從新一代 TPU 到 Google.ai,詳解 Google I/O 首日人工智慧五大亮點

Google 在山景城開啟了今年度的 Google I/O 開發者大會。從大會主題演講可以看出,Google 人工智慧主要體現在以下五大方面。
評論
評論

本文獲合作媒體 36kr 授權轉載,作者為 機器之心

Google 在山景城開啟了今年度的 Google I/O 開發者大會。從大會主題演講可以看出,Google 人工智慧主要體現在以下五大方面:

  1. AI First 的整體戰略;
  2. TPU 的升級與雲服務;
  3. 集研究、工具、應用於一體的 Google.ai ;
  4. 人工智慧技術的產品落地;
  5. 基於 Android 和 TensorFlow 的行動開發者生態。

重申 AI First

去年 10 月的 Google 新品發布會期間,Google 執行長 Sundar Pichai 曾撰文解讀 Google 從 Mobile First 向 AI First 的戰略轉變。他認為在接下來 10 年中,Google 將轉向建立 AI First 的世界。

Pichai 在本屆大會上再次強調了 AI First 戰略的重要性。他表示,機器學習已經在 Google 的諸多產品中得到了廣泛應用,其中包括搜尋排序、街景、圖片搜尋、智慧回覆、YouTube 推薦等。

在具體技術方面,Pichai 說:「聲音和視覺是一種新的計算形式。我們正在見證電腦視覺和語音領域的許多偉大進步。」

Google 的語音辨識技術的錯誤率逐年下降,僅從去年 7 月到現在就實現了 8.5% 到 4.9% 的極大改進;而且即使在有噪音存在的情況下也能表現良好。在 Google Home 剛發佈時,原本需要 8 個麥克風才能準確定位周圍的說話人,「藉助深度學習,我們最後能夠推出僅有 2 個麥克風的產品,而且達到了同樣品質。」現在 Google Home 已經能辨識 6 個不同的說話人並為他們設定客製化體驗。

在處理某些任務時,圖像辨識的準確度也超過了人類水準,並且應用到了 Pixel 系列手機的相機 App 中,來自動清除圖像中的噪點,實現高品質的夜間成像效果;不久之後甚至還可以自動移除照片上的遮擋物,比如擋在相機前的棒球場圍網。

在這些電腦視覺技術的基礎上,Google 又發布了 Google Lens 。這個功能將首先出現在 Google Assistant 和 Photos 中,用戶可以使用 Google Lens 來辨識花的品種、掃描設置好的條碼來連接 WiFi 、在大街上掃描店面來了解網上評價。

TPU 雲服務

AI First 的戰略需要 AI First 的資料中心,為此 Google 打造了為機器學習訂製的硬體 TPU 。去年發佈時,TPU 的速度比當時 CPU 和 GPU 的速度快 15 到 30 倍,功耗效率高 30 到 80 倍。如今的 TPU 已經在為 Google 的各種機器學習應用提供支援,包括之前戰勝李世乭的 AlphaGo 。

Pichai 介紹道,深度學習分為兩個階段:訓練(training)和推理(inference)。其中訓練階段是非常計算密集型的。例如,Google 的一個機器翻譯模型每週就要處理至少 30 億詞的訓練資料,需要數百個 GPU,去年的 TPU 就是專門為推理階段優化的;而在今年的 I/O 大會上,Pichai 宣布了下一代 TPU——Cloud TPU——其既為推理階段進行了優化,也為訓練階段進行了優化。在現場展示的一塊 Cloud TPU 板圖片上有 4 塊晶片,其處理速度可達 180 teraflops(每秒萬億次浮點運算)。


此外,Cloud TPU 還可以輕鬆實現集成組合,你可以將 64 塊 TPU 組合成一個「超級電腦」,即一個 pod ,每個 pod 的速度可達 11.5 petaflops(每秒千萬億次浮點運算);另外,Pichai 還宣布將 Cloud TPU 應用到了 Google Compute Engine 中。
一個 Cloud TPU Pod 示意圖,包含 64 塊 Cloud TPU

正如 Pichai 所言,「我們希望 Google Cloud 是最好的機器學習雲,並為用戶提供 CPU 、GPU 和 TPU 等更廣泛的硬體支持。」

在下午的開發者 Keynote 中,Google Cloud 機器學習與人工智慧首席科學家李飛飛也表示,每個人都可通過 Google 的雲平台使用雲 TPU,不久之後將會開放租借。

李飛飛在下午的開發者 Keynote 演講

Google.ai 與 AutoML

為推動使用人工智慧解決實際問題,Pichai 宣布將 Google 人工智慧方面的工作綜合到 Google.ai 下。總體而言,Google.ai 將專注於三個領域:研究、工具和應用。

在研究方面,深度學習模型方面的進步令人振奮,但設計和開發卻很耗費時間,只有少量工程師和科學家願意去研究它們。為了讓更多開發者使用機器學習,Google 提出了 AutoML——讓神經網路來設計神經網路。


AutoML 是一種「learning to learn」的方法。在此方法中,一種控制器神經網路能夠提議一個「子」模型架構,然後針對特定任務進行訓練與質量評估;而回饋給控制器的資訊則會被用來改進下一輪的提議。Google 在技術部落格中表示,他們已經將此過程重複了上千次,從而來生成新架構,然後經過測試和回饋,讓控制器進行學習。最終,控制器將學會為好的架構分配高的概率。
AutoML 流程圖

AutoML 會產生什麼樣的神經網路?以循環架構為例(用來在 Penn Treebank 資料集上預測下一單詞),如下圖所示:

左邊為人類專家設計的神經網路,右邊為 AutoML 方法創造的循環架構,兩個架構有著共同的設計特徵。

Pichai 認為,AutoML 具有很大的潛力。並且,Google 已經在圖像辨識基準資料集 CIFAR-10 上取得了頂尖成果。雖然過程很難,但雲 TPU 的存在使這種方法成為了可能。

有了這些前沿的研究,接下來就是應用的問題。Pichai 列舉了 Google 應用機器學習的幾個案例:例如在醫療領域診斷癌症的應用和在基礎科學領域的應用(在生物學上,Google 通過訓練神經網路來改進 DNA 定序的準確率;在化學領域,Google 通過使用機器學習了預測分子性質)。

產品及應用

Google AI First 戰略不僅體現在研究上,還表現於眾多人工智慧技術的應用上——將 Google 的各項人工智慧技術在產品層面統一起來。Pichai 提到:「電腦仍在不斷地進化,從 Mobile First 的世界進化到 AI First 的世界。我們也在重新思考我們所有的產品。」

1. Google Assistant

Google 正將人工智慧應用於所有產品中,Pichai 表示,其中最重要的就是 Google 搜尋和 Google Assistant 。自去年 I/O 大會發布以來,Google Assistant 已經可以在上億台設備上使用。今天 Google Assistant 工程副總裁 Scott Huffman 又介紹了 Google Assistant 三大進步。

1)更自然的對話

Google Assistant 上 70% 的請求都是通過自然語言的方式進行的,而非鍵盤輸入。而 Google 要做的就是結合語音辨識、自然語言處理以及語境意義方面的技術來解放用戶雙手,實現更加自然的人機交流。「Google Assistant 可以通過聆聽學會區分不同家庭成員的聲音。」他說。除了語音辨識和自然語言處理,Google Assistant 還使用了 Google Lens 功能,通過圖像資訊來實現更加自然的「對話」。

2)更廣泛的應用

Huffman 表示,Google Assistant 正變得更加廣泛可用,除了之前的 Android 系統,Google Assistant 已經可以在 iPhone 上使用。而隨著 Google Assistant SDK 的發布,任何設備生產商都能簡單輕鬆地將 Google Assistant 部署在音響、玩具和機器人等設備上;此外,今年夏天,Google Assistant 也開始將支持法語、德語、葡萄牙語和日語,並將在年底新增意大利語、韓語和西班牙語等語言。

3)更觸手可及的服務

用戶使用 Google Assistant 不僅僅是搜尋資訊,還希望獲取所有服務,比如 Gmail 、Google Photos 、Google 地圖和 YouTube 等。因此,Google 將 Google Assistant 開放給了第三方開發者,以實現產品間更加有用的融合。據 Google Assistant 產品經理 Valerie Nygaard 介紹,Google Assistant 將支援交易,從而為第三方提供端到端的完整解決方案。

Google Assistant 的進步也使得智慧家居產品 Google Home 新增了 50 項新功能——用戶可以通過語音去調用各種服務,包括免費電話、免費聽音樂,以及在電視上觀看影片等。

同時,基於本次大會上多次提及的「語音加圖像」的多模態互動,之前缺乏視覺互動的 Google Home 現在也可以藉助手機和電視的螢幕與用戶進行更好的互動,比如,用戶可以通過語音命令讓 Google Home 把你的日程在電視上顯示。就像 Nygaard 所說的那樣,用戶可以 hands-free 的做任何事情。如今 Google Assistant 已經開始支持交易並集成到智慧家居設備中,目前擁有超過 70 家智慧家居合作者。

2. Google Photos

Google Photos 目前擁有十億月度活躍用戶,每天上傳的照片和影片達到 12 億次。借助於 Google 的核心人工智慧技術,如今 Google Photos 使用了全新的圖像處理方法。這從此次發布的三個新功能可以看出:

  • Suggest Sharing 可以藉助機器學習將照片中的人物和場景辨識出來,然後給用戶提供分享建議——是否應該分享以及分享給誰。
  • Shared Libraries 基於用戶辨識的相片庫分享。
  • Photo Books 自動幫助用戶篩選出某一場景下的高質量照片並生成相簿。

另外,除了 Google Assistant ,Google Lens 也被集成到了 Google Photos 中。通過這個功能,你可以辨識相簿裡面的地標建築、檢索藝術作品背後的故事、辨識照片內的文本內容和資訊,這項功能將於今年晚些時候發布。

用 TensorFlowLite 構建行動開發者生態

機器學習在行動端的應用至關重要,而在討論 Android 的未來時,Google 工程副總裁 Dave Burke 宣布了一個為行動端優化的 TensorFlow 版本——TensorFlowLite 。TensorFlowLite 能讓更多的開發者建立在 Android 手機上運行的深度學習模型。

而 TensorFlowLite 就是 Google 在行動端部署人工智慧的一個著力點。首先,TensorFlowLite 很小很快,但依然可以使用最先進的技術,包括卷積神經網路、LSTM 等;其次,Dave Burke 還宣佈在 Android 上推出了一個新的框架來進行硬體加速,期待看到為神經網路的訓練和推理特別定制的 DSP 。這些新能力將促進新一代設備上(on-device)語音辨識、視覺搜尋和增強現實的發展。


去年,Facebook 公開了 Caffe2Go ,今年更是開源了可在手機與樹莓派電腦上訓練和部署神經網路模型的 Caffe2 。在行動端部署機器學習成為了一項新的挑戰。但不幸的是,手機上訓練神經網路仍是計算密集型任務。即便忽略訓練,預訓練模型仍舊艱難。但如果能在邊緣設備運行模型,就能避免雲和網路,在任何環境中有更可靠的表現。

Google 表示他們會開源該項工作,併計劃在今年晚些時候發布 API 。

Google 首日 Keynote ,讓我們看到了 Google 圍繞機器學習研究、開源工具、基礎設施和人工智慧應用開發的 AI First 戰略。Cloud TPU 是加速人工智慧部署的基礎設施;AutoML 代表著機器學習研究層面的前沿方向;TensorFlowLite 將促進人工智慧在行動端的部署;語音和圖像的結合代表著對多模態人機交互的探索;而應用了各種人工智慧技術的產品更新則是極大推動了將 AI 真正融入生活的進程。


新國科會主委吳政忠:部會協力串聯,打造不只科技部的科技,回應社會多元需求

國家科學及技術委員會揭牌及主任委員布達儀式 7 月 27 日於科技大樓舉行,原科技部部長吳政忠出任首任主任委員,承接過去使命再提出四點精進方向,期待透過跨部會協力,布局新興科技與產業。
評論
Photo Credit:TNL Brand Studio
評論

科技部改制為「國家科學及技術委員會」(以下稱「新國科會」),7 月 27 日於科技大樓舉行揭牌及主任委員布達儀式,與會貴賓不只涵蓋產官學界,總統蔡英文及行政院長蘇貞昌也親臨會場,共同見證我國科研事務推動最高權責機關成立,為政府組織改造立下重要的里程碑。

Photo Credit:TNL Brand Studio

新國科會打造不只是科技部的科技,建立科技與臺灣社會的多元聯繫

臺灣的科技不應該只有科技部,而是還有經濟部、衛福部等所有部會在一起,但是用科技部的名稱出去國外,好像就變成全臺灣的科技都是科技部的。所以我說,科技不會只有科技部的科技,應該是所有部會的總合。

新國科會首任主委吳政忠在致詞開頭即強調「部會合作」的組織核心,表示「科技不只是科技,科技與經濟、社會、環境等面相都有密切的關係」,也因此不應侷限於某個部分,應當是多個部會、學術界、產業界等攜手合作推動。

有別於過去科技部與行政院科技會報辦公室以合作關係來協調部會,未來新國科會改以委員會的組織形式運行,透過每月主要部會的首長共同商議策略方向,能夠整合部會資源,協作共達目標,此舉不只立下我國科技發展全新的里程碑,也讓臺灣能夠更靈敏的面對國際競爭。

Photo Credit:TNL Brand Studio
新國科會主委 吳政忠。

新國科會前身是 1959 年行政院國家科學委員會,又於 2014 年改制為科技部,過去肩負推動全國整體科技發展、支援學術基礎研究,以及發展科學園區等三大使命,在歷任部長的努力下,更將創新創業加入推動目標。如今的新國科會不只承接過去使命,主任委員吳政忠更提出以下四點未來新國科會所精進的方向:

一、跨部會協力,布局新興科技與產業
儘管臺灣小、科技預算不如國外,但臺灣部會之間高效率、精準連結的合作模式,將成為與國外競爭時的最大優勢,而「跨部會」溝通不只是未來新國科會的努力目標,也是新國科會最核心的思考架構。

二、基礎學術研究奠基
回顧過去兩年臺灣新冠疫情的防疫成果,無論在病毒醫學還是疫苗研發領域,基礎科學研究一直都是技術開發的堅強後盾;所以在臺灣邁向國際頂尖的路上,無論半導體、太空、還是人工智慧,科技的基礎研究與國際互動都將是新國科會注重的發展方向。

三、打造精緻多元的生活科學園區
過去半導體產業已替臺灣打下堅實的基礎,科技園區的產值從 2.7 兆成長到去(2021)年 3.7 兆,但除了半導體,其他的產業也需要布局,尤其是精準健康、智慧農醫、電動車、太空科技、低軌衛星等「接近生活」的重點產業。

四、實踐科技的人文社會價值
隨著科技與生活拉近距離,未來的科技發展必然需要與社會需求、環境永續連結,回應外在社會環境的變化;此外,科技人才培育、加強臺灣女性在科技面的投入比例,都將是未來新國科會欲強化的目標。

Photo Credit:TNL Brand Studio

進一步探究,就會發現上述新國科會的策略方針並非憑空發想,而是源自對產業發展的細微觀察與豐富的知識、經驗的珍貴結晶。早在吳政忠任職行政院科技顧問組副執行秘書時,就已觀察到「當科技更接近生活,產品價值就會大幅度的翻倍成長」的現象,再回顧臺灣善於代工製造零件的發展歷史,才萌生「將臺灣強而有力的製造技術與創新想法整合」的初步想法。

但是「整合」一詞的背後,需要的是基礎研究、應用研究,產業實務之間的環環相扣,過程不只涉及公私跨部門、跨領域的協調,也是一個漫長轉換的過程,並非一蹴可及。最後,在數年醞釀及無數人的共同努力下,儘管過程困難重重,以「部會合作」思考為核心的組織架構「新國科會」終於順利誕生,讓整體國家的科技發展得以提升至行政院層級的高度,向下整合上中游的基礎研究、下游的應用研究及產業實務的連接,創造更多的商機與價值。

Photo Credit:TNL Brand Studio

新國科會的挑戰與期許,後疫情時代的科技人文關懷

如今全球進入後疫情時代,國際關係變動不定,更面臨供應鏈重組、數位轉型等產業挑戰,科技作為國家發展重要的中堅力量,勢必需要更快速的布局因應,在變動中搶得先機。但除了研究與創新,科技與人文社會的結合也是新國科會的一大核心。

隨著人工智慧、太空等科技發展,生活中科技將無所不在,因此未來傳統產業必然將被完全翻轉,此時人文社會科學就扮演嫁接技術與生活文化的重要橋樑,彰顯科學研究成果對人類福祉的巨大貢獻。但這一切的前提是科技與社會必須主動伸手,彼此接觸、相互了解,攜手促進社會總體的福祉發展。新國科會成立之日,同時也是「國科會職場互助教保服務中心 [ 註 ] 」揭牌日,便能看見國科會對人文的用心,除了前述四大重點外,對於女性人才的培育、原住民教育的深耕、環境永續,都將是國科會的重點目標,如何透過科技連結社會的需求,正是新國科會追求的核心,因此新國科會不只是部會整合、資源分配與未來展望而已,更是將科技應用在民間的推動者,同時成為科技與人文交流的平台,最大化科技對總體社會福祉的貢獻。

國科會科技辦公室 廣告


[ 註 ] :國科會職場互助教保服務中心於 110 年 8 月開辦,位於科技大樓 1 樓,是臺灣公共托育協會承接的第一間職場教保中心。以平價、優質、非營利、社區化之方向營運,希望透過政府與公益法人團體協力的方式,結合民間團體資源,提供孩子優質的教保品質,減輕社區家庭照顧負擔,提升教保人員工作環境與權益。資料來源:財團法人彭婉如文教基金會