神奇的 Google Translate,背後到底蘊藏哪些機器學習科技?

喜歡使用 Google Translate 的朋友,是不是覺得其翻譯品質近年來有大幅度的提升?Google Translate 可說是整個 Google 如何運用機器學習,提升產品能力的經典案例之一,讓我們來看看他們究竟怎麼做到的。
評論
Photo Credit: Google Taiwan
Photo Credit: Google Taiwan
評論

當今科技界的 AI 風潮,可說一大部分起源自去年 AlphaGO 與李世石圍棋人機大戰所帶起。而為了讓台灣大眾更加認識人工智慧與機器學習,Google 台灣今天招開了首場「Google 機器學習系列講座」,邀請到 Google Translate 產品經理線上與大家連線,為大家深入介紹機器學習技術如何徹底運用在 Google Translate 。

這可以說是除了 AlphaGO 以外,Google 在台第一次向公眾深談機器學習,台灣區總經理簡立峰介紹,在兩三年大家還在談行動 First,但科技進展非常快,如今已經是 AI First 的時代了。

▲Google 台灣總經理簡立峰,Photo Credit: Google Taiwan

他觀察現今科技業會吹起 AI 風潮,有三個面向主因:第一從新聞與議題面來看,當然前面提到的 AlphaGO 人機大戰是主因之一。圍棋過去被認為是世界最複雜的遊戲之一,長久以來一直被認為是電腦無法超越人類的領域;但 AlphaGO 卻透過深度學習,打破之前大眾們的想像,讓世人親眼目睹機器學習的無窮潛力。

第二從技術上來看,就是 「深度學習」的飛躍性突破。過去人工智慧技術就算用了非常大量的資料也不一定有顯著、有效的成果。但近年來隨著演算模型的進步,只要把模型妥善設計調教,就能獲得非常好的分析結果

最後一點是投資面,簡立峰強調其實在 AlphaGO 勝利之前,科技圈就已有不少投資者看好人工智慧,為相關產業注入足夠的資源與動能。

那麼人工智慧到底會不會超越人類? 簡立峰認為這要先把人類與機器目前擅長的事劃分討論。如果是有一定規律、重複性高而且有大量資料的事情,就很適合交給機器學習處理,目前像圍棋、遊戲,甚至到開車是 AI 表現比人類還好;而現在正夯的文字與影像分辨能力,人跟機器的表現就差不多。但像是需要判別情境、前後文的自然語言理解,顯然機器還遠不及人類

▲產品經理 Julie Cattiau 在矽谷總部即時跟台灣連線,Photo Credit: Google Taiwan

隨後,產品經理 Julie Cattiau 在矽谷總部即時跟台灣連線,向大家說明 Google 是如何透過機器學習,快速提升 Google Translate 的翻譯品質。首先先從 Google Translate 產品本身介紹起, Google 認為「翻譯」在全球網路資訊流通扮演了重要角色,像目前全球網路上有 50% 內容以英文呈現,但卻只有 20% 人口以英語為其主要語言,因此讓線上翻譯變得更快、更好,就成了加速網路發展的關鍵因素之一。

而到現在,Google Translate 已經累積了驚人的使用量,每天平均翻譯量超過 10 億次,並且每月也有超過 10 億的活躍使用者使用;這其中,台灣正是 Google Translate(Android 版) 成長最快的市場,近年平均年成長高達 2 倍,另外 iOS 版也有年成長 60% 優異表現。

Julie Cattiau 進一步解釋,十年前 Google Translate 是以片語式機器翻譯(Phrase-Based Machine Translation)作 為主要運算方式,將句子切割成小塊語言單位,之後針對各別語言塊進行翻譯,最後再將這些語言塊組合成看似句子的目標語言。在此同時,Google 也以收集搜尋索引來建構翻譯模型,收集並翻譯了數十億的網路文件,包含官方文件、新聞文章、書籍等。但片語式機器翻譯有其極限,稍微複雜一點的句子其語意就無法有效連貫。

不過從 2015 年開始,Google Translate 以 TensorFlow 為核心開始執行專案,導入了端對端學習架構的神經機器翻譯系統(Google Neural Machine Translation, GNMT),能整個句子視為一個單位進行翻譯,並讓系統從數百萬的例子學習,提昇翻譯品質。每組 GNMT 模型都需要超過 1 億筆訓練案例,2-3 週的訓練時間才能完成,不過到目前為止,原先預期需耗時 36 個月才能完成神經機器導入專案成果卻超乎預期,僅耗時 13.5 個月就到達目標。

▲神經網路翻譯導入前後的差別

接下來在去年 11 月,Google 還導入了更先進之 Zero-Shot 技術,現在僅需要一套系統就能完成多元語言翻譯,並且讓系統具備了自行學習的能力。簡單來說,Zero-Shot 翻譯在進行英日、韓英翻譯訓練後,不僅可完成英日、日英、英韓、韓英的互譯,更可在藉由導入 Zero-Shot 翻譯就能完成之前沒有經過任何相關訓練的第三種語言。如: 韓日、日韓的互譯。藉由 Zero-Shot 翻譯,Google 僅需要一套系統就能完成所有語言的互譯。

而且 Zero-Shot 還能認識語義,從圖片就可以看到,語義相近的字句會被歸類到同一種類,並透過關聯性在相近語系裡找出最適合的翻譯,而非過去單純靠記憶短語到另一個短語的方式進行翻譯。這也讓翻譯速度大幅提升,技術導入後兩個月內就將 10 秒翻譯一句話的速度,縮短到 0.2 秒就能完成。

此外,令人驚豔的即時鏡頭翻譯(Word Lens)也是一次視覺深度學習,以及語言機器學習的高度結合。先透過視覺識別,Word Lens 可以從鏡頭拍攝的圖片中找出目標文字,並辨識成可讀的文字,再進到翻譯資料庫尋找並轉換出翻譯結果。

同時她也表示,現今無論繁體中文還是簡體中文,Google Translate 都是用同一套模型去訓練,這是因為若將模型拆成兩種資料庫,需要資料庫內容太大、太多了,而且在繁中、簡中之間語法極為相同,僅有少數詞彙不一樣的狀況下,採用單一學習模型再搭配不同詞彙是最符合效益的做法。

Julie Cattiau 結束 Google Translate 的介紹之後,簡立峰回到現場,為大家一一詳解有關人工智慧的提問。在問到除了機器學習之外,哪個人工智慧方法還商業應用潛力時,簡立峰解釋機器學習可以說就是大數據的延伸,已經非常具有商業價值了,但還是有所侷限;目前機器學習所訓練出來的 AI,其實並未具有真正的推理與規劃能力,而這正是其他人工智慧研究領域正在積極處理卻未有突破鏡展的領域。

最後簡立峰表示,目前人工智慧崛起正是台灣擺脫軟硬分離窘境的好機會。台灣在半導體的製造與設計很強,但怎麼結合在辦公室管理呢?簡立峰以指紋辨識為例,這種需要背後有雲端 AI 系統進行辨認的裝置,在前面也需要針對 AI 最適化 IC 終端設計產品才能連貫。像這種需要高度軟硬整合的「人工智慧 IC 化」路徑,就是擁有先進製程的台灣企業非常好的切入點。

簡立峰也分析,像資料量不夠,諸如消費者的終端資料等相關領域就不太適合台灣。不過像很多專利握在以色列手上,但他們缺乏製造與設計能力的部分,就是非常適合台灣一起合作的結合點。


精選熱門好工作

賣家關係維護專員

樂購蝦皮股份有限公司
臺北市.台灣

獎勵 NT$15,000

Campaign Manager 活動企劃經理

樂購蝦皮股份有限公司
臺北市.台灣

獎勵 NT$15,000

高階 SRE 專家 / Sr. SRE

奔騰網路科技有限公司
臺北市.台灣

獎勵 NT$15,000

評論