神奇的 Google Translate,背後到底蘊藏哪些機器學習科技?

喜歡使用 Google Translate 的朋友,是不是覺得其翻譯品質近年來有大幅度的提升?Google Translate 可說是整個 Google 如何運用機器學習,提升產品能力的經典案例之一,讓我們來看看他們究竟怎麼做到的。
評論
Photo Credit: Google Taiwan
評論

當今科技界的 AI 風潮,可說一大部分起源自去年 AlphaGO 與李世石圍棋人機大戰所帶起。而為了讓台灣大眾更加認識人工智慧與機器學習,Google 台灣今天招開了首場「Google 機器學習系列講座」,邀請到 Google Translate 產品經理線上與大家連線,為大家深入介紹機器學習技術如何徹底運用在 Google Translate 。

這可以說是除了 AlphaGO 以外,Google 在台第一次向公眾深談機器學習,台灣區總經理簡立峰介紹,在兩三年大家還在談行動 First,但科技進展非常快,如今已經是 AI First 的時代了。

▲Google 台灣總經理簡立峰,Photo Credit: Google Taiwan
▲Google 台灣總經理簡立峰,Photo Credit: Google Taiwan

他觀察現今科技業會吹起 AI 風潮,有三個面向主因:第一從新聞與議題面來看,當然前面提到的 AlphaGO 人機大戰是主因之一。圍棋過去被認為是世界最複雜的遊戲之一,長久以來一直被認為是電腦無法超越人類的領域;但 AlphaGO 卻透過深度學習,打破之前大眾們的想像,讓世人親眼目睹機器學習的無窮潛力。

第二從技術上來看,就是 「深度學習」的飛躍性突破。過去人工智慧技術就算用了非常大量的資料也不一定有顯著、有效的成果。但近年來隨著演算模型的進步,只要把模型妥善設計調教,就能獲得非常好的分析結果

最後一點是投資面,簡立峰強調其實在 AlphaGO 勝利之前,科技圈就已有不少投資者看好人工智慧,為相關產業注入足夠的資源與動能。

那麼人工智慧到底會不會超越人類? 簡立峰認為這要先把人類與機器目前擅長的事劃分討論。如果是有一定規律、重複性高而且有大量資料的事情,就很適合交給機器學習處理,目前像圍棋、遊戲,甚至到開車是 AI 表現比人類還好;而現在正夯的文字與影像分辨能力,人跟機器的表現就差不多。但像是需要判別情境、前後文的自然語言理解,顯然機器還遠不及人類

▲產品經理 Julie Cattiau 在矽谷總部即時跟台灣連線,Photo Credit: Google Taiwan

隨後,產品經理 Julie Cattiau 在矽谷總部即時跟台灣連線,向大家說明 Google 是如何透過機器學習,快速提升 Google Translate 的翻譯品質。首先先從 Google Translate 產品本身介紹起, Google 認為「翻譯」在全球網路資訊流通扮演了重要角色,像目前全球網路上有 50% 內容以英文呈現,但卻只有 20% 人口以英語為其主要語言,因此讓線上翻譯變得更快、更好,就成了加速網路發展的關鍵因素之一。

而到現在,Google Translate 已經累積了驚人的使用量,每天平均翻譯量超過 10 億次,並且每月也有超過 10 億的活躍使用者使用;這其中,台灣正是 Google Translate(Android 版) 成長最快的市場,近年平均年成長高達 2 倍,另外 iOS 版也有年成長 60% 優異表現。

Julie Cattiau 進一步解釋,十年前 Google Translate 是以片語式機器翻譯(Phrase-Based Machine Translation)作 為主要運算方式,將句子切割成小塊語言單位,之後針對各別語言塊進行翻譯,最後再將這些語言塊組合成看似句子的目標語言。在此同時,Google 也以收集搜尋索引來建構翻譯模型,收集並翻譯了數十億的網路文件,包含官方文件、新聞文章、書籍等。但片語式機器翻譯有其極限,稍微複雜一點的句子其語意就無法有效連貫。

不過從 2015 年開始,Google Translate 以 TensorFlow 為核心開始執行專案,導入了端對端學習架構的神經機器翻譯系統(Google Neural Machine Translation, GNMT),能整個句子視為一個單位進行翻譯,並讓系統從數百萬的例子學習,提昇翻譯品質。每組 GNMT 模型都需要超過 1 億筆訓練案例,2-3 週的訓練時間才能完成,不過到目前為止,原先預期需耗時 36 個月才能完成神經機器導入專案成果卻超乎預期,僅耗時 13.5 個月就到達目標。

▲神經網路翻譯導入前後的差別

接下來在去年 11 月,Google 還導入了更先進之 Zero-Shot 技術,現在僅需要一套系統就能完成多元語言翻譯,並且讓系統具備了自行學習的能力。簡單來說,Zero-Shot 翻譯在進行英日、韓英翻譯訓練後,不僅可完成英日、日英、英韓、韓英的互譯,更可在藉由導入 Zero-Shot 翻譯就能完成之前沒有經過任何相關訓練的第三種語言。如: 韓日、日韓的互譯。藉由 Zero-Shot 翻譯,Google 僅需要一套系統就能完成所有語言的互譯。

而且 Zero-Shot 還能認識語義,從圖片就可以看到,語義相近的字句會被歸類到同一種類,並透過關聯性在相近語系裡找出最適合的翻譯,而非過去單純靠記憶短語到另一個短語的方式進行翻譯。這也讓翻譯速度大幅提升,技術導入後兩個月內就將 10 秒翻譯一句話的速度,縮短到 0.2 秒就能完成。

此外,令人驚豔的即時鏡頭翻譯(Word Lens)也是一次視覺深度學習,以及語言機器學習的高度結合。先透過視覺識別,Word Lens 可以從鏡頭拍攝的圖片中找出目標文字,並辨識成可讀的文字,再進到翻譯資料庫尋找並轉換出翻譯結果。

同時她也表示,現今無論繁體中文還是簡體中文,Google Translate 都是用同一套模型去訓練,這是因為若將模型拆成兩種資料庫,需要資料庫內容太大、太多了,而且在繁中、簡中之間語法極為相同,僅有少數詞彙不一樣的狀況下,採用單一學習模型再搭配不同詞彙是最符合效益的做法。

Julie Cattiau 結束 Google Translate 的介紹之後,簡立峰回到現場,為大家一一詳解有關人工智慧的提問。在問到除了機器學習之外,哪個人工智慧方法還商業應用潛力時,簡立峰解釋機器學習可以說就是大數據的延伸,已經非常具有商業價值了,但還是有所侷限;目前機器學習所訓練出來的 AI,其實並未具有真正的推理與規劃能力,而這正是其他人工智慧研究領域正在積極處理卻未有突破鏡展的領域。

最後簡立峰表示,目前人工智慧崛起正是台灣擺脫軟硬分離窘境的好機會。台灣在半導體的製造與設計很強,但怎麼結合在辦公室管理呢?簡立峰以指紋辨識為例,這種需要背後有雲端 AI 系統進行辨認的裝置,在前面也需要針對 AI 最適化 IC 終端設計產品才能連貫。像這種需要高度軟硬整合的「人工智慧 IC 化」路徑,就是擁有先進製程的台灣企業非常好的切入點。

簡立峰也分析,像資料量不夠,諸如消費者的終端資料等相關領域就不太適合台灣。不過像很多專利握在以色列手上,但他們缺乏製造與設計能力的部分,就是非常適合台灣一起合作的結合點。


趕上全民投資運動!國泰世華網銀 App 線上搞定證券戶,還能投資美股、加強理財

因疫情而興起的產業類別,在過去一段時間的表現,讓不投資的民眾對於「航海王」、「鋼鐵人」…等詞彙也能朗朗上口,連大學生愛用的社群平台Dcard也有不少的股票討論。用投資來刻畫更好的生活,已經是全民運動。
評論
Photo Credit:iStock
評論

「持續投資」是管理超過千億美元、全球最知名的資產管理公司橡樹資本共同創辦人霍華.馬克斯(Howard Marks)6 月在國泰世華銀行舉辦的全球投資展望線上論壇中,給予所有投資人的未來建議。儘管下半年不可預期,但持續出擊仍是投資巨擘的建議方向。

就算對投資毫無頭緒,也必須明白一個道理:通貨膨脹在短期內也許沒有感覺,但長期來看,一般民眾放在銀行裡面的錢只會愈來愈小。抵抗通膨的方式,便是有目的性地理財。撇開通膨,不管旅遊、購物、添購生財器具,甚至是退休,都需要有財務規劃的支持,投資理財絕對是規劃道路上事半功倍的選擇。

立即體驗行動金融

投資已成全民運動,國泰世華網銀 App,最快 5 分鐘完成開戶手續

不過,投資並不是有錢人的專利。根據證交所的資料顯示,2020 年台灣的開戶數達到 1,124 萬人,也就是說,每兩個台灣人,就有一個人擁有證券戶。尤其是 20 至 30 歲的年輕族群,占比從五年前的 25.4% 快速增加至 36.1%,大幅成長至 123 萬人。

也因為航海、鋼鐵族群過去一段時間的表現,讓不投資的民眾對於「航海王」、「鋼鐵人」也能朗朗上口,連大學生愛用的社群平台 Dcard 也有不少的股票討論。用投資來刻畫更好的生活,已經是全民運動。

一切的起點都必須從擁有證券戶開始。但自從新冠狀病毒(COVID-19)侵擾以來,臨櫃開戶伴隨而來的等待時間,無形中提高了染疫風險,要參與這項全民運動似乎難度不低。

國泰世華網路銀行 App 以民眾需求為優先,提供了「線上開證券戶」服務,只要備妥雙證件,最快 5 分鐘就能完成開戶手續。國泰世華網路銀行 App 不只提供買賣台股的功能,同步開通了美股複委託,讓跨海購買 Google、Apple 或微軟的股票都在手機上就能輕鬆操作。

Photo Credit:國泰世華

有了證券戶後,固然可以開啟投資人生,但對初步踏入股市的民眾來說,投資不懂得標的無疑是一種賭博。國泰提供每月最低 1,000 元的定期定額存股,不管是熱門股票,或者想要選擇風險較為分散的 ETF,都任由民眾挑選、輕鬆存股;或者也能透過國泰提供的「投資屬性」分析,了解自己的風險承受程度及偏好,選擇適合的基金來投資。

Photo Credit:國泰世華

上述的功能全部收攏在國泰世華網銀 App 內,用一個簡單的 App 就能輕鬆掌握,並檢視所有的資產狀況。

不只是手機上的銀行,更是消費者所有金融服務的提供者

投資難免有風險,對於尚在觀望,或是投資性格較為保守的民眾來說,先安穩地「存一筆本金」是個比較好的開始。

許多理財專家都提到,唯有掌握現金流的流入與流出,才是儲蓄的開端。國泰世華網銀 App 內提供了「母子帳戶」的服務。舉例來說,可以在母帳戶下分出旅遊帳戶、投資帳戶、緊急帳戶、教育基金帳戶等,每一筆錢都有了固定的去處,就不怕克制不了購物慾造成的額外開支。唯有自動化、不必費心的服務,才能最無痛地把錢存起來。

Photo Credit:國泰世華

但這也不代表要犧牲生活品質,利用母子帳戶「目標儲蓄」的功能,也能設定自動匯入固定的款項到子帳戶中,譬如設定一個「大餐帳戶」,每月存入 NT$3,000 元作為犒賞自己辛勞的來源;或是設定一個「遊戲基金」,存入固定的金額來限制自己每年的購買遊戲金額。

如果你打算在疫情解封之後,來一趟好久不見的旅行,除了目標儲蓄之外,利用國泰世華網路銀行 App,只要三分鐘就能開設外幣帳戶,除了買賣外幣有獨享的優惠,國泰還提供最長一年的匯率走勢圖,讓民眾可以在外幣便宜的時刻分批購買。

其他網路銀行應有的功能,不論是存、提、轉、匯,或是繳費、貸款、刷卡推波、消費紀錄查詢、臨時的額度調整等,國泰世華網銀 App 中也都能找到。除此之外,針對資料傳輸、儲存都建立了保護機制,加密技術、使用者辨識系統、存取控制等機制都是基本,來避免資料被第三人截取得知,為資料做最完善的安全把關。

Photo Credit:國泰世華

更重要的是,國泰世華銀行讓手機不只是銀行,同時也是投資幫手、資產管理師。提供最貼近生活上的金融服務,才能回歸服務好每一位消費者的初心。

立即體驗行動金融

本文係由國泰世華邀稿

證券服務由國泰證券提供

台北市敦化南路二段333號19樓| 客服專線 (02) 7732-6888 | 109年金管正總字第0044號