在東京看見 Google 大未來:所有產品都將融入「機器學習」

昨天 Google 於東京舉辦的亞太區媒體活動,Alphabet 執行董事長 Eric Schmidt 從華盛頓特區視訊連線,去年他在同樣的活動場合中表示「亞洲走在行動唯一的道路上」,而今要讓人類生活再進化,Google 將大舉投資機器學習,篤定它將成為改變世界的 Next Big Thing。Google 機器學習核心團隊成員 Greg Corrado 也更細緻的何謂解釋機器學習。我們整理五大重點,一覽機器學習的力量。
評論
評論

這一兩年來 Google 陸續推出的服務,從 Google Photos、Now On Tap、Google Now 到上週最新面世的 Gmail「自動回信」功能,都有個共通點:他們都深刻運用了「機器學習」的原理。在第三季的財報會議中,剛接任 Google CEO 的 Sundar Pichai,明白宣示 1 機器學習將是 Google 大力推動的方向:

機器學習是一種核心的轉變方式,透過機器學習,我們正在重新思考我們所從事的一切。我們將審慎的把所有產品,包括搜尋、廣告、YouTube、Google Play 等等全部融入機器學習。我們目前正處於初期階段,但用戶將看到 Google 以系統的方式來思考我們將如何把機器學習應用到所有的這些領域。

昨天 Google 於東京舉辦的亞太區媒體活動,Alphabet 執行董事長 Eric Schmidt 從華盛頓特區視訊連線,去年他在同樣的活動場合中表示「亞洲走在行動唯一的道路上」,而今要讓人類生活再進化,Google 將大舉投資機器學習,篤定它將成為改變世界的 Next Big Thing。Google 機器學習核心團隊成員 Greg Corrado 也更細緻的何謂解釋機器學習。我們整理五大重點,一覽機器學習的力量。

什麼是機器學習

Greg Corrado 解釋,過去工程師使用「建立與排除規則」的方式讓電腦學習,但機器學習的邏輯完全不同:透過極大量的樣本與案例預測與學習。

理想的機器學習進程是:輸入 => 進入可以加入各種參數或變因的模型 => 週而復始不斷預測結果,並將預測結果與真實結果加以比對,即產生學習的機制。範例愈多、比較愈多次,學習的效果就會愈好,往後得出的結果也會愈精準。人類雖然也透過經驗學習,但是我們的大腦只需要幾次的例子就能舉一反三,而電腦卻得吞食巨量的案例才能建立認知。

若把機器學習愈為一艘火箭,大量的數據就是驅動它的能源。Greg Corrado 強調,機器學習不是魔術,而是工具。在機器「學習」的進程中,人類必須發揮創意與多方思考,建立不同模型,並以強大的運算能力支撐整個學習過程。

機器學習進展到後來,變成接近人腦的深度學習。藉由層疊許多模型,形成更加複雜的學習方式,例如電腦看到貓的影像後,經過好幾個層次的運算,便得出「這是一隻貓」的結論。

電腦認出一隻貓的過程,宛若「全面啟動」

當天一同與會的 Google Photos 搜尋和分析負責人 Chris Perry,更進一步介紹 Google 引以為傲的「電腦視覺」技術。自 Google Photos 推出以來,每月超過 1 億人使用,並累計儲存超過 500 億張照片。以往我們利用關鍵字搜尋照片,大概只能找到當初有被標籤為特定字詞的影像,但現在打「貓」或「巴黎鐵塔」等等,即使該照片並未被標記關鍵字,還是會被呈現出來,這就是電腦視覺的威力。

以把離鐵塔來說,如果相片缺乏定位資訊,Google 會先找出這張照片的巴黎鐵塔,接著與其他含有巴黎鐵塔的照片進行比對,由於地標形狀永遠不會改變,辨識相對容易。若比對成功,就把這張照片標示為「巴黎鐵塔」,並分類到巴黎中。

但若是動物難度就很高了。例如,上百萬隻貓咪長相、姿態不盡相同,就需要更複雜的電腦視覺運算,去年九月 Google 發表關於神經網絡(neural network)的論文,命名為「全面啟動(inception)」,因為 Google 歷經 22 層的電腦視覺運算原理,如同全面啟動中夢境的分層概念。例如 Google 準備辨識一隻貓的照片,首先會先偵測線條與顏色、接著是眼睛與耳朵,經過數層辨識後,終於認出這是一隻貓。但任務尚未結束,Google 需要從網路中上千張「貓」的影樣與「貓」的連結,推斷出「貓」這個字通常與「尖耳、生動的線條」的生物聯繫在一起。於是,當人們在搜尋框中打上「貓」,無論照片是否被標記了「貓」,Google Photos 都能吐出相關影像。

只是,雖然 Eric Schmidt 大力推崇藉由機器學習,電腦視覺(computer vision)將比人眼更精準銳利,但目前實務上仍無法 100% 判斷正確的是非。比方說先前 Google Photos 曾經出現把非裔人士標記為黑猩猩的烏龍,又或者是人工標籤,也有可能發生許多人誤把布魯克林大橋錯置為舊金山大橋的狀況,靠著大量統計資訊進行學習的系統缺乏文化社會常識,的確只能靠著後續更多資料比對提出反證,或是藉著人為手動修正。

Eric Schmidt 也在視訊中表示,要把問題轉換成機器學習能解決的題目並不容易,但一旦轉換成功,人人都將受益。

緣起於 20% Project,機器學習將改變世界

Google 發展深度學習,其實源自於 2011 年享譽盛名、給予工程師自由時間發展個人專案的「20% Project」,成員包括已經加入中國百度的吳恩達(Andrew Ng)、在科技圈名聲響亮的 Jeff Dean、以及 Greg Corrado 等人。歷經數次失敗後,因在語意辨識(speech recognition)上取得重大進展,而且電腦與智慧型裝置的運算能力大幅增強,因此從 GoogleX「畢業」,成為 Google 正式投入發展的專案。

其後,深度機器學習陸續運用在各式各樣的 Google 產品中,你我生活中離不開的搜尋、99% 的垃圾郵件區辨率、Google 翻譯、自動歸類照片、自動回覆、以及自動回覆,都是仰賴機器學習的成果,Eric Schmidt 上週在韓國首爾透露 2,「未來五年機器學習將應用在所有產業領域,光 Google 正在進行的相關專案就超過 100 個。」

TensorFlow 開源,Google 不走尋常路

現在,為了讓機器學習的發展快馬加鞭,Google 邀請全世界攜手加入訓練機器的行列。

前天 Google 宣布將旗下機器學習軟體系統「TensorFlow」以開源專案釋出。TensorFlow 已運用在 Inbox 的 Smart Reply、Google Photos 的搜尋功能、YouTube 的最佳縮圖(thumbnail),能在小至一台智慧型手機或多達數千台電腦的資料中心中運行。TensorFlow 打造、訓練神經網絡的速度比起舊版系統 DistBelief 快了五倍。

就像先前提到的,機器學習兩大關鍵元素:資料量以及人類賦予的創造力,Google 開源的舉動,無疑是要藉助社群力量,將機器學習的觸角延伸到無所不在。往後研究者、工程師或任何對機器學習有興趣的群眾,都能利用程式碼快速交流,加快機器學習領域發展。另外科學家也能利用 TensorFlow 分析並解讀複雜數據,例如蛋白質折疊或天文數據運算。

雖然機器學習已成顯學,蘋果、微軟、IBM 都有秘密武器,但 Eric Schmidt 自信的說,TensorFlow 要「讓全世界的聰明人都能運用 TensorFlow,甚至連競爭對手都會用它,Google 不走尋常之路。」。

暫且不會朝向人工智慧發展

機器學習經常被拿來與人工智慧相提並論,但人工智慧總是令人充滿「取代人類」的憂慮不安。不過 Greg Corrado 解釋,兩者雖有相疊之處,但本質上並不一樣。人工智慧是「讓機器變聰明」,IBM 的 Deep Blue(深藍電腦)即屬此類,而機器學習是希望「由人類訓練機器,讓它從不斷學習中變聰明」,後者要比前者來得簡單可行,Google 也以機器學習為主要目標。Greg Corrado 說,Google 現階段還是以讓人類的生活更加便利、不必把時間浪費在瑣事上為主。


Cookie 消失?試試看全新 AI 影像內容辨識:讓用戶看的內容決定看到的廣告

Google Chrome 即將淘汰幫助廣告主的工具—— Cookie ,它的離去將再一次地影響數位廣告產業。
評論
Photo Credit:<a href="https://www.shutterstock.com/zh/image-photo/ai-artificial-intelligence-big-data-internet-1075853384" target="_blank">shutterstock</a>
評論

透過GA分析進站者發現, Safari的新客數越來越多,難道這表示 iOS 的用戶數也跟著增加了嗎?注意了,這有可能是 Apple 封鎖第三方 Cookie 帶來的影響。隨著 Google 即將淘汰 Chrome 上的 Cookie ,這個幫助廣告主記住用戶受眾的小工具,將要再一次地影響數位廣告產業。

Photo Credit:驚點股份有限公司( FreakOut Taiwan )

後 Cookie 時代的廣告受眾如何鎖定?

各大廣告平台在過去幾年不斷地透過 Cookie 以及其它方式,悄悄收集使用者的用戶數據,隨著這幾年用戶的隱私權意識抬頭, Apple 與 Google 對於藉由 Cookie 辨識用戶資料的廣告投遞方式,持有不同的態度,這也將是所有廣告主的極大挑戰。當 Cookie 不復存在,要如何辨識使用者資料?

Cookie 消失了,或許會有新的數據辨識工具來取代,但是任何試圖跟蹤受眾的方式,都難以符合大眾對於保護隱私權的期望。另一方面,也極有可能無法再通過日趨嚴格的媒體監管限制。無論如何,數位廣告不能像過去一樣,無條件地使用類似 Cookie 的追蹤方式,來達到與現在同樣的廣告效果。

後 Cookie 時代內容辨識類型的廣告鎖定方式,將成為未來具指標性的投放策略。廣告與瀏覽平台或內文主題的高相關性,不僅能顯著提高受眾的互動度,更重要的是,完全不需要收集任何個人數據。

FreakOut Taiwan 不斷嘗試更友善的廣告投遞形式, 自 2016 年進入台灣市場的原生廣告,到 2020 年末引進「 Mirrors 」 AI 影像視覺內容辨識系統,都是以網路使用者的角度出發。「 Mirrors 」不需要使用傳統的受眾興趣設定,即可針對「目標受眾在觀看的影像內容」、「品牌自身競爭對手或相關指定系列產品出現的影片」來投遞 YouTube 上的影音廣告。

Photo Credit:驚點股份有限公司( FreakOut Taiwan )

AI 人工智慧影像技術突破,推動新一代內容辨識功能

傳統的內容比對廣告皆為自然語言處理 NLP 中心,基於「純文字」的比對來顯示相關廣告,如大家很熟悉的 Google AdSense 。但是,結合新興的 AI 演算和複雜的圖像辨識,已然能夠達到「影片」的內容偵測,透過增加多個比對層和基於自然語言處理 NLP 的基準定位,可深度學習並提供更精細的辨識洞察力。

舉例來說,若想要將汽車廣告投放給對汽車有興趣的人,我們要先從可能對汽車感興趣的受眾中開始推估,並且根據過去的經驗加入不同的興趣條件,最後針對素材更進一步地測試。透過 Mirrors ,我們可以讓廣告出現在有滿足特定條件的影片內,例如:在消費者觀看的影片中,出現汽車評測報告、自家品牌或競爭對手的 LOGO 、代言人等指定條件,再依照不同廣告主設定的預算判斷是否露出廣告。

藉由這樣的影像比對方式,可以更有效地根據消費者行為觸發廣告投遞條件,而不再是現行的用戶受眾數據。人的興趣是多樣且多變的,當對汽車有興趣的用戶在完成汽車的選購後,短期內將不會再瀏覽相關資訊,轉而瀏覽其他更具時效性的內容。透過消費者當下正在觀看的影片內容,取代消費者身上被貼上的數位標籤,將更貼近消費者本身的使用行為。

Photo Credit:驚點股份有限公司( FreakOut Taiwan )

Mirrors AI 影像辨識:用消費者看的內容決定廣告

2021 年台灣數位報告指出,台灣人在各網路內容服務中,最愛「網路影片」的比例高達 97.9%,遠超過 Vlog、串流音樂、網路廣播、Podcast 。

影音廣告早已是品牌經營的趨勢:根據 DMA 2019 年台灣數位廣告量統計報告指出,台灣各類型廣告中,影音廣告以 37.2% 的成長比例大幅領先奪冠。其中 YouTube 持續蟬聯台灣最常被造訪網站第 2 名(僅次於 Google ) ,在台灣各大影音平台中的觸及率及影響力不容小覷。

2021 年 FreakOut Taiwan 已與客戶合作,進行搭載新系統的 YouTube 串流內廣告投遞,在針對品牌及產品客製化的多層鎖定策略建議下,房地產廣告的 CTR 表現高於平均,並發現「人臉」群組辨識表現為佳,其中多為財經、名嘴等名人。而美妝品牌廣告 VTR 表現優異,則以品牌「 Logo 」、「人臉」群組有最出色的表現。

本文章內容由「驚點股份有限公司( FreakOut Taiwan )」提供,經關鍵評論網媒體集團廣編企劃編審。