未來Email將預測你的心思自動寫完?Google大腦首席工程師在官方部落格詳細介紹了原理

在使用者寫郵件時可預測下一句的 Smart Compose 技術在Google開發者大會上廣受矚目。近期, Google 大腦團隊首席軟體工程師 Yonghui Wu 在 Google AI Po 出了這篇詳細介紹 Smart Compose 原理的網誌。
評論
評論

本篇原文《 Smart Compose : Using Neural Networks to Help Write Emails》合作媒體 雷鋒網 編譯,INSIDE 授權轉載。

編按:在 Google I/O 2018 上,除了 Google 助手給餐館打電話的場景贏得現場觀眾的喝彩外,在使用者寫郵件時可預測下一句的 Smart Compose 技術同樣也引得眾人歡呼。近期, Google 大腦團隊首席軟體工程師 Yonghui Wu 在 Google AI Po 出了這篇詳細介紹 Smart Compose 原理的網誌。

Google I/O 2018 上, Google 介紹了 Gmail 中的一項新特性,智慧預測拼寫功能: Smart Compose ,該新特性利用機器學習,互動式地為正在寫郵件的使用者提供補全句子的預測建議,從而讓使用者更快地撰寫郵件。 Smart Compose 基於此前智慧回覆(Smart Reply)技術開發而來, Smart Compose 提供了全新的方式來幫助使用者撰寫郵件,無論使用者是在回一封來件還是從草稿匣起草一封新郵件。

Google 在開發 Smart Compose 的過程中,遭遇到了以下這些關鍵挑戰:

延遲 :因為 Smart Compose 需基於使用者的每一次輸入來提供預測,所以它必須提供 100 毫秒以內的理想預測,這樣使用者才察覺不到任何延遲。這時候,平衡模型複雜性和推理速度就成了一個需要解決的關鍵難題。

使用者規模 : Gmail 擁有超過 14 億的各種使用者。為了面向所有使用者提供自動組句預測,模型必須擁有足夠強的建模能力,這樣它才能精細地在不同上下文中提供客製建議。

公平性和使用者隱私 :在 Smart Compose 的開發過程中, Google 需要在訓練過程中處理潛在偏倚的來源,並遵守像 Smart Reply 功能一樣嚴格的使用者隱私標準,以確保模型不會暴露使用者的隱私訊息。另外, Google 的研究人員也不具備查看使用者郵件的權限,這意味著他們不得不在一個自己都無法查看的數據集上開發和訓練一個機器學習系統。

找到對的模型

比如 ngram,neural bag-of-words(BoW)和 RNN language 這種典型的語言生成模型,它們是基於前綴詞序列來預測下一個詞的。然而,在一封郵件中,使用者在當前郵件撰寫會話中打下的單詞會給模型一個信號,模型會利用該信號來預測下一個單詞。為了結合更多使用者想表達的上下文, Google 的模型還會利用郵件主題和此前的郵件正文(假設使用者正在回復一封剛剛收到的郵件)。

Google 的方法是包含利用額外語境的一個方法,該方法是將問題轉換成一個序列到序列(seq2seq)的機器翻譯任務,其中源序列是郵件主題和上封郵件正文(假設存在上封郵件)的串聯,使用者正在寫的郵件是目標序列。儘管該方法在預測品質上表現良好,但它的延遲要比 Google 嚴苛的延遲標準超出了好幾個量級

為了提高預測品質, Google 將一個 RNN-LM 神經網路與一個 BoW 模型結合起來,結合後的模型在速度上比 seq2seq 模型要快,且只輕微犧牲了預測品質。在該混合演算法中, Google 通過把詞嵌套們平均分配在每個區域內,來對郵件主題和此前的郵件內容進行編碼。隨後 Google 將這些平均分配後的嵌套連接在一起,並在每次執行解碼步驟時將它們提供給目標序列 RNN-LM,過程如下面的模型圖解。

 Smart Compose RNN-LM 模型架構。將郵件主題和此前郵件訊息進行編碼,採用的方法是將它們的詞嵌套平均分配在每一個區域內。隨後,平均後的嵌套會在每次執行解碼步驟時提供給目標序列 RNN-LM。

加速模型訓練和服務

當然,一旦選定了這種建模方法, Google 就必須調整各種模型超參數和使用超過數十億的樣本來訓練這些模型,所有的這些操作都相當費時。為了實現加速, Google 使用了一個完整 TPUv2 Pod 來執行實驗。在這情況下, Google 能夠在一天之內將一個模型訓練至收斂狀態。

在 Google 訓練出速度上更快的混合模型之後,初始版本的 Smart Compose 在一個標準 CPU 上運行時,依舊存在幾百毫秒的平均服務延遲,這與 Smart Compose 努力預測語句來幫使用者節省時間的特點是不相符的。幸運的是, Google 可在推斷期間使用 TPU 來大大地加速使用者體驗,通過分流 TPU 之上的大部分計算, Google 可以將平均延遲改良至幾十毫秒,同時也能大大增加單一機器可處理的服務請求數量。

公平性和隱私

由於語言理解模型會反映人類的認知偏倚,這樣會導致得到多餘的詞彙聯想和句子完成建議,所以在機器學習內實現公平至關重要。Caliskan et al. 在他們近期的「Semantics derived automatically from language corpora contain human-like biases」論文中指出,模型的詞聯想深陷於自然語言數據的偏倚數據中,這為打造任何一個語言模型都帶來了相當的挑戰。在模型訓練過程中, Google 積極地尋找方法來持續降低潛在的偏倚。另外,由於 Smart Compose 是基於數十億的短語和句子進行訓練,這與垃圾郵件機器學習模型的訓練方法一致, Google 已經進行了廣泛的測試來確保,模型只記憶多種使用者都使用的常識語句,關於常識語句的調查結果源自這篇論文 The Secret Sharer: Measuring Unintended Neural Network Memorization & Extracting Secrets

未來研究

Google 將持續地研究改良語言生成模型的預測品質,為此 Google 會通過使用最先進的構架(如 Transformer,RNMT+等)和試用最新、最先進的訓練技術來實現這一目標。一旦模型的實驗結果滿足了 Google 的嚴格延遲約束條件, Google 就會把這些更加的先進模型部署到自家產品上去。另外, Google 還在進行結合個人語言模型的研究,該模型的目的是給系統增加一個新特性,讓它能夠更加準確地模擬每個使用者自己的寫作風格。


Cookie 消失?試試看全新 AI 影像內容辨識:讓用戶看的內容決定看到的廣告

Google Chrome 即將淘汰幫助廣告主的工具—— Cookie ,它的離去將再一次地影響數位廣告產業。
評論
Photo Credit:<a href="https://www.shutterstock.com/zh/image-photo/ai-artificial-intelligence-big-data-internet-1075853384" target="_blank">shutterstock</a>
評論

透過GA分析進站者發現, Safari的新客數越來越多,難道這表示 iOS 的用戶數也跟著增加了嗎?注意了,這有可能是 Apple 封鎖第三方 Cookie 帶來的影響。隨著 Google 即將淘汰 Chrome 上的 Cookie ,這個幫助廣告主記住用戶受眾的小工具,將要再一次地影響數位廣告產業。

Photo Credit:驚點股份有限公司( FreakOut Taiwan )

後 Cookie 時代的廣告受眾如何鎖定?

各大廣告平台在過去幾年不斷地透過 Cookie 以及其它方式,悄悄收集使用者的用戶數據,隨著這幾年用戶的隱私權意識抬頭, Apple 與 Google 對於藉由 Cookie 辨識用戶資料的廣告投遞方式,持有不同的態度,這也將是所有廣告主的極大挑戰。當 Cookie 不復存在,要如何辨識使用者資料?

Cookie 消失了,或許會有新的數據辨識工具來取代,但是任何試圖跟蹤受眾的方式,都難以符合大眾對於保護隱私權的期望。另一方面,也極有可能無法再通過日趨嚴格的媒體監管限制。無論如何,數位廣告不能像過去一樣,無條件地使用類似 Cookie 的追蹤方式,來達到與現在同樣的廣告效果。

後 Cookie 時代內容辨識類型的廣告鎖定方式,將成為未來具指標性的投放策略。廣告與瀏覽平台或內文主題的高相關性,不僅能顯著提高受眾的互動度,更重要的是,完全不需要收集任何個人數據。

FreakOut Taiwan 不斷嘗試更友善的廣告投遞形式, 自 2016 年進入台灣市場的原生廣告,到 2020 年末引進「 Mirrors 」 AI 影像視覺內容辨識系統,都是以網路使用者的角度出發。「 Mirrors 」不需要使用傳統的受眾興趣設定,即可針對「目標受眾在觀看的影像內容」、「品牌自身競爭對手或相關指定系列產品出現的影片」來投遞 YouTube 上的影音廣告。

Photo Credit:驚點股份有限公司( FreakOut Taiwan )

AI 人工智慧影像技術突破,推動新一代內容辨識功能

傳統的內容比對廣告皆為自然語言處理 NLP 中心,基於「純文字」的比對來顯示相關廣告,如大家很熟悉的 Google AdSense 。但是,結合新興的 AI 演算和複雜的圖像辨識,已然能夠達到「影片」的內容偵測,透過增加多個比對層和基於自然語言處理 NLP 的基準定位,可深度學習並提供更精細的辨識洞察力。

舉例來說,若想要將汽車廣告投放給對汽車有興趣的人,我們要先從可能對汽車感興趣的受眾中開始推估,並且根據過去的經驗加入不同的興趣條件,最後針對素材更進一步地測試。透過 Mirrors ,我們可以讓廣告出現在有滿足特定條件的影片內,例如:在消費者觀看的影片中,出現汽車評測報告、自家品牌或競爭對手的 LOGO 、代言人等指定條件,再依照不同廣告主設定的預算判斷是否露出廣告。

藉由這樣的影像比對方式,可以更有效地根據消費者行為觸發廣告投遞條件,而不再是現行的用戶受眾數據。人的興趣是多樣且多變的,當對汽車有興趣的用戶在完成汽車的選購後,短期內將不會再瀏覽相關資訊,轉而瀏覽其他更具時效性的內容。透過消費者當下正在觀看的影片內容,取代消費者身上被貼上的數位標籤,將更貼近消費者本身的使用行為。

Photo Credit:驚點股份有限公司( FreakOut Taiwan )

Mirrors AI 影像辨識:用消費者看的內容決定廣告

2021 年台灣數位報告指出,台灣人在各網路內容服務中,最愛「網路影片」的比例高達 97.9%,遠超過 Vlog、串流音樂、網路廣播、Podcast 。

影音廣告早已是品牌經營的趨勢:根據 DMA 2019 年台灣數位廣告量統計報告指出,台灣各類型廣告中,影音廣告以 37.2% 的成長比例大幅領先奪冠。其中 YouTube 持續蟬聯台灣最常被造訪網站第 2 名(僅次於 Google ) ,在台灣各大影音平台中的觸及率及影響力不容小覷。

2021 年 FreakOut Taiwan 已與客戶合作,進行搭載新系統的 YouTube 串流內廣告投遞,在針對品牌及產品客製化的多層鎖定策略建議下,房地產廣告的 CTR 表現高於平均,並發現「人臉」群組辨識表現為佳,其中多為財經、名嘴等名人。而美妝品牌廣告 VTR 表現優異,則以品牌「 Logo 」、「人臉」群組有最出色的表現。

本文章內容由「驚點股份有限公司( FreakOut Taiwan )」提供,經關鍵評論網媒體集團廣編企劃編審。