AI 怎學說話最自然?Elon Musk 認為從美國 PTT「Reddit」學最快!

人工智慧是科技巨頭目前重點發展方向這點大家都知道,但怎麼讓 AI 學的好又精準,這就考驗各家的功夫了。
評論
評論

人工智慧是科技巨頭目前重點發展方向這點大家都知道,但怎麼讓 AI 學的好又精準,這就考驗各家的功夫了。Elon Musk 旗下的人工智慧公司 OpenAI 在八月的時候,從 NVIDIA CEO 黃仁勳手上親自收到一份大禮:一台每秒浮點運算可達 170 Tflops 超級電腦 DGX-1(也送了一台給台大),黃仁勳甚至宣稱它是「世上第一台專為人工智慧學習所設計的超級電腦」。

那 Elon Musk 與 OpenAI 拿它來做什麼呢?學路況辨識協助 Tesla 自動駕駛?不。拿來算 SpaceX 火箭的發射軌道?也不是。嗯.... 答案有點意外,是學有美國 PTT 之稱的網路論壇「Reddit」!

可別以為這在開玩笑。事實上,這項計畫 被美國媒體 譽為「人工智慧產業發展以來,最困難的挑戰之一。」大家光從 PTT 就可想而知,要 AI 完全理解鄉民們說話有多困難。不同於學術論文或是正式新聞稿,鄉民們的梗、流行語或反諷對 AI 可是困難重重。但反過來說,如果 AI 連鄉民說的話都能理解,在機器學習語言上真的可謂一大突破。(或許中文文言文也蠻值得挑戰?)

OpenAI 最終目的是要將人工智慧訓練成一個「正常人」,正常到你跟它對話時,無法察覺它是 AI。不過對 OpenAI 來說,真正的挑戰可能就在於避免重蹈 微軟「Tay」的覆轍 。Tay 才上線一天,就被鄉民惡搞成滿口粗言的種族歧視者。既使這一年來,Reddit 的發言規則逐漸變得嚴格,但從 Reddit 學習語言的確還是會有類似 Tay 的風險。

會挑 Reddit 的另一個原因就是它「夠大」。畢竟對機器學習來說資料量越多越好,Reddit 目前為止已有近 20 億條發文,OpenAI 的研究員 Andrej Karpathy 表示 DGX-1 估計將在幾個月內就可完成整套學習流程,而且還不用套用新的演算法,「只要增加模型的大小就可以了」。或許很快在明年初甚至今年年底之前,我們就能看到 OpenAI 的 AI 現身跟我們聊天。


Cookie 消失?試試看全新 AI 影像內容辨識:讓用戶看的內容決定看到的廣告

Google Chrome 即將淘汰幫助廣告主的工具—— Cookie ,它的離去將再一次地影響數位廣告產業。
評論
Photo Credit:<a href="https://www.shutterstock.com/zh/image-photo/ai-artificial-intelligence-big-data-internet-1075853384" target="_blank">shutterstock</a>
評論

透過GA分析進站者發現, Safari的新客數越來越多,難道這表示 iOS 的用戶數也跟著增加了嗎?注意了,這有可能是 Apple 封鎖第三方 Cookie 帶來的影響。隨著 Google 即將淘汰 Chrome 上的 Cookie ,這個幫助廣告主記住用戶受眾的小工具,將要再一次地影響數位廣告產業。

Photo Credit:驚點股份有限公司( FreakOut Taiwan )

後 Cookie 時代的廣告受眾如何鎖定?

各大廣告平台在過去幾年不斷地透過 Cookie 以及其它方式,悄悄收集使用者的用戶數據,隨著這幾年用戶的隱私權意識抬頭, Apple 與 Google 對於藉由 Cookie 辨識用戶資料的廣告投遞方式,持有不同的態度,這也將是所有廣告主的極大挑戰。當 Cookie 不復存在,要如何辨識使用者資料?

Cookie 消失了,或許會有新的數據辨識工具來取代,但是任何試圖跟蹤受眾的方式,都難以符合大眾對於保護隱私權的期望。另一方面,也極有可能無法再通過日趨嚴格的媒體監管限制。無論如何,數位廣告不能像過去一樣,無條件地使用類似 Cookie 的追蹤方式,來達到與現在同樣的廣告效果。

後 Cookie 時代內容辨識類型的廣告鎖定方式,將成為未來具指標性的投放策略。廣告與瀏覽平台或內文主題的高相關性,不僅能顯著提高受眾的互動度,更重要的是,完全不需要收集任何個人數據。

FreakOut Taiwan 不斷嘗試更友善的廣告投遞形式, 自 2016 年進入台灣市場的原生廣告,到 2020 年末引進「 Mirrors 」 AI 影像視覺內容辨識系統,都是以網路使用者的角度出發。「 Mirrors 」不需要使用傳統的受眾興趣設定,即可針對「目標受眾在觀看的影像內容」、「品牌自身競爭對手或相關指定系列產品出現的影片」來投遞 YouTube 上的影音廣告。

Photo Credit:驚點股份有限公司( FreakOut Taiwan )

AI 人工智慧影像技術突破,推動新一代內容辨識功能

傳統的內容比對廣告皆為自然語言處理 NLP 中心,基於「純文字」的比對來顯示相關廣告,如大家很熟悉的 Google AdSense 。但是,結合新興的 AI 演算和複雜的圖像辨識,已然能夠達到「影片」的內容偵測,透過增加多個比對層和基於自然語言處理 NLP 的基準定位,可深度學習並提供更精細的辨識洞察力。

舉例來說,若想要將汽車廣告投放給對汽車有興趣的人,我們要先從可能對汽車感興趣的受眾中開始推估,並且根據過去的經驗加入不同的興趣條件,最後針對素材更進一步地測試。透過 Mirrors ,我們可以讓廣告出現在有滿足特定條件的影片內,例如:在消費者觀看的影片中,出現汽車評測報告、自家品牌或競爭對手的 LOGO 、代言人等指定條件,再依照不同廣告主設定的預算判斷是否露出廣告。

藉由這樣的影像比對方式,可以更有效地根據消費者行為觸發廣告投遞條件,而不再是現行的用戶受眾數據。人的興趣是多樣且多變的,當對汽車有興趣的用戶在完成汽車的選購後,短期內將不會再瀏覽相關資訊,轉而瀏覽其他更具時效性的內容。透過消費者當下正在觀看的影片內容,取代消費者身上被貼上的數位標籤,將更貼近消費者本身的使用行為。

Photo Credit:驚點股份有限公司( FreakOut Taiwan )

Mirrors AI 影像辨識:用消費者看的內容決定廣告

2021 年台灣數位報告指出,台灣人在各網路內容服務中,最愛「網路影片」的比例高達 97.9%,遠超過 Vlog、串流音樂、網路廣播、Podcast 。

影音廣告早已是品牌經營的趨勢:根據 DMA 2019 年台灣數位廣告量統計報告指出,台灣各類型廣告中,影音廣告以 37.2% 的成長比例大幅領先奪冠。其中 YouTube 持續蟬聯台灣最常被造訪網站第 2 名(僅次於 Google ) ,在台灣各大影音平台中的觸及率及影響力不容小覷。

2021 年 FreakOut Taiwan 已與客戶合作,進行搭載新系統的 YouTube 串流內廣告投遞,在針對品牌及產品客製化的多層鎖定策略建議下,房地產廣告的 CTR 表現高於平均,並發現「人臉」群組辨識表現為佳,其中多為財經、名嘴等名人。而美妝品牌廣告 VTR 表現優異,則以品牌「 Logo 」、「人臉」群組有最出色的表現。

本文章內容由「驚點股份有限公司( FreakOut Taiwan )」提供,經關鍵評論網媒體集團廣編企劃編審。