推薦演算法失效?研究表明 YouTube 系統性誇大有關駭人聽聞和陰謀詭計的影片

去年 YouTube 上所引爆的爭議影片事件層出不窮,像是先前爆出 二次創作血腥卡通 及當紅創作者取材不當仍讓人心有餘悸。一名 Google 前員工不僅開發軟體揭秘 YouTube 演算法機制,還建立了一個網站開源他揭秘 YouTube 和 Google 演算法的方法。
評論
評論

本文由 AI 前線 編譯與導讀(微信公眾號:ai-front)英文原文 "An ex-Google engineer is scraping YouTube to pop our filter bubbles",INSIDE 授權轉載。

INSIDE 編按:去年 YouTube 上所引爆的爭議影片事件層出不窮,像是先前爆出 二次創作血腥卡通  及當紅創作者取材不當仍讓人心有餘悸。本文將揭露 YouTube 推薦演算法失效的原因。

 

AI 前線導讀

一名 Google 的前員工據說因推薦演算法問題建言惹怒上司而被解僱,之後他便致力於 YouTube 推薦機制的透明化工作,不僅開發軟體揭秘 YouTube 演算法機制,還建立了一個網站開源他揭秘 YouTube 和 Google(收購 YouTube)演算法的方法。

不管他是懷著何種目的來揭發老東家的問題,他的這一舉動都將對推進演算法透明化進程做出好的帶頭作用。用過 YouTube 的人可能都有這樣的體驗,當你看完一個影片以後, YouTube 會向你一個接一個地推薦影片,等你回過頭來一看,兩個小時已經過去了,而且你可能會看到一些價值觀奇怪,甚至扭曲的內容。不只是 YouTube ,Facebook、twitter 等社交媒體都會採用類似的推薦演算法,讓你看一些有趣可愛的內容還好,但是可怕之處在於它的邏輯傾向於單向,比如當你觀看了一條關於車禍的影片,系統會接下來會自動推薦更多的相關內容如災難、校園槍殺、氣候變化等負面的內容。

這樣的演算法機制是什麼,卻很少有人有全面的了解。

 

YouTube kid 採用人工推薦取代演算法推薦,AI 演算法不靈了?

2015 年, YouTube 曾推出一款目標受眾為兒童的 APP YouTube Kids,一直以來和 YouTube 網站一樣,都是使用演算法推薦內容。但演算法推薦並沒有達到該公司的預期,為了防止推薦演算法為兒童推薦不適合觀看的內容, YouTube 已經決定用人工選取內容的方法代替演算法推薦,並重新思考如何使用推薦演算法中的過濾器。

Photo credit: YouTube Kids

新版 YouTube Kids APP 可能不僅依賴電腦演算法,而是包含由 YouTube 管理團隊直接挑選的內容。簡而言之,應用程序中的影片必須由人工,而不是電腦審核。

目前尚不清楚這款軟體是否會完全作為新應用上架,但似乎最有可能基於現有的訊息,採用人工審核內容的新模式。對此 YouTube 沒有發表評論,但消息人士稱新版本可能會在未來幾週內發布。對於父母來說,這是一次重大勝利。但對於技術人員來說,世界上最大的影片網站開始放棄在自己的產品中使用推薦演算法,難道推薦演算法不靈了嗎?

 

YouTube 、 Google 演算法屢屢被爆扭曲事實,演算法到底哪裡出錯了?

作為全球最受歡迎的影片網站之一, YouTube 擁有超過十億使用者每天觀看十億小時以上的資料。 YouTube 向公眾公開展示了一些統計數據,例如影片觀看量、點讚或討厭的次數。但是,它同時還隱藏了每個影片更細微的細節,比如網站向其他人推薦它的頻率。沒有完整的理解,我們就很難知道它的演算法究竟將你向什麼方向上引導,以及推薦的帶有偏見的影片背後被扭曲的事實究竟是什麼。

YouTube 已經不止一次因為因為推薦內容不當或扭曲事實而受到公眾的譴責。

2018 年 1 月,網上被一則由網紅 Logan Paul 上傳的在日本自殺森林死者旁邊發表不當言論的影片刷爆,截至 24 小時後被下架,這則影片的觀看量已達 600 萬。Logan Paul 對死者的輕蔑和不尊重引發眾怒,同時掀起了一股譴責 YouTube 平台將這種影片放在推薦首頁的聲討浪潮。

YouTube 還被質疑利用演算法引導拉斯維加斯槍殺案背後的陰謀論,拉斯維加斯的倖存者們因為 YouTube 宣傳短片而憤怒,指責他們拍攝了一個騙局。在 4 月份 YouTube 總部附近發生的女殺手槍擊案中,女殺手在槍殺 1 人,並導致 4 人受傷後自殺,原因據說與其在 YouTube 平台上影片的觀看量下降有關。

利用推薦, YouTube 平台還間接鼓勵如粉紅豬小妹吃掉父親、喝漂白劑等影片背後,以兒童為受眾的次文化。

除了 Facebook、Twitter, YouTube 同樣被質疑利用演算法影響 2016 年大選,在大選期間成為製造和傳播虛假訊息的引擎等等。

 

演算法原理和產生的問題

據公司內部人員透露,演算法已經成為驅動 YouTube 收入增長最有效的工具,使用神經網路通過大量資料和使用者觀看記錄對使用者進行分析, YouTube 的工程師將其描述為「目前規模最大、最複雜的商用推薦系統」。那這個推薦系統到底是怎麼工作的呢?

上圖是 YouTube 推薦系統的體系結構,在向使用者展示少量推薦影片之前,會對影片進行檢索和排名。

本質上,過濾氣泡(filter bubble,一種網站針對客製化搜索而提供篩選後內容的結果)的生成方式,也是所有推薦演算法的工作原理。一小段電腦程式碼追踪你正在進行的動作,比如你最常看的影片分類、最長觀看時間,然後推薦給你同一類型的影片。從某種角度而言, YouTube Kids 提供的節目明確按照孩子們想要看的影片進行推薦。實際上是孩子們自己做出的選擇,直到第二次他們失去了興趣,選擇看其他影片。

內容推薦演算法的過程一般包括以下三步:

  • Item Representation:為每個 item 抽取出一些特徵(也就是 item 的 content 了)來表示此 item;
  • Profile Learning:利用一個使用者過去喜歡(及不喜歡)的 item 的特徵數據,來學習出此使用者的喜好特徵(profile);
  • Recommendation Generation:通過比較上一步得到的使用者 profile 與候選 item 的特徵,為此使用者推荐一組相關性最大的 item。上圖內容推薦演算法的步驟展示出了推薦演算法的基本原理。

而孩子們觀看影片有一個特點,就是喜歡反復觀看同一個影片,直到完全理解。與過濾氣泡推薦演算法相結合,其實 YouTube 應用軟體只是忠實地對孩子的想法作出反饋,推薦更多相關內容。但這也被別有用心者利用,傷害孩子的身心健康。

雖然 YouTube Kids 影片的創造者花費無數的時間來與推薦演算法博弈,使他們的影片有盡可能多的機會被推送給更多觀眾,但是由於一旦偏離了特定的分類和標籤,就會面臨巨大的風險,因此,推薦演算法和商業策略的相悖會繼續阻礙健康、民主、較為平衡的內容生態的維護。

 

Google 前員工自建網站,推出開源項目破除 YouTube 演算法過濾氣泡

普通人對於 YouTube 的做法可能只停留在憤怒和譴責層面,做不了更多的事。但有人卻將之付諸行動,並尋求解決的辦法,致力於推動演算法透明化。

Guillaume Chaslot (Photo credit: algotransparency.org)

Google 前員工 Guillaume Chaslot 就是後一種人,他自建了 一個網站 ,用來揭示 YouTube 和 Google 演算法的工作原理,讓這個被稱為全世界目前最複雜的商業推薦系統演算法透明化。

據 Guillaume Chaslot 稱,2013 年,他因為建議公司讓使用者對內容有更多掌控權而被公司開除。回顧他在 Google 工作的三年中,他曾與 YouTube 工程師團隊一起工作了幾個月,負責推薦系統。這一經歷使他得出結論, YouTube 給予其演算法的優先地位是極具危險性的。

「YouTube 給你營造一種被扭曲的現實。」他說道:「推薦演算法並未進行一種真實、平衡或健康的優化。」

Chaslot 解釋道, YouTube 演算法是會不斷變化的。它會不斷改變其賦予不同信號的權重:例如,使用者的觀看模式,或者在有人點擊之前觀看影片的時長。

在 YouTube 那段時間,他與他合作的工程師負責不斷嘗試新的公式,通過延長人們觀看影片的時間來增加廣告收入。他回憶道:「觀看時間長度是重中之重。 其他一切都不重要。」

他特別擔心演算法對事實的扭曲,因為過於聚焦在向使用者展示他們感興趣的內容,會導致過濾氣泡的出現,這些泡沫只會向人們展示增強其現有世界觀的內容。Chaslot 說道,他提出的修復措施中沒有一個被他的上級採納。「YouTube 有很多方法可以改變演算法來抑制假新聞,並改善人們看到的影片的質量和多樣性。」他說。「我試圖從內部改變 YouTube ,但沒有奏效。」

之後, YouTube 和 Google 在演算法上的一些改變在 Chaslot 看來大多是表面化的,並沒有從根本上改變演算法中演變出的一些令人不安的偏見。2016 年,他開發了一款程序進行調查。

Chaslot 編寫了一款軟體,旨在為大家提供全球首個探究 YouTube 推薦引擎的窗口,該應用程式模擬使用者在觀看一個影片後引發推薦影片鏈,並追蹤資料。

在過去的 18 個月中,Chaslot 利用該計劃探索法國、英國和德國選舉期間 YouTube 上推廣內容的偏差,全球變暖和大規模槍擊事件,並在 他的網站 上發布了他的調查結果。每項研究發現不同的東西,但研究表明 YouTube 系統性地誇大了有關分裂主義、聳人聽聞和陰謀詭計的影片。

從目前該網站披露的項目來看,至少在 2016 年美國大選、拉斯維加斯槍擊案、德國大選等事件中, YouTube 演算法都發揮了重要的作用。

通過該網站的檢測,有助於我們更好地了解 YouTube 演算法帶來的影響,同時帶給我們關於機器學習演算法透明化的思考:從使用者的角度來看,演算法透明化是趨勢,也是有必要的,這就給破除黑箱問題提出了更迫切的要求。


快商務時代來臨!解密電商如何拼快送布局

快商務的核心價值是滿足消費者的需求,但物流配送的核心是「穩」,對消費者而言,貨物運送的品質及運送時間準確性是基礎要求,再來才是追求快速等附加價值,雙管齊下才能獲得消費者的信賴。
評論
快商務時代到來,速度與方便性成為品牌決勝點。Photo Credit:爆米花數位
評論

去年年中一場疫情,民眾足不出戶,讓大家都感受到物流快與穩的重要性。隨著快商務(quick commerce)的發展,電商業者不再只競爭誰家商品多、誰家優惠多,全方位的服務才是電商之戰的新主場,尤其是物流服務,更成為通往消費者心中的關鍵道路。

根據 KPMG 報告,隨著都市化程度越來越高,小家庭與獨戶家庭也不斷增加,消費者的購物行為也發生變化,在現在的消費市場中,少量商品的需求越來越多,速度與方便性比以往任何時候都更加重要,也是品牌的決勝點之一。

快商務元年?國內外電商龍頭早已開始布局

快商務顧名思義就是要求快速交付貨物,跨國外送公司 Delivery Hero 也指出,快商務是電商的新時代,要縮短這傳統的最後一哩路,更要靠科技服務。除了空間及交通系統的優化,當然還有包含 AI 預測及庫存管理系統,透過數據和技術來減少成本。根據摩根大通的研究指出,Amazon 可能成為美國最大的物流公司,Amazon 自 2019 年開始就發展「一日到貨計劃」,為 Prime 會員推出 24 小時到貨服務,靠著自動化技術不斷優化物流流程,在幅員遼闊的美國做到一日到貨服務。

美國電商龍頭Amazon靠著自動化技術優化物流流程,在美國也做到快商務。圖片來源:shutterstock

而提到快商務在台灣的發展,便會想到 PChome 24h購物,2007 年 PChome 24h購物首創 24 小時到貨專區,在台灣電商與物流界掀起革命,為了掌握更全面的服務,也建立自有車隊,把關送貨速度及品質,目前 PChome 已在北部六縣市推動 6 小時到貨試營運,預計於 2022 下半年開始啟用 A7 中華郵政智慧物流園區營運,可望進一步提升為 4 小時到貨,值得期待。近來因外送平台的興起,從美食外送到生活用品外送,將送貨時間縮短到 24 小時內,開始以個位數小時計,2021 年 7 月登台的韓國電商 Coupang 更是打出未來 10 分鐘到貨,刺激台灣電商業的物流布局。 

韓國亞馬遜之稱的coupang進軍台灣,打出10分鐘到貨口號。圖片來源:Coupang 酷澎-官方FB

快商務發展三布局

1. 採取包圍戰加強衛星倉

過去電商為了管控出貨品質,常以大型集中式倉儲為戰略,隨著快商務興起,加上都市化程度越來越高,設點在市區、離消費者更近的衛星小倉儲也成了不可或缺的倉儲策略。

大型集中式倉儲及小衛星倉兩者雙管齊下,更能同時提升速度與品質。亞洲物流科技新創 Pickupp 於 2021 年 7 月進軍台灣,其在城市內與小型實體店面合作「共享衛星倉」,透過彈性的方式與店面共享空間,將一些實體店面的閒置倉庫和空間變成物流中心,以增加衛星倉的數量,提升物流效率之外也幫助實體商家帶來額外收入,對自身服務、消費者、商家等來說多方受惠。

2. 強化運能保留彈性

過去台灣的物流產業以大型貨車為主要運送工具,隨著外送平台的興起,人們漸漸注意到機車的運能在城市生活更加便利,機動性高,運送成本也較低。

PChome 24h購物自有車隊即有超過 200 台貨車與機車的配置,且送貨品質如包裝的完整度及乾淨度高,隨著快商務需求增加,近來更與 Pickupp 合作,加強機車運能,可紓解臨時訂單或是交通塞車的問題,在維持品質之餘,也努力讓物流運送更有效率。

電商平台與物流平台聯手,機動性更高的摩托車運能讓配送服務快上加快。圖片來源:Pickupp台灣-官方IG

3. 數位化加強配送效率

傳統物流是人力密集產業,電商業的優勢在於可收集數據,預測更多的消費者行為,數位化成為快商務的一大助力,不僅在倉儲空間可設有自動化技術,如自動搬運機器人 AGV、機器手臂等,在物流上,也能藉由數位化計算訂單的時間、材積、路線後給予最有效的分配。

從消費者在線上展開購物體驗開始,AI 技術即可預測消費者可能購買商品,並進行貨物倉儲布局,當消費者下單,更能根據訂單內容、材積、運送地點計算出最適合出貨的方式和路線。PChome 24h購物今年將啟用的 A7 自動倉儲中心,除了倉儲面積增加五成,更大量使用AI人工智慧與物流結合,運用自動化技術降低人力、加速揀貨速度,預計啟用之後包裹處理量將提升一倍以上,運能也將提升 2 倍。

數位化倉儲成為快商務一大助力。圖片來源:爆米花數位

快商務蓬勃發展,物流核心價值不能忘 

快商務的核心價值是滿足消費者的需求,但消費者的需求是否完全圍繞著快,也是視情況而定,除了快,在商務上也有許多本質是不能偏廢的,例如建立與消費者的信賴感。電商自有車隊的物流士穿著整齊乾淨制服在街頭穿梭,以及貨物乾淨完整送到消費者手上,甚至在春節假期也提供不打烊配送服務,即使消費者臨時有送禮或是生活用品需求,不用離開團圓現場就能依靠有品質的快商務完成,滿足現代消費者的需求及渴望,無形中也帶給消費者信賴感。

快商務服務不只包含「快」,貼近消費者需求的「穩」亦然重要,如專業有素的電商物流士、過節不打烊的貼心配送。圖片來源:爆米花數位

在目前追求快速的浪潮下,其實最不能忘記的是物流配送的核心──「穩」,對消費者而言,貨物運送的品質及運送時間準確性是基礎要求,再來才是追求快速等附加價值。維持原先的穩定外,再因應快商務的潮流,雙管齊下才能獲得消費者的信賴。 

本文章內容由「爆米花數位」提供,經關鍵評論網媒體集團廣編企劃編審。