
如何判定仇恨言論?Facebook 說明內容審查運作機制,AI 主動偵測且移除率高達 97.1%

社群平台上的仇恨言論一直都是頭痛又難以處理的議題,並且會隨著特定社會事件的發生(例如:選舉)而造成更加嚴重的趨勢。Facebook 亞太區內容政策經理 Manu Gummi 於今日(6/3)親自說明 Facebook 上的仇恨言論問題,主導內容審查與管理的她,除了分享 Facebook 如何定義何謂仇恨言論外,也揭曉目前內部的審查運作機制,以及現階段的進展為何。

社群守則:為了保障 20 億用戶表達意見的權利
Gummi 表示,Facebook 和 Instagram 合計共有超過 20 億名的全球用戶,共享不同的語言及文化,為了讓大家能夠自由、安全表達意見,所以制定了社群守則來規範平台上內容,確保並不會出現有害內容,或是假新聞、不實資訊的流竄。
Facebook 的社群規範包含五大核心價值:「意見」,表達意見是自由人權的一部份,但網路恐怕帶來其濫用的機會,為了確保用戶有表達的自由,因此意見的安全性非常重要;「真實性」,用戶該為平台上的一舉一動而負責,因此必須保障其真實性,確保用戶不會假冒身分,來做出虛假、不負責任的行徑;「安全」,是 Facebook 非常看重的一點,社群上不允許威脅、恐嚇、傷害他人的行為或言論出現;「隱私」,社群是用戶分享資訊的平台,但同時也必須保有隱私,以免遭有心人士濫用;「尊嚴」,社群上人人平等,用戶須公平遵守社群歸返,尊重自己也尊重他人的意見。
Facebook 如何制定內容審查政策?
內容政策制定小組分散在全球 11 個辦公室中,每隔兩周舉行一次「政策論壇(Policy Forum)」,政策論壇由多方領域的專家組成,共同討論當前社群守則的變革與制定,並且分享最近有什麼趨勢恐會導致有害內容,需要 Facebook 去特別關注。
在政策論壇結束後,制定小組會針對討論內容去諮詢相關議題的內部和外部利害人,包含學者及實務界專家;接著,蒐集用戶如何使用或濫用臉書平台的資料,觀察其行為與語境;最後,又到了開「政策論壇」的時間,由小組根據上述研究提出建議,再由各方專家一同討論提出具體建議,並放入政策實行之。
Facebook 如何定義仇恨言論
為什麼處理仇恨言論對社群平台而言,是一大挑戰呢?Gummi 表示主要有四個原因——
- 全球並沒有對仇恨言論有放諸四海皆準的公認定義。
- 每個人對言論的容忍度不同。
- 仇恨言論不能單看一字一句,必須考慮到發言者與接收者的語境與脈絡。
- 仇恨言論的詞彙是動態的,隨著時間會不斷改變、新增詞彙的意涵,因此很難掌握其變動性。
雖然難以定論何謂仇恨言論,但 Facebook 仍歸類了仇恨言論的要素。第一,需有「攻擊」行為,包含暴力、刻板印象、貶低他人、輕蔑、咒罵等行徑;第二,攻擊針對對象的「受保護特徵」,包含種族、民族、國籍、身心障礙、宗教信仰、社會階級、性別、性傾向進行攻擊,或是特別諷刺其年齡、職業、年齡,都是仇恨言論的範疇。
Facebook 在考慮當地脈絡與情境後,將仇恨言論分類出三個等級,從最嚴重到最輕微依序為——
- 第一級(最嚴重的等級):包含暴力言論、抹滅人性(非人化)言論、嘲弄仇恨犯罪的概念或受害者、特定抹滅人性(非人化)的比喻。舉例來說,將非裔明星的臉與猴子後製融合,疑似將「黑人」比喻成「動物」,這就是「特定抹滅人性(非人化)的比喻」。
- 第二級:貶低詆毀他人的陳述(攻擊生理、心理、道德缺陷)、表達輕視/憎惡/厭惡、咒罵。
- 第三級:號召排擠或隔離對待的行為(在政治、經濟或社會剝奪權力或隔離)、毀謗/詆毀。
Facebook 目前的內容審查成果
Facebook 從 2017 年開始執行內容審查相關政策,並在 2018 年投入 AI 人工智慧作為輔助工具,數年來也一直在科技上進行投資,以提高內容審查效率,並不斷增加更多元的內容讓政策更完整,保障更多用戶安全。
Gummi 根據社群守則執行報告分享,2019 年 12 月至 2020 年 12 月期間,Facebook 針對仇恨言論採取行動的效率增加了 389%。並且 Facebook 運用 AI 科技主動偵測(不須用戶手動檢舉)並移除仇恨言論的比例為 97.1%,對比 2017 年 Q4 的 25% 有顯著進步。
Facebook 如何進行內容審查?首先,AI 會不間斷進行主動偵測,依照上述的仇恨言論分級將不當內容進行排序,再交由人類審查員檢視。目前,Facebook 負責社群安全的團隊人數高達 35,000 人,並有 15,000 名內容審查員全天候地進行人工分析。當然,用戶也可以主動檢具不當內容,Facebook 保證在 24 小時內即可完成審查。
在 AI 科技方面,為了能提高內容辨識的效率及精準度,Facebook 團隊也致力提升「多語言理解」、「完整貼文理解(WPIE)」、「排序優先順序」的功能。
最後,除了平台提供的內容體驗,用戶也能自由管理自己在臉書上的隱私或動態牆設定,例如留言控制選項(Comment controls)、標籤審查和動態時報審查、暫停追蹤和取消追蹤、隱私設定檢查、檢視角度、分享對象選擇器,這 6 項工具都能幫助使用者降低不當內容的出現。
核稿編輯:Anny
延伸閱讀:
- 【F8 Refresh】首次線上臉書開發者大會:Research API、Messenger API 支援 IG 私訊 Bot 將登場、AR 視訊通話
- 臉友老是分享假消息?臉書三大策略反擊
- 臉書沒有在偷聽!Facebook 公共政策團隊總監 Steve Satterfield 說明隱私與廣告雙贏策略
- AI 維護社群和平?臉書辦記者會解釋 AI 如何左右內容審查
- 【硬塞評論】臉書文字獄?論社群平台內容審查的權衡