聊天中的微笑表情是示好還是罵人?MIT的新算法幫你「鑑諷」

「因為在網路環境中,我們無法用類似聲調或肢體語言的形式將情感語境化,使用表情符號則可以幫助我們實現語境化。」
評論
評論

本篇來自合作媒體  虎嗅網  ,INSIDE 經授權後轉載。

 「Was that Sarcasm?」 (剛剛那句話是在諷刺我嗎?)

生活大爆炸中,謝耳朵對「諷刺類語言」的分辨無能有沒有也讓你印象深刻!MIT 的研究人員近期的新研究可能會讓 Sheldon 類的 GEEK 歡呼:一套比多數人類更可以檢測諷刺語境和潛在情感的算法;當然這套算法不是為了 Sheldon 這類社交恐慌的人研發的,它的存在是為了在社交網路上更好地打擊種族歧視、辱罵和騷擾。

就像隨時在 twitter 上舉起的一支「sarcasm sign」。

對諷刺語言的了解可以幫助人工智慧有效打擊種族歧視、辱罵和騷擾。

翻看推特你會發現很多諷刺的評論-更不用說那些被誤讀的諷刺了。

所幸的是, MIT 的研究人員研發了一套比多數人類更可以檢測諷刺語境和潛在情感的算法。檢測社交中發文的情緒對有效追蹤人們對於品牌和商品的態度,以及對辨別指引金融市場的趨勢訊號起到巨大作用。但更準確的辨識推文和評論的意義可以幫助電腦自動圈出並撤銷帶有辱罵意味的網路言論。對於推文的更深層了解同樣應當能幫助專業學者,去理解訊息和影響因素是如何在網路中流動的。如果機器變的更聰明,感知情感的能力將會變成人與機器交流的關鍵一環。

研究人員原本打算建立一個可以檢測帶有種族歧視推文的系統,但後來他們發現,如果對諷刺沒有一定程度的理解能力,程序會很難理解這些推文。

這個算法運用到 深度學習 ,一個十分普遍的機器學習技術,基於用大量數據訓練一個龐大的模擬神經網路去辨識微妙的規律。訓練該算法的秘訣就是:很多推文都在情緒化語境中添加了類似於標籤體系的東西—表情符號。一旦他們利用這一點的幫助讀懂大部分情感,專業學者就為辨別諷刺開了個好頭。

「因為在網路環境中,我們無法用類似聲調或肢體語言的形式將情感語境化,使用表情符號則可以幫助我們 實現語境化 。」Iyad Rahwan,一位 MIT 媒體實驗室的副教授。他和他的學生 Bjarke Feibo 一同研究出了這套算法。

為了訓練這套叫做深度表情符號的算法,研究者們從 550 億推文中選取了 12 億個包含有 64 個最受歡迎的表情符號的推文。他們先讓系統根據推文的情感(開心、難過、搞笑等等)來預測什麼樣的表情符號可以被應用於該推文中。用表情符號預先訓練的算法在檢測諷刺歧視上表現的比沒有用的更出眾。他們將發布這套算法給大眾使用。

為了看看深度表情符號表現如何,研究人員在幾個用於檢測情感文本的標準檢查程序中測試了 DeepMoji。他們發現這套算法在各種情況下表現的比現有最好算法還要突出。

研究人員還對 DeepMoji 與人類進行了對比測試。他們發現這套算法在圈點推特上的諷刺和其他情感表現的比人類更為出色。相比於人類志願者 76% 的平均精確度,Mechanical Turk 擁有高達 82% 的準確率。

深度表情符號網站可以為推文自動生成表情符號。

Felbo 表示:推特上大家的語言習慣非常有意思,這也許是相當於當 DeepMoji 學習了不同的網路語言。

photo credit : flickr

學者們建立起了一個深度表情符號網站用於展示系統的表情符號部分。它會為小段文字自動匹配合適的表情符號。看上去運行的不錯,除了在我嘗試輸入唐納·川普現今還不是很有名的「covfefe」推文,它表現的如大家一樣一臉懵懂。

這個網站也支援用戶們的對於這項研究的貢獻,透過暱名上傳他們自己的推文和情感。這是這項工作中非常重要的一項,Rahwan 說到。通常情況下,研究人員是讓志願者來給貼文配對表情符號,這些數據都只是間接測量的。「這些基準無法抓住心理學家所謂的真正情感,」他說道。

Gary King 是哈佛大學定量社交科學系主任和挖掘社交意義方面的專家。他說道,用表情符號訓練是個十分明智的想法。但是如果大部分人都無法察覺的諷刺,辨識出來到底有多大的意義?「如果諷刺細微到人們都會錯過,那這些就都無所謂了」,他說。

儘管如此,這項成果反應了電腦越來越能感知人類情感的事實。文字的情感分析已經是一個普遍運用的技術。例如,它幫助公司通過郵件和聊天紀錄判斷顧客是否不滿。

今後電腦解讀我們的情緒將會變得越來越普遍,可以試想一下,機器人將能察覺到人類同事何時感到失意,或者何時的恭維是諷刺性的。

「如果機器要和我們一起合作,它們則要理解我們,情感確實是十分艱鉅的一項。」Rahwan 說到。