史丹佛大學新 AI 算法,用照片判斷出你的性取向!

評論
評論

本篇來自合作媒體 雷鋒網 ,INSIDE 經授權轉載。

有的細節,人無法辨認,不等於機器也不行;比如透過臉部的細微特徵來判斷這個人的性取向。

史丹佛研究員 Michal Kosinski 這麼說。雷鋒網獲得消息,他和同學 Yilun Wang 一起寫了個深度學習算法:僅憑一個人的照片,就能判斷他或者她,是否是同性戀。

這個算法的準確度並不低:

雷鋒網獲知,只有一張正面照的情況下,有 81% 的準確率成功判斷「直男」還是「Gay」;判斷是否為「女同」的準確率則是 74%。在有五張對方照片的情況下,準確率被提升到 91%(男)和 83%(女)。

相比之下,人類僅憑相貌猜測一個人性取向的準確率通常為 61%(男),54%(女)。

一張圖告訴你美國的 Gay 和女同「長什麼樣」

兩位研究人員根據該約會網站的數據樣本,製作出了美國直男、直女、男同、女同四個人群的合成照片,即典型相貌:

左上為「典型美國直男」,左下為「典型美國直女」,右上為「典型的美國 Gay」,右下則是「典型的美國女同」。至於最右邊的兩張線條圖,上圖是直男、Gay 的主要面部輪廓區別(紅線表示 Gay,綠線為直男);下圖則是直女、非直女的主要臉部輪廓區別(紅線為女同,綠線為直女)。

總結起來,兩位研究人員在「同性戀 vs 異性戀面部輪廓區別」這個話題上,總結出的結果可概括為:

Gay 傾向於擁有被劃分為「非典型男性」的特徵、表情和打扮。簡單來說,Gay 看起來更女性化,下頜更窄,鼻子更長,額頭面積更大。

同則相反,一般下頜會更寬,額頭更小。

研究目的

兩位研究人員表示,開展該研究不是為了分辨同性戀人群。

在對方不知情的情況下獲取其性取向信息,在倫理上肯定站不住腳。而在技術上,即便該算法的準確率很高,在不能消除假正例(比如把某直男錯誤判斷為 Gay)的前提下,也不能用於在現實中辨別某個人群(「辨別」特定人群的動機,本身很值得討論與批判)。

另外,《經濟學人》指出,該研究在數據集上有一個非常大的局限性:

其數據集是來自美國某約會網站的 36630 名男用戶的 130741 張照片,以及 38593 名女用戶的 170360 張照片。同性戀和異性戀群體的樣本大小基本一致。

眾所周知,一個人在約會平台上發布的照片

通常經過精挑細選,往往會化妝打扮以及對照片進行 PS。這些照片和一個人真實的生活狀態應該是有區別的。因而,若把該算法應用於普通生活照片,其準確性極有可能會大幅降低。

其實,研究員 Michal Kosinski 表示,這項研究的真正目的是警告大家和政府—每個人的隱私究竟面臨著多大的威脅。

更多關於這項研究的 訊息 可見此。

評論