未曾謀面卻可以知道你的長相,美最新研究演算法用 DNA 還原人像!

最近,美國著名基因組學專家克雷格·文特爾(J. Craig Venter)在知名學術期刊《美國國家科學院院刊》(PNAS)上發表了一篇論文,稱新的算法能透過分析個體的基因組訊息來還原我們的長相,將包括臉形、眼睛、髮色甚至是聲音在內的諸多臉部特徵融合進一張圖片之中
評論
評論

本篇原文刊登於合作媒體 36kr,INSIDE 經授權轉載。

最近,美國著名基因組學專家克雷格·文特爾(J. Craig Venter)在知名學術期刊《美國國家科學院院刊》(PNAS)上發表了一篇 論文 ,稱新的演算法能透過分析個體的基因組訊息來還原我們的長相,將包括臉形、眼睛、髮色甚至是聲音在內的諸多臉部特徵融合進一張圖片之中

即便從未見過你,這個演算法通過分析 DNA 就能獲取你的長相

左邊是真人照,右邊是預測圖

Photo Credit:Human Longevity

演算法預測人臉

基於全基因組測序數據,文特爾的 研究團隊 召集了 1061 名年齡在 18 至 82 歲之間的人群參加,並且保證他們來自不同的種族。之後研究人員收集了這些樣本的 3D 臉部圖像、聲音、眼睛、膚色、年齡、身高和體重等數據,創造預測模型。

就預測的情況來看,演算法對瞳孔顏色、膚色和性別等簡單特徵的預測準確率較高,但在聲音等其他更複雜的遺傳性狀上還存在比較多的困難。

此外,該團隊還開發了一種名為最大的機器學習演算法,其創新之處在於它能找到所有預測模型的最佳組合,實現全基因組測序數據與人口統計數據的互相匹配。例如,10 名參與者中能保證有 8 個來自不同種族,一半的人是非裔美國人或者歐洲移民。

文特爾說:

我們著手進行這項研究是為了證明個體的基因組代碼記錄了關於個體的一切,預測模型是健全的,儘管目前的研究樣本有限,但是隨著數據庫中的研究人數增加到數十萬,我們將能夠更精準地預測個體基因組中可預測的一切。

論文的作者之一、數據科學家 Lippert 補充說:「這項研究顯示了成像技術對大量人物特徵進行篩選的潛力,機器學習能夠實現全面自動化的數據解釋,並在科學發現中起著至關重要的作用。」

試想一下,未來如果這種「身份反推」的演算法可行的話,那麼警察就可以通過提取血跡中的 DNA 還原出嫌疑犯的長相了。

不能精準預測

不過,文特爾的論文一經發表便在社交媒體上引起了不小的波瀾,很多人對於「基因預測人臉」這一結論的準確性持保留態度。

美國另一家 DNA 檢測公司 My Heritage 的首席科學家、哥倫比亞大學電腦科學助理教授 Yaniv Erlich 就在生命科學預印本網站 BioRxiv 上直言不諱地指出了論文存在的錯誤,認為其並沒有利用全基因組訊息中的標記物(比如人臉識別需要挖掘臉部特徵的標記點)來識別人的身份。

文特爾的基因檢測技術並不能準確預測人臉。因為原作者並不知道某一特定個體的身高或臉部結構,他們只是根據人口統計學上的平均值來進行了預測。

事實上,Erlich 一年前就吐槽過文特爾的預測演算法。當時,文特爾利用演算法「預測」出了自己 DNA 背後的臉部 3D 圖像,Erlich 之後找了一張演員的真人照與預測圖像作對比,結果發現,經演算法預測之後的照片看起來更像是一位名叫 Bradley Cooper 的美國影星。

Erlich 說:「其實在相同的拍攝角度下,很多白人男性看起來都很像預測出的這張臉。」

曾擔任美國「科學」雜誌審稿人的格里弗也透露,文特爾的基因預測技術並不能從人群中準確地識別某一特定對象,論文兩次都未通過該雜誌的審查,在此之前文章也遭遇了因找不到出版商而難以發表的情況。

演算法預測人臉究竟可不可行?

在遺傳學中,諸如瞳孔顏色、膽固醇水平等被稱為「表型」。表型或多或少是由生物特定的 DNA 或基因型決定的。

在賓夕法尼亞州立大學從事基因臉部預測研究的 Mark Shriver 說

這就是為什麼從 DNA 中識別特定個體的面孔不僅僅在理論上是可行的,而且是可能的,這是我們的未來。 

但是因為長相的影響因素比較複雜(五官尺寸、面容比例、脂肪厚度、毛髮密度等一系列因素都會極大地影響一個人的長相),因此想要確切地知道 DNA 對於臉部特徵的作用(或者從 DNA 裡讀出臉部特徵的諸多訊息)還需要不斷地進行深入研究。

並且,文特爾團隊近幾年在「演算法預測人臉」這條路上闊步前進的同時也在有意引導人們越來越重視個人隱私。

試想一下,如果上文提到的警察應用演算法還原嫌疑人長相的事情成為現實的話,這在某種程度上意味著出於研究目的而收集的基因組將因此而失去其私有屬性,不再真正為個體所有。

文特爾認為基因組數據(特別是公共數據)具有嚴重的隱私風險。也就是說,如果有人可以訪問我們的基因組,那麼他們可能會通過生成預測照片來找到我們。

不過文特爾提及「基因檢測存在隱私風險」這一點也是為了自我行銷。因為他認為像他創立的「人類長壽」這樣的私人數據庫更有可能為個體提供必要的保護。

據了解,人類長壽公司(Human Longevity Inc)由文特爾與乾細胞先驅羅伯特·哈里里和 XPRIZE 基金會創辦 人彼得·迪曼蒂斯組建,該公司試圖利用基因組和乾細胞療法,尋找相應的治療藥物,最終實現延緩衰老、保持健康和身體機能的目標。