蘋果發布了第一篇 AI 論文,既刷了存在感又能吸引人才

以保密為文化傳統的蘋果一貫不喜歡對外公佈自己的研究成果。但不久前在機器學習的頂級大會 NIPS 上,蘋果 AI 團隊的負責人拉斯 Russ Salakhutdinov 宣布,公司已經允許自己的 AI 研發人員對外公佈論文成果。
評論
A group of young developers stand for a group photo on stage during the Apple World Wide Developers Conference in San Francisco, California, U.S., June 13, 2016. REUTERS/Stephen Lam  TPX IMAGES OF THE DAY      - RTX2G1OT
A group of young developers stand for a group photo on stage during the Apple World Wide Developers Conference in San Francisco, California, U.S., June 13, 2016. REUTERS/Stephen Lam TPX IMAGES OF THE DAY - RTX2G1OT
評論

本文獲合作媒體 36kr 授權轉載。

以保密為文化傳統的蘋果一貫不喜歡對外公佈自己的研究成果。但不久前在機器學習的頂級大會 NIPS 上,蘋果 AI 團隊的負責人拉斯 Russ Salakhutdinov 宣布,公司已經允許自己的 AI 研發人員對外公佈論文成果。這則消息剛剛宣布沒多久,蘋果就發表了自己的第一篇論文,題目叫做《通過對抗訓練從模擬與無監督圖像中學習》(Learning from Simulated and Unsupervised Images through Adversarial Training),論文描述了如何利用電腦生成的圖像而不是真實圖像改進算法識別圖像能力的訓練。此舉一方面可以提高蘋果在人工智慧領域的存在感,同時如果其研究成果出色的話,也能在學術界贏得同行認可,並吸引到 AI 方面的人才。

在機器學習研究方面,訓練 AI 的圖像識別能力需要有標籤化的圖像作為訓練樣本。標籤化圖像的來源一般有兩種,一種是利用現實世界的圖像。真實世界的圖像資料則需要人工對計算機能看到的所有東西 - 比如樹木,貓狗,人,汽車等都打上標籤,顯然這是件非常耗時、耗力的事情。用來訓練人工智慧識別圖像的標籤圖像資料庫 ImageNet 就是耗費了大量人力用數年時間才建成的。

另一種是利用合成圖像(比如電玩遊戲裡面的圖像)。因為合成圖像本身已經標籤化並且經過註釋,所以訓練神經網路往往要比利用真實世界的圖像更有效。但合成圖像有一個問題,那就是算法學到的東西並不能總是適用於現實世界場景,導致神經網路從合成圖像學到的東西很難應用到真實圖像上面。

為了改進利用合成圖像資料訓練的效果,蘋果的研究人員採用了模擬 + 無監督的學習法,來提升模擬圖像對現實的仿真程度。他們利用了名為生成對抗網路的一個新版本,讓兩個神經網路相互對抗,最後產生照片級的圖像。

論文作者包括與 Ashish Shrivastava、Tomas Pfister 以及 Josh Susskind 等。其中 Susskind 是 Emotient 的聯合創辦人,這家 AI 初創企業可通過臉部表情評估人的情緒,今年早些時候已經被蘋果收購。

正如開頭所述,蘋果的第一篇 AI 論文意味著這家看重保密的公司邁出的一大步。在開源和開放成為主流的今天,隨著各大巨頭都在紛紛開放自己的機器學習技術來吸引人才,打造生態體系,蘋果過去的文化顯然已經不能跟上整體的步伐,及時作出改變是可喜的調整。