Facebook 訓練 AI 的秘密武器: 你的 Instagram 照片

Facebook 年度大會 F8 上,Facebook 公佈了他們在這場 AI 深度學習競賽中的秘密武器:Instagram 上的數億則照片。
評論
Photo credit: Luke van Zyl on Unsplash
Photo credit: Luke van Zyl on Unsplash
評論

Facebook 年度大會 F8 上,Facebook 公佈了他們在這場 AI 深度學習競賽中的秘密武器:Instagram 上的數億則照片。

Facebook 在 F8 會中示範如何使用數十億的公開 Instagram 照片,訓練在 ImageNet 拿到 85.4% 準確度的深度學習模型。

使用者的 hashtag 等於為照片提供分類參考的免費勞力,雖然省下另外貼標籤的麻煩,不過 Facebook 還是得歸類出使用者為什麼要下這些標籤,但面對擁有 17000 種 hashtag 的 35 億張照片,就算是 Facebook 也沒有資源像其他研究一樣人工篩選標籤,他們必須能大規模找出 hashtag 關聯的方法。

所以他們又做了一套「訓練前」的深度學習系統,找出哪些是相關的 hashtag,學習同義詞,以及 hashtag 的指涉範圍和層級,也就哪些 hashtag 包含其中比較細項的 tag。這套系統他們稱之為「大規模 hashtag 預測模型」。

儘管 Facebook 強調他們使用的是權限設定「公開」的照片,藉此避免隱私問題,不過 Facebook 正在風頭上,有多少使用者意識到他們的照片正被用來訓練 AI?恐怕 Facebook 還是在用戶溝通上多花點心思會比較保險。

另外,這套模型專注在辨識影像中的物件,不過也許能分析社群爆紅元素的演算法會是更有趣的應用。

可惜的是,以會中分享內容來看,訓練結果並不令特別驚艷,但為了規模化分類 tag 的「預先訓練」演算法倒是相當實用又有趣的亮點。

延伸閱讀: