Facebook 人工智慧新突破!理解照片內容、把照片「說」給視障者聽

《The Next Web》報導,Facebook 最近展示了其 AI 人工智慧研究的最新進展。而其中最令人印象深刻的一項新系統,即是它能夠辨識出圖片內容,比如「一個滑板、一個男人、一個絕招、他的滑板」,並將這些元素串連,以語音方式解釋照片中可能正在發生的事。

The Next Web》報導,Facebook 最近展示了其 AI 人工智慧研究的最新進展。而其中最令人印象深刻的一項新系統,即是它能夠辨識出圖片內容,比如「一個滑板、一個男人、一個特技、他的滑板」,並將這些元素串連,以語音方式解釋照片中可能正在發生的事。

這項新系統由 Facebook 技術長 Mike Schroepfer 發表介紹。他表示,當圖片中的特徵和元素都能被機器理解,那麼機器對於理解 Facebook 上的內容就簡單多了。因為這將能讓 Facebook 運用此技術,以圖像為基礎,提供用戶他們最想知道的內容在他們的動態牆上。

Visual Question and Answering DemoEarlier this year, we showed some of our work on natural language understanding — specifically, a system called Memory Networks (MemNets) that can read and then answer questions about short texts. In this demo of a new system we call VQA, or visual Q&A, MemNets are combined with our image recognition technology, making it possible for people to ask the machine what's in a photo.

Posted by Facebook Engineering on Tuesday, November 3, 2015

目前這項技術並不開放給用戶使用,但會在未來結合於其他 Facebook 可能提供的服務上。

另外這項技術對於視障者,亦是一大福音。因為視障者可以透過嘴巴詢問 AI,現在在手機上的照片是哪張、長得什麼模樣,AI 也能以語音的方式描繪照片中的內容,讓視障者即使看不到照片,也能透過聲音,想像照片中的人物、風景。

Facebook 也表示,他們計劃在下個月舉行的 NIPS 人工智慧會議上發表論文,展示 AI 團隊最新研究成果,目前這項技術,據說比產業的標準快了 30%。

I'm inspired by this video about our artificial intelligence research at Facebook.Our AI can now look at a photo, figure out what's in it and help explain it to you. This is especially helpful if you're blind or can't see the photo. We see AI as helping computers better understand the world --- so they can be more helpful to people.We're still early with this technology, and you can already start to imagine how helpful it will be in the future.

Posted by Mark Zuckerberg on Tuesday, November 3, 2015