台灣的人工智慧產業在哪裡?Viscovery 力推產學研交流

Viscovery 上週六 10/1 舉辦了一場電腦視覺與深度學習研究成果分享會,廣邀入選 ECCV、ACM、MM、ICPR、CVPR、等知名電腦視覺與機器學習領域國際研討會的台灣研究員及教授一同交流研究成果,我們也訪問到與會教授和 Viscovery 執行長黃俊傑 Amos,和我們聊聊台灣電腦視覺與相關人工智慧技術的現在與未來。
評論
評論

在電腦視覺業界,代表台灣佔有一席之地的 Viscovery 上週六 10/1 舉辦了一場電腦視覺與深度學習研究成果分享會,邀請了近十位即將在國際頂尖電腦視覺、機器學習與深度學習研討會上發表論文的作者,和來自台灣北、中、南近七十名教授、研究人員、學生與業界人士分享最新的研究成果。我們訪談了多名 與會教授和 Viscovery 執行長黃俊傑 Amos,和我們聊聊台灣電腦視覺、深度學習與相關人工智慧技術的現在與未來。

電腦視覺:人工智慧領域,讓電腦「看得懂」世界的科學

「人工智慧」這聽似熟悉,卻好像離我們生活還很遠的科技,在過去幾年間產生了劇烈的大轉變。人工智慧,是讓電腦跟我們一樣看得懂、聽得懂,並且能進一步思考、和我們產生互動的一門研究,而「電腦視覺」正是人工智慧裡讓電腦「看得懂」的科學。

人工智慧研究近年來的重大突破,源自於「深度學習」技術的成熟。不久之前打敗世界棋王的 Alpha Go、Facebook 自動標記好友、Google 最新的搜尋引擎,都是這套演算法的應用。

電腦視覺的許多應用問題,在過去幾年間也因為深度學習技術成熟而有了突破性的發展。原本僅能偶爾偵測到的人臉,現在已成熟應用在身分驗證上;原本要上百個感應元件才能勉強上路的自動駕駛車輛,現在只要幾個相機,就能開上萬公里而不發生車禍;原本耗費大量人力的工廠品管、錄影監控等問題,現在已經大幅自動化。世界大廠如  GoogleMicrosoftFacebookIBM 在過去十年間,更是前仆後繼的大量投入研發資源與產品開發,晶片大廠如 Intel、NVIDIA、Qualcomm,甚至早在六、七年前,就開始以深度學習、電腦視覺為主設計下一代晶片。

然而像 Google 和蘋果現在的雲端相片識別技術都是轉化成文字標籤或簡介,但描述其實是不直覺且模糊的「山」、「草地」、「汽車」等等,或是用比對的方式以圖找圖,這都代表電腦還沒「看懂」影像內容。

我們的願景就是,電腦看到的和人看到的是一樣的。只要看過,就算這張椅子只露出上半部或只有正面照,你也能知道這是一張椅子。

——Viscovery 執行長黃俊傑

在這波劃時代的深度學習革命中,台灣科技業依舊走在製造、代工的路線;學界僅有的研究人員也都在缺乏產業資源的情況下,胼手胝足的辛苦奮鬥。 Viscovery 執行長黃俊傑從當初碩士做人工智慧研究,不斷試圖找尋電腦視覺技術的出口,更對台灣缺席這波技術革命,有分外深刻的感受,因此開始贊 助許多重要的電腦視覺研討會,如 ICCV、CVGIP、ACCV 等,甚至還主辦了這場論文分享會。

電腦視覺、機器學習、深度學習領域的一流學術研討會如 CVPR、ICCV,ICML,往往都在歐美舉辦,即便研究人員最新的研究成果從上千名投稿者中脫穎而出(有些會議論文錄取率還不到 5%),還要解決報名費、食宿、機票等等加起來動輒超過 10 萬元台幣的開銷。科技部研究計畫的補助常常不夠用,讓原本就已經很缺乏資源的情況雪上加霜。黃俊傑表示,此次論文分享會,就是要讓台灣的頂尖人才能無後顧之憂的參加這些頂級研討會,同時,更希望把這些最先進的研究成果帶到台灣,讓論文作者在正式發表前一兩個月,就能和台灣相關領域的學生、研究人員、教授分享最新的研究成果。

Viscovery 執行長黃俊傑認為,台灣有人才、有機會,並相信電腦視覺就是對的主題。未來的雲端預測將超過 80% 都是非結構化資料,其中影像識別將成為不可或缺的一部分,「不論是 Google 或蘋果,文字和語音搜尋的競爭版圖都已經大勢底定,但是圖像搜尋還有很大一塊尚未完成。」

發展軟體需要開放的技術和心態

▲左起為中研院副研究員王鈺強博士,Viscovery 首席科學家陳彥呈,Viscovery 執行長黃俊傑,Photo Credit: Viscovery
▲左起為中研院副研究員王鈺強博士,Viscovery 首席科學家陳彥呈,Viscovery 執行長黃俊傑,Photo Credit: Viscovery

「頂尖研究者碰到商業問題也不一定想得出解法,我們這場會議可以提供學界新的研究方向,」黃俊傑談起產學交流的重要,電腦視覺和深度學習的技術日新月異,業界必須密切關注最新的研究突破, Viscovery 希望開放這樣的分享平台,能讓產學合作激盪出新的火花,甚至帶起台灣產業開放交流的風氣。

▲清大電機孫民教授,Photo Credit: Viscovery
▲清大電機孫民教授,Photo Credit: Viscovery

在場的教授一致指出,這場分享會的可貴之處在於,這是一場深入電腦視覺深度學習垂直領域,同時又開放各界參與的產學會議,這在台灣尤其難得。孫民教授認為勇於開放技術交流才能激發產業生態蓬勃發展,而且需要有人能開第一槍,「五年之前美國也沒有 AI 產業,像 Elon Musk 和一群好朋友發起 OpenAI,在開放平台上技術和人才流動都很快。」

Skywatch 創辦人陳維超則認為,這是台灣軟體產業整體資金和市場的問題,台灣國際級的代工大廠多是靠著獨家技術成功,要他們接受軟體產業的開放思維不容易。加上公司內部對人工智慧、雲端不了解,導致有資源也只會往看得見、看得懂的房地產傾注。

產學交流激發創新,讓技術人才在出國前小試身手

▲中研院發表者陳威宇

為了讓電腦能夠進一步應用圖像,本次發表的研究包羅萬象,清大電機 所研究生 詹誠盛和指導教授孫民博士就用手部相機配合傳統置於頭部或胸口攝影的方法,來追蹤目標一天的活動,捕捉更完整的生活資訊。「電腦學會用戶行為以後,就能在你回家時自動開好冷氣、幫助記憶衰退患者捕捉服藥紀錄、注意有沒有關瓦斯等等。」

這場活動 的論文作者都 是「one in a million」,他們都是已經入選一流國際研討會的人才。

——Viscovery 執行長黃俊傑

另外同樣是清大電機所的研究生陳增鴻一樣由孫民教授指導,透過分析大量 第一人稱視角 影片,展示了自動為影片下標的演算法。為了達到目標,電腦不是只有辨識物件,還能找出影片重點事件並轉化成文字。過往電腦下標可能偏向事實陳述,

比如「A Man Riding Bicycle(一個人在騎腳踏車)」,卻不足以描述影片中的精彩片段,透過這個演算法自動下標,會變成像是「Awesome BMX Tricks(超強 BMX 腳踏車特技)」的強調性敘事標題。

台大資工所研究生陳育聖和莊永裕教授發表的研究成果,重新檢視各界忽略已久的照片縫合問題並加以改良,整合了多項影像處理演算法,降低全景照片的畫面扭曲,還能調整成最符合一般人所看到的視角。

中研院的陳威宇研究助理和王鈺強副研究員的研究,則著重於重複利用相似但不同應用的深度學習模型成果,如手機照片訓練出來的模型,搬到影片分析會產生角度、光影、背景的分類問題。

同樣來自中研院的楊惠芳博士後研究員與陳祝嵩研究員,分享了用深度學習於影像檢索的重大突破,解決手動設計分辨能力較低,但自動深度學習囿於目標複雜度過高而不夠有效。楊博士和陳博士設計出全新的、跨批量處理的訓練方式,突破了既有方式的限制,有效提昇了影像檢索準確性。

▲會後自由交流時間
▲會後自由交流時間

圖像辨識技術有待突破,Viscovery 望能搶下先機

img_3941
▲全體與會人員

Viscovery 專攻影片的內容分析與深度學習,擁有多項電腦視覺演算法專利,其中以 FITAMOS 技術為核心,開發出 VDS 智能影音探索平台 ,為目前主要的商業模式,透過精準辨識影片內容,可供廣告商安插關聯廣告,以及電商相似商品導購等應用。

VDS 能夠辨識影片畫面,並分類出人臉、圖像、文字、語音、動作、物件、場景等等,並統計各項目出現的次數等資訊,應用於相應的廣告或提供商品導購等等,廣告主也能利用辨識出來的物件,加強商品與觀眾的互動。

這樣緊追最新技術,Viscovery 究竟想成就什麼樣的未來呢?,黃俊傑這麼說到:

未來用監視器偵測人流、車流、打劫,或是醫院病人意外跌倒等用途會愈來愈廣泛。廣告、電商只是第一步,我們要讓大家在願景和收益上都能看見投資軟體開發是有未來的,我們要製造成功案例,來帶動整個產業。

這次共有八組講者參與發表,評審教授們根據報告內容及表現選出五名優選頒發 3 萬元台幣獎金,另外三名也有入圍獎金 5000 元台幣,作為出國參加研討會的差旅補助。

Viscovery 相當看重尖端技術研究,除了自辦交流活動,也 於去年贊助國際一流電腦視覺會議 ICCV,以及今年年底,難得 在台舉辦的 ACCV 學術研討會,「很多非營利學術組織需要資金,也不乏國際軟體公司資助,但像電腦視覺這樣的小型垂直領域能獲得的資源就很少。」有感於此,黃俊傑希望未來在國際研討會前都能主辦一次會前交流,未來雖考慮邀請更多業界大小公司參與,不過還是希望人數維持在 40 人左右,小規模但深入地針對電腦視覺處理技術交換意見。

黃俊傑說,未來趨勢熱點如無人車、無人機、機器人到監視器辨識犯罪行為,這些都是圖像資料,電腦視覺正踩在下個世代的風口浪尖,而 Viscovery 期盼作為種子來開啟整個產學更密切的交流,也期許自己能助台灣搶下未來圖像辨識的藍海。

車輪直徑為 20 英寸的小輪自行車,小輪車比賽分為在泥地賽道上的小輪車競速賽和以技巧為主的自由式小輪車比賽。


精選熱門好工作

平台營運專員

樂購蝦皮股份有限公司
臺北市.台灣

獎勵 NT$15,000

客服服務品質稽核專員

樂購蝦皮股份有限公司
臺北市.台灣

獎勵 NT$15,000

資深軟體工程師- KOL Radar (Senior Software Engineer, Node.js)

iKala 愛卡拉
臺北市.台灣

獎勵 NT$15,000

評論