【研之有物】如果電腦有神經,可以教它做什麼?

時間來到 2017 年,受惠於深度學習的進展,電腦視覺技術彷彿從單細胞生物進化到智人,發展出優異的影像辨識及理解技術,並成功應用於各行業與生活中。
評論
評論

本文獲合作媒體  研之有物  授權轉載, 執行編輯|林婷嫻  美術編輯|張語辰。

深度學習 (Deep Learning)

若將資料比喻為原料 (data),機器學習就是處理器 (processor) , AI 人工智慧相當於結果 (outcome) 。而「深度學習」是機器學習的一種方式,讓電腦像長了神經網路般,可進行複雜的運算,展現擬人的判斷及行為,是現今 AI 人工智慧的主流技術。

▲許多人試著進入「深度學習」領域,卻發現教材明明都是中文字,卻完全看不懂。(圖片來源:iStock、Nick Young、圖說重製:林婷嫻、張語辰)

如果上圖有打中你,本文整理 2017 中央研究院 AI 月 系列活動中,國內外專家分享的深度學習思維與應用。希望能讓深度學習成為各位小智的寶可夢,在人工智慧這條路上,走出樂趣與成就感。

深度學習:讓電腦長神經,教它判斷決策!

1960 年代起,科學家就試著透過各種機器學習技術,教電腦擁有人工智慧,例如會下西洋跳棋的電腦程式。但這跟現在的 AlphaGo 相比似乎不算什麼?這部分拜賜於電腦運算效能大幅提升、大量供訓練使用的資料,以及深度學習技術近幾年的突破性進展。

▲人腦思考仰賴神經網路的運作,科學家也透過設計函數模組,在電腦中組成「類神經網路」,讓電腦藉由餵養的訓練資料,歸納出背後的規則,做出最適合的判斷。(圖片來源:iStock、圖說設計:林婷嫻、張語辰)

從上圖可以看到,這是深度學習與傳統機器學習技術的最大差別:電腦有了四通八達的神經網路!透過層層非線性函數組成的神經網路、及精心規劃的權重訓練過程,電腦學會在未曾經驗過的情境下做出最適當的反應。

訓練深度學習模型就像教小孩,給予足夠的人生經驗,透過神經網路學習,讓電腦未來自己判斷怎麼做比較好。

若將深度學習比喻為手拉坏,陶土就是資料,陶碗成品是電腦自動找出來的函數 (function),而目前有的「拉坯機」為 TensorFlow, PyTorch, Microsoft CNTK, Keras 等程式庫,其中 Keras 算是 TensorFlow 的官方介面,比較容易上手、適合初學者。而核心處理器 GPU 就像拉坯機的電源,若是 GPU 強大又穩定,深度學習的運算速度會更快。但最重要的是,身為手拉坏師傅的你,要如何教導電腦這位學徒。

「深度」在於神經網路的層層結構

小時候爸媽會拿著圖書,教你辨認「1」,「2」,「3」每個數字的長相,若要教電腦辨識數字「2」,要先從該影像一個個像素 ( pixel ) 開始分析,經由層層層層層層層層層層層層層層層層函數組成的神經網路運算,最後判斷出這個影像「最可能」為數字「2」。

▲先教電腦定義每個影像的值,再透過神經網路的層層非線性函數運算,判斷這個影像最可能為哪個數字,信心水準比值最高者為答案。(資料來源:李宏毅提供、圖說重製:林婷嫻、張語辰)

為了達到較高的信心水準,有兩個關鍵:給與足夠的訓練資料,以及設計出優秀的神經網路。

深度學習的神經網路結構,該長什麼模樣?目前主流作法有 CNN (Convolutional Neural Network), RNN (Recurrent Neural Network) 和 GAN (Generative Adversarial Network) 等等 ,各有信徒支持的優點。

▲深度學習常使用的三種神經網路架構示意:CNN, RNN, GAN(資料來源:李宏毅提供、圖說重製:林婷嫻、張語辰)

CNN 善於處理空間上連續的資料,例如影像辨識;RNN 適合處理有時間序列、語意結構的資料,例如分析 ptt 電影版的文章是好雷或負雷;而 GAN 生成器 (generator) 與鑑別器 (discriminator) 的對抗訓練模式可以輔佐電腦「觀全局」,不會忘記自己做過的步驟而發生窘況,像是教電腦自動畫皮卡丘時,忘記自己已經畫了一個頭,最後畫出兩個頭。

強大的 AlphaGo 如何深度學習?

與 AlphaGo 對弈的柯潔曾表示:「與人類相比,我感覺不到它 (AlphaGo) 對圍棋的熱情和熱愛。我會我用所有的熱情去與它做最後的對決」。若以情感面來探討,確實為難 AlphaGo 。

因為在 AlphaGo 深度學習的過程中,訓練的資料並沒有任何熱血動漫或情書情歌,而是一張又一張專業的棋譜影像資料。台大電機系 李宏毅 教授以《棋靈王》漫畫的棋譜比喻說明,請見下圖。

▲透過眾多棋譜影像訓練,電腦可以學會根據目前棋盤上的局面,判斷下一步應該落棋於何處。本圖以《棋靈王》漫畫情節來比喻。(資料來源:《棋靈王》漫畫、李宏毅提供、圖說重製:林婷嫻、張語辰)

異質神經網路 (HIN):教電腦找到不同種資料的關連

除了「深度」,也別忘了「廣度」,把不同類型的資料整合在一起,可讓分析結果更精

來自伊利諾伊大學芝加哥校區的  俞士綸 教授點出,通常企業機關擁有的數據,是從各種不同管道蒐集而來,往往屬於不同型態。例如 Google 呈現搜尋結果建議時,除了看搜尋的關鍵字,也會參考使用者平常 Gmail 常用哪些字,或使用者正位於 Google Map 上的哪個位置。

這需要透過 HIN 異質神經網路 (Heterogeneous Information Networks) 技術,來理解並串連不同種類資料之間的關係。

俞士綸 教授以藥物研發為例,在藥物合成或試驗前,可先透過深度學習分析相關資料,瞭解化合物的藥效會控制哪個基因、該基因和哪個通道有關係,或了解某個副作用會由哪兩種化合物引起 (註二)。這些深度學習的分析結果,再搭配和生醫或化學專家討論,有助縮減研發藥物的時間和花費。

▲透過深度學習,幫助判斷哪個藥物研發路徑比較重要 (不同顏色的箭頭),及預測某個藥物能不能治療某種疾病。(資料來源:俞士綸提供 、圖說重製:林婷嫻、張語辰)

深度學習,超幅提升電腦視覺能力

1960 年代,人工智慧先驅者 MIT 教授 Marvin Minsky 曾說「給我三個月,還有一位大學生,我要讓電腦可以辨識影像」,但當時電腦的聰明程度只會畫一些簡單的圓形、正方形,後來 Marvin Minsky 和學生 Gerald Sussman 宣告這個挑戰失敗。

到了 1990 年代,電腦視覺 (Computer Vision) 有更進步的發展,例如由 David Lowe 發表的 SIFT (Scale-Invariant Feature Transform) 演算法,用來描述影像中的局部特徵,藉以偵測影像或影片在位置、尺度、角度上的對應及變異。

▲SIFT 電腦視覺演算法:先算出影像中每一個小區塊的方向性與梯度變化,再整合成各大區塊的方向性與梯度變化,降低資料的維度和雜訊,以利後續應用。(資料來源:陳彥呈提供)

現在大家常用的 panorama 全景攝影、3D 模型建立、VR 影像縫合等技術,皆應用到 SIFT 或類似的演算法;而 NASA 在外太空拍下火星地景照片時,也是透過 SIFT 演算法來比對地景特徵。
▲NASA 在外太空以俯視及平視兩種角度拍下火星地景,再透過 SIFT 演算法,辨認出同區域的視覺特徵 (照片中的彩色小圓圈)。(資料來源:陳彥呈提供)


時間來到 2017 年,受惠於深度學習的進展,電腦視覺技術彷彿從單細胞生物進化到智人,發展出優異的影像辨識及理解技術,並成功應用於各行業與生活中。例如:在生產線上辨識紡織品花紋的瑕疵,以及網美愛用的修圖 APP ──辨識痘痘的位置並套上讓肌膚平滑的濾鏡。
▲影像辨識技術:早期演算法只能辨識一些簡單的特徵,現在透過深度學習,電腦可以辨識看到的汽車、自行車、行人等等,算出相對應的距離,並判斷哪些目標需要注意。(資料來源:Nvidia launches Drive – the computer self-driving cars have been crying out for)


運用深度學習教電腦辨識視覺特徵,發展到極致可望革新人類的生活。Viscovery 研發副總裁  陳彥呈 博士在演講中分享,現今 NVIDIA 的自動駕駛系統,從頭到尾只教電腦一件事:「辨認哪裡還有路可以開,才不會撞上」。秉持這個單純的概念,擴增訓練的影像資料、優化深度學習的神經網路,NVIDIA 自動駕駛系統的影像辨識正確性、反應速度和駕駛時速,不斷提升到可以上路的程度。
▲NVIDIA 自動駕駛系統:用深度學習,教電腦辨認哪裡有路可走,才不會撞上任何障礙物。(資料來源:Volvo Cars and Autoliv Select NVIDIA DRIVE PX Platform for Self-Driving Cars)


但自動駕駛車上路後,有哪些變因是神經網路算不出來的? 陳彥呈 舉例,當交通信號燈從黃燈變為紅燈時,自動駕駛系統會辨認燈色,並判斷該剎車停下來。但若這時後方一輛人類駕駛的車輛,可能趕時間認為應該要闖黃燈,就會撞上自動駕駛車。這該優化的是電腦的判斷力呢?還是人類的判斷力呢?
雖然將深度學習應用到電腦視覺領域,看來走在時代最前端,可以幫人類完成許多事,但  陳彥呈 以黑客松 (hackathon) 競賽的範例來提醒,人們在進行深度學習研究時經常忽略的考量。
▲黑客松競賽中,學員提出用深度學習教電腦辨認「機車違規亂停」,幫助解決街道亂象。(圖說設計:林婷嫻、張語辰)


用 100 張違規停車的照片,加上 100 張依規停車的照片,透過 150 層的 ResNet 深度神經網路 來訓練電腦,辨認出違規停車。聽起來是很棒的點子。
陳彥呈以過來人的經驗分享,這最大的挑戰在於:第一層輸入訓練電腦的影像資料中,「機車」和「腳踏車」的視覺特徵變異,遠大於地上「白線」和「紅線」的視覺特徵變異,會讓電腦誤以為要學習辨認「機車」和「腳踏車」的不同,而無法辨認出「白線」和「紅線」。
就像要教小狗「坐下」,但卻說了很多不同語言的「坐下」,或同時伴隨華麗的手勢,會混淆小狗究竟該辨認哪個特徵,無法做出正確的反應。

一開始準備訓練深度學習模型的資料時,就要處理乾淨,有助於後續神經網路的運算表現。

深度學習:一天 24 小時不夠用 QQ

中研院資訊所  陳昇瑋 研究員在演講中說明:深度學習讓電腦具備從繁雜資料中歸納規則的能力,但電腦畢竟不像人腦直覺,過程中還要教電腦處理各層函數的權重 (weights) 與偏差 (bias) 。

台大電機系  李宏毅 教授分享教電腦辨識 ”2” 的經驗,需要餵給電腦一萬張以上的手寫數字影像資料。而若要訓練電腦自動畫出二次元人物頭像,為了達到看起來會想戀愛的精美程度,至少要運算 5 萬回合 (epoch),而每跑 100 回合可能就耗費大半天光陰。

▲透過 GAN 生成式對抗網路,跑了 5 萬回合後,教電腦自動畫出二次元頭像的成果。某幾個頭像是否看了感到心動?(資料來源:GAN 學習指南:從原理入門到製作生成 Demo、李宏毅提供)

 打算將鐵杵磨成繡花針的老婆婆,曾經感動李白奮發向上,而若李白來到這個時代,看到電腦科學家不屈不撓的「深度學習」精神可能會雙膝一軟。若您是某企業的高階長官,千萬別對軟體工程師說:「這有資料,現在深度學習不是很紅嗎?試試看,一個禮拜後報告。」任何人工智慧技術,都需要時間淬煉。

XXX 工作會消失?天網會消滅人類?

▲(左圖) 中間高台的人正在唸故事給工作的人們聽; (右圖) 拿著竹竿敲窗戶的 morning call 服務。(圖片來源:陳彥呈提供)

隨著科技發展,現在有音樂串流平台,可以排解工作煩悶。早上也能透過智慧手機鬧鐘,讓自己在降低起床氣的旋律中睜開眼睛。這些是在留聲機及鬧鐘尚未出現前,曾經有的人工服務,但現在圖中的工作都已經消失了。

唯一不變的,是變的本身 (change is the only constant) ─ 古希臘哲學家 Heraclitus

幫助人們完成做不到的任務、解決心有餘而力不足的問題,這是自始至終發展人工智慧的目標。以中研院「106 年度資料科學種子研究計畫」正在進行的研究為例 (註一),人工智慧可望幫忙解決生活中許多問題,包含:透過行動上網訊號來觀測人口流動,並預測傳染病的傳染區域途徑;藉由分析近年來交通事故的地方法院民事判決,歸納出法官如何衡量肇事責任的分配;亦可透過電腦視覺分析蛾類的體色,了解體色變化與氣候變異的關係。

現階段人工智慧受惠於深度學習,雖然相當強大,但尚有許多限制有待突破,電腦科學家們仍在蒐集訓練資料、優化神經網路、改善運算效能這條路上馬不停蹄。對於想踏入深度學習領域的初心者, 李宏毅 教授在演講中說出相當真實的心聲:

你看別人做手拉坏好像很容易,但自己做下去會有各種崩潰,深度學習也是一樣。心法在於你要相信自己一定做得出來!

▲2017 中央研究院 AI 月活動現場,講師正在向大家說明,如何建構精巧的深度神經網路。(攝影:張語辰)

看完這篇文章,當媒體下標天網要消滅人類、機器人發展自己的語言嚇壞工程師時,相信你已了解深度學習的能力與發展可能性。來自美國南加州大學的  郭宗杰 教授,在演講中笑著說:「因為不懂,會把它(深度學習)講得非常強;但如果懂了,就會知道它其實相當地有限,不要被外行人的說法嚇到。」

無論何種身分,若對於人工智慧和深度學習的最新發展感興趣,後續  中央研究院資料科學種子研究群 的活動現場有個位子,留給未來的你。

延伸閱讀:

2017 中研院 AI 月活動

註一. 106 年度資料科學種子研究計畫最終核定名單

註二. "PathSim: Meta Path-Based Top-K Similarity Search in Heterogeneous Information Networks", PVLDB, 2011.

註二. "Integrating Meta-Path Selection with User Guided Object Clustering in Heterogeneous Information Networks”,. ACM KDD, 2012. (Best Paper)

迎接 AI,先做到「AI Ready」。作者:陳昇瑋

人工智慧、機器學習與深度學習間有什麼區別? 作者:Michael Copeland


【圖解】電動車風潮席捲全球,TOYOTA PRIUS PHV 才是最適選擇!

當全世界都在鼓吹電動車之際,其實從現代人的用車習慣、造車技術、環保角度而言,許多車廠並沒有告訴你:「插電式油電複合動力車」才會是現況最適合的選擇。
評論
Photo Credit:TNL Brand Studio
評論

時至科技迅速發展的今日,人們享受由科技所帶來的便利生活,但同時也帶來了破壞環境和影響健康的負面效應。加上天然能源並非取之不盡,近年來汽車產業吹起了一股電動車風潮,全世界的主要國家也為了降低碳排放而推廣電動車。但從現代人的用車習慣、造車技術、環保角度來看,電池電動車是否真為現階段的最佳解答?

先從種類談起:多元化電動車款 HEV/PHEV/BEV 介紹及比較

說到電動車,除了純電動車外,其實電動車種類繁多,油電複合動力車、插電式油電複合動力車的差異在哪?哪個適合你?以下從「電力驅動比例」來介紹,相當簡單易懂。

Photo Credit:TNL Brand Studio

油電複合動力車(HEV):

「油」與「電」並行的驅動策略,引擎產生剩餘動力可轉為電能儲存,低速可以電能驅動,無法從外部充電,長短程移動皆適用,相對傳統燃油車油耗更佳。

插電式油電複合動力車(PHEV):

架構類似於油電複合車(HEV),電池規格加大,可使用通用規格充電樁與隨附充電線針對電池充電,短程移動可採用純電模式,長程移動則為油電並行,長短程移動皆適用,沒有如電池電動車(BEV)般的里程焦慮問題。

電池電動車(BEV):

完全電力驅動,由外部充電樁充電,受惠電力驅動特性,享有純電駕馭快感,但須考慮充電便利性。

電池電動車才環保?答案並非絕對

相對傳統內燃機汽車而言,電池電動車於行駛過程中雖然是零碳排,但車輛的環保與否,更需廣義的從產品的生命週期評估(Life cycle assessment,LCA),也就是從原物料開採、生產製造、行駛過程、回收過程的整體生命週期的總碳排量來計算。目前無論哪一款電動車,都不可能在生產過程時達到零碳排表現,且電動車上最高成本的電池組,不僅製造時需要使用稀有金屬,提煉過程本身更需要大量化學藥劑,且老廢電池回收亦可能造成環境污染。廣義討論而言,當前的電池電動車絕非零碳排與絕對環保的代表。

因此除了上述的生命週期評估,同步考量當前發電結構、充電設施普及率、用車習慣等問題,插電式油電複合動力車(PHEV)會是更好的解答。插電式油電複合動力車(PHEV)將電力驅動輔助比例放大,純電行駛里程增加,短程通勤可以純電行駛,長途移動則可油電並行,又無里程焦慮,絕對是當前兼具節能環保與便利性的推薦選擇。

銷售王來示範,PHEV 就應該要這樣

TOYOTA 一直以來是 HYBRID 油電車款的領導品牌,開賣至今已銷售超過 1,700 萬輛,不管是其油電複合動力車(HEV)或是更先進的插電式油電複合動力車(PHEV)的熱銷,無疑就是最佳印證。其中逐漸成為銷售主流的 TOYOTA PRIUS PHV 車款,成為經濟務實又節能環保的最佳代言人。

Photo Credit:TNL Brand Studio

TOYOTA PRIUS PHV 採用油電驅動系統,「油」的部分搭載高效能汽油引擎,採用 Atkinson 循環設計與 VVT-i 連續可變汽門正時控制系統讓引擎更具效率;「電」的部分則搭載雙馬達驅動系統,位置設置於引擎室下方,並有設置於後廂底板下的高效能鋰電池、位於後座下方的高效率車載充電器、設置於引擎室內的 PCU 動力控制模組等架構。

動力來源除了從油箱提供引擎燃油進而作動產生驅動力以外,電池則提供電力來驅動電動馬達作動。按下 EV Mode 車輛可以完全以電力驅動,而在一般狀態下引擎與電動馬達會透過 PCU 模組來管理以最高效能相互運用。除了引擎輸出超出駕駛需求會回充高效能鋰電池以外,也可利用外部充電來為鋰電池充電。

也因此 TOYOTA PRIUS PHV 車身上有兩個「油箱蓋」,左側為加油使用,右側則為充電使用。值得一提的是,PRIUS PHV 只要使用標配隨附的隨車充電線,即可使用一般的 110V 家用插座充電,且純電行駛里程可達 64km*註1,相當適合日常生活通勤使用;此外, PRIUS PHV 純電行駛最高極速可達 135km/h,結合油電模式的特性,適合長途行駛與遠程旅行,更可讓 PRIUS PHV 有著高達 109.9km/l*註2的平均油耗,達成傳統內燃機汽車或油電複合動力車(HEV)無法企及的節能表現。

Photo Credit:TNL Brand Studio

PRIUS PHV 擁有極具未來感的造型,相當流線的車身造型與具有良好空氣力學的雙曲面後擋風玻璃帶來了低風阻優勢,更配備了鷹眼式 LED 頭燈及飛翼式 LED 光條尾燈,為其賦予了更吸睛的靈魂。

立基於 TNGA 底盤基礎,PRIUS PHV 擁有輕量化高剛性的車身架構,給予絕佳的行駛穩定性以及安全防護能力,也為座艙內帶來相當寬敞的空間基礎。不僅前後排駕駛與乘客都可以擁有寬裕與舒適的乘坐空間,標準乘坐狀態下後行李廂可擁有媲美小休旅車的 360 公升置物容積,實用性毋庸置疑。

PRIUS PHV 旗艦版的座艙內中控台更配備了 9 吋 4G 旗艦主機,利用 4G 網路的連結,給予了 24H 愛車守護/一鍵救援/智慧導航等便利功能,搭配 Apple CarPlay & Android Auto智慧手機連結,以及 Qi 無線充電座*註3,完美接軌現代人習慣的科技生活。

PRIUS PHV 新增尊爵版車型,不僅享有等同於 HEV 車型的親民售價,且同步標配 TSS 2.0 安全科技,如 ACC 主動式車距維持系統(含 Stop & Go)、PCS 預警式防護系統、 LTA 車道循跡輔助系統等等全數搭載,讓更多喜愛節能與著重安全的消費者可以輕鬆入主。

台灣目前最合適的節能車選擇,加入油電革新行列——TOYOTA PRIUS PHV

總結以上,從環保角度來看,以台灣目前的用車環境與發電能源結構來說,油電複合的 HEV 或是 PHEV 車款,會是比較符合使用需求和節能的作法。尤其插電式油電複合動力車(PHEV)不僅可銜接當前油車使用習慣,還可最大化運用電力降低碳排放,可以說是在燃油與電力的使用之間,達到最佳的平衡。

若要在茫茫 PHEV 車款中,找到兼具環保節能、價格優勢、智慧內裝、卓越駕駛體驗者,那麼從 TOYOTA PRIUS PHV 車款入手絕對錯不了。高效能的油電雙驅動,只要使用一般家用 110V 插座即可充電;加上未來感十足的流線車身外型、舒適寬敞與安全穩定兼備的座艙結構,由裡到外帶給消費者最新的科技體驗;可連結智慧應用程式的旗艦主機,與時代接軌不落人後。加入油電革新、淨化未來的行列,且當前 TOYOTA PRIUS PHV 更推出空前優惠的尊爵版車型,汰舊換新震撼價只需 99.9 萬元,僅限量 30 輛,且享有與 TOYOTA 所有 HYBRID 車款一樣的 HYBRID 電池 8 年或 16 萬公里保固服務。TOYOTA PRIUS PHV 不愧為當前最平衡、兼具環保及便利的用車選擇。

體驗 TOYOTA PRIUS PHV,立即預約試乘
前往官網了解更多。

註1:純電行駛里程及純電最高時速係於電量充足且啟用電動模式(EV Mode)之情形下於實驗室測得。公告資料係依據歐盟 1999/100/EC 指令及後續修正指令之標準測試程序測得。本車型為插電式油電複合動力車,平均油耗測試值係為馬達電能(滿電狀態)與汽油引擎之效率綜合計算而得。本標示之測試值係在實驗室內,依規定的行車型態於車體動力計上測得。實際道路行駛時,因受天候、路況、載重、使用空調系統、電池充電狀態、駕駛習慣及車輛維護保養等因素影響,其實際值可能與測試值有所差異。詳情請參閱經濟部能源局網站。

註2:實際道路行駛時,因受天候、路況、載重、使用空調系統、駕駛習慣及車輛維護保養等因素,其實際值可能與測試值有所差異。

註3:9 吋 4G 旗艦主機、Qi 無線充電皆為 TOYOTA PRIUS PHV 旗艦版專屬配備。