【Howie 商業投資】結盟康乃爾!Google為何跨入鳥類語音辨識領域?

蒐集人類語音來訓練 AI 既複雜又有隱私考量,不如藉分析「鳥語」來訓練 AI 理解語音情緒,又能幫助大學研究生態,何樂不為?
評論
康乃爾大學以 AI 分析鳥類復育可能性。資料來源:康乃爾大學
評論

語音辨識無疑是當前 AI 應用的當紅炸子雞,包含智慧居家、語音助理、車聯網、行動載具等產業都大量運用語音辨識,這塊近 1,300 億美元的市場吸引成百上千的科技公司與新創企業參加。不過,在這片紅海市場上,還是有些人默默的付出,Google 與康乃爾大學的聯盟測試的對象不是人類,而是鳥類。

Google 正利用人以外的語音作為模型開發利器

Google 實驗室中的認知科學團隊專門執行各種生物科學與語言處理的研究,對公司而言,雖然人類的語音有非常高的研究價值,但因為其複雜度高過任何其他動物的聲音,在面臨 Facebook 與 Amazon 的競爭威脅下,其 Google Assistant 必須能更快、更聰明的辨認人的語調,甚至從情緒中預測人的需求。但因為收集人類資料有隱私考量,因此公司需要更大量、更多元的資料作為新型訓練樣本。團隊把腦筋動到了動物身上,開啟了動物聲音研究+演算法的新紀元,並找上了康乃爾大學生物實驗室協助。

冷門卻利基的應用:鳥類復育

身為常春藤名校之一的康乃爾大學在人工智慧的投入不遺餘力,特別是在機器學習與語音辨識上也多次發表論文。不過研究鳥類要做什麼呢?在環境保護的浪潮下,動物復育已成為刻不容緩的議題,內華達山多次人為開發與森林大火已經嚴重破壞鳥類棲息地,加上鳥類處於食物連頂層,可以測試身體累積的有毒物質數量。Google 的與學校生物研究團隊正好都有動物語音研究需求,因此結盟後出發至內華達深山,由生物學暨 AI 教授 Connor Wood 領軍,結合 Google 資料科學小組。團隊先是花了數個月的時間部署 2,000 多具感測器,鳥種為林鶯鳥,原因是林鶯鳥的聲音較為高亢,音質資料便於感測器蒐集處理。

BirdNET 為這次擔任重責大任的演算法系統,其特色為能在一天內處理上千小時的資料量,由於林鶯鳥具備不只一種聲調,並且在不同時間的音頻也不同,因此對於一般語音辨識的演算法而言難以分析;此外,團隊採用語音辨識而非影像識別的原因在於影像識別圖片蒐集過於困難,再倒入深度神經網路模型中成效不佳,分析人員需要在資料庫中加入動物不同的姿勢、不同的生命階段等大量照片,以確保參數分析結果符合需求,因此這種方法並不適用於野生群落,特別是內華達深山內。

以深度神經網路識別鳥類個體經常面臨資料蒐集瓶頸
。資料來源:法國蒙彼利埃第三大學

從陸上到海上,所有動物都是研究對象

似乎沒有其他公司會像 Google 大手筆投入動物語音識別,甚至從內華達山、辛巴威草原、到大西洋深處都是研究場域;不只鳥類,Google 也投入其他動物研究,鬣狗獅子、鯨魚烏賊。除了達到生態保護,甚至可能發現新物種外種,豐富的資料成為模型訓練的最佳來源,而跟不同生態保育團體或大學合作,又可以提高公司的形象與人才招募能力,何樂而不為呢?

當然了,這些資料能不能商業化也是值得討論的議題,部分動保協會認為,用 AI 模型預測動物下個遷徙地作為動保決策確實不錯,但若盜獵團體也取得這部分資料並進行佈局,那可能就是物種滅絕而非保護了。美國有人權團體也指出,動物聚落的行為研究若運用到人類身上,可能在極權國家帶來不良示範。由此看來,該類研究似乎不是只有提高 Google Assistant 的功能這麼簡單而已。

責任編輯:Mia
核稿編輯:Anny

延伸閱讀:



從物流到巡檢!無人機小兵立大功,助產業翻轉應用場景、加速智慧城鄉腳步

隨著科技進步,在推動智慧城鄉的道路上,已發展出應用無人機來縮短城鄉差距、加速產業應用佈局,同時提升民眾的生活品質。
評論
photo credit:經濟部工業局
評論

談起無人機會令你想到什麼?對多數消費者而言,第一時間聯想到的或許是結合影音、娛樂的應用場景,藉由飛行優勢捕捉各種畫面、創造更有趣的觀賞體驗,但其實無人機早已升級,在許多我們意想不到的場域裡發揮它的技術,改善我們當前的生活品質。

根據 DRONEII.Com 的報告指出,全球無人機市場將從 2018 年 140 億美元、一舉躍升到 2024 年 430 億美元,其中能發揮無人機應用的場景除了熟悉的娛樂、拍攝外,勘/救災、預警系統、資料蒐集與分析與環境監測等,亦是無人機可著力之處。

看準無人機所具備的這些優勢,讓經濟部工業局在「普及智慧城鄉生活應用計畫」中,善用無人機的價值,讓它得以跳脫娛樂拍攝場景,以物流、巡檢等角色走入偏鄉,為在地民眾以科技力注入創新活水。

看無人機如何從物流到巡檢,翻轉智慧城鄉

「智慧城鄉的目的就是要透過科技力,讓偏鄉地區的民眾也能同步享受等同於都會區的資源與生活品質。」作為國內長期投入研發無人機的中光電智能機器人王仲平協理觀察,這也是為什麼中光電加入「普及智慧城鄉生活應用計畫」後,選擇以物流、巡檢等場景作為起手式,希望藉由技術的輔助讓偏鄉地區的生活體驗可以再升級。

攤開 Google 地圖,從新竹火車站前往尖石鄉的路程接近 3 小時,途中更是九彎十八拐,也常因天災造成道路坍方,切斷輸送物資的主要管道。「但這趟路對無人機而言僅需 10 分鐘」在天氣許可下,無人機能垂直飛行加速物資運送,讓偏鄉在資源需求上邁進了一大步。當然,王仲平也解釋,這樣的場景是需要串接地方政府、物流業者乃至於零售業者都缺一不可,中光電發揮在無人機的技術與專業,攜手夥伴們才能讓智慧城鄉的發展被實現。

而這項技術也已輸出海外、與日本樂天合作。王仲平透露,目前已在白馬山進行試飛,在高低落差近 1600 公尺、往返距離約 10 公里的地區,以無人機方式將貨物運送至目的地。讓過去需要耗費車程、人力約 7 小時的路途,如今只需要 10 分鐘就能解決,不只能運送物資上山、也同時能將山上的垃圾運下來,藉由無人機創造雙向價值、提升偏鄉的生活體驗。

除了物流場域,巡檢應用也同樣能發揮無人機效益。王仲平表示,電塔維護關係著偏鄉居民的生活及維修人員的生命財產安全,過去動輒爬上高處修繕或需要跨域的奔波,不僅耗時耗力、也可能有人為無法判斷的疏漏發生。如今在無人機的輔助下,不僅大範圍的檢測不成問題,因不受空間影響、更能 360 度的徹底檢查,即便在環境惡劣的山區也難不倒它。

photo credit:經濟部工業局

用「眼睛」跟「大腦」,讓無人機更智慧地徜徉在場域中

無人機之所以能實現如此多應用場景、強化偏鄉地區生活品質與智慧水準,全仰賴技術上的突破,「你就想像現在的無人機其實是台會飛行的掃地機器人,」王仲平生動地解釋。傳統無人機因缺乏人工智慧的導入,讓任務執行依舊需要耗費大量人力監控,也可能因人為操作而發生意外,而這也是為什麼中光電在研發無人機的第一天起,就希望能賦予智慧設計,讓無人機能具有思考與判斷能力。

首先,要能被稱作為智能機器人就需要配置影像辨識系統,王仲平表示這讓無人機如同人眼一般,能捕捉外界影像,讓它在執行任務時能採集需要的資訊,同時透過 SLAM 避障技術,協助無人機判別外界的障礙物,無論在運輸或是巡檢的過程中,更加順利。

此外,智能機器人也需要具備良好的運算平台、就像是大腦一樣,能將捕捉到的影像進行分析、並且建立模型,以利未來在同一條路徑上的飛行時,可以更加熟悉、也讓這台無人機得以減少對人為操作的依賴,加速對偏鄉服務的提供效率。

偏鄉需求大,無人機應用潛力無窮

「其實物流體系的成本有 75% 都是耗費在最後一哩路。」王仲平說,若能借重無人機的技術突破瓶頸,相信在偏鄉的民眾生活品質將會有大幅度邁進,同時為加快腳步,他認為每個物流節點都需要擁抱數位工具、面臨數位轉型,才能攜手翻轉當前的應用場景。

展望未來、王仲平更是滿心期待,他相信還有很多場域正等著無人機發揮技術突破現有框架,「你能想像如果我們有空中計程車的時候嗎?那將會是航空界的革命性發展,也將為偏鄉居民的醫療帶來全新的體驗。」短程的載人運送服務將可能為偏鄉居民、甚至是因登山發生意外的狀況,有了更即時與效率的幫助。藉著這次的計畫,王仲平相信在攜手產官學一同合作打造可落地的應用,就能讓更多人看見無人機的價值、也才能加速偏鄉擁抱智慧科技。

經濟部工業局廣告