【AIoT 的智慧未來】犀動智能:從旅宿情境揚帆,專精軟體端 AIoT 整合的語音新創

在研發台灣中文語音識別的科技廠商中,創辦人沈書緯具有 Google 背景的「Aiello」絕對是相當顯眼的存在。
評論
Photo Credit:Aiello 提供
評論

與圖像識別、資料探勘並列,語音識別可說是目前機器學習商業應用的顯學之一,在台灣致力中文語音識別的人也不少,最出名的就像 PTT 創世神杜奕瑾創辦的 Taiwan AI Labs 就有發展自己的通用型模型並推出「雅婷逐字稿」APP,又或是威盛電子還有推出 OLAMI 語音、語意的 API 供第三方使用。

但在這麼多研發台灣中文語音識別的科技廠商中,創辦人沈書緯具有 Google 背景的「Aiello」絕對是相當顯眼的存在。從商業模式來看,他們創業第一步不選擇投入泛用型中文語音模型,而是把旅宿當第一個進攻的垂直領域,為旅宿業智慧音箱設計專用的智慧語音助理「小犀管家智能語音 AI 平台」,是以軟體為本,但又具豐富 AIoT 整合經驗的 AI 新創公司。

作為 AIoT 專題的一部分,INSIDE 與 Aiello 創辦人沈書緯 Vic 進行了一次深入訪談來了解他們打造中文自然語言理解 NLU、自然語言處理 NLP 的經驗,以下使用 Q&A 方式進行:

Q:Vic 當初為什麼要選語音 NLU、NLP 當作創業題目?您的 Google 經驗又怎麼幫助你創業?

A:從個人角度來說,我高中開始就想創業了,也是為了創業才去 Google 這間全球數一數二的科技公司。我在 Google 時負責的就是 Google Home、Google Assistant 的 NLU,那時只要是要用到 Google Assistant 的軟硬體,基本上我都會接觸到。

就是這段工作經驗讓我察覺 NLU、NLP 逐漸開始出現技術突破點,有創業的可能性。當然,那時候在 Google 內部升遷也很有機會,但我更想自己創業,從頭到尾建立一間自己想要的公司、做自己想做的產品。

我可以分享一下:在機器學習普及化之前,對 NLU、NLP 大量研究心血的是語文科學家,而不是軟體工程師。但到了機器學習開始普及化,甚至到 Alexa 開始流行時,NLU、NLP 已經大量導入機器學習。不過反過來說,機器學習在 NLU、NLP 還是有很多待開拓空間的。如果說機器學習導入影像識別有 90 分水準的話,NLU 大概只有 5、60 分。

補充:NLU 是理解,NLP 是執行,NLU 幫你把意圖、名詞猜出來,但知道你想要什麼後,還要交給 NLP 幫你把行動執行。

Q:那中文 NLU、NLP 跟英文相比,開發起來目前最大的難關、限制在哪呢?

A:好,我分享第一個難關在於中文跟英文的模型本質差異。如果鎖定垂直領域,看場景、習慣性的話,我認為英文的 NLU、NLP 已經有 70、80 分的水準。

但是,NLU 的技術本身是從英文所原生發展的,像是語料、模型都是從英文來的,甚至全世界英文的數位資料量也遠遠比其他語言還多。這讓 NLU、NLP 的中文開發者都適用「遷移式訓練」,除非你是非常大或是有特殊目地的公司,不然不可能從零開始重練一套中文專用的語言模型,大多都是直接拿 GPT-3 或其他開源模型重新訓練。

延伸上一點,中文、英文這兩種語言本體的差異對訓練模型來說就會很明顯,中文本身特性是連結詞與贅詞特別多,而且中文是用「字拼成詞」,不像英文由一個詞一個詞個別所組成。我舉個例子:「我在野生動物園玩」這句話,在中文是在野生動物園裡面遊玩,但只要訓練一不小心,電腦就會把「在野」這個詞特別拿出來翻,兩者可是天差地遠。

當然,上訴問題不是不能解決的,但會大大提升模型訓練的困難度。關於這點,如果是把 NLU  運用在一個垂直領域、特定情境,自然準確度就能提升。

Q:那 Aiello 在訓練中文 NLU 模型時有何自家的特別技術?

A:這有三點可以分享,第一點是模型,我們的確也不是重頭訓練一個新的中文 NLU、NLP,而是找開放模型。但第二點我們一開始就想鎖定一個垂直領域做 NLU,我會把它稱為從「科學」到「商用化」的過程。怎麼說呢?一個垂直領域一定有很多專業術語、也會有特定的情境,舉個例子,我今天做一個披薩店的客服 NLU,那使用者就不會問美股的情報或天氣如何,而是專心訂一個披薩;那我自然就不用去處理問美或天氣的資料。

第三是 NLU 做到 100 分,不代表 NLP 做到 100 分!我舉例假設是在飯店裡講「我要開燈」好了,這句話很單純,NLU 判別這種單純的語意準確力很高,但 NLP 的處理細節很差,它沒辦法找到對應的 API 去開飯店的燈,那也無效,不是完整的服務。

所以我們的 Know-How 很大一部分在於針對行業專用語意、情境建立產業知識圖譜,用架構資料告訴 NLP 需要做什麼,只要節點出現越多、該詞彙出現越多次,那  NLP 就會越清楚知道要什麼。

Q:那 Aiello 是怎麼透過 IoT 軟硬優化提升自動語音識別品質的? 

A:Aiello 的服務核心是 NLP 平台與可以對應不同產業的 API,現在除了旅宿以外,也有金融業的 API 了,而能大幅優化 B to B 場景。

再舉個例子,如果有買 Google Home 的朋友應該可以理解,Google Home 的「智慧家庭」是「是 DIY Smart Home」什麼意思呢?就是使用者要享受便利的智慧家電之前,還要自己花一點時間去跟每台智慧家電連結,你要語音操作前,還要知道你的燈泡、冷氣、冰箱、電視跟掃地機器人叫什麼名字。

但你走進一間飯店房間時,總不會知道這盞檯燈、那盞落地燈叫什麼名字吧!我們的 NLP 平台就是在這裡下了巧思,讓使用者可以依照自己想要的情境、亮度、舒適度去語音操控。

根據統計,我們的使用者 90% 沒用過智慧音箱,所以沒辦法用 Google Home 那種邏輯提供智能服務。另外我們要把 NLP 平台適用在智慧音箱,在 IoT 整合也做過不少調整。像只要牽涉到聲學,就一定要處理回音消除(Acoustic Echo Cancelling,AEC)的問題。音箱有幾個麥克風?哪裡收音比較不清楚?然後到底要用多少 CPU 資源分配給 AEC?或是要用哪些喚醒詞、哪些詞又要特別注意不要跟喚醒詞搞混?

又或是智慧音箱跟雲端連線要消耗多少封包跟運算資源?要不要 device 內對資料壓縮?這些我們都有特別用心調整,而且我們還特別對飯店有做訂製化系統,每間飯店房間用的燈、裝置一定有細微差異,但我們的系統可以讓不管是 A 音箱、B 音箱,只要換 IP、MAC 跟房間對應好,那能讓不同音箱馬上使用了。

Photo Credit:截自 Aiello YouTube
Aiello 的飯店後台管理系統。

Q:那為什麼要特別會選「旅宿」這個情境當一開始的創業方向?

A:又要回到 NLU 的話題了(笑)。很多人都想像 NLU 是拿來取代遙控器或 App 的,但從商業成本來看,這是不太對的,像電視遙控器對消費者來說是一件三塊美金就可以做很好的事,而且你用語音取代電視遙控,還會剝奪一直轉台的樂趣,實在不值得花兩億去開發解決這種事情(笑)。

但旅宿這種垂直領域就很不一樣了,一方面系統一旦開發完成,它能很快地被飯店採用、迅速複製,而且能確實幫飯店精簡人力與提升,是個很有 end to end 價值的市場。

Q:能聊聊最近接受一輪 2 億元投資的狀況嗎?

A:先聊聊也有參與這輪的基石創投好了,我們跟基石在這一輪之前就已經合作過了,他們很理解目前網路語音 chatbot 的侷限,所以看好 NLP 可以在電商跟其他領域的發展。ColoplNext 他們則觀察在亞洲認真在做 NLU、NLP 的公司其實不多,但 NLU、NLP 的當地化又非常重要,他們很看好亞洲 NLU、NLP  的商務應用,想看誰會成為未來亞洲語音應用的市場先驅。

【2021 INSIDE 未來日】AIoT 智慧未來 數位轉型加速器

2021 INSDIE未來日 產官學跨界交鋒「一次看懂 AIoT+數位轉型大商機」!Accupass 取票頁請點我。INSIDE 將於 2021 年 9 月 24 日,舉辦一場為時 8 小時的線上論壇,預計號召 800 位以上的參與者於線上交流,深入探討與 AIoT 發展趨勢不可分割的三大面向:5G 服務、雲端科技、智慧生活,論壇總結將由 INSIDE 主編及兩位講者針對此次議題進行深度對談,提供與會者不同角度的觀點,創造更多商務合作和深度討論的機會。

核稿編輯:Mia

延伸閱讀:



電動自駕車上路迎曙光!Turing Drive 借重 AWS IoT Lab 雲端服務,桃園青埔開放道路成功試營運

Turing Drive 透過 AWS IoT Core 進行資料彙整並集中傳送到 AWS 雲端,事後新創團隊更快梳理資料庫的數據,持續優化自駕車路線,AWS 除了技術面、架構面的協助之外,更重要是提供實作的引導,讓管理資料安全更有效率。
評論
Photo Credit:TNL Brand Studio
評論

電動車浪潮,讓無人自駕車的場景應用,增加更多想像空間!市調預測 2020~2024 年 L1-L5 等級電動自駕車,年複合成長率 18.3%。然而,電動自駕車要實際上路,除了要配套法規,保護乘客、行人的安全,更備受考驗。

團隊成員平均 30 歲的新創台灣智駕(Turing Drive)於 2018 年創立,致力研發可商轉的自動駕駛系統,他們開發的特製國產電動車,上路測試兩年行駛超過 30,000 公里、運載 70,000 位旅客。達成 98% 車輛妥善率,背後正仰賴龐大感測數據做為支撐,過程中 Turing Drive 借重 AWS IoT Lab 物聯網實驗室服務,讓創新之路更加拓寬。

特殊交通情境提供創新養分,封閉到開放場域 Turing Drive 累積實戰經驗與數據

Photo Credit:TNL Brand Studio
Turing Drive 執行長沈大維提出電動自駕車在台灣交通情境下所擁有的優勢與挑戰。

「要在台灣創新,尤其是電動自駕車全新題目,對我們新創是相當大挑戰,但也迫使我們每天想破頭思考,在困境之下該如何找出路!」Turing Drive 執行長沈大維開門見山表示,創業三年多來,走得每一步有多麼不容易。

Turing Drive 握有 CPU、GPU 平行運算核心能力,正因為資源稀缺,盡可能發揮自駕系統的多重定位技術,從GPS、光達、雷達、影像、到車體慣性導航等應用,Turing Drive具備足以提供市場最快速 time-to-market 應用方案。然而,除了握有 AI 演算、晶片感測能力,沈大維認為台灣的獨特交通情境,對發展自動駕駛技術推了一把。

他解釋,「台灣摩托車、汽車齊聚路上,還有偏鄉接駁、市區夜間公車專用道,多元交通環境交錯,讓我們嘗試用自動駕駛創造新的營運模式,這是其他國家沒有的先天優勢。」因為有實際場域得以試營運,Turing Drive 一路從封閉環境的桃園農博會、台中麗寶樂園,再到台北信義區夜間、桃園青埔的開放道路環境,象徵台灣交通情境的縮影,這家新創正逐步破關打怪。

Photo Credit:Turing Drive
全台第一條電動自駕巴士路線,就在桃園青埔。

除了 Turing Drive 積極突破技術提升安全率,提供場域驗證、城市建設的桃園市也貢獻良多。桃園市政府經濟發展局局長郭裕信回應,桃園近年積極推動創新城市治理,被 ICF 智慧城市論壇評選為「全球智慧城市首獎」,電動自駕車是智慧城市的一環,因此桃園不遺餘力推動全台第一條自駕巴士路線試營運,提供載客接駁累計超過 800 位人次乘坐,創下 90% 乘客滿意度。

Photo Credit:TNL Brand Studio
桃園市政府經濟發展局局長郭裕信表示,桃園近年積極推動創新城市治理,電動自駕車是智慧城市的一環,因此桃園不遺餘力推動全台第一條自駕巴士路線試營運。

大量的感測、影像數據該如何加值使用?借力 AWS 邁向「雲」運算成必經之路

Turing Drive 的電動巴士每天在桃園青埔定點載客、行駛,可想而知,有多麼龐大的感測、影像數據不斷累積。沈大維點出過去其他案例測試時,若想達成 Data Driven 驅動更多自駕車服務,勢必要先克服數據的儲存、加值、運用等實際挑戰,他解釋,「以前用終端硬碟儲存資料,往往我們工程師要留守到半夜,再去插拔車上的硬碟、整理車子運行數據,我們發現這樣做很沒效率,甚至隨著數據資料越來越多,在分類管理的工作也更為困難。」

面對難題,就是尋求解方!Turing Drive 找上 AWS IoT Lab 物聯網實驗室,雙方開始盤點,該如何運用雲端環境的優勢,更輕鬆掌握、洞察自駕車數據的金礦。AWS IoT Lab 表示,

「我們從三大面向切入,協助 Turing Drive 加速他們開發流程、減少工程師例行工作,甚至將影像資料有效加值,又能確保資料安全。」

AWS 所説的的三大面向,正是 AWS IoT Lab 所提供的三項解決方案服務。首先針對工程師要排班到試營運現場,插拔硬碟下載資料的冗長流程,AWS 提供 AWS IoT Device SDK 透過 MQTT over TLS1.2 安全機制加密與 AWS IoT Core 連結,通過認證後可將終端裝置的資料傳到 AWS 雲端儲存。同時允許開發團隊從遠端,直接登入自駕車系統做韌體更新或回收數據等指令,大幅縮短 Turing Drive 在開發、調教程式的時間。

第二項服務則聚焦協助 Turing Drive 針對自駕車運行所錄製的影像,AWS 提供 Amazon Kinesis Video Streams (Amazon KVS) 服務,讓終端裝置的影像資料串流到 AWS 雲端平台,進行後續機器學習、分析處理。讓 Turing Drive 省去過去人工傳輸影響資料流程,也幫助開發團隊更便利做後續的資料加值利用。

Photo Credit:TNL Brand Studio
AWS IoT Solutions Architect Tec 介紹三項解決方案內容服務。

第三項則鎖定自駕車的資料,因為搭載光達、雷達、GPS、陀螺儀等感測器,每天每秒都在產生巨量資料,Turing Drive 透過 AWS IoT Core 進行資料彙整並集中傳送到 AWS 雲端,事後新創團隊更快梳理資料庫的數據,持續優化自駕車路線。除這三項關鍵服務,沈大維特別回應,「AWS 帶給我們技術面、架構面的協助之外,更重要是提供實作的引導,讓我們管理資料安全更有效率,把資料放到雲端儲存,再也不用煩惱地端伺服器的維護跟管理。」

Turing Drive、AWS、桃園市政府,各司其職聯手出力助攻電動自家車加速上路

Photo Credit:TNL Brand Studio
沈大維指出,電動自駕車上路的普及,須同步具備雲端數據解決方案與硬體環境的配合。

在 Turing Drive 的眼中,與桃園市政府合作在青埔導入電動巴士試營運只是開端,沈大維說:「十年、二十年後,我們認為新世代的智慧車會趨向平台化發展,一方面需要有像桃園市願意投資智慧城市硬體環境的地方政府;另一方面則仰賴 AWS 雲端方案,完善數位基礎建設來整合道路號誌資料、車輛運行資料,當這兩端同步發展之下,電動自駕車上路才會加速普及。」

尤其是自駕車數據背後隱含的商業創新,郭裕信回應說,「智慧城市治理最重要就是數據, Turing Drive 掌握的數據未來還能跟保險公司、電商導購做結合,只要資料去識別化在安全範圍下使用,相信 Turing Drive 與 AWS 兩家新創企業的創新能量,我們非常樂見有更多資料應用,搭配新興商業模式,在充滿活力的桃園市進行驗證,看見更多創新應用具體落地。」

Turing Drive 展望未來的佈局,沈大維認為自駕車的發展不會只靠一家企業單打獨鬥,未來他們將聯手產業鏈夥伴,將 AI 技術、車載設備、關鍵組件、路側設備端到端的解決方案輸出海外,放眼全球商機。他肯定表示,「AWS 雲端平台具備彈性,不斷推出新應用的價值,我們會持續與 AWS 合作,把新世代智慧車的數位基礎建設産品放在 AWS 平台一起推廣,鼓勵更多勇於築夢的新創,善用 AWS 的優勢展開創新之旅!」