【AIoT 的智慧未來】犀動智能:從旅宿情境揚帆,專精軟體端 AIoT 整合的語音新創

在研發台灣中文語音識別的科技廠商中,創辦人沈書緯具有 Google 背景的「Aiello」絕對是相當顯眼的存在。
評論
Photo Credit:Aiello 提供
評論

與圖像識別、資料探勘並列,語音識別可說是目前機器學習商業應用的顯學之一,在台灣致力中文語音識別的人也不少,最出名的就像 PTT 創世神杜奕瑾創辦的 Taiwan AI Labs 就有發展自己的通用型模型並推出「雅婷逐字稿」APP,又或是威盛電子還有推出 OLAMI 語音、語意的 API 供第三方使用。

但在這麼多研發台灣中文語音識別的科技廠商中,創辦人沈書緯具有 Google 背景的「Aiello」絕對是相當顯眼的存在。從商業模式來看,他們創業第一步不選擇投入泛用型中文語音模型,而是把旅宿當第一個進攻的垂直領域,為旅宿業智慧音箱設計專用的智慧語音助理「小犀管家智能語音 AI 平台」,是以軟體為本,但又具豐富 AIoT 整合經驗的 AI 新創公司。

作為 AIoT 專題的一部分,INSIDE 與 Aiello 創辦人沈書緯 Vic 進行了一次深入訪談來了解他們打造中文自然語言理解 NLU、自然語言處理 NLP 的經驗,以下使用 Q&A 方式進行:

Q:Vic 當初為什麼要選語音 NLU、NLP 當作創業題目?您的 Google 經驗又怎麼幫助你創業?

A:從個人角度來說,我高中開始就想創業了,也是為了創業才去 Google 這間全球數一數二的科技公司。我在 Google 時負責的就是 Google Home、Google Assistant 的 NLU,那時只要是要用到 Google Assistant 的軟硬體,基本上我都會接觸到。

就是這段工作經驗讓我察覺 NLU、NLP 逐漸開始出現技術突破點,有創業的可能性。當然,那時候在 Google 內部升遷也很有機會,但我更想自己創業,從頭到尾建立一間自己想要的公司、做自己想做的產品。

我可以分享一下:在機器學習普及化之前,對 NLU、NLP 大量研究心血的是語文科學家,而不是軟體工程師。但到了機器學習開始普及化,甚至到 Alexa 開始流行時,NLU、NLP 已經大量導入機器學習。不過反過來說,機器學習在 NLU、NLP 還是有很多待開拓空間的。如果說機器學習導入影像識別有 90 分水準的話,NLU 大概只有 5、60 分。

補充:NLU 是理解,NLP 是執行,NLU 幫你把意圖、名詞猜出來,但知道你想要什麼後,還要交給 NLP 幫你把行動執行。

Q:那中文 NLU、NLP 跟英文相比,開發起來目前最大的難關、限制在哪呢?

A:好,我分享第一個難關在於中文跟英文的模型本質差異。如果鎖定垂直領域,看場景、習慣性的話,我認為英文的 NLU、NLP 已經有 70、80 分的水準。

但是,NLU 的技術本身是從英文所原生發展的,像是語料、模型都是從英文來的,甚至全世界英文的數位資料量也遠遠比其他語言還多。這讓 NLU、NLP 的中文開發者都適用「遷移式訓練」,除非你是非常大或是有特殊目地的公司,不然不可能從零開始重練一套中文專用的語言模型,大多都是直接拿 GPT-3 或其他開源模型重新訓練。

延伸上一點,中文、英文這兩種語言本體的差異對訓練模型來說就會很明顯,中文本身特性是連結詞與贅詞特別多,而且中文是用「字拼成詞」,不像英文由一個詞一個詞個別所組成。我舉個例子:「我在野生動物園玩」這句話,在中文是在野生動物園裡面遊玩,但只要訓練一不小心,電腦就會把「在野」這個詞特別拿出來翻,兩者可是天差地遠。

當然,上訴問題不是不能解決的,但會大大提升模型訓練的困難度。關於這點,如果是把 NLU  運用在一個垂直領域、特定情境,自然準確度就能提升。

Q:那 Aiello 在訓練中文 NLU 模型時有何自家的特別技術?

A:這有三點可以分享,第一點是模型,我們的確也不是重頭訓練一個新的中文 NLU、NLP,而是找開放模型。但第二點我們一開始就想鎖定一個垂直領域做 NLU,我會把它稱為從「科學」到「商用化」的過程。怎麼說呢?一個垂直領域一定有很多專業術語、也會有特定的情境,舉個例子,我今天做一個披薩店的客服 NLU,那使用者就不會問美股的情報或天氣如何,而是專心訂一個披薩;那我自然就不用去處理問美或天氣的資料。

第三是 NLU 做到 100 分,不代表 NLP 做到 100 分!我舉例假設是在飯店裡講「我要開燈」好了,這句話很單純,NLU 判別這種單純的語意準確力很高,但 NLP 的處理細節很差,它沒辦法找到對應的 API 去開飯店的燈,那也無效,不是完整的服務。

所以我們的 Know-How 很大一部分在於針對行業專用語意、情境建立產業知識圖譜,用架構資料告訴 NLP 需要做什麼,只要節點出現越多、該詞彙出現越多次,那  NLP 就會越清楚知道要什麼。

Q:那 Aiello 是怎麼透過 IoT 軟硬優化提升自動語音識別品質的? 

A:Aiello 的服務核心是 NLP 平台與可以對應不同產業的 API,現在除了旅宿以外,也有金融業的 API 了,而能大幅優化 B to B 場景。

再舉個例子,如果有買 Google Home 的朋友應該可以理解,Google Home 的「智慧家庭」是「是 DIY Smart Home」什麼意思呢?就是使用者要享受便利的智慧家電之前,還要自己花一點時間去跟每台智慧家電連結,你要語音操作前,還要知道你的燈泡、冷氣、冰箱、電視跟掃地機器人叫什麼名字。

但你走進一間飯店房間時,總不會知道這盞檯燈、那盞落地燈叫什麼名字吧!我們的 NLP 平台就是在這裡下了巧思,讓使用者可以依照自己想要的情境、亮度、舒適度去語音操控。

根據統計,我們的使用者 90% 沒用過智慧音箱,所以沒辦法用 Google Home 那種邏輯提供智能服務。另外我們要把 NLP 平台適用在智慧音箱,在 IoT 整合也做過不少調整。像只要牽涉到聲學,就一定要處理回音消除(Acoustic Echo Cancelling,AEC)的問題。音箱有幾個麥克風?哪裡收音比較不清楚?然後到底要用多少 CPU 資源分配給 AEC?或是要用哪些喚醒詞、哪些詞又要特別注意不要跟喚醒詞搞混?

又或是智慧音箱跟雲端連線要消耗多少封包跟運算資源?要不要 device 內對資料壓縮?這些我們都有特別用心調整,而且我們還特別對飯店有做訂製化系統,每間飯店房間用的燈、裝置一定有細微差異,但我們的系統可以讓不管是 A 音箱、B 音箱,只要換 IP、MAC 跟房間對應好,那能讓不同音箱馬上使用了。

Photo Credit:截自 Aiello YouTube
Aiello 的飯店後台管理系統。

Q:那為什麼要特別會選「旅宿」這個情境當一開始的創業方向?

A:又要回到 NLU 的話題了(笑)。很多人都想像 NLU 是拿來取代遙控器或 App 的,但從商業成本來看,這是不太對的,像電視遙控器對消費者來說是一件三塊美金就可以做很好的事,而且你用語音取代電視遙控,還會剝奪一直轉台的樂趣,實在不值得花兩億去開發解決這種事情(笑)。

但旅宿這種垂直領域就很不一樣了,一方面系統一旦開發完成,它能很快地被飯店採用、迅速複製,而且能確實幫飯店精簡人力與提升,是個很有 end to end 價值的市場。

Q:能聊聊最近接受一輪 2 億元投資的狀況嗎?

A:先聊聊也有參與這輪的基石創投好了,我們跟基石在這一輪之前就已經合作過了,他們很理解目前網路語音 chatbot 的侷限,所以看好 NLP 可以在電商跟其他領域的發展。ColoplNext 他們則觀察在亞洲認真在做 NLU、NLP 的公司其實不多,但 NLU、NLP 的當地化又非常重要,他們很看好亞洲 NLU、NLP  的商務應用,想看誰會成為未來亞洲語音應用的市場先驅。

【2021 INSIDE 未來日】AIoT 智慧未來 數位轉型加速器

2021 INSDIE未來日 產官學跨界交鋒「一次看懂 AIoT+數位轉型大商機」!Accupass 取票頁請點我。INSIDE 將於 2021 年 9 月 24 日,舉辦一場為時 8 小時的線上論壇,預計號召 800 位以上的參與者於線上交流,深入探討與 AIoT 發展趨勢不可分割的三大面向:5G 服務、雲端科技、智慧生活,論壇總結將由 INSIDE 主編及兩位講者針對此次議題進行深度對談,提供與會者不同角度的觀點,創造更多商務合作和深度討論的機會。

核稿編輯:Mia

延伸閱讀:



圖解智慧國家四大關鍵科技,從不同角度帶你了解台灣的科技應用實力

大家都知道台灣有座半導體護國神山,也聽過許多媒體對台灣科技實力的盛讚,但台灣的科技實力到底強不強?我們從四個面向帶你看台灣作為「智慧國家」到底有什麼實力!
評論
評論

大家都知道台灣有座半導體護國神山,也聽過許多媒體對台灣科技實力的盛讚,但台灣的科技實力到底強不強?自己說不如讓國際單位做的調查更客觀顯示。瑞士洛桑管理學院(IMD)每年9月公布的世界數位競爭力(World Digital Competitiveness Ranking)評比,最近一次報告2021年台灣在全球64個主要國家及經濟體當中排名第8,獲得歷年來最佳名次。

而且值得關注的是,支持數位競爭力的核心要素之一,也就是「科技」競爭力。IMD評比報告揭露台灣拿下全球第2的佳績,從2018年的第11名年排名持續上升,顯見台灣無愧於科技強國之名。


科技小百科:
瑞士洛桑管理學院(IMD)是一個長期研究國家與企業競爭力,在國際上具盛名及公信力的評比機構,並自1989年起發布「世界競爭力年報」World Competitiveness Yearbook,其評比報告與調查結果更是各國政府擬定相關政策之參考。IMD每年會定期公布兩份競爭力評比報告,其一是「世界競爭力年報」,每年在6月公布,2022年台灣在63個受評比國家中排名全球第7名。另一份報告為「世界數位競爭力評比」World Digital Competitiveness Ranking,每年在9月底公布,本篇文章引用的資料為這份兩份研究。


也因為科技與國家發展息息相關,有哪些技術是台灣不為人知的優勢?或是未來產業可大力投資布局的領域?我們找出其中四大項與智慧國家最有關的科技,展現台灣具備強勁的科技能量,或許你已經受惠,也或許你能從其中找到發展的機會。

關鍵科技一、融合海陸空領域的多維通訊

隨著國家管理範圍逐漸擴大,通訊範圍多元且彼此關聯,相關科技如低軌衛星、5G通訊、海底電纜等,形成環環相扣的多維通訊聯網。

仔細洞察2021年的IMD報告,台灣在「行動寬頻的用戶比例」這項指標,拿下全球第1的傲人成績。顯見台灣在通訊基礎建設的投資及普及率,是走在全球領先位置。

尤其5G/6G關聯科技更是未來多維通訊的具舉足輕重的地位,原因是5G衍生的價值鏈相當廣泛,舉凡從晶片、模組、終端、邊緣、系統、到應用服務,可形成完整生態圈。為了強健台灣5G專網的自主技術與供應鏈,從2018年先後成立5G產業發展聯盟、5G垂直應用聯盟、以及5G Open Networking平台,逐漸形成5G國家隊。

除了把5G領先國視為戰略目標,當創新技術落地,更能帶來龐大商機。根據工研院的預估,將5G的小基站、邊緣運算、網路虛擬化等關鍵產品、模組、元件加總起來,2025年的市場規模上看2,510億美元(約新台幣7.5兆元),其他國家還在積極推動5G聯網建設,顯見相關商機仍有相當大發展空間。

關鍵科技二、新型態數位經濟與網路服務

邁向Web 3.0的交叉點,元宇宙被視為下一代網際網路的新機會,市調機構Gartner預測,2026年全世界將有25%的人口,每天至少有一小時投入元宇宙虛擬世界,進行工作、社交、教育、購物、娛樂等活動,並藉由虛擬貨幣、NFT進行數位資產的交易,虛擬經濟逐漸成形。

所謂元宇宙,需要以5G/6G高速網路為基礎,透過VR頭盔/眼鏡作為進入3D虛擬世界的載體,在元宇宙的各種互動體驗則需仰賴AI運算、雲端/邊緣儲存、區塊鏈等核心技術支援。人們在元宇宙內可以滿足從現實世界做不到的事情,形成穿梭虛擬、現實之間的生活體驗與商業模式。

近七成投入元宇宙相關應用的企業,認為元宇宙在未來5年一定會蓬勃發展,虛擬音樂會、虛擬時裝秀、媒體及產品聯名展示活動,將是元宇宙優先發生的商業體驗。

那麼台灣要投入元宇宙有何利基?解析元宇宙供應鏈版圖,主要可分為晶片、光電、通訊、AR/VR裝置、內容以及AI技術,台灣科技可從硬體方面,包含晶片、感測IC、光學零組件、伺服器等擅長領域切入。像是大家熟知的半導體大廠台積電,對於相關晶片的供應就至關重要,另外光電產業也有揚明光、玉晶光、中光電等企業,讓投影技術更精緻,再來連接元宇宙的通訊技術,也有聯亞來支援,而裝置軟硬體、AI技術則是有創意、世芯、智原等企業投入,最後想到AR/VR集大成者,就不能遺漏宏達電在這一塊的耕耘,同樣威盛電、佐臻、未來市(XRSPACE)等品牌也積極佈局,可見台灣已有完整的供應鏈,接下來有志於加入元宇宙的廠家,不妨從自身的專長去思考,相信不論是哪個領域的企業,都能有更多的創新、應用內容投入,完善整個元宇宙生態。

關鍵科技三、疫後時代興起的智慧型代理人 

近年因疫情持續延燒,越來越多領域開始導入「智慧型代理人」,像是零售業者引進半自動化機器,協助人力處理訂單、點餐;又或是醫院使用機器人,藉由AI辨識功能分擔部分醫護工作。

所謂智慧型代理人,以它所知的知識範圍內,自主完成人類所給予的指令任務。智慧型代理人發展至今,能協助人類的廣度、深度越來越多,主要是受惠機器學習的技術更為先進,加上其他的自動規劃、互相協調等演算法的成熟,讓智慧型代理人成為下一波產業發展重點。

世界先進國家紛紛把AI納為國家產業重要發展策略,台灣從2018年就推出「台灣AI行動計畫」,全面啟動產業AI化。發展至今,AI應用已從測試階段逐步應用於各式產業,資策會統計發現,掌握AI技術的新創企業在台灣有300家,逐漸摸索出不同的商業策略與獲利模式。

尤其資通訊、醫療照護是台灣兩大擁有頂尖人才的雙軸產業,在疫情之下,就可以看到醫療+科技所衍生的智慧型代理人應用。像是過去為了解決醫療量能不足,開發「5G智慧防疫機器人」,用來隔離病房消毒、運送餐盒及藥品物資,比傳統人力消毒方式有效節省50%時間,還能降低醫護人員感染風險,讓醫事工作更有效率。

關鍵科技四、資訊安全網保護每個人數位資產

我國面臨網路犯罪、駭客入侵政府、機關,甚至竊取個人資料事件持續增加,如何保護國民安心使用數位科技、保障財產安全將是未來重要方向。隨著AI普及所衍生的龐大資料量之隱私及資安問題,成為棘手的挑戰。從國際AI資安發展現況來看,歐盟在2021年提出人工智慧規則草案(Artificial Intelligence Act),鼓勵值得信賴且道德的AI進行研發與應用。微軟更在今(2022)年禁止提供AI推測情緒技術,並制定「負責任AI標準第二版」、Google則停止AI機器人具有自我意識、能與人類溝通等爭議事件,這些做法也都反映美歐在立法之際,業者也在努力自行節制敏感AI技術。

AI資安,是挑戰也是機會。未來,台灣政府與企業也須密切關注美歐相關草案的立法動態,找出AI規範的共同點,以此界定使用AI產品與服務之要求;因此,AI資安不僅需透過科技來防禦,更需要治理與法規,降低AI所帶來的衝擊。

另外,針對5G資安議題,台灣有展開大型科技防禦策略,包含5G資安防護系統、跨機關資安聯防。5G資安防護系統致力確保業者使用的5G系統具備安全、可靠、信賴,與國內5G專網業者進行服務驗證,以強化國產5G系統的整體資安防護能力。跨機關資安聯防的目標放在建立政府與民間的資安聯防體系,藉由橫向整合跨部會,全面提供威脅情資,減少機關隱匿資安事件,降低事件誤報與漏報。

持續提升台灣的科技能量 打造全方位的智慧國家

圖片資料來源:IMD 2022 世界競爭力年報

台灣的科技能量持續提升,從2022年的IMD世界競爭力年報可發現,而且該報告還指出我國擁有高素質勞動力、經濟活力、企業治理能耐、高教育水準等優勢。上述四項與智慧國家高度關聯的新興科技,涵蓋「數位基盤、數位創新、數位包容」等元素,如何借助科技打造創新、包容的社會,在台灣強勁的科技應用產業鏈上,補強創新的能量,並延續發展優勢項目,將是台灣要持續努力的方向。

了解更多智慧國家方案
看更多智慧國家相關報導

行政院科技會報辦公室 廣告