不只降噪還能提升口語能力,美 AI 新創 Krisp 獲 500 萬美元 A 輪融資

他們透過機器學習系統,可即時將語音對話中「非人類聲音」消除掉,讓對話更清晰;就算稍有延遲,Krisp 也表示僅延遲 15 毫秒,幾乎沒有感覺。
評論
▲Photo Credit: Shutterstock/ 達志影像
▲Photo Credit: Shutterstock/ 達志影像
評論

疫情帶來遠距工作需求,意外也讓「降噪」技術成為另類寵兒。根據 TechCrunch 報導,美國新創團隊 Krisp 用 AI 降低語音通話時的背景噪音,近期獲得 500 萬美元 A 輪融資。但他們不只想降噪,未來還希望透過分析人類對話資料,幫忙提升口語表達能力。

Krisp 成立於 2017 年,誕生於柏克萊加州大學(UC Berkeley)旗下的 Skydeck 加速器。雖然當時剛好是 AI 人工智慧進入熱潮、相關新創如雨後春筍般出現的時期,但 Krisp 切入領域非常專精,他們透過機器學習系統,可即時將語音對話中「非人類聲音」消除掉,讓對話更清晰;就算稍有延遲,Krisp 也表示僅延遲 15 毫秒,幾乎沒有感覺。

Krisp 提供的軟體可免費下載,每週最高可於通話時使用長達 120 分鐘,付費版本則無時間限制。從去年 12 月起,團隊開始發展 B2B 商業模式,而疫情則加速此佈局,漸漸地 B2B 也成為他們主要的營收來源,短短一年內從 0 家付費企業成長到 600 家付費企業。

例如:今年 3 月就有一家擁有 2000 名員工的大企業,因為全公司幾乎都在家遠距辦公,因此一口氣購買 2000 個付費版本給他們。此外,最近也正與銀行、企業客服中心(call center)等簽約。

獲得融資後,Krisp 將擴大產品和團隊規模,下一步目標希望能監測、呈現人類對話的詮釋資料(metadata)。也就是說,未來 Krisp 不只能降噪,也能即時給予對話回饋,讓你知道自己在講話時是否常打斷別人?或自己老是被打斷?甚至,他們還想進一步分析談話內容,之後就可以提供相關建議或詞彙選擇,提升口語表達能力。

也因為如此,Krisp 的軟體不支援事後語音檔案輸入、輸出,盡量讓每次收集語音數據都最完整。至於隱私爭議,Krisp 表示這個產品並不向伺服器發送任何數據,語音資料也都在設備上,不上雲端。

核稿編輯:Chris

延伸閱讀: