Nvidia 新 AI 語音合成技術,揮別 Google 小姐實現真人聲發音

Nvidia 打破傳統生硬的機器語音技術,開放 RAD-TTS 原始碼讓擬真人語音互動更多元。
評論
Photo Credit:All the Feels: NVIDIA Shares Expressive Speech Synthesis Research at Interspeech
評論

在本週的 INTERSPEECH 大會 Nvidia 發佈了最新的 AI 語音合成技術,有別於傳統生硬的 Google 小姐、亞馬遜的 Alexa 語音助手工具,Nvidia 開發出擬真人語調、節奏、音色的 RAD-TTS 模組。

RAD-TTS 的功能主要是語音轉換,可將某個人的聲音來轉換另一個人聲,同時該功能可以對合成中的語氣音高、講話時間、精神進行細微的修正及編寫。

Nvidia 開發 RAD-TTS 將仿真人語音對話功能推向新的境界

Nvidia 在這次釋出的最新 RAD-TTS 模組製作而成的宣傳影片「I am a storyteller」,主要應用的技術共分 2 種,第一種是運用將近 10 萬筆真人發音訓練成一組專屬的語音合成模組,只要把任何語法輸入到模組中,就會自動生成、轉換成仿真人語音。

另一種則是真人語音轉換, 透過 Nvidia GPU Cloud(NGC)目錄中的資料,在 Mozilla Common Voice 進行訓練而成的 RAD-TTS 語音模組,在 Mozilla Common Voice 現有資料庫擁有近 76 種語言、近 1.4 萬小時的群眾外包語音資料,只要把真人人聲輸入至模組後,就會自動生成與人聲相同語調、音色、語氣的仿真人語音內容。

值得關注的是,NVIDIA 正在規劃開放原始碼,並有意改善並用在自家 GPU 真人發音演算,目前已有部分內容開源上架到 NVIDIA NeMo Python 的 GitHub 網站,這些研究未來經優化後將會套用在 NVIDIA GPU。

未來有任何研究人員、開發人員及各式語音服務的內容創作者,均可透過 NVIDIA NeMo 這項上架 GitHub 的 GPU 加速對話式的 AI 開放原始碼 Python 工具包,來延伸各種應用並測試及微調真人語音發音模型。 NVIDIA 這次釋出的這項 RAD-TTS,融合並開放目前全世界最大規模的數據語音資料集,就是為了讓更多人能了解到這項語音技術。

RAD-TTS 的擬真人語音技術,將有更多豐富的場景應用尚待測試

RAD-TTS 的擬真人語音技術,包含了自然語言處理、自動語音辨識、關鍵字偵測、音訊增強等功能,未來的產業應用上如有助銀行和零售商的自動語音客服、電玩遊戲、有聲書籍、虛擬偶等。

NVIDIA 強調這項技術也能適用在語言機能的障礙者,甚至讓使用者能用自己的聲音翻譯成不同國家的語言;即便是重新已故歌手的表演,只要搭配歌曲旋律就能重現人聲背後真正的情感。NVIDIA 表示之後可透過 SDK、API 串接這些資源,讓開發者更容易直接使用,進而創造、改善更豐富的擬真人語音互動情境。

核稿編輯:Anny

延伸閱讀:



佈雲今日 ‧ 決勝未來──數位轉型的現在進行式! AWS 台灣雲端高峰會 8 月 10 日盛大登場

2022 AWS 台灣雲端高峰會將於 8 月 10 日在台北南港展覽二館盛大登場,聚焦雲端 9 大主題、超過 45 場產業與技術專題演講,為開發者與經理人提供深度交流機會,任何與雲端有所接觸的工作者都不容錯過。
評論
首途02.png
評論

AWS 公開年度雲端技術盛會── 2022 AWS 台灣雲端高峰會(AWS Summit Taiwan)即將在 8 月 10 日至 8 月 11 日於台北南港展覽館二館舉行!歷經新冠疫情紛擾,睽違兩年 AWS 台灣雲端高峰會即將重回實體舉行,讓每位參與者走入規劃豐富的實體專區與各路開發者深度共學。立即報名點此

今年主題「佈雲今日 ‧ 決勝未來」明顯表達數位轉型已是現在進行式。隨著新冠疫情及國際局勢改變的雙重影響,全球迎來的新常態經濟模式使雲端技術不再只是企業應變關鍵,更是走向安全、永續,以及鏈結未來的必經之途。因此,2022 AWS 台灣雲端高峰會中將展示當代最前瞻的雲端趨勢,帶領參與者運用現代化雲端洞悉市場數據,探索商業與技術的無限可能。

聚焦九大雲端主題:基礎設施、技術開發、數位轉型到產業實務面面俱到

photo credit:AWS

今年 AWS 台灣雲端高峰會不只集結領域中傑出的 AWS 技術專家、產業代表以及社群領袖,舉辦超過 45 場的產業及技術專題演講,分享最佳實踐案例、 Demo 實機展演和客戶案例分析,還規劃包含證照認證、實作演練、 CISO 實戰工作坊等與 AWS 相關課程及工作坊。除此之外,會場也設置「AWS Game day & Developer Lounge」與「新創焦點」兩大專區,讓會眾能在精心規劃的空間內與其他開發者、新創公司透過高度互動的競賽與短講,深度交流彼此技術與經驗。

立即報名:2022 AWS 台灣雲端高峰會

2022 年, AWS 台灣雲端高峰會致力打造深度交流的產業平台,聚焦雲端技術的九大面向,搭配各具特色的活動設計,從基礎設施、技術開發、數位轉型到產業實務面面俱到。不僅為 C-level 與資深技術人員、企業經營與 IT 決策與管理者精心規劃議題內容,也在特別企劃內容中,為 IT Pro 、解決方案架構師、開發人員、工程師與維運管理人員提供最佳實務經驗,讓無論 AWS 初學使用者還是資深產業經理人,都能在高峰會中吸收新知、了解趨勢,提升自我能力與視野。

無分初學大師,只要接觸雲端,你就應該參加 AWS 台灣雲端高峰會

符合以下關鍵字之一,你就應該參與 AWS 台灣雲端高峰會:

  • 學無止盡-開發者、工程師、架構師
  • 商業創新開發-新創團隊技術團隊成員
  • 最佳化生產力- IT 專業人員、技術支援經理
  • 掌握趨勢-創辦人、經營決策者
  • 自我精進-學生、教職員、研究員
  • 洞見趨勢-任何關注雲端趨勢者

AWS 台灣雲端高峰會首日聚焦雲端服務、開發技術及新創,以技術相關內容為主,較適合具備初級主題知識之開發人員、工程師與 IT 專業人員;次日則圍繞產業解決方案提供、數位轉型等,以應用相關內容為主,較適合欲了解雲端技術如何為企業經營加分之經營決策者、解決方案架構師以及系統管理員。

立即報名:2022 AWS 台灣雲端高峰會

如此縝密的規劃,無論是初上雲端的新手,還是乘雲縱橫產業多年的技術大師,甚至是非技術相關人士,都能在高峰會中依照自身工作職掌和興趣,安排個人化的專屬議程,從不同主題和技術能力演講中,滿足個人技術或視野的成長。

最重要的是, 2022 AWS 雲端高峰會為免費參加,絕對是任何需要開拓雲端新經濟、自我加值的工作者不可錯過的年度盛會。

玩轉雲端核心技術! AWS DeepRacer 人工智慧賽車同步登場

photo credit:AWS

每年與台灣雲端高峰會共同舉行的「AWS DeepRacer 智慧自駕車競賽」當然也不會缺席。 AWS DeepRacer 是 Amazon 產品背後所運用之人工智慧和機器學習等核心技術的具體化身,不僅是全球首個以自駕車競賽為主題賽車聯盟,也是機器學習(ML)與強化學習(RL)最友善、有趣、刺激的學習課程。

競賽設計不只替雲端技術增添不少趣味,激起各方開發者爭奪獎品、獲取冠軍榮耀的鬥志,搭配 AWS 所提供的免費入門課程及學習資源,更創造出技術學習與推廣的友善環境,也是AWS 送給所有工程師最棒的寓教於樂場域。

精彩豐富的專題講座與寓教於樂的刺激競賽還不夠嗎?活動現場還有抽獎活動、深度參會集點以及問卷好禮,提早報到者再加碼早鳥禮!

立即報名豐富有趣的 2022 AWS 台灣雲端高峰會!