Nvidia 新 AI 語音合成技術,揮別 Google 小姐實現真人聲發音

Nvidia 打破傳統生硬的機器語音技術,開放 RAD-TTS 原始碼讓擬真人語音互動更多元。
評論
Photo Credit:All the Feels: NVIDIA Shares Expressive Speech Synthesis Research at Interspeech
評論

在本週的 INTERSPEECH 大會 Nvidia 發佈了最新的 AI 語音合成技術,有別於傳統生硬的 Google 小姐、亞馬遜的 Alexa 語音助手工具,Nvidia 開發出擬真人語調、節奏、音色的 RAD-TTS 模組。

RAD-TTS 的功能主要是語音轉換,可將某個人的聲音來轉換另一個人聲,同時該功能可以對合成中的語氣音高、講話時間、精神進行細微的修正及編寫。

Nvidia 開發 RAD-TTS 將仿真人語音對話功能推向新的境界

Nvidia 在這次釋出的最新 RAD-TTS 模組製作而成的宣傳影片「I am a storyteller」,主要應用的技術共分 2 種,第一種是運用將近 10 萬筆真人發音訓練成一組專屬的語音合成模組,只要把任何語法輸入到模組中,就會自動生成、轉換成仿真人語音。

另一種則是真人語音轉換, 透過 Nvidia GPU Cloud(NGC)目錄中的資料,在 Mozilla Common Voice 進行訓練而成的 RAD-TTS 語音模組,在 Mozilla Common Voice 現有資料庫擁有近 76 種語言、近 1.4 萬小時的群眾外包語音資料,只要把真人人聲輸入至模組後,就會自動生成與人聲相同語調、音色、語氣的仿真人語音內容。

值得關注的是,NVIDIA 正在規劃開放原始碼,並有意改善並用在自家 GPU 真人發音演算,目前已有部分內容開源上架到 NVIDIA NeMo Python 的 GitHub 網站,這些研究未來經優化後將會套用在 NVIDIA GPU。

未來有任何研究人員、開發人員及各式語音服務的內容創作者,均可透過 NVIDIA NeMo 這項上架 GitHub 的 GPU 加速對話式的 AI 開放原始碼 Python 工具包,來延伸各種應用並測試及微調真人語音發音模型。 NVIDIA 這次釋出的這項 RAD-TTS,融合並開放目前全世界最大規模的數據語音資料集,就是為了讓更多人能了解到這項語音技術。

RAD-TTS 的擬真人語音技術,將有更多豐富的場景應用尚待測試

RAD-TTS 的擬真人語音技術,包含了自然語言處理、自動語音辨識、關鍵字偵測、音訊增強等功能,未來的產業應用上如有助銀行和零售商的自動語音客服、電玩遊戲、有聲書籍、虛擬偶等。

NVIDIA 強調這項技術也能適用在語言機能的障礙者,甚至讓使用者能用自己的聲音翻譯成不同國家的語言;即便是重新已故歌手的表演,只要搭配歌曲旋律就能重現人聲背後真正的情感。NVIDIA 表示之後可透過 SDK、API 串接這些資源,讓開發者更容易直接使用,進而創造、改善更豐富的擬真人語音互動情境。

核稿編輯:Anny

延伸閱讀:



一圖看懂 Seagate Exos®  CORVAULT 的室內設計魔法:資料量跑得快又多,你的儲存空間追得上嗎?

在資料儲存領域深耕超過 40 年的 Seagate 推出 Exos® CORVAULT™ ,實現「更小的空間、更大的資料密度」,4U 硬碟機架總共置入 106 台 20TB 硬碟,總密度高達 2.12 PB,協助各行各業加速數位化腳步。
評論
評論

「儲存空間寸土寸金,但資料量不斷高速成長。如果短時間內無法擴充資料中心,我們的儲存空間該怎麼『追上』?」

「機房硬碟那麼多顆,難免會碰上故障。假如每次都要親自出入機房更換,又得花好幾天來重建資料,還要擔心影響資料安全和讀寫效能。」

除了採用公有雲,近年許多企業開始自建資料中心來存放資料。然而,當資料量跑得愈來愈快、愈來愈多,「儲存空間」、「資料安全」以及「讀寫效能」也更受關注。希捷科技(Seagate)最新的儲存產品 Exos® CORVAULT™,展現「小空間、大儲存」魔法,並透過自我修復降低企業維運成本。

儲存的「室內設計魔法」:更小的空間、更大的資料密度

你知道嗎?今天全世界 1 小時所產生資料量,比 20 年前一整年加起來的資料量還多。例如:一輛自駕車每天最高產生 32 TB 資料,一間智慧工廠每天最高產生 1 PB 資料,一座智慧城市每天最高產生 2.5 PB 資料。高速成長的資料量,可不僅限於 B2B 領域而已。隨著元宇宙(MetaVerse)趨勢崛起,在不遠的未來,B2C 領域的資料量也將快速增長。

然而,當我們對數位世界的「儲存空間」需求不斷成長,實體世界的「機房空間」依舊寸土寸金。為了協助各行各業加速數位化腳步,在資料儲存領域深耕超過 40 年的 Seagate 最新推出 Exos® CORVAULT™ 實現「更小的空間、更大的資料密度」,4U 硬碟機架總共置入 106 台 20TB 硬碟,總密度高達 2.12 PB。

 Exos® CORVAULT™ 總共可以置入 106 台 20TB 硬碟,總密度高達 2.12 PB。

為何能做到「小坪數、大儲存」?原來,Seagate 透過 Top-Loading 技術,宛如發揮「室內設計魔法」一般,以垂直置入模式,在有限的空間裡達成目前市面上最高的硬碟數量。此外,當高密度的硬碟於同一時間高速運轉時,往往會讓機房產生「音波震動」困擾;而 Exos® CORVAULT™ 的模組化機殼透過抑震、抑音裝置,最大幅度地降低震動、噪音和排出的廢熱干擾,甚至還能保護硬碟機不受外部電力異常影響。

此外,Exos® CORVAULT™ 具備熱插拔設計的備援電源供應器,可確保高效供電穩定一致、毫無噪音;而面對電力突波時,反應速度也很快。

「雙重加持」的自我修復:不只省成本,還能愛地球

有了「大儲存空間」不代表高枕無憂,畢竟 24 小時不間斷運轉的資料中心,難免會碰上少數幾顆硬碟故障。一般來說,整體儲存空間愈高,資料重建的耗時也愈長,進而影響資料安全與讀寫效能。 Seagate 透過獨有技術,不僅提升資料安全、降低客戶人力維運成本,還跟上近年 ESG 投資指標趨勢,大幅減少電子垃圾。

以容錯式磁碟陣列(​​Redundant Array of Independent Disks;RAID)架構來說,RAID 5 最多只能容錯一顆故障硬碟;相較之下,Exos® CORVAULT™ 容錯功能更佳,達到與 RAID 6 同等的效能,即使兩顆硬碟同時故障,依舊能夠維持正常讀寫效能。

不過,Exos® CORVAULT™ 最獨特之處,是同時具備 Seagate 的自動分散式配置保護技術(Autonomic Distributed Allocation Protection Technology,簡稱 ADAPT)與硬碟自動重生技術(Autonomous Drive Regeneration,簡稱 ADR)。

藉由 ADAPT 技術,資料可分散儲存於高達 106 顆硬碟裡,強化資料保護。一旦碰上硬碟故障,維運人員不需親自進入機房抽換硬碟,Exos® CORVAULT™ 會透過 ADR 技術,藉由自動設定硬碟讓機房「重生」,讓系統暫時跳過故障硬碟,並以剩下正常的硬碟重新上線。當機房透過自動更新恢復運作後,此時 ADAPT 技術再度「上陣」,透過自我修復把「重生」後的冗餘硬碟空間進行換算,大幅提高資料可用性。

究竟 Exos® CORVAULT™ 可以在多短時間內完成資料重建呢?若以 10TB 為例,傳統硬碟的資料重建最快也要 5-50 小時,有些甚至得耗費 4-5 天;但在 ADAPT 與 ADR 的「雙重加持」下,同樣 10TB 的資料重建,Exos® CORVAULT™ 僅需 3-4 小時。部署快、資安強,高標準的客戶也不怕。

不僅如此,透過特別建置的架構,Exos® CORVAULT™ 擁有12Gb/秒 HD-Mini SAS 介面、循序讀/寫速度高達 14Gb/秒及 12Gb/秒、IOPS 高達 17,680。此外,ADAPT 糾刪碼運用高效率去叢集同位校驗,可涵蓋集區內的所有硬碟機,減少容量間接成本、達到更好效能、加快重建速度。

再加上,此架構結合第六代 VelosCT™ ASIC 的主動-主動雙控制器,擁有完善備援能力和熱插拔功能,具備高可用性、相容性,效能可加以預測。上述種種特點,都讓採用 Exos® CORVAULT™ 的客戶得以加速回應、降低延遲。

若從維運角度來看,部署時是否方便?又該如何確保後續資料安全?別擔心,Exos® CORVAULT™ 以整合式 Web 裝置和資料管理主控台為後盾,可透過 Web GUI 或 CLI 使用強大的內建管理功能,透過一鍵設定輕鬆快速完成部署,並具備遠端診斷和不中斷更新能力。

在資安方面,不需要控制器層級的間接費用,就能讓資料均達到最高的安全性。而所有隨附的 HDD 標準規格均採 Seagate Secure™ 自我加密硬碟機(SED)技術並提供 SFTP 支援,可安全傳輸檔案。

更重要的是,如果你經營跨國 IT 業務,旗下出售的軟硬體產品需符合歐美地區的加密模組要求,或你來自對數據安全高標準的醫療、金融等領域,都可選配適用美國與加拿大地區的加密模組測試標準 FIPS 140-3 的配置。

 Exos® CORVAULT™ 具有最高的資料安全性,且維運相當方便。

「追上」數位腳步,就靠 Seagate 的「大儲存」技術

十年前的儲存空間,只是今日的杯水車薪;而現在的資料量,也極可能是未來數位世界的滄海一粟。在數位化愈來愈全面、儲存需求也愈來愈迫切的今天,Seagate 帶著自身超過 40 年的儲存專業,期望透過提供儲存創新服務,協助各行各業「追上」愈來愈快的數位腳步。