機器學習降低門檻!外媒:未來大家都能輕鬆合成自己聲音

現在只要對著麥克風朗誦一段文字約 30 分鐘,再把錄製的語音檔案上傳處理,只要幾小時後,你的「聲音副本」就完成了。
評論
Photo Credit: Shutterstock / 達志影像
評論

過去語音複製(voice clones)技術成本較高,得將錄音轉成聲音模組,再合成完整單字;但現在受惠於機器學習大幅進展,只要錄製一段聲音就能直接進行語音複製、合成了!

機器學習進展,降低語音複製門檻

根據 The Verge 報導,以前語音複製或合成技術如果要聽起來夠逼真,得先錄下人類聲音,再把他們的聲音分類成一個個的語音模組;之後播放時,就再把語音模組組合成一個個完整的單字,這樣聽起來比較真實。

不過,得益於機器學習的進步,現在的神經網路(neural networks)技術已經做到——能針對未分類的語音數據直接進行訓練,並合成一個人說話的聲音。

換句話說,現在你只要對著麥克風朗誦一段文字約 30 分鐘,再把錄製的語音檔案上傳處理,只要幾小時後,你的「聲音副本」(a copy of your voice)就完成了。之後,就可以在對話框裡直接輸入想說的文字,系統會自動產出用你聲音講出來、足以騙過親友的語音。

儘管目前技術還不夠完美,仍需要進行一些手動調整,但隨著技術改進,未來勢必會愈來愈逼真。

舉例來說,知名 Podcast 編輯軟體 Descript 就內建語音複製技術,這樣節目製作人就能在編輯時快速修改主持人的語音內容,例如:刪掉一句話中的幾個字,或是直接輸入某個單字,並用主持人的聲音講出來。

「找回」聲音受損者的嗓音

不過,先前這些語音複製或合成技術都還被當作只是新奇、好玩之事,但現在則可用於嚴肅的醫療領域。

曾演出蝙蝠俠的好萊塢知名演員 Val Kilmer,在 2014 年罹患喉癌後,逐漸淡出影壇,聲音也因而受損,甚至曾說:「旁人已經很難理解我在說什麼了。」

來自英國的語音技術新創公司 Sonantic 則為他客製化複製語音,並在今年七月坎城影展播出的紀錄片《Val》「重新找回」Val Kilmer 的嗓音。

即使聲音沒有受損,對擁有高知名度的公眾人士來說,語音複製、合成技術也能為他們「開拓財源」。例如,他們可以授權讓自己的聲音用在特定廣告代言上,擴大自己的生財範圍。

但對普羅大眾來說,語音複製、合成技術有什麼功用?外媒推測,未來或許會有親子語音應用程式問世,讓父母可以快速複製自己的聲音,這樣即使暫時無法陪在孩子身邊時,也能用爸媽聲音來為孩子念床邊故事。

然而,語音複製、合成技術屬於深偽(Deepfake)一環,而任何新技術都是雙面刃,只要查詢一下深偽技術相關詐欺事件,就不難想像語音複製、合成技術一旦普及,未來也會遇到更多這類挑戰。

核稿編輯:Anny

延伸閱讀:



不只是把交易搬到網路上!數位轉型3模式協助品牌再升級

數位轉型並不只是將實體商家搬到線上,要將數位的概念貫穿策略、組織、技術、文化等面向,才算是真正搭上數位轉型的列車。
評論
評論

2020 年世界各國因為疫情的蔓延,讓許多企業都開始正視數位轉型的議題,然而台灣到了 2021 年才開始爆發大規模的疫情,也讓很多產業意識到數位轉型的重要性。新冠肺炎疫情帶來許多衝擊,居家辦公、遠端教學、餐廳禁止內用、市場分流等措施,也造成了生活模式及消費習慣的改變,對企業與商家而言,數位轉型成為迫切需求。以餐飲業而言,研究機構 IDC 指出,由於疫情影響,原先需要 2 年以上的數位轉型工作將壓縮到 2 個月以內完成,而另根據《數位時代》的調查,台灣已經有 85.7% 的組織及企業已展開數位轉型。新興的年輕消費族群身為數位原生代,對於數位科技更是運用自如,企業如何運用數位科技及數據幫助企業更精準接觸 TA、並營造更個人化的消費體驗,才是關鍵。

數位轉型並不只是將實體商家搬到線上,要將數位的概念貫穿策略、組織、技術、文化等面向,才算是真正搭上數位轉型的列車。針對數位轉型,全球企業巨擘 Google提出「數位獲客」、「數位科技」、「數位文化」轉型三支箭,指出企業應從線上觀察消費者的行為模式以理解消費者,進而調整數位策略,配合其行為進行個人化行銷或掌握流量,轉為實際業績;在數位獲客以前必須善用數位科技,利用雲端科技打造互相連結的平台;而營造合適的組織文化,培養更多數位人才,更是數位轉型後企業能夠永續經營的重要關鍵。

許多品牌也以此為基礎延伸數位轉型的概念,三模式Plus促進再產業升級:

數位X異業結盟 增加獲客

利用數據進行個人化行銷已是行之有年的數位轉型策略之一,數位廣告及行銷界也長期依賴第三方 cookie 精準追蹤用戶行為進行個人化行銷。在此基礎之上,也有許多品牌進一步融合數位及異業結盟,增加獲客數。如玉山銀行,過去銀行業的獲客模式主要為信用卡優惠,現在則把金融服務融入數位場景中,利用數位化銀行串聯多平台線上支付,擴大異業合作,也增加獲客數。旅遊平台 KKday 在疫情期間受到莫大衝擊,推出旅遊業雲端 SaaS 服務 「Rezio 預定系統」及「KKday 同業分銷平台」,整合旅遊業商品、訂單、金流等面向,攜手合作夥伴一起進行數位轉型,互相增加獲客數。

本土電商龍頭 PChome 24h購物也觀察消費者的消費模式,將數位服務融入異業串聯,如觀察到現代上班族的寄杯文化,因此與新型態咖啡寄杯 APP:CAFFÈCOIN 職人咖啡通行合作,集結全國 1000 家職人咖啡館,於線上儲值,跨店皆能兌換,輸入折扣碼送咖啡兌換金 ;或是看準永續消費的概念與永續時尚品牌 FYNE 合作,輸入折扣碼可享滿額折抵,且參加 FYNE 舉辦的舊衣回收傻瓜計劃,於活動期間透過 FYNE 官網申請不限品牌,舊衣回收可獲得紅利,紅利還可於 FYNE 官網消費折抵。

PChome 24h購物與新型態咖啡寄杯聯盟 CAFFÈCOIN 職人咖啡通行合作。

數位融入生活場景 

而品牌推出的服務要被應用才能增加獲利,品牌藉由數位技術融入生活場景,讓消費者更加離不開品牌服務。如 APPLE 開創的 Face ID,藉由擴大與 APP 通路合作,下載、入口網站、繳費解鎖都要靠 Face ID,也成功增加消費者對品牌商品的依賴度。看準現代人離不開網路地圖的服務,Inline 結合 Google Map 地圖定位服務,讓消費者使用 Google Map 搜尋餐廳或商家後,能直接在地圖下方的「訂位」鍵完成訂位服務,深入消費者生活場景,提升依賴及使用度。而 PChome 24h購物的金流服務 P 幣支付也不斷致力於融入消費者的生活場景,使用範圍從超商、水電費、停車場、買咖啡服務等層面融入消費者的生活,形成 PChome 的金流生態圈,其也支援最完善的行動支付服務,將數位工具完整融入生活場境,滿足消費者體驗。

數位科技擴大應用

隨著科技的推陳出新,行銷手法也不斷變化,尤其在 COVID-19 肆虐之下,新興的行銷 5.0 也應運而生,行銷 5.0 主要在於使用科技提升消費者體驗,如鼎泰豐早在 2016 年就陸續引進 Pepper 機器人及自助點餐機來減少消費者排隊等待的時間,提升顧客體驗,近來更結合物聯網技術,監測店內食品保持品質一致,是行銷 5.0 應用的先驅;IKEA 利用 AR 讓消費者可以將販售的家具擺放在現實生活空間,檢視產品是否符合自家風格。

鼎泰豐早已引進 Pepper 機器人協助候位、點餐系統,減少大量等待時間,優化消費者體驗。
IKEA 發布 APP「IKEA Place」讓消費者可以藉由 AR 技術,檢視產品放置在家中的感覺。圖片來源:IKEA Youtube

除了上述三模式,在企業及商家中樹立良好的數位文化更是能讓組織成為活水,在時代趨勢中不被淘汰。樹立良好的數位文化不外乎就是要培養許多數位人才,尤其是生長在數位原生代的 Z 世代們,從小浸淫在數位時代帶來的資訊爆炸環境,求知慾、學習力旺盛,應變能力強,對於科技運用能力更是嫻熟,

且多半不滿足於單一能力的培養,紛紛具有多元能力而成為斜槓族;除了技術性的能力之外,在軟實力上也不落人後,Z 世代勇於表達自我,也積極在社群媒體上求表現,甚至被稱為「孔雀世代」,同時也善於營造生活氛圍,重視工作與生活的平衡,貼近現代消費者的需求。

PChome 24h購物開辦電商線上課程,強化電商人才培育。

許多企業注意到 Z 世代的人才特質,開始運用在企業經營上,尤其在以數位為根基的電商產業,如 PChome 24h購物看到了 Z 世代人才的特質優勢,但苦於台灣並無系統性的電商培育資源,因此開辦電商線上課程,教授創意檔期策略、異業合作、社群入門及行銷提案等電商產業知識,培育人才回饋產業界。人才培育是數位轉型文化能夠保持滾動的重要因素,品牌應善加運用 Z 世代數位人才的特質,創造雙贏。

本文章內容由「戰國策傳播集團」提供,經關鍵評論網媒體集團廣編企劃編審。