新的 AI 「騙」術!用聲音就可偽造出嘴形ㄧ致的影片

PS 的使用讓圖片可以以假亂真,人像去背重置到另一個場所的「騙術」層出不窮,不過你能想像在未來只要用聲音就可以做出偽造的影片嗎?
評論
評論

PS 的使用讓圖片可以以假亂真,人像去背重置到另一個場所的「騙術」層出不窮,不過你能想像在未來只要用聲音就可以做出偽造的影片嗎? 最近華盛頓大學的研究人員開發了一項新工具,透過新的機器學習演算法,可以將音檔轉換成口型一致的影片。如下方影片,左邊為音檔,右邊是透過人工智慧將聲音轉換為歐巴馬口型所生成的影片,雖然似乎有那麼一點對不上,不過整體來說已經相當的逼真!

 

影片來源:UW (University of Washington)

事實上,使用 AI 偽造的概念在之前就有類似的工具,像是 Twitter 機器人 Smile vector ,可以將明星藝人的照片做成微笑的動圖。Adobe 的 Project VoCo 可像 Photoshop 編輯圖片的方式對影片中的對話和發音進行編輯。

在過去,類似的技術所使用的概念為錄製多個人反覆說同一句話的影片,再收集聲音與不同口型之間的相關性。 不過此技術十分耗時,成本也非常昂貴。而在這次研究他們轉換了技術,所使用的技術不只是將音檔提供給神經網路,同時也提供影片進行訓練。

團隊表示,使用歐巴馬作為測試的原因在於,歐巴馬的高畫質影片素材豐富,可讓神經網路訓練更加容易,研究人員 Ira Kemelmacher 表示這次大約需要 17 個小時的鏡頭來追蹤並複製嘴形動作,但在未來這個訓練的時長可降為 1 小時。

他們希望在未來可將此技術應用來改善像是 Skype 視訊聊天工具,使用者可以收集自己的音檔用來訓練軟體。由於透過網路傳輸音檔所需頻寬遠低於視訊,因此,在網路不穩又需要與對方視訊對談時,就能自動使用自己的聲音生成視訊,同時也可以解決斷網後造成影片遺失而無法存取的問題。

然而這樣的工具,讓人擔心未來在影片上更容易產生造假的問題,不過研究團隊表示,他們對於這樣的問題也會十分謹慎,因此在未來他們也將開發可以辨別視訊真偽的工具!


疫後科技趨勢大爆發 5G加速創新應用發展

經濟部次長曾文生去年表示,在新冠肺炎疫情肆虐之下,大眾經常無法面對面進行溝通,更顯出「通訊」這個題目對人類社會發展的重要。
評論
Photo Credit: Lenny Kuhne / Unsplash
評論

疫情改變了目前人類的行為,而且影響會持續到未來,人與人、人與機器之間互動的方式將有所改變;試著想像這個場景,你剛去巡視完公司的無人工廠,整間廠房,就只有機械手臂安靜的高速運轉,這間廠房的生產效率,是過去一間兩百人廠的 3 倍以上;確認一切無礙,你快速的用模擬人像的視訊會議,跟所有夥伴說明企業運作現況。

下班後,坐進你的自動駕駛電動車,系統告訴你,大約 25 分鐘後就會到家。你在位置上手機連線,開啟家裡的冷氣、把最心愛的模擬實境遊戲打開,準備一回家就要戴上眼鏡與手套進入遊戲環境裡捉對廝殺。

10 年前,這些事情聽起來像是科幻小說,但現在,會因為所有科技技術逐漸到位,讓小說場景成為尋常的現實生活。而要連結這些場景,使之成真的背後,最關鍵的技術,莫過於能夠橫跨視聽展演、遊戲、運動、智慧觀光、交通及製造領域的 5G 技術。

5G 為通訊與物聯網的基礎,在 2020 年疫情侵襲全球期間,經濟部次長曾文生更曾提及,因為疫情,以至於所有人與人的通訊、連結都由面對面轉為線上,這更凸顯了流暢的通訊技術,對人類社會發展的影響之遠大。而國際研究機構 IHS Market《5G經濟》報告預估,到了 2035 年,全球 5G 產業鏈投資額預計將達到約 4 兆美元,而由 5G 技術驅動的全球產業應用將創造超過 12 兆美元。其中又以製造、數位娛樂、交通等,影響最大。

Photo Credit : 一零四資訊科技公司
一零四資訊科技公司於 2020 年 3 月發布的《104 職務白皮書》。(Photo Credit : 一零四資訊科技公司)

正因為商機如此龐大,這些關鍵發展領域,延伸出來的產業與技術,更需要創新與創意人才的參與和培育,根據 2020 年 104 人力銀行的調查指出,未來搶手的 10 大熱門職業中,有 6 項職業,都直接與 5G 領域技術高度相關,顯見台灣對於這類人才的渴求與期盼。

瞄準世界發展 5G 領先產業,廣納台灣人才加入競賽

以此來看,5G 產業不僅是國際發展趨勢,更是台灣未來打造下一個兆元產業的重中之重。而為讓創意真正落地到可執行的情境中, 經濟部工業局也同步於辦理近 20 年的通訊大賽 MobileHero 之中,特於 2020 年增設「5G領航創新應用競賽」子競賽,吸納與挖掘更多 5G 應用相關人才,並透過賽事,激盪出更多 5G 應用創新想法與實踐性。

而今年度 5G 領航創新應用競賽串接人才與發展領域,更聚焦於數位娛樂、交通及製造領域,橫跨視聽展演、遊戲、運動、智慧觀光、交通、製造產業,衍伸技術從浮空投影、360 度全景沈浸式體驗、到自動駕駛、物流自動化、無人搬運車、影像辨識等等

本屆 5G 領航創新應用競賽總獎金超過 100萬,概念組更只要完成 6 題的提案企劃即可參賽,從製造、交通到數位娛樂,有 5G 應用創新構想的你現在馬上就上傳你的提案吧。 (Photo Credit : 資策會地方創生服務處)

為發展 5G 特定領域解決方案,以使用者場景出發,在這次的 5G 領航創新應用競賽裡,更鼓勵「跨域組隊」,透過不同領域的人才組合,也成為團隊相互激盪出有趣創意及能否多元思考的關鍵。

實作組概念組雙軌賽制,激發更多創新創意思維

舉例來說,假設今天參賽者是以「電動車」為概念發想,做出相關企劃提案,那從電動車裡的乘客,乃至於駕駛的體驗感受以及需求,都成為想像電動車應該會需要什麼功能與服務的重點,藉由這樣的場景描述,找出可以以 5G 技術滿足的痛點,便有可能可以提出一個極具商業化價值與創新創意的提案。

競賽本身即是為了挖掘與培育數位人才為出發點,更棒的是競賽以「實作」與「概念」兩種賽制雙軌並行,除了以往落地執行的實作組,「概念組」團隊僅需要提出「創新概念」的提案,試圖想像 5G 技術可能的應用情境,第一階段提出夠創新、夠獨特的 6 道提案企畫書,就符合參賽條件。更說明了經濟部工業局開放更大的空間,邀請更多不同領域的傑出人才,一起發想未來世界生活的理想樣貌。

同時,競賽更採贊助商即評審制,產業代表可以就第一線面對市場的經驗,直接回饋修正與優化的方向,讓概念化為實際商業產品或服務時,更有市場思維。

接軌世界與台灣發展趨勢,也考量到實作難度,5G 領航創新應用競賽提出雙軌賽制,更廣邀產業專家加入,不僅給予相關資源協助,更有貼近市場脈動的意見與經驗參考。與此同時,團隊還可使用經濟部工業局 digiBlock C 數位創新基地測試相關應用服務的可行性,讓所有參賽者無論最後有無得名,都能從中得到寶貴的經驗與機會。

競賽報名方式

  1. 參賽者不限國籍與年齡;新創團隊、公司行號、社會人士或學生皆可組隊參加。
  2. 每隊由 1 至 5 人自由組成,鼓勵成員跨領域組合,激發多元創意。
  3. 每隊可視需求設指導老師/專家最多 2 名。
  4. 概念組著重創新創意,僅需完成 6 道題目的概念企畫提案即可。

經濟部工業局 廣告