
【Howie 商業投資】寫幾行字就能生出一張圖?看看 NVIDIA 新武器 GauGAN2

你只要動嘴,電腦就能幫你畫風景
除了元宇宙的佈局外,NVIDIA 近日公布 AI 秘密武器:一種名為 GauGAN2 的機器學習模型,這種模型最特別的地方是可以生成「原本不存在的圖片」。
整合深度學習的 segmentation mapping、inpainting,以及文字轉圖檔等技術,GauGAN2 可以從使用者寫的文字中生成該物體圖片,厲害的是,這些元素在組合後可以生成景觀圖外,還可以自動延伸出新景象(比如石頭+水=溪流、或是雪+山=冰河),更神奇的是,未來如果文字中加入形容詞,例如長短高低,則這些圖還可能產生千奇百怪的類別。當然,這個模型由於還在訓練中,因此也可能產生你看不懂的東西…。
GauGAN2 可能顛覆我們對事實的認知?
早在 2019 年 NVIDIA 就推出 GauGAN,也就是 GauGAN2 的父輩,這種基於生成對抗網路技術(Generative Adversarial Network,GAN)的模型可以自行學習,只不過當時只能畫出單一物體,如一座山或一條溪,對於物體間組合能產生的景觀還不是那麼上手,解析度與像素也不細緻。經過兩年改良後,現在的 GauGAN2 已經可以自動生成各種景觀圖。開發人員認為,這個技術可以改變人類的生活型態,並且應用在各種行業上,模糊了事實與虛擬的界線,甚至可能帶來嚴重影響,為什麼?
會不會變成深度偽造的另種版本?
先講壞事,我們對於深度偽造(Deepfake)一方面保持樂觀,認為是 AI 發展的一大進步,一方面又擔心自己的人像遭受盜用,甚至用在犯罪上,當前還真的難以預防這類技術風險,一般人也難以辨認遭偽造圖像的真假。不過由於深度偽造是基於現實既有的圖片進行模仿,只能產生人臉而不能產生其他場景,但 GauGAN2 就不一定了。

雖然現在是以生成自然景觀為主,但沒人知道如果跟深度偽造結合,是不是可以直接產生「人+特定景象」的狀況,更可怕的是 GauGAN2 可以從文字中去想像各種人事物組合,如果今天你在元宇宙的虛擬會議中開會,主管突然問為何你在外面咖啡廳遊蕩,一查之下是有人用「你的個人照+星巴克咖啡廳」生成這個場景,會有什麼感想?甚至這種技術還可以產生你從沒見過的人,倘若有人謊稱你是他的擔保人到處借貸,這是多糟糕的事。真真假假、假假真真的世界,可能是我們以後要面對的。
可能性無限的創意產生器
當然並不是說上述的事情一定會發生。NVIDIA 開發這些技術時應該也想過這些問題,客觀來說,GauGAN2 是搶佔虛擬世界市場的法寶,可以讓人們的創意無限發揮,甚至讓電腦幫你一起做腦力激盪才是公司主要目的,可以透過虛擬創作來強化沉浸式體驗。
此外,藝術家、行銷人員、內容創造者都可以用這個工具提高自己的戰力值,增加更多創作靈感來源或是撰寫草稿,補齊人類圖像化能力不佳的劣勢。而產品開發人員可以用 GauGAN2 加上 3D 列印,把產品雛型現場直接印出來檢視,大幅縮短上市時間,許多 AI 專家預測會有越來越多 GauGAN2 這類應用出現,讓人類更有效率的運轉。有句話用來形容這些新科技很貼切:「所有的事情到後來都是好的,如果還不夠好,那就是還沒有走到最後。」
加入 INSIDE 會員,獨享 INSIDE 最精采每日趨勢電子報,未來還有會員專屬內容。 點擊立刻成為會員!
責任編輯:Mia
核稿編輯:Chris
延伸閱讀:
- 你打字,AI 就幫你畫:NVIDIA 發表全新 GauGAN2 繪圖工具
- 【NVIDIA 2021 秋季 GTC】大舉實現 Metaverse!NVIDIA 為 Omniverse 新增多項功能
- Nvidia 新 AI 語音合成技術,揮別 Google 小姐實現真人聲發音
- 防堵有人亂美國大選,微軟推出反 Deepfake 偵測工具!
- Deepfake 快可以拍電影?迪士尼親自秀百萬畫素逼真 Deepfake技術