電腦會自己畫圖!微軟 AI 把文字變成栩栩如生的影像畫面

評論
Photo credit: 微軟
Photo credit: 微軟
評論

近年 AI 在各領域表現大幅躍進,不管是 作曲建立另一個 AI,成果都相當讓人刮目相看前陣子京都大學發表了可以「讀心」的 AI, 從無到有還原受試者正盯著的影像。現在微軟 AI 又在影像領域產生了新的突破,能夠看完文字敘述以後自己「畫圖」。

和 Google 的 Sketch RNN 真的要訓練電腦「畫」出具題而複雜的物件不同,微軟 AI 相較起來可能是個比較小的挑戰:他可以把文字敘述轉變成一幅畫。

微軟的 AI 產生器名為 Attentional Generative Adversarial Network (AttnGAN)。當然現在用文字來搜尋符合敘述的現成圖片已經不稀奇了,不過微軟除了教 AI 什麼樣的文字特徵與什麼樣的圖像配對以外,在 論文 中還提到,他們的 AI 史無前例地能夠從文字中過濾出不同的條件,用來產生畫面中不同的部位。

Photo credit: 微軟

舉例來說,如果輸入「這隻鳥有綠色的頭冠、黑色的基底和白色的肚子」電腦就會一個像素一個像素地重建出一幅相當精準的影像。

主要研究員何曉冬在 新聞稿 中解釋到,差別在於「如果你用 Bing 搜尋一隻鳥,你就得到一隻鳥的圖片,但是在這裡電腦則是無中生有,一像素一像素地創造出這個影像。」研究人員表示,這個 AI 產生器可以用來增強攝影師的影像編輯工作,或者當藝術家的繪圖助理。在新聞稿中還提到,也許未來甚至能直接從文字劇本生成動畫電影。

延伸閱讀:


精選熱門好工作

平台營運專員

樂購蝦皮股份有限公司
臺北市.台灣

獎勵 NT$20,000

Full-stack (Frontend most) Senior Software Engineer

ShopBack 回饋網股份有限公司
臺北市.台灣

獎勵 NT$20,000

PopDaily 業務企劃-公標案專責–【業務部】

數果網路股份有限公司
臺北市.台灣

獎勵 NT$20,000

評論