不用標記就可辨識圖像! DeepMind 最新研究用強化對抗學習合成繪圖程式

它們是自己學會做這件事,而不是靠人工標記的數據集。
評論
評論

本篇來自合作媒體 雷鋒網 ,INSIDE 經授權轉載。

近日,DeepMind 發表的一篇部落客中提到了一種新的人工智慧體,它可以推斷數字,角色和肖像的構造方式。更為關鍵的是,它們是自己學會做這件事,而不是靠人工標記的數據集。

真實的世界並不僅僅是我們眼睛裡所反映的圖像。例如,當我們看建築物並欣賞其設計的複雜性時,我們也欣賞它所需的工藝。這種思維方式可以使我們對世界有更加豐富的理解,也是人類智慧的重要體現之一。

DeepMind  的研究員希望它們的系統也能創造出同樣豐富的世界表現形式。例如,觀察繪畫的圖像時,希望系統能了解用於繪畫的筆觸,而不僅僅是表現在螢幕上的像素。

DeepMind新研究:使用強化對抗學習合成圖像程序

在這項工作中,研究員為人造智慧體(agents)配備了與人類用來生成圖像相同的工具,並證明它們可以推斷數字,人物和肖像的構造方式。更關鍵的是,它們是自學如何做到這一點,而不是人為標籤的數據集。這與最近的一項研究「A Neural Representation of Sketch Drawings」提到的依賴從人類經驗中學習的方式恰恰相反。依賴於人類經驗的學習通常是很耗時的。

DeepMind新研究:使用強化對抗學習合成圖像程序

研究員設計了一個可以與電腦繪圖程式交互的深度強化學習智慧體,將筆觸放在數位畫布上並更改畫筆大小,壓力和顏色,未經訓練的智慧體畫筆很隨意,並沒有明顯的意圖或結構。為了克服這一點,研究員需要創建一種獎勵方式,鼓勵 agents 生成有意義的圖片。

為此,研究員訓練了第二個神經網路,稱之為鑑別器。它唯一目的是預測特定圖形是由 agents 製作的,還是從真實照片的數據集中採樣的。agents 的獎勵是用「欺騙」鑑別者認為它的繪畫是真實的。換句話說,agents 的獎勵本身就是學習的。雖然這與生成對抗網路(GAN)中使用的方法類似,但並不相同。因為 GAN 網路設置中的生成器通常是直接輸出像素的神經網路。而這裡的 agents 是透過編寫繪圖程式來與繪圖環境交互來生成圖像。

在第一組實驗中,agents 透過訓練生成類似於 MNIST 數字的圖像:它顯示了數字的樣子,但沒有顯示它們是如何繪製的。透過嘗試生成欺騙鑑別器的圖像,agents 學會控制畫筆並操縱它以適應不同數字的風格,這是一種稱為可視化程序合成的技術。

研究員也訓練它重現特定圖像的能力。在這裡,鑑別器的目的是確定再現圖像是否是目標圖像的副本,或者是否由 agents 產生。鑑別器越難區分,agents 得到的獎勵就越多。

最重要的是,這個框架也是可以解釋的,因為它產生了一系列控制模擬畫筆的動作。這意味著該模型可以將其在模擬繪圖程序中學到的知識應用到其他類似環境中的字符重建,例如用在仿造的或真實的機械臂上。

還有可能將這個框架擴展到真實的數據集。agents 經過訓練可以繪製名人臉部表情,能夠捕捉到臉部的主要特徵,例如形狀,色調和髮型,就像街頭藝術家在使用有限數量的畫筆描繪肖像時一樣:

從原始感受中提取資料結構化表示是人類很容易擁有且經常使用的能力。在這項工作中,研究員表明可以透過讓智慧體獲得和人類重現世界的相同工具來指導智慧體產生類似的表示。在這樣做時,它們學會製作可視化程式,簡潔地表達因果關係,提升了它們的觀察力。儘管該工作目前僅代表了向靈活的程序合成邁出一小步,但預計需要類似的技術才能使智能體具有類似人的認知,包括歸納概括和溝通交流等能力。


Google Cloud Next Recap: Taiwan 精華篇上線!11/10 多支中文精選影音一次看

為了讓台灣市場更深入獲得第一手的 Google Cloud Next '21 產品與技術發表,Google 台灣擷取適合台灣市場的主題內容,推出 31 支的中文影音內容,探討各種 Google Cloud 相關主題,並進一步帶來啟發。
評論
評論

一年一度的 Google Cloud Next 盛會以往都是實體舉行,自去年(2020)受疫情影響後轉為線上舉辦,且開放全球使用者免費報名參加。為了讓台灣市場更深入獲得第一手的 Google Cloud Next '21 產品與技術發表,Google 台灣今年也持續自 Google Cloud Next '21 線上發表中,擷取適合台灣市場的主題內容,將在 11 月 10 日 推出 15 支精彩的重點摘要、精選 16 支主題影片添加中文字幕,共計 31 支的中文影音內容,帶來最新的 Google Cloud 雲端技術發展,並期待替市場帶來啟發。

立即報名觀看 Google Cloud Next 精選中文影音內容

Google Cloud Next 雲端盛會為企業帶來的好處

在本次 Google Cloud Next 會中發表了一系列的創新技術,這些新發表的技術無不是憑藉著業界最乾淨安全的 Google 雲端服務,支持各行各業解決眼前所面臨的急迫問題。尤其現在可以說是每一家公司都轉型成為了科技企業,但最終能獲得成功的企業,不只是要做出與資料儲存以及運算相關的基礎架構決策,還要能夠運用雲端技術來推動數位轉型,以徹底改變整間公司的工作模式與創新思維。因此,無論是要提升內部營運效率、增加業務成長,或是開發創新可能,在 Google Cloud Next 雲端大會中都有機會找到企業所需的答案。

Google Cloud Next 雲端盛會精華篇,五大主題一次掌握

在  Google Cloud Next 中跟著 Google 設計的學習歷程,逐步領略企業的數位轉型過程,以及未來可期的技術發展。本次的中文內容涵括五大主題,分別為:

  • 開放式基礎架構:為了協助企業能在不受任何地理環境的限制下,加速雲端部署的腳步,Google 發表了一系列的託管式硬軟體解決方案 Google Distributed Cloud,幫助建構不受任何地理環境限制的雲端環境。
  • 資料與分析:為了協助企業建立具備即時分析能力的新一代資料基礎架構,並支援處理重要業務資料的應用程式,Google 也發佈了整合度最高、資料分析最完善的 AI 解決方案。
  • Google Workspace:透過建立一個數位工作場所,為超過三十億名使用者提供不受地理環境限制的交流和協作服務,完善所有業務環節間的協同合作,就是 Google Workspace 的使命。會中將透過 Smart Canvas 等輔助工具,提升使用者的工作效率,並進一步提供橫跨於 Docs、Gmail、Meet 和 Chat 等產品中的無縫式用戶體驗,以滿足第一線使用者的不同需求。
  • 安全性:今時今日,各個產業的機構組織都面臨前所未見的資安難題。為了提供更多人安全的網路環境,Google 宣佈了兩項重要政策,分別是全新的 Google 網路安全行動團隊 (簡稱 G-CAT),以及全新的 Work Safer 計畫。
  • 永續發展:為了提供業界最乾淨的雲端環境,Google 也發表了幾項創新技術,協助企業因應氣候變遷,採取立即行動。例如:提供所有客戶免費使用 Carbon Footprint 碳足跡追蹤功能。

立即免費觀看 Google Cloud Next Recap: Taiwan!了解更多詳細精彩的 Google Cloud Next 雲端盛會精華