不用標記就可辨識圖像! DeepMind 最新研究用強化對抗學習合成繪圖程式

它們是自己學會做這件事,而不是靠人工標記的數據集。
評論
評論

本篇來自合作媒體 雷鋒網 ,INSIDE 經授權轉載。

近日,DeepMind 發表的一篇部落客中提到了一種新的人工智慧體,它可以推斷數字,角色和肖像的構造方式。更為關鍵的是,它們是自己學會做這件事,而不是靠人工標記的數據集。

真實的世界並不僅僅是我們眼睛裡所反映的圖像。例如,當我們看建築物並欣賞其設計的複雜性時,我們也欣賞它所需的工藝。這種思維方式可以使我們對世界有更加豐富的理解,也是人類智慧的重要體現之一。

DeepMind  的研究員希望它們的系統也能創造出同樣豐富的世界表現形式。例如,觀察繪畫的圖像時,希望系統能了解用於繪畫的筆觸,而不僅僅是表現在螢幕上的像素。

DeepMind新研究:使用強化對抗學習合成圖像程序

在這項工作中,研究員為人造智慧體(agents)配備了與人類用來生成圖像相同的工具,並證明它們可以推斷數字,人物和肖像的構造方式。更關鍵的是,它們是自學如何做到這一點,而不是人為標籤的數據集。這與最近的一項研究「A Neural Representation of Sketch Drawings」提到的依賴從人類經驗中學習的方式恰恰相反。依賴於人類經驗的學習通常是很耗時的。

DeepMind新研究:使用強化對抗學習合成圖像程序

研究員設計了一個可以與電腦繪圖程式交互的深度強化學習智慧體,將筆觸放在數位畫布上並更改畫筆大小,壓力和顏色,未經訓練的智慧體畫筆很隨意,並沒有明顯的意圖或結構。為了克服這一點,研究員需要創建一種獎勵方式,鼓勵 agents 生成有意義的圖片。

為此,研究員訓練了第二個神經網路,稱之為鑑別器。它唯一目的是預測特定圖形是由 agents 製作的,還是從真實照片的數據集中採樣的。agents 的獎勵是用「欺騙」鑑別者認為它的繪畫是真實的。換句話說,agents 的獎勵本身就是學習的。雖然這與生成對抗網路(GAN)中使用的方法類似,但並不相同。因為 GAN 網路設置中的生成器通常是直接輸出像素的神經網路。而這裡的 agents 是透過編寫繪圖程式來與繪圖環境交互來生成圖像。

在第一組實驗中,agents 透過訓練生成類似於 MNIST 數字的圖像:它顯示了數字的樣子,但沒有顯示它們是如何繪製的。透過嘗試生成欺騙鑑別器的圖像,agents 學會控制畫筆並操縱它以適應不同數字的風格,這是一種稱為可視化程序合成的技術。

研究員也訓練它重現特定圖像的能力。在這裡,鑑別器的目的是確定再現圖像是否是目標圖像的副本,或者是否由 agents 產生。鑑別器越難區分,agents 得到的獎勵就越多。

最重要的是,這個框架也是可以解釋的,因為它產生了一系列控制模擬畫筆的動作。這意味著該模型可以將其在模擬繪圖程序中學到的知識應用到其他類似環境中的字符重建,例如用在仿造的或真實的機械臂上。

還有可能將這個框架擴展到真實的數據集。agents 經過訓練可以繪製名人臉部表情,能夠捕捉到臉部的主要特徵,例如形狀,色調和髮型,就像街頭藝術家在使用有限數量的畫筆描繪肖像時一樣:

從原始感受中提取資料結構化表示是人類很容易擁有且經常使用的能力。在這項工作中,研究員表明可以透過讓智慧體獲得和人類重現世界的相同工具來指導智慧體產生類似的表示。在這樣做時,它們學會製作可視化程式,簡潔地表達因果關係,提升了它們的觀察力。儘管該工作目前僅代表了向靈活的程序合成邁出一小步,但預計需要類似的技術才能使智能體具有類似人的認知,包括歸納概括和溝通交流等能力。


逆勢而上!阿物科技運用 AI ,加速旅遊咖疫後復甦

COVID-19 疫情爆發至今,持續衝擊台灣本土旅遊業者發展。awoo 阿物科技透過線上座談會,探討後疫情時代的數位轉型策略,分享現今旅遊業應如何部署,在疫情解封後迎戰「報復性旅遊潮」的商機。
評論
Photo Credit:阿物科技
評論

自 COVID-19 疫情爆發至今,全球不見趨緩,在台灣三級警戒近兩個月中,持續衝擊台灣本土旅遊業者生存發展。awoo 阿物科技憑藉豐富的數位轉型成功案例、多年的 MarTech 技術與 SEO 經驗,透過線上座談會,探討後疫情時代的數位轉型策略,邀請到 Tripresso  旅遊咖創辦人暨執行長洪明楓、awoo 阿物科技副總經理吳一凡、awoo 阿物科技行銷經理林秉寬,分享現今旅遊業應如何部署,在疫情解封後迎戰「報復性旅遊潮」的商機。

Photo Credit:阿物科技
awoo 行銷自動化服務應用講座,分享如何協助旅遊咖數位轉型。左起為 awoo 科技行銷經理 林秉寬;awoo 科技副總經理吳一凡;Tripresso 旅遊咖創辦人暨執行長 洪明楓

Tripresso 旅遊咖趁疫情整合底層供應鏈,滿足消費者更多場景需求 

Tripresso 旅遊咖自 2016 年以 B2C 一站式的旅遊平台起家,2018 年隨著業務的成長推出 TripSaaS 服務,再到 2019 年推出出差旅費管理系統 COMMEET,旅遊咖的客戶多為傳統旅行社,且多數仍以實體服務為主。但自疫情爆發後,旅行社無力應對國旅、海外旅客銳減的衝擊,洪明楓表示,業者應趁疫情期間整合底層供應鏈,來滿足未來消費者多元的需求。

提早佈局!旅遊咖攜手 awoo 阿物科技,誓言打造旅遊電商生態圈

從團體旅遊服務起家的Tripresso 旅遊咖,為整合旅遊供應鏈,提供大型旅行社、小眾旅行社的服務系統化、數位化的運營,於 2019 年成立了 TripSaaS 公司,為傳統旅行社提供許多線上服務、快速架設網站、上架行程、管理訂單等。

整頓了底層供應鏈的需求後,旅遊咖卻面臨了在網站取得訂單的困境,從取得顧客到實際轉換,甚至因為旅遊產品的顧客特性,導致回訪率低的問題,都需要大力優化。從 2020 年起,Tripresso 旅遊咖多次尋訪台灣的數位轉型服務領導品牌,最終找上 awoo 阿物科技,其以 AI MarTech 的行銷平台聞名台日兩國,有效加速打造旅遊電商生態圈的進程。

awoo 阿物科技以理解商品出發,助攻旅遊業數位轉型,創造最懂消費者的網站體驗

Tripresso 旅遊咖整合旅遊供應鏈的服務,涵蓋航空公司、旅館、地面交通、替代住宿相關的旅遊資訊。過往這些服務旅行社需跨部門、跨公司接洽與溝通,導致花費許多時間與人力成本。雖然現在多數旅行社皆有提供線上下訂服務,但業者與旅行社仍難以清楚知道下訂使用者背後的真實「想法」,在下訂機票的同時,如何同時推薦使用者訂當地的旅館?如何把使用者的停留時間拉長,並提高轉換率?

為此,awoo 阿物科技提供了多達 20 種關鍵產品的功能,透過拆解商品背後的消費者意圖洞察,創造最懂消費者的網站體驗,從顧客獲取、行動喚起、創造營收到維持顧客, All-in-One  行銷平台協助旅遊業獲得最佳成效。另外 awoo 阿物科技在電商產業屢獲佳績,近期更協助 50 餘年歷史的 3C  零售商 EcLife 良興購物網,以 awoo AI 自動化降低人力,並創造轉換率大增 2 倍的亮眼成效 。 

電商數位轉型刻不容緩,awoo 阿物科技積極協助各行各業找出痛點

數位轉型是各行各業在面對新冠疫情時,都曾思考或煩惱的問題,但是如何轉型及應用、到商業策略中變現才是各產業界關心的議題。阿物科技為國內少數擁有利用 AI 將產品資料與消費者進行關聯性比對的系統,並使用消費紀錄、會員資料、網路上的商品分類等數據分析後,給予業者在商品陳列、庫存優化、適合的活動主題與企劃等建議。

 AI 結合大數據分析功能,能帶來實質的銷售業績成長與消費者反饋,阿物科技副總經理吳一凡表示,阿物身為 AI MarTech 新創,長期致力於協助實體零售解決產業數位轉型的痛點時,發現到數位轉型不僅僅只是領導者與老闆的責任,而是整個公司及員工都需要合作才有可能成功。另外,不論是廣義的實體服務或零售的數位轉型,電商的數位轉型之路都需要花費相當多的時間來磨合。

掌握零售電商數位行銷秘技,了解更多數位轉型案例,立即下載白皮書

瞭解更多:阿物科技的 MarTech 趨勢解密

本文章內容由「 awoo 阿物科技」提供,經關鍵評論網媒體集團廣編企劃編審。