吃雞、捉迷藏都難不倒它!Deepmind 推出最新泛用型遊戲 AI「XLand」

XLand 特殊在於能在多人遊戲中建立 3D 第一人稱化身,透過第一人稱視角去感知遊戲中環境,並且不斷嘗試、碰撞遊戲規則,從中累積龐大資料來訓練自己完成遊戲目標。
評論
Photo Credit:Deepmind
評論

還記得 AlphaGo 圍棋下贏柯潔、李世乭的震撼時刻嗎?從 AlphaGo 之後,Google 母公司 Alphabet 旗下的英國 AI 企業 Deepmind 一直在透過強化學習(Reinforcement learning,RL)技術挑戰各種遊戲,有星海爭霸 2 的 AlphaStar、能通學西洋棋、將棋、圍棋的 AlphaZero、MuZero 技術上也越往「無監督學習」的方向走去。

但最近他們則把觸角放到更廣泛的領域,推出泛用度極高、可以零樣本,而且不需要事先知道規則的通用型新遊戲學習 AI:XLand

我們知道機器學習(Machine Learning,ML)、RL 都需要足夠的資料來訓練模型,反過來說只要資料不夠,RL 學習的成效就不好。之前 AlphaGo Zero 能震撼世人不只是它能下贏世界棋王柯潔,更重要的是它能不需要任何人類資料,就能從零開始自我學習、自我對戰。

而今天的主角 XLand 的特殊點在於,它能在多人遊戲環境中建立一個 3D 的第一人稱化身,這個化身會透過第一人稱視角去感知遊戲中環境,並且不斷嘗試、碰撞遊戲規則,從中累積龐大資料來訓練自己完成遊戲目標。要舉例的話,AlphaGo Zero 化身的只是「下棋的那隻手」,但 XLand 是把整個人都模擬出來了!

目前 Deepmind 讓 XLand 去玩奪旗、捉迷藏或 King of the Hill 等遊戲,Deepmind 官方說明,XLand 只要平均訓練五個世代之後,那個 AI 化身的遊戲表現就能有飛躍式的進步。Deepmind 透過動作特徵發現這些 AI 每次訓練都能幫助理解自己動作的基本原理、時間條件與遊戲規則。Deepmind 還表示在吃雞型遊戲中,XLand 的 AI 化身甚至可以彼此間展現出很好的合作行為。

Photo Credit:Deepmind

Deepmind 說明 XLand 訓練出來的模型若再加上些許的監督式學習進行微調,其原理類似於 OpenAI 的 Text-KI GPT-3 可以針對某些特定文本任務進行微調一樣,XLand 再經過約 30 分鐘或多 1 億次的再訓練後,AI 化身完成任務的成效就能再增加 340%,並且還具有解決先前無法成功任務的能力。

從 AlphaGo 走到現在 XLand,Deepmind 展示了無監督式機器學習的高度潛力,也向世界證明未來訓練 AI 的成本跟門檻將會越來越低、越來越普羅。他們的技術論文請點這

核稿編輯:Anny

延伸閱讀:



總價值一千萬獎項!「挖貝提案者大賽」提供完整顧問與行銷資源,目標助 40 組提案團隊圓夢

第一屆「挖貝提案者大賽」,不僅祭出總價值高達一千萬的豐厚獎項,更運用貝殼放大過往協助無數破千萬集資專案的強大專業優勢,提供獲選提案團隊完整顧問與行銷資源,力求讓好提案能在台灣遍地開花。
評論
Photo Credit:貝殼放大
評論

群眾集資產業在台灣邁向第 10 年,產業又有新變革!由台灣最大群眾集資顧問公司「貝殼放大」成立的「挖貝 WaBay」群眾集資平台於 1 月 14 日正式宣布,舉辦第一屆「挖貝提案者大賽」,不僅祭出總價值高達一千萬的豐厚獎項,更運用貝殼放大過往協助無數破千萬集資專案的強大專業優勢,提供最多 40 組獲選提案團隊完整顧問與行銷資源,力求讓好提案能在台灣遍地開花。

徵件對象包含原創產品、社會參與、文化內容等各類型提案,並於即日起至 3 月 31 日開放報名,首獎可獲得挖貝 WaBay 提供價值 300 萬元的專案推廣、行銷、顧問資源,而且只要入選決賽便可擁有價值 10 萬元的行銷資源挹注!歡迎所有符合資格的提案團隊報名參賽

從根本改善產業,提供完整顧問資源、提升群眾集資原創動能

「挖貝 WaBay」群眾集資平台於 2021 年 4 月正式成立,由於看見群眾集資原創性日益降低,以及層出不窮的爭議事件,漸漸讓大眾對產業失去信心,因此挖貝秉持群眾集資「信任」與「責任」原則,鼓勵「原創」和「社會倡議」類型專案,致力和提案團隊與贊助者共創良好的集資環境,希望重建群眾集資產業最美好的的初始信念,成為原創、文化及社會參與團隊最青睞的平台。

適逢整體群眾集資產業在台灣邁向第 10 年里程碑,也是挖貝平台在成立將滿一週年之際,特別舉辦「挖貝提案者大賽」,以史上最豐厚、總價值高達一千萬的獎項,鼓勵全台與挖貝一樣懷抱著美好理想的團隊,將心中的原創提案實現成真,讓社會產生正向改變,並帶動群眾集資產業正向發展。

總獎項價值千萬!首獎獨得 300 萬、入選決賽即獲 10 萬行銷資源

「挖貝提案者大賽」共分為三個組別,包含「原創產品」(具備全新概念的生活原創設計品、3C 科技、活動等)、「社會參與」(具有社會公益價值,例如:社會議題倡議、空間再造、教育、在地等)、「文化內容」(影視娛樂、藝文出版、遊戲等),期望凸顯提案團隊本身的原創性以及對社會文化的關注與理念實踐,初賽不限報名組數,最多取 40 組入選決賽。

在獎項的部分,為了鼓勵更多團隊藉由群眾集資實現理想,「挖貝提案者大賽」跳脫一般平台僅能提供基礎上架指導的限制,透過母公司「貝殼放大」成立以來奠基的紮實群眾集資執行專業,期望在過程中讓提案團隊獲得完整的專業支持,對群眾集資產業具備正確理念;本次祭出總價值一千萬的豐厚獎項,除了專案推廣費用挹注之外,更包含一對一顧問諮詢、對外宣傳資源、海外平台上架評估與輔導等實際支持;「首獎」可獨得價值 300 萬獎項、「優勝」每組兩名 50 萬獎項、「入選決賽」最多取 40 組各獲得價值 10 萬獎項。

敬請提案團隊把握機會報名參賽,挖貝提案者大賽報名資訊詳見:https://backme.tw/ref/XcxOl/

Photo Credit:貝殼放大

第一屆「挖貝提案者大賽」報名資訊

▶報名時間:即日起至 3 月 31 日

▶初賽結果公告:2022 年 4 月 20 日

▶報名資格

  • 設籍台灣
  • 具備完全行為能力之自然人或合法登記之法人、團體,未成年提案人則須提供法定代理人同意書
  • 報名期間內繳交提案資訊

▶提案組別

  • 原創產品組:生活原創產品(設計、餐飲、美妝保養、服飾)、3C 科技(3C、科技)、活動(活動、運動、旅行)等提案
  • 社會參與組:社會、空間再造、教育、在地等提案
  • 文化內容組:影視娛樂(表演、音樂、影視動畫)、藝文出版(印刷出版、攝影、插畫漫畫、藝術)、遊戲(桌遊、紙牌、電動、遊戲設計)等提案

▶獎項福利(總價值一千萬)

  • 「首獎」:一名,獎項總價值 300 萬
    • 專案推廣費 100 萬
    • 行銷、顧問資源 200 萬
  • 「優勝」:每組兩名,每名獎項總價值 50 萬
    • 專案推廣費 15 萬
    • 行銷、顧問資源 35 萬
  • 「入選決賽」:最多取 40 名,每名獎項總價值 10 萬
    • 行銷、顧問資源 10 萬

▶線上報名連結:https://backme.tw/ref/XcxOl/

本文章內容由「貝殼放大」提供,經關鍵評論網媒體集團廣編企劃編審。