大開源!DeepMind 與暴雪要讓《星海爭霸2》變 AI 研究室

所以距離 AI 成為世界冠軍還有多少時間呢?
評論
Photo Credit: Blizzard
Photo Credit: Blizzard
評論

擊敗李世乭之後,Google 旗下人工智慧公司 DeepMind 去年就宣布將進軍《星海爭霸 2》,今天他們則公佈了跟暴雪合作的最新研究工具集。不過值得注意的是,這次並非直接以「打敗人類」為最終目標,而是想把即時戰略遊戲當作一種工具訓練 AI ,讓 AI 變得更智慧、更精準。

這次發布的 「SC2LE」工具集 內含如下:

  • 一組透過讓研究者和開發者接進遊戲的機器學習 API,並且首次囊括了在 Linux 系統上的系列工具。
  • 匿名遊戲影片數據集,而且近期內就會從 65k 數據量增加到超過 50 萬場比賽。
  • 開源的 DeepMind 工具箱 PySC2,可以讓研究者簡單串連它們的人工智慧軟體到暴雪的 API 上。
  • 一系列單純的 RL(強化學習)小遊戲,讓研究者測試人工智慧軟體在採礦、建築、控兵等具體任務上的表現。
  • 除此以外,還有一篇 DeepMind 與暴雪聯名發表的論文,簡介上述 RL 小遊戲、AI 學習遊戲影像以及內置 AI 1v1 天梯比賽等一系列成果。

為什麼《星海爭霸 2》會對訓練 AI 很重要?同時身兼頂尖玩家的 DeepMind 研究員 Oriol Vinyals 說明星海跟圍棋不一樣,戰爭迷霧的機制讓它是一款「不完全資訊」的遊戲,玩家要不斷偵查地圖的過程對 AI 來說就是一件非常複雜的事;此外星海等即時戰略是很複雜的遊戲,不只要控兵攻擊、建構防禦,還必須兼顧生產部隊與採集資源。

也因此 DeepMind 和 Blizzard 才會發布一系列單純的 RL 小遊戲,把一場完整遊戲中猜解成不同的子環節,讓這些子環節可以跟不同研究人員的各種 AI 表現互相比較,最終再嘗試組合成整場遊戲的複雜運作。此外,PySC2 工具箱也把遊戲分解為「特徵層」,其中遊戲的元素像是兵種、血量、地圖可見性之間彼此隔離,同時保留了遊戲核心的視覺和空間元素。

雖然 DeepMind 沒有明說他們離在《星海爭霸 2》中打敗人類距離還多遠,但事實上電玩是目前 AI 研究中非常熱門的測試,卡內基梅隆的研究員如何透過第一人稱射擊遊戲「Doom」來改進他們的 AI;OpenAI 團隊也用過 DeepDrive,讓 AI 在 GTA V 世界裡面訓練開車技巧,以提高自動駕駛的精準度。