十比一大勝人類!Google Deepmind 再以 AI 稱霸《星海爭霸2》

評論
評論
Photo Credit: Deepmind

Deepmind 繼圍棋之後再度稱霸人機大戰!今天台北時間凌晨兩點登場的《星海爭霸2》人機挑戰賽中,Deepmind 星海專用 AI「AlphaStar」以 10:1 橫掃 Dario Wunsch 和 Grzegorz Komincz 兩位人類職業玩家(分別世界排名第 39 位、第 14 位,Non-Korean ),其中只有 Grzegorz Komincz 在連戰最後一場換了新 AI 的狀況下贏得勝利。

這場比賽中 AlphaStar 都以神族參賽,並且所展現的微操能力十分驚人(精確控制部隊中單一單位的能力,部隊數量越多難度越高),專業賽評“RotterdaM”稱其為「超乎想像」,就連 Grzegorz Komincz 本人也對其操縱追獵者的能力讚嘆不已。

你一定會想:AI 是不是會有許多人類做不到的優勢?例如不受戰爭迷霧影響?光手速就超越人類?但 DeepMind 研究人員表示,AlphaStar 從一開始訓練時並不存在這種優勢,它的視野仍然受戰爭迷霧的限制,而且手速、點擊數甚至被限制比頂級玩家平均水準還低一些,每個點擊只有約平均 350 毫秒的反應時間。

DeepMind 進一步表示 AlphaStar 的遊戲技能主要來自稱之為 AlphaStar 聯盟的培訓計劃,一開始是從各種聯賽的比賽過程開始學習,累積了約 200 年人類遊戲時間的學習量。

值得注意的是《星海爭霸2》跟圍棋差距最大在於,戰爭迷霧的機制讓它是一款「不完全資訊」的遊戲,玩家要不斷偵查地圖的過程對 AI 來說就是一件非常複雜的事;此外星海等即時戰略是很複雜的遊戲,不只要控兵攻擊、建構防禦,還必須兼顧生產部隊與採集資源。因此 DeepMind 和 Blizzard 是使用一系列單純的 RL 小遊戲,把一場完整遊戲中猜解成不同的子環節,讓這些子環節可以跟不同研究人員的各種 AI 表現互相比較,最終再嘗試組合成整場遊戲的複雜運作。

下面就是這場世紀對決的影片:

延伸閱讀:


評論