激戰二十天!人工智慧 Libratus 戰勝四位頂級德州撲克選手

在賓州匹茲堡的 Rivers 賭場,卡耐基梅隆大學(CMU)開發的人工智慧系統 Libratus 戰勝四位德州撲克頂級選手,獲得最終勝利。
評論
Ryan Riess (L), 23, a poker professional from East Lansing, Michigan contemplates a move against Jay Farber, 29, a Las Vegas VIP Host originally from Santa Barbara, California, during the final table of the World Series of Poker $10,000 buy-in no-limit Texas Hold 'Em tournament at the Rio Hotel & Casino in Las Vegas, Nevada November 5, 2013. REUTERS/Steve Marcus (UNITED STATES - Tags: SOCIETY) - RTX151SF
Ryan Riess (L), 23, a poker professional from East Lansing, Michigan contemplates a move against Jay Farber, 29, a Las Vegas VIP Host originally from Santa Barbara, California, during the final table of the World Series of Poker $10,000 buy-in no-limit Texas Hold 'Em tournament at the Rio Hotel & Casino in Las Vegas, Nevada November 5, 2013. REUTERS/Steve Marcus (UNITED STATES - Tags: SOCIETY) - RTX151SF
評論

在賓州匹茲堡的 Rivers 賭場,卡耐基梅隆大學(CMU)開發的人工智慧系統 Libratus 戰勝四位德州撲克頂級選手,獲得最終勝利。

據官網介紹,此次由 4 名人類職業玩家 Jason Les、Dong Kim、Daniel McAulay 和 Jimmy Chou 對戰人工智慧程式 Libratus,賽程為 20 天,一共進行了 12 萬手牌的比賽。

2015 年,CMU 曾組織了首場「大腦對抗人工智慧」賽事。在當時的賽事中,代表 CMU 出戰的是另外一款人工智慧系統「Claudico」,同樣也有 4 名職業撲克玩家參加了比賽,然而,Claudico 並未獲得最終勝利。

不過 CMU 認為,當時撲克職業玩家與 Claudico 僅進行了 8 萬手牌的比賽,就統計學角度來講並無法證明人類職業撲克玩家或人工智慧具有優勢。這也是本輪巡迴賽中比賽的牌局數量增加 50% 的原因。

德州撲克的玩法:每個玩家有 2 張牌作為「底牌」,同時還有 5 張公共牌。玩家選擇 5 張公共牌裡的 3 張,與手裡的 2 張底牌組合,最後以期得到最好的 5 張牌的組合。按照「Card Ranking」決定最後的勝者。

由於對方的「底牌」是隱藏資訊,對於電腦來說,就是在處理一種「非完整資訊博弈」。而圍棋對弈雙方的資訊是完整的、對稱的,並沒有隱藏的資訊。Libratus 此次戰勝頂級人類德州撲克選手,具有非常重要的意義。

電腦正確決定,依賴於對方「底牌資訊」情況下的機率分佈,這種「底牌資訊」可以通過對手過去的行為顯露出來。比如有時玩家採取「虛張聲勢」(Bluffing)的策略,對手有時手裡並沒有強牌,但還是作出全額下注、志在必得的行為,電腦這時要根據對方過去的博弈表現,來判斷對手有強牌的機率。

相應的,對手也會推斷我方的底牌資訊,所以這裡就是一個「遞歸推理」(recursive reasoning),一個玩家無法輕易推理博弈狀況。

繼圍棋和德州撲克之後,人工智慧的下一站會是哪個遊戲呢?