逆轉無望?人機大戰德州撲克,AI 領先已近 68 萬美元

目前 AI 展示出來的潛能,讓人們擔心一些職業會不會就此消失,現在最前沿的 AI 領域的專家已經開始嘗試訓練 AI 學習設計程序了。
評論
REUTERS/Vladimir Konstantinov  (RUSSIA - Tags: SOCIETY) - RTXSKTU
REUTERS/Vladimir Konstantinov (RUSSIA - Tags: SOCIETY) - RTXSKTU
評論

原文刊登於 雷鋒網 ,INSIDE 獲授權轉載。

德州撲克人機大戰 中,四位職業牌手與 CMU 開發的人工智慧系統 Libratus 進行了激烈對抗。

Libratus 是卡內基梅隆大學的 Tuomas Sandholm 和 Noam Brown 開發的。他們以前開發的機器人 Claudico 在 2015 年的德州撲克比賽中沒能擊敗職業牌手。

先前也曾有報導,「一對一無限注德州撲克」 就是兩個人玩的賭博遊戲,因為事先會給每位玩家分發 2 張底牌,所以對方 的 「底牌資訊」 你是不知道的,對於電腦來說,就是在處理一種 「不完全資訊博弈」。我們知道 AlphaGo 玩圍棋,對弈雙方的資訊是完整的、對稱的,並沒有隱藏的資訊。所以在德州撲克上 AI 取得了進步,是具有重要意義的。

比賽期間,前三輪比賽失利後,四位職業牌手在第四天和第六天的比賽中獲得勝利。 Libratus 原本領先 193000 美元,在第六輪比賽後 Libratus 僅領先 51000 美元。

在人類選手反擊迅猛之時,牌手之一 Jason Les 便在一封電子郵件中寫道:

我們花了一段時間學習,來理解正在發生什麼事情。

然而,隨後 Libratus 的表現讓所有非常人吃驚:再次獲得關鍵性勝利。第 10 天結束時, Libratus 已經領先 677000 美元,而 局勢似乎不可逆轉

跟 AlphaGo 相似, Libratus 也可通過機器學習進行自我博弈和學習。

Libratus 的開發者之一 Tuomas Sandholm 也說道:

我們不能詳細談論 Libratus 的技術,直到比賽結束為止。但是,我可以告訴大家, Libratus 的算法一直在超級電腦上執行,所以超級電腦每天都在輸出改進的策略。

今年 1 月底, Libratus 可能會在下一場比賽中再次擊敗人類。到目前為止,機器人還沒有在無限制德州撲克團體賽中擊敗過人類,但這一天也許不會太遠了。

人工智慧撲克機器人的研發具有重大意義。首先,它是一種教導人工智慧系統處理不完全資訊的方式。 Noam Brown 指出 「在現實世界中,所有的相關資訊通常不像棋盤上的棋子那樣明顯。有些重要的資訊會消失或隱藏,人工智慧需要能夠處理這樣的資訊。」

對這場德州撲克人機大戰有興趣的讀者可上 Twitch 觀看直播

延伸閱讀: