Google 讓兩個 AI 一起玩遊戲,他們會合作還是打架?

評論
REUTERS/Andrea Comas
REUTERS/Andrea Comas
評論

原文刊登於合作媒體 36Kr,INSIDE 獲授權轉載。

相信自從 AlphaGO 戰勝人類之後,不少人想乾脆讓兩個人工智慧直接對決算了。

Google 的 DeepMind 團隊還真的做了一件類似的事,不過設定有點稍稍不同,這源於試驗的目的並不是要找出哪隻人工智慧玩圍棋更厲害,而是想知道,人工智慧在特定的規則環境下,究竟是會合作還是競爭?

畢竟,未來人工智慧在這個社會中,要處理的事情可能很多,小到指揮交通,大到國家的經濟運行,可能都有人工智慧的參與。然而人類發展的歷程告訴我們,有時候合作也許才是對大家最好的。

為了探討這個問題, DeepMind 做了個實驗,將幾個 AI 機器人置於一系列的 「社交困境」 中,在這些情況下,個人可以從背叛他人中獲利,但如果所有人都那麼自私,那就沒有贏家。這是不是讓你想起了諾貝爾獎得主奈許提出的 「博弈論」 裡面的「囚徒困境」?

DeepMind 做實驗的方法就是 ,讓這些 AI 們一起玩兩個簡單的電動遊戲。

第一個電動遊戲叫 「撿蘋果」,兩名玩家要在中間的同一支管子上收集蘋果,誰撿的蘋果多誰就贏。同時他們都有一個技能,透過用雷射來阻礙對方的行動,讓對手暫時在遊戲中消失,就有機會收集更多的蘋果了。

第二個遊戲叫 「狼群」,兩名玩家需要在一個充滿困難和障礙的環境中捕獵一隻獵物。不過不僅是抓到獵物那名玩家可以得分,而是當獵物被捕時,所有靠近獵物的玩家都可以得分。

實驗結果略為有趣,但是不算意外:這些人工智慧都會根據不同的情景和規則,調整他們的行為方式,時而合作時而敵對。

比如,在 「撿蘋果」 遊戲中,當蘋果數量很充足的時候,這些人工智慧似乎懶得去動手阻礙別人,而是努力在自顧自地撿蘋果。然而當蘋果的總數逐漸減少,他們使用雷射功能的次數也開始增多了

但這是一個機器人,接下來的事情就更有趣了,當引入一個運算能力更強的人工智慧時,它卻傾向於無論剩下多少蘋果,都會去阻礙對手。似乎更聰明的 AI 表現出來的是,在這個遊戲中,什麼時候都要好鬥。

不過這是不是就是意味著, AI 認為阻礙別人就是最好的戰略呢?這可不一定。

研究人員認為,更高級的人工智慧在遊戲中使用雷射的次數較多,有可能只是因為發出雷射這個動很難,所以高級 AI 做得比較順手。 AI 需要把武器瞄准目標,還要追蹤它們,這樣的舉動需要更多的運算能力,而且還會佔用寶貴的撿蘋果時間。所以除非玩家覺得發雷射划得來,否則大概會乖乖一起撿蘋果。

那麼在 「狼群」 遊戲中又如何?

這個遊戲的情況則恰恰相反,較聰明的 AI,在這個遊戲裡較容易傾向於和其他玩家合作。研究人員解釋,這也是因為跟其他玩家一起追蹤和圍捕獵物,要求用更多運算能力 。

不得不說,不同級別的機器人模式轉變的理由,真是十分實在。即便 AI 展現出來的合作與好鬥的程度,跟他們的 「能力」 有關,但無論如何,研究結果都說明,人工智慧的行為模式會隨著它們所面臨的規則而變。如果遊戲規則鼓勵的是好鬥的行為,也就是說你要好鬥才能拿高分, AI 會變得好鬥;如果遊戲規則鼓勵合作行為,那他們會表現得更為合作。顯然上面的遊戲中,第一個撿蘋果的遊戲更像一個零和博弈,你撿的蘋果多了我的就少;第二個則像正和博弈,合作時雙方或至少一方的利益會增加,也就是整體利益會增加。

這也告訴告訴了人工智慧研究的相關人員,未來在涉及多個 AI 互動的場景中,確保制定的 「遊戲規則」 適當,是控制 AI 行為很重要的部分。就像研究人員在 部落格 中寫道:

這個實驗之後,我們似乎更能理解與控制多方參與的系統,比如經濟運行、交通系統,或者地球生態健康的維護,這些都依靠我們持續的合作。

如果把上述遊戲中的 AI 換成人,得出的結論很像社會心理學的基本假設,傾向於將人的行為模式歸結到環境變化。然而人的不可控性在於複雜的七情六慾,還有內心各種特殊陰影,都會影響他的選擇。對於機器而言,還沒有性格可言,在同一環境下的不同行為,變量僅是運算能力。

也許囚徒困境不會是個問題,因為即便資訊不對稱,只要你給我足夠的演算力,我可以算出合作是最佳解。但人呢?即便智商夠高,也不一定能相信坐在隔壁的人不會背叛我。

不過如果出現了影集《西方極樂園》的情況,機器人有了記憶和意識,不知道他們還會不會純粹靠智商差異來思考?

延伸閱讀:


精選熱門好工作

Video/Image Processing Software Engineer

PicCollage 拼貼趣
臺北市.台灣

獎勵 NT$20,000

(Backend)Senior Software Engineer

ShopBack 回饋網股份有限公司
臺北市.台灣

獎勵 NT$20,000

資深前端工程師 - Solution (Senior Frontend Engineer)

iKala 愛卡拉
臺北市.台灣

獎勵 NT$20,000

評論