【武漢肺炎】如何用賽局理論決定最好的防疫策略?

前幾天一篇用賽局理論探討防疫策略的文章爆紅,不過其中有一些錯誤,為了讓大家對賽局理論有更正確的認識,教授經濟系課程的作者想要 debug 一下:
評論
REUTERS/達志影像
REUTERS/達志影像
評論

本文作者 Vivian Fang 方郁茗,加拿大公立西門菲莎大學 (Simon Fraser University) 教授經濟系課程 7 年,精通賽局理論 (Game Theory),主攻關懷社會的公共經濟 (Public Finance)。離開學術界後征戰商業戰場、深耕國際市場商業開發 10 餘年 ,橫跨電子業、製造業、媒體、品牌相關等領域,縱行智囊團、幕僚、業務、行銷、商業開發 (Business Development) 等職務。現提供私人商業智庫服務,商業顧問、教學等。心願是為社會盡力,身體力行柏拉圖改善 (Pareto Improvement) 以及最優化 (Pareto Optimal)。

原文刊登於作者 Medium,INSIDE 經授權轉載。

網路爆款文:「賽局理論」看「防疫策略」

前晚吃飯時一個好友傳了篇社群媒體爆紅的文章給我;點開連結,看到作者用「賽局理論」談 covid-19(新冠狀肺炎)疫情防災策略,眼睛為之一亮,馬上往下閱讀。

很可惜,文章裡的「賽局理論」觀念並不正確,但已有幾千人點閱,整頓飯吃得十分忐忑。考慮了 15 分鐘後職業病發作、老師魂上身,我豁出去了。

賽局理論糾察隊

先到作者的文章下面留言,提醒他:賽局裡「策略」(strategy) 和可能「結果」(outcome)是完全不同的概念。

進一步加了作者為好友,私訊跟他討論更深層的賽局理論問題。

作者很客氣,溝通後,我畫了個賽局矩陣表(payoff matrix)解釋:以他的數字設計,正確運用賽局理論工具推出來的結論,與他想表達的論點恰恰相反

(按:文章說到「全面防堵或是全面減災都是辦不到的事」,但他的賽局架構導出來的結論與此自相矛盾。)

有鑑於此火紅網路文章案例,筆者感受到大家對賽局理論有興趣,希望藉此導正賽局理論的觀念。此文會以 covid-19 防疫時事為題目,以賽局理論架構,用賽局矩陣表(game matrix)的架構及工具來拆解此防疫策略局勢。

先談賽局入門(以前的文章有說過,熟悉的人歡迎跳過)。

賽局理論入門

賽局基本入門的要素:

1. 玩家(player):玩家必須多於一人,兩人成局的概念。

2. 策略(strategy):指的是在所有可能發生情況下的一套完整行動計畫;這完全決定了玩家的行為。

3. 得失 / 支付(Payoffs): 「得失」指的是賽局裡玩家在每個可能的行動的「得」與「失」。簡單些,可以想成玩遊戲裡的「得分」。而由於這個「得失」取決於對手玩家的策略,學術上一般以支付(payoffs)的函數來計算。

4. 最佳反應 (Best Respond, 下簡稱 BR):針對「對手玩家」的某一策略,能帶給此玩家最優「得失」(payoff) 的策略為最佳反應。換個角度想,最佳反應(BR)是在問:當對手出某一招,你出哪一招分數才會高分。

5. 均衡(Equilibrium):均衡就是平衡,也是最終的賽局結果。在賽局裡一般簡單的均衡指的是「納許平衡」(Nash Equilibrium)。

防疫策略賽局

先說此防疫策略的假設。

假設:

  1. 兩位玩家:國家 A & B
  2. 兩個策略:「封鎖」 (Lock-down) & 「防疫 」(Containment)
  3. 兩位玩家在下列等條件上有相似背景:醫療資源、人文、政治態勢、經濟體系及規模,且目前皆處在「未爆發重度社區感染」
  4. 採「封鎖」策略下得分:

▪️ 如兩位玩家同時採「封鎖」策略,成本為 80,得分為 -80 分(因為是負數,所以分數為負數)
▪️ 如單一方採「封鎖」,其成本為 100,因為採封鎖的那方還得加派人員防守對方人員到境內,得分為 -100 分

5.        採「防疫」策略下的得分:

▪️ 如兩位玩家同時採「防疫」策略,成本為 40,得分為 -40 分
▪️ 如單一方採「防疫」,其成本為 60,因為還得加派醫療人員等,協助追蹤境外移入感染,得分為 -60 分

從上得分設計,可看出此賽局假設「防疫」成本比「封鎖」成本低;當然,採「防疫」策略對醫療體系造成的衝擊,以及社會成本也很高。但畢竟「封鎖」的先期成本(軍方、官方、海關等)相對高,更不用論採「封鎖」可能造成的恐慌效應、企業、勞工等的其他社會成本。

賽局矩陣 Game Matrix

此賽局有 2 位玩家(player),雙方有 2 個可選的策略(strategy),所以共有 4 個可能發生的結果(outcome)。

賽局矩陣(game matrix)就是將玩家的得分(payoffs)放入一個 2x2 的表格示意,如表一。

1_69n8IBbbE6z24JHr-hDUHw

玩家的得分(payoff)讀法,每一格的左邊的數字代表國家 A 的分數,右邊的是國家 B 的,如表右上的定義。

用賽局矩陣的小技巧來拆解國家 A 的最佳反應(BR)。

當國家 B 採「封鎖」策略,請看表格的左邊兩格,圖示綠色箭頭處。

1_FmBQTWUJBeSqM_GaltZIAQ

從表二可知:國家 A 採「封鎖」payoff 為 -80,採「防疫」payoff 為 -60 分,-60 > -80。故,當國家 B 採「封鎖」,國家 A 的 BR 是「防疫」。

註:賽局小技巧,把高分的數字圈起來代表是 BR,如表三綠圓圈。

1_RaRuqYGJ4LifG2v_DyWLjA

如果國家 B 採「防疫」策略,請看表格的右邊兩格。同樣方法,從表四可看到 -40 > -100, 國家 A 的 BR 一樣是「防疫」。把高分的圈起來,如表四右邊的綠色圓圈。

1_R-DYaklzznax_g10ZUHTDA

再介紹一個賽局新名詞「優勢策略」(dominant strategy):不管對手出哪一招,玩家出此招都拿較高分,這就是優勢策略。

由於不論國家 B 採哪一策略,國家 A 都是「防疫」比較優,所以「防疫」是國家 A 的優勢策略為防疫。

國家 B 的分析就不一步步操作,循上分析,結果如表五。

1_aublNfAA82Bt8lqiSRaV4w

使用紫色圈來畫出國家 B 的 BR,不難發現,國家 B 也有優勢策略,一樣是採取「防疫」。

當有個可能賽局結局 (possible outcome)是雙方的 BR 時,此時賽局已找到平衡點,稱為納許均衡,雙方都會理性「防疫」。

賽局結論:兩國都會採「防疫」策略而非「封鎖」策略。

註:畫圈圈這賽局小技巧是用來幫助尋找均衡,當 payoff 矩陣裡每位玩家的 payoffs 都被圈起來了,代表找到賽局終點。

結語

當然此賽局簡化了很多其他可變的因素及參數,也假設了政府有能力追蹤每一位入境者的旅遊史,感染史,而且醫療體系尚足夠應付。此賽局也只探討靜態(static game),實際上這些情勢隨時在變化,應為動態賽局(dynamic game) 。不過,這個簡單的賽局分析結論,剛好呼應了台灣當局目前的策略。

在社區疫情未大爆發前,採取「防疫」這個策略,審慎查詢每一位確診案例染症來源,追蹤確症個案接觸人士,謝絕疫情嚴重區之入境,加強自疫區返國人士的自我居家管理,隔離患者,杜絕傳染,未染症國人加強勤洗手、出入人多場合戴口罩、大型活動延遲舉辦、減少外出等自我保護措施,相對是比全面「封鎖」來的理智。

剛才賽局理論的分析,也佐證此為現階段最佳的手段:嚴謹「防疫」為台灣目前最優的策略。

責任編輯:Mia
核稿編輯:李柏鋒