轉引:囚犯的兩難-賽局理論與數學天才馮紐曼的故事

囚犯的兩難-賽局理論與數學天才馮紐曼的故事

經濟學系的學生大都要唸「賽局理論 」相關主題,某些商學EMBA也會提到賽局理論的研究跟應用。本書在台北市立圖書館相當熱門,一個月內不看完,很少有機會再續借一個月。

這本書是在講匈牙利猶太人天才數學家 John Von Neumann 個人的生平傳記簡介跟這個理論如何因為他而受人舉世注目。就跟許多天才一樣,他的個性與思考模式總是超乎常人理解的範圍,書中有許多他令人驚奇的生活故事、愛情故事,其他像是會說 7 種語言、超強記憶力、五年就唸完大學跟博士班,以及後來進入高等學府、研究機構的一些活動軼事,包括在冷戰期間,為 RAND Corporation 蘭德研究機構 (p. 115,一家由美國空軍支持的智庫單位 )做戰略研究像是他鼓吹預防性戰爭 。書中還提到許多跟他同時代的聰明腦袋,一些諾貝爾獎得主之類的同儕,愛因斯坦也是同時代人物,兩人雖曾共事但並不如傳說中的熟識。




RAND 機構

John Von Neumann在許多領域都有卓越的貢獻,一般而言認定他對賽局理論(Game theory)跟電腦發展的貢獻最大。 賽局理論裡「囚犯的困境」發生在生物學、心理學、社會學、經濟學、法律的領域。只要有利益衝突的地方,就有囚犯的困境。對於動物、人類社會為什麼呈現目前的社會組織型態,囚犯的困境的研究提出很強的解釋能力。




John Von Neumann, 1903-1957




另外一名對 Game theory 有卓越貢獻的是 John Forbes Nash。Von Neumann對賽局遊戲的二人零和賽局,也就是一個人的收益正是另一人損失的遊戲,得出大中取小的定理。Nash的主要研究是「非零和賽局、以及有三個以上三參與者的賽局」。Nash的一生也被搬上螢幕,變成電影,就是美麗人生(A beautiful Mind),就跟電影演的一樣,真實的 Nash 在後產生了一些精神方面的問題。不過賽局理論的發明並非由Von Neumann獨享,法國數學家 Esmile Borel 早他七年,在1921年發表了賽局理論的論文也考慮了欺騙的問題,但他並沒有繼續對此主題發表深入的論文。


John Nash at a symposium of game theory at the University of Cologne, Germany (2006)

John Forbes Nash, 1928

如果沒有Von Neumann對電腦的貢獻,可能就沒有賽局理論的第三位卓越貢獻者 Robert Axelord 利用電腦程式跑實驗程式的計算結果。他的程式實驗結果顯示「一報還一報」的策略是最佳的獲益策略。Von Neumann 身兼IBM公司顧問,協助該公司確定電腦技術的發展方向,以數位而非類比的機器儲存二進位(而非十進位)數字的軟體程式。Von Neumann和他的同事沒有積極申請專利,顯然是為了鼓勵電腦技術的應用和推廣。

Robert Axelord 現在還活著,他的網站:http://www-personal.umich.edu/~axe/


賽局理論的故事與相關用語

囚犯的困境

  • 囚犯困境是普遍的概念,理論家已經體認到它會出現在生物學、心理學、社會學、經濟學、法律等領域。只要有利益衝突的地方就會有囚犯困境,而利益衝突並非只發生在有感知能力的生物之間。

小孩分蛋糕的故事 (p. 60)–大中取小(p. 73)

  • 馮紐曼從數學證明了雙人賽局,只要彼此利益完全對立,就永遠存在一個理性的行動方針,這一證明稱為「大中取小定理」(Minimax theorem),典型的例子如第二點。
  • 不管父母多小心翼翼,兩個小孩總覺得自己的蛋糕比較小,甚至兩個都這樣覺得。解決這個問題的著名方法是一個切分蛋糕,一個選。這樣,貪婪的動機保證了蛋糕有公平的分配,切蛋糕的不能質疑蛋糕不一樣大,第二個也不能抱怨,因為是自己挑的。對切蛋糕的人來講,他必須切得很平均,不然他就只能在一樣大的半塊跟比它小之間做選擇,此稱「大中取小」。遊戲者偏離此最佳策略只會對自己不利。
  • 卡爾維諾在《如果在冬夜,一個旅人》寫道:「你知道,你能期盼最好的結果是避免最壞的情況。」這個警句充分說明了大中取小策略。

賽局樹(p. 63)

  • 賽局理論的嚴格假設是對象必須完全理性的遊戲者,不會在跳棋遊戲中誤跳,在下棋時落入陷阱。因此一個招式都有對應的招式,因此每種招式演化的結果就像是一棵樹的策略步驟。

賽局表(p. 67)

  • 賽局理論,策略是最要得概念,比一般意義下的策略有更精確的含意。它是指更特定計畫…策略必須周密的預先描述所有的行動,以致你永不需要在某一行動之後再做什麼決定。
  • 例如圈叉OX遊戲,劃x在中央,O就有兩種完整的反應方式,若劃在角落,有哪幾種策略。
  • 這個遊戲可以用表格做對應,形成賽局表,x走啥,O就走啥。

零和賽局(p. 71)

  • Winner takes all.的賽局情況,例如玩家把錢投入罐子,贏家可以取走罐子裡全部的錢。
  • 這種賽局與經濟學內容有明顯的相似之處,例如「零和社會」,意思是有人得就有人失,也就是「天下沒有白吃的午餐」。

大中取小定理(p. 85)

  • 大中取小定理證明,每個有限的零和賽局都存在一個理性解,不是單純策略,就是混和策略。
  • 當兩個利益完全相反地人有定義精確的衝突,其中總存在一種理性解。所謂理性的解就是在既定的衝突本質下,雙方都確信他們不可能有更好的結果了。

n人賽局:

  • 有任意數量的參賽者,這種賽局稱為「n人賽局」,錯綜複雜的利益糾葛衝突,會產生聯盟關係,改變賽局發展方向。

竊賊的信用(P. 138)

  • 兩難困境中最重要的第三個是「不合作的一對」,例子:
  • 假定你偷了知名的「世界之鑽」,想脫手賣掉。你認識潛在買主叫做「大條先生」黑社會大亨,世界最冷酷、殘忍的人,非常聰明,極端狡詐貪婪。你們達成協議,一手交錢一手交貨,大條先生建議在郊外荒蕪的麥田見面交易,這樣就不會有目擊者。你偶然得知,他過去的秘密交易都是在交易時,出槍打死對方,帶著錢貨離去。
  • 知道他的策略,於是你提出雙麥田計畫,大條先生把錢放在州北邊的一塊麥田,你在藏在南邊的麥田。雙方透過電話聯繫,交換如何找到這些藏起來的錢和鑽石。你很圓滑的說服大條先生接受計畫,因為你身上沒鑽石,他是精明的商人,不是殺人狂,沒理由躲在北邊麥田伏擊你。他同意此計畫。
  • 在南邊藏鑽石時,你突然念頭一閃:為何不留著鑽石自己用呢?大條先生到南邊麥田之前,他不可能知道你背信,你會等他電話並把藏寶地點告訴他,假裝啥事也沒發生。那時,你已經到達北邊麥田,拿了錢逃跑了,再也見不到大條先生。
  • 突然腦筋又一閃:大條先生肯定也懷著同樣的鬼胎,他和你一樣聰明,也許還貪婪十倍,他樂於背信,你也絕對鬥不過他。
  • 在這個例子裡,遵守協議,欺騙只會破壞彼此的利益。
  • 就算一般的合法交易也潛藏囚犯困境,付錢買了一批貨物,怎知銷售商會不會拿了預付款就溜走了,他又怎知你會不會止付那張支票。
大條先生遵守 背信
你遵守 順利完成交易 你輸掉鑽石,他拿走鑽石,省下錢
你背信 你拿走錢,賺到鑽石,大條先生損失錢 雙方白忙一場,鑽石仍在你手上,他也沒損失錢

均衡解(p. 141)

  • 所謂均衡解是以馬後炮的方式回顧遊戲,就是以事後知道的結果去推論分析。

塔克的兩難故事(P. 153)

  • 1950年,哈佛大學心理系請塔克演講,為了讓缺乏賽局理論背景知識的心理學的聽眾瞭解賽局理論,塔克設計了「囚犯的兩難」故事,成為廣為人知的理論。
  • 兩個共同犯法的人被警察羈押,雙方都被告知:
    1. 如果一人招,另一人不招,前者可拿到獎金,後者被處以罰金
    2. 如果二人同時招,兩人都處以罰金
    3. 如果二人都不招,兩人都將無罪開釋
  • 衍生版本的故事,犯罪幫派的兩個成員被逮住並羈押,且隔離偵訊,警察承認沒有足夠的證據指控二人罪行,他們打算以較輕的罪名判處二人各一年監禁。同時也許諾,先做出不利同夥證供,將獲得釋放,而他的同伴將被判刑三年監禁。這裡的陷阱是,如果二人都做不利對方證詞,二人都被判刑2年監禁。
  • 這個例子是至少要關一年,除非供出對方不利證詞,對方也如此想,對自己最有利的方式就是供出不利對方的證詞,這樣才有機會不坐牢,如果我供出了,對方沒做,我不用坐牢。最可能產生的情況就是兩人都要坐牢2年。

B拒絕與警方交易 B供出不利A的證詞
A拒絕與警方交易 A1年, B1年 A3年, B0年
A供出不利B的證詞 A0, B3年 A2年, B2年

  • 但這種協商式的偵訊有可能造成問題。例如1990.01.29《洛杉磯時報》就如此寫過兒童謀殺犯哈里斯的死刑判決案:
    1. 搶劫殺人犯案件常有一人以上的犯罪份子,應判決死刑的也不只一人。根據加州大學柏克萊分校法學教授和死刑專家齊默林的說法,對檢方而言:「重要的是觸地得分,達成死刑判決」。
    2. 因此這類案件常出現這樣的競爭:犯人爭先指出同犯,與檢方達成交易,以做出不利同夥的證明換取自己的減刑。
    3. 齊默林說,某些情況,已經永遠分不清楚誰是真正的殺人兇手,是接受寬大處理的人,或接受了死刑裁決的人?

搭霸王車(白搭便車)的故事(p. 165):

  • 個人利益與群體利益的衝突。搭火車逃票,個人得利,長久下來火車可能虧本無法經營。因此逃票的行為,被視為不道德。
  • 滿足恐怖份子、綁架者的要求,會不會鼓勵更多這樣的行為?但這樣的行為卻不會被視為不道德,雖然真正不道德的是綁匪、恐怖份子(OS:因為這些人是邪派)。
  • 「白搭便車的背叛」最常被拿來反對摩爾的烏托邦和馬克思主義的理由。

核武競賽(p. 169)
俄亥俄研究(p. 225)
膽小鬼遊戲(p. 255)–古巴飛彈危機
志願者的兩難困境(p. 261)
圍捕公鹿(p. 284)
不對稱賽局(p. 288):握有不同資源,差異性導致必輸或必贏的局面。

最適者生存
1980年代生物學、社會學成了賽局理論最活躍的應用領域。許多生物之間各種形式的合作和競爭在過去無法解釋,現在賽局理論提供了富有說服力的答案。(p. 301)

穩定策略(p. 302)
合作與文明(p. 326)
美元拍賣(p. 333):陷入無可避免的升級競賽,不升級就損失,唯一解決方式就是一開始就退出比賽。人類行為具備自我回饋的放大效果,幾輪放大後,導致全面衝突。

一報還一報:

賽局理論失靈的地方(p. 351):無法逆向分析,必須一開始就知道喊價的極限,喊價的極限不確定就很難做到。所以在拍賣、地緣政治,賽局理論都派不上用場。
最大數賽局(p. 354)

 
 
 
廣告
本篇發表於 新知學習。將永久鏈結加入書籤。

發表迴響

在下方填入你的資料或按右方圖示以社群網站登入:

WordPress.com Logo

您的留言將使用 WordPress.com 帳號。 登出 / 變更 )

Twitter picture

您的留言將使用 Twitter 帳號。 登出 / 變更 )

Facebook照片

您的留言將使用 Facebook 帳號。 登出 / 變更 )

Google+ photo

您的留言將使用 Google+ 帳號。 登出 / 變更 )

連結到 %s