博弈論經(jīng)典例子(13)重復(fù)囚徒困境的游戲_第1頁
博弈論經(jīng)典例子(13)重復(fù)囚徒困境的游戲_第2頁
博弈論經(jīng)典例子(13)重復(fù)囚徒困境的游戲_第3頁
博弈論經(jīng)典例子(13)重復(fù)囚徒困境的游戲_第4頁
免費(fèi)預(yù)覽已結(jié)束,剩余1頁可下載查看

下載本文檔

版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請(qǐng)進(jìn)行舉報(bào)或認(rèn)領(lǐng)

文檔簡(jiǎn)介

1、重復(fù)囚徒困境的游戲其目的就是要研究在無限次數(shù)的對(duì)局游戲中人為什么要合作,人什么時(shí)候是合作的,什 么時(shí)候又是不合作的,如何使別人與你合作。位美國(guó)科學(xué)院院士、著名的行為分析和國(guó)際關(guān)系專家羅伯符艾克斯羅德 搞了一場(chǎng)關(guān)于“重復(fù)囚徒困境"的游戲,艾克斯羅德的游戲思路非常簡(jiǎn)單,任何想 參加這個(gè)計(jì)算機(jī)競(jìng)賽的人都扮演“囚徒困境”案例中一個(gè)囚犯的角色,他們把自 己的策略編入到計(jì)算機(jī)程序中,然后他們的程序會(huì)被成雙成對(duì)地融入到不同的組 合,在分好組以后,參與者就開始玩“囚徒困境”的游戲。在游戲中,有兩個(gè)對(duì)策 者,他們可以有兩個(gè)選擇:合作或背叛,每個(gè)人都必須在不知道對(duì)方選擇的情況 下,做出自己的選擇。艾克斯

2、羅德邀請(qǐng)了來自經(jīng)濟(jì)界,心理學(xué),補(bǔ)會(huì)學(xué)、政治學(xué)和數(shù)學(xué)領(lǐng)域的14 位專家參與這一游戲,每個(gè)參加者每一步都要寫出個(gè)體選擇合作或不合作的程序, 這個(gè)程序在作選擇時(shí)可以利用對(duì)局的歷史情況來分析,從而決定自己的策略。游戲雙方的選擇,放在一起就產(chǎn)生了四種可能的結(jié)果,即1.合作.合作;2.合作,背叛;3.背叛,合作;4.背叛,背叛;在這個(gè)游戲中,如果雙方選擇合作,雙方都能得到較好的結(jié)果,即“對(duì)雙方合 作的獎(jiǎng)勵(lì)”為3分,如果一個(gè)合作而另一方背叛,那么,背叛者因?yàn)檎剂吮阋耍?所以得到“對(duì)背叛投機(jī)"的5分,而合作者因?yàn)楸粚?duì)方占了便宜.只能得到O分。 如果雙方都背叛,那么雙方既沒有得到利益,也沒有失去什么,

3、雙方都得1分。我們?cè)O(shè)想甲、乙兩個(gè)程序在一起博弈,就出現(xiàn)這樣的結(jié)果:甲:合作 乙:合作甲:合作(O) 乙:背叛(5)甲:背叛(5)乙:合作(0)甲:背叛乙:背叛(1)就這種情形來看,對(duì)雙方最好的結(jié)果是選擇合作,總體得6分,如果一方選 擇合作,一方選不合作,總體得5分,如果兩個(gè)人都不合作,總體得2分。競(jìng)賽是循環(huán)進(jìn)行的,即每一個(gè)參賽程序都與其他程序相遇,按照事先約定 的競(jìng)賽規(guī)則,每一個(gè)參賽程序還要與自己對(duì)局,以及和一個(gè)隨機(jī)程序?qū)?所謂 隨機(jī)程序是以相等的概率50%隨機(jī)選擇合作或背叛;艾克斯羅德要求每個(gè)參賽者把追求得分最多的策略寫成計(jì)算機(jī)程序,然后用 單循環(huán)賽的方式將參賽程序兩兩對(duì)局,以找出什么樣的

4、策略得分最高。14個(gè)程序再加上一個(gè)“隨機(jī)程序“彼此開始了第一輪游戲,讓我們來分析一 下這個(gè)重復(fù)囚徒困境的游戲,雖然對(duì)個(gè)體而言最大的利益是得5分,但是如果對(duì) 局在多人間進(jìn)行,而且次數(shù)未知,對(duì)策者就會(huì)意識(shí)到,當(dāng)持續(xù)地采取合作并達(dá)成 默契是,對(duì)策者就能持續(xù)的得3分,這是一個(gè)相對(duì)理想的結(jié)果但如果持續(xù)不合 作的話,每個(gè)人就永遠(yuǎn)得一分,因此,對(duì)每個(gè)參賽者而言,不可能得到高分,這 樣,合作成為了這個(gè)游戲的優(yōu)勢(shì)策略。在這個(gè)游戲中,參賽者提出了各種程序,根據(jù)程序的本意大致可分為善良的, 邪惡的和隨意的三類,所謂善良即以合作為主導(dǎo)的策略,邪惡即以背叛占便宜的 為主的策略。最后勝出的是一個(gè)稱為“一報(bào)還一報(bào)”的策略,

5、它是所有提交程序中最簡(jiǎn)單, 結(jié)果卻是最好的,這個(gè)策略的特點(diǎn)是,第一次對(duì)局采用合作的策略,以后每一步 都跟隨對(duì)方上一步的策略,你上一次合作,我這一次就合作,你上一次不合作, 我這一次就不合作。假設(shè)某人的策略是:第一次合作,以后只要對(duì)方不合作一次,他就永遠(yuǎn)不合 作。對(duì)這種對(duì)策者,當(dāng)然合作下去是上策。假如有的人不管對(duì)方采取什么策略, 他總是合作,那么總是對(duì)他采取不合作的策略得分最多,對(duì)于總是不合作的人, 也只能采取不合作的策略。為什么一報(bào)還一報(bào)這樣簡(jiǎn)單的策略會(huì)打敗其他學(xué)者絞盡腦汁寫出來的復(fù)雜 程序呢?讓我們?cè)賮矸此家幌拢粓?bào)還一報(bào)穩(wěn)定成功的原因,簡(jiǎn)單的說,這個(gè)以其人 之道還治其人之身的策略有著四個(gè)特

6、點(diǎn)。-I 清晰性,以牙還牙,以眼還眼,以合作還合作,以背叛還背叛.使他 容易被對(duì)方理解,從而引出長(zhǎng)期合作的關(guān)系。二, 善良性,這種策略一開始便以善意和對(duì)方合作,也絕不會(huì)先背叛對(duì)方, 這可防止它陷入不必要的麻煩。三, 報(bào)復(fù)性,如果對(duì)方背叛,下一次一定如法炮制,自動(dòng)報(bào)復(fù)對(duì)面絕不 原諒,報(bào)復(fù)性使得對(duì)方試著背叛一次后就不敢背叛。四, 寬容性,如果對(duì)方又主動(dòng)恢復(fù)合作,要立刻與對(duì)方握手言歡,既往不 咎,有肋于重新恢復(fù)合作。報(bào)還一報(bào),策略是有關(guān)囚徒困境的最著名的也是被討論最多的策略,它非 常容易理解也非常容易被編成程序,更因?yàn)檫@個(gè)策略能引發(fā)人們的合作關(guān)系而著 名。報(bào)還一報(bào)的成功可以說明它是一個(gè)很具適應(yīng)性的規(guī)

7、則,即它在很大范圍內(nèi)表現(xiàn)極佳。有趣的足,“一報(bào)還報(bào)”這個(gè)策略與單獨(dú)某個(gè)策略相遇時(shí),沒有一次是贏 了對(duì)方的,頂多是和對(duì)方打成平手?!耙粓?bào)還一報(bào)”策略從來沒有一次在競(jìng)賽 中比對(duì)方得更多的分!它總是讓對(duì)方先背叛.而它自己背叛次數(shù)也絕不比對(duì) 方多,它的得分往往比對(duì)方少,至多與對(duì)方相等。但是,打與多樣化的對(duì)手 分別比賽之后,最后加起來的,它的總分仍然有可能是最高的;今天如果 比賽的規(guī)則改變了,在單獨(dú)比賽贏的人將得到所有的分?jǐn)?shù)輸?shù)臑榱惴?。?么,“一報(bào)還一報(bào)”可能就沒機(jī)會(huì)坐上冠軍的寶座了。報(bào)還一報(bào)的成功部分是由于其他規(guī)則預(yù)料到它的存在并被設(shè)計(jì)得與 它很好相處。要和“一報(bào)還一報(bào)"很好的相處就要求和

8、它合作,這反過來就幫 助了“一報(bào)還一報(bào)"規(guī)則,即使,是那些想伺機(jī)占便宜而不被懲罰的規(guī)則,也 很快向“一報(bào)還一報(bào)"規(guī)則道歉。任何想占“一報(bào)還一報(bào)”便宜的規(guī)則最終傷害自己,“一報(bào)還一報(bào)”從自己 的不可欺負(fù)性中得到好處.這是因?yàn)橛龅健耙粓?bào)還一報(bào)"很容易被識(shí)別出來, 一旦被識(shí)別出來,其不可欺負(fù)性就顯示出來了,因此,一報(bào)還一報(bào)從它自己 的清晰性中得到好處。報(bào)還一報(bào)這個(gè)策略放棄了占他人便宜的可能性,盡管這種機(jī)會(huì)有時(shí)是 很有利可圖的,但是在廣泛的環(huán)境中,試圖占便宜而引來的問題也多種多樣。在與一報(bào)還一報(bào)的策略的接觸中,如果一個(gè)規(guī)則用背叛試探是否可以占 便宜,它就得被那些可激怒的規(guī)

9、則報(bào)復(fù)的風(fēng)險(xiǎn),如果雙方反擊一旦開始.就 很難使自己解脫。最后,試圖識(shí)別那些“隨機(jī)規(guī)則”或者那些過分不合作的規(guī)則,放棄與他們合作的努力,經(jīng)常錯(cuò)誤地導(dǎo)致放棄與其他一些規(guī)則的合作,而這些規(guī)則是可以被有耐心的規(guī)則,比如一報(bào)還一報(bào)這種規(guī)則挽救的。當(dāng)然,我們知道就有限的次數(shù)與對(duì)局者而言,“一報(bào)還一報(bào)”并不是最優(yōu) 策略,但卻是整體得分最多的策略,它的成功在于它良好的適應(yīng)性。由于一個(gè)特定的策略的有效性不僅取決于它自己的特性,而且取決于它 要相遇的其他策略的特性,因此,單一競(jìng)賽的結(jié)果是不能最后說明問題的。當(dāng)?shù)谝惠喌谋荣惤Y(jié)束后,第一次的結(jié)果被公布,并決定邀請(qǐng)更多的人再 做一次游戲,第二次征集到了 62個(gè)程序,加上自己的隨機(jī)程序,又進(jìn)行了 一次比賽。第二次的比賽有了更高的起點(diǎn),因?yàn)槊總€(gè)策略都已經(jīng)從第一次的 比賽中獲取了經(jīng)驗(yàn),因此人們更期望它的結(jié)果對(duì)指導(dǎo)下一輪的成功更有幫助。令人意外的是,第二輪勝出的仍然是一報(bào)還一報(bào),但與第一輪不同的是, 這一輪比賽由于絕大部分人都知道了一報(bào)還一報(bào)勝出的事實(shí),最有趣而令人 驚奇的是,許多人在一報(bào)還一報(bào)的原則上試圖改進(jìn)它,不過,更令人驚奇的 是這些提交的復(fù)雜程序

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請(qǐng)下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請(qǐng)聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會(huì)有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫(kù)網(wǎng)僅提供信息存儲(chǔ)空間,僅對(duì)用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對(duì)用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對(duì)任何下載內(nèi)容負(fù)責(zé)。
  • 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請(qǐng)與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶因使用這些下載資源對(duì)自己和他人造成任何形式的傷害或損失。

評(píng)論

0/150

提交評(píng)論