版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進(jìn)行舉報或認(rèn)領(lǐng)
文檔簡介
1、第七章博弈論實驗7.1博弈論基礎(chǔ)知識7.1.3博弈論與實驗博弈論 實驗博弈由以下三個基本要素構(gòu)成:實驗所要達(dá)到的目的;實驗必備的信息;游戲規(guī)則。7.2完全信息靜態(tài)博弈實驗7.2.1基礎(chǔ)理論占優(yōu)策略:是指不管競爭對手做什么,參與人都是最優(yōu)的策略。納什均衡:給定對手的行為,參與人自身的最優(yōu)選擇。此時,參與人的策略是其他策略的最優(yōu)反映?;旌喜呗约{什均衡:參與人根據(jù)一組選定的概率,在兩種或兩種以上可能的行動中隨機(jī)選擇中得到納什均衡。7.2.2實驗研究7.2.2.1納什均衡與馮.諾依曼-摩根斯坦博弈解實驗假設(shè):開始的階段,人們的行為接近均衡點,然后繼續(xù)尋找更好的均衡點,最后階段,參與人的選擇接近馮.諾依
2、曼-摩根斯坦合作博弈解。參與人之間的社會關(guān)系是影響博弈結(jié)果的重要因素。假設(shè)有兩個被試者PP和ZZ,他們已掌握零和博弈論,同時知道馮.諾依曼-摩根斯坦非零和博弈論,但他們不清楚納什均衡理論。支付矩陣如表所示:納什均衡策略為(2,1)如果允許單邊支付,馮.諾依曼-摩根斯坦的非零和博弈解是策略(1,2)。Merrill報告了100次實驗的結(jié)果,pp得到0.4美元,zz得到0.65美元。如此看來,在現(xiàn)實的討價還價中并沒有達(dá)到納什均衡。1(zz)2(zz)1(pp)-1,21/2,12(pp)0,1/21,-17.2.2.2 囚徒困境博弈實驗 假定有兩個潛在的進(jìn)入新市場者,決定進(jìn)入(E)或者不進(jìn)入(N)
3、。策略組合如圖所示:N (參與人2) E (參與人2)N(參與人1) 800,8000,1000E (參與人1) 1000,0350,350Cooper對此博弈進(jìn)行了實驗,實驗中被試者成對搭配,每個被試者僅碰到其他被試著一次,被試者之間不能討論問題和簽訂協(xié)議。實驗結(jié)果:百分比從第一組5個人匹配的43%下降到最后5個人匹配的20%。可以看出,參與人有合作的傾向,但當(dāng)被試著獲得經(jīng)驗后,結(jié)果接近于納什均衡,即不合作。7.2.2.3含混和策略納什均衡的博弈實驗有兩個純策略納什均衡(R1,C2)和(R2,C1)。還存在一個混合策略納什均衡,納什理論預(yù)測選擇R2或C2的可能性是75%。C1(參與人2)C2
4、(參與人2)R1(參與人1)0, 0200,600R2(參與人1)600,2000,0Cooper等的試驗程序與囚徒困境博弈相同:20個單期博弈中不同參與人相互被匹配,使用策略2的被試者所占比重小于混合策略預(yù)測的百分比。Cooper等調(diào)查了允許無約束事前交流來解決協(xié)助問題的可能性。在允許交流的情況下,選擇策略2的百分比變?yōu)?0%,而被試者中申明未協(xié)調(diào)選擇的比重只有71%。7.2.2.4 n人博弈的實驗n人博弈實驗的目的是為了觀察同一批參與人反復(fù)進(jìn)行同一博弈的結(jié)果。這樣可以使得談判博弈具有合作性。G.Kalisch等做了一組n人博弈實驗。在3人博弈中,被試者被蒙住了眼睛,只能通過手勢向仲裁人示意
5、他們的行動。在4人博弈中,每個被試人都坐在其他人看不到的地方,他將自己的行動寫在紙上。3人博弈規(guī)則如下:1、被試者A要么等待,要么提出一個叫價與被試者B或C其中的一個結(jié)成聯(lián)盟,這一叫價要列明A想得到的在將來聯(lián)盟中的份額dA(整數(shù)),參與人B和C也進(jìn)行同樣的第一步而且三個人要同時和獨立地完成自己的選擇。若兩個被試者(比如說A和B)彼此提出了叫價,且dA+ dB15,則博弈結(jié)束,并且支付如下: A得到 dA, B得到 dB,C得到-(dA+ dB)。若 dA+ dB15,3個人都得到0.若形成一個聯(lián)盟,這次博弈結(jié)束,3個人都得0.若某個被試者(比如說A)第一步選擇等待,且另一個被試者向他提出了一個
6、聯(lián)盟叫價,則他就進(jìn)行第二步,他要么接受要么拒絕。兩種情況下,這一次博弈都結(jié)束。第一種情況下的支付是: A得到 15-dB, B得到 dB, C得到-15.第二種情況下,3個參與人都得0. 實驗結(jié)果表明,被試者選擇等待策略的比重只占了33%,而由一個被試者叫價另一個接受而形成聯(lián)盟的策略出現(xiàn)的比例較高。實驗結(jié)果說明同一批人反復(fù)進(jìn)行同一個博弈有利于形成合作博弈。7.3完全信息動態(tài)博弈實驗7.3.1基礎(chǔ)知識 逆向歸納法:該方法適用于有限次博弈,并且參與人都是理性的,都清楚的知道博弈樹結(jié)構(gòu),參與人首先從博弈樹的末端開始,求解末端的子博弈均衡,然后繼續(xù)向前求解,直至起點。 重復(fù)博弈:同樣結(jié)構(gòu)的博弈重復(fù)多次
7、,或者無數(shù)次,其中的每次博弈稱為“階段博弈”。 特征:A、重復(fù)博弈的階段,博弈之間沒有“物質(zhì)”上的聯(lián)系,即前一個階段博弈并不改變后一個階段的博弈的結(jié)構(gòu); B、在重復(fù)博弈的每一個階段,所有參與人都觀測到該博弈過去的歷史; C、參與人的總收益是所有階段博弈的收益的貼現(xiàn)值之和或加權(quán)平均數(shù)。7.3.2??怂沽_德重復(fù)博弈實驗支付矩陣如圖。合作B背叛B合作A3,30,5背叛A5,01,1第一次實驗:共有15個策略。將每一策略分別和所有策略對弈,每對策略對弈5次,每次200步,但對于參賽者而言,什么時候結(jié)束博弈是未知的。參與人可以選擇一下策略:“一報還一報”:第一回合合作,以后各回合均重復(fù)對方在上一個回合中
8、的策略:對方背叛,自己也背叛,對方合作,自己也合作?!案ダ锏侣呗浴保哼@是一個缺乏寬容的策略。他不首先背叛,但一旦對方背叛,就永遠(yuǎn)選擇背叛?!暗缹幉呗浴保旱谝徊奖撑眩缓竺孔咭徊?,估計自己合作或背叛之后對方合作的概率,如果對方似乎仍然傾向于合作,則選擇背叛,反之,則合作。“喬斯策略”:試圖偶爾背叛而不受懲罰。若對方背叛則馬上背叛,但十次有一次是對方合作之后而背叛。實驗結(jié)果,得分最高的是“一報還一報”策略。“弗里德曼”策略得分最低。??怂沽_德總結(jié)了排名靠前的策略的特點: 善良性,即不做首先的背叛者??杉づ?,即針對對方的背叛行為給與報復(fù) 寬容性,即不能沒完沒了的報復(fù)。第二次實驗:第二次實驗規(guī)模更
9、大,共有來自6個國家63位參賽者,其中包括第一次實驗的所有參賽者。賽前,埃克斯羅德給每位參賽者寄去了關(guān)于第一次比賽的分析報告。每對策略仍對弈5次。實驗結(jié)果是“一報還一報”再次榮獲第一名,并且第二次比賽再次證明第一次比賽的結(jié)論是成立的。第三次實驗:??怂沽_德假設(shè)博弈者所組成的群體是一代一代進(jìn)化下去的。他把個體的得分看作個體的后代期望數(shù),誰在第一輪中的得分高,他在第二輪的群體所占的比例就高。這樣較優(yōu)的策略就能繁衍更多的后代,較差的策略就會被抑制,直至滅絕。結(jié)果,“一報還一報”從第二代開始擴(kuò)大,在整個過程中一直領(lǐng)先。到1000代,“一報還一報”是最成功的策略,并且增長的最快。7.4不完全信息靜態(tài)博弈
10、實驗 在現(xiàn)實情境中,信息往往是不充分的,人們在決策時不能了解所有信息。海薩尼提出了處理不完全信息博弈的方法。即每個參與人的偏好是一個隨機(jī)變量,這個隨機(jī)變量實現(xiàn)的事前概率分布被假設(shè)為所有參與人的共同知識。這就是“海薩尼轉(zhuǎn)換”。 這種參與人不了解其他參與人選擇的完全信息,但卻有其他參與人類型概率分布的完全信息博弈稱為“完全但不完美信息博弈”。7.4.2最后通牒式議價談判博弈實驗 最后通牒式議價談判博弈實驗的一般模式為:博弈雙方就一個定數(shù)c的份額分配進(jìn)行一次討價還價。一方為開價者,他提出的分配方案為給對方x,自己留下c-x。如果被開價者接受方案,則談判達(dá)成一致,否則就破裂。 為了考察非對稱激勵機(jī)制對
11、議價結(jié)果的影響,李竹渝等分別在三天的實驗中設(shè)計了由談判博弈的外部組織者的干預(yù)使得博弈雙方的收益/激勵呈非對稱的3種不同的實驗規(guī)則。第一天的規(guī)則定為博弈雙方如未能達(dá)成一致,除參加試驗的基本支付外,博弈雙方談判破裂的收益都為0。第二天的規(guī)則是在談判破裂時,開價者的沖突點支付上升為8點,而接受者仍為0點。第三天在談判破裂時,開價者的沖突點支付上升為8點,而接受者仍為2點。如接受者接受了開價者的報價,判斷談判達(dá)成一致,接受者將分別獲得開價者分配的x點,而開價者得20-x點。 實驗結(jié)果可以觀察到開價者要求的分配額度集中于12點的有6組,分別分布在三種實驗規(guī)則中。而要求14點的有5組,也分布在三組規(guī)則中,
12、而要求平均分配的發(fā)生在第一第二種規(guī)則中。 Roth等在美國、以色列、日本、前南斯拉夫進(jìn)行了該項實驗,并重復(fù)進(jìn)行了該試驗。 結(jié)果是所有國家參與人都是各取一半。具體為美國和前南斯拉夫各取50%,以色列、日本提議人得60%,后者分取40%。 也就是說公平性在很大程度上影響著分配結(jié)果。7.5不完全信息動態(tài)博弈實驗蜈蚣博弈: 運用逆向歸納法可以得出,參與人A在博弈開始時會直接選擇D,兩人收益都為1.很顯然這種結(jié)果是非帕累托最優(yōu)的。如果AB合作,則雙方都可以獲得高收益。由于A首先選擇R而不是D,在隨后的子博弈中,即使B選擇了D,A僅遭受1單位損失,但是如果B選擇r,則A的收益永遠(yuǎn)不會小于1,而且很有可能獲得相當(dāng)可觀的收益。但是B究竟是一位合作者還是短期利益至上者,只有B自己知道。因此,B具有完全信息,而A不具有。 后行動者能夠觀察到先行動者的行為,但不知道先行動者的類型。因為參與人的行動是互相依存的,先行動者可以設(shè)法對后行動者傳遞對自己最有利的信息,后者可以選擇自己的最優(yōu)行為。所以動態(tài)博弈過程不僅是參與人選擇行動的過程,而
溫馨提示
- 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
- 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
- 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
- 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負(fù)責(zé)。
- 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請與我們聯(lián)系,我們立即糾正。
- 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時也不承擔(dān)用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。
最新文檔
- 2024物業(yè)管理合同范本:物業(yè)消防安全管理與應(yīng)急處理合同3篇
- 2024甲方委托乙方進(jìn)行人工智能機(jī)器人研發(fā)的合同
- 2024珠寶首飾設(shè)計與定制合同
- 外墻巖棉板巖棉板一方安全操作規(guī)程
- 二零二五年度版權(quán)購買合同:影視作品全球發(fā)行權(quán)2篇
- 潼南石紋鋁扣板施工方案
- 富可興精密磨床安全操作規(guī)程
- 2025年滬科版九年級化學(xué)下冊階段測試試卷
- 結(jié)構(gòu)設(shè)計原理課程設(shè)計模板
- 2024版辦公室門鎖更換及維護(hù)協(xié)議版B版
- 船舶維修搶修方案
- 九年級初三中考物理綜合復(fù)習(xí)測試卷3套(含答案)
- (正式版)JTT 1218.5-2024 城市軌道交通運營設(shè)備維修與更新技術(shù)規(guī)范 第5部分:通信
- 2023年人教版五年級上冊語文期末考試題(加答案)
- 新中國史智慧樹知到期末考試答案2024年
- 基于物聯(lián)網(wǎng)的智能衣柜
- 設(shè)備的故障管理
- 2024年計算機(jī)二級ms備考試題庫400題(含答案)
- 蘇教版三年級上冊解決問題的策略應(yīng)用題100題及答案
- 連云港市2023-2024學(xué)年九年級上學(xué)期期末道德與法治試卷(含答案解析)
- 技術(shù)研發(fā)項目預(yù)算報告
評論
0/150
提交評論