




版權(quán)說(shuō)明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請(qǐng)進(jìn)行舉報(bào)或認(rèn)領(lǐng)
文檔簡(jiǎn)介
1、第七章博弈論實(shí)驗(yàn)7.1博弈論基礎(chǔ)知識(shí)7.1.3博弈論與實(shí)驗(yàn)博弈論 實(shí)驗(yàn)博弈由以下三個(gè)基本要素構(gòu)成:實(shí)驗(yàn)所要達(dá)到的目的;實(shí)驗(yàn)必備的信息;游戲規(guī)則。7.2完全信息靜態(tài)博弈實(shí)驗(yàn)7.2.1基礎(chǔ)理論占優(yōu)策略:是指不管競(jìng)爭(zhēng)對(duì)手做什么,參與人都是最優(yōu)的策略。納什均衡:給定對(duì)手的行為,參與人自身的最優(yōu)選擇。此時(shí),參與人的策略是其他策略的最優(yōu)反映。混合策略納什均衡:參與人根據(jù)一組選定的概率,在兩種或兩種以上可能的行動(dòng)中隨機(jī)選擇中得到納什均衡。7.2.2實(shí)驗(yàn)研究7.2.2.1納什均衡與馮.諾依曼-摩根斯坦博弈解實(shí)驗(yàn)假設(shè):開(kāi)始的階段,人們的行為接近均衡點(diǎn),然后繼續(xù)尋找更好的均衡點(diǎn),最后階段,參與人的選擇接近馮.諾依
2、曼-摩根斯坦合作博弈解。參與人之間的社會(huì)關(guān)系是影響博弈結(jié)果的重要因素。假設(shè)有兩個(gè)被試者PP和ZZ,他們已掌握零和博弈論,同時(shí)知道馮.諾依曼-摩根斯坦非零和博弈論,但他們不清楚納什均衡理論。支付矩陣如表所示:納什均衡策略為(2,1)如果允許單邊支付,馮.諾依曼-摩根斯坦的非零和博弈解是策略(1,2)。Merrill報(bào)告了100次實(shí)驗(yàn)的結(jié)果,pp得到0.4美元,zz得到0.65美元。如此看來(lái),在現(xiàn)實(shí)的討價(jià)還價(jià)中并沒(méi)有達(dá)到納什均衡。1(zz)2(zz)1(pp)-1,21/2,12(pp)0,1/21,-17.2.2.2 囚徒困境博弈實(shí)驗(yàn) 假定有兩個(gè)潛在的進(jìn)入新市場(chǎng)者,決定進(jìn)入(E)或者不進(jìn)入(N)
3、。策略組合如圖所示:N (參與人2) E (參與人2)N(參與人1) 800,8000,1000E (參與人1) 1000,0350,350Cooper對(duì)此博弈進(jìn)行了實(shí)驗(yàn),實(shí)驗(yàn)中被試者成對(duì)搭配,每個(gè)被試者僅碰到其他被試著一次,被試者之間不能討論問(wèn)題和簽訂協(xié)議。實(shí)驗(yàn)結(jié)果:百分比從第一組5個(gè)人匹配的43%下降到最后5個(gè)人匹配的20%??梢钥闯觯瑓⑴c人有合作的傾向,但當(dāng)被試著獲得經(jīng)驗(yàn)后,結(jié)果接近于納什均衡,即不合作。7.2.2.3含混和策略納什均衡的博弈實(shí)驗(yàn)有兩個(gè)純策略納什均衡(R1,C2)和(R2,C1)。還存在一個(gè)混合策略納什均衡,納什理論預(yù)測(cè)選擇R2或C2的可能性是75%。C1(參與人2)C2
4、(參與人2)R1(參與人1)0, 0200,600R2(參與人1)600,2000,0Cooper等的試驗(yàn)程序與囚徒困境博弈相同:20個(gè)單期博弈中不同參與人相互被匹配,使用策略2的被試者所占比重小于混合策略預(yù)測(cè)的百分比。Cooper等調(diào)查了允許無(wú)約束事前交流來(lái)解決協(xié)助問(wèn)題的可能性。在允許交流的情況下,選擇策略2的百分比變?yōu)?0%,而被試者中申明未協(xié)調(diào)選擇的比重只有71%。7.2.2.4 n人博弈的實(shí)驗(yàn)n人博弈實(shí)驗(yàn)的目的是為了觀察同一批參與人反復(fù)進(jìn)行同一博弈的結(jié)果。這樣可以使得談判博弈具有合作性。G.Kalisch等做了一組n人博弈實(shí)驗(yàn)。在3人博弈中,被試者被蒙住了眼睛,只能通過(guò)手勢(shì)向仲裁人示意
5、他們的行動(dòng)。在4人博弈中,每個(gè)被試人都坐在其他人看不到的地方,他將自己的行動(dòng)寫在紙上。3人博弈規(guī)則如下:1、被試者A要么等待,要么提出一個(gè)叫價(jià)與被試者B或C其中的一個(gè)結(jié)成聯(lián)盟,這一叫價(jià)要列明A想得到的在將來(lái)聯(lián)盟中的份額dA(整數(shù)),參與人B和C也進(jìn)行同樣的第一步而且三個(gè)人要同時(shí)和獨(dú)立地完成自己的選擇。若兩個(gè)被試者(比如說(shuō)A和B)彼此提出了叫價(jià),且dA+ dB15,則博弈結(jié)束,并且支付如下: A得到 dA, B得到 dB,C得到-(dA+ dB)。若 dA+ dB15,3個(gè)人都得到0.若形成一個(gè)聯(lián)盟,這次博弈結(jié)束,3個(gè)人都得0.若某個(gè)被試者(比如說(shuō)A)第一步選擇等待,且另一個(gè)被試者向他提出了一個(gè)
6、聯(lián)盟叫價(jià),則他就進(jìn)行第二步,他要么接受要么拒絕。兩種情況下,這一次博弈都結(jié)束。第一種情況下的支付是: A得到 15-dB, B得到 dB, C得到-15.第二種情況下,3個(gè)參與人都得0. 實(shí)驗(yàn)結(jié)果表明,被試者選擇等待策略的比重只占了33%,而由一個(gè)被試者叫價(jià)另一個(gè)接受而形成聯(lián)盟的策略出現(xiàn)的比例較高。實(shí)驗(yàn)結(jié)果說(shuō)明同一批人反復(fù)進(jìn)行同一個(gè)博弈有利于形成合作博弈。7.3完全信息動(dòng)態(tài)博弈實(shí)驗(yàn)7.3.1基礎(chǔ)知識(shí) 逆向歸納法:該方法適用于有限次博弈,并且參與人都是理性的,都清楚的知道博弈樹(shù)結(jié)構(gòu),參與人首先從博弈樹(shù)的末端開(kāi)始,求解末端的子博弈均衡,然后繼續(xù)向前求解,直至起點(diǎn)。 重復(fù)博弈:同樣結(jié)構(gòu)的博弈重復(fù)多次
7、,或者無(wú)數(shù)次,其中的每次博弈稱為“階段博弈”。 特征:A、重復(fù)博弈的階段,博弈之間沒(méi)有“物質(zhì)”上的聯(lián)系,即前一個(gè)階段博弈并不改變后一個(gè)階段的博弈的結(jié)構(gòu); B、在重復(fù)博弈的每一個(gè)階段,所有參與人都觀測(cè)到該博弈過(guò)去的歷史; C、參與人的總收益是所有階段博弈的收益的貼現(xiàn)值之和或加權(quán)平均數(shù)。7.3.2??怂沽_德重復(fù)博弈實(shí)驗(yàn)支付矩陣如圖。合作B背叛B合作A3,30,5背叛A5,01,1第一次實(shí)驗(yàn):共有15個(gè)策略。將每一策略分別和所有策略對(duì)弈,每對(duì)策略對(duì)弈5次,每次200步,但對(duì)于參賽者而言,什么時(shí)候結(jié)束博弈是未知的。參與人可以選擇一下策略:“一報(bào)還一報(bào)”:第一回合合作,以后各回合均重復(fù)對(duì)方在上一個(gè)回合中
8、的策略:對(duì)方背叛,自己也背叛,對(duì)方合作,自己也合作?!案ダ锏侣呗浴保哼@是一個(gè)缺乏寬容的策略。他不首先背叛,但一旦對(duì)方背叛,就永遠(yuǎn)選擇背叛。“道寧策略”:第一步背叛,然后每走一步,估計(jì)自己合作或背叛之后對(duì)方合作的概率,如果對(duì)方似乎仍然傾向于合作,則選擇背叛,反之,則合作?!皢趟共呗浴保涸噲D偶爾背叛而不受懲罰。若對(duì)方背叛則馬上背叛,但十次有一次是對(duì)方合作之后而背叛。實(shí)驗(yàn)結(jié)果,得分最高的是“一報(bào)還一報(bào)”策略?!案ダ锏侣辈呗缘梅肿畹汀0?怂沽_德總結(jié)了排名靠前的策略的特點(diǎn): 善良性,即不做首先的背叛者。可激怒性,即針對(duì)對(duì)方的背叛行為給與報(bào)復(fù) 寬容性,即不能沒(méi)完沒(méi)了的報(bào)復(fù)。第二次實(shí)驗(yàn):第二次實(shí)驗(yàn)規(guī)模更
9、大,共有來(lái)自6個(gè)國(guó)家63位參賽者,其中包括第一次實(shí)驗(yàn)的所有參賽者。賽前,??怂沽_德給每位參賽者寄去了關(guān)于第一次比賽的分析報(bào)告。每對(duì)策略仍對(duì)弈5次。實(shí)驗(yàn)結(jié)果是“一報(bào)還一報(bào)”再次榮獲第一名,并且第二次比賽再次證明第一次比賽的結(jié)論是成立的。第三次實(shí)驗(yàn):埃克斯羅德假設(shè)博弈者所組成的群體是一代一代進(jìn)化下去的。他把個(gè)體的得分看作個(gè)體的后代期望數(shù),誰(shuí)在第一輪中的得分高,他在第二輪的群體所占的比例就高。這樣較優(yōu)的策略就能繁衍更多的后代,較差的策略就會(huì)被抑制,直至滅絕。結(jié)果,“一報(bào)還一報(bào)”從第二代開(kāi)始擴(kuò)大,在整個(gè)過(guò)程中一直領(lǐng)先。到1000代,“一報(bào)還一報(bào)”是最成功的策略,并且增長(zhǎng)的最快。7.4不完全信息靜態(tài)博弈
10、實(shí)驗(yàn) 在現(xiàn)實(shí)情境中,信息往往是不充分的,人們?cè)跊Q策時(shí)不能了解所有信息。海薩尼提出了處理不完全信息博弈的方法。即每個(gè)參與人的偏好是一個(gè)隨機(jī)變量,這個(gè)隨機(jī)變量實(shí)現(xiàn)的事前概率分布被假設(shè)為所有參與人的共同知識(shí)。這就是“海薩尼轉(zhuǎn)換”。 這種參與人不了解其他參與人選擇的完全信息,但卻有其他參與人類型概率分布的完全信息博弈稱為“完全但不完美信息博弈”。7.4.2最后通牒式議價(jià)談判博弈實(shí)驗(yàn) 最后通牒式議價(jià)談判博弈實(shí)驗(yàn)的一般模式為:博弈雙方就一個(gè)定數(shù)c的份額分配進(jìn)行一次討價(jià)還價(jià)。一方為開(kāi)價(jià)者,他提出的分配方案為給對(duì)方x,自己留下c-x。如果被開(kāi)價(jià)者接受方案,則談判達(dá)成一致,否則就破裂。 為了考察非對(duì)稱激勵(lì)機(jī)制對(duì)
11、議價(jià)結(jié)果的影響,李竹渝等分別在三天的實(shí)驗(yàn)中設(shè)計(jì)了由談判博弈的外部組織者的干預(yù)使得博弈雙方的收益/激勵(lì)呈非對(duì)稱的3種不同的實(shí)驗(yàn)規(guī)則。第一天的規(guī)則定為博弈雙方如未能達(dá)成一致,除參加試驗(yàn)的基本支付外,博弈雙方談判破裂的收益都為0。第二天的規(guī)則是在談判破裂時(shí),開(kāi)價(jià)者的沖突點(diǎn)支付上升為8點(diǎn),而接受者仍為0點(diǎn)。第三天在談判破裂時(shí),開(kāi)價(jià)者的沖突點(diǎn)支付上升為8點(diǎn),而接受者仍為2點(diǎn)。如接受者接受了開(kāi)價(jià)者的報(bào)價(jià),判斷談判達(dá)成一致,接受者將分別獲得開(kāi)價(jià)者分配的x點(diǎn),而開(kāi)價(jià)者得20-x點(diǎn)。 實(shí)驗(yàn)結(jié)果可以觀察到開(kāi)價(jià)者要求的分配額度集中于12點(diǎn)的有6組,分別分布在三種實(shí)驗(yàn)規(guī)則中。而要求14點(diǎn)的有5組,也分布在三組規(guī)則中,
12、而要求平均分配的發(fā)生在第一第二種規(guī)則中。 Roth等在美國(guó)、以色列、日本、前南斯拉夫進(jìn)行了該項(xiàng)實(shí)驗(yàn),并重復(fù)進(jìn)行了該試驗(yàn)。 結(jié)果是所有國(guó)家參與人都是各取一半。具體為美國(guó)和前南斯拉夫各取50%,以色列、日本提議人得60%,后者分取40%。 也就是說(shuō)公平性在很大程度上影響著分配結(jié)果。7.5不完全信息動(dòng)態(tài)博弈實(shí)驗(yàn)蜈蚣博弈: 運(yùn)用逆向歸納法可以得出,參與人A在博弈開(kāi)始時(shí)會(huì)直接選擇D,兩人收益都為1.很顯然這種結(jié)果是非帕累托最優(yōu)的。如果AB合作,則雙方都可以獲得高收益。由于A首先選擇R而不是D,在隨后的子博弈中,即使B選擇了D,A僅遭受1單位損失,但是如果B選擇r,則A的收益永遠(yuǎn)不會(huì)小于1,而且很有可能獲得相當(dāng)可觀的收益。但是B究竟是一位合作者還是短期利益至上者,只有B自己知道。因此,B具有完全信息,而A不具有。 后行動(dòng)者能夠觀察到先行動(dòng)者的行為,但不知道先行動(dòng)者的類型。因?yàn)閰⑴c人的行動(dòng)是互相依存的,先行動(dòng)者可以設(shè)法對(duì)后行動(dòng)者傳遞對(duì)自己最有利的信息,后者可以選擇自己的最優(yōu)行為。所以動(dòng)態(tài)博弈過(guò)程不僅是參與人選擇行動(dòng)的過(guò)程,而
溫馨提示
- 1. 本站所有資源如無(wú)特殊說(shuō)明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請(qǐng)下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請(qǐng)聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
- 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁(yè)內(nèi)容里面會(huì)有圖紙預(yù)覽,若沒(méi)有圖紙預(yù)覽就沒(méi)有圖紙。
- 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
- 5. 人人文庫(kù)網(wǎng)僅提供信息存儲(chǔ)空間,僅對(duì)用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對(duì)用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對(duì)任何下載內(nèi)容負(fù)責(zé)。
- 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請(qǐng)與我們聯(lián)系,我們立即糾正。
- 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶因使用這些下載資源對(duì)自己和他人造成任何形式的傷害或損失。
最新文檔
- 高三模擬考試數(shù)學(xué)理試題
- 小學(xué)生邊塞詩(shī)講解課件
- 22 必修2 第四單元 第19講 基因的自由組合定律及應(yīng)用
- 商業(yè)店鋪?zhàn)赓U與裝修設(shè)計(jì)轉(zhuǎn)讓合同
- 車輛贈(zèng)與及新能源汽車技術(shù)共享合同
- 識(shí)字1教學(xué)課件
- 2024-2025學(xué)年安徽省江南十校高一下學(xué)期5月份聯(lián)考政治試題及答案
- 租賃設(shè)備租賃期間的客戶技術(shù)支持滿意度調(diào)查考核試卷
- 職業(yè)壓力與心理健康研究考核試卷
- 鞋類企業(yè)企業(yè)文化與員工心理健康支持的實(shí)踐探索考核試卷
- 2025至2030中國(guó)糠酸行業(yè)發(fā)展趨勢(shì)分析與未來(lái)投資戰(zhàn)略咨詢研究報(bào)告
- 江西省上饒市廣信區(qū)2023-2024學(xué)年七年級(jí)下學(xué)期6月期末考試數(shù)學(xué)試卷(含答案)
- 糖尿病病人胰島素治療講課件
- 高壓氣體絕緣設(shè)備中SF6分解產(chǎn)物檢測(cè)SO2傳感器的設(shè)計(jì)與應(yīng)用
- poct科室管理制度
- 溝通與表達(dá)講課件
- 2025年山東高考化學(xué)真題及答案
- 2025-2030年中國(guó)魚(yú)膠原蛋白肽行業(yè)市場(chǎng)現(xiàn)狀供需分析及投資評(píng)估規(guī)劃分析研究報(bào)告
- 0號(hào)柴油安全技術(shù)說(shuō)明書(shū)SDS
- GA/T 1454-2018信息安全技術(shù)網(wǎng)絡(luò)型流量控制產(chǎn)品安全技術(shù)要求
- 《體操—隊(duì)形隊(duì)列》單元教學(xué)計(jì)劃和教案
評(píng)論
0/150
提交評(píng)論