




版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進(jìn)行舉報(bào)或認(rèn)領(lǐng)
文檔簡介
1、第7章不完全信息與聲譽(yù),張維迎 教授 北京大學(xué)光華管理學(xué)院,有限次博弈,第6章證明,只要未來足夠重要,合作行為可以是無限次重復(fù)博弈的精煉納什均衡。 但是,現(xiàn)實(shí)中許多博弈是有限次的,不是無限次的。 如果博弈重復(fù)的次數(shù)是有限的,無論重復(fù)多少次,合作都不會出現(xiàn)。,“連鎖店悖論”(chain-store paradox),Selten (1978);,進(jìn)入者,在位者,進(jìn)入,不進(jìn)入,默許,斗爭,(40,50),(-10,0),(0,100),逆向歸納,假定在位者有20個(gè)市場。直觀告訴我們,如果進(jìn)入者在第一個(gè)市場進(jìn)入,在位者應(yīng)該選擇斗爭,因?yàn)楸M管從一個(gè)市場看,斗爭是不值得的,但這樣做可以遏止進(jìn)入者在其他市
2、場上的進(jìn)入。 唯一的精煉納什均衡是:進(jìn)入者總是進(jìn)入;在位者總是默許。,Axelrod 實(shí)驗(yàn),Axelrod(1981)實(shí)驗(yàn)表明:即使在有限次博弈中,合作行為也頻繁出現(xiàn)。,問題在哪里?,一個(gè)可能的原因在于:我們前面假定不僅參與人的理性是共同知識,而且每個(gè)參與人可以選擇的戰(zhàn)略和效用函數(shù)都是共同知識。但現(xiàn)實(shí)不是這樣。 可能性:逆向歸納方法的問題(理性共識);信息不完全; 正如我們前面討論的談判情況:如果信息是完全的,談判一開始就達(dá)成協(xié)議,但現(xiàn)實(shí)中的談判不是這樣,原因在于信息不對稱。,不完全信息,KMRW模型(1982); 如果參與人對其他參與人的效用函數(shù)和戰(zhàn)略空間的信息不完全,即使博弈重復(fù)的次數(shù)是有
3、限的,人們也有積極性建立一個(gè)合作的聲譽(yù)(reputation),合作會出現(xiàn)。,單方不完全信息,假定有兩個(gè)參與人,A和B,進(jìn)行囚徒困境博弈。如下圖。 參與人A有兩中可能的類型:“非理性”型:只有一種戰(zhàn)略,tit-for-tat (TFT),或者grim strategy, 概率為p; “理性”型:可以選擇任何戰(zhàn)略,概率為(1-p); 參與人B有一種類型:理性型。,對“非理性”的解釋,特殊的成本函數(shù)或效用函數(shù); 講義氣、重情誼的人;內(nèi)在化了 reciprocity 社會規(guī)范的人; 認(rèn)知問題;,囚徒困境博弈,合作,背叛,合作,背叛,3,3,-1,4,4,-1,0,0,A,B,博弈重復(fù)兩次,t=1,t
4、=2,A,非理性(p),理性型(1-p),B (理性型),合作,X,背叛,背叛,X,背叛,第2階段,參與人A:如果是理性的,選擇“背叛”;如果是非理性的,選擇B在第1階段的行動(dòng)(X); 參與人B:選擇“背叛”。,第1階段,參與人A:如果是非理性的,選擇“合作”;如果是理性的,選擇“背叛”; 參與人B:如果選擇合作,面臨被背叛的風(fēng)險(xiǎn),但如果A是非理性的,可以換來第2階段的合作。,B在第2階段的選擇,選擇合作,期望效用是: 3p+(-1)(1-p)+4p+0(1-p)=8p-1 如果選擇背叛,期望效用函數(shù)是: 4p+0(1-p)+0=4p 最優(yōu)選擇是合作,如果:p=0.25; 結(jié)論:如果B認(rèn)為A非
5、理性的概率不小于0.25, B在第1階段會選擇合作,即使博弈只重復(fù)兩次。,博弈重復(fù)3次,t=1,t=2,A,非理性(p),理性型(1-p),B (理性型),合作,X,?,背叛,X,X,t=3,X,背叛,背叛,參與人A(理性)的選擇,如果A是理性的,在第2階段和第3階段一定會選擇背叛,但第1階段也可能選擇合作,因?yàn)榻⒁粋€(gè)合作的形象可以換取B在第2階段的合作; 如果p=0.25, 并且A認(rèn)為B在第1階段會合作,給定A在第2階段合作的話B在在第2階段也會合作,那么A選擇合作得到:3+4+0=5; 如果A選擇背叛,得到:4+0+0=4; 所以合作是最優(yōu)的。,參與人B的選擇,B有四種戰(zhàn)略: (合作,合
6、作,背叛); (合作,背叛,背叛); (背叛,背叛,背叛); (背叛,合作,背叛),(合作,合作,背叛),t=1,t=2,A,非理性(p),理性型(1-p),B (理性型),合作,X=合作,合作,背叛,X=合作,X=合作,t=3,X=合作,背叛,背叛,3+ 3p+(-1)(1-p)+ 4p+0=8p+2,預(yù)期效用=,(合作,背叛,背叛),t=1,t=2,A,非理性(p),理性型(1-p),B (理性型),合作,X=合作,合作,背叛,X=合作,X=背叛,t=3,X=背叛,背叛,背叛,3+ 4p+0(1-p)+ 0= 4p+3,預(yù)期效用=,(背叛,背叛,背叛),t=1,t=2,A,非理性(p),理
7、性型(1-p),B (理性型),合作,X=背叛,合作,背叛,X=背叛,X=背叛,t=3,X=背叛,背叛,背叛,4+ 0 +0= 4,預(yù)期效用=,(背叛,合作,背叛),t=1,t=2,A,非理性(p),理性型(1-p),B (理性型),合作,X=背叛,合作,背叛,X=背叛,X=合作,t=3,X=合作,背叛,背叛,4+ (-1) +4p+0(1-p)= 4p+3,預(yù)期效用=,P=1,8p+2 (合作,合作,背叛),0.2,4p+3 (合作,合作,背叛) (背叛,合作,背叛),=4(背叛,背叛,背叛),結(jié)論,只要p=0.25, 下表所列戰(zhàn)略組合是一個(gè)精煉納什均衡: 理性型A在第1階段選擇合作,然后在
8、第2和第3階段選擇背叛; B在第1和第2階段選擇合作,然后在第3階段背叛。,精煉納什均衡,t=1,t=2,A,非理性(p),理性型(1-p),B (理性型),合作,X=合作,合作,背叛,X=合作,X=合作,t=3,X=合作,背叛,背叛,一般結(jié)論,可以證明:如果博弈重復(fù)T次,只要p=0.25, 對于所有的T=3, 下列戰(zhàn)略組合構(gòu)成一個(gè)精煉納什均衡:理性型A在t=1.T-2階段選擇合作,在T-1和T階段選擇背叛;B在t=1.T-1階段選擇合作,在最后階段T選擇背叛。 背叛只在最后兩階段出現(xiàn)。,雙方不完全信息,在單方不完全信息下,只要p0.25,不論博弈重復(fù)多少次,合作都不會出現(xiàn)。 但如果雙方信息不
9、完全,即使小小的不確定性也會導(dǎo)致合作行為,只要博弈重復(fù)的次數(shù)足夠多(但不需要是無限次); 原因在于,如果博弈重復(fù)的次數(shù)足夠長,沒有任何一方愿意一開始就把自己的名聲搞壞。,Grim Strategies,假定非理性型選擇grim strategy; 如果A在一開始就選擇背叛,暴露了自己是非合作型的,從第2期開始的唯一的均衡是每個(gè)人都背叛;所以A的最大預(yù)期收益為: 4+0+0+=4; 假定選擇如下戰(zhàn)略:開始選擇合作,直到對方選擇不合作,之后永遠(yuǎn)背叛。最小預(yù)期收益是: p(3T)+(1-p)(-1+0+0+)=p(3T)-(1-p),合作條件,(p)(3T)-(1-p)=4; T*=(5-p)/p; 所以,無論p多小,只要博弈重復(fù)的次數(shù)足夠大,一開始就選擇背叛不是最優(yōu)的。,KMRW定理,在不完全信息的情況下,只要博弈重復(fù)的次數(shù)足夠長,參與人就有積極性在博弈的早期建立一個(gè)“合作”的聲譽(yù);只是在博弈的后期,才會選擇背叛;并且,非合作階段的數(shù)量只與p有關(guān),而與博弈的次數(shù)T無關(guān)。 看似不理性的行為其實(shí)是理性的;,“大智若愚”,應(yīng)該樹立什么樣的形象? 合作與非合作; 強(qiáng)硬與懦弱; 對“不理智”(情緒
溫馨提示
- 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
- 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
- 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
- 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負(fù)責(zé)。
- 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請與我們聯(lián)系,我們立即糾正。
- 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。
最新文檔
- DB32/T 4182-2021家庭養(yǎng)老照護(hù)床位建設(shè)和服務(wù)規(guī)范
- DB32/T 3894.2-2020工程建設(shè)項(xiàng)目遠(yuǎn)程開標(biāo)工作規(guī)范第2部分:運(yùn)行管理
- DB32/T 3761.65-2022新型冠狀病毒肺炎疫情防控技術(shù)規(guī)范第65部分:接觸者追蹤管理信息系統(tǒng)
- DB32/T 3734-2020旅游信息分類與編碼
- DB32/T 3668-2019凹凸棒石粘土礦分級規(guī)范
- DB32/T 3658-2019蕎麥生產(chǎn)技術(shù)規(guī)程
- DB32/T 3571-2019水稻全程機(jī)械化生產(chǎn)技術(shù)規(guī)范
- DB32/T 1967-2021迷你南瓜春播早熟生產(chǎn)技術(shù)規(guī)程
- DB31/T 942.1-2015節(jié)能消費(fèi)領(lǐng)跑者評價(jià)方法(生產(chǎn)企業(yè))第1部分:家用空調(diào)器生產(chǎn)企業(yè)
- DB31/T 715-2013汽車玻璃用膜安全節(jié)能技術(shù)要求
- 中國蠶絲綢文化智慧樹知到期末考試答案章節(jié)答案2024年浙江大學(xué)
- MOOC 學(xué)術(shù)英語寫作-東南大學(xué) 中國大學(xué)慕課答案
- 《企業(yè)銷售費(fèi)用控制研究(論文)8600字》
- 二0二三年度六年級上冊Module1《多維閱讀》第八級DifferentPlants教學(xué)設(shè)計(jì)
- 公司網(wǎng)銀盾交接單
- JT∕T 784-2022 組合結(jié)構(gòu)橋梁用波形鋼腹板
- 汽車客運(yùn)有限公司成本費(fèi)用管理規(guī)定
- 緩刑期滿個(gè)人總結(jié)
- 市政道路中線測量內(nèi)容及計(jì)算方法
- 南瓜種植PPT演示課件(PPT 46頁)
- 第三章磁功能玻璃
評論
0/150
提交評論