金融數(shù)學(xué)博弈課件第二章_第1頁
金融數(shù)學(xué)博弈課件第二章_第2頁
金融數(shù)學(xué)博弈課件第二章_第3頁
金融數(shù)學(xué)博弈課件第二章_第4頁
金融數(shù)學(xué)博弈課件第二章_第5頁
已閱讀5頁,還剩56頁未讀, 繼續(xù)免費(fèi)閱讀

下載本文檔

版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進(jìn)行舉報或認(rèn)領(lǐng)

文檔簡介

第二章完全信息動態(tài)博弈參與者的收益函數(shù)是共同知識.完全信息:在第一章完全信息靜態(tài)博弈(StaticGamesofCompleteInformation)中,要求參與者同時選擇戰(zhàn)略或行動,且只能選擇一次.

但很多博弈參與者的行動選擇并非同時,甚至可以有無限次.而且參與者的行動選擇而是有先后順序的.并非一次,這種博弈就是動態(tài)博弈(DynamicGamesofCompleteInformation)完全且完美信息:博弈進(jìn)行的每一步當(dāng)中,要選擇

行動的參與者都知道這一步之前博弈進(jìn)行的整個過程.“動態(tài)博弈具體描述參與人在戰(zhàn)略情形中所遇到的序列結(jié)構(gòu).該模型允許我們研究這樣的解,即每個參與人不僅可以在博弈開始時考慮他的行動計劃,且在任何一個不得不做決策的時點上,他都可以考慮他的行動計劃.與此相反,靜態(tài)博弈限于這樣的解,即每個參與者選擇且僅選擇一次他的行動計劃,這個計劃可包納無數(shù)的變數(shù),但靜態(tài)博弈在博弈中的某些事件已知后則不允許參與者去重新考慮他的行動計劃.”(馬丁J.奧斯本博弈論教程87頁)動態(tài)博弈分為

完美信息和非完美信息動態(tài)博弈.2.1完全且完美信息動態(tài)博弈2.1.A理論:逆向歸納法

第一,參與者1選擇支付1000美元給參與者2還是一分不給;第二,參與者2觀察到參與者1的選擇,然后決定是否引爆一顆手雷把兩個人一塊炸死.一個兩步博弈例子.兩個參與者如何選擇呢?如果參與者1相信這一威脅,他的最優(yōu)反應(yīng)是支付1000美元給參與者2,與者1卻不會對這一威脅信以為真,它不可置信.參與者2接受,博弈結(jié)束.完全且完美信息動態(tài)博弈但參動態(tài)博弈的中心問題是可信任性.所有

手雷博弈屬于下面簡單類型的完全且完美信息動態(tài)博弈:(兩人兩階段動態(tài)博弈)1.參與者1從可行集A1中選擇一個行動a1,2.參與者2觀察到a1后,從可行集A2中選擇一個行動a2,

3

兩人的收益分別為和逆向歸納法(backwardinduction)求解此博弈如下:當(dāng)在博弈的第二階段參與者2行動時,由于其前參與者1已選擇行動a1,為假定對A1中的每一個a1,參與者2的最優(yōu)化問題只用R2(a1)

表示.動的最優(yōu)反應(yīng)函數(shù).行動a1所做出的反應(yīng),這樣1在第一階段要解決的問題可有唯一解,歸結(jié)為:假定參與者1的這一最優(yōu)化問題也有唯一解,我們稱是這一博弈的逆向歸納解.此逆向歸納他面臨的決策問題可用下式表示這就是參與者2對參與者1行由于參與者1能和參與者2一樣解出2的問題,參與者1可以預(yù)測到參與者2對1每一個可能的表示為解不含有不可置信的威脅:參與者1預(yù)測參與者2將對1的可能選擇的任何行動a1這一預(yù)測排除了參與者2不可置信的威脅,即做出最優(yōu)反應(yīng),R2(a1)

;參與者2將在第二階段到來時做出不符合自身利益的反應(yīng).例子:逆向歸納法背后的理性假設(shè).考慮下例三階段兩個參與者的動態(tài)博弈,其中參與者1有兩次行動.(2,0)(1,1)121LRL1R1R2L2(3,0)(0,2)博弈的解或博弈的結(jié)果:參與者選擇L,博弈結(jié)束.博弈的逆向歸納解表示為(L,X).結(jié)論:參與者是理性的是“共同知識”是逆向歸納法背后假設(shè).選擇行動“開金礦博弈”(3個版本)(經(jīng)濟(jì)博弈論基礎(chǔ))甲欲開發(fā)一個價值4萬元的金礦,缺少1萬元資金,乙有1萬元的資金可以投資.甲想說服乙借給他,并答應(yīng)分給乙2萬元,乙是否應(yīng)該借給他?(不借,X

)可將此問題看作一個博弈.不借借還不還(1,0)乙甲(2,2)(0,4)版本1:無法律保障的開金礦博弈博弈的逆向歸納解:兩個階段兩個參與者的動態(tài)易知此博弈的逆向歸納解為:乙選擇不借,博弈結(jié)束.直觀解釋為:乙沒有理由相信甲的“承諾”.不借借還不還起訴放棄(1,0)乙甲乙(2,2)(-1,0)(0,4)版本2:法律保障不充足的開金礦博弈(不借,X)博弈逆向歸納解:不借借還不還起訴放棄(1,0)乙甲乙(2,2)(1,0)(0,4)版本2:法律保障充足的開金礦博弈(借,還)博弈逆向歸納解:2·1·B斯塔克爾貝里(Stackelberg)雙頭壟斷模型博弈的時間順序如下(2)企業(yè)2觀察到以后,然后選擇產(chǎn)量

;

(市場上的總產(chǎn)量)(市場出清價格)c是生產(chǎn)的邊際成本(固定成本為0).(1)企業(yè)1選擇產(chǎn)量(3)企業(yè)i的收益由下面的利潤函數(shù)給出:為求解此博弈的逆向歸納解,任意產(chǎn)量的最優(yōu)反應(yīng)應(yīng)滿足:首先計算企2對企業(yè)1由上式可得已知果相同.但兩者不同之處在于這里的企業(yè)1

是企業(yè)2對是企業(yè)2對假定的企業(yè)1的產(chǎn)量的最優(yōu)反應(yīng).

且企業(yè)1的產(chǎn)量選擇是和企業(yè)2同時作出的.由于企業(yè)1也到他如選擇,這與同時行動的古諾模型中得出的結(jié)而在古諾模型中已觀測到的產(chǎn)量的真實反應(yīng),和企業(yè)2一樣解出企業(yè)2的最優(yōu)反應(yīng),企業(yè)1就可以預(yù)測企業(yè)2將根據(jù)選擇產(chǎn)量.那么在在博弈的第一階段,企業(yè)1的問題就可表示為于是這就是斯塔克爾貝里雙頭壟斷博弈的逆向歸納解.斯塔克爾貝里模型解與古諾模型解的比較1)古諾博弈納什均衡產(chǎn)量從而在斯塔克爾貝里博弈里相應(yīng)的市場出清價格就比較低.不過在斯塔克爾貝里博弈中,企業(yè)1完全可以選擇古諾均衡產(chǎn)量這時企業(yè)2的最優(yōu)反應(yīng)產(chǎn)量同樣是古諾均衡產(chǎn)量,但企業(yè)1卻選擇了其它產(chǎn)量,那么企業(yè)1在斯塔克爾貝里博弈中的利潤諾均衡中的利潤.一定高于其在古

但斯塔克爾貝里博弈中的市場出清價格降低了,從而總利潤水平也會下降.(古諾納什均衡時的總利潤)(斯塔納什均衡時的總利潤)企業(yè)1在斯塔克爾貝里博弈中利潤的增加必定意味著企業(yè)2利潤的減少.而在古諾博弈中兩個企業(yè)的利潤相等.這一結(jié)果揭示了單人決策問題和多人決策問題的一個重要不同之處.在單人決策理論中,占有更多信息的絕不會對決策者帶來不利,然而在博弈論中,了解更多信息(或者更為準(zhǔn)確地說,是讓其他參與者知道一個人掌握更多信息)卻可以讓一個參與者受損.在斯塔克爾貝里博弈中,存在問題的信息是企業(yè)的產(chǎn)量:企業(yè)2知道并且(重要的是)企業(yè)1知道企業(yè)2知道于是企業(yè)1可以利用先動優(yōu)勢對企業(yè)2用詐!也即企業(yè)1可以事先讓企業(yè)2知道一個虛假產(chǎn)量,如果企業(yè)2

相信企業(yè)1的虛假產(chǎn)量,則企業(yè)2將會選擇對虛假產(chǎn)量的

最優(yōu)反應(yīng)產(chǎn)量,而企業(yè)1實際上選擇的產(chǎn)量卻是對企業(yè)2企業(yè)2受損.關(guān)于他的虛假產(chǎn)量最優(yōu)反應(yīng)產(chǎn)量的最優(yōu)反應(yīng)產(chǎn)量,使因為企業(yè)2的產(chǎn)量不是對企業(yè)1的最優(yōu)反應(yīng).但是,企業(yè)2未必一定上當(dāng)!另一個角度,則假設(shè)企業(yè)1先選擇產(chǎn)量企業(yè)1選擇了它的斯塔克爾貝里產(chǎn)量選擇產(chǎn)量之后企業(yè)2但事先并沒有觀測到如果企業(yè)2相信企業(yè)2的最優(yōu)反應(yīng)產(chǎn)量仍是但是,如果企業(yè)1預(yù)測到企業(yè)2將持有這一推斷并選擇這一產(chǎn)量,企業(yè)1就會傾向于它對的最優(yōu)反應(yīng)產(chǎn)量而不愿意去選擇斯塔克爾貝里產(chǎn)量那么企業(yè)2就不會相信企業(yè)1選擇了斯塔克爾貝里產(chǎn)量.

于是,此時動態(tài)博弈的唯一納什均衡產(chǎn)量是古諾博弈時的納什均衡產(chǎn)量.也就是靜態(tài)博弈同時行動的.這說明靜態(tài)博弈中的“同時行動”不一定指時間意義上的,只要雙反沒有信息交流即可.(2.1C自己閱讀)2·1·D討價還價博弈(分錢博弈)—序貫談判

三階段談判:參與人1和2就一美元的分配進(jìn)行談判.他們輪流提出方案:首先參與人1提出一個分配建議,參與人1提出一個分配建議,參與人2可以接受或拒絕;如果參與人2拒絕,就由參與人2提出分配建議,參與人1選擇接受或拒絕;如此一直進(jìn)行下去.一個條件一旦被拒絕,它就不再有任何約束力,并和博弈下面的進(jìn)行不相關(guān).

每個條件都代表一個階段.

參與人都沒有足夠的耐心:他們對后面階段得到的收益進(jìn)行貼現(xiàn),每一個階段的貼現(xiàn)因子為下面是對三階段談判博弈時序的更為詳細(xì)的描述:(1a)在第一階段時.參與人1建議他分走1美元的S1,留給參與人2的份額為1-S1.(1b)參與人2或者接受這一條件(此時博弈結(jié)束,即拿到)或者拒絕這一條件(博弈將繼續(xù)進(jìn)行,進(jìn)入第參與者1的收益為S1,參與人2的收益為1-S1,都可立二階段)(2a)在第二階段的開始,參與人2提議參與人1分得1美元的S2,留給參與人2的為1-S2.(請注意在階段t,

St總是表示分給參與人1的,而不論是誰提出的條件)(2b)參與人1或者接受條件(此時博弈結(jié)束,參與人1的收益為S2,參與人2的收益為1-S2都可立即拿走)或者拒絕這一條件(此時博弈繼續(xù)進(jìn)行,進(jìn)入第三階段)

(3)在第三階段的開始,參與人1得到1美元的S參與人2得到1-S.這里

下面求解此三階段博弈的逆向歸納解:首先計算如果博弈進(jìn)行到第二階段,參與人2可能條件S2

,提供的最優(yōu)條件,但下一階段的S在當(dāng)期的價值為參與人會1才接受

(我們假定當(dāng)接受和拒絕無差異時,參與人總是選擇接參與人1拒絕參與人2在這一階段的可以在第三階段得到S,那么當(dāng)且僅當(dāng)受條件).在本階段收入(通過向參與人1提條件,給(通過向參與人1提出條件,給他從而參與人2在第二階段的決策問題就可歸于和下階段收入他任意小于前一選擇可得的之間作出選擇.后一選擇的貼現(xiàn)值為于是參與人2在第二階段可以提出的最優(yōu)條件是博弈進(jìn)行到第二階段,參與人2將提出條件也就是說如果1選擇接受條件.第二階段的決策問題,絕參與人1的條件在第二階段可以得到但下一階那么當(dāng)在本階段的的價值只有時參與人就可歸結(jié)于在本階段收入從而參與人1在第一階段的決策問題

(通過向參與人2提(通過向參與人2提出參與人由于參與人1可以和參與人2同樣地解出參與人2在參與人1也知道參與人2通過拒段得到的且僅當(dāng)或者2才會接受出條件和下階段收入任意的之間作出選擇.后一選擇的貼現(xiàn)值為小于前一選擇可得的于是參與人1在第一階段可以提出的最優(yōu)條件是這樣,在此三階段博弈的逆向歸納解中,提出分配方案參與人1向參與人2后者接受該方案.下面考慮無限期的情況.博弈時序和前面的描述完全一致,只是第(3)階段給出的外生解決方案被其后的無限步討價還價(3a)、(3b)、(4a)、(4b)等等所代替:奇數(shù)步由參與人1出條件,偶數(shù)步由參與人2出條件,直至一方接受條件,討價還價結(jié)束.如何利用逆向歸納法求解?1984年,謝克德和薩頓(ShakedandSutton)

提出一種方法.他們的方法思想是:將無限期博弈截開,從第三階段開始的博弈(如果能進(jìn)行到這一階段)與(從第一階段開始的)整個過程的博弈是相同的—兩種情況下,都是由參與人1首先提出條件,其后兩個參與人輪流出價,直至有一方接受條件談判結(jié)束.ShakedandSutton,1984,思路要點:1對一個無限回合討價還價博弈來講,無論從第三回合開始,還是從第一回合開始結(jié)果都是相同的.2求解過程:假設(shè)整個博弈有一個逆向歸納解(S,1-S),即在第一回合甲出價S,乙接受是雙方的收益.3由Shaked的思路,解(S,1-S)也是從第三回合開始博弈的結(jié)果.即第三回合為甲出價S,乙接受,雙方收益(S,1-S).4再把上述第三回合理解成從第一階段開始的無限回合博弈的第三回合,由于甲在第三回合出價是最終出價,故可理解為三回合強(qiáng)制性討價還價博弈.由前面的討論:甲在第一回合出價雙方收益從而解得:為逆向遞推解.2·2

完全非完美信息兩階段博弈2·2·A理論:子博弈精煉和在完全且完美信息動態(tài)博弈中相同,假定博弈的進(jìn)行分為一系的階段,下一階段開始前參與者可觀察到前面所有階段的行動.與上節(jié)分析的不同之處在于每一階段中有同時行動.這種階段內(nèi)的同時行動意味我們將以下類型的簡單博著博弈包含了不完美信息.弈稱為完全非完美信息兩階段博弈:1參與者1和2同時從自己的可行集A1和A2中選擇行動a1和a2,2參與者3和4觀察到第一階段的結(jié)果后同時從各自的可行集A3和A4中選擇行動a3和a4,然3收益為使用逆向歸納法解決此類問題,但這里從博弈的最后階段逆向推導(dǎo)的第一步就包含了求解一個真正的博弈(給定第一階段結(jié)果時,參與者3和4在第二階段同時行動的博弈),而不再是前一階段求解單人最優(yōu)化的決策問題.為使問題簡化,我們假設(shè)對第一階段其后(參與者3和4之間博弈每一可能的結(jié)果的)第二階段博弈有唯一納什均衡,表示為如果參與人1和2預(yù)測到參與人3和4的行動將由上面的均衡給出,則參與者1和2在第一階段的問題就可用以下的同時行動博弈表示:1參與者1和2同時從自己的可行集A1和A2中選擇行動a1和a2,2收益情況為假定為以上同時行動博弈的唯一納什均衡,則稱為這兩階段博弈的子博弈精煉解.2·1·B

對銀行的擠提兩個投資者每人存入銀行一筆存款D,銀行已將這些存款投入一個長期項目.如果在該項目到期前銀行被迫對投資者變現(xiàn),共可收回2r,這里如銀行允許投資項目到期,則項目共可取得2R,這里有兩個日期.投資者可以從銀行提款:日期1在銀行的投資項目到期之前,日期2則在到期后.為了討論方便,假設(shè)不存在貼現(xiàn).如果兩個投資者都在日期1提款,每人可得到r

,博弈結(jié)束.如果只有一個投資者在日期1提款,他可得到D,不過另一人可得到2r-D,博弈結(jié)束.如果兩人都在日期2提款,每人得到R,博弈結(jié)束.如果只有一個投資者在日期2提款,則他得到2R-D,如果兩人都不在日期1提款,則項目結(jié)束后投資者在日期2進(jìn)行提款決策.另一個人得到D,博弈結(jié)束.最后,如果在日期2兩個投資者都不提款,則銀行向每個投資者返還R

,博弈結(jié)束.兩個投資者在日期1和日期2的收益情況可以用下面的兩個標(biāo)準(zhǔn)式博弈表示.

下一階段

2r-D,D

D,2r-D

r,r

提款不提提款不提日期1

下一階段

2r-D,D

D,2r-D

r,r

提款不提提款不提日期1

R

,RD,2R-D

2R-D,DR,R提款不提提款日期2不提逆向歸納法分析此博弈.先考慮日期2的標(biāo)準(zhǔn)式博弈.由于(由此可得),“提款”嚴(yán)格優(yōu)于“不提款”,那么這一博弈有唯一納什均衡:兩個投資者都提款,最終收益為由于不存在貼現(xiàn),可以直接用這一收益替入日期1的R,RD,2R-D

2R-D,DR,R提款不提提款日期2不提變?yōu)闃?biāo)準(zhǔn)式博弈雙方都不提款時的情況于是日期1的情況就R,R2r-D,DD,2r-D

r,r

提款不提提款不提由于(并且由此可得),這一兩階段博弈變形為單階段博弈,存在兩個純戰(zhàn)略納什均衡:(1)

兩個投資者都提款,最終收益為最初的兩階段銀行擠提博弈就有兩個子博弈精煉解.(2)

兩個投資者都不提款最終收益為顯然,

(提款,提款)是類似于“囚徒困境”的結(jié)果,是對大家都低效率的選擇,但是,該博弈還有一個高效率的納什均衡,因此,此模型不能預(yù)測何時會出現(xiàn)擠提.但是,擠提的確存在.補(bǔ)例(要挾訴訟,承諾行動與精煉均衡的關(guān)系)這個博弈有兩個參與者:原告P和被告D.行動順序如下:(1)原告決定是否對被告提出指控,指控的成本為C>0;(2)如果決定指控,原告要求被告支付S>0以了卻訴訟;(3)被告決定接受還是拒絕原告的要求;(4)

如果被告拒絕,原告決定是放棄指控還是向法庭起訴,原告的起訴成本(包括律師費(fèi)用)為p,被告的辯護(hù)成為d;(5)如果案子到了法庭原告以r的概率贏得x單位的支付.訴訟成功可能性非常小,目的是希望和解得到補(bǔ)償.P不指控指控要求S拒絕接受起訴放棄(0,0)PDP原告指控的目的本身意味著階段,那么在博弈的最后原告的最優(yōu)選擇是放棄.rx<p

,因為被告知道如果自己自己拒絕,原告將放棄,選擇是拒絕;

原告在第一階段的子博弈精煉納什均衡是原告選擇(不指控,要求,放棄),被告選擇(拒絕),均衡結(jié)果為:原告不指控.被告在倒數(shù)第二階段的最優(yōu)原告知道將被拒絕,下面考慮承諾行動如何改變上述結(jié)果.假定原告在指控前將訴訟費(fèi)p支付給律師,原告將選擇起訴.無論那么,在博弈的最后階段,最優(yōu)選擇是不指控.因此,結(jié)果如何,律師費(fèi)不能退還.因為(假定勝訴的概率大于0).也即被告將會接受原告提出的賠償要求,被告將會接受原告提出的賠償要求如果的話.因為只要原告將選擇私了而不是上法庭解決爭端,是雙方私了的賠償因此假定雙方的討價還價能力相同,區(qū)域.意味著原告要求的賠償為因為原告指控(即上法庭的期望收益小于訴訟成本),

的條件仍可能成立.如果顯然,即使假定這個條件成立,原告提出指控要求.原告的納什討價還價解成本為c+p,子博弈納什均衡結(jié)果將是:支付為被告的支付為案件私了.因為被告打官司的成本不僅包括應(yīng)訴的法律費(fèi)用而且涉及聲譽(yù)損失(d

),所以,被告越大(大人物大企這是為什么大人物常常受到無端指控的原因之一.業(yè)),d越大,的條件越可能滿足.當(dāng)然,大企業(yè),大人物也可以通過他們的承諾行動使自己避免小企業(yè),小人物的無端指控.辦法之一就是在被那么賠償區(qū)域為納什均衡解為成立,因為即使指控之前就支付律師費(fèi)用y

.諾行動使被告節(jié)省成本因此,只要這就是為什么大公司,也可能不滿足,從而,原告將不會提出指控.承諾行動就值得.這樣的承大人物雇傭律師的原因之一.2·3重復(fù)博弈2·3·A理論:兩階段重復(fù)博弈考慮將“囚徒困境”博弈重復(fù)進(jìn)行兩次,過程博弈的收益等于兩個階段各自收益的簡單相加,次博弈開始前可觀察第一次進(jìn)行的結(jié)果,(不考慮貼現(xiàn)因素),

4,4

0,5

5,0

1,1參與者2參與者1圖2·3·1且在第二并假設(shè)整個這叫兩階段“囚徒困境”重復(fù)博弈.兩階段“囚徒困境”重復(fù)博弈屬于第2·2.A節(jié)分析過的博弈

根據(jù)2·2.A節(jié)的求解此類博弈精煉解的程序,第兩人的收益為二階段博弈的結(jié)果為所余部分博弈的納什均衡,即為

在此前提下分析第一階段的情況.由此兩階段“囚徒困境”中,參與者在第一階段的局勢就可歸納為下圖所示的博弈,其中第二階段的收益(1,1)分別加到兩人第一階段每一收益組合上.該博弈有唯一的納什均衡

5

,5

1

,6

6

,1

2

,2參與者2參與者1圖2·3·2從而,兩階段囚徒困境唯一的子博弈精煉解就是第一在子博弈精煉解中,任一階段都不能達(dá)成合作—的結(jié)果.階段的和第二階段的這一結(jié)論在更為一般的條件下同樣成立.表示一完全信息博弈,其中參與者1到n同時從各自的行動空間A1到An中分別選擇行動a1和an,得到收益分別為以后我們稱博弈G為重復(fù)博弈中的階段博弈.定義對給定的階段博弈G,令G(T)表示G重復(fù)進(jìn)

行T次的有限博弈,并且在下一次博弈開始前,所有以前博弈的進(jìn)行都可被觀測到.G(T)的收益為T次階段博弈的簡單相加.意有限的T次重復(fù)博弈G(T)有唯一的子博弈精煉解:即G的納什均衡結(jié)果在每一階段重復(fù)進(jìn)行.定理如果階段博弈G

有唯一的納什均衡,則對任下面,再回到兩階段博弈,進(jìn)一步考慮階段博弈G有多個納什均衡的情況,看下面例子:3,30,00,00,04,40,50,05,01,1圖2.33容易看出,此博弈有兩個純戰(zhàn)略納什均衡:設(shè)圖2.33表示的階段博弈重復(fù)進(jìn)行兩次,并在第二次博弈開始前可觀察第一次進(jìn)行的結(jié)果,可以證明這一重復(fù)博弈中存在一個子博弈精煉解,其中第一階段的戰(zhàn)略組合為說明:嚴(yán)格地講,我們只是對第2.2A節(jié)定義的博弈類型定義了子博弈精煉解,后面將會看到,二者解的定義對此類博弈我們還沒有給出子博弈精煉解的定義,相差甚微.(該例分析復(fù)雜,略去)這個例子要說明的主要觀點是:對將來行動所作的可信的威脅或承諾可以影響到當(dāng)前的行動.另一方面,子博弈精煉的概念對可信性的要求并不嚴(yán)格.2·3重復(fù)博弈2·3·A理論:兩階段重復(fù)博弈重復(fù)博弈分析在參與者長期重復(fù)的相互往來中,關(guān)于將來行動的威脅或承諾能否影響到當(dāng)前的行動.考慮將“囚徒困境”博弈重復(fù)進(jìn)行兩次,且在第二過程博弈的收益等于兩個階段各自收益的簡單相加,次博弈開始前可觀察第一次進(jìn)行的結(jié)果,并假設(shè)整個(不考慮貼現(xiàn)因素),這叫兩階段“囚徒困境”重復(fù)博弈.

4,4

0,5

5,0

1,1參與者2參與者1圖2·3·1兩階段“囚徒困境”重復(fù)博弈屬于2·2節(jié)的完全非完美信息兩階段博弈.

根據(jù)2·2.A節(jié)的求解此類博弈精煉解的程序,第兩人的收益為二階段博弈的結(jié)果為所余部分博弈的納什均衡,即為

在此前提下分析第一階段的情況.由此兩階段“囚徒困境”中,參與者在第一階段的局勢就可歸納為下圖所示的博弈,其中第二階段的收益(1,1)分別加到兩人第一階段每一收益組合上.該博弈有唯一的納什均衡

5

,5

1

,6

6

,1

2

,2參與者2參與者1圖2·3·2從而,兩階段囚徒困境唯一的子博弈精煉解就是第一在子博弈精煉解中,任一階段都不能達(dá)成合作—的結(jié)果.階段的和第二階段的這一結(jié)論在更為一般的條件下同樣成立.表示一完全信息博弈,其中參與者1到n同時從各自的行動空間A1到An中分別選擇行動a1和an,得到收益分別為以后我們稱博弈G為重復(fù)博弈中的階段博弈.定義對給定的階段博弈G,令G(T)表示G重復(fù)T進(jìn)行T次的有限博弈,并且在下一次博弈開始前,所有以前博弈的進(jìn)行都可被觀測到.G(T)的收益為T次階段

博弈的簡單相加.補(bǔ)充例子(要挾訴訟,承諾行動與精煉均衡的關(guān)系)這個博弈有兩個參與者:原告P和被告D.行動順序如下:(1)原告決定是否對被告提出指控,指控的成本為C>0;(2)如果決定指控,原告要求被告支付S>0以了訴訟;(3)被告決定接受還是拒絕原告的要求;(4)

如果被告拒絕,原告決定是放棄指控還是向法庭起訴,原告的起訴成本(包括律師費(fèi)用)為p,被告的辯護(hù)成為d;(5)如果案子到了法庭原告以r

的概率贏得x單位訴訟成功可能性非常小,目的是希望和解得到補(bǔ)償.的支付.P不指控指控要求S拒絕接受起訴放棄(0,0)PDP原告指控的目的本身意味著rx<p

,

最后階段,因為被告知道如果自己拒絕,原告將放棄,在倒數(shù)第二階段的最優(yōu)選擇是拒絕;

絕,原告在第一階段的最優(yōu)選擇是不指控.因此,子博弈精煉納什均衡是原告選擇(不指控,要求,放棄),被告選擇(拒絕)均衡結(jié)果為:原告不指控.那么,在博弈的原告的最優(yōu)選擇是放棄.被告原告知道將被拒下面考慮承諾行動如何改變上述結(jié)果.假定原告在指控前將訴訟費(fèi)p支付給律師,結(jié)果如何,律師費(fèi)不能退還.原告將選擇起訴.無論那么,在博弈的最后階段,受原告提出的賠償要求也即被告將會接受原告提出的賠償要求,因為只要因為(假定勝訴概率大于零),被告將會接如果的話.假定雙方的討價還價能力相同,納什討價還價解將選擇私了而不是上法庭解決爭端,是雙方私了的賠償區(qū)域.原告意味著原告要求的賠償為因為原告指控成本為C+p,(即上法庭的期望收益小于訴訟的條件仍可能成立.如果顯然即使成本),假定這個條件成立,子博弈納什均衡結(jié)果將是:原告提出指控要求.原告的支付為被告的支付為案件私了.因為被告打官司的成本不僅包括應(yīng)訴的法律費(fèi)用該博弈模型的實際背景舉例:而且涉及聲譽(yù)損失(d

),所以,被告越大(大人物大這是為什么大人物常常受到無端指控的原因之一.當(dāng)然,大企業(yè),大人物也可以通過他們的承諾行動使自己避免小企業(yè),小人物的無端指控.企業(yè)),d越大,的條件越可能滿足.辦法之一就是在被指控之前就支付律師費(fèi)用.假定被告在被指控之前支付律師費(fèi)用y,那么賠償區(qū)域為納什均衡解為成立,因為即使諾行動使被告節(jié)省成本因此,只要是為什么大公司,大人物雇傭律師的原因之一.也可能不滿足,從而,原告將不會提出指控.承諾行動就值得.這就這樣的承121接受接受拒絕,出S圖1出討價還價博弈(序貫談判,魯賓斯坦1982)—分錢博弈無貼現(xiàn)因子分錢博弈121接受拒絕,出S接受(序貫談判,魯賓斯坦1982)有貼現(xiàn)因子的分錢博弈討價還價博弈—分錢博弈2·1·D討價還價博弈(分錢博弈)—序貫談判三階段談判:參與人1和2就一美元的分配進(jìn)行談判.他們輪流提出方案:首先參與人1提出一個分配建議,參與人1提出一個分配建議,參與人2可以接受或拒絕;如果參與人2拒絕,就由參與人2提出分配建議,參與人1選擇接受或拒絕;如此一直進(jìn)行下去.一個條件一旦被拒絕,它就不再有任何約束力,并和博弈下面的進(jìn)行不相關(guān).每個條件都代表一個階段.參與人都沒有足夠的耐心:他們對后面階段得到的收益進(jìn)行貼現(xiàn),每一個階段的貼現(xiàn)因子為下面是對三階段談判博弈時序的更為詳細(xì)的描述:(1a)在第一階段時.參與人1建議他分走1美元的S1,留給參與人2的份額為1-S1.(1b)參與人2或者接受這一條件(此時博弈結(jié)束,立即拿到)或者拒絕這一條件(博弈將繼續(xù)進(jìn)行,進(jìn)參與者1的收益為S1,

參與人2的收益為1-S1,都可入第二階段)(2a)在第二階段的開始,參與人2提議參與人1分得1美元的S2,留給參與人2的為1-S2.(請注意在階段t,St總是表示分給參與人1的而不論是誰提出的條件)(2b)參與人1或者接受條件(此時博弈結(jié)束,參與人1的收益為S2,參與人2的收益為1-S2都可立即拿走)或者拒絕這一條件(此時博弈繼續(xù)進(jìn)行,進(jìn)入第三階段)(3)在第三階段的開始,參與人1得到1美元的S,

參與人2得到1-S.下面求解此三階段博弈的逆向歸納解:首先計算如果博弈進(jìn)行到第二階段,參與人2可能提件S2

,可以在第三階段得到S,供的最優(yōu)條件,參與人1拒絕參與人2在這一階段的條但下一階段的S在當(dāng)期的價值為那么當(dāng)且僅當(dāng)參與人會1才接受

(我們假定當(dāng)接受和拒絕無差異時,參與人總是選擇接受條件)從而參與人2在第二階段的決策問題就可歸于在本階段收入(通過向參與人1提出條件給他)和下階段收入(通過向參與人1提條件給他任意

)之間作出選擇.選擇的貼現(xiàn)值為小于前一選擇可得的,于是參與人2在第二階段可以提出的最優(yōu)條件是如果博弈進(jìn)行到第二階段,參與人2將提出條件也就是說參與人1選擇接受條件.由于參與人1可以和參與人2同樣地解出參與人2在第二階段的決策問題,參與人1也知道參與人2通過拒絕參與人1的條件在第二階段可以得到但下一階段得到的的價值只有.那么當(dāng)且僅當(dāng)在本階段的或者時參與人2才會接受與人1在第一階段的決策問題就可歸結(jié)于在本階段收從而參入(通過向參與人2提條件和下階段收入(通過向參與人2提出任意的)之間作出選擇.后一選擇的貼現(xiàn)值小于前一選擇可得的于是參與人1在第一階段提出的最優(yōu)條件為這樣,在此三階段博弈的逆向歸納解中,參與人1向參與人2提出分配方案為,后者接受該方案.二、無限回合討價還價博弈(Shaked1984)思路要點:1對一個無限回合討價還價博弈來講,無論從第三回合開始,還是從第一回合開始結(jié)果都是相同的.2求解過程:假設(shè)整個博弈有一個逆向歸納解(S,1-S),即在第一回合甲出價S,乙接受是雙方的收益.3由Shaked的思路,解(S,1-S)也是從第三回合開收益(S,1-S)始博弈的結(jié)果.即第三回合為甲出價S,乙接受,雙方4再把上述第三回合理解成從第一階段開始的無限回合博弈的第三回合,由于甲在第三回合出價是最終出價,故可理解為三回合強(qiáng)制性討價還價博弈.由前面的討論:甲在第一回合出價雙方收益從而解得:為逆向遞推解.2·2

完全非完美信息兩階段博弈2·2·A理論:子博弈精煉和在完全且完美信息動態(tài)博弈中相同,假定博弈的進(jìn)行分為一系的階段,下一階段開始前參與者可觀察到前面所有階段的行動.與上節(jié)分析的不同之處在于每一階段中有同時行動.我們將以下類型的簡單博弈稱為完全非完美信息兩階段博弈:1參與者1和2同時從自己的可行集A1和A2中選擇行動a1和a2,2參與者3和4觀察到第一階段的結(jié)果后同時從各自的可行集A3和A4中選擇行

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負(fù)責(zé)。
  • 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時也不承擔(dān)用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

最新文檔

評論

0/150

提交評論