三完全信息動(dòng)態(tài)博弈版_第1頁
三完全信息動(dòng)態(tài)博弈版_第2頁
三完全信息動(dòng)態(tài)博弈版_第3頁
三完全信息動(dòng)態(tài)博弈版_第4頁
三完全信息動(dòng)態(tài)博弈版_第5頁
已閱讀5頁,還剩36頁未讀, 繼續(xù)免費(fèi)閱讀

下載本文檔

版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請(qǐng)進(jìn)行舉報(bào)或認(rèn)領(lǐng)

文檔簡(jiǎn)介

2【唐朝的宰相房玄齡的夫人善嫉、性情兇悍,房玄齡很怕她,一個(gè)也不敢納。唐太宗李世民與房玄齡的關(guān)系很密切,聽說這件事后,就讓皇后召見房夫人,告訴她現(xiàn)在大臣娶有定制,將賞給房玄3【倚天屠龍記故事背景:綠柳山莊中,明教眾中了趙敏暗下的毒,張無忌為尋解藥重回綠柳山入入4【射雕傳 黃蓉因誤會(huì)郭靖要娶成吉思汗的女兒華箏公主而離開郭靖,后來被歐陽鋒抓住并芭蕾。。。)n,set N人有限博弈的擴(kuò)展式可以用博弈樹來表示AAN2)A行動(dòng)后進(jìn)入標(biāo)有N小大小大

的兩個(gè)枝表示;然后進(jìn)入B 開發(fā)不開

不開發(fā)

前一個(gè)分量是A的支付, (8,0)(-3,-

結(jié)標(biāo)注在終點(diǎn)結(jié)下的是參與人的支付向量,每個(gè)終點(diǎn)結(jié)(z)完全決定了博弈樹的路徑,用uiz表示對(duì)應(yīng)的博弈路徑所導(dǎo)致的第i個(gè)參與人的支付函數(shù)枝A假定開發(fā)商B是在知道ANN大小大小BBBB (8,0)(-3,- A開

B必須作出兩個(gè) 大 大 開發(fā)不開 開

不開發(fā) (8,0)(-3,- A開

B知道N的選擇但不知道A的選B也有兩個(gè)信息集,每B必須作出兩大 大 開發(fā)不開 開

不開發(fā) (8,0)(-3,- ACBAAAACBACBAAAACBC最上面的信息集不滿足A在同一時(shí)點(diǎn)決策的要求;中間的信息集中的結(jié)不是同一個(gè)參與人的;最下面的信息集中(Singletons集都是單結(jié)的,該博弈稱為完全信息博弈(gameofperfectinformation。

美信息博弈,從而A的一個(gè)信息集包 開發(fā)不開 開

不開發(fā) (8,0)(-3,- 圖1-A開

圖可以轉(zhuǎn)化成上圖的非完美信息 開發(fā)不開 開

不開發(fā) (8,03,- B之前決策擴(kuò)展式表述博弈的為了使用以前定義的均衡概念,一個(gè)自然的思路就是,將博弈的擴(kuò)展式表述和策A開 開 開 -3,-

A只有一個(gè)信息集,兩個(gè)可選擇的行為,故AB有兩個(gè)信息集,每個(gè)信息集上有兩個(gè)可選擇B有四個(gè)純策略:①{開∣A開;開∣A不開};②{開∣A開;不開︱A不開};③{不開∣A開;開∣A不開};④{不開∣A開;不開∣A不開};{開∣A開∣A不開{開∣A不開︱A不開{不開∣A開∣A不開{不開∣A不開∣A不開-3,--3,-(A不開發(fā),B開發(fā)(A開發(fā),B不開發(fā)(A開發(fā),B不開發(fā) A不開}可以簡(jiǎn)單地表述為(開,開) 示為在每一個(gè)信息集hi上的行動(dòng)空間A(hi)的 Si

比如說,上述房地產(chǎn)開發(fā)博弈中,開發(fā)商A只有一個(gè)信息集和兩個(gè)可選擇的行動(dòng),所B有兩個(gè)信息集(A的兩個(gè)行動(dòng)選擇,每個(gè)信息集上,B有兩個(gè)行動(dòng)選擇,因而B有四個(gè)純策略。一般地,一個(gè)參與人可選擇的純策略總數(shù):

每個(gè)策略組合(從而博弈的路徑)決定了一個(gè)支付向量u(u1,...,un)。

isi

B的給定策略為{不開發(fā),開發(fā)},BA選擇開發(fā),B將選擇不開發(fā);如果A不開發(fā),B將開發(fā)。定理(Zermelo,191;Kuhn,193:一個(gè)有限完美信息博弈有一個(gè)純策略均induction1U,22L和R1D,2的信息集達(dá)到,2有兩個(gè)選擇:選L1單位支付以及選R0。因?yàn)長(zhǎng)21選D,2L21是理性的,1將選D得(3, (0,

LRUD(U,那么2的信息集不能達(dá)到,我們說2的信息LRUD就不是1的最優(yōu)選擇了。1的最優(yōu)選擇的信念沒有特別說明,我們無法定義2的最優(yōu)選擇?!踝硬┺木珶捑? AA -3,-

發(fā))}【注意,B的策略簡(jiǎn)寫為(開發(fā),開發(fā)應(yīng)于右信息集x】B的策略可以描述為“莫進(jìn)場(chǎng)跟我爭(zhēng),不管你選擇開發(fā)還是不開發(fā),我開發(fā)定由此看,B是在A,而A也相信了這A為什么要相信B的呢A真的進(jìn)場(chǎng)開發(fā),Bx,B0比開發(fā)得-3B的最優(yōu)選擇是己得到1的支付,而不是選擇不開發(fā),讓B開發(fā),自己得到0的支付。于B的一個(gè)不可置信的策略;B策略的不可置信就在于,一旦A選擇開發(fā),B不會(huì)實(shí)施原上述{不開發(fā);(開發(fā),開發(fā))}之所以成為均衡,原因在于均衡只是要求參與他人行動(dòng)(空間)的影響。例如{不開發(fā);(開發(fā),開發(fā))}這個(gè)“不可置信的”均衡。B在博弈的動(dòng)態(tài)進(jìn)行中執(zhí)行(開發(fā),開發(fā)A則執(zhí)行不開發(fā)。A偏離“不B相信A會(huì)執(zhí)行不開發(fā)(注意,B若將策略中的前一個(gè)“開發(fā)”偏離到“不開發(fā)”會(huì)使降低到脅”的意味,盡管這個(gè)均衡結(jié)果(A開發(fā),B不開發(fā))似乎是合理的,但均衡策略本身是不發(fā),不開發(fā)}不是B的合理策略,或者說,不是可置信的策略。A的最優(yōu)選擇。均衡結(jié)果Gx和所有該決策結(jié)的后續(xù)結(jié)Tx(包括終點(diǎn)結(jié))組成,它滿足下列條件:(1)x是一個(gè)單節(jié)信息集,即h(x){x;(2)xT(xxhxxTx,BAA -3,- -3,-左圖中,x和??處以同一信息集1 子博弈要滿足上述兩個(gè)條件的目的是保證子博弈可以對(duì)應(yīng)博弈中各種可能出現(xiàn)的 A開 開 開 -3,-

與人在均衡路徑上的選擇。A選不開發(fā),正因?yàn)锽選開發(fā),這便使得不可置信的成為可(SequentialRationalityA -3,-A -3,-A A -3,-A A -3,-均衡,這是一個(gè)1 (2,

(D,L)是這個(gè)博弈的唯一的與在第一步找到的最后決策者的最優(yōu)選擇構(gòu)成倒數(shù)第二個(gè)決策結(jié)開始的1() 按aR(a)的規(guī)則行動(dòng),參與人1在第一階段的問題是: 令上述問題的最優(yōu)解為a,那么這個(gè)博弈的SPNEa,R(a)) a,Ra。a,Ra))aRa) ) 1111

1 1

11 ?? ??2(??1 在第二階段,參與人2也有無窮多個(gè)選擇,但是只有??2(?)是滿足弈精煉的要求;如果整個(gè)博弈只有唯一的一個(gè)SPNE,那么長(zhǎng)紅線就就是該SPNE下的均衡路徑舉例1 2

1的最優(yōu)選擇上述弈均衡為({U;U′

0,1 2 0,

認(rèn)為參與人2不是理性的,參與人1在第一階段可能選擇D,期待參與人2在第二階段選R,從而自己有機(jī)會(huì)在第三階段選擇U′而得到3,而 22)再比如,即使參與人2知道參與人1是理性′U′L2,-′R-′D- 2,- 2 ′2′

合策略納什均衡((1/2,1/2)2 -2 -2 2 選L。用弈均衡的支付向量替代弈,然后考慮簡(jiǎn)SPNE就容易找到了(3,

(0,(leader向量(q1,s2(q1,支付函數(shù)uiq1,s2(q1))。i(q1,q2qiPQci1,2。

q222q1的最優(yōu)反應(yīng)。q1ac qsqqsq1acSPNE q1ac、q1acq1ac 均衡是(q,s(q)) 第一講中我們得到的Cournot模型的均衡是qq=(ac)/3,比較可 Stackelberg均衡總產(chǎn)量3ac4Cournot均衡總產(chǎn)量2ac31StackelbergCournot1Cournot產(chǎn)總產(chǎn)量提升意味著總利潤(rùn)下降了,從而企業(yè)2的利潤(rùn)一定下降了。1具有先動(dòng)優(yōu)勢(shì)(first-moveradvantage14是否會(huì)相信它的呢?假定企業(yè)2相信了企業(yè)1的威脅,從而選擇q21ac,但給定這個(gè)企業(yè)2的這個(gè)選擇,企業(yè)1的最優(yōu)選擇是14 一的均衡是qq(ac)/ ???=??1(?????1???2?

3(a-c)/8(a- 身也是一個(gè)均衡。因?yàn)椋o定企業(yè)1選擇q1(ac)/3,企業(yè)2的最優(yōu)選擇是1選擇q1ac32s2q1ac3。宏觀經(jīng)濟(jì)學(xué)上與SPNE相對(duì)應(yīng)的是概念是政策的動(dòng)態(tài)一致性(dynamicconsistency(Kydland&Prescott(1977)的貨幣政策模型。這個(gè)模型里,博弈參與人包括Myc2yky2,c0,k1。y是自然失業(yè)率,PhillipscurvePhillipscurve取如下線性形式:yy(e),maxM(,y)c2(ykys.t.yy(e (c2)1(e(k1)y私人部門有理性預(yù)期,那么預(yù)期的通貨膨脹等于。將e代入的反應(yīng)函數(shù),均衡ec1k1)y【越大,即產(chǎn)出對(duì)未預(yù)料到的通脹率越敏yy,一方面忍受著通脹,另一方面又無法享受產(chǎn)出增加之收益。將通脹率代入效用函數(shù)并使用Phillipscurve消去y,得到的短期效用水平為:sM(k1)2y2(1c12sp M(k1)2y2。pp表示事前承諾的零通貨膨脹率。顯然,在選擇短期最優(yōu)通脹率時(shí)的效用水中零通脹率不是一個(gè)動(dòng)態(tài)一致的政策,或者說不是一個(gè)SPNE。假定許諾自己將實(shí)行零通貨膨脹率,并且,私人部門輕信了的許諾。給定e0,的最優(yōu)通貨膨脹率e0c2)1k1)y,對(duì)應(yīng)于這個(gè)通貨膨脹率的f (12(c2)1)((k1)yf(Ms由于無法使私人部門相信零通貨膨脹率而自受其苦。擺脫這一困境的辦法對(duì)自身聲譽(yù)的考慮也是約束機(jī)會(huì)主義行為的一個(gè)重要因素(重復(fù)博弈)托-理論最重要的一個(gè)課題。由于委托人可以利用的主要是委托合同委 人

(1)第一階段委托人選擇是否向?qū)Ψ浇?[R(0);0]人的服務(wù)時(shí)委托人的利益。 努 偷懶[R(0); 托。若人不接受,則收益情況); ); (3)第三階段人選擇努力還是偷懶。如果努力(effort),那么委托人得到較高的產(chǎn)出R(e),但要支付較高的w(e)給人,人得到較高的w(e),但是有較高此時(shí)雙方收益分別為R(s)-w(s);w(s)-s。否有確定性的對(duì)應(yīng),因此委托人仍然可以完全清楚人的選擇,因此本博弈是一個(gè)完全 人的選擇有努力和偷懶兩種可能,因此須分兩種情況討論第二階段的選擇。

[R(0);[R(0);[R(0);[R(0); 最后回到第一階段委托人的選擇。如果人在第二階段選擇,那么委托人的選

[R(0);[R(0);[R(0);[R(0); R(e)=16,R(s)=9。再假設(shè)w(e)=4,w(s)=2。委 人

在該數(shù)值例子當(dāng)中,人努力的激勵(lì)相容約束、人接受委托的參與 [0,0] 努 偷 [0, [7;假定人的努力和工作成果(或產(chǎn)出)之間不再完全一致,但是委托人對(duì)人可概率是0.9。再假設(shè)R(0)=0,其他與前一個(gè)模型一樣。委 人

人 N

[0,N

[00]完美信息的動(dòng)態(tài)博弈,仍然可以用倒

erfae0.9[20w(e)]0.1[10w(e)]

( p1p在人會(huì)選擇接受委托并偷懶的情況下,則委托人有0.1的可能性獲得對(duì)應(yīng)高產(chǎn)出0.1[20w(s)]0.9[10w(s)]

( p2p上述雙方的選擇就是對(duì)應(yīng)兩種不同情況的SPNE。如果人不會(huì)接受委托,委托人(除非委托人支付固定委 人

接 人[0,

[0, 努 偷N

0.9[w(20)e]0.1[w(10)e]0.1[w(20)s]0.9[w(10)s]支付大于等于0,即:0.9[w(20)e]0.1[w(10)e] 0.9[20w(20)]0.1[10w(10)] 述激勵(lì)相容約束和參與約束條件,以及es的數(shù)值,確定w(20)w(10)的數(shù)值。續(xù)努力水平的例的單調(diào)遞增的凸函數(shù)C=C(e)。eRe的隨機(jī)函數(shù),我們系。這樣,委托人的獲益函數(shù)為R-w=R(e)-w[R(e)],人的獲益函數(shù)為w-C=w[R(e)]-C(e)。人的參與約束(PCa)為w[R(e)]-C(e)≥???根據(jù)上述效用函數(shù),委托人首先可以求出最符合自身利益的人努力水平e*。在滿足參與約束的條件下,人愿意接受工作但努力水平不一定是e*,因?yàn)槿耸歉鶕?jù)自身利益最大化行為。要人自覺選擇e*,e*必須符合他自己的最大化利益,即對(duì)其他任何努力水平e都有: 勵(lì)相容約束設(shè)計(jì)函數(shù),就能使人的行為符合自己的利益。341,2的行動(dòng)結(jié)果a1,a2A3,A4中選擇行動(dòng)a3,a4收益函數(shù)為uia1,a2,a3,a4imaxu4(maxu4(a1,a2,a3,a4 均衡(a(a,a),a(a,a)) 3,4的最優(yōu)反應(yīng)必然是aaa),aaa))1,2 maxu(a,a,a(a,a),a(a,aa1A1

maxu(a,a,a(a,a),a(a,a

求得完全但不完美的兩階段可觀察博弈的弈精煉納什均衡結(jié)果a,a,aa,a),aa,a)) 則Qhiej。企業(yè)的邊際成本為常數(shù)c,并且沒有固定成本,從而,企業(yè)i生產(chǎn)的總成本為Cj(hi,ej)c(hiei),另外,產(chǎn)品出口時(shí)企業(yè)還要承擔(dān)關(guān)稅成本:如果j制定的關(guān)稅稅率為tj,企業(yè)i向國(guó)家j出口ei必須支付關(guān)稅tjei給j。i的收益則為本國(guó)總的福利,其中國(guó)家i的總福利是國(guó)家i的消費(fèi)者盈余、企業(yè)i賺取的利潤(rùn)以及i從企業(yè)j收取的關(guān)入之和:i(ti,tj,hi,ei,hj,ej)[a(hiej)]hi[a(eihj)]eic(hjei)tw(t,t,h,e,h,e)1Q2(t,t,h,e,h,e)tii i ii i i假設(shè)已選定的稅率分別為t,t,如果(h,e,h,e)為其余部分企業(yè)1和1 業(yè)2的(兩市場(chǎng))博弈的均衡,對(duì)每一個(gè)企業(yè)i,(h,e)必須滿足 max(t,t,h,e,h,ehi,ei0 由于t,th,e,h,e可以表示為企業(yè)i在市場(chǎng)ij i在市場(chǎng)ih和ej的利潤(rùn)又只是eh和t的函數(shù),企業(yè)i iimaxh[a(he)chi 且e必須滿足 maxe[a(eh)c)]t ei j假設(shè)eac,可得 h1(aec 同時(shí)假設(shè)hact,可得:e1(ahct hacti且eac2tj 際成本假設(shè)下得出的。然而關(guān)稅使得邊際成本不對(duì)稱。例如,在市場(chǎng)i,企業(yè)i的邊際成本是cj的邊際成本則是ctij 為以下同時(shí)行動(dòng)博弈:首先,同時(shí)選擇關(guān)稅稅率t1,t2;第二,i的獲益為W(t,t,h,e,h,e),i1,2,即當(dāng)i、j分別選擇關(guān)稅t、t,企業(yè)按照(3)式中 1itmaxW(tt ti W(t,t)1Q2(t,t,h,e,h,e)t i ii i i1Q2(he)h(eh)e(he)(ac)tet j i(act)3(ac)ac ac1Q2 i j j i(ac2t)acij

(ac)t

ac t i(2(ac)t (act (ac2t t(ac2t i a

于是ti 。這一結(jié)果對(duì)每一個(gè)i都成立,并不依賴于tj,也就是說,在本模型中,a 3論不成立。把ttac代入(3) h4ac且ea 至此我們已求得這一關(guān)稅博弈 弈精煉解為:(tt(ac)/3 hh4ac9eeac9 2ac3Cournoti【(1/2)Q2】在選擇其占優(yōu)策略時(shí),比選擇0關(guān)稅稅率時(shí)要低。事實(shí)上,為0的關(guān)稅稅率是社會(huì)最優(yōu)選擇,因?yàn)閠1t20是下式的解:maxW(t,t)W(t,t1t,t0 1 21i,j在第二階段將按(3)給出的均衡結(jié)果行動(dòng),在第一階段的互動(dòng)決策就成為 工作的兩個(gè)工人,工人i生產(chǎn)的產(chǎn)出為yieii,其中ei是努力程度,i是隨機(jī)擾動(dòng)項(xiàng)。動(dòng)項(xiàng)1,20f為u(w,ewg(eg(e表示努力的負(fù)效用(ge0ge0即e1,e2。最后,參與人各自的收益前面已給出。由于產(chǎn)出(因而工資)不只是參與人行動(dòng)的函數(shù),而且還受隨機(jī)擾動(dòng)因素1,2假 已選定了工資水平w,w,如果一對(duì)努力水平(e,e)是第二階段兩 iii凈化,亦即e必須滿足imaxwprob{y(e)y(e)}wprob{y(e)y(e)}g(eie i(ww)prob{y(e)y(e)}wg(e yieii

prob{y(e)y(e

g(eiprob{y(e)y(e)}prob{ee prob{ee}f( [1F(ee)]f( L

F.O.C.可化為:wwj

e)f()dg(e【法則】在對(duì)稱的均衡(eee j(wHwLj

f(j)2djg(e fj)2dj f)d1exp(

222)d 22

2222

f()2d

exp(2

1exp(t

∴f)2d 它隨著的增加而下降,也就是說e確實(shí)隨著為Ua。因?yàn)樵趯?duì)稱的均衡中每個(gè)工人在競(jìng)賽中獲得勝的概率為prob{yi(e)y(je)}1/2,如

w g(e) w 假設(shè)Ua足夠低,因而愿意激勵(lì)工人參加錦標(biāo)賽,則他會(huì)在(2)的約束條件下,選擇使自己期望收益2eww最大化的工資水平。在最優(yōu)時(shí),(2)取等號(hào)(沒必要給工人工資w2U2g(ew2e2U2g( 的問題最后成為最大化eg(e,這時(shí)他選擇的ege1,代入(1)意味著最優(yōu)激勵(lì)滿足wHwL

f)2d1w2U2g(ewjj 以解得(wH,w 斯敦太空的里工作,同時(shí)也在休斯敦大學(xué)主修電腦。盡管學(xué)校、睡眠與工作幾乎占據(jù)了他大部一個(gè)叫凡內(nèi)芮的朋友在他事業(yè)起步時(shí)給了他最大的鼓勵(lì)。德州的詩詞比賽中不知得多少獎(jiǎng)牌,她的作品讓他愛不釋手,他們合寫了許多很好的作品。一天早上,芮又熱情邀請(qǐng)到她家的牧場(chǎng)烤肉。芮知道音樂的執(zhí)著。然而面對(duì)那遙遠(yuǎn)的音樂界及整個(gè)陌生的唱片市場(chǎng),他們一點(diǎn)門路都沒有。他就一定要所有要準(zhǔn)備的作品全部修飾好,排練就位準(zhǔn)備好。那么你的第6個(gè)月,就是要把那些沒道理應(yīng)該有你自己的一個(gè)或室。那么你的第3年,可能是先跟這個(gè)圈子里的人一起工作,那么【故事2:一條當(dāng)我遇到一個(gè)自己不敢直面的時(shí),我就會(huì)閉上眼睛,深呼吸,想象自己是一個(gè)80歲的老人,因?yàn)槿松性艞壓吞颖苓^的無數(shù)而懊惱不已。當(dāng)我進(jìn)入到那個(gè)老人的心態(tài)之后,(commitment-1,--2,--2,-0,-1,-看芭蕾。由于丈夫喜歡對(duì)家里的事做主,所以每周末他們都會(huì)去看比賽,丈夫因此0,-1,0,-1,---在房地產(chǎn)開發(fā)博弈中,我們知道均衡(不開發(fā),{開發(fā),開發(fā)}依賴于參與人的A -3,-

在A決策之前,B與某個(gè)客戶簽訂一個(gè)合同,規(guī)B在一個(gè)特定的時(shí)刻交付客戶若干面積的寫簽訂該合同就是一個(gè)承諾行動(dòng),從而B一個(gè)可信的:如果A開發(fā),B不開發(fā)損失更多(3.5>3)。3500B損失什么,反而使B得利10002,U1

5,′U′′

SPNE1在第一12D L1,

4,

擇R,我接下來就再選D′;21許諾,自己選R1也信守許諾選D′,這時(shí)(4,2)的改進(jìn)的結(jié)果出現(xiàn)預(yù)期到這種情況,2LR;

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請(qǐng)下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請(qǐng)聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會(huì)有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫網(wǎng)僅提供信息存儲(chǔ)空間,僅對(duì)用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對(duì)用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對(duì)任何下載內(nèi)容負(fù)責(zé)。
  • 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請(qǐng)與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶因使用這些下載資源對(duì)自己和他人造成任何形式的傷害或損失。

最新文檔

評(píng)論

0/150

提交評(píng)論