![完全信息動態(tài)博弈課件_第1頁](http://file4.renrendoc.com/view/97207fb12069a8840bab239a0f7c3ba0/97207fb12069a8840bab239a0f7c3ba01.gif)
![完全信息動態(tài)博弈課件_第2頁](http://file4.renrendoc.com/view/97207fb12069a8840bab239a0f7c3ba0/97207fb12069a8840bab239a0f7c3ba02.gif)
![完全信息動態(tài)博弈課件_第3頁](http://file4.renrendoc.com/view/97207fb12069a8840bab239a0f7c3ba0/97207fb12069a8840bab239a0f7c3ba03.gif)
![完全信息動態(tài)博弈課件_第4頁](http://file4.renrendoc.com/view/97207fb12069a8840bab239a0f7c3ba0/97207fb12069a8840bab239a0f7c3ba04.gif)
![完全信息動態(tài)博弈課件_第5頁](http://file4.renrendoc.com/view/97207fb12069a8840bab239a0f7c3ba0/97207fb12069a8840bab239a0f7c3ba05.gif)
版權說明:本文檔由用戶提供并上傳,收益歸屬內容提供方,若內容存在侵權,請進行舉報或認領
文檔簡介
2完全信息動態(tài)博弈擴展型博弈表述擴展型博弈的戰(zhàn)略及納什均衡子博弈精煉納什均衡子博弈精煉納什均衡應用舉例2完全信息動態(tài)博弈擴展型博弈表述12完全信息動態(tài)博弈動態(tài)博弈:參與人的行動有先后順序,且后行動者能夠觀察到先行動者的行動(電信公司、電信用戶及資費套餐)。先行動者的選擇影響后行動者的選擇空間,后行動者可以觀察到先行動者做了什么選擇,因此,為了做出最優(yōu)的行動選擇,每個參與人都必須這樣思考問題:如果我如此選擇,對方將如何應對?給定他的應對,什么是我的最優(yōu)選擇?(美女;帥哥)例:欺負他人可以獲得快樂,你會欺負他人嗎?不會。欺負他人會擔心他人的報復,抵消了從欺負他人的行為中獲得快樂?!刃袆诱咴谶x擇行動時要考慮自己的選擇對后行動者的影響。2完全信息動態(tài)博弈動態(tài)博弈:參與人的行動有先后順序,且后行2一、動態(tài)博弈的擴展式表述I
如何用擴展式表述(extensiveformrepresentation)來描述動態(tài)博弈?
例1,解放初,美國總是尋找各種機會來侵犯我國。對此,毛主席提出了“人不犯我、我不犯人,人若犯我、我必犯人”的戰(zhàn)略方針。該動態(tài)博弈的戰(zhàn)略式表述局中人:美國、中國行動空間:美國“犯我”或“不犯我”,中國“犯人”或“不犯人”行動順序:美國先行動,我國依美國的行動而后動支付:這樣假設支付情況:若美國“犯我”,中國“犯人”,則支付向量為(-2,-2);一、動態(tài)博弈的擴展式表述I如何用擴展式表述(3一、動態(tài)博弈的擴展式表述Ⅱ
n人有限戰(zhàn)略的擴展式表述:博弈樹(gametree)犯人犯我不犯我犯人不犯人不犯人美國我國我國(1,1)(3,-5)(2,-4)(-2,-2)若美國“犯我”,中國“不犯人”,則支付向量為(2,-4);若美國“不犯我”,中國“犯人”,則支付向量為(3,-5);若美國“不犯我”,中國“犯人”,則支付向量為(1,1)。2人有限博弈的戰(zhàn)略式表述:支付矩陣決策結:行動的時點枝終點結一、動態(tài)博弈的擴展式表述Ⅱn人有限戰(zhàn)略的擴展式表犯人犯我4參與人集合:,此外,虛擬參與人“自然”;參與人的行動順序(theorderofmoves):誰在什么時候行動;參與人的行動空間(actionset):在每次行動時,參與人有些什么選擇。參與人的信息集(informationset):每次行動時,參與人知道些什么;參與人的支付函數(shù);外生事件(即自然的選擇)的概率分布擴展式表述的要素:一、動態(tài)博弈的擴展式表述Ⅵ參與人集合:,此外,虛擬參與人“自然5一、動態(tài)博弈的擴展式表述Ⅲ例2:兩個房地產商A、B進行房地產開發(fā)博弈。市場需求大、小的概率各占50%。投入:1億。假定市場上有兩棟樓出售:需求大時,每棟售價1.4億,需求小時,售價7千萬;如果市場上只有一棟樓需求大時,可賣1.8億需求小時,可賣1.1億行動順序:(1)開發(fā)商A首先行動,選擇開發(fā)或不開發(fā);(2)在A決策后,自然選擇市場需求的大?。?3)開發(fā)商B在觀測到A的決策和市場需求后,決定是否開發(fā)一、動態(tài)博弈的擴展式表述Ⅲ例2:兩個房地產商A6A開發(fā)不開發(fā)NN大小1/21/2大小1/21/2BBBB開發(fā)不開發(fā)開發(fā)不開發(fā)開發(fā)不開發(fā)開發(fā)不開發(fā)(4,4)(8,0)(-3,-3)(1,0)(0,8)(0,0)(0,1)(0,0)房地產開發(fā)博弈(圖2.1)注意:支付向量的順序與博弈樹上行動順序是對應的!A開發(fā)不開發(fā)NN大小1/21/2大小1/21/2BBBB開發(fā)7A開發(fā)不開發(fā)NN大小1/21/2大小1/21/2BBBB開發(fā)不開發(fā)開發(fā)不開發(fā)開發(fā)不開發(fā)開發(fā)不開發(fā)(4,4)(8,0)(-3,-3)(1,0)(0,8)(0,0)(0,1)(0,0)
B在決策時不確切地知道自然的選擇;B的信息集由4個變?yōu)?個該參與人知道博弈進入該集合的某個決策結,但不知道自己究竟處于哪一個決策結A開發(fā)不開發(fā)NN大小1/21/2大小1/21/2BBBB開發(fā)8A開發(fā)不開發(fā)NN大小1/21/2大小1/21/2BBBB開發(fā)不開發(fā)開發(fā)不開發(fā)開發(fā)不開發(fā)開發(fā)不開發(fā)(4,4)(8,0)(-3,-3)(1,0)(0,8)(0,0)(0,1)(0,0)
B知道自然的選擇;但不知道A的選擇(或A、B同時決策)
房地產開發(fā)博弈A開發(fā)不開發(fā)NN大小1/21/2大小1/21/2BBBB開發(fā)9信息集(informationset)的概念:是決策結集合的一個子集,該子集包括所有滿足下列條件的決策結:每一個決策結都是同一參與人的決策結;該參與人知道博弈進入該集合的某個決策結,但不知道自己究竟處于哪一個決策結。只包含一個決策結的信息集稱為單結信息集,如果博弈樹的所有信息都是單結的,該博弈稱為完美信息博弈
。(博弈中沒有任何參與人同時行動,且后行動者能觀察到先行動者的行動,且所有參與人觀察到N的行動)一、動態(tài)博弈的擴展式表述Ⅳ信息集(informationset)的概念:是決策結集合10A開發(fā)不開發(fā)NN大小1/21/2大小1/21/2BBBB開發(fā)不開發(fā)開發(fā)不開發(fā)開發(fā)不開發(fā)開發(fā)不開發(fā)(4,4)(8,0)(-3,-3)(1,0)(0,8)(0,0)(0,1)(0,0)表示B在行動前既觀察不到A的行動,也觀察不到N的行動房地產開發(fā)博弈A開發(fā)不開發(fā)NN大小1/21/2大小1/21/2BBBB開發(fā)11N大小AA開發(fā)不開發(fā)開發(fā)不開發(fā)1/2BBBB開發(fā)不開發(fā)開發(fā)不開發(fā)開發(fā)不開發(fā)開發(fā)不開發(fā)(4,4)(8,0)(0,8)(0,0)(-3,-3)(1,0)(0,1)(0,0)
不同的博弈樹可能代表相同的博弈,但有一個基本準則一個參與人決策之前知道的事情必須出現(xiàn)在該參與人的決策結之前實際上是A先行動>N>B(圖2.5)1/2N大小AA開發(fā)不開發(fā)開發(fā)不開發(fā)1/2BBBB開發(fā)不開發(fā)開發(fā)不12靜態(tài)博弈用擴展式表述。例囚徒困境博弈一、動態(tài)博弈的擴展式表述ⅤBAA坦白抵賴坦白抵賴坦白抵賴(-8,-8)(0,-10)(-10,0)(-1,-1)A坦白抵賴BB坦白抵賴坦白抵賴(-8,-8)(0,-10)(-10,0)(-1,-1)靜態(tài)博弈用擴展式表述。例囚徒困境博弈一、動態(tài)博弈的擴展式表述13二、動態(tài)博弈中的戰(zhàn)略令Hi為第i個參與人的信息集的集合,Ai=
hiHiA(hi)為其行動集合,其中A(hi)是在信息集hi的行動集合。參與人i的一個純戰(zhàn)略是從信息集集合Hi到行動集Ai的一個映射,用Si:Hi
Ai表示,其中,對于所有的hi
Hi,Si(hi)A(hi),參與人的純戰(zhàn)略空間Si就是所有的Si的集合,因為每一個純戰(zhàn)略都是從信息集到行動集的一個映射,Si可以表示為每一個信息集hi上的行動空間A(hi)的笛卡爾積:Si=
hiHiA((hi)
二、動態(tài)博弈中的戰(zhàn)略令Hi為第i個參與人的信息集的集合,A14二、動態(tài)博弈中的戰(zhàn)略戰(zhàn)略是一個完備的行動計劃:在博弈開始之前就規(guī)定出每一個決策點上的選擇,即使這個決策點實際上不會出現(xiàn)。例1:房地產開發(fā)博弈(映射關系)
AB開發(fā)開發(fā)不開發(fā)不開發(fā)(0,0)(0,1)開發(fā)不開發(fā)(1,0)(-3,-3)B二、動態(tài)博弈中的戰(zhàn)略戰(zhàn)略是一個完備的行動計劃:在博弈開始之前15若A先行動,B在知道A的行動后行動,則A有一個信息集,兩個可選擇的行動,戰(zhàn)略空間為:(開發(fā),不開發(fā));B有兩個信息集,2個可選擇的行動,B有四個純戰(zhàn)略:開發(fā)策略:不論A開發(fā)不開發(fā),我開發(fā)——{開發(fā),開發(fā)}追隨策略:A開發(fā)我開發(fā),A不開發(fā)我不開發(fā)——{開發(fā),不開發(fā)};反向策略:A開發(fā)我不開發(fā),A不開發(fā)我開發(fā)——{不開發(fā),開發(fā)};不開發(fā)策略:不論A開發(fā)不開發(fā)我不開發(fā))——{不開發(fā),不開發(fā)};戰(zhàn)略空間為:{開發(fā),開發(fā)}、{開發(fā),不開發(fā)}、{不開發(fā),開發(fā)}
(不開發(fā),不開發(fā)}。A開發(fā)不開發(fā)BB開發(fā)不開發(fā)開發(fā)(-3,-3)(1,0)(0,1)(0,0)不開發(fā)xx’什么是參與人的戰(zhàn)略?若A先行動,B在知道A的行動后行動,則A有一個信息集,兩個可16三、戰(zhàn)略式表述下的納什均衡Ⅰ開發(fā)不開發(fā)AB{開發(fā),開發(fā)}-3,-3-3,-31,01,00,10,00,10,0{開發(fā),不開發(fā)}{不開發(fā),開發(fā)}{不開發(fā),不開發(fā)}A(不開發(fā),{開發(fā),開發(fā)})三、戰(zhàn)略式表述下的納什均衡Ⅰ開發(fā)不開發(fā)AB{開發(fā),開發(fā)}-17三個純戰(zhàn)略NE:(開發(fā),{不開發(fā),開發(fā)});(開發(fā);{不開發(fā),不開發(fā)});(不開發(fā),{開發(fā),開發(fā)})
問題:哪一個會出現(xiàn)呢?
三個純戰(zhàn)略NE:(開發(fā),{不開發(fā),開發(fā)});(開發(fā);{不開發(fā)18三、戰(zhàn)略式表述下的納什均衡ⅡNE(不開發(fā),{開發(fā),開發(fā)}):B威脅無論A是否開發(fā)自己都將開發(fā),A相信了威脅,則最好選擇不開發(fā);如果A選擇不開發(fā),則B選擇{開發(fā),開發(fā)}是最優(yōu)的。A會相信B的威脅嗎?如果A選擇了開發(fā),B的最好選擇不開發(fā)?!狟的威脅是不可置信的(notcredible):給定A選擇了“開發(fā)”,“開發(fā)”不是B的最優(yōu)選擇。(不開發(fā),{開發(fā),開發(fā)})不會是該博弈合理的均衡。為什么?三、戰(zhàn)略式表述下的納什均衡ⅡNE(不開發(fā),{開發(fā),開發(fā)}):19三、戰(zhàn)略式表述下的納什均衡Ⅲ納什均衡假定每一個參與人在選擇自己的最優(yōu)戰(zhàn)略時假定所有其他參與人的戰(zhàn)略是給定的,即參與人并不考慮自己的選擇對他人的影響。但是如果參與人的行動有先有后,后行動者的選擇空間依賴于前行動者的選擇,先行動者在選擇時不可能不考慮自己的行動對后行動者的影響。NE(開發(fā),{不開發(fā),不開發(fā)}):{不開發(fā),不開發(fā)}不是B一個合理的戰(zhàn)略,因為如果A選擇了不開發(fā),B的最優(yōu)選擇是開發(fā)而非不開發(fā)。NE(開發(fā),{不開發(fā),開發(fā)}):若A選擇開發(fā),B的最優(yōu)選擇是開發(fā);若A選擇不開發(fā),則B選擇開發(fā)。A預測到自己的選擇對B產生的影響,選擇開發(fā)。三、戰(zhàn)略式表述下的納什均衡Ⅲ納什均衡假定每一個參與人在選擇自20四、子博弈精煉納什均衡IⅡⅢ不包含不可置信的行動的戰(zhàn)略所組成的NE被稱為“精煉納什均衡”(PerfectNashequilibrium);也就是說,不論過去發(fā)生了什么,構成精煉納什均衡的戰(zhàn)略,其所規(guī)定的行動在每一個決策點上都是最優(yōu)的;首先必須是“納什均衡”,但并非所有納什均衡都是合理的;只有其戰(zhàn)略不包含不可置信行動的納什均衡才是合理的。四、子博弈精煉納什均衡IⅡⅢ不包含不可置信的行動的戰(zhàn)略所組成21子博弈。A
開發(fā)不開發(fā)
B
B開發(fā)不開發(fā)開發(fā)不開發(fā)
(-3,-3)(1,0)(0,1)(0,0)定義:一個擴展式博弈的子博弈G由一個決策結和所有該決策結的后續(xù)結T(x)組成,它滿足下列條件:1、x是單結信息集,即h(x)=x;2、對于所有的x1T(x),如果x2h(x1),那么x2T(x)子博弈。22有幾個子博弈?A
UDB
BLRLR
C
C
C
Clrlrlrlr(4,4)(8,0)(-3,-3)(1,0)(0,8)(0,0)(0,1)(0,0)o
0
有幾個子博弈?o023不開發(fā)四、子博弈精煉納什均衡Ⅱ子博弈:由原博弈中某個決策點(信息集)開始的部分構成一個子博弈。原博弈不開發(fā)開發(fā)
開發(fā)不開發(fā)(0,0)(0,1)開發(fā)(1,0)(-3,-3)BAxx’x子博弈I(-3,-3)(1,0)x’子博弈Ⅱ(0,1)(0,0)開發(fā)不開發(fā)不開發(fā)開發(fā)不開發(fā)四、子博弈精煉納什均衡Ⅱ子博弈:由原博弈中某個決策點(24四、子博弈精煉納什均衡Ⅲ一個納什均衡是精煉納什均衡,當只當參與人的戰(zhàn)略在每個子博弈中都構成納什均衡,也就是說,組成精煉納什均衡的戰(zhàn)略必須在每一個子博弈中都是最優(yōu)的?!獫蔂栻v(Selten)(1965):子博弈精煉納什均衡(SubgameperfectNashequilibrium,SPNE)序貫理性(sequentialrationality):不管過去發(fā)生什么,參與人在每一個決策結上最優(yōu)化自己的行動。例,房地產開發(fā)博弈:(不開發(fā),{開發(fā),開發(fā)})在子博弈Ⅰ上不構成NE;(開發(fā),{不開發(fā),不開發(fā)})在子博弈Ⅱ不構成NE;(開發(fā),{不開發(fā),開發(fā)})在所有子博弈上都構成NE。四、子博弈精煉納什均衡Ⅲ一個納什均衡是精煉納什均衡,當只當參25四、子博弈精煉納什均衡Ⅳ例UDLR(2,2)(3,1)(0,0)122,22,23,10,01UDLR2NE(U,R)在子博弈上不構成NE;NE(D,L)在子博弈上構成NE,所以為SPNE;四、子博弈精煉納什均衡Ⅳ例UDLR(2,2)(3,1)(0,26四、子博弈精煉納什均衡Ⅵ逆向歸納法(backwardinduction)求解有限博弈的精煉納什均衡:從最后一個決策點開始,找出該子博弈的納什均衡;然后再倒回到倒數(shù)第二個決策點,找出決策者的最優(yōu)決策(假定最后一個決策者的決策是最優(yōu)的;如此一直到初始決策點,所有子博弈上的最優(yōu)選擇就是精煉納什均衡。又稱“rollback”。逆向歸納法只適用于完美信息博弈。四、子博弈精煉納什均衡Ⅵ逆向歸納法(backwardind27犯人犯我不犯我犯人不犯人不犯人美國我國我國(1,1)(3,-5)(2,-4)(-2,-2)例1:逆向歸納法找中美軍事博弈的SPNE均衡為(不犯我,{犯人,不犯人})犯人犯我不犯我犯人不犯人不犯人美國我國我國(1,1)(3,-28例2:121(2,0)(5,0)(4,2)(1,1)UDRLU’D’均衡為({U,U’};L),均衡結果為1選擇U。例2:121(2,0)(5,0)(4,2)(1,1)UDRL29四、子博弈精煉納什均衡Ⅶ特定的納什均衡下所經過的決策點和最優(yōu)選擇構成的路徑,稱為均衡路徑(equilibriumpath);其他的路徑是非均衡路徑(off-equilibriumpath);SPNE與NE的實際區(qū)別:SPNE要求在每個子博弈上構成納什均衡=構成SPNE的戰(zhàn)略不僅在均衡路徑的決策結上最優(yōu),而且在非均衡路徑的決策結上也是最優(yōu)的
四、子博弈精煉納什均衡Ⅶ特定的納什均衡下所經過的決策點和最優(yōu)30輪流出價的討價還價模型兩人分一塊蛋糕,參與人1先出價,參與人2可以接受或拒絕.如果參與人2接受,博弈結束;如果參與人2拒絕,參與人2出價,參與人1此時必須接受.問此博弈的精煉的納什均衡?用x表示參與人1的份額,(1-x)表示參與人2的份額,假定參與人1與參與人2的貼現(xiàn)因子分別為
1,
2輪流出價的討價還價模型兩人分一塊蛋糕,參與人1先出價,參與人31
乙112乙(1,-1)甲(-1,1)112甲1(-1,1)甲1(-1,1)2211(1,-1)乙乙1乙甲2乙21甲21(-1,1)1甲(1,-1)(1,-1)均衡路徑:(2,2,1)(2,1,2)乙112乙(1,-1)甲(-1,132甲必勝,因為他始終在開局拿走2根火柴,剩下3根,不管乙拿1或2根,甲都可獲得最后的2根或1根火柴從而獲勝。但是,如果假設初始的火柴根數(shù)為30根或100根等等,那么結果如何?仍然用逆向歸納法。假設參與人面臨最后的1或2根,則必勝;但若面臨最后的3根,則必輸;當參與人面臨的是4根或5根,則他可以拿走1根或2根,使對手面臨3根的局面,則必勝;如果參與人面臨的是6根火柴,則無論拿1根還是2根都不能使對手面臨3根火柴的局面,而對手反而可以使他面臨3根火柴的局面,則對手必勝;若參與人面臨7根或8根火柴,則他可使對手面臨6根火柴而對手必輸;若處于9根,則將被對手逼迫到6根火柴的位置而自己必輸……甲必勝,因為他始終在開局拿走2根火柴,剩下3根,不管乙33例,最后通牒博弈
張三拾到100塊,被李四見到。見者有份,于是2人決定如何分這筆錢。極端地假設他們的談判只進行一個回合,即由張三提出一個分配比例(最小計算單位為元),然后李四表示接受不接受,如果接受就按照提議分,如果不接受則將錢交到警察局,誰都得不到。張三如何提議?例,最后通牒博弈34最后通牒博弈實驗結果:現(xiàn)實生活中提議者給回應者1元錢的話,常常會遭到回應者拒絕;不少被接受的分配方案是分給回應者30-50元,20元以下的分配被拒絕的頻率很高。人除了自利偏好還存在公平偏好(FairnessPreferences),即在追求個人收益時還會關注收益分配或行為動機是否公平?!拔业氖找娑噙^對方太多,我可能會不舒服”——收益公平“知恩圖報,以牙還牙”:當別人對你友善時你也對別人友善,當別人對你不善時你也對別人不善,甚至犧牲自己利益去報復——動機公平公平偏好會影響人們的行為決策。最后通牒博弈實驗結果:35分析動態(tài)博弈的思路:向前展望,向后推理,即面向未來,思考現(xiàn)在,站在未來的立場思考現(xiàn)在的行動方案。網(wǎng)絡詩歌我站在未來的山坡上回頭看過去和現(xiàn)在如同不再有懸念的平靜湖面所有發(fā)生的一切都是如此清晰和必然分析動態(tài)博弈的思路:向前展望,向后推理,即36甲右下上前后左甲乙(2,0)(1,1)(0,2)(3,0)練習:甲右下上前后左甲乙(2,0)(1,1)(0,2)(3,0)練37右下上前后左五、序貫理性與理性操縱I甲乙甲(2,0)(1,1)(100,0)(0,100)操縱理性的博弈均衡結果為:甲選擇下結束博弈右下上前后左五、序貫理性與理性操縱I甲乙甲(2,0)(1,138五、序貫理性與理性操縱Ⅱ
現(xiàn)實中該均衡很可能不會出現(xiàn)。為什么?甲可能會想,如果我選擇“上”,即使乙選擇了“左”,則我也可以得到1個單位支付;但是,如果乙認為我是傻子,則乙可能會冒險選擇一次“右”……而如果我選擇前,我就可以獲得100個單位的支付。甲真的選擇了“上”如果乙認為甲真的是傻子,那么乙可能冒險選擇“右”。甲選擇“前”。
理性操縱:利用對方的理性不足而引誘對方上鉤,獲取利益。如,三國中黃蓋詐降五、序貫理性與理性操縱Ⅱ現(xiàn)實中該均衡很可能不會出39六、不可置信威脅I不可置信的威脅(空頭威脅,emptythreat)精煉納什均衡剔除了不可置信的威脅,使得我們可以更合理地對博弈中參與人行為的預測;為什么存在不可置信威脅?
例1,司馬相如與卓文君的戀愛故事默認結婚(-1,1)(0,-2)(1,-1)斷絕父女關系斷絕戀愛關系文君父親威脅所采取的策略會損害威脅者自己利益因而根本不會實施(根源是事前最優(yōu)與事后最優(yōu)不同);六、不可置信威脅I不可置信的威脅(空頭威脅,emptyth40六、不可置信威脅Ⅱ其他例子管教孩子MBA復試錄取打擊進入(0,100)(50,50)(-10,30)默認不進入進入者在位者例2,市場進入博弈六、不可置信威脅Ⅱ其他例子打擊進入(0,100)(50,5041七、承諾Ⅰ如何將不可置信的威脅變成可置信的威脅?——承諾(招聘,勤奮)例,市場進入博弈中的承諾行動在位者事前擴大生產能力,維護費用30萬,但打擊進入者的成本降低了,扣除維護費用后也可獲得30萬,如果進入者進入而在位者默認,則在位者利潤為50-30=20萬打擊進入(0,70)(50,20)(-10,30)默認不進入進入者在位者擴大生產能力在位者七、承諾Ⅰ如何將不可置信的威脅變成可置信的威脅?——承諾(招42七、承諾Ⅱ承諾行動:使威脅或承諾可信的行動,采取承諾行動過后,實施威脅或承諾符合威脅者或承諾者的利益擴大生產能力雖然產生30萬維護費用,但這樣做仍然是值得的;這一模型解釋了現(xiàn)實中大部分壟斷企業(yè)有閑置生產能力(中國國情學生學習托福)其他承諾方式:召開新聞發(fā)布會公開宣稱自己打擊意圖,有聲望的企業(yè)言出必行。七、承諾Ⅱ承諾行動:使威脅或承諾可信的行動,采取承諾行動過后43七、承諾Ⅲ其他承諾行動的例子:項羽破釜沉舟對秦軍最惠條款:生產耐用品的企業(yè)經常被“降價預期”所困擾:如果消費者預期企業(yè)將降價,他們將會等待,結果,企業(yè)只能降價。如汽車行業(yè)面臨的問題;最惠條款可以起到承諾的作用:企業(yè)不會降價了。(100,80.40.20)七、承諾Ⅲ其他承諾行動的例子:44合同寫入“差價賠付”記者向該樓盤售樓處進行了了解,一位銷售員表示“現(xiàn)在這批房子均價2萬/平,一共只有100套,面積有145、168、180平三種,上午就賣了20多套了”。值得一提的是,這批房源還有一個“最低價保證”,“我們還承諾,在交房前3個月,如果房價低于現(xiàn)在這批房子的價格,那么我們會按照差價金額補償給你,這是寫入購房合同的”,這也是此番宏觀調控下首個承諾差價賠付的項目。某房產調查顯示,該樓盤為今年9月25日開盤的新項目,當時報價為低區(qū)26500元/平,高區(qū)28000元/平,購房享5萬抵20萬的優(yōu)惠。10月中旬左右,該案也曾推出10套特價房,在減15萬的基礎上再打95折。但網(wǎng)上房地產最新數(shù)據(jù)顯示,其9月份推出的340套房源,僅有10套完成簽約銷售。合同寫入“差價賠付”45九、子博弈精煉納什均衡應用舉例ⅠStackelberg(1934)寡頭競爭模型企業(yè)1為領頭企業(yè),首先選擇自己的產量;企業(yè)2為跟隨者,根據(jù)企業(yè)1的產量選擇自己的產量。設市場需求函數(shù)為企業(yè)i的利潤為逆向歸納法求解SPNE結果。第二階段企業(yè)2的問題為一階條件,也就是反應函數(shù)為與cournot模型中企業(yè)2的反應函數(shù)相同九、子博弈精煉納什均衡應用舉例ⅠStackelberg(1946九、子博弈精煉納什均衡應用舉例Ⅰ企業(yè)1會預測到企業(yè)2的反應,因此第一階段的問題為代入企業(yè)2的反應函數(shù)得一階條件為代入反應函數(shù),即得企業(yè)2的最優(yōu)產量為九、子博弈精煉納什均衡應用舉例Ⅰ企業(yè)1會預測到企業(yè)2的反應,47九、子博弈精煉納什均衡應用舉例Ⅰ比較stackelberg模型和counot模型結果:均衡總產量:企業(yè)1均衡產量:企業(yè)2均衡產量:為什么?企業(yè)1存在先動優(yōu)勢(first-moveradvantage)九、子博弈精煉納什均衡應用舉例Ⅰ比較stackelberg模48九、子博弈精煉納什均衡應用舉例Ⅱ宏觀經濟政策的動態(tài)一致性(dynamicconsistency)——2004年諾貝爾經濟學獎(Kydland&Prescott,1977)
背景1970年代以前,經濟學領域基本上是凱恩斯主義思想統(tǒng)治著經濟政策的研究。經濟學家通常把宏觀經濟波動主要歸因于需求方的變動,經濟學家對宏觀經濟政策的分析也通常集中在解釋和說明應該執(zhí)行什么樣的貨幣和財政政策來抵消需求的波動,這個時候還幾乎沒有人致力于解釋實際經濟政策的運作。九、子博弈精煉納什均衡應用舉例Ⅱ宏觀經濟政策的動態(tài)一致性(d49
從1970年代開始,該分析方法的缺陷日益顯現(xiàn),基于當時的經濟理論所制定的經濟穩(wěn)定政策根本無法實現(xiàn)預定的目標。所以,在很長一段時間里,西方世界的經濟都處于一種滯脹狀態(tài)——失業(yè)和通貨膨脹并存,而盛行的理論卻無法對此作出有說服力的解釋。與此同時,宏觀經濟波動并非僅僅緣于需求波動的特征也表現(xiàn)得十分明顯,供應方面的波動(比如石油價格上漲、勞動生產率增長下降等)在經濟周期中的作用變得越來越突出。正是在這樣一種背景下,Kydland&Prescott對宏觀經濟及政策的觀察、解釋和分析運用新的方法,提供了一個獨特的視角。九、子博弈精煉納什均衡應用舉例Ⅱ從1970年代開始,該分析方法的缺陷日益顯現(xiàn),基于九、子50九、子博弈精煉納什均衡應用舉例ⅡDynamicConsistencyortimeconsistency動態(tài)不一致:政策在制定時是最優(yōu)的,但是在執(zhí)行時不再是最優(yōu)的,因而制定政策的政府不會實施政策。模型:KylandandPrescott的貨幣政策模型參與人:政府與私人部門行動順序:私人部門選擇預期的通貨膨脹率,政府根據(jù)私人部門的預期通脹率選擇實際的通脹率政府關心通貨膨脹和失業(yè)率,設其效用函數(shù)為其中,為通貨膨脹率,為實際產量,為自然失業(yè)率下的產量,和為系數(shù),容忍某種程度的通貨膨脹。九、子博弈精煉納什均衡應用舉例ⅡDynamicConsis51九、子博弈精煉納什均衡應用舉例Ⅱ設含有通貨膨脹的菲力普斯曲線(expectationalPhillipscurve),又稱意外產出函數(shù)(surpriseproductionfunction),為其中,為私人部門預期的通貨膨脹率。政府選擇最優(yōu)的通貨膨脹率,即政府對于私人部門選擇預期通貨膨脹率的反應函數(shù)表示產出對于未預期到的通脹率的敏感程度九、子博弈精煉納什均衡應用舉例Ⅱ設含有通貨膨脹的菲力普斯曲線52九、子博弈精煉納什均衡應用舉例Ⅱ設有理性預期,即那么,政府的效用為如果承諾實行零通脹率,政府的效用為則有,均衡通貨膨脹率為但是政府不會真的保證零通貨膨脹率,因為一旦私人部門相信零通貨膨脹,政府的最優(yōu)通貨膨脹率和效用分別為越大,扭曲程度越大,均衡通常率越高九、子博弈精煉納什均衡應用舉例Ⅱ設有理性預期,即那么,政府的53九、子博弈精煉納什均衡應用舉例Ⅱ政府根本沒有積極性兌現(xiàn)自己的承諾,而會正的通脹率;進一步,私人部門具有理性預期,能夠正確預測政府行為,政府無法獲得的效用水平。零通脹率非SPNE結果,或者說是一個動態(tài)不一致的政策。九、子博弈精煉納什均衡應用舉例Ⅱ政府根本沒有積極性兌現(xiàn)自己的54十、討價還價(Bargaining)博弈討價還價問題的普遍性幾乎所有的交易都涉及討價還價:買賣雙方之間雇員與雇主之間合伙人之間夫妻之間政治領域之間中央政府與地方政府國家之間十、討價還價(Bargaining)博弈討價還價問題的普遍性55十、討價還價(Bargaining)博弈所有的討價還價問題的共同之處:首先,參加談判各方通過達成協(xié)議所能夠產生和得到的總收益應該比他們獨立行動所能得到的個人收益之和要大。達成某種協(xié)議是當事人的共同利益,但他們之間在究竟達成哪一個協(xié)議的問題上存在利益沖突;協(xié)議的多重性可能阻止任何協(xié)議的出現(xiàn)。
例,假定2個人分1美元。要求每個人同時報出其想要的數(shù)量。如果他們所報數(shù)量x和y加起來等于或小于1,每個人得到其所報的量。否則一無所獲。NE為?典型的“合作與競爭”問題;十、討價還價(Bargaining)博弈所有的討價還價問題的56十、討價還價(Bargaining)博弈這不是一個零和博弈。表面看起來是一個零和博弈:當剩余存在時,談判就是為了瓜分它。每個討價還價者都試圖讓自己多得,而留給別人更少。但在這背后隱藏著一個危險,如果協(xié)議未能達成,沒有人可以得到任何一點剩余。這一不利于雙方的結果,以及雙方都要避免之的愿望,為威脅(明顯的或隱含的)創(chuàng)造了可能,這就使得討價還價成為一個策略問題。十、討價還價(Bargaining)博弈這不是一個零和博弈。57十、討價還價(Bargaining)博弈分析討價還價問題的兩種思路:合作博弈思路(cooperativegameapproach):參與人聯(lián)合作出決定,協(xié)議對雙方具有約束力;——強調集體理性非合作博弈思路(non-cooperativeapproach):每個參與人獨立決策,協(xié)議是一個納什均衡,沒有約束力;強調的是個人理性;注意:這里“合作”與“非合作”指的是“聯(lián)合決策”(jointaction)和“獨立決策”(separateaction)。十、討價還價(Bargaining)博弈分析討價還價問題的兩58十、討價還價(Bargaining)博弈納什合作解——各方共同尋找和實施一個解決方案,可能找一個中立的第三方來作為執(zhí)行的仲裁者??紤]一個畫家與拍賣商之間的討價還價問題:如果畫家自己出售畫,可得1000元;如果拍賣商干其他事情(如拍賣別人的畫),收入是500元;如果畫家委托拍賣商出售畫,畫的價格是3000元。他們之間如何分配這3000元?請同學們給出建議。十、討價還價(Bargaining)博弈納什合作解——59十、討價還價(Bargaining)博弈問題的一般化:設想兩個人,A和B,之間要就總價值等于V的分配問題討價還價;如果他們之間能達成協(xié)議,V按照協(xié)議規(guī)定分配;如果不能達成協(xié)議,A得到a,B得到b。(a,b)被稱“威脅點”或非合作狀態(tài)(statusquo),是不能達成協(xié)議的最好選擇。a+b<V;S=V-a-b是合作帶來的剩余(surplus)十、討價還價(Bargaining)博弈問題的一般化:60討價還價(Bargaining)博弈分配規(guī)則:我們用x表示A得到的價值,y表示B得到的價值,假定A和B分別從剩余價值S中達到h和k的份額,那么:x=a+h(V-a-b);x-a=h(V-a-b)y=b+k(V-a-b);y-b=k(V-a-b)納什公式討價還價(Bargaining)博弈分配規(guī)則:納什公式61十、討價還價(Bargaining)博弈VVabPQ納什討價還價解圖示威脅點十、討價還價(Bargaining)博弈VVabPQ納什討價62十、討價還價(Bargaining)博弈納什證明:如果滿足以下原則:(1)帕累托有效性Paretoefficiency;(2)效用測度的無關性Invarianceoflineartransformation;(3)無關選擇的獨立性independenceofirrelevantalternatives那么,討價還價的唯一結果是最大化如下納什福利函數(shù)的解:該討價還價問題的效率邊界十、討價還價(Bargaining)博弈納什證明:如果滿足以63十、討價還價(Bargaining)博弈PabQ(x-a)h(y-b)k=c2(x-a)h(y-b)k=c2(x-a)h(y-b)k=c1VV十、討價還價(Bargaining)博弈PabQ(x-a)h64十、討價還價(Bargaining)博弈納什福利函數(shù)的解釋(a,b)對最后的分配具有決定性的意義,可以理解為“談判砝碼”(bargainingpower);h和k:是剩余價值的分配比例,又可以理解為談判力(bargainingstrength),可能與個人的耐心有關,或與個人的邊際貢獻(可替代性)有關;納什:如果兩個人是對稱的(即可分配價值以過(a,b)點的45度線對稱),h=k=1/2十、討價還價(Bargaining)博弈納什福利函數(shù)的解釋65十、討價還價(Bargaining)博弈非合作博弈思路:談判實際上是一個討價還價的過程,一個動態(tài)博弈;用非合作博弈的方法更合理;十、討價還價(Bargaining)博弈非合作博弈思路:66十、討價還價(Bargaining)博弈最常見的討價還價方式:序貫討價還價基本特征:兩人,A和B,分一塊錢;A先出價,B決定接受還是拒絕;如果接受,按照A提出的方案分配,談判結束;如果B拒絕,B提出方案,A決定接受還是拒絕;如果接受,按B的方案分配,談判結束;如果不接受,再由A提出方案;如此等等。提議提議談判結束同意AB同意談判結束A提議談判結束B提議談判結束同意同意十、討價還價(Bargaining)博弈最常見的討價還價方式67十、討價還價(Bargaining)博弈決定結果的關鍵因素:誰先出價?談判有無最后時限?誰最有耐心(時間偏好)?談判的固定成本多大?十、討價還價(Bargaining)博弈決定結果的關鍵因素:68十、討價還價(Bargaining)博弈我們先考慮沒有固定談判成本的情況。假定:x:A得到的份額;y:B得到的份額;x+y=1s:A的貼現(xiàn)率;a=1/(1+s):A的貼現(xiàn)因子;r:B的貼現(xiàn)率;b=1/(1+r):B的貼現(xiàn)因子;貼現(xiàn)因子:反映參與人的耐心程度。每個人的耐心不同,對將來貨幣的主觀貼現(xiàn)率是不同的十、討價還價(Bargaining)博弈我們先考慮沒有固定談69十、討價還價(Bargaining)博弈有限期談判的情況如果只有一次談判:逆向歸納意味著SPNE結果是:x=1,y=0;如果允許談判兩次:SPNE結果是:x=1-b,y=b;如果談判三次,SPNE結果是:
x=1-b(1-a),y=b(1-a);如果談判四次,SPNE結果是:
x=1-b(1-a(1-b)),y=b(1-a(1-b))如果談判五次,SPNE結果是:x=1-b(1-a(1-b(1-a))),y=b(1-a(1-b(1-a)))……可以推導出任何給定的T<∞情況下的SPNE結果十、討價還價(Bargaining)博弈有限期談判的情況70十、討價還價(Bargaining)博弈SPNE結果與a、b及博弈期限T關系:如果a=b=0,無論T,SPNE結果為x=1(先出價者得全部);如果b=0(無論a大小),則SPNE結果為x=1;如果a=0(無論b大小),則SPNE結果為x=1-b一個人對未來越沒有耐心,得到的越少SPNE結果與博弈期限T的關系(不妨考慮a=b=1):如果T=1,3,5…,均衡結果為x=1(先動后動為一個人);如果T=2,4,6…,均衡結果為x=0(后動優(yōu)勢)(給定其貼現(xiàn)因子為1,后出價者會拒絕任何自己不能得到整個利潤的出價,一直等到博弈最后階段得到全部)十、討價還價(Bargaining)博弈SPNE結果與a、b71十、討價還價(Bargaining)博弈有限期討價還價博弈一般結論:如果兩人貼現(xiàn)因子都較高,也就是對未來有足夠的耐心,談判有“后動優(yōu)勢”(last-moveradvantage)(在奇數(shù)次談判,先動和后動是一個人)。無論如何,一個人對未來越沒有耐心,得到的越少十、討價還價(Bargaining)博弈有限期討價還價博弈一72十、討價還價(Bargaining)博弈無限期談判(Rubinstein,1982)不能用逆向歸納法求解,但可以使用類似的思路得到均衡解(x,y)Shakedandsutton(1984):博弈是無限期的,因此從參與人A第二次報價(也就是博弈的第3階段)開始的子博弈(記為Ⅱ)與原博弈(記為I)是相同的。所以,均衡時參與人A在博弈I和博弈Ⅱ中所得份額應該是相同的。假定第三階段時,A出價,得到x;在第二階段時,B出價,給A為ax就可以了,B得到y(tǒng)=1-ax;在第一階段時,A出價,給B為b(1-ax)就可以了,自己得到x=1-b(1-ax)十、討價還價(Bargaining)博弈無限期談判(Rubi73十、討價還價(Bargaining)博弈因為從第三階段開始的博弈與從第一階段開始的博弈完全相同,參與人A在第一階段能得到的最大份額一定等于其在第三階段得到的最大份額相同,因此即在均衡狀態(tài)下參與人A(先行者)的份額為參與人B(后行者)的份額為十、討價還價(Bargaining)博弈因為從74十、討價還價(Bargaining)博弈貼現(xiàn)因子的含義及其對均衡結果的影響二人的均衡份額為(先行者),(后行者)貼現(xiàn)因子表示耐心程度,其值越大說明越有耐心耐心優(yōu)勢:越有耐心,得到的利益越大先動優(yōu)勢:當雙方具有相同耐心程度a=b時,先行者獲得份額大于二分之一;特別地,具有無限耐心(即給定b,)的先行者可以獲得全部利益,而具有無限耐心的后行者不能獲得全部利益十、討價還價(Bargaining)博弈貼現(xiàn)因子的含義及其對75十、討價還價(Bargaining)博弈談判的另一類成本是固定成本,如勞資談判拖延的話,企業(yè)可能要為客戶支付違約金。這類似于冰淇淋隨時間而變小。十、討價還價(Bargaining)博弈談判的另一類成本是固76十、討價還價(Bargaining)博弈舉例設想100g冰淇淋,每次融化25g,到第5期時,冰淇淋已化完,第4期等于25g,第3期是50g,第2期是75g,第1期是100g。第4期:B出價,將把整個冰淇淋(25g)留給自己;第3期:A出價,A必須分給B25g的冰淇淋,此時冰淇淋為50g,所以分1/2給B,自己得1/2(25g);第2期:B出價,B只需給A25g(此時冰淇淋75g),自己得到2/3冰淇淋(50g);第1期:A出價,分給B50g,自己得到一半(50g)。PNE:每人1/2。十、討價還價(Bargaining)博弈舉例77十一、重復博弈重復博弈(RepeatedGame)同樣結構的博弈重復多次,就是重復博弈。其中,每次博弈稱為階段博弈(stagegame)重復無限次,為無限次重復博弈;反之,為有限次重復博弈重復博弈的基本特征:各階段博弈相互獨立,前階段博弈不會改變后階段博弈的結構所有參與人都能看到博弈歷史參與人的支付等于各階段支付的貼現(xiàn)值之和十一、重復博弈重復博弈(RepeatedGame)78十一、重復博弈如果博弈不是一次的,而是重復進行的,參與人過去行動的歷史是可以觀察到的,參與人就可以將自己的選擇依賴于其他人之前的行動,因而有了更多的戰(zhàn)略可以選擇,均衡結果可能與一次博弈大不相同。-8,-80,-10-10,0-1,-1坦白抵賴坦白抵賴十一、重復博弈如果博弈不是一次的,而是重復進行的,參與人過去79十一、重復博弈假定上屬博弈重復多次或無限次;那么,每個參與人有多個可選擇的戰(zhàn)略。僅舉幾例:All-D:不論過去什么發(fā)生,總是選擇不
溫馨提示
- 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權益歸上傳用戶所有。
- 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內容里面會有圖紙預覽,若沒有圖紙預覽就沒有圖紙。
- 4. 未經權益所有人同意不得將文件中的內容挪作商業(yè)或盈利用途。
- 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內容的表現(xiàn)方式做保護處理,對用戶上傳分享的文檔內容本身不做任何修改或編輯,并不能對任何下載內容負責。
- 6. 下載文件中如有侵權或不適當內容,請與我們聯(lián)系,我們立即糾正。
- 7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。
最新文檔
- 現(xiàn)代科技在中藥植物油提取中的綠色環(huán)保策略
- 生活用紙設計新趨勢創(chuàng)新驅動的消費者體驗升級
- 生態(tài)保護與零碳公園規(guī)劃的融合實踐
- 國慶節(jié)活動方案活動內容
- 現(xiàn)代服務業(yè)的綠色發(fā)展路徑探索
- 小學勞動教育考核方案
- 2024年五年級英語下冊 Unit 7 Chinese festivals第6課時說課稿 譯林牛津版
- 2024年秋七年級歷史上冊 第14課 溝通中外文明的“絲綢之路”說課稿 新人教版
- Unit 3 My friends Read and write(說課稿)-2024-2025學年人教PEP版英語四年級上冊
- 3 我不拖拉 第一課時(說課稿)2023-2024學年統(tǒng)編版道德與法治一年級下冊
- 商業(yè)銀行的風險審計與內部控制
- 2025年新能源汽車銷售傭金返點合同范本6篇
- 2025-2030年中國配電變壓器市場未來發(fā)展趨勢及前景調研分析報告
- GB/T 45120-2024道路車輛48 V供電電壓電氣要求及試驗
- 2025年上海市嘉定區(qū)中考英語一模試卷
- 潤滑油、潤滑脂培訓課件
- 2025年中核財務有限責任公司招聘筆試參考題庫含答案解析
- 華中師大一附中2024-2025學年度上學期高三年級第二次考試數(shù)學試題(含解析)
- ADA糖尿病醫(yī)學診療標準指南修訂要點解讀(2025)課件
- 健康管理-理論知識復習測試卷含答案
- 國籍狀況聲明書
評論
0/150
提交評論