版權說明:本文檔由用戶提供并上傳,收益歸屬內容提供方,若內容存在侵權,請進行舉報或認領
文檔簡介
上次內容回顧動態(tài)博弈的概念完美信息和完全信息(信息集)擴展式表示(博弈樹)動態(tài)博弈的策略式表示逆向歸納法(BackInduction)承諾的置信(反國家分裂法)子博弈完美均衡斯塔克博格(Stackelberg)模型1子博弈完美均衡與BI2先動優(yōu)勢?后動優(yōu)勢NIM34討價還價實例假設兩人就冰激凌的分配討價還價。冰激凌會隨時間而融化。假設冰激凌重量為100克,每一回合融化10克(即10個回合全部融化)。假設甲先提議,然后是乙。5討價還價實例兩回合談判的均衡結果推導過程:第二回合乙提議之后博弈結束,因此相當于他面臨獨裁博弈。此時,他會將全部冰激凌分給自己(比例為1)。由于已經化掉1/10,因此,盡管乙得到了全部,但實際上是90克;甲什么也沒得到。再回溯到第一回合,為了不使乙反對,甲必須使得乙所獲得的冰激凌實際額不低于其第二回合的數量。因此,均衡結果是甲10克,乙90克6討價還價實例三回合談判的均衡結果推導過程:第三回合甲提議之后博弈結束,因此相當于他面臨獨裁博弈。此時,他會將全部冰激凌分給自己(比例為1)。由于已經化掉2/10,因此,盡管甲得到了全部,但實際上是80克;第二回合中,為了不使甲反對,乙必須使得甲所獲得的冰激凌實際額不低于其第三回合的數量,即甲80克,乙10克;再回溯到第一回合,為了不使乙反對,甲必須使得乙所獲得的冰激凌實際額不低于其第二回合的數量,即乙10克,甲90克。因此,均衡結果是甲90克,乙10克7討價還價實例同學們可以自己推導一下,第9回合和第十回合的均衡結果是多少?8討價還價實例第9回合,甲60克,乙40克;第10回合,甲乙各50克。推導過程9和10回合.doc9討價還價實例結論:1,低于10回合外,誰最后提議,誰有優(yōu)勢。2,談判的回合越多,兩人的利益分享額越接近平均分配。3,回合足夠多得話,平均分配合作利益。10經典案例(2):討價還價博弈討價還價(bargaining)是市場中最常見、普通的事情。也是博弈論中典型的動態(tài)博弈問題。討價還價模型還可以推廣到談判問題。這里介紹的是討價還價最為經典的模型。11經典案例(2):討價還價博弈假設有兩個人分割一塊蛋糕,參與人1先出價(offer),參與人2可以選擇接受(accept)或拒絕(reject);如果參與人2接受,博弈結束,蛋糕按參與人1的方案分配。如果參與人2拒絕,參與人2出價,參與人1決定接受或拒絕;如果參與人1接受,博弈結束,蛋糕按參與人2的方案分配。如果參與人1拒絕,參與人1再出價…12經典案例(2):討價還價博弈上述過程反復進行,直到一個參與人的出價被另一個參與人接受為止。這是一個無限期完美信息博弈,參與人1在1,3,5,…出價,參與人2在時期2,4,6,…出價。13經典案例(2):討價還價博弈若用x表示參與人1的份額,(1-x)表示參與人2的份額,x1和(1-x1)分別是參與人1出價時參與人1和參與人2的份額,x2和1-x2分別是參與人2出價時參與人1和參與人2的份額。假定參與人1和參與人2的貼現因子分別為δ1和δ2,如果博弈在時期t結束,t是參與人i的出價階段,則參與人1支付的貼現值是π1=δ1t-1xi,參與人2支付的貼現值是π2=δ2t-1(1-xi)14經典案例(2):討價還價博弈結合切蛋糕問題,貼現值既可以理解為資金的時間價值由于蛋糕由于未被分割出去所造成的自然縮減。雙方的耐心程度。15經典案例(2):討價還價博弈問題分析由于該博弈是無限期博弈,因此,不能直接采用逆推歸納法。為分析上述問題,先考慮階段數有限的情形。16經典案例(2):討價還價博弈有限階段討價還價問題假定博弈只進行兩個時期,在T=2,參與人2出價,如果他提出x2=0,參與人1會接受(假定參與人在接受和拒絕之間無差異時,我們假定他選擇接受)。因為博弈在T=2時,參與人1再沒有討價還價的機會。17經典案例(2):討價還價博弈參與人2在T=2時得到的1單位等價于在t=1時的δ2單位,因此,如果參與人1在t=1時出價1-x1≥δ2,參與人2會接受;因為參與人1沒有必要給參與人2多于他會接受的最低份額,博弈均衡結果是參與人1得到x=x1=1-δ2,參與人2得到1-x=δ218
(a)T=1時參與人1出價情況(b)T=2時參與人2出價情況
圖2-18兩階段討價還價示意δ21-δ2經典案例(2):討價還價博弈19經典案例(2):討價還價博弈再假定T=3在最后階段,參與人1出價,他可以得到的最大份額是x1=1;因為參與人1在T=3時1單位等價于T=2時的δ1單位,因此,如果參與人2在T=2時出價x2=δ1,參與人1將會接受;因為參與人2在T=2的(1-δ1)單位等價于T=1時的δ2(1-δ1),因此,如果參與人1在T=1時出價1-x1=δ2(1-δ1),參與人2將會接受。因此,子博弈精煉均衡結果是x=1-δ2(1-δ1)20當T=4,5,…等有限整數值時,仿照前述方法,可以推導出任何給定的T的子博弈精煉納什均衡。如果δ1=δ2=0,不論T為多少,子博弈精煉均衡的結果是x=1;就是說,如果兩個參與人都是絕對無耐心的,第一個出價的人得到整個蛋糕;如果δ2=0,不論δ1為多少,子博弈精煉均衡結果仍然是x=1;如果δ1=0,δ2>0,子博弈精煉均衡結果是x=1-δ2經典案例(2):討價還價博弈21經典案例(2):討價還價博弈如果δ1=δ2=1,即雙方都有無限耐心,那么,如果T=1,3,5,…,均衡結果是x=1;如果T=2,4,6,…,均衡結果是x=0。這里的結果可以稱之為“后動優(yōu)勢”(last-moveradvantage)22經典案例(2):討價還價博弈一般說來,如果0<δi<1,i=1,2,均衡結果不僅依賴于貼現因子的相對比率,而且還依賴于博弈時期T和誰在最后階段出價。然而,這種依存關系隨著T的變大而變小當T趨于無窮時,我們得到“先動優(yōu)勢”:如果δ1=δ2=δ,唯一的納什均衡結果為x=1/(1+δ)23無限階段討價還價問題羅賓斯坦恩(Rubinstein,1982):在無限期輪流出價博弈中,唯一的子博弈精煉納什均衡結果是經典案例(2):討價還價博弈24無限階段討價還價問題羅賓斯坦恩(Rubinstein,1982):在無限期輪流出價博弈中,唯一的子博弈精煉納什均衡結果是如果δ1=δ2=δ,則經典案例(2):討價還價博弈25經典案例(2):討價還價博弈上述定理的證明由于T=∞,博弈沒有最后階段,不可能使用逆推歸納法。但根據Shaked,Sutton(1984),因為從參與人1出價的任何一個階段開始的子博弈等價于從T=1開始的整個博弈,因此可轉換為有限階段討價還價問題。見圖2-19。26從任一階段開始的子博弈(t為奇數)…圖2-19無限階段討價還價問題t=1t=2t=k…t=3從t=1階段開始的整個博弈經典案例(2):討價還價博弈27假定在時期t≥3時參與人1出價,參與人1能得到的最大份額是M;對參與人1而言,t期的M等價于t-1期的δ1M,參與人2知道在t-1時期的任何x2≥δ1M的出價將被參與人1接受,因此參與人出價x2=δ1M,自己獲得1-δ1M;對于參與人2而言,t-1期的1-δ1M等價于t-2期的δ2(1-δ1M),參與人知道在t-2期的任何x1<=1-δ2(1-δ1M)出價將被參與人2接受,因此參與人1出價x1=1-δ2(1-δ1M)t=1t=2t=k…t=3x=Mx=δ1Mx=1-δ2(1-δ1M)經典案例(2):討價還價博弈28因此有x=1-δ2(1-δ1M)=M進而求得t=1t=2t=k…t=3x=Mx=δ1Mx=1-δ2(1-δ1M)經典案例(2):討價還價博弈29與此類似,可求出參與人1能夠獲得的最小份額m,為經典案例(2):討價還價博弈由于參與人1能得到的最大份額和最小份額相同,均衡結果是唯一的,為30多階段靜態(tài)博弈該類模型中至少在某個階段參與人同時選擇其決策。31多階段靜態(tài)博弈模型一例博弈中有四個參與人,分別用參與人1~4表示。第一階段是參與人1與2的決策選擇階段,他們同時在各自的策略集A1和A2中分別選擇a1和a2。第二階段是參與人3與4決策選擇階段,他們看到參與人1和2的決策a1和a2后,同時在各自的策略集A3,A4中分別選擇a3和a4。各參與人的支付函數是參與人的策略a1,a2,a3,a4的函數,記為ui=ui(a1,a2,a3,a4)32多階段靜態(tài)博弈有同時選擇的動態(tài)博弈問題如國際競爭中最優(yōu)關稅博弈問題,兩個制定關稅的國家可看成標準模型中的參與人1與2;兩國各自的一個相互進行產量競爭的企業(yè)就是模型中的參與人3于4。上述標準模型的變形,如某個階段只有一個參與人;第二階段的參與人3于4與第一階段的參與人1與2相同等,也屬于同時選擇的動態(tài)博弈問題。33多階段靜態(tài)博弈這類模型實質上就是完美信息動態(tài)博弈,因此仍然可以采用逆推歸納法進行分析。因為存在同時選擇,因此每個階段不再是單人優(yōu)化問題,而是一個靜態(tài)博弈。34多階段靜態(tài)博弈簡例:擠兌博弈問題描述:銀行信貸對社會經濟發(fā)展的作用無可估量,但它在帶來巨大利益的同時也蘊含著一定的風險。設一家銀行為了給一個企業(yè)貸放一筆20000元的貸款,以20%的年利率吸引客戶存款。若兩個客戶各有10000元資金,如果他們把資金作為1年期定期存款存入該銀行,那么銀行就可以向企業(yè)貸款。如果兩客戶都不愿存款或只有一個客戶存款,那么銀行就無法給上述企業(yè)貸款,這時候客戶的本金可以保全。35多階段靜態(tài)博弈簡例:擠兌博弈在兩個客戶都存款,從而銀行給上述企業(yè)提供貸款的情況下,如果銀行滿1年收回貸款,企業(yè)就能完成一筆生意,銀行可收回貸款本息,并可支付存款客戶的存款本息。如果在不到1年的時候,其中任何一個客戶單獨或同時要求提前取出存款,銀行就不得不提前收回貸款。假設銀行只能收回80%的本錢。若只有一個客戶要求提前取款,則銀行會償還其全部本金,余款則屬于另一客戶;若兩客戶同時要求提前取款,則平分回收的資金。36多階段靜態(tài)博弈簡例:擠兌博弈根據上述假設,可以用圖2-20的兩個矩陣表示該問題。不存存款不存1,11,1存款1,1下一階段提前到期提前0.8,0.81,0.6到期0.6,11.2,1.2客戶2客戶1圖2-20銀行擠兌風險客戶2客戶1第一階段第二階段37多階段靜態(tài)博弈簡例:擠兌博弈用逆推歸納法來分析該博弈。在第二個階段的博弈。這是一個二人完全信息靜態(tài)博弈,可以得出該博弈有兩個純策略納什均衡(提前,提前)和(到期,到期)。對應的支付情況分別為(0.8,0.8)和(1.2,1.2)。分別為風險占優(yōu)均衡和帕雷托占優(yōu)均衡。提前到期提前0.8,0.81,0.6到期0.6,11.2,1.2客戶2客戶1第二階段38多階段靜態(tài)博弈簡例:擠兌博弈其中,風險占優(yōu)均衡就是“擠兌”現象,而帕雷托占優(yōu)則是金融健康的經濟現象。若采用風險占優(yōu)策略的客戶比例較大,超出了銀行承受能力,就可能會造成金融危機。提前到期提前0.8,0.81,0.6到期0.6,11.2,1.2客戶2客戶1第二階段39如果第二個階段博弈結果是比較理想的(到期,到期)納什均衡,那么這時候第一階段的博弈相當于圖2-21的支付矩陣(完全信息靜態(tài)博弈)。不存存款不存1,11,1存款1,1下一階段提前到期提前0.8,0.81,0.6到期0.6,11.2,1.2第一階段40如果第二個階段博弈結果是比較理想的(到期,到期)納什均衡,那么這時候第一階段的博弈相當于圖2-21的支付矩陣(完全信息靜態(tài)博弈)。不存存款不存1,11,1存款1,11.2,1.2多階段靜態(tài)博弈簡例:擠兌博弈圖2-21第一階段等價博弈(1)41此時也有兩個純戰(zhàn)略納什均衡,為(不存,不存),(存款,存款),且后一個均衡策略帕雷托優(yōu)于前一個,同時也是風險占優(yōu)均衡。因此,兩客戶都會選擇存款給銀行。這是銀行融資信用很好起的作用。不存存款不存1,11,1存款1,11.2,1.2多階段靜態(tài)博弈簡例:擠兌博弈圖2-21第一階段等價博弈(1)42如果第二個階段博弈結果是不甚理想的(提前,提前)納什均衡,那么這時候第一階段的博弈支付如圖2-22的矩陣。此時(不存,不存)是兩客戶的納什均衡,也是占優(yōu)均衡。因此,兩客戶都會選擇“不存”,這相當于客戶不再信任銀行的情況。但這時候不會引起銀行擠兌現象及金融危機。因為沒有人存錢給銀行。不存存款不存1,11,1存款1,10.8,0.8多階段靜態(tài)博弈簡例:擠兌博弈圖2-22第一階段等價博弈(2)43多階段靜態(tài)博弈簡例:擠兌博弈由該模型,可將由于擠兌導致的金融危機解釋為:在金融穩(wěn)定時期,社會閑散資金會選擇銀行;企業(yè)多數從銀行貸款進行發(fā)展,但若從事的項目風險較大,有些企業(yè)可能到期不能償還貸款;社會儲戶由于上述信息引起恐慌,引發(fā)擠兌現象;擠兌現象達到一定程度,引發(fā)一些銀行倒閉;金融危機由此產生。44前向歸納法前面已經說明,完美信息動態(tài)博弈的經典求解方法為逆序歸納法。還有一種分析方式,就是前向歸納法(forwardinduction)。前向歸納法由科爾博格和莫頓斯(1986)提出。這里不進行嚴格的數學描述,僅通過一個例題進行說明。45前向歸納法一例:燒錢博弈回顧博弈論的經典問題,性別戰(zhàn)博弈PLAYER2LRT3,10,0B0,01,3圖2-23性別戰(zhàn)博弈PLAYERl46前向歸納法一例:燒錢博弈該博弈有兩個純策略均衡(T,L),(B,R)以及一個混合策略均衡。PLAYER2LRT3,10,0B0,01,3圖2-23性別戰(zhàn)博弈PLAYERl47前向歸納法一例:燒錢博弈現對博弈進行稍微修改,見圖2-24圖2-24修改的性別戰(zhàn)3,10,00,01,3TBLR1InOut2,248前向歸納法一例:燒錢博弈這時博弈的合理結果是什么?圖2-24修改的性別戰(zhàn)3,10,00,01,3TBLR1InOut2,249前向歸納法一例:燒錢博弈如果博弈到達第2階段…圖2-24修改的性別戰(zhàn)3,10,00,01,3TBLR1InOut2,250前向歸納法一例:燒錢博弈說明參與人1放棄了第一階段獲取2單位效用的機會…圖2-24修改的性別戰(zhàn)3,10,00,01,3TBLR1InOut2,251前向歸納法一例:燒錢博弈如果參與人是理性的,必然在第二階段追求更好(>2)的結局。圖2-24修改的性別戰(zhàn)3,10,00,01,3TBLR1InOut2,252前向歸納法一例:燒錢博弈因此,在第二階段,參與人1必然要選取策略T.圖2-24修改的性別戰(zhàn)3,10,00,01,3TBLR1InOut2,253前向歸納法一例:燒錢博弈預見到上述情況,參與人2將選擇策略L圖2-24修改的性別戰(zhàn)3,10,00,01,3TBLR1InOut2,254前向歸納法一例:燒錢博弈因此,按照前向歸納法邏輯,合理結局是…圖2-24修改的性別戰(zhàn)3,10,00,01,3TBLR1InOut2,255重復博弈重復博弈(repeatedgame)的定義指同樣結構的博弈重復多次,其中的每次博弈稱為“階段博弈(stagegame)”。如兩個多次犯罪的“囚徒問題”。由于動態(tài)博弈是相機行動,反映到重復博弈中,就是可以使自己在某個階段的博弈選擇依賴于其他參與人過去的行動歷史。56重復博弈如囚徒困境的重復博弈的一個策略可以是:“如果這次你選擇了坦白,我下次將選擇坦白;如果你這次選擇了抵賴,我下次將選擇抵賴”。因此,參與人在重復博弈中的戰(zhàn)略空間遠遠大于和復雜于在每個階段博弈中的戰(zhàn)略空間。57重復博弈影響重復博弈均衡結果的主要因素是博弈重復次數和信息的完備性(completeness)。重復次數對參與人可能會有的影響是:參與人為了獲得長遠利益而犧牲眼前利益的策略成為可能。關于完備性,簡單地說,但一個參與人的支付函數不為其他參與人所知時,該參與人可能有積極性建立一個“好”的聲譽(reputation)以換取長遠利益。在社會行為中,經??梢钥吹奖举|不好的人在相當長的時期內干好事的原因。58重復博弈有限次重復博弈:連鎖店悖論考慮如圖2-25所示的市場進入博弈。如果進入者先行動,則可表示為完全信息動態(tài)博弈的博弈樹形式,見圖2-26。圖中A表示進入者,B表示在位者。圖2-25市場進入博弈默許斗爭進入40,50-10,0不進入0,3000,300在位者進入者59該博弈唯一的子博弈精煉納什均衡結果是進入者進入,在位者默許,分別得到40和50的支付。不進入進入斗爭默許(0,300)(0,300)圖2-26市場進入博弈ABB(40,50)(-10,0)默許斗爭重復博弈60重復博弈現在假定同樣的市場有20個(可以理解為在位者有20個連鎖店),進入者每次進入一個市場,博弈就變成了20次重復博弈。假定進入者先進入第1個市場,在位者應該作如何反應?按照一般的認識,在位者應該堅決進行斗爭,即便是損失該市場,但可以阻止其他19個市場的進入者的進入。但按照子博弈精練納什均衡分析方法,卻與上述結論相左。61重復博弈分析過程如下:設想前19個市場已被進入,進入者現在進入第20個市場。因為在最后階段,選擇斗爭已沒有任何威懾意義,在位者最優(yōu)選擇是默許,進入者將選擇進入。現在考慮第19個市場。因為無論在位者選擇什么行動,第20個市場上的均衡結果不受影響(因為進入者知道第20各市場上在位者將選擇默許),在位者最優(yōu)選擇仍然是默許。62重復博弈如此一直倒推回去,我們得到這個博弈的唯一子博弈精煉均衡是在位者在每一個市場上都選擇默許,進入者在每一個市場上選擇進入。這就是所謂的“連鎖店悖論”(chain-storeparadox,Selten,1978)63重復博弈囚徒困境問題與市場進入博弈類似,只要博弈的重復次數是有限的,最后階段博弈的唯一納什均衡是兩個囚徒都選擇坦白,且“總是坦白”是唯一的子博弈精煉均衡。上述結果可以一般化為下述定理。定理:令G是階段博弈,G(T)是G重復T次的重復博弈(T<∞)。那么,如果G有唯一的納什均衡,重復博弈G(T)的唯一子博弈精煉納什均衡結果是階段博弈G的納什均衡重復T次(即每個階段博弈出現的都是一次性博弈的均衡結果)。64重復博弈上述定理說明,只要博弈的重復次數是有限的,重復本身并不改變囚徒困境的均衡結果。上述定理中“唯一性”是一個重要條件。如果納什均衡不是唯一的,上述結論就不一定成立。當博弈有多個納什均衡時,參與人可以使用不同的納什均衡懲罰前面階段的不合作行為或獎勵第一階段的合作行為。65重復博弈前述連鎖店悖論的一個解釋是引入信息的不完全性。在不完全信息動態(tài)博弈中,可以看到這一點。這里先給出一個解釋模型,即當博弈重復無窮多次而不是有限次時,存在著完全不同于一次博弈的子博弈精煉均衡。以囚徒問題為例,對此進行說明。66重復博弈為便于討論
溫馨提示
- 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯系上傳者。文件的所有權益歸上傳用戶所有。
- 3. 本站RAR壓縮包中若帶圖紙,網頁內容里面會有圖紙預覽,若沒有圖紙預覽就沒有圖紙。
- 4. 未經權益所有人同意不得將文件中的內容挪作商業(yè)或盈利用途。
- 5. 人人文庫網僅提供信息存儲空間,僅對用戶上傳內容的表現方式做保護處理,對用戶上傳分享的文檔內容本身不做任何修改或編輯,并不能對任何下載內容負責。
- 6. 下載文件中如有侵權或不適當內容,請與我們聯系,我們立即糾正。
- 7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。
最新文檔
- 陽江職業(yè)技術學院《傳感器技術及應用》2023-2024學年第一學期期末試卷
- 2024年物流第三方配送合作協議
- 2024年員工出差專項報銷及管理服務協議3篇
- 2024年海沙運輸與河道整治工程合同模板3篇
- 2025土地流轉合同范本
- 2025農村土地互換合同(標準版)
- 監(jiān)測儀項目立項申請報告
- 新建變色夜光杯項目立項申請報告
- 針織布項目立項申請報告
- 新建來電感應玩具公仔項目立項申請報告
- 小學生科技社團社團活動總結
- 部編版三年級上冊語文古詩文日積月累及同步練習題
- 沉井與沉管法施工-沉井法施工
- 魯教版六年級上課冊數學2.10科學計數法
- 南藝 28685 設計原理考點(本科)
- GB/T 8733-2016鑄造鋁合金錠
- GB/T 17514-2017水處理劑陰離子和非離子型聚丙烯酰胺
- GB 5768.4-2017道路交通標志和標線第4部分:作業(yè)區(qū)
- 廢氣治理設施運行管理規(guī)程
- 出租廠房建筑和設施安全檢查表
- 項目驗收交接單(運維部)
評論
0/150
提交評論