第十一講 廣延型博弈與反向歸納策略課件_第1頁
第十一講 廣延型博弈與反向歸納策略課件_第2頁
第十一講 廣延型博弈與反向歸納策略課件_第3頁
第十一講 廣延型博弈與反向歸納策略課件_第4頁
第十一講 廣延型博弈與反向歸納策略課件_第5頁
已閱讀5頁,還剩141頁未讀 繼續(xù)免費(fèi)閱讀

下載本文檔

版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進(jìn)行舉報或認(rèn)領(lǐng)

文檔簡介

第十一講廣延型博弈與反向歸納策略廣延型博弈適合于分析動態(tài)博弈過程,其強(qiáng)調(diào)的重點(diǎn)在行動的時序性,以及參與人決定策略時所擁有的信息集。第一節(jié)廣延型博弈的定義與形式一、廣延型博弈的定義信息完美(perfectinformation),是指每一個參與人在其作決策時,對于以前所發(fā)生的事件具有完全的信息。

第十一講廣延型博弈與反向歸納策略廣延型博弈適合于分析動態(tài)1廣延型博弈構(gòu)成要素(1)決策點(diǎn)與決策分枝的結(jié)構(gòu),在初始決策點(diǎn)與最終結(jié)局點(diǎn)之間不存在任何閉環(huán)(closedloops);(2)清楚地指明什么決策點(diǎn)屬于哪一個參與人;(3)在自然決策點(diǎn)上選擇的概率是公共知識;(4)參與人作決策時所依據(jù)的信息集;信息集把參與人在某一時刻的所有決策點(diǎn)分成若干類;(5)在博弈的終極點(diǎn)上每一個參與人的收益廣延型博弈構(gòu)成要素(1)決策點(diǎn)與決策分枝的結(jié)構(gòu),在初始決策點(diǎn)2二、廣延型博弈的形式廣延型博弈是以“決策樹”或“博弈樹”的形式來表達(dá)的。二、廣延型博弈的形式廣延型博弈是以“決策樹”或“博弈樹”的3122(2,0)(2,-1)(1,0)(3,1)LRMNMN122(2,0)(2,-1)(1,0)(3,1)LRMNMN4三、廣延型博弈的規(guī)則第一,初始點(diǎn)沒有一條箭頭指向它;對其他所有箭頭,都只有一條箭頭指向它。第二,如果我們從某一點(diǎn)向初始點(diǎn)返回,我們就不可能再通過迂回的途徑回這一點(diǎn),我們只能按反向逐次返回原點(diǎn)。

三、廣延型博弈的規(guī)則第一,初始點(diǎn)沒有一條箭頭指向它;對其他5第二節(jié)完美信息廣延(動態(tài))博弈一、特征。(一)決策有先后順序(二)關(guān)于博弈進(jìn)程的信息是不對稱的后決策者擁有更多信息。第二節(jié)完美信息廣延(動態(tài))博弈6(三)具有完美信息:即參與人決策時完全了解之前的博弈過程的信息。(四)動態(tài)博弈至少有兩個階段;階段:參與者在某一時點(diǎn)進(jìn)行的一次決策。(三)具有完美信息:7二、可信性:先決策者對后決策者行為的信任性。即先決策者是否相信后決策者是否采取有利的(許諾)或不利的(威脅)行為。二、可信性:先決策者對后決策者行為的信任性。8例1:父女博弈。女兒交了一個父親不喜歡的男友,父親威脅說:“你如果不斷絕與他的關(guān)系,我與你斷絕關(guān)系?!迸畠菏欠裣嘈鸥赣H的威脅?這一博弈可如下表示:例1:父女博弈。女兒交了一個父親不喜歡的男友,9女兒父親斷絕交往不交往不斷絕(1,-1)(2,1)(0,1)女兒父親斷絕交往不交往不斷絕(1,-1)(2,1)(0,1)10作為女兒,知道父親斷絕與女兒的關(guān)系損失是非常大的,因此,對父親來講,即使女兒不聽話,“斷絕”是下策,應(yīng)被剔除掉:作為女兒,知道父親斷絕與女兒的關(guān)系11女兒父親交往不交往不斷絕(2,1)(0,1)女兒父親交往不交往不斷絕(2,1)(0,1)12聰明的女兒在看到父親的威脅不可信時,一定不會選擇“不交往”女兒父親交往不斷絕(2,1)聰明的女兒在看到父親的威脅不可信時,女兒父親交往不斷絕(2,13父親的威脅是不可信的。因此,所謂不可信的威脅,就是指一旦采取該策略,給他本人帶來的收益并非最大的策略父親的威脅是不可信的。因此,所謂不可信的威脅,14例2:開金礦(二階段):參與人2欲開采一價值4萬元的金礦,但缺乏1萬資金,參與人1恰擁有一萬元資金。參與人2對參與人1說:“如果你把錢借給我,我與你平分開金礦所得?!眳⑴c人1是否應(yīng)相信2把錢借給他?例2:開金礦(二階段):參與人2欲開采一價值4萬元的金礦,1512分借不借不分(2,2)(0,4)(1,0)12分借不借不分(2,2)(0,4)(1,0)16在參與人借的資金開發(fā)金礦后,平分所得是其下策,故應(yīng)被剔除:12借不借不分(0,4)(1,0)在參與人借的資金開發(fā)金礦后,12借不借不分(0,4)(1,017這時,“借”成為參與人1的下策,故應(yīng)被剔除:1不借(1,0)這時,“借”成為參與人1的下策,1不借(1,0)18參與人2的許諾是不可信的。所謂不可信的許諾,就是指一旦采取該策略,給他本人帶來的收益并非最大的策略參與人2的許諾是不可信的。所謂不可信的許諾,19例3:開金礦(三階段)在有完善的法律制度的條件下,參與人1可以在參與人而不信守承諾的情況下選擇與其打官司,這樣就變成了一個三階段博弈。這時參與人1是否應(yīng)相信2的承諾?例3:開金礦(三階段)在有完善的法律制度的條件下,2012分借不借不分(2,2)(0,4)(1,0)1不打打(1,0)12分借不借不分(2,2)(0,4)(1,0)1不打打(1,2112分借不借不分(2,2)(1,0)1打(1,0)在參與人2不信守承諾的情況下,不打官司是參與人1的下策故應(yīng)被剔除12分借不借不分(2,2)(1,0)1打(1,0)在參與人222由于參與人1必定會選擇打官司,故不分是參與人2的下策因此被剔除12分借不借(2,2)(1,0)由于參與人1必定會選擇打官司,12分借不借(2,2)(1,023在這種情況下,參與人1知道參與人2必定會其起平分收益,不借則變成了他的下策,剔除之。12分借(2,2)在這種情況下,參與人1知道參與人212分借(2,2)24在法律制度建立后,參與人2的許諾變?yōu)榭尚旁诜山∪珪r,既可保障社會公平,又可提高社會經(jīng)濟(jì)活動效率。在法律制度建立后,25所謂可信的許諾(威脅),就是指一旦采取該策略,給他本人帶來的收益一定最大的策略所謂可信的許諾(威脅),26三、子博弈和逆推歸納法

(一)子博弈:從一個博弈的某個階段開始的能夠自成一個博弈的后續(xù)階段。它必須有一個初始信息集,具備進(jìn)行博弈的需要的各種信息。三、子博弈和逆推歸納法

(一)子博弈:27(二)逆推歸納法:從動態(tài)博弈的最后一個階段或最后一個子博弈開始,逐步倒推以求解動態(tài)博弈的方法。(二)逆推歸納法:從動態(tài)博弈的最后一個階段28四、子博弈精煉納什均衡如果動態(tài)博弈中各參與人的策略在動態(tài)博弈本身和所有子博弈中都構(gòu)成一個納什均衡,則稱該策略組合為一個子博弈精煉納什均衡。四、子博弈精煉納什均衡如果動態(tài)博弈中各參與人29例4.討價還價博弈(三階段)設(shè)兩人就如何分割1萬元進(jìn)行談判,規(guī)則如下:首先由1提出一個分割比例S1,2可以接受也可以拒絕,如果2拒絕,則提一個分割比例S2,這時1可以接受,也可以拒絕,如果拒絕,則出價S則2必須接受例4.討價還價博弈(三階段)設(shè)兩人就如何分割1萬元進(jìn)行談判,30假設(shè)每經(jīng)過一輪要有一定的折扣,折扣因子為。的大小與談判者的耐心,通貨膨脹以及資金的時間價值等有關(guān)。假設(shè)每經(jīng)過一輪要有一定的折扣,。的大小與談判者的耐心,3112接受出S1不接受出S2(S1,1-S1)(δ2S,δ2(1-S))(δS2,δ(1-S2))1接受不接受出S解:展開表示為12接受出S1不接受出S2(S1,1-S1)(δ2S,δ2(32應(yīng)用逆推歸納法。第三階段:1出S,2必須接受,因此S=112接受出S1不接受出S2(S1,1-S1)(δ2,0)(δS2,δ(1-S2))1接受不接受出S=1應(yīng)用逆推歸納法。12接受出S1不接受出S2(S1,1-S1)33第二階段:2知道在第三階段1必出S=1,因此,為了避免這一情況的出現(xiàn),自己出的S2(即1的所得)應(yīng)滿足:第二階段:2知道在第三階段34這時博弈樹變?yōu)?2接受出S1不接受出S2=δ(S1,1-S1)(δ2,

δ(1-δ))1接受這時博弈樹變?yōu)?2接受出S1不接受出S2=δ(S1,1-S35第一階段,如果1的出價S1滿足1-S1≥δ(1-δ)即S1≤1-δ+δ2則2不會拒絕第一階段,如果1的出價S1滿足36因此,1的最優(yōu)出價S1=1-δ+δ2這時S1=1-δ+δ2>δ2避免進(jìn)入下一段談判,雙方獲得的收益均達(dá)到最大。¥因此,1的最優(yōu)出價3712接受出S1=1-δ+δ2(1-δ+δ2,δ-δ2)最終的博弈路徑(子博弈精煉納什均衡)為12接受出S1=1-δ+δ2(1-δ+δ2,δ-δ2)最終的38例5.求下列四階段動態(tài)博弈的子博弈精煉納什均衡。例5.求下列四階段動態(tài)博弈3912cabd(4,3)(3,6)(5,3)1h(8,5)1efg(2,4)12cabd(4,3)(3,6)(5,3)1h(8,5)1e40第三節(jié)有同時選擇的動態(tài)博弈一、特征:在博弈的某些階段,有多個參與者同時進(jìn)行決策第三節(jié)有同時選擇的動態(tài)博弈一、特征:4111222VRLVˊDˊRˊLˊRˊLˊ(2,2)(3,1)(2,-2)(-2,2)(-2,2)(2,-2)例1

D

11222VRLVˊDˊRˊLˊRˊLˊ(2,2)(3,1)42當(dāng)博弈進(jìn)行到第三階段時,1,2必須同時作了決策,(或者說,每個參與人在決策時,并不知道對方作出了什么選擇)。這樣在第三階段構(gòu)成了一個策略(靜態(tài))博弈(二人零和博弈)。當(dāng)博弈進(jìn)行到第三階段時,1,2必須同時作了決策,43這一策略(靜態(tài))博弈的收益矩陣為:參與人1參與人2LˊRˊDˊ-2,22,-2Vˊ2,-2-2,2這一策略(靜態(tài))博弈的收益矩陣為:參與人2LˊRˊDˊ-244這個策略(靜態(tài))博弈有唯一的一個混合策略納什均衡:((1/2,1/2),(1/2,1/2)),其帶給雙方的期望收益(0,0)這樣這個博弈可以簡化為這個策略(靜態(tài))博弈有唯一的4512VRL(2,2)(3,1)D(0,0)12VRL(2,2)(3,1)D(0,0)46繼續(xù)運(yùn)用逆推歸納法,易求得子博弈精煉納什均衡為12L(3,1)D繼續(xù)運(yùn)用逆推歸納法,12L(3,1)D47二、求解方法(一)按逆推歸納法的思路進(jìn)行求解。(二)對同時選擇構(gòu)成策略(靜態(tài))博弈的階段,分別應(yīng)用策略(靜態(tài))博弈求解法求解(三)將求解結(jié)果分別代入原博弈簡化,再按逆推歸納法求解。二、求解方法(一)按逆推歸納法的思路進(jìn)行求解。48例2,銀行擠兌兩客戶在銀行各存100元,銀行將這200元投資于一個長期項目,如果在項目到期前抽回資金,則只能收回140元(記為日期1),如果到期后(日期2)再收回投資,則可回收本利280元。例2,銀行擠兌兩客戶在銀行各存100元,銀行49客戶抽回存款的日期也是這兩種,這一博弈可擴(kuò)展表示如下:客戶抽回存款的日期也是這兩種,5011222不抽抽ˊ(140,140)2抽抽抽抽抽不抽不抽不抽不抽不抽(140,100)(100,140)(100,100)(40,100)(100,40)(70,70)11222不抽抽ˊ(140,140)2抽抽抽抽抽不抽不抽不抽51解:應(yīng)用逆向歸納法的思想求解。在日期2(即第二階段),兩客戶決策構(gòu)成了一個策略(靜態(tài))博弈,其正規(guī)型表示如下21抽不抽抽140,140140,100不抽100,140100,100日期2解:應(yīng)用逆向歸納法的思想求解。21抽不抽抽140,1401452顯然,這一策略(靜態(tài))博弈有唯一的納什均衡為(抽,抽),其收益分別為140,140。將這一結(jié)果代入原博弈,可簡化為:顯然,這一策略(靜態(tài))博弈有唯一的5312不抽2抽抽抽不抽(40,100)(100,40)(70,70)(140,140)12不抽2抽抽抽不抽(40,100)(100,40)(70,54它又構(gòu)成了一個策略(靜態(tài))博弈其正規(guī)型表示如下21抽不抽概率抽70,70100,140P不抽40,100140,1401-P概率r1-r日期1它又構(gòu)成了一個策略(靜態(tài))博弈21抽不抽概率抽70,701055這一博弈有兩個純策略納什均衡(抽,抽)和(不抽,不抽),還有一個混合策略納什衡,即各以4/7的概率在第1日期抽回資金。

這一博弈有兩個純策略納什均衡56結(jié)果分析:1.當(dāng)信用環(huán)境非常好的情況下,客戶的選擇是在第1日期“不抽”,在第二日期“抽回”,雙方獲利最大(140,140)結(jié)果分析:1.當(dāng)信用環(huán)境非常好的情況下,572.當(dāng)信用環(huán)境非常不好的情況下,客戶的選擇是在第1日期“抽”,在雙方獲利最?。?0,70)2.當(dāng)信用環(huán)境非常不好的情況下,583.當(dāng)信用環(huán)境一般的情況下,客戶數(shù)量很大時,將有4/7的客戶在第1日期抽回資金。或者說,客戶將抽回4/7的資金3.當(dāng)信用環(huán)境一般的情況下,59例3,關(guān)稅與不完全國際競爭設(shè)有兩個國家1,2,分別有兩上企業(yè)(分別記為企業(yè)1,企業(yè)2),企業(yè)1,2生產(chǎn)既內(nèi)銷又出口的相互競爭商品,確定國家1,2的關(guān)稅策略和企業(yè)1,2的產(chǎn)量策略。例3,關(guān)稅與不完全國際競爭60例3,關(guān)稅與不完全國際競爭設(shè)有兩個國家1,2,分別有兩上企業(yè)(分別記為企業(yè)1,企業(yè)2),企業(yè)1,2生產(chǎn)既內(nèi)銷又出口的相互競爭商品,確定國家1,2的關(guān)稅策略和企業(yè)1,2的產(chǎn)量策略。例3,關(guān)稅與不完全國際競爭設(shè)有兩個國家1,2,分別有兩上企業(yè)61設(shè)Qi為國家i的市場商品總量,反需求函數(shù)Pi=a-Qi,企業(yè)i生產(chǎn)hi個單位供內(nèi)銷,ei單位供出口,因此Qi=hi+ej(i≠j)單位成本為常數(shù)C,國家i的關(guān)稅率為ti設(shè)Qi為國家i的市場商品總量,反需求函數(shù)Pi=a-Qi,企業(yè)62設(shè)設(shè)首先由兩國政府同時制定關(guān)稅率ti,企業(yè)1、2根據(jù)t1,t2同時決定各自內(nèi)銷和出口的產(chǎn)量(h1,e1)和(h2,e2)。設(shè)設(shè)首先由兩國政府同時制定關(guān)稅率ti,63解:企業(yè)以利潤最大化為目標(biāo),利潤函數(shù)為解:企業(yè)以利潤最大化為目標(biāo),64第十一講廣延型博弈與反向歸納策略65國家以社會福利最大化為目標(biāo),包括消費(fèi)者剩余,本國企業(yè)的利潤和國家關(guān)稅三部分,社會福利函數(shù)為:國家以社會福利最大化66第十一講廣延型博弈與反向歸納策略67應(yīng)用逆時歸納法來分析此博弈先從第二階段開始,可設(shè)t1,t2已定,求maxлi的解應(yīng)用逆時歸納法來分析此博弈68第十一講廣延型博弈與反向歸納策略69第十一講廣延型博弈與反向歸納策略70再回到第一階段兩國之間的博弈。將上述結(jié)果分別代入wi得再回到第一階段兩國之間的博弈。71第十一講廣延型博弈與反向歸納策略72即兩國的最佳關(guān)稅選擇為將這一結(jié)果代入得即兩國的最佳關(guān)稅選擇為將這一結(jié)果代入得73第十一講廣延型博弈與反向歸納策略廣延型博弈適合于分析動態(tài)博弈過程,其強(qiáng)調(diào)的重點(diǎn)在行動的時序性,以及參與人決定策略時所擁有的信息集。第一節(jié)廣延型博弈的定義與形式一、廣延型博弈的定義信息完美(perfectinformation),是指每一個參與人在其作決策時,對于以前所發(fā)生的事件具有完全的信息。

第十一講廣延型博弈與反向歸納策略廣延型博弈適合于分析動態(tài)74廣延型博弈構(gòu)成要素(1)決策點(diǎn)與決策分枝的結(jié)構(gòu),在初始決策點(diǎn)與最終結(jié)局點(diǎn)之間不存在任何閉環(huán)(closedloops);(2)清楚地指明什么決策點(diǎn)屬于哪一個參與人;(3)在自然決策點(diǎn)上選擇的概率是公共知識;(4)參與人作決策時所依據(jù)的信息集;信息集把參與人在某一時刻的所有決策點(diǎn)分成若干類;(5)在博弈的終極點(diǎn)上每一個參與人的收益廣延型博弈構(gòu)成要素(1)決策點(diǎn)與決策分枝的結(jié)構(gòu),在初始決策點(diǎn)75二、廣延型博弈的形式廣延型博弈是以“決策樹”或“博弈樹”的形式來表達(dá)的。二、廣延型博弈的形式廣延型博弈是以“決策樹”或“博弈樹”的76122(2,0)(2,-1)(1,0)(3,1)LRMNMN122(2,0)(2,-1)(1,0)(3,1)LRMNMN77三、廣延型博弈的規(guī)則第一,初始點(diǎn)沒有一條箭頭指向它;對其他所有箭頭,都只有一條箭頭指向它。第二,如果我們從某一點(diǎn)向初始點(diǎn)返回,我們就不可能再通過迂回的途徑回這一點(diǎn),我們只能按反向逐次返回原點(diǎn)。

三、廣延型博弈的規(guī)則第一,初始點(diǎn)沒有一條箭頭指向它;對其他78第二節(jié)完美信息廣延(動態(tài))博弈一、特征。(一)決策有先后順序(二)關(guān)于博弈進(jìn)程的信息是不對稱的后決策者擁有更多信息。第二節(jié)完美信息廣延(動態(tài))博弈79(三)具有完美信息:即參與人決策時完全了解之前的博弈過程的信息。(四)動態(tài)博弈至少有兩個階段;階段:參與者在某一時點(diǎn)進(jìn)行的一次決策。(三)具有完美信息:80二、可信性:先決策者對后決策者行為的信任性。即先決策者是否相信后決策者是否采取有利的(許諾)或不利的(威脅)行為。二、可信性:先決策者對后決策者行為的信任性。81例1:父女博弈。女兒交了一個父親不喜歡的男友,父親威脅說:“你如果不斷絕與他的關(guān)系,我與你斷絕關(guān)系?!迸畠菏欠裣嘈鸥赣H的威脅?這一博弈可如下表示:例1:父女博弈。女兒交了一個父親不喜歡的男友,82女兒父親斷絕交往不交往不斷絕(1,-1)(2,1)(0,1)女兒父親斷絕交往不交往不斷絕(1,-1)(2,1)(0,1)83作為女兒,知道父親斷絕與女兒的關(guān)系損失是非常大的,因此,對父親來講,即使女兒不聽話,“斷絕”是下策,應(yīng)被剔除掉:作為女兒,知道父親斷絕與女兒的關(guān)系84女兒父親交往不交往不斷絕(2,1)(0,1)女兒父親交往不交往不斷絕(2,1)(0,1)85聰明的女兒在看到父親的威脅不可信時,一定不會選擇“不交往”女兒父親交往不斷絕(2,1)聰明的女兒在看到父親的威脅不可信時,女兒父親交往不斷絕(2,86父親的威脅是不可信的。因此,所謂不可信的威脅,就是指一旦采取該策略,給他本人帶來的收益并非最大的策略父親的威脅是不可信的。因此,所謂不可信的威脅,87例2:開金礦(二階段):參與人2欲開采一價值4萬元的金礦,但缺乏1萬資金,參與人1恰擁有一萬元資金。參與人2對參與人1說:“如果你把錢借給我,我與你平分開金礦所得。”參與人1是否應(yīng)相信2把錢借給他?例2:開金礦(二階段):參與人2欲開采一價值4萬元的金礦,8812分借不借不分(2,2)(0,4)(1,0)12分借不借不分(2,2)(0,4)(1,0)89在參與人借的資金開發(fā)金礦后,平分所得是其下策,故應(yīng)被剔除:12借不借不分(0,4)(1,0)在參與人借的資金開發(fā)金礦后,12借不借不分(0,4)(1,090這時,“借”成為參與人1的下策,故應(yīng)被剔除:1不借(1,0)這時,“借”成為參與人1的下策,1不借(1,0)91參與人2的許諾是不可信的。所謂不可信的許諾,就是指一旦采取該策略,給他本人帶來的收益并非最大的策略參與人2的許諾是不可信的。所謂不可信的許諾,92例3:開金礦(三階段)在有完善的法律制度的條件下,參與人1可以在參與人而不信守承諾的情況下選擇與其打官司,這樣就變成了一個三階段博弈。這時參與人1是否應(yīng)相信2的承諾?例3:開金礦(三階段)在有完善的法律制度的條件下,9312分借不借不分(2,2)(0,4)(1,0)1不打打(1,0)12分借不借不分(2,2)(0,4)(1,0)1不打打(1,9412分借不借不分(2,2)(1,0)1打(1,0)在參與人2不信守承諾的情況下,不打官司是參與人1的下策故應(yīng)被剔除12分借不借不分(2,2)(1,0)1打(1,0)在參與人295由于參與人1必定會選擇打官司,故不分是參與人2的下策因此被剔除12分借不借(2,2)(1,0)由于參與人1必定會選擇打官司,12分借不借(2,2)(1,096在這種情況下,參與人1知道參與人2必定會其起平分收益,不借則變成了他的下策,剔除之。12分借(2,2)在這種情況下,參與人1知道參與人212分借(2,2)97在法律制度建立后,參與人2的許諾變?yōu)榭尚旁诜山∪珪r,既可保障社會公平,又可提高社會經(jīng)濟(jì)活動效率。在法律制度建立后,98所謂可信的許諾(威脅),就是指一旦采取該策略,給他本人帶來的收益一定最大的策略所謂可信的許諾(威脅),99三、子博弈和逆推歸納法

(一)子博弈:從一個博弈的某個階段開始的能夠自成一個博弈的后續(xù)階段。它必須有一個初始信息集,具備進(jìn)行博弈的需要的各種信息。三、子博弈和逆推歸納法

(一)子博弈:100(二)逆推歸納法:從動態(tài)博弈的最后一個階段或最后一個子博弈開始,逐步倒推以求解動態(tài)博弈的方法。(二)逆推歸納法:從動態(tài)博弈的最后一個階段101四、子博弈精煉納什均衡如果動態(tài)博弈中各參與人的策略在動態(tài)博弈本身和所有子博弈中都構(gòu)成一個納什均衡,則稱該策略組合為一個子博弈精煉納什均衡。四、子博弈精煉納什均衡如果動態(tài)博弈中各參與人102例4.討價還價博弈(三階段)設(shè)兩人就如何分割1萬元進(jìn)行談判,規(guī)則如下:首先由1提出一個分割比例S1,2可以接受也可以拒絕,如果2拒絕,則提一個分割比例S2,這時1可以接受,也可以拒絕,如果拒絕,則出價S則2必須接受例4.討價還價博弈(三階段)設(shè)兩人就如何分割1萬元進(jìn)行談判,103假設(shè)每經(jīng)過一輪要有一定的折扣,折扣因子為。的大小與談判者的耐心,通貨膨脹以及資金的時間價值等有關(guān)。假設(shè)每經(jīng)過一輪要有一定的折扣,。的大小與談判者的耐心,10412接受出S1不接受出S2(S1,1-S1)(δ2S,δ2(1-S))(δS2,δ(1-S2))1接受不接受出S解:展開表示為12接受出S1不接受出S2(S1,1-S1)(δ2S,δ2(105應(yīng)用逆推歸納法。第三階段:1出S,2必須接受,因此S=112接受出S1不接受出S2(S1,1-S1)(δ2,0)(δS2,δ(1-S2))1接受不接受出S=1應(yīng)用逆推歸納法。12接受出S1不接受出S2(S1,1-S1)106第二階段:2知道在第三階段1必出S=1,因此,為了避免這一情況的出現(xiàn),自己出的S2(即1的所得)應(yīng)滿足:第二階段:2知道在第三階段107這時博弈樹變?yōu)?2接受出S1不接受出S2=δ(S1,1-S1)(δ2,

δ(1-δ))1接受這時博弈樹變?yōu)?2接受出S1不接受出S2=δ(S1,1-S108第一階段,如果1的出價S1滿足1-S1≥δ(1-δ)即S1≤1-δ+δ2則2不會拒絕第一階段,如果1的出價S1滿足109因此,1的最優(yōu)出價S1=1-δ+δ2這時S1=1-δ+δ2>δ2避免進(jìn)入下一段談判,雙方獲得的收益均達(dá)到最大。¥因此,1的最優(yōu)出價11012接受出S1=1-δ+δ2(1-δ+δ2,δ-δ2)最終的博弈路徑(子博弈精煉納什均衡)為12接受出S1=1-δ+δ2(1-δ+δ2,δ-δ2)最終的111例5.求下列四階段動態(tài)博弈的子博弈精煉納什均衡。例5.求下列四階段動態(tài)博弈11212cabd(4,3)(3,6)(5,3)1h(8,5)1efg(2,4)12cabd(4,3)(3,6)(5,3)1h(8,5)1e113第三節(jié)有同時選擇的動態(tài)博弈一、特征:在博弈的某些階段,有多個參與者同時進(jìn)行決策第三節(jié)有同時選擇的動態(tài)博弈一、特征:11411222VRLVˊDˊRˊLˊRˊLˊ(2,2)(3,1)(2,-2)(-2,2)(-2,2)(2,-2)例1

D

11222VRLVˊDˊRˊLˊRˊLˊ(2,2)(3,1)115當(dāng)博弈進(jìn)行到第三階段時,1,2必須同時作了決策,(或者說,每個參與人在決策時,并不知道對方作出了什么選擇)。這樣在第三階段構(gòu)成了一個策略(靜態(tài))博弈(二人零和博弈)。當(dāng)博弈進(jìn)行到第三階段時,1,2必須同時作了決策,116這一策略(靜態(tài))博弈的收益矩陣為:參與人1參與人2LˊRˊDˊ-2,22,-2Vˊ2,-2-2,2這一策略(靜態(tài))博弈的收益矩陣為:參與人2LˊRˊDˊ-2117這個策略(靜態(tài))博弈有唯一的一個混合策略納什均衡:((1/2,1/2),(1/2,1/2)),其帶給雙方的期望收益(0,0)這樣這個博弈可以簡化為這個策略(靜態(tài))博弈有唯一的11812VRL(2,2)(3,1)D(0,0)12VRL(2,2)(3,1)D(0,0)119繼續(xù)運(yùn)用逆推歸納法,易求得子博弈精煉納什均衡為12L(3,1)D繼續(xù)運(yùn)用逆推歸納法,12L(3,1)D120二、求解方法(一)按逆推歸納法的思路進(jìn)行求解。(二)對同時選擇構(gòu)成策略(靜態(tài))博弈的階段,分別應(yīng)用策略(靜態(tài))博弈求解法求解(三)將求解結(jié)果分別代入原博弈簡化,再按逆推歸納法求解。二、求解方法(一)按逆推歸納法的思路進(jìn)行求解。121例2,銀行擠兌兩客戶在銀行各存100元,銀行將這200元投資于一個長期項目,如果在項目到期前抽回資金,則只能收回140元(記為日期1),如果到期后(日期2)再收回投資,則可回收本利280元。例2,銀行擠兌兩客戶在銀行各存100元,銀行122客戶抽回存款的日期也是這兩種,這一博弈可擴(kuò)展表示如下:客戶抽回存款的日期也是這兩種,12311222不抽抽ˊ(140,140)2抽抽抽抽抽不抽不抽不抽不抽不抽(140,100)(100,140)(100,100)(40,100)(100,40)(70,70)11222不抽抽ˊ(140,140)2抽抽抽抽抽不抽不抽不抽124解:應(yīng)用逆向歸納法的思想求解。在日期2(即第二階段),兩客戶決策構(gòu)成了一個策略(靜態(tài))博弈,其正規(guī)型表示如下21抽不抽抽140,140140,100不抽100,140100,100日期2解:應(yīng)用逆向歸納法的思想求解。21抽不抽抽140,14014125顯然,這一策略(靜態(tài))博弈有唯一的納什均衡為(抽,抽),其收益分別為140,140。將這一結(jié)果代入原博弈,可簡化為:顯然,這一策略(靜態(tài))博弈有唯一的12612不抽2抽抽抽不抽(40,100)(100,40)(70,70)(140,140)12不抽2抽抽

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負(fù)責(zé)。
  • 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時也不承擔(dān)用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

評論

0/150

提交評論