博弈論(第八講 完美信息動(dòng)態(tài)博弈求解)_第1頁(yè)
博弈論(第八講 完美信息動(dòng)態(tài)博弈求解)_第2頁(yè)
博弈論(第八講 完美信息動(dòng)態(tài)博弈求解)_第3頁(yè)
博弈論(第八講 完美信息動(dòng)態(tài)博弈求解)_第4頁(yè)
博弈論(第八講 完美信息動(dòng)態(tài)博弈求解)_第5頁(yè)
已閱讀5頁(yè),還剩31頁(yè)未讀, 繼續(xù)免費(fèi)閱讀

下載本文檔

版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請(qǐng)進(jìn)行舉報(bào)或認(rèn)領(lǐng)

文檔簡(jiǎn)介

1、第八第八講 完美信息動(dòng)態(tài)博弈求解第八講第八講 完美信息動(dòng)態(tài)博弈求解完美信息動(dòng)態(tài)博弈求解引例引例第八講第八講 完美信息動(dòng)態(tài)博弈求解完美信息動(dòng)態(tài)博弈求解引例引例第第8講講 完美信息動(dòng)態(tài)博弈求解完美信息動(dòng)態(tài)博弈求解子博弈精煉納什均衡與逆向歸納法子博弈精煉納什均衡與逆向歸納法離散動(dòng)態(tài)博弈求解離散動(dòng)態(tài)博弈求解連續(xù)動(dòng)態(tài)博弈求解連續(xù)動(dòng)態(tài)博弈求解8.1 子博弈精煉納什均衡與逆向歸納法子博弈精煉納什均衡與逆向歸納法 8 8.1.1 .1.1 子博弈精煉納什均衡與逆向歸納法子博弈精煉納什均衡與逆向歸納法子博弈子博弈 子博弈子博弈:在某個(gè)擴(kuò)展式博弈中,如果節(jié)點(diǎn)x以及它的所有后續(xù)節(jié)點(diǎn)所在的信息集都不包括非x的后續(xù)節(jié)點(diǎn)

2、,就稱博弈樹中的節(jié)點(diǎn)x開啟了一個(gè)子博弈子博弈。子博弈是由節(jié)點(diǎn)x與它的后續(xù)節(jié)點(diǎn)所定義的樹狀結(jié)構(gòu)。u 一旦處于子博弈中,各參與人都具有他們正處的子博弈的共同知識(shí)。u 子博弈是自成一體的擴(kuò)展式博弈,將其看成一個(gè)獨(dú)立的博弈也是有意義的。 如果一個(gè)子博弈的初始點(diǎn)并不是該博弈的初始點(diǎn),這個(gè)子博弈被稱為嚴(yán)格子博弈。嚴(yán)格子博弈。 8.1 子博弈精煉納什均衡與逆向歸納法子博弈精煉納什均衡與逆向歸納法 8 8.1.1 .1.1 子博弈精煉納什均衡與逆向歸納法子博弈精煉納什均衡與逆向歸納法子博弈子博弈8.1 子博弈精煉納什均衡與逆向歸納法子博弈精煉納什均衡與逆向歸納法 8 8.1.1 .1.1 子博弈精煉納什均衡與

3、逆向歸納法子博弈精煉納什均衡與逆向歸納法子博弈子博弈8.1 子博弈精煉納什均衡與逆向歸納法子博弈精煉納什均衡與逆向歸納法 8 8.1.1 .1.1 子博弈精煉納什均衡與逆向歸納法子博弈精煉納什均衡與逆向歸納法子博弈子博弈8.1 子博弈精煉納什均衡與逆向歸納法子博弈精煉納什均衡與逆向歸納法 8.1.2 子博弈精煉納什均衡與逆向歸納法子博弈精煉納什均衡與逆向歸納法子博弈精煉納什均衡子博弈精煉納什均衡 子博弈精煉納什均衡子博弈精煉納什均衡:對(duì)于一個(gè)策略組合而言,如果它在原博弈的每一個(gè)子博弈中都是納什均衡,這個(gè)策略組合就被稱為子博弈精煉納什均衡。 9在均衡博弈中所有決策節(jié)點(diǎn)處,在均衡博弈中所有決策節(jié)點(diǎn)

4、處,保證每個(gè)參與者的策略都能制定保證每個(gè)參與者的策略都能制定最佳行動(dòng)。最佳行動(dòng)。將參與者的最佳行動(dòng)擴(kuò)展到所有將參與者的最佳行動(dòng)擴(kuò)展到所有的偶然事件中,而不僅僅是那些的偶然事件中,而不僅僅是那些在均衡博弈中發(fā)生的事件。在均衡博弈中發(fā)生的事件。比較比較 納什均衡納什均衡 子博弈精子博弈精煉納什均煉納什均衡衡8.1 子博弈精煉納什均衡與逆向歸納法子博弈精煉納什均衡與逆向歸納法 8.1.2 子博弈精煉納什均衡與逆向歸納法子博弈精煉納什均衡與逆向歸納法子博弈精煉納什均衡子博弈精煉納什均衡納什均衡(不綁架,釋放,殺害),不付贖金)能夠保證在蓋伊不綁架的情況下,薇薇卡的最優(yōu)行動(dòng)為不付贖金;但是,一旦蓋伊實(shí)施

5、綁架,蓋伊在后兩個(gè)節(jié)點(diǎn)上的策略仍為(釋放,殺害)時(shí),不付贖金不再是薇薇卡的最佳行動(dòng)。因此,該納什均衡不符合子博弈精煉納什均衡的思想。納什均衡(綁架,釋放,殺害),支付贖金)符合子博弈精煉納什均衡的思想。8.1 子博弈精煉納什均衡與逆向歸納法子博弈精煉納什均衡與逆向歸納法 8.1.3 子博弈精煉納什均衡與逆向歸納法子博弈精煉納什均衡與逆向歸納法序貫理性序貫理性 為了求解子博弈精煉納什均衡,不僅要考慮參與人事先(就博弈開始前而言)選擇的最優(yōu)反應(yīng),參與人在任何需要做出決定的時(shí)候,都應(yīng)該表現(xiàn)出理性。這稱為序貫理性。 如果序貫理性是參與人之間的共同知識(shí),那么每個(gè)參與人都會(huì)“提前”考慮各參與人未來對(duì)于他在

6、某一信息集中采取的行為將如何相應(yīng)地做出反應(yīng)。 8.1 子博弈精煉納什均衡與逆向歸納法子博弈精煉納什均衡與逆向歸納法 8.1.4 子博弈精煉納什均衡與逆向歸納法子博弈精煉納什均衡與逆向歸納法逆向歸納法逆向歸納法 逆向歸納法逆向歸納法:一種從后往前(從博弈樹末端的信息集推到博弈開始時(shí)的信息集)分析動(dòng)態(tài)博弈的方法。在可以到達(dá)終止節(jié)點(diǎn)的假定下,依次刪去每個(gè)信息集中作為劣勢(shì)策略的行動(dòng)。 在完美信息條件下,如果沒有兩個(gè)及以上的終止點(diǎn)對(duì)某個(gè)在完美信息條件下,如果沒有兩個(gè)及以上的終止點(diǎn)對(duì)某個(gè)參與人來說支付相同,那么逆向歸納法可以為各參與人確定參與人來說支付相同,那么逆向歸納法可以為各參與人確定唯一的理性策略組

7、合。唯一的理性策略組合。8.1 子博弈精煉納什均衡與逆向歸納法子博弈精煉納什均衡與逆向歸納法 8.1.4 子博弈精煉納什均衡與逆向歸納法子博弈精煉納什均衡與逆向歸納法逆向歸納法逆向歸納法8.1 子博弈精煉納什均衡與逆向歸納法子博弈精煉納什均衡與逆向歸納法 8.1.4 子博弈精煉納什均衡與逆向歸納法子博弈精煉納什均衡與逆向歸納法逆向歸納法逆向歸納法該博弈的子博弈精煉納什均衡為(綁架,釋放,殺害),支付贖金)。8.1 子博弈精煉納什均衡與逆向歸納法子博弈精煉納什均衡與逆向歸納法 8.1.4 子博弈精煉納什均衡與逆向歸納法子博弈精煉納什均衡與逆向歸納法逆向歸納法逆向歸納法8.1 子博弈精煉納什均衡與

8、逆向歸納法子博弈精煉納什均衡與逆向歸納法 8.1.4 子博弈精煉納什均衡與逆向歸納法子博弈精煉納什均衡與逆向歸納法逆向歸納法逆向歸納法該博弈有4個(gè)納什均衡:(DE,AC),(DE,BC),(UE,BD)和(UF,BD) ;該博弈有2個(gè)子博弈精煉納什均衡: (DE,BC)與(UE,BD)。8.1 子博弈精煉納什均衡與逆向歸納法子博弈精煉納什均衡與逆向歸納法 8.1.5 子博弈精煉納什均衡與逆向歸納法子博弈精煉納什均衡與逆向歸納法小練習(xí)小練習(xí) 8.2 離散動(dòng)態(tài)博弈求解離散動(dòng)態(tài)博弈求解8.2.1離散動(dòng)態(tài)博弈求解離散動(dòng)態(tài)博弈求解古巴導(dǎo)彈危機(jī)古巴導(dǎo)彈危機(jī)8.2 離散動(dòng)態(tài)博弈求解離散動(dòng)態(tài)博弈求解8.2.1

9、離散動(dòng)態(tài)博弈求解離散動(dòng)態(tài)博弈求解古巴導(dǎo)彈危機(jī)古巴導(dǎo)彈危機(jī)8.2 離散動(dòng)態(tài)博弈求解離散動(dòng)態(tài)博弈求解8.2.2 離散動(dòng)態(tài)博弈求解離散動(dòng)態(tài)博弈求解安然公司與檢查特權(quán)安然公司與檢查特權(quán)8.2 離散動(dòng)態(tài)博弈求解離散動(dòng)態(tài)博弈求解8.2.3 離散動(dòng)態(tài)博弈求解離散動(dòng)態(tài)博弈求解種族歧視與棒球隊(duì)種族歧視與棒球隊(duì)8.2 離散動(dòng)態(tài)博弈求解離散動(dòng)態(tài)博弈求解8.2.3 離散動(dòng)態(tài)博弈求解離散動(dòng)態(tài)博弈求解種族歧視與棒球隊(duì)種族歧視與棒球隊(duì)道奇隊(duì)不考慮種族,只看球員的才能;紅襪隊(duì)既考道奇隊(duì)不考慮種族,只看球員的才能;紅襪隊(duì)既考慮球員的才能還考慮球員的種族。這從球員對(duì)每個(gè)慮球員的才能還考慮球員的種族。這從球員對(duì)每個(gè)球隊(duì)的不同價(jià)值體

10、現(xiàn)出來。球隊(duì)的不同價(jià)值體現(xiàn)出來。8.2 離散動(dòng)態(tài)博弈求解離散動(dòng)態(tài)博弈求解8.2.3 離散動(dòng)態(tài)博弈求解離散動(dòng)態(tài)博弈求解種族歧視與棒球隊(duì)種族歧視與棒球隊(duì)8.2 離散動(dòng)態(tài)博弈求解離散動(dòng)態(tài)博弈求解8.2.3 離散動(dòng)態(tài)博弈求解離散動(dòng)態(tài)博弈求解種族歧視與棒球隊(duì)種族歧視與棒球隊(duì)8.2 離散動(dòng)態(tài)博弈求解離散動(dòng)態(tài)博弈求解8.2.3 離散動(dòng)態(tài)博弈求解離散動(dòng)態(tài)博弈求解種族歧視與棒球隊(duì)種族歧視與棒球隊(duì)該博弈的子博弈精煉納什均衡為(2322311211211,2322),(2322311211211,2323),(2322311211211,2342),(2322311211211,2343), (2322311211

11、211,2422),(2322311211211,2423),(2322311211211,2442),(2322311211211,2443). 8.2 離散動(dòng)態(tài)博弈求解離散動(dòng)態(tài)博弈求解8.2.4 離散動(dòng)態(tài)博弈求解離散動(dòng)態(tài)博弈求解搶先博弈搶先博弈 在搶先博弈中,每個(gè)參與者決定何時(shí)行動(dòng),當(dāng)下列情形發(fā)生時(shí)參與者獲得較高的支付:(1 1)先于其他人行動(dòng);)先于其他人行動(dòng);(2 2)行動(dòng)之前等待更長(zhǎng)的時(shí)間。)行動(dòng)之前等待更長(zhǎng)的時(shí)間。 假設(shè)只有兩個(gè)乘客,排在第一位收益為30,排在第二位收益為20。排隊(duì)時(shí)間的成本如右表所示: 8.2 離散動(dòng)態(tài)博弈求解離散動(dòng)態(tài)博弈求解8.2.4 離散動(dòng)態(tài)博弈求解離散動(dòng)態(tài)博

12、弈求解搶先博弈搶先博弈 通過求解可得,該博弈的子博弈精煉納什均衡為(等待,行動(dòng),行動(dòng)),(等待,行動(dòng),行動(dòng))。該博弈的均衡結(jié)果為參與人1在第三輪選擇行動(dòng),二人的支付分別為9和(-1),明顯劣于兩人都一直選擇等待所得到的支付水平25。這是由于人們的急切心理造成的。8.2 離散動(dòng)態(tài)博弈求解離散動(dòng)態(tài)博弈求解8.2.5 離散動(dòng)態(tài)博弈求解離散動(dòng)態(tài)博弈求解消耗戰(zhàn)消耗戰(zhàn) 消耗戰(zhàn)是時(shí)機(jī)博弈,當(dāng)下列情形發(fā)生時(shí)參與者獲得較高的支付:(1 1)其他參與者較早行動(dòng);()其他參與者較早行動(dòng);(2 2)自己較早行動(dòng)。)自己較早行動(dòng)。 消耗戰(zhàn)源于一種軍事沖突類型。雙方持續(xù)交火,每一方都希望對(duì)方能迅速放棄進(jìn)攻或投降,都希望能

13、比對(duì)方堅(jiān)持更長(zhǎng)時(shí)間。 【例子】自己首先行動(dòng)支付為0,而讓對(duì)方首先行動(dòng)的支付為100。如果雙方都不行動(dòng),那么每一方的成本消耗都是10。 8.2 離散動(dòng)態(tài)博弈求解離散動(dòng)態(tài)博弈求解8.2.5 離散動(dòng)態(tài)博弈求解離散動(dòng)態(tài)博弈求解消耗戰(zhàn)消耗戰(zhàn) 該博弈的子博弈精煉納什均衡為(等待,等待),(等待,等待)。該博弈的均衡結(jié)果為兩個(gè)參與人都是一直選擇等待,導(dǎo)致每個(gè)人的最終支付都為10。8.2 離散動(dòng)態(tài)博弈求解離散動(dòng)態(tài)博弈求解8.2.6 離散動(dòng)態(tài)博弈求解小練習(xí)求解下列博弈的子博弈精煉納什均衡:該博弈的子博弈精煉納什均衡為(Ry,bb)。 8.3 連續(xù)動(dòng)態(tài)博弈求解連續(xù)動(dòng)態(tài)博弈求解廣告和競(jìng)爭(zhēng)廣告和競(jìng)爭(zhēng) 廣告可以以多種形

14、式出現(xiàn),并且對(duì)需求和福利有不同的效應(yīng)。 強(qiáng)調(diào)一個(gè)產(chǎn)品的優(yōu)點(diǎn)的廣告,稱為正面廣告。 強(qiáng)調(diào)競(jìng)爭(zhēng)產(chǎn)品劣勢(shì)的廣告,稱為負(fù)面廣告。 公司可以通過廣告來增加對(duì)他的產(chǎn)品的需求,有時(shí)候增加的需求是以犧牲競(jìng)爭(zhēng)公司的利益為代價(jià)的。8.3 連續(xù)動(dòng)態(tài)博弈求解連續(xù)動(dòng)態(tài)博弈求解廣告和競(jìng)爭(zhēng)廣告和競(jìng)爭(zhēng) 考慮一個(gè)古諾雙寡頭模型,其中公司1在與其他公司競(jìng)爭(zhēng)之前需要進(jìn)行廣告宣傳。公司1選擇做廣告的程度a0。廣告對(duì)于該行業(yè)的商品需求具有正向效應(yīng),提高消費(fèi)者愿意為兩個(gè)公司所生產(chǎn)產(chǎn)品所付出的價(jià)格。市場(chǎng)價(jià)格p=a-q1-q2,q1與q2分別為公司1與公司2的產(chǎn)量。在公司1選擇a之后,可以被公司2觀察到。然后兩個(gè)公司同時(shí)并獨(dú)立地選擇產(chǎn)量水平。假設(shè)公司以零成本生產(chǎn),但公司1必須付出的廣告成本為2a3/81。8.3 連續(xù)動(dòng)態(tài)博弈求解連續(xù)動(dòng)態(tài)博弈求解廣告和競(jìng)爭(zhēng)廣告和競(jìng)爭(zhēng) 該博弈的擴(kuò)展式為:公司公司1公司公司1公司公司2aq2q1u1,u2 該博弈具有無(wú)限的嚴(yán)格子博弈公司1選擇a之后進(jìn)行的古諾雙寡頭競(jìng)爭(zhēng)。 使用逆向歸納法求解該博弈:先求子博弈的納什均衡,再計(jì)算公司1的廣告投入。8.3 連續(xù)動(dòng)態(tài)博弈求解連續(xù)動(dòng)態(tài)博弈求解廣告和競(jìng)爭(zhēng)廣告和競(jìng)爭(zhēng) 公司1的支付為: 因?yàn)閍已經(jīng)被選定,可以看做是一個(gè)常數(shù)。對(duì)q1求導(dǎo)數(shù)并令其等于0,得到公司1對(duì)公司2所選產(chǎn)量q2的最優(yōu)反應(yīng): 同理,公司2的最優(yōu)反應(yīng)函數(shù)為: 對(duì)這兩式構(gòu)成

溫馨提示

  • 1. 本站所有資源如無(wú)特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請(qǐng)下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請(qǐng)聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁(yè)內(nèi)容里面會(huì)有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫(kù)網(wǎng)僅提供信息存儲(chǔ)空間,僅對(duì)用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對(duì)用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對(duì)任何下載內(nèi)容負(fù)責(zé)。
  • 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請(qǐng)與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶因使用這些下載資源對(duì)自己和他人造成任何形式的傷害或損失。

最新文檔

評(píng)論

0/150

提交評(píng)論