(精選)博弈論以及應(yīng)用之3完全且完美信息動態(tài)博弈1x課件_第1頁
(精選)博弈論以及應(yīng)用之3完全且完美信息動態(tài)博弈1x課件_第2頁
(精選)博弈論以及應(yīng)用之3完全且完美信息動態(tài)博弈1x課件_第3頁
(精選)博弈論以及應(yīng)用之3完全且完美信息動態(tài)博弈1x課件_第4頁
(精選)博弈論以及應(yīng)用之3完全且完美信息動態(tài)博弈1x課件_第5頁
已閱讀5頁,還剩38頁未讀 繼續(xù)免費閱讀

下載本文檔

版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進行舉報或認領(lǐng)

文檔簡介

1、博弈論及其應(yīng)用 Game Theory with Applications第三章:完全且完美信息動態(tài)博弈Chapter III: Dynamic Game of Complete & Perfect Information第1頁,共43頁。2022/8/1423.1 動態(tài)關(guān)系網(wǎng)絡(luò)詩歌我站在未來的山坡上回頭看過去和現(xiàn)在如同不再有懸念的平靜湖面所有發(fā)生的一切都是如此清晰和必然5.12汶川大地震事前難以預(yù)測事后卻成必然棋局、股價與政策棋局:對弈的基本規(guī)則與原則股價:事后判斷什么時候買進什么時候賣出很容易政策:其有效性取決于大眾的反應(yīng)第2頁,共43頁。2022/8/1433.2 完美信息完全信息com

2、plete information我方知道對方知道的一切,對方知道我方知道對方的一切對方知道我方知道的一切,我方知道對方知道我方的一切一切通常用效用或類型來描述動態(tài)博弈dynamic game后行動者看到先行動者的行為選擇之后再選擇自己的行為如果在選擇自己行為之前看不到對方的行為就是靜態(tài)博弈完美信息perfect information后行動者記得此前的全部博弈進程,稱為完美信息全部博弈進程包括局中人的博弈順序每個局中人在各個階段的行為選擇第3頁,共43頁。2022/8/1443.3 動態(tài)博弈中的行為與戰(zhàn)略I事例1:中美戰(zhàn)略博弈解放初,美國總是尋找各種機會來侵犯我國。對此,毛主席提出了“人不犯

3、我、我不犯人,人若犯我、我必犯人”的戰(zhàn)略方針。模型描述局中人美國和中國行動空間美國:來犯,不犯中國:犯人,不犯行動順序先行者:美國后行者:中國第4頁,共43頁。2022/8/1453.3 動態(tài)博弈中的行為與戰(zhàn)略II模型描述戰(zhàn)略空間美國先行者戰(zhàn)略就是行動中國后行者戰(zhàn)略是針對先行者各種可能行動而制定的行動方案,包括美國犯我,我犯人;美國不犯我,我犯人美國犯我,我不犯人;美國不犯我,我不犯人美國犯我,我犯人;美國不犯我,我不犯人美國犯我,我不犯人;美國不犯我,我犯人簡記為(犯人,犯人); (不犯人,不犯人)(犯人,不犯人); (不犯人,犯人)第5頁,共43頁。2022/8/1463.3 動態(tài)博弈中的

4、行為與戰(zhàn)略III模型描述收益刻畫美犯我,我犯人:美-2,中-3美犯我,我不犯人:美1,中-4美不犯我,我犯人:美2,中-5美不犯我,我不犯人:美0,中0收益矩陣納什均衡美不犯我,我不犯美(犯人,犯人)(犯人,不犯人)(不犯人,犯人)(不犯人,不犯人)犯我-2,-3-2,-31,-41,-4不犯我2,-50,02,-50,0第6頁,共43頁。2022/8/1473.3 動態(tài)博弈中的行為與戰(zhàn)略IV事例2:產(chǎn)品開發(fā)博弈兩企業(yè)就是否開發(fā)某種新產(chǎn)品展開競爭。設(shè)A先決定是否開發(fā),B看到A的選擇后再決定是否開發(fā)。如果只有一家企業(yè)開發(fā),開發(fā)者將獲利1,不開發(fā)者收益不變。如果兩家企業(yè)都開發(fā),各自將虧損3。如果都

5、不開發(fā),收益都不變。模型描述局中人企業(yè)A和企業(yè)B行動空間開發(fā),不開發(fā)行動順序A先行動,B后行動第7頁,共43頁。2022/8/1483.3 動態(tài)博弈中的行為與戰(zhàn)略V模型描述戰(zhàn)略空間企業(yè)A與行動空間相同企業(yè)B是針對A行動的一系列行動方案,包括A開發(fā),B開發(fā);A不開發(fā),B開發(fā)A開發(fā),B開發(fā);A不開發(fā),B不開發(fā)A開發(fā),B不開發(fā);A不開發(fā),B開發(fā)A開發(fā),B不開發(fā);A不開發(fā),B不開發(fā)簡記為(開發(fā),開發(fā)); (開發(fā),不開發(fā))(不開發(fā),開發(fā)); (不開發(fā),不開發(fā))第8頁,共43頁。2022/8/1493.3 動態(tài)博弈中的行為與戰(zhàn)略VI模型描述收益矩陣納什均衡企業(yè)A開發(fā)B不開發(fā)(開發(fā),(不開發(fā),開發(fā))(開發(fā),

6、(不開發(fā),不開發(fā))企業(yè)A 不開發(fā)B開發(fā)(不開發(fā),(開發(fā),開發(fā))(開發(fā),開發(fā))(開發(fā),不開發(fā))(不開發(fā),開發(fā))(不開發(fā),不開發(fā))開發(fā)-3,-3-3,-31,01,0不開發(fā)0,10,00,10,0第9頁,共43頁。2022/8/14103.3 動態(tài)博弈中的行為與戰(zhàn)略VII總結(jié):動態(tài)博弈的矩陣描述存在的問題戰(zhàn)略空間復(fù)雜后行動者的戰(zhàn)略空間隨局中人的數(shù)量和每一階段局中人的行動選擇數(shù)量而急劇增大對多人多行動的動態(tài)博弈,難以用矩陣描述納什均衡有待精煉可能多個均衡描述的是同一個結(jié)果可能存在不合理的均衡第10頁,共43頁。2022/8/1411(0,0)3.4 動態(tài)博弈中的擴展式描述I博弈樹game tree中

7、美戰(zhàn)略博弈犯人犯我不犯我犯人不犯人不犯人美國我國我國(2,-5)(1,-4)(-2,-3)第11頁,共43頁。2022/8/14123.4 動態(tài)博弈中的擴展式描述II博弈樹game tree新產(chǎn)品開發(fā)博弈開發(fā)開發(fā)不開發(fā)開發(fā)不開發(fā)不開發(fā)A企業(yè)B企業(yè)B企業(yè)(0,0)(0,1)(1,0)(-3,-3)第12頁,共43頁。2022/8/1413(0,0)3.5 逆向歸納法I逆向推理reasoning backward中美戰(zhàn)略博弈均衡結(jié)果美不犯我,我不犯人我方具有后動優(yōu)勢犯人犯我不犯我犯人不犯人不犯人美國我國我國(2,-5)(1,-4)(-2,-3)第13頁,共43頁。2022/8/14143.5 逆向

8、歸納法II逆向推理reasoning backward新產(chǎn)品開發(fā)博弈均衡結(jié)果企業(yè)A開發(fā),B不開發(fā)企業(yè)A具有先動優(yōu)勢開發(fā)開發(fā)不開發(fā)開發(fā)不開發(fā)不開發(fā)A企業(yè)B企業(yè)B企業(yè)(0,0)(0,1)(1,0)(-3,-3)第14頁,共43頁。2022/8/14153.5 逆向歸納法III逆向推理reasoning backward求以下動態(tài)博弈的均衡結(jié)果右下上前后左甲乙甲(2,0)(1,1)(0,2)(3,0)第15頁,共43頁。2022/8/14163.6 序貫理性與理性操縱I序貫理性Sequential Rationality每一個行動點上都選擇最優(yōu)行為逆向歸納法遵循了序貫理性原則理性操縱Controll

9、ed Rationality利用對方的理性缺點,引誘對方上鉤,獲取利益有時候就是“大智若愚”比如,黃蓋詐降成功;孫權(quán)卻賠了夫人又折兵右下上前后左甲乙甲(2,0)(1,1)(100,0)(0,100)第16頁,共43頁。2022/8/14173.6 序貫理性與理性操縱II兩個游戲奪寶戰(zhàn)nim game桌子上有100根火柴,兩個人輪流拿火柴,每次可以拿一根或兩根,拿到最后一根者勝出,可以享受一次港澳游。如果你是先行者,應(yīng)該如何行動?海盜分贓微軟公司用過的面試題5個加勒比海盜搶來100個金幣,大家決定如下分配規(guī)則:先由甲提議,若獲半數(shù)通過,就分;反之,把甲扔進海里,再由乙提議,若獲半數(shù)通過,就分;反

10、之,把乙扔進海里,又由丙提議如果你是甲,該如何提議?第17頁,共43頁。2022/8/14183.7 空頭威脅I故事模型歷史故事青年作家司馬相如與寡婦卓文君相戀,遭到父親反對。于是,私奔,后得到認可。博弈模型空頭威脅Empty Threats會損害威脅者自己利益因而根本不會實施的威脅,常見的例子有子女教育、夫妻關(guān)系、研究生復(fù)試等。默認結(jié)婚斷絕父女關(guān)系文君父親(-1,1)(0,-2)(1,-1)第18頁,共43頁。2022/8/14193.7 空頭威脅II市場進入博弈模型描述均衡結(jié)果(進入,默認)在位者打擊進入者的威脅是空頭的,不可置信的。打擊不進入進入默認進入者在位者(0,100)(50,50

11、)(-10,30)第19頁,共43頁。2022/8/14203.8 空頭承諾I愛的承諾笑話故事有一位小伙子給心愛的姑娘寫了一份情書:親愛的,我愛你愛得如此之深,以至愿意為你赴湯蹈火,上刀山、下火海在所不惜。我非常想見到你,任憑艱難險阻也擋不住我的腳步。本周六如果不下雨,我就來接你。5.12汶川大地震中的感人故事“先救他”“我會做你的左手”一對分不開的夫妻,最終合葬我們都應(yīng)該記住,太動聽的承諾是往往空頭的。但是,我們也應(yīng)該相信真愛。回顧在前述產(chǎn)品開發(fā)博弈中,均衡結(jié)果(不開發(fā),(開發(fā),開發(fā))就是企業(yè)A的空頭承諾,是不可置信的。第20頁,共43頁。2022/8/14213.8 空頭承諾II回顧在前述

12、產(chǎn)品開發(fā)博弈中,均衡結(jié)果(不開發(fā),(開發(fā),開發(fā))就是企業(yè)A的空頭承諾,是不可置信的。生活中的空頭承諾學(xué)生對老師的承諾老師,這回讓我過吧,以后我會好好學(xué)習(xí)的老師,先發(fā)表一篇達到畢業(yè)要求,以后一定會寫核心期刊的山盟海誓愛你一萬年海枯石爛包過包會不過退款不會再學(xué)第21頁,共43頁。2022/8/14223.9 承諾行動I承諾行動Committed Actions使威脅或承諾可信的行動,采取承諾行動過后,實施威脅或承諾符合威脅者或承諾者的利益。在位者的承諾行動在潛在者進入之前,擴大生產(chǎn)能力這解釋了現(xiàn)實中大部分壟斷企業(yè)有閑置生產(chǎn)能力注意:是實實在在的擴大投資,而不是說說而已行勝于言!擴大生產(chǎn)能力打擊不進

13、入進入默認進入者在位者(0,100,70)(50,50,20)(-10,30,25)在位者第22頁,共43頁。2022/8/14233.9 承諾行動II歷史和生活中的承諾行動人質(zhì)與通婚秦王贏政就是人質(zhì)四大美女之一的王昭君就是政治通婚康熙之女藍齊兒更是政治犧牲品截斷后路項羽破釜沉舟對秦軍三國姜維對王經(jīng)南宋韓世忠對李復(fù)戀愛婚姻中的承諾行動為什么要戴戒指?為什么要見雙方朋友和雙方父母?為什么有厚重的彩禮和隆重的婚禮?第23頁,共43頁。2022/8/14243.9 承諾行動III商業(yè)中的承諾行動訂金與抵押訂餐要交訂金按揭購房要抵押質(zhì)量承諾三包條款“假一賠十”價格承諾國美等補差價措施最后一天血價處理加

14、薪策略不斷接到獵頭公司的電話信函不斷接到競爭對手老總的邀請第24頁,共43頁。2022/8/14253.9 承諾行動IV綁架與劫持中的承諾行動綁架與劫持影視作品中的一種常見情節(jié)現(xiàn)實生活中也時有發(fā)生歹徒的威脅是空頭的嗎?可能是,因為他們不想罪上加罪可能不是,因為他們要樹立自己言出必行的聲譽歹徒的承諾行動有哪些?電話里人質(zhì)的痛苦和吶喊聲照片、錄像帶、人質(zhì)的衣物甚至器官警方的威脅是空頭的嗎?可能是,特別是不知道歹徒是誰的時候可能不是,一旦知道歹徒是誰在哪第25頁,共43頁。2022/8/14263.9 承諾行動IV綁架與劫持中的承諾行動對峙中的談判拒絕談判歷史上拒絕談判曾是一種高效方法,漢武帝和曹操

15、都用過實際生活中拒絕談判也是一種重要策略交出控制權(quán)是拒絕談判的一種具體形式談判中的承諾歹徒的承諾可信嗎?職業(yè)歹徒的承諾是可信的,因為他們在樹立和維護自己的聲譽非職業(yè)歹徒的承諾可能也是可信的,因為他們可能不想罪加一等警方的承諾可信嗎?是,為了人質(zhì)的安全不是,為了社會的正義第26頁,共43頁。2022/8/14273.10 子博弈精煉納什均衡I子博弈sub-game原博弈的一部分,從單結(jié)信集開始,擁有獨立信息集子博弈精煉納什均衡sub-game perfect Nash Equilibrium完全信息動態(tài)博弈的均衡概念是在任意一個子博弈上都是納什均衡的均衡也是剔除了所有空頭威脅和空頭承諾的均衡用逆

16、向歸納法求出的均衡一定是子博弈精煉納什均衡右下上前后左甲乙甲(2,0)(1,1)(0,2)(3,0)第27頁,共43頁。2022/8/1428h3.10 子博弈精煉納什均衡II均衡路徑與序貫理性均衡路徑與非均衡路徑精煉納什均衡構(gòu)成的路徑是均衡路徑,其它就是非均衡路徑序貫理性不但在均衡路徑上尋求最優(yōu),而且在非均衡路徑上也尋求最優(yōu)在經(jīng)濟學(xué)中,序貫理性有時候又稱為動態(tài)(不)一致性練習(xí)求以下博弈的子博弈精煉納什均衡cbaefd甲乙甲(5,3)(2,4)(4,3)(3,6)乙g(8,5)第28頁,共43頁。2022/8/1429不借3.10 子博弈精煉納什均衡III練習(xí)為使以下博弈中的威脅和承諾是可信的

17、,參數(shù)a和b 應(yīng)滿足什么條件?不分分打借乙甲(2, 2)(a, b)(1, 0)乙不打(0, 4)第29頁,共43頁。2022/8/14303.11 超級理性I蜈蚣博弈(Centipede Game; Rosenthal, 1981)求子博弈精煉納什均衡選美博弈很多人在一起參加一項游戲,規(guī)則如下:每個人獨立地寫1到100之間的一個整數(shù),所得獎金為50減去,所寫數(shù)字與平均數(shù)之間的絕對差,你該寫多少?1D(1, 1)A2D(0, 3)A1D(99, 99)A2D(98, 101)A(100, 100)1D(2, 2)AD(1, 4)A第30頁,共43頁。2022/8/14313.11 超級理性II

18、瓷器博弈甲乙兩人到景德鎮(zhèn)旅游,各自買了一件相同的瓷器,托運回家。但是,運輸公司把瓷器打碎了。運輸公司提出的賠償方案如下:甲乙各拿一張紙寫出瓷器的價格(只能為0到100之間的整數(shù),因為運輸公司雖然不知道瓷器的價格,但是能夠判斷肯定不會超過100),如果寫出的價格相同,說明是真實的,照價賠償;如果寫出的價格不相同,那么認為價低者是真實的,而價高者在撒謊,對價低者的賠償額為其所寫價格加2,對價高者的賠償額為其所寫價格減2,其中2可以看作是對誠實的獎勵也是對謊言的懲罰。假如瓷器價值20元,甲該寫多少?第31頁,共43頁。2022/8/14323.12 斯塔克伯格模型IStackelberg(1934)

19、基本假設(shè)企業(yè)1為領(lǐng)頭企業(yè),首先選擇自己的產(chǎn)量企業(yè)2為跟隨者,根據(jù)企業(yè)1的產(chǎn)量選擇自己的產(chǎn)量設(shè)市場需求函數(shù)為企業(yè)i的利潤為模型求解第二階段,企業(yè)2的決策問題為由一階條件得,反應(yīng)函數(shù)為第32頁,共43頁。2022/8/14333.12 斯塔克伯格模型II模型求解企業(yè)1會預(yù)測到企業(yè)2的反應(yīng)。因此,第一階段的問題為代入企業(yè)2的反應(yīng)函數(shù)得一階條件為代入反應(yīng)函數(shù),即得企業(yè)2的最優(yōu)產(chǎn)量為結(jié)論企業(yè)1具有先行優(yōu)勢,會占據(jù)大部分市場份額。其市場效率高于古諾寡頭競爭(產(chǎn)量為2(a-c)/3),說明讓市場存在相對壟斷者(先行者)可能對提高市場效率是有利的。第33頁,共43頁。2022/8/14343.13 宏觀經(jīng)濟政

20、策動態(tài)不一致IDynamic Consistency (Kydland & Prescott, 1977)動態(tài)不一致宏觀經(jīng)濟政策在制定時是最優(yōu)的,但是在執(zhí)行時不再是最優(yōu)的。因而,制定政策的政府根本不會實施該政策。政府關(guān)心通貨膨脹和失業(yè)率,設(shè)其效用函數(shù)為其中, 為通貨膨脹率, 為實際產(chǎn)量, 為自然失業(yè)率下的產(chǎn)量, 和 為系數(shù)。含有通貨膨脹的菲力普斯曲線(expectational Phillips curve),又稱意外產(chǎn)出函數(shù)(surprise production function)為其中, 為私人部門預(yù)期的通貨膨脹率。第34頁,共43頁。2022/8/14353.13 宏觀經(jīng)濟政策動態(tài)不一

21、致IIDynamic Consistency (Kydland & Prescott, 1977)政府選擇最優(yōu)的通貨膨脹率,即解得設(shè)有理性預(yù)期,即則那么,政府的效用為第35頁,共43頁。2022/8/14363.13 宏觀經(jīng)濟政策動態(tài)不一致IIIDynamic Consistency (Kydland & Prescott, 1977)而保證實行零通貨膨脹率,政府的效用為但是,政府不會真的保證零通貨膨脹率,因為一旦公眾相信零通貨膨脹,政府的最優(yōu)通貨膨脹率和效用分別為得政府做出零通貨膨脹的承諾,公眾一旦相信,政府就會選擇實施高于零的通貨膨脹率。第36頁,共43頁。2022/8/14373.14

22、討價還價模型IRubinstein(1982)談判規(guī)則參與人1和參與人2分配蛋糕。首先由1出價,如果2接受就分;反之,再由2出價,如果1接受就分;反之,又由1出價直到雙方達成一致為止。先行者參與人1的貼現(xiàn)因子為 ,后行者參與人2的貼現(xiàn)因子為 。再用 表示參與人1出價時分配給1的份額, 表示參與人2出價時分配給1的份額。求解關(guān)鍵此博弈是無限期的,因此從參與人1第二次報價(也就是博弈的第3階段)開始的子博弈(記為B)與原博弈(記為A)是相同的。所以,均衡時參與人1在博弈A和博弈B中所得份額應(yīng)該是相同的。第37頁,共43頁。2022/8/14383.14 討價還價模型IIRubinstein(1982)求解過程設(shè)在博弈A中參與人1在第三階段分配自己的份額為 ,參與人2在第二階段分配給參與人1的份額應(yīng)該為 ,參與人1在第一階段分配給參與人2的份額應(yīng)該為 ,留給自己的份額是 ,均衡時必等于 ,那么即,在均衡狀態(tài)下,先行者的份額為后行者的份額為第38頁,共43頁。2022/8/14393.14 討價還價模型IIIRubinstein(1982)子博弈精煉納什均衡參與人1先行者的均衡戰(zhàn)略在博弈的奇數(shù)階段,要

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負責(zé)。
  • 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時也不承擔(dān)用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

最新文檔

評論

0/150

提交評論