![博弈論課件(決策理論與方法)武俊霖_第1頁](http://file4.renrendoc.com/view/4733abc2c14c95698cd7f2d0c73cbeb6/4733abc2c14c95698cd7f2d0c73cbeb61.gif)
![博弈論課件(決策理論與方法)武俊霖_第2頁](http://file4.renrendoc.com/view/4733abc2c14c95698cd7f2d0c73cbeb6/4733abc2c14c95698cd7f2d0c73cbeb62.gif)
![博弈論課件(決策理論與方法)武俊霖_第3頁](http://file4.renrendoc.com/view/4733abc2c14c95698cd7f2d0c73cbeb6/4733abc2c14c95698cd7f2d0c73cbeb63.gif)
![博弈論課件(決策理論與方法)武俊霖_第4頁](http://file4.renrendoc.com/view/4733abc2c14c95698cd7f2d0c73cbeb6/4733abc2c14c95698cd7f2d0c73cbeb64.gif)
![博弈論課件(決策理論與方法)武俊霖_第5頁](http://file4.renrendoc.com/view/4733abc2c14c95698cd7f2d0c73cbeb6/4733abc2c14c95698cd7f2d0c73cbeb65.gif)
版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進行舉報或認領(lǐng)
文檔簡介
博弈論課件(決策理論與方法)武俊霖第一頁,共174頁。2博弈論概述與天斗,與地斗,與人斗,其樂無窮
第一頁第二頁,共174頁。31.1博弈論的淵源與地位
--從經(jīng)濟學(xué)帝國主義到博弈論強權(quán)經(jīng)濟學(xué)研究什么?
理性人、合作與非合作
美女不該開名車嗎?第二頁第三頁,共174頁。4博弈論的非技術(shù)定義賭博+對弈理性決策+科學(xué)決策參與人在決策時既要最大化自身利益也要考慮到:這個結(jié)果對其他參與人的影響和反饋,進而在此基礎(chǔ)上“重新”做出最優(yōu)決策。
Eg1:一場風(fēng)花雪月的故事----面對認真的誓言,你能找到最愛你的人了嗎?第三頁第四頁,共174頁。5博弈論的起源與發(fā)展1、在中國:孔子—己所不欲,勿施于人孫子—以奇勝、以正合莊子—莊周夢蝶與魚之樂老子—俗人昭昭,我獨昏昏;俗人察察,我獨悶悶
博弈論(gametheory)又稱對策論、游戲理論或策略運籌學(xué)。應(yīng)用于經(jīng)濟學(xué)、政治學(xué)、公共選擇、軍事學(xué)、外交、犯罪學(xué)等方面。特點:強調(diào)個人理性,追求給定條件下效用最大化。第四頁第五頁,共174頁。博弈論歷史和發(fā)展在國外1710年萊布尼茨提出1713年瓦德格拉夫提出了兩人博弈的極小化極大混合策略解1838年和1883年古諾和伯特蘭德提出了博弈論最經(jīng)典模型(古諾寡頭競爭模型)1944年,馮.諾依曼和奧斯卡.摩根斯坦合作《博弈論與經(jīng)濟行為》6第五頁第六頁,共174頁。(1)早期研究古諾寡頭模型(1838年)關(guān)于寡頭之間通過常量決策進行競爭的模型伯特蘭德模型(1883年)通過價格進行博弈的寡頭競爭模型逆推歸納法(1913年,齊默羅)第一種有一般意義的分析方法兩人博弈的極小化極大解(1921-1927年,雷波爾)有限策略的兩人零合博弈有確定的結(jié)果(1928年,諾依曼)7第六頁第七頁,共174頁。(2)博弈論的形成1944年,馮。諾依曼和奧斯卡.摩根斯坦合作《博弈論與經(jīng)濟行為》博弈論的起點引進了博弈論的擴展形、矩陣形表示,定義了極小化極大解,并說明這種解在所有兩人零和博弈中存在,且提出了穩(wěn)定集解的概念。該書標志著博弈理論從數(shù)學(xué)領(lǐng)域進入經(jīng)濟學(xué)領(lǐng)域8第七頁第八頁,共174頁。(3)博弈論的成長和發(fā)展少年時期(20世紀40年代末和50年代初)博弈論思想和研究方法應(yīng)用于第二次世界大戰(zhàn)軍事領(lǐng)域。標志人物:納什1950年將博弈論擴展到非零和博弈,形成以納什均衡概念為核心的非合作博弈的基礎(chǔ)理論。青年時期(50年代中后期到70年代)1954-1955年提出了“微分博弈”的概念,奧曼(“強均衡”,1959)(“重復(fù)博弈”1960)及民間定理,焦點等概念,并應(yīng)用于進化生物學(xué)。賽爾騰(相機計劃,子博弈完美納什均衡,1965)(顫抖手均衡,1975);海薩尼(貝葉斯納什均衡,混合策略不完全信息解釋,嚴格納什均衡,1967-1972)9第八頁第九頁,共174頁。(4)博弈論的成熟及與主流經(jīng)濟學(xué)的融合成熟時期(20世紀80-90年代)開始貫穿于整個微觀經(jīng)濟學(xué),產(chǎn)業(yè)組織理論,在環(huán)境、勞動、福利、國際經(jīng)濟學(xué)等學(xué)科中開始占越來越重要地位。1994年,納什、海薩尼、賽爾頓獲得經(jīng)濟學(xué)諾貝爾獎。順推歸納法(Elon,1981)序列均衡(Kreps,Wilson,1982)可理性化性(Berheim,1984)非合作和合作博弈中均衡選擇的一般理論(海薩尼&賽爾騰,1988)完美貝葉斯均衡(tirole泰勒爾,1991)10第九頁第十頁,共174頁。(5)博弈論的成熟及與主流經(jīng)濟學(xué)的融合發(fā)展迅速的原因現(xiàn)代經(jīng)濟活動規(guī)模越來越大,對抗性、競爭性越來越強,特別是寡頭壟斷或壟斷競爭市場,競爭和決策較量成為核心內(nèi)容,使得人民重視經(jīng)濟活動的環(huán)境條件及其變化,越來越重視競爭者或合作者的反應(yīng),因此經(jīng)濟決策的“博弈性”越來越強。11第十頁第十一頁,共174頁。123、實用價值:理性人實現(xiàn)最大化時即需要合作也存在沖突,如何解決,需要一個制度或規(guī)則(約束條件或戰(zhàn)略)。如:價格機制、排隊機制
但價格機制常不能實現(xiàn)“帕累拖最優(yōu)”,通過其他制度或博弈可以解決存在外部經(jīng)濟時的合作問題。
第十一頁第十二頁,共174頁。131.2博弈論的分類按形式分
cooperativegame:參與人之間能達成具有約束力的協(xié)議(bindingagreement),并決定如何分享合作帶來的剩余。特性:強調(diào)集體理性,做集體最優(yōu)化決策。Eg:歐配克組織;串供;團隊進步與個人工作量安排Non-cooperativegame:參與人之間不能達成bindingagreement。特性:強調(diào)個體理性,各自做最優(yōu)化決策,常和集體理性相矛盾。第十二頁第十三頁,共174頁。14
Eg2:一個模擬:中、美、俄的核戰(zhàn)爭真的打響了會怎么樣?
2108年,中、美、俄三國爭霸世界,爆發(fā)全面戰(zhàn)爭,即將升級為核戰(zhàn)爭。當時局勢是,美國核力量最強、俄國次之,中國最弱。由于核戰(zhàn)爭沒有第2輪,只有第一輪,中央軍委緊急研究,一旦核戰(zhàn)爭打響,三國將進行亂戰(zhàn),結(jié)果如何決定了我方是否選擇開啟“核按鈕”?如果你是總參的軍事數(shù)學(xué)家,你認為如果開戰(zhàn),哪國幸存下來的機會最大?哪國的危險最大?Eg1:交通燈故障與擁擠第十三頁第十四頁,共174頁。15按信息與時序分完全信息靜態(tài)博弈-Nashequilibrum完全信息動態(tài)博弈—SubgameperfectNashequi不完全信息靜態(tài)博弈-BayesianNashequi不完全信息動態(tài)博弈-PerfectBayesianNashequi按時間還可以分為序貫博弈和靜態(tài)博弈;重復(fù)博弈和一次性博弈第十四頁第十五頁,共174頁。16完全信息靜態(tài)博弈
納什均衡:所有參與人選擇這樣一組戰(zhàn)略組合,在這個組合下,給定別人的戰(zhàn)略,任何參與人沒有動機選擇其他的戰(zhàn)略。
或說,所有當事人形成了一個顯性或隱性的契約,該契約是“self-enforcing”的,即:給定別人遵循該契約,則其他人沒有動機違背該契約,我們說,此時的契約構(gòu)成納什均衡。
Eg1:不得不舉的例子—囚徒困境第十五頁第十六頁,共174頁。17囚徒B坦白抵賴囚徒A坦白(-8,-8)(0,-10)抵賴(-10,0)(-1,-1)納什均衡是帕累拖最優(yōu)點嗎?
一個問題:需要防范串供嗎?如果兩個囚徒在被抓之前串供了,這對警察來說重要嗎?在什么情況下警察需要防范串供?第十六頁第十七頁,共174頁。18
囚徒的話:1、集體理性和個人理性常常是沖突的:民主常常不能代表“民意”;公司好不見得你就好;如果我們都強大了,國家不見得就強大了……2、承認人是自私的,一切都好辦了。
答案簡評:可置信的承諾或信用會改變支付矩陣,如,囚徒A是江湖老大,他對B說“如果你坦白了,我在外面的兄弟會殺了你全家”,同時,這個承諾/威脅如果是可置信的,或是,B相信A是講義氣的,他一定不會坦白,則均衡位置在帕累拖最優(yōu)的位置上。第十七頁第十八頁,共174頁。19Eg2:納什均衡是唯一的嗎?美國打了越南,打了阿富汗,打了伊拉克,也已經(jīng)打過朝鮮,它還會再打朝鮮嗎?如果美國智庫計算出如下簡化的支付矩陣,那么結(jié)果會怎樣呢?美國會打朝鮮嗎朝鮮抵抗妥協(xié)美國打(-10,-100)(300,50)不打(0,300)(0,200)同時有兩個納什均衡第十八頁第十九頁,共174頁。20--簡單世界到真實世界的博弈發(fā)展不是我不明白這世界變化快
第十九頁第二十頁,共174頁。21一、博弈的基本術(shù)語參與人player:博弈中的決策主體,其目的是最大化自己的支付。環(huán)境參數(shù):博弈中不做決策的主體,如囚徒困境中的警察。虛擬參與人pseudo-player:對外生狀態(tài)的概率分布進行決定的主體,博弈論中通常叫“自然”(nature)行動action:參與人的決策變量或決策手段。第二十頁第二十一頁,共174頁。22信息information:參與人掌握的有關(guān)其他參與人的特征與行動結(jié)果、“自然”的選擇結(jié)果、博弈過程與結(jié)果的相關(guān)知識信息集informationset:所有信息的集合。共同知識commonknowledge:參與人之間無限循環(huán)知道的信息。一致信念concordantbelief:在參與人間有限循環(huán)知道的信息。如,我知道你是女的,你也知道我是男的,但我并不知道你知道我是男的。第二十一頁第二十二頁,共174頁。23戰(zhàn)略strategy:規(guī)定參與人在給定的信息集下采取的行動規(guī)則(可能是一個行動組合)。靜態(tài)博弈中戰(zhàn)略=行動;動態(tài)博弈中戰(zhàn)略=一定條件下的行動或行動組合。如:如果美國進攻朝鮮,則朝鮮進行抵抗。支付payoff:即效用或期望效用。參與人的支付不僅取決于自身的戰(zhàn)略,而且取決于其他參與人的戰(zhàn)略,即第二十二頁第二十三頁,共174頁。24結(jié)果outcome:參與人感興趣的所有東西,但一般指在一定博弈階段或博弈局部的支付結(jié)果。均衡equilibrium:即所有參與人的最優(yōu)戰(zhàn)略組合!
NOTE:是所有參與人!何謂“最優(yōu)戰(zhàn)略”?第二十三頁第二十四頁,共174頁。25假設(shè)只有3個參與人,則為最優(yōu)戰(zhàn)略,當且僅當:第二十四頁第二十五頁,共174頁。26二、簡介:完全信息動態(tài)博弈
子博弈精練納什均衡:參與人的行動有前有后,后行動者可以看見先行動者的所有信息和結(jié)果,并且雙方是完全信息的,在所有子博弈中都是最優(yōu)的納什均衡。精練是意思是:在納什均衡中將不可置信的均衡剔除掉。
子博弈:整個博弈中的一個階段性博弈或決策,如愛情與婚姻是個博弈,則戀愛—結(jié)婚—生孩子—離婚都是子博弈,甚至婚外情也是子博弈。
精練納什均衡:當且僅當參與人的戰(zhàn)略在每一個子博弈中都構(gòu)成納什均衡時,該均衡才是精練納什均衡。靜態(tài)時的其他納什均衡被剔除掉。第二十五頁第二十六頁,共174頁。27美國到底會打朝鮮嗎?動態(tài)的情況預(yù)測結(jié)果和伊拉克戰(zhàn)爭很相似?。?!打美國不打抵抗妥協(xié)朝鮮(-10,-100)(300,50)朝鮮抵抗妥協(xié)(0,300)(0,200)第二十六頁第二十七頁,共174頁。28三、簡介:不完全信息靜態(tài)博弈一個參與人可能并不了解其他參與人的偏好、戰(zhàn)略空間和支付函數(shù)。此時參與人不知道對手的情況,他怎么敢于作出決策呢?1967年以前,這個問題無法解決。補充知識:完全信息與完美信息
1967年,Harsanyi提出“Harsanyi轉(zhuǎn)換”:引入虛擬的參與人—“自然”,自然最先行動,選擇參與人的“類型”,被選擇的參與人知道自己的類型,其他參與人只知道其概率分布,且該概率分布是“共同知識”。第二十七頁第二十八頁,共174頁。29完全(但不完美)信息:自然做出了選擇,其他參與人不知道它具體的選擇是什么,但知道其概率分布。完美信息:自然做出了選擇,其他參與人都看到了它的具體選擇是什么。一個例子:招聘博弈
“Harsanyi”轉(zhuǎn)換將不完全信息轉(zhuǎn)化為完全但不完美信息?。?!第二十八頁第二十九頁,共174頁。30自然1-xx優(yōu)秀求職者平庸求職者招聘單位遞簡歷不遞簡歷10,100,0招聘-5,00,0不招聘遞簡歷不遞簡歷招聘-10,100,0不招聘0,-50,0靜態(tài)博弈,同時行動,則當遇上一個遞簡歷者,招聘單位招聘的期望收益是:10x+(-10)(1-x)=20x-10當遇上一個遞簡歷者,招聘單位不招聘的期望收益是:0x+0(1-x)=0所以,只有當20x-10>0即x>1/2時,招聘才是有利的,此時,(x>1/2招聘)叫貝葉斯納什均衡.第二十九頁第三十頁,共174頁。31四、簡介:不完全信息動態(tài)博弈靠什么來修正先驗概率?
在動態(tài)博弈中,后行動者可以看見先行動者的信息,以修正自己之前對之類型的判斷(概率分布).先行動者知道這個結(jié)果,在行動時就會故意扭曲或隱瞞其信息,即以后行動者知道自己的行為為條件來選擇自己的最優(yōu)行動策略.靠貝葉斯條件概率:第三十頁第三十一頁,共174頁。32
中國需要說“不”嗎?如果中國先行動,美國后決定對華政策,則美國將根據(jù)中國的對日政策來修正自己的政策.中國也知道這個情況,則中國會選擇,如果中國是強大的,中國可能會用更強硬的對日政策.精練貝葉斯均衡是:(中國國力差時選擇柔軟的對日政策,美國不對中國強硬;中國國力強大時選擇強硬對日政策,美國對中國懷柔)
信號傳遞模型:就業(yè)市場、要專業(yè)還是要學(xué)校?看學(xué)歷,更看名牌的學(xué)歷!!第三十一頁第三十二頁,共174頁。33
關(guān)于純戰(zhàn)略納什均衡(之一)平衡在理性的鋼絲上
第三十二頁第三十三頁,共174頁。34一、奠基者與啟示錄1、一個問題:用食指當牙刷怎么刷牙?
答:天才和傻子只一步之遙。NASH就是這樣的天才。John.Nash
游蕩普林30年的幽靈!
2005年6月12日北京1臺曾濤采訪NASH
在北京演講《理想貨幣與漸進理想貨幣》,試圖創(chuàng)造一種沒有通貨膨脹的貨幣22歲的文章為獲獎成果
在中國,與陳省身交情最好。
對北京的高樓最驚訝第三十三頁第三十四頁,共174頁。352、第2個問題:Nash創(chuàng)造了什么?國外的每本經(jīng)濟學(xué)教材中都需要講授博弈論。博弈論帶動了最尖端的數(shù)學(xué)知識和數(shù)理工具在經(jīng)濟學(xué)中的運用,幫助一大批經(jīng)濟學(xué)家在主流的舞臺上揚名立萬、光耀史冊!博弈論成為了整個微觀經(jīng)濟學(xué)的最基礎(chǔ)分析方法,幾乎“吞沒了整個經(jīng)濟學(xué)”。第三十四頁第三十五頁,共174頁。36一聲嘆息:
不懂得博弈論的經(jīng)濟學(xué)和管理學(xué)學(xué)生和學(xué)者,就象是一位在晚禮會上身穿著燕尾服卻下身只穿了一條沙灘短褲的舞者,舞技再高,仍感到無盡的悲涼和恐慌!第三十五頁第三十六頁,共174頁。37二、技術(shù)定義戰(zhàn)略表達式:若支付函數(shù)是離散的,則也可以用矩陣來表達1
eg:兩寡頭產(chǎn)量博弈的戰(zhàn)略表達式第三十六頁第三十七頁,共174頁。(1)占優(yōu)策略局中人的最優(yōu)策略不依賴于其他局中人的選擇,則稱該局中人有占優(yōu)策略。如果某策略組合中的每一個策略都是局中人各自的占優(yōu)策略,此策略組合稱為占優(yōu)均衡。囚徒困境中的(坦白,坦白)就是占優(yōu)均衡,坦白是每個囚徒的占優(yōu)策略。但并不是每個博弈,每個局中人都有占優(yōu)策略。3.完全信息靜態(tài)博弈博弈的解法AB坦白不坦白坦白-8,-80,-10不坦白-10,0-1,-1第三十七頁第三十八頁,共174頁。(2)嚴格劣策略的逐次消去法
定義不管其他局中人的策略如何變化,某一策略S總比另一策略S′帶來的支付大,則稱S是S′的嚴格優(yōu)策略,而稱S′是S的嚴格劣策略。
0,010,6不按-4,204,8按鈕不按按鈕大豬小豬智豬博弈(剔除博弈)第三十八頁第三十九頁,共174頁。(3)劃線法AB坦白不坦白坦白-8,-80,-10不坦白-10,0-1,-1猜硬幣者蓋硬幣者正面反面正面-1,11,-1反面1,-1-1,1注A:并非所有的博弈均有穩(wěn)定的解。如右圖所示拋硬幣博弈第三十九頁第四十頁,共174頁。注B:穩(wěn)定性并非是確定性——可能有多個穩(wěn)定性的結(jié)果性別之爭斗雞游戲A
B進退進-3,-32,0退0,20,0男
女看足球逛街看足球5,10-1,-1逛街3,310,5第四十頁第四十一頁,共174頁。
(4)箭頭法:局中人能否通過單獨改變自己的策略,而改善自己的支付。-1,-1-10,0不坦白0,-10-8,-8坦白不坦白坦白AB第四十一頁第四十二頁,共174頁。注A:沒有穩(wěn)定解的情況注B:有多個穩(wěn)定解的情況-1,11,-1反面1,-1-1,1正面反面正面猜硬幣者蓋硬幣者10,53,3逛街-1,-15,10看足球逛街看足球男
女第四十二頁第四十三頁,共174頁。44三、純戰(zhàn)略NASHEQUI的解法1、Dominantstrategyequi(占優(yōu)戰(zhàn)略遴選法)
每個參與人如果都有占優(yōu)戰(zhàn)略,則其如下組合就是“占優(yōu)NASH均衡”
第四十三頁第四十四頁,共174頁。45eg:占優(yōu)均衡的例子愛在心里口難開女說不說男說10,10-5,20不說20,-50,0占優(yōu)納什均衡帕累拖均衡特點:1、均衡是唯一的!2、參與人不需要對方的“理性”是共同知識,只需要自己是理性的就可以了!第四十四頁第四十五頁,共174頁。462、重復(fù)剔除劣戰(zhàn)略法方法:通過重復(fù)剔除劣戰(zhàn)略(如果有的話),則剩下的唯一組合就是“占優(yōu)均衡”。此時我們說這樣的博弈是
dominancesoluable(重剔可解的)注意:如果每次剔除的是嚴格劣戰(zhàn)略,則均衡結(jié)果與剔除次序無關(guān);如果剔除過程中有弱劣戰(zhàn)略,則均衡結(jié)果可能與剔除次序有關(guān),并可能剔除掉“弱納什均衡”!第四十五頁第四十六頁,共174頁。47國際爭端博弈中國升值不動貶值美國不制裁1,01,20,1制裁0,30,12,0國際爭端博弈中國升值不動美國不制裁1,01,2制裁0,30,1國際爭端博弈中國升值不動美國不制裁1,01,2課堂參與練習(xí):重剔可解的均衡第四十六頁第四十七頁,共174頁。48經(jīng)典例3、納什均衡法:定義
第四十七頁第四十八頁,共174頁。492、前提:參與人不選價格而選產(chǎn)量,因為他確信,如果自己降價,則對方會加倍降價,于是寡頭面臨的價格相同即該市場是“同質(zhì)產(chǎn)品的完全競爭產(chǎn)品市場”。
第一個例子:Cournot雙頭壟斷模型1、說明:模型中寡頭是選產(chǎn)量,而不是選價格----選價格的模型是“BertrandModel”;動態(tài)選產(chǎn)量是“StackbergModel”;多階段重復(fù)的Cournot博弈是“FriedmanModel”.
第四十八頁第四十九頁,共174頁。50分析:
題設(shè)企業(yè)不存在固定成本,只有變動成本,單位成為均為c。面對同一市場,市場的反需求函數(shù)為
3、內(nèi)容參與人:寡頭1和寡頭2戰(zhàn)略:選各自的產(chǎn)量
支付:各自的利潤
由于市場結(jié)構(gòu)的原因,各寡頭的價格不能出現(xiàn)差別,必須都定在等于P的位置。于是,可得到寡頭1的
支付函數(shù)如下:第四十九頁第五十頁,共174頁。51同理可得:求解:第五十頁第五十一頁,共174頁。522、寡頭的總產(chǎn)量高,但總利潤卻小于壟斷利潤,即經(jīng)濟意義:1、寡頭的產(chǎn)量要小于壟斷產(chǎn)量但寡頭的總產(chǎn)量要高于壟斷時的總產(chǎn)量,即
請問:壟斷產(chǎn)量如何得到的?請問:利潤如何得到的?3、結(jié)論:寡頭格局帶來了一定的競爭性福利—高產(chǎn)量、低利潤第五十一頁第五十二頁,共174頁。531、前提:同質(zhì)產(chǎn)品的完全競爭產(chǎn)品市場
第2個例子:Bertrand雙頭壟斷模型2、特點:寡頭1和2面對離散的需求函數(shù)3、寡頭1和2的面對的需求函數(shù)為寡頭1的總體需求函數(shù)市場的需求函數(shù)(在寡頭1的價格較低時)請注意寡頭市場的特性,其市場需求曲線是主觀需求曲線,即每個寡頭都能影響“市場需求曲線”第五十二頁第五十三頁,共174頁。544、經(jīng)濟意義:悖論--市場上只有兩家企業(yè),結(jié)果也和有無數(shù)家企業(yè)一樣----形成和完全競爭一樣的結(jié)果?,F(xiàn)階段的文獻:是用narrativeapproach假設(shè)寡頭的單位成本相同,都為c,那么NASHEQUI是什么呢?NASHEQUI:原因:產(chǎn)品同質(zhì)、成本相同、需求間斷第五十三頁第五十四頁,共174頁。55
-關(guān)于純戰(zhàn)略納什均衡(之二)
平衡在理性的鋼絲上
第五十四頁第五十五頁,共174頁。56第3個例子:如何破解Bertrand???Way1:引入產(chǎn)品差異—需求函數(shù)同時被連續(xù)化(如:用一個系數(shù)表示產(chǎn)品的替代性或互補性)Way2:Hotelling模型:線性城市模型。產(chǎn)品差異的特殊形式—空間差異導(dǎo)致出真實成本差異第五十五頁第五十六頁,共174頁。57題設(shè):產(chǎn)品同質(zhì),寡頭1和2對稱,即它們都有一個產(chǎn)量限制:在產(chǎn)量限制內(nèi),有相同的邊際成本c,在產(chǎn)量限制外,邊際成本無限大。Way3:Edgeworth模型—適合于飯店的模型引入“產(chǎn)能限制”Eg:北門外只有5家餐館,客人再多,超過了接待規(guī)模,各個餐館沒有必要一味降價來爭奪市場。注意:當時,退化為Bertrand悖論;只有時,即寡頭即便按成本定價、開足生產(chǎn)能力也無法滿足市場總需求時,才能逃離Bertrand悖論
第五十六頁第五十七頁,共174頁。58開始求解:為了計算簡便,取c=0。設(shè)市場需求函數(shù)為如果寡頭都按最高產(chǎn)量生產(chǎn),則市場出清價格為:
如果寡頭1的價格低,則它可以獲得其生產(chǎn)能力的需求量,寡頭2獲得剩余的部分。如果,那么他們的利潤為
第五十七頁第五十八頁,共174頁。59如果則寡頭1的利潤為所以理性的寡頭1不會低于定價。同理寡頭2也一樣。如果則寡頭1的利潤為
利潤最大化第五十八頁第五十九頁,共174頁。60所以,寡頭1有定價超過寡頭2的動機,但由于信息完全,所以寡頭2也這樣做,直到二者的價格定得高到無法攀比(此時價格為1,需求為0)也就是說,只要偏離就會引發(fā)價格戰(zhàn)(奇怪的漲價價格戰(zhàn))導(dǎo)致利潤為0,因此,寡頭不能偏離定性上看,是NASHEQUI代數(shù)運算得到第五十九頁第六十頁,共174頁。61證明修正:如果某一寡頭定價高于,另一廠商必然以比其低的價格定價。證明:若,則如果寡頭2和寡頭1定價相同,那么寡頭2得到的需求量為
于是,只要寡頭2稍微降一點價格,就能得到其最高產(chǎn)量的需求量,只要降價幅度足夠小,那么它的利潤一定是比將價格定在上時增加了。此時寡頭1的需求為第六十頁第六十一頁,共174頁。62同理,寡頭1有將價格下降得比寡頭2低一點點以得到需求量的動機,由于寡頭2的定價比寡頭1的定價低的幅度很小,所以這種“競爭降價”可以保證寡頭1利潤增進。綜合以上,寡頭的價格將穩(wěn)定在上。第六十一頁第六十二頁,共174頁。63第4個例子:公地的悲?。╰ragedyofthecommons)(Hardin,1968)起源與結(jié)論:從休莫(1739)開始,經(jīng)濟學(xué)家和哲學(xué)家已經(jīng)認識到----如果公民只關(guān)心個人福利,公共物品就會出現(xiàn)短缺,公共資源會被過度使用。Eg1:地球的環(huán)境eg2:高速公路Eg3:學(xué)校的課桌eg4:娛樂明星“英國經(jīng)驗論的邏輯終局”—羅素代表作—《人性論》洛克的終結(jié)者;因果論;必然知識與或然知識;第六十二頁第六十三頁,共174頁。64原題:
一個村莊有n個村民,每年夏天,所有村民在村委會的公共牧地上放牧。村民i放養(yǎng)的羊的頭數(shù)為,放養(yǎng)的總羊數(shù)為
照看和購買一只羊的成本均為c,c不隨羊的數(shù)目的多少而改變。當牧地上的羊的總數(shù)為G時,一個村民從自家的一頭羊身上得到的收益為牧地的放牧上限為,當時,。當時,。第六十三頁第六十四頁,共174頁。65
注意:隨著公地上的羊的數(shù)目上升,每個村民從羊身上得到的收益將減少。并且,隨著放養(yǎng)數(shù)目接近上限值,每增加一頭羊,都會對其他放養(yǎng)者的收益帶來極大損害。用數(shù)學(xué)表示為村民的戰(zhàn)略是選擇他放養(yǎng)的羊的頭數(shù),最大化其總利潤:假設(shè)羊的頭數(shù)可分割,則村民的戰(zhàn)略空間為
村民的總利潤為
第六十四頁第六十五頁,共174頁。66
所有的村民同時選擇放養(yǎng)頭數(shù)進行最優(yōu)化選擇,就是???將各自的利潤函數(shù)求一階條件!?。∮谑堑玫剑簩⑸鲜较嗉硬⒊詎得到(1)(1)第六十五頁第六十六頁,共174頁。67
但是,作為村民全體的村委會而言,最優(yōu)的放牧量應(yīng)該滿足以上最優(yōu)化的問題就是其一階條件(對G求導(dǎo)數(shù)),即
對比(1)和(2)式:(2)發(fā)現(xiàn):G*>G**(3)說明:和社會總體的最優(yōu)放牧量相比,個體只為自身福利追求而得到的納什均衡放牧量太大了。
村民只考慮自身福利,結(jié)果造成對公共資源的過度使用!
第六十六頁第六十七頁,共174頁。68對(3)式的證明:《反證法》假設(shè),則:因為是個減函數(shù)于是。類似地,由于,于是
同時有結(jié)合(4)(5)(6)式并對照(1)(2)式:發(fā)現(xiàn):
(1)式的左邊嚴格大于(2)式的左邊,但這是不可能的,因為他們都等于0。所以,原假設(shè)不成立。(4)(5)(6)(1)(2)第六十七頁第六十八頁,共174頁。69
--混合戰(zhàn)略納什均衡
平衡在顫抖理性的鋼絲上
第六十八頁第六十九頁,共174頁。70前導(dǎo)性例題:課堂共同練習(xí)—求解與改造新版導(dǎo)游證政策動態(tài)一致性的博弈分析
問題起源:為貫徹《導(dǎo)游人員管理條例》和2001年頒布的《導(dǎo)游人員管理實施辦法》(國家旅游局第15號令)精神,國家旅游局決定啟用新版導(dǎo)游證。
第六十九頁第七十頁,共174頁。71問題提出:制度本身是一種契約。新導(dǎo)游證制度是可
“自動實施”
(self-enforcing)的穩(wěn)契約嗎?是納什均衡嗎?如果不是,那它一定會被歪曲和在執(zhí)行中走樣。第七十頁第七十一頁,共174頁。72導(dǎo)游證有必要存在嗎?作為一種外在制度,導(dǎo)游管理有其存在的必要性。旅游業(yè)是個跨行業(yè)的超復(fù)雜系統(tǒng),在一個很復(fù)雜的系統(tǒng)或社會里,內(nèi)在的制度不能排除所有的機會主義行為(opportunisticbehavior)
,因為人們或企業(yè)常常要和“轉(zhuǎn)眼就各奔東西”的對象做交易,許多非正式懲罰如“一報還一報”是無效的。在這種情況下,更容易出現(xiàn)“囚徒的困境”,因此,為逃出困境(追求合作行為),正式的外在制度是必要的。導(dǎo)游管理正是這樣的一種制度。
第七十一頁第七十二頁,共174頁。73我們的目的是什么?分析換發(fā)新版導(dǎo)游證后對無證(包括假證)導(dǎo)游的檢查是否具有自我實施性,即這項制度在執(zhí)行當中會不會走樣。第七十二頁第七十三頁,共174頁。74擴展性說明:
省去對有證導(dǎo)游進行計分檢查和管理的分析,因為從長期看(只要這項制度能堅持下去且導(dǎo)游也愿意干得足夠久),計分檢查是一個無限重復(fù)博弈,能達成一個令各方滿意的帕累托最優(yōu)的合作解;從短期看,計分檢查是一個有限重復(fù)博弈,而且其博弈結(jié)構(gòu)和檢查無證導(dǎo)游博弈的結(jié)構(gòu)是類似的(有唯一的強納什均衡),因此,根據(jù)有限重復(fù)博弈的不變性定理(Selton,1978),計分檢查博弈從短期看和檢查無證導(dǎo)游博弈具有完全類似的均衡結(jié)果。基于上述,我們對無證導(dǎo)游檢查的分析也完全適用于對有證導(dǎo)游的計分檢查。第七十三頁第七十四頁,共174頁。75前期論證:
為增強效果、提高效率,檢查機構(gòu)采取“不期而至”的暗查,檢查機構(gòu)和導(dǎo)游對對方的成本和收益有一個至少是大致的了解,既支付矩陣是雙方的“共同知識”(
commonknowledge),因此這個博弈可看作是個完全信息靜態(tài)博弈。
變量說明:C:檢查機構(gòu)的檢查成本;R:導(dǎo)游無證上崗相對于有證上崗的超額收益量(大體相當于考導(dǎo)游證的成本);L:無證導(dǎo)游被查到后的變相損失量(如名譽損失、以后不能帶團的損失等);第七十四頁第七十五頁,共174頁。76博弈過程:練習(xí)1:請用嚴格剔除劣戰(zhàn)略方法求取納什均衡,并說明過程。
導(dǎo)游證博弈導(dǎo)游持證上崗無證上崗旅游局檢查-C,0-C,-L不檢查0,00,R練習(xí)2:你如何解釋自己的結(jié)論?這項制度在執(zhí)行一段時間后,出于對自身得失的權(quán)衡,檢查人員會由于費心費力而疏于檢查。同時無證的導(dǎo)游追求額外的利益也會心無顧忌地照上崗不誤。而且,這樣的狀態(tài)一旦形成,誰也沒有積極性去打破它。第七十五頁第七十六頁,共174頁。77練習(xí)3:如何改造這個制度?改造方法:1、改造信息條件2、改造決策順序3、改造博弈的期數(shù)4、改造博弈不同期的結(jié)構(gòu)5、改造支付結(jié)果(本案例的方法)第七十六頁第七十七頁,共174頁。78分析:旅游局的支付函數(shù)(目標函數(shù))中沒有體現(xiàn)檢查機構(gòu)在查到無證導(dǎo)游后的收益,因此我們可以把這種收益引入到檢查機構(gòu)的目標函數(shù)中(當然,這也相應(yīng)改變導(dǎo)游的目標函數(shù))。
第七十七頁第七十八頁,共174頁。79難點說明:旅游局的收益應(yīng)該是實質(zhì)性收益,比如,對查獲的無證導(dǎo)游或相關(guān)旅行社按事前規(guī)定進行罰款(設(shè)罰款量為F)所得款項歸檢查機構(gòu)合法支配。并且這個罰款量當然要能包住檢查的成本即F-C>0。盡管旅游局查到無證導(dǎo)游時具有社會收益,但這種收益具有公共品屬性,旅游局從中所得到的實質(zhì)性收益有限并且旅游局很難從這個收益中量化出自己的實際收益,因此具有理性的導(dǎo)游將不會認為這種收益會改變檢查機構(gòu)的支付,從而也不會改變自己的支付結(jié)果。如果F-C≤0,它和原支付矩陣中-C的實質(zhì)效果一樣,只是程度的不同,但并不改變原博弈的實際支付內(nèi)容及其均衡結(jié)果。
第七十八頁第七十九頁,共174頁。80新的導(dǎo)游證博弈矩陣:練習(xí)4:這個博弈的均衡在哪里?
導(dǎo)游證博弈導(dǎo)游持證上崗無證上崗旅游局檢查-C,0F-C,-L-F不檢查0,00,R第七十九頁第八十頁,共174頁。81混合戰(zhàn)略(mixedstrategies)NASHEQUI定義:假定參與人i有K個純戰(zhàn)略他分別以概率來選擇上述純戰(zhàn)略,則稱
為i的一個混合戰(zhàn)略。混合戰(zhàn)略納什均衡:若則稱為一個混合戰(zhàn)略納什均衡第八十頁第八十一頁,共174頁。82完全信息情況下,戰(zhàn)略選擇的不確定性會帶來均衡位置的移動或消失。Eg:現(xiàn)實小問題—在QQ上做個誠實的人嗎?如果大家都知道我在QQ上從不說謊,那么當我說一個真實的感人故事或致富信息時大家就會“為我所用”,但這又使得我有偶爾騙人獲取“額外”收益的動機;另一方面,說謊太多,終究會被網(wǎng)友識破,結(jié)局“很慘”。于是,網(wǎng)友需要猜測到我確實的戰(zhàn)略選擇才最有利,同理,我也需要事先猜測到每個網(wǎng)友的戰(zhàn)略選擇,以決定我的最優(yōu)反應(yīng)--說多少次慌最有利。結(jié)論:一旦每個參與人都竭力猜測其他參與人的戰(zhàn)略選擇,就不會存在(純戰(zhàn)略)納什均衡。零和博弈有0、2個純戰(zhàn)略均衡—修正第八十一頁第八十二頁,共174頁。83經(jīng)典例:福利模型政府和流浪漢之間的博弈支付如下:這是一個zero-sum博弈,存在純戰(zhàn)略均衡嗎?求解混合戰(zhàn)略納什均衡的路徑:1、支付結(jié)果演變?yōu)椤捌谕в谩保?、求解的核心:混合戰(zhàn)略形成參與人均衡時必然是使各參與人在該概率下,選擇各戰(zhàn)略的期望效用之間不存在差別,這時,這樣的概率才是“均衡”
的,否則,參與人就會確定地選擇某個戰(zhàn)略,均衡退化為“純戰(zhàn)略均衡”。3、具體方法:最大支付法;支付等值法第八十二頁第八十三頁,共174頁。84設(shè):政府以概率選擇救濟,流浪漢以概率選擇找工作(G:政府;L:流浪漢)
福利模型流浪漢找工作游蕩政府救濟3,2-1,3不救濟-1,10,0第八十三頁第八十四頁,共174頁。85
政府選擇自己的概率選擇以最大化自己的期望效用:
即:只有在流浪漢選擇以0.2的概率找工作時,政府才會選擇混合戰(zhàn)略()而不是確定性地選擇純戰(zhàn)略。同理,請求解流浪漢的最優(yōu)期望效用:方法一:最大支付法政府的期望效用
第八十四頁第八十五頁,共174頁。86所以,混合戰(zhàn)略納什均衡為
第八十五頁第八十六頁,共174頁。87方法2:支付等值法政府選“救濟”時的期望效用為
政府選“不救濟”時的期望效用為
流浪漢的概率選擇如果構(gòu)成混合均衡,它必然使政府在兩個純戰(zhàn)略選擇間無效用差別,即
同理,求得所以,混合均衡為第八十六頁第八十七頁,共174頁。88混合戰(zhàn)略的現(xiàn)實解釋:問題:既然混合均衡使參與人在各種純戰(zhàn)略選擇間無差異,那么為什么他不選擇一個特定的純戰(zhàn)略而是“隨機”地選擇各個純戰(zhàn)略呢?類似:拳擊、劃拳、選擇情侶回答:因為,參與人想通過混合戰(zhàn)略給對方造成不確定性—因為混合均衡下,“我”在各個純戰(zhàn)略選擇上無差別,所以對手無法確定性地把握我到底會選擇哪個純戰(zhàn)略。
這樣,就能形成一個對大家都無損害的
“均衡”,或在沒有純戰(zhàn)略最優(yōu)均衡時,保證一個均衡出現(xiàn)----因為不確定性本身能帶來各參與人收益的變化,從而形成均衡。
第八十七頁第八十八頁,共174頁。89
測試性練習(xí):
求解“導(dǎo)游證博弈”的混合均衡,并說明其政策意義。
解釋均衡概率的影響因素第八十八頁第八十九頁,共174頁。90
這個博弈不存在納什均衡。但是,根據(jù)奇數(shù)定理(oddnesstheorem,Wilson,1971)我們能找到這個博弈的一個混合戰(zhàn)略納什均衡。亦即:假設(shè)檢查機構(gòu)以α的概率或頻率進行檢查,以(1-α)的概率或頻率不去檢查;導(dǎo)游以β的概率無證上崗,以(1-β)的概率考得真證后持真證上崗。則:
“導(dǎo)游證博弈”的解答
第八十九頁第九十頁,共174頁。91檢查機構(gòu)的期望效用函數(shù)
Uc(α,β)=α[-C(1-β)+(F-C)β]+(1-α)(0+0)檢查機構(gòu)最優(yōu)化的條件是:
?Uc/?α=0即:-C(1-β)+(F-C)β=0?β?=C/F同理導(dǎo)游的期望效用函數(shù)
Ug(α,β)=(1-β)(0+0)+β[α(-L-F)+(1-α)R]導(dǎo)游最優(yōu)化的條件是:
?Ug/?β=0即:α(-L-F)+(1-α)R=0?α?=R/(L+F+R)第九十頁第九十一頁,共174頁。92混合戰(zhàn)略納什均衡是:(α?,β?)
即雙方趨于穩(wěn)定(可以自我實施)的最優(yōu)選擇是
檢查機構(gòu)以α?的概率進行檢查,導(dǎo)游以β?的概率無證上崗。
第九十一頁第九十二頁,共174頁。93關(guān)于靜態(tài)博弈的重要定理定理1:混合戰(zhàn)略靜態(tài)均衡相當于不完全信息下的純戰(zhàn)略均衡定理2:Wilson(1971),Nash,1951OddnessTherem每一個有限博弈至少存在一個納什均衡(純的或混合的),且?guī)缀跛杏邢薏┺亩加杏邢奁鏀?shù)個納什均衡。第九十二頁第九十三頁,共174頁。94例子:二外還會存在嗎?--一個理論假設(shè)
并校博弈二外合為北廣合為二外北廣合為北廣10,50,0合為二外0,01,15請問:這個博弈有幾個均衡?更實際的結(jié)論是什么?第九十三頁第九十四頁,共174頁。95定理3:混合戰(zhàn)略納什均衡的存在性定理
Glicksberg,1952
如果每個參與人的戰(zhàn)略空間是一個非空的、閉的、有界的凸集,支付函數(shù)u(s)是連續(xù)的,那么至少存在一個純戰(zhàn)略納什均衡。定理3:純戰(zhàn)略納什均衡的存在性定理
Debreu,1952
如果每個參與人的戰(zhàn)略空間是一個非空的、閉的、有界的凸集,支付函數(shù)u(s)是連續(xù)的、擬凹的,那么至少存在一個純戰(zhàn)略納什均衡。關(guān)于靜態(tài)博弈的重要定理偏好平均的戰(zhàn)略邊際效用遞減第九十四頁第九十五頁,共174頁。96關(guān)于靜態(tài)博弈的重要定理關(guān)于多重均衡問題:聚點均衡(FocusEqui):由于習(xí)俗、經(jīng)驗等使參與人會共同預(yù)測到某個均衡,于是多重均衡積聚為一個唯一的均衡。廉價磋商(CheapTalk):前期進行一個不花成本的磋商,共同約定收斂于一個特定的均衡,比是一種特殊的聚點均衡。經(jīng)驗效應(yīng)(ExperienceEffect):參與人通過不斷試錯,形成某種特定的協(xié)作方式,促使某個均衡會多次出現(xiàn),以至成為一個恒久均衡。第九十五頁第九十六頁,共174頁。97運籌帷幄、決勝千里--完全且完美信息動態(tài)博弈第九十六頁第九十七頁,共174頁。98一、操練前的熱身艱難術(shù)語的簡明含義
完全且完美信息—在博弈進行的每一步中,要選擇行動的參與者都知道這一步之前博弈進行的整個過程和結(jié)果。
完全但不完美信息--在博弈的某些階段,要選擇行動的參與者并不知道這一步之前博弈進行的整個過程和結(jié)果。第九十七頁第九十八頁,共174頁。99動態(tài)博弈的中心問題:
可信任性Eg1:不可置信的威脅在動態(tài)中很無聊!《黑社會有多黑---斗狠博弈》第一步:A匪徒選擇,給B匪徒分贓5000元還是分文不給;第二步:B觀察到A的選擇,然后決定是否引爆一顆手雷把雙方都炸死。
第九十八頁第九十九頁,共174頁。100結(jié)論:A匪徒不會給B匪徒一分錢,因為B的威脅不可置信。引申的問題:結(jié)論的前提是----匪徒B不是一個這種懷疑在完全信息博弈中不存在,但卻是不完全信息博弈的考慮重點?。?!瘋子第九十九頁第一百頁,共174頁。101信息結(jié):每次行動的起點及其包含的參與人類型的信息信息集:每次行動時,參與人所掌握的所有知識第一百頁第一百零一頁,共174頁。102威脅:參與人在博弈開始前通過采取某種行動改變了支付結(jié)果,影響均衡位置。完全威脅:增加某個行動的成本,使之不可能被采取,從而改變均衡。實質(zhì)—通過減少自己的選擇機會來影響對方的支付,并改變整個結(jié)果。
選擇少不一定是壞事孫子兵法—置于死地而后生第一百零一頁第一百零二頁,共174頁。103二、準備性定理與原則定理1:一個有限的完全且完美信息有唯一一個純戰(zhàn)略
“子博弈精練納什均衡”。定理2:博弈的初始結(jié)是唯一的,否則轉(zhuǎn)變?yōu)椴煌耆畔⒉┺摹枰搿白匀弧?。定?:子博弈精練納什均衡若戰(zhàn)略組合是整體博弈的納什均衡,也是各個子博弈的納什均衡,則是該博弈唯一的子博弈精練納什均衡第一百零二頁第一百零三頁,共174頁。104原則1:完美信息要求參與人的信息集中只含有一個結(jié)(類型)。原則2:SPNE求解的首要原則--參與人是序貫理性的(SequentialNationality)即不論博弈的過去發(fā)生了什么,參與人在自己的每個結(jié)點處都趨于最大化自己的支付。
第一百零三頁第一百零四頁,共174頁。105eg1:黑社會博弈三、“完全且完美動態(tài)博弈”求解方法—逆向歸納法第一階段:A決定分給B5000元還是0元,即行動集第二階段:B觀察到后,選擇行動集第一百零四頁第一百零五頁,共174頁。106求解:第一步:從后往前,從第二階段求起在第二階段,B在給定A的最優(yōu)選擇—分0元的前提下,或給定A做任何選擇的前提下,B的最優(yōu)選擇都是—不拉手雷。第二步:給定第二階段B的最優(yōu)選擇后,在此前提下求A的最優(yōu)選擇此時,B不拉手雷,A的最優(yōu)選擇當然為
分給B匪徒0元第一百零五頁第一百零六頁,共174頁。107所以,Sub-gamePerfectNashEquilibrium是(A不分給B贓款,B不拉手雷)特點:完全且完美信息使A預(yù)測到B將對A的任何行動做出最符合B自身利益的選擇。這一預(yù)測排除了B進行不可置信威脅或行動的可能性,即A完全有信息以支持他認為,B不可能在第二階段做出不符合自身利益的選擇。第一百零六頁第一百零七頁,共174頁。108Eg2:Stackelberg雙頭壟斷模型汽車市場上的領(lǐng)導(dǎo)者“通用汽車”和跟隨者“福特汽車”進行如下博弈:第一步:通用選擇產(chǎn)量;
第二步:福特觀測到以上情況,然后選產(chǎn)量;公司i的利潤函數(shù)為
第一百零七頁第一百零八頁,共174頁。109求解:1、先逆向求第2步中,福特在給定通用已作出最優(yōu)產(chǎn)量選擇的基礎(chǔ)上自己的最優(yōu)反應(yīng):2、由于通用也能象福特一樣解出福特的最優(yōu)產(chǎn)量,所以通用可以預(yù)測到如果自己選擇某個產(chǎn)量伏特會如何反應(yīng),于是通用的最優(yōu)選擇是:
(2)(1)第一百零八頁第一百零九頁,共174頁。110將(2)式代入(1)式,得SPNE
得到均衡價格為:
第一百零九頁第一百一十頁,共174頁。111重要對比:在靜態(tài)的Cournot博弈中,
可得到如下結(jié)論:1、如果通用選擇Cournot產(chǎn)量,福特的最優(yōu)產(chǎn)量將也是Cournot產(chǎn)量。2、通用實際中選了比Cournot產(chǎn)量高的產(chǎn)量,可計算得知,此時它的利潤大于Cournot利潤;代價是,福特的產(chǎn)量降低、利潤減少了!!!
第一百一十頁第一百一十一頁,共174頁。112
3、動態(tài)的威力之一:
first-moveradvantadge先下手為強單人決策(無博弈的古典世界)時,占有更多信息不會帶來不利。多人動態(tài)博弈時,了解更多的信息卻可能讓一個人受損!(如:福特)
即:讓其他參與人掌握更多自己的信息理性的無知例1和2都是先動優(yōu)勢??!第一百一十一頁第一百一十二頁,共174頁。113Eg3:offer-counteroffer(討價還價)模型
Rubinstein,1982情形:A買B的某件拍賣品(價值標準化為1),A先出價,B看到價格后選擇接受或拒絕。若B接受,則博弈結(jié)束。若B拒絕,則輪到B出價;A如上做出反應(yīng)。依次A在1、3、5…….期出價;A在2、4、6…期出價;第一百一十二頁第一百一十三頁,共174頁。114變量說明:參與人A獲得的價值份額。:參與人B獲得的價值份額。第一百一十三頁第一百一十四頁,共174頁。115求解參與人對收益進行貼現(xiàn)比較,貼現(xiàn)率為和。注意:由于無限期博弈沒有最后階段,所以原則上無法使用逆向歸納法。
(有限期的該博弈可用逆向歸納法:此時在最后階段B總是出價1)第一百一十四頁第一百一十五頁,共174頁。116變通:因為該博弈是無限序貫的,則任何一個A出價開始的子博弈相當于整個博弈。假設(shè)在時,A出價,在該子博弈中他得到的最優(yōu)分額是M。A在期得到的M,相當于期的。于是B知道,在期,如果自己的出價使A的收益不小于,則A一定會接受。于是B在期出價,使自己得到。而對于B而言,期的相當于期的。于是A也清楚,他在期出價,B就會接受。第一百一十五頁第一百一十六頁,共174頁。117此時A得。否則B拒絕,誰的收益都會為0。也就是說,在期A在整體博弈中能得到的最大收益為。手筋:因為從開始的整體博弈和從開始的子博弈類似于同一個博弈,因此必然有如果我們從期開始,結(jié)果是類似的,只是收斂速度不一樣。第一百一十六頁第一百一十七頁,共174頁。118結(jié)論:因為是任意的,所以SPNE是
A在第一階段出價
B在第二階段接受。啟示:耐心的比拼---越大表示越有耐心未來消費或?qū)Y產(chǎn)價值的享受的時間忍耐性很高。1、若,則A得到1(全部資產(chǎn)),說明足夠的耐心能獲得最大收益。2、若,則A得到,B得到,當時,即B的耐心高于平均水平時,出現(xiàn)
后動優(yōu)勢。3、當時,是先動優(yōu)勢!為什么?第一百一十七頁第一百一十八頁,共174頁。119概念澄清:NE與SPNE;均衡路徑與非均衡路徑Eg4:愛情掌握在主動者手里嗎?不追追
A:追求者
B:女方
B:女方接受不接受不接受接受(10,-10)(-50,-40)(0,0)(0,0)第一個NE:女方威脅說“無論A追還是不追,我都不會接受的”,則對方相信后,NE為(不追,(不接受,不接受))AB第一百一十八頁第一百一十九頁,共174頁。120不追追
A:追求者
B:女方
B:女方接受不接受不接受接受(10,-10)(-50,-40)(0,0)(0,0)第一個NE的均衡結(jié)果:(不追,(不接受,不接受))AB均衡路徑第一百一十九頁第一百二十頁,共174頁。121不追追
A:追求者
B:女方
B:女方接受不接受不接受接受(10,-10)(-50,-40)(0,0)(0,0)第二個NE:從B開始逆向歸納,B在A選“追”與“不追”時,最優(yōu)選擇都是“接受”
A預(yù)測到這個結(jié)果,在A選擇時,于是A的最優(yōu)選擇是“追”。于是NE是:(追,(接受,接受))均衡路徑第一百二十頁第一百二十一頁,共174頁。122SPNE排除了“不可置信威脅”,留下唯一均衡路徑!不追追
A:追求者
B:女方
B:女方接受不接受不接受接受(10,-10)(-50,-40)(0,0)(0,0)
SPNE在整體與子博弈中都最優(yōu),而NE在整體博弈上最優(yōu),但在子博弈1上并不最優(yōu)。子博弈1子博弈2第一百二十一頁第一百二十二頁,共174頁。123現(xiàn)實啟示:在環(huán)境參數(shù)比較穩(wěn)定和女方尚未失去理智的情況下,愛情確實掌握在主動者手中。哲學(xué)含義:愛>被愛很弱的前提條件第一百二十二頁第一百二十三頁,共174頁。124世事無常但有概率--完全但非完美信息動態(tài)博弈第一百二十三頁第一百二十四頁,共174頁。125一、對“信息”的總結(jié)與眺望不完全信息的通俗解釋:至少一方參與人的類型(主要指支付函數(shù))不成為“公共知識”。完全但不完美信息的通俗解釋:對參與人的類型雖不了解,但具備對其類型的先驗概率,且該概率是“共同知識”。第一百二十四頁第一百二十五頁,共174頁。126通過“HarsanyiTransfer”將不完全信息轉(zhuǎn)化為
“完全但不完美信息”。因此,有了Harsanyi后,我們將不完全信息和完全但不完美信息可以等同起來。通過先驗概率規(guī)定完全但不完美信息,通過后驗信息(即貝葉斯條件概率)來修正多個序貫完全但不完美信息子博弈的先驗概率,就可以求解不完全(或不完美)信息動態(tài)博弈。第一百二十五頁第一百二十六頁,共174頁。127二、經(jīng)典事例Eg1:銀行擠體博弈情形:存款人1和2在銀行各存入D元。到期后銀行可回收2R元分給存款人,不到期(有任一個提前取款)則只能回收2r給存款人。(,)。存款人未到期而取款,只能得到r元,到期后可收回D元。這里設(shè)銀行把全部收益分給存款人,正常利潤包含在成本或費用中,且不考慮貼現(xiàn)。第一百二十六頁第一百二十七頁,共174頁。128
博弈過程如下:(r,r)(2r-D,D)(D,2r-D)(R,R)(D,2R-D)(2R-D,D)(R,R)不提提提不提不提提提不提不提提提不提122122階段1:到期前提款階段2:到期后提款第一百二十七頁第一百二十八頁,共174頁。129上面的戰(zhàn)略表達式可轉(zhuǎn)化為下面的矩陣表達式:第一階段1提款不提款2提款r.rD,2r-D不提款2r-D下階段第二階段1提款不提款2提款R,R2R-D,D不提款D,2R-DR,R由于,所以。由于,所以,。由逆向歸納法求解:
第一百二十八頁第一百二十九頁,共174頁。130結(jié)論:該博弈存在2個SPNE:(提款,提款)和((不提款,提款)(不提款,提款))1212啟示:第一個SPNE可看作是一次擠提----如果1相信2會提前取款,則他最優(yōu)選擇會取款,即便后來的選擇福利更高。這說明擠提是信心與信息問題。
與囚徒困境一樣,存在低效率均衡,但本博弈還存在高效率均衡。
本博弈的多重性使我們無法判斷什么時候會擠提,但是它說明擠提確實會作為一個均衡而出現(xiàn)。第一百二十九頁第一百三十頁,共174頁。131Eg2:關(guān)稅與自由貿(mào)易沖動國家i(i=1,2)市場上的總產(chǎn)量為,則其市場出清價格(按照線性需求函數(shù))為,國內(nèi)企業(yè)i生產(chǎn)的產(chǎn)量一部分供應(yīng)國內(nèi),一部分出口,即。企業(yè)的總成本為,其中c為邊際成本,設(shè)兩個國家中的企業(yè)可看成只有一個,且邊際成本相同。同時,企業(yè)i出口時還要還要支付的關(guān)稅給國家j,其中為國家征收的關(guān)稅稅率。企業(yè)的支付為其利潤;政府的支付為其總福利---消費者剩余、國內(nèi)企業(yè)利潤和關(guān)稅收入之和。第一百三十頁第一百三十一頁,共174頁。132動態(tài)博弈順序:第一步:國家同時選擇關(guān)稅率和,最大化其總福利。第二步:企業(yè)選擇國內(nèi)生產(chǎn)量和出口量以最大化利潤。國家1和2同時選企業(yè)1和2同時選第一百三十一頁第一百三十二頁,共174頁。133擬向歸納求解:首先,求企業(yè)i的利潤最大化可分解為國內(nèi)利潤最大化和出口利潤最大化即選擇,使同時選擇,使聯(lián)立求解,得第一百三十二頁第一百三十三頁,共174頁。134然后,選求國家j的福利最大化其中,,代入上式,得到:,將此代入上式,得到:第一百三十三頁第一百三十四頁,共174頁。135SPNE為:國家1和2選擇關(guān)稅率;企業(yè)1和2選擇生產(chǎn)量但是,如果在第二步中,不是國家單獨追求福利最大化,而是追求國家集體的福利最大化,即:第一百三十四頁第一百三十五頁,共174頁。136并將代入上式后,對求偏導(dǎo)數(shù)令其為零,可求得
即:從共同利益考慮,國家間有動機建立一個“零關(guān)稅的自由貿(mào)易區(qū)”。第一百三十五頁第一百三十六頁,共174頁。137
第八個瞬間:
人生何處不相逢--關(guān)于重復(fù)博弈第一百三十六頁第一百三十七頁,共174頁。138一、動態(tài)博弈分兩種1、序貫博弈(Sequentialgame):子博弈交替出現(xiàn),但同樣結(jié)構(gòu)的子博弈只出現(xiàn)一次。且前一階段的博弈可以改變后一階段博弈的結(jié)構(gòu)。第一百三十七頁第一百三十八頁,共174頁。1392、重復(fù)博弈(Repeatedgame):子博弈交替出現(xiàn),并且每個子博弈結(jié)構(gòu)相同。前一階段的博弈不改變后一階段博弈的結(jié)構(gòu)。參與人的總支付是所有階段博弈支付的貼現(xiàn)值或平均值。第一百三十八頁第一百三十九頁,共174頁。140再次提醒:戰(zhàn)略和行動的區(qū)別是什么?戰(zhàn)略是什么?重復(fù)博弈的戰(zhàn)略數(shù)有多大?重復(fù)博弈的戰(zhàn)略是“歷史的天空”第一百三十九頁第一百四十頁,共174頁。141重復(fù)博弈的威力是什么---Aumman的貢獻:重復(fù)博弈的均衡結(jié)果受到兩因素影響重復(fù)次數(shù)信息結(jié)構(gòu)博弈重復(fù)次數(shù)越
溫馨提示
- 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
- 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
- 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
- 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負責。
- 6. 下載文件中如有侵權(quán)或不適當內(nèi)容,請與我們聯(lián)系,我們立即糾正。
- 7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。
最新文檔
- 助產(chǎn)師復(fù)習(xí)試題含答案
- 2025年度智能電網(wǎng)規(guī)劃設(shè)計合同
- 醫(yī)保協(xié)議合同范本
- 農(nóng)村硅藻泥采購合同范本
- 儀器 借用合同范本
- cng纏繞氣瓶合同范本
- 2024年半導(dǎo)體分立器件項目評估報告
- 北京辦公裝修合同范本
- 樓地面找平工程合同范本
- 會議室使用合同范本
- 杭州市淳安縣國有企業(yè)招聘筆試真題2024
- 2024政府采購評審專家考試真題庫及答案
- 2025年道路貨運駕駛員從業(yè)資格證模擬考試題
- 數(shù)學(xué)-安徽省皖南八校2025屆高三上學(xué)期12月第二次大聯(lián)考試題和答案
- 退市新規(guī)解讀-上海證券交易所、大同證券
- 融資報告范文模板
- 桃李面包盈利能力探析案例11000字
- GB/Z 30966.71-2024風(fēng)能發(fā)電系統(tǒng)風(fēng)力發(fā)電場監(jiān)控系統(tǒng)通信第71部分:配置描述語言
- 腦梗死的護理查房
- 2025高考數(shù)學(xué)專項復(fù)習(xí):概率與統(tǒng)計的綜合應(yīng)用(十八大題型)含答案
- 2024-2030年中國紫蘇市場深度局勢分析及未來5發(fā)展趨勢報告
評論
0/150
提交評論