




版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請(qǐng)進(jìn)行舉報(bào)或認(rèn)領(lǐng)
文檔簡(jiǎn)介
博弈論與信息經(jīng)濟(jì)學(xué)經(jīng)濟(jì)學(xué)系陶-mail:taoyimiao@博弈論與信息經(jīng)濟(jì)學(xué)經(jīng)濟(jì)學(xué)系1參考文獻(xiàn):1.艾里克·拉斯穆森(EricRasmusen),《博弈與信息:博弈論概論》,中國(guó)人大出版社第三、四版,。2.克里斯汀·蒙特等(ChristianMontet),《博弈論與經(jīng)濟(jì)學(xué)》,經(jīng)濟(jì)管理出版社2005年版。3.朱·弗登博格和讓·梯若爾(DrewFudenbergandJeanTirole),《博弈論》,中國(guó)人大出版社2002年版。4.張維迎,《博弈論與信息經(jīng)濟(jì)學(xué)》,上海人民出版社1996年版。5.謝熾予,《經(jīng)濟(jì)博弈論》,復(fù)旦大學(xué)出版社第三版。參考文獻(xiàn):2第一章導(dǎo)論“正如理性預(yù)期學(xué)派使宏觀經(jīng)濟(jì)學(xué)發(fā)生革命一樣,博弈論廣泛而深遠(yuǎn)地改變了經(jīng)濟(jì)學(xué)家的思維方式。”讓·梯若爾(JeanTirole)(和讓·雅克·拉豐一起創(chuàng)立圖盧茲學(xué)派)第一章導(dǎo)論“正如理性預(yù)期學(xué)派使宏觀經(jīng)濟(jì)學(xué)發(fā)生革命一樣,博弈3經(jīng)濟(jì)學(xué)與博弈論的契合20世紀(jì)80年代以來(lái),博弈論迅速成為主流經(jīng)濟(jì)的重要組成部分,幾乎吞沒了整個(gè)微觀經(jīng)濟(jì)學(xué),就如同計(jì)量經(jīng)濟(jì)學(xué)吞沒了“經(jīng)驗(yàn)經(jīng)濟(jì)學(xué)”一樣。為什么?博弈論的研究范式:建模者對(duì)players規(guī)定pay-offfunctions和strategysets,觀察當(dāng)參與人選擇策略以最大化其支付時(shí)會(huì)產(chǎn)生什么結(jié)果。經(jīng)濟(jì)學(xué)與博弈論的契合20世紀(jì)80年代以來(lái),博弈論迅速成為主流4原因一,博弈論的研究范式是“MaximizationSubjecttoConstraints”和“NoFreeLunch”經(jīng)濟(jì)學(xué)思想的結(jié)合。原因二,主流經(jīng)濟(jì)學(xué)對(duì)寡頭壟斷的束手無(wú)策。原因一,博弈論的研究范式是“MaximizationSub5博弈論是建模的工具,它依賴于ideas。運(yùn)用博弈論建模的方式通常稱為“無(wú)脂建?!保╪o-fatmodeling)或者實(shí)例建模(modelingbyexample)或者實(shí)例化理論。Fisher“實(shí)例化理論并不告訴我們什么是必將發(fā)生的,而只告訴我們什么是可以發(fā)生的。”博弈論是建模的工具,它依賴于ideas。6社會(huì)的兩個(gè)基本問題:協(xié)調(diào)(coordination)協(xié)調(diào)問題的核心是預(yù)測(cè)(prediction):預(yù)測(cè)其他人如何行為;合作(cooperation)合作問題的核心是激勵(lì)(incentive)個(gè)人行為與社會(huì)利益的沖突什么是個(gè)人的最優(yōu)選擇?什么是社會(huì)的最優(yōu)選擇?如何把個(gè)人行為與社會(huì)利益統(tǒng)一起來(lái)?社會(huì)的兩個(gè)基本問題:7“美麗心靈”納什在1994年諾貝爾經(jīng)濟(jì)學(xué)獎(jiǎng)揭曉的那天下午,普林斯頓大學(xué)為納什舉行了一個(gè)小型香檳酒會(huì)。納什在會(huì)上說,他不習(xí)慣發(fā)表講話,但這次他有三件事要說。第一件事就是,他希望獲得諾貝爾獎(jiǎng)可以改善他的信用評(píng)級(jí),因?yàn)樗麑?shí)在太需要一張信用卡了;第二件是他更希望自己能夠獨(dú)享諾貝爾獎(jiǎng),因?yàn)樗枰枪P錢,他要為自己的住房支付欠款;第三件是他認(rèn)為自己的博弈論研究是與超弦理論類似的高度智力課題,其實(shí)用性也許是次要的或者可疑的“美麗心靈”納什在1994年諾貝爾經(jīng)濟(jì)學(xué)獎(jiǎng)揭曉的那天下午,普8美國(guó)數(shù)學(xué)家約翰·納什、約翰·海薩尼、萊因哈德·澤爾騰因在非合作博弈均衡分析理論方面做出了開創(chuàng)性貢獻(xiàn),從而對(duì)博弈論和經(jīng)濟(jì)學(xué)產(chǎn)生了重大影響,而共同獲得諾貝爾經(jīng)濟(jì)學(xué)獎(jiǎng)。美國(guó)數(shù)學(xué)家約翰·納什、約翰·海薩尼、萊因哈德·澤爾騰因在非合9非合作博弈和合作博弈區(qū)分的依據(jù):約束力的協(xié)議(bindingagreement)內(nèi)生與外生研究的重點(diǎn):非合作博弈強(qiáng)調(diào)的重點(diǎn)主要在個(gè)人行為;合作博弈強(qiáng)調(diào)的重點(diǎn)在于參與者聯(lián)盟會(huì)形成什么樣的聯(lián)盟,他們之間如何瓜分合作的收益等。非合作博弈和合作博弈區(qū)分的依據(jù):10均衡s*=(s1*,…,sn*)是指由博弈的n個(gè)參與人每人選取的最佳策略所組成的一個(gè)策略組合。那什么是最佳策略呢?均衡s*=(s1*,…,sn*)是指由博弈的n個(gè)參與人每11靜態(tài)動(dòng)態(tài)完全信息完全信息靜態(tài)博弈;納什均衡(NE)Nash(1950-1951)完全信息動(dòng)態(tài)博弈;子博弈精煉納什均衡(SPE)Selten(1965)不完全信息不完全信息靜態(tài)博弈;貝葉斯納什均衡(BNE)Harsanyi(1967-1968)不完全信息動(dòng)態(tài)博弈;精煉貝葉斯納什均衡(PBE)Kreps,Wilson(1982)Fundenberg,Tirole(1991)靜態(tài)動(dòng)態(tài)完全信息完全信息靜態(tài)博弈;完全信息動(dòng)態(tài)博弈;不完全信12納什均衡的精煉邏輯NEMSNESPEPTHEBNEPBE和SEPTHE∈SE∈PBE∈SPE∈NE
NE的不存在需要對(duì)NE擴(kuò)展NE的多重性需要對(duì)NE精煉對(duì)SPE“完美”對(duì)SPE“序貫”引入不完全信息需要對(duì)NE概括MixedstrategynashequilibriumSub-gameperfectequilibirumPerfecttremblinghandequilibirumBayesnashequilibriumSequentialequilibirumPerfectBayesequilibirum精煉納什均衡的精煉邏輯NE的不存在需要對(duì)NE擴(kuò)展NE的多重性需要13博弈論的關(guān)鍵:
如何預(yù)測(cè)對(duì)方的行動(dòng)博弈論關(guān)注的是意識(shí)到其行動(dòng)將相互影響的決策者們的行為。也就是說博弈論涉及那些真實(shí)生活中的情形——當(dāng)理性的人們彼此相互作用的時(shí)候,即當(dāng)某個(gè)人的行動(dòng)依賴于他人如何行動(dòng)的時(shí)候。博弈論的關(guān)鍵:
如何預(yù)測(cè)對(duì)方的行動(dòng)博弈論關(guān)注的是意識(shí)到其行動(dòng)14一、博弈的要素博弈的要素包括:參與人(players)、行動(dòng)(actions)、信息(information)、策略(strategies)、支付(payoffs)、結(jié)果(outcome)和均衡(equilibrium)。對(duì)一個(gè)博弈的描述至少必須包括參與人、策略和支付;而行動(dòng)和信息則是建筑材料。一、博弈的要素博弈的要素包括:參與人(players)、行動(dòng)151參與人參與人是獨(dú)立決策和獨(dú)立承擔(dān)結(jié)果的個(gè)人或組織。每個(gè)參與人的目標(biāo)都是通過選擇來(lái)最大化自身的效用(理性)。假設(shè)我們構(gòu)造一個(gè)“OPEC模型Ⅰ”,我們將參與人設(shè)定為沙特阿拉伯(S)和其他生產(chǎn)者(O),消費(fèi)者只是被動(dòng)的個(gè)體不是參與人,只是環(huán)境參數(shù)。1參與人參與人是獨(dú)立決策和獨(dú)立承擔(dān)結(jié)果的個(gè)人或組織。每個(gè)參與16要理解何種情形適宜用博弈來(lái)模型化,考察以下幾個(gè)例子:1OPEC成員國(guó)選擇其年產(chǎn)量2GM向USX(美國(guó)最大的鋼材商)購(gòu)買鋼材3中石油在全國(guó)招聘工人4一家電力公司在估計(jì)了未來(lái)10年對(duì)電力的需求后,決定是否購(gòu)置一套新的發(fā)電機(jī)組。要理解何種情形適宜用博弈來(lái)模型化,考察以下幾個(gè)例子:171OPEC成員國(guó)的產(chǎn)量都會(huì)影響世界油價(jià)2雙方的產(chǎn)量或需求量會(huì)影響價(jià)格3每個(gè)工人對(duì)中石油的影響微乎其微4電力公司決策的復(fù)雜性并非來(lái)自另一個(gè)理性的主體如何改變重要的經(jīng)濟(jì)變量使3和4轉(zhuǎn)化成博弈?1OPEC成員國(guó)的產(chǎn)量都會(huì)影響世界油價(jià)18自然是一種虛擬的參與人,它在博弈的特定時(shí)點(diǎn)上以特定的概率隨機(jī)選擇行動(dòng)。自然的支付是無(wú)差異的。自然是一種虛擬的參與人,它在博弈的特定時(shí)點(diǎn)上以特定的概率隨機(jī)19在“OPEC模型Ⅰ”中,我們用D來(lái)表示石油的需求。我們還可以假定需求只分“強(qiáng)”和“弱”。假設(shè)前者的概率為70%,后者為30%。一個(gè)博弈會(huì)因隨機(jī)變動(dòng)的結(jié)果不同而有著不同的結(jié)果。在“OPEC模型Ⅰ”中,我們用D來(lái)表示石油的需求。我們還可以202行動(dòng)參與人i的行動(dòng)以ai表示,是他能做的某一選擇。參與人的行動(dòng)集(actionset),Ai={ai},是其可以采用的全部行動(dòng)的集合。一個(gè)行動(dòng)組合(actionprofile)是一個(gè)由博弈中的n個(gè)參與人每人選擇一個(gè)行動(dòng)所組成的有序集,a={ai},i=1,2,…,n2行動(dòng)參與人i的行動(dòng)以ai表示,是他能做的某一選擇。21除了設(shè)定對(duì)于參與人來(lái)說何種行動(dòng)是可行的之外,還必須設(shè)定何時(shí)這種行動(dòng)是可行的。這就是行動(dòng)順序(orderofplay)若石油生產(chǎn)要求提前計(jì)劃,則一國(guó)在博弈之初就選擇兩年的產(chǎn)量,OPEC模型Ⅰ的行動(dòng)順序可以是:除了設(shè)定對(duì)于參與人來(lái)說何種行動(dòng)是可行的之外,還必須設(shè)定何時(shí)這22第一步,自然選擇需求D,強(qiáng)或弱第二步,S從如下行動(dòng)集中選擇其1998和1999的產(chǎn)量:(Qs,8=L,Qs,9=L),(Qs,8=L,Qs,9=H)(Qs,8=H,Qs,9=L),(Qs,8=H,Qs,9=H)O同時(shí)從其相應(yīng)行動(dòng)集中選擇其產(chǎn)量。博弈論與信息經(jīng)濟(jì)經(jīng)濟(jì)學(xué)系學(xué)課件233信息既然博弈的關(guān)鍵是預(yù)測(cè)行動(dòng),信息理所當(dāng)然是重要的。信息是以信息集的概念來(lái)模型化的??梢詫⑴c人的信息集看做是他在特定時(shí)點(diǎn)對(duì)于不同變量的取值的了解。信息集的要素包括參與人認(rèn)為可能的不同值。若有很多元素,則表明存在參與人無(wú)法排除的許多取值。若只有一個(gè)元素,則表明他準(zhǔn)確知道這些變量的取值。3信息既然博弈的關(guān)鍵是預(yù)測(cè)行動(dòng),信息理所當(dāng)然是重要的。24我們假定,在自然行動(dòng)后,沙特知道世界石油需求是強(qiáng)還是弱,但其他生產(chǎn)者無(wú)法排除任何一種可能,因此模型的信息集為:其他生產(chǎn)者:{D=強(qiáng),D=弱}沙特:{D=強(qiáng)}或{D=弱},視需求而定。參與人的信息集不僅包括如石油需求強(qiáng)度等變量取值的差別,還包括對(duì)已采取過什么行動(dòng)的了解。因此信息集是變化的。我們假定,在自然行動(dòng)后,沙特知道世界石油需求是強(qiáng)還是弱,但其25博弈的信息
(Information)完美(perfect)或不完美信息的,是指博弈的規(guī)則而言:如果參考者在選擇自己行動(dòng)時(shí)對(duì)于前面發(fā)生的情況很清楚,并且假設(shè)沒有同時(shí)的行動(dòng),那么就是完美信息;否則就是不完美信息的。完全(complete)或不完全信息,是指博弈進(jìn)行的環(huán)境而言,是指參與者之間對(duì)博弈的各個(gè)方面相互了解的程度。博弈的信息(Information)完美(perfect)26不完全信息和不完美信息的區(qū)別不完全信息指的是參與者的信息特征;不完美信息指的是博弈的信息結(jié)構(gòu)。后面會(huì)講到,經(jīng)過海薩尼轉(zhuǎn)換,任何不完全信息博弈都可以轉(zhuǎn)化為不完美信息博弈。不完全信息和不完美信息的區(qū)別不完全信息指的是參與者的信息特征27什么是“共同知識(shí)”(CommonKnowledge)最早出現(xiàn)在哲學(xué)領(lǐng)域(DavidLewis),1976年奧曼(Aumann)引入到博弈論中。舉例說明。什么是“共同知識(shí)”(CommonKnowledge)28理性的共同知識(shí)
(commonknowledgeofrationality)(1)Zero-orderCKR:每個(gè)人都是理性的,但不知道其他人是否是理性的;(2)first-orderCKR:每個(gè)人是理性的,并且知道其他每個(gè)人也都是理性的,但并不知道其他人是否知道自己是理性的;(3)second-orderCKR:(1)+(2)+每個(gè)人知道(2)nth-orderCKR:R(b)C(b)R(b)……C(b)Risrational,理性的共同知識(shí)
(commonknowledgeofr294策略參與人的策略si是如下一項(xiàng)規(guī)則:給定其信息集,該策略決定在博弈的每一時(shí)點(diǎn)他選擇何種行動(dòng)。參與人的策略集或策略空間Si={si}是其可行策略的集合。策略組合(strategyprofile)s=(s1,…,sn)是由博弈的n個(gè)參與人每人選擇一個(gè)策略組成的策略集。4策略參與人的策略si是如下一項(xiàng)規(guī)則:給定其信息集,該策略決30策略與行動(dòng)的區(qū)別
參與人的策略是一個(gè)關(guān)于其行動(dòng)程序的完備集合(completeset),它告訴參與人在每一種可預(yù)見的情況下選擇什么行動(dòng),即使參與人并不預(yù)期那種情況真的會(huì)出現(xiàn)。這一描述的完備性也意味著策略與行動(dòng)的不同之處在于它是不可觀測(cè)的,行動(dòng)是物質(zhì)上的,但策略僅是意識(shí)上的。策略與行動(dòng)的區(qū)別
參與人的策略是一個(gè)關(guān)于其行動(dòng)程序的完備集合315支付在所有參與人和自然都選擇了各自策略且博弈已經(jīng)完成之后,參與人i獲得的效用或期望效用。在OPEC模型Ⅰ中,可以將沙特和其他生產(chǎn)者的支付設(shè)為兩個(gè)生產(chǎn)年份中石油收入的總和。5支付在所有參與人和自然都選擇了各自策略且博弈已經(jīng)完成之后,326結(jié)果一個(gè)博弈的結(jié)果是指在博弈結(jié)束之后,建模者從行動(dòng)、支付和其他變量的取值中所挑選出來(lái)的他感興趣的要素的集合。結(jié)果的定義取決于建模者所感興趣的是什么。OPEC模型Ⅰ的一個(gè)結(jié)果是:Qs,8=L,Qs,9=H,Qo,8=H,Qo,9=L,D=L,Rs=100,Ro=80結(jié)果可以狹義地定義為僅僅是支付或產(chǎn)量水平的集合。選擇何種定義取決于建模者認(rèn)為對(duì)OPEC而言什么是最有意義的。6結(jié)果一個(gè)博弈的結(jié)果是指在博弈結(jié)束之后,建模者從行動(dòng)、支付337均衡均衡s*=(s1*,…,sn*)是指由博弈的n個(gè)參與人每人選取的最佳策略所組成的一個(gè)策略組合。策略組合是一組策略的集合,而結(jié)果指的是感興趣的一組變量的取值集合。7均衡均衡s*=(s1*,…,sn*)是指由博弈的n個(gè)參34不同的策略組合有時(shí)會(huì)導(dǎo)致不同的結(jié)果(Qs,8=L,Qs,9=L,Qo,8=L,Qo,9=L,D=強(qiáng),Rs=100,Ro=80)這一結(jié)果可以由下述任一策略產(chǎn)生。黃金規(guī)則:無(wú)論如何都選擇低產(chǎn)量。沙特:(Qs,8=L,Qs,9=L)其他生產(chǎn)者:(Qo,8=L,Qo,9=L)
不同的策略組合有時(shí)會(huì)導(dǎo)致不同的結(jié)果35白銀規(guī)則:針鋒相對(duì)沙特阿拉伯:(Qs,8=L;若Qo,8=L,則Qs,9=L,否則Qs,9=H)其他生產(chǎn)者:(Qo,8=L;若Qs,8=L,則Qo,9=L,否則Qo,9=H)要記住的是:行動(dòng)與策略、結(jié)果與均衡之間是存在嚴(yán)格區(qū)別的。白銀規(guī)則:針鋒相對(duì)368均衡概念僅僅規(guī)定參與人、策略與支付還不足以找到均衡,因?yàn)榻U哌€必須決定“最優(yōu)策略”到底是什么意思。這一點(diǎn)可以通過定義一個(gè)均衡概念來(lái)實(shí)現(xiàn)。只有幾種均衡概念被普遍接受,如優(yōu)勢(shì)策略均衡(dominantstrategyequilibrium)和納什均衡(Nashequilibrium)。8均衡概念僅僅規(guī)定參與人、策略與支付還不足以找到均衡,因?yàn)榻?7第二章分散化決策這章考察的是一種完全忽略其他參與者決策的非合作博弈。這種決策無(wú)須關(guān)于其他決策者的任何知識(shí),因?yàn)檫@里的“環(huán)境”ENVIORMENT就是不考慮策略性的不確定性。第二章分散化決策這章考察的是一種完全忽略其他參與者決策的非合38一、優(yōu)勢(shì)策略均衡(DominantStrategyEquilibrium)
如果無(wú)論其他參與人選擇什么策略,策略si*都是參與人i的強(qiáng)最佳應(yīng)對(duì),那么si*就稱為優(yōu)勢(shì)策略。這意味著無(wú)論別人選擇什么策略,si*都使參與人i的支付最大化。從數(shù)學(xué)上講ui(si*,s-i)≥ui(si′,s-i)對(duì)于任何si′≠si*一、優(yōu)勢(shì)策略均衡(DominantStrategyEqu39對(duì)于參與人i而言較差的策略稱為劣式策略(dominantedstrategy)。優(yōu)勢(shì)策略均衡是由每個(gè)參與人優(yōu)勢(shì)策略所組成的策略組合(s1*,s2*,…,sn*)。優(yōu)勢(shì)策略只要求每個(gè)參與者是理性的,而不要求每個(gè)參與者知道其他參與者是理性的(即不要求“理性”是共同知識(shí))對(duì)于參與人i而言較差的策略稱為劣式策略(dominanted40如果參與人有優(yōu)勢(shì)策略,無(wú)需了解他人的偏好,任何關(guān)于其他參與者策略決策的信息都是毫無(wú)價(jià)值的。DSE對(duì)信息基本無(wú)要求,只要求參與人自己是理性的就足夠了。如果參與人有優(yōu)勢(shì)策略,無(wú)需了解他人的偏好,任何關(guān)于其他參與者41囚徒困境舉例列抵賴坦白抵賴(-1,-1)(-10,0)行坦白(0,-10)(-8,-8)“困境”的根源不在于“囚徒”之間缺乏溝通,而是缺“動(dòng)機(jī)”(Incentives).囚徒困境舉例列42“囚徒困境”一般化到N個(gè)參與人,便是“公有地悲劇”,更為一般化的是,公共物品的提供和“搭便車”行為等問題。“囚徒困境”一般化到N個(gè)參與人,便是“公有地悲劇”,更為一般43二、重復(fù)剔除優(yōu)勢(shì)策略(IteratedDominanceEquilibrium))這是建立在“重復(fù)”剔除非占優(yōu)策略的準(zhǔn)則之上的。由于每個(gè)參與人都知道其他人的偏好,因此每個(gè)人都確信其他人不會(huì)選擇dominatedstrategy(只要他們是理性的);并且由于每個(gè)參與人都能同時(shí)洞悉其他參與人的非占優(yōu)策略,那就意味著策略集縮小了,以此類推。(換位思考)也就是說IDE要求理性是共同知識(shí)。二、重復(fù)剔除優(yōu)勢(shì)策略(IteratedDominance44數(shù)學(xué)上講,若存在這樣的si‘’,對(duì)于任何s-iui(si‘’,s-i)≥ui(si′,s-i),對(duì)于某一s-i,則說si′弱劣于si‘’。弱優(yōu)勢(shì)策略均衡(weakdomimantstrategyequilibrium)定義為在剔除了每個(gè)參與人的全部弱劣勢(shì)策略后得到的一個(gè)策略組合。數(shù)學(xué)上講,若存在這樣的si‘’,對(duì)于任何s-iui(si‘45日本海軍上將木村要將日本陸軍運(yùn)往新幾內(nèi)亞,有兩條航線:較短的北線和較長(zhǎng)的南線。美國(guó)海軍上將肯尼則必須決定將其飛機(jī)派往南線還是北線進(jìn)行搜索轟炸。俾斯麥海戰(zhàn)木村北南北(2,-2)(2,-2)肯尼南(1,-1)(3,-3)日本海軍上將木村要將日本陸軍運(yùn)往新幾內(nèi)亞,有兩條航線:較短的46列左中右上(10,0)(5,1)(4,-200)行下(10,100)(5,0)(0,-100)列左中右上(10,0)(5,1)(4,-200)行下(10,100)(5,0)(0,-100)列47重復(fù)剔除與理性共識(shí)重復(fù)剔除不僅要求每個(gè)人是理性的,而且要求每個(gè)人知道其他人是理性的,每個(gè)人知道每個(gè)人知道每個(gè)人是理性的,如此等等,即理性是“共同知識(shí)”(共識(shí))C1C2C3R1R2R310,41,598,49,90,399,81,980,100100,98這個(gè)博弈只要求一階理性共識(shí)就可以預(yù)測(cè)均衡結(jié)果。如果把(下-左)的第一個(gè)數(shù)字改為11呢?重復(fù)剔除與理性共識(shí)重復(fù)剔除不僅要求每個(gè)人是理性的,而且要求每48最優(yōu)選擇這個(gè)博弈只要求一階理性共識(shí)就可以預(yù)測(cè)均衡結(jié)果:如果R相信C是理性的,R就知道C不會(huì)選擇C3,所以R的最優(yōu)選擇是R1;如果C相信R是理性的,C就知道R不會(huì)選擇R2,所以C的最優(yōu)選擇是C2。但要C預(yù)期R不會(huì)選擇R3,需要二階理性共識(shí);要R不預(yù)期C會(huì)選擇C1,需要三階理性共識(shí)。最優(yōu)選擇這個(gè)博弈只要求一階理性共識(shí)就可以預(yù)測(cè)均衡結(jié)果:49>6767≥Si>4545≥Si>3030≥Si>20……Si=1耶魯大學(xué)的試驗(yàn)結(jié)果是平均數(shù)為13又1/3。>6750>6767≥Si>4545≥Si>3030≥Si>20……Si=1耶魯大學(xué)的試驗(yàn)結(jié)果是平均數(shù)為13又1/3。>6751選擇越多,對(duì)理性共識(shí)的要求越高>6767≥Si>4545≥Si>3030≥Si>20……Si=1耶魯大學(xué)的試驗(yàn)結(jié)果是平均數(shù)為13又1/3。選擇越多,對(duì)理性共識(shí)的要求越高>67521.IDE對(duì)理性的要求較高2.IDE可能會(huì)因?yàn)樘蕹樞虻牟煌煌?需要強(qiáng)調(diào)的是,如果是剔除嚴(yán)格劣策略,則不存在這問題)3.對(duì)于大多數(shù)的博弈而言,重復(fù)剔除優(yōu)勢(shì)均衡也是不存在的。1.IDE對(duì)理性的要求較高53三、安全策略(最大最小策略)在策略式表述的博弈(X1,X2
…;u1,…un)中,任何策略Xi,如果是下面問題的解:Maxximinx-iui(xi,x-i),則稱為安全策略。我們現(xiàn)在考慮的關(guān)于參與者信息的無(wú)知(ignorance),即“完全忽略”的博弈。三、安全策略(最大最小策略)在策略式表述的博弈(X1,X254列左中右上(2,0)(3,-1)(0,1)[0]行下(2,1)(-1,2)(5,0)-1[0]-1[0]列55列左中右上214[1]行下-106-1
2[1]6列左中右上6-23[-2]行下-454-6
65[4]列56安全策略是針對(duì)雙人零和博弈(嚴(yán)格競(jìng)爭(zhēng)的博弈)提出的。有值的嚴(yán)格競(jìng)爭(zhēng)或者雙人零和博弈博弈中,“安全第一”的行為是最優(yōu)的。均衡是一對(duì)最優(yōu)安全策略組成的。有時(shí)也被稱為“最大最小均衡”或“最小最大均衡”。安全策略是針對(duì)雙人零和博弈(嚴(yán)格競(jìng)爭(zhēng)的博弈)提出的。57安全策略對(duì)理性的要求安全策略要求理性必須是共同知識(shí)。如果某個(gè)參與者懷疑他的對(duì)手并非理性地行動(dòng),那么安全策略并非是最優(yōu)的。也就意味著有機(jī)會(huì)獲得高于有保證的最低水平。安全策略對(duì)理性的要求安全策略要求理性必須是共同知識(shí)。58第三章
納什均衡(NashEquilibrium)定義1:如果一個(gè)博弈有n個(gè)博弈方,其策略空間分別為S1,S2,…,Sn,支付函數(shù)分別為:u1,u2,…,un,則此博弈的標(biāo)準(zhǔn)式表示為:G={S1,S2,…,Sn,;u1,u2,…,un}第三章
納什均衡(NashEquilibrium)定義1:59標(biāo)準(zhǔn)式主要用來(lái)表示靜態(tài)博弈。這種博弈中,參與者是“同時(shí)”選擇策略的,但只要每一參與者在行動(dòng)時(shí)不知道其他參與者的選擇就可以了。標(biāo)準(zhǔn)式主要用來(lái)表示靜態(tài)博弈。這種博弈中,參與者是“同時(shí)”選60“合理”的結(jié)果每個(gè)人都認(rèn)為更可能出現(xiàn)的結(jié)果每個(gè)人對(duì)其他人預(yù)期的行動(dòng)的最佳應(yīng)對(duì)(bestresponds)納什均衡(Nashequibrium)如果大家都預(yù)測(cè)特定的納什均衡會(huì)出現(xiàn),沒有哪個(gè)參與人有激勵(lì)單方面偏離(“一致性”預(yù)測(cè))數(shù)學(xué)表達(dá)為,ui(si*,s-i*)≥ui(si′,s-i*)對(duì)于任何si′≠si*
“合理”的結(jié)果每個(gè)人都認(rèn)為更可能出現(xiàn)的結(jié)61囚徒困境舉例列抵賴坦白抵賴(-1,-1)(-10,0)行坦白(0,-10)(-8,-8)“困境”的根源不在于“囚徒”之間缺乏溝通,而是缺“動(dòng)機(jī)”(Incentives).囚徒困境舉例列62智豬博弈(boxedpigs)小豬按鍵等待按鍵(5,1)→(4,4)大豬↓↑等待(9,-1)→(0,0)大豬的最佳應(yīng)對(duì):B1等待/按鍵,B2按鍵/等待小豬的最佳應(yīng)對(duì):L1等待/按鍵,L2等待/等待智豬博弈(boxedpigs)63小豬的策略等待
按鍵
按鍵等待B2,L1(按鍵,等待)B1(等待,按鍵)0大豬的策略L2(等待,等待)小豬的策略等待按鍵按鍵等待B2,L1(按鍵,等待)B164性別大戰(zhàn)妻子韓劇球賽韓劇2,10,0丈夫球賽0,01,2性別大戰(zhàn)65不存在重復(fù)剔除優(yōu)勢(shì)均衡。看球賽和看韓劇都是納什均衡,但分別是針對(duì)不同均衡而言。若這對(duì)戀人事先不通氣,則可能出現(xiàn)誤會(huì)。性別戰(zhàn)中,任一納什均衡都是帕累托有效的,其他任一策略都不可能在不降低其他參與人支付的條件下提高另一參與人的支付,即不存在帕累托改進(jìn)。但囚徒困境博弈中納什均衡并不是帕累托最優(yōu)的。不存在重復(fù)剔除優(yōu)勢(shì)均衡??辞蛸惡涂错n劇都是納什均衡,但分別66斗雞博弈妻子進(jìn)退進(jìn)-3,-32,0丈夫退0,20,0斗雞博弈67市場(chǎng)進(jìn)入阻撓在位者默許斗爭(zhēng)進(jìn)入40,50-10,0進(jìn)入者不進(jìn)入0,3000,300市場(chǎng)進(jìn)入阻撓68恩愛夫妻博弈妻子活著死了活著2,2-6,0丈夫死了0,-60,0恩愛夫妻博弈69仇恨夫妻博弈妻子活著死了活著0,06,0丈夫死了0,60,0仇恨夫妻博弈70同優(yōu)勢(shì)策略均衡一樣,納什均衡也有強(qiáng)弱之分,要定義一個(gè)強(qiáng)納什均衡,只要不等式成立嚴(yán)格成立。也就是說,沒有參與人會(huì)對(duì)是選擇均衡策略還是選擇其他策略持兩可的態(tài)度。同優(yōu)勢(shì)策略均衡一樣,納什均衡也有強(qiáng)弱之分,要定義一個(gè)強(qiáng)納什均71為了說明納什均衡的這一特點(diǎn),構(gòu)造囚徒困境的變形。變形的囚徒困境列抵賴坦白抵賴(0,0)(-10,0)列坦白(0,-10)(-8,-8)變形的囚徒困境沒有強(qiáng)優(yōu)勢(shì)策略均衡,它僅有一個(gè)弱優(yōu)勢(shì)策略均衡,坦白仍是一個(gè)弱優(yōu)勢(shì)策略。為了說明納什均衡的這一特點(diǎn),構(gòu)造囚徒困境的變形。72在一個(gè)策略組合si*,在其他參與人都不會(huì)改變已有策略的條件下,如果沒有參與人有激勵(lì)去改變自身的策略,則稱策略組合si*為納什均衡,數(shù)學(xué)表達(dá)為,ui(si*,s-i*)≥ui(si′,s-i*)對(duì)于任何si′≠si*博弈論與信息經(jīng)濟(jì)經(jīng)濟(jì)學(xué)系學(xué)課件73優(yōu)勢(shì)策略均衡、重復(fù)剔除的優(yōu)勢(shì)均衡與納什均衡的關(guān)系每一個(gè)占優(yōu)策略均衡、重復(fù)剔除的占優(yōu)均衡一定是納什均衡;但反之不然。納什均衡一定是在重復(fù)剔除嚴(yán)格劣策略過程中沒有被剔除掉的策略組合,但沒有被剔除的策略組合不一定是納什均衡,除非它是唯一的。優(yōu)勢(shì)策略均衡、重復(fù)剔除的優(yōu)勢(shì)均衡與納什均衡的關(guān)系每一個(gè)占優(yōu)策74團(tuán)隊(duì)中的道德風(fēng)險(xiǎn)模型假設(shè)一個(gè)團(tuán)隊(duì)中有兩個(gè)工人,每個(gè)人可以工作(si=1)或偷懶(si=0),團(tuán)隊(duì)總產(chǎn)出是4(s1+s2),并在兩個(gè)工人中平均分配。每個(gè)人工作要承擔(dān)私人成本3,偷懶時(shí)私人成本為0。工人2工作偷懶工作(1,1)(-1,2)工人1偷懶(2,-1)(0,0)團(tuán)隊(duì)中的道德風(fēng)險(xiǎn)模型假設(shè)一個(gè)團(tuán)隊(duì)中有兩個(gè)工人,每個(gè)人可以工作75思考題1.下面的博弈問題的結(jié)果是什么?乙abca甲bc2,01,14,23,41,25,31,30,23,0思考題1.下面的博弈問題的結(jié)果是什么?2,01,14,23,761、players:廠商1和廠商2向市場(chǎng)提供無(wú)差異的同質(zhì)的產(chǎn)品;面臨的決策是qi=?qiQ
pui,博弈●1.Cournot模型標(biāo)準(zhǔn)式表述p是市場(chǎng)出清價(jià)格,是市場(chǎng)供應(yīng)量Q的減函數(shù):p=p(Q)=a-Q=a-(qi+qj)1、players:廠商1和廠商2向市場(chǎng)提供無(wú)差異的同772、策略:產(chǎn)出水平qi,策略集Si={qi:qi≥0}3、支付函數(shù):ui(si,sj)=ui(qi,qj)=qip–cqi假定兩廠商均無(wú)固定成本,只有常數(shù)邊際成本c。=qi[a-(qi+qj)]–cqi=-qi2+(a-c-qj)qi2、策略:產(chǎn)出水平qi,策略集Si={qi:qi≥078●無(wú)限策略博弈NE的求解按NE定義的條件,如果策略組合(qi*,qj*)是NE,那么對(duì)于qj*,qi*是下列優(yōu)化問題的解:Maxui(qi,qj*)qi∈Si=Max[-qi2+(a-c-qj*)qi]
qi∈Siduidqi-2qi+(a-c-qj*)
●無(wú)限策略博弈NE的求解按NE定義的條件,如果策略組合79令:-2qi+(a-c-qj*)=0得:qi*=(a-c-qj*)/2于是有方程組:q1*=(a-c-q2*)/2q2*=(a-c-q1*)/2q1*=q2*=(a-c)/3此時(shí),u1*=u2*=(a-c)2/9令:-2qi+(a-c-qj*)=0于是有方程組:q180考慮關(guān)系式:qi*=(a-c-qj*)/2無(wú)論qj是否最優(yōu),由qi=(a-c-qj)/2決定的qi總是廠商i針對(duì)廠商j產(chǎn)出水平的最優(yōu)反應(yīng);我們稱關(guān)系式qi=(a-c-qj)/2為廠商i針對(duì)廠商j的策略的反應(yīng)函數(shù),并記為:qi*=Ri(qj)=(a-c-qj)/2.由此NE(qi*,qj*)必須是方程組:q1=(a-c-q2)/2q2=(a-c-q1)/2的解。-------------------------反應(yīng)函數(shù)法考慮關(guān)系式:qi*=(a-c-qj*)/2無(wú)論qj是否最81q1q2a-c(a-c)2(a-c)/2a-cR2(q1)=(a-c-q1)/2R1(q2)=(a-c-q2)/2(a-c)3(a-c)/3NE0⊙q1q2a-c(a-c)(a-c)/2a-cR2(q1)=(82古諾納什均衡的調(diào)整過程古諾納什均衡的簡(jiǎn)單性成為了納什均衡調(diào)整過程的最好應(yīng)用。內(nèi)省的辦法:要求理性是“共同知識(shí)”外推的辦法:只要求參與人是理性的古諾納什均衡的調(diào)整過程古諾納什均衡的簡(jiǎn)單性成為了納什均衡調(diào)整83q1q2a-cq1mq2ma-cR2(q1)=(a-c-q1)/2R1(q2)=(a-c-q2)/2q12q22NE0⊙q13q23通過內(nèi)省和演繹預(yù)測(cè)對(duì)手的行為q1q2a-cq1mq2ma-cR2(q1)=(a-c-q84q1≤q1m企業(yè)1是理性的,q12≤q1≤q1m企業(yè)1知道企業(yè)2理性的q12≤q1≤q13企業(yè)1知道企業(yè)2知道企業(yè)1是理性的q14≤q1≤q13……q1=(a-c)/3理性是共同知識(shí)q1≤q1m企業(yè)85q1q2a-cq1mq2ma-cR2(q1)=(a-c-q1)/2R1(q2)=(a-c-q2)/2q12q22NE0⊙q13q23通過外推引導(dǎo)參與人采用均衡策略,每個(gè)參與人的產(chǎn)量是對(duì)前一階段產(chǎn)量的最佳反應(yīng)。q1q2a-cq1mq2ma-cR2(q1)=(a-c-q86納什均衡隱含的“信念”關(guān)于參與人行為描述的一個(gè)問題是參與人認(rèn)為自己的行動(dòng)不會(huì)直接影響到其他人的行動(dòng),也就是說企業(yè)1和企業(yè)2都認(rèn)為它的產(chǎn)量不會(huì)影響其他企業(yè)的產(chǎn)量。數(shù)學(xué)表達(dá)式:dq/dq1=1+dq2/dq1=1只有這個(gè)“信念”才能支撐納什均衡。納什均衡隱含的“信念”關(guān)于參與人行為描述的一個(gè)問題是參與人認(rèn)87對(duì)納什均衡隱含的“信念”的辯護(hù)假設(shè)存在大批參與人,彼此隨機(jī)配對(duì)進(jìn)行博弈;則現(xiàn)在配對(duì)的參與人不太可能再碰面,那么就不用擔(dān)心他們當(dāng)前的選擇會(huì)如何影響他們未來(lái)對(duì)手的博弈行動(dòng)。這一辯護(hù)的缺陷在哪里?大批參與人對(duì)納什均衡隱含的“信念”的辯護(hù)假設(shè)存在大批參與人,彼此隨機(jī)配882.伯川德模型BertrandModelofDuopoly●標(biāo)準(zhǔn)式表述1、參與人:廠商1與廠商2;他們生產(chǎn)同質(zhì)產(chǎn)品。2、他們選擇價(jià)格,Si={pi:pi≥0};3、他們的支付函數(shù)就是他們的利潤(rùn)函數(shù):ui=ui(pi,pj)NE將是:P1*=p2*=cBertrandparadox2.伯川德模型BertrandModelofDuop89根據(jù)伯川德均衡可以得到兩個(gè)結(jié)論:1.寡頭市場(chǎng)的均衡價(jià)格為:P=MC;2.寡頭的長(zhǎng)期經(jīng)濟(jì)利潤(rùn)為0。這一與實(shí)際不符的結(jié)論,被稱為伯川德悖論Bertrandparadox根據(jù)伯川德均衡可以得到兩個(gè)結(jié)論:90從前面我們得知古諾和伯川德模型并不貼近現(xiàn)實(shí),為什么我們還要用它?建模的最高的目的并不是最貼近現(xiàn)實(shí),簡(jiǎn)單性永遠(yuǎn)是建模的最高目的之一。特別是參與人超過兩個(gè)時(shí),所以這兩個(gè)模型是更好的模型解決伯川德悖論的兩個(gè)方法2.1生產(chǎn)能力約束:合理的配給規(guī)則從前面我們得知古諾和伯川德模型并不貼近現(xiàn)實(shí),為什么我們還要用912.2異質(zhì)伯川德模型BertrandModelofDuopoly*兩廠商決策的相互影響在于需求函數(shù)Di(pi,pj)=a-pi+bpj兩廠商的產(chǎn)品具有一定的差異性;b是廠商i的產(chǎn)品對(duì)廠商j的產(chǎn)品的替代系數(shù)?!駱?biāo)準(zhǔn)式表述1、參與人:廠商1與廠商2;他們生產(chǎn)同類但存在一定差異的產(chǎn)品。2.2異質(zhì)伯川德模型BertrandModelofD922、他們選擇價(jià)格,Si={pi:pi≥0};3、他們的支付函數(shù)就是他們的利潤(rùn)函數(shù):ui=ui(pi,pj)=Di(pi,pj)pi-Di(pi,pj)c=(a-pi+bpj)(pi-c)
假定兩廠商均無(wú)固定成本,只有常數(shù)邊際成本c。廠商i的反應(yīng)函數(shù):Ri(pj)=a+c+bpj22、他們選擇價(jià)格,Si={pi:pi≥0};3、他們的支付932P1=a+c+bp22P2=a+c+bp1P1*=p2*=(a+c)/(2-b)b﹤22P1=a+c+bp22P2=a+c+bp1P1*=p294聚點(diǎn)選擇相同就獲得獎(jiǎng)勵(lì),不同則不能獲得。(1)選擇下面一個(gè)數(shù),并畫上圈:7,100,13,261,99,666。(2)你要在湖北經(jīng)濟(jì)學(xué)院與另一個(gè)人見面,但應(yīng)在何時(shí)何地碰頭。(3)你和別人一起分蛋糕,你們各自報(bào)出欲分得的比例,但所報(bào)比例之和超過百分之百,則你們一無(wú)所獲。聚點(diǎn)選擇相同就獲得獎(jiǎng)勵(lì),不同則不能獲得。95上述博弈都有許多納什均衡比如如果我認(rèn)為你會(huì)選擇666,而你也認(rèn)為我會(huì)選擇666,那么666就是我們共同的選擇。但是在這些均衡中,總有一些可能性更大些。這些特定的策略組合就稱為聚點(diǎn),即出于心理上的原因尤為引人注目的那些納什均衡。要使得某一策略組合成為聚點(diǎn)的緣由正式形式化并非易事,這往往取決于具體的環(huán)境。上述博弈都有許多納什均衡比如如果我認(rèn)為你會(huì)選擇666,而你也96ThomasSchelling在《TheStrategyofConflict》中分析了聚點(diǎn)。在例1中謝林發(fā)現(xiàn)選擇7是最常見的策略,在一群貪得無(wú)厭的人中666可能成為聚點(diǎn)。第一次分蛋糕可能是五五開,如果過去分過,過去的經(jīng)歷將影響聚點(diǎn)的形成。ThomasSchelling在《TheStrategy97三、混合策略納什均衡混合策略的定義:在博弈G={s1,s2,…,sn}中,博弈方i的策略空間為Si=(si1,si2,…,sik),則博弈方以pi=(pi1,pi2,…,pik)隨機(jī)選擇k個(gè)可選策略稱為一個(gè)混合策略。其中,0≤pik≤1,k=1,2,…,k,且pi1+pi2+…+pik=1三、混合策略納什均衡混合策略的定義:在博弈G={s1,s2,98猜謎游戲(A決定,B來(lái)猜;B猜中,獎(jiǎng)勵(lì);否則,懲罰)B正面反面正面-1,11,-1A反面1,-1-1,1猜謎游戲(A決定,B來(lái)猜;B猜中,獎(jiǎng)勵(lì);否則,懲罰)99猜棋游戲看這樣一個(gè)問題。甲乙兩個(gè)人各有一副圍棋,游戲規(guī)則是,每人同時(shí)出一枚棋子,若顏色相同,則甲得1分,乙得-1分;若顏色相反,則甲得-1分,乙得1分。試分析博弈結(jié)果。這是一個(gè)靜態(tài)博弈。得益矩陣為乙黑白黑甲白1,-1-1,1-1,11,-1猜棋游戲看這樣一個(gè)問題。甲乙兩個(gè)人各有一副圍棋,游戲規(guī)則是,100
這個(gè)博弈沒有純策略納什均衡。甲在博弈中以概率p出黑棋,以概率1-p出白棋,稱為混合策略(p,1-p);同樣地,乙的混合策略(q,1-q)。相應(yīng)地,以概率1(或0)出棋,則稱為純策略。在混合策略下,甲的期望收益是:U甲=pq-p(1-q)-q(1-p)+(1-p)(1-q)=2p(2q-1)+1-2q這個(gè)博弈沒有純策略納什均衡。101
乙的期望收益是:U乙=-1pq+p(1-q)+q(1-p)-(1-p)(1-q)=2q(1-2p)+2p-1看甲的決策,當(dāng)2q-1>0時(shí),應(yīng)選p值越大越好,最好取1;當(dāng)2q-1z<0時(shí),選擇p=0好,當(dāng)2q-1=0時(shí),p可以隨便選。即甲的最佳反應(yīng)(稱為反應(yīng)函數(shù))為:乙的期望收益是:102
同樣,乙的反應(yīng)函數(shù)為:以p,q為坐標(biāo)軸畫出它們的圖像,則交點(diǎn)就是納什均衡。同樣,乙的反應(yīng)函數(shù)為:103
0.510.51pq0(0.5,0.5)0.510.51pq0(0.5,0.5)104每個(gè)參與人都想猜透對(duì)方的策略,而每一個(gè)參與人又都不能讓對(duì)方猜透自己的策略,即必須使其他博弈方選擇其任何策略的期望即支付相同。(支付均等化原則)每個(gè)參與人都想猜透對(duì)方的策略,而每一個(gè)參與人又都不能讓對(duì)方猜105小偷與守衛(wèi)守衛(wèi)小偷睡(Pg)不睡(1-Pg)偷(Pt)V,-D-P,0不偷(1-Pt)0,S0,0小偷與守衛(wèi)守衛(wèi)小偷睡不睡偷V,-D-P,0不偷0,S0,0106MAXU(守衛(wèi))=Pg(S-S·Pt-D·Pt),0≤Pg≤11Pt<S/(D+S)Pg=0-1Pt=S/(D+S)0Pt>S/(D+S)MAXU(小偷)=Pt(V·Pg+P·Pg-P),0≤Pt≤10Pg<P/(P+V)Pt=0-1Pg=P/(P+V)1Pg>P/(P+V)MAXU(守衛(wèi))=Pg(S-S·Pt-D·Pt),0≤Pg≤107守衛(wèi)睡的概率Pg小偷偷的概率PtP/(P+V)
1
1
S/(D+S)小偷的反應(yīng)曲線守衛(wèi)的反應(yīng)曲線0守衛(wèi)睡的概率Pg小偷偷的概率PtP/(P+V)11108小偷偷的概率01守衛(wèi)睡覺的期望收益S-D-D’Pt*P’t小偷偷的概率01守衛(wèi)睡覺的期望收益S-D-D’Pt*P’t109守衛(wèi)睡的概率01小偷偷的期望收益Pg*P’gV-P-P’守衛(wèi)睡的概率01小偷偷的期望收益Pg*P’gV-P-P’110我們把納什均衡的概念也作相應(yīng)的擴(kuò)大:對(duì)一個(gè)策略組合,無(wú)論它是純策略還是混合策略,只要滿足各博弈方都不想單獨(dú)偏離它,就稱其為納什均衡我們把納什均衡的概念也作相應(yīng)的擴(kuò)大:對(duì)一個(gè)策略組合,無(wú)論它是111“吉蒂謀殺案”的混合策略博弈分析吉蒂是在紐約被殺的,她的38位鄰居都目睹了卻無(wú)人報(bào)警。瓊斯旁觀β報(bào)警1-β旁觀β0,010,7史密斯報(bào)警1-β7,107,7“吉蒂謀殺案”的混合策略博弈分析吉蒂是在紐約被殺的,她的38112U(報(bào)警)=7=U(旁觀)=βN-1(0)+(1-βN-1)(10)βN-1=0.3隨著N的增加,β增加.無(wú)人報(bào)警的概率為βN,因?yàn)棣翹-1=0.3,所以βN=0.3β這顯然是隨著N的增加而增加.當(dāng)有38個(gè)人時(shí),無(wú)人報(bào)警的概率約為0.29,β=0.97。U(報(bào)警)=7=U(旁觀)=βN-1(0)+(1-βN113這時(shí)混合策略顯然不好,所需要某些東西使得一個(gè)純策略納什均衡成為一個(gè)聚點(diǎn).問題在于責(zé)任的分割,某一個(gè)參與人必須肩負(fù)起報(bào)警的責(zé)任這時(shí)混合策略顯然不好,所需要某些東西使得一個(gè)純策略納什均衡成114四、完全信息動(dòng)態(tài)博弈SPE前面講述的納什均衡有三個(gè)問題:第一,納什均衡的多重性,但這并不是納什均衡最嚴(yán)重的問題;第二,在納什均衡中,參與人在選擇自己的策略時(shí),把其他參與人的策略當(dāng)作是給定的,不考慮自己的選擇如何影響對(duì)手的策略。動(dòng)態(tài)博弈時(shí)這就有問題了;第三,這由第二個(gè)問題引發(fā)來(lái),由于不考慮自己選擇對(duì)別人選擇的影響,納什均衡允許了不可置信威脅的存在。四、完全信息動(dòng)態(tài)博弈SPE前面講述的納什均衡有三個(gè)問題:115
在位者默許斗爭(zhēng)進(jìn)入40,50-10,0進(jìn)入者不進(jìn)入0,3000,300市場(chǎng)進(jìn)入博弈中,如若進(jìn)入者真的進(jìn)入,在位者的最優(yōu)行動(dòng)顯然是默許而不是斗爭(zhēng),因?yàn)槟S帶來(lái)50的利潤(rùn),所以斗爭(zhēng)就是一種不可置信的威脅。但納什均衡概念承認(rèn)了這種不可置信的威脅,所以(不進(jìn)入,斗爭(zhēng))就成為一個(gè)納什均衡。在位者116策略式與結(jié)果矩陣表1瓊斯大小大2,2-1,-1史密斯小-1,-11,1上述博弈中不僅策略與行動(dòng)是等價(jià)的,而且結(jié)果也簡(jiǎn)單。所以表1的2×2形式就同時(shí)完成了將策略組合與支付聯(lián)系起來(lái)和將行動(dòng)組合與結(jié)果聯(lián)系起來(lái)這兩項(xiàng)任務(wù)。這兩項(xiàng)任務(wù)的結(jié)果分別稱為策略式和結(jié)果矩陣。策略式與結(jié)果矩陣表1117考慮由表1的博弈演變來(lái)的博弈。我們稱之為跟隨領(lǐng)頭羊Ⅰ。這一博弈與表1的博弈不同之處在于史密斯首先采取行動(dòng),即承諾自己將采用某一種軟驅(qū)規(guī)格而不管瓊斯將會(huì)先哪種。新的博弈有著與原博弈一樣的結(jié)果矩陣,但其策略式卻大相徑庭。考慮由表1的博弈演變來(lái)的博弈。我們稱之為跟隨領(lǐng)頭羊Ⅰ。這一博118因?yàn)榄偹沟牟呗圆辉僦皇菃我坏男袆?dòng),瓊斯策略集此時(shí)有四個(gè)元素。(L/L,L/S)(L/L,S/S)(S/L,L/S)(S/L,S/S)(若史密斯選擇大則選擇大;若其選擇小則選擇大)(若史密斯選擇大則選擇大;若其選擇小則選擇小)(若史密斯選擇大則選擇小;若其選擇小則選擇大)(若史密斯選擇大則選擇小;若其選擇小則選擇小)因?yàn)榄偹沟牟呗圆辉僦皇菃我坏男袆?dòng),瓊斯策略集此時(shí)有四個(gè)元素。119跟隨領(lǐng)頭羊Ⅰ表明只要添加一點(diǎn)復(fù)雜性,就使得策略式表述變得晦澀難懂,幾無(wú)用武之地。策略式如下。瓊斯
L/L,L/SL/L,S/SS/L,L/SS/L,S/S大2,22,2-1,-1-1,-1史密斯小-1,-11,1-1,-11,1跟隨領(lǐng)頭羊Ⅰ表明只要添加一點(diǎn)復(fù)雜性,就使得策略式表述變得晦澀120均衡策略結(jié)果E1大,(L/L,L/S)雙方都選擇大E2大,(L/L,S/S)雙方都選擇大E3小,(S/L,S/S)雙方都選擇小在以后的分析中我們將討論均衡E1和E3可以被我們通過納什均衡的精煉所排除。均衡策略121子博弈完美納什均衡澤爾騰(1965)提出了“子博弈完美納什均衡”(sub-gameperfectNashequilibrium)概念的目的就是要將那些包含不可置信威脅策略的納什均衡從均衡中剔除,從而給出動(dòng)態(tài)博弈結(jié)果的一個(gè)合理預(yù)測(cè)。子博弈完美納什均衡澤爾騰(1965)提出了“子博弈完美納什均122擴(kuò)展式和博弈樹描述一個(gè)博弈的另外兩種方法就是擴(kuò)展式和博弈樹。結(jié)(node)是指博弈中某一參與人或自然采取行動(dòng)的時(shí)點(diǎn)或博弈結(jié)束的時(shí)點(diǎn)。起點(diǎn)結(jié)是指不存在前續(xù)結(jié)的結(jié)。終點(diǎn)結(jié)是指不存在后續(xù)結(jié)的結(jié)。枝(branch)指在一個(gè)特定結(jié)上某一參與人的行動(dòng)集中的一個(gè)行動(dòng)路徑(path)指從起始結(jié)到終點(diǎn)結(jié)由結(jié)和枝所組成的系列。擴(kuò)展式和博弈樹描述一個(gè)博弈的另外兩種方法就是擴(kuò)展式和博弈樹。123擴(kuò)展式是對(duì)博弈的一種描述,它由下述幾點(diǎn)組成:(1)由結(jié)和枝所組成的整體結(jié)構(gòu),即由單個(gè)起始結(jié)開始直至終點(diǎn)結(jié),中間無(wú)閉合的圈。(2)有對(duì)哪個(gè)結(jié)點(diǎn)屬于哪個(gè)人的說明。(3)在自然作選擇的結(jié)上,有自然選擇不同枝的概率。(4)有劃分每個(gè)參與人的結(jié)的信息集。(5)在每一個(gè)終點(diǎn)結(jié)上都有對(duì)每個(gè)參與人的支付博弈樹除(5)外與擴(kuò)展式都一樣,在博弈樹中(5)變?yōu)椋涸诿恳粋€(gè)終點(diǎn)結(jié)上都有結(jié)果。博弈樹(gametree)是一個(gè)比擴(kuò)展式更為靈活的術(shù)語(yǔ),如果結(jié)果被定義為支付組合,博弈樹與擴(kuò)展式一樣擴(kuò)展式是對(duì)博弈的一種描述,它由下述幾點(diǎn)組成:124子博弈(subgame)由原博弈中某個(gè)決策點(diǎn)(信息集)開始的部分構(gòu)成一個(gè)子博弈。12323原博弈子博弈I子博弈II子博弈(subgame)由原博弈中某個(gè)決策點(diǎn)(信息集)開始的125逆向歸納法(backwardinduction)在有限博弈中,我們可以用逆向歸納法求解精煉納什均衡:從最后一個(gè)決策點(diǎn)開始,找出該子博弈的納什均衡;然后再倒回到倒數(shù)第二個(gè)決策點(diǎn),找出決策者的最優(yōu)決策(假定最后一個(gè)決策者的決策是最有的;如此一直到初始決策點(diǎn),所有子博弈上的最優(yōu)選擇就是精煉納什均衡。又稱“rollback”.逆向歸納法(backwardinduction)在有限博126海盜分金幣5個(gè)海盜搶到了100顆寶石,每一顆都一樣的大小和價(jià)值連城,他們決定這分:首先,由1號(hào)提出分配方案,然后大家5人進(jìn)行表決,當(dāng)且僅當(dāng)超過半數(shù)的人同意時(shí),按照他的提案進(jìn)行分配,否則將被扔入大海喂鯊魚。再由2號(hào)提出分配方案,以次類推......條件:1.每個(gè)海盜都是極其聰明的人2.每個(gè)海盜都是非常殘忍的人3.每個(gè)海盜都能明確的判斷得失然后作出明智的選擇問題:第一個(gè)海盜提出怎樣的分配方案才能夠使自己的收益最大化海盜分金幣5個(gè)海盜搶到了100顆寶石,每一顆都一樣的大小和價(jià)127如果只剩4號(hào)和5號(hào)的話,5號(hào)一定投反對(duì)票讓4號(hào)喂鯊魚,以獨(dú)吞全部金幣。所以,4號(hào)惟有支持3號(hào)才能保命。3號(hào)知道這一點(diǎn),就會(huì)提(100,0,0)的分配方案,對(duì)4號(hào)、5號(hào)一毛不拔而將全部金幣歸為已有,因?yàn)樗?號(hào)一無(wú)所獲但還是會(huì)投贊成票,再加上自己一票他的方案即可通過。不過,2號(hào)推知到3號(hào)的方案,就會(huì)提出(98,0,1,1)的方案,即放棄3號(hào),而給予4號(hào)和5號(hào)各一枚金幣。由于該方案對(duì)于4號(hào)和5號(hào)來(lái)說比在3號(hào)分配時(shí)更為有利,他們將支持他而不希望他出局而由3號(hào)來(lái)分配。這樣,2號(hào)將拿走98枚金幣。不過,2號(hào)的方案會(huì)被1號(hào)所洞悉,1號(hào)并將提出(97,0,1,2,0)或(97,0,1,0,2)的方案,如果只剩4號(hào)和5號(hào)的話,5號(hào)一定投反對(duì)票讓4號(hào)喂鯊魚,以獨(dú)吞128取石子博弈:小時(shí)候的游戲參與者1和2。博弈順序:一次最多只能取走3塊石頭,最少一塊。支付:拿走最后一塊石頭的人贏。取石子博弈:小時(shí)候的游戲參與者1和2。1290,4,8,12,16,20是死數(shù)(targetposition)共有21塊石頭,所以先拿的贏。0,4,8,12,16,20是死數(shù)(targetposit130?。?,1)
小大(-1,-1)?。?1,-1)大大(2,2)圖1擴(kuò)展式下的跟隨領(lǐng)頭羊ⅠSJ1J2E1大,(L/L,L/S)雙方都選擇大E2大,(L/L,S/S)雙方都選擇大E3小,(S/L,S/S)雙方都選擇小小131均衡路徑與子博弈完美納什均衡121UDLRD′U′(0,2)(0,1)(1,3)(2,0)均衡路徑與子博弈完美納什均衡121UDLRD′U′(0,2)132第三階段121UDLRD′U′(0,2)(0,1)(1,3)(2,0)第三階段121UDLRD′U′(0,2)(0,1)(1,3)133第二階段121UDLRD′U′(0,2)(0,1)(1,3)(2,0)第二階段121UDLRD′U′(0,2)(0,1)(1,3)134第一階段121UDLRD′U′(0,2)(0,1)(1,3)(2,0)第一階段121UDLRD′U′(0,2)(0,1)(1,3)135這樣均衡結(jié)果和均衡路徑是參與人在第一階段選擇U結(jié)束。子博弈完美納什均衡是(﹛U,U′﹜,L)這里的U′和L分別是參與人1和參與人2在非均衡路徑上的選擇。這樣均衡結(jié)果和均衡路徑是參與人在第一階段選擇U結(jié)束。136不可置信威脅精煉納什均衡剔除了不可置信的威脅,使得我們可以更合理地對(duì)博弈中參與人行為的預(yù)測(cè);不可置信威脅的根源是事前最優(yōu)與事后最優(yōu)不同,導(dǎo)致許多帕累托效率無(wú)法實(shí)現(xiàn);不可置信威脅精煉納什均衡剔除了不可置信的威脅,使得我們可以更137承諾承諾是將不可置信的威脅變成可置信的威脅的行動(dòng):威脅不僅是事前最優(yōu)的,也是事后最優(yōu)的。承諾意味著限制自己的自由:選擇少反而對(duì)自己好。如“破釜沉舟”的故事。承諾承諾是將不可置信的威脅變成可置信的威脅的行動(dòng):威脅不僅是138承諾舉例婚姻中的承諾:彩禮、昂貴的婚禮可以理解為一種對(duì)婚姻的承諾;訂金、抵押物做為對(duì)交易的承諾;“安營(yíng)扎寨”;固定資產(chǎn)投資可以作為承諾;承諾舉例婚姻中的承諾:彩禮、昂貴的婚禮可以理解為一種對(duì)婚姻的139要挾訴訟Ⅰ:簡(jiǎn)單勒索參與人:一個(gè)原告和一個(gè)被告博弈順序:1.原告決定是否指控被告。2.原告提出一個(gè)無(wú)協(xié)商余地的賠償金額s。3.被告決定接受或拒絕原告的要求。4.如果被拒絕,原告將決定是放棄還是告上法庭,這將給自己帶來(lái)p的成本,原告d的成本。5.如果原告上法庭,將以a的概率勝訴,從而獲得賠償x,否則什么也得不到。要挾訴訟Ⅰ:簡(jiǎn)單勒索參與人:一個(gè)原告和一個(gè)被告140支付:令ax<p,這樣原告的期望賠償支付將小于他起訴的邊際成本。支付:141要挾訴訟博弈Ⅰ的擴(kuò)展式原告被告原告不指控指控要求賠償s接受拒絕上法庭放棄(s-c,-s)(ax-c-p,-ax-d)(-c,0)(0,0)要挾訴訟博弈Ⅰ的擴(kuò)展式原告被告原告不指控指控要求賠償s接受拒142要挾訴訟博弈Ⅱ:
原告策略性地運(yùn)用沉沒成本原告可以事先支付他的律師報(bào)酬p,即使案子私了也不收回。不能收回律師費(fèi)對(duì)原告是有利的。只要ax>0,他就會(huì)上法庭。只要s>ax,原告才會(huì)愿意私了。當(dāng)s<ax+d,被將愿意私了。存在一個(gè)有效的私了區(qū)域〔ax,ax+d〕,具體的賠償金額將取決于雙方的討價(jià)還價(jià)的能力。要挾訴訟博弈Ⅱ:
原告策略性地運(yùn)用沉沒成本原告可以事先支付他143在這里,假定允許原告討價(jià)還價(jià)的能力極強(qiáng)。s=ax+d。只要-c-p+ax+d≥0,才有子博弈完美納什均衡。見下圖的擴(kuò)展式。原告指控是因?yàn)樗梢岳账鞯絛,而這正好是被告的辯護(hù)成本。
在這里,假定允許原告討價(jià)還價(jià)的能力極強(qiáng)。s=ax+d。144要挾訴訟博弈Ⅱ的擴(kuò)展式:原告被告原告不指控指控要求賠償s接受拒絕上法庭放棄(s-c-p,-s)(ax-c-p,-ax-d)(-c-p,0)(0,0)要挾訴訟博弈Ⅱ的擴(kuò)展式:原告被告原告不指控指控要求賠償s接受145要挾訴訟博弈Ⅲ:
被告策略性地運(yùn)用沉沒成本對(duì)付被告這種策略的一個(gè)辦法是:被告在關(guān)于私了未進(jìn)行了之前,甚至在原告決定指控被告之前就支付律師費(fèi)d。要挾訴訟博弈Ⅲ:
被告策略性地運(yùn)用沉沒成本對(duì)付被告這種策略的146要挾訴訟博弈Ⅲ的擴(kuò)展式:原告被告原告不指控指控要求賠償s接受拒絕上法庭放棄(s-c-p,-s-d)(ax-c-p,-ax-d)(-c-p,-d)(0,0)要挾訴訟博弈Ⅲ的擴(kuò)展式:原告被告原告不指控指控要求賠償s接受147這就是為什么許多大公司除了雇傭按時(shí)計(jì)酬的外部律師外都雇傭內(nèi)部律師的原因。如果是這樣,就會(huì)帶來(lái)社會(huì)損失(浪費(fèi)律師的時(shí)間,花費(fèi)為D)。這也是為什么一些好戰(zhàn)的國(guó)家引起的全球軍費(fèi)開支造成了社會(huì)損失,即使這些從未發(fā)生過戰(zhàn)爭(zhēng)。這就是為什么許多大公司除了雇傭按時(shí)計(jì)酬的外部律師外都雇傭內(nèi)部148畫家和政府的苦惱名畫的價(jià)值取決于數(shù)量,畫家常為無(wú)法承諾而苦惱:誰(shuí)相信他不會(huì)再畫呢?這可能是為什么死了畫家的畫最值錢。政府也有類似的問題。政府經(jīng)常缺乏承諾:給定投資者進(jìn)入的情況下,多征稅是最優(yōu)的;但投資者預(yù)期到這一點(diǎn),將不愿意進(jìn)入。中國(guó)許多地方支付有嚴(yán)重的機(jī)會(huì)主義行為?!疤拱讖膶挘咕軓膰?yán)”面臨的問題也如此。畫家和政府的苦惱名畫的價(jià)值取決于數(shù)量,畫家常為無(wú)法承諾而苦惱149作為承諾的法律法律改變事后的選擇空間或選擇成本,所以可以起到承諾的作用;合同的承諾作用(違約的成本增加,使得遵守合同更可能是事后最優(yōu)的選擇);刑法:為什么不能商量?為什么對(duì)嚴(yán)重犯罪要執(zhí)行死刑?臺(tái)灣問題:立法還是政府隨機(jī)應(yīng)變?“法治”(ruleoflaw)是政府的承諾;作為承諾的法律法律改變事后的選擇空間或選擇成本,所以可以起到150借錢投資問題設(shè)甲準(zhǔn)備投資開采一個(gè)價(jià)值4萬(wàn)元的金礦,但缺1萬(wàn)元資金,而乙正好有1萬(wàn)元可以投入。甲向乙借這1萬(wàn)元用于開礦,并承諾收益雙方平分。假設(shè)金礦的價(jià)值經(jīng)權(quán)威探測(cè),是確實(shí)的。乙是否應(yīng)該借錢給甲呢?乙最關(guān)心的是甲得到金子后是否履行諾言跟乙平分收益。萬(wàn)一甲采到金子后不分收益,甚至賴賬,乙連本錢都收不回來(lái)。我們用下面的擴(kuò)展形的方法分析:借錢投資問題設(shè)甲準(zhǔn)備投資開采一個(gè)價(jià)值4萬(wàn)元的金礦,但缺1萬(wàn)151借款投資的擴(kuò)展形(博弈樹)
乙甲借不借分不分(2,2)(0,4)(1,0)借款投資的擴(kuò)展形(博弈樹)152改進(jìn)本博弈因?yàn)榧椎牟豢尚诺姆皱X承諾而使甲乙的合作沒有成功,開礦帶來(lái)的3萬(wàn)元的社會(huì)效益也沒能實(shí)現(xiàn)。能否改進(jìn)措施,使甲的承諾變?yōu)榭尚??我們?cè)黾右粋€(gè)對(duì)甲的行為的制約。當(dāng)甲選擇分錢時(shí),雙方達(dá)到最佳結(jié)局。當(dāng)甲選擇不分時(shí),讓乙通過打官司來(lái)保護(hù)自己的利益,打官司乙肯定能贏,但要耗費(fèi)財(cái)力物力,假設(shè)乙除掉打官司的花費(fèi),正好收回1萬(wàn)元投資,而甲的全部采金收入將被沒收。這樣,就變成了三階段的動(dòng)態(tài)博弈。改進(jìn)本博弈因?yàn)榧椎牟豢尚诺姆皱X承諾而使甲乙的合作沒有成功,開153有可信的諾言和威脅時(shí)的博弈樹乙甲乙不借借分不分打不打(2,2)(1,0)(0,4)
溫馨提示
- 1. 本站所有資源如無(wú)特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請(qǐng)下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請(qǐng)聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
- 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁(yè)內(nèi)容里面會(huì)有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
- 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
- 5. 人人文庫(kù)網(wǎng)僅提供信息存儲(chǔ)空間,僅對(duì)用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對(duì)用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對(duì)任何下載內(nèi)容負(fù)責(zé)。
- 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請(qǐng)與我們聯(lián)系,我們立即糾正。
- 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶因使用這些下載資源對(duì)自己和他人造成任何形式的傷害或損失。
最新文檔
- 會(huì)展產(chǎn)品合同范本
- 出口種子銷售合同范本
- 轉(zhuǎn)賣音響合同范本
- 勞務(wù)外包合同范例
- 中介委托租房電子合同范本
- 凱倫股合同范本
- 養(yǎng)牛合伙合同范本
- 北海吊車出租合同范本
- 公司中途入股合同范本
- 產(chǎn)品服務(wù)合同范例
- 設(shè)計(jì)管理資料課件
- “春季傳染病預(yù)防”班會(huì)全文PPT
- 《涉外禮儀教程(第五版)》課件第一章 涉外通則
- 農(nóng)藥殘留檢測(cè)技術(shù)課件
- 服裝造型點(diǎn)線面課件
- 化工裝置安全試車工作規(guī)范附件解讀教材課件
- 醫(yī)院管理案例運(yùn)用PDCA降低住院患者跌倒發(fā)生率課件
- DB32T 3699-2019 城市道路照明設(shè)施養(yǎng)護(hù)規(guī)程
- 自然辯證法概論課件:第四章馬克思主義科學(xué)技術(shù)社會(huì)論
- 中建精裝修施工工藝工法標(biāo)準(zhǔn)(做法詳細(xì)值得收藏)
- 2021版大象版四年級(jí)科學(xué)下冊(cè)12奇妙的植物教學(xué)課件
評(píng)論
0/150
提交評(píng)論