博弈論簡介 微觀經(jīng)濟(jì)學(xué)課件_第1頁
博弈論簡介 微觀經(jīng)濟(jì)學(xué)課件_第2頁
博弈論簡介 微觀經(jīng)濟(jì)學(xué)課件_第3頁
博弈論簡介 微觀經(jīng)濟(jì)學(xué)課件_第4頁
博弈論簡介 微觀經(jīng)濟(jì)學(xué)課件_第5頁
已閱讀5頁,還剩75頁未讀, 繼續(xù)免費(fèi)閱讀

下載本文檔

版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請(qǐng)進(jìn)行舉報(bào)或認(rèn)領(lǐng)

文檔簡介

博弈論簡介博弈論簡介11、博弈論簡介至今沒有一個(gè)理想的模型可以解釋形形色色的寡頭壟斷市場,現(xiàn)有工具內(nèi)不能完全解釋寡頭市場或總結(jié)出所謂的主要規(guī)律。為此,人們發(fā)展出了新的工具,博弈論。博弈論(GameTheory)又名對(duì)策論,游戲論失火了,屋里人很多,你往哪個(gè)門跑—這就是博弈你的行動(dòng)結(jié)果不僅取決于你的策略選擇,同時(shí)也取決于他人的策略選擇。它研究個(gè)體或組織之間存在利益沖突情況下如何進(jìn)行最優(yōu)決策。1、博弈論簡介至今沒有一個(gè)理想的模型可以解釋形形色色的寡頭壟博弈論是50年代數(shù)學(xué)家馮·諾依曼和經(jīng)濟(jì)學(xué)家奧斯卡·摩根斯坦首先提出的。在經(jīng)濟(jì)學(xué)、政治學(xué)、社會(huì)學(xué)獲得了巨大的應(yīng)用。1994年諾貝爾經(jīng)濟(jì)學(xué)獎(jiǎng)?lì)C發(fā)給了3位博弈論專家:納什、澤爾騰、哈桑尼。博弈論是關(guān)于社會(huì),而不是關(guān)于自然的。中國人研究博弈論是有優(yōu)勢的《三國演義》、《孫子兵法》、《三十六計(jì)》、《厚黑學(xué)》都是博弈論教材,如何在人與人的博弈中取得成功。博弈論是50年代數(shù)學(xué)家馮·諾依曼和經(jīng)濟(jì)學(xué)家奧斯卡·摩根斯坦首

1994年諾貝爾經(jīng)濟(jì)學(xué)獎(jiǎng)獲得者:美國數(shù)學(xué)家JohnF.Nash;德國經(jīng)濟(jì)學(xué)家ReinhardSelten;美籍匈牙利經(jīng)濟(jì)學(xué)家JohnC.Harsanyi。

1928年Nash出生于美國,1950年獲Princeton大學(xué)數(shù)學(xué)博士學(xué)位,曾先后任教于MIT和Princeton大學(xué)。其博士論文《非合作博弈》首次區(qū)分了合作博弈與非合作博弈,并且提出了非合作博弈的納什均衡概念。后來人們發(fā)現(xiàn),早在1938年法國數(shù)學(xué)家和經(jīng)濟(jì)學(xué)家古諾(Cournot)關(guān)于雙頭壟斷(oligapoly)的著作中,曾提出Nash均衡的觀念。2002年《美麗心靈》獲多項(xiàng)奧斯卡獎(jiǎng)。1994年諾貝爾經(jīng)濟(jì)學(xué)獎(jiǎng)獲得者:1928年N1930年Selten出生于現(xiàn)屬于波蘭的德國城市,1961年獲法蘭克福大學(xué)數(shù)學(xué)博士學(xué)位,曾先后任教于柏林自由大學(xué)、比勒菲爾特大學(xué)和波恩大學(xué)。Selten的主要貢獻(xiàn)是首次對(duì)分析動(dòng)態(tài)策略交互作用深化了Nash均衡的概念。1920年Harsanyi出生于匈牙利,1947年獲布達(dá)佩斯大學(xué)博士學(xué)位,后逃亡澳大利亞,再到美國,1954年獲斯坦福大學(xué)博士學(xué)位,曾先后任教于澳大利亞國立大學(xué)、加州伯克利分校。于2000年去世。Harsanyi研究和分析了不完全信息博弈,從而為信息經(jīng)濟(jì)學(xué)提供了一個(gè)理論基礎(chǔ)。1930年Selten出生于現(xiàn)屬于波蘭的1996年,兩位將博弈論應(yīng)用于不對(duì)稱信息下機(jī)制設(shè)計(jì)的經(jīng)濟(jì)學(xué)家莫里斯(Mirrlees)和維克里(Vickrey)獲諾貝爾經(jīng)濟(jì)學(xué)獎(jiǎng)。2001年三位經(jīng)濟(jì)學(xué)家阿克洛夫(Akerlof)、斯蒂格利茨(Stiglitz)和斯賓塞(Spence)因運(yùn)用博弈論研究信息經(jīng)濟(jì)學(xué)所取得的成就而成為該年度的諾貝爾經(jīng)濟(jì)學(xué)獎(jiǎng)得主。1996年,兩位將博弈論應(yīng)用于不對(duì)稱信息下機(jī)制設(shè)計(jì)的經(jīng)濟(jì)學(xué)家博弈的規(guī)則或研究框架(1)博弈參與者(player),博弈論分析假定參與者都是理性的(追求個(gè)人利益最大化)。(2)策略空間,博弈參與者必須知道他自己及其對(duì)手的策略(strategy)或行動(dòng)選擇范圍。(3)決策行為結(jié)果。博弈論用數(shù)字表示這類結(jié)果(可評(píng)價(jià)優(yōu)劣高下),并稱之為收益(payoff、支付)。博弈的規(guī)則或研究框架博弈的分類一、靜態(tài)博弈與動(dòng)態(tài)博弈

參與者行動(dòng)的先后順序,靜態(tài)博弈是同時(shí)作出決策(不了解對(duì)手的決策方案),動(dòng)態(tài)博弈是參與者先后作出決策(后行動(dòng)的人知道先行動(dòng)者的行動(dòng)方案)。二、完全信息博弈與不完全信息博弈

對(duì)其他參與者收益支付信息的掌握程度。不完全信息博弈中至少有一人不能確切了解其它決策者收益函數(shù)。三、合作博弈與非合作博弈

能否達(dá)成一個(gè)有約束力的協(xié)議,合作博弈強(qiáng)調(diào)集體理性。(經(jīng)濟(jì)學(xué)主要討論非合作博弈)四、一次性博弈與重復(fù)博弈

博弈重復(fù)多次進(jìn)行。(注意區(qū)分動(dòng)態(tài)博弈)博弈的分類一、靜態(tài)博弈與動(dòng)態(tài)博弈博弈的分類博弈的分類

嚴(yán)格地講,博弈論并不是經(jīng)濟(jì)學(xué)的一個(gè)分支,它是一種方法,應(yīng)用范圍除經(jīng)濟(jì)學(xué)外,還包括政治學(xué)、軍事學(xué)、外交學(xué)、國際關(guān)系學(xué)、犯罪學(xué)等。但為何博弈論受到經(jīng)濟(jì)學(xué)的重視呢?主要原因有:⑴博弈論在經(jīng)濟(jì)學(xué)中得到最廣泛、最成功的應(yīng)用,尤其在寡頭市場理論中得到直接的應(yīng)用。⑵博弈論的許多成果也是借助于經(jīng)濟(jì)學(xué)的例子來發(fā)展的,經(jīng)濟(jì)學(xué)家對(duì)博弈論的貢獻(xiàn)最大。⑶博弈論與經(jīng)濟(jì)學(xué)的研究模式一樣:理性人在給定約束條件追求自己的效用最大化。由于上述原因博弈論逐漸成為主流經(jīng)濟(jì)學(xué)最重要的組成部分。嚴(yán)格地講,博弈論并不是經(jīng)濟(jì)學(xué)的一個(gè)分支,它是2、博弈論基本模型囚徒困境(完全信息靜態(tài)博弈)(A、B共同犯罪被抓,警察分開審問)

BA坦白不坦白A=10年A=25年B=10年B=1年A=1年A=3年B=25年B=3年坦白不坦白每一個(gè)人的結(jié)局不僅取決于自身的選擇,同時(shí)也取決于對(duì)手的選擇不管B坦白不坦白,我坦白總是會(huì)少坐一些牢2、博弈論基本模型囚徒困境(完全信息靜態(tài)博弈)坦白不坦白每一囚徒困境(完全信息下的靜態(tài)博弈)“囚徒的困境(Prisoners’Dilemma)”,從博弈論角度看,這是一個(gè)存在占優(yōu)均衡的博弈:因?yàn)閷?duì)囚犯A,B來說,無論對(duì)方如何選擇,“坦白”都是各自的最優(yōu)選擇。雖然從兩名囚犯共同利益看,最好的選擇是合作,即同時(shí)選擇保持沉默,然而,由于猜忌,試圖獲得更大好處等競爭性動(dòng)機(jī)阻礙了它們達(dá)到更好的互利選擇,我們將看到,寡頭壟斷廠商經(jīng)常面臨類似的困境。啟示:個(gè)體理性決策常導(dǎo)致集體非理性結(jié)果囚徒困境(完全信息下的靜態(tài)博弈)“囚徒的困境(Prisone實(shí)例:投標(biāo)(總工程量50,賄賂成本5,甲乙雙方實(shí)力相當(dāng))甲賄賂不賄賂

賄賂不賄賂20200454502525均衡:(賄賂,賄賂)乙實(shí)例:投標(biāo)(總工程量50,賄賂成本5,甲乙雙方實(shí)力相當(dāng))智豬博弈背景:在一個(gè)豬圈里住著一大一小兩頭豬。它們從同一個(gè)食槽中獲得食物。但食槽的按鈕與食物的出口分布在相反的兩端。每按一次按鈕,可得10個(gè)單位食物,但需付出2個(gè)單位勞動(dòng)。規(guī)則:若大豬按按鈕:大豬吃6個(gè)單位,小豬吃4個(gè)單位;若小豬按按鈕:大豬吃9個(gè)單位,小豬吃1個(gè)單位;若一起去按:大豬吃7個(gè)單位,小豬吃3個(gè)單位;問題:哪頭豬將會(huì)去按按鈕?

小豬按等待按5,14,4等待9,-10,0大豬智豬博弈背景:在一個(gè)豬圈里住著一大一小兩頭豬。它們從同一個(gè)食市場中大企業(yè)與小企業(yè)的關(guān)系就類似于智豬博弈,大企業(yè)進(jìn)行研究開發(fā),為新產(chǎn)品做廣告,而對(duì)小企業(yè)來說,這些工作可能得不償失,因此,小企業(yè)就將精力放在模仿上,或等大企業(yè)用廣告打開市場以后再出售廉價(jià)產(chǎn)品。股份公司治理中的小股東、股市中的信息收集智豬博弈結(jié)果:多勞不多得市場中大企業(yè)與小企業(yè)的關(guān)系就類似于智豬博弈,大企業(yè)進(jìn)斗雞博弈假設(shè)兩只公雞遇到一起,每只公雞都有兩個(gè)行動(dòng)選擇:進(jìn)攻或后退。后退是很丟面子的事情,若雞甲進(jìn)攻,乙后退,則甲贏。雙方前進(jìn),兩敗俱傷。

雞乙進(jìn)退

雞甲進(jìn)-4,-41,-1退-1,1-1,-1雙方都沒有占優(yōu)策略存在兩個(gè)穩(wěn)定的狀態(tài)(納什均衡):(-1,1);(1,-1)斗雞博弈假設(shè)兩只公雞遇到一起,每只公雞都有兩個(gè)行動(dòng)選擇:進(jìn)攻雙方都避免兩敗俱傷,斗雞博弈有兩個(gè)納什均衡,一方前進(jìn),另一方后退。由于有兩個(gè)均衡點(diǎn),結(jié)果無法預(yù)知。20世紀(jì)60年代蘇美間的古巴導(dǎo)彈危機(jī)就是一個(gè)斗雞博弈的很好例子。古巴導(dǎo)彈危機(jī)是冷戰(zhàn)時(shí)期蘇美之間最嚴(yán)重的一次危機(jī),赫魯曉夫1962年偷偷將導(dǎo)彈運(yùn)到古巴對(duì)付美國,被美國U2飛機(jī)偵察到,美國派出攜帶核武器的戰(zhàn)機(jī)、航母,威脅蘇聯(lián)限期從古巴撤出導(dǎo)彈。蘇美這兩只大公雞均在考慮進(jìn)還是退?戰(zhàn)爭的結(jié)果當(dāng)然是兩敗俱傷,但任何一方退下來則是很不光彩的事。博弈結(jié)果是蘇聯(lián)從古巴撤回了導(dǎo)彈,做了丟面子的“撤退的雞”,而美國堅(jiān)持了自己的策略,做了“不退的雞”。當(dāng)然為了給蘇聯(lián)面子,同時(shí)也擔(dān)心戰(zhàn)爭,美國也從土耳其撤了一些導(dǎo)彈。雙方都避免兩敗俱傷,斗雞博弈有兩個(gè)納什均衡,一方前進(jìn)例:兩個(gè)寡頭進(jìn)行價(jià)格戰(zhàn)博弈的收益矩陣。

博弈論中的均衡是一組穩(wěn)定的博弈結(jié)果。雙方均不愿先改變策略。博弈的均衡是穩(wěn)定的,因而是可以預(yù)測的。10,1050,50-50,100100,-50低價(jià)低價(jià)高價(jià)高價(jià)廠商B廠商A3、博弈論中的均衡例:兩個(gè)寡頭進(jìn)行價(jià)格戰(zhàn)博弈的收益矩陣。10,1050,50占優(yōu)策略,又稱支配性策略(dominantstrategy)此類博弈中存在一種策略,無論B選擇何行動(dòng),該策略對(duì)A都是最優(yōu),則稱此策略為博弈者A的占優(yōu)策略。在本例中,廠商A和廠商B都有不受他人策略影響的占優(yōu)策略,即選擇低價(jià)。占優(yōu)均衡,支配均衡每個(gè)參與者都有并都選擇占優(yōu)策略,由此實(shí)現(xiàn)的均衡稱占優(yōu)均衡。本例為(10,10)。占優(yōu)均衡占優(yōu)策略,又稱支配性策略(dominantstrategy納什均衡納什均衡(非合作性均衡):納什均衡是這樣一組策略,它使所有博弈參與者都不能再提高其收益的狀況。此時(shí),雙方在對(duì)方給定的策略下均不愿意調(diào)整自己的策略。下例中,A有占優(yōu)策略即正常價(jià)格策略,而廠商B沒有占優(yōu)策略,它必須根據(jù)A的占優(yōu)策略來確定其戰(zhàn)略選擇,即其選擇受A的選擇的影響。100,20010,10150,-30-20,150高價(jià)格正常價(jià)格廠商B廠商A高價(jià)格正常價(jià)格納什均衡納什均衡(非合作性均衡):100,20010,101多個(gè)均衡和沒有均衡一個(gè)博弈可能有好幾個(gè)納什均衡(即幾組穩(wěn)定并且自我堅(jiān)持的策略),有時(shí)又可能不存在(純策略的)納什均衡。甲表存在兩個(gè)納什均衡:其中“上,左”是納什均衡(A選上,則B選左;且B選左時(shí)A仍應(yīng)選上);“下,右”也是納什均衡(A選下,則B選右;且B選右時(shí)A仍應(yīng)選下)。如某個(gè)博弈只有一個(gè)納什均衡點(diǎn),這個(gè)博弈的結(jié)果是可以預(yù)測的,如有兩個(gè)或以上的納什均衡點(diǎn),則博弈結(jié)果無法預(yù)測。乙表沒有納什均衡。如A選“上”,B則選“左”;然而當(dāng)B選“左”時(shí),A卻應(yīng)當(dāng)選“下”。反之,A選“下”時(shí),B應(yīng)選“右”;然而當(dāng)B選右時(shí),A又應(yīng)選“上”。沒有均衡點(diǎn)。2,11,20,00,0左上右下局中人B局中人A0,0-1,31,00,-1左上右下局中人B局中人A(甲)(乙)多個(gè)均衡和沒有均衡一個(gè)博弈可能有好幾個(gè)納什均衡(即幾組穩(wěn)定并占優(yōu)均衡與納什均衡的區(qū)別

占優(yōu)均衡:我所做的是:不管你做什么我所能做的最好的。

你所做的是:不管我做什么你所能做的最好的。納什均衡:我所做的是:給定你所做的我所能做的最好的。你所做的是:給定我所做的你所能做的最好的。占優(yōu)均衡是納什均衡的一個(gè)特例占優(yōu)均衡與納什均衡的區(qū)別占優(yōu)均衡:我所做的是:不管你做4、最大最小策略迄今為止,對(duì)廠商行為的分析都建立在利潤最大化基礎(chǔ)上。但在一些競爭激烈的寡頭壟斷市場,馮·諾依曼和摩根斯坦認(rèn)為決策者也可能采取一種風(fēng)險(xiǎn)厭惡策略。即確保在最壞的結(jié)果中得到最好的結(jié)果。這種決策規(guī)則稱最大最小策略(MaximinStrategy):博弈者在可能最少的利潤方案中選擇利潤最大的方案。4、最大最小策略迄今為止,對(duì)廠商行為的分析都建立在利潤最大化如果企業(yè)謀求利潤最大化,將有兩個(gè)納什均衡,一家企業(yè)投資推出新產(chǎn)品,另一家企業(yè)不投資產(chǎn)品。最大最小策略,不是利潤最大化策略,準(zhǔn)確說,它是用來避免十分不利結(jié)果的。對(duì)企業(yè)1來說,如果它不投資新產(chǎn)品,利潤最小是300萬,如果它投資,利潤最小是200萬。對(duì)企業(yè)2數(shù)字也相同。兩家企業(yè)都在最小利潤中選最大值。結(jié)果是兩家企業(yè)都不投資新產(chǎn)品。因?yàn)檫@樣的策略能保證至少獲得300萬利潤。戰(zhàn)略不投資投資投資4,43,66,32,2廠商1廠商2不投資雙寡頭企業(yè)都在考慮是否投資推出新產(chǎn)品。如果企業(yè)謀求利潤最大化,將有兩個(gè)納什均衡,一家企業(yè)投資最大最小策略的結(jié)果并不是兩種納什均衡中的一種。原因是這種決策所用的準(zhǔn)則,不是利潤最大化,而是避免虧損過多。不同的決策目標(biāo)可能導(dǎo)致人們選擇不同的策略,最終導(dǎo)致不同的博弈結(jié)果。最大最小策略的結(jié)果并不是兩種納什均衡中的一種。5、重復(fù)剔除嚴(yán)格劣戰(zhàn)略“重復(fù)剔除嚴(yán)格劣戰(zhàn)略”的思路:首先找出博弈參與人的劣戰(zhàn)略(dominatedstrategy)(假定存在的話),把這個(gè)劣戰(zhàn)略剔除后,剩下的是一個(gè)不包含已剔除劣戰(zhàn)略的新的博弈;然后在剔除這個(gè)新的博弈中的劣戰(zhàn)略;繼續(xù)這個(gè)過程,直到?jīng)]有劣戰(zhàn)略存在。如果剩下的戰(zhàn)略組合是唯一的,這個(gè)唯一的戰(zhàn)略組合就是“重復(fù)剔除占優(yōu)均衡”。如果這樣的解存在,我們說該博弈是“重復(fù)剔除占優(yōu)可解的”。5、重復(fù)剔除嚴(yán)格劣戰(zhàn)略“重復(fù)剔除嚴(yán)格劣戰(zhàn)略”的思路:首先找連續(xù)排除劣勢策略兩者都沒有占優(yōu)策略,怎么辦?Player2Player1100,10090,11050,120110,4080,8045,50120,3050,3540,40StrategyABCabc連續(xù)排除劣勢策略兩者都沒有占優(yōu)策略,怎么辦?Player2連續(xù)排除劣勢策略(續(xù))兩者都沒有占優(yōu)策略,怎么辦?Player2Player190,11050,12050,3540,40

80,8045,50

50,3540,40連續(xù)排除劣勢策略(續(xù))兩者都沒有占優(yōu)策略,怎么辦?Playe普林斯頓大學(xué)的一道習(xí)題題目:如果給你兩個(gè)師的兵力,由你來當(dāng)“司令”,任務(wù)是攻克“敵人”占據(jù)的一座城市而敵軍的守備力量是三個(gè)師,規(guī)定雙方的兵力只能整師調(diào)動(dòng)。通往城市的道路只有甲乙兩條。當(dāng)你發(fā)起攻擊的時(shí)候,你的兵力超過敵人,你就獲勝;你的兵力比敵人的守備兵力少或者相等,你就失敗。那么,你將如何制定攻城方案?普林斯頓大學(xué)的一道習(xí)題6、重復(fù)博弈“囚徒的困境”暗含有一次性博弈假定,結(jié)果陷入了個(gè)體理性決策導(dǎo)致集體非理性結(jié)果的困境?,F(xiàn)在我們改變假定條件,討論博弈可以多次進(jìn)行的重復(fù)博弈(RepeatedGame)。如,囚徒困境博弈中,假定博弈或重復(fù)多次,A對(duì)B宣布如下方針:我將選擇沉默,并要求你也如此來增進(jìn)各自利益;然而,如果你半途背叛選擇坦白,我從下一階段游戲開始便一直采取坦白。這一方針與A利益一致,因而是可信的。6、重復(fù)博弈“囚徒的困境”暗含有一次性博弈假定,結(jié)果陷入了個(gè)重復(fù)博弈中,聲譽(yù)(名聲)十分重要從B角度來看,和A合作可在每階段得到較好結(jié)果;中途變卦,固然當(dāng)期可得更好結(jié)果,但此后便每次面臨更壞的后果,顯然是不利的。因而,重復(fù)性博弈中,“沉默+沉默”點(diǎn)可能成為對(duì)雙方最佳選擇,因而成為納什均衡點(diǎn)?!捎诓┺臈l件由一次性變?yōu)橹貜?fù)性,均衡狀態(tài)隨之發(fā)生變化。欺騙一次對(duì)方就會(huì)警覺,導(dǎo)致合作失敗。在重復(fù)博弈中,名聲對(duì)得出什么樣的結(jié)果十分重要。重復(fù)博弈中,聲譽(yù)(名聲)十分重要從B角度來看,和A合作可在每7、混合策略博弈---警察與小偷某警察負(fù)責(zé)A、B兩地治安,兩地相隔較遠(yuǎn),他每晚只能去一個(gè)地方巡邏,該地區(qū)有一小偷,他每晚也只能選擇偷一個(gè)地方,A地財(cái)產(chǎn)價(jià)格2萬元,B地財(cái)產(chǎn)價(jià)格1萬元,若警察選A地巡邏,而小偷也選擇去了A地,則會(huì)放棄偷竊,警察保全了3萬元財(cái)產(chǎn);若警察選擇A巡邏,小偷去了B地,則B地財(cái)產(chǎn)被盜。問:警察如何巡邏效果最好?策略1:警察只對(duì)A巡邏,這樣可保住2萬元的財(cái)產(chǎn)不被竊。

這個(gè)做法是最優(yōu)的嗎?有沒有改進(jìn)的措施?改進(jìn)策略:既去A地,又去B地。那么去A地多少次,B地多少次最優(yōu)?7、混合策略博弈---警察與小偷策略1:警察只對(duì)A巡邏,這樣小偷警察盜竊A地盜竊B地巡邏A地(3,0)(2,1)巡邏B地(1,2)(3,0)對(duì)上例,警察的最好做法是:通過擲骰子決定去A地還是B地,1/3的機(jī)會(huì)去B地,2/3的機(jī)會(huì)去A地。(對(duì)6個(gè)面的骰子,1-4點(diǎn)去A地,5、6點(diǎn)去B地。)對(duì)小偷也是如此,擲骰子來決定是偷什么地方,只是1-4點(diǎn)去B地,5、6點(diǎn)去A地。小偷盜竊A地盜竊B地巡邏A地(3警察和小偷的損益分析:警察到A地時(shí),小偷有1/3機(jī)會(huì)到A,2/3機(jī)會(huì)去B,此時(shí)警察得益:同理警察到B地時(shí),得益也為7/3。由于警察到A的可能為2/3,到B的可能為1/3,其總得益為:可以看出警察的總得益大于2,該策略優(yōu)于只巡邏A的策略1。小偷的得益有什么改變呢?(2/3)警察和小偷的損益分析:該博弈為零和博弈(一方之所得,即為另一方之所失),只有混和策略均衡點(diǎn),不會(huì)有純策略的納什均衡點(diǎn)。警察與小偷博弈如同剪刀-石頭-布游戲,或猜拳游戲,是混合策略博弈,參與者在多種備選策略中隨機(jī)選擇。在這樣的游戲中,不存在純策略均衡(不能選擇單一策略),對(duì)每個(gè)人來說,出剪刀、布、還是石頭的策略應(yīng)當(dāng)是隨機(jī)的,不能讓對(duì)方知道自己的策略,哪怕是策略的“傾向性”,如果對(duì)方知道你出哪一個(gè)策略的可能性較大,你在游戲中輸?shù)目赡苄跃驮龃?。該博弈為零和博弈(一方之所得,即為另一方之所失)?、言語博弈:威脅和承諾為了在博弈中獲得對(duì)已有利的結(jié)果,往往會(huì)產(chǎn)生“威脅”和“承諾”的行為。語言哲學(xué)認(rèn)為,語言就是行動(dòng)。言語博弈涉及:聲稱的策略和實(shí)際的策略?,F(xiàn)實(shí)中,各國的外交聲明,企業(yè)發(fā)出的威脅等。伊拉克對(duì)美國:如果你打我們,我就使用大規(guī)模殺傷性武器。臺(tái)灣問題:美國聲稱,如果中國武力攻打臺(tái)灣,美國將介入。中國聲稱,是否收回臺(tái)灣是中國內(nèi)政,中國原來的不率先使用核武器的聲明在國內(nèi)戰(zhàn)爭中不適用,溫家寶的“不惜一切代價(jià)”。中國“不首先使用核武器”的承諾。8、言語博弈:威脅和承諾為了在博弈中獲得對(duì)已有利的結(jié)果,往往阻止市場進(jìn)入的威脅

公司之間經(jīng)常相互發(fā)出信號(hào)以表明他們的意圖、動(dòng)機(jī)和目標(biāo)。有些信號(hào)是威脅性的。只有威脅變得可信時(shí)才會(huì)生效。假定在一個(gè)市場中,某企業(yè)是市場壟斷者?,F(xiàn)在有另一企業(yè)作為潛在的競爭者,試圖進(jìn)入這個(gè)市場。對(duì)壟斷者來說,會(huì)設(shè)法阻止?jié)撛诟偁幷叩倪M(jìn)入。在這個(gè)博弈中,潛在競爭者有兩種策略可以選擇,即進(jìn)入或不進(jìn)入;壟斷者也有兩種策略,或者與進(jìn)入者打一場價(jià)格戰(zhàn),或者默許它的進(jìn)入。該博弈的策略選擇順序是:首先由潛在進(jìn)入者作出進(jìn)入市場或不進(jìn)入市場的選擇,然后再由壟斷者來決定是默許它的進(jìn)入還是與進(jìn)入者進(jìn)行一場價(jià)格戰(zhàn)。這個(gè)博弈的得益矩陣如表所示。阻止市場進(jìn)入的威脅公司之間經(jīng)常相互發(fā)出信號(hào)以表明他們的意圖

上述博弈有兩個(gè)納什均衡點(diǎn)(紅、藍(lán)),但由于是動(dòng)態(tài)博弈,(價(jià)格戰(zhàn),不進(jìn)入)被淘汰,動(dòng)態(tài)博弈的均衡----子博弈精練納什均衡得以實(shí)現(xiàn)。(澤爾騰的貢獻(xiàn))

壟斷者能阻止市場進(jìn)入嗎?一種策略是,壟斷者對(duì)潛在進(jìn)入者進(jìn)行威脅?!叭绻氵M(jìn)入市場,我將采取價(jià)格戰(zhàn)的策略?!?/p>

但面對(duì)如上表的得益矩陣,壟斷者的威脅是不可信的。潛在進(jìn)入者認(rèn)為一旦進(jìn)入發(fā)生,壟斷者并不會(huì)選擇商戰(zhàn)的策略,而只會(huì)默許它的進(jìn)入。因此,壟斷者的這種聲明并不能達(dá)到它阻止進(jìn)入的目的,進(jìn)入者仍然會(huì)進(jìn)入市場。這種威脅被稱為空頭威脅壟斷者價(jià)格戰(zhàn)不打價(jià)格戰(zhàn)進(jìn)入潛在進(jìn)入者不進(jìn)入-200,600900,1100

0,30000,3000

上述博弈有兩個(gè)納什均衡點(diǎn)(紅、藍(lán)),但由于是動(dòng)態(tài)博弈承諾與可信性

承諾,是指對(duì)局者所采取的某種行動(dòng),這種行動(dòng)使其威脅成為一種令人可信的威脅。與承諾行動(dòng)相比,空頭威脅無法有效阻止市場進(jìn)入的主要原因是,它不需要任何成本。阻止市場進(jìn)入的有效承諾就是就是通過投資來形成一部分剩余的生產(chǎn)能力。這部分生產(chǎn)能力在沒有其他企業(yè)進(jìn)入市場的時(shí)候是多余的,但在進(jìn)入發(fā)生時(shí)則成為其低價(jià)競爭的有力武器。承諾與可信性承諾,是指對(duì)局者所采取的某種行動(dòng),這種行動(dòng)使其生產(chǎn)能力的擴(kuò)大需要額外的投入,我們假定壟斷者需要投資800萬元來實(shí)行這個(gè)承諾。這一投資將改變博弈的得益矩陣,新的得益矩陣如下表。表實(shí)行承諾后的阻止市場進(jìn)入博弈承諾能夠阻止市場進(jìn)入的關(guān)鍵在于它是可信的。擴(kuò)大投資需要花費(fèi)較大的代價(jià),但在某些情況下,只要承諾是可信的,其代價(jià)反而可能會(huì)小。壟斷者價(jià)格戰(zhàn)默許進(jìn)入潛在進(jìn)入者不進(jìn)入-400,400900,3000,22000,2200生產(chǎn)能力的擴(kuò)大需要額外的投入,我們假定壟斷者需要投資800萬博弈論簡介博弈論簡介411、博弈論簡介至今沒有一個(gè)理想的模型可以解釋形形色色的寡頭壟斷市場,現(xiàn)有工具內(nèi)不能完全解釋寡頭市場或總結(jié)出所謂的主要規(guī)律。為此,人們發(fā)展出了新的工具,博弈論。博弈論(GameTheory)又名對(duì)策論,游戲論失火了,屋里人很多,你往哪個(gè)門跑—這就是博弈你的行動(dòng)結(jié)果不僅取決于你的策略選擇,同時(shí)也取決于他人的策略選擇。它研究個(gè)體或組織之間存在利益沖突情況下如何進(jìn)行最優(yōu)決策。1、博弈論簡介至今沒有一個(gè)理想的模型可以解釋形形色色的寡頭壟博弈論是50年代數(shù)學(xué)家馮·諾依曼和經(jīng)濟(jì)學(xué)家奧斯卡·摩根斯坦首先提出的。在經(jīng)濟(jì)學(xué)、政治學(xué)、社會(huì)學(xué)獲得了巨大的應(yīng)用。1994年諾貝爾經(jīng)濟(jì)學(xué)獎(jiǎng)?lì)C發(fā)給了3位博弈論專家:納什、澤爾騰、哈桑尼。博弈論是關(guān)于社會(huì),而不是關(guān)于自然的。中國人研究博弈論是有優(yōu)勢的《三國演義》、《孫子兵法》、《三十六計(jì)》、《厚黑學(xué)》都是博弈論教材,如何在人與人的博弈中取得成功。博弈論是50年代數(shù)學(xué)家馮·諾依曼和經(jīng)濟(jì)學(xué)家奧斯卡·摩根斯坦首

1994年諾貝爾經(jīng)濟(jì)學(xué)獎(jiǎng)獲得者:美國數(shù)學(xué)家JohnF.Nash;德國經(jīng)濟(jì)學(xué)家ReinhardSelten;美籍匈牙利經(jīng)濟(jì)學(xué)家JohnC.Harsanyi。

1928年Nash出生于美國,1950年獲Princeton大學(xué)數(shù)學(xué)博士學(xué)位,曾先后任教于MIT和Princeton大學(xué)。其博士論文《非合作博弈》首次區(qū)分了合作博弈與非合作博弈,并且提出了非合作博弈的納什均衡概念。后來人們發(fā)現(xiàn),早在1938年法國數(shù)學(xué)家和經(jīng)濟(jì)學(xué)家古諾(Cournot)關(guān)于雙頭壟斷(oligapoly)的著作中,曾提出Nash均衡的觀念。2002年《美麗心靈》獲多項(xiàng)奧斯卡獎(jiǎng)。1994年諾貝爾經(jīng)濟(jì)學(xué)獎(jiǎng)獲得者:1928年N1930年Selten出生于現(xiàn)屬于波蘭的德國城市,1961年獲法蘭克福大學(xué)數(shù)學(xué)博士學(xué)位,曾先后任教于柏林自由大學(xué)、比勒菲爾特大學(xué)和波恩大學(xué)。Selten的主要貢獻(xiàn)是首次對(duì)分析動(dòng)態(tài)策略交互作用深化了Nash均衡的概念。1920年Harsanyi出生于匈牙利,1947年獲布達(dá)佩斯大學(xué)博士學(xué)位,后逃亡澳大利亞,再到美國,1954年獲斯坦福大學(xué)博士學(xué)位,曾先后任教于澳大利亞國立大學(xué)、加州伯克利分校。于2000年去世。Harsanyi研究和分析了不完全信息博弈,從而為信息經(jīng)濟(jì)學(xué)提供了一個(gè)理論基礎(chǔ)。1930年Selten出生于現(xiàn)屬于波蘭的1996年,兩位將博弈論應(yīng)用于不對(duì)稱信息下機(jī)制設(shè)計(jì)的經(jīng)濟(jì)學(xué)家莫里斯(Mirrlees)和維克里(Vickrey)獲諾貝爾經(jīng)濟(jì)學(xué)獎(jiǎng)。2001年三位經(jīng)濟(jì)學(xué)家阿克洛夫(Akerlof)、斯蒂格利茨(Stiglitz)和斯賓塞(Spence)因運(yùn)用博弈論研究信息經(jīng)濟(jì)學(xué)所取得的成就而成為該年度的諾貝爾經(jīng)濟(jì)學(xué)獎(jiǎng)得主。1996年,兩位將博弈論應(yīng)用于不對(duì)稱信息下機(jī)制設(shè)計(jì)的經(jīng)濟(jì)學(xué)家博弈的規(guī)則或研究框架(1)博弈參與者(player),博弈論分析假定參與者都是理性的(追求個(gè)人利益最大化)。(2)策略空間,博弈參與者必須知道他自己及其對(duì)手的策略(strategy)或行動(dòng)選擇范圍。(3)決策行為結(jié)果。博弈論用數(shù)字表示這類結(jié)果(可評(píng)價(jià)優(yōu)劣高下),并稱之為收益(payoff、支付)。博弈的規(guī)則或研究框架博弈的分類一、靜態(tài)博弈與動(dòng)態(tài)博弈

參與者行動(dòng)的先后順序,靜態(tài)博弈是同時(shí)作出決策(不了解對(duì)手的決策方案),動(dòng)態(tài)博弈是參與者先后作出決策(后行動(dòng)的人知道先行動(dòng)者的行動(dòng)方案)。二、完全信息博弈與不完全信息博弈

對(duì)其他參與者收益支付信息的掌握程度。不完全信息博弈中至少有一人不能確切了解其它決策者收益函數(shù)。三、合作博弈與非合作博弈

能否達(dá)成一個(gè)有約束力的協(xié)議,合作博弈強(qiáng)調(diào)集體理性。(經(jīng)濟(jì)學(xué)主要討論非合作博弈)四、一次性博弈與重復(fù)博弈

博弈重復(fù)多次進(jìn)行。(注意區(qū)分動(dòng)態(tài)博弈)博弈的分類一、靜態(tài)博弈與動(dòng)態(tài)博弈博弈的分類博弈的分類

嚴(yán)格地講,博弈論并不是經(jīng)濟(jì)學(xué)的一個(gè)分支,它是一種方法,應(yīng)用范圍除經(jīng)濟(jì)學(xué)外,還包括政治學(xué)、軍事學(xué)、外交學(xué)、國際關(guān)系學(xué)、犯罪學(xué)等。但為何博弈論受到經(jīng)濟(jì)學(xué)的重視呢?主要原因有:⑴博弈論在經(jīng)濟(jì)學(xué)中得到最廣泛、最成功的應(yīng)用,尤其在寡頭市場理論中得到直接的應(yīng)用。⑵博弈論的許多成果也是借助于經(jīng)濟(jì)學(xué)的例子來發(fā)展的,經(jīng)濟(jì)學(xué)家對(duì)博弈論的貢獻(xiàn)最大。⑶博弈論與經(jīng)濟(jì)學(xué)的研究模式一樣:理性人在給定約束條件追求自己的效用最大化。由于上述原因博弈論逐漸成為主流經(jīng)濟(jì)學(xué)最重要的組成部分。嚴(yán)格地講,博弈論并不是經(jīng)濟(jì)學(xué)的一個(gè)分支,它是2、博弈論基本模型囚徒困境(完全信息靜態(tài)博弈)(A、B共同犯罪被抓,警察分開審問)

BA坦白不坦白A=10年A=25年B=10年B=1年A=1年A=3年B=25年B=3年坦白不坦白每一個(gè)人的結(jié)局不僅取決于自身的選擇,同時(shí)也取決于對(duì)手的選擇不管B坦白不坦白,我坦白總是會(huì)少坐一些牢2、博弈論基本模型囚徒困境(完全信息靜態(tài)博弈)坦白不坦白每一囚徒困境(完全信息下的靜態(tài)博弈)“囚徒的困境(Prisoners’Dilemma)”,從博弈論角度看,這是一個(gè)存在占優(yōu)均衡的博弈:因?yàn)閷?duì)囚犯A,B來說,無論對(duì)方如何選擇,“坦白”都是各自的最優(yōu)選擇。雖然從兩名囚犯共同利益看,最好的選擇是合作,即同時(shí)選擇保持沉默,然而,由于猜忌,試圖獲得更大好處等競爭性動(dòng)機(jī)阻礙了它們達(dá)到更好的互利選擇,我們將看到,寡頭壟斷廠商經(jīng)常面臨類似的困境。啟示:個(gè)體理性決策常導(dǎo)致集體非理性結(jié)果囚徒困境(完全信息下的靜態(tài)博弈)“囚徒的困境(Prisone實(shí)例:投標(biāo)(總工程量50,賄賂成本5,甲乙雙方實(shí)力相當(dāng))甲賄賂不賄賂

賄賂不賄賂20200454502525均衡:(賄賂,賄賂)乙實(shí)例:投標(biāo)(總工程量50,賄賂成本5,甲乙雙方實(shí)力相當(dāng))智豬博弈背景:在一個(gè)豬圈里住著一大一小兩頭豬。它們從同一個(gè)食槽中獲得食物。但食槽的按鈕與食物的出口分布在相反的兩端。每按一次按鈕,可得10個(gè)單位食物,但需付出2個(gè)單位勞動(dòng)。規(guī)則:若大豬按按鈕:大豬吃6個(gè)單位,小豬吃4個(gè)單位;若小豬按按鈕:大豬吃9個(gè)單位,小豬吃1個(gè)單位;若一起去按:大豬吃7個(gè)單位,小豬吃3個(gè)單位;問題:哪頭豬將會(huì)去按按鈕?

小豬按等待按5,14,4等待9,-10,0大豬智豬博弈背景:在一個(gè)豬圈里住著一大一小兩頭豬。它們從同一個(gè)食市場中大企業(yè)與小企業(yè)的關(guān)系就類似于智豬博弈,大企業(yè)進(jìn)行研究開發(fā),為新產(chǎn)品做廣告,而對(duì)小企業(yè)來說,這些工作可能得不償失,因此,小企業(yè)就將精力放在模仿上,或等大企業(yè)用廣告打開市場以后再出售廉價(jià)產(chǎn)品。股份公司治理中的小股東、股市中的信息收集智豬博弈結(jié)果:多勞不多得市場中大企業(yè)與小企業(yè)的關(guān)系就類似于智豬博弈,大企業(yè)進(jìn)斗雞博弈假設(shè)兩只公雞遇到一起,每只公雞都有兩個(gè)行動(dòng)選擇:進(jìn)攻或后退。后退是很丟面子的事情,若雞甲進(jìn)攻,乙后退,則甲贏。雙方前進(jìn),兩敗俱傷。

雞乙進(jìn)退

雞甲進(jìn)-4,-41,-1退-1,1-1,-1雙方都沒有占優(yōu)策略存在兩個(gè)穩(wěn)定的狀態(tài)(納什均衡):(-1,1);(1,-1)斗雞博弈假設(shè)兩只公雞遇到一起,每只公雞都有兩個(gè)行動(dòng)選擇:進(jìn)攻雙方都避免兩敗俱傷,斗雞博弈有兩個(gè)納什均衡,一方前進(jìn),另一方后退。由于有兩個(gè)均衡點(diǎn),結(jié)果無法預(yù)知。20世紀(jì)60年代蘇美間的古巴導(dǎo)彈危機(jī)就是一個(gè)斗雞博弈的很好例子。古巴導(dǎo)彈危機(jī)是冷戰(zhàn)時(shí)期蘇美之間最嚴(yán)重的一次危機(jī),赫魯曉夫1962年偷偷將導(dǎo)彈運(yùn)到古巴對(duì)付美國,被美國U2飛機(jī)偵察到,美國派出攜帶核武器的戰(zhàn)機(jī)、航母,威脅蘇聯(lián)限期從古巴撤出導(dǎo)彈。蘇美這兩只大公雞均在考慮進(jìn)還是退?戰(zhàn)爭的結(jié)果當(dāng)然是兩敗俱傷,但任何一方退下來則是很不光彩的事。博弈結(jié)果是蘇聯(lián)從古巴撤回了導(dǎo)彈,做了丟面子的“撤退的雞”,而美國堅(jiān)持了自己的策略,做了“不退的雞”。當(dāng)然為了給蘇聯(lián)面子,同時(shí)也擔(dān)心戰(zhàn)爭,美國也從土耳其撤了一些導(dǎo)彈。雙方都避免兩敗俱傷,斗雞博弈有兩個(gè)納什均衡,一方前進(jìn)例:兩個(gè)寡頭進(jìn)行價(jià)格戰(zhàn)博弈的收益矩陣。

博弈論中的均衡是一組穩(wěn)定的博弈結(jié)果。雙方均不愿先改變策略。博弈的均衡是穩(wěn)定的,因而是可以預(yù)測的。10,1050,50-50,100100,-50低價(jià)低價(jià)高價(jià)高價(jià)廠商B廠商A3、博弈論中的均衡例:兩個(gè)寡頭進(jìn)行價(jià)格戰(zhàn)博弈的收益矩陣。10,1050,50占優(yōu)策略,又稱支配性策略(dominantstrategy)此類博弈中存在一種策略,無論B選擇何行動(dòng),該策略對(duì)A都是最優(yōu),則稱此策略為博弈者A的占優(yōu)策略。在本例中,廠商A和廠商B都有不受他人策略影響的占優(yōu)策略,即選擇低價(jià)。占優(yōu)均衡,支配均衡每個(gè)參與者都有并都選擇占優(yōu)策略,由此實(shí)現(xiàn)的均衡稱占優(yōu)均衡。本例為(10,10)。占優(yōu)均衡占優(yōu)策略,又稱支配性策略(dominantstrategy納什均衡納什均衡(非合作性均衡):納什均衡是這樣一組策略,它使所有博弈參與者都不能再提高其收益的狀況。此時(shí),雙方在對(duì)方給定的策略下均不愿意調(diào)整自己的策略。下例中,A有占優(yōu)策略即正常價(jià)格策略,而廠商B沒有占優(yōu)策略,它必須根據(jù)A的占優(yōu)策略來確定其戰(zhàn)略選擇,即其選擇受A的選擇的影響。100,20010,10150,-30-20,150高價(jià)格正常價(jià)格廠商B廠商A高價(jià)格正常價(jià)格納什均衡納什均衡(非合作性均衡):100,20010,101多個(gè)均衡和沒有均衡一個(gè)博弈可能有好幾個(gè)納什均衡(即幾組穩(wěn)定并且自我堅(jiān)持的策略),有時(shí)又可能不存在(純策略的)納什均衡。甲表存在兩個(gè)納什均衡:其中“上,左”是納什均衡(A選上,則B選左;且B選左時(shí)A仍應(yīng)選上);“下,右”也是納什均衡(A選下,則B選右;且B選右時(shí)A仍應(yīng)選下)。如某個(gè)博弈只有一個(gè)納什均衡點(diǎn),這個(gè)博弈的結(jié)果是可以預(yù)測的,如有兩個(gè)或以上的納什均衡點(diǎn),則博弈結(jié)果無法預(yù)測。乙表沒有納什均衡。如A選“上”,B則選“左”;然而當(dāng)B選“左”時(shí),A卻應(yīng)當(dāng)選“下”。反之,A選“下”時(shí),B應(yīng)選“右”;然而當(dāng)B選右時(shí),A又應(yīng)選“上”。沒有均衡點(diǎn)。2,11,20,00,0左上右下局中人B局中人A0,0-1,31,00,-1左上右下局中人B局中人A(甲)(乙)多個(gè)均衡和沒有均衡一個(gè)博弈可能有好幾個(gè)納什均衡(即幾組穩(wěn)定并占優(yōu)均衡與納什均衡的區(qū)別

占優(yōu)均衡:我所做的是:不管你做什么我所能做的最好的。

你所做的是:不管我做什么你所能做的最好的。納什均衡:我所做的是:給定你所做的我所能做的最好的。你所做的是:給定我所做的你所能做的最好的。占優(yōu)均衡是納什均衡的一個(gè)特例占優(yōu)均衡與納什均衡的區(qū)別占優(yōu)均衡:我所做的是:不管你做4、最大最小策略迄今為止,對(duì)廠商行為的分析都建立在利潤最大化基礎(chǔ)上。但在一些競爭激烈的寡頭壟斷市場,馮·諾依曼和摩根斯坦認(rèn)為決策者也可能采取一種風(fēng)險(xiǎn)厭惡策略。即確保在最壞的結(jié)果中得到最好的結(jié)果。這種決策規(guī)則稱最大最小策略(MaximinStrategy):博弈者在可能最少的利潤方案中選擇利潤最大的方案。4、最大最小策略迄今為止,對(duì)廠商行為的分析都建立在利潤最大化如果企業(yè)謀求利潤最大化,將有兩個(gè)納什均衡,一家企業(yè)投資推出新產(chǎn)品,另一家企業(yè)不投資產(chǎn)品。最大最小策略,不是利潤最大化策略,準(zhǔn)確說,它是用來避免十分不利結(jié)果的。對(duì)企業(yè)1來說,如果它不投資新產(chǎn)品,利潤最小是300萬,如果它投資,利潤最小是200萬。對(duì)企業(yè)2數(shù)字也相同。兩家企業(yè)都在最小利潤中選最大值。結(jié)果是兩家企業(yè)都不投資新產(chǎn)品。因?yàn)檫@樣的策略能保證至少獲得300萬利潤。戰(zhàn)略不投資投資投資4,43,66,32,2廠商1廠商2不投資雙寡頭企業(yè)都在考慮是否投資推出新產(chǎn)品。如果企業(yè)謀求利潤最大化,將有兩個(gè)納什均衡,一家企業(yè)投資最大最小策略的結(jié)果并不是兩種納什均衡中的一種。原因是這種決策所用的準(zhǔn)則,不是利潤最大化,而是避免虧損過多。不同的決策目標(biāo)可能導(dǎo)致人們選擇不同的策略,最終導(dǎo)致不同的博弈結(jié)果。最大最小策略的結(jié)果并不是兩種納什均衡中的一種。5、重復(fù)剔除嚴(yán)格劣戰(zhàn)略“重復(fù)剔除嚴(yán)格劣戰(zhàn)略”的思路:首先找出博弈參與人的劣戰(zhàn)略(dominatedstrategy)(假定存在的話),把這個(gè)劣戰(zhàn)略剔除后,剩下的是一個(gè)不包含已剔除劣戰(zhàn)略的新的博弈;然后在剔除這個(gè)新的博弈中的劣戰(zhàn)略;繼續(xù)這個(gè)過程,直到?jīng)]有劣戰(zhàn)略存在。如果剩下的戰(zhàn)略組合是唯一的,這個(gè)唯一的戰(zhàn)略組合就是“重復(fù)剔除占優(yōu)均衡”。如果這樣的解存在,我們說該博弈是“重復(fù)剔除占優(yōu)可解的”。5、重復(fù)剔除嚴(yán)格劣戰(zhàn)略“重復(fù)剔除嚴(yán)格劣戰(zhàn)略”的思路:首先找連續(xù)排除劣勢策略兩者都沒有占優(yōu)策略,怎么辦?Player2Player1100,10090,11050,120110,4080,8045,50120,3050,3540,40StrategyABCabc連續(xù)排除劣勢策略兩者都沒有占優(yōu)策略,怎么辦?Player2連續(xù)排除劣勢策略(續(xù))兩者都沒有占優(yōu)策略,怎么辦?Player2Player190,11050,12050,3540,40

80,8045,50

50,3540,40連續(xù)排除劣勢策略(續(xù))兩者都沒有占優(yōu)策略,怎么辦?Playe普林斯頓大學(xué)的一道習(xí)題題目:如果給你兩個(gè)師的兵力,由你來當(dāng)“司令”,任務(wù)是攻克“敵人”占據(jù)的一座城市而敵軍的守備力量是三個(gè)師,規(guī)定雙方的兵力只能整師調(diào)動(dòng)。通往城市的道路只有甲乙兩條。當(dāng)你發(fā)起攻擊的時(shí)候,你的兵力超過敵人,你就獲勝;你的兵力比敵人的守備兵力少或者相等,你就失敗。那么,你將如何制定攻城方案?普林斯頓大學(xué)的一道習(xí)題6、重復(fù)博弈“囚徒的困境”暗含有一次性博弈假定,結(jié)果陷入了個(gè)體理性決策導(dǎo)致集體非理性結(jié)果的困境?,F(xiàn)在我們改變假定條件,討論博弈可以多次進(jìn)行的重復(fù)博弈(RepeatedGame)。如,囚徒困境博弈中,假定博弈或重復(fù)多次,A對(duì)B宣布如下方針:我將選擇沉默,并要求你也如此來增進(jìn)各自利益;然而,如果你半途背叛選擇坦白,我從下一階段游戲開始便一直采取坦白。這一方針與A利益一致,因而是可信的。6、重復(fù)博弈“囚徒的困境”暗含有一次性博弈假定,結(jié)果陷入了個(gè)重復(fù)博弈中,聲譽(yù)(名聲)十分重要從B角度來看,和A合作可在每階段得到較好結(jié)果;中途變卦,固然當(dāng)期可得更好結(jié)果,但此后便每次面臨更壞的后果,顯然是不利的。因而,重復(fù)性博弈中,“沉默+沉默”點(diǎn)可能成為對(duì)雙方最佳選擇,因而成為納什均衡點(diǎn)?!捎诓┺臈l件由一次性變?yōu)橹貜?fù)性,均衡狀態(tài)隨之發(fā)生變化。欺騙一次對(duì)方就會(huì)警覺,導(dǎo)致合作失敗。在重復(fù)博弈中,名聲對(duì)得出什么樣的結(jié)果十分重要。重復(fù)博弈中,聲譽(yù)(名聲)十分重要從B角度來看,和A合作可在每7、混合策略博弈---警察與小偷某警察負(fù)責(zé)A、B兩地治安,兩地相隔較遠(yuǎn),他每晚只能去一個(gè)地方巡邏,該地區(qū)有一小偷,他每晚也只能選擇偷一個(gè)地方,A地財(cái)產(chǎn)價(jià)格2萬元,B地財(cái)產(chǎn)價(jià)格1萬元,若警察選A地巡邏,而小偷也選擇去了A地,則會(huì)放棄偷竊,警察保全了3萬元財(cái)產(chǎn);若警察選擇A巡邏,小偷去了B地,則B地財(cái)產(chǎn)被盜。問:警察如何巡邏效果最好?策略1:警察只對(duì)A巡邏,這樣可保住2萬元的財(cái)產(chǎn)不被竊。

這個(gè)做法是最優(yōu)的嗎?有沒有改進(jìn)的措施?改進(jìn)策略:既去A地,又去B地。那么去A地多少次,B地多少次最優(yōu)?7、混合策略博弈---警察與小偷策略1:警察只對(duì)A巡邏,這樣小偷警察盜竊A地盜竊B地巡邏A地(3,0)(2,1)巡邏B地(1,2)(3,0)對(duì)上例,警察的最好做法是:通過擲骰子決定去A地還是B地,1/3的機(jī)會(huì)去B地,2/3的機(jī)會(huì)去A地。(對(duì)6個(gè)面的骰子,1-4點(diǎn)去A地,5、6點(diǎn)去B地。)對(duì)小偷也是如此,擲骰子來決定是偷什么地方,只是1-4點(diǎn)去B地,5、6點(diǎn)去A地。小偷盜竊A地盜竊B地巡邏A地(3警察和小偷的損益分析:警察到A地時(shí),小偷有1/3機(jī)會(huì)到A,2/3機(jī)會(huì)去B,此時(shí)警察得益:同理警察到B地時(shí),得

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請(qǐng)下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請(qǐng)聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會(huì)有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫網(wǎng)僅提供信息存儲(chǔ)空間,僅對(duì)用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對(duì)用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對(duì)任何下載內(nèi)容負(fù)責(zé)。
  • 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請(qǐng)與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶因使用這些下載資源對(duì)自己和他人造成任何形式的傷害或損失。

最新文檔

評(píng)論

0/150

提交評(píng)論