Chapter1 Static Games of Complete Information(博弈論-浙江大學(xué))_第1頁
Chapter1 Static Games of Complete Information(博弈論-浙江大學(xué))_第2頁
Chapter1 Static Games of Complete Information(博弈論-浙江大學(xué))_第3頁
Chapter1 Static Games of Complete Information(博弈論-浙江大學(xué))_第4頁
Chapter1 Static Games of Complete Information(博弈論-浙江大學(xué))_第5頁
已閱讀5頁,還剩97頁未讀, 繼續(xù)免費閱讀

下載本文檔

版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進行舉報或認(rèn)領(lǐng)

文檔簡介

Chapter1完全信息靜態(tài)博弈StaticGamesofCompleteInformationInthischapterweconsidergamesofthefollowingsimpleform:first,theplayerssimultaneouslychooseactions;then,theplayersreceivepayoffsthatdependonthecombinationofactionsjustchosen.Withintheclassofsuchstatic(orsimultaneous-move)games,werestrictattentiontogamesofcompleteinformation.That

iseachplayer’spayofffunction(thefunctionthatdeterminestheplayerspayofffromthecombinationofactionschosenbytheplayers)iscommonknowledgeamongalltheplayers.教材P21一、Normal-FormRepresentationofGamesandNashEquilibrium(一)Normal-FormRepresentationofGamesInthenormal-formrepresentationofagame,eachplayersimultaneouslychoosesastrategy,andthecombinationofstrategieschosenbytheplayersdeterminesapayoffforeachplayer.Weillustratethenormal-formrepresentationwithaclassicalexample—Theprisoners’Dilemma.*Twosuspectsarearrestedandchargedwithacrime.Thepolicelacksufficientevidencetoconvictthesuspects,unlessatleastoneconfesses.Thepoliceholdthesuspectsinseparatecellsandexplaintheconsequencesthatwillfollowfromtheactionstheycouldtake.Ifneitherconfessesthenbothwillbeconvictedofaminoroffenseandsentencedtooneyearinjail.Ifbothconfessthenbothwillbesentencedtojailfiveyears.Finally,ifoneconfessesbuttheotherdoesnot,thentheconfessorwillbereleasedimmediatelybuttheotherwillbesentencedtoeightyearsinjail—fiveforthecrimeandafurtherthreeforobstructingjustice(干擾司法)。囚徒2招認(rèn)沉默招認(rèn)–5,-50,-8囚徒1沉默-8,0-1,-1

囚徒的困境Wenowturntothegeneralcase.Thenormal-formrepresentationofagamespecifies:(1)theplayersinthegame;(2)thestrategiesavailabletoeachplayer;(3)thepayoffreceivedbyeachplayerforeachcombinationofstrategiesthatcouldbechosenbytheplayers.

Definition:Thenormal-formrepresentationofan-n-playergamespecifiestheplayers’strategyspacesS1,…,Snandtheirpayofffunctionsu1,…,un.WedenotethisgamebyG={S1,…,Sn;u1,…,un}.教材P22*理解完全信息靜態(tài)博弈時要注意事項1Althoughwestatedthatinanormal-formgametheplayerschoosetheirstrategiessimultaneously,thisdoesnotimplythatthepartiesnecessarilyactsimultaneously:itsufficesthateachchoosehisorheractionwithoutknowledgeoftheothers’choices,aswouldbethecase“theprisoners’dilemma”iftheprisonersreacheddecisionsatarbitrarytimes(在任意時間)whileintheirseparatecells.2Herewemayrecognize‘completeinformation’asthateachplayerknowthepayofffunctionsoftheothers.(二)Dominant-StrategyEquilibriumDefinitionInthenormal-formgameG={S1,…,Sn;u1,…,un},letsi'andsi"

befeasiblestrategiesforplayeri(i.e.,si'andsi"aremembersofSi

).Strategysi'isstrictlydominatedbystrategysi"ifforeachfeasiblecombinationoftheothers’strategies,i’spayofffromplayingsi'isstrictlylessthani’spayofffromplayingsi".i.e.:ui(s1,…,si-1,si*,si+1,…,sn)

<ui(s1,…,si-1,si**,si+1,…,sn)

(DS)foreachs-i=(s1,…,si-1,si+1,…,sn)thatcanbeconstructedfromtheotherplayers’strategySpacesS1,…,Si-1,Si+1,…,Sn.WATSONP551囚徒2招認(rèn)沉默招認(rèn)–5,-50,-8囚徒1沉默-8,0-1,-1

囚徒的困境策略“沉默”嚴(yán)格劣于策略“招認(rèn)”博弈分析的目的:預(yù)測博弈的均衡結(jié)果,即給定“每個參與人都是理性的”是共同知識,什么是每個參與人的最優(yōu)策略?什么是所有參與人的最優(yōu)策略組合?*肯定性(sure-thing)或替代性(substitution)公理:一個決策者在事件A發(fā)生的偏好選項1勝于選項2,并且在事件A不發(fā)生時也偏好選項1勝于選項2,那么就有,他在知道事件A無論是發(fā)生還是不發(fā)生之前都應(yīng)該偏好選項1勝于選項2。——“理性的參與人不會選擇嚴(yán)格劣策略”俗語:已不變應(yīng)萬變“重復(fù)剔除嚴(yán)格劣策略(iteratedeliminationofstrictlydominatedstrategies)”的思路:首先,找出某個參與人的嚴(yán)格劣策略,并把它從他的策略空間中剔除,重新構(gòu)造一個已不包含該嚴(yán)格劣策略的博弈;其次,剔除新博弈中某個參與人的嚴(yán)格劣策略;重復(fù)上述過程,直到只剩下唯一的策略組合。——我們認(rèn)為這個唯一所剩的策略組合是穩(wěn)定的。P24DefinitionInanormal-formgame,ifforeachplayeri,si"isi’sdominantstrategy,thanwecallthestrategiesprofile(s1″,…,sn"

)the‘dominant-strategyequilibrium’.參與人2左中右上1,01,20,1參與人1下0,30,12,0策略組合(上,中)是均衡結(jié)局,將實現(xiàn)支付(1,2)。第一第二第三

參與人2左中右上0,44,05,3參與人1中4,00,45,3下3,53,56,6每個參與人都不存在嚴(yán)格劣策略(三)納什均衡

DefinitionInthen-playernormal-formgameG={S1,…,Sn;u1,…,un},thestrategies(s1*…,sn*)areaNashequilibriumif,foreachplayeri,si*is(atleasttiedfor(至少不劣于))playeri’sbestresponsetothestrategiesspecifiedforthen-1otherplayers,(s1*…,sn-1*,sn+1*,…,sn*):

ui(s1*…,sn-1*,si*,

sn+1*,…,sn*)

≥ui(s1*…,sn-1*,si

,

sn+1*,…,sn*)……….(NE)

foreveryfeasiblestrategysiinSi;Thatis,si*solves

maxui(s1*…,sn-1*,si,

sn+1*,…,sn*).

si∈Si

上述均衡概念是1951年由數(shù)學(xué)家約翰·納什(JohnNash)首先解釋清楚的,所以將他所解釋的均衡稱為納什均衡。*對納什均衡的理解:

1Ifgametheoryistoprovideauniquesolutiontoagame-theoreticproblemthenthesolutionmustbeaNashequilibrium,inthefollowingsense.Supposethatgametheorymakesauniquepredictionaboutthestrategyeachplayerwillchoose.Inorderforthispredictiontobecorrect,itisnecessarythateachplayerbewillingtochoosethestrategypredictedbythetheory.Thuseachplayer’spredictedstrategymustbethatplayer’sbestresponsetothestrategiesoftheotherplayers.Suchapredictioncouldbecalled

strategicallystableorself-enforcing,becausenosingleplayerwantstodeviatefromhisorher

Predictedstrategy.WewillcallsuchapredictionaNashequilibrium.-----------------------------RobertGibbonsP82是這樣的一種穩(wěn)定的策略組合:當(dāng)所有參與人的選擇公開以后,每個人都滿意自己作出了正確的選擇;沒有人能得到更好的結(jié)果了。在博弈論中這種結(jié)果被稱為NE。3為了理解納什均衡的哲學(xué)含義,讓我們設(shè)想n個參與人在博弈之前協(xié)商達成一個協(xié)議,規(guī)定每一個參與人選擇一個特定的策略。我們要問的一個問題是,給定其他參與人都遵守這個協(xié)議,在沒有外在強制的情況下,是否有任何人有積極性不遵守這個協(xié)議?顯然,只有當(dāng)遵守協(xié)議帶來的效用大于不遵守協(xié)議時的效用,一個人才會遵守這個協(xié)議。如果沒有任何參與人有積極性不遵守這個協(xié)議,我們說這個協(xié)議是可以自動實施的(self-enforcing),這個協(xié)議就構(gòu)成一個納什均衡;否則,它就不是一個納什均衡。(張維迎,P68)4納什均衡是一種策略組合,使得每個參與人的策略是對其他參與人策略的最優(yōu)放應(yīng)。納什均衡是博弈將會如何進行的“一致”(consistent)預(yù)測,這意指,如果所有參與人預(yù)測特定納什均衡會出現(xiàn),那么沒有參與人有動力采用與均衡不同的行動。因此納什均衡(也只有納什均衡)能具有性質(zhì)使得參與人能預(yù)測到它,預(yù)測到他們的對手也會預(yù)測到它,如此繼續(xù)。與之相反,任何固定的非納什均衡如果出現(xiàn)就意味著至少有一個參與人“犯了錯”,或者是對對手行動的預(yù)測上犯了錯,或者是(給定那種預(yù)測)在最大化自己的收益時犯了錯。(JeanTirole)P10納什均衡通過了一致預(yù)測檢驗并不就使得它們是好的預(yù)測,在一些博弈格局中如果認(rèn)為可以獲得精確預(yù)測那會過于輕率,由此我們想提請注意一個事實,博弈的最可能結(jié)果實際上取決于比標(biāo)準(zhǔn)式所提供的更多的信息。例如,可能希望知道參與人對于此類博弈具有多少經(jīng)驗,他們是否來自同一種文化因此而分縣分享關(guān)于博弈將會如何進行的特定期望,以及如此等等。(JeanTirole)P10-11Abrute-forceapproach(一個最直接的方法)tofindingagame’sNashequilibriumissimplytocheckwhethereachpossiblecombinationofstrategiessatisfiescondition(NE)inthedefinition.Inatwo-playergame,thisapproachbeginsasfollows:foreachplayer,andforeachfeasiblestrategyforthatplayer,determinetheotherplayer’sbestresponsetoeachofthatstrategy.……劃線法……畫箭頭法參與人2左中右上0,44,05,3參與人1中4,00,45,3下3,53,56,6每個參與人都不存在嚴(yán)格劣策略(下,右)是NE,將實現(xiàn)支付(6,6)囚徒2招認(rèn)沉默招認(rèn)–5,-50,-8囚徒1沉默-8,0-1,-1囚徒的困境(沉默,沉默)帕累托優(yōu)于(招認(rèn),招認(rèn))有一頭大豬和一頭小豬住在同一個豬圈里,豬圈的一側(cè)放者豬食槽,另一側(cè)安裝著一個控制食物供應(yīng)的按鈕。按一次按鈕,有8個單位的食物進槽,但需承擔(dān)2個單位的成本。偌大豬小豬同時到達豬食槽,大豬吃到5個單位的食物,小豬吃到3個單位的食物;若大豬先到,大豬吃7個單位的食物,小豬只能吃到1個單位;若小豬先到,小豬吃到4個單位食物,大豬也吃到4個單位食物。練習(xí):智豬博弈(boxedpigsgame)小豬去按等待去按3,12,4大豬等待7,-10,0大豬的收益外部化,小豬不勞而獲,免費搭了大豬的便車。請列舉“搭便車”的現(xiàn)象沖開水、搞衛(wèi)生;股市上莊家與散戶20世紀(jì)70年代末80年代初,美國市場上私人標(biāo)簽(privatelabel)的軟飲料價格便宜、質(zhì)量較差,因此占有較低的市場份額??煽诳蓸饭竞桶偈驴蓸饭咀畛跄苋萑踢@些私人標(biāo)簽飲料的存在,因為它們是小豬,威脅有限。可是沒過多久,一家主要的私人標(biāo)簽飲料供應(yīng)商Cott公司通過挑釁性的定價和較高的質(zhì)量,從擁有較低市場份額的地區(qū)品牌,成長為一個擁有三分之一市場份額的、旗鼓相當(dāng)?shù)母偁幷摺4藭r,可口可樂公司和百事可樂公司通過降低價格這種進攻性的行動,使私人標(biāo)簽軟飲料的市場份額立即瓦解了。小雞博弈(thegameofchicken)設(shè)想湯姆和吉米是兩個頑皮的小孩,他們在小伙伴的鼓動下要進行一場關(guān)于勇氣的比賽:兩人分別從一條獨木橋的兩端沖向?qū)Ψ?,誰退卻誰就是“小雞”。顯然,如果兩個人都向前沖,則兩敗俱傷,設(shè)支付水平為-2;如果一個勇進而另一個退卻,則勇進者受到小伙伴的歡呼,退卻者受到嘲諷,設(shè)支付分別為4和-1;若兩人同時退卻,則一起受到小伙伴的嘲笑,設(shè)支付為0,因為兩人一起受到嘲笑比起一人單獨受到嘲笑要好受些。箭頭法吉米退卻勇進退卻湯姆勇進0,0-1,44,-1-2,-2有兩個均衡。實際會怎樣?(四)IteratedEliminationofstrictlyDominatedstrategiesandNashEquilibriumPropositionAInan-playernormal-formgameG={S1,…,Sn;u1,…,un},ifiteratedeliminationofstrictlydominatedstrategieseliminatedallbutthestrategies(s1*…,sn*),thanthesestrategiesaretheuniqueNashequilibriumofthegame.PropositionBInan-playernormal-formgameG={S1,…,Sn;u1,…,un},ifthestrategies(s1*…,sn*)areaNashequilibrium,thentheysurviveiteratedeliminationofstrictlydominatedstrategies.二、無限策略博弈的解和反應(yīng)函數(shù)法Inthissectionweusethemodeltoillustrate:(a)thetranslationofaninformalstatementofaproblemintoanormal-formrepresentationofagame;(b)thecomputationsinvolvedinsolvingforthegame’sNashequilibrium.

按競爭程度劃分的市場類型(就賣方來說;對于買方而言,市場是競爭的,且每一單個買者對市場價格影響程度較?。篈完全競爭市場B寡頭競爭市場C獨家壟斷市場卡特爾市場類型不同,廠商之間行為特怔不同,A與C類型中,廠商的決策都是個體優(yōu)化決策,而B類型中寡頭壟斷競爭的本質(zhì)就構(gòu)成博弈,他們都是理性的決策者,他們的行為既影響(一)CournotModelofDuopoly

自身,又影響對方。盡管兩寡頭由于壟斷能給他們帶來一些共同的利益,但是他們的根本利益并不是完全一致的。如果兩寡頭之間可以簽定有約束力的協(xié)議,彼此之間達成合作,形成完全壟斷,此時的博弈是一種合作博弈。然而在大多數(shù)情況下,彼此之間很難達成有約束力的協(xié)議,這樣就是非合作博弈。最早研究兩寡頭壟斷競爭,并作出巨大貢獻的當(dāng)推法國經(jīng)濟學(xué)家Cournot(《財富理論的數(shù)學(xué)原理研究》,1838),他對寡頭市場的極端形式——兩寡頭壟斷市場作了分析,研究了在靜態(tài)條件下,完全相同產(chǎn)品市場中兩家廠商的競爭行為、反應(yīng)函數(shù)和均衡結(jié)果,得出結(jié)論:……1、players:廠商1和廠商2向市場提供無差異的同質(zhì)的產(chǎn)品;面臨的決策是qi=?qiQ

pui,博弈●標(biāo)準(zhǔn)式表述P34p是市場出清價格,是市場供應(yīng)量Q的減函數(shù):p=p(Q)=a-Q=a-(qi+qj)2、策略:產(chǎn)出水平qi,策略集Si={qi:qi≥0}3、支付函數(shù):ui(si,sj)=ui(qi,qj)=qip–cqi假定兩廠商均無固定成本,只有常數(shù)邊際成本c。=qi[a-(qi+qj)]–cqi=-qi2+(a-c-qj)qi●無限策略博弈NE的求解按NE定義的條件,如果策略組合(qi*,qj*)是NE,那么對于qj*,qi*是下列優(yōu)化問題的解:Maxui(qi,qj*)qi∈Si=Max[-qi2+(a-c-qj*)qi]

qi∈Siduidqi-2qi+(a-c-qj*)

令:-2qi+(a-c-qj*)=0得:qi*=(a-c-qj*)/2于是有方程組:q1*=(a-c-q2*)/2q2*=(a-c-q1*)/2q1*=q2*=(a-c)/3此時,u1*=u2*=(a-c)2/9考慮關(guān)系式:qi*=(a-c-qj*)/2無論qj是否最優(yōu),由qi=(a-c-qj)/2決定的qi總是廠商i針對廠商j產(chǎn)出水平的最優(yōu)反應(yīng);我們稱關(guān)系式qi=(a-c-qj)/2為廠商i針對廠商j的策略的反應(yīng)函數(shù),并記為:qi*=Ri(qj)=(a-c-qj)/2.由此NE(qi*,qj*)必須是方程組:q1=(a-c-q2)/2q2=(a-c-q1)/2的解。-------------------------反應(yīng)函數(shù)法對于無限策略博弈,其NE的求解主要是通過反應(yīng)函數(shù),而反應(yīng)函數(shù)則由各個參與人的支付函數(shù)優(yōu)化求得,即:Ri(s-i)來自于Maxui(s1…,sn-1,si

,

sn+1,…,sn)si∈Si下面用圖解來說明該模型的NE是:((a-c)/3,(a-c)/3)q1q2a-c(a-c)2(a-c)/2a-cR2(q1)=(a-c-q1)/2R1(q2)=(a-c-q2)/2(a-c)3(a-c)/3NE0如果兩個寡頭能聯(lián)合起來從共同利益角度進行決策,那他們將會怎樣?卡特爾古諾模型中,q1*=q2*=(a-c)/3,u1*=u2*=(a-c)2/9;生產(chǎn)壟斷產(chǎn)量的一半,q1m=q2m=qm/2=(a-c)/4<(a-c)/3=q1*=q2*,而u1m=u2m=(a-c)2/8>(a-c)2/9=u1*=u2*。思考:假定每個廠商要么生產(chǎn)壟斷產(chǎn)出的一半,要么生產(chǎn)古諾產(chǎn)量,任何其它產(chǎn)出都不允許,那么他們會作怎樣的決策?Cournot通過模型研究得出:兩寡頭市場產(chǎn)量比壟斷市場高、價格比壟斷市場價格低、利潤比壟斷市場低。這是典型的囚徒困境問題,導(dǎo)致個人理性和集體理性的沖突。類似的寡頭壟斷在實際經(jīng)濟活動中,在某些地區(qū)、某段時期、對于某種商品來說并不鮮,見,如電力業(yè)、電信業(yè)等。桔農(nóng)棄桔美國1933年5月頒布的《農(nóng)業(yè)調(diào)整法》是羅斯福上臺后實施“新政”所頒布的一系列法令之一。旨在控制農(nóng)業(yè)生產(chǎn)規(guī)模,減少農(nóng)產(chǎn)品供給,以提高農(nóng)產(chǎn)品價格。具體措施是,政府與農(nóng)民簽訂限產(chǎn)合同,對自愿限產(chǎn)的農(nóng)民實行直接津貼補助。(二)BertrandModelofDuopolyP39*兩廠商決策的相互影響在于需求函數(shù)Di(pi,pj)=a-pi+bpj兩廠商的產(chǎn)品具有一定的差異性;b是廠商i的產(chǎn)品對廠商j的產(chǎn)品的替代系數(shù)?!駱?biāo)準(zhǔn)式表述1、參與人:廠商1與廠商2;他們生產(chǎn)同類但存在一定差異的產(chǎn)品。2、他們選擇價格,Si={pi:pi≥0};3、他們的支付函數(shù)就是他們的利潤函數(shù):ui=ui(pi,pj)=Di(pi,pj)pi-Di(pi,pj)c=(a-pi+bpj)(pi-c)

假定兩廠商均無固定成本,只有常數(shù)邊際成本c。廠商i的反應(yīng)函數(shù):Ri(pj)=a+c+bpj2將是:P1*=p2*=c2P1=a+c+bp22P2=a+c+bp1P1*=p2*=(a+c)/(2-b)b﹤2思考:在Bertrand的模型中,如果兩廠商的產(chǎn)品是同質(zhì)的,那么NE會是什么?Bertrandparadox(三)豪泰林(Hotelling,1929)的價格競爭模型P41在該模型中,產(chǎn)品在物質(zhì)形態(tài)上無差異,但在空間上處于不同的位置?!駱?biāo)準(zhǔn)式表述1、參與人:商店1與商店2。他們分別位于一線性城市的兩端,出售同質(zhì)的商品;2、他們要決定的是各自商品的售價pi,Si={pi:pi≥0};令該線性城市的長度為1,消費者均勻地分布3、他們的支付函數(shù)就是利潤函數(shù):u1=D1p1-D1cu2=D2p2-D2c注:設(shè)兩家商店商品的單位成本相同為c。設(shè)消費者購買商品的旅行成本為t,并且每個消費者都具有單位需求,即每個消費者只要認(rèn)為價格“足夠低”就會(也僅僅)購買一個單位的商品,這意味著如果商店i的價格“不太高”,對商店i的需求等于發(fā)現(xiàn)從商店i購買更為便宜的顧客的數(shù)量。在[0,1]的區(qū)間里,分布密度為1;商店1位于0處,商店2位于1處。x為[0,1]上的任意一點。01商店1商店2x住在x的消費者到商店1購買的旅行成本是tx,到商店2購買的成本是t(1-x);如果住在x的消費者在兩個商店之間購買的成本是無差異的,那么所有住在x左邊的消費者在商店1購買,所有住在x右邊的消費者在商店2購買,即有:D1=x,D2=1-x。這里x滿足:P1+tx=P2+t(1-x)x=(P2-P1+t)/2t所以有需求函數(shù):

D1=x=(P2-P1+t)/2t;D2=1-x=(P1-P2+t)/2tu1=D1p1-D1c=(p1-c)[((P2-P1+t)/2t]u2=D2p2-D2c=(p2-c)[((P1-P2+t)/2t]反應(yīng)函數(shù):R1(p2)=(c+t+p2)R2(p1)=(c+t+p1)解兩個反應(yīng)函數(shù)組成的方程組,得:p1*=p2*=c+tu1*=u2*=t/2商店的利潤與消費者的旅行成本成正比。P42思考:“冰激凌問題”夏季某海濱浴場有兩個冰激凌銷售商,冰激凌是由同一個工廠供應(yīng)(產(chǎn)品無差異),價格由廠家統(tǒng)一確定。那么消費者會就近購買。問:兩個銷售商將選址何處?對于Hotelling的價格競爭模型,可以一般地討論兩家商店位于[0,1]區(qū)間內(nèi)任意位置時的情形:01ab商店1商店2x若住在x處的消費者到商店1與商店2無差異,那么有D1=x,D2=1-x;x滿足:P1+t(x-a)2=P2+t(1-x-b)2設(shè)旅行成本為td2,d為消費者到商店的距離。x=a+(1-a-b)/2+(P2-P1)/2t(1-a-b)所以有需求函數(shù):D1=x=a+(1-a-b)/2+(P2-P1)/2t(1-a-b)D2=1-x=b+(1-a-b)/2+(P1-P2)/2t(1-a-b)進一步可解得NE為:P1*(a,b)=c+t(1-a-b)(3+a-b)/3P2*(a,b)=c+t(1-a-b)(3+b-a)/3當(dāng)a=0、b=0,即商店1位于0、商店2位于1,P1*(0,1)=P2*(0,1)=c+t;當(dāng)a=1-b,即商店1與商店2同時位于線性城市的正中央,P1*(a,1-a)=P2*(a,1-a)=c。(四)TragedyoftheCommonsP44(Harding,1968)●標(biāo)準(zhǔn)式表述1、參與人:一個村莊里的n家農(nóng)戶,他們可以自由地在一片公共草地上放牧羊群。公共資源publicresourcesandgoods:Theresourcesandgoodswhichanyonehasownershipofthemandanyonecanusethemfreely.gi農(nóng)戶i的放牧羊的數(shù)量,∑gi=G。2、策略:每個農(nóng)戶決定gi=?以最大化自己的收益,Si={gi:gi≥0}。令V為每一只羊的產(chǎn)出。一個合理的假設(shè)是V是G的減函數(shù)(而不僅僅是gi的增函數(shù)),記為V=V(G)。由于每只羊的生存需要一定量的青草,草地能供養(yǎng)的羊的數(shù)量有一個上限Gmax:當(dāng)G﹤Gmax時,V(G)﹥0,當(dāng)G≥Gmax時,V(G)=0;并且在G﹤Gmax時,V(G)隨G的增大下降速度加快,見下圖:0V(G)GmaxV'(G)<0V"(G)<0G3、支付函數(shù):ui=[V(G)-c]gi假設(shè)每只羊的購買與飼養(yǎng)成本相同為常數(shù)c令n=3,c=4,V(G)=100-(g1+g2+g3)。那么有:ui=[100--(g1+g2+g3)4]gi反應(yīng)函數(shù):R1(g2,g3)=(96-g2-g3)/2R2(g1,g3)=(96-g1-g3)/2R3(g1,g2)=(96-g1-g2)/2g1*=g2*=g3*=24,此時u1*=u2*=u3*=576。如果村里對這片草地進行管理,即制定一條村規(guī),限制農(nóng)戶養(yǎng)羊的數(shù)量,情況將怎樣?村干部要做的優(yōu)化決策是:MaxU=Max[(100-G)-4]GGGdUdG=100-G-4-G令100-G-4-G=0Gm=48Um=2304村規(guī):gim=16﹤gi*=24uim=768﹥ui*=576三、混合策略納什均衡(一)混合策略的提出猜硬幣方正面反面正面-1,11,-1蓋硬幣方反面1,-1-1,1MatchingPennies不存在純策略意義上的NE。那么,他們的合理選擇是什么?ThedistinguishingfeatureofMatchingPenniesisthateachplayerwouldliketooutguesstheother.Inanygameinwhicheachplayerwouldliketooutguesstheother(s),thereisnoNashequilibrium(atleastasthisequilibriumconceptwasdefinedinSection1.3)becausethesolutiontosuchagamenecessarilyinvolvesuncertaintyaboutwhattheplayerswilldo.就一次游戲而言,猜測對方的策略,保密自己的策略。在多次反復(fù)游戲中,避免任何的傾向性和規(guī)律性。怎樣才能讓對方徹底猜不透?連自己也不知道自即將會采用哪個策略;把對方搞糊涂。隨機地選擇策略,即采用混合策略對純策略空間來說,可延伸的混合策略很多,如本例中雙方的純策略空間都是{正面,反面},混合策略可以是(5%,95%),(3%,97%),(20%,80%),(50%,50%),……選擇哪個混合策略?即p(正面,反面)=?先看蓋硬幣方的決策:令p蓋方(正面,反面)=(r,1-r)。這時,猜硬幣方若猜正面,則支付為(期望值):V(正)=1×r+(-1)×(1-r)=2r-1若猜反面,則支付為:V(反)=(-1)×r+1×(1-r)=-2r+1如果r﹥1/2或r﹤1/2,則有V(正)﹥0﹥V(反)或V(正)﹤0﹤V(反),那么,猜方只要猜正面或猜反面就贏定了,相應(yīng)地蓋方就輸定了。所以只有使r*=1/2,蓋方才能不輸。令V(正)=V(反)使猜方猜正面與猜反面無區(qū)別。再看猜方的決策:令p(正面,反面)=(q,1-q),這時蓋方的:V(正)=(-1)×q+1×(1-q)=-2q+1V(反)=1×q+(-1)×(1-q)=2q-1同理令:V(正)=V(反),即-2q+1=2q-1得:q*=1/2NE:p蓋*(正面,反面)=(1/2,1/2)p猜*(正面,反面)=(1/2,1/2)要求:請驗證是否有人愿意偏離這個概率分布。把這個包含概率分布(不確定性)的NE稱為混合策略NE。混合策略定義P50DefinitionInthenormal-formgameG={S1,…,Sn;u1,…,un},supposeSi={si1,…,siK}.Thenamixedstrategyforplayeriisaprobabilitydistributionpi=(pi1,…,piK),where0≤pik≤1fork=1,…,Kand(pi1+…+piK=1.為了能簡單地說明混合策略NE的精神,考慮標(biāo)準(zhǔn)式博弈G={S1,S2;u1,u2}。令S1={si1,…,siJ},S2={si1,…,siK},在純策略情況下,ui=ui(s1j,

s2k),一個確定的數(shù)值。但在采用混合策略的情況下,參與人只能把注意力集中于期望效用:ui=Vi(s1j,

s2k)。令p1=(p11,…,p1J)為參與人1的概率分布,p2=(p21,…,p2K)為參與人2的概率分布。參與人1推測到參與人2將以p2在{s21,…,s2K}上選擇,那么自己選擇純策略s1j的期望支付是V1(s1j)=∑p2kui(s1j,

s2k)k=1K并且,參與人1選擇混合策略p1的期望支付是:

V1(p1,p2)=∑p1j[∑p2ku1(s1j,

s2k)]k=1Kj=1J同理:V2(p1,p2)=∑p2k[∑p1ju2(s1j,

s2k)]j=1Jk=1K在兩人博弈里,混合策略NE是指兩個參與人的最優(yōu)混合策略組合。所謂最優(yōu)混合策略是指使參與人的期望支付最大化的混合策略。換言之,一對混合策略(p1*,p2*)要成為NE,p1*與p2*必須同時分別滿足:V(p1*,p2*)≥V(p1,p2*)與V(p1*,p2*)≥V(p1*,p2)混合策略NE定義DefinitionInthen-playernormal-formgameG={S1,…,Sn;u1,…,un},themixedstrategies(p1*,…,pn*)areaNashequilibriumifeachplayer’smixedstrategyisabestresponsetotheotherplayer’smixedstrategies:

V(pi*,p-i*)≥V(pi,p-i*)musthold.(二)混合策略NE的求解●支付等值法112113這種通過使對方選擇各個純策略的期望支付值相等來確定自己的策略空間上的最優(yōu)概率分布的方法被稱為“支付等值法”?!裰Ц蹲畲蠡ㄒ圆掠矌庞螒驗槔?。令蓋硬幣方以r的概率選正面,以1-r的概率選反面,即P蓋=(r,1-r);猜硬幣方以q的概率猜正面,以1-q的概率猜反面,即P猜=(q,1-q),有:V蓋(p蓋,p猜)=r[(-1)×q+1×(1-q)]+(1-r)[1×q+(-1)×(1-q)]=-4qr+2q+2r-1

V猜(p蓋,p猜)=q[1×r+(-1)×(1-r)]+(1-q)[(-1)×r+1×(1-r)]=4qr-2q-2r+1解:MaxV蓋(p蓋,p猜)r得:q*=1/2MaxV猜(p蓋,p猜)q得:r*=1/2混合策略NE是蓋方在策略空間{正面,反面}上以概率分布P蓋*,=(1/2,1/2)進行選擇,猜方也在策略空間{正面,反面上以概率p猜*=(1/2,1/2)進行選擇。對混合策略的辯護:*混合策略表示使用不同純策略的大量參與人。*Harsanyi:混合可以解釋為參與人收益上微小的不可觀測變動的結(jié)果。*博弈多次反復(fù)進行時參與人實施某一純策略的不確定次數(shù)和時間。*P52一個參與人實施混合策略的目的是給其他參與人造成不確定性,盡管其他參與人能推測到他選擇某個純策略的概率有多大,但卻不知道他到底會選哪個純策略。為了進一步理解混合策略的實際意義,下面分析“監(jiān)察博弈”(JeanTiroleandSelten)監(jiān)察博弈“監(jiān)察博弈”是“MatchingPennies”的一種流行變種,它可以應(yīng)用于武器控制、犯罪預(yù)防和工人激勵。下圖是這一博弈的簡單版本。一個工人為一個老板工作(參與人);工人可以偷懶或工作、老板可以監(jiān)察或不監(jiān)察(策略集);工人工作能為老板產(chǎn)生價值為v的產(chǎn)出,但會使自己花費成本g。老板監(jiān)察要花費成本h,但可以提供工人是否偷懶的證據(jù)。工人得到工資w(假設(shè)老板不允許根據(jù)觀測產(chǎn)出水平來條件化工資),如果工人被抓住在偷懶,則他得到0(由于有限責(zé)任的原因)。兩認(rèn)同時選擇他們的策略(特別地,老板在決定是否監(jiān)察工人時不知道工人是否會選擇偷懶)。為了限制要考察的情形數(shù)量,假設(shè)g>h>0;為了使分析更有趣,還假設(shè)w>g(否則工作對于工人來說會是一個嚴(yán)格劣策略)。監(jiān)察不監(jiān)察偷懶0,-hw,-w不偷懶w-g,v-w-hw-g,v-wP*(偷懶)=h/w,P*(監(jiān)察)=g/w武器核查、工商打假、不定期抽查等等戀人之爭battleofthesexes一對戀人,小娟和大海,在不同的地方上班,兩人都很珍惜周末能夠在一起的時間。某周末,小娟花高價購得兩張芭蕾舞門票,大海也好不容易搞到兩張足球賽門票。小娟從小酷愛芭蕾,大海是個十足的足球迷,怎么辦?顯然如果各自分開過周末,那才是雙方最不樂意的事。大海芭蕾足球芭蕾小娟足球2,11,20,00,0Battleofthesexes存在兩個純策略NE:(芭蕾,芭蕾)和(足球,足球)。無法形成一致的預(yù)期,結(jié)果不確定。*Schelling(1960)認(rèn)為,在現(xiàn)實生活中,參與人可能使用某些被博弈模型抽象掉的信息來達到一個“聚點”(focalpoint)均衡。這些信息可能與社會文化習(xí)慣、參與人過去博弈的歷史等有關(guān)。*促成NE出現(xiàn)的另一種方法是參與人在博弈開始之前進行不花什么成本的“廉價磋商”(cheaptalk).*Aumann(1974)證明,如果參與人可以根據(jù)某個共同觀測到的信號進行博弈,就可能出現(xiàn)“相關(guān)均衡”(correlatedequilibrium)。如天氣拋硬幣如果兩個人都很任性,誰也不讓步,誰也不肯讓對方得意又確實離不開對方,那就變成實施混合策略:(小娟)選足球不甘心,選芭蕾又怕大海不樂意。大海也一樣。那么最優(yōu)的概率分布是什么?令小娟策略空間{芭蕾,足球}上的概率分布為(r,1-r),大海策略空間{芭蕾,足球}上的概率分布為(q,1-q),那么:V小娟=2×r×q+1×(1-r)×(1-q)=3rq+1-r-q最優(yōu)化q*=1/3V大海=1×r×q+2×(1-r)×(1-q)=3rq+2-2q-2r最優(yōu)化r*=2/3所以,混合策略NE是:小娟以2/3的概率選芭蕾,以1/3的概率選足球;大海以1/3的概率選芭蕾,以2/3的概率選足球。其效率是:V小娟=2/3=V大海<1最差的效率是兩人都為對方著想,又沒有事前溝通,結(jié)果小娟去了足球場,而大海去了劇場。(三)混合策略與反應(yīng)對應(yīng)P56回顧MatchingPennies,雙方都會實施混合策略,其NE是r*=q*=(1/2,1/2)。這里,從另一個角度說明這樣的概率分布確實是一個“不動點”。按照NE的條件,一個策略組合如過是一個NE,那么其中的每一個策略都是參與人針對其他參與人策略組合的最優(yōu)反應(yīng),在純策略NE中,這個“最優(yōu)反應(yīng)”可能是一個具體的純策略(如在“Prisoners’Dilemma”中),也可能是一個反應(yīng)函數(shù)(reactionfunction)(如在“CournotModelofDuopoly”中)。而在一個混合策略NE中,這個“最優(yōu)反應(yīng)”將是一個概率或很多個概率——被稱為“反應(yīng)對應(yīng)”(reactioncorrespondence)。以MatchingPennies為例。r—蓋方選正面的概率,q—猜方猜正面的概率先看蓋方的最優(yōu)反應(yīng),記為r*=R(q):當(dāng)q<1/2r*=R(q)=1當(dāng)q=1/2[0,1]當(dāng)q>1/20猜方的最優(yōu)反應(yīng)反應(yīng),記為q*=R(r)當(dāng)r<1/2q*=R(r)=0,當(dāng)r=1/2[0,1],當(dāng)r>1/21,反應(yīng)對應(yīng)與反應(yīng)函數(shù)的區(qū)別:…作為NE,各個參與人的反應(yīng)應(yīng)該同時為最優(yōu),那么只要求兩個反應(yīng)對應(yīng)的交點,用圖示法:rq01(正面)1(正面)1/21/2r*=R(q)q*=R(r)(四)ExistenceofNashEquilibrium問題:是否所有的博弈都存在NE(純的或混合的)?*Nash在1950年證明:任何有限博弈,都至少存在一個NE。Theorem(Nash1950):Inthen-playernormal-formgameG={S1,…,Sn;u1,…,un},ifnisfiniteandSiisfiniteforeveryithenthereexistsatleastoneNashequilibrium,possiblyinvolvingmixedstrategies.Nashtheorem的證明略Wilson(1971)證明,幾乎所有有限博弈,都存在有限奇數(shù)個NE,包括純策略NE和混合策略NE?!狾ddnessTheoremP63例證,P67-69證明Problems1、Inthefollowingnormal-formgame,whatstrategiessurviveiteratedeliminationofstrictlydominatedstrategies?Whatarethepure-strategyNashequilibrium?LCRT2,01,14,2M3,41,22,3B1,30,23,02、Players1and2arebargainingoverhowtosplit10thousanddollars.Bothplayerssimultaneouslynamesharestheywouldliketohave,s1ands2,where0≤s1,s2≤1.Ifs1+s2≤1,thentheplayersreceivethesharestheynamed;ifs1+s2>1,thenbothplayersreceivezero.Whataret

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負責(zé)。
  • 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時也不承擔(dān)用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

評論

0/150

提交評論