Chapter1 Static Games of Complete Information(博弈論-浙江大學(xué))_第1頁(yè)
Chapter1 Static Games of Complete Information(博弈論-浙江大學(xué))_第2頁(yè)
Chapter1 Static Games of Complete Information(博弈論-浙江大學(xué))_第3頁(yè)
Chapter1 Static Games of Complete Information(博弈論-浙江大學(xué))_第4頁(yè)
Chapter1 Static Games of Complete Information(博弈論-浙江大學(xué))_第5頁(yè)
已閱讀5頁(yè),還剩97頁(yè)未讀, 繼續(xù)免費(fèi)閱讀

下載本文檔

版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請(qǐng)進(jìn)行舉報(bào)或認(rèn)領(lǐng)

文檔簡(jiǎn)介

Chapter1完全信息靜態(tài)博弈StaticGamesofCompleteInformationInthischapterweconsidergamesofthefollowingsimpleform:first,theplayerssimultaneouslychooseactions;then,theplayersreceivepayoffsthatdependonthecombinationofactionsjustchosen.Withintheclassofsuchstatic(orsimultaneous-move)games,werestrictattentiontogamesofcompleteinformation.That

iseachplayer’spayofffunction(thefunctionthatdeterminestheplayerspayofffromthecombinationofactionschosenbytheplayers)iscommonknowledgeamongalltheplayers.教材P21一、Normal-FormRepresentationofGamesandNashEquilibrium(一)Normal-FormRepresentationofGamesInthenormal-formrepresentationofagame,eachplayersimultaneouslychoosesastrategy,andthecombinationofstrategieschosenbytheplayersdeterminesapayoffforeachplayer.Weillustratethenormal-formrepresentationwithaclassicalexample—Theprisoners’Dilemma.*Twosuspectsarearrestedandchargedwithacrime.Thepolicelacksufficientevidencetoconvictthesuspects,unlessatleastoneconfesses.Thepoliceholdthesuspectsinseparatecellsandexplaintheconsequencesthatwillfollowfromtheactionstheycouldtake.Ifneitherconfessesthenbothwillbeconvictedofaminoroffenseandsentencedtooneyearinjail.Ifbothconfessthenbothwillbesentencedtojailfiveyears.Finally,ifoneconfessesbuttheotherdoesnot,thentheconfessorwillbereleasedimmediatelybuttheotherwillbesentencedtoeightyearsinjail—fiveforthecrimeandafurtherthreeforobstructingjustice(干擾司法)。囚徒2招認(rèn)沉默招認(rèn)–5,-50,-8囚徒1沉默-8,0-1,-1

囚徒的困境Wenowturntothegeneralcase.Thenormal-formrepresentationofagamespecifies:(1)theplayersinthegame;(2)thestrategiesavailabletoeachplayer;(3)thepayoffreceivedbyeachplayerforeachcombinationofstrategiesthatcouldbechosenbytheplayers.

Definition:Thenormal-formrepresentationofan-n-playergamespecifiestheplayers’strategyspacesS1,…,Snandtheirpayofffunctionsu1,…,un.WedenotethisgamebyG={S1,…,Sn;u1,…,un}.教材P22*理解完全信息靜態(tài)博弈時(shí)要注意事項(xiàng)1Althoughwestatedthatinanormal-formgametheplayerschoosetheirstrategiessimultaneously,thisdoesnotimplythatthepartiesnecessarilyactsimultaneously:itsufficesthateachchoosehisorheractionwithoutknowledgeoftheothers’choices,aswouldbethecase“theprisoners’dilemma”iftheprisonersreacheddecisionsatarbitrarytimes(在任意時(shí)間)whileintheirseparatecells.2Herewemayrecognize‘completeinformation’asthateachplayerknowthepayofffunctionsoftheothers.(二)Dominant-StrategyEquilibriumDefinitionInthenormal-formgameG={S1,…,Sn;u1,…,un},letsi'andsi"

befeasiblestrategiesforplayeri(i.e.,si'andsi"aremembersofSi

).Strategysi'isstrictlydominatedbystrategysi"ifforeachfeasiblecombinationoftheothers’strategies,i’spayofffromplayingsi'isstrictlylessthani’spayofffromplayingsi".i.e.:ui(s1,…,si-1,si*,si+1,…,sn)

<ui(s1,…,si-1,si**,si+1,…,sn)

(DS)foreachs-i=(s1,…,si-1,si+1,…,sn)thatcanbeconstructedfromtheotherplayers’strategySpacesS1,…,Si-1,Si+1,…,Sn.WATSONP551囚徒2招認(rèn)沉默招認(rèn)–5,-50,-8囚徒1沉默-8,0-1,-1

囚徒的困境策略“沉默”嚴(yán)格劣于策略“招認(rèn)”博弈分析的目的:預(yù)測(cè)博弈的均衡結(jié)果,即給定“每個(gè)參與人都是理性的”是共同知識(shí),什么是每個(gè)參與人的最優(yōu)策略?什么是所有參與人的最優(yōu)策略組合?*肯定性(sure-thing)或替代性(substitution)公理:一個(gè)決策者在事件A發(fā)生的偏好選項(xiàng)1勝于選項(xiàng)2,并且在事件A不發(fā)生時(shí)也偏好選項(xiàng)1勝于選項(xiàng)2,那么就有,他在知道事件A無論是發(fā)生還是不發(fā)生之前都應(yīng)該偏好選項(xiàng)1勝于選項(xiàng)2?!袄硇缘膮⑴c人不會(huì)選擇嚴(yán)格劣策略”俗語:已不變應(yīng)萬變“重復(fù)剔除嚴(yán)格劣策略(iteratedeliminationofstrictlydominatedstrategies)”的思路:首先,找出某個(gè)參與人的嚴(yán)格劣策略,并把它從他的策略空間中剔除,重新構(gòu)造一個(gè)已不包含該嚴(yán)格劣策略的博弈;其次,剔除新博弈中某個(gè)參與人的嚴(yán)格劣策略;重復(fù)上述過程,直到只剩下唯一的策略組合。——我們認(rèn)為這個(gè)唯一所剩的策略組合是穩(wěn)定的。P24DefinitionInanormal-formgame,ifforeachplayeri,si"isi’sdominantstrategy,thanwecallthestrategiesprofile(s1″,…,sn"

)the‘dominant-strategyequilibrium’.參與人2左中右上1,01,20,1參與人1下0,30,12,0策略組合(上,中)是均衡結(jié)局,將實(shí)現(xiàn)支付(1,2)。第一第二第三

參與人2左中右上0,44,05,3參與人1中4,00,45,3下3,53,56,6每個(gè)參與人都不存在嚴(yán)格劣策略(三)納什均衡

DefinitionInthen-playernormal-formgameG={S1,…,Sn;u1,…,un},thestrategies(s1*…,sn*)areaNashequilibriumif,foreachplayeri,si*is(atleasttiedfor(至少不劣于))playeri’sbestresponsetothestrategiesspecifiedforthen-1otherplayers,(s1*…,sn-1*,sn+1*,…,sn*):

ui(s1*…,sn-1*,si*,

sn+1*,…,sn*)

≥ui(s1*…,sn-1*,si

,

sn+1*,…,sn*)……….(NE)

foreveryfeasiblestrategysiinSi;Thatis,si*solves

maxui(s1*…,sn-1*,si,

sn+1*,…,sn*).

si∈Si

上述均衡概念是1951年由數(shù)學(xué)家約翰·納什(JohnNash)首先解釋清楚的,所以將他所解釋的均衡稱為納什均衡。*對(duì)納什均衡的理解:

1Ifgametheoryistoprovideauniquesolutiontoagame-theoreticproblemthenthesolutionmustbeaNashequilibrium,inthefollowingsense.Supposethatgametheorymakesauniquepredictionaboutthestrategyeachplayerwillchoose.Inorderforthispredictiontobecorrect,itisnecessarythateachplayerbewillingtochoosethestrategypredictedbythetheory.Thuseachplayer’spredictedstrategymustbethatplayer’sbestresponsetothestrategiesoftheotherplayers.Suchapredictioncouldbecalled

strategicallystableorself-enforcing,becausenosingleplayerwantstodeviatefromhisorher

Predictedstrategy.WewillcallsuchapredictionaNashequilibrium.-----------------------------RobertGibbonsP82是這樣的一種穩(wěn)定的策略組合:當(dāng)所有參與人的選擇公開以后,每個(gè)人都滿意自己作出了正確的選擇;沒有人能得到更好的結(jié)果了。在博弈論中這種結(jié)果被稱為NE。3為了理解納什均衡的哲學(xué)含義,讓我們?cè)O(shè)想n個(gè)參與人在博弈之前協(xié)商達(dá)成一個(gè)協(xié)議,規(guī)定每一個(gè)參與人選擇一個(gè)特定的策略。我們要問的一個(gè)問題是,給定其他參與人都遵守這個(gè)協(xié)議,在沒有外在強(qiáng)制的情況下,是否有任何人有積極性不遵守這個(gè)協(xié)議?顯然,只有當(dāng)遵守協(xié)議帶來的效用大于不遵守協(xié)議時(shí)的效用,一個(gè)人才會(huì)遵守這個(gè)協(xié)議。如果沒有任何參與人有積極性不遵守這個(gè)協(xié)議,我們說這個(gè)協(xié)議是可以自動(dòng)實(shí)施的(self-enforcing),這個(gè)協(xié)議就構(gòu)成一個(gè)納什均衡;否則,它就不是一個(gè)納什均衡。(張維迎,P68)4納什均衡是一種策略組合,使得每個(gè)參與人的策略是對(duì)其他參與人策略的最優(yōu)放應(yīng)。納什均衡是博弈將會(huì)如何進(jìn)行的“一致”(consistent)預(yù)測(cè),這意指,如果所有參與人預(yù)測(cè)特定納什均衡會(huì)出現(xiàn),那么沒有參與人有動(dòng)力采用與均衡不同的行動(dòng)。因此納什均衡(也只有納什均衡)能具有性質(zhì)使得參與人能預(yù)測(cè)到它,預(yù)測(cè)到他們的對(duì)手也會(huì)預(yù)測(cè)到它,如此繼續(xù)。與之相反,任何固定的非納什均衡如果出現(xiàn)就意味著至少有一個(gè)參與人“犯了錯(cuò)”,或者是對(duì)對(duì)手行動(dòng)的預(yù)測(cè)上犯了錯(cuò),或者是(給定那種預(yù)測(cè))在最大化自己的收益時(shí)犯了錯(cuò)。(JeanTirole)P10納什均衡通過了一致預(yù)測(cè)檢驗(yàn)并不就使得它們是好的預(yù)測(cè),在一些博弈格局中如果認(rèn)為可以獲得精確預(yù)測(cè)那會(huì)過于輕率,由此我們想提請(qǐng)注意一個(gè)事實(shí),博弈的最可能結(jié)果實(shí)際上取決于比標(biāo)準(zhǔn)式所提供的更多的信息。例如,可能希望知道參與人對(duì)于此類博弈具有多少經(jīng)驗(yàn),他們是否來自同一種文化因此而分縣分享關(guān)于博弈將會(huì)如何進(jìn)行的特定期望,以及如此等等。(JeanTirole)P10-11Abrute-forceapproach(一個(gè)最直接的方法)tofindingagame’sNashequilibriumissimplytocheckwhethereachpossiblecombinationofstrategiessatisfiescondition(NE)inthedefinition.Inatwo-playergame,thisapproachbeginsasfollows:foreachplayer,andforeachfeasiblestrategyforthatplayer,determinetheotherplayer’sbestresponsetoeachofthatstrategy.……劃線法……畫箭頭法參與人2左中右上0,44,05,3參與人1中4,00,45,3下3,53,56,6每個(gè)參與人都不存在嚴(yán)格劣策略(下,右)是NE,將實(shí)現(xiàn)支付(6,6)囚徒2招認(rèn)沉默招認(rèn)–5,-50,-8囚徒1沉默-8,0-1,-1囚徒的困境(沉默,沉默)帕累托優(yōu)于(招認(rèn),招認(rèn))有一頭大豬和一頭小豬住在同一個(gè)豬圈里,豬圈的一側(cè)放者豬食槽,另一側(cè)安裝著一個(gè)控制食物供應(yīng)的按鈕。按一次按鈕,有8個(gè)單位的食物進(jìn)槽,但需承擔(dān)2個(gè)單位的成本。偌大豬小豬同時(shí)到達(dá)豬食槽,大豬吃到5個(gè)單位的食物,小豬吃到3個(gè)單位的食物;若大豬先到,大豬吃7個(gè)單位的食物,小豬只能吃到1個(gè)單位;若小豬先到,小豬吃到4個(gè)單位食物,大豬也吃到4個(gè)單位食物。練習(xí):智豬博弈(boxedpigsgame)小豬去按等待去按3,12,4大豬等待7,-10,0大豬的收益外部化,小豬不勞而獲,免費(fèi)搭了大豬的便車。請(qǐng)列舉“搭便車”的現(xiàn)象沖開水、搞衛(wèi)生;股市上莊家與散戶20世紀(jì)70年代末80年代初,美國(guó)市場(chǎng)上私人標(biāo)簽(privatelabel)的軟飲料價(jià)格便宜、質(zhì)量較差,因此占有較低的市場(chǎng)份額??煽诳蓸饭竞桶偈驴蓸饭咀畛跄苋萑踢@些私人標(biāo)簽飲料的存在,因?yàn)樗鼈兪切∝i,威脅有限。可是沒過多久,一家主要的私人標(biāo)簽飲料供應(yīng)商Cott公司通過挑釁性的定價(jià)和較高的質(zhì)量,從擁有較低市場(chǎng)份額的地區(qū)品牌,成長(zhǎng)為一個(gè)擁有三分之一市場(chǎng)份額的、旗鼓相當(dāng)?shù)母?jìng)爭(zhēng)者。此時(shí),可口可樂公司和百事可樂公司通過降低價(jià)格這種進(jìn)攻性的行動(dòng),使私人標(biāo)簽軟飲料的市場(chǎng)份額立即瓦解了。小雞博弈(thegameofchicken)設(shè)想湯姆和吉米是兩個(gè)頑皮的小孩,他們?cè)谛』锇榈墓膭?dòng)下要進(jìn)行一場(chǎng)關(guān)于勇氣的比賽:兩人分別從一條獨(dú)木橋的兩端沖向?qū)Ψ?,誰退卻誰就是“小雞”。顯然,如果兩個(gè)人都向前沖,則兩敗俱傷,設(shè)支付水平為-2;如果一個(gè)勇進(jìn)而另一個(gè)退卻,則勇進(jìn)者受到小伙伴的歡呼,退卻者受到嘲諷,設(shè)支付分別為4和-1;若兩人同時(shí)退卻,則一起受到小伙伴的嘲笑,設(shè)支付為0,因?yàn)閮扇艘黄鹗艿匠靶Ρ绕鹨蝗藛为?dú)受到嘲笑要好受些。箭頭法吉米退卻勇進(jìn)退卻湯姆勇進(jìn)0,0-1,44,-1-2,-2有兩個(gè)均衡。實(shí)際會(huì)怎樣?(四)IteratedEliminationofstrictlyDominatedstrategiesandNashEquilibriumPropositionAInan-playernormal-formgameG={S1,…,Sn;u1,…,un},ifiteratedeliminationofstrictlydominatedstrategieseliminatedallbutthestrategies(s1*…,sn*),thanthesestrategiesaretheuniqueNashequilibriumofthegame.PropositionBInan-playernormal-formgameG={S1,…,Sn;u1,…,un},ifthestrategies(s1*…,sn*)areaNashequilibrium,thentheysurviveiteratedeliminationofstrictlydominatedstrategies.二、無限策略博弈的解和反應(yīng)函數(shù)法Inthissectionweusethemodeltoillustrate:(a)thetranslationofaninformalstatementofaproblemintoanormal-formrepresentationofagame;(b)thecomputationsinvolvedinsolvingforthegame’sNashequilibrium.

按競(jìng)爭(zhēng)程度劃分的市場(chǎng)類型(就賣方來說;對(duì)于買方而言,市場(chǎng)是競(jìng)爭(zhēng)的,且每一單個(gè)買者對(duì)市場(chǎng)價(jià)格影響程度較小):A完全競(jìng)爭(zhēng)市場(chǎng)B寡頭競(jìng)爭(zhēng)市場(chǎng)C獨(dú)家壟斷市場(chǎng)卡特爾市場(chǎng)類型不同,廠商之間行為特怔不同,A與C類型中,廠商的決策都是個(gè)體優(yōu)化決策,而B類型中寡頭壟斷競(jìng)爭(zhēng)的本質(zhì)就構(gòu)成博弈,他們都是理性的決策者,他們的行為既影響(一)CournotModelofDuopoly

自身,又影響對(duì)方。盡管兩寡頭由于壟斷能給他們帶來一些共同的利益,但是他們的根本利益并不是完全一致的。如果兩寡頭之間可以簽定有約束力的協(xié)議,彼此之間達(dá)成合作,形成完全壟斷,此時(shí)的博弈是一種合作博弈。然而在大多數(shù)情況下,彼此之間很難達(dá)成有約束力的協(xié)議,這樣就是非合作博弈。最早研究?jī)晒杨^壟斷競(jìng)爭(zhēng),并作出巨大貢獻(xiàn)的當(dāng)推法國(guó)經(jīng)濟(jì)學(xué)家Cournot(《財(cái)富理論的數(shù)學(xué)原理研究》,1838),他對(duì)寡頭市場(chǎng)的極端形式——兩寡頭壟斷市場(chǎng)作了分析,研究了在靜態(tài)條件下,完全相同產(chǎn)品市場(chǎng)中兩家廠商的競(jìng)爭(zhēng)行為、反應(yīng)函數(shù)和均衡結(jié)果,得出結(jié)論:……1、players:廠商1和廠商2向市場(chǎng)提供無差異的同質(zhì)的產(chǎn)品;面臨的決策是qi=?qiQ

pui,博弈●標(biāo)準(zhǔn)式表述P34p是市場(chǎng)出清價(jià)格,是市場(chǎng)供應(yīng)量Q的減函數(shù):p=p(Q)=a-Q=a-(qi+qj)2、策略:產(chǎn)出水平qi,策略集Si={qi:qi≥0}3、支付函數(shù):ui(si,sj)=ui(qi,qj)=qip–cqi假定兩廠商均無固定成本,只有常數(shù)邊際成本c。=qi[a-(qi+qj)]–cqi=-qi2+(a-c-qj)qi●無限策略博弈NE的求解按NE定義的條件,如果策略組合(qi*,qj*)是NE,那么對(duì)于qj*,qi*是下列優(yōu)化問題的解:Maxui(qi,qj*)qi∈Si=Max[-qi2+(a-c-qj*)qi]

qi∈Siduidqi-2qi+(a-c-qj*)

令:-2qi+(a-c-qj*)=0得:qi*=(a-c-qj*)/2于是有方程組:q1*=(a-c-q2*)/2q2*=(a-c-q1*)/2q1*=q2*=(a-c)/3此時(shí),u1*=u2*=(a-c)2/9考慮關(guān)系式:qi*=(a-c-qj*)/2無論qj是否最優(yōu),由qi=(a-c-qj)/2決定的qi總是廠商i針對(duì)廠商j產(chǎn)出水平的最優(yōu)反應(yīng);我們稱關(guān)系式qi=(a-c-qj)/2為廠商i針對(duì)廠商j的策略的反應(yīng)函數(shù),并記為:qi*=Ri(qj)=(a-c-qj)/2.由此NE(qi*,qj*)必須是方程組:q1=(a-c-q2)/2q2=(a-c-q1)/2的解。-------------------------反應(yīng)函數(shù)法對(duì)于無限策略博弈,其NE的求解主要是通過反應(yīng)函數(shù),而反應(yīng)函數(shù)則由各個(gè)參與人的支付函數(shù)優(yōu)化求得,即:Ri(s-i)來自于Maxui(s1…,sn-1,si

,

sn+1,…,sn)si∈Si下面用圖解來說明該模型的NE是:((a-c)/3,(a-c)/3)q1q2a-c(a-c)2(a-c)/2a-cR2(q1)=(a-c-q1)/2R1(q2)=(a-c-q2)/2(a-c)3(a-c)/3NE0如果兩個(gè)寡頭能聯(lián)合起來從共同利益角度進(jìn)行決策,那他們將會(huì)怎樣?卡特爾古諾模型中,q1*=q2*=(a-c)/3,u1*=u2*=(a-c)2/9;生產(chǎn)壟斷產(chǎn)量的一半,q1m=q2m=qm/2=(a-c)/4<(a-c)/3=q1*=q2*,而u1m=u2m=(a-c)2/8>(a-c)2/9=u1*=u2*。思考:假定每個(gè)廠商要么生產(chǎn)壟斷產(chǎn)出的一半,要么生產(chǎn)古諾產(chǎn)量,任何其它產(chǎn)出都不允許,那么他們會(huì)作怎樣的決策?Cournot通過模型研究得出:兩寡頭市場(chǎng)產(chǎn)量比壟斷市場(chǎng)高、價(jià)格比壟斷市場(chǎng)價(jià)格低、利潤(rùn)比壟斷市場(chǎng)低。這是典型的囚徒困境問題,導(dǎo)致個(gè)人理性和集體理性的沖突。類似的寡頭壟斷在實(shí)際經(jīng)濟(jì)活動(dòng)中,在某些地區(qū)、某段時(shí)期、對(duì)于某種商品來說并不鮮,見,如電力業(yè)、電信業(yè)等。桔農(nóng)棄桔美國(guó)1933年5月頒布的《農(nóng)業(yè)調(diào)整法》是羅斯福上臺(tái)后實(shí)施“新政”所頒布的一系列法令之一。旨在控制農(nóng)業(yè)生產(chǎn)規(guī)模,減少農(nóng)產(chǎn)品供給,以提高農(nóng)產(chǎn)品價(jià)格。具體措施是,政府與農(nóng)民簽訂限產(chǎn)合同,對(duì)自愿限產(chǎn)的農(nóng)民實(shí)行直接津貼補(bǔ)助。(二)BertrandModelofDuopolyP39*兩廠商決策的相互影響在于需求函數(shù)Di(pi,pj)=a-pi+bpj兩廠商的產(chǎn)品具有一定的差異性;b是廠商i的產(chǎn)品對(duì)廠商j的產(chǎn)品的替代系數(shù)?!駱?biāo)準(zhǔn)式表述1、參與人:廠商1與廠商2;他們生產(chǎn)同類但存在一定差異的產(chǎn)品。2、他們選擇價(jià)格,Si={pi:pi≥0};3、他們的支付函數(shù)就是他們的利潤(rùn)函數(shù):ui=ui(pi,pj)=Di(pi,pj)pi-Di(pi,pj)c=(a-pi+bpj)(pi-c)

假定兩廠商均無固定成本,只有常數(shù)邊際成本c。廠商i的反應(yīng)函數(shù):Ri(pj)=a+c+bpj2將是:P1*=p2*=c2P1=a+c+bp22P2=a+c+bp1P1*=p2*=(a+c)/(2-b)b﹤2思考:在Bertrand的模型中,如果兩廠商的產(chǎn)品是同質(zhì)的,那么NE會(huì)是什么?Bertrandparadox(三)豪泰林(Hotelling,1929)的價(jià)格競(jìng)爭(zhēng)模型P41在該模型中,產(chǎn)品在物質(zhì)形態(tài)上無差異,但在空間上處于不同的位置。●標(biāo)準(zhǔn)式表述1、參與人:商店1與商店2。他們分別位于一線性城市的兩端,出售同質(zhì)的商品;2、他們要決定的是各自商品的售價(jià)pi,Si={pi:pi≥0};令該線性城市的長(zhǎng)度為1,消費(fèi)者均勻地分布3、他們的支付函數(shù)就是利潤(rùn)函數(shù):u1=D1p1-D1cu2=D2p2-D2c注:設(shè)兩家商店商品的單位成本相同為c。設(shè)消費(fèi)者購(gòu)買商品的旅行成本為t,并且每個(gè)消費(fèi)者都具有單位需求,即每個(gè)消費(fèi)者只要認(rèn)為價(jià)格“足夠低”就會(huì)(也僅僅)購(gòu)買一個(gè)單位的商品,這意味著如果商店i的價(jià)格“不太高”,對(duì)商店i的需求等于發(fā)現(xiàn)從商店i購(gòu)買更為便宜的顧客的數(shù)量。在[0,1]的區(qū)間里,分布密度為1;商店1位于0處,商店2位于1處。x為[0,1]上的任意一點(diǎn)。01商店1商店2x住在x的消費(fèi)者到商店1購(gòu)買的旅行成本是tx,到商店2購(gòu)買的成本是t(1-x);如果住在x的消費(fèi)者在兩個(gè)商店之間購(gòu)買的成本是無差異的,那么所有住在x左邊的消費(fèi)者在商店1購(gòu)買,所有住在x右邊的消費(fèi)者在商店2購(gòu)買,即有:D1=x,D2=1-x。這里x滿足:P1+tx=P2+t(1-x)x=(P2-P1+t)/2t所以有需求函數(shù):

D1=x=(P2-P1+t)/2t;D2=1-x=(P1-P2+t)/2tu1=D1p1-D1c=(p1-c)[((P2-P1+t)/2t]u2=D2p2-D2c=(p2-c)[((P1-P2+t)/2t]反應(yīng)函數(shù):R1(p2)=(c+t+p2)R2(p1)=(c+t+p1)解兩個(gè)反應(yīng)函數(shù)組成的方程組,得:p1*=p2*=c+tu1*=u2*=t/2商店的利潤(rùn)與消費(fèi)者的旅行成本成正比。P42思考:“冰激凌問題”夏季某海濱浴場(chǎng)有兩個(gè)冰激凌銷售商,冰激凌是由同一個(gè)工廠供應(yīng)(產(chǎn)品無差異),價(jià)格由廠家統(tǒng)一確定。那么消費(fèi)者會(huì)就近購(gòu)買。問:兩個(gè)銷售商將選址何處?對(duì)于Hotelling的價(jià)格競(jìng)爭(zhēng)模型,可以一般地討論兩家商店位于[0,1]區(qū)間內(nèi)任意位置時(shí)的情形:01ab商店1商店2x若住在x處的消費(fèi)者到商店1與商店2無差異,那么有D1=x,D2=1-x;x滿足:P1+t(x-a)2=P2+t(1-x-b)2設(shè)旅行成本為td2,d為消費(fèi)者到商店的距離。x=a+(1-a-b)/2+(P2-P1)/2t(1-a-b)所以有需求函數(shù):D1=x=a+(1-a-b)/2+(P2-P1)/2t(1-a-b)D2=1-x=b+(1-a-b)/2+(P1-P2)/2t(1-a-b)進(jìn)一步可解得NE為:P1*(a,b)=c+t(1-a-b)(3+a-b)/3P2*(a,b)=c+t(1-a-b)(3+b-a)/3當(dāng)a=0、b=0,即商店1位于0、商店2位于1,P1*(0,1)=P2*(0,1)=c+t;當(dāng)a=1-b,即商店1與商店2同時(shí)位于線性城市的正中央,P1*(a,1-a)=P2*(a,1-a)=c。(四)TragedyoftheCommonsP44(Harding,1968)●標(biāo)準(zhǔn)式表述1、參與人:一個(gè)村莊里的n家農(nóng)戶,他們可以自由地在一片公共草地上放牧羊群。公共資源publicresourcesandgoods:Theresourcesandgoodswhichanyonehasownershipofthemandanyonecanusethemfreely.gi農(nóng)戶i的放牧羊的數(shù)量,∑gi=G。2、策略:每個(gè)農(nóng)戶決定gi=?以最大化自己的收益,Si={gi:gi≥0}。令V為每一只羊的產(chǎn)出。一個(gè)合理的假設(shè)是V是G的減函數(shù)(而不僅僅是gi的增函數(shù)),記為V=V(G)。由于每只羊的生存需要一定量的青草,草地能供養(yǎng)的羊的數(shù)量有一個(gè)上限Gmax:當(dāng)G﹤Gmax時(shí),V(G)﹥0,當(dāng)G≥Gmax時(shí),V(G)=0;并且在G﹤Gmax時(shí),V(G)隨G的增大下降速度加快,見下圖:0V(G)GmaxV'(G)<0V"(G)<0G3、支付函數(shù):ui=[V(G)-c]gi假設(shè)每只羊的購(gòu)買與飼養(yǎng)成本相同為常數(shù)c令n=3,c=4,V(G)=100-(g1+g2+g3)。那么有:ui=[100--(g1+g2+g3)4]gi反應(yīng)函數(shù):R1(g2,g3)=(96-g2-g3)/2R2(g1,g3)=(96-g1-g3)/2R3(g1,g2)=(96-g1-g2)/2g1*=g2*=g3*=24,此時(shí)u1*=u2*=u3*=576。如果村里對(duì)這片草地進(jìn)行管理,即制定一條村規(guī),限制農(nóng)戶養(yǎng)羊的數(shù)量,情況將怎樣?村干部要做的優(yōu)化決策是:MaxU=Max[(100-G)-4]GGGdUdG=100-G-4-G令100-G-4-G=0Gm=48Um=2304村規(guī):gim=16﹤gi*=24uim=768﹥ui*=576三、混合策略納什均衡(一)混合策略的提出猜硬幣方正面反面正面-1,11,-1蓋硬幣方反面1,-1-1,1MatchingPennies不存在純策略意義上的NE。那么,他們的合理選擇是什么?ThedistinguishingfeatureofMatchingPenniesisthateachplayerwouldliketooutguesstheother.Inanygameinwhicheachplayerwouldliketooutguesstheother(s),thereisnoNashequilibrium(atleastasthisequilibriumconceptwasdefinedinSection1.3)becausethesolutiontosuchagamenecessarilyinvolvesuncertaintyaboutwhattheplayerswilldo.就一次游戲而言,猜測(cè)對(duì)方的策略,保密自己的策略。在多次反復(fù)游戲中,避免任何的傾向性和規(guī)律性。怎樣才能讓對(duì)方徹底猜不透?連自己也不知道自即將會(huì)采用哪個(gè)策略;把對(duì)方搞糊涂。隨機(jī)地選擇策略,即采用混合策略對(duì)純策略空間來說,可延伸的混合策略很多,如本例中雙方的純策略空間都是{正面,反面},混合策略可以是(5%,95%),(3%,97%),(20%,80%),(50%,50%),……選擇哪個(gè)混合策略?即p(正面,反面)=?先看蓋硬幣方的決策:令p蓋方(正面,反面)=(r,1-r)。這時(shí),猜硬幣方若猜正面,則支付為(期望值):V(正)=1×r+(-1)×(1-r)=2r-1若猜反面,則支付為:V(反)=(-1)×r+1×(1-r)=-2r+1如果r﹥1/2或r﹤1/2,則有V(正)﹥0﹥V(反)或V(正)﹤0﹤V(反),那么,猜方只要猜正面或猜反面就贏定了,相應(yīng)地蓋方就輸定了。所以只有使r*=1/2,蓋方才能不輸。令V(正)=V(反)使猜方猜正面與猜反面無區(qū)別。再看猜方的決策:令p(正面,反面)=(q,1-q),這時(shí)蓋方的:V(正)=(-1)×q+1×(1-q)=-2q+1V(反)=1×q+(-1)×(1-q)=2q-1同理令:V(正)=V(反),即-2q+1=2q-1得:q*=1/2NE:p蓋*(正面,反面)=(1/2,1/2)p猜*(正面,反面)=(1/2,1/2)要求:請(qǐng)驗(yàn)證是否有人愿意偏離這個(gè)概率分布。把這個(gè)包含概率分布(不確定性)的NE稱為混合策略NE?;旌喜呗远xP50DefinitionInthenormal-formgameG={S1,…,Sn;u1,…,un},supposeSi={si1,…,siK}.Thenamixedstrategyforplayeriisaprobabilitydistributionpi=(pi1,…,piK),where0≤pik≤1fork=1,…,Kand(pi1+…+piK=1.為了能簡(jiǎn)單地說明混合策略NE的精神,考慮標(biāo)準(zhǔn)式博弈G={S1,S2;u1,u2}。令S1={si1,…,siJ},S2={si1,…,siK},在純策略情況下,ui=ui(s1j,

s2k),一個(gè)確定的數(shù)值。但在采用混合策略的情況下,參與人只能把注意力集中于期望效用:ui=Vi(s1j,

s2k)。令p1=(p11,…,p1J)為參與人1的概率分布,p2=(p21,…,p2K)為參與人2的概率分布。參與人1推測(cè)到參與人2將以p2在{s21,…,s2K}上選擇,那么自己選擇純策略s1j的期望支付是V1(s1j)=∑p2kui(s1j,

s2k)k=1K并且,參與人1選擇混合策略p1的期望支付是:

V1(p1,p2)=∑p1j[∑p2ku1(s1j,

s2k)]k=1Kj=1J同理:V2(p1,p2)=∑p2k[∑p1ju2(s1j,

s2k)]j=1Jk=1K在兩人博弈里,混合策略NE是指兩個(gè)參與人的最優(yōu)混合策略組合。所謂最優(yōu)混合策略是指使參與人的期望支付最大化的混合策略。換言之,一對(duì)混合策略(p1*,p2*)要成為NE,p1*與p2*必須同時(shí)分別滿足:V(p1*,p2*)≥V(p1,p2*)與V(p1*,p2*)≥V(p1*,p2)混合策略NE定義DefinitionInthen-playernormal-formgameG={S1,…,Sn;u1,…,un},themixedstrategies(p1*,…,pn*)areaNashequilibriumifeachplayer’smixedstrategyisabestresponsetotheotherplayer’smixedstrategies:

V(pi*,p-i*)≥V(pi,p-i*)musthold.(二)混合策略NE的求解●支付等值法112113這種通過使對(duì)方選擇各個(gè)純策略的期望支付值相等來確定自己的策略空間上的最優(yōu)概率分布的方法被稱為“支付等值法”。●支付最大化法以猜硬幣游戲?yàn)槔?。令蓋硬幣方以r的概率選正面,以1-r的概率選反面,即P蓋=(r,1-r);猜硬幣方以q的概率猜正面,以1-q的概率猜反面,即P猜=(q,1-q),有:V蓋(p蓋,p猜)=r[(-1)×q+1×(1-q)]+(1-r)[1×q+(-1)×(1-q)]=-4qr+2q+2r-1

V猜(p蓋,p猜)=q[1×r+(-1)×(1-r)]+(1-q)[(-1)×r+1×(1-r)]=4qr-2q-2r+1解:MaxV蓋(p蓋,p猜)r得:q*=1/2MaxV猜(p蓋,p猜)q得:r*=1/2混合策略NE是蓋方在策略空間{正面,反面}上以概率分布P蓋*,=(1/2,1/2)進(jìn)行選擇,猜方也在策略空間{正面,反面上以概率p猜*=(1/2,1/2)進(jìn)行選擇。對(duì)混合策略的辯護(hù):*混合策略表示使用不同純策略的大量參與人。*Harsanyi:混合可以解釋為參與人收益上微小的不可觀測(cè)變動(dòng)的結(jié)果。*博弈多次反復(fù)進(jìn)行時(shí)參與人實(shí)施某一純策略的不確定次數(shù)和時(shí)間。*P52一個(gè)參與人實(shí)施混合策略的目的是給其他參與人造成不確定性,盡管其他參與人能推測(cè)到他選擇某個(gè)純策略的概率有多大,但卻不知道他到底會(huì)選哪個(gè)純策略。為了進(jìn)一步理解混合策略的實(shí)際意義,下面分析“監(jiān)察博弈”(JeanTiroleandSelten)監(jiān)察博弈“監(jiān)察博弈”是“MatchingPennies”的一種流行變種,它可以應(yīng)用于武器控制、犯罪預(yù)防和工人激勵(lì)。下圖是這一博弈的簡(jiǎn)單版本。一個(gè)工人為一個(gè)老板工作(參與人);工人可以偷懶或工作、老板可以監(jiān)察或不監(jiān)察(策略集);工人工作能為老板產(chǎn)生價(jià)值為v的產(chǎn)出,但會(huì)使自己花費(fèi)成本g。老板監(jiān)察要花費(fèi)成本h,但可以提供工人是否偷懶的證據(jù)。工人得到工資w(假設(shè)老板不允許根據(jù)觀測(cè)產(chǎn)出水平來?xiàng)l件化工資),如果工人被抓住在偷懶,則他得到0(由于有限責(zé)任的原因)。兩認(rèn)同時(shí)選擇他們的策略(特別地,老板在決定是否監(jiān)察工人時(shí)不知道工人是否會(huì)選擇偷懶)。為了限制要考察的情形數(shù)量,假設(shè)g>h>0;為了使分析更有趣,還假設(shè)w>g(否則工作對(duì)于工人來說會(huì)是一個(gè)嚴(yán)格劣策略)。監(jiān)察不監(jiān)察偷懶0,-hw,-w不偷懶w-g,v-w-hw-g,v-wP*(偷懶)=h/w,P*(監(jiān)察)=g/w武器核查、工商打假、不定期抽查等等戀人之爭(zhēng)battleofthesexes一對(duì)戀人,小娟和大海,在不同的地方上班,兩人都很珍惜周末能夠在一起的時(shí)間。某周末,小娟花高價(jià)購(gòu)得兩張芭蕾舞門票,大海也好不容易搞到兩張足球賽門票。小娟從小酷愛芭蕾,大海是個(gè)十足的足球迷,怎么辦?顯然如果各自分開過周末,那才是雙方最不樂意的事。大海芭蕾足球芭蕾小娟足球2,11,20,00,0Battleofthesexes存在兩個(gè)純策略NE:(芭蕾,芭蕾)和(足球,足球)。無法形成一致的預(yù)期,結(jié)果不確定。*Schelling(1960)認(rèn)為,在現(xiàn)實(shí)生活中,參與人可能使用某些被博弈模型抽象掉的信息來達(dá)到一個(gè)“聚點(diǎn)”(focalpoint)均衡。這些信息可能與社會(huì)文化習(xí)慣、參與人過去博弈的歷史等有關(guān)。*促成NE出現(xiàn)的另一種方法是參與人在博弈開始之前進(jìn)行不花什么成本的“廉價(jià)磋商”(cheaptalk).*Aumann(1974)證明,如果參與人可以根據(jù)某個(gè)共同觀測(cè)到的信號(hào)進(jìn)行博弈,就可能出現(xiàn)“相關(guān)均衡”(correlatedequilibrium)。如天氣拋硬幣如果兩個(gè)人都很任性,誰也不讓步,誰也不肯讓對(duì)方得意又確實(shí)離不開對(duì)方,那就變成實(shí)施混合策略:(小娟)選足球不甘心,選芭蕾又怕大海不樂意。大海也一樣。那么最優(yōu)的概率分布是什么?令小娟策略空間{芭蕾,足球}上的概率分布為(r,1-r),大海策略空間{芭蕾,足球}上的概率分布為(q,1-q),那么:V小娟=2×r×q+1×(1-r)×(1-q)=3rq+1-r-q最優(yōu)化q*=1/3V大海=1×r×q+2×(1-r)×(1-q)=3rq+2-2q-2r最優(yōu)化r*=2/3所以,混合策略NE是:小娟以2/3的概率選芭蕾,以1/3的概率選足球;大海以1/3的概率選芭蕾,以2/3的概率選足球。其效率是:V小娟=2/3=V大海<1最差的效率是兩人都為對(duì)方著想,又沒有事前溝通,結(jié)果小娟去了足球場(chǎng),而大海去了劇場(chǎng)。(三)混合策略與反應(yīng)對(duì)應(yīng)P56回顧MatchingPennies,雙方都會(huì)實(shí)施混合策略,其NE是r*=q*=(1/2,1/2)。這里,從另一個(gè)角度說明這樣的概率分布確實(shí)是一個(gè)“不動(dòng)點(diǎn)”。按照NE的條件,一個(gè)策略組合如過是一個(gè)NE,那么其中的每一個(gè)策略都是參與人針對(duì)其他參與人策略組合的最優(yōu)反應(yīng),在純策略NE中,這個(gè)“最優(yōu)反應(yīng)”可能是一個(gè)具體的純策略(如在“Prisoners’Dilemma”中),也可能是一個(gè)反應(yīng)函數(shù)(reactionfunction)(如在“CournotModelofDuopoly”中)。而在一個(gè)混合策略NE中,這個(gè)“最優(yōu)反應(yīng)”將是一個(gè)概率或很多個(gè)概率——被稱為“反應(yīng)對(duì)應(yīng)”(reactioncorrespondence)。以MatchingPennies為例。r—蓋方選正面的概率,q—猜方猜正面的概率先看蓋方的最優(yōu)反應(yīng),記為r*=R(q):當(dāng)q<1/2r*=R(q)=1當(dāng)q=1/2[0,1]當(dāng)q>1/20猜方的最優(yōu)反應(yīng)反應(yīng),記為q*=R(r)當(dāng)r<1/2q*=R(r)=0,當(dāng)r=1/2[0,1],當(dāng)r>1/21,反應(yīng)對(duì)應(yīng)與反應(yīng)函數(shù)的區(qū)別:…作為NE,各個(gè)參與人的反應(yīng)應(yīng)該同時(shí)為最優(yōu),那么只要求兩個(gè)反應(yīng)對(duì)應(yīng)的交點(diǎn),用圖示法:rq01(正面)1(正面)1/21/2r*=R(q)q*=R(r)(四)ExistenceofNashEquilibrium問題:是否所有的博弈都存在NE(純的或混合的)?*Nash在1950年證明:任何有限博弈,都至少存在一個(gè)NE。Theorem(Nash1950):Inthen-playernormal-formgameG={S1,…,Sn;u1,…,un},ifnisfiniteandSiisfiniteforeveryithenthereexistsatleastoneNashequilibrium,possiblyinvolvingmixedstrategies.Nashtheorem的證明略Wilson(1971)證明,幾乎所有有限博弈,都存在有限奇數(shù)個(gè)NE,包括純策略NE和混合策略NE?!狾ddnessTheoremP63例證,P67-69證明Problems1、Inthefollowingnormal-formgame,whatstrategiessurviveiteratedeliminationofstrictlydominatedstrategies?Whatarethepure-strategyNashequilibrium?LCRT2,01,14,2M3,41,22,3B1,30,23,02、Players1and2arebargainingoverhowtosplit10thousanddollars.Bothplayerssimultaneouslynamesharestheywouldliketohave,s1ands2,where0≤s1,s2≤1.Ifs1+s2≤1,thentheplayersreceivethesharestheynamed;ifs1+s2>1,thenbothplayersreceivezero.Whataret

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請(qǐng)下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請(qǐng)聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁(yè)內(nèi)容里面會(huì)有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫(kù)網(wǎng)僅提供信息存儲(chǔ)空間,僅對(duì)用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對(duì)用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對(duì)任何下載內(nèi)容負(fù)責(zé)。
  • 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請(qǐng)與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶因使用這些下載資源對(duì)自己和他人造成任何形式的傷害或損失。

評(píng)論

0/150

提交評(píng)論