高級(jí)微觀經(jīng)濟(jì)學(xué) 8 博弈論_第1頁(yè)
高級(jí)微觀經(jīng)濟(jì)學(xué) 8 博弈論_第2頁(yè)
高級(jí)微觀經(jīng)濟(jì)學(xué) 8 博弈論_第3頁(yè)
高級(jí)微觀經(jīng)濟(jì)學(xué) 8 博弈論_第4頁(yè)
高級(jí)微觀經(jīng)濟(jì)學(xué) 8 博弈論_第5頁(yè)
已閱讀5頁(yè),還剩51頁(yè)未讀, 繼續(xù)免費(fèi)閱讀

下載本文檔

版權(quán)說(shuō)明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請(qǐng)進(jìn)行舉報(bào)或認(rèn)領(lǐng)

文檔簡(jiǎn)介

1、PAGE PAGE 55第八章 博弈論P(yáng)AGE 225第八章 博弈論霸前面章節(jié)對(duì)經(jīng)濟(jì)版人最優(yōu)決策的討啊論,是在簡(jiǎn)單環(huán)扳境下進(jìn)行的,沒(méi)岸有考慮經(jīng)濟(jì)人之唉間決策相互影響佰的問(wèn)題。本章討罷論這個(gè)問(wèn)題,建辦立復(fù)雜環(huán)境下的捌決策理論。開(kāi)展阿這種研究的的理疤論叫做博弈論,白也稱為對(duì)策論(俺Game Th扒eory)。最翱近十幾年來(lái),博伴弈論在經(jīng)濟(jì)學(xué)中板得到了廣泛應(yīng)用絆,在揭示經(jīng)濟(jì)行昂為相互制約性質(zhì)扳方面取得了重大俺進(jìn)展。大部分經(jīng)啊濟(jì)行為都可視作霸博弈的特殊情況柏,比如把經(jīng)濟(jì)系埃統(tǒng)看成是一種博白弈,把競(jìng)爭(zhēng)均衡拌看成是該博弈的扮古諾隘-傲納什均衡。博弈斑論的思想精髓與頒方法,已成為經(jīng)氨濟(jì)分析基礎(chǔ)的必柏要組成部

2、分。版第一節(jié) 博弈事凹例扒博弈是一種日常跋現(xiàn)象,例如棋手藹下棋,雙方都要霸根據(jù)對(duì)方的行動(dòng)版來(lái)決定自己的行拜動(dòng),雙方的目的耙都是要戰(zhàn)勝對(duì)方礙,互不相容,互安相影響,互相制俺約。一般來(lái)講,半博弈現(xiàn)象的特征稗表現(xiàn)為兩個(gè)或兩案?jìng)€(gè)以上具有利害吧沖突的當(dāng)事人處芭于一種不相容的安狀態(tài)中,一方的柏行動(dòng)取決于對(duì)方絆的行動(dòng),每個(gè)當(dāng)爸事人的收益都取澳決于所有當(dāng)事人絆的行動(dòng)。當(dāng)所有阿當(dāng)事人都拿定主敗意作出決策時(shí),拔博弈的局勢(shì)就暫霸時(shí)確定下來(lái)。博敗弈論就是研究這辦種不相容現(xiàn)象的俺一種理論,并把罷當(dāng)事人叫做疤局中人叭(player奧)白。耙博弈論推廣了標(biāo)稗準(zhǔn)的一人決策理霸論。在每個(gè)局中鞍人的收益都依賴拌于其他局中人的熬選

3、擇的情況下,班追求收益最大化佰的局中人應(yīng)該如背何采取行動(dòng)?顯扳然,為了確定出扳可行的策略,每奧個(gè)局中人都必須澳考慮其他局中人岸面臨的問(wèn)題。下澳面來(lái)舉例說(shuō)明。伴例1拔扳便士匹配隘(Matchi罷ng Penn案ies)頒(跋二人零和博弈)稗設(shè)博弈中有兩個(gè)捌局中人甲和乙,襖每個(gè)局中人都有版一塊硬幣,并且八各自獨(dú)立安排硬俺幣是否正面朝上愛(ài)。局中人的收益吧情況是這樣的:笆如果兩個(gè)局中人愛(ài)同時(shí)出示硬幣正澳面或反面,那么啊甲贏得元,乙板輸?shù)粼?;如果隘一個(gè)局中人出示把硬幣正面,另一叭個(gè)局中人出示硬昂幣反面,那么甲暗輸?shù)粼?,乙贏扒得元。襖表1: 便士扒匹配博弈局勢(shì)表阿 乙甲背正面按反面胺正面絆(正,正)板(正

4、,反)氨反面岸(反,正)耙(反,反)岸對(duì)于這個(gè)博弈,奧每個(gè)局中人可選骯擇的策略都有兩敖種:正面朝上和澳反面朝上,即甲岸和乙的策略集合藹都是埃正面澳,熬反面瓣。當(dāng)甲和乙都疤作出選擇時(shí),博熬弈的局勢(shì)就確定昂了。顯然,該博吧弈的礙局勢(shì)集合辦是敖(正面板,罷正面),(正面傲,反面),(反芭面,正面),(敖反面阿,愛(ài)反面)啊,即各種可能熬的局勢(shì)的全體,拔也稱為埃局勢(shì)表挨,即表1。挨表2: 甲和百乙的收益表稗 乙絆甲板正面扒反面壩正面稗 氨 阿,哎,胺反面柏,捌 罷 柏,疤每個(gè)局中人的收癌益都取決于所有芭局中人的決策,背也就是說(shuō),局中跋人的收益是博弈埃局勢(shì)的函數(shù)。本巴例中,甲的收益安函數(shù)皚為:唉,熬,翱,

5、岸;乙的收益函數(shù)搬為:霸,板,敗,背。局中人的收益霸函數(shù)也可用表格頒或矩陣加以表示啊,并稱其為把收益表藹或敗收益矩陣俺。表2中,甲的澳收益列在左邊,吧乙的收益列在右哀邊。唉該博弈的特點(diǎn)在啊于每個(gè)局中人的案收益都是另一個(gè)俺局中人的付出,頒即甲和乙的收益扒之和為零,收支笆發(fā)生在局內(nèi),不扳涉及任何局外人把。這種博弈就是鞍所謂的哎二人零和博弈瓣。習(xí)慣上,人們皚喜歡把二人博弈壩的第一個(gè)局中人把甲叫做按“岸列芭”百,第二個(gè)局中人哀乙叫做八“拜行氨”敗,而且總是把列瓣的收益寫在前面吧(般即左邊稗)把,行的收益寫在柏后面鞍(瓣即右邊柏)搬。澳例2敗絆囚徒難題板(Prison按ers De哎li班m百ma)艾(

6、鞍二人變和博弈)板表3: 囚徒把博弈局勢(shì)表愛(ài)乙盎甲凹合作班背叛唉合作佰(礙合作,合作鞍)吧(合作,背叛)扮背叛暗(背叛,合作)背(背叛,背叛)按有兩個(gè)狂徒甲和斑乙因共同參與了哀一起犯罪活動(dòng)而背被囚禁收審。他版?zhèn)兛梢赃x擇合作拜,拒絕供出任何百犯罪事實(shí);也可拌以選擇背叛,供扒出對(duì)方的犯罪行氨徑。這就是所謂擺的囚徒博弈,也藹叫做囚徒難題。骯博弈的局中人甲捌和乙都有兩種可白選擇的策略:合盎作與背叛。挨囚徒博弈的意義矮在于它可以解釋胺寡頭壟斷廠商的盎行為,關(guān)鍵是賦懊予合作與背叛具扒體的經(jīng)濟(jì)含義。盎比如在雙頭壟斷罷的情況下,合作敗可以解釋為背“安保持索要一個(gè)高罷價(jià)啊”瓣,背叛可解釋為盎“柏降價(jià)以爭(zhēng)奪對(duì)手鞍

7、的市場(chǎng)芭”柏。右表給出了囚霸徒博弈的局勢(shì)表敖。罷局中人可以事先礙討論這局博弈,敗但實(shí)際決策必須皚獨(dú)立地做出。如把果甲采取合作策把略,不供出乙的芭犯罪事實(shí),那么邦乙就能得到30班00元的收益。扳同樣,如果乙采翱取合作策略,那捌么甲就能得到3礙000元的收益笆??梢?jiàn),如果甲皚乙雙方都采取合吧作策略,雙方各擺得3000元收愛(ài)益。翱但是,審訊者用俺1000元獎(jiǎng)賞佰來(lái)鼓勵(lì)局中人采氨取背叛策略。這吧樣,只要局中人芭選擇背叛,他就骯會(huì)得到1000疤元鼓勵(lì),而不管凹另一個(gè)局中人會(huì)耙采取什么策略。霸需要注意的是,爸囚徒博弈中的貨胺幣支付來(lái)自第三佰方按哎局外人,這正是矮囚徒博弈同便士八匹配博弈的不同俺之處。奧曼(

8、A頒umann)1愛(ài)987年對(duì)囚徒疤博弈給出了一個(gè)板特別簡(jiǎn)單的描述疤:每個(gè)局中人都爸可以對(duì)仲裁人簡(jiǎn)熬單地宣告鞍“瓣給我1000元隘”鞍或霸“班給對(duì)方3000霸元澳”胺。叭表4: 甲和斑乙的收益表頒 般乙岸 哀甲稗合作阿背叛奧合作挨3000, 爸 3000唉 0, 擺 4000芭背叛骯4000, 伴 0拜1000, 凹 1000疤簡(jiǎn)單分析一下就矮會(huì)發(fā)現(xiàn),如果一隘個(gè)局中人采取合把作策略,而另一罷個(gè)局中人采取背岸叛策略,那么采把取合作策略的局矮中人的收益為零背,而采取背叛策扒略的局中人的收哀益為4000元背(3000元收斑益再加上100疤0元的背叛鼓勵(lì)愛(ài))。如果雙方都懊采取背叛策略,傲則雙方的收益各

9、班為1000元。愛(ài)表4列出了甲乙礙雙方的收益情況翱。從收益表可以皚看出,甲乙雙方皚的收益之和不為伴零,而且收益和稗是變化的。因此版,囚徒博弈是一啊種岸變和博弈頒。案直覺(jué)上看,甲和敖乙都應(yīng)采取合作吧策略(互不供出癌對(duì)方的犯罪事實(shí)百),各得300半0元收益。但從阿收益表可以得出隘這樣的結(jié)論:如安果一個(gè)局中人認(rèn)疤為另一個(gè)局中人絆將合作,從而他擺將得到3000愛(ài)元收益,那么他氨若采取背叛策略擺,就將總共能獲霸得4000元的擺收益;如果他認(rèn)叭為另一個(gè)局中人骯為了得到100巴0元鼓勵(lì)而將背爸叛,那么他也就叭只好為了自己也隘取得1000元唉鼓勵(lì)而采取背叛耙策略(否則,他百將一無(wú)所獲)。擺總之,在收益最唉大化

10、動(dòng)機(jī)的驅(qū)使白下,局中人的最斑優(yōu)選擇是背叛。澳這樣一來(lái),甲乙拜雙方都采取背叛耙策略,各得10扮00元收益;而扒不是都采取合作鞍策略,各得30霸00元。這是一昂個(gè)典型的博弈悖柏論,問(wèn)題的關(guān)鍵頒在于每個(gè)局中人艾都有背叛的鼓勵(lì)邦,而不管其他局礙中人將做什么。盎例3疤百古諾博弈芭(雙頭壟斷:產(chǎn)癌量較量)胺法國(guó)經(jīng)濟(jì)學(xué)家古八諾(Courn擺ot)于183翱8年以天然礦泉辦井為例,首次建跋立了簡(jiǎn)單的雙頭癌壟斷博弈模型,拔其特點(diǎn)是,壟斷鞍廠商雙方都天真搬地以為對(duì)方不會(huì)巴改變?cè)挟a(chǎn)量水笆平,雙方都追求背各自利潤(rùn)最大化斑。古諾假定:挨吧有兩個(gè)天然礦泉拔在一起,分別為拌廠商甲和乙占有班;扮擺兩個(gè)礦泉都為自岸流井,生產(chǎn)

11、成本芭為零,邊際成本背也為零;靶鞍甲和乙面對(duì)相同疤的需求曲線,采跋用相同的價(jià)格;案罷雙方都以為對(duì)方熬的產(chǎn)量水平不會(huì)哎改變。在這些假巴設(shè)前提下,甲和扮乙各自獨(dú)立決定瓣自己的產(chǎn)量水平鞍,以求利潤(rùn)最大伴化。安設(shè)按是甲乙雙方共同辦面臨的反需求函扒數(shù)。當(dāng)甲的礦泉擺水產(chǎn)量為芭,乙的產(chǎn)量為疤時(shí),礦泉水的市叭場(chǎng)價(jià)格為挨,甲的利潤(rùn)扮, 乙的利潤(rùn)為艾。在這個(gè)博弈中礙,甲乙雙方的策傲略都表現(xiàn)為選擇拜產(chǎn)量水平,局中壩人的收益即為廠伴商的利潤(rùn)。當(dāng)甲巴的產(chǎn)量為熬時(shí),乙以為甲不阿會(huì)改變這一產(chǎn)量拌,而選擇一個(gè)合吧適的產(chǎn)量水平叭以使自己的利潤(rùn)吧達(dá)到最大。同樣襖,當(dāng)乙的產(chǎn)量水懊平為版時(shí),甲以為乙不疤會(huì)改變這一產(chǎn)量隘,而選擇一個(gè)合

12、拌適的產(chǎn)量水平愛(ài)以使自己的利潤(rùn)岸達(dá)到最大。伴為了說(shuō)明這個(gè)博挨弈的結(jié)果,假設(shè)阿甲乙雙方面臨的捌反需求函數(shù)翱。用靶表示這局博弈中耙甲選擇的最優(yōu)產(chǎn)埃量,百表示乙選擇的最扮優(yōu)產(chǎn)量水平,則百甲乙各自的收益芭分別為背和瓣。由于實(shí)現(xiàn)了利暗潤(rùn)最大化,因此疤解之得:當(dāng)乙的斑產(chǎn)量水平為佰時(shí),甲決定的產(chǎn)瓣量水平為阿(這是甲對(duì)乙的般反應(yīng)函數(shù));當(dāng)伴甲的產(chǎn)量水平為埃時(shí),乙決定的產(chǎn)邦量水平為按(這是乙對(duì)甲的岸反應(yīng)函數(shù))。其岸中,懊表示礦泉水市場(chǎng)辦容量(即價(jià)格為艾零時(shí)的礦泉水需哀求量)。進(jìn)一步耙求解可得:襖, 即博弈的結(jié)矮果是雙方最終各熬占據(jù)礦泉市場(chǎng)的矮三分之一。反應(yīng)熬函數(shù)說(shuō)明,古諾昂博弈中每個(gè)局中把人的決策(選定骯的產(chǎn)量

13、水平)不爸但依賴于其他局八中人的決策,而鞍且與市場(chǎng)的容量隘有關(guān)。壩例4芭阿貝特蘭博弈奧(雙頭壟斷:價(jià)敗格較量)搬古諾博弈模型描八述了雙頭壟斷廠版商之間展開(kāi)的產(chǎn)翱量較量。實(shí)際上霸廠商之間的產(chǎn)量白較量并不如價(jià)格岸較量那么普遍,艾寡頭之間應(yīng)該有半激烈的價(jià)格競(jìng)爭(zhēng)斑。不論市場(chǎng)價(jià)格佰如何,只要某一氨廠商降低價(jià)格,半而其他競(jìng)爭(zhēng)對(duì)手霸保持原價(jià)格不變扒,那么降價(jià)廠商半就能占有全部市哀場(chǎng)。這就是說(shuō),叭我們假定消費(fèi)者跋只從最低價(jià)格廠哀商那里購(gòu)買產(chǎn)品板。為此,法國(guó)經(jīng)疤濟(jì)學(xué)家貝特蘭(半Bertran靶d)于1883瓣年提出了以價(jià)格胺為選擇策略的貝半特蘭博弈模型,八反對(duì)古諾關(guān)于產(chǎn)胺量的博弈模型。笆還以礦泉水為例暗,在貝特

14、蘭博弈般模型中各廠商都礙預(yù)期對(duì)手不會(huì)改奧變價(jià)格,從而將骯自己的價(jià)格確定爸在利潤(rùn)最大化的盎水平之上。這就礙是說(shuō),貝特蘭博啊弈的構(gòu)建同古諾靶博弈相似,所不班同的是貝特蘭博背弈中局中人的策半略是選擇價(jià)格,癌而古諾博弈局中辦人的策略是選擇熬產(chǎn)量水平。捌貝特蘭博弈中兩矮個(gè)局中人甲和乙扒也是面臨相同的佰市場(chǎng)需求函數(shù),傲不過(guò)現(xiàn)在價(jià)格是擺自變量,產(chǎn)量為疤因變量(古諾模壩型正好相反)。按設(shè)市場(chǎng)需求函數(shù)岸為矮, 為了分析上柏簡(jiǎn)單起見(jiàn),進(jìn)一罷步設(shè)胺(這里,氨,搬,即與古諾模型拌中的市場(chǎng)需求相案同)。局中人的班收益仍是他所獲般得的利潤(rùn)。笆如果甲和乙不相敗互勾結(jié)串通,當(dāng)盎乙采取了價(jià)格水罷平案時(shí),甲認(rèn)為乙不岸會(huì)改變這一價(jià)

15、格扳水平,從而為了佰占領(lǐng)市場(chǎng)而要采巴取低于乙的價(jià)格伴水平俺的價(jià)格哀,于是甲的利潤(rùn)疤為藹,乙的利潤(rùn)為零懊;同樣,當(dāng)甲采懊取了價(jià)格水平背時(shí),乙認(rèn)為甲不吧會(huì)改變這一價(jià)格扒水平,從而為了唉占領(lǐng)市場(chǎng)而要采板取低于甲的價(jià)格斑水平壩的價(jià)格版,于是乙的利潤(rùn)艾為皚, 甲的利潤(rùn)為疤零。佰如果甲和乙相互邦勾結(jié)串通起來(lái),稗采取相同的價(jià)格柏策略,即爸,那么甲和乙就白能索要一個(gè)壟斷扮價(jià)格,并且每人辦可收取一半的壟斑斷利潤(rùn)。岸由此可見(jiàn),甲和奧乙的利潤(rùn)函數(shù)分罷別為: , 背如果甲和乙勾結(jié)吧串通,合作起來(lái)搬,那么雙方就能般按照最大利潤(rùn)價(jià)艾格隘獲得壟斷價(jià)格,隘并且各得最大利氨潤(rùn)的一半。這里凹,利潤(rùn)最大化價(jià)阿格是按照隘確定的。但是

16、,辦占領(lǐng)市場(chǎng)的誘惑柏對(duì)每個(gè)局中人都艾存在,只要他稍昂微降價(jià),他就能佰獲得全部市場(chǎng)。板假如甲先進(jìn)入該百礦泉市場(chǎng),那么骯甲就按照利潤(rùn)最斑大化價(jià)格$P_阿1=Q_o/(半2b)$獲取最叭大利潤(rùn)。 繼而吧乙進(jìn)入這個(gè)市場(chǎng)藹,且乙認(rèn)為甲不皚會(huì)改變他的價(jià)格耙$P_1$,于襖是乙為了奪取市八場(chǎng)而采取低于甲壩的價(jià)格水平班的一個(gè)價(jià)格奧(班。由于乙?jiàn)Z走了艾市場(chǎng),甲同樣又霸會(huì)采取低于乙的擺價(jià)格水平昂的價(jià)格扳,以?shī)Z回市場(chǎng)。跋這樣不斷往復(fù)下藹去,直至最后甲唉乙雙方都把價(jià)格暗水平定為零時(shí)才版可達(dá)到均衡,此八時(shí)雙方的收益為捌零,市場(chǎng)各占一斑半(即甲的銷售岸量壩和乙的銷售量翱相等,且瓣)。這就是甲乙扳雙方不合作的結(jié)隘果,雙方都

17、變得壩更差。拔以上分析表明:絆把貝特蘭博弈與板古諾博弈作比較搬,對(duì)同一市場(chǎng)來(lái)胺說(shuō),由于選擇了按不同的策略集合半(一個(gè)以產(chǎn)量作挨為策略,另一個(gè)辦以定價(jià)作為策略爸),得出了不同隘的博弈結(jié)果,貝阿特蘭博弈的均衡背價(jià)格、均衡產(chǎn)量翱和均衡利潤(rùn)都呈隘完全競(jìng)爭(zhēng)狀態(tài)(熬超額利潤(rùn)為零)安,而古諾博弈的鞍結(jié)果不是這樣;敖再把貝特蘭博弈愛(ài)同囚徒難題博弈癌作比較,二者具扳有相似的結(jié)構(gòu),凹即局中人合作會(huì)靶取得最好的結(jié)果皚,但利益的誘惑岸促使他們采取不敗合作的行動(dòng),致翱使雙方博弈的結(jié)版局都變得更差。爸貝特蘭博弈也可凹用囚徒博以來(lái)解哀釋:合作是指兩靶個(gè)廠商的勾結(jié),霸背叛是指兩個(gè)廠拜商獨(dú)立行動(dòng),沒(méi)翱有勾結(jié)。合作,白可以索要一

18、個(gè)高拜的壟斷價(jià)格;背扒叛,則導(dǎo)致市場(chǎng)笆價(jià)格為零,雙方藹利潤(rùn)為零??梢?jiàn)稗,雙方合作起來(lái)按,對(duì)兩個(gè)廠商都瓣有利,似乎應(yīng)該俺合作。但博弈的頒最終結(jié)果是雙方澳都采取背叛策略吧,導(dǎo)致誰(shuí)也得不傲到利潤(rùn)。伴本節(jié)所舉的這些罷事例說(shuō)明,寡頭柏壟斷廠商之間展暗開(kāi)的競(jìng)爭(zhēng)與較量翱完全可以用博弈擺加以描述和研究胺。實(shí)際上,經(jīng)濟(jì)背學(xué)中大部分經(jīng)濟(jì)吧現(xiàn)象都可以作為澳博弈的特殊情形般進(jìn)行研究,比如俺歷史上解決競(jìng)爭(zhēng)胺均衡的存在性這吧一經(jīng)濟(jì)學(xué)基本問(wèn)藹題時(shí),就把經(jīng)濟(jì)昂系統(tǒng)看成為一局敖博弈。拌為了研究博弈,胺必須抓住博弈現(xiàn)隘象的基本要素,絆這些要素是:局熬中人、策略、收搬益。也就是說(shuō),壩博弈可以用局中芭人集合、策略集敗合和收益函數(shù)加敗

19、以描述。局中人拌從策略集合中選皚擇一種策略后所按獲得的效用或利佰益,就是局中人癌的收益(pay白o(hù)ffs),也懊叫做得失。我們熬假定每一個(gè)局中敗人都知道他自己按和別人的策略集矮合與收益函數(shù),岸這就是說(shuō),每個(gè)斑局中人的策略集皚合與收益函數(shù)為啊所有局中人所共巴知。當(dāng)然,每個(gè)瓣局中人都知道其翱他局中人掌握著哀這些信息和知識(shí)安。局中人的收益胺不但依賴于他自笆己的策略選擇,擺而且依賴于其他爸局中人的策略選靶擇。我們?cè)偌俣◥?ài)每個(gè)局中人在給霸定的主觀信念下暗會(huì)選擇收益最大拌化的行動(dòng),并且柏當(dāng)新的信息根據(jù)扒貝葉斯規(guī)則到來(lái)板時(shí),這些信息會(huì)靶得到修正(即根瓣據(jù)貝葉斯全概率澳公式從先驗(yàn)概率背計(jì)算后驗(yàn)概率)凹。疤第二

20、節(jié) 策略博骯弈藹為了能夠正確地捌應(yīng)用博弈論研究拜經(jīng)濟(jì)問(wèn)題,需要扳對(duì)博弈加以準(zhǔn)確唉地描述和定義。襖要定義一個(gè)博弈岸,需要確定三件疤事情:一是局中白人集合(set扳 of pla熬yers),一吧是局中人的策略拌集合(set 挨of stra鞍tegies)藹,一是局中人的敗收益函數(shù)(pa耙yoff fu芭nction)八。這三件事情中耙,確定策略集合壩是至關(guān)重要的。懊局中人以策略決頒定勝負(fù),目標(biāo)是哎使他的收益最大絆化。這種以策略扳定勝負(fù)的博弈,八稱為半策略博弈按(game o擺f strat昂egy)。正象矮比較古諾博弈和敖貝特蘭博弈時(shí)說(shuō)邦明的問(wèn)題一樣,稗用博弈論研究經(jīng)邦濟(jì)問(wèn)題時(shí),對(duì)于岸同一經(jīng)濟(jì)

21、現(xiàn)象,把由于選擇了不同挨的策略集合,得癌到的博弈結(jié)果截氨然不同。辦用稗表示博弈的局中辦人集合,昂表示局中人胺的策略集合,白表示拌的收益函數(shù),則敖就表示了一個(gè)博按弈。根據(jù)局中人敖的多少,博弈可拌分為挨二人博弈伴和哀多人博弈笆。根據(jù)博弈的策辦略集合是否有限皚,博弈還又可分安為扮有限博弈懊和暗無(wú)限博弈襖。例如,便士匹疤配和囚徒難題都拌是有限博弈,而辦古諾博弈和貝特耙蘭博弈都是無(wú)限澳博弈。還可根據(jù)瓣所有局中人的收拔益總和是否固定頒,把博弈分為笆常和博弈背和拔變和博弈拔。常和博弈分為跋零和博弈伴(即收益總和為版零的博弈)和哎非零和博弈俺。二人零和有限安博弈是所有博弈矮中最簡(jiǎn)單、最重般要的一類,通常版稱為

22、翱矩陣博弈擺。本節(jié)以二人博奧弈為重點(diǎn),介紹把有關(guān)策略博弈的八概念與理論。扳一策略表與收柏益矩陣八設(shè)二人博弈的局霸中人是甲和乙。叭甲有襖種可選策略,策伴略表為辦;乙有啊種可選策略,策盎略表為柏。當(dāng)甲采取策略拔,乙采取策略扒時(shí),般稱為博弈的搬局勢(shì)芭,集合邦就是皚局勢(shì)集合隘(扮局勢(shì)表拌、案局勢(shì)矩陣哀),即翱每個(gè)局中人選擇挨自己的策略時(shí),敖都要考慮對(duì)手的岸行動(dòng)。這樣每個(gè)敖局中人的收益不氨但與自己的選擇斑有關(guān),而且與對(duì)敗手的選擇有關(guān),吧收益函數(shù)是定義哀在局勢(shì)集合拔上的函數(shù),這里瓣假定了局中人的邦收益是可以用實(shí)凹數(shù)來(lái)都來(lái)計(jì)量的唉。用鞍表示局中人甲的瓣收益函數(shù),用班表示局中人乙的把收益函數(shù)。由于巴局勢(shì)集合懊

23、是有限集合,收稗益函數(shù)辦和壩都可用矩陣加以凹表示,這些矩陣拜就稱為阿收益矩陣安。記把,愛(ài),則甲和乙的收哀益矩陣分別為:,礙當(dāng)罷(常數(shù))胺時(shí),該博弈就是矮常和博弈。否則啊,就是變和博弈胺。局中人的策略挨與收益也可用收芭益表加以表達(dá):壩表1: 博弈盎的收益表斑乙的策略柏甲的策略拔埃,昂,盎唉,辦,耙,唉矮,唉捌,埃,澳絆,辦一般情況下,二擺人博弈可表示成吧。但對(duì)于二人常哎和博弈,則可簡(jiǎn)般單地表示成拜,其中哀為收益的常數(shù)和笆。而矩陣博弈則皚可更簡(jiǎn)單地表示啊成挨,或者直接用甲哎的收益矩陣板來(lái)表示矩陣博弈搬。霸二最小最大原背理隘局中人的目標(biāo)是襖選擇使自己收益拌最大化的策略,班我們來(lái)分析局中班人如何決策。

24、假昂定甲乙雙方彼此笆了解對(duì)方的收益邦表。如果甲通過(guò)襖間諜獲悉乙采取伴某種策略胺時(shí),甲必然會(huì)采唉取相應(yīng)的某種策襖略搬,以求自己的收懊益最大,即選擇頒使下式成立:澳但是,當(dāng)甲不知頒道乙會(huì)采取什么胺策略時(shí),如果甲擺是一個(gè)避險(xiǎn)者,稗那么他必將作最扒壞的打算,以求唉取得較好的效果罷。首先,甲要從辦收益表中找出自八己的每一種策略巴下至少可獲得的瓣收益盎(俺即所能獲得的最?yuàn)W小收益捌)啊,即先求解盎,然后從這些最昂小收益策略中選半擇出收益最大的昂策略,即鞍“跋從最小收益中選鞍擇最大收益扳”藹。從收益矩陣來(lái)稗看這個(gè)決策過(guò)程百,即甲首先選出芭自己的收益矩陣安的各行的最小值敗,然后從這些最案小值中再選出最霸大值:礙

25、這就是求解策略扒博弈的昂最小最大原理斑,其合理性表現(xiàn)邦為:如果甲采取鞍按照最小最大原埃理確定的策略,唉那么不論乙采取百什么策略,甲都白可至少得到這個(gè)版最小最大收益。拔由此可見(jiàn),最小柏最大原理是能夠罷確保局中人收益艾的一種原理。今鞍后,我們把局中稗人甲按照最小最鞍大原理所確定的懊策略,叫做甲的板穩(wěn)妥策略板。敗對(duì)于局中人乙來(lái)擺說(shuō),他的決策行伴為和決策過(guò)程同皚甲是一樣的,只盎不過(guò)乙要依賴于胺收益矩陣壩。乙決策的最小斑最大原理是:乙暗先選出收益矩陣安的各列的最小值擺,然后從這些最擺小值中選出最大般值:岸局中人乙按照最俺小最大原理確定艾的策略,稱為乙扮的哀穩(wěn)妥策略芭。熬讀者可能會(huì)問(wèn):挨甲先找出他的收熬益

26、矩陣各列的最氨大值,然后再?gòu)陌线@些最大值中選氨出最小值,不也哎是一種很好的決巴策辦法嗎?其實(shí)般,這種決策辦法骯叫做最大最小法辦,照此辦法做出靶的決策,在甲不絆知道乙會(huì)采取什辦么策略的情況下辦不能保證甲的最捌大最小收益能夠敖達(dá)到。原因在于翱最大最小法需要吧確定出乙的每種傲策略下甲的最大吧可能的收益。假絆如甲按照最大最柏小法選出了策略艾, 那么當(dāng)乙采阿用策略胺時(shí),甲可得到最熬大最小收益辦。但是,若乙采半用的不是策略斑, 而是策略案,那么甲如不重埃新選擇他的收益靶矩陣第俺列的最大值的話般,他的最大最小白收益凹就不一定能夠達(dá)壩到,這正是最大拔最小法同最小最岸大原理的區(qū)別。鞍實(shí)際中,在甲不拜知道乙會(huì)采取

27、什板么策略的情況下百選定了自己的策愛(ài)略以后,乙的策隘略才出臺(tái),為甲瓣也獲悉了乙的這澳一行動(dòng)時(shí),甲很芭有可能來(lái)不及調(diào)敖整自己原定的策絆略,從而給甲帶礙來(lái)一定的損失。疤因此,最大最小背法在保證局中人靶收益方面不如最鞍小最大原理那么阿保險(xiǎn)。邦當(dāng)甲和乙的穩(wěn)妥哀策略都已選定時(shí)背,二者結(jié)合起來(lái)岸能否成為博弈的扮結(jié)果呢?答案是擺未必。請(qǐng)看下面版二人零和博弈的胺事例。白例1愛(ài).扮 熬高度不確定的博辦弈靶考慮二人博弈背,甲的策略集合骯,乙的策略集合班,甲和乙的收益翱矩陣拌和安通過(guò)博弈的收益扒表給出跋(罷見(jiàn)表2拜)搬。礙表2: 甲和叭乙的收益表安乙壩甲隘4,敖1,白2,稗3,翱對(duì)于甲來(lái)說(shuō),澳;對(duì)于乙來(lái)說(shuō),鞍。這說(shuō)

28、明甲的穩(wěn)般妥策略是爸,乙的穩(wěn)妥策略藹是阿。胺但是,當(dāng)甲采取扮時(shí),乙采取案的收益擺小于采取柏的收益笆,因而乙要改用胺策略頒。在乙改用哎后,甲采取策略般的收益稗小于采取胺的收益擺,因而甲也要改巴用策略捌。而當(dāng)甲改用班后,乙采用板的收益壩小于采用安的收益拔,于是乙又要改笆回到愛(ài);在乙改回到壩后,甲也要改回稗到收益最大的策鞍略唉。這就讓我們看稗到:當(dāng)甲采取靶時(shí),乙要采用??;然后甲改用笆,乙隨之改用鞍;甲再改用敗,乙又改用扒,如此不斷往復(fù)骯下去,博弈的結(jié)扒局是高度不確定伴的。熬一般來(lái)講,要想熬一個(gè)二人博弈阿具有確定的結(jié)局佰,必須存在這樣癌的局勢(shì)凹:捌滿足這個(gè)條件的敖的局勢(shì)絆,叫做博弈氨的拔均衡伴或澳最優(yōu)

29、解跋或拔最優(yōu)局勢(shì)疤,其中的耙和皚分別叫做局中人靶甲和乙的頒最優(yōu)策略笆或擺均衡策略傲。這個(gè)條件也就瓣叫做博弈的笆均衡條件氨。捌對(duì)于二人常和博敖弈暗來(lái)說(shuō),昂是博弈的最優(yōu)解礙當(dāng)且僅當(dāng)版數(shù)學(xué)中,滿足這班個(gè)條件的點(diǎn)挨叫做函數(shù)暗的奧鞍點(diǎn)扒。因此,把是博弈的最優(yōu)解捌當(dāng)且僅當(dāng)捌是收益函數(shù)隘的鞍點(diǎn)扮。下面的定理給佰出了鞍點(diǎn)的判別捌條件。拌鞍點(diǎn)定理隘暗是收益函數(shù)鞍的鞍點(diǎn)的充要條骯件是挨:拌證明:拜必要性敖.澳 設(shè)百是艾的鞍點(diǎn),即礙。拔從岸可知,扮對(duì)一切安成立,這就蘊(yùn)含拌著罷,即拜。稗注意,暗。這就證明了半。伴充分性昂設(shè)稗滿足版。從隘可知礙;從皚可知瓣。所以,艾,即耙是函數(shù)傲的鞍點(diǎn)。絆傲既然二人常和博笆弈的最優(yōu)解恰

30、好案就是收益函數(shù)的敗鞍點(diǎn),鞍點(diǎn)定理昂告訴我們,當(dāng)收氨益函數(shù)的鞍點(diǎn)存凹在時(shí),利用最小矮最大原理確定的拌博弈局勢(shì)就是二岸人常和博弈的最挨優(yōu)解。八但是,當(dāng)收益矩斑陣不存在鞍點(diǎn)時(shí)半,常和博弈就沒(méi)俺有最優(yōu)解,博弈拜的結(jié)局就是高度熬不確定的。鑒于氨此,我們將有鞍跋點(diǎn)的常和博弈稱辦為柏嚴(yán)格確定的博弈拔。三反應(yīng)函數(shù)辦博弈叭的局中人總是要邦考慮對(duì)手的行動(dòng)懊,然后確定自己哎的對(duì)策。當(dāng)乙采背取了某種策略懊,而且被甲所覺(jué)捌察時(shí),甲必然有叭所反應(yīng),要確定把出相應(yīng)的對(duì)策敖以使自己的收益瓣在乙選擇拜的情況下達(dá)到最昂大,即要使耙。甲對(duì)乙的行動(dòng)把的這種反應(yīng),確頒定了一個(gè)從乙的拔策略集合背到甲的策略集合捌的映射暗,即對(duì)任何疤,甲

31、的反應(yīng)策略哎是按照安來(lái)確定的。這個(gè)敗映射巴就叫做甲對(duì)乙的般反應(yīng)函數(shù)俺。挨同樣的道理,可吧以確定出乙對(duì)甲矮的反應(yīng)函數(shù)翱,即對(duì)任何八,藹是按照搬來(lái)確定的。翱利用反應(yīng)函數(shù),懊我們也可以解釋案博弈的結(jié)局。就盎象古諾博弈一樣熬,假如甲先采取盎某種策略隘,乙通過(guò)某種途暗徑獲悉了甲的這拔一行動(dòng),并認(rèn)為癌甲不會(huì)改變他的百策略,于是作出鞍反應(yīng),決定采取澳策略凹,以使自己的收澳益最大化。當(dāng)乙靶采取策略疤時(shí),甲掌握了這俺一信息,并認(rèn)為昂乙不會(huì)改變他的叭策略,于是作出般反應(yīng),改變?cè)瓉?lái)斑的策略,決定采唉用案,以求收益最大昂化。這時(shí),乙再板次對(duì)甲的行為作般出反應(yīng),采取新靶策略扮。甲也再次對(duì)乙辦的行動(dòng)作出反應(yīng)盎,采取新策略

32、頒。這樣的反應(yīng)不背斷下去,直到最?yuàn)W后達(dá)到哎且挨時(shí)博弈實(shí)現(xiàn)了均鞍衡,此時(shí)的局勢(shì)岸就是博弈的最優(yōu)背解跋(拔均衡、最優(yōu)局勢(shì)哎)。靶綜上所述,博弈擺的結(jié)局是實(shí)現(xiàn)均敗衡,并且均衡由岸甲乙雙方的反應(yīng)唉函數(shù)確定,即由氨方程組暗決定。事實(shí)上,澳是該方程組的解扳當(dāng)且僅當(dāng)哎,而這正是博弈爸實(shí)現(xiàn)均衡的含義胺。注意,以上關(guān)氨于反應(yīng)函數(shù)的討唉論,沒(méi)有要求策疤略集合的有限性壩,即集合拔和唉可以是任何集合巴。把下面考慮二人無(wú)唉限博弈的一種特癌殊情況:策略集挨合昂和罷都是實(shí)數(shù)區(qū)間。扮比如,本章第一矮節(jié)例3中古諾博拜弈的局中人策略唉集合就是區(qū)間按(半直線),例八4中貝特蘭博弈啊的局中人策略集跋合也是半直線。佰假設(shè)局中人甲和懊乙

33、的收益函數(shù)岸和襖可微,則甲對(duì)乙耙的反應(yīng)函數(shù)背由方程邦(叭一階條件叭)奧決定,乙對(duì)甲的耙反應(yīng)函數(shù)熬由方程俺(矮一階條件班)邦決定,從而博弈柏的最優(yōu)解就是如跋下方程組的解:白例2般柏二人博弈的反應(yīng)把函數(shù)及最優(yōu)解稗設(shè)二人博弈中,稗甲和乙的策略集懊合愛(ài)和傲為澳,收益函數(shù)暗和跋分別如下:八求偏導(dǎo)數(shù)得方程壩組瓣。由此可知局中頒人甲和乙的反應(yīng)搬函數(shù)分別為般,博弈的最優(yōu)解哀為愛(ài)。擺四策略選擇的礙經(jīng)濟(jì)模擬挨第一節(jié)中曾經(jīng)指跋出,描述一個(gè)博案弈時(shí)策略集合的芭選擇至關(guān)重要。皚比較古諾博弈和扳貝特蘭博弈,雖隘然二者的目的都案是要模擬同一經(jīng)愛(ài)濟(jì)現(xiàn)象白百雙頭壟斷,但二斑者的結(jié)構(gòu)卻很不胺同。古諾博弈中熬廠商的策略是選版擇產(chǎn)量

34、,廠商的懊收益是策略變量骯的連續(xù)函數(shù);而跋貝特蘭博弈中廠哎商的策略是選擇巴價(jià)格,廠商的收按益是策略變量的爸非連續(xù)函數(shù)。這氨導(dǎo)致了相當(dāng)不同耙的均衡,究竟哪凹一種是正確的呢哎?辦如果抽象地看待扮這個(gè)問(wèn)題,那么邦“按哪一種模型正確芭”按這樣的提問(wèn)并無(wú)矮什么意義。要回阿答這個(gè)問(wèn)題,就巴必須看模型試圖百模擬什么。不要案問(wèn)哪一種模型是凹正確的,而去問(wèn)捌策略選擇中什么頒樣的考慮是切入癌主題的,這樣的頒提問(wèn)可能會(huì)更加鞍有益一些。比如跋,如果我們觀察熬OPEC公司的哎公告,就會(huì)發(fā)現(xiàn)叭OPEC企圖為霸每一個(gè)員工決定版產(chǎn)量配額,并且澳允許按照世界石八油市場(chǎng)價(jià)格定價(jià)捌,這樣按照產(chǎn)量癌水平而不是按價(jià)芭格水平來(lái)模擬博頒弈

35、策略,就可能挨更加合理。擺在策略選擇的經(jīng)伴濟(jì)模擬中還有另安一方面的考慮,板乃就是一旦對(duì)手懊的行為被觀察到壩,那么對(duì)手的策熬略應(yīng)該是被承諾笆的或者是難以改艾變的。然而到目背前為止,所描述絆的博弈是敗“擺一次性靶”白(one-sh背ot)博弈,其捌特點(diǎn)是一旦知道胺對(duì)手的行動(dòng),策啊略變量可以很快板地進(jìn)行調(diào)整。例昂如,假設(shè)我為我扳的產(chǎn)品選擇一個(gè)扒價(jià)格,然后發(fā)現(xiàn)盎我的對(duì)手制定了案一個(gè)略低一些的半價(jià)格,在這種情邦況下我可以很快按地調(diào)整我的價(jià)格擺。因此,盡管昂“皚一次性跋”骯博弈所描述的現(xiàn)罷象應(yīng)該是發(fā)生在案實(shí)際生活中的現(xiàn)壩實(shí),但在扒“奧一次性拌”般博弈中模擬這種捌能夠很快調(diào)整的跋策略反應(yīng)并不具百有多大的意義

36、。氨似乎應(yīng)該使用多耙階段博弈,這樣把才能捕獲到策略盎選擇行為的所有扮可能的內(nèi)容。白另一方面,如果辦我們把古諾博弈叭中的產(chǎn)量水平解辦釋成為廠商的生把產(chǎn)能力,那么一扳定產(chǎn)量的產(chǎn)品生把產(chǎn)就可能是不可暗撤消或不可改變版的資本投資。這百種情況下,廠商胺一旦發(fā)現(xiàn)對(duì)手的昂產(chǎn)量水平,而要翱改變廠商自己的拌產(chǎn)量水平,則可百能是難以辦到或愛(ài)非常昂貴的。生霸產(chǎn)能力或產(chǎn)量水艾平似乎是廠商策板略的天然選擇,瓣即使一次性博弈捌中也是這樣。癌同大部分經(jīng)濟(jì)模奧擬一樣,在策略叭選擇的經(jīng)濟(jì)模擬凹中,如果既要讓版博弈簡(jiǎn)單明了以鞍便分析,又要能隘夠說(shuō)明實(shí)際策略癌的迭接要素,那耙么如何表示博弈疤的策略選擇,就半是一項(xiàng)藝術(shù)。癌第三節(jié) 重

37、復(fù)博巴弈絆到目前為止,所捌談?wù)摰牟┺氖且话ご涡缘?。其?shí),按任何博弈都可以熬一次一次地重復(fù)八進(jìn)行,且每一次挨重復(fù)都不是簡(jiǎn)單絆地重復(fù)前一次的擺著法,而會(huì)考慮伴得比前一次更全扳面些,技法也會(huì)班更高些。就好像拜棋手下棋一樣,暗一局結(jié)束了再開(kāi)暗一局,前一局在岸某些著法上吃了爸虧,這一局中就懊會(huì)吸取教訓(xùn)而加盎以注意,正所謂柏“絆吃一暫,長(zhǎng)一智搬”搬。反反復(fù)復(fù)地開(kāi)艾局,給棋手不斷艾積累經(jīng)驗(yàn),讓棋瓣手的技藝越來(lái)越頒高。藹通過(guò)博弈的重復(fù)叭進(jìn)行,局中人的八經(jīng)驗(yàn)越來(lái)越豐富澳,這種經(jīng)驗(yàn)源于礙博弈歷史。實(shí)際矮上,重復(fù)博弈中頒的每一點(diǎn)處,局凹中人決定自己的癌選擇時(shí)會(huì)考慮到扮達(dá)該點(diǎn)之前的全疤部博弈歷史,比骯如象棋棋手在上哎

38、一局中因出車慢跋而吃了虧,那么翱這一局中就會(huì)吸叭取前一局的教訓(xùn)爸而趕快把車開(kāi)出疤來(lái)。這樣一來(lái),癌重復(fù)博弈中局中半人的策略空間隨瓣著博弈被重復(fù)的般次數(shù)的增加而變辦得越來(lái)越大,也藹就是說(shuō),博弈歷靶史越長(zhǎng),局中人邦的策略空間越大邦,可以選擇的著爸法越多。由于矮“芭我的對(duì)手會(huì)基于白我的選擇歷史而爸修正他的行為,傲我必須在做出自稗己的選擇時(shí)考慮礙到這種影響愛(ài)”扮,所以,重復(fù)博版弈的結(jié)果不絕不疤是一次性博弈的般簡(jiǎn)單重復(fù)。藹例1哀.般 扒囚徒博弈的重復(fù)傲我們以囚徒博弈搬為例,來(lái)分析重班復(fù)博弈問(wèn)題。囚拌徒博弈中,企圖靶獲得胺“熬(合作,合作)啊”靶解是兩個(gè)局中人昂的長(zhǎng)期利益所在百。對(duì)于每個(gè)局中骯人來(lái)說(shuō),可行的

39、奧做法是試著給另埃一個(gè)局中人發(fā)出皚“懊信號(hào)百”澳以表明他的拔“艾善意扳”般,并且在博弈一扳開(kāi)始移動(dòng)就進(jìn)行斑合作。當(dāng)然,背敖叛是另一個(gè)局中斑人的短期利益所矮在。如果他不合癌作而采取背叛策百略,那么對(duì)方就巴可能失去耐心而斑從此以后永遠(yuǎn)只翱實(shí)行背叛。這樣氨一來(lái),背叛者就啊會(huì)因只看到眼前擺利益而喪失合作埃的長(zhǎng)期利益?;逃谶@種推理可以鞍得到的事實(shí)是,案一個(gè)局中人目前暗的做法將在未來(lái)半將得到回應(yīng)哎背其他局中人的未哎來(lái)選擇可能依賴稗于這個(gè)局中人當(dāng)敖前的選擇。礙現(xiàn)在來(lái)分析一下俺“背(合作,合作)啊”昂局勢(shì)能否成為重半復(fù)囚徒博弈的一佰個(gè)均衡。我們分拜兩種情況進(jìn)行討疤論,一種情況是柏有限次重復(fù)博弈艾,另一種情況

40、是按無(wú)限次重復(fù)博弈礙。絆先討論有限次重邦復(fù)博弈,為此假凹定每個(gè)局中人都把知道博弈將重復(fù)跋一個(gè)固定的次數(shù)叭(比如重復(fù)次半)。考慮最后一巴輪博弈實(shí)施之前癌局中人給予的推柏理,此時(shí)每個(gè)人藹都認(rèn)為他們?cè)谶M(jìn)胺行一次性博弈。埃由于這是最后一懊次移動(dòng),將來(lái)不按會(huì)再有,因此均艾衡的標(biāo)準(zhǔn)邏輯推拌理便得以應(yīng)用,吧其結(jié)果是局中人熬雙方都選擇半“靶背叛捌”靶策略。再考慮最跋后一次移動(dòng)之前奧的移動(dòng),這里似骯乎每個(gè)局中人都皚重視合作,以向岸對(duì)方發(fā)出他是版“八好人擺”安的信號(hào),以便能啊在下一次以及最巴后一次移動(dòng)中合矮作。但是,我們癌已經(jīng)看到,最后啊一次移動(dòng)中雙方唉都將采取背叛,跋因此在倒數(shù)第二按次的移動(dòng)中合作捌就沒(méi)有什么優(yōu)

41、勢(shì)凹可言。采取合作拔是為了得到長(zhǎng)期百利益,為了在將版來(lái)最后一次移動(dòng)柏中得到回應(yīng)。然奧而,將來(lái)最后一敗次移動(dòng)中并不能靶得到合作,雙方跋都背叛了,結(jié)果斑倒數(shù)第二次移動(dòng)澳中雙方也只有采皚取背叛。同理不擺斷向后歸納(b案ackward癌s哀 凹inducti爸on),結(jié)果最愛(ài)后一次移動(dòng)之前佰的所有移動(dòng)中,奧合作并不能帶來(lái)拌什么長(zhǎng)期利益,爸沒(méi)有什么優(yōu)點(diǎn),奧局中人惟有相信啊其他局中人將在背最后一次移動(dòng)中澳背叛,用現(xiàn)在的鞍善意企圖去影響般未來(lái)下一次的移擺動(dòng)是無(wú)利可圖的柏。因此,在重復(fù)絆某一固定次數(shù)的芭囚徒難題重復(fù)博爸弈中,每一局博拌弈的均衡局勢(shì)都拔是白“瓣(背叛,背叛)癌”扒,而不是般“白(合作,合作)斑”

42、安。啊再來(lái)考慮博弈可氨無(wú)限次重復(fù)的情胺況。當(dāng)博弈的重藹復(fù)次數(shù)為無(wú)限時(shí)扒,情況就大不相芭同了。此時(shí),局吧中人在每一個(gè)階耙段都知道博弈至傲少還要重復(fù)一次搬以上,因而合作背大有前景,長(zhǎng)期跋利益在望。在這扳種無(wú)限次重復(fù)的阿囚徒博弈中,每拌個(gè)人的策略都是稗一個(gè)函數(shù)序列,伴它表明每個(gè)局中懊人在每個(gè)階段是霸選擇合作還是選斑擇背叛,都是作叭為此階段之前博安弈歷史的函數(shù)。頒重復(fù)博弈中,局叭中人的收益是各耙階段收益的貼現(xiàn)按值之總和搬擺貼現(xiàn)和跋(昂向時(shí)刻0貼現(xiàn))昂。具體地說(shuō),設(shè)懊局中人在時(shí)刻阿的收益癌(百即第八局重復(fù)中的收益白)板為頒,他在重復(fù)博弈礙中的收益就是貼唉現(xiàn)和板,其中八為貼現(xiàn)率。只要敗貼現(xiàn)率不很高,癌囚徒

43、博弈每一局藹重復(fù)的均衡局勢(shì)案便都是岸“藹(合作,合作)罷”昂,每個(gè)人在各個(gè)柏階段都會(huì)看到合暗作的利益。為了擺說(shuō)明這個(gè)事實(shí),板我們采用第一節(jié)擺例2提供的數(shù)據(jù)佰。哀假設(shè)兩個(gè)局中人版一直合作,移動(dòng)翱到了時(shí)刻胺。如果本次移動(dòng)扒中一個(gè)人決定背昂叛,那么另一個(gè)跋人會(huì)因本次移動(dòng)熬中采取合作而未愛(ài)得收益,從而從唉下次以后永遠(yuǎn)采辦取背叛策略,給俺對(duì)方以懲罰。第暗一個(gè)背叛者從本癌次開(kāi)始,以后只伴能繼續(xù)背叛(因翱為合作的收益為癌零),結(jié)果他雖拜然在本次移動(dòng)中拔立即得到了40笆00元的收益,百但也以以后無(wú)限伴次的1000元哎收益這個(gè)低收益扳流來(lái)毀滅自己,哀他從背叛中得到擺的收益貼現(xiàn)和為氨元。另一方面,霸如果他持續(xù)合作

44、安下去,永不背叛吧,那么對(duì)方也不敗會(huì)背叛,于是他敖從合作中得到的氨收益貼現(xiàn)和為辦元。比較伴和叭可知,只要貼現(xiàn)懊率奧,就有岸。這就說(shuō)明,只白要貼現(xiàn)率不很高耙,當(dāng)一方背叛時(shí)拌,另一方也采取半背叛給其以懲罰傲,就能使背叛者叭償其苦果。由此胺看來(lái),只有雙方熬互相合作下去。骯如有一方背叛,扮另一方就要執(zhí)行靶懲罰策略來(lái)使背扒叛者飽償苦果,哎因而沒(méi)有一方能澳夠從背叛中會(huì)有翱收獲。所以,在唉貼現(xiàn)率不很高的背情況下,囚徒博翱弈重復(fù)的均衡是扳局中人雙方在各柏階段都采取合作拜策略。隘以上論述實(shí)際上艾是很有力的,有柏一個(gè)稱為弗爾克案(Folk)的挨著名定理支持了把這一論述。該定啊理斷言:在重復(fù)爸的囚徒博弈中,啊任何收

45、益如果高矮于局中人雙方一芭致背叛所能得到扒的收益,那么都凹將被作為重復(fù)博把弈均衡而得到支般持。上面我們還愛(ài)提到了懲罰策略澳,實(shí)際上這個(gè)策班略可明確敘述成俺:扮“哎在當(dāng)前移動(dòng)中合般作,除非其他局盎中人在最后移動(dòng)白中背叛傲”邦。采取這個(gè)策略柏的理由是,如果搬一個(gè)局中人背叛拔,那么他將在收挨益上得到永久性昂懲罰。另外,上叭面論述中還涉及藹到了貼現(xiàn)率,并皚要求貼現(xiàn)率不很鞍高。實(shí)際上,當(dāng)阿貼現(xiàn)率很高時(shí),敖當(dāng)前收益就是特罷別重要的,因?yàn)榘皩?lái)的貨幣貶值壩太大了,現(xiàn)在的皚收益要抵得上將按來(lái)收益的好幾倍翱,因而當(dāng)事人只邦好顧及當(dāng)前收益案,力求當(dāng)前收益哀越多越好,而把隘未來(lái)長(zhǎng)遠(yuǎn)利益放癌在次要位置上。邦下面再看一

46、個(gè)雙鞍頭壟斷的重復(fù)博扒弈事例。骯例2盎辦維持卡特爾罷考慮一個(gè)簡(jiǎn)單的隘重復(fù)雙頭壟斷,邦如果兩個(gè)廠商都藹執(zhí)行古諾博弈均瓣衡策略,則得到哀利潤(rùn)搬;如果以共同利拌潤(rùn)最大化決定產(chǎn)挨量水平,即執(zhí)行鞍卡特爾行動(dòng),則埃得到利潤(rùn)壩。我們知道,一敗次性博弈中共同跋利潤(rùn)最大化的產(chǎn)隘量不是博弈均衡鞍,每個(gè)廠商都有安激勵(lì)去傾銷額外翱數(shù)量的產(chǎn)品,如襖果他認(rèn)為其他廠鞍商將保持產(chǎn)量不隘變的話。但是在疤重復(fù)博弈中,只壩要貼現(xiàn)率不太高把,合作起來(lái)以使爸共同利潤(rùn)最大化鞍之策略,將是重襖復(fù)博弈的最優(yōu)解暗。襖可以證明,如果案這種簡(jiǎn)單的雙頭拜壟斷博弈是一次半性的,那么每個(gè)巴廠商以古諾產(chǎn)量擺生產(chǎn)將是博弈的靶最優(yōu)解。但是,絆如果這個(gè)博弈是吧

47、不斷重復(fù)的,那唉么每個(gè)廠商都采霸取按照卡特爾產(chǎn)安量生產(chǎn)的策略,搬即都選擇合作,叭將是雙頭壟斷重芭復(fù)博弈的最優(yōu)解扒。對(duì)不合作的適頒當(dāng)懲罰,是采取班生產(chǎn)古諾產(chǎn)量水艾平這一策略。可氨見(jiàn),在不斷重復(fù)拔的雙頭壟斷博弈板中,由于一次性癌博弈均衡這種懲般罰策略的存在,按局中人都將以長(zhǎng)柏遠(yuǎn)利益為重,來(lái)巴維持卡特爾。昂第四節(jié) 混合策澳略版并非所有博弈都拔有嚴(yán)格確定的結(jié)埃局。進(jìn)一步,實(shí)安際中博弈局中人俺常常希望自己的版行動(dòng)隱秘不被暴版露,不被對(duì)手覺(jué)矮察。對(duì)于這兩個(gè)芭問(wèn)題,目前意義班上的策略博弈是唉解決不了的。在骯博弈非嚴(yán)格確定矮或者局中人希望般保守秘密的情況哎下,局中人的最安好做法是采取混捌合策略,即以一挨定的概

48、率采取某胺種策略。這樣做板,甚至連局中人背自己也不知道每襖一次行動(dòng)中究竟跋采取什么策略,柏競(jìng)爭(zhēng)對(duì)手就更不隘得而知了。而且扳對(duì)于非嚴(yán)格確定把的博弈來(lái)說(shuō),采翱用混合策略就可靶求得最優(yōu)解。當(dāng)昂一種混合策略以藹概率1選擇某種疤策略時(shí),這種策艾略就是前三節(jié)所叭談?wù)摰陌选鞍婕儼摹卑也呗裕梢?jiàn)混合巴策略擴(kuò)展了策略暗概念。唉一混合策略的骯概念唉我們以兩人博弈拜為例,來(lái)對(duì)混合擺策略的概念以及癌采取混合策略時(shí)安局中人的行動(dòng)目敖標(biāo)進(jìn)行解釋。至隘于更一般的多人辦博弈,將在下一癌節(jié)中討論。稗設(shè)搬為有限二人策略安博弈,其中礙為局中人甲的策笆略集合,邦為乙的策略集合澳,澳和背分別為甲和乙的百收益函數(shù)。唉局中人為了保持百自己

49、決策的秘密扮性,不再象以前奧那樣選擇純策略爸,而決定采用隨芭機(jī)辦法來(lái)選擇策皚略。也就是說(shuō),啊局中人對(duì)純策略八的選擇由某種隨襖機(jī)裝置來(lái)決定,擺對(duì)每個(gè)純策略來(lái)般說(shuō),采用它只有板可能性的大小,案也就是用多大的哀概率來(lái)選擇各個(gè)隘純策略。這樣,班對(duì)方就不可能事白先知道究竟選擇笆哪個(gè)純策略,甚啊至連局中人自己罷也不可能事先知辦道,而純策略是跋在最后時(shí)刻借助佰隨機(jī)裝置選擇出叭來(lái)的。通過(guò)借助捌隨機(jī)裝置,局中板人原來(lái)對(duì)純策略骯的選擇變成為現(xiàn)捌在對(duì)各個(gè)純策略般的概率大小的選敖擇。襖如果還嫌借助隨班機(jī)裝置給出的選艾擇各個(gè)純策略的熬概率大小具有一百定的客觀性,怕扮被對(duì)方估計(jì)出來(lái)骯,局中人還可進(jìn)霸一步采取主觀概耙率分布

50、,以使對(duì)安純策略的選擇帶辦有真正的不確定皚性(參見(jiàn)第六章敗關(guān)于主觀概率的搬介紹)。凹這種以某種概率矮選擇的策略就是邦混合策略,更準(zhǔn)邦確地說(shuō),選擇混懊合策略就是選擇疤一個(gè)概率分布,拔然后按照這個(gè)分?jǐn)[布給出的概率來(lái)奧選擇各個(gè)純策略暗。假如甲選擇策頒略扮的概率為版 頒,唉,則向量斑代表著甲選擇各傲種純策略的概率氨分布,實(shí)際上就芭表示了甲的一種骯混合策略。這就辦是說(shuō),混合策略哎是用概率分布邦來(lái)表示的,混合敖策略的變化完全板反映為概率分布懊的變化。今后,班我們把概率分布霸就稱為局中人甲拜的捌混合策略柏。挨原來(lái)的純策略挨可看成是這樣的懊一種混合策略:八以概率1選擇策伴略岸,以概率0選擇笆其他策略壩。如此一

51、來(lái),甲皚的策略集合由原拌來(lái)的純策略集合澳擴(kuò)張成為混合策愛(ài)略集合伴。同樣,局中人啊乙的選擇集合也挨由原來(lái)的純策略稗集合澳擴(kuò)張成為混合策氨略集合胺。當(dāng)甲采取混合皚策略拜,乙采取混合策拌略背時(shí),襖就稱為博弈把的擺混合局勢(shì)暗。傲在采取混合策略班的情況下,局中頒人的目標(biāo)是要使拔預(yù)期收益最大化白。當(dāng)甲采取混合柏策略般,乙采取混合策翱略版時(shí),甲和乙的預(yù)啊期收益分別為暗和哀:版這里,唉和背都寫成行向量形熬式,罷“擺”翱為轉(zhuǎn)置運(yùn)算。甲扒的收益函數(shù)由原傲來(lái)的白擴(kuò)充成為跋,乙的收益函數(shù)拜由原來(lái)的案擴(kuò)充成為版。盎在策略集合和收瓣益函數(shù)都得到擴(kuò)唉充以后,原來(lái)的昂純策略博弈岸就擴(kuò)充成為混合扳策略博弈白,而且板可看成是一般

52、的半二人博弈,不過(guò)辦這個(gè)博弈的收益唉函數(shù)具有雙線性搬性,即對(duì)于任何背,扳,及任何實(shí)數(shù)扒,都成立:拜的混合局勢(shì)就是盎的局勢(shì)。博弈氨叫做純策略博弈扒的壩混合擴(kuò)充骯。關(guān)于混合擴(kuò)充盎,下述兩個(gè)事實(shí)骯是明顯的:骯(1) 罷博弈辦是常和博弈當(dāng)且矮僅當(dāng)混合擴(kuò)充安是常和博弈爸。板(2) 敖如果叭是常和博弈,則搬混合擴(kuò)充啊保持了原來(lái)博弈版的收益和傲。啊混合擴(kuò)充瓣的最優(yōu)解跋(昂均衡唉)艾,叫做原博弈爸的拔最優(yōu)混合解敖(唉混合均衡昂)奧。也即挨是疤的最優(yōu)混合解,盎是指熬且昂。當(dāng)瓣是把的最優(yōu)混合解時(shí)啊,捌和頒分別叫做甲和乙斑的拜最優(yōu)混合策略柏??梢宰C明:叭(3) 岸純策略博弈辦的最優(yōu)解必然是岸混合擴(kuò)充巴的最優(yōu)解胺。稗

53、(4) 吧當(dāng)拔是常和博弈時(shí),靶是捌的最優(yōu)混合解當(dāng)拔且僅當(dāng)拔。霸從班(4)皚可知,扮是常和博弈把的最優(yōu)混合解當(dāng)襖切僅當(dāng)班是預(yù)期收益函數(shù)頒的鞍點(diǎn)。應(yīng)用第敖二節(jié)的鞍點(diǎn)定理扳,我們得到常和擺博弈的最優(yōu)混合鞍解的又一判別條阿件:隘(5) 般設(shè)板是二人常和博弈愛(ài),則翱是班的最優(yōu)混合解的氨充分必要條件是扳 俺。盎二混合策略的澳意義罷有時(shí),給予混合敖策略一個(gè)有意義敗的解釋是困難的岸。第一節(jié)例1所把述的便士匹配博艾弈,由于收益矩隘陣沒(méi)有鞍點(diǎn),因罷而沒(méi)有純策略意爸義下的最優(yōu)解。把但由于硬幣出現(xiàn)矮正面或反面,總擺有一個(gè)概率分布絆情況,因此采取俺混合策略來(lái)把便奧士匹配博弈加以捌擴(kuò)充,然后尋找巴混合策略意義下拔的最優(yōu)解

54、,這顯疤然是我們大家都佰能夠感覺(jué)得到的搬應(yīng)該采取的做法拔。然而對(duì)于象雙邦頭壟斷這樣的一拜些其他經(jīng)濟(jì)利益板博弈來(lái)說(shuō),采取挨混合策略似乎是絆不現(xiàn)實(shí)的。頒除了混合策略在襖一定范圍內(nèi)缺乏敗現(xiàn)實(shí)意義外,還扳有一些邏輯上的半原因?qū)е聦?duì)混合霸策略難以解釋。傲我們用一個(gè)例子安來(lái)說(shuō)明這一點(diǎn)。唉例1埃傲性別博弈埃(Battle背 of the骯 Sexes)性別博弈收益表叭卡夫芭茹達(dá)胺話劇阿足球把話劇澳2,1暗0,0版足球版0,0敗1,2靶這里介紹的博弈八背后隱藏的故事扮是一場(chǎng)般“靶性別之戰(zhàn)壩”氨。茹達(dá)(Rho皚nda,女)和佰卡夫(Calv霸in,男)本周熬末一起歡度良宵阿,但他們二人的擺娛樂(lè)愛(ài)好不同。擺茹達(dá)喜

55、歡看話劇耙,而卡夫喜歡看拌足球比賽。如果盎他們同時(shí)選擇看跋話劇,則茹達(dá)可拌得2個(gè)單位的效把用,卡夫可得1阿個(gè)單位的效用;跋如果同時(shí)選擇看奧足球比賽,則他扳們得到的效用正艾好與此相反;如稗果他們選擇不同吧的娛樂(lè),則得不安到任何效用。右擺表給出了茹達(dá)和懊卡夫的收益情況傲。我們來(lái)看一看巴茹達(dá)和卡夫之間斑這場(chǎng)凹“罷性別之戰(zhàn)哀”按博弈的結(jié)局究竟凹如何。凹首先,讓我們尋啊找該博弈的所有扒純策略意義下的矮最優(yōu)解。通過(guò)對(duì)斑各種策略進(jìn)行逐啊一相互比較,不襖難看出版“埃(話劇,話劇)按”絆和昂“擺(足球,足球)伴”絆都是純策略最優(yōu)班解,即茹達(dá)和卡癌夫選擇相同的娛拔樂(lè),才是最好的襖做法。柏然后,我們來(lái)尋拜找混合策略

56、意義隘下的最優(yōu)解。茹拜達(dá)的收益矩陣把和卡夫的收益矩半陣澳為:,背茹達(dá)的預(yù)期收益扮為瓣,卡夫的預(yù)期收骯益為隘。因此,最優(yōu)混版合策略問(wèn)題可歸阿結(jié)為如下的約束耙極值問(wèn)題:邦應(yīng)用Kuhn-扳Tucker條背件(參見(jiàn)第七章頒第八節(jié)),上述八極值問(wèn)題的解為八,敖,壩,柏。這就是說(shuō),茹盎達(dá)以概率敗選擇看話劇,以翱概率傲選擇看足球比賽背;卡夫以概率皚選擇看話劇、以半概率稗選擇看足球比賽澳,是性別博弈的柏最優(yōu)混合局勢(shì)。胺這個(gè)最優(yōu)解有這岸樣幾個(gè)特點(diǎn):第挨一,茹達(dá)和卡夫瓣采取最優(yōu)混合策班略的預(yù)期收益都稗等于2/3;第罷二,如果茹達(dá)采皚取最優(yōu)混合策略疤,那么不論卡夫扳采取什么純策略癌,卡夫的預(yù)期收叭益也都是2/3傲;

57、第三,如果卡哀夫采取最優(yōu)混合凹策略,那么不論稗茹達(dá)采取什么純凹策略,她的預(yù)期稗收益也都是2/拜3。這樣一來(lái),傲還有什么理由要拌求茹達(dá)和卡夫雙邦方都采取最優(yōu)混敖合策略呢?看來(lái)稗,要想人們采取斑混合策略,必須挨有一些更加令人把興奮的理由。芭本例說(shuō)明,從邏吧輯上講,采用混疤合策略沒(méi)有多少哀道理。盡管如此鞍,在某些情況下柏這種邏輯上的毛芭病不會(huì)帶來(lái)嚴(yán)重百問(wèn)題。例如,假哀定有一大群人在皚隨機(jī)碰面并玩便敗士匹配游戲,甲伴是其中一員。設(shè)哎最初每個(gè)人都按皚概率分布(1/搬2,1/2)執(zhí)伴行唯一的最優(yōu)混藹合策略,到最后疤有些人便厭倦于隘執(zhí)行此混合策略隘,而決定總是玩傲正面游戲或總是愛(ài)玩反面游戲。如罷果決定總出正

58、面白的人數(shù)等于決定半總出反面的人數(shù)稗,那么各個(gè)局中按人的選擇問(wèn)題不般會(huì)有明顯變化:邦每個(gè)人仍然理性辦地以為他的對(duì)手氨以50的可能白性出正面或反面皚。也就是說(shuō),雖擺然每個(gè)人都決定板采取純策略而總俺是出正面或反面般,但當(dāng)甲隨機(jī)碰昂到一個(gè)局中人時(shí)斑,該人是出正面翱還是反面,甲不捌得而知,只能作唉出這樣的判斷:熬該人出正面的可把能性為50。八這等同于該人采凹取混合策略。叭對(duì)混合策略的另壩一種解釋是:考懊慮某人在一次性柏博弈中出正面還艾是反面的選擇,艾這個(gè)選擇被看作頒是依賴于一些為跋對(duì)手所不能確定疤的特殊因素。比熬如,該人心想暗“版正面藹”半時(shí)就出正面,心愛(ài)想罷“稗反面奧”伴時(shí)就出反面。這氨種俺“氨心想

59、胺”罷因素是很難為對(duì)鞍手所把握的,一辦個(gè)人可以自我覺(jué)般察到自己的心情傲,但其他人(對(duì)鞍手) 卻難以覺(jué)跋察這個(gè)人的心情礙。因此,每個(gè)局版中人都會(huì)認(rèn)為其拔他人對(duì)策略的選盎擇是隨機(jī)的。這爸樣,采取混合策疤略就是一件有意絆義的事情。疤第五節(jié) 矩陣博安弈的古諾均衡把前面介紹的博弈挨最優(yōu)解(均衡)稗概念,假定了局把中人各自獨(dú)立行柏動(dòng),沒(méi)有合作。安這種非合作二人擺博弈均衡概念,熬最早是由古諾提案出來(lái)的,稱為古白諾均衡。無(wú)合作皚意味著局中人之壩間存在著利害沖版突,互相對(duì)抗,辦互為對(duì)手。矩陣叭博弈愛(ài)(哎即二人零和博弈版)艾是對(duì)這種或?qū)拱锠顟B(tài)的簡(jiǎn)明刻畫(huà)叭,本節(jié)就下面就頒矩陣博弈均衡的吧存在性與算法問(wèn)罷題及其均衡

60、的性挨質(zhì)進(jìn)行討論。柏一均衡的存在疤性氨收益矩陣的鞍點(diǎn)氨未必存在,這使背得矩陣博弈的均絆衡未必存在。但挨當(dāng)采用混合策略罷時(shí),情況就不同班了:矩陣博弈的岸最優(yōu)混合解總是拜存在的。下面用板von Neu罷mann(19阿37)的構(gòu)造性柏方法來(lái)證明這一霸事實(shí),構(gòu)造性方安法本身蘊(yùn)含著古扒諾均衡的一種計(jì)班算方法。鞍矩陣博弈均衡的半存在性按捌任何矩陣博弈都版有混合均衡奧。般具體來(lái)說(shuō),設(shè)背 拜為矩陣博弈暗,矮,阿,哎為叭的混合擴(kuò)充,則邦必存在耙滿足挨。傲本定理的證明較昂長(zhǎng),會(huì)令讀者感拜到枯燥。但證明安過(guò)程給出了古諾瓣均衡的計(jì)算方法斑,學(xué)習(xí)掌握這一吧計(jì)算方法是重要扳的,讀者有必要襖靜下心來(lái)琢磨一盎下。佰首先注意

溫馨提示

  • 1. 本站所有資源如無(wú)特殊說(shuō)明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請(qǐng)下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請(qǐng)聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁(yè)內(nèi)容里面會(huì)有圖紙預(yù)覽,若沒(méi)有圖紙預(yù)覽就沒(méi)有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫(kù)網(wǎng)僅提供信息存儲(chǔ)空間,僅對(duì)用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對(duì)用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對(duì)任何下載內(nèi)容負(fù)責(zé)。
  • 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請(qǐng)與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶因使用這些下載資源對(duì)自己和他人造成任何形式的傷害或損失。

最新文檔

評(píng)論

0/150

提交評(píng)論