博弈論-范如國(guó)_第1頁(yè)
博弈論-范如國(guó)_第2頁(yè)
博弈論-范如國(guó)_第3頁(yè)
博弈論-范如國(guó)_第4頁(yè)
博弈論-范如國(guó)_第5頁(yè)
已閱讀5頁(yè),還剩476頁(yè)未讀 繼續(xù)免費(fèi)閱讀

下載本文檔

版權(quán)說(shuō)明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請(qǐng)進(jìn)行舉報(bào)或認(rèn)領(lǐng)

文檔簡(jiǎn)介

博弈論

GameTheory

范如國(guó)教授rgfanchina@

武漢大學(xué)經(jīng)濟(jì)與管理學(xué)院公郵:gametheoryfan@163.com密碼:highgpa教材:范如國(guó),博弈論,武漢大學(xué)出版社,2011參考書(shū):1.[美]哈羅德.W.庫(kù)恩,博弈論經(jīng)典,中國(guó)人民大學(xué)出版社2.[美]羅伯特.吉本斯,博弈論基礎(chǔ),中國(guó)社會(huì)科學(xué)出版社3.[美]艾里克.拉斯繆森,博弈與信息,北京大學(xué)出版社4.肖條軍,博弈論及其應(yīng)用,上海三聯(lián)書(shū)店第一章

什么是博弈幾個(gè)博弈的例子:1.高考填報(bào)志愿2.外交談判3.企業(yè)合作與競(jìng)爭(zhēng)4.金融危機(jī)5.就業(yè)“要想在現(xiàn)代社會(huì)做一個(gè)有文化的人,你必須對(duì)博弈論有一個(gè)大致了解”——保羅·薩繆爾森一.什么是“博弈”“博弈論”譯自英文“GameTheory”?!癎ame”的基本意義是游戲,因此“GameTheory”直譯應(yīng)該是“游戲理論”。

博弈即一些個(gè)人、隊(duì)組或其他組織,面對(duì)一定的環(huán)境條件,在一定的規(guī)則下,同時(shí)或先后,一次或多次,從各自允許選擇的行為或策略中進(jìn)行選擇并加以實(shí)施,各自取得相應(yīng)結(jié)果的過(guò)程。博弈論(GameTheory,又名對(duì)策論)是一門以數(shù)學(xué)為基礎(chǔ)的、研究對(duì)抗沖突中最優(yōu)解決問(wèn)題的學(xué)科,更確切地說(shuō)是運(yùn)籌學(xué)的一個(gè)分支,開(kāi)山鼻祖是數(shù)學(xué)家、計(jì)算機(jī)的發(fā)明者馮·諾意曼(Vonneumann)。他是一位出生于匈牙利的天才的數(shù)學(xué)家。他不僅創(chuàng)立了經(jīng)濟(jì)博弈論,而且發(fā)明了計(jì)算機(jī)。

1944年他和普林斯頓經(jīng)濟(jì)學(xué)家摩根斯坦恩(Morgenstern)合寫(xiě)了一本書(shū),《博弈論和經(jīng)濟(jì)行為》(TheTheoryofGamesandEconomicBehaviour),正式奠定了現(xiàn)代博弈論的基礎(chǔ),標(biāo)志著現(xiàn)代系統(tǒng)博弈理論的的初步形成。博弈論作為一門學(xué)科,是在20世紀(jì)50~60年代發(fā)展起來(lái)的。1950和1951年,Nash發(fā)表了兩篇關(guān)于非合作博弈的重要文章,明確提出了NashEquilibrium的概念,揭示了博弈論和經(jīng)濟(jì)均衡之間的關(guān)系,并證明了均衡解的存在,奠定了現(xiàn)代非合作博弈論的基石。到20世紀(jì)70年代,博弈論正式成為主流經(jīng)濟(jì)學(xué)研究的主要方法之一。1994年諾貝爾經(jīng)濟(jì)學(xué)獎(jiǎng)同時(shí)授予了納什、澤爾騰、海薩尼三位博弈論專家。1996年諾獎(jiǎng)授予兩位博弈論與信息經(jīng)濟(jì)學(xué)研究專家莫里斯、維克瑞;2001年諾獎(jiǎng)授予阿克洛夫、斯彭斯、斯蒂格利茨,表彰他們?cè)跈幟适袌?chǎng)、信號(hào)傳遞和信號(hào)甄別等非對(duì)稱信息理論研究中的開(kāi)創(chuàng)性貢獻(xiàn)。2005年諾貝爾經(jīng)濟(jì)學(xué)獎(jiǎng)又授予了美國(guó)經(jīng)濟(jì)學(xué)家托馬斯.謝林(ThomasSchelling)和以色列經(jīng)濟(jì)學(xué)家羅伯特.奧曼(RobertAumann),以表彰他們?cè)诤献鞑┺姆矫娴木薮筘暙I(xiàn)。最近十幾年來(lái),博弈論在經(jīng)濟(jì)學(xué)中得到了廣泛地運(yùn)用,在揭示經(jīng)濟(jì)行為相互制約性質(zhì)方面。今天,在現(xiàn)代經(jīng)濟(jì)學(xué)里,博弈論已經(jīng)成為十分標(biāo)準(zhǔn)的分析工具。

TheNobelMemorialPrizeinEconomicSciences

2007-LeonidHurwicz,EricS.Maskin,RogerB.Myerson2005-RobertJ.Aumann,ThomasC.Schelling2001-GeorgeA.Akerlof,A.MichaelSpence,JosephE.Stiglitz1996-JamesA.Mirrlees,WilliamVickrey1994-JohnC.Harsanyi,JohnF.NashJr.,ReinhardSelten1994年三位獲諾獎(jiǎng)的博弈論學(xué)者JohnNashJohnHarsanyLeihadenSelten納什(Nash):Nash-Equilibrium約翰·納什,1928年生于美國(guó)

1994年Nobel經(jīng)濟(jì)學(xué)獎(jiǎng)得主在非合作博弈的均衡分析

理論方面做出了開(kāi)創(chuàng)性的

貢獻(xiàn),對(duì)博弈論和經(jīng)濟(jì)學(xué)

產(chǎn)生了重大影響。納什傳奇的經(jīng)歷納什1928年6月13日出生于美國(guó)弗吉尼亞西部,從小就表現(xiàn)出非凡的數(shù)學(xué)天分1948年獲得數(shù)學(xué)碩士學(xué)位1950年在普林斯頓獲得數(shù)學(xué)博士學(xué)位,博士論文關(guān)于博弈論的研究,在45年后獲得諾貝爾獎(jiǎng)1951-1959年,在MIT數(shù)學(xué)中心任教。在1958年底,納什的心智狀態(tài)出現(xiàn)問(wèn)題。因?yàn)榫穹至寻Y,在1959年丟了MIT的工作。后來(lái)妻子Alicia也最終和他離婚,但仍然繼續(xù)幫助他。納什在妻子和普林斯頓朋友和同事的無(wú)微不至的關(guān)懷幫助下,和自己的不懈努力下,病情逐漸好轉(zhuǎn)起來(lái)。經(jīng)歷了近30年的精神病的折磨,又重新回到了學(xué)術(shù)研究中。1994年,納什和其他兩位博弈論的學(xué)者一起獲得了諾貝爾經(jīng)濟(jì)學(xué)獎(jiǎng)。2002年3月24日,當(dāng)74歲的納什拉著妻子Alicia的手走進(jìn)柯達(dá)劇院奧斯卡頒獎(jiǎng)現(xiàn)場(chǎng)時(shí),整個(gè)劇院爆發(fā)出熱烈的掌聲。2002年3月24日,第74屆奧斯卡頒獎(jiǎng)典禮在好萊塢柯達(dá)劇院隆重開(kāi)幕。一部名叫《美麗心靈》(abeautifulmind)的影片大出風(fēng)頭,在獲得八項(xiàng)提名后,獨(dú)得最佳影片、最佳導(dǎo)演、最佳改編劇本、最佳女配角四項(xiàng)大獎(jiǎng)。美麗

心靈澤爾藤(Selten):Subgame-PerfectNashE---

萊因哈德·澤爾騰,1930年生于德國(guó)1994年Nobel經(jīng)濟(jì)學(xué)獎(jiǎng)得主在非合作博弈的均衡分析理論方面做出了開(kāi)創(chuàng)性的貢獻(xiàn),對(duì)博弈論和經(jīng)濟(jì)學(xué)產(chǎn)生了重大影響。海薩尼(Harsanyi):Bayes-NashEquilibrium約翰·海薩尼,1920年生于美國(guó)1994年Nobel經(jīng)濟(jì)學(xué)獎(jiǎng)得主莫里斯1996獲獎(jiǎng)?wù)材匪埂つ锼?/p>

1936年生于英國(guó)在信息經(jīng)濟(jì)學(xué)理論領(lǐng)域做出了重大貢獻(xiàn),尤其是不對(duì)稱信息條件下的經(jīng)濟(jì)激勵(lì)理論威廉·維克瑞1914-1996,生于美國(guó),1996獲獎(jiǎng)在信息經(jīng)濟(jì)學(xué)、激勵(lì)理論、博弈論等方面都做出了重大貢獻(xiàn)邁克爾·斯賓斯(Spence)2001獲獎(jiǎng)斯賓斯(A.MichaelSpence)生于1943年,美國(guó)加州斯坦福大學(xué)教授為不對(duì)稱信息市場(chǎng)的一般理論奠定了基石。他們的理論迅速得到了應(yīng)用,從傳統(tǒng)的農(nóng)業(yè)市場(chǎng)到現(xiàn)代的金融市場(chǎng)。他們的貢獻(xiàn)來(lái)自于現(xiàn)代信息經(jīng)濟(jì)學(xué)的核心部分......阿克洛夫(GeorgeA.Akerlof)生于1940年,美國(guó)加州大學(xué)伯克萊分校教授為不對(duì)稱信息市場(chǎng)的一般理論奠定了基石。他們的理論迅速得到了應(yīng)用,從傳統(tǒng)的農(nóng)業(yè)市場(chǎng)到現(xiàn)代的金融市場(chǎng)。他們的貢獻(xiàn)來(lái)自于現(xiàn)代信息經(jīng)濟(jì)學(xué)的核心部分......2001獲獎(jiǎng)斯蒂格利茲(JosephE.Stiglitz)生于1943年,美國(guó)紐約哥倫比亞大學(xué)教授為不對(duì)稱信息市場(chǎng)的一般理論奠定了基石。他們的理論迅速得到了應(yīng)用,從傳統(tǒng)的農(nóng)業(yè)市場(chǎng)到現(xiàn)代的金融市場(chǎng)。他們的貢獻(xiàn)來(lái)自于現(xiàn)代信息經(jīng)濟(jì)學(xué)的核心部分......2001獲獎(jiǎng)羅伯特·奧曼(RobertJ.Aumann)1930年6月出生于德國(guó)的法蘭克福,擁有以色列和美國(guó)雙重國(guó)籍。通過(guò)博弈論分析,促進(jìn)了人們對(duì)沖突和合作的理解2005獲獎(jiǎng)托馬斯·謝林(ThomasC.Schelling)1921年出生于美國(guó)加利福尼亞州的奧克蘭市。通過(guò)博弈論分析,促進(jìn)了人們對(duì)沖突和合作的理解2005獲獎(jiǎng)LeonidHurwicz(里奧尼德·赫維克茲)1917年出生于俄羅斯莫斯科,后加入美國(guó)國(guó)籍,目前為美國(guó)明尼蘇達(dá)大學(xué)經(jīng)濟(jì)學(xué)榮譽(yù)教授創(chuàng)立和發(fā)展了“機(jī)制設(shè)計(jì)理論”。這一理論有助于經(jīng)濟(jì)學(xué)家、各國(guó)政府和企業(yè)識(shí)別在哪些情況下市場(chǎng)機(jī)制有效,哪些情況下市場(chǎng)機(jī)制無(wú)效。此外,借助“機(jī)制設(shè)計(jì)理論”,人們還可以確定最佳和最有效的資源分配方式。2007獲獎(jiǎng)馬斯金(EricS.Maskin)

1950年出生于美國(guó)紐約,現(xiàn)任美國(guó)普林斯頓進(jìn)修學(xué)院教授創(chuàng)立和發(fā)展了“機(jī)制設(shè)計(jì)理論”。這一理論有助于經(jīng)濟(jì)學(xué)家、各國(guó)政府和企業(yè)識(shí)別在哪些情況下市場(chǎng)機(jī)制有效,哪些情況下市場(chǎng)機(jī)制無(wú)效。此外,借助“機(jī)制設(shè)計(jì)理論”,人們還可以確定最佳和最有效的資源分配方式。2007獲獎(jiǎng)羅杰·B·梅爾森(RogerB.Myerson)1951年出生在美國(guó)波士頓,現(xiàn)任美國(guó)芝加哥大學(xué)教授創(chuàng)立和發(fā)展了“機(jī)制設(shè)計(jì)理論”。這一理論有助于經(jīng)濟(jì)學(xué)家、各國(guó)政府和企業(yè)識(shí)別在哪些情況下市場(chǎng)機(jī)制有效,哪些情況下市場(chǎng)機(jī)制無(wú)效。此外,借助“機(jī)制設(shè)計(jì)理論”,人們還可以確定最佳和最有效的資源分配方式。2007獲獎(jiǎng)

梅爾森為芝加哥大學(xué)經(jīng)濟(jì)系教授。他于1951年3月29日生于美國(guó)波士頓,美國(guó)國(guó)籍。他有兩名孩子,分別生于1983年及1985年。梅爾森于1976年獲得哈佛大學(xué)應(yīng)用數(shù)學(xué)系哲學(xué)博士學(xué)位,其博士課題為“一種合作博弈理論(ATheoryofCooperativeGames)”。教授1976年獲得哈佛大學(xué)應(yīng)用數(shù)學(xué)博士學(xué)位,對(duì)博弈論有深入的研究。著有《博弈論:矛盾沖突分析》(GameTheory:AnalysisofConflict)及《經(jīng)濟(jì)決策的概率模型》(ProbabilityModelsforEconomicDecisions)。博弈論是人們深刻理解諸如經(jīng)濟(jì)行為和社會(huì)問(wèn)題的基礎(chǔ)?,F(xiàn)在人們所說(shuō)的博弈論,一般指非合作博弈論。非合作博弈強(qiáng)調(diào)的是個(gè)人理性、個(gè)人最優(yōu)決策,其結(jié)果可能是有效率的,也可能是無(wú)效率的。它的特征是:人們行為相互作用時(shí),行為人不能達(dá)成一個(gè)有約束力的協(xié)議?;蛘哒f(shuō),行為人之間的合約對(duì)于簽約人沒(méi)有實(shí)質(zhì)性約束力。然而,在各種生活行為中,人與人之間除了競(jìng)爭(zhēng)關(guān)系,還存在合作關(guān)系,常常是兩種關(guān)系并存,合理的合作能夠給雙方帶來(lái)共同利益。這是合作型博弈論研究的范疇。博弈論的應(yīng)用非常廣泛,利用博弈論可以證明現(xiàn)實(shí)生活中許多有趣的問(wèn)題。如:多勞者不多得,公共資源的過(guò)度使用,非合作者在一段時(shí)間內(nèi)選擇合作。雖然這些結(jié)論都是建立在一個(gè)很強(qiáng)的假設(shè),即參與人是理性的,有最大化自己效用的趨勢(shì)。但是其結(jié)論有深刻的哲學(xué)內(nèi)涵。目前經(jīng)濟(jì)學(xué)中的委托——代理制、激勵(lì)理論都可以用博弈論來(lái)分析?,F(xiàn)代的企業(yè)間競(jìng)爭(zhēng)有很多情況都是在合作的背景下進(jìn)行的。

博弈論目前在生物學(xué),經(jīng)濟(jì)學(xué),國(guó)際關(guān)系,計(jì)算機(jī)科學(xué),政治學(xué),軍事戰(zhàn)略和其他很多學(xué)科都有廣泛的應(yīng)用。

此外,博弈論也應(yīng)用于數(shù)學(xué)的其他分支,如概率,統(tǒng)計(jì)和線性規(guī)劃等。

為國(guó)王畫(huà)像

從前,有個(gè)國(guó)王,瘸了一條腿,瞎了一只眼睛。他想得到一張稱心如意的畫(huà)像,便召來(lái)三位著名的畫(huà)家為他作畫(huà)。一位畫(huà)家把國(guó)王畫(huà)得儀表堂堂,氣概非凡,特別是把兩只眼睛畫(huà)得炯炯有神,把兩條腿畫(huà)得健壯有力。國(guó)王一看,很不滿意,氣憤地說(shuō):“睜著眼睛胡畫(huà),肯定是個(gè)拍馬逢迎的騙子?!?/p>

第二位畫(huà)家把國(guó)王畫(huà)得維妙維肖,簡(jiǎn)直像國(guó)王本人一樣,瞎眼瘸腿一目了然。國(guó)王看過(guò)大發(fā)雷霆,把畫(huà)像踩在腳下吼叫起來(lái)。

第三位畫(huà)家十分從容地畫(huà)好了,發(fā)怒的國(guó)王一見(jiàn)到這張畫(huà)像,頓時(shí)轉(zhuǎn)怒為喜,連聲稱贊畫(huà)得好。

第三位畫(huà)家是怎樣畫(huà)的呢?

火車過(guò)隧道兩條火車軌道除了在隧道內(nèi)的一段外都是平行鋪設(shè)的。由于隧道的寬度不足以鋪設(shè)雙軌,因此,在隧道內(nèi)只能鋪設(shè)單軌。據(jù)某人觀察,一天下午,一列火車從某一方向駛?cè)胨淼?,另一列火車從相反方向駛?cè)胨淼?。兩列火車都以最高的速度行駛,然而,它們并未相撞。這是為什么?二.博弈的標(biāo)準(zhǔn)式表達(dá)博弈的標(biāo)準(zhǔn)式表達(dá)包括以下八個(gè)方面:1.博弈的參與者(Players)

2.各博弈方各自可選擇的全部策略(Strategies)或行為(Actions)的集合

3.進(jìn)行博弈的次序(Orders)

4.博弈方的得益(Payoffs)5.博弈行為(action)

6.博弈信息(information)7.結(jié)果(outcome)8.均衡(equilibrium)三.經(jīng)典的博弈模型1、“囚徒的困境”(Prisoners’Dilemma)關(guān)于博弈論,流傳最廣的是一個(gè)叫做“囚徒困境”的故事??梢哉f(shuō)凡是講博弈論,都會(huì)說(shuō)到這個(gè)經(jīng)典的博弈模型。

(1950年,數(shù)學(xué)家塔克任斯坦福大學(xué)客座教授,在給一些心理學(xué)家作講演時(shí),講到兩個(gè)囚犯的故事。)

假設(shè)有兩個(gè)小偷A(chǔ)和B聯(lián)合犯事、私入民宅被警察抓住。警方將兩人分別置于不同的兩個(gè)房間內(nèi)進(jìn)行審訊,對(duì)每一個(gè)犯罪嫌疑人,警方給出的政策是:如果一個(gè)犯罪嫌疑人坦白了罪行,交出了贓物,于是證據(jù)確鑿,兩人都被判有罪。如果另一個(gè)犯罪嫌疑人也作了坦白,則兩人各被判刑8年;如果另一個(gè)犯罪嫌人沒(méi)有坦白而是抵賴,則以妨礙公務(wù)罪(因已有證據(jù)表明其有罪)再加刑2年,而坦白者有功被減刑8年,立即釋放。如果兩人都抵賴,則警方因證據(jù)不足不能判兩人的偷竊罪,但可以私入民宅的罪名將兩人各判入獄1年。

博弈的支付矩陣囚徒1:坦白囚徒2:坦白這兩個(gè)人都會(huì)有這樣一個(gè)盤算過(guò)程:假如他坦白,我抵賴,得坐10年監(jiān)獄,坦白最多才8年;他要是抵賴,我就可以被釋放,而他會(huì)坐10年牢。綜合以上幾種情況考慮,不管他坦白與否,對(duì)我而言都是坦白了劃算。兩個(gè)人都會(huì)動(dòng)這樣的腦筋,最終,兩個(gè)人都選擇了坦白,結(jié)果都被判8年刑期。這樣兩人都選擇坦白的策略以及因此被判8年的結(jié)局被稱為“納什均衡”,也叫非合作均衡。囚徒困境的啟示

“囚徒的兩難選擇”有著廣泛而深刻的意義。個(gè)人理性與集體理性的沖突,各人追求利己行為而導(dǎo)致的最終結(jié)局是一個(gè)“納什均衡”,也是對(duì)所有人都不利的結(jié)局。他們兩人都是在坦白與抵賴策略上首先想到自己,這樣他們必然要服長(zhǎng)的刑期。只有當(dāng)他們都首先替對(duì)方著想時(shí),或者相互合謀(串供)時(shí),才可以得到最短時(shí)間的監(jiān)禁的結(jié)果?!凹{什均衡”對(duì)亞當(dāng)·斯密的“看不見(jiàn)的手”的原理提出挑戰(zhàn)。按照斯密的理論,在市場(chǎng)經(jīng)濟(jì)中,每一個(gè)人都從利己的目的出發(fā),而最終全社會(huì)達(dá)到利他的效果。《國(guó)富論》中有這樣一句名言:“通過(guò)追求(個(gè)人的)自身利益,他常常會(huì)比其實(shí)際上想做的那樣更有效地促進(jìn)社會(huì)利益。從“納什均衡”我們引出了“看不見(jiàn)的手”的原理的一個(gè)悖論:從利己目的出發(fā),結(jié)果損人不利己,既不利己也不利他。兩個(gè)囚徒的命運(yùn)就是如此。可以說(shuō),“納什均衡”提出的悖論實(shí)際上動(dòng)搖了西方經(jīng)濟(jì)學(xué)的基石。從“納什均衡”中我們還可以悟出一條真理:合作是有利的“利己策略”。但它必須符合以下黃金律:按照你愿意別人對(duì)你的方式來(lái)對(duì)別人,但只有他們也按同樣方式行事才行。也就是中國(guó)人說(shuō)的“己所不欲勿施于人”。但前提是人所不欲勿施于我。2.猜硬幣游戲-1,11,-11,-1-1,1正面反面猜方蓋方正面反面3.“田忌賽馬”“田忌賽馬”是我國(guó)古代一個(gè)非常有名的故事,講的是發(fā)生在齊威王與大將田忌之間的賽馬的故事。田忌在謀士孫臏的幫助下,運(yùn)用謀略幫助田忌以弱勝?gòu)?qiáng)戰(zhàn)勝了齊威王。這個(gè)故事講的其實(shí)是一個(gè)很典型的博弈問(wèn)題。3,-31,-11,-11,-1-1,11,-11,-13,-31,-11,-11,-1-1,11,-1-1,13,-31,-11,-11,-1-1,11,-1,1,-13,-31,-11,-11,-11,-11,-1-1,13,-31,-11,-11,-1-1,11,-11,-13,-3上中下上下中中上下中下上下上中下中上上中下上下中中上下中下上下上中下中上田忌齊威王得益矩陣

在這個(gè)博弈中齊威王和田忌應(yīng)該怎樣選擇自己的策略,才能最終獲得滿意的結(jié)果呢?首先,作為博弈方的齊威王和田忌不能讓對(duì)方知道或猜中自己的策略,從而導(dǎo)致自己輸?shù)舯荣?。這也意味著任何一方的策略選擇不能一成不變,或者不能有規(guī)律性地變動(dòng),即必須以隨機(jī)的方式選擇策略,否則一旦對(duì)方捕捉到這種規(guī)律性的變動(dòng),就可以針對(duì)性地采取應(yīng)對(duì)措施。

其次,無(wú)論對(duì)齊威王還是田忌,可選擇的六種策略之間沒(méi)有優(yōu)劣之分。從圖可以看出,對(duì)齊威王來(lái)說(shuō),每一種策略都可能有六種不同的結(jié)果,究竟最終得到哪種結(jié)果,主要看對(duì)方策略與自己策略的對(duì)應(yīng)狀況,而不是自己的策略本身。同樣的,對(duì)田忌來(lái)講六種策略本身也無(wú)好壞之分。因此,兩博弈方在決策時(shí)對(duì)自已的可選策略并無(wú)偏好,應(yīng)以相同的概率選用。夫妻之爭(zhēng)2,10,00,01,3時(shí)裝足球時(shí)裝足球丈夫妻子夫妻之爭(zhēng)第三節(jié)

博弈結(jié)構(gòu)和博弈的分類一、博弈的分類(Types)

1.如果按照博弈者的先后順序,博弈持續(xù)的時(shí)間和重復(fù)的次數(shù)進(jìn)行分類,博弈可以劃分為靜態(tài)博弈(Staticgame)和動(dòng)態(tài)博弈(DynamicGame)。靜態(tài)博弈是指這樣一種博弈,在這種博弈中,博弈者同時(shí)采取行動(dòng),同時(shí)進(jìn)行策略決定,博弈者所獲得的支付依賴于他們所采取的不同的策略組合情況。因此,我們也靜態(tài)博弈稱為“同時(shí)行動(dòng)的博弈”(Simultaneous-MoveGames)?;蛘弑M管博弈者的行動(dòng)有先后順序,但后行動(dòng)的人不知道先采取行動(dòng)的人采取的是什么行動(dòng)。如“囚徒困境”就是如此。再比如工程招標(biāo),不同的投標(biāo)者投標(biāo)的時(shí)間也許不同,但只要互相不知道對(duì)方的報(bào)價(jià),則是同時(shí)行動(dòng)。

動(dòng)態(tài)博弈是指在博弈中,博弈者的行動(dòng)有先后順序(Sequential-Move),且后行動(dòng)者能夠觀察到先行動(dòng)者所選擇的行動(dòng)或策略,因此,動(dòng)態(tài)博弈又叫做序貫博弈。2.如果按照博弈者對(duì)其他博弈者所掌握的信息的完全與完備程度進(jìn)行分類,博弈可以劃分為完全信息博弈(GamewithCompleteInformation)與不完全信息的博弈(GamewithIncompleteInformation),以及完美信息的博弈(GamewithPerfectInformation)與不完美信息的博弈(GamewithImperfectInformation),確定的博弈(GameofCertainty)與不確定的博弈(GameofUncertainty),對(duì)稱信息的博弈(GameofSymmetricInformation)與非對(duì)稱信息的博弈(GameofAsymmetricInformation)等。

博弈的分類和均衡

信息是博弈論中重要的內(nèi)容。完全博弈是指在博弈過(guò)程中,每一位博弈者對(duì)其他博弈者的特征、策略空間及收益函數(shù)有準(zhǔn)確的信息。嚴(yán)格地講,完全信息博弈是指博弈者的策略空間及策略組合下的支付,是博弈中所有博弈者的“公共知識(shí)”(CommomKnowledge)的博弈。完美信息是指博弈者完全清楚到他決策時(shí)為止時(shí),所有其他博弈者的所有決策信息,或者說(shuō),了解博弈已進(jìn)行過(guò)程的所有信息。3.如果博弈者對(duì)其他博弈者的特征、策略空間及收益函數(shù)信息了解的不夠準(zhǔn)確、或者不是對(duì)所有博弈者的特征、策略空間及收益函數(shù)都有準(zhǔn)確的信息,在這種情況下進(jìn)行的博弈就是不完全信息博弈。對(duì)于不完全信息博弈,博弈者所做的是努力使自己的期望支付或期望效用最大化。在不完全信息的博弈中,首先行動(dòng)的是自然(Nature),自然決定了博弈者以多大的可能性采取某種行動(dòng),由自然決定的每個(gè)博弈者以多大的可能性采取某種行動(dòng)的情況只有每個(gè)博弈者個(gè)人知道,其他博弈者都不知道。確定的博弈是指不存在由自然作出行動(dòng)的博弈,否則就是不確定的博弈。4.如果按照博弈者之間是否存在合作進(jìn)行分類,博弈可以劃分為合作博弈(CooperativeGame)和非合作博弈(Non-CooperativeGame)。合作博弈是指博弈者之間有著一個(gè)對(duì)各方具有約束力的協(xié)議,博弈者在協(xié)議范圍內(nèi)進(jìn)行的博弈。人們分工與交換的經(jīng)濟(jì)活動(dòng)就是合作性的博弈。如果博弈者無(wú)法通過(guò)談判達(dá)成一個(gè)有約束的契約來(lái)限制博弈者的行為,那么這個(gè)博弈為非合作博弈。典型的合作博弈是寡頭企業(yè)之間的串謀(Collusion)。串謀是指企業(yè)之間通過(guò)公開(kāi)或暗地里簽訂協(xié)議,對(duì)各自的價(jià)格或產(chǎn)量進(jìn)行限制,以達(dá)到獲取更多壟斷利潤(rùn)的行為。后面將會(huì)繼續(xù)討論的囚徒困境和將要討論的公共資源悲劇都是非合作性的博弈。根據(jù)博弈者支付的情況,有以下分類:5.零和博弈(Zero-SumGame)和非零和博弈(Non-Zero-SumGame)。如果一個(gè)博弈在所有對(duì)局情況下全體參與人的得益之和總為0,這個(gè)博弈就叫做零和博弈;如果一個(gè)博弈在所有對(duì)局情況下全體參與人的得益之和不為0,這個(gè)博弈就叫做非零和博弈。6.常和博弈(Constant-SumGame)和變和博弈(Variable-SumGame)。如果一個(gè)博弈在所有對(duì)局情況下全體參與人的得益之和總為一個(gè)常數(shù),這個(gè)博弈就叫做常和博弈;如果一個(gè)博弈在所有對(duì)局情況下全體參與人的得益之和不總是一個(gè)常數(shù),這個(gè)博弈就叫做變和博弈。二、博弈中的博弈方1.單人博弈單人博弈即只有一個(gè)博弈方的博弈。嚴(yán)格地講,單人博弈已經(jīng)退化為一般的最優(yōu)化問(wèn)題,因此不屬于博弈論研究的目標(biāo)對(duì)象。不過(guò)討論單人博弈還是有價(jià)值的,因?yàn)榘▎稳瞬┺目梢允共┺睦碚摰慕Y(jié)構(gòu)更加完整,如同集合里面的完整,它使集合理論的結(jié)構(gòu)更完整。

一個(gè)單人博弈例子的例子

有一個(gè)商人需要將一批商品從武漢向上海運(yùn)輸,從武漢到上海運(yùn)輸有水、陸兩條路線,走陸路運(yùn)輸成本為10000元,走水路的運(yùn)輸成本為6000元。走陸路比較安全,走水路則有一定的風(fēng)險(xiǎn),如果遇到惡劣天氣將會(huì)造成這批貨物總價(jià)值10%的損失。假設(shè)已知該批貨物的總價(jià)值為100000元,運(yùn)輸期間出現(xiàn)暴風(fēng)雨天氣的概率為20%,問(wèn)該商人該選擇哪條運(yùn)輸路線?0

武漢1武漢海海壞天氣(20%)好天氣(80%)上海(-0.6)(-1.0)(-1.6)(-1.0)上海在本博弈中,供應(yīng)商走水路時(shí),得益為-0.6的概率為80%(好天氣),得益為-1.6的概率為20%(壞天氣),因此走水路的期望得益為(-0.6)×80%+(-1.6)×20%=-0.8;走陸路時(shí),得益是確定的-1。因?yàn)?0.8>-1,即走水路的期望費(fèi)用0.8小于走陸路的費(fèi)用1,所以供應(yīng)商還是應(yīng)該選擇走水路。若多次碰到同樣的決策選擇并每次都作這樣的選擇,則平均每次的運(yùn)輸成本應(yīng)接近0.8。2.雙人博弈雙人博弈就是兩個(gè)各自獨(dú)立決策,但策略和利益具有相互依存關(guān)系的博弈方的決策問(wèn)題。雙人博弈是博弈問(wèn)題中最常見(jiàn),也是研究得最多的博弈類型。

3.多人博弈有三個(gè)或三個(gè)以上博弈方參加的博弈稱為“多人博弈”。

多人博弈中的“破壞者”

三、博弈中的策略博弈中各博弈方的決策內(nèi)容稱為“策略”(Strategies)如果一個(gè)博弈中每個(gè)博弈方的策略數(shù)都是有限的,則稱為“有限博弈(FiniteGames)”如果一個(gè)博弈中至少有某些博弈方的策略無(wú)限多個(gè),則稱為“無(wú)限博弈”(InfiniteGames)

四、博弈中的得益

得益(Payoffs)即參加博弈的各個(gè)博弈方從博弈中所獲得的利益,得益可以是本身就是數(shù)量的利潤(rùn)、收入,也可以是量化的效用、社會(huì)效益、福利等等。1.零和博弈零和博弈:一方的得益必定是另一方的損失,某些博弈方的贏肯定是來(lái)源于其他博弈方的輸。

2.常和博弈常和博弈可以看作零和博弈的擴(kuò)展。

3、變和博弈零和博弈和常和博弈以外的所有博弈都稱為“變和博弈”。變和博弈是指在不同策略組合(結(jié)果)下各博弈方的利益之和往往是不相同的。五、博弈的過(guò)程

1.靜態(tài)博弈

許多博弈常常要求或者說(shuō)設(shè)定各博弈方是同時(shí)決策的,或者雖然各博弈方?jīng)Q策的時(shí)間不一定真正一致,但在他們作出選擇之前不允許知道其他博弈方的策略,在知道其他博弈方的策略之后則不能改變自己的選擇,從而各博弈方的選擇仍然可以看作是同時(shí)作出的。

2.動(dòng)態(tài)博弈(DynamicGames)

除了各博弈方同時(shí)決策的靜態(tài)博弈以外,也有大量現(xiàn)實(shí)決策活動(dòng)構(gòu)成的博弈中,各博弈方的選擇和行動(dòng)不僅有先后次序,而且后選擇、后行動(dòng)的博弈方在自己選擇、行動(dòng)之前,可以看到其他博弈方的選擇、行動(dòng),甚至還包括自己的選擇和行動(dòng)。

例“市場(chǎng)阻擊”博弈3.重復(fù)博弈(RepeatedGames)

所謂重復(fù)博弈實(shí)際上就是同一個(gè)博弈反復(fù)進(jìn)行所構(gòu)成的博弈過(guò)程?!坝邢薮沃貜?fù)博弈”(FinitelyRepeatedGames)“無(wú)限次重復(fù)博弈”(InfinitelyRepeatedGames)六、博弈的信息結(jié)構(gòu)

1.博弈中最重要的信息之一是關(guān)于得益的信息

一般地,我們將各博弈方都完全了解所有博弈方各種情況下得益的博弈稱為“完全信息(CompleteInformation)博弈”,將至少部分博弈方不完全了解其他博弈方得益情況的博弈稱為“不完全信息(IncompleteInformation)博弈”。2.關(guān)于博弈過(guò)程的信息動(dòng)態(tài)博弈中在輪到行為時(shí)對(duì)博弈的進(jìn)程完全了解的博弈方,稱為具有“完美信息”(PerfectInformation)的博弈方如果動(dòng)態(tài)博弈的所有博弈方都有完美信息,則稱為“完美信息的動(dòng)態(tài)博弈”。動(dòng)態(tài)博弈中輪到行為的博弈方不完全了解此前全部博弈進(jìn)程時(shí),稱為具有“不完美信息(ImperfectInformation)的博弈方,有這種博弈方的動(dòng)態(tài)博弈則稱為“ImperfectInformation”的博弈方,有這種博弈方的動(dòng)態(tài)博弈則稱為“不完美信息的動(dòng)態(tài)博弈”。七、博弈方的能力和理性

博弈論關(guān)于人的理性假設(shè)包括兩個(gè)方面:一是他們決策行為的根本目標(biāo);二是他們追求目標(biāo)的能力。即認(rèn)為博弈方都是以個(gè)體利益最大化目標(biāo),且有準(zhǔn)確的判斷選擇能力,也不會(huì)“犯錯(cuò)誤”。以個(gè)體利益最大為目標(biāo)被稱為“個(gè)體理性”(IndividualRationality),有完美的分析判斷能力和不會(huì)犯選擇行為的錯(cuò)誤稱為“完全理性”。1、完全理性和有限理性2、個(gè)體理性和集體理性

例“信息與戰(zhàn)爭(zhēng)”博弈戰(zhàn)爭(zhēng)勝敗大體上取決于實(shí)力、信息、戰(zhàn)略與人心。如果其中一方各方面均優(yōu)于另外一方,并且弱的一方知道的話,理性的弱者是不會(huì)參與戰(zhàn)爭(zhēng)的,此時(shí)戰(zhàn)爭(zhēng)便打不起來(lái)。很多情況下,國(guó)與國(guó)之間的戰(zhàn)爭(zhēng)往往是由于不完全了解局勢(shì)造成的,有足夠理性的雙方之間是不可能發(fā)生戰(zhàn)爭(zhēng)的。從理論上講,具有足夠理性和具有足夠知識(shí)與信息的人能預(yù)知戰(zhàn)爭(zhēng)的結(jié)果,但現(xiàn)實(shí)中的人或者因?yàn)闆](méi)有足夠的知識(shí)和信息,或者不具有足夠的理性的能力,而往往不能做到這一點(diǎn)。

比如,第二次世界大戰(zhàn)結(jié)束后,朝鮮半島沿三八線被劃分為南北朝鮮。1951年南北之間發(fā)生戰(zhàn)爭(zhēng),美國(guó)馬上介入了這場(chǎng)戰(zhàn)爭(zhēng)。美國(guó)的考慮是,剛剛成立的中華人民共和國(guó)不會(huì)介入到這場(chǎng)朝鮮戰(zhàn)爭(zhēng)中去。在美國(guó)看來(lái),新生的中國(guó)剛剛內(nèi)戰(zhàn)消耗太大,百?gòu)U待興,沒(méi)有能力卷入戰(zhàn)爭(zhēng)。并且美國(guó)認(rèn)為,美國(guó)武器裝備優(yōu)良,軍費(fèi)充足,即使中國(guó)參戰(zhàn),也無(wú)力與之抗衡。因此美國(guó)得出結(jié)論:朝鮮戰(zhàn)爭(zhēng)因美國(guó)的介入很快就會(huì)結(jié)束,而中國(guó)不會(huì)介入。當(dāng)時(shí)美國(guó)的一家咨詢公司在美國(guó)未出兵之前,深入地研究了中國(guó)的情況,以及朝鮮與中國(guó)的關(guān)系,認(rèn)為如果美國(guó)介入到朝鮮戰(zhàn)爭(zhēng)中去,只要中國(guó)判斷沒(méi)有失誤,中國(guó)必將出兵。他們想將研究報(bào)告提供的信息以500萬(wàn)美元賣給政府,而美國(guó)政府未予理睬。最終,美國(guó)以損失幾百億美元的財(cái)產(chǎn),傷亡數(shù)十萬(wàn)人的代價(jià)在朝鮮戰(zhàn)場(chǎng)上大敗。八.博弈的表示

我們常用G表示一個(gè)博弈:如G有n個(gè)博弈方,每個(gè)博弈方的全部可選策略的集合我們稱為“策略空間”,分別用S1,……Sn表示;Sij表示博弈方i的第j個(gè)策略,其中j可取有限個(gè)值(有限策略博弈),也可取無(wú)限個(gè)值(無(wú)限策略博弈);博弈方i的利益則用ui表示,ui是各博弈方策略的多元函數(shù)。n個(gè)博弈方的標(biāo)準(zhǔn)式博弈G常寫(xiě)成:

(二)博弈的策略式表達(dá)

在博弈論中,一個(gè)博弈可以用兩種不同的方式來(lái)表達(dá):一種是策略式表達(dá),另一種是擴(kuò)展式表達(dá)。策略式表達(dá)更適合于靜態(tài)博弈,而擴(kuò)展式表達(dá)更適合于討論動(dòng)態(tài)博弈。

策略式表達(dá)又稱為標(biāo)準(zhǔn)式表達(dá),在這種表達(dá)中,所有參與人同時(shí)選擇自己的策略,所有參與人選擇的策略一起決定每個(gè)參與人的得益。這里參與人同時(shí)選擇的是“策略”,而不是“行動(dòng)”。在靜態(tài)博弈中,由于參與人只選擇一次,所以策略就等同于行動(dòng)了。而在動(dòng)態(tài)博弈中,策略是參與人在各個(gè)階段的行動(dòng)的全面計(jì)劃。策略式表述:

1、博弈的參與人集合:i∈K,K=(1,2,…,n);2、每個(gè)參與人的戰(zhàn)略空間:Si ,,i=1,2,3,…,n;3、每個(gè)參與人的得益函數(shù):ui(s1,…,si…,sn),i=1,2,3,…,n。用G={S1,…,Sn;u1,…,un}代表戰(zhàn)略式表述博弈。(三)博弈的得益矩陣表示

囚徒B囚徒A

坦白不坦白坦白-8,-80,-10不坦白-10,0-1,-1第二章

完全信息靜態(tài)博弈第一節(jié)靜態(tài)博弈分析方法一、靜態(tài)博弈

(StaticGame)

博弈方同時(shí)作出決策,且各博弈方對(duì)對(duì)方的得益完全了解,或者雖然決策有先后,但是沒(méi)有人在決策之前看到了其他博弈方的決策行為,也沒(méi)有交換信息,一旦決策做出之后,就只能等待結(jié)果,對(duì)博弈的發(fā)展再也不能產(chǎn)生任何影響,這種博弈叫做靜態(tài)博弈。日常生活中靜態(tài)博弈的例子很多,如前面介紹的“囚徒困境”,“石頭·剪子·布”都是靜態(tài)博弈。二、占優(yōu)策略均衡(DominantStrategiesEquilibrium)占優(yōu)策略均衡是指這樣一種特殊的博弈:某一博弈方的策略可能并不依賴于其他博弈方的策略選擇。換句話說(shuō),無(wú)論其他博弈方如何選擇自己的策略,該博弈方的最優(yōu)策略選擇是惟一的。也就是說(shuō),如果無(wú)論所有其他博弈方采取什么策略,一博弈方的某個(gè)策略給他帶來(lái)的得益始終高于其他策略,至少不低于其他策略。那么,“某個(gè)策略”必然是該博弈方愿意選擇的策略,我們稱這種策略為該博弈方的一個(gè)“占優(yōu)策略”(Dominant--Strategy)或“上策”。進(jìn)一步,如果一個(gè)博弈的某個(gè)策略組合中的所有策略都是各個(gè)博弈方各自的上策,那么這個(gè)策略組合肯定是所有博弈方都愿意選擇的,必然是該博弈比較穩(wěn)定的結(jié)果。我們稱這樣的策略組合為該博弈的一個(gè)“占優(yōu)策略均衡”(Dominant-strategyEquilibrium)或“上策均衡”?!罢純?yōu)策略均衡”是博弈分析中最基本的均衡概念之一,“占優(yōu)策略均衡”分析是最基本的博弈分析方法。囚徒的困境博弈中的(坦白,坦白)實(shí)際上就是一個(gè)上策均衡,因?yàn)楦鶕?jù)第一章的分析,“坦白”對(duì)該博弈的兩個(gè)博弈方來(lái)說(shuō)都是上策。

占優(yōu)策略不管囚犯B是選擇認(rèn)罪還是不認(rèn)罪,囚犯A都會(huì)選擇認(rèn)罪!認(rèn)罪是囚犯A的占優(yōu)策略!占優(yōu)策略(上策)

不管對(duì)手做什么,對(duì)一個(gè)參與者都能獲得最高得益的策略對(duì)于囚犯B不管囚犯A是選擇認(rèn)罪還是不認(rèn)罪,囚犯B都會(huì)選擇認(rèn)罪!認(rèn)罪是囚犯B的占優(yōu)策略!占優(yōu)策略(上策)均衡不管囚犯B是選擇認(rèn)罪還是不認(rèn)罪,囚犯A都會(huì)選擇認(rèn)罪!不管囚犯A是選擇認(rèn)罪還是不認(rèn)罪,囚犯B都會(huì)選擇認(rèn)罪!認(rèn)罪是囚犯A和B的占優(yōu)策略!有博弈中,由局中人的上策構(gòu)成的均衡稱為占優(yōu)策略(上策)均衡三、嚴(yán)格下策反復(fù)消去法(IteratedEliminationofStrictlyDominatedStrategies)

該方法可以歸納如下:首先找出某博弈者的嚴(yán)格劣策略,將它剔除,重新構(gòu)造一個(gè)不包括已剔除策略的新博弈;然后,繼續(xù)剔除這個(gè)新的博弈中某一博弈者的嚴(yán)格劣策略;重復(fù)進(jìn)行這一過(guò)程,直到博弈者剩下惟一的策略組合為止。剩下的這個(gè)惟一的博弈者的策略組合,就是這個(gè)博弈的均衡解。所謂“嚴(yán)格劣策略”(StrictlyDominatedstrategies)是指:在博弈中,不論其他參與人采取什么策略,某一參與人可能采取的策略中,對(duì)自己嚴(yán)格不利的策略。

如果某一個(gè)策略的收益和第二個(gè)策略一樣大,或者偶爾大于第二個(gè)策略,我們就說(shuō)第二個(gè)戰(zhàn)略是相對(duì)于第一個(gè)策略的“弱劣策略”(WeaklyDominatedStrategies)。通過(guò)上面的分析我們可以發(fā)現(xiàn),嚴(yán)格下策反復(fù)消去法的適用范圍確實(shí)要比占優(yōu)策略均衡分析更大一些,因此在分析博弈方面的作用也更大。不過(guò),嚴(yán)格下策反復(fù)消去法也不能解決所有博弈的分析問(wèn)題。因?yàn)樵谠S多博弈問(wèn)題中,上述相對(duì)意義上的嚴(yán)格下策往往也不存在。如猜硬幣、田忌賽馬中沒(méi)有任何博弈方的任何策略是相對(duì)其他策略的嚴(yán)格下策。既然不存在任何嚴(yán)格下策的博弈,那么也就無(wú)法用嚴(yán)格下策反復(fù)消去法進(jìn)行分析了。此外,在策略數(shù)較多的博弈中,往往是嚴(yán)格下策反復(fù)消去法只能消去其中的部分策略,不能消去的策略組合并不惟一,這時(shí)僅用嚴(yán)格下策反復(fù)消去法也無(wú)法對(duì)博弈作出準(zhǔn)確的判斷,因此仍然不能完全解決這些博弈問(wèn)題。例

“智豬博弈”(BoxedPigs)下面,我們來(lái)看博弈論中的另一個(gè)著名的例子:“智豬博弈”(BoxedPigs)。假設(shè)豬圈里有兩頭豬,一頭大豬,一頭小豬,豬圈的一端有一個(gè)豬食槽,另一端安裝了一個(gè)按鈕,控制豬食的供應(yīng)。按一下按鈕,將有8?jìng)€(gè)單位的豬食進(jìn)入豬食槽,供兩頭豬食用。兩頭豬場(chǎng)面臨選擇的策略有兩個(gè):自己去按按鈕或等待另一頭豬去按按鈕。兩只豬應(yīng)該各采取什么策略呢?答案是:小豬將等在食槽邊,而大豬則要不知疲倦地奔忙于踏板和食槽之間。下面我們給出具體的分析。如果某一頭豬作出自己去按按鈕的選擇,它必須付出如下代價(jià):第一,它需要付出相當(dāng)于兩個(gè)單位的成本;第二,由于豬食槽遠(yuǎn)離豬食,它將比另一頭豬后到豬食槽,從而減少吃食的數(shù)量。假定:若小豬按按鈕,大豬先到食槽,大豬將吃到7個(gè)單位的豬食,小豬只能吃到1個(gè)單位的豬食;若大豬場(chǎng)按按鈕,小豬先到食槽,大豬和小豬各吃到4個(gè)單位的豬食;若兩頭豬都選擇等待,兩頭豬同時(shí)到食槽(實(shí)際上兩頭豬都吃不到豬食),大豬吃到5個(gè)單位的豬食,小豬吃到3個(gè)單位的豬食。智豬博弈的結(jié)果可以被我們用來(lái)解釋許多社會(huì)和經(jīng)濟(jì)現(xiàn)象。比如,在股份公司中,股東都承擔(dān)著監(jiān)督管理層工作的職能,但是,大小股東從監(jiān)督中獲得的收益大小不一樣。在監(jiān)督成本相同相同的情況下,大股東從監(jiān)督管理層工作中獲得的收益明顯大于小股東。因此,小股東往往不會(huì)象大股東那樣去監(jiān)督經(jīng)理人員,這是小股東的占優(yōu)策略,而大股東也知道小股東會(huì)選擇不監(jiān)督,知道小股東要搭大股東的便車,但是大股東別無(wú)選擇。大股東選擇監(jiān)督管理層工作的責(zé)任、獨(dú)自承擔(dān)監(jiān)督成本是大股東在小股東占優(yōu)選擇的前提下必須選擇的最優(yōu)策略。這樣以來(lái),與智豬博弈一樣,從每股的凈收益(每股收益減去每股分擔(dān)的監(jiān)督成本)來(lái)看,小股東要大于大股東。智豬博弈也能給予我們很多其他方面的啟發(fā)。比如,大豬不首先按按鈕,小豬會(huì)不會(huì)首先去按按鈕?答案是:會(huì)。比如,長(zhǎng)時(shí)間陷于困境的群體中總會(huì)出現(xiàn)一個(gè)敢于為群體的利益而獻(xiàn)身的人,不過(guò)他的下場(chǎng)可能是悲壯的,如陳勝吳廣起義。

澡堂里的智豬博弈上個(gè)星期天我在澡堂里當(dāng)了一次大豬。那時(shí)我們第一批沖進(jìn)了澡堂,結(jié)果發(fā)現(xiàn)水管里的水還沒(méi)有放盡。誰(shuí)先踩踏板,誰(shuí)就會(huì)濺一身的涼水;如果大家都不先踩踏板,顯然就都洗不成澡。但如果一部分人先踩踏板,另一部分人就可以……于是滿浴室的人們就象"智豬"那樣博弈了起來(lái)。博弈的結(jié)果是:大家都不去踩那踏板,而是看著一個(gè)"大豬"--筆者本人,在那里傻乎乎地淋著冷水。一個(gè)淋浴器的放水速度實(shí)在太慢了,冰涼的水流沒(méi)完沒(méi)了地濺在身上,凍得齜牙咧嘴的我環(huán)顧了一下四周才驚異地發(fā)現(xiàn),大家都瑟瑟的站在那里,不時(shí)地抬頭看著我頭頂那噴涌的淋浴。我這才明白原來(lái)他們是在等我一個(gè)人把冷水排凈!這下我真的僵硬了,隨后的冰冷感覺(jué)可以用"悲壯"來(lái)形容。我要感謝后來(lái)走進(jìn)浴室的另一位"大豬"幫我放水,緩解并縮短了我的苦難,也使這些"小豬"們歡快的洗上了熱水澡。聰明的"小豬"們依靠沉著和智慧在這場(chǎng)"智豬博弈"中輕松地?fù)魯×?大豬"。敗下陣來(lái)以后,我對(duì)這次經(jīng)歷進(jìn)行了認(rèn)真的反思,得出以下幾條結(jié)論:

首先,如果我和另外一只"大豬"不首先踩踏板,"小豬"中會(huì)不會(huì)有人首先去踩踏板?我認(rèn)為一定會(huì)有的。其次,當(dāng)群體道德喪失殆盡的時(shí)候,社會(huì)是否還有向前發(fā)展的可能?我認(rèn)為是有可能的。如果浴室的管理人員在浴室中增加幾個(gè)放水開(kāi)關(guān),小豬們就可以利用這一"先進(jìn)"的裝置迅速地放掉冷水,增進(jìn)群體的福利。也就是說(shuō),即使社會(huì)道德水準(zhǔn)降低到了極限(所有的人都變得絕對(duì)自私),技術(shù)進(jìn)步仍然可以增進(jìn)全社會(huì)的福利。也許這就是所謂的"發(fā)展才是硬道理"。

再次,制度約束能否替代道德約束?能不能建立一套制度,通過(guò)這套制度逐步改善這種群體的無(wú)效行為?我認(rèn)為這也是有可能的。如果浴室改成按洗浴時(shí)間的長(zhǎng)短來(lái)收費(fèi)的制度,來(lái)增加"小豬"們的投機(jī)成本,他們中就會(huì)有相當(dāng)多的人變成"大豬"。這就是現(xiàn)代西方經(jīng)濟(jì)學(xué)家們正在絞盡腦汁去探尋的途徑。

最后,是否可以通過(guò)教育來(lái)解決這個(gè)問(wèn)題?我認(rèn)為這是最根本的出路。但這種教育與通常的思想政治教育應(yīng)該是不同的。與其說(shuō)武大是一個(gè)大家庭,不如說(shuō)人們期望武大是一個(gè)大家庭,人們都向往生活在一個(gè)團(tuán)結(jié)友愛(ài)、互助互讓的大家庭里,但在建設(shè)這個(gè)大家庭時(shí),人們很大程度上忽視了家庭賴以形成的最根本因素,那就是寬容和愛(ài)護(hù)。一個(gè)在沒(méi)有寬容和愛(ài)護(hù),只有規(guī)章和制度的環(huán)境下成長(zhǎng)起來(lái)的人,是不可能真正熱愛(ài)這個(gè)社會(huì)進(jìn)而愿意為社會(huì)的和諧與進(jìn)步貢獻(xiàn)自己的力量的。筆者認(rèn)為要?jiǎng)?chuàng)造這樣的環(huán)境,首先是同學(xué)們都應(yīng)該嘗試一下互相寬容與愛(ài)護(hù),但最根本的是這個(gè)家庭的管理者們要轉(zhuǎn)變管理思想,真正的認(rèn)清管理就是服務(wù)的道理,真正的領(lǐng)會(huì)和貫徹以人為本的管理。

“智豬博弈”對(duì)激勵(lì)的啟示

故事中的游戲規(guī)則導(dǎo)致了“小豬躺著大豬跑”的現(xiàn)象,如果改變一下核心指標(biāo):每次落下的事物數(shù)量和踏板與投食口之間的距離,就不會(huì)出現(xiàn)“小豬躺著大豬跑”的現(xiàn)象。我們假設(shè)以下三種新的游戲規(guī)則:改變方案一:減量方案.投食僅原來(lái)的一半分量.誰(shuí)去踩踏板,就意味著為對(duì)方貢獻(xiàn)食物,結(jié)果是小豬大豬都不去踩踏板了,也就不會(huì)有踩踏板的動(dòng)力.如果目的是想讓豬們?nèi)ザ嗖忍ぐ澹@個(gè)游戲規(guī)則的設(shè)計(jì)顯然是失敗的。改變方案二:增量方案.投食為原來(lái)的一倍分量.結(jié)果是小豬、大豬都會(huì)去踩踏板,反正對(duì)方不會(huì)一次把食物吃完,所以競(jìng)爭(zhēng)意識(shí)卻不會(huì)很強(qiáng).對(duì)于游戲規(guī)則的設(shè)計(jì)者來(lái)說(shuō),這個(gè)規(guī)則的成本相當(dāng)高(每次提供雙份的食物);而且因?yàn)楦?jìng)爭(zhēng)不強(qiáng)烈,想讓豬們?nèi)ザ嗖忍ぐ宓男Ч⒉缓?。改變方案?減量加移位方案。投食僅原來(lái)的一半分量,但同時(shí)將投食口移到踏板附近。結(jié)果小豬和大豬都在拼命地?fù)屩忍ぐ澹却卟坏檬?而多勞者多得。對(duì)于游戲設(shè)計(jì)者而言,這是一個(gè)最好的方案,成本不高,但收獲最大?!爸秦i博弈”故事給了競(jìng)爭(zhēng)中的弱者(小豬)以等待為最佳策略的啟發(fā)。對(duì)于社會(huì)而言,因?yàn)樾∝i未能參與競(jìng)爭(zhēng),小豬搭便車時(shí)的社會(huì)資源配置的并不是最佳狀態(tài)。為使資源最有效配置,規(guī)則的設(shè)計(jì)者是不愿看見(jiàn)有人搭便車的,能否完全杜絕“搭便車”現(xiàn)象,就要看游戲規(guī)則的核心指標(biāo)設(shè)置是否合適。比如,在企業(yè)人力資源管理中進(jìn)行激勵(lì)制度設(shè)計(jì)時(shí),如果獎(jiǎng)勵(lì)力度太大,又是持股,又是期權(quán),公司職員個(gè)個(gè)都成了百萬(wàn)富翁,成本高不說(shuō),重要的是激勵(lì)因素轉(zhuǎn)變成了保證因素,員工的積極性并沒(méi)有提高。這就是“智豬博弈”增量方案所描述的情形。但是如果獎(jiǎng)勵(lì)力度不大,而且見(jiàn)者有份,一度十分努力的大豬也不會(huì)有動(dòng)力了,企業(yè)將會(huì)沒(méi)有生命力,就出現(xiàn)“智豬博弈”減量方案所產(chǎn)生的結(jié)果。最好的激勵(lì)機(jī)制設(shè)計(jì)就像改變方案三減量加移位的辦法,獎(jiǎng)勵(lì)并非人人有份,而是直接針對(duì)個(gè)人(如業(yè)務(wù)按比例提成),通過(guò)競(jìng)爭(zhēng)既節(jié)約了成本(對(duì)公司而言),又消除了“搭便車”現(xiàn)象,能實(shí)現(xiàn)有效的激勵(lì)。四、劃線法下面我們?cè)俳榻B一種博弈分析的方法——“劃線法”。我們知道,博弈中的博弈方的最終目標(biāo)都是實(shí)現(xiàn)自身的最大得益,各個(gè)博弈方的得益既取決于自己選擇的策略,也與其他博弈方選擇的策略有關(guān),因此博弈方在決策時(shí)必須考慮其他博弈方的存在和策略選擇。根據(jù)這一思路決策的思路應(yīng)該是:先找出自己針對(duì)其他博弈方每種策略或策略組合的最佳對(duì)策,然后在此基礎(chǔ)上,通過(guò)對(duì)其他博弈方策略選擇的判斷,包括對(duì)其他博弈方對(duì)自己策略判斷的判斷等,預(yù)測(cè)博弈的可能結(jié)果和確定自己的最優(yōu)策略。例“性別之爭(zhēng)”(BattleofSexes)第二節(jié)納什均衡一、納什均衡(NashEquilibrium)

納什均衡是著名博弈論專家納什(JohnNash)對(duì)博弈論的重要貢獻(xiàn)之一。納什在19世紀(jì)50年1951年的兩篇重要論文中,在一般意義上給定了非合作博弈及其均衡解,并證明了解的存在性。正是納什的這一貢獻(xiàn)奠定了非合作博弈論的理論基礎(chǔ)。納什所定義的均衡稱之謂“納什均衡”。定義:在博弈中,如果由各個(gè)博弈方的各一個(gè)策略組成的某個(gè)策略組合中,任一博弈方i的策略,都是對(duì)其余博弈方策略的組合的最佳策略,即

對(duì)任意都成立,則稱為G的一個(gè)“納什均衡”。納什均衡是博弈論中第一個(gè)極其重要的概念,它主要描述的是這樣一種策略(或行動(dòng))集:在這一策略集中每一個(gè)博弈者都確信,在給定競(jìng)爭(zhēng)對(duì)手的情況下,他選擇了最好的策略。

通俗的表達(dá)就是:給定你的策略,我的策略是最好的策略;給定我的策略,你的策略也是你最好的策略。這就是說(shuō),雙方在對(duì)方的策略下自己現(xiàn)有的策略是最好的策略。即:此時(shí)雙方在對(duì)方給定的策略下不愿意調(diào)整自己的策略,因?yàn)閱为?dú)改變對(duì)自己沒(méi)有好處。這里的策略包括我們后面要介紹的混合策略。顯然占優(yōu)策略均衡是一種納什均衡,但是納什均衡不一定是占優(yōu)均衡。占優(yōu)策略均衡是比納什均衡更強(qiáng)的博弈均衡,它要求任何一方對(duì)于其他博弈方的任何策略選擇來(lái)說(shuō),其最優(yōu)策略選擇都是唯一的。而納什均衡只要求任何一個(gè)博弈方在其他博弈方的策略選擇給定的條件下,其選擇的策略是最優(yōu)的。

判斷某一結(jié)果是不是納什均衡的通常做法是看博弈者是否可以通過(guò)單方面的背離而受益。如果還有其他策略讓博弈者獲得更多的得益,他一定會(huì)偏離現(xiàn)有的策略組合,該策略組合就不會(huì)是穩(wěn)定的,不可能成為納什均衡。俾斯麥海的??諏?duì)抗

(l)相關(guān)背景資料

1943年2月,第二次世界大戰(zhàn)中的日本,在太平洋戰(zhàn)區(qū)己處于明顯的劣勢(shì)。為扭轉(zhuǎn)戰(zhàn)局,日軍統(tǒng)帥山本五十六統(tǒng)率下的一支艦隊(duì)策劃了一次軍事行動(dòng):由集結(jié)地——南太平洋新不列顛群島的拉包爾出發(fā),穿過(guò)俾斯麥海,開(kāi)往新幾內(nèi)亞的萊城,支援困守在那里的日軍(見(jiàn)下圖)。山本五十六心中明白,在日本艦隊(duì)穿過(guò)俾斯麥海的3天航程中,不可能躲開(kāi)美軍的空襲;他要謀劃的是盡可能地減少損失。當(dāng)美軍獲此情報(bào)后,太平洋戰(zhàn)區(qū)盟軍統(tǒng)帥麥克阿瑟命令空軍司令肯尼將軍組織空中打擊。.日美雙方的指揮官及參謀人員都進(jìn)行了冷靜與全面的謀劃。自然條件對(duì)于雙方來(lái)說(shuō)是已知的?;厩闆r是:從拉包爾到萊城的海上航線有南線和北線兩條,通過(guò)時(shí)間均為3天。氣象預(yù)報(bào)表明,未來(lái)3天中,北線陰雨,能見(jiàn)度差;而南線則天氣晴好,能見(jiàn)度佳。(2)局勢(shì)估計(jì)情況1:美軍偵察機(jī)重點(diǎn)搜索北線,日本艦隊(duì)恰好走北線。由于氣候惡劣,能見(jiàn)度低以及美軍空軍基地靠近南線,因而美軍只能實(shí)施兩天有效的轟炸。情況2:美軍偵察機(jī)重點(diǎn)搜索北線,而日本艦隊(duì)走南線。由于發(fā)現(xiàn)晚,盡管美軍空軍基地靠近南線,但有效轟炸也只有兩天。情況3:美軍偵察機(jī)重點(diǎn)搜索南線,而日本艦隊(duì)走北線。由于發(fā)現(xiàn)晚,美軍空軍基地靠近南線,以及北線天氣惡劣,故有效轟炸只能實(shí)施1天。情況4:美軍偵察機(jī)重點(diǎn)搜索南線,日本艦隊(duì)恰好走南線。此時(shí),日軍艦隊(duì)被迅速發(fā)現(xiàn),美軍轟炸機(jī)群所需航程很短,加之天氣晴好,這將使美軍空軍在3天中皆可實(shí)施有效轟炸。博弈者:美日雙方?jīng)Q策者策略:美日雙方各有兩個(gè)策略:南線、北線得益:美方的支付(贏得轟炸天數(shù))矩陣為

博弈方1(美軍)希望獲得的得益(贏得轟炸天數(shù))盡可能多,但同時(shí),他們也深知:博弈方2(日軍)必然想方設(shè)法使自己的付出(被轟炸天數(shù))盡可能少。因此,美軍參謀部在作選擇時(shí),首先要考慮:選擇每個(gè)策略時(shí)至少能贏得多少,然后從中選取最有利的策略。具體來(lái)說(shuō):先對(duì)得益矩陣的各列求極?。ㄖ辽仝A得),然后,再對(duì)矩陣各列極小組成的集合中取極大(爭(zhēng)取最佳)。于是有:

對(duì)于日軍參謀部,因居于被動(dòng)地位,故首先考慮在對(duì)方每個(gè)策略中最多損失多少。在此前提下?tīng)?zhēng)取損失最小。具體來(lái)說(shuō):對(duì)同一得益矩陣的各行求極大(最多損失),然后,對(duì)矩陣各行極大組成的集合中取極小(爭(zhēng)取最佳)。于是有:

上述求解思想可概括為:“從最壞處著想,去爭(zhēng)取最好的結(jié)果”。這是理性思考的表現(xiàn)。實(shí)際結(jié)果這里恰有:這正是歷史實(shí)際對(duì)局的結(jié)果,即:局勢(shì)1成為事實(shí)??夏釋④娒蠲儡妭刹鞕C(jī)重點(diǎn)搜索北線;而山本五十六命令日本艦隊(duì)取道北線航行。美軍飛機(jī)在1天后發(fā)現(xiàn)日本艦隊(duì),基地在南線的美軍轟炸機(jī)群遠(yuǎn)程飛行,在惡劣天氣中,實(shí)施了2天有效地轟炸,重創(chuàng)了日本艦隊(duì),但未能全殲。中美貿(mào)易戰(zhàn)

(1)相關(guān)背景資料

1996年5月15日,美國(guó)政府借口中國(guó)對(duì)知識(shí)產(chǎn)權(quán)保護(hù)不力,單方面宣布:對(duì)中國(guó)出口到美國(guó)的紡織品、服裝及電子產(chǎn)品實(shí)施懲罰性關(guān)稅,涉及產(chǎn)品金額達(dá)30億美元,懲罰性稅率達(dá)100%,將于一個(gè)月后生效。當(dāng)晚,中國(guó)外經(jīng)貿(mào)部發(fā)表公告,做出了強(qiáng)烈的反應(yīng)。公告中表示:如果美國(guó)政府一意孤行,中國(guó)將實(shí)施反報(bào)復(fù),并與美國(guó)貿(mào)易報(bào)復(fù)措施生效的同時(shí)生效。在公告中還列舉了反報(bào)復(fù)清單,報(bào)復(fù)懲罰額與美國(guó)相當(dāng)。模型博弈方:中國(guó)、美國(guó)。下面用一些模擬的數(shù)據(jù)來(lái)寫(xiě)出該博弈問(wèn)題的贏得矩陣:將雙方報(bào)復(fù)的損失均假設(shè)為50億元,雙方不報(bào)復(fù)的收益均假設(shè)為20億元,單方報(bào)復(fù)而另一方不報(bào)復(fù),不報(bào)復(fù)方的損失假設(shè)為150億元(考慮牽連效應(yīng))。結(jié)果

這是一個(gè)二人非零和博弈問(wèn)題。按納什均衡理論可以得出:策略組合(報(bào)復(fù),報(bào)復(fù))為惟一的納什均衡。事實(shí)發(fā)展是:雙方都有允若,也有威脅。由于中方反報(bào)復(fù)力度相當(dāng),又在強(qiáng)化知識(shí)產(chǎn)權(quán)保護(hù)上作了承諾,因而,誘使美方考慮合作與不合作的得與失。雙方經(jīng)過(guò)5天的磋商,在知識(shí)產(chǎn)權(quán)問(wèn)題上達(dá)成一致的同時(shí),彼此宣布取消擬采取的貿(mào)易報(bào)復(fù)措施,避免了兩敗俱傷的結(jié)局,得到了好的結(jié)果。[討論]

為什么麥當(dāng)勞和肯德基的店鋪總是比較鄰近?

例雜貨鋪定位博弈為了進(jìn)一步說(shuō)明納什均衡的意義,讓我們看一個(gè)雜貨鋪定位博弈的例子,該模型是美國(guó)經(jīng)濟(jì)學(xué)家霍特林(Hotelling)提出的,因此又叫霍特林模型。設(shè)想有一個(gè)小居民點(diǎn),居民住宅沿著一條公路均勻地排開(kāi)?,F(xiàn)在有兩家雜貨鋪要在這個(gè)小居民點(diǎn)兜賣生意。假設(shè)他們賣同樣的東西,價(jià)格也完全一樣,但相互競(jìng)爭(zhēng)。那么,兩家雜貨店應(yīng)各自設(shè)在什么地方比較好。現(xiàn)在,因?yàn)樯唐芬粯?,價(jià)格也一樣,居民到哪個(gè)雜貨鋪買東西,就看哪一個(gè)雜貨鋪離自己比較近。如果把這條路四等分,雜貨鋪A設(shè)在1/4的位置,雜貨鋪B設(shè)在3/4的位置,問(wèn)題就解決了。好象這是一種不錯(cuò)的配置,按照這種配置,每個(gè)雜貨鋪的勢(shì)力范圍都是1/4??墒?,如果雜貨鋪只以自己贏利為目的,是不會(huì)滿足于這樣的位置安排的。因?yàn)槿绻鸄向右移動(dòng)一點(diǎn)兒到達(dá)A?的位置,那么A的地盤,就擴(kuò)張到A?和B的中點(diǎn),A的地盤就會(huì)比B持有的地盤大。所以,原來(lái)位于左邊的A,有向右邊移動(dòng)來(lái)擴(kuò)大自己的地盤的動(dòng)力。在這個(gè)定位博弈中,雜貨鋪的地盤就是市場(chǎng)份額,就是經(jīng)濟(jì)利益。同樣,原來(lái)位于右邊的B,有向左邊移動(dòng)擴(kuò)大自己地盤的激勵(lì)。可見(jiàn)上述A在1/4處,B在3/4處的位置配置方式,不是穩(wěn)定的配置。那么,什么位置才會(huì)是穩(wěn)定的呢?在兩個(gè)雜貨鋪市場(chǎng)競(jìng)爭(zhēng)的位置博弈中,位于左邊的要向右靠,位于右邊的要向左靠,最后的局面是:兩家雜貨鋪都緊挨著位于中點(diǎn)1/2的位置。這就是納什均衡的位置。因?yàn)檎l(shuí)要是單獨(dú)移開(kāi)“一點(diǎn)”,他就會(huì)喪失“半點(diǎn)”市場(chǎng)份額。所以誰(shuí)都不想偏離中點(diǎn)的位置。我們可能會(huì)想,實(shí)際生活中情況似乎不是這樣。的確可能不是這樣,但是那一定有其他因素在起作用。比方說(shuō)中點(diǎn)位置的房租特別貴,又比方說(shuō)在什么地方正好有一家鋪?zhàn)涌粘鰜?lái),還可能是原來(lái)的住家在要開(kāi)雜貨鋪時(shí)就用他自己的住宅,等等。再一種可能是兩家雜貨鋪都尊重一個(gè)協(xié)調(diào)機(jī)構(gòu),這個(gè)協(xié)調(diào)機(jī)構(gòu)從方便居民購(gòu)物的角度來(lái)考慮,希望兩家雜貨鋪互相禮讓,分別在1/4和3/4的位置開(kāi)張。還有一種可能,就是兩家雜貨鋪實(shí)際上是同一個(gè)企業(yè)的兩家分店,那么當(dāng)然在1/4和3/4的位置。只有兩家雜貨鋪都緊挨著在中點(diǎn)開(kāi)張才是穩(wěn)定的納什均衡結(jié)局,前提是每家雜貨鋪都是只關(guān)心自己眼前商業(yè)利益的“理性人”假設(shè)。在這種情況下,“理性人”的特征就是“唯利是圖”。既然唯利是圖,就要千方百計(jì)擠占對(duì)方的地盤,最終造成兩家“劍拔弩張”擠在中點(diǎn)的結(jié)局?,F(xiàn)在我們一些管理不好的攤販?zhǔn)袌?chǎng)就是這樣,下班以后,攤販都要往好地方擠,誰(shuí)也不肯禮讓。應(yīng)用上述霍特林模型還可以較好地說(shuō)明西方兩黨政治的一些有趣現(xiàn)象。比如西方一些國(guó)家的兩黨在競(jìng)選時(shí),越是到最后關(guān)頭,兩黨的政治綱領(lǐng),政策主張?jiān)絹?lái)越接近。等到一個(gè)政黨取代另一個(gè)政黨上臺(tái)之后,選民們發(fā)現(xiàn)其實(shí)新政黨和舊政黨在政策上并沒(méi)有多少實(shí)質(zhì)性的差別。再比如,產(chǎn)業(yè)或企業(yè)聚集問(wèn)題也可以用此模型得到很好的解釋。納什均衡是這樣一種策略(或行動(dòng))集,在這一策略集中每一個(gè)博弈者都確信,在給定競(jìng)爭(zhēng)對(duì)手的情況下,他選擇了最好的策略。通俗的表達(dá)就是:給定你的策略,我的策略是最好的策略;給定我的策略,你的策略也是你最好的策略。這就是說(shuō),雙方在對(duì)方的策略下自己現(xiàn)有的策略是最好的策略。即:此時(shí)雙方在對(duì)方給定的策略下不愿意調(diào)整自己的策略。這里的策略包括我們后面要介紹的混合策略。

顯然占優(yōu)策略均衡是一種納什均衡,但是納什均衡不一定是占優(yōu)均衡。

有些博弈的納什均衡點(diǎn)不止一個(gè)。如“性別之爭(zhēng)”博弈中有兩個(gè)納什均衡:

(歌劇,歌?。┖停ㄗ闱?,足球),在有兩個(gè)或兩個(gè)以上納什均衡點(diǎn)的博弈中,其最后結(jié)果難以預(yù)測(cè)。在“性別之爭(zhēng)”中,我們無(wú)法知道,最后結(jié)果是一同欣賞歌劇還是一起去看拳擊。除非有進(jìn)一步的信息,如丈夫或妻子具有優(yōu)先選擇權(quán),否則,我們無(wú)法確定雙方在上述博弈中會(huì)作出什么樣的選擇。

二、無(wú)納什均衡的例子那么,是不是所有的博弈均存在納什均衡點(diǎn)呢?不一定。實(shí)際上,納什均衡也是一種特殊情況,并不是所有的博弈都存在純策略納什均衡點(diǎn)(所謂純策略是指參與者在他的策略空間中選取惟一確定的策略)。但至少存在一個(gè)混合策略(mixedstrategy)均衡點(diǎn)(所謂混合策略是指參與者采取的不是惟一的策略,而是其策略空間上的一種概率分布,后面將會(huì)介紹)。這就是納什于1950年證明了的納什定理。例如“田忌賽馬”博弈中就沒(méi)有納什均衡。

V,-D-P,00,S0,0睡不睡偷不偷守衛(wèi)小偷

在經(jīng)濟(jì)學(xué)研究中,納什均衡首先對(duì)亞當(dāng)·斯密的“看不見(jiàn)的手”的原理提出挑戰(zhàn)。按照斯密的理論,在市場(chǎng)經(jīng)濟(jì)中,每一個(gè)人都從利己的目的出發(fā),而最終全社會(huì)達(dá)到利他的效果。從“納什均衡”我們引出一個(gè)悖論:從利己目的出發(fā),結(jié)果損人不利己。兩個(gè)囚徒的命運(yùn)就是如此。從這個(gè)意義上說(shuō),“納什均衡”提出的悖論實(shí)際上動(dòng)搖了西方經(jīng)濟(jì)學(xué)的基石。因此,從“納什均衡”中我們還可以悟出一條真理:合作是有利的“利己策略”。但它必須符合以下黃金律:按照你希望別人對(duì)待你的方式去對(duì)待別人,但只有他們也按同樣方式行事才行。也就是中國(guó)人說(shuō)的“己所不欲勿施于人”。但前提是人所不欲勿施于我。其次,納什均衡是一種非合作博弈均衡,在現(xiàn)實(shí)中非合作的情況要比合作情況普遍。

三、納什均衡的一致預(yù)測(cè)性質(zhì)(ConsistentForecast)

博弈分析最基本的目的之一是預(yù)測(cè)。也就是說(shuō),我們之所以要進(jìn)行博弈分析,最重要的原因就是預(yù)測(cè)特定博弈中的博弈方究竟會(huì)采取什么行動(dòng),博弈將有怎樣的結(jié)果。

一般來(lái)說(shuō),人類的歷史是不可預(yù)測(cè)的,也就是說(shuō),人類的集體行動(dòng)是不可能預(yù)知的。但是,在某些假定的條件下,某種集體行動(dòng)是可預(yù)測(cè)的。博弈論中對(duì)行動(dòng)者的假定是,行動(dòng)者是理性的。理性的人不可能作出非理性的事情,在這個(gè)假定下,許多結(jié)果就能預(yù)測(cè)出來(lái)。博弈的均衡就是可預(yù)測(cè)的結(jié)果。在囚徒困境中,囚犯除了選擇“坦白”外其他還有嗎?對(duì)于理性的或者說(shuō)自私的囚徒來(lái)說(shuō),肯定沒(méi)有。這是理性人的假定下的必然結(jié)論。因此,納什均衡的價(jià)值主要在于它的一些非常重要的性質(zhì),其中“一致預(yù)測(cè)性”就是最重要的性質(zhì)之一。也就是說(shuō),納什均衡是關(guān)于博弈將會(huì)如何進(jìn)行“一致預(yù)測(cè)”

(ConsistentForecast)的。這里所說(shuō)的“一致預(yù)測(cè)”是指這樣一種性質(zhì):如果所有博弈方都預(yù)測(cè)一個(gè)特定的博弈結(jié)果會(huì)出現(xiàn),那么所有的博弈方都不會(huì)不顧這種預(yù)測(cè)或者這種預(yù)測(cè)能力,去選擇與預(yù)測(cè)結(jié)果不一致的策略,即沒(méi)有哪個(gè)博弈方有動(dòng)力采取與這個(gè)預(yù)測(cè)結(jié)果不同的行為,沒(méi)有哪個(gè)博弈方有偏離這個(gè)預(yù)測(cè)結(jié)果的愿望,因此這個(gè)預(yù)測(cè)結(jié)果最終真會(huì)成為博弈的結(jié)果。也就是說(shuō),這里“一致預(yù)測(cè)”中“一致”的意義是,各博弈方的實(shí)際行為選擇與他們的預(yù)測(cè)一致,而不是不同博弈方的預(yù)測(cè)相同、無(wú)差異。納什均衡的一致預(yù)測(cè)性質(zhì)正是博弈預(yù)測(cè)能力的基本保證。其他的博弈分析概念要么不具備這種性質(zhì),從而不存在預(yù)測(cè)的穩(wěn)定性,因此不可能成為具有普遍意義的博弈分析概念,要么本身也是納什均衡,是納什均衡的一部分。

值得注意的是,雖然納什均衡是博弈結(jié)果的一致預(yù)測(cè),但納什均衡分析卻并不一定能對(duì)所有博弈的結(jié)果都作出準(zhǔn)確的預(yù)測(cè)。因?yàn)榧{什均衡的一致預(yù)測(cè)性質(zhì)本身并不保證各博弈方的預(yù)測(cè)是相同的,相同的預(yù)測(cè)是一致預(yù)測(cè)性質(zhì)的前提而不是結(jié)果。有許多博弈其實(shí)根本無(wú)法準(zhǔn)確預(yù)測(cè),因?yàn)橛行┎┺牟淮嬖诩{什均衡,而另一些博弈又有多重納什均衡且相互無(wú)顯著的優(yōu)劣或效率差別。

第三節(jié)納什均衡的應(yīng)用

一、古諾(Cournot)寡頭模型法國(guó)經(jīng)濟(jì)學(xué)家古諾(Cournot)一個(gè)半世紀(jì)以前提出的寡頭市場(chǎng)模型是博弈論的經(jīng)典模型設(shè)某市場(chǎng)有兩家企業(yè)生產(chǎn)同類型的產(chǎn)品,企業(yè)商1的產(chǎn)量為q1,企業(yè)商2的產(chǎn)量為q2,則市場(chǎng)總產(chǎn)量為Q=q1+q2。設(shè)市場(chǎng)出清價(jià)格P是關(guān)于市場(chǎng)總產(chǎn)量的函數(shù)P=P(Q)=a-Q。為分析簡(jiǎn)單的需要和突出博弈的特征,假設(shè)兩企業(yè)的生產(chǎn)都無(wú)固定成本,且單位產(chǎn)量的邊際成本相等,并為常數(shù)c,則兩個(gè)企業(yè)分別生產(chǎn)q1和q2單位產(chǎn)量的總成本分別為q1和q2。最后強(qiáng)調(diào)企業(yè)商同時(shí)決定各自的產(chǎn)量,即他們?cè)跊Q策之前都不知道另一方的產(chǎn)量。

在上述問(wèn)題構(gòu)成的標(biāo)準(zhǔn)博弈中,博弈方為企業(yè)1和企業(yè)2。兩博弈方的策略空間就是他們可以選擇的產(chǎn)量。假設(shè)產(chǎn)量是連續(xù)可分的,因此兩個(gè)企業(yè)都有無(wú)限多種可選策略,且產(chǎn)量不可能為負(fù)值。該博弈中兩博弈方的得益是兩企業(yè)各自的利潤(rùn),即各自的銷售收益減去各自的成本,二、最優(yōu)反應(yīng)函數(shù)(BestReactionFunction)如果上述通過(guò)求解極值的方法得到納什均衡解的方法比較抽象,下面我們用圖形法來(lái)比較直觀地得到古諾模型的納什均衡解,其借助的主要工具是最優(yōu)反應(yīng)函數(shù)。

三、伯特蘭德(Bertrand)寡頭模型下面我們討論雙頭壟斷中兩個(gè)企業(yè)相互競(jìng)爭(zhēng)的伯特蘭德(Bertrand)模型。伯特蘭德1883年提出了另一種形式的寡頭模型,這種模型與選擇產(chǎn)量的古諾模型的差別在于,伯特蘭德模型中各廠商所選擇的是價(jià)格而不是產(chǎn)量。這導(dǎo)致博弈企業(yè)的策略空間不同,得益(收益)函數(shù)不同,行為模式也不相同。下面我們用兩寡頭且產(chǎn)品有一定差別的伯特蘭德價(jià)格博弈模型來(lái)進(jìn)行分析。我們假設(shè)兩個(gè)企業(yè)生產(chǎn)有一定差別的產(chǎn)品,這種有差別的產(chǎn)品之間有很強(qiáng)的替代性,但又不是完全可替代,即價(jià)格不同時(shí),價(jià)格較高的不會(huì)完全銷不出去。如果企業(yè)1和企業(yè)2價(jià)格分別為P1和P2.四、公共地悲?。═ragedyoftheCommons)在經(jīng)濟(jì)學(xué)理論中,象公共資源利用、公共設(shè)施提供和公共環(huán)境保護(hù)等關(guān)于公共產(chǎn)品的使用方面的問(wèn)題的研究是一類極其重要的問(wèn)題。而公共地悲劇(Tragedyofthecommons)也是制度經(jīng)濟(jì)學(xué)中非常經(jīng)典的研究問(wèn)題。所謂公共地或公共資源在經(jīng)濟(jì)學(xué)中是指沒(méi)有哪個(gè)個(gè)人、企業(yè)或組織擁有所有權(quán),大家都可以自由利用的自然資源或人類生產(chǎn)的供大眾免費(fèi)使用的設(shè)施和產(chǎn)品。如人們都可以自由開(kāi)采使用的地下水,可自由放牧的草地,可自由排放廢氣廢水的空氣,以及無(wú)成本地使用公共道路、樓道的照明燈等。

公共地或公共物品或公共資源具有兩個(gè)重要的特征:一是每個(gè)人都可以從該物品中受益。特別是,沒(méi)有付費(fèi)的人可以與付費(fèi)的人同等享用該物品;二是成本由提供公共物品服務(wù)的水平?jīng)Q定,而不取決于接受公共物品服務(wù)的消費(fèi)者數(shù)量。在同樣的條件下,公共物品消費(fèi)者數(shù)量的增加不會(huì)導(dǎo)致成本的升高,而且沒(méi)有任何人能夠通過(guò)減少公共物品對(duì)他人的服務(wù)來(lái)提高對(duì)自己的服務(wù)。由于公共地或公共資源有上述兩個(gè)特征,因而利用這些資源時(shí)不支付任何代價(jià),除非政府將這些資源收歸國(guó)有,并對(duì)使用者征收資源稅或收取類似的費(fèi)用。例:蘇格蘭的草地為什么消失了?在18世紀(jì)以前,英國(guó)蘇格蘭地區(qū)有大量的草地,其產(chǎn)權(quán)沒(méi)有界定,屬公共資源,大家都可以自由地在那里放牧。草地屬于“可再生資源”,如果限制放牧的數(shù)量,沒(méi)有被牛羊吃掉的剩余草皮還會(huì)重新長(zhǎng)出大面積草場(chǎng),但如果不限制放牧規(guī)模,過(guò)多的牛羊?qū)⒉莩缘靡还舛?,則今后不會(huì)再有新草生長(zhǎng)出來(lái),草場(chǎng)就會(huì)消失?,F(xiàn)在的蘇格蘭的草地很美現(xiàn)在的蘇格蘭的草地很美

愛(ài)丁堡城堡

由于草地的產(chǎn)權(quán)沒(méi)有界定,政府也沒(méi)有對(duì)放牧作出規(guī)模限制,每家牧民都會(huì)如此盤算:如果其他牧民不約束自己的放牧規(guī)模,讓自己的牛羊過(guò)多地到草地上吃草,那么,我自己一家約束自己的放牧規(guī)模規(guī)模對(duì)保護(hù)草場(chǎng)的貢獻(xiàn)是微乎其微的,不會(huì)使草場(chǎng)免于破壞;相反,我也加入過(guò)度放牧的行列,至少在草場(chǎng)消失之前還會(huì)獲得一部分短期的收益。如果其他牧民約束放牧規(guī)模,我單獨(dú)一家人過(guò)度放牧不會(huì)破壞廣褒的牧場(chǎng),但自己卻獲得了高額的收益。因此,任何一位牧民的結(jié)論都會(huì)是:無(wú)論其他牧民是否過(guò)度放牧,我選擇“約束自己的放牧規(guī)?!倍际橇討?zhàn)略,從而被剔除。大家最終都會(huì)選擇過(guò)度放牧,結(jié)果導(dǎo)致草地消失,生態(tài)破壞。設(shè)某村莊有n戶牧民,該村有一片可以自由放牧羊群的公共草地。由于這片草地的面積有限,因此只能讓不超過(guò)某一數(shù)量的羊吃飽,如果在這片草地上放牧羊只的實(shí)際數(shù)量超過(guò)這個(gè)限度,則每只羊都無(wú)法吃飽,甚至?xí)I死,而且產(chǎn)出也減少,所以這些牧民必須決定自己養(yǎng)羊的數(shù)量,假設(shè)各牧民在決定自己的養(yǎng)羊數(shù)量時(shí)是不知道其他牧民養(yǎng)羊數(shù)量的,即各牧民決定養(yǎng)羊數(shù)量的決策是同時(shí)作出的。再假設(shè)所有牧民都清楚這片公共草地最多能養(yǎng)多少羊和羊只總數(shù)的不同水平下每只羊的產(chǎn)出。這就構(gòu)成了n個(gè)牧民之間關(guān)于養(yǎng)羊數(shù)量的一個(gè)博弈問(wèn)題,并且是一個(gè)靜態(tài)博弈。

公共資源的悲劇在我國(guó)有許多例子,如國(guó)有資產(chǎn)的流失,煤礦的濫開(kāi)濫采導(dǎo)致的煤礦資源的浪費(fèi)等就是公共資源悲劇的典型表現(xiàn),象公園,水利設(shè)施等公共設(shè)施也存在類似的問(wèn)題。在許多需要人類生產(chǎn)、提供的公共設(shè)施的問(wèn)題上,作搭便車者(FreeRider)總是比作提供者合算,因此許多必需的公共設(shè)施,如樓道里的電燈等就總是沒(méi)人提供。這些公共資源博弈問(wèn)題的結(jié)果說(shuō)明了在公共資源的利用,公共設(shè)施的提供方面,政府的組織、協(xié)調(diào)和制約是非常必要的,因?yàn)槿祟惞灿械馁Y源是有限的,當(dāng)每個(gè)人都試圖從有限的資源中多拿一點(diǎn)兒時(shí),就產(chǎn)生了局部利益與整體利益的沖突。人口問(wèn)題、資源危機(jī)、交通阻塞,都可以在社會(huì)悖論中得以解釋,在這些問(wèn)題中,關(guān)鍵是通過(guò)研究,制定游戲規(guī)則來(lái)控制每個(gè)人的行為,這也可以說(shuō)是政府之所以有必要存在的主要理由之一。

第四節(jié)

混合策略納什均衡

一、混合策略(MixedStrategies)和混合策略納什均衡2,10,00,01,3時(shí)裝足球時(shí)裝足球丈夫妻子夫妻之爭(zhēng)妻子的混合策略丈夫的混合策略夫妻之爭(zhēng)博弈的混合策略納什均衡策略得益博弈方1(0.75,0.25)0.67博弈方2(1/3,2/3)0.75“田忌賽馬”與混合策略納什均衡

為了簡(jiǎn)便起見(jiàn),我們將齊威王的策略從上到下分別稱為策略a、b、c、d、e和f,將田忌的策略從左到右分別稱為策略g、h、i、j、k和l。設(shè)齊威王分別以概率pa、pb、pc、pd、pe和pf隨機(jī)選擇相應(yīng)策略,顯然田忌采用g的期望得益為-3pa-pb-pc+pd-pe-pf,采用h的期望得益為-pa-3pb+pc-pd-pe-pf,采用i的期望得益為-pa-pb–3pc-pd–pe+

溫馨提示

  • 1. 本站所有資源如無(wú)特殊說(shuō)明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請(qǐng)下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請(qǐng)聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁(yè)內(nèi)容里面會(huì)有圖紙預(yù)覽,若沒(méi)有圖紙預(yù)覽就沒(méi)有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫(kù)網(wǎng)僅提供信息存儲(chǔ)空間,僅對(duì)用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對(duì)用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對(duì)任何下載內(nèi)容負(fù)責(zé)。
  • 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請(qǐng)與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶因使用這些下載資源對(duì)自己和他人造成任何形式的傷害或損失。

最新文檔

評(píng)論

0/150

提交評(píng)論