《身邊的博弈論：博弈論與信息經(jīng)濟(jì)學(xué)淺說》第一稿未定稿(一)版

上傳人：新*** IP屬地：河北上傳時間：2024-12-19 格式：PDF 頁數(shù)：65 大小：33.81MB 積分：12 舉報 版權(quán)申訴

《身邊的博弈論：博弈論與信息經(jīng)濟(jì)學(xué)淺說》第一稿未定稿(一)版_第2頁

《身邊的博弈論：博弈論與信息經(jīng)濟(jì)學(xué)淺說》第一稿未定稿(一)版_第3頁

《身邊的博弈論：博弈論與信息經(jīng)濟(jì)學(xué)淺說》第一稿未定稿(一)版_第4頁

《身邊的博弈論：博弈論與信息經(jīng)濟(jì)學(xué)淺說》第一稿未定稿(一)版_第5頁

已閱讀5頁，還剩60頁未讀，繼續(xù)免費(fèi)閱讀

版權(quán)說明：本文檔由用戶提供并上傳，收益歸屬內(nèi)容提供方，若內(nèi)容存在侵權(quán)，請進(jìn)行舉報或認(rèn)領(lǐng)

文檔簡介

最新資料推薦

4《身邊的博弈論：博弈論與信息經(jīng)濟(jì)學(xué)淺說》第一稿（未定稿，為北京師范大

學(xué)出版社某叢書所作）

余治國編著（《中國民營企業(yè)批判》當(dāng)代中國出版社，《轉(zhuǎn)型力：中國企業(yè)轉(zhuǎn)型之道》清華

大學(xué)出版社，目前正在創(chuàng)作《企業(yè)與企業(yè)家道德》國家行政學(xué)院出版社）

序言大博弈的思維觀..............................2

第一章什么是博弈論：從秦始皇統(tǒng)一天下談起..........3

1.秦始皇因何統(tǒng)一天下？........................................................3

2.博弈是一種競合游戲..........................................................5

3.博弈論不是“萬金油”........................................................7

第二章納什均衡、純策略與混和策略.................................................8

1.從圍棋定式談納什均衡........................................................8

2.從愛情故事談起：優(yōu)勢策略與房地產(chǎn)開發(fā)博弈..................................10

3.房地產(chǎn)博弈、警察捉小偷博弈與納什均衡.......................................11

4.位置博弈與商家策略.........................................................12

5.獵鹿模型的合作哲學(xué).........................................................13

第三章“囚徒困境”的啟示..........................15

1.“囚徒困境”的深刻哲理......................................................15

2.經(jīng)濟(jì)自由與效率.............................................................16

3.“囚徒困境”的破解：無限次重復(fù)博弈與有限次重復(fù)博弈........................17

4.威脅、承諾、作弊與懲罰.....................................................19

5.國家法律...................................................................20

6.猴子的故事與道德約束......................................................21

7.愛克斯羅德試驗(yàn)、針鋒相對的策略............................................22

8.合作、利他主義與愛克斯羅德試驗(yàn)的局限.......................................23

第四章“智豬博弈”：對諸多現(xiàn)象的解釋...............25

1.“智豬博弈”的故事.........................................................25

2“智豬博弈”與激勵機(jī)制設(shè)計(jì)...................................................26

3.企業(yè)戰(zhàn)略與“智豬博弈”.....................................................27

4.證券市場中的“智豬博弈”...................................................28

第五章常見的博弈案例..............................29

1.“斗雞博弈”與“騎憲難下”.................................................29

2.銀行會垮掉嗎？.............................................................31

3.如何以弱勝強(qiáng)？.............................................................32

4.公共地悲劇.................................................................34

5.少數(shù)人博弈與酒吧問迦.......................................................35

6.房地產(chǎn)市場的多人博弈.......................................................36

第六章信息經(jīng)濟(jì)學(xué)基礎(chǔ)..............................38

1.信息有價.....................................................................38

最新精品資料整理推薦，更新于二。二。年十二月二十七日2020年12月27日星期日11:10:02

最新資料推薦

2.從形象工程談道德風(fēng)險......................................................40

3.逆向選擇的困境：二手車市場為何建立不起來？................................41

4.聲譽(yù)、信號傳遞與制度設(shè)計(jì)...................................................42

5.所羅門故事與信息甄別.......................................................44

第七章討價還價的策略..............................46

1.從情侶博弈談起.............................................................46

2.先發(fā)優(yōu)勢與后發(fā)優(yōu)勢.........................................................47

3.談判的要訣:掌握對方心理與妥協(xié).............................................48

4.獨(dú)裁者博弈與勞資談判.......................................................49

第八章如何做好一個老板............................50

1.管理需要建立預(yù)期...........................................................50

2.獎罰分明...................................................................52

3.強(qiáng)強(qiáng)如何有效聯(lián)合？.........................................................53

4.如何接到一個項(xiàng)目？.........................................................54

第九章民主的悲劇................................................................55

L社會選擇的形式...............................................................55

2.非排序式投票................................................................56

3.孔多塞投票法則.............................................................59

4.BORDA法則及其他...........................................................60

5.投票操縱的方法：民主的悖論................................................61

6.阿羅不可能定理.............................................................63

參考文獻(xiàn)：.........................................64

序言大博弈的思維觀

對于許多非數(shù)學(xué)專業(yè)和經(jīng)濟(jì)學(xué)專業(yè)的人們來說，博弈論可能是一個極為陌生的概念。但

在國外，博弈論作為現(xiàn)代經(jīng)濟(jì)學(xué)的前沿領(lǐng)域，已成為占據(jù)主流的基本分析工具。1994年諾

貝爾經(jīng)濟(jì)學(xué)獎即授予三位博弈論專家，1996年諾貝爾經(jīng)濟(jì)學(xué)獎又授予兩位與博弈論一脈相

承的信息經(jīng)濟(jì)學(xué)的開拓者。

經(jīng)濟(jì)學(xué)的三次重大的“革命”，分別是“邊際分析革命”、“凱恩斯革命”與“博弈論革

命”。博弈論與信息經(jīng)濟(jì)學(xué)的產(chǎn)生與發(fā)展引發(fā)了一場深刻的經(jīng)濟(jì)學(xué)革命，博弈論與信息經(jīng)濟(jì)

學(xué)代表著一種新概念、新方法論、新分析方法和一種全新的思想。

經(jīng)濟(jì)學(xué)家凱恩斯1936年在《就業(yè)利息與貨幣通論》寫過這樣一段深刻的話，“經(jīng)濟(jì)學(xué)

家和政治哲學(xué)家的思想，不管是正確的還是錯誤的，其刀量之大，往往超出常人意料。事實(shí)

上，統(tǒng)治這個世界的就只是這些思想。許多實(shí)踐家自以為絕不受任何知識的影響，卻往往當(dāng)

上了一些已故經(jīng)濟(jì)學(xué)家的奴隸。執(zhí)政的狂人，自稱聽到了上帝的指示，實(shí)際上卻是從若干年

前?些學(xué)術(shù)界劣等思想家那兒拾取了一些怪誕的想法.....比起思想的逐漸侵蝕力來，既得

利益的勢力被過分夸大了」

由此可見，博弈論的思想比任何技術(shù)性的分析都要重要。

實(shí)際上，博弈之道是古已有之，但博弈思想的系統(tǒng)化、數(shù)學(xué)化卻是近幾十年的事。正是

最新精品資料整理推薦，更新于二。二。年十二月二十七日2020年12月27日星期日11:10:02

最新資料推薦

因?yàn)椴┺目茖W(xué)是一門新學(xué)科，我國管理界、經(jīng)濟(jì)界對博弈論與信息經(jīng)濟(jì)學(xué)的研究還是停留在

引進(jìn)介紹層面上，他們發(fā)表的成果大多堆砌龐雜的數(shù)學(xué)算法與令人眩FI的數(shù)學(xué)模型。雖然博

弈論與信息經(jīng)濟(jì)學(xué)在中國已是一門顯學(xué)，但卻逐漸變成陽春白雪、棄之不用的高深學(xué)問或是

概念混亂而被濫用到極至。

博弈論與信息經(jīng)濟(jì)學(xué)不僅僅能在學(xué)術(shù)領(lǐng)域中光彩奪目，在其它領(lǐng)域如軍事、管理、體育、

政治、公關(guān)、個人生活中同樣能得到充分利用，甚至在生物學(xué)中都可以覓其蹤跡。在普通的

企業(yè)管理中，經(jīng)營者要熟練地掌握管理之術(shù)，必須能夠自動自發(fā)并自覺地運(yùn)用博弈論與信息

經(jīng)濟(jì)學(xué)。在日常生活中，人們可以博弈論與信息經(jīng)濟(jì)學(xué)得思想方法賴分析甚而解決實(shí)際問題。

正是因?yàn)槿绱耍Z貝爾經(jīng)濟(jì)學(xué)獎獲得者保羅?薩繆爾遜(PaulSamuelson)說：“要想在現(xiàn)

代社會做一個有文化的人，你必須勸博弈論有一個大致了解J

筆者試圖在這本小冊子中用最淺顯的語言描述博弈論與信息經(jīng)濟(jì)學(xué)的大概思路方法，能

用語言可以描述的就盡量少用或不用數(shù)學(xué)，因此筆者未對博弈論與信息經(jīng)濟(jì)學(xué)作數(shù)學(xué)化、系

統(tǒng)的證明與闡述。但是，只有這樣才能夠使似乎高深的博弈論與信息經(jīng)濟(jì)學(xué)思想很輕松地為

普通讀者所掌握，并能夠讓讀者應(yīng)用其思想方法來分析其至是能夠解決身邊的實(shí)際問題。

筆者這里還要解釋一下書名的由來，“身邊的博弈論”并不是說讀者身邊看到感受到的

博弈論，這樣理解未免過于狹窄。這里“身邊的博弈論”的含義是，人們身邊無處不在的博

弈哲學(xué)，無論是直接感受到還是從未接觸過的社會、政治、法律、軍事、經(jīng)濟(jì)、管理等現(xiàn)象。

由于筆者本人學(xué)識有艱，對博弈論與信息經(jīng)濟(jì)學(xué)的理解與研究尚不深刻，錯誤在所淮免,

敬請博弈論與信息經(jīng)濟(jì)學(xué)的方家高人指點(diǎn)，以免貽誤廣大讀者。

余治國2005年9月謹(jǐn)識于安徽工業(yè)大學(xué)

第一章什么是博弈論：從秦始皇統(tǒng)一天下談起

1.秦始皇因何統(tǒng)一天下？

2000多年前，雄才大略的秦始皇第一次統(tǒng)一了中國大地,并創(chuàng)建了當(dāng)時世界上最龐大的

帝國，得以名垂青史。從當(dāng)時的歷史條件來看，秦國雖然在商鞅變法之后實(shí)力大增，但其經(jīng)

濟(jì)、政治、軍事實(shí)力是遠(yuǎn)遠(yuǎn)不能與六國總和相匹敵的。這種情況下，六國與秦國的形勢就產(chǎn)

生了兩種針鋒相對的可能：其一，六國采用“合縱”政策對抗秦國，也就是各國締結(jié)軍事盟

約，共同抵御秦國的侵略，秦國若對任一國家發(fā)動侵略，其它國家必須無條件M兵營救；其

二，六國采用“連橫”政策與秦國妥協(xié)、也就是各國都與秦國簽訂友好互助條約，保持雙邊

和平關(guān)系。

當(dāng)時七國之中，只有齊國實(shí)力比秦國稍遜一籌，成為六國軍事同盟的核心。一旦齊國放

棄“合縱”政策，六國的軍事同盟就土崩瓦解。真實(shí)的歷史也證明了這一點(diǎn)，秦國對六國聯(lián)

盟的破壞正是從齊國開始的。

在這種情況下，秦國與齊國都有兩種戰(zhàn)略政策可以選擇，那就是“合縱”與“連橫”。

秦國如果默許六國“合縱”，齊國采用“合縱”政策，結(jié)果是秦國勢力擴(kuò)張被遏制，而齊國

成為六國領(lǐng)袖，勢力得以擴(kuò)張。秦國采取“連橫”政策，齊國仍然采取“合縱”政策，結(jié)果

是秦國與六國處于對峙狀態(tài)。秦國默許六國“合縱”，齊國卻采用“連橫”政策與秦國示好,

結(jié)果是秦國沒有吞并六國的野心自然無法一統(tǒng)天下，齊國的勢力也沒有得以擴(kuò)張。而歷史的

真相是，秦國采取“連橫”政策，齊國默許秦國的“連橫”政策并與秦國建立友好外交關(guān)系,

齊國最終被滅，千古一帝秦始皇得以名揚(yáng)千秋。

最新精品資料整理推薦，更新于二。二。年十二月二十七日2020年12月27日星期日11:10:02

最新資料推薦

秦國與六國集團(tuán)之間為爭斗實(shí)質(zhì)上就是一種博弈。秦國與齊國之間的戰(zhàn)略政策選擇正是

為了在保持自身能夠生存的基礎(chǔ)上謀取更大的利益甚至是統(tǒng)一天下。有利益的爭奪是博弈的

目的，也是形成博弈的基礎(chǔ)。經(jīng)濟(jì)學(xué)的最基本的公設(shè)就是經(jīng)濟(jì)人或理性人的目的就是為了收

益最大化，參與博弈的博弈者正是為了自身收益的最大化而互相爭斗。參與博弈的各方形成

相互競爭相互對抗的關(guān)系，以爭得利益的多少決定勝負(fù)，一定的外部條件又決定了競爭和對

抗的具體形式，這就形成了博弈。如象棋對局的參與者是以將對方的軍為目標(biāo)，戰(zhàn)爭的目的

是為了勝利，古羅馬競技場中角斗士在爭奪兩人中僅有的一個生存權(quán)，企業(yè)經(jīng)營的目的是為

了生存發(fā)展，而股市中人們所爭的很實(shí)在，就是金錢。從經(jīng)濟(jì)學(xué)角度來看，有一種資源為人

們所需要，而資源的總量具有稀缺性或是有限的，這時就會發(fā)生競爭，競爭需要有一個具體

形式把大家拉在一起，一旦找到了這種形式就形成了博弈，競爭各方之間就會走到一起開始

一場博弈?！秾O子兵法》上說，“知己知彼，百戰(zhàn)百勝?！?，可見競爭對抗還有博弈各方擁

有信息的特征。比如上一個例子中，秦國與齊國都明白對方的策略，從博弈理論來說，更拗

口的說法是秦國知道齊國知道自己的策略，反之齊國亦然，這種句法我們可以一直這么用下

去，一直用到打“……”，而這正是博弈雙方所掌握的信息。

因此我們可以了解到，形成一個博弈有4個要素：

1.博弈要有2個或2個以上的參與者（Player）。在博弈中存在一個必須的因素，那就是

不是一個人在一個亳無干擾的真空作決策。比如，前例中只有秦國，而沒有與之而抗的六國，

就不存在'‘合縱連橫”的博弈。從經(jīng)濟(jì)學(xué)的角度來看，如果足一個人做決策而不受到他人下

擾的話，那就是一個傳統(tǒng)經(jīng)濟(jì)學(xué)或管理學(xué)中最經(jīng)常研究的最優(yōu)化問題，也就是一個人或一個

企業(yè)在一個既定的局面或情況下如何決策的問題。最簡單一個最優(yōu)化的例子就是，吸煙傷肺，

不吸煙卻又傷心，煙民是選擇抽煙還是不抽煙，這就需要進(jìn)行權(quán)衡（Tradeoff）。如果這個煙

民非單身貴族，而是有妻子或女友，這種情況下就很有可能形成一個博弈。這也就是，博弈

者的身邊充斥著具有主觀能動性的決策者，他們的選擇與其它博弈者的選擇相互作用、相互

影響。這種互動關(guān)系自然會對博弈各方的思維和行動產(chǎn)生重要的影響，有時甚至直接影響著

其他參與者的決策結(jié)果。

在馮?諾依曼（VonNeumann）的博弈論奠基之作《博弈論與經(jīng)濟(jì)行為》一書中舉過這

樣一個經(jīng)典的例子。在《魯濱遜漂流記》中，與世隔絕的“魯濱遜”（RobinsonCrusoe）一

個人組成一個獨(dú)立的經(jīng)濟(jì)系統(tǒng)，有中學(xué)數(shù)學(xué)水平的人都能夠清楚，這只是一個普通的求解最

大值的問題。因?yàn)轸敒I遜面對的是一些死的數(shù)據(jù)，而不是有主觀意愿的人。一旦“星期五”

（《魯濱遜漂流記》中魯濱遜的黑人仆人）加入這個系統(tǒng)，這個經(jīng)濟(jì)系統(tǒng)就形成了一個博弈

問題。

2）博弈要有參與各方爭奪的資源或收益（Resources或Payoff）。資源指的不僅僅是自然

資源，如礦山、石油、土地、水資源等，還包括了各種社會資源，如人脈、信譽(yù)、學(xué)歷、職

位等。如果這些資源是無限供給的，那么我們也不需要為共產(chǎn)主義而奮斗了，因?yàn)橐徊骄涂?/p>

以邁入“貨惡其棄于地也，不必藏于已，力惡其不出于身也，不必為己?！?、“大道之行也，

天下為公」的大同社會。當(dāng)然，不可否認(rèn)是，一方面，博弈者之間會發(fā)生沖突；另一方

面，他們當(dāng)中也包含著合作的潛力。

筆者在這里還要強(qiáng)謊一點(diǎn)是，資源是有主觀性的。人們之所以會參與博弈是受到利益

的吸引，預(yù)期將來所獲得利益的大小直接影響到競爭博弈的吸引力和參與者的關(guān)注程度。經(jīng)

濟(jì)學(xué)的效用理論可以用來解釋這個問題，凡是自己主觀需要的就是資源，反之亦然。比如，

“孩子總是自己的好，妻子總是別人好”：自己的孩子在眼里是無價之寶，而在別人面前相

對是無價值的；即使是眾人公認(rèn)的美妻嬌眷也會產(chǎn)生審美疲勞，資源的價值不斷下降，這正

是效用遞減規(guī)律起了作用，最極端的例子大概就是明代小說《鏡花緣》中所描繪的君子國，

人人禮讓使得客觀的資源就變得亳無價值，自然就不存在競爭與博弈。

最新精品資料整理推薦，更新于二。二。年十二月二十七日2020年12月27日星期日11:10:02

最新資料推薦

3)參與者有自己能夠選擇的策略(Strategy).所謂策略，就是“計(jì)利以聽，乃為之

勢，以佐其外。勢者，因利而制權(quán)也?！保@指的是直接實(shí)用的針對某一個具體問題所采取

的應(yīng)對方式。通俗的說策略就是計(jì)策，是博弈參與者所能夠選擇的手段方法。比如秦國就采

用了“連橫”的策略將六國“合縱”瓦解。

一般口常生活中，策略選擇僅是解決問題的方法，并不牽涉到分析關(guān)鍵因素、確定局

勢特征這些理論化的內(nèi)容，而博弈論種的策略選擇，是先對局勢和整體狀況進(jìn)行分析，確定

局勢特征，找出其中關(guān)鍵因素，然后在最重要的目標(biāo)上進(jìn)行策略選擇。由此可見，博弈論種

的策略是可以牽一發(fā)而動全身的，這直接對整個局勢造成重大影響。

4)參與者擁有一定量的信息(Information)。比如在“合縱連橫”的故事中，秦國

與六國之間所擁有的信息就是完全的。但有些時候，信息并不是完全的，俗話說“天有不測

風(fēng)云”，比如今天是陰云密布、狂風(fēng)大作，氣象臺預(yù)報明天是“陰轉(zhuǎn)小雨”，明天出門上班

到底要不要帶傘呢？這種情況的信息是不完全的，人們決策的信息條件是不確定。當(dāng)然從情

理上說，在實(shí)際生活中一般是要帶傘以防不測。

通俗的說，博弈就是個人或組織在??定的環(huán)境條件與既定的規(guī)則下，同時或先后，僅僅

一次或是進(jìn)行多次地選擇策略并實(shí)施，從而得到某種結(jié)果的過程。我們生活在這個世界上，

就不可避免地要與他人打交道，這是一個利益交換的過程，也就無可避免地要面對各種矛盾

和沖突。所謂博弈論聽似拗牙瞥齒，看似深不可測，但其思想極易理解。簡單說來博弈論就

足研究，人們?nèi)绾芜M(jìn)行決策、以及這種決策的如何達(dá)到均衡問題。每個博弈者在決定采取何

種行動時，不但要根據(jù)自身的利益和目的行事，還必須考慮到他的決策行為對其他人的可能

影響，以及其他人的反應(yīng)行為的可能后果，通過選擇最佳行動計(jì)劃，來尋求收益或效用的最

大化。

2.博弈是一種競合游戲

“博弈論”的英文是“GameTheoi-y"，實(shí)際上Gme的本意是游戲，博弈論直接翻譯成中

文最貼切的直譯是“游戲理論”。更準(zhǔn)確點(diǎn)說，是一種競合的智力游戲。

所謂競合，就是競爭合作的簡寫，一個博弈，并不僅僅是競爭，實(shí)際上競爭種包含著潛

在合作的種子，合作中包含著潛在競爭的種子。合作博弈并不是指合作各方具有合作的意向

或態(tài)度，而是指在博弈中有一些對博弈各方有約束力的協(xié)議或契約，或者說是博弈各方不能

公然“串通”或“共課”。合作博弈最典型的例子就是石油輸出國組織歐佩克(Organization

ofPetroleumExportingCountries,簡稱Opec),其1960年9月，由伊朗、伊拉克、科

威特、沙特阿拉伯和委內(nèi)瑞拉的代表在巴格達(dá)開會，決定聯(lián)合起來共同對付西方石油公司，

維護(hù)石油收入。隨著成員的增加，歐佩克發(fā)展成為亞洲、非洲和拉丁美洲一些主要石油生產(chǎn)

國的國際性石油組織。歐佩克協(xié)調(diào)和統(tǒng)一各成員國的石油政策，并以石油生產(chǎn)配額制的手段

來維護(hù)它們各自和共同的利益，把國際石油價格穩(wěn)定在公平合理的水平上。比如有些時候?yàn)?/p>

防止石油價格颼升，歐佩克可依據(jù)市場形勢增加其石油產(chǎn)量；為阻止石油價格下滑，歐佩克

則可依據(jù)市場形勢減少其石油產(chǎn)量。

智力游戲與博弈相近似的木質(zhì)是，在確定游戲規(guī)則的約束下，游戲參與者決策、行動的

過程。各種智力游戲?qū)嶋H上就是一個實(shí)際社會、經(jīng)濟(jì)、管理、軍事、政治等現(xiàn)象抽象出來的

縮微模擬的模型。在這個意義上不妨說，博弈論就是研究怎么玩好游戲的理論。

游戲是一種抽象。面對復(fù)雜現(xiàn)象時，人們經(jīng)常會“見樹木不見森林”，無法抓住某種

現(xiàn)象的關(guān)鍵所在。而在游戲中，可以通過抽象出現(xiàn)實(shí)生活中的要點(diǎn)，并將干擾因素減至最低,

從而輕松地分析問題并找到合理可行的解決方法。

中國最古老的圍棋最初的功能形態(tài)就是模擬戰(zhàn)爭。圍棋包含最多的是軍事內(nèi)涵，如國

最新精品資料整理推薦，更新于二。二。年十二月二十七日2020年12月27日星期日11:10:02

最新資料推薦

而殲之，生死存亡為先，爭地奪利為上。圍棋以獲得最大的利益為勝，抽象出戰(zhàn)爭的本質(zhì)和

目的，非常符合戰(zhàn)爭規(guī)律，

圍棋游戲的規(guī)則極其簡單，不過是兩氣生，一氣死，附加帖目、打劫等輔助規(guī)則，最

終以所占地盤大小定勝負(fù)。但其作為一項(xiàng)智力游戲，與戰(zhàn)爭在很多方面都相通。圍棋棋手在

小小棋盤上較量，就是戰(zhàn)爭、戰(zhàn)場、戰(zhàn)斗在棋盤上的演繹。

戰(zhàn)爭理念和戰(zhàn)爭指導(dǎo)思想是“基于毀傷”，以破壞、消耗、摧毀敵方為上?，F(xiàn)代西方

國家提出“基于效果”的作戰(zhàn)思想，美國人將這一戰(zhàn)爭理念上的革命稱為新的戰(zhàn)爭哲學(xué)。基

于效果就是，著眼于敵方整個作戰(zhàn)系統(tǒng)的控制，使之喪矢作戰(zhàn)能力。美軍在伊拉克發(fā)動“斬

首行動”的前一天，還專門召開了推山基于效果作戰(zhàn)理念的新聞發(fā)布會，接著就發(fā)動了進(jìn)攻。

圍棋模擬出“基于效果”的戰(zhàn)爭理念，強(qiáng)調(diào)從全局上控制，而不是基于蠅頭小利。即所

有的作戰(zhàn)方法都必須是有效的，著子要看在全局中是否有用、有效,而不再是基于棋理、棋

道、棋風(fēng)等虛幻的在形式。基于效果的思想就是贏棋第一，實(shí)事求是。比如韓國棋手李昌鎬

就是基于效果的典范。

現(xiàn)在很多世界級公司都已經(jīng)明白智力游戲的作用。比如著名的微軟公司在招聘員工時出

過非?！皟和钡恼衅缚碱}，題目是這樣的：”某合唱團(tuán)的4名成員A、B、C、I)往演出現(xiàn)

場，他們途中要經(jīng)過一座小橋。當(dāng)他們趕到橋頭時，天已經(jīng)黑了，周圍沒有燈。他們只有一

只手電筒?，F(xiàn)在規(guī)定：一次最多只許兩人一起過橋，過橋人手里必須有手電筒，而且手電筒

不能用扔的方式傳遞。4個人的步行速度都不同，若兩人同行，則以較慢者的速度為準(zhǔn)。A

需花1分鐘過橋，B過橋需花2分鐘，C需花5分鐘過橋，D需花10分鐘過橋。請問：他們能在17

分鐘內(nèi)過橋嗎？”這可不是微軟公司的別出心裁，據(jù)說比界上許多躋身世界500強(qiáng)的公司在

招收新員工時，都要出類似的智力題。

智力游戲可以鍛煉人的思維能力，培養(yǎng)人的思維方法。良好的思維方法能使我們從錯

綜復(fù)雜的現(xiàn)象中找到事物的本質(zhì)，從紛繁的因素中找到事物變化的主要原因，使事物呈現(xiàn)出

條理性。思維方法是抽象的，它不像1+1=2那么簡單，只有通過自己的想像，親自動手操

作，經(jīng)歷失敗，才能逐步形成。思維科學(xué)化程度越高的人，工作中發(fā)現(xiàn)問題、解決問題的能

力就越強(qiáng)。這一點(diǎn)已成為人們的共識。

在許多智力游戲中，都存在這么一個共同的特點(diǎn)，就是參與者所選擇的策略對于勝負(fù)

有著舉足輕重的影響。一個游戲一點(diǎn)規(guī)則制訂好之后，策略選擇的好壞就成了游戲參加者所

能自由運(yùn)用的左右游戲結(jié)果的最關(guān)鍵因素，。特別是在圍棋、象棋之類參與者的初始條件完全

相同的游戲中，策略選擇就成了游戲結(jié)果的唯一決定因素。

至于從圍棋初段段到九段之間的差別，從博弈論的角度去看，就是他們之間策略選擇

的技巧高低不同而已。博弈論的策略思維是一種技巧。策略思維從一些基本技巧出發(fā)，考慮

的是怎樣將這些基本技巧最大限度地發(fā)揮出來。

任何游戲都有自己的規(guī)則(RuleofIhegame)。實(shí)際現(xiàn)實(shí)自然也是如此，這就是法律、

道德和各種成文或不成文的規(guī)章制度和慣例等。當(dāng)然，這些規(guī)則也不是一成不變的，它會隨

著情況的改變和人們的要求不斷修正，但是只要規(guī)則存在，這個規(guī)則就是確定了人們行為的

前提條件。因此博弈與游戲都有?個重要的共同特征，那就是這些規(guī)則規(guī)定游戲參加者可以

做什么，不可以作什么，按照什么次序去做，什么時候結(jié)束游戲，一旦參與者犯規(guī)將受到怎

樣的處罰等。

游戲者的策略有相互依存的關(guān)系。每一個游戲者從游戲所得結(jié)果的好壞不僅取決于自

身的策略選擇，同時也取決于其它參加者的策略選擇。有時甚至一個壞的策略會給選它的一

方帶來并不壞的結(jié)果，原因是其它方選擇了更壞的利他而不利己的策略。這一點(diǎn)也是游戲與

博弈重要的相似之處。

最新精品資料整理推薦，更新于二。二。年十二月二十七日2020年12月27日星期日11:10:02

最新資料推薦

3.博弈論不是“萬金油”

博弈論并不是“萬金油”，正如諾貝爾經(jīng)濟(jì)學(xué)獎得主萊因哈德?澤爾滕教授所說，“博

弈論并不是療法，也不是處方，它不能幫我們在賭博中獲勝，不能幫我們通過投機(jī)來致富，

也不能幫我們在下棋或打牌中贏對手。它不告訴你該付多少錢買東西，這是計(jì)算機(jī)或者字典

的任務(wù)。”

要求博弈論能夠完全刻畫真實(shí)的世界，那么這命中注定會徒勞無功。根據(jù)著名的哥德爾

不完備定理，任何一個理論體系必定是不完全的，任何理論包含了既不能證明為真也不能證

明為假的命題,對這個世界的最好描述可能只有其本身，但是正如羅賓遜夫人的妙語“比例

尺是一比一的地圖是沒用的二

博弈論也是這樣，博弈論力圖用最簡單的假設(shè)下得到最大范圍的推理應(yīng)用。博弈論的這

種方法與很多應(yīng)用廣泛學(xué)科都是相似的。如歐幾里德幾何的基本假設(shè)是兩點(diǎn)之間直線，推演

出龐大而嚴(yán)密的幾何體系，可以說，在生活中或工程應(yīng)用中，歐幾里德幾何學(xué)的思想方法是

無處不在、無時不有。其基本公設(shè)之一就是，人是理性的(rational)o所謂理性的人是指行

動者具有推理能力，在具體策略選擇時的目的是使自己的利益最大化。而現(xiàn)實(shí)生活中，人們

再做決策時往往是有限理性。

所謂有限理性，也就是說人不是機(jī)器，人的理性是有限度的。比方說，某人要簽署一份

合同，有三種方法可供選擇：一種是計(jì)劃好，安排好一切，然后不動腦筋按部就班地照計(jì)劃

進(jìn)行；另一種是做進(jìn)度安排的時候都留一點(diǎn)余地，可供簽訂合同雙方私下協(xié)商解決：最后一

種是完全沒有安排，憑著當(dāng)時的感情與直覺任意為之，這種方法當(dāng)然不可能是理性的。

后兩種一眼就可看出完全不滿足博弈論意義上的理性，即使是第一種方法也不是真正意

義.上的經(jīng)濟(jì)理性。這是因?yàn)槿藗兒茈y對每個措施將要產(chǎn)生的結(jié)果具有完全的了解和正確的預(yù)

測，常常要在缺乏完全了解的情況下，一定程度地根據(jù)主觀意識進(jìn)行決策，個人或企業(yè)的決

策都是在有限理性的條件下進(jìn)行的。完全理性，意味著對每個抉擇的確切后果都有完完全全

的了解。事實(shí)上，一個人對自己的行動條件的了解，從來都只能是零碎的；至于使他得以從

對當(dāng)前狀況的了解去推想未來后果的那些規(guī)律和法則，他也是所知甚微的。

人類的精力和時間永遠(yuǎn)是有限的，人不可能具備完全理性，不可能掌握所有知識和信息。

人類也不可能搜尋到所需的全部的信息。另一方面也要意識到信息的搜尋需要成本，而不是

亳不費(fèi)成本的，因?yàn)槿祟惐仨殲榇烁冻龃罅康臅r間、精力和財力等等。意圖搜尋到所有信息,

企圖做出收益最優(yōu)的決策行為有時反而是最不理性的行為。

但當(dāng)我們退而求其次時，博弈論可以得到對現(xiàn)實(shí)的客觀世界描述的近似。所以博弈論仍

然是我們目前所能得到的最好但非唯一的工具。就像并不完美的力學(xué)是自然科學(xué)的哲學(xué)和數(shù)

學(xué)一樣，博弈論是社會科學(xué)的力學(xué)和數(shù)學(xué)。沒有牛頓力學(xué)我們連最簡單的物理現(xiàn)象都無法理

解，馬用了多大的力拉動一車貨物？上帝說“讓牛頓來做吧"，于是我們知道了馬用的力相

當(dāng)于克服摩擦力.同樣的道理，沒有博弈論我們也無法解釋分析很多現(xiàn)實(shí)的社會現(xiàn)象v

著名的博弈論大師魯賓斯坦(Rubinstein)說過，“一個博弈模型是我們關(guān)于現(xiàn)實(shí)的觀念

的近似，而不是現(xiàn)實(shí)的客觀描述的近似”?？磥怼袄碚撝畼涫腔疑模畼涑Ｇ?！”這

句話，我們應(yīng)該謹(jǐn)記于心。

最新精品資料整理推薦，更新于二。二。年十二月二十七日2020年12月27日星期日11:10:02

最新資料推薦

第二章納什均衡、純策略與混和策略

1.從圍棋定式談納什均衡

我們已經(jīng)知道，博弈論的基本前提是，某人或某物的行為效果如何，有賴于他人或他物

的行為。由于世上人間的事物很少不依賴于其他事物而存在。非合作博弈強(qiáng)調(diào)利益的沖突，

即沖合作甚至對抗?fàn)顟B(tài)v比如，“零和博弈”就是典型的沖合作博弈，它是指博弈各方的所

得之和為零，在特殊情況下如兩人博弈時，?方所得與另?方所失相等。從嚴(yán)格的數(shù)學(xué)角度

來看，圍棋19X19的361個交叉點(diǎn)就是圍棋對弈者所得的總和，因此圍棋棋手非輸即贏，可

見圍棋明顯是數(shù)學(xué)意義上的嚴(yán)格的零和博弈。

世事如棋局，而棋局是可以用博弈思維加以概括的。比如過分的“騙著”,“本手”與“緩

著”之間，一般都會選擇本手，著法過分如不遇反擊，可能占到便宜，如遇反擊則可能虧損，

因此如果棋力相當(dāng)，則應(yīng)考慮到對手的反擊手段。對手也同樣考慮到在追求利益中不可能占

盡便宜。這就導(dǎo)致雙方都能接受的方案。

圍棋定式從策略層面看，如一方的策略是搶占實(shí)地，另一方是獲得外勢，而結(jié)果相當(dāng)，

互有所得，雙方就愿意那樣下。搶占實(shí)地考慮現(xiàn)實(shí)利益，獲得外勢考慮將來發(fā)展，這便形成

一個雙方的“均衡”：另一方面，可以從具體行棋效果來看，如果一步棋能考慮到對手各種

應(yīng)手而依然成立，對手也運(yùn)用同樣法則找到應(yīng)對，則可以說雙方達(dá)成了“均衡二

在經(jīng)濟(jì)學(xué)中，均衡(equilibrium)意即相關(guān)量處于穩(wěn)定值。比如在經(jīng)典的供需分析中，若

某一商品的市場價格使得欲購買該商品的人均能買到，同時想賣的人均能將商品賣出去，此

時該商品的供求達(dá)到了均衡。這個市場價格可稱之為均衡價格，產(chǎn)量可稱之為均衡產(chǎn)量。均

衡分析是經(jīng)典經(jīng)濟(jì)學(xué)中的重要方法。

在講解納什均衡之前，我們再來看這樣一個例子。一般對博弈論稍微有些了解的人，都

會知道“囚徒困境”這個名詞。這個例子就是在“囚徒困境”的基礎(chǔ)上所作的修改。

A和B是兩個因盜竊而被抓的慣犯。警察局局長C正在調(diào)查該局管轄區(qū)域內(nèi)的一宗懸

而未決的銀行搶劫案，并且他根據(jù)一系列的線索判定A和B是這樁案了?的兇犯。因?yàn)樵摼?/p>

管轄地區(qū)治安一向混亂不堪，C的上級對C非常惱火，直接威脅C如果銀行案破不了，就

要撤銷C局長的職位，給予降級懲罰。C在上級的壓力下不得不耗費(fèi)大量時間、精力提審A

和Bo為了能夠讓兩個囚犯認(rèn)罪，C想讓A和B明白，假如只有他們其中的一人坦白認(rèn)罪

則這個人可能受到的最嚴(yán)厲的懲罰是什么，但向他們遵守承諾，若兩個人都坦白，則會從輕

發(fā)落。

于是，這個警察局長C分別與A、B立下許諾：如果只有一個人坦白認(rèn)罪，則認(rèn)罪的

?方會收到所有指控，會因銀行搶劫而判無期徒刑，另?個人則不會再加刑罰。如果無人認(rèn)

罪，兩個人都會因盜竊罪而判刑2年。如果兩個人都坦白，則兩個人都被判處有期徒刑5

年。

這樣，警察局長C給A和B構(gòu)造了一個博弈。不妨假設(shè)，A和B都是極其精明的會打

小算盤的自私自利不講“江湖義氣”的人，同時A和B被分別審查不能夠進(jìn)行溝通。在這

種情況下，A會在腦子里打小算盤，他會想：如果選擇坦白，那么B選擇坦白時將判刑5

年，B選擇不坦白時將判刑20年，因此選擇坦白時最壞的打算就把牢底坐穿；若是選擇不

坦白，那么B選擇坦白時將無罪釋放獲得自由，B選擇不坦白時將判有期徒刑5年，因此

選擇不坦白時最壞的可能就是被囚禁5年。兩害相權(quán)，取其輕。因此在這種情況下，A必然

會選擇不坦白，同樣的道理，B也會選擇不坦白。這個時候，博弈達(dá)到了這樣一種局面，這

最新精品資料整理推薦，更新于二。二。年十二月二十七日2020年12月27日星期日11:10:02

最新資料推薦

種局面就是納什均衡(NashEquilibrium)。

納什均衡的思想其實(shí)并不復(fù)雜，在博弈達(dá)到納什均衡時，局中的每一個博弈者都不可能

因?yàn)閱畏矫娓淖冏约旱牟呗远黾荧@益，于是各方為了6己利益的最大化而選擇了某中最優(yōu)

策略，并與其他對手達(dá)成了某種暫時的平衡。這種平衡在外界環(huán)境沒有變化的情況下，倘若

有關(guān)各方堅(jiān)持原有的利益最大化原則并理性面對現(xiàn)實(shí)，那么這種平衡狀況就能夠長期保持穩(wěn)

定。

再簡單一點(diǎn)說，一策略組合中，所有的參與者面臨這樣的一種情況：當(dāng)其他人不改變策

略時，他此時的策略是最好的。也就是說，此時如果他改變策略，他的收益將會降低。在納

什均衡點(diǎn)上，每一個理性的參與者都不會有單獨(dú)改變策略的沖動.

由此可見，納什均衡是一穩(wěn)定的博弈結(jié)果。打一個比方，如果把一個乒乓球，放到一個

光滑的鐵鍋里，不論其初始位置在何處，最終乒乓球都會穩(wěn)定地停留在鍋底，這時的鍋底就

可稱為是一個納什均衡點(diǎn)3相反，如果鍋是扣在地上的，那么鍋底部位是很難放穩(wěn)一個乒乓

球的，因?yàn)橥魏畏较虻囊稽c(diǎn)點(diǎn)移動，都會使球徹底離開鍋底。這時的鍋底部位就不是一個

納什均衡點(diǎn)了。

博弈的結(jié)果并不都能成為均衡。博弈的均衡是穩(wěn)定的，則必然可以預(yù)測。納什均衡的另

一層含義是：在對方策略確定的情況下，每個參與者的策略是最好的，此時沒有人愿意先改

變或主動改變自己的策略。在上面的“囚徒困境”變形的博弈中，A和B都不坦白就是一

個納什均衡，這對雙方來說都是最優(yōu)選擇。同時在這個博弈中，其均衡對雙方來說是全局最

優(yōu)的。當(dāng)然博弈達(dá)到納什均衡，并不一定是對參與者最有利的結(jié)果，更不意味著是對整個社

會作為一個整體而言最有利的結(jié)果，比如“囚徒困境”的例子導(dǎo)致了整體的不利。

圍棋與這個博弈的例子是有所不同的。上面的這個例子是A和B雙方?jīng)]有信息交換下

的博弈，這就是博弈論中的靜態(tài)博弈概念。圍棋則是對弈雙方相繼按照一先一后次序行動的

博弈。對于一人一步的相繼行動的博弈，每個參與者都必須向前展望或預(yù)期，估計(jì)對手的意

圖，從而倒后推理，決定自己這一步應(yīng)該怎么走。這是一條線性的推理鏈：“假如我這么做，

他就會那么做——若是那樣，我會這么反擊”，后面的步驟依此類推。也就是說，你怎么走

棋，完全取決于對手的上一招。這在博弈論上叫做“倒布法”。在動態(tài)博弈中，存在明顯的

馬太效應(yīng)，也就是說凡是少的，連他僅有的也奪過來；凡是多的，就加給他，讓他更多。比

如在圍棋上，就有“一招不慎，滿盤皆輸”的諺語，當(dāng)然我們也要應(yīng)用動態(tài)博弈的馬太效應(yīng)

原理，在獲得優(yōu)勢的情況能夠保持優(yōu)勢擴(kuò)大優(yōu)勢，直至最后成功。

而在同時行動的靜態(tài)博弈里，沒有?個博弈者可以在自己行動之前得知另?個博弈者的

整個計(jì)劃。在這種情況下，互動推理不是通過觀察對方的策略進(jìn)行，而是必須通過看穿對手

的策略才能展開。要想做到這一點(diǎn)，單單假設(shè)自己處于對手的位置會怎么做還不夠。即便你

那樣做了，你只會發(fā)現(xiàn)，你的對手也在做同樣的事情，即他也在假設(shè)自己處于你的位置會怎

么做。因此，每一個人不得不同時擔(dān)任兩個角色，一個是自己，一個是對手，從而找出雙方

的最佳行動方式。與一條線性的推理鏈不同，這是一個循環(huán)，即“假如我認(rèn)為對方認(rèn)為我認(rèn)

為...

這樣來看，定式是?系列納什均衡的累計(jì)直至局部達(dá)到穩(wěn)定的?種變化，直到?方認(rèn)為

可以根據(jù)形勢選擇任何變化或脫先而無局部受損之虞。由于定式是在大量實(shí)戰(zhàn)基礎(chǔ)上不斷被

驗(yàn)證并長期積累而成。

因此在動態(tài)博弈中，納什均衡的要義在于：即使在對抗條件下，雙方可以通過向?qū)Ψ教?/p>

出威脅和要求，找到雙方能夠接受的解決方案而不至于因?yàn)楦髯宰非笞晕依娑鵁o法達(dá)到妥

協(xié)，甚至兩敗俱傷。穩(wěn)定的均衡點(diǎn)建立在找到各自的“占優(yōu)策略”(dominantstrategy),即無

論對方作何選擇，這一策略優(yōu)于其他策略。

最新精品資料整理推薦，更新于二。二。年十二月二十七日2020年12月27日星期日11:10:02

...............................................最新資料推薦......................................

2.從愛情故事談起：優(yōu)勢策略與房地產(chǎn)開發(fā)博弈

“原地高天，堪嘆古今情難盡；癡男怨女，可憐風(fēng)月債難償。”我們來先看歐?亨利的小

說《麥吉的禮物》描述的這樣一個愛情故事。新婚不久的MM和GG,很是窮困潦倒。除了MM

那一頭美麗的金色長發(fā)，GG那一只祖?zhèn)鞯慕饝驯恚阍僖矝]有什么東西可以讓他們引以為傲

了。雖然生活很累很苦，他們卻彼此相愛至深。每個人關(guān)心對方都勝過關(guān)心自己。為了促進(jìn)

對方的利益，他們愿意奉獻(xiàn)和犧牲自己的一切。

話說明天就是圣誕節(jié)了，小兩口都是身無余錢。為了讓愛人過得好一點(diǎn)，每個人還是想

悄悄兒準(zhǔn)備一份禮物給對方。GG賣掉了心愛的懷表，買了一套漂亮發(fā)卡，去配那一頭金色

長發(fā)。MM剪掉心愛的長發(fā)，拿去賣錢，為GG的懷表買了表鏈和表袋。

最后，到了交換禮物的時刻，他們無可奈何地發(fā)現(xiàn)，自己如此珍視的東西，對方已作為

禮物的代價而出賣了。花了慘痛代價換回的東西，竟成了無用之物。出于無私愛心的利他主

義行為，結(jié)果卻使得雙方的利益同時受損。

歐?亨利在小說中寫道：“聰明的人，送禮自然也很聰明。大約都是用自己有余的物事,

來交換送禮的好處。然而，我講的這個平平淡淡的故事旦，兩個住公寓的傻孩子，卻是笨到

極點(diǎn)，彼此為了對方，白白犧牲了他們屋檐下最珍貴的財富。”從這段文字看，歐亨利似乎

并不認(rèn)為這小兩口是理性的。且讓我們暫時拋開愛情的溫馨，單從利益的角度來解讀。我們

假定，他們每個人，有一個“亳不利己專門利人”的偏好系統(tǒng)，毫不考慮自身利益，專門謀

求別人的幸福。這樣，個人選擇付出還是不付出，只看對方能不能得益，與自己是否受損無

關(guān)。以這樣的偏好來衡量，最好的結(jié)果自然是自己付出而對方不付出，對方收益增大；次好

的結(jié)果是大家都不付出，對方不得益也不犧牲；再次的結(jié)果是大家都付出；最壞的結(jié)果是別

人付出而自己不付出，靠犧牲別人來使自己得益。我們不妨可用數(shù)字來代表個人對這匹種結(jié)

果的評價：第一種結(jié)果給3分，第二種結(jié)果給1分，第三種結(jié)果給1分，最后那種給0分。

不難看出，無論對方選擇付出，還是選擇不付出，個人自己的最佳選擇都是付出。然而

這并不是對大家都有利的選擇。事實(shí)上，大家都選擇不付出，明顯優(yōu)于大家都選擇付出的境

況，這就達(dá)到了上文提到的納什均衡。

實(shí)際上，這里的例子是一個博弈論中所說的占優(yōu)策略均衡。通俗地說，在占優(yōu)策略均衡

中，不論所有其他參與人選擇什么策略，一個參與人的占優(yōu)策略都是他的最優(yōu)策略。顯然，

這一策略一定是所有其他參與人選擇某一特定策略時該參與人的占優(yōu)策略。因此，占優(yōu)策略

均衡一定是納什均衡。在這個例子中，MM選擇不付出，也就是不剪掉金發(fā)對于MM來說是一個

優(yōu)勢策略，也就是說UM不付出，GG不管選擇什么策略，MM所得的結(jié)果都好于GG。同理，GG

不賣掉懷表對于GG來說也是一個優(yōu)勢策略。

再舉個簡單的例子：一名籃球前鋒和隊(duì)友在藍(lán)下面對著對方的一個后衛(wèi)時，形成了二打

一的局面，該前鋒可以選擇直接投籃，也可以選擇傳球給隊(duì)友，根據(jù)經(jīng)驗(yàn)，傳球過人的成功

率更大，那么傳球就是該前鋒的優(yōu)勢策略。即某些時候它勝于其他策略，且任何時候都不會

比其他策略差。如果一個球員具有這樣?種策略，無論其他球員怎么做，這個策略都會高出

一籌，那么這個球員就有一個優(yōu)勢策略。當(dāng)然如果一個球員有這么一個優(yōu)勢策略，他的決策

就會變得非常簡單，只要直接采用該策略而完全不必考慮對手的應(yīng)對策略。

還有一個要注意的問題是，采用優(yōu)勢策略得到的最壞結(jié)果并不一定比采用另外一個策略

得到的最佳結(jié)果要好，這是很多博弈論普及書中容易出錯的一個問題。應(yīng)該說，對局者采用

優(yōu)勢策略在對方采取任何策略時，總能夠顯示出優(yōu)勢。比如就這個例子來說，就MM來說,

她采用不付出的策略，無論GG付出或不付出，MM的不付出策略總是占有優(yōu)勢。GG的優(yōu)

勢策略也是一樣。但是，MM選擇不付出的最壞結(jié)果是1,二選擇付出的最好結(jié)果是3,很

明顯，MM的優(yōu)勢策略得到的最壞結(jié)果并不比采用另外個策略得到的最佳結(jié)果要高出

最新精品資料整理推薦，更新于二。二。年十二月二十七日2020年12月27日星期日11:10:02

最新資料推薦

籌。

反之，劣勢策略則是指在博弈中，不論其他參與人采取什么策略，某一參與人可能采取

的策略中，對自己嚴(yán)格不利的策略，劣勢策略是我們在日常生活中不可以選擇的行動。劣勢

策略是與優(yōu)勢策略相對應(yīng)的概念，筆者這里就不多做介紹。

3.房地產(chǎn)博弈、警察捉小偷博弈與納什均衡

實(shí)際上，在上一小節(jié)，每個參與人都有優(yōu)勢策略的情況下，優(yōu)勢策略均衡是非常合乎邏

輯的。?個優(yōu)勢策略優(yōu)于其他任何策略，同樣，?個劣勢策略則劣于其他任何策略。假如你

有一個優(yōu)勢策略，你可以選擇采用，并且知道你的對手若是有一個優(yōu)勢策略他也會照辦；同

樣，假如你有一個劣勢策略，你應(yīng)該避免采用，并且知道你的對手若是有一個劣勢策略他也

會規(guī)避。

但遺憾的是不是所有博弈都有優(yōu)勢策略，哪怕這個博弈只有兩個個參與者。實(shí)際上，優(yōu)

勢策略只是博弈論的一種特例。雖然出現(xiàn)一個優(yōu)勢策略可以大大簡化行動的規(guī)則，但這些規(guī)

則卻并不適用于大多數(shù)現(xiàn)實(shí)生活中的博弈。

來看這樣一個房地產(chǎn)開發(fā)博弈的例子。假定北京市的房地產(chǎn)市場需求有限，A、B兩個

開發(fā)商都想開發(fā)一定規(guī)模的房地產(chǎn)，但是市場對房地產(chǎn)的需求只能滿足一個房地產(chǎn)的開發(fā)

量，而且，每個房地產(chǎn)商必須一次性開發(fā)這一定規(guī)模的房地產(chǎn)才能獲利。在這種情況下，無

論是對開發(fā)商A還是開發(fā)商B,都不存在一種策略完全優(yōu)于另一種策略，也不存在一個策略

完全劣于另一個策略。因?yàn)椋绻鸄選擇開發(fā)，則B的最優(yōu)策略是不開發(fā)；如果A選擇不開

發(fā)，則B的最優(yōu)策略是開發(fā)；類似地，如果B選擇開發(fā)，則A的最優(yōu)策略是不開發(fā)；如果B

選擇不開發(fā)，則A的最優(yōu)策略是開發(fā)。這樣就形成了一個循環(huán)選擇。

根據(jù)納什均衡含義就是：給定你的策略，我的策略是最好的策略；給定我的策略，你的

策略也是你最好的策略。即雙方在對方給定的策略下不愿意調(diào)整自己的策略。這個博弈的納

什均衡點(diǎn)不止一個，而是兩個：要么A選擇開發(fā)，B不開發(fā)；要么A選擇不開發(fā)，B選擇

開發(fā)。在這種情況下，A與B都不存在優(yōu)勢策略，也就是A和B不可能只要選擇某一個策

略而不考慮對方的所選擇的策略。實(shí)際上，在有兩個或兩個以上納什均衡點(diǎn)的博弈中，其最

后結(jié)果難以預(yù)測。在房地前博弈中，我們無法知道，最后結(jié)果是A開發(fā)，B不開發(fā)還是A

不開發(fā)，B開發(fā)。

再來看這樣一個警察捉小偷博弈的例子。某個村莊上只有一名警察，他要負(fù)責(zé)整個村的

治安。小村的兩頭住著兩個全村最富有的村民A和B,A、B分別需要保護(hù)的財產(chǎn)為2萬元、

1萬元。整個小村某一天來了個小偷，要在村中偷盜A和B的財產(chǎn)，這個消息被警察得知。

因?yàn)榉稚矸πg(shù)，警察一次只能在一個地方巡邏；而小偷也只能偷盜其中一家。若警察在某家

看守財產(chǎn)，而小偷也選擇了去該富戶家，就會被警察抓住；若警察沒有看守財產(chǎn)的富戶家而

小偷去了，則小偷偷盜成功。

一般人會憑著感覺認(rèn)為，警察當(dāng)然應(yīng)該看守富戶A家財產(chǎn)，因?yàn)锳2萬元的財產(chǎn)而B

只有1萬元的財產(chǎn)。實(shí)際上，對于警察的一個最好的做法是，警察抽簽決定去A還是B家。

因?yàn)锳家的財產(chǎn)是B家的2倍，所以用兩個簽代表A家，比如如果抽到1、2號簽去A家,

抽到3號簽去B家。這樣警察有2/3的機(jī)會去A家進(jìn)行做看守，1/3的機(jī)會去B家做看

守。而小偷的最優(yōu)選擇是：以同樣抽簽的辦法決定去A家還是去B家實(shí)施偷盜，只是抽到

1、2號簽去A家，抽到3號簽去B家，那么，小偷有1/3的機(jī)會去A家，2/3的機(jī)會去

B家。這些數(shù)值是可以通過聯(lián)立方程準(zhǔn)確計(jì)算出的，筆者這里就不給出具體的數(shù)學(xué)計(jì)算過程。

細(xì)心的讀者會發(fā)現(xiàn)，警察捉小偷博弈與前面所舉的兩個博弈案例有一個很大的差別，就

是用到了概率的知識，警察與小偷沒有一個一定要選杼其個策略的納什均衡，而只有選擇某

最新精品資料整理推薦，更新于二。二。年十二月二十七日2020年12月27日星期日11:10:02

最新資料推薦

個策略是多少幾率的納什均衡。

在博弈論中，可以選擇出某個策略的納什均衡，這個策略叫做純策略，凡是用到概率（并

且?guī)茁什荒転椤：虸,否則就退化為純策略，可以想見，純策略的納什均衡只是博弈的一種

特例）的納什均衡。用專業(yè)的話來說，所謂純策略是指參與者在他的策略空間中選取惟一確

定的策略。但至少存在一個混合策略均衡點(diǎn)。所謂混合策略是指參與者采取的不是惟一的策

略，而是其策略空間上的概率分布。這就是納什于1950年證明了的納什定理。而這個博弈

沒有純策略納什均衡點(diǎn)，而有混合策略均衡點(diǎn)。這個混合策略均衡點(diǎn)下的策略選擇是每個參

與者的混合策略選擇。

最常見混和策略就是猜硬幣游戲。比如在足球比較開場，裁判將手中的硬幣拋擲到空中，

讓雙方隊(duì)長猜硬幣落下的正反面。由于硬幣落下是正是反是隨機(jī)的，概率應(yīng)該都是1/2。那

么，猜硬幣游戲的參與者都是1/2的概率選擇正與反，這時博弈達(dá)到混和策略納什均衡。再

比如我們兒時玩的“剪、方、錘”就不存在純策略均衡，對每個小孩來說，自己采取出“剪”、

“布”還是“錘”的策略應(yīng)當(dāng)是隨機(jī)的。一旦一方知道另一方出其中某個策略的可能性增大,

那么這個對弈者在游戲中輸?shù)目赡苄跃驮龃蟆Ｒ虼?，每個小孩的最優(yōu)混合策略是采取每個策

略的可能性是1/3。在這樣的博弈中，每個小孩各取三個策略的1/3是納什均衡。由此可

見：純策略是參與者一次性選取的，并且堅(jiān)持他選取的策略；而混合策略是參與者在各種備

選策略中采取隨機(jī)方式選取的。在博弈中，參與者可以改變他的策略，而使得他的策略選取

滿足一定的概率。當(dāng)博弈是零和博弈時，即一方所得是另外一方的所失時，此時只有混合策

略均衡。對于任何一方來說，此時不可能有純策略的占優(yōu)策略。

4.位置博弈與商家策略

有這么一個大家都很熟悉的現(xiàn)象，那就是在每個大大小小的城市街道上，經(jīng)常見到一些

地段上的商店十分擁擠，構(gòu)成一個繁榮的商業(yè)中心區(qū)，但另一些地段卻十分冷僻，沒什么商

店。更有意思的是，往往在一個同類型的商家總是聚集在比較近的地方，比如在任何城市肯

德基、麥當(dāng)勞之間總是津津相鄰。再如超市現(xiàn)象，前兩年有很多人對超市的布局發(fā)表了一些

議論。因?yàn)橛腥俗⒁獾?，如果在一條街上有2?3家超市的話，這幾家超市經(jīng)常性地會“相

依為鄰”，選址離得很近，倘若它們稍微分散地布置于街上，無疑對市民的購物提供柞當(dāng)?shù)?/p>

便利，因此他們認(rèn)為超市“擁擠”在一起屬于資源浪費(fèi)。

類似的事情發(fā)生于電視臺的節(jié)目播放。很多電視迷會發(fā)現(xiàn)，大部分電視臺總是將最精彩

的節(jié)目放在相同的時間段，甚至有些時候是在相同時間段播放類似的節(jié)目，比如你播“快樂

大本營”，我就播“超級總動員”；你播“玫瑰有約”，我就播“單身男女”。人都說文人相輕,

電視臺也是這么相煎太急，

博弈論能夠?qū)@個現(xiàn)象作出科學(xué)的解釋。首先看一個簡單的博弈模型進(jìn)行敘述：

假設(shè)有條完全筆直的公路，連接城市A到城市B之間的交通。這條公路上每天行駛著

大量的車輛，并且車流量在公路上是均勻分布的。假設(shè)有兩家快餐店，我們不妨假設(shè)為靠高

速公路起家的麥當(dāng)勞與肯德基,它們要在這條公路上選擇一個位置開設(shè)快餐，招攬來往車輛。

為了能夠更加清晰的說明這個博弈，我們不得不畫一張圖。

0IIIIIIIII1

A1/4麥當(dāng)勞1/23/4肯德基B

圖1位置博弈

再對該模型作一個合乎邏輯的假定：通常情況下，車輛總是樂意到距自己最近的快餐店

購買食物。根據(jù)這個原則，從資源的最佳配置來看，麥當(dāng)勞，肯德基應(yīng)該分別開在1/4.3/4

最新精品資料整理推薦，更新于二。二。年十二月二十七日2020年12月27日星期日11:10:02

最新資料推薦

處是最優(yōu)。在這種均勻散布的情況下，

人人文庫> 全部分類> 教育資料 > 輔導(dǎo)培訓(xùn)

溫馨提示

1. 本站所有資源如無特殊說明，都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
2. 本站的文檔不包含任何第三方提供的附件圖紙等，如果需要附件，請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
3. 本站RAR壓縮包中若帶圖紙，網(wǎng)頁內(nèi)容里面會有圖紙預(yù)覽，若沒有圖紙預(yù)覽就沒有圖紙。
4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
5. 人人文庫網(wǎng)僅提供信息存儲空間，僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理，對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯，并不能對任何下載內(nèi)容負(fù)責(zé)。
6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容，請與我們聯(lián)系，我們立即糾正。
7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時也不承擔(dān)用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

《身邊的博弈論：博弈論與信息經(jīng)濟(jì)學(xué)淺說》第一稿未定稿(一)版

文檔簡介

溫馨提示

最新文檔

評論

《身邊的博弈論：博弈論與信息經(jīng)濟(jì)學(xué)淺說》第一稿未定稿(一)版

文檔簡介

溫馨提示

最新文檔

評論

相關(guān)文檔