博弈論基礎(chǔ)PPT精品課程課件全冊課件匯總

上傳人：n*** IP屬地：貴州上傳時間：2022-07-24 格式：PPT 頁數(shù)：203 大?。?.83MB 積分：30 舉報 版權(quán)申訴

已閱讀5頁，還剩198頁未讀，繼續(xù)免費(fèi)閱讀

版權(quán)說明：本文檔由用戶提供并上傳，收益歸屬內(nèi)容提供方，若內(nèi)容存在侵權(quán)，請進(jìn)行舉報或認(rèn)領(lǐng)

文檔簡介

1、授課人：XX XX PPT內(nèi)容可自行編輯博弈論基礎(chǔ)精品課程策略博弈2th，阿維納什迪克西特，蘇珊斯克絲策略：博弈論導(dǎo)論。喬爾沃森博弈論基礎(chǔ)羅伯特吉本斯博弈入門馬丁奧斯本研究生：博弈論D. 弗登博格，讓梯若爾博弈論R. 邁爾森博弈論教程M. 奧斯本，A. 魯賓斯坦參考書在所有社會，人們經(jīng)?；?。有時，互動是合作，其他的時候，互動是競爭。在這兩種情況下，都可以用一個術(shù)語，即相互依賴性來表示一個人的行為對另外一個人的福利造成的影響。相互依賴的情形可稱為策略環(huán)境。因?yàn)槿藗優(yōu)榱舜_定所采取的最優(yōu)行動，必須考慮他周圍的其他人會怎樣選擇行動。1 概述策略對于社會的運(yùn)行來說，是非?；镜?。我們

2、要學(xué)會了解在策略環(huán)境下，人們實(shí)際上是如何采取行動的，以及他們應(yīng)該怎樣采取行動。相互依賴的情形可稱為策略環(huán)境。因?yàn)槿藗優(yōu)榱舜_定所采取的最優(yōu)行動，必須考慮他周圍的其他人會怎樣選擇行動。這種系統(tǒng)的研究形成了應(yīng)該策略互動的理論。1 概述這個理論在許多方面都是有用的。首先，它提供了一種語言。其次，它提供了應(yīng)該框架，能夠指導(dǎo)我們建立策略環(huán)境模型。其三，它有助于我們追朔，對行為假設(shè)的邏輯推理過程。1 概述這個理論在許多方面都是有用的。首先，它提供了一種語言。其次，它提供了應(yīng)該框架，能夠指導(dǎo)我們建立策略環(huán)境模型。其三，它有助于我們追朔，對行為假設(shè)的邏輯推理過程。1 概述好幾百年前，數(shù)學(xué)家就開始研究室內(nèi)游

3、戲，試圖構(gòu)造最優(yōu)的游戲策略。在1713年，沃爾德格雷夫就某種紙牌游戲的解決方法，與他的同事德莫特和貝努利進(jìn)行交流。沃爾德格雷夫的解決方法，與現(xiàn)代理論的結(jié)論相一致。1 概述在19世紀(jì)的前10年，古諾對寡頭模型的均衡進(jìn)行了研究。而埃奇沃思解決了交易經(jīng)濟(jì)中的議價問題。1 概述1913年，關(guān)于博弈的第一個定理（關(guān)于象棋游戲的結(jié)論）被澤梅羅證明。接著，博雷爾開創(chuàng)性地提出了“策略”的概念。1 概述博弈論發(fā)展的關(guān)鍵事件是1944年馮諾依曼和奧斯卡摩根斯坦的著作博弈論和經(jīng)濟(jì)行為的出版。此書奠定了該領(lǐng)域的基石。接下去的幾十年中，數(shù)學(xué)家和經(jīng)濟(jì)學(xué)家豐富了它的基礎(chǔ)，逐步打造了社會科學(xué)最強(qiáng)大和最有影響力的工具箱之一。1

4、概述1994年諾貝爾獎頒給了，在20世紀(jì)50-70年代對博弈論做出了重大貢獻(xiàn)的3位經(jīng)濟(jì)學(xué)家：約翰納什，約翰海薩尼和萊茵哈特澤爾騰。1 概述接著榮膺諾貝爾經(jīng)濟(jì)學(xué)獎金桂冠的經(jīng)濟(jì)學(xué)家有，諸如信息和合約方面的專家-威廉維克里和詹姆斯米利斯（1996年）。1 概述還有2001年獲獎的米歇爾斯彭斯，約瑟夫斯蒂克利茨和喬治阿克洛夫。1 概述目前，博弈論被許多來自不同領(lǐng)域的專業(yè)人士使用，這些領(lǐng)域包括經(jīng)濟(jì)學(xué)、政治學(xué)、法律、生物、國際關(guān)系哲學(xué)以及數(shù)學(xué)。事實(shí)上，大多數(shù)情形即包含了沖突元素，也包含了合作的元素。我們對博弈的組成要有一個廣義的理解。簡而言之，博弈是策略環(huán)境的正式描述。因此，博弈論是研究相互依賴情形的正

5、式的方法論。這里，“正式”是指一種以數(shù)學(xué)化的精確，以及邏輯上的一致見長的結(jié)構(gòu)。利用正確的理論工具，我們可以研究各種情況下的行為，從而更好地理解經(jīng)濟(jì)中的相互作用。1 概述 1.1 什么是博弈論？博弈論幫助我們理解，決策者互動的情形。Creates a double record of bank transactions.Bank reconciliation.導(dǎo)言MovieCricketMovie2,10,0Cricket0,01,22 擴(kuò)展型在數(shù)學(xué)上，有幾種方法描述一個博弈：1 博弈有一組參與人；2 對于參與人可能采取的行動的完整描述（即它們的可行行動集）；3 對于參與人采取行動時，所知信息

6、的描述；4 對于參與人的行為將如何導(dǎo)致博弈結(jié)果的規(guī)定；5 對于參與人對結(jié)果偏好的定義。2 擴(kuò)展型迪斯尼工作室的蟲子的一生和夢工場的螞蟻。卡曾伯格被迪斯尼的老板艾斯納從派拉蒙招賢，以重振迪斯尼動畫部。卡氏于1994年8月辭職。不久，艾斯納接受了提議，于是蟲子的一生進(jìn)入了制作階段。大概同時，卡氏與斯皮爾伯格等組建了夢工場。開始制作螞蟻。兩個工作室是在決定制作兩部影片之后，才得知對方的決定的。2 擴(kuò)展型迪斯尼準(zhǔn)備在1998年感恩節(jié)期間，發(fā)行蟲子的一生。而這正是夢工場原定埃及艷后的上映時間。夢工場于是決定，把埃及艷后推遲到圣誕節(jié)。爭取在蟲子的一生上映之前，讓螞蟻上映。最后，螞蟻為夢工場創(chuàng)造了超過0.9

7、億美元的利潤，而蟲子的一生確保了超過1.6億美元的利潤。2 擴(kuò)展型讓我們用一個數(shù)學(xué)模型講述這個故事。為了把它轉(zhuǎn)化成數(shù)學(xué)的抽象語言，我們必須對故事進(jìn)行適當(dāng)?shù)暮喕统淌交?。我們的目?biāo)應(yīng)該是從中分析得出一兩個策略要素。這可以幫助我們從理論學(xué)者的角度，理解這個決策環(huán)境。2 擴(kuò)展型 K E K K fghlmLSPNPNPNRNabcde我們可以用一個樹狀結(jié)構(gòu)表示兩個公司之間的互動。樹狀結(jié)構(gòu)由節(jié)點(diǎn)和分支組成。節(jié)點(diǎn)表示事件的發(fā)生點(diǎn)，分支表示可以選擇的不同的行為方案。我們用實(shí)心圓表示節(jié)點(diǎn)，用連接節(jié)點(diǎn)的箭頭表示分支。這個樹狀結(jié)構(gòu)稱為擴(kuò)展型表述。a稱為初始點(diǎn)，a,b,c,d,e稱為決策點(diǎn)。f,g,h,l,m稱為

8、終止點(diǎn)。表示博弈的結(jié)果。 2 擴(kuò)展型 K E K K fghlmLSPNPNPNRNabcde我們用信息集來定義參與人在博弈中的決策節(jié)點(diǎn)所擁有的信息。有一些信息集只包括一個節(jié)點(diǎn)，例如在節(jié)點(diǎn)a,b。節(jié)點(diǎn)c,d則包含在一個信息集中。每個信息集只能做出一個決策。而正如在故事中所說的，雙方都不知道對方是否制作影片之前，決定制作自己的影片。虛線表示K知道自己處于這兩個節(jié)點(diǎn)之一，但是不能區(qū)分自己處于c還是d。即K缺乏信息。 2 擴(kuò)展型 K K K 40,11013,1200,14080,00,0LSPNPNPNRNabcdeE參與人對于結(jié)果的偏好性。K是否更希望博弈終止點(diǎn)f而不是h上結(jié)束？我們必須知道參與

9、人關(guān)心什么，才能將終止點(diǎn)根據(jù)每個參與人的偏好排列。通常用數(shù)字表述參與人的偏好排序最為簡便。這也稱為支付(payoff)，或者效用(utilities)。2 擴(kuò)展型 K K K 40,11013,1200,14080,00,0LSPNPNPNRNabcdeE我們引入一些數(shù)學(xué)符號來考察博弈。我們來看看一個市場博弈，兩個廠商通過選擇高價或者低價進(jìn)行競爭。我們用參與人i表示任何一個參與人的數(shù)字代碼。即在一個有n個參與人的博弈中，i=1,2,n。在某些博弈中，一個參與人可以在無限多個行動中進(jìn)行選擇。2 擴(kuò)展型 12pyesnop,100-p0,0一個簡單的討價還價模型，即最后通牒議價。假設(shè)1希望賣一幅畫

10、。各方只有一次出價的機(jī)會。假設(shè)賣方先出價，買方2可以決定是否接受這個價格。如果畫沒有成交，雙方均一無所獲。如果成交，賣方獲得等于價格的收益，買方獲得自己的價值。2 擴(kuò)展型 12pyesnop,100-p0,01.1 什么是博弈論？博弈論幫助我們理解，決策者互動的情形。Creates a double record of bank transactions.Bank reconciliation.導(dǎo)言MovieCricketMovie2,10,0Cricket0,01,23 策略策略是博弈中的一組參與人完整的相機(jī)的行動計劃。這里的“完整的相機(jī)計劃”是對一個參與人行為的完整描述。它包含了它的每一

11、個決策點(diǎn)上的行為。因?yàn)樾畔⒓硎镜氖窃诓┺闹懈鱾€參與人的決策點(diǎn)，所以，一個參與人的策略描述的是，在它的每個信息集中，它所做出的決策。3 策略例如，在下面的博弈中，你的策略必須包括在所有的節(jié)點(diǎn)，即a,c-d,以及e的信息集中，所有選擇的行動。即使你打算在節(jié)點(diǎn)a選擇“留下”，你也必須對上述所有決策進(jìn)行定義。3 策略 K K K 40,11013,1200,14080,00,0LSPNPNPNRNabcdeE例子：該圖描述了一個簡單的市場博弈。兩個廠商為其生產(chǎn)的一種相同的產(chǎn)品，分別選擇高價或者低價進(jìn)行相互競爭。3 策略 1 2 HLLHHL1，10，22，01/2，1/2，正式地說，給定某個博弈。

12、我們用Si來表示參與人i的策略空間。也稱為策略集合。即Si包含了參與人i的每一個可能的策略集合。對前一個博弈，參與人1的策略空間S1=H,L。而參與人2的策略空間是S2=HH,HL,LH,LL。我們用小寫字母表示單個策略(即這個集合中的一個元素)，則si Si是博弈中參與人i的一個策略。例如，s1=L，s2=LH。3 策略一個策略組合是關(guān)于策略的向量，每一項(xiàng)表示一個參與人。在研究一個有n個參與人的博弈。一個典型的策略組合就是這樣一個向量，s=(s1,s2,sn)。其中si是參與人i的策略，i=1,2,n。S表示策略組合的集合。在數(shù)學(xué)上表示為S=S1XS2XXSn。X表示笛卡爾乘積。如果S1=

13、A,B,S2=X,Y，那么，S=S1XS2=A,X),(A,Y),(B,X),(B,Y)。3 策略舉個例子，我們看下圖的博弈。S1=OA,OB,IA,IB，S2=O,I請注意，在這個博弈中，參與人1的策略。不僅要定義它在開始時怎么做，還要定義在第二個信息集中，它將采取什么行動。你可能會問，如果參與人1在博弈開始時選擇退出，為什么它還要在第二個信息集中，決定該怎么做？3 策略 211IIOOAB2，21，33，44，2原因一是，出于理性的研究，我們需要的是對于博弈中，任意一點(diǎn)的最優(yōu)行動的明確評估。這種評估與參與人對彼此的信念有關(guān)。原因而在于，萬一參與人犯了錯誤，它們可能會需要一個意外狀況下的計

14、劃。3 策略 211IIOOAB2，21，33，44，2另外一個例子，在這個博弈樹中，S1=U,DS2=AC,AE,BC,BES3=RP,RQ,TP,TQ3 策略 1 3 9,2,52,4,40,5,43,0,0UDABRTPQ22,2,21,2,26,3,2CEPQ3 24 標(biāo)準(zhǔn)型標(biāo)準(zhǔn)型是另一種表示博弈的正式方法。在某些情況下，標(biāo)準(zhǔn)型更加簡潔，可以優(yōu)先使用。對于一個用擴(kuò)展型表示的博弈，每一個策略組合能夠告訴我們，該博弈在博弈樹中所遵循的路徑。同時告訴我們，在博弈結(jié)束時，終止點(diǎn)是哪個。與每個終止點(diǎn)相對應(yīng)的是，各個參與人的收益向量。因此需要注意的是，每一個策略組合，給出了一個收益向量。 4 標(biāo)

15、準(zhǔn)型對于每一個參與人i，我們可以定義一個函數(shù)ui=S R (該函數(shù)的定義域是策略組合的集合，值域是實(shí)數(shù)）。對于各個參與人所選擇的每一個策略組合，sS，ui(s)是參與人i 在博弈中的收益。這個函數(shù)ui稱為參與人i的收益函數(shù)。4 標(biāo)準(zhǔn)型舉個例子，我們看下圖的博弈。S1=OA,OB,IA,IB，S2=O,I該博弈的策略組合是S=(OA,O),(OA,I),OB,O), (OB,I),(IA,O), (IA,I)(IB,O),(IB,I)參與人i的收益是定義在S之上的。因此，當(dāng)博弈采取策略組合s時，ui(s)給出了參與人i在博弈中的收益。例如，u1=(OA,O)=2,u1(IA,I)=4,u2

16、(IA,O)=34 標(biāo)準(zhǔn)型 211IIOOAB2，21，33，44，2對于各參與人具有的策略數(shù)量有限的兩方博弈，表示各參與人的策略空間的一種簡便方法，是畫出它們的收益矩陣。矩陣的每一行對應(yīng)參與人1的一個策略。而每一列對應(yīng)參與人2的一個策略。4 標(biāo)準(zhǔn)型12IOOA2，22，2OB2，22，2IA4，21，3IB3，41，3囚徒的困境。警察逮捕了兩個嫌疑犯，警察擁有的證據(jù)只能證明他們犯了較輕的罪。警察分別把他們關(guān)在不同的房間。每個囚犯都被要求高發(fā)另一個囚犯。告發(fā)對應(yīng)于策略D（背叛），不告發(fā)對應(yīng)于策略C（指合作）。囚犯被告知，如果他們選擇告發(fā)，將被免罪。他們的證據(jù)將被用于給對方定罪。如果他們都選擇告

17、發(fā)，他們都將入獄。但是他們的刑期由于合作將會較短。 4 標(biāo)準(zhǔn)型局中人：兩個嫌疑犯。行動：每個嫌疑犯的行動集是沉默，告密偏好：嫌疑犯1的行動組合序列是（最好到最差）：（告密，沉默），（沉默，沉默），（告密，告密），（沉默，告密）；嫌疑犯2的是：（沉默，告密），（沉默，沉默），（告密，告密），（告密，沉默）4 標(biāo)準(zhǔn)型嫌疑犯12沉默告密沉默2,20,3告密3,01,1我們研究囚徒的困境的重要性，不在于想了解囚徒的動機(jī)，而在于許多其他的情形，都具有類似的結(jié)構(gòu)。每當(dāng)兩個局中人的任何一個，有兩種選擇。那么囚徒的困境模擬了局中人的情形。例如：合作項(xiàng)目。4 標(biāo)準(zhǔn)型12努力工作游手好閑努力工作 2,2

18、0,3游手好閑 3,01,1雙寡頭壟斷。4 標(biāo)準(zhǔn)型12高價低價高價 1000，1000-200，1200低價 1200，-200600，600公地悲劇。4 標(biāo)準(zhǔn)型12少吃多吃少吃 2，20，3多吃 3，01，1在囚徒困境中，主要問題是局中人是否合作。在以下的博弈中，局中人同意合作好于不合作，但是他們在最好的結(jié)局上存在分歧。局中人：兩個朋友。行動：每個嫌疑犯的行動集是沉默，告密偏好：嫌疑犯1的行動組合序列是（最好到最差）：（告密，沉默），（沉默，沉默），（告密，告密），（沉默，告密）；嫌疑犯2的是：（沉默，告密），（沉默，沉默），（告密，告密），（告密，沉默）4 標(biāo)準(zhǔn)型嫌疑犯12沉默告

19、密沉默2,20,3告密3,01,1在囚徒困境中，主要問題是局中人是否合作。在以下的博弈中，局中人同意合作好于不合作，但是他們在最好的結(jié)局上存在分歧。性別戰(zhàn)。局中人：兩個朋友。行動：兩個朋友必須決定去看電影還是聽歌劇。偏好：他們都愿意待在一起。但是參與人1更喜歡歌劇，參與人2更喜歡電影。4 標(biāo)準(zhǔn)型12歌劇電影歌劇 2，10，0電影 0，01，2斗雞博弈。局中人：鷹和鴿。行動：保持原方向和轉(zhuǎn)向。偏好：如果他們都保持原方向，就會撞車。如果都轉(zhuǎn)向，就都保住了面子。如果只有對方轉(zhuǎn)向，就會被稱為硬漢。4 標(biāo)準(zhǔn)型12保持轉(zhuǎn)向保持 0，0 3，1轉(zhuǎn)向 1，32，2智豬博弈。局中人：大豬和小豬。行動：按

20、下按鈕和不按。偏好：如果他們都保持原方向，就會撞車。如果都轉(zhuǎn)向，就都保住了面子。如果只有對方轉(zhuǎn)向，就會被稱為硬漢。4 標(biāo)準(zhǔn)型12按下不按按下 4，2 2，3不按 6，-10，05 信念、混合策略和期望效用以后，我們將提出某些進(jìn)行博弈的理性行為的概念。這些概念的基礎(chǔ)想法，是通過某些過程，互相形成對方行為的信念。因?yàn)槲覀兊哪康氖?，建立決策的數(shù)學(xué)模型，我們需要精確地表示一個參與人的信念。我們使用概率。例如，參與人1的信念，是參與人2的策略的概率分布。參與人1的信念是，參與人2以概率p選擇C；以概率1-p選擇D。 5 信念、混合策略和期望效用讓我們正式定義標(biāo)準(zhǔn)型概率的信念。在數(shù)學(xué)上，參與人i的

21、一個信念，是其他參與人的策略的一個概率分布。我們用-i來表示這個概率分布。且有-iS-i 。其中，S-i是指除了參與人i之外的所有其他參與人，所采取的策略的概率分布的集合。例如，在兩方博弈中(因此有-i=j)，假設(shè)每一個參與人都有有限數(shù)量的策略。參與人i對參與人j所采取的行為的信念是一個函數(shù)-iS-i ，其中，對于參與人j的每個策略sjSj，(sj)可以解釋為，參與人i認(rèn)為參與人j可能采取策略sj的概率。5 信念、混合策略和期望效用作為一個概率分布，-i具有這樣的性質(zhì)，對于每個sjSj，(sj) 0 ，且sjSj(sj) =1。一個參與人的混合策略是指，他根據(jù)一個概率分布來選擇策略行為。正式

22、地說，混合策略和信念是相似的概念，它們都是概率分布。我們一般表示參與人i的混合策略為iS-i 。5 信念、混合策略和期望效用我們可以把效用函數(shù)的定義，通過一個期望值的概念，擴(kuò)展到混合策略和信念中。當(dāng)參與人i對其他人的策略具有信念-i ，并計劃選擇si時，他的期望收益，等于他采取策略si ，而其他人根據(jù)-i采取行動時的“平均”收益。用數(shù)學(xué)表示為5 信念、混合策略和期望效用以下圖的博弈為例。假設(shè)參與人1相信，有1/2的可能性參與人2采取策略L，有1/4的可能性采取策略M，有1/4的可能性采取策略R。即他的信念2滿足2(L)=1/2，2(M)=1/4, 2(R)=1/4。這個信念的常用的簡寫方式是(

23、1/2,1/4,1/4)。如果參與人1選擇U，那么他的期望收益是u1(U,2)=(1/2)8+(1/4)0+(1/4)4)=5 5 信念、混合策略和期望效用12LMPL8，10，24，0M3，31，20，0P5，02，38，1局中人：兩個嫌疑犯。行動：每個嫌疑犯的行動集是沉默，告密偏好：嫌疑犯1的行動組合序列是（最好到最差）：（告密，沉默），（沉默，沉默），（告密，告密），（沉默，告密）；嫌疑犯2的是：（沉默，告密），（沉默，沉默），（告密，告密），（告密，沉默）5 信念、混合策略和期望效用嫌疑犯12沉默告密沉默2,20,3告密3,01,1第二部分靜態(tài)行為分析博弈論的要點(diǎn)在于，通過正式模

24、型的使用，幫助我們理解在各種經(jīng)濟(jì)和社會環(huán)境中的策略要素。這些環(huán)境包括市場結(jié)構(gòu)、協(xié)議、公司之間的競爭、公司的內(nèi)部組織、討價還價、政治和普遍的關(guān)系。所有這些環(huán)境的全面研究過于復(fù)雜。因此，給定特定的環(huán)境，我們將試圖將某些明確的特征，加入必要簡化的模型，描述為一個博弈。模型可以提供一個有用的框架，用它可以探索參與人的行為。第二部分靜態(tài)行為分析在我們的博弈論研究中，我們的目標(biāo)有，解釋和理解人們實(shí)際的行為，預(yù)測人們在特定的情況下如何行動，描述人們在特定的情況下應(yīng)該如何行動。第二部分介紹研究理性行為的基本工具。這些工具將策略和收益作為基礎(chǔ)。即使用博弈的標(biāo)準(zhǔn)型設(shè)定。這里的分析可以很容易地應(yīng)用于擴(kuò)展型的設(shè)定

25、。此后，我們的分析建立在參與人都理解它們進(jìn)行的博弈的假設(shè)的基礎(chǔ)上。它們都了解該標(biāo)準(zhǔn)型。第二部分靜態(tài)行為分析本章討論策略互動理論中最基本的兩個概念：占優(yōu)和最優(yōu)反應(yīng)。這兩個概念是大部分關(guān)于理性行為的概念的基礎(chǔ)。占優(yōu)。觀察下表的博弈。假設(shè)你是參與人1。策略U有一個有趣的特性，不管參與人2選擇哪個，策略U都比策略D的收益絕對地高。用專業(yè)術(shù)語說，我們稱策略D劣于策略U。所以策略D永遠(yuǎn)不會被理性的參與人1采納。注意，對于參與人2來說，兩個策略中，沒有一個是劣策略。6 占優(yōu)與最優(yōu)反應(yīng)12L R U 2，35，0D 1，04，3 在以下這個博弈中，參與人1的策略D是策略M的劣策略。即不管參與人2采取哪種策

26、略，M給參與人1帶來的收益都比D高。但是，策略U不是M的劣策略。6 占優(yōu)與最優(yōu)反應(yīng) 12LC R U 8，30，44，4M4，21，55，3D 3，70，12，0下面的博弈有更加復(fù)雜的占優(yōu)關(guān)系。對于參與人1而言，沒有一個純策略是另一個純策略的劣策略。但是，混合策略要優(yōu)于D。考慮參與人1各以1/2的概率選擇U和M，而以概率0選擇D的策略。我們將這個策略表示為(1/2,1/2,0)。如果參與人2選擇L，該混合策略給參與人1的收益為：2=4(1/2)+0(1/2)+1(0) 參與人1采取D的收益更低。參與人2采取R時，結(jié)果也是一樣的。因此，策略D要劣于混合策略(1/2,1/2,0) 。6 占優(yōu)與最優(yōu)

27、反應(yīng) 12L R U 4，10，2M 0，04，0D 1，31，2 占優(yōu)的概念的正式定義如下：對于參與人i的純策略si，有策略(不管是純策略還是混合策略) iSi，如果對于其他參與人的所有策略組合s-iS-i均能滿足ui(i,s-i) ui(si,s-i)，我們就稱si劣于i。檢驗(yàn)一個策略是否是劣策略，最好的方法是首先確定它是否劣于另一個純策略。例如，為了檢驗(yàn)參與人1的某個策略是否占優(yōu)于另一個策略，只需要逐列地比較收益矩陣中，代表這兩個策略的兩行。如果一個策略并不劣于其他純策略，那么你必須比較它是否劣于某個混合策略。6 占優(yōu)與最優(yōu)反應(yīng) 當(dāng)涉及混合策略時，占優(yōu)關(guān)系的檢驗(yàn)就比較棘手。但是有幾條訣

28、竅：首先要注意的是，有很多不同的混合策略可以嘗試。其次，在尋找混合策略時，先觀察收益矩陣中，數(shù)字的變化規(guī)律。第三，只需要找到某一個策略(不管是純策略還是混合策略)即可。最后，要確定你所檢驗(yàn)的收益數(shù)字是正確的。6 占優(yōu)與最優(yōu)反應(yīng) 第一類策略矛盾和囚徒的困境。在以下的囚徒的困境的博弈中，對兩個參與人來說，策略C都劣于策略D。因此我們預(yù)測，他們都不會選擇策略C，但是，如果人們都選擇策略C，他們都會得到更好的結(jié)果。6 占優(yōu)與最優(yōu)反應(yīng)嫌疑犯12C D C 2,20,3D 3,01,1囚徒的困境反映了策略環(huán)境的一個主要矛盾：個人利益與集體利益之間的沖突。雙方都認(rèn)識到他們都選擇C時，共同得到更好的結(jié)果。但是

29、，每個人都有個人的動機(jī)選擇背叛。因?yàn)楦鱾€參與人是同時并且獨(dú)立地選擇他們的策略，因此個人的動機(jī)占了上風(fēng)。你甚至可以想象花了很多時間討論采取(C,C)策略組合的優(yōu)點(diǎn)，他們甚至達(dá)成了口頭協(xié)議。但是當(dāng)他們分開并采取行動時，沒有一方有激勵根據(jù)協(xié)議采取行動。強(qiáng)烈的個人動機(jī)將導(dǎo)致集體的損失。6 占優(yōu)與最優(yōu)反應(yīng)嫌疑犯12C D C 2,20,3D 3,01,1關(guān)于利益沖突，我們簡單地考慮兩個相關(guān)的問題。首先，要記住收益數(shù)字的含義。作為效用，這些數(shù)字只是表示個人的偏好。它們不一定表示利潤或貨幣的數(shù)量。其次，在真實(shí)的世界中，各個參與人有時選擇相互之間，達(dá)成有法律約束力的合同。例如，參與人或許可以選擇簽訂一份合同，

30、約束他們都選擇策略C。如果這樣的選擇是該策略環(huán)境的關(guān)鍵部分，我們應(yīng)該將其納入模型。囚徒困境是一個被廣泛討論的博弈，并且為經(jīng)濟(jì)學(xué)、社會學(xué)、政治學(xué)、國際關(guān)系及哲學(xué)等研究領(lǐng)域，提供了加深認(rèn)識的源泉。 6 占優(yōu)與最優(yōu)反應(yīng) 效率的概念。第一種策略矛盾與經(jīng)濟(jì)效率有關(guān)，這是一個重要的福利標(biāo)準(zhǔn)，可以用于對博弈中的行為進(jìn)行評判。假設(shè)我們想比較兩個策略組合的結(jié)果，它們分別為s和s。如果所有的參與人，相當(dāng)于s都更加偏好于采取s，而且至少對一個參與人是嚴(yán)格偏好，我們稱s比s更有效率。用數(shù)學(xué)表示，如果ui(s) ui(s)，對每個參與人都成立，并且不等式至少對一個參與人是嚴(yán)格成立的，那么s就比s更有效率。6 占優(yōu)與最

31、優(yōu)反應(yīng) 如果不存在其他更有效率的策略組合，我們就稱這個策略組合s是有效的。即對于每一個參與人i來說，不存在其他策略組合s，對于每個參與人i都滿足ui(s) ui(s) ，同時對某個參與人來說uj(s) uj(s) 。帕累托有效表示的是同一個意思。在囚徒的困境中，(C,C)比(D,D)更有效率。而且，(C,C), (C,D),(D,C)都是有效的策略組合。 6 占優(yōu)與最優(yōu)反應(yīng)嫌疑犯12C D C 2,20,3D 3,01,1最優(yōu)反應(yīng)。理性人會避免采取劣策略的假設(shè)似乎是合理的。占優(yōu)是一個具有很好描述性和說明性的概念。但是，這僅僅是我們展開行為理論的開端。實(shí)際上，在大多數(shù)博弈中，參與人具有超過一個非

32、劣策略。這時，人們無法根據(jù)占優(yōu)的標(biāo)準(zhǔn)，預(yù)測參與人會采取怎樣的行動。6 占優(yōu)與最優(yōu)反應(yīng) 理性人會思考其他參與人可能采取的行動。即人們會形成對彼此行為的一種信念。在決定自己的策略之前，先對其他參與人的行為形成觀點(diǎn)是明智的。為了使期望獲得的收益最大化，我們假定這是理性行為的標(biāo)志，你應(yīng)該選擇與你的信念相對應(yīng)，從而能夠產(chǎn)生最大期望的策略。這樣一個策略就稱為最優(yōu)反應(yīng)。正式地有：假設(shè)參與人i對其他參與人采取的策略具有信念-iS-i，如果對于任何siSi，參與人i的策略siSi都滿足 ui(si, -i)ui(si, -i )，那么，si是一個最優(yōu)反應(yīng)。6 占優(yōu)與最優(yōu)反應(yīng) 在某個信念下，可能有超過一個最優(yōu)反應(yīng)

33、。不難證明，在一個有限博弈中，每個信念至少對應(yīng)一個最優(yōu)反應(yīng)。對于參與人i的每個信念-i，我們將最優(yōu)反應(yīng)的集合表示為BRi(-i)。例如，假設(shè)參與人1對參與人2的策略的信念為(1/3,1/2,1/6)。即相信參與人2有1/3的可能選擇L。如果參與人1選擇策略U，他所能期望的收益為(1/3)2+(1/2)0+(1/6)4=8/6。其他類推。如果選M，期望收益為7/6，如果選L，則為13/6。因此，他的最優(yōu)反應(yīng)為策略D。我們得到BR1(1/3,1/2,1/6)=D6 占優(yōu)與最優(yōu)反應(yīng) 12LC R U 2，60，44，4M3，30，01，5 D 1，13，5 2，3假設(shè)參與人2對參與人1采取的策略，具

34、有信念(1/2,1/4,1/4)。如果參與人2選擇策略L，他所能期望的收益為(1/2)6+(1/4)3+(1/4)1=4。如果選擇C，期望收益為13/4，如果選擇L，則為4。因此，他有兩個最優(yōu)反應(yīng)，為策略L和R。我們得到BR2(1/2,1/4,1/4)=L，R6 占優(yōu)與最優(yōu)反應(yīng) 12LC R U 2，60，44，4M3，30，01，5 D 1，13，5 2，3有一點(diǎn)需要理解的是，根據(jù)對其他參與人行動的信念，相應(yīng)地采取最優(yōu)反應(yīng)策略本身，并不是一個策略行為。你可以把它看作是與理性有關(guān)的一種純粹的計算練習(xí)。形成信念才是策略中的一個更加重要的部分。有一點(diǎn)你必須很確定，采取行動最關(guān)鍵的部分是信念中包含的

35、信息。事實(shí)上，博弈的真正藝術(shù)就在這里。6 占優(yōu)與最優(yōu)反應(yīng) 7 可理性化和重復(fù)占優(yōu) 占優(yōu)和最優(yōu)反應(yīng)的概念是理性行為理論的基礎(chǔ)。但是我們必須認(rèn)識到，理性行為包含的不僅僅是避免采取劣策略。實(shí)際上，明智的博弈參與人對博弈的基本概念很清晰，即一方的行動將影響另一方的收益，需要同時站在對方的立場考慮，從而對對方的行為做出聰明的估計。7 可理性化和重復(fù)占優(yōu)在以下的博弈中，假設(shè)你是參與人1，你的兩個策略中沒有劣策略。因此你可以根據(jù)你對對方行動的信念，理性地選擇策略A或B。用p表示你認(rèn)為對方會采取X，用q表示采取Y，用1-p-q表示采取Z的概率。基于你的信念，你采取策略A獲得的期望收益為3p+0q+0(1-p-

36、q)=3p。你采取B的期望收益為0p+3q+1(1-p-q)= 1-p+2q。因此，當(dāng)3p1-p+2q時，你的最優(yōu)反應(yīng)是采取A。7 可理性化和重復(fù)占優(yōu)12XYZA3，30，50，4B0，03，11，2當(dāng)4p0，0，Q=Q1+Q2。我們使用逆需求函數(shù)為P=a-bQ。作為實(shí)例，我們偶爾會考慮a=10，b=1的特殊情況。即逆需求函數(shù)為P=10-Q。該需求曲線的圖像為：10 寡頭、關(guān)稅、犯罪與懲罰 PQ1010 0現(xiàn)在假設(shè)每家公司的成本函數(shù)相同，并且單位成本不隨產(chǎn)量而變化。即每家公司具有常數(shù)的邊際成本函數(shù)：生產(chǎn)數(shù)量Qi的成本為cQi。其中c0，i=1,2。每家公司將生產(chǎn)多少？為了做出決策，每家公司必須

37、采取兩個步驟：1. 對另一家公司的產(chǎn)量進(jìn)行預(yù)測。2. 決定生產(chǎn)的數(shù)量。10 寡頭、關(guān)稅、犯罪與懲罰本節(jié)我們將通過模型說明，(a)如何把一個問題的非正式化描述，轉(zhuǎn)化為一個博弈的標(biāo)準(zhǔn)式表述。(b)如何通過計算解出博弈的納什均衡。令q1、q2分別表示企業(yè)1、2的同質(zhì)產(chǎn)品的產(chǎn)量。令P=a-bQ 為市場出清時的價格。設(shè)企業(yè)i生產(chǎn)Qi的總成本ci(Qi)=cQi，企業(yè)不存在固定成本，且生產(chǎn)每單位產(chǎn)品的邊際成本為常數(shù)c。根據(jù)古諾的假定，兩個企業(yè)同時進(jìn)行產(chǎn)量決策。 10 寡頭、關(guān)稅、犯罪與懲罰為了求出古諾博弈的納什均衡，我們首先要將其化為標(biāo)準(zhǔn)式的博弈。博弈的標(biāo)準(zhǔn)式表述包含下列要素: (1)博弈的參與人；

38、(2)每個參與人可以選擇的戰(zhàn)略；(3)針對某一個可能出現(xiàn)的參與人的戰(zhàn)略組合，每一參與人的收益。雙寡頭模型只有兩個參與人。每一個企業(yè)可以選擇的戰(zhàn)略，是其產(chǎn)品的產(chǎn)量。我們假定產(chǎn)品是連續(xù)可分的。每一個企業(yè)的戰(zhàn)略空間可以表示為Si=0, )。其中一個戰(zhàn)略si就是企業(yè)選擇的產(chǎn)量Qi0。要全面表示一個博弈，并且求其均衡解，還需要把企業(yè)i的收益表示為兩一個企業(yè)選擇的策略的函數(shù)。我們假定企業(yè)的收益就是其利潤額。在兩個參與人的標(biāo)準(zhǔn)式博弈中，參與人i的收益ui(si,sj)就可以寫為：i(Qi,Qj)=Qip(Qi+Qj)-c=Qia-b(Qi+Qj)-c10 寡頭、關(guān)稅、犯罪與懲罰在一個標(biāo)準(zhǔn)式的兩方博弈中，一

39、對戰(zhàn)略(s1*,s2*)如果是納什均衡，則對于每個參與人i，si*應(yīng)該滿足：ui(si*,sj*) ui(si,sj*) 上式對Si中每一個可選戰(zhàn)略si都成立。這一條件等價于，對每個參與人i，si*必須是以下最優(yōu)化問題的解：在古諾雙寡頭模型模型中，上面的條件可以具體表述為，一對產(chǎn)出組合(Qi*,Q2*)如果是納什均衡，對每一個企業(yè)i，Qi*應(yīng)該為下列最優(yōu)化問題的解：10 寡頭、關(guān)稅、犯罪與懲罰利潤是二次函數(shù)，存在一個最大產(chǎn)量，表示為Q1*，我們可以通過對該問題的一階條件計算得到：a-c-bQ2*=2bQ1* 或者Q1*=(a-c-bQ2*)/2b。讓我們記這個最優(yōu)反應(yīng)函數(shù)為R1。對稱的推理

40、R2的最優(yōu)反應(yīng)函數(shù)也有：10 寡頭、關(guān)稅、犯罪與懲罰我們把這兩個最優(yōu)反應(yīng)函數(shù)的圖像進(jìn)行合并。10 寡頭、關(guān)稅、犯罪與懲罰 Q2 Q1 (a-c)/b(a-c)/2b(a-c)/b(a-c)/2b注意唯一的一對生產(chǎn)數(shù)量Q1*和Q2*，反應(yīng)函數(shù)在該點(diǎn)相交。因此這是一對滿足下列條件的產(chǎn)量：R2(Q1*)=Q2* R1(Q2*)=Q1* 換言之，這一對產(chǎn)量就是該博弈的古諾-納什均衡。經(jīng)過計算得出如下均衡的產(chǎn)量、價格和利潤：每家公司的生產(chǎn)數(shù)量價格每家公司的利潤 (a-c)/3b (a/3)+(2c/3) (a-c)2/9b 10 寡頭、關(guān)稅、犯罪與懲罰卡特爾解。作為對比，如果兩家公司如卡特爾一樣

41、運(yùn)作，即如果它們對各自的生產(chǎn)決策進(jìn)行協(xié)調(diào)我們來計算它們將生產(chǎn)的產(chǎn)量。如果兩個公司共謀，可以合理地假設(shè)，它們以最大化它們的聯(lián)合利潤，設(shè)置它們的生產(chǎn)目標(biāo)。它們預(yù)先指定生產(chǎn)“配額”為Q1和Q2，它們的選擇是使得總利潤最大化：換言之，這一對產(chǎn)量就是該博弈的古諾-納什均衡。經(jīng)過計算得出如下均衡的產(chǎn)量、價格和利潤：10 寡頭、關(guān)稅、犯罪與懲罰卡特爾解問題與最優(yōu)反應(yīng)問題之間的區(qū)別在于，在此兩家公司明確主張它們的利潤是由它們的總產(chǎn)量確定的。使利潤最大化的總產(chǎn)量也由一階條件確定：a-c-2bQ2=2bQ1 a-c-2bQ1=2bQ2 這兩個公式可以用來解卡特爾的產(chǎn)量、價格和利潤：每家公司的生產(chǎn)數(shù)量價格每家

42、公司的利潤 (a-c)/4b (a+c)/2 (a-c)2/8b 古諾納什均衡： (a-c)/3b (a/3)+(2c/3) (a-c)2/9b10 寡頭、關(guān)稅、犯罪與懲罰卡特爾的產(chǎn)量、價格和利潤：每家公司的生產(chǎn)數(shù)量價格每家公司的利潤 (a-c)/4b (a+c)/2 (a-c)2/8b 古諾-納什均衡： (a-c)/3b (a/3)+(2c/3) (a-c)2/9b注意，如果兩家公司像卡特爾一樣經(jīng)營，它們的產(chǎn)量將會少一些?？ㄌ貭柈a(chǎn)量是古諾-納什均衡產(chǎn)量的75%。而在卡特爾的每家公司的利潤較高。10 寡頭、關(guān)稅、犯罪與懲罰人們自然會提出一個問題，為什么兩家公司不去通過削減產(chǎn)量增加利潤呢

43、？如同囚徒困境一樣，答案是對群體好的事情，對個體未必也好。如果公司試圖像卡特爾那樣生產(chǎn)，每家公司都將存在激勵或者動機(jī)，欺騙對方，并在另一家公司蒙受損失的情況下，增加自己的利潤。實(shí)際上，如果公司2生產(chǎn)卡特爾的產(chǎn)量(a-c)/4b，由公司1的反應(yīng)函數(shù)計算得出，公司1的最大化產(chǎn)量是3(a-c)/8b。當(dāng)Q1增加而Q2并不增加時，公司2毋庸置疑會變得更糟。因?yàn)椋袌鰞r格下跌了，而公司2銷售了完全相同的數(shù)量。10 寡頭、關(guān)稅、犯罪與懲罰假如我們有規(guī)模為y的公共資源。兩個參與人各可以瓜分一個非負(fù)量(c1和c2)用于消費(fèi)。假設(shè)c1+c2y。當(dāng)總的消費(fèi)量小于y時，剩余量y-(c1+c2)是未來消費(fèi)的基礎(chǔ)。在

44、第二周期，他們平分余下的總量，每人得到y(tǒng)-(c1+c2)/2。參與人1的最優(yōu)反應(yīng)問題是：Maxc1 logc1+logy-(c1+c2)/2由一階條件，參與人1的最優(yōu)反應(yīng)數(shù)量為：1/c1=1/y-(c1+c2)R1(c2)=(y-c2*)/2代入反應(yīng)函數(shù)，我們可以計算得到納什均衡為：c1*=c2*=y/3應(yīng)用：公共問題社會最優(yōu)性。兩個參與人的效用之和最大化，即如果它們是下述問題的解：Maxc1,c2 logc1+logc2+2logy-(c1+c2)/2這種方法可以求得社會最優(yōu)解為：c1*=c2*=y/4注意，在這種情況下，正好一半資源用于第一個周期。與納什均衡相比，那里用于第一個周期的資源

45、，有2/3之多。在這個意義上，在納什均衡中，我們對資源存在過度的榨取，即我們經(jīng)受了公地悲劇。應(yīng)用：公共問題 11 混合策略納什均衡有些博弈并不存在納什均衡。看看以下的賭便士游戲。在這個博弈中，沒有穩(wěn)定的策略組合。因?yàn)槊總€組合都有一個“贏家”和一個“輸家”。在賭便士游戲中，各個參與人隨機(jī)采取策略是可行的。以1/2的概率選擇每種純策略看來似乎不錯。事實(shí)上，這樣的策略組合從混合策略的角度看是一個納什均衡。在對手以相同的概率選擇H和T的情況下，該參與人選擇策略H和T的收益是一樣的。因此，他的所有策略都是最優(yōu)反應(yīng)。包括在H和T之間以相同的概率進(jìn)行選擇的混合策略。11 混合策略納什均衡12H T H

46、1，-1-1，1 T -1，1 1，-1一般情況下，納什均衡的概念可以擴(kuò)展到混合策略。一個混合策略納什均衡，是具有這樣特性的一個混合策略組合，在給定其他參與人的策略的情況下，沒有參與人可以通過改變策略來增加自己的收益。考慮策略組合=(1,2,n)，其中對于每一個參與人i， iSi。當(dāng)且僅當(dāng)ui(i,-i)ui(si,-i)對于任何siSi和每一個參與人i都成立時，組合是一個混合策略納什均衡。也就是說，對于每一個參與人i來說，i是-i的最優(yōu)反應(yīng)。11 混合策略納什均衡考慮兩個公司之間的游說博弈。游說的成本是15。如果兩個公司進(jìn)行游說，或者沒有公司進(jìn)行游說，每個公司都獲得10。如果只有公司Y進(jìn)行

47、游說，收益為30。如果只有X進(jìn)行游說，收益為40?？梢宰C明這個博弈有兩個純策略納什均衡,(N,L)和(L,N)。除了這些純策略均衡，還存在一個混合策略均衡。11 混合策略納什均衡XYL N L -5，-525，0 N 0，15 10，10除了這些純策略均衡，還存在一個混合策略均衡。假設(shè)公司X混合采取L和N，通過采取L的期望收益，必須等于N取得的期望收益，否則公司X會嚴(yán)格偏好于選擇L和N。但是，公司X的策略L和N如何能夠得到同樣的期望收益？一定是Y的行動導(dǎo)致這樣的期望。因?yàn)槿绻鸜采取純策略，那么X一定會嚴(yán)格偏好一種策略。用q表示公司Y采取L的概率，即(q,1-q)是公司Y的混合策略。在這個策略

48、下，公司X選擇L可以期望獲得q(-5)+(1-q)(25)，而選擇N時等于q(0)+(1-q)(10)。如果公司X愿意采取混合策略，則一定有25-30q=10-10q。簡化可得q=3/4。11 混合策略納什均衡XYL N L -5，-525，0 N 0，15 10，10我們繼續(xù)分析Y的動機(jī)。用p表示公司X取L的概率。如果Y選擇L可以期望獲得p(-5)+(1-p)(15)，而選擇N時等于10-10p。如果15-20p=10-10p，公司Y在兩個策略之間選擇，就沒有差別。簡化可得p=1/2。混合策略組合(1/2,1/2),(3/4,1/3)是混合策略納什均衡。給定公司Y的混合策略的情況下，公司X的

49、混合策略是最優(yōu)反應(yīng)。實(shí)際上，對于公司X來說，每一個策略都是最優(yōu)反應(yīng)。11 混合策略納什均衡XYL N L -5，-525，0 N 0，15 10，10我們在構(gòu)建一個混合策略納什均衡時，出現(xiàn)了一個有趣的新變化。我們尋找一個參與人的混合策略，使得另一個參與人對自己的各個純策略之間的選擇，沒有偏好差別。這是計算混合策略均衡的最好的方法。注意，每一個純策略的均衡，也可以看作是混合策略的均衡。因此目前分析的所有博弈，至少會有一個均衡。事實(shí)上，這是一個一般性的結(jié)論。這個結(jié)論相當(dāng)有用，它保證了納什均衡概念，為每一個有限博弈提供預(yù)測。11 混合策略納什均衡 13 靜態(tài)環(huán)境下的合同、法律和執(zhí)行正如納什均衡概念

50、中提到的，有許多機(jī)制有助于聯(lián)結(jié)行為和信念，以獲得一致性的結(jié)果。特別地，締約機(jī)制在我們的社會中主導(dǎo)著非常廣泛的關(guān)系。締約不僅僅用于防止策略不確定。締約也有助于解決其他兩種決策情形的矛盾。在本章，我們將解釋如何用博弈論定義和研究合同。對于兩個或者兩個以上的經(jīng)濟(jì)人之間互動，如果各方帶有某種刻意的合作，為他們之間的關(guān)系設(shè)定條款，我們就稱之為合同關(guān)系。他們協(xié)定的某些方面，可能包括第三方的作用。例如判決或仲裁等。我們可以認(rèn)為，外部參與人是根據(jù)對他來說，可證實(shí)的關(guān)于合同的信息采取行動的。13 靜態(tài)環(huán)境下的合同、法律和執(zhí)行在博弈論中，有三種合同執(zhí)行的方法需要區(qū)分。首先，如果各參與人有個人動機(jī)遵守合同條款，我們

51、就說這個合同是自我實(shí)施的。如果各參與人通過外部參與人的行動，會服從合同。我們稱該合同是外部實(shí)施的。最后，通過合同的執(zhí)行與協(xié)定本身是同步發(fā)生的，我們就稱該合同是自動實(shí)施的。為了說明前兩種方法，并且引出締約制度的更深層次的問題，我們來思考一個特定的例子。假設(shè)杰西卡和馬克想重新裝修他們的家。馬克(1)是一個建筑師。裝修承包商是丹尼(2)。13 靜態(tài)環(huán)境下的合同、法律和執(zhí)行對于馬克來說，已一個建筑師的職責(zé)投入努力，是需要成本的。但這會使丹尼的工作容易。丹尼的投入是指花費(fèi)在提高裝修質(zhì)量的努力。下圖為基本博弈。讓我們集中考慮z1+z2x1+y2，z1+z2x2+y1，且z1+z20的情況。這意味著各參與人

52、的收益總合，在采取(I,I)時達(dá)到最大化。事實(shí)上，如果各參與人之間允許進(jìn)行貨幣的轉(zhuǎn)移支付，那么(I,I)組合是這個基本博弈的唯一的一個有效率的結(jié)果。我們的基本問題是，假設(shè)(I,I)是最好的結(jié)果，各參與人是否可以執(zhí)行一個規(guī)定采取(I,I)的合同？ 13 靜態(tài)環(huán)境下的合同、法律和執(zhí)行12I N I z1，z2 y1，x2 N x1，y2 0，0只要(I,I)是一個納什均衡，采取(I,I)的協(xié)定就是自我實(shí)施合同。而這只有當(dāng)z1x1和z2x2的情況下才成立。但是，如果其中有一個不成立，那么各個參與人就無法依靠合同的自我實(shí)施去維持(I,I)的結(jié)果。他們需要第三方的加入，這有助于改變博弈的性質(zhì)。法庭就是

53、作為這樣一種第三方存在的。如果一方選擇了N，法庭的涉入可以在他們之間，強(qiáng)制進(jìn)行貨幣收益的轉(zhuǎn)移支付。用m表示法庭所要求的轉(zhuǎn)移支付。假設(shè)轉(zhuǎn)移支付是從丹尼到馬克。如果mx1+y2 和 z1+z2x2+y1它們正好是當(dāng)(I,I)有效率時所滿足的條件。13 靜態(tài)環(huán)境下的合同、法律和執(zhí)行12I N I z1，z2 z1, x2+y1-z1N x1+y2 z2，z2 0，012I N I z1，z2 y1+, x2-N x1+,y2 - ，-結(jié)論：在下圖的基本博弈的預(yù)期利益賠償原則下，當(dāng)且僅當(dāng)(I,I)是有效率的時候，(I,I)是可執(zhí)行的。該結(jié)論意味著預(yù)期利益賠償，緩解了個人和集體動機(jī)之間的矛盾。事實(shí)上，

54、即使參與人在締約時并不知道xi,yi和zi的值，預(yù)期損失仍然會激勵有效率的結(jié)果。但是，要得到預(yù)期值需要大量信息。首先，法庭必須能夠確認(rèn)誰違約。其次，參與人決定是否投入之前，必須知道收益參數(shù)的值。第三，也是最關(guān)鍵的是，法庭必須能夠確定基本博弈中，違約與未違約結(jié)果中雙方的收益（即zi和yi) 13 靜態(tài)環(huán)境下的合同、法律和執(zhí)行12I N I z1，z2 y1，x2 N x1，y2 0，0第二種違約補(bǔ)償非常適用于zi無法觀察的情況。在信賴?yán)鎿p害賠償原則下，法庭實(shí)施的轉(zhuǎn)移，使得原告能夠獲得他在沒有簽署合同情況下的收益。也就是說，法庭將確定銀行在沒有合同的情況下可以取得的收益，然后法庭實(shí)施轉(zhuǎn)移，將使

55、得原告獲得的總收益，達(dá)到這個水平。例如，當(dāng)馬克為他的房屋畫出詳細(xì)的裝修設(shè)計圖時，如果對方?jīng)]有遵循合同，他應(yīng)該為他的投入得到補(bǔ)償。我們確定“沒有合同”的方法是，假設(shè)基本博弈分別以有合同存在和沒有合同存在的方式進(jìn)行。在這種情況下，沒有合同存在意味著，基本博弈會采取納什均衡策略組合的方式。假定yi0。(N,N)是基本博弈的納什均衡，這是我們對無合同結(jié)果的預(yù)測。 13 靜態(tài)環(huán)境下的合同、法律和執(zhí)行根據(jù)左下圖，信賴?yán)鎿p害賠償意味著=y2和=-y1。引發(fā)博弈如右下圖所示。注意，當(dāng)且僅當(dāng)z1x1+y2 和z2x2+y1時，(I，I)是引發(fā)博弈的納什均衡。13 靜態(tài)環(huán)境下的合同、法律和執(zhí)行12I N I

56、z1，z2 y1+, x2-N x1+,y2 - ，-12I N I z1，z2 0, x2+y1N x1+y2，0 0，0違約情況下普遍采用的第三種法律原則指的是回復(fù)原狀賠償，這種原則是通過取消被告因違約而牟取的，相對于無合同情況下所增加的不當(dāng)?shù)美妹?。違約價值x2代表了丹尼可以在合同中獲得的不當(dāng)?shù)美??；貜?fù)原狀賠償意味著=-x1，=x2。所得到的引發(fā)博弈形式如下圖所示。注意，當(dāng)且僅當(dāng)z10，z20時，(I,I)是引發(fā)博弈的納什均衡。13 靜態(tài)環(huán)境下的合同、法律和執(zhí)行12I N I z1，z2 x2+y1，0N 0，x1+y2 0，0當(dāng)zi無法進(jìn)行準(zhǔn)確估計時，法庭會采取信賴?yán)婊蛘呋貜?fù)原狀檢

57、驗(yàn)。信賴原則要求法庭知道原告與合同相關(guān)的花費(fèi)，以及原告的機(jī)會成本的價值。回復(fù)原狀原則需要有被告不當(dāng)?shù)美南嚓P(guān)知識。各種復(fù)雜的因素經(jīng)常使得收益參數(shù)的估計變得非常困難。13 靜態(tài)環(huán)境下的合同、法律和執(zhí)行14 擴(kuò)展型表示的細(xì)節(jié)說明 14 擴(kuò)展型表示的細(xì)節(jié)說明ab c 繼續(xù)分析擴(kuò)展型博弈之前，我們詳細(xì)說明它的技術(shù)細(xì)節(jié)。博弈樹是由分支所連接的結(jié)點(diǎn)組成。每一個分支都是一個箭頭，從一個節(jié)點(diǎn)指向另一個節(jié)點(diǎn)。因此，你可以從某個節(jié)點(diǎn)開始，通過后續(xù)的一系列箭頭，來追溯博弈樹中的路線?？梢酝ㄟ^這種方式達(dá)到的節(jié)點(diǎn)，稱為從開始節(jié)點(diǎn)的后續(xù)節(jié)點(diǎn)。從某節(jié)點(diǎn)出發(fā)的分支，指向的是它的直接后續(xù)節(jié)點(diǎn)。終止點(diǎn) 初始點(diǎn) 同樣，從某一個

58、節(jié)點(diǎn)出發(fā)，沿著博弈樹的箭頭反方向倒推，我們可以定義出這個節(jié)點(diǎn)的前置節(jié)點(diǎn)和直接前置節(jié)點(diǎn)。博弈樹規(guī)則。博弈樹規(guī)則1：每一個節(jié)點(diǎn)都是初始節(jié)點(diǎn)的后續(xù)節(jié)點(diǎn)，同時，初始節(jié)點(diǎn)是唯一具有一特性的節(jié)點(diǎn)。博弈樹規(guī)則2：除初始節(jié)點(diǎn)之外的任一節(jié)點(diǎn)，都只有一個直接前置節(jié)點(diǎn)。初始節(jié)點(diǎn)沒有前置節(jié)點(diǎn)。博弈樹規(guī)則3：同一個節(jié)點(diǎn)引出的多個分支，具有不同的行動標(biāo)簽。14 擴(kuò)展型表示的細(xì)節(jié)說明信息集表示參與人必須在此作出決定的位置。正式地說，一個信息集指的是一個參與人在決策時，無法進(jìn)行區(qū)分的節(jié)點(diǎn)集合。博弈樹規(guī)則4：每一個信息集只包含一個參與人的決策點(diǎn)。以下的博弈樹是錯誤的。博弈樹規(guī)則5：某個信息集中的所有節(jié)點(diǎn)，必須具有相同數(shù)量的直接

59、后續(xù)節(jié)點(diǎn)，而且其中的所有節(jié)點(diǎn)是通過具有相同集合行動標(biāo)簽的分支，而達(dá)到這些后續(xù)節(jié)點(diǎn)的。14 擴(kuò)展型表示的細(xì)節(jié)說明14 擴(kuò)展型表示的細(xì)節(jié)說明1 信息集表示參與人必須在此作出決定的位置。正式地說，一個信息集指的是一個參與人在決策時，無法進(jìn)行區(qū)分的節(jié)點(diǎn)集合。博弈樹規(guī)則4：每一個信息集只包含一個參與人的決策點(diǎn)。以下的博弈樹是錯誤的.1 2 ab14 擴(kuò)展型表示的細(xì)節(jié)說明2 博弈樹規(guī)則5：某個信息集中的所有節(jié)點(diǎn)，必須具有相同數(shù)量的直接后續(xù)節(jié)點(diǎn)，而且其中的所有節(jié)點(diǎn)是通過具有相同集合行動標(biāo)簽的分支，而達(dá)到這些后續(xù)節(jié)點(diǎn)的。規(guī)則5背后的機(jī)制是，如果一個參與人在節(jié)點(diǎn)a和b上可以選擇的行動是不同的，那么它一定可以區(qū)

60、分這兩個節(jié)點(diǎn)。因此下圖是錯誤的。1 ab14 擴(kuò)展型表示的細(xì)節(jié)說明1 假設(shè)參與人記得它們自己過去的行動，以及它們已經(jīng)觀察到的任何事件，在一般情況下是合理的。滿足這一假設(shè)的博弈稱為具有完美記憶的。下圖描述了一種不完美記憶的情形。1 abUDXYXY15 逆向歸納法和子博弈完美均衡 15 逆向歸納法和子博弈完美均衡標(biāo)準(zhǔn)型博弈最適用于所有參與人同時和獨(dú)立作出決定的博弈。我們現(xiàn)在開始考慮具有有趣動態(tài)特性的博弈。對于這種博弈，擴(kuò)展型可以最明確地刻畫行動的順序和信息結(jié)構(gòu)。我們觀察下列博弈。如果參與人1(進(jìn)入者)選擇進(jìn)入市場，參與人2(在位者)必須選擇是否進(jìn)行價格戰(zhàn)。通過對標(biāo)準(zhǔn)型的觀察，可以很快發(fā)現(xiàn)這個博

人人文庫> 全部分類> 教育資料 > 課件下載

溫馨提示

1. 本站所有資源如無特殊說明，都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
2. 本站的文檔不包含任何第三方提供的附件圖紙等，如果需要附件，請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
3. 本站RAR壓縮包中若帶圖紙，網(wǎng)頁內(nèi)容里面會有圖紙預(yù)覽，若沒有圖紙預(yù)覽就沒有圖紙。
4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
5. 人人文庫網(wǎng)僅提供信息存儲空間，僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理，對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯，并不能對任何下載內(nèi)容負(fù)責(zé)。
6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容，請與我們聯(lián)系，我們立即糾正。
7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時也不承擔(dān)用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

博弈論基礎(chǔ)PPT精品課程課件全冊課件匯總

文檔簡介

溫馨提示

最新文檔

評論

博弈論基礎(chǔ)PPT精品課程課件全冊課件匯總

文檔簡介

溫馨提示

最新文檔

評論

相關(guān)文檔