




版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進(jìn)行舉報或認(rèn)領(lǐng)
文檔簡介
1、授課人:XX XX PPT內(nèi)容可自行編輯博弈論基礎(chǔ)精品課程策略博弈2th,阿維納什 迪克西特,蘇珊 斯克絲策略:博弈論導(dǎo)論。喬爾 沃森博弈論基礎(chǔ)羅伯特 吉本斯博弈入門馬丁 奧斯本研究生:博弈論D. 弗登博格,讓 梯若爾 博弈論R. 邁爾森博弈論教程M. 奧斯本,A. 魯賓斯坦參考書 在所有社會,人們經(jīng)?;?。有時,互動是合作,其他的時候,互動是競爭。在這兩種情況下,都可以用一個術(shù)語,即相互依賴性來表示一個人的行為對另外一個人的福利造成的影響。相互依賴的情形可稱為策略環(huán)境。因?yàn)槿藗優(yōu)榱舜_定所采取的最優(yōu)行動,必須考慮他周圍的其他人會怎樣選擇行動。1 概述 策略對于社會的運(yùn)行來說,是非?;镜?。我們
2、要學(xué)會了解在策略環(huán)境下,人們實(shí)際上是如何采取行動的,以及他們應(yīng)該怎樣采取行動。相互依賴的情形可稱為策略環(huán)境。因?yàn)槿藗優(yōu)榱舜_定所采取的最優(yōu)行動,必須考慮他周圍的其他人會怎樣選擇行動。這種系統(tǒng)的研究形成了應(yīng)該策略互動的理論。1 概述 這個理論在許多方面都是有用的。首先,它提供了一種語言。其次,它提供了應(yīng)該框架,能夠指導(dǎo)我們建立策略環(huán)境模型。其三,它有助于我們追朔,對行為假設(shè)的邏輯推理過程。1 概述 這個理論在許多方面都是有用的。首先,它提供了一種語言。其次,它提供了應(yīng)該框架,能夠指導(dǎo)我們建立策略環(huán)境模型。其三,它有助于我們追朔,對行為假設(shè)的邏輯推理過程。1 概述 好幾百年前,數(shù)學(xué)家就開始研究室內(nèi)游
3、戲,試圖構(gòu)造最優(yōu)的游戲策略。在1713年,沃爾德格雷夫就某種紙牌游戲的解決方法,與他的同事德莫特和貝努利進(jìn)行交流。沃爾德格雷夫的解決方法,與現(xiàn)代理論的結(jié)論相一致。1 概述在19世紀(jì)的前10年,古諾對寡頭模型的均衡進(jìn)行了研究。而埃奇沃思解決了交易經(jīng)濟(jì)中的議價問題。1 概述1913年,關(guān)于博弈的第一個定理(關(guān)于象棋游戲的結(jié)論)被澤梅羅證明。接著,博雷爾開創(chuàng)性地提出了“策略”的概念。1 概述博弈論發(fā)展的關(guān)鍵事件是1944年馮諾依曼和奧斯卡摩根斯坦的著作博弈論和經(jīng)濟(jì)行為的出版。此書奠定了該領(lǐng)域的基石。接下去的幾十年中,數(shù)學(xué)家和經(jīng)濟(jì)學(xué)家豐富了它的基礎(chǔ),逐步打造了社會科學(xué)最強(qiáng)大和最有影響力的工具箱之一。1
4、 概述1994年諾貝爾獎頒給了,在20世紀(jì)50-70年代對博弈論做出了重大貢獻(xiàn)的3位經(jīng)濟(jì)學(xué)家:約翰納什,約翰海薩尼和萊茵哈特澤爾騰。1 概述接著榮膺諾貝爾經(jīng)濟(jì)學(xué)獎金桂冠的經(jīng)濟(jì)學(xué)家有,諸如信息和合約方面的專家-威廉維克里和詹姆斯米利斯(1996年)。1 概述還有2001年獲獎的米歇爾斯彭斯,約瑟夫斯蒂克利茨和喬治阿克洛夫。1 概述目前,博弈論被許多來自不同領(lǐng)域的專業(yè)人士使用,這些領(lǐng)域包括經(jīng)濟(jì)學(xué)、政治學(xué)、法律、生物、國際關(guān)系哲學(xué)以及數(shù)學(xué)。事實(shí)上,大多數(shù)情形即包含了沖突元素,也包含了合作的元素。我們對博弈的組成要有一個廣義的理解。簡而言之,博弈是策略環(huán)境的正式描述。因此,博弈論是研究相互依賴情形的正
5、式的方法論。這里,“正式”是指一種以數(shù)學(xué)化的精確,以及邏輯上的一致見長的結(jié)構(gòu)。利用正確的理論工具,我們可以研究各種情況下的行為,從而更好地理解經(jīng)濟(jì)中的相互作用。1 概述 1.1 什么是博弈論?博弈論幫助我們理解,決策者互動的情形。Creates a double record of bank transactions.Bank reconciliation.導(dǎo)言MovieCricketMovie2,10,0Cricket0,01,22 擴(kuò)展型 在數(shù)學(xué)上,有幾種方法描述一個博弈:1 博弈有一組參與人;2 對于參與人可能采取的行動的完整描述(即它們的可行行動集);3 對于參與人采取行動時,所知信息
6、的描述;4 對于參與人的行為將如何導(dǎo)致博弈結(jié)果的規(guī)定;5 對于參與人對結(jié)果偏好的定義。2 擴(kuò)展型迪斯尼工作室的蟲子的一生和夢工場的螞蟻。卡曾伯格被迪斯尼的老板艾斯納從派拉蒙招賢,以重振迪斯尼動畫部。卡氏于1994年8月辭職。不久,艾斯納接受了提議,于是蟲子的一生進(jìn)入了制作階段。大概同時,卡氏與斯皮爾伯格等組建了夢工場。開始制作螞蟻。兩個工作室是在決定制作兩部影片之后,才得知對方的決定的。2 擴(kuò)展型迪斯尼準(zhǔn)備在1998年感恩節(jié)期間,發(fā)行蟲子的一生。而這正是夢工場原定埃及艷后的上映時間。夢工場于是決定,把埃及艷后推遲到圣誕節(jié)。爭取在蟲子的一生上映之前,讓螞蟻上映。最后,螞蟻為夢工場創(chuàng)造了超過0.9
7、億美元的利潤,而蟲子的一生確保了超過1.6億美元的利潤。2 擴(kuò)展型讓我們用一個數(shù)學(xué)模型講述這個故事。為了把它轉(zhuǎn)化成數(shù)學(xué)的抽象語言,我們必須對故事進(jìn)行適當(dāng)?shù)暮喕统淌交?。我們的目?biāo)應(yīng)該是從中分析得出一兩個策略要素。這可以幫助我們從理論學(xué)者的角度,理解這個決策環(huán)境。2 擴(kuò)展型 K E K K fghlmLSPNPNPNRNabcde我們可以用一個樹狀結(jié)構(gòu)表示兩個公司之間的互動。樹狀結(jié)構(gòu)由節(jié)點(diǎn)和分支組成。節(jié)點(diǎn)表示事件的發(fā)生點(diǎn),分支表示可以選擇的不同的行為方案。我們用實(shí)心圓表示節(jié)點(diǎn),用連接節(jié)點(diǎn)的箭頭表示分支。這個樹狀結(jié)構(gòu)稱為擴(kuò)展型表述。a稱為初始點(diǎn),a,b,c,d,e稱為決策點(diǎn)。f,g,h,l,m稱為
8、終止點(diǎn)。表示博弈的結(jié)果。 2 擴(kuò)展型 K E K K fghlmLSPNPNPNRNabcde我們用信息集來定義參與人在博弈中的決策節(jié)點(diǎn)所擁有的信息。有一些信息集只包括一個節(jié)點(diǎn),例如在節(jié)點(diǎn)a,b。節(jié)點(diǎn)c,d則包含在一個信息集中。每個信息集只能做出一個決策。而正如在故事中所說的,雙方都不知道對方是否制作影片之前,決定制作自己的影片。虛線表示K知道自己處于這兩個節(jié)點(diǎn)之一,但是不能區(qū)分自己處于c還是d。即K缺乏信息。 2 擴(kuò)展型 K K K 40,11013,1200,14080,00,0LSPNPNPNRNabcdeE參與人對于結(jié)果的偏好性。K是否更希望博弈終止點(diǎn)f而不是h上結(jié)束?我們必須知道參與
9、人關(guān)心什么,才能將終止點(diǎn)根據(jù)每個參與人的偏好排列。通常用數(shù)字表述參與人的偏好排序最為簡便。這也稱為支付(payoff),或者效用(utilities)。2 擴(kuò)展型 K K K 40,11013,1200,14080,00,0LSPNPNPNRNabcdeE我們引入一些數(shù)學(xué)符號來考察博弈。我們來看看一個市場博弈,兩個廠商通過選擇高價或者低價進(jìn)行競爭。我們用參與人i表示任何一個參與人的數(shù)字代碼。即在一個有n個參與人的博弈中,i=1,2,n。在某些博弈中,一個參與人可以在無限多個行動中進(jìn)行選擇。2 擴(kuò)展型 12pyesnop,100-p0,0一個簡單的討價還價模型,即最后通牒議價。假設(shè)1希望賣一幅畫
10、。各方只有一次出價的機(jī)會。假設(shè)賣方先出價,買方2可以決定是否接受這個價格。如果畫沒有成交,雙方均一無所獲。如果成交,賣方獲得等于價格的收益,買方獲得自己的價值。2 擴(kuò)展型 12pyesnop,100-p0,01.1 什么是博弈論?博弈論幫助我們理解,決策者互動的情形。Creates a double record of bank transactions.Bank reconciliation.導(dǎo)言MovieCricketMovie2,10,0Cricket0,01,23 策略 策略是博弈中的一組參與人完整的相機(jī)的行動計劃。這里的“完整的相機(jī)計劃”是對一個參與人行為的完整描述。它包含了它的每一
11、個決策點(diǎn)上的行為。因?yàn)樾畔⒓硎镜氖窃诓┺闹懈鱾€參與人的決策點(diǎn),所以,一個參與人的策略描述的是,在它的每個信息集中,它所做出的決策。3 策略 例如,在下面的博弈中,你的策略必須包括在所有的節(jié)點(diǎn),即a,c-d,以及e的信息集中,所有選擇的行動。即使你打算在節(jié)點(diǎn)a選擇“留下”,你也必須對上述所有決策進(jìn)行定義。3 策略 K K K 40,11013,1200,14080,00,0LSPNPNPNRNabcdeE例子:該圖描述了一個簡單的市場博弈。兩個廠商為其生產(chǎn)的一種相同的產(chǎn)品,分別選擇高價或者低價進(jìn)行相互競爭。3 策略 1 2 HLLHHL1,10,22,01/2,1/2,正式地說,給定某個博弈。
12、我們用Si來表示參與人i的策略空間。也稱為策略集合。即Si包含了參與人i的每一個可能的策略集合。對前一個博弈,參與人1的策略空間S1=H,L。而參與人2的策略空間是S2=HH,HL,LH,LL。我們用小寫字母表示單個策略(即這個集合中的一個元素),則si Si是博弈中參與人i的一個策略。例如,s1=L,s2=LH。3 策略 一個策略組合是關(guān)于策略的向量,每一項(xiàng)表示一個參與人。在研究一個有n個參與人的博弈。一個典型的策略組合就是這樣一個向量,s=(s1,s2,sn)。其中si是參與人i的策略,i=1,2,n。S表示策略組合的集合。在數(shù)學(xué)上表示為S=S1XS2XXSn。X表示笛卡爾乘積。如果S1=
13、A,B,S2=X,Y,那么,S=S1XS2=A,X),(A,Y),(B,X),(B,Y)。3 策略 舉個例子,我們看下圖的博弈。S1=OA,OB,IA,IB,S2=O,I請注意,在這個博弈中,參與人1的策略。不僅要定義它在開始時怎么做,還要定義在第二個信息集中,它將采取什么行動。你可能會問,如果參與人1在博弈開始時選擇退出,為什么它還要在第二個信息集中,決定該怎么做?3 策略 211IIOOAB2,21,33,44,2原因一是,出于理性的研究,我們需要的是對于博弈中,任意一點(diǎn)的最優(yōu)行動的明確評估。這種評估與參與人對彼此的信念有關(guān)。原因而在于,萬一參與人犯了錯誤,它們可能會需要一個意外狀況下的計
14、劃。3 策略 211IIOOAB2,21,33,44,2另外一個例子,在這個博弈樹中,S1=U,DS2=AC,AE,BC,BES3=RP,RQ,TP,TQ3 策略 1 3 9,2,52,4,40,5,43,0,0UDABRTPQ22,2,21,2,26,3,2CEPQ3 24 標(biāo)準(zhǔn)型 標(biāo)準(zhǔn)型是另一種表示博弈的正式方法。在某些情況下,標(biāo)準(zhǔn)型更加簡潔,可以優(yōu)先使用。對于一個用擴(kuò)展型表示的博弈,每一個策略組合能夠告訴我們,該博弈在博弈樹中所遵循的路徑。同時告訴我們,在博弈結(jié)束時,終止點(diǎn)是哪個。與每個終止點(diǎn)相對應(yīng)的是,各個參與人的收益向量。因此需要注意的是,每一個策略組合,給出了一個收益向量。 4 標(biāo)
15、準(zhǔn)型 對于每一個參與人i,我們可以定義一個函數(shù)ui=S R (該函數(shù)的定義域是策略組合的集合,值域是實(shí)數(shù))。對于各個參與人所選擇的每一個策略組合,sS,ui(s)是參與人i 在博弈中的收益。 這個函數(shù)ui稱為參與人i的收益函數(shù)。4 標(biāo)準(zhǔn)型 舉個例子,我們看下圖的博弈。S1=OA,OB,IA,IB,S2=O,I該博弈的策略組合是S=(OA,O),(OA,I),OB,O), (OB,I),(IA,O), (IA,I)(IB,O),(IB,I)參與人i的收益是定義在S之上的。因此,當(dāng)博弈采取策略組合s時,ui(s)給出了參與人i在博弈中的收益。例如,u1=(OA,O)=2,u1(IA,I)=4,u2
16、(IA,O)=34 標(biāo)準(zhǔn)型 211IIOOAB2,21,33,44,2對于各參與人具有的策略數(shù)量有限的兩方博弈,表示各參與人的策略空間的一種簡便方法,是畫出它們的收益矩陣。矩陣的每一行對應(yīng)參與人1的一個策略。而每一列對應(yīng)參與人2的一個策略。4 標(biāo)準(zhǔn)型12IOOA2,22,2OB2,22,2IA4,21,3IB3,41,3囚徒的困境。警察逮捕了兩個嫌疑犯,警察擁有的證據(jù)只能證明他們犯了較輕的罪。警察分別把他們關(guān)在不同的房間。每個囚犯都被要求高發(fā)另一個囚犯。告發(fā)對應(yīng)于策略D(背叛),不告發(fā)對應(yīng)于策略C(指合作)。囚犯被告知,如果他們選擇告發(fā),將被免罪。他們的證據(jù)將被用于給對方定罪。如果他們都選擇告
17、發(fā),他們都將入獄。但是他們的刑期由于合作將會較短。 4 標(biāo)準(zhǔn)型 局中人:兩個嫌疑犯。行動:每個嫌疑犯的行動集是沉默,告密偏好:嫌疑犯1的行動組合序列是(最好到最差):(告密,沉默),(沉默,沉默),(告密,告密),(沉默,告密);嫌疑犯2的是:(沉默,告密),(沉默,沉默),(告密,告密),(告密,沉默)4 標(biāo)準(zhǔn)型嫌疑犯12沉默 告密沉默2,20,3告密3,01,1我們研究囚徒的困境的重要性,不在于想了解囚徒的動機(jī),而在于許多其他的情形,都具有類似的結(jié)構(gòu)。每當(dāng)兩個局中人的任何一個,有兩種選擇。那么囚徒的困境模擬了局中人的情形。例如: 合作項(xiàng)目。4 標(biāo)準(zhǔn)型12努力工作 游手好閑 努力工作 2,2
18、0,3游手好閑 3,01,1雙寡頭壟斷。4 標(biāo)準(zhǔn)型12高價 低價 高價 1000,1000-200,1200低價 1200,-200600,600公地悲劇。4 標(biāo)準(zhǔn)型12少吃 多吃 少吃 2,20,3多吃 3,01,1在囚徒困境中,主要問題是局中人是否合作。在以下的博弈中,局中人同意合作好于不合作,但是他們在最好的結(jié)局上存在分歧。局中人:兩個朋友。行動:每個嫌疑犯的行動集是沉默,告密偏好:嫌疑犯1的行動組合序列是(最好到最差):(告密,沉默),(沉默,沉默),(告密,告密),(沉默,告密);嫌疑犯2的是:(沉默,告密),(沉默,沉默),(告密,告密),(告密,沉默)4 標(biāo)準(zhǔn)型嫌疑犯12沉默 告
19、密沉默2,20,3告密3,01,1在囚徒困境中,主要問題是局中人是否合作。在以下的博弈中,局中人同意合作好于不合作,但是他們在最好的結(jié)局上存在分歧。性別戰(zhàn)。局中人:兩個朋友。行動:兩個朋友必須決定去看電影還是聽歌劇。偏好:他們都愿意待在一起。但是參與人1更喜歡歌劇,參與人2更喜歡電影。4 標(biāo)準(zhǔn)型12歌劇 電影 歌劇 2,10,0電影 0,01,2斗雞博弈。局中人:鷹和鴿。行動:保持原方向和轉(zhuǎn)向。偏好:如果他們都保持原方向,就會撞車。如果都轉(zhuǎn)向,就都保住了面子。如果只有對方轉(zhuǎn)向,就會被稱為硬漢。4 標(biāo)準(zhǔn)型12保持 轉(zhuǎn)向 保持 0,0 3,1轉(zhuǎn)向 1,32,2智豬博弈。局中人:大豬和小豬。行動:按
20、下按鈕和不按。偏好:如果他們都保持原方向,就會撞車。如果都轉(zhuǎn)向,就都保住了面子。如果只有對方轉(zhuǎn)向,就會被稱為硬漢。4 標(biāo)準(zhǔn)型12按下 不按 按下 4,2 2,3不按 6,-10,05 信念、混合策略和期望效用 以后,我們將提出某些進(jìn)行博弈的理性行為的概念。這些概念的基礎(chǔ)想法,是通過某些過程,互相形成對方行為的信念。因?yàn)槲覀兊哪康氖?,建立決策的數(shù)學(xué)模型,我們需要精確地表示一個參與人的信念。我們使用概率。例如,參與人1的信念,是參與人2的策略的概率分布。 參與人1的信念是,參與人2以概率p選擇C;以概率1-p選擇D。 5 信念、混合策略和期望效用讓我們正式定義標(biāo)準(zhǔn)型概率的信念。在數(shù)學(xué)上,參與人i的
21、一個信念,是其他參與人的策略的一個概率分布。我們用-i來表示這個概率分布。且有-iS-i 。其中,S-i是指除了參與人i之外的所有其他參與人,所采取的策略的概率分布的集合。例如,在兩方博弈中(因此有-i=j),假設(shè)每一個參與人都有有限數(shù)量的策略。參與人i對參與人j所采取的行為的信念是一個函數(shù)-iS-i ,其中,對于參與人j的每個策略sjSj,(sj)可以解釋為,參與人i認(rèn)為參與人j可能采取策略sj的概率。5 信念、混合策略和期望效用作為一個概率分布,-i具有這樣的性質(zhì),對于每個sjSj,(sj) 0 ,且sjSj(sj) =1。一個參與人的混合策略是指,他根據(jù)一個概率分布來選擇策略行為。 正式
22、地說,混合策略和信念是相似的概念,它們都是概率分布。我們一般表示參與人i的混合策略為iS-i 。5 信念、混合策略和期望效用我們可以把效用函數(shù)的定義,通過一個期望值的概念,擴(kuò)展到混合策略和信念中。當(dāng)參與人i對其他人的策略具有信念-i ,并計劃選擇si時,他的期望收益,等于他采取策略si ,而其他人根據(jù)-i采取行動時的“平均”收益。用數(shù)學(xué)表示為5 信念、混合策略和期望效用以下圖的博弈為例。假設(shè)參與人1相信,有1/2的可能性參與人2采取策略L,有1/4的可能性采取策略M,有1/4的可能性采取策略R。即他的信念2滿足2(L)=1/2,2(M)=1/4, 2(R)=1/4。這個信念的常用的簡寫方式是(
23、1/2,1/4,1/4)。如果參與人1選擇U,那么他的期望收益是u1(U,2)=(1/2)8+(1/4)0+(1/4)4)=5 5 信念、混合策略和期望效用12LMPL8,10,24,0M3,31,20,0P5,02,38,1局中人:兩個嫌疑犯。行動:每個嫌疑犯的行動集是沉默,告密偏好:嫌疑犯1的行動組合序列是(最好到最差):(告密,沉默),(沉默,沉默),(告密,告密),(沉默,告密);嫌疑犯2的是:(沉默,告密),(沉默,沉默),(告密,告密),(告密,沉默)5 信念、混合策略和期望效用嫌疑犯12沉默 告密沉默2,20,3告密3,01,1第二部分 靜態(tài)行為分析 博弈論的要點(diǎn)在于,通過正式模
24、型的使用,幫助我們理解在各種經(jīng)濟(jì)和社會環(huán)境中的策略要素。這些環(huán)境包括市場結(jié)構(gòu)、協(xié)議、公司之間的競爭、公司的內(nèi)部組織、討價還價、政治和普遍的關(guān)系。所有這些環(huán)境的全面研究過于復(fù)雜。因此,給定特定的環(huán)境,我們將試圖將某些明確的特征,加入必要簡化的模型,描述為一個博弈。 模型可以提供一個有用的框架,用它可以探索參與人的行為。第二部分 靜態(tài)行為分析在我們的博弈論研究中,我們的目標(biāo)有,解釋和理解人們實(shí)際的行為,預(yù)測人們在特定的情況下如何行動,描述人們在特定的情況下應(yīng)該如何行動。第二部分介紹研究理性行為的基本工具。這些工具將策略和收益作為基礎(chǔ)。即使用博弈的標(biāo)準(zhǔn)型設(shè)定。這里的分析可以很容易地應(yīng)用于擴(kuò)展型的設(shè)定
25、。此后,我們的分析建立在參與人都理解它們進(jìn)行的博弈的假設(shè)的基礎(chǔ)上。它們都了解該標(biāo)準(zhǔn)型。第二部分 靜態(tài)行為分析本章討論策略互動理論中最基本的兩個概念:占優(yōu)和最優(yōu)反應(yīng)。這兩個概念是大部分關(guān)于理性行為的概念的基礎(chǔ)。占優(yōu)。觀察下表的博弈。假設(shè)你是參與人1。策略U有一個有趣的特性,不管參與人2選擇哪個,策略U都比策略D的收益絕對地高。 用專業(yè)術(shù)語說,我們稱策略D劣于策略U。所以策略D永遠(yuǎn)不會被理性的參與人1采納。注意,對于參與人2來說,兩個策略中,沒有一個是劣策略。6 占優(yōu)與最優(yōu)反應(yīng)12L R U 2,35,0D 1,04,3 在以下這個博弈中,參與人1的策略D是策略M的劣策略。即不管參與人2采取哪種策
26、略,M給參與人1帶來的收益都比D高。但是,策略U不是M的劣策略。6 占優(yōu)與最優(yōu)反應(yīng) 12LC R U 8,30,44,4M4,21,55,3D 3,70,12,0下面的博弈有更加復(fù)雜的占優(yōu)關(guān)系。對于參與人1而言,沒有一個純策略是另一個純策略的劣策略。但是,混合策略要優(yōu)于D。考慮參與人1各以1/2的概率選擇U和M,而以概率0選擇D的策略。我們將這個策略表示為(1/2,1/2,0)。如果參與人2選擇L,該混合策略給參與人1的收益為:2=4(1/2)+0(1/2)+1(0) 參與人1采取D的收益更低。參與人2采取R時,結(jié)果也是一樣的。因此,策略D要劣于混合策略(1/2,1/2,0) 。6 占優(yōu)與最優(yōu)
27、反應(yīng) 12L R U 4,10,2M 0,04,0D 1,31,2 占優(yōu)的概念的正式定義如下: 對于參與人i的純策略si,有策略(不管是純策略還是混合策略) iSi,如果對于其他參與人的所有策略組合s-iS-i均能滿足ui(i,s-i) ui(si,s-i),我們就稱si劣于i。檢驗(yàn)一個策略是否是劣策略,最好的方法是首先確定它是否劣于另一個純策略。例如,為了檢驗(yàn)參與人1的某個策略是否占優(yōu)于另一個策略,只需要逐列地比較收益矩陣中,代表這兩個策略的兩行。如果一個策略并不劣于其他純策略,那么你必須比較它是否劣于某個混合策略。6 占優(yōu)與最優(yōu)反應(yīng) 當(dāng)涉及混合策略時,占優(yōu)關(guān)系的檢驗(yàn)就比較棘手。但是有幾條訣
28、竅:首先要注意的是,有很多不同的混合策略可以嘗試。其次,在尋找混合策略時,先觀察收益矩陣中,數(shù)字的變化規(guī)律。第三,只需要找到某一個策略(不管是純策略還是混合策略)即可。最后,要確定你所檢驗(yàn)的收益數(shù)字是正確的。6 占優(yōu)與最優(yōu)反應(yīng) 第一類策略矛盾和囚徒的困境。在以下的囚徒的困境的博弈中,對兩個參與人來說,策略C都劣于策略D。因此我們預(yù)測,他們都不會選擇策略C,但是,如果人們都選擇策略C,他們都會得到更好的結(jié)果。6 占優(yōu)與最優(yōu)反應(yīng)嫌疑犯12C D C 2,20,3D 3,01,1囚徒的困境反映了策略環(huán)境的一個主要矛盾:個人利益與集體利益之間的沖突。雙方都認(rèn)識到他們都選擇C時,共同得到更好的結(jié)果。但是
29、,每個人都有個人的動機(jī)選擇背叛。因?yàn)楦鱾€參與人是同時并且獨(dú)立地選擇他們的策略,因此個人的動機(jī)占了上風(fēng)。你甚至可以想象花了很多時間討論采取(C,C)策略組合的優(yōu)點(diǎn),他們甚至達(dá)成了口頭協(xié)議。但是當(dāng)他們分開并采取行動時,沒有一方有激勵根據(jù)協(xié)議采取行動。強(qiáng)烈的個人動機(jī)將導(dǎo)致集體的損失。6 占優(yōu)與最優(yōu)反應(yīng)嫌疑犯12C D C 2,20,3D 3,01,1關(guān)于利益沖突,我們簡單地考慮兩個相關(guān)的問題。首先,要記住收益數(shù)字的含義。作為效用,這些數(shù)字只是表示個人的偏好。它們不一定表示利潤或貨幣的數(shù)量。其次,在真實(shí)的世界中,各個參與人有時選擇相互之間,達(dá)成有法律約束力的合同。例如,參與人或許可以選擇簽訂一份合同,
30、約束他們都選擇策略C。如果這樣的選擇是該策略環(huán)境的關(guān)鍵部分,我們應(yīng)該將其納入模型。囚徒困境是一個被廣泛討論的博弈,并且為經(jīng)濟(jì)學(xué)、社會學(xué)、政治學(xué)、國際關(guān)系及哲學(xué)等研究領(lǐng)域,提供了加深認(rèn)識的源泉。 6 占優(yōu)與最優(yōu)反應(yīng) 效率的概念。第一種策略矛盾與經(jīng)濟(jì)效率有關(guān),這是一個重要的福利標(biāo)準(zhǔn),可以用于對博弈中的行為進(jìn)行評判。假設(shè)我們想比較兩個策略組合的結(jié)果,它們分別為s和s。如果所有的參與人,相當(dāng)于s都更加偏好于采取s,而且至少對一個參與人是嚴(yán)格偏好,我們稱s比s更有效率。 用數(shù)學(xué)表示,如果ui(s) ui(s),對每個參與人都成立,并且不等式至少對一個參與人是嚴(yán)格成立的,那么s就比s更有效率。6 占優(yōu)與最
31、優(yōu)反應(yīng) 如果不存在其他更有效率的策略組合,我們就稱這個策略組合s是有效的。即對于每一個參與人i來說,不存在其他策略組合s,對于每個參與人i都滿足ui(s) ui(s) ,同時對某個參與人來說uj(s) uj(s) 。帕累托有效表示的是同一個意思。在囚徒的困境中,(C,C)比(D,D)更有效率。而且,(C,C), (C,D),(D,C)都是有效的策略組合。 6 占優(yōu)與最優(yōu)反應(yīng)嫌疑犯12C D C 2,20,3D 3,01,1最優(yōu)反應(yīng)。理性人會避免采取劣策略的假設(shè)似乎是合理的。占優(yōu)是一個具有很好描述性和說明性的概念。但是,這僅僅是我們展開行為理論的開端。實(shí)際上,在大多數(shù)博弈中,參與人具有超過一個非
32、劣策略。這時,人們無法根據(jù)占優(yōu)的標(biāo)準(zhǔn),預(yù)測參與人會采取怎樣的行動。6 占優(yōu)與最優(yōu)反應(yīng) 理性人會思考其他參與人可能采取的行動。即人們會形成對彼此行為的一種信念。在決定自己的策略之前,先對其他參與人的行為形成觀點(diǎn)是明智的。為了使期望獲得的收益最大化,我們假定這是理性行為的標(biāo)志,你應(yīng)該選擇與你的信念相對應(yīng),從而能夠產(chǎn)生最大期望的策略。這樣一個策略就稱為最優(yōu)反應(yīng)。正式地有:假設(shè)參與人i對其他參與人采取的策略具有信念-iS-i,如果對于任何siSi,參與人i的策略siSi都滿足 ui(si, -i)ui(si, -i ),那么,si是一個最優(yōu)反應(yīng)。6 占優(yōu)與最優(yōu)反應(yīng) 在某個信念下,可能有超過一個最優(yōu)反應(yīng)
33、。不難證明,在一個有限博弈中,每個信念至少對應(yīng)一個最優(yōu)反應(yīng)。對于參與人i的每個信念-i,我們將最優(yōu)反應(yīng)的集合表示為BRi(-i)。例如,假設(shè)參與人1對參與人2的策略的信念為(1/3,1/2,1/6)。即相信參與人2有1/3的可能選擇L。如果參與人1選擇策略U,他所能期望的收益為(1/3)2+(1/2)0+(1/6)4=8/6。其他類推。如果選M,期望收益為7/6,如果選L,則為13/6。因此,他的最優(yōu)反應(yīng)為策略D。我們得到BR1(1/3,1/2,1/6)=D6 占優(yōu)與最優(yōu)反應(yīng) 12LC R U 2,60,44,4M3,30,01,5 D 1,13,5 2,3假設(shè)參與人2對參與人1采取的策略,具
34、有信念(1/2,1/4,1/4)。如果參與人2選擇策略L,他所能期望的收益為(1/2)6+(1/4)3+(1/4)1=4。如果選擇C,期望收益為13/4,如果選擇L,則為4。因此,他有兩個最優(yōu)反應(yīng),為策略L和R。我們得到BR2(1/2,1/4,1/4)=L,R6 占優(yōu)與最優(yōu)反應(yīng) 12LC R U 2,60,44,4M3,30,01,5 D 1,13,5 2,3有一點(diǎn)需要理解的是,根據(jù)對其他參與人行動的信念,相應(yīng)地采取最優(yōu)反應(yīng)策略本身,并不是一個策略行為。你可以把它看作是與理性有關(guān)的一種純粹的計算練習(xí)。形成信念才是策略中的一個更加重要的部分。有一點(diǎn)你必須很確定,采取行動最關(guān)鍵的部分是信念中包含的
35、信息。事實(shí)上,博弈的真正藝術(shù)就在這里。6 占優(yōu)與最優(yōu)反應(yīng) 7 可理性化和重復(fù)占優(yōu) 占優(yōu)和最優(yōu)反應(yīng)的概念是理性行為理論的基礎(chǔ)。但是我們必須認(rèn)識到,理性行為包含的不僅僅是避免采取劣策略。實(shí)際上,明智的博弈參與人對博弈的基本概念很清晰,即一方的行動將影響另一方的收益,需要同時站在對方的立場考慮,從而對對方的行為做出聰明的估計。7 可理性化和重復(fù)占優(yōu)在以下的博弈中,假設(shè)你是參與人1,你的兩個策略中沒有劣策略。因此你可以根據(jù)你對對方行動的信念,理性地選擇策略A或B。用p表示你認(rèn)為對方會采取X,用q表示采取Y,用1-p-q表示采取Z的概率。基于你的信念,你采取策略A獲得的期望收益為3p+0q+0(1-p-
36、q)=3p。你采取B的期望收益為0p+3q+1(1-p-q)= 1-p+2q。因此,當(dāng)3p1-p+2q時,你的最優(yōu)反應(yīng)是采取A。7 可理性化和重復(fù)占優(yōu)12XYZA3,30,50,4B0,03,11,2當(dāng)4p0,0,Q=Q1+Q2。我們使用逆需求函數(shù)為P=a-bQ。作為實(shí)例,我們偶爾會考慮a=10,b=1的特殊情況。即逆需求函數(shù)為P=10-Q。該需求曲線的圖像為:10 寡頭、關(guān)稅、犯罪與懲罰 PQ1010 0現(xiàn)在假設(shè)每家公司的成本函數(shù)相同,并且單位成本不隨產(chǎn)量而變化。即每家公司具有常數(shù)的邊際成本函數(shù):生產(chǎn)數(shù)量Qi的成本為cQi。其中c0,i=1,2。每家公司將生產(chǎn)多少?為了做出決策,每家公司必須
37、采取兩個步驟:1. 對另一家公司的產(chǎn)量進(jìn)行預(yù)測。2. 決定生產(chǎn)的數(shù)量。10 寡頭、關(guān)稅、犯罪與懲罰 本節(jié)我們將通過模型說明,(a)如何把一個問題的非正式化描述,轉(zhuǎn)化為一個博弈的標(biāo)準(zhǔn)式表述。(b)如何通過計算解出博弈的納什均衡。令q1、q2分別表示企業(yè)1、2的同質(zhì)產(chǎn)品的產(chǎn)量。 令P=a-bQ 為市場出清時的價格。設(shè)企業(yè)i生產(chǎn)Qi的總成本ci(Qi)=cQi,企業(yè)不存在固定成本,且生產(chǎn)每單位產(chǎn)品的邊際成本為常數(shù)c。根據(jù)古諾的假定,兩個企業(yè)同時進(jìn)行產(chǎn)量決策。 10 寡頭、關(guān)稅、犯罪與懲罰 為了求出古諾博弈的納什均衡,我們首先要將其化為標(biāo)準(zhǔn)式的博弈。博弈的標(biāo)準(zhǔn)式表述包含下列要素: (1)博弈的參與人;
38、(2)每個參與人可以選擇的戰(zhàn)略;(3)針對某一個可能出現(xiàn)的參與人的戰(zhàn)略組合,每一參與人的收益。雙寡頭模型只有兩個參與人。每一個企業(yè)可以選擇的戰(zhàn)略,是其產(chǎn)品的產(chǎn)量。我們假定產(chǎn)品是連續(xù)可分的。每一個企業(yè)的戰(zhàn)略空間可以表示為Si=0, )。其中一個戰(zhàn)略si就是企業(yè)選擇的產(chǎn)量Qi0。要全面表示一個博弈,并且求其均衡解,還需要把企業(yè)i的收益表示為兩一個企業(yè)選擇的策略的函數(shù)。我們假定企業(yè)的收益就是其利潤額。在兩個參與人的標(biāo)準(zhǔn)式博弈中,參與人i的收益ui(si,sj)就可以寫為:i(Qi,Qj)=Qip(Qi+Qj)-c=Qia-b(Qi+Qj)-c10 寡頭、關(guān)稅、犯罪與懲罰 在一個標(biāo)準(zhǔn)式的兩方博弈中,一
39、對戰(zhàn)略(s1*,s2*)如果是納什均衡,則對于每個參與人i,si*應(yīng)該滿足:ui(si*,sj*) ui(si,sj*) 上式對Si中每一個可選戰(zhàn)略si都成立。這一條件等價于,對每個參與人i,si*必須是以下最優(yōu)化問題的解:在古諾雙寡頭模型模型中,上面的條件可以具體表述為,一對產(chǎn)出組合(Qi*,Q2*)如果是納什均衡,對每一個企業(yè)i,Qi*應(yīng)該為下列最優(yōu)化問題的解:10 寡頭、關(guān)稅、犯罪與懲罰 利潤是二次函數(shù),存在一個最大產(chǎn)量,表示為Q1*,我們可以通過對該問題的一階條件計算得到:a-c-bQ2*=2bQ1* 或者Q1*=(a-c-bQ2*)/2b。 讓我們記這個最優(yōu)反應(yīng)函數(shù)為R1。對稱的推理
40、R2的最優(yōu)反應(yīng)函數(shù)也有:10 寡頭、關(guān)稅、犯罪與懲罰 我們把這兩個最優(yōu)反應(yīng)函數(shù)的圖像進(jìn)行合并。10 寡頭、關(guān)稅、犯罪與懲罰 Q2 Q1 (a-c)/b(a-c)/2b(a-c)/b(a-c)/2b注意唯一的一對生產(chǎn)數(shù)量Q1*和Q2*,反應(yīng)函數(shù)在該點(diǎn)相交。因此這是一對滿足下列條件的產(chǎn)量:R2(Q1*)=Q2* R1(Q2*)=Q1* 換言之,這一對產(chǎn)量就是該博弈的古諾-納什均衡。經(jīng)過計算得出如下均衡的產(chǎn)量、價格和利潤:每家公司的生產(chǎn)數(shù)量 價格 每家公司的利潤 (a-c)/3b (a/3)+(2c/3) (a-c)2/9b 10 寡頭、關(guān)稅、犯罪與懲罰 卡特爾解。作為對比,如果兩家公司如卡特爾一樣
41、運(yùn)作,即如果它們對各自的生產(chǎn)決策進(jìn)行協(xié)調(diào)我們來計算它們將生產(chǎn)的產(chǎn)量。如果兩個公司共謀,可以合理地假設(shè),它們以最大化它們的聯(lián)合利潤,設(shè)置它們的生產(chǎn)目標(biāo)。它們預(yù)先指定生產(chǎn)“配額”為Q1和Q2,它們的選擇是使得總利潤最大化:換言之,這一對產(chǎn)量就是該博弈的古諾-納什均衡。經(jīng)過計算得出如下均衡的產(chǎn)量、價格和利潤:10 寡頭、關(guān)稅、犯罪與懲罰 卡特爾解問題與最優(yōu)反應(yīng)問題之間的區(qū)別在于,在此兩家公司明確主張它們的利潤是由它們的總產(chǎn)量確定的。使利潤最大化的總產(chǎn)量也由一階條件確定:a-c-2bQ2=2bQ1 a-c-2bQ1=2bQ2 這兩個公式可以用來解卡特爾的產(chǎn)量、價格和利潤:每家公司的生產(chǎn)數(shù)量 價格 每家
42、公司的利潤 (a-c)/4b (a+c)/2 (a-c)2/8b 古諾納什均衡: (a-c)/3b (a/3)+(2c/3) (a-c)2/9b10 寡頭、關(guān)稅、犯罪與懲罰 卡特爾的產(chǎn)量、價格和利潤:每家公司的生產(chǎn)數(shù)量 價格 每家公司的利潤 (a-c)/4b (a+c)/2 (a-c)2/8b 古諾-納什均衡: (a-c)/3b (a/3)+(2c/3) (a-c)2/9b注意,如果兩家公司像卡特爾一樣經(jīng)營,它們的產(chǎn)量將會少一些??ㄌ貭柈a(chǎn)量是古諾-納什均衡產(chǎn)量的75%。而在卡特爾的每家公司的利潤較高。10 寡頭、關(guān)稅、犯罪與懲罰 人們自然會提出一個問題,為什么兩家公司不去通過削減產(chǎn)量增加利潤呢
43、?如同囚徒困境一樣,答案是對群體好的事情,對個體未必也好。如果公司試圖像卡特爾那樣生產(chǎn),每家公司都將存在激勵或者動機(jī),欺騙對方,并在另一家公司蒙受損失的情況下,增加自己的利潤。實(shí)際上,如果公司2生產(chǎn)卡特爾的產(chǎn)量(a-c)/4b,由公司1的反應(yīng)函數(shù)計算得出,公司1的最大化產(chǎn)量是3(a-c)/8b。當(dāng)Q1增加而Q2并不增加時,公司2毋庸置疑會變得更糟。因?yàn)椋袌鰞r格下跌了,而公司2銷售了完全相同的數(shù)量。10 寡頭、關(guān)稅、犯罪與懲罰 假如我們有規(guī)模為y的公共資源。兩個參與人各可以瓜分一個非負(fù)量(c1和c2)用于消費(fèi)。假設(shè)c1+c2y。當(dāng)總的消費(fèi)量小于y時,剩余量y-(c1+c2)是未來消費(fèi)的基礎(chǔ)。在
44、第二周期,他們平分余下的總量,每人得到y(tǒng)-(c1+c2)/2。參與人1的最優(yōu)反應(yīng)問題是:Maxc1 logc1+logy-(c1+c2)/2由一階條件,參與人1的最優(yōu)反應(yīng)數(shù)量為:1/c1=1/y-(c1+c2)R1(c2)=(y-c2*)/2代入反應(yīng)函數(shù),我們可以計算得到納什均衡為:c1*=c2*=y/3應(yīng)用:公共問題 社會最優(yōu)性。兩個參與人的效用之和最大化,即如果它們是下述問題的解:Maxc1,c2 logc1+logc2+2logy-(c1+c2)/2這種方法可以求得社會最優(yōu)解為:c1*=c2*=y/4注意,在這種情況下,正好一半資源用于第一個周期。與納什均衡相比,那里用于第一個周期的資源
45、,有2/3之多。在這個意義上,在納什均衡中,我們對資源存在過度的榨取,即我們經(jīng)受了公地悲劇。應(yīng)用:公共問題 11 混合策略納什均衡 有些博弈并不存在納什均衡。看看以下的賭便士游戲。在這個博弈中,沒有穩(wěn)定的策略組合。因?yàn)槊總€組合都有一個“贏家”和一個“輸家”。在賭便士游戲中,各個參與人隨機(jī)采取策略是可行的。以1/2的概率選擇每種純策略看來似乎不錯。事實(shí)上,這樣的策略組合從混合策略的角度看是一個納什均衡。 在對手以相同的概率選擇H和T的情況下,該參與人選擇策略H和T的收益是一樣的。因此,他的所有策略都是最優(yōu)反應(yīng)。包括在H和T之間以相同的概率進(jìn)行選擇的混合策略。11 混合策略納什均衡12H T H
46、1,-1-1,1 T -1,1 1,-1一般情況下,納什均衡的概念可以擴(kuò)展到混合策略。一個混合策略納什均衡,是具有這樣特性的一個混合策略組合,在給定其他參與人的策略的情況下,沒有參與人可以通過改變策略來增加自己的收益。考慮策略組合=(1,2,n),其中對于每一個參與人i, iSi。當(dāng)且僅當(dāng)ui(i,-i)ui(si,-i)對于任何siSi和每一個參與人i都成立時,組合是一個混合策略納什均衡。也就是說,對于每一個參與人i來說,i是-i的最優(yōu)反應(yīng)。11 混合策略納什均衡 考慮兩個公司之間的游說博弈。游說的成本是15。如果兩個公司進(jìn)行游說,或者沒有公司進(jìn)行游說,每個公司都獲得10。如果只有公司Y進(jìn)行
47、游說,收益為30。如果只有X進(jìn)行游說,收益為40??梢宰C明這個博弈有兩個純策略納什均衡,(N,L)和(L,N)。 除了這些純策略均衡,還存在一個混合策略均衡。11 混合策略納什均衡XYL N L -5,-525,0 N 0,15 10,10除了這些純策略均衡,還存在一個混合策略均衡。假設(shè)公司X混合采取L和N,通過采取L的期望收益,必須等于N取得的期望收益,否則公司X會嚴(yán)格偏好于選擇L和N。但是,公司X的策略L和N如何能夠得到同樣的期望收益?一定是Y的行動導(dǎo)致這樣的期望。因?yàn)槿绻鸜采取純策略,那么X一定會嚴(yán)格偏好一種策略。用q表示公司Y采取L的概率,即(q,1-q)是公司Y的混合策略。在這個策略
48、下,公司X選擇L可以期望獲得q(-5)+(1-q)(25),而選擇N時等于q(0)+(1-q)(10)。如果公司X愿意采取混合策略,則一定有25-30q=10-10q。簡化可得q=3/4。11 混合策略納什均衡XYL N L -5,-525,0 N 0,15 10,10我們繼續(xù)分析Y的動機(jī)。用p表示公司X取L的概率。如果Y選擇L可以期望獲得p(-5)+(1-p)(15),而選擇N時等于10-10p。如果15-20p=10-10p,公司Y在兩個策略之間選擇,就沒有差別。簡化可得p=1/2。混合策略組合(1/2,1/2),(3/4,1/3)是混合策略納什均衡。給定公司Y的混合策略的情況下,公司X的
49、混合策略是最優(yōu)反應(yīng)。實(shí)際上,對于公司X來說,每一個策略都是最優(yōu)反應(yīng)。11 混合策略納什均衡XYL N L -5,-525,0 N 0,15 10,10我們在構(gòu)建一個混合策略納什均衡時,出現(xiàn)了一個有趣的新變化。我們尋找一個參與人的混合策略,使得另一個參與人對自己的各個純策略之間的選擇,沒有偏好差別。這是計算混合策略均衡的最好的方法。注意,每一個純策略的均衡,也可以看作是混合策略的均衡。因此目前分析的所有博弈,至少會有一個均衡。事實(shí)上,這是一個一般性的結(jié)論。這個結(jié)論相當(dāng)有用,它保證了納什均衡概念,為每一個有限博弈提供預(yù)測。11 混合策略納什均衡 13 靜態(tài)環(huán)境下的合同、法律和執(zhí)行 正如納什均衡概念
50、中提到的,有許多機(jī)制有助于聯(lián)結(jié)行為和信念,以獲得一致性的結(jié)果。特別地,締約機(jī)制在我們的社會中主導(dǎo)著非常廣泛的關(guān)系。締約不僅僅用于防止策略不確定。締約也有助于解決其他兩種決策情形的矛盾。在本章,我們將解釋如何用博弈論定義和研究合同。對于兩個或者兩個以上的經(jīng)濟(jì)人之間互動,如果各方帶有某種刻意的合作,為他們之間的關(guān)系設(shè)定條款,我們就稱之為合同關(guān)系。他們協(xié)定的某些方面,可能包括第三方的作用。例如判決或仲裁等。我們可以認(rèn)為,外部參與人是根據(jù)對他來說,可證實(shí)的關(guān)于合同的信息采取行動的。13 靜態(tài)環(huán)境下的合同、法律和執(zhí)行在博弈論中,有三種合同執(zhí)行的方法需要區(qū)分。首先,如果各參與人有個人動機(jī)遵守合同條款,我們
51、就說這個合同是自我實(shí)施的。如果各參與人通過外部參與人的行動,會服從合同。我們稱該合同是外部實(shí)施的。最后,通過合同的執(zhí)行與協(xié)定本身是同步發(fā)生的,我們就稱該合同是自動實(shí)施的。為了說明前兩種方法,并且引出締約制度的更深層次的問題,我們來思考一個特定的例子。假設(shè)杰西卡和馬克想重新裝修他們的家。馬克(1)是一個建筑師。裝修承包商是丹尼(2)。13 靜態(tài)環(huán)境下的合同、法律和執(zhí)行對于馬克來說,已一個建筑師的職責(zé)投入努力,是需要成本的。但這會使丹尼的工作容易。丹尼的投入是指花費(fèi)在提高裝修質(zhì)量的努力。下圖為基本博弈。讓我們集中考慮z1+z2x1+y2,z1+z2x2+y1,且z1+z20的情況。這意味著各參與人
52、的收益總合,在采取(I,I)時達(dá)到最大化。事實(shí)上,如果各參與人之間允許進(jìn)行貨幣的轉(zhuǎn)移支付,那么(I,I)組合是這個基本博弈的唯一的一個有效率的結(jié)果。我們的基本問題是,假設(shè)(I,I)是最好的結(jié)果,各參與人是否可以執(zhí)行一個規(guī)定采取(I,I)的合同? 13 靜態(tài)環(huán)境下的合同、法律和執(zhí)行12I N I z1,z2 y1,x2 N x1,y2 0,0只要(I,I)是一個納什均衡,采取(I,I)的協(xié)定就是自我實(shí)施合同。而這只有當(dāng)z1x1和z2x2的情況下才成立。但是,如果其中有一個不成立,那么各個參與人就無法依靠合同的自我實(shí)施去維持(I,I)的結(jié)果。他們需要第三方的加入,這有助于改變博弈的性質(zhì)。 法庭就是
53、作為這樣一種第三方存在的。 如果一方選擇了N,法庭的涉入可以在他們之間,強(qiáng)制進(jìn)行貨幣收益的轉(zhuǎn)移支付。用m表示法庭所要求的轉(zhuǎn)移支付。假設(shè)轉(zhuǎn)移支付是從丹尼到馬克。如果mx1+y2 和 z1+z2x2+y1它們正好是當(dāng)(I,I)有效率時所滿足的條件。13 靜態(tài)環(huán)境下的合同、法律和執(zhí)行12I N I z1,z2 z1, x2+y1-z1N x1+y2 z2,z2 0,012I N I z1,z2 y1+, x2-N x1+,y2 - ,-結(jié)論:在下圖的基本博弈的預(yù)期利益賠償原則下,當(dāng)且僅當(dāng)(I,I)是有效率的時候,(I,I)是可執(zhí)行的。該結(jié)論意味著預(yù)期利益賠償,緩解了個人和集體動機(jī)之間的矛盾。事實(shí)上,
54、即使參與人在締約時并不知道xi,yi和zi的值,預(yù)期損失仍然會激勵有效率的結(jié)果。但是,要得到預(yù)期值需要大量信息。首先,法庭必須能夠確認(rèn)誰違約。其次,參與人決定是否投入之前,必須知道收益參數(shù)的值。第三,也是最關(guān)鍵的是,法庭必須能夠確定基本博弈中,違約與未違約結(jié)果中雙方的收益(即zi和yi) 13 靜態(tài)環(huán)境下的合同、法律和執(zhí)行12I N I z1,z2 y1,x2 N x1,y2 0,0第二種違約補(bǔ)償非常適用于zi無法觀察的情況。 在信賴?yán)鎿p害賠償原則下,法庭實(shí)施的轉(zhuǎn)移,使得原告能夠獲得他在沒有簽署合同情況下的收益。也就是說,法庭將確定銀行在沒有合同的情況下可以取得的收益,然后法庭實(shí)施轉(zhuǎn)移,將使
55、得原告獲得的總收益,達(dá)到這個水平。例如,當(dāng)馬克為他的房屋畫出詳細(xì)的裝修設(shè)計圖時,如果對方?jīng)]有遵循合同,他應(yīng)該為他的投入得到補(bǔ)償。 我們確定“沒有合同”的方法是,假設(shè)基本博弈分別以有合同存在和沒有合同存在的方式進(jìn)行。在這種情況下,沒有合同存在意味著,基本博弈會采取納什均衡策略組合的方式。假定yi0。(N,N)是基本博弈的納什均衡,這是我們對無合同結(jié)果的預(yù)測。 13 靜態(tài)環(huán)境下的合同、法律和執(zhí)行根據(jù)左下圖,信賴?yán)鎿p害賠償意味著=y2和=-y1。引發(fā)博弈如右下圖所示。注意,當(dāng)且僅當(dāng)z1x1+y2 和z2x2+y1時,(I,I)是引發(fā)博弈的納什均衡。13 靜態(tài)環(huán)境下的合同、法律和執(zhí)行12I N I
56、z1,z2 y1+, x2-N x1+,y2 - ,-12I N I z1,z2 0, x2+y1N x1+y2,0 0,0違約情況下普遍采用的第三種法律原則指的是回復(fù)原狀賠償,這種原則是通過取消被告因違約而牟取的,相對于無合同情況下所增加的不當(dāng)?shù)美妹?。違約價值x2代表了丹尼可以在合同中獲得的不當(dāng)?shù)美??;貜?fù)原狀賠償意味著=-x1,=x2。所得到的引發(fā)博弈形式如下圖所示。注意,當(dāng)且僅當(dāng)z10,z20時,(I,I)是引發(fā)博弈的納什均衡。13 靜態(tài)環(huán)境下的合同、法律和執(zhí)行12I N I z1,z2 x2+y1,0N 0,x1+y2 0,0當(dāng)zi無法進(jìn)行準(zhǔn)確估計時,法庭會采取信賴?yán)婊蛘呋貜?fù)原狀檢
57、驗(yàn)。信賴原則要求法庭知道原告與合同相關(guān)的花費(fèi),以及原告的機(jī)會成本的價值。回復(fù)原狀原則需要有被告不當(dāng)?shù)美南嚓P(guān)知識。各種復(fù)雜的因素經(jīng)常使得收益參數(shù)的估計變得非常困難。13 靜態(tài)環(huán)境下的合同、法律和執(zhí)行14 擴(kuò)展型表示的細(xì)節(jié)說明 14 擴(kuò)展型表示的細(xì)節(jié)說明ab c 繼續(xù)分析擴(kuò)展型博弈之前,我們詳細(xì)說明它的技術(shù)細(xì)節(jié)。博弈樹是由分支所連接的結(jié)點(diǎn)組成。每一個分支都是一個箭頭,從一個節(jié)點(diǎn)指向另一個節(jié)點(diǎn)。因此,你可以從某個節(jié)點(diǎn)開始,通過后續(xù)的一系列箭頭,來追溯博弈樹中的路線??梢酝ㄟ^這種方式達(dá)到的節(jié)點(diǎn),稱為從開始節(jié)點(diǎn)的后續(xù)節(jié)點(diǎn)。 從某節(jié)點(diǎn)出發(fā)的分支,指向的是它的直接后續(xù)節(jié)點(diǎn)。 終止點(diǎn) 初始點(diǎn) 同樣,從某一個
58、節(jié)點(diǎn)出發(fā),沿著博弈樹的箭頭反方向倒推,我們可以定義出這個節(jié)點(diǎn)的前置節(jié)點(diǎn)和直接前置節(jié)點(diǎn)。博弈樹規(guī)則。博弈樹規(guī)則1:每一個節(jié)點(diǎn)都是初始節(jié)點(diǎn)的后續(xù)節(jié)點(diǎn),同時,初始節(jié)點(diǎn)是唯一具有一特性的節(jié)點(diǎn)。博弈樹規(guī)則2:除初始節(jié)點(diǎn)之外的任一節(jié)點(diǎn),都只有一個直接前置節(jié)點(diǎn)。初始節(jié)點(diǎn)沒有前置節(jié)點(diǎn)。博弈樹規(guī)則3:同一個節(jié)點(diǎn)引出的多個分支,具有不同的行動標(biāo)簽。14 擴(kuò)展型表示的細(xì)節(jié)說明信息集表示參與人必須在此作出決定的位置。正式地說,一個信息集指的是一個參與人在決策時,無法進(jìn)行區(qū)分的節(jié)點(diǎn)集合。博弈樹規(guī)則4:每一個信息集只包含一個參與人的決策點(diǎn)。以下的博弈樹是錯誤的。博弈樹規(guī)則5:某個信息集中的所有節(jié)點(diǎn),必須具有相同數(shù)量的直接
59、后續(xù)節(jié)點(diǎn),而且其中的所有節(jié)點(diǎn)是通過具有相同集合行動標(biāo)簽的分支,而達(dá)到這些后續(xù)節(jié)點(diǎn)的。14 擴(kuò)展型表示的細(xì)節(jié)說明14 擴(kuò)展型表示的細(xì)節(jié)說明1 信息集表示參與人必須在此作出決定的位置。正式地說,一個信息集指的是一個參與人在決策時,無法進(jìn)行區(qū)分的節(jié)點(diǎn)集合。博弈樹規(guī)則4:每一個信息集只包含一個參與人的決策點(diǎn)。以下的博弈樹是錯誤的.1 2 ab14 擴(kuò)展型表示的細(xì)節(jié)說明2 博弈樹規(guī)則5:某個信息集中的所有節(jié)點(diǎn),必須具有相同數(shù)量的直接后續(xù)節(jié)點(diǎn),而且其中的所有節(jié)點(diǎn)是通過具有相同集合行動標(biāo)簽的分支,而達(dá)到這些后續(xù)節(jié)點(diǎn)的。 規(guī)則5背后的機(jī)制是,如果一個參與人在節(jié)點(diǎn)a和b上可以選擇的行動是不同的,那么它一定可以區(qū)
60、分這兩個節(jié)點(diǎn)。因此下圖是錯誤的。1 ab14 擴(kuò)展型表示的細(xì)節(jié)說明1 假設(shè)參與人記得它們自己過去的行動,以及它們已經(jīng)觀察到的任何事件,在一般情況下是合理的。滿足這一假設(shè)的博弈稱為具有完美記憶的。下圖描述了一種不完美記憶的情形。1 abUDXYXY15 逆向歸納法和子博弈完美均衡 15 逆向歸納法和子博弈完美均衡標(biāo)準(zhǔn)型博弈最適用于所有參與人同時和獨(dú)立作出決定的博弈。 我們現(xiàn)在開始考慮具有有趣動態(tài)特性的博弈。對于這種博弈,擴(kuò)展型可以最明確地刻畫行動的順序和信息結(jié)構(gòu)。我們觀察下列博弈。如果參與人1(進(jìn)入者)選擇進(jìn)入市場,參與人2(在位者)必須選擇是否進(jìn)行價格戰(zhàn)。通過對標(biāo)準(zhǔn)型的觀察,可以很快發(fā)現(xiàn)這個博
溫馨提示
- 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
- 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
- 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
- 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負(fù)責(zé)。
- 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請與我們聯(lián)系,我們立即糾正。
- 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時也不承擔(dān)用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。
最新文檔
- 合同范本水印去掉
- 中藥苗代銷合同范本
- 肺炎研究課題申報書
- 員工餐具采購合同范本
- 住房調(diào)換合同范本
- 煤礦研究課題申報書
- 廚房廚具采購合同范本
- 醫(yī)師勞動合同范本診所
- 南昌市商品房預(yù)售合同范本
- 合伙式經(jīng)營合同范本
- 中央2025年交通運(yùn)輸部所屬事業(yè)單位招聘261人筆試歷年參考題庫附帶答案詳解
- 云南省昆明市2025年中考語文模擬試卷六套【附參考答案】
- 中智集團(tuán)所屬中智國際商務(wù)發(fā)展限公司招聘高頻重點(diǎn)提升(共500題)附帶答案詳解
- 2024年廣東省《輔警招聘考試必刷500題》考試題庫含答案
- 【9語一?!?024年蚌埠市懷遠(yuǎn)縣中考一模語文試題
- 《芮城花椒栽培技術(shù)規(guī)程》
- 《智能制造技術(shù)基礎(chǔ)》課件-第1章 智能制造技術(shù)概述
- 《零售基礎(chǔ)》課件-第一章 零售概述
- 專項(xiàng)10:文言文-【中職專用】2025年職教高考學(xué)業(yè)考試語文二輪專項(xiàng)突破(福建專用)
- 國網(wǎng)基建安全管理課件
- 10.1.2事件的關(guān)系和運(yùn)算(教學(xué)課件)高一數(shù)學(xué)(人教A版2019必修第二冊)
評論
0/150
提交評論