博弈論與信息經(jīng)濟(jì)學(xué)混合均衡_第1頁(yè)
博弈論與信息經(jīng)濟(jì)學(xué)混合均衡_第2頁(yè)
博弈論與信息經(jīng)濟(jì)學(xué)混合均衡_第3頁(yè)
博弈論與信息經(jīng)濟(jì)學(xué)混合均衡_第4頁(yè)
博弈論與信息經(jīng)濟(jì)學(xué)混合均衡_第5頁(yè)
已閱讀5頁(yè),還剩71頁(yè)未讀, 繼續(xù)免費(fèi)閱讀

下載本文檔

版權(quán)說(shuō)明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請(qǐng)進(jìn)行舉報(bào)或認(rèn)領(lǐng)

文檔簡(jiǎn)介

1、博弈論與信息經(jīng)濟(jì)學(xué)第2章 完全但不完美信息靜態(tài)博弈-2混合戰(zhàn)略納什均衡主要內(nèi)容 占優(yōu)戰(zhàn)略均衡、重復(fù)剔除的占優(yōu)均衡 納什均衡 庫(kù)諾特寡頭競(jìng)爭(zhēng)模型 混合戰(zhàn)略納什均衡 納什均衡的存在性和多重性 聚點(diǎn)均衡和相關(guān)均衡純戰(zhàn)略納什均衡 納什均衡定義為一個(gè)滿足所有參與人的效用最大化要求的戰(zhàn)略組合,即(s1*,.,si*, .,sn*)是一個(gè)納什均衡,當(dāng)且僅當(dāng)對(duì)于所有的i,si* argmax ui(si,s-i*)。 根據(jù)這一定義,有些博弈不存在納什均衡。社會(huì)福利博弈 參與人:政府和一個(gè)流浪漢 博弈規(guī)則:流浪漢有兩個(gè)戰(zhàn)略: 尋找工作或游蕩;政府也有兩個(gè)戰(zhàn)略: 救濟(jì)或不救濟(jì)。政府想幫助流浪漢,但前提是后者必須試

2、圖尋找工作,否則,前者不予幫助;而流浪漢只有在得不到政府救濟(jì)時(shí)才會(huì)尋找工作。政府和流浪漢同時(shí)選擇各自的戰(zhàn)略或行動(dòng)。 表1.12給出了這個(gè)博弈的支付矩陣。 既沒(méi)有占優(yōu)戰(zhàn)略組合,也沒(méi)有純戰(zhàn)略納什戰(zhàn)略組合。純戰(zhàn)略與混合戰(zhàn)略 純戰(zhàn)略(pure strategy):如果一個(gè)戰(zhàn)略規(guī)定參與人在每一個(gè)給定的信息情況下只選擇一種特定的行動(dòng),我們稱該戰(zhàn)略為純戰(zhàn)略,si: i ai。 混合戰(zhàn)略(mixed strategy):如果一個(gè)戰(zhàn)略規(guī)定參與人在每一個(gè)給定信息情況下以某種概率分布隨機(jī)地選擇不同的行動(dòng),我們稱該戰(zhàn)略為混合戰(zhàn)略,si: i m(ai),其中m0, Ai m(ai)dai=1。 在博弈的戰(zhàn)略式表述中,

3、混合戰(zhàn)略可以定義為在純戰(zhàn)略空間上的概率分布。在靜態(tài)博弈里,純戰(zhàn)略等價(jià)于特定的行動(dòng),混合戰(zhàn)略是不同行動(dòng)之間的隨機(jī)選擇(randomization)戰(zhàn)略。 混合戰(zhàn)略 定義: 在n個(gè)參與人博弈的戰(zhàn)略式表述G = S1, ., Sn;u1, ., un中,假定參與人i有K個(gè)純戰(zhàn)略: Si = si1, ., siK,那么,概率分布i = (i1,., iK)稱為i的一個(gè)混合戰(zhàn)略,這里ik =(sik)是i選擇Sik的概率,對(duì)于所有的k = 1,., K,0ik 1,1Kik = 1。 純戰(zhàn)略可以理解為混合戰(zhàn)略的特例,比如說(shuō),純戰(zhàn)略si1等價(jià)于混合戰(zhàn)略i = (1,0,.,0),即選擇純戰(zhàn)略si1的概率

4、為1,選擇任何其他純戰(zhàn)略的概率為0。 混合戰(zhàn)略空間 i代表i的混合戰(zhàn)略空間(ii), i = 1i,2i,。 = (1,., i, ., n)代表混合戰(zhàn)略組合(mixed strategy profile),其中i為i的一個(gè)混合戰(zhàn)略, = 1ni代表混合戰(zhàn)略組合空間() = 1,2,。笛卡爾積 笛卡爾積(Cartesian product)是一種用給定的集合構(gòu)造新集合的方法,用n元組的集合來(lái)定義。 設(shè)A1, A2, , An是n個(gè)任意集合, A1, A2, , An的卡氏積定義為所有由第一個(gè)元素a1取自A1,第二個(gè)元素a2取自A2,第n個(gè)元素an取自An的序列n元組(a1, a2, , an)

5、構(gòu)成的集合,記為A1A2An或Ai,i = 1, 2, , n。 Ren Descartes(1596-1650)是法國(guó)數(shù)學(xué)家、哲學(xué)家、物理學(xué)家、生理學(xué)家、心理學(xué)家、天文學(xué)家,解析幾何的創(chuàng)始人。集合與n元組 一些對(duì)象組成的全體就是一個(gè)集合,這些對(duì)象稱為集合的元素。N,Z,R分別表示由自然數(shù),整數(shù)和實(shí)數(shù)組成的集合,表示不含任何元素的空集。當(dāng)一個(gè)對(duì)象a是集合A的元素時(shí),記為aA。集合的表示方法是把元素放在花括號(hào)中。 集合中的元素是無(wú)次序的,而元素間的次序常常是非常重要的。由若干個(gè)元素組成的有序結(jié)構(gòu),稱為n元組,如(a1, a2, , an)是由n個(gè)元素a1, a2, , an組成,其中a1是第一個(gè)

6、元素, a2是第二個(gè)元素,an是第n個(gè)元素?;旌蠎?zhàn)略的期望效用混合戰(zhàn)略的期望效用 與混合戰(zhàn)略相伴隨的是支付的不確定性,因?yàn)橐粋€(gè)參與人并不知道其他參與人的實(shí)際戰(zhàn)略選擇。 我們用i() =i(i, -i)表示參與人i的期望效用函數(shù)(其中,-i = (1,., i-1, i+1, ., n)是除i之外所有其他參與人的混合戰(zhàn)略組合),i可以定義為: n i(i,-i) = (j(sj)ui(s) sS j=1 兩人博弈 假定參與人1有K個(gè)純戰(zhàn)略,參與人2有J個(gè)純戰(zhàn)略,即S1 = s11, ., s1K,S2 = s21, ., s2J。 如果參與人1相信參與人2的混合戰(zhàn)略為2 = (21,., 2J)

7、,那么,參與人1選擇純戰(zhàn)略s1k的期望效用為: J 1(s1k,2) = 2ju1(s1k, s2j) j=1 兩人博弈 參與人1選擇混合戰(zhàn)略1 = (11,., 1K)的期望效用為 K J 1(1, 2) = 1k 2ju1(s1k,s2j) k=1 j=1 K J = 1k2ju1(s1k,s2j) k=1 j=1 這里,1k2j是參與人1選擇s1k且參與人2選擇s2j的概率,即純戰(zhàn)略組合(s1k, s2j)發(fā)生的聯(lián)合概率。 兩人博弈 如果參與人1選擇1= (11,.,1K),參與人2選擇2 = (21,.,2J),參與人2的期望效用為: J K 2(1, 2) = 2j 1ku2(s1k

8、,s2j) j=1 k=1 K J = 1k2ju2(s1k,s2j) k=1 j=1兩人博弈的混合戰(zhàn)略納什均衡 在兩人博弈里,混合戰(zhàn)略納什均衡是兩個(gè)參與人的最優(yōu)混合戰(zhàn)略的組合,這里,最優(yōu)混合戰(zhàn)略是指使期望效用函數(shù)最大化的混合戰(zhàn)略(給定對(duì)方的混合戰(zhàn)略)。換言之,如果* = (1*, 2*)是一個(gè)納什均衡,它必須滿足: 1(1*, 2*)1(1, 2*),11 2(1*, 2*)2(1*, 2),22混合戰(zhàn)略納什均衡 定義: 在n個(gè)參與人博弈的戰(zhàn)略式表述G = S1, ., Sn;u1, ., un中,混合戰(zhàn)略組合* = (1*,.,i* .,n*)是一個(gè)納什均衡,如果對(duì)于所有的i = 1,2,

9、., n, i(i*, -i*)i(i, -i*), ii 每個(gè)參與人的期望效用是自己的混合概率的線性函數(shù) 這一點(diǎn)意味著,如果i = (i1,., iK)是相對(duì)于給定-i的一個(gè)最優(yōu)混合戰(zhàn)略,那么,對(duì)于所有的ik 0,下面的期望效用不等式成立: i(sik,-i)i(sik,-i), sikSi 就是說(shuō),如果i = (i1,., iK)是相對(duì)于給定-i的一個(gè)最優(yōu)混合戰(zhàn)略,并且如果這個(gè)混合戰(zhàn)略規(guī)定i以嚴(yán)格正的概率選擇純戰(zhàn)略sik,那么,sik本身一定是相對(duì)于-i的一個(gè)最優(yōu)戰(zhàn)略。 ik 0 ?, 即混合戰(zhàn)略規(guī)定以非嚴(yán)格正的概率選擇sik。若ik等于0,則上式嚴(yán)格不等式成立,sik不進(jìn)入混合戰(zhàn)略;若i

10、k不等于0,則上式的等式成立,sik進(jìn)入混合戰(zhàn)略。兩人博弈 在兩人博弈情況下,如果1是相對(duì)于2 = (21,.,2J)的最優(yōu)戰(zhàn)略,1k 0,則意味著: J J 2ju1(s1k ,s2j)2ju1(s1k,s2j),s1kS1 j=1 j=1 其中,若1k等于0,則上式嚴(yán)格不等式成立,s1k不進(jìn)入混合戰(zhàn)略;若1k不等于0,則上式的等式成立,s1k進(jìn)入混合戰(zhàn)略。無(wú)差異性 進(jìn)一步,因?yàn)樗幸哉母怕蔬M(jìn)入最優(yōu)混合戰(zhàn)略的純戰(zhàn)略都是最優(yōu)戰(zhàn)略,它們的期望效用是相同的,參與人在所有這些純戰(zhàn)略之間一定是無(wú)差異的。就是說(shuō),如果i1 0, ., iK 0,那么, i(si1,-i)=i(si2,-i)=.=i(s

11、iK,-i) 反過(guò)來(lái),若參與人有幾個(gè)純戰(zhàn)略是最優(yōu)的,它們的期望效用是相同的,那么,任何以正的概率選擇其中一些或所有這些純戰(zhàn)略的混合戰(zhàn)略也是最優(yōu)的?;旌蠎?zhàn)略納什均衡 根據(jù)上述道理,納什均衡也可以表述如下: 定義: * = (1*,.,i* .,n*)是一個(gè)納什均衡,如果對(duì)于所有的參與人i, i(i*, -i*)i(sik, -i*), sikSi 若ik等于0,則上式嚴(yán)格不等式成立,sik不進(jìn)入混合戰(zhàn)略;若ik不等于0,則上式的等式成立,sik進(jìn)入混合戰(zhàn)略?;旌蠎?zhàn)略嚴(yán)格占優(yōu)純戰(zhàn)略如果選擇Defense,行參與人可以保證獲得支付1。但是,如果采取混合戰(zhàn)略(0.5North, 0.5South, 0

12、Defense),如果列參與人以N的概率選擇North,以(1-N)的概率選擇South,行參與人的支付是2。所以,不論列參與人的反應(yīng)如何,行參與人選擇混合戰(zhàn)略的期望支付大于選擇純戰(zhàn)略Defense的支付。 混合戰(zhàn)略嚴(yán)格占優(yōu)純戰(zhàn)略博弈如何判斷哪個(gè)純戰(zhàn)略不進(jìn)入混合戰(zhàn)略?如何判斷哪個(gè)純戰(zhàn)略不進(jìn)入混合戰(zhàn)略?D是是Row的最劣戰(zhàn)略。的最劣戰(zhàn)略。因?yàn)閰⑴c人1選擇D和參與人2選擇R的概率都是0,所以兩個(gè)參與人只在兩種純戰(zhàn)略間進(jìn)行混合。社會(huì)福利博弈的混合戰(zhàn)略納什均衡 假定政府的混合戰(zhàn)略為G = (,1),即政府以的概率選擇救濟(jì),以(1)的概率選擇不救濟(jì),流浪漢的混合戰(zhàn)略為L(zhǎng) = (,1 -),即流浪漢以的概

13、率選擇尋找工作,以(1-)的概率選擇游蕩。那么,政府的期望效用函數(shù)為: G(G,L)=3+(-1)(1-) +(1-)-1+ 0(1-) =(4 - 1) - (1 ) =(5 - 1) -支付最大化法 對(duì)上述效用函數(shù)求微分,得到政府最優(yōu)化的一階條件為: dG/d = 5 1 = 0 因此, * = 0.2 就是說(shuō),在混合戰(zhàn)略均衡下,流浪漢以0.2的概率選擇尋找工作,以0.8的概率選擇游蕩。支付等值法 假定最優(yōu)混合戰(zhàn)略是存在的?給定流浪漢選擇混合戰(zhàn)略(, 1),政府選擇純戰(zhàn)略救濟(jì)(即=1)的期望效用為: G(1,) = 3 + (-1)(1 -) = 4 - 1 選擇純戰(zhàn)略不救濟(jì)(即=1)的期

14、望效用為: G(0,) = -1 + 0(1 - ) = - 如果一個(gè)混合戰(zhàn)略( 0,1)是政府的最優(yōu)選擇,那一定意味著政府在救濟(jì)與不救濟(jì)之間是無(wú)差異的,即: G(1,) = 4 1 = - =G(0,)支付等值法 上述等式意味著* = 0.2。 就是說(shuō),如果 0.2,政府將選擇救濟(jì);只有當(dāng)= 0.2時(shí),政府才會(huì)選擇混合戰(zhàn)略( 0,1)或任何純戰(zhàn)略。 解政府的最優(yōu)化問(wèn)題,得到流浪漢的均衡混合戰(zhàn)略(0.2,0.8)。支付最大化法 為了找出政府的均衡混合戰(zhàn)略,我們需要求解流浪漢的最優(yōu)化問(wèn)題。給定G = (,1 ), L = (, 1 -),流浪漢的期望效用函數(shù)為: L(G,L)=2+1(1-) +

15、(1-)3+0(1-) =(+1)+3(1) = -(2-1)+3 最優(yōu)化的一階條件為 dL/d= -(21)= 0 因此,* = 0.5 支付最大化法 如果0.5,流浪漢的最優(yōu)選擇是游蕩;只有當(dāng)=0.5時(shí),流浪漢才會(huì)選擇混合戰(zhàn)略( 0,1)或任何純戰(zhàn)略。 納什均衡要求每個(gè)參與人的混合戰(zhàn)略是給定對(duì)方的混合戰(zhàn)略下的最優(yōu)選擇。因此,在社會(huì)福利博弈中,*=0.5,*=0.2是唯一的納什均衡。 就是說(shuō),在均衡情況下,政府以0.5的概率選擇救濟(jì),以0.5的概率選擇不救濟(jì);流浪漢以0.2的概率選擇尋找工作,以0.8的概率選擇游蕩。 0.2以及 0.5都不構(gòu)成納什均衡 假定政府認(rèn)為流浪漢選擇尋找工作的概率嚴(yán)

16、格小于0.2,那么,政府的唯一最優(yōu)的選擇是純戰(zhàn)略不救濟(jì);但如果政府以1的概率選擇不救濟(jì),流浪漢的最優(yōu)選擇是尋找工作,這又將導(dǎo)致政府選擇救濟(jì)的戰(zhàn)略,因此 0.2也不構(gòu)成納什均衡。同樣可以驗(yàn)證 0.5的情形。在支付結(jié)果矩陣中,哪種結(jié)果更有可能出現(xiàn)?非對(duì)稱博弈,均衡結(jié)果不對(duì)稱反應(yīng)對(duì)應(yīng) 上述混合戰(zhàn)略均衡也可以用幾何圖形來(lái)表示。當(dāng)參與人可以選擇混合戰(zhàn)略時(shí),他選擇任何一個(gè)純戰(zhàn)略的概率在0與l之間是連續(xù)的(因而是無(wú)限的),因?yàn)檫@些純戰(zhàn)略的期望效用是相等的。 現(xiàn)在,我們可以使用反應(yīng)對(duì)應(yīng)(reaction correspondence)的概念來(lái)描述一個(gè)參與人對(duì)應(yīng)于其他參與人混合戰(zhàn)略的最優(yōu)選擇。社會(huì)福利博弈的反應(yīng)

17、對(duì)應(yīng)及均衡 政府和流浪漢的反應(yīng)對(duì)應(yīng)分別為, 政府:= 0, if 0.2 流浪漢:= 1, if 0.5 在圖1.5中,我們畫出政府和流浪漢的反應(yīng)曲線。兩條反應(yīng)曲線的交叉點(diǎn)就是納什均衡點(diǎn)。=0=1=0=1反應(yīng)對(duì)應(yīng)與反應(yīng)函數(shù) 反應(yīng)對(duì)應(yīng)允許一個(gè)參與人有多個(gè)(甚至無(wú)窮多個(gè))戰(zhàn)略是其他參與人給定戰(zhàn)略的最優(yōu)選擇。 庫(kù)諾特寡頭競(jìng)爭(zhēng)模型 反應(yīng)函數(shù)(reaction function)表示的是一個(gè)參與人只有一個(gè)特定的戰(zhàn)略是其他參與人給定戰(zhàn)略的最優(yōu)選擇。映射(mapping) 映射(mapping)是把一個(gè)集合中的元素與另一個(gè)集合中的元素聯(lián)系起來(lái)的一種規(guī)則。 設(shè)A和B是任意非空集合,假定有一個(gè)從A到B的聯(lián)系f,

18、對(duì)A中的每一個(gè)元素,B中至多有一個(gè)元素與之建立這種聯(lián)系,或者說(shuō),對(duì)于每個(gè)aA,都存在唯一的bB,使得序偶a, bf,這種聯(lián)系規(guī)則稱為一個(gè)從A到B的映射,記為 f:AB,元素a與b的聯(lián)系記為f(a)=b。 f的定義域就是A本身,不能是A的真子集;f的值域只要求是B的子集。映射或函數(shù) 就映射或函數(shù)而言,對(duì)于A中的每個(gè)元素,有且僅有一條射線由此出發(fā),對(duì)應(yīng)B中唯一的元素(不許一對(duì)多); 而B中的元素,在A中可能沒(méi)有元素或可能有多個(gè)元素與之對(duì)應(yīng)(允許多對(duì)一)。ABfABfABf滿,但不單多對(duì)一單,但不滿一對(duì)一,B中有元素在A中沒(méi)有元素與之對(duì)應(yīng)雙,既單又滿一對(duì)一,B中所有元素在A中都有元素與之對(duì)應(yīng)函數(shù)、映

19、射與對(duì)應(yīng) 映射是通常數(shù)集上函數(shù)的推廣,對(duì)于映射來(lái)說(shuō),A和B中的元素可以不是數(shù)值。 對(duì)于函數(shù)來(lái)說(shuō),集合A和B中的元素(也稱為點(diǎn))通常都是數(shù)值,在這種情況下,如果f把A中的每一點(diǎn)映射到B中的恰好一點(diǎn), f稱為函數(shù)。 函數(shù)和映射只把每一點(diǎn)映射到一點(diǎn),可以一對(duì)一或多對(duì)一,稱為點(diǎn)-點(diǎn)映射或單值映射。 對(duì)應(yīng)是函數(shù)和映射概念的一般化,把一個(gè)集合A中每一點(diǎn)映射到另外一個(gè)集合B中的一點(diǎn)或多點(diǎn)(一對(duì)多),稱為點(diǎn)-集映射或集值映射。數(shù)值對(duì)應(yīng) 給定集合ARN,對(duì)應(yīng)f:ARK是為每一xA指定一個(gè)集合f(x)RK的規(guī)則。 對(duì)于每一xA,如果f(x)由恰好一個(gè)元素構(gòu)成,f(.)可看作通常意義上的函數(shù)。 對(duì)應(yīng)的定義允許f(x

20、)=,通常,我們只考慮對(duì)于每一xA,f(x)的對(duì)應(yīng)。 對(duì)于某種集合YRK,如果對(duì)于每一xA,有f(x)Y,用f:AY來(lái)表示。數(shù)值對(duì)應(yīng)猜謎博弈的納什均衡 每個(gè)參與人的均衡混合戰(zhàn)略是以0.5的概率隨機(jī)地選擇任意一個(gè)純戰(zhàn)略。 對(duì)稱博弈:均衡結(jié)果對(duì)稱混合戰(zhàn)略嚴(yán)格占優(yōu)純戰(zhàn)略博弈如何判斷哪個(gè)純戰(zhàn)略不進(jìn)入混合戰(zhàn)略?如何判斷哪個(gè)純戰(zhàn)略不進(jìn)入混合戰(zhàn)略?D是是Row的最劣戰(zhàn)略。的最劣戰(zhàn)略。混合戰(zhàn)略組合混合戰(zhàn)略組合(1/2N, 1/2S)R, (1/2N, 1/2S)C)是唯一的納什均衡。是唯一的納什均衡。因?yàn)閰⑴c人1選擇D和參與人2選擇R的概率都是0,所以兩個(gè)參與人只在兩種純戰(zhàn)略間進(jìn)行混合,混合戰(zhàn)略均衡為(3/7

21、U,4/7M),(3/7L, 4/7M)。判斷混合戰(zhàn)略是否存在的方法 當(dāng)混合概率計(jì)算為大于1或小于0時(shí),可以認(rèn)為或者建模者犯了計(jì)算錯(cuò)誤,或者博弈沒(méi)有混合戰(zhàn)略均衡。 如果不能確定均衡是否是混合的,可以用這種方法證明博弈沒(méi)有混合戰(zhàn)略均衡。疑問(wèn) 在均衡的情況下,一個(gè)參與人選擇不同純戰(zhàn)略的概率分布不是由他自己的支付決定的,而是由他的對(duì)手的支付決定的。 進(jìn)一步,每個(gè)參與人在所有構(gòu)成均衡的純戰(zhàn)略之間是無(wú)差異的,均衡均衡卻要求每個(gè)參與人以特定的概率選擇純戰(zhàn)略。 既然參與人在構(gòu)成混合戰(zhàn)略的不同純戰(zhàn)略之間是無(wú)差異的,他為什么不選擇一個(gè)特定的純戰(zhàn)略而要以特定的概率隨機(jī)地選擇不同的純戰(zhàn)略呢? 解釋-1-戰(zhàn)略不確定性

22、 如果一個(gè)參與人采取混合戰(zhàn)略,他的對(duì)手就不能準(zhǔn)確地猜出他實(shí)際上會(huì)選擇的純戰(zhàn)略,盡管在均衡點(diǎn),每個(gè)參與人都知道其他參與人選擇不同戰(zhàn)略的概率分布,參與人選擇混合戰(zhàn)略的目的是給其他參與人造成不確定性。 事實(shí)上,正是因?yàn)樗趲讉€(gè)(或全部)戰(zhàn)略之間是無(wú)差異的,他的行為才難以預(yù)測(cè),混合戰(zhàn)略均衡才會(huì)存在。如果他嚴(yán)格偏好于某個(gè)特定的純戰(zhàn)略,他的行為就會(huì)被其他參與人準(zhǔn)確地猜透,就不會(huì)有混合戰(zhàn)略均衡出現(xiàn)。 解釋-2-群體論 流浪漢不是一個(gè),而是一個(gè)群體,他們具有相同的趣味和支付函數(shù),政府必須以相同的方式對(duì)待每一個(gè)流浪漢。 在混合戰(zhàn)略均衡中,一個(gè)流浪漢以20%的概率選擇去工作,以80%概率選擇去流浪。 所以,在流浪

23、漢群體中,有20%的流浪漢選擇去工作,80%的流浪漢選擇去流浪,政府只知道這個(gè)比例,但不知道每一個(gè)流浪漢的實(shí)際偏好。實(shí)際上,對(duì)流浪漢來(lái)說(shuō),這是一個(gè)純戰(zhàn)略均衡。解釋-3 海薩尼(Harsanyi,1973)對(duì)混合戰(zhàn)略的解釋是,混合戰(zhàn)略均衡等價(jià)于不完全信息下的純戰(zhàn)略均衡。 在前例中,假定有兩類特征的流浪漢,一類選擇尋找工作,另一類選擇游蕩;每個(gè)流浪漢都知道自己的特征,但政府并不知道流浪漢的準(zhǔn)確特征,只知道一個(gè)流浪漢有20%的概率屬于第一類,有80%的概率屬于第二類。 在這種情況下,政府在選擇自己的戰(zhàn)略時(shí)似乎面臨的是一位選擇混合戰(zhàn)略的流浪漢。純戰(zhàn)略均衡與混合戰(zhàn)略均衡同時(shí)存在 前面我們討論的是不存在純

24、戰(zhàn)略納什均衡但存在混合戰(zhàn)略納什均衡的博弈。 有些博弈既存在純戰(zhàn)略均衡,也存在混合戰(zhàn)略均衡。所謂的“性別戰(zhàn)”就是這樣一個(gè)博弈。 性別戰(zhàn)說(shuō)的是,一男一女約會(huì),或者去看足球比賽,或者看芭蕾舞演出。男的偏好足球賽,女的偏好芭蕾舞,但他們都寧愿在一起而不愿分開。表1.15給出支付矩陣。 對(duì)稱博弈:不對(duì)稱的純戰(zhàn)略均衡結(jié)果,對(duì)稱的混合戰(zhàn)略均衡結(jié)果純戰(zhàn)略均衡與混合戰(zhàn)略均衡同時(shí)存在 這個(gè)博弈有兩個(gè)純戰(zhàn)略納什均衡:(足球,足球),(芭蕾,芭蕾)。事實(shí)上,這個(gè)博弈還有一個(gè)混合戰(zhàn)略納什均衡,這就是: 男的以2/3的概率選擇足球賽,以1/3的概率選擇芭蕾舞;女的以1/3的概率選擇足球賽,以2/3的概率選擇芭蕾舞。 類似

25、性別戰(zhàn)這種存在兩個(gè)純戰(zhàn)略納什均衡和一個(gè)混合戰(zhàn)略納什均衡的博弈的例子還有斗雞博弈等。 房地產(chǎn)開發(fā)博弈在低需求時(shí),也有兩個(gè)純戰(zhàn)略納什均衡和一個(gè)混合戰(zhàn)略納什均衡。對(duì)稱博弈:不對(duì)稱的純戰(zhàn)略均衡結(jié)果,對(duì)稱的混合戰(zhàn)略均衡結(jié)果奇數(shù)定理,oddness theorem 威爾遜(Wilson,1971)證明,幾乎所有有限博弈都有有限奇數(shù)個(gè)納什均衡。 這一點(diǎn)意味著,一般來(lái)說(shuō),如果一個(gè)博弈有兩個(gè)純戰(zhàn)略納什均衡,那么,一定存在第三個(gè)混合戰(zhàn)略納什均衡。 0, 0-10, 00, -10-8, -8建模者困境列參與人行參與人抵賴坦白抵賴坦白警察沒(méi)有證據(jù),甚至不能拘留小偷。有一個(gè)弱占優(yōu)均衡,同時(shí)是強(qiáng)納什均衡;有一個(gè)弱納什均

26、衡,卻是一個(gè)帕累托占優(yōu)均衡;有沒(méi)有混合戰(zhàn)略均衡?庫(kù)諾特(Cournot)寡頭競(jìng)爭(zhēng)模型 在庫(kù)諾特模型里,有兩個(gè)參與人,分別稱為企業(yè)1和企業(yè)2,每個(gè)企業(yè)的戰(zhàn)略是選擇產(chǎn)量,支付是利潤(rùn),利潤(rùn)是兩個(gè)企業(yè)產(chǎn)量的函數(shù)。 在這個(gè)例子中,參與人的戰(zhàn)略是連續(xù)變量,因而是無(wú)限博弈。 我們用qi0,)代表第i個(gè)企業(yè)的產(chǎn)量,Ci(qi)代表成本函數(shù),P = P(q1 + q2)代表逆需求函數(shù)(P是價(jià)格,Q(P)是原需求函數(shù))。 兩個(gè)企業(yè)的利潤(rùn)函數(shù)為: i(q1, q2) = qiP(q1 + q2) - Ci(qi), i = 1, 2 寡頭競(jìng)爭(zhēng)模型 (q1*,q2*)是納什均衡產(chǎn)量意味著: q1*argmax1(q1

27、,q2*)=q1P(q1+q2*)C1(q1) q2*argmax2(q1*,q2)=q2P(q1*+q2)C2(q2) 找出納什均衡的一個(gè)辦法是對(duì)每個(gè)企業(yè)的利潤(rùn)函數(shù)求一階導(dǎo)數(shù)并令其等于零 d1/dq1=P(q1+q2)+q1P(q1+q2)C1(q1)=0 d2/dq2=P(q1+q2)+q2P(q1+q2)C2(q2)=0寡頭競(jìng)爭(zhēng)模型 上述兩個(gè)一階條件分別定義了兩個(gè)反應(yīng)函數(shù)(reaction function) q1 = R1(q2) q2 = R2(q1) 反應(yīng)函數(shù)意味著每個(gè)企業(yè)的最優(yōu)戰(zhàn)略(產(chǎn)量)是另一個(gè)企業(yè)產(chǎn)量的函數(shù)。兩個(gè)反應(yīng)函數(shù)的交叉點(diǎn)就是納什均衡q* =(q1*,q2*),如圖1.

28、1所示。寡頭壟斷產(chǎn)量完全競(jìng)爭(zhēng)產(chǎn)量納什均衡的多重性 我們說(shuō),只有納什均衡是一致性預(yù)期,任何非納什均衡都不可能成為一致性預(yù)期。不過(guò),事實(shí)上,許多博弈都存在多個(gè)納什均衡,有些博弈甚至有無(wú)窮多個(gè)納什均衡。 考慮兩個(gè)人分一塊蛋糕,每個(gè)人獨(dú)立地提出自己要求的份額。設(shè)x1為第一個(gè)人要求的份額,x2為第二個(gè)人要求的份額,如果x1+x21,每個(gè)人得到自已要求的份額;否則,誰(shuí)也得不到什么。 在這個(gè)博弈中,任何滿足x1+x2=1的(x1,x2)都是納什均衡,因而這個(gè)博弈有無(wú)窮多個(gè)納什均衡,如圖1.9所示(注意,x1+x21不是納什均衡)。預(yù)測(cè)的困境 博弈分析的目的是預(yù)測(cè)參與人的合理行為方式。納什均衡是參與人如何博弈

29、的一致性預(yù)測(cè): 如果所有參與人預(yù)測(cè)一個(gè)特定的納什均衡將出現(xiàn),那么,沒(méi)有人有積極性選擇非納什均衡的戰(zhàn)略,這個(gè)納什均衡就會(huì)實(shí)際出現(xiàn)。 但當(dāng)一個(gè)博弈有多個(gè)納什均衡時(shí),要所有參與人預(yù)測(cè)同一個(gè)納什均衡會(huì)出現(xiàn)是非常困難的。在這種情況下,盡管所有參與人都預(yù)測(cè)納什均衡會(huì)出現(xiàn),但如果不同參與人預(yù)測(cè)的不是同一個(gè)納什均衡,實(shí)際出現(xiàn)的就不是納什均衡,而是非納什均衡。 非合作博弈理論的核心問(wèn)題 說(shuō)納什均衡是一致性預(yù)測(cè)并不意味著納什均衡一定是一個(gè)好的預(yù)測(cè)。正如我們已經(jīng)看到的,一個(gè)非常普遍的現(xiàn)象是一個(gè)博弈可能有多個(gè)納什均衡,如何預(yù)測(cè)哪一個(gè)納什均衡實(shí)際上會(huì)出現(xiàn)? 因此,非合作博弈理論的核心問(wèn)題可表述為:假如一個(gè)博弈有若干個(gè)均

30、衡,理性的參與者究竟應(yīng)該 (或愿意)選擇其中的哪一個(gè)?聚點(diǎn)均衡 當(dāng)一個(gè)博弈有多個(gè)納什均衡時(shí),博弈論并沒(méi)有一般的理論證明納什均衡結(jié)果一定會(huì)出現(xiàn)。 然而,如薩林(Schelling,1960)指出的,在現(xiàn)實(shí)生活中,參與人可能使用某些被博弈模型抽象掉的信息來(lái)達(dá)到一個(gè)“聚點(diǎn)”(focal point)均衡。這些信息可能與社會(huì)文化習(xí)慣、參與人過(guò)去博弈的歷史等有關(guān)。 Thomas Schelling1960年的The Strategy of Conflict是博弈論的經(jīng)典著作,他考察了諸如威脅、承諾、人質(zhì)和代表團(tuán)等戰(zhàn)略問(wèn)題?;蛟S,他最為有名的是協(xié)調(diào)博弈。協(xié)調(diào)博弈-“提名博弈” 在下面的博弈中,如果你選擇的

31、戰(zhàn)略與盡可能多的其他人選擇的戰(zhàn)略相同,你就會(huì)贏得一定獎(jiǎng)勵(lì)。 在以下數(shù)字中選一個(gè): 100, 14, 15, 16, 17, 18. 在以下數(shù)字中選一個(gè): 7, 100, 13, 261, 99, 666. 選擇正面或背面。 選擇背面或正面。 選擇晚上上課的時(shí)間。歷史與邊界 上面的各個(gè)博弈,雖然有許多納什均衡,但是,在或大或小的程度上,它們也有更為可能的納什均衡。某些戰(zhàn)略組合是聚點(diǎn): 出于心理上的原因,特別令人心服的納什均衡。 說(shuō)明什么樣的戰(zhàn)略組合是聚點(diǎn)是很難的,這取決于具體的情景。在重復(fù)博弈中,過(guò)去的歷史常常可以提供聚點(diǎn);邊界是一種特別的聚點(diǎn)。歷史與邊界 如果兩人分一塊蛋糕,他們很可能同意50:50;但是,如果上一次的比例是60:40, 那么這一次這就是一個(gè)聚點(diǎn)。 如果俄羅斯選擇把軍隊(duì)部署在離中國(guó)邊界1寸或100公里的地方,中國(guó)不會(huì)有什么反應(yīng);但是,如果俄羅斯選擇把軍隊(duì)部署在其邊界1寸或100公里以外的地方,中國(guó)就會(huì)宣布進(jìn)入戰(zhàn)爭(zhēng)狀態(tài)。

溫馨提示

  • 1. 本站所有資源如無(wú)特殊說(shuō)明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請(qǐng)下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請(qǐng)聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁(yè)內(nèi)容里面會(huì)有圖紙預(yù)覽,若沒(méi)有圖紙預(yù)覽就沒(méi)有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫(kù)網(wǎng)僅提供信息存儲(chǔ)空間,僅對(duì)用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對(duì)用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對(duì)任何下載內(nèi)容負(fù)責(zé)。
  • 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請(qǐng)與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶因使用這些下載資源對(duì)自己和他人造成任何形式的傷害或損失。

評(píng)論

0/150

提交評(píng)論