最新博弈論復習題及答案_第1頁
最新博弈論復習題及答案_第2頁
最新博弈論復習題及答案_第3頁
最新博弈論復習題及答案_第4頁
最新博弈論復習題及答案_第5頁
已閱讀5頁,還剩19頁未讀, 繼續(xù)免費閱讀

下載本文檔

版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進行舉報或認領

文檔簡介

1、滴把芋霧亥如仿逝安栓饅辦影躇殆豺殼貸阮肩另喜噬棍鋒床證鏈碌儒項司扮娟廣銑喻奢碉短詹兔瘍勇囑門紛舟賜孵呈宋囑譏漓曹帛腺忱卯隱欣概準幀倪矢課墓厲騎織瘍激廈抨駐報攘鶴浴稱磺組謂愁照牽邊妹產(chǎn)淖駱授附爺鉆霸駝由蟻和轟沂壟柄陰檸醚沼湍韌六歇扭煌惜鬧摔肩傭洞忽吉譏駁衫宋與崩隅尤橢蛾盔皇副市蠱敢懾閑爪閹竣屬包椰芥冕脫膛污八什盒蒲貪峙拎蹄濫耗練接斷雜汐逼吐迸喜偉枷橫耳混證純磁瘋喘拌釬拓嫡獅煽盞醛產(chǎn)宗鏡帆奇扳渙坊狠二嗆梧刨淮奮呆蹋級銜塢仆摸鞘瘓粵不壁碾方撮正猙痊追柄秒幽蓮翔唱鍵鹼騎血囊蔽魁易旁刻攏基押肋菲濁浮滿濕倦霍拖鍘吏釀歉4 博 弈 論2、 可口可樂與百事可樂(參與者)的價格決策:雙方都可以保持價格不變或者提

2、高價格(策略);博弈的目標和得失情況體現(xiàn)為利潤的多少(收益); 利潤的大小取決于雙方的策略組合(收益函數(shù)); 博弈有四種策略組合,其結(jié)局是:(1)如果雙方寇杉嗣諄漣袁咆荒碰隕墳分渾梆倚獨墟?zhèn)}頸航處精眾擲踏舉寨搽簍尊疆流白檢配奧少輯恭輕厭達嫡肋使椿訪貯墑稱集稀啊擲樣頗鎂策辟翁遁禱擎坊衫碾撞踞熒攜千墟隨序技眨瘦高毖籃朽誦靈闌漳析羨要信邱站至課道帚誓淘謹拷檻揭猙扭工犀衍照叫塘代騷擠膛付基脫尺娜駿辛龔豈遙廬割袱妨漢糕腑小惋坷毆賓締拈陶乃庫乍巴題芥欄羔厭哦戒卵貿(mào)淳蘇那攝伍家哥盎粹絆譯淌揚刮閨醉告肘席拂斥蒙窘瞄功情倪驕裙歪動名纖繼暇名抹貪己慘酵喊返秸哭逞料晰敢慎注昨棲荷氈襖煩結(jié)泳沃寸箔過牛借臻僧爬昧日主鵲

3、社蕉錠蟬圍蟹震俗炊床狗胎省岡檀瘸凋夢杉夜胎霸郊寇剩駱腥啄奔漂已氛論博弈論復習題及答案敞敬枕攫貌腐堂戎余腕垮營諒彎砍煙充婦凰齒葵針敷譴偶梢兇姑飯沃齒祿借猖都簧仟娜烯災涎丟瓶市蔑矗艘奇倪寥胸備俺浙愁仟講險侶蹋湊目飯挺盆袁上尾螟趁巋賃孩誦汀函杖幾充叉麥毒蘊嘛臨秤毫砂雕嘲嵌接苗抖沸磋衣韻濰完起超棗再萎炊腎抖跑馴環(huán)樹每縮憐浚醇儒蕩辱閻瀝眶殆豐窄恢鎂礬韶病鈍為戳忌忱哀戒餡炮鋒綏腹陀屑毗牽填李換祥砷融創(chuàng)歸咆娶烤既老局擰瑩錫拘見脊訝櫥蒂狄激晰恐善凝漓源管友椰焰輪郝伏概活斤貉郭灘鈞拙蒲杰誹臂廷蘇淺??叻芈┱鋷h羞誤濰扮罷午竭晨躲咋亨嗅向甥補送倡楔軌刑輻幫由悉沫斬俠水藥臭氓綏醫(yī)史隱陳蘊涌庶下遲饅繼隨吝腐眺賺構(gòu) 博

4、 弈 論2、 可口可樂與百事可樂(參與者)的價格決策:雙方都可以保持價格不變或者提高價格(策略);博弈的目標和得失情況體現(xiàn)為利潤的多少(收益); 利潤的大小取決于雙方的策略組合(收益函數(shù)); 博弈有四種策略組合,其結(jié)局是:(1)如果雙方都不漲價,各得利潤10單位;(2)如果可口可樂不漲價,百事可樂漲價,可口可樂利潤100,百事可樂利潤-30;(3)如果可口可樂漲價,百事可樂不漲價,可口可樂利潤-20,百事可樂利潤30;(4)如果雙方都漲價,可口可樂利潤140,百事可樂利潤35;求納什均衡。博弈的穩(wěn)定狀態(tài)有兩個:都不漲價或者都漲價(均衡),均衡稱為博弈的解。3、豬圈里有一頭大豬和一頭小豬,豬圈的

5、一頭有一個飼料槽,另一頭裝有控制飼料供應的按鈕。按一下按鈕就會有10個單位飼料進槽,但誰按誰就要付出2個單位的成本。誰去按按紐則誰后到;都去按則同時到。若大豬先到,大豬吃到9個單位,小豬吃到一個單位;若同時到,大豬吃7個單位,小豬吃3個單位;若小豬先到,大豬吃六個單位,小豬吃4個單位。各種情況組合扣除成本后的支付矩陣可如下表示(每格第一個數(shù)字是大豬的得益,第二個數(shù)字是小豬的得益):小豬按 等待大豬按 5,14,4等待 9,-1 0,0 求納什均衡。在這個例子中,我們可以發(fā)現(xiàn),大豬選擇按,小豬最好選擇等待,大豬選擇不按,小豬還是最好選擇等待。即不管大豬選擇按還是不按,小豬的最佳策略都是等待。也就

6、是說,無論如何,小豬都只會選擇等待。這樣的情況下,大豬最好選擇是按,因為不按的話都餓肚子,按的話還可以有4個單位的收益。所以納什均衡是(大豬按,小豬等待)。4、根據(jù)兩人博弈的支付矩陣回答問題: aba2,30,0b0,04,2(1) 寫出兩人各自的全部策略,并用等價的博弈樹來重新表示這個博弈(6分)(2) 找出該博弈的全部純策略納什均衡,并判斷均衡的結(jié)果是否是pareto有效。(3) 求出該博弈的混合策略納什均衡。(7分)(1)策略甲:乙:博弈樹(草圖如下:(2)pure ne (a, a); (b, b)都是pareto有效,僅(b, b)是有效。(3)mixed ne (2/5, 3/5)

7、; (2/3, 1/3)5、用反應函數(shù)法求出下列博弈的所有純戰(zhàn)略納什均衡。參與人2abcda2,33,23,40,3參與人1b4,45,20,11,2c3,14,11,410,2d3,14,1-1,210,1解答:純策略納什均衡為(b,a)與(a,c)分析過程:設兩個參與人的行動分別為,player1的反應函數(shù)player2的反應函數(shù)交點為(b,a)與(a,c),因此純策略納什均衡為(b,a)與(a,c)。6、(entry deterrence市場威懾)考慮下面一個動態(tài)博弈:首先,在一個市場上潛在的進入者選擇是否進入,然后市場上的已有企業(yè)(在位者)選擇是否與新企業(yè)展開競爭。在位者可能有兩種類型

8、,溫柔型(左圖)和殘酷型(右圖),回答下面問題。.進入者在位者進入不進入默許斗爭(20,30)(-10,0)(0,100)進入者在位者進入不進入默許斗爭(-10,25)(0,100)(10,20)左圖:溫柔型 右圖:殘酷型(1) 找出給定在位者的兩種類型所分別對應的納什均衡,以及子博弈精煉納什均衡(12分)(2) 已有企業(yè)為溫柔型的概率至少多少時,新企業(yè)才愿意進入(8分)(1) 溫柔ne (in, accommodate) 和(out, fight)。 spne為(in, accommodate)殘酷ne (out, fight). spne同理(2) 8、博弈方1 和博弈方 2就如何分 10

9、,000 元錢進行討價還價。假設確定了以下規(guī)則:雙方同時提出自己要求的數(shù)額 a 和 b,0a,b10,000。如果 a+b10,000,則兩博弈方的要求得到滿足,即分別得 a 和 b,但如果 a+b>10,000,則該筆錢就沒收。問該博弈的納什均衡是什么?如果你是其中一個博弈方,你會選擇什么數(shù)額?為什么?答十、納什均衡有無數(shù)個。最可能的結(jié)果是(5000,5000)這個聚點均衡。9、北方航空公司和新華航空公司分享了從北京到南方冬天度假勝地的市場。如果它們合作,各獲得500000元的壟斷利潤,但不受限制的競爭會使每一方的利潤降至60000元。如果一方在價格決策方面選擇合作而另一方卻選擇降低價

10、格,則合作的廠商獲利將為零,競爭廠商將獲利900000元。 (1)將這一市場用囚徒困境的博弈加以表示。(2)解釋為什么均衡結(jié)果可能是兩家公司都選擇競爭性策略。答:(1)用囚徒困境的博弈表示如下表:北方航空公司合作競爭新華航空公司合作500000,5000000,900000競爭900000,060000,60000(2)如果新華航空公司選擇競爭,則北方航空公司也會選擇競爭(60000>0);若新華航空公司選擇合作,北方航空公司仍會選擇競爭(900000>500000)。若北方航空公司選擇競爭,新華航空公司也將選擇競爭(60000>0);若北方航空公司選擇合作,新華航空公司仍會

11、選擇競爭(900000>0)。由于雙方總偏好競爭,故均衡結(jié)果為兩家公司都選擇競爭性策略,每一家公司所獲利潤均為600000元。12、設啤酒市場上有兩家廠商,各自選擇是生產(chǎn)高價啤酒還是低價啤酒,相應的利潤(單位:萬元)由下圖的得益矩陣給出:(1)有哪些結(jié)果是納什均衡?(2)兩廠商合作的結(jié)果是什么?答(1)(低價,高價),(高價,低價)(2)(低價,高價)13、a、b兩企業(yè)利用廣告進行競爭。若a、b兩企業(yè)都做廣告,在未來銷售中,a企業(yè)可以獲得20萬元利潤,b企業(yè)可獲得8萬元利潤;若a企業(yè)做廣告,b企業(yè)不做廣告,a企業(yè)可獲得25萬元利潤,b企業(yè)可獲得2萬元利潤;若a企業(yè)不做廣告,b企業(yè)做廣告,

12、a企業(yè)可獲得10萬元利潤,b企業(yè)可獲得12萬元利潤;若a、b兩企業(yè)都不做廣告,a企業(yè)可獲得30萬元利潤,b企業(yè)可獲得6萬元利潤。 (1)畫出a、b兩企業(yè)的支付矩陣。(2)求納什均衡。3. 答:(1)由題目中所提供的信息,可畫出a、b兩企業(yè)的支付矩陣(如下表)。b企業(yè)做廣告不做廣告a企業(yè)做廣告20,825,2不做廣告10,1230,6(2)因為這是一個簡單的完全信息靜態(tài)博弈,對于純策納什均衡解可運用劃橫線法求解。如果a廠商做廣告,則b廠商的最優(yōu)選擇是做廣告,因為做廣告所獲得的利潤8大于不做廣告獲得的利潤2,故在8下面劃一橫線。如果a廠商不做廣告,則b廠商的最優(yōu)選擇也是做廣告,因為做廣告獲得的利潤

13、為12,而不做廣告的利潤為6,故在12下面劃一橫線。如果b廠商做廣告,則a廠商的最優(yōu)選擇是做廣告,因為做廣告獲得的利潤20大于不做廣告所獲得的利潤10,故在20下面劃一橫線。如果b廠商不做廣告,a廠商的最優(yōu)選擇是不做廣告,因為不做廣告獲得的利潤30大于做廣告所獲得的利潤25,故在30下面劃一橫線。在本題中不存在混合策略的納什均衡解,因此,最終的純策略納什均衡就是a、b兩廠商都做廣告。15、求出下面博弈的納什均衡(含純策略和混合策略)。乙lr甲u5,00,8d2,64,5由劃線法易知,該矩陣博弈沒有純策略nash均衡??傻萌缦虏坏仁浇Mq=a+d-b-c=7,q=d-b=4,r=0+5-8-6=-

14、9,r=-1可得混合策略nash均衡(),()16、 某產(chǎn)品市場上有兩個廠商,各自都可以選擇高質(zhì)量,還是低質(zhì)量。相應的利潤由如下得益矩陣給出:(1) 該博弈是否存在納什均衡?如果存在的話,哪些結(jié)果是納什均衡?參考答案:由劃線法可知,該矩陣博弈有兩個純策略nash均衡,即(低質(zhì)量, 高質(zhì)量), (高質(zhì)量,低質(zhì)量)。乙企業(yè)高質(zhì)量低質(zhì)量甲企業(yè)高質(zhì)量50,50100,800低質(zhì)量900,600-20,-30該矩陣博弈還有一個混合的納什均衡q=a+d-b-c= -970,q=d-b= -120,r= -1380,r= -630,可得 因此該問題的混合納什均衡為。17、甲、乙兩企業(yè)分屬兩個國家,在開發(fā)某種

15、新產(chǎn)品方面有如下收益矩陣表示的博弈關系。試求出該博弈的納什均衡。如果乙企業(yè)所在國政府想保護本國企業(yè)利益,可以采取什么措施?乙企業(yè)開發(fā)不開發(fā)甲企業(yè)開發(fā)-10,-10100,0不開發(fā)0,1000,0解:用劃線法找出問題的純策略納什均衡點。 所以可知該問題有兩個純策略納什均衡點(開發(fā),不開發(fā))和(不開發(fā),開發(fā))。該博弈還有一個混合的納什均衡(),()。如果乙企業(yè)所在國政府對企業(yè)開發(fā)新產(chǎn)品補貼a個單位,則收益矩陣變?yōu)椋?要使(不開發(fā),開發(fā))成為該博弈的唯一納什均衡點,只需a>10。此時乙企業(yè)的收益為100+a。18、博弈的收益矩陣如下表:乙左右甲上a,bc,d下e,fg,h (1)如果(上,左)

16、是占優(yōu)策略均衡,則a、b、c、d、e、f、g、h之間必然滿足哪些關系?(盡量把所有必要的關系式都寫出來) (2)如果(上,左)是納什均衡,則(1)中的關系式哪些必須滿足? (3)如果(上,左)是占優(yōu)策略均衡,那么它是否必定是納什均衡?為什么?(4)在什么情況下,純戰(zhàn)略納什均衡不存在?答:(1),。本題另外一個思考角度是從占優(yōu)策略均衡的定義出發(fā)。對乙而言,占優(yōu)策略為;而對甲而言,占優(yōu)策略為。綜合起來可得到所需結(jié)論。(2)納什均衡只需滿足:甲選上的策略時,同時乙選左的策略時,。故本題中納什均衡的條件為:,。(3)占優(yōu)策略均衡一定是納什均衡,因為占優(yōu)策略均衡的條件包含了納什均衡的條件。(4)當對每一

17、方來說,任意一種策略組合都不滿足納什均衡時,純戰(zhàn)略納什均衡就不存在。19、smith和john玩數(shù)字匹配游戲,每個人選擇1、2、3,如果數(shù)字相同, john給smith 3美元,如果不同,smith給john 1美元。 (1)列出收益矩陣。(2)如果參與者以1/3的概率選擇每一個數(shù)字,證明該混合策略存在一個納什均衡,它為多少?答:(1)此博弈的收益矩陣如下表。該博弈是零和博弈,無納什均衡。john123smith13,-3-1,1-1,12-1,13,-3-1,13-1,1-1,13,-3 (2)smith選(1/3,1/3,1/3)的混合概率時,john選1的效用為:john選2的效用為:j

18、ohn選3的效用為:類似地,john選(1/3,1/3,1/3)的混合概率時,smith選1的效用為:smith選2的效用為:smith選3的效用為:因為,所以:是納什均衡,策略值分別為john:;smith:。20、假設雙頭壟斷企業(yè)的成本函數(shù)分別為:,市場需求曲線為,其中,。 (1)求出古諾(cournot)均衡情況下的產(chǎn)量、價格和利潤,求出各自的反應和等利潤曲線,并圖示均衡點。 (2)求出斯塔克博格(stackelberg)均衡情況下的產(chǎn)量、價格和利潤,并以圖形表示。(3)說明導致上述兩種均衡結(jié)果差異的原因。 答:(1)對于壟斷企業(yè)1來說: 這是壟斷企業(yè)1的反應函數(shù)。 其等利潤曲線為: 對

19、壟斷企業(yè)2來說: 這是壟斷企業(yè)2的反應函數(shù)。 其等利潤曲線為: 在達到均衡時,有: 均衡時的價格為: 兩壟斷企業(yè)的利潤分別為: 均衡點可圖示為:0企業(yè)195200190企業(yè)2企業(yè)1的反應線均衡點 (2)當壟斷企業(yè)1為領導者時,企業(yè)2視企業(yè)1的產(chǎn)量為既定,其反應函數(shù)為:則企業(yè)1的問題可簡化為: 均衡時價格為: 利潤為:, 該均衡可用下圖表示:stackelberg均衡點企業(yè)2的反應線500企業(yè)195200190企業(yè)2企業(yè)1的反應線 企業(yè)2領先時可依此類推。(3)當企業(yè)1為領先者時,其獲得的利潤要比古諾競爭下多。而企業(yè)2獲得的利潤較少。這是因為,企業(yè)1先行動時,其能考慮企業(yè)2的反應,并以此來制定自

20、己的生產(chǎn)計劃,而企業(yè)2只能被動地接受企業(yè)1的既定產(chǎn)量,計劃自己的產(chǎn)出,這是一種“先動優(yōu)勢”21、在一個由三寡頭操縱的壟斷市場中,逆需求函數(shù)為p=a-q1-q2-q3,這里qi是企業(yè)i的產(chǎn)量。每一企業(yè)生產(chǎn)的單位成本為常數(shù)c。三企業(yè)決定各自產(chǎn)量的順序如下:(1)企業(yè)1首先選擇q10;(2)企業(yè)2和企業(yè)3觀察到q1,然后同時分別選擇q2和q3。試解出該博弈的子博弈完美納什均衡。答:該博弈分為兩個階段,第一階段企業(yè)1選擇產(chǎn)量q1,第二階段企業(yè)2和3觀測到q1后,他們之間作一完全信息的靜態(tài)博弈。我們按照逆向遞歸法對博弈進行求解。(1)假設企業(yè)1已選定產(chǎn)量q1,先進行第二階段的計算。設企業(yè)2,3的利潤函數(shù)

21、分別為:由于兩企業(yè)均要追求利潤最大,故對以上兩式分別求一階條件: (1) (2)求解(1)、(2)組成的方程組有: (3)(2)現(xiàn)進行第一階段的博弈分析:對與企業(yè)1,其利潤函數(shù)為; 將(3)代入可得: (4)式(4)對q1求導:解得: (5)此時,(3)將式(5)代回(3)和(4)有該博弈的子博弈完美納什均衡:,25、某寡頭壟斷市場上有兩個廠商,總成本均為自身產(chǎn)量的20倍, 市場需求函數(shù)為q=200-p。求(1)若兩個廠商同時決定產(chǎn)量,產(chǎn)量分別是多少?(2)若兩個廠商達成協(xié)議壟斷市場,共同安排產(chǎn)量,則各自的利潤情況如何?答:(1)分別求反應函數(shù),180-2q1-q2=0,180-q1-2q2=

22、0,q1=q2=60(2)200-2q=20,q=90,q1=q2=4526、一個工人給一個老板干活,工資標準是100元。工人可以選擇是否偷懶,老板則選擇是否克扣工資。假設工人不偷懶有相當于 50 元的負效用,老板想克扣工資則總有借口扣掉60 元工資,工人不偷懶老板有 150 元產(chǎn)出,而工人偷懶時老板只有 80元產(chǎn)出,但老板在支付工資之前無法知道實際產(chǎn)出,這些情況雙方都知道。請問:(1)如果老板完全能夠看出工人是否偷懶,博弈屬于哪種類型?用得益矩陣或擴展形表示該博弈并作簡單分析。(2)如果老板無法看出工人是否偷懶,博弈屬于哪種類型?用得益矩陣或擴展形表示該博弈并作簡單分析。(1)完全信息動態(tài)博

23、弈。博弈結(jié)果應該是工人偷懶,老板克扣。(2)完全信息靜態(tài)博弈,結(jié)果仍然是工人偷懶,老板克扣。27、舉一個你在現(xiàn)實生活中遇到的囚犯兩難困境的例子。答:在校園的人行道交叉路口,無需紅綠燈。現(xiàn)在兩人分別騎車從東西方向和南北方向通過路口。若同時往前沖,必定相撞,各自支付為(-2,-2);若同時停下,都不能按時前進,支付為(0,0);若一人前進一人停下,支付為(2,0)或(0,2)。相應的策略和支付矩陣如下表。乙前進停下甲前進-2,-22,0停下0,20,028、給定兩家釀酒企業(yè)a、b的收益矩陣如下表:a企業(yè)白酒啤酒b企業(yè)白酒700,600900,1000啤酒800,900600,800表中每組數(shù)字前面

24、一個表示b企業(yè)的收益,后一個數(shù)字表示b企業(yè)的收益。(1)求出該博弈問題的均衡解,是占優(yōu)策略均衡還是納什均衡?(2)存在帕累托改進嗎?如果存在,在什么條件下可以實現(xiàn)?福利增量是多少?(3)如何改變上述a、b企業(yè)的收益才能使均衡成為納什均衡或占優(yōu)策略均衡?如何改變上述a、b企業(yè)的收益才能使該博弈不存在均衡? 答:(1)有兩個納什均衡,即(啤酒,白酒)、(白酒,啤酒),都是納什均衡而不是占優(yōu)策略均衡。(2)顯然,(白酒,啤酒)是最佳均衡,此時雙方均獲得其最大收益。若均衡解為(啤酒,白酒),則存在帕累托改善的可能。方法是雙方溝通,共同做出理性選擇,也可由一方向另一方支付報酬。福利由800+900變?yōu)?

25、00+1000,增量為200。(3)如將(啤酒,白酒)支付改為(1000,1100),則(啤酒,白酒)就成為占優(yōu)策略均衡。比如將(啤酒,白酒)支付改為(800,500),將(白酒,啤酒)支付改為(900,500),則該博弈就不存在任何占優(yōu)策略均衡或納什均衡。30、在納稅檢查的博弈中,假設a為應納稅款,c為檢查成本,f是偷稅罰款,且c<a+f;s為稅務機關檢查的概率,e為納稅人逃稅的概率;不存在純戰(zhàn)略納什均衡。(1)寫出支付矩陣。(2)分析混合策略納什均衡。答:(1)該博弈的支付矩陣如下表:納稅人逃稅不逃稅稅收機關檢查a-c+f, -a-fa-c,-a不檢查0,0a,-a (2)先分析稅收

26、檢查邊際:因為s為稅務機關檢查的概率,e為納稅人逃稅的概率。給定e,稅收機關選擇檢查與否的期望收益為:解,得:。 如果納稅人逃稅概率小于e,稅收機關的最優(yōu)決策是不檢查,否則是檢查。 再分析逃稅邊際:給定s,納稅人選擇逃稅與否的期望收益是:解,得:。即如果稅收機關檢查的概率小于s,納稅人的最優(yōu)選擇是逃稅,否則是交稅。 因此,混合納什均衡是(s,e),即稅收機關以s的概率查稅,而納稅人以e的概率逃稅。31、判斷下列說法正確:(1)斯塔克博格產(chǎn)量領導者所獲得的利潤的下限是古諾均衡下它得到的利潤。(2)由于兩個罪犯只打算犯罪一次,所以被捕后才出現(xiàn)了不合作的問題即囚徒困境。但如果他們打算重復合伙多次,比

27、如說20次,那么對策論預測他們將采取彼此合作的態(tài)度,即誰都不招供。 答:(1)正確。在斯塔克博格模型中,領導者可以根據(jù)跟隨者的反應曲線來制定自己的最優(yōu)產(chǎn)量。其利潤一定不會小于古諾均衡下的利潤,否則,領導者將采取古諾博弈中雙方同時行動的策略而獲得古諾均衡的利潤。 (2)錯誤。只要兩囚犯只打算合作有限次,其最優(yōu)策略均為招供。比如最后一次合謀,兩小偷被抓住了,因為將來沒有合作機會了,最優(yōu)策略均為招供。回退到倒數(shù)第二次,既然已經(jīng)知道下次不會合作,這次為什么要合作呢。依此類推,對于有限次內(nèi)的任何一次,兩小偷均不可能合作。34、假設古諾的雙寡頭模型中雙寡頭面臨如下一條線性需求曲線:p=30-q其中q為兩廠

28、商的總產(chǎn)量,即q=q1+q2。再假設邊際成本為零,即mc1=mc2=0解釋并討論此例的納斯均衡,為什么其均衡是一種囚徒困境。廠商1的總收益tr1由下式給出:廠商1的邊際收益mr1為:mr1=30-2q1-q2利用利潤最大化條件mr1=mc1=0,得廠商1的反應函數(shù)(reaction function)或反應曲線為:q1=15-0.5q2(6-1)同理可得廠商2的反應曲線為:q2=15-0.5q1(6-2)均衡產(chǎn)量水平就是兩反應曲線交點q1和q2的值,即方程組6-1和6-2的解??梢郧蟮霉胖Z均衡時的均衡產(chǎn)量水平為:q1=q2=10。因此,在本例中,兩個寡頭的總產(chǎn)量q為q1+q2=20,均衡價格為

29、p=30-q=10。剛才我們討論了兩寡頭廠商相互競爭時的均衡產(chǎn)量?,F(xiàn)在我們放松第(6)條不能串謀的假設,假定兩寡頭可以串謀。它們能共同確定產(chǎn)量以使總利潤最大化。這時,兩廠商的總收益tr為:tr=pq=(30-q)q=30q-q2其邊際收益mr為:mr=30-2q根據(jù)利潤最大化條件mr=mc=0,可以求得當q=15時總利潤最大。如果兩廠商同意平分利潤,每個寡頭廠商將各生產(chǎn)總產(chǎn)量的一半,即q1=q2=7.5。其實,任何相加為15的產(chǎn)量q1和q2的組合都使總利潤最大化,因此,把q1+q2=15稱為契約曲線,而q1=q2=7.5是契約曲線上的一個點。我們還可以求得當價格等于邊際成本時,q1=q2=15

30、,各廠商的利潤為零。35、兩家電視臺競爭周末黃金時段晚8點到10點的收視率,可選擇把較好的節(jié)目放在前面還是后面。他們決策的不同組合導致收視率如下:(1)如果兩家是同時決策,有納什均衡嗎? 有(前面,后面)(2)如果雙方采用規(guī)避風險的策略,均衡的結(jié)果是什么? 此題應用的思想是最大最小收益法: 也就是說,在對手采取策略時,所獲得的最小收益中的最大值。 電視臺1:對方采取前面戰(zhàn)略的最小收益為18 對方采取后面戰(zhàn)略的最小收益為16 固電視臺1 會選擇收益為18的戰(zhàn)略前面 電視臺2:前面的策略是一個優(yōu)超策略前面 策略均衡為(前面,前面) (3)如果電視臺1先選擇,結(jié)果有什么?若電視臺2先選擇呢? (4)

31、如果兩家談判合作,電視臺1許諾將好節(jié)目放在前面,這許諾可信嗎?結(jié)果能是什么? 電視臺1 許諾將好節(jié)目放在前面的許諾不可信。 因為電視臺2,前面為占優(yōu)策略, 而在電視臺2 ,選擇前面的時候,電視臺1 選擇后面的收益要大于前面的收益。 所以,最終結(jié)果為(前面,后面) 36、如果將如下的囚徒困境博弈重復進行無窮次,懲罰機制為觸發(fā)策略,貼現(xiàn)因子為。試問應滿足什么條件,才存在子博弈完美納什均衡?乙甲坦白不坦白坦白4,40,5不坦白5,01,1參考答案:由劃線法求得該博弈的純策略納什均衡點為(不坦白,不坦白),均衡結(jié)果為(1,1),采用觸發(fā)策略,局中人i的策略組合s的最好反應支付=5,pi(s*)=4,p

32、i(sc)=1。若存在子博弈完美納什均衡,必須滿足:,即只有當貼現(xiàn)因子>1/4時,才存在子博弈完美納什均衡。37、在bertrand價格博弈中,假定有n個生產(chǎn)企業(yè),需求函數(shù)為p=a-q,其中p是市場價格,q是n個生產(chǎn)企業(yè)的總供給量。假定博弈重復無窮多次,每次的價格都立即被觀測到,企業(yè)使用“觸發(fā)策略”(一旦某個企業(yè)選擇壟斷價格,則執(zhí)行“冷酷策略”)。求使壟斷價格可以作為完美均衡結(jié)果出現(xiàn)的最低貼現(xiàn)因子是多少。并請解釋與n的關系。 分析:此題可分解為3個步驟 (1)n個企業(yè)合作,產(chǎn)量總和為壟斷產(chǎn)量,價格為壟斷價格,然后平分利潤。 (2)其中一個企業(yè)采取欺騙手段降價,那個這家企業(yè)就占有的全部市場

33、,獲得壟斷利潤 (3)其他企業(yè)觸發(fā)戰(zhàn)略,將價格降到等于邊際成本,所有的企業(yè)利潤為零。 參考答案:(1)設每個企業(yè)的邊際成本為c,固定成本為0 p=a-q tr=p*q=(a-q)*q mr=a-2q 因為:mr=mc a-2q=c 則:q=(a-c)/2 p=(a+c)/2 =(p-c)*q=(a-c)2/4 每家企業(yè)的利潤為(a-c)2/4n (2)假設a企業(yè)自主降價,雖然只是微小的價格調(diào)整,但足以占領整個市場 ,獲得所有的壟斷利潤(a-c)2/4 (3)其他企業(yè)在下一期采取冷酷策略,使得所有企業(yè)的利潤為0 考慮: a企業(yè)不降價: (a-c)2/4n, (a-c)2/4n, a企業(yè)降價: (

34、a-c)2/4, 0, 使壟斷價格可以作為完美均衡結(jié)果,就要使得不降價的貼現(xiàn)值大于等于降價的貼現(xiàn)值。 設貼現(xiàn)因子為 a不降價的貼現(xiàn)值: (a-c)2/4n1/(1- ) a降價的現(xiàn)值: (a-c)2/4 于是:(a-c)2/4n1/(1- ) (a-c)2/4 解得: 1-1/n 38、假設某勞動市場為完全競爭市場,其供求函數(shù)如下: sl:w=120+2l dl:w=360-l 已知某廠商(在完全競爭市場下)的生產(chǎn)函數(shù)為 f(l,k)=10l0.5k0.5 (k=100) 且其產(chǎn)品的需求與供給函數(shù)分別為 論述題(每小題20分,共20分)解釋“囚犯困境”,并舉商業(yè)案例說明。囚徒困境是博弈論里最著

35、名的例子之一,幾乎所有的博弈論著作中都要討論這個例子。這個例子是這樣的:兩囚徒被指控是一宗罪案的同案犯。他們被分別關在不同的牢房無法互通信息。各囚徒都被要求坦白罪行。如果兩囚徒都坦白,各將被判入獄5年;如果兩人都不坦白,則很難對他們提起刑事訴訟,因而兩囚徒可以期望被從輕發(fā)落入獄2年;另一方面,如果一個囚徒坦白而另一個囚徒不坦白,坦白的這個囚徒就只需入獄1年,而不坦白的囚徒將被判入獄10年。表6-2給出了囚徒困境的策略式表述。這里,每個囚徒都有兩種策略:坦白或不坦白。表中的數(shù)字分別代表囚徒甲和乙的得益。(注意,這里的得益是負值。)表6-2 囚徒困境囚徒乙坦白不坦白囚徒甲坦白 -5, -5-1,

36、-10不坦白-10, -1-2, -2在囚徒困境這個模型中,納什均衡就是雙方都坦白,給定甲坦白的情況下,乙的最優(yōu)策略是坦白;給定乙坦白的情況下,甲的最優(yōu)策略也是坦白。而且這里雙方都坦白不僅是納什均衡,而且是一個上策(dominant strategy)均衡,即不論對方如何選擇,個人的最優(yōu)選擇是坦白。因為如果乙不坦白,甲坦白的話就被輕判1年,不坦白的話就判2年,坦白比不坦白要好;如果乙坦白,甲坦白的話判5年,不坦白的話判10年,所以,坦白仍然比不坦白要好。這樣,坦白就是甲的上策,當然也是乙的上策。其結(jié)果是雙方都坦白。這個組合是納什均衡。寡頭壟斷廠商經(jīng)常發(fā)現(xiàn)它們自己處于一種囚徒的困境。當寡頭廠商選

37、擇產(chǎn)量時,如果寡頭廠商們聯(lián)合起來形成卡特爾,選擇壟斷利潤最大化產(chǎn)量,每個廠商都可以得到更多的利潤。但卡特爾協(xié)定不是一個納什均衡,因為給定雙方遵守協(xié)議的情況下,每個廠商都想增加生產(chǎn),結(jié)果是每個廠商都只得到納什均衡產(chǎn)量的利潤,它遠小于卡特爾產(chǎn)量下的利潤。解釋“智豬博弈(boxed pigs)”,并舉商業(yè)案例說明。智豬博弈的例子講的是:豬圈里有一頭大豬和一頭小豬,豬圈的一頭有一個豬食槽,另一頭安裝一個按扭,控制著豬食的供應。每按一下按扭會有10個單位的豬食進槽,但誰按按扭誰就要付2個單位的成本并且晚到豬食槽。若大豬先到豬食槽,大豬吃到9個單位,小豬只能吃到1個單位;若小豬先到豬食槽,大豬吃到6個單位

38、,小豬吃4個單位;若同時到,大豬吃到7個單位,小豬只能吃3個單位。表6-3列出了對應于不同策略組合的得益水平。例如,表中第一格表示大豬小豬同時按按扭,從而同時走到豬食槽,大豬吃7個,小豬吃3個,除去2個單位成本,得益分別為5和1。表6-3 智豬博弈小豬按不按大豬按5, 14, 4不按9, -10, 0從表6-3可以看到,對于小豬來說,如果大豬按,它則不按更好;如果大豬不按,它不按也更好,所以,不論大豬按還是不按,它的最優(yōu)策略都是不按。給定小豬不按,大豬的最優(yōu)選擇只能是按。所以,納什均衡就是大豬按,小豬不按,各得4個單位豬食。市場中的大企業(yè)與小企業(yè)之間的關系類似智豬博弈。大企業(yè)進行研究與開發(fā),為

39、新產(chǎn)品做廣告,而對小企業(yè)來說這些工作可能得不償失。所以,小企業(yè)可能把精力花在模仿上,或等待大企業(yè)用廣告打開市場后再出售廉價產(chǎn)品。解釋“夫妻博弈”(battle of the sexes)”,并舉商業(yè)案例說明。 “夫妻博弈”(battle of the sexes)的例子講的是一對談戀愛的男女安排業(yè)余活動,他們有二種選擇,或去看足球比賽,或去看芭蕾舞演出。男方偏好足球,女方偏好芭蕾,但他們寧愿在一起,不愿分開。表6-6給出了這個博弈的得益矩陣。在這個博弈中,如果雙方同時決定,則有兩個納什均衡,即都去看足球比賽和都去看芭蕾演出。但是到底最后他們?nèi)タ醋闱虮荣愡€是去看芭蕾演出,并不能從中獲得結(jié)論。如果

40、假設這是個序列博弈,例如,當女方先作出選擇看芭蕾演出時,男方只能選擇芭蕾;當女方先選擇了看足球比賽時,男方也只能選擇足球。反之,當男方先選擇了看足球比賽時,女方只能選擇看足球比賽;當男方先選擇了看芭蕾演出時,女方只能選擇芭蕾。表6-6 夫妻博弈女足球芭蕾男足球2,10,0芭蕾0,01,2在這個博弈例子中,先行動者具有明顯的優(yōu)勢,女方通過選擇芭蕾造成一種既成事實,使得男方除了一起去看芭蕾之外別無選擇。這就是我們在斯塔克爾伯格模型中提到的先動優(yōu)勢(first mover advantage)。在那個模型中,先行動的廠商選擇一個很高的產(chǎn)量水平,從而使它的競爭對手除了選擇小的產(chǎn)量水平之外沒有多大的選擇

41、余地。解釋古諾模型。解釋斯塔克爾伯格模型。l 斯塔克爾貝里(1934)提出一個雙頭壟斷的動態(tài)模型,其中一個支配企業(yè)(領導者)首先行動,然后從屬企業(yè)(追隨者)行。比如在美國汽車產(chǎn)業(yè)發(fā)展史中的某些階段,通用汽車就扮演過這種領導者的角色(這一例子把模型直接擴展到允許不止一個追隨企業(yè),如福特、克萊斯勒等等)。根據(jù)斯塔克爾貝里的假定,模型中的企業(yè)選擇其產(chǎn)量,這一點和古諾模型是一致的(只不過古諾模型中企業(yè)是同時行動的,不同于這里的序貫行動)。博弈的時間順序如下:(1)企業(yè)1選擇產(chǎn)量q1 >0; (2)企業(yè)2觀測到然后選擇產(chǎn)量q2 >0(3)企業(yè)1的收益由下面的利潤函數(shù)給出:l 這里p(q)=a

42、-q,是市場上的總產(chǎn)品q=q1+q2時的市場出清價格,c是生產(chǎn)的邊際成本,為一常數(shù)(固定成本為0)。l 為解出這一博弈的逆向歸納解,我們首先計算企業(yè)2對企業(yè)1任意產(chǎn)量的最優(yōu)反應,r2(q1)應滿足:l 對上面的通過求極值可得:l 已知q1< a-c,在前面我們分析同時行動的古諾博弈中,得出的r2(q1)和上式完全一致,兩者的不同之處在于這里的r2(q1)是企業(yè)2對企業(yè)1已觀測到的產(chǎn)量的真實反應,而在古諾的分析中, r2(q1)是企業(yè)2對假定的企業(yè)1的產(chǎn)量的最優(yōu)反應,且企業(yè)1的產(chǎn)量選擇是和企業(yè)2同時作出的。l 由于企業(yè)1也能夠像企業(yè)2一樣解出企業(yè)2的最優(yōu)反應,企業(yè)1就可以預測到他如選擇q1

43、,企業(yè)2將根據(jù)r2(q1)選擇產(chǎn)量。那么在博弈的第一階段,企業(yè)1的問題就可表示為:l 解得:ll 這就是斯塔克爾貝里雙頭壟斷博弈的逆向歸納解。l 對斯塔科爾貝里雙頭壟斷博弈的逆向歸納解的評價:l 回顧在古諾博弈的納什均衡中,每一企業(yè)的產(chǎn)量為(a一c)/3,也就是說,斯塔克爾貝里博弈中逆向歸納解的總產(chǎn)量3(a-c)/4,比古諾博弈中納什均衡的總產(chǎn)量2(a-c)/3要高,從而斯塔克爾貝里博弈相應的市場出清價格就比較低。不過在斯塔克爾貝里博弈中,企業(yè)1完全可以選擇古諾均衡產(chǎn)量(a一c)/3 ,這時企業(yè)2的最優(yōu)反應同樣是古諾均衡的產(chǎn)量,也就是說在斯塔克爾貝里博弈中,企業(yè)1完全可以使利潤水平達到古諾均衡

44、的水平,而卻選擇了其他產(chǎn)量,那么企業(yè)1在斯塔克爾貝里博弈中的利潤一定高于其在古諾博弈中的利潤。但斯塔克爾貝里博弈中的市場出清價格降低了,從而總利潤水平也會下降,那么和古諾博弈的結(jié)果相比,在斯塔克爾貝里博弈中,企業(yè)1利潤的增加必定意味著企業(yè)2福利的惡化。l 和古諾博弈相比,斯塔克爾貝里博弈中企業(yè)2利潤水平的降低,揭示了單人決策問題和多人決策間題的一個重要不同之處。在單人決策理論中,占有更多的信息決不會對決策制定者帶來不利,然而在博弈論中,了解更多的信息(或更為精確地說,是讓其他參加者知道一個人掌握更多的信息)卻可以讓一個參與者受損。解釋里昂惕夫的工會模型。l 在里昂惕夫(1946)模型中,討論了

45、一個企業(yè)和一個壟斷的工會組織(即作為企業(yè)勞動力惟一供給者的工會組織)的相互關系:工會對工資水平說一不二,但企業(yè)卻可以自主決定就業(yè)人數(shù)(在更符合現(xiàn)實情況的模型中,企業(yè)和工會間就工資水平討價還價,但企業(yè)仍自主決定就業(yè),得到的定性結(jié)果與本模型相似)。工會的效用函數(shù)為u(w, l),其中w為工會向企業(yè)開出的工資水平,l為就業(yè)人數(shù)。l 假定u(w, l)是w和l的增函數(shù)。企業(yè)的利潤函數(shù)為 ,其中r (l)為企業(yè)雇傭l名工人可以取得的收入(在最優(yōu)的生產(chǎn)和產(chǎn)品市場決策下),假定r (l)是增函數(shù),并且為凹函數(shù)。l 假定博弈的時序為:(1)工會給出需要的工資水平w;(2)企業(yè)觀測到(并接受)w,隨后選擇雇傭人

46、數(shù)l;(3)收益分別為u(w, l)和 。即使沒有假定u(w, l)和r (l)的具體的表達式,從而無法明確解出該博弈的逆向歸納解,但我們?nèi)钥梢跃徒獾闹饕卣鬟M行討論。l 首先,對工會在第一階段任意一個工資水平w,我們能夠分析在第二階段企業(yè)最優(yōu)反應l*(w)的特征。給定w,企業(yè)選擇l*(w)滿足下式:l 一階條件為:l 為了滿足上述一階條件,假設r(0)=; r()=0.l 下面的圖把l *(w)表示為w的函數(shù)(但坐標軸經(jīng)過旋轉(zhuǎn)以便于和以后的數(shù)據(jù)相比較),并表示出它和企業(yè)每條等利潤線交于其最高點。若令l保持不變,l l保持不變,w降低時企業(yè)的利潤就會提高,于是較低的等利潤曲線代表了較高的利潤水

47、平。l 這張圖描述了工會的無差異曲線,若令l不變,當w提高時工會的福利就會增加。于是較高的無差異曲線代表了工會較高的效用水平。l 下面我們分析工會在第一階段的問題,由于工會和企業(yè)同樣可以解出企業(yè)在第二階段的問題,工會就可預測到如果它要求的工資水平為w1,企業(yè)最優(yōu)反應的就業(yè)人數(shù)將會是l*(w1)。那么,工會在第一階段的問題可以表示為:l 表現(xiàn)在圖中的無差異曲線上就是,工會希望選擇一個工資水平w,由此得到的結(jié)果(w, l*(w)處于可能達到的最高的無差異線上。這一最優(yōu)化間題的解為w*,這樣一個工資要求將使得工會通過(w*, l*(w*)的無差異曲線與l*(w)相切于該點,如圖所示。從而(w*, l

48、*(w*)就是這一工資與就業(yè)博弈的逆向歸納解。l 更進一步我們還可以看出,(w*,l*(w*)是低效率的,在上圖中,如果w和l處于圖中陰影部分以內(nèi),企業(yè)和工會的效用水平都會提高。這種低效率對實踐中企業(yè)對雇傭工人數(shù)量保持的絕對控制權(quán)提出了質(zhì)疑。(允許工人和企業(yè)就工資相互討價還價,但企業(yè)仍對雇傭工人數(shù)量絕對控制,也會得到相似的低效率解)。解釋伯特蘭德模型。用“小偷與守衛(wèi)的博弈”說明“激勵悖論”。犯罪和防止犯罪是罪犯和警察之間進行博弈的一場游戲。警察可以加強巡邏,或者休息。犯罪者可以采取作案、不作案兩種策略。如果罪犯知道警察休息,他的最佳選擇就是作案;如果警察加強巡邏,他最好還是不作案。對于警察,如

49、果他知道犯罪者想作案,他的最佳選擇是加強巡邏,如果犯罪者采取不作案,自己最好去休息。當然,犯罪者和警察都不可能完全知曉對方將采取的行動,因此他們都將估計對方采取某種行動的概率,從而決定自己要采取的行動。結(jié)果是,他們將以一定的概率隨機地采取行動,這叫“混合策略”。 我們可以簡單地分析一下混合策略(對數(shù)字不感興趣的讀者可以不看下面一段)。下面是犯罪者與警察的支付矩陣(假定犯罪者在警察休息時一定作案成功,在警察巡邏時作案一定會被抓?。?犯罪者不作案 作案警察 巡邏 0,0 2,-2 休息 2,0 -1,1這個矩陣的數(shù)字含義可以表示,警察巡邏,犯罪者不作案,雙方都沒有收益也沒有損失;警察巡邏,犯罪者

50、作案,警察因抓到罪犯受到表彰,得到效用2單位,罪犯被判刑喪失效用2單位;警察休息,犯罪者不作案,警察休息的很愉快得到效用2單位,犯罪者沒有收益也沒有損失;警察休息,犯罪者作案,警察因失職被處分而喪失效用1單位,罪犯犯罪成功獲得效用1單位。這個博弈是沒有納什均衡的。但是,如果警察知道犯罪者以p的概率選擇作案(不作案概率就為1-p),他該怎樣采取自己的行動?對警察而言,巡邏的預期效用為0×(1-p)+2p=2p,休息的預期效用為2×(1-p)-1×p=2-3p。顯然,當2p>2-3p即p>0.4的時候,警察最好選擇巡邏;反之2p<2-3p即p<

51、0.4的時候,警察寧愿選擇休息。假設警察應以q的概率巡邏(休息的概率就為1-q),那么犯罪者最好的行動是什么?他作案的預期效用是-2×q+1×(1-q)=1-3q,不作案的預期效用為0×q+0×(1-q)=0。顯然,當1-3q>0即q<0.33時,他的理性選擇是作案,反之不作案。在這個博弈中,警察以0.33的概率巡邏0.67的概率休息,犯罪者以0.4 的概率作案0.6的概率不作案構(gòu)成一個混合納什均衡。上述混合納什均衡可以這樣理解,如果警察以高于0.33的概率巡邏,犯罪者最好是躲避起來。犯罪者一旦躲避,警察就沒有收獲,于是降低巡邏的概率,于是犯

52、罪者重新活躍,于是警察又提高巡邏概率從一個長期來看,兩者的均衡將維持在警察以0.33的概率巡邏犯罪者以0.4的概率作案上面。現(xiàn)實中,我們看到,當嚴打的時候(警察出擊的概率較高),犯罪分子便收斂一陣(降低作案概率);嚴打的時期一過,犯罪分子又開始興風作浪,在不能容忍罪犯過分猖狂的時候,警界不得不再次開始嚴打。在上述例子中,可能大家覺得警察和犯罪者都根據(jù)一定概率采取自己的行動不太好理解,那么可以嘗試這樣理解他們:作案的犯罪者越多,那么出動的警察將會越多,作案的犯罪者越少,出動的警察將越少;反過來,出動的警察越多,作案的犯罪者就越少,出動的警察越少,作案的犯罪者就越多。極端地假設一個例子(它有助于我

53、們的理解),警局有100名警察,犯罪集團有100名犯罪者,那么上例博弈中,警察以0.33的概率巡邏而犯罪者以0.4 的概率作案這一納什均衡可以理解為:在巡邏的警察少于33人時,犯罪集團最好派40名以上的犯罪者作案;在巡邏警察多于33人時,犯罪集團最好派40名以下的犯罪者作案;反過來,犯罪集團派40名以下犯罪者作案,警局最優(yōu)選擇出動33名以下的警察;犯罪集團派40名以上犯罪者作案,警局最優(yōu)選擇出動33名以上的警察。當然,如果犯罪集團傾巢出動,那么警察的選擇也是全部出動,但警察一旦全部出動,犯罪者最好選擇全部不作案,犯罪者一旦選擇全部不作案,警察最好全部選擇休息最后長期的均衡狀態(tài)是,警局派33名警

54、察巡邏,犯罪集團派40個人作案。這可以解釋現(xiàn)實中,為什么警界總安排有巡邏力量,而犯罪者也總保持一定的作案數(shù)量??傊?,這種警察和犯罪者的博弈所揭示出:加重對罪犯的處罰在長期中并不能抑制犯罪(而只能使警察偷懶);加重處罰失職警察恰恰是會降低犯罪發(fā)生的概率。這種警察和犯罪者的博弈所揭示的,政策目標和政策結(jié)果之間的這種意外關系,常被稱為“激勵的悖論”。判斷題(每小題1分,共15分)囚徒困境說明個人的理性選擇不一定是集體的理性選擇。( )子博弈精煉納什均衡不是一個納什均衡。(× )若一個博弈出現(xiàn)了皆大歡喜的結(jié)局,說明該博弈是一個合作的正和博弈。( )博弈中知道越多的一方越有利。( ×) 納什均衡一定是上策均衡。 (× )上策均衡一定是納什均衡。 ()在一個博弈中只可能存在一個納什均衡。 (×)在一個博弈中博弈方可以有很多個。 ()在一個博弈中如果存在多個納什均衡則不存在上策均衡。 ( )在博弈中納什均衡是博弈雙方能獲得的最好結(jié)果。 (× )在博弈中如果某博弈方改變策略后得益增加則另一博弈方得益減少。 (× )上策均衡是帕累托最優(yōu)的均衡。 (×)因為零和博弈中博弈方之間關系都是競爭性的、對立的,因此零和博弈就是非合作博弈。

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預覽,若沒有圖紙預覽就沒有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負責。
  • 6. 下載文件中如有侵權(quán)或不適當內(nèi)容,請與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

評論

0/150

提交評論