




版權(quán)說(shuō)明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請(qǐng)進(jìn)行舉報(bào)或認(rèn)領(lǐng)
文檔簡(jiǎn)介
納什均衡2.1納什均衡的定義納什均衡是博弈論中最重要的概念,各種非合作博弈模型的均衡概念都是建立在納什均衡基礎(chǔ)之上的。納什均衡是個(gè)策略組合,它滿足兩個(gè)要求。1.對(duì)每個(gè)局中人,能夠預(yù)期到對(duì)手采用策略組合。2.對(duì)每個(gè)局中人,是他應(yīng)對(duì)的最好的策略。納什均衡的定義定義2.1
設(shè)為一具有完全信息的策略型博弈模型,稱策略組合為G的一個(gè)納什均衡。如果對(duì)是在i的對(duì)手策略組合為條件下局中人i的最優(yōu)反應(yīng)策略,即
或?qū)?。如果以上不等式?duì)嚴(yán)格成立,稱為G的嚴(yán)格納什均衡。在完全信息靜態(tài)博弈中可用納什均衡預(yù)測(cè)每個(gè)參與人的策略,進(jìn)而預(yù)測(cè)我們所關(guān)心的各種博弈結(jié)果。擴(kuò)展型博弈模型的納什均衡定義為它所對(duì)應(yīng)的策略型博弈的納什均衡。例2.1囚徒困境問(wèn)題在例1.6給出的囚徒困境問(wèn)題中,是惟一的嚴(yán)格納什均衡。策略組合都不是納什均衡。例2.2伯川德(Berchand)均衡設(shè)有生產(chǎn)同質(zhì)產(chǎn)品的兩個(gè)企業(yè),同時(shí)獨(dú)立地確定產(chǎn)品的價(jià)格。已知該產(chǎn)品市場(chǎng)需求函數(shù)為,滿足。這里q代表產(chǎn)量,p代表價(jià)格。兩個(gè)企業(yè)具有相同的單位成本.企業(yè)的利潤(rùn)函數(shù)如下:這里表示兩個(gè)企業(yè)的價(jià)格分別為時(shí),市場(chǎng)對(duì)于企業(yè)的產(chǎn)品的需求量。上述企業(yè)價(jià)格競(jìng)爭(zhēng)問(wèn)題可以歸結(jié)為完全信息靜態(tài)博弈模型其中局中人集合。策略集合表示企業(yè)所有可行價(jià)格構(gòu)成的集合。支付函數(shù)。為求該模型的納什均衡,可先將策略組合集合中的點(diǎn)分為4類,分別討論它們是否能構(gòu)成納什均衡。第1類,第2類,第3類,第4類,(1)當(dāng),不是納什均衡。.(2)當(dāng),不是納什均衡。(3)當(dāng),不是納什均衡。(4)當(dāng),是納什均衡。稱其為伯川德均衡。例2.3簡(jiǎn)單產(chǎn)品差異化模型考慮由商店構(gòu)成的市場(chǎng),A與B分別銷售不同品牌的商品,進(jìn)行價(jià)格競(jìng)爭(zhēng)。假設(shè)生產(chǎn)的單位成本為零。消費(fèi)者分為兩類,個(gè)消費(fèi)者偏好于產(chǎn)品A,個(gè)消費(fèi)者偏好于產(chǎn)品B。A,B兩種品牌價(jià)格分別為。設(shè)消費(fèi)者可從A或B處購(gòu)買(mǎi)單位商品。用表示由于購(gòu)買(mǎi)不喜歡的產(chǎn)品所付出的厭惡成本,假設(shè)消費(fèi)者具有如下的效用函數(shù)用表示消費(fèi)者對(duì)于產(chǎn)品A的需求量;表示消費(fèi)者對(duì)于產(chǎn)品B的需求量。則可以證明上述產(chǎn)品的差異化模型不存在納什均衡。納什均衡的不變性由納什均衡的定義知,為納什均衡的充要條件是對(duì)任何參與人支付差,而與這個(gè)差值是多少無(wú)關(guān),由此可導(dǎo)出納什均衡的一個(gè)性質(zhì):納什均衡的不變性命題2.1
設(shè)為已知策略型博弈。(1)納什均衡在支付函數(shù)的正仿射變換下不變。對(duì),令,其中,則G與有相同的納什均衡。(2)納什均衡在支付函數(shù)的局部變換下不變。給定及.令,G與有相同的納什均衡。重復(fù)剔除被嚴(yán)格占優(yōu)策略均衡與納什均衡的關(guān)系命題2.2
若是有限策略型博弈的納什均衡,那么它不會(huì)被重復(fù)剔除被嚴(yán)格占優(yōu)策略的過(guò)程所剔除。命題2.3在有限策略型博弈中,如果是重復(fù)剔除被嚴(yán)格占優(yōu)策略均衡,則它必為納什均衡。2.2 求納什均衡的劃線法劃線法對(duì)于二人有限博弈,,G可由支付矩陣給出。設(shè)為G的納什均衡。即是局中人2對(duì)于的最優(yōu)反應(yīng),是局中人1對(duì)于的最優(yōu)反應(yīng)。G的納什均衡可由以下劃線法求得。1.對(duì)局中人1的每個(gè)策略,尋找局中人2的最優(yōu)反應(yīng)。若最優(yōu)反應(yīng)為,即,則在支付矩陣元素下劃一短線。2.對(duì)局中人2的每個(gè)策略,尋找局中人1的最優(yōu)反應(yīng),若最優(yōu)反應(yīng)為,即,則在元素下劃一短線。3.如果支付矩陣中元素的每個(gè)分量都劃有短線,這表明,是關(guān)于的最優(yōu)反應(yīng)。也是關(guān)于的最優(yōu)反應(yīng),故,策略組合為G的納什均衡。例2.4在囚徒困境問(wèn)題中,其支付矩陣為應(yīng)用劃線法,支付矩陣中的元素(-5,-5)下都劃上了短線,其所對(duì)應(yīng)的策略組合為納什均衡,且是嚴(yán)格的納什均衡,例2.5
斗雞博弈兩個(gè)人舉著火棍從獨(dú)木橋的兩端走向中央進(jìn)行火拼,每個(gè)人都有兩種戰(zhàn)略:繼續(xù)前進(jìn),或退下陣來(lái)。若兩個(gè)人都繼續(xù)前進(jìn),則兩敗具傷;若一方前進(jìn),另一方退下來(lái),前進(jìn)者勝利,退下來(lái)的丟了面子;若兩人都退下來(lái),兩人都丟面子,支付矩陣如下:用劃線法可得嚴(yán)格納什均衡(退,進(jìn)),(進(jìn),退)。例2.6智豬博弈豬圈里圈著兩頭豬,一頭大豬,一頭小豬。豬圈的一邊有一個(gè)豬食槽,另一邊安裝一個(gè)按鈕,按一下按鈕會(huì)有10個(gè)單位的豬食進(jìn)槽。但誰(shuí)按按鈕就需要付2個(gè)單位的成本。若大豬先到,大豬吃到9個(gè)單位,小豬吃到1個(gè)單位;若同時(shí)到,大豬吃7個(gè)單位,小豬吃3個(gè)單位;若小豬先到,大豬吃6個(gè)單位,小豬吃4個(gè)單位,支付矩陣如下。嚴(yán)格納什均衡為大豬“按”,小豬“等待”。例2.7在例1.8中的大堤維護(hù)博弈中,支付矩陣為利用劃線法可得納什均衡(維護(hù),維護(hù)),(不維護(hù),不維護(hù))。為了保護(hù)生命財(cái)產(chǎn)的安全,政府可以立法,如果參與人不維護(hù)大堤,需付罰款5,則有支付矩陣這時(shí)該博弈有惟一的納什均衡(維護(hù),維護(hù))。2.3最優(yōu)反應(yīng)映射與納什均衡定義2.2局中人的最優(yōu)反應(yīng)映射局中人i的最優(yōu)反應(yīng)映射是一個(gè)定義于策略組合集合S,取值于策略集的子集的集值映射(映射值為集合的映射稱為集值映射),,滿足定義2.2表明,局中人i的最優(yōu)化反應(yīng)映射僅與有關(guān)。反應(yīng)函數(shù)當(dāng)為單點(diǎn)集時(shí),稱為局中人i的最優(yōu)反應(yīng)函數(shù),簡(jiǎn)稱反應(yīng)函數(shù)。這時(shí)將記為。定義2.3最優(yōu)反應(yīng)映射n個(gè)參與人的最優(yōu)反應(yīng)映射的乘積稱為博弈G的最優(yōu)反應(yīng)映射。博弈的最優(yōu)反應(yīng)映射與納什均衡之間的關(guān)系定理2.1為策略型博弈的納什均衡的充要條件是。設(shè)為一集值映射。若,稱x為的不動(dòng)點(diǎn)。利用不動(dòng)點(diǎn)概念,定理2.1可以如下敘述。命題2.4
是策略型博弈G的納什均衡的充要條件是是最優(yōu)反應(yīng)映射的不動(dòng)點(diǎn),即。例2.8
在囚徒困境問(wèn)題中,是囚徒困境博弈的惟一納什均衡。例2.9多囚徒困境問(wèn)題將例1.6中兩個(gè)囚徒推廣為個(gè)囚徒,且量刑的規(guī)則為,如果n個(gè)囚徒都抗拒,各判1年;如n個(gè)囚徒都坦白,各判5年;如果n個(gè)囚徒中有的坦白,有的抗拒。坦白者釋放,抗拒者判8年。這說(shuō)明是惟一的納什均衡。例2.9多囚徒困境問(wèn)題將例1.6中兩個(gè)囚徒推廣為個(gè)囚徒,且量刑的規(guī)則為,如果n個(gè)囚徒都抗拒,各判1年;如n個(gè)囚徒都坦白,各判5年;如果n個(gè)囚徒中有的坦白,有的抗拒。坦白者釋放,抗拒者判8年。,這說(shuō)明是惟一的納什均衡。
例2.10設(shè)有n家電視臺(tái)可選擇m部電視劇在某段時(shí)間同時(shí)播放。電視臺(tái)的播放的收益為觀眾數(shù)的倍。已知偏好于第部電視劇的觀眾為,且。如果同時(shí)有幾個(gè)電視臺(tái)同時(shí)播放同一部電視劇,則它們均分觀眾,考慮電視臺(tái)如何播放電視節(jié)目。首先建立策略型博弈模型,其中局中人集合,表示第i家電視臺(tái),策略集合,表示電視臺(tái)i選擇第j部電視劇播放。局中人的支付函數(shù)
且其余電視臺(tái)中還有家播放。。對(duì),且中有個(gè)1。。由知,故有,從而,對(duì),,??芍考译娨暸_(tái)同時(shí)播放電視劇1是惟一的納什均衡,該例解釋了n家電視臺(tái)熱播同一部電視劇的實(shí)際情況。例2.11國(guó)際聯(lián)盟博弈為毗鄰某海岸的三個(gè)國(guó)家,他們?cè)谶@個(gè)海岸附近駐扎軍隊(duì)。要想控制整個(gè)海灣,至少需要兩個(gè)國(guó)家聯(lián)合起來(lái)。三國(guó)的兵力部署與相應(yīng)的支付由以下支付矩陣給出
w選擇陸地
w選擇近海支付向量的第1,2,3個(gè)分量分別給出的的支付值。局中人的最優(yōu)反應(yīng)映射為,,,。因s為納什均衡需滿足,故納什均衡僅能存在于策略組合,,,中。
故納什均衡存在于策略組合,,中。,,從而該博弈的納什均衡為,,,相應(yīng)的支付向量為,,。兩國(guó)結(jié)成聯(lián)盟控制海灣將會(huì)出現(xiàn)以下情況。(1)L與S聯(lián)盟,分別將兵力部署于北、東,W將把兵力部署于陸地;(2)L與W聯(lián)盟,分別把兵力部署于北、海,S將把兵力部署于西;(3)S與W聯(lián)盟,分別將兵力部署于東、海,L將把兵力部署于南。盡管三個(gè)國(guó)家都聯(lián)合起來(lái),總支付最大,但他們之間如無(wú)具有約束力的協(xié)議,這種聯(lián)盟是不穩(wěn)定的,因它不是一個(gè)納什均衡。由上例我們可以得出求多人有限策略型博弈的納什均衡的方法,步驟如下:1.對(duì)S中所有的策略組合計(jì)算,如果,則從S剔除,剩余策略組合集合記為。2.對(duì)中所有的策略組合S計(jì)算。如,則從S中剔除,剩余集合記為。3.應(yīng)用類似方法n步,如,從中剔除,最后得到。中的策略組合都是納什均衡。特別是對(duì)于三人有限策略博弈模型,我們可給出納什均衡的劃線法。設(shè)參與人的策略集合分別為,,對(duì)
.對(duì)每個(gè),,都可寫(xiě)出一個(gè)以3維向量為元素的m行n列的支付矩陣。劃線法步驟如下1.對(duì)每個(gè)支付矩陣,比較每一行中的元素的第2個(gè)分量,最大者下面劃線。2.對(duì)每個(gè)支付矩陣,比較每一列中的元素的第1個(gè)分量,最大者下面劃線。3.對(duì)于個(gè)支付矩陣的相同行列的元素,比較第3個(gè)分量,最大者下面劃線。例2.12公共物品提供對(duì)于公共物品,提供者與不提供者都享受同樣的效益,且公共物品提供的成本僅與其提供的服務(wù)水平有關(guān),而與享用其效益的人數(shù)無(wú)關(guān)。設(shè)甲、乙、丙三人決定是否提供某項(xiàng)公共物品。1表示提供,0表示不提供。提供者需付出成本。而收益為已被提供的公共物品的數(shù)量,分別就討論該博弈的納什均衡。(1)當(dāng)c=0.5,支付矩陣如下。丙提供:丙不提供:由劃線法知,(1,1,1)是納什均衡。(2)當(dāng)c=1時(shí),支付矩陣為丙提供:丙不提供:
任何一個(gè)策略組合都是納什均衡。(3)c=1.5,支付矩陣為丙提供:丙不提供:(0,0,0)為納什均衡。2.4求納什均衡的反應(yīng)函數(shù)法如果博弈G的n個(gè)局中人的最優(yōu)反應(yīng)映射都是反應(yīng)函數(shù),我們有如下定理。定理2.2為博弈的納什均衡的充要條件是是局中人的n條最優(yōu)反應(yīng)曲線,的交點(diǎn)。由定理2.2,可用以下兩步求得納什均衡。1.求出每個(gè)參與人的最優(yōu)反應(yīng)函數(shù),。2.求,的交點(diǎn)。例2.13設(shè)策略型博弈其中,支付函數(shù)為求G的納什均衡。為求,固定,求解優(yōu)化問(wèn)題:可得:為求,固定,求解優(yōu)化問(wèn)題:可得:兩條反應(yīng)曲線的交點(diǎn)為它們給出了G的三個(gè)納什均衡。
例2.14
設(shè)。支付函數(shù)為為求,固定,求解優(yōu)化問(wèn)題可得,。為求,固定,求解優(yōu)化問(wèn)題由上例知兩條最優(yōu)反應(yīng)曲線的交點(diǎn)為納什均衡。例2.15投資問(wèn)題兩個(gè)投資主體中央政府與地方政府都可向基礎(chǔ)設(shè)施與加工工業(yè)兩個(gè)方向投資,記:中央政府對(duì)于基礎(chǔ)設(shè)施的投資水平;:中央政府對(duì)于加工工業(yè)的投資水平;:地方政府對(duì)于基礎(chǔ)設(shè)施的投資水平;:地方政府對(duì)于加工工業(yè)的投資水平。中央政府與地方政府的投資效益為如下的Cobb-Douglas型函數(shù)。參數(shù)。的假設(shè)表明中央政府考慮基礎(chǔ)設(shè)施投資的外部性,而地方政府不考慮這種外部性,即中央政府對(duì)基礎(chǔ)設(shè)施投資有更大的偏好。在這個(gè)投資博弈中,參與人1為中央政府,參與人2為地方政府。中央政府選擇基礎(chǔ)設(shè)施投資水平,加工業(yè)投資水平。地方政府也選擇基礎(chǔ)設(shè)施投資水平與加工業(yè)投資水平。中央政府的問(wèn)題是,對(duì)于固定的地方政府的投資選擇,選擇,在投資預(yù)算約束為中央政府的投資預(yù)算)下求解最優(yōu)化問(wèn)題地方政府的問(wèn)題是固定中央政府的選擇,選擇,在預(yù)算約束下最大化自己的效益。其中為地方政府的投資預(yù)算。首先考慮中央政府問(wèn)題,將代入目標(biāo)函數(shù),將中央政府問(wèn)題簡(jiǎn)化為由1階條件,可得(1)同理,地方政府問(wèn)題可被簡(jiǎn)化為
由1階條件,可得(2)不妨設(shè),對(duì)于,分以下三種情況討論該博弈的納什均衡。1.中央政府最優(yōu)反應(yīng)函數(shù)為地方政府的最優(yōu)反應(yīng)函數(shù)為納什均衡為納什均衡如圖2-1(a)所示。圖2-1(a)2.中央政府最優(yōu)反應(yīng)函數(shù)為地方政府最優(yōu)反應(yīng)函數(shù)為納什均衡為即地方政府投資于加工業(yè),中央政府投資于基礎(chǔ)設(shè)施。納什均衡如圖2-1(b)所示。圖2-1(b)3.中央政府最優(yōu)反應(yīng)函數(shù)為地方政府最優(yōu)反應(yīng)函數(shù)不變。納什均衡為即中央政府把全部資金投資于基礎(chǔ)設(shè)施,地方政府彌補(bǔ)中央政府對(duì)于基礎(chǔ)設(shè)施的投資不足,然后將剩余資金投資于加工業(yè)。納什均衡如圖2-1(c)所示。圖2-1(c)
2.5納什均衡的性質(zhì)定義與假設(shè)條件定義2.4
稱為擬凹函數(shù),如果使,則有對(duì)成立。若以上不等式嚴(yán)格成立,則稱嚴(yán)格擬凹。注意,如果是單調(diào)函數(shù),則擬凹。若為凹函數(shù),則為擬凹函數(shù)。但為擬凹函數(shù),不一定是凹函數(shù)。在納什均衡的存在性與惟一性的研究中需要以下假設(shè)。假設(shè)1博弈的每個(gè)局中人的策略集合為緊凸集,
指m維實(shí)數(shù)空間,中的緊集指有界閉集。假設(shè)2對(duì)局中人i的支付函數(shù)為連續(xù)函數(shù)。假設(shè)3對(duì),局中人i的支付函數(shù)為的凹函數(shù)。假設(shè)4對(duì),局中人i的支付函數(shù)為的擬凹函數(shù)。假設(shè)5對(duì),局中人i的支付函數(shù)為的嚴(yán)格擬凹函數(shù)。納什均衡存在性定理定理2.3設(shè)策略型博弈G滿足假設(shè)1,2,4,則G至少存在一個(gè)納什均衡。當(dāng)博弈G滿足假設(shè)1,2,3或1,2,5時(shí),G存在納什均衡。為看到假設(shè)5的特殊作用,我們給出以下命題。命題2.5設(shè)為策略型博弈且滿足假設(shè)1,2,5,則局中人的最優(yōu)反應(yīng)映射,恰含有一點(diǎn)。假設(shè)5的重要作用在于局中人的最優(yōu)反應(yīng)映射這個(gè)集值映射轉(zhuǎn)化為局中人的最優(yōu)反應(yīng)函數(shù)。此時(shí)納什均衡的惟一性問(wèn)題在下面的關(guān)于博弈G納什均衡的唯一性的討論種中,假設(shè)局中人的最優(yōu)反應(yīng)映射為反應(yīng)函數(shù)。定義2.5設(shè),x到y(tǒng)的距離被定義為定義2.6壓縮映射設(shè)映射,其中。如果存在正數(shù),使對(duì),,稱為壓縮映射。可用以下命題判斷為壓縮映射。命題2.6設(shè)可微,,如果存在,使對(duì)任意x成立,則為壓縮映射。例2.16因,所以為壓縮映射。定理2.4
若策略型博弈滿足假設(shè)1,2,5,且最優(yōu)反應(yīng)映射為壓縮映射。則G有惟一的納什均衡。定義2.7光滑博弈稱策略型博弈為光滑博弈,如果下述導(dǎo)數(shù)在策略型組合集合S內(nèi)部上存在且連續(xù)(指S去掉邊界)。定義2.8嚴(yán)格光滑博弈稱策略型博弈G為嚴(yán)格光滑博弈,如果G是光滑的,且對(duì)策略組合集合的任何邊界點(diǎn)有上述極限對(duì)于中所有趨于的序列而取。定義2.9設(shè)A為m階方陣,若負(fù)定,稱A為擬負(fù)定矩陣。用表示1階條件系統(tǒng)的Jacobian矩陣,即它是由元素構(gòu)成的階方陣。例如
其中。
定理2.5設(shè)G為完全信息靜態(tài)的光滑博弈,滿足假設(shè)1,2,4.表示該博弈的最優(yōu)反應(yīng)映射的Jacobian矩陣,如果它對(duì)擬負(fù)定,且對(duì),,則G有唯一的納什均衡。定理2.6Rosen惟一性定理設(shè)是嚴(yán)格光滑博弈,滿足條件1,2,5。且對(duì)任何擬負(fù)定,則G有惟一的納什均衡。
例2.17設(shè)策略型博弈,其中,,,.而不是負(fù)定矩陣,從而不是擬負(fù)定的。另外,其中不是壓縮映射。故我們不能得到G有惟一的納什均衡的結(jié)論,在例2.13中我們已求出了G的3個(gè)納什均衡。例2.18
設(shè),,,顯然G為嚴(yán)格光滑博弈,且,負(fù)定,從而擬負(fù)定。由定理2.6知,G有惟一的納什均衡。
2.6混合策略下的納什均衡
2.6.1混合策略下的納什均衡例2.19“石頭、剪子÷布”游戲是一個(gè)二人有限策略型博弈,它的支付矩陣為利用劃線法易見(jiàn),納什均衡不存在。為了解決這類均衡不存在的問(wèn)題,需要把策略的概念擴(kuò)充為混合策略的概念,進(jìn)而把納什均衡的概念擴(kuò)充為混合策略意義下的納什均衡的概念。而把前面介紹過(guò)的策略與納什均衡分別稱為純策略與純策略意義下的納什均衡?;旌喜呗詾榉奖闫鹨?jiàn),針對(duì)二人有限策略型博弈討論這個(gè)問(wèn)題。設(shè)。稱上的一個(gè)概率分布為參與人的一個(gè)混合策略,故可分別用
表示兩個(gè)參與人的混合策略集合。為參與人1的混合策略,表示參與人1以概率隨機(jī)選擇純策略。為參與人2的混合策略,表示參與人2以概率隨機(jī)選擇純策略。易知,參與人1的混合策略等同于他的純策略。參與人2的純策略等同于他的純策略。因而混合策略包含了純策略,即混合策略是純策略概念的擴(kuò)充。
稱為混合策略組合。對(duì)于混合策略組合,由于參與人隨機(jī)選擇純策略,因而參與人的支付值也是隨機(jī)的,故需用期望支付代替博弈G中的支付函數(shù)。對(duì)于給定的,參與人1的期望支付為參與人2的期望支付為稱為G的混合擴(kuò)充。記,,,。分別為參與人1與2的支付矩陣。利用支付矩陣A與B,參與人1與2的期望支付可表示為這里X表示參與人1的混合策略行向量,Y表示參與人2的混合策略列向量。定義2.10
稱混合策略組合為的納什均衡或G的混合策略納什均衡,如果,對(duì)任何成立,,對(duì)任何成立。當(dāng)以上兩個(gè)不等式嚴(yán)格成立時(shí),稱為G的嚴(yán)格混合策略納什均衡?;旌喜呗砸饬x下的納什均衡的含意仍為:固定是參與人2對(duì)的最優(yōu)反應(yīng),固定是參與人1對(duì)的最優(yōu)反應(yīng)。2.72×2雙矩陣博弈的納什均衡
設(shè)為二人有限博弈,且,這時(shí)兩個(gè)參與人的支付矩陣分別為對(duì)G的支付函數(shù)作正仿射變換,相當(dāng)于對(duì)參與人的支付矩陣每個(gè)元素乘以一個(gè)正數(shù)再加一常數(shù),即其中,,。對(duì)G的支付函數(shù)作局部變換,相當(dāng)于A的某一列加一常數(shù)或B的某行加一常數(shù),即可以證明與有相同的混合策略納什均衡。當(dāng)為2階方陣時(shí),對(duì)G的支付函數(shù)進(jìn)行局部變換,可對(duì)A進(jìn)行列變換將A變?yōu)閷?duì)角形。對(duì)B進(jìn)行行變換將B變?yōu)閷?duì)角形。1(1)、(5)成立條件圖形納什均衡2(1)、(6)成立3(1)、(7)成立4(1)、(8)成立5(2)、(5)成立6(2)、(6)成立7(2)、(7)成立8(2)、(8)成立9(3)、(5)成立10(3)、(6)成立11(3)、(7)成立(3)
(1)
(2)
y10x
12(3)、(8)成立13(4)、(5)成立14(4)、(6)成立15(4)、(7)成立16(4)、(8)成立(1)
(2)
(3)
表2.1給出了除之外的雙矩陣的所有納什均衡。這里。例2.20囚徒困境對(duì)于例2.9的囚徒困境問(wèn)題,兩個(gè)局中人的支付矩陣經(jīng)局部變換后均為,由表2.1知,囚徒困境問(wèn)題僅有一個(gè)純策略納什均衡(坦白,坦白)。例2.21斗雞博弈對(duì)于2.10的斗雞博弈問(wèn)題,兩個(gè)參與人的支付矩陣經(jīng)局部變換后均為,。由表2.1知,該博弈有兩個(gè)純策略納什均衡(進(jìn),退)、(退,進(jìn))與一個(gè)混合策略納什均衡。即以的概率退卻,以的概率進(jìn)攻。斗雞博弈表明了參與人在競(jìng)爭(zhēng)中總是采取避免兩敗俱傷的理性行為。例2.22智豬博弈對(duì)例2.11的智豬博弈問(wèn)題,兩個(gè)參與人的支付矩陣經(jīng)局部變換后,分別為
,
。由表2.1知,該博弈僅有一個(gè)純策略納什均衡:大豬按,小豬等待。例2.23交通規(guī)則有的國(guó)家規(guī)定右側(cè)通行,有的國(guó)家規(guī)定左側(cè)通行。如果不作規(guī)定,情況如何?設(shè)兩個(gè)參與人的交通規(guī)則博弈的支付矩陣如下。兩個(gè)參與人的支付矩陣為,經(jīng)局部變換后為以上博弈符合表2.1中第11種情況,,。純策略納什均衡為(左,左,),(右,右),混合策略納什均衡為例2.24狩獵博弈兩個(gè)獵人必須同時(shí)決定是獵鹿還是獵兔。如果兩人均決定獵鹿。他們會(huì)獲得一只鹿,然后平分。如果兩人均決定獵兔,、那么每人可各獲得一只野兔。如果一人決定獵鹿,另一人決定獵兔,獵兔者將獲得一只野兔,而獵鹿者將一無(wú)所獲。對(duì)每個(gè)獵人而言,半只鹿的收益要大于1只野兔的收益,該博弈的支付矩陣為對(duì)支付矩陣作局部變換,可得,因而納什均衡與上例相同:,及混合策略納什均衡這里“獵鹿”體現(xiàn)了參與人在政治、經(jīng)濟(jì)、軍事等活動(dòng)中的合作行為,“獵兔”體現(xiàn)了參與人的不合作行為。例2.25性別戰(zhàn)有一對(duì)情侶,男士喜歡看足球,女士喜歡看歌舞,周末他們兩人可選擇去看足球或看歌舞。支付矩陣為由表2.1的第11種情況,,,該博弈有2個(gè)純策略納什均衡(足球,足球),(歌舞,歌舞)與一個(gè)混合策略納什均衡。性別戰(zhàn)博弈刻畫(huà)了實(shí)際問(wèn)題中參與人合作要優(yōu)于不合作,但合作的收益還有區(qū)別的情形。例2.26公共物品提供在兩個(gè)參與人的公共物品提供博弈中,參與人可從公共物品中收益1,而付出的成本分別為。支付矩陣如下。分別對(duì)兩個(gè)參與人的支付矩陣作局部變換,變換后仍為??傻?,。。由表2.1知,該博弈的納什均衡為(提供,不提供),(不提供,提供)。及混合策略納什均衡。兩個(gè)純策略納什均衡刻畫(huà)了公共物品提供問(wèn)題中的參與人之間的“搭便車(chē)”行為。例2.27監(jiān)督博弈監(jiān)督博弈概括了諸如稅收檢查、質(zhì)量檢驗(yàn)、腐敗懲治、雇主監(jiān)督雇員等活動(dòng)。以稅收檢查為例,博弈的參與人為稅檢機(jī)關(guān)與納稅人。稅檢機(jī)關(guān)所能選擇的策略是檢查與不檢查,納稅人的選擇是逃稅與不逃稅。支付矩陣如下。
其中為應(yīng)納稅額,為檢查成本,F(xiàn)是罰款,且。對(duì)兩個(gè)參與人的支付矩陣作局部變換后有,,。由表2.1,可得混合策略納什均衡,。均衡時(shí),稅檢機(jī)關(guān)以概率檢查,越大,這個(gè)概率也越大;納稅人以的概率逃稅。檢查成本c越大,應(yīng)納稅款越大,罰款F越大,這個(gè)概率越小。
2.8混合策略納什均衡的有關(guān)結(jié)論更一般的混合策略意義下的納什均衡混合策略設(shè)為一有限策略型博弈模型,其中局中人集合,對(duì)于,純策略集合為,上之一概率分布,,稱為局中人i的一個(gè)混合策略。局中人i采用混合策略的含義是局中人i對(duì)純策略進(jìn)行隨機(jī)選擇,以概率選擇純策略,。記,,因而可用表示局中人的所有混合策略構(gòu)成的集合。稱為G的混合策略組合。期望支付如果局中人隨機(jī)選擇純策略,則局中人的支付也是隨機(jī)的,因而我們需要用局中人的期望支付描述局中人的選擇行為。給定,局中人i的期望支付為式中,.這樣
,顯然,局中人i的純策略等同于混合策略,因而混合策略集中包含了純策略。稱為G的混合擴(kuò)充。定義2.10設(shè)為
溫馨提示
- 1. 本站所有資源如無(wú)特殊說(shuō)明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請(qǐng)下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請(qǐng)聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
- 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁(yè)內(nèi)容里面會(huì)有圖紙預(yù)覽,若沒(méi)有圖紙預(yù)覽就沒(méi)有圖紙。
- 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
- 5. 人人文庫(kù)網(wǎng)僅提供信息存儲(chǔ)空間,僅對(duì)用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對(duì)用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對(duì)任何下載內(nèi)容負(fù)責(zé)。
- 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請(qǐng)與我們聯(lián)系,我們立即糾正。
- 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶因使用這些下載資源對(duì)自己和他人造成任何形式的傷害或損失。
最新文檔
- 高效辦公空間運(yùn)營(yíng)策略書(shū)
- 錯(cuò)誤處理機(jī)制增強(qiáng)穩(wěn)定性
- 雙方離婚子女歸女方協(xié)議書(shū)
- 公司員工加班申請(qǐng)記錄表
- 勞動(dòng)合同業(yè)務(wù)員勞動(dòng)合同
- 培訓(xùn)場(chǎng)地出租合同
- 各行業(yè)專利申請(qǐng)數(shù)量統(tǒng)計(jì)表
- 農(nóng)民合作社經(jīng)營(yíng)模式方案
- 亮化工程合同
- 2025年合肥從業(yè)資格證模擬考試試題
- 《 大學(xué)生軍事理論教程》全套教學(xué)課件
- 三年級(jí)數(shù)學(xué)下冊(cè)一兩位數(shù)乘兩位數(shù)的乘法2問(wèn)題解決作業(yè)課件西師大版
- 家校溝通經(jīng)驗(yàn)分享-溝通有方法教育有溫度
- 2024年福建省廈門(mén)市翔安區(qū)殘疾人聯(lián)合會(huì)招聘殘疾人工作聯(lián)絡(luò)員29人歷年重點(diǎn)基礎(chǔ)提升難、易點(diǎn)模擬試題(共500題)附帶答案詳解
- 幼兒園家長(zhǎng)會(huì)疾病預(yù)防
- 《儲(chǔ)糧害蟲(chóng)防治技術(shù)》課件-第六章 儲(chǔ)糧保護(hù)劑及其應(yīng)用
- 排水管道施工組織設(shè)計(jì)排水管道施工組織設(shè)計(jì)排水施工排水管道施工施工設(shè)計(jì)
- 人工智能科普教育活動(dòng)方案設(shè)計(jì)
- 2024未來(lái)會(huì)議:AI與協(xié)作前沿趨勢(shì)白皮書(shū)
- 2024年廣東普通專升本《公共英語(yǔ)》完整版真題
- 國(guó)家中長(zhǎng)期科技發(fā)展規(guī)劃(2021-2035)
評(píng)論
0/150
提交評(píng)論