博弈論與經(jīng)濟(jì)-納什均衡

上傳人：熊*** IP屬地：山東上傳時(shí)間：2024-06-01 格式：PPT 頁(yè)數(shù)：89 大小：1.90MB 積分：25 舉報(bào) 版權(quán)申訴

已閱讀5頁(yè)，還剩84頁(yè)未讀，繼續(xù)免費(fèi)閱讀

版權(quán)說(shuō)明：本文檔由用戶提供并上傳，收益歸屬內(nèi)容提供方，若內(nèi)容存在侵權(quán)，請(qǐng)進(jìn)行舉報(bào)或認(rèn)領(lǐng)

文檔簡(jiǎn)介

納什均衡2.1納什均衡的定義納什均衡是博弈論中最重要的概念，各種非合作博弈模型的均衡概念都是建立在納什均衡基礎(chǔ)之上的。納什均衡是個(gè)策略組合，它滿足兩個(gè)要求。1.對(duì)每個(gè)局中人，能夠預(yù)期到對(duì)手采用策略組合。2.對(duì)每個(gè)局中人，是他應(yīng)對(duì)的最好的策略。納什均衡的定義定義2.1

設(shè)為一具有完全信息的策略型博弈模型，稱策略組合為G的一個(gè)納什均衡。如果對(duì)是在i的對(duì)手策略組合為條件下局中人i的最優(yōu)反應(yīng)策略，即

或?qū)?。如果以上不等式?duì)嚴(yán)格成立，稱為G的嚴(yán)格納什均衡。在完全信息靜態(tài)博弈中可用納什均衡預(yù)測(cè)每個(gè)參與人的策略，進(jìn)而預(yù)測(cè)我們所關(guān)心的各種博弈結(jié)果。擴(kuò)展型博弈模型的納什均衡定義為它所對(duì)應(yīng)的策略型博弈的納什均衡。例2.1囚徒困境問(wèn)題在例1.6給出的囚徒困境問(wèn)題中，是惟一的嚴(yán)格納什均衡。策略組合都不是納什均衡。例2.2伯川德（Berchand）均衡設(shè)有生產(chǎn)同質(zhì)產(chǎn)品的兩個(gè)企業(yè)，同時(shí)獨(dú)立地確定產(chǎn)品的價(jià)格。已知該產(chǎn)品市場(chǎng)需求函數(shù)為，滿足。這里q代表產(chǎn)量，p代表價(jià)格。兩個(gè)企業(yè)具有相同的單位成本.企業(yè)的利潤(rùn)函數(shù)如下：這里表示兩個(gè)企業(yè)的價(jià)格分別為時(shí)，市場(chǎng)對(duì)于企業(yè)的產(chǎn)品的需求量。上述企業(yè)價(jià)格競(jìng)爭(zhēng)問(wèn)題可以歸結(jié)為完全信息靜態(tài)博弈模型其中局中人集合。策略集合表示企業(yè)所有可行價(jià)格構(gòu)成的集合。支付函數(shù)。為求該模型的納什均衡，可先將策略組合集合中的點(diǎn)分為4類，分別討論它們是否能構(gòu)成納什均衡。第1類，第2類，第3類，第4類,（1）當(dāng)，不是納什均衡。.（2）當(dāng)，不是納什均衡。（3）當(dāng)，不是納什均衡。（4）當(dāng)，是納什均衡。稱其為伯川德均衡。例2.3簡(jiǎn)單產(chǎn)品差異化模型考慮由商店構(gòu)成的市場(chǎng)，A與B分別銷售不同品牌的商品，進(jìn)行價(jià)格競(jìng)爭(zhēng)。假設(shè)生產(chǎn)的單位成本為零。消費(fèi)者分為兩類,個(gè)消費(fèi)者偏好于產(chǎn)品A，個(gè)消費(fèi)者偏好于產(chǎn)品B。A,B兩種品牌價(jià)格分別為。設(shè)消費(fèi)者可從A或B處購(gòu)買(mǎi)單位商品。用表示由于購(gòu)買(mǎi)不喜歡的產(chǎn)品所付出的厭惡成本，假設(shè)消費(fèi)者具有如下的效用函數(shù)用表示消費(fèi)者對(duì)于產(chǎn)品A的需求量；表示消費(fèi)者對(duì)于產(chǎn)品B的需求量。則可以證明上述產(chǎn)品的差異化模型不存在納什均衡。納什均衡的不變性由納什均衡的定義知，為納什均衡的充要條件是對(duì)任何參與人支付差，而與這個(gè)差值是多少無(wú)關(guān)，由此可導(dǎo)出納什均衡的一個(gè)性質(zhì)：納什均衡的不變性命題2.1

設(shè)為已知策略型博弈。（1）納什均衡在支付函數(shù)的正仿射變換下不變。對(duì)，令，其中，則G與有相同的納什均衡。（2）納什均衡在支付函數(shù)的局部變換下不變。給定及.令,G與有相同的納什均衡。重復(fù)剔除被嚴(yán)格占優(yōu)策略均衡與納什均衡的關(guān)系命題2.2

若是有限策略型博弈的納什均衡，那么它不會(huì)被重復(fù)剔除被嚴(yán)格占優(yōu)策略的過(guò)程所剔除。命題2.3在有限策略型博弈中，如果是重復(fù)剔除被嚴(yán)格占優(yōu)策略均衡，則它必為納什均衡。2.2 求納什均衡的劃線法劃線法對(duì)于二人有限博弈，，G可由支付矩陣給出。設(shè)為G的納什均衡。即是局中人2對(duì)于的最優(yōu)反應(yīng)，是局中人1對(duì)于的最優(yōu)反應(yīng)。G的納什均衡可由以下劃線法求得。1.對(duì)局中人1的每個(gè)策略，尋找局中人2的最優(yōu)反應(yīng)。若最優(yōu)反應(yīng)為，即，則在支付矩陣元素下劃一短線。2.對(duì)局中人2的每個(gè)策略，尋找局中人1的最優(yōu)反應(yīng)，若最優(yōu)反應(yīng)為，即，則在元素下劃一短線。3.如果支付矩陣中元素的每個(gè)分量都劃有短線，這表明，是關(guān)于的最優(yōu)反應(yīng)。也是關(guān)于的最優(yōu)反應(yīng)，故，策略組合為G的納什均衡。例2.4在囚徒困境問(wèn)題中，其支付矩陣為應(yīng)用劃線法，支付矩陣中的元素（-5，-5）下都劃上了短線，其所對(duì)應(yīng)的策略組合為納什均衡，且是嚴(yán)格的納什均衡，例2.5

斗雞博弈兩個(gè)人舉著火棍從獨(dú)木橋的兩端走向中央進(jìn)行火拼，每個(gè)人都有兩種戰(zhàn)略：繼續(xù)前進(jìn)，或退下陣來(lái)。若兩個(gè)人都繼續(xù)前進(jìn)，則兩敗具傷；若一方前進(jìn)，另一方退下來(lái)，前進(jìn)者勝利，退下來(lái)的丟了面子；若兩人都退下來(lái)，兩人都丟面子，支付矩陣如下：用劃線法可得嚴(yán)格納什均衡（退，進(jìn)），（進(jìn)，退）。例2.6智豬博弈豬圈里圈著兩頭豬，一頭大豬，一頭小豬。豬圈的一邊有一個(gè)豬食槽，另一邊安裝一個(gè)按鈕，按一下按鈕會(huì)有10個(gè)單位的豬食進(jìn)槽。但誰(shuí)按按鈕就需要付2個(gè)單位的成本。若大豬先到，大豬吃到9個(gè)單位，小豬吃到1個(gè)單位；若同時(shí)到，大豬吃7個(gè)單位，小豬吃3個(gè)單位；若小豬先到，大豬吃6個(gè)單位，小豬吃4個(gè)單位，支付矩陣如下。嚴(yán)格納什均衡為大豬“按”，小豬“等待”。例2.7在例1.8中的大堤維護(hù)博弈中，支付矩陣為利用劃線法可得納什均衡（維護(hù)，維護(hù)），（不維護(hù)，不維護(hù)）。為了保護(hù)生命財(cái)產(chǎn)的安全，政府可以立法，如果參與人不維護(hù)大堤，需付罰款5，則有支付矩陣這時(shí)該博弈有惟一的納什均衡（維護(hù)，維護(hù)）。2.3最優(yōu)反應(yīng)映射與納什均衡定義2.2局中人的最優(yōu)反應(yīng)映射局中人i的最優(yōu)反應(yīng)映射是一個(gè)定義于策略組合集合S,取值于策略集的子集的集值映射（映射值為集合的映射稱為集值映射），，滿足定義2.2表明，局中人i的最優(yōu)化反應(yīng)映射僅與有關(guān)。反應(yīng)函數(shù)當(dāng)為單點(diǎn)集時(shí)，稱為局中人i的最優(yōu)反應(yīng)函數(shù)，簡(jiǎn)稱反應(yīng)函數(shù)。這時(shí)將記為。定義2.3最優(yōu)反應(yīng)映射n個(gè)參與人的最優(yōu)反應(yīng)映射的乘積稱為博弈G的最優(yōu)反應(yīng)映射。博弈的最優(yōu)反應(yīng)映射與納什均衡之間的關(guān)系定理2.1為策略型博弈的納什均衡的充要條件是。設(shè)為一集值映射。若，稱x為的不動(dòng)點(diǎn)。利用不動(dòng)點(diǎn)概念，定理2.1可以如下敘述。命題2.4

是策略型博弈G的納什均衡的充要條件是是最優(yōu)反應(yīng)映射的不動(dòng)點(diǎn)，即。例2.8

在囚徒困境問(wèn)題中，是囚徒困境博弈的惟一納什均衡。例2.9多囚徒困境問(wèn)題將例1.6中兩個(gè)囚徒推廣為個(gè)囚徒，且量刑的規(guī)則為，如果n個(gè)囚徒都抗拒，各判1年；如n個(gè)囚徒都坦白，各判5年；如果n個(gè)囚徒中有的坦白，有的抗拒。坦白者釋放，抗拒者判8年。這說(shuō)明是惟一的納什均衡。例2.9多囚徒困境問(wèn)題將例1.6中兩個(gè)囚徒推廣為個(gè)囚徒，且量刑的規(guī)則為，如果n個(gè)囚徒都抗拒，各判1年；如n個(gè)囚徒都坦白，各判5年；如果n個(gè)囚徒中有的坦白，有的抗拒。坦白者釋放，抗拒者判8年。，這說(shuō)明是惟一的納什均衡。

例2.10設(shè)有n家電視臺(tái)可選擇m部電視劇在某段時(shí)間同時(shí)播放。電視臺(tái)的播放的收益為觀眾數(shù)的倍。已知偏好于第部電視劇的觀眾為，且。如果同時(shí)有幾個(gè)電視臺(tái)同時(shí)播放同一部電視劇，則它們均分觀眾，考慮電視臺(tái)如何播放電視節(jié)目。首先建立策略型博弈模型,其中局中人集合，表示第i家電視臺(tái)，策略集合，表示電視臺(tái)i選擇第j部電視劇播放。局中人的支付函數(shù)

且其余電視臺(tái)中還有家播放。。對(duì)，且中有個(gè)1。。由知，故有，從而，對(duì)，，?？芍考译娨暸_(tái)同時(shí)播放電視劇1是惟一的納什均衡，該例解釋了n家電視臺(tái)熱播同一部電視劇的實(shí)際情況。例2.11國(guó)際聯(lián)盟博弈為毗鄰某海岸的三個(gè)國(guó)家，他們?cè)谶@個(gè)海岸附近駐扎軍隊(duì)。要想控制整個(gè)海灣，至少需要兩個(gè)國(guó)家聯(lián)合起來(lái)。三國(guó)的兵力部署與相應(yīng)的支付由以下支付矩陣給出

w選擇陸地

w選擇近海支付向量的第1，2，3個(gè)分量分別給出的的支付值。局中人的最優(yōu)反應(yīng)映射為，，，。因s為納什均衡需滿足，故納什均衡僅能存在于策略組合，，，中。

故納什均衡存在于策略組合，，中。，，從而該博弈的納什均衡為，,，相應(yīng)的支付向量為，，。兩國(guó)結(jié)成聯(lián)盟控制海灣將會(huì)出現(xiàn)以下情況。（1）L與S聯(lián)盟，分別將兵力部署于北、東，W將把兵力部署于陸地；（2）L與W聯(lián)盟，分別把兵力部署于北、海，S將把兵力部署于西；（3）S與W聯(lián)盟，分別將兵力部署于東、海，L將把兵力部署于南。盡管三個(gè)國(guó)家都聯(lián)合起來(lái)，總支付最大，但他們之間如無(wú)具有約束力的協(xié)議，這種聯(lián)盟是不穩(wěn)定的，因它不是一個(gè)納什均衡。由上例我們可以得出求多人有限策略型博弈的納什均衡的方法，步驟如下：1.對(duì)S中所有的策略組合計(jì)算，如果，則從S剔除，剩余策略組合集合記為。2.對(duì)中所有的策略組合S計(jì)算。如，則從S中剔除，剩余集合記為。3.應(yīng)用類似方法n步，如，從中剔除，最后得到。中的策略組合都是納什均衡。特別是對(duì)于三人有限策略博弈模型,我們可給出納什均衡的劃線法。設(shè)參與人的策略集合分別為，,對(duì)

.對(duì)每個(gè)，，都可寫(xiě)出一個(gè)以3維向量為元素的m行n列的支付矩陣。劃線法步驟如下1．對(duì)每個(gè)支付矩陣，比較每一行中的元素的第2個(gè)分量，最大者下面劃線。2.對(duì)每個(gè)支付矩陣，比較每一列中的元素的第1個(gè)分量，最大者下面劃線。3.對(duì)于個(gè)支付矩陣的相同行列的元素，比較第3個(gè)分量，最大者下面劃線。例2.12公共物品提供對(duì)于公共物品，提供者與不提供者都享受同樣的效益，且公共物品提供的成本僅與其提供的服務(wù)水平有關(guān)，而與享用其效益的人數(shù)無(wú)關(guān)。設(shè)甲、乙、丙三人決定是否提供某項(xiàng)公共物品。1表示提供，0表示不提供。提供者需付出成本。而收益為已被提供的公共物品的數(shù)量，分別就討論該博弈的納什均衡。（1）當(dāng)c=0.5，支付矩陣如下。丙提供：丙不提供：由劃線法知，（1，1，1）是納什均衡。（2）當(dāng)c=1時(shí)，支付矩陣為丙提供：丙不提供：

任何一個(gè)策略組合都是納什均衡。（3）c=1.5，支付矩陣為丙提供：丙不提供：（0，0，0）為納什均衡。2.4求納什均衡的反應(yīng)函數(shù)法如果博弈G的n個(gè)局中人的最優(yōu)反應(yīng)映射都是反應(yīng)函數(shù)，我們有如下定理。定理2.2為博弈的納什均衡的充要條件是是局中人的n條最優(yōu)反應(yīng)曲線，的交點(diǎn)。由定理2.2，可用以下兩步求得納什均衡。1.求出每個(gè)參與人的最優(yōu)反應(yīng)函數(shù)，。2.求，的交點(diǎn)。例2.13設(shè)策略型博弈其中，支付函數(shù)為求G的納什均衡。為求，固定，求解優(yōu)化問(wèn)題：可得：為求，固定，求解優(yōu)化問(wèn)題：可得：兩條反應(yīng)曲線的交點(diǎn)為它們給出了G的三個(gè)納什均衡。

例2.14

設(shè)。支付函數(shù)為為求，固定，求解優(yōu)化問(wèn)題可得，。為求，固定，求解優(yōu)化問(wèn)題由上例知兩條最優(yōu)反應(yīng)曲線的交點(diǎn)為納什均衡。例2.15投資問(wèn)題兩個(gè)投資主體中央政府與地方政府都可向基礎(chǔ)設(shè)施與加工工業(yè)兩個(gè)方向投資，記：中央政府對(duì)于基礎(chǔ)設(shè)施的投資水平；：中央政府對(duì)于加工工業(yè)的投資水平；：地方政府對(duì)于基礎(chǔ)設(shè)施的投資水平；：地方政府對(duì)于加工工業(yè)的投資水平。中央政府與地方政府的投資效益為如下的Cobb-Douglas型函數(shù)。參數(shù)。的假設(shè)表明中央政府考慮基礎(chǔ)設(shè)施投資的外部性，而地方政府不考慮這種外部性，即中央政府對(duì)基礎(chǔ)設(shè)施投資有更大的偏好。在這個(gè)投資博弈中，參與人1為中央政府，參與人2為地方政府。中央政府選擇基礎(chǔ)設(shè)施投資水平，加工業(yè)投資水平。地方政府也選擇基礎(chǔ)設(shè)施投資水平與加工業(yè)投資水平。中央政府的問(wèn)題是，對(duì)于固定的地方政府的投資選擇，選擇，在投資預(yù)算約束為中央政府的投資預(yù)算)下求解最優(yōu)化問(wèn)題地方政府的問(wèn)題是固定中央政府的選擇，選擇，在預(yù)算約束下最大化自己的效益。其中為地方政府的投資預(yù)算。首先考慮中央政府問(wèn)題，將代入目標(biāo)函數(shù)，將中央政府問(wèn)題簡(jiǎn)化為由1階條件，可得（1）同理，地方政府問(wèn)題可被簡(jiǎn)化為

由1階條件，可得（2）不妨設(shè)，對(duì)于，分以下三種情況討論該博弈的納什均衡。1.中央政府最優(yōu)反應(yīng)函數(shù)為地方政府的最優(yōu)反應(yīng)函數(shù)為納什均衡為納什均衡如圖2-1(a)所示。圖2-1（a）2.中央政府最優(yōu)反應(yīng)函數(shù)為地方政府最優(yōu)反應(yīng)函數(shù)為納什均衡為即地方政府投資于加工業(yè)，中央政府投資于基礎(chǔ)設(shè)施。納什均衡如圖2-1（b）所示。圖2-1（b）3.中央政府最優(yōu)反應(yīng)函數(shù)為地方政府最優(yōu)反應(yīng)函數(shù)不變。納什均衡為即中央政府把全部資金投資于基礎(chǔ)設(shè)施，地方政府彌補(bǔ)中央政府對(duì)于基礎(chǔ)設(shè)施的投資不足，然后將剩余資金投資于加工業(yè)。納什均衡如圖2-1（c）所示。圖2-1（c）

2.5納什均衡的性質(zhì)定義與假設(shè)條件定義2.4

稱為擬凹函數(shù)，如果使,則有對(duì)成立。若以上不等式嚴(yán)格成立，則稱嚴(yán)格擬凹。注意，如果是單調(diào)函數(shù)，則擬凹。若為凹函數(shù)，則為擬凹函數(shù)。但為擬凹函數(shù)，不一定是凹函數(shù)。在納什均衡的存在性與惟一性的研究中需要以下假設(shè)。假設(shè)1博弈的每個(gè)局中人的策略集合為緊凸集,

指m維實(shí)數(shù)空間，中的緊集指有界閉集。假設(shè)2對(duì)局中人i的支付函數(shù)為連續(xù)函數(shù)。假設(shè)3對(duì)，局中人i的支付函數(shù)為的凹函數(shù)。假設(shè)4對(duì)，局中人i的支付函數(shù)為的擬凹函數(shù)。假設(shè)5對(duì)，局中人i的支付函數(shù)為的嚴(yán)格擬凹函數(shù)。納什均衡存在性定理定理2.3設(shè)策略型博弈G滿足假設(shè)1，2，4，則G至少存在一個(gè)納什均衡。當(dāng)博弈G滿足假設(shè)1，2，3或1，2，5時(shí)，G存在納什均衡。為看到假設(shè)5的特殊作用，我們給出以下命題。命題2.5設(shè)為策略型博弈且滿足假設(shè)1，2，5，則局中人的最優(yōu)反應(yīng)映射，恰含有一點(diǎn)。假設(shè)5的重要作用在于局中人的最優(yōu)反應(yīng)映射這個(gè)集值映射轉(zhuǎn)化為局中人的最優(yōu)反應(yīng)函數(shù)。此時(shí)納什均衡的惟一性問(wèn)題在下面的關(guān)于博弈G納什均衡的唯一性的討論種中，假設(shè)局中人的最優(yōu)反應(yīng)映射為反應(yīng)函數(shù)。定義2.5設(shè)，x到y(tǒng)的距離被定義為定義2.6壓縮映射設(shè)映射，其中。如果存在正數(shù)，使對(duì)，，稱為壓縮映射。可用以下命題判斷為壓縮映射。命題2.6設(shè)可微，，如果存在，使對(duì)任意x成立，則為壓縮映射。例2.16因，所以為壓縮映射。定理2.4

若策略型博弈滿足假設(shè)1，2，5，且最優(yōu)反應(yīng)映射為壓縮映射。則G有惟一的納什均衡。定義2.7光滑博弈稱策略型博弈為光滑博弈，如果下述導(dǎo)數(shù)在策略型組合集合S內(nèi)部上存在且連續(xù)（指S去掉邊界）。定義2.8嚴(yán)格光滑博弈稱策略型博弈G為嚴(yán)格光滑博弈，如果G是光滑的，且對(duì)策略組合集合的任何邊界點(diǎn)有上述極限對(duì)于中所有趨于的序列而取。定義2.9設(shè)A為m階方陣，若負(fù)定，稱A為擬負(fù)定矩陣。用表示1階條件系統(tǒng)的Jacobian矩陣,即它是由元素構(gòu)成的階方陣。例如

其中。

定理2.5設(shè)G為完全信息靜態(tài)的光滑博弈，滿足假設(shè)1，2，4.表示該博弈的最優(yōu)反應(yīng)映射的Jacobian矩陣，如果它對(duì)擬負(fù)定，且對(duì)，，則G有唯一的納什均衡。定理2.6Rosen惟一性定理設(shè)是嚴(yán)格光滑博弈，滿足條件1，2，5。且對(duì)任何擬負(fù)定，則G有惟一的納什均衡。

例2.17設(shè)策略型博弈，其中，，，.而不是負(fù)定矩陣,從而不是擬負(fù)定的。另外，其中不是壓縮映射。故我們不能得到G有惟一的納什均衡的結(jié)論，在例2.13中我們已求出了G的3個(gè)納什均衡。例2.18

設(shè)，，，顯然G為嚴(yán)格光滑博弈，且，負(fù)定，從而擬負(fù)定。由定理2.6知，G有惟一的納什均衡。

2.6混合策略下的納什均衡

2.6.1混合策略下的納什均衡例2.19“石頭、剪子÷布”游戲是一個(gè)二人有限策略型博弈，它的支付矩陣為利用劃線法易見(jiàn),納什均衡不存在。為了解決這類均衡不存在的問(wèn)題,需要把策略的概念擴(kuò)充為混合策略的概念，進(jìn)而把納什均衡的概念擴(kuò)充為混合策略意義下的納什均衡的概念。而把前面介紹過(guò)的策略與納什均衡分別稱為純策略與純策略意義下的納什均衡?；旌喜呗詾榉奖闫鹨?jiàn)，針對(duì)二人有限策略型博弈討論這個(gè)問(wèn)題。設(shè)。稱上的一個(gè)概率分布為參與人的一個(gè)混合策略，故可分別用

表示兩個(gè)參與人的混合策略集合。為參與人1的混合策略，表示參與人1以概率隨機(jī)選擇純策略。為參與人2的混合策略，表示參與人2以概率隨機(jī)選擇純策略。易知，參與人1的混合策略等同于他的純策略。參與人2的純策略等同于他的純策略。因而混合策略包含了純策略，即混合策略是純策略概念的擴(kuò)充。

稱為混合策略組合。對(duì)于混合策略組合，由于參與人隨機(jī)選擇純策略，因而參與人的支付值也是隨機(jī)的，故需用期望支付代替博弈G中的支付函數(shù)。對(duì)于給定的，參與人1的期望支付為參與人2的期望支付為稱為G的混合擴(kuò)充。記，，，。分別為參與人1與2的支付矩陣。利用支付矩陣A與B，參與人1與2的期望支付可表示為這里X表示參與人1的混合策略行向量，Y表示參與人2的混合策略列向量。定義2.10

稱混合策略組合為的納什均衡或G的混合策略納什均衡，如果，對(duì)任何成立，，對(duì)任何成立。當(dāng)以上兩個(gè)不等式嚴(yán)格成立時(shí)，稱為G的嚴(yán)格混合策略納什均衡?；旌喜呗砸饬x下的納什均衡的含意仍為：固定是參與人2對(duì)的最優(yōu)反應(yīng)，固定是參與人1對(duì)的最優(yōu)反應(yīng)。2.72×2雙矩陣博弈的納什均衡

設(shè)為二人有限博弈，且，這時(shí)兩個(gè)參與人的支付矩陣分別為對(duì)G的支付函數(shù)作正仿射變換，相當(dāng)于對(duì)參與人的支付矩陣每個(gè)元素乘以一個(gè)正數(shù)再加一常數(shù)，即其中，，。對(duì)G的支付函數(shù)作局部變換，相當(dāng)于A的某一列加一常數(shù)或B的某行加一常數(shù)，即可以證明與有相同的混合策略納什均衡。當(dāng)為2階方陣時(shí)，對(duì)G的支付函數(shù)進(jìn)行局部變換，可對(duì)A進(jìn)行列變換將A變?yōu)閷?duì)角形。對(duì)B進(jìn)行行變換將B變?yōu)閷?duì)角形。1（1）、（5）成立條件圖形納什均衡2（1）、（6）成立3（1）、（7）成立4（1）、（8）成立5（2）、（5）成立6（2）、（6）成立7（2）、（7）成立8（2）、（8）成立9（3）、（5）成立10（3）、（6）成立11（3）、（7）成立(3)

(1)

(2)

y10x

12（3）、（8）成立13（4）、（5）成立14（4）、（6）成立15（4）、（7）成立16（4）、（8）成立(1)

(2)

(3)

表2.1給出了除之外的雙矩陣的所有納什均衡。這里。例2.20囚徒困境對(duì)于例2.9的囚徒困境問(wèn)題，兩個(gè)局中人的支付矩陣經(jīng)局部變換后均為，由表2.1知，囚徒困境問(wèn)題僅有一個(gè)純策略納什均衡（坦白，坦白）。例2.21斗雞博弈對(duì)于2.10的斗雞博弈問(wèn)題，兩個(gè)參與人的支付矩陣經(jīng)局部變換后均為，。由表2.1知，該博弈有兩個(gè)純策略納什均衡（進(jìn)，退）、（退，進(jìn)）與一個(gè)混合策略納什均衡。即以的概率退卻，以的概率進(jìn)攻。斗雞博弈表明了參與人在競(jìng)爭(zhēng)中總是采取避免兩敗俱傷的理性行為。例2.22智豬博弈對(duì)例2.11的智豬博弈問(wèn)題，兩個(gè)參與人的支付矩陣經(jīng)局部變換后，分別為

。由表2.1知，該博弈僅有一個(gè)純策略納什均衡：大豬按，小豬等待。例2.23交通規(guī)則有的國(guó)家規(guī)定右側(cè)通行，有的國(guó)家規(guī)定左側(cè)通行。如果不作規(guī)定，情況如何？設(shè)兩個(gè)參與人的交通規(guī)則博弈的支付矩陣如下。兩個(gè)參與人的支付矩陣為，經(jīng)局部變換后為以上博弈符合表2.1中第11種情況，，。純策略納什均衡為（左，左，），（右，右），混合策略納什均衡為例2.24狩獵博弈兩個(gè)獵人必須同時(shí)決定是獵鹿還是獵兔。如果兩人均決定獵鹿。他們會(huì)獲得一只鹿，然后平分。如果兩人均決定獵兔，、那么每人可各獲得一只野兔。如果一人決定獵鹿，另一人決定獵兔，獵兔者將獲得一只野兔，而獵鹿者將一無(wú)所獲。對(duì)每個(gè)獵人而言，半只鹿的收益要大于1只野兔的收益，該博弈的支付矩陣為對(duì)支付矩陣作局部變換，可得，因而納什均衡與上例相同：，及混合策略納什均衡這里“獵鹿”體現(xiàn)了參與人在政治、經(jīng)濟(jì)、軍事等活動(dòng)中的合作行為，“獵兔”體現(xiàn)了參與人的不合作行為。例2.25性別戰(zhàn)有一對(duì)情侶，男士喜歡看足球，女士喜歡看歌舞，周末他們兩人可選擇去看足球或看歌舞。支付矩陣為由表2.1的第11種情況，，，該博弈有2個(gè)純策略納什均衡（足球，足球），（歌舞，歌舞）與一個(gè)混合策略納什均衡。性別戰(zhàn)博弈刻畫(huà)了實(shí)際問(wèn)題中參與人合作要優(yōu)于不合作，但合作的收益還有區(qū)別的情形。例2.26公共物品提供在兩個(gè)參與人的公共物品提供博弈中，參與人可從公共物品中收益1，而付出的成本分別為。支付矩陣如下。分別對(duì)兩個(gè)參與人的支付矩陣作局部變換，變換后仍為?？傻?，。。由表2.1知，該博弈的納什均衡為（提供，不提供），（不提供，提供）。及混合策略納什均衡。兩個(gè)純策略納什均衡刻畫(huà)了公共物品提供問(wèn)題中的參與人之間的“搭便車(chē)”行為。例2.27監(jiān)督博弈監(jiān)督博弈概括了諸如稅收檢查、質(zhì)量檢驗(yàn)、腐敗懲治、雇主監(jiān)督雇員等活動(dòng)。以稅收檢查為例，博弈的參與人為稅檢機(jī)關(guān)與納稅人。稅檢機(jī)關(guān)所能選擇的策略是檢查與不檢查，納稅人的選擇是逃稅與不逃稅。支付矩陣如下。

其中為應(yīng)納稅額，為檢查成本，F(xiàn)是罰款，且。對(duì)兩個(gè)參與人的支付矩陣作局部變換后有，，。由表2.1，可得混合策略納什均衡,。均衡時(shí),稅檢機(jī)關(guān)以概率檢查，越大，這個(gè)概率也越大；納稅人以的概率逃稅。檢查成本c越大，應(yīng)納稅款越大，罰款F越大，這個(gè)概率越小。

2.8混合策略納什均衡的有關(guān)結(jié)論更一般的混合策略意義下的納什均衡混合策略設(shè)為一有限策略型博弈模型，其中局中人集合，對(duì)于，純策略集合為,上之一概率分布，，稱為局中人i的一個(gè)混合策略。局中人i采用混合策略的含義是局中人i對(duì)純策略進(jìn)行隨機(jī)選擇，以概率選擇純策略，。記，，因而可用表示局中人的所有混合策略構(gòu)成的集合。稱為G的混合策略組合。期望支付如果局中人隨機(jī)選擇純策略，則局中人的支付也是隨機(jī)的，因而我們需要用局中人的期望支付描述局中人的選擇行為。給定，局中人i的期望支付為式中，.這樣

,顯然，局中人i的純策略等同于混合策略，因而混合策略集中包含了純策略。稱為G的混合擴(kuò)充。定義2.10設(shè)為

人人文庫(kù)> 全部分類> 教育資料 > 課件下載

溫馨提示

1. 本站所有資源如無(wú)特殊說(shuō)明，都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請(qǐng)下載最新的WinRAR軟件解壓。
2. 本站的文檔不包含任何第三方提供的附件圖紙等，如果需要附件，請(qǐng)聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
3. 本站RAR壓縮包中若帶圖紙，網(wǎng)頁(yè)內(nèi)容里面會(huì)有圖紙預(yù)覽，若沒(méi)有圖紙預(yù)覽就沒(méi)有圖紙。
4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
5. 人人文庫(kù)網(wǎng)僅提供信息存儲(chǔ)空間，僅對(duì)用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理，對(duì)用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯，并不能對(duì)任何下載內(nèi)容負(fù)責(zé)。
6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容，請(qǐng)與我們聯(lián)系，我們立即糾正。
7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶因使用這些下載資源對(duì)自己和他人造成任何形式的傷害或損失。

博弈論與經(jīng)濟(jì)-納什均衡

文檔簡(jiǎn)介

溫馨提示

最新文檔

評(píng)論

博弈論與經(jīng)濟(jì)-納什均衡

文檔簡(jiǎn)介

溫馨提示

最新文檔

評(píng)論

相關(guān)文檔