博弈論及其應(yīng)用-混合策略納什均衡._第1頁(yè)
博弈論及其應(yīng)用-混合策略納什均衡._第2頁(yè)
博弈論及其應(yīng)用-混合策略納什均衡._第3頁(yè)
博弈論及其應(yīng)用-混合策略納什均衡._第4頁(yè)
博弈論及其應(yīng)用-混合策略納什均衡._第5頁(yè)
已閱讀5頁(yè),還剩29頁(yè)未讀, 繼續(xù)免費(fèi)閱讀

下載本文檔

版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請(qǐng)進(jìn)行舉報(bào)或認(rèn)領(lǐng)

文檔簡(jiǎn)介

1、博弈論及其應(yīng)用博弈論及其應(yīng)用完全信息靜態(tài)博弈:完全信息靜態(tài)博弈: 混合策略納什均衡混合策略納什均衡張紅霞國(guó)民經(jīng)濟(jì)管理系混合策略納什均衡混合策略納什均衡4混合策略4混合策略納什均衡張紅霞國(guó)民經(jīng)濟(jì)管理系混合策略納什均衡混合策略納什均衡4混合策略混合策略4混合策略納什均衡張紅霞國(guó)民經(jīng)濟(jì)管理系混合策略混合策略The cliffhanger混合策略期望效用NE和最優(yōu)反應(yīng)案例混合策略博弈的性質(zhì)張紅霞國(guó)民經(jīng)濟(jì)管理系混合策略混合策略4混合策略:把不確定性引入純戰(zhàn)略,即參與者以一定的概率選擇他的戰(zhàn)略,比如網(wǎng)球比賽中,運(yùn)動(dòng)員以60的概率發(fā)正手球,40的概率發(fā)反手球。張紅霞國(guó)民經(jīng)濟(jì)管理系混合策略混合策略4為什么采用

2、“混合策略”?考慮下面的博弈:撲克牌對(duì)色游戲 兩個(gè)人參與這個(gè)游戲,從自己的撲克牌中抽出一張,一起翻開,如果顏色一樣,甲輸給乙一根火柴;如果顏色不一樣,甲贏得乙一根火柴。不允許出大小鬼。描述這個(gè)博弈,尋找納什均衡。張紅霞國(guó)民經(jīng)濟(jì)管理系混合策略混合策略紅紅黑黑-1,11,-1-1,11,-1乙甲張紅霞國(guó)民經(jīng)濟(jì)管理系混合策略混合策略這個(gè)博弈“不存在”我們前面所講的納什均衡在這個(gè)游戲中,重要的是猜測(cè)對(duì)方的出牌規(guī)律,同時(shí)避免對(duì)方猜到自己的出牌規(guī)律。也就是說,要盡量讓對(duì)手迷失。這種隨機(jī)化自己可選策略的做法,就是采取“混合策略”的思想。局中人以一定的概率p選擇紅,以一定的概率1-p選擇黑,則(p,1-p)概

3、括了某個(gè)局中人所有的混合策略。可知這樣的混合策略有無窮多個(gè)。兩個(gè)局中人的策略組合有無窮多個(gè)張紅霞國(guó)民經(jīng)濟(jì)管理系混合策略混合策略紅 p紅q黑1-q黑 1-p-1,11,-1-1,11,-1乙甲張紅霞國(guó)民經(jīng)濟(jì)管理系混合策略混合策略當(dāng)參與人可以選擇的策略比較多時(shí)(3個(gè),4個(gè),),用一個(gè)字母就不夠用了,需要用多個(gè)字母表示其混合策略可以想象,混合策略情況下,參與人的支付不再是確定性的。需要用期望支付期望支付的概念張紅霞國(guó)民經(jīng)濟(jì)管理系混合策略混合策略1)2 1 , 01),(,;,11111KkikikikikiKiiiKiiinnsiissSKSuuSSGn)的概率。選擇參與者為的一個(gè)混合戰(zhàn)略,稱為,那

4、么,概率分布,個(gè)參與人參加的博弈張紅霞國(guó)民經(jīng)濟(jì)管理系混合策略混合策略為混合戰(zhàn)略組合),(1niiii混合戰(zhàn)略組合空間:的混合戰(zhàn)略空間:),()(iiiivvi的期望效用函數(shù):參與人 Ssinjjjisusv)() )()(1張紅霞國(guó)民經(jīng)濟(jì)管理系混合策略混合策略4舉例撲克牌對(duì)色游戲中,假設(shè)p0.5,q0.5,寫出雙方在這種情況下的期望支付張紅霞國(guó)民經(jīng)濟(jì)管理系混合策略混合策略4舉例:兩人博弈的情況,2;,1232221212111sssSssS的純戰(zhàn)略:參與人的純戰(zhàn)略:參與人),(),(),(),(1),(21231112322111222111121321112112322212ssussuss

5、ussus1jjj時(shí)的期望效用為選擇則參與人的混合策略為認(rèn)為參與人參與人張紅霞國(guó)民經(jīng)濟(jì)管理系混合策略混合策略4舉例:兩人博弈的情況),(112111選擇混合戰(zhàn)略如果參與人312121212312111211211),(),(),(,jjjjjjssussuv他的期望效用為那么213121121213121121),(),(kjjkjkkjjkjkssussu張紅霞國(guó)民經(jīng)濟(jì)管理系混合策略混合策略4舉例:兩人博弈的情況 類似的,可以寫出參與人2的期望效用Ssiisusv)()()(簡(jiǎn)煉的表達(dá)關(guān)于期望效用函數(shù)更為張紅霞國(guó)民經(jīng)濟(jì)管理系混合戰(zhàn)略混合戰(zhàn)略硬幣博弈a1b1a2b21,-1-1, 11, -1

6、-1, 1p(1-p)q(1-q)各種戰(zhàn)略組合及其概率各種戰(zhàn)略組合及其概率(a1,a2)(a1,b2)(b1,a2)(b1,b2)pqp(1-q)(1-p)(1-q)(1-p)q期望效用期望效用1)1)(1 () 1()1 () 1)(1 (1),(211qpqpqppqv) 1()1)(1 (1)1 (1)1 () 1(),(212qpqpqppqv張紅霞國(guó)民經(jīng)濟(jì)管理系混合戰(zhàn)略納什均衡混合戰(zhàn)略納什均衡4純戰(zhàn)略納什均衡 混合戰(zhàn)略納什均衡對(duì)于某個(gè)參與人來說,最優(yōu)混合戰(zhàn)略是指期望效用最大化的混合戰(zhàn)略對(duì)于前面的例子:二人博弈來說:222*12*2*1211*211*2*11*2*1*),(),(),

7、(),(),(vvvv必須滿足混合戰(zhàn)略納什均衡張紅霞國(guó)民經(jīng)濟(jì)管理系混合戰(zhàn)略納什均衡混合戰(zhàn)略納什均衡iiiiiiiinnnvvniuuSSG),(),(, 2 , 1),(,;,*1*11,有所有的是一個(gè)納什均衡,若對(duì)混合戰(zhàn)略組合對(duì)于博弈衡定義:混合戰(zhàn)略納什均張紅霞國(guó)民經(jīng)濟(jì)管理系混合戰(zhàn)略納什均衡混合戰(zhàn)略納什均衡4 4 iijiijiiikiikiiKiiSssvsv),(),(, 0),(1有則對(duì)所有的時(shí)的最優(yōu)混合戰(zhàn)略是給定若iijiiKiiiiiiiiKiSssvsvsv),(),(),(, 0, 0211即,如果這些戰(zhàn)略之間無差異是最優(yōu)戰(zhàn)略,參與人在優(yōu)混合戰(zhàn)略的純戰(zhàn)略都所有以正的概率進(jìn)入最張

8、紅霞國(guó)民經(jīng)濟(jì)管理系混合戰(zhàn)略納什均衡混合戰(zhàn)略納什均衡iiiiiiiinssvvni),(),(, 2 , 1),(*1*,有若對(duì)所有的是一個(gè)納什均衡,定義:混合戰(zhàn)略組合由上述混合戰(zhàn)略納什均衡的定義,以及混合戰(zhàn)略的定義,可以得到:張紅霞國(guó)民經(jīng)濟(jì)管理系a1b1a2b23,2-1, 30, 0-1, 1社會(huì)福利博弈q(1-q)p(1-p)期望效用期望效用混合戰(zhàn)略納什均衡混合戰(zhàn)略納什均衡政府流浪漢qqpqqpqqpv) 15()0)1 () 1()(1 ()1)(1 (3(),(211ppqppqppqv3) 12()0)1 (3)(1 () 1)1 (2(),(212張紅霞國(guó)民經(jīng)濟(jì)管理系011反應(yīng)函數(shù)

9、反應(yīng)函數(shù)0.50.2BR1(q)BR2(p)不救濟(jì)混合策略救濟(jì)qp2 . 0, 015*1qqpv5 . 0, 0) 12(*2ppqv2 . 0, 12 . 0,1 , 02 . 0, 0qifqifqifp5 . 0, 05 . 0,1 , 05 . 0, 1pifpifpifq找工作混合策略不找工作混合戰(zhàn)略納什均衡混合戰(zhàn)略納什均衡反反應(yīng)應(yīng)對(duì)對(duì)應(yīng)應(yīng)反應(yīng)對(duì)應(yīng)反應(yīng)對(duì)應(yīng)張紅霞國(guó)民經(jīng)濟(jì)管理系混合戰(zhàn)略納什均衡混合戰(zhàn)略納什均衡硬幣博弈a1b1a2b21,-1-1, 11, -1-1, 1p(1-p)q(1-q)期望效用期望效用1)1)(1 () 1()1 () 1)(1 (1),(211qpqpqpp

10、qv) 1()1)(1 (1)1 (1)1 () 1(),(212qpqpqppqv張紅霞國(guó)民經(jīng)濟(jì)管理系 111/20,11/201/2qBR qqq 201/20,11/211/2pBRppp0.50.5BR1(q)BR2(p)反應(yīng)函數(shù)反應(yīng)函數(shù) 142BR qq 224BRpp011p(a1)q(a2)混合戰(zhàn)略納什均衡混合戰(zhàn)略納什均衡反反應(yīng)應(yīng)對(duì)對(duì)應(yīng)應(yīng)反應(yīng)對(duì)應(yīng)反應(yīng)對(duì)應(yīng)張紅霞國(guó)民經(jīng)濟(jì)管理系混合戰(zhàn)略納什均衡混合戰(zhàn)略納什均衡4報(bào)案(reporting a crime)n個(gè)人目睹一樁罪行,每個(gè)人都希望報(bào)警,但是都傾向于其他人打電話。特別的,假定能從報(bào)警中得到v單位的收益,而打電話的人需要付出c單位的成

11、本,vc0。分析這個(gè)問題的純戰(zhàn)略NE和混合戰(zhàn)略NE。張紅霞國(guó)民經(jīng)濟(jì)管理系混合戰(zhàn)略納什均衡混合戰(zhàn)略納什均衡分析: 參與人:n個(gè) 每個(gè)參與人的戰(zhàn)略集:打電話,不打電話 效用:沒有任何人打,所有人0支付; 打,v-c; 不打,但其他人至少有一個(gè)人打,v純戰(zhàn)略NE 當(dāng)只有兩個(gè)參與人的時(shí)候(公共產(chǎn)品提供的斗雞博弈)兩個(gè)NE n個(gè)人的時(shí)候:假設(shè)有m個(gè)人提供,m1 or m=1 n個(gè)NE張紅霞國(guó)民經(jīng)濟(jì)管理系混合戰(zhàn)略納什均衡混合戰(zhàn)略納什均衡混合戰(zhàn)略NE 任何一個(gè)參與人i的期望效用函數(shù): 假設(shè)i提供的概率為pi,第i個(gè)參與人最大化自己的期望效用,得到 )1 (1 ()1 (0)1 ()(),(ijjijjiii

12、iipvppcvpVvcpijj/)1 (張紅霞國(guó)民經(jīng)濟(jì)管理系混合戰(zhàn)略納什均衡混合戰(zhàn)略納什均衡由此,c/v1,因此,隨著人數(shù)n的增加,p減小,即人越多,每個(gè)人選擇報(bào)案的概率就會(huì)越小,如果n1,則p1社會(huì)心理學(xué)與博弈分析ppppn21)1/(11)/(1)1 (nnvcpvcp張紅霞國(guó)民經(jīng)濟(jì)管理系1.幾乎所有有限博弈都有有限奇數(shù)個(gè)納什均衡2.對(duì)每個(gè)參與人來講,在構(gòu)成混合戰(zhàn)略均衡純戰(zhàn)略之間是無差異的,即帶來的支即帶來的支付是無差異的付是無差異的3.3.因此,尋找混合戰(zhàn)略納什均衡的方法除因此,尋找混合戰(zhàn)略納什均衡的方法除了優(yōu)化方法,還有等值法了優(yōu)化方法,還有等值法混合戰(zhàn)略納什均衡混合戰(zhàn)略納什均衡張紅霞國(guó)民經(jīng)濟(jì)管理系案例分析案例分析4有人要打網(wǎng)球嗎?張紅霞國(guó)民經(jīng)濟(jì)管理系小結(jié)小結(jié)4混合策略的定義,含義4期望效用4混合策略納什均衡:定義求解含義4案例張紅霞國(guó)民經(jīng)濟(jì)管理系Homework1. Find all “mixed” strategy NE to a Priso

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請(qǐng)下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請(qǐng)聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁(yè)內(nèi)容里面會(huì)有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫(kù)網(wǎng)僅提供信息存儲(chǔ)空間,僅對(duì)用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對(duì)用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對(duì)任何下載內(nèi)容負(fù)責(zé)。
  • 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請(qǐng)與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶因使用這些下載資源對(duì)自己和他人造成任何形式的傷害或損失。

評(píng)論

0/150

提交評(píng)論