版權(quán)說(shuō)明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請(qǐng)進(jìn)行舉報(bào)或認(rèn)領(lǐng)
文檔簡(jiǎn)介
第二章完全信息靜態(tài)博弈分析思路納什均衡混合策略和混合策略納什均衡*納什均衡的存在性*納什均衡的選擇和存在性5/24/20231楔子本章介紹完全信息靜態(tài)博弈。完全信息靜態(tài)博弈即各博弈方同時(shí)決策,且所有博弈方對(duì)各方得益都了解的博弈。囚徒的困境、齊威王田忌賽馬、猜硬幣、石頭剪子布、古諾產(chǎn)量決策都屬于這種博弈。完全信息靜態(tài)博弈屬于非合作博弈最基本的類型。本章介紹完全信息靜態(tài)博弈的一般分析方法、納什均衡概念、各種經(jīng)典模型及其應(yīng)用等。
5/24/202322.1基本分析思路和方法一、上策均衡上策(dominatestr.):不管其它博弈方選擇什么策略,一博弈方的某個(gè)策略給他帶來(lái)的得益始終高于其它的策略,至少不低于其他策略的策略u(píng)i(Si*,
S-i
)≥ui(Si,S-i)
上策均衡:一個(gè)博弈的某個(gè)策略組合中的所有策略都是各個(gè)博弈方的上策,則稱為上策均衡。***上策均衡必然是該博弈比較穩(wěn)定的結(jié)果上策均衡不是普遍存在的5/24/202332.1Cont.-5,-50,-8-8,0-1,-1坦白不坦白坦白不坦白Payoff妻(囚徒2
)夫(囚徒1
)5/24/202342.1Cont.二、下策均衡嚴(yán)格下策(dominatestr.):不管其它博弈方的策略如何變化,給一個(gè)博弈方帶來(lái)的收益總是比另一種策略給他帶來(lái)的收益小的策略,ui(Si’
,S-i)≥,>ui(Si*,
S-i
),分別稱為弱下策、嚴(yán)格下策嚴(yán)格下策反復(fù)消去1,01,30,40,2LMUDPayoffPlayer2Player10,12,0R5/24/202352.1Cont.尋找均衡的技術(shù)技巧劃線法1,01,30,10,40,22,0-5,-50,-8-8,0-1,-1囚徒困境-1,11,-11,-1-1,1猜硬幣2,10,00,01,3夫妻之爭(zhēng)5/24/202362.1Cont.尋找均衡的技術(shù)技巧箭頭法1,01,30,10,40,22,0-5,-50,-8-8,0-1,-1囚徒困境-1,11,-11,-1-1,1猜硬幣2,10,00,01,3夫妻之爭(zhēng)5/24/202372.2納什均衡一、納什均衡的定義博弈方:1,…,n;表示有n個(gè)博弈方策略空間:S1,...,Si,…Sn,博弈方i的第j個(gè)策略Sij∈Si博弈方i的得益:ui博弈:G={S1,...Sn;u1,...un}
納什均衡:在博弈G={S1,...Sn;u1,...un}中,如果由各個(gè)博弈方的各一個(gè)策略組成的某個(gè)策略組合{S1*,...Sn*}中,任一博弈方i的策略Si*,都是對(duì)其余博弈方策略的組合{S1*,...Si-1*,Si+1*,…
Sn*}的最佳對(duì)策,也即對(duì)任意
ui(S1*,...Si-1*,Si*,
Si+1*,...Sn*)
≥ui(S1,...Si-1*,Sij,
Si+1*,…
Sn*)都成立,則稱{S1*,...Sn*}為G的一個(gè)納什均衡5/24/20238Cont.二、納什均衡的一致預(yù)測(cè)性質(zhì)一致預(yù)測(cè):如果所有博弈方都預(yù)測(cè)一個(gè)特定博弈結(jié)果會(huì)出現(xiàn),所有博弈方都不會(huì)利用該預(yù)測(cè)或者這種預(yù)測(cè)能力選擇與預(yù)測(cè)結(jié)果不一致的策略,即沒(méi)有哪個(gè)博弈方有偏離這個(gè)預(yù)測(cè)結(jié)果的愿望,因此預(yù)測(cè)結(jié)果會(huì)成為博弈的最終結(jié)果只有納什均衡才具有一致預(yù)測(cè)的性質(zhì)一致預(yù)測(cè)性是納什均衡的本質(zhì)屬性一致預(yù)測(cè)并不意味著一定能準(zhǔn)確預(yù)測(cè),因?yàn)橛卸嘀鼐?,預(yù)測(cè)不一致的可能5/24/20239Cont三、納什均衡與嚴(yán)格下策反復(fù)消去法上策均衡肯定是納什均衡,但納什均衡不一定是上策均衡命題1:在n個(gè)博弈方的博弈G={S1,...Sn;u1,...un}中,如果嚴(yán)格下策反復(fù)消去法排除了除{S1*,...Sn*}之外的所有策略組合,那么{S1*,...Sn*}一定是該博弈的唯一的納什均衡命題2:在n個(gè)博弈方的博弈中G={S1,...Sn;u1,...un}中,如果{S1*,...Sn*}是G的一個(gè)納什均衡,那么嚴(yán)格下策反復(fù)消去法一定不會(huì)將它消去上述兩個(gè)命題保證在進(jìn)行納什均衡分析之前先通過(guò)嚴(yán)格下策反復(fù)消去法簡(jiǎn)化博弈是可行的5/24/202310Cont證明:納什均衡與嚴(yán)格下策反復(fù)消去法(反證法)命題1:如果消去所有后余下的{Si*,S-i*}不是納什均衡不是納什均衡,一定存在那么{Si’,S-i*},
使得{Si*,S-i*}<{Si’,S-i*}。然而,反復(fù)消去法消去了{(lán)Si’,S-i},說(shuō)明{Si*,S-i}>{Si’,S-i}{Si*,S-i*}in{Si*,S-i},{Si’,S-i*}
in{Si’,S-i}所以,{Si*,S-i*}>{Si’,S-i*}
命題2:如果納什均衡{Si*,S-i*}被嚴(yán)格下策反復(fù)消去;那么必然存在一個(gè)Si‘,使得{Si’,S-i}>{Si*,S-i}進(jìn)而,
{Si‘,S-i*}>{Si*,S-i*}與納什均衡的定義,矛盾5/24/2023112.3無(wú)限策略分析和反應(yīng)函數(shù)古諾的寡頭模型Player:廠商1,2Strategy:q1,q2Payoff:P=8-(q1+q2),c1=c2=2;u1=6q1-q1q2-q12,u2=6q2-q1q2-q22,Howtofindtheequilibrium?(3,0)(6,0)(0,3)(0,6)古諾模型的反應(yīng)函數(shù)圖示R1(q2)R2(q1)q1q25/24/202312Cont。伯特蘭德寡頭模型模型Player:廠商1,2Strategy:[0,p1max],[0,p2max]Payoff:q1(p1,p2)=28-p1-0.5p2,q2(p1,p2)=28-p2-0.5p1,c1=c2=2;u1=(p1-2)(28-p1-0.5p2);u2=(p2-2)(28-p2-0.5p1);Howetofindtheequilibrium?maxu1=max(p1-2)(28-p1-0.5p2);maxu2=max(p2-2)(28-p2-0.5p1);p1p2p1*=0.5(30-0.5p2*);p2*=0.5(30-0.5p1*);p1*=p2*=205/24/202313Cont。公共草地養(yǎng)羊問(wèn)題Player:3個(gè)農(nóng)戶Strategy:[0,q1,max],…,[0,qn,max],Q=q1+q2+q3Payoff:ui=qi[100-(q1+q2+q3);]-qic;Howetofindtheequilibrium?maxu1=maxq1[100-(q1+q2+q3);]–q1c;maxu2=maxq2[100-(q1+q2+q3);]–q2c;maxu3=maxq3[100-(q1+q2+q3);]–q3c;q1q2q3q1*=q2*=q3*=24,u1*=u2*=u3*=576如果總體來(lái)看,maxQ[100-Q
]–Qc;Q*=48,u=2304公共資源的悲?。。?!5/24/202314Cont.反應(yīng)函數(shù)的問(wèn)題和局限性有此博弈中,博弈方的策略是有限且非連續(xù)時(shí),其得益函數(shù)不是連續(xù)可導(dǎo)函數(shù),無(wú)法求得反應(yīng)函數(shù),從而不能通過(guò)解方程組的方法求得納什均衡。即使得益函數(shù)可以求導(dǎo),也可能各博弈方的得益函數(shù)比較復(fù)雜,因此各自的反應(yīng)函數(shù)也比較復(fù)雜,并不總能保證各博弈方的反應(yīng)函數(shù)有交點(diǎn),特別不能保證有唯一的交點(diǎn)。5/24/2023152.那4混合狗策略太和混乏合策化略納哀什均處衡一、伏猜硬潤(rùn)幣博循弈(1)不綁存在稍前面王定義秋的納宜什均倚衡策躺略組泰合(2)關(guān)假鍵是至不能王讓對(duì)調(diào)方猜奪到自荒己策援略這類吹博弈襲很多朋,引姐出混富合策勒略納北什均耽衡概膨念-1,11,-11,-1-1,1正面反面正面反面猜硬燙幣方蓋硬陽(yáng)幣方5/卵18俗/2熔02暴316Co虛nt沫.二、混合澤策略德、混舍合策續(xù)略博觀弈和氏混合捕策略柱納什帖均衡混合統(tǒng)策略:在買博弈G={S1,石..減.Sn;u1,奸..編.un}中,煮博弈逆方i的策蒙略空摔間{Si1,校..勤.Sik},則屬博弈敬方i以概毛率分召布{pi1,致..朵.pik}隨機(jī)雨在其k個(gè)可拖選策管略中辦選擇較的“甜策略間”,含稱為副一個(gè)斷“混旗合策付略”增,其劃中0<pij<1勝,對(duì)1<j<k翅,都成支立,pi1+西..茫.pik=1混合京策略航擴(kuò)展睬博弈:博墓弈方搬在混窯合策厘略的近策略格空間路(概業(yè)率分輪布空烤間)瘡的選賺擇看央作一淋個(gè)博狂弈,郵就是糊原博帥弈的具“混電合策棵略擴(kuò)詠展博忠弈)虧?;旌暇S策略圍納什厚均衡:包攻含混糖合策寧略的己策略攜組合碧,構(gòu)芒成納省什均洲衡。5/爬18武/2方02蔽317Co仗nt針.三、一個(gè)灑例子該博石弈無(wú)鈴純策深略納和什均形衡,磁可用白混合脅策略至納什蒙均衡瀉分析I的混康合策股略(p):3p+1鵝(1綠-p)=匪2p+5包(1鞭-p)II的混印合策撿略(q):2q+5層(1帥-q)=雹3q+1彼(1峰-q)u1=鞋p[昌2q拿+5杠(1圓-q抖)]票+(攤1-穴p)奪[3掏q+櫻1(下1-晚q)闊]=窗2.城6u2=身q[確3p走+1證(1莫-p讀)]凝+(括1-切q)贈(zèng)[2蛋p+攜5(壓1-粱p)摩]=都2.孩62,35,23,11,5C網(wǎng)(q)D槽(1鉗-q)A(p)B(1雞-p)Pa仔yo須ffPl膏ay怕er恢2Pl纏ay陷er殿1p=0.8,q=0.8u
1=2.6,u
2=2.65/占18奴/2雕02暫318Co腦nt敬.博弈號(hào)方2選C的收狗益(p混)3p桑+1瞧(1雜-p晨)=蠅1+粒2p博弈貼方2選D的收犬益(p混)2p線+5劉(1永-p剃)=妨5-流3p博弈澆方1選A的收糾益(q混)2q師+5燃(辯1-逢q)派=沉5-聚3q博弈肝方1選B的收灑益(q混):3q縮慧+1話(1糕-q泰)=圖1+鉆2q2,35,23,11,5C(q)D(1-q)A(p)B(1-p)PayoffPlayer2Player10p=造1u2(C)u2(D)0p=的1q=壩10.幟80.厘80q=殊1u1(B)u1(A)0.謠85/汪18暢/2痛02鴉319五、萬(wàn)小偷綠和守哈衛(wèi)的肯博弈加重右對(duì)首暮位的嫁處罰宣:短茂期中銅的效廁果是蜻使守致衛(wèi)真忌正盡煩職在長(zhǎng)軌期中鈴并不渾能使快守衛(wèi)吹更盡丸職,隆但會(huì)娛降低勾盜竊邁發(fā)生姑的概規(guī)略0-化D-診D’守衛(wèi)得益((睡)Sp=1小偷p混合煎下,掠守衛(wèi)膊的得編益睡時(shí)敬:-Dp+S(1剝-p)不睡醬時(shí):0*p+狠0*澤(1荷-p)守衛(wèi)直睡覺(jué)暴時(shí)的禁得益p*守衛(wèi)溝不睡放覺(jué)時(shí)選的得際益V,-D-P,00,S0,0睡不睡偷不偷守衛(wèi)小偷5/腦18移/2巨02遞320Co典nt寄.0-P守衛(wèi)得益((睡)Vq=1守衛(wèi)q混合臂下,妖小偷睜的得戶益偷:Vq-P(1冊(cè)-q)=攤-P+(V+P)q不偷師:0*q+陳0*猶(1命-q)項(xiàng)=0偷時(shí)胖的得坑益q*不偷遲的得袍益V,-D-P,00,S0,0睡不睡偷不偷守衛(wèi)小偷加重注對(duì)小蛾偷的斗處罰戀:短煙期內(nèi)循能抑改制盜統(tǒng)竊發(fā)意生率長(zhǎng)期遷并不使能降革低盜盼竊發(fā)燈生率靠,但鑒會(huì)是搏的守臂衛(wèi)更英多的鋪偷懶5/虛18卡/2避02吊321Co柜nt堆.多重影均衡責(zé)博弈產(chǎn)和混俯合策平略夫妻暴之爭(zhēng)線的混加合策每略納恩什均材衡2,10,00,01,3時(shí)裝足球時(shí)裝足球丈夫妻子夫妻之爭(zhēng)妻子備的p混合個(gè)策略讓使:1p+0賤(1暮-p)=鮮0p+3電(1猶-p)丈夫始的q混合闖策略介使:2q+0元(1借-q)=貍0q+1某(1信-q)夫妻晴之爭(zhēng)泄博弈框的混羅合策哭略納冷什均鬧衡策略只得益博弈檢方1(3/罪4,相1/喜4)0.靜67博弈喊方2(1/設(shè)3,嘗2猴/3)0.呆755/絲式18聲/2是02情322Co責(zé)nt來(lái).夫妻狡之爭(zhēng)丈夫郊選時(shí)裝的得鋤益(p混):p-0崖(1挪-p)=p丈夫他選足球的得局益(p混):0p+3楊(1帥-p)=該3-炊3p妻子討選時(shí)裝的得除益(q混):2q+0愛(ài)(1翁-q)李=2q妻子茅選足球的得慰益(q混):0q+1捧(1掌-q)=折1-qPayoff2,10,00,01,3時(shí)裝(q)足球(1-q)時(shí)裝(p)足球(1-p)丈夫妻0p=1u2(球)u2(時(shí))0p=鞏1q=舟13/漏43/遍40q=毫1u1(時(shí))u1(球)1/切3R2R11/馬3315/逮18畫(huà)/2各02訪323Co闊nt石.制式孕問(wèn)題1,30,00,02,2A(q)B(1-q)A(p)B(1-p)廠商1廠商2pa宴yo哪ff廠商A的p混合喇策略鐵使:3p+0嘉(1校-p)=緒0p+2寨(1丈-p)廠商B的q混合劃策略眠使:1q+0懸(1圾-q)=質(zhì)0q+2蛾(1換-q)制式勵(lì)問(wèn)題峰的混聰合策感略納猾什均敞衡策略兆得益廠商1(0.葬4,0.漲6)0.缸67廠商2(0.皇67,0.脊33)0.磚755/揭18悄/2塑02趕324Co普nt訴.三、景混合還策略跨和嚴(yán)塵格下爸策反夫復(fù)消散去法包括跨混合牢策略醫(yī)時(shí),慈嚴(yán)格妨下策道反復(fù)異消去燈法依蠟然成告立(左米)博文弈不蛛存在可純策遺略嚴(yán)于格下緩策3,10,20,23,31,31,1LRUMD博弈方2博弈方11.5,1.51.5,2.5mix如果I使用p混合茂策略哈,如個(gè)(.5,.5,0)5/羞18白/2喪02繩325重新隸思考評(píng)“夫理妻之批爭(zhēng)”夫妻莊約會(huì)是:但侍電話算斷了覽!能飽遇見(jiàn)器么妻子擊根據(jù)叔對(duì)“雪丈夫嫂”的回判斷萬(wàn),q,考慮酷決定如:u1[時(shí)裝]=久2q+艙0(1-維q)=尖2qu1[足球]=呼0q+旬1(1-飯q)=車1蓋-q如果那判斷q大,2q>籮1-q,or住,q>精1/況3妻子塵最好動(dòng)直接松去時(shí)炒裝!問(wèn)題灰:混合渠策略胃的得辦益小脆:雙導(dǎo)方預(yù)煮期得訊益0.起67,0.途75均小竊于兩浴個(gè)納兩什均住衡遇不內(nèi)到的際概率堡:1/另3*炊1/鄰4+延2/客3*役3/墨4=防7/興12Payoff2,10,00,01,3時(shí)裝(q)足球(1-q)時(shí)裝(p)足球(1-p)丈夫妻5/媽18缺/2征02理3262.故5納什睬均衡蛋的存配在性智(略凱)5/星18疼/2畢02驅(qū)3272.約6納什刑均衡膀的選檢擇和癢分析茶方法駛擴(kuò)展(選)2.燃6.廚1多重引納什預(yù)均衡墾博弈秧的分斤析2.星6.栗2共謀窯和防而共謀瞇均衡核心雷是均江衡的按精煉子問(wèn)題載?。?/場(chǎng)18流/2畝02口328Co移nt退.多重凝納什銹均衡膝博弈址的分態(tài)析一、晝帕累抽托上拆策均找衡(鷹鴿柳博弈紀(jì))這個(gè)爬博弈塞中有裝兩個(gè)棵純策部略納線什均暴衡,打(戰(zhàn)胸爭(zhēng),楚戰(zhàn)爭(zhēng)悟)和(碌和平文,和役平)流,顯增然后劉者帕漸累托毅優(yōu)于巾前者辱,所以,旨(和杠平,庸和平概)是稀本博確弈的扁一個(gè)瓶帕累美托上宮策均垂衡。-5,-5-1撒0,88,-1毒010,10戰(zhàn)爭(zhēng)和平國(guó)家2戰(zhàn)爭(zhēng)和平國(guó)家1戰(zhàn)爭(zhēng)湯與和仰平5/牽18顯/2醒02脈329Co督nt膊.二、旋風(fēng)險(xiǎn)膛上策詳均衡考慮需、顧弟忌博劣弈方全、其鴨他博塌弈方險(xiǎn)可能稀發(fā)生死錯(cuò)誤聽(tīng)等時(shí)離,帕歸累托熱上策似均衡教并不堅(jiān)一定秤是最輛優(yōu)選閘擇,匠需要盛考慮合:風(fēng)籮險(xiǎn)上卻策均廉衡。殘下面纖就是劣兩個(gè)蛾例子跨。9,98,00,87,7LR博弈轉(zhuǎn)方2UD博弈方1風(fēng)險(xiǎn)酸上策皮均衡翁(D,R)5,53,00,33,3鹿兔子獵人2鹿兔子獵人1獵鹿博弈風(fēng)險(xiǎn)哲上策物均衡瓶(兔越子,息兔子舅)4.告57.荒54.挑57.捏52.攏532.鮮535/磁18倚/2鬧02括330Co響nt鋪.三、擠聚點(diǎn)漠均衡利用捷博弈念設(shè)定犯以外傍的信隱息和歉依據(jù)板選擇笨的均校衡文化嗽、習(xí)憑慣或庸者其什他各須種特險(xiǎn)征都挺可能沒(méi)是聚棗點(diǎn)均多衡的耍依據(jù)城市乖博弈殲(城亭市分怖組相賣同)緞、時(shí)湯間博該弈(瘡報(bào)出聯(lián)相同雕的時(shí)分間)侄是聚言點(diǎn)均上衡的聞典型蹤蝶例子5/刺18喇/2慚02莊331四、勒相關(guān)洞均衡冠(略環(huán))5,14,40,01,5LR博弈方2UD博弈方1相關(guān)均衡例子三個(gè)納什動(dòng)均衡:(U,L)、峰(D,R)和混陸合策田略均譽(yù)
溫馨提示
- 1. 本站所有資源如無(wú)特殊說(shuō)明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請(qǐng)下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請(qǐng)聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
- 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁(yè)內(nèi)容里面會(huì)有圖紙預(yù)覽,若沒(méi)有圖紙預(yù)覽就沒(méi)有圖紙。
- 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
- 5. 人人文庫(kù)網(wǎng)僅提供信息存儲(chǔ)空間,僅對(duì)用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對(duì)用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對(duì)任何下載內(nèi)容負(fù)責(zé)。
- 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請(qǐng)與我們聯(lián)系,我們立即糾正。
- 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶因使用這些下載資源對(duì)自己和他人造成任何形式的傷害或損失。
最新文檔
- 2025版實(shí)習(xí)指導(dǎo)教師專業(yè)素養(yǎng)提升項(xiàng)目勞動(dòng)合同規(guī)范3篇
- 2025版公益宣傳活動(dòng)宣傳品制作及推廣合同2篇
- 2025版住宅小區(qū)地下車庫(kù)車位租賃及維護(hù)服務(wù)合同范本2篇
- 2025版木工班組智能化設(shè)備引進(jìn)與應(yīng)用合同4篇
- 企業(yè)對(duì)人才需求談職業(yè)
- 2025年度個(gè)人房產(chǎn)維修勞務(wù)合同范本4篇
- 二零二五年度股權(quán)并購(gòu)與國(guó)際化布局合同3篇
- 2025版國(guó)際貿(mào)易采購(gòu)合同(原材料)3篇
- 民政局2025年度自愿離婚協(xié)議書(shū)財(cái)產(chǎn)分割與子女撫養(yǎng)協(xié)議范本4篇
- 基于2025年度需求的冷卻塔設(shè)計(jì)、安裝與調(diào)試服務(wù)合同2篇
- 四川省成都市武侯區(qū)2023-2024學(xué)年九年級(jí)上學(xué)期期末考試化學(xué)試題
- 教育部《中小學(xué)校園食品安全和膳食經(jīng)費(fèi)管理工作指引》知識(shí)培訓(xùn)
- 初一到初三英語(yǔ)單詞表2182個(gè)帶音標(biāo)打印版
- 2024年秋季人教版七年級(jí)上冊(cè)生物全冊(cè)教學(xué)課件(2024年秋季新版教材)
- 2024年共青團(tuán)入團(tuán)積極分子考試題庫(kù)(含答案)
- 碎屑巖油藏注水水質(zhì)指標(biāo)及分析方法
- 【S洲際酒店婚禮策劃方案設(shè)計(jì)6800字(論文)】
- 鐵路項(xiàng)目征地拆遷工作體會(huì)課件
- 醫(yī)院死亡報(bào)告年終分析報(bào)告
- 中國(guó)教育史(第四版)全套教學(xué)課件
- 2023年11月英語(yǔ)二級(jí)筆譯真題及答案(筆譯實(shí)務(wù))
評(píng)論
0/150
提交評(píng)論