混合策略納什均衡概述課件_第1頁(yè)
混合策略納什均衡概述課件_第2頁(yè)
混合策略納什均衡概述課件_第3頁(yè)
混合策略納什均衡概述課件_第4頁(yè)
混合策略納什均衡概述課件_第5頁(yè)
已閱讀5頁(yè),還剩91頁(yè)未讀, 繼續(xù)免費(fèi)閱讀

下載本文檔

版權(quán)說(shuō)明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請(qǐng)進(jìn)行舉報(bào)或認(rèn)領(lǐng)

文檔簡(jiǎn)介

2022年12月24日博弈論第三章第一講概念與方法1社會(huì)福利博弈:無(wú)納什均衡

流浪漢尋找工作游蕩救濟(jì)政府不救濟(jì)3,2-1,3-1,10,0你救濟(jì),他就游蕩;你游蕩,他就不救濟(jì)2022年12月20日博弈論第三章1社會(huì)福利博弈:無(wú)納什均衡2022年12月24日博弈論第三章第一講概念與方法2社會(huì)福利博弈的特征不存在納什均衡類似:父母與啃老族回望:另一個(gè)不正常的博弈情侶博弈——兩個(gè)納什均衡2022年12月20日博弈論第三章2社會(huì)福利博弈的特征不存在2022年12月24日博弈論第三章第一講概念與方法3思考如何分析“不存在”納什均衡或存在多個(gè)納什均衡的博弈?2022年12月20日博弈論第三章3思考如何分析“不存在”納2022年12月24日博弈論第三章第一講概念與方法4第三章混合策略納什均衡第一節(jié)基本概念:混合策略與期望支付2022年12月20日博弈論第三章4第三章混合策略納什均2022年12月24日博弈論第三章第一講概念與方法5第一節(jié)混合策略與期望支付一、混合策略(一)案例:小偷與守衛(wèi)的貓鼠博弈守衛(wèi)睡不睡偷小偷不偷8,-2-2,00,80,02022年12月20日博弈論第三章5第一節(jié)混合策略與期望2022年12月24日博弈論第三章第一講概念與方法6小偷與守衛(wèi)博弈無(wú)納什均衡,如何分析?2022年12月20日博弈論第三章6小偷與守衛(wèi)博弈無(wú)納什均衡2022年12月24日博弈論第三章第一講概念與方法7第一節(jié)混合策略與期望支付一、混合策略(二)混合策略1.表述參與人按照一定概率,隨機(jī)從策略組合中選擇一種策略作為實(shí)際行動(dòng)隨機(jī)行動(dòng)的目的:使自己的行為不被對(duì)手預(yù)測(cè)2022年12月20日博弈論第三章7第一節(jié)混合策略與期望2022年12月24日博弈論第三章第一講概念與方法8混合策略小偷的混合策略以p的概率偷,(p,1-p)守衛(wèi)的混合策略以q的概率睡(q,1-q)2022年12月20日博弈論第三章8混合策略小偷的混合策略2022年12月24日博弈論第三章第一講概念與方法9第一節(jié)混合策略與期望支付一、混合策略(二)混合策略2.相對(duì)概念:純策略每個(gè)參與人的非隨機(jī)性選擇純粹行動(dòng)計(jì)劃,p=100%,1-p=02022年12月20日博弈論第三章9第一節(jié)混合策略與期望2022年12月24日博弈論第三章第一講概念與方法10第一節(jié)混合策略與期望支付一、混合策略(二)混合策略3.數(shù)學(xué)刻畫給定博弈G={S1,…,Sn;u1,…,un}以及參與人i的純策略Si={si1,…,sik}概率分布pi=(pi1,…,pik)為混合策略其中:0≤pik≤1,∑pik=1,pik=p(sik

)混合策略組合p=(p1,…,pi,…pn)2022年12月20日博弈論第三章10第一節(jié)混合策略與期2022年12月24日博弈論第三章第一講概念與方法11第一節(jié)混合策略與期望支付二、期望支付(一)分析1.概率(偷,睡)的概率:pq(偷,不睡)的概率:p(1-q)(不偷,睡)的概率:(1-p)q(不偷,不睡)的概率:(1-p)(1-q)2022年12月20日博弈論第三章11第一節(jié)混合策略與期2022年12月24日博弈論第三章第一講概念與方法12第一節(jié)混合策略與期望支付二、期望支付(一)分析2.期望支付U小偷=8pq+(-2)p(1-q)+0(1-p)q+0(1-p)(1-q)=2p(5q-1)U守衛(wèi)=(-2)pq+0p(1-q)+8(1-p)q+0(1-p)(1-q)=2q(4-5p)2022年12月20日博弈論第三章12第一節(jié)混合策略與期2022年12月24日博弈論第三章第一講概念與方法13第一節(jié)混合策略與期望支付二、期望支付(二)數(shù)學(xué)刻畫2022年12月20日博弈論第三章13第一節(jié)混合策略與期2022年12月24日博弈論第三章第一講概念與方法14第一節(jié)混合策略與期望支付三、混合策略納什均衡給定策略式博弈G={S1,…,Sn;u1,…,un}以及混合策略組合p*=(p1*,…,pi*,…pn*)對(duì)于所有i和pi∈∑i,∑i——i的混合策略空間如果有:πi(pi*,p-i*)≥πi(pi’,p-i*)則:混合策略組合p*=(p1*,…,pi*,…pn*)為G的混合策略納什均衡2022年12月20日博弈論第三章14第一節(jié)混合策略與期2022年12月24日博弈論第三章第一講概念與方法15第二節(jié)研究方法:反應(yīng)函數(shù)法——最佳反應(yīng)函數(shù)曲線交叉法一、案例:麥琪的禮物

Dela

剪發(fā)q保留(1-q)賣表pJim

保留(1-p)-2,-22,22,20,02022年12月20日博弈論第三章15第二節(jié)研究方法:2022年12月24日博弈論第三章第一講概念與方法16二、研究方法:反應(yīng)函數(shù)法二、期望支付1.UJim=(-2)pq+2p(1-q)+2(1-p)q+0(1-p)(1-q)=2p(1-3q)+2q整理原則:一項(xiàng)含p,一項(xiàng)不含p2.UDel=(-2)pq+2p(1-q)+2(1-p)q+0(1-p)(1-q)=2q(1-3p)+2p整理原則:一項(xiàng)含q,一項(xiàng)不含q2022年12月20日博弈論第三章16二、研究方法:反應(yīng)函數(shù)2022年12月24日博弈論第三章第一講概念與方法17二、研究方法:反應(yīng)函數(shù)法三、反應(yīng)函數(shù)1.Jim:Dela剪發(fā)的概率越小,Jim賣表越好UJim=2p(1-3q)+2q2022年12月20日博弈論第三章17二、研究方法:反應(yīng)函數(shù)2022年12月24日博弈論第三章第一講概念與方法18二、研究方法:反應(yīng)函數(shù)法三、反應(yīng)函數(shù)2.Dela:Jim賣表的概率越小,Dela剪發(fā)越好UDel=2q(1-3p)+2p2022年12月20日博弈論第三章18二、研究方法:反應(yīng)函數(shù)2022年12月24日博弈論第三章第一講概念與方法19二、研究方法:反應(yīng)函數(shù)法四、反應(yīng)函數(shù)曲線1.交點(diǎn)(1,0)雙方支付為22.交點(diǎn)(0,1)雙方支付為23.交點(diǎn)(1/3,1/3)雙方支付為2/3qp11/31/31互相為對(duì)方著想,期望支付變小2022年12月20日博弈論第三章19二、研究方法:反應(yīng)函數(shù)2022年12月24日博弈論第三章第一講概念與方法20作業(yè)利用反應(yīng)函數(shù)法求解“社會(huì)福利博弈”是否需要調(diào)整數(shù)據(jù)?可得出有關(guān)社會(huì)保障體系改革的結(jié)論?2022年12月20日博弈論第三章20作業(yè)利用反應(yīng)函數(shù)法求解2022年12月24日博弈論第三章第二講多重納什均衡21友軍博弈

英國(guó)支持巴頓支持蒙帥支持巴頓美國(guó)支持蒙帥4,32,21,13,42022年12月20日博弈論第三章21友軍博弈2022年12月24日博弈論第三章第二講多重納什均衡22友軍博弈特征兩個(gè)(多個(gè))納什均衡問(wèn)題:博弈的最終結(jié)果?2022年12月20日博弈論第三章22友軍博弈特征兩個(gè)(多個(gè)2022年12月24日博弈論第三章第二講多重納什均衡23第三章混合策略納什均衡第三節(jié)多重納什均衡的選擇標(biāo)準(zhǔn)2022年12月20日博弈論第三章23第三章混合策略納什2022年12月24日博弈論第三章第二講多重納什均衡24第三節(jié)多重納什均衡的選擇標(biāo)準(zhǔn)一、帕累托優(yōu)勢(shì)標(biāo)準(zhǔn):得益更大(一)案例:戰(zhàn)爭(zhēng)與和平

C國(guó)鷹戰(zhàn)略鴿戰(zhàn)略鷹戰(zhàn)略

A國(guó)鴿戰(zhàn)略-5,-58,-10-10,810,102022年12月20日博弈論第三章24第三節(jié)多重納什均衡的2022年12月24日博弈論第三章第二講多重納什均衡25第三節(jié)多重納什均衡的選擇標(biāo)準(zhǔn)一、帕累托優(yōu)勢(shì)標(biāo)準(zhǔn):得益更大(二)納什均衡的選擇標(biāo)準(zhǔn)帕累托優(yōu)勢(shì)標(biāo)準(zhǔn)按照支付大小篩選納什均衡-5,-58,-10-10,810,102022年12月20日博弈論第三章25第三節(jié)多重納什均衡的2022年12月24日博弈論第三章第二講多重納什均衡26第三節(jié)多重納什均衡的選擇標(biāo)準(zhǔn)二、風(fēng)險(xiǎn)優(yōu)勢(shì)標(biāo)準(zhǔn):風(fēng)險(xiǎn)更???(一)案例:串通作弊博弈學(xué)生乙作弊不作弊作弊學(xué)生甲不作弊9,90,88,07,7帕累托優(yōu)勢(shì)?2022年12月20日博弈論第三章26第三節(jié)多重納什均衡的選2022年12月24日博弈論第三章第二講多重納什均衡27第三節(jié)多重納什均衡的選擇標(biāo)準(zhǔn)二、風(fēng)險(xiǎn)優(yōu)勢(shì)標(biāo)準(zhǔn):風(fēng)險(xiǎn)更小(二)分析:偏離損失比較法1.甲:?jiǎn)为?dú)偏離均衡的損失(1)偏離“作弊”:9-8=1(2)偏離“不作弊”:7-0=79,90,88,07,72022年12月20日博弈論第三章27第三節(jié)多重納什均衡的選2022年12月24日博弈論第三章第二講多重納什均衡28第三節(jié)多重納什均衡的選擇標(biāo)準(zhǔn)二、風(fēng)險(xiǎn)優(yōu)勢(shì)標(biāo)準(zhǔn):風(fēng)險(xiǎn)更?。ǘ┓治觯浩x損失比較法2.乙:?jiǎn)为?dú)偏離均衡的損失(1)偏離“作弊”:9-8=1(2)偏離“不作弊”:7-0=79,90,88,07,72022年12月20日博弈論第三章28第三節(jié)多重納什均衡的選2022年12月24日博弈論第三章第二講多重納什均衡29第三節(jié)多重納什均衡的選擇標(biāo)準(zhǔn)二、風(fēng)險(xiǎn)優(yōu)勢(shì)標(biāo)準(zhǔn):風(fēng)險(xiǎn)更小(二)分析:偏離損失比較法3.偏離損失比較方法:偏離“作弊”的損失VS偏離“不作弊”的損失1×1<7×79,90,88,07,72022年12月20日博弈論第三章29第三節(jié)多重納什均衡的選2022年12月24日博弈論第三章第二講多重納什均衡30第三節(jié)多重納什均衡的選擇標(biāo)準(zhǔn)二、風(fēng)險(xiǎn)優(yōu)勢(shì)標(biāo)準(zhǔn):風(fēng)險(xiǎn)更小(二)分析:偏離損失比較法4.結(jié)論(1)偏離(不作弊,不作弊)的損失更大:49(2)不偏離(不作弊,不作弊)9,90,88,07,72022年12月20日博弈論第三章30第三節(jié)多重納什均衡的選2022年12月24日博弈論第三章第二講多重納什均衡31第三節(jié)多重納什均衡的選擇標(biāo)準(zhǔn)二、風(fēng)險(xiǎn)優(yōu)勢(shì)標(biāo)準(zhǔn):風(fēng)險(xiǎn)更?。ㄈ┘{什均衡的選擇標(biāo)準(zhǔn):風(fēng)險(xiǎn)優(yōu)勢(shì)標(biāo)準(zhǔn)比較不同納什均衡之間的風(fēng)險(xiǎn)狀況,風(fēng)險(xiǎn)小的納什均衡優(yōu)先9,90,88,07,72022年12月20日博弈論第三章31第三節(jié)多重納什均衡的選2022年12月24日博弈論第三章第二講多重納什均衡32第三節(jié)多重納什均衡的選擇標(biāo)準(zhǔn)三、聚點(diǎn)均衡(一)案例:城市分組博弈參與人:甲乙策略:把上海、長(zhǎng)春、南京、哈爾濱四個(gè)城市分成兩組,每組2個(gè)城市支付:甲乙分法相同——獎(jiǎng)勵(lì)100元;甲乙分法不同——獎(jiǎng)勵(lì)0元2022年12月20日博弈論第三章32第三節(jié)多重納什均衡的選2022年12月24日博弈論第三章第二講多重納什均衡33第三節(jié)多重納什均衡的選擇標(biāo)準(zhǔn)三、聚點(diǎn)均衡(二)聚點(diǎn)均衡1.標(biāo)準(zhǔn)使用社會(huì)文化習(xí)慣、博弈歷史等信息達(dá)到均衡1、10、66、8882.實(shí)質(zhì)規(guī)律性2022年12月20日博弈論第三章33第三節(jié)多重納什均衡的選2022年12月24日博弈論第三章第二講多重納什均衡34第三節(jié)多重納什均衡的選擇標(biāo)準(zhǔn)四、相關(guān)均衡(一)案例:“地域連坐”下的產(chǎn)品質(zhì)量博弈企業(yè)乙好產(chǎn)品差產(chǎn)品好產(chǎn)品企業(yè)甲差產(chǎn)品4,4-8,-2-2,-8-2,-22022年12月20日博弈論第三章34第三節(jié)多重納什均衡的選2022年12月24日博弈論第三章第二講多重納什均衡35第三節(jié)多重納什均衡的選擇標(biāo)準(zhǔn)四、相關(guān)均衡(二)相關(guān)均衡參與人主動(dòng)設(shè)計(jì)某種形式的選擇機(jī)制,形成制度安排,從而確定最終均衡“三鹿”事件出現(xiàn)后,河北省其他食品企業(yè)以后如何做?4,4-8,-2-2,-8-2,-22022年12月20日博弈論第三章35第三節(jié)多重納什均衡的選2022年12月24日博弈論第三章第二講多重納什均衡36第三節(jié)多重納什均衡的選擇標(biāo)準(zhǔn)五、抗共謀均衡(一)案例:抽象的選擇乙左右上甲下

乙左右上甲下0,0,10-5,-5,0-5,-5,01,1,-5丙:A-2,-2,0-5,-5,0-5,-5,0-1,-1,5丙:B2022年12月20日博弈論第三章36第三節(jié)多重納什均衡的選2022年12月24日博弈論第三章第二講多重納什均衡37第三節(jié)多重納什均衡的選擇標(biāo)準(zhǔn)五、抗共謀均衡(二)共謀偏離(集體偏離)均衡的激勵(lì)1.如果集體偏離(上,左,A)(1)起因:甲、乙集體偏離,選(下,右,A)(2)結(jié)果:甲的支付0→1,乙的支付0→1(3)結(jié)論:甲、乙有集體偏離的動(dòng)機(jī),(上,左,A)非抗共謀均衡2022年12月20日博弈論第三章37第三節(jié)多重納什均衡的選2022年12月24日博弈論第三章第二講多重納什均衡38第三節(jié)多重納什均衡的選擇標(biāo)準(zhǔn)五、抗共謀均衡(二)共謀偏離(集體偏離)均衡的激勵(lì)2.如果集體偏離(下,右,B)(1)若甲、乙集體偏離,選(上,左,B)-1→-2,-1→-2(2)若甲、丙集體偏離,選(上,右,A)-1→-5,5→0(3)若乙、丙集體偏離,選(下,左,A)-1→-5,5→0(4)結(jié)論:缺乏集體偏離的激勵(lì),(下,右,B)為抗共謀均衡2022年12月20日博弈論第三章38第三節(jié)多重納什均衡的選2022年12月24日博弈論第三章第二講多重納什均衡39獵鹿博弈:何為抗共謀均衡?

乙獵鹿打兔獵鹿甲打兔10,100,44,04,42022年12月20日博弈論第三章39獵鹿博弈:何為抗共謀均2022年12月24日博弈論第三章第二講多重納什均衡40金無(wú)足赤,人無(wú)完人人總是要犯錯(cuò)誤的,所以要對(duì)別人寬容2022年12月20日博弈論第三章40金無(wú)足赤,人無(wú)完人人總2022年12月24日博弈論第三章第二講多重納什均衡41經(jīng)得起考驗(yàn)的納什均衡在其他參與人選擇了錯(cuò)誤策略的情況下,某參與人仍能實(shí)現(xiàn)納什均衡他人不犯錯(cuò)誤,你能實(shí)現(xiàn)最優(yōu);他人犯錯(cuò)誤,你仍能實(shí)現(xiàn)最優(yōu)2022年12月20日博弈論第三章41經(jīng)得起考驗(yàn)的納什均衡在2022年12月24日博弈論第三章第二講多重納什均衡42第三節(jié)多重納什均衡的選擇標(biāo)準(zhǔn)六、顫抖手精煉均衡Trembling-handperfectequilibrium(一)顫抖手某一參與人的非蓄意錯(cuò)誤博弈偏離均衡路徑的原因一個(gè)人用手抓東西時(shí),手一顫抖,就可能抓不住他想抓的東西:非蓄意錯(cuò)誤2022年12月20日博弈論第三章42第三節(jié)多重納什均衡的選2022年12月24日博弈論第三章第二講多重納什均衡43第三節(jié)多重納什均衡的選擇標(biāo)準(zhǔn)六、顫抖手精煉均衡(二)顫抖手均衡1.基本思想給定所有參與人均可能犯錯(cuò)誤的情況下,如果某一策略組合仍是每一個(gè)參與人的最優(yōu)策略組合,則實(shí)現(xiàn)顫抖手均衡如何理解?2022年12月20日博弈論第三章43第三節(jié)多重納什均衡的選2022年12月24日博弈論第三章第二講多重納什均衡44第三節(jié)多重納什均衡的選擇標(biāo)準(zhǔn)六、顫抖手精煉均衡(二)顫抖手均衡2.定義:m——mistaken人博弈中,對(duì)于每一個(gè)博弈方i,存在嚴(yán)格混合策略序列,使下列條件得到滿足:(1)盡管每一個(gè)博弈方可能犯錯(cuò)誤,但錯(cuò)誤收斂于零——總有一天能成功2022年12月20日博弈論第三章44第三節(jié)多重納什均衡的選2022年12月24日博弈論第三章第二講多重納什均衡45穿針引線——功夫不負(fù)有心人將一條線穿入針眼,手在不停顫抖,不大可能一下子穿進(jìn)去但如果試的次數(shù)足夠大,總是能夠成功2022年12月20日博弈論第三章45穿針引線——功夫不負(fù)有2022年12月24日博弈論第三章第二講多重納什均衡46第三節(jié)多重納什均衡的選擇標(biāo)準(zhǔn)六、顫抖手精煉均衡(二)顫抖手均衡2.定義:m——mistaken人博弈中,對(duì)于每一個(gè)博弈方i,存在嚴(yán)格混合策略序列,使下列條件得到滿足:(2)對(duì)于任何可選擇的混合策略2022年12月20日博弈論第三章46第三節(jié)多重納什均衡的選2022年12月24日博弈論第三章第二講多重納什均衡47穿針引線——學(xué)會(huì)寬容納什均衡:每一個(gè)人都把線穿入針眼寬容:某參與人不能因?yàn)槠渌麉⑴c人可能暫時(shí)無(wú)法把線穿進(jìn)針眼而故意不把線穿進(jìn)針眼寬容是一種美德2022年12月20日博弈論第三章47穿針引線——學(xué)會(huì)寬容納2022年12月24日博弈論第三章第二講多重納什均衡48本章作業(yè)P143-1461、7、11、19、20、21、22、24、252022年12月20日博弈論第三章48本章作業(yè)P143-142022年12月24日博弈論第三章第一講概念與方法49社會(huì)福利博弈:無(wú)納什均衡

流浪漢尋找工作游蕩救濟(jì)政府不救濟(jì)3,2-1,3-1,10,0你救濟(jì),他就游蕩;你游蕩,他就不救濟(jì)2022年12月20日博弈論第三章1社會(huì)福利博弈:無(wú)納什均衡2022年12月24日博弈論第三章第一講概念與方法50社會(huì)福利博弈的特征不存在納什均衡類似:父母與啃老族回望:另一個(gè)不正常的博弈情侶博弈——兩個(gè)納什均衡2022年12月20日博弈論第三章2社會(huì)福利博弈的特征不存在2022年12月24日博弈論第三章第一講概念與方法51思考如何分析“不存在”納什均衡或存在多個(gè)納什均衡的博弈?2022年12月20日博弈論第三章3思考如何分析“不存在”納2022年12月24日博弈論第三章第一講概念與方法52第三章混合策略納什均衡第一節(jié)基本概念:混合策略與期望支付2022年12月20日博弈論第三章4第三章混合策略納什均2022年12月24日博弈論第三章第一講概念與方法53第一節(jié)混合策略與期望支付一、混合策略(一)案例:小偷與守衛(wèi)的貓鼠博弈守衛(wèi)睡不睡偷小偷不偷8,-2-2,00,80,02022年12月20日博弈論第三章5第一節(jié)混合策略與期望2022年12月24日博弈論第三章第一講概念與方法54小偷與守衛(wèi)博弈無(wú)納什均衡,如何分析?2022年12月20日博弈論第三章6小偷與守衛(wèi)博弈無(wú)納什均衡2022年12月24日博弈論第三章第一講概念與方法55第一節(jié)混合策略與期望支付一、混合策略(二)混合策略1.表述參與人按照一定概率,隨機(jī)從策略組合中選擇一種策略作為實(shí)際行動(dòng)隨機(jī)行動(dòng)的目的:使自己的行為不被對(duì)手預(yù)測(cè)2022年12月20日博弈論第三章7第一節(jié)混合策略與期望2022年12月24日博弈論第三章第一講概念與方法56混合策略小偷的混合策略以p的概率偷,(p,1-p)守衛(wèi)的混合策略以q的概率睡(q,1-q)2022年12月20日博弈論第三章8混合策略小偷的混合策略2022年12月24日博弈論第三章第一講概念與方法57第一節(jié)混合策略與期望支付一、混合策略(二)混合策略2.相對(duì)概念:純策略每個(gè)參與人的非隨機(jī)性選擇純粹行動(dòng)計(jì)劃,p=100%,1-p=02022年12月20日博弈論第三章9第一節(jié)混合策略與期望2022年12月24日博弈論第三章第一講概念與方法58第一節(jié)混合策略與期望支付一、混合策略(二)混合策略3.數(shù)學(xué)刻畫給定博弈G={S1,…,Sn;u1,…,un}以及參與人i的純策略Si={si1,…,sik}概率分布pi=(pi1,…,pik)為混合策略其中:0≤pik≤1,∑pik=1,pik=p(sik

)混合策略組合p=(p1,…,pi,…pn)2022年12月20日博弈論第三章10第一節(jié)混合策略與期2022年12月24日博弈論第三章第一講概念與方法59第一節(jié)混合策略與期望支付二、期望支付(一)分析1.概率(偷,睡)的概率:pq(偷,不睡)的概率:p(1-q)(不偷,睡)的概率:(1-p)q(不偷,不睡)的概率:(1-p)(1-q)2022年12月20日博弈論第三章11第一節(jié)混合策略與期2022年12月24日博弈論第三章第一講概念與方法60第一節(jié)混合策略與期望支付二、期望支付(一)分析2.期望支付U小偷=8pq+(-2)p(1-q)+0(1-p)q+0(1-p)(1-q)=2p(5q-1)U守衛(wèi)=(-2)pq+0p(1-q)+8(1-p)q+0(1-p)(1-q)=2q(4-5p)2022年12月20日博弈論第三章12第一節(jié)混合策略與期2022年12月24日博弈論第三章第一講概念與方法61第一節(jié)混合策略與期望支付二、期望支付(二)數(shù)學(xué)刻畫2022年12月20日博弈論第三章13第一節(jié)混合策略與期2022年12月24日博弈論第三章第一講概念與方法62第一節(jié)混合策略與期望支付三、混合策略納什均衡給定策略式博弈G={S1,…,Sn;u1,…,un}以及混合策略組合p*=(p1*,…,pi*,…pn*)對(duì)于所有i和pi∈∑i,∑i——i的混合策略空間如果有:πi(pi*,p-i*)≥πi(pi’,p-i*)則:混合策略組合p*=(p1*,…,pi*,…pn*)為G的混合策略納什均衡2022年12月20日博弈論第三章14第一節(jié)混合策略與期2022年12月24日博弈論第三章第一講概念與方法63第二節(jié)研究方法:反應(yīng)函數(shù)法——最佳反應(yīng)函數(shù)曲線交叉法一、案例:麥琪的禮物

Dela

剪發(fā)q保留(1-q)賣表pJim

保留(1-p)-2,-22,22,20,02022年12月20日博弈論第三章15第二節(jié)研究方法:2022年12月24日博弈論第三章第一講概念與方法64二、研究方法:反應(yīng)函數(shù)法二、期望支付1.UJim=(-2)pq+2p(1-q)+2(1-p)q+0(1-p)(1-q)=2p(1-3q)+2q整理原則:一項(xiàng)含p,一項(xiàng)不含p2.UDel=(-2)pq+2p(1-q)+2(1-p)q+0(1-p)(1-q)=2q(1-3p)+2p整理原則:一項(xiàng)含q,一項(xiàng)不含q2022年12月20日博弈論第三章16二、研究方法:反應(yīng)函數(shù)2022年12月24日博弈論第三章第一講概念與方法65二、研究方法:反應(yīng)函數(shù)法三、反應(yīng)函數(shù)1.Jim:Dela剪發(fā)的概率越小,Jim賣表越好UJim=2p(1-3q)+2q2022年12月20日博弈論第三章17二、研究方法:反應(yīng)函數(shù)2022年12月24日博弈論第三章第一講概念與方法66二、研究方法:反應(yīng)函數(shù)法三、反應(yīng)函數(shù)2.Dela:Jim賣表的概率越小,Dela剪發(fā)越好UDel=2q(1-3p)+2p2022年12月20日博弈論第三章18二、研究方法:反應(yīng)函數(shù)2022年12月24日博弈論第三章第一講概念與方法67二、研究方法:反應(yīng)函數(shù)法四、反應(yīng)函數(shù)曲線1.交點(diǎn)(1,0)雙方支付為22.交點(diǎn)(0,1)雙方支付為23.交點(diǎn)(1/3,1/3)雙方支付為2/3qp11/31/31互相為對(duì)方著想,期望支付變小2022年12月20日博弈論第三章19二、研究方法:反應(yīng)函數(shù)2022年12月24日博弈論第三章第一講概念與方法68作業(yè)利用反應(yīng)函數(shù)法求解“社會(huì)福利博弈”是否需要調(diào)整數(shù)據(jù)?可得出有關(guān)社會(huì)保障體系改革的結(jié)論?2022年12月20日博弈論第三章20作業(yè)利用反應(yīng)函數(shù)法求解2022年12月24日博弈論第三章第二講多重納什均衡69友軍博弈

英國(guó)支持巴頓支持蒙帥支持巴頓美國(guó)支持蒙帥4,32,21,13,42022年12月20日博弈論第三章21友軍博弈2022年12月24日博弈論第三章第二講多重納什均衡70友軍博弈特征兩個(gè)(多個(gè))納什均衡問(wèn)題:博弈的最終結(jié)果?2022年12月20日博弈論第三章22友軍博弈特征兩個(gè)(多個(gè)2022年12月24日博弈論第三章第二講多重納什均衡71第三章混合策略納什均衡第三節(jié)多重納什均衡的選擇標(biāo)準(zhǔn)2022年12月20日博弈論第三章23第三章混合策略納什2022年12月24日博弈論第三章第二講多重納什均衡72第三節(jié)多重納什均衡的選擇標(biāo)準(zhǔn)一、帕累托優(yōu)勢(shì)標(biāo)準(zhǔn):得益更大(一)案例:戰(zhàn)爭(zhēng)與和平

C國(guó)鷹戰(zhàn)略鴿戰(zhàn)略鷹戰(zhàn)略

A國(guó)鴿戰(zhàn)略-5,-58,-10-10,810,102022年12月20日博弈論第三章24第三節(jié)多重納什均衡的2022年12月24日博弈論第三章第二講多重納什均衡73第三節(jié)多重納什均衡的選擇標(biāo)準(zhǔn)一、帕累托優(yōu)勢(shì)標(biāo)準(zhǔn):得益更大(二)納什均衡的選擇標(biāo)準(zhǔn)帕累托優(yōu)勢(shì)標(biāo)準(zhǔn)按照支付大小篩選納什均衡-5,-58,-10-10,810,102022年12月20日博弈論第三章25第三節(jié)多重納什均衡的2022年12月24日博弈論第三章第二講多重納什均衡74第三節(jié)多重納什均衡的選擇標(biāo)準(zhǔn)二、風(fēng)險(xiǎn)優(yōu)勢(shì)標(biāo)準(zhǔn):風(fēng)險(xiǎn)更???(一)案例:串通作弊博弈學(xué)生乙作弊不作弊作弊學(xué)生甲不作弊9,90,88,07,7帕累托優(yōu)勢(shì)?2022年12月20日博弈論第三章26第三節(jié)多重納什均衡的選2022年12月24日博弈論第三章第二講多重納什均衡75第三節(jié)多重納什均衡的選擇標(biāo)準(zhǔn)二、風(fēng)險(xiǎn)優(yōu)勢(shì)標(biāo)準(zhǔn):風(fēng)險(xiǎn)更?。ǘ┓治觯浩x損失比較法1.甲:?jiǎn)为?dú)偏離均衡的損失(1)偏離“作弊”:9-8=1(2)偏離“不作弊”:7-0=79,90,88,07,72022年12月20日博弈論第三章27第三節(jié)多重納什均衡的選2022年12月24日博弈論第三章第二講多重納什均衡76第三節(jié)多重納什均衡的選擇標(biāo)準(zhǔn)二、風(fēng)險(xiǎn)優(yōu)勢(shì)標(biāo)準(zhǔn):風(fēng)險(xiǎn)更?。ǘ┓治觯浩x損失比較法2.乙:?jiǎn)为?dú)偏離均衡的損失(1)偏離“作弊”:9-8=1(2)偏離“不作弊”:7-0=79,90,88,07,72022年12月20日博弈論第三章28第三節(jié)多重納什均衡的選2022年12月24日博弈論第三章第二講多重納什均衡77第三節(jié)多重納什均衡的選擇標(biāo)準(zhǔn)二、風(fēng)險(xiǎn)優(yōu)勢(shì)標(biāo)準(zhǔn):風(fēng)險(xiǎn)更?。ǘ┓治觯浩x損失比較法3.偏離損失比較方法:偏離“作弊”的損失VS偏離“不作弊”的損失1×1<7×79,90,88,07,72022年12月20日博弈論第三章29第三節(jié)多重納什均衡的選2022年12月24日博弈論第三章第二講多重納什均衡78第三節(jié)多重納什均衡的選擇標(biāo)準(zhǔn)二、風(fēng)險(xiǎn)優(yōu)勢(shì)標(biāo)準(zhǔn):風(fēng)險(xiǎn)更?。ǘ┓治觯浩x損失比較法4.結(jié)論(1)偏離(不作弊,不作弊)的損失更大:49(2)不偏離(不作弊,不作弊)9,90,88,07,72022年12月20日博弈論第三章30第三節(jié)多重納什均衡的選2022年12月24日博弈論第三章第二講多重納什均衡79第三節(jié)多重納什均衡的選擇標(biāo)準(zhǔn)二、風(fēng)險(xiǎn)優(yōu)勢(shì)標(biāo)準(zhǔn):風(fēng)險(xiǎn)更?。ㄈ┘{什均衡的選擇標(biāo)準(zhǔn):風(fēng)險(xiǎn)優(yōu)勢(shì)標(biāo)準(zhǔn)比較不同納什均衡之間的風(fēng)險(xiǎn)狀況,風(fēng)險(xiǎn)小的納什均衡優(yōu)先9,90,88,07,72022年12月20日博弈論第三章31第三節(jié)多重納什均衡的選2022年12月24日博弈論第三章第二講多重納什均衡80第三節(jié)多重納什均衡的選擇標(biāo)準(zhǔn)三、聚點(diǎn)均衡(一)案例:城市分組博弈參與人:甲乙策略:把上海、長(zhǎng)春、南京、哈爾濱四個(gè)城市分成兩組,每組2個(gè)城市支付:甲乙分法相同——獎(jiǎng)勵(lì)100元;甲乙分法不同——獎(jiǎng)勵(lì)0元2022年12月20日博弈論第三章32第三節(jié)多重納什均衡的選2022年12月24日博弈論第三章第二講多重納什均衡81第三節(jié)多重納什均衡的選擇標(biāo)準(zhǔn)三、聚點(diǎn)均衡(二)聚點(diǎn)均衡1.標(biāo)準(zhǔn)使用社會(huì)文化習(xí)慣、博弈歷史等信息達(dá)到均衡1、10、66、8882.實(shí)質(zhì)規(guī)律性2022年12月20日博弈論第三章33第三節(jié)多重納什均衡的選2022年12月24日博弈論第三章第二講多重納什均衡82第三節(jié)多重納什均衡的選擇標(biāo)準(zhǔn)四、相關(guān)均衡(一)案例:“地域連坐”下的產(chǎn)品質(zhì)量博弈企業(yè)乙好產(chǎn)品差產(chǎn)品好產(chǎn)品企業(yè)甲差產(chǎn)品4,4-8,-2-2,-8-2,-22022年12月20日博弈論第三章34第三節(jié)多重納什均衡的選2022年12月24日博弈論第三章第二講多重納什均衡83第三節(jié)多重納什均衡的選擇標(biāo)準(zhǔn)四、相關(guān)均衡(二)相關(guān)均衡參與人主動(dòng)設(shè)計(jì)某種形式的選擇機(jī)制,形成制度安排,從而確定最終均衡“三鹿”事件出現(xiàn)后,河北省其他食品企業(yè)以后如何做?4,4-8,-2-2,-8-2,-22022年12月20日博弈論第三章35第三節(jié)多重納什均衡的選2022年12月24日博弈論第三章第二講多重納什均衡84第三節(jié)多重納什均衡的選擇標(biāo)準(zhǔn)五、抗共謀均衡(一)案例:抽象的選擇乙左右上甲下

乙左右上甲下0,0,10-5,-5,0-5,-5,01,1,-5丙:A-2,-2,0-5,-5,0-5,-5,0-1,-1,5丙:B2022年12月20日博弈論第三章36第三節(jié)多重納什均衡的選2022年12月24日博弈論第三章第二講多重納什均衡85第三節(jié)多重納什均衡的選擇標(biāo)準(zhǔn)五、抗共謀均衡(二)共謀偏離(集體偏離)均衡的激勵(lì)1.如果集體偏離(上,左,A)(1)起因:甲、乙集體偏離,選(下,右,A)(2)結(jié)果:甲的支付0→1,乙的支付0→1(3)結(jié)論:甲、乙有集體偏離的動(dòng)機(jī),(上,左,A)非抗共謀均衡2022年12月20日博弈論第三章37第三節(jié)多重納什均衡的選2022年12月24日博弈論第三章第二講多重納什均衡86第三節(jié)多重納什均衡的選擇標(biāo)準(zhǔn)五、抗共謀均衡(二)共謀偏離(集體偏離)均衡的激勵(lì)2.如果集體偏離(下,右,B)(1)若甲、乙集體偏離,選(上,左,B)-1→-2,-1→-2(2

溫馨提示

  • 1. 本站所有資源如無(wú)特殊說(shuō)明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請(qǐng)下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請(qǐng)聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁(yè)內(nèi)容里面會(huì)有圖紙預(yù)覽,若沒(méi)有圖紙預(yù)覽就沒(méi)有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫(kù)網(wǎng)僅提供信息存儲(chǔ)空間,僅對(duì)用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對(duì)用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對(duì)任何下載內(nèi)容負(fù)責(zé)。
  • 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請(qǐng)與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶因使用這些下載資源對(duì)自己和他人造成任何形式的傷害或損失。

最新文檔

評(píng)論

0/150

提交評(píng)論