博弈論課件5-完全信息靜態(tài)博弈-納什均衡_第1頁
博弈論課件5-完全信息靜態(tài)博弈-納什均衡_第2頁
博弈論課件5-完全信息靜態(tài)博弈-納什均衡_第3頁
博弈論課件5-完全信息靜態(tài)博弈-納什均衡_第4頁
博弈論課件5-完全信息靜態(tài)博弈-納什均衡_第5頁
已閱讀5頁,還剩103頁未讀 繼續(xù)免費(fèi)閱讀

下載本文檔

版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進(jìn)行舉報(bào)或認(rèn)領(lǐng)

文檔簡介

完全信息靜態(tài)博弈——納什均衡

設(shè)有兩人博弈,每個(gè)博弈方都有不同的策略,誰都希望自己出“高招”使自己獲勝(即尋求效用的最大化),但獲勝并不完全依賴于自己的行為能力,還依賴于對手怎么做。2022/12/191中南財(cái)經(jīng)政法大學(xué)信息學(xué)院完全信息靜態(tài)博弈——納什均衡設(shè)有兩人博弈,每個(gè)

試想有兩只公雞遇到一起,每只公雞有兩個(gè)行動(dòng)選擇:一是退下來,一是進(jìn)攻。如果一方退下來,而對方?jīng)]有退下來,對方獲得勝利,這只公雞則很丟面子;如果對方也退下來雙方則打個(gè)平手;如果自己沒退下來,而對方退下來,自己則勝利,對方則失敗;如果兩只公雞都前進(jìn),那么則兩敗俱傷。因此,對每只公雞來說,最好的結(jié)果是,對方退下來,而自己不退,但是此時(shí)面臨著兩敗俱傷的結(jié)果。經(jīng)典案例三——斗雞博弈2022/12/192中南財(cái)經(jīng)政法大學(xué)信息學(xué)院試想有兩只公雞遇到一起,每只公雞有兩個(gè)行動(dòng)選擇:一是退下來經(jīng)典案例三——斗雞博弈-3,-32,00,20,0退BA進(jìn)退進(jìn)獨(dú)木橋?qū)τ谙喈?dāng)多的博弈,我們無法運(yùn)用重復(fù)剔除劣戰(zhàn)略的方法找出均衡解。顯然為了找出這些博弈的均衡解,需要引入納什均衡。2022/12/193中南財(cái)經(jīng)政法大學(xué)信息學(xué)院經(jīng)典案例三——斗雞博弈-3,-32,00,20,0退BA進(jìn)退例1、選課博弈鐘信陳明德語法語德語3,21,1法語0,02,3斗雞博弈:對諸多現(xiàn)象的解釋2022/12/194中南財(cái)經(jīng)政法大學(xué)信息學(xué)院例1、選課博弈鐘信德語法語德語3,21,1法語例2、性別博弈

Battleofsexes

足球2,10,0-1,-11,2芭蕾足球

芭蕾girlboy2022/12/195中南財(cái)經(jīng)政法大學(xué)信息學(xué)院例2、性別博弈

Battleofsexes

足球2,10納什均衡____哲學(xué)思考

如果一個(gè)博弈問題的所有博弈方事前能達(dá)成一個(gè)“協(xié)議”,并在沒有外部強(qiáng)制的情況下,每個(gè)博弈方都有積極性遵守這個(gè)“協(xié)議”。那么,這個(gè)協(xié)議就是納什均衡。2022/12/196中南財(cái)經(jīng)政法大學(xué)信息學(xué)院納什均衡____哲學(xué)思考如果一個(gè)博弈問題的所有博弈假設(shè)n個(gè)人參與博弈,給定其他博弈方策略的條件下,每個(gè)博弈方選擇自己的最優(yōu)策略。納什均衡指的是“由所有博弈方的最優(yōu)策略組成的一個(gè)組合”n個(gè)人制訂了一個(gè)協(xié)議,這n個(gè)人是否能自愿遵守?他們會(huì)自覺遵守,這個(gè)協(xié)議就構(gòu)成一個(gè)納什均衡。如果一個(gè)協(xié)議不構(gòu)成納什均衡,它就不可能自動(dòng)實(shí)施,而需要外力脅迫,這就是無所謂的“協(xié)議”2022/12/197中南財(cái)經(jīng)政法大學(xué)信息學(xué)院假設(shè)n個(gè)人參與博弈,給定其他博弈方策略的條件下,每個(gè)博弈方選理解納什均衡的重要性:任何“合理”結(jié)果都要滿足的條件——當(dāng)某一博弈方發(fā)現(xiàn)他人單方面改變策略可以獲取更多時(shí),他會(huì)毫不猶豫地改變自己的策略,博弈自然就有達(dá)到均衡了。思考:一種制度安排要發(fā)生效力,為什么必須是納什均衡。否則,這種制度安排會(huì)有效力嗎?2022/12/198中南財(cái)經(jīng)政法大學(xué)信息學(xué)院理解納什均衡的重要性:任何“合理”結(jié)果都要滿足的條件——當(dāng)某五、納什均衡定義:在博弈G={s1,…,sn;u1,…,un}中,如果各博弈方i的某策略si*與其他博弈方的策略s-i*組成策略組合(si*,s-i*),且任一博弈方i的策略si*都是對其余博弈方策略s-i*的最佳反應(yīng)。 則稱(si*,s-i*)為該博弈的一個(gè)Nash均衡 特別,當(dāng)且僅當(dāng)(si*,s-i*)是Nash均衡,且對所有純策略si(si≠si*)有ui(si*,s-i*)>ui(si,s-i*),又稱(si*,s-i*)是嚴(yán)格(強(qiáng))Nash均衡。2022/12/199中南財(cái)經(jīng)政法大學(xué)信息學(xué)院五、納什均衡定義:在博弈G={s1,…,sn;u1,…,un納什均衡與一致預(yù)期納什均衡:所有博弈方的最優(yōu)策略的組合:給定該策略中別人的選擇,沒有人有積極性改變自己的選擇。一致預(yù)期:基于信念的選擇是合理的;支持選擇的信念是正確的;預(yù)期的自我實(shí)現(xiàn):如果所有人認(rèn)為這個(gè)結(jié)果會(huì)出現(xiàn),這個(gè)結(jié)果就一定會(huì)出現(xiàn)。預(yù)期是自我實(shí)現(xiàn)的,預(yù)期不會(huì)錯(cuò)誤。如果你認(rèn)為我預(yù)期你將選擇X,你就真的會(huì)選擇X。2022/12/1910中南財(cái)經(jīng)政法大學(xué)信息學(xué)院納什均衡與一致預(yù)期納什均衡:所有博弈方的最優(yōu)策略的組合:給定納什均衡舉例例如——廣告博弈納什均衡:(做廣告,做廣告)企業(yè)1企業(yè)22022/12/1911中南財(cái)經(jīng)政法大學(xué)信息學(xué)院納什均衡舉例例如——廣告博弈企業(yè)1企業(yè)22022/12/10經(jīng)典案例三——斗雞博弈-3,-32,00,20,0退BA進(jìn)退進(jìn)獨(dú)木橋納什均衡:A進(jìn),B退;A退,B進(jìn)納什均衡可以幫我們找出這些博弈的均衡解,2022/12/1912中南財(cái)經(jīng)政法大學(xué)信息學(xué)院經(jīng)典案例三——斗雞博弈-3,-32,00,20,0退BA進(jìn)退例如——性別博弈小莉大海足球芭蕾足球(2,1)(0,0)芭蕾(-1,-1)(1,2)納什均衡的含義就是:給定你的策略,我的策略是最好的策略;給定我的策略,你的策略也是你的最好的策略。即雙方在給定的策略下不愿意調(diào)整自己的策略。請同學(xué)分析:2022/12/1913中南財(cái)經(jīng)政法大學(xué)信息學(xué)院例如——性別博弈小莉足球芭蕾足球(2,1)(一)Nash均衡的基本求解法1、劃線法基本思想——博弈方先找出自己針對其他博弈方每種策略或策略組合的最佳對策,即自己的可選策略中與其他博弈方的策略或策略組合配合,給自己帶來最大得益的策略,然后在此基礎(chǔ)上,通過對其他博弈方策略選擇的判斷,包括對其他博弈方對自己策略判斷的判斷等,預(yù)測博弈的可能結(jié)果和確定自己的最優(yōu)策略。2022/12/1914中南財(cái)經(jīng)政法大學(xué)信息學(xué)院(一)Nash均衡的基本求解法1、劃線法2022/12/10具體方法——對其他博弈方的任一策略組合,找出博弈方i的最佳策略,并在其得益值下劃一小橫線;若存在一個(gè)這樣的策略組合,所有博弈方的得益值下都劃了線,則該組策略組合就是該博弈的一個(gè)納什均衡。2022/12/1915中南財(cái)經(jīng)政法大學(xué)信息學(xué)院具體方法——對其他博弈方的任一策略組合,找出博弈方i的最佳策例1、性別博弈小莉大海足球芭蕾足球(2,1)(0,0)芭蕾(-1,-1)(1,2)分析:如果大海選足球,小莉的“相對優(yōu)勢策略”也是足球,這比她選芭蕾好,這是在小莉的盈利值1下劃線。2022/12/1916中南財(cái)經(jīng)政法大學(xué)信息學(xué)院例1、性別博弈小莉足球芭蕾足球(2,

如果大海選芭蕾,小莉的“相對優(yōu)勢策略”也一定是芭蕾,這時(shí)將右下方格中盈利值2下劃線。如果小莉選足球,大海的“相對優(yōu)勢策略”是足球,這時(shí),在大海的盈利矩陣左上格中盈利值2下劃線。 如果小莉選芭蕾,大海的“相對優(yōu)勢策略”也是芭蕾,因而在右下格其盈利值2下劃線。當(dāng)雙方的相對優(yōu)勢策略確定后,哪個(gè)格子里面兩個(gè)數(shù)字都被被劃線,那么這個(gè)格中所對應(yīng)的相對優(yōu)勢策略組合就是一個(gè)納什均衡。2022/12/1917中南財(cái)經(jīng)政法大學(xué)信息學(xué)院 如果大海選芭蕾,小莉的“相對優(yōu)勢策略”也一定是芭蕾,這時(shí)將例2、囚徒困境博弈

招不招招甲不招(問題1:甲、乙如何選擇?)

-8,-80,-15-15,0-1,-12022/12/1918中南財(cái)經(jīng)政法大學(xué)信息學(xué)院例2、囚徒困境博弈-8,-80,-15-15,0-1,-12例3—“智豬博弈”(boxedpigs)有些博弈沒有占優(yōu)均衡,但通過剔除“劣”策略,我們可以預(yù)測博弈的結(jié)果;還可以通過“納什均衡”預(yù)測博弈的結(jié)果。如“智豬博弈”按等待按等待5,14,49,-10,0這個(gè)博弈中,大豬的最優(yōu)選擇依賴于小豬的選擇,但小豬的最優(yōu)選擇與大豬的選擇無關(guān)。如果大豬知道小豬的理性的,大豬將選擇“按”。均衡是“大豬按,小豬等待”?!傲印辈呗裕簾o論對方選擇什么,如果自己選擇A得到的總是收益小于選擇B得到的收益,A就是相對于B的劣策略。2022/12/1919中南財(cái)經(jīng)政法大學(xué)信息學(xué)院例3—“智豬博弈”(boxedpigs)有些博弈沒有占優(yōu)均例4:博弈G如右圖:1,01,30,10,40,20,0博弈方Ⅱ左中右解:該博弈的納什均衡為(中,上)。

2022/12/1920中南財(cái)經(jīng)政法大學(xué)信息學(xué)院例4:博弈G如右圖:1,01,30,10,4例5:博弈G如下圖:2,81,61,80,80,60,80,81,50,9博弈方ⅡLMR解:該博弈有兩個(gè)納什均衡(U,L)和(U,R)。2022/12/1921中南財(cái)經(jīng)政法大學(xué)信息學(xué)院例5:博弈G如下圖:2,81,61,80,8例6、軍備競賽蘇美擴(kuò)軍裁軍擴(kuò)軍(-3000,-3000)(10000,-∞)裁軍(-∞,10000)(0,0)結(jié)論,這個(gè)博弈存在一個(gè)Nash均衡(擴(kuò)軍,擴(kuò)軍)2022/12/1922中南財(cái)經(jīng)政法大學(xué)信息學(xué)院例6、軍備競賽蘇擴(kuò)軍裁軍擴(kuò)軍(-3000,-軍備考慮為擴(kuò)軍、有限軍備、不設(shè)防,那么G為:

BA擴(kuò)軍有限裁軍擴(kuò)軍(-2000,-2000)(-1600,-1500)(8000,-∞)有限(-1500,-1600)(-500,-500)(9500,-∞)裁軍(-∞,8000)(-∞,9500)(0,0)據(jù)劃線法求得Nash均衡為雙方采用有限軍備策略。注意①對每一方,有限軍備都是全局優(yōu)勢策略,擴(kuò)軍和不設(shè)防都是全局劣勢策略。 ②此問題也可用重復(fù)剔除的占優(yōu)均衡求得博弈問題的解為(有限軍備,有限軍備)。2022/12/1923中南財(cái)經(jīng)政法大學(xué)信息學(xué)院軍備考慮為擴(kuò)軍、有限軍備、不設(shè)防,那么G為:例7:尋找納什均衡C1C2C3R1R2R3100,1000,050,10150,01,160,00,3000,0200,2002022/12/1924中南財(cái)經(jīng)政法大學(xué)信息學(xué)院例7:尋找納什均衡C1C2C3R1R2R3100,1000,納什均衡(NashEquilibrium)的理解?納什均衡-是一種“僵局”,給定別人不改變策略的情況下,沒有人有興趣改變。?囚徒困境是西方經(jīng)濟(jì)學(xué)中個(gè)人理性與集體理性沖突的一個(gè)例證。2022/12/1925中南財(cái)經(jīng)政法大學(xué)信息學(xué)院納什均衡(NashEquilibrium)的理解2022/基本思路——對博弈中的每個(gè)策略組合進(jìn)行分析,考察在每個(gè)策略組合處各個(gè)博弈方能否通過單獨(dú)改變自己的策略而增加盈利,如能,則從所分析的策略組合對應(yīng)的盈利數(shù)組引一箭頭,到改變策略后策略組合對應(yīng)的盈利數(shù)組,最后綜合對每個(gè)策略組合的分析情況,只有指向、無指離的策略組合形成對博弈的結(jié)果。2、箭頭法2022/12/1926中南財(cái)經(jīng)政法大學(xué)信息學(xué)院基本思路——對博弈中的每個(gè)策略組合進(jìn)行分析,考察在每個(gè)策略組具體方法——考察在每個(gè)策略組合處各個(gè)博弈方能否通過單獨(dú)改變自己的策略而增加得益。如能,則從所分析的策略組合對應(yīng)的得益數(shù)組引一箭頭,到改變策略后策略組合對應(yīng)的得益數(shù)組。若存在一策略組合,其得益數(shù)組只有進(jìn)來的箭頭而沒有出去的箭頭,則該策略組合就是納什均衡。2022/12/1927中南財(cái)經(jīng)政法大學(xué)信息學(xué)院具體方法——考察在每個(gè)策略組合處各個(gè)博弈方能否通過單獨(dú)改變自例1:博弈G如右博弈方Ⅱ左中右0,41,00,00,20,11,3納什均衡為(上,中)2022/12/1928中南財(cái)經(jīng)政法大學(xué)信息學(xué)院例1:博弈G如右博弈方Ⅱ左例2、囚徒困境乙甲坦白抵賴坦白(-8,-8)(0,-15)抵賴(-15,0)(-1,-1)因此,策略組合(坦白,坦白)就是唯一具有穩(wěn)定性的結(jié)果。2022/12/1929中南財(cái)經(jīng)政法大學(xué)信息學(xué)院例2、囚徒困境乙坦白抵賴坦白(-8,-8斗雞B進(jìn)攻退卻-3,-32,00,20,0經(jīng)典案例3——斗雞博弈

(進(jìn),退)和(退,進(jìn))是兩個(gè)納什均衡。2022/12/1930中南財(cái)經(jīng)政法大學(xué)信息學(xué)院斗雞B-3,-32,00,20,0經(jīng)典案例3例4、性別博弈小莉大海足球芭蕾足球(2,1)(0,0)芭蕾(-1,-1)(1,2)2022/12/1931中南財(cái)經(jīng)政法大學(xué)信息學(xué)院例4、性別博弈小莉足球芭蕾足球(2,1)((二)納什均衡與重復(fù)剔除的占優(yōu)均衡

占優(yōu)均衡肯定是納什均衡,但反過來納什均衡不一定是占優(yōu)均衡,因此占優(yōu)均衡是比納什均衡更強(qiáng)、穩(wěn)定性更高的均衡概念。只是,占優(yōu)均衡在博弈問題中的普遍性比納什均衡要差得多。

重復(fù)剔除的占有均衡和納什均衡之間的關(guān)系要復(fù)雜一些,關(guān)鍵是這兩者之間是否存在相容性,即嚴(yán)格劣策略反復(fù)消去法是否會(huì)消去納什均衡,對于納什均衡和重復(fù)剔出的占優(yōu)均衡的關(guān)系,下面的兩個(gè)命題基本上給出了我們所希望的答案。2022/12/1932中南財(cái)經(jīng)政法大學(xué)信息學(xué)院(二)納什均衡與重復(fù)剔除的占優(yōu)均衡占優(yōu)均衡肯定是納什Nash均衡的特質(zhì)1)一致預(yù)測性 “一致”——各博弈方的實(shí)際行為選擇與他們的預(yù)測一致。2)與重復(fù)剔出的占優(yōu)均衡的關(guān)系若G={s1,…,sn;u1,…,un},通過嚴(yán)格劣策反復(fù)消去法排除了除(s1*,…,sn*)之外的所有策略組合,那么(s1*,…,sn*)一定是該博弈唯一的Nash均衡。若G={s1,…,sn;u1,…,un},如果(s1*,…,s2*)是G的一個(gè)Nash均衡,那么嚴(yán)格劣策反復(fù)消去法一定不會(huì)將它剔除。2022/12/1933中南財(cái)經(jīng)政法大學(xué)信息學(xué)院Nash均衡的特質(zhì)1)一致預(yù)測性2022/12/1033中南納什均衡構(gòu)成納什均衡的策略一定是重復(fù)剔除嚴(yán)格劣策略過程中不會(huì)被剔除的策略。許多不存在占優(yōu)策略均衡或重復(fù)剔除的占優(yōu)均衡的博弈卻存在納什均衡。小結(jié)與思考:三種均衡的概念:占優(yōu)均衡——重復(fù)剔除的占優(yōu)均衡——納什均衡三種均衡是什么關(guān)系2022/12/1934中南財(cái)經(jīng)政法大學(xué)信息學(xué)院納什均衡2022/12/1034中南財(cái)經(jīng)政法大學(xué)信息學(xué)院納什均衡納什均衡與其他概念的關(guān)系每一個(gè)占優(yōu)策略均衡、重復(fù)剔除的占優(yōu)均衡一定是納什均衡,但并非每一個(gè)納什均衡都是占優(yōu)戰(zhàn)略均衡或者重復(fù)剔除的占優(yōu)均衡。納什均衡一定是在重復(fù)剔除嚴(yán)格劣策略過程中沒有被剔除掉的策略組合;但沒有被剔除的策略組合不一定是納什均衡,除非它是唯一的。注意:弱劣策略剔除可能剔除掉納什均衡2022/12/1935中南財(cái)經(jīng)政法大學(xué)信息學(xué)院納什均衡2022/12/1035中南財(cái)經(jīng)政法大學(xué)信息學(xué)院不同均衡概念的關(guān)系:占優(yōu)均衡DSE重復(fù)剔除占優(yōu)均衡IEDE純策略納什均衡PNE2022/12/1936中南財(cái)經(jīng)政法大學(xué)信息學(xué)院不同均衡概念的關(guān)系:占優(yōu)均衡重復(fù)剔除占優(yōu)均衡純策略納什均衡2占優(yōu)均衡重復(fù)剔除的占優(yōu)均衡納什均衡完全信息靜態(tài)博弈均衡解的思考進(jìn)程2022/12/1937中南財(cái)經(jīng)政法大學(xué)信息學(xué)院占優(yōu)均衡重復(fù)剔除的占優(yōu)均衡納什均衡完全信息靜態(tài)博弈均衡解的思

那么什么是博弈論的均衡呢?所謂博弈均衡,它是一穩(wěn)定的博弈結(jié)果。均衡是博弈的一結(jié)果,但不是說博弈的結(jié)果都能成為均衡。博弈的均衡是穩(wěn)定的,因而是可以預(yù)測的。納什均衡是一最常見的均衡。它的含義是:在對方策略確定的情況下,每個(gè)參與者的策略都是最好的,此時(shí)沒有人愿意先改變自己的策略。

納什均衡是博弈論中的重要概念,同時(shí)也是經(jīng)濟(jì)學(xué)的重要概念。2022/12/1938中南財(cái)經(jīng)政法大學(xué)信息學(xué)院那么什么是博弈論的均衡呢?所謂博弈均衡,它是一穩(wěn)定的博弈納什均衡的缺點(diǎn)(1)納什均衡不唯一。在不唯一的情況下,哪一個(gè)才是最可能出現(xiàn)的呢?(允許了不可置信的威脅的存在)

(2)沒有納什均衡存在又如何分析?2022/12/1939中南財(cái)經(jīng)政法大學(xué)信息學(xué)院納什均衡的缺點(diǎn)2022/12/1039中南財(cái)經(jīng)政法大學(xué)例1——監(jiān)督博弈(不存在納什均衡)監(jiān)督不監(jiān)督偷懶不偷懶1,-1-1,2-2,32,2給定工人偷懶,老板的最優(yōu)選擇是監(jiān)督;給定老板監(jiān)督,工人的最優(yōu)選擇是不偷懶;給定工人不偷懶,老板的最優(yōu)選擇是不監(jiān)督;給定老板不監(jiān)督,工人的最優(yōu)選擇是偷懶;形成如此循環(huán)。2022/12/1940中南財(cái)經(jīng)政法大學(xué)信息學(xué)院例1——監(jiān)督博弈(不存在納什均衡)監(jiān)督不監(jiān)督偷懶不偷懶1,-例2——斗雞博弈(存在兩個(gè)以上納什均衡)-3,-32,00,20,0退BA進(jìn)退進(jìn)獨(dú)木橋納什均衡:A進(jìn),B退;A退,B進(jìn)2022/12/1941中南財(cái)經(jīng)政法大學(xué)信息學(xué)院例2——斗雞博弈(存在兩個(gè)以上納什均衡)-3,-32,00,美蘇古巴導(dǎo)彈危機(jī)冷戰(zhàn)期間美蘇爭霸最嚴(yán)重的一次危機(jī)。蘇聯(lián):面臨將導(dǎo)彈撤回國還是堅(jiān)持部署在古巴的選擇;美國:挑起戰(zhàn)爭還是容忍蘇聯(lián)的挑釁行為。結(jié)果:蘇聯(lián):將導(dǎo)彈從古巴撤回,做了丟面子的“撤退的雞”,美國:堅(jiān)持自己的的策略,做了“不退的雞”,但是象征性地從土耳其撤回了一些導(dǎo)彈,給蘇聯(lián)一點(diǎn)面子。獨(dú)木橋2022/12/1942中南財(cái)經(jīng)政法大學(xué)信息學(xué)院美蘇古巴導(dǎo)彈危機(jī)獨(dú)木橋2022/12/1042中南財(cái)經(jīng)政法大這就是美國與蘇聯(lián)在古巴導(dǎo)彈上的博弈結(jié)果。對于蘇聯(lián)來說,退下來的結(jié)果是丟了面子,但總比戰(zhàn)爭要好;對美國而言,既保全了面子,又沒有發(fā)生戰(zhàn)爭。這就是這兩只“大公雞”博弈的結(jié)果。2022/12/1943中南財(cái)經(jīng)政法大學(xué)信息學(xué)院這就是美國與蘇聯(lián)在古巴導(dǎo)彈上的博弈結(jié)果。對于蘇聯(lián)來說,退下來

在博弈中納什均衡點(diǎn)如果有兩個(gè)或兩個(gè)以上,結(jié)果就難以預(yù)料。這對每個(gè)博弈方都是麻煩事,因?yàn)楹蠊y料,行動(dòng)也往往進(jìn)退兩難。左邊還是右邊例如兩個(gè)騎自行車的人對面碰頭,很容易互相“向住”:因?yàn)椴恢缹Ψ綍?huì)不會(huì)躲、往哪邊躲,自己也不知該如何反應(yīng),于是撞到一起。自行車相撞一般不會(huì)造成什么大麻煩,可是如果換成馬車、汽車,就可能出現(xiàn)傷亡。所以,應(yīng)該有一個(gè)強(qiáng)制性的規(guī)定,來告訴人們該怎么做。2022/12/1944中南財(cái)經(jīng)政法大學(xué)信息學(xué)院在博弈中納什均衡點(diǎn)如果有兩個(gè)或兩個(gè)以上,結(jié)果就難交通博弈與交通規(guī)則靠左行靠右行靠左行靠右行1,11,1-1,-1-1,-12022/12/1945中南財(cái)經(jīng)政法大學(xué)信息學(xué)院交通博弈與交通規(guī)則靠左行靠右行靠左行靠右行1,11,1-1,

海上航行也要面臨同樣的問題,盡管大海遼闊,但是航線卻是比較固定的,因此船只交會(huì)的機(jī)會(huì)很多,這些船只屬于不同的國家,如何調(diào)節(jié)誰進(jìn)誰退的問題呢?先來看一個(gè)小笑話:一艘軍艦在夜航中,艦長發(fā)現(xiàn)前方航線上出現(xiàn)了燈光。艦長馬上呼叫:“對面船只,右轉(zhuǎn)30度?!睂Ψ交卮穑骸罢垖γ娲蛔筠D(zhuǎn)30度?!薄拔沂敲绹\娚闲?,右轉(zhuǎn)30度。”“我是加拿大海軍二等兵,請左轉(zhuǎn)30度。”艦長生氣了:“聽著,我是‘列克星頓’號(hào)戰(zhàn)列艦艦長,這是美國海軍最強(qiáng)大的武裝力量,右轉(zhuǎn)30度!”“我是燈塔管理員,請左轉(zhuǎn)30度。”2022/12/1946中南財(cái)經(jīng)政法大學(xué)信息學(xué)院海上航行也要面臨同樣的問題,盡管大海遼誰打電話上面的例子是通過規(guī)定解決了問題,不過,若是遇到電話打到一半突然斷了的事,你該怎么辦?假如你正在和朋友通話,電話斷了,而話還沒說完。這時(shí)有兩個(gè)選擇,馬上打給對方,或等待對方打來。注意:如果你打過去,他就應(yīng)該等在電話旁,好把自家電話的線路空出來,如果他也在打給你,你們只能聽到忙音;另一方面,假如你等待對方打電話,而他也在等待,那么你們的聊天就沒有機(jī)會(huì)繼續(xù)下去。2022/12/1947中南財(cái)經(jīng)政法大學(xué)信息學(xué)院誰打電話2022/12/1047中南財(cái)經(jīng)政法大學(xué)信息學(xué)院

案例——?dú)W共體在空中客車與波音公司的競爭中對空中客車公司的戰(zhàn)略性補(bǔ)貼。歐共體為了打破美國波音公司對全球民航業(yè)的壟斷,曾放棄歐洲傳統(tǒng)的自由競爭精神而對與波音公司進(jìn)行競爭的空中客車公司進(jìn)行補(bǔ)貼。2022/12/1948中南財(cái)經(jīng)政法大學(xué)信息學(xué)院2022/12/1048中南財(cái)經(jīng)政法大學(xué)信息學(xué)院

當(dāng)雙方都未獲得政府的補(bǔ)貼時(shí),兩個(gè)公司都開發(fā)新型飛機(jī)會(huì)因市場飽和而虧損,但若一家公司開發(fā)而另一家公司不開發(fā)時(shí),則開發(fā)的那家公司會(huì)獲巨額利潤,見表2。2022/12/1949中南財(cái)經(jīng)政法大學(xué)信息學(xué)院當(dāng)雙方都未獲得政府的補(bǔ)貼時(shí),兩個(gè)公司表2未補(bǔ)貼時(shí)的博弈

空中客車開發(fā)不開發(fā)開發(fā)波音不開發(fā)

-10,-10100,00,1000,02022/12/1950中南財(cái)經(jīng)政法大學(xué)信息學(xué)院表2未補(bǔ)貼時(shí)的博弈-10,-10100,00,1000

此時(shí)有兩個(gè)納什均衡,即一家開發(fā)而另一家不開發(fā)。下面,考慮歐共體對空中客車進(jìn)行補(bǔ)貼20個(gè)單位的情況。此時(shí),當(dāng)兩家都開發(fā)時(shí),空中客車仍然盈利10單位而不是虧損,博弈矩陣見表3。2022/12/1951中南財(cái)經(jīng)政法大學(xué)信息學(xué)院此時(shí)有兩個(gè)納什均衡,即一家開發(fā)而另一家不開發(fā)。表3有補(bǔ)貼時(shí)的博弈

空中客車開發(fā)不開發(fā)開發(fā)波音不開發(fā)

-10,10100,00,1200,02022/12/1952中南財(cái)經(jīng)政法大學(xué)信息學(xué)院表3有補(bǔ)貼時(shí)的博弈-10,10100,00,1200,

這時(shí)只有一個(gè)納什均衡,即波音公司不開發(fā)和空中客車公司開發(fā)的均衡(不開發(fā),開發(fā)),這有利于空中客車。在這里,歐共體對空中客車的補(bǔ)貼就是使空中客車一定要開發(fā)(無論波音是否開發(fā))的威脅變得可置信的一種“承諾行動(dòng)”。2022/12/1953中南財(cái)經(jīng)政法大學(xué)信息學(xué)院這時(shí)只有一個(gè)納什均衡,即波音公司不課后練習(xí):1、P1024,52022/12/1954中南財(cái)經(jīng)政法大學(xué)信息學(xué)院課后練習(xí):2022/12/1054中南財(cái)經(jīng)政法大學(xué)信息學(xué)院

完全信息靜態(tài)博弈——納什均衡

設(shè)有兩人博弈,每個(gè)博弈方都有不同的策略,誰都希望自己出“高招”使自己獲勝(即尋求效用的最大化),但獲勝并不完全依賴于自己的行為能力,還依賴于對手怎么做。2022/12/1955中南財(cái)經(jīng)政法大學(xué)信息學(xué)院完全信息靜態(tài)博弈——納什均衡設(shè)有兩人博弈,每個(gè)

試想有兩只公雞遇到一起,每只公雞有兩個(gè)行動(dòng)選擇:一是退下來,一是進(jìn)攻。如果一方退下來,而對方?jīng)]有退下來,對方獲得勝利,這只公雞則很丟面子;如果對方也退下來雙方則打個(gè)平手;如果自己沒退下來,而對方退下來,自己則勝利,對方則失?。蝗绻麅芍还u都前進(jìn),那么則兩敗俱傷。因此,對每只公雞來說,最好的結(jié)果是,對方退下來,而自己不退,但是此時(shí)面臨著兩敗俱傷的結(jié)果。經(jīng)典案例三——斗雞博弈2022/12/1956中南財(cái)經(jīng)政法大學(xué)信息學(xué)院試想有兩只公雞遇到一起,每只公雞有兩個(gè)行動(dòng)選擇:一是退下來經(jīng)典案例三——斗雞博弈-3,-32,00,20,0退BA進(jìn)退進(jìn)獨(dú)木橋?qū)τ谙喈?dāng)多的博弈,我們無法運(yùn)用重復(fù)剔除劣戰(zhàn)略的方法找出均衡解。顯然為了找出這些博弈的均衡解,需要引入納什均衡。2022/12/1957中南財(cái)經(jīng)政法大學(xué)信息學(xué)院經(jīng)典案例三——斗雞博弈-3,-32,00,20,0退BA進(jìn)退例1、選課博弈鐘信陳明德語法語德語3,21,1法語0,02,3斗雞博弈:對諸多現(xiàn)象的解釋2022/12/1958中南財(cái)經(jīng)政法大學(xué)信息學(xué)院例1、選課博弈鐘信德語法語德語3,21,1法語例2、性別博弈

Battleofsexes

足球2,10,0-1,-11,2芭蕾足球

芭蕾girlboy2022/12/1959中南財(cái)經(jīng)政法大學(xué)信息學(xué)院例2、性別博弈

Battleofsexes

足球2,10納什均衡____哲學(xué)思考

如果一個(gè)博弈問題的所有博弈方事前能達(dá)成一個(gè)“協(xié)議”,并在沒有外部強(qiáng)制的情況下,每個(gè)博弈方都有積極性遵守這個(gè)“協(xié)議”。那么,這個(gè)協(xié)議就是納什均衡。2022/12/1960中南財(cái)經(jīng)政法大學(xué)信息學(xué)院納什均衡____哲學(xué)思考如果一個(gè)博弈問題的所有博弈假設(shè)n個(gè)人參與博弈,給定其他博弈方策略的條件下,每個(gè)博弈方選擇自己的最優(yōu)策略。納什均衡指的是“由所有博弈方的最優(yōu)策略組成的一個(gè)組合”n個(gè)人制訂了一個(gè)協(xié)議,這n個(gè)人是否能自愿遵守?他們會(huì)自覺遵守,這個(gè)協(xié)議就構(gòu)成一個(gè)納什均衡。如果一個(gè)協(xié)議不構(gòu)成納什均衡,它就不可能自動(dòng)實(shí)施,而需要外力脅迫,這就是無所謂的“協(xié)議”2022/12/1961中南財(cái)經(jīng)政法大學(xué)信息學(xué)院假設(shè)n個(gè)人參與博弈,給定其他博弈方策略的條件下,每個(gè)博弈方選理解納什均衡的重要性:任何“合理”結(jié)果都要滿足的條件——當(dāng)某一博弈方發(fā)現(xiàn)他人單方面改變策略可以獲取更多時(shí),他會(huì)毫不猶豫地改變自己的策略,博弈自然就有達(dá)到均衡了。思考:一種制度安排要發(fā)生效力,為什么必須是納什均衡。否則,這種制度安排會(huì)有效力嗎?2022/12/1962中南財(cái)經(jīng)政法大學(xué)信息學(xué)院理解納什均衡的重要性:任何“合理”結(jié)果都要滿足的條件——當(dāng)某五、納什均衡定義:在博弈G={s1,…,sn;u1,…,un}中,如果各博弈方i的某策略si*與其他博弈方的策略s-i*組成策略組合(si*,s-i*),且任一博弈方i的策略si*都是對其余博弈方策略s-i*的最佳反應(yīng)。 則稱(si*,s-i*)為該博弈的一個(gè)Nash均衡 特別,當(dāng)且僅當(dāng)(si*,s-i*)是Nash均衡,且對所有純策略si(si≠si*)有ui(si*,s-i*)>ui(si,s-i*),又稱(si*,s-i*)是嚴(yán)格(強(qiáng))Nash均衡。2022/12/1963中南財(cái)經(jīng)政法大學(xué)信息學(xué)院五、納什均衡定義:在博弈G={s1,…,sn;u1,…,un納什均衡與一致預(yù)期納什均衡:所有博弈方的最優(yōu)策略的組合:給定該策略中別人的選擇,沒有人有積極性改變自己的選擇。一致預(yù)期:基于信念的選擇是合理的;支持選擇的信念是正確的;預(yù)期的自我實(shí)現(xiàn):如果所有人認(rèn)為這個(gè)結(jié)果會(huì)出現(xiàn),這個(gè)結(jié)果就一定會(huì)出現(xiàn)。預(yù)期是自我實(shí)現(xiàn)的,預(yù)期不會(huì)錯(cuò)誤。如果你認(rèn)為我預(yù)期你將選擇X,你就真的會(huì)選擇X。2022/12/1964中南財(cái)經(jīng)政法大學(xué)信息學(xué)院納什均衡與一致預(yù)期納什均衡:所有博弈方的最優(yōu)策略的組合:給定納什均衡舉例例如——廣告博弈納什均衡:(做廣告,做廣告)企業(yè)1企業(yè)22022/12/1965中南財(cái)經(jīng)政法大學(xué)信息學(xué)院納什均衡舉例例如——廣告博弈企業(yè)1企業(yè)22022/12/10經(jīng)典案例三——斗雞博弈-3,-32,00,20,0退BA進(jìn)退進(jìn)獨(dú)木橋納什均衡:A進(jìn),B退;A退,B進(jìn)納什均衡可以幫我們找出這些博弈的均衡解,2022/12/1966中南財(cái)經(jīng)政法大學(xué)信息學(xué)院經(jīng)典案例三——斗雞博弈-3,-32,00,20,0退BA進(jìn)退例如——性別博弈小莉大海足球芭蕾足球(2,1)(0,0)芭蕾(-1,-1)(1,2)納什均衡的含義就是:給定你的策略,我的策略是最好的策略;給定我的策略,你的策略也是你的最好的策略。即雙方在給定的策略下不愿意調(diào)整自己的策略。請同學(xué)分析:2022/12/1967中南財(cái)經(jīng)政法大學(xué)信息學(xué)院例如——性別博弈小莉足球芭蕾足球(2,1)(一)Nash均衡的基本求解法1、劃線法基本思想——博弈方先找出自己針對其他博弈方每種策略或策略組合的最佳對策,即自己的可選策略中與其他博弈方的策略或策略組合配合,給自己帶來最大得益的策略,然后在此基礎(chǔ)上,通過對其他博弈方策略選擇的判斷,包括對其他博弈方對自己策略判斷的判斷等,預(yù)測博弈的可能結(jié)果和確定自己的最優(yōu)策略。2022/12/1968中南財(cái)經(jīng)政法大學(xué)信息學(xué)院(一)Nash均衡的基本求解法1、劃線法2022/12/10具體方法——對其他博弈方的任一策略組合,找出博弈方i的最佳策略,并在其得益值下劃一小橫線;若存在一個(gè)這樣的策略組合,所有博弈方的得益值下都劃了線,則該組策略組合就是該博弈的一個(gè)納什均衡。2022/12/1969中南財(cái)經(jīng)政法大學(xué)信息學(xué)院具體方法——對其他博弈方的任一策略組合,找出博弈方i的最佳策例1、性別博弈小莉大海足球芭蕾足球(2,1)(0,0)芭蕾(-1,-1)(1,2)分析:如果大海選足球,小莉的“相對優(yōu)勢策略”也是足球,這比她選芭蕾好,這是在小莉的盈利值1下劃線。2022/12/1970中南財(cái)經(jīng)政法大學(xué)信息學(xué)院例1、性別博弈小莉足球芭蕾足球(2,

如果大海選芭蕾,小莉的“相對優(yōu)勢策略”也一定是芭蕾,這時(shí)將右下方格中盈利值2下劃線。如果小莉選足球,大海的“相對優(yōu)勢策略”是足球,這時(shí),在大海的盈利矩陣左上格中盈利值2下劃線。 如果小莉選芭蕾,大海的“相對優(yōu)勢策略”也是芭蕾,因而在右下格其盈利值2下劃線。當(dāng)雙方的相對優(yōu)勢策略確定后,哪個(gè)格子里面兩個(gè)數(shù)字都被被劃線,那么這個(gè)格中所對應(yīng)的相對優(yōu)勢策略組合就是一個(gè)納什均衡。2022/12/1971中南財(cái)經(jīng)政法大學(xué)信息學(xué)院 如果大海選芭蕾,小莉的“相對優(yōu)勢策略”也一定是芭蕾,這時(shí)將例2、囚徒困境博弈

招不招招甲不招(問題1:甲、乙如何選擇?)

-8,-80,-15-15,0-1,-12022/12/1972中南財(cái)經(jīng)政法大學(xué)信息學(xué)院例2、囚徒困境博弈-8,-80,-15-15,0-1,-12例3—“智豬博弈”(boxedpigs)有些博弈沒有占優(yōu)均衡,但通過剔除“劣”策略,我們可以預(yù)測博弈的結(jié)果;還可以通過“納什均衡”預(yù)測博弈的結(jié)果。如“智豬博弈”按等待按等待5,14,49,-10,0這個(gè)博弈中,大豬的最優(yōu)選擇依賴于小豬的選擇,但小豬的最優(yōu)選擇與大豬的選擇無關(guān)。如果大豬知道小豬的理性的,大豬將選擇“按”。均衡是“大豬按,小豬等待”?!傲印辈呗裕簾o論對方選擇什么,如果自己選擇A得到的總是收益小于選擇B得到的收益,A就是相對于B的劣策略。2022/12/1973中南財(cái)經(jīng)政法大學(xué)信息學(xué)院例3—“智豬博弈”(boxedpigs)有些博弈沒有占優(yōu)均例4:博弈G如右圖:1,01,30,10,40,20,0博弈方Ⅱ左中右解:該博弈的納什均衡為(中,上)。

2022/12/1974中南財(cái)經(jīng)政法大學(xué)信息學(xué)院例4:博弈G如右圖:1,01,30,10,4例5:博弈G如下圖:2,81,61,80,80,60,80,81,50,9博弈方ⅡLMR解:該博弈有兩個(gè)納什均衡(U,L)和(U,R)。2022/12/1975中南財(cái)經(jīng)政法大學(xué)信息學(xué)院例5:博弈G如下圖:2,81,61,80,8例6、軍備競賽蘇美擴(kuò)軍裁軍擴(kuò)軍(-3000,-3000)(10000,-∞)裁軍(-∞,10000)(0,0)結(jié)論,這個(gè)博弈存在一個(gè)Nash均衡(擴(kuò)軍,擴(kuò)軍)2022/12/1976中南財(cái)經(jīng)政法大學(xué)信息學(xué)院例6、軍備競賽蘇擴(kuò)軍裁軍擴(kuò)軍(-3000,-軍備考慮為擴(kuò)軍、有限軍備、不設(shè)防,那么G為:

BA擴(kuò)軍有限裁軍擴(kuò)軍(-2000,-2000)(-1600,-1500)(8000,-∞)有限(-1500,-1600)(-500,-500)(9500,-∞)裁軍(-∞,8000)(-∞,9500)(0,0)據(jù)劃線法求得Nash均衡為雙方采用有限軍備策略。注意①對每一方,有限軍備都是全局優(yōu)勢策略,擴(kuò)軍和不設(shè)防都是全局劣勢策略。 ②此問題也可用重復(fù)剔除的占優(yōu)均衡求得博弈問題的解為(有限軍備,有限軍備)。2022/12/1977中南財(cái)經(jīng)政法大學(xué)信息學(xué)院軍備考慮為擴(kuò)軍、有限軍備、不設(shè)防,那么G為:例7:尋找納什均衡C1C2C3R1R2R3100,1000,050,10150,01,160,00,3000,0200,2002022/12/1978中南財(cái)經(jīng)政法大學(xué)信息學(xué)院例7:尋找納什均衡C1C2C3R1R2R3100,1000,納什均衡(NashEquilibrium)的理解?納什均衡-是一種“僵局”,給定別人不改變策略的情況下,沒有人有興趣改變。?囚徒困境是西方經(jīng)濟(jì)學(xué)中個(gè)人理性與集體理性沖突的一個(gè)例證。2022/12/1979中南財(cái)經(jīng)政法大學(xué)信息學(xué)院納什均衡(NashEquilibrium)的理解2022/基本思路——對博弈中的每個(gè)策略組合進(jìn)行分析,考察在每個(gè)策略組合處各個(gè)博弈方能否通過單獨(dú)改變自己的策略而增加盈利,如能,則從所分析的策略組合對應(yīng)的盈利數(shù)組引一箭頭,到改變策略后策略組合對應(yīng)的盈利數(shù)組,最后綜合對每個(gè)策略組合的分析情況,只有指向、無指離的策略組合形成對博弈的結(jié)果。2、箭頭法2022/12/1980中南財(cái)經(jīng)政法大學(xué)信息學(xué)院基本思路——對博弈中的每個(gè)策略組合進(jìn)行分析,考察在每個(gè)策略組具體方法——考察在每個(gè)策略組合處各個(gè)博弈方能否通過單獨(dú)改變自己的策略而增加得益。如能,則從所分析的策略組合對應(yīng)的得益數(shù)組引一箭頭,到改變策略后策略組合對應(yīng)的得益數(shù)組。若存在一策略組合,其得益數(shù)組只有進(jìn)來的箭頭而沒有出去的箭頭,則該策略組合就是納什均衡。2022/12/1981中南財(cái)經(jīng)政法大學(xué)信息學(xué)院具體方法——考察在每個(gè)策略組合處各個(gè)博弈方能否通過單獨(dú)改變自例1:博弈G如右博弈方Ⅱ左中右0,41,00,00,20,11,3納什均衡為(上,中)2022/12/1982中南財(cái)經(jīng)政法大學(xué)信息學(xué)院例1:博弈G如右博弈方Ⅱ左例2、囚徒困境乙甲坦白抵賴坦白(-8,-8)(0,-15)抵賴(-15,0)(-1,-1)因此,策略組合(坦白,坦白)就是唯一具有穩(wěn)定性的結(jié)果。2022/12/1983中南財(cái)經(jīng)政法大學(xué)信息學(xué)院例2、囚徒困境乙坦白抵賴坦白(-8,-8斗雞B進(jìn)攻退卻-3,-32,00,20,0經(jīng)典案例3——斗雞博弈

(進(jìn),退)和(退,進(jìn))是兩個(gè)納什均衡。2022/12/1984中南財(cái)經(jīng)政法大學(xué)信息學(xué)院斗雞B-3,-32,00,20,0經(jīng)典案例3例4、性別博弈小莉大海足球芭蕾足球(2,1)(0,0)芭蕾(-1,-1)(1,2)2022/12/1985中南財(cái)經(jīng)政法大學(xué)信息學(xué)院例4、性別博弈小莉足球芭蕾足球(2,1)((二)納什均衡與重復(fù)剔除的占優(yōu)均衡

占優(yōu)均衡肯定是納什均衡,但反過來納什均衡不一定是占優(yōu)均衡,因此占優(yōu)均衡是比納什均衡更強(qiáng)、穩(wěn)定性更高的均衡概念。只是,占優(yōu)均衡在博弈問題中的普遍性比納什均衡要差得多。

重復(fù)剔除的占有均衡和納什均衡之間的關(guān)系要復(fù)雜一些,關(guān)鍵是這兩者之間是否存在相容性,即嚴(yán)格劣策略反復(fù)消去法是否會(huì)消去納什均衡,對于納什均衡和重復(fù)剔出的占優(yōu)均衡的關(guān)系,下面的兩個(gè)命題基本上給出了我們所希望的答案。2022/12/1986中南財(cái)經(jīng)政法大學(xué)信息學(xué)院(二)納什均衡與重復(fù)剔除的占優(yōu)均衡占優(yōu)均衡肯定是納什Nash均衡的特質(zhì)1)一致預(yù)測性 “一致”——各博弈方的實(shí)際行為選擇與他們的預(yù)測一致。2)與重復(fù)剔出的占優(yōu)均衡的關(guān)系若G={s1,…,sn;u1,…,un},通過嚴(yán)格劣策反復(fù)消去法排除了除(s1*,…,sn*)之外的所有策略組合,那么(s1*,…,sn*)一定是該博弈唯一的Nash均衡。若G={s1,…,sn;u1,…,un},如果(s1*,…,s2*)是G的一個(gè)Nash均衡,那么嚴(yán)格劣策反復(fù)消去法一定不會(huì)將它剔除。2022/12/1987中南財(cái)經(jīng)政法大學(xué)信息學(xué)院Nash均衡的特質(zhì)1)一致預(yù)測性2022/12/1033中南納什均衡構(gòu)成納什均衡的策略一定是重復(fù)剔除嚴(yán)格劣策略過程中不會(huì)被剔除的策略。許多不存在占優(yōu)策略均衡或重復(fù)剔除的占優(yōu)均衡的博弈卻存在納什均衡。小結(jié)與思考:三種均衡的概念:占優(yōu)均衡——重復(fù)剔除的占優(yōu)均衡——納什均衡三種均衡是什么關(guān)系2022/12/1988中南財(cái)經(jīng)政法大學(xué)信息學(xué)院納什均衡2022/12/1034中南財(cái)經(jīng)政法大學(xué)信息學(xué)院納什均衡納什均衡與其他概念的關(guān)系每一個(gè)占優(yōu)策略均衡、重復(fù)剔除的占優(yōu)均衡一定是納什均衡,但并非每一個(gè)納什均衡都是占優(yōu)戰(zhàn)略均衡或者重復(fù)剔除的占優(yōu)均衡。納什均衡一定是在重復(fù)剔除嚴(yán)格劣策略過程中沒有被剔除掉的策略組合;但沒有被剔除的策略組合不一定是納什均衡,除非它是唯一的。注意:弱劣策略剔除可能剔除掉納什均衡2022/12/1989中南財(cái)經(jīng)政法大學(xué)信息學(xué)院納什均衡2022/12/1035中南財(cái)經(jīng)政法大學(xué)信息學(xué)院不同均衡概念的關(guān)系:占優(yōu)均衡DSE重復(fù)剔除占優(yōu)均衡IEDE純策略納什均衡PNE2022/12/1990中南財(cái)經(jīng)政法大學(xué)信息學(xué)院不同均衡概念的關(guān)系:占優(yōu)均衡重復(fù)剔除占優(yōu)均衡純策略納什均衡2占優(yōu)均衡重復(fù)剔除的占優(yōu)均衡納什均衡完全信息靜態(tài)博弈均衡解的思考進(jìn)程2022/12/1991中南財(cái)經(jīng)政法大學(xué)信息學(xué)院占優(yōu)均衡重復(fù)剔除的占優(yōu)均衡納什均衡完全信息靜態(tài)博弈均衡解的思

那么什么是博弈論的均衡呢?所謂博弈均衡,它是一穩(wěn)定的博弈結(jié)果。均衡是博弈的一結(jié)果,但不是說博弈的結(jié)果都能成為均衡。博弈的均衡是穩(wěn)定的,因而是可以預(yù)測的。納什均衡是一最常見的均衡。它的含義是:在對方策略確定的情況下,每個(gè)參與者的策略都是最好的,此時(shí)沒有人愿意先改變自己的策略。

納什均衡是博弈論中的重要概念,同時(shí)也是經(jīng)濟(jì)學(xué)的重要概念。2022/12/1992中南財(cái)經(jīng)政法大學(xué)信息學(xué)院那么什么是博弈論的均衡呢?所謂博弈均衡,它是一穩(wěn)定的博弈納什均衡的缺點(diǎn)(1)納什均衡不唯一。在不唯一的情況下,哪一個(gè)才是最可能出現(xiàn)的呢?(允許了不可置信的威脅的存在)

(2)沒有納什均衡存在又如何分析?2022/12/1993中南財(cái)經(jīng)政法大學(xué)信息學(xué)院納什均衡的缺點(diǎn)2022/12/1039中南財(cái)經(jīng)政法大學(xué)例1——監(jiān)督博弈(不存在納什均衡)監(jiān)督不監(jiān)督偷懶不偷懶1,-1-1,2-2,32,2給定工人偷懶,老板的最優(yōu)選擇是監(jiān)督;給定老板監(jiān)督,工人的最優(yōu)選擇是不偷懶;給定工人不偷懶,老板的最優(yōu)選擇是不監(jiān)督;給定老板不監(jiān)督,工人的最優(yōu)選擇是偷懶;形成如此循環(huán)。2022/12/1994中南財(cái)經(jīng)政法大學(xué)信息學(xué)院例1——監(jiān)督博弈(不存在納什均衡)監(jiān)督不監(jiān)督偷懶不偷懶1,-例2——斗雞博弈(存在兩個(gè)以上納什均衡)-3,-32,00,20,0退BA進(jìn)退進(jìn)獨(dú)木橋納什均衡:A進(jìn),B退;A退,B進(jìn)2022/12/1995中南財(cái)經(jīng)政法大學(xué)信息學(xué)院例2——斗雞博弈(存在兩個(gè)以上納什均衡)-3,-32,00,美蘇古巴導(dǎo)彈危機(jī)冷戰(zhàn)期間美蘇爭霸最嚴(yán)重的一次危機(jī)。蘇聯(lián):面臨將導(dǎo)彈撤回國還是堅(jiān)持部署在古巴的選擇;美國:挑起戰(zhàn)爭還是容忍蘇聯(lián)的挑釁行為。結(jié)果:蘇聯(lián):將導(dǎo)彈從古巴撤回,做了丟面子的“撤退的雞”,美國:堅(jiān)持自己的的策略,做了“不退的雞”,但是象征性地從土耳其撤回了一些導(dǎo)彈,給蘇聯(lián)一點(diǎn)面子。獨(dú)木橋2022/12/1996中南財(cái)經(jīng)政法大學(xué)信息學(xué)院美蘇古巴導(dǎo)彈危機(jī)獨(dú)木橋2022/12/1042中南財(cái)經(jīng)政法大這就是美國與蘇聯(lián)在古巴導(dǎo)彈上的博弈結(jié)果。對于蘇聯(lián)來說,退下來的結(jié)果是丟了面子,但總比戰(zhàn)爭要好;對美國而言,既保全了面子,又沒有發(fā)生戰(zhàn)爭。這就是這兩只“大公雞”博弈的結(jié)果。2022/12/1997中南財(cái)經(jīng)政法大學(xué)信息學(xué)院這就是美國與蘇聯(lián)在古巴導(dǎo)彈上的博弈結(jié)果。對于蘇聯(lián)來說,退下來

在博弈中納什均衡點(diǎn)如果有兩個(gè)或兩個(gè)以上,結(jié)果就難以預(yù)料。這對每個(gè)博弈方都是麻煩事,因?yàn)楹蠊y料,行動(dòng)也往往進(jìn)退兩難。左邊還是右邊例如兩個(gè)騎自行車的人對面碰頭,很容易互相“向住”:因?yàn)椴恢缹Ψ綍?huì)不會(huì)躲、往哪邊躲,自己也不知該如何反應(yīng),于是撞到一起。自行車相撞一般不會(huì)造成什么大麻煩,可是如果

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會(huì)有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫網(wǎng)僅提供信息存儲(chǔ)空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負(fù)責(zé)。
  • 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

評(píng)論

0/150

提交評(píng)論