博弈論課件5-完全信息靜態(tài)博弈-納什均衡_第1頁
博弈論課件5-完全信息靜態(tài)博弈-納什均衡_第2頁
博弈論課件5-完全信息靜態(tài)博弈-納什均衡_第3頁
博弈論課件5-完全信息靜態(tài)博弈-納什均衡_第4頁
博弈論課件5-完全信息靜態(tài)博弈-納什均衡_第5頁
已閱讀5頁,還剩103頁未讀 繼續(xù)免費閱讀

下載本文檔

版權說明:本文檔由用戶提供并上傳,收益歸屬內容提供方,若內容存在侵權,請進行舉報或認領

文檔簡介

完全信息靜態(tài)博弈——納什均衡

設有兩人博弈,每個博弈方都有不同的策略,誰都希望自己出“高招”使自己獲勝(即尋求效用的最大化),但獲勝并不完全依賴于自己的行為能力,還依賴于對手怎么做。2022/12/191中南財經(jīng)政法大學信息學院完全信息靜態(tài)博弈——納什均衡設有兩人博弈,每個

試想有兩只公雞遇到一起,每只公雞有兩個行動選擇:一是退下來,一是進攻。如果一方退下來,而對方?jīng)]有退下來,對方獲得勝利,這只公雞則很丟面子;如果對方也退下來雙方則打個平手;如果自己沒退下來,而對方退下來,自己則勝利,對方則失?。蝗绻麅芍还u都前進,那么則兩敗俱傷。因此,對每只公雞來說,最好的結果是,對方退下來,而自己不退,但是此時面臨著兩敗俱傷的結果。經(jīng)典案例三——斗雞博弈2022/12/192中南財經(jīng)政法大學信息學院試想有兩只公雞遇到一起,每只公雞有兩個行動選擇:一是退下來經(jīng)典案例三——斗雞博弈-3,-32,00,20,0退BA進退進獨木橋對于相當多的博弈,我們無法運用重復剔除劣戰(zhàn)略的方法找出均衡解。顯然為了找出這些博弈的均衡解,需要引入納什均衡。2022/12/193中南財經(jīng)政法大學信息學院經(jīng)典案例三——斗雞博弈-3,-32,00,20,0退BA進退例1、選課博弈鐘信陳明德語法語德語3,21,1法語0,02,3斗雞博弈:對諸多現(xiàn)象的解釋2022/12/194中南財經(jīng)政法大學信息學院例1、選課博弈鐘信德語法語德語3,21,1法語例2、性別博弈

Battleofsexes

足球2,10,0-1,-11,2芭蕾足球

芭蕾girlboy2022/12/195中南財經(jīng)政法大學信息學院例2、性別博弈

Battleofsexes

足球2,10納什均衡____哲學思考

如果一個博弈問題的所有博弈方事前能達成一個“協(xié)議”,并在沒有外部強制的情況下,每個博弈方都有積極性遵守這個“協(xié)議”。那么,這個協(xié)議就是納什均衡。2022/12/196中南財經(jīng)政法大學信息學院納什均衡____哲學思考如果一個博弈問題的所有博弈假設n個人參與博弈,給定其他博弈方策略的條件下,每個博弈方選擇自己的最優(yōu)策略。納什均衡指的是“由所有博弈方的最優(yōu)策略組成的一個組合”n個人制訂了一個協(xié)議,這n個人是否能自愿遵守?他們會自覺遵守,這個協(xié)議就構成一個納什均衡。如果一個協(xié)議不構成納什均衡,它就不可能自動實施,而需要外力脅迫,這就是無所謂的“協(xié)議”2022/12/197中南財經(jīng)政法大學信息學院假設n個人參與博弈,給定其他博弈方策略的條件下,每個博弈方選理解納什均衡的重要性:任何“合理”結果都要滿足的條件——當某一博弈方發(fā)現(xiàn)他人單方面改變策略可以獲取更多時,他會毫不猶豫地改變自己的策略,博弈自然就有達到均衡了。思考:一種制度安排要發(fā)生效力,為什么必須是納什均衡。否則,這種制度安排會有效力嗎?2022/12/198中南財經(jīng)政法大學信息學院理解納什均衡的重要性:任何“合理”結果都要滿足的條件——當某五、納什均衡定義:在博弈G={s1,…,sn;u1,…,un}中,如果各博弈方i的某策略si*與其他博弈方的策略s-i*組成策略組合(si*,s-i*),且任一博弈方i的策略si*都是對其余博弈方策略s-i*的最佳反應。 則稱(si*,s-i*)為該博弈的一個Nash均衡 特別,當且僅當(si*,s-i*)是Nash均衡,且對所有純策略si(si≠si*)有ui(si*,s-i*)>ui(si,s-i*),又稱(si*,s-i*)是嚴格(強)Nash均衡。2022/12/199中南財經(jīng)政法大學信息學院五、納什均衡定義:在博弈G={s1,…,sn;u1,…,un納什均衡與一致預期納什均衡:所有博弈方的最優(yōu)策略的組合:給定該策略中別人的選擇,沒有人有積極性改變自己的選擇。一致預期:基于信念的選擇是合理的;支持選擇的信念是正確的;預期的自我實現(xiàn):如果所有人認為這個結果會出現(xiàn),這個結果就一定會出現(xiàn)。預期是自我實現(xiàn)的,預期不會錯誤。如果你認為我預期你將選擇X,你就真的會選擇X。2022/12/1910中南財經(jīng)政法大學信息學院納什均衡與一致預期納什均衡:所有博弈方的最優(yōu)策略的組合:給定納什均衡舉例例如——廣告博弈納什均衡:(做廣告,做廣告)企業(yè)1企業(yè)22022/12/1911中南財經(jīng)政法大學信息學院納什均衡舉例例如——廣告博弈企業(yè)1企業(yè)22022/12/10經(jīng)典案例三——斗雞博弈-3,-32,00,20,0退BA進退進獨木橋納什均衡:A進,B退;A退,B進納什均衡可以幫我們找出這些博弈的均衡解,2022/12/1912中南財經(jīng)政法大學信息學院經(jīng)典案例三——斗雞博弈-3,-32,00,20,0退BA進退例如——性別博弈小莉大海足球芭蕾足球(2,1)(0,0)芭蕾(-1,-1)(1,2)納什均衡的含義就是:給定你的策略,我的策略是最好的策略;給定我的策略,你的策略也是你的最好的策略。即雙方在給定的策略下不愿意調整自己的策略。請同學分析:2022/12/1913中南財經(jīng)政法大學信息學院例如——性別博弈小莉足球芭蕾足球(2,1)(一)Nash均衡的基本求解法1、劃線法基本思想——博弈方先找出自己針對其他博弈方每種策略或策略組合的最佳對策,即自己的可選策略中與其他博弈方的策略或策略組合配合,給自己帶來最大得益的策略,然后在此基礎上,通過對其他博弈方策略選擇的判斷,包括對其他博弈方對自己策略判斷的判斷等,預測博弈的可能結果和確定自己的最優(yōu)策略。2022/12/1914中南財經(jīng)政法大學信息學院(一)Nash均衡的基本求解法1、劃線法2022/12/10具體方法——對其他博弈方的任一策略組合,找出博弈方i的最佳策略,并在其得益值下劃一小橫線;若存在一個這樣的策略組合,所有博弈方的得益值下都劃了線,則該組策略組合就是該博弈的一個納什均衡。2022/12/1915中南財經(jīng)政法大學信息學院具體方法——對其他博弈方的任一策略組合,找出博弈方i的最佳策例1、性別博弈小莉大海足球芭蕾足球(2,1)(0,0)芭蕾(-1,-1)(1,2)分析:如果大海選足球,小莉的“相對優(yōu)勢策略”也是足球,這比她選芭蕾好,這是在小莉的盈利值1下劃線。2022/12/1916中南財經(jīng)政法大學信息學院例1、性別博弈小莉足球芭蕾足球(2,

如果大海選芭蕾,小莉的“相對優(yōu)勢策略”也一定是芭蕾,這時將右下方格中盈利值2下劃線。如果小莉選足球,大海的“相對優(yōu)勢策略”是足球,這時,在大海的盈利矩陣左上格中盈利值2下劃線。 如果小莉選芭蕾,大海的“相對優(yōu)勢策略”也是芭蕾,因而在右下格其盈利值2下劃線。當雙方的相對優(yōu)勢策略確定后,哪個格子里面兩個數(shù)字都被被劃線,那么這個格中所對應的相對優(yōu)勢策略組合就是一個納什均衡。2022/12/1917中南財經(jīng)政法大學信息學院 如果大海選芭蕾,小莉的“相對優(yōu)勢策略”也一定是芭蕾,這時將例2、囚徒困境博弈

招不招招甲不招(問題1:甲、乙如何選擇?)

-8,-80,-15-15,0-1,-12022/12/1918中南財經(jīng)政法大學信息學院例2、囚徒困境博弈-8,-80,-15-15,0-1,-12例3—“智豬博弈”(boxedpigs)有些博弈沒有占優(yōu)均衡,但通過剔除“劣”策略,我們可以預測博弈的結果;還可以通過“納什均衡”預測博弈的結果。如“智豬博弈”按等待按等待5,14,49,-10,0這個博弈中,大豬的最優(yōu)選擇依賴于小豬的選擇,但小豬的最優(yōu)選擇與大豬的選擇無關。如果大豬知道小豬的理性的,大豬將選擇“按”。均衡是“大豬按,小豬等待”?!傲印辈呗裕簾o論對方選擇什么,如果自己選擇A得到的總是收益小于選擇B得到的收益,A就是相對于B的劣策略。2022/12/1919中南財經(jīng)政法大學信息學院例3—“智豬博弈”(boxedpigs)有些博弈沒有占優(yōu)均例4:博弈G如右圖:1,01,30,10,40,20,0博弈方Ⅱ左中右解:該博弈的納什均衡為(中,上)。

2022/12/1920中南財經(jīng)政法大學信息學院例4:博弈G如右圖:1,01,30,10,4例5:博弈G如下圖:2,81,61,80,80,60,80,81,50,9博弈方ⅡLMR解:該博弈有兩個納什均衡(U,L)和(U,R)。2022/12/1921中南財經(jīng)政法大學信息學院例5:博弈G如下圖:2,81,61,80,8例6、軍備競賽蘇美擴軍裁軍擴軍(-3000,-3000)(10000,-∞)裁軍(-∞,10000)(0,0)結論,這個博弈存在一個Nash均衡(擴軍,擴軍)2022/12/1922中南財經(jīng)政法大學信息學院例6、軍備競賽蘇擴軍裁軍擴軍(-3000,-軍備考慮為擴軍、有限軍備、不設防,那么G為:

BA擴軍有限裁軍擴軍(-2000,-2000)(-1600,-1500)(8000,-∞)有限(-1500,-1600)(-500,-500)(9500,-∞)裁軍(-∞,8000)(-∞,9500)(0,0)據(jù)劃線法求得Nash均衡為雙方采用有限軍備策略。注意①對每一方,有限軍備都是全局優(yōu)勢策略,擴軍和不設防都是全局劣勢策略。 ②此問題也可用重復剔除的占優(yōu)均衡求得博弈問題的解為(有限軍備,有限軍備)。2022/12/1923中南財經(jīng)政法大學信息學院軍備考慮為擴軍、有限軍備、不設防,那么G為:例7:尋找納什均衡C1C2C3R1R2R3100,1000,050,10150,01,160,00,3000,0200,2002022/12/1924中南財經(jīng)政法大學信息學院例7:尋找納什均衡C1C2C3R1R2R3100,1000,納什均衡(NashEquilibrium)的理解?納什均衡-是一種“僵局”,給定別人不改變策略的情況下,沒有人有興趣改變。?囚徒困境是西方經(jīng)濟學中個人理性與集體理性沖突的一個例證。2022/12/1925中南財經(jīng)政法大學信息學院納什均衡(NashEquilibrium)的理解2022/基本思路——對博弈中的每個策略組合進行分析,考察在每個策略組合處各個博弈方能否通過單獨改變自己的策略而增加盈利,如能,則從所分析的策略組合對應的盈利數(shù)組引一箭頭,到改變策略后策略組合對應的盈利數(shù)組,最后綜合對每個策略組合的分析情況,只有指向、無指離的策略組合形成對博弈的結果。2、箭頭法2022/12/1926中南財經(jīng)政法大學信息學院基本思路——對博弈中的每個策略組合進行分析,考察在每個策略組具體方法——考察在每個策略組合處各個博弈方能否通過單獨改變自己的策略而增加得益。如能,則從所分析的策略組合對應的得益數(shù)組引一箭頭,到改變策略后策略組合對應的得益數(shù)組。若存在一策略組合,其得益數(shù)組只有進來的箭頭而沒有出去的箭頭,則該策略組合就是納什均衡。2022/12/1927中南財經(jīng)政法大學信息學院具體方法——考察在每個策略組合處各個博弈方能否通過單獨改變自例1:博弈G如右博弈方Ⅱ左中右0,41,00,00,20,11,3納什均衡為(上,中)2022/12/1928中南財經(jīng)政法大學信息學院例1:博弈G如右博弈方Ⅱ左例2、囚徒困境乙甲坦白抵賴坦白(-8,-8)(0,-15)抵賴(-15,0)(-1,-1)因此,策略組合(坦白,坦白)就是唯一具有穩(wěn)定性的結果。2022/12/1929中南財經(jīng)政法大學信息學院例2、囚徒困境乙坦白抵賴坦白(-8,-8斗雞B進攻退卻-3,-32,00,20,0經(jīng)典案例3——斗雞博弈

(進,退)和(退,進)是兩個納什均衡。2022/12/1930中南財經(jīng)政法大學信息學院斗雞B-3,-32,00,20,0經(jīng)典案例3例4、性別博弈小莉大海足球芭蕾足球(2,1)(0,0)芭蕾(-1,-1)(1,2)2022/12/1931中南財經(jīng)政法大學信息學院例4、性別博弈小莉足球芭蕾足球(2,1)((二)納什均衡與重復剔除的占優(yōu)均衡

占優(yōu)均衡肯定是納什均衡,但反過來納什均衡不一定是占優(yōu)均衡,因此占優(yōu)均衡是比納什均衡更強、穩(wěn)定性更高的均衡概念。只是,占優(yōu)均衡在博弈問題中的普遍性比納什均衡要差得多。

重復剔除的占有均衡和納什均衡之間的關系要復雜一些,關鍵是這兩者之間是否存在相容性,即嚴格劣策略反復消去法是否會消去納什均衡,對于納什均衡和重復剔出的占優(yōu)均衡的關系,下面的兩個命題基本上給出了我們所希望的答案。2022/12/1932中南財經(jīng)政法大學信息學院(二)納什均衡與重復剔除的占優(yōu)均衡占優(yōu)均衡肯定是納什Nash均衡的特質1)一致預測性 “一致”——各博弈方的實際行為選擇與他們的預測一致。2)與重復剔出的占優(yōu)均衡的關系若G={s1,…,sn;u1,…,un},通過嚴格劣策反復消去法排除了除(s1*,…,sn*)之外的所有策略組合,那么(s1*,…,sn*)一定是該博弈唯一的Nash均衡。若G={s1,…,sn;u1,…,un},如果(s1*,…,s2*)是G的一個Nash均衡,那么嚴格劣策反復消去法一定不會將它剔除。2022/12/1933中南財經(jīng)政法大學信息學院Nash均衡的特質1)一致預測性2022/12/1033中南納什均衡構成納什均衡的策略一定是重復剔除嚴格劣策略過程中不會被剔除的策略。許多不存在占優(yōu)策略均衡或重復剔除的占優(yōu)均衡的博弈卻存在納什均衡。小結與思考:三種均衡的概念:占優(yōu)均衡——重復剔除的占優(yōu)均衡——納什均衡三種均衡是什么關系2022/12/1934中南財經(jīng)政法大學信息學院納什均衡2022/12/1034中南財經(jīng)政法大學信息學院納什均衡納什均衡與其他概念的關系每一個占優(yōu)策略均衡、重復剔除的占優(yōu)均衡一定是納什均衡,但并非每一個納什均衡都是占優(yōu)戰(zhàn)略均衡或者重復剔除的占優(yōu)均衡。納什均衡一定是在重復剔除嚴格劣策略過程中沒有被剔除掉的策略組合;但沒有被剔除的策略組合不一定是納什均衡,除非它是唯一的。注意:弱劣策略剔除可能剔除掉納什均衡2022/12/1935中南財經(jīng)政法大學信息學院納什均衡2022/12/1035中南財經(jīng)政法大學信息學院不同均衡概念的關系:占優(yōu)均衡DSE重復剔除占優(yōu)均衡IEDE純策略納什均衡PNE2022/12/1936中南財經(jīng)政法大學信息學院不同均衡概念的關系:占優(yōu)均衡重復剔除占優(yōu)均衡純策略納什均衡2占優(yōu)均衡重復剔除的占優(yōu)均衡納什均衡完全信息靜態(tài)博弈均衡解的思考進程2022/12/1937中南財經(jīng)政法大學信息學院占優(yōu)均衡重復剔除的占優(yōu)均衡納什均衡完全信息靜態(tài)博弈均衡解的思

那么什么是博弈論的均衡呢?所謂博弈均衡,它是一穩(wěn)定的博弈結果。均衡是博弈的一結果,但不是說博弈的結果都能成為均衡。博弈的均衡是穩(wěn)定的,因而是可以預測的。納什均衡是一最常見的均衡。它的含義是:在對方策略確定的情況下,每個參與者的策略都是最好的,此時沒有人愿意先改變自己的策略。

納什均衡是博弈論中的重要概念,同時也是經(jīng)濟學的重要概念。2022/12/1938中南財經(jīng)政法大學信息學院那么什么是博弈論的均衡呢?所謂博弈均衡,它是一穩(wěn)定的博弈納什均衡的缺點(1)納什均衡不唯一。在不唯一的情況下,哪一個才是最可能出現(xiàn)的呢?(允許了不可置信的威脅的存在)

(2)沒有納什均衡存在又如何分析?2022/12/1939中南財經(jīng)政法大學信息學院納什均衡的缺點2022/12/1039中南財經(jīng)政法大學例1——監(jiān)督博弈(不存在納什均衡)監(jiān)督不監(jiān)督偷懶不偷懶1,-1-1,2-2,32,2給定工人偷懶,老板的最優(yōu)選擇是監(jiān)督;給定老板監(jiān)督,工人的最優(yōu)選擇是不偷懶;給定工人不偷懶,老板的最優(yōu)選擇是不監(jiān)督;給定老板不監(jiān)督,工人的最優(yōu)選擇是偷懶;形成如此循環(huán)。2022/12/1940中南財經(jīng)政法大學信息學院例1——監(jiān)督博弈(不存在納什均衡)監(jiān)督不監(jiān)督偷懶不偷懶1,-例2——斗雞博弈(存在兩個以上納什均衡)-3,-32,00,20,0退BA進退進獨木橋納什均衡:A進,B退;A退,B進2022/12/1941中南財經(jīng)政法大學信息學院例2——斗雞博弈(存在兩個以上納什均衡)-3,-32,00,美蘇古巴導彈危機冷戰(zhàn)期間美蘇爭霸最嚴重的一次危機。蘇聯(lián):面臨將導彈撤回國還是堅持部署在古巴的選擇;美國:挑起戰(zhàn)爭還是容忍蘇聯(lián)的挑釁行為。結果:蘇聯(lián):將導彈從古巴撤回,做了丟面子的“撤退的雞”,美國:堅持自己的的策略,做了“不退的雞”,但是象征性地從土耳其撤回了一些導彈,給蘇聯(lián)一點面子。獨木橋2022/12/1942中南財經(jīng)政法大學信息學院美蘇古巴導彈危機獨木橋2022/12/1042中南財經(jīng)政法大這就是美國與蘇聯(lián)在古巴導彈上的博弈結果。對于蘇聯(lián)來說,退下來的結果是丟了面子,但總比戰(zhàn)爭要好;對美國而言,既保全了面子,又沒有發(fā)生戰(zhàn)爭。這就是這兩只“大公雞”博弈的結果。2022/12/1943中南財經(jīng)政法大學信息學院這就是美國與蘇聯(lián)在古巴導彈上的博弈結果。對于蘇聯(lián)來說,退下來

在博弈中納什均衡點如果有兩個或兩個以上,結果就難以預料。這對每個博弈方都是麻煩事,因為后果難料,行動也往往進退兩難。左邊還是右邊例如兩個騎自行車的人對面碰頭,很容易互相“向住”:因為不知道對方會不會躲、往哪邊躲,自己也不知該如何反應,于是撞到一起。自行車相撞一般不會造成什么大麻煩,可是如果換成馬車、汽車,就可能出現(xiàn)傷亡。所以,應該有一個強制性的規(guī)定,來告訴人們該怎么做。2022/12/1944中南財經(jīng)政法大學信息學院在博弈中納什均衡點如果有兩個或兩個以上,結果就難交通博弈與交通規(guī)則靠左行靠右行靠左行靠右行1,11,1-1,-1-1,-12022/12/1945中南財經(jīng)政法大學信息學院交通博弈與交通規(guī)則靠左行靠右行靠左行靠右行1,11,1-1,

海上航行也要面臨同樣的問題,盡管大海遼闊,但是航線卻是比較固定的,因此船只交會的機會很多,這些船只屬于不同的國家,如何調節(jié)誰進誰退的問題呢?先來看一個小笑話:一艘軍艦在夜航中,艦長發(fā)現(xiàn)前方航線上出現(xiàn)了燈光。艦長馬上呼叫:“對面船只,右轉30度。”對方回答:“請對面船只左轉30度?!薄拔沂敲绹\娚闲#肄D30度?!薄拔沂羌幽么蠛\姸缺?,請左轉30度?!迸為L生氣了:“聽著,我是‘列克星頓’號戰(zhàn)列艦艦長,這是美國海軍最強大的武裝力量,右轉30度!”“我是燈塔管理員,請左轉30度?!?022/12/1946中南財經(jīng)政法大學信息學院海上航行也要面臨同樣的問題,盡管大海遼誰打電話上面的例子是通過規(guī)定解決了問題,不過,若是遇到電話打到一半突然斷了的事,你該怎么辦?假如你正在和朋友通話,電話斷了,而話還沒說完。這時有兩個選擇,馬上打給對方,或等待對方打來。注意:如果你打過去,他就應該等在電話旁,好把自家電話的線路空出來,如果他也在打給你,你們只能聽到忙音;另一方面,假如你等待對方打電話,而他也在等待,那么你們的聊天就沒有機會繼續(xù)下去。2022/12/1947中南財經(jīng)政法大學信息學院誰打電話2022/12/1047中南財經(jīng)政法大學信息學院

案例——歐共體在空中客車與波音公司的競爭中對空中客車公司的戰(zhàn)略性補貼。歐共體為了打破美國波音公司對全球民航業(yè)的壟斷,曾放棄歐洲傳統(tǒng)的自由競爭精神而對與波音公司進行競爭的空中客車公司進行補貼。2022/12/1948中南財經(jīng)政法大學信息學院2022/12/1048中南財經(jīng)政法大學信息學院

當雙方都未獲得政府的補貼時,兩個公司都開發(fā)新型飛機會因市場飽和而虧損,但若一家公司開發(fā)而另一家公司不開發(fā)時,則開發(fā)的那家公司會獲巨額利潤,見表2。2022/12/1949中南財經(jīng)政法大學信息學院當雙方都未獲得政府的補貼時,兩個公司表2未補貼時的博弈

空中客車開發(fā)不開發(fā)開發(fā)波音不開發(fā)

-10,-10100,00,1000,02022/12/1950中南財經(jīng)政法大學信息學院表2未補貼時的博弈-10,-10100,00,1000

此時有兩個納什均衡,即一家開發(fā)而另一家不開發(fā)。下面,考慮歐共體對空中客車進行補貼20個單位的情況。此時,當兩家都開發(fā)時,空中客車仍然盈利10單位而不是虧損,博弈矩陣見表3。2022/12/1951中南財經(jīng)政法大學信息學院此時有兩個納什均衡,即一家開發(fā)而另一家不開發(fā)。表3有補貼時的博弈

空中客車開發(fā)不開發(fā)開發(fā)波音不開發(fā)

-10,10100,00,1200,02022/12/1952中南財經(jīng)政法大學信息學院表3有補貼時的博弈-10,10100,00,1200,

這時只有一個納什均衡,即波音公司不開發(fā)和空中客車公司開發(fā)的均衡(不開發(fā),開發(fā)),這有利于空中客車。在這里,歐共體對空中客車的補貼就是使空中客車一定要開發(fā)(無論波音是否開發(fā))的威脅變得可置信的一種“承諾行動”。2022/12/1953中南財經(jīng)政法大學信息學院這時只有一個納什均衡,即波音公司不課后練習:1、P1024,52022/12/1954中南財經(jīng)政法大學信息學院課后練習:2022/12/1054中南財經(jīng)政法大學信息學院

完全信息靜態(tài)博弈——納什均衡

設有兩人博弈,每個博弈方都有不同的策略,誰都希望自己出“高招”使自己獲勝(即尋求效用的最大化),但獲勝并不完全依賴于自己的行為能力,還依賴于對手怎么做。2022/12/1955中南財經(jīng)政法大學信息學院完全信息靜態(tài)博弈——納什均衡設有兩人博弈,每個

試想有兩只公雞遇到一起,每只公雞有兩個行動選擇:一是退下來,一是進攻。如果一方退下來,而對方?jīng)]有退下來,對方獲得勝利,這只公雞則很丟面子;如果對方也退下來雙方則打個平手;如果自己沒退下來,而對方退下來,自己則勝利,對方則失敗;如果兩只公雞都前進,那么則兩敗俱傷。因此,對每只公雞來說,最好的結果是,對方退下來,而自己不退,但是此時面臨著兩敗俱傷的結果。經(jīng)典案例三——斗雞博弈2022/12/1956中南財經(jīng)政法大學信息學院試想有兩只公雞遇到一起,每只公雞有兩個行動選擇:一是退下來經(jīng)典案例三——斗雞博弈-3,-32,00,20,0退BA進退進獨木橋對于相當多的博弈,我們無法運用重復剔除劣戰(zhàn)略的方法找出均衡解。顯然為了找出這些博弈的均衡解,需要引入納什均衡。2022/12/1957中南財經(jīng)政法大學信息學院經(jīng)典案例三——斗雞博弈-3,-32,00,20,0退BA進退例1、選課博弈鐘信陳明德語法語德語3,21,1法語0,02,3斗雞博弈:對諸多現(xiàn)象的解釋2022/12/1958中南財經(jīng)政法大學信息學院例1、選課博弈鐘信德語法語德語3,21,1法語例2、性別博弈

Battleofsexes

足球2,10,0-1,-11,2芭蕾足球

芭蕾girlboy2022/12/1959中南財經(jīng)政法大學信息學院例2、性別博弈

Battleofsexes

足球2,10納什均衡____哲學思考

如果一個博弈問題的所有博弈方事前能達成一個“協(xié)議”,并在沒有外部強制的情況下,每個博弈方都有積極性遵守這個“協(xié)議”。那么,這個協(xié)議就是納什均衡。2022/12/1960中南財經(jīng)政法大學信息學院納什均衡____哲學思考如果一個博弈問題的所有博弈假設n個人參與博弈,給定其他博弈方策略的條件下,每個博弈方選擇自己的最優(yōu)策略。納什均衡指的是“由所有博弈方的最優(yōu)策略組成的一個組合”n個人制訂了一個協(xié)議,這n個人是否能自愿遵守?他們會自覺遵守,這個協(xié)議就構成一個納什均衡。如果一個協(xié)議不構成納什均衡,它就不可能自動實施,而需要外力脅迫,這就是無所謂的“協(xié)議”2022/12/1961中南財經(jīng)政法大學信息學院假設n個人參與博弈,給定其他博弈方策略的條件下,每個博弈方選理解納什均衡的重要性:任何“合理”結果都要滿足的條件——當某一博弈方發(fā)現(xiàn)他人單方面改變策略可以獲取更多時,他會毫不猶豫地改變自己的策略,博弈自然就有達到均衡了。思考:一種制度安排要發(fā)生效力,為什么必須是納什均衡。否則,這種制度安排會有效力嗎?2022/12/1962中南財經(jīng)政法大學信息學院理解納什均衡的重要性:任何“合理”結果都要滿足的條件——當某五、納什均衡定義:在博弈G={s1,…,sn;u1,…,un}中,如果各博弈方i的某策略si*與其他博弈方的策略s-i*組成策略組合(si*,s-i*),且任一博弈方i的策略si*都是對其余博弈方策略s-i*的最佳反應。 則稱(si*,s-i*)為該博弈的一個Nash均衡 特別,當且僅當(si*,s-i*)是Nash均衡,且對所有純策略si(si≠si*)有ui(si*,s-i*)>ui(si,s-i*),又稱(si*,s-i*)是嚴格(強)Nash均衡。2022/12/1963中南財經(jīng)政法大學信息學院五、納什均衡定義:在博弈G={s1,…,sn;u1,…,un納什均衡與一致預期納什均衡:所有博弈方的最優(yōu)策略的組合:給定該策略中別人的選擇,沒有人有積極性改變自己的選擇。一致預期:基于信念的選擇是合理的;支持選擇的信念是正確的;預期的自我實現(xiàn):如果所有人認為這個結果會出現(xiàn),這個結果就一定會出現(xiàn)。預期是自我實現(xiàn)的,預期不會錯誤。如果你認為我預期你將選擇X,你就真的會選擇X。2022/12/1964中南財經(jīng)政法大學信息學院納什均衡與一致預期納什均衡:所有博弈方的最優(yōu)策略的組合:給定納什均衡舉例例如——廣告博弈納什均衡:(做廣告,做廣告)企業(yè)1企業(yè)22022/12/1965中南財經(jīng)政法大學信息學院納什均衡舉例例如——廣告博弈企業(yè)1企業(yè)22022/12/10經(jīng)典案例三——斗雞博弈-3,-32,00,20,0退BA進退進獨木橋納什均衡:A進,B退;A退,B進納什均衡可以幫我們找出這些博弈的均衡解,2022/12/1966中南財經(jīng)政法大學信息學院經(jīng)典案例三——斗雞博弈-3,-32,00,20,0退BA進退例如——性別博弈小莉大海足球芭蕾足球(2,1)(0,0)芭蕾(-1,-1)(1,2)納什均衡的含義就是:給定你的策略,我的策略是最好的策略;給定我的策略,你的策略也是你的最好的策略。即雙方在給定的策略下不愿意調整自己的策略。請同學分析:2022/12/1967中南財經(jīng)政法大學信息學院例如——性別博弈小莉足球芭蕾足球(2,1)(一)Nash均衡的基本求解法1、劃線法基本思想——博弈方先找出自己針對其他博弈方每種策略或策略組合的最佳對策,即自己的可選策略中與其他博弈方的策略或策略組合配合,給自己帶來最大得益的策略,然后在此基礎上,通過對其他博弈方策略選擇的判斷,包括對其他博弈方對自己策略判斷的判斷等,預測博弈的可能結果和確定自己的最優(yōu)策略。2022/12/1968中南財經(jīng)政法大學信息學院(一)Nash均衡的基本求解法1、劃線法2022/12/10具體方法——對其他博弈方的任一策略組合,找出博弈方i的最佳策略,并在其得益值下劃一小橫線;若存在一個這樣的策略組合,所有博弈方的得益值下都劃了線,則該組策略組合就是該博弈的一個納什均衡。2022/12/1969中南財經(jīng)政法大學信息學院具體方法——對其他博弈方的任一策略組合,找出博弈方i的最佳策例1、性別博弈小莉大海足球芭蕾足球(2,1)(0,0)芭蕾(-1,-1)(1,2)分析:如果大海選足球,小莉的“相對優(yōu)勢策略”也是足球,這比她選芭蕾好,這是在小莉的盈利值1下劃線。2022/12/1970中南財經(jīng)政法大學信息學院例1、性別博弈小莉足球芭蕾足球(2,

如果大海選芭蕾,小莉的“相對優(yōu)勢策略”也一定是芭蕾,這時將右下方格中盈利值2下劃線。如果小莉選足球,大海的“相對優(yōu)勢策略”是足球,這時,在大海的盈利矩陣左上格中盈利值2下劃線。 如果小莉選芭蕾,大海的“相對優(yōu)勢策略”也是芭蕾,因而在右下格其盈利值2下劃線。當雙方的相對優(yōu)勢策略確定后,哪個格子里面兩個數(shù)字都被被劃線,那么這個格中所對應的相對優(yōu)勢策略組合就是一個納什均衡。2022/12/1971中南財經(jīng)政法大學信息學院 如果大海選芭蕾,小莉的“相對優(yōu)勢策略”也一定是芭蕾,這時將例2、囚徒困境博弈

招不招招甲不招(問題1:甲、乙如何選擇?)

-8,-80,-15-15,0-1,-12022/12/1972中南財經(jīng)政法大學信息學院例2、囚徒困境博弈-8,-80,-15-15,0-1,-12例3—“智豬博弈”(boxedpigs)有些博弈沒有占優(yōu)均衡,但通過剔除“劣”策略,我們可以預測博弈的結果;還可以通過“納什均衡”預測博弈的結果。如“智豬博弈”按等待按等待5,14,49,-10,0這個博弈中,大豬的最優(yōu)選擇依賴于小豬的選擇,但小豬的最優(yōu)選擇與大豬的選擇無關。如果大豬知道小豬的理性的,大豬將選擇“按”。均衡是“大豬按,小豬等待”。“劣”策略:無論對方選擇什么,如果自己選擇A得到的總是收益小于選擇B得到的收益,A就是相對于B的劣策略。2022/12/1973中南財經(jīng)政法大學信息學院例3—“智豬博弈”(boxedpigs)有些博弈沒有占優(yōu)均例4:博弈G如右圖:1,01,30,10,40,20,0博弈方Ⅱ左中右解:該博弈的納什均衡為(中,上)。

2022/12/1974中南財經(jīng)政法大學信息學院例4:博弈G如右圖:1,01,30,10,4例5:博弈G如下圖:2,81,61,80,80,60,80,81,50,9博弈方ⅡLMR解:該博弈有兩個納什均衡(U,L)和(U,R)。2022/12/1975中南財經(jīng)政法大學信息學院例5:博弈G如下圖:2,81,61,80,8例6、軍備競賽蘇美擴軍裁軍擴軍(-3000,-3000)(10000,-∞)裁軍(-∞,10000)(0,0)結論,這個博弈存在一個Nash均衡(擴軍,擴軍)2022/12/1976中南財經(jīng)政法大學信息學院例6、軍備競賽蘇擴軍裁軍擴軍(-3000,-軍備考慮為擴軍、有限軍備、不設防,那么G為:

BA擴軍有限裁軍擴軍(-2000,-2000)(-1600,-1500)(8000,-∞)有限(-1500,-1600)(-500,-500)(9500,-∞)裁軍(-∞,8000)(-∞,9500)(0,0)據(jù)劃線法求得Nash均衡為雙方采用有限軍備策略。注意①對每一方,有限軍備都是全局優(yōu)勢策略,擴軍和不設防都是全局劣勢策略。 ②此問題也可用重復剔除的占優(yōu)均衡求得博弈問題的解為(有限軍備,有限軍備)。2022/12/1977中南財經(jīng)政法大學信息學院軍備考慮為擴軍、有限軍備、不設防,那么G為:例7:尋找納什均衡C1C2C3R1R2R3100,1000,050,10150,01,160,00,3000,0200,2002022/12/1978中南財經(jīng)政法大學信息學院例7:尋找納什均衡C1C2C3R1R2R3100,1000,納什均衡(NashEquilibrium)的理解?納什均衡-是一種“僵局”,給定別人不改變策略的情況下,沒有人有興趣改變。?囚徒困境是西方經(jīng)濟學中個人理性與集體理性沖突的一個例證。2022/12/1979中南財經(jīng)政法大學信息學院納什均衡(NashEquilibrium)的理解2022/基本思路——對博弈中的每個策略組合進行分析,考察在每個策略組合處各個博弈方能否通過單獨改變自己的策略而增加盈利,如能,則從所分析的策略組合對應的盈利數(shù)組引一箭頭,到改變策略后策略組合對應的盈利數(shù)組,最后綜合對每個策略組合的分析情況,只有指向、無指離的策略組合形成對博弈的結果。2、箭頭法2022/12/1980中南財經(jīng)政法大學信息學院基本思路——對博弈中的每個策略組合進行分析,考察在每個策略組具體方法——考察在每個策略組合處各個博弈方能否通過單獨改變自己的策略而增加得益。如能,則從所分析的策略組合對應的得益數(shù)組引一箭頭,到改變策略后策略組合對應的得益數(shù)組。若存在一策略組合,其得益數(shù)組只有進來的箭頭而沒有出去的箭頭,則該策略組合就是納什均衡。2022/12/1981中南財經(jīng)政法大學信息學院具體方法——考察在每個策略組合處各個博弈方能否通過單獨改變自例1:博弈G如右博弈方Ⅱ左中右0,41,00,00,20,11,3納什均衡為(上,中)2022/12/1982中南財經(jīng)政法大學信息學院例1:博弈G如右博弈方Ⅱ左例2、囚徒困境乙甲坦白抵賴坦白(-8,-8)(0,-15)抵賴(-15,0)(-1,-1)因此,策略組合(坦白,坦白)就是唯一具有穩(wěn)定性的結果。2022/12/1983中南財經(jīng)政法大學信息學院例2、囚徒困境乙坦白抵賴坦白(-8,-8斗雞B進攻退卻-3,-32,00,20,0經(jīng)典案例3——斗雞博弈

(進,退)和(退,進)是兩個納什均衡。2022/12/1984中南財經(jīng)政法大學信息學院斗雞B-3,-32,00,20,0經(jīng)典案例3例4、性別博弈小莉大海足球芭蕾足球(2,1)(0,0)芭蕾(-1,-1)(1,2)2022/12/1985中南財經(jīng)政法大學信息學院例4、性別博弈小莉足球芭蕾足球(2,1)((二)納什均衡與重復剔除的占優(yōu)均衡

占優(yōu)均衡肯定是納什均衡,但反過來納什均衡不一定是占優(yōu)均衡,因此占優(yōu)均衡是比納什均衡更強、穩(wěn)定性更高的均衡概念。只是,占優(yōu)均衡在博弈問題中的普遍性比納什均衡要差得多。

重復剔除的占有均衡和納什均衡之間的關系要復雜一些,關鍵是這兩者之間是否存在相容性,即嚴格劣策略反復消去法是否會消去納什均衡,對于納什均衡和重復剔出的占優(yōu)均衡的關系,下面的兩個命題基本上給出了我們所希望的答案。2022/12/1986中南財經(jīng)政法大學信息學院(二)納什均衡與重復剔除的占優(yōu)均衡占優(yōu)均衡肯定是納什Nash均衡的特質1)一致預測性 “一致”——各博弈方的實際行為選擇與他們的預測一致。2)與重復剔出的占優(yōu)均衡的關系若G={s1,…,sn;u1,…,un},通過嚴格劣策反復消去法排除了除(s1*,…,sn*)之外的所有策略組合,那么(s1*,…,sn*)一定是該博弈唯一的Nash均衡。若G={s1,…,sn;u1,…,un},如果(s1*,…,s2*)是G的一個Nash均衡,那么嚴格劣策反復消去法一定不會將它剔除。2022/12/1987中南財經(jīng)政法大學信息學院Nash均衡的特質1)一致預測性2022/12/1033中南納什均衡構成納什均衡的策略一定是重復剔除嚴格劣策略過程中不會被剔除的策略。許多不存在占優(yōu)策略均衡或重復剔除的占優(yōu)均衡的博弈卻存在納什均衡。小結與思考:三種均衡的概念:占優(yōu)均衡——重復剔除的占優(yōu)均衡——納什均衡三種均衡是什么關系2022/12/1988中南財經(jīng)政法大學信息學院納什均衡2022/12/1034中南財經(jīng)政法大學信息學院納什均衡納什均衡與其他概念的關系每一個占優(yōu)策略均衡、重復剔除的占優(yōu)均衡一定是納什均衡,但并非每一個納什均衡都是占優(yōu)戰(zhàn)略均衡或者重復剔除的占優(yōu)均衡。納什均衡一定是在重復剔除嚴格劣策略過程中沒有被剔除掉的策略組合;但沒有被剔除的策略組合不一定是納什均衡,除非它是唯一的。注意:弱劣策略剔除可能剔除掉納什均衡2022/12/1989中南財經(jīng)政法大學信息學院納什均衡2022/12/1035中南財經(jīng)政法大學信息學院不同均衡概念的關系:占優(yōu)均衡DSE重復剔除占優(yōu)均衡IEDE純策略納什均衡PNE2022/12/1990中南財經(jīng)政法大學信息學院不同均衡概念的關系:占優(yōu)均衡重復剔除占優(yōu)均衡純策略納什均衡2占優(yōu)均衡重復剔除的占優(yōu)均衡納什均衡完全信息靜態(tài)博弈均衡解的思考進程2022/12/1991中南財經(jīng)政法大學信息學院占優(yōu)均衡重復剔除的占優(yōu)均衡納什均衡完全信息靜態(tài)博弈均衡解的思

那么什么是博弈論的均衡呢?所謂博弈均衡,它是一穩(wěn)定的博弈結果。均衡是博弈的一結果,但不是說博弈的結果都能成為均衡。博弈的均衡是穩(wěn)定的,因而是可以預測的。納什均衡是一最常見的均衡。它的含義是:在對方策略確定的情況下,每個參與者的策略都是最好的,此時沒有人愿意先改變自己的策略。

納什均衡是博弈論中的重要概念,同時也是經(jīng)濟學的重要概念。2022/12/1992中南財經(jīng)政法大學信息學院那么什么是博弈論的均衡呢?所謂博弈均衡,它是一穩(wěn)定的博弈納什均衡的缺點(1)納什均衡不唯一。在不唯一的情況下,哪一個才是最可能出現(xiàn)的呢?(允許了不可置信的威脅的存在)

(2)沒有納什均衡存在又如何分析?2022/12/1993中南財經(jīng)政法大學信息學院納什均衡的缺點2022/12/1039中南財經(jīng)政法大學例1——監(jiān)督博弈(不存在納什均衡)監(jiān)督不監(jiān)督偷懶不偷懶1,-1-1,2-2,32,2給定工人偷懶,老板的最優(yōu)選擇是監(jiān)督;給定老板監(jiān)督,工人的最優(yōu)選擇是不偷懶;給定工人不偷懶,老板的最優(yōu)選擇是不監(jiān)督;給定老板不監(jiān)督,工人的最優(yōu)選擇是偷懶;形成如此循環(huán)。2022/12/1994中南財經(jīng)政法大學信息學院例1——監(jiān)督博弈(不存在納什均衡)監(jiān)督不監(jiān)督偷懶不偷懶1,-例2——斗雞博弈(存在兩個以上納什均衡)-3,-32,00,20,0退BA進退進獨木橋納什均衡:A進,B退;A退,B進2022/12/1995中南財經(jīng)政法大學信息學院例2——斗雞博弈(存在兩個以上納什均衡)-3,-32,00,美蘇古巴導彈危機冷戰(zhàn)期間美蘇爭霸最嚴重的一次危機。蘇聯(lián):面臨將導彈撤回國還是堅持部署在古巴的選擇;美國:挑起戰(zhàn)爭還是容忍蘇聯(lián)的挑釁行為。結果:蘇聯(lián):將導彈從古巴撤回,做了丟面子的“撤退的雞”,美國:堅持自己的的策略,做了“不退的雞”,但是象征性地從土耳其撤回了一些導彈,給蘇聯(lián)一點面子。獨木橋2022/12/1996中南財經(jīng)政法大學信息學院美蘇古巴導彈危機獨木橋2022/12/1042中南財經(jīng)政法大這就是美國與蘇聯(lián)在古巴導彈上的博弈結果。對于蘇聯(lián)來說,退下來的結果是丟了面子,但總比戰(zhàn)爭要好;對美國而言,既保全了面子,又沒有發(fā)生戰(zhàn)爭。這就是這兩只“大公雞”博弈的結果。2022/12/1997中南財經(jīng)政法大學信息學院這就是美國與蘇聯(lián)在古巴導彈上的博弈結果。對于蘇聯(lián)來說,退下來

在博弈中納什均衡點如果有兩個或兩個以上,結果就難以預料。這對每個博弈方都是麻煩事,因為后果難料,行動也往往進退兩難。左邊還是右邊例如兩個騎自行車的人對面碰頭,很容易互相“向住”:因為不知道對方會不會躲、往哪邊躲,自己也不知該如何反應,于是撞到一起。自行車相撞一般不會造成什么大麻煩,可是如果

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內容里面會有圖紙預覽,若沒有圖紙預覽就沒有圖紙。
  • 4. 未經(jīng)權益所有人同意不得將文件中的內容挪作商業(yè)或盈利用途。
  • 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內容的表現(xiàn)方式做保護處理,對用戶上傳分享的文檔內容本身不做任何修改或編輯,并不能對任何下載內容負責。
  • 6. 下載文件中如有侵權或不適當內容,請與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

最新文檔

評論

0/150

提交評論