




版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進行舉報或認領(lǐng)
文檔簡介
博弈論專題一、基本概念1、參與人;2、行動;3、信息;4、戰(zhàn)略;5、支付函數(shù)6、結(jié)果;7、均衡;二、分類1、靜態(tài)博弈:參與人同時參與選擇行動。2、動態(tài)博弈:參與人的行動有先后順序,且后行動者能夠觀察到先行動者所選擇的行動。3、完全信息:每一個參與人對所有其他參與人(對手)的特征、戰(zhàn)略空間及支付函數(shù)有準確的知識。4、不完全信息:每一個參與人對所有其他參與人(對手)的特征、戰(zhàn)略空間及支付函數(shù)沒有準確的知識。博弈論專題一、基本概念1
行動順序信息靜態(tài)動態(tài)完全信息完全信息靜態(tài)博弈(納什均衡)、納什完全信息動態(tài)博弈(子博弈精煉納什均衡)、澤爾騰不完全信息不完全信息靜態(tài)博弈(貝葉斯納什均衡)、海薩尼不完全信息動態(tài)博弈(精煉貝葉斯納什均衡)、澤爾騰博弈的分類及對應(yīng)的均衡概念行動順序靜態(tài)動態(tài)完全信息完全信息靜態(tài)博弈(納2所謂博弈均衡指博弈中所有參與者都不想改變自己的策略的這樣一種狀態(tài)。沙灘買冰淇淋的兩商販博弈均衡納什均衡:1、如果A的選擇是給定的,則B的選擇是最優(yōu)的;如果B的選擇是給定的,則A的選擇是最優(yōu)的;這樣策略組合的均衡為納什均衡;2、它是這樣一種戰(zhàn)略組合,這種戰(zhàn)略組合由所有參與人的最優(yōu)戰(zhàn)略組成,即給定別人戰(zhàn)略的情況下,沒有任何單個參與人有積極性選擇其他戰(zhàn)略,從而沒有任何人有積極性打破這種均衡,即僵局。所謂博弈均衡指博弈中所有參與者都不想改變自己的策略的這樣一種310,106,1212,68,8合作不合作不合作合作甲乙占優(yōu)策略均衡占優(yōu)策略均衡:由博弈中的所有參與者的占優(yōu)策略組合所構(gòu)成的就是占優(yōu)策略均衡。10,106,1212,68,8合作不合作不合作合作甲乙占優(yōu)4(一)、納什均衡經(jīng)典例子:1、囚徒困境:-8,-80,-10-10,0-1,-1坦白抵賴抵賴坦白囚徒A囚徒B-8,-80,-10-10,0-1,-1降價不降價不降價降價廠商A廠商B廠商價格策略均衡(一)、納什均衡-8,-80,-10-10,0-1,-1坦白5-8,-80,-10-10,0-1,-1競賽不競賽不競賽競賽國家A國家B國家軍備競賽策略均衡-8,-80,-10-10,0-1,-1吵架不吵架不吵架吵架丈夫妻子夫妻競賽策略均衡-8,-80,-10-10,0-1,-1競賽不競賽不競賽競賽62、智豬博弈:5,14,49,-10,0按等待等待按大豬小豬5,14,49,-10,0搜集等待等待搜集大股東小股東2、智豬博弈:5,14,49,-10,0按等待等待按大豬小豬75,14,49,-10,0研發(fā)等待等待研發(fā)大企業(yè)小企業(yè)5,14,49,-10,0研發(fā)等待等待研發(fā)大企業(yè)小企業(yè)82,10,00,01,2足球芭蕾芭蕾足球男女3、性別戰(zhàn):先動優(yōu)勢:若男的買票,兩人就會出現(xiàn)在足球場;若女的買票,兩人就會出現(xiàn)在芭蕾舞廳;2,10,00,01,2足球芭蕾芭蕾足球男女3、性別戰(zhàn):先動9-3,-32,00,20,0進退退進AB4、斗雞博弈:-3,-32,00,20,0吵躲躲吵丈夫妻子夫妻博弈:-3,-32,00,20,0進退退進AB4、斗雞博弈:-3,1040,50-10,00,3000,300默許斗爭不進入進入進入者在位者5、市場進入阻撓40,50-10,00,3000,300默許斗爭不進入進入進110,44,05,34,00,45,33,53,56,6.尋找納什均衡:0,44,05,34,00,45,33,53,56,6.尋找122,30,23,41,12,7.4,54,3.5,16,22,18,43,63,09,62,8重復(fù)優(yōu)勢解法:逐次刪去劣勢策略。2,30,23,41,12,7.4,54,3.5,16,2213(二)、完全信息動態(tài)博弈:子博弈精煉納什均衡1、納什均衡存在的問題:(1)一個博弈可能有不止一個納什均衡,哪一個會發(fā)生并不知道;(2)靜態(tài)博弈時,不考慮自己的策略對對手的影響,動態(tài)博弈中必須進行考慮。(3)納什均衡允許了不可置信威脅的存在。在市場進入的例子中,如果在位者擺出一幅“你進入我就斗爭”的架式,(不進入,斗爭)便成為一個納什均衡。40,50-10,00,3000,300默許斗爭不進入進入進入者在位者(二)、完全信息動態(tài)博弈:子博弈精煉納什均衡40,50-10142、澤爾騰的貢獻(1)針對靜態(tài)納什均衡的問題,澤爾騰對動態(tài)博弈進行了分析,定義了子博弈精煉納什均衡。將納什均衡中不可置信威脅戰(zhàn)略剔除出去,使均衡戰(zhàn)略不再包含不可置信的威脅。它要求參與人的決策在任何時點上都是最優(yōu)的。決策者要“應(yīng)變”,而不是“固守”。(2)擴展性博弈形式的5個要素:參與人;每個參與人選擇行動的時點;每個參與人在每次行動時可供選擇的行動集合;每個參與人在每次行動時有關(guān)對手過去行動選擇的信息;支付函數(shù)。博弈樹——是擴展型的一種形象化表述?!白硬┺摹边M入者合作不進入在位者斗爭(40,50)(-10,0)(0,300)進入市場進入阻撓博弈樹2、澤爾騰的貢獻進入者合作不進入在位者斗爭(40,50)(-15(3)、概念:一個納什均衡稱為精煉納什均衡,當(dāng)且只當(dāng)參與人的戰(zhàn)略在每一個子博弈中都構(gòu)成納什均衡,即組成精煉納什均衡的戰(zhàn)略必須在每一個博弈中都是最優(yōu)的。因此,(進入,斗爭)不是一個精煉納什均衡,而(進入,合作)是惟一的子博弈精煉納什均衡。*“不可置信——承諾行動”的例子:談戀愛;破釜沉舟;紅軍、白軍搶占小島,炸橋斷后路;(3)、概念:一個納什均衡稱為精煉納什均衡,當(dāng)且只當(dāng)參與人的1680,80.70,5960,9059,70努力不努力不嚴嚴老師學(xué)生承諾行動:嚴?。?!80,80.70,5960,9059,70努力不努力不嚴嚴老17(三)不完全信息靜態(tài)博弈:貝葉斯納什均衡市場進入的例子——進入者知道在位者的偏好、戰(zhàn)略空間及各種戰(zhàn)略組合下的利潤水平。如果進入者實際上并不完全了解在位者的生產(chǎn)函數(shù)、成本函數(shù)及偏好,這就是不完全信息博弈。設(shè)想在位者成本函數(shù)有兩種可能的情況,對應(yīng)于這兩種情況的支付矩陣分別如表一和表二:解釋:在給定進入者選擇進入的情況下,高成本在位者的最優(yōu)戰(zhàn)略是默許,而低成本在位者的最有戰(zhàn)略是斗爭。低成本情況下斗爭之所以比默許優(yōu),可能是由于在位者的生產(chǎn)成本是如此低,從而他在非常低的價格下獲得的壟斷利潤也高于相對高的價格下分享到的寡頭利潤;也可能在位者有一種好斗的天性,他更樂于與進入者斗爭而不是合作。(三)不完全信息靜態(tài)博弈:貝葉斯納什均衡1840,50-10,00,3000,300默許斗爭不進入進入進入者在位者表一:市場進入:高成本情況30,100-10,1400,4000,400默許斗爭不進入進入進入者在位者表一:市場進入:低成本情況40,50-10,00,3000,300默許斗爭不進入進入進19在1967年以前,遇到這種不知對手的選擇情況,自己的戰(zhàn)略自然無法選擇,因此相應(yīng)的問題無法解決。海薩尼的貢獻在于引進了一個虛擬的參與人—“自然”,使得上述情況可以分析。自然首先行動——選擇參與人的類型,被選擇的參與人知道自己的真是類型,而其他參與人并不清楚這個被選擇的參與人的真是類型,僅知道各種可能類型的概率分布。另外,被選擇的參與人也知道其他參與人心目中的這個分布函數(shù),即分布函數(shù)是一種共同知識(commonknowledge)。在1967年以前,遇到這種不知對手的選擇情況,自己的戰(zhàn)略自然20在市場進入的這個例子中,“自然”首先選擇在位者的類型——高成本還是低成本;在位者本人知道自己究竟是高成本還是低成本,而進入者僅知道在位者或者高成本,或者是低成本,并且,知道高成本和低成本的可能性各為多少。海薩尼把“不完全信息博弈”轉(zhuǎn)換成“完全但不完美信息博弈”。貝葉斯是一位概率統(tǒng)計學(xué)家,貝葉斯均衡是納什均衡在不完全信息博弈中的自然擴展。在市場進入的這個例子中,“自然”首先選擇在位者的類型——高21貝葉斯納什均衡是這樣一種類型戰(zhàn)略組合——給定自己的類型和別人類型的概率分布的情況下,每個參與人的期望效用達到了最大化,也就是說,沒有人有積極性選擇其他戰(zhàn)略。以市場進入為例:進入者知道高成本的可能性為x,低成本的可能性為(1-x)。那么,進入者選擇進入得到的期望利潤為40x+(-10)(1-x);選擇不進入的期望利潤為零。當(dāng)x>0.20時,進入得到的期望利潤才大于不進入時的期望利潤,從而,進入才是最優(yōu)的。即x大于0.20,那么,貝葉斯納什均衡是——進入者選擇進入,高成本在位者選擇默許,低成本在位者選擇斗爭。40,50-10,00,3000,300默許斗爭不進入進入進入者在位者高成本30,100-10,1400,4000,400默許斗爭不進入進入進入者在位者低成本貝葉斯納什均衡是這樣一種類型戰(zhàn)略組合——給定自己的類型和別人22100,100-50,00,00,0接受不接受不求愛求愛求愛者你表一:求愛博弈:品德優(yōu)良者求愛100,-100-50,00,00,0接受不接受不求愛求愛求愛者你表二:求愛博弈:品德惡劣者求愛假設(shè)你認為求愛者品德優(yōu)良的概率為x。求愛者也知道這個x為多少。則他求愛你接受時你的期望效用為100x+(-100)(1-x);你不接受時你的期望效用為零。當(dāng)x>1/2時,你接受才是最優(yōu)選擇。如果x確實小于1/2,貝葉斯納什均衡是——求愛者不求愛,你不接受。原因在于他知道他求愛會被你拒絕,這種損臉面(-50)的事是不值得干的。100,100-50,00,00,0接受不接受不求愛求愛求愛23(四)不完全信息動態(tài)博弈:精煉貝葉斯均衡精煉貝葉斯均衡的要點在于當(dāng)事人要根據(jù)所觀察到的他人的行為來修正自己有關(guān)后者類型的“信念”(主觀概率),并由此來選擇自己的行動。精煉貝葉斯均衡是所有參與人戰(zhàn)略和信念的一種結(jié)合,它滿足如下條件:(1)給定每個人有關(guān)其他人類型的信念的情況下,他的戰(zhàn)略選擇是最優(yōu)的;(2)每個人有關(guān)他人類型的信念都是使用貝葉斯法則從所觀察到的行為中獲得的。1、張三與你(恃強欺弱、早餐——辣椒)2、黔驢技窮(四)不完全信息動態(tài)博弈:精煉貝葉斯均衡24(五)純策略、混合策略及混合策略的均衡純策略:每個行為人只作出一個選擇并始終堅持這個選擇,這種策略叫做純策略;混合策略:允許行為人使他們的策略隨機化——對每項選擇都制定一個概率,按照這些概率作出他們的選擇;混合策略的均衡:每個行為人都選定了最優(yōu)頻率,并在另一個行為人的頻率選擇給定的情況下按照這個最優(yōu)頻率采取他的策略;計算題(五)純策略、混合策略及混合策略的均衡25計算題:求出下圖中得益矩陣所表示的博弈中的混合策略納什均衡?2,10,21,23,0LRBT博弈方1博弈方2解:設(shè)博弈方1采用T策略的概率為p,則采用B策略的概率為(1-p);再設(shè)博弈方2采用策略L的概率為q,那么采用策略R的概率是(1-q)。根據(jù)上述概率分別計算兩個博弈方采用各自兩個純策略的期望得益,并令它們相等:因此,納什均衡為博弈方1以概率分布2/3和1/3在T和B中隨機選擇;博弈方2以概率分布3/4和1/4在L和R中隨機選擇。計算題:求出下圖中得益矩陣所表示的博弈中的混合策略納什均衡?26兩寡頭古諾模型,,P為市場出清價格,兩個廠商的邊際成本不同,分別為。如果,問納什均衡產(chǎn)量各為多少?如果,則納什均衡產(chǎn)量又各為多少?兩寡頭古諾模型,27解:兩個廠商的利潤函數(shù)為:將利潤函數(shù)對產(chǎn)量求導(dǎo)并令其等于0得:解得兩個廠商的反應(yīng)函數(shù)為:具體寫成:解:兩個廠商的利潤函數(shù)為:將利潤函數(shù)對產(chǎn)量求導(dǎo)并令其等于0得28當(dāng)時,根據(jù)上述兩個廠商的反應(yīng)函數(shù),直接求出兩個廠商的納什均衡產(chǎn)量分別為:q1,q2都大于0;當(dāng)時,根據(jù)反應(yīng)函數(shù)求出來的廠商2產(chǎn)量。這意味著廠商2不會生產(chǎn),這是廠商1成了壟斷廠商,廠商1的最優(yōu)產(chǎn)量選擇是利潤最大化的壟斷產(chǎn)量:因此這種情況下的納什均衡為當(dāng)時,根據(jù)上述兩個廠商的反應(yīng)29課后第一題:解:課后第一題:300,0-1,11,-11,-10,0-1,1-1,11,-10,0剪刀剪刀石頭石
溫馨提示
- 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
- 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
- 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
- 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負責(zé)。
- 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請與我們聯(lián)系,我們立即糾正。
- 7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔(dān)用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。
最新文檔
- 品牌西服采購合同范本
- 合租倉庫協(xié)議合同范本
- 二十四節(jié)氣文化內(nèi)涵與漢字文創(chuàng)衍生品的融合創(chuàng)新設(shè)計
- 2025至2030年中國純銅浴缸扶手數(shù)據(jù)監(jiān)測研究報告
- 公司總監(jiān)合同范例
- 合同標題寫著合同范本
- 買賣合同范本房子
- 商家推廣合作合同范例
- 2025至2031年中國PU十字編鞋材行業(yè)投資前景及策略咨詢研究報告
- 合伙吊車合同范例
- 2022年高考(全國甲卷)語文仿真模擬卷【含答案】
- 腸瘺治療PPT醫(yī)學(xué)課件(PPT 25頁)
- 員工轉(zhuǎn)正評價表
- 道路交通事故責(zé)任認定行政復(fù)議申請書范例
- 鄭州大學(xué)圖書館平立剖面效果圖
- 高效液相含量測定計算公式
- 公安機關(guān)通用告知書模板
- 《小學(xué)數(shù)學(xué)課程與教學(xué)》教學(xué)大綱
- 《手機攝影》全套課件(完整版)
- 礦井無計劃停電停風(fēng)安全技術(shù)措施
- 標前合作合同協(xié)議書范本
評論
0/150
提交評論