博弈論與信息經(jīng)濟學(xué)講義09-3.ppt_第1頁
博弈論與信息經(jīng)濟學(xué)講義09-3.ppt_第2頁
博弈論與信息經(jīng)濟學(xué)講義09-3.ppt_第3頁
博弈論與信息經(jīng)濟學(xué)講義09-3.ppt_第4頁
博弈論與信息經(jīng)濟學(xué)講義09-3.ppt_第5頁
已閱讀5頁,還剩49頁未讀, 繼續(xù)免費閱讀

下載本文檔

版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進行舉報或認領(lǐng)

文檔簡介

1、博弈論與信息經(jīng)濟學(xué),中國科學(xué)院研究生院管理學(xué)院,張玲玲,第1章概述-生活中的處處博弈第1章非合作博弈第2章完全信息靜態(tài)信息博弈-納什均衡第3章完全信息動態(tài)博弈-子博弈精煉納什均衡第4章不完全信息靜態(tài)博弈-貝葉斯納什均衡第5章不完全信息動態(tài)博弈-精煉貝葉斯納什均衡第6章信息經(jīng)濟學(xué)的委托代理理論(一)第7章委托代理理論(二)第8章逆向選擇與信號傳遞, 主要內(nèi)容簡介,第二章完全信息靜態(tài)信息博弈納什均衡,一個博弈的基本概念和戰(zhàn)略表達,兩個顯性戰(zhàn)略均衡,三個重復(fù)淘汰的顯性均衡,四個納什均衡和五個納什均衡應(yīng)用實例,案例1囚徒困境,囚徒困境,坦白,否認,坦白,否認,顯性戰(zhàn)略均衡。 囚徒困境是對一些非常常見和

2、有趣的情況的抽象。在這些情況下,從個人角度來看,背叛是最好的選擇,但雙方的背叛都會導(dǎo)致不理想的結(jié)果。第二,主導(dǎo)戰(zhàn)略是平衡的,第二次世界大戰(zhàn)的勝利在望。然而,為了給自己爭光,一個飛行大隊的指揮官無休止地發(fā)布任務(wù)配額來提高他的下屬,這讓每個人都感到恐慌。轟炸機塞里安不想成為勝利前夕的最后一名受害者,他想盡一切辦法逃避任務(wù)。他的上級問:“如果我的士兵都像你一樣思考,我們怎么打這場仗?”但特別是塞里安回答說:“如果我不這樣想,我會不會變成一個大傻瓜?”第二,主導(dǎo)戰(zhàn)略均衡,注:如果每個人都有一個(嚴格的)主導(dǎo)戰(zhàn)略,那么主導(dǎo)戰(zhàn)略均衡是唯一可以預(yù)測的均衡。主導(dǎo)策略只要求每個參與者都是理性的,而不要求每個參與

3、者都知道其他參與者是理性的(也就是說,理性不要求是常識)。為什么?第二章,完全信息靜態(tài)信息博弈納什均衡,一個博弈的基本概念和策略表達,兩個顯性戰(zhàn)略均衡,三個重復(fù)淘汰的顯性均衡,四個重復(fù)淘汰的納什均衡,三個重復(fù)淘汰的顯性均衡,以及重復(fù)淘汰的嚴格劣策略:思路:首先找到一個玩家的劣策略(假設(shè)它存在),淘汰這個劣策略,重構(gòu)一個沒有淘汰策略的新博弈,然后淘汰這個新博弈中的一個。唯一剩下的戰(zhàn)略組合是這一博弈的均衡解,稱為“重復(fù)淘汰的主導(dǎo)均衡”。三個重復(fù)排除的優(yōu)勢均衡,等待,小豬,大豬,按,等待,按,案例2-智能豬的游戲,“按”是大豬的優(yōu)勢策略,納什均衡:大豬按,小豬按,三個重復(fù)排除的優(yōu)勢均衡,M,列老師,

4、行老師,U。行:L優(yōu)于列D:沒有優(yōu)勢策略消除D,M優(yōu)于L,(U,M)是重復(fù)消除的優(yōu)勢均衡,以及三個重復(fù)消除的優(yōu)勢均衡。俾斯麥海戰(zhàn)役于1943年發(fā)生在南太平洋,日本海軍上將木村奉命將日本軍隊運送到新幾內(nèi)亞,在此期間他不得不穿越俾斯麥海。美國海軍上將肯尼想要轟炸日本運輸船。通過俾斯麥海到新幾內(nèi)亞有兩條路線。木村必須從中選擇一個,而肯尼必須決定把他的飛機送到哪里去搜尋日本人。如果肯尼把他的飛機送錯了路線,他可以召回它們,但是轟炸的可用天數(shù)將會減少。木村,肯尼,北,南,北,南,第二章完全信息靜態(tài)信息博弈納什均衡,基本概念和戰(zhàn)略描述一局兩優(yōu)戰(zhàn)略均衡三優(yōu)均衡重復(fù)淘汰四納什均衡五納什均衡應(yīng)用實例,四納什均衡

5、,通俗地說,納什均衡的意思是:給定你的戰(zhàn)略,我的戰(zhàn)略就是最好的戰(zhàn)略;根據(jù)我的策略,你的策略也是你最好的策略。也就是說,雙方都不愿意在給定的策略下調(diào)整自己的策略。四、納什均衡、美蘇導(dǎo)彈危機和古巴冷戰(zhàn)時期最嚴重的美蘇霸權(quán)危機。蘇聯(lián):面臨撤回導(dǎo)彈或堅持在古巴部署導(dǎo)彈的選擇;美國:挑起戰(zhàn)爭或容忍蘇聯(lián)的挑釁行為。結(jié)果:蘇聯(lián)從古巴撤出導(dǎo)彈,成為“撤退的雞”,而美國堅持自己的戰(zhàn)略,成為“不撤退的雞”,但象征性地從土耳其撤出一些導(dǎo)彈,給了蘇聯(lián)一點面子。杜牧橋,四個納什均衡,尋找納什均衡,C2,R1,R2,C1,C3,R3,玩家B,玩家A,(R3,C3)是納什均衡,不同均衡概念之間的關(guān)系,顯性均衡DSE,重復(fù)消

6、除顯性均衡IEDE,純戰(zhàn)略納什均衡PNE,四個納什均衡,第二章完全信息基本概念和戰(zhàn)略表達一局兩個顯性戰(zhàn)略均衡三個重復(fù)拒絕顯性均衡四個納什均衡五個混合戰(zhàn)略納什均衡的存在及相關(guān)討論,五個混合戰(zhàn)略納什均衡,社會福利博弈, 流浪,無家可歸,政府,救濟,沒有救濟,找工作,沒有一個戰(zhàn)略組合構(gòu)成納什均衡,五個混合戰(zhàn)略納什均衡,相反,正面,背面,正面,猜謎游戲兩個孩子各拿一枚硬幣。 如果他們同時朝上或朝下,甲給乙1美分,如果只有一面朝上,乙給甲1美分。零和游戲:游戲中的玩家輸贏,但結(jié)果總是0。沒有戰(zhàn)略組合形成納什均衡,五個混合戰(zhàn)略納什均衡,警察和小偷,銀行,酒吧,警察,小偷,2萬元,1萬元,東,西,什么是警察

7、和小偷的最佳策略?上述博弈的特點是在這類博弈中不存在純納什均衡。參與者的報酬取決于其他參與者的策略;以一定的概率分布隨機選擇不同的動作。每個參與者都想猜測對方的策略,但每個參與者都不愿意讓對方猜測自己的策略。這個游戲是什么類型的?如何找到平衡?五混合策略納什均衡,請給出一些這樣的例子:石頭,剪刀,布游戲老虎,粗棍,雞,蠕蟲游戲撲克游戲足球游戲戰(zhàn)爭,西,東,西,東五混合策略納什均衡,警察抽簽決定是去銀行還是去酒吧,三分之二的機會去銀行,三分之一的機會去酒吧;同樣,小偷也抽簽決定是去銀行還是去酒吧,三分之二的機會去酒吧,三分之一的機會去銀行。五混合策略納什均衡,社會福利博弈,流浪,流浪,政府,救濟

8、,無救濟,找工作,集合:政府救濟的概率:1/2;無法緩解的概率:1/2。流浪漢:求職的預(yù)期效用:1/22 1/2 1=1.5流浪的預(yù)期效用:1/23 1/2 0=1.5因此,流浪漢的任何策略都是對政府混合策略、五種混合策略納什均衡、社會福利博弈、流浪者、流浪漢、政府、救濟、無救濟、求職和政府救濟的最佳回應(yīng)。流浪漢:找到工作的概率:0.2;游走概率:0.8每個參與者的策略是給定對方的混合策略的最佳策略,納什均衡的五種混合策略,消極的,積極的,消極的,積極的,兩個孩子在猜謎游戲中的最佳策略是采用每種策略??赡苄允?/2;每個孩子策略的一半是納什均衡。零和游戲,五混合戰(zhàn)略納什均衡,請給出一些這樣的例

9、子:石頭,剪刀,布游戲,老虎,粗棍,雞,蠕蟲游戲,撲克游戲,足球游戲,這種游戲在戰(zhàn)爭中的均衡是混合戰(zhàn)略納什均衡,五混合戰(zhàn)略納什均衡,戰(zhàn)略:規(guī)則為參與者選擇行動,在給定的信息集,它規(guī)定了參與者在什么情況下選擇什么行動,是參與者的“相機行動計劃”純戰(zhàn)略:如果一個戰(zhàn)略規(guī)定參與者只選擇一個特定的行動,在每個給定的信息下,這個戰(zhàn)略就是純戰(zhàn)略。混合策略:如果一個策略規(guī)定參與者在給定信息的情況下以一定的概率分布隨機選擇不同的行動,那么這個策略就是一個混合策略?;旌喜呗约{什均衡,混合策略:如果一個策略規(guī)定參與者在給定的信息下以一定的概率分布隨機選擇不同的行動,那么這個策略就是一個混合策略。五種混合策略納什均衡

10、,純策略可以理解為混合策略的一種特殊情況,即在許多策略中,選擇這種純策略的概率si為1,而選擇其他純策略的概率為0。等等,豬,大豬,出版社,等等,出版社,負,正,負,正,五混合策略納什均衡如何找到混合策略納什均衡?支付最大化與支付等價因為混合策略伴隨著支付的不確定性,參與者關(guān)心其預(yù)期效用。最優(yōu)混合策略:指使期望效用函數(shù)最大化的混合策略(給定彼此的混合策略)。在兩人博弈中,混合策略的納什均衡是兩個參與者的最優(yōu)混合策略的組合。五種混合策略納什均衡,流浪,流浪,政府,救濟,不救濟,找工作,也就是說,流浪漢選擇找工作的概率為0.2,流浪的概率為0.8。同樣,政府的最優(yōu)混合策略可以根據(jù)流浪漢的期望效用函

11、數(shù)來找到。支付最大化方法,五種混合策略的納什均衡,社會福利博弈,流浪,流浪,政府救濟,無救濟,找工作,集合:政府救濟的概率:1/2;無法緩解的概率:1/2。流浪漢:找到工作的概率:0.2;游走概率:0.8每個參與者的策略是給定對方混合策略的最優(yōu)策略。五種混合策略是納什均衡。假設(shè)最優(yōu)混合策略存在,給定不定期船的混合策略選擇(R,1- r),政府選擇純策略救濟的預(yù)期效用為3r (-1)(1-r)=4r-1。選擇無救濟的純策略的效用為-1r0 (1 4r-1=-r r=0.2,流浪,流浪,政府,救濟,無救濟,求職,報酬等值法,五種混合策略的納什均衡,社會福利博弈,流浪,流浪,政府,救濟,無救濟,求職

12、,設(shè)定:政府救濟的概率:1/2;無法緩解的概率:1/2。流浪漢:找到工作的概率:0.2;徘徊概率:0.8。每個參與者的策略是給定彼此混合策略的最佳策略。五混合策略納什均衡,正確解釋:如果無家可歸者尋找工作的概率小于0.2,那么政府選擇不提供救濟;如果它大于0.2,政府選擇救濟,只有當(dāng)概率等于0.2。政府將選擇混合策略或任何純策略。解釋*=0.5如果政府救助的概率大于0.5,無家可歸者的最佳選擇是流浪;如果政府救濟的概率小于0.5,無家可歸者的最佳選擇就是找工作。五種混合策略納什均衡,混合策略納什均衡的含義:納什均衡要求每個參與者的混合策略是給定彼此的混合策略的最佳選擇。因此,在社會福利博弈中,

13、*=0.5是唯一的混合策略納什均衡。相反,如果政府認為無家可歸者選擇找工作的概率嚴格來說小于0.2,那么政府唯一的最佳選擇就是純粹的策略:不救濟;如果政府選擇不提供救濟的概率為1,無家可歸者的最佳選擇是找工作,這將導(dǎo)致政府選擇救濟策略,而無家可歸者選擇流浪。等等。五個混合策略納什均衡,負,正,負,正。使用以上方法:找出這個猜謎游戲的混合策略納什均衡,并練習(xí):模擬下面的拳擊游戲:-作業(yè)3兩個老朋友一起喝酒,每個人有四個純策略:粗棍,老虎,雞和蟲子,輸贏規(guī)則。如果一個打敗另一個,獲勝的效用是1,失敗的效用是-1,否則,效用是0。寫出這個游戲的支付矩陣。這個博弈有純戰(zhàn)略均衡嗎?計算其混合策略納什均衡

14、。第二章是完全信息靜態(tài)信息博弈納什均衡,一個博弈的基本概念和戰(zhàn)略表達,兩個優(yōu)勢戰(zhàn)略均衡,三個重復(fù)消除的優(yōu)勢均衡,四個納什均衡,五個混合戰(zhàn)略納什均衡,六個納什均衡的存在性及相關(guān)討論,不同均衡概念之間的關(guān)系,優(yōu)勢均衡DSE,以及優(yōu)勢均衡IEDE的重復(fù)消除。摘要:純戰(zhàn)略納什均衡,混合戰(zhàn)略納什均衡,六種納什均衡的存在性及相關(guān)討論,納什均衡存在定理:每個有限博弈至少有一個納什均衡(純戰(zhàn)略或混合戰(zhàn)略)。六個納什均衡的存在及相關(guān)討論,一個博弈可能有多個均衡:兩個人分蛋糕;性別戰(zhàn)爭中的游戲;納什均衡的多重性:博弈論沒有一個通用的理論來證明納什均衡結(jié)果會出現(xiàn)。芭蕾、女、男、足球、芭蕾、足球、六個納什均衡的存在及

15、相關(guān)討論,如何保證均衡出現(xiàn):1。“聚集點”均衡:參與者可以使用一些抽象的信息來實現(xiàn)“聚集點均衡”。兩個人分蛋糕;性別戰(zhàn)爭中的游戲;兩個人同時互相呼叫,六個納什均衡的存在和相關(guān)的討論,2。廉價談判“協(xié)調(diào)博弈”并不能保證談判中達成協(xié)議,即使達成了協(xié)議,也不一定會被觀察到,但在某些博弈中,事先的談判實際上會出現(xiàn)一些均衡。r,b,a,u,d,l,u,d,l,聚集點,六個納什均衡的存在及相關(guān)討論,獵人博弈及帕累托優(yōu)勢:獵兔,獵人b,獵人a,獵鹿,獵兔,獵鹿,有兩個納什可以認為:(10,10)優(yōu)于(4,4),六個納什均衡的存在及相關(guān)討論,以及大流士陰謀推翻波斯王國的故事:當(dāng)時, 一群波斯貴族聚集在一起,決定推翻國王,在此期間,一些人提議休會,大流士站起來,大聲呼喊,說如果休會是休會,有人會去國王講故事,因為如果其他人不這樣做。 這個反叛的故事也為協(xié)調(diào)游戲提供了一個出路。殺死國王后,貴族們想選擇自己的一個國王。他們決定不自相殘殺,而是在佛祖破曉時去山上,誰的馬先叫他做國王。大流士的新郎篡改了這個隨機的安排,成為國王。六個納什均衡的存在性及相關(guān)討論。3

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負責(zé)。
  • 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔(dān)用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

評論

0/150

提交評論