博弈論與信息經(jīng)濟(jì)學(xué)講義07-3.ppt_第1頁(yè)
博弈論與信息經(jīng)濟(jì)學(xué)講義07-3.ppt_第2頁(yè)
博弈論與信息經(jīng)濟(jì)學(xué)講義07-3.ppt_第3頁(yè)
博弈論與信息經(jīng)濟(jì)學(xué)講義07-3.ppt_第4頁(yè)
博弈論與信息經(jīng)濟(jì)學(xué)講義07-3.ppt_第5頁(yè)
已閱讀5頁(yè),還剩34頁(yè)未讀 繼續(xù)免費(fèi)閱讀

下載本文檔

版權(quán)說(shuō)明:本文檔由用戶(hù)提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請(qǐng)進(jìn)行舉報(bào)或認(rèn)領(lǐng)

文檔簡(jiǎn)介

博弈論與信息經(jīng)濟(jì)學(xué) (Game Theory and Information Economics ),張玲玲 中國(guó)科學(xué)院研究生院管理學(xué)院 ,主要內(nèi)容簡(jiǎn)介,第一章 概述-人生處處皆博弈 第一篇 非合作博弈理論 第二章 完全信息靜態(tài)信息博弈-納什均衡 第三章 完全信息動(dòng)態(tài)搏弈-子博弈精煉納什均衡 第四章 不完全信息靜態(tài)博弈-貝葉斯納什均衡 第五章 不完全信息動(dòng)態(tài)博弈-精練貝葉斯納什均衡,第二篇 信息經(jīng)濟(jì)學(xué) 第六章 委托-代理理論(I) 第七章 委托-代理理論(II) 第八章 逆向選擇與信號(hào)傳遞,主要內(nèi)容簡(jiǎn)介,第二章 完全信息靜態(tài)信息博弈-納什均衡,一 博弈的基本概念及戰(zhàn)略表述 二 占優(yōu)戰(zhàn)略均衡 三 重復(fù)剔除的占優(yōu)均衡 四 納什均衡 五 混合戰(zhàn)略納什均衡 六 納什均衡存在性及相關(guān)討論,五 混合戰(zhàn)略納什均衡,社會(huì)福利博弈,流浪,流浪漢,政府,救濟(jì),不救濟(jì),尋找工作,沒(méi)有一個(gè)戰(zhàn)略組合構(gòu)成納什均衡,五 混合戰(zhàn)略納什均衡,反面,正面,反面,正面,猜謎游戲 兩個(gè)兒童各拿一枚硬幣, 若同時(shí)正面朝上或朝下,A給B 1分錢(qián), 若只有一面朝上,B給A 1分錢(qián)。,零和博弈 博弈參與者有輸有贏,但結(jié)果永遠(yuǎn)是0。,沒(méi)有一個(gè)戰(zhàn)略組合構(gòu)成納什均衡,五 混合戰(zhàn)略納什均衡,警察與小偷,銀行,酒館,警察,小偷,2萬(wàn)元,1萬(wàn)元,東邊,西邊,警察與小偷的最優(yōu)策略各是什么?,五 混合戰(zhàn)略納什均衡,上述博弈的特征是: 在這類(lèi)博弈中,都不存在純納什均衡。 參與人的支付取決于其他參與人的戰(zhàn)略;以某種概率分布隨機(jī)地選擇不同的行動(dòng) 每個(gè)參與人都想猜透對(duì)方的戰(zhàn)略,而每個(gè)參與人又不愿意讓對(duì)方猜透自己的戰(zhàn)略。 這種博弈的類(lèi)型是什么?如何找到均衡?,五 混合戰(zhàn)略納什均衡,請(qǐng)舉一些這樣的例子:,石頭、剪子、布游戲 老虎、杠子、雞、蟲(chóng)子游戲 撲克游戲 橄欖球賽 戰(zhàn)爭(zhēng)中,西邊,東邊,西邊,東邊,五 混合戰(zhàn)略納什均衡,警察抽簽決定去銀行還是酒館,2/3的機(jī)會(huì)去銀行,1/3的機(jī)會(huì)去酒館; 同樣,小偷也抽簽決定去銀行還是酒館, 2/3的機(jī)會(huì)去酒館, 1/3的機(jī)會(huì)去銀行。,五 混合戰(zhàn)略納什均衡,社會(huì)福利博弈,流浪,流浪漢,政府,救濟(jì),不救濟(jì),尋找工作,設(shè):政府救濟(jì)的概率:1/2 ;不救濟(jì)的概率:1/2。 流浪漢:尋找工作的期望效用:1/22+1/2 1=1.5 流浪的期望效用: 1/23+1/2 0=1.5 因此,流浪漢的任何一種戰(zhàn)略都是都是對(duì)政府混合戰(zhàn)略的最優(yōu)反應(yīng),五 混合戰(zhàn)略納什均衡,社會(huì)福利博弈,流浪,流浪漢,政府,救濟(jì),不救濟(jì),尋找工作,設(shè):政府救濟(jì)的概率:1/2 ;不救濟(jì)的概率:1/2。 流浪漢:尋找工作的概率:0. 2;流浪的概率:0.8 每個(gè)參與人的戰(zhàn)略都是給定對(duì)方混合戰(zhàn)略時(shí)的最優(yōu)戰(zhàn)略,五 混合戰(zhàn)略納什均衡,反面,正面,反面,正面,猜謎游戲 兩個(gè)小孩的最優(yōu)策略是采取每個(gè)策略的可能性均為1/2; 每個(gè)小孩各取策略的1/2是納什均衡。,零和博弈,五 混合戰(zhàn)略納什均衡,請(qǐng)舉一些這樣的例子:,石頭、剪子、布游戲 老虎、杠子、雞、蟲(chóng)子游戲 撲克游戲 橄欖球賽 戰(zhàn)爭(zhēng)中 這樣的博弈的均衡是混合戰(zhàn)略納什均衡,五 混合戰(zhàn)略納什均衡,戰(zhàn)略:參與人在給定信息集的情況下選擇行動(dòng)的規(guī)則,它規(guī)定參與人在什么情況下選擇什么行動(dòng),是參與人的“相機(jī)行動(dòng)方案”。 純戰(zhàn)略:如果一個(gè)戰(zhàn)略規(guī)定參與人在每一個(gè)給定的信 息情況下只選擇一種特定的行動(dòng),該戰(zhàn)略為 純戰(zhàn)略。 混合戰(zhàn)略:如果一個(gè)戰(zhàn)略規(guī)定參與人在給定信息情況 下以某種概率分布隨機(jī)地選擇不同的行動(dòng), 則該戰(zhàn)略為混合戰(zhàn)略。,五 混合戰(zhàn)略納什均衡,混合戰(zhàn)略:如果一個(gè)戰(zhàn)略規(guī)定參與人在給定信息情況 下以某種概率分布隨機(jī)地選擇不同的行動(dòng), 則該戰(zhàn)略為混合戰(zhàn)略。,五 混合戰(zhàn)略納什均衡,純戰(zhàn)略可以理解為混合戰(zhàn)略的特例,即在諸多戰(zhàn)略中,選該純戰(zhàn)略si的概率為1,選其他純戰(zhàn)略的概率為0。,等待,小豬,大豬,按,等待,按,反面,正面,反面,正面,五 混合戰(zhàn)略納什均衡,如何尋找混合戰(zhàn)略納什均衡? 支付最大化法 支付等值法 由于混合戰(zhàn)略伴隨的是支付的不確定性,因此參與人關(guān)心的是其期望效用。 最優(yōu)混合戰(zhàn)略:是指使期望效用函數(shù)最大的混合戰(zhàn)略(給定對(duì)方的混合戰(zhàn)略) 在兩人博弈里,混合戰(zhàn)略納什均衡是兩個(gè)參與人的最優(yōu)混合戰(zhàn)略的組合。,五 混合戰(zhàn)略納什均衡,流浪,流浪漢,政府,救濟(jì),不救濟(jì),尋找工作,即:流浪漢以0.2的概率選擇尋找工作,0.8的概率選擇游蕩,同樣,可以根據(jù)流浪漢的期望效用函數(shù)找到政府的最優(yōu)混合戰(zhàn)略。?,支付最大化法,五 混合戰(zhàn)略納什均衡,社會(huì)福利博弈,流浪,流浪漢,政府,救濟(jì),不救濟(jì),尋找工作,設(shè):政府救濟(jì)的概率:1/2 ;不救濟(jì)的概率:1/2。 流浪漢:尋找工作的概率:0. 2;流浪的概率:0.8 每個(gè)參與人的戰(zhàn)略都是給定對(duì)方混合戰(zhàn)略時(shí)的最優(yōu)戰(zhàn)略,五 混合戰(zhàn)略納什均衡,假定最優(yōu)混合戰(zhàn)略存在,給定流浪漢選擇混合戰(zhàn)略(r,1- r),政府選擇純戰(zhàn)略救濟(jì)的期望效用為: 3r+(-1)(1-r)=4r-1 選擇純戰(zhàn)略不救濟(jì)的效用為:-1r+0(1-r)=-r 如果一個(gè)混合戰(zhàn)略(而不是純戰(zhàn)略)是政府的最優(yōu)選擇,一定意味著政府在救濟(jì)與不救濟(jì)之間是無(wú)差異的。 4r-1=-r r=0.2,流浪,流浪漢,政府,救濟(jì),不救濟(jì),尋找工作,支付等值法,五 混合戰(zhàn)略納什均衡,社會(huì)福利博弈,流浪,流浪漢,政府,救濟(jì),不救濟(jì),尋找工作,設(shè):政府救濟(jì)的概率:1/2 ;不救濟(jì)的概率:1/2。 流浪漢:尋找工作的概率:0. 2;流浪的概率:0.8 每個(gè)參與人的戰(zhàn)略都是給定對(duì)方混合戰(zhàn)略時(shí)的最優(yōu)戰(zhàn)略,五 混合戰(zhàn)略納什均衡,對(duì) 的解釋?zhuān)?如果流浪漢以找工作的概率小于0.2, 則政府選擇不救濟(jì),如果大于0.2,政府選擇救濟(jì) ,只有當(dāng)概率等于0.2時(shí),政府才會(huì)選擇混合戰(zhàn)略或任何純戰(zhàn)略. 對(duì) *= 0.5的解釋 如果政府救濟(jì)的概率大于0.5,流浪漢的最優(yōu)選擇是流浪,如果政府救濟(jì)的概率小于0.5,流浪漢的最優(yōu)選擇是尋找工作.,五 混合戰(zhàn)略納什均衡,混合戰(zhàn)略納什均衡的含義: 納什均衡要求每個(gè)參與人的混合戰(zhàn)略是給定對(duì)方的混合戰(zhàn)略下的最優(yōu)選擇。因此在社會(huì)福利博弈中, , *=0.5是唯一的混合戰(zhàn)略納什均衡。 從反面來(lái)說(shuō),如果政府認(rèn)為流浪漢選擇尋找工作的概率嚴(yán)格小于0.2,那么政府的唯一最優(yōu)選擇是純戰(zhàn)略:不救濟(jì); 如果政府以1的概率選擇不救濟(jì),流浪漢的最優(yōu)選擇是尋找工作,這又將導(dǎo)致政府選擇救濟(jì)的戰(zhàn)略,流浪漢則選擇游蕩。如此等等。,五 混合戰(zhàn)略納什均衡,反面,正面,反面,正面,用上述方法:求該猜謎游戲的混合戰(zhàn)略納什均衡,五 混合戰(zhàn)略納什均衡,練習(xí):模型化下述劃拳博弈:-作業(yè)3 兩個(gè)老朋友在一起喝酒,每個(gè)人有四個(gè)純戰(zhàn)略:杠子、老虎、雞和蟲(chóng)子,輸贏規(guī)則是:杠子降雞,雞吃蟲(chóng)子,蟲(chóng)子降杠子,兩人同時(shí)出令。如果一個(gè)打敗另一個(gè),贏的效用為1,輸?shù)男в脼?1,否則效用為0,寫(xiě)出這個(gè)博弈的支付矩陣,這個(gè)博弈有純戰(zhàn)略均衡嗎?計(jì)算其混合戰(zhàn)略納什均衡。,第二章 完全信息靜態(tài)信息博弈-納什均衡,一 博弈的基本概念及戰(zhàn)略表述 二 占優(yōu)戰(zhàn)略均衡 三 重復(fù)剔除的占優(yōu)均衡 四 納什均衡 五 混合戰(zhàn)略納什均衡 六 納什均衡存在性及相關(guān)討論,六 納什均衡存在性及相關(guān)討論,不同均衡概念的關(guān)系,占優(yōu)均衡 DSE,重復(fù)剔除占優(yōu)均衡 IEDE,純戰(zhàn)略納什均衡 PNE,混合戰(zhàn)略納什均衡 MNE,六 納什均衡存在性及相關(guān)討論,納什均衡存在性定理:每一個(gè)有限博弈至少存在一個(gè)納什均衡(純戰(zhàn)略的或混合戰(zhàn)略的)。,六 納什均衡存在性及相關(guān)討論,一個(gè)博弈可能有多個(gè)均衡: 兩個(gè)人分蛋糕; 性別戰(zhàn)中的博弈; 納什均衡的多重性:博弈論并沒(méi)有一個(gè)一般的理論證明納什均衡結(jié)果一定能出現(xiàn),芭蕾,女,男,足球,芭蕾,足球,六 納什均衡存在性及相關(guān)討論,如何保證均衡出現(xiàn): 1、“聚點(diǎn)”均衡:參與人可以使用某些被抽象掉的信息達(dá)到一個(gè)“聚點(diǎn)均衡”。 兩個(gè)人分蛋糕; 性別戰(zhàn)中的博弈; 兩人同時(shí)給對(duì)方打電話(huà) ,六 納什均衡存在性及相關(guān)討論,2、廉價(jià)磋商-“協(xié)調(diào)博弈” 盡管無(wú)法保證磋商會(huì)達(dá)成一個(gè)協(xié)議,即使達(dá)成協(xié)議也不一定會(huì)被遵守,但在一些博弈中,事前磋商確實(shí)可以使某些均衡實(shí)際上出現(xiàn)。,R,B,A,U,D,L,R,B,A,U,D,L,聚點(diǎn),六 納什均衡存在性及相關(guān)討論,獵人博弈和帕累托優(yōu)勢(shì):,打兔,獵人乙,獵人甲,獵鹿,打兔,獵鹿,有兩個(gè)納什均衡: (10,10)與 (4,4); 可以認(rèn)為: (10,10)比(4,4)有帕累托優(yōu)勢(shì),六 納什均衡存在性及相關(guān)討論,大流士陰謀推翻波斯王國(guó)的故事: 當(dāng)時(shí),一群波斯貴族聚在一起決定推翻國(guó)王,其間有人提議休會(huì),大流士此時(shí)站出來(lái)大聲疾呼,說(shuō)如果休會(huì)的話(huà),就一定會(huì)有人去國(guó)王那里告密,因?yàn)槿绻麆e人不那么做的話(huà),他自己就會(huì)去做,大流士說(shuō)唯一的辦法就是沖進(jìn)皇宮,殺死國(guó)王。 這個(gè)謀反的故事還提供了關(guān)于協(xié)調(diào)博弈的出路。在殺死國(guó)王之后,貴族們想從自己人中推選出一個(gè)人當(dāng)國(guó)王,他們決定不自相殘殺,而是在佛曉十分到山上去,誰(shuí)的馬先叫誰(shuí)就當(dāng)國(guó)王。大流士的馬夫在這場(chǎng)隨機(jī)的安排中做了手腳,從而成為國(guó)王。,六 納什均衡存在性及相關(guān)討論,3、學(xué)習(xí)過(guò)程 假定博弈重復(fù)多次,即使參與人最初難以協(xié)調(diào)行動(dòng),在博弈若干次后,某種特定的協(xié)調(diào)模式可能會(huì)形成,特別地,假定參與人每一輪根據(jù)其對(duì)手

溫馨提示

  • 1. 本站所有資源如無(wú)特殊說(shuō)明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請(qǐng)下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請(qǐng)聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶(hù)所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁(yè)內(nèi)容里面會(huì)有圖紙預(yù)覽,若沒(méi)有圖紙預(yù)覽就沒(méi)有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫(kù)網(wǎng)僅提供信息存儲(chǔ)空間,僅對(duì)用戶(hù)上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對(duì)用戶(hù)上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對(duì)任何下載內(nèi)容負(fù)責(zé)。
  • 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請(qǐng)與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶(hù)因使用這些下載資源對(duì)自己和他人造成任何形式的傷害或損失。

最新文檔

評(píng)論

0/150

提交評(píng)論