人微觀經(jīng)濟(jì)學(xué)-第十章-博弈論初步_第1頁(yè)
人微觀經(jīng)濟(jì)學(xué)-第十章-博弈論初步_第2頁(yè)
人微觀經(jīng)濟(jì)學(xué)-第十章-博弈論初步_第3頁(yè)
人微觀經(jīng)濟(jì)學(xué)-第十章-博弈論初步_第4頁(yè)
人微觀經(jīng)濟(jì)學(xué)-第十章-博弈論初步_第5頁(yè)
已閱讀5頁(yè),還剩30頁(yè)未讀, 繼續(xù)免費(fèi)閱讀

下載本文檔

版權(quán)說(shuō)明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請(qǐng)進(jìn)行舉報(bào)或認(rèn)領(lǐng)

文檔簡(jiǎn)介

微觀經(jīng)濟(jì)學(xué)主講人韓松第十章博弈論初步知識(shí)結(jié)構(gòu)知識(shí)結(jié)構(gòu)博弈論靜態(tài)博弈不完全信息動(dòng)態(tài)博弈完全信息基本要素逆向歸納法博弈樹支付矩陣純策略均衡混合策略均衡條件策略下劃線法納什均衡囚徒困境第一節(jié)策略和行為一、博弈的定義企業(yè)行為相互影響,每個(gè)人進(jìn)行的決策和采取的行動(dòng)都會(huì)對(duì)其他人產(chǎn)生影響,根據(jù)其他人的可能反應(yīng)來(lái)決定自己的決策和行動(dòng)。在策略性環(huán)境中,所進(jìn)行的策略性決策和采取的策略性行動(dòng)就是所謂的博弈

(Game),進(jìn)行博弈研究就是博弈論(GameTheory)。1944年馮·諾依曼和摩根斯頓共著《博弈論與經(jīng)濟(jì)行為》,將博弈論用于經(jīng)濟(jì)領(lǐng)域。第一節(jié)策略和行為一博弈的定義1769年,匈牙利的工程師坎比林為奧地利皇后做出一臺(tái)會(huì)“下”棋的機(jī)器。阿倫·圖靈的紙上機(jī)器。貝爾實(shí)驗(yàn)室克勞迪·申朗提出的A策略和B策略。1951年,“計(jì)算機(jī)之父”——馮·諾依曼領(lǐng)導(dǎo)的研

究小組設(shè)計(jì)出ENIAC一號(hào)。[資料]下棋的機(jī)器[資料]下棋的機(jī)器李世石與谷歌AlphaGo進(jìn)行最后一輪較量,最終人機(jī)大戰(zhàn)的總比分定格在1:

4。[視頻]圍棋人機(jī)大戰(zhàn)[視頻]圍棋人機(jī)大戰(zhàn)第一節(jié)策略和行為二、要素和類型參與者:進(jìn)行決策的個(gè)體至少有兩個(gè),有時(shí)可引入一個(gè)虛擬參與人如“自然”;策略:在一項(xiàng)規(guī)則下一組可選擇行動(dòng)集合;支付:各自的報(bào)酬,即所得到的支付,都是所有策略共同作用的結(jié)果——支付組合。從多角度進(jìn)行博弈分類,如兩人博弈和多人博弈、零和博弈和非零和博弈、有限博弈和無(wú)限博弈、同時(shí)博弈和動(dòng)態(tài)博弈。第一節(jié)策略和行為二要素和類型合作博弈與非合作博弈:能否達(dá)成有約束力協(xié)議;重復(fù)博弈與非重復(fù)博弈:具有連續(xù)性的特點(diǎn);零和博弈與非零和博弈:你的所失正是我的所得。完全且完美信息博弈完全但不完美信息博弈不完全信息博弈海薩尼轉(zhuǎn)換(含自然)[資料]博弈的類型[資料]博弈的類型類型區(qū)別內(nèi)容完全信息針對(duì)策略集和支付集完美信息針對(duì)記憶(過(guò)程),信息結(jié)點(diǎn)是唯一的第二節(jié)純策略均衡一、寡頭和支付矩陣假定在某個(gè)寡頭市場(chǎng)上有甲、乙兩個(gè)廠商。列出一個(gè)只有兩方廠商參加并且同時(shí)進(jìn)行決策的簡(jiǎn)單博弈。用一個(gè)以二元數(shù)組為元素的矩陣

(亦稱博弈矩陣或支付矩陣)進(jìn)行描述和分析。第二節(jié)純策略均衡一寡頭和支付矩陣甲廠商合作不合作乙廠商合作不合作51235617第二節(jié)純策略均衡二、條件策略和組合把甲廠商在乙廠商選擇合作條件下最優(yōu)策略(不合作)叫做甲廠商的條件優(yōu)勢(shì)策略,因此與這一條件策略相聯(lián)系的策略組合就叫條件優(yōu)勢(shì)策略組合。條件策略包括參與人的條件策略及組合。第二節(jié)純策略均衡二條件策略和組合甲廠商合作不合作乙廠商合作不合作51235617一位日本的收藏家無(wú)法決定讓誰(shuí)來(lái)拍賣畫作,于是要求佳士得與蘇富比老板猜拳定勝負(fù)。佳士得老板向員工們討教猜拳策略,最后,在一名主管11歲女兒建議下,決定出招……[思考]猜拳出什么招?[思考]猜拳出什么招第二節(jié)純策略均衡三、納什均衡當(dāng)廠商的條件策略組合恰好相同,從而都不再有單獨(dú)改變策略的傾向時(shí),整個(gè)博弈就達(dá)到均衡是博弈的解,稱為納什均衡。納什均衡是參與者在該策略組合上,任何單獨(dú)改變策略都不會(huì)得到好處;當(dāng)所有其他人都不改變時(shí),沒(méi)有人會(huì)改變自己的策略。假定支付不變時(shí),由于存在著成本和風(fēng)險(xiǎn),參與者也不愿意單獨(dú)地改變策略。第二節(jié)純策略均衡三納什均衡天才與瘋子僅有一線之隔,瘋子變常人的欣慰等同對(duì)天才淪為平庸的惋惜。[視頻]納什的命運(yùn)[視頻]納什的命運(yùn)[案例]華容道的納什均衡孔明曰:“亮夜觀乾象,操賊未合身亡。留這人情,教云長(zhǎng)做了,亦是美事?!毙略唬骸跋壬袼?,世所罕及![案例]華容道的納什均衡孔明小道大路曹操小道大路逃脫空等拿下被捉拿下被捉逃脫空等小豬按鍵等待大豬按鍵等待9-1001544[案例]孫劉的智豬博弈孔明笑曰:“亮借一帆風(fēng),直至江東,憑三寸不爛之舌,說(shuō)南北兩軍互相吞并。若南軍勝,共誅曹操以取荊州之地;若北軍勝,則我乘勢(shì)以取江南可也?!鼻G州是赤壁之戰(zhàn)最重要的戰(zhàn)果之一,卻被出力很少的劉備摘去了。[案例]孫劉的智豬博弈第二節(jié)純策略均衡四、下劃線法條件均衡策略,用下劃線分別來(lái)表示甲廠商和乙廠商的條件策略。在甲廠商的支付矩陣中,找出每一列的最大數(shù)字;在乙廠商的支付矩陣中,找出每一行的最大數(shù)字。都有下劃線的組合。第二節(jié)純策略均衡四下劃線法甲廠商合作不合作乙廠商合作不合作51235617————第二節(jié)純策略均衡五、納什均衡的特性在同時(shí)博弈中,純策略的納什均衡有可能存在也可能不存在。在納什均衡存在的條件下,它可能是惟一的也可能不惟一。如果納什均衡存在,它可能是最優(yōu)的也可能不是最優(yōu)的。第二節(jié)純策略均衡五納什均衡的特性甲廠商合作不合作乙廠商合作不合作41235614————第二節(jié)純策略均衡六、囚徒困境無(wú)論其他參與者采取什么策略,某一參與者惟一的最優(yōu)策略就是他的占優(yōu)策略,任何一方都不想偏離各自認(rèn)為的最優(yōu)策略。囚徒困境(Prisoners’

Dilemma)反映個(gè)人理性和團(tuán)體理性的沖突,從個(gè)人理性角度出發(fā)選擇占優(yōu)策略結(jié)局,從整體來(lái)看卻是最差的。根據(jù)“看不見(jiàn)的手”的原理,理性人在追求自己利益中,會(huì)同時(shí)增進(jìn)整體福利。第二節(jié)純策略均衡六囚徒困境[案例]空城計(jì)的占優(yōu)策略諸葛亮對(duì)司馬懿的思想軌跡是相當(dāng)了解;諸葛亮的行徑司馬懿也能做出理性判斷。[案例]空城計(jì)的占優(yōu)策略曹家使用殺掉司馬捉拿放走2010-151-103-158諸葛守城棄城司馬進(jìn)攻撤退平手逃脫××被捉拿下拿下被捉雙方都存在著偷換策略的誘惑,不穩(wěn)定狀態(tài)。即使兩個(gè)囚徒事先訂立攻守同盟(死不坦白),最終也將會(huì)背叛同盟。每個(gè)囚徒希望對(duì)方選擇抵賴而自己坦白從而獲釋;當(dāng)他們都這么想并這么做的時(shí)候,就形成都坦白的左上角結(jié)局。甲方坦白不坦白乙方坦白不坦白-200-1-1-8-80-20————[案例]囚徒困境[案例]囚徒困境第三節(jié)混合策略均衡一、混合策略組合將純策略賦予不同的概率向量,是參與人的某種混合策略。形成期望支付,求得條件混合策略。第三節(jié)混合策略均衡一混合策略組合甲廠商上下乙廠商左右19284637q1

q2p1p2————在每一個(gè)參與人都只有有限多個(gè)純策略的博弈中,至少存在一個(gè)混合策略納什均衡。第三節(jié)混合策略均衡二、混合策略均衡第三節(jié)混合策略均衡二混合策略均衡op1q111乙廠商0.50.7甲廠商·e·······▲▲1/21/2▲▲▲▲1×1/2▲▲1×1/2[思考]快餐店會(huì)扎堆么?[思考]快餐店會(huì)扎堆么第四節(jié)動(dòng)態(tài)博弈一、競(jìng)爭(zhēng)者-壟斷者威脅策略一定具有可信性,才能起到作用。第四節(jié)動(dòng)態(tài)博弈一競(jìng)爭(zhēng)者-壟斷者壟斷者容忍抵抗競(jìng)爭(zhēng)者進(jìn)入退出023021-24壟斷者容忍抵抗競(jìng)爭(zhēng)者進(jìn)入退出053041-22“中國(guó)人不怕原子彈,死一半也沒(méi)什么,照樣接著搞社會(huì)主義?!睆?qiáng)權(quán)政治、單邊主義和恐怖活動(dòng)都增加著文明毀滅的危險(xiǎn)——局部核戰(zhàn)爭(zhēng)已是不可忽視的現(xiàn)實(shí)威脅?!半y道上個(gè)世紀(jì)的夢(mèng)魘又回來(lái)了嗎???”[案例]核武環(huán)峙中國(guó)[案例]核武環(huán)峙中國(guó)第四節(jié)動(dòng)態(tài)博弈二、博弈樹博弈樹模型又稱為擴(kuò)展型博弈模型,用博弈樹來(lái)描述的序貫博弈又叫做擴(kuò)展型博弈。第四節(jié)動(dòng)態(tài)博弈二博弈樹競(jìng)爭(zhēng)者壟斷者abc壟斷者進(jìn)入退出容忍抵抗容忍抵抗defg(1,4)(-2,2)(0,5)(0,3)起點(diǎn)中間點(diǎn)終點(diǎn)·······蒙特卡洛樹搜索,借助價(jià)值網(wǎng)絡(luò)與策略網(wǎng)絡(luò),最初通過(guò)模仿人類玩家,嘗試匹配職業(yè)棋手。一旦達(dá)到一定的熟練程度,它開始和自己對(duì)弈,強(qiáng)化學(xué)習(xí),它在用技巧,根本沒(méi)有用力氣。[資料]AlphaGo的AI[資料]AlphaGo的AI第四節(jié)動(dòng)態(tài)博弈三、逆向歸納法在所有的納什均衡中,找到最有可能實(shí)現(xiàn)的策略組合,這就是對(duì)納什均衡的精練。逆向歸納法的兩個(gè)步驟:第一,從最后階段每一個(gè)決策點(diǎn)開始,確定參與人此時(shí)所選擇策略,并把其他策略刪除;第二,對(duì)簡(jiǎn)化博弈重復(fù)刪除程序,直到最后的最簡(jiǎn)博弈。實(shí)際上,逆向歸納策略總是屬于納什均衡,盡管納什均衡并不一定是逆向歸納策略。第四節(jié)動(dòng)態(tài)博弈三逆向歸納法[案例]戀愛(ài)的蜈蚣博弈[1﹐1][0﹐3][2﹐2][8﹐11][9﹐9][7﹐10][1﹐4]+1+1+1+11+1+1+[10﹐10]芳芳芳芳芳呆呆呆呆呆[案例]戀愛(ài)的蜈蚣博弈第四節(jié)動(dòng)態(tài)博弈四、順序與優(yōu)勢(shì)動(dòng)態(tài)博弈的行動(dòng)存在著先后順序,一些具有先動(dòng)優(yōu)勢(shì)(First-moverAdvantage),另一些具有后動(dòng)優(yōu)勢(shì)(Second-moverAdvantage)。在不完全信息下順序更重要:產(chǎn)量競(jìng)爭(zhēng)可能有先動(dòng)優(yōu)勢(shì),價(jià)格競(jìng)爭(zhēng)可能有后動(dòng)優(yōu)勢(shì),但有的博弈如抓鬮沒(méi)有先動(dòng)和后動(dòng)優(yōu)勢(shì)。優(yōu)勢(shì)是指自己某個(gè)策略相比較其他策略有優(yōu)勢(shì),而不是相比對(duì)手策略一定有優(yōu)勢(shì)。第四節(jié)動(dòng)態(tài)博弈四順序與優(yōu)勢(shì)

支付次序ABCDE[案例]海盜分金幣[案例]海盜分金幣97

012

0第四輪第三輪第二輪

第一輪

×

×

×

溫馨提示

  • 1. 本站所有資源如無(wú)特殊說(shuō)明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請(qǐng)下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請(qǐng)聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁(yè)內(nèi)容里面會(huì)有圖紙預(yù)覽,若沒(méi)有圖紙預(yù)覽就沒(méi)有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫(kù)網(wǎng)僅提供信息存儲(chǔ)空間,僅對(duì)用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對(duì)用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對(duì)任何下載內(nèi)容負(fù)責(zé)。
  • 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請(qǐng)與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶因使用這些下載資源對(duì)自己和他人造成任何形式的傷害或損失。

評(píng)論

0/150

提交評(píng)論