《不完全信息博弈綜述》3400字_第1頁
《不完全信息博弈綜述》3400字_第2頁
《不完全信息博弈綜述》3400字_第3頁
《不完全信息博弈綜述》3400字_第4頁
《不完全信息博弈綜述》3400字_第5頁
已閱讀5頁,還剩2頁未讀, 繼續(xù)免費(fèi)閱讀

下載本文檔

版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進(jìn)行舉報(bào)或認(rèn)領(lǐng)

文檔簡介

不完全信息博弈綜述目錄TOC\o"1-2"\h\u9274不完全信息博弈綜述 124451不完全信息靜態(tài)博弈 192471.1貝葉斯納什均衡 133831.2貝葉斯納什均衡的例子及應(yīng)用 277343.4不完全信息動(dòng)態(tài)博弈 31不完全信息靜態(tài)博弈在上文介紹的納什均衡、子博弈精煉納什均衡中都有一個(gè)共同的假設(shè):完全信息,也就是參加博弈的每一個(gè)人都清楚地知道博弈的規(guī)則、博弈的結(jié)構(gòu)、博弈的函數(shù)等。換句話說,也就是參與者對博弈的信息沒有未知。但實(shí)際上博弈論中很多問題都是不完全信息的。在1967年之前是不完全信息的問題是沒有辦法解決的,數(shù)學(xué)家或者是經(jīng)濟(jì)學(xué)家都是束手無策的,直到海薩尼提出新的理論。1.1貝葉斯納什均衡海薩尼(JohnCharlesHarsanyi,1920年5月29日-2000年8月9日)是出生于\o"匈牙利"匈牙利布達(dá)佩斯,后定居于\o"美國"美國。他是一位著名\o"經(jīng)濟(jì)學(xué)家"經(jīng)濟(jì)學(xué)家,曾獲得1994年\o"諾貝爾獎(jiǎng)獲得者"諾貝爾經(jīng)濟(jì)學(xué)獎(jiǎng)。曾就讀于法國里昂大學(xué),后來在故鄉(xiāng)的布達(dá)佩斯大學(xué)取得本科、博士學(xué)位。因其在博弈論以及博弈論在經(jīng)濟(jì)學(xué)的應(yīng)用而聞名于世,尤其是他在分析不完全信息靜態(tài)博弈時(shí),引入相關(guān)的貝葉斯理論,進(jìn)行了高度創(chuàng)新。同時(shí)他在對博弈論在其他領(lǐng)域的交叉應(yīng)用也做出了極大的貢獻(xiàn),例如推動(dòng)博弈論在政治、哲學(xué)的應(yīng)用。他于1967年在管理科學(xué)(Management

Science)發(fā)表的論文《Gameswithincompleteinformationplayedby“Bayesian”players,I-III.》使得關(guān)于不完全信息的問題變得可以得到處理。他將概率論引入博弈論,同時(shí)在分析不完全信息靜態(tài)博弈時(shí)引入一個(gè)了假設(shè)的參與人:自然。同時(shí)對自然有一個(gè)附加條件:所有的博弈結(jié)果對自然都是沒有本質(zhì)區(qū)別的。然后自然首先行動(dòng),選擇每一個(gè)參與者的類型。然后對于任意一個(gè)參與者而言,自己的類型已知,其他參與者的類型未知,但知道各種可被選擇的類型的分布函數(shù)。即分布函數(shù)是共同知識(shí)。上述的轉(zhuǎn)化被命名為海薩尼轉(zhuǎn)化,這個(gè)轉(zhuǎn)化將不完全信息靜態(tài)博弈轉(zhuǎn)化為完全但不完美靜態(tài)信息博弈。這里的不完美主要可以解釋為:參與者知道了選擇的分布函數(shù),但對于自然的選擇卻一無所知。1.2貝葉斯納什均衡的例子及應(yīng)用關(guān)于貝葉斯均衡的例子,為了突出不完全信息靜態(tài)博弈和完全信息靜態(tài)博弈的區(qū)別,本文選擇介紹不完全信息下的古諾模型。假設(shè)中除了企業(yè)生產(chǎn)成本發(fā)生變化,其余假設(shè)不變。對于生產(chǎn)成本的假設(shè)更換為:企業(yè)1的成產(chǎn)成本為,并且是企業(yè)1、企業(yè)2的共同知識(shí)。對于企業(yè)2的成本,可能有兩種情況或,企業(yè)2知道自己的成本,但企業(yè)1只知道分布,即表2:成本概率表2注:企業(yè)1、2同時(shí)做決策。可以將企業(yè)1、2的利潤函數(shù)分布表示為:分別關(guān)于各自產(chǎn)量求導(dǎo),尋找導(dǎo)數(shù)的零點(diǎn)得:則:對于企業(yè)2:則對于企業(yè)2的產(chǎn)量,企業(yè)1認(rèn)為的最優(yōu)情況:為了方便對比不妨賦值,則有:3.4不完全信息動(dòng)態(tài)博弈在上文中,我們總共介紹了完全信息靜態(tài)博弈、完全信息動(dòng)態(tài)博弈、不完全信息靜態(tài)博弈。但實(shí)際上在生活中面對的情況是不完全信息,同時(shí)行動(dòng)又有先后順序的,或者在后先動(dòng)者也是可以觀察先行動(dòng)者,來推斷他的喜好。這也是本文想介紹的最后一個(gè)博弈論模型:不完全信息動(dòng)態(tài)博弈。對于這個(gè)問題許多博弈論學(xué)家提出解決方法,本文主要對精煉貝葉斯均衡進(jìn)行介紹。3.4.1顫抖手均衡顫抖手均衡是由澤爾騰提出的,前文已經(jīng)對澤爾騰做過介紹,這里就不進(jìn)行介紹。他是在1975年于著名的論文《AReexaminationofthePerfectnessConceptforEquilibriumPointsinExtensiveGames》提出"顫抖手均衡"(tremblinghandequilibrium)的概念,給出了如何處理動(dòng)態(tài)博弈中有限理性的方法。顫抖手均衡主要的思想是:對于一個(gè)保持穩(wěn)定的納什均衡是可能會(huì)遭受某些極其微小的擾動(dòng),這些微小的擾動(dòng)可能來自于人決策行動(dòng)時(shí)出現(xiàn)的錯(cuò)誤。如果出現(xiàn)這種錯(cuò)誤的概率趨近0,而且這個(gè)過程中的均衡序列收斂,那么均衡序列的極限就是顫抖手均衡。換句話就是在納什均衡的下,博弈中有一個(gè)人手抖了一下,選擇的是次優(yōu)的策略,如果該納什均衡是顫抖手均衡,則博弈參與者會(huì)回到該均衡,而不是偏向另一個(gè)納什均衡。下面我們簡要介紹一個(gè)關(guān)于顫抖手均衡的例子:假設(shè)博弈者1、2的支付矩陣如表3:表3易得該博弈具有兩個(gè)納什均衡:(U,L)、(D,R)。當(dāng)博弈處于(U,L)時(shí),如果博弈者2手抖犯錯(cuò),將策略換為D,則其收益變?yōu)?。對于博弈者1來說,收益變?yōu)?,這是他是沒有更換策略的積極性的,若更換為R,收益沒有發(fā)生變化,還可能會(huì)遭遇博弈者2更換策略,收益變?yōu)?。但是對于博弈者2而言,更換策略的動(dòng)機(jī)是易見的,只要更換策略為U,收益就會(huì)增加。然后博弈又回到了最初的狀態(tài)(U,L),這就是顫抖手均衡。但是如果博弈處于(D,R),博弈者1手抖犯錯(cuò),將策略換為L,對于自身收益造成影響,但是博弈者2的收益變?yōu)?,博弈者只有調(diào)整策略為U,才可增加收益。均衡變成(U,L),無法回到(D,R),則(D,R)不是一個(gè)納什均衡。3.4.2序貫均衡克雷普斯(David

M.Kreps,1950-)是美國斯坦福大學(xué)的著名教授,他是一位經(jīng)濟(jì)學(xué)家。他出生于美國紐約,曾就讀于達(dá)特茅斯學(xué)院、斯坦福大學(xué)等高校。在1989年榮獲John

Bates

Clark

Medal,也在2018年被授予John

J.Carty

Award。他以對動(dòng)態(tài)選擇模型和非合作博弈論的研究而聞名。威爾遜(Robert

B.Wilson,1937年-),出生于內(nèi)布拉斯加州,博士就讀于哈佛大學(xué),后一直執(zhí)教于斯坦福大學(xué)。在1994年獲選為美國國家科學(xué)院成員,后在2020年獲得諾貝爾經(jīng)濟(jì)學(xué)獎(jiǎng)。威爾遜以其對管理科學(xué)和商業(yè)經(jīng)濟(jì)學(xué)的貢獻(xiàn)而聞名。他與斯坦福商學(xué)院的其他數(shù)理經(jīng)濟(jì)學(xué)家一起,使用非合作博弈理論幫助重新構(gòu)造了產(chǎn)業(yè)組織經(jīng)濟(jì)學(xué)和組織理論。他對非線性定價(jià)的研究影響了大公司的政策,尤其是在能源工業(yè)。序貫均衡提出于克瑞普斯和威爾遜共同發(fā)表的論文《SequentialEquilibrium》中,在這篇論文中,他們定義了序貫均衡,序貫均衡是一個(gè)行為策略—信念的組合。這要求:首先,策略必須是“序貫理性”,換句話說,可以理解為在后續(xù)出現(xiàn)的任意一個(gè)貝葉斯博弈當(dāng)作構(gòu)成一個(gè)貝葉斯納什均衡。其次,信念的一致性,一列完全混合策略生成的信念的極限是這個(gè)信念。下面我們簡要介紹一個(gè)關(guān)于序貫均衡的例子:圖3圖3是博弈者1、2的博弈過程樹形圖。博弈者1先做出選擇,選擇有A、B、C,博弈者2再做出選擇,選擇有D、E,虛線表示博弈者2做出選擇時(shí),不知道博弈者1做出了何種選擇,也是博弈者1的選擇不是共同知識(shí)。很容易可得到,博弈者1的最優(yōu)策略是選擇A,得到2的收益,博弈直接結(jié)束。但博弈的過程中出現(xiàn)錯(cuò)誤,博弈者1未選擇A,然后博弈者2就需要開始考慮選擇何種策略。博弈者2知道博弈者1在B、C之間做出了選擇,但不知道何種選擇。如果博弈者1選擇B,博弈者2的最優(yōu)策略為E;如果博弈者1選擇C,博弈者2的最優(yōu)策略為D。如何做出選擇就要依靠博弈者2認(rèn)為博弈者1做出對應(yīng)選擇的概率為多少。如上圖,假設(shè)博弈者1選擇B的概率為,則選擇C的概率為可計(jì)算得到,博弈者2做出選擇對應(yīng)收益的數(shù)學(xué)期望如下:根據(jù)收益的期望得到,當(dāng),博弈者2應(yīng)選擇E;,應(yīng)選擇D。等于時(shí)都可以。3.4.3精煉貝葉斯納什均衡精煉貝葉斯納什均衡(prefect

Bayesian

equilibrium)的主要成果是由弗登伯格和泰勒爾提出的。讓·弗登伯格(Drew

Fudenberg

,1957年—)出生于美國紐約,是美國哈佛大學(xué)經(jīng)濟(jì)系的著名教授。1981年,他取得了麻省理工學(xué)院的經(jīng)濟(jì)學(xué)博士學(xué)位。之后,他在博弈論和動(dòng)態(tài)經(jīng)濟(jì)學(xué)方面做出了巨大貢獻(xiàn)。曾經(jīng)在加州大學(xué)伯克利分校、麻省理工學(xué)院、斯坦福大學(xué)和法國圖盧茲大學(xué)任教。他的廣泛研究涵蓋了博弈論的許多方面,包括均衡理論,博弈學(xué)習(xí),進(jìn)化博弈論以及在其他領(lǐng)域的許多應(yīng)用。富登堡還是最早將博弈論分析應(yīng)用到產(chǎn)業(yè)組織,討價(jià)還價(jià)理論和契約理論中的人之一。讓·泰勒爾(Jean

Tirole,1953年—)是法國圖盧茲大學(xué)的著名產(chǎn)業(yè)經(jīng)濟(jì)學(xué)教授,同時(shí)他也是巴黎大學(xué)、麻省理工學(xué)院的兼職教授,并且曾經(jīng)在哈佛大學(xué)、斯坦福大學(xué)擔(dān)任客座教授。他專注于產(chǎn)業(yè)組織、博弈論、銀行、金融等各種領(lǐng)域。2014年,他因?qū)κ袌隽α亢捅O(jiān)管的分析而被授予諾貝爾經(jīng)濟(jì)學(xué)獎(jiǎng)。1978年,在獲得巴黎第九大學(xué)應(yīng)用數(shù)學(xué)博士學(xué)位后,對經(jīng)濟(jì)學(xué)興趣油生,他來到著名的美國麻省理工學(xué)院繼續(xù)深造,并于1981年獲得經(jīng)濟(jì)學(xué)博士學(xué)位。精煉貝葉斯均衡出現(xiàn)在弗登伯格和泰勒爾于1991年年共同撰寫的《gametheory》中。在本書中詳細(xì)介紹了精煉貝葉斯均衡,精煉貝葉斯均衡的關(guān)鍵點(diǎn)是博弈的參與者可通過觀察其他參與者的行為來改變自己關(guān)于后面的參與者類型的主觀概率,并由此決定自己的策略。這個(gè)修正的過程就被稱之為貝葉斯規(guī)則。從數(shù)學(xué)觀點(diǎn)來說,精煉貝葉斯均衡就是一個(gè)關(guān)于映射的不動(dòng)點(diǎn)。具體的理解可以理解為每一個(gè)博弈的參與者都預(yù)先假設(shè)其他博弈參與者是均衡策略。換句話說就是:它

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會(huì)有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫網(wǎng)僅提供信息存儲(chǔ)空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負(fù)責(zé)。
  • 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

評(píng)論

0/150

提交評(píng)論