版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進行舉報或認領(lǐng)
文檔簡介
目錄摘要 III第一章前言 11.1研究背景 11.2研究目的和意義 11.3國內(nèi)外研究現(xiàn)狀 2第二章預備知識 3第三章主要結(jié)果 53.1完全信息靜態(tài)博弈 53.1.1納什均衡 53.1.2納什均衡的例子及應用 63.1.3相關(guān)均衡 93.2完全信息動態(tài)博弈 103.2.1子博弈精煉納什均衡 103.2.2子博弈精煉納什均衡的模型及應用 113.3不完全信息靜態(tài)博弈 123.3.1貝葉斯納什均衡 133.3.2貝葉斯納什均衡的例子及應用 133.4不完全信息動態(tài)博弈 153.4.1顫抖手均衡 153.4.2序貫均衡 163.4.3精煉貝葉斯納什均衡 173.5合作博弈理論 18第四章總結(jié)與展望 214.1論文總結(jié) 214.2論文展望 21參考文獻 22博弈論簡史探析摘要現(xiàn)代博弈論研究主要分為合作博弈與非合作博弈兩個領(lǐng)域。本文主要研究非合作博弈發(fā)展簡史問題,同時簡述了合作博弈發(fā)展史。本文所得具體成果如下:第一章解釋了研究博弈論發(fā)展簡史的背景、目的、意義等。第二章介紹博弈論的基本概念,說明了閱讀本文所需基本知識。第三章對于非合作博弈理論,從1994年諾貝爾經(jīng)濟學獎三位獲得者出發(fā),搭建起由完全信息靜態(tài)博弈、完全信息動態(tài)博弈、不完全信息靜態(tài)博弈、不完全信息動態(tài)博弈歷史發(fā)展框架,找出每個博弈所對應均衡:納什均衡、子博弈精煉納什均衡、貝葉斯納什均衡、精煉貝葉斯納什均衡等,對其提出者、提出論文、提出時間以及思想進行追根溯源,同時給出例子。對于合作博弈,從“核”與Shapley值出發(fā),通過追溯合作博弈理論基本概念,來闡述合作博弈理論發(fā)展史。第四章是對本文內(nèi)容的總結(jié),同時說明了本文還存在的不足以及對未來研究的展望。關(guān)鍵詞:博弈論,納什均衡,核,Shapley值第一章前言1.1研究背景博弈論于1944年正式獨立為一個全新的數(shù)學分支學科,至今尚不足百年之久,但博弈論的前史則可追根溯源至18世紀,若論博弈現(xiàn)象的出現(xiàn)與積累甚至可以遍布整個人類發(fā)展史中。隨著經(jīng)濟學與博弈論的發(fā)展,微觀經(jīng)濟學逐漸與博弈論水乳交融,你中有我,我中有你。由此許多經(jīng)濟學家都對博弈論發(fā)展史進行了研究與思考,但至今沒有形成類似于《古今數(shù)學思想》的學科史著作,也沒有形成廣泛受到認可的博弈論發(fā)展史。同時現(xiàn)有的關(guān)于博弈論發(fā)展史的研究多處于社會學或經(jīng)濟學的角度,在博弈論發(fā)展過程中做出巨大貢獻的數(shù)學家們,極少涉足關(guān)于博弈論發(fā)展史的研究,這造成了數(shù)學角度的缺失。1.2研究目的和意義首先,科學的目的是探索未知,解決問題。在這個過程中教育有著決定性的力量。研究博弈論發(fā)展史,可以了解在歷史長河中博弈論是如何發(fā)展的,博弈論學家們是如何通過個人的努力與時代的機遇去解決接連不斷出現(xiàn)的博弈論難題。這些材料都將成為博弈論教育中的巨大助力。博弈論學家曾經(jīng)犯過的錯、遇到過的問題,也極有可能是學生的錯誤與問題,這使博弈論教育中可能遇到的問題可以提前預見。同時那些博弈論發(fā)展史中那些曲折的故事也是博弈論教育中最好的引入。其次,科學雖是面向未來的,但也是注重過去的。就如同科學研究中,需要大量閱讀前人的成果,站在路人的肩上望向更遠。雖博弈論發(fā)展史所研究的博弈論成果大多已是教科書上的案例與定理,不再那么前沿,但其包含的思想不會變,只會更加歷久彌新,讓后來者打破時間與空間的阻隔,與多年前的大師對話。最后,數(shù)學是追求完備,作為數(shù)學的分支學科,博弈論也不可以避免的追求完備。研究博弈論發(fā)展史,可以梳理學科脈絡,整理學科資料,總結(jié)出博弈論發(fā)現(xiàn)至今還稍有欠缺或已充分挖掘的方向,為后來者做出更大的貢獻提供幫助。1.3國內(nèi)外研究現(xiàn)狀2003年,中國西北大學博士生尚宇紅的博士論文《博弈論前史研究》系統(tǒng)闡述博弈論初期發(fā)展的情況,對古諾模型、《博弈論與經(jīng)濟行為》、極大極小值理論等博弈論重要理論進行了追根溯源,分析了其產(chǎn)生的歷史背景,對其在博弈論發(fā)展進程中所起的作用進行了論證。張維迎所編寫的《博弈論與信息經(jīng)濟學》雖未對博弈論史進行大量介紹,但他對每一個博弈論理論的提出者進行了介紹了,并提供了最初文獻的相關(guān)資料。謝識予所編寫的《經(jīng)濟博弈論》對博弈論的整個發(fā)展史以及博弈論發(fā)展的未來方向進行了全方位的說明,系統(tǒng)分析了博弈論如何是如何發(fā)展的。
第二章預備知識定義1.1參與者[7]:一個博弈中的決策主體??梢允墙M織也可以是個人,其目的是使自身利益最大化。定義1.2行動[7]:參與者在博弈的某時刻的決策變量。定義1.3信息[7]:參與者有關(guān)博弈的知識。定義1.4共同知識[7]:“所有人參與者知道,所有參與者知道所有者知道,所有人參與者知道所有者參與人知道所有者參與人知道...”的信息。定義1.5策略(戰(zhàn)略)[7]:策略(戰(zhàn)略)是參與者在給定信息集的情況下的行動規(guī)則。定義1.6支付[7]:在博弈論中,支付或者是在一個特定的戰(zhàn)略組合下參與者得到的確定效用水平,或者是指參與者得到的期望效用水平。定義1.7結(jié)果[7]:博弈分析者所感興趣的所有東西,如均衡策略組合、均衡行動組合等。定義1.8均衡[7]:所有參與者的最優(yōu)策略組合。一般記為:定義1.9納什均衡[7]:有個參與人的戰(zhàn)略表達式,戰(zhàn)略組合是一個納什均衡,如果對于每一個,是給定其他參與人選擇的情況下第個參與人的最優(yōu)戰(zhàn)略,即:定義1.10子博弈精煉納什均衡[7]:擴展式表述博弈的戰(zhàn)略組合是一個子博弈精煉納什均衡,如果:(1)它是原博弈的納什均衡;(2)他在每一個子博弈給出納什均衡。定義1.11貝葉斯納什均衡[7]:人不完全信息靜態(tài)博弈的純策略貝葉斯納什均衡是一個類型依存戰(zhàn)略組合,其中每個參與人在給定自己的類型和其他參與人類型依存戰(zhàn)略的情況下,最大化自己的效用函數(shù)。換言之,戰(zhàn)略組合是一個貝葉斯納什均衡,如果對于所有的,定義1.12精煉貝葉斯納什均衡[7]:一個戰(zhàn)略組合和一個后驗概率組合,滿足:對于所有的參與人,在每一個信息集,是使用貝葉斯法則從先驗概率、觀測到的和最優(yōu)策略得到的(在可能的情況下)。
第三章主要結(jié)果3.1完全信息靜態(tài)博弈3.1.1納什均衡納什(JohnForbesNashJr,1928年6月13日—2015年5月23日)是一位著名的美國數(shù)學家以及經(jīng)濟學家,他不僅僅在博弈論做出了巨大貢獻,也在微分幾何以及偏微分方程等領(lǐng)域成就非凡。在他的下半生任教于普林斯頓大學時,他的博弈理論隨著時代的發(fā)展在經(jīng)濟學中得到了廣泛的應用,這也使他獲得了1994年諾貝爾經(jīng)濟學獎。2015年,他又因在非線性偏微分方程方面的工作而與路易斯·尼倫貝格(LouisNirenberg)共同獲得了阿貝爾獎。納什是迄今為止唯一同時獲得過諾貝爾經(jīng)濟學獎和阿貝爾獎的人。1959年,納什開始明顯出現(xiàn)精神病跡象,隨后花了數(shù)年在精神病院接受相關(guān)的精神治療。上世紀70年代之后,他成功克服病魔。并在在1980年代中期重返學術(shù)領(lǐng)域。這些傳奇經(jīng)歷后來成為了《美麗心靈》的原型。對于博弈論,納什所做出的巨大貢獻主要表現(xiàn)在兩方面:在合作博弈方面,他于1950年發(fā)表的論文
《TheBargainingProblem》中提出了討價還價模型;在非合作博弈方面,他貢獻非常巨大。他在1950所發(fā)表的論文《EquilibriumPointsinN-personGame》以及1951年所發(fā)表的論文《Non-cooperativeGames》中明確定義了非合作博弈,也隨之提出了非合作博弈的均衡解,并且使用數(shù)學方法嚴格證明了非合作博弈均衡解的存在性。這些巨大的貢獻奠定了非合作博弈的基礎(chǔ),也使得他在論文中所定義的均衡被后世的數(shù)學家、經(jīng)濟學家以及各種運用博弈論的學者稱之為納什均衡(Nashequilibrium)。下面,我們主要介紹納什在非合作博弈相關(guān)的理論,即納什均衡。首先需要介紹的是納什均衡的定義:不妨設(shè)博弈的參與者有n個,在明確其他任意博弈參與者的策略下,每一個參與者決定出自己的最優(yōu)策略,需要指明的是每個人的最優(yōu)策略可能與其他參與者的策略相關(guān),也可能與其他參與者的策略無關(guān),這樣所有參與者所選擇的策略一起構(gòu)成了一個策略組合(StrategyProfile)。納什均衡指的就是這樣一種策略組合,每一個參與者都采用的是最優(yōu)策略,即對于每個參與者來說,如果其他人不主動改變自身的策略,他就無法取得更大受益。換句話說:沒有人有積極性改變自己所選擇的策略。3.1.2納什均衡的例子及應用介紹納什均衡,其實不應該避開艾爾特.W.塔克所提出的囚徒困境,但考慮篇幅有限,本文主要介紹納什均衡的另外兩個例子:古諾寡頭博弈模型與豪泰林博弈模型,這兩個模型都是典型的納什均衡在經(jīng)濟學中的應用,但又早于納什均衡的提出,則這兩者既可以闡釋納什均衡,又可以揭示博弈論思想萌芽的出現(xiàn)。首先介紹古諾寡頭博弈模型,古諾(AntoineAugustinCournot,1801年8月28日—1877年3月31日)是法國著名的哲學家、數(shù)學家以及經(jīng)濟學家。1838年,他出版了不朽的巨作《財富理論的數(shù)學原理研究》(ResearchesontheMathematicalPrinciplesoftheTheoryofWealth),在這本書中,他首次將數(shù)學公式和符號應用到了實際的經(jīng)濟分析中,巧妙地給出了許多數(shù)學模型。但其超前的思想在當時不為當時的大多數(shù)經(jīng)濟學家所接受,甚至還受到批評。但這不妨礙多年后的今天,古諾的理論被廣泛應用,甚至被許多經(jīng)濟學家是現(xiàn)代經(jīng)濟分析的起點。下面我們要介紹的是這本著作中最廣為流傳的模型:古諾寡頭博弈模型。古諾寡頭博弈模型來源于古諾對兩個礦泉水生產(chǎn)企業(yè)的描述,基于如下的假設(shè):(1)企業(yè)數(shù)量大于等于2,所有企業(yè)都生產(chǎn)一樣的產(chǎn)品,即產(chǎn)品沒有實質(zhì)性差異。(2)企業(yè)之間不合作,即企業(yè)之間不溝通產(chǎn)量。(3)企業(yè)都具有市場影響力,即每個企業(yè)的產(chǎn)量多少都會影響產(chǎn)品的價格,(4)企業(yè)的數(shù)目是固定的,即不存在新企業(yè)進入。(5)企業(yè)在數(shù)量上競爭并且同時選擇數(shù)量。(6)企業(yè)為理性的,追求最大利益。我們討論兩個企業(yè)的情形:企業(yè)1、企業(yè)2,同時明確每個企業(yè)的策略是選擇生產(chǎn)多少數(shù)量的產(chǎn)品;支付是利潤,是關(guān)于兩個企業(yè)產(chǎn)量的函數(shù)。首先用表示企業(yè)的生產(chǎn)數(shù)量,其次用表示生產(chǎn)過程中的成本函數(shù),最后用表示逆需求函數(shù),需要說明的是是價格,表示原需求函數(shù)。則可以得到關(guān)于第個企業(yè)的利潤函數(shù)為:如果用來表示納什均衡的產(chǎn)量則有:在數(shù)學上尋找納什均衡的方法之一:求導,并找出其一階導數(shù)值為0的點:由此可以由上確定兩個反應函數(shù):納什均衡即為的交點,如下圖1:圖1從模型的介紹中我們可以清晰感受到古諾寡頭博弈模型中關(guān)于納什均衡的萌芽,其可以說得上是納什均衡有記載的最早版本。但遺憾的是古諾的工作被認作博弈論理論的先驅(qū)是在1955年才被Shubik發(fā)現(xiàn),就如同《財富理論的數(shù)學原理研究》的認同來得遲一樣,古諾對博弈論的貢獻獲得認可也姍姍來遲。下面開始介紹豪泰林(Hotelling)價格競爭模型,豪泰林(HaroldHotelling,1895年9月29日—1973年12月26日)是美國的數(shù)理統(tǒng)計學家和理論經(jīng)濟學家。他曾任教于斯坦福大學、哥倫比亞大學、北卡羅來納大學教堂山分校等大學。他最杰出的成就是開發(fā)主成分分析方法,這種方法被廣泛應用于金融、統(tǒng)計、計算機等領(lǐng)域。在去世前一年,因為其一生在各個領(lǐng)域杰出的貢獻,其被授予了NorthCarolinaAward。本文將介紹的豪泰林價格競爭模型就來自于他1929的論文《StabilityinCompetition》。豪泰林價格競爭模型是基于如下假設(shè)的:(1)城市為一條長度為1的線段,所有的居民均勻分布在這條線段上;(2)這條線段的兩端各分布著一家超市;(3)每家超市的商品是同質(zhì)的,成本為;(4)居民購買商品的單位旅游成本為;(5)在線段上存在一點,兩家超市對該點上居民無差異,該點往左的居民會選擇商店1,往右反之。用與表示超市的商品價格和可售出商品數(shù)量。我們可以簡化成如2圖的位置關(guān)系:圖2由假設(shè)(3)有:可解出:則商店分別售出的商品數(shù)量如下:可將兩家商店的利潤表示為:如古諾模型處理方法:則可得均衡價格:這兩個模型都是納什均衡在經(jīng)濟學中應用的典型案例,并且都早于納什均衡出現(xiàn),這說明了博弈論的出現(xiàn)與發(fā)展,并不是一個人的奇思妙想,而是來源于各種案例以及問題的積累。3.1.3相關(guān)均衡在納什均衡中,每個人都是獨立行動的,但在實際情況下,博弈策略的選擇可能有相關(guān)性的。比如:參與者1、參與者2兩位參與者,在博弈前一天約定根據(jù)明天的天氣情況來選擇策略。比如:晴天:參與者1選擇策略1、參與者2選擇策略2;陰天:參與者1選擇策略3、參與者2選擇策略4.這樣通過天氣的變化,他們之間的選擇就出現(xiàn)相關(guān)了。這就要引出奧曼的相關(guān)均衡來解決問題了。奧曼(Robert
John
Aumann,1930年6月8日-),是一位出生于德國的猶太人。在二戰(zhàn)期間期間逃亡美國,后在美國取得數(shù)學的學士、碩士、博士學位,成為了一位數(shù)學家、經(jīng)濟學家,因其在博弈論領(lǐng)域做出的卓越貢獻獲得了2005的諾貝爾經(jīng)濟學獎。他一生致力于研究博弈論,在博弈論領(lǐng)域做出過許多重大成果,如:博弈論中關(guān)于常識的第一個純形式的解釋、與勞埃德·沙普利(Lloyd
Shapley)合作研究了Aumann–Shapley值等。但他最廣泛傳播的成果1974年發(fā)表論文《Subjectivityandcorrelationinrandomizedstrategies》中提出的相關(guān)均衡。
在這篇論文中,奧曼證明了如果博弈參與人根據(jù)某個可以共同觀測的信號選擇行動,就會出現(xiàn)相關(guān)均衡,相關(guān)均衡可以使所有的博弈者受益。同時其中更為重要的是,奧曼還證明了在每個人收到不同但相關(guān)的信號下,每個人都可以去獲得更高的效用。為了解釋相關(guān)均衡可以是所有人受益,下面簡要介紹一個關(guān)于相關(guān)均衡的例子,假如博弈者1、2的支付矩陣如下:表1易得該博弈有三個納什均衡,其中兩個為(U,L)、(D,R)。在假設(shè)以相同的概率選擇純策略的情況下得到另一個混合策略納什均衡,且期望為2.5。不妨設(shè)博弈者1、博弈者2博弈前約定。如果明天下雨,博弈者1選擇L,博弈者2選擇U;如果明天未下雨,博弈者1選擇R,博弈者2選擇D。這種情況下,假定下雨與未下雨的概率都為,則雙方的期望:這就體現(xiàn)了,在相關(guān)均衡下,雙方都受益。3.2完全信息動態(tài)博弈上文介紹了納什均衡,但在納什均衡中還有三個問題沒有解決:首先,有相當部分博弈存在不止一個納什均衡;其次,在理想的納什均衡下,其他參與者的策略是確定的,這種預設(shè)在靜態(tài)的情況下成立,但實際上在動態(tài)情況下,會產(chǎn)生很大的變化;最后在納什均衡存在著不可置信的威脅。這些問題都困擾著當時的博弈論學家,直到子博弈精煉納什均衡的提出。3.2.1子博弈精煉納什均衡關(guān)于子博弈精煉納什均衡,首先需要介紹提出者:澤爾騰(ReinhardJustusReginaldSelten,1930年10月5日至2016年8月23日)是德國的著名經(jīng)濟學家,是1994年諾貝爾經(jīng)濟學獎的獲得者,也是德國的第一位獲得諾貝爾經(jīng)濟學獎的經(jīng)濟學家,也是持續(xù)多年的德國唯一一位獲得諾貝爾經(jīng)濟學獎的經(jīng)濟學家。他還以非合作博弈方面工作而聞名世界,被認為是實驗經(jīng)濟學的奠基人之一。
他一生都在致力于博弈論的研究,發(fā)表了許多著名的博弈領(lǐng)域論文,提出了許多博弈論領(lǐng)域的重要理論。如他在1975年于著名的論文《擴展式博弈精煉均衡概念的重新考察》提出"顫抖手均衡"(trembling
hand
equilibrium)的概念,給出了如何處理動態(tài)博弈中有限理性的方法,在后文關(guān)于不完全信息動態(tài)博弈中會進行更詳細的介紹。本節(jié)更加著重于介紹他于1965年論文《一個具有需求慣性的寡頭博弈模型》的子博弈精煉納什均衡(subgameperfeet
Nashe
quilibrinm)。在這篇論文中,澤爾騰主要的主要成果是,通過對動態(tài)博弈的分析,將納什均衡中包含的不可置信的威脅策略組合剔除,使得納什均衡最后得到的策略組合不再擁有不可置信的威脅。也就是,每一個參與者必須在任意一個時刻都是最優(yōu)的,這要求參與者要保持著策略的及時更替,而不是如納什均衡一樣保持著原有策略,變動策略既不是最優(yōu)策略的選擇。同時在數(shù)學意義上由于剔除了不可置信的威脅,使得求解過程中的納什均衡的個數(shù)減少,使得求解過程變得容易。這些成果進一步完善和推廣了納什均衡,使得博弈論的發(fā)展更加完善。3.2.2子博弈精煉納什均衡的模型及應用子博弈精煉納什均衡的模型有許多,比如交替出價的還價博弈模型、中國中央與地方以前的財政包干制博弈模型。出于形成與上文古諾寡頭博弈模型、豪泰林博弈模型的對比以及模型的經(jīng)典性。對于動態(tài)的寡頭市場產(chǎn)量博弈,本文選擇的是下來的斯塔克博格(Stackelberg)模型。斯塔克博格(Heinrich
Freiherr
von
Stackelberg,1905年10月31日—1946年10月12日)是德國著名的經(jīng)濟學家,他擅長的領(lǐng)域是博弈論和產(chǎn)業(yè)經(jīng)濟學。他在論文《MarketStructureEquilibrium》提出了斯塔克博格模型,并且以這個模型而廣泛聞名。對于斯塔克博格模型。我們首先進行如下假設(shè):(1)企業(yè)數(shù)量大于等于2,所有企業(yè)都生產(chǎn)一樣的產(chǎn)品,即產(chǎn)品沒有實質(zhì)性差異。(2)企業(yè)之間不合作,即企業(yè)之間不溝通產(chǎn)量。(3)企業(yè)都具有市場影響力,即每個企業(yè)的產(chǎn)量多少都會影響產(chǎn)品的價格,(4)企業(yè)的數(shù)目是固定的,即不存在新企業(yè)進入。(5)企業(yè)在數(shù)量上競爭并且同時選擇數(shù)量。(6)企業(yè)為理性的,追求最大利益。(7)企業(yè)有強有弱。我們?nèi)稳挥懻搩蓚€企業(yè)的情況,同時企業(yè)1位較強的企業(yè),企業(yè)2為較弱的企業(yè)。企業(yè)1先進行選擇,企業(yè)2后進行選擇,且企業(yè)2進行選擇時知道企業(yè)1的選擇。用表示企業(yè)的生產(chǎn)數(shù)量,其次用表示生產(chǎn)過程中的成本函數(shù),最后用表示逆需求函數(shù),也就是價格。企業(yè)1、企業(yè)2的利潤函數(shù)可以表示如下:使用逆向歸納法求解該問題,先將企業(yè)1的當作常數(shù)求解使的,即將問題轉(zhuǎn)化為:即:則:則企業(yè)1的利潤函數(shù)變?yōu)椋簩ζ髽I(yè)1的利潤函數(shù)求導,找導數(shù)零點:則:則子博弈精煉納什均衡的納什均衡結(jié)果如下:3.3不完全信息靜態(tài)博弈在上文介紹的納什均衡、子博弈精煉納什均衡中都有一個共同的假設(shè):完全信息,也就是參加博弈的每一個人都清楚地知道博弈的規(guī)則、博弈的結(jié)構(gòu)、博弈的函數(shù)等。換句話說,也就是參與者對博弈的信息沒有未知。但實際上博弈論中很多問題都是不完全信息的。在1967年之前是不完全信息的問題是沒有辦法解決的,數(shù)學家或者是經(jīng)濟學家都是束手無策的,直到海薩尼提出新的理論。3.3.1貝葉斯納什均衡海薩尼(JohnCharlesHarsanyi,1920年5月29日-2000年8月9日)是出生于\o"匈牙利"匈牙利布達佩斯,后定居于\o"美國"美國。他是一位著名\o"經(jīng)濟學家"經(jīng)濟學家,曾獲得1994年\o"諾貝爾獎獲得者"諾貝爾經(jīng)濟學獎。曾就讀于法國里昂大學,后來在故鄉(xiāng)的布達佩斯大學取得本科、博士學位。因其在博弈論以及博弈論在經(jīng)濟學的應用而聞名于世,尤其是他在分析不完全信息靜態(tài)博弈時,引入相關(guān)的貝葉斯理論,進行了高度創(chuàng)新。同時他在對博弈論在其他領(lǐng)域的交叉應用也做出了極大的貢獻,例如推動博弈論在政治、哲學的應用。他于1967年在管理科學(Management
Science)發(fā)表的論文《Gameswithincompleteinformationplayedby“Bayesian”players,I-III.》使得關(guān)于不完全信息的問題變得可以得到處理。他將概率論引入博弈論,同時在分析不完全信息靜態(tài)博弈時引入一個了假設(shè)的參與人:自然。同時對自然有一個附加條件:所有的博弈結(jié)果對自然都是沒有本質(zhì)區(qū)別的。然后自然首先行動,選擇每一個參與者的類型。然后對于任意一個參與者而言,自己的類型已知,其他參與者的類型未知,但知道各種可被選擇的類型的分布函數(shù)。即分布函數(shù)是共同知識。上述的轉(zhuǎn)化被命名為海薩尼轉(zhuǎn)化,這個轉(zhuǎn)化將不完全信息靜態(tài)博弈轉(zhuǎn)化為完全但不完美靜態(tài)信息博弈。這里的不完美主要可以解釋為:參與者知道了選擇的分布函數(shù),但對于自然的選擇卻一無所知。3.3.2貝葉斯納什均衡的例子及應用關(guān)于貝葉斯均衡的例子,為了突出不完全信息靜態(tài)博弈和完全信息靜態(tài)博弈的區(qū)別,本文選擇介紹不完全信息下的古諾模型。假設(shè)中除了企業(yè)生產(chǎn)成本發(fā)生變化,其余假設(shè)不變。對于生產(chǎn)成本的假設(shè)更換為:企業(yè)1的成產(chǎn)成本為,并且是企業(yè)1、企業(yè)2的共同知識。對于企業(yè)2的成本,可能有兩種情況或,企業(yè)2知道自己的成本,但企業(yè)1只知道分布,即表2:成本概率表2注:企業(yè)1、2同時做決策??梢詫⑵髽I(yè)1、2的利潤函數(shù)分布表示為:分別關(guān)于各自產(chǎn)量求導,尋找導數(shù)的零點得:則:對于企業(yè)2:則對于企業(yè)2的產(chǎn)量,企業(yè)1認為的最優(yōu)情況:為了方便對比不妨賦值,則有:3.4不完全信息動態(tài)博弈在上文中,我們總共介紹了完全信息靜態(tài)博弈、完全信息動態(tài)博弈、不完全信息靜態(tài)博弈。但實際上在生活中面對的情況是不完全信息,同時行動又有先后順序的,或者在后先動者也是可以觀察先行動者,來推斷他的喜好。這也是本文想介紹的最后一個博弈論模型:不完全信息動態(tài)博弈。對于這個問題許多博弈論學家提出解決方法,本文主要對精煉貝葉斯均衡進行介紹。3.4.1顫抖手均衡顫抖手均衡是由澤爾騰提出的,前文已經(jīng)對澤爾騰做過介紹,這里就不進行介紹。他是在1975年于著名的論文《AReexaminationofthePerfectnessConceptforEquilibriumPointsinExtensiveGames》提出"顫抖手均衡"(tremblinghandequilibrium)的概念,給出了如何處理動態(tài)博弈中有限理性的方法。顫抖手均衡主要的思想是:對于一個保持穩(wěn)定的納什均衡是可能會遭受某些極其微小的擾動,這些微小的擾動可能來自于人決策行動時出現(xiàn)的錯誤。如果出現(xiàn)這種錯誤的概率趨近0,而且這個過程中的均衡序列收斂,那么均衡序列的極限就是顫抖手均衡。換句話就是在納什均衡的下,博弈中有一個人手抖了一下,選擇的是次優(yōu)的策略,如果該納什均衡是顫抖手均衡,則博弈參與者會回到該均衡,而不是偏向另一個納什均衡。下面我們簡要介紹一個關(guān)于顫抖手均衡的例子:假設(shè)博弈者1、2的支付矩陣如表3:表3易得該博弈具有兩個納什均衡:(U,L)、(D,R)。當博弈處于(U,L)時,如果博弈者2手抖犯錯,將策略換為D,則其收益變?yōu)?。對于博弈者1來說,收益變?yōu)?,這是他是沒有更換策略的積極性的,若更換為R,收益沒有發(fā)生變化,還可能會遭遇博弈者2更換策略,收益變?yōu)?。但是對于博弈者2而言,更換策略的動機是易見的,只要更換策略為U,收益就會增加。然后博弈又回到了最初的狀態(tài)(U,L),這就是顫抖手均衡。但是如果博弈處于(D,R),博弈者1手抖犯錯,將策略換為L,對于自身收益造成影響,但是博弈者2的收益變?yōu)?,博弈者只有調(diào)整策略為U,才可增加收益。均衡變成(U,L),無法回到(D,R),則(D,R)不是一個納什均衡。3.4.2序貫均衡克雷普斯(David
M.Kreps,1950-)是美國斯坦福大學的著名教授,他是一位經(jīng)濟學家。他出生于美國紐約,曾就讀于達特茅斯學院、斯坦福大學等高校。在1989年榮獲John
Bates
Clark
Medal,也在2018年被授予John
J.Carty
Award。他以對動態(tài)選擇模型和非合作博弈論的研究而聞名。威爾遜(Robert
B.Wilson,1937年-),出生于內(nèi)布拉斯加州,博士就讀于哈佛大學,后一直執(zhí)教于斯坦福大學。在1994年獲選為美國國家科學院成員,后在2020年獲得諾貝爾經(jīng)濟學獎。威爾遜以其對管理科學和商業(yè)經(jīng)濟學的貢獻而聞名。他與斯坦福商學院的其他數(shù)理經(jīng)濟學家一起,使用非合作博弈理論幫助重新構(gòu)造了產(chǎn)業(yè)組織經(jīng)濟學和組織理論。他對非線性定價的研究影響了大公司的政策,尤其是在能源工業(yè)。序貫均衡提出于克瑞普斯和威爾遜共同發(fā)表的論文《SequentialEquilibrium》中,在這篇論文中,他們定義了序貫均衡,序貫均衡是一個行為策略—信念的組合。這要求:首先,策略必須是“序貫理性”,換句話說,可以理解為在后續(xù)出現(xiàn)的任意一個貝葉斯博弈當作構(gòu)成一個貝葉斯納什均衡。其次,信念的一致性,一列完全混合策略生成的信念的極限是這個信念。下面我們簡要介紹一個關(guān)于序貫均衡的例子:圖3圖3是博弈者1、2的博弈過程樹形圖。博弈者1先做出選擇,選擇有A、B、C,博弈者2再做出選擇,選擇有D、E,虛線表示博弈者2做出選擇時,不知道博弈者1做出了何種選擇,也是博弈者1的選擇不是共同知識。很容易可得到,博弈者1的最優(yōu)策略是選擇A,得到2的收益,博弈直接結(jié)束。但博弈的過程中出現(xiàn)錯誤,博弈者1未選擇A,然后博弈者2就需要開始考慮選擇何種策略。博弈者2知道博弈者1在B、C之間做出了選擇,但不知道何種選擇。如果博弈者1選擇B,博弈者2的最優(yōu)策略為E;如果博弈者1選擇C,博弈者2的最優(yōu)策略為D。如何做出選擇就要依靠博弈者2認為博弈者1做出對應選擇的概率為多少。如上圖,假設(shè)博弈者1選擇B的概率為,則選擇C的概率為可計算得到,博弈者2做出選擇對應收益的數(shù)學期望如下:根據(jù)收益的期望得到,當,博弈者2應選擇E;,應選擇D。等于時都可以。3.4.3精煉貝葉斯納什均衡精煉貝葉斯納什均衡(prefect
Bayesian
equilibrium)的主要成果是由弗登伯格和泰勒爾提出的。讓·弗登伯格(Drew
Fudenberg
,1957年—)出生于美國紐約,是美國哈佛大學經(jīng)濟系的著名教授。1981年,他取得了麻省理工學院的經(jīng)濟學博士學位。之后,他在博弈論和動態(tài)經(jīng)濟學方面做出了巨大貢獻。曾經(jīng)在加州大學伯克利分校、麻省理工學院、斯坦福大學和法國圖盧茲大學任教。他的廣泛研究涵蓋了博弈論的許多方面,包括均衡理論,博弈學習,進化博弈論以及在其他領(lǐng)域的許多應用。富登堡還是最早將博弈論分析應用到產(chǎn)業(yè)組織,討價還價理論和契約理論中的人之一。讓·泰勒爾(Jean
Tirole,1953年—)是法國圖盧茲大學的著名產(chǎn)業(yè)經(jīng)濟學教授,同時他也是巴黎大學、麻省理工學院的兼職教授,并且曾經(jīng)在哈佛大學、斯坦福大學擔任客座教授。他專注于產(chǎn)業(yè)組織、博弈論、銀行、金融等各種領(lǐng)域。2014年,他因?qū)κ袌隽α亢捅O(jiān)管的分析而被授予諾貝爾經(jīng)濟學獎。1978年,在獲得巴黎第九大學應用數(shù)學博士學位后,對經(jīng)濟學興趣油生,他來到著名的美國麻省理工學院繼續(xù)深造,并于1981年獲得經(jīng)濟學博士學位。精煉貝葉斯均衡出現(xiàn)在弗登伯格和泰勒爾于1991年年共同撰寫的《gametheory》中。在本書中詳細介紹了精煉貝葉斯均衡,精煉貝葉斯均衡的關(guān)鍵點是博弈的參與者可通過觀察其他參與者的行為來改變自己關(guān)于后面的參與者類型的主觀概率,并由此決定自己的策略。這個修正的過程就被稱之為貝葉斯規(guī)則。從數(shù)學觀點來說,精煉貝葉斯均衡就是一個關(guān)于映射的不動點。具體的理解可以理解為每一個博弈的參與者都預先假設(shè)其他博弈參與者是均衡策略。換句話說就是:它就是所有博弈參與者的滿足條件的信念與策略的結(jié)合。下面我們簡要介紹一個關(guān)于精煉貝葉斯納什均衡的例子:發(fā)布聲明博弈的一種情況,將博弈雙方分為聲明方、行為方,行為方不知道聲明方的聲明是否為真。設(shè)聲明方有兩種聲明類型:,行為方有兩種行為類型:,有支付矩陣如下表4。我們可發(fā)現(xiàn),的偏好是不同的,分別偏好于。聲明方與博弈方的偏好完全一致,這是一種非常好的情況,這種情況下信息傳遞非常有效,能夠更加良好的達到目的。表43.5合作博弈理論為了順應時代的發(fā)展,也為了得到更大的發(fā)展,在近30多年里,全球化、區(qū)域一體化、人類命運共同體、合作共贏等概念被逐漸推廣,雖然有的國家倒行逆施,企圖逆全球化,但這是歷史的規(guī)律,不容改變。在這個時代背景下,再以非合作博弈的相關(guān)理論分析問題,用個體理性選擇決策顯然已經(jīng)不是最優(yōu)解,取代之的是合作博弈理論。合作博弈與上文的非合作博弈并沒有先后之別,但合作博弈的發(fā)展緩慢,本文認為有兩方面的原因:首先是聚焦于博弈論的經(jīng)濟學家受到主流經(jīng)濟學的影響,主流經(jīng)濟學更多的時候是將問題的分析與經(jīng)濟落足于個人的。其次,就是沒有形成統(tǒng)一的框架,數(shù)學追求的美之一就是簡潔美,而在合作博弈理論一直沒有像非合作博弈領(lǐng)域形成統(tǒng)一的分析手段。這些影響了合作博弈理論的發(fā)展,但2005、2012年的諾貝爾經(jīng)濟學獎已經(jīng)預示著合作博弈時代的到來。下面我們具體闡述合作博弈理論的歷史。1928年馮·諾依曼提出了合作博弈中廣泛使用的特征函數(shù),比起合作博弈的概念早了許多。合作博弈的概念是在其1944年的《博弈論與信息經(jīng)濟學》一書中才明確提出的。而后在上世紀50年代,納什又將合作與非合作博弈進行了明確的區(qū)分:如果博弈的每一個參與者能夠事先達成具有約束力而且強制執(zhí)行的協(xié)議的博弈稱為合作博弈,反之即為非合作博弈。也同樣是在上世紀50年代,為了解決合作博弈求解的問題。吉利斯(DonaldB.Gillies,1928年10月15日—1975年7月17日),一位出生于加拿大的數(shù)學家、計算機學家,在其1953年的論文中引入“核”,但“核”的最早思想萌芽理應歸給Edgeworth,他1881提出合同曲線就是“核”最早的雛形。下面給出“核”的一個具體例子。不妨假設(shè)現(xiàn)有一開發(fā)商準備征地,征地的對象有A、B、C三人,A、B、C三人可能出現(xiàn)的聯(lián)盟情況以及收益如下表5:情況12345聯(lián)盟(A,B,C)(A,B),C(A,C),B(B,C),AA,B,C收益10060,4050,4050,4030,30,30表5容易得到該合作博弈的核就是情況2。這只是“核”非常簡單的應用,核在其他方面有著非常廣泛的應用。比如Shapley在1955年以及1959年發(fā)表的關(guān)于經(jīng)濟博弈的論文,這是“核”在經(jīng)濟學中的應用,也是最早的應用。雖然“核”具有很好的性質(zhì),但是時常會出現(xiàn)空集的情況,對于這個問題的處理方法來自于Shapley與Bondareva,被稱為Bondareva-Shapley定理,這是一個關(guān)于“核”的存在性的充分必要條件。下面介紹Shapley值,沙普利(LloydShapley,1923年6月2日—2016年3月12日)出生于馬薩諸塞州,是美國著名的經(jīng)濟學家與數(shù)學家,是2012年諾貝爾
溫馨提示
- 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
- 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預覽,若沒有圖紙預覽就沒有圖紙。
- 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
- 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負責。
- 6. 下載文件中如有侵權(quán)或不適當內(nèi)容,請與我們聯(lián)系,我們立即糾正。
- 7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。
最新文檔
- 全新網(wǎng)絡游戲開發(fā)合同2篇
- 2024-2025學年新教材高中歷史第八單元20世紀下半葉世界的新變化第19課資本主義國家的新變化課時作業(yè)含解析新人教版必修中外歷史綱要下
- 2025不動產(chǎn)登記信息化改造項目合同3篇
- 2025年微信小程序企業(yè)客戶關(guān)系管理系統(tǒng)開發(fā)與應用合同3篇
- 2024銷售人員職業(yè)發(fā)展保障勞動合同3篇
- 二零二五年度醫(yī)療設(shè)施臨時借款合同參考樣本4篇
- 2025高溫粘合劑產(chǎn)業(yè)鏈金融服務平臺合作合同3篇
- 2025年度電信設(shè)備知識產(chǎn)權(quán)保護合同3篇
- 2025年度食品行業(yè)退換貨質(zhì)量保證協(xié)議書
- 二零二五年度高層建筑樓頂廣告位使用權(quán)租賃合同3篇
- 臺資企業(yè)A股上市相關(guān)資料
- 電 梯 工 程 預 算 書
- 羅盤超高清圖
- 參會嘉賓簽到表
- 機械車間員工績效考核表
- 形式發(fā)票格式2 INVOICE
- 2.48低危胸痛患者后繼治療評估流程圖
- 人力資源管理之績效考核 一、什么是績效 所謂績效簡單的講就是對
- 山東省醫(yī)院目錄
- 云南地方本科高校部分基礎(chǔ)研究
- 廢品管理流程圖
評論
0/150
提交評論