版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進(jìn)行舉報(bào)或認(rèn)領(lǐng)
文檔簡介
1、博弈論與信息經(jīng)濟(jì)學(xué)第1頁,共110頁,2022年,5月20日,3點(diǎn)29分,星期二關(guān)于博弈論的某些光環(huán)博弈論很時髦,也有點(diǎn)神秘,誰懂博弈論,或在文章中使用博弈方法,似乎很有面子Why?因?yàn)樗詳?shù)學(xué)為基礎(chǔ),似乎不容易學(xué)懂它有廣泛的用途,但很直接有效的運(yùn)用似乎也不多見發(fā)展很快第2頁,共110頁,2022年,5月20日,3點(diǎn)29分,星期二這些光環(huán)的一點(diǎn)猜測性說明它曾經(jīng)很落寞,少數(shù)人自己玩得很高興它1994獲得諾貝爾獎了,好萊塢居然還拿納什的故事拍電影它來自數(shù)學(xué),對數(shù)學(xué)不太有感覺的人會覺得它很枯燥,而數(shù)學(xué)意識強(qiáng)的人卻覺得它很好玩還不夠成熟,因?yàn)樗爸卦诮ㄔO(shè)”我國的博弈論運(yùn)用還很落后,幾乎看不到高水平的運(yùn)
2、用第3頁,共110頁,2022年,5月20日,3點(diǎn)29分,星期二博弈論之“數(shù)學(xué)”的特征只是數(shù)學(xué)思維、數(shù)學(xué)符號,有些符號怪模怪樣,甚至不會讀,但很少有什么艱深的數(shù)學(xué)這里的符號比較麻煩,因?yàn)樗痛鷶?shù)中的純粹抽象而無意義的符號不同,在腦子里要時刻記得它們的實(shí)際意義但要熟悉這種簡捷、抽象的思維方式,記住這些符號的代表意義所以,一個比較有效的學(xué)習(xí)方法是重復(fù)第4頁,共110頁,2022年,5月20日,3點(diǎn)29分,星期二博弈論的開拓之功“開拓”一般具備什么特征?從學(xué)理看:新方法,新模式,新領(lǐng)域從功效看:新辦法,新答案博弈論兼有之新方法:不同主體之間數(shù)量比較和概率思想的結(jié)合新模式:經(jīng)驗(yàn)層次的一些“高妙手段”具
3、有邏輯剛性,并非巧合,如“囚徒困境”新領(lǐng)域:突破了傳統(tǒng)經(jīng)濟(jì)學(xué)的苛刻假設(shè),而且把觸角不客氣地伸到政治、管理、系統(tǒng)論等領(lǐng)域第5頁,共110頁,2022年,5月20日,3點(diǎn)29分,星期二博弈論在研究對象之特點(diǎn)上的根本不同通常的學(xué)問或理論體系都以“系統(tǒng)內(nèi)”為研究對象,如果研究多個主體之間的關(guān)系,也須納入一個框架之中。每個學(xué)科都有自己的“整體觀”顯然,這里有明顯的傳統(tǒng)科學(xué)理性的風(fēng)味。博弈論根本不同,它直接研究幾個在邏輯層次上并列的主體之間的關(guān)系。看似簡單的方法,其實(shí)開創(chuàng)了一個思路。它之所以不被廣泛應(yīng)用的一個猜測是:人們目前還不熟悉、不適應(yīng)這種多維的思維方式。第6頁,共110頁,2022年,5月20日,3
4、點(diǎn)29分,星期二博弈論在思維方式上的特點(diǎn)習(xí)見的思維方式:還原論:整體可無窮拆分為不同級別的個體目的論:事物的發(fā)展有其目標(biāo)其他事物不變博弈論思維方式歷史理性多元化、相對化、歷史化事物并不存在一種內(nèi)在的、永恒的、抽象的“本質(zhì)”,而只有一種在特定歷史框架中的建構(gòu)。對傳統(tǒng)經(jīng)濟(jì)學(xué)的啟發(fā):將研究對象轉(zhuǎn)向個體,放棄一些沒有微觀基礎(chǔ)的假設(shè),如消費(fèi)函數(shù)及其投資函數(shù),而在給出個人的支付函數(shù)及戰(zhàn)略空間的條件下,研究每個人都選擇其最優(yōu)戰(zhàn)略以最大化個人支付函數(shù)時將發(fā)生什么。第7頁,共110頁,2022年,5月20日,3點(diǎn)29分,星期二博弈論的學(xué)習(xí)特點(diǎn)很多人對博弈論有所期待,似乎它有很強(qiáng)的功效。的確,猶如數(shù)學(xué),力量很強(qiáng),
5、無處不在,作用非常廣泛而深刻,但學(xué)習(xí)的時候很枯燥因其與數(shù)學(xué)密切相關(guān),關(guān)于博弈論素養(yǎng)的提高要靠自己的學(xué)習(xí)、揣摩和領(lǐng)悟習(xí)薫悟化注重?cái)?shù)學(xué)的嚴(yán)謹(jǐn),注意基本功得魚忘筌,得意忘形第8頁,共110頁,2022年,5月20日,3點(diǎn)29分,星期二本課程的閱讀文獻(xiàn)張維迎博弈論與信息經(jīng)濟(jì)學(xué)為主要教材通俗讀物:王則柯博弈論平話、白波博弈游戲、潘天群博弈生存參考書籍:謝識予經(jīng)濟(jì)博弈論、姚國慶博弈論(南開),拉斯繆森博弈與信息(北大與三聯(lián))、弗登博格博弈論(人民大學(xué)),信息經(jīng)濟(jì)學(xué)(湖北)期刊文章:非常多,關(guān)于博弈論基本問題的文章自1995陸續(xù)發(fā)表。但我國直接研究博弈論理論的文章不多,應(yīng)用博弈論方法的文章非常多,但水平低第
6、9頁,共110頁,2022年,5月20日,3點(diǎn)29分,星期二0.導(dǎo)論:博弈論與經(jīng)濟(jì)學(xué)0.1博弈論與主流經(jīng)濟(jì)學(xué)的發(fā)展傳統(tǒng)經(jīng)濟(jì)學(xué)的局限以及博弈論對經(jīng)濟(jì)學(xué)的重要影響0.2基本內(nèi)容的概述非合作博弈的非技術(shù)性概述第10頁,共110頁,2022年,5月20日,3點(diǎn)29分,星期二0.1博弈論與主流經(jīng)濟(jì)學(xué)的發(fā)展傳統(tǒng)經(jīng)濟(jì)學(xué)的假設(shè)及其局限性二基本假設(shè):完全競爭,完美信息局限性:交易主體的數(shù)量其實(shí)很有限;信息是不對稱的一般均衡理論是整個經(jīng)濟(jì)學(xué)的理論基石和道義基礎(chǔ),市場機(jī)制是完美的,帕累托最優(yōu)成立,平等與效率可以兼顧。然而在以下情況不成立:非完全競爭:壟斷越來越普遍外部性:市場不可能把所有的成本收益都計(jì)算在內(nèi)公共產(chǎn)品
7、:市場無非解決“搭便車”問題逆向選擇問題:檸檬市場道德風(fēng)險問題:為什么市場的交易費(fèi)用比較高?百年來,經(jīng)濟(jì)學(xué)的主要發(fā)展圍繞以上五方面,如壟斷競爭理論、產(chǎn)業(yè)組織理論、企業(yè)理論、信息經(jīng)濟(jì)學(xué)、新制度經(jīng)濟(jì)學(xué)、不確定下的決策(投資理論),宏觀經(jīng)濟(jì)學(xué)第11頁,共110頁,2022年,5月20日,3點(diǎn)29分,星期二0.1博弈論與主流經(jīng)濟(jì)學(xué)的發(fā)展傳統(tǒng)微觀經(jīng)濟(jì)學(xué)與博弈論的比較傳統(tǒng)微觀經(jīng)濟(jì)學(xué)的個人決策是在給定一個價格參數(shù)和收入的條件下最大化自己的效用,個人的效用與其他人無涉,所有其他人的行為都被總結(jié)在“價格”參數(shù)之中博弈論中,個人效用不僅依賴于自己的選擇,還以來于他人的選擇,研究在存在外部經(jīng)濟(jì)條件下的個人選擇問題事
8、實(shí)上,行為主體的數(shù)量通常不多,相互之間存在明顯影響經(jīng)濟(jì)學(xué)對博弈論寄予厚望,認(rèn)為用博弈論可以重寫經(jīng)濟(jì)學(xué)原理博弈論改寫經(jīng)濟(jì)學(xué),從放寬新古典的完全競爭和完全信息兩個條件展開第12頁,共110頁,2022年,5月20日,3點(diǎn)29分,星期二0.1博弈論與主流經(jīng)濟(jì)學(xué)的發(fā)展國外經(jīng)濟(jì)學(xué)教科書改寫,加入大量博弈論內(nèi)容博弈論進(jìn)入主流經(jīng)濟(jì)學(xué),反映了:經(jīng)濟(jì)學(xué)的研究對象越來越轉(zhuǎn)向個體放棄了有些沒有微觀基礎(chǔ)的假設(shè)經(jīng)濟(jì)學(xué)的研究對象越來越轉(zhuǎn)向人與人之間行為的相互影響和作用經(jīng)濟(jì)學(xué)越來越重視對信息的研究傳統(tǒng)微觀經(jīng)濟(jì)學(xué)的工具是數(shù)學(xué)(微積分、線性代數(shù)、統(tǒng)計(jì)學(xué)),而博弈論是一種新的數(shù)學(xué)。以前只有陸軍,現(xiàn)在有了空軍,其差異不可以道里計(jì)第
9、13頁,共110頁,2022年,5月20日,3點(diǎn)29分,星期二0.1博弈論與主流經(jīng)濟(jì)學(xué)的發(fā)展博弈論研究的是:當(dāng)成果無法由個體完全掌握,而結(jié)局須視群體共同決策而定時,個人為了取勝,應(yīng)該采取什么策略博弈論成為通用方法論,經(jīng)濟(jì)學(xué)、政治學(xué)、管理、軍事、外交、國際關(guān)系、公共選擇、犯罪學(xué)“深藍(lán)”和“更深的藍(lán)”使用動態(tài)博弈理論編寫程序,后來戰(zhàn)勝了無敵的卡斯帕羅夫第14頁,共110頁,2022年,5月20日,3點(diǎn)29分,星期二0.2 博弈論要點(diǎn)著名案例囚徒困境prisoners dilemma個人理性最終導(dǎo)致集體理性的缺失第15頁,共110頁,2022年,5月20日,3點(diǎn)29分,星期二0.2 博弈論要點(diǎn)博弈:
10、決策主體在互相對抗中,對抗雙方(或多方)互相依存的一系列策略和行動的過程集合參與人的利益有沖突博弈是一個過程集合(參與人、策略、行動、信息等)。把博弈視為集合是思維從具體到抽象的重要一步博弈的一個本質(zhì)特征是策略的相互依存性博弈論:專門研究博弈如何出現(xiàn)均衡的規(guī)律的學(xué)問第16頁,共110頁,2022年,5月20日,3點(diǎn)29分,星期二0.2 博弈論要點(diǎn)博弈論的基本概念包括:參與人、行動、信息、戰(zhàn)略、支付函數(shù)、結(jié)果、均衡其中,參與人、行動、結(jié)果合稱博弈規(guī)則博弈有不同的種類:從行動順序角度:靜態(tài)博弈。參與人同時選擇行動動態(tài)博弈。參與人的行動有先后順序從擁有信息角度:完全信息博弈。每個參與人對所有其他參與
11、人的特征、戰(zhàn)略空間、支付函數(shù)有準(zhǔn)確的知識不完全信息博弈。第17頁,共110頁,2022年,5月20日,3點(diǎn)29分,星期二0.2 博弈論要點(diǎn)將二角度結(jié)合,博弈有四種:完全信息靜態(tài)博弈完全信息動態(tài)博弈不完全信息靜態(tài)博弈不完全信息動態(tài)博弈第18頁,共110頁,2022年,5月20日,3點(diǎn)29分,星期二博弈論模型GP,A,S,I,U 一個博弈需要有五方面內(nèi)容組成:參與人、行動、信息、結(jié)果P:為局中人,能夠獨(dú)立決策,獨(dú)立承擔(dān)責(zé)任的個人或組織,以最終實(shí)現(xiàn)自身利益最大化為目標(biāo)。A:各局中人的所有可能的策略或行動的集合。分為有限博弈和無限博弈,后者表現(xiàn)為連續(xù)對策、重復(fù)博弈和微分對策等。 S:博弈的進(jìn)程或次序。
12、分為靜態(tài)博弈和動態(tài)博弈。第19頁,共110頁,2022年,5月20日,3點(diǎn)29分,星期二I:博弈信息,能夠影響最后博弈結(jié)局的所有局中人的情報(bào)。信息在博弈中占重要地位,博弈的贏得很大程度上依賴于信息的準(zhǔn)確度與多寡。如果各方對各種局勢下所有局中人的得益狀況完全清楚,稱為完全信息博弈。反之為不完全信息博弈。在動態(tài)博弈中還有一類信息:輪到行動的博弈方是否完全了解此前對方的行動。如果完全了解則稱之為“具有完美信息”的博弈。反之稱為“不完美信息的動態(tài)博弈”。由于信息不完美,博弈的結(jié)果只能是概率期望,而不能像完美信息博弈那樣有確定的結(jié)果。 U:為局中人獲得利益,也是博弈各方追求的最終目標(biāo)。分為零和博弈和變和
13、博弈。零和博弈中各方利益之間是完全對立的。變和博弈有可能存在合作關(guān)系,爭取雙贏的局面。第20頁,共110頁,2022年,5月20日,3點(diǎn)29分,星期二0.2.1 完全信息靜態(tài)博弈:納什均衡設(shè)有兩個人一起玩游戲,每個人都有不同的策略,誰都希望自己出“高招”使自己獲勝(即尋求效用的最大化),但獲勝并不完全依賴于自己的行為能力,還依賴于對手怎么做。有時,雙方會形成這樣一種狀態(tài):我的最好策略所依賴的條件就是你的最好策略。換言之:如果你那樣做,我這樣最好,而你“那樣”做恰恰又是你的最佳策略。通俗地講:如果別人不動,我也不能動第21頁,共110頁,2022年,5月20日,3點(diǎn)29分,星期二0.2.1 完全
14、信息靜態(tài)博弈:納什均衡假設(shè)n個人參與博弈,給定其他人戰(zhàn)略的條件下,每個人選擇自己的最優(yōu)戰(zhàn)略。納什均衡指的是“由所有參與人的最優(yōu)戰(zhàn)略組成的一個組合”幾個人制訂了一個協(xié)議,這幾個人是否能自愿遵守?他們會自覺遵守,這個協(xié)議就構(gòu)成一個納什均衡。如果一個協(xié)議不構(gòu)成納什均衡,它就不可能自動實(shí)施,需要外力脅迫,這就無所謂“協(xié)議”第22頁,共110頁,2022年,5月20日,3點(diǎn)29分,星期二Nash EquilibriumA Nash equilibrium, named after John Nash, is a set of strategies, one for each player, such t
15、hat no player has incentive動機(jī) to unilaterally單方面change her action. Players are in equilibrium if a change in strategies by any one of them would lead that player to earn獲得 less than if she remained保持 with her current strategy. For games in which players randomize (mixed strategies), the expected or
16、average payoff must be at least as large as that obtainable能得到的 by any other strategy. 納什均衡,一個策略集合,其中每個參與人沒有動機(jī)去但方面地改變自己的行為。任何一個人改變策略都會獲得更少,這就是納什均衡。對于隨機(jī)化的參與人,期望或平均支付至少與其他任何策略一樣大第23頁,共110頁,2022年,5月20日,3點(diǎn)29分,星期二0.2.1 完全信息靜態(tài)博弈:納什均衡納什均衡的重要性:任何“合理”結(jié)果都要滿足的條件當(dāng)某一局中人發(fā)現(xiàn)他單方面改變戰(zhàn)略可以獲取更多時,他會毫不猶豫地改變自己的戰(zhàn)略,博弈自然就沒有達(dá)到均
17、衡一種制度安排要發(fā)生效力,必須是納什均衡,否則,這種制度安排就沒有效力第24頁,共110頁,2022年,5月20日,3點(diǎn)29分,星期二0.2.1 完全信息靜態(tài)博弈:納什均衡囚徒困境的幾個事例:價格大戰(zhàn)兩個寡頭企業(yè)選擇產(chǎn)量公共產(chǎn)品的供給軍備競賽做廣告圍觀時踮腳尖應(yīng)試教育污染。1968年,格雷特哈丁成功地將“囚徒的困境”與資源耗竭結(jié)合起來 , 揭示了生態(tài)環(huán)境問題與囚徒困境的相似之處。貿(mào)易自由與壁壘,地方保護(hù)主義第25頁,共110頁,2022年,5月20日,3點(diǎn)29分,星期二0.2.1 完全信息靜態(tài)博弈:納什均衡個人理性與集體理性的沖突,各人追求利己行為而導(dǎo)致的最終結(jié)局是一個“納什均衡”,也是對所有
18、人都不利的結(jié)局。從“納什均衡”引出“看不見的手” 的一個悖論:從利己目的出發(fā),結(jié)果損人不利己。“納什均衡”提出的悖論動搖了經(jīng)濟(jì)學(xué)的基石。從“納什均衡”還可以悟出:合作是有利的“利己策略”,但它必須符合以下黃金律:按照你愿意別人對你的方式來對別人,但只有他們也按同樣方式行事才行。也就是 “己所不欲勿施于人”。第26頁,共110頁,2022年,5月20日,3點(diǎn)29分,星期二占優(yōu)戰(zhàn)略均衡:不論其他人采取什么策略,A之某策略的payoff總是最高,即為“占優(yōu)戰(zhàn)略”(dominant-strategy)。如果一個博弈的某個策略組合中的所有策略都是各方的上策,那么這個策略組合將是所有人都愿意選擇的,必然是
19、比較穩(wěn)定的結(jié)果,這是“占優(yōu)戰(zhàn)略均衡”(dominant-strategy equilibrium)。反映了所有人的絕對偏好,因此十分穩(wěn)定。但這種情況較少見。劃線法:橫向,如果“列”選中一個策略,在我的最佳策略下劃線;縱向,如果“行”選中一個策略,在我的最佳策略下劃線。某個策略組合中的兩個支付之下都有橫線,此即較為可能的解。如果這種解只有一組,此即上策均衡。(參見謝識予p.61)0.2.1 完全信息靜態(tài)博弈:納什均衡基本分析思路和方法第27頁,共110頁,2022年,5月20日,3點(diǎn)29分,星期二例2:圈豬博弈(boxed pigs)0.2.1 完全信息靜態(tài)博弈:納什均衡小豬按 等待大豬按等待5
20、,-14,49,-10,0第28頁,共110頁,2022年,5月20日,3點(diǎn)29分,星期二例3:性別戰(zhàn)(battle of sexes)女足球 芭蕾男足球芭蕾2,10,00,01,20.2.1 完全信息靜態(tài)博弈:納什均衡先動優(yōu)勢所形成的“解”形成的機(jī)會第29頁,共110頁,2022年,5月20日,3點(diǎn)29分,星期二例4:斗雞博弈(chicken game)(膽小鬼博弈)0.2.1 完全信息靜態(tài)博弈:納什均衡B進(jìn) 退A進(jìn)退-3,-32,00,20,0第30頁,共110頁,2022年,5月20日,3點(diǎn)29分,星期二例5:進(jìn)入阻撓(entry deterrance)0.2.1 完全信息靜態(tài)博弈:納什
21、均衡在位者默許 斗爭進(jìn)入者進(jìn)入不進(jìn)入40,50-10,00,3000,300第31頁,共110頁,2022年,5月20日,3點(diǎn)29分,星期二可能存在多個納什均衡,如果某種情況不可能出現(xiàn)(如,不可信的威脅),則可剔除之。精煉,縮小了“解”的個數(shù)如果是動態(tài)博弈,從每一個行動選擇開始到博弈結(jié)束又構(gòu)成一個博弈,即“子博弈”精煉納什均衡:當(dāng)只當(dāng)參與人的戰(zhàn)略在每一個子博弈中都構(gòu)成納什均衡承諾行動:當(dāng)事人使自己的威脅變得可信的行動0.2.2 完全信息動態(tài)博弈:子博弈精煉納什均衡第32頁,共110頁,2022年,5月20日,3點(diǎn)29分,星期二很多時候,參與人并不清楚對手的偏好、戰(zhàn)略空間、各種組合下的利潤水平,
22、即,只擁有不完全信息。每個人知己于必然,知人于或然引入一個虛擬的參與人:自然。它選擇了參與人的特征類型。海薩尼轉(zhuǎn)換。完全但不完美信息博弈。因?yàn)槭共┺姆治龀蔀榭赡?,故稱“完全”,但所知不確,故“不完美”給定自己的類型和別人的類型的概率分布的情況下,每個參與人的期望效用達(dá)到最大。0.2.3 不完全信息靜態(tài)博弈:貝葉斯-納什均衡第33頁,共110頁,2022年,5月20日,3點(diǎn)29分,星期二貝葉斯統(tǒng)計(jì)簡介經(jīng)典統(tǒng)計(jì)學(xué)需要兩種信息:總體和樣本貝葉斯統(tǒng)計(jì)加入了“先驗(yàn)信息”,來源于經(jīng)驗(yàn)和歷史資料。其統(tǒng)計(jì)分布為“先驗(yàn)分布”Bayes T. R. 17021761。有貝葉斯公式貝葉斯學(xué)派的基本觀點(diǎn):任一未知量都
23、可看作隨機(jī)變量,可用一個概率分布去描述它,這個分布稱為“先驗(yàn)分布”。任意未知量都有不確定性,因此非常適合用概率來表達(dá)第34頁,共110頁,2022年,5月20日,3點(diǎn)29分,星期二后行動者可以通過觀察而增加對先行者的了解,再修正其主觀判斷,并由此選擇自己的行動。先行者知道自己的行為會被他人利用,就會設(shè)法傳遞有利信息。博弈過程是不僅是參與人選擇行動的過程,還是不斷學(xué)習(xí)的過程。精煉貝葉斯均衡要求:給定其他參與人類型的信念,參與人的策略在每一個信息集開始的“后續(xù)博弈”上構(gòu)成貝葉斯-納什均衡,而且在所有可能的情況下,參與人要根據(jù)觀察結(jié)果來修正對其他參與人的信念,據(jù)此選擇自己的最優(yōu)化行為。0.2.3 不
24、完全信息動態(tài)博弈:精煉貝葉斯均衡第35頁,共110頁,2022年,5月20日,3點(diǎn)29分,星期二1.1博弈論的基本概念及戰(zhàn)略式表述1.2納什均衡1.3納什均衡應(yīng)用舉例1.4混合戰(zhàn)略納什均衡1.5納什均衡的存在性與多重性 1 完全信息靜態(tài)博弈第36頁,共110頁,2022年,5月20日,3點(diǎn)29分,星期二1.1博弈論的基本概念及戰(zhàn)略式表述1.1.1基本概念參與人 i=1,2,n N表示自然行動。ai表示第i個參與人的一個特定行動 Ai=ai表示可供i個選擇的所有行動的集合 n人博弈中,n個參與人行動的有序集a稱為“行動組合”信息完美信息:某個信息集只有1個值完全信息:自然不首先行動或其初始行動為
25、所有參與人知道共同知識第37頁,共110頁,2022年,5月20日,3點(diǎn)29分,星期二1.1博弈論的基本概念及戰(zhàn)略式表述1.1.1基本概念戰(zhàn)略s:參與人在給定信息集時的行動規(guī)則靜態(tài)博弈中,戰(zhàn)略等同于行動戰(zhàn)略必須是完備的支付u。u=ui(s1, ,si, sn)結(jié)果均衡s*=(s1*, ,si*, sn*)均衡:一種所有動作的影響都互相抵消,整個系統(tǒng)處于平穩(wěn)的、均勢的、不變的狀態(tài)第38頁,共110頁,2022年,5月20日,3點(diǎn)29分,星期二ui(si*,s-i) ui(si,s-i)si si*是數(shù)理邏輯符號,全稱量詞,讀作“對于全部”或“對于每一個”Universal quantifier,
26、read for all or for every第39頁,共110頁,2022年,5月20日,3點(diǎn)29分,星期二1.1博弈論的基本概念及戰(zhàn)略式表述1.1.2博弈的戰(zhàn)略式表述G博弈的參與人集合每個人的戰(zhàn)略空間每個人的支付函數(shù)如果:參與人個數(shù)有限,每個參與人的戰(zhàn)略有限,則為“有限博弈”兩人有限博弈的戰(zhàn)略式表述可以用矩陣表示第40頁,共110頁,2022年,5月20日,3點(diǎn)29分,星期二納什均衡是完全信息靜態(tài)博弈的一般概念,也是所有其他類型博弈的基本要求1.2.1占優(yōu)戰(zhàn)略均衡占優(yōu)戰(zhàn)略均衡的定義p.59如果所有參與人都有占優(yōu)戰(zhàn)略存在,則占優(yōu)戰(zhàn)略均衡是可以預(yù)測到的惟一的均衡1.2 納什均衡第41頁,共
27、110頁,2022年,5月20日,3點(diǎn)29分,星期二占優(yōu)戰(zhàn)略均衡是非常合理的預(yù)測,但經(jīng)常不存在,這才是博弈論真正的用武之地1.2.2重復(fù)剔除的占優(yōu)戰(zhàn)略均衡智豬博弈中,沒有占優(yōu)戰(zhàn)略均衡首先找出某個參與人的劣戰(zhàn)略,剔除之,再找,再剔除,直到最后的一個劣戰(zhàn)略、占優(yōu)戰(zhàn)略的定義p.62弱占優(yōu)戰(zhàn)略的定義p.63重復(fù)剔除的占優(yōu)均衡的定義p.631.2 納什均衡第42頁,共110頁,2022年,5月20日,3點(diǎn)29分,星期二1.2.3納什均衡很多博弈無法使用重復(fù)剔除的方法找到均衡解定義p.69沒有任何一個戰(zhàn)略嚴(yán)格優(yōu)于納什均衡戰(zhàn)略(嚴(yán)格優(yōu),大于,不包括等于)強(qiáng)納什均衡p.711.2 納什均衡第43頁,共110頁
28、,2022年,5月20日,3點(diǎn)29分,星期二1.3.1古諾寡頭競爭模型兩個寡頭企業(yè),市場總產(chǎn)量為Q=q1+q2。市場出清價格P是市場總產(chǎn)量的函數(shù)P=P(Q)=8-Q。假設(shè)生產(chǎn)無固定成本,且每增加一單位產(chǎn)量的邊際成本c相等=2,則其成本分別為2q1、2q2 ,他們同時選擇產(chǎn)量利潤:u1=q1(Q)-c1q1=q18-(q1+q2)-2q1=6q1-q1q2-q12u2=q2(Q)-c2q2=q28-(q1+q2)-2q2=6q2-q1q2-q22可以尋找納什均衡:只要兩方的一個策略組合(q1*,q2*)相互是對方的最佳對策,就構(gòu)成一個納什均衡,如果再可以證明它是惟一的,則可以預(yù)言博弈的解可直接根
29、據(jù)定義來尋找1.3 納什均衡應(yīng)用舉例第44頁,共110頁,2022年,5月20日,3點(diǎn)29分,星期二(q1*,q2*)必須是最大值解得均衡產(chǎn)量為q1*=q2*=2策略組合(2,2)是惟一的納什均衡市場最終產(chǎn)量為2+2=4,價格為8-4=4雙方各自利潤2(8-4)-22=4如果只有一家廠商,總得益U=P(Q)-cQ= Q(8-Q)-2Q=6Q-Q2。其最大產(chǎn)量為6-2Q=0,即Q=3,而得益為9。高于各自產(chǎn)量為2時的總得益8。第45頁,共110頁,2022年,5月20日,3點(diǎn)29分,星期二1.3.2 Hotelling價格競爭模型1.3.3 公共地的悲劇1.3.4 公共物品的私人自愿供給基礎(chǔ)設(shè)施
30、建設(shè):中央政府與地方政府之間的博弈1.3 納什均衡應(yīng)用舉例第46頁,共110頁,2022年,5月20日,3點(diǎn)29分,星期二1.4 混合戰(zhàn)略納什均衡有些博弈不存在(純策略的)納什均衡社會福利博弈之例:不存在納什均衡猜謎游戲之例:不存在納什均衡B正面 反面A正面反面-1,11,-11,-1-1,1流浪漢找工作 游蕩政府救濟(jì)不救濟(jì)3,2-1,3-1,10,0第47頁,共110頁,2022年,5月20日,3點(diǎn)29分,星期二設(shè)流浪漢找工作的概率為p,則游蕩為1-p政府的支付:當(dāng)政府救濟(jì),政府得到3p-(1-p)=4p-1當(dāng)政府不救濟(jì),政府得到-p+0=-p流浪漢應(yīng)比較兩種策略:4p-1-p,p0.2或者
31、4p-1-p,p3q, q0.5第48頁,共110頁,2022年,5月20日,3點(diǎn)29分,星期二1.4 混合戰(zhàn)略納什均衡純戰(zhàn)略:參與人在每一個給定信息的情況下只選擇一個特定的行動混合戰(zhàn)略:參與人在每一個給定信息的情況下以某種概率分布隨機(jī)地選擇不同的行動純戰(zhàn)略可視為混合戰(zhàn)略的特例以混合策略為對象,重新定義效用函數(shù),即期望效用函數(shù)p101再定義納什均衡p102103“流浪漢”的納什均衡:政府以0.5救濟(jì),流浪漢以0.2找工作第49頁,共110頁,2022年,5月20日,3點(diǎn)29分,星期二1.4 混合戰(zhàn)略納什均衡一個參與人使用混合策略的好處是給對方造成不確定性,渾水摸魚海薩尼對混合戰(zhàn)略的解釋:混合戰(zhàn)
32、略等價于不完全信息下的純戰(zhàn)略均衡如稅收檢查,檢查則不偷稅,不檢查則偷稅。但稅務(wù)局檢查有成本,企業(yè)在知道稅務(wù)局可能檢查的情況下,偷稅有風(fēng)險。此時,可以根據(jù)某些參數(shù)尋找一個混合策略的納什均衡幾乎所有優(yōu)先博弈都有優(yōu)先奇數(shù)個納什均衡。如果一個博弈有兩個純戰(zhàn)略納什均衡,那么,一定存在第三個混合戰(zhàn)略納什均衡第50頁,共110頁,2022年,5月20日,3點(diǎn)29分,星期二1.5 納什均衡的存在性和多重性的討論納什均衡的存在性p113圖X本來是一組自變量,每一個自變量都有一些取值,必然存在一點(diǎn),使每個人的選擇所形成的結(jié)果等于自己在這一點(diǎn)上所期望的結(jié)果。在這一個點(diǎn)上,所有人的選擇重合為一個相同的點(diǎn)。需要理解兩點(diǎn)
33、:多個自變量的取值至少在一個點(diǎn)上是重合的;這個點(diǎn)上每個人都沒有偏離自己的規(guī)律(符合自己在此種選擇下的意愿)如果有人不選擇這一點(diǎn)的取值,則有可能不形成這個點(diǎn)每個自變量都符合自己的規(guī)律第51頁,共110頁,2022年,5月20日,3點(diǎn)29分,星期二1.5 納什均衡的存在性和多重性的討論納什均衡的多重性最令人無奈的是可能存在多個納什均衡,仍然存在不穩(wěn)定性你預(yù)測出現(xiàn)這個納什均衡,因而有相應(yīng)選擇,我卻以為會出現(xiàn)另一個,乃有我的選擇,此時的組合可能并不構(gòu)成納什均衡當(dāng)一個博弈有多個納什均衡時,博弈論并沒有一個一般的理論注明納什均衡結(jié)果一定會出現(xiàn)??梢岳猛庠诘男畔⑦_(dá)到納什均衡,如性別戰(zhàn)Cheap talk也
34、可能促成納什均衡重復(fù)博弈也有可能促成納什均衡但以上情況并不保證必然出現(xiàn)納什均衡第52頁,共110頁,2022年,5月20日,3點(diǎn)29分,星期二2 完全信息動態(tài)博弈不能同時選擇和行動的博弈是動態(tài)博弈Dynamic Games,后行動者可以先觀察別人的行動,自己再選擇本章討論完全信息下的動態(tài)博弈第53頁,共110頁,2022年,5月20日,3點(diǎn)29分,星期二2.1 博弈的擴(kuò)展式表述擴(kuò)展式表述所“擴(kuò)展”的主要是參與人的戰(zhàn)略空間戰(zhàn)略式表述簡單地給出參與人有些什么戰(zhàn)略可以選擇,而擴(kuò)展式表述要給出每個戰(zhàn)略的動態(tài)描述:誰在什么時候行動,每次行動時有些什么具體行動方案可供選擇,以及知道些什么此時的戰(zhàn)略:如果你
35、這樣,我將怎樣第54頁,共110頁,2022年,5月20日,3點(diǎn)29分,星期二2.1 博弈的擴(kuò)展式表述要素:參與人集合參與人的行動順序參與人的行動空間參與人的信息集參與人的支付函數(shù)外生事件(即“自然”的選擇)的概率分布第55頁,共110頁,2022年,5月20日,3點(diǎn)29分,星期二2.1 博弈的擴(kuò)展式表述博弈樹的基本元素:結(jié)、枝、信息集需要注意的概念:前列集、后續(xù)集;初始結(jié)、決策結(jié)、終點(diǎn)結(jié);直接前列結(jié)、直接后續(xù)結(jié)。以及相應(yīng)的符號信息集:某個參與人都知道些什么信息集是用來標(biāo)注某個人知道些什么信息的,不同的標(biāo)注表示這個人知道不同的信息p142第56頁,共110頁,2022年,5月20日,3點(diǎn)29分
36、,星期二2.1 博弈的擴(kuò)展式表述如果博弈樹的所有信息集都是單結(jié)的,則稱為“完美信息博弈”,沒有任何兩個決策結(jié)是用虛線連起來的自然信息集總是假設(shè)為單結(jié)的博弈樹上是否出現(xiàn)連接不同決策結(jié)的虛線取決于如何劃決策結(jié)的順序p145一個參與人在決策之前所適當(dāng)?shù)氖虑楸仨毘霈F(xiàn)在該參與人的決策結(jié)之前有了信息集的概念,擴(kuò)展式表述也可用來表述靜態(tài)博弈第57頁,共110頁,2022年,5月20日,3點(diǎn)29分,星期二2.2 擴(kuò)展式表述博弈的納什均衡需求大,開發(fā)者利潤8千萬,不開發(fā)者利潤0。需求大,兩者都開發(fā)利潤各為4千萬。需求小,開發(fā)者利潤1千萬,不開發(fā)者利潤0。需求小,兩者都開發(fā)利潤各為-3千萬兩者都不開發(fā)利潤各為0。
37、博弈樹:房地產(chǎn)開發(fā)博弈IA 開發(fā) 不開發(fā) 大 小 大 小開發(fā) 不開發(fā) 開 不開 開 不開 開 不開 (4,4) (8,0) (-3,-3) (1,0) (0,8) (0,0) (0,1) (0,0) N1 N2 B1 B2 B3 B4第58頁,共110頁,2022年,5月20日,3點(diǎn)29分,星期二博弈樹:不允許的情形第59頁,共110頁,2022年,5月20日,3點(diǎn)29分,星期二結(jié)(nodes):枝(branches):信息集(information sets):博弈樹的結(jié)構(gòu)包括決策結(jié)和終點(diǎn)結(jié)。決策結(jié)是參與人采取行動的時點(diǎn);終點(diǎn)結(jié)是博弈行動路徑的終點(diǎn)。枝是從一個決策結(jié)到它的直接后續(xù)結(jié)的連線,每
38、一個枝代表參與人的一個行動選擇。一個信息集是決策結(jié)集合的一個子集(信息集是由決策結(jié)構(gòu)成的集合),該子集包括所有滿足下列條件的決策結(jié):(1)每一個決策結(jié)都是同一個參與人的決策結(jié)(2)該參與人知道博弈進(jìn)入該集合的某個決策結(jié),但不知道自己究竟處于哪一個決策結(jié)。第60頁,共110頁,2022年,5月20日,3點(diǎn)29分,星期二信息集:房地產(chǎn)博弈IIA 開發(fā) 不開發(fā) 大 小 大 小開發(fā) 不開發(fā) 開 不開 開 不開 開 不開 (4,4) (8,0) (-3,-3) (1,0) (0,8) (0,0) (0,1) (0,0) N1 N2 B1 B2 B3 B4第61頁,共110頁,2022年,5月20日,3點(diǎn)
39、29分,星期二信息集:房地產(chǎn)博弈IIIA 開發(fā) 不開發(fā) 大 小 大 小開發(fā) 不開發(fā) 開 不開 開 不開 開 不開 (4,4) (8,0) (-3,-3) (1,0) (0,8) (0,0) (0,1) (0,0) N1 N2 B1 B2 B3 B4第62頁,共110頁,2022年,5月20日,3點(diǎn)29分,星期二信息集:房地產(chǎn)博弈IVN 大 小 開 不開 開 不開開發(fā) 不開發(fā) 開 不開 開 不開 開 不開 (4,4) (8,0) (0,8) (0,0) (-3,-3) (1,0) (0,1) (0,0) B1 B2 A1 A2 A3 A4第63頁,共110頁,2022年,5月20日,3點(diǎn)29分,
40、星期二幾個符號的意義第i個人的信息集為Hi,其中某特定信息集為hi,在hi的情況下會有A(hi)的行動。他的所有信息集所對應(yīng)的所有行動A(hi)的集合為Ai,表示聚合第i個人有信息H,乃有行動A此時的戰(zhàn)略是S(而且是純戰(zhàn)略,以后用其他字母表示“不純”戰(zhàn)略)maps into第64頁,共110頁,2022年,5月20日,3點(diǎn)29分,星期二153頁第二段:“每一個純戰(zhàn)略都是從信息集到行動集的一個映射,Si可以表示為在每一個信息集hi上的行動空間A(hi)的笛卡兒積”每一個純戰(zhàn)略都是原因現(xiàn)象依某種對應(yīng)關(guān)系所導(dǎo)致的惟一結(jié)果現(xiàn)象 (信息集可視為自變量,行動集可視為因變量) ,純戰(zhàn)略的集合Si就是行動空間
41、A(hi)中各種行動的交叉乘積第65頁,共110頁,2022年,5月20日,3點(diǎn)29分,星期二完美信息博弈&不完美信息博弈一個信息集可能包含多個決策結(jié),也可能只包含一個決策結(jié)。只包含一個決策結(jié)的信息集稱為單結(jié)信息集;如果博弈樹的所有信息集都是單結(jié)的,該博弈稱為完美信息博弈(Game of perfect information);否則就是不完美信息博弈。2.3子博弈精煉納什均衡第66頁,共110頁,2022年,5月20日,3點(diǎn)29分,星期二2.3子博弈精煉納什均衡可信性問題子博弈和逆向歸納法子博弈精煉納什均衡應(yīng)用舉例有同時選擇的兩階段動態(tài)博弈第67頁,共110頁,2022年,5月20日,3點(diǎn)2
42、9分,星期二可信性:開金礦博弈甲在開采一價值4萬元的金礦時缺1萬元資金,而乙正好有1萬元資金可以投資。甲希望乙能將1萬元資金借給自己用于開礦,并許諾在采到金子后與乙對半分成,乙是否該將錢借給甲呢?參見謝識予p128第68頁,共110頁,2022年,5月20日,3點(diǎn)29分,星期二開金礦I無法律的博弈 乙 甲 借 不借 分 不分 (2,2) (0,4) (1,0)第69頁,共110頁,2022年,5月20日,3點(diǎn)29分,星期二開金礦II有法律保障的博弈 乙 甲 借 不借 分 不分 (2,2) 打 不打 (1,0) (0,4) (1,0)第70頁,共110頁,2022年,5月20日,3點(diǎn)29分,星期
43、二子博弈由一個決策結(jié)x和所有該決策結(jié)的后續(xù)結(jié)T(x)(包括終點(diǎn)結(jié))組成,它滿足下列條件:(1)x是一個單結(jié)信息集;(2)子博弈不改變原博弈的信息集和支付向量子博弈條件1說的是一個子博弈必需從一個單結(jié)信息集開始。即:(1)當(dāng)且僅當(dāng)決策者在原博弈中確切地知道博弈進(jìn)入一個特定的決策結(jié)時,該決策結(jié)才能作為一個子博弈的開始。(2)如果一個信息集包含兩個以上決策結(jié),沒有任何一個決策結(jié)可以作為子博弈的初始結(jié)。A 開發(fā) 不開發(fā) 大 小 大 小開發(fā) 不開發(fā) 開 不開 開 不開 開 不開 (4,4) (8,0) (-3,-3) (1,0) (0,8) (0,0) (0,1) (0,0) N1 N2 B1 B2 B
44、3 B4A 開發(fā) 不開發(fā) 大 小 大 小開發(fā) 不開發(fā) 開 不開 開 不開 開 不開 (4,4) (8,0) (-3,-3) (1,0) (0,8) (0,0) (0,1) (0,0) N1 N2 B1 B2 B3 B4條件2說的是,子博弈的信息集和支付向量都直接繼承自原博弈,并不會發(fā)生任何變化。這意味著子博弈不能分割原博弈的信息集。A 開發(fā) 不開發(fā) 大 小 大 小開發(fā) 不開發(fā) 開 不開 開 不開 開 不開 (4,4) (8,0) (-3,-3) (1,0) (0,8) (0,0) (0,1) (0,0) N1 N2 B1 B2 B3 B4第71頁,共110頁,2022年,5月20日,3點(diǎn)29分
45、,星期二逆向歸納法p157開 不開開 不開 開 不開(-3,-3) (1,0) (0,1) (0,0) A B B房地產(chǎn)開發(fā):需求小逆向歸納法就是從動態(tài)博弈的最后一個階段或最后一個子博弈開始,逐步向前倒推以求解動態(tài)博弈的方法。第72頁,共110頁,2022年,5月20日,3點(diǎn)29分,星期二子博弈精煉納什均衡p166擴(kuò)展式博弈的戰(zhàn)略組合s*=(s1*,si*,sn*)是一個子博弈精煉納什均衡,如果:(1)它是原博弈的納什均衡;(2)它在每一個子博弈上給出納什均衡。一個戰(zhàn)略組合是個子博弈精煉納什均衡,當(dāng)只當(dāng)它在每一個子博弈上都構(gòu)成一個納什均衡第73頁,共110頁,2022年,5月20日,3點(diǎn)29分,星期二子博弈精煉納什均衡均衡路徑構(gòu)成子博弈精煉納什均衡的戰(zhàn)略不僅在均衡路徑上是最優(yōu)的,而且在非均衡路徑上也是最優(yōu)的。這是納什均衡與子博弈精煉納什均衡的實(shí)質(zhì)區(qū)別只有當(dāng)一個戰(zhàn)略規(guī)定的行動規(guī)則在所有可能的情況下都是最優(yōu)的時,它才是一個合理的、可置信的戰(zhàn)略序貫理性:不論過去發(fā)生了什么,參與人應(yīng)該在博弈的每一個時點(diǎn)上最優(yōu)化自己的決策第74頁,共110頁,2022年,5月20日,3點(diǎn)29分,星期二2.4子博弈精煉納什均衡應(yīng)用舉例斯坦克爾伯格(Stackelberg)寡頭競爭模型勞資博弈討價還價博弈第75頁,共110頁,2022年,5月20日,3點(diǎn)29分,星
溫馨提示
- 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
- 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
- 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
- 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負(fù)責(zé)。
- 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請與我們聯(lián)系,我們立即糾正。
- 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時也不承擔(dān)用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。
最新文檔
- 2025屆福建省泉州市實(shí)驗(yàn)中學(xué)中考聯(lián)考生物試卷含解析
- 鹽城市亭湖區(qū)2025屆中考考前最后一卷生物試卷含解析
- 2025屆四川省南充市高坪區(qū)高坪中學(xué)中考生物五模試卷含解析
- 福建省寧德市福鼎市重點(diǎn)達(dá)標(biāo)名校2025屆中考生物最后一模試卷含解析
- 廣東省深圳實(shí)驗(yàn)校2025屆中考生物仿真試卷含解析
- 天津市津南區(qū)2025屆十校聯(lián)考最后生物試題含解析
- 2025年度兒童主題噴泉池建設(shè)與運(yùn)營合同
- 2025年上海市汽車購買合同常用版(2篇)
- 2025年個人農(nóng)村土地轉(zhuǎn)讓合同樣本(2篇)
- 2025年不定期勞動合同例文(2篇)
- 2025年浙江省金華市統(tǒng)計(jì)局招聘2人歷年高頻重點(diǎn)提升(共500題)附帶答案詳解
- 員工職業(yè)素養(yǎng)與團(tuán)隊(duì)意識培訓(xùn)課件2
- 部編版三年級下冊語文全冊教案及全套導(dǎo)學(xué)案
- 2024年國家級森林公園資源承包經(jīng)營合同范本3篇
- 對口升學(xué)《計(jì)算機(jī)應(yīng)用基礎(chǔ)》復(fù)習(xí)資料總匯(含答案)
- 迪士尼樂園總體規(guī)劃
- 2024年江蘇省蘇州市中考數(shù)學(xué)試卷含答案
- 2024年世界職業(yè)院校技能大賽高職組“市政管線(道)數(shù)字化施工組”賽項(xiàng)考試題庫
- 大學(xué)計(jì)算機(jī)基礎(chǔ)(第2版) 課件 第1章 計(jì)算機(jī)概述
- 數(shù)字化年終述職報(bào)告
- 全過程工程咨詢管理服務(wù)方案投標(biāo)方案(技術(shù)方案)
評論
0/150
提交評論