南開大學(xué) 博弈論簡介.ppt_第1頁
南開大學(xué) 博弈論簡介.ppt_第2頁
南開大學(xué) 博弈論簡介.ppt_第3頁
南開大學(xué) 博弈論簡介.ppt_第4頁
南開大學(xué) 博弈論簡介.ppt_第5頁
已閱讀5頁,還剩43頁未讀, 繼續(xù)免費(fèi)閱讀

下載本文檔

版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進(jìn)行舉報(bào)或認(rèn)領(lǐng)

文檔簡介

1、1,博弈論簡介,2,第一節(jié) 博弈論的基本概念,一、市場競爭中的博弈 二、現(xiàn)代經(jīng)濟(jì)學(xué)與博弈論 三、博弈論的基本概念,3,一、市場競爭中的博弈,在現(xiàn)實(shí)經(jīng)濟(jì)生活中,許多產(chǎn)業(yè)市場是寡頭斷市場。寡頭壟斷市場是指少數(shù)幾家大廠商生產(chǎn)一個產(chǎn)業(yè)中的全部或大部分產(chǎn)品,從而形成對一個產(chǎn)業(yè)的控制的產(chǎn)業(yè)市場。 在分析寡頭壟斷市場中的企業(yè)決策行為時,就必須把各種決策者之間的策略相互作用納入到經(jīng)濟(jì)模型中,這就是一種博弈分析。,4,二、現(xiàn)代經(jīng)濟(jì)學(xué)與博弈論,從現(xiàn)代的觀點(diǎn)來看,經(jīng)濟(jì)學(xué)是研究人的決策行為的學(xué)問。 理性人是指有一個很好定義的偏好,在面臨給定的約束條件下能最大化自己偏好的人,不考慮競爭對手的決策。 價格理論有兩個基本假

2、定:1、市場參與人的數(shù)量足夠多,從而市場是競爭性的;2、參與人之間不存在信息不對稱問題(完全競爭、完全信息)。 然而在現(xiàn)實(shí)生活中,這兩個假設(shè)在許多情況下是不能被滿足。,5,1994年諾貝爾經(jīng)濟(jì)學(xué)獎授予了三位博弈論專家納什、澤爾騰和海薩尼。 1996年諾獎授予兩位博弈論與信息經(jīng)濟(jì)學(xué)研究專家莫里斯、維克瑞; 2001年諾獎授予阿克洛夫、斯彭斯、斯蒂格利茨,表彰他們在檸檬市場、信號傳遞和信號甄別等非對稱信息理論研究中的開創(chuàng)性貢獻(xiàn)。 2005年諾獎授予有以色列和美國雙重國籍的羅伯特奧曼和美國人托馬斯謝林,以表彰他們在博弈論領(lǐng)域作出的貢獻(xiàn)。,6,三、博弈論的基本概念,(一)博弈論的定義 博弈論,英文為G

3、ame theory,是研究相互依賴、相互影響的決策主體的理性決策行為以及這些決策的均衡結(jié)果的理論。 一些相互依賴、相互影響的決策行為及其結(jié)果的組合稱為博弈(Game)。,7,(二)博弈的組成要素,一個博弈一般由以下幾個要素組成,包括:參與人、行動、信息、策略、得益、結(jié)果、均衡等。 1、參與人指的是博弈中選擇行動以最大化自己效用的決策主體(可以是個人,也可以是團(tuán)體); 2、行動是指參與人在博弈進(jìn)程中輪到自己選擇時所作的某個具體決策; 3、策略是指參與人選擇行動的規(guī)則,即在博弈進(jìn)程中,什么情況下選擇什么行動的預(yù)先安排;,8,4、信息指的是參與人在博弈中所知道的關(guān)于自己以及其他參與人的行動、策略及

4、其得益函數(shù)等知識; 5、得益是參與人在博弈結(jié)束后從博弈中獲得的效用,一般是所有參與人的策略或行動的函數(shù),這是每個參與人最關(guān)心的東西; 6、均衡是所有參與人的最優(yōu)策略或行動的組合;均衡結(jié)果是指博弈結(jié)束后博弈分析者感興趣的一些要素的集合,如在各參與人的均衡策略作用下,各參與人最終的行動或效用集合。 上述要素中,參與人、行動、結(jié)果統(tǒng)稱為博弈規(guī)則,博弈分析的目的就是使用博弈規(guī)則來決定均衡。,9,(三)博弈的分類,根據(jù)參與人的多少,可將博弈分為兩人博弈或多人博弈; 根據(jù)參與人是否合作,可將博弈分為合作博弈或非合作博弈; 根據(jù)博弈結(jié)果的不同,又可分為零和博弈、常和博弈與變和博弈。,10,1、從行動的先后次

5、序來分,博弈可以 分為靜態(tài)博弈和動態(tài)博弈。 靜態(tài)博弈指在博弈中,參與人同時選擇行動,或雖非同時但后行動者并不知道前行動者采取了什么具體行動; 動態(tài)博弈指的是參與人的行動有先后順序,且后行動者能夠觀察到先行動者所選擇的行動的博弈。,11,2、從參與人對其他參與人的各種特征信息的獲得差異來分,博弈可分為完全信息博弈和不完全信息博弈。 完全信息指的是每一個參與人對所有其他參與人的特征,如策略集合及得益函數(shù)都有準(zhǔn)確完備的知識;否則就是不完全信息。 將上述兩個角度的劃分結(jié)合起來,我們就得到四種不同類型的博弈,這就是:完全信息靜態(tài)博弈,完全信息動態(tài)博弈,不完全信息靜態(tài)博弈和不完全信息動態(tài)博弈。,12,博弈

6、的分類和均衡,13,第二節(jié) 博弈的種類,一、完全信息靜態(tài)博弈 (一)完全信息靜態(tài)博弈定義 所謂完全信息靜態(tài)博弈指的是各博弈方同時決策,或者決策行動雖有先后,但后行動者不知道先行動者的具體行動是什么且各博弈方對博弈中各種策略組合情況下所有參與人相應(yīng)的得益都完全了解的博弈。,14,(二)博弈的策略式表達(dá),在博弈論中,一個博弈可以用兩種不同的方式來表達(dá): 一種是策略式表達(dá):另一種是擴(kuò)展式表達(dá).策略式表達(dá)更適合于靜態(tài)博弈,而擴(kuò)展式表達(dá)更適合于討論動態(tài)博弈。,15,策略式表達(dá)又稱為標(biāo)準(zhǔn)式表達(dá),在這種表達(dá)中,所有參人同時選擇自己的策略,所有參與人選擇的策略一起決定每個參與人的得益。 值得強(qiáng)調(diào)的是,這里參與

7、人同時選擇的是“策略”,而不是“行動”。 在靜態(tài)博弈中,于參與人只選擇一次,所以策略就等同于行動了。而在動態(tài)博弈中,策略是參與人在各個階段的行動的全面計(jì)劃。,16,更為準(zhǔn)確地講,戰(zhàn)略式表述給出: 1、博弈的參與人集合:i,=(1,2,, n); 2、每個參與人的戰(zhàn)略空間:Si i1,2,3,n; 3、每個參與人的得益函數(shù):ui(s1, ,si,sn),i1,2,3, ,n。 用GS1,Sn;u1, ,un代表戰(zhàn)略式表述博弈。,17,(三)博弈的得益矩陣表示,一個博弈被稱為有限博弈,如果:第一,參與人的個數(shù)是有限的; 第二,每個參人可選擇的策略個數(shù)是有限的。 有限博弈的策略式表達(dá)及其求解可以方便

8、地用得益矩陣直觀地給出。,18,著名的“囚徒困境”的例子,警察抓住了兩個罪犯,但是警察局卻缺乏足夠的證據(jù)指證他們所犯的罪行。如果罪犯中至少有一人供認(rèn)犯罪,就能確認(rèn)罪名成立。為了得到所需的口供,警察將這兩名罪犯分別關(guān)押防止他們串供或結(jié)成攻守同盟,并分別跟他們講清了他們的處境和面臨的選擇:如果他們兩人都拒不認(rèn)罪,則他們會被以較輕的妨礙公務(wù)罪各判一年徒刑;如果兩人中有一人坦白認(rèn)罪,則坦白者立即釋放而另一人將重判10年徒刑;果兩人都坦白認(rèn)罪,則他們將被各判8年監(jiān)禁。問:兩個罪犯會如何選擇(即是坦白還是抵賴)?,19,20,(四)納什均衡,1、占優(yōu)策略均衡。一般來說,由于每個參與人的得益是博弈中所有參與

9、人的策略的函數(shù),因此每個參與人的最優(yōu)策略選擇依賴于所有其他參與人的策略選擇。但在一些特殊的博弈中,一個參與人的最優(yōu)策略可能可以不依賴于其他參與人的策略選擇,就是說,不論其他參與人選擇什么策略,他的最優(yōu)策略是 唯一的,這樣的最優(yōu)策略被稱為“占優(yōu)策略”。 如果一個博弈中,某個參與人有占 優(yōu)策略,那么該參與人的其他可選擇策略就被稱為“劣策略”。,21,在一個博弈里,如果所有參與人都有占優(yōu)策略 存在,那么占優(yōu)策略均衡是可以預(yù)測到的唯一的均衡, 因?yàn)闆]有一個理性的參與人會選擇劣策略。所以在囚徒 困境博弈里,坦白,坦白是占優(yōu)策略均衡。 囚徒困境反映了一個深刻的問題,即個人理性與 團(tuán)體理性的沖突。這給我們一

10、個啟示,我們學(xué)習(xí)博弈論, 也許更應(yīng)該研究的是怎樣設(shè)計(jì)一種制度,在滿足個人理 性的同時,去爭取達(dá)到“集體理性”。,22,2、嚴(yán)格劣策略的重復(fù)剔除,重復(fù)剔除嚴(yán)格劣策略”的思路如下:首先找出某個參與人的嚴(yán)格劣策略(假定其存在),把這個劣策略剔除掉,重新構(gòu)造一個不包含已剔除策略的新的博弈;重復(fù)這個過程,一直到只剩下一個唯一的策略組合為止。這個唯一剩下的策略組合就是這個博弈的均衡解,稱為”重復(fù)剔除的占優(yōu) 均衡”。注意,上述表述中強(qiáng)調(diào)了“唯一”這個詞。也就是說,如果重復(fù)剔除后剩下的策略組合不唯一,那么該博弈就不是可通過重復(fù)剔除劣策略求解的。,23,3納什均衡,納什均衡是完全信息靜態(tài)博弈解的一般概 念,構(gòu)成

11、納什均衡的策略一定是重復(fù)剔除嚴(yán)格 劣策略過程中不能被剔除的策略,即沒有任何 一個策略嚴(yán)格優(yōu)于納什均衡策略。當(dāng)然,逆定 理是不存在的。更為重要的是,許多不存在占 優(yōu)策略均衡或重復(fù)剔除的占優(yōu)策略均衡的博 弈,也存在納什均衡。 下面,我們給出納什均衡的正式定義。,24,納什均衡的正式定義,納什均衡:有n個參與人的戰(zhàn)略式表述博弈GS1,Sn;u1, ,un,戰(zhàn)略組合S*(S1*,Sn*)是一個納什均衡,如果對于每一個i,Si*是給定其他參與人Si*(S1*,,S-1*,Si+1*,Sn*)的情況下第i個參與人的最優(yōu)戰(zhàn)略,即:ui(si*,s-i*)ui(si,s-i*)對任意SiSi,和任意的 I都成

12、立。,25,指一組給定對手行為前提下對各博弈方存在的最佳選擇;在納什均衡狀態(tài)下,只要其它參與者不變換策略選擇,任何單個參與者不可能單方面通過變換策略來提高他的所獲支付。,26,(五)納什均衡的多重性,在兩人的有限策略博弈中,我們還可以簡單地用劃線法來找出納什均衡,從這個例子中我們知道一個博弈可能有多個納什均衡,而具體哪個均衡會實(shí)現(xiàn),納什均衡本身不能給出回答,任何有限博弈都存在至少一個納什均衡,若是無限博弈則不一定。,27,幾個博弈案例,1.智豬博弈(占優(yōu)戰(zhàn)略均衡) 2.性別之爭(多重納什均衡) 3.斗雞博弈; 4.市場阻撓博弈,28,第二節(jié) 完全信息動態(tài)博弈,一、完全信息動態(tài)博弈定義 完全信息

13、動態(tài)博弈指的是各博弈方先后行動,后行動者知道先行動者的具體行動是什么且各博弈方對博弈中各種策略組合情況下所有參與人相應(yīng)的得益都完全了解的博弈.,29,二、動態(tài)博弈的構(gòu)成要素,(1)參與人集合:I:1,n;此外我們以后將用代表虛擬的參與人“自然”; (2)參與人的行動順序:誰在什么時候行動; (3)參與人的行動空間:在每次行動時,參與人有些什么行動可供選擇; (4)參與人的信息集:每次行動時,參與人知道些什么; (5)參與人的得益函數(shù):在博弈結(jié)束后,每個參與人得到些什么; (6)外生事件(即“自然”的選擇)的概率分布。,30,三、動態(tài)博弈的表現(xiàn)形式 “博弈樹”,結(jié):結(jié)包括決策結(jié)和終點(diǎn)結(jié)。 枝:博

14、弈樹上,枝是從一個決策結(jié)到其直接后續(xù)結(jié)的連線,每一個枝代表參與人的一個行動選擇。在每一個枝旁標(biāo)注該具體行動的代號。一般地,每個決策結(jié)下有多個枝,給出每次行動時參與人的行動空間,即此時 有哪些行動可供選擇。 信息集:將博弈樹中某一決策者在某一行動階段具有相同信息的所有決策結(jié)稱為一個信息集。,31,四、動態(tài)博弈的特點(diǎn),1.動態(tài)博弈的策略特征: 博弈方?jīng)Q策的內(nèi)容也是決定博弈結(jié)果的關(guān)鍵,不是博弈方在單個階段的行為,而是各博弈方在整個博弈中輪到選擇的每個階段,針對前面階段的各種情況作出的相應(yīng)選擇和行為的完整計(jì)劃,以及由不同博弈方的這種計(jì)劃所構(gòu)成的組合。這種計(jì)劃就是博弈方的策略。,32,2.博弈方的非對策

15、性,在信息的占有上,后行動者往往比先行動者更占優(yōu)勢。但所獲得的收益不一定比先行動者多。這與單人決策是不同的。 3.策略的可置信性問題: 策略是博弈方自己預(yù)先設(shè)定的,在各個博弈階段針對各種情況所作的相應(yīng)行為選擇的計(jì)劃,本身沒有強(qiáng)制力,且實(shí)施起來有一個過程。在該過程中,根據(jù)自己的利益需要,他完全可以改變這個計(jì)劃,從而存在“相機(jī)選擇”,產(chǎn)生策略的可置信性問題。,33,四、子博弈精煉納什均衡 動態(tài)博弈的納什均衡,1.意義: “子博弈精煉納什均衡”, 用于區(qū)分動態(tài)博弈中的“合理納什均衡”與“不合理納什均衡”,將納什均衡中包含有不可置信威脅策略的均衡剔除出去,就是說,使最后的均衡中不再包含有不可置信威脅策

16、略的存在。,34,2.子博弈精煉納什均衡的定義,子博弈:一個擴(kuò)展式表示博弈的子博弈G是由一個單結(jié)信息集x開始的與所有該決策結(jié)的后續(xù)結(jié)(包括終點(diǎn)結(jié))組成的能自成一個博弈的原博弈的一部分。 子博弈精煉納什均衡定義: 對于擴(kuò)展式博弈的策略組合S*=(S1*,Si*,,Sn*) ,如果它是原博弈的納什均衡;它在每一個子博弈上也都構(gòu)成納什均衡,則它是一個子博弈精煉納什均衡。,35,3.子博弈精煉納什均衡求法逆向歸納法求解,對于我們現(xiàn)在所討論的有限完全信息動態(tài)博弈,逆向歸納法是求解子博弈精煉納什均衡的最簡便方法。在求解子博弈精煉納什均衡時,從最后一個子博弈開始逆推上去,這就是逆向歸納法。所以逆向歸納法就是

17、從動態(tài)博弈的最后一個階段或最后一個子博弈開始,逐步向前倒推以求解動態(tài)博弈均衡的方法,36,第二節(jié) 寡頭壟斷企業(yè)的博弈行為,一、寡頭壟斷企業(yè)的靜態(tài)博弈行為 1.博弈論(Game Theory): 它是研究行為決策主體的行為發(fā)生直接相互作用時的決策,以及這種決策的均衡問題的經(jīng)濟(jì)學(xué)分支,也就是說,當(dāng)一個行為主體的選擇受到其他行為主體選擇影響,而且反過來影響到其他行為主體選擇時的決策問題和均衡問題。,37,2.博弈論與寡頭壟斷企業(yè)競爭行為: 在博弈過程中,行為主體決策的效用函數(shù)不僅依賴于他自己的選擇,而且依賴于與其具有博弈關(guān)系的其他行為方的選擇:個人的最優(yōu)選擇及其得益是其他人選擇的函數(shù)。 根據(jù)上述分析

18、,寡頭壟斷企業(yè)的競爭行為與博弈論關(guān)于競爭主體的行為假定是一致的,由此決定了寡頭壟斷企業(yè)的競爭行為成為博弈論原理的重要應(yīng)用領(lǐng)域,可以說所有的寡頭壟斷競爭模型都是博弈論有關(guān)原理的具體應(yīng)用。,38,3.寡頭壟斷企業(yè)競爭的早期研究:完全信息的靜態(tài)博弈 寡頭壟斷企業(yè)競爭的早期研究主要集中于其靜態(tài)的或單時期的市場競爭模型,適用于僅持續(xù)一個較短期限的市場,競爭對手同時作出決策并只競爭一次。彼此之間沒有機(jī)會事先觀察競爭對手的行動,從而選擇相應(yīng)的決策。 在博弈論上,對于這樣一種競爭行為主要是用完全信息的靜態(tài)博弈來分析的。,39,二、完全信息動態(tài)博弈與寡頭壟斷企業(yè)競爭行為,1. 寡頭壟斷企業(yè)的現(xiàn)實(shí)競爭行為多為動態(tài)

19、博弈 靜態(tài)競爭的情況在現(xiàn)實(shí)經(jīng)濟(jì)中往往是很少存在的,現(xiàn)實(shí)中存在較多的是參與競爭的企業(yè)在行動順序上有先后之分,且后行動者一般能夠在自己行動之前或多或少地觀察到競爭對手在此之前行動的有關(guān)信息,并以此為依據(jù)來制定自己的競爭決策。 這種競爭是一種動態(tài)競爭,需要用動態(tài)博弈理論進(jìn)行分析。,40,三、重復(fù)博弈與寡頭壟斷企業(yè)競爭行為,1.定義:同樣結(jié)構(gòu)的博弈重復(fù)多次,其中每次博弈稱為“階段博弈”。 2.特征: A.階段博弈之間無物質(zhì)上的聯(lián)系,也就是說,前一階段的博弈不改變后一階段博弈的結(jié)構(gòu); B.所有參與人都觀察到博弈過去的歷史; C.參與人關(guān)心的是整個博弈的總得益,總得益是所有階段博弈得益的貼現(xiàn)值之和。,41

20、,3.有限次重復(fù)博弈,給定一個博弈G,重復(fù)進(jìn)行T次G,并且在每次重復(fù)之前各博弈方都能觀察到以前博弈的結(jié)果,這樣的博弈過程稱為G的一個“T次重復(fù)博弈”,記為G(T)。 而G則稱為G(T)的原博弈。 G(T)的每次重復(fù)稱為G(T)的一個階段。,42,關(guān)于有限次重復(fù)博弈結(jié)果定理: 令G是階段博弈,G(T)是G重復(fù)T次的重復(fù)博弈。那么,如果G有唯一的納什均衡,重復(fù)博弈G(T)的唯一子博弈精煉納什均衡結(jié)果是階段博弈G的納什均衡重復(fù)T次(即每個階段博弈出現(xiàn)的都是一次性博弈的均衡結(jié)果)。,43,4.無限次重復(fù)博弈,與有限次重復(fù)博弈的差別: 當(dāng)博弈重復(fù)無窮多次時,會存在著完全不同于一次性博弈的子博弈精煉均衡。在無限次重復(fù)博弈中,因?yàn)椴┺臎]有最后階段,故不能用逆向歸納法求解。 觸發(fā)機(jī)制發(fā)揮重要的作用 長遠(yuǎn)利益與眼前利益的權(quán)衡 合作的實(shí)現(xiàn),44,四、不完全信息博弈基本概念 不完全信息博弈是指博弈的各參與人對其他參與人的得益函數(shù)不完全了解的博弈。 在不完全信息情況下的博弈參與人的最優(yōu)策略不僅僅依賴于其他參與人的策略,更依賴于對其他參與人情況的判斷。,45,(一)海薩尼轉(zhuǎn)換,1967年,海薩尼提出了“海薩尼轉(zhuǎn)換”來處理這種不完全信息的博弈。其基本思路是引入一個

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負(fù)責(zé)。
  • 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時也不承擔(dān)用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

評論

0/150

提交評論