第三章完全且完美信息動態(tài)博弈_第1頁
第三章完全且完美信息動態(tài)博弈_第2頁
第三章完全且完美信息動態(tài)博弈_第3頁
第三章完全且完美信息動態(tài)博弈_第4頁
第三章完全且完美信息動態(tài)博弈_第5頁
已閱讀5頁,還剩68頁未讀, 繼續(xù)免費閱讀

下載本文檔

版權說明:本文檔由用戶提供并上傳,收益歸屬內容提供方,若內容存在侵權,請進行舉報或認領

文檔簡介

第三章完全且完美信息動態(tài)博弈

本章討論動態(tài)博弈,所有博弈方都對博弈過程和得益完全了解的完全且完美信息動態(tài)博弈。這類博弈也是現(xiàn)實中常見的基本博弈類型。由于動態(tài)博弈中博弈方的選擇、行為有先后次序,因此在表示方法、利益關系、分析方法和均衡概念等方面,都與靜態(tài)博弈有很大區(qū)別。本章對動態(tài)博弈分析的概念和方法,特別是子博弈完美均衡和逆推歸納法作系統(tǒng)介紹,并介紹各種經典的動態(tài)博弈模型。本章分六節(jié)3.1動態(tài)博弈的表示法和特點3.2可信性和納什均衡的問題3.3子博弈和子博弈完美納什均衡3.4幾個經典動態(tài)博弈模型3.5有同時選擇的動態(tài)博弈模型3.6動態(tài)博弈分析的問題和擴展討論逆向歸納法的應用例子

私奔博弈

在我國漢代,有個青年作家叫司馬相如,有個年輕的寡婦叫卓文君。但這門親事遭到文君父親的反對。父親對文君說,你若跟司馬相如結婚,那么就將脫離父女關系?,F(xiàn)在,卓文君應該怎樣選擇?是屈從父親,還是跟心上人結婚?海盜分贓

話說有5個海盜搶來了100枚金幣,大家決定分贓的方式是:由海盜一提出一種分配方案。如果同意這種方案的人達到半數(shù),那么該提議就通過并付諸實施;若同意這種方案的人未達半數(shù),則提議不能通過且提議人將被扔進大海喂鯊魚,然后由接下來的海盜繼續(xù)重復提議過程,假設每個海盜都絕頂聰明,也不相互合作,并且每個海盜都想盡可能多得到金幣,那么,第一個提議的海盜將怎樣提議即可以使得提議被通過又可以最大限度得到金幣呢?如果他們就是第一個海盜會怎么分。答案五花八門,但是大多數(shù)是表示平均分—這可能是現(xiàn)實中的情況,公平觀念在博弈中發(fā)揮著作用。但是標準博弈論是研究人們完全理性的情況下極端復雜的策略互動后果,這里的平均分配并不符合標準博弈論的邏輯。那么答案究竟是什么呢?使用逆向歸納法可以求解如下:首先,考慮只剩下最后的海盜五,顯然他會分給自己100枚,并贊成自己。再回溯到只剩下海盜四和海盜五的決策,海盜四分給自己100枚并贊成五自己;海盜五被分得0枚,即使反對也無用?;氐胶1I三,海盜三可以分給海盜五的決策1枚得到海盜五的同意;分給自己99枚,自己也同意;分給海盜0枚,海盜四反對但無用?;氐胶1I二,海盜二分給海盜四1枚得的海盜四同意;分給自己99枚,自己也同意;海盜三、五分得0枚,他們會反對但反對沒有用?;氐胶1I一,他可以分給海盜三、五各1枚,獲得海盜三、五的同意;分給自己98,自己也同意;分給海盜二、四各0枚,他們會反對但反對不起作用。因此這個海盜分贓問題的答案是(98,0,1,0,1)。還可以演化不同的版本。(1)如果要求包括提議海盜在內的所有海盜過半數(shù)(超過1/2)同意才能使提議通過,那么海盜一應該怎么提方案?(2)如果要求提議海盜之外的海盜過半數(shù)同意才能通過,那么海盜一又該怎么提方案?(3)或者海盜的數(shù)目增加到10個、100個,海盜一又怎么提方案?問題1(97,0,1,2,0)或(97,0,1,0,2)問題2(97,0,1,1,1)問題3逐漸增加海盜的數(shù)量,將會發(fā)現(xiàn)答案是有規(guī)律可循的。3.1動態(tài)博弈的表示法和特點3.1.1階段和擴展性表示3.1.2動態(tài)博弈的基本特點3.1.1階段和擴展性表示階段:動態(tài)博弈中一個博弈方的一次選擇行為例子:仿冒和反仿冒博弈ABBA不制止制止(-2,5)(2,2)(10,4)(5,5)不仿冒(0,10)仿冒不制止制止仿冒不仿冒3.1.2動態(tài)博弈的基本特點策略是在整個博弈中所有選擇、行為的計劃結果是上述“計劃型”策略的策略組合,構成一條路徑得益對應每條路徑,而不是對應每步選擇、行為動態(tài)博弈的非對稱性——先后次序決定動態(tài)博弈必然是非對稱的。先選擇、行為的博弈方常常更有利,有“先行優(yōu)勢”。3.2可信性和納什均衡的問題3.2.1相機選擇和策略中的可信性問題3.2.2納什均衡的問題3.2.3逆推歸納法3.2.1相機選擇和策略中的可信性問題不同版本的開金礦博弈——分錢和打官司的可信性乙甲(0,4)(2,2)(1,0)不借借分不分開金礦博弈不借乙甲乙借不分分(1,0)不打打(0,4)(1,0)(2,2)有法律保障的開金礦博弈——分錢打官司都可信乙甲乙打(2,2)不分分不借借(0,4)(-1,0)不打(1,0)法律保障不足的開金礦博弈——分錢打官司都不可信3.2.2納什均衡的問題第三種開金礦博弈中,(不借-不打,不分)和(借-打,分)都是納什均衡。但后者不可信,不可能實現(xiàn)或穩(wěn)定。博弈的策略形:分不分借打2,2-1,0借不打2,20,4不借1,01,0結論:納什均衡在動態(tài)博弈可能缺乏穩(wěn)定性,也就是說,在完全信息靜態(tài)博弈中穩(wěn)定的納什均衡,在動態(tài)博弈中可能是不穩(wěn)定的,不能作為預測的基礎。根源:納什均衡本身不能排除博弈方策略中包含的不可信的行為設定,不能解決動態(tài)博弈的相機選擇引起的可信性問題3.2.3逆推歸納法定義:從動態(tài)博弈的最后一個階段博弈方的行為開始分析,逐步倒推回前一個階段相應博弈方的行為選擇,一直到第一個階段的分析方法,稱為“逆推歸納法”。逆推歸納法是動態(tài)博弈分析最重要、基本的方法。乙不借借(1,0)甲不分分(0,4)(2,2)3.3子博弈和子博弈完美納什均衡3.3.1子博弈3.3.2子博弈完美納什均衡3.3.1子博弈定義:由一個動態(tài)博弈第一階段以外的某階段開始的后續(xù)博弈階段構成的,有初始信息集和進行博弈所需要的全部信息,能夠自成一個博弈的原博弈的一部分,稱為原動態(tài)博弈的一個“子博弈”。乙甲不借借不分分(1,0)(0,4)(2,2)乙(-1,0)3.3.2子博弈完美納什均衡定義:如果一個完美信息的動態(tài)博弈中,各博弈方的策略構成的一個策略組合滿足,在整個動態(tài)博弈及它的所有子博弈中都構成納什均衡,那么這個策略組合稱為該動態(tài)博弈的一個“子博弈完美納什均衡”。子博弈完美納什均衡能夠排除均衡策略中不可信的威脅和承諾,因此是真正穩(wěn)定的。逆推歸納法是求完美信息動態(tài)博弈子博弈完美納什均衡的基本方法。3.4幾個經典動態(tài)博弈模型3.4.1寡占的斯塔克博格模型3.4.2勞資博弈3.4.3討價還價博弈3.4.4委托人—代理人理論3.4.1寡占的斯塔克博格模型先后選擇產量的產量競爭博弈把古諾模型改為廠商1先選擇,廠商2后選擇,而非同時選擇即可。222126qqqq--=產量得益廠商13單位4.5廠商21.5單位2.25先行優(yōu)勢寡占的斯塔克博格模型由于本博弈是一個動態(tài)博弈,因此我們考慮用遞推歸納法來分析。根據(jù)逆推歸納法的思路,首先分析第二階段廠商2的決策,為此,我們先假設廠商1的選擇為q1,是已經確定的,這實際上就是在q1確定下來求使u2實現(xiàn)最大值的q2這樣的必須滿足:

6-2q2-q1=0

即q2=(1/2)(6-q1)=3-q1/2(1)

實際上它就是廠商2對廠商1的策略的一個反應函數(shù)。廠商1知道廠商2的這種決策思路,因此他在選擇q1的知道q2*將是根據(jù)(1)代入他自己得益函數(shù),然后再求最大值。即求使寡占的斯塔克博格模型寡占的斯塔克博格模型與兩寡頭同時選擇的古諾模型的結果u1=u2=4相比,斯塔伯克模型的結果有很大不同。它的產量大于古諾模型,價格低于古諾模型,總利潤(兩廠商得益之和)小于古諾模型。但是,廠商1的得益卻大于古諾模型中廠商1的得益,更大于廠商2的得益。這當然是因為該模型中兩廠商所處地位不同,廠商1具有先動的主動,且他又把握住理性的廠商2總歸會根據(jù)自己的選擇q1而合理抉擇的心理,選擇較大的產量得到了好處。

本博弈也揭示了這一一個事實,即在信息不對稱的博弈中,信息較多的博弈方(如廠商2,他在決策之前可先知道廠商1的實際選擇,因此知道較多的信息)不一定能得到較多的得益。3.4.2勞資博弈先由工會決定工資率,再由廠商決定雇用多少勞動力RL0WL廠商的反應函數(shù)R(L)斜率為WLW0工會的誤差異曲線序貫討價還價和耐心

在價格談判中最常見的談判方式是序貫討價還價。它的規(guī)則是由甲先提議分配方案;然后,乙若同意則實施該方案,否則由乙提議方案;然后再由甲表示是否同意,若不同意則由甲提方案;然后再由乙來表決同意否,若不同意則由乙提方案…如此往復,直到談判結束(達成協(xié)議或談判破裂)。

序貫討價還價分有限回合和無限回合兩種情況。對于有限回合情況,不管多少次,都可以用逆向歸納方法來推導其均衡結果。由于序貫談判中會耗費時間,面臨機會成本,因此我們不妨假設分配的物品不是蛋糕,而是冰激凌---它會隨著時間而融化,假設冰激凌重量為100克,每一個回合冰激凌都會融化掉10克(那么10個回合冰激凌就會融化完畢)。假設甲先提議,然后是乙,在兩個回合的談判中,均衡的結果是什么?用逆向歸納法可以這樣推導均衡結果:在第二個回合,因為乙提議之后博弈結束,因此相當于他在此時面臨獨裁博弈,他將把全部的冰激凌分給自己,而由于冰激凌此時已經融化掉1/10,因此盡管乙得到了全部的冰激凌,但他實際得到的冰激凌為100-10=90克,而甲在第二回合什么也沒得到;再回溯到第一回合,甲享有提議權,此時為讓乙不至于反對其提議,他必須使得乙所獲得的冰激凌實額不低于乙在第二回合可獲得數(shù)量,即90克—而此時冰激凌并未融化,因此甲應當分給乙0.9的比例(實額為90克),而剩下的0.1比例(10克)則分給自己。在這里,我們發(fā)現(xiàn),甲自己所分得的部分,實際上正好是冰激凌將融化掉的部分,因為只有這樣,才可能保證乙不反對?;睾戏纸o甲分給乙比例實額比例實額10.1100.990200190談判三個回合,情況將會怎樣?此時提議順序應當為“甲-乙-甲”,顯然最后的主動權在甲手里面。相應的均衡結果仍可用逆向歸納法來獲得:在第三回合,冰激凌融化到只剩下80克,此時甲提議,他將80克全部分給自己;在第二回合,乙為了獲得甲的同意,只好按照不低于80克的標準分給甲,此時溶化后的冰激凌是90克,所以他分給甲的比例是8/9,擇機得到1/9;然后回到第一回合,甲分配時只需要給乙10克就可以得到乙的同意,而自己得到了90克,回合分給甲分給乙比例實額比例實額19/10901/101028/9801/910318000同樣的方法和道理,可以推導出9和10談判回合下的均衡分配結果?;睾希ㄌ嶙h人)九回合十回合可分配克數(shù)甲乙甲乙1(甲)604050501002(乙)50404050903(甲)50304040804(乙)40303040705(甲)40203030606(乙)30202030507(甲)30102020408(乙)20101020309(甲)20010102010(乙)--01010至少可以得到以下幾個結論

誰掌握談判的最后主動權,誰就可以得到更多的冰激凌。談判的回合越多,則兩個人的利益分享額就越接近平均分配。如果談判回合足夠長,一直可以到分配的合作利益消耗殆盡,那么最終的討價還價均衡結果就是平均合作利益。上述的結論也間接的反映出談判中耐心的重要。只有足夠的耐心的前提下,討價還價才可能重復進行很多回合—當然,這里不是說真的要使討價還價進行那么多回合,而是雙方都表現(xiàn)出耐心的話,那么雙方就知道應當提早做出讓步,不要一直耗下去。這當中或許有幾個回合的試探,不過對于雙方來說的確沒有必要真的耗到那么多回合,但若一方顯示急于結束討價還價,那么另一方就不大會做出讓步。關于耐心之重要,也可以從無限回合的討價還價博弈之均衡結果看到。

分配貨幣,由于每個人的耐心不一樣,所以他們對將來的貨幣的主觀貼現(xiàn)率也不一樣。為此可以假設他們分配1元錢,甲的主觀貼現(xiàn)率為r1,乙的主觀貼現(xiàn)率是r2,那么對于甲來說,將來的1元錢與現(xiàn)在的1元錢之兌換比率可用貼現(xiàn)因子s1=1/(1+r1)表示;乙的貼現(xiàn)因子為s2=1/(1+r2)。這里s1、s2越大,說明談判越有耐心,因為對他們來說將來的錢也很值錢,反之越小,s1、s2說明他們越沒有耐心。

給定上面這些信息,在無限回合的討價還價博弈中,均衡結果是:第一個提議者將建議分給自己x*的比例,分給乙(1-x*)的比例。這里:

上述結果是博弈論學者魯賓斯坦(1982)證明的一個定理。通過求導容易發(fā)現(xiàn)x*關于s1的偏導數(shù)大于0,而關于s2的偏導數(shù)小于0,其表達的含義是:甲的耐心越高或乙的耐心越低,都會導致甲得到更高的分享比例。當然,甲得到更高的分享比例也就意味著乙在這樣的情形下將得到更低的分享比例。可以得出如下一般的結論:耐心優(yōu)勢。直觀地講,有絕對耐心的人總可以通過拖延時間使自己獨吞所分物品;即使放棄絕對耐心,“耐心優(yōu)勢”在一般情況下也是成立的。先動優(yōu)勢.當兩個耐心相同,但并非都是絕對耐心的時候(s1=s2=s<1).x*=1/(1+s)>1/2,即甲總是會得到比乙更多的份額。先動優(yōu)勢的喪失。當兩人絕對耐心(s1=s2=s=1),則x*=1/2,結果是兩人平均所要分割的物品。

當然,主觀貼現(xiàn)因子s1、s2可以表示耐心,不過也可以做出其他的解釋,比如用它表示固定資產的成本----一般來說,如果企業(yè)不能早日達成協(xié)議,那么它承擔的成本包括三種:一是固定資產的維護費用在日益增加,二是推遲出售固定資產的利息損失的日益增加,三是不能按期交付產品的違約罰款(一般隨時間增加)。顯然,這些成本越高則談判越處于不利地位,因為它不能長期耗下去,而希望可以迅速結束談判,結果只好向對手出較大幅度的讓步。3.4.3討價還價博弈三回合討價還價112不接受,出S接受不接受,出S2接受出S13.4.3討價還價博弈三回合討價還價博弈結果的討論無限回合討價還價宏觀經濟政策的動態(tài)一致性3.4.4委托人—代理人理論一、委托人——代理人關系經濟活動和社會活動中有很多委托人——代理人關系,有明顯的,也有隱蔽的。工廠和工人、店主和店員、客戶和律師、市民和政府、基金購買者和基金管理人等都是。委托人——代理人關系的關鍵特征:不能直接控制,監(jiān)督不完全,信息不完全,利益的相關性委托人——代理人涉及問題:激勵機制設計、機制設計理論,委托合同設計問題等二、無不確定性的委托人—代理人模型[R(S)-w(S),w(S)-S][R(E)-w(E),w(E)-E][R(0),0][R(0),0]122偷懶努力拒絕接受不委托委托代理人的選擇激勵相容約束:w(E)-E>w(S)-Sw(E)>w(S)+E-S參與約束:22[R(E)-w(E),w(E)-E]拒絕接受拒絕接受[R(0),0][R(S)-w(S),w(S)-S][R(0),0]接受:w(E)-E>0接受:w(S)-S>0參與約束委托人的選擇11不委托委托委托[R(S)-w(S),w(S)-S][R(0),0][R(E)-w(E),w(E)-E]不委托[R(0),0]委托:R(E)-w(E)

>R(0)不委托:R(E)-w(E)

<R(0)委托:R(S)-w(S)

>R(0)不委托:R(S)-w(S)<R(0)數(shù)值例子[12,2][0,0][0,0]122偷懶努力拒絕接受不委托委托[7,1]E=2,S=1,w(E)=4,w(S)=2w(E)-E=2>w(S)-S=1滿足使代理人努力努力的激勵相容w(E)-E=2>0滿足代理人接受的參與約束,R(E)-w(E)=12>0也滿足委托人提出的委托條件。三、有不確定性但可監(jiān)督的

委托人—代理人博弈10022[0,0][0,0][10-w(S),w(S)-S][20-w(S),w(S)-S][10-w(E),w(E)-E][20-w(E),w(E)-E]不委托高產(0.1)低產(0.9)低產(0.1)高產(0.9)努力偷懶接受拒絕委托偷懶:委托:

0.1*[20-w(S)]+0.9*[10-w(S)]>0不委托:

0.1*[20-w(S)]+0.9*[10-w(S)]<0努力委托:0.9*[20-w(E)]+0.1*[10-w(E)]>0不委托:0.9*[20-w(E)]+0.1*[10-w(E)]<0因為可監(jiān)督,因此代理人報酬與成果無關,只與努力情況有關。不確定性風險由委托人承擔。代理人選擇同無不確定性情況。四、有不確定性且不可監(jiān)督的

委托人—代理人博弈122[0,0][0,0][10-w(S),w(10)-S][20-w(20),w(20)-S][10-w(10),w(10)-E][20-w(20),w(20)-E]不委托高產(0.1)低產(0.9)低產(0.1)高產(0.9)努力偷懶接受拒絕委托0只能根據(jù)成果付酬,w是成果函數(shù),而非努力程度函數(shù)。不確定性對代理人利益、選擇有影響。努力:0.9*[w(20)-E]+0.1*[w(10)-E]>0.1*[w(20)-S]+0.9*[w(10)-S]接受:0.9*[w(20)-E]+0.1*[w(10)-E]>0委托:0.9*[20-w(20)]+0.1*[10-w(10)]>0激勵相容約束促使代理人努力的激勵相容約束、參與約束,以及委托人選擇委托的條件參與約束對于委托人來說,就是要根據(jù)上述兩個條件,以及E、S的值,選擇最佳的工資水平w(20)和w(10),或者它們的差額w(20)-w(10)五、選擇報酬和連續(xù)努力水平的

委托人—代理人博弈R,CC(e)+R(e)委托人希望的代理人努力水平(滿足參與約束)店主和店員的問題商店的利潤,是均值為0的隨機變量店員的負效用,是店員的努力機會成本為1店主采用的報酬計算公式店員的得益店員期望得益為店主的得益為參與約束:當?shù)陠T風險中性時符合其最大利益店主選擇下限代入得益公式得:,期望得益為,易求得令得,再代入?yún)⑴c約束得,求數(shù)學期望得解得,則店主的最優(yōu)激勵工資計算公式是3.5有同時選擇的動態(tài)博弈模型3.5.1標準模型3.5.2間接融資和擠兌風險3.5.3國際競爭和最優(yōu)關稅3.5.4工資獎金制度3.5.1標準模型博弈中有四個博弈方,分別稱為博弈方1、博弈方2、博弈方3和博弈方4第一階段是博弈方1和博弈方2的選擇階段,他們同時在各自的可選策略(行為)集合

中分別選擇和

第二階段是博弈方3和博弈方4的選擇階段,他們在看到博弈方1和博弈方2的選擇和以后,同時在各自的可選策略(行為)集合

中分別選擇和各博弈方的得益都取決于所有博弈方的策略即博弈方i的得益是各個博弈方所選擇策略的多元函數(shù)3.5.2間接融資和擠兌風險下一階段1,11,11,1不存存款客戶2不存存款客戶1第一階段0.8,0.80.6,11,0.61.2,1.2提前到期客戶2提前到期客戶1第二階段(到期,到期)(存款,存款)(提前,提前)(不存,不存)1.2,1.2第二階段建立信貸保證、保險制度,對存款進行保護、保險的原因非法集資問題

現(xiàn)代更容易引發(fā)金融、社會風險的主要是不正規(guī)的非法金融活動,如地下錢莊和非法集資等。因為非法金融活動常常通過惡意欺騙的手段吸引人們參加,用借新債還舊債的方法,而不是經營利潤償還到期資金,信用差、管理差而且缺乏保險措施,引起金融風險并引發(fā)社會問題的可能性要大得多。3.5.3國際競爭和最優(yōu)關稅廠商的得益函數(shù)為:第二階段廠商選擇:第一階段政府選擇:先把第二階段根據(jù)廠商選擇得到結果代入政府得益,再求最優(yōu)化:政府的得益函數(shù);3.5.4工資獎金制度模型假設:1.雇員i(i=1,2)的產出函數(shù)為,為雇員努力水平,為隨機擾動。服從分布密度,均值為0的隨機變量。雇員努力的負效用函數(shù)為,且。2.產量高的雇員得到高工資,產量低的得到低工資。3.兩雇員在已知雇主宣布的工資獎金制度下,同時獨立選擇各自的努力程度。雇員選擇雇主決定了工資以后,雇員同時決定努力程度:一階條件這是雇員所選擇努力程度必須滿足的基本條件。利用條件概率的貝葉斯法則:

代入得:兩雇員情況一樣,對努力程度的選擇也相同,即:,這樣就得到:這就是兩雇員之間的靜態(tài)博弈納什均衡。若進一步假設,那么雇主選擇由于雇員之間博弈的均衡是對稱均衡,因此雙方贏得競賽的機會都是0.5,假設雇能得到其他工作機會提供的得益是,則保證雇員接受工作的基本條件是:此即“參與約束”。由于在雇員接受工作的前提下,雇主必然盡可能壓低工資

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內容里面會有圖紙預覽,若沒有圖紙預覽就沒有圖紙。
  • 4. 未經權益所有人同意不得將文件中的內容挪作商業(yè)或盈利用途。
  • 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內容的表現(xiàn)方式做保護處理,對用戶上傳分享的文檔內容本身不做任何修改或編輯,并不能對任何下載內容負責。
  • 6. 下載文件中如有侵權或不適當內容,請與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

評論

0/150

提交評論