一、完全靜態(tài)博弈課件_第1頁
一、完全靜態(tài)博弈課件_第2頁
一、完全靜態(tài)博弈課件_第3頁
一、完全靜態(tài)博弈課件_第4頁
一、完全靜態(tài)博弈課件_第5頁
已閱讀5頁,還剩56頁未讀, 繼續(xù)免費(fèi)閱讀

下載本文檔

版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進(jìn)行舉報或認(rèn)領(lǐng)

文檔簡介

經(jīng)濟(jì)現(xiàn)象博弈分析一、完全信息靜態(tài)博弈二、完全信息動態(tài)博弈三、不完全信息靜態(tài)博弈四、不完全信息動態(tài)博弈五、與企業(yè)關(guān)聯(lián)的博弈一、完全靜態(tài)博弈第一部分完全信息靜態(tài)博弈

納什均衡混合戰(zhàn)略的納什均衡納什均衡的存在性和多重性及“聚點(diǎn)均衡”和“相關(guān)均衡”。一、完全靜態(tài)博弈§1引例:產(chǎn)權(quán)無保護(hù)的情況的博弈與無產(chǎn)權(quán)的情況相比,產(chǎn)權(quán)保護(hù)的收益可以用對策論中的囚徒困境的例子來解釋。貝茨——普里查德用對策論對非洲上尼羅河地區(qū)努埃爾人游牧部落中秩序的形成和維持進(jìn)行了解釋。努埃爾人的經(jīng)濟(jì)以“牛”為基礎(chǔ)。讓我們設(shè)想有兩個大家庭的情況,X和Y,每個家庭有同樣的武力潛能和侵犯傾向,每家都擁有相當(dāng)于10頭牛的凈財產(chǎn)。每家都有兩種行為選擇:侵犯對方行為A,不侵犯對方行為N。一、完全靜態(tài)博弈收益矩陣四個可能結(jié)果:

家庭Y

AN

家庭X

A

N(4,4)(18,2)(2,18)(10,10)一、完全靜態(tài)博弈博弈過程在不知對方策略的情況下,要求每一方都作出不可更改的選擇,就會導(dǎo)致囚徒的困境,這時,不管對方采取什么策略,每一方選擇侵犯策略可以使他的期望財富達(dá)到最大化——因?yàn)?>2、18>10。均衡的結(jié)果是(A,A),這是一個產(chǎn)權(quán)得不到保障的社會,也許最終會導(dǎo)致牛的養(yǎng)殖與放牧在經(jīng)濟(jì)上根本得不償失。一、完全靜態(tài)博弈社會困境解決的方案要解決這個基本的社會困境,就必須給對策者加以外部約束或內(nèi)在化價值以改變收益矩陣的相互關(guān)系,使結(jié)果(A,N)對于每一個潛在的侵略者不再有吸引力或不再可能。例如,矩陣非對角線上的兩個結(jié)果(18,2)和(2,18)可以被徹底地清除掉:如果對策的規(guī)則發(fā)生變化——也許通過一個第三者(一個仲裁者)使雙方都知道對方會對侵犯行為進(jìn)行報復(fù)——這樣和結(jié)果就不可能再出現(xiàn)。一、完全靜態(tài)博弈(上接)原收益矩陣變?yōu)椋?/p>

家庭Y

AN家庭XAN

(10,10)

(0,0)

(0,0)

(4,4)

如果外在設(shè)立一個機(jī)制——武力報復(fù)的威脅是確定的,那么理性的和追求財富極大化的家庭現(xiàn)在就會選擇非暴力,這樣只會有一個選擇結(jié)果,(10,10)當(dāng)然要優(yōu)于(4,4)。一、完全靜態(tài)博弈§2博弈論的基本概念——(1)參與人參與人(players):決策主體,他的目的是通過選擇行動(或戰(zhàn)略)以最大化自己的支付(效用)水平。每個參與人必須有可供選擇的行動和一個很好定義的偏好函數(shù),那些不作決策的被動主體只當(dāng)作環(huán)境參數(shù)來處理。例如,在房地產(chǎn)開發(fā)博弈中,有兩個參與人,即開發(fā)商和開發(fā)商,他們要作出“開發(fā)”或“不開發(fā)”的決策,目的是最大化自己的利潤水平,而寫字樓的需求則被當(dāng)作環(huán)境變量放在“市場需求”中。虛擬參與人(pseudo-player):“自然”(nature)。指決定外生的隨機(jī)變量的概率分布的機(jī)制。一、完全靜態(tài)博弈關(guān)于自然“自然”以一定的概率決定事件發(fā)生是大還是小,參與人決策的后果依賴于自然的選擇。在不完全信息博弈中,自然選擇參與人的類型。與一般參與人不同的是,自然作為虛擬的參與人沒有自己的支付和目標(biāo)函數(shù)。一、完全靜態(tài)博弈(2)行動(actionsormoves)行動是參與人在博弈的某個時點(diǎn)的決策變量。在n人的博弈中,n個參與人的行動的有序集a=(a1,…,ai,…,an)成為“行動組合”(actionprofile)。ai表示第i個參與人的行動。行動順序(theorderofplay)一、完全靜態(tài)博弈關(guān)于行動順序同樣的參與人,同樣的行動集合,行動順序不同,每個參與人的最優(yōu)選擇就不同,博弈的結(jié)果就不同。特別是在不完全信息博弈中,后行動者可以通過觀察先行動者的行動來獲得信息,從而使得博弈分析成為預(yù)測人的行動的一個強(qiáng)有力的工具。一、完全靜態(tài)博弈(3)信息(information)信息是參與人有關(guān)博弈的知識。完美信息(perfectinformation)是指一個參與人對其他參與人的行動選擇情況有準(zhǔn)確了解。完全信息(completeinformation)是指自然不首先行動或自然初始行動被所有參與人準(zhǔn)確觀察,即沒有事前的不確定性。一、完全靜態(tài)博弈關(guān)于“共同知識”(commonknowledge)是與信息有關(guān)的。指的是“所有參與人知道,所有參與人知道‘所有參與人知道’,所有參與人知道‘所有參與人知道所有參與人知道’…”的知識。共同知識是博弈論中一個非常強(qiáng)的假定。在現(xiàn)實(shí)的許多博弈中,即使所有參與人“共同”享有某種知識,每個參與人也許并不知道其他參與人知道這些知識,或者并不知道其他人知道自己擁有這些知識。這種情況被稱為“一致信念”。一、完全靜態(tài)博弈(4)策略策略是參與人在給定信息集的情況下的行動規(guī)則,它規(guī)定參與人在什么時候選擇什么行動。相機(jī)行動方案(contingentactionplan)。信息集包含了一個參與人有關(guān)其他參與人之前的行動知識。策略告訴該參與人如何對其他參與人的行動作出反應(yīng),因而策略是參與人的“相機(jī)行動方案”一、完全靜態(tài)博弈接上

一般地,我們用Si代表第i參與人的策略,代表第i個參與人的所有可選擇的策略集合。策略的表示一、完全靜態(tài)博弈(5)收益函數(shù)支付函數(shù)(payoff):在特定的策略組合下參與人得到的確定效用水平,或是期望水平。結(jié)果(outcome):博弈分析者所感興趣的所有東西。均衡(equilibrium):所有參與人的最優(yōu)策略的組合一、完全靜態(tài)博弈§3模型:囚徒困境

-1,-1

-9,0

0,-9

-6,-6乙

沉默招供甲沉默招供

設(shè)想:若(招供,招供)為(-7,-7),又會怎樣?占優(yōu)策略一、完全靜態(tài)博弈囚徒困境的引伸

此模型告之我們,在完全信息且靜態(tài)情況下,從自己切身利益考慮,兩個囚徒都愿意走“坦白從寬”道路。然而,國內(nèi)外的司法實(shí)踐卻說明的是:在兩個共同作案的案件中,相互背叛而坦白案情所占的比例并不令人滿意。這是因?yàn)閷τ谒麄兌?,博弈往往不是一次性的,常常是重?fù)多次,存在著動態(tài)博弈,這中間存在“威脅”與“承諾”等因素,使得效用發(fā)生根本變化。另一方面,由于支付函數(shù)的改變,也會引起心理預(yù)期的調(diào)整,從而建立起他們心理契約。個人理性轉(zhuǎn)向集體理性。一、完全靜態(tài)博弈納什均衡的定義設(shè)為一組完全信息的靜

態(tài)博弈模型,稱策略組合為一個納什均衡,如果對是在

條件下局中人的最優(yōu)選擇,即或?qū)τ诔闪?。一、完全靜態(tài)博弈一般分析博弈理論家肯·賓默爾(KenBinmore)認(rèn)為:(1)我們的基因并不強(qiáng)調(diào)“我們更喜歡或相信確定的事情”,但是它們應(yīng)當(dāng)為組織自身對于偏好和信念的認(rèn)知過程負(fù)責(zé)。(2)我們裝備的運(yùn)算法則,不只是說明我們依據(jù)偏好和信念體系觀察自我和他人的行為模式,而是在我們的操作系統(tǒng)中積極地建造可選擇的模式。人們擁有這種能力,即在任何博弈中,學(xué)習(xí)第二種最好的策略的潛力。

(3)互動式學(xué)習(xí)。一、完全靜態(tài)博弈模型:智豬博弈重復(fù)剔除的占優(yōu)均衡5-2,3-24-2,4-07-0,1-20-0,0-0

小豬

按等待大豬

按等待一、完全靜態(tài)博弈納什均衡應(yīng)用舉例(1)古諾模型(2)公共地的悲劇一、完全靜態(tài)博弈(1)古諾模型

背景:古諾(Cournot,1838)寡頭競爭模型可以說是納什均衡最早的版本,它比納什(1950)本人的定義早了100多年。假設(shè):在此模型里,有兩個參與人,分別稱為企業(yè)1和企業(yè)2;每個企業(yè)的戰(zhàn)略是選擇產(chǎn)量;支付是利潤,它是每個企業(yè)產(chǎn)量的函數(shù)。一、完全靜態(tài)博弈古諾寡頭競爭的模型化(1)古諾(Cournot)寡頭競爭模型第I個企業(yè)的利潤函數(shù)為:一、完全靜態(tài)博弈找出納什均衡的一個辦法是對每個企業(yè)的利潤函數(shù)求一階導(dǎo)數(shù),并令其等于零:上述兩個一階導(dǎo)數(shù)條件分別定義了兩個反應(yīng)函數(shù)一、完全靜態(tài)博弈反應(yīng)函數(shù)意味著每個企業(yè)的最優(yōu)策略——產(chǎn)量是另一個企業(yè)產(chǎn)量的函數(shù)。兩個反應(yīng)函數(shù)的交叉點(diǎn)就是納什均衡古諾模型的納什均衡一、完全靜態(tài)博弈

為了得到更具體的結(jié)果,讓我們來考慮上述模型的簡單情況。假定每個企業(yè)有具體相同的不變單位成本需求函數(shù)取如下線性形式那么,最優(yōu)化的一階條件分別是:一、完全靜態(tài)博弈反應(yīng)函數(shù)為解兩個反應(yīng)函數(shù),我們得納什均衡為每個企業(yè)的納什利潤分別是一、完全靜態(tài)博弈在壟斷的情況下,壟斷企業(yè)的問題是容易算出,壟斷企業(yè)的最優(yōu)產(chǎn)量為一、完全靜態(tài)博弈解釋寡頭競爭的總產(chǎn)量大于壟斷產(chǎn)量的原因在于每個企業(yè)在選擇自己的最優(yōu)產(chǎn)量時,只考慮對本企業(yè)利潤的影響,而忽視對另一個企業(yè)的外部負(fù)效應(yīng)。這是典型的囚徒困境問題。這個模型使用重復(fù)剔除嚴(yán)格劣戰(zhàn)略的方法找出均衡解。一、完全靜態(tài)博弈(2)公共地的悲劇公共地的悲劇(tragedyofthecommons)是制度經(jīng)濟(jì)學(xué)家非常熟悉的例子。格雷特·

哈丁(GarrettHardin,1968),他曾經(jīng)做過一次題為“公地的悲劇”的演講,演講稿刊登在《科學(xué)》雜志上。之后,它與“乘數(shù)”、“噪音”、“零和”或“從眾”這些詞一樣,成為某種現(xiàn)象的代名詞。十年前,“囚徒困境”走出博弈理論的領(lǐng)域,而變成了描述兩個人之間某種常見關(guān)系的代名詞,即這兩個人如果分別做出了自私的選擇,那么他們對各自的傷害就甚于對各自的幫助,但是如果他們都不從自己的角度進(jìn)行選擇,結(jié)果對兩個人都會更有利。一、完全靜態(tài)博弈公共牧場的比喻哈丁所講的公共牧場則是研究具有同一行為動機(jī)結(jié)構(gòu)的一種特殊的多人情況。那些在會議上高談闊論卻又言之無物的人們,可能看上去就像牧場上的牛一樣,他們一邊吃一邊踐踏,而另一頭牛正在眼巴巴地看著草?,F(xiàn)在這個詞已經(jīng)被廣泛地應(yīng)用于研究在公共水域傾倒污水的行為,在公共石油層開采石油行為,在公海獵捕鯨魚的行為,甚至于將地球和地球上的資源比喻成一個公共養(yǎng)殖場,人類在其中過度繁衍后代。還有中國的小煤窯的開發(fā)以及高??蒲薪?jīng)費(fèi)的申請等。一、完全靜態(tài)博弈“公地”范式即人們在追求個人利益的時候相互之間會產(chǎn)生利益沖突,如果他們能夠進(jìn)行自我約束,他們的整體福利會得到提高,但是,如果某個人進(jìn)行自我約束,他的個人福利并不會有所改善?!劳旭R斯·C·謝林《微觀動機(jī)與宏觀行為》中國人民大學(xué)出版社2005p112。一、完全靜態(tài)博弈性質(zhì)解釋公地是一種廣為普遍的現(xiàn)象中的一個特殊情況,但是這種情況又無處不在,人們的行為成本或損失超過了他們自身掌控范圍,他們要么不知道這種成本或損失,要么根本不關(guān)心。污染、疾病傳染、噪音、危險駕駛、隨意玩火或者“囤積居奇”都是這樣的行為。人們可能會自覺使這些行為服從于集體約束。而這種行為對個體來講,應(yīng)該不受約束的,但是對集體來講都是由成本的。一、完全靜態(tài)博弈顯著特征只有使用公地的人受制于他們使用公地的方式以及他們對公地的使用程度;使用或過度使用公地的成本與獲得或損失的收益通向變化。如:在擁擠的高速公路上車流速度未必比旁邊小道更快捷的情況;在異常擁擠以至于使人們后悔到這里來的沙灘上等。一、完全靜態(tài)博弈(2)公共地的悲劇公共地的悲劇(tragedyofthecommons)是制度經(jīng)濟(jì)學(xué)家非常熟悉的例子(Hardin,1968),這個例子證明,如果一種資源沒有排他性的所有權(quán),就會導(dǎo)致對這種資源的過度使用。考慮一個有n個農(nóng)民的村莊共同擁有一片草地,每個農(nóng)民都有在草地上放牧的自由。每年春天,每個農(nóng)民要決定自己養(yǎng)多少只羊。一、完全靜態(tài)博弈接上

一個重要的假設(shè)是v是G的函數(shù),v=v(G)。因?yàn)槊恐谎蛑辽僖欢〝?shù)量的草才不至于餓死,有一個最大可存活的數(shù)量。

當(dāng)草地上的羊很少時,增加一只,也許不會對其他羊的價值有太大的不利影響,但隨著飼養(yǎng)量的不斷增加,每只羊的價值會急劇下降,因此,我們假定:一、完全靜態(tài)博弈接上如圖所示vG每只羊的價值隨飼養(yǎng)總數(shù)量的增加而下降一、完全靜態(tài)博弈博弈的過程1在這個博弈里,每個農(nóng)民的問題是選擇gi以最大化自己的利潤。假定購買一只羊的價格為c,那么,利潤函數(shù)為:最優(yōu)化的一階條件是:一、完全靜態(tài)博弈2

上述一階條件可以作如下解釋:增加一只羊有正負(fù)兩方面的效應(yīng),正的效應(yīng)是這只羊本身的價值v,負(fù)的效應(yīng)是這只羊使所有之前的羊的價值下降(giv/<0)。最優(yōu)解滿足邊際收益等于邊際成本的條件。上述一階條件定義了n個反應(yīng)函數(shù):一、完全靜態(tài)博弈3就是說,第i個農(nóng)民的最優(yōu)飼養(yǎng)量隨其他農(nóng)民的飼養(yǎng)量的增加而遞減。N個反應(yīng)函數(shù)的交叉點(diǎn)為納什均衡:一、完全靜態(tài)博弈4

仔細(xì)觀察一階條件,我們發(fā)現(xiàn),盡管每個農(nóng)民在決定增加飼養(yǎng)量時考慮了對現(xiàn)有羊的價值的負(fù)效應(yīng),但他考慮的只是對自己羊的影響,而并不是對所有的羊的影響。因此,最優(yōu)點(diǎn)上個人邊際成本小于社會邊際成本,納什均衡的總飼養(yǎng)量大于社會最優(yōu)的飼養(yǎng)量。證明如下:一、完全靜態(tài)博弈5

這里,G**是社會最優(yōu)的飼養(yǎng)量。比較社會最優(yōu)的一階條件與個人最優(yōu)的一階條件可以看出,G*>G**,公共草地被過度使用了。這就是公共地的悲哀。社會最優(yōu)的目標(biāo)是最大化如下定義的社會總剩余價值。一、完全靜態(tài)博弈§4混合策略納什均衡純策略(purestrategies):如果一個策略規(guī)定參與人在一個給定的信息情況下只選擇一種特定的行動。混合策略(mixedstrategies):如果一個策略規(guī)定參與人在給定的信息情況下,以某種概率分布隨機(jī)地選擇不同的行動。在靜態(tài)博弈里,純策略等價于特定的行動,混合策略是不同行動之間的隨機(jī)選擇。一、完全靜態(tài)博弈一、社會福利博弈在這個博弈里,參與人是政府和一個流浪漢。流浪漢有兩個策略:尋找工作或游閑;政府也有兩個策略:救濟(jì)或不救濟(jì)。政府想幫助流浪漢,但前提是后者必須試圖尋找工作,否則,不予幫助;而流浪漢只有在得不到政府救濟(jì)時才會尋找工作。(3,2)(-1,3)(-1,1)(0,0)流浪漢尋找工作游閑政府救濟(jì)不救濟(jì)一、完全靜態(tài)博弈求解混合策略納什均衡1、假定政府的混合策略為:2、流浪漢的混合策略為:一、完全靜態(tài)博弈

對上述效用函數(shù)求微分,得到政府最優(yōu)化的一階條件為:

就是說,在混合策略均衡,流浪漢以0.2的概率選擇尋找工作,0.8的概率選擇游閑。那么,政府的期望效用函數(shù)為:一、完全靜態(tài)博弈解釋政府選擇救濟(jì)策略政府選擇不救濟(jì)策略

如果一個混合策略是政府的最優(yōu)選擇,那一定意味著政府在救濟(jì)與不救濟(jì)之間是無差異的,即:一、完全靜態(tài)博弈從流浪漢的最優(yōu)化問題,找出政府的均衡混合策略流浪漢的期望效用函數(shù)為:一、完全靜態(tài)博弈一、完全靜態(tài)博弈討論表明1找出混合戰(zhàn)略納什均衡可以有兩種方法,一種是支付最大化方法;另一種是支付等值法,這兩種方法是等價的。上面的均衡要求每個參與人以特定的概率選擇純戰(zhàn)略。也就是說,一個參與人選擇不同純戰(zhàn)略的概率發(fā)布不是由他自己的支付決定的,而是由他的對手的支付決定的。由于這個原因,許多人認(rèn)為混合戰(zhàn)略納什均衡是一個難以令人滿意的概念。事實(shí)上,正是因?yàn)樗趲讉€(或全部)戰(zhàn)略之間是無差異的,他的行為才難以預(yù)測,混合戰(zhàn)略納什均衡才會存在。一、完全靜態(tài)博弈2盡管混合戰(zhàn)略不像純戰(zhàn)略那樣直觀,但它確實(shí)是一些博弈中參與人的合理行為方式。撲克比賽、壘球比賽、劃拳就是這樣的例子,在這一類博弈中,參與比賽的總是隨機(jī)行動以使自己的行為不被對方所預(yù)測。經(jīng)濟(jì)學(xué)上的監(jiān)督博弈也是這樣一個例子。如稅收檢查、質(zhì)量檢查、懲治犯罪、雇主監(jiān)督雇員等都可以看成猜謎博弈。一、完全靜態(tài)博弈二、稅收檢查監(jiān)督博弈一、完全靜態(tài)博弈字母說明a是應(yīng)納稅款;C是檢查成本;F是罰款。我們假定是C<a+F。在這個假定下,不存在純戰(zhàn)略納什均衡。我們用θ代表稅收機(jī)關(guān)檢查的概率;г代表納稅人逃稅的概率。一、完全靜態(tài)博弈求解:混合戰(zhàn)略納什均衡之一給定г。稅收機(jī)關(guān)選擇檢查(θ=1)和不檢查(θ=0)的期望收益分別是:πG(1,г)=(a-C+F)г+(a-C)(1-г)=гF+a-CπG(0,г)=0г+a(1-г)=a(1-г)πG(1,г)=πG(0,г),得г*=C/(a+F)一、完全靜態(tài)博弈說明如果納稅人逃

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負(fù)責(zé)。
  • 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時也不承擔(dān)用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

評論

0/150

提交評論