版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進(jìn)行舉報或認(rèn)領(lǐng)
文檔簡介
第三章信息經(jīng)濟學(xué)研究方法博弈論基本概念規(guī)范研究實證研究非線性規(guī)劃應(yīng)用例證基礎(chǔ)模型其他例證基本類型信息經(jīng)濟學(xué)的研究方法例證經(jīng)典模型第三章信息經(jīng)濟學(xué)研究方法博弈論基本概念規(guī)范研究非線性規(guī)劃1
一、信息經(jīng)濟學(xué)的規(guī)范研究假設(shè)條件與現(xiàn)實不違背條件之間不矛盾基本模型構(gòu)造合理推導(dǎo)簡潔、正確結(jié)論不可批判性與現(xiàn)實吻合或合理復(fù)雜模型(擴展或推廣)復(fù)雜化應(yīng)用評論規(guī)范分析的基本框架
經(jīng)濟學(xué)研究的“四步曲”?--假設(shè)條件、模型、分析或結(jié)論,評論經(jīng)濟學(xué)研究的“八股文”?第一節(jié)信息經(jīng)濟學(xué)基本方法
一、信息經(jīng)濟學(xué)的規(guī)范研究假設(shè)條件基本模型結(jié)論復(fù)雜模型(擴展21.假設(shè)條件在信息經(jīng)濟學(xué)之前,微觀經(jīng)濟學(xué)假設(shè)中幾乎都包括經(jīng)濟人假設(shè)和完全信息假設(shè)這兩個最基本的假設(shè)。經(jīng)濟人假設(shè)也稱為理性人假設(shè),是指經(jīng)濟決策主體(消費者、生產(chǎn)者等)的經(jīng)濟行為都是理性的或合乎理性的,他們在經(jīng)濟活動中不會感情用事,而是精于判斷和計算,總是以利己為動機,力圖以最小的經(jīng)濟代價去追逐和獲得自身的最大利益。
完全信息假設(shè)是指經(jīng)濟活動的所有當(dāng)事人都擁有充分的和相同的信息,而且獲取信息不需要支付任何成本。其它假設(shè):完全競爭假設(shè)、稀缺性假設(shè)(資源不能夠滿足人們不斷增長的需求)、制度假設(shè)(既定的市場經(jīng)濟制度)、交易成本為零的假定第一節(jié)信息經(jīng)濟學(xué)基本方法1.假設(shè)條件第一節(jié)信息經(jīng)濟學(xué)基本方法3完全信息——不完全信息
阿克洛夫首先提出的不對稱信息市場更好的貼近了現(xiàn)實,更為準(zhǔn)確地反映了市場上商品的異質(zhì)性。
古典假設(shè)的錯誤?經(jīng)濟學(xué)規(guī)范研究的模型假設(shè)兩方面要求:一是與現(xiàn)實不違背,二是條件之間不矛盾。
完全信息假設(shè)可以滿足這兩方面要求,甚至可以說,正是這種由簡單到復(fù)雜的假設(shè)擴展過程使經(jīng)濟學(xué)的發(fā)展更為平穩(wěn)和完備。第一節(jié)信息經(jīng)濟學(xué)基本方法完全信息——不完全信息阿克洛夫首先提出的不對42.模型建立的典范
——一般均衡分析里昂?瓦爾拉斯(LeonWalras,1834~1910)
里昂·瓦爾拉斯,法國經(jīng)濟學(xué)家,邊際革命領(lǐng)導(dǎo)人,洛桑學(xué)派創(chuàng)始人。19世紀(jì)50年代開始研究政治經(jīng)濟學(xué),1870年被聘為洛桑大學(xué)政治經(jīng)濟學(xué)教授。瓦爾拉斯是邊際效用價值論的創(chuàng)建人之一,他把邊際效用稱為“稀少性”,并在經(jīng)濟學(xué)中使用了數(shù)學(xué),研究了使一切市場(不是一種商品的市場,而是所有商品的市場)都處于供求相等狀態(tài)的均衡,即一般均衡,從而成為數(shù)理經(jīng)濟學(xué)和一般均衡理論的創(chuàng)建者和主要代表,他的一般均衡分析方法被經(jīng)濟學(xué)所普遍使用。瓦爾拉斯把自由競爭的資本主義看作最理想的制度,但也主張國家根據(jù)正義原則干預(yù)經(jīng)濟。第一節(jié)信息經(jīng)濟學(xué)基本方法2.模型建立的典范
5實證研究的步驟理論分析提出假說構(gòu)建模型實證分析收集數(shù)據(jù)數(shù)據(jù)處理計量檢驗結(jié)論作出預(yù)測給出問題的對策文獻(xiàn)綜述研究方法研究結(jié)論討論反映現(xiàn)實?預(yù)測未來?實證研究能夠?qū)崿F(xiàn):討論區(qū)第一節(jié)信息經(jīng)濟學(xué)基本方法
二、信息經(jīng)濟學(xué)的實證研究
實證研究的步驟理論分析實證分析結(jié)論文獻(xiàn)綜述討論反映現(xiàn)實?預(yù)6第二節(jié)信息經(jīng)濟學(xué)基本方法——博弈論經(jīng)濟學(xué)研究的基本問題:
——資源的有效配置
——人的行為經(jīng)濟學(xué)的基本假設(shè):人是理性的
理性人:在一定的約束條件下,使自己的收益最大化。第三章信息經(jīng)濟學(xué)研究方法第二節(jié)信息經(jīng)濟學(xué)基本方法第三章信息經(jīng)濟學(xué)研究方法7新古典經(jīng)濟學(xué):價格制度——每個參與者的決策是獨立的?;炯僭O(shè):(1)市場是競爭的(2)信息是完全的(3)產(chǎn)品是獨立的個人決策的分析:收入—支出(價格),收益最大化博弈論:基本假設(shè):(1)市場是不完全競爭的(2)信息是不完全的特征:每個參與者的決策是相互影響的
現(xiàn)代西方經(jīng)濟學(xué)的系統(tǒng)性發(fā)展源自亞當(dāng)·斯密,中經(jīng)大衛(wèi)·李嘉圖、西斯蒙第、穆勒、薩伊等,逐漸形成了一個經(jīng)典的經(jīng)濟學(xué)理論體系,這就是古典經(jīng)濟學(xué)(ClassicalEconomics)。在20世紀(jì)以后,現(xiàn)代西方經(jīng)濟學(xué)歷經(jīng)了“張伯倫革命”、“凱恩斯革命”和“預(yù)期革命”等所謂三次大的革命,形成了包括微觀經(jīng)濟學(xué)和宏觀經(jīng)濟學(xué)的基本理論框架,這個框架被稱為新古典經(jīng)濟學(xué)(NeoclassicalEconomics),以區(qū)別于先前的古典經(jīng)濟學(xué)。新古典經(jīng)濟學(xué)集中而充分地反映了現(xiàn)代西方主流經(jīng)濟學(xué)過去100年間的研究成果和發(fā)展特征,它在研究方法上更注重證偽主義的普遍化、假定條件的多樣化、分析工具的數(shù)理化、研究領(lǐng)域的非經(jīng)濟化、案例使用的經(jīng)典化、學(xué)科交叉的邊緣化。第二節(jié)博弈論新古典經(jīng)濟學(xué):現(xiàn)代西方經(jīng)濟學(xué)的系統(tǒng)性發(fā)展源自亞當(dāng)·斯密,中經(jīng)8博弈:國家之間、企業(yè)之間、人與人之間生活中的博弈:——打牌、下棋——宿舍打掃衛(wèi)生——宿舍買電風(fēng)扇——家庭裝修——擠公共汽車第二節(jié)博弈論博弈:國家之間、企業(yè)之間、人與人之間第二節(jié)博弈論9一、經(jīng)濟博弈論的產(chǎn)生與發(fā)展
通常,人們將數(shù)學(xué)家馮?諾依曼(vonNeumann)于1928年提出的二人零和博弈的極小化極大定理作為博弈論奠基的標(biāo)志。
1944年,數(shù)學(xué)家馮?諾依曼(vonNeumann)和經(jīng)濟學(xué)家摩根斯坦恩(Morgenstern)合作發(fā)表了《博弈論和經(jīng)濟行為》一書,被認(rèn)為是應(yīng)用博弈論進(jìn)行經(jīng)濟分析的開始。
20世紀(jì)50-60年代,博弈論確立了發(fā)展的基礎(chǔ)。1950-1951年,Nash發(fā)表了兩篇關(guān)于非合作博弈的重要論文。1950年,Tucker定義了“囚犯難題”(prisoners’dilemma)。Nash和Tucker的工作基本奠定了現(xiàn)代博弈論的基礎(chǔ)。
20世紀(jì)60年代,澤爾騰(Selten)將納什均衡的概念引入了動態(tài)分析。1967-1968年,海薩尼(Harsanyi)發(fā)表了《具有不完全信息的由Bayesian局中人所進(jìn)行的博弈》。此后,他們兩人長期合作,發(fā)展了非合作博弈理論第二節(jié)博弈論一、經(jīng)濟博弈論的產(chǎn)生與發(fā)展第二節(jié)博弈論10
1994年諾貝爾經(jīng)濟學(xué)獎獲得者:美國數(shù)學(xué)家JohnF.Nash,德國經(jīng)濟學(xué)家ReinhardSelten,美籍匈牙利經(jīng)濟學(xué)家JohnC.Harsanyi。
1928年Nash出生于美國,1950年獲Princeton大學(xué)數(shù)學(xué)博士學(xué)位,曾先后任教于MIT和Princeton大學(xué)。其博士論文《非合作博弈》首次區(qū)分了合作博弈與非合作博弈,并且提出了非合作博弈的所謂Nash均衡概念。1930年Selten出生于現(xiàn)屬于波蘭的德國城市,1961年獲法蘭克福大學(xué)數(shù)學(xué)博士學(xué)位,曾先后任教于柏林自由大學(xué)、比勒菲爾特大學(xué)和波恩大學(xué)。其主要貢獻(xiàn)是在博弈論中引入了動態(tài)分析。1920年Harsanyi出生于匈牙利,1947年獲布達(dá)佩斯大學(xué)博士學(xué)位,后到美國,1954年獲斯坦福大學(xué)博士學(xué)位,曾先后任教于澳大利亞國立大學(xué)、加州伯克利分校。于2000年去世。他的貢獻(xiàn)是將不完全信息引入了博弈論的研究。第二節(jié)博弈論1994年諾貝爾經(jīng)濟學(xué)獎獲得者:1928年Nas11二、經(jīng)濟博弈論主要概念及表述(一)博弈的基本概念
局中人(players):指做決策的個體。每個局中人的目標(biāo)都是通過選擇行動來使自己的效用最大化。虛擬局中人(pseudo-players):指以一種純機械的方式來采取行動的個體。“自然”是一種虛擬局中人,它在博弈的特定時點上以特定的概率隨機選擇行動。例如:
——
你要出門,要決策是否帶傘
——
打牌
——聯(lián)通進(jìn)入市場,移動的成本情況就是一個隨機變量。(相對)第二節(jié)博弈論二、經(jīng)濟博弈論主要概念及表述第二節(jié)博弈論12
行動(actions):是指局中人的決策變量。局中人i的行動以ai表示,是他所能做的某一選擇。局中人i的行動集(actionset)是其可以采用的全部行動的集合。一個行動組合(actionprofile)是一個由博弈中的n個局中人每人選擇一個行動所組成的有序集。例如:
——出門:帶傘或不帶傘
——打牌:出牌第二節(jié)博弈論行動(actions):是指局中人的決策變量。第二節(jié)13
信息(information)指局中人在博弈中的知識,特別是有關(guān)其他局中人(競爭者或?qū)κ郑┑奶卣骱托袆拥闹R。一般地,信息是以信息集(informationset)的概念來模型化的??梢詫⒕种腥说男畔⒓闯墒瞧湓谔囟〞r點對于不同變量的取值的了解程度。例如:
——對天氣的判斷(出門)
——對其他人的判斷(打牌)
——對產(chǎn)品了解的程度(裝修)第二節(jié)博弈論信息(information)指局中人在博弈14
戰(zhàn)略或策略(strategies),是局中人選擇行動的規(guī)則,它告訴局中人在什么時候選擇什么行動。例如:
——“人不犯我,我不犯人;人若犯我,我必犯人”
——三個和尚沒水喝第二節(jié)博弈論戰(zhàn)略或策略(strategies),是局中人15
收益或支付(payoff):指每個參與人從博弈中獲得的效用水平。既可以指實際支付,也可以用來指期望支付。它是所有局中人戰(zhàn)略或行動的函數(shù),是每個局中人關(guān)注的核心問題。例如:
——出門帶傘的成本為2,如果下雨,有傘獲得的收益為6,則實際得到的效用為4。
均衡(equilibrium)是指所有局中人的最優(yōu)戰(zhàn)略組合或行動組合,或者均衡s*=(s1*,…,sn*)是指由博弈中的n個局中人每人選取的最佳戰(zhàn)略所組成的一個戰(zhàn)略組合。
結(jié)果(outcome)是指在博弈結(jié)束后,建立博弈模型者從行動、支付和其他變量的取值中所挑選出來的他所感興趣的要素的集合。第二節(jié)博弈論收益或支付(payoff):指每個參與人從博16在一個博弈過程中,無論對方的策略選擇如何,局中人一方都會選擇某個確定的策略,則該策略被稱為支配性策略。如果兩個博弈的局中人的策略組合分別構(gòu)成各自的支配性策略,那么,這個組合就被定義為納西均衡(Nashequilibrium)。第二節(jié)博弈論在一個博弈過程中,無論對方的策略選擇如何,局中人一方都會選擇17小結(jié):一個博弈中需要的要素包括:局中人、行動、信息、戰(zhàn)略或策略、支付、結(jié)果和均衡。其中,對一個博弈的描述至少必須包括:局中人、戰(zhàn)略和支付。局中人、行動和結(jié)果合起來統(tǒng)稱為博弈規(guī)則(rulesofthegame),博弈分析的目的在于運用博弈規(guī)則來確定均衡。惟一性(uniqueness):公認(rèn)的均衡概念并不能保證惟一性,缺乏惟一性是博弈論的主要缺陷或問題。例如,可能存在多種均衡,或者根本就沒有均衡。解決方案:看重博弈的規(guī)則,而不是均衡概念。第二節(jié)博弈論小結(jié):第二節(jié)博弈論18(二)博弈的基本表述雙變量矩陣表:雙變量指在兩個局中人的博弈中,每一單元格都有兩個數(shù)字——分別表示兩個局中人的收益。局中人B
左右上2,10,0局中人A
下0,01,2博弈表述的基本要素包括:局中人、戰(zhàn)略和支付第二節(jié)博弈論(二)博弈的基本表述第二節(jié)博弈論19(三)劃分博弈的主要概念1.合作博弈與非合作博弈合作博弈(cooperativegame):是以局中人整體的可能聯(lián)合行動集合為基本要素。通俗地說,如果局中人能夠達(dá)成有約束力的協(xié)議或合約,則該博弈稱為合作博弈。合作博弈強調(diào)的是集體理性。非合作博弈(non-cooperativegame):是以單個局中人的可能行動集合為基本要素的博弈。通俗地說,如果局中人不能在博弈中達(dá)成有約束力的協(xié)議或合約,則稱該博弈為非合作博弈。非合作博弈強調(diào)的是個體理性。信息經(jīng)濟學(xué)主要研究的是非合作博弈。第二節(jié)博弈論(三)劃分博弈的主要概念第二節(jié)博弈論202.零和博弈與非零和博弈按照博弈的收益分配結(jié)果劃分,博弈可以劃分為零和博弈和非零和博弈。零和博弈指在博弈中一組局中人所得到的支付(或收益)恰好是另一組局中人的損失。通俗地說,博弈結(jié)果總和為零的博弈稱為零和博弈。非零和博弈指所有局中人的支付(或收益)的代數(shù)和不為零。為正或為負(fù)。例如:贏錢與輸錢為零和博弈;工會與廠方達(dá)成增加工資的協(xié)議雙方獲得“雙贏”。反之,罷工導(dǎo)致“兩敗俱傷”。3.自然假設(shè)與自然參與博弈第二節(jié)博弈論2.零和博弈與非零和博弈第二節(jié)博弈論214.根據(jù)信息結(jié)構(gòu)劃分
對稱信息(symmetricinformation):指博弈中任一局中人都至少包含與其他每個局中人的信息集相同的元素。
非對稱信息(asymmetricinformation):指至少有一個局中人擁有私人信息(privateinformation)。完全信息(completeinformation):指局中人完全了解其他局中人的收益或收益函數(shù)。通俗地說,局中人完全了解其他局中人的特征、戰(zhàn)略空間及支付函數(shù)。
不完全信息(incompleteinformation):指至少有一個局中人不完全了解其他局中人的收益或收益函數(shù)。
第二節(jié)博弈論4.根據(jù)信息結(jié)構(gòu)劃分第二節(jié)博弈論22完備信息(perfectinformation):指一個參與人對其他參與人的行動選擇有準(zhǔn)確的了解。不完備信息(Imperfectinformation):指博弈中至少有一個局中人不了解其他局中人的行動選擇。完全信息——如“石頭、剪刀、布”游戲不完全信息——如打牌完備信息——“石頭、剪刀、布”游戲中,你知道對方40%出石頭,30%出布,30%出剪刀第二節(jié)博弈論完備信息(perfectinformation):指一個參235.根據(jù)行動結(jié)構(gòu)劃分
靜態(tài)博弈(staticgame):博弈中局中人同時選擇行動,或雖然不是同時行動但后行動者并不了解前行動者采取了什么具體行動。例如:——“石頭、剪刀、布”的游戲
——應(yīng)聘者演講(輪流,但其他人在外等候)
討論:
1)田忌賽馬的博弈是否屬于靜態(tài)博弈?
2)企業(yè)中有哪些屬于靜態(tài)博弈的例子?
3)當(dāng)你知道對方40%出石頭,30%出布和30%出剪刀,但不知道組合的順序,你的最優(yōu)策略是什么?第二節(jié)博弈論5.根據(jù)行動結(jié)構(gòu)劃分第二節(jié)博弈論24
動態(tài)博弈(dynamicgame):指局中人的行動有先后順序,且后行動者能夠觀察到先行動者所選擇的行動。例如:
——下棋、打牌等游戲
——應(yīng)聘者演講(輪流,但后者可以聽前者的演講)
——博士答辯的安排順序政府政策與企業(yè)行為之間“上有政策,下有對策”博弈:
——關(guān)稅水平與走私、稅收與逃稅之間的博弈;
——政府與企業(yè)之間“鞭打快?!钡牟┺?;
——政府官員“四菜一湯”規(guī)定的博弈。
第二節(jié)博弈論動態(tài)博弈(dynamicgame):指局中25基于信息結(jié)構(gòu)和行動結(jié)構(gòu)來劃分博弈的結(jié)果:
博弈的類型及對應(yīng)的均衡概念
行動順序靜態(tài)結(jié)構(gòu)動態(tài)結(jié)構(gòu)
信息(戰(zhàn)略博弈)(擴展博弈)完全信息靜態(tài)博弈完全信息動態(tài)博弈完全信息結(jié)構(gòu)Nash均衡子博弈精練Nash均衡
Nash(1950,1951)Selten(1965)
不完全信息靜態(tài)博弈不完全信息動態(tài)博弈不完全信息結(jié)構(gòu)貝葉斯Nash均衡精練貝葉斯Nash均衡
Harsanyi(1967-1968)Selten(1975)等第二節(jié)博弈論基于信息結(jié)構(gòu)和行動結(jié)構(gòu)來劃分博弈的結(jié)果:第二節(jié)博弈論26
信息結(jié)構(gòu)與行動結(jié)構(gòu)框架圖靜態(tài)結(jié)構(gòu)動態(tài)結(jié)構(gòu)(戰(zhàn)略博弈)(擴展博弈)完全信息結(jié)構(gòu)石頭/剪刀/布圍棋、象棋不完全信息結(jié)構(gòu)賭博黔驢技窮第二節(jié)博弈論第二節(jié)博弈論276.博弈類型的另一種劃分方法:局中人
1人博弈2人博弈多人博弈(個人與自然)零和ACE博弈結(jié)果非零和BDF第二節(jié)博弈論6.博弈類型的另一種劃分方法:第二節(jié)博弈論281人博弈:個人與自然假設(shè)一位花農(nóng)需要決定種植花的品種,但無法知道明年的天氣情況,通過經(jīng)驗和資料得知明年各種天氣類型出現(xiàn)的可能性是:S1=0.2,S2=0.1,S3=0.4,S4=0.3。可以選擇的花的品種為3種。不同的花在不同的氣候條件下的收成為:如果只能選擇一種花的話,花農(nóng)應(yīng)該選擇種哪種花?期望值(A1)、大中最大(A3)、小中最大(A2)天氣品種第二節(jié)博弈論1人博弈:個人與自然如果只能選擇一種花的話,花農(nóng)應(yīng)該選擇種哪29三、經(jīng)典博弈思想及其應(yīng)用(一)完全信息靜態(tài)博弈:Nash均衡1.Nash均衡的概念通俗地說,Nash均衡是指由全部局中人的最優(yōu)戰(zhàn)略組成的均衡。在其他局中人戰(zhàn)略既定的情況下,沒有任何單個局中人會選擇其他戰(zhàn)略,從而沒有任何局中人會打破這種均衡。
Nash均衡是一個穩(wěn)定狀態(tài)的解。在這個(“僵局”)狀態(tài)下,每個局中人的決策依賴于均衡的知識。第二節(jié)博弈論三、經(jīng)典博弈思想及其應(yīng)用第二節(jié)博弈論302.Nash均衡的主要特征(1)Nash均衡可能是高成本的(2)可能不存在納什均衡(3)Nash均衡可能有多重解
第二節(jié)博弈論2.Nash均衡的主要特征第二節(jié)博弈論313.Nash均衡:囚犯難題張三坦白不坦白坦白-3,-30,-6
李四不坦白-6,0-1,-1第二節(jié)博弈論3.Nash均衡:囚犯難題第二節(jié)博弈論32
囚犯難題的推論:
1)可能不是帕累托最優(yōu);
2)個體理性與集體理性的不一致性;
3)表明制度安排的重要性;
4)在現(xiàn)實政治經(jīng)濟中,合作具有積極普遍的意義。囚犯難題的應(yīng)用:——
軍備競賽——
企業(yè)員工——
交通堵塞
——經(jīng)濟改革
——投票選舉第二節(jié)博弈論囚犯難題的推論:第二節(jié)博弈論33囚犯難題應(yīng)用1:軍備競賽
20多年前,美、蘇兩國是兩個超級大國,他們相互對壘。假設(shè)他們有兩種策略選擇:擴軍或裁軍。雙方選擇的支付如下:蘇聯(lián)擴軍裁軍擴軍-2000,-20008000,-∞
美國裁軍-∞
,80000,0
第二節(jié)博弈論第二節(jié)博弈論34囚犯難題應(yīng)用2:環(huán)境保護(hù)兩個企業(yè)(u1,u2)被問:是否同意建造一個新的下水管道以使地下水不被污染。假設(shè)建造下水管道需要投資120萬。如同意各承擔(dān)50%,下水管道對企業(yè)的價值分別是80萬。
說明:產(chǎn)權(quán)界定與環(huán)境保護(hù)的制度建設(shè)對于公共資源的保護(hù)是十分必要的。第二節(jié)博弈論第二節(jié)博弈論35囚犯難題應(yīng)用3:搭便車分析假設(shè):學(xué)生A和B各有財產(chǎn)300元;對風(fēng)扇的福利評價分別為100元,風(fēng)扇價格為160元,合伙買風(fēng)扇的收益為200-160=40元。學(xué)生B
買風(fēng)扇不買風(fēng)扇買風(fēng)扇320,320240,400
學(xué)生A
不買風(fēng)扇400,240300,300第二節(jié)博弈論第二節(jié)博弈論36現(xiàn)實中的搭便車現(xiàn)象:
——燈塔、路燈等公共設(shè)施;
——污染等環(huán)境問題;
——各種濫竽充數(shù)的廣告、產(chǎn)品或服務(wù)。搭便車問題的主要解決方案:
——中央集權(quán)制;
——投票制:少數(shù)服從多數(shù);
——征收克拉克稅(如汽油稅、過橋費)。第二節(jié)博弈論第二節(jié)博弈論374.不存在Nash均衡:保安與小偷基本假設(shè):策略;預(yù)期效益。
小偷不偷偷不睡覺0,00,-1
保安睡覺1,0-1,3第二節(jié)博弈論4.不存在Nash均衡:保安與小偷第二節(jié)博弈論38猜硬幣博弈:每個局中人的戰(zhàn)略空間為(正面,背面)局中人2
正面背面正面-1,11,-1
局中人1
背面1,-1-1,1
在博弈中,一旦每個局中人都竭力猜測其他局中人的戰(zhàn)略選擇,就不存在Nash均衡(至少不存在前面定義的標(biāo)準(zhǔn)的Nash均衡)。因為這時局中人的最優(yōu)行動是不確定的,而博弈的結(jié)果必然要包含這種不確定性。例如:股票市場
第二節(jié)博弈論猜硬幣博弈:每個局中人的戰(zhàn)略空間為(正面,背面)第二節(jié)博弈395.Nash均衡:智豬博弈(boxedpigs)假設(shè)按一下按鈕要支付2個單位成本,有10個單位豬食進(jìn)入豬槽。又假設(shè):1)大豬和小豬同時趕到,大豬吃7個單位,小豬吃3個單位;2)大豬和小豬同時按按鈕又同時趕到豬槽,扣除2個單位成本后,大豬支付水平為7-2=5,小豬支付水平為3-2=1。3)大豬按按鈕,小豬等待,小豬先趕到,小豬吃4個單位,大豬吃6個單位。大豬支付水平為6-2=4,小豬支付水平為4-0=4。4)小豬按按鈕,大豬等待,大豬先趕到,大豬吃9個單位,小豬吃1個單位。大豬支付水平為9-0=9,小豬為1-2=-1。大豬按等待按1,5-1,9
小豬等待4,40,0第二節(jié)博弈論5.Nash均衡:智豬博弈(boxedpigs)第二節(jié)40智豬博弈表明:能者多勞,但多勞者未必多得。在每個行業(yè)中龍頭企業(yè)都要承擔(dān)三個“大豬成本”:1)市場開拓成本——群狼策略;2)人才培訓(xùn)成本——獵頭策略;3)商業(yè)模式創(chuàng)新成本——模仿策略。例如,“大豬控股”和“小豬有限”都計劃引進(jìn)一種新產(chǎn)品,但為了獲得公眾的認(rèn)同,須投入廣告費用。如大豬控股打頭陣,小豬有限跟進(jìn)也可以獲得一部分市場。相反,如小豬有限先進(jìn)入,大豬控股就會后發(fā)制任,獨占市場。
現(xiàn)實生活中的智豬博弈例子:
——領(lǐng)頭企業(yè)與小企業(yè)(麥當(dāng)勞與小快餐店)
——股票市場上的大戶與小戶
——企業(yè)的大股東和小股東
——公共設(shè)施或基礎(chǔ)設(shè)施投資:富人與窮人的博弈第二節(jié)博弈論智豬博弈表明:能者多勞,但多勞者未必多得。第二節(jié)博弈論416.Nash均衡:性別之戰(zhàn)(battleofthesexes)假設(shè)條件:
1)聯(lián)合行動收益大于非聯(lián)合行動收益;
2)非合作基礎(chǔ):影響力或影響因子相同。
丈夫足球芭蕾足球2,3-1,-1
妻子芭蕾1,13,2第二節(jié)博弈論6.Nash均衡:性別之戰(zhàn)(battleofthes42評論:在性別之戰(zhàn)中,任一Nash均衡都是帕累托最優(yōu),其他任一戰(zhàn)略組合都不可能在不降低其他局中人支付的條件下提高另一局中人的支付。問題:在性別之戰(zhàn)的兩個Nash均衡中,究竟最終是哪個?情形一:彼此不溝通,出現(xiàn)非聯(lián)合行動;情形二:可以通過博弈的重復(fù)進(jìn)行形成共同知識(commonknowledge),也有可能出現(xiàn)Nash均衡;情形三:局中人不溝通,但每晚重復(fù)進(jìn)行這一博弈,他們將最終穩(wěn)定在某一Nash均衡上。第二節(jié)博弈論評論:在性別之戰(zhàn)中,任一Nash均衡都是帕累托最優(yōu),其他任一43性別之戰(zhàn)應(yīng)用:菜市場早市/夜市博弈假設(shè)兩個相互競爭的蔬菜市場可以自己決定是開早市還是開夜市,但每個市場一天只能開一次。如果是開夜市,蔬菜就可以通過船運,如果是開早市,就必須通過貨車運輸。船運會比車運便宜。中國家庭主婦雖然傳統(tǒng)上習(xí)慣早上買菜,但如果菜價在夜市便宜許多,她們也有可能到夜市買菜。無論如何一戶一天只買一次菜(數(shù)學(xué)上稱為不重疊組合)。問題:兩個菜市場如何決定開早市還是開夜市,在決定之前是否應(yīng)該相互合作?各種支付如下圖。第二節(jié)博弈論性別之戰(zhàn)應(yīng)用:菜市場早市/夜市博弈第二節(jié)博弈論44性別之戰(zhàn)策略:(1)先動優(yōu)勢
A企業(yè)民用市場軍用市場民用市場-10,-1030,15
B企業(yè)軍用市場15,30-10,-10(2)公平性合作戰(zhàn)略(3)補償性合作戰(zhàn)略(4)隨機行動策略(“李王莊”車站)第二節(jié)博弈論性別之戰(zhàn)策略:第二節(jié)博弈論457.Nash均衡:勇士博弈
勇士博弈是反映20世紀(jì)50年代美國青年的行為特征,并通過JameDean主演的電影典型地表現(xiàn)出來:某個青年集團(tuán)中有A和B兩人爭斗集團(tuán)頭領(lǐng)。他們將通過一個勇氣的測驗來決定誰更勇敢,勇敢者就可以當(dāng)頭領(lǐng)。測驗規(guī)則如下:A與B各自駕駛自己的小車在一條道路上面對面朝對方高速開去,誰第一個讓開誰就輸?shù)?。讓開者被稱為膽小鬼(chicken)而不能當(dāng)頭領(lǐng)。如果兩人都不讓開,結(jié)果是車毀人亡。如果兩人同時讓開,結(jié)果是平局。如果一方讓開一方不讓,讓開者則既丟面子,又當(dāng)不成頭領(lǐng)。勇士博弈的支付矩陣如下。第二節(jié)博弈論7.Nash均衡:勇士博弈第二節(jié)博弈論46勇士博弈模型:局中人B
前進(jìn)避讓前進(jìn)0,08,2
局中人A
避讓2,86,6現(xiàn)實生活中的勇士博弈例子:
——警察與游行隊伍
——夫妻吵架
——產(chǎn)品銷售中的競爭勇士博弈中的有效策略:恫嚇或威懾第二節(jié)博弈論勇士博弈模型:第二節(jié)博弈論47課堂討論:——路燈維修——道路鋪設(shè)——囚徒博弈——智豬博弈——勇士博弈第二節(jié)博弈論課堂討論:第二節(jié)博弈論488.Nash均衡:市場進(jìn)入阻撓(entrydeterrance)假設(shè)局中人A為潛在市場進(jìn)入者,局中人B為現(xiàn)有市場的占有者。具體博弈模型如下所示:局中人B:占有者接納競爭進(jìn)入20,30-10,0
局中人A:進(jìn)入者不進(jìn)入0,1000,100第二節(jié)博弈論8.Nash均衡:市場進(jìn)入阻撓(entrydeterra499.Nash均衡:聚點(focalpoints)在以下的選擇中,如果你的選擇與其他局中人的選擇一致的次數(shù)越多,你就贏得越多,那么,你在博弈中將采取什么戰(zhàn)略?
(1)選擇下述一個數(shù)并畫圈:7,100,13,261,99,666。(2)你要在中山大學(xué)與一個沒有來過中山大學(xué)的高中同學(xué)會面,應(yīng)在什么時間、什么公共地點碰面?(3)選擇下述一個數(shù)并畫圈:14,15,16,17,18,100。(4)你與另外一人一起分蛋糕,你們各自報出期望分到的比例,但如果你們報的比例之和超過100%,大家都將一無所獲。(5)假設(shè)你到一個熱帶島國去做市場營銷,只允許帶一樣產(chǎn)品,你會選擇帶什么產(chǎn)品?第二節(jié)博弈論9.Nash均衡:聚點(focalpoints)第二節(jié)50
聚點:就是出于心理或其他非理性原因受到人們共同關(guān)注的那些Nash均衡。
評論1:在上述博弈中,每一個題目都有許多Nash均衡。但是,在這些Nash均衡中,總有一些看起來或多或少可能性會更大一些。這些特點的戰(zhàn)略組合就稱為聚點。
評論2:在重復(fù)博弈中,以往的經(jīng)歷或做法通常就確定了聚點的位置。例如,如果我們第一次分蛋糕,往往彼此可能會同意五五分成。但是,如果曾經(jīng)按四六分成過,這個比例就為這次劃分蛋糕提供了一個聚點。
現(xiàn)實生活中聚點的例子:
——企業(yè)承包分成比例
——成行成市
——沙灘零售店第二節(jié)博弈論聚點:就是出于心理或其他非理性原因受到人們共51
評論3:邊界(boundary)是一種特殊的聚點。在邊界外的行為存在極度的不確定性。邊界一旦確定就具有重要的作用和公共約束力,如共同知識成為一種邊界后,就構(gòu)成行動規(guī)則。
例如:
——在商業(yè)領(lǐng)域,兩家生產(chǎn)不益于健康的產(chǎn)品的公司可能會達(dá)成某種默契,彼此都不在廣告中提及各自產(chǎn)品對健康的影響程度。
——家庭分工
評論4:在沒有明確的聚點之前,調(diào)解(mediation)和溝通(communication)是十分重要的兩種手段。
例如:
——商業(yè)糾紛或家庭財產(chǎn)糾紛中的律師或法庭第二節(jié)博弈論評論3:邊界(boundary)是一種特殊的52(二)完全信息動態(tài)博弈:子博弈精練Nash均衡(subgameperfectNashequilibrium)1.問題的提出(1)如前述,在多個Nash均衡中,究竟哪個均衡會成為最后的均衡?(2)在Nash均衡中,局中人不考慮自己的選擇如何影響其他局中人的戰(zhàn)略(因為是靜態(tài)結(jié)構(gòu))。但在動態(tài)結(jié)構(gòu)中,后者會根據(jù)前者的行動來調(diào)整自己的戰(zhàn)略,因此,會考慮自己的選擇對其他局中人的影響。(3)由于不考慮自己選擇對其他局中人選擇的影響,Nash均衡允許存在不可信威脅(在現(xiàn)實中這是不真的)。第二節(jié)博弈論(二)完全信息動態(tài)博弈:子博弈精練Nash均衡(subgam53所有動態(tài)博弈的核心問題是——可信任性
手雷博弈模型第一步:局中人A選擇支付1000元給局中人B還是一分不給;第二步:局中人B觀察局中人A的選擇,然后決定是否引爆一顆手雷將兩個人一起炸死。假設(shè)局中人B威脅局中人A,如果他不支付1000元就引爆手雷,如果局中人A相信這個威脅,其最優(yōu)反應(yīng)是支付1000元;如果局中人A不相信這個威脅,他認(rèn)為即使給局中人B一個機會,讓他將威脅付諸實施,局中人B也不會選擇去實施,這樣,局中人A就會一分不給。第二節(jié)博弈論所有動態(tài)博弈的核心問題是——可信任性第二節(jié)博弈論542.威脅與威懾不可信與可信威脅設(shè)局中人A為潛在市場進(jìn)入者,局中人B為現(xiàn)有市場的占有者。博弈模型如下:局中人B:占有者接納競爭進(jìn)入20,30-10,0
局中人A:進(jìn)入者不進(jìn)入0,1000,100第二節(jié)博弈論2.威脅與威懾第二節(jié)博弈論55假設(shè):U1為實施威脅的收益
U2為不實施威脅的收益可信威脅:U1>U2;不可信威脅:U2>U1例如:——英國農(nóng)民的故事——母親對兒子(不做作業(yè))——父親對女兒(談戀愛)*威脅與威懾的區(qū)別:明確與潛在的進(jìn)攻或制裁信號。第二節(jié)博弈論假設(shè):U1為實施威脅的收益第二節(jié)博弈論563.子博弈精練Nash均衡的概念
Selten(1965)通過對動態(tài)博弈的分析完善了Nash均衡的概念,并定義了子博弈精練Nash均衡的含義,將Nash均衡中包含不可信威脅的戰(zhàn)略剔除出去,使均衡戰(zhàn)略不再包含不可信的威脅。這樣,就要求局中人的選擇在任何時點上都是最優(yōu)的,局中人需要“隨機應(yīng)變”或“隨需而變”,而不能因循守舊。由于剔除了不可信威脅的戰(zhàn)略,因而在多數(shù)情況下精練Nash均衡縮小了Nash均衡的數(shù)量,這對于預(yù)測具有重要意義。通俗地說,子博弈(subgame)指包含在一個博弈模型中的一個或若干個階段博弈。出國讀例如:考研本科畢業(yè)在國內(nèi)讀就業(yè)第二節(jié)博弈論3.子博弈精練Nash均衡的概念第二節(jié)博弈論57
子博弈的定義:子博弈是一個對于所有局中人的信息集而言都是單結(jié)的結(jié),這個結(jié)的后續(xù)結(jié)以及在相應(yīng)的終點結(jié)處的支付三個要素所組成的博弈。如果滿足下列條件,一個戰(zhàn)略組合就是一個子博弈精練Nash均衡(subgameperfectNashequilibrium):
1)它是整個博弈的Nash均衡;
2)它的相關(guān)行動規(guī)則在每個子博弈上都是Nash均衡。評論:一個精練均衡首先必須是一個Nash均衡,但Nash均衡不一定是精練均衡。只有那些剔除了不可信威脅的Nash均衡才是精練Nash均衡。第二節(jié)博弈論子博弈的定義:第二節(jié)博弈論58
序慣理性(sequentialrational):指一個局中人在博弈的每一個點上都重新優(yōu)化自己的選擇,并且將自己在未來會重新優(yōu)化其選擇這一點納入到考慮之中。
承諾行動(commitment):指局中人使自己的威脅戰(zhàn)略變得可信的行動。通過承諾行動,局中人可以明確地告訴其他局中人其威脅是可信的威脅,而不是不可信的威脅。例如:
——企業(yè)威脅(宣布降價)
——破釜沉舟第二節(jié)博弈論序慣理性(sequentialration594.應(yīng)用:房地產(chǎn)開發(fā)博弈兩個房地產(chǎn)商A和B,他們要作出是否在H市進(jìn)行開發(fā)的決策。他們面臨兩種市場需求的情況。
高需求情況
B開發(fā)不開發(fā)
A開發(fā)4000,40008000,0
不開發(fā)0,80000,0
低需求情況
B開發(fā)不開發(fā)
A開發(fā)-3000,-30001000,0
不開發(fā)0,10000,0第二節(jié)博弈論4.應(yīng)用:房地產(chǎn)開發(fā)博弈第二節(jié)博弈論60博弈樹的表述:
N
高低
??AA
開發(fā)不開發(fā)不
BBBB
開不開不開不開不
(4,4)(8,0)(0,8)(0,0)(-3,-3)(1,0)(0,1)(0,0)第二節(jié)博弈論博弈樹的表述:第二節(jié)博弈論615.Selten連鎖店博弈模型
假設(shè)有一家連鎖店(局中人A)在20個城鎮(zhèn)中有分店,其編號為1,2,…,20。同時,在每一個城鎮(zhèn)都有一個潛在的競爭者,即有一家公司可能通過銀行貸款建立同樣類型和規(guī)模的商店,第k個城鎮(zhèn)的潛在競爭者被稱為局中人k。這樣,就形成了一個局中人A與它的20個潛在競爭者,即局中人k,k=1,…,20之間的一場博弈。如果從傳統(tǒng)的博弈論來考慮問題,結(jié)論應(yīng)該是每個潛在競爭者在條件許可下,都會采取“進(jìn)入”策略,即開設(shè)一家與連鎖店同類型的商店,而連鎖店則應(yīng)該對新開設(shè)的商店采取“接納”策略,以便取得更多的收益。第二節(jié)博弈論5.Selten連鎖店博弈模型第二節(jié)博弈論62
然而,這個結(jié)論與實際情況并不符合。幾乎所有的人都會認(rèn)為,連鎖店應(yīng)該對新開設(shè)的商店采取“攻擊”策略,以保持其壟斷地位。另一種方案是連鎖店對前面N家商店采取“攻擊”策略,而對后20-N家采取“合作”策略。這種方案似乎更符合實際。
Selten對這個“連鎖店博弈悖論”進(jìn)行了深入分析,提出了分層次的理性抉擇的概念,認(rèn)為人們對察覺到的理性解決方案,不一定會采取行動。第二節(jié)博弈論然而,這個結(jié)論與實際情況并不符合。幾乎所有的人63Selten連鎖店博弈模型的應(yīng)用:——愛情博弈模型:n個小伙子同時愛上一位姑娘,每個小伙子的占有策略是什么?對于任意局中人i,競爭者均為n-1個。——毛澤東抗日戰(zhàn)爭與解放戰(zhàn)爭時期的策略:*抗日戰(zhàn)爭時期:抗日民族統(tǒng)一戰(zhàn)線*解放戰(zhàn)爭時期:除國民黨頑固派之外的所有力量——春秋戰(zhàn)國時期:秦國“遠(yuǎn)交近攻”策略——市場競爭策略第二節(jié)博弈論Selten連鎖店博弈模型的應(yīng)用:——毛澤東抗日戰(zhàn)爭與解放646.
重復(fù)博弈(repeatedplay)
重復(fù)博弈,即是戰(zhàn)略依存的廠商(局中人)在長期內(nèi)相互競爭的狀態(tài)。在現(xiàn)實中,寡頭壟斷廠商之間存在重復(fù)博弈。重復(fù)博弈將改變局中人對博弈的觀點,并產(chǎn)生基于長期考慮的新戰(zhàn)略,即重復(fù)博弈的一種可能結(jié)果是產(chǎn)生合作行為。典型的重復(fù)博弈包括:
——公開串謀(explicitcollusion)
——暗中串謀(tacitcollusion)
——毛澤東博弈(針鋒相對)
——中國帝王的激勵機制(一人得道,雞犬升天;一人犯法,株連九族)第二節(jié)博弈論6.重復(fù)博弈(repeatedplay)第二節(jié)博弈論65重復(fù)博弈應(yīng)用:軍備競賽(2)假設(shè)美蘇兩國現(xiàn)在還有第三種策略選擇:有限軍備。這樣,雙方選擇的支付改變?yōu)椋禾K聯(lián)擴軍有限裁軍擴軍-2000,-2000-1600,-15008000,-∞
美國有限-1500,-1600-500,-5009500,-∞
裁軍-∞
,8000-∞,95000,0
第二節(jié)博弈論第二節(jié)博弈論66(三)不完全信息靜態(tài)博弈:貝葉斯Nash均衡
(BayesianNashequilibrium)有時,人們將不完全信息博弈稱為貝葉斯博弈。在完全信息博弈中,局中人的支付函數(shù)是共同知識。在不完全信息博弈中,至少有一個局中人不能確定另一局中人的支付函數(shù)。密封報價拍賣、工程招標(biāo)等都是常見的不完全信息靜態(tài)博弈的例子。1.不完全信息的市場進(jìn)入博弈在市場進(jìn)入博弈中,潛在進(jìn)入企業(yè)決定是否進(jìn)入一個新市場,但不了解現(xiàn)有企業(yè)的成本函數(shù),不了解現(xiàn)有企業(yè)決定接納還是競爭。第二節(jié)博弈論(三)不完全信息靜態(tài)博弈:貝葉斯Nash均衡第二節(jié)博弈論67
假設(shè)現(xiàn)有企業(yè)有兩種可能的成本函數(shù):高成本和低成本。對應(yīng)兩種成本情況的不同戰(zhàn)略組合的支付矩陣如下:現(xiàn)有企業(yè)高成本情況低成本情況接納競爭接納競爭進(jìn)入40,50-10,030,80-10,100
進(jìn)入企業(yè)不進(jìn)入0,3000,3000,4000,400
在該模型中,進(jìn)入企業(yè)對有關(guān)現(xiàn)有企業(yè)的成本信息掌握是不完全的,但現(xiàn)有企業(yè)了解進(jìn)入企業(yè)的成本函數(shù)。如果現(xiàn)有企業(yè)是高成本,當(dāng)進(jìn)入企業(yè)進(jìn)入時最優(yōu)選擇是接納;如果是低成本,則最優(yōu)選擇是競爭。在不完全信息條件下,進(jìn)入企業(yè)的最優(yōu)選擇依賴于它在多大程度上認(rèn)為現(xiàn)有企業(yè)是高成本還是低成本。第二節(jié)博弈論假設(shè)現(xiàn)有企業(yè)有兩種可能的成本函數(shù):高成本和低68
假設(shè)進(jìn)入企業(yè)認(rèn)為現(xiàn)有企業(yè)是高成本的概率是p,低成本的概率是1-p。進(jìn)入企業(yè)選擇進(jìn)入的期望利潤是p(40)+(1-p)(-10),選擇不進(jìn)入的期望利潤是0。因此,進(jìn)入企業(yè)的最優(yōu)選擇是:
1)如果p大于等于1/5,則進(jìn)入;
2)如果p小于1/5,則不進(jìn)入(當(dāng)p=1/5時,進(jìn)入企業(yè)在進(jìn)入與不進(jìn)入之間無差異,假定其進(jìn)入)。
評論:在該模型中,進(jìn)入企業(yè)似乎是在與兩個不同的現(xiàn)有企業(yè)博弈,一個是高成本的現(xiàn)有企業(yè),另外一個是低成本的現(xiàn)有企業(yè)。一般地,如果現(xiàn)有企業(yè)有T種可能的不同成本函數(shù),進(jìn)入企業(yè)似乎是在與T個不同的現(xiàn)有企業(yè)博弈。在1967年以前,博弈論學(xué)者認(rèn)為這樣的不完全信息博弈無法分析,因為當(dāng)一個局中人不了解他在與誰博弈時,博弈的規(guī)則是無法確定的。第二節(jié)博弈論假設(shè)進(jìn)入企業(yè)認(rèn)為現(xiàn)有企業(yè)是高成本的概率是p,692.Bayes博弈模型
設(shè)博弈中有N個局中人,每個局中人i都有一個行動集Ci,一個可能的類型集Ti,一個概率函數(shù)pi以及一個效用函數(shù)ui,那么,這就構(gòu)成了一個Bayes博弈的模型。這種Bayes博弈的典型例子是商業(yè)談判。局中人是買方和賣方,商品對雙方都有個底價,但這點并不為對方所掌握。假設(shè)商品的價格可能是10元直到100元。如果雙方報價,按常規(guī),如果買方的報價高于賣方的報價,那么,他們就在兩者的中間價成交;否則,就不成交。于是,這就構(gòu)成了一個Bayes博弈。第二節(jié)博弈論2.Bayes博弈模型第二節(jié)博弈論703.Harsanyi轉(zhuǎn)換
1967年,海薩尼(JohnHarsanyi)指出,所有在原來定義下的不完全信息博弈都可以在不改變其本質(zhì)的前提下被重新模型化為一個完全但不完備的信息博弈。這一切只需要增加一個由自然在不同規(guī)則集合中進(jìn)行選擇的初始行動就可以了。在轉(zhuǎn)換后的博弈中,全體局中人都了解新的可變的規(guī)則。
Harsanyi的思想可以表述為:
引入一個虛擬的局中人——“自然”,自然首先行動決定局中人的特征,局中人了解自己的特征,但其他局中人不了解。第二節(jié)博弈論3.Harsanyi轉(zhuǎn)換第二節(jié)博弈論71N自然選擇不同行動的概率高低
[p]
進(jìn)入企業(yè)[1-p]
不進(jìn)入進(jìn)入不進(jìn)入進(jìn)入現(xiàn)有企業(yè)現(xiàn)有企業(yè)(0,300)(0,400)接納競爭接納競爭(40,50)(-10,0)(30,80)(-10,100)Harsanyi轉(zhuǎn)換后的市場進(jìn)入博弈第二節(jié)博弈論
724.貝葉斯納什均衡:求愛博弈假設(shè)當(dāng)有人向你求愛時,你是否接受依賴于對求愛者品德的判斷。假設(shè)如果你準(zhǔn)確知道求愛者品德良好,則選擇接受;反之則不接受。但是,你可能并不準(zhǔn)確地知道求愛者的品德。這時,你的決策依賴于你在多大程度上相信他是一個品德優(yōu)良(或惡劣)的人。下面分別是兩種情況下的支付矩陣。
假設(shè):無論求愛者品德如何,只要他求愛你接受,他就得到100。但你的支付依賴于求愛者的類型,接受一個品德良好的求愛者得100,反之則損失100。求愛者(不論類型如何)在你拒絕時損失50。第二節(jié)博弈論4.貝葉斯納什均衡:求愛博弈假設(shè):無論求愛73
討論:假設(shè)你認(rèn)為求愛者品德優(yōu)良的概率為p。求愛者也知道這個p為多少,那么,他求愛你接受時你的預(yù)期效用為100p+(-100)(1-p),不接受時的預(yù)期效用為零。當(dāng)p>1/2時,接受才是最優(yōu)選擇。如果p確實大于1/2,貝葉斯(納什)均衡是:求愛者求愛,你接受。反之,如果p<1/2時,貝葉斯(納什)均衡為:求愛者不求愛,你不接受。
現(xiàn)實生活中的貝葉斯納什均衡:
——賭博
——企業(yè)招標(biāo)
——拍賣市場(密封報價)
第二節(jié)博弈論討論:假設(shè)你認(rèn)為求愛者品德優(yōu)良的概率為p。求愛者74
(四)不完全信息動態(tài)博弈:精練貝葉斯均衡
(perfectBayesianequilibrium)1.基本概念精練貝葉斯均衡是完全信息動態(tài)博弈的精練納什均衡與不完全信息靜態(tài)博弈的貝葉斯納什均衡的結(jié)合。一個精練貝葉斯均衡是一個戰(zhàn)略組合s和一組信念μ,使得在博弈的每一個結(jié)點上都有:(1)給定其他局中人的信念和戰(zhàn)略,博弈剩余部分的戰(zhàn)略是納什均衡戰(zhàn)略;(2)給定博弈到目前為止的歷史,局中人在每一個信息集上的信念都是理性的(這意味著只要有可能,局中人就會根據(jù)觀察到的行動,通過貝葉斯法則來修正后驗概率)。第二節(jié)博弈論(四)不完全信息動態(tài)博弈:精練貝葉斯均衡第二節(jié)博弈論75
2.現(xiàn)實中的精練貝葉斯均衡:
——黔驢技窮
——買東西時的討價還價
——Spence信號發(fā)送模型
——企業(yè)招聘員工
素質(zhì)
錯誤拒絕正確接受正確拒絕錯誤接受
招聘測試
在這里,“成本”成為一個重要的概念,只有負(fù)擔(dān)成本的行動才是可信的。例如:
——低成本企業(yè),需要證明
——高能力的人、好的員工,需要證明第二節(jié)博弈論2.現(xiàn)實中的精練貝葉斯均衡:第二節(jié)博弈論76小結(jié):四類博弈模型的關(guān)鍵內(nèi)容:
1.完全信息靜態(tài)博弈。納什均衡:指由全部局中人的最優(yōu)戰(zhàn)略組成的均衡。例如:囚犯難題。
2.完全信息動態(tài)博弈。子博弈精練納什均衡:即局中人的戰(zhàn)略在每一個子博弈中都構(gòu)成Nash均衡,即組成精練Nash均衡的戰(zhàn)略必須在每一個子博弈中都是最優(yōu)的。例如:手雷博弈。
3.不完全信息靜態(tài)博弈。貝葉斯納什均衡:在給定自己的類型和其他局中人類型的概率分布的情況下,每個局中人的預(yù)期效用達(dá)到最大化,即沒有人有積極性再選擇其他戰(zhàn)略。例如:求愛博弈。
4.不完全信息動態(tài)博弈。精練貝葉斯均衡
溫馨提示
- 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
- 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
- 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
- 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負(fù)責(zé)。
- 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請與我們聯(lián)系,我們立即糾正。
- 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時也不承擔(dān)用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。
最新文檔
- 2024-2025學(xué)年高中英語Unit1SchoollifeSectionⅦGuidedWriting教師用書教案牛津譯林版必修1
- 2024-2025學(xué)年高中歷史課時分層作業(yè)一1.1統(tǒng)一中國的第一個皇帝秦始皇含解析新人教版選修4
- 2025年度虛擬現(xiàn)實VR教育內(nèi)容開發(fā)與運營合同3篇
- 旅游地產(chǎn)尾盤銷售代理合同(2025版)9篇
- 2025年土地租賃合同終止及合同解除條件協(xié)議
- 2025臨時土地出租及設(shè)施建設(shè)合作協(xié)議3篇
- 2025年度大型企業(yè)人力資源成本控制與預(yù)算合同3篇
- 2024食品行業(yè)供應(yīng)鏈管理服務(wù)合作協(xié)議3篇
- 2024石油化工公司化工產(chǎn)品供應(yīng)承包合同
- 2025年度知識產(chǎn)權(quán)保護(hù)委托維權(quán)服務(wù)協(xié)議3篇
- 中國華能集團(tuán)公司風(fēng)力發(fā)電場運行導(dǎo)則(馬晉輝20231.1.13)
- 中考語文非連續(xù)性文本閱讀10篇專項練習(xí)及答案
- 2022-2023學(xué)年度六年級數(shù)學(xué)(上冊)寒假作業(yè)【每日一練】
- 法人不承擔(dān)責(zé)任協(xié)議書(3篇)
- 電工工具報價單
- 反歧視程序文件
- 油氣藏類型、典型的相圖特征和識別實例
- 流體靜力學(xué)課件
- 顧客忠誠度論文
- 實驗室安全檢查自查表
- 證券公司績效考核管理辦法
評論
0/150
提交評論