![博弈論第二章博弈規(guī)則課件_第1頁(yè)](http://file4.renrendoc.com/view/f74965255e3853811214bad87cd79169/f74965255e3853811214bad87cd791691.gif)
![博弈論第二章博弈規(guī)則課件_第2頁(yè)](http://file4.renrendoc.com/view/f74965255e3853811214bad87cd79169/f74965255e3853811214bad87cd791692.gif)
![博弈論第二章博弈規(guī)則課件_第3頁(yè)](http://file4.renrendoc.com/view/f74965255e3853811214bad87cd79169/f74965255e3853811214bad87cd791693.gif)
![博弈論第二章博弈規(guī)則課件_第4頁(yè)](http://file4.renrendoc.com/view/f74965255e3853811214bad87cd79169/f74965255e3853811214bad87cd791694.gif)
![博弈論第二章博弈規(guī)則課件_第5頁(yè)](http://file4.renrendoc.com/view/f74965255e3853811214bad87cd79169/f74965255e3853811214bad87cd791695.gif)
版權(quán)說(shuō)明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請(qǐng)進(jìn)行舉報(bào)或認(rèn)領(lǐng)
文檔簡(jiǎn)介
參考書目1.[美]阿維納什·K·迪克西特.策略思維.中國(guó)人民大學(xué)出版社,20022.王則柯.新編博弈論平話.中信出版社,20033.謝識(shí)予.經(jīng)濟(jì)博弈論(第二版).復(fù)旦大學(xué)出版社,20024.[美]埃里克·拉斯繆森.博弈與信息:博弈論概論.北京大學(xué)出版社,20035.張維迎.博弈論與信息經(jīng)濟(jì)學(xué).上海三聯(lián)書店,2004參考書目1.[美]阿維納什·K·迪克西特.策略思維.中國(guó)第二章博弈論基本知識(shí)2.1什么是博弈論2.2博弈的結(jié)構(gòu)和分類2.3博弈的表達(dá)方式2.4
幾類經(jīng)典的博弈模型第二章博弈論基本知識(shí)2.1什么是博弈論2.1.1從游戲到博弈2.1.2一個(gè)非技術(shù)性的定義2.1.3博弈論模型簡(jiǎn)介第一節(jié)什么是博弈論2.1.1從游戲到博弈第一節(jié)什么是博弈論2.1.1從游戲到博弈
“博弈論”譯自英文“GameTheory”,直譯就是“游戲理論”。
游戲的共有特征
1.一定的規(guī)則
2.有一個(gè)結(jié)果(且可以折算成數(shù)字)
3.策略的相互依存性
4.策略至關(guān)重要2.1.1從游戲到博弈“博弈論”譯自博弈論-無(wú)處不在的游戲
“要想在現(xiàn)代社會(huì)做一個(gè)有文化的人,你必須對(duì)博弈論有一個(gè)大致了解”。
—保羅·薩繆爾森
年光似鳥翩翩過(guò),世事如棋局局新。
——(宋)僧志文博弈論-無(wú)處不在的游戲“要想在現(xiàn)代社會(huì)做一個(gè)有文化的人
博弈論(gametheory):又稱對(duì)策論,是研究相互依賴、相互影響的決策主體的理性決策行為以及這些決策的均衡結(jié)果的理論。2.1.2博弈論的基本概念GoverningDynamics博弈論(gametheory):又稱對(duì)策論,是研究相互依博弈論的基本假設(shè)
人是理性人(rational,也說(shuō)自私人):行動(dòng)者具有推理能力,在具體策略選擇時(shí)的目的是使決策者自己的目標(biāo)效用最大化。2.1.2博弈論的基本概念博弈論的基本假設(shè)2.1.2博弈論的基本概念通俗地講,博弈論是一種“游戲理論”。其較對(duì)博弈為準(zhǔn)確的理解是:一些個(gè)人、團(tuán)隊(duì)或其他組織,面對(duì)一定的環(huán)境條件,在一定的規(guī)則約束下,依靠所掌握的信息,同時(shí)或先后,一次或多次,從各自允許選擇的行為或策略進(jìn)行選擇并加以實(shí)施,并從中各自取得相應(yīng)結(jié)果或收益的過(guò)程。通俗地講,博弈論是一種“游戲理論”。其較對(duì)博弈為準(zhǔn)確的理解是博弈論模型可以用七個(gè)方面來(lái)描述
G={P,A,S,I,U,O,E}2.1.3博弈論的模型簡(jiǎn)介2.1.3博弈論的模型簡(jiǎn)介P(players)P(players):為局中人,博弈的參與者,也稱為“博弈方”,局中人以最終實(shí)現(xiàn)自身利益最大化為目標(biāo)。個(gè)人團(tuán)體雙方多方虛擬參與人:NatureP(players)P(players):為局中人,博弈的A(action)A(action):為各局中人的所有可能的策略或行動(dòng)的集合。行動(dòng)的順序(Theorderofplay)根據(jù)該集合是有限還是無(wú)限進(jìn)行分類:先動(dòng)優(yōu)勢(shì)后動(dòng)優(yōu)勢(shì)A(action)A(action):為各局中人的所有可能S(strategies)S(strategies):博弈的進(jìn)程,也是博弈進(jìn)行的次序。它規(guī)定什么人在什么時(shí)候選擇什么行動(dòng)。因此,戰(zhàn)略是參與人的“相機(jī)行動(dòng)方案”(contingentactionplan)分類:根據(jù)后行動(dòng)的人是否能夠看到先行動(dòng)人的具體行動(dòng)靜態(tài)博弈動(dòng)態(tài)博弈S(strategies)S(strategies):博弈行動(dòng)與策略的區(qū)別?行動(dòng)是指參與者可能有的具體行動(dòng)戰(zhàn)略是行動(dòng)的規(guī)則而不是行動(dòng)本身毛澤東:人不犯我我不犯人人若犯我我必犯人敵進(jìn)我退敵退我追敵駐我擾敵疲我打
行動(dòng)與策略的區(qū)別?行動(dòng)是指參與者可能有的具體行動(dòng)毛澤東:敵進(jìn)I(information)I(information)
:博弈信息。指的是參與人在博弈中的知識(shí),特別是有關(guān)其他參與人(對(duì)手)的特征和行為的知識(shí)分類:根據(jù)博弈各方對(duì)各種局勢(shì)下所有局中人的信息掌握情況分:完全信息博弈不完全信息博弈I(information)I(information):U(utility
)U(utility
):也稱為支付(payoff).為局中人獲得利益,或者是指參與人的期望效用水平。也是博弈各方追求的最終目標(biāo)。分類:根據(jù)各方得益的不同情況零和博弈變和博弈田忌賽馬囚徒困境U(utility)U(utility):也稱為支付Ua(t,t)=-8
Ua(t,n)=0Ua(n,n)=-1Ua(n,t)=-10Ub(t,t)=-8
Ub(t,n)=-10Ub(n,n)=-1Ub(n,t)=0
坦白t不坦白n坦白t-8,-80,-10不坦白n-10,0-1,-1嫌疑人a嫌疑人bUa(t,t)=-8
Ua(t,n)=0Ua(n,n)=-U(t,t)=0.5*(-8)+0.5*(-8)=-8
U(t,n)=0.5*0+0.5*(-10)=-5
U(n,t)=0.5*(-10)+0.5*0=-5
U(n,n)=0.5*(-1)+0.5*(-1)=-1結(jié)果(outcome)是指博弈分析者感興趣的要素的集合。是均衡行動(dòng)的組合。
坦白t不坦白n坦白t-8,-80,-10不坦白n-10,0-1,-1嫌疑人A嫌疑人BU(t,t)=0.5*(-8)+0.5*(-8)=-8
UE(equilibrium)均衡(equilibrium):是所有參與人的最優(yōu)戰(zhàn)略的組合。所謂博弈均衡,它是一種穩(wěn)定的博弈結(jié)果。納什均衡(NashEquilibrium):一策略組合中,所有的參與者面臨這樣的一種情況:當(dāng)其他人不改變策略時(shí),他此時(shí)的策略是最好的。謝識(shí)予:給定你的策略,我的策略是最好的的策略,給定我的策略,你的策略也是最好的的策略E(equilibrium)均衡(equilibrium):兩個(gè)小偷甲和乙聯(lián)手作案,私入民宅被警方逮住但未獲證據(jù)。警方將兩人分別置于兩間房間分開(kāi)審訊,政策是若一人招供但另一人未招,則招者立即被釋放,未招者判入獄10年;若二人都招則兩人各判刑8年;若兩人都不招則未獲證據(jù)但因私入民宅各拘留1年。兩個(gè)小偷甲和乙聯(lián)手作案,私入民宅被警方逮住但未獲證據(jù)。警方將囚徒困境
坦白不坦白坦白不坦白嫌疑人A嫌疑人B-8,-8-1,-1-10,00,-10一個(gè)納什均衡點(diǎn)!囚徒困境坦白不坦白坦白不坦白嫌疑人A嫌疑人B-8,情侶博弈
足球演唱會(huì)足球演唱會(huì)王菲李亞鵬2,11,2-1,-10,0兩個(gè)納什均衡點(diǎn)!情侶博弈足球演唱會(huì)足球演唱會(huì)王菲李亞鵬2,11,2博弈論模型可以用五個(gè)方面來(lái)描述
G={P,A,S,I,U,O,E}描述博弈的最少要素:參與人,戰(zhàn)略,支付。
行動(dòng)和信息是其積木參與人、行動(dòng)、結(jié)果統(tǒng)稱為“博弈規(guī)則”博弈分析的目的:是使用博弈規(guī)則預(yù)測(cè)均衡2.1.3博弈論的模型簡(jiǎn)介博弈論模型可以用五個(gè)方面來(lái)描述2.1.3博弈論的模博弈論模型可以用七個(gè)方面來(lái)描述
G={P,A,S,I,U,O,E}2.2.1博弈方2.2.2博弈的行動(dòng)過(guò)程2.2.3策略2.2.4支付(效用、得益)2.2.5博弈的信息結(jié)構(gòu)2.2.6博弈方的能力和理性2.2.7博弈的分類和理論結(jié)構(gòu)第二節(jié)博弈論的結(jié)構(gòu)與分類博弈論模型可以用七個(gè)方面來(lái)描述第二節(jié)博弈論的結(jié)構(gòu)與2.2.1博弈中的博弈方博弈方(player/players)博弈中獨(dú)立決策、獨(dú)立承擔(dān)博弈結(jié)果的個(gè)人或組織稱為博弈方。
1.單人博弈
2.雙人博弈
3.多人博弈2.2.1博弈中的博弈方博弈方(player/playe1.單人博弈設(shè)有一商人要從A地運(yùn)輸一批貨物,從A地到B地有水、陸兩條路線,走陸路運(yùn)輸成本10000元,而走水路運(yùn)輸成本只要7000元。但非常危險(xiǎn),出現(xiàn)壞天氣的概率為0.25,此時(shí)會(huì)損失10%的貨物。貨物總價(jià)值90000元。此人怎樣決策?1.單人博弈設(shè)有一商人要從A地運(yùn)輸一批貨物,從A地到B地有水
好天氣(75%)壞天氣(25%)水路陸路自然商人-7000-10000-10000-16000好天氣壞天氣水路陸路自然商人-7000-10000囚徒困境
坦白不坦白坦白不坦白嫌疑人A嫌疑人B-8,-8-1,-1-10,00,-102.雙人博弈囚徒困境坦白不坦白坦白不坦白嫌疑人A嫌疑人B-8,情侶博弈
足球演唱會(huì)足球演唱會(huì)王菲李亞鵬2,11,2-1,-10,0情侶博弈足球演唱會(huì)足球演唱會(huì)王菲李亞鵬2,11,2選修課--另一版本
博弈論舞蹈博弈論舞蹈王菲李亞鵬4,33,41,12,2選修課--另一版本博弈論舞蹈博弈論舞蹈王菲李亞鵬4石頭·剪子·布石頭剪子布石頭0,01,-1-1,1剪子-1,10,01,-1布1,-1-1,10,0博弈方2博弈方1石頭·剪子·布石頭剪子布石頭0,01,-1-1,1剪子-1,雙人博弈小結(jié)注意二點(diǎn):1.博弈方之間并非總是對(duì)抗的。2.個(gè)人理性決策常不能實(shí)現(xiàn)自己的最大利益。雙人博弈小結(jié)注意二點(diǎn):3、多人博弈三個(gè)或三個(gè)以上的博弈方參加的博弈。競(jìng)爭(zhēng)者破壞者競(jìng)爭(zhēng)者3、多人博弈三個(gè)或三個(gè)以上的博弈方參加的博弈。競(jìng)爭(zhēng)者破壞者競(jìng)北京申辦2000年奧運(yùn)會(huì)失利第一輪第二輪第三輪第四輪北京32374043悉尼28303745曼徹斯特111111柏林910伊斯坦布爾8北京申辦2000年奧運(yùn)會(huì)失利第一輪第二輪第三輪第四輪北京322.2.2策略有限博弈(finitegames):如果博弈中每個(gè)博弈方的策略是有限的,稱為有限博弈。2.無(wú)限博弈(infinitegames):如果博弈中至少有某些博弈方的策略是無(wú)限多個(gè)的,稱為無(wú)限博弈。
(函數(shù)表示)2.2.2策略有限博弈(finitegames):如2.2.3博弈的行動(dòng)過(guò)程1.靜態(tài)博弈(staticgames):所有博弈方同時(shí)選擇策略的博弈。
2.動(dòng)態(tài)博弈(dynamicgames):各博弈方的選擇和行動(dòng)有先后次序,而且后選擇的、后行動(dòng)的博弈方,在自己選擇行動(dòng)方案之前,可以看到其他博弈方的選擇和行動(dòng)。也稱為多階段博弈(multistagegames)
3.重復(fù)博弈(repeatedgames):同一個(gè)博弈反復(fù)進(jìn)行多構(gòu)成的博弈。2.2.3博弈的行動(dòng)過(guò)程2.2.4博弈的支付
(效用,得益)效用的計(jì)算方法:將每一個(gè)博弈方在同一策略結(jié)果中的得益相加,算出所有博弈方的得益總和。Ua(1,2)=Ua1+Ua2Ub(1,2)=Ub1+Ub2
1.零和博弈:Ua(1,2)=Ub(1,2)=0
2.常和博弈:Ua(1,2)=Ub(1,2)=m
3.變和博弈:Ua(1,2)〒Ub(1,2)2.2.4博弈的支付
(效用,得益)效用的計(jì)算方法:將每?jī)蓚€(gè)人通過(guò)猜硬幣的正反賭輸贏,其中一人用手蓋住一枚硬幣,有另一方在是正面還是反面朝上。若猜對(duì),則猜著贏1元,蓋著輸1元;若猜錯(cuò),則猜著輸1元,蓋著贏1元。假設(shè)贏著收益為1,輸者收益為-1。猜硬幣游戲兩個(gè)人通過(guò)猜硬幣的正反賭輸贏,其中一人用手蓋住一枚硬幣,有另猜硬幣游戲
正面z反面f正面z-1,11,-1反面f1,-1-1,1猜硬幣方-2U1z(z,z)=-1
U1z(z,f)=1U1f(f,z)=1U1f(f,f)=-1U2z(z,z)=-1
U2z(f,z)=1U2f(z,f)=1U2f(f,f)=-1Uz=U1z+U2z=-1+1-1+1=0Uf=U1f+U2f=1-1+1-1=0蓋硬幣方-1猜硬幣游戲正面z反面f正面z-1,11,-1反面f石頭·剪子·布石頭剪子布石頭0,01,-1-1,1剪子-1,10,01,-1布1,-1-1,10,0博弈方2博弈方1石頭·剪子·布石頭剪子布石頭0,01,-1-1,1剪子-1,周末約會(huì)
足球g演唱會(huì)d足球g2,10,0演唱會(huì)d-1,-11,2王菲b李亞鵬aUag(g,g)=2
Uag(g,d)=0Uad(d,g)=-1Uad(d,d)=1Ubg(g,g)=1
Ubg(d,g)=-1Ubd(g,d)=0Ubd(d,d)=2UU=Uag+Ubg=2+0+1-1=2Ud=Uad+Ubd=-1+1+0+2=2周末約會(huì)足球g演唱會(huì)d足球g2,10,0演唱會(huì)d-Un=Uan+Ubn=-1-10-10-1=-22Uat(t,t)=-8
Uat(t,n)=0Uan(n,t)=-10Uan(n,n)=-1Ubt(t,t)=-8
Ubt(n,t)=0Ubn(t,n)=-10Ubn(n,n)=-1
坦白t不坦白n坦白t-8,-80,-10不坦白n-10,0-1,-1嫌疑人b嫌疑人aUt=Uat+Ubt=-8+0-8+0=-16囚徒困境Un=Uan+Ubn=-1-10-10-1=-22Uat獎(jiǎng)金分配
績(jī)效高g績(jī)效低d績(jī)效高g績(jī)效低d王菲b李亞鵬a5,55,53,77,3Uag(g,g)=5
Uag(g,d)=7Uad(d,g)=3Uad(d,d)=5Ubg(g,g)=5
Ubg(d,g)=7Ubd(g,d)=3Ubd(d,d)=5Ug=Uag+Ubg=5+7+5+7=24Ud=Uad+Ubd=3+5+3+5=16獎(jiǎng)金分配績(jī)效高g績(jī)效低d績(jī)效高g績(jī)效低d王菲b李亞Ud=Uad+Ubd=30+80+30+80=220Uag(g,g)=50
Uag(g,d)=10Uad(d,g)=80Uad(d,d)=30Ubg(g,g)=50
Ubg(d,g)=10Ubd(g,d)=80Ubd(d,d)=30
高價(jià)g低價(jià)d高價(jià)g50,5010,80低價(jià)d80,1030,30聯(lián)通b移動(dòng)aUg=Uag+Ubg=50+10+50+10=120寡頭定價(jià)Ud=Uad+Ubd=30+80+30+80=220Ua2.2.5博弈的信息結(jié)構(gòu)1.關(guān)于得益的信息完全信息和不完全信息(1)完全信息(completeinformation)是指在博弈過(guò)程中,每一位博弈方對(duì)其他博弈方的特征、策略空間及收益函數(shù)有準(zhǔn)確的信息。(2)不完全信息(incompleteinformation):
如果博弈方對(duì)其他博弈方的特征、策略空間及收益函數(shù)信息了解的不夠準(zhǔn)確、或者不是對(duì)所有博弈方的特征、策略空間及收益函數(shù)都有準(zhǔn)確的準(zhǔn)確信息,在這種情況下進(jìn)行的博弈就是不完全信息博弈。也成不對(duì)稱信息或者信息不對(duì)稱(asymmetric
information)2.2.5博弈的信息結(jié)構(gòu)1.關(guān)于得益的信息2.關(guān)于博弈過(guò)程的信息完美信息和不完美信息完美信息(perfectinformation):對(duì)已經(jīng)發(fā)生的的事情有清楚的了解,稱具有完美信息。否則,稱為不完美信息(imperfectinformation)2.關(guān)于博弈過(guò)程的信息2.2.6博弈方的理性與能力完全理性與有限理性個(gè)體理性與集體理性
戰(zhàn)爭(zhēng)和平戰(zhàn)爭(zhēng)-50,-50100,0和平0,10050,50A國(guó)B國(guó)戰(zhàn)爭(zhēng)與和平2.2.6博弈方的理性與能力完全理性與有限理性戰(zhàn)2.2.7博弈的類型[1]根據(jù)參與者能否形成約束性的協(xié)議,以便集體行動(dòng)(1)合作博弈(cooperativegame)——研究人們達(dá)成合作時(shí)如何分配合作得到的收益,即收益分配問(wèn)題。
(2)非合作博弈(non-cooperative/uncooperativegame
)——研究人們?cè)诶嫦嗷ビ绊懙木謩?shì)中如何選決策使自己的收益最大,即策略選擇問(wèn)題。
2.2.7博弈的類型[1]根據(jù)參與者能否形成約束性的協(xié)議,行動(dòng)次序信息靜態(tài)動(dòng)態(tài)完全信息完全信息靜態(tài)博弈納什均衡(納什,1950,1951)完全信息動(dòng)態(tài)博弈子博弈精練納什均衡(澤爾騰,1965)不完全信息不完全信息靜態(tài)博弈貝葉斯均衡(海薩尼,1967-1968)不完全信息動(dòng)態(tài)博弈精煉貝葉斯均衡(澤爾騰等,1975)
2.2.7博弈的分類[2]行動(dòng)次序靜態(tài)動(dòng)態(tài)完全信息完全信息靜態(tài)博弈完全信息動(dòng)態(tài)博弈不完囚徒困境
(prisoner'sdilemma
)乙的對(duì)策甲的對(duì)策合作(沉默)背叛(認(rèn)罪)合作(沉默)(-1,-1)(-10,0)背叛(交代)(0,-10)(-8,-8)完全信息靜態(tài)博弈囚徒困境
(prisoner'sdilemma)乙的對(duì)空城計(jì)
進(jìn)攻后退堅(jiān)持被擒,大勝0,10逃脫,無(wú)勝5,0逃跑被擒,大勝0,10逃脫,無(wú)勝5,0諸葛亮司馬懿不完全信息靜態(tài)博弈空城計(jì)進(jìn)攻后退堅(jiān)持被擒,大勝逃脫,無(wú)勝逃跑被擒,大
走大路走小路守大路被擒10,0逃脫0,10守小道逃脫0,10被擒10,0諸葛亮(關(guān)羽)曹操不完全信息靜態(tài)博弈曹操敗走華容道走大路走小路守大路被擒逃脫守小道逃脫被擒諸葛亮(關(guān)相親王實(shí)甫張生和崔鶯鶯
紅娘王實(shí)甫.西廂記不完全信息靜態(tài)博弈相親王實(shí)甫張生和崔鶯鶯完全信息動(dòng)態(tài)博弈完全信息動(dòng)態(tài)博弈《黔之驢》—黔驢技窮
——柳宗元(唐)不完全信息動(dòng)態(tài)博弈《黔之驢》—黔驢技窮——柳宗元(唐)不完斗雞博弈斗雞博弈(ChickenGame)其實(shí)是一種誤譯。Chicken在美國(guó)口語(yǔ)中是“懦夫”之意,ChickenGame本應(yīng)譯成懦夫博弈。不過(guò)這個(gè)錯(cuò)誤并不算太嚴(yán)重,非要把chickengame叫作斗雞博弈,也不是不可以。試想有兩人狹路相逢,每人有兩個(gè)行動(dòng)選擇:一是退下來(lái),一是進(jìn)攻。如果一方退下來(lái),而對(duì)方?jīng)]有退下來(lái),對(duì)方獲得勝利,這人就很丟面子;如果對(duì)方也退下來(lái),雙方則打個(gè)平手;如果自己沒(méi)退下來(lái),而對(duì)方退下來(lái),自己則勝利,對(duì)方則失??;如果兩人都前進(jìn),那么則兩敗俱傷。因此,對(duì)每個(gè)人來(lái)說(shuō),最好的結(jié)果是,對(duì)方退下來(lái),而自己不退。贏利矩陣(payoffmatrix)如下:甲/乙前進(jìn)后退前進(jìn)(-2,-2)(1,-1)后退(-1,1)(-1,-1)上表中的數(shù)字的意思是:兩者如果均選擇“前進(jìn)”,結(jié)果是兩敗俱傷,兩者均獲得-2的支付;如果一方“前進(jìn)”,另外一方“后退”,前進(jìn)者獲得1的支付,贏得了面子,而后退者獲得-1的支付,輸?shù)袅嗣孀?,但沒(méi)有兩者均“前進(jìn)”受到的損失大;兩者均“后退”,兩者均輸?shù)袅嗣孀?,獲得-1的支付。當(dāng)然表中的數(shù)字只是相對(duì)的值。這個(gè)博弈有兩個(gè)純策略納什均衡:一方前進(jìn),另一方后退;或一方后退,另一方前進(jìn)。但關(guān)鍵是誰(shuí)進(jìn)誰(shuí)退?當(dāng)然,該博弈也存在一個(gè)混合策略均衡,即大家隨機(jī)的選擇前進(jìn)或后退。不過(guò)相對(duì)而言,我們更關(guān)注于純策略均衡。一博弈,如果有惟一的納什均衡點(diǎn),那么這個(gè)博弈是可預(yù)測(cè)的,即這個(gè)納什均衡點(diǎn)就是事先知道的惟一的博弈結(jié)果。但是如果一博弈有多個(gè)納什均衡,則要預(yù)測(cè)結(jié)果就必須附加另外的有關(guān)博弈的細(xì)節(jié)信息。比如,這里誰(shuí)進(jìn)誰(shuí)退,可能就需要附加額外的細(xì)節(jié)信息才能做出判斷。斗雞博弈斗雞博弈(ChickenGame)其實(shí)是一種誤譯。斗雞博弈斗雞博弈(ChickenGame)試想有兩人(雞)狹路相逢,每人有兩個(gè)行動(dòng)選擇:一是退下來(lái),一是進(jìn)攻。如果一方退下來(lái),而對(duì)方?jīng)]有退下來(lái),對(duì)方獲得勝利,這人就很丟面子;如果對(duì)方也退下來(lái),雙方則打個(gè)平手;如果自己沒(méi)退下來(lái),而對(duì)方退下來(lái),自己則勝利,對(duì)方則失??;如果兩人都前進(jìn),那么則兩敗俱傷。假設(shè)兩敗俱傷為-2,贏的一方為1,輸?shù)囊环綖?1。請(qǐng)用戰(zhàn)略式和擴(kuò)展式寫出他們的表達(dá)方式。并說(shuō)明納什均衡點(diǎn)。斗雞博弈斗雞博弈(ChickenGame)斗雞博弈
進(jìn)退進(jìn)-2,-21,-1退-1,1-1,-1ChickenAChickenB完全信息動(dòng)態(tài)博弈斗雞博弈進(jìn)退進(jìn)-2,-21,-1退-1,1-行動(dòng)次序信息靜態(tài)動(dòng)態(tài)完全信息完全信息靜態(tài)博弈納什均衡(納什,1950,1951)囚徒困境,周末約會(huì)完全信息動(dòng)態(tài)博弈子博弈精練納什均衡(澤爾騰,1965)田忌賽馬,破釜沉舟,昭君出塞不完全信息不完全信息靜態(tài)博弈貝葉斯均衡(海薩尼,1967-1968)招標(biāo)(暗標(biāo)),空城計(jì)相親,曹操華容道被捉不完全信息動(dòng)態(tài)博弈精煉貝葉斯均衡(澤爾騰等,1975)黔驢技窮,拍賣,龜兔賽跑
2.2.7博弈的分類和均衡行動(dòng)次序靜態(tài)動(dòng)態(tài)完全信息完全信息靜態(tài)博弈完全信息動(dòng)態(tài)博弈不完2.3.1戰(zhàn)略式表達(dá)2.3.2擴(kuò)展式表達(dá)第三節(jié)博弈的表達(dá)方式第三節(jié)博弈的表達(dá)方式2.3.1戰(zhàn)略式表達(dá)戰(zhàn)略式表達(dá)(strategicrepresentation),又稱標(biāo)準(zhǔn)式表達(dá)(normalfromrepresentation)。更適合靜態(tài)博弈。用支付矩陣表示。三個(gè)要素:1.博弈的參與人集合2.每個(gè)參與人的戰(zhàn)略空間3.每個(gè)參與人的支付函數(shù)(由戰(zhàn)略組合決定)2.3.1戰(zhàn)略式表達(dá)戰(zhàn)略式表達(dá)(strategicrep囚徒困境
坦白不坦白坦白不坦白嫌疑人A嫌疑人B-8,-8-1,-1-10,00,-10囚徒困境坦白不坦白坦白不坦白嫌疑人A嫌疑人B-8,案例:智豬博弈
(pigs’game)
豬圈中有一頭大豬和一頭小豬,在豬圈的一端設(shè)有一個(gè)按鈕,每按一下,位于豬圈另一端的食槽中就會(huì)有10單位的豬食進(jìn)槽,但每按一下按鈕會(huì)耗去相當(dāng)于2單位豬食的成本。如果大豬先到食槽,則大豬吃到9單位食物,小豬僅能吃到1單位食物;如果兩豬同時(shí)到食槽,則大豬吃7單位,小豬吃3單位食物;如果小豬先到,大豬吃6單位而小豬吃4單位食物。請(qǐng)用戰(zhàn)略式和擴(kuò)展式寫出他們的表達(dá)方式。并說(shuō)明納什均衡點(diǎn)案例:智豬博弈
(pigs’game)豬圈中智豬博弈
局中人:大豬,小豬策略:大豬:按,等待小豬:按,等待支付矩陣:智豬博弈局中人:大豬,小豬智豬博弈
按等待按等待小豬大豬5,10,09,-14,4完全信息靜態(tài)博弈智豬博弈按等待按等待小豬大豬5,10,09,-14案例:田忌賽馬上中下上下中中上下中下上下上中下中上上中下3,-31,-11,-11,-1-1,11,-1上下中1,-13,-31,-11,-11,-1-1,1中上下1,-1-1,13,-31,-11,-11,-1中下上-1,11,-11,-13,-31,-11,-1下上中1,-11,-11,-1-1,13,-31,-1下上中1,-11,-1-1,11,-11,-13,-3田忌齊威王案例:田忌賽馬上中下上下中中上下中下上下上中下中上上中下3,2.3.2擴(kuò)展式表達(dá)擴(kuò)展式表達(dá)(extensiveformrepresentation)。更適合動(dòng)態(tài)博弈。用博弈樹來(lái)表示六個(gè)要素:1.博弈的參與人集合2.參與人的行動(dòng)順序3.參與人的戰(zhàn)略行動(dòng)空間4.參與人的信息集5.參與人的支付函數(shù)6.外生事件(即自然選擇)的概率分布)2.3.2擴(kuò)展式表達(dá)擴(kuò)展式表達(dá)(extensivefor博弈樹的基本建筑材料[1]1.結(jié)(nodes):2.枝(branches):3.信息集(informationsets)博弈樹的基本建筑材料[1]1.結(jié)(nodes):博弈樹的基本建筑材料[1]1.結(jié)(nodes):初始結(jié)(beginingnodes)決策結(jié)(decisionnodes)終點(diǎn)結(jié)(terminalnodes)博弈從空心圓開(kāi)始,空心圓表示開(kāi)始決策,A選擇后,博弈進(jìn)入標(biāo)有B的實(shí)心圓。初始結(jié)用其他決策結(jié)用博弈樹的基本建筑材料[1]1.結(jié)(nodes):博弈樹的基本建筑材料[2]2.枝(branches):是從一個(gè)決策結(jié)到它的直接后續(xù)結(jié)的連線,某一個(gè)枝代表參與人的一個(gè)行動(dòng)選擇。博弈樹的基本建筑材料[2]2.枝(branches):是從一博弈樹的基本建筑材料[2]3.信息集(informationsets):某個(gè)參與人都知道些什么。信息集是用來(lái)標(biāo)注某個(gè)人知道些什么信息的,不同的標(biāo)注表示這個(gè)人知道不同的信息。博弈樹上的所有決策結(jié)分割成不同的信息集。每一個(gè)信息集是決策結(jié)集合的一個(gè)子集,該子集包括所有滿足下列條件的決策結(jié)。(1)每一個(gè)決策結(jié)都是同一個(gè)參與人的決策結(jié)(2)該參與人知道博弈進(jìn)入該集合的某個(gè)決策結(jié),但不知道自己究竟處于哪一個(gè)決策結(jié)博弈樹的基本建筑材料[2]3.信息集(information2.3.2擴(kuò)展式表達(dá)坦白坦白不坦白(-8,-8)(0,-10)不坦白坦白囚徒困境不坦白(-10,0)(-1,-1)ABB2.3.2擴(kuò)展式表達(dá)坦白坦白不坦白(-8,-8)(0,-1案例案例一:姑娘(girl)愛(ài)上小伙子,父親(father)不同意。威脅說(shuō),如果分手,我們還是好父女,兩人和好;如果嫁給小伙子,那就一刀兩斷。局中人:姑娘(girl),父親(father)策略:
girl:分手,不分手
father:和好,不和好支付矩陣:案例案例一:姑娘(girl)愛(ài)上小伙子,父親(father)2.3.2擴(kuò)展式表達(dá)girl不分手和好不和好father(2,1)(1,0)father分手和好父女威脅不和好(1,1)(0,0)2.3.2擴(kuò)展式表達(dá)girl不分手和好不和好father(
和好不和好分手1,10,0不分手2,11,0girlfather和好不和好分手1,10,0不分手2,11,0有兩家房地產(chǎn)公司,決定是否開(kāi)發(fā)房地產(chǎn)。需求大,開(kāi)發(fā)者利潤(rùn)8千萬(wàn),不開(kāi)發(fā)者利潤(rùn)0。需求大,兩者都開(kāi)發(fā)利潤(rùn)各為4千萬(wàn)。需求小,開(kāi)發(fā)者利潤(rùn)1千萬(wàn),不開(kāi)發(fā)者利潤(rùn)0。需求小,兩者都開(kāi)發(fā)利潤(rùn)各為-3千萬(wàn)兩者都不開(kāi)發(fā)利潤(rùn)各為0。博弈樹:房地產(chǎn)開(kāi)發(fā)博弈I有兩家房地產(chǎn)公司,決定是否開(kāi)發(fā)房地產(chǎn)。博弈樹:房地產(chǎn)開(kāi)發(fā)博弈博弈樹:房地產(chǎn)開(kāi)發(fā)博弈IA
開(kāi)發(fā)不開(kāi)發(fā)
大小大小開(kāi)發(fā)不開(kāi)發(fā)開(kāi)不開(kāi)開(kāi)不開(kāi)開(kāi)不開(kāi)(4,4)(8,0)(-3,-3)(1,0)(0,8)(0,0)(0,1)(0,0)N1N2B1B2B3B4博弈樹:房地產(chǎn)開(kāi)發(fā)博弈IA開(kāi)發(fā)博弈樹:不允許的情形博弈樹:不允許的情形博弈樹的基本建筑材料[2]3.信息集(informationsets):某個(gè)參與人都知道些什么。信息集是用來(lái)標(biāo)注某個(gè)人知道些什么信息的,不同的標(biāo)注表示這個(gè)人知道不同的信息。博弈樹上的所有決策結(jié)分割成不同的信息集。每一個(gè)信息集是決策結(jié)集合的一個(gè)子集,該子集包括所有滿足下列條件的決策結(jié)。(1)每一個(gè)決策結(jié)都是同一個(gè)參與人的決策結(jié)(2)該參與人知道博弈進(jìn)入該集合的某個(gè)決策結(jié),但不知道自己究竟處于哪一個(gè)決策結(jié)博弈樹的基本建筑材料[2]3.信息集(information博弈樹:房地產(chǎn)開(kāi)發(fā)博弈IA
開(kāi)發(fā)不開(kāi)發(fā)
大小大小開(kāi)發(fā)不開(kāi)發(fā)開(kāi)不開(kāi)開(kāi)不開(kāi)開(kāi)不開(kāi)(4,4)(8,0)(-3,-3)(1,0)(0,8)(0,0)(0,1)(0,0)N1N2B1B2B3B4博弈樹:房地產(chǎn)開(kāi)發(fā)博弈IA開(kāi)發(fā)另一種描述:房地產(chǎn)開(kāi)發(fā)博弈IN
大(1/2)小(1/2)
開(kāi)發(fā)不開(kāi)發(fā)開(kāi)發(fā)不開(kāi)發(fā)開(kāi)發(fā)不開(kāi)發(fā)開(kāi)不開(kāi)開(kāi)不開(kāi)開(kāi)不開(kāi)(4,4)(8,0)(-3,-3)(1,0)(0,8)(0,0)(0,1)(0,0)AAB1B2B3B4另一種描述:房地產(chǎn)開(kāi)發(fā)博弈IN大(1/2)信息集:房地產(chǎn)博弈IIA
開(kāi)發(fā)不開(kāi)發(fā)
大小大小開(kāi)發(fā)不開(kāi)發(fā)開(kāi)不開(kāi)開(kāi)不開(kāi)開(kāi)不開(kāi)(4,4)(8,0)(-3,-3)(1,0)(0,8)(0,0)(0,1)(0,0)N1N2
B1
B2
B3
B4信息集:房地產(chǎn)博弈IIA開(kāi)發(fā)信息集:房地產(chǎn)博弈IIIA
開(kāi)發(fā)不開(kāi)發(fā)
大小大小開(kāi)發(fā)不開(kāi)發(fā)開(kāi)不開(kāi)開(kāi)不開(kāi)開(kāi)不開(kāi)(4,4)(8,0)(-3,-3)(1,0)(0,8)(0,0)(0,1)(0,0)N1N2
B1
B2
B3
B4信息集:房地產(chǎn)博弈IIIA開(kāi)發(fā)第二種描述:房地產(chǎn)開(kāi)發(fā)博弈IIIN
大(1/2)小(1/2)
開(kāi)發(fā)不開(kāi)發(fā)開(kāi)發(fā)不開(kāi)發(fā)開(kāi)發(fā)不開(kāi)發(fā)開(kāi)不開(kāi)開(kāi)不開(kāi)開(kāi)不開(kāi)(4,4)(8,0)(-3,-3)(1,0)(0,8)(0,0)(0,1)(0,0)AAB1B2B3B4第二種描述:房地產(chǎn)開(kāi)發(fā)博弈IIIN大(1/2)第三種描述:房地產(chǎn)博弈IVN
大小
開(kāi)不開(kāi)開(kāi)不開(kāi)開(kāi)發(fā)不開(kāi)發(fā)開(kāi)不開(kāi)開(kāi)不開(kāi)開(kāi)不開(kāi)(4,4)(8,0)(0,8)(0,0)(-3,-3)(1,0)(0,1)(0,0)B1B2
A1A2A3A4第三種描述:房地產(chǎn)博弈IVN囚徒困境Ⅰ
A
坦白抵賴坦白抵賴
BB坦白抵賴(-8,-8)(0,-10)(-10,0)(-1,-1)
B
坦白抵賴
坦白抵賴坦白抵賴
(-8,-8)(0,-10)(-10,0)(-1,-1)AA囚徒困境ⅠA坦白抵賴囚徒困境Ⅱ
A
坦白抵賴坦白抵賴
BB坦白抵賴(-8,-8)(0,-10)(-10,0)(-1,-1)
B
坦白抵賴
坦白抵賴坦白抵賴
(-8,-8)(0,-10)(-10,0)(-1,-1)AA囚徒困境ⅡA坦白抵賴2.4.1靜態(tài)博弈2.4.2動(dòng)態(tài)博弈第四節(jié)如何尋找博弈的均衡點(diǎn)第四節(jié)如何尋找博弈的均衡點(diǎn)納什均衡☆納什均衡的定義
對(duì)于一個(gè)給定的策略組合,如果各博弈方都沒(méi)有單獨(dú)改變策略組合的意愿,則稱該策略組合為納什均衡.☆納什均衡的一致預(yù)測(cè)性質(zhì)
各博弈方都能預(yù)測(cè)到,并且能預(yù)測(cè)到其他博弈方能預(yù)測(cè)到,能預(yù)測(cè)到其他博弈方也能預(yù)測(cè)到自己能預(yù)測(cè)到.納什均衡☆納什均衡的定義完全信息靜態(tài)博弈納什均衡
各博弈方同時(shí)決策,且所有博弈方對(duì)博弈中的各種情況下的得益都完全了解的博弈問(wèn)題。
1.基本分析思路和方法
2.納什均衡
3.無(wú)限策略博弈分析完全信息靜態(tài)博弈納什均衡各博弈方同時(shí)決策,且所有博弈1.基本分析思路和方法1優(yōu)勢(shì)策略均衡2箭頭法3畫線法4嚴(yán)格劣勢(shì)反復(fù)消去法1.基本分析思路和方法1優(yōu)勢(shì)策略均衡1優(yōu)勢(shì)策略均衡
不管其他博弈方選擇什么策略,一博弈方的某個(gè)策略給他帶來(lái)的得益始終高于其他策略,就稱此策略為“優(yōu)勢(shì)”一策略組合中的策略都是博弈方的優(yōu)勢(shì)策略,則稱該策略為“優(yōu)勢(shì)策略均衡”如“囚徒困境”1優(yōu)勢(shì)策略均衡不管其他博弈方選擇什么策略,2箭頭法
思路是:判斷各博弈方能否通過(guò)單獨(dú)改變自己的策略而改善自己的得益,如能,則引一箭頭。對(duì)可能的策略組合都考察過(guò)后,根據(jù)箭頭反映的情況來(lái)判斷博弈的結(jié)果。2箭頭法思路是:判斷各博弈方能否通過(guò)單犯人A犯人B坦白不坦白坦白-10,-100,-25不坦白-25,0-1,-1
按等待按5,14,4等待9,-10,0小豬大豬犯人A犯人B坦白不坦白坦白-10,-100,-25不坦白-2
足球演唱會(huì)足球2,10,0演唱會(huì)-1,-11,2王菲李亞鵬
某策略組合只有指向的箭頭,沒(méi)有指離的箭頭,則為穩(wěn)定性的策略組合足球演唱會(huì)足球2,10,0演唱會(huì)-1,-11,2王
正面方面正面-1,11,-1反面1,-1-1,1猜硬幣方蓋硬幣方正面方面正面-1,11,-1反面1,-1
溫馨提示
- 1. 本站所有資源如無(wú)特殊說(shuō)明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請(qǐng)下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請(qǐng)聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
- 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁(yè)內(nèi)容里面會(huì)有圖紙預(yù)覽,若沒(méi)有圖紙預(yù)覽就沒(méi)有圖紙。
- 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
- 5. 人人文庫(kù)網(wǎng)僅提供信息存儲(chǔ)空間,僅對(duì)用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對(duì)用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對(duì)任何下載內(nèi)容負(fù)責(zé)。
- 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請(qǐng)與我們聯(lián)系,我們立即糾正。
- 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶因使用這些下載資源對(duì)自己和他人造成任何形式的傷害或損失。
最新文檔
- Unit 1 Knowing me,knowing you Listening and speaking 說(shuō)課稿-2023-2024學(xué)年高一英語(yǔ)外研版(2019)必修第三冊(cè)
- Unit2 What is your hobby?Lesson 7(說(shuō)課稿)-2024-2025學(xué)年人教精通版英語(yǔ)六年級(jí)上冊(cè)001
- 2025合同模板股東協(xié)議 范本
- 25《憶讀書》說(shuō)課稿-2024-2025學(xué)年五年級(jí)上冊(cè)語(yǔ)文統(tǒng)編版
- 8空氣和我們的生活 說(shuō)課稿-2024-2025學(xué)年科學(xué)三年級(jí)上冊(cè)教科版
- 遼寧新風(fēng)系統(tǒng)施工方案
- 8 網(wǎng)絡(luò)新世界說(shuō)課稿-2024-2025學(xué)年道德與法治四年級(jí)上冊(cè)統(tǒng)編版
- 高空連廊除銹刷漆施工方案
- Unit 3 Asking the way(說(shuō)課稿)-2023-2024學(xué)年譯林版(三起)英語(yǔ)五年級(jí)下冊(cè)
- 修理廠與公司車合同范例
- 《工程測(cè)試技術(shù)》全套教學(xué)課件
- 自卸車司機(jī)實(shí)操培訓(xùn)考核表
- 教師個(gè)人基本信息登記表
- 中考現(xiàn)代文閱讀理解題精選及答案共20篇
- ESD測(cè)試作業(yè)指導(dǎo)書-防靜電手環(huán)
- 高頻變壓器的制作流程
- 春季開(kāi)學(xué)安全第一課PPT、中小學(xué)開(kāi)學(xué)第一課教育培訓(xùn)主題班會(huì)PPT模板
- JJG30-2012通用卡尺檢定規(guī)程
- 部編版人教版二年級(jí)上冊(cè)語(yǔ)文教材分析
- 艾賓浩斯遺忘曲線復(fù)習(xí)方法表格模板100天
- APR版制作流程
評(píng)論
0/150
提交評(píng)論