經(jīng)濟(jì)博弈論課件_第1頁
經(jīng)濟(jì)博弈論課件_第2頁
經(jīng)濟(jì)博弈論課件_第3頁
經(jīng)濟(jì)博弈論課件_第4頁
經(jīng)濟(jì)博弈論課件_第5頁
已閱讀5頁,還剩115頁未讀, 繼續(xù)免費(fèi)閱讀

下載本文檔

版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進(jìn)行舉報(bào)或認(rèn)領(lǐng)

文檔簡介

第五章有限理性和進(jìn)化博弈

本章介紹有限理性基礎(chǔ)上的進(jìn)化博弈分析。完全理性在現(xiàn)實(shí)中很難滿足,當(dāng)社會經(jīng)濟(jì)環(huán)境和決策問題較復(fù)雜時(shí),人們必須存在很大的理性局限。有限理性對人們的決策、行為選擇方式有很大影響,有限理性基礎(chǔ)上的博弈分析與完全理性博弈分析也有很大區(qū)別。進(jìn)化博弈分析是有限理性博弈分析的基本框架。本章介紹以最優(yōu)反應(yīng)動態(tài)和復(fù)制動態(tài)為核心,以進(jìn)化穩(wěn)定策略為基本均衡概念的進(jìn)化博弈分析,包括基本方法、概念和各種經(jīng)典模型等。第五章有限理性和進(jìn)化博弈本章介紹有限理性基礎(chǔ)上1本章分四節(jié)5.1有限理性博弈及其分析框架5.2最優(yōu)反應(yīng)動態(tài)5.3復(fù)制動態(tài)和進(jìn)化穩(wěn)定性:兩人對稱博弈5.4復(fù)制動態(tài)和進(jìn)化穩(wěn)定性:兩人非對稱博弈本章分四節(jié)5.1有限理性博弈及其分析框架25.1有限理性博弈及其分析框架5.1.1有限理性及其對博弈的影響5.1.2有限理性博弈分析框架5.1有限理性博弈及其分析框架5.1.1有限理性及其對博3

傳統(tǒng)的博弈均衡,特別是Nash均衡及其完美是以博弈規(guī)則、參與人的理性以及參與人的得益都是共同知識(commonknowledge)為前提的,這并不完全符合現(xiàn)實(shí)。進(jìn)化博弈的基本思路是:有限理性的經(jīng)濟(jì)主體不可能正確地知道自己所處的利害狀態(tài),它只是通過它認(rèn)為最有利的策略逐漸模仿下去,最終到達(dá)一種均衡狀態(tài)。在這樣變化的系統(tǒng)中,采用得益高的策略的參與人的比率逐漸上升。5.1.1有限理性及其對博弈的影響傳統(tǒng)的博弈均衡,特別是Nash均衡及其4

博弈論分析研究的是參與人在特定的問題中的行為和策略,因此重要的不是人們始終一貫的理性,而是在具體問題上的理性,因此在具體問題中完全理性的假定仍有可能成立,但理性的局限的情況也很普遍。在分析復(fù)雜問題時(shí)就可能具有很大的理性局限性。如果具體的博弈中博弈方不滿足完全理性的假設(shè),稱為有限理性博弈方(boundedlyrationalplayer),相應(yīng)地有有限理性博弈。完全理性包括理性知識、分析推理能力、識別判斷能力和準(zhǔn)確行為能力等多方面完美性要求,其中任何一方不完美就不是完全理性。但有限理性有多種情況和層次:較高的層次和較低的層次。有限理性意味著博弈方往往不會一開始就找到最優(yōu)策略而是會“在戰(zhàn)爭中學(xué)習(xí)戰(zhàn)爭”,必須通過“試錯”來尋找較好的策略。博弈論分析研究的是參與人在特定的問題中的行5

在有限理性博弈中具有真正穩(wěn)定性和較強(qiáng)預(yù)測能力的均衡,必須是能夠通過博弈方的模仿、學(xué)習(xí)的調(diào)整過程達(dá)到的,具有能經(jīng)受錯誤偏離的干擾的均衡,是在受到少量干擾后仍然能夠“恢復(fù)”的均衡。這時(shí)博弈分析的核心不是博弈方的最優(yōu)策略的選擇,而是有限理性的博弈方組成的群體成員的策略調(diào)整過程、趨勢和穩(wěn)定性,這里的穩(wěn)定性是指采用特定策略的成員的比例不變,而非某個(gè)博弈方的策略不變5.1.2有限理性博弈分析框架在有限理性博弈中具有真正穩(wěn)定性和較強(qiáng)預(yù)測能力6

有限理性博弈分析的關(guān)鍵是確定博弈方學(xué)習(xí)和調(diào)整的模式(機(jī)制),進(jìn)化博弈主要采用的是生物進(jìn)化的“模仿者動態(tài)”機(jī)制模擬博弈方的學(xué)習(xí)和動態(tài)調(diào)整,但由于博弈方的學(xué)習(xí)能力的差異,需要多種機(jī)制來模擬。

最優(yōu)反應(yīng)動態(tài):有快速學(xué)習(xí)能力的小群體成員的反復(fù)博弈復(fù)制動態(tài):學(xué)習(xí)速度很慢的成員組成的大群體隨機(jī)配對的反復(fù)博弈進(jìn)化穩(wěn)定策略(ESS)有限理性博弈分析的關(guān)鍵是確定博弈方學(xué)習(xí)和調(diào)整75.2最優(yōu)反應(yīng)動態(tài)5.2.1協(xié)調(diào)博弈的有限博弈方快速學(xué)習(xí)模型5.2.2古諾調(diào)整過程5.2最優(yōu)反應(yīng)動態(tài)5.2.1協(xié)調(diào)博弈的有限博弈方快速學(xué)習(xí)85.2.1協(xié)調(diào)博弈的有限博弈方快速學(xué)習(xí)模型前提:少數(shù)有快速學(xué)習(xí)能力的有限理性的博弈方之間的反復(fù)博弈和策略進(jìn)化這種分析框架對博弈方的理性假設(shè)為相當(dāng)快的學(xué)習(xí)能力,雖然在復(fù)雜局面下準(zhǔn)確判斷分析和運(yùn)用預(yù)見性的能力較差,但它們能對不同策略的結(jié)果作出比較正確的事后評估并相應(yīng)地調(diào)整策略。5.2.1協(xié)調(diào)博弈的有限博弈方快速學(xué)習(xí)模型前提:少數(shù)有快速95.2.1協(xié)調(diào)博弈的有限博弈方快速學(xué)習(xí)模型50,500,4960,6049,0A博弈方2BAB博弈方1協(xié)調(diào)博弈通過納什均衡分析不難發(fā)現(xiàn),該博弈有兩個(gè)純策略納什均衡A,A)和(B,B)。這兩個(gè)納什均衡中,后者明顯帕累托優(yōu)于前者。前者是相對于后名的風(fēng)險(xiǎn)上策均衡。因此、如果是在完全理性博弈方之間進(jìn)行這個(gè)博棄,通常的預(yù)測結(jié)果應(yīng)該是(B,B),但如果我們考慮博弈方相互對對方理性的信任問題,或者對風(fēng)險(xiǎn)的敏感性等因素,那么風(fēng)險(xiǎn)上策均衡(A,A)可能是更好的預(yù)測:也就是說,由于該博弈是一個(gè)有多重納什均衡的博弈,因此在一次性博弈中,博弈結(jié)果也有不確定性,很難作出完全保險(xiǎn)的預(yù)測。這種協(xié)調(diào)博弈正是人們在決策方面經(jīng)常遇到的難題。5.2.1協(xié)調(diào)博弈的有限博弈方快速學(xué)習(xí)模型50,500,4105.2.1協(xié)調(diào)博弈的有限博弈方快速學(xué)習(xí)模型50,500,4960,6049,0A博弈方2BAB博弈方1協(xié)調(diào)博弈12345假設(shè)共有5個(gè)博弈方分別處于如圖中圓周上的5個(gè)位置上(可理解為5戶居民環(huán)山而居),每戶居民都與各白的左右鄰居反復(fù)博弈。5.2.1協(xié)調(diào)博弈的有限博弈方快速學(xué)習(xí)模型50,500,411反應(yīng)、策略調(diào)整規(guī)則推導(dǎo)假設(shè)為在t時(shí)期博弈方i的鄰居中采用A策略鄰居的數(shù)量,該數(shù)量有0、1、2三個(gè)可能的值。采用B策略鄰居的數(shù)量相應(yīng)為2-,也有0、1、2三個(gè)可能值。50,500,4960,6049,0A博弈方2BAB博弈方1協(xié)調(diào)博弈12345反應(yīng)、策略調(diào)整規(guī)則推導(dǎo)假設(shè)為在t時(shí)期博弈方i12由于取0、1、2三個(gè)整數(shù)。因此上述反應(yīng)規(guī)則實(shí)際就是。如果在t時(shí)期博弈方i的兩個(gè)鄰居中只要有1個(gè)采用A,那么博弈方在在t+1時(shí)期采用A.如果兩個(gè)鄰居都沒有采用A。那么博弈方i在t+1時(shí)期采用B。特點(diǎn):博弈方i在t+1時(shí)期的策略與自己在第t期采取策略反而沒有直接關(guān)系;50,500,4960,6049,0A博弈方2BAB博弈方1協(xié)調(diào)博弈12345由于取0、1、2三個(gè)整數(shù)。因此上述反應(yīng)規(guī)13最優(yōu)反應(yīng)動態(tài)模擬:初次博弈1個(gè)AABABABABBBAAAAABAAAABAABB5個(gè)博弈方經(jīng)過4個(gè)時(shí)期的調(diào)整,最終收斂到了所有博弈方都采用A的穩(wěn)定狀態(tài)。最優(yōu)反應(yīng)動態(tài)模擬:初次博弈1個(gè)AABABABABBBAAAA14初次博弈相鄰2個(gè)AAAAAAAABAABBBAA初次博弈相鄰2個(gè)AAAAAAAABAABBBAA15初次博弈相連3個(gè)ABAABAAAAAA初次博弈相連3個(gè)ABAABAAAAAA16結(jié)論:除了初次博弈時(shí)所有博弈方都采用B的一種情況以外,從其余所有的情況出發(fā),經(jīng)過或多或少時(shí)期的最優(yōu)反應(yīng)動態(tài)法則的調(diào)整,最終都會收斂到所有博弈方都采用A的穩(wěn)定狀態(tài)。上述分析證明了在上述設(shè)定下,所有32種可能種初次博弈情況中,只有一種是穩(wěn)定于所有博弈方采用B的狀態(tài),其余31種都會收斂到采用A的狀態(tài)。這說明所有博弈方都采用A策略和所有博弈方都采用B策略都是有限理性博弈方進(jìn)行協(xié)調(diào)博弈的穩(wěn)定狀態(tài)。所有博弈方都采用A的穩(wěn)定狀態(tài)是具有穩(wěn)健性的,相反,所有博弈方都采用B的均衡狀態(tài)卻不是穩(wěn)健的。結(jié)論:除了初次博弈時(shí)所有博弈方都采用B的一種情況以外,從其余17在上述協(xié)調(diào)博弈最優(yōu)反應(yīng)動態(tài)的兩種穩(wěn)定狀態(tài)中,只有所有博弈方都采用A的一種同時(shí)具有在博弈方的動態(tài)策略調(diào)整中會達(dá)到,又對少量偏離的擾動有穩(wěn)健性兩個(gè)性質(zhì)。同時(shí)具有這兩種性質(zhì)的穩(wěn)定狀態(tài),在進(jìn)化博弈論中被稱為“進(jìn)化穩(wěn)定策略”A稱為進(jìn)化穩(wěn)定策略,B則不是進(jìn)化穩(wěn)定策略。因?yàn)橐坏┠硞€(gè)博弈方偏離B,那么最優(yōu)反應(yīng)動態(tài)會使博弈方的策略離該狀態(tài)越來越遠(yuǎn),因此該均衡并不是真正穩(wěn)定的。在上述協(xié)調(diào)博弈最優(yōu)反應(yīng)動態(tài)的兩種穩(wěn)定狀態(tài)中,只有所185.2.2古諾調(diào)整過程古諾模型反應(yīng)函數(shù)1博弈方12.5博弈方23最優(yōu)反應(yīng)動態(tài)模擬:不難看出,上述動態(tài)調(diào)整過程趨向收斂于兩寡頭各生產(chǎn)2單位產(chǎn)量,也就是完全理性博弈的古諾產(chǎn)量,也就是惟一的純策略納什均衡。這正是這個(gè)有限理性博弈的穩(wěn)定狀態(tài),由于這個(gè)穩(wěn)定狀態(tài)也具有對微小擾動的穩(wěn)健性,因此它是這個(gè)博弈在上述最優(yōu)反應(yīng)動態(tài)下的進(jìn)化穩(wěn)定策略(ESS)。假設(shè):這兩個(gè)博弈方都是有限理性的,但都屬于知道自己的反應(yīng)函數(shù)(意味著知道自己的利潤函數(shù)),只是不知道對方的利潤、反應(yīng)函數(shù),也沒有預(yù)見能力。21.51.7532.2152.2541.8751.9375……5.2.2古諾調(diào)整過程古諾模型反應(yīng)函數(shù)195.3復(fù)制動態(tài)和進(jìn)化穩(wěn)定性:

兩人對稱博弈5.3.1簽協(xié)議博弈的復(fù)制動態(tài)和進(jìn)化穩(wěn)定策略5.3.2一般兩人對稱博弈復(fù)制動態(tài)和進(jìn)化穩(wěn)定策略5.3.3協(xié)調(diào)博弈的復(fù)制動態(tài)和進(jìn)化穩(wěn)定博弈5.3.4鷹鴿博弈的復(fù)制動態(tài)和進(jìn)化穩(wěn)定策略5.3.5蛙鳴博弈的復(fù)制動態(tài)和進(jìn)化穩(wěn)定策略5.3復(fù)制動態(tài)和進(jìn)化穩(wěn)定性:

兩人對稱博弈5.3205.3.1簽協(xié)議博弈的復(fù)制動態(tài)和進(jìn)化穩(wěn)定策略簽協(xié)議博弈:1,10,00,00,0同意博弈方2不同意同意不同意博弈方1兩個(gè)純策略納什均衡:(同意,同意),(不同意,不同意),前一個(gè)納什均衡帕累托優(yōu)于后一個(gè)納什均衡。假如是在完全理性的基礎(chǔ)上進(jìn)行該博弈,可以預(yù)期結(jié)果是(同意,同意)。下面是在理性層次較低的有限理性博弈方組成的大群體成員隨機(jī)配對反復(fù)博弈的分析框架內(nèi)進(jìn)行分析。5.3.1簽協(xié)議博弈的復(fù)制動態(tài)和進(jìn)化穩(wěn)定策略簽協(xié)議博弈:1215.3.1簽協(xié)議博弈的復(fù)制動態(tài)和進(jìn)化穩(wěn)定策略

假設(shè)群體中采用“同意”博弈方的比例x,則不同策略期望得益和平均得益為:簽協(xié)議博弈:1,10,00,00,0同意博弈方2不同意同意不同意博弈方15.3.1簽協(xié)議博弈的復(fù)制動態(tài)和進(jìn)化穩(wěn)定策略22根據(jù)上述結(jié)果可以看出,除非x=0(即所有博弈方都是“不同意”類型),否則兩類博弈方的得益就有明顯差異,“同意”類型博弈方的得益高于“不同意”類型的,也高于平均得益(因?yàn)?<x<1),“不同意”類型的則低于“同意”類型的得益和平均得益。只要博弈方有基本的、包括直覺和經(jīng)驗(yàn)的判斷能力,早晚會發(fā)現(xiàn)上述得益差異,得益較差類型的博弈方或早或遲會發(fā)現(xiàn)改變策略對自己是有利的,并開始模仿另一種類型的博棄方。這意味著兩種類型博弈方的比例x和1-x不是固定不變的,而是隨時(shí)間變化的,可以寫成時(shí)間的函數(shù)。根據(jù)上述結(jié)果可以看出,除非x=0(即所有博弈方都23博弈方策略類型比例動態(tài)變化是有限理性博弈分析的核心,其關(guān)鍵是動態(tài)變化的速度模仿的速度取決于兩個(gè)因素,一是模仿對象的數(shù)量大小(可用相應(yīng)類型博弈方的比例表示),因?yàn)檫@關(guān)系到觀察和模仿的難易程度;二是模仿對象的成功程度(可用模仿對象策略得益超過平均得益的幅度表示),因?yàn)檫@關(guān)系到判斷差異的難易程度和對模仿激勵的大小。以采用“同意”策略類型博弈方的比例為例,其動態(tài)變化速度可用下列微分方程反映:博弈方策略類型比例動態(tài)變化是有限理性博弈分析的核心,其關(guān)鍵是24動態(tài)微分方程的相位圖dx/dtx010.5穩(wěn)定狀態(tài)、不動點(diǎn):x*=0,x*=1可以看出,只有開始時(shí)所有博弈方都采用“不同意”策略,沒有一個(gè)博弈方采用“同意”策略,即x=0。除此以外,該博弈從其他所有初始情況出發(fā)的復(fù)制動態(tài)過程,最終都會使所有博弈方都趨向于“同意”,也就是x=1。動態(tài)微分方程的相位圖dx/dtx010.5穩(wěn)定狀態(tài)、不動點(diǎn):25需要注意的是,即使上述學(xué)習(xí)過程已經(jīng)停止了,意味著所有博弈方都通過學(xué)習(xí)找到了最好的策略,也不能排除博弈方還會“犯錯誤”,也就是說博弈方仍然可能偏離上述復(fù)制動態(tài)收斂到的納什均衡策略。這給我們提出的進(jìn)一步問題是:如果博棄方的策略偏離復(fù)制動態(tài)收斂到的穩(wěn)定狀態(tài),學(xué)習(xí)過程是否還會再回到同樣的穩(wěn)定狀態(tài)?或者換句話說,復(fù)制動態(tài)收斂到的穩(wěn)定狀態(tài)對于少量“錯誤”的干擾具有穩(wěn)健性嗎?需要注意的是,即使上述學(xué)習(xí)過程已經(jīng)停止了,意味著所26進(jìn)化穩(wěn)定策略的檢驗(yàn)因?yàn)榍医咏?,因此犯錯誤博弈方的期望得益遠(yuǎn)遠(yuǎn)低于沒有犯錯誤的博弈方,也遠(yuǎn)低于群體平均得益,因此犯錯誤的博弈方會逐步改正錯誤,最終仍然會趨向于x=1,即所有博弈方都采用“同意”策略。進(jìn)化穩(wěn)定策略的檢驗(yàn)因?yàn)?7進(jìn)化穩(wěn)定策略的檢驗(yàn)進(jìn)化穩(wěn)定策略的檢驗(yàn)285.3.2一般兩人對稱博弈復(fù)制動態(tài)

和進(jìn)化穩(wěn)定策略一般模型a,ac,bd,db,c策略1博弈方2策略2策略1策略2博弈方1一般2X2對稱博弈進(jìn)化博弈設(shè)定是在一個(gè)大群體的成員中進(jìn)行隨機(jī)配對的反復(fù)博弈?;灸P褪莾蓚€(gè)博弈方之間的對稱博弈。含義是兩個(gè)博弈位置是無差異的。其中a、b、c、d可以是任何得益,根據(jù)問題設(shè)定。5.3.2一般兩人對稱博弈復(fù)制動態(tài)

和進(jìn)化穩(wěn)定29復(fù)制動態(tài)分析dx/dtx1x復(fù)制動態(tài)的進(jìn)化規(guī)則是生物學(xué)中生物特征進(jìn)化規(guī)則設(shè)x為采用策略1的比例復(fù)制動態(tài)相位圖復(fù)制動態(tài)方程:a,ac,bd,db,c策略1博弈方2策略2策略1策略2博弈方1一般2X2對稱博弈復(fù)制動態(tài)分析dx/dtx1x復(fù)制動態(tài)的進(jìn)化規(guī)則是生物學(xué)中生物30復(fù)制動態(tài)分析dx/dtx1X復(fù)制動態(tài)的進(jìn)化規(guī)則是生物學(xué)中生物特征進(jìn)化規(guī)則設(shè)x為采用策略1的比例復(fù)制動態(tài)相位圖復(fù)制動態(tài)方程:穩(wěn)定性定理:設(shè),穩(wěn)健狀態(tài)處F(x)的導(dǎo)數(shù)F’(x),即該處切線的斜率小于0。復(fù)制動態(tài)分析dx/dtx1X復(fù)制動態(tài)的進(jìn)化規(guī)則是生物學(xué)中生物3150,500,4960,6049,0策略1博弈方2策略2策略1策略2博弈方1一般2*2對稱博弈dx/dtx111/61復(fù)制動態(tài)方程:復(fù)制動態(tài)相位圖根據(jù)穩(wěn)定性定理,x=0,x=1是該博弈的進(jìn)化穩(wěn)定策略,而X=11/61不是該博弈的進(jìn)化穩(wěn)定策略。5.3.3協(xié)調(diào)博弈的復(fù)制動態(tài)和進(jìn)化穩(wěn)定博弈50,500,4960,6049,0策略1博弈方2策略2策略325.3.3協(xié)調(diào)博弈的復(fù)制動態(tài)和進(jìn)化穩(wěn)定博弈50,500,4960,6049,0策略1博弈方2策略2策略1策略2博弈方1一般2*2對稱博弈dx/dtx111/61復(fù)制動態(tài)相位圖根據(jù)上述復(fù)制動態(tài)相位圖我們進(jìn)一步可以得出結(jié)論,那就是當(dāng)初始的x水平落在區(qū)間(0,11/61)時(shí),復(fù)制動態(tài)會趨向于穩(wěn)定狀態(tài)x=0,即所有博弈方都采用策略2。而當(dāng)初始的x水平落在區(qū)間(11/61,1)時(shí),復(fù)制動態(tài)會趨向于x=1,即所有博弈方都采用策略1。5.3.3協(xié)調(diào)博弈的復(fù)制動態(tài)和進(jìn)化穩(wěn)定博弈50,500,4335.3.3協(xié)調(diào)博弈的復(fù)制動態(tài)和進(jìn)化穩(wěn)定博弈50,500,4960,6049,0策略1博弈方2策略2策略1策略2博弈方1一般2*2對稱博弈dx/dtx111/61復(fù)制動態(tài)相位圖如果初次進(jìn)行這個(gè)博弈時(shí)群體成員采用兩種策略的比例落在[o,1]區(qū)間任—點(diǎn)的概率相同、那么通過復(fù)制動態(tài)最終實(shí)現(xiàn)前一種更高效率進(jìn)化穩(wěn)定策略均衡的機(jī)會是11/61,實(shí)現(xiàn)后一種相對較差進(jìn)化穩(wěn)定策略均衡的機(jī)會都有50/61,后者得益明顯大于前者。5.3.3協(xié)調(diào)博弈的復(fù)制動態(tài)和進(jìn)化穩(wěn)定博弈50,500,434這個(gè)結(jié)論也說明,有限理性博弈方通過復(fù)制動態(tài)的學(xué)習(xí)和策略調(diào)整,也并不—定能實(shí)現(xiàn)最理想的結(jié)果,并不一定能實(shí)現(xiàn)最優(yōu)化,往往只能實(shí)現(xiàn)次佳的結(jié)果。上述結(jié)果的另—個(gè)重要意義是,復(fù)制動態(tài)進(jìn)化博弈的結(jié)果常常是取決于帶有很大偶然性的初始狀態(tài)的,事實(shí)上這也正是為什么在相似的規(guī)律作用下,事物的形態(tài)特點(diǎn)會如此豐富多彩的根本原因。這個(gè)結(jié)論也說明,有限理性博弈方通過復(fù)制動態(tài)的學(xué)習(xí)355.3.4鷹鴿博弈的復(fù)制動態(tài)和進(jìn)化穩(wěn)定策略,0,v,v,0鷹博弈方2鴿?jì)楕澆┺姆?鷹鴿博弈該博弈的納什均衡取決于v和c的具體數(shù)值。5.3.4鷹鴿博弈的復(fù)制動態(tài)和進(jìn)化穩(wěn)定策略,0,v365.3.4鷹鴿博弈的復(fù)制動態(tài)

和進(jìn)化穩(wěn)定策略,0,v,v,0鷹博弈方2鴿?jì)楕澆┺姆?鷹鴿博弈這是一個(gè)2×2對稱博弈,因此可以直接用2×2對稱博弈復(fù)制動態(tài)的一般公式。設(shè)x表示采用“鷹”策略博弈方的比例,則采用“鷹”策略博弈方比例的復(fù)制動態(tài)方程為:5.3.4鷹鴿博弈的復(fù)制動態(tài)

和進(jìn)化穩(wěn)定策略,0,37,0,v,v,0鷹博弈方2鴿?jì)楕澆┺姆?鷹鴿博弈取v=2,c=12,則復(fù)制動態(tài)方程為:三個(gè)穩(wěn)定狀態(tài)分別為:x*=0,x*=1和x*=1/6。因?yàn)镕’(0)>0,F’(1)>0而F’(16)<0,所以x*=1/6是進(jìn)化穩(wěn)定策略。,0,v,v,0鷹博弈方2鴿?jì)楕澆?8復(fù)制動態(tài)方程和相位圖dx/dtx11/6實(shí)際上,從復(fù)制相位圖也可看出x*=1/6是進(jìn)化穩(wěn)定策略。復(fù)制動態(tài)方程和相位圖dx/dtx11/6實(shí)際上,從復(fù)制相位圖39結(jié)論的現(xiàn)實(shí)意義:當(dāng)人們爭奪、競爭的利益利嚴(yán)重沖突的后果損失符合上述設(shè)定時(shí),在較大規(guī)模群體長期的進(jìn)化中,采取攻擊型策略的博弈方購數(shù)量最終會穩(wěn)定在1/6左右的水平,大多數(shù)人(5/6)會采用比較和平的策略。這意味著發(fā)生嚴(yán)重戰(zhàn)爭的機(jī)會雖然存在,但可能性比較小(大約1/36),相互間和平共處的可能性最大(約占25/36),比較忍讓的一方受到比較霸道一方欺負(fù)的機(jī)會居中(約占10/36)。這是比較穩(wěn)定的狀態(tài),實(shí)際情況通常會在該水平上下波動。這樣的格局與國際政治、軍事關(guān)系的實(shí)際情況是很相似的。結(jié)論的現(xiàn)實(shí)意義:當(dāng)人們爭奪、競爭的利益利嚴(yán)重沖突405.3.5蛙鳴博弈的復(fù)制動態(tài)

和進(jìn)化穩(wěn)定策略動物進(jìn)化競爭是生物多樣性、復(fù)雜性的基本機(jī)制蛙鳴博弈:P-z,P-z1-m,m-z0,0m-z,1-m鳴叫雄蛙2不鳴鳴叫不鳴雄蛙1假設(shè):在某一范圍內(nèi)有兩只雄蛙。如果它們都不鳴叫,則吸引來的蛙數(shù)量為0,即它們都沒有交配的機(jī)會;如果有一只雄蛙鳴叫,那么會吸引來1只雌蛙,而鳴叫的雄蛙獲交配的機(jī)會為m,0.5<m<1,但鳴叫者有成本z;如果它們都鳴叫,則各能吸引P只雌蛙,或者說獲得交配的機(jī)會為P,m<p<1,此時(shí)各有成本z。5.3.5蛙鳴博弈的復(fù)制動態(tài)

和進(jìn)化穩(wěn)定策41P-z,P-z1-m,m-z0,0m-z,1-m鳴叫雄蛙2不鳴鳴叫不鳴雄蛙1

如果m-z<0,也就是m<z,那么因?yàn)閜<1,因此必然有P-z<1-m。根據(jù)上述假設(shè),首先可知P-z>m-z是成立的。因?yàn)榧僭O(shè)1>P>m這時(shí)候兩雄蛙都不鳴是該博弈惟一的納什均衡。因?yàn)樵谶@種情況下鳴叫總是不合算的,不鳴叫是雙方的上策。P-z,P-z1-m,m-z0,0m-z,42根據(jù)上述假設(shè),首先可知:P-z>m-z是成立的。

如果m-z>0,也就是m>z,但P-z<1-m仍然成立,則p-1+m<z<m。P-z,P-z1-m,m-z0,0m-z,1-m鳴叫雄蛙2不鳴鳴叫不鳴雄蛙1此時(shí)還存在一個(gè)混合策略的納什均衡,兩蛙都以一定的概率隨機(jī)決定是否鳴叫。根據(jù)上述假設(shè),首先可知:P-z>m-z是成立的。43根據(jù)上述假設(shè),首先可知:P-z>m-z是成立的。如果在m-z>0的情況下,p-z>1-m。P-z,P-z1-m,m-z0,0m-z,1-m鳴叫雄蛙2不鳴鳴叫不鳴雄蛙1那么兩雄蛙都鳴叫是惟一的純策略納什均衡,因?yàn)榇藭r(shí)鳴叫對兩雄蛙來說都是上策。根據(jù)上述假設(shè),首先可知:P-z>m-z是成立的。44蛙鳴博弈不同均衡的條件Z11鳴叫混合策略不鳴叫m=1-P+zm=z分析結(jié)論說明:在這個(gè)蛙鳴博弈中,除了鳴叫與不鳴叫在吸引雌蛙和獲得交配機(jī)會方面的差異以外,鳴叫的成本代價(jià)大小也是決定雄蛙是否鳴叫的關(guān)鍵因素。m>zp-z>1-mp-z<1-mm>zm<zm0蛙鳴博弈不同均衡的條件Z1鳴叫混合策略不鳴叫m=1-P+zm45蛙鳴博弈復(fù)制動態(tài)方程和不動點(diǎn)x——鳴叫雄蛙比例可能的不動點(diǎn):x*=0x*=1x*=(m-z)/(1-p)復(fù)制動態(tài)方程蛙鳴博弈復(fù)制動態(tài)方程和不動點(diǎn)x——鳴叫雄蛙比例可能的不動點(diǎn):46蛙鳴博弈復(fù)制動態(tài)相位圖xdx/dt1(m-z)/(1-P)<0dx/dtx1(m-z)/(1-P)0<(m-z)/(1-P)<1xdx/dt1(m-z)/(1-P)>1蛙鳴博弈復(fù)制動態(tài)相位圖xdx/dt1(m-z)/(1-P)<47蛙鳴博弈復(fù)制動態(tài)相位圖x1(m-z)/(1-P)當(dāng)0<(m-z)/(1-P)<1時(shí),有3個(gè)穩(wěn)定狀態(tài):x*=0,x*=1,x*=(m-z)/(1-p)其中只有x*=(m-z)/(1-p)是進(jìn)化穩(wěn)定策略。

這意味著如果上述由環(huán)境條件等決定的蛙鳴的利益關(guān)系是穩(wěn)定的,那么一旦發(fā)生少數(shù)雄蛙從不鳴到鳴叫的變異,那么這種變異雄蛙的數(shù)量會不斷增加,直到達(dá)到占整個(gè)雄蛙數(shù)量的比重為x*=(m-z)/(1-P)。如果雄蛙中鳴叫雄蛙所占比重超過這個(gè)水平,甚至全部是鳴叫的,那么這時(shí)候少量不鳴叫的變異則又會在種群中擴(kuò)散,因?yàn)榇藭r(shí)不鳴叫雄蛙“搭便車”的機(jī)會和利益特別大,最終仍然會回到x*=(m-z)/(1-P)的均衡比例。蛙鳴博弈復(fù)制動態(tài)相位圖x1(m-z)/(1-P)當(dāng)0<(m-48蛙鳴博弈復(fù)制動態(tài)相位圖xdx/dt1當(dāng)(m-z)/(1-P)<0時(shí)有2個(gè)穩(wěn)定狀態(tài):x*=0,x*=1

這意味著如果從所有雄蛙都是不鳴叫的開始,那么即使出現(xiàn)少量鳴叫的變異,它們也很快就會消失掉。只要不是開始時(shí)所有雄蛙都是鳴叫的極端情況,最終都會在長期的動態(tài)變化中趨向于不鳴叫。即使是所有雄蛙都鳴叫的極端情況,也是一旦出現(xiàn)變異,變異就會不斷擴(kuò)散,最終還是會趨向于所有雄蛙都不鳴叫的均衡。這種情況往往是鳴叫成本很大,或青蛙天敵很多,鳴叫的成本代價(jià)大大超過鳴叫的好處時(shí)是合理的

根據(jù)上述相位圖不難看出,這時(shí)候復(fù)制動態(tài)的惟一穩(wěn)定的均衡點(diǎn),也就是ESS為x*=0,也就是所有雄蛙都是不鳴叫的。蛙鳴博弈復(fù)制動態(tài)相位圖xdx/dt1當(dāng)(m-z)/(1-P)49蛙鳴博弈復(fù)制動態(tài)相位圖xdx/dt1(m-z)/(1-P)>1當(dāng)(m-z)/(1-P)>1時(shí)有2個(gè)穩(wěn)定狀態(tài):x*=0,x*=1根據(jù)該相位圖可以看出,現(xiàn)在的進(jìn)化穩(wěn)定策略是x*=1,也就是所有雄蛙都鳴叫。這種情況在青蛙的天敵較少,而且氣候不是很寒冷,從而鳴叫的好處大大超過成本代價(jià)時(shí)是合理的。蛙鳴博弈復(fù)制動態(tài)相位圖xdx/dt1(m-z)/(1-P)>505.4復(fù)制動態(tài)和進(jìn)化穩(wěn)定性:

兩人非對稱博弈5.4.1市場阻入博弈的復(fù)制動態(tài)和進(jìn)化穩(wěn)定策略5.4.2非對稱鷹鴿博弈的進(jìn)化分析5.4復(fù)制動態(tài)和進(jìn)化穩(wěn)定性:

兩人非對稱博弈5515.4.1市場阻入博弈的復(fù)制動態(tài)和進(jìn)化穩(wěn)定策略12進(jìn)入不進(jìn)打擊不打(0,0)(2,2)(1,5)0,02,21,51,5打擊不打博弈方2博弈方1進(jìn)入不進(jìn)這個(gè)博弈的兩個(gè)博弈方既不是同時(shí)選擇,且策略選擇和得益情況也不對稱,因此是一個(gè)非對稱的兩人博弈。兩個(gè)納什均衡策略組合,即(進(jìn),不打)和(不進(jìn),打擊)。(進(jìn),不打擊)是子博弈納什均衡。分析框架:反復(fù)在兩個(gè)群體中各隨機(jī)抽取一個(gè)成員配對進(jìn)行博弈,博弈方的學(xué)習(xí)和策略模仿局限在他們所在的群體內(nèi)部,策略調(diào)整的機(jī)制仍然是與兩人對稱博弈中相似的復(fù)制動態(tài)。5.4.1市場阻入博弈的復(fù)制動態(tài)和進(jìn)化穩(wěn)定策略12進(jìn)入不進(jìn)525.4.1市場阻入博弈的復(fù)制動態(tài)和進(jìn)化穩(wěn)定策略在有限理性基礎(chǔ)上分析假設(shè)博弈方1位置博弈的群體中,采取“進(jìn)”策略的博弈方比例為x,那么采用“不進(jìn)”策略的比例為1-x;假設(shè)博弈方2位置博弈的群體中,采取“打擊”策略的博弈方比例為y,那么采用“不打擊”策略的比例為1-y。則0,02,21,51,5打擊y不打1-y博弈方2博弈方1進(jìn)入x不進(jìn)1-x5.4.1市場阻入博弈的復(fù)制動態(tài)和進(jìn)化穩(wěn)定策略在有限理性基53博弈方1位置博弈群體復(fù)制動態(tài)相位圖xdx/dt1y>1/2xdx/dt1y<1/2dx/dtx1y=1/2xy111/20博弈方1位置博弈群體復(fù)制動態(tài)相位圖xdx/dt1y>1/2x54博弈方2位置博弈群體復(fù)制動態(tài)相位圖xdy/dt1x=0xdy/dt1x=0.xy111/20博弈方2位置博弈群體復(fù)制動態(tài)相位圖xdy/dt1x=0x55兩群體復(fù)制動態(tài)的關(guān)系和穩(wěn)定性根據(jù)圖中反映的復(fù)制動態(tài)和穩(wěn)定性,不難看出本博弈的進(jìn)化穩(wěn)定策略只有x*=1和y*=0一點(diǎn),其他所有點(diǎn)都不是復(fù)制動態(tài)中收斂和只有抗擾動的穩(wěn)定狀態(tài),這意味著有限理性的博弈方通過長期反復(fù)博弈,學(xué)習(xí)和調(diào)整策略則結(jié)果是,潛在進(jìn)入備最終都會進(jìn)入市場競爭,而先占領(lǐng)市場的阻入一方則會放棄采取不理智的報(bào)復(fù)措施。這與完全理性條件下博弈的子博弈完美納什均衡完全一致,說明在這個(gè)問題上有限理性的博弈方通過學(xué)習(xí)是能夠?qū)W握子博弈完美納什均衡策略的。xy111/20兩群體復(fù)制動態(tài)的關(guān)系和穩(wěn)定性根據(jù)圖中反映的復(fù)制565.4.2非對稱鷹鴿博弈的進(jìn)化分析鷹博弈方1鴿?jì)棽┺姆?鴿?jì)梱博弈方1鴿1-x鷹x博弈方2鴿1-y5.4.2非對稱鷹鴿博弈的進(jìn)化分析鷹博鴿?jì)棽┺姆?鴿?jì)梱博57非對稱鷹鴿博弈博弈方1群體復(fù)制動態(tài)相位圖xdx/dt1y>5/6xdx/dt1y<5/6xdx/dt1y=5/6xY115/60非對稱鷹鴿博弈博弈方1群體復(fù)制動態(tài)相位圖xdx/dt1y>558非對稱鷹鴿博弈博弈方2群體復(fù)制動態(tài)相位圖ydy/dt1x>1/6ydy/dt1ydy/dt1x=1/6x<1/6xY111/60非對稱鷹鴿博弈博弈方2群體復(fù)制動態(tài)相位圖ydy/dt1x>159兩群體復(fù)制動態(tài)關(guān)系和穩(wěn)定性

根據(jù)圖中箭頭的方向不難看出,在非對稱鷹鴿博弈中,x*=1、y*=0和x*=0、y*=1是這個(gè)博弈的進(jìn)化穩(wěn)定策略。在這個(gè)博弈的復(fù)制動態(tài)進(jìn)化博弈中,當(dāng)初始情況落在A區(qū)域時(shí)會收斂到進(jìn)化穩(wěn)定策略x*=0、y*=1,即博弈方1位置群體都采用“鴿”策略,博弈方2位置群體都采用“鷹”策略;當(dāng)初始情況落在D區(qū)域時(shí),會收斂到進(jìn)化穩(wěn)定策略x*=1、y*=0,即博弈方1位置群體部采用“鷹”策略,博弈方2位置群體都采用“鴿”策略;當(dāng)初始情況落在B和C兩個(gè)區(qū)域時(shí),大部分可能性也是最終收斂列進(jìn)化穩(wěn)定策略x*=1、y*=0。因此在本博弈中。有限理性博弈方通過長期的學(xué)習(xí)和策略調(diào)整,大部分情況下最終都會收斂于博弈方1采用比較強(qiáng)硬的“鷹”策略、博弈方2采用比較保守的“鴿”策略的均衡;但在少數(shù)比較極端的情況下.也會出現(xiàn)相反的結(jié)果。應(yīng)話說這個(gè)結(jié)論也是符合這個(gè)博弈的利益結(jié)構(gòu)所決定的各個(gè)博弈方的行為取向的。xY111/65/6BDCA0兩群體復(fù)制動態(tài)關(guān)系和穩(wěn)定性根據(jù)圖中箭頭的方向不難60第五章有限理性和進(jìn)化博弈

本章介紹有限理性基礎(chǔ)上的進(jìn)化博弈分析。完全理性在現(xiàn)實(shí)中很難滿足,當(dāng)社會經(jīng)濟(jì)環(huán)境和決策問題較復(fù)雜時(shí),人們必須存在很大的理性局限。有限理性對人們的決策、行為選擇方式有很大影響,有限理性基礎(chǔ)上的博弈分析與完全理性博弈分析也有很大區(qū)別。進(jìn)化博弈分析是有限理性博弈分析的基本框架。本章介紹以最優(yōu)反應(yīng)動態(tài)和復(fù)制動態(tài)為核心,以進(jìn)化穩(wěn)定策略為基本均衡概念的進(jìn)化博弈分析,包括基本方法、概念和各種經(jīng)典模型等。第五章有限理性和進(jìn)化博弈本章介紹有限理性基礎(chǔ)上61本章分四節(jié)5.1有限理性博弈及其分析框架5.2最優(yōu)反應(yīng)動態(tài)5.3復(fù)制動態(tài)和進(jìn)化穩(wěn)定性:兩人對稱博弈5.4復(fù)制動態(tài)和進(jìn)化穩(wěn)定性:兩人非對稱博弈本章分四節(jié)5.1有限理性博弈及其分析框架625.1有限理性博弈及其分析框架5.1.1有限理性及其對博弈的影響5.1.2有限理性博弈分析框架5.1有限理性博弈及其分析框架5.1.1有限理性及其對博63

傳統(tǒng)的博弈均衡,特別是Nash均衡及其完美是以博弈規(guī)則、參與人的理性以及參與人的得益都是共同知識(commonknowledge)為前提的,這并不完全符合現(xiàn)實(shí)。進(jìn)化博弈的基本思路是:有限理性的經(jīng)濟(jì)主體不可能正確地知道自己所處的利害狀態(tài),它只是通過它認(rèn)為最有利的策略逐漸模仿下去,最終到達(dá)一種均衡狀態(tài)。在這樣變化的系統(tǒng)中,采用得益高的策略的參與人的比率逐漸上升。5.1.1有限理性及其對博弈的影響傳統(tǒng)的博弈均衡,特別是Nash均衡及其64

博弈論分析研究的是參與人在特定的問題中的行為和策略,因此重要的不是人們始終一貫的理性,而是在具體問題上的理性,因此在具體問題中完全理性的假定仍有可能成立,但理性的局限的情況也很普遍。在分析復(fù)雜問題時(shí)就可能具有很大的理性局限性。如果具體的博弈中博弈方不滿足完全理性的假設(shè),稱為有限理性博弈方(boundedlyrationalplayer),相應(yīng)地有有限理性博弈。完全理性包括理性知識、分析推理能力、識別判斷能力和準(zhǔn)確行為能力等多方面完美性要求,其中任何一方不完美就不是完全理性。但有限理性有多種情況和層次:較高的層次和較低的層次。有限理性意味著博弈方往往不會一開始就找到最優(yōu)策略而是會“在戰(zhàn)爭中學(xué)習(xí)戰(zhàn)爭”,必須通過“試錯”來尋找較好的策略。博弈論分析研究的是參與人在特定的問題中的行65

在有限理性博弈中具有真正穩(wěn)定性和較強(qiáng)預(yù)測能力的均衡,必須是能夠通過博弈方的模仿、學(xué)習(xí)的調(diào)整過程達(dá)到的,具有能經(jīng)受錯誤偏離的干擾的均衡,是在受到少量干擾后仍然能夠“恢復(fù)”的均衡。這時(shí)博弈分析的核心不是博弈方的最優(yōu)策略的選擇,而是有限理性的博弈方組成的群體成員的策略調(diào)整過程、趨勢和穩(wěn)定性,這里的穩(wěn)定性是指采用特定策略的成員的比例不變,而非某個(gè)博弈方的策略不變5.1.2有限理性博弈分析框架在有限理性博弈中具有真正穩(wěn)定性和較強(qiáng)預(yù)測能力66

有限理性博弈分析的關(guān)鍵是確定博弈方學(xué)習(xí)和調(diào)整的模式(機(jī)制),進(jìn)化博弈主要采用的是生物進(jìn)化的“模仿者動態(tài)”機(jī)制模擬博弈方的學(xué)習(xí)和動態(tài)調(diào)整,但由于博弈方的學(xué)習(xí)能力的差異,需要多種機(jī)制來模擬。

最優(yōu)反應(yīng)動態(tài):有快速學(xué)習(xí)能力的小群體成員的反復(fù)博弈復(fù)制動態(tài):學(xué)習(xí)速度很慢的成員組成的大群體隨機(jī)配對的反復(fù)博弈進(jìn)化穩(wěn)定策略(ESS)有限理性博弈分析的關(guān)鍵是確定博弈方學(xué)習(xí)和調(diào)整675.2最優(yōu)反應(yīng)動態(tài)5.2.1協(xié)調(diào)博弈的有限博弈方快速學(xué)習(xí)模型5.2.2古諾調(diào)整過程5.2最優(yōu)反應(yīng)動態(tài)5.2.1協(xié)調(diào)博弈的有限博弈方快速學(xué)習(xí)685.2.1協(xié)調(diào)博弈的有限博弈方快速學(xué)習(xí)模型前提:少數(shù)有快速學(xué)習(xí)能力的有限理性的博弈方之間的反復(fù)博弈和策略進(jìn)化這種分析框架對博弈方的理性假設(shè)為相當(dāng)快的學(xué)習(xí)能力,雖然在復(fù)雜局面下準(zhǔn)確判斷分析和運(yùn)用預(yù)見性的能力較差,但它們能對不同策略的結(jié)果作出比較正確的事后評估并相應(yīng)地調(diào)整策略。5.2.1協(xié)調(diào)博弈的有限博弈方快速學(xué)習(xí)模型前提:少數(shù)有快速695.2.1協(xié)調(diào)博弈的有限博弈方快速學(xué)習(xí)模型50,500,4960,6049,0A博弈方2BAB博弈方1協(xié)調(diào)博弈通過納什均衡分析不難發(fā)現(xiàn),該博弈有兩個(gè)純策略納什均衡A,A)和(B,B)。這兩個(gè)納什均衡中,后者明顯帕累托優(yōu)于前者。前者是相對于后名的風(fēng)險(xiǎn)上策均衡。因此、如果是在完全理性博弈方之間進(jìn)行這個(gè)博棄,通常的預(yù)測結(jié)果應(yīng)該是(B,B),但如果我們考慮博弈方相互對對方理性的信任問題,或者對風(fēng)險(xiǎn)的敏感性等因素,那么風(fēng)險(xiǎn)上策均衡(A,A)可能是更好的預(yù)測:也就是說,由于該博弈是一個(gè)有多重納什均衡的博弈,因此在一次性博弈中,博弈結(jié)果也有不確定性,很難作出完全保險(xiǎn)的預(yù)測。這種協(xié)調(diào)博弈正是人們在決策方面經(jīng)常遇到的難題。5.2.1協(xié)調(diào)博弈的有限博弈方快速學(xué)習(xí)模型50,500,4705.2.1協(xié)調(diào)博弈的有限博弈方快速學(xué)習(xí)模型50,500,4960,6049,0A博弈方2BAB博弈方1協(xié)調(diào)博弈12345假設(shè)共有5個(gè)博弈方分別處于如圖中圓周上的5個(gè)位置上(可理解為5戶居民環(huán)山而居),每戶居民都與各白的左右鄰居反復(fù)博弈。5.2.1協(xié)調(diào)博弈的有限博弈方快速學(xué)習(xí)模型50,500,471反應(yīng)、策略調(diào)整規(guī)則推導(dǎo)假設(shè)為在t時(shí)期博弈方i的鄰居中采用A策略鄰居的數(shù)量,該數(shù)量有0、1、2三個(gè)可能的值。采用B策略鄰居的數(shù)量相應(yīng)為2-,也有0、1、2三個(gè)可能值。50,500,4960,6049,0A博弈方2BAB博弈方1協(xié)調(diào)博弈12345反應(yīng)、策略調(diào)整規(guī)則推導(dǎo)假設(shè)為在t時(shí)期博弈方i72由于取0、1、2三個(gè)整數(shù)。因此上述反應(yīng)規(guī)則實(shí)際就是。如果在t時(shí)期博弈方i的兩個(gè)鄰居中只要有1個(gè)采用A,那么博弈方在在t+1時(shí)期采用A.如果兩個(gè)鄰居都沒有采用A。那么博弈方i在t+1時(shí)期采用B。特點(diǎn):博弈方i在t+1時(shí)期的策略與自己在第t期采取策略反而沒有直接關(guān)系;50,500,4960,6049,0A博弈方2BAB博弈方1協(xié)調(diào)博弈12345由于取0、1、2三個(gè)整數(shù)。因此上述反應(yīng)規(guī)73最優(yōu)反應(yīng)動態(tài)模擬:初次博弈1個(gè)AABABABABBBAAAAABAAAABAABB5個(gè)博弈方經(jīng)過4個(gè)時(shí)期的調(diào)整,最終收斂到了所有博弈方都采用A的穩(wěn)定狀態(tài)。最優(yōu)反應(yīng)動態(tài)模擬:初次博弈1個(gè)AABABABABBBAAAA74初次博弈相鄰2個(gè)AAAAAAAABAABBBAA初次博弈相鄰2個(gè)AAAAAAAABAABBBAA75初次博弈相連3個(gè)ABAABAAAAAA初次博弈相連3個(gè)ABAABAAAAAA76結(jié)論:除了初次博弈時(shí)所有博弈方都采用B的一種情況以外,從其余所有的情況出發(fā),經(jīng)過或多或少時(shí)期的最優(yōu)反應(yīng)動態(tài)法則的調(diào)整,最終都會收斂到所有博弈方都采用A的穩(wěn)定狀態(tài)。上述分析證明了在上述設(shè)定下,所有32種可能種初次博弈情況中,只有一種是穩(wěn)定于所有博弈方采用B的狀態(tài),其余31種都會收斂到采用A的狀態(tài)。這說明所有博弈方都采用A策略和所有博弈方都采用B策略都是有限理性博弈方進(jìn)行協(xié)調(diào)博弈的穩(wěn)定狀態(tài)。所有博弈方都采用A的穩(wěn)定狀態(tài)是具有穩(wěn)健性的,相反,所有博弈方都采用B的均衡狀態(tài)卻不是穩(wěn)健的。結(jié)論:除了初次博弈時(shí)所有博弈方都采用B的一種情況以外,從其余77在上述協(xié)調(diào)博弈最優(yōu)反應(yīng)動態(tài)的兩種穩(wěn)定狀態(tài)中,只有所有博弈方都采用A的一種同時(shí)具有在博弈方的動態(tài)策略調(diào)整中會達(dá)到,又對少量偏離的擾動有穩(wěn)健性兩個(gè)性質(zhì)。同時(shí)具有這兩種性質(zhì)的穩(wěn)定狀態(tài),在進(jìn)化博弈論中被稱為“進(jìn)化穩(wěn)定策略”A稱為進(jìn)化穩(wěn)定策略,B則不是進(jìn)化穩(wěn)定策略。因?yàn)橐坏┠硞€(gè)博弈方偏離B,那么最優(yōu)反應(yīng)動態(tài)會使博弈方的策略離該狀態(tài)越來越遠(yuǎn),因此該均衡并不是真正穩(wěn)定的。在上述協(xié)調(diào)博弈最優(yōu)反應(yīng)動態(tài)的兩種穩(wěn)定狀態(tài)中,只有所785.2.2古諾調(diào)整過程古諾模型反應(yīng)函數(shù)1博弈方12.5博弈方23最優(yōu)反應(yīng)動態(tài)模擬:不難看出,上述動態(tài)調(diào)整過程趨向收斂于兩寡頭各生產(chǎn)2單位產(chǎn)量,也就是完全理性博弈的古諾產(chǎn)量,也就是惟一的純策略納什均衡。這正是這個(gè)有限理性博弈的穩(wěn)定狀態(tài),由于這個(gè)穩(wěn)定狀態(tài)也具有對微小擾動的穩(wěn)健性,因此它是這個(gè)博弈在上述最優(yōu)反應(yīng)動態(tài)下的進(jìn)化穩(wěn)定策略(ESS)。假設(shè):這兩個(gè)博弈方都是有限理性的,但都屬于知道自己的反應(yīng)函數(shù)(意味著知道自己的利潤函數(shù)),只是不知道對方的利潤、反應(yīng)函數(shù),也沒有預(yù)見能力。21.51.7532.2152.2541.8751.9375……5.2.2古諾調(diào)整過程古諾模型反應(yīng)函數(shù)795.3復(fù)制動態(tài)和進(jìn)化穩(wěn)定性:

兩人對稱博弈5.3.1簽協(xié)議博弈的復(fù)制動態(tài)和進(jìn)化穩(wěn)定策略5.3.2一般兩人對稱博弈復(fù)制動態(tài)和進(jìn)化穩(wěn)定策略5.3.3協(xié)調(diào)博弈的復(fù)制動態(tài)和進(jìn)化穩(wěn)定博弈5.3.4鷹鴿博弈的復(fù)制動態(tài)和進(jìn)化穩(wěn)定策略5.3.5蛙鳴博弈的復(fù)制動態(tài)和進(jìn)化穩(wěn)定策略5.3復(fù)制動態(tài)和進(jìn)化穩(wěn)定性:

兩人對稱博弈5.3805.3.1簽協(xié)議博弈的復(fù)制動態(tài)和進(jìn)化穩(wěn)定策略簽協(xié)議博弈:1,10,00,00,0同意博弈方2不同意同意不同意博弈方1兩個(gè)純策略納什均衡:(同意,同意),(不同意,不同意),前一個(gè)納什均衡帕累托優(yōu)于后一個(gè)納什均衡。假如是在完全理性的基礎(chǔ)上進(jìn)行該博弈,可以預(yù)期結(jié)果是(同意,同意)。下面是在理性層次較低的有限理性博弈方組成的大群體成員隨機(jī)配對反復(fù)博弈的分析框架內(nèi)進(jìn)行分析。5.3.1簽協(xié)議博弈的復(fù)制動態(tài)和進(jìn)化穩(wěn)定策略簽協(xié)議博弈:1815.3.1簽協(xié)議博弈的復(fù)制動態(tài)和進(jìn)化穩(wěn)定策略

假設(shè)群體中采用“同意”博弈方的比例x,則不同策略期望得益和平均得益為:簽協(xié)議博弈:1,10,00,00,0同意博弈方2不同意同意不同意博弈方15.3.1簽協(xié)議博弈的復(fù)制動態(tài)和進(jìn)化穩(wěn)定策略82根據(jù)上述結(jié)果可以看出,除非x=0(即所有博弈方都是“不同意”類型),否則兩類博弈方的得益就有明顯差異,“同意”類型博弈方的得益高于“不同意”類型的,也高于平均得益(因?yàn)?<x<1),“不同意”類型的則低于“同意”類型的得益和平均得益。只要博弈方有基本的、包括直覺和經(jīng)驗(yàn)的判斷能力,早晚會發(fā)現(xiàn)上述得益差異,得益較差類型的博弈方或早或遲會發(fā)現(xiàn)改變策略對自己是有利的,并開始模仿另一種類型的博棄方。這意味著兩種類型博弈方的比例x和1-x不是固定不變的,而是隨時(shí)間變化的,可以寫成時(shí)間的函數(shù)。根據(jù)上述結(jié)果可以看出,除非x=0(即所有博弈方都83博弈方策略類型比例動態(tài)變化是有限理性博弈分析的核心,其關(guān)鍵是動態(tài)變化的速度模仿的速度取決于兩個(gè)因素,一是模仿對象的數(shù)量大小(可用相應(yīng)類型博弈方的比例表示),因?yàn)檫@關(guān)系到觀察和模仿的難易程度;二是模仿對象的成功程度(可用模仿對象策略得益超過平均得益的幅度表示),因?yàn)檫@關(guān)系到判斷差異的難易程度和對模仿激勵的大小。以采用“同意”策略類型博弈方的比例為例,其動態(tài)變化速度可用下列微分方程反映:博弈方策略類型比例動態(tài)變化是有限理性博弈分析的核心,其關(guān)鍵是84動態(tài)微分方程的相位圖dx/dtx010.5穩(wěn)定狀態(tài)、不動點(diǎn):x*=0,x*=1可以看出,只有開始時(shí)所有博弈方都采用“不同意”策略,沒有一個(gè)博弈方采用“同意”策略,即x=0。除此以外,該博弈從其他所有初始情況出發(fā)的復(fù)制動態(tài)過程,最終都會使所有博弈方都趨向于“同意”,也就是x=1。動態(tài)微分方程的相位圖dx/dtx010.5穩(wěn)定狀態(tài)、不動點(diǎn):85需要注意的是,即使上述學(xué)習(xí)過程已經(jīng)停止了,意味著所有博弈方都通過學(xué)習(xí)找到了最好的策略,也不能排除博弈方還會“犯錯誤”,也就是說博弈方仍然可能偏離上述復(fù)制動態(tài)收斂到的納什均衡策略。這給我們提出的進(jìn)一步問題是:如果博棄方的策略偏離復(fù)制動態(tài)收斂到的穩(wěn)定狀態(tài),學(xué)習(xí)過程是否還會再回到同樣的穩(wěn)定狀態(tài)?或者換句話說,復(fù)制動態(tài)收斂到的穩(wěn)定狀態(tài)對于少量“錯誤”的干擾具有穩(wěn)健性嗎?需要注意的是,即使上述學(xué)習(xí)過程已經(jīng)停止了,意味著所86進(jìn)化穩(wěn)定策略的檢驗(yàn)因?yàn)榍医咏?,因此犯錯誤博弈方的期望得益遠(yuǎn)遠(yuǎn)低于沒有犯錯誤的博弈方,也遠(yuǎn)低于群體平均得益,因此犯錯誤的博弈方會逐步改正錯誤,最終仍然會趨向于x=1,即所有博弈方都采用“同意”策略。進(jìn)化穩(wěn)定策略的檢驗(yàn)因?yàn)?7進(jìn)化穩(wěn)定策略的檢驗(yàn)進(jìn)化穩(wěn)定策略的檢驗(yàn)885.3.2一般兩人對稱博弈復(fù)制動態(tài)

和進(jìn)化穩(wěn)定策略一般模型a,ac,bd,db,c策略1博弈方2策略2策略1策略2博弈方1一般2X2對稱博弈進(jìn)化博弈設(shè)定是在一個(gè)大群體的成員中進(jìn)行隨機(jī)配對的反復(fù)博弈?;灸P褪莾蓚€(gè)博弈方之間的對稱博弈。含義是兩個(gè)博弈位置是無差異的。其中a、b、c、d可以是任何得益,根據(jù)問題設(shè)定。5.3.2一般兩人對稱博弈復(fù)制動態(tài)

和進(jìn)化穩(wěn)定89復(fù)制動態(tài)分析dx/dtx1x復(fù)制動態(tài)的進(jìn)化規(guī)則是生物學(xué)中生物特征進(jìn)化規(guī)則設(shè)x為采用策略1的比例復(fù)制動態(tài)相位圖復(fù)制動態(tài)方程:a,ac,bd,db,c策略1博弈方2策略2策略1策略2博弈方1一般2X2對稱博弈復(fù)制動態(tài)分析dx/dtx1x復(fù)制動態(tài)的進(jìn)化規(guī)則是生物學(xué)中生物90復(fù)制動態(tài)分析dx/dtx1X復(fù)制動態(tài)的進(jìn)化規(guī)則是生物學(xué)中生物特征進(jìn)化規(guī)則設(shè)x為采用策略1的比例復(fù)制動態(tài)相位圖復(fù)制動態(tài)方程:穩(wěn)定性定理:設(shè),穩(wěn)健狀態(tài)處F(x)的導(dǎo)數(shù)F’(x),即該處切線的斜率小于0。復(fù)制動態(tài)分析dx/dtx1X復(fù)制動態(tài)的進(jìn)化規(guī)則是生物學(xué)中生物9150,500,4960,6049,0策略1博弈方2策略2策略1策略2博弈方1一般2*2對稱博弈dx/dtx111/61復(fù)制動態(tài)方程:復(fù)制動態(tài)相位圖根據(jù)穩(wěn)定性定理,x=0,x=1是該博弈的進(jìn)化穩(wěn)定策略,而X=11/61不是該博弈的進(jìn)化穩(wěn)定策略。5.3.3協(xié)調(diào)博弈的復(fù)制動態(tài)和進(jìn)化穩(wěn)定博弈50,500,4960,6049,0策略1博弈方2策略2策略925.3.3協(xié)調(diào)博弈的復(fù)制動態(tài)和進(jìn)化穩(wěn)定博弈50,500,4960,6049,0策略1博弈方2策略2策略1策略2博弈方1一般2*2對稱博弈dx/dtx111/61復(fù)制動態(tài)相位圖根據(jù)上述復(fù)制動態(tài)相位圖我們進(jìn)一步可以得出結(jié)論,那就是當(dāng)初始的x水平落在區(qū)間(0,11/61)時(shí),復(fù)制動態(tài)會趨向于穩(wěn)定狀態(tài)x=0,即所有博弈方都采用策略2。而當(dāng)初始的x水平落在區(qū)間(11/61,1)時(shí),復(fù)制動態(tài)會趨向于x=1,即所有博弈方都采用策略1。5.3.3協(xié)調(diào)博弈的復(fù)制動態(tài)和進(jìn)化穩(wěn)定博弈50,500,4935.3.3協(xié)調(diào)博弈的復(fù)制動態(tài)和進(jìn)化穩(wěn)定博弈50,500,4960,6049,0策略1博弈方2策略2策略1策略2博弈方1一般2*2對稱博弈dx/dtx111/61復(fù)制動態(tài)相位圖如果初次進(jìn)行這個(gè)博弈時(shí)群體成員采用兩種策略的比例落在[o,1]區(qū)間任—點(diǎn)的概率相同、那么通過復(fù)制動態(tài)最終實(shí)現(xiàn)前一種更高效率進(jìn)化穩(wěn)定策略均衡的機(jī)會是11/61,實(shí)現(xiàn)后一種相對較差進(jìn)化穩(wěn)定策略均衡的機(jī)會都有50/61,后者得益明顯大于前者。5.3.3協(xié)調(diào)博弈的復(fù)制動態(tài)和進(jìn)化穩(wěn)定博弈50,500,494這個(gè)結(jié)論也說明,有限理性博弈方通過復(fù)制動態(tài)的學(xué)習(xí)和策略調(diào)整,也并不—定能實(shí)現(xiàn)最理想的結(jié)果,并不一定能實(shí)現(xiàn)最優(yōu)化,往往只能實(shí)現(xiàn)次佳的結(jié)果。上述結(jié)果的另—個(gè)重要意義是,復(fù)制動態(tài)進(jìn)化博弈的結(jié)果常常是取決于帶有很大偶然性的初始狀態(tài)的,事實(shí)上這也正是為什么在相似的規(guī)律作用下,事物的形態(tài)特點(diǎn)會如此豐富多彩的根本原因。這個(gè)結(jié)論也說明,有限理性博弈方通過復(fù)制動態(tài)的學(xué)習(xí)955.3.4鷹鴿博弈的復(fù)制動態(tài)和進(jìn)化穩(wěn)定策略,0,v,v,0鷹博弈方2鴿?jì)楕澆┺姆?鷹鴿博弈該博弈的納什均衡取決于v和c的具體數(shù)值。5.3.4鷹鴿博弈的復(fù)制動態(tài)和進(jìn)化穩(wěn)定策略,0,v965.3.4鷹鴿博弈的復(fù)制動態(tài)

和進(jìn)化穩(wěn)定策略,0,v,v,0鷹博弈方2鴿?jì)楕澆┺姆?鷹鴿博弈這是一個(gè)2×2對稱博弈,因此可以直接用2×2對稱博弈復(fù)制動態(tài)的一般公式。設(shè)x表示采用“鷹”策略博弈方的比例,則采用“鷹”策略博弈方比例的復(fù)制動態(tài)方程為:5.3.4鷹鴿博弈的復(fù)制動態(tài)

和進(jìn)化穩(wěn)定策略,0,97,0,v,v,0鷹博弈方2鴿?jì)楕澆┺姆?鷹鴿博弈取v=2,c=12,則復(fù)制動態(tài)方程為:三個(gè)穩(wěn)定狀態(tài)分別為:x*=0,x*=1和x*=1/6。因?yàn)镕’(0)>0,F’(1)>0而F’(16)<0,所以x*=1/6是進(jìn)化穩(wěn)定策略。,0,v,v,0鷹博弈方2鴿?jì)楕澆?8復(fù)制動態(tài)方程和相位圖dx/dtx11/6實(shí)際上,從復(fù)制相位圖也可看出x*=1/6是進(jìn)化穩(wěn)定策略。復(fù)制動態(tài)方程和相位圖dx/dtx11/6實(shí)際上,從復(fù)制相位圖99結(jié)論的現(xiàn)實(shí)意義:當(dāng)人們爭奪、競爭的利益利嚴(yán)重沖突的后果損失符合上述設(shè)定時(shí),在較大規(guī)模群體長期的進(jìn)化中,采取攻擊型策略的博弈方購數(shù)量最終會穩(wěn)定在1/6左右的水平,大多數(shù)人(5/6)會采用比較和平的策略。這意味著發(fā)生嚴(yán)重戰(zhàn)爭的機(jī)會雖然存在,但可能性比較小(大約1/36),相互間和平共處的可能性最大(約占25/36),比較忍讓的一方受到比較霸道一方欺負(fù)的機(jī)會居中(約占10/36)。這是比較穩(wěn)定的狀態(tài),實(shí)際情況通常會在該水平上下波動。這樣的格局與國際政治、軍事關(guān)系的實(shí)際情況是很相似的。結(jié)論的現(xiàn)實(shí)意義:當(dāng)人們爭奪、競爭的利益利嚴(yán)重沖突1005.3.5蛙鳴博弈的復(fù)制動態(tài)

和進(jìn)化穩(wěn)定策略動物進(jìn)化競爭是生物多樣性、復(fù)雜性的基本機(jī)制蛙鳴博弈:P-z,P-z1-m,m-z0,0m-z,1-m鳴叫雄蛙2不鳴鳴叫不鳴雄蛙1假設(shè):在某一范圍內(nèi)有兩只雄蛙。如果它們都不鳴叫,則吸引來的蛙數(shù)量為0,即它們都沒有交配的機(jī)會;如果有一只雄蛙鳴叫,那么會吸引來1只雌蛙,而鳴叫的雄蛙獲交配的機(jī)會為m,0.5<m<1,但鳴叫者有成本z;如果它們都鳴叫,則各能吸引P只雌蛙,或者說獲得交配的機(jī)會為P,m<p<1,此時(shí)各有成本z。5.3.5蛙鳴博弈的復(fù)制動態(tài)

和進(jìn)化穩(wěn)定策101P-z,P-z1-m,m-z0,0m-z,1-m鳴叫雄蛙2不鳴鳴叫不鳴雄蛙1

如果m-z<0,也就是m<z,那么因?yàn)閜<1,因此必然有P-z<1-m。根據(jù)上述假設(shè),首先可知P-z>m-z是成立的。因?yàn)榧僭O(shè)1>P>m這時(shí)候兩雄蛙都不鳴是該博弈惟一的納什均衡。因?yàn)樵谶@種情況下鳴叫總是不合算的,不鳴叫是雙方的上策。P-z,P-z1-m,m-z0,0m-z,102根據(jù)上述假設(shè),首先可知:P-z>m-z是成立的。

如果m-z>0,也就是m>z,但P-z<1-m仍然成立,則p-1+m<z<m。P-z,P-z1-m,m-z0,0m-z,1-m鳴叫雄蛙2不鳴鳴叫不鳴雄蛙1此時(shí)還存在一個(gè)混合策略的納什均衡,兩蛙都以一定的概率隨機(jī)決定是否鳴叫。根據(jù)上述假設(shè),首先可知:P-z>m-z是成立的。103根據(jù)上述假設(shè),首先可知:P-z>m-z是成立的。如果在m-z>0的情況下,p-z>1-m。P-z,P-z1-m,m-z0,0m-z,1-m鳴叫雄蛙2不鳴鳴叫不鳴雄蛙1那么兩雄蛙都鳴叫是惟一的純策略納什均衡,因?yàn)榇藭r(shí)鳴叫對兩雄蛙來說都是上策。根據(jù)上述假設(shè),首先可知:P-z>m-z是成立的。104蛙鳴博弈不同均衡的條件Z11鳴叫混合策略不鳴叫m=1-P+zm=z分析結(jié)論說明:在這個(gè)蛙鳴博弈中,除了鳴叫與不鳴叫在吸引雌蛙和獲得交配機(jī)會方面的差異以外,鳴叫的成本代價(jià)大小也是決定雄蛙是否鳴叫的關(guān)鍵因素。m>zp-z>1-mp-z<1-mm>zm<zm0蛙鳴博弈不同均衡的條件Z1鳴叫混合策略不鳴叫m=1-P+zm105蛙鳴博弈復(fù)制動態(tài)方程和不動點(diǎn)x——鳴叫雄蛙比例可能的不動點(diǎn):x*=0x*=1x*=(m-z)/(1-p)復(fù)制動態(tài)方程蛙鳴博弈復(fù)制動態(tài)方程和不動點(diǎn)x——鳴叫雄蛙比例可能的不動點(diǎn):106蛙鳴博弈復(fù)制動態(tài)相位圖xdx/dt1(m-z)/(1-P)<0dx/dtx1(m-z)/(1-P)0<(m-z)/(1-P)<1xdx/dt1(m-z)/(1-P)>1蛙鳴博弈復(fù)制動態(tài)相位圖xdx/dt1(m-z)/(1-P)<107蛙鳴博弈復(fù)制動態(tài)相位圖x1(m-z)/(1-P)當(dāng)0<(m-z)/(1-P)<1時(shí),有3個(gè)穩(wěn)定狀態(tài):x*=0,x*=1,x*=(m-z)/(1-p)其中只有x*=(m-z)/(1-p)是進(jìn)化穩(wěn)定策略。

這意味著如果上述由環(huán)境條件等決定的蛙鳴的利益關(guān)系是穩(wěn)定的,那么一旦發(fā)生少數(shù)雄蛙從不鳴到鳴叫的變異,那么這種變異雄蛙的數(shù)量會不斷增加,直到達(dá)到占整個(gè)雄蛙數(shù)量的比重為x*=(m-z)/(1-P)。如果雄蛙中鳴叫雄蛙所占比重超過這個(gè)水平,甚至全部是鳴叫的,那么這時(shí)候少量不鳴叫的變異則又會在種群中擴(kuò)散,因?yàn)榇藭r(shí)不鳴叫雄蛙“搭便車”的機(jī)會和利益特別大,最終仍然會回到x*=(m-z)/(1-P)的均衡比例。蛙鳴博弈復(fù)制動態(tài)相位圖x1(m-z)/(1-P)當(dāng)0<(m-108蛙鳴博弈復(fù)制動態(tài)相位圖xdx/dt1當(dāng)(m-z)/(1-P)<0時(shí)有2個(gè)穩(wěn)定狀態(tài):x*=0,x*=1

這意味著如果從所有雄蛙都是不

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負(fù)責(zé)。
  • 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

最新文檔

評論

0/150

提交評論