第10講:有限理性博弈(I):具有快速學習能力小群體成員反復(fù)博弈_第1頁
第10講:有限理性博弈(I):具有快速學習能力小群體成員反復(fù)博弈_第2頁
第10講:有限理性博弈(I):具有快速學習能力小群體成員反復(fù)博弈_第3頁
第10講:有限理性博弈(I):具有快速學習能力小群體成員反復(fù)博弈_第4頁
第10講:有限理性博弈(I):具有快速學習能力小群體成員反復(fù)博弈_第5頁
已閱讀5頁,還剩47頁未讀, 繼續(xù)免費閱讀

下載本文檔

版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進行舉報或認領(lǐng)

文檔簡介

第10講:有限理性博弈(I):

具有快速學習能力的小群體成員的反復(fù)博弈1outline1、完全理性&有限理性2、具有快速學習能力的小群體成員的反復(fù)博弈:一般分析思路3、協(xié)調(diào)博弈的有限理性博弈方快速學習模型4、進化穩(wěn)定策略(EvolutionaryStableStrategy:ESS)21、完全理性&有限理性3完全理性經(jīng)濟學通常假設(shè)人們有完全理性有始終追求最大利益的完美意識、分析推理能力、識別判斷能力、記憶能力和準確行為能力。4完全理性&有限理性經(jīng)濟學通常假設(shè)人們有完全理性,但這種假設(shè)的現(xiàn)實性是有問題的。事實上,人們只是在分析處理比較簡單問題時接近完全理性要求,但在分析復(fù)雜問題時理性的局限性很明顯。5完全理性&有限理性基于博弈方具有完全理性的假設(shè),我們已經(jīng)分析了:完全信息靜態(tài)博弈完全且完美信息動態(tài)博弈重復(fù)博弈6完全理性&有限理性博弈問題通常包含復(fù)雜的相互依存關(guān)系,博弈分析往往是很復(fù)雜的,因此指望現(xiàn)實的博弈方都能通過博弈分析找到最優(yōu)策略,而且不會因為遺忘、失誤、任性等原因偏離最佳選擇,常常是不切實際的。7完全理性&有限理性如果我們只是在完全理性假設(shè)下進行博弈分析,顯然是不夠的,會影響博弈論的適用范圍和價值。8完全理性&有限理性理性完全理性有完美的分析判斷能力和不會犯選擇行為的錯誤。有限理性(BoundedlyRational)不滿足完全理性假設(shè),即博弈方的判斷選擇能力有缺陷。9完全理性&有限理性博弈問題“完全理性博弈”所有博弈方均符合完全理性假設(shè)下的博弈問題?!坝邢蘩硇圆┺摹辈┺姆降呐袛噙x擇能力有缺陷情況下的博弈問題。10完全理性&有限理性有限理性博弈11完全理性&有限理性有限理性意味著博弈方往往不會一開始就找到最優(yōu)策略,會在博弈過程中學習博弈,必須通過試錯尋找較好的策略;有限理性也意味著一般至少存在部分博弈方不會采用完全理性博弈的均衡策略;有限理性還意味著均衡是不斷調(diào)整和改進而不是一次性選擇的結(jié)果,而且即使達到了均衡也可能再次偏離。12完全理性&有限理性需要引入新的分析方法13有限理性博弈典型的有限理性博弈(1)具有快速學習能力的小群體成員的反復(fù)博弈(2)學習速度較慢的成員組成的大群體隨機配對的反復(fù)博弈142、具有快速學習能力的小群體成員的反復(fù)博弈:一般分析思路15具有快速學習能力的小群體成員的反復(fù)博弈具有快速學習能力的小群體成員的反復(fù)博弈博弈方的理性層次較高、學習速度較快,能迅速調(diào)整策略。16具有快速學習能力的小群體成員的反復(fù)博弈(續(xù))一般分析思路:(1)(初始條件)初次進行博弈時,各別博弈方的策略選擇;(2)博弈方相互博弈、學習和模仿的環(huán)境條件;(3)博弈方的理性層次決定的學習和策略調(diào)整的方式、特征。17博弈方的理性層次決定的學習和策略調(diào)整的方式、特征。策略調(diào)整機制:最優(yōu)反應(yīng)動態(tài)(Best-ResponseDynamics)給定前期的經(jīng)驗(即博弈結(jié)果),各個博弈方本期都能找到和采用針對前期其他博弈方策略的最佳反應(yīng)策略。183、協(xié)調(diào)博弈的有限理性博弈方快速學習模型19具有快速學習能力的小群體成員的反復(fù)博弈(續(xù))例:協(xié)調(diào)博弈的有限理性博弈方快速學習模型20協(xié)調(diào)博弈的有限理性博弈方快速學習模型協(xié)調(diào)博弈的有限理性博弈方快速學習模型2112345有5個有限理性博弈方,分別位于圖示圓周的5個位置上;每個博弈方都與各自的左右鄰居反復(fù)博弈。博弈方的博弈內(nèi)容是“協(xié)調(diào)博弈”(CoordinationGame)。

博弈方相互博弈、學習和模仿的環(huán)境條件協(xié)調(diào)博弈的有限理性博弈方快速學習模型(續(xù))22博弈方2AB博弈方1A50,5049,0B0,4960,60協(xié)調(diào)博弈具有兩個純策略納什均衡(A,A)和(B,B)協(xié)調(diào)博弈的有限理性博弈方快速學習模型(續(xù))假設(shè)博弈方雖然缺乏分析交互動態(tài)關(guān)系和預(yù)見能力,但是能夠馬上對上一階段的博弈結(jié)果進行總結(jié),并立即做出相應(yīng)的策略調(diào)整。(最優(yōu)反應(yīng)動態(tài):給定前期的經(jīng)驗(即博弈結(jié)果),各個博弈方本期都能找到和采用針對前期其他博弈方策略的最佳反應(yīng)策略。

)23博弈方的理性層次決定的學習和策略調(diào)整的方式、特征

協(xié)調(diào)博弈的有限理性博弈方快速學習模型(續(xù))博弈方的理性層次決定的學習和策略調(diào)整的方式、特征24假設(shè)xi(t)為在t時期博弈方i的鄰居中采用A策略的數(shù)量,該數(shù)量有0、1、2三個可能值。采用B策略的鄰居的數(shù)量相應(yīng)為2-xi(t),也有0、1、2三個可能值。12345協(xié)調(diào)博弈的有限理性博弈方快速學習模型(續(xù))針對第t

期的相關(guān)情況xi(t),博弈方

i

采用策略A的得益為xi(t)·50+[2-xi(t)]·49,博弈方

i采用策略B則得益為xi(t)·0+[2-xi(t)]·60。25博弈方2AB博弈方1A50,5049,0B0,4960,60xi(t):在t時期博弈方i的鄰居中采用A策略的數(shù)量;2-xi(t)

:在t時期博弈方i的鄰居中采用B策略的數(shù)量。協(xié)調(diào)博弈的有限理性博弈方快速學習模型(續(xù))根據(jù)最優(yōu)反應(yīng)動態(tài)機制,當xi(t)·50+[2-xi(t)]49>xi(t)·0+[2-xi(t)]60即xi(t)>22/61時,博弈方i在t+1時期會采用A,而當xi(t)·50+[2-xi(t)]49<xi(t)·0+[2-xi(t)]60即xi(t)<22/61時,博弈方i在t+1時期會采用B。26博弈方2AB博弈方1A50,5049,0B0,4960,60最優(yōu)反應(yīng)動態(tài):給定前期的經(jīng)驗(即博弈結(jié)果),各個博弈方本期都能找到和采用針對前期其他博弈方策略的最佳反應(yīng)策略。協(xié)調(diào)博弈的有限理性博弈方快速學習模型(續(xù))由于xi(t)只能取0、1、2這三個整數(shù),因此上述反應(yīng)機制實際上就是:如果在t時期博弈方i的兩個鄰居中只要有1個采用A,那么博弈方i在第t+1時期采用A;如果在t時期博弈方i的兩個鄰居都沒有采用A,那么博弈方i在t+1時期采用B。27當xi(t)>22/61時,博弈方i在t+1時期會采用A;當xi(t)<22/61時,博弈方i在t+1時期會采用B。協(xié)調(diào)博弈的有限理性博弈方快速學習模型(續(xù))初次進行博弈時,各別博弈方的策略選擇(博弈方都是有限理性的)初次博弈總共有25=32種可能的情況。2812345博弈方2AB博弈方1A50,5049,0B0,4960,60協(xié)調(diào)博弈的有限理性博弈方快速學習模型(續(xù))但是,這32種情況中不少實質(zhì)上是相同的,只是哪個博弈方采用A或B有所不同,把圓周作一定的旋轉(zhuǎn)就能完全重合。29BABBAABABB協(xié)調(diào)博弈的有限理性博弈方快速學習模型(續(xù))根據(jù)采用A策略博弈方的數(shù)量和分布,總共有8種無實質(zhì)差異,無法通過圓周旋轉(zhuǎn)而重合的情況:(1)0A;(2)1A;(3)相鄰2A;(4)不相鄰2A;(5)3連A;(6)非3連A;(7)4A;(8)5A。3012345協(xié)調(diào)博弈的有限理性博弈方快速學習模型(續(xù))31最優(yōu)反應(yīng)動態(tài)機制:如果在t時期博弈方i的兩個鄰居中只要有1個采用A,那么博弈方i在第t+1時期采用A,如果兩個鄰居都沒有采用A,那么博弈方i在t+1時期采用B。BBBBBBBBBB情形1:初次博弈有0個A協(xié)調(diào)博弈的有限理性博弈方快速學習模型(續(xù))情形2:初次博弈有1個A32最優(yōu)反應(yīng)動態(tài)機制:如果在t時期博弈方i的兩個鄰居中只要有1個采用A,那么博弈方i在第t+1時期采用A,如果兩個鄰居都沒有采用A,那么博弈方i在t+1時期采用B。ABBBBBABBAABAABAAAAABAAAA協(xié)調(diào)博弈的有限理性博弈方快速學習模型(續(xù))情形3:初次博弈有相鄰2A33最優(yōu)反應(yīng)動態(tài)機制:如果在t時期博弈方i的兩個鄰居中只要有1個采用A,那么博弈方i在第t+1時期采用A,如果兩個鄰居都沒有采用A,那么博弈方i在t+1時期采用B。BAABBAAAABAAAAA協(xié)調(diào)博弈的有限理性博弈方快速學習模型(續(xù))情形4:初次博弈有不相鄰2A34最優(yōu)反應(yīng)動態(tài)機制:如果在t時期博弈方i的兩個鄰居中只要有1個采用A,那么博弈方i在第t+1時期采用A,如果兩個鄰居都沒有采用A,那么博弈方i在t+1時期采用B。BABBAABAABAAAAABAAAA協(xié)調(diào)博弈的有限理性博弈方快速學習模型(續(xù))情形5:初次博弈有3連A35最優(yōu)反應(yīng)動態(tài)機制:如果在t時期博弈方i的兩個鄰居中只要有1個采用A,那么博弈方i在第t+1時期采用A,如果兩個鄰居都沒有采用A,那么博弈方i在t+1時期采用B。AAABBAAAAA協(xié)調(diào)博弈的有限理性博弈方快速學習模型(續(xù))情形6:初次博弈有非3連A36最優(yōu)反應(yīng)動態(tài)機制:如果在t時期博弈方i的兩個鄰居中只要有1個采用A,那么博弈方i在第t+1時期采用A,如果兩個鄰居都沒有采用A,那么博弈方i在t+1時期采用B。ABAABAAAAABAAAA協(xié)調(diào)博弈的有限理性博弈方快速學習模型(續(xù))情形7:初次博弈有4A37最優(yōu)反應(yīng)動態(tài)機制:如果在t時期博弈方i的兩個鄰居中只要有1個采用A,那么博弈方i在第t+1時期采用A,如果兩個鄰居都沒有采用A,那么博弈方i在t+1時期采用B。AAAAABAAAA協(xié)調(diào)博弈的有限理性博弈方快速學習模型(續(xù))情形8:初次博弈有5A38最優(yōu)反應(yīng)動態(tài)機制:如果在t時期博弈方i的兩個鄰居中只要有1個采用A,那么博弈方i在第t+1時期采用A,如果兩個鄰居都沒有采用A,那么博弈方i在t+1時期采用B。AAAAAAAAAA協(xié)調(diào)博弈的有限理性博弈方快速學習模型(續(xù))總結(jié):除了初次博弈時所有博弈方都采用B的一種情況以外,從其余所有的情況出發(fā),經(jīng)過或多或少時期的最優(yōu)反應(yīng)動態(tài)法則的調(diào)整,最終都會收斂到所有博弈方都采用A的穩(wěn)定狀態(tài)。39協(xié)調(diào)博弈的有限理性博弈方快速學習模型(續(xù))“所有博弈方都采用A策略”和“所有博弈方都采用B策略”都是有限理性博弈方進行上述協(xié)調(diào)博弈的穩(wěn)定狀態(tài),但前一種穩(wěn)定狀態(tài)顯然要更重要一些。在上述設(shè)定下,總共32種可能的初次博弈情況中只有一種是穩(wěn)定于所有博弈方采用B的狀態(tài),其余31種都會收斂到采用A的狀態(tài)。40協(xié)調(diào)博弈的有限理性博弈方快速學習模型(續(xù))“所有博弈方都采用A”的穩(wěn)定狀態(tài)是具有“穩(wěn)健性”的在達到所有博弈方都采用A的穩(wěn)定狀態(tài)后,如果出現(xiàn)少數(shù)博弈方偏離A的情況,那么最優(yōu)反應(yīng)動態(tài)會使博弈方的策略很快回到都采用A的狀態(tài)。41協(xié)調(diào)博弈的有限理性博弈方快速學習模型(續(xù))“所有博弈方都采用B”的穩(wěn)定狀態(tài)不具有穩(wěn)健性一旦某個博弈方偏離B,那么最優(yōu)反應(yīng)動態(tài)會使博弈方的策略離該穩(wěn)定狀態(tài)越來越遠。42差之毫厘,謬以千里434、進化穩(wěn)定策略(EvolutionaryStableStrategy:ESS)44協(xié)調(diào)博弈的有限理性博弈方快速學習模型(續(xù))進化穩(wěn)定策略(EvolutionaryStableStrategy:ESS)同時具有(1)在博弈方的動態(tài)策略調(diào)整中會達到,又(2)對少量偏離的擾動有穩(wěn)健性這兩個性質(zhì)的穩(wěn)定狀態(tài),在進化博弈中被稱為“進化穩(wěn)定策略”。在上述協(xié)調(diào)博弈中,所有博弈方都采用A就是一個進化穩(wěn)定策略,而所有博弈方都采用B則不是進化穩(wěn)定策略。45有限理性博弈的一般分析思

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負責。
  • 6. 下載文件中如有侵權(quán)或不適當內(nèi)容,請與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

評論

0/150

提交評論