版權說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權,請進行舉報或認領
文檔簡介
進化博弈理論一.進化博弈提出背景
二.進化博弈由來三.進化博弈概述四.復制動態(tài)和進化穩(wěn)定性五.最優(yōu)反應動態(tài)和進化穩(wěn)定性第一節(jié)進化博弈提出的背景彌補主流博弈論的缺陷
一、對博弈論的發(fā)展威脅最大的是他的理性基礎。完全理性要求行為主體始終以自身最大利益為目標,具有在確定和非確定性環(huán)境中追求自身利益最大化的判斷和決策能力,還要求他們具有在存在交互作用的博弈環(huán)境中完美的判斷和預測能力。不僅要求人們自身有完美的理性,還要求人們相互信任對方的理性,有“理性的共同知識”這種完全理性假設要求博弈方絕對不會犯錯誤,決不會沖動和不理智,在現(xiàn)實中顯然是不成立的。二、博弈論的理性依據(jù)——理性經(jīng)濟人假設
經(jīng)濟人要求人們是對總供給、總需求或價格等代表的市場總體或平均行為進行反應,較少考慮個體之間直接的交互作用,而博弈論研究的恰恰是行為主體之間直接的反應。進化博弈理論的由來1.生物進化中生物性狀和行為特征是一個動態(tài)模擬調(diào)整的過程,而這個過程正是模擬博弈方學習博弈和調(diào)整策略過程最主要的動態(tài)機制2.而生物進化理論中具有在動態(tài)調(diào)整過程中達到,在受到少量干擾后仍能“恢復”的穩(wěn)健性均衡概念“進化穩(wěn)定策略”,正是有限理性博弈分析最核心的均衡概念。
正是因為上述有限理性博弈分析與生物進化理論的這種關系,因此這種博弈分析理論也稱為“進化博弈論”或“經(jīng)濟學中的進化博弈論”。進化博弈理論概述進化博弈理論是經(jīng)濟學領域的前沿理論,它來源于對生態(tài)現(xiàn)象的研究,雖然該理論應用于經(jīng)濟分析的時間不長,但它為經(jīng)濟學研究提供了一個全新的分析方法,較好地克服了新古典經(jīng)濟學及經(jīng)典博弈理論中理性假定及多重均衡的困難。并且,應用進化博弈理論來研究經(jīng)濟系統(tǒng)能夠獲得比傳統(tǒng)理論更準確的結(jié)果,能夠更加現(xiàn)實地解釋經(jīng)濟現(xiàn)象,因而在短期內(nèi)為多數(shù)經(jīng)濟學家所接受。從某種意義上說引入進化博弈理論局部動態(tài)法來分析經(jīng)濟中參與人的行為是經(jīng)濟學研究方法的一次創(chuàng)新。進化博弈理論概述進化博弈理論是經(jīng)濟學研究方法的一次創(chuàng)新,該理論從否定傳統(tǒng)理論賴以成立的基礎——理性人假定出發(fā)而建立起來一個新的分析框架,它結(jié)合了生態(tài)學、社會學、心理學及經(jīng)濟學的最新發(fā)展成果,從有限理性的社會人出發(fā)來分析參與人的資源配置行為。
進化博弈理論概述一.現(xiàn)實中個體并不是行為最優(yōu)化者,個體的決策是通過個體之間模仿、學習和突變等動態(tài)過程來實現(xiàn)的。二.進化博弈理論強調(diào)系統(tǒng)達到均衡的動態(tài)調(diào)整過程,博弈方往往不會一開始就找到最優(yōu)策略,必須通過試錯尋找較好的策略認為系統(tǒng)的均衡是達到均衡過程的函數(shù),一、復制動態(tài)——大群體成員集體博弈假設在一個理性層次較低、學習速度較慢的大群體成員中隨機配對反復進行該博弈的進化博弈問題。這里“學習速度慢”指的是向優(yōu)勢策略的轉(zhuǎn)變不是所有博弈方同時實現(xiàn)的,而是逐漸實現(xiàn)的。一、復制動態(tài)——大群體成員集體博弈
博弈方B
策略1策略2
博弈方A策略1
策略2
圖1
2×2對稱博弈a,ab,cc,bd,d計算步驟步驟一:假設在該群體中采用策略1的博弈方的比例為x,那么采用策略2的博弈方的比例就是1一x。算出采用兩種策略博弈方的期望得益u1,u2和群體平均期望得益u分別為u1=x·a+(1-x)·b、u2=
x·c+(1一x)·du=x·u1+(1一x)·u2。步驟二:按照生物進化復制動態(tài)的思想,采用的策略收益較低的博弈方會改變自己的策略,轉(zhuǎn)向(模仿)有較高收益的策略,因此群體中采用不同策略成員的比例就會發(fā)生變化,特定策略比例的變化速度與其比重和其得益超過平均得益的幅度成正比在上述問題中采用策略1的博弈方比例x的變化速度,可以用微分方程(復制動態(tài)公式dx/dt=x(u1-u)=x[u1-x·ul-(1-x)·u2]=x(1-x)(u1-u2)=x(1-x)[x(a-c)+(1-x)(b-d)]來表示。最多可能有三個穩(wěn)定點,分別是x=o、x=1和x=(b—d)/(a—b—c+d),作為進化穩(wěn)定策略的點,除了本身必須是均衡狀態(tài)以外,還必須具有這樣的性質(zhì),那就是如果某些博弈方由于偶然的錯誤偏離了它們,復制動態(tài)仍然會使x回復到。在數(shù)學上,這相當于要求當干擾使x出現(xiàn)低于時,必須大于0,當干擾使得x出現(xiàn)高于時,必須小于0。換句話說,在這些穩(wěn)定狀態(tài)處F(x)的導數(shù)(也就是切線的斜率)必須小于0。這就是微分方程的“穩(wěn)定性定理”。
算法分析為前述一般兩人對稱博弈的復制動態(tài)進化穩(wěn)定策略,而
x=0和x=1都不是進化穩(wěn)定策略。圖5.102×2對稱博弈復制動態(tài)方程相位圖算法分析其中前兩個穩(wěn)定點意味著群體成員趨向于采用相同的策略(1或2),后一個穩(wěn)定點意味著群體成員以一定比例采用不同策略,前者對應完全理性博弈的純策略均衡,后者對應混合策略均衡。值得注意的是,這些穩(wěn)定點只意味著博弈方采用特定策略的比例達到該水平不會再發(fā)生變化,但并沒有說明復制動態(tài)過程究竟會趨向于哪個穩(wěn)定點。這些取決于博弈方采用策略比例的初始狀態(tài)和動態(tài)微分方程在相應區(qū)間的正負情況,需要根據(jù)具體問題進行分析。此外,具有真正穩(wěn)定性的穩(wěn)定狀態(tài)還必須對微小的擾動具有穩(wěn)定性。即如果由于博弈方的錯誤等某種原因使得上述比例關系偏離了這些穩(wěn)定點X時,復制動態(tài)仍然會使其回復到這些水平?!苞楕澆┺摹柄楕澆┺难芯康膶嶋H上并不是鷹和鴿之間的博弈,而是同一物種、種群內(nèi)部競爭和沖突中的策略和均衡問題,其中“鷹”和“鴿”分別指“攻擊型”和“和平型”的兩種策略或策略類型。鷹鴿博弈是研究動物世界和人類社會中普遍存在的競爭和沖突現(xiàn)象的經(jīng)典博弈,其進化博弈分析可以揭示人類社會或動物世界發(fā)生戰(zhàn)爭或激烈沖突的可能性及其頻率,以及國際關系中霸道和軟弱、侵略和反抗、威脅和妥協(xié)等共存的原因。
博弈方2
鷹鴿博弈鷹方1鴿
圖5.13鷹鴿博弈
v代表雙方爭奪的利益(可以是軍事利益、經(jīng)濟利益或政治利益,也可以是動物的領地和繁殖機會),c是爭奪中失敗一方的損失。
v-c/2,v-c/2V,00,vv/2,v/2這個博弈也是一個2×2對稱博弈,直接運用2×2對稱博弈復制動態(tài)的一般公式。用x表示采用“鷹”策略博弈方的比例,把b=v,c=0,d=v/2代入,可得采用“鷹”策略博弈方比例的復制動態(tài)方程為:
為了直觀起見,我們這里給出v和c的一組具體數(shù)值,如v=2,c=12,那么復制動態(tài)方程就為:解得三個穩(wěn)定狀態(tài)分別為,
和。這三個均衡點中只有是進化穩(wěn)定策略,因為F’(0)>0,
F’(1)>0,而F’(1/6)<0。
圖5.14鷹鴿博弈復制動態(tài)相位圖上述進化博弈分析結(jié)論的現(xiàn)實意義是,當競爭的利益和沖突的后果符合上述設定時,在較大規(guī)模群體長期的進化中,采取攻擊型策略的博弈方的數(shù)量最終會穩(wěn)定在1/6左右的水平,大多數(shù)人(5/6)會采用比較和平的策略。這意味著發(fā)生嚴重戰(zhàn)爭的機會雖然存在,但可能性比較?。ù蠹s1/36)相互間和平共處的可能性最大(約占25/36),比較忍讓的一方受到比較霸道一方欺負的機會居中(約占10/36)。博弈方具有較快學習能力(在復雜局面下準確判斷和預見能力稍差,但能夠?qū)Σ煌呗缘慕Y(jié)果作出比較正確的事后評估,并能相應調(diào)整其策略)的博弈。因此給定前期的經(jīng)驗(博弈結(jié)果),每個博弈方本期能找到和采取針對前期其他博弈方(全部或鄰近的部分博弈方)策略的最佳反應策略。最適合描述這種理性層次博弈方的策略調(diào)整的動態(tài)機制,就是所謂的“最優(yōu)反應動態(tài)”(BestResponseDynamics)。二.最優(yōu)反應動態(tài)——小群體進化博弈一、協(xié)調(diào)博弈(CoordinationGame)博弈方2AB
博弈A
方1B
50,5049,00,4960,60
該博弈有兩個純策略納什均衡:(A,A)和(B,B)。這兩個納什均衡中,后者明顯帕累托優(yōu)于前者。但如果博弈方之一有采用A的可能性,或者兩博弈方相互懷疑對方可能采用A,那么前者就是相對于后者的風險上策均衡。因此,如果是在完全理性博弈方之間進行這個博弈,通常的預測結(jié)果應該是(B,B),但如果我們考慮博弈方相互對對方理性的信任問題,或者對風險的敏感性等因素,那么風險上策均衡(A,A)可能是更好的預測。也就是說,由于該博弈本身是一個有多重納什均衡的博弈,因此在一次性博弈中,即使博弈方都是高度理性的,博弈結(jié)果也有不確定性,很難作出完全保險的預測。這里舉例說明最優(yōu)反應動態(tài)的思想方法。設有5個有限理性博弈方,分別處于如圖5.2所示的位署上,每個人都與各自的左右鄰居就圖5.1中得益矩陣表示的“協(xié)調(diào)博弈”(CoordinationGame)進行反復博弈,觀察他們最終會趨于向選擇哪個策略。
圖5.2博弈方的分布
在初次進行博弈時每個位置的博弈方都既可能采用A,也可能采用B。因此,初次博弈總共有種可能的情況,圖5.3中給出了其中部分可能情況。
圖5.3初次博弈的部分可能情況
根據(jù)采用A博弈方的數(shù)量和分布,總共有無A、1A、有相鄰2A、有不相鄰2A、有3連A、有非3連A、4A、5A共8種有實質(zhì)差異。
假設為在t時期博弈方i的鄰居中采用A策略的數(shù)量,該數(shù)量有0、1、2三個可能的值;鄰居中采用B策略的數(shù)量相應為,也有0、1、2三個可能值。
針對第t期的相關情況,博弈方i采用A的得益為,博弈方i采用B的得益為為。根據(jù)最優(yōu)反應動態(tài)機制,當時,即時,博弈方i在t+1時期會采用A,否則采用B。
由于只能取0、1、2三個整數(shù),因此,如果在t時期博弈方i的兩個鄰居中只要有1個采用A,那么博弈方i在t+l時期采用A,如果兩個鄰居都沒有采用A,那么博弈方i在t+1時期采用B。圖5.4初次博弈為1A的最優(yōu)反應動態(tài)圖5.5初次博弈為相鄰2A的最優(yōu)反應動態(tài)圖5.6初次博弈為相連3A的最優(yōu)反應動態(tài)上述分析表明,在題設條件下,所有32種可能的初次博弈情況中,只有一種情況是所有博弈方采用B的狀態(tài),其余31種都會收斂到采用A的狀態(tài)。這說明A策略和B策略都是有限理性博弈方進行上述協(xié)調(diào)博弈的穩(wěn)定狀態(tài),但前一種穩(wěn)定狀態(tài)顯然更重要一些,因為博弈方的策略調(diào)整收斂到這種情況的機會要大大高于后一種情況。從而在博弈方有限理性條件下給出了(A,A)和(B,B)這兩個納什均衡各自被采用的機會一種趨勢性判斷。結(jié)論是在有限理性框架內(nèi),博弈方采用策略A,實現(xiàn)均衡(A,A)的機會遠高于采用B和實現(xiàn)均衡(B,B)的機會。從上述協(xié)調(diào)博弈的最優(yōu)反應動態(tài)機制給出的兩種穩(wěn)定狀態(tài)可以看出,只有所有博弈方都采用A策略同時具有在博弈方的動態(tài)策略調(diào)整中會達到,又對少量偏離的擾動有穩(wěn)健性兩個性質(zhì)。同時具有這兩種性質(zhì)(群體趨向且抗干擾)的穩(wěn)定狀態(tài),在進化博弈論中被稱為“進化穩(wěn)定策略”。在上述協(xié)調(diào)博弈中,A就是一個進化穩(wěn)定策略,而B則不是進化穩(wěn)定策略。二、古諾調(diào)整過程寡頭競爭中的“古諾調(diào)整”問題,也是最優(yōu)反應動態(tài)的一個典型例子。
古諾模型中兩寡頭的反應函數(shù):如果兩個博弈方都是有博弈分析能力、有預見能力的完全理性博弈方,那么他們都能夠計算出各自的最佳均衡產(chǎn)量,即各生產(chǎn)2單位。這個產(chǎn)量也稱為“古諾產(chǎn)量”。
假設這兩個博弈方都是有限理性的,都屬于知道自己的反應函數(shù)(意味著知道自己的利潤函數(shù)),不知道對方的利潤(反應)函數(shù),也沒有預見能力。不妨設一個寡頭生產(chǎn)2.5單位,另一個寡頭生產(chǎn)3單位為第一個時期的結(jié)果,來演示一下兩個寡頭的產(chǎn)量調(diào)整過程。古諾模型的最優(yōu)反應過程設生產(chǎn)2.5單位的是寡頭1,生產(chǎn)了3單位的是寡頭2。把這兩個產(chǎn)量分別代入寡頭2和寡頭1的反應函數(shù),很容易得到兩寡頭第二期的產(chǎn)量將分別是1.5單位和1.75單位;然后再把這兩個產(chǎn)量分別代入寡頭2和寡頭1的反應函數(shù),不難得到第三期雙方的產(chǎn)量為2.125單位和2.25單位;依次類推可得到第四期雙方產(chǎn)量為1.875單位和1.9375單位,……;
上述動態(tài)調(diào)整過程趨向收斂于兩寡頭各生產(chǎn)2單位產(chǎn)量(完全理性博弈的古諾產(chǎn)量),即唯一的純策略納什均衡。由于這個穩(wěn)定狀態(tài)也具有對微小擾動的穩(wěn)健性,因此它是這個博弈在上述最優(yōu)反應動態(tài)下的進化穩(wěn)定策略(ESS)。二、非對稱鷹鴿博弈的進化博弈分析鷹鴿博弈也可以是非對稱博弈,因為當人們或者其他動物)為了某件事物發(fā)生沖突競爭時,所爭奪的目標對沖突各方的價值并不一定是—致的。例如,當一個國家試圖侵略另一個國家,被侵略國家考慮是否抗擊入侵者時,雙方所爭奪的國土對前者來說意味著一塊殖民地,后者則是自己的祖國,顯然對于雙方來說價值是完全不同的,對后者的價值通常要遠遠高于前者。
假設鷹鴿博弈所爭奪的目標對博弈方1位置博弈的博弈方價值為,對博弈方2位置博弈的博弈方價值為,并設0<<。再假設其余方面都與對稱鷹鴿博弈的假設相同。那么,現(xiàn)在這個鷹鴿博弈的得益矩陣如圖5.25所示。很顯然,這是一個雙方利益不對稱的非對稱博弈。為了簡單起見,進一步假設上述博弈中,,,這樣該博弈的得益矩陣進一步變?yōu)閳D5.26中的情況。博弈方2
鷹鴿博弈鷹
方1鴿
圖5.25非對稱鷹鴿博弈
博弈方2
鷹鴿博弈鷹
方1鴿
圖5.26非對稱鷹鴿博弈數(shù)
溫馨提示
- 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權益歸上傳用戶所有。
- 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預覽,若沒有圖紙預覽就沒有圖紙。
- 4. 未經(jīng)權益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
- 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負責。
- 6. 下載文件中如有侵權或不適當內(nèi)容,請與我們聯(lián)系,我們立即糾正。
- 7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。
最新文檔
- 2024年離婚快速和解合同指南版B版
- 自控課程設計0型系統(tǒng)
- 私教體態(tài)調(diào)整課程設計
- 2025年高中生禁毒教案二
- 2024招聘計劃書(32篇)
- 2024年用電客戶受理員(二級技術師)理論考試題庫(B卷)
- 網(wǎng)上購物系統(tǒng)web課程設計
- 舞蹈新鞋子課程設計
- 市場行業(yè)助理職責概述
- 三年高考地理(全國乙卷21-23)真題知識點-工業(yè)及其區(qū)位因素
- 社會消防安全教育培訓題庫及答案
- 部編人教版語文八年級上冊文言文課下注釋
- 蘇教版譯林三年級上下冊單詞表
- 腫瘤病例隨訪調(diào)查表
- 游樂園、滑雪場、冰雪樂園建設合作協(xié)議
- 粉末涂料有限公司檢維修作業(yè)安全風險分級清單
- 【蘇教版】2022-2023學年六年級數(shù)學上冊期末試卷(及答案)
- 2023-2024學年連云港市灌云縣四年級數(shù)學第一學期期末學業(yè)水平測試模擬試題含答案
- 湖南省懷化市鶴城區(qū)2023年數(shù)學三下期末監(jiān)測試題含解析
- 項目工程安全管理責任區(qū)域劃分表
- 2023年學校食堂審計發(fā)現(xiàn)問題整改報告3篇
評論
0/150
提交評論