經(jīng)濟(jì)博弈論4培訓(xùn)資料課件

上傳人：六*** IP屬地：重慶上傳時(shí)間：2023-05-14 格式：PPT 頁(yè)數(shù)：57 大?。?.26MB 積分：12 舉報(bào) 版權(quán)申訴

已閱讀5頁(yè)，還剩52頁(yè)未讀，繼續(xù)免費(fèi)閱讀

版權(quán)說(shuō)明：本文檔由用戶(hù)提供并上傳，收益歸屬內(nèi)容提供方，若內(nèi)容存在侵權(quán)，請(qǐng)進(jìn)行舉報(bào)或認(rèn)領(lǐng)

文檔簡(jiǎn)介

第四章重復(fù)博弈

本章介紹基本博弈重復(fù)進(jìn)行構(gòu)成的重復(fù)博弈。雖然形式上是基本博弈的重復(fù)進(jìn)行，但重復(fù)博弈中博弈方的行為和博弈結(jié)果卻不一定是基本博弈的簡(jiǎn)單重復(fù)，因?yàn)椴┺姆綄?duì)于博弈會(huì)重復(fù)進(jìn)行的意識(shí)，會(huì)使他們對(duì)利益的判斷發(fā)生變化，從而使他們?cè)谥貜?fù)博弈過(guò)程中的行為選擇受到影響。這意味著不能把重復(fù)博弈當(dāng)作基本博弈的簡(jiǎn)單疊加，必須把整個(gè)重復(fù)博弈過(guò)程作為整體進(jìn)行研究。第一頁(yè)，共五十七頁(yè)。1重復(fù)博弈大多數(shù)重復(fù)博弈是靜態(tài)博弈的重復(fù)，而重復(fù)博弈又是一個(gè)動(dòng)態(tài)的過(guò)程，屬于動(dòng)態(tài)博弈的范疇。因此重復(fù)博弈與靜態(tài)博弈和動(dòng)態(tài)博弈都有關(guān)系。第二頁(yè)，共五十七頁(yè)。2本章分三節(jié)4.1重復(fù)博弈引論4.2有限次重復(fù)博弈4.3無(wú)限次重復(fù)博弈第三頁(yè)，共五十七頁(yè)。34.1重復(fù)博弈引論4.1.1為何研究重復(fù)博弈兩家企業(yè)在一個(gè)市場(chǎng)上的傳長(zhǎng)期競(jìng)爭(zhēng)；兩個(gè)企業(yè)遵守一份為期10年協(xié)議方面的契約；商業(yè)中的回頭客等等。由于長(zhǎng)期合作，通過(guò)報(bào)復(fù)、制裁、威脅等手段的相互約束行為，追求共同的目標(biāo)，考慮當(dāng)前利益兼顧將來(lái)的利益。長(zhǎng)期關(guān)系可以理解為博弈階段較多，時(shí)間跨度較大的一般動(dòng)態(tài)博弈。誠(chéng)信、信任……4.1.2基本概念第四頁(yè)，共五十七頁(yè)。44.1.1為何研究重復(fù)博弈經(jīng)濟(jì)中的長(zhǎng)期關(guān)系人們的預(yù)見(jiàn)性未來(lái)利益對(duì)當(dāng)前行為的制約長(zhǎng)期合同、回頭客、?？秃鸵淮涡再I(mǎi)賣(mài)的區(qū)別有無(wú)確定的結(jié)束時(shí)間長(zhǎng)期關(guān)系與短期關(guān)系前面討論的都是社會(huì)經(jīng)濟(jì)活動(dòng)中短期一次性合作或競(jìng)爭(zhēng)關(guān)系，但社會(huì)經(jīng)濟(jì)活動(dòng)中除了短期一次性關(guān)系以外，還存在許多長(zhǎng)期反復(fù)的合作和競(jìng)爭(zhēng)關(guān)系。如商業(yè)活動(dòng)中的回頭客。長(zhǎng)期關(guān)系與短期關(guān)系之間的差別不只是時(shí)間跨度長(zhǎng)短的數(shù)量問(wèn)題，而是有重要性質(zhì)的差別。在長(zhǎng)期關(guān)系中，人們?cè)诳紤]當(dāng)前利益的同時(shí)，需要兼顧未來(lái)利益。第五頁(yè)，共五十七頁(yè)。5

“沖突”何以能產(chǎn)生合作，就是因?yàn)橹貜?fù)博弈的存在瑞典皇家科學(xué)院2005年10月10日在斯德哥爾摩宣布，將2005年的諾貝爾經(jīng)濟(jì)學(xué)獎(jiǎng)授予以色列希伯萊大學(xué)的羅伯特·奧曼（RobertJ.Aumann）和美國(guó)馬里蘭大學(xué)的托馬斯·謝林（ThomasC.Schelling），以表彰他們“通過(guò)博弈論分析，促進(jìn)了人們對(duì)沖突和合作的理解”。為此，他們獲得1000萬(wàn)瑞典克朗（約合130萬(wàn)美元）的獎(jiǎng)金。從約翰·納什開(kāi)始，在博弈論這座金礦中淘到諾貝爾經(jīng)濟(jì)學(xué)獎(jiǎng)的有數(shù)十位之多，與博弈論領(lǐng)域相關(guān)的基礎(chǔ)研究，據(jù)說(shuō)已經(jīng)是第五次折桂了。

瑞典皇家科學(xué)院在授獎(jiǎng)時(shí)說(shuō)，羅伯特·奧曼第一次對(duì)重復(fù)博弈進(jìn)行了全面正式分析。他們認(rèn)為，“重復(fù)博弈的理論促進(jìn)了我們對(duì)合作先決條件的理解，闡明了包括商業(yè)協(xié)會(huì)、犯罪組織在內(nèi)的許多機(jī)構(gòu)進(jìn)行磋商和國(guó)際貿(mào)易協(xié)定的理由”。第六頁(yè)，共五十七頁(yè)。64.1.2基本概念有限次重復(fù)博弈：給定一個(gè)基本博弈G（可以是靜態(tài)博弈，也可以是動(dòng)態(tài)博弈），重復(fù)進(jìn)行T次G，并且在每次重復(fù)G之前各博弈方都能觀察到以前博弈的結(jié)果，這樣的博弈過(guò)程稱(chēng)為“G的T次重復(fù)博弈”，記為G(T)。而G則稱(chēng)為G(T)的“原博弈”。G(T)中的每次重復(fù)稱(chēng)為G(T)的一個(gè)“階段”。無(wú)限次重復(fù)博弈：一個(gè)基本博弈G一直重復(fù)博弈下去的博弈，記為G(∞)策略：博弈方在每個(gè)階段針對(duì)每種情況如何行為的計(jì)劃子博弈：從某個(gè)階段（不包括第一階段）開(kāi)始，包括此后所有的重復(fù)博弈部分均衡路徑：由每個(gè)階段博弈方的行為組合串聯(lián)而成第七頁(yè)，共五十七頁(yè)。72.重復(fù)博弈的策略、子博弈和均衡路徑(1)重復(fù)博弈的策略重復(fù)博弈中每個(gè)博弈方在每個(gè)階段都必須進(jìn)行策略選擇，因此博弈方的一個(gè)策略就是在每次重復(fù)時(shí),針對(duì)其前面階段所有可能的情況如何進(jìn)行行動(dòng)的計(jì)劃。(2)重復(fù)博弈的子博弈重復(fù)博弈的子博弈就是從某個(gè)階段（除第一階段以外）開(kāi)始，包括此后所有階段的重復(fù)博弈部分。重復(fù)博弈的子博弈要么仍然是重復(fù)博弈，只是重復(fù)的次數(shù)較少，要么就是原博弈。(3)重復(fù)博弈的均衡路徑重復(fù)博弈的路徑是由每個(gè)階段博弈方的行動(dòng)組合串聯(lián)而成的。而且對(duì)應(yīng)前一階段的每一種結(jié)果，下一階段都有原博弈全部策略組合數(shù)那么多種可能的結(jié)果，如原博弈有m種策略組合，那么重復(fù)兩次就有m2條博弈路徑，重復(fù)T次就有mT條博弈路徑，因此在重博弈中，博弈方在重復(fù)博弈中的策略空間要遠(yuǎn)遠(yuǎn)大于在每個(gè)階段博弈中的策略空間，重復(fù)博弈的路徑數(shù)往往是很大的，常?？梢援a(chǎn)生一些意想不到的均衡路徑。第八頁(yè)，共五十七頁(yè)。83．重復(fù)博弈的得益方法之一是計(jì)算重復(fù)博弈的”總得益”,即博弈方各次重復(fù)得益的總和；另一種方法是計(jì)算各階段的“平均得益”，即總得益除以重復(fù)次數(shù)。第九頁(yè)，共五十七頁(yè)。9重復(fù)博弈的總得益第十頁(yè)，共五十七頁(yè)。10重復(fù)博弈的平均得益隨機(jī)停止和貼現(xiàn)率第十一頁(yè)，共五十七頁(yè)。114.2有限次重復(fù)博弈4.2.1兩人零和博弈的有限次重復(fù)博弈4.2.2唯一純策略納什均衡博弈的有限次重復(fù)博弈4.2.3多個(gè)純策略納什均衡博弈的有限次重復(fù)博弈4.2.4有限次重復(fù)博弈的民間定理第十二頁(yè)，共五十七頁(yè)。124.2.1兩人零和博弈的有限次重復(fù)博弈零和博弈是嚴(yán)格競(jìng)爭(zhēng)的，重復(fù)博弈并不改變這一點(diǎn)。以零和博弈為原博弈的有限次重復(fù)博弈與猜硬幣博弈的有限次重復(fù)博弈一樣，博弈方的正確策略是重復(fù)一次性博弈中的納什均衡策略。

以猜硬幣博弈為原博弈的有限次重復(fù)博弈中，每個(gè)博弈方的惟一正確的策略是在每次重復(fù)時(shí)都采用一次性博弈的納什均衡策略，即各以0.5的概率隨機(jī)選正面和反面的混合策略。重復(fù)博弈的結(jié)果是雙方的平均期望得益和期望總得益都為0。第十三頁(yè)，共五十七頁(yè)。134.2.2兩人零和博弈的無(wú)限次重復(fù)博弈兩人零和博弈無(wú)限次重復(fù)的所有階段都不可能發(fā)生合作，博弈方會(huì)一直重復(fù)原博弈的混合策略納什均衡

兩人零和博弈的無(wú)限次重復(fù)與有限次重復(fù)博弈的結(jié)果并不會(huì)有什么不同：因?yàn)橹貜?fù)次數(shù)的無(wú)限增加也不能改變?cè)┺闹胁┺姆街g在利益上的對(duì)立關(guān)系，也不會(huì)創(chuàng)造出潛在的合作利益，因此在這種博弈的無(wú)限次重復(fù)博弈中，博弈方仍然是每次重復(fù)都根據(jù)當(dāng)時(shí)的最大利益行為，采用原博弈的混合策略納什均衡。兩人零和博弈無(wú)限次重復(fù)博弈會(huì)不會(huì)發(fā)生合作？第十四頁(yè)，共五十七頁(yè)。144.2.2唯一純策略納什均衡博弈的

有限次重復(fù)博弈定理：設(shè)原博弈G有唯一的純策略納什均衡,則對(duì)任意整數(shù)T，重復(fù)博弈G(T)有唯一的子博弈完美納什均衡，即各博弈方每個(gè)階段都采用G的納什均衡策略。各博弈方在G(T)中的總得益為在G中得益的T倍，平均得益的與原博弈G中的得益。-5，-50，-8-8，0-1，-1坦白不坦白囚徒2坦白不坦白囚徒1（-5，-5）-10，-10-13，-5-5，-13-6，-6坦白不坦白囚徒2坦白不坦白囚徒1（-10，-10）第十五頁(yè)，共五十七頁(yè)。15有限次重復(fù)削價(jià)競(jìng)爭(zhēng)博弈100，10020，150150，2070，70高價(jià)低價(jià)高價(jià)低價(jià)寡頭2寡頭1削價(jià)競(jìng)爭(zhēng)博弈有唯一純策略納什均衡（70，70）

有限次重復(fù)的結(jié)果仍然是（低價(jià)，低價(jià)）第十六頁(yè)，共五十七頁(yè)。164.4多個(gè)純策略納什均衡的重復(fù)博弈5，53，32，00，22，06，00，20，61，1HMH廠商2ML廠商1L三價(jià)博弈原博弈存在兩個(gè)純策略納什均衡（M,M），（L,L）以及混合策略納什均衡。第十七頁(yè)，共五十七頁(yè)。174.4.1多個(gè)純策略納什均衡的有限次重復(fù)博弈5，53，32，00，22，06，00，20，61，1HMH廠商2ML廠商1L三價(jià)博弈重復(fù)2次觸發(fā)策略：兩博弈方先試探合作，一旦發(fā)現(xiàn)對(duì)方不合作則也用不合作報(bào)復(fù)博弈方1：第一次選H；如第一次結(jié)果為(H,H)，則第二次選M，否則選L。博弈方2：同博弈方1第十八頁(yè)，共五十七頁(yè)。185，53，32，00，22，06，00，20，61，1HMH廠商2ML廠商1L三價(jià)博弈2，23，13，11，34，47，11，31，78，8廠商1廠商2LMHHML兩次重復(fù)三價(jià)博弈的等價(jià)模型如果重復(fù)n次，結(jié)論相似。采用觸發(fā)策略實(shí)現(xiàn)比較好的結(jié)果，子博弈完美納什均衡路徑為：除了最后一次外，每次都采用（H，H），最后一次采用（M，M）。當(dāng)重復(fù)次數(shù)較多時(shí)，平均得益接近于一次性博弈中（H，H）的得益（5，5）。第十九頁(yè)，共五十七頁(yè)。19在上面的分析中，我們發(fā)現(xiàn)觸發(fā)策略重復(fù)是一種非常重要的機(jī)制，采用這種策略就意味著對(duì)將來(lái)策略選擇所作的可信的威脅或承諾可以影響到當(dāng)前階段的行動(dòng)選擇。但如果仔細(xì)分析，不難發(fā)現(xiàn)上述觸發(fā)策略也可能存在值得推敲的問(wèn)題，就是報(bào)復(fù)機(jī)制的可信性。懲罰別人也懲罰自己！5，53，32，00，22，06，00，20，61，1HMH廠商2ML廠商1L三價(jià)博弈關(guān)于“觸發(fā)策略”的討論第二十頁(yè)，共五十七頁(yè)。20其實(shí)，并不是每個(gè)重復(fù)博弈的觸發(fā)策略都有可信性問(wèn)題，觸發(fā)策略在很多情況下是非?？尚诺?。可以證明，雙方的上述觸發(fā)策略組合（H，H），（M，M）構(gòu)成該重復(fù)博弈的一個(gè)子博弈精煉納什均衡，而且雙方的觸發(fā)策略中的報(bào)復(fù)都是可信的。第二十一頁(yè)，共五十七頁(yè)。21

在博弈理論中，有兩個(gè)著名的策略：

1.觸發(fā)策略（Triggerstrategies）。2.“一報(bào)還一報(bào)”策略：也就是若你采取不合作策略，我也采取不合作策略，但是如果你采取了合作策略，我也采取合作策略。這叫，或者稱(chēng)為“針?shù)h相對(duì)”，英文叫Tit-for-Tat。第二十二頁(yè)，共五十七頁(yè)。22

一報(bào)還一報(bào)的策略是這樣的：第一次博弈采用合作的策略，以后每一步都跟隨對(duì)方上一步的策略，你上一次合作，我這一次就合作，你上一次不合作，我這一次就不合作。也就是說(shuō)，一報(bào)還一報(bào)的策略實(shí)行了“胡蘿卜加大棒”的原則。它永遠(yuǎn)不先背叛對(duì)方，從這個(gè)意義上來(lái)說(shuō)它是“善意的”。它會(huì)在下一輪中對(duì)對(duì)手的前一次合作給予回報(bào),哪怕以前這個(gè)對(duì)手曾經(jīng)背叛過(guò)它，從這個(gè)意義上來(lái)說(shuō)它是“寬容的”。但它會(huì)采取背叛的行動(dòng)來(lái)懲罰對(duì)手前一次的背叛，從這個(gè)意義上來(lái)說(shuō)它又是“可激怒的”。而且，它的策略極為簡(jiǎn)單，對(duì)手一望便知其用意何在，從這個(gè)意義來(lái)說(shuō)它又是“簡(jiǎn)單明了的”。“一報(bào)還一報(bào)”策略的優(yōu)越性向我們充分展示了一個(gè)純粹自利的人何以會(huì)選擇善，只因?yàn)楹献魇亲晕依孀畲蠡囊环N必要手段。第二十三頁(yè)，共五十七頁(yè)。23美國(guó)密執(zhí)安大學(xué)的羅伯特·?？怂沽_德(RobertAxerold)曾經(jīng)主持過(guò)一次計(jì)算機(jī)比賽，看誰(shuí)寫(xiě)出來(lái)的程序能夠贏。參加者有政治學(xué)家、數(shù)學(xué)家、經(jīng)濟(jì)學(xué)家、社會(huì)學(xué)家，他們都詳細(xì)研究過(guò)囚徒困境。獲勝者是加拿大多倫多大學(xué)的羅伯布（AnatolRapoport）寫(xiě)的“一報(bào)還一報(bào)”(Tit-for-Tat)策略。第二十四頁(yè)，共五十七頁(yè)。24兩市場(chǎng)博弈的重復(fù)博弈（重復(fù)一次）0，04，11，43，3廠商1廠商2BAAB兩市場(chǎng)博弈純策略納什均衡：(A,B)和(A,B)，對(duì)應(yīng)得益為（1，4）和（4，1）混合策略納什均衡：分別以1/2的概率隨機(jī)在A或B中選擇，雙方得益為1/4×（3＋4＋1＋0）＝2兩市場(chǎng)博弈的重復(fù)博弈第二十五頁(yè)，共五十七頁(yè)。25兩市場(chǎng)博弈的重復(fù)博弈（重復(fù)兩次）(A,B)+(A,B)OR(B,A)+(B,A)——(1,4)OR(4,1)連續(xù)兩次采用混合策略——(2,2)(A,B)+(B,A)OR(B,A)+(A,B)——(2.5,2.5)輪換策略一次純策略+一次混合策略——(1.5,3)OR(3,1.5)0，04，11，43，3廠商1廠商2BAAB兩市場(chǎng)博弈第二十六頁(yè)，共五十七頁(yè)。26重復(fù)博弈不同策略、均衡及一次性博弈得益比較不同策略組合、均衡得益圖示廠商2得益廠商1得益(1,4)(3,3)(2.5,2.5)(2,2)(3,1.5)(4,1)(1.5,3)第二十七頁(yè)，共五十七頁(yè)。27重復(fù)博弈不同策略、均衡及一次性博弈得益比較不同策略組合、均衡得益圖示廠商2得益廠商1得益(1,4)(3,3)(2.5,2.5)(2,2)(3,1.5)(4,1)(1.5,3)輪換策略結(jié)果比較好，但與最佳結(jié)果（A，A）還有一定差距。本博弈不能實(shí)現(xiàn)最佳結(jié)果原因，是因?yàn)檫@個(gè)兩次重復(fù)博弈沒(méi)有運(yùn)用觸發(fā)策略的條件或者說(shuō)機(jī)會(huì)。0，04，11，43，3廠商1廠商2BAAB兩市場(chǎng)博弈第二十八頁(yè)，共五十七頁(yè)。28兩市場(chǎng)博弈的重復(fù)博弈（重復(fù)三次）如果兩市場(chǎng)重復(fù)3次，則博弈結(jié)果會(huì)得到進(jìn)一步改善，關(guān)鍵是在兩次重復(fù)博弈時(shí)沒(méi)有條件運(yùn)用觸發(fā)策略，在3次以上的重復(fù)博弈中有了運(yùn)用的條件。0，04，11，43，3廠商1廠商2BAAB兩市場(chǎng)博弈廠商1：第一階段選A；如果第一階段結(jié)果是（A，A），則第二階段選A，如果第一階段結(jié)果是（A，B），則第二階段選B；第三階段無(wú)條件選B。廠商2：第一階段選A，第二階段無(wú)條件選B，如果第一階段結(jié)果是（A，A），則第三階段選A；如果第一階段結(jié)果是（B，A），則第三階段選B。均衡路徑（A，A）（A，B）（B，A）第二十九頁(yè)，共五十七頁(yè)。29兩市場(chǎng)博弈的重復(fù)博弈（重復(fù)三次）0，04，11，43，3廠商1廠商2BAAB兩市場(chǎng)博弈其中第二階段、第三階段本身就是納什均衡，因此不會(huì)有哪一方愿單獨(dú)偏離。第一階段的策略組合雖然并不是原博弈的納什均衡，但由于有后面階段利益的制約作用，但它作為3次重復(fù)博弈的第一次博弈的策略組合具有穩(wěn)定性。該子博弈完美納什均衡的平均得益為（3＋1＋4）/3＝2.67，大于其他任何子博弈完美納什均衡的平均得益，因此從總體效率的意義上，這個(gè)帶觸發(fā)策略的子博弈完美納什均衡是眾多子博弈完美納什均衡中效率最高的。第三十頁(yè)，共五十七頁(yè)。30兩市場(chǎng)博弈的重復(fù)博弈（重復(fù)101次）廠商1觸發(fā)策略：前99次選A；但從其中的第二次開(kāi)始，一旦發(fā)現(xiàn)哪次的結(jié)果不是（A，A），則改為B并堅(jiān)持到底，最后兩次重復(fù)與3次重復(fù)博弈的后兩次重復(fù)的策略相同。廠商2觸發(fā)策略：同廠商1每階段的平均得益：（99*3+1+4）/101=2.99非常接近效率最高的得益（3,3）第三十一頁(yè)，共五十七頁(yè)。31

由上面兩個(gè)重復(fù)博弈例子的分析可以看出，當(dāng)原博弈有多個(gè)純策略納什均衡時(shí)，有限次重復(fù)博弈存在許多效率差異很大的子博弈完美納什均衡，并且可以通過(guò)設(shè)計(jì)包含報(bào)復(fù)機(jī)制的觸發(fā)策略，來(lái)實(shí)現(xiàn)效率較高的均衡，得到一次性博弈中無(wú)法實(shí)現(xiàn)的潛在合作利益。而提高效率和發(fā)掘潛在利益可能性和程度，則主要決定于運(yùn)用特定策略的條件，采用的策略，以及重復(fù)博弈的次數(shù)。由此，我們得到如下的“無(wú)名氏定理”（FolkTheorem）。在闡述“無(wú)名氏定理”之前，我們?cè)俳榻B幾個(gè)關(guān)于得益的概念。有限重復(fù)博弈的“無(wú)名氏定理”（FolkTheorem）第三十二頁(yè)，共五十七頁(yè)。32設(shè)wi為博弈方i在一次性博弈中最差的均衡得益，用w記各博弈方的wi構(gòu)成的得益數(shù)組。無(wú)論其他博弈方行為如何，一博弈方在某個(gè)博弈中自己采取某種特定的策略，能夠最低限度保證得到的得益稱(chēng)為“保留得益”（ReservationPayoff）或“個(gè)體理性得益”（IndividualRationalityPayoff）。博弈中所有純策略組合得益的凸組合（ConvexCombination）即純策略得益的加權(quán)平均（權(quán)重?cái)?shù)非負(fù)且總和為1）數(shù)組稱(chēng)為“可實(shí)現(xiàn)得益”（FeasiblePayoff）。第三十三頁(yè)，共五十七頁(yè)。33

有了這幾個(gè)得益概念，我們就可以給出次數(shù)較多的有限次重復(fù)博弈的“無(wú)名氏定理”：有限重復(fù)博弈“無(wú)名氏定理”：設(shè)原博弈G為一個(gè)完全信息的靜態(tài)博弈，原博弈G的一次性博弈均衡得益數(shù)組優(yōu)于w，那么在該博弈的多次重復(fù)中，所有不小于個(gè)體理性得益的可實(shí)現(xiàn)得益，都至少有一個(gè)子博弈完美納什均衡的極限的平均得益來(lái)實(shí)現(xiàn)他們。第三十四頁(yè)，共五十七頁(yè)。34

下面以?xún)墒袌?chǎng)博弈的重復(fù)博弈為例來(lái)說(shuō)明該定理。0，04，11，43，3廠商1廠商2BAAB兩市場(chǎng)博弈在兩市場(chǎng)博弈中，兩個(gè)博弈方最差的均衡得益都是1，因此構(gòu)成得益數(shù)組w=（1，1）；只要采取A策略，兩個(gè)博弈方都至少得到1以上的得益，因此1就是這兩個(gè)博弈方的個(gè)體理性得益；該博弈中的可實(shí)現(xiàn)得益就是下圖中由（0，0），（1，4）、（3，3）和（4，1）四點(diǎn)連成邊界線(xiàn)圍起來(lái)的整個(gè)陰影部分面積中點(diǎn)坐標(biāo)。很顯然，該博弈的一次性博弈中顯然存在均衡得益數(shù)組優(yōu)于w，滿(mǎn)足民間定理的條件，因此所有不小于個(gè)體理性得益的可實(shí)現(xiàn)得益，即圖中（1，1）、（1，4）、（3，3）和（4，1）四點(diǎn)連成邊界線(xiàn)所圍陰影部分面積中點(diǎn)對(duì)應(yīng)的雙方得益，都有子博弈完美納什均衡或這種均衡的極限來(lái)實(shí)現(xiàn)它。

第三十五頁(yè)，共五十七頁(yè)。354.2.4有限次重復(fù)博弈的民間定理個(gè)體理性得益：不管其它博弈方的行為如何，一博弈方在某個(gè)博弈中只要自己采取某種特定的策略，最低限度保證能獲得的得益可實(shí)現(xiàn)得益：博弈中所有純策略組合得益的加權(quán)平均數(shù)組定理：設(shè)原博弈的一次性博弈有均衡得益數(shù)組優(yōu)于w，那么在該博弈的多次重復(fù)中所有不小于個(gè)體理性得益的可實(shí)現(xiàn)得益，都至少有一個(gè)子博弈完美納什均衡的極限的平均得益來(lái)實(shí)現(xiàn)它們廠商2得益廠商1得益(1,4)(3,3)(1，1)(4,1)w=(1.1)第三十六頁(yè)，共五十七頁(yè)。36例如（4，1）和（1，4）可用每次采用原博弈同一個(gè)納什均衡的子博弈完美納什均衡來(lái)實(shí)現(xiàn)，這兩點(diǎn)連線(xiàn)上的點(diǎn)可用原博弈兩個(gè)純策略納什均衡的某種組合來(lái)實(shí)現(xiàn)，（3，3）可用重復(fù)次數(shù)不斷增加前述觸發(fā)策略構(gòu)成的子博弈完美納什均衡的極限實(shí)現(xiàn)等。w第三十七頁(yè)，共五十七頁(yè)。37在所有可實(shí)現(xiàn)得益或優(yōu)于w=（1，1）的可實(shí)現(xiàn)得益中，只有處于（1，4）與（3，3）和（3，3）與（4，1）兩條連線(xiàn)上，包括這三點(diǎn)本身的可實(shí)現(xiàn)得益有較重要的意義，因?yàn)樗鼈兇砹伺晾弁行室饬x上最有效率的均衡得益。無(wú)名氏定理的關(guān)鍵意義正是在于保證這些得益有一定次數(shù)重復(fù)博弈的子博弈完美納什均衡的平均得益可以實(shí)現(xiàn)或逼近它們。w第三十八頁(yè)，共五十七頁(yè)。38通過(guò)上面幾個(gè)例子的分析我們發(fā)現(xiàn)，在一次性博弈和有限次重復(fù)中都無(wú)法實(shí)現(xiàn)的囚徒困境博弈中的合作關(guān)系，在無(wú)限次重復(fù)博弈的情況下是可以實(shí)現(xiàn)的。而且在有限次重復(fù)博弈中只有在原博弈有多個(gè)純策略納什均衡的情況下才會(huì)存在的合作，在無(wú)限重復(fù)博弈的情況下只要原博弈有一個(gè)納什均衡就可能存在。于是，我們又得到無(wú)限次重復(fù)博弈的無(wú)名氏定理。二、無(wú)限重復(fù)博弈的“無(wú)名氏定理”第三十九頁(yè)，共五十七頁(yè)。39兩寡頭削價(jià)競(jìng)爭(zhēng)博弈4，40，55，01，1HLHL4.3.2唯一純策略納什均衡的無(wú)限次重復(fù)博弈該博弈一次性博弈均衡是都采用低價(jià)，是囚徒困境型博弈廠商1廠商2第四十頁(yè)，共五十七頁(yè)。40無(wú)限次重復(fù)兩寡頭削價(jià)博弈

“觸發(fā)策略”（冷酷策略）

：第一階段采用H，如果前t-1階段的結(jié)果都是(H,H)，則繼續(xù)采用H，否則采用L。4，40，55，01，1HLHL如果博弈方2在第一階段采用L，總得益現(xiàn)值為：如果博弈方2第一階段采用H，總得益現(xiàn)值為：博弈方2會(huì)采用H策，否則會(huì)采用L策，即此時(shí)，博弈方2對(duì)博弈方1觸發(fā)策略的最佳反應(yīng)是第一階段采用H。第四十一頁(yè)，共五十七頁(yè)。41由于從第二階段開(kāi)始的無(wú)限次重復(fù)博弈，與從第一階段開(kāi)始的無(wú)限次重復(fù)博弈是完全相同的，因此博弈方第二階段的選擇必然也是H，第三階段也同樣。依次類(lèi)推。因?yàn)橹貜?fù)博弈的子博弈就是重復(fù)一定次數(shù)之后的全部重復(fù)博弈過(guò)程，因此無(wú)限次重復(fù)博弈的子博弈還是無(wú)限次重復(fù)博弈。由于前述兩博弈方的觸發(fā)策略在所有子博弈中都仍然構(gòu)成相同的觸發(fā)策略，因此必然也是這些子博弈的納什均衡，從而上述觸發(fā)策略組合構(gòu)成整個(gè)無(wú)限次重復(fù)博弈的子博弈完美納什均衡，其均衡路徑為兩博弈方每階段都選擇H。只要博弈方1采用前述觸發(fā)策略、那么博弈方2的最優(yōu)選擇就始終是H。當(dāng)然，如果博弈方1偏離H，博弈方2也必須用L來(lái)報(bào)復(fù)。因此博弈方2對(duì)博弈方1觸發(fā)策略的完整反應(yīng)策略是同樣的觸發(fā)策略。這就證明了雙方都采取上述觸發(fā)策略是一個(gè)納什均衡。第四十二頁(yè)，共五十七頁(yè)。42兩寡頭削價(jià)競(jìng)爭(zhēng)無(wú)限次重復(fù)博弈的民間定理廠商2得益廠商1得益(4,4)(1,1)(5,0)(5,0)第四十三頁(yè)，共五十七頁(yè)。431，15，00，54，4廠商1廠商2LHHL兩寡頭削價(jià)競(jìng)爭(zhēng)博弈在上述兩寡頭頭削價(jià)競(jìng)爭(zhēng)模型的無(wú)限次重復(fù)博弈中，納什均衡的得益數(shù)組為(1，1)，所有可實(shí)現(xiàn)得益構(gòu)成圖4．12中由(1，1)、(0，5)、(4，4)利(5，0)四點(diǎn)連成邊界線(xiàn)圍成的整個(gè)陰影部分面積中點(diǎn)的坐標(biāo)。無(wú)限次重復(fù)博弈的民間定理應(yīng)用到該博弈中意味著，由圖4．12中豎線(xiàn)條陰影部分中點(diǎn)的坐標(biāo)對(duì)應(yīng)的雙方數(shù)組，在該博弈的無(wú)限次重復(fù)博弈中，都有無(wú)限次重復(fù)博弈的子博弈完美納什均衡的平均得益來(lái)實(shí)現(xiàn)它們。第四十四頁(yè)，共五十七頁(yè)。44在無(wú)限次重復(fù)古諾模型中，當(dāng)貼現(xiàn)率滿(mǎn)足一定條件時(shí)，兩廠商采用下列觸發(fā)策略構(gòu)成一個(gè)子博弈完美納什均衡：4.51.5,4.51.53.751.5,55,3.751.542,42廠商2不突破突破在第一階段生產(chǎn)壟斷產(chǎn)量的一半1.5；在第t階段，如果前t-1階段結(jié)果都是(1.5,1.5)，則繼續(xù)生產(chǎn)1.5，否則生產(chǎn)古諾產(chǎn)量2。應(yīng)用：無(wú)限次重復(fù)古諾模型在無(wú)限次重復(fù)古諾模型中，當(dāng)貼現(xiàn)率滿(mǎn)足一定條件時(shí)，兩廠商采用下列觸發(fā)策略構(gòu)成一個(gè)子博弈完美納什均衡：第四十五頁(yè)，共五十七頁(yè)。45設(shè)廠商1已采用該觸發(fā)策略，若廠商2也采用該觸發(fā)策略，則每期得益4.5，無(wú)限次重復(fù)博弈總得益的現(xiàn)值為：廠商2不突破突破如果廠商2偏離上述觸發(fā)策略，則他在第一階段所選產(chǎn)量應(yīng)為給定廠商1產(chǎn)量為1.5時(shí)，自己的最大利潤(rùn)產(chǎn)量，即滿(mǎn)足：解得，此時(shí)利潤(rùn)為5.0625，高于觸發(fā)策略第一階段得益4.5。4.51.5,4.51.53.751.5,55,3.751.542,42第四十六頁(yè)，共五十七頁(yè)。46結(jié)論:在時(shí)，雙方都采用上述觸發(fā)策略是一條子博弈完美納什均衡路徑；當(dāng)時(shí)，偏離是廠商2對(duì)廠商1的觸發(fā)策略的最佳反應(yīng)。為什么貼現(xiàn)系數(shù)的大小會(huì)得出兩種不同情況？后一種情況說(shuō)明未來(lái)得益折算成現(xiàn)在值的貼現(xiàn)系數(shù)太小，即博弈方太不看重未來(lái)利益時(shí)，他就會(huì)只顧為自己撈取更多的眼前利益，不會(huì)為長(zhǎng)期利益打算，也不會(huì)害怕對(duì)方在未來(lái)階段的報(bào)復(fù)，在這種情況下無(wú)限次重復(fù)博弈也不能提高原博弈的效率。前一種情況則剛好相反，由于貼現(xiàn)系數(shù)較大，因此對(duì)廠商2來(lái)說(shuō)未來(lái)利益是足夠重要的，他不會(huì)為了一次性的眼前利益而激怒對(duì)方，導(dǎo)致自己的未來(lái)利益、長(zhǎng)期利益受到損失。第四十七頁(yè)，共五十七頁(yè)。47

現(xiàn)實(shí)生活中，市場(chǎng)上的寡頭企業(yè)往往有許多個(gè)，而不僅有兩個(gè)：假定是有n個(gè)企業(yè)時(shí)，要n個(gè)企業(yè)都堅(jiān)持觸發(fā)戰(zhàn)略，則貼現(xiàn)因子要滿(mǎn)足：當(dāng)時(shí)，。這說(shuō)明當(dāng)有許多企業(yè)時(shí)，除非未來(lái)的利益相當(dāng)大，才會(huì)使所有企業(yè)放棄短期利益去獲取長(zhǎng)遠(yuǎn)利益。但貼現(xiàn)因子等于1在現(xiàn)實(shí)中幾乎是可能的。故許多企業(yè)就會(huì)選擇只顧眼前不顧長(zhǎng)遠(yuǎn)的背叛行為。這就意味著，企業(yè)越多，合作越困難，這與現(xiàn)實(shí)狀況是非常吻合的。第四十八頁(yè)，共五十七頁(yè)。48參與人不固定的重復(fù)博弈重復(fù)博弈時(shí)，廠商不敢以劣貨欺人在經(jīng)濟(jì)學(xué)或管理學(xué)中使用“信譽(yù)”這樣一個(gè)不好解釋的概念，但在博弈論中卻在某些假設(shè)之下“邏輯地”證明了。所謂“信譽(yù)”，無(wú)非對(duì)自己行為的預(yù)期為什么買(mǎi)于“坐賈”而非“行商”？為什么車(chē)站旁邊的劣質(zhì)品那么多？企業(yè)存在的一個(gè)原因是創(chuàng)造一個(gè)“長(zhǎng)期參與人”，因其考慮長(zhǎng)期利益而遵章守紀(jì)、態(tài)度積極第四十九頁(yè)，共五十七頁(yè)。491，1-1，20，00，0高質(zhì)量低質(zhì)量猜硬幣方消費(fèi)者購(gòu)買(mǎi)不購(gòu)買(mǎi)廠商策略：第一次生產(chǎn)高質(zhì)量產(chǎn)品，繼續(xù)生產(chǎn)高質(zhì)量產(chǎn)品。如果上一次生產(chǎn)了低質(zhì)量產(chǎn)品，之后永遠(yuǎn)生產(chǎn)低質(zhì)量產(chǎn)品。消費(fèi)者策略：第一個(gè)消費(fèi)者選擇購(gòu)買(mǎi)，只要廠商不曾生產(chǎn)過(guò)低質(zhì)量產(chǎn)品，隨后的消費(fèi)者繼續(xù)購(gòu)買(mǎi)；如果廠商曾經(jīng)生產(chǎn)過(guò)低質(zhì)量產(chǎn)品，之后的消費(fèi)者不再購(gòu)買(mǎi)。廠商策略是最優(yōu)的：第五十頁(yè)，共五十七頁(yè)。501，1-1，20，00，0高質(zhì)量低質(zhì)量猜硬幣方消費(fèi)者購(gòu)買(mǎi)不購(gòu)買(mǎi)廠商不生產(chǎn)低質(zhì)量產(chǎn)品

消費(fèi)者：預(yù)期是高質(zhì)量時(shí)，才購(gòu)買(mǎi)。

消費(fèi)者預(yù)期不曾生產(chǎn)過(guò)低

質(zhì)量產(chǎn)品的廠商將繼續(xù)生

產(chǎn)高質(zhì)量產(chǎn)品，所以購(gòu)買(mǎi)

是最優(yōu)的；如果廠商曾經(jīng)

生產(chǎn)過(guò)低質(zhì)量產(chǎn)品，消費(fèi)

者預(yù)期廠商將繼續(xù)生產(chǎn)低

質(zhì)量產(chǎn)品，所以不購(gòu)買(mǎi)是

最優(yōu)的。

第五十一頁(yè)，共五十七頁(yè)。514.3.4有效工資率模型設(shè)定：首先廠商選擇工資率為，然后工人選擇接受或拒絕。如果拒絕，則他作個(gè)體戶(hù)得到收入小于，如果接受，則工人選擇努力工作（負(fù)效用）還是偷懶（無(wú)負(fù)效用）。廠商只能看到產(chǎn)量高低，高產(chǎn)量為，低產(chǎn)量0。工人努力工作時(shí)一定是高產(chǎn)量，不努力時(shí)卻并不一定是0，而是高產(chǎn)量的概率為，低產(chǎn)量0的概率為。工人努力工作時(shí)，廠商得益為，工人得益為；工人偷懶時(shí)，廠商期望得益為，工人得益為。第五十二頁(yè)，共五十七頁(yè)。52如果該模型是一個(gè)一次性博弈，則它的結(jié)果肯定是不理想的，因?yàn)橥ǔS商要預(yù)付工資給工人，或者即使發(fā)覺(jué)工人不努力也必須支付工資給工人，因此工人沒(méi)有努力工作的動(dòng)力，他必然會(huì)偷懶。由于廠商了解工人的這種思路，因此他決不會(huì)冒險(xiǎn)去雇用一個(gè)肯定不會(huì)努力工作的工人(當(dāng)P不夠大時(shí)，常是負(fù)數(shù))，因此他的選擇必然是。而工人則只能去做個(gè)體戶(hù)。如果我們假設(shè)

人人文庫(kù)> 全部分類(lèi)> 教育資料 > 課件下載

溫馨提示

1. 本站所有資源如無(wú)特殊說(shuō)明，都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請(qǐng)下載最新的WinRAR軟件解壓。
2. 本站的文檔不包含任何第三方提供的附件圖紙等，如果需要附件，請(qǐng)聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶(hù)所有。
3. 本站RAR壓縮包中若帶圖紙，網(wǎng)頁(yè)內(nèi)容里面會(huì)有圖紙預(yù)覽，若沒(méi)有圖紙預(yù)覽就沒(méi)有圖紙。
4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
5. 人人文庫(kù)網(wǎng)僅提供信息存儲(chǔ)空間，僅對(duì)用戶(hù)上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理，對(duì)用戶(hù)上傳分享的文檔內(nèi)容本身不做任何修改或編輯，并不能對(duì)任何下載內(nèi)容負(fù)責(zé)。
6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容，請(qǐng)與我們聯(lián)系，我們立即糾正。
7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶(hù)因使用這些下載資源對(duì)自己和他人造成任何形式的傷害或損失。

經(jīng)濟(jì)博弈論4培訓(xùn)資料課件

文檔簡(jiǎn)介

溫馨提示

最新文檔

評(píng)論

經(jīng)濟(jì)博弈論4培訓(xùn)資料課件

文檔簡(jiǎn)介

溫馨提示

最新文檔

評(píng)論

相關(guān)文檔