博弈論課件第四章

上傳人：活*** IP屬地：寧夏上傳時(shí)間：2021-11-09 格式：PPT 頁(yè)數(shù)：60 大?。?72.52KB 積分：20 舉報(bào) 版權(quán)申訴

已閱讀5頁(yè)，還剩55頁(yè)未讀，繼續(xù)免費(fèi)閱讀

版權(quán)說(shuō)明：本文檔由用戶(hù)提供并上傳，收益歸屬內(nèi)容提供方，若內(nèi)容存在侵權(quán)，請(qǐng)進(jìn)行舉報(bào)或認(rèn)領(lǐng)

文檔簡(jiǎn)介

1、第四講第四講重復(fù)博弈重復(fù)博弈何為何為“重復(fù)博弈重復(fù)博弈”？l重復(fù)博弈是指基本博弈重復(fù)進(jìn)行構(gòu)成的博弈過(guò)程。重復(fù)博弈中每個(gè)階段中的博弈方、可選策略、規(guī)則和得益都是相同的-是特殊的動(dòng)態(tài)博弈；形式上是基本博弈的重復(fù)進(jìn)行，但博弈方的行為和博弈結(jié)果不一定是基本博弈的簡(jiǎn)單重復(fù)，因?yàn)椴┺姆綄?duì)于博弈會(huì)重復(fù)進(jìn)行的意識(shí)，會(huì)使他們對(duì)利益的判斷發(fā)送變化，從而使他們?cè)谥貜?fù)博弈過(guò)程不同階段的行為選擇受到影響?？尚哦龋鹤硬┺耐昝佬匀允桥袛嗑馐欠穹€(wěn)定可靠的重要判斷依據(jù)4.1 引引論論4.1.1 為何研究為何研究“重復(fù)博弈重復(fù)博弈”（game）：）：4.1.2 基本概念基本概念：l分類(lèi)：有限次重復(fù)博弈，無(wú)限次重復(fù)博弈分類(lèi)

2、：有限次重復(fù)博弈，無(wú)限次重復(fù)博弈有限次重復(fù)博弈：給定一個(gè)基本博弈g（可以靜態(tài)，也可以動(dòng)態(tài)），重復(fù)進(jìn)行了t次g，并且在每次重復(fù)g之前，各博弈方都能觀(guān)察到以前博弈的結(jié)果，這樣的博弈過(guò)程稱(chēng)為“g的t次重復(fù)博弈”，記為g(t)。而g稱(chēng)為g(t)的“原博弈”。g(t)中的每次重復(fù)稱(chēng)為g(t)的一個(gè)“階段”。無(wú)限次重復(fù)博弈：理論上，重復(fù)博弈可以無(wú)限制進(jìn)行下去，不一定經(jīng)過(guò)一定次數(shù)重復(fù)以后就必須結(jié)束。如果一個(gè)基本博弈g一直重復(fù)下去，這樣的重復(fù)博弈就是“無(wú)限次重復(fù)博弈”，記為g()。無(wú)限次重復(fù)博弈的基本博弈也稱(chēng)為“原博弈”。無(wú)限次重復(fù)博弈是有無(wú)限個(gè)階段的動(dòng)態(tài)博弈。l 重復(fù)博弈的次數(shù)雖然有限，但重復(fù)的次數(shù)或博弈結(jié)

3、束的時(shí)間不確定，這種重復(fù)博弈中博弈方的行為選擇與確定結(jié)束時(shí)間的有限次重復(fù)博弈很不同，與無(wú)限次重復(fù)博弈很相似，甚至可以通過(guò)某種方式與無(wú)限次重復(fù)博弈統(tǒng)一起來(lái)。這種重復(fù)博弈可以稱(chēng)為“隨機(jī)結(jié)束的重復(fù)博弈”。策略、子博弈和均衡路徑策略、子博弈和均衡路徑l策略：博弈方的一個(gè)策略就是在每個(gè)階段（即每次重復(fù)），針對(duì)每種情況（以前階段的結(jié)果）如何行動(dòng)的計(jì)劃。l子博弈：重復(fù)博弈的子博弈就是從某個(gè)階段（不包括第一階段）開(kāi)始，包括此后所有階段的重復(fù)博弈部分。子博弈：重復(fù)博弈？原博弈？（最后一個(gè)階段）l路徑：子博弈完美納什均衡，以逆推歸納法（逆向歸納法）為核心的子博弈完美納什均衡分析及相關(guān)結(jié)論，可以推廣到重復(fù)博弈中。重

4、復(fù)博弈的路徑是由每個(gè)階段博弈方的行動(dòng)組合串聯(lián)而成的。因?yàn)閷?duì)應(yīng)前一階段的每種結(jié)果，下一階段都有原博弈全部策略組合數(shù)那么多種可能的結(jié)果。原博弈有m種策略組合，那么重復(fù)兩次就有m2條博弈路徑，重復(fù)次就有mt條博弈路徑。2111231.tttttt 重復(fù)博弈的得益重復(fù)博弈的得益l任何博弈博弈方策略選擇依據(jù)都是得益的大小。l計(jì)算重復(fù)博弈的“總得益”。l計(jì)算各階段的“平均得益”。l時(shí)間有先后，引入貼現(xiàn)系數(shù)2111231.ttttt 無(wú)限次重復(fù)博弈：隨機(jī)停止和貼現(xiàn)率隨機(jī)停止和貼現(xiàn)率l典型的隨機(jī)結(jié)束重復(fù)博弈可以理解為在進(jìn)行一個(gè)重復(fù)博弈時(shí)，每次都通過(guò)抽簽來(lái)決定是否停止重復(fù)，如果抽到停止重復(fù)的概率為，則抽到重復(fù)

5、下去的概率為。l設(shè)某博弈方在此博弈中的階段得益為，利率為，因?yàn)樵诿恳淮尾┺囊院竽芾^續(xù)下一次重復(fù)的可能性是，因此第二階段的期望得益為，進(jìn)一步，第三階段的期望得益為，l故該博弈方在重復(fù)博弈中期望得益的現(xiàn)值為：l其中最后一個(gè)等式是通過(guò)令得到的。l把這個(gè)與前面純粹考慮時(shí)間價(jià)值的貼現(xiàn)率統(tǒng)一起來(lái)，我們就把已知概率的隨機(jī)停止重復(fù)博弈與無(wú)限次重復(fù)博弈統(tǒng)一起來(lái)了。隨機(jī)停止重復(fù)博弈問(wèn)題可以當(dāng)作無(wú)限次重復(fù)博弈來(lái)進(jìn)行分析。4.2 有限次重復(fù)博弈有限次重復(fù)博弈l有限次重復(fù)博弈：給定一個(gè)基本博弈g（可以靜態(tài)，也可以動(dòng)態(tài)），重復(fù)進(jìn)行了t次g，并且在每次重復(fù)g之前，各博弈方都能觀(guān)察到以前博弈的結(jié)果，這樣的博弈過(guò)程稱(chēng)為“g的t

6、次重復(fù)博弈”，記為g(t)。而g稱(chēng)為g(t)的“原博弈”。g(t)中的每次重復(fù)稱(chēng)為g(t)的一個(gè)“階段”。策略、子博弈和均衡路徑策略、子博弈和均衡路徑l策略：博弈方的一個(gè)策略就是在每個(gè)階段（即每次重復(fù)），針對(duì)每種情況（以前階段的結(jié)果）如何行動(dòng)的計(jì)劃。l子博弈：重復(fù)博弈的子博弈就是從某個(gè)階段（不包括第一階段）開(kāi)始，包括此后所有階段的重復(fù)博弈部分。子博弈：重復(fù)博弈？原博弈？（最后一個(gè)階段）l路徑：子博弈完美納什均衡，以逆推歸納法（逆向歸納法）為核心的子博弈完美納什均衡分析及相關(guān)結(jié)論，可以推廣到重復(fù)博弈中。重復(fù)博弈的路徑是由每個(gè)階段博弈方的行動(dòng)組合串聯(lián)而成的。因?yàn)閷?duì)應(yīng)前一階段的每種結(jié)果，下一階段都有

7、原博弈全部策略組合數(shù)那么多種可能的結(jié)果。原博弈有m種策略組合，那么重復(fù)兩次就有m2條博弈路徑，重復(fù)次就有mt條博弈路徑。4.2.1 兩人零和博弈的有限次重復(fù)博弈兩人零和博弈的有限次重復(fù)博弈l重復(fù)零和博弈不會(huì)創(chuàng)造出新的利益。l合作的可能性根本不存在。即使雙方都知道還要重復(fù)進(jìn)行許多次基本博弈，也不會(huì)改變它們?cè)诋?dāng)前階段博弈中的行動(dòng)方式，不可能變得（哪怕是暫時(shí)的）合作和顧及對(duì)方的利益。l所有以零和博弈為原博弈的有限次重復(fù)博弈，博弈方的正確策略都是重復(fù)一次性博弈中的納什均衡策略。l推廣：非零和或多個(gè)博弈方，博弈方的利益嚴(yán)格對(duì)立，沒(méi)有純策略納什均衡的其他嚴(yán)格競(jìng)爭(zhēng)博弈中。在以這些博弈作為原博弈構(gòu)成的有限次重

8、復(fù)博弈中，惟一的子博弈完美納什均衡就是所有博弈方都始終采用原博弈的混合策略納什均衡策略。有限次重復(fù)猜硬幣博弈有限次重復(fù)猜硬幣博弈l各博弈方的正確策略就是在每次重復(fù)中都采用一次性博弈中的納什均衡策略。4.2.2 惟一純策略納什均衡博弈的有限惟一純策略納什均衡博弈的有限次重復(fù)博弈次重復(fù)博弈l在有惟一純策略納什均衡的博弈中，博弈方之間的利益關(guān)系不再是始終對(duì)立的，而是有很大一致性甚至完全一致。l在以這樣的博弈為原博弈的有限次重復(fù)博弈中，博弈方的行動(dòng)和博弈結(jié)果會(huì)不會(huì)發(fā)生質(zhì)的變化？l如果原博弈惟一的純策略納什均衡本身就是帕累托意義上的最佳策略組合，那么因?yàn)榉纤胁┺姆降睦?，因此，有限次重?fù)顯然不會(huì)改變

9、博弈方的行動(dòng)方式。l分析：原博弈惟一的納什均衡沒(méi)有達(dá)到帕累托效率，因此存在通過(guò)合作進(jìn)一步提高效率的潛在可能性的囚徒困境式的博弈，在有限次重復(fù)博弈中能不能實(shí)現(xiàn)合作和提高效率呢？-5，-50，-8-8，0-1，-1坦白不坦白坦白不坦白囚徒2囚徒1 圖4.1 囚徒的困境博弈有限次重復(fù)博弈的囚徒困境有限次重復(fù)博弈的囚徒困境重復(fù)博弈等價(jià)于圖4.2 兩次 -10， -10-5， -13-13， -5-6， -6坦白不坦白坦白不坦白囚徒 2囚徒1圖 4.2 逆推歸納法和等價(jià) 博弈一般結(jié)論：在有限次重復(fù)博弈中，如果原博弈存在唯一的純策略納什均衡策略組合，一般結(jié)論：在有限

10、次重復(fù)博弈中，如果原博弈存在唯一的純策略納什均衡策略組合，則有限次重復(fù)博弈的唯一的均衡解即各博弈方在每階段中都采用原博弈的納什均衡；則有限次重復(fù)博弈的唯一的均衡解即各博弈方在每階段中都采用原博弈的納什均衡；（2 2）由于在這樣的雙方策略下，均衡路徑中的每個(gè)階段都不存在任何不可信的）由于在這樣的雙方策略下，均衡路徑中的每個(gè)階段都不存在任何不可信的威脅或許諾，因此這種均衡是子博弈完美納什均衡。威脅或許諾，因此這種均衡是子博弈完美納什均衡。（3 3）在一個(gè)博弈中的每個(gè)博弈方的所有得益上各自加上相同的數(shù)值不會(huì)改變博弈）在一個(gè)博弈中的每個(gè)博弈方的所有得益上各自加上相同的數(shù)值不會(huì)改變博弈原來(lái)的均衡原來(lái)的

11、均衡定理定理設(shè)原博弈g有惟一的純策略納什均衡，則對(duì)任意正整數(shù)t，重復(fù)博弈g(t)有惟一的子博弈完美納什均衡，即各博弈方每個(gè)階段都采用g的納什均衡策略。各博弈方在g(t)中的總得益為在g中得益的t倍，平均得益等于原博弈g中的得益。gtg( )g tg一般結(jié)論一般結(jié)論：（1 1）在有限次重復(fù)博弈中，如果原博弈存在唯一的純策略納什在有限次重復(fù)博弈中，如果原博弈存在唯一的純策略納什均衡策略組合，則有限次重復(fù)博弈的唯一的均衡解即各博弈方在均衡策略組合，則有限次重復(fù)博弈的唯一的均衡解即各博弈方在每階段中都采用原博弈的納什均衡；每階段中都采用原博弈的納什均衡；（2 2）由于在這樣的雙方策略下，均衡路徑

12、中的每個(gè)階段都不存）由于在這樣的雙方策略下，均衡路徑中的每個(gè)階段都不存在任何不可信的威脅或許諾，因此這種均衡是子博弈完美納什均在任何不可信的威脅或許諾，因此這種均衡是子博弈完美納什均衡。衡。（3 3）在一個(gè)博弈中的每個(gè)博弈方的所有得益上各自加上相同的）在一個(gè)博弈中的每個(gè)博弈方的所有得益上各自加上相同的數(shù)值不會(huì)改變博弈原來(lái)的均衡數(shù)值不會(huì)改變博弈原來(lái)的均衡定理定理：設(shè)原博弈g有惟一的純策略納什均衡，則對(duì)任意正整數(shù)t，重復(fù)博弈g(t)有惟一的子博弈完美納什均衡，即各博弈方每個(gè)階段都采用g的納什均衡策略。各博弈方在g(t)中的總得益為在g中得益的t倍，平均得益等于原博弈g中的得益。石油輸出國(guó)組織

13、的困境石油輸出國(guó)組織的困境l（1）某些成員國(guó)的石油資源已趨枯竭；l（2）不少非石油輸出國(guó)組織成員國(guó)加入石油市場(chǎng)；l（3）石油輸出國(guó)組織成員之間地位的不平衡；l（4）有些國(guó)家由于政治、經(jīng)濟(jì)、軍事等方面的原因造成資金、財(cái)政緊張；100，10020，，20 ，高價(jià)低價(jià)高價(jià)低價(jià)寡頭2寡頭1圖4.3 削價(jià)競(jìng)爭(zhēng)博弈1507070150有限次重復(fù)削價(jià)競(jìng)爭(zhēng)模型有限次重復(fù)削價(jià)競(jìng)爭(zhēng)模型重復(fù)囚徒困境悖論和連鎖店悖論重復(fù)囚徒困境悖論和連鎖店悖論l（1 1）與直覺(jué)的差異）與直覺(jué)的差異l（2 2）連鎖店悖論（）連鎖店悖論（seltenselten，19781978）澤爾騰澤爾騰l一個(gè)在一個(gè)在n個(gè)市場(chǎng)都開(kāi)設(shè)有連鎖店的企

14、業(yè)，對(duì)于各個(gè)市個(gè)市場(chǎng)都開(kāi)設(shè)有連鎖店的企業(yè)，對(duì)于各個(gè)市場(chǎng)的競(jìng)爭(zhēng)者是否應(yīng)該加以打擊排斥？場(chǎng)的競(jìng)爭(zhēng)者是否應(yīng)該加以打擊排斥？l由于由于n個(gè)市場(chǎng)的競(jìng)爭(zhēng)者一般不會(huì)同時(shí)進(jìn)入競(jìng)爭(zhēng)，如果個(gè)市場(chǎng)的競(jìng)爭(zhēng)者一般不會(huì)同時(shí)進(jìn)入競(jìng)爭(zhēng)，如果忽略各個(gè)市場(chǎng)環(huán)境、競(jìng)爭(zhēng)者不同等方面的微小差異，忽略各個(gè)市場(chǎng)環(huán)境、競(jìng)爭(zhēng)者不同等方面的微小差異，這個(gè)問(wèn)題對(duì)上述連鎖企業(yè)來(lái)說(shuō)相當(dāng)于一個(gè)這個(gè)問(wèn)題對(duì)上述連鎖企業(yè)來(lái)說(shuō)相當(dāng)于一個(gè)n次重復(fù)的次重復(fù)的重復(fù)博弈。重復(fù)博弈。ll較多階段的動(dòng)態(tài)博弈較多階段的動(dòng)態(tài)博弈例：若例：若10次重復(fù)下先來(lái)后到博弈，次重復(fù)下先來(lái)后到博弈，spne？97l 打進(jìn) 不進(jìn) （0，10）打擊和平（-2，3）（5，5）ba結(jié)論結(jié)論

15、： 10個(gè)重復(fù)博弈的spne就是重復(fù)原博弈g的子博弈納什均衡。這就有有名的“連鎖店悖論?？偨Y(jié)：總結(jié)：l第一類(lèi)是由零和博弈構(gòu)成的，不存在純策略ne；第二類(lèi)是唯一的純策略納什么均衡的靜態(tài)博弈構(gòu)成的。l共性：重復(fù)博弈本質(zhì)上只不過(guò)是原博弈的簡(jiǎn)單重復(fù)，重復(fù)博弈每個(gè)階段采取的策略就是原博弈中所采取的策略，在零和博弈的情況下是同樣的混合策略ne，在后一種情況下則是純策略ne;l重復(fù)博弈并不能給博弈方帶來(lái)比一次博弈更好的結(jié)果，每階段的平均得益與一次性博弈的得益相同。例：例：如果如果t次重復(fù)齊威王田忌賽馬，雙方在該重次重復(fù)齊威王田忌賽馬，雙方在該重復(fù)博弈中的策略是什么？博弈結(jié)果如何？復(fù)博弈中的策略是什么？博弈

16、結(jié)果如何？l特點(diǎn)：此博弈是混合博弈ne的嚴(yán)格競(jìng)爭(zhēng)零和博弈，對(duì)一方有利的策略組合總是對(duì)另一方不利，沒(méi)有一個(gè)策略組合雙方同時(shí)愿意接受。例例2：重復(fù)博弈與一次性博弈效率不同？：重復(fù)博弈與一次性博弈效率不同？4.2.3 有兩個(gè)有兩個(gè)納什均衡博弈的有限次重納什均衡博弈的有限次重復(fù)博弈復(fù)博弈l重復(fù)博弈有可能有多個(gè)子博弈完美納會(huì)均衡重復(fù)博弈有可能有多個(gè)子博弈完美納會(huì)均衡路徑重復(fù)次數(shù)越多，這種路徑也越多，并且路徑重復(fù)次數(shù)越多，這種路徑也越多，并且會(huì)出現(xiàn)在原博弈中并非均衡的策略組合在重會(huì)出現(xiàn)在原博弈中并非均衡的策略組合在重復(fù)博弈中卻構(gòu)成其子博弈完美納什均衡的一復(fù)博弈中卻構(gòu)成其子博弈完美納什均衡的一個(gè)部分的情況。

17、個(gè)部分的情況。3，31，44，10，0abab廠(chǎng)商2產(chǎn)商1圖4.8 兩市場(chǎng)博弈兩個(gè)廠(chǎng)商兩個(gè)廠(chǎng)商1 1和和2 2，同時(shí)面臨兩個(gè)市場(chǎng)機(jī)會(huì)，同時(shí)面臨兩個(gè)市場(chǎng)機(jī)會(huì)a a和和b b。假設(shè)每個(gè)。假設(shè)每個(gè)廠(chǎng)商都只有能力選擇一個(gè)市場(chǎng)發(fā)展，即他們的可選策略廠(chǎng)商都只有能力選擇一個(gè)市場(chǎng)發(fā)展，即他們的可選策略都是都是a a或或b b。a a：市場(chǎng)較大，但開(kāi)發(fā)程度還很低：市場(chǎng)較大，但開(kāi)發(fā)程度還很低b b：市場(chǎng)較小，但已不需花大力氣去開(kāi)發(fā)市場(chǎng)：市場(chǎng)較小，但已不需花大力氣去開(kāi)發(fā)市場(chǎng)輪換策略：雙方輪流去兩個(gè)不同市場(chǎng)的策略。例：兩市場(chǎng)博弈的重復(fù)博弈例：兩市場(chǎng)博弈的重復(fù)博弈3，31，44，10，0abab廠(chǎng)商2產(chǎn)商1圖4.8 兩

18、市場(chǎng)博弈(1,4)(1.5,3)(3,3)(2.5,2.5)(2,2)(3,1.5)(4,1)廠(chǎng)商2得益廠(chǎng)商1得益圖4.9 兩市場(chǎng)博弈及重復(fù)博弈各均衡的平均得益例：兩市場(chǎng)博弈的重復(fù)博弈例：兩市場(chǎng)博弈的重復(fù)博弈輪換策略：雙方輪流去兩個(gè)不同市場(chǎng)的策略。3，31，44，10，0abab廠(chǎng)商2產(chǎn)商1圖4.8 兩市場(chǎng)博弈廠(chǎng)商廠(chǎng)商1 1：第一階段選：第一階段選a a；如果第一階段結(jié)果是（；如果第一階段結(jié)果是（a,aa,a），），則第二階段選則第二階段選a a；如果第一階段結(jié)果是（；如果第一階段結(jié)果是（a a，b b），則第二），則第二階段選階段選b b；第三階段無(wú)條件選；第三階段無(wú)條件選b b。廠(chǎng)商廠(chǎng)

19、商2 2：第一階段選第一階段選a a；則第二階段無(wú)條件選；則第二階段無(wú)條件選b b；如果第；如果第一階段結(jié)果是（一階段結(jié)果是（a,aa,a），則第三階段選），則第三階段選a a ；如果第一階段；如果第一階段結(jié)果是（結(jié)果是（b,ab,a），則第三階段選），則第三階段選b b；輪換策略：雙方輪流去兩個(gè)不同市場(chǎng)的策略。例：兩市場(chǎng)博弈的重復(fù)博弈（進(jìn)行三次）例：兩市場(chǎng)博弈的重復(fù)博弈（進(jìn)行三次）三階段路徑三階段路徑: :( (a,a）到（）到（a，b）再到再到(b,a)是是spne路徑路徑平均得益平均得益=（3+1+4）/3=2.67例例3：分析兩次重復(fù)制式問(wèn)題時(shí)雙方：分析兩次重復(fù)制式問(wèn)題時(shí)雙方的均衡策略

20、的均衡策略l彩電有不同的制式，采用相同的制式，則廠(chǎng)商之間由于零部件的通用性，相關(guān)設(shè)備可相互匹配等大家都能獲得一定的好處。l設(shè)有兩廠(chǎng)商都決定引進(jìn)彩電生產(chǎn)線(xiàn)，可選擇的有a,b兩種制式，則兩廠(chǎng)商面臨一個(gè)決定制式的博弈。l 廠(chǎng)商b a b a廠(chǎng)商a b結(jié)論：純策略ne多于一個(gè)，無(wú)法肯定在一次博弈中兩博弈方究竟會(huì)作何選擇，哪個(gè)結(jié)果會(huì)出現(xiàn)。1,3 0,00,0 2,24.2.3 多個(gè)純策略納什均衡博弈的有限多個(gè)純策略納什均衡博弈的有限次重復(fù)博弈次重復(fù)博弈觸發(fā)策略觸發(fā)策略trigger strategy：首先試探合作，首先試探合作，一旦發(fā)覺(jué)對(duì)方不合作，則也用不合作相報(bào)一旦發(fā)覺(jué)對(duì)方不合作，則也用不合作相報(bào)復(fù)的

21、策略。復(fù)的策略。冷酷策略冷酷策略grim strategy 例：例：博弈博弈g如下圖：如下圖： 1,15,00,00,54,40,00,00,03,3 博弈博弈2 l m r 博博 l弈弈 m1 r 最重要的是：兩次重復(fù)的路徑中包括的最重要的是：兩次重復(fù)的路徑中包括的spne中中可在第一階段采用非原可在第一階段采用非原博弈的均衡策略博弈的均衡策略例：例：博弈博弈g如下圖：如下圖：博弈方博弈方1：第一階段選：第一階段選m；如第一階段結(jié)果為（；如第一階段結(jié)果為（m，m），），則第一階段選則第一階段選r；如第一階段結(jié)果為任何其他；如第一階段結(jié)果為任何其他策略組合，則選策略組合，則選l. 博

22、弈方博弈方2：同博弈方：同博弈方1：結(jié)論結(jié)論：路徑為第一階段（：路徑為第一階段（m,m），），第二階段第二階段(r,r)，是一個(gè)，是一個(gè)spne路徑路徑 2,26,11,11,67,71,11,11,14,4 博弈博弈2 l m r 博博 l弈弈 m1 r 最重要的是：觸發(fā)策略所帶的威脅的可信性。最重要的是：觸發(fā)策略所帶的威脅的可信性。兩兩博弈方都采用觸發(fā)策略：第一階段選結(jié)果為（博弈方都采用觸發(fā)策略：第一階段選結(jié)果為（m,m），），則第二階段必為（則第二階段必為（r,r）；而第一階段結(jié)果為任何其他）；而第一階段結(jié)果為任何其他8種結(jié)種結(jié) 果時(shí)，第二階段必為（果時(shí)，第二階段必為（l,l） 4

23、,48,33,33,87,73,33,33,36,6 博弈博弈2 l m r 博博 l弈弈 m1 r 最重要的是：觸發(fā)策略所帶的威脅的可信性。最重要的是：觸發(fā)策略所帶的威脅的可信性。兩兩博弈方：不管第一階段結(jié)果如何，第二階段總為（博弈方：不管第一階段結(jié)果如何，第二階段總為（r,r），），得益（得益（3，3）所采用的觸發(fā)策略的威脅的可信性是勉強(qiáng)的。所采用的觸發(fā)策略的威脅的可信性是勉強(qiáng)的。5，50，60，26，03，30，22，02，01，1mlhhml廠(chǎng)商2產(chǎn)商1圖4.4 三價(jià)博弈三價(jià)博弈的重復(fù)博弈三價(jià)博弈的重復(fù)博弈8，81，71，37，14，41，33，13，12，2mlhhml廠(chǎng)商2產(chǎn)商1

24、圖4.5 兩次重復(fù)三價(jià)博弈的等價(jià)博弈觸發(fā)策略觸發(fā)策略trigger strategytrigger strategy：首先試探合作，一首先試探合作，一旦發(fā)覺(jué)對(duì)方不合作，則也用不合作相報(bào)復(fù)的策略。旦發(fā)覺(jué)對(duì)方不合作，則也用不合作相報(bào)復(fù)的策略。冷酷策略冷酷策略grim strategygrim strategy8，83，93，59，36，61，35，35，34，4mlhhml廠(chǎng)商2產(chǎn)商1圖4.6 重復(fù)三價(jià)博弈的等價(jià)博弈：不可信報(bào)復(fù)觸發(fā)策略的進(jìn)一步討論觸發(fā)策略的進(jìn)一步討論不計(jì)前嫌擔(dān)心報(bào)復(fù)5，50，60，20，00，06，03，30，20，00，02，02，01，10，00，00，00，00，04，1/

25、20，00，00，00，00，01/2，4 hmlpqhm l pq博弈方2博弈方2圖4.7 重復(fù)博弈時(shí)觸發(fā)策略可信性較強(qiáng)的博弈iwiwiw4.2.4 4.2.4 有限次重復(fù)博弈的無(wú)名氏定理（有限次重復(fù)博弈的無(wú)名氏定理（folk folk theoremtheorem）民間定理，民歌定理首先，記為博弈方在一次性博弈中最差的均衡得益（支付），用表示各博弈方的構(gòu)成的得益數(shù)組。其次，不管其他博弈方的行為如何，一博弈方在某個(gè)博弈中只要自己采取某種特定的策略，最低限度保證能獲得的得益稱(chēng)為“個(gè)體理性得益”（individual rationality payoff）或“保留得益”（reservatio

26、n payoff）。第三，博弈中所有純策略組合得益的加權(quán)平均（權(quán)數(shù)非負(fù)且總和為1）數(shù)組稱(chēng)為“可實(shí)現(xiàn)得益”（feasible payoff）。iwiwiw有限次重復(fù)博弈的無(wú)名氏定理有限次重復(fù)博弈的無(wú)名氏定理l設(shè)原博弈的一次性博弈有均衡得益數(shù)組優(yōu)于，設(shè)原博弈的一次性博弈有均衡得益數(shù)組優(yōu)于，那么在該博弈的多次重復(fù)中，所有不小于個(gè)人那么在該博弈的多次重復(fù)中，所有不小于個(gè)人理性得益的可實(shí)現(xiàn)得益，都至少有一個(gè)子博弈理性得益的可實(shí)現(xiàn)得益，都至少有一個(gè)子博弈完美納什均衡的極限的平均得益來(lái)實(shí)現(xiàn)它們。完美納什均衡的極限的平均得益來(lái)實(shí)現(xiàn)它們。廠(chǎng)商2得益廠(chǎng)商1得益（1，4）（3，3）(4，1）0w=(1,1)圖4.1

27、0 兩市場(chǎng)博弈有限次重復(fù)的民間定理無(wú)名氏定理的關(guān)鍵意義：l保證這些得益有一定次數(shù)重復(fù)博弈的子博弈完美納保證這些得益有一定次數(shù)重復(fù)博弈的子博弈完美納什均衡的平均得益可以實(shí)現(xiàn)或逼近它們。什均衡的平均得益可以實(shí)現(xiàn)或逼近它們。l有助于在重復(fù)博弈中更好地把握機(jī)會(huì)，設(shè)計(jì)和運(yùn)用有助于在重復(fù)博弈中更好地把握機(jī)會(huì)，設(shè)計(jì)和運(yùn)用高效率的策略，建立相互的默契和信任，從而爭(zhēng)取高效率的策略，建立相互的默契和信任，從而爭(zhēng)取實(shí)現(xiàn)更好的博弈結(jié)果。實(shí)現(xiàn)更好的博弈結(jié)果。ll重復(fù)博弈往往也很難確定博弈結(jié)果究竟是哪一個(gè)子重復(fù)博弈往往也很難確定博弈結(jié)果究竟是哪一個(gè)子博弈完美納什均衡。現(xiàn)實(shí)博弈的結(jié)果很大程度上取博弈完美納什均衡?，F(xiàn)實(shí)博弈的

28、結(jié)果很大程度上取決于博弈方對(duì)重復(fù)博弈結(jié)構(gòu)和性質(zhì)的了解，以及博決于博弈方對(duì)重復(fù)博弈結(jié)構(gòu)和性質(zhì)的了解，以及博弈方的分析能力和相互信任等因素，特別是博弈方弈方的分析能力和相互信任等因素，特別是博弈方是否具有設(shè)計(jì)和實(shí)行輪換策略、觸發(fā)策略的能力和是否具有設(shè)計(jì)和實(shí)行輪換策略、觸發(fā)策略的能力和默契。默契。l冷酷策略grim strategy：以囚徒困境博弈為例。l(1) 一開(kāi)始選擇抵賴(lài)l(2) 一直選擇抵賴(lài)，除非某些參與人選擇了坦白；如果某些參與人已經(jīng)選擇了坦白，那么就永遠(yuǎn)選擇坦白ll針?shù)h相對(duì)策略tit-for-tatl(1) 開(kāi)始時(shí)選擇否認(rèn)。l此后，在第n期選擇其他參與人在第n-1期選擇的行動(dòng)。 4.3

29、無(wú)限次重復(fù)博弈無(wú)限次重復(fù)博弈有限與無(wú)限的比較有限與無(wú)限的比較l異：l有限次：（1）存在最后一次博弈正是破壞重復(fù)博弈中博弈方利益和行為的相互制約關(guān)系，使重復(fù)博弈無(wú)法實(shí)現(xiàn)更高效率均衡的關(guān)鍵。l（2）不一定考慮貼現(xiàn)問(wèn)題l無(wú)限次：（1）（2）對(duì)博弈方選擇和博弈均衡的分析必須以平均得益或總得益的現(xiàn)值為依據(jù)。l l同：試圖“合作”，懲罰“不合作”都是實(shí)現(xiàn)理想均衡的關(guān)鍵，是構(gòu)造高效率均衡策略的核心構(gòu)件。l 4.3.1 兩人零和博弈的無(wú)限次重復(fù)博弈兩人零和博弈的無(wú)限次重復(fù)博弈l沒(méi)有最后一個(gè)階段，逆推法。l先討論無(wú)限次重復(fù)博弈的第階段。顯然，該階段博弈方面臨的仍然是一個(gè)無(wú)限次重復(fù)博弈兩人零和博弈，博弈方的利益關(guān)

30、系不會(huì)因?yàn)榈趖-1階段或前t-1階段的結(jié)果而有任何改變，仍然是嚴(yán)格對(duì)立的，因此在第t-1階段不會(huì)合作。同理，第t-2、t-3也都不會(huì)合作。從重復(fù)博弈的第一個(gè)階段開(kāi)始就不可能合作。l l推廣到更多博弈方、非零和的其他嚴(yán)格競(jìng)爭(zhēng)博弈的無(wú)限次重復(fù)博弈。4.3.2 惟一純策略納什均衡博弈的無(wú)限惟一純策略納什均衡博弈的無(wú)限次重復(fù)博弈次重復(fù)博弈l原博弈有惟一純策略納什均衡的無(wú)限次重復(fù)博弈l帕累托意義上最佳策略組合l存在前在合作利益的囚徒困境式博弈 4，40，55，01，1hlhl博弈方2博弈方1圖4.11 兩寡頭削價(jià)競(jìng)爭(zhēng)博弈囚徒困境式的無(wú)限次重復(fù)囚徒困境式的無(wú)限次重復(fù) 在囚徒困境式博弈的無(wú)限次重復(fù)博弈中，對(duì)

31、雙方有利的合作在子博弈完美納什均衡中有可能存在，博弈可能會(huì)出現(xiàn)較理想的結(jié)果。1( ,., )nee1(,.,)nxxiixei( , )g1(,.,)nxx無(wú)限次重復(fù)博弈無(wú)名氏定理：設(shè)g是一個(gè)完全信息的靜態(tài)博弈。用記g的納什均衡的得益，用表示g的任意可實(shí)現(xiàn)得益。如果對(duì)任意博弈方都成立，而足夠接近1，那么無(wú)限次重復(fù)博弈中一定存在一個(gè)子博弈完美的納什均衡，各博弈方的平均得益就是。弗里德曼（1971）這個(gè)定理稱(chēng)為無(wú)名氏定理是因?yàn)橛邢薮沃貜?fù)博弈無(wú)名氏定理的關(guān)系。廠(chǎng)商2得益（0，5）（4，4)(5，0）w=（1，1）廠(chǎng)商1得益圖4.12 兩寡頭削價(jià)競(jìng)爭(zhēng)無(wú)限次重復(fù)博弈的民間定理0例：例：l寡頭

32、的古諾產(chǎn)量博弈中，如果市場(chǎng)需求p=130-q,邊際成本c=30且沒(méi)有固定成本，帖現(xiàn)因子=0.9。如果該市場(chǎng)有長(zhǎng)期穩(wěn)定性，問(wèn)兩個(gè)廠(chǎng)商能否維持壟斷產(chǎn)量？例：例：l如果上一題廠(chǎng)商1的邊際成本改為10，廠(chǎng)商2的邊際成本仍然是30.假設(shè)該市場(chǎng)仍然是長(zhǎng)期穩(wěn)定的，而且兩個(gè)廠(chǎng)商之間已經(jīng)達(dá)成廠(chǎng)商1生產(chǎn)3/4，廠(chǎng)商2生產(chǎn)1/4的壟斷產(chǎn)量分配協(xié)議，問(wèn)這種協(xié)議是否能夠長(zhǎng)期維持？例：兩人合作開(kāi)發(fā)一項(xiàng)產(chǎn)品，能否成例：兩人合作開(kāi)發(fā)一項(xiàng)產(chǎn)品，能否成功與兩個(gè)人的工作態(tài)度有關(guān)。功與兩個(gè)人的工作態(tài)度有關(guān)。l得益矩陣如下： l b 努力偷懶a 努力 9/4，9/4 3/2，5/2 偷懶 5/2，3/2 2，2問(wèn)題：該博弈無(wú)限次重復(fù)

33、博弈的均衡？案例案例3：價(jià)格大戰(zhàn)和雙贏對(duì)局：價(jià)格大戰(zhàn)和雙贏對(duì)局l兩個(gè)企業(yè)壟斷或幾乎壟斷了某種商品的市場(chǎng)，他們兩個(gè)企業(yè)壟斷或幾乎壟斷了某種商品的市場(chǎng)，他們都想打垮對(duì)手，爭(zhēng)取更大的利潤(rùn)?？煽诳蓸?lè)公司和都想打垮對(duì)手，爭(zhēng)取更大的利潤(rùn)?？煽诳蓸?lè)公司和百事可樂(lè)公司，幾乎壟斷了美國(guó)碳酸飲料的市場(chǎng)，百事可樂(lè)公司，幾乎壟斷了美國(guó)碳酸飲料的市場(chǎng)，他們之間的爭(zhēng)斗，就是這個(gè)樣子。爭(zhēng)斗的目的，最他們之間的爭(zhēng)斗，就是這個(gè)樣子。爭(zhēng)斗的目的，最后是增加自己的利潤(rùn)后是增加自己的利潤(rùn)-要緊的因素是市場(chǎng)份額。要緊的因素是市場(chǎng)份額。l假定兩個(gè)企業(yè)都采取比較低的價(jià)格，可以各得利潤(rùn)假定兩個(gè)企業(yè)都采取比較低的價(jià)格，可以各得利潤(rùn)3030億美

34、元；都采取比較高的價(jià)格，各得億美元；都采取比較高的價(jià)格，各得5050億美元；億美元；而如果一家采取較高的價(jià)格而另一家采取較低的價(jià)而如果一家采取較高的價(jià)格而另一家采取較低的價(jià)格，那么價(jià)格高的企業(yè)利潤(rùn)變格，那么價(jià)格高的企業(yè)利潤(rùn)變1010億美元，價(jià)格低的億美元，價(jià)格低的企業(yè)因多銷(xiāo)利潤(rùn)將上升到企業(yè)因多銷(xiāo)利潤(rùn)將上升到6060億美元。億美元。l 百事可樂(lè) 低價(jià) 高價(jià) 低價(jià)可口可樂(lè) 高價(jià)問(wèn)：為什么兩個(gè)企業(yè)那么蠢要進(jìn)行價(jià)格大戰(zhàn)呢？?jī)r(jià)格博弈中，只要以對(duì)方為敵手，那么不管對(duì)方的決策怎樣，自己總是采取低價(jià)策略會(huì)占便宜。這就促使雙方都采取低價(jià)策略。為何不合作？-“雙贏對(duì)局”。3,3 6,1 1,6 5,5案例案例4：

35、為什么多數(shù)情形是非合作博：為什么多數(shù)情形是非合作博弈？弈？l博弈論主要研究非合作博弈，主要有兩方面原因：博弈論主要研究非合作博弈，主要有兩方面原因：l從經(jīng)濟(jì)的角度來(lái)看，如果幾個(gè)大企業(yè)聯(lián)手或勾結(jié)起從經(jīng)濟(jì)的角度來(lái)看，如果幾個(gè)大企業(yè)聯(lián)手或勾結(jié)起來(lái)形成對(duì)行業(yè)的壟斷，謀求最大利潤(rùn)，那么他們結(jié)來(lái)形成對(duì)行業(yè)的壟斷，謀求最大利潤(rùn)，那么他們結(jié)成的聯(lián)盟，稱(chēng)為成的聯(lián)盟，稱(chēng)為“卡特爾卡特爾”。卡特爾因?yàn)橛勺灾鞯?。卡特爾因?yàn)橛勺灾鞯钠髽I(yè)組成，所以很不穩(wěn)定。以產(chǎn)量競(jìng)爭(zhēng)來(lái)說(shuō)，組成企業(yè)組成，所以很不穩(wěn)定。以產(chǎn)量競(jìng)爭(zhēng)來(lái)說(shuō)，組成卡特爾，就要討價(jià)還價(jià)，達(dá)成限制產(chǎn)量的協(xié)定，總卡特爾，就要討價(jià)還價(jià)，達(dá)成限制產(chǎn)量的協(xié)定，總產(chǎn)量因?yàn)閰f(xié)定的

36、限制降低了，價(jià)格也就上去了，可產(chǎn)量因?yàn)閰f(xié)定的限制降低了，價(jià)格也就上去了，可能比結(jié)成卡特爾以前高很多。這時(shí)候，誰(shuí)要是偷偷能比結(jié)成卡特爾以前高很多。這時(shí)候，誰(shuí)要是偷偷地?cái)U(kuò)大產(chǎn)量，他可能占到很大的便宜。卡特爾聯(lián)盟地?cái)U(kuò)大產(chǎn)量，他可能占到很大的便宜?？ㄌ貭柭?lián)盟和組成聯(lián)盟的成員之間和組成聯(lián)盟的成員之間l的關(guān)系，不是上下級(jí)的關(guān)系，不時(shí)誰(shuí)服從誰(shuí)的關(guān)系。的關(guān)系，不是上下級(jí)的關(guān)系，不時(shí)誰(shuí)服從誰(shuí)的關(guān)系?？ㄌ貭柕某蓡T，都是獨(dú)立的經(jīng)濟(jì)主體人，只不過(guò)為了卡特爾的成員，都是獨(dú)立的經(jīng)濟(jì)主體人，只不過(guò)為了利益關(guān)系走到一起來(lái)了。偷偷違反協(xié)議增加產(chǎn)量或提利益關(guān)系走到一起來(lái)了。偷偷違反協(xié)議增加產(chǎn)量或提供優(yōu)惠會(huì)撈到很大的便宜，這就促使一些成員違反協(xié)供優(yōu)惠會(huì)撈到很大的便宜，這就促使一些成員違反協(xié)議。所以說(shuō)，卡特爾行為本身就提供了瓦解卡特爾的議。所以說(shuō)，卡特爾行為本身就提供了瓦解卡特爾的激勵(lì)。在人類(lèi)經(jīng)濟(jì)活動(dòng)中，除了石油輸出國(guó)組織激勵(lì)。在人類(lèi)經(jīng)濟(jì)活動(dòng)中，除了石油輸出國(guó)組織opecopec以外，卡特爾成功的例子實(shí)在很少。以外，卡特爾成功的例子實(shí)在很少。l從政府管制的角度來(lái)看，卡特爾在許多情況下是非法從政府管制的角度來(lái)看，卡特爾在許多情況下是非法行為。行為。19801980年代電風(fēng)扇大戰(zhàn)的時(shí)候，我國(guó)電風(fēng)扇企業(yè)年代

人人文庫(kù)> 全部分類(lèi)> 行業(yè)資料 > 農(nóng)林牧漁

溫馨提示

1. 本站所有資源如無(wú)特殊說(shuō)明，都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請(qǐng)下載最新的WinRAR軟件解壓。
2. 本站的文檔不包含任何第三方提供的附件圖紙等，如果需要附件，請(qǐng)聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶(hù)所有。
3. 本站RAR壓縮包中若帶圖紙，網(wǎng)頁(yè)內(nèi)容里面會(huì)有圖紙預(yù)覽，若沒(méi)有圖紙預(yù)覽就沒(méi)有圖紙。
4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
5. 人人文庫(kù)網(wǎng)僅提供信息存儲(chǔ)空間，僅對(duì)用戶(hù)上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理，對(duì)用戶(hù)上傳分享的文檔內(nèi)容本身不做任何修改或編輯，并不能對(duì)任何下載內(nèi)容負(fù)責(zé)。
6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容，請(qǐng)與我們聯(lián)系，我們立即糾正。
7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶(hù)因使用這些下載資源對(duì)自己和他人造成任何形式的傷害或損失。

博弈論課件第四章

文檔簡(jiǎn)介

溫馨提示

最新文檔

評(píng)論

博弈論課件 第四章

文檔簡(jiǎn)介

溫馨提示

最新文檔

評(píng)論

相關(guān)文檔

博弈論課件第四章