經(jīng)管營銷博弈

上傳人：1*** IP屬地：云南上傳時間：2024-08-26 格式：PPTX 頁數(shù)：59 大小：449KB 積分：20 舉報 版權(quán)申訴

已閱讀5頁，還剩54頁未讀，繼續(xù)免費閱讀

版權(quán)說明：本文檔由用戶提供并上傳，收益歸屬內(nèi)容提供方，若內(nèi)容存在侵權(quán)，請進行舉報或認領

文檔簡介

2024/8/26中南財經(jīng)政法大學信息學院1

第二節(jié)

有限次重復博弈

重復次數(shù)較少的有限次重復博弈可以不考慮不同階段得益的貼現(xiàn)問題。

一、兩人零和的有限次重復博弈重復零和博弈不會創(chuàng)造出新的利益。如重復進行猜硬幣博弈，不管兩個博弈方如何選擇，每次重復的結(jié)果都是一方贏一方輸，得益相加為0。因此在零和博弈或者它們的重復博弈中，雙方合作的可能性根本不存在。

2024/8/26中南財經(jīng)政法大學信息學院2二、唯一純策略納什均衡的有限次重復博弈

首先容易理解的是，如果原博弈的惟一的純策略納什均衡本身就是的累托效率意義上的最佳策略組合，那么因為符合所有博弈方的利益，因此有限次重復顯然不會改變博弈方的行為方式。

我們最關心的當然不是這種博弈，而是原博弈惟一的納什均衡沒有達到帕累托效率，因此存在通過合作進一步提高效率的潛在可能性的囚徒困境式博弈，在有限次重復博弈中能不能實現(xiàn)合作和提高效率的問題。如果原博弈惟一的納什均衡沒有達到帕累托效率，在有限次重復博弈中能不能實現(xiàn)合作和提高效率呢？2024/8/26中南財經(jīng)政法大學信息學院3有限次重復囚徒的困境博弈

現(xiàn)考慮兩次重復的囚徒困境博弈，在這個兩次重復博弈中，兩博弈方先進行第一次博弈，雙方看到第一次博弈的結(jié)果以后再進行第二次博弈。囚徒2坦白不坦白-1,-1-8,00,-8-5,-52024/8/26中南財經(jīng)政法大學信息學院4

我們用逆向歸納法來分析該重復博弈，先分析第二階段，也就是第一次重復時兩博弈方的選擇。這個第二階段仍然是一個囚徒困境博弈,此時前一階段的結(jié)果已成為既成事實，此后又不再有任何的后續(xù)階段，因此實現(xiàn)自身當前的最大利益是兩博弈方在該階段決策中的唯一原則。因此我們不難得出結(jié)論，不管前一次博弈的結(jié)果如何，第二階段的唯一結(jié)果就是原博弈惟一的納什均衡(坦白,坦白)，雙方得益(-5，-5)。

現(xiàn)在再回到第一階段，即第一次博弈。理性的博弈方在第一階段就對后一階段的結(jié)局非常清楚，知道第二個階段的結(jié)果必然是(坦白，坦白)，雙方得到(－5，－5)。2024/8/26中南財經(jīng)政法大學信息學院5

因此不管第一階段的博弈結(jié)果是什么，雙方在整個重復博弈中的最終得益，都將是在第一階段得益的基礎上各加－5。因此從第一階段的選擇來看，這個重復博弈與下圖中得益矩陣表示的一次性博弈實際上是完全等價的。

該等價博弈仍然有惟一的純策略納什均衡(坦白，坦白)，雙方的得益則為(-10

，-10)。囚徒2坦白不坦白-6,-6-13,-5-5,-13-10,-102024/8/26中南財經(jīng)政法大學信息學院6

這意味著兩次重復囚徒的困境博弈的第一階段結(jié)果與一次性博弈也一樣，最終兩次重復囚徒困境博弈仍然相當于一次性囚徒困境博弈的簡單重復。

根據(jù)上述分析方法，我們同樣可以證明3次、4次，或者n次重復囚徒困境博弈的結(jié)果都是一樣的，那就是每次重復都采用原博弈惟一的純策略納什均衡，這就是這種重復博弈惟一的子博弈完美納什均衡路徑。

事實上，上述結(jié)果是具有一般意義的。原博弈有惟一的純策略納什均衡的博弈，則有限次重復博弈的惟一均衡即各博弈方在每階段(即每次重復)中都采用原博弈的納什均衡策略。2024/8/26中南財經(jīng)政法大學信息學院7

（一）有限次重復囚徒的困境博弈

－１，－１０，－８－８，０－５，－５

囚徒2坦白抵賴囚徒1坦白抵賴

囚徒困境博弈

－６，－６－５，－１３－１３，－５－１０，－１０

囚徒2坦白抵賴囚徒1坦白抵賴逆推歸納法和等價博弈

上圖所示囚徒的困境博弈，考慮兩次重復該博弈。用逆推歸納法來分析該重復博弈，先分析第二階段，由于該階段仍然是一個囚徒困境博弈，結(jié)果還是原博弈惟一的納什均衡（坦白，坦白），雙方得益（-5，-5）。回到第一階段，理性的博弈方會知道第二階段的結(jié)果必然是（坦白，坦白），因此可以把第二階段的得益直接加到第一階段對應得益上，結(jié)果與一次性博弈一樣，最終兩次重復囚徒的困境仍然相當于一次性囚徒的困境博弈的簡單重復。2024/8/26中南財經(jīng)政法大學信息學院8

（二）一般結(jié)論

原博弈有惟一的純策略納什均衡的博弈，則有限次重復博弈的惟一均衡即各博弈方在每階段（即每次重復）中都采用原博弈的納什均衡策略。定理設原博弈G有惟一的純策略納什均衡，則對任意正整數(shù)T，重復博弈G（T）有惟一的子博弈完美納什均衡，即各博弈方每個階段都采用G的納什均衡策略。各博弈方在G（T）中的總得益為在G中得益的T倍，平均得益等于原博弈G中的得益。2024/8/26中南財經(jīng)政法大學信息學院9（三）有限次重復削價競爭博弈７０，７０２０，１５０１５０，２０１００，１００

寡頭2高價低價寡頭1高價低價

削價競爭博弈

根據(jù)右圖得益矩陣不難看出，一次性博弈的結(jié)果必然是雙方都采用“低價”策略，各得到70個單位的利益。假設兩寡頭都意識到相互競爭的市場格局大約可以持續(xù)5年，也就是面臨一個5次重復博弈，它們是不是還會采用低價不斷打價格戰(zhàn)呢？

根據(jù)前面得到的一般結(jié)論，以它為原博弈的有限次重復博弈的惟一的子博弈完美納什均衡，就是兩博弈方重復5次原博弈的納什均衡策略，也就是削價，兩寡頭還是會不斷打價格戰(zhàn)。

2024/8/26中南財經(jīng)政法大學信息學院10

（四）重復囚徒困境悖論和連鎖店悖論

在重復囚徒的困境博弈的大量實驗研究中，重復次數(shù)較大時的實驗結(jié)果通常也與上述理論結(jié)論不同，包含合作的情況非常普遍。其實，有限次重復囚徒的困境博弈的問題，與蜈蚣博弈都是相似的，問題的癥結(jié)都在于在較多階段的動態(tài)博弈中逆推歸納法的適用性受到了懷疑。

2024/8/26中南財經(jīng)政法大學信息學院11例一：誠信博弈G如圖：乙甲誠信欺騙誠信(4,4)(0,5)欺騙(5,0)(1,1)這個博弈與囚徒困境實質(zhì)上完全一樣，存在唯一Nash均衡為（欺騙，欺騙）。2024/8/26中南財經(jīng)政法大學信息學院12問題一：求此兩階重復博弈：根據(jù)逆向歸納法知道：在第二個階段，信用困境的納什均衡為（欺騙，欺騙）；乙甲誠信欺騙誠信(5,5)(1,6)欺騙(6,1)(2,2)2024/8/26中南財經(jīng)政法大學信息學院13逆推到第一階段，唯一的Nash均衡還是（欺騙，欺騙）。從而，兩個階段信用困境唯一的完美均衡的第一階段的（欺騙，欺騙）和隨后第二階段的（欺騙，欺騙）。問題二（進一步考察階段博弈G存在多個Nash均衡情形）2024/8/26中南財經(jīng)政法大學信息學院14乙甲誠信欺騙中誠信4，40，50，0欺騙5，01，10，0中0，00，03，3仍對存在多重均衡的階段博弈重復進行兩次。2024/8/26中南財經(jīng)政法大學信息學院15乙甲誠信欺騙中誠信7，71，61，1欺騙6，12，21，1中1，11，14，4解：先考察第二階段2024/8/26中南財經(jīng)政法大學信息學院16其中存在三個Nash均衡：（誠信，誠信）（欺騙，欺騙）（中，中）其中Nash均衡與完美均衡關系為：

(誠信,誠信)——((誠信,誠信)(中,中)) (欺騙,欺騙)——((欺騙,欺騙)(欺騙,欺騙)) (中,中)——((中,中)(欺騙,欺騙))完美均衡的結(jié)構(gòu)：((欺騙,欺騙)(欺騙,欺騙)),((欺騙,欺騙)(欺騙,欺騙))這兩個完美博弈均衡都簡單地由兩個階段博弈的Nash均衡組成；2024/8/26中南財經(jīng)政法大學信息學院17((誠信,誠信)(中,中))這個完美均衡與前兩個完美均衡由一個非Nash均衡(第一階段)和一個Nash均衡(中,中)(第二階段)組成。2024/8/26中南財經(jīng)政法大學信息學院18

設一市場有兩個生產(chǎn)同質(zhì)產(chǎn)品的廠商，他們對產(chǎn)品的定價同有高、中、低三種可能。設高價時市場總利潤為10個單位，中價時市場總利潤為6個單位，低價時市場總利潤為2個單位。再假設兩廠商同時決定價格，價格不等時價格低者獨享利潤，價格相等時雙方平分利潤。這時候兩廠商對價格的選擇就構(gòu)成了一個靜態(tài)博弈問題，我們稱為“三價博弈”，得益矩陣如下圖所示。三、多個純策略納什均衡的有限次重復博弈1、三價博弈的重復博弈2024/8/26中南財經(jīng)政法大學信息學院19

很容易看出，這個三價博弈有兩個純策略納什均衡(M，M)和(L，L)，對應的雙方得益分別是(3，3)和(1，1)。但這個博弈中兩博弈方的總利益最大，而且也符合他們個體利益(僅次于在對方高價自己中價時的6單位得益)的策略組合(H，H)并不是納什均衡，因此一次性博弈的結(jié)果不可能是效率最高的。那么，兩次重復這個博弈情況會如何呢？0,20,65,52,06,01,12,00,23,3

廠商ⅡHML2024/8/26中南財經(jīng)政法大學信息學院20

首先可以肯定的是，重復這個博弈使得博弈的可能結(jié)果出現(xiàn)了很多可能性，兩次重復博弈的純策略路徑有9×9＝81種之多，加上帶混合策略的路徑可能結(jié)果的數(shù)量就更大。這些路徑中的子博弈完美納什均衡路徑，有兩階段都采用原博弈同一個純策略納什均衡的，也有輪流采用不同純策略糾什均衡的，也有兩次都采用混合策略納什均衡的，或者是混合策略均衡和純策略均衡輪流采用。但最重要的是，在兩次重復中確實存在第一階段采用(H，H)的子博弈完美納什均衡，其雙方的策略是這樣的：

博弈方1：第一次選H；如第一次結(jié)果為(H，H)，則第二次選M，如第一次結(jié)果為任何其他策略組合，則第二次選L。

博弈方2：同博弈方1。2024/8/26中南財經(jīng)政法大學信息學院21

在上述雙方策略組合下，兩次重復博弈的路徑一定為第一階段(H，H)，第二階段(M，M)，這是一個子博弈完美納什均衡路徑。這個結(jié)論很容易理解，首先，第二階段是一個原博弈的納什均衡，因此不可能有哪一方會愿意單獨偏離；其次，第一階段的(H，H)雖然不是原博弈的納什均衡，一方單獨偏離，采用M能增加1單位得益，但這樣做的后果是第二階段至少要損失2單位的得益，因為對方所采用的是有“報復機制”的策略，因此偏離(H，H)是得不償失的，合理的選擇是堅持H，這就證明了上述策略組合確實是這個兩次重復博弈的子博弈完美納什均衡。

上述重復博弈中兩個博弈方所采用的，首先試探合作，一旦發(fā)覺對方不合作則也用不合作相報復的策略，稱為“觸發(fā)策略”

(triggerstrategies)。2024/8/26中南財經(jīng)政法大學信息學院22

觸發(fā)策略是重復博弈中實現(xiàn)合作和提高均衡效率的關鍵機制，是重復博弈分析的重要“構(gòu)件”之一。

實際上，在上述兩次重復博弈中，當兩博弈方都采用上述觸發(fā)策略時，第二階段都是一種條件選擇，當?shù)谝浑A段結(jié)果為(H，H)時，第二階段必為(M，M)，得益為(3，3)；而當?shù)谝浑A段結(jié)果為其他8種結(jié)果時，第二階段必為(L，L)，得益為(1，1)。如果我們把(3，3)加到第一階段(H，H)的得益上，把(1，1)加到第一階段共他策略組合的得益上，就把原兩次重復博弈化成了一個等價的一次性，并且得益矩陣如下圖。2024/8/26中南財經(jīng)政法大學信息學院23

這時候，我們當然很容易看出，(H，H)是個納什均衡，并且得益是兩個博弈方的最佳得益，因此兩博弈方必然會采用它。1,31,78,83,17,12,23,11,34,4廠商ⅡHML2024/8/26中南財經(jīng)政法大學信息學院24

觸發(fā)策略在理論上有很重要的意義，而且在現(xiàn)實問題中也不難找到這種策略的現(xiàn)實證據(jù)，因此它在重復博弈分析中有非常重要的作用。但如果仔細分析，不難發(fā)現(xiàn)上述觸發(fā)策略中可能存在可信性問題。問題在那兒？：在上述兩次重復三價博弈中，如果第一階段的結(jié)果確實是(H，H)，也就是在子博弈完美納什均衡路徑上，第二階段的(M，M)符合雙方的利益，當然不會存在問題。2、觸發(fā)策略的進一步討論

但如果第一階段有一方偏離了均衡路徑就會產(chǎn)生疑問。因為根據(jù)上述子博弈完美納什均衡的策略，另一方將在第二階段采用報復性的L策略，這樣偏離的一方也只能采用L，雙方都只能得到比較差的得益。2024/8/26中南財經(jīng)政法大學信息學院25

問題的關鍵是：上述觸發(fā)策略在報復偏離了均衡路徑的博弈方的同時，報復者自己也會受到損失。如果不偏離的一方能夠不計前嫌，還是與對方共同采用M，對他自己也是有利的。

因而這必然引起上述觸發(fā)策略是否真正可信的問題。

如果認為觸發(fā)策略不可信，當認為博弈方不可能真正采用觸發(fā)策略，就相當于不管第一階段結(jié)果如何，第二階段都是(M，M)，雙方得益（3，3)。我們在第一階段則所有得益上加(3，3)，就得到這種情況下的兩次重復博弈的等價一次性博弈如下圖。2024/8/26中南財經(jīng)政法大學信息學院26

從得益矩陣中不難發(fā)現(xiàn)，這時第一階段的最佳選擇不是(H，H)，而是(M，M)。這意味著兩次重復博弈的均衡路徑是兩次重復(M，M)，即原博弈效率較高的一個納什均衡。3,53,98,85,39,34,45,33,56,6廠商ⅡHML2024/8/26中南財經(jīng)政法大學信息學院27

并不是每個重復博弈的觸發(fā)策略都有可信性問題。觸發(fā)策略在不少情況下是非?？尚诺?。我們來看下面得益矩陣表示的這個靜態(tài)博弈的兩次重復博弈：廠商2HMLPQ0.5,40，00，00，00，00，04,0.50，00，00，00，00，01，12，02，00，00，00，23，36，00，00，00，20，65，52024/8/26中南財經(jīng)政法大學信息學院28

不難看出，這個博弈兩博弈方都增加廠兩個可選策略，現(xiàn)在它有四個純策略的納什均衡(M，M)、(L，L)、(P，P)和(Q，Q),得益分別是(3．3)、(1，1)、(4，0.5)和(0.5，4)，效率最高的(H，H)也不是納什均衡，正是由于比前一個博弈多了兩個純策略納什均衡，因此在重復博弈中采用觸發(fā)策略的余地就增加了，更重要的是構(gòu)成的觸發(fā)策略的報復機制更加可信。例如在兩次重復中。兩博弈方分別采用這樣的觸發(fā)策略：

博弈方1：在第一階段采用H，如果第一階段的結(jié)果是(H，H)，那么第二階段采用M，否則采用P。博弈方2：在第一階段采用H，如果第一階段的結(jié)果是(H，H)，那么第二階段采用M，否則采用Q。2024/8/26中南財經(jīng)政法大學信息學院29

不難證明，雙方的上述觸發(fā)策略組合構(gòu)成該重復博弈的一個子博弈完美納什均衡，而且雙方的觸發(fā)策略中的報復都是可信的。因為雙方觸發(fā)策略中的報復機制不僅本身可以構(gòu)成納什均衡，而且對報復者自己也是有利的。3、兩市場博弈的重復博弈廠商2AB4,13,30,01,42024/8/26中南財經(jīng)政法大學信息學院30

廠商1：第一階段選A,如果第一階段結(jié)果是(A,A),則第二階段選A，如果第一階段結(jié)果是(A,B)，則第二階段選B，第三階段無條件選B;

廠商2：第一階段選A，第二階段無條件選B，如果第一階段結(jié)果是(A，A)，則第三階段選A，如果第一階段結(jié)果是(B，A)，則第三階段選B。

兩市場博弈重復3次，廠商1利和廠商2可以分別采用如下觸發(fā)策略：

根據(jù)雙方的上述策略，3次重復博弈的均衡路徑是(A，A)到(A，B)再到(B，A)。其中第二、第三階段本身就是原博弈的納什均衡，因此不會有哪一方愿意單獨偏離。2024/8/26中南財經(jīng)政法大學信息學院31

第二節(jié)

無限次重復博弈

雖然無限次重復博弈與有限次重復博弈一樣，也是基本博弈的重復進行，但兩者還是有重要區(qū)別的。因為無限次重復博弈沒有結(jié)束重復的確定時間，也就是最后一次重復。根據(jù)我們對有限次重復博弈的分析可知，存在最后一次重復正是破壞重復博弈中博弈方利益和行為的相互制約關系。使重復博弈無法實現(xiàn)更高效率均衡的關鍵問題。2024/8/26中南財經(jīng)政法大學信息學院32

因為重復次數(shù)的無限增加也不能改變原博弈中博弈方之間在利益上的對立關系，也不會創(chuàng)造出潛在的合作利益，因此仍然是每次重復原博弈的混合策略納什均衡。

一、兩人零和的無限次重復博弈2024/8/26中南財經(jīng)政法大學信息學院331、無限次重復囚徒困境式博弈

兩寡頭價格競爭博弈的無限次重復模型其中H和L分別表示高價(不削價)和低價(削價)策略。

二、惟一純策略納什均衡的無限次重復博弈廠商2HL5,04,41,10,52024/8/26中南財經(jīng)政法大學信息學院34

該博弈的一次性博弈有惟一的純策略納什均衡(L，L)，雙方得益為1。這個納什均衡并不是帕累托效率意義上的最佳策略組合，因為策略組合(H，H)的得益(4，4)比(1，1)要高得多。但因為(H，H)并不是該博弈的納什均衡，因此在一次性博弈中不會被采用，這是一個典型的囚徒的困境類型的博弈。根據(jù)上一節(jié)的分析，該博弈的有限次重復博弈并不能實現(xiàn)潛在的合作利益，兩博弈方在每次重復中都不會采用效率較高的(H，H)。

在這個博弈的無限次重復博弈中，我們假設兩博弈方都采用如下觸發(fā)策略：2024/8/26中南財經(jīng)政法大學信息學院35觸發(fā)策略：第一階段采用H，在第t階段，如果前t-1階段的結(jié)果都是(H，H)，則繼續(xù)采用H，否則采用L。

具體含義也就是，雙方在無限次重復博弈中都是先試圖合作，第一次無條件選H，如果對方采取的也是合作態(tài)度，則堅持選H，一旦發(fā)現(xiàn)對方不合作(選L)，則用以后永遠選L報復；我們不難證明，在不同時期得益的貼現(xiàn)值δ較大時，雙方采用上述策略構(gòu)成無限次重復博弈的一個子博弈完美納什均衡。

先說明雙方采用上述觸發(fā)策略是一個納什均衡。方法是先假設博弈方1已采用了這種策略，然后證明在δ達到一定水平時，采用同樣的觸發(fā)策略是博弈方2的最佳反應策略。2024/8/26中南財經(jīng)政法大學信息學院36

因為博弈方1與博弈方2是對稱的，因此只要這個結(jié)論成立，就可以確定上述觸發(fā)策略是兩博弈方相互對對方策略的最佳反應，因此構(gòu)成納什均衡。由于在某個階段出現(xiàn)與(H，H)不同的結(jié)果以后博弈方1將永遠采用L，此時博弈方2也只有一直選擇L。

因此博弈方2對博弈方1觸發(fā)策略的最佳反應策略的后半部分與觸發(fā)策略的后半部分是一樣的。

現(xiàn)在關鍵是要確定博弈方2在第一階段的最優(yōu)選擇。

如果博弈方2采用L，那么在第一階段能得到5，但以后引起博弈方1一直采用L進行報復，自己也只能一直采用L，得益將永遠為1，則總得益現(xiàn)在值為：2024/8/26中南財經(jīng)政法大學信息學院37

如果博弈方2在第一階段采用H，則他將得4，下一階段又面臨同樣的選擇。若記V為博弈方2在該重復博弈中每階段都采用最佳選擇的總得益的貼現(xiàn)值。那么從第二階段開始的無限次重復博弈因為與從第一階段開始的只差一階段，因而在無限次重復時可看作相同的，其總得益的貼現(xiàn)值折算成第一階段的得益為δV，

因此，當博弈方2第一階段的最佳選擇是H時，整個無限次重復博弈總得益的貼現(xiàn)值為：V=4＋δV或2024/8/26中南財經(jīng)政法大學信息學院38因此當

即當δ＞1／4時，博弈方2第一階段會采用H，否則會采用L。即當δ＞1／4時，由于從第二階段開始的無限次重復博弈，與從第一階段開始的無限次重復博弈是完全相同的，因此博弈方第二階段的選擇必然也是H，第三階段也同樣。

依次類推，只要博弈方1采用前述觸發(fā)策略、則博弈方2的最優(yōu)選擇就始終是H；如果博弈方1偏離H，博弈方2也必須用L來報復。因此博弈方2對博弈方1觸發(fā)策略的完整反應策略是同樣的觸發(fā)策略。這就證明了雙方都采取上述觸發(fā)策略是一個子博弈完美納什均衡。2024/8/26中南財經(jīng)政法大學信息學院39重復無窮次，結(jié)果如何？證明得出，如果博弈方有足夠的耐心，（抵賴，抵賴）是一個子博弈精練納什均衡結(jié)果。-8，-80，-10-10，0-1，-1囚徒A囚徒B坦白抵賴坦白抵賴

冷酷戰(zhàn)略（1）開始選擇抵賴；（2）選擇抵賴一直到有一方選擇了坦白，然后永遠選擇坦白。2、無限次重復囚徒困境博弈問題:無限次重復博弈使其走出了囚徒困境，背后的原因是什么?2024/8/26中南財經(jīng)政法大學信息學院40

如果博弈重復無窮次而且每個人有足夠的耐心，任何短期機會主義行為的所得都是微不足道的，博弈方都有積極性為自己建立一個樂于合作的聲譽，同時也有積極性懲罰對方的機會主義的行為。無限次重復博弈使其走出了囚徒困境，背后的原因是：2024/8/26中南財經(jīng)政法大學信息學院413、無限次重復古諾模型

基本假設同前古諾模型，其中a=8，c=2。一次性博弈存在惟一的納什均衡(2，2)，即兩廠商都生產(chǎn)2單位產(chǎn)量，該產(chǎn)量也稱力“古諾產(chǎn)量”，用qc表示。如果該市場是一家廠商壟斷，那么最佳壟斷產(chǎn)量為qm＝3，納什均衡的總產(chǎn)量4大于壟斷產(chǎn)量3，如果兩廠商各生產(chǎn)壟斷產(chǎn)量的一半1.5，則兩廠商商的得益都會增加，但這在一次性靜態(tài)博弈中不可能實現(xiàn)，在有限次重復博弈中也不可能實現(xiàn)。

可以證明在無限次重復古諾模型中，當貼現(xiàn)率δ滿足一定條件時，兩廠商都采用下列觸發(fā)策略構(gòu)成一個子博弈完美納什均衡。2024/8/26中南財經(jīng)政法大學信息學院42

在第一階段生產(chǎn)壟斷產(chǎn)量的一半1.5，在第t

階段，如果前t-1階段的結(jié)果都是(1.5，1.5)則繼續(xù)生產(chǎn)1.5

，否則生產(chǎn)古諾產(chǎn)量qc

＝2。

這種觸發(fā)策略的實質(zhì)同樣是采用它的博弈方先試圖合作，選擇符合雙方利益的產(chǎn)量，而一旦發(fā)現(xiàn)對方不合作，偏離對雙方有利的產(chǎn)量，則以選擇納什均衡產(chǎn)量來進行報復。雙方都采用上述觸發(fā)策略的博弈路徑為每階段生產(chǎn)產(chǎn)量(1.5，1.5)雙方每階段的得益都是π*＝4.5

。2024/8/26中南財經(jīng)政法大學信息學院43

設廠商1已采用該觸發(fā)策略，如果廠商2也采用該觸發(fā)策略，則每期得益4.5，無限次重復博弈總得益的貼現(xiàn)值為：

如果廠商2偏離上述觸發(fā)策略，則他在第一階段所選產(chǎn)量應該是給定廠商1產(chǎn)量為1.5的情況下，自己的最大利潤產(chǎn)量，即滿足：解之得q2

＝2.25

。此時他的利潤為2.252＝5.0625，高于不偏離觸發(fā)策略時第一階段的得益4.5。2024/8/26中南財經(jīng)政法大學信息學院44

但是，從第二階段開始，廠商1將報復性地永遠采用古諾產(chǎn)量2，這樣廠商2也被迫永遠采用古諾產(chǎn)量2。從此得利潤4，因此，無限次重復博弈第一階段偏離的情況下總得益的貼現(xiàn)值是：當即當δ＞0.5625／1.0625＝9／17時，上述觸發(fā)策略是廠商2對廠商1的同樣觸發(fā)策略的最佳反應，否則偏離是他的最佳反應。2024/8/26中南財經(jīng)政法大學信息學院45

當δ<9／17上述觸發(fā)策略不是無限次重復博弈的納什均衡，更不是子博弈完美納什均衡。但這并不是說當δ<9／17時，兩廠商就一定只能每階段都采用古諾產(chǎn)量，實現(xiàn)每階段結(jié)果為原博弈的低效率納什均衡的得益。

雖然δ較小(<9／17)時，因為遠期利益的重要性不足，無限次重復博弈也不能促使兩廠商把產(chǎn)量都控制在qm／2＝1.5的低水平，但還是有可能使各廠商把產(chǎn)量都控制在比古諾產(chǎn)量qc低的水平，即壟斷產(chǎn)量的一半qm／2和古諾產(chǎn)量qc之間的某個中間產(chǎn)量水平q*

。2024/8/26中南財經(jīng)政法大學信息學院464、信用困境無限重復博弈分析設每一博弈方的貼現(xiàn)因子都為δ，每一博弈方在重復博弈中得到的收益等于各自在所有階段博弈中得到的收益的現(xiàn)值。每一階段都是相互合作——(誠信,誠信)？乙甲誠信欺騙誠信(4,4)(0,5)欺騙(5,0)(1,1)2024/8/26中南財經(jīng)政法大學信息學院47如果當前博弈方選擇合作，那么將來（下一階段）將得到好報（選擇高收益的均衡結(jié)果）；如果當前博弈方選擇欺騙，那么將得到報應（選擇低收益的均衡結(jié)果）。策略：觸發(fā)策略(triggerstrategies)--冷酷策略開始選合作，選擇合作直到有一方選擇了坦白一報還一報策略(tit-for-tat)2024/8/26中南財經(jīng)政法大學信息學院48博弈方甲、乙的這一策略的表述為：在第一階段選擇誠信，且在第t階段，如果所有前面t-1階段的結(jié)果都是(誠信,誠信)，則選擇誠信，否則就永遠選擇欺騙。如果博弈方甲、乙都采取這種觸發(fā)策略，則此無限重復博弈的結(jié)果就是每一階段選擇(誠信,誠信)。問題：每一階段選擇(誠信,誠信)是無限重復的Nash均衡嗎？這一Nash均衡是子博弈完美均衡嗎？對于觸發(fā)策略組合分析：2024/8/26中南財經(jīng)政法大學信息學院49第一、策略分析如果某階段的結(jié)果偏離(誠信,誠信)，博弈方甲將在其后永遠選擇欺騙；如果某階段的結(jié)果偏離了(誠信,誠信)，博弈方乙的最優(yōu)反應同樣是在其后永遠選擇欺騙。這表明(欺騙,欺騙)是無限重復信

人人文庫> 全部分類> 教育資料 > 中學教育

溫馨提示

1. 本站所有資源如無特殊說明，都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
2. 本站的文檔不包含任何第三方提供的附件圖紙等，如果需要附件，請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
3. 本站RAR壓縮包中若帶圖紙，網(wǎng)頁內(nèi)容里面會有圖紙預覽，若沒有圖紙預覽就沒有圖紙。
4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
5. 人人文庫網(wǎng)僅提供信息存儲空間，僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護處理，對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯，并不能對任何下載內(nèi)容負責。
6. 下載文件中如有侵權(quán)或不適當內(nèi)容，請與我們聯(lián)系，我們立即糾正。
7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

經(jīng)管營銷博弈

文檔簡介

溫馨提示

最新文檔

評論

經(jīng)管營銷博弈

文檔簡介

溫馨提示

最新文檔

評論

相關文檔