基于博弈論的對抗:最佳行動策略2010_第1頁
基于博弈論的對抗:最佳行動策略2010_第2頁
基于博弈論的對抗:最佳行動策略2010_第3頁
基于博弈論的對抗:最佳行動策略2010_第4頁
基于博弈論的對抗:最佳行動策略2010_第5頁
已閱讀5頁,還剩64頁未讀 繼續(xù)免費閱讀

下載本文檔

版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進行舉報或認領(lǐng)

文檔簡介

基于博弈論的對抗:

最佳行動策略補充B11學習內(nèi)容企業(yè)戰(zhàn)略博弈作為一種順序博弈的企業(yè)對抗過剩的生產(chǎn)能力、進入規(guī)模與阻止進入同時博弈避免囚犯兩難境況21B.1

企業(yè)戰(zhàn)略博弈寡頭競爭中,事前主動是最佳的,但它需要對競爭對手發(fā)起的行動和反應做出準確可靠的預測。博弈論的管理目標就是預測競爭對手的行為。戰(zhàn)略博弈可分幾種類型:合作博弈與非合作博弈雙人博弈與n人博弈零和博弈與非零和博弈一次行動博弈與重復行動博弈順序博弈與同時博弈311.順序博弈與同時博弈同時博弈是競爭對手同時的行動或反應。而在順序博弈中,行動次序是具體規(guī)定的,而且通常是戰(zhàn)略均衡的核心。同時博弈。例如航空公司每天同時公布票價等。

[例]卡車制造商及其獨立分銷商之間的博弈(兩人參與的協(xié)調(diào)博弈)。制造商希望零售商繼續(xù)服務,作為回報,制造商同意做廣告,并宣布提高制造商的建議零售價(MSRP)4100500020003000002000提價,做廣告不提價,不做廣告增加利潤(停止服務)繼續(xù)服務零售分銷商卡車制造商同時行動的制造商與分銷商51制造商或分銷商如何行動?注意:分銷商的最佳收益出現(xiàn)在,制造商預期分銷商停止服務,且不提價的時候;制造商的最佳收益出現(xiàn)在,預期分銷商繼續(xù)服務,其自己提價的時候。另外:如分銷商減少服務,制造商保持價格;下一期制造商提高價格,分銷商保持服務。如何?如分銷商過于計較,或其可靠性被制造商誤解,而在未來失去承擔分銷業(yè)務的機會。情況如何?在同時博弈中,企業(yè)經(jīng)營活動的協(xié)調(diào)會是一種真正的挑戰(zhàn)?!赏ㄟ^激勵性私人自愿契約、不履行契約規(guī)則和

合同法等方法來解決。612.順序協(xié)調(diào)博弈在決策中引入一個前后順序,就可能預測到參與雙方的最優(yōu)戰(zhàn)略行動。

[例]在上例中,假定制造商首先選擇:更新、不更新;然后,分銷商決定:停止、繼續(xù)。新的博弈結(jié)構(gòu)可表示為博弈樹(決策樹)。71MRR更新不更新停止繼續(xù)停止繼續(xù)50002000200030000000(M,R)M:制造商;R:分銷商順序行動的制造商/分銷商81制造商可以前瞻并預測到更新并使分銷商的繼續(xù)服務產(chǎn)生優(yōu)勢,發(fā)現(xiàn)承諾產(chǎn)品更新,然后提高建議零售價,隨后做廣告,符合自己的最高利益。每一方都能前瞻和逆向推理,利用最佳回答反應來預測競爭對手的行動。但在同時行動型的博弈中,這種順序推理是無法進行的。

[例]A、Z兩家保險公司,經(jīng)營福利項目,為在其專業(yè)范圍內(nèi)增加業(yè)務而競標出價。現(xiàn)行市場價:200美元/小時;A的總成本:66美元/小時;Z的總成本:40美元/小時。91在現(xiàn)價200美元/小時的條件下,要將顧客從別的供應商吸引過來,除非降價。若A降價50美元,Z的決定必然是同樣降價,以便顧客在兩家公司之間隨機選擇。A為吸引顧客,再將價格降至100美元,……,降價循環(huán),顧客兩邊跑。問題:將價格降到多低?存在“倒數(shù)第二規(guī)則”,當價格降至業(yè)務成本時,不會再降。101(0,5)(-8,0)A1Z1A2NNZ2N150美元/小時100美元/小時50

0促銷相同Z贏A贏相同相同降價降價降價Z贏Z贏A贏A贏(0,55)(42,0)(0,30)(17,0)(0,-40)把價格降到多低:A、Z保險公司的博弈樹N:隨機選擇PZ=0.5PA=0.5111在A將價格降到150美元/小時,Z將處于一個對此逆向推理的地位:預測對手對100美元的最佳回答反應,前瞻自己

降價50美元的行動,最后分析低于50美元的最終博弈。最終博弈推理過程總是要求前瞻到一個順序行動中的最后一次行動,確定其決策將控制最終博弈結(jié)果的參與人,然后預測該參與人的最優(yōu)選擇。Z前瞻到50美元/小時的最低分支上將損失貨幣,就可預測到:在節(jié)點A2上A會對100美元的出價做出“相同”的回

應。并隨機決定各自的機會。在此條件下,Z會采用逆向歸納法重新思考自己最初從150美元降至100美元的計劃,是否符合自己的最大利益。121因為最終博弈推理過程表明,A也報價100美元,在此價格上分享市場。將價格從150美元降到100美元,不會吸引到新的顧客,僅僅是降價,在低價格上分享市場而已。所以在節(jié)點Z1上Z會對150美元的出價做出“相同”的回應,即也按150美元出價。這樣,A與Z公司的戰(zhàn)略組合為此順序競標博弈提供了一種均衡:{150美元,以相同價格回應}。所以,一種在更高價水平上分享市場的非合作的自動實施的協(xié)議出現(xiàn)了(寡頭的勾結(jié)可能是非合作博弈的結(jié)果)。1313.順序博弈中的戰(zhàn)略均衡前瞻競爭對手在最終博弈中的最佳回答反應,然后對前面每一個問題進行逆向歸納分析,這就是由澤爾滕(Selten)提出的順序博弈均衡理論(1994年諾貝爾經(jīng)濟

學獎)。納什均衡戰(zhàn)略是一種決策者的最優(yōu)行動,在所有其它參與人做出最佳回答反應時,其收益超過了決策者從其它任何行動和最佳回答反應中得到的收益。Selten將此概念引入順序博弈之中,并發(fā)明了一個恰當?shù)淖硬┺募{什均衡概念——子博弈精煉均衡戰(zhàn)略,通常包括所有恰當?shù)淖硬┺闹袑ψ罴鸦卮鸱磻那罢?,然后逆向推理到前面決策點上的最優(yōu)戰(zhàn)略。141如果最終博弈無法通過最佳回答反應達到的話,就可以不予考慮。只有在恰當?shù)淖硬┺墓?jié)點上,納什均衡才會成

立。

[例]上例中A公司不必考慮在節(jié)點Z2上Z公司如何選擇。原因在于A公司在節(jié)點A2上選擇降價至50美元,對自己來說不是最佳回答反應。因此,超過A公司降價至50美元的節(jié)點不是恰當?shù)淖硬┺?,他們不能通過最佳回答反應來實現(xiàn)。因此,子博弈精煉均衡需分析博弈行動在A2~Z2上的最佳回答反應相聯(lián)系的結(jié)果。他們是恰當?shù)淖硬┺狞c,{150美元,以相同價格回應}是子博弈精煉均衡戰(zhàn)略。151B.2作為一種順序博弈的企業(yè)對抗子博弈精煉均衡概念是自動實施過程,他預見到穩(wěn)定的競爭反應,不是因為有效的監(jiān)測和第三方實施,而是因為各方背離均衡戰(zhàn)略組合要比實施戰(zhàn)略組合的情況更壞??尚判詸C制是實施子博弈戰(zhàn)略的關(guān)鍵,可信性可在兩方面起作用:可信的承諾也可能變成可信的威脅。1611.優(yōu)先者優(yōu)勢與次動者優(yōu)勢“是誰在何時能做什么?”是任何順序戰(zhàn)略博弈的本質(zhì)。博弈順序是核心,因為它決定了誰發(fā)起行動,誰做出回答,這決定了最終博弈中的最佳回答反應,因此決定了戰(zhàn)

略均衡。

[例]某制藥業(yè)原有廠商,收益100000美元,面臨握有一項新技術(shù)的潛在廠商的威脅。潛在廠商可出售技術(shù)或進入。原有廠商以價格來應對。171803060800355070不進,許可證進入保持高價中等價格原有廠商潛在廠商20405040折扣價格阻止進入或接納進入的收益(單位:千元)181假設(shè)新入者必須首先選擇是否進入,原有廠商隨后就要選擇一種價格反應。如潛在廠商進入,原廠商的最佳回答反應是:低價。對此分析使?jié)撛趶S商預見到自己80000美元和50000美元的結(jié)

果應從進一步的分析中排除掉。如潛在廠商不進入,原廠商的最佳回答反應是:高價。潛在廠商預見到60000美元許可證費無法獲得。因此,潛在廠商決策時僅存在兩種利益集中結(jié)果:從進入方案獲得40000美元和不進入方案獲得30000美元的收

益。比較兩者,潛在廠商決定進入。子博弈精煉戰(zhàn)略均衡:{進入,打折};博弈的最佳結(jié)

果:{50000,40000}。191IIPE高價中價低價高價中價低價不進/許可證進入(080)(3550)(5040)*(8030)(7060)(4020)阻止進入I:原有廠商以定價對進入威脅做出反應201假設(shè)原有廠商先動者,宣布不可逆的價格政策,此時潛在廠商控制最終博弈。原有廠商在分析了三個最終博弈節(jié)點后,預見到潛在廠商的選擇:原有廠商承諾高價時,進入原有廠商承諾中價時,不進入原有廠商承諾低價時,進入據(jù)此,原有廠商寧愿宣布一種中價政策,戰(zhàn)略均衡:{中價,不進};結(jié)果:{70000,60000}潛在進入者的行為變了,且原有廠商的收益從50000美元增加至70000美元。由此可見順序的重要性。211高價(080)PEPEPEII不進進入不進進入不進進入低價中價價格承諾信號(8030)(3550)(7060)*(5040)(4020)阻止進入II:作為對原有廠商價格承諾反應的阻止進入221率先行動者,能夠做出可信的威脅或可信的事前承諾。因此搶先獲得某些優(yōu)勢結(jié)果;后動者做出回答,能決定最終博弈中的最佳回答反應。哪個更有優(yōu)勢取決于具體的戰(zhàn)略與環(huán)境。2.可信的威脅和承諾在多階段博弈中,所有的威脅和承諾的可信性最終都來自威脅者或承諾者是否能成功地確定和采取子博弈精煉戰(zhàn)略。231可信的威脅是一種條件戰(zhàn)略,威脅者若食言不履行就會受損失??尚诺某兄Z是一種義務,承諾方忽略承諾要比履行承諾的情況更壞。

[例]上例中:原有廠商聲稱若潛在廠商進入,就要對價格打折,是一種可信的威脅,因為打折是一種最佳回答反應。如果潛在廠商不進入,原有廠商承諾保持高價或中價是一種可信的承諾,因為這是對不進入的最佳回答反應。2412.建立可信性的機制可信性機制是子博弈精煉均衡戰(zhàn)略的關(guān)鍵。在上例分析中,原有廠商承諾中價并不是一個完全可信的承諾,因為,在事后恢復高價對自己更有利。解決此類問題的機制:建立一項契約或契約性轉(zhuǎn)移支付。各種限制價格的契約(非法)。投資于一種非重置的聲譽資產(chǎn)。原廠商采取對中價的聲譽進行大量投資。阻止或打斷反應過程。打斷重新定價過程,以期貨合同事先出售產(chǎn)品。251達成利潤分享的聯(lián)盟。原廠商與潛在廠商建立利潤分享的聯(lián)盟。采取小步驟行動。原廠商改變博弈結(jié)構(gòu),要求自己與潛在廠商只“采取小步驟”行動,如租賃。安排一項不可逆轉(zhuǎn)和不可取消的抵押。自動實施的雙倍賠償?shù)摹白罨輫鴹l款”的低價保證等。4.租賃與可續(xù)許可證的可信性優(yōu)勢新型號產(chǎn)品(資本設(shè)備)的早期買主,會擔心所購設(shè)備的陳舊過時和價格下降,而不愿支付高價。該問題會伴隨每一代新設(shè)備持續(xù)出現(xiàn)。廠商必須提供一個保持價格和有計劃推出新品的可信承諾,以使初期買主有時間收回投資成本(在技術(shù)快速發(fā)展

的行業(yè)里,廠商也不能完全控制)。261帶有殘值的限額租賃提供了一種可信的承諾。在一個資本設(shè)備租賃的競爭市場中,在信息不對稱條件下,殘值代表了制造商對租賃期末的尚余價值最佳估計。這個殘值就是實際建立的制造商承諾的可信性。承諾在租賃期內(nèi)不打折或不引進會造成當前設(shè)備過時的新設(shè)備。如出租方(制造商)違背該承諾,在租賃結(jié)束時返還的資產(chǎn)價值將少于制造商同意的返還殘值。事實上,制造商給了承租方一個抵押品。通過同意按事前確定殘值收回資本設(shè)備,就是對有限度的變價和有限速度的過時損耗進行了可信的承諾。271由政府發(fā)放的經(jīng)營許可證、貿(mào)易秘密和專利的授予等,因使持有人的排他使用權(quán)而使其價值最大化,因此,也使貿(mào)易秘密和專利讓渡行為利潤最大化??裳永m(xù)的租賃和許可證,能在建立可信承諾中提供策略優(yōu)勢,這是公開銷售中所得不到的。281B.3過剩的生產(chǎn)能力、進入規(guī)模與阻止進入對非重置性過剩生產(chǎn)能力的投資,是另一類可信的威脅或承諾。過剩的生產(chǎn)能力投資,能顯著加強原有廠商以降價對付進入威脅的能力。其可信性的唯一原因:忽略威脅要比實施威脅,將使威脅者的情況更壞。下圖中,在A點以450美元的單位成本生產(chǎn)Q1產(chǎn)量與在B點用300美元的單位成本生產(chǎn)Q2產(chǎn)量相比,情況會更糟。291LACATC1ATC2Q2Q1AB450300在阻止進入博弈中,過程的生產(chǎn)能力強化了可信性

3011.過剩能力的事先承諾

[例]一家原有社區(qū)醫(yī)院是否要建立一種專用醫(yī)療設(shè)備的過剩能力,以阻止另一家醫(yī)院的進入。原有醫(yī)院要選擇是否具備過剩能力,潛在醫(yī)院隨后要決定是否進入,然后由原有醫(yī)院控制定價的最終博弈。通過在各種恰當?shù)淖硬┺暮妥罱K博弈中,前瞻性地預測對手最佳回答反應,原有醫(yī)院的選擇歸結(jié)為兩個戰(zhàn)略:

{有過剩能力,不進入,用限制價阻止進一步的進入}{無過剩能力,進入,用中等價格接納進入}311把價格降到進入價格以下IIIIPEPEI保持高價限制價格用中等價格接納進入同樣采用低價保持高價限制價格用中等價格接納進入不進入不進入進入進入無過剩能力有過剩能力過剩能力的預先承諾博弈321一般而言,是用過剩能力的承諾阻止?jié)撛谶M入者,還是不保有過剩能力,而用較低價格接納進入者的選擇是一個復雜的問題。他取決于多種因素:原有廠商能否尋求一種先動者優(yōu)勢。進入后的競爭是發(fā)生在差異化產(chǎn)品的價格上,還是無差異產(chǎn)品的數(shù)量上。不同細分市場中新老顧客的選擇(價格的敏感性)。3312.顧客選擇規(guī)則(方式)所有顧客都同樣可能得到低價格生產(chǎn)能力的隨機分配過

程。最高程度(然后是次高程度)愿意支付的顧客得到低價格生產(chǎn)能力直至分配完畢的效率分配過程。任何一個顧客都不尋求低價格生產(chǎn)能力的極端品牌忠誠。最低程度(然后是次低程度)愿意支付的顧客獲得低價格生產(chǎn)能力、直至分配完畢的反向強度分配過程。對反向強度分配來說,顧客的選擇表明了一種細分市場,并最有

可能導致接納進入。341

[注意]在預測是阻止還是接納進入者行為的過程中,由于顧客選擇方式的核心性質(zhì)、決策的時間和產(chǎn)品的性質(zhì)等因素,博弈論有時會陷于極大的困惑之中,使得博弈論的分析必須與產(chǎn)業(yè)研究聯(lián)系在一起,才能確定多種可能的結(jié)

果。3.接納成本競爭者的大規(guī)模進入

[例]人民捷運(PeopleExpress,PX)進入美國大西洋

中部城市市場的阻止進入和接納博弈行動。1981年,PX成為解除管制后最先進入者之一,其進入戰(zhàn)略是利用以新澤西尼瓦克為中心的輻射網(wǎng)絡,向大西洋中部13城市提供統(tǒng)一的低價格服務。351實際上,PX創(chuàng)造了一個新的細分市場。這是這一地區(qū)原有的Mohawk,Allegheny等昂貴而稀少的航班服務不到的市場。由PX的折扣價格吸引到該市場中的新的不太愿意付高價的顧客迅速占有了PX全部能力(反向強度分配)。但PX并沒有從高價點把原有公司常規(guī)旅客吸引走。戰(zhàn)略博弈:原有公司必須決定是使自己的價格與PX的折價機票相同,還是通過保持高價接納PX的進入;PX也必須決定是用120座的大型飛機,還是用30座的小型飛機進入市場。361(53682068)IPXI同樣采用低價大規(guī)模進入能力過剩實現(xiàn)承諾I接納進入接納進入同樣采用低價小規(guī)模進入(82253877)*(4765969)(4236969)采用反向強度分配的大規(guī)模進入接納行動每航班收益(美元)(原廠商,PX)(小飛機)(大飛機)371PX擁有一個支配戰(zhàn)略,不管原有公司的定價反應如何,PX都會從大規(guī)模進入中得到更高的收益。在此條件下,原有公司寧愿以8225美元的收益來接納進入者,而不是同樣打折。因此,戰(zhàn)略博弈精煉均衡:{大規(guī)模進入,高價格接納}。4.阻止低成本競爭者的大規(guī)模進入

[例]1985年,PX進入美國東南部城市市場,與派德蒙特航空公司(PiedmontAirlines,PI)之間發(fā)生的阻止進入和接納博弈行動。381共有信息:在一條400英里的航線上起始價格:79美元新價格:49美元79美元水平上的需求:13249美元水平上的需求:196(新顧客:64)原有能力:300變動成本(PI):16.69美元變動成本(PX):13.63美元PX必須首先決策,是用小飛機還是使用大飛機;PI作出回應:與PX的$49價格相同,還是保持$79而接納新進入者,其定價控制最終博弈。391票價總需求銷售量利潤(美元)PIPXPIPX小飛機進入79/49132112306979106149/49196196~1660~306330~53650~1061大飛機進入79/49132511203178424449/49196196~1320~646330~42650~2264112=[(196-30)/196]×13251=[(196-120)/196]×132高價接納:79/49低價回擊:49/49隨機分配規(guī)則下PI/PX的利潤401(6979,1061)大型飛機接納進入價格回應小型飛機PIPXPI接納進入價格回應(120座)(30座)(PI=$79)(PI=$49)(PI=$79)(PI=$49)進入規(guī)模決策采用隨機分配規(guī)則的阻止進入和接納進入博弈利潤(美元)(PI,PX)(6330~5365,0~1061)(6330~4265,0~2264)(3178,4244)411在PX小規(guī)模進入的條件下,PI會選擇高價接納;而在PX

大規(guī)模進入的條件下,PI會選擇低價回應。PX在小規(guī)模進入時,利潤幾乎肯定為$1061;而在大規(guī)模進入時,利潤是$0~2264。子博弈精煉均衡應為:{小規(guī)模進入。高價接納}。

[實際]PX采用了大規(guī)模進入,PI采用降價反擊,價格戰(zhàn)爆發(fā),

機票一度降至$19,PX被迫退出東南部城市市場。在對差別定價采用隨機分配規(guī)則和對跟隨降價的原廠商存在顧客忠誠的情況下,只有小規(guī)模進入才能導致接納。421由此可見顧客選擇規(guī)則的極端重要性。當顧客的選擇方式改變時,原廠商的最佳回答反應會發(fā)生改變,子博弈精煉均衡也會隨之變化。5.沉沒成本在決策中的作用作為對進入者或潛在進入者的反應,除了對過剩生產(chǎn)能力的事先承諾、可信的價格折扣威脅外,顧客忠誠(積分)、以事先購買行為基礎(chǔ)的價格歧視和能力分配安排——收益管理系統(tǒng)提供了一種有效的阻止進入方法。阻止進入和接納戰(zhàn)略還可通過在非重置性資產(chǎn)——廣告或其他促銷投資表現(xiàn)出來——事先承諾原廠商會全力保護市場份額和現(xiàn)金流以便收回這些非重置性投資的成本。431要進入非重置性沉沒成本普遍存在的市場,就會受到阻止。由于競爭戰(zhàn)略順序的相互作用,加上可信的威脅與承諾的作用,就構(gòu)成了管理經(jīng)濟決策中沉沒成本的一種重

現(xiàn)。事實上,正是因為廠商對沉沒成本投資的無能為力——不可逆轉(zhuǎn)、不能撤銷,也不能收回,才使涉及這些資產(chǎn)收益的具體威脅行動計劃是可信的。

[例外]可競爭市場是新廠商能夠根據(jù)短期信息進入、退出而不會因沉沒成本發(fā)生虧損的產(chǎn)業(yè)??刹捎谩按蛄司团堋钡牟呗?。在完全可競爭市場下,原廠商要比常規(guī)顧客更緩慢地對進入威脅作出發(fā)應。441B.4

同時博弈

[例]兩家游覽公司“嘉年華會”、“皇家加勒比”,經(jīng)營游覽業(yè)務,獨立經(jīng)營時利潤最大化價格$300,聯(lián)合時(建立卡特爾)的利潤最大化價格為$

450。如有一家違約,打折到$300,則索取$

450的公司所獲利潤將大大低于對

手。該博弈具有一個典型的“囚犯兩難”的結(jié)果順序。皇家加勒比單方違約的收益($375000)超過了自己不違約的收益($275000);超過了對方也違約時自己的收益($180000);超過自己單方面不違約時的收益($60

000)。保證了“皇家加勒比”存在一個支配戰(zhàn)略。4513502756037550175185320450美元300美元450美元300美元嘉年華會皇家加勒比具有一種支配戰(zhàn)略的游艇雙寡頭壟斷定價(單位:千美元)461“嘉年華會”沒有支配戰(zhàn)略,但由于可預測“皇家加勒比”的行為,通過排除“換家加勒比”的支配戰(zhàn)略,“嘉年華會”可以反復實施一種自己偏好的戰(zhàn)略。因此“嘉年華會”的行為也是完全可預測的。反復支配戰(zhàn)略均衡:{違約,違約}或{300,300}——囚犯兩難。兩公司都可以具有支配戰(zhàn)略,但它不一定是反復的支配戰(zhàn)略,原因是支配戰(zhàn)略不要求針對任何人特定的最優(yōu)或次優(yōu)反應。支配戰(zhàn)略被定義為參與人i的一種行動,不管其他參與人怎么做,都是一種最優(yōu)行動{ai}。參與人i的收益i

{ai*

,a-i}超過了參與人從其他任何行動i{ai

,a-i}得到的收益:471

i

{a

i*

,a-i}>i

{a

i,a-i}納什均衡戰(zhàn)略的定義是參與人i的一種行動,它是在條件上最優(yōu)的{ai*},因為在給定競爭對手的最佳回答反應i{ai*

,a-i*}條件下,參與人i的收益超過了在給定對手的最佳回答反應i

{ai,a-i*}是任何行動所形成的收益:i

{ai*

,a-i*}>i

{ai,a-i*}481[例]可口可樂與百事可樂的價格競爭。兩家公司都不存在支配戰(zhàn)略當可口可樂保持高價時,百事可樂希望價格打折;當可口可樂價格打折時,百事可樂希望保持高價。反之亦然。此時存在兩個純粹的納什均衡:{保持p*,打折c*}和{打折p*,保持c*}結(jié)果:輪番打折49112000130001050016000900063000800014

000保持高價打折價格保持高價打折價格百事可樂可口可樂不存在支配戰(zhàn)略的軟飲料“違約打折”博弈501多種均衡的出現(xiàn)是因為納什均衡的條件弱于支配戰(zhàn)略均

衡。支配戰(zhàn)略均衡要求一種行動,對于競爭對手每種可能的反應都是最優(yōu)的。納什均衡要求一種行動,僅僅對于競爭對手的最佳回答反應是最優(yōu)的。這是一種不太嚴格的均衡戰(zhàn)略,較易于滿

足。

解決輪番打折問題的答案在于隨機定價過程,百事必須算出什么樣的自動定價反應,將使可口可樂在保持高價和打折之間無差異,從而隨機宣布自己的價格。即百事采取打折行動的概率為多大時,使可口可樂從保持高價和打折兩種行動得到的期望收益相等。511設(shè)百事打折的概率為pp,則不打折的概率為1-pp,計算:pp·13000+(1-pp)·10500=pp·16000+(1-pp)·8000

解得:

pp=0.454;1-pp=0.546存在對照形象的納什反射性,可口可樂也會希望知道保持高價和打折具有什么樣的概率,才能使百事認為這兩種選擇是無差異的。同樣計算:pc·12000+(1-pc)·9000=pc·14000+(1-pc)·6300

解得:

pc=0.574;1-pc=0.426521據(jù)此,如果百事的隨機選擇對可口可樂是一種最佳回答反應,且如果此時可口可樂不能做得更好,這種違約打折博弈必定出現(xiàn)第三個納什均衡:{百事保持高價(pp=0.454),可口保持高價(pc=0.574)}這組均衡戰(zhàn)略被稱為混合的納什均衡戰(zhàn)略。預期收益為{10720,11634}。因此,在此博弈的戰(zhàn)略均衡中,存在著兩種純粹的和一種混合的納什均衡。在沒有加進事先溝通、沒有轉(zhuǎn)移支付和約束性協(xié)議的非合作的同時性博弈中,沒有辦法避免這種可能的戰(zhàn)略均衡的多元性。531B.5

避免囚犯兩難境況通過引進重復行動、不完全信息和可信性機制把同時博弈轉(zhuǎn)換成一種順序博弈來追求雙贏的結(jié)果。結(jié)論是納什均衡在有關(guān)收益信息是完全的和肯定、一方參與人的行動不能影響另一方參與人的選擇時是最優(yōu)戰(zhàn)略。

[例]軟飲料行業(yè)的重復性囚犯兩難違約將使百事可樂與可口可樂的情況會變得更糟。但避免單方面違約的唯一辦法就是自己違約!支配戰(zhàn)略促使雙方參與人在一次行動中的打折行為。不過,兩公司肯定會看到他們參與的是一種持續(xù)的競爭過程,并非一次性博弈。因此,某種策略性的合作就會代替獨斷的削價。5411200012000105001700060008000

800017

000保持高價打折價格保持高價打著價格百事可樂可口可樂軟飲料行業(yè)的重復性囚犯兩難每周經(jīng)營利潤(單位:千美元)551假設(shè)可口可樂通過宣布在時期1內(nèi)保持高價來開始此博弈過程,這是一種所謂的冷酷觸發(fā)戰(zhàn)略。一旦百事可樂脫離合作性的高價格,可口可樂就會立即對其實施懲罰,且這種懲罰是無止境的?!捎枚鄷r期懲罰在囚犯兩難博弈中是引進合作的關(guān)鍵。在此情況下,百事可樂要拿以d比例進行貼現(xiàn)的年金機會損失($12000-$8000)與從違約行動中得到的一次性獲益($17000-$12000)相比較:$4000/d>$5000以任何低于80%的貼現(xiàn)率計算,從共同合作保持高價得到的原先放棄的未來收益超過了因違約而得到的一次性獲

益。561若用更低的貼現(xiàn)率,在一次性博弈中違背諾言的支配戰(zhàn)略在永久性博弈中就不再是決定性的了。這一結(jié)論反映出一個一般性的無名氏定理,它認為對于任何收益結(jié)構(gòu)來說,貼現(xiàn)率總是存在的,但它會小到足以在一個無限重復的囚犯兩難中形成合作。

[問題]有限的短期,情況會怎樣?如2周怎么辦?假設(shè)現(xiàn)在從第2周開始,參與人知道從下一周(第3周)就要脫離這個競爭結(jié)構(gòu)。保持高價的剩余動力僅僅是$4000/(1+d),而違背諾言的動力是$5000?,F(xiàn)在突然變得對任何貼現(xiàn)率,違背諾言的結(jié)果都會更好,這也是一個

一般性的結(jié)果。571一個重復性囚犯兩難的最后一次行動與一次性行動的囚犯兩難具有相同的動力:每個人都會違約。因此,在一個重復行動的囚犯兩難中,在非最終博弈的一個時期內(nèi)參與雙方都沒有積極性保持其合作的聲譽。如果掌控最終博弈,任何懲罰性違約的安排都沒有什么作用。1.解釋問題與連鎖店悖論在無限重復博弈中,起作用的是無名氏定理。但在次數(shù)較少的有限重復博弈中,合作均衡也會得到解釋——連鎖店悖論——有限重復的囚徒兩難的解釋問題。581

[例]一家原有的連鎖店(I),要針對一個潛在進入者(PE)的進入或不進入做出接納還是斗爭的反應。原有廠商有一個接納新進入者的支配戰(zhàn)略,即使?jié)撛趶S商不進入,原有廠商也會通過斗爭阻止對手進入。但直觀上人們會認為,面對連鎖店競爭中足夠多次的重復,原有廠商通過斗爭阻止進入的聲譽就會得到收益,這種直覺在極端情況下是正確。接納的結(jié)果會使原有連鎖店的利潤從$100000減少到$80000,從而導致未來的進入。通過斗爭阻止進入會得到一個強硬者聲譽,造成現(xiàn)在的實際損失(-$10000)。下圖給出了一個20個連鎖店競爭中最后3輪的情況:第

18、19、20個商店/子市場/時期。591(-10,-10)PEI接納斗爭I接納斗爭IIPEPEII接納接納斗爭斗爭進入接納接納斗爭斗爭接納進入進入不進入不進入不進入ABCDEFGHI(80,10)*(100,-10)(60,0)(-10,-10)*(80,10)*(100,0)(60,0)N.A.N.A.N.A.N.A.連鎖店悖論(80,10)*第18個商店第19個商店第20個商店601原有廠商通過對最終博弈的前瞻,將在最后一個子市場中采取接納行動,$80000超過$60000,且一個阻止進入強硬者的聲譽以后并不存在任何收益(沒有最后?。?。因為潛在進入者也了解這一點,進入將肯定發(fā)生在最后一個市

場之中。在第19個子市場,原廠商認識到對手隨后進入第20個子市場是肯定,所以在第19個子市場中阻止進入的聲譽也是沒有收益的,因此,接納就是從節(jié)點B向到最終博弈的適當子博弈中的最佳回答反應。因為對手也可以預見到這個決

策,所以進入發(fā)生在節(jié)點A上的第19個子市場中。611因此,第19個子市場中的事實在18個子市場也是真實的,第17個也是,直到到逆向推到博弈的開始。這就是造成連

鎖店悖論的逆向推理過程。我們可以計算在子市場1中,若以合理的貼現(xiàn)率計算,原廠商能從未來的阻止進入行動中得到足夠NPV,由此證明

阻止進入而不是接納進入行動的合理性。然而,原廠商現(xiàn)在采取斗爭阻止進入行動的可信性要受到能否預見到未來接納行動的影響。因為在到達最終博弈的整個過程中,都把預見的接納作為最佳回答反應,所以任何現(xiàn)在采取斗爭阻止進入的聲譽問題就得到解決。6212.重復性囚犯兩難中的合作均衡中斷連鎖店悖論推理過程的一種方法,就是引進博弈結(jié)果的不確定性。只要最終結(jié)果是不確定的,有限重復博弈(如:報復折扣這樣的有限重復定價博弈),那么,競爭對手就可能通過保持高價而合作。而無限重復博弈并不要

求導致囚犯兩難中的合作。另一種避免囚犯兩難的方法是運用

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預覽,若沒有圖紙預覽就沒有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負責。
  • 6. 下載文件中如有侵權(quán)或不適當內(nèi)容,請與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

評論

0/150

提交評論