


版權(quán)說(shuō)明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請(qǐng)進(jìn)行舉報(bào)或認(rèn)領(lǐng)
文檔簡(jiǎn)介
1、純策略納什均衡純策略納什均衡(Pure Strategy Nash Equilibrium )編輯什么是純策略納什均衡純策略納什均衡是指在一個(gè)純策略組合中,如果 給定其他的策略不變,該節(jié)點(diǎn)不會(huì)單方面改變自己的 策略,否則不會(huì)使節(jié)點(diǎn)訪問(wèn)代價(jià)變小。編輯存在純策略納什均衡的有限次重復(fù)博弈1如果重復(fù)博弈中有惟一純策略納什均衡,那么我 們?cè)趺凑页鏊募儾呗约{什均衡呢?首先看下面囚徒 的困境的博弈的例子:tad 不加白囚徒1坦由-5,-5O-S不坦白亠比07廠1009囚徒的困境的蟻弈我們現(xiàn)在考慮該博弈重復(fù)兩次的重復(fù)博弈,這可 以理解成給囚徒兩次坦白機(jī)會(huì),最后的得益是兩個(gè)階段博弈中各自得益之和在兩次博弈過(guò)程
2、中,雙方知 道第一次博弈的結(jié)果再進(jìn)行二次博弈用逆推歸納法 來(lái)分析,先分析第二階段,也就是第二次重復(fù)時(shí)兩博弈方的選擇很明顯,這個(gè)第二階段仍然是兩囚徒之 間的一個(gè)囚徒的困境博弈,此時(shí)前一階段的結(jié)果已成 為既成事實(shí),此后又不再有任何的后續(xù)階段,因此實(shí) 現(xiàn)自身當(dāng)前的最大利益是兩博弈方在該階段決策中的 惟一原則.因此我們不難得出結(jié)論,不管前一次的博弈得到 的結(jié)果如何,第二階段的惟一結(jié)果就是原博弈惟一的 納什均衡(坦白,坦白),雙方得益(-5,-5) 現(xiàn)在再回到第一階段,即第一次博弈理性的博 弈方在第一階段就對(duì)后一階段的結(jié)局非常清楚,知道 第二階段的結(jié)果必然是(坦白,坦白),因此不管第一 階段的博弈結(jié)果是
3、什么,雙方在整個(gè)重復(fù)博弈中的最 終得益,都將是第一階段的基礎(chǔ)上各加-5.因此從第 一階段的選擇來(lái)看,這個(gè) 重復(fù)博弈與圖I中得益矩陣 表示的一次性博弈實(shí)際上是完全等價(jià)的.-10,-10-5.-13 I-1JTS6,-6囚徒2國(guó)徒1坦白不坦口坦白 不如白BU ft-址!(酪均衛(wèi)的育附次夏廨奔于是我們可以得出惟一純策略均衡的 有限次重復(fù) 博弈的結(jié)果就是重復(fù)原博弈惟一的純策略納什均衡, 這就是這種重復(fù)博弈惟一的子博弈完美納什均衡路 徑.如果重復(fù)博弈中有多個(gè)純策略納什均衡,設(shè)某一 市場(chǎng)有兩個(gè)生產(chǎn)同樣 質(zhì)量產(chǎn)品的廠商,他們對(duì)產(chǎn)品的 定價(jià)同有高(H)、中(M)、低(L)三種可能設(shè)高價(jià)時(shí)市 場(chǎng)總利潤(rùn)為10個(gè)單
4、位,中價(jià)時(shí)市場(chǎng)總利潤(rùn)為 6個(gè)單 位,低價(jià)時(shí)市場(chǎng)總利潤(rùn)為2個(gè)單位.再假設(shè)兩廠商同 時(shí)決定價(jià)格,價(jià)格不等時(shí)低價(jià)格者獨(dú)享利潤(rùn),價(jià)格相 等時(shí)雙方平分利潤(rùn)這時(shí)候兩廠商對(duì)價(jià)格的選擇就構(gòu) 成了一個(gè)靜態(tài)博弈問(wèn)題我們看一個(gè)三價(jià)博弈的重復(fù) 博弈的例子:0,Od6,03,30,22,0AO|廠裔I廠曲2H M圈3三價(jià)t#弈的顯然,這個(gè)得益矩陣有兩個(gè)純策略納什均衡(M , M)和(L, L),我們也可以看出實(shí)際上兩博弈方最大的 得益是策略組合(H, H),但是它并不是納什均衡.現(xiàn) 在考慮重復(fù)兩次該博弈,我們采用一種觸發(fā)策略 (Trigger Strategy ):博弈雙方首先試圖合作,一旦發(fā) 覺(jué)對(duì)方不合作也用不合作相
5、報(bào)復(fù)的策略使得在第一 階段采用(H,H)成為子博弈完美納什均衡,其雙方的 策略是這樣的:博弈方1 :第一次選H ;如果第一次結(jié)果為(H, H),則第二次選M,如果第一次結(jié)果為任何其他策略 組合,則第二次選擇L .博弈方2 :同博弈方1在上述雙方策略組合下, 兩次重復(fù)博弈的路徑一定為第一階段(H , H),第二階 段(M,M),這是一個(gè)子博弈完美納什均衡路徑因?yàn)?第二階段是一個(gè)原博弈的納什均衡,因此不可能有哪 一方愿意單獨(dú)偏離;其次,第一階段的(H,H)雖然不 是原來(lái)的博弈納什均衡,但是如果一方單獨(dú)偏離,采 用M能增加1單位得益,這樣的后果卻是第二階段至 少要損失2單位的得益,因?yàn)殡p方采用的是
6、觸發(fā)策略, 即有報(bào)復(fù)機(jī)制的策略,因此合理的選擇是堅(jiān)持H 這 就說(shuō)明了上述策略組合是這個(gè)兩次重復(fù)博弈的 子博弈 完美納什均衡從上述的例子我們可以看出,有多個(gè)純策略納什 均衡的博弈重復(fù)兩次的子博弈完美納什均衡路徑是, 第一階段采用(H , H),第二階段采用原博弈的納什均 衡(M , M) 如果這個(gè)重復(fù)博弈重復(fù)三次,或者更多次,結(jié)論 也是相似的,仍然用觸發(fā)策略,它的子博弈完美納什 均衡路徑為除了最后一次以外,每次都采用(H,H), 最后一次采用原博弈的納什均衡(M , M) 編輯存在純策略納什均衡的無(wú)限次重復(fù)博弈1與有限次重復(fù)博弈一樣,無(wú)限次重復(fù)博弈也是基 本博弈的簡(jiǎn)單重復(fù),但是無(wú)限次重復(fù)博弈沒(méi)有
7、最后一 次重復(fù),因此無(wú)限次重復(fù)博弈與有限次有一些不同.任何博弈中博弈方策略選擇的依據(jù)都是得益的大 小,這在重復(fù)博弈中仍然是成立的.但是重復(fù)博弈又 與一次性博弈有所不同,因?yàn)樵谥貜?fù)博弈中,每一階 段都是一個(gè)博弈,并且各博弈方都有得益,因此對(duì)于重復(fù)博弈,我們要計(jì)算的就是博弈結(jié)束時(shí)的一個(gè)總的 得益由于前一次博弈和后一次博弈之間會(huì)有損失, 因此我們采用一種方法,就是將后一階段的得益折算 成當(dāng)前階段得益的(現(xiàn)在值)的貼現(xiàn)系數(shù)有了貼現(xiàn)系 數(shù)那么在無(wú)限次重復(fù)博弈中,某博弈方各階段得 益為n, n.,則該博弈方總得益的現(xiàn)在值為:C-7T =町+ 62 +用眄+=刀滬一t=l對(duì)于存在惟一純策略納什均衡博弈的無(wú)限
8、次重復(fù) 博弈,我們從下面的例子來(lái)看:H霽方】S4存在惟一地覽路的卄均窗博弈的無(wú)BI次握博葬其中博弈方1和博弈方2分別表示兩個(gè)廠商,H 和L分別表示高價(jià)和低價(jià)顯然,該博弈的一次性博 弈有惟一的純策略納什均衡(L, L),但是這個(gè)納什均 衡并不是最佳策略組合,因?yàn)椴呗越M合(H,H)的得益 (4,4)比(1,1)要高的多但是由于(H,H)不是該博 弈的納什均衡,所以在一次性博弈中不會(huì)被采用根 據(jù)上面的分析,此博弈在有限次重復(fù)博弈并不能實(shí)現(xiàn)潛在的合作利益,兩博弈方在每次重復(fù)中都不會(huì)采用 效率較高的(H,H) 為了實(shí)現(xiàn)效率較高的合作利益(H, H),假設(shè)兩博弈方都采用 觸發(fā)策略,也即報(bào)復(fù)性策略: 第一階
9、段采用H,在第t階段,如果前t-l階段的結(jié)果 都是(H,H),則繼續(xù)采用L.假設(shè)博弈方1已經(jīng)采用 了這種策略,現(xiàn)在我們來(lái)確定博弈方 2在第一階段的 最優(yōu)選擇如果博弈方2采用L,那么在第一階段能 得到5,但這樣會(huì)引起博弈方1 一直采用L的報(bào)復(fù), 自己也只能一直米用L,得益將永遠(yuǎn)為1,總得益的 現(xiàn)在值為 存<57T = 5 + 1 x 6 + 1 x + . = 5+ J1 G如果博弈方2采用H,則在第一階段他將得4, 下一階段又面臨同樣的選擇.若記V為博弈方2在該 重復(fù)博弈中每階段都采用最佳選擇的總得益現(xiàn)在值, 那么從第二階段開(kāi)始的無(wú)限次重復(fù)博弈因?yàn)榕c從第一 階段開(kāi)始的只差一階段,因而在無(wú)限次重復(fù)時(shí)可看作 相同的,其總得益的現(xiàn)在值折算成第一階段的得益為 因此當(dāng)?shù)谝浑A段的最佳選擇是 H時(shí),整個(gè)無(wú)限 次重復(fù)博弈總得益的現(xiàn)在值為&丄V = 4 + 6yV 或者 L-6461因此,當(dāng)L 一解得:時(shí),博弈方2 會(huì)采用H策略
溫馨提示
- 1. 本站所有資源如無(wú)特殊說(shuō)明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請(qǐng)下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請(qǐng)聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
- 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁(yè)內(nèi)容里面會(huì)有圖紙預(yù)覽,若沒(méi)有圖紙預(yù)覽就沒(méi)有圖紙。
- 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
- 5. 人人文庫(kù)網(wǎng)僅提供信息存儲(chǔ)空間,僅對(duì)用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對(duì)用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對(duì)任何下載內(nèi)容負(fù)責(zé)。
- 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請(qǐng)與我們聯(lián)系,我們立即糾正。
- 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶因使用這些下載資源對(duì)自己和他人造成任何形式的傷害或損失。
最新文檔
- 預(yù)防發(fā)展犯罪行為班會(huì)
- 頜面部間隙感染患者的護(hù)理
- 青光眼病人的護(hù)理小講課
- 草莓種植技術(shù)培訓(xùn)
- 寒露營(yíng)銷策略解析
- 管理學(xué)博士探索
- 腦梗賽后遺癥護(hù)理查房
- 預(yù)防溺水安全知識(shí)教育
- 2025至2030年中國(guó)金郵票紀(jì)念品數(shù)據(jù)監(jiān)測(cè)研究報(bào)告
- 2025至2030年中國(guó)開(kāi)蓋式鑰匙扣市場(chǎng)分析及競(jìng)爭(zhēng)策略研究報(bào)告
- 2025年中考百日誓師大會(huì)校長(zhǎng)發(fā)言稿:激揚(yáng)青春志 決勝中考時(shí)
- YY/T 1860.1-2024無(wú)源外科植入物植入物涂層第1部分:通用要求
- 中央2025年全國(guó)婦聯(lián)所屬在京事業(yè)單位招聘93人筆試歷年參考題庫(kù)附帶答案詳解
- 人教版高中物理選擇性必修第二冊(cè)電磁波的發(fā)射與接收課件
- 《建筑冷熱源》全冊(cè)配套最完整課件1
- 廣州2025年廣東廣州市番禺區(qū)小谷圍街道辦事處下屬事業(yè)單位招聘5人筆試歷年參考題庫(kù)附帶答案詳解
- 2025年春新人教版生物七年級(jí)下冊(cè)全冊(cè)教學(xué)課件
- 【物理】《跨學(xué)科實(shí)踐:制作微型密度計(jì)》(教學(xué)設(shè)計(jì))-2024-2025學(xué)年人教版(2024)初中物理八年級(jí)下冊(cè)
- 2024年湖南高速鐵路職業(yè)技術(shù)學(xué)院高職單招數(shù)學(xué)歷年參考題庫(kù)含答案解析
- 學(xué)校食堂餐廳管理者食堂安全考試題附答案
- 2025廣西中煙工業(yè)限責(zé)任公司招聘126人高頻重點(diǎn)提升(共500題)附帶答案詳解
評(píng)論
0/150
提交評(píng)論