




版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進行舉報或認領(lǐng)
文檔簡介
第四講不完全信息動態(tài)博弈1一、精煉貝葉斯納什均衡
二、信號傳遞博弈及其應用
三、不完全信息重復博弈與聲譽
2不完全信息動態(tài)博弈的基本思路
1、“自然”首先選擇參與人的類型,參與人自己知道,其他參與人不知道,但參與人類型的概率分布(也稱為“先驗信念”)是公共知識;2、在自然行動以后,參與人開始行動,參與人的行動有先有后,后行動者能觀測到先行動者的行動,但不能觀測到先行動者的類型。3、后行動者可以通過觀察先行動者所選擇的行動來推斷或修正對其類型的先驗信念(這是由于:參與人的行動是類型依存的,每個參與人的行動都傳遞著有關(guān)自己類型的某種信息。但是,先行動者預測到自己的行動將被后行動者所利用,也會設法選擇傳遞對自己最有利的信息,避免傳遞對自己不利的信息),從而形成后行動者的后驗信念。4、因此,博弈過程不僅是參與人選擇行動的過程,而且是參與人不斷修正信念的過程。
一、精煉貝葉斯納什均衡3貝葉斯法則
在日常生活中,當面臨不確定性時,在任何一個時點上,我們對某件事情發(fā)生的可能性有一個判斷,然后,我們會根據(jù)新的信息來修正這個判斷。修正之前的判斷稱為“先驗概率”;修正之后的判斷稱為“后驗概率”。目前,貝葉斯法則是人類修正信念的唯一合理方法。
貝葉斯法則黔驢技窮:老虎“信念”的不斷修正過程。
4例1:有一個人,我們認為他是好人的先驗概率是50%?,F(xiàn)在,發(fā)現(xiàn)他做了一件好事,如何修正我們對他的判斷,取決于好事好到什么程度。(板書)1、這是一件非常好的好事,好人一定干,壞人決不可能干后驗概率:好人100%;2、這是一件一般的好事,好人會干,壞人也會干后驗概率:好人50%,壞人50%;3、好人肯定會干,壞人可能干,可能不干,概率各50%后驗概率:好人67%,壞人33%。
混同均衡、分離均衡的概念:吃辣椒。
5精煉貝葉斯納什均衡(簡稱精煉貝葉斯均衡)6則精煉貝葉斯均衡定義為:
7產(chǎn)品定價問題
當進入者進入后,在位者的類型將成為公共知識。如果在位者是高成本類型,兩者的均衡價格為p=5,效用都是為3,則凈效用為(3,1);如果在位者是低成本類型,兩者的均衡價格為p=4,在位者效用為5,進入者效用為1,則凈效用為(5,-1)。
進入者是高成本類型,進入成本為2。
8當u<0.5時,均衡為:不論高成本還是低成本,在位者選擇p=5;競爭者將進入,當且僅當他看到p=6;當u≥0.5時,均衡為:低成本在位者選擇p=4,高成本在位者選擇p=6;如果看到p=4,競爭者不進入;如果看到p=5或6,競爭者將選擇進入。
在先驗概率u已知的情況下,對進入者來說,如果u>0.5,進入者將進入?,F(xiàn)在的問題是:進入者的進入,不論對高成本的在位者,還是低成本的在位者都沒有好處;在位者應如何選擇價格,阻止進入者進入;而進入者又該如何根據(jù)在位者的價格來修正先驗概率。前者是“混同均衡”;后者是“分離均衡”。
在市場經(jīng)濟條件下,壟斷者維持高價是不理性行為;低價更能展示在位者的實力和產(chǎn)品質(zhì)量;請明星做廣告:產(chǎn)品的質(zhì)量信譽良好,有長期競爭的能力。
9信號傳遞模型
兩個參與人1和2,參與人1發(fā)送信號,參與人2接受信號。參與人1的類型是私人信息,參與人2的類型是公共信息(只有一個類型)。博弈的順序如下:
4、效用函數(shù)分別為u1(m,a,θ)和u2(m,a,θ)。
3、參與人2觀測到參與人1發(fā)出的信號m,使用貝葉斯法則得到后驗概率,然后選擇行動aA,A={a1,…,aH}是參與人2的行動空間;
2、參與人1了解自己的類型θ后選擇發(fā)出信號mM,這里M={m1,…,mJ},是信號空間;
1、“自然”選擇參與人1的類型θΘ,Θ={θ1,…,θK}是參與人1的類型空間,參與人1知道θ,但參與人2不知道,只知道1屬于θ的先驗概率為p=p(θ),;
10信號傳遞博弈的精煉貝葉斯均衡定義如下:信號傳遞博弈的貝葉斯均衡是策略組合(m*(θ),a*(m))和后驗概率的結(jié)合,它滿足:
信號傳遞博弈的所有精煉貝葉斯均衡可以劃分為三類:分離均衡、混同均衡和準分離均衡。
(P1)
(P2)
(B)是參與人2使用貝葉斯法則從先驗概率P(θ)、觀測到的信號m和參與人1的最優(yōu)策略m*(θ)得到的。
11分離均衡不同類型的發(fā)送者(參與人1)以1的概率選擇不同的信號,或者說,沒有任何類型選擇與其他類型相同的信號。在分離均衡下,信號準確地揭示出類型。假定K=J=2,則:
因此,后驗概率為:
,
;
,
。
;
。
12混同均衡不同類型的發(fā)送者(參與人1)選擇相同的信號,或者說,沒有任何類型選擇與其他類型不同的信號,因此,接受者(參與人2)不能修正先驗概率。假定mj是均衡策略,那么:
;
。
;
13準分離均衡一些類型的發(fā)送者(參與人1)隨機地選擇信號,另一些類型的發(fā)送者選擇特定的信號。假定類型θ1的發(fā)送者隨機地選擇m1或m2,類型θ2的發(fā)送者以1的概率選擇m2,如果這個策略組合是均衡策略組合,那么:
;
。
;
;
;
14壟斷限價模型模型分兩個階段,有兩個企業(yè),分別為企業(yè)1(在位者)和企業(yè)2(進入者)。在第一階段,企業(yè)1是一個壟斷者,選擇價格p1;在第二階段,企業(yè)2決定是否進入。企業(yè)1有兩個潛在類型:高成本和低成本,概率分別為u和1-u?,F(xiàn)在的問題是:如果企業(yè)1是低成本的,那么在第一階段,他應該如何選擇價格p1L,使進入者不敢進入。這里假設進入者也是高成本的。于是,我們得到連續(xù)的分離均衡(無窮多個均衡),即高成本在位者選擇pmH,低成本在位者選擇任意的;進入者觀測到p1L,就認為,選擇不進入;觀測到,就認為選擇進入??梢钥吹?,是一個最低成本均衡。
在所有這些均衡中,低成本在位者限制自己的價格低于壟斷價格以阻止進入者進入。
15不完全信息重復博弈與聲譽我們已經(jīng)知道,在完全信息情況下,不論階段博弈重復多少次,只有重復的次數(shù)是有限的,唯一的均衡是每個參與人在每次博弈中選擇單次靜態(tài)的均衡策略,從而,有限次重復不可能導致參與人的合作行為。這個結(jié)果似乎與人們的直觀感覺不一致。實驗結(jié)果表明:即使在確定的有限次重復博弈中,合作行為也頻繁出現(xiàn)。KMRW聲譽模型說明:參與人對其他參與人效用函數(shù)或策略空間的不完全信息對均衡結(jié)果有重要影響,在不完全信息情況下,只要博弈重復的次數(shù)足夠多,合作行為在有限次博弈中是可以出現(xiàn)的(博弈次數(shù)沒有必要是無限的)。聲譽模型涉及不完全信息重復博弈中的合作行為。
16以“囚徒困境”為例說明聲譽模型的結(jié)果。假設囚徒1是理性的;囚徒2有兩種類型:理性的和非理性的,概率分別為1-p和p。理性的囚徒1可以選擇任何策略;但非理性的囚徒2,由于某種原因,只有一種策略,即“針鋒相對”策略:開始選擇抵賴,然后在t階段選擇囚徒1在t-1階段的選擇(即“你抵賴我也抵賴,你坦白我也坦白”,“你不仁我不義”)。這里的理性囚徒可以理解為機會主義者,或者稱為非合作型參與人;這里的非理性囚徒可以理解為講義氣重信譽的人,或者合作型參與人。我們將討論博弈只重復兩次(T=2)和三次(T=3)的情況(這里設貼現(xiàn)率δ=1),并得到我們需要的結(jié)論。我們的目的在于證明:即使在完全信息下肯定會選擇“坦白”的理性囚徒也會在不完全信息下選擇“抵賴”。17兩個說明:1、進一步地,假若兩個人都有p>0(無論p多小)的概率是非理性的,只要博弈重復的次數(shù)足夠多,合作均衡就可以出現(xiàn)。2、即使選擇“冷酷策略”(絕不原諒對方的任何背信棄義行為),只要p>0,合作均衡也必然存在。可以證明,均衡結(jié)果為:如果,當重復博弈次數(shù)為T時,理性囚徒1在t=1至t=T-2階段一直選擇合作D,然后在t=T-1和t=T階段選擇不合作C;囚徒2在t=1至t=T-1階段選擇合作D,在t=T階段選擇不合作C。18作業(yè)1、下圖是一個信號傳遞博弈:自然首先選擇參與人1的類型,參與人1知道自然的選擇,參與人2不知道,只知道參與人1屬于t1和t2的可能性相等;參與人1然后選擇信號L或R;參與人2最后選擇行動U或D,博弈結(jié)束,效用向量如終點結(jié)所示。給出找個博弈的所有純策略分離均衡和混同均衡。DUNt11(1,1)21LLRR222t2(2,0)(2,2)(0,0)(0,0)(0,1)(1,0)(1,1)DUDUDU192、一對夫婦離婚是要分財產(chǎn)。根據(jù)法律規(guī)定,婚姻期間形成的財產(chǎn)的所有權(quán)各占一半。但因為家庭財產(chǎn)由不同的部分組成,要對財產(chǎn)的價值作一個客觀的估計是很困難的;特別地,由于個人的興趣和出于對未來生活的考慮,夫妻雙方對不同財產(chǎn)的評價是不同的。因此,二人免不了要對什么物品歸誰所有而發(fā)生爭執(zhí)。經(jīng)過幾個回合的談判,兩人同意按以
溫馨提示
- 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
- 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預覽,若沒有圖紙預覽就沒有圖紙。
- 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
- 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負責。
- 6. 下載文件中如有侵權(quán)或不適當內(nèi)容,請與我們聯(lián)系,我們立即糾正。
- 7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。
最新文檔
- 彩鋼板產(chǎn)品知識培訓課件
- 活動效果跟蹤記錄表格(事件類)
- 建筑工地施工安全管理與預案
- 電子廢物回收與處理協(xié)議
- 物業(yè)管理服務具體協(xié)議
- 數(shù)據(jù)管理中心辦公場所表格(特定公司情境)
- 麻疹的防治知識培訓課件
- 酒店防汛知識培訓課件
- 小學低年級繪本故事解讀
- 新能源充電站運營與管理手冊
- 企業(yè)內(nèi)部系統(tǒng)使用權(quán)限規(guī)范
- 2024年亳州職業(yè)技術(shù)學院單招職業(yè)技能測試題庫
- 2025年旅行與旅游的未來:擁抱可持續(xù)與包容性增長報告(英文版)-世界經(jīng)濟論壇
- 學校跟移動公司合作協(xié)議
- 茶館項目創(chuàng)業(yè)計劃書
- 化工生產(chǎn)中的智能優(yōu)化
- 《西方經(jīng)濟學》(上冊)課程教案
- 移動政企部年終總結(jié)
- 施工合同協(xié)議書樣本
- 醫(yī)學綜合題庫(含答案)
- 工會一函兩書模板
評論
0/150
提交評論