版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請(qǐng)進(jìn)行舉報(bào)或認(rèn)領(lǐng)
文檔簡介
第二講完全信息靜態(tài)博弈1博弈的標(biāo)準(zhǔn)式或策略式2占優(yōu)策略均衡3重復(fù)剔除劣策略4納什均衡1博弈的標(biāo)準(zhǔn)式或策略式
博弈的要素包括博弈方、策略空間、博弈的次序、博弈方的支付、博弈方的信息掌握程度和理性基礎(chǔ)。其中博弈的次序、信息和理性基礎(chǔ)是構(gòu)成博弈前提,而要表示一個(gè)博弈,只要表出各博弈方及其策略空間和得益就可以了。即:(1)博弈參與者集合:A={1,2,…,n}(2)策略空間:Si,i=1,2,…,n.(3)支付函數(shù):ui(s1,s2,…,sn)定義1:如果一個(gè)博弈有n個(gè)博弈方,其策略空間分別為S1,S2,…,Sn,支付函數(shù)分別為:u1,u2,…,un,則此博弈的標(biāo)準(zhǔn)式表示為:G={S1,S2,…,Sn,;u1,u2,…,un}標(biāo)準(zhǔn)式主要用來表示靜態(tài)博弈。這種博弈中,參與者是同時(shí)選擇策略的,但只要每一參與者在行動(dòng)時(shí)不知道其他參與者的選擇就可以了。2占優(yōu)策略均衡參與者選擇策略的過程。選擇方法無非兩種:選優(yōu)和去劣。一般說來,每個(gè)參與者的收益都是所有參與者所選戰(zhàn)略的函數(shù),因此,每個(gè)參與者選擇最優(yōu)策略時(shí)必須考慮其他參與者的選擇。但有些特殊的博弈中,某些參與者可能不需要考慮其他參與者的選擇,因?yàn)闊o論其他參與者如何選擇,他有唯一的最優(yōu)策略,稱為占優(yōu)策略。對(duì)于任一向量s=s(s1,…,sn),將向量(s1,…,si-1,si+1,…,sn)記作s-i,即s中與參與人i無關(guān)的部分。參與人i之外所有其他參與人的策略組合參與人i對(duì)于其他參與人所選擇的策略s-i的最佳應(yīng)對(duì)是使其獲得最大支付的策略si即ui(si*,s-i)≥ui(si′,s-i)對(duì)于任何si′≠si*如果沒有其他策略是同樣好的,那么這一最佳應(yīng)對(duì)就是強(qiáng)最佳應(yīng)對(duì)。
第一個(gè)重要的均衡概念就是優(yōu)勢策略均衡(dominantstrategyequilibrium)。如果無論其他參與人選擇什么策略,策略si*都是參與人i的強(qiáng)最佳應(yīng)對(duì),那么si*就稱為優(yōu)勢策略。這意味著無論別人選擇什么策略,si*都使參與人i的支付最大化。從數(shù)學(xué)上講ui(si*,s-i)≥ui(si′,s-i)對(duì)于任何si′≠si*對(duì)于參與人i而言較差的策略稱為劣式策略(dominantedstrategy)。優(yōu)勢策略均衡是由每個(gè)參與人優(yōu)勢策略所組成的策略組合(s1*,s2*,…,sn*)。優(yōu)勢策略只要求每個(gè)參與者是理性的,而不要求每個(gè)參與者知道其他參與者是理性的(即不要求“理性”是共同知識(shí))囚徒困境舉例囚徒困境列抵賴坦白抵賴(-1,-1)(-10,0)列坦白(0,-10)(-8,-8)每一個(gè)參與人都有一個(gè)優(yōu)勢策略。以行先生為例,他并不知道列先生選擇的是什么行動(dòng)。但不管列先生選擇什么,行先生的優(yōu)勢策略都是坦白。由于支付矩陣是對(duì)稱的,列先生也是如此。所以優(yōu)勢策略均衡為(坦白,坦白),均衡支付為(-8,-8)囚徒困境看起來既荒謬又不現(xiàn)實(shí)(雖然這是對(duì)付犯罪的標(biāo)準(zhǔn)工具之一)。如果你實(shí)在不能理解,應(yīng)該意識(shí)到,模型的主要用處通常是導(dǎo)出荒謬的結(jié)果,引致困惑。困惑是你的模型與你設(shè)想的有所不同的標(biāo)志(你遺漏了對(duì)于所期望但卻未得到的結(jié)果來說必不可少的東西)。此時(shí)要么是你的最初想法有問題,要么是你的模型有錯(cuò)誤發(fā)現(xiàn)此類錯(cuò)誤是建模過程中的收獲。這種收獲雖然痛苦,但卻是真實(shí)的有益的。拒絕接受出乎意料的結(jié)論就是拒絕邏輯。3重復(fù)剔除劣策略——“俾斯麥海戰(zhàn)”日本海軍上將木村要將日本陸軍運(yùn)往新幾內(nèi)亞,有兩條航線:較短的北線和較長的南線。美國海軍上將肯尼則必須決定將其飛機(jī)派往南線還是北線進(jìn)行搜索轟炸。俾斯麥海戰(zhàn)木村北南北(2,-2)(2,-2)肯尼南(1,-1)(3,-3)兩個(gè)參與人都沒有優(yōu)勢策略。但使用弱優(yōu)勢的概念,可以找到一個(gè)較為合理的均衡。對(duì)參與人i的策略si′來說,如果存在有可能比si′好而絕不會(huì)比si′差的另一策略si‘’,即在某些策略組合下si‘’可帶來更高支付而絕不會(huì)產(chǎn)生更低的支付,那么我們說si′弱劣于si‘’。從數(shù)學(xué)上講,若存在這樣的si‘’,對(duì)于任何s-iui(si‘’,s-i)≥ui(si′,s-i),對(duì)于某一s-i,則說si′弱劣于si‘’。弱優(yōu)勢策略均衡(weakdomimantstrategyequilibrium)定義為在剔除了每個(gè)參與人的全部弱劣勢策略后得到的一個(gè)策略組合。但是肯尼沒有任一策略是弱劣的。于是要求定義一個(gè)重復(fù)剔除優(yōu)勢均衡。我們首先從某一個(gè)參與人的策略集里剔除一個(gè)弱劣策略,再重新考察各個(gè)參與人剩下的策略中哪些是弱劣的并剔除其中之一,繼續(xù)這一過程直到每一個(gè)參與人都僅剩下一個(gè)策略。這樣得到的策略組合就稱為這重復(fù)剔除優(yōu)勢均衡(iterateddominanceequilibrium)將這一均衡概念應(yīng)用于俾斯麥海戰(zhàn),則意味著肯尼斷定木村會(huì)選擇策略北,因?yàn)樗侨鮾?yōu)勢的。木村北北(2,-2)肯尼南(1,-1)去掉了一列的情況下,肯尼就有一個(gè)強(qiáng)優(yōu)勢策略:選擇北。(北,北)就是一個(gè)重復(fù)剔除優(yōu)勢均衡,這也是1943年真實(shí)發(fā)生的情況。優(yōu)勢策略均衡和重復(fù)剔除策略均衡對(duì)參與者的理性要求是不同的。前者只要每個(gè)參與者自己是理性的就可以了,而后者要求理性是參與者的共同知識(shí),即,參與者不僅自己是理性的,還需要其他參與者也是理性的,并且還假定所有參與者都知道其他參與者是理性的。重復(fù)剔除策略均衡是建立在理性參與者不會(huì)選擇嚴(yán)格劣策略這一合情推理之上的,但這一方法和嚴(yán)格占優(yōu)策略均衡一樣,有時(shí)候找不到嚴(yán)格劣策略。所以,這兩種解法雖然簡單,但有時(shí)不奏效。4納什均衡對(duì)于大多數(shù)的博弈而言,重復(fù)剔除優(yōu)勢均衡也是不存在的,于是引入納什均衡(NashEquilibrium)。在一個(gè)策略組合si*,在其他參與人都不會(huì)改變已有策略的條件下,如果沒有參與人有激勵(lì)去改變自身的策略,則稱策略組合si*為納什均衡,數(shù)學(xué)表達(dá)為,ui(si*,s-i*)≥ui(si′,s-i*)對(duì)于任何si′≠si*智豬博弈(boxedpigs)小豬按鍵等待按鍵(5,1)→(4,4)大豬↓↑等待(9,-1)→(0,0)策略組合為(按鍵,等待)是一個(gè)納什均衡。理解納什均衡就是構(gòu)造一個(gè)策略組合,然后看看每個(gè)參與人的策略是否是對(duì)其他參與人策略的最好應(yīng)對(duì)。如果大豬選擇了按鍵,那么小豬會(huì)選擇等待。反過來,如果小豬選擇了等待,那么大豬選擇按鍵,這就是印證了(按鍵,等待)確實(shí)是一個(gè)納什均衡。乙左中右上甲中下0,44,05,34,03,50,43,56,65,3性別大戰(zhàn)妻子韓劇球賽韓劇2,10,0丈夫球賽0,01,2不存在重復(fù)剔除優(yōu)勢均衡??辞蛸惡涂错n劇都是納什均衡,但分別是針對(duì)不同均衡而言。若這對(duì)戀人事先不通氣,則可能出現(xiàn)誤會(huì)。性別戰(zhàn)中,任一納什均衡都是帕累托有效的,其他任一策略都不可能在不降低其他參與人支付的條件下提高另一參與人的支付,即不存在帕累托改進(jìn)。但囚徒困境博弈中納什均衡并不是帕累托最優(yōu)的。斗雞博弈妻子進(jìn)退進(jìn)-3,-32,0丈夫退0,20,0市場進(jìn)入阻撓在位者默許斗爭進(jìn)入40,50-10,0進(jìn)入者不進(jìn)入0,3000,300恩愛夫妻博弈妻子活著死了活著2,2-6,0丈夫死了0,-60,0仇恨夫妻博弈妻子活著死了活著0,06,0丈夫死了0,60,0同優(yōu)勢策略均衡一樣,納什均衡也有強(qiáng)弱之分,要定義一個(gè)強(qiáng)納什均衡,只要不等式成立嚴(yán)格成立。也就是說,沒有參與人會(huì)對(duì)是選擇均衡策略還是選擇其他策略持兩可的態(tài)度。每一個(gè)優(yōu)勢策略均衡都是納什均衡,但并非每一個(gè)納什均衡都是優(yōu)勢策略均衡。如果某一策略是優(yōu)勢的,那么它對(duì)于其他參與人選擇的任何策略都是最佳應(yīng)對(duì)從數(shù)學(xué)上講(ui(si*,s-i)≥ui(si′,s-i)對(duì)于任何si′≠si*),這自然也包括其他參與人的均衡策略。如果某一策略是納什均衡的組成部分,那么它只需要對(duì)其他參與人的均衡策略而言是最佳應(yīng)對(duì)即可。(ui(si*,s-i*)≥ui(si′,s-i*)對(duì)于任何si′≠si*)為了說明納什均衡的這一特點(diǎn),構(gòu)造囚徒困境的變形。變形的囚徒困境列抵賴坦白抵賴(0,0)(-10,0)列坦白(0,-10)(-8,-8)變形的囚徒困境沒有強(qiáng)優(yōu)勢策略均衡,它僅有一個(gè)弱優(yōu)勢策略均衡,坦白仍是一個(gè)弱優(yōu)勢策略。(坦白,坦白)是一個(gè)重復(fù)剔除均衡策略,也是一個(gè)強(qiáng)納什均衡。但是還存在另一個(gè)納什均衡:(抵賴,抵賴)。這是一個(gè)弱納什均衡。雖然這一均衡是弱的而另一均衡是強(qiáng)的,但(抵賴,抵賴)仍然有其自身的優(yōu)勢:它的結(jié)果具有帕累托優(yōu)勢,因?yàn)椋?,0)中二者的支付均大于(-8,-8)。納什均衡的應(yīng)用古諾(Cournot)的雙寡頭壟斷模型設(shè)q1,q2分別表示企業(yè)1,2生產(chǎn)的同樣產(chǎn)品的產(chǎn)量,市場中該產(chǎn)品的總供給Q=q1+q2,令P(Q)=a-Q表示市場出清價(jià)格(當(dāng)Q>a時(shí)P(Q)=0),設(shè)企業(yè)i生產(chǎn)qi總成本為cqi,即不考慮固定成本,邊際成本為常數(shù)c,并且兩個(gè)企業(yè)同時(shí)進(jìn)行產(chǎn)量決策。首先把問題轉(zhuǎn)化為標(biāo)準(zhǔn)式博弈。博弈參與者:企業(yè)1、2;博弈參與者的策略空間:設(shè)產(chǎn)量是連續(xù)變化的,則S1=S2=[0,+∞)。(其實(shí)不會(huì)產(chǎn)生qi>a的情況)把各自的收益表示成自己和對(duì)方所選策略的函數(shù):U1(q1,q2)=q1[P(q1+q2)-c]=q1[a-(q1+q2)-c]U2(q1,q2)=q2[P(q1+q2)-c]=q2[a-(q1+q2)-c]設(shè)(q1*,q2*)是納什均衡,則由(NE)得:u1(q1*,q2*)≥u1(q1,q2*)u2(q1*,q2*)≥u2(q1*
,q2)對(duì)所有qi∈Si=[0,+∞)都成立。分別求導(dǎo)得出如果(q1*,q2*)是納什均衡則必須解得這一均衡在直觀上很好理解。每一企業(yè)都想成為壟斷者,它會(huì)選擇qi使ui(qi,0)最大化假設(shè)a=8,c=2.惟一一組解為q1*=q2*=2,策略組合(2,2)是惟一納什均衡。市場總產(chǎn)量為4,市場價(jià)格為4,雙方支付(利潤)均為2×(8-4)-2×2=4,利潤總和為8。如果從兩廠商總利潤最大化角度來看,U=Q(8-Q)-2Q=6Q-Q×Q,最大產(chǎn)量為3,最大總利潤為9。古諾模型的簡單模型:兩寡頭間的囚徒困境博弈。寡頭2不突破突破不突破4.5,4.53.75,5寡頭1突破5,3.754,4團(tuán)隊(duì)中的道德風(fēng)險(xiǎn)模型假設(shè)一個(gè)團(tuán)隊(duì)中有兩個(gè)工人,每個(gè)人可以工作(si=1)或偷懶(si=0),團(tuán)隊(duì)總產(chǎn)出是4(s1+s2),并在兩個(gè)工人中平均分配。每個(gè)人工作要承擔(dān)私人成本3,偷懶時(shí)私人成本為0。工人2
溫馨提示
- 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請(qǐng)下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請(qǐng)聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
- 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會(huì)有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
- 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
- 5. 人人文庫網(wǎng)僅提供信息存儲(chǔ)空間,僅對(duì)用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對(duì)用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對(duì)任何下載內(nèi)容負(fù)責(zé)。
- 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請(qǐng)與我們聯(lián)系,我們立即糾正。
- 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶因使用這些下載資源對(duì)自己和他人造成任何形式的傷害或損失。
最新文檔
- 分包商擔(dān)保合同的賠償責(zé)任
- 散熱器招標(biāo)文件及合同的履行地點(diǎn)
- 試劑與耗材購銷合同
- 五保供養(yǎng)合同書
- 硝酸鉀化肥銷售協(xié)議
- 建筑分包合同的勞務(wù)條款
- 快樂成長托兒所寶寶照顧合同
- 建筑垃圾運(yùn)輸合同樣本
- 代工協(xié)議合同文本
- 放射線計(jì)儀表采購合同規(guī)范
- 中外比較文學(xué)研究專題智慧樹知到期末考試答案2024年
- 語言表達(dá)的修辭解碼智慧樹知到期末考試答案2024年
- 獸醫(yī)寄生蟲學(xué)智慧樹知到期末考試答案2024年
- 2022-2023學(xué)年北京市西城區(qū)人教版五年級(jí)上冊期末測試數(shù)學(xué)試卷(無答案和有答案版)
- 家庭教育促進(jìn)法培訓(xùn)課件
- 2024年度首診負(fù)責(zé)制度課件
- 教師校園網(wǎng)絡(luò)安全培訓(xùn)
- 工程倫理智慧樹知到期末考試答案2024年
- 設(shè)備維保的備品備件與庫存管理
- 《茶藝》課程教學(xué)大綱
- 建筑工地塌陷應(yīng)急預(yù)案
評(píng)論
0/150
提交評(píng)論