![博弈論簡介(I)_第1頁](http://file2.renrendoc.com/fileroot_temp3/2021-10/26/faaace39-2e4b-4c78-bd97-fc866de4948d/faaace39-2e4b-4c78-bd97-fc866de4948d1.gif)
![博弈論簡介(I)_第2頁](http://file2.renrendoc.com/fileroot_temp3/2021-10/26/faaace39-2e4b-4c78-bd97-fc866de4948d/faaace39-2e4b-4c78-bd97-fc866de4948d2.gif)
![博弈論簡介(I)_第3頁](http://file2.renrendoc.com/fileroot_temp3/2021-10/26/faaace39-2e4b-4c78-bd97-fc866de4948d/faaace39-2e4b-4c78-bd97-fc866de4948d3.gif)
![博弈論簡介(I)_第4頁](http://file2.renrendoc.com/fileroot_temp3/2021-10/26/faaace39-2e4b-4c78-bd97-fc866de4948d/faaace39-2e4b-4c78-bd97-fc866de4948d4.gif)
![博弈論簡介(I)_第5頁](http://file2.renrendoc.com/fileroot_temp3/2021-10/26/faaace39-2e4b-4c78-bd97-fc866de4948d/faaace39-2e4b-4c78-bd97-fc866de4948d5.gif)
版權說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權,請進行舉報或認領
文檔簡介
1、 博弈論簡介博弈論簡介 第一節(jié)第一節(jié) 博弈論的基本概念博弈論的基本概念第二節(jié)第二節(jié) 完全信息靜態(tài)博弈完全信息靜態(tài)博弈第三節(jié)第三節(jié) 完全信息動態(tài)博弈完全信息動態(tài)博弈第四節(jié)第四節(jié) 不完全信息靜態(tài)博弈不完全信息靜態(tài)博弈第五節(jié)第五節(jié) 不完全信息動態(tài)博弈不完全信息動態(tài)博弈12第一節(jié)第一節(jié) 博弈論的基本概念博弈論的基本概念 一、市場競爭中的博弈一、市場競爭中的博弈 二、現(xiàn)代經(jīng)濟學與博弈論二、現(xiàn)代經(jīng)濟學與博弈論 三、博弈論的基本概念三、博弈論的基本概念 3一、市場競爭中的博弈一、市場競爭中的博弈 在現(xiàn)實經(jīng)濟生活中,許多產(chǎn)業(yè)市場是寡頭斷市場。寡頭壟斷市場是指少數(shù)幾家大廠商生產(chǎn)一個產(chǎn)業(yè)中的全部或大部分產(chǎn)品,從而
2、形成對一個產(chǎn)業(yè)的控制的產(chǎn)業(yè)市場。 在分析寡頭壟斷市場中的企業(yè)決策行為時,就必須把各種決策者之間的策略相互作決策者之間的策略相互作用用納入到經(jīng)濟模型中,這就是一種博弈分析。 4 二、現(xiàn)代經(jīng)濟學與博弈論二、現(xiàn)代經(jīng)濟學與博弈論 從現(xiàn)代的觀點來看,經(jīng)濟學是研究人的決策行為的學問。 理性人是指有一個很好定義的偏好,在面臨給定的約束條件下能最大化自己偏好的人,不考慮競爭對手的決策。 價格理論有兩個基本假定:1、市場參與人的數(shù)量足夠多,從而市場是競爭性的;2、參與人之間不存在信息不對稱問題(完全競爭、完全信息)。 然而在現(xiàn)實生活中,這兩個假設在許多情況下是不能被滿足。 博弈論與諾貝爾經(jīng)濟學獎博弈論與諾貝爾經(jīng)
3、濟學獎1994年諾貝爾經(jīng)濟學獎授予了三位博弈論專家年諾貝爾經(jīng)濟學獎授予了三位博弈論專家和和。1996年諾獎授予兩位博弈論與信息經(jīng)濟學研究專家莫里斯、維克里;年諾獎授予兩位博弈論與信息經(jīng)濟學研究專家莫里斯、維克里;2001年諾獎授予阿克洛夫、斯彭斯、斯蒂格利茨,表彰他們在檸檬市年諾獎授予阿克洛夫、斯彭斯、斯蒂格利茨,表彰他們在檸檬市場、信號傳遞和信號甄別等非對稱信息理論研究中的開創(chuàng)性貢獻。場、信號傳遞和信號甄別等非對稱信息理論研究中的開創(chuàng)性貢獻。2005年諾獎授予有以色列和美國雙重國籍的年諾獎授予有以色列和美國雙重國籍的,以表彰他們在博弈論領域作出的貢獻。,以表彰他們在博弈論領域作出的貢獻。51
4、994年年10月月11日日 新聞公報(新聞公報(/)“由于其對非合作博弈論中關于均衡的開創(chuàng)性分析”,瑞典皇家科學院決定將1994年瑞典央行紀念諾貝爾經(jīng)濟科學獎聯(lián)合授予美國加利福尼亞大學 約翰.C.海薩尼 教授美國普林斯頓大學 約翰.F.納什 Jr. 博士德國波恩大學 萊因哈德.澤爾騰 教授瑞典皇家科學院瑞典銀行紀念諾貝爾經(jīng)濟科學獎1994年桂冠得主約翰.C.海薩尼斯坦福大學經(jīng)濟學博士 1957年布達佩斯大學 哲學博士 1947年約翰.F.納什 Jr.普林斯頓大學數(shù)學博士 1950年MIT.數(shù)學教員(1951-1959) 萊因哈德.澤爾騰法蘭克福大學數(shù)學博
5、士 1961年1996年年10月月11日日 新聞公報(新聞公報(/)前者在信息經(jīng)濟學理論領域做出了重大貢獻,尤其是不對稱信息條件下的經(jīng)濟激勵理論的論述;后者在信息經(jīng)濟學、激勵理論、博弈論等方面都做出了重大貢獻。瑞典皇家科學院2005年年10月月10日日 新聞公報新聞公報“由于通過博弈論分析加深了我們對沖突與合作的理解”,瑞典皇家科學院決定將2005年瑞典銀行紀念諾貝爾經(jīng)濟科學獎聯(lián)合授予以色列耶路撒冷希伯來大學理性中心羅伯特.J.奧曼 教授 (以色列和美國雙重國籍) 美國馬里蘭大學經(jīng)濟學系與公共政策學院托馬斯.C.謝林 教授 哈佛大學政治經(jīng)濟學教授。瑞典皇
6、家科學院瑞典銀行紀念諾貝爾經(jīng)濟科學獎2005年桂冠得主羅伯特.J.奧曼麻省理工學院數(shù)學博士, 1955年托馬斯.C.謝林哈佛大學經(jīng)濟學博士, 1951年13 三、博弈論的基本概念三、博弈論的基本概念 (一)博弈論的定義 博弈論,英文為Game theory,是研究相互依賴、相互影響的決策主體的理性決策行為以及這些決策的均衡結(jié)果的理論。 一些相互依賴、相互影響的決策行為及其結(jié)果的組合稱為博弈(Game)。 14( (二二) )博弈的組成要素博弈的組成要素 一個博弈一般由以下幾個要素組成,包括:參與人、行動、信息、策略、得益、結(jié)果、均衡等。 1、參與人指的是博弈中選擇行動以最大化自己效用的決策主體
7、(可以是個人,也可以是團體); 2、行動是指參與人在博弈進程中輪到自己選擇時所作的某個具體決策; 3、策略是指參與人選擇行動的規(guī)則,即在博弈進程中,什么情況下選擇什么行動的預先安排;15 4、信息指的是參與人在博弈中所知道的關于自己以及其他參與人的行動、策略及其得益函數(shù)等知識; 5、得益是參與人在博弈結(jié)束后從博弈中獲得的效用,一般是所有參與人的策略或行動的函數(shù),這是每個參與人最關心的東西; 6、均衡是所有參與人的最優(yōu)策略或行動的組合;均衡結(jié)果是指博弈結(jié)束后博弈分析者感興趣的一些要素的集合,如在各參與人的均衡策略作用下,各參與人最終的行動或效用集合。 上述要素中,參與人、行動、結(jié)果統(tǒng)稱為博弈規(guī)則
8、,博弈分析的目的就是使用博弈規(guī)則來決定均衡。 16( (三三) )博弈的分類博弈的分類 根據(jù)參與人的多少,可將博弈分為兩人博弈或多人博弈; 根據(jù)參與人是否合作,可將博弈分為合作博弈或非合作博弈; 根據(jù)博弈結(jié)果的不同,又可分為零和博弈、常和博弈與變和博弈。 17p1.從行動的先后次序來分,博弈可以分為靜態(tài)博弈和動態(tài)博弈:靜態(tài)博弈指在博弈中,參與人同時選擇行動,或雖非同時但后行動者并不知道前行動者采取了什么具體行動;動態(tài)博弈指的是參與人的行動有先后順序,且后行動者能夠觀察到先行動者所選擇的行動的博弈。 18 2、從參與人對其他參與人的各種特征信息的獲得差異來分,博弈可分為完全信息博弈和不完全信息博
9、弈。 完全信息指的是每一個參與人對所有其他參與人的特征,如策略集合及得益函數(shù)都有準確完備的知識;否則就是不完全信息。 將上述兩個角度的劃分結(jié)合起來,我們就得到四種不同類型的博弈,這就是:完全信息靜態(tài)博弈,完全信息動態(tài)博弈,不完全信息靜態(tài)博弈和不完全信息動態(tài)博弈。 順序信息靜態(tài)博弈一般動態(tài)博弈-序貫博弈重復動態(tài)博弈-超級博弈完全信息納什均衡-納什(1950,1951);重復剔除占優(yōu)均衡-Luce和Raiffa (1957)聚點均衡聚點均衡-謝林謝林(1960); 相關均衡相關均衡- 奧曼奧曼(1974,1987)子博弈精煉納什均衡-澤爾騰(1965)無限重復博弈:強均衡-奧曼(1959);無名氏
10、定理-弗里德曼 (1971);有限重復博弈:連鎖店悖論-澤爾騰(1978)不完全信息非對稱非對稱信息信息貝葉斯納什均衡-海薩尼(1967-1968)顫抖的手均衡-澤爾騰(1975);序貫均衡-克瑞普斯和威爾遜(1982);精煉貝葉斯均衡- 弗登伯格和泰勒爾 (1991)無限重復博弈:奧曼、馬什勒和斯泰因斯(1966-1968);有限重復博弈:KMRW聲譽模型(1982)非合作博弈論的基本內(nèi)容20 第二節(jié)第二節(jié) 完全信息靜態(tài)博弈完全信息靜態(tài)博弈 一、一、完全信息靜態(tài)博弈定義 所謂完全信息靜態(tài)博弈指的是各博弈方同時決策,或者決策行動雖有先后,但后行動者不知道先行動者的具體行動是什么且各博弈方對博弈
11、中各種策略組合情況下所有參與人相應的得益都完全了解的博弈。 21二、博弈的策略式表達二、博弈的策略式表達 在博弈論中,一個博弈可以用兩種不同的方式來表達: 一種是策略式表達;另一種是擴展式表達。策略式表達更適合于靜態(tài)博弈,而擴展式表達更適合于討論動態(tài)博弈。 22 策略式表達又稱為標準式表達,在這種表達中,所有參人同時選擇自己的策略,所有參與人選擇的策略一起決定每個參與人的得益。 值得強調(diào)的是,這里參與人同時選擇的是“策略”,而不是“行動”。 在靜態(tài)博弈中,于參與人只選擇一次,所以策略就等同于行動了。而在動態(tài)博弈中,策略是參與人在各個階段的行動的全面計劃。 23 更為準確地講,戰(zhàn)略式表述給出:更
12、為準確地講,戰(zhàn)略式表述給出: 1、博弈的參與人集合:i,=(1,2,, n); 2、每個參與人的戰(zhàn)略空間:Si i1,2,3,n; 3、每個參與人的得益函數(shù):ui(s1, ,si,sn),i1,2,3, ,n。 用GS1,Sn;u1, ,un代表戰(zhàn)略式表述博弈。24 三、博弈的得益矩陣表示博弈的得益矩陣表示 一個博弈被稱為有限博弈,如果: 第一,參與人的個數(shù)是有限的; 第二,每個參人可選擇的策略個數(shù)是有限的。 有限博弈的策略式表達及其求解可以方便地用得益矩陣直觀地給出。 25著名的著名的“囚徒困境囚徒困境”的例的例子子 警察抓住了兩個罪犯,但是警察局卻缺乏足夠的證據(jù)指證他們所犯的罪行。如果罪犯
13、中至少有一人供認犯罪,就能確認罪名成立。為了得到所需的口供,警察將這兩名罪犯分別關押防止他們串供或結(jié)成攻守同盟,并分別跟他們講清了他們的處境和面臨的選擇:如果他們兩人都拒不認罪,則他們會被以較輕的妨礙公務罪各判一年徒刑;如果兩人中有一人坦白認罪,則坦白者立即釋放而另一人將重判10年徒刑;果兩人都坦白認罪,則他們將被各判8年監(jiān)禁。問:兩個罪犯會如何選擇(即是坦白還是抵賴)? 26囚徒囚徒B B囚徒囚徒A A 坦白不坦白坦白8,80,-10不坦白-10,01,127四、完全信息靜態(tài)博弈的均衡四、完全信息靜態(tài)博弈的均衡 1、占優(yōu)策略均衡。一般來說,由于每個參與人的得益是博弈中所有參與人的策略的函數(shù),
14、因此每個參與人的最優(yōu)策略選擇依賴于所有其他參與人的策略選擇。但在一些特殊的博弈中,一個參與人的最優(yōu)策略可能可以不依賴于其他參與人的策略選擇,就是說,不論其他參與人選擇什么策略,他的最優(yōu)策略是 唯一的,這樣的最優(yōu)策略被稱為“占優(yōu)策略”。 如果一個博弈中,某個參與人有占 優(yōu)策略,那么該參與人的其他可選擇策略就被稱為“劣策略”。 28 在一個博弈里在一個博弈里, ,如果所有參與人都有占優(yōu)策略如果所有參與人都有占優(yōu)策略存在,那么占優(yōu)策略均衡是可以預測到的唯一的均衡,存在,那么占優(yōu)策略均衡是可以預測到的唯一的均衡,因為沒有一個理性的參與人會選擇劣策略。所以在囚徒因為沒有一個理性的參與人會選擇劣策略。所以
15、在囚徒困境博弈里,困境博弈里, 坦白,坦白坦白,坦白 是占優(yōu)策略均衡。是占優(yōu)策略均衡。 囚徒困境反映了一個深刻的問題囚徒困境反映了一個深刻的問題, ,即個人理性與即個人理性與團體理性的沖突。這給我們一個啟示團體理性的沖突。這給我們一個啟示, ,我們學習博弈論,我們學習博弈論,也許更應該研究的是怎樣設計一種制度也許更應該研究的是怎樣設計一種制度, ,在滿足個人理在滿足個人理性的同時性的同時, ,去爭取達到去爭取達到“集體理性集體理性”。29 2 2、嚴格劣策略的重復剔除、嚴格劣策略的重復剔除 重復剔除嚴格劣策略”的思路如下:首先找出某個參與人的嚴格劣策略(假定其存在),把這個劣策略剔除掉,重新構
16、造一個不包含已剔除策略的新的博弈;重復這個過程,一直到只剩下一個唯一的策略組合為止。這個唯一剩下的策略組合就是這個博弈的均衡解,稱為”重復剔除的占優(yōu) 均衡”。注意,上述表述中強調(diào)了“唯一”這個詞。也就是說,如果重復剔除后剩下的策略組合不唯一,那么該博弈就不是可通過重復剔除劣策略求解的。 重復剔除的占優(yōu)均衡重復剔除嚴格劣戰(zhàn)略:思路:首先找到某個參與人的劣戰(zhàn)略(假定存在),把這個劣戰(zhàn)略剔除掉,重新構造一個不包含已剔除戰(zhàn)略的新的博弈,然后再剔除這個新的博弈中的某個參與人的劣戰(zhàn)略,一直重復這個過程,直到只剩下唯一的戰(zhàn)略組合為止。 這個唯一剩下的戰(zhàn)略組合就是這個博弈的均衡解,稱為“重復剔除的占優(yōu)均衡”。
17、重復剔除的占優(yōu)均衡 5,14,49,-10,0等待小豬大豬按等待按案例2-智豬博弈按是小豬的嚴格劣戰(zhàn)略-剔除4大于10大于-1“按”是大豬的占優(yōu)戰(zhàn)略,納什均衡:大豬按,小豬等待重復剔除的占優(yōu)均衡1,01,20,30,1M列先生行先生UDL0,12,0R行:沒有占優(yōu)戰(zhàn)略列:M嚴格優(yōu)于R剔除 R行:L優(yōu)于D列:無占優(yōu)戰(zhàn)略剔除 DM優(yōu)于L(U,M)是重復剔除的占優(yōu)均衡重復剔除的占優(yōu)均衡卑斯麥海之戰(zhàn)卑斯麥海之戰(zhàn)發(fā)生在1943年的南太平洋上,日本海軍上將木村受命將日本陸軍運抵新幾內(nèi)亞,其間要穿越卑斯麥海。而美國上將肯尼欲對日軍運輸船進行轟炸,穿越卑斯麥海通往新幾內(nèi)亞的有兩條航線,木村必須從中選一條,而肯
18、尼則必須決定將其飛機派往何處去搜索日軍,如果肯尼將他的飛機派到了錯誤的航線上,他雖可以召回他們,但可供轟炸的天數(shù)將減少。2,-22,-21,-13,-3木村肯尼北南北南34 3 3納什均衡納什均衡 納什均衡是完全信息靜態(tài)博弈解的一般概念,構成納什均衡的策略一定是重復剔除嚴格劣策略過程中不能被剔除的策略,即沒有任何一個策略嚴格優(yōu)于納什均衡策略。當然,逆定理是不存在的。更為重要的是,許多不存在占優(yōu)策略均衡或重復剔除的占優(yōu)策略均衡的博弈,也存在納什均衡。 下面,我們給出納什均衡的正式定義。35 納什均衡的正式定義納什均衡的正式定義 納什均衡:有n個參與人的戰(zhàn)略式表述博弈GS1,Sn;u1, ,un,
19、戰(zhàn)略組合S*(S1*,Sn*)是一個納什均衡,如果對于每一個i,Si*是給定其他參與人Si*(S1*,,S-1*,Si+1*,Sn*)的情況下第i個參與人的最優(yōu)戰(zhàn)略,即:ui(si*,s-i*)ui(si,s-i*)對任意SiSi,和任意的 I都成立。36 指一組給定對手行為前提下對各指一組給定對手行為前提下對各博弈方存在的最佳選擇;在納什博弈方存在的最佳選擇;在納什均衡狀態(tài)下,只要其它參與者不均衡狀態(tài)下,只要其它參與者不變換策略選擇,任何單個參與者變換策略選擇,任何單個參與者不可能單方面通過變換策略來提不可能單方面通過變換策略來提高他的所獲支付。高他的所獲支付。37五、納什均衡的多重性 在兩
20、人的有限策略博弈中,我們還可以簡單地用劃線法來找出納什均衡在位者進入者默許打擊進入40,50-10,0不進入0,3000,300 從這個例子中我們知道一個博弈可能有多個納什均衡,而具體哪個均衡會實現(xiàn),納什均衡本身不能給出回答,任何有限博弈都存在至少一個納什均衡,若是無限博弈則不一定。 六、混合戰(zhàn)略納什均衡社會福利博弈 23, 3-1, 1-1, 00,流浪流浪漢政府救濟不救濟尋找工作沒有一個戰(zhàn)略組合構成納什均衡六、混合戰(zhàn)略納什均衡 1-1, -11, -11, 1-1,反面正面反面正面猜謎游戲v兩個兒童各拿一枚硬幣,v若同時正面朝上或朝下,A給B 1分錢,v若只有一面朝上,B給A 1分錢。零和
21、博弈博弈參與者有輸有贏,但結(jié)果永遠是0。沒有一個戰(zhàn)略組合構成納什均衡六、混合戰(zhàn)略納什均衡警察與小偷銀行酒館警察小偷2萬元1萬元東邊西邊警察與小偷的最優(yōu)策略各是什么?六、混合戰(zhàn)略納什均衡上述博弈的特征是:在這類博弈中,都不存在純納什均衡。參與人的支付取決于其他參與人的戰(zhàn)略;以某種概率分布隨機地選擇不同的行動每個參與人都想猜透對方的戰(zhàn)略,而每個參與人又不愿意讓對方猜透自己的戰(zhàn)略。這種博弈的類型是什么?如何找到均衡?六、混合戰(zhàn)略納什均衡請舉一些這樣的例子:石頭、剪子、布游戲老虎、杠子、雞、蟲子游戲撲克游戲橄欖球賽戰(zhàn)爭中 1-1, -11, -22, 2-2,西邊東邊西邊東邊六、混合戰(zhàn)略納什均衡警察抽
22、簽決定去銀行還是酒館,2/3的機會去銀行,1/3的機會去酒館;同樣,小偷也抽簽決定去銀行還是酒館, 2/3的機會去酒館, 1/3的機會去銀行。六、混合戰(zhàn)略納什均衡n社會福利博弈 23, 3-1, 1-1, 00,流浪流浪漢政府救濟不救濟尋找工作設:政府救濟的概率:1/2 ;不救濟的概率:1/2。流浪漢:尋找工作的期望效用:1/22+1/2 1=1.5 流浪的期望效用: 1/23+1/2 0=1.5因此,流浪漢的任何一種戰(zhàn)略都是都是對政府混合戰(zhàn)略的最優(yōu)反應六、混合戰(zhàn)略納什均衡n社會福利博弈 23, 3-1, 1-1, 00,流浪流浪漢政府救濟不救濟尋找工作設:政府救濟的概率:1/2 ;不救濟的概
23、率:1/2。流浪漢:尋找工作的概率:0. 2;流浪的概率:0.8每個參與人的戰(zhàn)略都是給定對方混合戰(zhàn)略時的最優(yōu)戰(zhàn)略六、混合戰(zhàn)略納什均衡 1-1, -11, -11, 1-1,反面正面反面正面猜謎游戲v兩個小孩的最優(yōu)策略是采取每個策略的可能性均為1/2;v每個小孩各取策略的1/2是納什均衡。零和博弈六、混合戰(zhàn)略納什均衡n請舉一些這樣的例子:石頭、剪子、布游戲老虎、杠子、雞、蟲子游戲撲克游戲橄欖球賽戰(zhàn)爭中這樣的博弈的均衡是混合戰(zhàn)略納什均衡六、混合戰(zhàn)略納什均衡 戰(zhàn)略:參與人在給定信息集的情況下選擇行動的規(guī)則,戰(zhàn)略:參與人在給定信息集的情況下選擇行動的規(guī)則,它規(guī)定參與人在什么情況下選擇什么行動,是參與人
24、它規(guī)定參與人在什么情況下選擇什么行動,是參與人的的“相機行動方案相機行動方案”。v 純戰(zhàn)略:如果一個戰(zhàn)略規(guī)定參與人在每一個給定的信純戰(zhàn)略:如果一個戰(zhàn)略規(guī)定參與人在每一個給定的信 息情況下息情況下只選擇一種特定只選擇一種特定的行動,該戰(zhàn)略為的行動,該戰(zhàn)略為 純戰(zhàn)略純戰(zhàn)略。v 混合戰(zhàn)略:如果一個戰(zhàn)略規(guī)定參與人在給定信息情況混合戰(zhàn)略:如果一個戰(zhàn)略規(guī)定參與人在給定信息情況 下下以某種概率分布隨機地選擇不同的行動以某種概率分布隨機地選擇不同的行動, 則該戰(zhàn)略為混合戰(zhàn)略。則該戰(zhàn)略為混合戰(zhàn)略。六、 混合戰(zhàn)略納什均衡kikikikikikikiiikiinnKksisissSKiuuuSSSGn1112121
25、1101,。,的概率,對于所有的選擇是)(的一個混合戰(zhàn)略,這里稱為,那么,概率分布個純戰(zhàn)略:有假定參與人中,;,表述:個參與人博弈的戰(zhàn)略式在v混合戰(zhàn)略:如果一個戰(zhàn)略規(guī)定參與人在給定信息情況混合戰(zhàn)略:如果一個戰(zhàn)略規(guī)定參與人在給定信息情況 下下以某種概率分布隨機地選擇不同的行動以某種概率分布隨機地選擇不同的行動, 則該戰(zhàn)略為混合戰(zhàn)略。則該戰(zhàn)略為混合戰(zhàn)略。六、混合戰(zhàn)略納什均衡純戰(zhàn)略可以理解為混合戰(zhàn)略的特例,即在諸多戰(zhàn)略中,選該純戰(zhàn)略si的概率為1,選其他純戰(zhàn)略的概率為0。5,14,49,-10,0等待小豬大豬按等待按 1-1, -11, -11, 1-1,反面正面反面正面六、混合戰(zhàn)略納什均衡如何尋找
26、混合戰(zhàn)略納什均衡?支付最大化法支付等值法由于混合戰(zhàn)略伴隨的是支付的不確定性,因此參與人關心的是其期望效用。最優(yōu)混合戰(zhàn)略:是指使期望效用函數(shù)最大的混合戰(zhàn)略(給定對方的混合戰(zhàn)略)在兩人博弈里,混合戰(zhàn)略納什均衡是兩個參與人的最優(yōu)混合戰(zhàn)略的組合。六、混合戰(zhàn)略納什均衡:支付最大化法 23, 3-1, 1-1, 00,流浪流浪漢政府救濟不救濟尋找工作2 . 00151510111311*故化的一階條件:求微分,得到政府最優(yōu))()()()(),(:政府的期望效用函數(shù)為)。,(流浪漢的混合戰(zhàn)略是);,(假定政府的混合戰(zhàn)略是GLGLGvv即:流浪漢以0.2的概率選擇尋找工作,0.8的概率選擇游蕩同樣,可以根據(jù)流
27、浪漢的期望效用函數(shù)找到政府的最優(yōu)混合戰(zhàn)略。?六、混合戰(zhàn)略納什均衡:支付等值法假定最優(yōu)混合戰(zhàn)略存在,給定流浪漢選擇混合戰(zhàn)略(r,1- r),政府選擇純戰(zhàn)略救濟的期望效用為: 3r+(-1)(1-r)=4r-1選擇純戰(zhàn)略不救濟的效用為:-1r+0(1-r)=-r如果一個混合戰(zhàn)略(而不是純戰(zhàn)略)是政府的最優(yōu)選擇,一定意味著政府在救濟與不救濟之間是無差異的。 4r-1=-r r=0.2 23, 3-1, 1-1, 00,流浪流浪漢政府救濟不救濟尋找工作六、混合戰(zhàn)略納什均衡對 的解釋:如果流浪漢以找工作的概率小于0.2, 則政府選擇不救濟,如果大于0.2,政府選擇救濟 ,只有當概率等于0.2時,政府才會
28、選擇混合戰(zhàn)略或任何純戰(zhàn)略.對 *= 0.5的解釋如果政府救濟的概率大于0.5,流浪漢的最優(yōu)選擇是流浪,如果政府救濟的概率小于0.5,流浪漢的最優(yōu)選擇是尋找工作.2 . 0* 六、混合戰(zhàn)略納什均衡混合戰(zhàn)略納什均衡的含義:納什均衡要求每個參與人的混合戰(zhàn)略是給定對方的混合戰(zhàn)略下的最優(yōu)選擇。因此在社會福利博弈中, , *=0.5 是唯一的混合戰(zhàn)略納什均衡。從反面來說,如果政府認為流浪漢選擇尋找工作的概率嚴格小于0.2,那么政府的唯一最優(yōu)選擇是純戰(zhàn)略:不救濟;如果政府以1的概率選擇不救濟,流浪漢的最優(yōu)選擇是尋找工作,這又將導致政府選擇救濟的戰(zhàn)略,流浪漢則選擇游蕩。如此等等。2 . 0* 流浪漢尋找工作的
29、概率小于0.2政府概率為1:不救濟流浪漢尋找工作政府救濟六、混合戰(zhàn)略納什均衡 1-1, -11, -11, 1-1,反面正面反面正面用上述方法:求該猜謎游戲的混合戰(zhàn)略納什均衡六、混合戰(zhàn)略納什均衡練習:模型化下述劃拳博弈:兩個老朋友在一起喝酒,每個人有四個純戰(zhàn)略:杠子、老虎、雞和蟲子,輸贏規(guī)則是:杠子降雞,雞吃蟲子,蟲子降杠子,兩人同時出令。如果一個打敗另一個,贏的效用為1,輸?shù)男в脼?1,否則效用為0,寫出這個博弈的支付矩陣,這個博弈有純戰(zhàn)略均衡嗎?計算其混合戰(zhàn)略納什均衡。59第二節(jié)第二節(jié) 完全信息動態(tài)博弈完全信息動態(tài)博弈一、完全信息動態(tài)博弈定義一、完全信息動態(tài)博弈定義 完全信息動態(tài)博弈指的是
30、各博弈方先完全信息動態(tài)博弈指的是各博弈方先后行動,后行動者知道先行動者的具體后行動,后行動者知道先行動者的具體行動是什么且各博弈方對博弈中各種策行動是什么且各博弈方對博弈中各種策略組合情況下所有參與人相應的得益都略組合情況下所有參與人相應的得益都完全了解的博弈完全了解的博弈. .第二節(jié) 完全信息動態(tài)搏弈 -子博弈精煉納什均衡n 一 博弈擴展式表述n 二 子博弈精練納什均衡n 三 應用舉例博弈的戰(zhàn)略表述案例- 房地產(chǎn)開發(fā)項目-假設有A、B兩家開發(fā)商市場需求:可能大,也可能小投入:1億v假定市場上有兩棟樓出售:需求大時,每棟售價1.4億,需求小時,售價7千萬;v如果市場上只有一棟樓需求大時,可賣1
31、.8億需求小時,可賣1.1億博弈戰(zhàn)略表述40004000,4000400080008000,0 00 0,800080000 0,0 0不開發(fā)開發(fā)商A開發(fā)不開發(fā)開發(fā)-3000-3000,-3000-300010001000,0 00 0,100010000 0,0 0不開發(fā)開發(fā)商B開發(fā)商A開發(fā)不開發(fā)開發(fā)開發(fā)商B需求小的情況需求小的情況需求大的情況需求大的情況博弈的戰(zhàn)略式表述一 博弈擴展式表述博弈的擴展式表述包括三個要素:參與人集合每個參與人的戰(zhàn)略集合由戰(zhàn)略組合決定的每個參與人的支付進入者進入不進入(0,300)在位者市場進入阻撓博弈樹不可置信威脅合作(40,50)斗爭(-10,0)A開發(fā)不開發(fā)
32、NN大小1/21/2大小1/21/2BBBB開發(fā)不開發(fā)開發(fā)不開發(fā)開發(fā)不開發(fā)開發(fā)不開發(fā)(4,4)(8,0)(-3,-3)(1,0)(0,8)(0,0)(0,1)(0,0)參與人(A,B,N)戰(zhàn)略支付參與人集合參與人行動順序參與人的行動空間參與人的信息集參與人的支付函數(shù)外生事件的概率分布房地產(chǎn)開發(fā)博弈結(jié),決策結(jié)結(jié),終點結(jié)枝結(jié),初始結(jié) 信息集一 博弈擴展式表述博弈的基本構造l結(jié): 包括決策結(jié)和終點結(jié)兩類;決策結(jié)是參與人行動的始點,終點結(jié)是決策人行動的終點.結(jié)滿足傳遞性和非對稱性x之前的所有結(jié)的集合,稱為x的前列集P(x),x之后的所有結(jié)的集合稱為x的后續(xù)集T(x)。l枝: 枝是從一個決策結(jié)到它的直接
33、后續(xù)結(jié)的連線,每一個枝代表參與人的一個行動選擇.l信息集: 每個信息集是決策結(jié)集合的一個子集,該子集包括所有滿足下列條件的決策結(jié):1 每個決策結(jié)都是同一個參與人的決策結(jié);2 該參與人知道博弈進入該集合的某個決策結(jié),但不知道自己究竟處于哪一個決策結(jié).A開發(fā)不開發(fā)NN大小1/21/2大小1/21/2BBBB開發(fā)不開發(fā)開發(fā)不開發(fā)開發(fā)不開發(fā)開發(fā)不開發(fā)(4,4)(8,0)(-3,-3)(1,0)(0,8)(0,0)(0,1)(0,0) B在決策時不確切地知道自然的選擇; B的決策結(jié)由4個變?yōu)?個房地產(chǎn)開發(fā)博弈A開發(fā)不開發(fā)NN大小1/21/2大小1/21/2BBBB開發(fā)不開發(fā)開發(fā)不開發(fā)開發(fā)不開發(fā)開發(fā)不開發(fā)
34、(4,4)(8,0)(-3,-3)(1,0)(0,8)(0,0)(0,1)(0,0) B知道自然的選擇;但不知道A的選擇(或A、B同時決策) 房地產(chǎn)開發(fā)博弈一 博弈擴展式表述只包含一個決策結(jié)的信息集稱為單結(jié)信息集,如果博弈樹的所有信息都是單結(jié)的,該博弈稱為完美信息博弈。自然總是假定是單結(jié)的,因為自然在參與人決策之后行動等價于自然在參與人之前行動但參與人不能觀測到自然的行動。不同的博弈樹可以代表相同的博弈,但是有一個基本規(guī)則:一個參與人在決策之前知道的事情,必須出現(xiàn)在該參與人決策結(jié)之前。AB坦白抵賴BBAA坦白抵賴坦白抵賴(-8,-8)(0,-10)(-10,0) (-1,-1)坦白抵賴坦白抵賴
35、坦白抵賴(-8,-8)(0,-10) (-10,0)(-1,-1)囚徒困境博弈的擴展式表述囚徒困境博弈的擴展式表述智豬博弈的擴展式表述?5,14,49,-10,0等待小豬大豬按等待按案例2-智豬博弈第二節(jié) 完全信息動態(tài)搏弈 -子博弈精煉納什均衡n 博弈擴展式表述n 子博弈精練納什均衡擴展式表述博弈的納什均衡子博弈精練納什均衡用逆向歸納法求子搏弈精練納什均衡承諾行動與子搏弈精練納什均衡逆向歸納法與子搏弈精練納什均衡的存在問題n 應用舉例完全信息動態(tài)博弈-子博弈精練納什均衡澤爾騰(1965)考慮下列問題:一個博弈可能有多個(甚至無窮多個)納什均衡,究竟哪個更合理?納什均衡假定每一個參與人在選擇自己
36、的最優(yōu)戰(zhàn)略時假定所有其他參與人的戰(zhàn)略是給定的,但是如果參與人的行動有先有后,后行動者的選擇空間依賴于前行動者的選擇,前行動者在選擇時不可能不考慮自己的行動對后行動者的影響。子博弈精練納什均衡的一個重要改進是將“合理納什均衡”與“不合理納什均衡”分開。完全信息動態(tài)博弈-子博弈精練納什均衡(舉例)澤爾騰(1965)進入者進入不進入(0,300)在位者合作(40,50)斗爭(-10,0)市場進入阻撓博弈樹特點:剔除博弈中包含的不可置信威脅。 承諾行動-破釜沉舟-背水一戰(zhàn)v給定進入者進入,剔除(進入,斗爭),(進入,默許)是唯一的子博弈精練納什均衡-舉例(結(jié)婚-反對)不可置信威脅支付函數(shù)行動二 子博弈
37、精練納什均衡一個納什均衡稱為精練納什均衡,當只當參與人的戰(zhàn)略在每個子博弈中都構成納什均衡,也就是說,組成精練納什均衡的戰(zhàn)略必須在每一個子博弈中都是最優(yōu)的。一個精練納什均衡首先必須是一個納什均衡,但納什均衡不一定是精練納什均衡。承諾行動-當事人使自己的威脅戰(zhàn)略變得可置信的行動。完全信息動態(tài)博弈-子博弈精練納什均衡澤爾騰(1965)澤爾騰引入子博弈精練納什均衡的概念的目的是將那些不可置信威脅戰(zhàn)略的納什均衡從均衡中剔除,從而給出動態(tài)博弈的一個合理的預測結(jié)果,簡單說,子博弈精練納什均衡要求均衡戰(zhàn)略的行為規(guī)則在每一個信息集上是最優(yōu)的。完全信息動態(tài)博弈-子博弈精練納什均衡澤爾騰(1965) 曹操與袁紹的倉
38、亭之戰(zhàn),曹操召集將領來獻破袁之策,程昱獻了十面埋伏之計,他讓曹操退軍河上,誘袁前來追擊,到那時“我軍無退路,必將死戰(zhàn),可退袁矣”。 曹操采納此計,令許褚誘袁軍軍至河上,曹軍無退路,操大呼曰:“前無去路,諸軍何不死戰(zhàn)!”,眾軍奮力回頭反擊,袁軍大敗。擴展式表述博弈的納什均衡足球男足球芭蕾女女芭蕾足球芭蕾(1,2)(-1,-1)(0,0)(2,1)xx男的策略:足球,芭蕾選擇足球;還是選擇芭蕾。女的策略:(足球,芭蕾),(芭蕾,足球)(芭蕾,芭蕾),(足球,足球)1、追隨策略:他選擇什么,我就選擇什么2、對抗策略:他選擇什么,我就偏不選什么3、芭蕾策略:不管他選什么,我都選芭蕾;4、足球策略:不管
39、他選什么,我都選足球。策略即:如果他選擇什么,我就怎樣行動的相機行動方案。在擴展式博弈里,參與人是相機行事,即“等待”博弈到達一個自己的信息集(包含一個或多個決策結(jié)后,再采取行動方案。o什么是動態(tài)博弈?擴展式表述博弈的納什均衡若A先行動,B在知道A的行動后行動,則A有一個信息集,兩個可選擇的行動,戰(zhàn)略空間為:(:(開發(fā),不開發(fā))開發(fā),不開發(fā));B有兩個信息集,四個可選擇的行動,B有四個純戰(zhàn)略:開發(fā)策略:不論開發(fā)策略:不論A A開發(fā)不開發(fā),我開發(fā)開發(fā)不開發(fā),我開發(fā);追隨策略:追隨策略:A A開發(fā)我開發(fā),開發(fā)我開發(fā),A A不開發(fā)我不開發(fā);不開發(fā)我不開發(fā);對抗策略:對抗策略:A A開發(fā)我不開發(fā),開發(fā)
40、我不開發(fā),A A不開發(fā)我開發(fā);不開發(fā)我開發(fā);不開發(fā)策略不論不開發(fā)策略不論A A開發(fā)不開發(fā)我不開發(fā)開發(fā)不開發(fā)我不開發(fā),簡寫為:簡寫為:(開發(fā),開發(fā)),(開發(fā),不開發(fā)),(開發(fā),開發(fā)),(開發(fā),不開發(fā)),(不開發(fā),開發(fā)),(不開發(fā),不開發(fā))不開發(fā),開發(fā)),(不開發(fā),不開發(fā)),括號內(nèi)的第一個元素對應A選擇“開發(fā)”時B的選擇,第二個元素對應A選擇“不開發(fā)”時B的選擇。A開發(fā)不開發(fā)BB開發(fā)不開發(fā)開發(fā)(-3,-3)(1,0)(0,1)(0,0)不開發(fā)xx什么是參與人什么是參與人的戰(zhàn)略?的戰(zhàn)略?擴展式擴展式-3, -3-3, -31, 01, 00, 10, 00, 10, 0開發(fā),開發(fā)開發(fā),不開發(fā)不開發(fā),
41、 開發(fā)不開發(fā),不開發(fā)開發(fā)不開發(fā)開發(fā)商開發(fā)商B B開發(fā)商開發(fā)商A A戰(zhàn)略式戰(zhàn)略式A開發(fā)不開發(fā)BB開發(fā)不開發(fā)開發(fā)(-3,-3)(1,0)(0,1)(0,0)不開發(fā)xx納什均衡與均衡結(jié)果:納什均衡與均衡結(jié)果:存在三個純戰(zhàn)略納什均衡:存在三個純戰(zhàn)略納什均衡: ( (不開發(fā),(開發(fā),開發(fā)),不開發(fā),(開發(fā),開發(fā)),(開發(fā),(不開發(fā),開發(fā)),(開發(fā),(不開發(fā),開發(fā)),(開發(fā)(開發(fā), ,(不開發(fā),不開發(fā))(不開發(fā),不開發(fā))兩個均衡結(jié)果:兩個均衡結(jié)果: (開發(fā),不開發(fā))(開發(fā),不開發(fā)) (不開發(fā),開發(fā))(不開發(fā),開發(fā))注意:均衡不同于均衡結(jié)果注意:均衡不同于均衡結(jié)果擴展式擴展式-3, -3-3, -31, 0
42、1, 00, 10, 00, 10, 0開發(fā),開發(fā)開發(fā),不開發(fā)不開發(fā), 開發(fā)不開發(fā),不開發(fā)開發(fā)不開發(fā)開發(fā)商開發(fā)商B B開發(fā)商開發(fā)商A A戰(zhàn)略式戰(zhàn)略式A開發(fā)不開發(fā)BB開發(fā)不開發(fā)開發(fā)(-3,-3)(1,0)(0,1)(0,0)不開發(fā)xx路徑路徑在擴展式博弈中,所有在擴展式博弈中,所有n n個參與人個參與人的一個純戰(zhàn)略組合決定了博弈樹的一個純戰(zhàn)略組合決定了博弈樹上的一個路徑。上的一個路徑。(開發(fā),(開發(fā), 不開發(fā),開發(fā)不開發(fā),開發(fā) )決定)決定了博弈的路徑為了博弈的路徑為A A開發(fā)開發(fā)B B不不開發(fā)開發(fā)-(1 1,0 0)(不開發(fā),(不開發(fā), 開發(fā),開發(fā)開發(fā),開發(fā) )決定)決定了路徑:?了路徑:?第
43、二節(jié) 完全信息動態(tài)搏弈 -子博弈精煉納什均衡n 博弈擴展式表述n 子博弈精練納什均衡擴展式表述博弈的納什均衡子博弈精練納什均衡用逆向歸納法求子搏弈精練納什均衡承諾行動與子搏弈精練納什均衡逆向歸納法與子搏弈精練納什均衡的存在問題n 應用舉例子博弈精煉納什均衡澤爾騰引入子博弈精練納什均衡的概念的目的是將那些不可置信威脅戰(zhàn)略的納什均衡從均衡中剔除,從而給出動態(tài)博弈的一個合理的預測結(jié)果,簡單說,子博弈精練納什均衡要求均衡戰(zhàn)略的行為規(guī)則在每一個信息集上是最優(yōu)的。子博弈精煉納什均衡-不可置信威脅美國普林斯頓大學古爾教授在1997年的經(jīng)濟學透視里發(fā)表文章,提出一個例子說明威脅的可信性問題:兩兄弟老是為玩具吵
44、架,哥哥老是要搶弟弟的玩具,不耐煩的父親宣布政策:好好去玩,不要吵我,不管你們誰向我告狀,我都把你們兩個關起來,關起來比沒有玩具更可怕?,F(xiàn)在,哥哥又把弟弟的玩具搶去玩了,弟弟沒有辦法,只好說:快把玩具還我,不然我就要去告訴爸爸。哥哥想,你真要告訴爸爸,我是要倒霉的,可是你不告狀不過沒有玩具玩,而告了狀卻要被關禁閉,告狀會使你的境遇變得更壞,所以你不會告狀,因此哥哥對弟弟的警告置之不理。的確,如果弟弟是會算計自己利益的理性人,在這樣的環(huán)境下,還是不告狀的好??梢姡艿苁抢硇匀?,他的告狀威脅是不可置信的。子博弈精練納什均衡A開發(fā)不開發(fā)BB開發(fā)不開發(fā)開發(fā)(-3,-3)(1,0)(0,1)(0,0)不
45、開發(fā)( (不開發(fā),(開發(fā),開發(fā)),(開發(fā),(不開發(fā),開發(fā)),(開發(fā)不開發(fā),(開發(fā),開發(fā)),(開發(fā),(不開發(fā),開發(fā)),(開發(fā), ,(不開發(fā),不開發(fā))(不開發(fā),不開發(fā)) 如果如果A A選擇開發(fā),選擇開發(fā),B B的最優(yōu)選擇是不開發(fā),如果的最優(yōu)選擇是不開發(fā),如果A A選擇不開發(fā),選擇不開發(fā),B B的最優(yōu)選擇是開發(fā),的最優(yōu)選擇是開發(fā),A A預預測到自己的選擇對測到自己的選擇對B B的影響,因此開發(fā)是的影響,因此開發(fā)是A A的最優(yōu)選擇。子博弈精練納什均衡結(jié)果是:的最優(yōu)選擇。子博弈精練納什均衡結(jié)果是:A A選擇選擇開發(fā),開發(fā),B B選擇不開發(fā)。選擇不開發(fā)。xx 對于對于( (不開發(fā),(開發(fā),開發(fā)),不開發(fā),
46、(開發(fā),開發(fā)),這個組合之所以構成納什均衡,是因這個組合之所以構成納什均衡,是因為為B B威脅不論威脅不論A A開發(fā)還是不開發(fā),他都開發(fā)還是不開發(fā),他都將選擇開發(fā),將選擇開發(fā),A A相信了相信了B B的威脅,不開的威脅,不開發(fā)是最優(yōu)選擇,但是發(fā)是最優(yōu)選擇,但是A A為什么要相信為什么要相信B B的威脅呢?的威脅呢? 畢竟,如果畢竟,如果A A真開發(fā),真開發(fā),B B選擇開發(fā)選擇開發(fā)得得-3-3,不開發(fā)得,不開發(fā)得0 0,所以,所以B B的最優(yōu)選擇的最優(yōu)選擇是不開發(fā)。如果是不開發(fā)。如果A A知道知道B B是理性的,是理性的,A A將選擇開發(fā),逼迫將選擇開發(fā),逼迫B B選擇不開發(fā)。自選擇不開發(fā)。自己
47、得己得1 1,B B得得0 0,即納什均衡,即納什均衡( (不開發(fā),不開發(fā),(開發(fā),開發(fā))是不可置信的。因(開發(fā),開發(fā))是不可置信的。因為它依賴于為它依賴于B B的一個不可置信的威脅。的一個不可置信的威脅。 同樣:同樣: (不開發(fā),不開發(fā))也是一(不開發(fā),不開發(fā))也是一個不可置信威脅,納什均衡(開發(fā)個不可置信威脅,納什均衡(開發(fā), ,(不(不開發(fā),不開發(fā))是不合理的。開發(fā),不開發(fā))是不合理的。子博弈精練納什均衡澤爾騰引入子博弈精練納什均衡的概念的目的是將那些不可置信威脅戰(zhàn)略的納什均衡從均衡中剔除,從而給出動態(tài)博弈的一個合理的預測結(jié)果,簡單說,子博弈精練納什均衡要求均衡戰(zhàn)略的行為規(guī)則在每一個信息
48、集上是最優(yōu)的。什么是子博弈,什么是子博弈精練納什均衡?有沒有更好的方法找到子博弈精練納什均衡?完全信息動態(tài)博弈-子博弈精練納什均衡澤爾騰(1965)子博弈:一個擴展式表示博弈的子博弈G是由一個單結(jié)信息集x開始的與所有該決策結(jié)的后續(xù)結(jié)(包括終點結(jié))組成的能自成一個博弈的原博弈的一部分。 (1)子博弈必須從一個單結(jié)信息點開始:只有決策者在原博弈中確切地知道博弈進入一個特定的決策結(jié)時,該決策結(jié)才能作為一個子博弈的初始結(jié)。如果信息集包含兩個以上的決策結(jié),則這兩個都不可以作為子博弈的初始結(jié)(見下頁)。(2)子博弈的信息集和支付向量都直接繼承自原博弈,即當x和x在原博弈中屬于同一信息集時,他們在子博弈中才
49、屬于同一信息集。習慣上,任何博弈的本身稱為自身的一個子博弈。A開發(fā)不開發(fā)XX大小1/21/2大小1/21/2BBBB開發(fā)不開發(fā)開發(fā)不開發(fā)開發(fā)不開發(fā)開發(fā)不開發(fā)(4,4)(8,0)(-3,-3)(1,0)(0,8)(0,0)(0,1)(0,0) 參與人X的信息集不能開始一個子博弈,否則的話,參與人B的信息將被切割。完全信息動態(tài)博弈-子博弈精練納什均衡澤爾騰(1965)不開發(fā)A開發(fā)不開發(fā)BB開發(fā)不開發(fā)開發(fā)(1,0)(0,1)(0,0)(-3,-3)xx不開發(fā)開發(fā)不開發(fā)(1,0)(-3,-3)x開發(fā)(0,1)(0,0)x子博弈I子博弈II房地產(chǎn)開發(fā)博弈A坦白抵賴BB坦白抵賴坦白(-8,-8)(0,-1
50、0)(-10,0) (-1,-1)找出房地產(chǎn)開發(fā)博弈的子博弈找出房地產(chǎn)開發(fā)博弈的子博弈( (不開發(fā),(開發(fā),開發(fā)),(開發(fā),(不開發(fā),開發(fā)),(開發(fā)不開發(fā),(開發(fā),開發(fā)),(開發(fā),(不開發(fā),開發(fā)),(開發(fā), ,(不開發(fā),不開發(fā))(不開發(fā),不開發(fā))完全信息動態(tài)博弈-子博弈精練納什均衡澤爾騰(1965)子博弈精練納什均衡: 擴展式博弈的戰(zhàn)略組合是一個子博弈精練納什均衡,如果:(1)它是原博弈的納什均衡;(2)它在每一個子博弈上都是納什均衡。A開發(fā)不開發(fā)BB開發(fā)不開發(fā)開發(fā)(1,0)(0,1)(0,0)(-3,-3)xx房地產(chǎn)開發(fā)博弈開發(fā)不開發(fā)(1,0)(-3,-3)x開發(fā)(0,1)(0,0)x子博弈
51、I子博弈II(不開發(fā),(開發(fā),開發(fā)),(開發(fā),(不開發(fā),開發(fā)),(開發(fā),(不開發(fā),不開發(fā))在c上構成均衡,在b上不構成; 在b和c上都構成 在c上不構成均衡,在b上構成完全信息動態(tài)博弈-子博弈精練納什均衡澤爾騰(1965)不開發(fā) 判斷下列均衡結(jié)果哪個構成子博弈精練納什均衡?不開發(fā)bc完全信息動態(tài)博弈-子博弈精練納什均衡澤爾騰(1965)戰(zhàn)略是參與人行動規(guī)則的完備描述,它要告訴參與人在每一種可預見的情況下(即每一個決策結(jié))上選擇什么行動,即使這種情況實際上沒有發(fā)生(甚至參與人并不預期它會發(fā)生)。因此,只有當一個戰(zhàn)略規(guī)定的行動規(guī)則在所有可能的情況下都是最優(yōu)的,它才是一個合理的可置信的戰(zhàn)略,子博弈精
52、練納什均衡就是要剔除那些只在特定情況下是合理的而在其他情況下不合理的行動規(guī)則。第三節(jié) 完全信息動態(tài)搏弈 -子博弈精煉納什均衡n 一 博弈擴展式表述n 二 子博弈精練納什均衡擴展式表述博弈的納什均衡子博弈精練納什均衡用逆向歸納法求子搏弈精練納什均衡承諾行動與子搏弈精練納什均衡逆向歸納法與子搏弈精練納什均衡的存在問題n 三 應用舉例用逆向歸納法求-子博弈精練納什均衡逆向歸納法就是從動態(tài)博弈的最后一個階段或最逆向歸納法就是從動態(tài)博弈的最后一個階段或最后一個子博弈開始,逐步向前倒推以求解動態(tài)博弈后一個子博弈開始,逐步向前倒推以求解動態(tài)博弈的方法。的方法。完全信息動態(tài)博弈-子博弈精練納什均衡澤爾騰(19
53、65)用逆向歸納法求子博弈精練納什均衡 對于有限完美信息博弈,逆向歸納法求解子博弈精練納什均衡是一個最簡便的方法。A開發(fā)不開發(fā)BB開發(fā)不開發(fā)開發(fā)(1,0)(0,1)(0,0)(-3,-3)xx房地產(chǎn)開發(fā)博弈完全信息動態(tài)博弈-子博弈精練納什均衡澤爾騰(1965)1UDL(1,1)22,0RU(3,0)(0,2)2D 子博弈精練納什均衡(U,U),L). U和L分別是參與人1和參與人2在非均衡路徑上的選擇。 逆向歸納法求解子博弈精練納什均衡的過程,實質(zhì)上是重復剔除劣戰(zhàn)略的過程:從最后一個決策結(jié)依次剔除每個子博弈的劣戰(zhàn)略,最后生存下來的戰(zhàn)略構成精練納什均衡。完全信息動態(tài)博弈-子博弈精練納什均衡澤爾騰(1965)用逆向歸納法求解的子博弈精練納什均衡也要求“
溫馨提示
- 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權益歸上傳用戶所有。
- 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預覽,若沒有圖紙預覽就沒有圖紙。
- 4. 未經(jīng)權益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
- 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負責。
- 6. 下載文件中如有侵權或不適當內(nèi)容,請與我們聯(lián)系,我們立即糾正。
- 7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。
最新文檔
- 現(xiàn)代辦公室空間中的綠色植物應用
- 現(xiàn)代制造園區(qū)的投資風險評估與管理
- 現(xiàn)代企業(yè)經(jīng)營中的稅務籌劃與風險管理
- 國慶節(jié)主題客堂活動方案
- 2024年春九年級化學下冊 第10單元 酸和堿 實驗活動6 酸、堿的化學性質(zhì)說課稿 (新版)新人教版
- Unit7 第2課時(說課稿)Story time三年級英語上冊同步高效課堂系列(譯林版三起·2024秋)
- 2《紅燭》《致云雀》聯(lián)讀說課稿 2024-2025學年統(tǒng)編版高中語文必修上冊
- 《4 做陽光少年》(說課稿)-2023-2024學年五年級上冊綜合實踐活動皖教版
- 2025水運工程施工監(jiān)理合同(試行)
- 2025企業(yè)聘用臨時工合同
- 城市隧道工程施工質(zhì)量驗收規(guī)范
- 2025年湖南高速鐵路職業(yè)技術學院高職單招高職單招英語2016-2024年參考題庫含答案解析
- 2025江蘇太倉水務集團招聘18人高頻重點提升(共500題)附帶答案詳解
- 2024-2025學年人教新版高二(上)英語寒假作業(yè)(五)
- 2025年八省聯(lián)考陜西高考生物試卷真題答案詳解(精校打印)
- 2025脫貧攻堅工作計劃
- 借款人解除合同通知書(2024年版)
- 《血小板及其功能》課件
- 江蘇省泰州市靖江市2024屆九年級下學期中考一模數(shù)學試卷(含答案)
- 沐足店長合同范例
- 《旅游資料翻譯》課件
評論
0/150
提交評論