博弈論的復(fù)習(xí)資料_第1頁
博弈論的復(fù)習(xí)資料_第2頁
博弈論的復(fù)習(xí)資料_第3頁
博弈論的復(fù)習(xí)資料_第4頁
博弈論的復(fù)習(xí)資料_第5頁
全文預(yù)覽已結(jié)束

下載本文檔

版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請(qǐng)進(jìn)行舉報(bào)或認(rèn)領(lǐng)

文檔簡介

1、名詞解釋:1,共同知識(shí):是指所有當(dāng)事人對(duì)該事件都知道,并且也所有當(dāng)事人都知道其他當(dāng)事人也知道這一事件,并且所有當(dāng)事人都知道所有當(dāng)事人都知道這一事件。那么該事件就是共同知識(shí)。2,先動(dòng)優(yōu)勢(shì):在序貫情侶博弈中,任何一方率先采取行動(dòng)可能得到的好處,都比他或她后行動(dòng)可能得到的好處大。這種局中人先動(dòng)得益大于后行得益的情況,叫做先動(dòng)優(yōu)勢(shì)。3,后動(dòng)優(yōu)勢(shì):后行動(dòng)的得益比先行動(dòng)的得益大的情況4,信息集:我們用一個(gè)扁橢圓形的虛線的圈,把所論局中人的若干決策節(jié)點(diǎn)罩起來,成為他的一個(gè)信息集。 單點(diǎn)集:我們把不被扁橢圓虛線罩住的每個(gè)決策節(jié)點(diǎn)也給以信息集的地位,稱為單點(diǎn)集。 觸發(fā)策略:即只要他的對(duì)手在博弈中一直采取合作策略

2、,則該局中人也會(huì)在博弈中繼續(xù)采取合作策略;但是,一旦對(duì)手在某一個(gè)階段采取背叛策略,將會(huì)觸發(fā)該局中人在往后的一段時(shí)期內(nèi)采取不合作策略,甚至永遠(yuǎn)采取不合作策略,從而對(duì)對(duì)手實(shí)施懲罰。 冷酷策略:雙方一開始的時(shí)候選擇合作,然后繼續(xù)選擇合作,直到有一方選擇背叛,從此永遠(yuǎn)選擇背叛。即任何局中人的一次性不合作將觸發(fā)永遠(yuǎn)不合作。 禮尚往來策略:開始的時(shí)候和冷酷策略一樣,即雙方從合作開始,在以后的每個(gè)階段,如果你的對(duì)手在最近的一次博弈中還是采取合作策略,則你繼續(xù)跟他合作;如果你的對(duì)手在上一階段的博弈中采取背叛策略,則你在下次的博弈中采取背叛策略懲罰他,但是如果你的對(duì)手在下一次博弈中改邪歸正,采用合作策略,則你在

3、下次繼續(xù)博弈中還是跟他合作。觸發(fā)策略是帶有獎(jiǎng)勵(lì)和懲罰措施的一種博弈機(jī)制。在這個(gè)機(jī)制中,懲罰措施是其中的關(guān)鍵。注意:(1),一個(gè)信息集罩住的必須是同一個(gè)局中人的決策點(diǎn)。 必須是同一個(gè)局中人在同一個(gè)時(shí)點(diǎn)的決策節(jié)點(diǎn)。同時(shí),即使是同一個(gè)人在同一時(shí)點(diǎn)進(jìn)行決策,也不一定構(gòu)成一個(gè)信息集,他還必須滿足:在每一個(gè)決策點(diǎn)他的行動(dòng)選擇集合必須是相同的。因?yàn)榫种腥嗽谧鲂袆?dòng)選擇時(shí)并不知道自己位于哪個(gè)決策點(diǎn),因此,他不可能做出不同的行動(dòng)選擇。簡答題:1,博弈的構(gòu)成要素: 局中人 決策主體,目的是通過選擇行動(dòng)(或策略)以最大化自己的支付(效用、得益)水平。 2)行動(dòng)參與人在博弈的某個(gè)時(shí)點(diǎn)的決策變量。3)策略策略是參與人在給

4、定信息集的情況下的行動(dòng)規(guī)則,它規(guī)定參與人在什么時(shí)候選擇什么行動(dòng)。4)信息 參與人有關(guān)博弈的知識(shí)。 完美信息是指所有參與人在博弈進(jìn)行過程的每一時(shí)刻,對(duì)所有參與人曾經(jīng)采取的決策或者行動(dòng)完全清楚。 完全信息是參與者對(duì)所有參與者的特征、策略空間及策略組合下的支付有“完全的了解”。即參與人的特征,策略空間和支付函數(shù)均為博弈各方的“共同知識(shí)”。 完全信息可以是完美的,也可是不完美的。5)支付(收益)函數(shù) 收益(支付)函數(shù):在特定的策略組合下參與人得到的確定效用水平,或是期望水平。 支付通常用矩陣來表示(一般適用于靜態(tài)博弈)。 也可以用博弈樹來表示(一般適用于動(dòng)態(tài)博弈)2,策略與行動(dòng)的區(qū)別 如果一個(gè)博弈僅僅

5、只是局中人一次性的同時(shí)行動(dòng)對(duì)局,那么每個(gè)局中人的策略就是他能采取的行動(dòng)。所以在同時(shí)決策博弈中,策略就是行動(dòng),行動(dòng)就是策略。 但是在序貫博弈中,當(dāng)局中人按決策的先后次序進(jìn)行時(shí),后行動(dòng)的局中人可以對(duì)其他局中人或他自己先前采取的行動(dòng)作出回應(yīng)。因此,設(shè)想后行動(dòng)人應(yīng)該會(huì)盤算一個(gè)完整的行動(dòng)計(jì)劃:“如果對(duì)手采取行動(dòng)A,我則采取行動(dòng)X,但如果對(duì)手采取行動(dòng)B,我將采取行動(dòng)Y”,這個(gè)完整的計(jì)劃就構(gòu)成局中人在博弈中的一個(gè)策略。行動(dòng)順序(同時(shí)決策序貫決策同時(shí)決策局中人在決策時(shí)不知道對(duì)手的決策或者行動(dòng)是什么。被稱為靜態(tài)博弈。注意: “同時(shí)”不是物理概念。先后或序貫決策行動(dòng)有先后次序,后行動(dòng)者能看到先行動(dòng)者的決策。被稱為

6、動(dòng)態(tài)博弈或序貫博弈策略策略是參與人在給定信息集的情況下的行動(dòng)規(guī)則,它規(guī)定參與人在什么時(shí)候選擇什么行動(dòng)。 純策略:如果一個(gè)策略規(guī)定參與人在一個(gè)給定的信息情況下只選擇一種特定的行動(dòng)。 混合策略:如果一個(gè)策略規(guī)定參與人在給定的信息情況下,以某種概率分布隨機(jī)地選擇不同的行動(dòng)。行動(dòng)與策略在同時(shí)決策博弈中,行動(dòng)就是策略。 但在序貫決策博弈中,行動(dòng)是指每一個(gè)決策點(diǎn)上局中人的決策變量或行動(dòng)的具體抉擇。策略就是一個(gè)完整的行動(dòng)計(jì)劃“壟斷者”的有四個(gè)純策略: 不管你怎樣,我總是容忍容忍,容忍 不管你怎樣,我總是對(duì)抗對(duì)抗,對(duì)抗 你進(jìn)我對(duì)抗,你不進(jìn)我忍對(duì)抗,容忍 你進(jìn)我忍,你不進(jìn)我對(duì)抗容忍,對(duì)抗該博弈有八種可能的策略組

7、合: ( 進(jìn)入,(上)容忍,(下)容忍 ) ( 進(jìn)入,(上)對(duì)抗,(下)對(duì)抗 ) ( 進(jìn)入,(上)對(duì)抗,(下)容忍 ) ( 進(jìn)入,(上)容忍,(下)對(duì)抗 ) ( 不進(jìn),(上)容忍,(下)容忍 ) ( 不進(jìn),(上)對(duì)抗,(下)對(duì)抗 ) ( 不進(jìn),(上)對(duì)抗,(下)容忍 ) ( 不進(jìn),(上)容忍,(下)對(duì)抗 )策略性行動(dòng)可以分為:承諾、威脅和允諾。承諾:假如輪到B要行動(dòng)時(shí),A說:“在接下來的博弈中,我將采取行動(dòng)X”,這意味著無論B此時(shí)采取什么行動(dòng),A采取X行動(dòng)是無條件的。這種策略性行動(dòng)被稱為“承諾”。威脅和允諾是一種條件依存性的策略性行動(dòng)。“如果你選擇,我會(huì)選擇”,即A所采取的行動(dòng)取決于B的行為。

8、我們稱這種行動(dòng)選擇為反映規(guī)則或反應(yīng)函數(shù)。威脅:“除非你把碗里的蔬菜吃完,否則不準(zhǔn)吃糖果!” 允諾:“如果你考試第一名,我?guī)闳サ纤鼓嵬妫 ?承諾與威脅與允諾的區(qū)別 承諾是無條件的策略性行動(dòng) 而威脅和允諾則是條件依存的策略性行動(dòng),屬于反應(yīng)函數(shù)或者反應(yīng)規(guī)則的范疇。承諾從支付上判斷有時(shí)是不可信的, 承諾可信要滿足三個(gè)條件: (1)可觀察 (2)不可逆轉(zhuǎn) (3)承諾后的收益大于不承諾前的收益 威脅一這這如果對(duì)手采取與你利益相違背的行動(dòng),他們將遭受損失。因此實(shí)施威脅的目的在于防止他人對(duì)你做出不利的事情。 允諾意味著如果對(duì)手采取對(duì)你有利的行動(dòng),他們將得到好處。因此實(shí)施允諾的目的在于引導(dǎo)他人做出一些對(duì)你有利

9、的事情,具有誘導(dǎo)功能。子博弈 1、子博弈不能從第一個(gè)階段開始,因?yàn)樵瓉淼牟┺模覆┺模┍旧聿荒芊Q為子博弈,即子博弈集合是一個(gè)真子集合。樹形博弈的子博弈 2、子博弈不能分割原來博弈(母博弈)的信息集。注:只有B,C,H是子博弈,因?yàn)镕后面有一支在紅圈以內(nèi),另外A不是。子博弈精煉納什均衡 定義:如果一個(gè)完美信息的動(dòng)態(tài)博弈中,各博弈方的策略構(gòu)成的一個(gè)策略組合滿足,在整個(gè)動(dòng)態(tài)博弈及它的所有子博弈中都構(gòu)成納什均衡,那么這個(gè)策略組合稱為該動(dòng)態(tài)博弈的一個(gè)“子博弈完美納什均衡”。 子博弈完美納什均衡能夠排除均衡策略中不可信的威脅HYPERLINK 第六章%20%20重復(fù)博弈new.ppt(HYPERLINK

10、第六章%20%20重復(fù)博弈new.ppt允諾HYPERLINK 第六章%20%20重復(fù)博弈new.ppt)HYPERLINK 第六章%20%20重復(fù)博弈new.ppt和承諾,因此是真正穩(wěn)定的。 逆推歸納法(倒推法)是求完美信息動(dòng)態(tài)博弈子博弈完美納什均衡的基本方法。 子博弈精煉納什均衡本身也是納什均衡,但卻比納什均衡更強(qiáng)的均衡概念。 子博弈精煉納什均衡能夠排除不是結(jié)果的納什均衡。例如:情侶博弈中,(足球,足球,足球)和(芭蕾,芭蕾,芭蕾)策略不是子博弈精煉納什均衡,因此不是最終的結(jié)果。圖見P179。 如果一個(gè)策略組合的某個(gè)策略成分有偏離的激勵(lì),我們可以說這個(gè)策略組合缺乏局部穩(wěn)定性,不是子博弈精煉

11、納什均衡。 子博弈完美納什均衡一定是納什均衡,但納什均衡不一定是子博弈完美納什均衡。納什均衡: 均衡:所有參與人的最優(yōu)策略的組合。在博弈達(dá)到均衡時(shí),局中每一個(gè)博弈者都不可能因?yàn)閱畏矫娓淖冏约旱牟呗远黾邮找?,于是各方為了自己利益的最大化而選擇了某種最優(yōu)策略,并與其他對(duì)手達(dá)成了某種暫時(shí)的平衡。 納什均衡:局中人單獨(dú)改變策略不會(huì)得到好處的對(duì)局策略組合?;旌喜呗约{什均衡:(?) 在靜態(tài)博弈里,純策略等價(jià)于特定的行動(dòng),混合策略是不同行動(dòng)之間的隨機(jī)選擇。在矩陣中用下劃線法,如果一個(gè)方框中有兩個(gè)數(shù)字都有下劃線,即為純策略納什均衡,有多個(gè)為混合策略納什均衡純策略納什均衡假定如果前鋒踢向球門的左方,當(dāng)守門員撲

12、向右方時(shí),前鋒將是得分的把握80% ,當(dāng)守門員撲向左方時(shí),前鋒得分的把握50%。 如果前鋒踢向球門的右方,當(dāng)守門員撲向左方時(shí),前鋒得分的把握90%,當(dāng)守門員撲向右方時(shí),前鋒得分的把握是20%。注:前鋒的得分,就為守門員的失分。 畫出這個(gè)競(jìng)爭博弈的支付矩陣,并求納什均衡. 計(jì)算得前鋒應(yīng)該按概率0.7踢向左方,而守門員應(yīng)該按概率0.6撲向左方。 這些概率使得無論對(duì)方采取什么策略,雙方都得到相等的收益。即當(dāng)前鋒選擇p=0.7時(shí),守門員撲向左方和右方無差異,即不會(huì)影響前鋒的收益,但他會(huì)樂意以0.6的概率撲向左方。同樣,當(dāng)守門員選擇q=0.6時(shí),前鋒踢向左方和右方無差異,但他會(huì)樂意以0.7的概率踢向左方

13、。 這就形成了納什均衡。給定對(duì)方的選擇,每一個(gè)參與人的選擇都是最優(yōu)的。 當(dāng)p0.7時(shí),守門員將撲向右方。類似的,當(dāng)q0.6時(shí),前鋒將踢向右方。計(jì)算題:(1)古諾模型:寡占的斯塔克爾博格模型 先后選擇產(chǎn)量的產(chǎn)量競(jìng)爭博弈 把古諾模型改為廠商1先選擇,廠商2后選擇,而非同時(shí)選擇即可。 用倒推法,因此從分析廠商2的產(chǎn)量選擇開始,再分析上一階段的廠商1的產(chǎn)量選擇。 1、先分析廠商2 假設(shè)P(Q1+Q2)=a- (Q1+Q2), MC2=MC1=c,沒有固定成本, 廠商2的利潤函數(shù)為:2=a- (Q1+Q2)Q2-cQ2 利潤最大化的一階條件為:a-Q1-2Q2-c=0 即:Q2=(a-c-Q1)/2 2

14、、再分析廠商1 由于完全信息,廠商1的利潤函數(shù)為: 1=a-(Q1+Q2)Q1-cQ1 將Q2=(a-c-Q1)/2代入上式得: 利潤最大化的一階條件為:a/2-bQ1=0。 Q1=(a-c)/2, Q2=(a-c)/4。結(jié)論: 1、該博弈領(lǐng)導(dǎo)者決定的產(chǎn)量(a-c)/2要大于追隨者的產(chǎn)量(a-c)/4 。領(lǐng)導(dǎo)者的所得的利潤也要大于追隨者的利潤,即“誰先動(dòng)誰占優(yōu)”。 2、斯塔克爾博格模型的產(chǎn)量(a-c)/2 + (a-c)/4 =3(a-c)/4要大于古諾模型的產(chǎn)量2(a-c)/3。因此,市場(chǎng)有一個(gè)領(lǐng)導(dǎo)者比各廠商勢(shì)均力敵時(shí)更好。 兩模型之間的區(qū)別: 斯塔克爾博格模型中兩個(gè)寡頭先后選擇的產(chǎn)量之和要大于古諾模型中兩個(gè)寡頭同時(shí)選擇的產(chǎn)量之和,而斯塔克爾博格模型中兩個(gè)寡頭利潤之和則小于古諾模型的兩個(gè)寡頭利潤之和。因此,市場(chǎng)有一個(gè)領(lǐng)導(dǎo)者比各廠商勢(shì)均力敵時(shí)對(duì)消費(fèi)者而言更好,因?yàn)樗顾藸柌└衲P团c古諾模型相比產(chǎn)量大了,價(jià)格低了。 斯塔克爾博格模型中博弈領(lǐng)導(dǎo)者決定的產(chǎn)量要大于追隨者的產(chǎn)量,領(lǐng)導(dǎo)者的所得的利潤也

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請(qǐng)下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請(qǐng)聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會(huì)有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫網(wǎng)僅提供信息存儲(chǔ)空間,僅對(duì)用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對(duì)用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對(duì)任何下載內(nèi)容負(fù)責(zé)。
  • 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請(qǐng)與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶因使用這些下載資源對(duì)自己和他人造成任何形式的傷害或損失。

評(píng)論

0/150

提交評(píng)論