![第5講:“開金礦”博弈:完全且完美信息動態(tài)博弈的求解_第1頁](http://file2.renrendoc.com/fileroot_temp3/2021-7/31/220c3861-e11d-4e80-9a89-b283e989b846/220c3861-e11d-4e80-9a89-b283e989b8461.gif)
![第5講:“開金礦”博弈:完全且完美信息動態(tài)博弈的求解_第2頁](http://file2.renrendoc.com/fileroot_temp3/2021-7/31/220c3861-e11d-4e80-9a89-b283e989b846/220c3861-e11d-4e80-9a89-b283e989b8462.gif)
![第5講:“開金礦”博弈:完全且完美信息動態(tài)博弈的求解_第3頁](http://file2.renrendoc.com/fileroot_temp3/2021-7/31/220c3861-e11d-4e80-9a89-b283e989b846/220c3861-e11d-4e80-9a89-b283e989b8463.gif)
![第5講:“開金礦”博弈:完全且完美信息動態(tài)博弈的求解_第4頁](http://file2.renrendoc.com/fileroot_temp3/2021-7/31/220c3861-e11d-4e80-9a89-b283e989b846/220c3861-e11d-4e80-9a89-b283e989b8464.gif)
![第5講:“開金礦”博弈:完全且完美信息動態(tài)博弈的求解_第5頁](http://file2.renrendoc.com/fileroot_temp3/2021-7/31/220c3861-e11d-4e80-9a89-b283e989b846/220c3861-e11d-4e80-9a89-b283e989b8465.gif)
版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進(jìn)行舉報(bào)或認(rèn)領(lǐng)
文檔簡介
1、第五講:“開金礦開金礦”博弈博弈 完全完全且完美信息動態(tài)博弈的求解且完美信息動態(tài)博弈的求解 1 “靜態(tài)博弈”與“動態(tài)博弈” 在靜態(tài)博弈中,所有參與人同時行動 (或者,行動有先后,但沒有人在自己 行動之前觀測到別人的行動); 在動態(tài)博弈中,參與人的行動有先后順 序,后行動者在自己行動之前能觀測到 先行動者的行動。 2 Dynamic games are the ones where the timing of decision making plays a role. 3 靜態(tài)博弈 戰(zhàn)略式表述 (Strategic Form Representation) 動態(tài)博弈 擴(kuò)展式表述 (Extensi
2、ve Form Representation) 4 戰(zhàn)略式表述 (Strategic Form Representation) (1)參與人集合; (2)每個參與人的戰(zhàn)略集合; (3)由戰(zhàn)略組合決定的每個參與人的 支付。 5 擴(kuò)展式表述 (Extensive Form Representation) 1.參與人集合; 2.參與人的行動順序(the order of moves); 3.參與人的行動空間(action set); 4.參與人的信息集(Information set); 5.參與人的支付函數(shù); 6.外生事件(自然的選擇)的概率分布。 6 博弈矩陣 兩人有限戰(zhàn)略博弈的 戰(zhàn)略式表述。
3、博弈樹 n人有限戰(zhàn)略博弈的擴(kuò) 展式表述。 7 ContentsContents 1.“1.“開金礦博弈開金礦博弈”問題的描述問題的描述 2.2.有法律保障的有法律保障的“開金礦博弈開金礦博弈” 3.3.法律保障不足的開金礦博弈法律保障不足的開金礦博弈 4.4.相機(jī)選擇與策略中的可信性問題相機(jī)選擇與策略中的可信性問題 5.5.逆推歸納法逆推歸納法 6.6.子博弈子博弈 7.7.子博弈完美納什子博弈完美納什均衡均衡 8 1.“1.“開金礦博弈開金礦博弈”問題的描述問題的描述 9 “開金礦博弈開金礦博弈”問題問題 甲在開采一價值甲在開采一價值4 4千萬元的金礦時缺千萬元的金礦時缺1 1千萬元資千萬元
4、資 金,而乙正好有金,而乙正好有1 1千萬元資金可以投資。假設(shè)千萬元資金可以投資。假設(shè) 甲想說服乙將這甲想說服乙將這1 1千萬元資金借給自己用于開千萬元資金借給自己用于開 礦,并允諾在采到金子后與乙對半分成,乙是礦,并允諾在采到金子后與乙對半分成,乙是 否該將錢借給甲呢?否該將錢借給甲呢? 假設(shè)金礦的價值是經(jīng)過權(quán)威部門探測認(rèn)定的,假設(shè)金礦的價值是經(jīng)過權(quán)威部門探測認(rèn)定的, 沒必要懷疑,則乙最需要關(guān)心的就是甲采到金沒必要懷疑,則乙最需要關(guān)心的就是甲采到金 子后是否會履行諾言跟自己平分,因?yàn)槿f一甲子后是否會履行諾言跟自己平分,因?yàn)槿f一甲 采到金子后不但不跟乙平分,而且還賴帳或卷采到金子后不但不跟乙平
5、分,而且還賴帳或卷 款潛逃,乙會連自己的本錢都收不回來??顫撎?,乙會連自己的本錢都收不回來。 10 “開金礦博弈開金礦博弈”問題問題的擴(kuò)展式表述的擴(kuò)展式表述11 乙乙 甲甲 借借不借不借 (1 1,0 0) (2 2,2 2) 分分不分不分 (0 0,4 4) 博弈樹給出了有限博弈的幾乎所 有信息。 博弈樹的基本建筑材料(basic building block): 結(jié)(node) 枝(branch) 信息集(Information set) 12 乙乙 甲甲 借借不借不借 (1 1,0 0) (2 2,2 2) 分分不分不分 (0 0,4 4) 博弈樹的基本建筑材料 (basic build
6、ing block) 結(jié)(node)包括“決策結(jié)”和“終點(diǎn)結(jié)” “決策結(jié)(decision node)”:參與人采取行動的時點(diǎn)。 “終點(diǎn)結(jié)(terminal node)”:博弈行動路徑的終點(diǎn)。 13 乙乙 甲甲 借借不借不借 (1 1,0 0) (2 2,2 2) 分分不分不分 (0 0,4 4) 博弈樹的基本建筑材料 (basic building block) 枝(branch) 在博弈樹上,“枝”是從一個決策結(jié)到它的直接后續(xù)結(jié)的連線 (有時用箭頭表述),每一個枝代表參與人的一個行動選擇。 14 乙乙 甲甲 借借不借不借 (1 1,0 0) (2 2,2 2) 分分不分不分 (0 0,4
7、4) 博弈樹的基本建筑材料 (basic building block) 信息集(Information set) 博弈樹上的所有決策結(jié)分割成不同的信息集。每個信息集是決 策結(jié)集合的一個子集,該子集包括所有滿足下列條件的決策結(jié): (1)每一個決策結(jié)都是同一參與人的決策結(jié); (2)該參與人知道博弈進(jìn)入該集合的某個決策結(jié),但不知道自己究 竟處于哪一個決策結(jié)。 15 乙乙 甲甲 借借不借不借 (1 1,0 0) (2 2,2 2) 分分不分不分 (0 0,4 4) 博弈樹的基本建筑材料 (basic building block) 信息集(Information set) 引入信息集的目的是描述下列
8、情況: 當(dāng)一個參與人要做出決策時他可能并不知道“之前”發(fā)生的所有事 情。 16 乙乙 甲甲 借借不借不借 (1 1,0 0) (2 2,2 2) 分分不分不分 (0 0,4 4) 完美信息博弈 (game of perfect information) 一個信息集可能包含多個決策結(jié),也可能包含一個決策結(jié)。 只包含一個決策結(jié)的信息集稱為“單結(jié)(singleton)信息 集”。如果博弈樹的所有信息集都是單結(jié)的,該博弈稱為 “完美信息博弈( game of perfect information )”。 完美信息博弈意味著博弈中沒有任何兩個參與人同時行動, 并且所有后行動者能確切知道前行動者選擇了什
9、么行動,所 有參與人觀測到自然的行動。 17 乙乙 甲甲 借借不借不借 (1 1,0 0) (2 2,2 2) 分分不分不分 (0 0,4 4) 分析博弈問題時的一般假設(shè) 博弈方都是以自身利益(得益)最大化 為目的,即他們不考慮道德因素,除非 能把道德因素折算成數(shù)量化的效用綜合 進(jìn)得益中。 18 乙乙 甲甲 借借不借不借 (1 1,0 0) (2 2,2 2) 分分不分不分 (0 0,4 4) “開金礦博弈開金礦博弈”問題的分析問題的分析 【結(jié)論結(jié)論】: 甲在第二階段選擇甲在第二階段選擇 “ “不分不分”; 乙在第一階段選擇乙在第一階段選擇“不借不借” ” 。 19 乙乙 甲甲 借借不借不借
10、(1 1,0 0) (2 2,2 2) 分分不分不分 (0 0,4 4) 對乙來說,對乙來說, 本博弈中甲本博弈中甲 有一個有一個“不不 可信可信”的允的允 諾。諾。 20 乙乙 甲甲 借借不借不借 (1 1,0 0) (2 2,2 2) 分分不分不分 (0 0,4 4) 信任? “什么叫信心?當(dāng)一個小孩子被父母什么叫信心?當(dāng)一個小孩子被父母 拋向空中,他在空中咯咯地笑,這就拋向空中,他在空中咯咯地笑,這就 是信心。什么叫信靠?當(dāng)一個小孩子是信心。什么叫信靠?當(dāng)一個小孩子 看到可怕的怪物,立即撲向父母的懷看到可怕的怪物,立即撲向父母的懷 中,這就是信靠。中,這就是信靠?!?21 有限博弈 如果
11、一個擴(kuò)展式表述博弈有有限個信息 集,每個信息集上參與人有有限個行動 選擇,我們說這個博弈是有限博弈。 22 乙乙 甲甲 借借不借不借 (1 1,0 0) (2 2,2 2) 分分不分不分 (0 0,4 4) 有限完美信息博弈 定理(Zermelo,1913;Kuhn, 1953):一個有限完美信息博弈有一 個純策略納什均衡。 23 乙乙 甲甲 借借不借不借 (1 1,0 0) (2 2,2 2) 分分不分不分 (0 0,4 4) 由于有不可信的允諾,使得甲、乙的合作最終成為由于有不可信的允諾,使得甲、乙的合作最終成為 不可能,這不是最佳結(jié)局不可能,這不是最佳結(jié)局。 那么那么,有沒有辦法使甲的允
12、諾變成可信的,從而使,有沒有辦法使甲的允諾變成可信的,從而使 乙愿意選擇乙愿意選擇“借借”,然后甲遵守諾言選擇,然后甲遵守諾言選擇“分分”, 最終增加雙方的利益呢?最終增加雙方的利益呢? 24 乙乙 甲甲 借借不借不借 (1 1,0 0) (2 2,2 2) 分分不分不分 (0 0,4 4) 2.2.有法律保障的有法律保障的“開金礦博弈開金礦博弈” 25 有法律保障的有法律保障的“開金礦博弈開金礦博弈” 如果讓乙在甲違約時可以用法律武器,如果讓乙在甲違約時可以用法律武器, 即即“打官司打官司”來保護(hù)自己的利益,則來保護(hù)自己的利益,則 情況會有所不同。情況會有所不同。 26 (2 2,2 2)
13、乙乙 甲甲 借借不借不借 (1 1,0 0) 分分不分不分 (0 0,4 4) 乙乙 (1 1,0 0) 打打不打不打 有法律保障的有法律保障的“開金礦博弈開金礦博弈” 分析表明,在乙的利益受到法律保障的情況下,甲分析表明,在乙的利益受到法律保障的情況下,甲 的的“分分”錢允諾變成可信的會信守的允諾。錢允諾變成可信的會信守的允諾。 27 (2 2,2 2) 乙乙 甲甲 借借不借不借 (1 1,0 0) 分分不分不分 (0 0,4 4) 乙乙 (1 1,0 0) 打打不打不打 有法律保障的有法律保障的“開金礦博弈開金礦博弈” 分析表明,在乙的利益受到法律保障的情況下,甲的分析表明,在乙的利益受到
14、法律保障的情況下,甲的 “分分”錢允諾變成可信的會信守的允諾。錢允諾變成可信的會信守的允諾。 這樣,乙第一階段選擇這樣,乙第一階段選擇“借借”就成了合理的選擇。最終就成了合理的選擇。最終 結(jié)果是乙在第一階段選擇結(jié)果是乙在第一階段選擇“借借”,甲在第二階段選擇,甲在第二階段選擇 “分分”,從而博弈結(jié)束,雙方各得,從而博弈結(jié)束,雙方各得2 2千萬元。千萬元。 28 (2 2,2 2) 乙乙 甲甲 借借不借不借 (1 1,0 0) 分分不分不分 (0 0,4 4) 乙乙 (1 1,0 0) 打打不打不打 有法律保障的有法律保障的“開金礦博弈開金礦博弈” 分析表明,在乙的利益受到法律保障的情況分析表明
15、,在乙的利益受到法律保障的情況 下,甲的下,甲的“分分”錢允諾變成可信的會信守的錢允諾變成可信的會信守的 允諾。允諾。 這樣,乙第一階段選擇這樣,乙第一階段選擇“借借”就成了合理的就成了合理的 選擇。最終結(jié)果是乙在第一階段選擇選擇。最終結(jié)果是乙在第一階段選擇“借借”, 甲在第二階段選擇甲在第二階段選擇“分分”,從而博弈結(jié)束,從而博弈結(jié)束, 雙方各得雙方各得2 2千萬元。千萬元。 此時,乙的完整策略是此時,乙的完整策略是“第一階段選擇第一階段選擇 借借,若第二階段甲選擇,若第二階段甲選擇不分不分,第三,第三 階段選擇階段選擇打打”,甲的完整策略是,甲的完整策略是“第二第二 階段選擇階段選擇分分”
16、。 29 有法律保障的有法律保障的“開金礦博弈開金礦博弈” 分析表明,在乙的利益受到法律保障的情況分析表明,在乙的利益受到法律保障的情況 下,甲的下,甲的“分分”錢允諾變成可信的會信守的錢允諾變成可信的會信守的 允諾。允諾。 這樣,乙第一階段選擇這樣,乙第一階段選擇“借借”就成了合理的就成了合理的 選擇。最終結(jié)果是乙在第一階段選擇選擇。最終結(jié)果是乙在第一階段選擇“借借”, 甲在第二階段選擇甲在第二階段選擇“分分”,從而博弈結(jié)束,從而博弈結(jié)束, 雙方各得雙方各得2 2千萬元。千萬元。 此時,乙的完整策略是此時,乙的完整策略是“第一階段選擇第一階段選擇 借借,若第二階段甲選擇,若第二階段甲選擇不分
17、不分,第三,第三 階段選擇階段選擇打打”,甲的完整策略是,甲的完整策略是“第二第二 階段選擇階段選擇分分”。 這就是這個三階段動態(tài)博弈的解。這就是這個三階段動態(tài)博弈的解。 30 31 (2 2,2 2) 乙乙 甲甲 借借不借不借 (1 1,0 0) 分分不分不分 (0 0,4 4) 乙乙 (1 1,0 0) 打打不打不打 在一個由都有私心、都重視自身利益的成員 所組成的社會中,完善公正的法律制度不但 能夠保障社會的公平,而且還能提高社會經(jīng) 濟(jì)活動的效率,是實(shí)現(xiàn)最優(yōu)效率的社會分工 合作的重要保障。 32 要充分保障社會公平和經(jīng)濟(jì)效率,法律 制度必須要滿足兩方面的要求: 一是,對守法者有足夠的保護(hù)
18、力度; 二是,對違法者有足夠的震懾作用。 33 3.3.法律保障不足的開金礦博弈法律保障不足的開金礦博弈 34 法律保障不足的開金礦法律保障不足的開金礦博弈博弈 分析表明:乙在第三階段選擇分析表明:乙在第三階段選擇“打打”官司的威脅不是官司的威脅不是 可信的,而是一種可信的,而是一種“不可信的(不可信的(incredibleincredible)” “” “空空 頭威脅(頭威脅(empty threatempty threat)”。所以乙在第一階段選擇。所以乙在第一階段選擇 “不借不借”。 35 (2 2,2 2) 乙乙 甲甲 借借不借不借 (1 1,0 0) 分分不分不分 (0 0,4 4)
19、 乙乙 (1 1,0 0) 打打不打不打 4.4.相機(jī)選擇與策略中的可信性問題相機(jī)選擇與策略中的可信性問題 36 通過開金礦博弈的幾個不同版本,我們清楚通過開金礦博弈的幾個不同版本,我們清楚 了在動態(tài)博弈中,各個博弈方的選擇和博弈了在動態(tài)博弈中,各個博弈方的選擇和博弈 的結(jié)果,與各個博弈方在各個階段選擇各種的結(jié)果,與各個博弈方在各個階段選擇各種 行為的可信程度有很大關(guān)系。行為的可信程度有很大關(guān)系。 37 可信性問題是動態(tài)博弈分析中的一個中心問題 有時候,雖然有些博弈方很想或聲稱要采取 某種行動,但是如果這些行動缺乏以經(jīng)濟(jì)利 益為基礎(chǔ)的可信性,那么這些想法或聲明最 終就不會有真正的效力,就只能落
20、空。 38 通過開金礦博弈的幾個不同版本,說通過開金礦博弈的幾個不同版本,說 明了動態(tài)博弈中的明了動態(tài)博弈中的相機(jī)選擇相機(jī)選擇引出的可引出的可 信性問題,以及可信性在動態(tài)博弈分信性問題,以及可信性在動態(tài)博弈分 析中的關(guān)鍵意義。析中的關(guān)鍵意義。 39 動態(tài)博弈中的策略動態(tài)博弈中的策略 動態(tài)博弈中博弈方的策略是他們自己動態(tài)博弈中博弈方的策略是他們自己 預(yù)先設(shè)定的,在各個博弈階段,針對預(yù)先設(shè)定的,在各個博弈階段,針對 各種情況的相應(yīng)行為選擇的計(jì)劃。各種情況的相應(yīng)行為選擇的計(jì)劃。 40 動態(tài)博弈中的動態(tài)博弈中的“相機(jī)選擇相機(jī)選擇” ” 問題問題 動態(tài)博弈中博弈方的策略實(shí)際上并沒動態(tài)博弈中博弈方的策略實(shí)
21、際上并沒 有強(qiáng)制力,而且實(shí)施起來有一個過程,有強(qiáng)制力,而且實(shí)施起來有一個過程, 因此只要符合博弈方自己的利益,他因此只要符合博弈方自己的利益,他 們完全可以在博弈過程中改變計(jì)劃。們完全可以在博弈過程中改變計(jì)劃。 我們稱這種問題為動態(tài)博弈中的我們稱這種問題為動態(tài)博弈中的“相機(jī)選相機(jī)選 擇擇”(contingent playcontingent play)問題。)問題。 41 策略中的策略中的“可信性可信性”問題問題 相機(jī)選擇的存在使得博弈方的策略中,所設(shè)相機(jī)選擇的存在使得博弈方的策略中,所設(shè) 定的各個階段、各種情況下會采取行為的定的各個階段、各種情況下會采取行為的 “可信性可信性”(credib
22、ilitycredibility)有了疑問。)有了疑問。 也就是說,各個博弈方是否會真正、始終按也就是說,各個博弈方是否會真正、始終按 照自己的策略所設(shè)定的方案行為,還是可能照自己的策略所設(shè)定的方案行為,還是可能 臨時改變自己的行動方案呢?臨時改變自己的行動方案呢? 不同版本的開金礦博弈給出了實(shí)際案例。 42 相機(jī)選擇與策略中的可信性問題相機(jī)選擇與策略中的可信性問題 由于動態(tài)博弈中博弈方的策略是多階由于動態(tài)博弈中博弈方的策略是多階 段的行動計(jì)劃,實(shí)施起來有一個過程,段的行動計(jì)劃,實(shí)施起來有一個過程, 而且又沒有強(qiáng)制力,因此博弈方完全而且又沒有強(qiáng)制力,因此博弈方完全 可以在博弈過程中改變計(jì)劃,我
23、們稱可以在博弈過程中改變計(jì)劃,我們稱 這種問題為這種問題為“相機(jī)選擇相機(jī)選擇”問題。問題。 相機(jī)選擇的存在使得動態(tài)博弈中各博相機(jī)選擇的存在使得動態(tài)博弈中各博 弈方策略設(shè)定的行為選擇的弈方策略設(shè)定的行為選擇的“可信性可信性” 有了疑問。有了疑問。 43 “破釜沉舟”完全承諾(Total commitment) 44 5.5.逆推歸納法逆推歸納法 45 逆推歸納法逆推歸納法 我們前面引入我們前面引入“可信性可信性”問題時,對不同版問題時,對不同版 本的本的“開金礦博弈開金礦博弈”問題的分析結(jié)論都是正問題的分析結(jié)論都是正 確的,對博弈方的選擇和博弈結(jié)果都做出了確的,對博弈方的選擇和博弈結(jié)果都做出了
24、正確的判斷,都排除了博弈方不可信的行為正確的判斷,都排除了博弈方不可信的行為 選擇。選擇。 之所以能做到這一點(diǎn),根本原因是采用了一之所以能做到這一點(diǎn),根本原因是采用了一 種分析動態(tài)博弈的有效方法種分析動態(tài)博弈的有效方法“逆推歸納逆推歸納 法法”(Backwards InductionBackwards Induction)。)。 這種方法的表現(xiàn)形式為:從動態(tài)博弈的最后這種方法的表現(xiàn)形式為:從動態(tài)博弈的最后 一個階段博弈方的行為開始分析,逐步倒推一個階段博弈方的行為開始分析,逐步倒推 回前一個階段相應(yīng)博弈方的行為選擇,一直回前一個階段相應(yīng)博弈方的行為選擇,一直 到第一個階段。到第一個階段。 46
25、 法律保障不足的開金礦博弈法律保障不足的開金礦博弈 第一步第一步:分析:分析第三第三 階段乙是否打官司階段乙是否打官司 的選擇,由于的選擇,由于“打打” 官司比官司比“不打不打”官官 司損失更大,他必司損失更大,他必 然會選擇然會選擇“不打不打” 官司。官司。 47 (2 2,2 2) 乙乙 甲甲 借借不借不借 (1 1,0 0) 分分不分不分 (0 0,4 4) 乙乙 (1 1,0 0) 打打不打不打 法律保障不足的開金礦博弈法律保障不足的開金礦博弈 第一步第一步:分析:分析第三階第三階 段乙是否打官司的選段乙是否打官司的選 擇,由于擇,由于“打打”官司官司 比比“不打不打”官司損失官司損失
26、 更大,他必然會選擇更大,他必然會選擇 “不打不打”官司。官司。 因此一旦博弈進(jìn)行到因此一旦博弈進(jìn)行到 這個階段,結(jié)果必然這個階段,結(jié)果必然 是乙選擇是乙選擇“不打不打”官官 司,雙方得益為(司,雙方得益為(0 0, 4 4)。 48 (2 2,2 2) 乙乙 甲甲 借借不借不借 (1 1,0 0) 分分不分不分 (0 0,4 4) 乙乙 (1 1,0 0) 打打不打不打 法律保障不足的開金礦博弈法律保障不足的開金礦博弈 第一步:分析第三階段第一步:分析第三階段 乙是否打官司的選擇,乙是否打官司的選擇, 由于由于“打打”官司比官司比“不不 打打”官司損失更大,他官司損失更大,他 必然會選擇必然
27、會選擇“不打不打”官官 司。司。 因此一旦博弈進(jìn)行到這因此一旦博弈進(jìn)行到這 個階段,結(jié)果必然是乙個階段,結(jié)果必然是乙 選擇選擇“不打不打”官司,雙官司,雙 方得益為(方得益為(0 0,4 4)。)。 所以在分析前兩個階段所以在分析前兩個階段 的博弈時,原來的三階的博弈時,原來的三階 段博弈與下頁的兩階段段博弈與下頁的兩階段 博弈是完全等價的。博弈是完全等價的。 49 (2 2,2 2) 乙乙 甲甲 借借不借不借 (1 1,0 0) 分分不分不分 (0 0,4 4) 乙乙 (1 1,0 0) 打打不打不打 法律保障不足的開金礦博弈法律保障不足的開金礦博弈 第二步:第二步:繼續(xù)繼續(xù) 對該兩階段博弈
28、對該兩階段博弈 運(yùn)用逆推歸納法,運(yùn)用逆推歸納法, 可知甲在第二階可知甲在第二階 段選擇段選擇“不分不分”, 因此博弈可進(jìn)一因此博弈可進(jìn)一 步化為下頁的等步化為下頁的等 價博弈。價博弈。 50 (2 2,2 2) 乙乙 甲甲 借借不借不借 (1 1,0 0) 分分不分不分 (0 0,4 4) 法律保障不足的開金礦博弈法律保障不足的開金礦博弈 第三步:第三步:這個等價這個等價 博弈已經(jīng)是一個單博弈已經(jīng)是一個單 人博弈了,可知乙人博弈了,可知乙 將選擇將選擇“不借不借”。 51 乙乙借借不借不借 (1 1,0 0) (0 0,4 4) 逆推歸納法 逆推歸納法事實(shí)上就是把多階段動態(tài)博 弈轉(zhuǎn)化為一系列的
29、單人博弈,通過對一 系列單人博弈的分析,確定各博弈方在 各自階段的選擇,最終對動態(tài)博弈結(jié)果 (包括,博弈的路徑、各博弈方的得益) 做出綜合判斷,歸納出各博弈方各階段 的選擇,從而得出各博弈方在整個動態(tài) 博弈中的策略。 52 逆推歸納法逆推歸納法 逆推歸納法確定的各個博弈方在各階逆推歸納法確定的各個博弈方在各階 段的選擇,都是建立在后續(xù)階段各個段的選擇,都是建立在后續(xù)階段各個 博弈方理性選擇基礎(chǔ)上的,因此自然博弈方理性選擇基礎(chǔ)上的,因此自然 排除了包含不可信的威脅或允諾的可排除了包含不可信的威脅或允諾的可 能性,因此它得出的結(jié)論是比較可靠能性,因此它得出的結(jié)論是比較可靠 的,確定的各個博弈方的策
30、略組合是的,確定的各個博弈方的策略組合是 有穩(wěn)定性的。有穩(wěn)定性的。 53 逆推歸納法 逆推歸納法是在動態(tài)博弈分析中使用得 最普遍的方法,在分析完全且完美信息 動態(tài)博弈中非常有用。 54 逆推歸納法的邏輯基礎(chǔ)逆推歸納法的邏輯基礎(chǔ) 動態(tài)博弈中先行為的理性的博弈方,在前面動態(tài)博弈中先行為的理性的博弈方,在前面 階段選擇行為時必須會先考慮后行為博弈方階段選擇行為時必須會先考慮后行為博弈方 在后面階段中將會怎樣選擇行為,只有在博在后面階段中將會怎樣選擇行為,只有在博 弈的最后一個階段選擇的,不再有后繼階段弈的最后一個階段選擇的,不再有后繼階段 牽制的博弈方,才能直接做出明確選擇。牽制的博弈方,才能直接做
31、出明確選擇。 而當(dāng)后面階段博弈方的選擇確定以后,前一而當(dāng)后面階段博弈方的選擇確定以后,前一 階段博弈方的行為也就容易確定了。階段博弈方的行為也就容易確定了。 55 逆推歸納法的一般方法逆推歸納法的一般方法 從動態(tài)博弈的最后一個階段開始分析,每一從動態(tài)博弈的最后一個階段開始分析,每一 次確定出所分析階段博弈方的選擇和路徑,次確定出所分析階段博弈方的選擇和路徑, 然后再確定前一個階段的博弈方選擇和路徑。然后再確定前一個階段的博弈方選擇和路徑。 逆推歸納到某個階段,那么這個階段及以后逆推歸納到某個階段,那么這個階段及以后 的博弈結(jié)果就可以肯定下來,該階段的選擇的博弈結(jié)果就可以肯定下來,該階段的選擇
32、節(jié)點(diǎn)等于一個結(jié)束終端。節(jié)點(diǎn)等于一個結(jié)束終端。 我們可以用不包含該階段與其后所有階段博我們可以用不包含該階段與其后所有階段博 弈的等價博弈來代替原來的博弈。弈的等價博弈來代替原來的博弈。 56 6.6.子博弈子博弈(Subgame) 子博弈是動態(tài)博弈分析中一個非常關(guān)鍵的概子博弈是動態(tài)博弈分析中一個非常關(guān)鍵的概 念,它是動態(tài)博弈中滿足一定條件的局部所念,它是動態(tài)博弈中滿足一定條件的局部所 構(gòu)成的次級博弈構(gòu)成的次級博弈。 57 子博弈(子博弈(SubgameSubgame)的定義)的定義 由一個動態(tài)博弈第一階段以外的某階由一個動態(tài)博弈第一階段以外的某階 段開始的后續(xù)博弈階段構(gòu)成的,有初段開始的后續(xù)博
33、弈階段構(gòu)成的,有初 始信息集和進(jìn)行博弈所需要的全部信始信息集和進(jìn)行博弈所需要的全部信 息,能夠自成一個博弈的原博弈的一息,能夠自成一個博弈的原博弈的一 部分,稱為原動態(tài)博弈的一個部分,稱為原動態(tài)博弈的一個“子博子博 弈弈”。 58 定義:一個擴(kuò)展式表述博弈的子博弈G由一個 決策結(jié)x和所有該決策結(jié)的后續(xù)結(jié)T(x)(包括終 點(diǎn)結(jié))組成,它滿足下列條件: (1)x是一個單結(jié)信息集,即包含決策結(jié)x的信息 集h(x)=x; (2)對于所有的xT(x),如果x” h(x),那么x” T(x)。 59 法律法律保障不足的開金礦保障不足的開金礦博弈博弈 如果乙在第一階段選擇了如果乙在第一階段選擇了“借借”,意
34、味著這個動態(tài)博弈,意味著這個動態(tài)博弈 進(jìn)行到了甲作選擇的第二階段。此時甲面臨的是一個在進(jìn)行到了甲作選擇的第二階段。此時甲面臨的是一個在 乙已經(jīng)借錢給他的前提下,自己選擇是否分成,然后再乙已經(jīng)借錢給他的前提下,自己選擇是否分成,然后再 由乙選擇是否打官司的兩階段動態(tài)博弈問題。由乙選擇是否打官司的兩階段動態(tài)博弈問題。 60 (2 2,2 2) 乙乙 甲甲 借借不借不借 (1 1,0 0) 分分不分不分 (0 0,4 4) 乙乙 (1 1,0 0) 打打不打不打 法律保障不足的開金礦博弈法律保障不足的開金礦博弈 按照子博弈的定義,在前頁介紹的子博弈中,當(dāng)甲選按照子博弈的定義,在前頁介紹的子博弈中,當(dāng)
35、甲選 擇擇“不分不分”,輪到乙選擇,輪到乙選擇“打打”還是還是“不打不打”的第三的第三 階段,是前頁介紹的子博弈的子博弈,我們稱后面這階段,是前頁介紹的子博弈的子博弈,我們稱后面這 個子博弈為原博弈的個子博弈為原博弈的“二級子博弈二級子博弈”。 61 (2 2,2 2) 乙乙 甲甲 借借不借不借 (1 1,0 0) 分分不分不分 (0 0,4 4) 乙乙 (1 1,0 0) 打打不打不打 子博弈(子博弈(續(xù)續(xù)) 一般地,當(dāng)動態(tài)博弈的階段數(shù)更多時,還可能存在更一般地,當(dāng)動態(tài)博弈的階段數(shù)更多時,還可能存在更 多層次的子博弈。多層次的子博弈。 62 (2 2,2 2) 乙乙 甲甲 借借不借不借 (1
36、 1,0 0) 分分不分不分 (0 0,4 4) 乙乙 (1 1,0 0) 打打不打不打 子博弈(子博弈(續(xù)續(xù)) 子博弈在動態(tài)博弈中是很普遍的,完美信息多階子博弈在動態(tài)博弈中是很普遍的,完美信息多階 段動態(tài)博弈基本上都有一級或多級子博弈。段動態(tài)博弈基本上都有一級或多級子博弈。 63 (2 2,2 2) 乙乙 甲甲 借借不借不借 (1 1,0 0) 分分不分不分 (0 0,4 4) 乙乙 (1 1,0 0) 打打不打不打 子博弈(子博弈(續(xù)續(xù)) 并不是動態(tài)博弈的任何部分都能構(gòu)成子博弈。并不是動態(tài)博弈的任何部分都能構(gòu)成子博弈。 子博弈不能包括原博弈的第一階段。子博弈不能包括原博弈的第一階段。 并不
37、是所有多階段動態(tài)博弈都有子博弈。并不是所有多階段動態(tài)博弈都有子博弈。 在不完美信息動態(tài)博弈中可能不存在子博弈。在不完美信息動態(tài)博弈中可能不存在子博弈。 64 7.7.子博弈完美納什子博弈完美納什均衡(均衡(Subgame Subgame Perfect Nash equilibriumPerfect Nash equilibrium) 65 在動態(tài)博弈分析中,納什均衡不能排除不可 信的行為選擇,不是真正具有穩(wěn)定性的均衡 概念,因此需要發(fā)展出一個新的均衡概念, 它能排除不可信的行為選擇。 66 子博弈完美納什均衡的定義子博弈完美納什均衡的定義 如果在一個完美信息的動態(tài)博弈中,各博弈如果在一個完美
38、信息的動態(tài)博弈中,各博弈 方的策略構(gòu)成的一個策略組合滿足,在整個方的策略構(gòu)成的一個策略組合滿足,在整個 動態(tài)博弈及它的所有子博弈中都構(gòu)成納什均動態(tài)博弈及它的所有子博弈中都構(gòu)成納什均 衡,那么這個策略組合稱為該動態(tài)博弈的一衡,那么這個策略組合稱為該動態(tài)博弈的一 個個“子博弈完美納什均衡子博弈完美納什均衡”(Subgame Perfect Nash Equilibrium)。)。 67 子博弈完美納什均衡(子博弈完美納什均衡(續(xù)續(xù)) 提出提出“子博弈完美納什均衡子博弈完美納什均衡”這個概這個概 念的價值在于它能夠排除納什均衡策念的價值在于它能夠排除納什均衡策 略中不可信的威脅或承諾,因此它是略中不
39、可信的威脅或承諾,因此它是 真正穩(wěn)定的。真正穩(wěn)定的。 68 子博弈完美納什均衡(子博弈完美納什均衡(續(xù)續(xù)) “子博弈完美納什均衡子博弈完美納什均衡”為什么能夠排除策為什么能夠排除策 略組合中的不可信行為呢?略組合中的不可信行為呢? 雖然包含不可信行為選擇的策略組合可以構(gòu)成整個雖然包含不可信行為選擇的策略組合可以構(gòu)成整個 博弈的納什均衡,但其中的不可信行為選擇至少在博弈的納什均衡,但其中的不可信行為選擇至少在 博弈的某些子博弈中不符合博弈方的自身利益,因博弈的某些子博弈中不符合博弈方的自身利益,因 而不構(gòu)成這些子博弈的納什均衡,而不構(gòu)成這些子博弈的納什均衡, 因此要求在所有子博弈中都是納什均衡的
40、子博弈完因此要求在所有子博弈中都是納什均衡的子博弈完 美納什均衡就排除了其中存在不可信行為選擇的策美納什均衡就排除了其中存在不可信行為選擇的策 略組合,從而在動態(tài)博弈分析中具有真正的穩(wěn)定性。略組合,從而在動態(tài)博弈分析中具有真正的穩(wěn)定性。 69 子博弈完美納什均衡(子博弈完美納什均衡(續(xù)續(xù)) 雙方的策略組合雙方的策略組合“乙第一階段選乙第一階段選 擇擇借借,第三階段選擇,第三階段選擇打打; 甲第二階段選擇甲第二階段選擇分分”是整個是整個 博弈的一個納什均衡。博弈的一個納什均衡。 但是,這個策略組合中乙的策略但是,這個策略組合中乙的策略 要求乙在第三階段單人博弈構(gòu)成要求乙在第三階段單人博弈構(gòu)成 的
41、子博弈中選擇的子博弈中選擇“打打”,不是該,不是該 子博弈的一個納什均衡,因此根子博弈的一個納什均衡,因此根 據(jù)子博弈完美納什均衡的定義判據(jù)子博弈完美納什均衡的定義判 斷,這個策略組合確實(shí)不是一個斷,這個策略組合確實(shí)不是一個 子博弈完美納什均衡。子博弈完美納什均衡。 這也正是上述納什均衡策略組合這也正是上述納什均衡策略組合 不穩(wěn)定的根源。不穩(wěn)定的根源。 70 (2 2,2 2) 乙乙 甲甲 借借不借不借 (1 1,0 0) 分分不分不分 (0 0,4 4) 乙乙 (1 1,0 0) 打打不打不打 子博弈完美納什均衡(子博弈完美納什均衡(續(xù)續(xù)) 策略組合策略組合“乙在第一階段選乙在第一階段選 擇
42、擇不借不借,如果有第三階段,如果有第三階段 選擇則選選擇則選不打不打;甲如果有;甲如果有 第二階段則選第二階段則選不分不分” ” 是是 子博弈完美納什均衡。子博弈完美納什均衡。 因?yàn)樵摬呗越M合的雙方策略不僅因?yàn)樵摬呗越M合的雙方策略不僅 在整個博弈中構(gòu)成納什均衡,而在整個博弈中構(gòu)成納什均衡,而 且在兩級子博弈中也都構(gòu)成納什且在兩級子博弈中也都構(gòu)成納什 均衡,從而不存在任何不可信的均衡,從而不存在任何不可信的 威脅或承諾,根據(jù)子博弈完美納威脅或承諾,根據(jù)子博弈完美納 什均衡的定義,該策略組合構(gòu)成什均衡的定義,該策略組合構(gòu)成 這個動態(tài)博弈的一個子博弈完美這個動態(tài)博弈的一個子博弈完美 納什均衡納什均衡
43、。 71 (2 2,2 2) 乙乙 甲甲 借借不借不借 (1 1,0 0) 分分不分不分 (0 0,4 4) 乙乙 (1 1,0 0) 打打不打不打 子博弈完美納什均衡(子博弈完美納什均衡(續(xù)續(xù)) 當(dāng)兩博弈方按照子博當(dāng)兩博弈方按照子博 弈完美納什均衡策略弈完美納什均衡策略 組合組合“乙在第一階段乙在第一階段 選擇選擇不借不借,如果,如果 有第三階段選擇則選有第三階段選擇則選 不打不打;甲如果有;甲如果有 第二階段則選第二階段則選不不 分分”行為時,實(shí)際行為時,實(shí)際 上不會進(jìn)行到博弈的上不會進(jìn)行到博弈的 第二、第三階段,兩第二、第三階段,兩 個博弈方在第二、第個博弈方在第二、第 三階段的行為實(shí)際
44、上三階段的行為實(shí)際上 不會發(fā)生。不會發(fā)生。 72 (2 2,2 2) 乙乙 甲甲 借借不借不借 (1 1,0 0) 分分不分不分 (0 0,4 4) 乙乙 (1 1,0 0) 打打不打不打 子博弈完美納什均衡(子博弈完美納什均衡(續(xù)續(xù)) 我們稱此時第二階段甲的選擇節(jié)我們稱此時第二階段甲的選擇節(jié) 點(diǎn)和第三階段乙的選擇節(jié)點(diǎn)為點(diǎn)和第三階段乙的選擇節(jié)點(diǎn)為 “不在均衡路徑上不在均衡路徑上”(out-of-out-of- equilibrium pathequilibrium path;off-off- equilibrium equilibrium path path )的,兩博弈)的,兩博弈 方的策略
45、中在這兩個節(jié)點(diǎn)的選擇方的策略中在這兩個節(jié)點(diǎn)的選擇 稱為稱為“不在均衡路徑上的選擇不在均衡路徑上的選擇”。 73 (2 2,2 2) 乙乙 甲甲 借借不借不借 (1 1,0 0) 分分不分不分 (0 0,4 4) 乙乙 (1 1,0 0) 打打不打不打 子博弈完美納什均衡(子博弈完美納什均衡(續(xù)續(xù)) 一個子博弈完美納什均衡必須對博弈方在所有選擇節(jié)點(diǎn)處的一個子博弈完美納什均衡必須對博弈方在所有選擇節(jié)點(diǎn)處的 選擇做出規(guī)定,包括最終不在均衡路徑上的節(jié)點(diǎn),而且不管選擇做出規(guī)定,包括最終不在均衡路徑上的節(jié)點(diǎn),而且不管 是在均衡路徑上的選擇還是不在均衡路徑上的選擇,都必須是在均衡路徑上的選擇還是不在均衡路徑
46、上的選擇,都必須 在相應(yīng)子博弈中構(gòu)成納什均衡,不能包含任何不可信的威脅在相應(yīng)子博弈中構(gòu)成納什均衡,不能包含任何不可信的威脅 或承諾,否則就不能保證一個策略組合是子博弈完美納什均或承諾,否則就不能保證一個策略組合是子博弈完美納什均 衡。衡。 74 “在每一個子博弈上給出納什均衡在每一個子博弈上給出納什均衡” 構(gòu)成子博弈精煉納什均衡的戰(zhàn)略不僅在均衡路徑的決 策結(jié)上最優(yōu),而且在非均衡路徑的決策結(jié)上也是最優(yōu) 的。這是納什均衡與子博弈精煉納什均衡的實(shí)質(zhì)區(qū)別 所在。 這里的要義是,戰(zhàn)略是參與人行動規(guī)則的完備描述, 它要告訴參與人在每一種可預(yù)見的情況下(每一個決 策結(jié)上)選擇什么行動,即使這種情況實(shí)際上并沒
47、有 發(fā)生(甚至參與人并不預(yù)測它會發(fā)生),因此,只有 當(dāng)一個戰(zhàn)略規(guī)定的行動規(guī)則在所有可能的情況下都是 最優(yōu)的時,它才是一個合理的、可置信的戰(zhàn)略。(張張 維迎,維迎,2012,第,第99頁頁) 75 “序貫理性” (sequential rationality) 子博弈精煉納什均衡就是剔除那些只有在特 定情況下是合理的而在其他情況下并不合理 的行動規(guī)則。 博弈論專家常常使用“序貫理性” (sequential rationality)指不論過去發(fā)生 了什么,參與人在博弈的每一個時點(diǎn)上最優(yōu) 化自己的決策。子博弈精煉納什均衡要求的 正是參與人應(yīng)該是序貫理性的。(張維迎,張維迎, 2012,第,第99頁
48、頁) 76 子博弈完美納什均衡(子博弈完美納什均衡(續(xù)續(xù)) 子博弈完美納什均衡本身也是納什均衡,是子博弈完美納什均衡本身也是納什均衡,是 比納什均衡更強(qiáng)的均衡概念。比納什均衡更強(qiáng)的均衡概念。 澤爾澤爾騰(騰(SeltenSelten,19651965)引入)引入“子博弈精煉納什均子博弈精煉納什均 衡(衡(SubgameSubgame Perfect Nash Equilibrium Perfect Nash Equilibrium)”概念概念 的目的是將那些包含不可置信威脅戰(zhàn)略的納什均衡的目的是將那些包含不可置信威脅戰(zhàn)略的納什均衡 從均衡中剔除,從而給動態(tài)博弈結(jié)果一個合理預(yù)測。從均衡中剔除,從
49、而給動態(tài)博弈結(jié)果一個合理預(yù)測。 簡單地說,簡單地說,子博弈精煉納什子博弈精煉納什均衡要求均衡戰(zhàn)略的行均衡要求均衡戰(zhàn)略的行 為規(guī)則在每一個信息集上都是最優(yōu)的。為規(guī)則在每一個信息集上都是最優(yōu)的。(張維迎, 2012,第96頁) 77 子博弈完美納什均衡(子博弈完美納什均衡(續(xù)續(xù)) 子博弈完美納什均衡在動態(tài)博弈分析中的地子博弈完美納什均衡在動態(tài)博弈分析中的地 位與納什均衡在靜態(tài)博弈分析中一樣,是最位與納什均衡在靜態(tài)博弈分析中一樣,是最 核心的分析概念和基本著眼點(diǎn)。核心的分析概念和基本著眼點(diǎn)。 要對動態(tài)博弈做出有效的分析,首先必須找出它們要對動態(tài)博弈做出有效的分析,首先必須找出它們 的子博弈完美納什均衡,必須判斷一個策略組合是的子博弈完美納什均衡,必須判斷一個策略組合是 不是子博弈完美納什均衡。不是子博弈完美納什均衡。 78 子博弈完美納什均衡(子博弈完美納什均衡(續(xù)續(xù)) 求完美信息動態(tài)博弈的求完美信息動態(tài)博弈的“子博弈完美納什均子博弈完美納什均 衡衡”最基本的方法就是最基本的方法就是逆推歸納法逆推歸納法: 引進(jìn)
溫馨提示
- 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
- 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
- 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
- 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負(fù)責(zé)。
- 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請與我們聯(lián)系,我們立即糾正。
- 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時也不承擔(dān)用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。
最新文檔
- 2025嶺南文化創(chuàng)意產(chǎn)業(yè)園項(xiàng)目啟動儀式籌辦服務(wù)合同協(xié)議書
- 2025含破碎錘挖掘機(jī)買賣合同書
- 2025咖啡粉批發(fā)合同
- 2025金屬制品委托加工合同
- 2023三年級英語上冊 Unit 5 Let's eat The first period第一課時說課稿 人教PEP
- 5 應(yīng)對自然災(zāi)害(說課稿)2023-2024學(xué)年統(tǒng)編版道德與法治六年級下冊
- 保母阿姨合同范例
- 人用工合同范例
- 上海檢測合同范例
- 金屬防水材料施工方案
- 2025年廣西教育出版社有限公司招聘筆試參考題庫含答案解析
- 中醫(yī)膏方臨床應(yīng)用與制備工藝規(guī)范 DB32/T 4870-2024
- JJG(交通) 208-2024 車貨外廓尺寸動態(tài)現(xiàn)場檢測設(shè)備
- 蘇北四市(徐州、宿遷、淮安、連云港)2025屆高三第一次調(diào)研考試(一模)英語試卷(含答案)
- 2025年信息系統(tǒng)集成服務(wù)公司組織架構(gòu)和業(yè)務(wù)流程
- 西藏自治區(qū)拉薩市城關(guān)區(qū)多校2024-2025學(xué)年六年級上學(xué)期期中英語試題
- 胸外科講課全套
- 2023年海南省公務(wù)員錄用考試《行測》真題卷及答案解析
- 公安法制培訓(xùn)
- 中國心力衰竭診斷和治療指南2024解讀(完整版)
- 《鋼鐵是怎樣練成的》閱讀任務(wù)單及答案
評論
0/150
提交評論