版權(quán)說(shuō)明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請(qǐng)進(jìn)行舉報(bào)或認(rèn)領(lǐng)
文檔簡(jiǎn)介
章多人合作博弈模型
一、問(wèn)題引入二、多人結(jié)盟博弈的基本概念三、多人結(jié)盟博弈的解四、常用解法2021/6/271一、問(wèn)題引入例1:(爵士樂(lè)隊(duì)博弈,AJazzBandGounce)
一位歌手(S),一位鋼琴家(P)和一位鼓手(D)組成一個(gè)小樂(lè)隊(duì)在俱樂(lè)部同臺(tái)演出能得到演出費(fèi)1000元,若歌手和鋼琴家一起演出能得800元。而只有鋼琴家和鼓手一起演出能得到650元,鋼琴獨(dú)奏表演能得300元,鋼琴家沒(méi)有其它收入。然而,歌手和鼓手在地鐵中表演能掙500元,歌手獨(dú)奏可以從TheTerasses掙200元,而鼓手單獨(dú)什么也掙不到。問(wèn)題:如何在這三人爵士樂(lè)隊(duì)中合理分配共同演出費(fèi)1000元?2021/6/272例2:成本分?jǐn)倖?wèn)題(ACostGame) 三個(gè)城鎮(zhèn)A,B,C欲與附近的一座電站連接起來(lái),其可能的線路及其成本如下網(wǎng)絡(luò)圖表示:這三個(gè)鎮(zhèn)可相互聯(lián)合建設(shè),試問(wèn)如何在這三個(gè)小鎮(zhèn)合理分?jǐn)傔@筆建設(shè)費(fèi)?ABC2021/6/273二、多人結(jié)盟博弈的基本概念多人結(jié)盟博弈:局中人多于二人時(shí)的博弈稱為多人博弈。這種博弈中如果局中人可以和其它局中人聯(lián)合成一體統(tǒng)一行動(dòng)與其它局中人對(duì)抗,這種博弈稱為多人結(jié)盟博弈。這種博弈有三個(gè)基本要素:局中人N={1,2,…,n};結(jié)盟S;特征函數(shù)V(S)。一般可用<N,V>表示一個(gè)多人結(jié)盟博弈。2021/6/2741、局中人與結(jié)盟(1)N={1,2,…,n}表示局中人集合。(2)結(jié)盟S,表示一個(gè)聯(lián)盟,即一局多人對(duì)策中,一部份局中人聯(lián)合成一體像一個(gè)“局中人”一樣選擇策略,這種聯(lián)合稱為結(jié)盟。顯然結(jié)盟S是局中人集合N
的子集,S
N。(3)2n是局中人可能形成結(jié)盟的個(gè)數(shù)。2021/6/2752、特征函數(shù)V(S)(1)V(S)表示當(dāng)若干局中人聯(lián)合成一個(gè)結(jié)盟S時(shí),在這局博弈中能獲得的最大收益值,即當(dāng)形成結(jié)盟S,只要S內(nèi)每一個(gè)局中人共同策略,選擇相應(yīng)策略結(jié)盟S能保證獲得,而與聯(lián)盟外局人采用什么策略無(wú)關(guān)。若S=
,V(
)=0。(2)超可加性 若一個(gè)多人博弈的特征函數(shù)具有下列性質(zhì),即對(duì)任意結(jié)盟S,T
N,S∩T=
,滿足 V(S∪T)≥V(S)+V(T).稱這個(gè)多人博弈具有超可加性。如果特征函數(shù)不滿足超可加性,博弈中的結(jié)盟是不穩(wěn)定的。2021/6/276例1:(爵士樂(lè)隊(duì)博弈,AJazzBandGounce)一位歌手(S),一位鋼琴家(P)和一位鼓手(D)組成一個(gè)小樂(lè)隊(duì)在俱樂(lè)部同臺(tái)演出能得到演出費(fèi)1000元,若歌手和鋼琴家一起演出能得800元。而只有鋼琴家和鼓手一起演出能得到650元,鋼琴獨(dú)奏表演能得300元,鋼琴家沒(méi)有其它收入。然而,歌手和鼓手在地鐵中表演能掙500元,歌手獨(dú)奏可以從TheTerasses掙200元,而鼓手單獨(dú)什么也掙不到。問(wèn)題:如何在這三人爵士樂(lè)隊(duì)中合理分配共同演出費(fèi)1000元?2021/6/277這個(gè)問(wèn)題可歸為一個(gè)三人合作博弈,它的特征函數(shù)V(S)為:很容易驗(yàn)證此博弈是具有超可加性的。
結(jié)盟S{S,P,D}{S,P}{S,D}{P,D}{S}{P}{D}V(S)100080050065020030002021/6/278例2:(產(chǎn)品博弈AProductionGame)從M1、M2、M3、M4四種原材料中各取一個(gè)單位能生產(chǎn)1個(gè)單位的某種產(chǎn)品,這個(gè)產(chǎn)品的價(jià)格要比它的原材料成本高出1000元,現(xiàn)有三個(gè)人,他們擁有這四種材料情況如下表:問(wèn):若這三人聯(lián)合起來(lái)生產(chǎn)這種產(chǎn)品,他們之間該如何分配所得利潤(rùn)?原材料人M1M2M3M411/21/20021/2010301/2012021/6/279將此問(wèn)題轉(zhuǎn)化為三人博弈,其特征函數(shù)如下:局中人2,3,通過(guò)合作生產(chǎn),但由于他們共有四種原材料只能生產(chǎn)1/2個(gè)單位產(chǎn)品,所以能掙500元。S
{1}{2}{3}{1,2}{1,3}{2,3}{1,2,3}V(S)00000050010002021/6/2710例3:成本分?jǐn)倖?wèn)題(ACostGame) 三個(gè)城鎮(zhèn)A,B,C欲與附近的一座電站連接起來(lái),其可能的線路及其成本如下網(wǎng)絡(luò)圖表示:這三個(gè)鎮(zhèn)可相互聯(lián)合建設(shè),試問(wèn)如何在這三個(gè)小鎮(zhèn)合理分?jǐn)傔@筆建設(shè)費(fèi)?ABC2021/6/2711這個(gè)問(wèn)題的合作博弈對(duì)<N,C>,N={A,B,C},成本分?jǐn)偛┺牡奶卣骱瘮?shù)V(S)為成本節(jié)省,如下表:
博弈<W,V>的特征函數(shù)值V(S),由下式得出S
{A}{B}{C}{A,B}{A,C}{B,C}{A,B,C}C(S)0100140130150130160150V(S)0000901001102202021/6/271222090110100A0B0C0150150130160A100B140C1302021/6/2713三、多人結(jié)盟博弈的解多人結(jié)盟博弈的解的概念 多人結(jié)盟博弈中,每個(gè)局中人都希望通過(guò)結(jié)盟的形式去得到更多,而博弈解的問(wèn)題是如何合理確定這局博弈中每個(gè)局中人的分配收益,博弈解一般用
X=(x1,x2,…xn) 表示n個(gè)局中人的得失向量,xi
表示第i個(gè)局中人之所得。2021/6/27141、合理分配(Imputation)作為一個(gè)博弈的解X,即在博弈中對(duì)N個(gè)局中人得失的合理分配,至少應(yīng)滿足兩個(gè)條件:(1)(個(gè)人合理性)(2)(集體合理性)條件(1)稱為:“個(gè)人合理性”(IndividualRationality),表示局中人i所分配值xi不小于特征函數(shù)中規(guī)定他至少能得到的值V(i)。條件(2)稱為“集體合理性”條件(GroupRationality),表示對(duì)于一個(gè)博弈解,所有局中人分配得失之和應(yīng)等于所有局中人聯(lián)合起來(lái)形成一個(gè)大聯(lián)盟時(shí)得到的收益值,也就是這局博弈中的最大收益值V(N)。由超可加性2021/6/2715滿足上述兩種條件的X=(x1……xn)稱為“合理分配”,即有顯然,作為多人結(jié)盟博弈的一個(gè)解X,至少必須是一個(gè)合理分配,即2021/6/2716例4:一局博弈,<N,V>,N={1,2,3},特征函數(shù)如下:
V(φ)=0,V({1})=V({2})=V({3})=0
V({1,2})=V({1,3})=V({2,3})=0
V({1,2,3})=1合理分配集合而就是其中兩合理分配。2021/6/27172、支配(Domination)多人結(jié)盟博弈求解問(wèn)題實(shí)際是在合理分配集I(V)中,按某種準(zhǔn)則選擇一個(gè)或一組合理分配,作為對(duì)策的解。但一個(gè)對(duì)策中,不可能存在一個(gè)合理分配優(yōu)于另一個(gè)合理分配,即滿足,這是因?yàn)?/p>
但是對(duì)于某一個(gè)聯(lián)盟S,只要滿足成立(這是可能的),則對(duì)S聯(lián)盟而言可認(rèn)為X分配優(yōu)于Y分配,即得出支配概念2021/6/2718定義:對(duì)于兩個(gè)合理分配X,Y,若對(duì)于某一聯(lián)盟S,有(1)(2) 則稱合理分配X通過(guò)聯(lián)盟S支配Y,記為解釋: 條件(1)表示對(duì)于聯(lián)盟S來(lái)講,X優(yōu)于Y。 條件(2)表示聯(lián)盟S有足夠的能力保證它的局中人I通過(guò)合作能獲得合理分配定義:在博弈中,只要存在某一聯(lián)盟S,且X通過(guò)S支配Y,則也稱X支配Y,記為2021/6/2719四、常用解法1、穩(wěn)集法2、核法3、Shaply值法4、多目標(biāo)規(guī)劃方法2021/6/27201、穩(wěn)集穩(wěn)集的基本思想 是選擇這樣一個(gè)合理分配的集合作為對(duì)策的解:不在這集合內(nèi)的任何合理分配總能被這個(gè)集合中某個(gè)合理分配所支配,且這個(gè)集合內(nèi)的合理分配互相不被支配。定義:對(duì)于一個(gè)對(duì)策,存在一組合理分配滿足(1),則X,Y互相不被支配。(2)對(duì)任合理分配,則必存在 則稱這樣一組合理分配S(V)為此對(duì)策的穩(wěn)集。穩(wěn)集被看作多人結(jié)盟對(duì)策的一種形式。2021/6/2721例5:有一三人結(jié)盟博弈<N,V>,N={1,2,3},V(S)為 V(φ)=V({1})=V({2})=V({3})=0 V({1,2})=V({1,3})=V({2,3})=V({1,2,3})=2很容易證明:
S(V)={(1,1,0),(1,0,1),(0,1,1)}是此博弈的一個(gè)穩(wěn)集。2021/6/2722(1)先驗(yàn)證這三個(gè)合理分配間不相互支配。對(duì)任一個(gè)不可能成立。例如對(duì)在三個(gè)分配中任兩個(gè)之間不可能同時(shí)成立。(2)設(shè)任一的合理分配分別討論的情況。2021/6/2723穩(wěn)集作為解,從支配角度具有合理性,但存在如下問(wèn)題:(1)多數(shù)結(jié)盟博弈可能有多個(gè)穩(wěn)集,(2)有的博弈都不存在穩(wěn)集
Lucas(1968)舉出一個(gè)無(wú)穩(wěn)集的10人博弈例子;Lucas和Rboie(1980)又舉出一個(gè)無(wú)穩(wěn)集的13人博弈的例子。2021/6/27242、核(TheCore)核的主要思想也是基于支配概念,即從合理分配集I(V)中選擇一組合理分配,它們對(duì)任何聯(lián)盟來(lái)說(shuō)都不被其他合理分配所支配,把這組合理分配,稱為“核”,作為博弈的一種解的形式。定義:博弈<N,V>,若存在一組合理分配,對(duì)任何聯(lián)盟S,滿足
稱這組合理分配為博弈的核,并用C(V)表示,記為2021/6/27252、核(TheCore)定義:設(shè)X是聯(lián)盟博弈<N,V>的一個(gè)合理分配,若存在一聯(lián)盟S,使得則稱聯(lián)盟S瓦解分配X。所以,核是不會(huì)被任何聯(lián)盟瓦解的合理分配的集合。2021/6/2726例:三人(分別記為1,2,3)有機(jī)會(huì)分享300元,分配方案由民主表決通過(guò)(少數(shù)服從多數(shù)),如果達(dá)不成協(xié)議則失去這個(gè)機(jī)會(huì)。特征函數(shù):2021/6/2727實(shí)際問(wèn)題中,經(jīng)濟(jì)問(wèn)題的博弈通常是有核的,而在政治科學(xué)的一些多人博弈問(wèn)題常常是沒(méi)有核存在,為了解決此問(wèn)題,提出弱核的概。核作為博弈解的合理性:
核中的分配肯定不會(huì)被任何聯(lián)盟推翻,因此在聯(lián)盟博弈中具有穩(wěn)定性。核作為博弈解的缺點(diǎn):并非每一個(gè)博弈均有非空的核。2021/6/2728通過(guò)求解下列LP問(wèn)題,求得一個(gè)非空弱核。s.t.稱根據(jù)合理分配、穩(wěn)集、核的定義有下面關(guān)系成立,
即核必定在穩(wěn)集內(nèi),穩(wěn)集必定在合理分配集合內(nèi)。
2021/6/27293、沙波利值(TheShapleyValue)多人結(jié)盟博弈的TheShapleyValue解的概念是Shapley在1953年提出的,這個(gè)解的概念不同于前面介紹的核和穩(wěn)集的概念。用核作為博弈解的思想是基于選擇不被支配的合理分配去作博弈的解,而穩(wěn)集是基于選擇能支配一切不在這個(gè)集合內(nèi)的合理分配的合理分配作為博弈的解,而Shapley則是基于期望邊際收入思想上提出的,他從局中人角度分析在博弈之前,每個(gè)局中人應(yīng)該期望得到多少。2021/6/2730在一局博弈<N,V>中,Shapley值由下式給出:
對(duì)于一個(gè)n人合作博弈<N,V>,存在唯一的一個(gè)向量函數(shù)其中,|S|表示聯(lián)盟S中人的個(gè)數(shù),則稱為Shapley值。2021/6/2731Shapely法是一種期望邊際收入思想。表示由于局中人參加了聯(lián)盟而帶來(lái)的數(shù)值,即局中人i對(duì)聯(lián)盟S的邊際貢獻(xiàn),而表示局中人參加S的概率。(局中人i在(N-S)個(gè)局中人前,(S-{i})個(gè)局中人之后參加S的概率。)2021/6/2732例7:該博弈的特征函數(shù)如下
V({1})=a
V({2})=V({3})=V({2,3})=0
V({1,2})=b
V({1,3})=V({1,2,3})=c求Φi(V),先把包括局中人1的聯(lián)盟抄列
溫馨提示
- 1. 本站所有資源如無(wú)特殊說(shuō)明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請(qǐng)下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請(qǐng)聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
- 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁(yè)內(nèi)容里面會(huì)有圖紙預(yù)覽,若沒(méi)有圖紙預(yù)覽就沒(méi)有圖紙。
- 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
- 5. 人人文庫(kù)網(wǎng)僅提供信息存儲(chǔ)空間,僅對(duì)用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對(duì)用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對(duì)任何下載內(nèi)容負(fù)責(zé)。
- 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請(qǐng)與我們聯(lián)系,我們立即糾正。
- 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶因使用這些下載資源對(duì)自己和他人造成任何形式的傷害或損失。
最新文檔
- 專項(xiàng)純凈水品供應(yīng)協(xié)議2024版
- 2025年影視基地場(chǎng)地合作經(jīng)營(yíng)協(xié)議書(shū)4篇
- 個(gè)人房產(chǎn)抵押貸款協(xié)議(2024版)版A版
- 2025年度城市更新違法建筑清拆合作協(xié)議4篇
- 專屬定制體檢服務(wù)協(xié)議版
- 二零二四塔吊司機(jī)勞動(dòng)合同及勞動(dòng)保護(hù)規(guī)定范本3篇
- 2025年影視基地場(chǎng)地租賃及影視制作服務(wù)協(xié)議4篇
- 2025年度智能安防產(chǎn)品區(qū)域代理銷(xiāo)售合同12篇
- 2025年度廠房中央空調(diào)設(shè)備安裝與售后服務(wù)一體化合同4篇
- 2025年度場(chǎng)海參產(chǎn)品綠色生產(chǎn)與環(huán)保認(rèn)證合同4篇
- 軟件項(xiàng)目應(yīng)急措施及方案
- 2025河北邯鄲經(jīng)開(kāi)國(guó)控資產(chǎn)運(yùn)營(yíng)管理限公司招聘專業(yè)技術(shù)人才5名高頻重點(diǎn)提升(共500題)附帶答案詳解
- 2024年民法典知識(shí)競(jìng)賽考試題庫(kù)及答案(共50題)
- 2025老年公寓合同管理制度
- 2024-2025學(xué)年人教版數(shù)學(xué)六年級(jí)上冊(cè) 期末綜合卷(含答案)
- 鈑金設(shè)備操作培訓(xùn)
- 感染性腹瀉的護(hù)理查房
- 中考英語(yǔ)688高頻詞大綱詞頻表
- 九年級(jí)初三中考物理綜合復(fù)習(xí)測(cè)試卷3套(含答案)
- 管理制度評(píng)價(jià)表(填寫(xiě)模板)
- 工地設(shè)計(jì)代表服務(wù)記錄
評(píng)論
0/150
提交評(píng)論