




版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請(qǐng)進(jìn)行舉報(bào)或認(rèn)領(lǐng)
文檔簡(jiǎn)介
1、引引 言言 20世紀(jì)90年代至2003年,諾貝爾經(jīng) 濟(jì)學(xué)獎(jiǎng)三次(1994,1996,2001)授予 了與博弈論相關(guān)的研究領(lǐng)域,總共有八 位經(jīng)濟(jì)學(xué)家獲獎(jiǎng),是獲獎(jiǎng)人數(shù)最多的領(lǐng) 域(排在第二位的是金融)。 博弈論研究的最大特點(diǎn)一般決策研究(數(shù)學(xué)表達(dá)): Y f ( x1, x2, , xn )博弈論的決策研究(數(shù)學(xué)表達(dá)): Y f ( x1, x2 , xn , z ) (z為他人行為)特點(diǎn):決策者目標(biāo)函數(shù)的自變量中包含他人行為。 嚴(yán)格地講,博弈論是一種方法,應(yīng)用范圍不僅包括經(jīng)濟(jì)學(xué),政治學(xué)、軍事、外交、國際關(guān)系、公共選擇,還有犯罪學(xué),都涉及到博弈論。實(shí)際上,不少人把博弈論看成是數(shù)學(xué)的一個(gè)分支。納什1
2、951年的奠基性文章就是發(fā)表在數(shù)學(xué)雜志上。夏普里1953年的文章本身也是一篇數(shù)學(xué)手稿。 一、博弈論基礎(chǔ)知識(shí)一、博弈論基礎(chǔ)知識(shí) 1. 博弈論的基本概念博弈論的基本概念 “博弈論”譯自英文“Game Theory”。直譯:“游戲理論”。 游戲有下列特征:游戲有下列特征:(1)都有規(guī)則。(2)都有結(jié)果(贏、輸、平),結(jié)果能折算成數(shù)值。(3)都有策略或者說計(jì)謀,選擇不同的策略或計(jì)謀 往往帶來不同的結(jié)果。(4)策略和利益有相互依存性,即每一個(gè)游戲者所 得結(jié)果的好壞,不僅取決于自身的策略選擇, 也取決于其他參加者的策略選擇。策略本身常常沒有絕對(duì)的好壞之分,只有相對(duì)于他方策略的相對(duì)好壞。 博弈論也稱為“對(duì)策
3、論”。其實(shí)并不是很恰當(dāng)。因?yàn)椤皩?duì)策”在實(shí)際中常被用來表示具體的針對(duì)性反應(yīng)方案,或站在某個(gè)決策方的立場(chǎng)上找針對(duì)其他方的對(duì)策。博弈論所研究的決策問題卻是有開始、有次序、有結(jié)果的整個(gè)過程。 “博弈”的通俗含意不過是弈棋、賭勝,但由于它是帶有文言性質(zhì)的詞,因而顯得學(xué)術(shù)味濃一些,既能反映這門學(xué)科的特點(diǎn)和實(shí)質(zhì),又給人一種高深莫測(cè)的感覺。 博弈的簡(jiǎn)明定義:博弈即一些個(gè)人 或其他組織,面對(duì)一定的環(huán)境條件,在 一定的規(guī)則下,同時(shí)或先后,一次或多 次,從各自允許選擇的行為或策略中進(jìn) 行選擇并加以實(shí)施,各自取得相應(yīng)結(jié)果 的過程。 博弈論,是研究決策主體的行為發(fā) 生直接相互作用時(shí)候的決策以及這種決 策的均衡問題。 博
4、弈論研究的對(duì)象是理性的參與者 如何選擇策略或如何作出行動(dòng)的決定, 使自己的目標(biāo)最大化。 2. 構(gòu)成一個(gè)博弈的基本要素構(gòu)成一個(gè)博弈的基本要素 博弈的七要素參與人、行動(dòng)、信息、戰(zhàn)略、支付函數(shù)、結(jié)果、均衡。 參與人是博弈中選擇行動(dòng)以最大化自己效用的決 策主體(可以是個(gè)人、團(tuán)體等);行動(dòng)是參與人的決策變量;戰(zhàn)略是參與人選擇行動(dòng)的規(guī)則,它告訴參與人在什么時(shí)候選擇什么行動(dòng);信息指的是參與人在博弈中的知識(shí),特別是有關(guān)其他參與人(對(duì)手)的特征和行動(dòng)的知識(shí);支付函數(shù)是參與人從博弈中獲得的效用水平,是每個(gè)參與人真正關(guān)心的東西;結(jié)果是指博弈分析者感興趣的要素的集合;均衡是所有參與人的最優(yōu)戰(zhàn)略或行動(dòng)的組合。 博弈的三
5、要素1) 博弈的參加者2) 博弈方各自可選擇的全部策略 或行動(dòng)的集合3) 博弈方的得益3. 博弈的表述形式博弈的表述形式 (1) 標(biāo)準(zhǔn)形式(策略形式)標(biāo)準(zhǔn)形式(策略形式) 被擒,中計(jì)(主觀) 勝利(客觀)逃脫,和被擒,勝利逃脫,和守城棄城 攻城退兵諸諸葛葛亮亮司馬懿司馬懿捉住曹操,被捉 撲空,逃脫 撲空,逃脫 捉住曹操,被捉 華容道 大 路 華容道 大路諸諸葛葛亮亮曹曹 操操(2)擴(kuò)展形式(博弈樹)擴(kuò)展形式(博弈樹) 諸葛亮諸葛亮司司 馬馬 懿懿棄城棄城守城守城進(jìn)攻進(jìn)攻退兵退兵 進(jìn)攻進(jìn)攻退兵退兵擒住擒住孔明孔明勝利勝利 和和和和 司馬懿司馬懿諸諸 葛葛 亮亮攻城攻城退兵退兵 守城守城棄城棄城
6、守城守城棄城棄城逃脫逃脫被擒被擒被擒被擒逃脫逃脫(3)聯(lián)盟形式(特殊函數(shù)形式)聯(lián)盟形式(特殊函數(shù)形式) 4. 博弈的類別博弈的類別 博弈分類可依不同的判據(jù)進(jìn)行:博弈分類可依不同的判據(jù)進(jìn)行:博弈人數(shù)單人博弈、兩人博弈、多人博弈;策略的數(shù)量有限博弈、無限博弈;得益情況零和博弈、常和博弈、變和博弈;博弈過程靜態(tài)博弈、動(dòng)態(tài)博弈、重復(fù)博弈;信息結(jié)構(gòu)完全信息博弈(靜、動(dòng)態(tài))、不完全信息博弈(靜、動(dòng)態(tài)) ,完美信息動(dòng)態(tài)博弈、不完美信息動(dòng)態(tài)博弈;博弈方的理性和行為邏輯完全理性博弈、有限理性博弈;合作博弈、非合作博弈。 常見的博弈分類 : 從這個(gè)角度,博弈可以分為靜態(tài)博弈和動(dòng)態(tài)博弈。 靜態(tài)博弈指的是博弈參與人同
7、時(shí)行動(dòng),或雖非同時(shí)但后行動(dòng)者不知道前行動(dòng)者采取了什么具體行動(dòng)。 動(dòng)態(tài)博弈指的是參與人的行動(dòng)有先后順序,且后行動(dòng)者能觀察到先行動(dòng)者所選擇的行動(dòng)。(1) 參與人行動(dòng)的先后順序(2) 參與人的信息 從這個(gè)角度,博弈可以分為完全信息博弈和不完全信息博弈。完全信息指的是每一個(gè)參與人對(duì)所有其他參與人(對(duì)手)的特征、戰(zhàn)略空間及支付函數(shù)有準(zhǔn)確的知識(shí);否則,就是不完全信息。 將上述兩個(gè)角度的劃分結(jié)合起來,共有四種不同類型的博弈,即:完全信息靜態(tài)博弈,完全信息動(dòng)態(tài)博弈,不完全信息靜態(tài)博弈,不完全信息動(dòng)態(tài)博弈。 博弈的分類表 行動(dòng)順序信 息 靜 態(tài) 動(dòng) 態(tài)完全信息 完全信息靜態(tài)博弈 完全信息動(dòng)態(tài)博弈 不完全信息 不
8、完全信息靜態(tài)博弈 不完全信息動(dòng)態(tài)博弈二、博弈論中的經(jīng)典分析及啟示二、博弈論中的經(jīng)典分析及啟示1. 囚徒困境囚徒困境 “囚徒困境”博弈是1950年圖克(Tucker)提出的。它非常簡(jiǎn)單,卻反映了博弈的根本特征,是闡釋眾多經(jīng)濟(jì)社會(huì)問題的經(jīng)典范式。 警察抓住兩個(gè)罪犯,分別關(guān)押,并與罪犯講清:如果一人坦白,一人抗拒,坦白者立即釋放,抗拒者判刑 8 年;若兩人都坦白,按律從輕各判 5 年。罪犯知道,他們?nèi)艨咕埽煺莆盏淖C據(jù)只能各判 1 年。最后的結(jié)果會(huì)怎樣? -5 -5,-5 -5 0 0,-8 -8 -8 -8,0 0 -1 -1,-1 -1 博弈(完全信息)分析方法:上策 均衡,嚴(yán)格下策反復(fù)消去法
9、,畫線法, 箭頭法等。 -5 -5,-5 -5 0 0,-8 -8 -8 -8,0 0 -1 -1,-1 -1此博弈的“均衡”為(坦白,坦白)該均衡就是大名鼎鼎的“納什均衡” 納什均衡:在對(duì)方策略確定的情況下,每個(gè)參與者的策略都是最好的,沒有人愿意先改變自己的策略。 假如博弈中的所有參與人事先達(dá)成一項(xiàng)協(xié)議,這個(gè)協(xié)議是否可以自動(dòng)實(shí)施? 若當(dāng)事人都會(huì)自覺遵守這個(gè)協(xié)議,這個(gè)協(xié)議就構(gòu)成納什均衡:沒有人有積極性偏離協(xié)議。換句話說,如果一個(gè)協(xié)議不構(gòu)成納什均衡,它就不可能自動(dòng)實(shí)施,因?yàn)橹辽儆幸粋€(gè)參與人會(huì)違背這個(gè)協(xié)議。 結(jié)論: 一種制度安排要生效,必須是 納什均衡。不滿足納什均衡要求的制 度沒有意義 。 類似
10、囚徒困境 應(yīng)試教育 公共產(chǎn)品供給不足(修路、公 寓樓道 的路燈) 卡特爾的內(nèi)在不穩(wěn)定性產(chǎn)量限制、價(jià)格限制)商業(yè)誠信商業(yè)誠信此博弈的納什均衡為(3,3) 乙乙誠信 欺詐 10,10 0,18 18,0 3,3 誠信甲甲 欺詐 交通規(guī)則交通規(guī)則 乙乙守規(guī) 違規(guī)10,100,1818,03,3 守規(guī)甲甲 違規(guī) 啟示:?jiǎn)⑹荆?個(gè)人理性與集體理性的矛盾; 冤假錯(cuò)案是怎樣產(chǎn)生的; 個(gè)人的最優(yōu)決策不一定帶來集體的最優(yōu)結(jié)果, 集體的最優(yōu)結(jié)果未必來源于個(gè)人的最優(yōu)決策。 領(lǐng)導(dǎo)的政績(jī)? 改變博弈結(jié)果的根本方法是改變博弈的支付 矩陣。 囚徒困境的解脫有這樣一個(gè)博弈 此時(shí),兩者的納什均衡為(不合作,不合作)。 獎(jiǎng)勵(lì) 假
11、如對(duì)采取“合作”策略的博弈方獎(jiǎng)勵(lì)3獎(jiǎng)勵(lì)矩陣為:最終結(jié)果為上述兩個(gè)矩陣相加:博弈的納什均衡為(合作,合作),解開了囚徒困境。 懲罰 思拉恩埃格特森在新制度經(jīng)濟(jì)學(xué)中舉 的例子。 非洲努埃爾人部落間有兩個(gè)大家庭X、Y, 每家擁有同樣的武力潛能和侵犯傾向,每家擁 有相當(dāng)于10頭牛的財(cái)產(chǎn)。 每家都擁有兩種策略: 侵犯對(duì)方,不侵犯對(duì)方。博弈表述為:納什均衡為(侵犯,侵犯),雙方的收益為(4,4)。 通過聯(lián)姻,努埃爾人引入了一個(gè)懲罰矩陣: 由于親戚關(guān)系,侵犯者遭受成本(包括心理成本)的損失。 此時(shí),X、Y就由非合作均衡變?yōu)楹献骶狻?上述方陣變?yōu)椋?. 賭勝博弈賭勝博弈 賭勝博弈屬于“零和博弈”的范疇,是
12、具有某種對(duì)稱性的零和博弈。猜硬幣博弈猜硬幣博弈 -1,1 1,-1 1,-1 -1,1 正面 反面 拋拋硬硬幣幣方方正面 反面猜猜 硬硬 幣幣 方方石頭石頭.剪子剪子.布布 博弈博弈 0,0 1,-1 -1,1 -1,1 0,0 1,-1 1,-1 -1,1 0,0 石頭 剪子 布 博博弈弈方方 1 石頭 剪子 布博弈方博弈方 2齊威王、田忌賽馬齊威王、田忌賽馬3,-31,-11,-11,-1-1,11,-11,-1 3,-31,-11,-11,-1-1,11,-1-1,13,-31,-11,-11,-1-1,11,-11,-13,-31,-11,-11,-11,-11,-1-1,13,-31
13、,-11,-11,-1-1,11,-11,-1 3,-3齊齊威威王王上中下田田 忌忌上下中中上下中下上下上中下中上上中下下中上上下中中上下中下上下上中 以上三個(gè)博弈是零和博弈,沒有純策略納什均衡。 純策略:單一的確定的策略。 0,0 1,-1 -1,1 -1,1 0,0 1,-1 1,-1 -1,1 0,0 石頭 剪子 布 博博弈弈方方 1 石頭 剪子 布博弈方博弈方 2取勝原則: 保密(不泄漏自己的策略); 避免自己的決策有傾向性; 讓對(duì)方琢磨不透。 混合策略: 以一定的概率分布在備選策略中隨機(jī)選取。 啟示: 當(dāng)博弈是零和博弈時(shí),只有混合策略均衡。 什么樣的決策是科學(xué)決策?隨機(jī)決策(當(dāng)面對(duì)零
14、和博弈時(shí))科學(xué)嗎?3. 警衛(wèi)與小偷警衛(wèi)與小偷 案例1 兩地巡邏 警衛(wèi)負(fù)責(zé)A、B兩地保安,A地財(cái)產(chǎn)2萬元,B地1萬元。警衛(wèi)一次只能在一個(gè)地方巡邏,小偷一次也只能去一個(gè)地方。警衛(wèi)在某地巡邏,小偷也去了該地,便不會(huì)失竊;小偷去了警衛(wèi)沒去的地方,則偷盜成功。警衛(wèi)怎么巡邏效果最好? 3 , 0 2 ,1 1 , 2 3 ,0 巡邏A地 巡邏B地 盜竊A地盜竊B地 警警衛(wèi)衛(wèi) 小小 偷偷 這個(gè)博弈是零和博弈,沒有純策略納什均衡點(diǎn),但有混合策略均衡點(diǎn)。 當(dāng)警衛(wèi)去A地巡邏時(shí),小偷有 的機(jī)會(huì)去A 地, 的機(jī)會(huì)去B地,此時(shí),A的得益為: 3+ 2= 萬元; 當(dāng)警衛(wèi)去B地時(shí),同樣小偷有 的機(jī)會(huì)去A 地, 的機(jī)會(huì)去B地
15、,此時(shí),B的得益為: 1+ 3= 萬元。警衛(wèi)總的得益為: + = 萬元。 同理,我們可得小偷的總的得益為 萬元。31323232323131313132323737373737 警衛(wèi)的最優(yōu)策略是: 擲骰子決定去A地還是B地巡邏。擲l4點(diǎn)去A地,擲5、6兩點(diǎn)去B地,這樣警衛(wèi)有23的機(jī)會(huì)去A地,13的機(jī)會(huì)去B地。警衛(wèi)的期望得益是:7/3大于2。 小偷的最優(yōu)策略是: 同樣擲骰子決定去A地還是B地偷盜,擲到14點(diǎn)去B地,擲5、6兩點(diǎn)去A地,即小偷有l(wèi)/3的機(jī)會(huì)去A地,2/3的機(jī)會(huì)去B地,期望收益為2/3萬元 啟示: 當(dāng)博弈是零和博弈時(shí),即一方所得是另外一方的所失時(shí),只有混合策略均衡。博弈方的策略應(yīng)當(dāng)是
16、隨機(jī)的,不能讓對(duì)方知道自己的策略,哪怕是“傾向性”的策略。如果對(duì)方知道你出其中一個(gè)策略的“可能性”大,你失敗的可能性就大。案例2 小偷和守衛(wèi): 此案例為塞爾頓(1994年諾貝爾經(jīng)濟(jì)學(xué)獎(jiǎng)得主)1996年3月在上海講演中舉的例子 。 有一倉庫,小偷行竊時(shí)守衛(wèi)睡覺,可獲價(jià)值 V 的財(cái)物,小偷行竊時(shí)守衛(wèi)沒睡覺,則被抓,被抓后要坐牢,效用為 P 。守衛(wèi)睡覺而未遭偷竊有 S 的效用,因睡覺被竊遭解雇,得益為 D 。小偷不偷,守衛(wèi)無得也無失。守衛(wèi)不睡,出一份力掙一份錢,也無得失。V , -D -P , 0 0 , S 0 , 0小偷不偷偷 守 衛(wèi)睡 不睡 分析:這個(gè)博弈不存在純策略納什均衡。 小偷的策略D
17、PtPt S0守衛(wèi)得益(睡)小偷偷的概率1 小偷有“偷”與“不偷”兩種策略。圖中橫軸表示小偷選擇“偷”的概率 Pt, “不偷”的概率等于 1Pt。 守衛(wèi)的策略P PgPg S0小偷得益(偷)守衛(wèi)睡的概率1V 守衛(wèi)有“睡”與“不睡”的策略,其概率分布也可用圖表示。 激勵(lì)悖論(政策目標(biāo)和政策結(jié)果的意外關(guān)系)P PgPg S0小偷得益(偷)守衛(wèi)睡的概率1V Pg P 加重對(duì)小偷的懲罰,相當(dāng)于 P 向下移動(dòng)到 P。短期內(nèi)小偷會(huì)停止“偷”竊,但長期中,小偷減少“偷”竊會(huì)使守衛(wèi)更多地選擇“睡”覺。加重對(duì)小偷懲罰的主要作用是守衛(wèi)可以更多地偷懶。D PtPt S0守衛(wèi)得益(睡)小偷偷的概率1Pt D 加重對(duì)失
18、職守衛(wèi)的處罰,意味著 D 增大到 D。短期效果是守衛(wèi)更加盡職,長期中的真正作用,恰恰是會(huì)降低盜竊發(fā)生的概率。啟示:怎樣避免激勵(lì)悖論? 4. 情侶博弈(性別戰(zhàn))情侶博弈(性別戰(zhàn)) 一對(duì)情侶,男的愛看足球,女的愛看芭蕾,都愿共度周末。其博弈表述為: 有兩個(gè)納什均衡:(足球,足球),(芭蕾,芭蕾)。 究竟哪一個(gè)會(huì)發(fā)生,不知道。 2,1 0,0 0,0 1,2男男足球 芭蕾 足球芭蕾女女 啟示:先動(dòng)優(yōu)勢(shì),后動(dòng)優(yōu)勢(shì)。 甲有先動(dòng)優(yōu)勢(shì),先選B策略,穩(wěn)得10。 乙有后動(dòng)優(yōu)勢(shì),最好讓A先選,樂得100。 10,0 5,4 10,100 5,0甲甲A BCD乙乙斗雞博弈斗雞博弈 兩只斗雞相遇,或進(jìn)或退。雙方都前進(jìn)
19、,兩敗俱傷。一方前進(jìn),一方后退,前進(jìn)者勝利,后退者丟面子。都后退,都丟面子。 博弈表述為: -2,-21,-1 -1,1 -1,-1雞雞甲甲前進(jìn) 后退 前進(jìn)后退雞乙雞乙 此博弈有兩個(gè)納什均衡:一方前進(jìn),一方后退。結(jié)果無法預(yù)測(cè)。 例子:20世紀(jì)60年代的古巴導(dǎo)彈危機(jī) 夫妻矛盾5. 智豬博弈智豬博弈 豬圈里有一大一小兩頭豬。食槽在一頭,按鈕在另一頭。按一次有10個(gè)單位食品進(jìn)入食槽,但按者要支付2個(gè)單位。若同時(shí)按,同時(shí)跑向食槽,各支付2 個(gè)單位,大豬吃7個(gè)單位,小豬吃3個(gè)單位。大豬按,小豬坐吃,大豬吃6個(gè)單位(支付2個(gè)單位),小豬吃4個(gè)單位。小豬按,大豬坐吃,大豬吃9,小豬吃1(支付2 個(gè)單位)。都
20、坐等,都沒吃。 5,1 4,4 9,-1 0,0智豬博弈(扣除支付) 此博弈的納什均衡:大豬按,小豬坐吃(4,4) 啟示:?jiǎn)⑹荆?多勞并不多得; 要推動(dòng)工作,就要想辦法找到“大豬”; 若你是“大豬”,做了好不僅不要想 得好,還要能受委屈。(大德無名) 6. 海灘占位博弈海灘占位博弈(霍特林模型)(霍特林模型) 有一海灘日光浴場(chǎng),均勻地散布著許多日光浴者。有 A 與 B 兩個(gè)小販,以同樣的價(jià)格、質(zhì)量向日光浴者提供同一品牌的礦泉水。在直線狀的海灘上他們會(huì)如何選擇自己的攤位點(diǎn)呢?海灘占位海灘占位 設(shè)海灘的長度為l,圖中0,1線段表示 海灘,“*”號(hào)代表日光浴者。01 由于日光浴者總是到距自己最近的攤
21、位購買礦泉水。理想的攤位點(diǎn)如下: A 在 14 處,B 在 34 處。這樣既方便了日光浴者, A、B 兩人又平分市場(chǎng),可謂皆大歡喜。 0121AB 然而,理性的小販 A 會(huì)想:如果我將攤位往 B 那兒挪動(dòng)至A位置,那么從 0 至 A 范圍內(nèi)的人顯然是我的顧客,而 A與 B 之間的中點(diǎn)將從原來的 12 處移至 12 右邊的 C 處,從 A至 C 范圍內(nèi)的人也將成為我的顧客,即從 B 那兒“奪”走了一部分生意。這當(dāng)然是個(gè)好主意! B 也是一個(gè)理性的商人,A 的想法也是 B 想法。0121ABAC 雙方“斗智斗勇”(博弈)的結(jié)果:A、B 的攤位都定在海灘中點(diǎn)(12處),相安無事地做買賣。0121AB
22、 西方大國為什么都是兩黨政治?為什么第三個(gè)政黨難成氣候??jī)牲h政治的穩(wěn)定性和欺騙性。西方兩黨政治的博弈論解讀西方兩黨政治的博弈論解讀 激進(jìn)黨激進(jìn)黨 保守黨保守黨第三黨 激進(jìn)黨激進(jìn)黨 保守黨保守黨7. 先來后到博弈先來后到博弈 廠商A先占領(lǐng)了一個(gè)容量有限的市場(chǎng),廠商B也想進(jìn)入該市場(chǎng)。廠商B知道一旦自己進(jìn)入,廠商A可能采取降價(jià)等競(jìng)爭(zhēng)手段打擊他。如果廠商A采取打擊行動(dòng),廠商B肯定會(huì)虧損。那么,廠商B要不要進(jìn)入這個(gè)市場(chǎng)?如果廠商B真的進(jìn)入,廠商A是否真會(huì)打擊?先來后到博弈(完全信息) 分析: 假設(shè)A獨(dú)占市場(chǎng)時(shí)利潤為10。與B分享市場(chǎng)則各得5。如 B進(jìn)入市場(chǎng)A打擊,則 B虧損2,A的利潤降為3。 我們可以
23、用擴(kuò)展形表示該動(dòng)態(tài)博弈。B進(jìn)入進(jìn)入不進(jìn)入不進(jìn)入打擊打擊 默許默許(0,10) (4,4)(-1,3)AB進(jìn)入進(jìn)入不進(jìn)入不進(jìn)入打擊打擊 默許默許(0,10) (3,3)(-1,5)A高成本低成本 在位者的類型有高成本、低成本之分。高成本的最優(yōu)策略是默許,低成本則是打擊。在位者知道自己的真實(shí)類型,進(jìn)入者雖不知在位者的真實(shí)類型,但知道各種可能類型的概率分布。 設(shè):高成本的可能性為x ,低成本的可能性則為(1X)。進(jìn)入者不進(jìn)入的期望利潤為0,進(jìn)入的期望利潤為: 4x(1)(1x) 即: x 0.2 時(shí),進(jìn)入的期望利潤大于不進(jìn)入的期望利潤。先來后到博弈(不完全信息) 啟示:怎樣的威脅和承諾是可信的(言語
24、博弈)?信號(hào)博弈:高等教育的功能?8. 求愛博弈求愛博弈 有人向你求愛,接受還是拒絕?若求愛者品德優(yōu)良,你接受;若求愛者品德惡劣,則拒絕。但你并不準(zhǔn)確知道求愛者的品德。你接受與否就取決于你對(duì)求愛者品德類型的概率判斷,即你在多大程度上相信他是一個(gè)品德優(yōu)良的人。求愛博弈(品德優(yōu)良)求愛博弈(品德優(yōu)良) 100,100 -50,0 0,0 0,0求求愛愛者者求愛不求愛 接受拒絕你你求愛博弈(品德惡劣)求愛博弈(品德惡劣) 100,-100 -50,0 0,0 0,0求求愛愛者者求愛不求愛 接受拒絕你你 假如你認(rèn)為求愛者品德優(yōu)良的概率為 X 。不接受求愛的期望效用為0,接受則為 100 X (100)
25、(1X)。解之,當(dāng)X 1/2 時(shí),接受求愛。 啟示:信息不完全帶來決策風(fēng)險(xiǎn)。諸葛亮和司馬懿相互知道類型(公共知識(shí))空城計(jì)空城計(jì) 9. 財(cái)產(chǎn)分配博弈財(cái)產(chǎn)分配博弈 你的權(quán)力有多大?(權(quán)力指數(shù)) 有A、B、C三人委員會(huì),A有兩票,B、C各一票,表決采取“多數(shù)”原則,一項(xiàng)議案獲得3票及3票以上則通過。他們各自的權(quán)力有多大?權(quán)力是什么? 決策者的權(quán)力體現(xiàn)在他在形成“獲勝聯(lián)盟”中是否“關(guān)鍵加入者”。若決策者作為“關(guān)鍵加入者”出現(xiàn),權(quán)力就大,反之則小。 決策者作為“關(guān)鍵加入者”的個(gè)數(shù)即為“權(quán)力指數(shù)”。 三人委員會(huì)的獲勝聯(lián)盟有: AB、AC、ABC。A在AB、AC和ABC中均是關(guān)鍵加入者, A的權(quán)力指數(shù)是3。
26、B是聯(lián)盟AB的關(guān)鍵加入者,B的權(quán)力指數(shù)為l。C與B一樣只是聯(lián)盟AC的關(guān)鍵加入者,權(quán)力指 數(shù)是1。A、B、C的權(quán)力指數(shù)之比是3:1:l。 群體中可能的權(quán)力結(jié)構(gòu)有多少 ? A、B兩人的群體,邏輯上有16種決策結(jié)構(gòu),以下4種最常見或在現(xiàn)實(shí)中有意義:(1) F=A,(2) F=B,(3) F=A+B,(4) F=AB (1)、(2) 表示A、B說了算。 (3)、(4) 中A、B權(quán)力相等。但在 (3) 中, 一人同意就行;在 (4)中,要A、B兩人同時(shí) 同意才行。 夫婦間的決策無非是這4種方式。 3個(gè)人組成的群體,邏輯上可能的權(quán)力結(jié)構(gòu)有256種之多! 但現(xiàn)實(shí)中的權(quán)力結(jié)構(gòu)(不含“邏輯非”)為13種。 當(dāng)人
27、數(shù)超過3人或者人數(shù)很多時(shí),可能的權(quán)力結(jié)構(gòu)非常多,很難列舉。這就是為什么社會(huì)形態(tài)多種多樣,權(quán)爭(zhēng)總是無止無息。 三人財(cái)產(chǎn)分配 案例: 在三人之間分配100萬元財(cái)產(chǎn)。A有50的票,B有40的票,C有10的票。規(guī)定超過50的票認(rèn)可某種方案時(shí),才能分配整個(gè)財(cái)產(chǎn)。 分析: 任何單獨(dú)一個(gè)人的票都不超過50,從而不能單獨(dú)決定財(cái)產(chǎn)的分配要超過50的票必須結(jié)成聯(lián)盟。 若按票力分配,即A、B、C的財(cái)產(chǎn)分配為: 50,40,10。 C可以提這樣的方案,A:70,B:0,C:30。這個(gè)方案能被A、C接受,盡管B被排除,但是A、C的票構(gòu)成大多數(shù)(60)。 B會(huì)提出新方案,A:80,B:20,C:0。此時(shí)A和B所得增加,C
28、一無所有。A、B的票力總和為(90) 這樣的過程可以一直進(jìn)行下去。 夏普里(LSShapley)1955年提出了一種計(jì)算權(quán)力的度量。根據(jù)他的理論求得的聯(lián)盟者的實(shí)力稱為Shapley值(夏普里值)。 夏普里值是:在各種可能的聯(lián)盟次序下,參與者對(duì)聯(lián)盟的邊際貢獻(xiàn)(聯(lián)盟的“關(guān)鍵加入者”)之和除以各種可能的聯(lián)盟組合。 如果說納什均衡是非合作博弈中的核心概念的話,夏普里值(shapley value)是合作博弈(或聯(lián)盟博弈)中的最重要的概念。財(cái)產(chǎn)分配中各種排列下的關(guān)鍵加入者由此得A、B、C的夏普里值分別為: A=46,B=16,C=16按照夏普里值, 可將財(cái)產(chǎn)(100萬元)分給A:46(66.7),B:1
29、6(16.67),C:16(16.67)。 啟示: 權(quán)力指數(shù)和票數(shù)不是一回事,票數(shù)指標(biāo)是虛假的實(shí)力表示。在設(shè)計(jì)投票制度時(shí),票數(shù)的分配要考慮權(quán)力指數(shù):票數(shù)的分配要與權(quán)力指數(shù)和人數(shù)成大致相同的比例。 S國的權(quán)力分配 S國有六個(gè)省:A、B、C、D、E、F,實(shí)行代議民主政治,所有立法決策由這些省的代表投票實(shí)施。各省按人口比例分配的票數(shù)為: A:10;B:9;C:7;D:3;E:1; F:1??偲睌?shù)為31。該國法律規(guī)定:一項(xiàng)決議擁有半數(shù)以上票(16票或16票以上)即獲得通過。總統(tǒng)選舉(兩位候選人)也一樣,獲半數(shù)以上票即當(dāng)選。該國的體制運(yùn)行了多年,但D、E、F省的人民總覺得有點(diǎn)問題。班扎夫三世(1965年)的分析: D、E、F省分別有3、1、1票。但這3個(gè)省不是任何獲勝聯(lián)盟的“關(guān)鍵加入者”,其 權(quán)力指數(shù)均為0。 (16;10,9,7,3,1,1)體制下S國各省權(quán)力指數(shù) 省 票數(shù)權(quán)力指數(shù)權(quán)力指數(shù)() A10433.3 B9433.3 C7433.3 D30 E10 F10 班扎夫三世的建議:多給A省兩張票
溫馨提示
- 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請(qǐng)下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請(qǐng)聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
- 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會(huì)有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
- 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
- 5. 人人文庫網(wǎng)僅提供信息存儲(chǔ)空間,僅對(duì)用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對(duì)用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對(duì)任何下載內(nèi)容負(fù)責(zé)。
- 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請(qǐng)與我們聯(lián)系,我們立即糾正。
- 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶因使用這些下載資源對(duì)自己和他人造成任何形式的傷害或損失。
最新文檔
- 個(gè)人如何做家庭教育
- 電子行業(yè)非標(biāo)產(chǎn)線
- 2025年少年宮活動(dòng)方案
- 出鏡記者與主持人實(shí)務(wù) 課件 第五章 現(xiàn)場(chǎng)隨機(jī)采訪
- 湘教版開花和結(jié)果
- 校園元旦晚會(huì)活動(dòng)方案策劃書2025年
- 幼兒園自理能力主題教育課件
- 伺服系統(tǒng)與工業(yè)機(jī)器人課件第11章 工業(yè)機(jī)器人系統(tǒng)
- 急診護(hù)理中的美學(xué)要求
- 咳嗽病的中醫(yī)護(hù)理
- DB34∕T 3791-2021 智慧藥房驗(yàn)收規(guī)范
- 公司章程與內(nèi)部管理規(guī)則制度
- 20以內(nèi)加減法口算練習(xí)題帶括號(hào)填空135
- 百位數(shù)加減法練習(xí)題連加
- 地下綜合管廊工程機(jī)電安裝工程施工方案
- 高速公路路網(wǎng)數(shù)字底座研究與建設(shè)
- 藥學(xué)專業(yè)崗位分析報(bào)告范文
- 七年級(jí)道法上冊(cè) 第一單元 少年有夢(mèng) 單元測(cè)試卷(人教版 2024年秋)
- DL-T586-2008電力設(shè)備監(jiān)造技術(shù)導(dǎo)則
- JT-T-1246-2019公路與鐵路兩用橋梁技術(shù)要求
- 河南省南陽市唐河縣2023-2024學(xué)年八年級(jí)下學(xué)期期末數(shù)學(xué)試題
評(píng)論
0/150
提交評(píng)論