經(jīng)濟(jì)與管理決策方法導(dǎo)論-博弈論_第1頁
經(jīng)濟(jì)與管理決策方法導(dǎo)論-博弈論_第2頁
經(jīng)濟(jì)與管理決策方法導(dǎo)論-博弈論_第3頁
經(jīng)濟(jì)與管理決策方法導(dǎo)論-博弈論_第4頁
經(jīng)濟(jì)與管理決策方法導(dǎo)論-博弈論_第5頁
已閱讀5頁,還剩31頁未讀 繼續(xù)免費(fèi)閱讀

下載本文檔

版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進(jìn)行舉報或認(rèn)領(lǐng)

文檔簡介

經(jīng)濟(jì)與管理決策方法導(dǎo)論索馬里海盜的難題請你按自己的思路來分析并且確定一個決策方案。全班分幾個組討論這一個案例,派代表發(fā)言,要求有爭論。

《決策方法》之一:博弈及其應(yīng)用

索馬里海盜的難題例題:5個海盜搶到了100顆寶石,每一顆都一樣的大小和價值連城。他們決定這么分:第一步,抽簽決定自己的號碼(1、2、3、4、5);第二步,首先,由1號提出分配方案,然后5個人進(jìn)行表決,當(dāng)且僅當(dāng)超過半數(shù)的人同意時,按照他的提案進(jìn)行分配,否則他將被扔入大海喂鯊魚;第三步,1號死后,再由2號提出分配方案,然后4人進(jìn)行表決,當(dāng)且僅當(dāng)超過半數(shù)的人同意時,按照他的提案進(jìn)行分配,否則他將被扔入大海喂鯊魚;第四步,以此類推。

條件:每個海盜都是很聰明的人,都能很理智的判斷得失,從而做出選擇。問題:最后的分配結(jié)果如何?納什均衡解。

提示:海盜的判斷原則:1.保命;2.盡量多得寶石;3.盡量多殺人。

海盜分寶石索馬里海盜的難題----猜想一1號是危險的二5號最安全三

推理過程:從后向前推,如果1-3號強(qiáng)盜都喂了鯊魚,只剩4號和5號的話,5號一定投反對票讓4號喂鯊魚,以獨(dú)吞全部金幣。所以,4號惟有支持3號才能保命。3號知道這一點,就會提(100,0,0)的分配方案,對4號、5號一毛不拔而將全部金幣歸為已有,因為他知道4號一無所獲但還是會投贊成票,再加上自己一票,他的方案即可通過。不過,2號推知到3號的方案,就會提出(98,0,1,1)的方案,即放棄3號,而給予4號和5號各一枚金幣。由于該方案對于4號和5號來說比在3號分配時更為有利,他們將支持他而不希望他出局而由3號來分配。這樣,2號將拿走98枚金幣。不過,2號的方案會被1號所洞悉,1號并將提出(97,0,1,2,0)或(97,0,1,0,2)的方案,即放棄2號,而給3號一枚金幣,同時給4號(或5號)2枚金幣。由于1號的這一方案對于3號和4號(或5號)來說,相比2號分配時更優(yōu),他們將投1號的贊成票,再加上1號自己的票,1號的方案可獲通過,97枚金幣可輕松落入囊中。這無疑是1號能夠獲取最大收益的方案了!可以看出,這個推理過程就先考慮簡化的極端情況,從而順藤摸瓜,得出最后的結(jié)果。另外,這其實是經(jīng)濟(jì)學(xué)中的博弈問題,1號提出的方案就是這種情況下的納什均衡。海盜分寶石什么是博弈論:從“囚徒困境”談起(引例)著名的“囚徒問題”:一位富翁在家中被殺,財物被盜。警方在此案的偵破過程中,抓到兩個犯罪嫌疑人甲和乙,并從他們的住處搜出被害人家中丟失的財物。但是,他們矢口否認(rèn)曾殺過人,辯稱是先發(fā)現(xiàn)富翁被殺,然后只是順手牽羊偷了點兒東西。于是警方將兩人隔離,分別關(guān)在不同的房間進(jìn)行審訊。檢察官說,“由于你們的偷盜罪已有確鑿的證據(jù),所以可以判你們1年刑期。但是,我可以和你做個交易。如果你單獨(dú)坦白殺人的罪行,我只判你3個月的監(jiān)禁,但你的同伙要被判10年刑。如果你拒不坦白,而被同伙檢舉,那么你就將被判10年刑,他只判3個月的監(jiān)禁。但是,如果你們兩人都坦白交代,那么,你們都要被判5年刑?!憋@然最好的策略是雙方都抵賴,這樣大家都只被判1年。但是由于兩人處于隔離的情況下無法串供。于是兩人都選擇坦白的策略以及因此被判5年的結(jié)局被稱為“納什均衡”,也叫非合作均衡。因為,每一方在選擇策略時都沒有“共謀”(串供),他們只是選擇對自己最有利的策略,而不考慮社會福利或任何其他對手的利益。甲乙二人合伙盜劫,并且殺死1人,警察證據(jù)不足,采用隔離各個擊破的心理戰(zhàn)術(shù)囚徒甲不招囚徒甲招囚徒乙不招(甲1年,乙1年)(甲判刑1年,乙判刑1年)(甲0.25年,乙10年)(甲判刑0.25年,乙判刑10年)囚徒乙招(甲10年,乙0.25年)(甲判刑10年,乙判刑0.25年)

(甲5年,乙5年)(甲判刑5年乙判刑5年)

“納什均衡”對甲來說,盡管他不知道乙是選擇了“招”還是“不招”,他發(fā)現(xiàn)他自己選擇“招”都是比選擇“不招”為好的。因此,“不招”是相對于“招”的劣戰(zhàn)略,他不會選擇劣戰(zhàn)略。所以,甲會選擇“招”。博弈的分類及對應(yīng)的均衡靜態(tài)動態(tài)完全信息完全信息靜態(tài)博弈;納什均衡;Nash(1950)完全信息動態(tài)博弈;子博弈精煉納什均衡;澤爾騰(1965)不完全信息不完全信息靜態(tài)博弈;貝葉斯納什均衡;海薩尼(1967-1968)不完全信息動態(tài)博弈,精煉貝葉斯納什均衡;澤爾騰(1975)Kreps,Wilson(1982),Fudenberg,Tirole(1991)

《決策方法》之一:博弈及其應(yīng)用

對甲來說,盡管他不知道乙是選擇了“招”還是“不招”,他發(fā)現(xiàn)他自己選擇“招”都是比選擇“不招”為好的。因此,“不招”是相對于“招”的劣戰(zhàn)略,他不會選擇劣戰(zhàn)略。所以,甲會選擇“招”。同樣,根據(jù)對稱性,乙也會選擇“招”,結(jié)果是甲乙兩人都“招”。甲和乙都不會選擇劣戰(zhàn)略“不招”,稱為“剔除劣戰(zhàn)略的占優(yōu)戰(zhàn)略均衡”。其中“招”是占優(yōu)于(優(yōu)于)“不招”的占優(yōu)戰(zhàn)略。

《決策方法》之一:博弈及其應(yīng)用

囚徒困境博弈雖然簡單,但是卻體現(xiàn)了非合作博弈的基礎(chǔ),稱(招,招)為“納什均衡”。納什均衡是局中人策略選擇上構(gòu)成的一種“僵局”,給定其他局中人的選擇不變,任何一個局中人的選擇是最好的,他也不會改變其策略選擇。所以,可以預(yù)期(招,招)是甲乙最終完成的穩(wěn)定的選擇。同時囚徒困境也是西方經(jīng)濟(jì)學(xué)中個人理性與集體理性沖突的一個例證。我們可以利用這個道理來分析日常生活中的許多不合作現(xiàn)象

《決策方法》之一:博弈及其應(yīng)用

公共地養(yǎng)羊MAX養(yǎng)羊數(shù)量每只羊產(chǎn)生的效益養(yǎng)羊數(shù)量類似的例子還有:渤海中的魚愈來愈少了,工業(yè)化中的大氣及河流污染,森林植被的破壞等。解決公共資源過度利用的出路是政府制訂相應(yīng)的規(guī)制政策加強(qiáng)管理,如我國政府規(guī)定海洋捕魚中,每年有一段時間的“休漁期”,此時禁止捕魚,讓小魚苗安安靜靜地生長,大魚好好地產(chǎn)卵,并對魚網(wǎng)的網(wǎng)眼大小作出規(guī)定,禁用過小網(wǎng)眼的捕網(wǎng)打魚,保護(hù)幼魚的生存。又如在三峽庫區(qū),為了保護(hù)庫區(qū)水體環(huán)境,關(guān)閉了前些年泛濫成災(zāi)的許多小造紙廠等。

《決策方法》之一:博弈及其應(yīng)用

《決策方法》之一:博弈及其應(yīng)用

商店甲高價商店甲降價商店乙高價(甲5萬,乙5萬)(甲獲利5萬,乙獲利5萬)(甲8萬,乙0.5萬)(甲獲利8萬,乙獲利0.5萬)商店乙降價(甲0.5萬,乙8萬)(甲獲利0.5萬,乙獲利8萬)

(甲1萬,乙1萬)(甲獲利1萬乙獲利1萬)

“納什均衡”囚徒模型的應(yīng)用:十字路口兩個家用電器商店,相同產(chǎn)品,獨(dú)立定價,雙方按高價比雙方按低價獲利大,但比不上單方降價。本來雙方商定按高價,但實際可能單方降價對甲來說,盡管他不知道乙是選擇了“降”還是“不降”,他發(fā)現(xiàn)他自己選擇“降”都是比選擇“不降”為好的。因此,“不降”是相對于“降”的劣戰(zhàn)略,他不會選擇劣戰(zhàn)略。所以,甲會選擇“降”。參與人players一個博弈中的決策主體,他的目的是通過選擇行動(或戰(zhàn)略)以最大化自己的支付(效用水平)。參與人可能是自然人,也可能是團(tuán)體,如企業(yè),國家等。重要的是:每個參與人必須有可供選擇的行動和一個很好定義的偏好函數(shù)。不做決策的被動主體只能被當(dāng)作環(huán)境參數(shù)。

《決策方法》之一:博弈及其應(yīng)用

支付payoff(效用utility)在一個特定的戰(zhàn)略組合下參與人得到的確定效用水平,或是指參與人得到的期望效用水平。均衡equilibrium指所有參與人的最優(yōu)戰(zhàn)略的組合。

《決策方法》之一:博弈及其應(yīng)用

1943年,盟軍轟炸日軍增援部隊。雙方均知天氣,均知對方可能的策略日軍山本五十六策略走北線(陰天)走南線(晴天)盟軍肯策尼略將軍走北線(陰天)轟炸2天轟炸2天走南線(晴天)轟炸1天轟炸3天盟軍:首先考慮每個策略至少能贏多少,然后選最有利的策略日軍:首先考慮對方每個策略至多會損失多少,然后選損失最少的策略基本思路:從最壞處著想,去爭取最好的結(jié)果MaxMinaij=MinMaxaij=a11=2

《決策方法》之一:博弈及其應(yīng)用

歷史事實:有效轟炸2天

《決策方法》之一:博弈及其應(yīng)用

量化戰(zhàn)略決策:

如圖,某城市被三條河分割成為A,B,C三個區(qū),城市人口A區(qū)占40%,B區(qū)占30%,C區(qū)占30%。目前,該城市沒有溜冰場,甲乙兩個公司計劃建溜冰場,甲公司計劃建兩個溜冰場,乙公司計劃建一個溜冰場,每個公司都知道:如果某區(qū)有兩個溜冰場,那么這兩個溜冰場將平分該區(qū)業(yè)務(wù);如果某區(qū)只有一個溜冰場,那么這個溜冰場將獨(dú)占該區(qū)業(yè)務(wù),如果某區(qū)沒有溜冰場,那么該區(qū)業(yè)務(wù)將平均分配到城市的三個溜冰場,每個公司都希望更多的市場份額。甲,乙兩個公司的最優(yōu)策略是什么?雙方最優(yōu)策略時兩個公司市場份額各為多少?答案:公司甲的最優(yōu)策略是在A區(qū),B區(qū)各建一個溜冰場或者在在A區(qū),C區(qū)各建一個溜冰場;公司乙的最優(yōu)策略是在A區(qū)建一個溜冰場。

《決策方法》之一:博弈及其應(yīng)用

解:(1)顯然,公司甲不會把兩個溜冰場建在同一個區(qū)。所以,兩個公司策略各有三種:

策略1AB區(qū)AC區(qū)策略2策略3BC區(qū)

策略1A區(qū)策略2B區(qū)策略3C區(qū)公司甲公司乙

《決策方法》之一:博弈及其應(yīng)用

表中數(shù)字1表示在該區(qū)建一個溜冰場,0表示在該區(qū)不建溜冰場。設(shè)市場總份額為100,如果市場由兩個公司平分,則各占50份,現(xiàn)在定義公司甲的損益值為:在各種組合策略下公司甲所占市場份額因此公司甲的損益如下:

《決策方法》之一:博弈及其應(yīng)用

公司乙

公司甲

策略1A區(qū)策略2B區(qū)策略3C區(qū)Minaij策略1AB區(qū)70757070*策略2AC區(qū)70707570*策略3BC區(qū)60727260

Maxaij70*7575

如果公司乙采用策略1,則甲最高可能收益70如果公司甲采用策略1,則無論乙如何,甲最低可能收益70公司甲的損益如果公司乙C區(qū),甲BC區(qū)甲收益72

《決策方法》之一:博弈及其應(yīng)用

對策結(jié)果:雙方最優(yōu)策略時甲公司市場份額為70%,乙公司市場份額為30%

《決策方法》之一:博弈及其應(yīng)用

銀行擠兌的原因和預(yù)防儲戶甲乙存款各100萬定期一年,銀行用200萬投資一個好項目,一年后收益共300萬,付甲乙各120萬,銀行提前收回資金被罰款,只退140萬。儲戶甲乙提前取款,銀行必須盡可能退100萬。儲戶乙提前取款到期取款儲戶甲提前取款(70,70)(100,40)到期取款(40,100)(120,120)預(yù)防:1銀行資金來源多元化2良好的業(yè)績3掌握相當(dāng)比例的備用金

否則銀行擠兌導(dǎo)致銀行破產(chǎn)。獵人博弈和Pareto優(yōu)勢獵人甲乙都獵鹿,可以打到一只鹿,每人分10天糧食,一個獵人單獨(dú)打獵,只能打4只兔子,可以作為4天糧食。

獵人乙獵鹿獵兔獵人甲獵鹿(10,10)(0,4)獵兔(4,0)(4,4)(10,10)相對于(4,4)具有Pareto優(yōu)勢智豬博弈按鈴有10單位豬食進(jìn)入槽,按鈴者付出“勞動”為2單位如果小豬按鈴,則大豬先到,大豬可吃9單位,小豬1單位如果大豬按鈴,則小豬先到,小豬可吃4單位,大豬6單位如果大小豬同時按鈴,則大小豬同時到,大豬可吃7單位,小豬3單位小豬按鈴等待大豬按鈴(5,1)(4,4)等待(9,-1)(0,0)鈴槽大豬,小豬看小豬:無論大豬是按鈴或者等待,小豬最好是等待??创筘i:既然小豬最好是等待,大豬最好是按鈴。高速公路貧窮的鄉(xiāng)下公路???城市外圍(4,4)風(fēng)險優(yōu)勢如果你是甲,你選擇上策略可能得6

也可能損失-1000

你選擇下策略可能得5

也可能得4乙左策略右策略如果你是甲上策略(6,6)(-1000,5)下策略(5,-1000)(4,4)(6,6)相對于(4,4)具有Pareto優(yōu)勢(4,4)相對于(6,6)具有風(fēng)險優(yōu)勢(4,4)旱澇保收為什么大股東挑起監(jiān)督經(jīng)理的重任?(智豬博弈的例子)投資1億元的大股東可能因為公司營運(yùn)好,收益增加1000萬,監(jiān)督成本20-50萬他能夠承擔(dān)。小股東可能因為公司營運(yùn)好,收益增加2萬,監(jiān)督成本20-50萬他能夠承擔(dān)嗎?敵軍防守方向

我軍進(jìn)攻方向甲甲不可能甲甲乙甲乙乙乙乙乙不可能甲甲-1,+1-1,+1+1,-1+1,-1甲乙不可能+1,-1-1,+1-1,+1+1,-1乙乙+1,-1+1,-1-1,+1-1,+1普林斯頓大學(xué)的題目—紙上談兵你是司令,你有兩個師兵力攻城,敵人三個師在甲乙兩方向防守規(guī)定雙方必須整師調(diào)動,如果你兵力多于敵人,則攻城勝利。+1,-1:攻城勝利-1,+1:攻城失敗兩個師在甲方向,一個師乙方向敵軍防守方向

我軍進(jìn)攻方向甲甲乙甲乙乙甲甲-1,+1+1,-1乙乙+1,-1-1,+1普林斯頓大學(xué)的題目—紙上談兵兩個師在甲方向,一個師乙方向敵軍防守方向

我軍進(jìn)攻方向甲甲甲不

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負(fù)責(zé)。
  • 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時也不承擔(dān)用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

評論

0/150

提交評論