第八講、博弈論初步高級管理學(xué)講義PPT課件_第1頁
第八講、博弈論初步高級管理學(xué)講義PPT課件_第2頁
第八講、博弈論初步高級管理學(xué)講義PPT課件_第3頁
第八講、博弈論初步高級管理學(xué)講義PPT課件_第4頁
第八講、博弈論初步高級管理學(xué)講義PPT課件_第5頁
已閱讀5頁,還剩14頁未讀, 繼續(xù)免費閱讀

下載本文檔

版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進行舉報或認(rèn)領(lǐng)

文檔簡介

1、6/21/2022School of Economics & Management, Tongji University1高級管理學(xué)高級管理學(xué)第八講第八講 博弈論初步博弈論初步6/21/2022School of Economics & Management, Tongji University21 1囚徒困境和納什均衡囚徒困境和納什均衡 n囚徒困境(prisoners dilemma)博弈論的著名的例子,納什均衡是博弈論的重要概念。囚徒困境說的是,兩個嫌疑犯作案后被捕,起訴機構(gòu)沒有足夠的證據(jù)證明他們搶劫了銀行。所以,若犯人們不坦白,起訴者只能就非法持有武器罪起訴,判犯人有期徒

2、刑2年。起訴者于是向犯人采取攻心戰(zhàn),說可以“坦白從寬、抗拒從嚴(yán)”。如果一人坦白,則坦白者從寬處理,判徒刑1年,抗拒者從嚴(yán)處理,判徒刑12年。如果兩人都坦白,每人依法判徒刑10年。兩個囚徒是坦白還是不坦白呢?6/21/2022School of Economics & Management, Tongji University31.11.1囚徒困境囚徒困境 乙乙 不坦白不坦白 坦白坦白 不坦白不坦白 -2 -2 -1 -12 甲甲 坦白坦白 -12 -1 -10 -10 6/21/2022School of Economics & Management, Tongji Unive

3、rsity41.2 1.2 博弈均衡博弈均衡n博弈論假設(shè)博弈的參加者都是理性的,即在對手戰(zhàn)略博弈論假設(shè)博弈的參加者都是理性的,即在對手戰(zhàn)略給定的條件下,每個參加者都會選擇適當(dāng)?shù)膽?zhàn)略來實給定的條件下,每個參加者都會選擇適當(dāng)?shù)膽?zhàn)略來實現(xiàn)自己報酬的最大化(或損失最小化)。問題是博弈現(xiàn)自己報酬的最大化(或損失最小化)。問題是博弈的一方不能控制另一方的決策。當(dāng)參加者甲以最優(yōu)戰(zhàn)的一方不能控制另一方的決策。當(dāng)參加者甲以最優(yōu)戰(zhàn)略對付乙的某個戰(zhàn)略時,乙會發(fā)現(xiàn)原先的戰(zhàn)略不是對略對付乙的某個戰(zhàn)略時,乙會發(fā)現(xiàn)原先的戰(zhàn)略不是對付甲的實際戰(zhàn)略的最佳戰(zhàn)略,因而會改變其戰(zhàn)略。要付甲的實際戰(zhàn)略的最佳戰(zhàn)略,因而會改變其戰(zhàn)略。要是

4、乙改變了戰(zhàn)略,參加者甲也要進行相應(yīng)的改變。這是乙改變了戰(zhàn)略,參加者甲也要進行相應(yīng)的改變。這樣的改變行為會否停止?這里借用經(jīng)濟學(xué)常用的均衡樣的改變行為會否停止?這里借用經(jīng)濟學(xué)常用的均衡概念,我們把博弈的穩(wěn)定結(jié)果稱為均衡,博弈的均衡概念,我們把博弈的穩(wěn)定結(jié)果稱為均衡,博弈的均衡也稱為博弈的解。也稱為博弈的解。均衡是指所有的參加者都不想改變均衡是指所有的參加者都不想改變戰(zhàn)略的狀態(tài)。戰(zhàn)略的狀態(tài)。 6/21/2022School of Economics & Management, Tongji University51.3 1.3 占優(yōu)均衡占優(yōu)均衡n在一些特殊的博弈中,一個參加者的最優(yōu)戰(zhàn)略可能

5、并不依賴于其在一些特殊的博弈中,一個參加者的最優(yōu)戰(zhàn)略可能并不依賴于其他參加者的戰(zhàn)略選擇,也就是說,不論其他參加者選擇什么戰(zhàn)略,他參加者的戰(zhàn)略選擇,也就是說,不論其他參加者選擇什么戰(zhàn)略,他的最優(yōu)戰(zhàn)略是唯一的,這樣的最優(yōu)戰(zhàn)略被稱為他的最優(yōu)戰(zhàn)略是唯一的,這樣的最優(yōu)戰(zhàn)略被稱為“占優(yōu)戰(zhàn)略占優(yōu)戰(zhàn)略”(dominant strategy)。)。n在上述的囚徒困境博弈中,每個囚徒可選擇的戰(zhàn)略有兩種:坦白在上述的囚徒困境博弈中,每個囚徒可選擇的戰(zhàn)略有兩種:坦白與不坦白。顯然,不論另外一個囚犯選擇什么戰(zhàn)略,每個囚犯的與不坦白。顯然,不論另外一個囚犯選擇什么戰(zhàn)略,每個囚犯的最優(yōu)戰(zhàn)略都是最優(yōu)戰(zhàn)略都是“坦白坦白”。例如

6、,如果乙選擇坦白,囚犯甲選擇坦。例如,如果乙選擇坦白,囚犯甲選擇坦白時的報酬為白時的報酬為-10,選擇不坦白的報酬為,選擇不坦白的報酬為-12,因而坦白比不坦,因而坦白比不坦白好;如果乙選擇不坦白,甲坦白的報酬為白好;如果乙選擇不坦白,甲坦白的報酬為-1,不坦白的報酬為,不坦白的報酬為-2,所以坦白還是比不坦白好。也就是說,所以坦白還是比不坦白好。也就是說,“坦白坦白”是囚犯甲的是囚犯甲的占優(yōu)戰(zhàn)略。由于對稱性,占優(yōu)戰(zhàn)略。由于對稱性,“坦白坦白”也是囚犯乙的占優(yōu)戰(zhàn)略。于是,也是囚犯乙的占優(yōu)戰(zhàn)略。于是,(坦白,坦白)或(坦白,坦白)或(-10,-10)是囚徒困境博弈的占優(yōu)均衡。)是囚徒困境博弈的占

7、優(yōu)均衡。 6/21/2022School of Economics & Management, Tongji University6個人理性與集體理性個人理性與集體理性n甲乙兩人都尋求最好的結(jié)果,而得到的甲乙兩人都尋求最好的結(jié)果,而得到的卻是較糟的結(jié)果。這個例子說明,在多卻是較糟的結(jié)果。這個例子說明,在多人決策的環(huán)境里,個人理性與集體理性人決策的環(huán)境里,個人理性與集體理性經(jīng)常是矛盾的,這種集體利益和個人利經(jīng)常是矛盾的,這種集體利益和個人利益的之間的益的之間的沖突被稱為沖突被稱為“囚徒困境囚徒困境”。 6/21/2022School of Economics & Manageme

8、nt, Tongji University71.4 1.4 納什均衡納什均衡n納什均衡是這樣一種穩(wěn)定狀態(tài),博弈的任何一方參加者都不會改變其戰(zhàn)略,如果其他參加者都不改變戰(zhàn)略的話。 n依定義,任何占優(yōu)戰(zhàn)略均衡必定是納什均衡,但納什均衡卻不一定是占優(yōu)戰(zhàn)略均衡,占優(yōu)戰(zhàn)略均衡是比較強的均衡概念。囚徒困境中的(坦白,坦白)就是納什均衡。經(jīng)濟生活中的眾多集體利益和個人利益的之間的沖突帶來的非帕累托有效狀態(tài)都是納什均衡。6/21/2022School of Economics & Management, Tongji University8納什均衡納什均衡( (嚴(yán)格的定義嚴(yán)格的定義) )納納什什均均衡

9、衡: 在有 n個參加者的博弈里, 記Si為參加者i的戰(zhàn)略空間,i為其報酬函數(shù), 如果存在一組戰(zhàn)略iinSssss*2*1,, 使得對每一個參加者ni i, 1都有 iiniiiiniSssssssssss,*1*1*2*1*2*1 那么,*2*1,nsss就是納什均衡。 6/21/2022School of Economics & Management, Tongji University9完全信息靜態(tài)博弈的幾個著名博弈完全信息靜態(tài)博弈的幾個著名博弈n智豬博弈智豬博弈(boxed pigs)n豬圈里有兩頭豬,一頭大豬,一頭小豬,豬豬圈里有兩頭豬,一頭大豬,一頭小豬,豬圈的一頭有個豬食槽

10、,另一頭安裝一個圈的一頭有個豬食槽,另一頭安裝一個 按按鈕,控制著豬食的供應(yīng)。按一下按鈕會有鈕,控制著豬食的供應(yīng)。按一下按鈕會有10單位的豬食進槽,但誰按按鈕誰就要付單位的豬食進槽,但誰按按鈕誰就要付2個單位的成本。若大豬先到,大豬吃到個單位的成本。若大豬先到,大豬吃到9個個單位,小豬只能吃單位,小豬只能吃1個單位;若同時到,大個單位;若同時到,大豬吃豬吃7個單位,小豬吃個單位,小豬吃3個單位;若小豬先個單位;若小豬先到,大豬吃到,大豬吃6個單位,小豬吃個單位,小豬吃4個單位。個單位。6/21/2022School of Economics & Management, Tongji U

11、niversity10標(biāo)準(zhǔn)型支付矩陣標(biāo)準(zhǔn)型支付矩陣 小小豬豬 按按 等等待待 按按 1 5 4 4 大大豬豬 等等待待 -1 9 0 0 6/21/2022School of Economics & Management, Tongji University11性別戰(zhàn)(性別戰(zhàn)(battle of the sexesbattle of the sexes) Rose 三三級級片片 紀(jì)紀(jì)錄錄片片 三三級級片片 1 2 0 0 Dell 紀(jì)紀(jì)錄錄片片 0 0 2 1 6/21/2022School of Economics & Management, Tongji Universit

12、y12市場進入阻撓博弈 在在位位者者 默默許許 斗斗爭爭 進進入入 50 40 0 -10 進進入入者者 不不進進入入 300 0 300 0 6/21/2022School of Economics & Management, Tongji University132動態(tài)博弈n靜態(tài)博弈,即博弈各方同時行動,但是經(jīng)濟生活中許多情形是動態(tài)博弈,也就是指博弈參加者的行動有先后順序,又叫序貫博弈。 6/21/2022School of Economics & Management, Tongji University142.1完全信息動態(tài)博弈的分類完全信息動態(tài)博弈的分類n博弈總的可以

13、分為完全信息的博弈(即博弈參博弈總的可以分為完全信息的博弈(即博弈參加者的收益函數(shù)是共同知識的博弈)和不完全加者的收益函數(shù)是共同知識的博弈)和不完全信息博弈(博弈中的一些參加者不知道其它參信息博弈(博弈中的一些參加者不知道其它參加者的收益函數(shù))。加者的收益函數(shù))。完全信息動態(tài)博弈完全信息動態(tài)博弈又分為又分為完全且完美信息(完全且完美信息(complete and perfect information)的動態(tài)博弈和完全但不完美信)的動態(tài)博弈和完全但不完美信息博弈兩類。前者是指在博弈進行的每一步當(dāng)息博弈兩類。前者是指在博弈進行的每一步當(dāng)中,要選擇行動的參加者都知道這一步之前博中,要選擇行動的參加

14、者都知道這一步之前博弈進行的整個過程;后者是指在博弈的某些階弈進行的整個過程;后者是指在博弈的某些階段,要選擇行動的參加者并不知道在這一步之段,要選擇行動的參加者并不知道在這一步之前博弈進行的整個過程前博弈進行的整個過程 6/21/2022School of Economics & Management, Tongji University152.2子博弈完美納什均衡(子博弈完美納什均衡(SPNESPNE)n一個子博弈是全部博弈的一部分,當(dāng)全部博弈進行到一個子博弈是全部博弈的一部分,當(dāng)全部博弈進行到任何一個階段,到此為止的進行過程已經(jīng)稱為博弈參任何一個階段,到此為止的進行過程已經(jīng)稱為博

15、弈參加各方的共同知識,而其后尚未開始進行的部分就是加各方的共同知識,而其后尚未開始進行的部分就是一個子博弈。如果博弈參加者的戰(zhàn)略在每一子博弈中一個子博弈。如果博弈參加者的戰(zhàn)略在每一子博弈中都構(gòu)成納什均衡,我們稱此納什均衡是子博弈完美納都構(gòu)成納什均衡,我們稱此納什均衡是子博弈完美納什均衡(什均衡(subgame perfect Nash equilibrium)(Selten,1965)。)。n所有動態(tài)博弈的中心問題是可信任性,所以不可置信所有動態(tài)博弈的中心問題是可信任性,所以不可置信的威脅被研究較多,子博弈完美納什均衡(的威脅被研究較多,子博弈完美納什均衡(SPNE)是)是不含不可置信的威脅的

16、。子博弈完美納什均衡可以用不含不可置信的威脅的。子博弈完美納什均衡可以用逆向歸納法(逆向歸納法(backwards-induction)找出)找出 6/21/2022School of Economics & Management, Tongji University16幾種著名的動態(tài)博弈幾種著名的動態(tài)博弈nStackelbeg模型nHotelling模型(地點模型)6/21/2022School of Economics & Management, Tongji University173重復(fù)博弈重復(fù)博弈: :特殊的動態(tài)博弈特殊的動態(tài)博弈n同一博弈重復(fù)多次,稱為重復(fù)博弈同一博

17、弈重復(fù)多次,稱為重復(fù)博弈(repeated game),其中的每一次),其中的每一次博弈稱為博弈稱為“階段博弈階段博弈”(stage game),事實上它是動態(tài)博弈的一種),事實上它是動態(tài)博弈的一種特殊情況。它的均衡狀況可能與一次性特殊情況。它的均衡狀況可能與一次性博弈不同,被研究最多的重復(fù)博弈還是博弈不同,被研究最多的重復(fù)博弈還是囚徒困境博弈。囚徒困境博弈。 6/21/2022School of Economics & Management, Tongji University18例子例子: :古諾產(chǎn)量博弈古諾產(chǎn)量博弈 乙企業(yè) 守約 違約 守約 1000 1000 1100 800 甲企業(yè) 違約 800 1100 900 900 表:古諾產(chǎn)量博弈 6/21/2022School of Economics & Managemen

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負責(zé)。
  • 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時也不承擔(dān)用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

評論

0/150

提交評論