第1章博弈論基本模型_第1頁
第1章博弈論基本模型_第2頁
第1章博弈論基本模型_第3頁
第1章博弈論基本模型_第4頁
第1章博弈論基本模型_第5頁
已閱讀5頁,還剩34頁未讀, 繼續(xù)免費(fèi)閱讀

下載本文檔

版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進(jìn)行舉報(bào)或認(rèn)領(lǐng)

文檔簡介

1、 第第1章章 博弈論基本模型博弈論基本模型 (game theory)華僑大學(xué)商學(xué)院什么是學(xué)習(xí)?什么是學(xué)習(xí)? 學(xué)習(xí)的三個(gè)層次學(xué)習(xí)的三個(gè)層次(大學(xué)之道,在明明德,在親民,在止于至善大學(xué)之道,在明明德,在親民,在止于至善) 專業(yè)學(xué)習(xí)專業(yè)學(xué)習(xí):謀職、謀生(身無長物、何以生存)。 事理學(xué)習(xí):事理學(xué)習(xí):明白事理、懂得分析生活中的很多問題。(崔琦:明白這個(gè)世界是一個(gè)什么樣子,這很重要)。一個(gè)人,其實(shí)只要懂得了加減乘除四則運(yùn)算,就可以掙到錢買房買車,在物質(zhì)世界中生活的很好。但這只是像一個(gè)盲人一樣在生活,“春天來了,但我卻看不到” 。(明明德) 人生學(xué)習(xí):人生學(xué)習(xí):充實(shí)人生、提高人生的境界、把學(xué)習(xí)融入人的生活

2、中。人不是做事和掙錢的工具,而是宇宙中的有血有肉的生靈,需要提高生活的趣味,享受趣味化的人生,這就需要學(xué)習(xí)。一個(gè)人,不會欣賞二泉映月,不會感受過禪宗的靜謐,從來也不思考什么是天行健,好像也是在生活??纯春芏嗳讼掳嗪笤谧鍪裁??打牌、或者歌廳洗腳房等,當(dāng)衣食住行解決了之后,就不知怎么過了,只有賭博和玩樂,卻找不到真正的趣味。(身體在成長、心靈也在成長嗎?)(新民) 仰望星空仰望星空為什么學(xué)習(xí)?為什么學(xué)習(xí)? 從學(xué)習(xí)中獲得心靈的提高,獲得心靈的享受。 學(xué)習(xí),其實(shí)就為自己創(chuàng)造一個(gè)美麗的心靈世界的過程。 有人說,我也沒什么追求,就學(xué)一點(diǎn)實(shí)用知識就行,但問題是,你沒有那些“無用”的知識,你怎么駕馭哪些實(shí)用的

3、知識呢?“世人只知有用之用,而不知無用只用”。 很多人30歲后就不再讀書,到60歲還是30年前的思維;很多人感慨“現(xiàn)在一讀書就頭痛”;農(nóng)村現(xiàn)在不要為生存而掙扎了,那做什么呢?“我不打牌又做什么呢?” 每個(gè)人都生活在現(xiàn)實(shí)的物質(zhì)世界和心靈的精神世界中,但很多人只知現(xiàn)實(shí)世界的繁華,卻不知心靈世界的清新和高遠(yuǎn)。行萬里路、讀萬卷書,就是為追求心靈世界。這些年我深刻體會到:生活的基礎(chǔ)是衣食住行,但生活的重點(diǎn)在于文化和精神。我不知道文化有什么用,我只知道一個(gè)人沒有了文化還有什么用呢? 教師的功能:教師的功能:催化劑催化劑(使學(xué)生更快速更深入地學(xué)習(xí))(使學(xué)生更快速更深入地學(xué)習(xí)) 大醫(yī)醫(yī)心:大醫(yī)醫(yī)心:能醫(yī)心者,

4、才是大醫(yī)。能醫(yī)心者,才是大醫(yī)。0 緒 論 一、從三國演義談起一、從三國演義談起 1、曹操走華容道,有一條大路和一條小路,走哪條路呢? 2、田忌與齊王賽馬,孫臏出主意。 3、三個(gè)和尚沒水喝,為什么? 4、一個(gè)村子里,道路泥濘,村子里一家很富有,其他貧窮,該修一條好路,能修成嗎? 5、剪刀-石頭-布,為什么成為猜先的選擇? 6、黔驢是如何技窮的? 7、a、b、c三人去釣魚,a釣了5條,b釣了3條,c沒釣著,中午一起吃飯,把釣的魚吃完了,c不好意思,就給了a和b共8元錢,a和b如何分配? 二、什么是博弈論 1、安踏的廣告是什么? 2、一般人平時(shí)的思維是怎么樣的? (決策,只知其一不知其二)(“我以為

5、”,“我覺得”) 3、博弈論的思想是什么?(對策) 博弈,就是對手之間的游戲(game),在游戲中如何做到立于不敗之地。 博:? 弈:? 下棋的最高享受是什么? 囚徒困境囚徒困境(prisoners dilemma) 博弈論的創(chuàng)立與發(fā)展博弈論的創(chuàng)立與發(fā)展 1、博弈論思想最早產(chǎn)生于我國古代、博弈論思想最早產(chǎn)生于我國古代 2000多年前的春秋時(shí)期孫武在孫子兵法中論述的軍事思想和治國策略,就蘊(yùn)育了豐富和深刻的博弈論思想。 田忌賽馬:齊威王的上、中、下馬分別優(yōu)于大將田忌的上、中、下,但田忌上馬、中馬分別優(yōu)于齊威王的中、下馬。比賽規(guī)則:每次雙方各出三匹馬,一對一比賽三場,第一場的輸方要賠一千金給贏方。田

6、忌策略:田忌策略:齊齊上馬上馬中馬中馬下馬下馬田田上馬上馬中馬中馬下馬下馬結(jié)結(jié) 果:果:田忌將軍每次輸?shù)羧Ы鹛锛蓪④娒看屋數(shù)羧Ы鹬\士孫臏謀士孫臏 策略:策略:齊齊上馬上馬中馬中馬下馬下馬田田下馬下馬上馬上馬中馬中馬結(jié)結(jié) 果:果:田忌將軍勝二負(fù)一贏一千金田忌將軍勝二負(fù)一贏一千金博弈論的創(chuàng)立與發(fā)展博弈論的創(chuàng)立與發(fā)展 2、博弈論的發(fā)展階段、博弈論的發(fā)展階段 第一階段:萌芽期第一階段:萌芽期(20世紀(jì)世紀(jì)40年代前年代前)。利益沖突的研究是分散和初步的、帶有很大程度的隨意性。 孫子兵法:古諾(cournot,1883)古諾的“雙寡頭壟斷”模型;艾奇沃思(f.y.edgeworth,1925)“雙寡

7、頭等分市場”;霍特林(h.hotelling,1929)產(chǎn)品差異而引起的“價(jià)格競爭”模型;斯塔克爾伯格(h.v.stackelberg,1934)“領(lǐng)導(dǎo)跟隨(leaderfollower)”模型;斯威齊(p.m.sweezy,1939)“折彎的需求曲線(kinky demand curve)”模型等等。 第二階段:創(chuàng)立期第二階段:創(chuàng)立期(20世紀(jì)世紀(jì)40年代年代)。博弈論首次系統(tǒng)地被引入經(jīng)濟(jì)學(xué)。 1944年馮諾依曼(von.neuman)和摩根斯坦恩(morgen stlern)合作出版了對策論與經(jīng)濟(jì)行為,從而奠定了合作博弈的理論與方法。博弈論的創(chuàng)立與發(fā)展博弈論的創(chuàng)立與發(fā)展 第三階段:大發(fā)展期

8、第三階段:大發(fā)展期(20世紀(jì)世紀(jì)50s90s)。非合作博弈以及合作博弈的理論獲得了空前的發(fā)展。 納什(nash,1950)n人非合作博弈及提出博弈均衡的定義 塔克(a tucker)提出“囚徒困境”(prisoners dilemma)模型 澤爾騰(selten,1965)提出精練子博弈納什均衡概念,并把這一概念引入到了動態(tài)分析之中 海薩尼(j.harsnyi,19671986)提出貝葉斯納什均衡概念,并把這一概念引入不完全信息博弈模型研究 澤爾騰(selten ,1975),克瑞普斯(kreps,1982)和威爾森(wilson,1982)。 弗得伯格(fudenberg,1991)和泰勒爾

9、(tirole,1991)研究了精練貝葉斯納什均衡,解決動態(tài)不完全信息博弈。澤爾騰定義了“顫抖手均衡”(trembling hand equilibrium);克瑞普斯和威爾森定義了“序貫均衡”(sequential equilibrium)并提出了著名的“信譽(yù)”問題模型;弗得伯格和泰勒爾給出了“精練貝葉斯均衡”的正式定義。 顫抖手均衡序貫均衡精練貝葉斯均衡(但在許多情況下,三個(gè)概念是一致的) 博弈論近期發(fā)展:除了博弈論與信息經(jīng)濟(jì)學(xué)的結(jié)合外,還出現(xiàn)了新的理論與應(yīng)用分支諸如博弈學(xué)習(xí)理論、進(jìn)化(演化)博弈論、博弈論與新制度經(jīng)濟(jì)學(xué)、博弈論與行為科學(xué)、博弈論與實(shí)驗(yàn)經(jīng)濟(jì)學(xué)、博弈論與組織管理的結(jié)合。1.1

10、 有限擴(kuò)展型博弈模型有限擴(kuò)展型博弈模型 博弈模型的構(gòu)建博弈模型的構(gòu)建 應(yīng)用博弈論方法分析研究問題,首先要構(gòu)造出博弈模型來,因而需要從大量的博弈活動中抽象出博弈模型的基本要素,對這些要素進(jìn)行嚴(yán)格、準(zhǔn)確的刻畫后,形成博弈模型。 將博弈活動構(gòu)造成博弈模型,需要了解以下6個(gè)方面的情況: 1.局中人; 2.外生事件的概率分布; 3.局中人選擇行動的次序; 4.局中人所能選擇的行動; 5. 局中人在選擇行動時(shí)所了解的信息。 6.局中人的支付。構(gòu)造博弈模型所需要的要素構(gòu)造博弈模型所需要的要素 1.局中人集合局中人集合 ,稱 為局中人或參與人集合。 中元素稱為參與人或局中人。參與人不專指人,它泛指參與博弈活動

11、的政府、企業(yè)、地區(qū)、國家、個(gè)人等決策主體。通常用“0”表示虛擬局中人,它的行為是以確定的概率分布進(jìn)行隨機(jī)選擇, 表示實(shí)際參與人。 2.行動集合行動集合 稱參與人 在博弈中所有可能選擇的行動構(gòu)成的集合 為局中人i的行行動集合動集合。 中的元素 稱為局中人i 的行動行動。局中人的行動集合可能是有限集,也可能是無限集。如果博弈活動中每個(gè)局中人的行動集合都是有限集,且每個(gè)局中人行動的次數(shù)也是有限的,稱該博弈為有限博弈有限博弈。 3.博弈樹博弈樹對于有限博弈,可用博弈樹直觀地刻畫它,市場進(jìn)入問題的博弈樹如圖1-1所示(見p2上的例子)。n, 2 , 1 , 0nnnni, 2 , 1iniaiaia4.

12、 支付向量支付向量 博弈樹中終點(diǎn)z下面的向量 稱為支付向支付向量量,它的第 個(gè)分量表示博弈結(jié)束于z時(shí),局中人i所得的支付。支付可表示參與人的某種收益或損失。本書中的支付指收益、效用、利潤等。正式地,支付向量是終點(diǎn)集合z到n維向量集合 的映射。zzzuzuzuzurzunn),(,),()()(,:21,),(21nuuuu,), 2 , 1(ninr 容許i01容許抵制進(jìn)入進(jìn)入不進(jìn)不進(jìn)旺盛疲軟圖1-1 市場進(jìn)入博弈樹 5. 信息集與信息集分割信息集與信息集分割 信息集由同一個(gè)局中人、在相同的時(shí)點(diǎn)上的具有相同信息的決策節(jié)點(diǎn)組成。用 表示局中人i的第k個(gè)信息集。它滿足 (1) ( 表示空集); (

13、2)從博弈起始點(diǎn)到任一終點(diǎn)的路徑至多與 交一點(diǎn)(描寫同一信息集中的節(jié)點(diǎn)處于同一時(shí)點(diǎn)上); (3)從 中的任一節(jié)點(diǎn)出發(fā),局中人i可能選擇的行動集合都相同(因?yàn)榫种腥嗽谕恍畔⒓牟煌?jié)點(diǎn)上具有相同的信息)。 在博弈樹上,將屬于同一信息集的節(jié)點(diǎn)用虛線框在一起。 稱 為局中人 的信息集類信息集類(在數(shù)學(xué)上,稱以集合為元素的集合為類)。 稱 為信息集分割信息集分割。iki), 2 , 1 , 0, 2 , 1 , 0(irkniikiikiiki,21iiriiiiiii,), 2 , 1 , 0(ni,210niiiii,有限擴(kuò)展型博弈模型的定義有限擴(kuò)展型博弈模型的定義定義定義1.1 稱稱 為有限擴(kuò)

14、展型博弈模型。有限擴(kuò)展型博弈模型。其中n為參與人集合,y為博弈樹,u為支付向量,i為信息集分割,q為外生事件的概率分布。完全信息博弈與不完全信息博弈完全信息博弈與不完全信息博弈如果所有的局中人對構(gòu)成g的元素n,y,u,i,q都完全了解,稱g為完全信完全信息博弈息博弈,否則為不完全信息博弈不完全信息博弈。靜態(tài)博弈與動態(tài)博弈靜態(tài)博弈與動態(tài)博弈如果所有的局中人都同時(shí)選擇行動,稱g為靜態(tài)博弈靜態(tài)博弈,否則,稱g為動態(tài)博弈動態(tài)博弈。靜態(tài)博弈靜態(tài)博弈更本質(zhì)的特征是所有局中人在選擇行動時(shí)不知道對手選擇了什么行動。q, i ,u,y,ng 例例1.1 考慮按以下步驟進(jìn)行的博弈活動。 第1步 局中人1從字母t,

15、h中選一個(gè); 第2步 局中人2不知第1步的選擇,再從h,t中選一字母; 第3步 局中人知道1,2兩步的選擇,又從t,h中選一字母; 第4步 局中人2不知第3步的選擇,但知1,2兩步的選擇,最后從t,h中選一字母,博弈結(jié)束。按照每步選擇的結(jié)果,每個(gè)局中人各得一筆報(bào)酬(略)。 該博弈的局中人集合 . 該博弈的信息集合分別為 ,其中 。 2 , 1n i ,i i21i ,ii ,i ,i i,i ,ii ,i ,i i2524232221215141312111,23i22i12ihhhttt圖1-2hh th th th thh th th tthhhtttt21i24i25i13i14i15i

16、11i 信息集可以告訴我們以下信息集可以告訴我們以下4點(diǎn)點(diǎn) 1.在一個(gè)信息集上應(yīng)由哪個(gè)參與人選擇行動。 2.從一個(gè)信息集出發(fā),局中人可能選擇哪些行動。 3.局中人在一個(gè)信息集上選擇行動時(shí)已知道了哪些信息。 4.單點(diǎn)信息集表明相應(yīng)的局中人完全了解博弈從開始到該信息集的博弈歷程。 完美信息博弈完美信息博弈 如果g的每個(gè)信息集都是單點(diǎn)信息集。表明博弈的每個(gè)參與人在選擇行動時(shí)對博弈到現(xiàn)在為止的歷程都完全了解,這時(shí)稱g為完美信息博弈完美信息博弈。 擴(kuò)展型博弈不僅能刻畫動態(tài)博弈,也能刻畫靜態(tài)博弈擴(kuò)展型博弈不僅能刻畫動態(tài)博弈,也能刻畫靜態(tài)博弈靜態(tài)擴(kuò)展型博弈的例子靜態(tài)擴(kuò)展型博弈的例子囚徒困境問題:囚徒困境問題

17、:p11 p11 例例1.61.6 完全信息完全信息: :博弈各方對各個(gè)節(jié)點(diǎn)的博弈各方對各個(gè)節(jié)點(diǎn)的支付都很明了支付都很明了. .完美信息完美信息: :博弈各方對博弈進(jìn)行的路博弈各方對博弈進(jìn)行的路徑都很明了徑都很明了, ,完美信息這一概念只用完美信息這一概念只用于動態(tài)博弈。于動態(tài)博弈。例例1.2 兩個(gè)參與人同時(shí)從字母t,h中選擇一個(gè),博弈結(jié)束時(shí)兩個(gè)參與人各得一筆支付,該博弈的博弈樹如圖1-3所示。練習(xí):寫出剪刀-石頭-布的博弈樹。hhhttt圖1-321i11i 抗拒抗拒抗拒坦白坦白坦白圖1-411i5580081121i 擴(kuò)展型博弈的擴(kuò)展型博弈的子博弈子博弈 擴(kuò)展型博弈的子博弈大體上說是原博弈

18、的一部分,但它不能破壞原博弈的信息集。 定義定義1.2 設(shè) 為一有限擴(kuò)展型博弈,從y的決策節(jié)點(diǎn)h出發(fā)的子博弈子博弈 滿足 (1)h是g的單點(diǎn)信息集; (2) n ; (3) 是y的子樹,它由h及其后的所有節(jié)點(diǎn)與終點(diǎn)構(gòu)成; (4) 不能割裂g的信息集; (5)若“自然”仍屬于 ,則 中“自然”的概率分布 ; (6)設(shè)z為 的終點(diǎn),支付向量 。p, i ,u,y,ng hhhhhhpiuyng,hnhyhghnhghpphp)()(zuzuh1.2 有限擴(kuò)展型博弈的策略有限擴(kuò)展型博弈的策略 策略的定義策略的定義 定義定義1.3 局中人 的策略集合策略集合用 表示, 中的元素 稱為局中人 i 的策略

19、策略。它定義為局中人i的信息集類 到行動集 的映射: 策略是信息集的映射,行動是映射值。兩者是不策略是信息集的映射,行動是映射值。兩者是不同的概念。相當(dāng)于策略是函數(shù),行動是函數(shù)值。同的概念。相當(dāng)于策略是函數(shù),行動是函數(shù)值。ni, 2 , 1isisiiiiiiikiiiirkniaaaisais, 2 , 1, 2 , 1,)(,:isia 例例1.3 考慮圖1-1所示的擴(kuò)展型博弈的策略。(p7) 策略 表明參與人2 在第1個(gè)信息集 上 選擇行動 ,在第2個(gè)信息集 上選擇行動 。其余策略可同樣理解。a11-進(jìn)入;a12-不進(jìn)入;a21-允許;,a22-抵制。x1-表示2在i21上選擇的行動,可

20、以是a21和a22; x2-是在i22上的選擇。 容許i01容許抵制進(jìn)入進(jìn)入不進(jìn)不進(jìn)旺盛疲軟圖1-1 市場進(jìn)入博弈樹1s1112aa,2s121),(xxx,aa2221,2xaa2221,)aa(),aa(),aa(),aa(2222212222212121,)a ,a (212221i22a22i21a11i21i22i 例例1.4 考慮例1.1所給出的擴(kuò)展型博弈的策略。 例例1.5 考慮例1.2給出的擴(kuò)展型博弈的策略。 在靜態(tài)博弈模型中,局中人策略與行動等在靜態(tài)博弈模型中,局中人策略與行動等同同。1skxxxxxx),(54321,,h,t5 , 4 , 3 , 2 , 1k12ss h

21、,tas,h,tas22111.3 一般擴(kuò)展型博弈模型一般擴(kuò)展型博弈模型構(gòu)成一般擴(kuò)展型博弈模型的要素構(gòu)成一般擴(kuò)展型博弈模型的要素(1)一個(gè)有限的局中人集合: ,其中“0”表示虛擬局中人“自然”,它以確定的概率分布進(jìn)行隨機(jī)選擇。(2)一個(gè)滿足下列三條性質(zhì)的行動序列集合h。h中包含一個(gè)空序列,即 ;如果局中人的有限行動序列 h,則對 正整數(shù) ,都有 h;對于局中人的無限行動序列 ,若對任何正整數(shù) 都 有 ,則 h,否則 h。稱滿足以上三條性質(zhì)的行 動序列集合h為歷史集歷史集。稱歷史集中的元素 h為博弈的一段歷史一段歷史。稱一段歷史 h為博弈的終點(diǎn),如果它是無限的( )或不 存在 使 h。博弈全體終

22、點(diǎn)構(gòu)成集合記為 z 。(3)局中人映射 ,表示歷史h之后應(yīng)由局中人i選擇行動。(4)定義“自然”的行動集合上的概率分布為q。n, 2 , 1 , 0nhk1()kka1()kka1()k lkah1()kka1)(kkahk1)(kkak1ka1k1kk)a (zhh, i)h(p,nzh:pkl1)(kkal (5)信息集分割。 對于每個(gè)局中人 ,稱集合 ( 可為無窮)為 的一個(gè)信息集分割, 稱為局中人的信息集,如果它滿足性質(zhì) ; 只要 與 同在 內(nèi),則 。 表示局中人 在歷史 之后的可能選擇的行動集合。 對 , 中至多有一段歷史與h相交。 (6)支付向量 支付向量是終點(diǎn) 到 的映射 。 其

23、中 是當(dāng)博弈結(jié)束于 ,局中人 的支付值。in,21iiriiiiiiiir)(ihphhiikrki, 2 , 1,iiikrki, 2 , 1,hhiikrki, 2 , 1,)()(haha)(haihhz ), 2 , 1(iikrkiznrzzzuzuzuzurzunn),(,),(),()(,:21)(zuiz), 2 , 1(ni例例1.1的一般擴(kuò)展型博弈模型的一般擴(kuò)展型博弈模型1.局中人集合 .2.歷史集合h= ,t,h,tt,th,ht,hh,ttt,tth,tht,thh,htt,hth,hht,hhh,tttt,ttth,ttht,tthh,thtt,thth,thh,th

24、hh,httt,htth,htht,hthh,hhtt,hht,hhht,hhhh終點(diǎn)集合z=tttt,ttth,ttht,tthh,thtt,thth,thht,thhh,httt,htth,htht,hthh,hhtt,hhth,hhht,hhhh3.局中人映射。 , , ,4.信息集分割。 其中 , , , , .5.支付向量。一般擴(kuò)展型博弈模型的策略一般擴(kuò)展型博弈模型的策略和有限擴(kuò)展型模型一樣,一般擴(kuò)展型博弈模型的策略一般擴(kuò)展型博弈模型的策略也是定義為信息集類到行動集的映射。 , ,( 可為 )。一般擴(kuò)展型博弈模型的子博弈一般擴(kuò)展型博弈模型的子博弈一般擴(kuò)展型博弈模型的子博弈子博弈是從一

25、個(gè)單點(diǎn)信息集引出,由局中人映射所確定的到終點(diǎn)集合的子博弈,子博弈不能割裂原博弈的信息集。2 , 1n 1)(p2)h(p)t(p1)hh(p)ht(p)th(p)tt(p)hht(p)hth(p)htt(p)thh(p)tht(p)tth(p)ttt(p2)hhh(pi ,i ,i ,i ,i i1514131211111ithi13tti12hti14hhi15iikiiiiaaisais)(.:irkni, 2 , 1, 2 , 1irir1.4 策略型博弈模型策略型博弈模型1.4.1 策略型博弈模型的定義策略型博弈模型的定義定義策略型博弈模型,策略型博弈模型,僅需要局中人、策略、支付這三

26、個(gè)要素。靜態(tài)博弈的策略與行動是等同的靜態(tài)博弈的策略與行動是等同的。策略組合策略組合稱由每個(gè)局中人 的策略 所構(gòu)成的向量 為一個(gè)策略組策略組合合,其中 。稱n個(gè)局中人的策略集 的乘積集合 為策略組合集合策略組合集合。支付函數(shù)支付函數(shù)局中人 的支付函數(shù)是定義在策略組合集合s上,取值于實(shí)數(shù)的映射。 。局中人i 的支付函數(shù)是 定義于策略組合集合上,而非 i的自身策略集 上,表明局中人i的支付不僅與自己的策略 有關(guān),也與對手的策略組合 有關(guān),即博弈論中局中人之間的利益是互相制約的。這是博弈論與決策理論的一個(gè)重要區(qū)別。定義定義1.5 稱 為一個(gè)策略型博弈模型策略型博弈模型 inis),(21nssssii

27、ss nss,1, 2 , 1,),(211nisssssssiininiinssusursuiii,)(,:),(iiiissuuisisisn1n21u,u,s,s,s,ng例例1.6 囚徒困境問題囚徒困境問題這個(gè)問題可以歸結(jié)為下述靜態(tài)信息完全的博弈模型 .其中,局中人集合 ,1代表甲,2代表乙。兩個(gè)局中人具有相同的策略集合: ,其中c代表 坦白,d代表抗拒的行動。對于策略組合 , ,兩個(gè)局中人的支付函數(shù)如下:該問題對應(yīng)的擴(kuò)展型博弈模型可用圖1-4示的博弈樹直觀給出。2121u,u,s,s,ng 2 , 1n d,css21),(21sss 2 , 1, issiidsscsdsdscsc

28、ssssu212121212111,8,05),(dssdscscsdscssssu212121212121,8,05),( 抗拒抗拒抗拒坦白坦白坦白圖1-411i5580081121i 1.4.2 二人有限策略型博弈模型二人有限策略型博弈模型 二人有限策略型博弈模型二人有限策略型博弈模型 設(shè) 是一個(gè)策略型博弈模型,如果 , , , 即n是兩個(gè)局中人的集合, 都是有限集,稱g為二人有限策略型博弈模型二人有限策略型博弈模型。2121u,u,s,s,ng 2 , 1n ,211ns,212ns21s,s 對于二人有限策略型博弈模型,定義 , , . 稱以下以向量 為元素的矩陣為g的支付支付矩陣矩陣

29、。 二人有限策略型博弈模型可由支付矩陣完全描述二人有限策略型博弈模型可由支付矩陣完全描述),(1jiijua),(2jiijubnjmi, 2 , 1, 2 , 1),(),(),(),(),(),(),(),(),(2211222222212111121211112121mnmnmmmmnnnnmnbababababababababa),(ijijba 稱 為參與人1的支付矩陣, 為參與人2的支付矩陣。 二人有限策略型博弈g也可稱為雙矩陣博弈,雙矩陣博弈,記為 囚徒困境問題是個(gè)二人有限策略型博弈,其支付矩陣為) 1, 1()0 , 8(8, 0)5, 5(dcdcb,ag mnmmnnmna

30、aaaaaaaaa2122221112112121mnmmnnmnbbbbbbbbbb2122221112112121 1.4.3 重復(fù)剔除被嚴(yán)格占優(yōu)策略均衡重復(fù)剔除被嚴(yán)格占優(yōu)策略均衡 定義定義1.6 如果對于任何策略組合 有 ,則稱局中人局中人i的策略的策略 嚴(yán)格占優(yōu)策略嚴(yán)格占優(yōu)策略 ,或 被被 嚴(yán)格占優(yōu)。嚴(yán)格占優(yōu)。 在博弈論中,對于參與人的一個(gè)基本理性假設(shè)是:參與人偏好更高的支付。因而不會使用被嚴(yán)格占優(yōu)的策略。 在上述理性假設(shè)下,我們有理由將被嚴(yán)格占優(yōu)的策略刪除。用剩余的策略組合預(yù)測博弈的結(jié)果。ss),(),(iiiiiisyusxuixiyiyix 重復(fù)剔除被嚴(yán)格占優(yōu)策略均衡重復(fù)剔除被嚴(yán)

31、格占優(yōu)策略均衡 一個(gè)策略本來是不被嚴(yán)格占優(yōu)的,但經(jīng)過一輪刪除被嚴(yán)格占優(yōu)的策略后,它變?yōu)楸粐?yán)格占優(yōu)的策略了,因而我們必須在第2輪中將其刪除。在有限博弈中,這樣的刪除被嚴(yán)格占優(yōu)策略的過程遲早會結(jié)束。如果結(jié)束時(shí),僅剩下一個(gè)未被刪除的策略組合 ,則稱 為重復(fù)剔除被嚴(yán)格占優(yōu)策略均衡重復(fù)剔除被嚴(yán)格占優(yōu)策略均衡,稱該博弈為嚴(yán)格占優(yōu)可解嚴(yán)格占優(yōu)可解的。我們可用重復(fù)剔除被嚴(yán)格占優(yōu)策略均衡預(yù)測博弈的結(jié)果。在囚徒困境問題中,策略組合 是重復(fù)剔除被嚴(yán)格占優(yōu)策略均衡。*s*s)c,c( 例例1.7 伯川德價(jià)格競爭伯川德價(jià)格競爭 假設(shè)雙寡頭壟斷市場中兩個(gè)企業(yè)都可選擇價(jià)格策略高、中、低三種,支付矩陣為 該博弈是嚴(yán)格占優(yōu)可解

32、的,策略組合(低,低)為重復(fù)剔除被嚴(yán)格占優(yōu)策略均衡。 并不是每個(gè)策略型博弈都是嚴(yán)格占優(yōu)可解的。并不是每個(gè)策略型博弈都是嚴(yán)格占優(yōu)可解的。)4 , 4()0 , 8()0 , 8()8 , 0()5 , 5()0 ,10()8 , 0()10, 0()6 , 6(低中高低中高 例例1.8 兩個(gè)土地所有者共同擁有一防洪大堤,每個(gè)人分管一段進(jìn)行維護(hù),維護(hù)成本為4。如不維護(hù),洪水造成的損失為10。該博弈的支付矩陣為 該博弈不是嚴(yán)格占優(yōu)可解的。 對于不是嚴(yán)格占優(yōu)可解的博弈,將繼續(xù)討論參與人應(yīng)如何選取策略 )10,10()14,10(1014)4, 4),(不維護(hù)維護(hù)不維護(hù)維護(hù)1.5 擴(kuò)展型博弈模型轉(zhuǎn)化為策

33、略型擴(kuò)展型博弈模型轉(zhuǎn)化為策略型博弈模型博弈模型 例例1.9 考慮以下動態(tài)博弈。 第1步,局中人1從1,2中選擇一數(shù) ; 第2步,局中人2知道 的值。從1,2中選 ; 第3步,局中人1知道 的值,從1,2中選 ,博弈結(jié)束。 對于給定的( )值,局中人2支付給局中人1一筆費(fèi)用 : , , , , , ,u1(1,2,2)=-4, u1(2,2,2)=6xxyyzzyx,),(1zyxu2) 1 , 1 , 1 (1u5) 1 , 1 , 2(1u1)2 , 1 , 1 (1u2)2 , 1 , 2(1u3) 1 , 2 , 1 (1u2) 1 , 2 , 2(1u 該博弈的局中人集合 ,為將其轉(zhuǎn)化

34、為策略型博弈,還需要確定出局中人的策略空間 及支付函數(shù)或支付矩陣。 局中人1的策略空間為 局中人2的策略空間為 該博弈對應(yīng)的策略型博弈可由如下的支付矩陣給出。 2 , 1n 21s,s),(543211xxxxxs ; 2 , 1ixni, 2 , 1 ),(212xxs2, 1;2, 121xx12122211i15i14i13i122圖1-6 i21i221i112112221133445522226612122211i14i13i122圖1-6 i211i1121122211334455222266該動態(tài)博弈所對應(yīng)的博弈樹如圖該動態(tài)博弈所對應(yīng)的博弈樹如圖1-6 所示。所示。該博弈對應(yīng)的策

35、略型博弈可由如下的支付矩陣給出。 (p16))22222()22221()22212()22211()22122()22121()22112()22111()21222()21221()21212()21211()21122()21121()21112()21111()12222()12221()12212()12211()12122()12121()12112()12111()11222()11221()11112()11211()11122()11121()11112()11111()6,6()2,2()6,6()2,2()2,2()2,2()2,2()2,2()6,6()5,5()6,6

36、()5,5()2,2()5,5()2,2()5,5()6,6()2,2()6,6()2,2()2,2()2,2()2,2()2,2()6,6()5,5()6,6()5,5()2,2()5,5()2,2()5,5()6,6()2,2()6,6()2,2()2,2()2,2()2,2()2,2()6,6()5,5()6,6()5,5()2,2()5,5()2,2()5,5()6,6()2,2()6,6()2,2()2,2()2,2()2,2()2,2()6,6()5,5()6,6()5,5()2,2()5,5()2,2()5,5()4,4()4,4()1,1()1,1()4,4()4,4()1,1()1,1()4,4()4,4()1,1()1,1()4,4()4,4()1,1()1,1()3,3()3,3()1,1()1,1()3,3()3,3()1,1()1,1()3,3()3,3()1,1()1,1()3,3()3,3()1,1()1,1()4,4()4,4()2,2()2,2()4,4()4,4()2,2()2,2()4,4()4,4()2,2()2,2()4,4()4,4()2,2()2,2()3,3()3,3()2,2()2,2()3,3()3,3()2,2()2,2()3

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負(fù)責(zé)。
  • 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

評論

0/150

提交評論