




版權(quán)說(shuō)明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請(qǐng)進(jìn)行舉報(bào)或認(rèn)領(lǐng)
文檔簡(jiǎn)介
1、經(jīng)濟(jì)博弈論教材 教學(xué)課件第一章 導(dǎo)論 本章介紹博弈論的基本概念,包括什么是博弈和博弈論,給出一些經(jīng)典博弈例子。對(duì)博弈分類和博弈理論的結(jié)構(gòu)作一些討論,對(duì)博弈論的發(fā)展歷史等作簡(jiǎn)單介紹。目標(biāo)是讓讀者對(duì)博弈論的內(nèi)容和博弈模型有更直觀的概念和印象,本教材的基本內(nèi)容,以及博弈分析的基本思想方法等形成初步的認(rèn)識(shí),為后面各章展開(kāi)詳細(xì)分析作好鋪墊和準(zhǔn)備。 本章分五節(jié)1. 1什么是博弈論1. 2幾類經(jīng)典博弈模型1. 3博弈結(jié)構(gòu)和博弈的分類1. 4博弈論歷史和發(fā)展的簡(jiǎn)要評(píng)述1. 5博弈論在我國(guó)的應(yīng)用1.1 什么是博弈論1.1.1 從游戲到博弈1.1.2 一個(gè)非技術(shù)性定義1.1.1 從游戲到博弈博弈就是策略對(duì)抗,或策
2、略有關(guān)鍵作用的游戲博弈Game,博弈論Game Theory,Game即游戲、競(jìng)技游戲和經(jīng)濟(jì)等決策競(jìng)爭(zhēng)較量的共同特征:規(guī)則、結(jié)果、策略選擇,策略和利益相互依存,策略的關(guān)鍵作用 游戲下棋、猜大小 經(jīng)濟(jì)寡頭產(chǎn)量決策、市場(chǎng)阻入、投標(biāo)拍賣寡頭市場(chǎng)廠商的產(chǎn)量決策;市場(chǎng)開(kāi)發(fā)競(jìng)爭(zhēng)中策略較量和策略依存;投標(biāo)拍賣 政治、軍事美國(guó)和伊拉克、以色列和巴勒斯坦政治、軍事和社會(huì)的決策較量博弈論不能稱作游戲理論,也不完全稱作對(duì)策論1.1.2 一個(gè)非技術(shù)性定義定義:博弈就是一些個(gè)人、隊(duì)組或其他組織,面對(duì)一定的環(huán)境條件,在一定的規(guī)則下,同時(shí)或先后,一次或多次,從各自允許選擇的行為或策略中進(jìn)行選擇并加以實(shí)施,各自取得相應(yīng)結(jié)果的
3、過(guò)程。四個(gè)核心方面博弈的參加者(Player)博弈方(單人、兩人和多人)各博弈方的策略(Strategies)或行為(Actions) (有限策略、無(wú)限策略) 博弈的次序(Order)(靜態(tài)、動(dòng)態(tài)、序貫、重復(fù))博弈方的得益(Payoffs)(零和、非零和、常和、非常和)這就是評(píng)價(jià)博弈論的標(biāo)準(zhǔn)和依據(jù)或者說(shuō)以上就是博弈論的四個(gè)基本要素1.2 幾個(gè)經(jīng)典博弈模型1.2.1 囚徒的困境1.2.2 賭勝博弈1.2.3 產(chǎn)量決策的古諾模型關(guān)于博弈論,流傳最廣的是一個(gè)叫做“囚徒困境”的故事。這個(gè)博弈是1950年圖克(Tucker)提出的,這個(gè)博弈模型提出后曾引發(fā)了大量的相關(guān)研究,也有許多關(guān)于“囚徒困境”的版本
4、?!扒敉嚼Ь场睂?duì)博弈論的發(fā)展起到了巨大的推動(dòng)作用??梢哉f(shuō)凡是講博弈論,都會(huì)說(shuō)到這個(gè)經(jīng)典的博弈模型。引例:囚徒困境(Prisoners Dilemma)1.2.1 囚徒的困境囚徒的困境是圖克(Tucker)1950年提出的該博弈是博弈論最經(jīng)典、著名的博弈該博弈本身講的是一個(gè)法律刑偵或犯罪學(xué)方面的問(wèn)題,但可以擴(kuò)展到許多經(jīng)濟(jì)問(wèn)題,以及各種社會(huì)問(wèn)題,可以揭示市場(chǎng)經(jīng)濟(jì)的根本缺陷一、基本模型-5, -50, -8-8, 0-1, -1坦 白不坦白坦 白不坦白兩個(gè)罪犯的得益矩陣囚徒 2囚徒1囚徒1:坦白囚徒2:坦白以后經(jīng)常用到這種形式分析博弈的上策(假設(shè)條件:個(gè)人效用最大化)有人提出:利用囚徒困境解決反腐敗
5、問(wèn)題。個(gè)體理性與團(tuán)體理性的矛盾。1,18, 0 0,85,5囚徒1不坦白 警察抓住了兩個(gè)罪犯,但是警察局卻缺乏足夠的證據(jù)指證他們所犯的罪行。如果罪犯中至少有一人供認(rèn)犯罪,就能確認(rèn)罪名成立。為了得到所需口供,警察將這兩名罪犯分別關(guān)押以防止他們串供或攻守聯(lián)盟,并分別跟他們講清他們的處境和面臨的選擇:如果他們兩人都拒不認(rèn)罪,則他們會(huì)以較輕的妨礙公務(wù)罪各判1年徒刑;如果兩人中一人坦白認(rèn)罪,則坦白者馬上釋放而另一人將重判8年徒刑;如果兩人都坦白認(rèn)罪,則他們各判刑5年監(jiān)禁。他們?nèi)绾巫鞒鰶Q策呢? 不坦白坦白坦白囚徒2囚徒1:坦白囚徒2:坦白兩個(gè)罪犯的得益矩陣(Payoff Matrix)引例:囚徒困境(Pr
6、isoners Dilemma) 不妨將條件放寬,允許囚犯A和B在審訊室里一起單獨(dú)呆上10分鐘,然后再?zèng)Q定是否坦白。很明顯,雙方交流的主旨就是建立攻守同盟,克服自利心理,甚至可能訂立一個(gè)口頭協(xié)議,要求雙方都不去坦白。然后,雙方再單獨(dú)被提審。我們不妨設(shè)想,囚犯A的心理,他一定會(huì)認(rèn)為,如果囚犯B遵守約定的話,則自己坦白就可獲得自由;如果囚犯B告密的話,若不坦白就會(huì)被終生囚禁。事實(shí)上,囚犯A的策略并沒(méi)有因?yàn)楹?jiǎn)單的溝通或協(xié)議而擺脫兩難境地。 企業(yè)之間相互溝通信誓旦旦,價(jià)格戰(zhàn)仍然會(huì)爆發(fā);美蘇兩國(guó)經(jīng)常會(huì)晤,甚至簽訂核不擴(kuò)散條約,但軍費(fèi)一年高過(guò)一年。這些現(xiàn)象都反映了上面所說(shuō)明的問(wèn)題。囚徒困境說(shuō)明了什么?在(
7、坦白、坦白)這個(gè)組合中,囚徒1和囚徒2都不能通過(guò)單方面的改變行動(dòng)增加自己的收益,于是誰(shuí)也沒(méi)有動(dòng)力游離這個(gè)組合,因此這個(gè)組合是納什均衡。囚徒困境反映了個(gè)人理性和集體理性的矛盾。如果囚徒1和囚徒2都選擇抵賴,各判刑年,顯然比都選擇坦白各判刑年好得多。當(dāng)然,囚徒1和囚徒2可以在被警察抓到之前訂立一個(gè)攻守同盟,但是這可能不會(huì)有用,因?yàn)樗粯?gòu)成納什均衡,沒(méi)有人有積極性遵守這個(gè)協(xié)定,顯然最好的策略是雙方都抵賴. 囚徒困境的意義“囚徒的兩難選擇”有著廣泛而深刻的意義。個(gè)人理性與集體理性的沖突,各人追求利己行為而導(dǎo)致的最終結(jié)局是一個(gè)“納什均衡”,也是對(duì)所有人都不利的結(jié)局。他們兩人都是在坦白與抵賴策略上首先想到
8、自己,這樣他們必然要服長(zhǎng)的刑期。只有當(dāng)他們都首先替對(duì)方著想時(shí),或者相互合謀(串供)時(shí),才可以得到最短時(shí)間的監(jiān)禁的結(jié)果。 對(duì)經(jīng)典經(jīng)濟(jì)學(xué)的沖擊“納什均衡”首先對(duì)亞當(dāng)斯密的“看不見(jiàn)的手”的原理提出挑戰(zhàn)。按照斯密的理論,在市場(chǎng)經(jīng)濟(jì)中,每一個(gè)人都從利己的目的出發(fā),而最終全社會(huì)達(dá)到利他的效果。從“納什均衡”我們引出了“看不見(jiàn)的手”的原理的一個(gè)悖論:從利己目的出發(fā),結(jié)果損人不利己,既不利己也不利他。兩個(gè)囚徒的命運(yùn)就是如此。從這個(gè)意義上說(shuō),“納什均衡”提出的悖論實(shí)際上動(dòng)搖了西方經(jīng)濟(jì)學(xué)的基石。 生活中的例子 在荷蘭召開(kāi)了一次“合作及社會(huì)兩難困境研討會(huì)”,與會(huì)的都是博弈論專家。當(dāng)大會(huì)結(jié)束之后,有兩個(gè)學(xué)者麥息克和路
9、特提議大家玩一個(gè)游戲。 他們將一個(gè)大信封拿出來(lái),請(qǐng)?jiān)趫?chǎng)的43位學(xué)者專家拿出金錢裝到這個(gè)信封里。如果到最后這信封里的錢超過(guò)250元,麥息克和路特將自己撈腰包,退還每人10元。不過(guò),如果最后信封內(nèi)的錢不足250元,就統(tǒng)統(tǒng)沒(méi)收,大家拿不到一分錢。 仔細(xì)想一想,如果你在場(chǎng),你會(huì)奉獻(xiàn)多少錢呢?結(jié)果是,打開(kāi)信封一數(shù),總共是元,比目標(biāo)250元差一點(diǎn)點(diǎn)“囚徒困境”的內(nèi)在根源是在個(gè)體之間存在行為和利益相互制約的博弈結(jié)構(gòu)中,以個(gè)體理性和個(gè)體選擇為基礎(chǔ)的分散決策方式,無(wú)法有效地協(xié)調(diào)各方面的利益,并實(shí)現(xiàn)整體、個(gè)體利益共同的最優(yōu)。簡(jiǎn)單地說(shuō), “囚徒困境”問(wèn)題都是個(gè)體理性和集體理性的矛盾引起的。現(xiàn)實(shí)中“囚徒困境”類型的問(wèn)
10、題是很多的。例如廠商之間的價(jià)格大戰(zhàn)、惡性的廣告競(jìng)爭(zhēng)、初等和中等教育中的應(yīng)試教育、亂砍林木、生育、排污等,其實(shí)都是“囚徒困境”博弈的表現(xiàn)形式。囚徒困境的應(yīng)用:價(jià)格大戰(zhàn) 假定兩個(gè)企業(yè)都采取比較低的價(jià)格,可以各得利潤(rùn)70億元;都采取比較高的價(jià)格,各得100億元;而如果一家采取較高的價(jià)格而另一家采取較低的價(jià)格,那么,價(jià)格高的企業(yè)利潤(rùn)為20億元,價(jià)格低的企業(yè)因?yàn)槎噤N利潤(rùn)上升到150億元,究竟是采用較高的價(jià)格好還是采用較低的價(jià)格好? 70,70 150, 20 20, 150 100, 100百事可樂(lè)低價(jià) 高價(jià)可口可樂(lè)低價(jià)高價(jià)寡頭1:低價(jià)(70)寡頭2:低價(jià)(70)政府組織協(xié)調(diào)的必要性和重要性 設(shè)想鄉(xiāng)下地
11、方有一個(gè)只有兩戶人家的小居民點(diǎn),由于道路情況不好,與外界的交通比較困難。如果修一條路出去,每家都能得到3那么多好處,但是修路的成本相當(dāng)于4。要是沒(méi)有人協(xié)調(diào),張三李四各自打著小算盤,最后結(jié)果如何呢? 1, 1 1,3 3,1 0, 0李四 修 不修 修張三 不修 結(jié)論:公共品問(wèn)題一定要有人協(xié)調(diào)囚徒困境的應(yīng)用:公共產(chǎn)品的供給 對(duì)甲和乙兩家居民來(lái)說(shuō),“修路”都是劣戰(zhàn)略,因而他們都不會(huì)出資修路。 這里,為了解決這條新路的建設(shè)問(wèn)題,需要政府強(qiáng)制性地分別向每家征稅2單位,然后投入4單位資金修好這條對(duì)大家都有好處的路,并使兩家居民的生活水平都得到改善。 這就是我們看到的為什么大多數(shù)路、橋等公共設(shè)施都是由政府
12、出資修建的原因。 同樣的道理,國(guó)防、教育、社會(huì)保障,環(huán)境衛(wèi)生等都由政府承擔(dān)資金投入,私人一般沒(méi)有積極性承擔(dān)這方面服務(wù)的積極性和能力。 如果雙方都擴(kuò)軍,則各自花費(fèi)2000億美元用于軍費(fèi);徹底裁軍,則軍費(fèi)為零;若一方擴(kuò)軍,另一方裁軍,其情形會(huì)怎樣呢?我們的想法是:贏方掠奪的財(cái)富是有限的,比方說(shuō)8000億美元,而輸方遭到的損失是無(wú)法估量的。2,28, 80, 0蘇聯(lián) 擴(kuò)軍 裁軍 擴(kuò)軍 美國(guó) 裁軍問(wèn)題:人類為什么那么傻,不選擇右下角?囚徒困境的應(yīng)用:軍備競(jìng)賽“囚徒困境”不僅可以解釋政治、經(jīng)濟(jì)領(lǐng)域的競(jìng)爭(zhēng),在廣闊的社會(huì)生活中,這一困境的影響也隨處可見(jiàn)。例如,我國(guó)目前的基礎(chǔ)教育,可以說(shuō)就是一個(gè)“囚徒困境”。
13、囚徒困境的應(yīng)用:應(yīng)試教育“囚徒困境”的內(nèi)在根源是什么?“囚徒困境”的內(nèi)在根源是在個(gè)體之間存在行為和利益相互制約的博弈結(jié)構(gòu)中,以個(gè)體理性和個(gè)體選擇為基礎(chǔ)的分散決策方式,無(wú)法有效地協(xié)調(diào)各方面的利益,并實(shí)現(xiàn)整體、個(gè)體利益的整體最優(yōu)。簡(jiǎn)單地說(shuō),“囚徒困境”問(wèn)題都是個(gè)體理性與集體理性的矛盾引起的?,F(xiàn)實(shí)中“囚徒的困境”類型的問(wèn)題很多。例如廠商之間的價(jià)格大戰(zhàn),惡性的廣告競(jìng)爭(zhēng),初等、中等教育的應(yīng)試教育,環(huán)境污染,計(jì)劃生育等等。都是“囚徒的困境”的表現(xiàn)形式1.2.2 賭勝博弈賭博、競(jìng)技等構(gòu)成的博弈問(wèn)題,在經(jīng)濟(jì)中也有許多應(yīng)用,賭勝博弈也是一類重要的博弈問(wèn)題,對(duì)經(jīng)濟(jì)競(jìng)爭(zhēng)和合作也有很大啟示賭勝博弈的特點(diǎn)是一方得等于另
14、一方失,不可能雙贏,屬于“零和博弈”這方面的例子不勝枚舉:劃拳、石頭剪子布等。一、田忌賽馬3,-31,-11,-11,-1-1,11,-11,-13,-31,-11,-11,-1-1,11,-1-1,13,-31,-11,-11,-1-1,11,-1,1,-13,-31,-11,-11,-11,-11,-1-1,13,-31,-11,-11,-1-1,11,-11,-13,-3上中下上下中中上下中下上下上中下中上上中下上下中中上下中下上下上中下中上田 忌齊威王得益矩陣取勝關(guān)鍵:不讓對(duì)方猜到自己策略,盡可能猜出對(duì)方策略沒(méi)有一種策略是上策或下策(永遠(yuǎn)最好或者最差的)這是非對(duì)稱的非零和博弈 在這個(gè)博
15、弈中齊威王和田忌應(yīng)該怎樣選擇自己的策略,才能最終獲得滿意的結(jié)果呢? 首先,作為博弈方的齊威王和田忌不能讓對(duì)方知道或猜中自己的策略,從而導(dǎo)致自己輸?shù)舯荣悺_@也意味著任何一方的策略選擇不能一成不變,或者不能有規(guī)律性地變動(dòng),即必須以隨機(jī)的方式選擇策略,否則一旦對(duì)方捕捉到這種規(guī)律性的變動(dòng),就可以針對(duì)性地采取應(yīng)對(duì)措施。 其次,無(wú)論對(duì)齊威王還是田忌,可選擇的六種策略之間沒(méi)有優(yōu)劣之分。從圖可以看出,對(duì)齊威王來(lái)說(shuō),每一種策略都可能有六種不同的結(jié)果,究竟最終得到哪種結(jié)果,主要看對(duì)方策略與自己策略的對(duì)應(yīng)狀況,而不是自己的策略本身。同樣的,對(duì)田忌來(lái)講六種策略本身也無(wú)好壞之分。因此,兩博弈方在決策時(shí)對(duì)自已的可選策略并
16、無(wú)偏好,應(yīng)以相同的概率選用二、猜硬幣博弈-1, 11, -11, -1-1, 1正 面反 面猜硬幣方蓋硬幣方正 面反 面這是對(duì)稱的零和博弈三、石頭、剪子、布0, 01, -1-1, 1-1, 11, -10, 01, -1-1, 10, 0石 頭剪 子布博弈方2石 頭剪 子布博弈方1這是對(duì)稱的零和博弈其他幾個(gè)典型的博弈問(wèn)題 1、智豬博弈(Boxed Pigs) 豬圈里圈兩頭豬,一頭大豬,一頭小豬。豬圈的一邊有一個(gè)豬食槽,另一邊安裝一個(gè)按鈕,控制著豬食的供應(yīng)。按一下按鈕會(huì)有10個(gè)單位的豬食進(jìn)槽,但誰(shuí)按按鈕誰(shuí)就需要付2個(gè)單位的成本。若大豬先到,大豬吃到9個(gè)單位,小豬只能吃1個(gè)單位;若同時(shí)到,大豬吃
17、7個(gè)單位,小豬吃3個(gè)單位;若小豬先到,大豬吃6個(gè)單位,小豬吃4個(gè)單位。最后結(jié)果如何呢? 5, 1 4, 4 9, 1 0, 0小豬 按 等 按 大豬 等智豬博弈的應(yīng)用例1 大股東挑起監(jiān)督經(jīng)理的重任 考察現(xiàn)代企業(yè)制度,“智豬博弈”最典型的例子是大股東和小股民的角色差異和行為差異。在一個(gè)股份公司里面,股東應(yīng)該承擔(dān)監(jiān)督經(jīng)理的職能。但是監(jiān)督經(jīng)理的工作是很不容易的,需要花費(fèi)很大的精力和很多的時(shí)間去搜集信息,并作出分析。 一句話,監(jiān)督成本是很高的。但是股東有大有小。別人向一家公司投資一個(gè)億,是這家公司的大股東,你買了這家公司幾手股票,也是這家公司的小股東。 假定公司運(yùn)營(yíng)得好盈利較多時(shí),分紅會(huì)是運(yùn)營(yíng)不太好時(shí)
18、的幾倍;那么雖然你這個(gè)小股東和他這個(gè)大股東都希望公司運(yùn)營(yíng)得好,但是利益關(guān)切程度卻實(shí)在相差很遠(yuǎn)。設(shè)想公司運(yùn)營(yíng)得好,大股東的分紅可以增加1千萬(wàn)元,你這個(gè)小股東的分紅可以增加1萬(wàn)元。增加1萬(wàn)元分紅當(dāng)然是好事,但是如果這需要你密切監(jiān)督經(jīng)理的工作才能實(shí)現(xiàn)。而密切監(jiān)督經(jīng)理的工作,本身的代價(jià)就差不多相當(dāng)于1萬(wàn)元, 甚至超過(guò)1萬(wàn)元,那么你就沒(méi)有多少積極性去密切監(jiān)督經(jīng)理們的工 作。大股東就不一樣,哪怕花幾萬(wàn)元十幾萬(wàn)元的代價(jià)雇人監(jiān)督經(jīng)理 的工作,對(duì)他也是很值得的:幾萬(wàn)元十幾萬(wàn)元代價(jià)的監(jiān)督可以換來(lái)近 千萬(wàn)元的分紅增加,何樂(lè)而不為? 可見(jiàn),大股東相當(dāng)于智豬博弈中的大豬,小股東相當(dāng)于小豬。在大小股東是否密切監(jiān)督經(jīng)理工作
19、的博弈中,大股東因?yàn)槔嫦嚓P(guān)會(huì)擔(dān)當(dāng)起搜集信息監(jiān)督經(jīng)理的重任,小股東坐享其成也可以因大股東密切監(jiān)督經(jīng)理的工作而得益。例2 股票市場(chǎng)例3 大企業(yè)與小企業(yè) 股市上有大戶,也有小戶,大戶類似“大豬”,小戶類似“小豬”。這時(shí)候,對(duì)小戶而言,“跟大戶”是最優(yōu)選擇,而大戶必須自己搜集信息,進(jìn)行分析。 進(jìn)行新產(chǎn)品開(kāi)發(fā)研究,為新產(chǎn)品做廣告,對(duì)大企業(yè)來(lái)說(shuō)是值得的,對(duì)小企業(yè)而言,則得不嘗試。所以,一種可能的情況是,小企業(yè)把精力放在模仿上,或等待大企業(yè)用廣告打開(kāi)市場(chǎng)后出售廉價(jià)產(chǎn)品。例4 公共產(chǎn)品供給(續(xù)) 假如這兩戶人家一戶富,一戶窮。富戶一般會(huì)承擔(dān)修路的責(zé)任,窮戶則很少這樣干,因?yàn)楦粦舫3J歉吲鬂M座,坐車坐轎的都來(lái)
20、,而窮人家只是自己穿著破鞋走路,路修好了他走起來(lái)舒服,路修不好他也無(wú)所謂。2、性別戰(zhàn)(Battle Of Sexes)其他幾個(gè)典型的博弈問(wèn)題 2, 1 0, 01 ,1 1, 2 女 足球 芭蕾 足球男 芭蕾 一男一女談戀愛(ài),有些業(yè)余活動(dòng)要安排,或者去看足球比賽或者看芭蕾舞演出。男的偏好足球,女的更喜歡芭蕾演出,但他們都寧愿在一起,不愿分開(kāi)。問(wèn)題:假如他倆都為對(duì)方著想,結(jié)果怎樣呢? 圣誕節(jié)的禮物非理性結(jié)局吉姆和德拉小兩口很窮。吉姆有一只掛表,但是沒(méi)有表鏈;德拉有一頭秀發(fā),可窮得連梳子也買不起。圣誕節(jié)到了,吉姆送給德拉一個(gè)梳子,德拉送給吉姆一條表鏈。可是德拉再也不要梳子了,因?yàn)樗u了秀發(fā)為吉姆買
21、回了表鏈,吉姆再也不需要表鏈了,因?yàn)樗u了掛表為德拉買了梳子。幾個(gè)典型的博弈問(wèn)題3、斗雞博弈(Chicken Games) 吉米和東尼拿著火棍從獨(dú)木橋的兩端走向中央進(jìn)行火拼,每個(gè)人都有兩種策略:繼續(xù)前進(jìn),或退下陣來(lái)。若兩人都繼續(xù)前進(jìn),則兩敗俱傷;若一方前進(jìn)另一方退下來(lái),前進(jìn)者取得勝利,退下來(lái)的丟了面子。那么,吉米和東尼這場(chǎng)斗雞博弈的對(duì)陣形勢(shì)怎樣呢? 1,1 0, 2 2,02,2 東尼 退卻 勇進(jìn) 退卻 吉米 勇進(jìn)斗雞博弈的應(yīng)用美蘇搶占地盤美蘇兩個(gè)軍事集團(tuán)在世界各地?fù)屨嫉乇P,也是一種斗雞博弈。一般說(shuō)來(lái),如果一方已經(jīng)搶占了一塊地盤,另一方就設(shè)法占領(lǐng)另一塊地盤,而不是與對(duì)手競(jìng)爭(zhēng)同一塊地盤。警察與游
22、行隊(duì)伍游行隊(duì)伍與警察越來(lái)越近,這時(shí)候,必有一方要退下來(lái)。如果警察不讓步,游行隊(duì)伍便會(huì)向后退;反過(guò)來(lái),如果游行隊(duì)伍來(lái)勢(shì)很猛,警察就得后撤。夫妻間矛盾這也是斗雞問(wèn)題,一般說(shuō)來(lái),吵得厲害了,不是妻子回娘家躲一躲,就是丈夫到院子里抽支煙。1.2.3 產(chǎn)量決策的古諾模型古諾模型是寡頭產(chǎn)量競(jìng)爭(zhēng),是市場(chǎng)經(jīng)濟(jì)中最常見(jiàn)的問(wèn)題之一古諾1838年提出,直到現(xiàn)在還是經(jīng)常使用古諾模型有很多擴(kuò)展古諾模型與囚徒困境相似,對(duì)理解市場(chǎng)經(jīng)濟(jì)和博弈分析本身都有重要價(jià)值一、三廠商離散產(chǎn)量P4455376281612856520253056420202455525252543113333333734921213二、n個(gè)廠商連續(xù)產(chǎn)量理論
23、推導(dǎo),一般結(jié)果1.3 博弈結(jié)構(gòu)和博弈分類1.3.1 博弈中的博弈方1.3.2 博弈中的策略1.3.3 博弈中的得益1.3.4 博弈的過(guò)程1.3.5 博弈的信息結(jié)構(gòu)1.3.6 博弈方的能力和理性1.3.7 博弈的分類和博弈理論的結(jié)構(gòu)1.3.1 博弈中的博弈方博弈方:獨(dú)立決策、獨(dú)立承擔(dān)博弈結(jié)果的個(gè)人或組織博弈規(guī)則面前博弈方之間平等,不因博弈方之間權(quán)利、地位的差異而改變博弈方數(shù)量對(duì)博弈結(jié)果和分析有影響根據(jù)博弈方數(shù)量分單人博弈、兩人博弈、多人博弈等。最常見(jiàn)的是兩人博弈,單人博弈是退化的博弈一、單人博弈只有一個(gè)博弈方的博弈例一:?jiǎn)稳嗣詫m入口AB出口(獎(jiǎng)金M)A,1B,1右左右左M00擴(kuò)展形單人博弈問(wèn)題可
24、以退化為最優(yōu)化問(wèn)題游戲者 0 M 0 0A左B左A左B右A右B左A右B右例二:運(yùn)輸路線-7000-16000-10000-10000好天氣(75%)壞天氣(25%)自 然商人水 路陸 路運(yùn)輸路線得益矩陣01-7000-10000-16000-10000運(yùn)輸路線擴(kuò)展形好天氣(75%)壞天氣(25%)單人博弈實(shí)質(zhì)個(gè)體最優(yōu)化問(wèn)題有一個(gè)商人需要將一批商品從A地向B地運(yùn)輸,從A地到B地有水、陸兩條路線,走陸路運(yùn)輸成本為10000元,走水路的運(yùn)輸成本為7000元。走陸路比較安全,走水路則有一定的風(fēng)險(xiǎn),如果遇到惡劣天氣將會(huì)造成這批貨物總價(jià)值10%的損失。假設(shè)已知該批貨物的總價(jià)值為90000元,運(yùn)輸期間出現(xiàn)暴
25、風(fēng)雨天氣的概率為1/4,問(wèn)該商人該選擇哪條運(yùn)輸路線?期望值:-9250-10000二、兩人博弈兩人博弈即有兩個(gè)博弈方的博弈兩人博弈最常見(jiàn),研究最多,是最基本和有用的博弈類型囚徒困境、猜硬幣、齊威王田忌賽馬等都是兩人博弈兩人博弈有多種可能性,博弈方的利益方向可能一致,也可以不一致利益不一定沖突,如制式問(wèn)題信息不一定是優(yōu)勢(shì)個(gè)人利益最大化不一定是整體利益最大化三、多人博弈三個(gè)博弈方之間的博弈可能存在“破壞者”:其策略選擇對(duì)自身的利益并沒(méi)有影響,但卻會(huì)對(duì)其他博弈方的利益產(chǎn)生很大的,有時(shí)甚至是決定性的影響。申辦奧運(yùn)會(huì)是典型例子。(競(jìng)選等。破壞者、合作者共謀)多人博弈的表示有時(shí)與兩人博弈不同,需要多個(gè)得益
26、矩陣,或者只能用描述法多個(gè)廠商(3廠商)采用新技術(shù)與老技術(shù)的博弈1.3.2 博弈中的策略策略:博弈中各博弈方的選擇內(nèi)容(每個(gè)博弈方的可選策略不一定完全相同,即不一定對(duì)稱)策略有定性定量、簡(jiǎn)單復(fù)雜之分不同博弈方之間不僅可選策略不同,而且可選策略數(shù)量也可不同有限博弈:每個(gè)博弈方的策略數(shù)都是有限的無(wú)限博弈:至少有某些博弈方的策略有無(wú)限多個(gè)(如連續(xù)產(chǎn)量的確定)1.3.3 博弈中的得益得益:各博弈方從博弈中所獲得的利益(利潤(rùn)、收入、量化的效用、社會(huì)效益、福利等,有效用,有損失)得益對(duì)應(yīng)博弈的結(jié)果,也就是各博弈方策略的組合得益是各博弈方追求的根本目標(biāo)及行為和判斷的主要依據(jù)根據(jù)得益的博弈分類:零和博弈、常和
27、博弈、變和博弈博弈方是對(duì)立的:分蛋糕、分財(cái)產(chǎn)、討價(jià)還價(jià)零和博弈:也稱“嚴(yán)格競(jìng)爭(zhēng)博弈”。博弈方之間利益始終對(duì)立,偏好通常不同 猜硬幣,田忌賽馬,石頭-剪刀-布常和博弈:博弈方之間利益的總和為常數(shù)。博弈方之間的利益是對(duì)立的且是競(jìng)爭(zhēng)關(guān)系 分配固定數(shù)額的獎(jiǎng)金、利潤(rùn),遺產(chǎn)官司變和博弈:零和博弈和常和博弈以外的所有博弈。合作利益存在,博弈效率問(wèn)題的重要性。 囚徒困境、產(chǎn)量博弈、制式問(wèn)題等分冰激凌是特殊的變和博弈1.3.4 博弈的過(guò)程博弈過(guò)程:博弈方選擇、行為的次序,包括是否多次重復(fù)選擇、行為。博弈過(guò)程對(duì)博弈結(jié)果也有重要影響。根據(jù)博弈的過(guò)程,博弈可分為靜態(tài)博弈、動(dòng)態(tài)博弈、重復(fù)博弈。靜態(tài)博弈:所有博弈方同時(shí)或
28、可看作同時(shí)選擇策略的博弈 田忌賽馬、猜硬幣、古諾模型動(dòng)態(tài)博弈:各博弈方的選擇和行動(dòng)有先后次序且后選擇、后行動(dòng)的博弈方在自己選擇、行動(dòng)之前可以看到其他博弈方的選擇和行動(dòng) 弈棋、市場(chǎng)進(jìn)入、領(lǐng)導(dǎo)追隨型市場(chǎng)結(jié)構(gòu)重復(fù)博弈:同一個(gè)博弈反復(fù)進(jìn)行所構(gòu)成的博弈,提供了實(shí)現(xiàn)更有效略博弈結(jié)果的新可能(討價(jià)還價(jià)、投標(biāo)拍賣) 長(zhǎng)期客戶、長(zhǎng)期合同、信譽(yù)問(wèn)題有限次重復(fù)博弈無(wú)限次重復(fù)博弈有限次重復(fù)博弈與無(wú)限次重復(fù)博弈的方法上也有明顯的不同短期(不一定有合作的意向)流動(dòng)攤位長(zhǎng)期(有合作的意向)固定攤位1.3.5 博弈的信息結(jié)構(gòu)完全信息博弈:各博弈方都完全了解所有博弈方各種情況下的得益(共同知識(shí))不完全信息博弈:至少部分博弈方不
29、完全了解其他博弈方得益的情況的博弈,也稱為“不對(duì)稱信息博弈”完美信息博弈:每個(gè)輪到行為的博弈方對(duì)博弈的進(jìn)程完全了解的博弈不完美信息博弈:至少某些博弈方在輪到行動(dòng)時(shí)不完全了解此前全部博弈的進(jìn)程的博弈1.3.6 博弈方的能力和理性完全理性和有限理性完全理性:有完美的分析判斷能力和不會(huì)犯選擇行為的錯(cuò)誤有限理性:博弈方的判斷選擇能力有缺陷個(gè)體理性和集體理性個(gè)體理性:以個(gè)體利益最大為目標(biāo)集體理性:追求集體利益最大化合作博弈:允許存在有約束力協(xié)議的博弈非合作博弈:不允許存在有約束力協(xié)議的博弈1.3.7 博弈的分類和博弈理論的結(jié)構(gòu)非合作博弈和合作博弈非合作博弈范圍內(nèi):完全理性博弈和有限理性博弈(進(jìn)化博弈)靜
30、態(tài)博弈,動(dòng)態(tài)博弈,重復(fù)博弈完全信息靜態(tài)博弈,不完全信息靜態(tài)博弈,完全且完美信息動(dòng)態(tài)博弈,完全但不完美信息動(dòng)態(tài)博弈,不完全信息動(dòng)態(tài)博弈零和博弈和非零和博弈,單人博弈和多人博弈1.4 博弈論歷史和發(fā)展簡(jiǎn)述博弈論的早期研究博弈論的形成博弈論的成長(zhǎng)和發(fā)展博弈論的成熟及與主流經(jīng)濟(jì)學(xué)的融合博弈論的早期研究博弈論歷史沒(méi)有公認(rèn)答案對(duì)具有策略依存特點(diǎn)決策問(wèn)題的研究可上溯到18世紀(jì)初甚至更早(古諾)博弈論真正的發(fā)展在本世紀(jì)(上世紀(jì)1944年)博弈論總體上仍然是發(fā)展中的學(xué)科(諾貝爾經(jīng)濟(jì)學(xué)獎(jiǎng)1994,1996,2001,2004,2007等) 2000年前我國(guó)古代的“齊威王田忌賽馬”1500年前巴比倫猶太教法典“婚姻
31、合同問(wèn)題”等。1838年古諾寡頭模型。1883年伯特蘭德寡頭競(jìng)爭(zhēng)模型。 1913年齊默羅象棋博弈定理 、“逆推歸納法”1921-1927年波雷爾混合策略的第一個(gè)現(xiàn)代表述,有數(shù)種策略兩人博弈的極小化極大解 1928年諾伊曼和摩根斯坦擴(kuò)展形博弈定義,證明有限策略兩人零和博弈有確定結(jié)果 博弈論的形成馮.諾伊曼和摩根斯坦博弈論和經(jīng)濟(jì)行為Theory of Games and Economic Behavior 1944引進(jìn)擴(kuò)展形(extensive form)表示和正規(guī)形(normal form)或稱策略形(strategy form)、矩陣形(matrix form)表示提出穩(wěn)定集(stable s
32、ets)解概念正式提出創(chuàng)造博弈論一般理論的主意給出博弈論研究的一般框架、概念術(shù)語(yǔ)和表述方法1.4.3 博弈論的成長(zhǎng)和發(fā)展一、第一個(gè)研究高潮,本世紀(jì)40年代末和50年代初1950年納什提出“納什均衡”(Nash equilibrium)概念和證明納什定理,發(fā)展非合作博弈的基礎(chǔ)理論。 1950年Melvin Dresher和Merrill Flood在蘭德公司(美國(guó)空軍)“囚徒的困境”(Prisons dilemma)博弈實(shí)驗(yàn),(Howard Raiffa)獨(dú)立進(jìn)行這個(gè)博弈實(shí)驗(yàn);1952-1953年期間(L. S. Shapley)和(D. B. Gillies)提出“核”(Core)作為合作博弈
33、的一般解概念Shapley提出了合作博弈的“Shapley值”(Shapley value)概念等。奧曼(R. J. Aumann)“40年代末50年代初是博弈論歷史上令人振奮的時(shí)期,原理已經(jīng)破繭而出,正在試飛它們的雙翅,活躍著一批巨人。” 二、50年代中后期一直到70年代博弈論發(fā)展的青年期1954-1955年提出了“微分博弈”(Differential games)的概念。奧曼則在1959年提出了“強(qiáng)均衡”(Strong equilibrium)的概念?!爸貜?fù)博弈”(Repeated games)也是在50年代末開(kāi)始研究的,這自然引出了關(guān)于重復(fù)博弈的“民間定理”(Folk theorem)。
34、1960年(Thomas C. Schelling)引進(jìn)了“焦點(diǎn)”(Focal point)的概念。博弈論在進(jìn)化生物學(xué)(Evolutionary Biology)中的公開(kāi)應(yīng)用也是在60年代初出現(xiàn)的。 塞爾騰(Selten)1965提出“子博弈完美納什均衡”(subgame perfect Nash equilibrium)1975年提出的“顫抖手均衡”(Trembling hand perfect equilibrium)海薩尼(Harsanyi)1967-1968三篇構(gòu)造不完全信息博弈理論的系列論文,“貝葉斯納什均衡”(Bayesian Nash equilibrium)。海薩尼1973年提
35、出關(guān)于“混合策略”的不完全信息解釋,以及“嚴(yán)格納什均衡”(Strict Nash equilibrium)。70年代“進(jìn)化博弈論”(Evolutionary game theory)的重要發(fā)展,(John Maynard Smith)1972年引進(jìn)“進(jìn)化穩(wěn)定策略”( Evolutionarily stable strategy,ESS)等?!肮餐R(shí)”(Common knowledge)的重要性,因?yàn)閵W曼1976年的文章引起廣泛的重視。 三、40年代末到70年代末是博弈論發(fā)展的重要階段這個(gè)時(shí)期博弈理論仍然沒(méi)有成熟,理論體系還比較亂,概念和分析方法很不統(tǒng)一,在經(jīng)濟(jì)學(xué)中的作用和影響還比較有限,但這
36、個(gè)時(shí)期博弈論研究的繁榮和進(jìn)展卻是非常顯著的。對(duì)這一階段博弈論研究的迅速發(fā)展,除了理論發(fā)展自身規(guī)律的作用以外,全球政治、軍事、經(jīng)濟(jì)特定環(huán)境條件的影響(戰(zhàn)爭(zhēng)和冷戰(zhàn)時(shí)期的軍事對(duì)抗和威懾策略研究的需要,經(jīng)濟(jì)競(jìng)爭(zhēng)、國(guó)際經(jīng)濟(jì)競(jìng)爭(zhēng)的加?。?,以及經(jīng)濟(jì)學(xué)理論發(fā)展本身的需要等,都起了重要的作用。正是因?yàn)橛辛诉@一階段博弈論研究的繁榮發(fā)展,才有80、90年代博弈論的成熟和對(duì)經(jīng)濟(jì)學(xué)的博弈論革命。 博弈論的成熟及與主流經(jīng)濟(jì)學(xué)的融合一、80、90年代是博弈論走向成熟的時(shí)期 1981(Elon Kohlberg) “順推歸納法”(Forward induction)克瑞潑斯(David M. kreps)和威爾孫(Robert Wilson)1982年提出“序列均衡”(Sequential equilibria)1982年斯密(John Maynard Smith)出版了進(jìn)化和博弈論()1984年由伯恩海姆(B. D. Bernheim)和皮爾斯(D. G. Pearce)提出“可理性化性”(Rationalizability)海薩尼和塞爾騰1988年提出了在非合作和合作博弈中均衡選擇的一般理論和標(biāo)準(zhǔn),1991年弗得伯格(D. Fudenberg)和泰勒爾(J. Tirole)首先提出了“完美貝葉斯均衡”(Perfext Bayesian equilibriu
溫馨提示
- 1. 本站所有資源如無(wú)特殊說(shuō)明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請(qǐng)下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請(qǐng)聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
- 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁(yè)內(nèi)容里面會(huì)有圖紙預(yù)覽,若沒(méi)有圖紙預(yù)覽就沒(méi)有圖紙。
- 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
- 5. 人人文庫(kù)網(wǎng)僅提供信息存儲(chǔ)空間,僅對(duì)用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對(duì)用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對(duì)任何下載內(nèi)容負(fù)責(zé)。
- 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請(qǐng)與我們聯(lián)系,我們立即糾正。
- 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶因使用這些下載資源對(duì)自己和他人造成任何形式的傷害或損失。
最新文檔
- 電工基礎(chǔ)期末考試試卷1
- 2017-2018學(xué)年高中化學(xué)必修2課時(shí)訓(xùn)練第一章第二節(jié)元素周期律第1課時(shí)原子核外電子排布元素周期律
- 高考物理課標(biāo)版一輪復(fù)習(xí)考點(diǎn)規(guī)范練13萬(wàn)有引力定律及其應(yīng)用
- 2025年玻尿酸注射項(xiàng)目建議書
- 2025年污水自動(dòng)采樣器合作協(xié)議書
- 基于SystemC的多核模型總線及通信模塊設(shè)計(jì)
- SIPSYS服務(wù)器應(yīng)用開(kāi)發(fā)接口CSGATE的設(shè)計(jì)與實(shí)現(xiàn)
- 企業(yè)貸款合同范例
- 2025屆高考數(shù)學(xué)二輪復(fù)習(xí)瘋狂專練26模擬訓(xùn)練六理
- 企業(yè)商鋪裝修合同范例
- 聯(lián)通IT專業(yè)能力認(rèn)證初級(jí)云計(jì)算、中級(jí)云計(jì)算題庫(kù)附答案
- 廣東離婚協(xié)議書范文2024標(biāo)準(zhǔn)版
- 司機(jī)崗位招聘筆試題及解答(某大型集團(tuán)公司)2024年
- 2024年中國(guó)除塵濾芯/濾筒市場(chǎng)調(diào)查研究報(bào)告
- 24年追覓在線測(cè)評(píng)28題及答案
- 六年級(jí)語(yǔ)文上冊(cè)14文言文二則《兩小兒辯日》公開(kāi)課一等獎(jiǎng)創(chuàng)新教學(xué)設(shè)計(jì)
- 專題01相交線與平行線(原卷版+解析)
- 工程造價(jià)預(yù)算書
- 便民驛站運(yùn)營(yíng)方案
- 終止授權(quán)代理協(xié)議書模板
- 2024年保密教育培訓(xùn)知識(shí)考試題庫(kù)(含答案)
評(píng)論
0/150
提交評(píng)論