版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進(jìn)行舉報(bào)或認(rèn)領(lǐng)
文檔簡介
博弈論
博弈論,又稱對策論。本章介紹博弈論的基本概念,包括什么是博弈和博弈論,給出一些經(jīng)典博弈例子。對博弈分類和博弈理論的結(jié)構(gòu)作一些討論,對博弈論的發(fā)展歷史等作簡單介紹。目標(biāo)是對博弈論的內(nèi)容和博弈模型有更直觀的概念和印象,對博弈分析的基本思想方法等形成初步的認(rèn)識。
博弈論引例——“囚徒困境”警察抓住了兩個合伙犯罪的罪犯,但卻缺乏足夠的證據(jù)指證他們的罪行。如果其中至少一人供認(rèn)犯罪,就能確認(rèn)罪名成立。為了得到所需的口供,警察將這兩名罪犯分別關(guān)押并給他們同樣的選擇機(jī)會:如果他們兩人都拒不認(rèn)罪,則因缺乏證據(jù),他們會被以較輕的妨礙公務(wù)罪各判2年徒刑;如果他們兩人中有一人坦白認(rèn)罪,則坦白者從輕處理,立即釋放,而另一人則將重判10年徒刑;如果兩人同時認(rèn)罪,則他們將各判4年徒刑。囚徒2坦白不坦白坦白-4,-40,-10囚徒1不坦白-10,0-2,-21.1從游戲到博弈博弈就是策略對抗,或策略有關(guān)鍵作用的游戲博弈Game,博弈論GameTheory,Game即游戲、競技游戲和經(jīng)濟(jì)等決策,具有競爭較量的共同特征:規(guī)則、結(jié)果、策略選擇,策略和利益相互依存,策略的關(guān)鍵作用游戲——下棋、猜大小、石頭剪刀布經(jīng)濟(jì)——寡頭產(chǎn)量決策、市場阻入、投標(biāo)拍賣(新娘拍賣)、股票市場政治——兩黨政治、多黨政治、政黨聯(lián)盟軍事——美國和伊拉克、印巴危機(jī)、以色列和巴勒斯坦、臺海兩岸(反分裂)娛樂——選美其他——婚姻市場1.2一個非技術(shù)性定義定義:博弈就是一些個人、團(tuán)隊(duì)或其他組織,面對一定的環(huán)境條件,在一定的規(guī)則下,同時或先后,一次或多次,從各自允許選擇的行為或策略中進(jìn)行選擇并加以實(shí)施,各自取得相應(yīng)結(jié)果的過程。四個核心方面博弈的參加者(Player)——博弈方各博弈方的策略(Strategies)或行為(Actions)博弈的次序(Order)博弈方的得益或支付(Payoffs)2.1囚徒的困境囚徒的困境是圖克(Tucker)1950年提出的該博弈是博弈論最經(jīng)典、著名的博弈該博弈本身講的是一個法律刑偵或犯罪學(xué)方面的問題,但可以擴(kuò)展到許多經(jīng)濟(jì)問題,以及各種社會問題,可以揭示市場經(jīng)濟(jì)的根本缺陷一、基本模型-5,-50,-8-8,0-1,-1坦白不坦白坦白不坦白兩個罪犯的得益矩陣囚徒2囚徒1囚徒1:坦白囚徒2:坦白二、雙寡頭削價競爭100,10020,150150,2070,70高價低價高價低價寡頭2寡頭1雙寡頭的得益矩陣政府組織協(xié)調(diào)的必要性和重要性寡頭1:低價(70)寡頭2:低價(70)2.2賭勝博弈賭博、競技等構(gòu)成的博弈問題,在經(jīng)濟(jì)中也有許多應(yīng)用,賭勝博弈也是一類重要的博弈問題,對經(jīng)濟(jì)競爭和合作也有很大啟示賭勝博弈的特點(diǎn)是一方得等于另一方失,不可能雙贏,屬于“零和博弈”一、田忌賽馬3,-31,-11,-11,-1-1,11,-11,-13,-31,-11,-11,-1-1,11,-1-1,13,-31,-11,-11,-1-1,11,-1,1,-13,-31,-11,-11,-11,-11,-1-1,13,-31,-11,-11,-1-1,11,-11,-13,-3上中下上下中中上下中下上下上中下中上上中下上下中中上下中下上下上中下中上田忌齊威王得益矩陣取勝關(guān)鍵:不讓對方猜到自己策略,盡可能猜出對方策略二、猜硬幣博弈-1,11,-11,-1-1,1正面反面猜硬幣方蓋硬幣方正面反面三、石頭、剪子、布0,01,-1-1,1-1,11,-10,01,-1-1,10,0石頭剪子布博弈方2石頭剪子布博弈方12.3產(chǎn)量決策的古諾模型古諾模型是寡頭產(chǎn)量競爭,是市場經(jīng)濟(jì)中最常見的問題之一古諾1838年提出,直到現(xiàn)在還是經(jīng)常使用古諾模型有很多擴(kuò)展古諾模型與囚徒困境相似,對理解市場經(jīng)濟(jì)和博弈分析本身都有重要價值一、三廠商離散產(chǎn)量{0P4555346281612854630302456420202455525252543113333333103403030373374921213.1博弈中的博弈方博弈方:獨(dú)立決策、獨(dú)立承擔(dān)博弈結(jié)果的個人或組織博弈規(guī)則面前博弈方之間平等,不因博弈方之間權(quán)利、地位的差異而改變博弈方數(shù)量對博弈結(jié)果和分析有影響根據(jù)博弈方數(shù)量分單人博弈、兩人博弈、多人博弈等。最常見的是兩人博弈,單人博弈是退化的博弈一、單人博弈——只有一個博弈方的博弈例一:單人迷宮入口AB出口(獎金M)A,1B,1右左右左M00擴(kuò)展形例二:運(yùn)輸路線-7000-16000-10000-10000好天氣(75%)壞天氣(25%)自然商人水路陸路運(yùn)輸路線得益矩陣01-7000-10000-16000-10000運(yùn)輸路線擴(kuò)展形好天氣(75%)壞天氣(25%)單人博弈實(shí)質(zhì)個體最優(yōu)化問題二、兩人博弈兩人博弈即有兩個博弈方的博弈兩人博弈最常見,研究最多,是最基本和有用的博弈類型囚徒困境、猜硬幣、齊威王田忌賽馬等都是兩人博弈兩人博弈有多種可能性,博弈方的利益方向可能一致,也可以不一致三、多人博弈三個博弈方之間的博弈可能存在“破壞者”:其策略選擇對自身的利益并沒有影響,但卻會對其他博弈方的利益產(chǎn)生很大的,有時甚至是決定性的影響。申辦奧運(yùn)會是典型例子。多人博弈的表示有時與兩人博弈不同,需要多個得益矩陣,或者只能用描述法3.2博弈中的策略策略:博弈中各博弈方的選擇內(nèi)容策略有定性定量、簡單復(fù)雜之分不同博弈方之間不僅可選策略不同,而且可選策略數(shù)量也可不同有限博弈:每個博弈方的策略數(shù)都是有限的無限博弈:至少有某些博弈方的策略有無限多個3.3博弈中的得益得益:各博弈方從博弈中所獲得的利益得益對應(yīng)博弈的結(jié)果,也就是各博弈方策略的組合得益是各博弈方追求的根本目標(biāo)及行為和判斷的主要依據(jù)根據(jù)得益的博弈分類:零和博弈、常和博弈、變和博弈零和博弈:也稱“嚴(yán)格競爭博弈”。博弈方之間利益始終對立,偏好通常不同—猜硬幣,田忌賽馬,石頭-剪刀-布常和博弈:博弈方之間利益的總和為常數(shù)。博弈方之間的利益是對立的且是競爭關(guān)系—分配固定數(shù)額的獎金、利潤,遺產(chǎn)官司變和博弈:零和博弈和常和博弈以外的所有博弈。合作利益存在,博弈效率問題的重要性?!敉嚼Ь场a(chǎn)量博弈等3.4博弈的過程博弈過程:博弈方選擇、行為的次序,包括是否多次重復(fù)選擇、行為。博弈過程對博弈結(jié)果也有重要影響。根據(jù)博弈的過程,博弈可分為靜態(tài)博弈、動態(tài)博弈、重復(fù)博弈。靜態(tài)博弈:所有博弈方同時或可看作同時選擇策略的博弈—田忌賽馬、猜硬幣、古諾模型動態(tài)博弈:各博弈方的選擇和行動又先后次序且后選擇、后行動的博弈方在自己選擇、行動之前可以看到其他博弈方的選擇和行動—弈棋、市場進(jìn)入、領(lǐng)導(dǎo)——追隨型市場結(jié)構(gòu)重復(fù)博弈:同一個博弈反復(fù)進(jìn)行所構(gòu)成的博弈,提供了實(shí)現(xiàn)更有效策略博弈結(jié)果的新可能?!L期客戶、長期合同、信譽(yù)問題有限次重復(fù)博弈無限次重復(fù)博弈3.5博弈的信息結(jié)構(gòu)完全信息博弈:各博弈方都完全了解所有博弈方各種情況下的得益不完全信息博弈:至少部分博弈方不完全了解其他博弈方得益的情況的博弈,也稱為“不對稱信息博弈”完美信息博弈:每個輪到行為的博弈方對博弈的進(jìn)程完全了解的博弈不完美信息博弈:至少某些博弈方在輪到行動時不完全了解此前全部博弈的進(jìn)程的博弈●共同知識(commonknowledge)是與信息有關(guān)的一個重要概念。解釋一:共同知識指“所有參與人知道,所有參與人知道所有參與人知道,所有參與人知道所有參與人知道所有參與人知道…”。解釋二:如果每個參與人都知道某個事實(shí),每個參與人都知道每個參與人都知道它,如此等等,從而形如“(每個參與人都知道)k每個參與人都知道它”的語句對k=0,1,2,…都是正確的,那我們就稱這個事實(shí)為參與人中間的共同知識。解釋三:這是一個“由己及人,由人及己”的無限推理過程。一件事一旦在某個群體中成為共同知識,則從任何一個個體出發(fā),他對這件事的理解等等都已達(dá)到了完全的統(tǒng)一,不再有任何層面的不確定性(奧曼,1976)?!裨诓┺恼撝校话慵俣▍⑴c人的行動空間和行動順序是共同知識?!袼饺诵畔ⅲ╬rivateinformation):指任何一個他擁有但不是該博弈中所有參與人共同知識的信息。由于存在私人信息,便有了信息不對稱的問題。3.6博弈方的能力和理性完全理性和有限理性完全理性:有完美的分析判斷能力和不會犯選擇行為的錯誤有限理性:博弈方的判斷選擇能力有缺陷個體理性和集體理性個體理性:以個體利益最大為目標(biāo)集體理性:追求集體利益最大化合作博弈:允許存在有約束力協(xié)議的博弈非合作博弈:不允許存在有約束力協(xié)議的博弈3.7博弈的分類和博弈理論的結(jié)構(gòu)非合作博弈和合作博弈非合作博弈范圍內(nèi):完全理性博弈和有限理性博弈(進(jìn)化博弈)靜態(tài)博弈,動態(tài)博弈,重復(fù)博弈完全信息靜態(tài)博弈,不完全信息靜態(tài)博弈,完全且完美信息動態(tài)博弈,完全但不完美信息動態(tài)博弈,不完全信息動態(tài)博弈零和博弈和非零和博弈,單人博弈和多人博弈4.1博弈論的早期研究博弈論歷史沒有公認(rèn)答案對具有策略依存特點(diǎn)決策問題的研究可上溯到18世紀(jì)初甚至更早博弈論真正的發(fā)展在上世紀(jì)博弈論總體上仍然是發(fā)展中的學(xué)科
2000年前我國古代的“齊威王田忌賽馬”巴比倫猶太教法典“婚姻合同問題”等。1838年古諾寡頭模型。1883年伯特蘭德寡頭競爭模型。1913年齊默羅象棋博弈定理、“逆推歸納法”1921-1927年波雷爾混合策略的第一個現(xiàn)代表述,有數(shù)種策略兩人博弈的極小化極大解1928年諾伊曼和摩根斯坦擴(kuò)展形博弈定義,證明有限策略兩人零和博弈有確定結(jié)果4.2博弈論的形成馮.諾伊曼和摩根斯坦《博弈論和經(jīng)濟(jì)行為》TheoryofGamesandEconomicBehavior1944引進(jìn)擴(kuò)展形(extensiveform)表示和正規(guī)形(normalform)或稱策略形(strategyform)、矩陣形(matrixform)表示提出穩(wěn)定集(stablesets)解概念正式提出創(chuàng)造博弈論一般理論的主意給出博弈論研究的一般框架、概念術(shù)語和表述方法4.3博弈論的成長和發(fā)展
一、第一個研究高潮,本世紀(jì)40年代末和50年代初1950年納什提出“納什均衡”(Nashequilibrium)概念和證明納什定理,發(fā)展非合作博弈的基礎(chǔ)理論。1950年MelvinDresher和MerrillFlood在蘭德公司(美國空軍)“囚徒的困境”(Prison’sdilemma)博弈實(shí)驗(yàn),(HowardRaiffa)獨(dú)立進(jìn)行這個博弈實(shí)驗(yàn);1952-1953年期間(L.S.Shapley)和(D.B.Gillies)提出“核”(Core)作為合作博弈的一般解概念Shapley提出了合作博弈的“Shapley值”(Shapleyvalue)概念等。奧曼(R.J.Aumann)“40年代末50年代初是博弈論歷史上令人振奮的時期,原理已經(jīng)破繭而出,正在試飛它們的雙翅,活躍著一批巨人。”二、50年代中后期一直到70年代博弈論發(fā)展的青年期1954-1955年提出了“微分博弈”(Differentialgames)的概念。奧曼則在1959年提出了“強(qiáng)均衡”(Strongequilibrium)的概念?!爸貜?fù)博弈”(Repeatedgames)也是在50年代末開始研究的,這自然引出了關(guān)于重復(fù)博弈的“民間定理”(Folktheorem)。1960年(ThomasC.Schelling)引進(jìn)了“焦點(diǎn)”(Focalpoint)的概念。博弈論在進(jìn)化生物學(xué)(EvolutionaryBiology)中的公開應(yīng)用也是在60年代初出現(xiàn)的。塞爾騰(Selten)1965提出“子博弈完美納什均衡”(subgameperfectNashequilibrium)1975年提出的“顫抖手均衡”(Tremblinghandperfectequilibrium)海薩尼(Harsanyi)1967-1968三篇構(gòu)造不完全信息博弈理論的系列論文,“貝葉斯納什均衡”(BayesianNashequilibrium)。海薩尼1973年提出關(guān)于“混合策略”的不完全信息解釋,以及“嚴(yán)格納什均衡”(StrictNashequilibrium)。70年代“進(jìn)化博弈論”(Evolutionarygametheory)的重要發(fā)展,(JohnMaynardSmith)1972年引進(jìn)“進(jìn)化穩(wěn)定策略”(Evolutionarilystablestrategy,ESS)等?!肮餐R”(Commonknowledge)的重要性,因?yàn)閵W曼1976年的文章引起廣泛的重視。三、40年代末到70年代末是博弈論發(fā)展的重要階段這個時期博弈理論仍然沒有成熟,理論體系還比較亂,概念和分析方法很不統(tǒng)一,在經(jīng)濟(jì)學(xué)中的作用和影響還比較有限,但這個時期博弈論研究的繁榮和進(jìn)展卻是非常顯著的。對這一階段博弈論研究的迅速發(fā)展,除了理論發(fā)展自身規(guī)律的作用以外,全球政治、軍事、經(jīng)濟(jì)特定環(huán)境條件的影響(戰(zhàn)爭和冷戰(zhàn)時期的軍事對抗和威懾策略研究的需要,經(jīng)濟(jì)競爭、國際經(jīng)濟(jì)競爭的加劇),以及經(jīng)濟(jì)學(xué)理論發(fā)展本身的需要等,都起了重要的作用。正是因?yàn)橛辛诉@一階段博弈論研究的繁榮發(fā)展,才有80、90年代博弈論的成熟和對經(jīng)濟(jì)學(xué)的博弈論革命。4.4博弈論的成熟及與主流經(jīng)濟(jì)學(xué)的融合
一、80、90年代是博弈論走向成熟的時期
1981(El
溫馨提示
- 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
- 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
- 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
- 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負(fù)責(zé)。
- 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請與我們聯(lián)系,我們立即糾正。
- 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時也不承擔(dān)用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。
最新文檔
- 聚餐燒烤采購合同范例
- 農(nóng)場拆遷賠償合同范例
- 快遞末端加盟合同范例
- 拆遷房子合同范例
- 電車租賃包月合同范例
- 石油化工消防維保合同范例
- 商旅服務(wù)合作合同范例
- 招聘銷售崗位合同范例
- 提前訂購生豬合同范例
- 廢品袋子出售合同范例
- 工程交工驗(yàn)收會議監(jiān)理發(fā)言
- 電力工程項(xiàng)目管理中的溝通與協(xié)調(diào)
- 中國農(nóng)業(yè)銀行流水單_免費(fèi)下載
- 護(hù)士延續(xù)注冊申請表范本
- 常用中藥藥材替代使用速查表
- ASME標(biāo)準(zhǔn)鋼號和中國鋼號對照表
- 頸靜脈球體瘤
- 【精選】教導(dǎo)處范文名師、學(xué)科帶頭人、骨干教師、教壇新秀評選方案
- 計(jì)量器具校準(zhǔn)記錄表
- 2022年2022年跨欄教案-程璐上交
- 青海省互助豐臺溝隧道施工組織設(shè)計(jì)
評論
0/150
提交評論