博弈論和納什均衡_第1頁
博弈論和納什均衡_第2頁
博弈論和納什均衡_第3頁
免費(fèi)預(yù)覽已結(jié)束,剩余1頁可下載查看

下載本文檔

版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進(jìn)行舉報或認(rèn)領(lǐng)

文檔簡介

1、博弈論和納什均衡關(guān)于博弈論和納什均衡你應(yīng)該知道這些美股騰訊財經(jīng)微博2015-05-25 10:05我要分享139摘要納什在與命運(yùn)的博弈中找到均衡,紀(jì)念大 師最好的方式就是嘗試了解博弈論。騰訊財經(jīng)綜合報道(風(fēng)生)奧斯卡獲獎電影美麗心靈主角原型、諾貝 爾獎得主、美國數(shù)學(xué)家約翰-納什日前與妻子在美國新澤西州乘搭的士時遇上車 禍,兩人均不幸遇難。事發(fā)當(dāng)時,這輛出租車失控撞向欄桿,兩人均被拋出車 外。約翰-納什因發(fā)表兩篇關(guān)于非合作博弈論的重要論文,徹底改變了人們對競 爭和市場的看法。他證明了非合作博弈及其均衡解,并證明了均衡解的存在性, 即著名的納什均衡。不均衡人生中孕育出均衡論納什于1928年在美國西

2、弗吉尼亞州出生,曾在麻省理工學(xué)院任教,晚年為 普林斯頓大學(xué)擔(dān)任數(shù)學(xué)系教授,死前與 82歲妻子艾麗西亞在普林斯頓居住。納 什以研究博弈論聞名,1994年獲頒諾貝爾經(jīng)濟(jì)學(xué)獎。他的理論被運(yùn)用在市場經(jīng) 濟(jì)、計算、演化生物學(xué)、人工智能、會計、政策和軍事理論等多個領(lǐng)域。納什在數(shù)學(xué)領(lǐng)域上取得多項突破,但他同時深受精神分裂癥困擾,其生平 故事在2001年被改編成電影美麗心靈,贏得包括最佳電影在內(nèi)的4項奧斯卡獎項。盡管西維亞-納薩斯(Sylvia Nasars )廣為人知的小說美麗心靈(ABeautiful Mi nd)和改編自該書的、由拉塞爾-克羅(Russell Crowe )主演的 同名奧斯卡電影探究了納

3、什錯綜復(fù)雜的生平,但都沒有深入挖掘他的數(shù)學(xué)思想。 他的數(shù)學(xué)成果依然不被大眾所熟知。在當(dāng)今科學(xué)界,人們普遍認(rèn)為,與牛頓和 愛因斯坦的數(shù)學(xué)理論相比,納什的數(shù)學(xué)理論觸及到的學(xué)科更多。牛頓和愛因斯 坦的數(shù)學(xué)旨在處理物理問題,而納什的數(shù)學(xué)卻可以應(yīng)用在生物學(xué)和社會學(xué)領(lǐng)域。如若不是精神疾病的困擾,納什今天可能已與那些科學(xué)偉人齊名。盡管如 此,他在幾個數(shù)學(xué)領(lǐng)域的重要貢獻(xiàn)大家有目共睹。他最大的成就來自于經(jīng)濟(jì)學(xué) 方面。由于他在博弈論上的開創(chuàng)性成就,他與約翰海薩尼(John Harsanyi )和萊茵哈德-澤爾騰(Reinhard Selten ) 起獲得了 1994年諾貝爾經(jīng)濟(jì)學(xué)獎。什么是博弈論與納什均衡博弈論:

4、亦名“對策論”、“賽局理論”,屬應(yīng)用數(shù)學(xué)的一個分支,主要 研究公式化了的激勵結(jié)構(gòu)間的相互作用。是研究決策主體的行為發(fā)生直接相互 作用時候的決策以及這種決策的均衡問題,具有斗爭或競爭性質(zhì)現(xiàn)象的數(shù)學(xué)理 論和方法。也是運(yùn)籌學(xué)的一個重要學(xué)科。博弈論考慮游戲中的個體的預(yù)測行為 和實(shí)際行為,并研究它們的優(yōu)化策略。納什均衡:又稱為非合作博弈均衡,是博弈論的一個重要術(shù)語,以約翰-納什命名。假設(shè)有n人局中人參與博弈,給定其他人策略的條件下,每個局中人 選擇自己的最優(yōu)策略(個人最優(yōu)策略可能依賴于也可能不依賴于他人的戰(zhàn)略), 從而使自己利益最大化。所有局中人策略構(gòu)成一個策略組合。納什均衡指的是 這樣一種戰(zhàn)略組合,這

5、種策略組合由所有參與人最優(yōu)策略組成。即在給定別人 策略的情況下,沒有人有足夠理由打破這種均衡。納什均衡,從實(shí)質(zhì)上說,是 一種非合作博弈狀態(tài)。近代對于博弈論的研究,開始于策墨咯,波雷爾及馮 -諾伊曼。1928年,馮 -諾依曼證明了博弈論的基本原理,從而宣告了博弈論的正式誕生。1944年,馮-諾依曼和摩根斯坦共著的劃時代巨著博弈論與經(jīng)濟(jì)行為將二人博弈推廣到 n人博弈結(jié)構(gòu)并將博弈論系統(tǒng)的應(yīng)用于經(jīng)濟(jì)領(lǐng)域,從而奠定了這一學(xué)科的基礎(chǔ)和 理論體系。19501951年,約翰-福布斯-納什利用不動點(diǎn)定理證明了均衡點(diǎn)的 存在,為博弈論的一般化奠定了堅實(shí)的基礎(chǔ)。納什的開創(chuàng)性論文n人博弈的均 衡點(diǎn)(1950),非合作

6、博弈(1951)等等,給出了納什均衡的概念和均 衡存在定理。此外,塞爾頓、哈桑尼的研究也對博弈論發(fā)展起到推動作用。今天博弈論 已發(fā)展成一門較完善的學(xué)科。博弈論起源于研究人們玩撲克( poker)、象棋(chess)等室內(nèi)游戲時的行為決策,后來作為一種研究人類經(jīng)濟(jì)行為的數(shù)學(xué)工 具得到了充分的發(fā)展。從根本上講,博弈論涉及到從打網(wǎng)球到指揮戰(zhàn)爭的任何 牽扯策略的情景。博弈論提供了一種計算各種可能決策所產(chǎn)生效益的數(shù)學(xué)方法, 該理論為在各種競賽性場合做出最佳決定建立了一套具體的數(shù)學(xué)公式。正如經(jīng) 濟(jì)學(xué)家赫伯特-金迪斯(Herbert Gintis )所說,博弈論是我們“研究世界的一 種工具”。但它不僅僅是一

7、種工具,“它不僅研究人們?nèi)绾魏献?,而且研究?們?nèi)绾胃偁帯薄M瑫r,“博弈論還研究行為方式的產(chǎn)生、轉(zhuǎn)變、散播和穩(wěn)定。”博弈論與納什均衡的發(fā)展和應(yīng)用博弈論不是納什發(fā)明的,但他擴(kuò)大了該理論的范圍,為之提供了解決實(shí)際 問題的更有力工具。在一開始,他的研究成果并沒有受到人們的重視。他的文 章發(fā)表在20世紀(jì)50年代,在當(dāng)時博弈論僅在冷戰(zhàn)分析家之間流傳,這些分析 家認(rèn)為國際侵略和利益最大化之間有一些相似之處。在經(jīng)濟(jì)學(xué)界,博弈論還被 視為一種新奇事物。經(jīng)濟(jì)學(xué)家薩繆-鮑爾斯(Samuel Bowles )告訴我說:“在 當(dāng)時博弈論羽翼未豐,如同經(jīng)濟(jì)學(xué)中其它許多優(yōu)秀的思想一樣,它還沒有受到 人們的關(guān)注。”然而在2

8、0世紀(jì)70年代時情況發(fā)生了改變,進(jìn)化論學(xué)派的生物學(xué)家開始采 用博弈論研究動植物中的生存競爭現(xiàn)象。緊接著在20世紀(jì)80年代,經(jīng)濟(jì)學(xué)家終于開始以各種不同方式將博弈論應(yīng)用于經(jīng)濟(jì)學(xué)中,尤其是將它用在設(shè)計真實(shí) 試驗(yàn)以驗(yàn)證經(jīng)濟(jì)學(xué)理論方面。到 80年代末博弈論在經(jīng)濟(jì)學(xué)領(lǐng)域已經(jīng)充分顯示了 它的作用, 這最終促成了納什等1994年諾貝爾經(jīng)濟(jì)學(xué)獎的獲得。早在此之前,博弈論就已經(jīng)出現(xiàn)在許多學(xué)科的課程中。數(shù)學(xué)系、經(jīng)濟(jì)學(xué)系、 生物學(xué)系、還有政治科學(xué)系、心理學(xué)系和社會科學(xué)系的課程中都含有博弈論的 內(nèi)容。到了 21世紀(jì)初,博弈論的應(yīng)用更為廣泛,涉及到從人類學(xué)到神經(jīng)生物學(xué) 等多個領(lǐng)域?,F(xiàn)今,經(jīng)濟(jì)學(xué)家繼續(xù)使用博弈論分析人們?nèi)绾?/p>

9、做出有關(guān)金錢的決策;生物 學(xué)家用它來建立假說以解釋適者生存原理和利他主義的起源;人類學(xué)家使用它 來研究原始文化,從而說明人性的多樣化;神經(jīng)科學(xué)者也加入了博弈論研究的 行列,通過研究博弈者的大腦,試圖發(fā)現(xiàn)決策如何反映人們的動機(jī)和情感。簡言之,納什的數(shù)學(xué)理論連同在其在其基礎(chǔ)上建立起來的現(xiàn)代博弈論已經(jīng) 成為科學(xué)家研究眾多與人類行為相關(guān)課題時的首選方法。博弈論和納什均衡的幾個經(jīng)典案例【智豬博弈(Pigs payoffs )】豬圈里有兩頭豬,一頭大豬,一頭小豬 豬圈的一邊有個踏板,每踩一下踏板,在遠(yuǎn)離踏板的豬圈的另一邊的投食口就 會落下少量的食物。如果有一只豬去踩踏板,另一只豬就有機(jī)會搶先吃到另一 邊落

10、下的食物。當(dāng)小豬踩動踏板時,大豬會在小豬跑到食槽之前剛好吃光所有 的食物;若是大豬踩動了踏板,則還有機(jī)會在小豬吃完落下的食物之前跑到食 槽,爭吃到另一半殘羹。那么,兩只豬各會采取什么策略?答案是:小豬將選擇“搭便車”策略, 也就是舒舒服服地等在食槽邊;而大豬則為一點(diǎn)殘羹不知疲倦地奔忙于踏板和 食槽之間。原因何在?因?yàn)?,小豬踩踏板將一無所獲,不踩踏板反而能吃上食物。對 小豬而言,無論大豬是否踩動踏板,不踩踏板總是好的選擇。反觀大豬,已明 知小豬是不會去踩動踏板的,自己親自去踩踏板總比不踩強(qiáng)吧,所以只好親力 親為了。【槍手博弈】王者的悲哀。三人對槍自決,甲乙丙槍法優(yōu)劣遞減。最后無 奈而神奇的結(jié)局,

11、將不取決于同時開槍還是先后開槍,最優(yōu)良的槍手,倒下的 概率將最高;而最蹩腳的槍手,存活的希望卻最大。因?yàn)闆]有人會把威脅最小 的槍手列為一號清楚目標(biāo)。在這里,后發(fā)制人的弱勢者將勝出。以弱勝強(qiáng),絕 不是神話?!厩敉嚼Ь场考僭O(shè)有兩個小偷 A和B聯(lián)合犯事、私入民宅被警察抓住。警 方將兩人分別置于不同的兩個房間內(nèi)進(jìn)行審訊,對每一個犯罪嫌疑人,警方給 出的政策是:如果一個犯罪嫌疑人坦白了罪行,交出了贓物,于是證據(jù)確鑿, 兩人都被判有罪。如果另一個犯罪嫌疑人也作了坦白,則兩人各被判刑8年;如果另一個犯罪嫌人沒有坦白而是抵賴,則以妨礙公務(wù)罪(因已有證據(jù)表明其 有罪)再加刑2年,而坦白者有功被減刑8年,立即釋放

12、。如果兩人都抵賴, 則警方因證據(jù)不足不能判兩人的偷竊罪,但可以私入民宅的罪名將兩人各判入 獄1年。關(guān)于這個案例,顯然最好的策略是雙方都抵賴,結(jié)果是大家都只被判1年。但是由于兩人處于隔離的情況,首先應(yīng)該是從心理學(xué)的角度來看,當(dāng)事雙方都 會懷疑對方會出賣自己以求自保、其次才是亞當(dāng) -斯密的理論,假設(shè)每個人都是 “理性的經(jīng)濟(jì)人”,都會從利己的目的出發(fā)進(jìn)行選擇。這兩個人都會有這樣一 個盤算過程:假如A坦白,B抵賴,B得坐10年監(jiān)獄,B坦白最多才8年;B要 是抵賴,A就可以被釋放,而B會坐10年牢。綜合以上幾種情況考慮,不管 A 坦白與否,對B而言都是坦白了劃算。兩個人都會動這樣的腦筋,最終,兩個 人都選擇了坦白,結(jié)果都被判 8年刑期。博弈論和納什均衡的重要影響博弈論所研究的是理性的決策者之間沖突及合作的理論,可以為實(shí)際決策 提供理論基礎(chǔ)和方向指導(dǎo)。其最終追求結(jié)果是使博弈方達(dá)到利益最大化的均衡。 在生活中,博弈仍然無處不在。博弈論代表著一種全新的分析方法和全新的思 想。諾貝爾經(jīng)濟(jì)學(xué)獎獲得者保羅-薩繆爾遜如是說:要想在現(xiàn)代社會做個有價值 的人,你就必須對博弈論有個大致的了解也可以這樣說,要想贏得生意,不可 不學(xué)博弈論;要想贏得生活,同樣不可不學(xué)

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負(fù)責(zé)。
  • 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時也不承擔(dān)用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

評論

0/150

提交評論