博弈論教材課件匯總完整版ppt全套課件最全教學(xué)教程整本書電子教案全書教案合集最新課件匯編_第1頁
博弈論教材課件匯總完整版ppt全套課件最全教學(xué)教程整本書電子教案全書教案合集最新課件匯編_第2頁
博弈論教材課件匯總完整版ppt全套課件最全教學(xué)教程整本書電子教案全書教案合集最新課件匯編_第3頁
博弈論教材課件匯總完整版ppt全套課件最全教學(xué)教程整本書電子教案全書教案合集最新課件匯編_第4頁
博弈論教材課件匯總完整版ppt全套課件最全教學(xué)教程整本書電子教案全書教案合集最新課件匯編_第5頁
已閱讀5頁,還剩33頁未讀, 繼續(xù)免費閱讀

下載本文檔

版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進行舉報或認領(lǐng)

文檔簡介

1、博 弈 論序 言在序言中,我們主要是對整個教材做一個總體上的介紹,并且提出有關(guān)的注意事項。一、該教材的組織安排和結(jié)構(gòu)。二、該教材所具有的特點。三、學(xué)習(xí)博弈論所需要的幾個條件。下面我們就分別加以介紹。第一章 導(dǎo)論第二章 靜態(tài)博弈第三章 納什均衡解第四章 動態(tài)博弈第五章 重復(fù)博弈第六章 貝葉斯博弈第七章 非完全信息動態(tài)博弈第八章 若干擴展博弈論的組織安排和結(jié)構(gòu)教材的特點在保證理論教全面的情況下,強調(diào)運用。邊學(xué)邊做,習(xí)題都被放在文章的正文中,成為正文的一個有機組成部分,通過做題來理解理論要比單純的學(xué)習(xí)要有有效的多,而且也與課程追求運用的目的相吻合。對數(shù)學(xué)的要求都很基礎(chǔ),相信即使對數(shù)學(xué)了解不多的讀者也

2、能很好的理解本書內(nèi)容。深入淺出也是本書的一大特點。給讀者的幾點建議盡管在書中盡量不用數(shù)學(xué)和盡量用簡單的數(shù)學(xué),但仍要求讀者對求導(dǎo)數(shù)較為熟悉,同時具備基本的概率論知識。學(xué)習(xí)是一個痛并快樂的事,有時可能面對一個問題百思不得其解,但一旦破解將會豁然開朗,喜悅之情悠然而生,該書的目的就是希望每位讀者都能夠體會到這種樂趣,但最終還是取決于讀者自身。好記性不如爛筆頭,多寫多記,甚至進一步查閱文獻都是學(xué)好博弈論的有效方法,也是深造的最有效途徑。第一章 導(dǎo)言第一節(jié) 什么是博弈論第二節(jié) 博弈論的經(jīng)濟學(xué)淵源第三節(jié) 博弈論革命第四節(jié) 博弈論要點 第一節(jié) 什么是博弈論我們首先看幾個例子。例1.1 石頭、剪刀、布豬 八

3、戒 石 頭 剪 刀 布孫悟空石頭未定,未定休息,找水找水,休息剪刀找水,休息未定,未定休息,找水布休息,找水找水,休息未定,未定例1.2 諾曼底登陸德 軍加來設(shè)防諾曼底設(shè)防盟 軍加來登陸失敗,成功成功,失敗諾曼底登陸成功,失敗失敗,成功例1.3 鴿派和鷹派美 國鴿派政策鷹派政策蘇聯(lián)鴿派政策0,01,+1鷹派政策+1,1 , 從上面的三個例子中,我們可以概括出一個博弈所具有的共同特征:利益相沖突的參與者、參與者總是根據(jù)對手可能采取的策略來采取相應(yīng)的行動-相互依存的策略和行動、參與者總是追求自身利益最大化。根據(jù)這些共同特征我們就能給出一個博弈的定義,只要符合這個定義,就可以將其納入到博弈論的研究范

4、疇之中。定義1.1 博弈是指利益存在沖突的決策主體(個人,企業(yè),集團,政黨,國家等等)在相互對抗(或合作)中,對抗雙方(或多方)相互依存的一系列策略和行動的過程集合。 在定義1.1中,我們最需要注意的就是策略的相互依存性。對于策略的相互依存性,傳統(tǒng)的經(jīng)濟學(xué)不是不想研究,而是缺乏有效的工具。從這個意義上而言,博弈論正是為了解決這一問題而產(chǎn)生的。也是從這個意義上講,我們有了博弈論的定義。定義1.2 博弈論是專門研究博弈如何出現(xiàn)均衡的規(guī)律的學(xué)科。 正是由于博弈論將博弈如何出現(xiàn)均衡列為核心,因而博弈論對于各門社會科學(xué)而言,就具有了方法論意義,成為各門學(xué)科的有力分析工具。第二節(jié) 博弈論的經(jīng)濟學(xué)淵源 博弈

5、論與經(jīng)濟學(xué)存在著不解之緣,主要是由于下面幾個方面:(1)博弈論的核心問題是經(jīng)濟學(xué)最早提出并加以系統(tǒng)研究的。(2)博弈論理論發(fā)展主要是經(jīng)濟學(xué)的需要推動的,也主要是由經(jīng)濟學(xué)家加以發(fā)展。(3)博弈論中的主要問題基本上都涉及到經(jīng)濟利益沖突問題。一、模型 所謂模型通俗地說就是一個對某種現(xiàn)象進行說明與解釋、甚或推演的邏輯體系。模型的形式多種多樣,并不一定必須是數(shù)學(xué)建立起來的才能稱為模型。一個模型通常有三個最基本的部分組成: 理論假設(shè) 邏輯推理 理論假說評判一個模型是好是壞關(guān)鍵取決于實踐檢驗,但由于模型總是簡化的,因而檢驗并不像我們想象的那么簡單。實際上,當(dāng)我們觀察到一個現(xiàn)象,將其抽象為一個模型的過程實際上

6、就是一個簡化的過程,簡化不同可能得出完全矛盾的結(jié)論,真理與謬誤相差只不過是毫厘之間,所謂既科學(xué)也是藝術(shù)就是這個道理。二、博弈論的經(jīng)濟學(xué)淵源 經(jīng)濟學(xué)的一些思想為博弈論提供了基礎(chǔ),其中最重要的就是所謂的“理性人”。 描述理性人的工具就是所謂的理性偏好。為了方便,我們又用效用函數(shù)(在博弈論中稱為收益函數(shù))來表示偏好。 構(gòu)成博弈論基礎(chǔ)的一個重要的經(jīng)濟定理就是所謂的理性選擇原理:如果決策主體的偏好是理性的,那么(有限)選擇集中就一定存在最優(yōu)選擇,這個選擇可能是唯一的,也可能是多個。需要注意的幾個問題:(1)表達同一個偏好的收益函數(shù)不唯一,但在單調(diào)變換下卻是唯一的。(2)理性并不等同于自私自利。(3)理性

7、選擇理論是有局限性的。三、博弈論革命 所謂革命是指博弈論對經(jīng)濟學(xué)(其他社會科學(xué))研究產(chǎn)生了深遠的影響。傳統(tǒng)經(jīng)濟學(xué)失靈的五個領(lǐng)域正好體現(xiàn)著博弈論的價值和意義:(1)非完全競爭;(2)外在性;(3)公共產(chǎn)品;(4)逆向選擇;(5)道德風(fēng)險。在其他社會科學(xué)中,博弈論同樣可以用來解釋各種現(xiàn)象,比如政黨,利益集團,甚或人類的基本制度。比如奧爾森集體行動的邏輯,羅爾斯正義論。在自然科學(xué)中,博弈論被運用在人工智能,物種演化等方面。所以稱博弈論革命并不為過。第四節(jié) 博弈論要點一、博弈的四個要素:(1)參與者,博弈中的決策主體。(2)博弈規(guī)則,對博弈如何進行做出的規(guī)定。(3)結(jié)果,博弈最后出現(xiàn)的情形。(4)收益

8、,就是參與者對結(jié)果的偏好。二、博弈的基本式 如何將博弈表示成一種便于研究和分析的形式顯然是很重要的。如果用參與者、策略和收益函數(shù)來(科學(xué))描述一個博弈,就稱為博弈表達的基本式。三、博弈的擴展式 博弈的擴展式就是非常詳細地描繪出一個博弈的參與者、策略、行動順序以及行動時擁有的信息、可能的結(jié)果和收益等細節(jié)就稱為博弈的擴展式。四、信息和順序 完全信息和非完全信息,完全和非完全判斷的標準就是如果有些信息只有一部分參與者知道,并不是所有的信息都是公共信息,那么博弈就是非完全信息博弈。 靜態(tài)博弈和動態(tài)博弈,靜態(tài)和動態(tài)的區(qū)別并不在于時間上是否同時,而是在信息上的一種同時行動。公共知識與一般信息的區(qū)別。第二章

9、 完全信息靜態(tài)博弈本章要點什么是博弈的基本式。如何將一個博弈用基本式加以概括。什么是納什均衡。純策略和混合策略納什均衡的證明。一、博弈的基本式首先我們需要明確什么是完全信息和靜態(tài)博弈,完全信息是指每個參與者的收益函數(shù)都是公共信息,而靜態(tài)博弈則指每個參與者都同時行動,隨后博弈結(jié)束。理解同時行動的關(guān)鍵在于每一個參與者在行動時并不了解其他參與者的行動。完全信息靜態(tài)博弈是最簡單的博弈。通常描述它只需要一些基本的要素就可以了。定義2.1 博弈表達的基本式(或策略式)由博弈的參與者N,策略空間S和收益函數(shù)u三個要素組成,即G = N, S, u。這里需要注意的是,完全信息靜態(tài)博弈在多數(shù)情況下,策略就等同于

10、行動,所以G= A,u。但嚴格來講,策略并不是行動。我們可以通過一個例子來加以說明。例1 進攻與防守雙方爭奪一個據(jù)點,有兩條進攻路線X和Y,攻方有兩個軍,而防守方也有兩個軍,只有當(dāng)守方的兵力不少于攻方時,才能擊退進攻,否則據(jù)點將會失守。首先可知守方的防守方案(即策略)為(0,2),(1,1),(2,0),即在X線路和Y線路駐扎軍隊數(shù),同樣可以到的攻方的進攻方案(0,2),(1,1)和(2,0)。容易看出,行動并非策略,策略是行動方案。守 方(0,2)(1,1)(2,0)攻 方(0,2)失敗,成功成功,失敗成功,失敗(1,1)成功,失敗失敗,成功成功,失敗(2,0)成功,失敗成功,失敗失敗,成功

11、二、納什均衡 有些策略式博弈性態(tài)非常好,不需要所謂的均衡概念就能找到博弈的均衡解,例如利用博弈參與者的理性這一假設(shè)就可以找出甚至是唯一的均衡。這里介紹幾個重要的概念:嚴格優(yōu)策略,嚴格劣策略,優(yōu)策略,劣策略,其基本的方法就是重復(fù)剔除嚴格劣策略,這種思路又被稱為博弈的可理性化。 但是,對于更一般的博弈,利用可理性化導(dǎo)致的結(jié)果可能是所有博弈組合都無法剔除,從而導(dǎo)致所有組合都可能是均衡這樣的狀態(tài)。嚴格優(yōu)策略通俗地說就是在任何情況下,該策略帶給參與者的收益都要嚴格大于其它任意策略。理解嚴格優(yōu)策略的關(guān)鍵在于兩個任意:給定對手任意的策略和自己任意的策略。如果嚴格優(yōu)策略存在,那么它必然是唯一的。這體現(xiàn)在命題2

12、.1中。相應(yīng)地,我們可以定義嚴格劣策略。嚴格劣策略是指存在某個策略無論在任何情況下,該策略帶個參與者的收益都要嚴格大于另一個策略。由此,可以看出嚴格優(yōu)策略和嚴格劣策略的差異。嚴格優(yōu)策略是全局性的,而嚴格劣策略只是相對于另一個策略而言。因而嚴格劣策略的要求要比嚴格優(yōu)策略要松,運用重復(fù)剔出嚴格劣策略(如果存在的話)通常都能夠確定博弈的均衡。如果放寬要求,可以相應(yīng)地定義優(yōu)策略和劣策略。優(yōu)策略的缺點是均衡不唯一,而劣策略卻有可能將均衡剔出,因而重復(fù)剔出只能運用到嚴格劣策略。通常,并不是所有博弈都存在劣策略,那么在這種情況下,博弈還存在均衡嗎?納什均衡:納什均衡通俗地說就是一個策略組合,其具有這樣一個特

13、性,即沒有任何一個參與者有動機單方面改變策略單邊背離。納什均衡與嚴格優(yōu)策略、嚴格劣策略的關(guān)系,體現(xiàn)在命題2.2和命題2.3上。納什均衡同樣存在不合理的地方,例如當(dāng)參與者的人數(shù)2時,一個納什均衡(策略組合)雖然不存在單邊背離,但有可能存在多邊背離。所謂多邊背離就是2人或2人以上的參與者同時背離納什均衡。為了克服這個缺點,理論界進行了一系列的努力,但都未能動搖納什均衡的地位。我們現(xiàn)在就舉例說明。例 雙邊背離與納什均衡1,1,2_ ,0, _0, _, _2, 2,1_, _, 1. 2 2 左 右 左 右上下1 3 高 低為了加深理解,我們來看一些經(jīng)典例子。見書43頁50頁。通過這些例子,要求:1

14、、掌握如果概括博弈的方法基本式,2、如何找納什均衡。三、最優(yōu)反應(yīng)函數(shù)最優(yōu)反應(yīng)函數(shù)是更為一般的尋找納什均衡的通用方法。最優(yōu)反應(yīng)函數(shù)通俗講就是描述了當(dāng)給定對手的某個策略時,我最優(yōu)的策略是什么?數(shù)學(xué)一點的話講,就是一個函數(shù)(對應(yīng)),其自變量為其它對手的策略,而應(yīng)變量則為自己的策略。最優(yōu)反應(yīng)函數(shù)不僅適用于離散策略,而且特別適用于連續(xù)策略。如果找到了所有參與者的最優(yōu)反應(yīng)函數(shù),如果我們把所有參與者的最優(yōu)反應(yīng)函數(shù)看作是一個大的“函數(shù)”,那么它的不動點,就是納什均衡。對稱博弈和對稱均衡能夠大大節(jié)省工作量,這也是博弈論中所舉例子通常為對稱博弈的原因。對稱博弈通俗說就是代表參與者身份的下標,在分析中可以省略掉而沒有關(guān)系。四、混合策略博弈論里面最根本的問題是什么?就是均衡的存在性。如果均衡不存在,所有的工作都成了無用功,之所以引入混合策略,意義就在這里,因為如果僅僅限制在純策略的范圍內(nèi)討論博弈的話,均衡有可能是不存在的?;旌喜呗酝ㄋ椎卣f就是隨機選擇純策略。在混合策略條件下,偏好實質(zhì)上變成了v-N-M偏好,除了滿足非對稱性和負傳遞性外,還需滿足替代公理和阿基米德公理。伯努利收益函數(shù)滿足線性變換。我們知道,一個嚴格劣策略肯定是一個從來都不會選擇的策略,在混合策略下,從來都不選擇的策略同樣是嚴格劣策略。但限制在純策略下,這個逆命題卻不成立。一個純策略組合如果它是一個納什均衡,那么在任何情況下,它仍是一

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負責(zé)。
  • 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔(dān)用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

評論

0/150

提交評論