納什均衡及應用舉例博弈論

上傳人：1*** IP屬地：廣西上傳時間：2024-01-20 格式：PPT 頁數(shù)：116 大?。?33.50KB 積分：18 舉報 版權申訴

已閱讀5頁，還剩111頁未讀，繼續(xù)免費閱讀

版權說明：本文檔由用戶提供并上傳，收益歸屬內(nèi)容提供方，若內(nèi)容存在侵權，請進行舉報或認領

文檔簡介

第一章完全信息靜態(tài)信息博弈-納什均衡一博弈的根本概念及戰(zhàn)略表述二占優(yōu)戰(zhàn)略均衡三重復剔除的占優(yōu)均衡四納什均衡五納什均衡應用舉例博弈論的根本概念與求解引例：房地產(chǎn)開發(fā)博弈設一個房地產(chǎn)開發(fā)商A打算開發(fā)一棟寫字樓，面臨的選擇是開發(fā)或不開發(fā)；假設開發(fā)，投入資金1億元，不開發(fā)資金投入為0另有一個開發(fā)商B也面臨同樣的選擇。影響因素：市場需求的大小影響因素：競爭對手的選擇引例：房地產(chǎn)開發(fā)博弈如果市場上有兩棟樓出售，需求大時，每棟售價1.4億元，需求小時7000萬元如果市場上只有一棟樓出售，需求大時。每棟售價1.8億元，需求小時1.1億元需求大，A開發(fā),B開發(fā),利潤各4000萬元需求大，A開發(fā)，B不開發(fā)，A8000萬元，B為0需求大，A不開發(fā),B開發(fā)，B為8000萬元，A為0需求大，A不開發(fā),B不開發(fā),都為0需求小，A開發(fā),B開發(fā)，AB各為-3000萬元需求小，A開發(fā),B不開發(fā)。A為1000萬元B為0需求小，A不開發(fā),B開發(fā)A為0，B為1000萬元需求小，A不開發(fā),B不開發(fā)，都為0房地產(chǎn)開發(fā)博弈房地產(chǎn)開發(fā)博弈4000，40008000，00，80000，0不開發(fā)開發(fā)商A開發(fā)不開發(fā)開發(fā)-3000，-30001000，00，10000，0不開發(fā)開發(fā)商B開發(fā)商A開發(fā)不開發(fā)開發(fā)開發(fā)商B需求小的情況需求大的情況假設雙方同時決策假設市場需求假設市場需求未知，是否開發(fā)依賴于各自在多大程度上認為需求是大的，以對方是否開發(fā)房地產(chǎn)開發(fā)博弈假設雙方不同時決策，且市場需求不確定設B在A之前決策，且只有B了解市場需求假設需求是大的,B選擇開發(fā)假設需求是小的，B的選擇依賴于他多大程度上相信A會開發(fā)，而A是否開發(fā)依賴于A在多大程度上認為需求是大的。房地產(chǎn)開發(fā)博弈博弈的根本概念PlayersActionStrategies&strategiessetInformationPayoff&payofffunctionOutcome&EquilibriumPlayers決策主體：單人博弈、兩人博弈和多人博弈。目的是通過選擇行動或策略以最大化自己的支付或效用水平自然人或團體，如企業(yè)、國家、OPEC、EU重要的是每個決策主體必須有可供選擇的行動或策略和一個很好定義的偏好而不做決策的被動主體只當作環(huán)境參數(shù)虛擬參與人：“自然〞〔nature〕作為“虛擬參與人〞〔pseudo-player〕來處理。這里的自然指決定外生隨機變量的概率分布的機制房地產(chǎn)開發(fā)博弈4000，40008000，00，80000，0不開發(fā)開發(fā)商A開發(fā)不開發(fā)開發(fā)-3000，-30001000，00，10000，0不開發(fā)開發(fā)商B開發(fā)商A開發(fā)不開發(fā)開發(fā)開發(fā)商B需求小的情況需求大的情況N高低[P][1-P]不進入進入不進入進入BB合作斗爭合作斗爭(0,300)(40,50)(-10,0)(30,80)(-10,100)進入者在位者在位者(0,400)市場進入博弈行動action行動：是參與人的決策變量參與人的行動可以是離散的，也可以是連續(xù)的。如Ai={開發(fā)，不開發(fā)}行動組合：n個參與人的行動有序集(如〔不開發(fā)，開發(fā)〕)行動順序：有關靜態(tài)博弈和動態(tài)博弈的區(qū)分在博弈論中，一般假定參與人的行動空間和行動順序是所有參與人的共同知識Strategies&strategiesset戰(zhàn)略：是參與人選擇行動的規(guī)那么，它告訴參與人在什么時候選擇什么行動戰(zhàn)略組合戰(zhàn)略與行動是兩個不同的概念，戰(zhàn)略是行動的規(guī)那么而不是行動本身“人不犯我，我不犯人；人假設犯我，我必犯人〞是一種戰(zhàn)略，這里的“犯〞與“不犯〞是兩種行動，戰(zhàn)略規(guī)定了什么時候選擇“犯〞，什么時候選擇“不犯〞靜態(tài)博弈中參與人同時行動。戰(zhàn)略和行動是相同的作為一種行動規(guī)那么，戰(zhàn)略必須是完備的，就是說，它要給出參與人在每一種可想象到的情況下的行動選擇，即使參與人并不預期這種情況會實際發(fā)生房地產(chǎn)開發(fā)博弈4000，40008000，00，80000，0不開發(fā)開發(fā)商A開發(fā)不開發(fā)開發(fā)-3000，-30001000，00，10000，0不開發(fā)開發(fā)商B開發(fā)商A開發(fā)不開發(fā)開發(fā)開發(fā)商B需求小的情況需求大的情況如果B在市場需求情況未知下先行動，A在得知B的行動后再行動。B的戰(zhàn)略SB=(開發(fā)，不開發(fā))A的戰(zhàn)略SA=({開發(fā)，開發(fā)},{開發(fā)，不開發(fā)},{不開發(fā)，開發(fā)},{不開發(fā)，不開發(fā)})一個戰(zhàn)略組合s=({不開發(fā)，開發(fā)},開發(fā))，A的戰(zhàn)略是“如果B開發(fā)，我不開發(fā)；如果B不開發(fā)，我開發(fā)〞，B的戰(zhàn)略是“開發(fā)〞。類似的可以列出其他7個戰(zhàn)略組合Information是Player有關博弈的知識，特別是有關其他參與人〔對手〕的特征和行動的知識.它是重要的決策依據(jù)和決定博弈結果的重要因素。信息集：參與人在特定時刻有關變量的值的信息CommonKnowledge即共同知識〔所有參與人知道，所有參與人知道所有參與人知道，〕CompleteandPerfect

——完全信息與完美信息兩者主要區(qū)別是在對博弈結果與博弈進程知識的掌握情況有差異：假設每一個參與人都知道所有其他參與人的支付或結果，稱為完全信息博弈〔CIG〕.假設有一個人不知道其他人的支付,稱不完全信息博弈IIG.假設每一個參與人都知道所有其他參與人的博弈進程，即動態(tài)博弈中輪到行為的博弈方完全了解此前行為的各博弈方的行為，即了解全部博弈進程，稱為完美的,否那么就是不完美的.如房地產(chǎn)開發(fā)博弈中，如果至少有一個參與人不知道市場需求的大小，信息是不完全的也是不完美的如果兩個參與人都知道市場需求是大的還是小的，信息是完全的，但如果A不知道B選擇了什么行動，那么A的信息是不完美的。CompleteandPerfect

——完全信息與完美信息支付Payoff它是指在一個特定的策略組合下player得到確實定的效用水平，或者指參與人得到的期望效用水平。這是player真正關心的東西，是player博弈后所得利益。他的目標就是在自己可以選擇的戰(zhàn)略集合里，選擇某個戰(zhàn)略以最大化自己的期望效用函數(shù)〔v-N-M預期效用函數(shù)〕。支付如果有n人博弈，令ui為Playeri的支付(效用水平〕，u=(u1,…ui…un)為支付組合payoffprofile,博弈的一個根本特征是一個參與人的支付不僅取決于自己的戰(zhàn)略選擇，而且取決于所有其他參與人的戰(zhàn)略選擇，即ui是所有參與人的戰(zhàn)略選擇的函數(shù)：ui=ui(s1,,…si,…sn),其中si是Playeri的戰(zhàn)略選擇。房地產(chǎn)開發(fā)博弈參與人的利潤水平即是他們的支付，如果A,B同時行動UA(需求大，A開發(fā),B開發(fā))=UB(需求大，A開發(fā),B開發(fā))=4000UA(需求小，A開發(fā),B開發(fā))=UB(需求小，A開發(fā),B開發(fā))=-3000UA(需求大，A開發(fā),B不開發(fā)〕=8000UB(需求小，A不開發(fā),B開發(fā)〕=1000。。。。。。例如A認為高需求的概率是0.5，給定B選擇開發(fā)，A選擇開發(fā)的期望效用為:EuA(開發(fā)，開發(fā))=0.5*4000+0.5*(-3000)=500Outcome&Equilibrium

——結果與均衡博弈的結果是所有博弈方所關心的，如均衡策略組合，均衡行動組合，均衡支付組合。在房地產(chǎn)開發(fā)博弈中，可能的結果是〔高需求，開發(fā)，開發(fā))，(uA,uB)=(4000,4000)〔低需求，開發(fā)，不開發(fā))，(uA,uB)=(1000,0)均衡均衡是所有參與人的最優(yōu)戰(zhàn)略的組合，一般記為S*=〔S1*，…,Si*,…,Sn*)其中，Si*是Playeri在均衡情況下的最優(yōu)策略。在一般均衡理論中，均衡指由個人最優(yōu)化行為導致的一組價格，而在博弈論里，這一組價格只是均衡的結果而不是均衡本身：均衡是指所有個人的買賣規(guī)那么〔戰(zhàn)略〕的組合，均衡價格是這種戰(zhàn)略組合的結果在這里，“均衡〞和“均衡結果〞是兩個不同的概念博弈分類博弈中的博弈方

單人博弈

兩人博弈

多人博弈

博弈中的策略

有限策略博弈無限策略博弈

博弈中的得益

零和博弈

常和博弈

變和博弈

博弈的過程

靜態(tài)博弈

動態(tài)博弈

重復博弈單人博弈00M0A左B左A左B右A右B左A右B右單人迷宮得益矩陣

入口出口（獎金M）單人迷宮

AB單人博弈（M）AB（0）（0）單人迷宮擴展形兩人博弈兩人博弈就是在兩個各自獨立決策，相互具有策略依存關系的博弈方之間的決策問題兩人博弈是博弈中最普通、最常見，也是研究得最多的博弈類型。如，囚徒的困境、齊威王與田忌賽馬、猜硬幣、石頭·剪子·布，日常生活中的棋牌、球類比賽，以及經(jīng)濟活動中兩廠商之間的競爭、談判、兼并收購、勞資糾紛等等都是兩人博弈問題兩人博弈中的本卷須知

兩個博弈方之間并不總是相互對抗，有時也會利益一致掌握信息較多并不能保證得益較多個人追求自身最大利益的行為常常并不能導致實現(xiàn)社會的最大利益。多人博弈例子11，1，100，5，55，0，52，2，2新技術老技術新技術老技術廠商2廠商

廠商3—新技術（A）1

廠商3—老技術2，2，21，10，110，1，15，5，0新技術新技術老技術老技術廠商2廠商（B）有限策略和無限策略不同的博弈問題中各博弈方可選策略的多少不同，一般分為：有限策略博弈和無限策略博弈有限策略〔所有博弈方都只有有限種可選策略〕的博弈只有有限種結果〔一種結果就是每個博弈方各一種可選策略構成的一個組合，全部可能的結果的數(shù)量因而就等于各博弈方可選策略數(shù)的連乘積〕有限策略博弈往往用支付矩陣、擴展形法將所有策略、結果及支付羅列出來。無限策略博弈其策略數(shù)種往往是一個連續(xù)數(shù)，只能用數(shù)集或函數(shù)式加以表示。有限策略與無限策略同時存在一個博弈問題中零和博弈

零和博弈：

社會總得益，即各博弈方得益之和總是為0

-1，11，-11，-1-1，1正面反面猜硬幣方蓋硬幣方正面反面零和博弈零和博弈的特點：各博弈方之間的利益對立，“你死我活〞的關系，結果不能完全確定，不能讓他們猜出自己將選擇的策略用零和博弈構成的重復博弈與非零和博弈構成的重復博弈會表現(xiàn)出很大的不同，零和博弈重復進行屢次不改變博弈方之間相互對立的關系，其他博弈的重復博弈產(chǎn)生新的時機常和博弈

常和博弈：每種結果之下各博弈方的得益之和不等于0，但總是等于一個非零常數(shù)，零和博弈本身可被看作是常和博弈的特例常和博弈的特點：各博弈方之間的利益關系也是對立的，博弈方之間的根本關系也是競爭不一定要有輸家，利益的對立性表達在利益的多少，結果可能出現(xiàn)大家分得合理或者說滿意的一份，因此也比較容易相互妥協(xié)和和平共處。這種博弈往往有一個確定的結果在重復博弈中，因為常和博弈的重復能使總得益增加，因此情況就會復雜得多，并會創(chuàng)造出許多新的結果變和博弈

變和博弈：意味著在不同策略組合〔結果〕下各博弈方的得益之和不相同的變和博弈的特點：最一般的博弈類型，常和博弈和零和博弈那么都是它的特例存在著社會總得益較大的策略組合和社會總得益較小的策略組合之間的區(qū)別，博弈方之間存在互相配合〔不是指公開的合作，只是指各博弈方在利益驅(qū)動下各自自覺、獨立采取的合作的態(tài)度和行為〕，爭取較大的社會總得益和個人得益的可能性。這種博弈的結果可以從社會總得益的角度分為“有效率的〞或“無效率的〞、“低效率的〞各博弈方之間的關系復雜，它們的重復博弈就更加復雜了博弈的過程〔1〕靜態(tài)博弈：所有博弈方同時或可看作同時選擇策略的博弈動態(tài)博弈：各博弈方不是同時，而是先后、依次進行選擇、行動，后選擇、行動的博弈方在自己選擇行動之前一般能看到此前其他博弈方的選擇、行動的博弈動態(tài)博弈與靜態(tài)博弈中“策略〞有差異：靜態(tài)博弈中，博弈方都只有一次選擇、行為的時機，“策略〞是唯一的選擇或行為，“策略〞與“選擇〞、“行為〞等價動態(tài)博弈中，一個博弈方可能有屢次選擇、行為，后選擇、行為的博弈方在輪到選擇、行為時會面臨不同的情況，博弈方的決策內(nèi)容就不是一個簡單的單一選擇，而是在每次輪到選擇、行為時，面臨各種情況，如何選擇、行為的“完整的方案〞，“策略〞是指這種方案，策略與選擇、行為之間不能簡單等同博弈的過程〔2〕重復博弈：同一個博弈反復進行所構成的博弈過程重復博弈的分類：有限次重復博弈和無限次重復博弈重復博弈本卷須知：重復博弈關心的不是某一次重復的結果或得益，而是原博弈重復進行以后的總體效果或平均效果，不能把重復博弈割裂為一次次獨立的博弈進行分析，而是要將它們作為一個完整的過程和整體來進行分析，重復博弈是一種動態(tài)博弈，是一種特殊的動態(tài)博弈，要用動態(tài)博弈的分析方法加以分析大多數(shù)重復博弈都是由靜態(tài)博弈作為原博弈構成的，要利用靜態(tài)博弈的性質(zhì)和研究方法博弈的過程〔2〕重復博弈本卷須知：一次性博弈，特別是靜態(tài)博弈，各博弈方?jīng)Q策時只需要考慮眼前的利益，不存在“將來〞利益的問題，博弈方是不惜“欺騙〞“傷害〞其他博弈方的博弈不止進行一次，而是要反復進行屢次，那么各博弈方可能會在開頭的各次博弈中試圖合作，采取對大家長期來說都較有利的策略，因為一旦任何一方覺察他方不合作，都有時機在以后階段進行報復，也就是說，重復博弈給博弈提供了新的實現(xiàn)更有效率的結果的可能性，重復博弈的重復次數(shù)越多，這種可能性就越大如何求解一個博弈問題？什么是博弈問題的解是一個策略組合，也是最優(yōu)策略組合；即在給定條件下，每一個博弈方最大化自己效用選擇的結果。如在G={S1,…Sn;u1,…un}中，如果所有策略組合〔S1*，…,Si*,…,Sn*)，其中任一博弈方i的策略Si*都是對其余博弈方的策略組合S-i*=〔S1*，…,S*i-1,S*i+1…,Sn*)的最正確對策,那么這個策略組合就是博弈的解。博弈的根本分析思路和方法嚴格下策反復消去法劃線法箭頭法嚴格下策反復消去法

嚴格下策：不管其他博弈方的策略如何變化，自己的某一策略給他帶來的得益總是比其他某些〔不必是全部〕策略給他帶來的得益要小，該“某一策略〞稱為相對于“其他某些策略〞的“嚴格下策〞嚴格下策反復消去法例子

2,00,20,40,11,31,0左右中上下博弈方2博弈方1

圖1嚴格下策反復消去法

0，20，41，31，0上下左中博弈方2博弈方圖2消去右策后得益矩陣

1，31，0博弈方2左中上博弈方圖3再消去的“下”策后得益矩陣注意：嚴格下策反復消去法不局限于用在可用得益矩陣表示的博弈

嚴格下策反復消去法步驟：找出某博弈方的某策略是相對于他的其他某些策略的嚴格下策，將它從該博弈方的策略空間中去掉在該博弈方余下的策略空間和其他博弈方的策略構成的策略組合中，檢查是否還存在嚴格下策，如有，那么再將其從相應博弈方的策略空間中去掉，如此反復，直到找不出任何嚴格下策如果最后只有唯一的一個策略組合幸存下來，那么它一定就是該博弈的解嚴格下策反復消去法

劃線法

劃線法：通過在每一博弈方針對對方每一策略的最大可能得益下劃線以求解博弈的方法結論：圖中得益矩陣所表示的博弈中就存在唯一的兩數(shù)字下都劃有短線的得益數(shù)組，即對應策略組合〔上，中〕的得益數(shù)組〔1，3〕，因此策略組合〔上，中〕是該得益矩陣表示的博弈的具有穩(wěn)定性的解例子：2，00，20，40，11，31，0下上右中左博弈方2博弈方劃線法分析囚徒困境

結論：策略組合〔坦白，坦白〕對應數(shù)組〔-5，-5〕是該得益矩陣表示的博弈的具有穩(wěn)定性的解-1，-1-8，00，-8-5，-5坦白不坦白坦白不坦白囚徒2囚徒劃線法分析猜硬幣困境

結論：猜硬幣博弈中沒有一種策略組合中的雙方策略正好相互都是關于對方策略的最正確對策，即沒有一個策略組合會是雙方都自愿接受的，該博弈不可能有確定的，或者至少是具有穩(wěn)定性的結果-1，11，-11，-1-1，1正面反面正面反面猜硬幣方蓋硬幣方劃線法分析夫妻之爭結論：存在兩個所有數(shù)字下都劃有短線的得益數(shù)組。意味著而在夫妻之爭博弈中，由于有兩個雙方策略都是對對方策略的最正確對策組成的策略組合〔時裝表演，時裝表演〕和〔足球，足球〕，因此，雖然一旦選了該兩策略組合中任何一個都不會有哪一方愿意單獨改變策略〔一方單獨改變策略只能使自己的得益減少〕，但卻無法確定到底會出現(xiàn)哪個，因此該博弈有穩(wěn)定性的解卻沒有確定性的解1，30，00，02，1時裝足球時裝足球丈夫妻子箭頭法

箭頭法：通過反映各博弈方選擇傾向的箭頭尋找穩(wěn)定性的策略組合求解博弈的方法思路：對博弈中的每個策略組合，判斷各博弈方能否通過單獨改變自己的策略而改善自己的得益，如能，那么從所考察的策略組合的得益引一箭頭到改變策略后的策略組合對應的得益。這樣對每個可能的策略組合都考察過以后，根據(jù)箭頭反映的情況來判斷博弈的結果箭頭法分析例子

在圖中只有指向的箭頭而沒有指離的箭頭的唯一一個得益數(shù)組是對應〔上，中〕策略組合的〔1，3〕，其余5個得益數(shù)組那么至少有一個指離的箭頭，因此〔上，中〕是該博弈唯一穩(wěn)定的策略組合并且也是博弈的解2,00,20,40,11,31,0左右中上下博弈方2博弈方1箭頭法分析猜硬幣

圖中猜硬幣博弈中沒有一個得益數(shù)組只有指向的箭頭，因此沒有任何具有穩(wěn)定性的策略組合和確定的解-1，11，-11，-1-1，1正面反面猜硬幣方蓋硬幣方正面反面箭頭法分析夫妻之爭結論：圖中夫妻之爭博弈的得益矩陣中，有〔時裝，時裝〕和〔足球，足球〕兩策略組合的得益只有指向的箭頭，沒有指離的箭頭，即有兩個具有穩(wěn)定性的策略組合1，30，00，02，1時裝足球丈夫妻子時裝足球博弈的戰(zhàn)略式表述博弈的戰(zhàn)略式表述：非合作博弈論

不完全信息動態(tài)博弈；精煉貝葉斯納什均衡；澤爾騰（1975），Kreps和Wilson（1982），F(xiàn)udenberg和Tirole（1991）不完全信息靜態(tài)博弈；貝葉斯納什均衡；海薩尼（1967－1968）不完全信息完全信息動態(tài)博弈；子博弈精煉納什均衡；澤爾騰（1965）完全信息靜態(tài)博弈；納什均衡；納什（1950，1951）完全信息動態(tài)靜態(tài)行動順序信息非合作博弈的分類及對應的均衡概念第一章完全信息靜態(tài)信息博弈-納什均衡一博弈的根本概念及戰(zhàn)略表述二占優(yōu)戰(zhàn)略均衡三重復剔除的占優(yōu)均衡四納什均衡五納什均衡應用舉例二占優(yōu)戰(zhàn)略均衡完全信息靜態(tài)博弈完全信息：每個參與人對所有其他參與人的特征〔包括戰(zhàn)略空間、支付函數(shù)等〕完全了解靜態(tài)：所有參與人同時選擇行動且只選擇一次。同時：只要每個參與人在選擇自己的行動時不知道其他參與人的選擇，就是同時行動博弈分析的目的是預測均衡結果二占優(yōu)戰(zhàn)略均衡案例1-囚徒困境-8，-80，-10-10，0-1，-1囚徒A囚徒B坦白抵賴坦白抵賴-8大于-100大于-1-8大于-100大于-1抵賴是A的嚴格劣戰(zhàn)略抵賴是B的嚴格劣戰(zhàn)略二占優(yōu)戰(zhàn)略均衡占優(yōu)戰(zhàn)略：不管其他人選擇什么戰(zhàn)略，參與人的最優(yōu)戰(zhàn)略是唯一的，這樣的最優(yōu)戰(zhàn)略稱為“占優(yōu)戰(zhàn)略〞(dominantstrategy)。二占優(yōu)戰(zhàn)略均衡占優(yōu)戰(zhàn)略均衡定義：在博弈的戰(zhàn)略表達式中，如果對于所有的i，Si*是i的占優(yōu)戰(zhàn)略，以下戰(zhàn)略組合稱為占優(yōu)戰(zhàn)略均衡：二占優(yōu)戰(zhàn)略均衡注意：如果所有人都有〔嚴格〕占優(yōu)戰(zhàn)略存在，那么占優(yōu)戰(zhàn)略均衡就是可以預測的唯一均衡。占優(yōu)戰(zhàn)略只要求每個參與人是理性的，而不要求每個參與人知道其他參與人是理性的〔也就是說，不要求理性是共同知識〕。為什么？二占優(yōu)戰(zhàn)略均衡4000，40008000，00，80000，0不開發(fā)開發(fā)商A開發(fā)不開發(fā)開發(fā)-3000，-30001000，00，10000，0不開發(fā)開發(fā)商B開發(fā)商A開發(fā)不開發(fā)開發(fā)開發(fā)商B需求小的情況需求大的情況博弈的戰(zhàn)略式表述A嚴格劣戰(zhàn)略B嚴格劣戰(zhàn)略

5，14，49，-10，0等待小豬大豬按等待按案例2-智豬博弈等待是小豬的嚴格占優(yōu)戰(zhàn)略大豬有無嚴格占優(yōu)戰(zhàn)略？4大于10大于-1第二章完全信息靜態(tài)信息博弈-納什均衡一博弈的根本概念及戰(zhàn)略表述二占優(yōu)戰(zhàn)略均衡三重復剔除的占優(yōu)均衡四納什均衡五納什均衡應用舉例三重復剔除的占優(yōu)均衡重復剔除嚴格劣戰(zhàn)略：思路：首先找到某個參與人的劣戰(zhàn)略〔假定存在〕，把這個劣戰(zhàn)略剔除掉，重新構造一個不包含已剔除戰(zhàn)略的新的博弈，然后再剔除這個新的博弈中的某個參與人的劣戰(zhàn)略，一直重復這個過程，直到只剩下唯一的戰(zhàn)略組合為止。這個唯一剩下的戰(zhàn)略組合就是這個博弈的均衡解，稱為“重復剔除的占優(yōu)均衡〞。三重復剔除的占優(yōu)均衡注意：

與占優(yōu)戰(zhàn)略均衡中的占優(yōu)戰(zhàn)略和劣戰(zhàn)略不同，這里的占優(yōu)戰(zhàn)略或劣戰(zhàn)略可能只是相對于另一個特定戰(zhàn)略而言。三重復剔除的占優(yōu)均衡

5，14，49，-10，0等待小豬大豬按等待按案例2-智豬博弈按是小豬的嚴格劣戰(zhàn)略-剔除4大于10大于-1“按〞是大豬的占優(yōu)戰(zhàn)略，納什均衡：大豬按，小豬等待三重復剔除的占優(yōu)均衡重復剔除的占優(yōu)均衡戰(zhàn)略組合稱為重復剔除的占優(yōu)均衡，如果它是重復剔除劣戰(zhàn)略后剩下的唯一戰(zhàn)略組合。如果這種唯一戰(zhàn)略組合是存在的，我們就說該博弈是重復剔除占優(yōu)可解。注意：如果重復剔除后的戰(zhàn)略組合不唯一，該博弈就不是重復剔除占優(yōu)可解的。三重復剔除的占優(yōu)均衡1，01，20，30，1M列先生行先生UDL0，12，0R行：沒有占優(yōu)戰(zhàn)略列：M嚴格優(yōu)于R剔除R行：U優(yōu)于D列：無占優(yōu)戰(zhàn)略剔除DM優(yōu)于L〔U，M〕是重復剔除的占優(yōu)均衡三重復剔除的占優(yōu)均衡練習：在以下戰(zhàn)略式表達中，找出重復剔除的占優(yōu)均衡4，35，16，22，18，43，63，09，62，8C2R1R2C1C3R3弱劣的概念定義：弱劣于戰(zhàn)略〔isweaklydominatedby〕，如果對于所有的，，且對于某些，嚴格不等式成立。稱為相對于的弱占優(yōu)戰(zhàn)略。三重復剔除的占優(yōu)均衡三重復剔除的占優(yōu)均衡注意：1、重復剔除的占優(yōu)均衡結果與劣戰(zhàn)略的剔除順序是否有關取決于剔除的是否是嚴格劣戰(zhàn)略?！踩绻看翁蕹氖菄栏窳討?zhàn)略，均衡結果與剔除的順序無關。然而如果剔除的是弱劣戰(zhàn)略，均衡結果可能與剔除順序有關。〕2、重復剔除的占優(yōu)均衡要求每個參與人是理性的，而且要求“理性〞是參與人的共同知識。即：所有參與人知道所有參與人是理性的，所有參與人知道所有參與人知道所有參與是理性的三重復剔除的占優(yōu)均衡2，121，101，120，120，100，110，120，100，13C2R1R2C1C3R3剔除順序：R3、C3、C2、R2，戰(zhàn)略組合〔R1，C1〕故一般使用嚴格劣戰(zhàn)略剔除，可以看到，〔R1，C3〕〔R1，C1〕都是納什均衡，但在這里是不可解的。剔除順序：C2、R2、C1、R3，戰(zhàn)略組合〔R1，C3〕舉例：三重復剔除的占優(yōu)均衡盡管許多博弈中重復剔除的占優(yōu)均衡是一個合理的預測，但并不總是如此，尤其是大概支付某些極端值的時候。8，10-1000，97，66，5參與人B參與人AUDLRU是A的最優(yōu)選擇，但是，只要有1/1000的概率B選R，A就會選D房地產(chǎn)開發(fā)中需求小情況4000，40008000，00，80000，0不開發(fā)開發(fā)商A開發(fā)不開發(fā)開發(fā)-3000，-30001000，00，10000，0不開發(fā)開發(fā)商B開發(fā)商A開發(fā)不開發(fā)開發(fā)開發(fā)商B需求小的情況需求大的情況博弈的戰(zhàn)略式表述斗雞博弈-3，-32，00，20，0退BA進退進獨木橋納什均衡：A進，B退；A退，B進對于相當多的博弈，我們無法運用重復剔除劣戰(zhàn)略的方法找出均衡解。為了找出這些博弈的均衡解，需要引入納什均衡。第二章完全信息靜態(tài)信息博弈-納什均衡一博弈的根本概念及戰(zhàn)略表述二占優(yōu)戰(zhàn)略均衡三重復剔除的占優(yōu)均衡四納什均衡五納什均衡應用舉例四納什均衡假設n個參與人在博弈之前達成一個協(xié)議，規(guī)定每一個參與人選擇一個特定的戰(zhàn)略，另代表這個協(xié)議，在沒有外在強制力的情況下，如果沒有任何人有積極性破壞這個協(xié)議，那么這個協(xié)議是自動實施的。這個協(xié)議就構成了一個納什均衡。四納什均衡通俗地說，納什均衡的含義就是：給定你的策略，我的策略是最好的策略；給定我的策略，你的策略也是你的最好的策略。即雙方在給定的策略下不愿意調(diào)整自己的策略。四納什均衡尋找納什均衡0，44，05，34，00，45，33，53，56，6C2R1R2C1C3R3參與人B參與人A〔R3，C3〕是納什均衡四納什均衡2，121，101，120，120，100，110，120，100，13C2R1R2C1C3R3剔除順序：R3、C3、C2、R2，戰(zhàn)略組合〔R1，C1〕可以看到，〔R1，C3〕〔R1，C1〕都是納什均衡。剔除順序：C2、R2、C1、R3，戰(zhàn)略組合〔R1，C3〕請用上述劃線法尋找以下納什均衡四納什均衡納什均衡與占優(yōu)戰(zhàn)略均衡及重復剔除的占優(yōu)均衡：〔1〕每一個占優(yōu)戰(zhàn)略均衡及重復剔除的占優(yōu)均衡一定是納什均衡，但并非每一個納什均衡都是占優(yōu)戰(zhàn)略均衡或重復剔除的占優(yōu)均衡；〔2〕納什均衡一定是在重復剔除嚴格劣戰(zhàn)略過程中沒有被剔除掉的戰(zhàn)略組合，但沒有被剔除掉的組合不一定是納什均衡，除非它是唯一的〔不適用于嚴格弱劣戰(zhàn)略的情況〕案例-市場進入阻撓40，50-10，00，3000，300斗爭在位者進入者進入不進入默許納什均衡：進入，默許；不進入，斗爭四納什均衡用重復剔除弱劣戰(zhàn)略的方法找均衡第二章完全信息靜態(tài)信息博弈-納什均衡一博弈的根本概念及戰(zhàn)略表述二占優(yōu)戰(zhàn)略均衡三重復剔除的占優(yōu)均衡四納什均衡五納什均衡應用舉例五納什均衡應用舉例諾貝爾經(jīng)濟學獎獲得者薩繆爾森有一句話：你可以將一只鸚鵡訓練成一個經(jīng)濟學家，因為它只需要學習兩個詞：供給和需求。博弈論專家坎多瑞引申說：要成為現(xiàn)代經(jīng)濟學家，這只鸚鵡必須再多學一個詞，就是“納什均衡〞。五納什均衡應用舉例案例1庫諾特〔Cournot〕寡頭競爭模型案例2公共地的悲劇案例3豪泰林價格競爭模型案例4公共物品的私人供給案例1庫諾特〔Cournot〕寡頭競爭模型企業(yè)1企業(yè)2參與人：企業(yè)1、企業(yè)2戰(zhàn)略：選擇產(chǎn)量支付：利潤，利潤是兩個企業(yè)產(chǎn)量的函數(shù)案例1庫諾特〔Cournot〕寡頭競爭模型qi：第i個企業(yè)的產(chǎn)量Ci〔qi〕代表本錢函數(shù)P=P〔q1+q2〕：價格是兩個企業(yè)產(chǎn)量的函數(shù)第i個企業(yè)的利潤函數(shù)為：企業(yè)1企業(yè)2案例1庫諾特〔Cournot〕寡頭競爭模型〔q1*，q2*〕是納什均衡意味著：

找出納什均衡的方法是對每個企業(yè)的利潤函數(shù)求一階導數(shù)，使其為0。案例1庫諾特〔Cournot〕寡頭競爭模型q2q1每個企業(yè)的最優(yōu)產(chǎn)量是另一個企業(yè)的產(chǎn)量的函數(shù)。交叉點即納什均衡點案例1庫諾特〔Cournot〕寡頭競爭模型假定每個企業(yè)有不變的單位本錢：假定需求函數(shù)為：最優(yōu)化的一階條件是：解反響函數(shù)得納什均衡為：納什均衡利潤為：案例1庫諾特〔Cournot〕寡頭競爭模型為什么說庫諾特〔Cournot〕寡頭競爭模型是典型的囚徒困境問題？壟斷企業(yè)的問題：壟斷企業(yè)的最優(yōu)產(chǎn)量：壟斷利潤為：寡頭競爭的總產(chǎn)量大于壟斷產(chǎn)量的原因是：每個企業(yè)在選擇自己的最優(yōu)產(chǎn)量時，只考慮對本企業(yè)利潤的影響，而無視了對另外一個企業(yè)的外部負效應。案例1庫諾特〔Cournot〕寡頭競爭模型在獨立決策、缺乏協(xié)調(diào)機制的兩企業(yè)之間，合作不容易出現(xiàn)，各自生產(chǎn)壟斷產(chǎn)量一半的產(chǎn)量組合不是納什均衡戰(zhàn)略組合。只有到達納什均衡的產(chǎn)量組合時，沒有任何一方有單獨改變自己產(chǎn)量的動力。此類博弈對于市場經(jīng)濟的組織、管理，對于產(chǎn)業(yè)組織和社會經(jīng)濟制度的效率判斷，都具有非常重要的意義。對于市場的管理，政府對市場的監(jiān)管和調(diào)控都是必需的。從囚徒困境中解放出來1971年，美國國會通過了禁止在電視上做煙草廣告的法律。令許多人奇怪的是，財大氣粗的各大煙草公司反響相當平靜，并沒有動用其龐大的社會資源和影響力阻止這個法律的通過。政府管制最終的結果是，盡管煙草廣告因受到限制而減少，可是煙草公司的利潤卻提高了。實際上，政府禁令不僅沒有打擊煙草公司，反而是把陷入白熱化廣告戰(zhàn)的各大煙草集團從“囚徒困境〞中解放了出來。

在20世紀60年代，美國煙草行業(yè)競爭劇烈，為了爭奪市場，各大煙草公司都必須消耗巨額費用大做廣告，這無疑降低了它們的利潤水平。也就是說，如果煙草公司都不做廣告，它們的利潤要更高?？墒?，如果其中一家公司不做廣告，它的市場份額就會被其他公司搶走。這正是一個囚徒困境：某公司放棄做，而其它公司仍然大作廣告搶占市場，放棄做廣告的公司必然利益受損。在這種情況下，做廣告就是每一個廣告公司的優(yōu)勢策略。即使煙草公司能夠達成都不做廣告的協(xié)議，但是這個協(xié)議的約束力太低并不能將煙草行業(yè)從廣告戰(zhàn)的泥潭中解救出來。這個時候國家出臺法令對于煙草行業(yè)來說反而是個好事，煙草公司靠自己做不到的事情，政府做到了。因為國家法律具有強制性的作用，相當于是煙草集團之間簽訂了極具約束力的協(xié)議，同時政府承擔了監(jiān)督煙草公司是否違反協(xié)議的本錢。

案例2公共地的悲劇公共地的悲劇證明：如果一種資源沒有排他性的所有權，就會導致資源的過度使用。公海捕魚小煤窯的過度開展……最初由英國留學生哈定〔GarritHadin〕1968年在《科學》雜志上發(fā)表的文章《TragedyofCommons》(公共策略)中提出案例2公共地的悲劇有n個農(nóng)民的村莊共同擁有一片草地，每個農(nóng)民都有在草地上放牧的自由。每年春天，農(nóng)民要決定自己養(yǎng)多少只羊。gi：第i個農(nóng)民飼養(yǎng)的數(shù)量，i=1,2,…,n.

n個農(nóng)民飼養(yǎng)的總量V:代表每只羊的平均價值,v是G的函數(shù),v=v(G),因為每只羊至少要一定數(shù)量的草才不至于餓死,有一個最大的可存活量Gmax,：

當G<Gmax時,v(G)>0;當G>=Gmax時,v(G)=0。案例2公共地的悲劇當草地上羊很少時，增加一只羊也許不會對其他羊的價值有太大影響，但隨著羊的不斷增加，每只羊的價值將急劇下降。GGmaxv參與人：農(nóng)民戰(zhàn)略：養(yǎng)羊的數(shù)量支付：利潤案例2公共地的悲劇假設一只羊羔的價格為c，對于農(nóng)民i來講，其利潤函數(shù)為：最優(yōu)化的一階條件為：上述一階條件可以解釋為：增加一只羊有正負兩方面的效應，正的效應是這只羊本身的價值v，負的效應是這只羊使所有之前的羊的價值降低。案例2公共地的悲劇其最優(yōu)解滿足邊際收益等于邊際本錢：上述n個一階條件定義了n個反響函數(shù)：因為：所以：案例2公共地的悲劇第i個農(nóng)民的最優(yōu)飼養(yǎng)量隨其他農(nóng)民的飼養(yǎng)量增加而遞減。n個反響函數(shù)的交叉點就是納什均衡。盡管每個農(nóng)民在決定自己增加飼養(yǎng)量時考慮了對現(xiàn)有羊價值的影響，但是他考慮的只是對自己羊的影響，而并不是對所有羊的影響，因此，最優(yōu)點上的個人邊際本錢小于社會邊際本錢，納什均衡總飼養(yǎng)量大于社會最優(yōu)飼養(yǎng)量。案例2公共地的悲劇案例2公共地的悲劇再次說明非合作博弈的結果有可能是低效率的。原因是每個利用公共資源的人都面臨著一種囚徒的困境：在總體上加大利用資源可能時，自己加大利用而他人不加大利用那么自己有利，自己加大利用而他人也加大利用自己不至于吃虧，最終是所有人都加大利用資源直至再加大會減少利益的納什均衡水平。公共地悲劇哈定指出：“在共享公有物的社會中，每個人，也就是所有人都追求各自的最大利益。這就是悲劇的所在。每個人都被鎖定在一個迫使他在有限范圍內(nèi)無節(jié)制地增加牲畜的制度中。消滅是所有人都奔向的目的地。因為在信奉公有物自由的社會當中，每個人均追求自己的最大利益。公有物自由給所有人帶來了消滅。〞公共地悲劇比方市場經(jīng)濟中存在著污染，但政府并沒有管制的環(huán)境，企業(yè)為了追求利潤的最大化，寧愿以犧牲環(huán)境為代價，也絕不會主動增加環(huán)保設備投資。按照看不見的手的原理，所有企業(yè)都會從利己的目的出發(fā)，采取不顧環(huán)境的策略，從而進入“納什均衡〞狀態(tài)。公共地悲劇要解決公共地悲劇，就必須要明晰公共地產(chǎn)權、牧民之間有效溝通形成共同愿景、采取違規(guī)行為之后的及時懲罰、牧民自身道德素質(zhì)的提高、改善?；蛘卟莸钠贩N甚至是牧民也可以換個職業(yè)等都是可行的方法。這些解決方法對我國建設節(jié)約型社會也有很大的啟發(fā)，比方增加資源環(huán)境危機的宣傳和教育以形成群眾心理暗示，對公共自由物中的不可再生資源采用國家管理的形式，嚴格控制使用；對可再生資源采取委托管理的形式，培育社會力量加以保護，國家起到監(jiān)督和引導作用等。案例3豪泰林價格競爭模型在庫諾特模型中，產(chǎn)品是同質(zhì)的〔homogenous〕而在豪泰林價格競爭模型中，我們探討的是產(chǎn)品存在差異性的情況。如果不同企業(yè)生產(chǎn)的產(chǎn)品是有差異的，替代彈性就不會是無限的，此時消費者對不同企業(yè)的產(chǎn)品有著不同的偏好，價格不是他們感興趣的唯一變量。在存在產(chǎn)品差異情況下，均衡價格不會等于邊際本錢。產(chǎn)品的差異有多種。我們現(xiàn)在考慮一種特殊的差異，即空間上的差異〔specialdifferentiation〕，這就是經(jīng)典的豪泰林〔Hotelling,1929〕模型。在豪太林模型中，產(chǎn)品在物質(zhì)性能上是相同的，但在空間位置上有差異。因為不同位置上的消費者要支付不同的運輸本錢，他們關心的價格與運輸本錢之和，而不是單價格。案例3豪泰林價格競爭模型假定有一個長度為一的線性城市，消費者均勻地分布在【0，1】區(qū)間里，分布密度為1。假定有兩個商店，分別位于城市的兩端，商店1在x=0，商店2在x=1，出售物質(zhì)性能相同的產(chǎn)品。每個商店提供單位產(chǎn)品的本錢為c，消費者購置商品的旅行本錢與離商店的距離成比例，單位距離的本錢為t。這樣住在x的消費者如果在商店1采購，要花費tx的旅行本錢；如果在商

人人文庫> 全部分類> 行業(yè)資料 > 管理策劃

溫馨提示

1. 本站所有資源如無特殊說明，都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
2. 本站的文檔不包含任何第三方提供的附件圖紙等，如果需要附件，請聯(lián)系上傳者。文件的所有權益歸上傳用戶所有。
3. 本站RAR壓縮包中若帶圖紙，網(wǎng)頁內(nèi)容里面會有圖紙預覽，若沒有圖紙預覽就沒有圖紙。
4. 未經(jīng)權益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
5. 人人文庫網(wǎng)僅提供信息存儲空間，僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護處理，對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯，并不能對任何下載內(nèi)容負責。
6. 下載文件中如有侵權或不適當內(nèi)容，請與我們聯(lián)系，我們立即糾正。
7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

納什均衡及應用舉例博弈論

文檔簡介

溫馨提示

最新文檔

評論

納什均衡及應用舉例博弈論

文檔簡介

溫馨提示

最新文檔

評論

相關文檔