博弈論1:純策略.ppt_第1頁(yè)
博弈論1:純策略.ppt_第2頁(yè)
博弈論1:純策略.ppt_第3頁(yè)
博弈論1:純策略.ppt_第4頁(yè)
博弈論1:純策略.ppt_第5頁(yè)
已閱讀5頁(yè),還剩24頁(yè)未讀, 繼續(xù)免費(fèi)閱讀

下載本文檔

版權(quán)說(shuō)明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請(qǐng)進(jìn)行舉報(bào)或認(rèn)領(lǐng)

文檔簡(jiǎn)介

1、博弈論和市場(chǎng)競(jìng)爭(zhēng)戰(zhàn)略,1994年諾貝爾經(jīng)濟(jì)學(xué)獎(jiǎng),約翰納西約翰f納什b.1928年,發(fā)展了一個(gè)均衡的概念,為非合作博弈后來(lái)被稱為納什均衡,約翰哈桑尼約翰C海薩尼b。1920年顯示如何不完全信息的博弈可以被分析,1930年第一次完善納什均衡的概念,以分析動(dòng)態(tài)戰(zhàn)略互動(dòng)。因?yàn)樗麄冮_(kāi)創(chuàng)性地分析了非合作博弈理論中的均衡。此后,博弈論被作為理解復(fù)雜經(jīng)濟(jì)問(wèn)題的基礎(chǔ),首先,博弈論的基本理論框架,首先,博弈論的理論意義和特點(diǎn),古典經(jīng)濟(jì)學(xué):根據(jù)資源稀缺性分配資源的科學(xué),價(jià)格是資源稀缺性的信號(hào),從而進(jìn)行經(jīng)濟(jì)行為的成本效益分析。MRMC的利潤(rùn)最大化忽略了其他人的決定對(duì)彼此經(jīng)濟(jì)利益的影響。制度經(jīng)濟(jì)學(xué):科斯:人與人之間交易

2、過(guò)程的成本收益分析。諾斯:分析交易過(guò)程的制度環(huán)境,包括制度約束和制度變遷與交易過(guò)程的關(guān)系,古典經(jīng)濟(jì)學(xué)和制度經(jīng)濟(jì)學(xué)的缺陷,都是邊際成本收益分析理論,但人們選擇的對(duì)象不是最小交易成本。相反,它根據(jù)另一方的行動(dòng)計(jì)劃孤立地分析行動(dòng)者的邊際收益和成本,但不分析其他人的行動(dòng)對(duì)該行動(dòng)者的影響,這僅適用于利益相關(guān)者的收益分析。因此,利益相關(guān)者戰(zhàn)略選擇的理論博弈論出現(xiàn)了,從而形成了博弈論對(duì)經(jīng)濟(jì)學(xué)的貢獻(xiàn):簡(jiǎn)言之:價(jià)格只提供了社會(huì)資源稀缺的機(jī)制,而經(jīng)濟(jì)決策也需要知道人們各種可能的經(jīng)濟(jì)行為的信息。博弈論研究利益相關(guān)者戰(zhàn)略選擇的互動(dòng)利益函數(shù),研究人們的行為及其形成的系統(tǒng)。從博弈論的角度來(lái)看,整個(gè)社會(huì)生活是人們的戰(zhàn)略選擇

3、和相互作用的過(guò)程,即博弈過(guò)程。現(xiàn)實(shí)生活中的游戲,如市場(chǎng)競(jìng)爭(zhēng)、高考志愿、股票買賣、家庭生活等。無(wú)所不包。2/博弈論的基本要素,博弈論:博弈規(guī)則下各方理性行為的理論。三個(gè)基本要素:1 .參與者(選擇器)。用1、2表示;2.選擇對(duì)象和范圍:政策空間、政策組合:各方可能采取的政策是選擇的對(duì)象。所選對(duì)象的整體構(gòu)成其策略空間。與S1、S2、S3;在所有各方都采取了某種戰(zhàn)略之后,它們就構(gòu)成了一個(gè)戰(zhàn)略輪廓;3.利益函數(shù):第I個(gè)參與者的利益函數(shù)ui是他在某個(gè)策略組合中獲得的利益-利益矩陣(也稱為“支付矩陣”):該矩陣由所有策略組合中各方獲得的利益組成,參與者、策略空間和利益函數(shù)構(gòu)成了博弈信息。根據(jù)這個(gè)標(biāo)準(zhǔn),它分

4、為:1 .完整的信息游戲:每個(gè)參與者了解以上三種信息,并據(jù)此選擇自己的游戲策略;2.不完全信息博弈:不完全理解上述三種信息的參與者的博弈行為分為:靜態(tài)博弈:各方同時(shí)選擇策略,它們之間沒(méi)有因果關(guān)系;動(dòng)態(tài)博弈:每一方根據(jù)他人選擇的策略來(lái)決定自己的策略。,游戲基本類型,完全信息靜態(tài)游戲各方選擇策略不完全信息靜態(tài)游戲(填寫高考志愿)完全信息動(dòng)態(tài)游戲(下棋,圍棋)游戲各方在充分了解游戲過(guò)程的三大要素的情況下完成知識(shí)游戲過(guò)程,然后使策略選擇不完全信息動(dòng)態(tài)游戲(國(guó)際市場(chǎng)競(jìng)爭(zhēng))一個(gè)接一個(gè),從而形成四種游戲類型:矩陣的每個(gè)位置顯示每個(gè)參與者的每個(gè)策略組合,而這個(gè)位置就是一個(gè)游戲模式。每個(gè)參與者的利益函數(shù)列在每個(gè)

5、游戲模式上,因此獲得了回報(bào)矩陣,例如,企業(yè)2價(jià)格不變地增加,利益函數(shù)和回報(bào)矩陣(收入矩陣,也翻譯為“支付矩陣”),2。納什均衡,納什:是一個(gè)數(shù)學(xué)天才,諾貝爾經(jīng)濟(jì)學(xué)獎(jiǎng)得主,美國(guó)美麗心靈大師。納什均衡:在完全信息的靜態(tài)博弈中,各方都實(shí)現(xiàn)了利益最大化的戰(zhàn)略組合狀態(tài)。純策略:假設(shè)每個(gè)參與者一次只選擇一個(gè)策略來(lái)玩游戲?;旌喜呗裕好總€(gè)參與者根據(jù)不同的賠率選擇不同的策略來(lái)玩游戲,如監(jiān)督游戲。2.博弈案例1:主導(dǎo)戰(zhàn)略和被主導(dǎo)戰(zhàn)略在教科書(shū)中被翻譯為“主導(dǎo)戰(zhàn)略”和“被主導(dǎo)戰(zhàn)略”,以及主導(dǎo)戰(zhàn)略下的1/納什均衡,無(wú)論對(duì)方采取什么戰(zhàn)略,某個(gè)戰(zhàn)略是最優(yōu)戰(zhàn)略,那么這個(gè)戰(zhàn)略就是主導(dǎo)戰(zhàn)略。例如,公司2應(yīng)該選擇“價(jià)格不變”,公司

6、1應(yīng)該將其價(jià)格提高3025。公司2應(yīng)該選擇“價(jià)格不變”。結(jié)論:“價(jià)格不變”是企業(yè)2的主導(dǎo)戰(zhàn)略,在決策時(shí)必須以此為前提。雙方主導(dǎo)策略下的納什均衡:囚徒困境,博弈各方都有一份。例如,甲、乙雙方的兩個(gè)共犯(搶劫和過(guò)失殺人)都有自己的策略空間(坦白和否認(rèn)),他們的利益函數(shù)是基于表中的判刑年限:而甲方的主導(dǎo)策略是:乙坦白,因?yàn)?10-15,所以坦白是利益最大的策略。b否認(rèn),因?yàn)?-2,坦白也是最大的好處。因此,坦白是主導(dǎo)策略。乙方的主導(dǎo)策略也很坦率。兩者的結(jié)合形成了納什均衡。挑戰(zhàn)亞當(dāng)斯密的“看不見(jiàn)的手”,亞當(dāng)斯密:個(gè)人私利的合理性將自動(dòng)被“看不見(jiàn)的手”帶入促進(jìn)社會(huì)集體福利的軌道,納什說(shuō):不!如果相互作用

7、的集體的各個(gè)部分不合作,只追求自身利益的最大化,那么整個(gè)集體將陷入最不利的納什均衡。必須使用某種權(quán)力來(lái)約束個(gè)人的自利行為,每個(gè)人都可以做出適當(dāng)?shù)臓奚詫?shí)現(xiàn)集體利益的最大化。亞當(dāng)斯密的“看不見(jiàn)的手”實(shí)際上是通過(guò)控制資源總量對(duì)人們行為的一種經(jīng)濟(jì)約束。一旦這種約束失效,當(dāng)有其他約束來(lái)補(bǔ)充它(道德和權(quán)力)時(shí),囚徒困境的實(shí)際結(jié)果與亞當(dāng)斯密的“看不見(jiàn)的手”相矛盾。市場(chǎng)經(jīng)濟(jì)充滿了集體理性和個(gè)人理性的沖突:污染問(wèn)題價(jià)格戰(zhàn)問(wèn)題(寡頭壟斷模型):價(jià)格卡特爾困境;超市布局問(wèn)題:為什么超市聚集在一起?資源的分配是不經(jīng)濟(jì)的。為什么有些人看到正義卻沒(méi)有勇氣?為什么誠(chéng)實(shí)的納稅人會(huì)受苦?因?yàn)槊總€(gè)人都是不誠(chéng)實(shí)的,克服納什悖論的

8、基本途徑是:制度約束、道德約束:使人們?cè)谳浾摵蜕鐣?huì)道德的壓力下被約束在集體理性行為的規(guī)則之下(如朋友的忠誠(chéng)等)。);使人們的行為服從集體理性的要求,懲罰違反者。例如,通過(guò)社會(huì)信用機(jī)制懲罰不誠(chéng)實(shí)的納稅人、建立休漁期和抑制傾銷價(jià)格相結(jié)合將會(huì)帶來(lái)良好的效果。世界上有兩種符合集體利益的正義:實(shí)體正義和規(guī)則正義。實(shí)質(zhì)正義必須通過(guò)常規(guī)正義來(lái)實(shí)現(xiàn),否則就會(huì)被證偽。因此,統(tǒng)治正義是最重要的。分蛋糕或粥的故事:一個(gè)20人的小組每天吃粥。如果每個(gè)人都吃,這就導(dǎo)致了納什悖論:每個(gè)人都提前來(lái)等粥,粥的價(jià)格非常高,對(duì)每個(gè)人都不利。如何制定規(guī)則使粥變得最公平?2/重復(fù)博弈下的策略:為了捍衛(wèi)看不見(jiàn)的手,上述納什均衡是一次性

9、博弈,參與者只從當(dāng)時(shí)的利益最大化出發(fā),這就導(dǎo)致了悖論。如果是一個(gè)重復(fù)的游戲,參與者不僅要考慮眼前的利益,還要考慮他們的行為所造成的未來(lái)后果,即對(duì)方的反應(yīng)。羅伯特阿克塞爾羅德(Robert Axelrod)利用許多博弈論專家與電腦玩游戲,表明針?shù)h相對(duì)是正確的策略。功能:簡(jiǎn)單易行;讓演員不敢先作弊;除非它希望合同破裂;欺騙會(huì)受到懲罰;誠(chéng)實(shí)是有回報(bào)的。3/支配策略下的納什均衡。重復(fù)優(yōu)化方法。聰明的豬博弈,無(wú)論對(duì)方采取什么樣的策略,收益函數(shù)最小的策略被稱為被支配策略,所以這是一種必須淘汰的策略,即“取其精華,去其糟粕”的方法:決策的每一步都必須淘汰自身和對(duì)方的劣勢(shì)策略,從而做出戰(zhàn)略選擇。例如,雙方之間

10、有一種“主從關(guān)系”:智能豬游戲,智能豬游戲:標(biāo)題:大豬和小豬必須先踩住豬圈一端的杠桿,然后才能放出8公斤的食物,在豬圈的另一端進(jìn)食。踩在橫桿上需要1公斤。如果豬踩在上面,大豬跑到另一端后已經(jīng)吃掉了8磅;如果大豬踩在上面,小豬已經(jīng)吃了3公斤,大豬可以吃5公斤。問(wèn)問(wèn)納什均衡點(diǎn)。智慧豬游戲的一個(gè)社會(huì)例子:當(dāng)工資被拖欠時(shí),誰(shuí)主動(dòng)討回工資,誰(shuí)享受福利?有必要舉行一次集體活動(dòng),讓每個(gè)人受益,但要付出代價(jià)。誰(shuí)將“擴(kuò)展”這項(xiàng)事業(yè)?在市場(chǎng)競(jìng)爭(zhēng)中,哪個(gè)企業(yè)最關(guān)心整個(gè)行業(yè)的利益?在國(guó)際聯(lián)盟中,哪些國(guó)家將積極維護(hù)聯(lián)盟的集體利益?智慧豬游戲就是這種游戲的典型例子。智慧豬博弈的現(xiàn)實(shí)意義在于,如果一個(gè)聯(lián)盟由對(duì)稱的成員組成,

11、它最有可能形成一個(gè)囚徒困境,個(gè)體理性導(dǎo)致集體非理性,這不是一個(gè)值得信賴的聯(lián)盟。聯(lián)盟的行為應(yīng)該遵循集體理性,應(yīng)該由非對(duì)稱成員組成。其主要成員的個(gè)體理性與聯(lián)盟的集體理性是一致的,他們作為“父母”負(fù)有責(zé)任。例子:沙特阿拉伯和歐佩克。如果沙特阿拉伯違反集體協(xié)議,整個(gè)歐佩克將分崩離析。討論:防止全行業(yè)虧損惡性競(jìng)爭(zhēng)的根本途徑是什么?建立“主從”寡頭壟斷的產(chǎn)業(yè)結(jié)構(gòu)(但要防止完全壟斷)。能夠防止企業(yè)間惡性價(jià)格戰(zhàn)的股票市場(chǎng):對(duì)所有散戶投資者更好,還是對(duì)銀行家-散戶投資者結(jié)構(gòu)更好?在不允許虛假信息的前提下,后者更好。因?yàn)榇髴糇铌P(guān)心企業(yè)的實(shí)際運(yùn)作。為什么聯(lián)合國(guó)安理會(huì)應(yīng)該有常任理事國(guó)?中國(guó)產(chǎn)業(yè)結(jié)構(gòu)中最大的問(wèn)題是什么?小而分散,不對(duì)整個(gè)行業(yè)和社會(huì)負(fù)責(zé)。4/兩個(gè)納什均衡博弈:小雞博弈,標(biāo)題:兩個(gè)人相對(duì)過(guò)橋。它們兩個(gè)都

溫馨提示

  • 1. 本站所有資源如無(wú)特殊說(shuō)明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請(qǐng)下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請(qǐng)聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁(yè)內(nèi)容里面會(huì)有圖紙預(yù)覽,若沒(méi)有圖紙預(yù)覽就沒(méi)有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫(kù)網(wǎng)僅提供信息存儲(chǔ)空間,僅對(duì)用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對(duì)用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對(duì)任何下載內(nèi)容負(fù)責(zé)。
  • 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請(qǐng)與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶因使用這些下載資源對(duì)自己和他人造成任何形式的傷害或損失。

評(píng)論

0/150

提交評(píng)論