博弈論復(fù)習(xí)分析和總結(jié)_第1頁(yè)
博弈論復(fù)習(xí)分析和總結(jié)_第2頁(yè)
博弈論復(fù)習(xí)分析和總結(jié)_第3頁(yè)
博弈論復(fù)習(xí)分析和總結(jié)_第4頁(yè)
博弈論復(fù)習(xí)分析和總結(jié)_第5頁(yè)
已閱讀5頁(yè),還剩6頁(yè)未讀, 繼續(xù)免費(fèi)閱讀

下載本文檔

版權(quán)說(shuō)明:本文檔由用戶(hù)提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請(qǐng)進(jìn)行舉報(bào)或認(rèn)領(lǐng)

文檔簡(jiǎn)介

第2章 擴(kuò)展式博弈與標(biāo)準(zhǔn)式博弈標(biāo)準(zhǔn)式:博弈過(guò)程以數(shù)字矩陣表示,矩陣兩側(cè)為參與者的不同的戰(zhàn)略選擇擴(kuò)展式:博弈過(guò)程以樹(shù)形圖表示,樹(shù)形圖的每一樹(shù)枝節(jié)代表了一種戰(zhàn)略選擇不確定事件:可能發(fā)生也可能不發(fā)生的事件相機(jī)戰(zhàn)略:僅在不確定事件發(fā)生時(shí)才會(huì)采取的戰(zhàn)略。在擴(kuò)展式博弈中,只要博弈的一方在不知情的情況下決策,或者同時(shí)決策,我們就將其所有的選擇都列在從一個(gè)節(jié)點(diǎn)出發(fā)的分支中,以此表示信息的不充分(標(biāo)準(zhǔn)式:博弈過(guò)程以數(shù)字矩陣表示,矩陣兩側(cè)為參與者的不同的戰(zhàn)略選擇,往往用于表達(dá)靜態(tài)博弈擴(kuò)展式:博弈過(guò)程以樹(shù)形圖表示,樹(shù)形圖的每一樹(shù)枝節(jié)代喪了一種戰(zhàn)略選擇,往往用廣表達(dá)動(dòng)態(tài)博弈任何一個(gè)博介都可以表小成為標(biāo)準(zhǔn)式,也可以表小為擴(kuò)展式)第3章占優(yōu)戰(zhàn)略與社會(huì)兩難占優(yōu)戰(zhàn)略:無(wú)論其他參與人選擇什么戰(zhàn)略,參與人的某一種戰(zhàn)略均是最優(yōu)的。占優(yōu)戰(zhàn)略均衡:如果博弈中的每位參與者都有占優(yōu)戰(zhàn)略,并且也實(shí)施其占優(yōu)戰(zhàn)略,我們就可以獲得一個(gè)占優(yōu)戰(zhàn)略均衡。合作解:不管是通過(guò)協(xié)議還是其他形式的強(qiáng)制手段,只要博弈中的參與者能夠保證自己履行協(xié)調(diào)后的戰(zhàn)略,那么他們選擇的戰(zhàn)略及其收益就被稱(chēng)作合作解非合作解:占優(yōu)戰(zhàn)略均衡是一種非合作解,也就是說(shuō)每位參與者都獨(dú)立行動(dòng),而不是一起協(xié)商其戰(zhàn)略。在非合作解中,每位參與者都會(huì)根據(jù)對(duì)方的戰(zhàn)略選擇自己的最優(yōu)戰(zhàn)略假定所有人都這樣做那么每一位參方的戰(zhàn)略選擇自己的最優(yōu)戰(zhàn)略,假定所有人都這樣做,那么每位參與者所選的戰(zhàn)略就都是針對(duì)他人最優(yōu)戰(zhàn)略的最優(yōu)反應(yīng)式參與者在行動(dòng)選擇時(shí)無(wú)法達(dá)成約束性的協(xié)議的解集。)社會(huì)兩難:社會(huì)兩難是一種存在占優(yōu)戰(zhàn)略均衡的博弈,并且參與者采用這種均衡的戰(zhàn)略收益比采用非均衡戰(zhàn)略的收益要差。(當(dāng)一個(gè)博弈存在占優(yōu)戰(zhàn)略時(shí),人們就會(huì)理所當(dāng)然地選擇該戰(zhàn)略而不是另一個(gè)。囚徒困境與垃圾處理博弈非常相似這些博弈都屬于社會(huì)兩難理博弈非常相似,這些博弈都屬于社會(huì)兩難。)第4章納什均衡納什均衡:給定你的策略,我的策略是最好的策略;給定我的策略,你的策略也是最好的策略,即雙方在給定的戰(zhàn)略上不愿意改變自己的策略。13、博弈有哪些分類(lèi)方法,有哪些主要的類(lèi)型?首先,可根據(jù)博弈方的行為邏輯,是否允許存在有約束力協(xié)議,分為非合作博弈和合作博弈兩大類(lèi)。其次,可以根據(jù)博弈方的理性層次,分為完全理性博弈和有限理性博弈兩大類(lèi),有限理性博弈就是進(jìn)化博弈。第三是可以根據(jù)博弈過(guò)程分為靜態(tài)博弈、動(dòng)態(tài)博弈和重復(fù)博弈三大類(lèi)。第四是根據(jù)博弈問(wèn)題的信息結(jié)構(gòu),根據(jù)博弈方是否都有關(guān)于得益和博弈過(guò)程的充分信息,分為完全信息靜態(tài)博弈、不完全信息靜態(tài)博弈、完全且完美信息動(dòng)態(tài)博弈、完全但不完美信自、動(dòng)態(tài)博弈和不完全信息動(dòng)態(tài)博弈幾類(lèi)。第五是根據(jù)得益的特征分為零和博弈、常和博弈和變和博弈。第六是根據(jù)博弈中博弈方的數(shù)量,可將博弈分為單人博弈、兩人博弈和多人博弈。第七是根據(jù)博弈方策略的數(shù)量,分為有限博弈和無(wú)限博弈兩類(lèi)。14、純策略納什均衡與混合策略納什均衡的計(jì)算純策略納什均衡:劃線(xiàn)法、箭頭法混合策略納什均衡:自己的策略選擇不能被另一方預(yù)知或猜到,即在決策時(shí)利用隨機(jī)性。選擇每種策略的概率一定要恰好使對(duì)方無(wú)機(jī)可乘,即讓對(duì)方無(wú)法通過(guò)有針對(duì)性的傾向某一策略而占上風(fēng)。三、分析題:案例分析一一囚徒困境案例:警察把甲乙分開(kāi)關(guān)押,并在提審時(shí)分別告之,如果你坦白而他不坦白,那么你將只判0年,他將被判8年;如果你不坦白而他坦白,那么你判8年,他判。年;如果你們兩人都坦白了,各判5年;如果你們兩人都不坦白了,各判1年。分析:每個(gè)博弈方選擇自己的策略時(shí),雖然無(wú)法知道另一方的實(shí)際選擇,但他卻不能忽視另一方的選擇對(duì)他自己的得益的影響,因此他應(yīng)該考慮到另一方有兩種可能的選擇,并分別考慮自己相應(yīng)的最佳策略。對(duì)囚徒A來(lái)說(shuō),囚徒B有坦白和不坦白兩種可能的選擇,假設(shè)囚徒B的選擇是不坦白,則對(duì)囚徒A來(lái)說(shuō),不坦白得益為坦白得益為0,他應(yīng)該選擇坦白;假設(shè)囚徒B選擇的是坦白,則囚徒A不坦白得益為-8,坦白得益為-5,他還是該選擇坦白。因此,在此博弈中,無(wú)論囚徒B采取何種策略囚徒A的選擇只有一種,即坦白,因?yàn)樵诹硪环絻煞N可能的情況下,坦白給自己帶來(lái)的得益都是較大的。同樣的道理,囚徒B的唯一的選擇也是坦白。所以最可能的結(jié)局:該博弈的最終結(jié)果是兩博弈方同選擇坦白策略。其支付矩陣如下:市E甲S6崛2乙5,50,88,01,12、“囚徒的困境”的內(nèi)在根源是什么?舉出現(xiàn)實(shí)中囚徒的困境的具體例子?!扒敉降睦Ь场钡膬?nèi)在根源是在個(gè)體之間存在行為和利益相互制約的博弈結(jié)構(gòu)中,以個(gè)體理性和個(gè)體選擇為基礎(chǔ)的分散決策方式,無(wú)法有效地協(xié)調(diào)各方面的利益,并實(shí)現(xiàn)整體、個(gè)體利益共同的最優(yōu)。簡(jiǎn)單地說(shuō),“囚徒的困境”問(wèn)題都是個(gè)體理性與集體理性的矛盾引起的?,F(xiàn)實(shí)中“囚徒的困境”類(lèi)型的問(wèn)題是很多的。例如廠(chǎng)商之間的價(jià)格戰(zhàn)、惡性的廣告競(jìng)爭(zhēng),初等、中等教育中的應(yīng)試教育等,其實(shí)都是“囚徒的困境”博弈的表現(xiàn)形式。3、古諾的寡頭模型中個(gè)體收益最大化和集體收益最大化的差異及現(xiàn)實(shí)意義。與個(gè)體收益最大化相比,追求集體收益最大化時(shí)總產(chǎn)量較小,而總利潤(rùn)較高。從兩廠(chǎng)商總體來(lái)看,根據(jù)集體利潤(rùn)最大化確定產(chǎn)量效率更高,兩廠(chǎng)商考慮合作,聯(lián)合起來(lái)決定產(chǎn)量,定出使集體利益最大的產(chǎn)量后各自生產(chǎn)一半,比只考慮個(gè)體收益的獨(dú)立決策行為得到的利益要高。在獨(dú)立決策、缺乏協(xié)調(diào)機(jī)制的兩個(gè)企業(yè)間,考慮集體收益最大化的合作并不容易實(shí)現(xiàn),即使實(shí)現(xiàn)了也是不穩(wěn)定的。主要原因是各自生產(chǎn)一半實(shí)現(xiàn)最大總利潤(rùn)總產(chǎn)量的產(chǎn)量組合不是納什均衡策略組合。納什均衡戰(zhàn)略:如果有兩個(gè)戰(zhàn)略(或者更一般的,有多個(gè)戰(zhàn)略,每個(gè)戰(zhàn)略都對(duì)應(yīng)著一個(gè)參與者),并且每個(gè)戰(zhàn)略都是另一個(gè)戰(zhàn)略(或者其他參與者的戰(zhàn)略)的最優(yōu)反應(yīng),我們就稱(chēng)這一戰(zhàn)略組合為納什均衡戰(zhàn)略。協(xié)調(diào)博弈:只有協(xié)調(diào)彼此的戰(zhàn)略選擇,兩個(gè)參與者才能得到最優(yōu)的的收益。謝林點(diǎn):人們把這種以線(xiàn)索為基礎(chǔ)選擇的均衡稱(chēng)為謝林點(diǎn)或焦點(diǎn)。納什均衡是求解博弈問(wèn)題的一個(gè)普遍適用的方法,但是也有缺點(diǎn)。1.有些博弈的納什均衡并不唯一。部分博弈存在兩個(gè)或更多的納什均衡。在這種情況下,博弈的參與者將很難確定哪個(gè)均衡會(huì)發(fā)生,這取決于他們能夠得到的信息。如果有信號(hào)或者線(xiàn)索使他們認(rèn)為,其中的一個(gè)均衡比其他均衡更可能發(fā)生,那么這個(gè)可能發(fā)生的均衡就是謝林點(diǎn)。但并非所有存在多個(gè)納什均衡的博弈都具有謝林點(diǎn)。2,并不是所有博弈(包含有限個(gè)戰(zhàn)略)都存在納什均衡。目前我們僅研究帶有2個(gè)、3個(gè)、4個(gè)戰(zhàn)略的有限博弈,戰(zhàn)略數(shù)量超過(guò)這個(gè)范圍的其他博弈可能不存在納什均衡。第一個(gè)均衡雙方的收益都高于第二個(gè)均衡。事實(shí)上,第一個(gè)均衡的收益優(yōu)于任何其他的戰(zhàn)略組合。所以(推,推)均衡是收益占優(yōu)均衡。收益最大這個(gè)特征似乎能使(推,推)均衡成為博弈的謝林點(diǎn),因?yàn)槊恳环蕉紩?huì)認(rèn)為對(duì)方將選擇推,自己為了獲取更大收益,自然會(huì)選擇推?,F(xiàn)實(shí)中卻不一定如此。若吉姆和卡爾互相了解且互不信任,那么該博弈另外一種可能就是雙發(fā)為了避免的收益而都選擇(不推,不推)。這個(gè)均衡規(guī)避了最大損失,成為風(fēng)險(xiǎn)占優(yōu)納什均衡。此時(shí),(不推,不推)成為謝林點(diǎn)。推與不推博弈是個(gè)協(xié)調(diào)博弈(還有前面講到的產(chǎn)業(yè)標(biāo)準(zhǔn)博弈),只有協(xié)調(diào)彼此的戰(zhàn)略選擇,兩個(gè)參與者才能獲得最優(yōu)收益,但協(xié)調(diào)戰(zhàn)略在現(xiàn)實(shí)中操作比較困難。納什均衡的缺陷:有些博弈的納什均衡并不唯一,如果一個(gè)均衡比其他均衡更可能發(fā)生,這個(gè)均衡就是謝林點(diǎn);不是所有博弈都存在納什均衡第5章博弈論中的經(jīng)典例子最大最小戰(zhàn)略:最大最小戰(zhàn)略是其最小收益中數(shù)值最大的收益所對(duì)應(yīng)的戰(zhàn)略。零和博弈:是指在博弈中,一方的得益就是另一方的損失,所有博弈方的得益總和為零常數(shù)和博弈:是指博弈雙方的得益總和為非零的常數(shù)非常數(shù)和博弈:是指在不同的策略組合或者結(jié)果下,所有博弈方的得益總和一般是不相同的??偸找嫒Q于參與者所選擇的戰(zhàn)略。心零和博弈的缺陷:他與日常工作中所遇到的復(fù)雜情況存在一定的差距,也告誡我們不要才巴問(wèn)題過(guò)于簡(jiǎn)單化。前面學(xué)習(xí)的尼姆游戲、西班牙叛亂等屬于零和博弈;囚徒困境、廣告博弈、選址博弈、電臺(tái)節(jié)目選擇等均為非常數(shù)和博弈選擇等均為非常數(shù)和博弈。第6章三人博弈聯(lián)盟博弈:拆臺(tái)者:是指自己不可能獲勝卻可以阻止其他人獲勝的參與者。公共物品:一項(xiàng)公共物品是指帶有某種特性的某一商品或服務(wù)(事實(shí)上通常都是服務(wù)),政府提供此類(lèi)服務(wù)要優(yōu)于私人。公共物品有以下兩個(gè)重要特征:1.每個(gè)人都可以從該物品中收益。特別是沒(méi)有,沒(méi)有付費(fèi)的人也可以與付費(fèi)的人同等享有該物品。22成本由提供服務(wù)的水品決定,而不取決于接受服務(wù)的消費(fèi)者的數(shù)量。第7章概率與博弈論概率:概率是衡量可能性的一種數(shù)字量度,取值范圍為[0,1]。極限頻率:無(wú)限擴(kuò)大試驗(yàn)次數(shù)所觀(guān)察到的事件發(fā)生頻率的近似值。期望值:所有可能收益的加權(quán)平均之和,權(quán)重為各可能收益的對(duì)應(yīng)頻率。風(fēng)險(xiǎn)厭惡:第8章混合戰(zhàn)略納什均衡純戰(zhàn)略:標(biāo)準(zhǔn)式博弈中列出的每一個(gè)戰(zhàn)略,出現(xiàn)的頻率為1(即使固定的)?;旌蠎?zhàn)略:根據(jù)給定的概率,在若干純戰(zhàn)略中進(jìn)行隨即選擇,將這些純戰(zhàn)略按概率混合起來(lái)。(如果在每個(gè)給定信息下只以某種概率選擇不同策略,稱(chēng)為混合策略。)隨機(jī)選擇戰(zhàn)略:混合戰(zhàn)略均衡:第9章非合作均衡的深入討論劣戰(zhàn)略:無(wú)論對(duì)手選擇哪個(gè)戰(zhàn)略,博弈中的一方選擇一個(gè)戰(zhàn)略的收益總是高于第二個(gè),那么第二個(gè)戰(zhàn)略就被第一個(gè)戰(zhàn)略所占優(yōu),稱(chēng)為劣戰(zhàn)略。強(qiáng)劣戰(zhàn)略:A戰(zhàn)略的收益嚴(yán)格大于B戰(zhàn)略,我們就稱(chēng)B戰(zhàn)略是強(qiáng)劣戰(zhàn)略0弱劣戰(zhàn)略:A戰(zhàn)略的收益和B戰(zhàn)略的收益一樣大,或者偶爾大于第二個(gè)戰(zhàn)略,那么B戰(zhàn)略就是相對(duì)于A(yíng)戰(zhàn)略的弱劣戰(zhàn)略若重復(fù)剔除過(guò)程一直可持續(xù)到只剩下唯一的戰(zhàn)略組合,則該戰(zhàn)略組合即為重復(fù)剔除的占優(yōu)均衡,此時(shí)該博弈是重復(fù)剔除戰(zhàn)略可解。要點(diǎn):再重復(fù)剔除過(guò)程中,如果每次剔除的是嚴(yán)格劣戰(zhàn)略,均衡結(jié)果與剔除順序無(wú)關(guān);如果剔除的是弱劣戰(zhàn)略,均衡結(jié)果可能與剔除順序有關(guān)。劣戰(zhàn)略的反復(fù)剔除:反復(fù)剔除劣戰(zhàn)略應(yīng)該是指剔除強(qiáng)劣戰(zhàn)略,這種剔除可以重復(fù)進(jìn)行直到不存在劣戰(zhàn)略。只有通過(guò)劣戰(zhàn)略反復(fù)剔除法剔除的戰(zhàn)略都為強(qiáng)劣戰(zhàn)略,那么所得到的博弈與原始博弈才除的戰(zhàn)略都為強(qiáng)劣戰(zhàn)略,那么所得到的博弈與原始博弈才有相同的納什均衡相關(guān)均衡:聯(lián)盟在非合作博弈中有著重要的作用,但是前提是所有聯(lián)盟成員都選擇他們的最佳反應(yīng)戰(zhàn)略。聯(lián)盟可能會(huì)形成一個(gè)集體的混合戰(zhàn)略。這是一個(gè)相關(guān)均衡,它要求聯(lián)盟的成員確定某種定的概率,隨機(jī)、集體地選擇戰(zhàn)略的方法,,,,對(duì)于非合作博弈,精煉后的納什均衡包括兩種:一種是強(qiáng)納什均衡,即偏離某一納什均衡時(shí),沒(méi)有一個(gè)聯(lián)盟能夠獲益,該納什均衡就是強(qiáng)納什均衡,另一種是“防聯(lián)盟”的均衡,判斷均衡是否是“防聯(lián)盟”的,需要回答兩個(gè)問(wèn)題:第一,是否有聯(lián)盟可以選擇其他的納什均衡并獲得更好的效益?第二,聯(lián)盟是否穩(wěn)定,即在其內(nèi)部是否存在更小的聯(lián)盟可以通過(guò)轉(zhuǎn)向另一個(gè)納什均衡而獲益?如果沒(méi)有更小的聯(lián)盟(即單人聯(lián)盟)能夠從改變戰(zhàn)略中獲益,貝I」兩人聯(lián)盟就是穩(wěn)定的。第11章多人博弈多人博弈:代表性經(jīng)濟(jì)人:在排隊(duì)博弈里,所有的參與者都被假設(shè)成一致的,即每個(gè)參與者都可以作為代表性經(jīng)紀(jì)人,他們都有著同樣的戰(zhàn)略集,并且存在對(duì)稱(chēng)收益并且存在對(duì)稱(chēng)收益。狀態(tài)變量:排隊(duì)博弈中,一個(gè)乘客所需要知道的只是隊(duì)列的長(zhǎng)度,不需要理解其他乘客的選擇。狀態(tài)變量是一個(gè)單變量,或者說(shuō)是某些變量中的一個(gè)。如果將狀態(tài)變量匯總,就可以描述博弈的整個(gè)狀態(tài)。狀態(tài)變量是代表性經(jīng)紀(jì)人做出最佳反應(yīng)戰(zhàn)略時(shí)所需要知道的全部信息。比例博弈:一、當(dāng)拍賣(mài)商宣布一個(gè)價(jià)格時(shí),理性的賣(mài)方和理性買(mǎi)方的最好反應(yīng)?答案:賣(mài)方的最好反應(yīng)是提供其供給函數(shù)里的數(shù)量。買(mǎi)方的最好反應(yīng)是提供其需求函數(shù)里的數(shù)量。二、假設(shè)不用試算規(guī)則,只要需求量等于或大于供給量,賣(mài)方就賣(mài)出貨物。這時(shí)當(dāng)拍賣(mài)商宣布一個(gè)價(jià)格賣(mài)方還是做出同樣的反應(yīng)嗎?這時(shí),當(dāng)拍賣(mài)商宣布個(gè)價(jià)格,賣(mài)方還是做出同樣的反應(yīng)嗎?分析:當(dāng)價(jià)格等于或低于平衡點(diǎn)時(shí),賣(mài)方供應(yīng)的貨物被賣(mài)出。但是當(dāng)需求大于供給量的價(jià)格比供需平衡的價(jià)格低。結(jié)果賣(mài)方會(huì)失去賣(mài)出高價(jià)的機(jī)會(huì)。因此提供供給曲線(xiàn)上的數(shù)量可能不是最佳的選擇因此,提供供給曲線(xiàn)上的數(shù)量可能不是最佳的選擇。.假設(shè)的好處:以簡(jiǎn)化研究為目的的假設(shè),是幫助我們思考問(wèn)題的有力工具。例如供需理論和凱恩斯理論可以按照含有代表經(jīng)濟(jì)人和狀態(tài)變量的納什均衡加以理解。.假設(shè)的壞處:1)有些情況下,決策者不能依靠市場(chǎng)價(jià)格之類(lèi)的狀態(tài)變量2)在某些情況下,競(jìng)爭(zhēng)者數(shù)量較少時(shí),決策者必須考慮到競(jìng)爭(zhēng)對(duì)手對(duì)自己決策的具體反應(yīng)競(jìng)爭(zhēng)對(duì)手對(duì)自己決策的具體反應(yīng)?,F(xiàn)實(shí)問(wèn)題往往涉及多個(gè)參與者,參與者的戰(zhàn)略組合數(shù)目很大,之間的關(guān)系會(huì)很復(fù)雜,需要進(jìn)行一些假設(shè)才可以使得研究變得可行描繪博弈狀態(tài)的變量稱(chēng)為狀態(tài)變量代表性經(jīng)紀(jì)人根據(jù)狀態(tài)變量就可以選擇出最佳反應(yīng)戰(zhàn)略對(duì)于相同的戰(zhàn)略和相同的狀態(tài)變量值,代表性經(jīng)紀(jì)人有著相同的收益,他們都有著同樣的戰(zhàn)略集,并且存在對(duì)稱(chēng)收益。第12章合作博弈的要素合作博弈:人們行為相互作用時(shí),當(dāng)事人能達(dá)成一個(gè)具有約束力的協(xié)議,也就是合作博弈合作博弈解:參與者可以協(xié)調(diào)相互之間的戰(zhàn)略選擇,合作博弈得到的解為合作博弈解聯(lián)盟:在博弈論中,把協(xié)調(diào)相互戰(zhàn)略的參與者們叫做聯(lián)盟。旁支付:在合作博弈中,買(mǎi)賣(mài)雙方的轉(zhuǎn)讓支付是與協(xié)議聯(lián)系在一起的,這種支付叫做旁支付解的概念:只有存在多個(gè)納什均衡,并且參與者有機(jī)會(huì)在博弈前進(jìn)行溝通的條件下,非合作博弈才可能出現(xiàn)聯(lián)盟。合作博弈分析的要點(diǎn)分析重點(diǎn)放在收益不同的聯(lián)盟形式的選擇上博弈的核通常包苔在解集中收益往往是用貨幣來(lái)衡量的。聯(lián)盟成員可以支付貨幣的方式彌補(bǔ)參與者放棄其他聯(lián)盟形式的損失此種貨幣支付叫做旁支付損失,此種貨幣支付叫做旁支付以是否與貨幣聯(lián)系在一起為標(biāo)準(zhǔn),可以把合作博弈分為存在轉(zhuǎn)移效用和不存在轉(zhuǎn)移效用兩類(lèi)博弈分為存在轉(zhuǎn)移效用和不存在轉(zhuǎn)移效用兩類(lèi)。有效配置意味著博弈的所有潛力都已被挖掘,如果想要使某些人變得更好,就不得不損害其他人的利益,這種資源配置狀態(tài)稱(chēng)為帕累托最優(yōu)合作博弈是一種參與者通過(guò)制定可信或具有約束力的承諾,以協(xié)調(diào)相互之間戰(zhàn)略選擇的博弈解集是全部有效(帕累托最優(yōu))配置(聯(lián)盟結(jié)構(gòu)與收益分配方式)的集合,參與者們至少可以獲得非合作博弈下的收益。參與者們至少可以獲得非合作博弈下的收益。合作博弈的核包含所有使團(tuán)體中的任何成員都不能從聯(lián)盟重組中獲益的配置方案,核囊括了所有不被占優(yōu)的配置方式對(duì)于無(wú)旁支付的情況解集:帕累托最優(yōu),占優(yōu)是從每一個(gè)個(gè)體的角度來(lái)考慮(如果想要使某些人變得更好,就不得不損害其他人的利益)核:占優(yōu)是從“聯(lián)盟”的每一個(gè)個(gè)體收益的角度來(lái)考慮對(duì)于有旁支付的情況解集:帕累托最優(yōu),解集由所有能夠帶來(lái)最大收益的協(xié)調(diào)戰(zhàn)略組成。(如前面的兩個(gè)房地產(chǎn)的例子)核:3優(yōu)是從聯(lián)?盟的總體收益的角度來(lái)考慮核必定包含在解集內(nèi),也可能與解集相同,可能是解集的子集,也可能是空集。人們按照合作博弈解行事,則任何非常數(shù)和博弈理論上都可轉(zhuǎn)化為雙贏(yíng)博弈非在常數(shù)和博弈中,合作博弈才是唯一理性的結(jié)果實(shí)際情況卻是,我們每天都會(huì)遇到非合作博弈問(wèn)題,非合作博弈似乎才是現(xiàn)實(shí)當(dāng)中常數(shù)和博弈的題,非合作博弈似乎才是現(xiàn)實(shí)當(dāng)中常數(shù)和博弈的寫(xiě)照當(dāng)參與者不能對(duì)合作戰(zhàn)略作出可信承諾時(shí),將產(chǎn)生非合作博弈解,通貨膨脹就是一個(gè)典型的例子第14章序貫博弈擴(kuò)展式:子博弈:從單結(jié)信息集開(kāi)始至博弈結(jié)束的過(guò)程,由一個(gè)決策結(jié)X和所有的后續(xù)決策結(jié)T(x)構(gòu)成,滿(mǎn)足條件:(1)決策結(jié)x是單結(jié)信息集;(2)在一個(gè)信息集的決策結(jié)必須是同一個(gè)決策結(jié)的后續(xù)結(jié)。子博弈完美均衡:如果一個(gè)納什均衡中的各個(gè)子博弈的戰(zhàn)略在每一個(gè)子博弈中都是最優(yōu)的,即構(gòu)成納什均衡,則稱(chēng)該博弈為子博弈完美納什均衡。基本子博弈和復(fù)合子博弈:最大的區(qū)別在于子博弈中是否含有更小的子博弈,如果沒(méi)有則是基本子博弈,否則都是復(fù)合子博弈后向歸納法:逆向歸納法是求解子博弈精煉納什均衡的最簡(jiǎn)便方法。在求解子博弈精煉納什均衡時(shí),從最后一個(gè)子博弈開(kāi)始逆推上。,,,,序列博弈:是指對(duì)局者選擇策略有時(shí)間先后的順序,某些對(duì)局者可能率先采取行動(dòng)。序列博弈也是一種動(dòng)態(tài)博弈。在序列博弈中,先行者可能占據(jù)一定的有利地位,我們把它叫作先行者優(yōu)勢(shì)。在某些市場(chǎng)中,特別在涉及市場(chǎng)進(jìn)入的競(jìng)爭(zhēng)時(shí),先行者優(yōu)勢(shì)對(duì)于企業(yè)的經(jīng)營(yíng)具有重要意義。二、簡(jiǎn)答1、合作博弈與非合作博弈的區(qū)別。解釋一:兩者的區(qū)別在于參與人在博弈過(guò)程中是否能夠達(dá)成一個(gè)具有約束力的協(xié)議。倘若不能,則稱(chēng)非合作博弈,比如零和博弈。合作博弈強(qiáng)調(diào)的是集體主義,團(tuán)體理性,是效率、公平、公正;而非合作博弈則強(qiáng)調(diào)個(gè)人理性、個(gè)人最優(yōu)決策,其結(jié)果是有時(shí)有效率,有時(shí)則不然。解釋二:合作博弈和非合作博弈兩者的區(qū)別是后者不考慮博弈方之間可以運(yùn)用有約束力協(xié)議的情況,而前者則允許存在這種協(xié)議。因此,是否允許有約束力的協(xié)議作為界定博弈合作非合作的根據(jù)。形成合作博弈的兩個(gè)條件:參見(jiàn)復(fù)習(xí)思考題。2、智豬博弈中制度設(shè)計(jì)改變博弈結(jié)果的原理智豬博弈給企業(yè)的啟示:1、在現(xiàn)實(shí)生活中,公司的激勵(lì)制度設(shè)計(jì)就必須充分利用智豬博弈的策略。如果公司的獎(jiǎng)勵(lì)力度太大,又是持股,又是期權(quán),公司職員各個(gè)都成了百萬(wàn)富翁,成本高不說(shuō),員工的積極性并不一定很高;如果獎(jiǎng)勵(lì)力度不大,而且見(jiàn)者有份(不勞動(dòng)的小豬也有),一度十分努力的大豬也不會(huì)有動(dòng)力了;最好的激勵(lì)機(jī)制就是一一獎(jiǎng)勵(lì)并非人人有份,而是直接針對(duì)個(gè)人(如業(yè)務(wù)按比例提成)這樣既節(jié)約了公司的成本,又消除了“搭便車(chē)”現(xiàn)象,能夠?qū)崿F(xiàn)有效的激勵(lì)。2、在企業(yè)中,大企業(yè)就好比大豬,中小企業(yè)就好比是小豬。控制按鈕可以比作技術(shù)創(chuàng)新,可以給企業(yè)帶來(lái)收益。大企業(yè)資金雄厚,生產(chǎn)力大,有更多的能力進(jìn)行技術(shù)創(chuàng)新,推出新產(chǎn)品后可以迅速占領(lǐng)市場(chǎng)獲得高額利潤(rùn)。而小企業(yè)的最優(yōu)選擇就是等待,等大企業(yè)技術(shù)創(chuàng)新后,跟在大企業(yè)后,搶占市場(chǎng)份額,從這種創(chuàng)新中獲得利益。員工和企業(yè)也是一個(gè)“智豬博弈”過(guò)程,員工就是大豬,員工有兩種選擇,努力工作或者消磨時(shí)間。如果員工努力工作那么企業(yè)和員工都受益,如果員工敷衍工作,拿多少工資干多少活,那么最終會(huì)被企業(yè)辭退。員工只有行動(dòng)才會(huì)受益,不行動(dòng)則不受益或者受損。而企業(yè)可以選擇物資獎(jiǎng)勵(lì),也可以選擇說(shuō)教等待,物資獎(jiǎng)勵(lì)企業(yè)必先拿出部分資金作為獎(jiǎng)勵(lì)品,顯然收益為負(fù),而等待則不受損,即使辭退員工也可以有人填補(bǔ)空缺,讓員工有危機(jī)感反而會(huì)促進(jìn)員工的積極性。所以聰明的員工會(huì)選擇努力工作引起領(lǐng)導(dǎo)注意而得到加薪。當(dāng)然也不要覺(jué)得做“小豬”沒(méi)有發(fā)展?!爸秦i博弈”是給競(jìng)爭(zhēng)中的弱者以等待為最佳策略的啟發(fā)。3、什么是納什均衡?你是如何理解的?納什均衡及其理解:在一個(gè)博弈過(guò)程中,無(wú)論其它局中人的策略選擇如何,局中人都會(huì)選擇某個(gè)確定的策略,則該策略被稱(chēng)作支配性策略。如果兩個(gè)博弈的當(dāng)事人的策略組合分別構(gòu)成各自的支配性策略,局中人誰(shuí)都沒(méi)有動(dòng)機(jī)單方面偏離該狀態(tài),那么這個(gè)組合就被定義為納什均衡。1,是完全信息靜態(tài)博弈的解的一般概念。2.每一個(gè)嚴(yán)格占優(yōu)戰(zhàn)略均衡一定是納什均衡,反之不然。3,每一個(gè)逐步剔除嚴(yán)格劣戰(zhàn)均衡一定是納什均衡,反之不然。4、比較策略型博弈的純策略和混合策略。純策略是指每個(gè)局中人在博弈中可選擇采用的行動(dòng)方案,混合策略是局中人的純策略空間上的一種概率分布,表示局中人實(shí)際博弈時(shí)根據(jù)這種概率分布在純策略中隨機(jī)選擇加以實(shí)施。純策略可視為混合策略的特例,也就是對(duì)某個(gè)純策略賦予概率1而對(duì)其他純策略賦予概率0的混合策略。5、簡(jiǎn)要分析擴(kuò)展型博弈的構(gòu)成要素。(1)參與人集合;虛擬參與人——自然。(2)行動(dòng)順序:誰(shuí)在什么時(shí)候行動(dòng)。(3)參與人的行動(dòng)空間:每次行動(dòng)時(shí),局中人可進(jìn)行的選擇(4)參與人的信息集:信息是參與人有關(guān)博弈的知識(shí),如有關(guān)“自然”的選擇、其他參與人的特征和行動(dòng)的知識(shí)等。(5)參與人的支付函數(shù):指在一個(gè)特定策略組合下參與人得到的確定(期望)效用水平(6)外生事件的概率分布。6、如何理解完全信息動(dòng)態(tài)博弈下的純策略和行動(dòng)?行動(dòng)與策略行動(dòng):是參與人在博弈的某個(gè)時(shí)點(diǎn)(某個(gè)信息集)的決策變量。 行動(dòng)組合:參與人的行動(dòng)的有序集。策略:是參與人在給定信息集情況下的行動(dòng)規(guī)則,它規(guī)定參與人在什么時(shí)候選擇什么行動(dòng)。在靜態(tài)博弈中,策略和行動(dòng)是等價(jià)的。在動(dòng)態(tài)博弈中,策略在給定信息集下完整的行動(dòng)方案,與行動(dòng)是不同的。7、理解子博弈和掌握逆向歸納法求解思想。子博弈是指由原擴(kuò)展型博弈中的一個(gè)決策節(jié)點(diǎn)與它的所有后續(xù)節(jié)點(diǎn)組成的博弈。一個(gè)擴(kuò)展式表述博弈的子博弈是原博弈的一部分,它應(yīng)滿(mǎn)足下列條件:(1).始于單結(jié)信息集的決策結(jié)x(但不包括原博弈的初始結(jié))。⑵.包含博弈樹(shù)中策結(jié)x的所有后續(xù)結(jié)(包括終點(diǎn)結(jié))。(3).沒(méi)有對(duì)任何信息集形成分割。逆向歸納法思想分析:有限博弈一定存在一個(gè)最后的決策結(jié)(其直接后續(xù)結(jié)是終點(diǎn)結(jié))的集合,在該決策結(jié)上行動(dòng)的參與人將選擇一個(gè)最大化自己的支付的行動(dòng);給定這個(gè)參與人的行動(dòng),倒數(shù)第二個(gè)決策結(jié)上的參與人將選擇一個(gè)可行的行動(dòng)最大化自己的支付;如此類(lèi)推,直至初始結(jié)。該倒推過(guò)程完成時(shí)得到了一條路徑,該路徑給出了每一個(gè)參與人的一個(gè)特定的策略,它是一個(gè)納什均衡(子博弈精煉納什均衡)。逆向歸納法實(shí)質(zhì)是重復(fù)剔除嚴(yán)格劣策略方法在擴(kuò)展式博弈中的運(yùn)用。8、比較合作博弈和非合作博弈。合約強(qiáng)制力不同:在合作博弈中,協(xié)議有外在力量保證強(qiáng)制執(zhí)行;在非合作博弈中,協(xié)議沒(méi)有外在力量保證強(qiáng)制執(zhí)行。研究重點(diǎn)不同:合作博弈研究的重點(diǎn)是聯(lián)盟,非合作博弈的重點(diǎn)是個(gè)體。9、占優(yōu)戰(zhàn)略均衡和納什均衡的聯(lián)系與區(qū)別:納什均衡,又稱(chēng)為非合作博弈均衡,是博弈論的一個(gè)重要術(shù)語(yǔ)。在這一均衡中,每個(gè)博弈參與人都確信,在給定其他參與人戰(zhàn)略決定的情況下,他選擇了最優(yōu)戰(zhàn)略以回應(yīng)對(duì)手的戰(zhàn)略。也就是說(shuō),所有人的戰(zhàn)略都是最優(yōu)的。占優(yōu)戰(zhàn)略是博弈論(gametheory)中的專(zhuān)業(yè)術(shù)語(yǔ),所謂的占優(yōu)戰(zhàn)略就是指無(wú)論競(jìng)爭(zhēng)對(duì)手如何反應(yīng)都屬于本企業(yè)最佳選擇的競(jìng)爭(zhēng)策略。占優(yōu)戰(zhàn)略均衡必定是納什均衡,因?yàn)榫种腥说恼純?yōu)戰(zhàn)略是對(duì)所有其他局中人的任何戰(zhàn)略組合情況下的最優(yōu)戰(zhàn)略選擇,自然它也一定是對(duì)于所有其他局中人的某個(gè)特定戰(zhàn)略(其他局中人的最優(yōu)戰(zhàn)略)情況下的最優(yōu)戰(zhàn)略選擇。但反過(guò)來(lái)不成立,納什均衡不一定是占優(yōu)戰(zhàn)略均衡。顯然,占優(yōu)戰(zhàn)略均衡是重復(fù)剔除的占優(yōu)戰(zhàn)略均衡的一種特例。10、納什均衡的意義:納什均衡理論奠定了現(xiàn)代主流博弈理論和經(jīng)濟(jì)理論的根本基礎(chǔ),其重要影響可以概括為以下六個(gè)方面:(1)改變了經(jīng)濟(jì)學(xué)的體系和結(jié)構(gòu)。非合作博弈論的概念、內(nèi)容、模型和分析工具等,均已滲透到微觀(guān)經(jīng)濟(jì)學(xué)、宏觀(guān)經(jīng)濟(jì)學(xué)、勞動(dòng)經(jīng)濟(jì)學(xué)、國(guó)際經(jīng)濟(jì)學(xué)、環(huán)境經(jīng)濟(jì)學(xué)等經(jīng)濟(jì)學(xué)科的絕大部分學(xué)科領(lǐng)域,改變了這些學(xué)科領(lǐng)域的內(nèi)容和結(jié)構(gòu),成為這些學(xué)科領(lǐng)域的基本研究范式和理論分析工具,從而改變了原有經(jīng)濟(jì)學(xué)理論體系中各分支學(xué)科的內(nèi)涵。(2)擴(kuò)展了經(jīng)濟(jì)學(xué)研究經(jīng)濟(jì)問(wèn)題的范圍。原有經(jīng)濟(jì)學(xué)缺乏將不確定性因素、變動(dòng)環(huán)境因素以及經(jīng)濟(jì)個(gè)體之間的交互作用模式化的有效辦法,因而不能進(jìn)行微觀(guān)層次經(jīng)濟(jì)問(wèn)題的解剖分析。納什均衡及相關(guān)模型分析方法,包括擴(kuò)展型博弈法、逆推歸納法、子博弈完美納什均衡等概念方法,為經(jīng)濟(jì)學(xué)家們提供了深入的分析工具。(3)加強(qiáng)了經(jīng)濟(jì)學(xué)研究的深度。納什均衡理論不回避經(jīng)濟(jì)個(gè)體之間直接的交互作用,不滿(mǎn)足于對(duì)經(jīng)濟(jì)個(gè)體之間復(fù)

溫馨提示

  • 1. 本站所有資源如無(wú)特殊說(shuō)明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請(qǐng)下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請(qǐng)聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶(hù)所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁(yè)內(nèi)容里面會(huì)有圖紙預(yù)覽,若沒(méi)有圖紙預(yù)覽就沒(méi)有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫(kù)網(wǎng)僅提供信息存儲(chǔ)空間,僅對(duì)用戶(hù)上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對(duì)用戶(hù)上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對(duì)任何下載內(nèi)容負(fù)責(zé)。
  • 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請(qǐng)與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶(hù)因使用這些下載資源對(duì)自己和他人造成任何形式的傷害或損失。

最新文檔

評(píng)論

0/150

提交評(píng)論