博弈論復(fù)習(xí)分析和總結(jié)

上傳人：比*** IP屬地：四川上傳時(shí)間：2023-07-28 格式：DOCX 頁(yè)數(shù)：11 大?。?6.97KB 積分：15 舉報(bào) 版權(quán)申訴

已閱讀5頁(yè)，還剩6頁(yè)未讀，繼續(xù)免費(fèi)閱讀

版權(quán)說(shuō)明：本文檔由用戶(hù)提供并上傳，收益歸屬內(nèi)容提供方，若內(nèi)容存在侵權(quán)，請(qǐng)進(jìn)行舉報(bào)或認(rèn)領(lǐng)

文檔簡(jiǎn)介

第2章擴(kuò)展式博弈與標(biāo)準(zhǔn)式博弈標(biāo)準(zhǔn)式：博弈過(guò)程以數(shù)字矩陣表示，矩陣兩側(cè)為參與者的不同的戰(zhàn)略選擇擴(kuò)展式：博弈過(guò)程以樹(shù)形圖表示，樹(shù)形圖的每一樹(shù)枝節(jié)代表了一種戰(zhàn)略選擇不確定事件：可能發(fā)生也可能不發(fā)生的事件相機(jī)戰(zhàn)略：僅在不確定事件發(fā)生時(shí)才會(huì)采取的戰(zhàn)略。在擴(kuò)展式博弈中，只要博弈的一方在不知情的情況下決策，或者同時(shí)決策，我們就將其所有的選擇都列在從一個(gè)節(jié)點(diǎn)出發(fā)的分支中，以此表示信息的不充分（標(biāo)準(zhǔn)式：博弈過(guò)程以數(shù)字矩陣表示，矩陣兩側(cè)為參與者的不同的戰(zhàn)略選擇，往往用于表達(dá)靜態(tài)博弈擴(kuò)展式：博弈過(guò)程以樹(shù)形圖表示,樹(shù)形圖的每一樹(shù)枝節(jié)代喪了一種戰(zhàn)略選擇,往往用廣表達(dá)動(dòng)態(tài)博弈任何一個(gè)博介都可以表小成為標(biāo)準(zhǔn)式,也可以表小為擴(kuò)展式）第3章占優(yōu)戰(zhàn)略與社會(huì)兩難占優(yōu)戰(zhàn)略：無(wú)論其他參與人選擇什么戰(zhàn)略，參與人的某一種戰(zhàn)略均是最優(yōu)的。占優(yōu)戰(zhàn)略均衡：如果博弈中的每位參與者都有占優(yōu)戰(zhàn)略，并且也實(shí)施其占優(yōu)戰(zhàn)略，我們就可以獲得一個(gè)占優(yōu)戰(zhàn)略均衡。合作解：不管是通過(guò)協(xié)議還是其他形式的強(qiáng)制手段，只要博弈中的參與者能夠保證自己履行協(xié)調(diào)后的戰(zhàn)略，那么他們選擇的戰(zhàn)略及其收益就被稱(chēng)作合作解非合作解：占優(yōu)戰(zhàn)略均衡是一種非合作解，也就是說(shuō)每位參與者都獨(dú)立行動(dòng)，而不是一起協(xié)商其戰(zhàn)略。在非合作解中，每位參與者都會(huì)根據(jù)對(duì)方的戰(zhàn)略選擇自己的最優(yōu)戰(zhàn)略假定所有人都這樣做那么每一位參方的戰(zhàn)略選擇自己的最優(yōu)戰(zhàn)略，假定所有人都這樣做，那么每位參與者所選的戰(zhàn)略就都是針對(duì)他人最優(yōu)戰(zhàn)略的最優(yōu)反應(yīng)式參與者在行動(dòng)選擇時(shí)無(wú)法達(dá)成約束性的協(xié)議的解集。）社會(huì)兩難：社會(huì)兩難是一種存在占優(yōu)戰(zhàn)略均衡的博弈，并且參與者采用這種均衡的戰(zhàn)略收益比采用非均衡戰(zhàn)略的收益要差。（當(dāng)一個(gè)博弈存在占優(yōu)戰(zhàn)略時(shí)，人們就會(huì)理所當(dāng)然地選擇該戰(zhàn)略而不是另一個(gè)。囚徒困境與垃圾處理博弈非常相似這些博弈都屬于社會(huì)兩難理博弈非常相似，這些博弈都屬于社會(huì)兩難。）第4章納什均衡納什均衡：給定你的策略，我的策略是最好的策略；給定我的策略，你的策略也是最好的策略,即雙方在給定的戰(zhàn)略上不愿意改變自己的策略。13、博弈有哪些分類(lèi)方法，有哪些主要的類(lèi)型？首先，可根據(jù)博弈方的行為邏輯，是否允許存在有約束力協(xié)議，分為非合作博弈和合作博弈兩大類(lèi)。其次，可以根據(jù)博弈方的理性層次，分為完全理性博弈和有限理性博弈兩大類(lèi)，有限理性博弈就是進(jìn)化博弈。第三是可以根據(jù)博弈過(guò)程分為靜態(tài)博弈、動(dòng)態(tài)博弈和重復(fù)博弈三大類(lèi)。第四是根據(jù)博弈問(wèn)題的信息結(jié)構(gòu)，根據(jù)博弈方是否都有關(guān)于得益和博弈過(guò)程的充分信息，分為完全信息靜態(tài)博弈、不完全信息靜態(tài)博弈、完全且完美信息動(dòng)態(tài)博弈、完全但不完美信自、動(dòng)態(tài)博弈和不完全信息動(dòng)態(tài)博弈幾類(lèi)。第五是根據(jù)得益的特征分為零和博弈、常和博弈和變和博弈。第六是根據(jù)博弈中博弈方的數(shù)量，可將博弈分為單人博弈、兩人博弈和多人博弈。第七是根據(jù)博弈方策略的數(shù)量，分為有限博弈和無(wú)限博弈兩類(lèi)。14、純策略納什均衡與混合策略納什均衡的計(jì)算純策略納什均衡：劃線(xiàn)法、箭頭法混合策略納什均衡：自己的策略選擇不能被另一方預(yù)知或猜到，即在決策時(shí)利用隨機(jī)性。選擇每種策略的概率一定要恰好使對(duì)方無(wú)機(jī)可乘，即讓對(duì)方無(wú)法通過(guò)有針對(duì)性的傾向某一策略而占上風(fēng)。三、分析題：案例分析一一囚徒困境案例：警察把甲乙分開(kāi)關(guān)押，并在提審時(shí)分別告之，如果你坦白而他不坦白，那么你將只判0年，他將被判8年；如果你不坦白而他坦白，那么你判8年，他判。年；如果你們兩人都坦白了，各判5年；如果你們兩人都不坦白了，各判1年。分析：每個(gè)博弈方選擇自己的策略時(shí)，雖然無(wú)法知道另一方的實(shí)際選擇，但他卻不能忽視另一方的選擇對(duì)他自己的得益的影響，因此他應(yīng)該考慮到另一方有兩種可能的選擇，并分別考慮自己相應(yīng)的最佳策略。對(duì)囚徒A來(lái)說(shuō)，囚徒B有坦白和不坦白兩種可能的選擇，假設(shè)囚徒B的選擇是不坦白，則對(duì)囚徒A來(lái)說(shuō)，不坦白得益為坦白得益為0,他應(yīng)該選擇坦白；假設(shè)囚徒B選擇的是坦白，則囚徒A不坦白得益為-8,坦白得益為-5,他還是該選擇坦白。因此，在此博弈中，無(wú)論囚徒B采取何種策略囚徒A的選擇只有一種，即坦白，因?yàn)樵诹硪环絻煞N可能的情況下，坦白給自己帶來(lái)的得益都是較大的。同樣的道理，囚徒B的唯一的選擇也是坦白。所以最可能的結(jié)局：該博弈的最終結(jié)果是兩博弈方同選擇坦白策略。其支付矩陣如下：市E甲S6崛2乙5,50,88,01,12、“囚徒的困境”的內(nèi)在根源是什么？舉出現(xiàn)實(shí)中囚徒的困境的具體例子?！扒敉降睦Ь场钡膬?nèi)在根源是在個(gè)體之間存在行為和利益相互制約的博弈結(jié)構(gòu)中，以個(gè)體理性和個(gè)體選擇為基礎(chǔ)的分散決策方式，無(wú)法有效地協(xié)調(diào)各方面的利益，并實(shí)現(xiàn)整體、個(gè)體利益共同的最優(yōu)。簡(jiǎn)單地說(shuō)，“囚徒的困境”問(wèn)題都是個(gè)體理性與集體理性的矛盾引起的?，F(xiàn)實(shí)中“囚徒的困境”類(lèi)型的問(wèn)題是很多的。例如廠(chǎng)商之間的價(jià)格戰(zhàn)、惡性的廣告競(jìng)爭(zhēng)，初等、中等教育中的應(yīng)試教育等，其實(shí)都是“囚徒的困境”博弈的表現(xiàn)形式。3、古諾的寡頭模型中個(gè)體收益最大化和集體收益最大化的差異及現(xiàn)實(shí)意義。與個(gè)體收益最大化相比，追求集體收益最大化時(shí)總產(chǎn)量較小，而總利潤(rùn)較高。從兩廠(chǎng)商總體來(lái)看，根據(jù)集體利潤(rùn)最大化確定產(chǎn)量效率更高，兩廠(chǎng)商考慮合作，聯(lián)合起來(lái)決定產(chǎn)量，定出使集體利益最大的產(chǎn)量后各自生產(chǎn)一半，比只考慮個(gè)體收益的獨(dú)立決策行為得到的利益要高。在獨(dú)立決策、缺乏協(xié)調(diào)機(jī)制的兩個(gè)企業(yè)間，考慮集體收益最大化的合作并不容易實(shí)現(xiàn)，即使實(shí)現(xiàn)了也是不穩(wěn)定的。主要原因是各自生產(chǎn)一半實(shí)現(xiàn)最大總利潤(rùn)總產(chǎn)量的產(chǎn)量組合不是納什均衡策略組合。納什均衡戰(zhàn)略：如果有兩個(gè)戰(zhàn)略（或者更一般的，有多個(gè)戰(zhàn)略，每個(gè)戰(zhàn)略都對(duì)應(yīng)著一個(gè)參與者）,并且每個(gè)戰(zhàn)略都是另一個(gè)戰(zhàn)略（或者其他參與者的戰(zhàn)略）的最優(yōu)反應(yīng)，我們就稱(chēng)這一戰(zhàn)略組合為納什均衡戰(zhàn)略。協(xié)調(diào)博弈：只有協(xié)調(diào)彼此的戰(zhàn)略選擇，兩個(gè)參與者才能得到最優(yōu)的的收益。謝林點(diǎn)：人們把這種以線(xiàn)索為基礎(chǔ)選擇的均衡稱(chēng)為謝林點(diǎn)或焦點(diǎn)。納什均衡是求解博弈問(wèn)題的一個(gè)普遍適用的方法，但是也有缺點(diǎn)。1.有些博弈的納什均衡并不唯一。部分博弈存在兩個(gè)或更多的納什均衡。在這種情況下，博弈的參與者將很難確定哪個(gè)均衡會(huì)發(fā)生，這取決于他們能夠得到的信息。如果有信號(hào)或者線(xiàn)索使他們認(rèn)為，其中的一個(gè)均衡比其他均衡更可能發(fā)生，那么這個(gè)可能發(fā)生的均衡就是謝林點(diǎn)。但并非所有存在多個(gè)納什均衡的博弈都具有謝林點(diǎn)。2,并不是所有博弈（包含有限個(gè)戰(zhàn)略）都存在納什均衡。目前我們僅研究帶有2個(gè)、3個(gè)、4個(gè)戰(zhàn)略的有限博弈，戰(zhàn)略數(shù)量超過(guò)這個(gè)范圍的其他博弈可能不存在納什均衡。第一個(gè)均衡雙方的收益都高于第二個(gè)均衡。事實(shí)上，第一個(gè)均衡的收益優(yōu)于任何其他的戰(zhàn)略組合。所以（推，推）均衡是收益占優(yōu)均衡。收益最大這個(gè)特征似乎能使（推，推）均衡成為博弈的謝林點(diǎn)，因?yàn)槊恳环蕉紩?huì)認(rèn)為對(duì)方將選擇推，自己為了獲取更大收益，自然會(huì)選擇推?，F(xiàn)實(shí)中卻不一定如此。若吉姆和卡爾互相了解且互不信任，那么該博弈另外一種可能就是雙發(fā)為了避免的收益而都選擇（不推，不推）。這個(gè)均衡規(guī)避了最大損失，成為風(fēng)險(xiǎn)占優(yōu)納什均衡。此時(shí)，（不推，不推）成為謝林點(diǎn)。推與不推博弈是個(gè)協(xié)調(diào)博弈（還有前面講到的產(chǎn)業(yè)標(biāo)準(zhǔn)博弈），只有協(xié)調(diào)彼此的戰(zhàn)略選擇，兩個(gè)參與者才能獲得最優(yōu)收益，但協(xié)調(diào)戰(zhàn)略在現(xiàn)實(shí)中操作比較困難。納什均衡的缺陷：有些博弈的納什均衡并不唯一，如果一個(gè)均衡比其他均衡更可能發(fā)生，這個(gè)均衡就是謝林點(diǎn)；不是所有博弈都存在納什均衡第5章博弈論中的經(jīng)典例子最大最小戰(zhàn)略：最大最小戰(zhàn)略是其最小收益中數(shù)值最大的收益所對(duì)應(yīng)的戰(zhàn)略。零和博弈：是指在博弈中，一方的得益就是另一方的損失，所有博弈方的得益總和為零常數(shù)和博弈：是指博弈雙方的得益總和為非零的常數(shù)非常數(shù)和博弈：是指在不同的策略組合或者結(jié)果下，所有博弈方的得益總和一般是不相同的?？偸找嫒Q于參與者所選擇的戰(zhàn)略。心零和博弈的缺陷：他與日常工作中所遇到的復(fù)雜情況存在一定的差距，也告誡我們不要才巴問(wèn)題過(guò)于簡(jiǎn)單化。前面學(xué)習(xí)的尼姆游戲、西班牙叛亂等屬于零和博弈；囚徒困境、廣告博弈、選址博弈、電臺(tái)節(jié)目選擇等均為非常數(shù)和博弈選擇等均為非常數(shù)和博弈。第6章三人博弈聯(lián)盟博弈：拆臺(tái)者：是指自己不可能獲勝卻可以阻止其他人獲勝的參與者。公共物品：一項(xiàng)公共物品是指帶有某種特性的某一商品或服務(wù)（事實(shí)上通常都是服務(wù)），政府提供此類(lèi)服務(wù)要優(yōu)于私人。公共物品有以下兩個(gè)重要特征：1.每個(gè)人都可以從該物品中收益。特別是沒(méi)有，沒(méi)有付費(fèi)的人也可以與付費(fèi)的人同等享有該物品。22成本由提供服務(wù)的水品決定，而不取決于接受服務(wù)的消費(fèi)者的數(shù)量。第7章概率與博弈論概率：概率是衡量可能性的一種數(shù)字量度，取值范圍為［0,1］。極限頻率：無(wú)限擴(kuò)大試驗(yàn)次數(shù)所觀(guān)察到的事件發(fā)生頻率的近似值。期望值：所有可能收益的加權(quán)平均之和，權(quán)重為各可能收益的對(duì)應(yīng)頻率。風(fēng)險(xiǎn)厭惡：第8章混合戰(zhàn)略納什均衡純戰(zhàn)略：標(biāo)準(zhǔn)式博弈中列出的每一個(gè)戰(zhàn)略，出現(xiàn)的頻率為1（即使固定的）?；旌蠎?zhàn)略：根據(jù)給定的概率，在若干純戰(zhàn)略中進(jìn)行隨即選擇，將這些純戰(zhàn)略按概率混合起來(lái)。（如果在每個(gè)給定信息下只以某種概率選擇不同策略，稱(chēng)為混合策略。）隨機(jī)選擇戰(zhàn)略：混合戰(zhàn)略均衡：第9章非合作均衡的深入討論劣戰(zhàn)略：無(wú)論對(duì)手選擇哪個(gè)戰(zhàn)略，博弈中的一方選擇一個(gè)戰(zhàn)略的收益總是高于第二個(gè)，那么第二個(gè)戰(zhàn)略就被第一個(gè)戰(zhàn)略所占優(yōu)，稱(chēng)為劣戰(zhàn)略。強(qiáng)劣戰(zhàn)略：A戰(zhàn)略的收益嚴(yán)格大于B戰(zhàn)略，我們就稱(chēng)B戰(zhàn)略是強(qiáng)劣戰(zhàn)略0弱劣戰(zhàn)略：A戰(zhàn)略的收益和B戰(zhàn)略的收益一樣大，或者偶爾大于第二個(gè)戰(zhàn)略，那么B戰(zhàn)略就是相對(duì)于A(yíng)戰(zhàn)略的弱劣戰(zhàn)略若重復(fù)剔除過(guò)程一直可持續(xù)到只剩下唯一的戰(zhàn)略組合，則該戰(zhàn)略組合即為重復(fù)剔除的占優(yōu)均衡，此時(shí)該博弈是重復(fù)剔除戰(zhàn)略可解。要點(diǎn)：再重復(fù)剔除過(guò)程中，如果每次剔除的是嚴(yán)格劣戰(zhàn)略，均衡結(jié)果與剔除順序無(wú)關(guān)；如果剔除的是弱劣戰(zhàn)略，均衡結(jié)果可能與剔除順序有關(guān)。劣戰(zhàn)略的反復(fù)剔除：反復(fù)剔除劣戰(zhàn)略應(yīng)該是指剔除強(qiáng)劣戰(zhàn)略，這種剔除可以重復(fù)進(jìn)行直到不存在劣戰(zhàn)略。只有通過(guò)劣戰(zhàn)略反復(fù)剔除法剔除的戰(zhàn)略都為強(qiáng)劣戰(zhàn)略，那么所得到的博弈與原始博弈才除的戰(zhàn)略都為強(qiáng)劣戰(zhàn)略，那么所得到的博弈與原始博弈才有相同的納什均衡相關(guān)均衡：聯(lián)盟在非合作博弈中有著重要的作用，但是前提是所有聯(lián)盟成員都選擇他們的最佳反應(yīng)戰(zhàn)略。聯(lián)盟可能會(huì)形成一個(gè)集體的混合戰(zhàn)略。這是一個(gè)相關(guān)均衡，它要求聯(lián)盟的成員確定某種定的概率，隨機(jī)、集體地選擇戰(zhàn)略的方法,,,,對(duì)于非合作博弈，精煉后的納什均衡包括兩種：一種是強(qiáng)納什均衡，即偏離某一納什均衡時(shí)，沒(méi)有一個(gè)聯(lián)盟能夠獲益，該納什均衡就是強(qiáng)納什均衡，另一種是“防聯(lián)盟”的均衡，判斷均衡是否是“防聯(lián)盟”的，需要回答兩個(gè)問(wèn)題：第一，是否有聯(lián)盟可以選擇其他的納什均衡并獲得更好的效益？第二，聯(lián)盟是否穩(wěn)定，即在其內(nèi)部是否存在更小的聯(lián)盟可以通過(guò)轉(zhuǎn)向另一個(gè)納什均衡而獲益？如果沒(méi)有更小的聯(lián)盟（即單人聯(lián)盟）能夠從改變戰(zhàn)略中獲益，貝I」兩人聯(lián)盟就是穩(wěn)定的。第11章多人博弈多人博弈：代表性經(jīng)濟(jì)人：在排隊(duì)博弈里，所有的參與者都被假設(shè)成一致的，即每個(gè)參與者都可以作為代表性經(jīng)紀(jì)人，他們都有著同樣的戰(zhàn)略集，并且存在對(duì)稱(chēng)收益并且存在對(duì)稱(chēng)收益。狀態(tài)變量：排隊(duì)博弈中，一個(gè)乘客所需要知道的只是隊(duì)列的長(zhǎng)度，不需要理解其他乘客的選擇。狀態(tài)變量是一個(gè)單變量，或者說(shuō)是某些變量中的一個(gè)。如果將狀態(tài)變量匯總，就可以描述博弈的整個(gè)狀態(tài)。狀態(tài)變量是代表性經(jīng)紀(jì)人做出最佳反應(yīng)戰(zhàn)略時(shí)所需要知道的全部信息。比例博弈：一、當(dāng)拍賣(mài)商宣布一個(gè)價(jià)格時(shí)，理性的賣(mài)方和理性買(mǎi)方的最好反應(yīng)？答案：賣(mài)方的最好反應(yīng)是提供其供給函數(shù)里的數(shù)量。買(mǎi)方的最好反應(yīng)是提供其需求函數(shù)里的數(shù)量。二、假設(shè)不用試算規(guī)則，只要需求量等于或大于供給量，賣(mài)方就賣(mài)出貨物。這時(shí)當(dāng)拍賣(mài)商宣布一個(gè)價(jià)格賣(mài)方還是做出同樣的反應(yīng)嗎？這時(shí)，當(dāng)拍賣(mài)商宣布個(gè)價(jià)格，賣(mài)方還是做出同樣的反應(yīng)嗎？分析：當(dāng)價(jià)格等于或低于平衡點(diǎn)時(shí)，賣(mài)方供應(yīng)的貨物被賣(mài)出。但是當(dāng)需求大于供給量的價(jià)格比供需平衡的價(jià)格低。結(jié)果賣(mài)方會(huì)失去賣(mài)出高價(jià)的機(jī)會(huì)。因此提供供給曲線(xiàn)上的數(shù)量可能不是最佳的選擇因此，提供供給曲線(xiàn)上的數(shù)量可能不是最佳的選擇。.假設(shè)的好處：以簡(jiǎn)化研究為目的的假設(shè)，是幫助我們思考問(wèn)題的有力工具。例如供需理論和凱恩斯理論可以按照含有代表經(jīng)濟(jì)人和狀態(tài)變量的納什均衡加以理解。.假設(shè)的壞處：1）有些情況下，決策者不能依靠市場(chǎng)價(jià)格之類(lèi)的狀態(tài)變量2）在某些情況下，競(jìng)爭(zhēng)者數(shù)量較少時(shí)，決策者必須考慮到競(jìng)爭(zhēng)對(duì)手對(duì)自己決策的具體反應(yīng)競(jìng)爭(zhēng)對(duì)手對(duì)自己決策的具體反應(yīng)?，F(xiàn)實(shí)問(wèn)題往往涉及多個(gè)參與者，參與者的戰(zhàn)略組合數(shù)目很大，之間的關(guān)系會(huì)很復(fù)雜，需要進(jìn)行一些假設(shè)才可以使得研究變得可行描繪博弈狀態(tài)的變量稱(chēng)為狀態(tài)變量代表性經(jīng)紀(jì)人根據(jù)狀態(tài)變量就可以選擇出最佳反應(yīng)戰(zhàn)略對(duì)于相同的戰(zhàn)略和相同的狀態(tài)變量值，代表性經(jīng)紀(jì)人有著相同的收益，他們都有著同樣的戰(zhàn)略集，并且存在對(duì)稱(chēng)收益。第12章合作博弈的要素合作博弈：人們行為相互作用時(shí)，當(dāng)事人能達(dá)成一個(gè)具有約束力的協(xié)議，也就是合作博弈合作博弈解：參與者可以協(xié)調(diào)相互之間的戰(zhàn)略選擇，合作博弈得到的解為合作博弈解聯(lián)盟：在博弈論中，把協(xié)調(diào)相互戰(zhàn)略的參與者們叫做聯(lián)盟。旁支付：在合作博弈中，買(mǎi)賣(mài)雙方的轉(zhuǎn)讓支付是與協(xié)議聯(lián)系在一起的，這種支付叫做旁支付解的概念：只有存在多個(gè)納什均衡，并且參與者有機(jī)會(huì)在博弈前進(jìn)行溝通的條件下，非合作博弈才可能出現(xiàn)聯(lián)盟。合作博弈分析的要點(diǎn)分析重點(diǎn)放在收益不同的聯(lián)盟形式的選擇上博弈的核通常包苔在解集中收益往往是用貨幣來(lái)衡量的。聯(lián)盟成員可以支付貨幣的方式彌補(bǔ)參與者放棄其他聯(lián)盟形式的損失此種貨幣支付叫做旁支付損失，此種貨幣支付叫做旁支付以是否與貨幣聯(lián)系在一起為標(biāo)準(zhǔn)，可以把合作博弈分為存在轉(zhuǎn)移效用和不存在轉(zhuǎn)移效用兩類(lèi)博弈分為存在轉(zhuǎn)移效用和不存在轉(zhuǎn)移效用兩類(lèi)。有效配置意味著博弈的所有潛力都已被挖掘，如果想要使某些人變得更好，就不得不損害其他人的利益，這種資源配置狀態(tài)稱(chēng)為帕累托最優(yōu)合作博弈是一種參與者通過(guò)制定可信或具有約束力的承諾，以協(xié)調(diào)相互之間戰(zhàn)略選擇的博弈解集是全部有效（帕累托最優(yōu)）配置（聯(lián)盟結(jié)構(gòu)與收益分配方式）的集合，參與者們至少可以獲得非合作博弈下的收益。參與者們至少可以獲得非合作博弈下的收益。合作博弈的核包含所有使團(tuán)體中的任何成員都不能從聯(lián)盟重組中獲益的配置方案，核囊括了所有不被占優(yōu)的配置方式對(duì)于無(wú)旁支付的情況解集：帕累托最優(yōu)，占優(yōu)是從每一個(gè)個(gè)體的角度來(lái)考慮（如果想要使某些人變得更好，就不得不損害其他人的利益）核：占優(yōu)是從“聯(lián)盟”的每一個(gè)個(gè)體收益的角度來(lái)考慮對(duì)于有旁支付的情況解集：帕累托最優(yōu)，解集由所有能夠帶來(lái)最大收益的協(xié)調(diào)戰(zhàn)略組成。(如前面的兩個(gè)房地產(chǎn)的例子)核：3優(yōu)是從聯(lián)?盟的總體收益的角度來(lái)考慮核必定包含在解集內(nèi)，也可能與解集相同,可能是解集的子集，也可能是空集。人們按照合作博弈解行事，則任何非常數(shù)和博弈理論上都可轉(zhuǎn)化為雙贏(yíng)博弈非在常數(shù)和博弈中，合作博弈才是唯一理性的結(jié)果實(shí)際情況卻是，我們每天都會(huì)遇到非合作博弈問(wèn)題，非合作博弈似乎才是現(xiàn)實(shí)當(dāng)中常數(shù)和博弈的題，非合作博弈似乎才是現(xiàn)實(shí)當(dāng)中常數(shù)和博弈的寫(xiě)照當(dāng)參與者不能對(duì)合作戰(zhàn)略作出可信承諾時(shí)，將產(chǎn)生非合作博弈解，通貨膨脹就是一個(gè)典型的例子第14章序貫博弈擴(kuò)展式：子博弈：從單結(jié)信息集開(kāi)始至博弈結(jié)束的過(guò)程，由一個(gè)決策結(jié)X和所有的后續(xù)決策結(jié)T(x)構(gòu)成，滿(mǎn)足條件：(1)決策結(jié)x是單結(jié)信息集；(2)在一個(gè)信息集的決策結(jié)必須是同一個(gè)決策結(jié)的后續(xù)結(jié)。子博弈完美均衡：如果一個(gè)納什均衡中的各個(gè)子博弈的戰(zhàn)略在每一個(gè)子博弈中都是最優(yōu)的，即構(gòu)成納什均衡，則稱(chēng)該博弈為子博弈完美納什均衡。基本子博弈和復(fù)合子博弈：最大的區(qū)別在于子博弈中是否含有更小的子博弈，如果沒(méi)有則是基本子博弈，否則都是復(fù)合子博弈后向歸納法：逆向歸納法是求解子博弈精煉納什均衡的最簡(jiǎn)便方法。在求解子博弈精煉納什均衡時(shí)，從最后一個(gè)子博弈開(kāi)始逆推上。,,,,序列博弈：是指對(duì)局者選擇策略有時(shí)間先后的順序，某些對(duì)局者可能率先采取行動(dòng)。序列博弈也是一種動(dòng)態(tài)博弈。在序列博弈中，先行者可能占據(jù)一定的有利地位，我們把它叫作先行者優(yōu)勢(shì)。在某些市場(chǎng)中，特別在涉及市場(chǎng)進(jìn)入的競(jìng)爭(zhēng)時(shí)，先行者優(yōu)勢(shì)對(duì)于企業(yè)的經(jīng)營(yíng)具有重要意義。二、簡(jiǎn)答1、合作博弈與非合作博弈的區(qū)別。解釋一：兩者的區(qū)別在于參與人在博弈過(guò)程中是否能夠達(dá)成一個(gè)具有約束力的協(xié)議。倘若不能，則稱(chēng)非合作博弈，比如零和博弈。合作博弈強(qiáng)調(diào)的是集體主義，團(tuán)體理性，是效率、公平、公正；而非合作博弈則強(qiáng)調(diào)個(gè)人理性、個(gè)人最優(yōu)決策，其結(jié)果是有時(shí)有效率，有時(shí)則不然。解釋二：合作博弈和非合作博弈兩者的區(qū)別是后者不考慮博弈方之間可以運(yùn)用有約束力協(xié)議的情況，而前者則允許存在這種協(xié)議。因此，是否允許有約束力的協(xié)議作為界定博弈合作非合作的根據(jù)。形成合作博弈的兩個(gè)條件：參見(jiàn)復(fù)習(xí)思考題。2、智豬博弈中制度設(shè)計(jì)改變博弈結(jié)果的原理智豬博弈給企業(yè)的啟示：1、在現(xiàn)實(shí)生活中，公司的激勵(lì)制度設(shè)計(jì)就必須充分利用智豬博弈的策略。如果公司的獎(jiǎng)勵(lì)力度太大，又是持股，又是期權(quán)，公司職員各個(gè)都成了百萬(wàn)富翁，成本高不說(shuō)，員工的積極性并不一定很高；如果獎(jiǎng)勵(lì)力度不大，而且見(jiàn)者有份（不勞動(dòng)的小豬也有），一度十分努力的大豬也不會(huì)有動(dòng)力了；最好的激勵(lì)機(jī)制就是一一獎(jiǎng)勵(lì)并非人人有份，而是直接針對(duì)個(gè)人（如業(yè)務(wù)按比例提成）這樣既節(jié)約了公司的成本，又消除了“搭便車(chē)”現(xiàn)象，能夠?qū)崿F(xiàn)有效的激勵(lì)。2、在企業(yè)中，大企業(yè)就好比大豬，中小企業(yè)就好比是小豬。控制按鈕可以比作技術(shù)創(chuàng)新，可以給企業(yè)帶來(lái)收益。大企業(yè)資金雄厚，生產(chǎn)力大，有更多的能力進(jìn)行技術(shù)創(chuàng)新，推出新產(chǎn)品后可以迅速占領(lǐng)市場(chǎng)獲得高額利潤(rùn)。而小企業(yè)的最優(yōu)選擇就是等待，等大企業(yè)技術(shù)創(chuàng)新后，跟在大企業(yè)后，搶占市場(chǎng)份額，從這種創(chuàng)新中獲得利益。員工和企業(yè)也是一個(gè)“智豬博弈”過(guò)程，員工就是大豬，員工有兩種選擇，努力工作或者消磨時(shí)間。如果員工努力工作那么企業(yè)和員工都受益，如果員工敷衍工作，拿多少工資干多少活，那么最終會(huì)被企業(yè)辭退。員工只有行動(dòng)才會(huì)受益，不行動(dòng)則不受益或者受損。而企業(yè)可以選擇物資獎(jiǎng)勵(lì)，也可以選擇說(shuō)教等待，物資獎(jiǎng)勵(lì)企業(yè)必先拿出部分資金作為獎(jiǎng)勵(lì)品，顯然收益為負(fù)，而等待則不受損，即使辭退員工也可以有人填補(bǔ)空缺，讓員工有危機(jī)感反而會(huì)促進(jìn)員工的積極性。所以聰明的員工會(huì)選擇努力工作引起領(lǐng)導(dǎo)注意而得到加薪。當(dāng)然也不要覺(jué)得做“小豬”沒(méi)有發(fā)展?！爸秦i博弈”是給競(jìng)爭(zhēng)中的弱者以等待為最佳策略的啟發(fā)。3、什么是納什均衡？你是如何理解的？納什均衡及其理解：在一個(gè)博弈過(guò)程中，無(wú)論其它局中人的策略選擇如何，局中人都會(huì)選擇某個(gè)確定的策略，則該策略被稱(chēng)作支配性策略。如果兩個(gè)博弈的當(dāng)事人的策略組合分別構(gòu)成各自的支配性策略,局中人誰(shuí)都沒(méi)有動(dòng)機(jī)單方面偏離該狀態(tài)，那么這個(gè)組合就被定義為納什均衡。1,是完全信息靜態(tài)博弈的解的一般概念。2.每一個(gè)嚴(yán)格占優(yōu)戰(zhàn)略均衡一定是納什均衡，反之不然。3,每一個(gè)逐步剔除嚴(yán)格劣戰(zhàn)均衡一定是納什均衡，反之不然。4、比較策略型博弈的純策略和混合策略。純策略是指每個(gè)局中人在博弈中可選擇采用的行動(dòng)方案，混合策略是局中人的純策略空間上的一種概率分布，表示局中人實(shí)際博弈時(shí)根據(jù)這種概率分布在純策略中隨機(jī)選擇加以實(shí)施。純策略可視為混合策略的特例，也就是對(duì)某個(gè)純策略賦予概率1而對(duì)其他純策略賦予概率0的混合策略。5、簡(jiǎn)要分析擴(kuò)展型博弈的構(gòu)成要素。（1）參與人集合；虛擬參與人——自然。（2）行動(dòng)順序：誰(shuí)在什么時(shí)候行動(dòng)。（3）參與人的行動(dòng)空間：每次行動(dòng)時(shí)，局中人可進(jìn)行的選擇（4）參與人的信息集：信息是參與人有關(guān)博弈的知識(shí)，如有關(guān)“自然”的選擇、其他參與人的特征和行動(dòng)的知識(shí)等。（5）參與人的支付函數(shù)：指在一個(gè)特定策略組合下參與人得到的確定（期望）效用水平（6）外生事件的概率分布。6、如何理解完全信息動(dòng)態(tài)博弈下的純策略和行動(dòng)？行動(dòng)與策略行動(dòng)：是參與人在博弈的某個(gè)時(shí)點(diǎn)（某個(gè)信息集）的決策變量。行動(dòng)組合：參與人的行動(dòng)的有序集。策略：是參與人在給定信息集情況下的行動(dòng)規(guī)則，它規(guī)定參與人在什么時(shí)候選擇什么行動(dòng)。在靜態(tài)博弈中，策略和行動(dòng)是等價(jià)的。在動(dòng)態(tài)博弈中，策略在給定信息集下完整的行動(dòng)方案，與行動(dòng)是不同的。7、理解子博弈和掌握逆向歸納法求解思想。子博弈是指由原擴(kuò)展型博弈中的一個(gè)決策節(jié)點(diǎn)與它的所有后續(xù)節(jié)點(diǎn)組成的博弈。一個(gè)擴(kuò)展式表述博弈的子博弈是原博弈的一部分，它應(yīng)滿(mǎn)足下列條件：（1）.始于單結(jié)信息集的決策結(jié)x（但不包括原博弈的初始結(jié)）。⑵.包含博弈樹(shù)中策結(jié)x的所有后續(xù)結(jié)（包括終點(diǎn)結(jié)）。（3）.沒(méi)有對(duì)任何信息集形成分割。逆向歸納法思想分析：有限博弈一定存在一個(gè)最后的決策結(jié)（其直接后續(xù)結(jié)是終點(diǎn)結(jié)）的集合，在該決策結(jié)上行動(dòng)的參與人將選擇一個(gè)最大化自己的支付的行動(dòng)；給定這個(gè)參與人的行動(dòng)，倒數(shù)第二個(gè)決策結(jié)上的參與人將選擇一個(gè)可行的行動(dòng)最大化自己的支付；如此類(lèi)推，直至初始結(jié)。該倒推過(guò)程完成時(shí)得到了一條路徑，該路徑給出了每一個(gè)參與人的一個(gè)特定的策略，它是一個(gè)納什均衡（子博弈精煉納什均衡）。逆向歸納法實(shí)質(zhì)是重復(fù)剔除嚴(yán)格劣策略方法在擴(kuò)展式博弈中的運(yùn)用。8、比較合作博弈和非合作博弈。合約強(qiáng)制力不同：在合作博弈中，協(xié)議有外在力量保證強(qiáng)制執(zhí)行；在非合作博弈中，協(xié)議沒(méi)有外在力量保證強(qiáng)制執(zhí)行。研究重點(diǎn)不同：合作博弈研究的重點(diǎn)是聯(lián)盟，非合作博弈的重點(diǎn)是個(gè)體。9、占優(yōu)戰(zhàn)略均衡和納什均衡的聯(lián)系與區(qū)別：納什均衡，又稱(chēng)為非合作博弈均衡，是博弈論的一個(gè)重要術(shù)語(yǔ)。在這一均衡中，每個(gè)博弈參與人都確信，在給定其他參與人戰(zhàn)略決定的情況下，他選擇了最優(yōu)戰(zhàn)略以回應(yīng)對(duì)手的戰(zhàn)略。也就是說(shuō)，所有人的戰(zhàn)略都是最優(yōu)的。占優(yōu)戰(zhàn)略是博弈論（gametheory）中的專(zhuān)業(yè)術(shù)語(yǔ)，所謂的占優(yōu)戰(zhàn)略就是指無(wú)論競(jìng)爭(zhēng)對(duì)手如何反應(yīng)都屬于本企業(yè)最佳選擇的競(jìng)爭(zhēng)策略。占優(yōu)戰(zhàn)略均衡必定是納什均衡，因?yàn)榫种腥说恼純?yōu)戰(zhàn)略是對(duì)所有其他局中人的任何戰(zhàn)略組合情況下的最優(yōu)戰(zhàn)略選擇，自然它也一定是對(duì)于所有其他局中人的某個(gè)特定戰(zhàn)略（其他局中人的最優(yōu)戰(zhàn)略）情況下的最優(yōu)戰(zhàn)略選擇。但反過(guò)來(lái)不成立，納什均衡不一定是占優(yōu)戰(zhàn)略均衡。顯然，占優(yōu)戰(zhàn)略均衡是重復(fù)剔除的占優(yōu)戰(zhàn)略均衡的一種特例。10、納什均衡的意義:納什均衡理論奠定了現(xiàn)代主流博弈理論和經(jīng)濟(jì)理論的根本基礎(chǔ)，其重要影響可以概括為以下六個(gè)方面：（1）改變了經(jīng)濟(jì)學(xué)的體系和結(jié)構(gòu)。非合作博弈論的概念、內(nèi)容、模型和分析工具等，均已滲透到微觀(guān)經(jīng)濟(jì)學(xué)、宏觀(guān)經(jīng)濟(jì)學(xué)、勞動(dòng)經(jīng)濟(jì)學(xué)、國(guó)際經(jīng)濟(jì)學(xué)、環(huán)境經(jīng)濟(jì)學(xué)等經(jīng)濟(jì)學(xué)科的絕大部分學(xué)科領(lǐng)域，改變了這些學(xué)科領(lǐng)域的內(nèi)容和結(jié)構(gòu)，成為這些學(xué)科領(lǐng)域的基本研究范式和理論分析工具，從而改變了原有經(jīng)濟(jì)學(xué)理論體系中各分支學(xué)科的內(nèi)涵。（2）擴(kuò)展了經(jīng)濟(jì)學(xué)研究經(jīng)濟(jì)問(wèn)題的范圍。原有經(jīng)濟(jì)學(xué)缺乏將不確定性因素、變動(dòng)環(huán)境因素以及經(jīng)濟(jì)個(gè)體之間的交互作用模式化的有效辦法，因而不能進(jìn)行微觀(guān)層次經(jīng)濟(jì)問(wèn)題的解剖分析。納什均衡及相關(guān)模型分析方法，包括擴(kuò)展型博弈法、逆推歸納法、子博弈完美納什均衡等概念方法，為經(jīng)濟(jì)學(xué)家們提供了深入的分析工具。（3）加強(qiáng)了經(jīng)濟(jì)學(xué)研究的深度。納什均衡理論不回避經(jīng)濟(jì)個(gè)體之間直接的交互作用，不滿(mǎn)足于對(duì)經(jīng)濟(jì)個(gè)體之間復(fù)

人人文庫(kù)> 全部分類(lèi)> 辦公材料 > 辦公文檔

溫馨提示

1. 本站所有資源如無(wú)特殊說(shuō)明，都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請(qǐng)下載最新的WinRAR軟件解壓。
2. 本站的文檔不包含任何第三方提供的附件圖紙等，如果需要附件，請(qǐng)聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶(hù)所有。
3. 本站RAR壓縮包中若帶圖紙，網(wǎng)頁(yè)內(nèi)容里面會(huì)有圖紙預(yù)覽，若沒(méi)有圖紙預(yù)覽就沒(méi)有圖紙。
4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
5. 人人文庫(kù)網(wǎng)僅提供信息存儲(chǔ)空間，僅對(duì)用戶(hù)上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理，對(duì)用戶(hù)上傳分享的文檔內(nèi)容本身不做任何修改或編輯，并不能對(duì)任何下載內(nèi)容負(fù)責(zé)。
6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容，請(qǐng)與我們聯(lián)系，我們立即糾正。
7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶(hù)因使用這些下載資源對(duì)自己和他人造成任何形式的傷害或損失。

博弈論復(fù)習(xí)分析和總結(jié)

文檔簡(jiǎn)介

溫馨提示

最新文檔

評(píng)論

博弈論復(fù)習(xí)分析和總結(jié)

文檔簡(jiǎn)介

溫馨提示

最新文檔

評(píng)論

相關(guān)文檔