版權(quán)說(shuō)明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請(qǐng)進(jìn)行舉報(bào)或認(rèn)領(lǐng)
文檔簡(jiǎn)介
第一章復(fù)習(xí)題2,4,5,6,7第一章參照答案2、設(shè)定一種博弈必須確定的方面包括:(1)博弈方,即博弈中進(jìn)行決策并承擔(dān)成果的參與者;(2)方略(空間),即博弈方選擇的內(nèi)容,可以是方向、取舍選擇,也可以是持續(xù)的數(shù)量水平等;(3)得益或得益函數(shù),即博弈方行為、方略選擇的對(duì)應(yīng)后果、成果,必須是數(shù)量或者可以折算成數(shù)量;(4)博弈次序,即博弈方行為、選擇的先后次序或者反復(fù)次數(shù)等;(5)信息構(gòu)造,即博弈方互相對(duì)其他博弈方行為或最終利益的理解程度;(6)行為邏輯和理性程度,即博弈方是根據(jù)個(gè)體理性還是集體理性行為,以及理性的程度等。假如設(shè)定博弈模型時(shí)不專門設(shè)定后兩個(gè)方面,就是隱含假定是完全、完美信息和完全理性的非合作博弈。4、“囚徒的困境”的內(nèi)在本源是在個(gè)體之間存在行為和利益互相制約的博弈構(gòu)造中,以個(gè)體理性和個(gè)體選擇為基礎(chǔ)的分散決策方式,無(wú)法有效地協(xié)調(diào)各方面的利益,并實(shí)現(xiàn)整個(gè)、個(gè)體利益共同的最優(yōu)。簡(jiǎn)樸地說(shuō),“囚徒的困境”問(wèn)題都是個(gè)體理性與集體理性的矛盾引起的。現(xiàn)實(shí)中“囚徒的困境”類型的問(wèn)題是諸多的。例如廠商之間價(jià)格戰(zhàn)、惡性的廣告競(jìng)爭(zhēng),初中、中等教育中的應(yīng)試教育等,其實(shí)都是“囚徒的困境”博弈的體現(xiàn)形式。5、首先可根據(jù)博弈方的行為邏輯,與否容許存在有約束力協(xié)議,分為非合作博弈和合作博弈兩大類。另一方面可以根據(jù)博弈方的理性層次,分為完全理性博弈和有限理性博弈兩大類,有限理性博弈就是進(jìn)化博弈。第三是可以根據(jù)博弈過(guò)程分為靜態(tài)博弈、動(dòng)態(tài)博弈和反復(fù)博弈三大類。第四是根據(jù)博弈問(wèn)題的信息構(gòu)造,根據(jù)博弈方與否均有有關(guān)得益和博弈過(guò)程的充足信息,分為完全信息靜態(tài)博弈、不完全信息靜態(tài)博弈、完全且完美信息動(dòng)態(tài)博弈、完全但不完美信息動(dòng)態(tài)博弈和不完全信息動(dòng)態(tài)博弈幾類。第五是根據(jù)得益的特性分為零和博弈、常和博弈和變和博弈。第六是根據(jù)博弈中博弈方的數(shù)量,可將博弈分為單人博弈、兩人博弈和多人博弈。第七是根據(jù)博弈方方略的數(shù)量,分為有限博弈和無(wú)限博弈兩類。9、(a)根據(jù)問(wèn)題的假設(shè),該博弈的得益矩陣和擴(kuò)展形表達(dá)分別如下:自然賺(35%) 虧(65%)3000100100開(kāi)我不開(kāi)自然自然虧(65%)賺(35%)(300)(100)(0)(100)不開(kāi)開(kāi)不開(kāi)開(kāi)我虧(65%)賺(35%)(300)(100)(0)(100)不開(kāi)開(kāi)不開(kāi)開(kāi)我(b)假如我是風(fēng)險(xiǎn)中性的,那么根據(jù)開(kāi)的期望收益與不開(kāi)收益的比較:0.35×300+0.65×0=105>100肯定會(huì)選擇開(kāi)。(c)假如成功的概率減少到0.3,那么由于這時(shí)候開(kāi)的期望收益與不開(kāi)的收益比較:0.30×300+0.70×0=90<100因此會(huì)選擇不開(kāi),方略肯定會(huì)變化。(d)假如我是風(fēng)險(xiǎn)規(guī)避的,開(kāi)的期望收益為:0.9×(0.35×300+0.65×0)=0.9×105=94.5<100因此也會(huì)選擇不開(kāi)。(e)假如我是風(fēng)險(xiǎn)偏好的,那么由于開(kāi)的期望收益為:1.2×(0.35×300+0.65×0)=1.2×105=126>100因此這時(shí)候肯定會(huì)選擇開(kāi)。10、首先需要注意的是,在該博弈方的得益單位不一樣,逃犯得到的是增長(zhǎng)或者減少的刑期(年),而看守得到的則是獎(jiǎng)金(元),因此除非先運(yùn)用效用概念折算成相似的單位,否則兩博弈方的得益互相之間不能比較和加減。直接采用單位不一樣的得益,該博弈的得益矩陣如下:看守路線一路線二-10,100010,010,0-10,1000逃路線一犯路線二該博弈的擴(kuò)展形表達(dá)如下:看守路線二路線二路線一路線一逃犯路線二路線一看守路線二路線二路線一路線一逃犯路線二路線一(-10,1000)(10,0)(10,0)(-10,1000)(-10,1000)(10,0)(10,0)(-10,1000)根據(jù)上述得益矩陣和擴(kuò)展形不難清晰,該博弈中兩博弈方的利益是對(duì)立的。雖然由于兩博弈方得益的單位不一樣,互相之間得益無(wú)法相加,因此無(wú)法判斷與否為零和博弈,但兩博弈方關(guān)系的性質(zhì)與猜硬幣等博弈相似,也是對(duì)立的。因此,該博弈同樣沒(méi)有兩博弈方都樂(lè)意接受的具有穩(wěn)定性的方略組合,兩博弈方最合理的方略都是以相似的概率隨機(jī)的選擇路線。補(bǔ)充習(xí)題:判斷下列論述與否對(duì)的,并作簡(jiǎn)樸分析。囚徒的困境博弈中兩個(gè)囚徒之因此會(huì)處在困境,無(wú)法得到較理想的成果,是由于兩囚徒都不在意坐牢時(shí)間長(zhǎng)短自身,只在意不能比對(duì)方坐牢的時(shí)間更長(zhǎng)。合作博弈就是博弈方采用互相合作態(tài)度的博弈。參照答案:錯(cuò)誤。結(jié)論恰恰相反,也就是囚徒的困境博弈中兩囚徒之因此處在困境,本源正是由于兩囚徒很在意坐牢的絕對(duì)時(shí)間長(zhǎng)短。此外,我們已開(kāi)始就假設(shè)兩囚徒都是理性經(jīng)濟(jì)人,而理性經(jīng)濟(jì)人都是以自身的(絕對(duì))利益,而不是相對(duì)利益為決策目的。不對(duì)的。合作博弈在博弈論中專門指博弈方之間可以到達(dá)和運(yùn)用有約束力協(xié)議限制行為選擇的博弈問(wèn)題,與博弈方的態(tài)度與否合作無(wú)關(guān)。博弈與游戲有什么關(guān)系?參照答案: 現(xiàn)代博弈論和經(jīng)濟(jì)學(xué)中的博弈一般指人們?cè)诮?jīng)濟(jì)、政治、軍事等活動(dòng)中的方略選擇,尤其是在有多種交互作用、方略互動(dòng)條件下的方略選擇和決策較勁。游戲則是指平常生活中的下棋打牌、賭勝博彩,以及田徑、球類等多種體育比賽。因此博弈和游戲之間當(dāng)然是有明顯區(qū)別的。但博弈和游戲之間其實(shí)也有重要的聯(lián)絡(luò),由于博弈與許多游戲之間在本質(zhì)特性方面有相似的特性:(1)均有一定的規(guī)則;(2)均有能用正或負(fù)的數(shù)值表達(dá),或能按照一定的規(guī)則折算成數(shù)值的成果;(3)方略至關(guān)重要;(4)方略和利益又互相依存性。正是由于存在這些共同的本質(zhì)特性,因此從研究游戲規(guī)律得出的結(jié)論可用來(lái)指導(dǎo)經(jīng)濟(jì)政治等活動(dòng)中的決策問(wèn)題,或者把這些決策問(wèn)題當(dāng)作游戲問(wèn)題研究。因此博弈在一定程度上可以理解成就是游戲。其實(shí)“博弈”的英文名稱“Game”的基本意義就是游戲。一種工人給一種老板干活,工資原則是100元。工人可以選擇與否偷懶,老板則選擇與否克扣工資。假設(shè)工人不偷懶有相稱于50元的負(fù)效用,老板想克扣工資則總有借口扣掉60元工資,工人不偷懶老板有150元產(chǎn)出,而工人偷懶是老板只有80元產(chǎn)出,但老板在支付工資之前無(wú)法懂得實(shí)際產(chǎn)出,這些狀況使雙方都懂得的。請(qǐng)問(wèn)假如老板完全可以看出工人與否偷懶,博弈屬于哪種類型?用得益矩陣或擴(kuò)展形表達(dá)該博弈并作簡(jiǎn)樸分析。假如老板無(wú)法看出工人與否偷懶,博弈屬于哪種類型?用得益矩陣或擴(kuò)展形表達(dá)并簡(jiǎn)樸分析。參照答案:工人老板工人老板老板偷懶不偷懶克扣克扣不克扣不克扣(40,40))(100,-20))(-10,110))(50,50))根據(jù)上述得益狀況可以看出,在該博弈中偷懶對(duì)工人總是有利的,克扣對(duì)老板也總是有利的,因此在雙方都只考慮自己的利益最大化的狀況下,該博弈的一般成果應(yīng)當(dāng)是工人偷懶和老板克扣。由于老板在決定與否克扣工資欠無(wú)法清晰工人與否偷懶,因此該博弈可以看作靜態(tài)博弈。由于雙方仍然均有有關(guān)得益的充足信息,因此是一種完全信息的靜態(tài)博弈。該博弈用得益矩陣表達(dá)如下:老板克扣不克扣工人偷懶40,40100,-20不偷懶-10,11050,50 其實(shí),根據(jù)該得益矩陣不難得到與上述動(dòng)態(tài)博弈相似的結(jié)論,仍然是工人會(huì)選擇偷懶和老板會(huì)選擇克扣。這個(gè)博弈實(shí)際上與囚徒的困境是相似的。第二章復(fù)習(xí)題4,5,7,9,11,12第二章參照答案4、多重納什均衡不會(huì)影響納什均衡的一致預(yù)測(cè)性質(zhì)。這是由于一致預(yù)測(cè)性不是指各個(gè)博弈方有一致的預(yù)測(cè),而是指每個(gè)博弈方自己的方略選擇與自己的預(yù)測(cè)一致。對(duì)博弈分析重要的不利影響是,當(dāng)博弈存在多重納什均衡,并且互相之間沒(méi)有明確的優(yōu)劣之分時(shí),會(huì)導(dǎo)致預(yù)測(cè)分析的困難,影響以納什均衡為關(guān)鍵的博弈分析的預(yù)測(cè)能力。存在帕累托上策均衡、風(fēng)險(xiǎn)上策均衡、聚點(diǎn)均衡或有關(guān)均衡的也許性,并且博弈方互相之間有足夠的默契和理解時(shí),多重納什均衡導(dǎo)致的不利影響會(huì)較小。5、博弈方2LCR2,01,14,23,41,22,31,30,23,0博 T弈M方 B1首先,運(yùn)用嚴(yán)格下策反復(fù)消去法的思想,不難發(fā)目前博弈方1的方略中,B是相對(duì)于T的嚴(yán)格下策,因此可以把該方略從博弈方1的方略空間中消去。把博弈方1的B方略消去后又可以發(fā)現(xiàn),博弈方2的方略中C是相對(duì)于R的嚴(yán)格下策,從而也可以消去。在下面的得益矩陣中對(duì)應(yīng)方略和得益處劃水平線和垂直線表達(dá)消去了這些方略。博弈方2LCR2,01,14,23,41,22,31,30,23,0博 T弈M方 B1兩個(gè)博弈方各消去一種方略后的博弈是如下的兩人2×2博弈,已經(jīng)不存在任何嚴(yán)格下策。再運(yùn)用劃線或箭頭法,很輕易發(fā)現(xiàn)這個(gè)2×2博弈有兩個(gè)純方略納什均衡(M,L)和(T,R)。博弈方2LR2,04,23,42,3博 T弈M方 1由于兩個(gè)純方略納什均衡之間沒(méi)有帕累托效率意義上的優(yōu)劣關(guān)系,雙方利益有不一致性,因此假如沒(méi)有其他深入的信息或者決策機(jī)制,一次性靜態(tài)博弈的成果不能肯定。由于雙方在該博弈中也許采用混合方略,因此實(shí)際上該博弈的成果可以是4個(gè)純方略組合中的任何一種。7、我們用反應(yīng)函數(shù)法來(lái)分析這個(gè)博弈。先討論博弈方1的選擇。根據(jù)問(wèn)題的假設(shè),假如博弈方2選擇金額s2(0≤s2≤10000),則博弈方1選擇s1的利益為:當(dāng)S1≤10000s2當(dāng)S當(dāng)S1≤10000s2當(dāng)S1≤10000s2因此博弈方1采用s1=1000—s2時(shí),能實(shí)現(xiàn)自己的最大利益u(s1)=s1=1000—s2。因此s1=1000—s2就是博弈方1的反應(yīng)函數(shù)。博弈方2與博弈方1的利益函數(shù)和方略選擇是完全相似的,因此對(duì)博弈方1所選擇的任意金額s1,博弈方2的最優(yōu)反應(yīng)方略,也就是反應(yīng)函數(shù)是s2=1000-s1。顯然,上述博弈方1的反應(yīng)函數(shù)與博弈方2的反應(yīng)函數(shù)是完全重疊的,因此本博弈有無(wú)窮多種納什均衡,所有滿足該反應(yīng)函數(shù),也就是s1+s2=10000的數(shù)組(s1,s2)都是本博弈的純方略納什均衡。假如我是兩個(gè)博弈方中的一種,那么我會(huì)規(guī)定得到5000元。理由是在該博弈的無(wú)窮多種純方略納什均衡中,(5000,5000)既是比較公平和輕易被雙方接受的,也是輕易被雙方同步想到的一種,因此是一種聚點(diǎn)均衡。9、(1)第i個(gè)廠商的利潤(rùn)函數(shù)為:πi=pqi-ciqi=(a-qi-qj)qi-ciqi將利潤(rùn)函數(shù)對(duì)產(chǎn)量求導(dǎo)并令其為0得:=a-qj-ci-2qi=0解得兩個(gè)廠商的反應(yīng)函數(shù)為:qj=(a-qj-ci)/2或詳細(xì)寫成:q1=(a-q2-c1)/2q2=(a-q1-c2)/2(2)當(dāng)0<ci<a/2時(shí),我們根據(jù)上述兩個(gè)廠商的反應(yīng)函數(shù),直接求出兩個(gè)廠商的納什均衡產(chǎn)量分別為:q1=q2=(3)當(dāng)c1<c2<a,但2c2>a+c1時(shí),根據(jù)反應(yīng)函數(shù)求出來(lái)的廠商2產(chǎn)量q2q1=q*=因此這種狀況下的納什均衡為[(a-c1)/2,0]。11、(1)兩個(gè)候選人競(jìng)爭(zhēng)時(shí),純方略納什均衡為(0.5,0.5),即兩個(gè)假選人都宣布自己是中間立場(chǎng)。我們用直接分析法加以證明:首先,假如一種候選人的立場(chǎng)是0.5而另一種候選人的立場(chǎng)不是0.5,那么不難證明有者將獲勝而后者必然失敗,由于根據(jù)投票原則前者得票比例將不小于0.5,那么雙方均有二分之一機(jī)會(huì)獲勝。因此對(duì)任意一種候選人來(lái)說(shuō),都是不管對(duì)方選擇的立場(chǎng)與否為0.5,0.5都是自己的對(duì)的選擇,也就是說(shuō)0.5都是上策。因此(0.5,0.5)是本博弈的一種上策均衡,當(dāng)然也是納什均衡。實(shí)際上,雖然兩個(gè)假選人開(kāi)始時(shí)沒(méi)有立即找到最佳立場(chǎng)0.5,他也會(huì)通過(guò)邊競(jìng)爭(zhēng)邊學(xué)習(xí)很快調(diào)整到該納什均衡方略。由于當(dāng)兩個(gè)候選人的立場(chǎng)都不在0.5時(shí),誰(shuí)更靠近0.5誰(shuí)選票就多,觀測(cè)到這一點(diǎn),兩個(gè)候選人必然都會(huì)向0.5靠攏,直到最終都取0.5的立場(chǎng)。當(dāng)兩個(gè)候選人都選擇0.5時(shí),各自都能得到二分之一選民的支持,誰(shuí)可以取勝往往取決于雙方競(jìng)選立場(chǎng)以外的東西,例如候選人的個(gè)人魅力和演說(shuō)才能等。(2)三個(gè)候選人時(shí)問(wèn)題比較復(fù)雜。由于當(dāng)三個(gè)候選人的立場(chǎng)都處在中點(diǎn)附近位置時(shí),立場(chǎng)夾在其他兩個(gè)候選人之間的候選人只能獲得很少的選票,從而他(或她)有轉(zhuǎn)變成比“左”傾者更“左”傾,或比右傾者更右傾立場(chǎng)的動(dòng)機(jī)。這時(shí)候三個(gè)候選人在中點(diǎn)附近處在一種不穩(wěn)定的平衡。(0.5±δ,0.5±ε,0.5±ξ),其中δ,ε和ξ是小正數(shù)。假如考慮到現(xiàn)實(shí)中競(jìng)選者的立場(chǎng)不也許由一維數(shù)學(xué)坐標(biāo)精確描述,選民對(duì)候選立場(chǎng)差異的辨別能力也不也許很精細(xì),那么當(dāng)候選人的立場(chǎng)堵靠近中點(diǎn)時(shí),選民很難識(shí)別究竟哪個(gè)候選人偏右傾或“左”傾某些,因此三個(gè)候選人的立場(chǎng)都靠近中點(diǎn)時(shí)可理解為是相似的。這樣,三個(gè)候選人與兩個(gè)候選人競(jìng)選的納什均衡方略可以當(dāng)作是相似的,即都選擇(0.5,0.5,0.5)。三個(gè)候選人時(shí)在數(shù)學(xué)上還也許求出其他純方略納什均衡。如方略組合(0.4,0.6,0.8)就是其中一種。由于當(dāng)三個(gè)候選人分別選擇這些立場(chǎng)時(shí),每項(xiàng)悠悠民選人沒(méi)有變化自己立場(chǎng)的動(dòng)機(jī),由于該方略組合的成果是他取勝,而第二和第三個(gè)候選人則單獨(dú)變化自己的立場(chǎng)并不能改善自己的命運(yùn),無(wú)論只是稍微變化自己的立場(chǎng),還是與其他候選人的相對(duì)立場(chǎng)發(fā)生逆轉(zhuǎn),都沒(méi)有限勝的機(jī)會(huì)。因此根據(jù)納什均衡的定義,這是一種純方略的納什均衡。類似的熏略組合尚有許多。不過(guò),雖然在數(shù)學(xué)上這些納什均衡完全符合納什均衡的定義,不過(guò)它們?cè)诂F(xiàn)實(shí)選舉問(wèn)題中的意義卻并不大,由于這種納什均衡自身只是弱均衡(部分博弈方變化方略不損害自己的利益),并且部分博弈方(第二、第三個(gè)候選人)屬于經(jīng)典的“破壞者”,他們的方略變化不影響自己的利益,但卻會(huì)對(duì)其他博弈方的利益產(chǎn)生決定性的影響,因此這些納什均衡其實(shí)是不穩(wěn)定的,不會(huì)是現(xiàn)實(shí)中的均衡成果。上述博弈模型不僅在政治選舉問(wèn)題中故意義,在分析經(jīng)濟(jì)經(jīng)營(yíng)活動(dòng)中的選址和產(chǎn)品定位等問(wèn)題方面也非常有用。讀者可以自行找某些例子進(jìn)行分析。12、在納什均衡分析的基礎(chǔ)上,再深入考慮運(yùn)用其他均衡概念或分析措施,如風(fēng)險(xiǎn)上策均衡等進(jìn)行分析。首先,很輕易根據(jù)劃線法等找出本博弈的兩個(gè)純方略納什均衡(U,R)和(D,L)。本博奕尚有一種混合方略納什均衡,即兩博弈方各自以2/3、1/3的概率在自己的兩個(gè)方略U、D和L、R中隨機(jī)選擇。但本博弈的兩個(gè)純方略納什均衡中沒(méi)有帕累托上策均衡,兩個(gè)博弈方各偏好其中一種,并且另一種方略組合(U,L)從整體利益角度優(yōu)于這兩個(gè)純方略納什均衡,因此博弈方很難在兩個(gè)純方略納什均衡的選擇上到達(dá)共識(shí)?;旌戏铰约{什均衡的效率也不是很高,由于有一定概率會(huì)出現(xiàn)(D,R)的成果。根據(jù)風(fēng)險(xiǎn)上策均衡的思想進(jìn)行分析,當(dāng)兩個(gè)博弈方各自的兩種方略均有二分之一也許性被選屆時(shí),本博弈的兩個(gè)純略納什均衡都不是風(fēng)險(xiǎn)上策均衡,而方略組合(U,L)卻是風(fēng)險(xiǎn)上策均衡。由于此時(shí)博弈方1選擇U的期望得益是4,選擇D的期望是益是3.5,博奕方2選擇L的期望得益是4,選擇R的期望得益是3.5。因此當(dāng)兩個(gè)博弈方考慮到上述風(fēng)險(xiǎn)原因時(shí),他們的選擇將是(U,L),成果反而比較理想。假如博弈問(wèn)題的基本背景支持,對(duì)本博弈還可以用有關(guān)均衡的思想進(jìn)行分析。讀者可自己作某些討論。補(bǔ)充習(xí)題:判斷下列表述與否對(duì)的,并作簡(jiǎn)樸分析:納什均衡即任一博弈方單獨(dú)變化方略都只能得到更小利益的方略組合。假如以博弈有兩個(gè)純方略納什均衡,則一定還存在一種混合方略均衡。上策均衡一定是帕累托最優(yōu)的均衡嗎?并闡明哪一種均衡更穩(wěn)定些。參照答案:錯(cuò)誤。只要任一博弈方單獨(dú)變化方略不會(huì)增長(zhǎng)得益,方略組合就是納什均衡了。單獨(dú)變化方略只能得到更小得益的方略組合是嚴(yán)格納什均衡,是比納什均衡更強(qiáng)的均衡概念。對(duì)的。這是納什均衡的基本性質(zhì)之一——奇數(shù)性所保證的。不對(duì)的。囚徒的困境博弈中的(坦白,坦白)就是上策均衡(同步也是納什均衡),但該均衡顯然不是帕累托最優(yōu)的,否則就不會(huì)稱其為囚徒的困境了。下面的得益矩陣表達(dá)一種兩人靜態(tài)博弈。問(wèn)當(dāng)a、b、c、d、e、f、g和h滿足什么條件時(shí),該博弈:存在嚴(yán)格上策均衡;可以用嚴(yán)格下策反復(fù)消去法簡(jiǎn)化或找出博弈的均衡;存在純方略納什均衡。博弈方2LR博弈方1Ua,bc,dDe,fg,h參照答案:嚴(yán)格上策均衡是由各個(gè)博弈方的嚴(yán)格上策構(gòu)成的方略組合。對(duì)于博弈方1,假如a>e且c>g,則U是相對(duì)于D的嚴(yán)格上策;假如a<e且c<g,則D是相對(duì)于U的嚴(yán)格上策。對(duì)于博弈方2,假如b>d且f>h,則L是相對(duì)于R的嚴(yán)格上策;假如b<d且f<h,則R是相對(duì)于L的嚴(yán)格上策。上述兩個(gè)博弈方各自有兩種嚴(yán)格上策的相對(duì)得益狀況的組合,總共也許構(gòu)成四種嚴(yán)格上策均衡。只要出現(xiàn)a>e且c>g、a<e且c<g、b<d且f>h或b<d且f<h四種狀況中的任何一種,就可以用嚴(yán)格下策反復(fù)消去法簡(jiǎn)化或直接求出博弈的均衡,由于這個(gè)時(shí)候D、U、R、L分別是對(duì)應(yīng)博弈方相對(duì)于各自另一方略的嚴(yán)格下策。純方略納什均衡是個(gè)博弈方單獨(dú)變化方略都無(wú)利可圖的方略組合。在上述博弈中,只要滿足a≥e且b≥d、c≥g且d≥b、e≥a且f≥h,g≥c且h≥f四種狀況中的任何一種,就存在純方略納什均衡。3. 假如雙寡頭壟斷的市場(chǎng)需求函數(shù)是p(Q)=a-Q,兩個(gè)廠商都無(wú)固定生產(chǎn)成本,邊際成本為相似的c。假如兩個(gè)廠商都只能要么生產(chǎn)壟斷產(chǎn)量的二分之一,要么生產(chǎn)古諾產(chǎn)量,證明這是一種囚徒困境型的博弈。參照答案: 根據(jù)市場(chǎng)需求函數(shù)p(Q)=a-Q和廠商的生產(chǎn)成本,不難計(jì)算出該市場(chǎng)的壟斷產(chǎn)量為qm=(a-c)/2,雙寡頭壟斷的古諾產(chǎn)量(納什均衡產(chǎn)量)為qc=(a-c)/3。兩個(gè)廠商都生產(chǎn)壟斷產(chǎn)量的二分之一(a-c)/4時(shí),各自的利潤(rùn)為兩個(gè)廠商都產(chǎn)生古諾產(chǎn)量(a-c)/3時(shí),各自的利潤(rùn)為:若一種廠商產(chǎn)生壟斷產(chǎn)量的二分之一(a-c)/4,,另一方生產(chǎn)古諾產(chǎn)量(a-c)/3,前者利潤(rùn)為:后者利潤(rùn)為:因此上述博弈用下列得益矩陣表達(dá)就是:企業(yè)乙qm/2qc企業(yè)甲qm/2(a-c)2/8,(a-c)2/85(a-c)2/48,5(a-c)2/36qc5(a-c)2/36,5(a-c)2/48(a-c)2/9,(a-c)2/9分析這個(gè)得益矩陣可以看出,由于(a-c)2/8<5(a-c)2/36,5(a-c)2/48<(a-c)2/9,因此qm/2對(duì)兩個(gè)廠商都是相對(duì)于qc的嚴(yán)格下策。因此該博弈唯一的納什均衡,也是上策均衡,是(qc,qc)。這個(gè)納什均衡的雙方得益(a-c)2/9,顯然不如雙方都采用qm/2的得益(a-c)2/8,因此這個(gè)博弈是一種囚徒困境型的博弈。4.試用反應(yīng)函數(shù)法尋找博弈的純方略納什均衡及混合方略的納什均衡:博弈方乙紅黑3,10,00,01,4博 紅弈黑 方甲(答案略)第三章復(fù)習(xí)題1,3,4,6第三章參照答案1、子博弈完美納什均衡即動(dòng)態(tài)博弈中具有這樣特性的方略組合;它們不僅在整個(gè)博弈中構(gòu)成納什均衡,并且在所有的子博弈中也都構(gòu)成納什均衡。在動(dòng)態(tài)博弈分析中引進(jìn)子博弈完美納什均衡概念的原因在于,動(dòng)態(tài)博弈中各個(gè)博弈方的行為有先后次序,因此往往會(huì)存在相機(jī)抉擇問(wèn)題,也就是博弈方也許在博弈過(guò)程中變化均衡方略設(shè)定的行為,從而使得均衡方略存在可信性問(wèn)題,并且納什均衡無(wú)法消除這種問(wèn)題,只有子博弈完美納什均衡可以處理它。子博弈完美納什均衡一定是納什均衡,但納什均衡不一定是子博弈完美納什均衡。因此一種動(dòng)態(tài)博弈的所有子博弈完納什均衡是該博弈所有納什均衡的一種子集。3、博弈方的理性問(wèn)題對(duì)動(dòng)態(tài)博弈分析的影響肯定比對(duì)靜態(tài)博弈分析的影響更大。雖然博弈方的理性問(wèn)題,博弈方實(shí)際理性與博弈分析假設(shè)的有差距,對(duì)博弈分析的影響在靜態(tài)博弈分析中也存在,教材第二章多次提到了這個(gè)問(wèn)題,但博弈方的理性問(wèn)題對(duì)動(dòng)態(tài)博弈分析的影響肯定更大。由于以子博弈完美納什均衡和逆推歸納法為關(guān)鍵的動(dòng)態(tài)博弈分析,對(duì)博弈方理性的規(guī)定比靜態(tài)博弈的納什均衡分析的更高,并且博弈方理性的缺陷還會(huì)引出理性判斷的動(dòng)態(tài)調(diào)整等更復(fù)雜的問(wèn)題。例如某個(gè)博弈方由理性問(wèn)題在某時(shí)刻“出錯(cuò)誤”,采用偏離子博弈完美納什均衡的行為、途徑,這時(shí)候背面階段行為博弈方的判斷和行為選擇就會(huì)有困難。這種困難是動(dòng)態(tài)博弈所特有的,在靜態(tài)博弈分析中并不存在。4、括號(hào)中的第一種數(shù)字代表乙的得益,第二個(gè)數(shù)字代表甲的得益,因此a表達(dá)乙的得益,而b表達(dá)甲的得益。在第三階段,假如a<0,則乙會(huì)選擇不打官司。這時(shí)逆推回第二階段,甲會(huì)選擇不分,由于分的得益2不不小于不分的得益4。再逆推回第一階段,乙肯定會(huì)選擇不錯(cuò),由于借的最終益0比不借的得出終得益1小。第三階段,假如a>0,則乙輪到選擇的時(shí)候會(huì)選擇打官司,此時(shí)雙方得益是(a,b)。逆推回第二階段,假如b>2,則甲在第二階段仍然選擇不分,這時(shí)候雙方得益為(a,b)。在這種狀況下再逆推回第一階段,那么當(dāng)a<1時(shí)乙會(huì)選擇不借,雙方得益(1,0),當(dāng)a>1時(shí)乙肯定會(huì)選擇借,最終雙方得益(a,b)。在第二階段假如b<2,則甲會(huì)選擇分,此時(shí)雙方得益為(2,2)。再逆推回第一階段,乙肯定選擇借,由于借的得益2不小于不借的得益1,最終雙方的得益(2,2)。根據(jù)上述分析我們可以看出,該博弈比較明確可以預(yù)測(cè)的成果有這樣幾種狀況:(1)a<0,此時(shí)本博弈的成果是乙在第一階段不樂(lè)意借給對(duì)方,結(jié)束博弈,雙方得益(1,0),不管這時(shí)候b的值是多少;(2)0<a<1且b>2,此時(shí)博弈的成果仍然是乙在第一階段選擇不錯(cuò),結(jié)束博弈,雙方得益(1,0);(3)a>1且b>2,此時(shí)博弈的成果是乙在第一階段選擇借,甲在第二階段選擇不分,乙在第三階段選擇打,最終成果是雙方得益(a,b);(4)a>0且b<2,此時(shí)乙在第一階段會(huì)選擇借,甲在第二階段會(huì)選擇分,雙方得益(2,2)。要本博弈的“威脅”,即“打”是可信的,條件是a>0。要本博弈的“承諾”,即“分”是可信的,條件是a>0且b<2。注意上面的討論中沒(méi)有考慮a=0、a=1、b=2的幾種狀況,由于這些時(shí)候博弈方的選擇很難用理論措施確定和預(yù)測(cè)。不過(guò)最終的成果并不會(huì)超過(guò)上面給出的范圍。6、首先,設(shè)三個(gè)廠商的產(chǎn)量分別為q1、q2和q3.三個(gè)廠商的利潤(rùn)函數(shù)為:π1=(100—q1—q2—q3)q1—2q1π2=(100—q1—q2—q3)q1—2q2π3=(100—q1—q2—q3)q1—2q3根據(jù)逆推歸納法,先分析第二階段是廠商3的選擇。將廠商1的利潤(rùn)函數(shù)對(duì)其產(chǎn)量求偏導(dǎo)數(shù)并令其為0得:=100—q1—q2—2q3—2=0因此廠商3的反應(yīng)函數(shù)為:q3=(98—q1—q2)/2再分析第一階段是廠商1和廠商2的決策。先把廠商3的反應(yīng)函數(shù)代入廠商1和廠商2的利潤(rùn)函數(shù)得:π1=(100—q1—q2—q3)q1—2q1=q1π2=(100—q1—q2—q3)q2—2q2=q2分別對(duì)q1和q2求偏導(dǎo)數(shù)并令為0得:-q1=0-q2=0聯(lián)立兩個(gè)方程可解得q1=q2=98/3。再代入廠商3的反應(yīng)函數(shù)得q3=(98-q1-q2)/2=98/6。把三個(gè)廠商產(chǎn)量代入各自的利潤(rùn)函數(shù),可得三個(gè)廠商的利潤(rùn)分別為4802/9、4802/9和2401/9。補(bǔ)充習(xí)題:判斷下列論述與否對(duì)的,并進(jìn)行分析:在動(dòng)態(tài)博弈中,由于后行為的博弈方可以先觀測(cè)對(duì)方行為后再選擇行為,因此總是有利的。逆推歸納法并不能排除所有不可置信的威脅。假如動(dòng)態(tài)博弈的一種方略組合在均衡途徑上是納什均衡,就構(gòu)成了該動(dòng)態(tài)博弈的一種子博弈完美納什均衡。參照答案:不對(duì)的。實(shí)際上動(dòng)態(tài)博弈中先行為的博弈方往往有先行優(yōu)勢(shì),因此常常是先行為的博弈方更有利而不是后行為的博弈方有利。不對(duì)的。逆推歸納法最主線的特性就是能排除動(dòng)態(tài)博弈中的所有不可信的行為,包括不可信的威脅和不可信的承諾。由于逆推歸納法使根據(jù)最大利益原則選擇博弈方每階段行為的,并且都考慮到了后續(xù)階段的行為選擇,因此用逆推歸納法找出的均衡方略組合中不也許包括不符合博弈方利益的不可信行為選擇。不對(duì)的。由于動(dòng)態(tài)博弈的子博弈完美納什均衡不僅規(guī)定在均衡途徑上是納什均衡,并且還規(guī)定在非均衡途徑上也是納什均衡。兩個(gè)兄弟分一塊冰激凌。哥哥先提出一種分割比例,弟弟可以接受或拒絕,接受則按哥哥的提議分割,若拒絕就自己提出一種比例。但這時(shí)候冰激凌已化得只剩1/2了,對(duì)弟弟提議的比例哥哥也可以接受或拒絕,若接受則按弟弟的提議分割,若拒絕冰激凌會(huì)所有化光。由于兄弟之間不應(yīng)當(dāng)做損人不利己的是,因此我們假設(shè)接受和拒絕利益相似時(shí)兄弟倆都會(huì)接受。求該博弈的子博弈完美納什均衡。假如冰激凌每階段只化掉1/3,博弈的子博弈完美納什均衡是什么?參照答案:哥弟哥出S1不接受,出S2接受(S1,1-S1)接受哥弟哥出S1不接受,出S2接受(S1,1-S1)接受不接受,出S2(S2/2,(1-S2)/2))(0,0) 運(yùn)用逆推歸納法先分析最終一階段哥的選擇。由于只要接受的利益不少于不接受的利益哥就會(huì)接受,因此在這個(gè)階段只要弟的方案滿足S2/2≥0,也就是S2≥0,哥就會(huì)接受,否則不會(huì)接受。由于冰激凌的份額不也許是負(fù)數(shù),因此該條件實(shí)際上必然是成立的,也就是說(shuō)由于哥不接受弟的方案冰激凌會(huì)所有化掉,因此任何方案哥都會(huì)接受。 目前回到前一階段弟的選擇。由于弟懂得后一階段哥的選擇措施,因此懂得假如不接受前一階段哥提出的比例,自己可以取S2=0,獨(dú)享此時(shí)尚未化掉的1/2塊冰激凌;假如選擇接受前一階段哥的提議,那么自己將得到1-S1,顯然只要1-S1≥1/2,即S1≤1/2,弟就會(huì)接受哥的提議。 再回到第一階段哥的選擇。哥清晰后兩個(gè)階段雙方的選擇邏輯和成果,因此他在這一階段選擇S1=1/2,正是可以被弟接受的自己的最大程度份額,超過(guò)這個(gè)份額將什么都不能得到,因此S1=1/2是最佳選擇。 綜上,該博弈的子博弈完美納什均衡是:哥哥開(kāi)始時(shí)就提議按(1/2,1/2)分割,弟弟接受。 每階段只化掉1/3的狀況請(qǐng)自己分析。假如學(xué)生在考試之前全面復(fù)習(xí),考好的概率為90%,假如學(xué)生只復(fù)習(xí)一部分重點(diǎn),則有50%的概率考好。全面復(fù)習(xí)花費(fèi)的時(shí)間t1=100小時(shí),重點(diǎn)復(fù)習(xí)之需要花費(fèi)t2=20小時(shí)。學(xué)生的效用函數(shù)為:U=W-2e,其中W是考試成績(jī),有高下兩種分?jǐn)?shù)Wh和Wl,e為努力學(xué)習(xí)的時(shí)間。問(wèn)老師怎樣才能促使學(xué)生全面復(fù)習(xí)?參照答案: 本題中老師的調(diào)控手段是高分和低分的水平,或者高分和低分的差距,老師給學(xué)生高下分并沒(méi)有成本,老師也不用考慮自己的收益或效用。學(xué)生00學(xué)生00全面重點(diǎn)高分(0.9)0.9000()(900.8()(((((((((((((((((()()高分(0.5)低分(0.1)低分(0.5)(Wh-200))(Wl-200))(Wh-40))(Wl-40))學(xué)生選擇全面復(fù)習(xí)的期望得益是U1=0.9(Wh-200)+0.1(Wl-200)重點(diǎn)復(fù)習(xí)的期望得益是U2=0.5(Wh-40)+0.5(Wl-40)只有當(dāng)U1U2時(shí)學(xué)生才會(huì)選擇全面復(fù)習(xí)。根據(jù)U1U2我們可以算出Wh-Wl400。這就是老師能有效全面復(fù)習(xí)需要滿足的條件。其實(shí)在獎(jiǎng)學(xué)金與成績(jī)掛鉤時(shí),Wh-Wl也可以理解成不一樣等獎(jiǎng)學(xué)金的差額。4.考慮如下兩人博弈:有兩個(gè)局中人,A和B,A首先行動(dòng),他可以選擇“上”或“下”。假如A選擇上,則博弈結(jié)束,每個(gè)局中人得到支付2。假如A選擇下,則輪到B作決策,B可以選擇“左”或“右”。假如B選擇左,則雙方都只好到0;假如B選擇右,則A得3,B得1。1)請(qǐng)用博弈樹(shù)的形式表述這個(gè)博弈,并判斷這個(gè)博弈是完美信息博弈還是不完美信息博弈。2)用逆向法求出這個(gè)博弈的均衡成果,這個(gè)均衡成果是子博弈精煉納什均衡嗎?(參照答案略)5、1)運(yùn)用觸發(fā)方略求兩次反復(fù)下面得益矩陣表達(dá)的靜態(tài)博弈解。2)假如方略組合(L,D)的得益改為(2,7),請(qǐng)問(wèn)與否存在觸發(fā)方略使得第一階段實(shí)現(xiàn)得益(5,6)?LMR3,20,06,10,11,20,00,00,05,6參照答案:1)博弈方1第一階段選D,第二階段選U;博弈方2第一階段選R,假如第一階段成果是(D,R),則第二階段選L,否則選M。2)假如方略組合(L,D)的得益改為(2,7),則不存在觸發(fā)方略使得第一階段實(shí)現(xiàn)得益(5,6)。16、設(shè)兩個(gè)博弈方之間的一種三階1段動(dòng)態(tài)博弈如右圖所示,若a,b分別為10和15,該博弈LR的子博弈完美納什均衡方略是什么?2R—M—T與否也許成為該博弈的子2博弈完美納什均衡路基途徑,為何?(30,0)3)在什么狀況下博弈方2會(huì)獲得30MN或更高的得益。11(20,20)ST(a,b)(5,30)參照答案:1)該博弈的子博弈完美納什均衡方略是:博弈方1在第一階段選L,在第三階段選S,博弈方2在第二階段選N。2)不也許,由于R—M—T給博弈方1的得益5不不小于他在第一階段選L的得益30,因此該途徑對(duì)應(yīng)的方略組合不構(gòu)成納什均衡。3)當(dāng)a>30,b≥30時(shí),博弈方2會(huì)獲得30或更高的得益。第四章復(fù)習(xí)題2,3,6,82、火車站和機(jī)場(chǎng)餐飲商業(yè)服務(wù)的顧客往往都是一次性的,回頭客、??捅容^少,這些經(jīng)濟(jì)交易具有一次性博弈的特性,它們的價(jià)格總是較高而質(zhì)量又會(huì)差某些,顧客也會(huì)盡量不在這些地方購(gòu)置商品和消費(fèi)。在一般商業(yè)區(qū)和居民區(qū)的餐飲商業(yè)服務(wù)則回頭客和常客較多,有明顯的反復(fù)博弈特性,在居民區(qū)購(gòu)置商品和消費(fèi)的老顧客一般能得到比較公平、優(yōu)惠的價(jià)格,還能得到很好的服務(wù),甚至有些還可以信用消費(fèi)(賒賬),因此消費(fèi)者一般會(huì)比較放心地消費(fèi)。這就是現(xiàn)實(shí)生活中反復(fù)博弈和一次性博弈效率不一樣的經(jīng)典例子之一。3、從研究對(duì)象和問(wèn)題特性看,有限次反復(fù)博弈研究的重要是有明確結(jié)束時(shí)間的(合作、競(jìng)爭(zhēng)等)關(guān)系,無(wú)限次反復(fù)博弈研究的重要是沒(méi)有明確成果時(shí)間,或者較長(zhǎng)期的關(guān)系。從分析措施的角度,動(dòng)態(tài)博弈和反復(fù)博弈分析中常用的逆推歸納法在無(wú)限次反復(fù)博弈中無(wú)法直接運(yùn)用,由于沒(méi)有最終一次反復(fù)。因此無(wú)限次反復(fù)博弈分析的重要措施是構(gòu)造法,即根據(jù)特定效率意義等構(gòu)造了博弈完美納什均衡。此外,也可以運(yùn)用某些技巧處理問(wèn)題,如教材中運(yùn)用三階段討價(jià)還價(jià)博弈分析無(wú)限階段討價(jià)還價(jià)博弈的技巧。從博弈的成果看,無(wú)限次反復(fù)博弈的效率往往高于有限次反復(fù)博弈,有些在有限次反復(fù)博弈中無(wú)法實(shí)現(xiàn)的效率較高的成果,在無(wú)限次反復(fù)博弈中有也許實(shí)現(xiàn)。例如囚徒的困境型博弈的無(wú)限次反復(fù)博弈和有限次反復(fù)博弈就體現(xiàn)了這種差異。兩類反復(fù)博弈民間定理的差異也闡明了這一點(diǎn)。最終,在反復(fù)次數(shù)不多的有限次反復(fù)博弈中不一定要考慮得益貼現(xiàn)問(wèn)題,在我限次反復(fù)博弈問(wèn)題中這是必須考慮的。上述區(qū)別在理論方面最重要的啟發(fā)是重視有限次和無(wú)限次反復(fù)博弈的區(qū)別,辨別研究這兩類博弈問(wèn)題是非常重要的,在實(shí)踐方面的重要啟發(fā)是增進(jìn)和保持經(jīng)濟(jì)關(guān)系的長(zhǎng)期穩(wěn)定性,對(duì)于提高社會(huì)經(jīng)濟(jì)效率等常常有非常重要的意義。6、用畫(huà)線法輕易找出該博弈的兩個(gè)純方略納什均衡(T,L)和(M,R)。這兩個(gè)納什均衡的得益都帕累托劣于(B,S)。一次性博弈中效率較高的(B,S)不也許實(shí)現(xiàn)。但該博弈的構(gòu)造表明存在雙方合作的利益,在兩次反復(fù)博弈中也有構(gòu)造懲罰機(jī)制的條件,因此我會(huì)考慮運(yùn)用試探合作的觸發(fā)方略爭(zhēng)取部分實(shí)現(xiàn)(B,S),提高博弈的效率。我作為博弈方1會(huì)采用這樣的觸發(fā)方略:第一次反復(fù)采用B;第二次反復(fù)時(shí),假如前一次的成果是(B,S),則采用M,假如前一次的成果是其他,則采用T。假如另一種博弈方有同樣的分析能力,或者比較有經(jīng)驗(yàn),那么他(或她)也會(huì)采用相似的觸發(fā)方略:在第一次反復(fù)時(shí)采用S;第二次反復(fù)時(shí),假如前一次的成果是(B,S),則采用R,否則采用L。雙方采用上述觸發(fā)方略構(gòu)成一種子博弈完美納什均衡,因此是穩(wěn)定的。這時(shí)候前一次反復(fù)實(shí)現(xiàn)了(B,S),提高了博弈的效率。當(dāng)然,上述觸發(fā)方略也是有風(fēng)險(xiǎn)的,由于當(dāng)另一種博弈方不理解和沒(méi)有采用上述方略時(shí),我的得益會(huì)較低。當(dāng)然假如考慮到人們具有學(xué)習(xí)進(jìn)步的能力,并且缺乏分析和學(xué)習(xí)能力,采用效率較低方略的博弈方長(zhǎng)期中會(huì)逐漸被淘汰掉,那么采用上述觸發(fā)方略的合理性就得到了深入的支持。8、博弈方2LR8,64,104,86,42,00,2博 T弈M方 D1首先很輕易看出,博弈方1的D策相對(duì)于T策和M策都是嚴(yán)格下策,因此可以消去,消去博弈方1的D策后四個(gè)方略組合中不存在純方略納什均衡。根據(jù)混合方略納什均衡的計(jì)算措施,不難算出混合方略納什均衡為:博弈方1概率分布(1/2,1/2)在T和M中隨機(jī)選擇,博弈方2則以概率分布(1/3,2/3)在L和R中隨機(jī)選擇。由于上述靜態(tài)博弈是沒(méi)有純方略納什均衡的嚴(yán)格競(jìng)爭(zhēng)博弈,因此在有限次反復(fù)博弈和無(wú)限次反復(fù)博弈中,兩博弈方的均衡方略都是簡(jiǎn)樸復(fù)重原博弈的混合方略納什均衡。補(bǔ)充習(xí)題:判斷下列表述與否對(duì)的,并簡(jiǎn)樸討論:有限次反復(fù)博弈的子博弈完美納什均衡的最終一次反復(fù)必然是原博弈的一種納什均衡。參照答案:對(duì)的。由于最終一次反復(fù)就是動(dòng)態(tài)博弈的最終一種階段,根據(jù)子博弈完美納什均衡的規(guī)定,博弈方在該階段的選擇必須構(gòu)成納什均衡。由于最終一次反復(fù)就是原博弈自身,因此該納什均衡就是原博弈的一種納什均衡。無(wú)限次反復(fù)博弈均衡解的得益一定優(yōu)于原博弈的均衡解的得益。參照答案:錯(cuò)誤。對(duì)于嚴(yán)格競(jìng)爭(zhēng)的零和博弈,或者不滿足合作條件的其他許多博弈來(lái)說(shuō),無(wú)限制反復(fù)博弈并不意味著效率的提高,得益不一定高于原博弈的得益。寡頭的古諾產(chǎn)量博弈中,假如市場(chǎng)需求P=130-Q,邊際成本c=30且沒(méi)有固定成本,貼現(xiàn)因子δ=0.9,假如該市場(chǎng)有長(zhǎng)期的穩(wěn)定性,問(wèn)兩個(gè)廠商能否維持壟斷產(chǎn)量?參照答案:由于市場(chǎng)有長(zhǎng)期穩(wěn)定性,因此可以把兩寡頭之間的產(chǎn)量博弈看作無(wú)限次反復(fù)博弈,討論能否構(gòu)造雙方在壟斷產(chǎn)量上合作的子博弈完美納什均衡。 首先分析上述產(chǎn)量博弈的一次性博弈的納什均衡。根據(jù)假設(shè),兩個(gè)廠商的利潤(rùn)函數(shù)為:運(yùn)用反應(yīng)函數(shù)法不難求出納什均衡產(chǎn)量(古諾產(chǎn)量)為此時(shí)兩個(gè)廠商的利潤(rùn)為目前分析壟斷產(chǎn)量。市場(chǎng)總利潤(rùn)函數(shù)是:很輕易求得市場(chǎng)總利潤(rùn)最大化的總產(chǎn)量是:Qm=50壟斷利潤(rùn)為 由于市場(chǎng)是長(zhǎng)期穩(wěn)定的,因此我們把兩個(gè)廠商的產(chǎn)量博弈看作無(wú)限次反復(fù)博弈。假設(shè)兩廠商都采用開(kāi)始時(shí)生產(chǎn)壟斷產(chǎn)量的二分之一,一旦一方偏離就永遠(yuǎn)生產(chǎn)古諾產(chǎn)量的觸發(fā)方略。這樣假如兩個(gè)廠商都堅(jiān)持合作,那么兩個(gè)廠商每階段各得1250,長(zhǎng)期總利潤(rùn)的目前值是:假如有一種廠商(設(shè)為廠商1)偏離,那么由于它的利潤(rùn)函數(shù)為:因此它會(huì)產(chǎn)生產(chǎn)量:q1=37.5其目前階段利潤(rùn)為而此后每階段都只能產(chǎn)生古諾產(chǎn)量和得到利潤(rùn)10000/9。因此偏離的長(zhǎng)期總利潤(rùn)目前值為:因此12500>11406.25,因此堅(jiān)持壟斷產(chǎn)量顯然是對(duì)的的選擇。這闡明在模型假設(shè)下,雙方都采用上述觸發(fā)方略是本博弈的子博弈完美納什均衡,長(zhǎng)期維持壟斷產(chǎn)量是也許的。第六章補(bǔ)充習(xí)題判斷下列表述與否對(duì)的,并簡(jiǎn)樸分析:完全不完美信息動(dòng)態(tài)博弈中各博弈方都不清晰博弈的得益。在完全但不完美信息博弈中,若不存在混合方略,并且個(gè)博弈方都是積極選擇且行為理性的,則不完美信息從本質(zhì)上說(shuō)是假的。子博弈可以從一種多節(jié)點(diǎn)信息集開(kāi)始。參照答案:錯(cuò)誤。不完美信息博弈中不一定所有博弈方都不清晰博弈進(jìn)程,只要部分或者一種博弈方不完全清晰其行為之前的博弈進(jìn)程,就是不完美信息動(dòng)態(tài)博弈。對(duì)的。由于對(duì)于只包括理性博弈方的積極選擇行為,利益構(gòu)造明確,并且不一樣途徑有嚴(yán)格優(yōu)劣之分,從不需要用混合方略的動(dòng)態(tài)博弈來(lái)說(shuō),所有博弈方選擇的途徑都可以通過(guò)度析加以確定和預(yù)測(cè),主線不必觀測(cè)。從這個(gè)意義上說(shuō),這個(gè)博弈的不完美信息實(shí)際上都是“假的”。錯(cuò)誤。在一種子博弈中出現(xiàn)的信息集必須是完整的,由于從多節(jié)點(diǎn)信息集開(kāi)始的博弈必須分割一種信息集,因此不也許是一種子博弈。假如一種商品的質(zhì)量很難在購(gòu)置時(shí)對(duì)的判斷,發(fā)售在這種商品的賣方又可以“售出商品,概不退換”。問(wèn)這種商品的市場(chǎng)最終會(huì)趨向于怎樣的狀況?參照答案: 從短期市場(chǎng)均衡的角度,假如消費(fèi)者對(duì)商品質(zhì)量缺乏判斷能力,并且廠商又不提供任何質(zhì)量保證,那么消費(fèi)者與否會(huì)購(gòu)置取決于購(gòu)置的期望利益。假如商品對(duì)消費(fèi)者來(lái)說(shuō)并不是必需品,市場(chǎng)上劣質(zhì)品比例很高,并且買到劣質(zhì)品損失很大,從而購(gòu)置的期望利益、效用很小,還不如不買,那么短期均衡中消費(fèi)者就不會(huì)選擇購(gòu)置。這是市場(chǎng)短期中就會(huì)瓦解。長(zhǎng)期中只有廠商的經(jīng)營(yíng)方略和市場(chǎng)狀況改善后來(lái)才也許重新恢復(fù)和發(fā)展。 假如反過(guò)來(lái)商品對(duì)消費(fèi)者來(lái)是必須的,消費(fèi)效用比較大,買到劣質(zhì)商品的損失也不是很大,或者市場(chǎng)上劣質(zhì)品的比例不大,從而購(gòu)置的期望利益、效用比較大,那么消費(fèi)者在短期均衡終會(huì)選擇購(gòu)置,市場(chǎng)可以存在。 但可以短期存在不等于可以長(zhǎng)期維持和發(fā)展。實(shí)際上,除非該商品市場(chǎng)是消費(fèi)需求嚴(yán)重缺乏彈性,市場(chǎng)構(gòu)造又屬于完全壟斷的極端狀況,否則是總部對(duì)消費(fèi)者做出質(zhì)量承諾的廠商和市場(chǎng)肯定是不能長(zhǎng)期維持的,否則會(huì)走向消滅,被其他商品、其他廠商所替代。假設(shè)在一價(jià)二手車模型中V=5000元,W=1000元,P=3000元,差車的概率是0.6。再假設(shè)政府可以控制廠商的偽裝成本C,但每一單位C政府自己有0.5單位成本,而政府的效用是交易中賣方的利益減去政府自己的成本。問(wèn)該博弈的完美貝葉斯均衡是什么?參照答案:111111好差2賣不賣賣不賣買不買買不買(0,0)(3000-C,-)(-C,0)(0,0)(0,0)(3000,) 根據(jù)上述擴(kuò)展形我們不難清晰,假設(shè)政府選擇的C<3000,那么買賣雙方博弈的市場(chǎng)均衡一定是市場(chǎng)失敗類型或靠近失敗的,因此差車偽裝發(fā)售有利可圖,而在好車差車都賣的狀況下買方選擇買的期望利益為0.4×+0.6×(-)=-400<0。在市場(chǎng)完全失敗時(shí)由于買方的利益為0,因此政府的效用肯定是非正的;在市場(chǎng)靠近失敗時(shí)買方的利益(期望得益)同樣也是0,因此政府的效用肯定也是非正的。 目前假設(shè)政府選擇的C恰好滿足C>3000,例如3001等。這時(shí)候買賣雙方的博弈均衡是市場(chǎng)完全成功類型的,也就是好車全賣,差車不會(huì)賣,買方則會(huì)買。這時(shí)候交易買方的利益是,而政府提高C的成本只需要1500左右,因此政府有正的效用。 根據(jù)上述分析不難得出結(jié)論,在上述存在政府選擇的二手車交易模型中,政府選擇把C提高到3000以上,好車的賣方選擇賣,差車的賣方選擇不賣,買方選擇買,構(gòu)成該博弈的一種市場(chǎng)完全成功類型的完美貝葉斯均衡。4、簡(jiǎn)述完全但不完美信息動(dòng)態(tài)博弈的完美貝葉斯均衡必須滿足的規(guī)定。參照答案:完美貝葉斯均衡必須滿足下列四個(gè)規(guī)定:規(guī)定1:在各個(gè)信息集,輪到選擇的博弈方必須具有一種有關(guān)博弈到達(dá)該信息集中每個(gè)節(jié)點(diǎn)也許性的“判斷”。規(guī)定2:給定各博弈方的“判斷”,他們的方略必須是“序列理性”的。規(guī)定3:在均衡途徑上的信息集處,“判斷”由貝葉斯法則和各博弈方的均衡方略所決定。規(guī)定4:在不處在均衡途徑上的信息集處,“判斷”由貝葉斯法則和各博弈方在此處也許有的均衡方略所決定。不完全信息部分直接機(jī)制在拍賣規(guī)則沒(méi)計(jì)中有什么意義?(7--3)古玩市場(chǎng)的交易中買賣雙方的懊悔都來(lái)自于自己對(duì)古玩價(jià)值判斷的失誤,若預(yù)先對(duì)價(jià)值的判斷是對(duì)的的,那么交易者肯定不會(huì)懊悔。從不完全信息博弈的角度,從高到低叫價(jià)的荷蘭式拍賣和暗標(biāo)拍賣之間與否有相似性?運(yùn)用海薩尼轉(zhuǎn)換后來(lái),不完全信息動(dòng)態(tài)博弈與完全但不完美信息動(dòng)態(tài)博弈基本上是相似的嗎?在位者企業(yè)和也許進(jìn)入者的盈利矩陣如下:擴(kuò)展成本低擴(kuò)展成本高在位者進(jìn)入者擴(kuò)展不擴(kuò)展在位者進(jìn)入者擴(kuò)展不擴(kuò)展進(jìn)入-1,21,1進(jìn)入-1,-11,1不進(jìn)入0,40,3不進(jìn)入0,00,3將其進(jìn)行Harsanyi轉(zhuǎn)換。并求在高成本概率為1/3時(shí),該博弈的Nash均衡。(7--7)若(1)“自然”以均等的概率決定得益是下述得益矩陣1的狀況還是得益矩陣2的狀況,并讓博弈方1懂得而不讓博弈方2懂得;(2)慎奔方1在T和B中選擇,同步博奔方2在L和R中進(jìn)行選擇。找出該靜態(tài)貝葉斯博弈的所有純方略貝葉斯納什均衡。得益矩陣1得益矩陣212LRT1,10,0B0,00,012LRT0,00,0B0,02,2兩戶居民同步?jīng)Q定與否維護(hù)某合用的設(shè)施。假如只要有一戶人家維護(hù),兩戶人家就都能得到1單位好處;沒(méi)有人維護(hù)則兩戶人家均沒(méi)有好處。設(shè)兩戶人家維護(hù)的成本不一樣,分別為C1和C2。(1)假如假設(shè)C1和C2分別是0.1和0.5,該博弈的納什均衡是什么?博弈成果會(huì)怎樣?(2)假如C1和C2都是獨(dú)立均勻分布在[0,1]上的隨機(jī)變量,且真實(shí)水平只有每戶人家自己懂得,該博弈的貝葉斯納什均衡是什么?雙寡頭古諾產(chǎn)量競(jìng)爭(zhēng)模型中廠商i的利潤(rùn)函數(shù)為,i=1,2。若是兩個(gè)廠商的共同知識(shí),而則是廠商2的私人信息,廠商1只懂得為3/4或5/4,且取這兩個(gè)值的概率相等。若兩個(gè)廠商同步選擇產(chǎn)量,請(qǐng)找出該博弈的純方略貝葉斯均衡。參照答案:1.答:直接機(jī)制在拍賣規(guī)則設(shè)計(jì)個(gè)最大的意義在于可以簡(jiǎn)化拍賣規(guī)則的設(shè)計(jì)。由于理論證明任何一種貝葉斯納什均衡都可以用一種說(shuō)實(shí)話的直接機(jī)制代表(揭示原理)
溫馨提示
- 1. 本站所有資源如無(wú)特殊說(shuō)明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請(qǐng)下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請(qǐng)聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
- 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁(yè)內(nèi)容里面會(huì)有圖紙預(yù)覽,若沒(méi)有圖紙預(yù)覽就沒(méi)有圖紙。
- 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
- 5. 人人文庫(kù)網(wǎng)僅提供信息存儲(chǔ)空間,僅對(duì)用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對(duì)用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對(duì)任何下載內(nèi)容負(fù)責(zé)。
- 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請(qǐng)與我們聯(lián)系,我們立即糾正。
- 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶因使用這些下載資源對(duì)自己和他人造成任何形式的傷害或損失。
最新文檔
- 課程設(shè)計(jì)科學(xué)有
- 二零二五年度小型餐館污水處理合同2篇
- 脫殼機(jī)課程設(shè)計(jì)
- 2025年度暖氣片節(jié)能產(chǎn)品認(rèn)證合同樣本3篇
- 2025年度特許經(jīng)營(yíng)合同標(biāo)的及許可條件詳細(xì)說(shuō)明3篇
- 技術(shù)部門安全職責(zé)(2篇)
- 2025年生產(chǎn)企業(yè)安全庫(kù)存管理制度(三篇)
- 2025年度特色農(nóng)產(chǎn)品線上線下融合營(yíng)銷合作協(xié)議2篇
- 二零二五年度房地產(chǎn)記賬代理與評(píng)估合同3篇
- 二零二五年度文化旅游項(xiàng)目勘察設(shè)計(jì)服務(wù)協(xié)議3篇
- 工程設(shè)計(jì)-《工程勘察設(shè)計(jì)收費(fèi)標(biāo)準(zhǔn)》(2002年修訂本)-完整版
- DB11-T1835-2021 給水排水管道工程施工技術(shù)規(guī)程高清最新版
- 解剖篇2-1內(nèi)臟系統(tǒng)消化呼吸生理學(xué)
- 《小學(xué)生錯(cuò)別字原因及對(duì)策研究(論文)》
- 公司組織架構(gòu)圖(可編輯模版)
- 北師大版七年級(jí)數(shù)學(xué)上冊(cè)教案(全冊(cè)完整版)教學(xué)設(shè)計(jì)含教學(xué)反思
- 智慧水庫(kù)平臺(tái)建設(shè)方案
- 系統(tǒng)性紅斑狼瘡-第九版內(nèi)科學(xué)
- 全統(tǒng)定額工程量計(jì)算規(guī)則1994
- 糧食平房倉(cāng)設(shè)計(jì)規(guī)范
- 通用個(gè)人全年工資表模板
評(píng)論
0/150
提交評(píng)論