




版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進(jìn)行舉報或認(rèn)領(lǐng)
文檔簡介
第一章復(fù)習(xí)題2,4,5,6,7第一章參照答案2、設(shè)定一種博弈必須確定的方面包括:(1)博弈方,即博弈中進(jìn)行決策并承擔(dān)成果的參與者;(2)方略(空間),即博弈方選擇的內(nèi)容,可以是方向、取舍選擇,也可以是持續(xù)的數(shù)量水平等;(3)得益或得益函數(shù),即博弈方行為、方略選擇的對應(yīng)后果、成果,必須是數(shù)量或者可以折算成數(shù)量;(4)博弈次序,即博弈方行為、選擇的先后次序或者反復(fù)次數(shù)等;(5)信息構(gòu)造,即博弈方互相對其他博弈方行為或最終利益的理解程度;(6)行為邏輯和理性程度,即博弈方是根據(jù)個體理性還是集體理性行為,以及理性的程度等。假如設(shè)定博弈模型時不專門設(shè)定后兩個方面,就是隱含假定是完全、完美信息和完全理性的非合作博弈。4、“囚徒的困境”的內(nèi)在本源是在個體之間存在行為和利益互相制約的博弈構(gòu)造中,以個體理性和個體選擇為基礎(chǔ)的分散決策方式,無法有效地協(xié)調(diào)各方面的利益,并實現(xiàn)整個、個體利益共同的最優(yōu)。簡樸地說,“囚徒的困境”問題都是個體理性與集體理性的矛盾引起的。現(xiàn)實中“囚徒的困境”類型的問題是諸多的。例如廠商之間價格戰(zhàn)、惡性的廣告競爭,初中、中等教育中的應(yīng)試教育等,其實都是“囚徒的困境”博弈的體現(xiàn)形式。5、首先可根據(jù)博弈方的行為邏輯,與否容許存在有約束力協(xié)議,分為非合作博弈和合作博弈兩大類。另一方面可以根據(jù)博弈方的理性層次,分為完全理性博弈和有限理性博弈兩大類,有限理性博弈就是進(jìn)化博弈。第三是可以根據(jù)博弈過程分為靜態(tài)博弈、動態(tài)博弈和反復(fù)博弈三大類。第四是根據(jù)博弈問題的信息構(gòu)造,根據(jù)博弈方與否均有有關(guān)得益和博弈過程的充足信息,分為完全信息靜態(tài)博弈、不完全信息靜態(tài)博弈、完全且完美信息動態(tài)博弈、完全但不完美信息動態(tài)博弈和不完全信息動態(tài)博弈幾類。第五是根據(jù)得益的特性分為零和博弈、常和博弈和變和博弈。第六是根據(jù)博弈中博弈方的數(shù)量,可將博弈分為單人博弈、兩人博弈和多人博弈。第七是根據(jù)博弈方方略的數(shù)量,分為有限博弈和無限博弈兩類。9、(a)根據(jù)問題的假設(shè),該博弈的得益矩陣和擴(kuò)展形表達(dá)分別如下:自然賺(35%) 虧(65%)3000100100開我不開自然自然虧(65%)賺(35%)(300)(100)(0)(100)不開開不開開我虧(65%)賺(35%)(300)(100)(0)(100)不開開不開開我(b)假如我是風(fēng)險中性的,那么根據(jù)開的期望收益與不開收益的比較:0.35×300+0.65×0=105>100肯定會選擇開。(c)假如成功的概率減少到0.3,那么由于這時候開的期望收益與不開的收益比較:0.30×300+0.70×0=90<100因此會選擇不開,方略肯定會變化。(d)假如我是風(fēng)險規(guī)避的,開的期望收益為:0.9×(0.35×300+0.65×0)=0.9×105=94.5<100因此也會選擇不開。(e)假如我是風(fēng)險偏好的,那么由于開的期望收益為:1.2×(0.35×300+0.65×0)=1.2×105=126>100因此這時候肯定會選擇開。10、首先需要注意的是,在該博弈方的得益單位不一樣,逃犯得到的是增長或者減少的刑期(年),而看守得到的則是獎金(元),因此除非先運用效用概念折算成相似的單位,否則兩博弈方的得益互相之間不能比較和加減。直接采用單位不一樣的得益,該博弈的得益矩陣如下:看守路線一路線二-10,100010,010,0-10,1000逃路線一犯路線二該博弈的擴(kuò)展形表達(dá)如下:看守路線二路線二路線一路線一逃犯路線二路線一看守路線二路線二路線一路線一逃犯路線二路線一(-10,1000)(10,0)(10,0)(-10,1000)(-10,1000)(10,0)(10,0)(-10,1000)根據(jù)上述得益矩陣和擴(kuò)展形不難清晰,該博弈中兩博弈方的利益是對立的。雖然由于兩博弈方得益的單位不一樣,互相之間得益無法相加,因此無法判斷與否為零和博弈,但兩博弈方關(guān)系的性質(zhì)與猜硬幣等博弈相似,也是對立的。因此,該博弈同樣沒有兩博弈方都樂意接受的具有穩(wěn)定性的方略組合,兩博弈方最合理的方略都是以相似的概率隨機(jī)的選擇路線。補(bǔ)充習(xí)題:判斷下列論述與否對的,并作簡樸分析。囚徒的困境博弈中兩個囚徒之因此會處在困境,無法得到較理想的成果,是由于兩囚徒都不在意坐牢時間長短自身,只在意不能比對方坐牢的時間更長。合作博弈就是博弈方采用互相合作態(tài)度的博弈。參照答案:錯誤。結(jié)論恰恰相反,也就是囚徒的困境博弈中兩囚徒之因此處在困境,本源正是由于兩囚徒很在意坐牢的絕對時間長短。此外,我們已開始就假設(shè)兩囚徒都是理性經(jīng)濟(jì)人,而理性經(jīng)濟(jì)人都是以自身的(絕對)利益,而不是相對利益為決策目的。不對的。合作博弈在博弈論中專門指博弈方之間可以到達(dá)和運用有約束力協(xié)議限制行為選擇的博弈問題,與博弈方的態(tài)度與否合作無關(guān)。博弈與游戲有什么關(guān)系?參照答案: 現(xiàn)代博弈論和經(jīng)濟(jì)學(xué)中的博弈一般指人們在經(jīng)濟(jì)、政治、軍事等活動中的方略選擇,尤其是在有多種交互作用、方略互動條件下的方略選擇和決策較勁。游戲則是指平常生活中的下棋打牌、賭勝博彩,以及田徑、球類等多種體育比賽。因此博弈和游戲之間當(dāng)然是有明顯區(qū)別的。但博弈和游戲之間其實也有重要的聯(lián)絡(luò),由于博弈與許多游戲之間在本質(zhì)特性方面有相似的特性:(1)均有一定的規(guī)則;(2)均有能用正或負(fù)的數(shù)值表達(dá),或能按照一定的規(guī)則折算成數(shù)值的成果;(3)方略至關(guān)重要;(4)方略和利益又互相依存性。正是由于存在這些共同的本質(zhì)特性,因此從研究游戲規(guī)律得出的結(jié)論可用來指導(dǎo)經(jīng)濟(jì)政治等活動中的決策問題,或者把這些決策問題當(dāng)作游戲問題研究。因此博弈在一定程度上可以理解成就是游戲。其實“博弈”的英文名稱“Game”的基本意義就是游戲。一種工人給一種老板干活,工資原則是100元。工人可以選擇與否偷懶,老板則選擇與否克扣工資。假設(shè)工人不偷懶有相稱于50元的負(fù)效用,老板想克扣工資則總有借口扣掉60元工資,工人不偷懶老板有150元產(chǎn)出,而工人偷懶是老板只有80元產(chǎn)出,但老板在支付工資之前無法懂得實際產(chǎn)出,這些狀況使雙方都懂得的。請問假如老板完全可以看出工人與否偷懶,博弈屬于哪種類型?用得益矩陣或擴(kuò)展形表達(dá)該博弈并作簡樸分析。假如老板無法看出工人與否偷懶,博弈屬于哪種類型?用得益矩陣或擴(kuò)展形表達(dá)并簡樸分析。參照答案:工人老板工人老板老板偷懶不偷懶克扣克扣不克扣不克扣(40,40))(100,-20))(-10,110))(50,50))根據(jù)上述得益狀況可以看出,在該博弈中偷懶對工人總是有利的,克扣對老板也總是有利的,因此在雙方都只考慮自己的利益最大化的狀況下,該博弈的一般成果應(yīng)當(dāng)是工人偷懶和老板克扣。由于老板在決定與否克扣工資欠無法清晰工人與否偷懶,因此該博弈可以看作靜態(tài)博弈。由于雙方仍然均有有關(guān)得益的充足信息,因此是一種完全信息的靜態(tài)博弈。該博弈用得益矩陣表達(dá)如下:老板克扣不克扣工人偷懶40,40100,-20不偷懶-10,11050,50 其實,根據(jù)該得益矩陣不難得到與上述動態(tài)博弈相似的結(jié)論,仍然是工人會選擇偷懶和老板會選擇克扣。這個博弈實際上與囚徒的困境是相似的。第二章復(fù)習(xí)題4,5,7,9,11,12第二章參照答案4、多重納什均衡不會影響納什均衡的一致預(yù)測性質(zhì)。這是由于一致預(yù)測性不是指各個博弈方有一致的預(yù)測,而是指每個博弈方自己的方略選擇與自己的預(yù)測一致。對博弈分析重要的不利影響是,當(dāng)博弈存在多重納什均衡,并且互相之間沒有明確的優(yōu)劣之分時,會導(dǎo)致預(yù)測分析的困難,影響以納什均衡為關(guān)鍵的博弈分析的預(yù)測能力。存在帕累托上策均衡、風(fēng)險上策均衡、聚點均衡或有關(guān)均衡的也許性,并且博弈方互相之間有足夠的默契和理解時,多重納什均衡導(dǎo)致的不利影響會較小。5、博弈方2LCR2,01,14,23,41,22,31,30,23,0博 T弈M方 B1首先,運用嚴(yán)格下策反復(fù)消去法的思想,不難發(fā)目前博弈方1的方略中,B是相對于T的嚴(yán)格下策,因此可以把該方略從博弈方1的方略空間中消去。把博弈方1的B方略消去后又可以發(fā)現(xiàn),博弈方2的方略中C是相對于R的嚴(yán)格下策,從而也可以消去。在下面的得益矩陣中對應(yīng)方略和得益處劃水平線和垂直線表達(dá)消去了這些方略。博弈方2LCR2,01,14,23,41,22,31,30,23,0博 T弈M方 B1兩個博弈方各消去一種方略后的博弈是如下的兩人2×2博弈,已經(jīng)不存在任何嚴(yán)格下策。再運用劃線或箭頭法,很輕易發(fā)現(xiàn)這個2×2博弈有兩個純方略納什均衡(M,L)和(T,R)。博弈方2LR2,04,23,42,3博 T弈M方 1由于兩個純方略納什均衡之間沒有帕累托效率意義上的優(yōu)劣關(guān)系,雙方利益有不一致性,因此假如沒有其他深入的信息或者決策機(jī)制,一次性靜態(tài)博弈的成果不能肯定。由于雙方在該博弈中也許采用混合方略,因此實際上該博弈的成果可以是4個純方略組合中的任何一種。7、我們用反應(yīng)函數(shù)法來分析這個博弈。先討論博弈方1的選擇。根據(jù)問題的假設(shè),假如博弈方2選擇金額s2(0≤s2≤10000),則博弈方1選擇s1的利益為:當(dāng)S1≤10000s2當(dāng)S當(dāng)S1≤10000s2當(dāng)S1≤10000s2因此博弈方1采用s1=1000—s2時,能實現(xiàn)自己的最大利益u(s1)=s1=1000—s2。因此s1=1000—s2就是博弈方1的反應(yīng)函數(shù)。博弈方2與博弈方1的利益函數(shù)和方略選擇是完全相似的,因此對博弈方1所選擇的任意金額s1,博弈方2的最優(yōu)反應(yīng)方略,也就是反應(yīng)函數(shù)是s2=1000-s1。顯然,上述博弈方1的反應(yīng)函數(shù)與博弈方2的反應(yīng)函數(shù)是完全重疊的,因此本博弈有無窮多種納什均衡,所有滿足該反應(yīng)函數(shù),也就是s1+s2=10000的數(shù)組(s1,s2)都是本博弈的純方略納什均衡。假如我是兩個博弈方中的一種,那么我會規(guī)定得到5000元。理由是在該博弈的無窮多種純方略納什均衡中,(5000,5000)既是比較公平和輕易被雙方接受的,也是輕易被雙方同步想到的一種,因此是一種聚點均衡。9、(1)第i個廠商的利潤函數(shù)為:πi=pqi-ciqi=(a-qi-qj)qi-ciqi將利潤函數(shù)對產(chǎn)量求導(dǎo)并令其為0得:=a-qj-ci-2qi=0解得兩個廠商的反應(yīng)函數(shù)為:qj=(a-qj-ci)/2或詳細(xì)寫成:q1=(a-q2-c1)/2q2=(a-q1-c2)/2(2)當(dāng)0<ci<a/2時,我們根據(jù)上述兩個廠商的反應(yīng)函數(shù),直接求出兩個廠商的納什均衡產(chǎn)量分別為:q1=q2=(3)當(dāng)c1<c2<a,但2c2>a+c1時,根據(jù)反應(yīng)函數(shù)求出來的廠商2產(chǎn)量q2q1=q*=因此這種狀況下的納什均衡為[(a-c1)/2,0]。11、(1)兩個候選人競爭時,純方略納什均衡為(0.5,0.5),即兩個假選人都宣布自己是中間立場。我們用直接分析法加以證明:首先,假如一種候選人的立場是0.5而另一種候選人的立場不是0.5,那么不難證明有者將獲勝而后者必然失敗,由于根據(jù)投票原則前者得票比例將不小于0.5,那么雙方均有二分之一機(jī)會獲勝。因此對任意一種候選人來說,都是不管對方選擇的立場與否為0.5,0.5都是自己的對的選擇,也就是說0.5都是上策。因此(0.5,0.5)是本博弈的一種上策均衡,當(dāng)然也是納什均衡。實際上,雖然兩個假選人開始時沒有立即找到最佳立場0.5,他也會通過邊競爭邊學(xué)習(xí)很快調(diào)整到該納什均衡方略。由于當(dāng)兩個候選人的立場都不在0.5時,誰更靠近0.5誰選票就多,觀測到這一點,兩個候選人必然都會向0.5靠攏,直到最終都取0.5的立場。當(dāng)兩個候選人都選擇0.5時,各自都能得到二分之一選民的支持,誰可以取勝往往取決于雙方競選立場以外的東西,例如候選人的個人魅力和演說才能等。(2)三個候選人時問題比較復(fù)雜。由于當(dāng)三個候選人的立場都處在中點附近位置時,立場夾在其他兩個候選人之間的候選人只能獲得很少的選票,從而他(或她)有轉(zhuǎn)變成比“左”傾者更“左”傾,或比右傾者更右傾立場的動機(jī)。這時候三個候選人在中點附近處在一種不穩(wěn)定的平衡。(0.5±δ,0.5±ε,0.5±ξ),其中δ,ε和ξ是小正數(shù)。假如考慮到現(xiàn)實中競選者的立場不也許由一維數(shù)學(xué)坐標(biāo)精確描述,選民對候選立場差異的辨別能力也不也許很精細(xì),那么當(dāng)候選人的立場堵靠近中點時,選民很難識別究竟哪個候選人偏右傾或“左”傾某些,因此三個候選人的立場都靠近中點時可理解為是相似的。這樣,三個候選人與兩個候選人競選的納什均衡方略可以當(dāng)作是相似的,即都選擇(0.5,0.5,0.5)。三個候選人時在數(shù)學(xué)上還也許求出其他純方略納什均衡。如方略組合(0.4,0.6,0.8)就是其中一種。由于當(dāng)三個候選人分別選擇這些立場時,每項悠悠民選人沒有變化自己立場的動機(jī),由于該方略組合的成果是他取勝,而第二和第三個候選人則單獨變化自己的立場并不能改善自己的命運,無論只是稍微變化自己的立場,還是與其他候選人的相對立場發(fā)生逆轉(zhuǎn),都沒有限勝的機(jī)會。因此根據(jù)納什均衡的定義,這是一種純方略的納什均衡。類似的熏略組合尚有許多。不過,雖然在數(shù)學(xué)上這些納什均衡完全符合納什均衡的定義,不過它們在現(xiàn)實選舉問題中的意義卻并不大,由于這種納什均衡自身只是弱均衡(部分博弈方變化方略不損害自己的利益),并且部分博弈方(第二、第三個候選人)屬于經(jīng)典的“破壞者”,他們的方略變化不影響自己的利益,但卻會對其他博弈方的利益產(chǎn)生決定性的影響,因此這些納什均衡其實是不穩(wěn)定的,不會是現(xiàn)實中的均衡成果。上述博弈模型不僅在政治選舉問題中故意義,在分析經(jīng)濟(jì)經(jīng)營活動中的選址和產(chǎn)品定位等問題方面也非常有用。讀者可以自行找某些例子進(jìn)行分析。12、在納什均衡分析的基礎(chǔ)上,再深入考慮運用其他均衡概念或分析措施,如風(fēng)險上策均衡等進(jìn)行分析。首先,很輕易根據(jù)劃線法等找出本博弈的兩個純方略納什均衡(U,R)和(D,L)。本博奕尚有一種混合方略納什均衡,即兩博弈方各自以2/3、1/3的概率在自己的兩個方略U、D和L、R中隨機(jī)選擇。但本博弈的兩個純方略納什均衡中沒有帕累托上策均衡,兩個博弈方各偏好其中一種,并且另一種方略組合(U,L)從整體利益角度優(yōu)于這兩個純方略納什均衡,因此博弈方很難在兩個純方略納什均衡的選擇上到達(dá)共識。混合方略納什均衡的效率也不是很高,由于有一定概率會出現(xiàn)(D,R)的成果。根據(jù)風(fēng)險上策均衡的思想進(jìn)行分析,當(dāng)兩個博弈方各自的兩種方略均有二分之一也許性被選屆時,本博弈的兩個純略納什均衡都不是風(fēng)險上策均衡,而方略組合(U,L)卻是風(fēng)險上策均衡。由于此時博弈方1選擇U的期望得益是4,選擇D的期望是益是3.5,博奕方2選擇L的期望得益是4,選擇R的期望得益是3.5。因此當(dāng)兩個博弈方考慮到上述風(fēng)險原因時,他們的選擇將是(U,L),成果反而比較理想。假如博弈問題的基本背景支持,對本博弈還可以用有關(guān)均衡的思想進(jìn)行分析。讀者可自己作某些討論。補(bǔ)充習(xí)題:判斷下列表述與否對的,并作簡樸分析:納什均衡即任一博弈方單獨變化方略都只能得到更小利益的方略組合。假如以博弈有兩個純方略納什均衡,則一定還存在一種混合方略均衡。上策均衡一定是帕累托最優(yōu)的均衡嗎?并闡明哪一種均衡更穩(wěn)定些。參照答案:錯誤。只要任一博弈方單獨變化方略不會增長得益,方略組合就是納什均衡了。單獨變化方略只能得到更小得益的方略組合是嚴(yán)格納什均衡,是比納什均衡更強(qiáng)的均衡概念。對的。這是納什均衡的基本性質(zhì)之一——奇數(shù)性所保證的。不對的。囚徒的困境博弈中的(坦白,坦白)就是上策均衡(同步也是納什均衡),但該均衡顯然不是帕累托最優(yōu)的,否則就不會稱其為囚徒的困境了。下面的得益矩陣表達(dá)一種兩人靜態(tài)博弈。問當(dāng)a、b、c、d、e、f、g和h滿足什么條件時,該博弈:存在嚴(yán)格上策均衡;可以用嚴(yán)格下策反復(fù)消去法簡化或找出博弈的均衡;存在純方略納什均衡。博弈方2LR博弈方1Ua,bc,dDe,fg,h參照答案:嚴(yán)格上策均衡是由各個博弈方的嚴(yán)格上策構(gòu)成的方略組合。對于博弈方1,假如a>e且c>g,則U是相對于D的嚴(yán)格上策;假如a<e且c<g,則D是相對于U的嚴(yán)格上策。對于博弈方2,假如b>d且f>h,則L是相對于R的嚴(yán)格上策;假如b<d且f<h,則R是相對于L的嚴(yán)格上策。上述兩個博弈方各自有兩種嚴(yán)格上策的相對得益狀況的組合,總共也許構(gòu)成四種嚴(yán)格上策均衡。只要出現(xiàn)a>e且c>g、a<e且c<g、b<d且f>h或b<d且f<h四種狀況中的任何一種,就可以用嚴(yán)格下策反復(fù)消去法簡化或直接求出博弈的均衡,由于這個時候D、U、R、L分別是對應(yīng)博弈方相對于各自另一方略的嚴(yán)格下策。純方略納什均衡是個博弈方單獨變化方略都無利可圖的方略組合。在上述博弈中,只要滿足a≥e且b≥d、c≥g且d≥b、e≥a且f≥h,g≥c且h≥f四種狀況中的任何一種,就存在純方略納什均衡。3. 假如雙寡頭壟斷的市場需求函數(shù)是p(Q)=a-Q,兩個廠商都無固定生產(chǎn)成本,邊際成本為相似的c。假如兩個廠商都只能要么生產(chǎn)壟斷產(chǎn)量的二分之一,要么生產(chǎn)古諾產(chǎn)量,證明這是一種囚徒困境型的博弈。參照答案: 根據(jù)市場需求函數(shù)p(Q)=a-Q和廠商的生產(chǎn)成本,不難計算出該市場的壟斷產(chǎn)量為qm=(a-c)/2,雙寡頭壟斷的古諾產(chǎn)量(納什均衡產(chǎn)量)為qc=(a-c)/3。兩個廠商都生產(chǎn)壟斷產(chǎn)量的二分之一(a-c)/4時,各自的利潤為兩個廠商都產(chǎn)生古諾產(chǎn)量(a-c)/3時,各自的利潤為:若一種廠商產(chǎn)生壟斷產(chǎn)量的二分之一(a-c)/4,,另一方生產(chǎn)古諾產(chǎn)量(a-c)/3,前者利潤為:后者利潤為:因此上述博弈用下列得益矩陣表達(dá)就是:企業(yè)乙qm/2qc企業(yè)甲qm/2(a-c)2/8,(a-c)2/85(a-c)2/48,5(a-c)2/36qc5(a-c)2/36,5(a-c)2/48(a-c)2/9,(a-c)2/9分析這個得益矩陣可以看出,由于(a-c)2/8<5(a-c)2/36,5(a-c)2/48<(a-c)2/9,因此qm/2對兩個廠商都是相對于qc的嚴(yán)格下策。因此該博弈唯一的納什均衡,也是上策均衡,是(qc,qc)。這個納什均衡的雙方得益(a-c)2/9,顯然不如雙方都采用qm/2的得益(a-c)2/8,因此這個博弈是一種囚徒困境型的博弈。4.試用反應(yīng)函數(shù)法尋找博弈的純方略納什均衡及混合方略的納什均衡:博弈方乙紅黑3,10,00,01,4博 紅弈黑 方甲(答案略)第三章復(fù)習(xí)題1,3,4,6第三章參照答案1、子博弈完美納什均衡即動態(tài)博弈中具有這樣特性的方略組合;它們不僅在整個博弈中構(gòu)成納什均衡,并且在所有的子博弈中也都構(gòu)成納什均衡。在動態(tài)博弈分析中引進(jìn)子博弈完美納什均衡概念的原因在于,動態(tài)博弈中各個博弈方的行為有先后次序,因此往往會存在相機(jī)抉擇問題,也就是博弈方也許在博弈過程中變化均衡方略設(shè)定的行為,從而使得均衡方略存在可信性問題,并且納什均衡無法消除這種問題,只有子博弈完美納什均衡可以處理它。子博弈完美納什均衡一定是納什均衡,但納什均衡不一定是子博弈完美納什均衡。因此一種動態(tài)博弈的所有子博弈完納什均衡是該博弈所有納什均衡的一種子集。3、博弈方的理性問題對動態(tài)博弈分析的影響肯定比對靜態(tài)博弈分析的影響更大。雖然博弈方的理性問題,博弈方實際理性與博弈分析假設(shè)的有差距,對博弈分析的影響在靜態(tài)博弈分析中也存在,教材第二章多次提到了這個問題,但博弈方的理性問題對動態(tài)博弈分析的影響肯定更大。由于以子博弈完美納什均衡和逆推歸納法為關(guān)鍵的動態(tài)博弈分析,對博弈方理性的規(guī)定比靜態(tài)博弈的納什均衡分析的更高,并且博弈方理性的缺陷還會引出理性判斷的動態(tài)調(diào)整等更復(fù)雜的問題。例如某個博弈方由理性問題在某時刻“出錯誤”,采用偏離子博弈完美納什均衡的行為、途徑,這時候背面階段行為博弈方的判斷和行為選擇就會有困難。這種困難是動態(tài)博弈所特有的,在靜態(tài)博弈分析中并不存在。4、括號中的第一種數(shù)字代表乙的得益,第二個數(shù)字代表甲的得益,因此a表達(dá)乙的得益,而b表達(dá)甲的得益。在第三階段,假如a<0,則乙會選擇不打官司。這時逆推回第二階段,甲會選擇不分,由于分的得益2不不小于不分的得益4。再逆推回第一階段,乙肯定會選擇不錯,由于借的最終益0比不借的得出終得益1小。第三階段,假如a>0,則乙輪到選擇的時候會選擇打官司,此時雙方得益是(a,b)。逆推回第二階段,假如b>2,則甲在第二階段仍然選擇不分,這時候雙方得益為(a,b)。在這種狀況下再逆推回第一階段,那么當(dāng)a<1時乙會選擇不借,雙方得益(1,0),當(dāng)a>1時乙肯定會選擇借,最終雙方得益(a,b)。在第二階段假如b<2,則甲會選擇分,此時雙方得益為(2,2)。再逆推回第一階段,乙肯定選擇借,由于借的得益2不小于不借的得益1,最終雙方的得益(2,2)。根據(jù)上述分析我們可以看出,該博弈比較明確可以預(yù)測的成果有這樣幾種狀況:(1)a<0,此時本博弈的成果是乙在第一階段不樂意借給對方,結(jié)束博弈,雙方得益(1,0),不管這時候b的值是多少;(2)0<a<1且b>2,此時博弈的成果仍然是乙在第一階段選擇不錯,結(jié)束博弈,雙方得益(1,0);(3)a>1且b>2,此時博弈的成果是乙在第一階段選擇借,甲在第二階段選擇不分,乙在第三階段選擇打,最終成果是雙方得益(a,b);(4)a>0且b<2,此時乙在第一階段會選擇借,甲在第二階段會選擇分,雙方得益(2,2)。要本博弈的“威脅”,即“打”是可信的,條件是a>0。要本博弈的“承諾”,即“分”是可信的,條件是a>0且b<2。注意上面的討論中沒有考慮a=0、a=1、b=2的幾種狀況,由于這些時候博弈方的選擇很難用理論措施確定和預(yù)測。不過最終的成果并不會超過上面給出的范圍。6、首先,設(shè)三個廠商的產(chǎn)量分別為q1、q2和q3.三個廠商的利潤函數(shù)為:π1=(100—q1—q2—q3)q1—2q1π2=(100—q1—q2—q3)q1—2q2π3=(100—q1—q2—q3)q1—2q3根據(jù)逆推歸納法,先分析第二階段是廠商3的選擇。將廠商1的利潤函數(shù)對其產(chǎn)量求偏導(dǎo)數(shù)并令其為0得:=100—q1—q2—2q3—2=0因此廠商3的反應(yīng)函數(shù)為:q3=(98—q1—q2)/2再分析第一階段是廠商1和廠商2的決策。先把廠商3的反應(yīng)函數(shù)代入廠商1和廠商2的利潤函數(shù)得:π1=(100—q1—q2—q3)q1—2q1=q1π2=(100—q1—q2—q3)q2—2q2=q2分別對q1和q2求偏導(dǎo)數(shù)并令為0得:-q1=0-q2=0聯(lián)立兩個方程可解得q1=q2=98/3。再代入廠商3的反應(yīng)函數(shù)得q3=(98-q1-q2)/2=98/6。把三個廠商產(chǎn)量代入各自的利潤函數(shù),可得三個廠商的利潤分別為4802/9、4802/9和2401/9。補(bǔ)充習(xí)題:判斷下列論述與否對的,并進(jìn)行分析:在動態(tài)博弈中,由于后行為的博弈方可以先觀測對方行為后再選擇行為,因此總是有利的。逆推歸納法并不能排除所有不可置信的威脅。假如動態(tài)博弈的一種方略組合在均衡途徑上是納什均衡,就構(gòu)成了該動態(tài)博弈的一種子博弈完美納什均衡。參照答案:不對的。實際上動態(tài)博弈中先行為的博弈方往往有先行優(yōu)勢,因此常常是先行為的博弈方更有利而不是后行為的博弈方有利。不對的。逆推歸納法最主線的特性就是能排除動態(tài)博弈中的所有不可信的行為,包括不可信的威脅和不可信的承諾。由于逆推歸納法使根據(jù)最大利益原則選擇博弈方每階段行為的,并且都考慮到了后續(xù)階段的行為選擇,因此用逆推歸納法找出的均衡方略組合中不也許包括不符合博弈方利益的不可信行為選擇。不對的。由于動態(tài)博弈的子博弈完美納什均衡不僅規(guī)定在均衡途徑上是納什均衡,并且還規(guī)定在非均衡途徑上也是納什均衡。兩個兄弟分一塊冰激凌。哥哥先提出一種分割比例,弟弟可以接受或拒絕,接受則按哥哥的提議分割,若拒絕就自己提出一種比例。但這時候冰激凌已化得只剩1/2了,對弟弟提議的比例哥哥也可以接受或拒絕,若接受則按弟弟的提議分割,若拒絕冰激凌會所有化光。由于兄弟之間不應(yīng)當(dāng)做損人不利己的是,因此我們假設(shè)接受和拒絕利益相似時兄弟倆都會接受。求該博弈的子博弈完美納什均衡。假如冰激凌每階段只化掉1/3,博弈的子博弈完美納什均衡是什么?參照答案:哥弟哥出S1不接受,出S2接受(S1,1-S1)接受哥弟哥出S1不接受,出S2接受(S1,1-S1)接受不接受,出S2(S2/2,(1-S2)/2))(0,0) 運用逆推歸納法先分析最終一階段哥的選擇。由于只要接受的利益不少于不接受的利益哥就會接受,因此在這個階段只要弟的方案滿足S2/2≥0,也就是S2≥0,哥就會接受,否則不會接受。由于冰激凌的份額不也許是負(fù)數(shù),因此該條件實際上必然是成立的,也就是說由于哥不接受弟的方案冰激凌會所有化掉,因此任何方案哥都會接受。 目前回到前一階段弟的選擇。由于弟懂得后一階段哥的選擇措施,因此懂得假如不接受前一階段哥提出的比例,自己可以取S2=0,獨享此時尚未化掉的1/2塊冰激凌;假如選擇接受前一階段哥的提議,那么自己將得到1-S1,顯然只要1-S1≥1/2,即S1≤1/2,弟就會接受哥的提議。 再回到第一階段哥的選擇。哥清晰后兩個階段雙方的選擇邏輯和成果,因此他在這一階段選擇S1=1/2,正是可以被弟接受的自己的最大程度份額,超過這個份額將什么都不能得到,因此S1=1/2是最佳選擇。 綜上,該博弈的子博弈完美納什均衡是:哥哥開始時就提議按(1/2,1/2)分割,弟弟接受。 每階段只化掉1/3的狀況請自己分析。假如學(xué)生在考試之前全面復(fù)習(xí),考好的概率為90%,假如學(xué)生只復(fù)習(xí)一部分重點,則有50%的概率考好。全面復(fù)習(xí)花費的時間t1=100小時,重點復(fù)習(xí)之需要花費t2=20小時。學(xué)生的效用函數(shù)為:U=W-2e,其中W是考試成績,有高下兩種分?jǐn)?shù)Wh和Wl,e為努力學(xué)習(xí)的時間。問老師怎樣才能促使學(xué)生全面復(fù)習(xí)?參照答案: 本題中老師的調(diào)控手段是高分和低分的水平,或者高分和低分的差距,老師給學(xué)生高下分并沒有成本,老師也不用考慮自己的收益或效用。學(xué)生00學(xué)生00全面重點高分(0.9)0.9000()(900.8()(((((((((((((((((()()高分(0.5)低分(0.1)低分(0.5)(Wh-200))(Wl-200))(Wh-40))(Wl-40))學(xué)生選擇全面復(fù)習(xí)的期望得益是U1=0.9(Wh-200)+0.1(Wl-200)重點復(fù)習(xí)的期望得益是U2=0.5(Wh-40)+0.5(Wl-40)只有當(dāng)U1U2時學(xué)生才會選擇全面復(fù)習(xí)。根據(jù)U1U2我們可以算出Wh-Wl400。這就是老師能有效全面復(fù)習(xí)需要滿足的條件。其實在獎學(xué)金與成績掛鉤時,Wh-Wl也可以理解成不一樣等獎學(xué)金的差額。4.考慮如下兩人博弈:有兩個局中人,A和B,A首先行動,他可以選擇“上”或“下”。假如A選擇上,則博弈結(jié)束,每個局中人得到支付2。假如A選擇下,則輪到B作決策,B可以選擇“左”或“右”。假如B選擇左,則雙方都只好到0;假如B選擇右,則A得3,B得1。1)請用博弈樹的形式表述這個博弈,并判斷這個博弈是完美信息博弈還是不完美信息博弈。2)用逆向法求出這個博弈的均衡成果,這個均衡成果是子博弈精煉納什均衡嗎?(參照答案略)5、1)運用觸發(fā)方略求兩次反復(fù)下面得益矩陣表達(dá)的靜態(tài)博弈解。2)假如方略組合(L,D)的得益改為(2,7),請問與否存在觸發(fā)方略使得第一階段實現(xiàn)得益(5,6)?LMR3,20,06,10,11,20,00,00,05,6參照答案:1)博弈方1第一階段選D,第二階段選U;博弈方2第一階段選R,假如第一階段成果是(D,R),則第二階段選L,否則選M。2)假如方略組合(L,D)的得益改為(2,7),則不存在觸發(fā)方略使得第一階段實現(xiàn)得益(5,6)。16、設(shè)兩個博弈方之間的一種三階1段動態(tài)博弈如右圖所示,若a,b分別為10和15,該博弈LR的子博弈完美納什均衡方略是什么?2R—M—T與否也許成為該博弈的子2博弈完美納什均衡路基途徑,為何?(30,0)3)在什么狀況下博弈方2會獲得30MN或更高的得益。11(20,20)ST(a,b)(5,30)參照答案:1)該博弈的子博弈完美納什均衡方略是:博弈方1在第一階段選L,在第三階段選S,博弈方2在第二階段選N。2)不也許,由于R—M—T給博弈方1的得益5不不小于他在第一階段選L的得益30,因此該途徑對應(yīng)的方略組合不構(gòu)成納什均衡。3)當(dāng)a>30,b≥30時,博弈方2會獲得30或更高的得益。第四章復(fù)習(xí)題2,3,6,82、火車站和機(jī)場餐飲商業(yè)服務(wù)的顧客往往都是一次性的,回頭客、??捅容^少,這些經(jīng)濟(jì)交易具有一次性博弈的特性,它們的價格總是較高而質(zhì)量又會差某些,顧客也會盡量不在這些地方購置商品和消費。在一般商業(yè)區(qū)和居民區(qū)的餐飲商業(yè)服務(wù)則回頭客和??洼^多,有明顯的反復(fù)博弈特性,在居民區(qū)購置商品和消費的老顧客一般能得到比較公平、優(yōu)惠的價格,還能得到很好的服務(wù),甚至有些還可以信用消費(賒賬),因此消費者一般會比較放心地消費。這就是現(xiàn)實生活中反復(fù)博弈和一次性博弈效率不一樣的經(jīng)典例子之一。3、從研究對象和問題特性看,有限次反復(fù)博弈研究的重要是有明確結(jié)束時間的(合作、競爭等)關(guān)系,無限次反復(fù)博弈研究的重要是沒有明確成果時間,或者較長期的關(guān)系。從分析措施的角度,動態(tài)博弈和反復(fù)博弈分析中常用的逆推歸納法在無限次反復(fù)博弈中無法直接運用,由于沒有最終一次反復(fù)。因此無限次反復(fù)博弈分析的重要措施是構(gòu)造法,即根據(jù)特定效率意義等構(gòu)造了博弈完美納什均衡。此外,也可以運用某些技巧處理問題,如教材中運用三階段討價還價博弈分析無限階段討價還價博弈的技巧。從博弈的成果看,無限次反復(fù)博弈的效率往往高于有限次反復(fù)博弈,有些在有限次反復(fù)博弈中無法實現(xiàn)的效率較高的成果,在無限次反復(fù)博弈中有也許實現(xiàn)。例如囚徒的困境型博弈的無限次反復(fù)博弈和有限次反復(fù)博弈就體現(xiàn)了這種差異。兩類反復(fù)博弈民間定理的差異也闡明了這一點。最終,在反復(fù)次數(shù)不多的有限次反復(fù)博弈中不一定要考慮得益貼現(xiàn)問題,在我限次反復(fù)博弈問題中這是必須考慮的。上述區(qū)別在理論方面最重要的啟發(fā)是重視有限次和無限次反復(fù)博弈的區(qū)別,辨別研究這兩類博弈問題是非常重要的,在實踐方面的重要啟發(fā)是增進(jìn)和保持經(jīng)濟(jì)關(guān)系的長期穩(wěn)定性,對于提高社會經(jīng)濟(jì)效率等常常有非常重要的意義。6、用畫線法輕易找出該博弈的兩個純方略納什均衡(T,L)和(M,R)。這兩個納什均衡的得益都帕累托劣于(B,S)。一次性博弈中效率較高的(B,S)不也許實現(xiàn)。但該博弈的構(gòu)造表明存在雙方合作的利益,在兩次反復(fù)博弈中也有構(gòu)造懲罰機(jī)制的條件,因此我會考慮運用試探合作的觸發(fā)方略爭取部分實現(xiàn)(B,S),提高博弈的效率。我作為博弈方1會采用這樣的觸發(fā)方略:第一次反復(fù)采用B;第二次反復(fù)時,假如前一次的成果是(B,S),則采用M,假如前一次的成果是其他,則采用T。假如另一種博弈方有同樣的分析能力,或者比較有經(jīng)驗,那么他(或她)也會采用相似的觸發(fā)方略:在第一次反復(fù)時采用S;第二次反復(fù)時,假如前一次的成果是(B,S),則采用R,否則采用L。雙方采用上述觸發(fā)方略構(gòu)成一種子博弈完美納什均衡,因此是穩(wěn)定的。這時候前一次反復(fù)實現(xiàn)了(B,S),提高了博弈的效率。當(dāng)然,上述觸發(fā)方略也是有風(fēng)險的,由于當(dāng)另一種博弈方不理解和沒有采用上述方略時,我的得益會較低。當(dāng)然假如考慮到人們具有學(xué)習(xí)進(jìn)步的能力,并且缺乏分析和學(xué)習(xí)能力,采用效率較低方略的博弈方長期中會逐漸被淘汰掉,那么采用上述觸發(fā)方略的合理性就得到了深入的支持。8、博弈方2LR8,64,104,86,42,00,2博 T弈M方 D1首先很輕易看出,博弈方1的D策相對于T策和M策都是嚴(yán)格下策,因此可以消去,消去博弈方1的D策后四個方略組合中不存在純方略納什均衡。根據(jù)混合方略納什均衡的計算措施,不難算出混合方略納什均衡為:博弈方1概率分布(1/2,1/2)在T和M中隨機(jī)選擇,博弈方2則以概率分布(1/3,2/3)在L和R中隨機(jī)選擇。由于上述靜態(tài)博弈是沒有純方略納什均衡的嚴(yán)格競爭博弈,因此在有限次反復(fù)博弈和無限次反復(fù)博弈中,兩博弈方的均衡方略都是簡樸復(fù)重原博弈的混合方略納什均衡。補(bǔ)充習(xí)題:判斷下列表述與否對的,并簡樸討論:有限次反復(fù)博弈的子博弈完美納什均衡的最終一次反復(fù)必然是原博弈的一種納什均衡。參照答案:對的。由于最終一次反復(fù)就是動態(tài)博弈的最終一種階段,根據(jù)子博弈完美納什均衡的規(guī)定,博弈方在該階段的選擇必須構(gòu)成納什均衡。由于最終一次反復(fù)就是原博弈自身,因此該納什均衡就是原博弈的一種納什均衡。無限次反復(fù)博弈均衡解的得益一定優(yōu)于原博弈的均衡解的得益。參照答案:錯誤。對于嚴(yán)格競爭的零和博弈,或者不滿足合作條件的其他許多博弈來說,無限制反復(fù)博弈并不意味著效率的提高,得益不一定高于原博弈的得益。寡頭的古諾產(chǎn)量博弈中,假如市場需求P=130-Q,邊際成本c=30且沒有固定成本,貼現(xiàn)因子δ=0.9,假如該市場有長期的穩(wěn)定性,問兩個廠商能否維持壟斷產(chǎn)量?參照答案:由于市場有長期穩(wěn)定性,因此可以把兩寡頭之間的產(chǎn)量博弈看作無限次反復(fù)博弈,討論能否構(gòu)造雙方在壟斷產(chǎn)量上合作的子博弈完美納什均衡。 首先分析上述產(chǎn)量博弈的一次性博弈的納什均衡。根據(jù)假設(shè),兩個廠商的利潤函數(shù)為:運用反應(yīng)函數(shù)法不難求出納什均衡產(chǎn)量(古諾產(chǎn)量)為此時兩個廠商的利潤為目前分析壟斷產(chǎn)量。市場總利潤函數(shù)是:很輕易求得市場總利潤最大化的總產(chǎn)量是:Qm=50壟斷利潤為 由于市場是長期穩(wěn)定的,因此我們把兩個廠商的產(chǎn)量博弈看作無限次反復(fù)博弈。假設(shè)兩廠商都采用開始時生產(chǎn)壟斷產(chǎn)量的二分之一,一旦一方偏離就永遠(yuǎn)生產(chǎn)古諾產(chǎn)量的觸發(fā)方略。這樣假如兩個廠商都堅持合作,那么兩個廠商每階段各得1250,長期總利潤的目前值是:假如有一種廠商(設(shè)為廠商1)偏離,那么由于它的利潤函數(shù)為:因此它會產(chǎn)生產(chǎn)量:q1=37.5其目前階段利潤為而此后每階段都只能產(chǎn)生古諾產(chǎn)量和得到利潤10000/9。因此偏離的長期總利潤目前值為:因此12500>11406.25,因此堅持壟斷產(chǎn)量顯然是對的的選擇。這闡明在模型假設(shè)下,雙方都采用上述觸發(fā)方略是本博弈的子博弈完美納什均衡,長期維持壟斷產(chǎn)量是也許的。第六章補(bǔ)充習(xí)題判斷下列表述與否對的,并簡樸分析:完全不完美信息動態(tài)博弈中各博弈方都不清晰博弈的得益。在完全但不完美信息博弈中,若不存在混合方略,并且個博弈方都是積極選擇且行為理性的,則不完美信息從本質(zhì)上說是假的。子博弈可以從一種多節(jié)點信息集開始。參照答案:錯誤。不完美信息博弈中不一定所有博弈方都不清晰博弈進(jìn)程,只要部分或者一種博弈方不完全清晰其行為之前的博弈進(jìn)程,就是不完美信息動態(tài)博弈。對的。由于對于只包括理性博弈方的積極選擇行為,利益構(gòu)造明確,并且不一樣途徑有嚴(yán)格優(yōu)劣之分,從不需要用混合方略的動態(tài)博弈來說,所有博弈方選擇的途徑都可以通過度析加以確定和預(yù)測,主線不必觀測。從這個意義上說,這個博弈的不完美信息實際上都是“假的”。錯誤。在一種子博弈中出現(xiàn)的信息集必須是完整的,由于從多節(jié)點信息集開始的博弈必須分割一種信息集,因此不也許是一種子博弈。假如一種商品的質(zhì)量很難在購置時對的判斷,發(fā)售在這種商品的賣方又可以“售出商品,概不退換”。問這種商品的市場最終會趨向于怎樣的狀況?參照答案: 從短期市場均衡的角度,假如消費者對商品質(zhì)量缺乏判斷能力,并且廠商又不提供任何質(zhì)量保證,那么消費者與否會購置取決于購置的期望利益。假如商品對消費者來說并不是必需品,市場上劣質(zhì)品比例很高,并且買到劣質(zhì)品損失很大,從而購置的期望利益、效用很小,還不如不買,那么短期均衡中消費者就不會選擇購置。這是市場短期中就會瓦解。長期中只有廠商的經(jīng)營方略和市場狀況改善后來才也許重新恢復(fù)和發(fā)展。 假如反過來商品對消費者來是必須的,消費效用比較大,買到劣質(zhì)商品的損失也不是很大,或者市場上劣質(zhì)品的比例不大,從而購置的期望利益、效用比較大,那么消費者在短期均衡終會選擇購置,市場可以存在。 但可以短期存在不等于可以長期維持和發(fā)展。實際上,除非該商品市場是消費需求嚴(yán)重缺乏彈性,市場構(gòu)造又屬于完全壟斷的極端狀況,否則是總部對消費者做出質(zhì)量承諾的廠商和市場肯定是不能長期維持的,否則會走向消滅,被其他商品、其他廠商所替代。假設(shè)在一價二手車模型中V=5000元,W=1000元,P=3000元,差車的概率是0.6。再假設(shè)政府可以控制廠商的偽裝成本C,但每一單位C政府自己有0.5單位成本,而政府的效用是交易中賣方的利益減去政府自己的成本。問該博弈的完美貝葉斯均衡是什么?參照答案:111111好差2賣不賣賣不賣買不買買不買(0,0)(3000-C,-)(-C,0)(0,0)(0,0)(3000,) 根據(jù)上述擴(kuò)展形我們不難清晰,假設(shè)政府選擇的C<3000,那么買賣雙方博弈的市場均衡一定是市場失敗類型或靠近失敗的,因此差車偽裝發(fā)售有利可圖,而在好車差車都賣的狀況下買方選擇買的期望利益為0.4×+0.6×(-)=-400<0。在市場完全失敗時由于買方的利益為0,因此政府的效用肯定是非正的;在市場靠近失敗時買方的利益(期望得益)同樣也是0,因此政府的效用肯定也是非正的。 目前假設(shè)政府選擇的C恰好滿足C>3000,例如3001等。這時候買賣雙方的博弈均衡是市場完全成功類型的,也就是好車全賣,差車不會賣,買方則會買。這時候交易買方的利益是,而政府提高C的成本只需要1500左右,因此政府有正的效用。 根據(jù)上述分析不難得出結(jié)論,在上述存在政府選擇的二手車交易模型中,政府選擇把C提高到3000以上,好車的賣方選擇賣,差車的賣方選擇不賣,買方選擇買,構(gòu)成該博弈的一種市場完全成功類型的完美貝葉斯均衡。4、簡述完全但不完美信息動態(tài)博弈的完美貝葉斯均衡必須滿足的規(guī)定。參照答案:完美貝葉斯均衡必須滿足下列四個規(guī)定:規(guī)定1:在各個信息集,輪到選擇的博弈方必須具有一種有關(guān)博弈到達(dá)該信息集中每個節(jié)點也許性的“判斷”。規(guī)定2:給定各博弈方的“判斷”,他們的方略必須是“序列理性”的。規(guī)定3:在均衡途徑上的信息集處,“判斷”由貝葉斯法則和各博弈方的均衡方略所決定。規(guī)定4:在不處在均衡途徑上的信息集處,“判斷”由貝葉斯法則和各博弈方在此處也許有的均衡方略所決定。不完全信息部分直接機(jī)制在拍賣規(guī)則沒計中有什么意義?(7--3)古玩市場的交易中買賣雙方的懊悔都來自于自己對古玩價值判斷的失誤,若預(yù)先對價值的判斷是對的的,那么交易者肯定不會懊悔。從不完全信息博弈的角度,從高到低叫價的荷蘭式拍賣和暗標(biāo)拍賣之間與否有相似性?運用海薩尼轉(zhuǎn)換后來,不完全信息動態(tài)博弈與完全但不完美信息動態(tài)博弈基本上是相似的嗎?在位者企業(yè)和也許進(jìn)入者的盈利矩陣如下:擴(kuò)展成本低擴(kuò)展成本高在位者進(jìn)入者擴(kuò)展不擴(kuò)展在位者進(jìn)入者擴(kuò)展不擴(kuò)展進(jìn)入-1,21,1進(jìn)入-1,-11,1不進(jìn)入0,40,3不進(jìn)入0,00,3將其進(jìn)行Harsanyi轉(zhuǎn)換。并求在高成本概率為1/3時,該博弈的Nash均衡。(7--7)若(1)“自然”以均等的概率決定得益是下述得益矩陣1的狀況還是得益矩陣2的狀況,并讓博弈方1懂得而不讓博弈方2懂得;(2)慎奔方1在T和B中選擇,同步博奔方2在L和R中進(jìn)行選擇。找出該靜態(tài)貝葉斯博弈的所有純方略貝葉斯納什均衡。得益矩陣1得益矩陣212LRT1,10,0B0,00,012LRT0,00,0B0,02,2兩戶居民同步?jīng)Q定與否維護(hù)某合用的設(shè)施。假如只要有一戶人家維護(hù),兩戶人家就都能得到1單位好處;沒有人維護(hù)則兩戶人家均沒有好處。設(shè)兩戶人家維護(hù)的成本不一樣,分別為C1和C2。(1)假如假設(shè)C1和C2分別是0.1和0.5,該博弈的納什均衡是什么?博弈成果會怎樣?(2)假如C1和C2都是獨立均勻分布在[0,1]上的隨機(jī)變量,且真實水平只有每戶人家自己懂得,該博弈的貝葉斯納什均衡是什么?雙寡頭古諾產(chǎn)量競爭模型中廠商i的利潤函數(shù)為,i=1,2。若是兩個廠商的共同知識,而則是廠商2的私人信息,廠商1只懂得為3/4或5/4,且取這兩個值的概率相等。若兩個廠商同步選擇產(chǎn)量,請找出該博弈的純方略貝葉斯均衡。參照答案:1.答:直接機(jī)制在拍賣規(guī)則設(shè)計個最大的意義在于可以簡化拍賣規(guī)則的設(shè)計。由于理論證明任何一種貝葉斯納什均衡都可以用一種說實話的直接機(jī)制代表(揭示原理)
溫馨提示
- 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
- 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
- 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
- 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負(fù)責(zé)。
- 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請與我們聯(lián)系,我們立即糾正。
- 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時也不承擔(dān)用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。
最新文檔
- 上海市延安中學(xué)2024-2025學(xué)年高三下學(xué)期2月練習(xí)數(shù)學(xué)試題(原卷版+解析版)
- 質(zhì)量管理制度職責(zé)程序的培訓(xùn)
- 部編版語文教學(xué)建議培訓(xùn)
- 蝦皮培訓(xùn)工作流程
- 2025年丙型肝炎抗原檢測試劑盒項目合作計劃書
- 未來賽車概念車試駕活動行業(yè)深度調(diào)研及發(fā)展戰(zhàn)略咨詢報告
- 非機(jī)構(gòu)債券投資企業(yè)數(shù)字化轉(zhuǎn)型與智慧升級戰(zhàn)略研究報告
- 咖啡飲料批發(fā)企業(yè)縣域市場拓展與下沉戰(zhàn)略研究報告
- 物流設(shè)備企業(yè)縣域市場拓展與下沉戰(zhàn)略研究報告
- 樂器百貨企業(yè)ESG實踐與創(chuàng)新戰(zhàn)略研究報告
- GA/T 701-2024安全防范指紋識別應(yīng)用出入口控制指紋識別模塊通用規(guī)范
- 4.1 人要有自信 (課件)2024-2025學(xué)年七年級道德與法治下冊(統(tǒng)編版2024)
- 加強(qiáng)學(xué)校鑄牢中華民族共同體意識教育心得
- 16.3 二次根式的加減 - 人教版數(shù)學(xué)八年級下冊教學(xué)課件
- 馬尼拉草皮施工方案
- 人工智能融入土木水利碩士人才培養(yǎng)模式研究
- 人工智能賦能新質(zhì)生產(chǎn)力發(fā)展:現(xiàn)狀解析與未來展望
- 2024版非ST段抬高型急性冠脈綜合征診斷和治療指南解讀
- 2021年安徽省中考數(shù)學(xué)試卷-普通卷
- 《 大學(xué)生軍事理論教程》全套教學(xué)課件
- 中考數(shù)學(xué)計算題練習(xí)100道(2024年中考真題)
評論
0/150
提交評論