第十二章 對(duì)策論(運(yùn)籌學(xué)講義)_第1頁(yè)
第十二章 對(duì)策論(運(yùn)籌學(xué)講義)_第2頁(yè)
第十二章 對(duì)策論(運(yùn)籌學(xué)講義)_第3頁(yè)
第十二章 對(duì)策論(運(yùn)籌學(xué)講義)_第4頁(yè)
第十二章 對(duì)策論(運(yùn)籌學(xué)講義)_第5頁(yè)
已閱讀5頁(yè),還剩63頁(yè)未讀, 繼續(xù)免費(fèi)閱讀

下載本文檔

版權(quán)說(shuō)明:本文檔由用戶(hù)提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請(qǐng)進(jìn)行舉報(bào)或認(rèn)領(lǐng)

文檔簡(jiǎn)介

1、第十章 對(duì)策論 由“齊王賽馬”引入1 1 對(duì)策論的例子2 2矩陣矩陣對(duì)策論的基本概念3 3 矩陣對(duì)策的最優(yōu)純策略矩陣對(duì)策的最優(yōu)純策略4 4矩陣對(duì)策的混合策略矩陣對(duì)策的混合策略5 5 其他類(lèi)型的對(duì)策其他類(lèi)型的對(duì)策對(duì)策論或博弈論(Game Theory) 是研究具有對(duì)抗和競(jìng)爭(zhēng)性行為問(wèn)題的數(shù)學(xué)理論與方法。是運(yùn)籌學(xué)的重要分支學(xué)科經(jīng)濟(jì)學(xué)領(lǐng)域一般稱(chēng)博弈論,是經(jīng)濟(jì)學(xué)領(lǐng)域近幾十年發(fā)展起來(lái)一門(mén)新興學(xué)科對(duì)策論從理論上作嚴(yán)格的討論卻起始于二十世紀(jì):1912年,德國(guó)數(shù)學(xué)家E.Zermelo證明了國(guó)際象棋的3種著法必定存在一種;1921年,法國(guó)數(shù)學(xué)家E.Borel引入了“最優(yōu)策略”等概念;1928年,美籍匈牙利人J.V

2、on Neumann證明了對(duì)策論的基本定理-最大值最小值定理;1944年,Von Neumann和O.Morgenstern合寫(xiě)了對(duì)策論與經(jīng)濟(jì)行為一書(shū),建立起對(duì)策論的基本理論,奠定了對(duì)策論研究的基礎(chǔ)。對(duì)策問(wèn)題舉例例例1 1 猜單和猜雙的博弈。兩個(gè)人同時(shí)出一個(gè)指頭或兩個(gè)指頭,猜單和猜雙的博弈。兩個(gè)人同時(shí)出一個(gè)指頭或兩個(gè)指頭,如果兩人出的指頭相同,則局中人如果兩人出的指頭相同,則局中人1 1從局中人從局中人2 2處贏得五元;處贏得五元;如果出的不一樣,局中人如果出的不一樣,局中人1 1就要支付給局中人就要支付給局中人2 2五元。兩個(gè)五元。兩個(gè)對(duì)手都可以采取兩個(gè)策略:出一個(gè)手指和出兩個(gè)手指,下對(duì)手都

3、可以采取兩個(gè)策略:出一個(gè)手指和出兩個(gè)手指,下表是局中人表是局中人1 1的贏得矩陣的贏得矩陣( (二指莫拉問(wèn)題二指莫拉問(wèn)題) )策 略局中人2出1指出2指局中人1出1指55出2指55局中人局中人1 1從局中人從局中人2 2該如何選擇策略,已獲得利益?該如何選擇策略,已獲得利益?例例2 2 囚徒困境。兩個(gè)嫌疑犯作案后被警察抓住,分別被關(guān)在囚徒困境。兩個(gè)嫌疑犯作案后被警察抓住,分別被關(guān)在不同的屋子里審訊。警察告訴他們:如果兩人都坦白,各不同的屋子里審訊。警察告訴他們:如果兩人都坦白,各判刑判刑8 8年;如果兩人都抵賴(lài),由于證據(jù)不充分,兩人將各年;如果兩人都抵賴(lài),由于證據(jù)不充分,兩人將各判刑判刑2 2

4、年;如果其中一人坦白,另一人抵賴(lài),則坦白者年;如果其中一人坦白,另一人抵賴(lài),則坦白者立即釋放,抵賴(lài)者判刑立即釋放,抵賴(lài)者判刑1010年。在這個(gè)例子中兩人嫌疑犯都年。在這個(gè)例子中兩人嫌疑犯都有兩種策略:坦白或抵賴(lài)。可以用一個(gè)矩陣表示兩個(gè)嫌疑有兩種策略:坦白或抵賴(lài)??梢杂靡粋€(gè)矩陣表示兩個(gè)嫌疑犯的策略的損益犯的策略的損益策 略囚徒2坦白抵賴(lài)囚徒1坦白(8, 8)(0, 10)抵賴(lài)(10, 0)(2, 2)囚徒該如何選擇策略?囚徒該如何選擇策略?囚徒困境反映了個(gè)人理性和集體理性的矛盾。對(duì)于雙方,(抵賴(lài),抵賴(lài))囚徒困境反映了個(gè)人理性和集體理性的矛盾。對(duì)于雙方,(抵賴(lài),抵賴(lài))的結(jié)果是最好的,但因?yàn)槊總€(gè)囚徒

5、都是理性人,他們追求自身效應(yīng)的最的結(jié)果是最好的,但因?yàn)槊總€(gè)囚徒都是理性人,他們追求自身效應(yīng)的最大化,結(jié)果就變成了(坦白,坦白)。個(gè)人理性導(dǎo)致了集體不理性大化,結(jié)果就變成了(坦白,坦白)。個(gè)人理性導(dǎo)致了集體不理性例3 田忌與齊王賽馬 戰(zhàn)國(guó)時(shí)期,齊威王與大將田忌賽馬,雙方約定:從各戰(zhàn)國(guó)時(shí)期,齊威王與大將田忌賽馬,雙方約定:從各自的自的上、中、下三個(gè)等級(jí)上、中、下三個(gè)等級(jí)的馬中各選一匹馬出場(chǎng)比賽,負(fù)者的馬中各選一匹馬出場(chǎng)比賽,負(fù)者要付給勝者一千金。已知田忌的馬要比齊王同一等級(jí)的馬差要付給勝者一千金。已知田忌的馬要比齊王同一等級(jí)的馬差一些,但比齊王等級(jí)較低的馬卻要強(qiáng)一些。因此,如用同等一些,但比齊王等

6、級(jí)較低的馬卻要強(qiáng)一些。因此,如用同等級(jí)的馬對(duì)抗,田忌必連輸三場(chǎng),失三千金無(wú)疑。田忌的謀士級(jí)的馬對(duì)抗,田忌必連輸三場(chǎng),失三千金無(wú)疑。田忌的謀士孫臏給田忌出了個(gè)主意:每局比賽前先了解齊王參賽馬的等孫臏給田忌出了個(gè)主意:每局比賽前先了解齊王參賽馬的等級(jí),再采用級(jí),再采用下等馬對(duì)齊王上等馬下等馬對(duì)齊王上等馬、中等馬對(duì)齊王下等馬中等馬對(duì)齊王下等馬、上上等馬對(duì)齊王中等馬等馬對(duì)齊王中等馬的策略。比賽結(jié)果,田忌二勝一負(fù),反而的策略。比賽結(jié)果,田忌二勝一負(fù),反而贏得一千金。由此可見(jiàn),雙方各采取什么樣的出馬次序?qū)仝A得一千金。由此可見(jiàn),雙方各采取什么樣的出馬次序?qū)儇?fù)至關(guān)重要。負(fù)至關(guān)重要。“齊王賽馬齊王賽馬”齊王

7、在各局勢(shì)中的益損值表齊王在各局勢(shì)中的益損值表(單位:千金單位:千金)齊王和田忌可以任意選擇三匹馬出場(chǎng)的順序齊王和田忌可以任意選擇三匹馬出場(chǎng)的順序1 1對(duì)策論的基本概念對(duì)策模型的三個(gè)基本要素:對(duì)策模型的三個(gè)基本要素:1.1.局中人局中人( (Players) ):參與對(duì)抗的各方;:參與對(duì)抗的各方;2.2.策略集策略集(Strategices):(Strategices):局中人選擇對(duì)付其它局中人的行動(dòng)局中人選擇對(duì)付其它局中人的行動(dòng)方案稱(chēng)為方案稱(chēng)為策略策略;某局中人的所有可能策略全體稱(chēng)為;某局中人的所有可能策略全體稱(chēng)為策略集策略集3.3.一局勢(shì)對(duì)策的益損值:局中人各自使用一個(gè)對(duì)策就形成了一局勢(shì)對(duì)策

8、的益損值:局中人各自使用一個(gè)對(duì)策就形成了一個(gè)局勢(shì)一個(gè)局勢(shì),一個(gè)局勢(shì)決定了各局中人的對(duì)策結(jié)果(量化),一個(gè)局勢(shì)決定了各局中人的對(duì)策結(jié)果(量化)稱(chēng)為該局勢(shì)對(duì)策的稱(chēng)為該局勢(shì)對(duì)策的益損值益損值。 贏得函數(shù)贏得函數(shù)(payoff function)(payoff function):定義在局勢(shì)上,取值為相應(yīng):定義在局勢(shì)上,取值為相應(yīng)益損值的函數(shù)益損值的函數(shù)4. 納什均衡:納什均衡:納什均衡指所有局中人最優(yōu)策略組成的一種局納什均衡指所有局中人最優(yōu)策略組成的一種局勢(shì),既在給定其他局中人策略的情況下,沒(méi)有任何局中人勢(shì),既在給定其他局中人策略的情況下,沒(méi)有任何局中人有積極性去選擇其他策略有積極性去選擇其他策略對(duì)

9、策的分類(lèi)對(duì)策按對(duì)策方式合作對(duì)策非合作對(duì)策完全理性有限理性?xún)扇藢?duì)策零和對(duì)策非零和對(duì)策多人對(duì)策結(jié)盟對(duì)策不結(jié)盟對(duì)策按對(duì)策人數(shù)靜態(tài)對(duì)策完全信息靜態(tài)對(duì)策不完全信息靜態(tài)對(duì)策動(dòng)態(tài)對(duì)策完全信息動(dòng)態(tài)對(duì)策不完全信息動(dòng)態(tài)對(duì)策按對(duì)策狀態(tài)二人有限零和對(duì)策二人有限零和對(duì)策(又稱(chēng)(又稱(chēng)矩陣對(duì)策矩陣對(duì)策):): 局中人為局中人為2 2;每個(gè)局中人的策略集的策略數(shù)目都是有限的;每個(gè)局中人的策略集的策略數(shù)目都是有限的;每一局勢(shì)的對(duì)策均有確定的損益值,并且對(duì)同一局勢(shì)的兩個(gè)每一局勢(shì)的對(duì)策均有確定的損益值,并且對(duì)同一局勢(shì)的兩個(gè)局中人的益損值之和為零。局中人的益損值之和為零。 通常將矩陣對(duì)策記為通常將矩陣對(duì)策記為: : G = S1,

10、S2, A局中人甲的策略集:局中人甲的策略集: 局中人乙的策略集:局中人乙的策略集:甲的贏得矩陣:甲的贏得矩陣: 矩陣對(duì)策矩陣對(duì)策112,mS212,nS111212122212mmmmmnaaaaaaAaaaaij為局中人甲在局勢(shì) 下的贏得(,)ij其中:齊王的策略集其中:齊王的策略集: : S1= 1, 2, 3, 4, 5, 6 , 田忌的策略集:田忌的策略集: S2= 1, 2, 3, 4, 5, 6 。下面矩陣稱(chēng)齊王的下面矩陣稱(chēng)齊王的贏得矩陣贏得矩陣: 3 1 1 1 -1 1 1 3 1 1 1 -1 A= 1 -1 3 1 1 1 -1 1 1 3 1 1 1 1 1 -1 3

11、1 1 1 -1 1 1 3 “齊王賽馬齊王賽馬”是一個(gè)矩陣策略。是一個(gè)矩陣策略。2 2 矩陣對(duì)策的最優(yōu)純策略矩陣對(duì)策的最優(yōu)純策略例4 甲、乙兩隊(duì)進(jìn)行球賽,雙方各可排出三種不同的陣容。設(shè)甲隊(duì)為局中人,乙隊(duì)為局中人,每一種陣容為一個(gè)策略,有S1 =1 , 2 , 3,S2 =1 , 2 , 3。根據(jù) 以往兩隊(duì)比賽的記錄,甲隊(duì)得分情況的贏得矩陣為415306213A問(wèn):這次比賽中,雙方應(yīng) 如何對(duì)陣?在如此反復(fù)對(duì)策的過(guò)程中,各局中人如果不想冒險(xiǎn),就應(yīng)該考慮從自身可能出現(xiàn)的最壞情況下著眼,去選擇一種盡可能好的結(jié)果,即雙方都是從各自可能出現(xiàn)的最不利即雙方都是從各自可能出現(xiàn)的最不利的情形選擇一種最為有利的

12、情況作為決策的依據(jù)。的情形選擇一種最為有利的情況作為決策的依據(jù)。這就是所謂“理智行為理智行為”。稱(chēng)為最小最大準(zhǔn)則最小最大準(zhǔn)則,按照這個(gè)各方均避免冒險(xiǎn)的觀念,就形成如下的推演過(guò)程推演過(guò)程。415306213A解 從A中可以看出,最多可得6分。于是,為得6分而選2 。但是推測(cè)會(huì)有此心理,從而選3來(lái)對(duì)付,使得非但得不到6分,反而要失去3分。當(dāng)然也會(huì)料到會(huì)有此心理,從而改選3 ,以使欲得3分而反失4分。矩陣矩陣A中每行的最小元素分別為中每行的最小元素分別為1,-3,-5。 在這些最少贏得中最好的結(jié)果是在這些最少贏得中最好的結(jié)果是1 1,故,故局中人局中人會(huì)采取會(huì)采取策略策略 1 1,無(wú)論對(duì)手采取何策略

13、,無(wú)論對(duì)手采取何策略,局中人局中人至少得至少得1 1分。對(duì)于分。對(duì)于局中人局中人, 1 1, 2 2, 3 3 可能帶來(lái)的最少贏得,即可能帶來(lái)的最少贏得,即A中每列的中每列的最大元素,分別為最大元素,分別為6,1,4。局中人局中人會(huì)采取會(huì)采取 2 2策略,確保策略,確保局局中人中人不會(huì)超過(guò)不會(huì)超過(guò)1 1分分。 1 1和和 2 2分別稱(chēng)為局中人分別稱(chēng)為局中人、 的最優(yōu)策略。由于雙方必的最優(yōu)策略。由于雙方必然選擇這一種策略,所以,這種策略又稱(chēng)為最優(yōu)純策略。然選擇這一種策略,所以,這種策略又稱(chēng)為最優(yōu)純策略。2 2 矩陣對(duì)策的最優(yōu)純策略矩陣對(duì)策的最優(yōu)純策略326035141AMin1356Max14

14、1 2 3 1 2 3定義定義1 1 設(shè)有矩陣對(duì)策設(shè)有矩陣對(duì)策G =S1, S2 ; A, 其中,其中, A = ai j mn ,若有若有vaaajiijijijji*maxminminmax則局勢(shì)則局勢(shì) (i* ,j*) 稱(chēng)為G在在純策略意義下的解純策略意義下的解,也稱(chēng),也稱(chēng)為為G的的鞍點(diǎn)鞍點(diǎn);i* 、j*分別稱(chēng)為局中人分別稱(chēng)為局中人和和的的最最優(yōu)純策略?xún)?yōu)純策略;v稱(chēng)為稱(chēng)為G的值,也稱(chēng)的值,也稱(chēng)對(duì)策值對(duì)策值。 對(duì)于例對(duì)于例4,G的解的解(鞍點(diǎn)鞍點(diǎn))為為 (1 ,2 ),1 、2分別為分別為、的最優(yōu)策略。對(duì)策值的最優(yōu)策略。對(duì)策值v = 1 0,反映優(yōu)勢(shì)在反映優(yōu)勢(shì)在方方(對(duì)對(duì)有利有利);若;若

15、v 0,為任一常數(shù)。則為任一常數(shù)。則 (1) (2) T(G1) = T(G2) 21GGvv定理定理9 設(shè)設(shè)G S1, S2; A為一矩陣對(duì)策,且為一矩陣對(duì)策,且A=AT為斜對(duì)稱(chēng)為斜對(duì)稱(chēng)矩陣,稱(chēng)這樣的對(duì)策為對(duì)稱(chēng)對(duì)策,則矩陣,稱(chēng)這樣的對(duì)策為對(duì)稱(chēng)對(duì)策,則 (1) vG =0 (2) T1 (G) = T2 (G) 其中其中T1 (G) 和和 T2 (G) 分別為局中人分別為局中人和和的最優(yōu)策略集的最優(yōu)策略集定理定理7和和8可以可以用來(lái)簡(jiǎn)化矩陣中的元素?cái)?shù)字,使得以后的求解用來(lái)簡(jiǎn)化矩陣中的元素?cái)?shù)字,使得以后的求解更為方便。更為方便。n矩陣對(duì)策的解法矩陣對(duì)策的解法 1優(yōu)超原則法優(yōu)超原則法 設(shè)有矩陣對(duì)策

16、設(shè)有矩陣對(duì)策G=S1, S2 ; A, 其中其中: A = ai j mn ,如果對(duì)一切如果對(duì)一切j =1,n,都有都有 即矩陣的第即矩陣的第 行元素均不小于行元素均不小于 行的元素,則行的元素,則稱(chēng)局中人稱(chēng)局中人的純策略的純策略 優(yōu)超于純策略?xún)?yōu)超于純策略 ;同樣,若對(duì)于;同樣,若對(duì)于一切一切i =1,m,有有 ,即矩陣的第即矩陣的第 列均不大于列均不大于 列的元素,則稱(chēng)局中人列的元素,則稱(chēng)局中人的純策略的純策略 優(yōu)超于純策略?xún)?yōu)超于純策略 112,mS212,nS00ijkjaa0i0k0i0k00i jikaa0j0k0j0k當(dāng)局中人當(dāng)局中人的純策略的純策略 優(yōu)超于純策略?xún)?yōu)超于純策略 時(shí),局

17、中人時(shí),局中人采用采用策略策略 超過(guò)采用策略超過(guò)采用策略 ;當(dāng)稱(chēng)局中人;當(dāng)稱(chēng)局中人的純策略的純策略 優(yōu)優(yōu)超于純策超于純策 時(shí),局中人時(shí),局中人采用純策略采用純策略 超過(guò)采用純策略超過(guò)采用純策略 。在求解矩陣對(duì)策時(shí),如果出現(xiàn)上述優(yōu)超情況,可將矩。在求解矩陣對(duì)策時(shí),如果出現(xiàn)上述優(yōu)超情況,可將矩陣陣A的第的第 行刪除;當(dāng)行刪除;當(dāng)?shù)募儾呗缘募儾呗?優(yōu)超于純策優(yōu)超于純策 時(shí),時(shí),可以將矩陣可以將矩陣A第第 列刪除。列刪除。優(yōu)超原則可以?xún)?yōu)超原則可以縮小了縮小了A A的規(guī)模的規(guī)模,使計(jì)算簡(jiǎn)化。一般情況下,優(yōu),使計(jì)算簡(jiǎn)化。一般情況下,優(yōu)超原理只是一種超原理只是一種降階技術(shù)降階技術(shù),但如精簡(jiǎn)之后,但如精簡(jiǎn)之后

18、,A A中的剩余元素中的剩余元素僅有一個(gè),則意味著已求得了對(duì)策的鞍點(diǎn)僅有一個(gè),則意味著已求得了對(duì)策的鞍點(diǎn)。0i0k0j0k0i0k0k0j0k0j0k0k 例例9 9 求解矩陣對(duì)策,其中:求解矩陣對(duì)策,其中:586510126110A585106151061解解 查視各列,發(fā)現(xiàn)可劃去第查視各列,發(fā)現(xiàn)可劃去第1 1列,列,得得查視各行,發(fā)現(xiàn)可劃去第查視各行,發(fā)現(xiàn)可劃去第3 3行,得行,得查視各行列,知已無(wú)法繼續(xù)優(yōu)超,查視各行列,知已無(wú)法繼續(xù)優(yōu)超,故原矩陣故原矩陣A A被簡(jiǎn)化為被簡(jiǎn)化為22規(guī)模規(guī)模。 二、二、2 22 2公式解法公式解法設(shè)矩陣對(duì)策中的設(shè)矩陣對(duì)策中的A A為為11122122aaAa

19、a1*2*1*222*112*221*111xxvxaxavxaxa1*2*1*222*121*212*111yyvyayavyaya若無(wú)鞍點(diǎn),則若無(wú)鞍點(diǎn),則X*與與Y*中各分量必不為零中各分量必不為零 ( (否則,假定否則,假定 ,則則 ,局中人,局中人選擇純策略選擇純策略1 1,局中人,局中人選擇選擇 中最小元素對(duì)應(yīng)的策略,即對(duì)策存在有鞍點(diǎn)中最小元素對(duì)應(yīng)的策略,即對(duì)策存在有鞍點(diǎn)) )。由定理由定理6 6的的(3)、(4),得,得*10 x *21x2122,aa二、二、2 22 2公式解法公式解法*2221111221221*11122111221221*2212111221221*112

20、121112212211122122111221221 ,1 ,1 Gaaxaaaaaaxxaaaaaayaaaaaayyaaaaa aaavvaaaa求解后,得:求解后,得:(11)1342A用用2 22 2求解例求解例5 5 已知矩陣對(duì)策已知矩陣對(duì)策G, ,其中:其中:解解 G是不存在鞍點(diǎn)是不存在鞍點(diǎn)*1*2*1*22421,12344213112342231,1234414312344212105.123442Gxxyyv 用用2 22 2求解例求解例9 9*12231571111552222222222Gxxyyv,;,;5002.5A 求解例求解例7 7 已知矩陣對(duì)策已知矩陣對(duì)策G,

21、 ,其中:其中:解解 利用優(yōu)超原理得利用優(yōu)超原理得*1*21*1*212.50152.50032132.50152.500321352.512.55.52.5007.53Gxxxyyyv555002.507.5A用公式計(jì)算用公式計(jì)算得:得:矩陣對(duì)策的解矩陣對(duì)策的解 :X* = (0,1/3, 2/3,0) T , Y* = (1/3, 2/3) T vG = 53三、三、2 2n n和和m m2 2圖解法圖解法 當(dāng)對(duì)策雙方中的當(dāng)對(duì)策雙方中的某一方策略個(gè)數(shù)為某一方策略個(gè)數(shù)為2 2,而另一方策略個(gè),而另一方策略個(gè)數(shù)大于數(shù)大于2 2時(shí),可以采用圖解法來(lái)方便地求解這類(lèi)對(duì)策問(wèn)題。時(shí),可以采用圖解法來(lái)方便

22、地求解這類(lèi)對(duì)策問(wèn)題。下面通過(guò)例子來(lái)介紹這種直觀的幾何方法。下面通過(guò)例子來(lái)介紹這種直觀的幾何方法。1713902A用一個(gè)例子來(lái)看解法用一個(gè)例子來(lái)看解法例例10 10 求解矩陣對(duì)策,其中求解矩陣對(duì)策,其中: :解解 顯然,顯然,G G無(wú)鞍點(diǎn)且無(wú)優(yōu)超關(guān)系。無(wú)鞍點(diǎn)且無(wú)優(yōu)超關(guān)系。設(shè)局中人設(shè)局中人的混合策略為的混合策略為X = (x1 , x2 )T = (x , 1x ) T,則按則按“理智行為理智行為”,期望的贏得為期望的贏得為1.1.考慮考慮2n 階矩陣階矩陣1112121222nnaaaAaaa*21101max min,max min(, )jxYSXSvEX YE Xj 1T121222(,

23、)( ,1- )(1)()jjjjjjjaE X jxxa xaxaaxaa1010101max min9 1,7 ,132 1max min89, 7 ,152max ( )xxxvxxxxxxxxfx在在Oxv平面直角坐標(biāo)系中,平面直角坐標(biāo)系中,x0, 1 畫(huà)直線(xiàn)段(圖畫(huà)直線(xiàn)段(圖10-110-1):):L1 : v = -8x + 9L2 : v = 7xL3 : v = 15x - 2圖圖10-110-1xvO2468101Cx*DEFL1L2L3于是,v = f (x) 的圖形就是折線(xiàn)CDEF。因?yàn)镋點(diǎn)是折線(xiàn)的最高點(diǎn),所以v = f (x*)。注意到E點(diǎn)是L1與L2的交點(diǎn),求解xvx

24、v798得x*= 35 ,vG = 215 ,的最優(yōu)混合策略為X* = (3/5, 2/5)T。圖圖10-110-1xvO2468101Cx*DEFL1L2L3設(shè)局中人的最優(yōu)混合策略為Y* = (y1*,y2*,y3*)T,則由定理6知*123*1321(1,)713521(2,)925EYyyyEYyy圖圖10-110-1xvO2468101Cx*DEFL1L2L3*123*1321(1,)713521(2,)925EYyyyEYyy根據(jù)定理根據(jù)定理6 6 得得y3*=0=0。也可根據(jù)。也可根據(jù)E點(diǎn)只與點(diǎn)只與L L1 1、L L2 2有關(guān)且此處有關(guān)且此處L L3 3高高于于E E點(diǎn),即只與點(diǎn)

25、,即只與1 1, ,2 2有關(guān)且有關(guān)且3 3不必考慮不必考慮, ,所以所以, ,y3*= 0 = 0 ,代入上式,可解得代入上式,可解得 y1* = 715,y2* = 815。于是,于是,的最優(yōu)混合策略為的最優(yōu)混合策略為 Y* = = (7/15, 8/15, 0) T。 矩陣對(duì)策的解矩陣對(duì)策的解 X* = = (3/5, 2/5) T , Y* = = (7/15, 8/15, 0) T vG = 215注意:注意:*21(,1)(,2)5321(,3)152755E XE XE X例例11 11 求解矩陣對(duì)策,其中求解矩陣對(duì)策,其中: :解解 顯然,顯然,G G無(wú)鞍點(diǎn)使用優(yōu)超原理,無(wú)鞍點(diǎn)

26、使用優(yōu)超原理,1 1優(yōu)超優(yōu)超4 4,刪去第刪去第4 4行,將行,將A A簡(jiǎn)化為簡(jiǎn)化為設(shè)局中人設(shè)局中人的混合策略為的混合策略為Y = (y1 , y2 )T = (y , 1y ) T,則按則按“理智行為理智行為”, 期望的贏得為期望的贏得為2.2.考慮考慮m2階矩陣階矩陣111221221mmaaaaAaa15442305A154423A*212011220101min max,min max( ,) min max()min( )yiYSXSiiiyyivEX YE i Yaayag y在在Oxv平面直角坐標(biāo)系中,平面直角坐標(biāo)系中,y0, 1 畫(huà)直線(xiàn)段(圖畫(huà)直線(xiàn)段(圖10-210-2):):

27、L1 : v = 6y5L2 : v = 8y4L3 : v = 5y 3( )max65,84,53g yyyy圖圖10-2yvO2461Fy*DECL1L2L342v = g (y) 的圖形就是折線(xiàn)CDEF。因?yàn)镋點(diǎn)是折線(xiàn)的最低點(diǎn),所以 v = g (y*)。注意到E點(diǎn)是L1與L3的交點(diǎn),求解圖圖10-2yvO2461Fy*DECL1L2L342求解求解3556yvyv得得 y*= 811,v = 711,的最優(yōu)混合策略為的最優(yōu)混合策略為Y* = (8/11, 3/11)T。*123*1237(,1)42117(,2)54311E XxxxE Xxxx 設(shè)局中人設(shè)局中人的最優(yōu)混合策略為的最

28、優(yōu)混合策略為:X* = (x1*,x2*,x3*,0 )T, y1*0 , y2*0 則由定理則由定理6 6知知 圖圖10-2yvO2461Fy*DECL1L2L342矩陣對(duì)策的解:矩陣對(duì)策的解: X* = (5/11, 0, 6/11, 0) T ,Y* = (8/11, 3/11)T。v G= 711根據(jù)定理根據(jù)定理6 6 得得x2*=0=0。也可根。也可根據(jù)據(jù)由由于于E點(diǎn)只與點(diǎn)只與L1、L3相關(guān)相關(guān), ,且此處且此處L2低于低于E E點(diǎn),即只與點(diǎn),即只與1 1、3 3相相關(guān)且關(guān)且2 2不必考慮,所以不必考慮,所以x2* = 0,代入上式,可解得代入上式,可解得x1* = 511,x3*

29、= 611。于是,于是,的最優(yōu)混合策略為的最優(yōu)混合策略為X* = (5/11, 0, 6/11, 0) T。*21832072,4411111111jnjjEYa y 四、線(xiàn)性規(guī)劃解法 (最通用、應(yīng)用最廣的方法)1,2,iixximw對(duì)于前述各種方法全都對(duì)于前述各種方法全都失效失效的一般形式的矩陣對(duì)策,線(xiàn)性規(guī)劃的一般形式的矩陣對(duì)策,線(xiàn)性規(guī)劃解法是最通用的方法,可以求解任一矩陣對(duì)策。解法是最通用的方法,可以求解任一矩陣對(duì)策。由定理由定理5 5知,求解矩陣對(duì)策可等價(jià)地轉(zhuǎn)化為求解互為對(duì)偶的線(xiàn)性知,求解矩陣對(duì)策可等價(jià)地轉(zhuǎn)化為求解互為對(duì)偶的線(xiàn)性規(guī)劃規(guī)劃(P)和和(D),故在問(wèn)題(),故在問(wèn)題(P)中,令

30、)中,令。則問(wèn)題則問(wèn)題(P)的約束條件變?yōu)榈募s束條件變?yōu)椋?11,1,2,1 0,1,2,mijiimiiia xjnxwxim 問(wèn)題問(wèn)題(P)等價(jià)與線(xiàn)性規(guī)劃問(wèn)題等價(jià)與線(xiàn)性規(guī)劃問(wèn)題( )P11min (P )1,1,2,0,1,2,miimijiiixa xjnxim (12) 乘以A第j列X 四、線(xiàn)性規(guī)劃解法 (最通用、應(yīng)用最廣的方法)1,2,jjyyjmv同理在問(wèn)題(同理在問(wèn)題(D)中,令)中,令可知問(wèn)題可知問(wèn)題(D)等價(jià)于等價(jià)于線(xiàn)性規(guī)劃問(wèn)題線(xiàn)性規(guī)劃問(wèn)題( )D11max (D )1,1,2,0,1,2,mjimijjjijya yimyjn (13) 問(wèn)題問(wèn)題( ) 和和( ) 是是互為

31、對(duì)偶的線(xiàn)性規(guī)劃,互為對(duì)偶的線(xiàn)性規(guī)劃,可用單純形或?qū)捎脝渭冃位驅(qū)ε紗渭冃畏ㄇ蠼?,再由變換偶單純形法求解,再由變換(12)和和(13),即可得到原問(wèn)題的解,即可得到原問(wèn)題的解和對(duì)策值和對(duì)策值DP A第i行列乘以Y例例12 求解矩陣對(duì)策,其中:求解矩陣對(duì)策,其中:821482248A123123123123123max. 8421 2841 281 ,0zyyys tyyyyyyyyyyyy解解 易知,易知,G無(wú)鞍點(diǎn)且無(wú)法優(yōu)超。求解問(wèn)題無(wú)鞍點(diǎn)且無(wú)法優(yōu)超。求解問(wèn)題可化成線(xiàn)性規(guī)劃問(wèn)題可化成線(xiàn)性規(guī)劃問(wèn)題迭代后,得規(guī)劃最優(yōu)解:迭代后,得規(guī)劃最優(yōu)解: = (1/14, 11/196, 5/49)T,對(duì)偶規(guī)劃

32、最優(yōu)解對(duì)偶規(guī)劃最優(yōu)解 = (5/49, 11/196, 1/14) T,最優(yōu)值最優(yōu)值 z* = 45196,vG =1z*=19645,X* = v = (20/45, 11/45, 14/45) TY* = v = (14/45, 11/45, 20/45) T*Y*X*X*Y例:求解例:求解“齊王賽馬齊王賽馬”問(wèn)題。問(wèn)題。已知齊王的贏得矩陣已知齊王的贏得矩陣A A求得求得故不存在純策略問(wèn)題下的解,可求其混合策略。故不存在純策略問(wèn)題下的解,可求其混合策略。A A中有負(fù)元素,可以取中有負(fù)元素,可以取k=2,k=2,在在A A的每個(gè)元素上加的每個(gè)元素上加2 2得到得到AA如下:如下:311111

33、131111113111111311111131111113A3maxmin1minmaxijijijjiaa533133351333335331333513133353313335A4 4矩陣對(duì)策的混合策略矩陣對(duì)策的混合策略 建立對(duì)建立對(duì)G=S1,S2,A中求甲方最佳策略的線(xiàn)性規(guī)劃如下:中求甲方最佳策略的線(xiàn)性規(guī)劃如下: Min x1+x2+x3+x4+x5+x6 s.t. 5x1+3x2+3x3+x4+3x5+3x6 1 3x1+5x2+x3+3x4+3x5+3x6 1 3x1+3x2+5x3+3x4+3x5+x6 1 3x1+3x2+3x3+5x4+x5+3x6 1 x1+3x2+3x3+

34、3x4+5x5+3x6 1 3x1+x2+3x3+3x4+3x5+5x6 1 xi 0, i=1,2,6 可解得解為:可解得解為:x1=x4=x5=0, x2=x3=x6=0.111, v=3, x1=x4=x5= 0,x2= vx2= x3=x6=1/3, 即即X* =(0,1/3,1/3,0,0,1/3)T,所以甲的最優(yōu)策略為作出,所以甲的最優(yōu)策略為作出策略策略 2、 3、 6的概率都為的概率都為0.333,而作出而作出 1、 4、 5 的概率為的概率為0,此時(shí),此時(shí)VG=V2=1。 同樣可以建立對(duì)策同樣可以建立對(duì)策G=S1,S2,A中求乙方最佳策略的線(xiàn)性規(guī)劃如下:中求乙方最佳策略的線(xiàn)性規(guī)

35、劃如下: Min y1+y2+y3+y4+y5+y6 約束條件:約束條件: 5y1+3y2+3y3+3y4+y5+3y6 1 3y1+5y2+3y3+3y4+3y5+y6 1 3y1+y2+5y3+3y4+3y5+3y6 1 y1+3y2+3y3+5y4+3y5+3y6 1 3y1+3y2+3y3+y4+5y5+3y6 1 3y1+3y2+y3+3y4+3y5+5y6 1 yi0,i=1,2,6 可解得解為:可解得解為: y1=y4=y5=0.111, y2=y3=y6=0, v=3, y1=y4=y5= 1/3, y2=y3=y6=0,即,即Y* =(1/3,0,0,1/3,1/3,0)T。

36、 所以田忌的最優(yōu)混合策略為作出策略所以田忌的最優(yōu)混合策略為作出策略 1、 4、 5的概率都為的概率都為1/3,而作出而作出 2, 3, 6的概率為的概率為0,此時(shí),此時(shí)VG=VG-k=1。4 4矩陣對(duì)策的混合策略矩陣對(duì)策的混合策略 齊王賽馬問(wèn)題的對(duì)策最優(yōu)解可簡(jiǎn)記為齊王賽馬問(wèn)題的對(duì)策最優(yōu)解可簡(jiǎn)記為X X* *= =(0,1/3,1/3,0,0,1/3)(0,1/3,1/3,0,0,1/3)T T,Y Y* *= =(1/3,0,0,1/3,1/3,0)(1/3,0,0,1/3,1/3,0)T T,對(duì)策值,對(duì)策值V VG G=1=1。例例 兩個(gè)局中人進(jìn)行對(duì)策,規(guī)則是兩人互相獨(dú)立的各自從兩個(gè)局中人進(jìn)

37、行對(duì)策,規(guī)則是兩人互相獨(dú)立的各自從1 1、2 2、3 3這三個(gè)這三個(gè)數(shù)字中任意選寫(xiě)一個(gè)數(shù)字。如果兩人所寫(xiě)的數(shù)字之和為偶數(shù),則局中人數(shù)字中任意選寫(xiě)一個(gè)數(shù)字。如果兩人所寫(xiě)的數(shù)字之和為偶數(shù),則局中人乙支付給局中人甲以數(shù)量為此和數(shù)的報(bào)酬;如果兩人所寫(xiě)數(shù)字之和為奇乙支付給局中人甲以數(shù)量為此和數(shù)的報(bào)酬;如果兩人所寫(xiě)數(shù)字之和為奇數(shù),則局中人甲付給局中人乙以數(shù)量為此和數(shù)的報(bào)酬。試求出其最優(yōu)策數(shù),則局中人甲付給局中人乙以數(shù)量為此和數(shù)的報(bào)酬。試求出其最優(yōu)策略。略。 解:首先計(jì)算局中人甲的贏得矩陣如下表:解:首先計(jì)算局中人甲的贏得矩陣如下表:4-56-34-52-34 1 1(出(出1 1) 2 2(出(出2 2)

38、 3 3(出(出3 3) 3 3(出(出3 3) 2 2(出(出2 2) 1 1(出(出1 1)甲的贏甲的贏 得得甲的策略甲的策略乙的策略乙的策略即甲的贏得矩陣為即甲的贏得矩陣為A A: 可知無(wú)純策略意義的解,下面求其在混合策略下的解??芍獰o(wú)純策略意義的解,下面求其在混合策略下的解。A A的各元素都加上的各元素都加上6 6,得到,得到建立線(xiàn)性規(guī)劃模型如下:建立線(xiàn)性規(guī)劃模型如下: Min xMin x1 1+x+x2 2+x+x3 3 Max yMax y1 1+y+y2 2+y+y3 3 S.T.8xS.T.8x1 1+3x+3x2 2+10 x+10 x3 3 1 8y1 8y1 1+3y+

39、3y2 2+10y+10y3 311 3x 3x1 1+10 x+10 x2 2+x+x3 3 1 3y1 3y1 1+10y+10y2 2+y+y3 3 11 10 x 10 x1 1+x+x2 2+12x+12x3 3 1 10y1 10y1 1+y+y2 2+12y+12y3 311 x x1 1,x,x2 2,x,x3 3 0 y0 y1 1,y,y2 2,y,y3 3 00 654543432A1211011031038A4 4矩陣對(duì)策的混合策略矩陣對(duì)策的混合策略得到得到x x1 1=0.25, x=0.25, x2 2=0.50, x=0.50, x3 3=0.25=0.25;y

40、y1 1=0.25, y=0.25, y2 2=0.50, y=0.50, y3 3=0.25=0.25。即此對(duì)策的解為即此對(duì)策的解為X X* * =(0.25,0.50,0.25)=(0.25,0.50,0.25)T T,Y Y* * =(0.25,0.50,0.25)=(0.25,0.50,0.25)T T。V VG G=V=VG G-k=0-k=0。4 4矩陣對(duì)策的混合策略矩陣對(duì)策的混合策略例例4 4 甲乙兩個(gè)企業(yè)生產(chǎn)同一種電子產(chǎn)品,甲企業(yè)可以采取的策略措施甲乙兩個(gè)企業(yè)生產(chǎn)同一種電子產(chǎn)品,甲企業(yè)可以采取的策略措施有有: :(1)(1)降低產(chǎn)品價(jià)格;降低產(chǎn)品價(jià)格;(2)(2)提高產(chǎn)品質(zhì)量;

41、提高產(chǎn)品質(zhì)量;(3)(3)推出新產(chǎn)品。乙企業(yè)考慮推出新產(chǎn)品。乙企業(yè)考慮采取的策略措施有采取的策略措施有(1)(1)增加廣告費(fèi)用;增加廣告費(fèi)用;(2)(2)增設(shè)維修網(wǎng)點(diǎn),加強(qiáng)售后服務(wù);增設(shè)維修網(wǎng)點(diǎn),加強(qiáng)售后服務(wù);(3)(3)改進(jìn)產(chǎn)品性能。由于甲乙兩個(gè)企業(yè)財(cái)力有限,都只能采取一個(gè)措施。改進(jìn)產(chǎn)品性能。由于甲乙兩個(gè)企業(yè)財(cái)力有限,都只能采取一個(gè)措施。假定這兩個(gè)企業(yè)所占有的市場(chǎng)總份額一定,由于各自采取的措施不同,假定這兩個(gè)企業(yè)所占有的市場(chǎng)總份額一定,由于各自采取的措施不同,通過(guò)預(yù)測(cè)今后兩個(gè)企業(yè)的市場(chǎng)占有份額變動(dòng)情況如下表,試求出這兩個(gè)通過(guò)預(yù)測(cè)今后兩個(gè)企業(yè)的市場(chǎng)占有份額變動(dòng)情況如下表,試求出這兩個(gè)企業(yè)各自的

42、最優(yōu)策略。企業(yè)各自的最優(yōu)策略。3-58-6510108-12 1 1(措施(措施1 1) 2 2(措施(措施2 2) 3 3(措施(措施3 3) 3 3(措施(措施3 3) 2 2(措施(措施2 2) 1 1(措施(措施1 1)4 4矩陣對(duì)策的混合策略矩陣對(duì)策的混合策略甲的贏甲的贏 得得甲的策略甲的策略乙的策略乙的策略解:解:易知此對(duì)策無(wú)純策略意義下的解。把易知此對(duì)策無(wú)純策略意義下的解。把A A的每一個(gè)元素加上的每一個(gè)元素加上1212,得到,得到A A建立線(xiàn)性規(guī)劃模型如下:建立線(xiàn)性規(guī)劃模型如下: Min xMin x1 1+x+x2 2+x+x3 3 Max yMax y1 1+y+y2 2+

43、y+y3 3 S.T.22xS.T.22x1 1+20 x+20 x2 21 22y1 22y1 1+6y+6y2 2+15y+15y3 3 11 6x 6x1 1+17x+17x2 2+22x+22x3 3 1 20y1 20y1 1+17y+17y2 2+7y+7y3 3 11 15x 15x1 1+7x+7x2 2+20 x+20 x3 3 1 22y1 22y2 2+20y+20y3 3 11 x x1 1,x,x2 2,x,x3 30 y0 y1 1,y,y2 2,y,y3 300得到:得到:x x1 1=0.027,x=0.027,x2 2=0.020,x=0.020,x3 3=0

44、.023=0.023;y y1 1=0.0225,y=0.0225,y2 2=0.0225,y=0.0225,y3 3=0.025=0.025。V=14.29V=14.29。x x1 1=0.3858, x=0.3858, x2 2=0.2858, x=0.2858, x3 3=0.3286=0.3286;y y1 1=0.3215,y=0.3215,y2 2=0.3215,y=0.3215,y3 3=0.3572=0.3572。即此對(duì)策的解為即此對(duì)策的解為 X X* * =(0.3858,0.2858,0.3286)=(0.3858,0.2858,0.3286)T T ,Y,Y* * =(0

45、.3215,0.3215,0.3572)=(0.3215,0.3215,0.3572)T T。V VG G=V=VG G-k=2.29-k=2.29。202207172015622A4 4矩陣對(duì)策的混合策略矩陣對(duì)策的混合策略 5 5其他類(lèi)型的對(duì)策論簡(jiǎn)介其他類(lèi)型的對(duì)策論簡(jiǎn)介 在對(duì)策論中可以根據(jù)不同方式對(duì)對(duì)策問(wèn)題進(jìn)行分類(lèi),通在對(duì)策論中可以根據(jù)不同方式對(duì)對(duì)策問(wèn)題進(jìn)行分類(lèi),通常分類(lèi)的方式有(常分類(lèi)的方式有(1)根據(jù)局中人的個(gè)數(shù),分為二人對(duì)策和多)根據(jù)局中人的個(gè)數(shù),分為二人對(duì)策和多人對(duì)策;(人對(duì)策;(2)根據(jù)各局中人的贏得函數(shù)的代數(shù)和是否為零,)根據(jù)各局中人的贏得函數(shù)的代數(shù)和是否為零,可分為零和對(duì)策和非

46、零和對(duì)策;(可分為零和對(duì)策和非零和對(duì)策;(3)根據(jù)局中人是否合作,)根據(jù)局中人是否合作,又可分為合作對(duì)策和非合作對(duì)策;(又可分為合作對(duì)策和非合作對(duì)策;(4)根據(jù)局中人的策略集)根據(jù)局中人的策略集中個(gè)數(shù),又分為有限對(duì)策和無(wú)限對(duì)策(或連續(xù)對(duì)策);(中個(gè)數(shù),又分為有限對(duì)策和無(wú)限對(duì)策(或連續(xù)對(duì)策);(5)也可根據(jù)局中人掌握信息的情況及決策選擇是否和時(shí)間有關(guān)也可根據(jù)局中人掌握信息的情況及決策選擇是否和時(shí)間有關(guān)可分為完全信息靜態(tài)對(duì)策、完全信息動(dòng)態(tài)對(duì)策、非完全信息可分為完全信息靜態(tài)對(duì)策、完全信息動(dòng)態(tài)對(duì)策、非完全信息靜態(tài)對(duì)策及非完全信息動(dòng)態(tài)對(duì)策;也可以根據(jù)對(duì)策模型的數(shù)靜態(tài)對(duì)策及非完全信息動(dòng)態(tài)對(duì)策;也可以根據(jù)對(duì)

47、策模型的數(shù)字特征又分為矩陣對(duì)策、連續(xù)對(duì)策、微分對(duì)策、陣地對(duì)策、字特征又分為矩陣對(duì)策、連續(xù)對(duì)策、微分對(duì)策、陣地對(duì)策、凸對(duì)策、隨機(jī)對(duì)策。凸對(duì)策、隨機(jī)對(duì)策。 本節(jié)只對(duì)對(duì)策論中非合作對(duì)策的完全信息對(duì)策、多人非本節(jié)只對(duì)對(duì)策論中非合作對(duì)策的完全信息對(duì)策、多人非合作對(duì)策、非零和對(duì)策作一個(gè)簡(jiǎn)單的敘述性介紹。合作對(duì)策、非零和對(duì)策作一個(gè)簡(jiǎn)單的敘述性介紹。 5 5其他類(lèi)型的對(duì)策論簡(jiǎn)介其他類(lèi)型的對(duì)策論簡(jiǎn)介一、完全信息靜態(tài)對(duì)策一、完全信息靜態(tài)對(duì)策 該對(duì)策是指掌握了參與人的特征、戰(zhàn)略空間、支付函數(shù)等知識(shí)和信該對(duì)策是指掌握了參與人的特征、戰(zhàn)略空間、支付函數(shù)等知識(shí)和信息并且參與人同時(shí)選擇行動(dòng)方案或雖非同時(shí)但后行動(dòng)者并不知道前

48、行動(dòng)息并且參與人同時(shí)選擇行動(dòng)方案或雖非同時(shí)但后行動(dòng)者并不知道前行動(dòng)者采取了什么行動(dòng)方案。者采取了什么行動(dòng)方案。 納什均衡是一個(gè)重要概念。在一個(gè)戰(zhàn)略組合中,給定其他參與者戰(zhàn)納什均衡是一個(gè)重要概念。在一個(gè)戰(zhàn)略組合中,給定其他參與者戰(zhàn)略的情況下,任何參與者都不愿意脫離這個(gè)組合,或者說(shuō)打破這個(gè)僵局,略的情況下,任何參與者都不愿意脫離這個(gè)組合,或者說(shuō)打破這個(gè)僵局,這種均衡就稱(chēng)為這種均衡就稱(chēng)為納什均衡納什均衡。下面以著名的。下面以著名的“囚徒困境囚徒困境”來(lái)進(jìn)一步闡述。來(lái)進(jìn)一步闡述。 例例1 “1 “囚徒困境囚徒困境”說(shuō)的是兩個(gè)囚犯的故事。這兩個(gè)囚徒一起做壞事,結(jié)果被說(shuō)的是兩個(gè)囚犯的故事。這兩個(gè)囚徒一起做

49、壞事,結(jié)果被警察發(fā)現(xiàn)抓了起來(lái),分別關(guān)在兩個(gè)獨(dú)立的不能互通信息的牢房里進(jìn)行審訊。在這警察發(fā)現(xiàn)抓了起來(lái),分別關(guān)在兩個(gè)獨(dú)立的不能互通信息的牢房里進(jìn)行審訊。在這種情形下,兩個(gè)囚犯都可以做出自己的選擇:或者坦白(即與警察合作,從而背種情形下,兩個(gè)囚犯都可以做出自己的選擇:或者坦白(即與警察合作,從而背叛他的同伙),或者抵賴(lài)(也就是與他的同伙合作,而不是與警察合作)。這兩叛他的同伙),或者抵賴(lài)(也就是與他的同伙合作,而不是與警察合作)。這兩個(gè)囚犯都知道,如果他倆都能抵賴(lài)的話(huà),就都會(huì)被釋放,因?yàn)橹灰麄兙懿怀姓J(rèn),個(gè)囚犯都知道,如果他倆都能抵賴(lài)的話(huà),就都會(huì)被釋放,因?yàn)橹灰麄兙懿怀姓J(rèn),警方無(wú)法給他們定罪。但警

50、方也明白這一點(diǎn),所以他們就給了這兩個(gè)囚犯一點(diǎn)兒警方無(wú)法給他們定罪。但警方也明白這一點(diǎn),所以他們就給了這兩個(gè)囚犯一點(diǎn)兒刺激:如果他們中的一個(gè)人坦白,即告發(fā)他的同伙,那么他就可以被無(wú)罪釋放。刺激:如果他們中的一個(gè)人坦白,即告發(fā)他的同伙,那么他就可以被無(wú)罪釋放。而他的同伙就會(huì)被按照最重的罪來(lái)判決。當(dāng)然,如果這兩個(gè)囚犯都坦白,兩個(gè)人而他的同伙就會(huì)被按照最重的罪來(lái)判決。當(dāng)然,如果這兩個(gè)囚犯都坦白,兩個(gè)人都會(huì)被按照輕罪來(lái)判決。如圖都會(huì)被按照輕罪來(lái)判決。如圖1-11-1所示。所示。 5 5其他類(lèi)型的對(duì)策論簡(jiǎn)介其他類(lèi)型的對(duì)策論簡(jiǎn)介坦白坦白抵賴(lài)抵賴(lài)輕罪,輕罪輕罪,輕罪重罪,無(wú)罪重罪,無(wú)罪重罪,無(wú)罪重罪,無(wú)罪釋放

51、,釋放釋放,釋放坦白坦白抵賴(lài)抵賴(lài)圖圖1-1 1-1 囚徒困境囚徒困境 由分析可知,上例中每個(gè)囚犯都會(huì)選擇坦白,因此這個(gè)戰(zhàn)略組合由分析可知,上例中每個(gè)囚犯都會(huì)選擇坦白,因此這個(gè)戰(zhàn)略組合是固定的,是固定的,( (坦白,坦白坦白,坦白) )就是納什均衡解。而這個(gè)均衡是不會(huì)被打破的,就是納什均衡解。而這個(gè)均衡是不會(huì)被打破的,即使他們?cè)谧沃斑_(dá)成協(xié)議。即使他們?cè)谧沃斑_(dá)成協(xié)議。 囚徒困境反映了個(gè)人理性和集體理性的矛盾。對(duì)于雙方,(抵賴(lài),囚徒困境反映了個(gè)人理性和集體理性的矛盾。對(duì)于雙方,(抵賴(lài),抵賴(lài))的結(jié)果是最好的,但因?yàn)槊總€(gè)囚徒都是理性人,他們追求自身效抵賴(lài))的結(jié)果是最好的,但因?yàn)槊總€(gè)囚徒都是理性人

52、,他們追求自身效應(yīng)的最大化,結(jié)果就變成了(坦白,坦白)。個(gè)人理性導(dǎo)致了集體不理應(yīng)的最大化,結(jié)果就變成了(坦白,坦白)。個(gè)人理性導(dǎo)致了集體不理性。性。 5 5其他類(lèi)型的對(duì)策論簡(jiǎn)介其他類(lèi)型的對(duì)策論簡(jiǎn)介二、完全信息動(dòng)態(tài)對(duì)策二、完全信息動(dòng)態(tài)對(duì)策 在完全信息靜態(tài)對(duì)策中,假設(shè)各方都同時(shí)選擇行動(dòng)。現(xiàn)在情況稍復(fù)在完全信息靜態(tài)對(duì)策中,假設(shè)各方都同時(shí)選擇行動(dòng)?,F(xiàn)在情況稍復(fù)雜一些。如果各方行動(dòng)存在先后順序,后行的一方會(huì)參考先行者的策略雜一些。如果各方行動(dòng)存在先后順序,后行的一方會(huì)參考先行者的策略而采取行動(dòng),而先行者也會(huì)知道后行者會(huì)根據(jù)他的行動(dòng)采取何種行動(dòng),而采取行動(dòng),而先行者也會(huì)知道后行者會(huì)根據(jù)他的行動(dòng)采取何種行動(dòng)

53、,因此先行者會(huì)考慮自己行動(dòng)會(huì)對(duì)后行者的影響后選擇行動(dòng)。這類(lèi)問(wèn)題稱(chēng)因此先行者會(huì)考慮自己行動(dòng)會(huì)對(duì)后行者的影響后選擇行動(dòng)。這類(lèi)問(wèn)題稱(chēng)為完全信息動(dòng)態(tài)對(duì)策問(wèn)題。為完全信息動(dòng)態(tài)對(duì)策問(wèn)題。 例例2 2 某行業(yè)中只有一個(gè)壟斷企業(yè)某行業(yè)中只有一個(gè)壟斷企業(yè)A A,有一個(gè)潛在進(jìn)入者,有一個(gè)潛在進(jìn)入者企業(yè)企業(yè)B B。B B可以選可以選擇進(jìn)入或不進(jìn)入該行業(yè)這兩種行動(dòng),而擇進(jìn)入或不進(jìn)入該行業(yè)這兩種行動(dòng),而A A當(dāng)當(dāng)B B進(jìn)入時(shí),可以選擇默認(rèn)或者報(bào)復(fù)兩種進(jìn)入時(shí),可以選擇默認(rèn)或者報(bào)復(fù)兩種行動(dòng)。如果行動(dòng)。如果B B進(jìn)入后進(jìn)入后A A企業(yè)報(bào)復(fù),將造成兩敗俱傷的結(jié)果,但如果企業(yè)報(bào)復(fù),將造成兩敗俱傷的結(jié)果,但如果A A默認(rèn)默認(rèn)B B

54、進(jìn)入,必進(jìn)入,必然對(duì)然對(duì)A A的收益造成損失。同樣的,如果的收益造成損失。同樣的,如果B B進(jìn)入而進(jìn)入而A A報(bào)復(fù),則報(bào)復(fù),則B B受損,反之,將受益。受損,反之,將受益。把此關(guān)系用圖把此關(guān)系用圖1-21-2表示。表示。默許默許報(bào)復(fù)報(bào)復(fù)50,10050,100-20,0-20,00,2000,2000,2000,200進(jìn)入進(jìn)入不進(jìn)入不進(jìn)入圖圖1-2 A1-2 A、B B的行動(dòng)及結(jié)果的行動(dòng)及結(jié)果A AB B 5 5其他類(lèi)型的對(duì)策論簡(jiǎn)介其他類(lèi)型的對(duì)策論簡(jiǎn)介 由分析可知,上例中(由分析可知,上例中(B B選擇不進(jìn)入,選擇不進(jìn)入,A A選擇報(bào)復(fù))和(選擇報(bào)復(fù))和(B B選擇進(jìn)入,選擇進(jìn)入,A A選擇默

55、許)都是納什均衡解。但在實(shí)際中,(選擇默許)都是納什均衡解。但在實(shí)際中,(B B選擇不進(jìn)入,選擇不進(jìn)入,A A選擇報(bào)復(fù))這種情況是不可能出現(xiàn)的。因?yàn)檫x擇報(bào)復(fù))這種情況是不可能出現(xiàn)的。因?yàn)锽 B知道他如果進(jìn)入,知道他如果進(jìn)入,A A只能默許,所以只有(只能默許,所以只有(B B選擇進(jìn)入,選擇進(jìn)入,A A選擇選擇默許)會(huì)發(fā)生?;蛘哒f(shuō),默許)會(huì)發(fā)生?;蛘哒f(shuō),A A選擇報(bào)復(fù)行動(dòng)是不可置信的威脅。選擇報(bào)復(fù)行動(dòng)是不可置信的威脅。對(duì)策論的術(shù)語(yǔ)中,稱(chēng)(對(duì)策論的術(shù)語(yǔ)中,稱(chēng)(A A選擇默許,選擇默許,B B選擇進(jìn)入)為精煉納什選擇進(jìn)入)為精煉納什均衡。當(dāng)只當(dāng)參與人的戰(zhàn)略在每一個(gè)子對(duì)策中都構(gòu)成納什均均衡。當(dāng)只當(dāng)參與

56、人的戰(zhàn)略在每一個(gè)子對(duì)策中都構(gòu)成納什均衡,這個(gè)納什均衡才稱(chēng)為衡,這個(gè)納什均衡才稱(chēng)為精煉納什均衡精煉納什均衡。 當(dāng)然,如果當(dāng)然,如果A A下定決心一定要報(bào)復(fù)下定決心一定要報(bào)復(fù)B B,即使自己暫時(shí)損失。,即使自己暫時(shí)損失。這時(shí)威脅就變成了可置信的,這時(shí)威脅就變成了可置信的,B B就會(huì)選擇不進(jìn)入,(就會(huì)選擇不進(jìn)入,(B B選擇不選擇不進(jìn)入,進(jìn)入,A A選擇報(bào)復(fù))就成為精煉納什均衡。選擇報(bào)復(fù))就成為精煉納什均衡。 軍事交戰(zhàn)時(shí),軍事交戰(zhàn)時(shí),“破釜沉舟破釜沉舟”講的就是一種可置信威脅。講的就是一種可置信威脅。實(shí)際企業(yè)經(jīng)營(yíng)中也有很多類(lèi)似的例子。實(shí)際企業(yè)經(jīng)營(yíng)中也有很多類(lèi)似的例子。 5 5其他類(lèi)型的對(duì)策論簡(jiǎn)介其他

57、類(lèi)型的對(duì)策論簡(jiǎn)介三、多人非合作對(duì)策三、多人非合作對(duì)策 有三個(gè)或三個(gè)以上對(duì)策方參加的對(duì)策就是有三個(gè)或三個(gè)以上對(duì)策方參加的對(duì)策就是“多人對(duì)策多人對(duì)策” ” 。多人對(duì)策。多人對(duì)策同樣也是對(duì)策方在意識(shí)到其他對(duì)策方的存在,意識(shí)到其他對(duì)策方對(duì)自己同樣也是對(duì)策方在意識(shí)到其他對(duì)策方的存在,意識(shí)到其他對(duì)策方對(duì)自己決策的反應(yīng)和反作用存在的情況下尋求自身最大利益的決策活動(dòng)。因而,決策的反應(yīng)和反作用存在的情況下尋求自身最大利益的決策活動(dòng)。因而,它們的基本性質(zhì)和特征與兩人對(duì)策是相似的,我們常??梢杂醚芯?jī)扇怂鼈兊幕拘再|(zhì)和特征與兩人對(duì)策是相似的,我們常??梢杂醚芯?jī)扇藢?duì)策同樣的思路和方法來(lái)研究它們,或?qū)扇藢?duì)策的結(jié)論推

58、廣到多人對(duì)對(duì)策同樣的思路和方法來(lái)研究它們,或?qū)扇藢?duì)策的結(jié)論推廣到多人對(duì)策。不過(guò),畢竟多人對(duì)策中出現(xiàn)了更多的追求各自利益的獨(dú)立決策者,策。不過(guò),畢竟多人對(duì)策中出現(xiàn)了更多的追求各自利益的獨(dú)立決策者,因此,策略的相互依存關(guān)系也就更為復(fù)雜,對(duì)任一對(duì)策方的決策引起的因此,策略的相互依存關(guān)系也就更為復(fù)雜,對(duì)任一對(duì)策方的決策引起的反應(yīng)也就要比兩人對(duì)策復(fù)雜得多。并且,在多人對(duì)策中還有一個(gè)與兩人反應(yīng)也就要比兩人對(duì)策復(fù)雜得多。并且,在多人對(duì)策中還有一個(gè)與兩人對(duì)策有本質(zhì)區(qū)別的特點(diǎn),即可能存在對(duì)策有本質(zhì)區(qū)別的特點(diǎn),即可能存在“破壞者破壞者”。所謂破壞者即一個(gè)對(duì)。所謂破壞者即一個(gè)對(duì)策中具有下列特征的對(duì)策方:其策略選擇對(duì)自身的得益沒(méi)有任何影響,策中具有下列特征的對(duì)策方:其策略選擇對(duì)自身的得益沒(méi)有任何影響,但卻會(huì)影響其它對(duì)策方的得益,有時(shí)這種影響甚至有決定性的作用。例但卻會(huì)影響其它對(duì)策方的得益,有時(shí)這種影響甚至有決定性的作用。例如有三個(gè)城市爭(zhēng)奪某屆奧運(yùn)會(huì)的主辦權(quán)。如有三個(gè)城市爭(zhēng)奪某屆奧運(yùn)會(huì)的主辦權(quán)。 5 5其他類(lèi)型的對(duì)策論簡(jiǎn)介其他類(lèi)型的對(duì)策論簡(jiǎn)介 多人對(duì)策可以分為合作的和非合作的。非合作對(duì)策顧名多人對(duì)策可以分為合作的和非合作的。非合作對(duì)策顧名思義,就是局中人之間不存在合作,即各局中人在采取行動(dòng)思義,就是局中人之間不存在合作,即各局中人在采取行動(dòng)之前,沒(méi)有事前的交流和約定,

溫馨提示

  • 1. 本站所有資源如無(wú)特殊說(shuō)明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請(qǐng)下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請(qǐng)聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶(hù)所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁(yè)內(nèi)容里面會(huì)有圖紙預(yù)覽,若沒(méi)有圖紙預(yù)覽就沒(méi)有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫(kù)網(wǎng)僅提供信息存儲(chǔ)空間,僅對(duì)用戶(hù)上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對(duì)用戶(hù)上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對(duì)任何下載內(nèi)容負(fù)責(zé)。
  • 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請(qǐng)與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶(hù)因使用這些下載資源對(duì)自己和他人造成任何形式的傷害或損失。

評(píng)論

0/150

提交評(píng)論