第15章對策論_第1頁
第15章對策論_第2頁
第15章對策論_第3頁
第15章對策論_第4頁
第15章對策論_第5頁
已閱讀5頁,還剩33頁未讀, 繼續(xù)免費閱讀

下載本文檔

版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進行舉報或認領(lǐng)

文檔簡介

1、管管 理理 運運 籌籌 學(xué)學(xué) 第15章對策論 1 第十五章 對策論 第一節(jié)第一節(jié) 對策論的基本概念對策論的基本概念 第二節(jié)第二節(jié) 矩陣對策的最優(yōu)純策略矩陣對策的最優(yōu)純策略 第三節(jié)第三節(jié) 矩陣對策的混合策略矩陣對策的混合策略 第四節(jié)第四節(jié) 其他類型的對策論簡介其他類型的對策論簡介 管管 理理 運運 籌籌 學(xué)學(xué) 第15章對策論 2 第十五章 對策論 由“齊王賽馬”引入 管管 理理 運運 籌籌 學(xué)學(xué) 第15章對策論 3 1 1 對策論的基本概念 對策模型的三個基本要素:對策模型的三個基本要素: 1.1.局中人:參與對抗的各方;局中人:參與對抗的各方; 2.2.策略集:局中人選擇對付其它局中人的行動方

2、案稱策略集:局中人選擇對付其它局中人的行動方案稱 為策略;某局中人的所有可能策略全體稱為策略集;為策略;某局中人的所有可能策略全體稱為策略集; 3.3.一局勢對策的益損值:局中人各自使用一個對策就一局勢對策的益損值:局中人各自使用一個對策就 形成了一個局勢,一個局勢決定了各局中人的對策形成了一個局勢,一個局勢決定了各局中人的對策 結(jié)果(量化)稱為該局勢對策的益損值。結(jié)果(量化)稱為該局勢對策的益損值。 管管 理理 運運 籌籌 學(xué)學(xué) 第15章對策論 4 “齊王賽馬齊王賽馬”齊王在各局勢中的益損值表(單位:千金)齊王在各局勢中的益損值表(單位:千金) 1 1 對策論的基本概念 管管 理理 運運 籌

3、籌 學(xué)學(xué) 第15章對策論 5 其中:齊王的策略集其中:齊王的策略集: : S1= 1, 2, 3, 4, 5, 6 , 田忌的策略集:田忌的策略集:S2= 1, 2, 3, 4, 5, 6 。 下面矩陣稱齊王的贏得矩陣:下面矩陣稱齊王的贏得矩陣: 3 1 1 1 -1 1 1 3 1 1 1 -1 A= 1 -1 3 1 1 1 -1 1 1 3 1 1 1 1 1 -1 3 1 1 1 -1 1 1 3 1 1 對策論的基本概念 管管 理理 運運 籌籌 學(xué)學(xué) 第15章對策論 6 二人有限零和對策(又稱矩陣對策):二人有限零和對策(又稱矩陣對策): 局中人為局中人為2 2;每個局中人的策略集的

4、策略數(shù)目都;每個局中人的策略集的策略數(shù)目都 是有限的;每一局勢的對策均有確定的損益值,并且是有限的;每一局勢的對策均有確定的損益值,并且 對同一局勢的兩個局中人的益損值之和為零。對同一局勢的兩個局中人的益損值之和為零。 通常將矩陣對策記為通常將矩陣對策記為: : G = S1, S2, A S1:甲的策略集;:甲的策略集; S2:乙的策略集;:乙的策略集; A:甲的贏得矩陣。甲的贏得矩陣。 “齊王賽馬齊王賽馬”是一個矩陣策略。是一個矩陣策略。 1 1 對策論的基本概念 管管 理理 運運 籌籌 學(xué)學(xué) 第15章對策論 7 在甲方的贏得矩陣中:在甲方的贏得矩陣中: A=aijm n i 行代表甲方策

5、略行代表甲方策略 i=1, 2, , m;j 行代表乙方策略行代表乙方策略 j=1, 2, , n;aij 代表甲方取策略代表甲方取策略 i,乙方取策略乙方取策略 j,這一局勢下甲方的這一局勢下甲方的 益損值。此時乙方的益損值為益損值。此時乙方的益損值為 - -aij(零和性質(zhì))。(零和性質(zhì))。 在考慮各方采用的策略時,必須注意一個前提,就是雙在考慮各方采用的策略時,必須注意一個前提,就是雙 方都是理智的,即雙方都是從各自可能出現(xiàn)的最不利的情形方都是理智的,即雙方都是從各自可能出現(xiàn)的最不利的情形 選擇一種最為有利的情況作為決策的依據(jù)。選擇一種最為有利的情況作為決策的依據(jù)。 2 2 矩陣對策的最

6、優(yōu)純策略矩陣對策的最優(yōu)純策略2 2 矩陣對策的最優(yōu)純策略矩陣對策的最優(yōu)純策略 管管 理理 運運 籌籌 學(xué)學(xué) 第15章對策論 8 例:甲乙乒乓球隊進行團體對抗賽,每隊由三名球員組成,雙例:甲乙乒乓球隊進行團體對抗賽,每隊由三名球員組成,雙 方都可排成三種不同的陣容,每一種陣容可以看作一種策略,雙方方都可排成三種不同的陣容,每一種陣容可以看作一種策略,雙方 各選一種策略參賽。比賽共賽三局,規(guī)定每局勝者得各選一種策略參賽。比賽共賽三局,規(guī)定每局勝者得1 1分,輸者得分,輸者得- - 1 1分,可知三賽三勝得分,可知三賽三勝得3 3分,三賽二勝得分,三賽二勝得1 1分,三賽一勝得分,三賽一勝得-1-1

7、分,三分,三 賽三負得賽三負得-3-3分。甲隊的策略集為分。甲隊的策略集為S S1 1= 1 1, 2 2, 3 3 ,乙隊的策略集為,乙隊的策略集為 S S2 2= 1 1, 2 2, 3 3 。根據(jù)以往比賽的資料,有甲隊的贏得矩陣為。根據(jù)以往比賽的資料,有甲隊的贏得矩陣為A A, 如下所示,如下所示, 請問這次比賽各隊采用哪種陣容上場最為穩(wěn)妥請問這次比賽各隊采用哪種陣容上場最為穩(wěn)妥? ? 313 311 111 A 2 2 矩陣對策的最優(yōu)純策略矩陣對策的最優(yōu)純策略 管管 理理 運運 籌籌 學(xué)學(xué) 第15章對策論 9 矩陣矩陣A A中每行的最小元素分別為中每行的最小元素分別為1 1,-3-3,

8、-1-1。 在這些最少贏得中最好的結(jié)果是在這些最少贏得中最好的結(jié)果是1 1,故甲隊會采取策略,故甲隊會采取策略 1 1,無論對手,無論對手 采取何策略,甲隊至少得采取何策略,甲隊至少得1 1分。對于乙隊,分。對于乙隊, 1 1, 2 2, 3 3 可能帶來的最少可能帶來的最少 贏得,即贏得,即A A中每列的最大元素,分別為中每列的最大元素,分別為3 3,1 1,3 3。乙隊會采取。乙隊會采取 2 2策略,確保策略,確保 甲隊不會超過甲隊不會超過1 1分。分。 1 1和和 2 2分別稱為局中人甲隊、乙隊的最優(yōu)策略。由于雙方必然選擇這分別稱為局中人甲隊、乙隊的最優(yōu)策略。由于雙方必然選擇這 一種策略

9、,所以,這種策略又稱為最優(yōu)純策略。一種策略,所以,這種策略又稱為最優(yōu)純策略。 這種最優(yōu)純策略只有當贏得矩陣這種最優(yōu)純策略只有當贏得矩陣A=A=(a aij ij)中等式 )中等式 成立時,雙方才有最優(yōu)純策略,并把(成立時,雙方才有最優(yōu)純策略,并把( 1 1, , 2 2)稱為對策)稱為對策G G在純策略下的解,在純策略下的解, 又稱(又稱( 1 1, , 2 2)為對策)為對策G G的鞍點。把其值的鞍點。把其值V V稱之為對策稱之為對策G=SG=S1 1,S S2 2,AA的值。的值。 ij ij ij ji aamaxminminmax 2 2 矩陣對策的最優(yōu)純策略矩陣對策的最優(yōu)純策略 管管

10、 理理 運運 籌籌 學(xué)學(xué) 第15章對策論 10 例例 某單位采購員在秋天決定冬季取暖用煤的儲量問題,已知某單位采購員在秋天決定冬季取暖用煤的儲量問題,已知 在正常的冬季氣溫條件下要消耗在正常的冬季氣溫條件下要消耗1515噸煤,在較暖和較冷的天氣下要噸煤,在較暖和較冷的天氣下要 消耗消耗1010噸和噸和2020噸。假定冬天的煤價隨天氣寒冷程度而有所變化,在噸。假定冬天的煤價隨天氣寒冷程度而有所變化,在 較暖和、正常、較冷的氣候條件下每噸煤價分別為較暖和、正常、較冷的氣候條件下每噸煤價分別為1010元、元、1515元、元、2020 元。又設(shè)冬季時煤炭價格為每噸元。又設(shè)冬季時煤炭價格為每噸1010元

11、。在沒有關(guān)于當年冬季準確的元。在沒有關(guān)于當年冬季準確的 氣象預(yù)報的條件下,秋天儲煤多少噸能使得單位的支出最少?氣象預(yù)報的條件下,秋天儲煤多少噸能使得單位的支出最少? 解:局中人解:局中人I I為采購員,局中人為采購員,局中人IIII為大自然,采購員有三個策為大自然,采購員有三個策 略,買略,買1010噸、噸、1515噸、噸、2020噸。分別記為噸。分別記為 1 1, 2 2, 3 3。大自然也有三個。大自然也有三個 策略:暖、正常、冷,分別記為策略:暖、正常、冷,分別記為 1 1, 2 2, 3 3。 2 2 矩陣對策的最優(yōu)純策略矩陣對策的最優(yōu)純策略 管管 理理 運運 籌籌 學(xué)學(xué) 第15章對策

12、論 11 贏得矩陣如下:贏得矩陣如下: 在此表上計算,有在此表上計算,有 得得 故(故( 3 3, 3 3)為對策)為對策G G的解,的解,V VG G=-200=-200。 1 1 2 2 3 3 1 1(10(10噸)噸)-100-175-300 2 2(15(15噸)噸)-150-150-250 3 3(20(20噸)噸)-200-200-200 1 1 2 2 3 3minmin 1 1(10(10噸)噸)-100-175-300-300 2 2(15(15噸)噸)-150-150-250-250 3 3(20(20噸)噸)-200-200-200-200* maxmax-100-15

13、0-200* 200maxminminmax 32 aaa ij ij ij ji 2 2 矩陣對策的最優(yōu)純策略矩陣對策的最優(yōu)純策略 管管 理理 運運 籌籌 學(xué)學(xué) 第15章對策論 12 設(shè)矩陣對策設(shè)矩陣對策 G = S1, S2, A 。當當 max min aij min max aij i j j i 時,不存在最優(yōu)純策略。時,不存在最優(yōu)純策略。 例:設(shè)一個贏得矩陣如下例:設(shè)一個贏得矩陣如下: : min min 5 9 5 5 9 5 A = max 6 = max 6 策略策略 2 8 6 6 8 6 6 i i max 8 9 max 8 9 min 8 min 8 策略策略 1 j

14、 j 3 3 矩陣對策的混合策略矩陣對策的混合策略 管管 理理 運運 籌籌 學(xué)學(xué) 第15章對策論 13 當甲取當甲取策略策略 2 2 ,乙取 ,乙取策略策略 1 1時,甲實際贏得時,甲實際贏得8比預(yù)期的多比預(yù)期的多2 2, 乙當然不滿意??紤]到甲可能取乙當然不滿意??紤]到甲可能取策略策略 2 2這一點,乙采取策略這一點,乙采取策略 2 2。若。若 甲也分析到甲也分析到乙可能采取策略乙可能采取策略 2 2這一點,取策略這一點,取策略 1 1, ,則贏得更多為 則贏得更多為 9 9 。此時,對兩個局中人甲、乙來說,沒有一個雙方均可接受。此時,對兩個局中人甲、乙來說,沒有一個雙方均可接受 的平衡局勢

15、,其主要原因是甲和乙沒有執(zhí)行上述原則的共同基礎(chǔ),的平衡局勢,其主要原因是甲和乙沒有執(zhí)行上述原則的共同基礎(chǔ), 即即 max min aij min max aij 。 i j j i 一個自然的想法:對甲(乙)給出一個選取不同策略的概率分一個自然的想法:對甲(乙)給出一個選取不同策略的概率分 布,以使甲(乙)在各種情況下的平均贏得(損失)最多(最少)布,以使甲(乙)在各種情況下的平均贏得(損失)最多(最少) -即混合策略。即混合策略。 3 3 矩陣對策的混合策略矩陣對策的混合策略 管管 理理 運運 籌籌 學(xué)學(xué) 第15章對策論 14 求解求解混合策略的問題有混合策略的問題有圖解法、迭代法、線性方程

16、法和線性規(guī)圖解法、迭代法、線性方程法和線性規(guī) 劃法等,我們這里只介紹線性規(guī)劃法,其他方法略。劃法等,我們這里只介紹線性規(guī)劃法,其他方法略。 例:設(shè)甲使用策略例:設(shè)甲使用策略 1 1的概率為的概率為X1 1 ,使用策略 ,使用策略 2 2的概率為的概率為X2 , , 并設(shè)在最壞的情況下,甲贏得的平均值為并設(shè)在最壞的情況下,甲贏得的平均值為V(未知)。(未知)。 5 9 A= STEP 1 8 6 1) 1) X1+X2=1 X1, X2 0 3 3 矩陣對策的混合策略矩陣對策的混合策略 管管 理理 運運 籌籌 學(xué)學(xué) 第15章對策論 15 2)2)無論乙取何策略,甲的平均贏得應(yīng)不少于無論乙取何策略

17、,甲的平均贏得應(yīng)不少于V:V: 對乙取對乙取 1 1: 5X5X1 1 + 8X + 8X2 2 V V 對乙取對乙取 2 2: 9X9X1 1 + 6X + 6X2 2 V V 注意注意 V0,V0,因為因為A A各元素為正。各元素為正。 STEP 2 STEP 2 作變換:作變換: X X1 1= X= X1 1 /V ; X /V ; X2 2= X= X2 2 /V /V 得到上述關(guān)系式變?yōu)椋旱玫缴鲜鲫P(guān)系式變?yōu)椋?X X1 1+ X+ X2 2=1/V (V=1/V (V愈大愈好)待定愈大愈好)待定 5X5X1 1+ 8X+ 8X2 2 1 1 9X 9X1 1+ 6X+ 6X2 2

18、1 1 X X1 1, X, X2 2 0 0 3 3 矩陣對策的混合策略矩陣對策的混合策略 管管 理理 運運 籌籌 學(xué)學(xué) 第15章對策論 16 建立線性模型:建立線性模型: min Xmin X1 1+X+X2 2 s.t. 5X s.t. 5X1 1+8X+8X2 2 1 1 X X1 1= 1/21= 1/21 9 9X X1 1+6X+6X2 2 1 1 X X2 2= 2/21= 2/21 X X1 1, X, X2 2 0 1/V= 0 1/V= X X1 1+X+X2 2=1/7=1/7 所以,所以,V=7 V=7 返回原問題:返回原問題: X X1 1 = = X X1 1V=

19、 1/3V= 1/3 X X2 2 = = X X2 2V= 2/3V= 2/3 于是甲的最優(yōu)混合策略為:于是甲的最優(yōu)混合策略為: 以以1/31/3的概率選的概率選 1 1, 以以2/32/3的概率選的概率選 2 2,最優(yōu)值,最優(yōu)值V=7V=7。 3 3 矩陣對策的混合策略矩陣對策的混合策略 管管 理理 運運 籌籌 學(xué)學(xué) 第15章對策論 17 同樣可求乙的最優(yōu)混合策略:同樣可求乙的最優(yōu)混合策略: 設(shè)乙使用策略設(shè)乙使用策略 1 1的概率為的概率為Y Y1 1 Y Y1 1+Y +Y2 2 =1 =1 設(shè)乙使用策略設(shè)乙使用策略 2 2的概率為的概率為Y Y2 2 Y Y1 1,Y ,Y2 2 0

20、0 設(shè)在最壞的情況下,甲贏得的平均值為設(shè)在最壞的情況下,甲贏得的平均值為V V。這也是乙損失的平均。這也是乙損失的平均 值,越小越好。值,越小越好。 作變換:作變換: Y Y1 1= Y= Y1 1 /V /V , Y Y2 2= Y= Y2 2 /V /V 建立線性模型:建立線性模型: max Ymax Y1 1+Y+Y2 2 s.t. 5Y s.t. 5Y1 1+9Y+9Y2 2 1 1 Y Y1 1= 1/14= 1/14 8 8Y Y1 1+6Y+6Y2 2 1 1 Y Y2 2= 1/14= 1/14 Y Y1 1, Y, Y2 2 0 1/V= 0 1/V= Y Y1 1+Y+Y2

21、 2=1/7=1/7 所以,所以,V=7 V=7 3 3 矩陣對策的混合策略矩陣對策的混合策略 管管 理理 運運 籌籌 學(xué)學(xué) 第15章對策論 18 返回原問題:返回原問題: Y1= Y1V = 1/2 Y2= Y2V = 1/2 于是乙的最優(yōu)混合策略為:于是乙的最優(yōu)混合策略為: 以以 的概率選的概率選 1 1;以以 的概率選的概率選 2 2 ,最優(yōu)值 ,最優(yōu)值 V=7。 當贏得矩陣中有非正元素時,當贏得矩陣中有非正元素時,V 0 的條件不一定成立,可以的條件不一定成立,可以 作下列變換:作下列變換: 選一正數(shù)選一正數(shù) k,令矩陣中每一元素加上,令矩陣中每一元素加上 k 得到新的正得到新的正 矩

22、陣矩陣AA,其對應(yīng)的矩陣對策,其對應(yīng)的矩陣對策 G= SG= S1 1, S, S2 2, A , A 與與 G = SG = S1 1, S, S2 2, A , A 解相同,但解相同,但VG = VG k。 3 3 矩陣對策的混合策略矩陣對策的混合策略 管管 理理 運運 籌籌 學(xué)學(xué) 第15章對策論 19 例例:求解:求解“齊王賽馬齊王賽馬”問題。問題。 已知齊王的贏得矩陣已知齊王的贏得矩陣A A 求得求得 故不存在純策略問題下的解,可求其混合策略。故不存在純策略問題下的解,可求其混合策略。 A A中有負元素,可以取中有負元素,可以取k=2,k=2,在在A A的每個元素上加的每個元素上加2

23、2得到得到AA如下:如下: 311111 131111 113111 111311 111131 111113 A 3maxmin1minmax ij ij ij ji aa 533133 351333 335331 333513 133353 313335 A 3 3 矩陣對策的混合策略矩陣對策的混合策略 管管 理理 運運 籌籌 學(xué)學(xué) 第15章對策論 20 建立對建立對G G =S =S1 1,S S2 2,A A 中求甲方最佳策略的線性規(guī)劃如下: 中求甲方最佳策略的線性規(guī)劃如下: Min xMin x1 1+x+x2 2+x+x3 3+x+x4 4+x+x5 5+x+x6 6 約束條件:約

24、束條件: 5x5x1 1+3x+3x2 2+3x+3x3 3+x+x4 4+3x+3x5 5+3x+3x6 6 1 1 3x 3x1 1+5x+5x2 2+x+x3 3+3x+3x4 4+3x+3x5 5+3x+3x6 6 1 1 3x 3x1 1+3x+3x2 2+5x+5x3 3+3x+3x4 4+3x+3x5 5+x+x6 6 1 1 3x 3x1 1+3x+3x2 2+3x+3x3 3+5x+5x4 4+x+x5 5+3x+3x6 6 1 1 x x1 1+3x+3x2 2+3x+3x3 3+3x+3x4 4+5x+5x5 5+3x+3x6 6 1 1 3x 3x1 1+x+x2 2+

25、3x+3x3 3+3x+3x4 4+3x+3x5 5+5x+5x6 6 1 1 x xi i 0,i=1,2,6 0,i=1,2,6 可解得解為:可解得解為:x x1 1=x=x4 4=x=x5 5=0, x=0, x2 2=x=x3 3=x=x6 6=0.111, v=0.111, v =3, x =3, x1 1 =x =x4 4 =x =x5 5 = 0 = 0, x x2 2 =x =x3 3 =x =x6 6 =1/3, =1/3, 即即X X * * =(0,1/3,1/3,0,0,1/3) =(0,1/3,1/3,0,0,1/3)T T,所以甲的最優(yōu)策略為作出策,所以甲的最優(yōu)策略

26、為作出策 略略 2 2、 3 3、 6 6的概率都為的概率都為0.333,0.333,而作出而作出 1 1、 4 4、 5 5 的概率為的概率為0 0,此時,此時V V G G=V =V =3 =3。 3 3 矩陣對策的混合策略矩陣對策的混合策略 管管 理理 運運 籌籌 學(xué)學(xué) 第15章對策論 21 同樣可以建立對策同樣可以建立對策G G =S =S1 1,S S2 2,A A 中求乙方最佳策略的線性規(guī)劃如下: 中求乙方最佳策略的線性規(guī)劃如下: Min yMin y1 1+y+y2 2+y+y3 3+y+y4 4+y+y5 5+y+y6 6 約束條件:約束條件: 5y5y1 1+3y+3y2 2

27、+3y+3y3 3+3y+3y4 4+y+y5 5+3y+3y6 6 1 1 3y 3y1 1+5y+5y2 2+3y+3y3 3+3y+3y4 4+3y+3y5 5+y+y6 6 1 1 3y 3y1 1+y+y2 2+5y+5y3 3+3y+3y4 4+3y+3y5 5+3y+3y6 6 1 1 y y1 1+3y+3y2 2+3y+3y3 3+5y+5y4 4+3y+3y5 5+3y+3y6 6 1 1 3y 3y1 1+3y+3y2 2+3y+3y3 3+y+y4 4+5y+5y5 5+3y+3y6 6 1 1 3y 3y1 1+3y+3y2 2+y+y3 3+3y+3y4 4+3y+

28、3y5 5+5y+5y6 6 1 1 y yi i0,i=1,2,60,i=1,2,6 可解得解為:可解得解為: y y1 1=y=y4 4=y=y5 5=0.111, y=0.111, y2 2=y=y3 3=y=y6 6=0, v=0, v =3, y =3, y1 1 =y =y4 4 =y =y5 5 = 1/3 = 1/3, y y2 2 =y =y3 3 =y =y6 6 =0 =0,即,即Y Y * * =(1/3,0,0,1/3,1/3,0) =(1/3,0,0,1/3,1/3,0)T T。 所以田忌的最優(yōu)混合策略為作出策略所以田忌的最優(yōu)混合策略為作出策略 1 1、 4 4、

29、5 5的概率都為的概率都為1/3,1/3,而作出而作出 2 2, 3 3, 6 6的概率為的概率為0 0,此時,此時V VG G=V=VG G -k=1 -k=1。 3 3 矩陣對策的混合策略矩陣對策的混合策略 管管 理理 運運 籌籌 學(xué)學(xué) 第15章對策論 22 齊王賽馬問題的對策最優(yōu)解可簡記為齊王賽馬問題的對策最優(yōu)解可簡記為X X* *= =(0,1/3,1/3,0,0,1/3)(0,1/3,1/3,0,0,1/3)T T, Y Y* *= =(1/3,0,0,1/3,1/3,0)(1/3,0,0,1/3,1/3,0)T T,對策值,對策值V VG G=1=1。 例例 兩個局中人進行對策,規(guī)

30、則是兩人互相獨立的各自從兩個局中人進行對策,規(guī)則是兩人互相獨立的各自從1 1、2 2、3 3這三個這三個 數(shù)字中任意選寫一個數(shù)字。如果兩人所寫的數(shù)字之和為偶數(shù),則局中人乙數(shù)字中任意選寫一個數(shù)字。如果兩人所寫的數(shù)字之和為偶數(shù),則局中人乙 支付給局中人甲以數(shù)量為此和數(shù)的報酬;如果兩人所寫數(shù)字之和為奇數(shù),支付給局中人甲以數(shù)量為此和數(shù)的報酬;如果兩人所寫數(shù)字之和為奇數(shù), 則局中人甲付給局中人乙以數(shù)量為此和數(shù)的報酬。試求出其最優(yōu)策略。則局中人甲付給局中人乙以數(shù)量為此和數(shù)的報酬。試求出其最優(yōu)策略。 解:首先計算局中人甲的贏得矩陣如下表:解:首先計算局中人甲的贏得矩陣如下表: 4 -5 6 -3 4 -5

31、2 -3 4 1 1(出(出1 1) 2 2(出(出2 2) 3 3(出(出3 3) 3 3(出(出3 3) 2 2(出(出2 2) 1 1(出(出1 1) 甲的贏甲的贏 得得 甲的策略甲的策略 3 3 矩陣對策的混合策略矩陣對策的混合策略 乙的策略乙的策略 管管 理理 運運 籌籌 學(xué)學(xué) 第15章對策論 23 即甲的贏得矩陣為即甲的贏得矩陣為A A: 可知無純策略意義的解,下面求其在混合策略下的解。可知無純策略意義的解,下面求其在混合策略下的解。 A A的各元素都加上的各元素都加上6 6,得到,得到 建立線性規(guī)劃模型如下:建立線性規(guī)劃模型如下: Min xMin x1 1+x+x2 2+x+x

32、3 3 Max y Max y1 1+y+y2 2+y+y3 3 S.T.8xS.T.8x1 1+3x+3x2 2+10 x+10 x3 3 1 8y 1 8y1 1+3y+3y2 2+10y+10y3 311 3x 3x1 1+10 x+10 x2 2+x+x3 3 1 3y 1 3y1 1+10y+10y2 2+y+y3 3 1 1 10 x 10 x1 1+x+x2 2+12x+12x3 3 1 10y 1 10y1 1+y+y2 2+12y+12y3 311 x x1 1,x,x2 2,x,x3 3 0 y 0 y1 1,y,y2 2,y,y3 3 0 0 654 543 432 A

33、12110 1103 1038 A 3 3 矩陣對策的混合策略矩陣對策的混合策略 管管 理理 運運 籌籌 學(xué)學(xué) 第15章對策論 24 得到得到 x x1 1 =0.25, x =0.25, x2 2 =0.50, x =0.50, x3 3 =0.25 =0.25; y y1 1 =0.25, y =0.25, y2 2 =0.50, y =0.50, y3 3 =0.25 =0.25。 即此對策的解為即此對策的解為 X X* * =(0.25,0.50,0.25)=(0.25,0.50,0.25)T T, Y Y* * =(0.25,0.50,0.25)=(0.25,0.50,0.25)T

34、T。 V VG G=V=VG G -k=0 -k=0。 3 3 矩陣對策的混合策略矩陣對策的混合策略 管管 理理 運運 籌籌 學(xué)學(xué) 第15章對策論 25 例例4 4 甲乙兩個企業(yè)生產(chǎn)同一種電子產(chǎn)品,甲企業(yè)可以采取的策略措施甲乙兩個企業(yè)生產(chǎn)同一種電子產(chǎn)品,甲企業(yè)可以采取的策略措施 有有: :(1)(1)降低產(chǎn)品價格;降低產(chǎn)品價格;(2)(2)提高產(chǎn)品質(zhì)量;提高產(chǎn)品質(zhì)量;(3)(3)推出新產(chǎn)品。乙企業(yè)考慮采推出新產(chǎn)品。乙企業(yè)考慮采 取的策略措施有取的策略措施有(1)(1)增加廣告費用;增加廣告費用;(2)(2)增設(shè)維修網(wǎng)點,加強售后服務(wù);增設(shè)維修網(wǎng)點,加強售后服務(wù);(3)(3) 改進產(chǎn)品性能。由于

35、甲乙兩個企業(yè)財力有限,都只能采取一個措施。假定改進產(chǎn)品性能。由于甲乙兩個企業(yè)財力有限,都只能采取一個措施。假定 這兩個企業(yè)所占有的市場總份額一定,由于各自采取的措施不同,通過預(yù)這兩個企業(yè)所占有的市場總份額一定,由于各自采取的措施不同,通過預(yù) 測今后兩個企業(yè)的市場占有份額變動情況如下表,試求出這兩個企業(yè)各自測今后兩個企業(yè)的市場占有份額變動情況如下表,試求出這兩個企業(yè)各自 的最優(yōu)策略。的最優(yōu)策略。 3 -5 8 -6 5 10 10 8 -12 1 1(措施(措施1 1) 2 2(措施(措施2 2) 3 3(措施(措施3 3) 3 3(措施(措施3 3) 2 2(措施(措施2 2) 1 1(措施(

36、措施1 1) 3 3 矩陣對策的混合策略矩陣對策的混合策略 甲的贏甲的贏 得得 甲的策略甲的策略 乙的策略乙的策略 管管 理理 運運 籌籌 學(xué)學(xué) 第15章對策論 26 解:解: 易知此對策無純策略意義下的解。把易知此對策無純策略意義下的解。把A A的每一個元素加上的每一個元素加上1212,得到,得到A A 建立線性規(guī)劃模型如下:建立線性規(guī)劃模型如下: Min xMin x1 1+x+x2 2+x+x3 3 Max y Max y1 1+y+y2 2+y+y3 3 S.T.22xS.T.22x1 1+20 x+20 x2 21 22y1 22y1 1+6y+6y2 2+15y+15y3 3 1

37、1 6x 6x1 1+17x+17x2 2+22x+22x3 3 1 20y 1 20y1 1+17y+17y2 2+7y+7y3 3 1 1 15x 15x1 1+7x+7x2 2+20 x+20 x3 3 1 22y 1 22y2 2+20y+20y3 3 1 1 x x1 1,x,x2 2,x,x3 30 y0 y1 1,y,y2 2,y,y3 300 得到:得到: x x1 1=0.027,x=0.027,x2 2=0.020,x=0.020,x3 3=0.023=0.023;y y1 1=0.0225,y=0.0225,y2 2=0.0225,y=0.0225,y3 3=0.025=

38、0.025。V=14.29V=14.29。 x x1 1 =0.3858, x =0.3858, x2 2 =0.2858, x =0.2858, x3 3 =0.3286 =0.3286;y y1 1 =0.3215,y =0.3215,y2 2 =0.3215,y =0.3215,y3 3 =0.3572 =0.3572。 即此對策的解為即此對策的解為 X X* * =(0.3858,0.2858,0.3286)=(0.3858,0.2858,0.3286)T T ,Y ,Y* * =(0.3215,0.3215,0.3572)=(0.3215,0.3215,0.3572)T T。 V V

39、G G=V=VG G -k=2.29 -k=2.29。 20220 71720 15622 A 3 3 矩陣對策的混合策略矩陣對策的混合策略 管管 理理 運運 籌籌 學(xué)學(xué) 第15章對策論 27 優(yōu)超原則:優(yōu)超原則: 假設(shè)假設(shè)矩陣對策矩陣對策 G = SG = S1 1, S, S2 2, A , A 甲方贏得矩陣甲方贏得矩陣 A=aA=aij ij m m n n 若存在兩行(列),若存在兩行(列),s s 行(列)的各元素均優(yōu)于行(列)的各元素均優(yōu)于 t t 行(列)的元行(列)的元 素,即素,即 a asj sj a atj tj j=1,2 n ( a j=1,2 n ( ais is

40、a ait it i=1,2 m ) i=1,2 m ) 稱甲方策略稱甲方策略 s s優(yōu)超于優(yōu)超于 t t ( ( s s優(yōu)超于優(yōu)超于 t t) )。 優(yōu)超原則:當局中人甲方的策略優(yōu)超原則:當局中人甲方的策略 t t被其它策略所被其它策略所優(yōu)超時,可在優(yōu)超時,可在 其贏得矩陣其贏得矩陣A A中劃去第中劃去第t t行(同理,當局中人乙方的策略行(同理,當局中人乙方的策略 t t被其它策被其它策 略所略所優(yōu)超時,可在矩陣優(yōu)超時,可在矩陣A A中劃去第中劃去第t t列)。列)。 如此得到階數(shù)較小的贏得矩陣如此得到階數(shù)較小的贏得矩陣AA,其對應(yīng)的矩陣對策其對應(yīng)的矩陣對策 G= S1, S2, A 與與

41、 G = S1, S2, A 等價,即解相同。等價,即解相同。 3 3 矩陣對策的混合策略矩陣對策的混合策略 管管 理理 運運 籌籌 學(xué)學(xué) 第15章對策論 28 例例. . 設(shè)設(shè)甲方的益損值,贏得矩陣為甲方的益損值,贏得矩陣為 3 2 0 3 0 被第被第3 3、4 4行所優(yōu)超行所優(yōu)超 5 0 2 5 9 被第被第3 3行所優(yōu)超行所優(yōu)超 A= 7 3 9 5 9 4 6 8 7 5.5 6 0 8 8 3 得到得到 7 3 9 5 9 被第被第1 1列所優(yōu)超列所優(yōu)超 A1= 4 6 8 7 5.5 被第被第2 2列所優(yōu)超列所優(yōu)超 6 0 8 8 3 3 3 矩陣對策的混合策略矩陣對策的混合策略

42、 管管 理理 運運 籌籌 學(xué)學(xué) 第15章對策論 29 得到得到 7 3 9 A2= 4 6 5.5 6 0 3 被第被第1 1行所優(yōu)超行所優(yōu)超 得到得到 7 3 9 被第被第1 1列所優(yōu)超列所優(yōu)超 A3= 4 6 5.5 7 3 最終得到最終得到 A4= 4 6 3 3 矩陣對策的混合策略矩陣對策的混合策略 管管 理理 運運 籌籌 學(xué)學(xué) 第15章對策論 30 對對A A4 4計算,用線性規(guī)劃方法得到:計算,用線性規(guī)劃方法得到: (注意:余下的策略為(注意:余下的策略為 3 3, 4 4, 1 1, 2 2) 甲:甲: X* = (0,0,1/15,2/15,0)T V=5 X*= (0,0,1

43、/3 ,2/3 ,0)T 乙:乙: Y* = (1/10,1/10,0,0,0)T V=5 Y*= (1/2 ,1/2 ,0,0,0)T 。 注:注: 利用優(yōu)超原則化簡贏得矩陣時,有可能將原對策問題的解也利用優(yōu)超原則化簡贏得矩陣時,有可能將原對策問題的解也 劃去一些(多解情況);劃去一些(多解情況); 線性規(guī)劃求解時有可能是多解問題。線性規(guī)劃求解時有可能是多解問題。 3 3 矩陣對策的混合策略矩陣對策的混合策略 管管 理理 運運 籌籌 學(xué)學(xué) 第15章對策論 31 4 4 其他類型的對策論簡介其他類型的對策論簡介 在對策論中可以根據(jù)不同方式對對策問題進行分類,通在對策論中可以根據(jù)不同方式對對策問

44、題進行分類,通 常分類的方式有(常分類的方式有(1)根據(jù)局中人的個數(shù),分為二人對策和多)根據(jù)局中人的個數(shù),分為二人對策和多 人對策;(人對策;(2)根據(jù)各局中人的贏得函數(shù)的代數(shù)和是否為零,)根據(jù)各局中人的贏得函數(shù)的代數(shù)和是否為零, 可分為零和對策和非零和對策;(可分為零和對策和非零和對策;(3)根據(jù)局中人是否合作,)根據(jù)局中人是否合作, 又可分為合作對策和非合作對策;(又可分為合作對策和非合作對策;(4)根據(jù)局中人的策略集)根據(jù)局中人的策略集 中個數(shù),又分為有限對策和無限對策(或連續(xù)對策);(中個數(shù),又分為有限對策和無限對策(或連續(xù)對策);(5) 也可根據(jù)局中人掌握信息的情況及決策選擇是否和時

45、間有關(guān)也可根據(jù)局中人掌握信息的情況及決策選擇是否和時間有關(guān) 可分為完全信息靜態(tài)對策、完全信息動態(tài)對策、非完全信息可分為完全信息靜態(tài)對策、完全信息動態(tài)對策、非完全信息 靜態(tài)對策及非完全信息動態(tài)對策;也可以根據(jù)對策模型的數(shù)靜態(tài)對策及非完全信息動態(tài)對策;也可以根據(jù)對策模型的數(shù) 字特征又分為矩陣對策、連續(xù)對策、微分對策、陣地對策、字特征又分為矩陣對策、連續(xù)對策、微分對策、陣地對策、 凸對策、隨機對策。凸對策、隨機對策。 本節(jié)只對對策論中非合作對策的完全信息對策、多人非本節(jié)只對對策論中非合作對策的完全信息對策、多人非 合作對策、非零和對策作一個簡單的敘述性介紹。合作對策、非零和對策作一個簡單的敘述性介紹

46、。 管管 理理 運運 籌籌 學(xué)學(xué) 第15章對策論 32 4 4 其他類型的對策論簡介其他類型的對策論簡介 一、完全信息靜態(tài)對策一、完全信息靜態(tài)對策 該對策是指掌握了參與人的特征、戰(zhàn)略空間、支付函數(shù)等知識和信該對策是指掌握了參與人的特征、戰(zhàn)略空間、支付函數(shù)等知識和信 息并且參與人同時選擇行動方案或雖非同時但后行動者并不知道前行動息并且參與人同時選擇行動方案或雖非同時但后行動者并不知道前行動 者采取了什么行動方案。者采取了什么行動方案。 納什均衡是一個重要概念。在一個戰(zhàn)略組合中,給定其他參與者戰(zhàn)納什均衡是一個重要概念。在一個戰(zhàn)略組合中,給定其他參與者戰(zhàn) 略的情況下,任何參與者都不愿意脫離這個組合,

47、或者說打破這個僵局,略的情況下,任何參與者都不愿意脫離這個組合,或者說打破這個僵局, 這種均衡就稱為納什均衡。下面以著名的這種均衡就稱為納什均衡。下面以著名的“囚徒困境囚徒困境”來進一步闡述。來進一步闡述。 例例1 “1 “囚徒困境囚徒困境”說的是兩個囚犯的故事。這兩個囚徒一起做壞事,結(jié)果被說的是兩個囚犯的故事。這兩個囚徒一起做壞事,結(jié)果被 警察發(fā)現(xiàn)抓了起來,分別關(guān)在兩個獨立的不能互通信息的牢房里進行審訊。在這警察發(fā)現(xiàn)抓了起來,分別關(guān)在兩個獨立的不能互通信息的牢房里進行審訊。在這 種情形下,兩個囚犯都可以做出自己的選擇:或者坦白(即與警察合作,從而背種情形下,兩個囚犯都可以做出自己的選擇:或者

48、坦白(即與警察合作,從而背 叛他的同伙),或者抵賴(也就是與他的同伙合作,而不是與警察合作)。這兩叛他的同伙),或者抵賴(也就是與他的同伙合作,而不是與警察合作)。這兩 個囚犯都知道,如果他倆都能抵賴的話,就都會被釋放,因為只要他們拒不承認,個囚犯都知道,如果他倆都能抵賴的話,就都會被釋放,因為只要他們拒不承認, 警方無法給他們定罪。但警方也明白這一點,所以他們就給了這兩個囚犯一點兒警方無法給他們定罪。但警方也明白這一點,所以他們就給了這兩個囚犯一點兒 刺激:如果他們中的一個人坦白,即告發(fā)他的同伙,那么他就可以被無罪釋放。刺激:如果他們中的一個人坦白,即告發(fā)他的同伙,那么他就可以被無罪釋放。

49、而他的同伙就會被按照最重的罪來判決。當然,如果這兩個囚犯都坦白,兩個人而他的同伙就會被按照最重的罪來判決。當然,如果這兩個囚犯都坦白,兩個人 都會被按照輕罪來判決。如圖都會被按照輕罪來判決。如圖1-11-1所示。所示。 管管 理理 運運 籌籌 學(xué)學(xué) 第15章對策論 33 4 4 其他類型的對策論簡介其他類型的對策論簡介 坦白坦白抵賴抵賴 輕罪,輕罪輕罪,輕罪重罪,無罪重罪,無罪 重罪,無罪重罪,無罪釋放,釋放釋放,釋放 坦白坦白 抵賴抵賴 圖圖1-1 1-1 囚徒困境囚徒困境 由分析可知,上例中每個囚犯都會選擇坦白,因此這個戰(zhàn)略組合由分析可知,上例中每個囚犯都會選擇坦白,因此這個戰(zhàn)略組合 是固

50、定的,是固定的,( (坦白,坦白坦白,坦白) )就是納什均衡解。而這個均衡是不會被打破的,就是納什均衡解。而這個均衡是不會被打破的, 即使他們在坐牢之前達成協(xié)議。即使他們在坐牢之前達成協(xié)議。 囚徒困境反映了個人理性和集體理性的矛盾。對于雙方,(抵賴,囚徒困境反映了個人理性和集體理性的矛盾。對于雙方,(抵賴, 抵賴)的結(jié)果是最好的,但因為每個囚徒都是理性人,他們追求自身效抵賴)的結(jié)果是最好的,但因為每個囚徒都是理性人,他們追求自身效 應(yīng)的最大化,結(jié)果就變成了(坦白,坦白)。個人理性導(dǎo)致了集體不理應(yīng)的最大化,結(jié)果就變成了(坦白,坦白)。個人理性導(dǎo)致了集體不理 性。性。 管管 理理 運運 籌籌 學(xué)學(xué)

51、 第15章對策論 34 4 4 其他類型的對策論簡介其他類型的對策論簡介 二、完全信息動態(tài)對策二、完全信息動態(tài)對策 在完全信息靜態(tài)對策中,假設(shè)各方都同時選擇行動?,F(xiàn)在情況稍復(fù)在完全信息靜態(tài)對策中,假設(shè)各方都同時選擇行動。現(xiàn)在情況稍復(fù) 雜一些。如果各方行動存在先后順序,后行的一方會參考先行者的策略雜一些。如果各方行動存在先后順序,后行的一方會參考先行者的策略 而采取行動,而先行者也會知道后行者會根據(jù)他的行動采取何種行動,而采取行動,而先行者也會知道后行者會根據(jù)他的行動采取何種行動, 因此先行者會考慮自己行動會對后行者的影響后選擇行動。這類問題稱因此先行者會考慮自己行動會對后行者的影響后選擇行動。

52、這類問題稱 為完全信息動態(tài)對策問題。為完全信息動態(tài)對策問題。 例例2 2 某行業(yè)中只有一個壟斷企業(yè)某行業(yè)中只有一個壟斷企業(yè)A A,有一個潛在進入者,有一個潛在進入者企業(yè)企業(yè)B B。B B可以選可以選 擇進入或不進入該行業(yè)這兩種行動,而擇進入或不進入該行業(yè)這兩種行動,而A A當當B B進入時,可以選擇默認或者報復(fù)兩種進入時,可以選擇默認或者報復(fù)兩種 行動。如果行動。如果B B進入后進入后A A企業(yè)報復(fù),將造成兩敗俱傷的結(jié)果,但如果企業(yè)報復(fù),將造成兩敗俱傷的結(jié)果,但如果A A默認默認B B進入,必進入,必 然對然對A A的收益造成損失。同樣的,如果的收益造成損失。同樣的,如果B B進入而進入而A

53、A報復(fù),則報復(fù),則B B受損,反之,將受益。受損,反之,將受益。 把此關(guān)系用圖把此關(guān)系用圖1-21-2表示。表示。 默許默許報復(fù)報復(fù) 50,10050,100-20,0-20,0 0,2000,2000,2000,200 進入進入 不進入不進入 圖圖1-2 A1-2 A、B B的行動及結(jié)果的行動及結(jié)果 A A B B 管管 理理 運運 籌籌 學(xué)學(xué) 第15章對策論 35 4 4 其他類型的對策論簡介其他類型的對策論簡介 由分析可知,上例中(由分析可知,上例中(B B選擇不進入,選擇不進入,A A選擇報復(fù))和(選擇報復(fù))和(B B 選擇進入,選擇進入,A A選擇默許)都是納什均衡解。但在實際中,(

54、選擇默許)都是納什均衡解。但在實際中,(B B 選擇不進入,選擇不進入,A A選擇報復(fù))這種情況是不可能出現(xiàn)的。因為選擇報復(fù))這種情況是不可能出現(xiàn)的。因為B B 知道他如果進入,知道他如果進入,A A只能默許,所以只有(只能默許,所以只有(B B選擇進入,選擇進入,A A選擇選擇 默許)會發(fā)生。或者說,默許)會發(fā)生?;蛘哒f,A A選擇報復(fù)行動是不可置信的威脅。選擇報復(fù)行動是不可置信的威脅。 對策論的術(shù)語中,稱(對策論的術(shù)語中,稱(A A選擇默許,選擇默許,B B選擇進入)為精煉納什選擇進入)為精煉納什 均衡。當只當參與人的戰(zhàn)略在每一個子對策中都構(gòu)成納什均均衡。當只當參與人的戰(zhàn)略在每一個子對策中

55、都構(gòu)成納什均 衡,這個納什均衡才稱為精煉納什均衡。衡,這個納什均衡才稱為精煉納什均衡。 當然,如果當然,如果A A下定決心一定要報復(fù)下定決心一定要報復(fù)B B,即使自己暫時損失。,即使自己暫時損失。 這時威脅就變成了可置信的,這時威脅就變成了可置信的,B B就會選擇不進入,(就會選擇不進入,(B B選擇不選擇不 進入,進入,A A選擇報復(fù))就成為精煉納什均衡。選擇報復(fù))就成為精煉納什均衡。 軍事交戰(zhàn)時,軍事交戰(zhàn)時,“破釜沉舟破釜沉舟”講的就是一種可置信威脅。講的就是一種可置信威脅。 實際企業(yè)經(jīng)營中也有很多類似的例子。實際企業(yè)經(jīng)營中也有很多類似的例子。 管管 理理 運運 籌籌 學(xué)學(xué) 第15章對策論

56、 36 4 4 其他類型的對策論簡介其他類型的對策論簡介 三、多人非合作對策三、多人非合作對策 有三個或三個以上對策方參加的對策就是有三個或三個以上對策方參加的對策就是“多人對策多人對策” 。多人對策。多人對策 同樣也是對策方在意識到其他對策方的存在,意識到其他對策方對自己同樣也是對策方在意識到其他對策方的存在,意識到其他對策方對自己 決策的反應(yīng)和反作用存在的情況下尋求自身最大利益的決策活動。因而,決策的反應(yīng)和反作用存在的情況下尋求自身最大利益的決策活動。因而, 它們的基本性質(zhì)和特征與兩人對策是相似的,我們常??梢杂醚芯績扇怂鼈兊幕拘再|(zhì)和特征與兩人對策是相似的,我們常常可以用研究兩人 對策同樣的思路和方法來研究它們,或?qū)扇藢Σ叩慕Y(jié)論推廣到多人對對策同樣的思路和方法來研究

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負責。
  • 6. 下載文件中如有侵權(quán)或不適當內(nèi)容,請與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

評論

0/150

提交評論