




版權(quán)說(shuō)明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請(qǐng)進(jìn)行舉報(bào)或認(rèn)領(lǐng)
文檔簡(jiǎn)介
對(duì)策論由“齊王賽馬”引入對(duì)策論由“齊王賽馬”引入11.對(duì)策論的基本概念三個(gè)基本要素;1.局中人:參與對(duì)抗的各方;2.策略集:局中人選擇對(duì)付其它局中人的行動(dòng)方案稱為策略。某局中人的所有可能策略全體稱為策略集;3.局勢(shì)對(duì)策的益損值:各局中人各自使用一個(gè)對(duì)策就形成一個(gè)局勢(shì),一個(gè)局勢(shì)決定了個(gè)局眾人的對(duì)策結(jié)果(量化)稱為該局勢(shì)對(duì)策的益損值)1.對(duì)策論的基本概念三個(gè)基本要素;2“齊王賽馬”齊王在各局勢(shì)中的益損值表(單位:千金)“齊王賽馬”齊王在各局勢(shì)中的益損值表(單位:千金)3其中:齊王的策略集:S1={1,2,3,4,5,6}田忌的策略集:S1={1,2,3,4,5,6}下列矩陣稱齊王的贏得矩陣:
3111-1113111-1A=1-13111-111311111-13111-1113其中:41.基本概念(續(xù))二人有限零和對(duì)策:(又稱矩陣策略)局中人為2;每局中人的策略集中策略權(quán)目有限;每一局勢(shì)的對(duì)策均有確定的損益值,并且對(duì)同一局勢(shì)的兩個(gè)局中人的益損值之和為零。1.基本概念(續(xù))二人有限零和對(duì)策:(又稱矩陣策略)51.基本概念(續(xù))記矩陣對(duì)策為:
G={S1,S2,A}
甲的策略集甲的贏得矩陣乙的策略集“齊王賽馬”即是一個(gè)矩陣策略.1.基本概念(續(xù))記矩陣對(duì)策為:62.矩陣對(duì)策的最優(yōu)純策略在甲方贏得矩陣中:A=[aij]m*ni行代表甲方策略i=1,2…mJ列代表乙方策略j=1,2…naij代表甲方取策略i,乙方取策略j,這一局勢(shì)下甲方的益損值,此時(shí)乙方的益損值為-aij(零和性質(zhì))。在討論各方采用的策略是必須注意一個(gè)前提就是對(duì)方是理智的。這就是要從最有把握取得的益損值情況考慮。2.矩陣對(duì)策的最優(yōu)純策略在甲方贏得矩陣中:72.矩陣對(duì)策的最優(yōu)純策略(續(xù))例:有交易雙方公司甲和乙,甲有三個(gè)策略1,2,3;乙有四個(gè)策略1,2,3,4,根據(jù)獲利情況建立甲方的益損值贏得矩陣。
-30-20A=2301-2-4-13問(wèn):甲公司應(yīng)采取什么策略比較適合?2.矩陣對(duì)策的最優(yōu)純策略(續(xù))例:有交易雙方公司甲和乙,甲有8甲:采取1至少得益–3(損失3)203-4(損失4)乙:采取1甲最多得益2(乙最少得益-2)23(乙得益-3)30(乙得益0)43(乙得益-3)取大則取2maxminaij=0
ij取小則取3minmaxaij=0ji甲:取大則取2取小則取39甲采取策略2不管乙采取如何策略,都至少得益。乙采取策略3不管甲采取如何策略,都至少可以得益。(最多損失0)分別稱甲,乙公司的最優(yōu)策略,由唯一性又稱最優(yōu)純策略。存在前提:
maxminaij=minmaxaij=v
ijji又稱(2,3)為對(duì)策G={s1,s2,A}的鞍點(diǎn)。值V為G的值。甲采取策略2不管乙采取如何策略,都至少得益。103.矩陣對(duì)策的混合策略設(shè)矩陣對(duì)策G={S1,S2,A}當(dāng)maxminaijminmaxaij
ijji時(shí),不存在最優(yōu)純策略求解混合策略。3.矩陣對(duì)策的混合策略設(shè)矩陣對(duì)策G={S1,S2,A}113.矩陣對(duì)策的混合策略例:設(shè)一個(gè)贏得矩陣如下:
min595A=max6策略2866imax89min8
策略1
j3.矩陣對(duì)策的混合策略例:設(shè)一個(gè)贏得矩陣如下:12矛盾:甲取2,乙取時(shí)1,甲實(shí)際贏得8比預(yù)期多2(乙就少2)這對(duì)乙講是不滿意的,考慮這一點(diǎn),乙采取策略2,若甲分析到這一點(diǎn),取策略1,則贏得更多為9…此時(shí),甲,乙方?jīng)]有一個(gè)雙方均可接受的平衡局勢(shì)。一個(gè)思路:對(duì)甲(乙)給出一個(gè)選取不同策略的概率分布,以使甲(乙)在各種情況下的平均贏得(損失)最多(最少)。-----即混合策略矛盾:甲取2,乙取時(shí)1,甲實(shí)際贏得8比預(yù)期多2(乙就少13求解方法:線性規(guī)劃法(其他方法:圖解法,迭代法,線性方程法等略)例:59設(shè)在最壞的情況下,A=甲贏得的平均值為V.
86(未知)STEP11)設(shè)甲使用策略1的概率為X1′X1′+X2′=1設(shè)甲使用策略2的概率為X2′X1′,X2′0求解方法:線性規(guī)劃法142)無(wú)論乙取何策略,甲的平均贏得應(yīng)不少于V:對(duì)乙取1:5X1’+8X2’V對(duì)乙取2:9X1’+6X2’V注意V>0,因?yàn)锳各元素為正。STEP2作變換:X1=X1’/V;X2=X2’/V得到上述關(guān)系式變?yōu)椋篨1+X2=1/V(V愈大愈好)待定5X1+8X219X1+6X21X1,X202)無(wú)論乙取何策略,甲的平均贏得應(yīng)不少于V:15建立線性模型:
minX1+X2
s.t.5X1+8X21X1=1/21
9X1+6X21X2=2/21X1,X201/V=X1+X2=1/7所以:V=7
返回原問(wèn)題:X1’=X1V=1/3
X2’=X2V=2/3于是甲的最優(yōu)混合策略為:以1/3的概率選1;以2/3的概率選2最優(yōu)值V=7.建立線性模型:16同樣可求乙的最優(yōu)混合策略:設(shè)乙使用策略1的概率為Y1′Y1′+Y2′=1設(shè)乙使用策略2的概率為Y2′Y1′,Y2′0設(shè)在最壞的情況下,甲贏得的平均值為V.這也是乙損失的平均值,越小越好作變換:Y1=Y1’/V;Y2=Y2’/V建立線性模型:
maxY1+Y2
s.t.5Y1+9Y21Y1=1/14
8Y1+6Y21Y2=1/14Y1,Y201/V=Y1+Y2=1/7所以:V=7
同樣可求乙的最優(yōu)混合策略:17返回原問(wèn)題:Y1’=Y1V=1/2
Y2’=Y2V=1/2于是乙的最優(yōu)混合策略為:以1/2的概率選1;以1/2的概率選2最優(yōu)值V=7.當(dāng)贏得矩陣中有非正元素時(shí),V0的條件不一定成立,可以作下列變換:選一正數(shù)k,令矩陣中每一元素加上k得到新的正矩陣A’,其對(duì)應(yīng)的矩陣對(duì)策G’={S1,S2,A’}與G={S1,S2,A}解相同,但VG=VG’-k返回原問(wèn)題:Y1’=Y1V=1/218例:求解“齊王賽馬”問(wèn)題(見(jiàn)備課稿)優(yōu)超原則:假設(shè)矩陣對(duì)策G={S1,S2,A}
甲方贏得矩陣A=[aij]mn--若存在兩行(列),s行(列)的各元素均優(yōu)于t行(列)的元素,即asjatjj=1,2…n(ais
aiti=1,2…m)稱甲方策略s優(yōu)超于t(s優(yōu)超于t)3.矩陣對(duì)策的混合策略(續(xù))例:求解“齊王賽馬”問(wèn)題(見(jiàn)備課稿)3.矩陣對(duì)策的混合策略(19--優(yōu)超原則:當(dāng)局中人甲方的策略t被其它策略所優(yōu)超時(shí),可在其贏得矩陣A中劃去第t行(同理,當(dāng)局中人乙方的策略t被其它策略所優(yōu)超時(shí),可在矩陣A中劃去第t列)。如此得到階數(shù)較小的贏得矩陣A’,其對(duì)應(yīng)的矩陣對(duì)策
G’={S1,S2,A’}與G={S1,S2,A}等價(jià),即解相同。3.矩陣對(duì)策的混合策略(續(xù))--優(yōu)超原則:當(dāng)局中人甲方的策略t被其它策略所優(yōu)超時(shí),可20例設(shè)甲方的益損值贏得矩陣。
32030
被第3、4行所優(yōu)超
50259
被第3行所優(yōu)超A=7395946875.560883得到73959被第1列所優(yōu)超A1=46875.5被第2列所優(yōu)超608833.矩陣對(duì)策的混合策略(續(xù))例設(shè)甲方的益損值贏得矩陣。3.矩陣對(duì)策的混合策略(續(xù))21續(xù)例得到739A2=465.5
603
被第1行所優(yōu)超得到739
被第1列所優(yōu)超A3=465.573最終得到A4=463.矩陣對(duì)策的混合策略(續(xù))續(xù)例得到3.矩陣對(duì)策的混合策略(續(xù))22對(duì)A4計(jì)算,用線性規(guī)劃方法得到:(注意:余下的策略為3,4,1,2)甲:X*=(0,0,1/15,2/15,0)TV=5X*’=(0,0,1/3,2/3,0)T
乙:Y*=(1/10,1/10,0,0,0)TV=5Y*’=(1/2,1/2,0,0,0)T
注:利用有超原則化簡(jiǎn)贏得矩陣時(shí),有可能將原對(duì)策問(wèn)題的解也劃去一些(多解情況);線性規(guī)劃求解時(shí)有可能是多解問(wèn)題。習(xí)題:P343-1,3,43.矩陣對(duì)策的混合策略(續(xù))對(duì)A4計(jì)算,用線性規(guī)劃方法得到:3.矩陣對(duì)策的混合策略(續(xù))23對(duì)策論由“齊王賽馬”引入對(duì)策論由“齊王賽馬”引入241.對(duì)策論的基本概念三個(gè)基本要素;1.局中人:參與對(duì)抗的各方;2.策略集:局中人選擇對(duì)付其它局中人的行動(dòng)方案稱為策略。某局中人的所有可能策略全體稱為策略集;3.局勢(shì)對(duì)策的益損值:各局中人各自使用一個(gè)對(duì)策就形成一個(gè)局勢(shì),一個(gè)局勢(shì)決定了個(gè)局眾人的對(duì)策結(jié)果(量化)稱為該局勢(shì)對(duì)策的益損值)1.對(duì)策論的基本概念三個(gè)基本要素;25“齊王賽馬”齊王在各局勢(shì)中的益損值表(單位:千金)“齊王賽馬”齊王在各局勢(shì)中的益損值表(單位:千金)26其中:齊王的策略集:S1={1,2,3,4,5,6}田忌的策略集:S1={1,2,3,4,5,6}下列矩陣稱齊王的贏得矩陣:
3111-1113111-1A=1-13111-111311111-13111-1113其中:271.基本概念(續(xù))二人有限零和對(duì)策:(又稱矩陣策略)局中人為2;每局中人的策略集中策略權(quán)目有限;每一局勢(shì)的對(duì)策均有確定的損益值,并且對(duì)同一局勢(shì)的兩個(gè)局中人的益損值之和為零。1.基本概念(續(xù))二人有限零和對(duì)策:(又稱矩陣策略)281.基本概念(續(xù))記矩陣對(duì)策為:
G={S1,S2,A}
甲的策略集甲的贏得矩陣乙的策略集“齊王賽馬”即是一個(gè)矩陣策略.1.基本概念(續(xù))記矩陣對(duì)策為:292.矩陣對(duì)策的最優(yōu)純策略在甲方贏得矩陣中:A=[aij]m*ni行代表甲方策略i=1,2…mJ列代表乙方策略j=1,2…naij代表甲方取策略i,乙方取策略j,這一局勢(shì)下甲方的益損值,此時(shí)乙方的益損值為-aij(零和性質(zhì))。在討論各方采用的策略是必須注意一個(gè)前提就是對(duì)方是理智的。這就是要從最有把握取得的益損值情況考慮。2.矩陣對(duì)策的最優(yōu)純策略在甲方贏得矩陣中:302.矩陣對(duì)策的最優(yōu)純策略(續(xù))例:有交易雙方公司甲和乙,甲有三個(gè)策略1,2,3;乙有四個(gè)策略1,2,3,4,根據(jù)獲利情況建立甲方的益損值贏得矩陣。
-30-20A=2301-2-4-13問(wèn):甲公司應(yīng)采取什么策略比較適合?2.矩陣對(duì)策的最優(yōu)純策略(續(xù))例:有交易雙方公司甲和乙,甲有31甲:采取1至少得益–3(損失3)203-4(損失4)乙:采取1甲最多得益2(乙最少得益-2)23(乙得益-3)30(乙得益0)43(乙得益-3)取大則取2maxminaij=0
ij取小則取3minmaxaij=0ji甲:取大則取2取小則取332甲采取策略2不管乙采取如何策略,都至少得益。乙采取策略3不管甲采取如何策略,都至少可以得益。(最多損失0)分別稱甲,乙公司的最優(yōu)策略,由唯一性又稱最優(yōu)純策略。存在前提:
maxminaij=minmaxaij=v
ijji又稱(2,3)為對(duì)策G={s1,s2,A}的鞍點(diǎn)。值V為G的值。甲采取策略2不管乙采取如何策略,都至少得益。333.矩陣對(duì)策的混合策略設(shè)矩陣對(duì)策G={S1,S2,A}當(dāng)maxminaijminmaxaij
ijji時(shí),不存在最優(yōu)純策略求解混合策略。3.矩陣對(duì)策的混合策略設(shè)矩陣對(duì)策G={S1,S2,A}343.矩陣對(duì)策的混合策略例:設(shè)一個(gè)贏得矩陣如下:
min595A=max6策略2866imax89min8
策略1
j3.矩陣對(duì)策的混合策略例:設(shè)一個(gè)贏得矩陣如下:35矛盾:甲取2,乙取時(shí)1,甲實(shí)際贏得8比預(yù)期多2(乙就少2)這對(duì)乙講是不滿意的,考慮這一點(diǎn),乙采取策略2,若甲分析到這一點(diǎn),取策略1,則贏得更多為9…此時(shí),甲,乙方?jīng)]有一個(gè)雙方均可接受的平衡局勢(shì)。一個(gè)思路:對(duì)甲(乙)給出一個(gè)選取不同策略的概率分布,以使甲(乙)在各種情況下的平均贏得(損失)最多(最少)。-----即混合策略矛盾:甲取2,乙取時(shí)1,甲實(shí)際贏得8比預(yù)期多2(乙就少36求解方法:線性規(guī)劃法(其他方法:圖解法,迭代法,線性方程法等略)例:59設(shè)在最壞的情況下,A=甲贏得的平均值為V.
86(未知)STEP11)設(shè)甲使用策略1的概率為X1′X1′+X2′=1設(shè)甲使用策略2的概率為X2′X1′,X2′0求解方法:線性規(guī)劃法372)無(wú)論乙取何策略,甲的平均贏得應(yīng)不少于V:對(duì)乙取1:5X1’+8X2’V對(duì)乙取2:9X1’+6X2’V注意V>0,因?yàn)锳各元素為正。STEP2作變換:X1=X1’/V;X2=X2’/V得到上述關(guān)系式變?yōu)椋篨1+X2=1/V(V愈大愈好)待定5X1+8X219X1+6X21X1,X202)無(wú)論乙取何策略,甲的平均贏得應(yīng)不少于V:38建立線性模型:
minX1+X2
s.t.5X1+8X21X1=1/21
9X1+6X21X2=2/21X1,X201/V=X1+X2=1/7所以:V=7
返回原問(wèn)題:X1’=X1V=1/3
X2’=X2V=2/3于是甲的最優(yōu)混合策略為:以1/3的概率選1;以2/3的概率選2最優(yōu)值V=7.建立線性模型:39同樣可求乙的最優(yōu)混合策略:設(shè)乙使用策略1的概率為Y1′Y1′+Y2′=1設(shè)乙使用策略2的概率為Y2′Y1′,Y2′0設(shè)在最壞的情況下,甲贏得的平均值為V.這也是乙損失的平均值,越小越好作變換:Y1=Y1’/V;Y2=Y2’/V建立線性模型:
maxY1+Y2
s.t.5Y1+9Y21Y1=1/14
8Y1+6Y21Y2=1/14Y1,Y201/V=Y1+Y2=1/7所以:V=7
同樣可求乙的最優(yōu)混合策略:40返回原問(wèn)題:Y1’=Y1V=1/2
Y2’=Y2V=1/2于是乙的最優(yōu)混合策略為:以1/2的概率選1;以1/2的概率選2最優(yōu)值V=7.當(dāng)贏得矩陣中有非正元素時(shí),V0的條件不一定成立,可以作下列變換:選一正數(shù)k,令矩陣中每一元素加上k得到新的正矩陣A’,其對(duì)應(yīng)的矩陣對(duì)策G’={S1,S2,A’}與G={S1,S2,A}解相同,但VG=VG’-k返回原問(wèn)題:Y1’=Y1V=1/241例:求解“齊王賽馬”問(wèn)題(見(jiàn)備課稿)優(yōu)超原則:假設(shè)矩陣對(duì)策G={S1,S2,A}
甲方贏得矩陣A=[aij]mn--若存在兩行(列),s行(列)的各元素均優(yōu)于t行(列)的元素,即asjatjj=1,2…n(ais
aiti=1,2…m)稱甲方策略s優(yōu)超于t(s優(yōu)超于t)3.矩陣對(duì)策的混合策略(續(xù))例:求解“齊王賽馬”問(wèn)題(見(jiàn)備課稿)3.矩陣對(duì)策的混合策略(42--優(yōu)超原則:當(dāng)局中人甲方的策略t被其它策略所優(yōu)超時(shí),可在其贏得矩陣A中劃去第t行(同
溫馨提示
- 1. 本站所有資源如無(wú)特殊說(shuō)明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請(qǐng)下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請(qǐng)聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
- 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁(yè)內(nèi)容里面會(huì)有圖紙預(yù)覽,若沒(méi)有圖紙預(yù)覽就沒(méi)有圖紙。
- 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
- 5. 人人文庫(kù)網(wǎng)僅提供信息存儲(chǔ)空間,僅對(duì)用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對(duì)用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對(duì)任何下載內(nèi)容負(fù)責(zé)。
- 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請(qǐng)與我們聯(lián)系,我們立即糾正。
- 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶因使用這些下載資源對(duì)自己和他人造成任何形式的傷害或損失。
最新文檔
- 出售轉(zhuǎn)讓網(wǎng)店合同標(biāo)準(zhǔn)文本
- 公對(duì)個(gè)人合同樣本
- 公務(wù)大巴租賃合同樣本
- 分公司 設(shè)計(jì)合同標(biāo)準(zhǔn)文本
- 農(nóng)場(chǎng)抵押貸款合同樣本
- 個(gè)人汽車(chē)質(zhì)押合同樣本
- 出售工廠馬桶套合同標(biāo)準(zhǔn)文本
- 冰柜轉(zhuǎn)讓商用合同范例
- 嵌頓疝護(hù)理查房
- 分期車(chē)輛回購(gòu)合同標(biāo)準(zhǔn)文本
- 《寓言故事中的對(duì)比》群文閱讀(教學(xué)設(shè)計(jì))-2023-2024學(xué)年統(tǒng)編版語(yǔ)文三年級(jí)下冊(cè)
- 2024年中國(guó)資源循環(huán)集團(tuán)有限公司招聘筆試真題
- 2025屆3月高三山東濰坊一模英語(yǔ)試題
- 行政管理本科畢業(yè)論文-數(shù)字政府背景下地方政府治理效能研究
- 家庭營(yíng)養(yǎng)師課件
- 成人腸內(nèi)營(yíng)養(yǎng)支持的護(hù)理課件
- 鐵路護(hù)路工作培訓(xùn)
- 玉蘭采購(gòu)及包栽包活合同范本
- 電信運(yùn)營(yíng)商網(wǎng)絡(luò)升級(jí)計(jì)劃
- 2025年全國(guó)國(guó)家版圖知識(shí)競(jìng)賽(中小學(xué)組)題庫(kù)及答案
- 介入治療測(cè)試試題及答案
評(píng)論
0/150
提交評(píng)論