版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進行舉報或認領(lǐng)
文檔簡介
對策論由“齊王賽馬”引入對策論由“齊王賽馬”引入11.對策論的基本概念三個基本要素;1.局中人:參與對抗的各方;2.策略集:局中人選擇對付其它局中人的行動方案稱為策略。某局中人的所有可能策略全體稱為策略集;3.局勢對策的益損值:各局中人各自使用一個對策就形成一個局勢,一個局勢決定了個局眾人的對策結(jié)果(量化)稱為該局勢對策的益損值)1.對策論的基本概念三個基本要素;2“齊王賽馬”齊王在各局勢中的益損值表(單位:千金)“齊王賽馬”齊王在各局勢中的益損值表(單位:千金)3其中:齊王的策略集:S1={1,2,3,4,5,6}田忌的策略集:S1={1,2,3,4,5,6}下列矩陣稱齊王的贏得矩陣:
3111-1113111-1A=1-13111-111311111-13111-1113其中:41.基本概念(續(xù))二人有限零和對策:(又稱矩陣策略)局中人為2;每局中人的策略集中策略權(quán)目有限;每一局勢的對策均有確定的損益值,并且對同一局勢的兩個局中人的益損值之和為零。1.基本概念(續(xù))二人有限零和對策:(又稱矩陣策略)51.基本概念(續(xù))記矩陣對策為:
G={S1,S2,A}
甲的策略集甲的贏得矩陣乙的策略集“齊王賽馬”即是一個矩陣策略.1.基本概念(續(xù))記矩陣對策為:62.矩陣對策的最優(yōu)純策略在甲方贏得矩陣中:A=[aij]m*ni行代表甲方策略i=1,2…mJ列代表乙方策略j=1,2…naij代表甲方取策略i,乙方取策略j,這一局勢下甲方的益損值,此時乙方的益損值為-aij(零和性質(zhì))。在討論各方采用的策略是必須注意一個前提就是對方是理智的。這就是要從最有把握取得的益損值情況考慮。2.矩陣對策的最優(yōu)純策略在甲方贏得矩陣中:72.矩陣對策的最優(yōu)純策略(續(xù))例:有交易雙方公司甲和乙,甲有三個策略1,2,3;乙有四個策略1,2,3,4,根據(jù)獲利情況建立甲方的益損值贏得矩陣。
-30-20A=2301-2-4-13問:甲公司應(yīng)采取什么策略比較適合?2.矩陣對策的最優(yōu)純策略(續(xù))例:有交易雙方公司甲和乙,甲有8甲:采取1至少得益–3(損失3)203-4(損失4)乙:采取1甲最多得益2(乙最少得益-2)23(乙得益-3)30(乙得益0)43(乙得益-3)取大則取2maxminaij=0
ij取小則取3minmaxaij=0ji甲:取大則取2取小則取39甲采取策略2不管乙采取如何策略,都至少得益。乙采取策略3不管甲采取如何策略,都至少可以得益。(最多損失0)分別稱甲,乙公司的最優(yōu)策略,由唯一性又稱最優(yōu)純策略。存在前提:
maxminaij=minmaxaij=v
ijji又稱(2,3)為對策G={s1,s2,A}的鞍點。值V為G的值。甲采取策略2不管乙采取如何策略,都至少得益。103.矩陣對策的混合策略設(shè)矩陣對策G={S1,S2,A}當maxminaijminmaxaij
ijji時,不存在最優(yōu)純策略求解混合策略。3.矩陣對策的混合策略設(shè)矩陣對策G={S1,S2,A}113.矩陣對策的混合策略例:設(shè)一個贏得矩陣如下:
min595A=max6策略2866imax89min8
策略1
j3.矩陣對策的混合策略例:設(shè)一個贏得矩陣如下:12矛盾:甲取2,乙取時1,甲實際贏得8比預期多2(乙就少2)這對乙講是不滿意的,考慮這一點,乙采取策略2,若甲分析到這一點,取策略1,則贏得更多為9…此時,甲,乙方?jīng)]有一個雙方均可接受的平衡局勢。一個思路:對甲(乙)給出一個選取不同策略的概率分布,以使甲(乙)在各種情況下的平均贏得(損失)最多(最少)。-----即混合策略矛盾:甲取2,乙取時1,甲實際贏得8比預期多2(乙就少13求解方法:線性規(guī)劃法(其他方法:圖解法,迭代法,線性方程法等略)例:59設(shè)在最壞的情況下,A=甲贏得的平均值為V.
86(未知)STEP11)設(shè)甲使用策略1的概率為X1′X1′+X2′=1設(shè)甲使用策略2的概率為X2′X1′,X2′0求解方法:線性規(guī)劃法142)無論乙取何策略,甲的平均贏得應(yīng)不少于V:對乙取1:5X1’+8X2’V對乙取2:9X1’+6X2’V注意V>0,因為A各元素為正。STEP2作變換:X1=X1’/V;X2=X2’/V得到上述關(guān)系式變?yōu)椋篨1+X2=1/V(V愈大愈好)待定5X1+8X219X1+6X21X1,X202)無論乙取何策略,甲的平均贏得應(yīng)不少于V:15建立線性模型:
minX1+X2
s.t.5X1+8X21X1=1/21
9X1+6X21X2=2/21X1,X201/V=X1+X2=1/7所以:V=7
返回原問題:X1’=X1V=1/3
X2’=X2V=2/3于是甲的最優(yōu)混合策略為:以1/3的概率選1;以2/3的概率選2最優(yōu)值V=7.建立線性模型:16同樣可求乙的最優(yōu)混合策略:設(shè)乙使用策略1的概率為Y1′Y1′+Y2′=1設(shè)乙使用策略2的概率為Y2′Y1′,Y2′0設(shè)在最壞的情況下,甲贏得的平均值為V.這也是乙損失的平均值,越小越好作變換:Y1=Y1’/V;Y2=Y2’/V建立線性模型:
maxY1+Y2
s.t.5Y1+9Y21Y1=1/14
8Y1+6Y21Y2=1/14Y1,Y201/V=Y1+Y2=1/7所以:V=7
同樣可求乙的最優(yōu)混合策略:17返回原問題:Y1’=Y1V=1/2
Y2’=Y2V=1/2于是乙的最優(yōu)混合策略為:以1/2的概率選1;以1/2的概率選2最優(yōu)值V=7.當贏得矩陣中有非正元素時,V0的條件不一定成立,可以作下列變換:選一正數(shù)k,令矩陣中每一元素加上k得到新的正矩陣A’,其對應(yīng)的矩陣對策G’={S1,S2,A’}與G={S1,S2,A}解相同,但VG=VG’-k返回原問題:Y1’=Y1V=1/218例:求解“齊王賽馬”問題(見備課稿)優(yōu)超原則:假設(shè)矩陣對策G={S1,S2,A}
甲方贏得矩陣A=[aij]mn--若存在兩行(列),s行(列)的各元素均優(yōu)于t行(列)的元素,即asjatjj=1,2…n(ais
aiti=1,2…m)稱甲方策略s優(yōu)超于t(s優(yōu)超于t)3.矩陣對策的混合策略(續(xù))例:求解“齊王賽馬”問題(見備課稿)3.矩陣對策的混合策略(19--優(yōu)超原則:當局中人甲方的策略t被其它策略所優(yōu)超時,可在其贏得矩陣A中劃去第t行(同理,當局中人乙方的策略t被其它策略所優(yōu)超時,可在矩陣A中劃去第t列)。如此得到階數(shù)較小的贏得矩陣A’,其對應(yīng)的矩陣對策
G’={S1,S2,A’}與G={S1,S2,A}等價,即解相同。3.矩陣對策的混合策略(續(xù))--優(yōu)超原則:當局中人甲方的策略t被其它策略所優(yōu)超時,可20例設(shè)甲方的益損值贏得矩陣。
32030
被第3、4行所優(yōu)超
50259
被第3行所優(yōu)超A=7395946875.560883得到73959被第1列所優(yōu)超A1=46875.5被第2列所優(yōu)超608833.矩陣對策的混合策略(續(xù))例設(shè)甲方的益損值贏得矩陣。3.矩陣對策的混合策略(續(xù))21續(xù)例得到739A2=465.5
603
被第1行所優(yōu)超得到739
被第1列所優(yōu)超A3=465.573最終得到A4=463.矩陣對策的混合策略(續(xù))續(xù)例得到3.矩陣對策的混合策略(續(xù))22對A4計算,用線性規(guī)劃方法得到:(注意:余下的策略為3,4,1,2)甲:X*=(0,0,1/15,2/15,0)TV=5X*’=(0,0,1/3,2/3,0)T
乙:Y*=(1/10,1/10,0,0,0)TV=5Y*’=(1/2,1/2,0,0,0)T
注:利用有超原則化簡贏得矩陣時,有可能將原對策問題的解也劃去一些(多解情況);線性規(guī)劃求解時有可能是多解問題。習題:P343-1,3,43.矩陣對策的混合策略(續(xù))對A4計算,用線性規(guī)劃方法得到:3.矩陣對策的混合策略(續(xù))23對策論由“齊王賽馬”引入對策論由“齊王賽馬”引入241.對策論的基本概念三個基本要素;1.局中人:參與對抗的各方;2.策略集:局中人選擇對付其它局中人的行動方案稱為策略。某局中人的所有可能策略全體稱為策略集;3.局勢對策的益損值:各局中人各自使用一個對策就形成一個局勢,一個局勢決定了個局眾人的對策結(jié)果(量化)稱為該局勢對策的益損值)1.對策論的基本概念三個基本要素;25“齊王賽馬”齊王在各局勢中的益損值表(單位:千金)“齊王賽馬”齊王在各局勢中的益損值表(單位:千金)26其中:齊王的策略集:S1={1,2,3,4,5,6}田忌的策略集:S1={1,2,3,4,5,6}下列矩陣稱齊王的贏得矩陣:
3111-1113111-1A=1-13111-111311111-13111-1113其中:271.基本概念(續(xù))二人有限零和對策:(又稱矩陣策略)局中人為2;每局中人的策略集中策略權(quán)目有限;每一局勢的對策均有確定的損益值,并且對同一局勢的兩個局中人的益損值之和為零。1.基本概念(續(xù))二人有限零和對策:(又稱矩陣策略)281.基本概念(續(xù))記矩陣對策為:
G={S1,S2,A}
甲的策略集甲的贏得矩陣乙的策略集“齊王賽馬”即是一個矩陣策略.1.基本概念(續(xù))記矩陣對策為:292.矩陣對策的最優(yōu)純策略在甲方贏得矩陣中:A=[aij]m*ni行代表甲方策略i=1,2…mJ列代表乙方策略j=1,2…naij代表甲方取策略i,乙方取策略j,這一局勢下甲方的益損值,此時乙方的益損值為-aij(零和性質(zhì))。在討論各方采用的策略是必須注意一個前提就是對方是理智的。這就是要從最有把握取得的益損值情況考慮。2.矩陣對策的最優(yōu)純策略在甲方贏得矩陣中:302.矩陣對策的最優(yōu)純策略(續(xù))例:有交易雙方公司甲和乙,甲有三個策略1,2,3;乙有四個策略1,2,3,4,根據(jù)獲利情況建立甲方的益損值贏得矩陣。
-30-20A=2301-2-4-13問:甲公司應(yīng)采取什么策略比較適合?2.矩陣對策的最優(yōu)純策略(續(xù))例:有交易雙方公司甲和乙,甲有31甲:采取1至少得益–3(損失3)203-4(損失4)乙:采取1甲最多得益2(乙最少得益-2)23(乙得益-3)30(乙得益0)43(乙得益-3)取大則取2maxminaij=0
ij取小則取3minmaxaij=0ji甲:取大則取2取小則取332甲采取策略2不管乙采取如何策略,都至少得益。乙采取策略3不管甲采取如何策略,都至少可以得益。(最多損失0)分別稱甲,乙公司的最優(yōu)策略,由唯一性又稱最優(yōu)純策略。存在前提:
maxminaij=minmaxaij=v
ijji又稱(2,3)為對策G={s1,s2,A}的鞍點。值V為G的值。甲采取策略2不管乙采取如何策略,都至少得益。333.矩陣對策的混合策略設(shè)矩陣對策G={S1,S2,A}當maxminaijminmaxaij
ijji時,不存在最優(yōu)純策略求解混合策略。3.矩陣對策的混合策略設(shè)矩陣對策G={S1,S2,A}343.矩陣對策的混合策略例:設(shè)一個贏得矩陣如下:
min595A=max6策略2866imax89min8
策略1
j3.矩陣對策的混合策略例:設(shè)一個贏得矩陣如下:35矛盾:甲取2,乙取時1,甲實際贏得8比預期多2(乙就少2)這對乙講是不滿意的,考慮這一點,乙采取策略2,若甲分析到這一點,取策略1,則贏得更多為9…此時,甲,乙方?jīng)]有一個雙方均可接受的平衡局勢。一個思路:對甲(乙)給出一個選取不同策略的概率分布,以使甲(乙)在各種情況下的平均贏得(損失)最多(最少)。-----即混合策略矛盾:甲取2,乙取時1,甲實際贏得8比預期多2(乙就少36求解方法:線性規(guī)劃法(其他方法:圖解法,迭代法,線性方程法等略)例:59設(shè)在最壞的情況下,A=甲贏得的平均值為V.
86(未知)STEP11)設(shè)甲使用策略1的概率為X1′X1′+X2′=1設(shè)甲使用策略2的概率為X2′X1′,X2′0求解方法:線性規(guī)劃法372)無論乙取何策略,甲的平均贏得應(yīng)不少于V:對乙取1:5X1’+8X2’V對乙取2:9X1’+6X2’V注意V>0,因為A各元素為正。STEP2作變換:X1=X1’/V;X2=X2’/V得到上述關(guān)系式變?yōu)椋篨1+X2=1/V(V愈大愈好)待定5X1+8X219X1+6X21X1,X202)無論乙取何策略,甲的平均贏得應(yīng)不少于V:38建立線性模型:
minX1+X2
s.t.5X1+8X21X1=1/21
9X1+6X21X2=2/21X1,X201/V=X1+X2=1/7所以:V=7
返回原問題:X1’=X1V=1/3
X2’=X2V=2/3于是甲的最優(yōu)混合策略為:以1/3的概率選1;以2/3的概率選2最優(yōu)值V=7.建立線性模型:39同樣可求乙的最優(yōu)混合策略:設(shè)乙使用策略1的概率為Y1′Y1′+Y2′=1設(shè)乙使用策略2的概率為Y2′Y1′,Y2′0設(shè)在最壞的情況下,甲贏得的平均值為V.這也是乙損失的平均值,越小越好作變換:Y1=Y1’/V;Y2=Y2’/V建立線性模型:
maxY1+Y2
s.t.5Y1+9Y21Y1=1/14
8Y1+6Y21Y2=1/14Y1,Y201/V=Y1+Y2=1/7所以:V=7
同樣可求乙的最優(yōu)混合策略:40返回原問題:Y1’=Y1V=1/2
Y2’=Y2V=1/2于是乙的最優(yōu)混合策略為:以1/2的概率選1;以1/2的概率選2最優(yōu)值V=7.當贏得矩陣中有非正元素時,V0的條件不一定成立,可以作下列變換:選一正數(shù)k,令矩陣中每一元素加上k得到新的正矩陣A’,其對應(yīng)的矩陣對策G’={S1,S2,A’}與G={S1,S2,A}解相同,但VG=VG’-k返回原問題:Y1’=Y1V=1/241例:求解“齊王賽馬”問題(見備課稿)優(yōu)超原則:假設(shè)矩陣對策G={S1,S2,A}
甲方贏得矩陣A=[aij]mn--若存在兩行(列),s行(列)的各元素均優(yōu)于t行(列)的元素,即asjatjj=1,2…n(ais
aiti=1,2…m)稱甲方策略s優(yōu)超于t(s優(yōu)超于t)3.矩陣對策的混合策略(續(xù))例:求解“齊王賽馬”問題(見備課稿)3.矩陣對策的混合策略(42--優(yōu)超原則:當局中人甲方的策略t被其它策略所優(yōu)超時,可在其贏得矩陣A中劃去第t行(同
溫馨提示
- 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
- 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預覽,若沒有圖紙預覽就沒有圖紙。
- 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
- 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負責。
- 6. 下載文件中如有侵權(quán)或不適當內(nèi)容,請與我們聯(lián)系,我們立即糾正。
- 7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。
最新文檔
- 2025年度石英砂信用保證與銷售合同
- 二零二五年度農(nóng)村自建房買賣定金合同范本3篇
- 二零二五年度房屋抵押貸款再擔保服務(wù)合同3篇
- 二零二五年度家政服務(wù)人員權(quán)益保障三方合同范本3篇
- 二零二五年度教師職務(wù)晉升勞動合同范本3篇
- 二零二五年度文化創(chuàng)意門面租賃與藝術(shù)展覽合作合同3篇
- 2025年度海上油輪保險合同范本發(fā)布3篇
- 海南衛(wèi)生健康職業(yè)學院《西醫(yī)外科學醫(yī)學免疫學與病原生物學》2023-2024學年第一學期期末試卷
- 螃蟹涂鴉課程設(shè)計
- 二零二五年度二手房購置糾紛調(diào)解服務(wù)合同
- 直播電商基地入駐協(xié)議書范文
- 兒童涂色畫空白填色圖(100張文本打印版)
- 2024版合同及信息管理方案
- 人教精通版小學英語(三年級起點)四年級上冊同步練習試題(全套)
- 2024-2025學年人教版生物八年級上冊期末綜合測試卷
- 有機農(nóng)業(yè)種植技術(shù)操作手冊
- 2024-2025學年四年級上冊數(shù)學人教版期末測評卷(含答案)
- 2024-2030年中國裸眼3D市場深度調(diào)查與競爭格局分析研究報告
- 曲線與曲面積分練習題含答案
- 《ISO56001-2024創(chuàng)新管理體系 - 要求》之25:“9績效評價-9.2內(nèi)部審核”解讀和應(yīng)用指導材料(雷澤佳編制-2024)
- 小升初典型奧數(shù):相遇問題(講義)-2023-2024學年六年級下冊數(shù)學人教版
評論
0/150
提交評論