![運(yùn)籌學(xué)課件第六章對(duì)策論基礎(chǔ)_第1頁(yè)](http://file3.renrendoc.com/fileroot_temp3/2022-7/4/c28af667-a8f9-4de2-b33d-49c0999e95ab/c28af667-a8f9-4de2-b33d-49c0999e95ab1.gif)
![運(yùn)籌學(xué)課件第六章對(duì)策論基礎(chǔ)_第2頁(yè)](http://file3.renrendoc.com/fileroot_temp3/2022-7/4/c28af667-a8f9-4de2-b33d-49c0999e95ab/c28af667-a8f9-4de2-b33d-49c0999e95ab2.gif)
![運(yùn)籌學(xué)課件第六章對(duì)策論基礎(chǔ)_第3頁(yè)](http://file3.renrendoc.com/fileroot_temp3/2022-7/4/c28af667-a8f9-4de2-b33d-49c0999e95ab/c28af667-a8f9-4de2-b33d-49c0999e95ab3.gif)
![運(yùn)籌學(xué)課件第六章對(duì)策論基礎(chǔ)_第4頁(yè)](http://file3.renrendoc.com/fileroot_temp3/2022-7/4/c28af667-a8f9-4de2-b33d-49c0999e95ab/c28af667-a8f9-4de2-b33d-49c0999e95ab4.gif)
![運(yùn)籌學(xué)課件第六章對(duì)策論基礎(chǔ)_第5頁(yè)](http://file3.renrendoc.com/fileroot_temp3/2022-7/4/c28af667-a8f9-4de2-b33d-49c0999e95ab/c28af667-a8f9-4de2-b33d-49c0999e95ab5.gif)
版權(quán)說(shuō)明:本文檔由用戶(hù)提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請(qǐng)進(jìn)行舉報(bào)或認(rèn)領(lǐng)
文檔簡(jiǎn)介
1、 概論基本概念與名詞對(duì)策分類(lèi) 矩陣對(duì)策的基本理論矩陣對(duì)策的數(shù)學(xué)模型最優(yōu)純策略混合策略與混合擴(kuò)充 基本概念與名詞 對(duì)策分類(lèi)博弈現(xiàn)象下棋與打牌體育比賽戰(zhàn)爭(zhēng)市場(chǎng)進(jìn)入談判生產(chǎn)管理決策競(jìng)拍 博弈論是研究博弈現(xiàn)象的規(guī)律的數(shù)學(xué)理論和方法 博弈現(xiàn)象的要素局中人(參與人) 二人或多人行動(dòng)與策略有限或無(wú)限信息完全或不完全支付函數(shù)可正可負(fù) 局中人 策略與策略集 局勢(shì) 贏得函數(shù) 零和對(duì)策 矩陣對(duì)策:二人有限零和對(duì)策一)按對(duì)策雙方是否存在有約束力的協(xié)議來(lái)分:合作對(duì)策非合作對(duì)策二)按局中人數(shù)分類(lèi):二人對(duì)策多人對(duì)策三)按策略數(shù)分類(lèi):有限策略對(duì)策無(wú)限策略對(duì)策 二人非合作對(duì)策是我們討論的重點(diǎn)。 非合作博弈的進(jìn)一步分類(lèi)非合作博弈
2、零和博弈 純策略博弈 混合策略博弈 非零和博弈 完全信息博弈 w 靜態(tài)博弈 w 動(dòng)態(tài)博弈 不完全信息博弈 w 靜態(tài)博弈 w 動(dòng)態(tài)博弈 非零和的四種博弈也可以有純策略和混合策略博弈之分。 動(dòng)態(tài)時(shí)行動(dòng)和策略不同,要素有五個(gè);而靜態(tài)時(shí)行動(dòng)與策略不加區(qū)別,要素有三個(gè)。 矩陣對(duì)策的數(shù)學(xué)模型矩陣對(duì)策的數(shù)學(xué)模型 最優(yōu)純策略最優(yōu)純策略 混合策略與混合擴(kuò)充混合策略與混合擴(kuò)充一、矩陣對(duì)策的數(shù)學(xué)模型一、矩陣對(duì)策的數(shù)學(xué)模型 以齊王賽馬為例說(shuō)明齊王賽馬二人非合作零和對(duì)策 局中人齊王和田忌 策略 上 中下三種等級(jí)的馬的組合 ,比三次,有六組策略:( 上,中,下) 、 ( 中,上,下) 、 ( 上,下,中) 、 ( 中,下
3、,上) 、 ( 下,上,中) 、 ( 下,中,上) . 對(duì)齊王,這六組策略用 表示, 對(duì)田忌,則用 表示。 支付函數(shù)贏了得一千金,輸了付一千金。6 , 5 , 4 , 3 , 2 , 1, ii6 , 5 , 4 , 3 , 2 , 1, ii齊王賽馬贏得函數(shù)31111-11311-111-13111-11131111-1131111-113 (上中下) (上下中)齊 (中上下)王 (中下上) (下中上) (下上中)田 忌654321654321 二人矩陣對(duì)策用下列式子表示 其中I、II表示兩個(gè)局中人,S1、S2分別表示局中人I、II的策略集,A則表示贏得矩陣:ASSGASSIIIG,2121
4、或)(ijaA 現(xiàn)有一矩陣對(duì)策 其中ASSG,216104801213936,4321321321243211ASS 若滿(mǎn)足 則上述條件規(guī)定的局勢(shì) 叫做最優(yōu)純局勢(shì),也是矩陣對(duì)策的最優(yōu)解,是局中人I、II的最優(yōu)純策略。 定理:矩陣對(duì)策G=S1,S2,A有純策略解的充要條件是存在一個(gè)純局勢(shì) 使得maxminminmaxijijijjiaa),(*ji),(*jinjmiaaajijiij, 2 , 1;, 2 , 1,* 在上述定理中 因此符合條件 的即為最優(yōu)純策略。 上述例子的最優(yōu)純策略為:最優(yōu)局勢(shì) 且G=2為局中人I的贏得值。)(max),(min*ijijiijjijaaaa)(min)(m
5、ax*jijijiaa),(22 基本概念:當(dāng) 時(shí)不存在最優(yōu)純策略,此時(shí)需要應(yīng)用混合策略的方法確定參加對(duì)策的純策略。 例如maxminminmaxijijijjiaaASSG,212431,2121212211ASS 因?yàn)?所以 此時(shí)假設(shè)局中人I以概率x選取策略1,以概率(1-x)選取策略2;局中人II以概率y選取策略1,以概率(1-y)選取策略2。則對(duì)于局中人I來(lái)說(shuō),贏得的期望值為E(x,y),它等于3maxmin, 2minmaxijijijjiaamaxminminmaxijijijjiaa 贏得期望值 在x=1/2,y=1/4時(shí),贏得函數(shù)取得最優(yōu)值5/2。這實(shí)際上是對(duì)策雙方都滿(mǎn)意的結(jié)果
6、。我們把純策略對(duì)應(yīng)的概率向量叫做混合策純策略對(duì)應(yīng)的概率向量叫做混合策略略,最優(yōu)解則是最優(yōu)混合策略。本例中,最優(yōu)混合策略是(1/2,1/2)和(1/4,3/4)。2/5)4/1)(2/1(42/52/124)1)(1 (2)1 (4)1 (3),(yxyxxyyxyxyxxyyxE 令純策略集對(duì)應(yīng)的概率向量是 它們滿(mǎn)足 混合策略的集合 將 叫做G的混合擴(kuò)充。),(),(2121nmyyyYxxxX11, 2 , 1;, 2 , 1, 0,11njjmiijiyxnjmiyx,*2*1YSXS,*2*1*ESSG 若令 并有 則稱(chēng)(X*,Y*)為最優(yōu)混合局勢(shì),或叫做G在混合策略下的解,V叫做對(duì)策G
7、的值。X*、Y*分別是局中人I、II的最優(yōu)混合策略。),(min),(),(max),(*2*1*YXEYXEYXEYXESYSXVYXEYXESXSY),(max),(min*1*2 如果G的值是V,則局中人I和II的最優(yōu)策略是下列兩組不等式的解: 關(guān)于混合對(duì)策問(wèn)題的解,我們有如下定理:0, 1, 2 , 1,11imiimiiijxxnjVxa0, 1, 2 , 1,11jnjjnjjijyymiVya 如果(X*,Y*)是對(duì)策G的最優(yōu)混合局勢(shì),則對(duì)于某個(gè)i或j來(lái)說(shuō),有:0,)4(0,) 3(0)2(0) 1 (*1*1*1*1*jmiiijinjjijmiiijjnjjijiyVxaxV
8、yaVxayVyax則若則若,則若,則若 對(duì)于G=S1,S2,A38806678649593795205030435432154321A 劃去普遍較小的行,例如第1、2行,得 劃去普遍較大的列,例如第3、4、5三列,結(jié)果如上。46987580686493754354321A06364754321A 上述結(jié)果的第一行比第三行普遍更優(yōu),因此再劃去第三行,得 若混合策略均不為零,由上述定理知混合對(duì)策問(wèn)題數(shù)學(xué)模型的不等式應(yīng)為等式。因此有64374321A 最優(yōu)混合策略滿(mǎn)足如下方程組 解得0,1634743434343xxxxVxxVxx0,1643721212121yyyyVyyVyy5, 2/1, 2/1; 3/2, 3/12143Vyyxx5)0 , 0 , 0 , 2/1 , 2/1 ()0 , 3/2 , 3/1 , 0 , 0(VYXTT記T(G)為矩陣對(duì)策G的解集定理1 設(shè)有兩個(gè)矩陣對(duì)策 G1=S1,S2,A1, G2=S1,S2,A2, 其中A1=(aij), A2=(aij+L), L為一任意常數(shù),則 (G)T(G)T )2( ) 1 (2112LVVGG 定理2 設(shè)有兩個(gè)矩陣
溫馨提示
- 1. 本站所有資源如無(wú)特殊說(shuō)明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請(qǐng)下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請(qǐng)聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶(hù)所有。
- 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁(yè)內(nèi)容里面會(huì)有圖紙預(yù)覽,若沒(méi)有圖紙預(yù)覽就沒(méi)有圖紙。
- 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
- 5. 人人文庫(kù)網(wǎng)僅提供信息存儲(chǔ)空間,僅對(duì)用戶(hù)上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對(duì)用戶(hù)上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對(duì)任何下載內(nèi)容負(fù)責(zé)。
- 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請(qǐng)與我們聯(lián)系,我們立即糾正。
- 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶(hù)因使用這些下載資源對(duì)自己和他人造成任何形式的傷害或損失。
最新文檔
- 2025年度大型水利工程監(jiān)理合同范本
- 2025年度市政道路基礎(chǔ)設(shè)施主體承包合同示范文本
- 2025年度個(gè)人車(chē)位使用權(quán)轉(zhuǎn)讓與車(chē)位租賃合同補(bǔ)充協(xié)議
- 2025年度酒店客房衛(wèi)生間改造工程油漆施工與智能家居設(shè)備安裝合同
- 2025年度新能源充電樁運(yùn)營(yíng)租賃合同
- 2025年度海上石油平臺(tái)設(shè)備維修服務(wù)合同標(biāo)準(zhǔn)范本
- 2025年度國(guó)際貿(mào)易電子合同執(zhí)行與違約責(zé)任追究協(xié)議
- 2025年度大棚灌溉系統(tǒng)安裝與維護(hù)合同
- 2025年度物流行業(yè)股權(quán)質(zhì)押擔(dān)保服務(wù)協(xié)議
- 2025年酒店房屋租賃合同模板專(zhuān)業(yè)版9篇
- 2024年福建漳州人才發(fā)展集團(tuán)有限公司招聘筆試參考題庫(kù)附帶答案詳解
- JTGT F20-2015 公路路面基層施工技術(shù)細(xì)則
- 《籃球主修》考核方式
- Unit 3 Times change單元教學(xué)設(shè)計(jì)
- 科室醫(yī)院感染風(fēng)險(xiǎn)評(píng)估表
- 山東省食用油(植物油)生產(chǎn)企業(yè)名錄496家
- 《智慧農(nóng)業(yè)》的ppt完整版
- GB∕T 33047.1-2016 塑料 聚合物熱重法(TG) 第1部分:通則
- 經(jīng)濟(jì)學(xué)市場(chǎng)失靈與政府失靈課件
- 電力業(yè)務(wù)許可證豁免證明
- 建筑工程資料歸檔立卷分類(lèi)表(全)
評(píng)論
0/150
提交評(píng)論