版權說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權,請進行舉報或認領
文檔簡介
第四章隨機性決策問題的決策準則第一節(jié)引言一、決策問題的表示1、決策樹將一個決策問題的相關方案、狀態(tài)、結果、損益值和概率等用由一些節(jié)點和邊組成的類似于“樹”的圖形表示出來。包括:決策點、狀態(tài)點、結果點。2023/2/54:042023/2/54:04決策樹表示法決策點機會點C1決策枝機會枝后果點C2C3C4后果值a1a2(1)(2)(1)(2)2、決策表將一個決策問題的自然狀態(tài)、概率、行動與損益值用表格的形式表示出來,叫做決策表或者決策矩陣。若決策問題的后果是用損失表示的,也稱損失矩陣。繪制決策表時需要假設:若決策人知道實際上出現(xiàn)的自然狀態(tài),則他就可以確定采取任何一種行動的后果。因此,假設自然只有有限種互不相容的可能的狀態(tài),決策者只有有限種可行的行動。2023/2/54:042023/2/54:04決策表表示法12
…j…n(j)(1)(2)…(j)…(n)a1c11c12…c1j…c1na2c11c12…c1j…c1n…………………aici1ci2…cij…cin…………………amcm1cm2…cmj…cmn狀態(tài)行動后果(效用值、損失值、價值)二、決策問題的分類1、確定型決策問題確定型決策問題的特點是決策人在進行行動之前了解真實的自然狀態(tài),即他可以確切地知道各種行動的后果(屬于運籌學中的純量優(yōu)化問題)。2、嚴格不確定型問題決策人只能知道哪些自然狀態(tài)可能出現(xiàn),他無法以任何方式量化這種不確定性。3、風險型決策決策人可以確定各種可能出現(xiàn)的自然狀態(tài)及其概率分布。2023/2/54:04三、決策準則無論是不確定型問題還是風險型問題,都需要根據(jù)某種準則來選擇決策規(guī)則,使結果最優(yōu)或滿意,這種準則就是決策準則。2023/2/54:04第二節(jié)嚴格不確定型決策問題的決策準則一、求解嚴格不確定型決策問題的主要決策準則1、悲觀準則即極小化極大準則(Wald,
1950)決策人應選擇盡可能最小化最大損失的行動或方案,或選擇使最小效用(價值)最大化的行動。該準則下決策者極端保守,是悲觀主義者,認為老天總跟自己作對,總是假設會發(fā)生最糟的情況會被自己遇上。2023/2/54:042、樂觀主義準則決策者總是選擇最小化最小損失的行動或方案,或最大化最大效用(價值)的行動或方案。Hurwitz在1951年提出,現(xiàn)實中很少有人絕對的悲觀與樂觀,因此,他提出了折衷主義準則,即決策者應根據(jù)悲觀與樂觀準則的加權平均值來排列行動的優(yōu)劣次序,其中加權的權數(shù)稱為樂觀系數(shù)。2023/2/54:043、遺憾準則(后悔值極小化極大)Savage,1951年提出,真實的自然狀態(tài)是決策人無法控制的,在用損失矩陣來作決策時,決策人會把采用一種行動在某一自然狀態(tài)下的結果與同樣的自然狀態(tài)下采用不同的行動的結果加以比較。他定義了后果的后悔值,即在某一狀態(tài)下采取某一行動的損失與該狀態(tài)下其他行動的最佳結果之差。該準則下用后悔值表代替決策表,并選擇最小化最大后悔值的行動或方案。2023/2/54:044、等可能準則Laplace認為對真實的自然狀態(tài)一無所知“等價于”所有自然狀態(tài)具有相同的概率,因此選擇最小化期望損失值的行動或方案。2023/2/54:045、四種決策準則的比較Milnor給出了一個有4種狀態(tài),4種行動的決策問題的例子。決策問題的損失矩陣表2023/2/54:04qja1a2a3a4q1
2343q2
2301q3
4344q4
3344二、理想的決策規(guī)則應當具備的幾種性質(zhì)公理4.1完全的優(yōu)劣次序公理4.2標號無關性公理4.3決策結果的標度無關性公理4.4強優(yōu)勢原則公理4.5無關方案獨立性公理4.6某行中各元素加常數(shù)的無關性公理4.7某一行動的各種后果排列次序的無關性公理4.8某種狀態(tài)下各種后果所在行復制的無關性2023/2/54:04四個準則滿足八條公理的證明分析2023/2/54:04
WaldHurwitzSavageLaplace公理4.1完全序√√√√公理4.2標號無關性√√√√公理4.3標度無關性√√√√公理4.4強優(yōu)勢原則√√√√公理4.5無關方案獨立性√√-√公理4.6同一狀態(tài)下各后果值加常數(shù)的無關性--√√公理4.7某一行動的各種后果排列次序的無關性√√-√公理4.8某種狀態(tài)下各種后果所在行復制的無關性√√√-對比分析后的結論:雖然真實自然狀態(tài)是不確定的,但這種不確定與嚴格不確定性概念所說的不確定有本質(zhì)的區(qū)別,因此現(xiàn)實中的決策問題都不可能是真正的嚴格不確定性的,于是我們要連同嚴格不確定性的概念一起拋棄公理4.7與4.8。研究問題的思路:為了判斷某些方法的優(yōu)劣,需要有一套衡量標準,這套標準以公理的形式表述,在用這些標準判斷方法的優(yōu)劣時還需要對標準的合理性加以權衡,甚至可以從根本上否定最初提出的基本概念的合理性。2023/2/54:042023/2/54:04第三節(jié)風險型決策問題的決策準則1、最大可能值準則決策者決策時都需要根據(jù)某種準則來選擇決策方案——決策準則。準則不同,決策結果就可能不同。下面介紹風險型決策中常用的幾種決策準則。最大可能值準則:(眾數(shù)原則)j123E(ai)=Σi(j)cij(j)0.20.50.3a17344.1a26.5413.6a36503.7注:后果為損失值此準則在狀態(tài)出現(xiàn)的概率差距不大時的決策效果可能很差!2023/2/54:042、貝葉斯準則:期望效用最大或期望損失最小。在實際決策中,一般先確定后果對決策人的實際價值即效用函數(shù)(若是損失則使用負效用)(稱為伯努利過程),然后再應用貝葉斯準則。j123E(ai)=Σi(j)cij(j)0.20.50.3a17344.1a26.5413.6a36503.7注:后果為損失值2023/2/54:043、E-V準則:用期望與方差(度量風險)共同判決一個方案的優(yōu)劣。帕累托優(yōu):若不存在方案al,使得方案ak的期望與風險均劣于al,稱ak為有效方案或帕累托優(yōu)。評價函數(shù):fi(E,V)=E(ai)+i2。反映了決策人的風險態(tài)度,>0風險厭惡;=0風險中立(對應于貝葉斯準則);<0風險追求。j123E(ai)i2=Σi(cij-E(ai))2
(j)(j)0.20.50.3a17344.12.29a26.5413.63.79a36503.75.9672023/2/54:04決策準則—E-V準則2023/2/54:044、優(yōu)勢原則在實際決策中,主觀概率的確定有時是很困難的,因此可利用優(yōu)勢原則進行決策。給不出準確的主觀概率;任何兩個行動(方案)之間都不存在絕對優(yōu);決策方法(以損失函數(shù)為例):列出方案ak最優(yōu)的判別不等式組E(ak)≤E(ai),i=1,…,m求解不等式組的解即得到ak方案最優(yōu)的概率分布判斷這種概率分布是否可能2023/2/54:04當(1)>0.6時,方案a1最優(yōu);當(1)<0.6時方案a3最優(yōu);方案a2被稱為強劣的(stronglydominated)。決策準則—優(yōu)勢原則j12a117a245a351注:后果為損失值2023/2/54:04第四節(jié)貝葉斯決策分析一、
貝葉斯定理條件概率:設A、B為隨機試驗E中的兩個事件,在事件A發(fā)生條件下事件B發(fā)生的概率稱為條件概率,記為(B|A),且(B|A)=(AB)/(A)。(A→B)若Aj(j=1,…,n)是樣本空間S中n個互不相容的事件,且(Aj)>0,(AkAl)=0(k≠l);∪j(Aj)=S。稱Aj是樣本空間的一個劃分。則對任一事件B,有:2023/2/54:04貝葉斯定理:已知(B|Aj)、(Aj)(先驗概率)(j=1,…,n),求當事件B發(fā)生(隨機試驗的結果或觀察值)時Ak發(fā)生的概率(后驗概率)。貝葉斯定理在決策分析中的意義:在實際決策中,我們需要準確估計的隨機變量是未來的自然狀態(tài)Θ,而通過隨機試驗所觀察到的往往是與之相關的另一個隨機變量。例如,疾病診斷往往是通過觀察癥狀如發(fā)燒、咳嗽等來判斷其疾病如感冒、甲流。貝葉斯定理可以幫助我們判斷當出現(xiàn)發(fā)燒時患甲流的概率。2023/2/54:04例:經(jīng)臨床觀察,患甲流的病人約70%發(fā)燒超過38度,患感冒的病人約40%發(fā)燒超過38度,而肺炎病人中有60%發(fā)燒超過38度。統(tǒng)計表明當前甲流發(fā)病率約15‰,感冒7‰
,肺炎1‰
。現(xiàn)有一病人發(fā)燒超過38度,請診斷該病人最可能患上哪種疾病。解:記發(fā)燒超過38度的事件為X;患甲流、感冒、肺炎分別記為A、B、C。先驗概率分別為(A)=0.015,(B)=0.007,(C)=0.001。條件概率分別為(X|A)=0.7;(X|B)=0.4;(X|C)=0.6。則(X)=0.7×0.015+0.4×0.007+0.6×0.001=0.0139(A|X)=0.7×0.015/0.0139=75.54%(B|X)=0.4×0.007/0.0139=20.14%(C|X)=0.6×0.001/0.0139=4.32%2023/2/54:04二、貝葉斯分析貝葉斯風險:當決策人通過隨機試驗得到觀察值x后,需要根據(jù)觀察值和某種決策準則選擇行動a,即a=(x)。對于自然狀態(tài)及其先驗概率(),采取策略時損失函數(shù)l(,(x))對隨機試驗結果x和自然狀態(tài)的期望值稱為貝葉斯風險,記為r()。r()=E(Ex(l(,(x))))=xl(,(x))p(x|)()貝葉斯規(guī)則(正規(guī)型):若策略空間存在某個策略*,使得對于任意其他策略,均有r(*)≤r(),則稱*為貝葉斯規(guī)則或貝葉斯策略。即r(*)=min{r()}2023/2/54:04貝葉斯規(guī)則(擴展型):在實際應用中,當行動集、狀態(tài)集、觀察值集中的元素較多時,策略集很大,獲得r()的最小值很困難,因此可對r()的計算公式進行變換:r()=xl(,(x))p(x|)()=x
l(,(x))p(x|)()若使
l(,(x))p(x|)()達到極小,r()必然達到最小又(x)>0,所以可使
l(,(x))p(x|)()/(x)達到極小后驗概率(|x)=p(x|)()/(x),因此r()的極小化問題轉(zhuǎn)變?yōu)榍?/p>
l(,(x))(|x)的極小化問題。2023/2/54:04貝葉斯決策分析—貝葉斯分析擴展型貝葉斯分析過程原始信息:先驗分布()追加樣本信息:觀察值x貝葉斯定理:后驗概率(|x)求*:計算r(),找出使后驗期望損失最小的2023/2/54:04信息的價值:隨機試驗獲得觀察值x是需要成本的,而觀察值x也可以幫助我們減少決策損失。那么隨機試驗觀察到的信息有多大價值呢?假設我們未進行任何觀察,那么根據(jù)貝葉斯準則,最小決策損失期望為:minE(li(,ai))若試驗獲得了觀察值x,則最小貝葉斯風險即為最小決策損失:minr()觀察信息的期望價值為:
minE(li(,ai))-minr()j123E(ai)(j)0.20.50.3a17344.1a26.5413.6a36503.72023/2/54:04例:(油井鉆探問題)某公司擁有一塊可能有油的土地,公司或自己開采,或以以下兩種模式出租:①無條件出租,租金45萬元;②有條件出租,產(chǎn)量在20萬桶或以上時,每桶提成5元;產(chǎn)量不足20萬桶不提成。設鉆井費用為75萬元,采油設備費25萬元(有油時),油價為15元/桶。假設油產(chǎn)量的可能狀態(tài)及其先驗概率分布如表。若決策人風險中立,決策人該選擇什么行動?產(chǎn)油量50萬桶20萬桶5萬桶無油j1234(j)0.10.150.250.52023/2/54:04解:公司可采取的行動有3種:a1-自己開采;a2-無條件出租;a3-有條件出租。決策表如下(單位:萬元):根據(jù)貝葉斯準則,方案a1效用最大,故應自己鉆井。產(chǎn)油量50萬桶20萬桶5萬桶無油期望效用j1234(j)0.10.150.250.5a1650200-25-7551.25a24545454545a325010000402023/2/54:04如果通過地質(zhì)勘探可以進一步了解該地區(qū)的產(chǎn)油情況,那么我們又如何決策?假設勘探成本是12萬元,統(tǒng)計表明,產(chǎn)油量與地質(zhì)構造(共四種類型,用xk表示)間的關系[p(xk|j)]如下表。產(chǎn)油量50萬桶20萬桶5萬桶無油j1234p(x1|j)7/129/1611/243/16p(x2|j)1/33/161/611/48p(x3|j)1/121/81/413/48p(x4|j)01/81/85/162023/2/54:04解:計算后驗概率,即已知地質(zhì)結構情況下產(chǎn)油狀態(tài)的概率,并給出決策表。產(chǎn)油量50萬桶20萬桶5萬桶無油j1234p(j|x1)0.1660.2400.
溫馨提示
- 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權益歸上傳用戶所有。
- 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預覽,若沒有圖紙預覽就沒有圖紙。
- 4. 未經(jīng)權益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
- 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負責。
- 6. 下載文件中如有侵權或不適當內(nèi)容,請與我們聯(lián)系,我們立即糾正。
- 7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。
最新文檔
- 創(chuàng)業(yè)投資信托協(xié)議書(2篇)
- 2024年草船借箭教學設計(53篇)
- 2024年福建省莆田市涵江區(qū)三江口鎮(zhèn)招聘社區(qū)工作者考前自測高頻考點模擬試題(共500題)含答案
- 2024年福建省《消防員資格證之一級防火考試》必刷500題標準卷
- 黃金卷3-【贏在中考·黃金八卷】(原卷版)
- 2024屆四川省綿陽市高三上學期第二次診斷性考試(二模)文綜試題
- 2025屆南開中學初中考生物押題試卷含解析
- 互補發(fā)電系統(tǒng)行業(yè)深度研究報告
- 2025公司質(zhì)押借款合同范本
- 2024年度天津市公共營養(yǎng)師之二級營養(yǎng)師綜合檢測試卷A卷含答案
- 調(diào)休單、加班申請單
- 肉制品生產(chǎn)企業(yè)名錄296家
- 小學-英語-湘少版-01-Unit1-What-does-she-look-like課件
- 單證管理崗工作總結與計劃
- 規(guī)劃設計收費標準
- 安全安全隱患整改通知單及回復
- 國有檢驗檢測機構員工激勵模式探索
- 采購部年終總結計劃PPT模板
- CDI-EM60系列變頻調(diào)速器使用說明書
- 【匯總】高二政治選擇性必修三(統(tǒng)編版) 重點知識點匯總
- 材料表面與界面考試必備
評論
0/150
提交評論