版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進(jìn)行舉報(bào)或認(rèn)領(lǐng)
文檔簡介
第八章對策與決策模型浙江大學(xué)城市學(xué)院第八章對策與決策模型浙江大學(xué)城市學(xué)院1第八章對策與決策模型對策與決策是人們生活和工作中經(jīng)常會遇到的擇優(yōu)活動。人們在處理一個(gè)問題時(shí),往往會面臨幾種情況,同時(shí)又存在幾種可行方案可供選擇,要求根據(jù)自己的行動目的選定一種方案,以期獲得最佳的結(jié)果。有時(shí),人們面臨的問題具有競爭性質(zhì),如商業(yè)上的競爭、體育中的比賽和軍事行動、政治派別的斗爭等等。這時(shí)競爭雙方或各方都要發(fā)揮自己的優(yōu)勢,使己方獲得最好結(jié)果。因而雙方或各方都要根據(jù)不同情況、不同對手做出自己的決擇,此時(shí)的決策稱為對策。在有些情況下,如果我們把可能出現(xiàn)的若干種情況也看作是競爭對手可采取的幾種策略,那么也可以把決策問題當(dāng)作對策問題來求解。第八章對策與決策模型對策與決策是人們生活和工作中2§8.1對策問題對策問題的特征是參與者為利益相互沖突的各方,其結(jié)局不取決于其中任意一方的努力而是各方所采取的策略的綜合結(jié)果。先考察幾個(gè)實(shí)際例子。
例8.1
(田忌賽馬)
田忌賽馬是大多數(shù)人都熟知的故事,傳說戰(zhàn)國時(shí)期齊王欲與大將田忌賽馬,雙方約定每人挑選上、中、下三個(gè)等級的馬各一匹進(jìn)行比賽,每局賭金為一千金。齊王同等級的馬均比田忌的馬略勝一籌,似乎必勝無疑。田忌的朋友孫臏給他出了一個(gè)主意,讓他用下等馬比齊王的上等馬,上等馬對齊王的中等馬,中等馬對齊王的下等馬,結(jié)果田忌二勝一敗,反而贏了一千金。
§8.1對策問題對策問題的特征是參與者為利益相互3例8.2
(石頭—剪子—布)這是一個(gè)大多數(shù)人小時(shí)候都玩過的游戲。游戲雙方只能選石頭、剪子、布中的一種,石頭贏剪子,剪子贏布,而布又贏石頭,贏者得一分,輸者失一分,雙方相同時(shí)不得分,見下表。表8.1石頭剪子布石頭01-1剪子-101布1-10例8.2(石頭—剪子—布)這是一個(gè)大多數(shù)人小時(shí)候都玩過的4例8.3
(囚犯的困惑)警察同時(shí)逮捕了兩人并分開關(guān)押,逮捕的原因是他們持有大量偽幣,警方懷疑他們偽造錢幣,但沒有找到充分證據(jù),希望他們能自己供認(rèn),這兩個(gè)人都知道:如果他們雙方都不供認(rèn),將被以使用和持有大量偽幣罪被各判刑18個(gè)月;如果雙方都供認(rèn)偽造了錢幣,將各被判刑3年;如果一方供認(rèn)另一方不供認(rèn),則供認(rèn)方將被從寬處理而免刑,但另一方面將被判刑7年。將嫌疑犯A、B被判刑的幾種可能情況列表如下:表8.2嫌疑犯B供認(rèn)不供認(rèn)嫌疑犯A供認(rèn)不供認(rèn)(3,3)(0,7)(7,0)(1.5,1.5)表中每對數(shù)字表示嫌疑犯A、B被判刑的年數(shù)。如果兩名疑犯均擔(dān)心對方供認(rèn)并希望受到最輕的懲罰,最保險(xiǎn)的辦法自然是承認(rèn)制造了偽幣。例8.3(囚犯的困惑)警察同時(shí)逮捕了兩人并分開關(guān)押,逮捕5一、對策的基本要素(1)局中人。參加決策的各方被稱為決策問題的局中人,一個(gè)決策總是可以包含兩名局中人(如棋類比賽、人與大自然作斗爭等),也可以包含多于兩名局中人(如大多數(shù)商業(yè)中的競爭、政治派別間的斗爭)。局中人必須要擁用可供其選擇并影響最終結(jié)局的策略,在例8.3中,局中人是A、B兩名疑犯,警方不是局中人。兩名疑犯最終如何判刑取決于他們各自采取的態(tài)度,警方不能為他們做出選擇。從這些簡單實(shí)例中可以看出對策現(xiàn)象中包含的幾個(gè)基本要素。一、對策的基本要素(1)局中人。參加決策的各方被稱為決策問題6(2)策略集合。局中人能采取的可行方案稱為策略,每一局中人可采取的全部策略稱為此局中人的策略集合。對策問題中,對應(yīng)于每一局中人存在著一個(gè)策略集合,而每一策略集合中至少要有兩個(gè)策略,否則該局中人可從此對策問題中刪去,因?yàn)閷λ麃碇v,不存在選擇策略的余地。應(yīng)當(dāng)注意的是,所謂策略是指在整個(gè)競爭過程中對付他方的完整方法,并非指競爭過程中某步所采取的具體局部辦法。例如下棋中的某步只能看和一個(gè)完整策略的組成部分,而不能看成一個(gè)完整的策略。當(dāng)然,有時(shí)可將它看成一個(gè)多階段對策中的子對策。策略集合可以是有限集也可以是無限集。策略集為有限集時(shí)稱為有限對策,否則稱為無限對策。
記局中人i的策略集合為Si。當(dāng)對策問題各方都從各自的策略集合中選定了一個(gè)策略后,各方采取的策略全體可用一矢量S表示,稱之為一個(gè)純局勢(簡稱局勢)。
(2)策略集合。局中人能采取的可行方案稱為策略,每一局中人可7例如,若一對策中包含A、B兩名局中人,其策略集合分別為SA
={1,…,m},SB
={1,…,n}。若A選擇策略i而B選策略j,則(i,j)就構(gòu)成此對策的一個(gè)純局勢。顯然,SA與SB一共可構(gòu)成m×n個(gè)純局勢,它們構(gòu)成表8.3。對策問題的全體純局勢構(gòu)成的集合S稱為此對策問題的局勢集合。
(m,n)
…(m,j)
…(m,2)
(m,1)
m…………………(i,n)
…(i,j)
…(i,2)
(i,1)
i…………………(2,n)
…(2,j)
…(2,2)
(2,1)
2(1,n)
…(1,j)
…(1,2)
(1,1)
1A的策略n…J…21B的策略例如,若一對策中包含A、B兩名局中人,其策略集合分別為SA8(3)贏得函數(shù)(或稱支付函數(shù))。對策的結(jié)果用矢量表示,稱之為贏得函數(shù)。贏得函數(shù)F為定義在局勢集合S上的矢值函數(shù),對于S中的每一純局勢S,F(xiàn)(S)指出了每一局中人在此對策結(jié)果下應(yīng)贏得(或支付)的值。綜上所述,一個(gè)對策模型由局中人、策略集合和贏得函數(shù)三部分組成。記局中人集合為I={1,…,k},對每一i∈I,有一策略集合Si,當(dāng)I中每一局中人i選定策略后得一個(gè)局勢s;將s代入贏得函數(shù)F,即得一矢量F(s)=(F1(s),…,Fk(s)),其中Fi(s)為在局勢s下局中人i的贏得(或支付)。本節(jié)討論只有兩名局中人的對策問題,即兩人對策,其結(jié)果可以推廣到一般的對策模型中去。對于只有兩名局中人的對策問題,其局勢集合和贏得函數(shù)均可用表格表示。例如,表8.2就給出了例8.3的局勢集合和贏得函數(shù)。(3)贏得函數(shù)(或稱支付函數(shù))。對策的結(jié)果用矢量表示,稱之為9二、零和對策存在一類特殊的對策問題。在這類對策中,當(dāng)純局勢確定后,A之所得恰為B之所失,或者A之所失恰為B之所得,即雙方所得之和總為零。在零和對策中,因F1(s)=-F2(s),只需指出其中一人的贏得值即可,故贏得函數(shù)可用贏得矩陣表示。例如若A有m種策略,B有n種策略,贏得矩陣
表示若A選取策略i而B選取策略j,則A之所得為aij(當(dāng)aij<0時(shí)為支付)。二、零和對策存在一類特殊的對策問題。在這類對策中,當(dāng)純局勢確10在有些兩人對策的贏得表中,A之所得并非明顯為B之所失,但雙方贏得數(shù)之和為一常數(shù)。例如在表8.4中,無論A、B怎樣選取策略,雙方贏得總和均為10,此時(shí),若將各人贏得數(shù)減去兩人的平均贏得數(shù),即可將贏得表化為零和贏得表。表8.4中的對策在轉(zhuǎn)化為零和對策后,具有贏得矩陣表8.4局中人B123局中人A1(8,2)(1,9)(7,3)2(4,6)(9,1)(3,7)3(2,8)(6,4)(8,2)4(6,4)(4,6)(6,4)在有些兩人對策的贏得表中,A之所得并非明顯為B之所失,但雙方11給定一個(gè)兩人對策只需給出局中人A、B的策略集合SA、SB及表示雙方贏得值的贏得矩陣R。綜上所述,當(dāng)遇到零和對策或可轉(zhuǎn)化為零和對策的問題時(shí),R可用通常意義下的矩陣表示,否則R的元素為一兩維矢量。故兩人對策G又可稱為矩陣對策并可簡記成G={SA,SB,R}給定一個(gè)兩人對策只需給出局中人A、B的策略集合SA、SB及表12例8.4
給定G={SA,SB,R},其中SA
={1,2,3},SB
={1,2,3,4}
從R中可以看出,若A希望獲得最大贏利30,需采取策略1,但此時(shí)若B采取策略4,A非但得不到30,反而會失去22。為了穩(wěn)妥,雙方都應(yīng)考慮到對方有使自己損失最大的動機(jī),在最壞的可能中爭取最好的結(jié)果。局中人A采取策略1、2、3時(shí),最壞的贏得結(jié)果分別為min{12,-6,30,-22}=-22min{14,2,18,10}=2min{-6,0,-10,16}=-10其中最好的可能為max{-22,2,-10}=2。如果A采取策略2,無論B采取什么策略,A的贏得均不會少于2.例8.4給定G={SA,SB,R},其中SA13B采取各方案的最大損失為max{12,14,-6}=14,max{-6,2,0}=2,max{30,18,-10}=30和max{-22,10,16}=16。當(dāng)B采取策略2時(shí),其損失不會超過2。注意到在贏得矩陣中,2既是所在行中的最小元素又是所在列中的最大元素。此時(shí),只要對方不改變策略,任一局中人都不可能通過變換策略來增大贏得或減小損失,稱這樣的局勢為對策的一個(gè)穩(wěn)定點(diǎn)或穩(wěn)定解,(注:也被稱為鞍點(diǎn))定義8.1
對于兩人對策G={SA,SB,R},若有,則稱G具有穩(wěn)定解,并稱VG為對策G的值。若純局勢()使得,則稱()為對策G的鞍點(diǎn)或穩(wěn)定解,贏得矩陣中與()相對應(yīng)的元素稱為贏得矩陣的鞍點(diǎn),與分別稱為局中人A與B的最優(yōu)策略。對(8.1)式中的贏得矩陣,容易發(fā)現(xiàn)不存在具有上述性質(zhì)的鞍點(diǎn)。給定一個(gè)對策G,如何判斷它是否具有鞍點(diǎn)呢?為了回答這一問題,先引入下面的極大極小原理。B采取各方案的最大損失為max{12,14,-6}=1414定理8.1
設(shè)G={SA,SB,R},記,則必有μ+ν≤0證明:,易見μ為A的最小贏得,ν為B的最小贏得,由于G是零和對策,故μ+ν≤0必成立。定理8.2
零和對策G具有穩(wěn)定解的充要條件為μ+ν=0。
證明:
(充分性)由μ和ν的定義可知,存在一行(例如p行)μ為p行中的最小元素且存在一列(例如q列),-ν為q列中的最大元素。故有apq≥μ且apq≤-ν又因μ+ν=0,所以μ=-ν,從而得出apq=μ,apq為贏得矩陣的鞍點(diǎn),(p,q)為G的穩(wěn)定解。
定理8.1設(shè)G={SA,SB,R},記15(必要性)若G具有穩(wěn)定解(p,q),則apq為贏得矩陣的鞍點(diǎn)。故有
從而可得μ+ν≥0,但根據(jù)定理8.1,μ+ν≤0必成立,故必有μ+ν=0。上述定理給出了對策問題有穩(wěn)定解(簡稱為解)的充要條件。當(dāng)對策問題有解時(shí),其解可以不唯一。例如,若
則易見,(2,2),(2,4),(4,2),(4,4)均為此對策問題的解。一般又可以證明。(必要性)若G具有穩(wěn)定解(p,q),則apq為16定理8.3對策問題的解具有下列性質(zhì):(1)無差別性。若(,)與(,)同為對策G的解,則必有。(2)可交換性。若(,j1)、(,j2)均為對策G的解,則(,j2)和(,j1)也必為G的解。
定理8.3的證明非常容易,作為習(xí)題留給讀者自己去完成。定理8.3對策問題的解具有下列性質(zhì):(1)無差別性。若(17具有穩(wěn)定解的零和對策問題是一類特別簡單的對策問題,它所對應(yīng)的贏得矩陣存在鞍點(diǎn),任一局中人都不可能通過自己單方面的努力來改進(jìn)結(jié)果。然而,在實(shí)際遇到的零和對策中更典型的是μ+ν≠0的情況。由于贏得矩陣中不存在鞍點(diǎn),至少存在一名局中人,在他單方面改變策略的情況下,有可能改善自己的收益。例如,考察(8.1)中的贏得矩陣R。若雙方都采取保守的maxmin原則,將會出現(xiàn)純局勢(
4,1)或(4,3)。但如果局中人A適當(dāng)改換策略,他可以增加收入。例如,如果B采用策略1,而A改換策略1,則A可收益3。但此時(shí)若B改換策略
2,又會使A輸?shù)?,……。此時(shí),在只使用純策略的范圍內(nèi),對策問題無解。這類決策如果只進(jìn)行一次,局中人除了碰運(yùn)氣以外別無辦法。但如果這類決策要反復(fù)進(jìn)行多次,則局中人固定采用一種策略顯然是不明智的,因?yàn)橐坏κ挚闯瞿銜捎檬裁床呗?,他將會選用對自己最為有利的策略。這時(shí),局中人均應(yīng)根據(jù)某種概率來選用各種策略,即采用混合策略的辦法,使自己的期望收益盡可能大。
具有穩(wěn)定解的零和對策問題是一類特別簡單的對策問題,它所對應(yīng)的18設(shè)A方用概率xi選用策略i,B方用概率yj選用策略j,,且雙方每次選用什么策略是隨機(jī)的,不能讓對方看出規(guī)律,記X=(x1,…,xm)T,Y=(y1,…,yn)T,則A的期望贏得為E(X,Y)=XTRY其中,R為A方的贏得矩陣。記SA:策略α1,…,αmSB:策略β1,…,βn概率x1,…,xm概率y1,…,yn分別稱SA與SB為A方和B方的混合策略。對于需要使用混合策略的對策問題,也有具有穩(wěn)定解的對策問題的類似結(jié)果。設(shè)A方用概率xi選用策略i,B方用概率yj選用策略19定義8.2若存在m維概率向量和n維概率向量,使得對一切m維概率向量X和n維概率向量y有則稱(,)為混合策略對策問題的鞍點(diǎn)。定理8.4(VonNeumann)任意混合策略對策問題必存在鞍點(diǎn),即必存在概率向量和,使得:(證明從略)。使用純策略的對策問題(具有穩(wěn)定解的對策問題)可以看成使用混合策略的對策問題的特殊情況,相當(dāng)于以概率1選取其中某一策略,以概率0選取其余策略。對于雙方均只有兩種策略的對策問題(即2×2對策),可按幾何方法求解。借助幾何方法也可以解m×2或2×n的使用混合策略的對策問題。但當(dāng)m>2且n>2時(shí),采用幾何方法求解就變得相當(dāng)麻煩,此時(shí)通常采用線性規(guī)劃方法求解。定義8.2若存在m維概率向量和n維概率向量,使得對一切m20A方選擇混合策略的目的是使得其中ej為只有第j個(gè)分量為1而其余分量均為零的向量,Ej
=XTRej。記,由于,在yk=1,yj=0(j≠k)時(shí)達(dá)到最大值u,
A方選擇混合策略的目的是使得其中ej為只有第j個(gè)分21故應(yīng)為線性規(guī)劃問題
minu
,j=1,2,…,n(即Ej≤Ek)xi≥0,i=1,2,…,mS.t的解。同理,應(yīng)為線性規(guī)劃maxν
,i=1,2,…,myj≥0,i=1,2,…,nS.t的解。故應(yīng)為線性規(guī)劃問題minu,j=1,222由線性規(guī)劃知識,(8.2)與(8.3)互為對偶線性規(guī)劃,它們具有相同的最優(yōu)目標(biāo)函數(shù)值。關(guān)于線性規(guī)劃對偶理論,有興趣的讀者可以參閱有關(guān)書籍,例如魯恩伯杰的“線性與非線性規(guī)劃引論”。
為了尋找例8.5中A方的最優(yōu)混合策略,求解線性規(guī)劃minuS.t0.82x1+x2≤u
x1+0.58x2≤u
x1+x2=1
x1,x2≥0可得最優(yōu)混合策略x1=0.7,x2=0.3。類似求解線性規(guī)劃maxυS.t0.82y1+y2≤υ
y1+0.58y2≥υ
y1+y2=1
y1,y2≥0可得B方最優(yōu)混合策略:y1=0.7,y2=0.3。由線性規(guī)劃知識,(8.2)與(8.3)互為對偶線性規(guī)劃,它們23三、非零和對策除了零和對策外,還存在著另一類對策問題,局中人獲利之和并非常數(shù)。例8.4現(xiàn)有一對策問題,雙方獲利情況見表8.5。表8.5B方A方1231234(8,2)(3,4)(1,6)(4,2)(0,9)(9,0)(6,2)(4,6)(7,3)(2,7)(8,1)(5,1)假如A、B雙方仍采取穩(wěn)妥的辦法,A發(fā)現(xiàn)如采取策略4,則至少可獲利4,而B發(fā)現(xiàn)如采取策略1,則至少可獲利2。因而,這種求穩(wěn)妥的想法將導(dǎo)至出現(xiàn)局勢(4,2)。三、非零和對策除了零和對策外,還存在著另一類對策問題,局中人24容易看出,從整體上看,結(jié)果并不是最好的,因?yàn)殡p方的總獲利有可能達(dá)到10。不難看出,依靠單方面的努力不一定能收到良好的效果??磥?,對這一對策問題,雙方最好還是握手言和,相互配合,先取得總體上的最大獲利,然后再按某一雙方均認(rèn)為較為合理的方式來分享這一已經(jīng)獲得的最大獲利。例8.4說明,總獲利數(shù)并非常數(shù)的對策問題(即不能轉(zhuǎn)化為零和對策的問題),是一類存在著合作基礎(chǔ)的對策問題。當(dāng)然,這里還存在著一個(gè)留待解決而又十分關(guān)鍵的問題:如何分享總獲利,如果不能達(dá)到一個(gè)雙方(或各方)都能接受的“公平”的分配原則,則合作仍然不能實(shí)現(xiàn)。怎樣建立一個(gè)“公平”的分配原則是一個(gè)較為困難的問題,將在第九章中介紹。
最后,我們來考察幾個(gè)對策問題的實(shí)例。容易看出,從整體上看,結(jié)果并不是最好的,因?yàn)殡p方的總獲利有可25例8.6(戰(zhàn)例分析)1944年8月,美軍第一軍和英軍占領(lǐng)法國諾曼第不久,立即從海防前線穿過海峽,向Avranches進(jìn)軍。美軍第一軍和英軍的行動直接威脅到德軍第九軍。美軍第三軍也開到了Avranches的南部,雙方軍隊(duì)所處的地理位置如圖8.2所示。美軍方面的指揮官是Bradley將軍,德軍指揮官是VonKluge將軍。VonKluge將軍面臨的問題是或者向西進(jìn)攻,加強(qiáng)他的西部防線,切斷美軍援助;或者撤退到東部,占據(jù)塞那河流域的有利地形,并能得到德軍第十五軍的援助。Bradley將軍的問題是如何調(diào)動他的后備軍,后備軍駐扎在海峽南部。Bradley將軍有三種可供選擇的策略:他可以命令后備軍原地待命,當(dāng)海峽形勢危急時(shí)支援第一軍或出擊東部敵人,以減輕第一軍的壓力。雙方應(yīng)如何決策,使自己能有較大的機(jī)會贏得戰(zhàn)爭的勝利呢?
例8.6(戰(zhàn)例分析)1944年8月,美軍第一軍和英軍占領(lǐng)法國26由于兩軍作戰(zhàn)并非可以反復(fù)進(jìn)行的對策問題,看來最大的可能是美軍采取策略3而德軍采取策略2,即美方后備軍待命而德軍第九軍東撤。事實(shí)上,當(dāng)時(shí)雙方指揮官正是這樣決策的,如果真能實(shí)行,雙方勝負(fù)還難以料定。但正當(dāng)?shù)萝姷诰跑妱傞_始東撤時(shí),突然接到了希特勒的命令要他們向西進(jìn)攻,從而失去了他們有可能取得的最佳結(jié)局,走上必然滅亡的道路。VonKluge將軍指揮的德軍向西進(jìn)攻,開始時(shí)德軍占領(lǐng)了海峽,但隨之即被美軍包圍遭到了全軍復(fù)滅,VonKluge本人在失敗后自殺。
由于兩軍作戰(zhàn)并非可以反復(fù)進(jìn)行的對策問題,看來最大的可能是美軍27§8.2決策問題人們在處理問題時(shí),常常會面臨幾種可能出現(xiàn)的自然情況,同時(shí)又存在著幾種可供選擇的行動方案。此時(shí),需要決策者根據(jù)已知信息作決策,即選擇出最佳的行動方案,這樣的問題稱為決策問題。面臨的幾種自然情況叫做自然狀態(tài)或簡稱狀態(tài)。
狀態(tài)是客觀存在的,是不可控因素??晒┻x擇的行動方案叫做策略,這是可控因素,選擇哪一方案由決策者決定。
§8.2決策問題人們在處理問題時(shí),常常會面臨幾種可能出現(xiàn)28例8.8在開采石油時(shí),會遇到是否在某處鉆井的問題。盡管勘探隊(duì)已作了大量調(diào)研分析,但由于地下結(jié)構(gòu)極為復(fù)雜,仍無法準(zhǔn)確預(yù)測開采的結(jié)果,決策者可以決定鉆井,也可以決定不鉆井。設(shè)根據(jù)經(jīng)驗(yàn)和勘探資料,決策者已掌握一定的信息并列出表8.7。表8.7000不鉆井(2)
4020-30鉆井(1)
P(3)=0.3
P(2)=0.5
P(1)=0.2
(億元)高產(chǎn)油井(3)
一般(2)
無油(1)
自然狀態(tài)概率
收益方案問:決策者應(yīng)如何作出決策?例8.8在開采石油時(shí),會遇到是否在某處鉆井的問題。盡管勘29解:由題意可以看出,決策問題應(yīng)包含三方面信息:狀態(tài)集合Q={1,…,n}、策略集合A={1,…,m}及收益R={aij},其中aij表示如果決策者選取策略i而出現(xiàn)的狀態(tài)為j,則決策者的收益值為aij(當(dāng)aij為負(fù)值時(shí)表示損失值)。決策問題按自然狀態(tài)的不同情況,常被分為三種類型:確定型、風(fēng)險(xiǎn)型(或隨機(jī)型)和不確定型。確定型決策是只存在一種可能自然狀態(tài)的決策問題。這種決策問題的結(jié)構(gòu)較為簡單,決策者只需比較各種方案,確定哪一方案最優(yōu)即可。值得一提的是策略集也可以是無限集,例如,線性規(guī)劃就可行看成一個(gè)策略集是限集的確定型決策,問題要求決策者從可行解集合(策略集)中挑選出最優(yōu)解。確定型決策的求解并非全是簡單的,但由于這些問題一般均有其自己的專門算法,本節(jié)不準(zhǔn)備再作介紹。在本節(jié)中,我們主要討論風(fēng)險(xiǎn)型與不確定型決策,并介紹它們的求解方法。解:由題意可以看出,決策問題應(yīng)包含三方面信息:狀態(tài)集合決策問30一、風(fēng)險(xiǎn)型決策問題在風(fēng)險(xiǎn)型決策問題中存在著兩種以上可能出現(xiàn)的自然狀態(tài)。決策者不知道究竟會出現(xiàn)哪一種狀態(tài),但知道各種狀態(tài)出現(xiàn)的概率有多大。例如,例8.8就是一個(gè)風(fēng)險(xiǎn)型決策問題。對于風(fēng)險(xiǎn)型決策問題,最常用的決策方法是期望值法,即根據(jù)各方案的期望收益或期望損失來評估各方案的優(yōu)劣并據(jù)此作出決策。如對例1,分別求出方案1(鉆井)和2(不鉆井)的期望收益值:E(1)=0.2×(-30)+0.5×20+0.3×40=16(萬元)E(2)=0由于E(1)>E(2),選取1作為最佳策略。一、風(fēng)險(xiǎn)型決策問題在風(fēng)險(xiǎn)型決策問題中存在著兩種以上可31對于較為復(fù)雜的決策問題,尤其是需要作多階段決策的問題,常采用較直觀的決策樹方法,但從本質(zhì)上講,決策樹方法仍然是一種期望值法。
例8.9某工程按正常速度施工時(shí),若無壞天氣影響可確保在30天內(nèi)按期完工。但根據(jù)天氣預(yù)報(bào),15天后天氣肯定變壞。有40%的可能會出現(xiàn)陰雨天氣而不影響工期,在50%的可能會遇到小風(fēng)暴而使工期推遲15天,另有10%的可能會遇到大風(fēng)暴而使工期推遲20天。對于可能出現(xiàn)的情況,考慮兩種方案:(1)提前緊急加班,在15天內(nèi)完成工程,實(shí)施此方案需增加開支18000元。
(2)先按正常速度施工,15天后根據(jù)實(shí)際出現(xiàn)的天氣狀況再作決策。如遇到陰雨天氣,則維持正常速度,不必支付額外費(fèi)用。如遇到小風(fēng)暴,有兩個(gè)備選方案:(i)維持正常速度施工,支付工程延期損失費(fèi)20000元。(ii)采取應(yīng)急措施。實(shí)施此應(yīng)急措施有三種可能結(jié)果:有50%可能減少誤工期1天,支付應(yīng)急費(fèi)用和延期損失費(fèi)共24000元;有30%可能減少誤工期2天,支付應(yīng)急費(fèi)用和延期損失費(fèi)共18000元;有20%可能減少誤工期3天,支付應(yīng)急費(fèi)用和延期損失費(fèi)共12000元。對于較為復(fù)雜的決策問題,尤其是需要作多階段決策的問題,常采用32如遇大風(fēng)暴,也有兩個(gè)方案可供選擇:(i)維持正常速度施工,支付工程延期損失費(fèi)50000元。(ii)采取應(yīng)急措施。實(shí)施此應(yīng)急措施也有三種可能結(jié)果:有70%可能減少誤工期2天,支付應(yīng)急費(fèi)及誤工費(fèi)共54000元;有20%可能減少誤工期3天,支付應(yīng)急費(fèi)及誤工費(fèi)共46000元;有10%可能減少誤工期4天,支付應(yīng)急費(fèi)和誤工費(fèi)共38000元。根據(jù)上述情況,試作出最佳決策使支付的額外費(fèi)用最少。解:由于未來的天氣狀態(tài)未知,但各種天氣狀況出現(xiàn)的概率已知,本例是一個(gè)風(fēng)險(xiǎn)型決策問題,所謂的額外費(fèi)用應(yīng)理解為期望值。
本例要求作多次決策,工程初期應(yīng)決定是按正常速度施工還是提前緊急加班。如按正常速度施工,則15天后還需根據(jù)天氣狀況再作一次決策,以決定是否采取應(yīng)急措施,故本例為多階段(兩階段)決策問題。為便于分析和決策,采用決策樹方法。根據(jù)題意,作決策樹如圖8.6如遇大風(fēng)暴,也有兩個(gè)方案可供選擇:(i)維持正常速度施工,支33圖8.6中,□表示決策點(diǎn),從它分出的分枝稱為方案分枝,分枝的數(shù)目就是方案的個(gè)數(shù)?!鸨硎緳C(jī)會節(jié)點(diǎn),從它分出的分枝稱為概率分枝,一條概率分枝對應(yīng)一條自然狀態(tài)并標(biāo)有相應(yīng)的發(fā)生概率?!鞣Q為未梢節(jié)點(diǎn),右邊的數(shù)字表示相應(yīng)的收益值或損失值。圖8.6中,□表示決策點(diǎn),從它分出的分枝稱為方案分枝,分枝的34在決策樹上由右向左計(jì)算各機(jī)會節(jié)點(diǎn)處的期望值,并將結(jié)果標(biāo)在節(jié)點(diǎn)旁。遇到?jīng)Q策點(diǎn)則比較各方案分枝的效益期望值以決定方案的優(yōu)劣,并且用雙線劃去淘汰掉的方案分枝,在決策點(diǎn)旁標(biāo)上最佳方案的效益期望值,計(jì)算步驟如下:(1)在機(jī)會節(jié)點(diǎn)E、F處計(jì)算它們的效益期望值E(E)=0.5×(-24000)+0.3×(-18000)+0.2×(-12000)=-19800E(F)=0.7×(-54000)+0.2×(-46000)+0.1×(-38000)=-50800(2)在第一級決策點(diǎn)C、D處進(jìn)行比較,在C點(diǎn)處劃去正常速度分枝,在D處劃去應(yīng)急分枝。
(3)計(jì)算第二級機(jī)會節(jié)點(diǎn)B處的效益期望值E(B)=0.4×0+0.5×(-19800)+0.1×(-50000)=-14900并將-14900標(biāo)在B點(diǎn)旁。在決策樹上由右向左計(jì)算各機(jī)會節(jié)點(diǎn)處的期望值,并將結(jié)果標(biāo)在節(jié)點(diǎn)35(4)在第二級決策點(diǎn)A處進(jìn)行方案比較,劃去提前緊急加班,將-14900標(biāo)在A點(diǎn)旁。
結(jié)論最佳決策為前15天按正常速度施工,15天后按實(shí)際出現(xiàn)的天氣狀況再作決定。如出現(xiàn)陰雨天氣,仍維持正常速度施工;如出現(xiàn)小風(fēng)暴,則采取應(yīng)急措施;如出現(xiàn)大風(fēng)暴,也按正常速度施工,整個(gè)方案總損失的期望值為-14900元。
根據(jù)期望值大小決策是隨機(jī)型決策問題最常用的辦法之一。實(shí)際應(yīng)用時(shí)應(yīng)根據(jù)具體情況作出分析,選取期望收益最大或期望損失最小的方案。(4)在第二級決策點(diǎn)A處進(jìn)行方案比較,劃去提前緊急加班,將-36二、不確定型決策問題只知道有幾種可能自然狀態(tài)發(fā)生,但各種自然狀態(tài)發(fā)生的概率未知的決策問題稱為不確定型決策問題,由于概率未知,期望值方法不能用于這類決策問題。下面結(jié)合一個(gè)例子,介紹幾種處理這類問題的方法。例8.10設(shè)存在五種可能的自然狀態(tài),其發(fā)生的概率未知。有四種可供選擇的行動方案,相應(yīng)的收益值見表8.7表8.866653415964387543266544154321自然狀態(tài)方案二、不確定型決策問題只知道有幾種可能自然狀態(tài)發(fā)生,但各種自然37(1)樂觀法(maxmax原則)
采用樂觀法時(shí),決策者意在追求最大可能收益。他先計(jì)算每一方案的最大收益值,再比較找出其中的最大者,并采取這一使最大收益最大的方案,在例8.10中,maxa1j=6,maxa2j=8,maxa3j=9,maxa4j=6,而max{6,8,9,6}=9,采取方案3。(2)悲觀法(maxmin原則)采用悲觀法時(shí),決策者意在安全保險(xiǎn)。他先求每一方案的最小收益,再比較找出其中的最大者,并采取這一使最小收益值最大化的方案。對于例8.10,mina1j=4,mina2j=3,mina3j=1,mina4j=3。因?yàn)閙ax{4,3,1,3}=4,采取方案1。(3)樂觀系數(shù)法(Hurwicz決策準(zhǔn)則)樂觀系數(shù)法采用折中的辦法,引入一個(gè)參數(shù)t,0≤t≤1,稱t為樂觀系數(shù)。作決策時(shí),決策者先適當(dāng)選取一個(gè)t的值;再對各方案1求出;最后再作比較,找出使最大的方案。在例8.10中,若取t=0.5,采用樂觀系數(shù)法決策,將選取方案2。易見,t=1對應(yīng)樂觀法,而t=0則對應(yīng)于悲觀法。(1)樂觀法(maxmax原則)采用樂觀法時(shí),38(4)等可能法(Laplace準(zhǔn)則)由于不能估計(jì)各狀態(tài)出現(xiàn)的概率,決策者認(rèn)為它們相差不會過大。此時(shí),決策者采用將各狀態(tài)的概率取成相同值的辦法把問題轉(zhuǎn)化為風(fēng)險(xiǎn)型,并借用風(fēng)險(xiǎn)型問題的期望值法來決策。對于例8.10,如取各狀態(tài)出現(xiàn)的概率均為0.2,用期望值法決策,將選取策略2。不難看出,對于不確定型決策問題,不論采用什么方法決策,最終采用的策略都不能稱為最佳策略。事實(shí)上,采取什么方法決策與決策者的心理狀態(tài)有關(guān)。而且,即使對同一決策者,在處理不同決策問題時(shí)也可能采取不同的方法。例如,在決定購買幾元錢一張的對獎券時(shí),決策者也許會采用樂觀法。因?yàn)閹自X的損失對他來講是無所謂的事,小額獎金他也許看不上眼,要中就來個(gè)大獎。但是,在決策購買何種股票時(shí),因?yàn)殛P(guān)系重大,也許他為了保險(xiǎn)又會采取悲觀法。同而,不確定型問題的決策充其量只能算是在決策者某種心理狀態(tài)下的選優(yōu)。要作出較符合實(shí)際情況的決策,還需決策者多作些調(diào)查研究,以便對未來自然狀態(tài)的出現(xiàn)作出較符合客觀實(shí)際的預(yù)測,才能收到較好的效果。(4)等可能法(Laplace準(zhǔn)則)由于不能估計(jì)各狀態(tài)出現(xiàn)39§8.3層次分析法建模層次分析法是對一些較為復(fù)雜、較為模糊的問題作出決策的簡易方法,它特別適用于那些難于完全定量分析的問題。社會的發(fā)展導(dǎo)致了社會結(jié)構(gòu)、經(jīng)濟(jì)體系及人們之間相互關(guān)系的日益復(fù)雜,人們希望能在錯(cuò)綜復(fù)雜的情況下,利用各種信息,通過理智的、科學(xué)的分析,作出最佳決策。例如,生產(chǎn)者面對消費(fèi)者的各種喜好或競爭對手的策略要作出最佳決策;消費(fèi)者面對琳瑯滿目的商品要根據(jù)它們的性能質(zhì)量的好壞、價(jià)格的高低、外形的美觀程度等選擇自己最為滿意的商品;畢業(yè)生要根據(jù)自己的專業(yè)特長、社會的需求情況、福利待遇的好壞等挑選最為合意的工作;科研單位要根據(jù)項(xiàng)目的科學(xué)意義和實(shí)用價(jià)值的大小、項(xiàng)目的可行性、項(xiàng)目的資助情況及周期長短等選擇最合適的研究課題……。當(dāng)我們面對這類決策問題時(shí),容易發(fā)現(xiàn),影響我們作決策的因素很多,其中某些因素存在定量指標(biāo),可以給以度量,但也有些因素不存在定量指標(biāo),只能定性地比較它們的強(qiáng)弱。在處理這類比較復(fù)雜而又比較模糊的問題時(shí),如何盡可能克服因主觀臆斷而造成的片面性,較系統(tǒng)、全面地比較分析并作出較為明智的決策呢?§8.3層次分析法建模層次分析法是對一40Saaty.T.L等人在70年代提出了一種以定性與定量相結(jié)合,系統(tǒng)化、層次化分析問題的方法,稱為層次分析法(AnalyticHiearchyProcess,簡稱AHP)。層次分析法將人們的思維過程層次化,逐層比較其間的相關(guān)因素并逐層檢驗(yàn)比較結(jié)果是否合理,從而為分析決策提供了較具說服力的定量依據(jù),層次分析法的提出不僅為處理這類問題提供了一種實(shí)用的決策方法,而且也提供了一個(gè)在處理機(jī)理比較模糊的問題時(shí),如何通過科學(xué)分析,在系統(tǒng)全面分析機(jī)理及因果關(guān)系的基礎(chǔ)上建立數(shù)學(xué)模型的范例。
一、層次分析的基本步驟層次分析過程可分為四個(gè)基本步驟:(1)建立層次結(jié)構(gòu)模型;(2)構(gòu)造出各層次中的所有判斷矩陣;(3)層次單排序及一致性檢驗(yàn);(4)層次總排序及一致性檢驗(yàn)。下面通過一個(gè)簡單的實(shí)例來說明各步驟中所做的工作。Saaty.T.L等人在70年代提出了一種以定性與定量相結(jié)合41例8.13某工廠有一筆企業(yè)留成利潤要由廠領(lǐng)導(dǎo)決定如何使用??晒┻x擇的方案有:給職工發(fā)獎金、擴(kuò)建企業(yè)的福利設(shè)施(改善企業(yè)環(huán)境、改善食堂等)和引進(jìn)新技術(shù)新設(shè)備。工廠領(lǐng)導(dǎo)希望知道按怎樣的比例來使用這筆資金較為合理。步1建立層次結(jié)構(gòu)模型在用層次分析法研究問題時(shí),首先要根據(jù)問題的因果關(guān)系并將這些關(guān)系分解成若干個(gè)層次。較簡單的問題通??煞纸鉃槟繕?biāo)層(最高層)、準(zhǔn)則層(中間層)和方案措施層(最低層)。與其他決策問題一樣,研究分析者不一定是決策者,不應(yīng)自作主張地作出決策。對于本例,如果分析者自行決定分配比例,廠領(lǐng)導(dǎo)必定會詢問為什么要按此比例分配,符合決策者要求的決策來自于對決策者意圖的真實(shí)了解。經(jīng)過雙方溝通,分析者了解到如下信息:決策者的目的是合理利用企業(yè)的留成利潤,而利潤的利用是否合理,決策者的主要標(biāo)準(zhǔn)為:(1)是否有利于調(diào)動企業(yè)職工的積極性,(2)是否有利于提高企業(yè)的生產(chǎn)能力,(3)是否有利于改善職工的工作、生活環(huán)境。分析者可以提出自己的看法,但標(biāo)準(zhǔn)的最終確定將由決策者決定。例8.13某工廠有一筆企業(yè)留成利潤要由廠領(lǐng)導(dǎo)決定如何使用42根據(jù)決策者的意圖,可以建立起本問題的層次結(jié)構(gòu)模型如圖8.7所示。合理利用企業(yè)利潤調(diào)動職工積極性C1提高企業(yè)技術(shù)水平C2改善職工工作生活條件C3發(fā)獎金P1擴(kuò)建福利事業(yè)P2引進(jìn)新設(shè)備P3目標(biāo)層O準(zhǔn)則層C措施層P圖中的連線反映了因素間存在的關(guān)聯(lián)關(guān)系,哪些因素存在關(guān)聯(lián)關(guān)系也應(yīng)由決策者決定。根據(jù)決策者的意圖,可以建立起本問題的層次結(jié)構(gòu)模型如圖8.7所43對于因果關(guān)系較為復(fù)雜的問題也可以引進(jìn)更多的層次。例如,在選購電冰箱時(shí),如以質(zhì)量、外觀、價(jià)格、品牌及信譽(yù)等為準(zhǔn)則,也許在衡量質(zhì)量優(yōu)劣時(shí)又可分出若干個(gè)不同的子準(zhǔn)則,如制冷性能、結(jié)霜情況、耗電量大小等等。建立層次結(jié)構(gòu)模型是進(jìn)行層次分析的基礎(chǔ),它將思維過程結(jié)構(gòu)化、層次化,為進(jìn)一步分析研究創(chuàng)造了條件。步2構(gòu)造判斷矩陣層次結(jié)構(gòu)反映了因素之間的關(guān)系,例如圖10.7中目標(biāo)層利潤利用是否合理可由準(zhǔn)則層中的各準(zhǔn)則反映出來。但準(zhǔn)則層中的各準(zhǔn)則在目標(biāo)衡量中所占的比重并不一定相同,在決策者的心目中,它們各占有一定的比例。對于因果關(guān)系較為復(fù)雜的問題也可以引進(jìn)更多的層次。例如,在選購44在確定影響某因素的諸因子在該因素中所占的比重時(shí),遇到的主要困難是這些比重常常不易定量化。雖然你必須讓決策者根據(jù)經(jīng)驗(yàn)提供這些數(shù)據(jù),但假如你提出“調(diào)動職工積極性在判斷利潤利用是否合理中占百分之幾的比例”之類的問題,不僅會讓人感到難以精確回答,而且還會使人感到你書生氣十足,不能勝任這一工作。此外,當(dāng)影響某因素的因子較多時(shí),直接考慮各因子對該因素有多大程度的影響時(shí),常常會因考慮不周全、顧此失彼而使決策者提出與他實(shí)際認(rèn)為的重要性程度不相一致的數(shù)據(jù),甚至有可能提出一組隱含矛盾的數(shù)據(jù)。為看清這一點(diǎn),可作如下設(shè)想:將一塊重為1千克的石塊砸成n小塊,你可以精確稱出它們的質(zhì)量,設(shè)為w1,…,wn?,F(xiàn)在,請人估計(jì)這n小塊的重量占總重量的比例(不能讓他知道各小石塊的重量),此人不僅很難給出精確的比值,而且完全可能因顧此失彼而提供彼此矛盾的數(shù)據(jù)。
在確定影響某因素的諸因子在該因素中所占的比重時(shí)45設(shè)現(xiàn)在要比較n個(gè)因子X={x1,…,xn}對某因素Z的影響大小,怎樣比較才能提供可信的數(shù)據(jù)呢?Saaty等人建議可以采取對因子進(jìn)行兩兩比較建立成對比較矩陣的辦法。即每次取兩個(gè)因子xi和xj,以aij表示xi和xj對Z的影響大小之比,全部比較結(jié)果用矩陣A=(aij)n×n表示,稱A為Z-X之間的成對比較判斷矩陣(簡稱判斷矩陣)。容易看出,若xi和xj對Z的影響之比為aij,則xj和xi對Z的影響之比應(yīng)為。定義8.4若矩陣A=(aij)n×n滿足(i)aij>0,(ii)(i,j=1,2,…,n),則稱之為正互反矩陣(易見aii=1,i=1,…,n)。關(guān)于如何確定aij的值,Saaty等建議引用數(shù)字1~9及其倒數(shù)作為標(biāo)度。他們認(rèn)為,人們在成對比較差別時(shí),用5種判斷級較為合適。即使用相等、較強(qiáng)、強(qiáng)、很強(qiáng)、絕對地強(qiáng)表示差別程度,aij相應(yīng)地取1,3,5,7和9。在成對事物的差別介于兩者之間難以定奪時(shí),aij可分別取值2、4、6、8。設(shè)現(xiàn)在要比較n個(gè)因子X={x1,…,xn}對某因素Z的影46從心理學(xué)觀點(diǎn)來看,分級太多會超越人們的判斷能力,既增加了作判斷的難度,又容易因此而提供虛假數(shù)據(jù)。Saaty等人還用實(shí)驗(yàn)方法比較了在各種不同標(biāo)度下人們判斷結(jié)果的正確性,實(shí)驗(yàn)結(jié)果也表明,采用1~9標(biāo)度最為合適。如果在構(gòu)造成對比較判斷矩陣時(shí),確實(shí)感到僅用1~9及其倒數(shù)還不夠理想時(shí),可以根據(jù)情況再采用因子分解聚類的方法,先比較類,再比較每一類中的元素。步3層次單排序及一致性檢驗(yàn)上述構(gòu)造成對比較判斷矩陣的辦法雖能減少其他因素的干擾影響,較客觀地反映出一對因子影響力的差別。但綜合全部比較結(jié)果時(shí),其中難免包含一定程度的非一致性。如果比較結(jié)果是前后完全一致的,則矩陣A的元素還應(yīng)當(dāng)滿足:
i、j、k=1,2,…,n
從心理學(xué)觀點(diǎn)來看,分級太多會超越人們的判斷能力,既增加了作判47定義8.5滿足(8.5)關(guān)系式的正互反矩陣稱為一致矩陣。如前所述,如果判斷者前后完全一致,則構(gòu)造出的成對比較判斷矩陣應(yīng)當(dāng)是一個(gè)一致矩陣。但構(gòu)造成對比較判斷矩陣A共計(jì)要作次比較(設(shè)有n個(gè)因素要兩兩比較),保證A是正互反矩陣是較容易辦到的,但要求所有比較結(jié)果嚴(yán)格滿足一致性,在n較大時(shí)幾乎可以說是無法辦到的,其中多少帶有一定程度的非一致性。更何況比較時(shí)采用了1~9標(biāo)度,已經(jīng)接受了一定程度的誤差,就不應(yīng)再要求最終判斷矩陣的嚴(yán)格一致性。如何檢驗(yàn)構(gòu)造出來的(正互反)判斷矩陣A是否嚴(yán)重地非一致,以便確定是否接受A,并用它作為進(jìn)一步分析研究的工具?Saaty等人在研究正互反矩陣和一致矩陣性質(zhì)的基礎(chǔ)上,找到了解決這一困難的辦法,給出了確定矩陣A中的非一致性是否可以允忍的檢驗(yàn)方法。定義8.5滿足(8.5)關(guān)系式的正互反矩陣稱為一致矩陣。48定理8.7正互反矩陣A的最大特征根λmax必為正實(shí)數(shù),其對應(yīng)特征向量的所有分量均為正實(shí)數(shù)。A的其余特征根的模均嚴(yán)格小于λmax。(證明從略)現(xiàn)在來考察一致矩陣A的性質(zhì),回復(fù)到將單位重量的大石塊剖分成重量為
1,…,n的n塊小石塊的例子,如果判斷者的判斷結(jié)果完全一致,則構(gòu)造出來的一致矩陣為容易看出,一致矩陣A具有以下性質(zhì):定理8.7正互反矩陣A的最大特征根λmax必為正實(shí)數(shù),其49根據(jù)定理8.9,我們可以由λmax是否等于n來檢驗(yàn)判斷矩陣A是否為一致矩陣。由于特征根連續(xù)地依賴于aij,故λmax比n大得越多,A的非一致性程度也就越為嚴(yán)重,λmax對應(yīng)的標(biāo)準(zhǔn)化特征向量也就越不能真實(shí)地反映出X={x1,…,xn}在對因素Z的影響中所占的比重。因此,對決策者提供的判斷矩陣有必要作一次一致性檢驗(yàn),以決定是否能接受它。
為確定多大程度的非一致性是可以允忍的,Saaty等人采用了如下辦法:(1)求出,稱CI為A的一致性指標(biāo)。容易看出,當(dāng)且僅當(dāng)A為一致矩陣時(shí),CI=0。CI的值越大,A的非一致性越嚴(yán)重。利用線性代數(shù)知識可以證明,A的n個(gè)特征根之和等于其對角線元素之和(即n)故CI事實(shí)上是A的除λmax以外其余n-1個(gè)特征根的平均值的絕對值。若A是一致矩陣,其余n-1個(gè)特征根均為零,故CI=0;否則,CI>0,其值隨A非一致性程度的加重而連續(xù)地增大。當(dāng)CI略大于零時(shí)(對應(yīng)地,λmax稍大于n),A具有較為滿意的一致性;否則,A的一致性就較差。根據(jù)定理8.9,我們可以由λmax是否等于n50(2)上面定義的CI值雖然能反映出非一致性的嚴(yán)重程度,但仍未能指明該非一致性是否應(yīng)當(dāng)被認(rèn)為是可以允許的。事實(shí)上,我們還需要一個(gè)度量標(biāo)準(zhǔn)。為此,Saaty等人又研究了他們認(rèn)為最不一致的矩陣——用從1~9及其倒數(shù)中隨機(jī)抽取的數(shù)字構(gòu)造的正互反矩陣,取充分大的子樣,求得最大特征根的平均值,并定義稱RI為平均隨機(jī)一致性指標(biāo)。對n=1,…,11,,Saaty給出了RI的值,如表8.10所示。表8.10N1234567891011RI000.580.901.121.241.321.411.451.491.51(2)上面定義的CI值雖然能反映出非一致性的嚴(yán)重程度,但仍未51(3)將CI與RI作比較,定義稱CR隨機(jī)一致性比率。經(jīng)大量實(shí)例比較,Saaty認(rèn)為,在CR<0.10時(shí)可以認(rèn)為判斷矩陣具有較為滿意的一致性,否則就應(yīng)當(dāng)重新調(diào)整判斷矩陣,直至具有滿意的一致性為止。綜上所述,在步3中應(yīng)先求出A的最大特征根λmax及λmax對應(yīng)的特征向量W=(w1,…,wn)T,進(jìn)行標(biāo)準(zhǔn)化,使得。再對A作一致性檢驗(yàn):計(jì)算,查表得到對應(yīng)于n的RI值,求,若CR<0.1,則一致性較為滿意,以i作為因子xi在上層因子Z中所具有的權(quán)值。否則必需重新作比較,修正A中的元素。只有在一致性較為滿意時(shí),W的分量才可用作層次單排序的權(quán)重。(3)將CI與RI作比較,定義稱CR隨機(jī)一致性比率。經(jīng)大量實(shí)52現(xiàn)對本節(jié)例8.13(即合理利用利潤問題的例子)進(jìn)行層次單排序。為求出C1、C2、C3在目標(biāo)層A中所占的權(quán)值,構(gòu)造O-C層的成對比較矩陣,設(shè)構(gòu)造出的成對比較判斷知陣A=311153C1C2C3C1C2C30于是經(jīng)計(jì)算,A的最大特征根λmax=3.038,CI=0.019,查表得RI=0.58,故CR=0.033。因CR<0.1,接受矩陣A,求出A對應(yīng)于λmax的標(biāo)準(zhǔn)化特征向量W=(0.105,0.637,0.258)T,以W的分量作為C1、C2、C3在目標(biāo)O中所占的權(quán)重。現(xiàn)對本節(jié)例8.13(即合理利用利潤問題的例子)進(jìn)行層次單排序53類似求措施層中的P1、P2在C1中的權(quán)值,P2、P3在C2中的權(quán)值及P1、P2在C1中的權(quán)值:
1P231P1P2P1C113λmax=2,CI=CR=0W=(0.75,0.25)T15P31P2P3P2C215λmax=2,CI=CR=0W=(0.167,0.833)T1P221P1P2P1C312λmax=2,CI=CR=0W=(0.66,0.333)T類似求措施層中的P1、P2在C1中的權(quán)值,P2、P3在C254經(jīng)層次單排序,得到圖8.8。合理利用企業(yè)利潤調(diào)動職工積極性C1提高企業(yè)技術(shù)水平C2改善職工工作生活條件C3發(fā)獎金P1擴(kuò)建福利事業(yè)P2引進(jìn)新設(shè)備P3目標(biāo)層O準(zhǔn)則層C措施層P0.1050.6370.2580.750.250.1670.8330.6670.3332經(jīng)層次單排序,得到圖8.8。合理利用企業(yè)利潤調(diào)動職工積極性提55設(shè)上一層次(A層)包含A1,…,Am共m個(gè)因素,它們的層次總排序權(quán)值分別為a1,…,am。又設(shè)其后的下一層次(B層)包含n個(gè)因素B1,…,Bn,它們關(guān)于Aj的層次單排序權(quán)值分別為b1j,…,bnj(當(dāng)Bi與Aj無關(guān)聯(lián)系時(shí),bij=0)。現(xiàn)求B層中各因素關(guān)于總目標(biāo)的權(quán)值,即求B層各因素的層次總排序權(quán)值b1,…,bn,計(jì)算按表8.11所示方式進(jìn)行,即,i=1,…,n。表8.11bnm…bn2bn1Bn………………B2m…b22b21B2B1m…b12b11B1B層總排序權(quán)值A(chǔ)mAm……A2a2A1a1層A層B步4
層次總排序及一致性檢驗(yàn)最后,在步驟(4)中將由最高層到最低層,逐層計(jì)算各層次中的諸因素關(guān)于總目標(biāo)(最高層)的相對重要性權(quán)值。設(shè)上一層次(A層)包含A1,…,Am共m個(gè)因素,它們的層次總56例如,對于前面考察的工廠合理利用留成利潤的例子,措施層層次單排序權(quán)值的計(jì)算如表8.12所示。層C層PC1C2C3層P的總排序權(quán)值0.1050.6370.258P10.7500.6670.251P20.250.1670.3330.218P300.83300.531對層次總排序也需作一致性檢驗(yàn),檢驗(yàn)仍象層次總排序那樣由高層到低層逐層進(jìn)行。這是因?yàn)殡m然各層次均已經(jīng)過層次單排序的一致性檢驗(yàn),各成對比較判斷矩陣都已具有較為滿意的一致性。但當(dāng)綜合考察時(shí),各層次的非一致性仍有可能積累起來,引起最終分析結(jié)果較嚴(yán)重的非一致性。例如,對于前面考察的工廠合理利用留成利潤的例子,措施層層次單57設(shè)B層中與Aj相關(guān)的因素的成對比較判斷矩陣在單排序中經(jīng)一致性檢驗(yàn),求得單排序一致性指標(biāo)為CI(j),(j=1,…,m),相應(yīng)的平均隨機(jī)一致性指標(biāo)為RI(j)(CI(j)、RI(j)已在層次單排序時(shí)求得),則B層總排序隨機(jī)一致性比率為CR=
當(dāng)CR<0.10時(shí),認(rèn)為層次總排序結(jié)果具有較滿意的一致性并接受該分析結(jié)果。對于表8.11中的P層總排序,由于C—P層間的三個(gè)判斷矩陣的一致性指標(biāo)(即CI(j),j=1,2,3)均為0,故P層總排序的隨機(jī)一致性比率CR=0,接受層次分析結(jié)果,將留成利潤的25.1%用于發(fā)獎金,21.8%用于擴(kuò)建福利事業(yè),余下的53.1%用于引進(jìn)新技術(shù)新設(shè)備。設(shè)B層中與Aj相關(guān)的因素的成對比較判斷矩陣在單排序中經(jīng)一致性58三、層次分析法應(yīng)用舉例在應(yīng)用層次分析法研究問題時(shí),遇到的主要困難有兩個(gè):(1)如何根據(jù)實(shí)際情況抽象出較為貼切的層次結(jié)構(gòu);(2)如何將某些定性的量作比較接近實(shí)際的定量化處理。層次分析法對人們的思維過程進(jìn)行了加工整理,提出了一套系統(tǒng)分析問題的方法,為科學(xué)管理和決策提供了較有說服力的依據(jù)。但層次分析法也有其局限性,主要表現(xiàn)在:(1)它在很大程度上依賴于人們的經(jīng)驗(yàn),主觀因素的影響很大,它至多只能排除思維過程中的嚴(yán)重非一致性(即矛盾性),卻無法排除決策者個(gè)人可能存在的嚴(yán)重片面性。(2)比較、判斷過程較為粗糙,不能用于精度要求較高的決策問題。AHP至多只能算是一種半定量(或定性與定量結(jié)合)的方法,如何用更科學(xué)、更精確的方法來研究問題并作出決策,還有待于進(jìn)一步的探討研究。在應(yīng)用層次分析法時(shí),建立層次結(jié)構(gòu)模型是十分關(guān)鍵的一步?,F(xiàn)再分析若干實(shí)例,以便說明如何從實(shí)際問題中抽象出相應(yīng)的層次結(jié)構(gòu)。三、層次分析法應(yīng)用舉例在應(yīng)用層次分析法研究問題時(shí),遇到的主要59第八章對策與決策模型浙江大學(xué)城市學(xué)院第八章對策與決策模型浙江大學(xué)城市學(xué)院60第八章對策與決策模型對策與決策是人們生活和工作中經(jīng)常會遇到的擇優(yōu)活動。人們在處理一個(gè)問題時(shí),往往會面臨幾種情況,同時(shí)又存在幾種可行方案可供選擇,要求根據(jù)自己的行動目的選定一種方案,以期獲得最佳的結(jié)果。有時(shí),人們面臨的問題具有競爭性質(zhì),如商業(yè)上的競爭、體育中的比賽和軍事行動、政治派別的斗爭等等。這時(shí)競爭雙方或各方都要發(fā)揮自己的優(yōu)勢,使己方獲得最好結(jié)果。因而雙方或各方都要根據(jù)不同情況、不同對手做出自己的決擇,此時(shí)的決策稱為對策。在有些情況下,如果我們把可能出現(xiàn)的若干種情況也看作是競爭對手可采取的幾種策略,那么也可以把決策問題當(dāng)作對策問題來求解。第八章對策與決策模型對策與決策是人們生活和工作中61§8.1對策問題對策問題的特征是參與者為利益相互沖突的各方,其結(jié)局不取決于其中任意一方的努力而是各方所采取的策略的綜合結(jié)果。先考察幾個(gè)實(shí)際例子。
例8.1
(田忌賽馬)
田忌賽馬是大多數(shù)人都熟知的故事,傳說戰(zhàn)國時(shí)期齊王欲與大將田忌賽馬,雙方約定每人挑選上、中、下三個(gè)等級的馬各一匹進(jìn)行比賽,每局賭金為一千金。齊王同等級的馬均比田忌的馬略勝一籌,似乎必勝無疑。田忌的朋友孫臏給他出了一個(gè)主意,讓他用下等馬比齊王的上等馬,上等馬對齊王的中等馬,中等馬對齊王的下等馬,結(jié)果田忌二勝一敗,反而贏了一千金。
§8.1對策問題對策問題的特征是參與者為利益相互62例8.2
(石頭—剪子—布)這是一個(gè)大多數(shù)人小時(shí)候都玩過的游戲。游戲雙方只能選石頭、剪子、布中的一種,石頭贏剪子,剪子贏布,而布又贏石頭,贏者得一分,輸者失一分,雙方相同時(shí)不得分,見下表。表8.1石頭剪子布石頭01-1剪子-101布1-10例8.2(石頭—剪子—布)這是一個(gè)大多數(shù)人小時(shí)候都玩過的63例8.3
(囚犯的困惑)警察同時(shí)逮捕了兩人并分開關(guān)押,逮捕的原因是他們持有大量偽幣,警方懷疑他們偽造錢幣,但沒有找到充分證據(jù),希望他們能自己供認(rèn),這兩個(gè)人都知道:如果他們雙方都不供認(rèn),將被以使用和持有大量偽幣罪被各判刑18個(gè)月;如果雙方都供認(rèn)偽造了錢幣,將各被判刑3年;如果一方供認(rèn)另一方不供認(rèn),則供認(rèn)方將被從寬處理而免刑,但另一方面將被判刑7年。將嫌疑犯A、B被判刑的幾種可能情況列表如下:表8.2嫌疑犯B供認(rèn)不供認(rèn)嫌疑犯A供認(rèn)不供認(rèn)(3,3)(0,7)(7,0)(1.5,1.5)表中每對數(shù)字表示嫌疑犯A、B被判刑的年數(shù)。如果兩名疑犯均擔(dān)心對方供認(rèn)并希望受到最輕的懲罰,最保險(xiǎn)的辦法自然是承認(rèn)制造了偽幣。例8.3(囚犯的困惑)警察同時(shí)逮捕了兩人并分開關(guān)押,逮捕64一、對策的基本要素(1)局中人。參加決策的各方被稱為決策問題的局中人,一個(gè)決策總是可以包含兩名局中人(如棋類比賽、人與大自然作斗爭等),也可以包含多于兩名局中人(如大多數(shù)商業(yè)中的競爭、政治派別間的斗爭)。局中人必須要擁用可供其選擇并影響最終結(jié)局的策略,在例8.3中,局中人是A、B兩名疑犯,警方不是局中人。兩名疑犯最終如何判刑取決于他們各自采取的態(tài)度,警方不能為他們做出選擇。從這些簡單實(shí)例中可以看出對策現(xiàn)象中包含的幾個(gè)基本要素。一、對策的基本要素(1)局中人。參加決策的各方被稱為決策問題65(2)策略集合。局中人能采取的可行方案稱為策略,每一局中人可采取的全部策略稱為此局中人的策略集合。對策問題中,對應(yīng)于每一局中人存在著一個(gè)策略集合,而每一策略集合中至少要有兩個(gè)策略,否則該局中人可從此對策問題中刪去,因?yàn)閷λ麃碇v,不存在選擇策略的余地。應(yīng)當(dāng)注意的是,所謂策略是指在整個(gè)競爭過程中對付他方的完整方法,并非指競爭過程中某步所采取的具體局部辦法。例如下棋中的某步只能看和一個(gè)完整策略的組成部分,而不能看成一個(gè)完整的策略。當(dāng)然,有時(shí)可將它看成一個(gè)多階段對策中的子對策。策略集合可以是有限集也可以是無限集。策略集為有限集時(shí)稱為有限對策,否則稱為無限對策。
記局中人i的策略集合為Si。當(dāng)對策問題各方都從各自的策略集合中選定了一個(gè)策略后,各方采取的策略全體可用一矢量S表示,稱之為一個(gè)純局勢(簡稱局勢)。
(2)策略集合。局中人能采取的可行方案稱為策略,每一局中人可66例如,若一對策中包含A、B兩名局中人,其策略集合分別為SA
={1,…,m},SB
={1,…,n}。若A選擇策略i而B選策略j,則(i,j)就構(gòu)成此對策的一個(gè)純局勢。顯然,SA與SB一共可構(gòu)成m×n個(gè)純局勢,它們構(gòu)成表8.3。對策問題的全體純局勢構(gòu)成的集合S稱為此對策問題的局勢集合。
(m,n)
…(m,j)
…(m,2)
(m,1)
m…………………(i,n)
…(i,j)
…(i,2)
(i,1)
i…………………(2,n)
…(2,j)
…(2,2)
(2,1)
2(1,n)
…(1,j)
…(1,2)
(1,1)
1A的策略n…J…21B的策略例如,若一對策中包含A、B兩名局中人,其策略集合分別為SA67(3)贏得函數(shù)(或稱支付函數(shù))。對策的結(jié)果用矢量表示,稱之為贏得函數(shù)。贏得函數(shù)F為定義在局勢集合S上的矢值函數(shù),對于S中的每一純局勢S,F(xiàn)(S)指出了每一局中人在此對策結(jié)果下應(yīng)贏得(或支付)的值。綜上所述,一個(gè)對策模型由局中人、策略集合和贏得函數(shù)三部分組成。記局中人集合為I={1,…,k},對每一i∈I,有一策略集合Si,當(dāng)I中每一局中人i選定策略后得一個(gè)局勢s;將s代入贏得函數(shù)F,即得一矢量F(s)=(F1(s),…,Fk(s)),其中Fi(s)為在局勢s下局中人i的贏得(或支付)。本節(jié)討論只有兩名局中人的對策問題,即兩人對策,其結(jié)果可以推廣到一般的對策模型中去。對于只有兩名局中人的對策問題,其局勢集合和贏得函數(shù)均可用表格表示。例如,表8.2就給出了例8.3的局勢集合和贏得函數(shù)。(3)贏得函數(shù)(或稱支付函數(shù))。對策的結(jié)果用矢量表示,稱之為68二、零和對策存在一類特殊的對策問題。在這類對策中,當(dāng)純局勢確定后,A之所得恰為B之所失,或者A之所失恰為B之所得,即雙方所得之和總為零。在零和對策中,因F1(s)=-F2(s),只需指出其中一人的贏得值即可,故贏得函數(shù)可用贏得矩陣表示。例如若A有m種策略,B有n種策略,贏得矩陣
表示若A選取策略i而B選取策略j,則A之所得為aij(當(dāng)aij<0時(shí)為支付)。二、零和對策存在一類特殊的對策問題。在這類對策中,當(dāng)純局勢確69在有些兩人對策的贏得表中,A之所得并非明顯為B之所失,但雙方贏得數(shù)之和為一常數(shù)。例如在表8.4中,無論A、B怎樣選取策略,雙方贏得總和均為10,此時(shí),若將各人贏得數(shù)減去兩人的平均贏得數(shù),即可將贏得表化為零和贏得表。表8.4中的對策在轉(zhuǎn)化為零和對策后,具有贏得矩陣表8.4局中人B123局中人A1(8,2)(1,9)(7,3)2(4,6)(9,1)(3,7)3(2,8)(6,4)(8,2)4(6,4)(4,6)(6,4)在有些兩人對策的贏得表中,A之所得并非明顯為B之所失,但雙方70給定一個(gè)兩人對策只需給出局中人A、B的策略集合SA、SB及表示雙方贏得值的贏得矩陣R。綜上所述,當(dāng)遇到零和對策或可轉(zhuǎn)化為零和對策的問題時(shí),R可用通常意義下的矩陣表示,否則R的元素為一兩維矢量。故兩人對策G又可稱為矩陣對策并可簡記成G={SA,SB,R}給定一個(gè)兩人對策只需給出局中人A、B的策略集合SA、SB及表71例8.4
給定G={SA,SB,R},其中SA
={1,2,3},SB
={1,2,3,4}
從R中可以看出,若A希望獲得最大贏利30,需采取策略1,但此時(shí)若B采取策略4,A非但得不到30,反而會失去22。為了穩(wěn)妥,雙方都應(yīng)考慮到對方有使自己損失最大的動機(jī),在最壞的可能中爭取最好的結(jié)果。局中人A采取策略1、2、3時(shí),最壞的贏得結(jié)果分別為min{12,-6,30,-22}=-22min{14,2,18,10}=2min{-6,0,-10,16}=-10其中最好的可能為max{-22,2,-10}=2。如果A采取策略2,無論B采取什么策略,A的贏得均不會少于2.例8.4給定G={SA,SB,R},其中SA72B采取各方案的最大損失為max{12,14,-6}=14,max{-6,2,0}=2,max{30,18,-10}=30和max{-22,10,16}=16。當(dāng)B采取策略2時(shí),其損失不會超過2。注意到在贏得矩陣中,2既是所在行中的最小元素又是所在列中的最大元素。此時(shí),只要對方不改變策略,任一局中人都不可能通過變換策略來增大贏得或減小損失,稱這樣的局勢為對策的一個(gè)穩(wěn)定點(diǎn)或穩(wěn)定解,(注:也被稱為鞍點(diǎn))定義8.1
對于兩人對策G={SA,SB,R},若有,則稱G具有穩(wěn)定解,并稱VG為對策G的值。若純局勢()使得,則稱()為對策G的鞍點(diǎn)或穩(wěn)定解,贏得矩陣中與()相對應(yīng)的元素稱為贏得矩陣的鞍點(diǎn),與分別稱為局中人A與B的最優(yōu)策略。對(8.1)式中的贏得矩陣,容易發(fā)現(xiàn)不存在具有上述性質(zhì)的鞍點(diǎn)。給定一個(gè)對策G,如何判斷它是否具有鞍點(diǎn)呢?為了回答這一問題,先引入下面的極大極小原理。B采取各方案的最大損失為max{12,14,-6}=1473定理8.1
設(shè)G={SA,SB,R},記,則必有μ+ν≤0證明:,易見μ為A的最小贏得,ν為B的最小贏得,由于G是零和對策,故μ+ν≤0必成立。定理8.2
零和對策G具有穩(wěn)定解的充要條件為μ+ν=0。
證明:
(充分性)由μ和ν的定義可知,存在一行(例如p行)μ為p行中的最小元素且存在一列(例如q列),-ν為q列中的最大元素。故有apq≥μ且apq≤-ν又因μ+ν=0,所以μ=-ν,從而得出apq=μ,apq為贏得矩陣的鞍點(diǎn),(p,q)為G的穩(wěn)定解。
定理8.1設(shè)G={SA,SB,R},記74(必要性)若G具有穩(wěn)定解(p,q),則apq為贏得矩陣的鞍點(diǎn)。故有
從而可得μ+ν≥0,但根據(jù)定理8.1,μ+ν≤0必成立,故必有μ+ν=0。上述定理給出了對策問題有穩(wěn)定解(簡稱為解)的充要條件。當(dāng)對策問題有解時(shí),其解可以不唯一。例如,若
則易見,(2
溫馨提示
- 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
- 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
- 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
- 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負(fù)責(zé)。
- 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請與我們聯(lián)系,我們立即糾正。
- 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。
最新文檔
- 思想政治教育理論與實(shí)踐期末考試試題及答案
- 籃球比賽的加油稿4篇范文
- 2025年上外版七年級歷史下冊階段測試試卷含答案
- 2025年魯教版七年級化學(xué)下冊月考試卷含答案
- 2025年滬科新版高一數(shù)學(xué)下冊月考試卷
- 二零二五年度房屋買賣及租賃市場分析報(bào)告合同3篇
- 2025年浙教版六年級英語上冊階段測試試卷
- 2025年湘教版七年級化學(xué)上冊階段測試試卷含答案
- 2025年度廢棄電池回收處理專項(xiàng)合同2篇
- 二零二五年度帶娃離婚雙方育兒費(fèi)用分擔(dān)協(xié)議3篇
- 遼寧省大連市2023-2024學(xué)年高三上學(xué)期雙基測試(期末考試) 物理 含解析
- 勞務(wù)分包的工程施工組織設(shè)計(jì)方案
- 18項(xiàng)醫(yī)療質(zhì)量安全核心制度
- 智能終端安全檢測
- 新能源發(fā)電技術(shù) 電子課件 1.4 新能源發(fā)電技術(shù)
- DB34-T 4859-2024 農(nóng)村河道清淤規(guī)范
- 中學(xué)物業(yè)管理服務(wù)采購?fù)稑?biāo)方案(技術(shù)方案)
- 康復(fù)科年度工作亮點(diǎn)與展望計(jì)劃
- 冀教版二年級(上)數(shù)學(xué)加減乘除口算題卡
- 【期中考后反思】《反躬自省,砥礪奮進(jìn)》-2022-2023學(xué)年初中主題班會課件
- 材料采購服務(wù)方案(技術(shù)方案)
評論
0/150
提交評論