暑期培訓課件7 22上午對策模型_第1頁
暑期培訓課件7 22上午對策模型_第2頁
暑期培訓課件7 22上午對策模型_第3頁
暑期培訓課件7 22上午對策模型_第4頁
暑期培訓課件7 22上午對策模型_第5頁
已閱讀5頁,還剩45頁未讀 繼續(xù)免費閱讀

下載本文檔

版權說明:本文檔由用戶提供并上傳,收益歸屬內容提供方,若內容存在侵權,請進行舉報或認領

文檔簡介

對策模型對策與決策是人們在日常生活和工作中經常會遇到的擇優(yōu)活動。人們在處理一個問題時,往往會面臨幾種情況,同時又存在幾種可行方案可供選擇,要求根據自己的行動目的選定一種方案,以期獲得最佳的結果。有時,人們面臨的問題具有競爭性質,如商業(yè)上的競爭、體育中的比賽和軍事行動、政治派別的斗爭等等。這時競爭

雙方或各方都要發(fā)揮自己的優(yōu)勢,使己方獲得最好結果。因

而雙方或各方都要根據不同情況、不同對手做出自己的決擇,此時的決策稱為對策。在有些情況下,我們面臨的并非競爭對手而是可能出現的多種情況,我們不知道究竟哪一種情況會發(fā)生,但希望我們的決策能獲得最好的結果,此時,我們面臨的問題被稱為決策問題。不過,如果我們把可能出現的若干種情況也看作是競爭對手可采取的幾種策略,那么也可以把決策問題當作對策問題來求解。決策:是人類活動的基本組成部分之一,幾乎任何工作都離不開決策。凡是根據預定的目標做出的任何行動決定,都可稱之為決策。決策問題:對于一個需要處理的事件,面臨幾種客觀條件,又有幾種方案可供選擇,這就構成一個決策問題。決策模型決策問題的類型確定型決策問題隨機型決策問題復雜過程的決策問題確定型決策問題:決策者確切地知道將發(fā)生什么樣的自然狀態(tài),從而可以在既定的自然狀態(tài)下選擇最佳方案的一類決策問題。方法:窮舉法,規(guī)劃方法(如線性規(guī)劃,動態(tài)規(guī)劃等)隨機型決策問題:決策者所面臨的的各種自然狀態(tài)是隨機出現的一類決策問題。方法:風險型決策,非確定型決策復雜系統(tǒng)的決策問題:同時受主觀與客觀因素影響的決策問題。方法:層次分析法風險型決策最大可能法,期望值決策法,樹型決策法,效用分析法等。非確定型決策樂觀法,悲觀法,折衷法,等可能性法,后悔值法。對策論(gametheory)又稱博弈論,運籌學的一個分支,是關于兩個或多個局中的人按一定規(guī)則處于競爭狀態(tài)下的決策行為的數學理論。對策論起源于關于室內游戲(象棋、撲克等)局中人的行為與得失的研究。產生于上世紀三十年代。對策模型1921年法國的包瑞爾首先做出對策論的研究。美籍數學家馮·諾伊曼在1928年提出的“最大最小原則”奠定了對策論的理論基礎,特別是在1944年發(fā)表的《對策論與經濟行為》一書,引起了廣泛的注意,對策論也由最初對于橋牌、棋藝的研究轉到對經濟、軍

事、心理等領域的廣泛應用?,F在,對策論與線性規(guī)劃、統(tǒng)計判決、管理科學、運籌學和軍事計劃等領域都有著密切關系。對策論也是安全管理學的理論基礎?,F代化生產中的安全問題是極復雜的問題,運用對策論解決這些復雜的問題,提出新模型具有重要意義。對策問題對策問題的特征是參與者為利益相互沖突的各方,其結局不取決于其中任意一方的努力而是各方所采取的策略的綜合結果。先考察幾個實際例子。例1

(田忌賽馬)田忌賽馬是大多數人都熟知的故事,傳說戰(zhàn)國時期齊王

欲與大將田忌賽馬,雙方約定每人挑選上、中、下三個等級

的馬各一匹進行比賽,每局賭金為一千金。齊王同等級的馬

均比田忌的馬略勝一籌,似乎必勝無疑。田忌的朋友孫臏給

他出了一個主意,讓他用下等馬比齊王的上等馬,上等馬對

齊王的中等馬,中等馬對齊王的下等馬,結果田忌二勝一敗,反而贏了一千金。田忌賽馬第一次賽馬田忌齊威王上中下上中下敗勝田忌賽馬第二次賽馬田忌齊威王上中下上 中 下敗勝例2

(石頭—剪子—布)這是一個大多數人小時候都玩過的游戲。游戲雙方只能選石頭、剪子、布中的一種,石頭贏剪子,剪子贏布,而布又贏石頭,贏者得一分,輸者失一分,雙方相同時不得分,見下表。表1石頭剪子布石頭01-1剪子-101布1-10例3

(囚犯的困惑)警察同時逮捕了兩人并分開關押,逮捕的原因是他們持有大量偽幣,警方懷疑他們偽造錢幣,但沒有找到充分證據,希望他們能自己供認,這兩個人都知道:如果他們雙方都不供認,將被以使用和持有大量偽幣罪被各判刑18個月;如果雙方都供認偽造了錢幣,將各被判刑3年;如果一方供認另一方不供認,則供認方將被從寬處理而免刑,但另一方面將被判刑7年。將嫌疑犯A、B被判刑的幾種可能情況列表如下:表2嫌疑犯B供認

不供認嫌疑犯A供認

不供認(3,3)

(7,0)(0,7)

(1.5,1.5)表中每對數字表示嫌疑犯A、B被判刑的年數。如果兩名疑犯均擔心對方供認并希望受到最輕的懲罰,最保險的辦法自然是承認制造了偽幣。盡管此例本身不完全符合現代的法律精神,但是這個例子的創(chuàng)造部分地奠定了非合作對策的理論基礎,并且它可以作為實際生活中許多現象的一個抽象概括。幾乎沒有一本涉及對策

(博弈)論的書不舉到這個例子,盡管表示有所不同。一、對策的基本要素(1)局中人

參加決策的各方被稱為決策問題的局中人,一個決策總是可以包含兩名局中人(如棋類比賽、人與大自然作斗爭等),也可以包含多于兩名局中人(如大多數商業(yè)中的競爭、政治派別間的斗爭)。局中人必須要擁有可供其選擇并影響最終結局的策略.在例3中,局中人是A、B兩名疑犯,警方不是局中人。兩名疑犯最終如何判刑取決于他們各自采取的態(tài)度,警方不能為他們做出選擇。從這些簡單實例中可以看出對策現象中包含的幾個基本要素。(2)策略集合

局中人能采取的可行方案稱為策略,每一局中人可采取的全部策略稱為此局中人的策略集合。對策問題中,對應于每一局中人存在著一個策略集合,而每一策略集合中至少要有兩個策略,否則該局中人可從此對策問題中刪去,因為對他來講,不存在選擇策略的余地。應當注意的是,所謂策略是指在整個競爭過程中對付他方的完整方法,并非指競爭過程中某步所采取的具體局部辦法。例如下棋中的某步只能看成其完整策略的組成部分,而不能看成一個完整的策略。當然,有時可將它看成一個多階段對策中的子對策。策略集合可以是有限集也可以是無限集。策略集為有限集時稱為有限對策,否則稱為無限對策。記局中人i的策略集合為Si。當對策問題各方都從各自的策略集合中選定了一個策略后,各方采取的策略全體可用一矢量S表示,稱之為一個純局勢(簡稱局勢)。例如,若一對策中包含A、B兩名局中人,其策略集合分別為

SA

={a1,…,am},SB

={b1,…,bn}。若A選擇策略ai而B選策略bj,則(a

i,bj)就構成此對策的一個純局勢。顯然,SA與SB一共可構成m×n個純局勢,它們構成表3。對策問題的全體純局勢構成的集合S稱為此對策問題的局勢集合。B的策略12…j…nA的策略1(a1,

b

1)(a

1,

b

2)…(

a1,b

j)…(

a1,b

n)2(a

2,

b

1)(a

2,

b

2)…(

a2,bj)…(a2,b

n)…………………i(ai

,

b1)(a

i,

b2)…(a

i,

bj)…(ai,

bn)…………………m(a

m,

b1)(a

m,b

2)…(a

m,

bj)…(am,

bn)表3(3)贏得函數(或稱支付函數)對策的結果用矢量表示,稱之為贏得函數。贏得函數F為定義在局勢集合S上的矢值函數,對于S中的每一純局勢s,F(s)指出了每一局中人在此對策結果下應贏得(或支付)的值。記局中人集合為I

={1,…,k},對每一i∈I,有一策略集合Si,當I中每一局中人i選定策略后得一個局勢s;將s代入贏得函數F,即得一矢量

F(s)=(F1(s),…,Fk(s)),其中Fi(s)為在局勢s下局中人i的贏得(或支付)。綜上所述,一個對策模型由局中人、策略集合和贏得函數三部分組成。此處討論只有兩名局中人的對策問題,即兩人對策,其結果可以推廣到一般的對策模型中去。對于只有兩名局中人的對策問題,其局勢集合和贏得函數均可用表格表示。例如,表2就給出了例3的局勢集合和贏得函數。例3

(囚犯的困惑)警察同時逮捕了兩人并分開關押,逮捕的原因是他們持有大量偽幣,警方懷疑他們偽造錢幣,但沒有找到充分證據,希望他們能自己供認,這兩個人都知道:如果他們雙方都不供認,將被以使用和持有大量偽幣罪被各判刑18個月;如果雙方都供認偽造了錢幣,將各被判刑3年;如果一方供認另一方不供認,則供認方將被從寬處理而免刑,但另一方面將被判刑7年。將嫌疑犯A、B被判刑的幾種可能情況列表如下:表2嫌疑犯B供認

不供認嫌疑犯A供認

不供認(3,3)

(7,0)(0,7)

(1.5,1.5)表中每對數字表示嫌疑犯A、B被判刑的年數。如果兩名疑犯均擔心對方供認并希望受到最輕的懲罰,最保險的辦法自然是承認制造了偽幣。二、對策問題的分類分類原則類型與時間有無關系靜態(tài)對策動態(tài)對策局中人的個數二人對策多人對策策略集中的策略有限還是無限有限對策無限對策二人對策中雙方的贏得之和是否為零零和對策(矩陣對策)非零和對策局中人之間是否允許合作合作對策非合作對策三、零和對策存在一類特殊的對策問題。在這類對策中,當純局勢確定后,A之所得恰為B之所失,或者A之所失恰為B之所得,即雙方所得之和總為零。在零和對策中,因F1(s)=-F2(s),只需指出其中一人的贏得值即可,故贏得函數可用贏得矩陣表示。例如若A有m種策略,B有n種策略,贏得矩陣21m1m2Rm·n

a11

a12

a22=

mn

aa1n

2n

a

a

a

a表示若A選取策略i而B選取策略j,則A之所得為aij(當aij<0時為支付)。B之所失為aij(當aij<0時為贏得)。在表4中,無論A、B怎樣選取策略,雙方贏得總和均為10,此時,若將各人贏得數減去兩人的平均贏得數,即可將贏得表化為零和贏得表。表4中的對策在轉化為零和對策后,具有贏得矩陣局中人B123局中人A1(8,

2)(1,

9)(7,

3)2(4,

6)(9,

1)(3,

7)3(2,

8)(6,

4)(8,

2)4(6,

4)(4,

6)(6,

4)在有些兩人對策的贏得表中,A之所得并非明顯為B之所失,但雙方贏得數之和為一常數。例如表

4

3

-4

2

R

=

3

1

-1

4

-2

-3

1

1

-1

給定一個兩人對策只需給出局中人A、B的策略集合SA、SB及表示雙方贏得值的贏得矩陣R。綜上所述,當遇到零和對策或可轉化為零和對策的問題時,R可用通常意義下的矩陣表示,否則R的元素為一兩維矢量。故兩人對策G又可稱為矩陣對策,并可簡記成G

=

{

SA,

SB,

R

}(1)例4

給定G

=

{

SA,

SB,

R},其中SA

=

{

a

1,a

2,

a

3},SB

=

{

b

1,

b2,

b

3,

b4}2R

=

14b1

b2

b3

b412

-6

30

-22

a1

2

18 10

a-6

0

-1016

a3從R中可以看出,若A希望獲得最大贏利30,需采取策略a

1,但此時若B采取策略b

4,A非但得不到30,反而會失去22。為了穩(wěn)妥,雙方都應考慮到對方有使自己損失最大的動機,在最壞的可能中爭取最好的結果。局中人A采取a策略a

1、a2、3時,最壞的贏得結果分別為min

{

12,

-6,

30,

-22

}

=

-22min

{

14,

2,

18,

10}

=2min

{-6,

0,

-10,

16}

=

-10其中最好的可能為max

{-22,2,-10}=2。如果A采取策略a

2,無論B采取什么策略,A的贏得均不會少于2.分別稱為局中人A與B的B采取各方案的最大損失為max{12,14,

-6}=14,max

{-6,2,0}=2,max

{30,18,

-10}=30和max

{-22,10,16}

=16。當B采b取策略

2時,其損失不會超過2。注意到在贏得矩陣中,2既是所在行中的最小元素又是所在列中的最大元素。此時,只要對方不改變策略,任一局中人都不可能通過變換策略來增大贏得或減小損失,稱這樣的局勢為對策的一個穩(wěn)定點

或穩(wěn)定解,(注:也被稱為鞍點)定義1

對于兩人對策G

=

{

SA,

SB,

R},若有max

min

aij

=

min

max

aij

VGi

j

j

i則稱G具有穩(wěn)定解,并稱VG為對策G的值。若純局勢(ai*

,b

j*

)使得min

ai*

j

=

max

aij*

=VGj

j,則稱(ai*

,b

j*

)為對策G的鞍點或穩(wěn)定解,贏得矩陣中與(ai*

,b

j*

)相對應的元素ai*

j*

稱為贏得矩陣的鞍點a,i*最優(yōu)策略。與b

j*對(1)式中的贏得矩陣,容易發(fā)現不存在具有上述性質的鞍點。給定一個對策G,如何判斷它是否具有鞍點呢?為了回答這一問題,先引入下面的極大極小原理。,定理1

設G

={SA,SB,R

},記則必有μ+ν≤0m

=

max

min

aij,g

=

-min

max

aiji

j

j

i證明:,j

in

=

max

min(-aij

)易見μ為A的最小贏得,ν為B的最小贏得,由于G是零和對策,故μ+ν≤0必成立。定理2

零和對策G具有穩(wěn)定解的充要條件為μ+ν=0。證明:(充分性)由μ和ν的定義可知,存在一行(例如p行)μ為p行中的最小元素且存在一列(例如q列),-ν為q列中的最大元素。故有apq≥μ且apq≤-ν又因μ+ν=0,所以μ=-ν,從而得出apq=μ,apq為贏得矩陣的鞍點,(ap

,b

q)為G的穩(wěn)定解。(必要性)若G具有穩(wěn)定解(

a

p

,b

q

),則apq為贏得矩陣的鞍點。故有m

=

max

min

aij

?

min

apj

=

apqi

j

j-n

=

min

max

aij

max

aiq

=

apqj

i

i從而可得μ+ν≥0,但根據定理1,μ+ν≤0必成立,故必有μ+ν=0。上述定理給出了對策問題有穩(wěn)定解(簡稱為解)的充要條件。當對策問題有解時,其解可以不唯一。例如,若2R

=

6

a3b1

b2

b3

b4

b5

9

-4

-3

-1

-10

a110

1

15

1

8

a-5

1

-8

-2

4

1

5

1

3

a

4一般又可以證明。則易見,(

a

2,b2),(a

2,b

4),(a

4,b

2),(a

4,b

4)均為此對策問題的解。定理3

對策問題的解具有下列性質:(1)無差別性。若(ai

,

bi

)與(ai

,

)同為對策G的解,則必有1

1

2

2ibai

j

=ai

j

。1

1 2

2j2j1)也必為G的解。(2)可交換性。若(ai

,b

j1)、(ai

,b

j2)均為對策G的解,1

212則(

ai

,

b

)和(ai

,

b定理3的證明非常容易,作為習題留給讀者自己去完成。具有穩(wěn)定解的零和對策問題是一類特別簡單的對策問題,它所對應的贏得矩陣存在鞍點,任一局中人都不可能通過自己單方面的努力來改進結果。然而,在實際遇到的零和對策中更典型的是μ+ν≠0的情況。由于贏得矩陣中不存在鞍點,至少存在一名局中人,在他單方面改變策略的情況下,有可能改善自己的收益。例如,考察(1)中的贏得矩陣R。若(雙方都采取保守的max

min原則,將會出現純局勢

4,

1a)或,

)。但如果局中人A適當改換策略,他可以增加收入。b例如,如a4

b3果B采用策略b1,而A改換策略a1,則A可收益3。但此時若B改換策略b2,又會使A輸掉4,……。此時,在只使用純策略的范圍內,對策問題無解。這類決策如果只進行一次,局中人除了碰運氣以外別無辦法。但如果這類決策要反復進行多次,則局中人固定采用一種策略顯然是不明智的,因為一旦對手看出你會采用什么策略,他將會選用對自己最為有利的策略。這時,局中人均應根據某種概率來選用各種策略,即采用混合策略的辦法,使自己的期望收益盡可能大。

3

-4

2

R

=

3

1

-1

4

-2

-3

1

1

-1(1),設A方用概率xi選用策略ai,B方用概率yj選用策略bj,且雙方每次選用什么策略是隨機的,不能讓對方看出規(guī)律,SA策略α1,…,

αmSB策略β1,…,

βn概率x1,…,xm概率y1,…,yn分別稱SA與SB為A方和B方的混合策略。對于需要使用混合策略的對策問題,也有具有穩(wěn)定解的對策問題的類似結果。m

n記X

=(x1,…,xm)T,Y

=(y1,…,yn)T,則A的期望贏得為E

(

X,Y)

=

XTRY=

xiaij

y

ji=1

j

=1其中,R為A方的贏得矩陣。記mn=

y

j

=

1j

=1

xii

=1定義2

若存在m維概率向量X

和n維概率向量

Y

,使得對一切m維概率向量X和n維概率向量Y有X

T

RY

=

max

X

T

RY

=

min

xT

RYy

x則稱(X

,Y)為混合策略對策問題的鞍點。定理4

(VonNeumann)任意混合策略對策問題必存在鞍點,即必存在概率向量

X

Y

,使得:X

T

RY

=

max

min

X

T

RY

=

min

max

X

T

RYy

x

x

y使用純策略的對策問題(具有穩(wěn)定解的對策問題)可以看成使用混合策略的對策問題的特殊情況,相當于以概率1選取其中某一策略,以概率0選取其余策略。對于雙方均只有兩種策略的對策問題(即2×2對策),可按幾何方法求解。例5

A、B為作戰(zhàn)雙方,A方擬派兩架轟炸機I和II去轟炸B方的指揮部,轟炸機I在前面飛行,II隨后。兩架轟炸機中只有一架帶有炸彈,而另一架僅為護航。轟炸機飛至B方上空,受到B方戰(zhàn)斗機的阻擊。若戰(zhàn)斗機阻擊后面的轟炸機II,它僅受II的射擊,被擊中的概率為0.3(I來不及

返回擊它)。若戰(zhàn)斗機阻擊I,它將同時受到兩架轟炸機的射擊,被擊中的概率為0.7。一旦戰(zhàn)斗機未被擊落,它將以0.6的概率擊毀其選中的轟炸機。請為A、B雙方各選擇一個最優(yōu)策略,即:對于A方應選擇哪一架轟炸機裝載炸彈?對于B方戰(zhàn)斗機應阻擊哪一架轟炸機?解:雙方可選擇的策略集分別為SA

=

{

a

1,

a2},SB=

{

b1,

b2},a

1:轟炸機I

裝炸彈,II

護航a

2:轟炸機II

裝炸彈,I

護航b1:阻擊轟炸機Ib

2:阻擊轟炸機IIj

時,轟i而B方采取策略b贏得矩陣R=(aij)2×2,aij為A方采取策略a炸機轟炸B方指揮部的概率,由題意可計算出:a11=

0.7

+

0.3

(1-0.6)

=

0.82a12=

1,

a21=

1a22=

0.3

+0.7

(1-0.6)=0.58即R

=

0.82

1

10.58

易求得。由于μ+ν≠0,矩陣R不存在鞍點,應當求最佳混合策略。m

=

max

min

aij

=

0.82

,n

=

-min

max

aij

=

-1i

j

j

i現設A以概率x1取策略a

1、概率x2取策略a

2;B以概率y1取策略b

1、概率y2取策略b

2。先從B方來考慮問題。B采用b

1時,A方轟炸機攻擊指揮部的概率的期望值為E(

b

1)=0.82x1+x2,而B采用β2時,A方轟炸機攻擊指揮部的概率的期望值為E(

2b)=x1+0.58x2。若E(

1)b

≠E(

2)b,不妨設E(

b

1)<E(

b

2),則B方必采用b1以減少指揮部被轟炸的概率。故對A方選取的最佳概率x1和x2,必滿足:0.82x1

+

x2

=

x1

+

0.58x2x

+

x

=1

1

2即a11

x1

+

a21

x2

=

a12

x1

+

a22

x2x

+

x

=1

1

2由此解得x1=0.7,x2=0.3。同樣,可從A方考慮問題,得0.82

y1

+

y2

=

y1

+

0.58

y2

y

+

y

=1

1

2即an

y1

+

a12

y2

=

a21

y1

+

a22

y2

y

+

y

=1

1

2并解得y1=0.7,y2=0.3。B方指揮部轟炸的概率的期望值VG=0.874。上述方法也可以用幾何方式表

達。在x軸上取長度為1的線段,左端點為x=0,右端點為x=1。過x=0和x=1各作x軸的垂線,稱之為軸I和軸II。在軸I上取B1、

B2,它們到x軸的距離分別的a11和a12,表示在A采取策略a

1

即(x2=0)時A方在B方分別采取策略b

1和b

2下的贏得,如圖1所示。-x2)+a21x2。對應x2的不同取值(0≤x2≤1),a11(1-x2)+a21x2恰好構成連接兩個B1的直線段。類似地,連接兩個B2的直線段恰好對應當B取而A以概率x2取2時的贏得a12(1-x2)+a22x2。設兩直線段相交于N,并設N2而使A的贏得減小。故A混合策略可類似用幾何方法求得)。借助幾何方法也可以解m×2或2×n的使用混合策略的對策問題。但當m>2且n>2時,采用幾何方法求解就變得相當麻煩,此時通常采用線性規(guī)劃方法求解?,F設A以概率x2采取策略a

2,若B采取策略b2,則A的期望贏得為a11(1b

2b對應于x2。若A以小于x2

的x2取策略a2,則B可以采取b1使A的期望贏得減??;反之,若x2>x2

,則B又可采取的最佳混合策略為以x1

=1-x2

概率取a

1,以概率取a

2(注:B的最佳A方選擇混合策略X

的目的是使得X

T

RY

=

min

max

X

T

RYX

YnTj

jX

Yy

e

)j

=1=

min

max

X

R(nj

jE

yj

=1=

min

maxX

Y其中ej為只有第j個分量為1而其余分量均為零的向量,Ej

=XTRej。在yk=1,yj=0j

=1n

nyj

=1j(j≠k)時達到最大值u,=

max

Ej

,由于

y

j

=1

,

max

Ej

y

j記m

=EKn

aij

xi

ui=1故X

應為線性規(guī)劃問題min

u,

j=1,

2,…,n

(即Ej≤Ek)mi=1

xi

=1xi≥0,

i

=1,2,…,mS.t的解。n

aij

yi

?ni=1同理,Y

應為線性規(guī)劃max

ν,i=1,

2,

…,mn

yi

=1j

=1yj≥0,

i

=1,2,…,nS.t的解。(2)(3)由線性規(guī)劃知識,(2)與(3)互為對偶線性規(guī)劃,它們具有相同的最優(yōu)目標函數值。關于線性規(guī)劃對偶理論,有興趣的讀者可以參閱有關書籍,例如魯恩伯杰的“線性與非線性規(guī)劃引論”。為了尋找例5中A方的最優(yōu)混合策略,求解線性規(guī)劃min

uS.t

0.82x1

+

x2

ux1

+

0.58x2

≤ux1

+x2

=1x1

,

x2

≥0可得最優(yōu)混合策略x1

=0.7,

x2

=0.3。類似求解線性規(guī)劃max

υS.t

0.82y1

+y2

≤υy1

+0.58y2

≥υy1

+y2

=1y1

,y2

≥0可得B方最優(yōu)混合策略:y1

=0.7,

y2

=0.3。四、非零和對策除了零和對策外,還存在著另一類對策問題,局中人獲利之和并非常數。例6

現有一對策問題,雙方獲利情況見表5。表5B方A方1231(8,2)(0,9)(7,3)2(3,4)(9,0)(2,7)3(1,6)(6,2)(8,1)4(4,2)(4,6)(5,1)假如A、B雙方仍采取穩(wěn)妥的辦法,A發(fā)現如采取策略4,則至少可獲利

4,而B發(fā)現如采取策略1,則至少可獲利2。因而,這種求穩(wěn)妥的想法將導致出現局勢(4,2)。容易看出,從整體上看,結果并不是最好的,因為雙方的總獲利有可能達到10。不難看出,依靠單方面的努力不一定能收到良好的效果??磥?,對這一對策問題,雙方最好還是握手言和,相互配合,先取得總體上的最大獲利,然后再按某一雙方均認為較為合理的方式來分享這一已經獲得的最大獲利。例6說明,總獲利數并非常數的對策問題(即不能轉化為零和對策的問題),是一類存在著合作基礎的對策問題。當然,這里還存在著一個留待解決而又十分關鍵的問題:如何分享總獲利,如果不能達到一個雙方(或各方)都能接受的“公平”的分配原則,則合作仍然不能實現。怎樣建立一個“公平”的分配原則是一個較為困難的問題。1953年,Shapley用公理化方法研究了這一問題,并提出了他認為公平的分配方法(可參閱有關對策論的書籍)。最后,我們來考察幾個對策問題的實例。例7(戰(zhàn)例分析)1944年8月,美軍第一軍和英軍占領法國諾曼第不久,立即從海防前線穿過海峽,向Arranches進軍。美軍第一軍和英軍的行動直接威脅到德軍第九軍。美軍第三軍也開到了Arranches的南部,雙方軍隊所處的地理位置如圖2所示。美軍方面的指揮官是Bradley將軍,德軍指揮官是Von

Kluge將軍。

Von

Kluge將軍面臨的問題是或者向西進攻,加強他的西部防線,切斷美軍援助;或者撤退到東部,占據塞那河流域的有利地形,并能得到德軍第十五軍的援助。Bradley將軍的問題是如何調動他的后備軍,后備軍駐扎在海峽南部。

Bradley將軍有三種可供選擇的策略:他可以命令后備軍原地待命,當海峽形勢危急時支援第一軍或出擊東部敵人,以減輕第一軍的壓力。雙方應如何決策,使自己能有較大的機會贏得戰(zhàn)爭的勝利呢?我們將用建立矩陣對策模型的方法,來試圖求得雙方的最優(yōu)策略。模型假設:1、Bradley將軍和Von

Kluge將軍分別為對策問題的局中人A和B。2、局中人A的策略集合為SA

={a1,a2,a

3},其中:a

1為后備軍增援保(1)(1

1,

),估計美軍擊敗德軍并占領海峽的可能性(即概率)為ab衛(wèi)海峽;a

2為后備軍東征,切斷德軍后路;a

3為后備軍待命3、局中人B的策略集合為SB

={

b1,b

2},其中:b

1為德國向西進攻海峽,切斷美軍援助;

2為b德軍撤退到東部,占領塞納河流域有利地形。4、SA、SB構成六種純局勢,綜合雙方實力,各種局勢估計結果如下。若B采取策略b

1,即德軍采取攻勢,則有132

1。德軍很可能打破美軍第一軍的防線,并切斷美軍的退路。(2)(a

,b

),估計美軍取勝的可能為16(3)(a

3,b

1),估計美軍可以根據需要增援。如不需增援,后備軍可東進繞行到德軍后方。這樣,美軍將占領海峽并徹底殲滅德軍第九軍。情況(1)、(2)、(3)如圖3(1)、(2)、(3)所示。若B采取策略b

2,即德軍第九軍東撤,占據塞納河流域有利地形,則有(4)(a

1,

b2),美方擴大了戰(zhàn)線,德軍雖占據了有利地形,美軍仍有擊敗德軍的可能性。(5)(a

2,b

2),美后備軍東進給德軍東撤造成壓力并挫傷德軍,使美軍擊敗5德軍的可能性增大到

6

。(6)(a

3,b2),美后備軍待命。在發(fā)現德軍撤退后,奉命向東擾亂敵方撤退,2為以后殲滅德第九軍創(chuàng)造條件,估計是美軍擊敗德軍的可能性3

。情況(4)、(5)、(6)見圖8.3(4)、(5)(6)所示。上述分析估計是由Bradley將軍作出的,據此構造出A方贏得矩陣Bb1

b2a1

1 1

3 2

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯系上傳者。文件的所有權益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網頁內容里面會有圖紙預覽,若沒有圖紙預覽就沒有圖紙。
  • 4. 未經權益所有人同意不得將文件中的內容挪作商業(yè)或盈利用途。
  • 5. 人人文庫網僅提供信息存儲空間,僅對用戶上傳內容的表現方式做保護處理,對用戶上傳分享的文檔內容本身不做任何修改或編輯,并不能對任何下載內容負責。
  • 6. 下載文件中如有侵權或不適當內容,請與我們聯系,我們立即糾正。
  • 7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

評論

0/150

提交評論