對(duì)策問(wèn)題的提出對(duì)策論模型矩陣對(duì)策的解法◎知識(shí)歸納

上傳人：c*** IP屬地：貴州上傳時(shí)間：2024-04-03 格式：PPT 頁(yè)數(shù)：34 大?。?59.73KB 積分：25 舉報(bào) 版權(quán)申訴

對(duì)策問(wèn)題的提出對(duì)策論模型矩陣對(duì)策的解法◎知識(shí)歸納_第2頁(yè)

對(duì)策問(wèn)題的提出對(duì)策論模型矩陣對(duì)策的解法◎知識(shí)歸納_第3頁(yè)

對(duì)策問(wèn)題的提出對(duì)策論模型矩陣對(duì)策的解法◎知識(shí)歸納_第4頁(yè)

對(duì)策問(wèn)題的提出對(duì)策論模型矩陣對(duì)策的解法◎知識(shí)歸納_第5頁(yè)

已閱讀5頁(yè)，還剩29頁(yè)未讀，繼續(xù)免費(fèi)閱讀

版權(quán)說(shuō)明：本文檔由用戶提供并上傳，收益歸屬內(nèi)容提供方，若內(nèi)容存在侵權(quán)，請(qǐng)進(jìn)行舉報(bào)或認(rèn)領(lǐng)

文檔簡(jiǎn)介

8對(duì)策論教學(xué)目的與要求通過(guò)對(duì)本章的學(xué)習(xí)，使學(xué)生對(duì)博弈論的產(chǎn)生、發(fā)展和研究現(xiàn)狀有較全面的了解，對(duì)博弈論在現(xiàn)代物流管理中的運(yùn)用有較全面的認(rèn)識(shí)，掌握博弈論的概念、特點(diǎn)、分類(lèi)和基本要素，掌握博弈論最基本的矩陣對(duì)策模型的建立,掌握矩陣對(duì)策的純策略和混合策略的運(yùn)用，掌握矩陣對(duì)策中圖解法和線性規(guī)劃解法，能夠運(yùn)用博弈論的方法對(duì)物流管理問(wèn)題進(jìn)行分析、建模并求解。對(duì)策論也稱游戲理論、競(jìng)賽論、博弈論，源自英文“GameTheory”?，F(xiàn)廣為學(xué)術(shù)界接受的是博弈論這一名稱。作為現(xiàn)代數(shù)學(xué)的一個(gè)新分支和運(yùn)籌學(xué)中的一個(gè)重要學(xué)科，它主要研究的是決策者在決策主體各方面相互作用的情況下如何進(jìn)行決策及有關(guān)這種決策的均衡問(wèn)題，其強(qiáng)調(diào)的是決策主體各方策略的相互依存性及其最優(yōu)組合。簡(jiǎn)單地說(shuō)就是對(duì)方如何行動(dòng)，而我們又將如何應(yīng)對(duì)。由于它提供了一種研究人類(lèi)理性行為的通用方法，運(yùn)用這些方法可以更為清晰完整地分析各種社會(huì)經(jīng)濟(jì)力量沖突與合作的形勢(shì)，因此，博弈論在經(jīng)濟(jì)學(xué)、社會(huì)學(xué)、心理學(xué)、政治學(xué)等各類(lèi)社會(huì)科學(xué)中得到了廣泛運(yùn)用，對(duì)進(jìn)化生物學(xué)和計(jì)算機(jī)科學(xué)等自然科學(xué)也產(chǎn)生了重要影響。8對(duì)策論教學(xué)目的與要求通過(guò)對(duì)本章的學(xué)習(xí)，使學(xué)生對(duì)18對(duì)策論8.1對(duì)策問(wèn)題的提出8.2對(duì)策論模型8.3矩陣對(duì)策的解法◎知識(shí)歸納◎習(xí)題與思考題8對(duì)策論8.1對(duì)策問(wèn)題的提出28.1對(duì)策問(wèn)題的提出8.1.1對(duì)策論概述作為一門(mén)現(xiàn)代學(xué)科，博弈論建立的時(shí)間并不長(zhǎng)，然而博弈的思想源遠(yuǎn)流長(zhǎng)，博弈現(xiàn)象無(wú)處不有。小到棋牌之類(lèi)的游戲，中到經(jīng)濟(jì)生活中的各種交易，大到國(guó)家之間的征伐斗爭(zhēng)，無(wú)不涉及人與人之間的斗智。博弈論的產(chǎn)生正是來(lái)自于人類(lèi)對(duì)這種斗智現(xiàn)象的觀察與思考?，F(xiàn)代博弈論起源于19世紀(jì)末20世紀(jì)初，二戰(zhàn)后發(fā)展成為一門(mén)完整而豐富的理論學(xué)科。學(xué)術(shù)界一般將其發(fā)展歷程分為以下幾個(gè)階段：（1）萌芽階段從19世紀(jì)末到20世紀(jì)30年代可以說(shuō)是博弈論的萌芽期，表現(xiàn)為學(xué)者們對(duì)社會(huì)經(jīng)濟(jì)理論和現(xiàn)實(shí)的一些思考，研究者以數(shù)學(xué)家為主。（2）產(chǎn)生階段20世紀(jì)四五十年代可說(shuō)是博弈論的體系建立時(shí)期。1944年諾依曼和摩根斯坦的巨著《博弈論和經(jīng)濟(jì)行為》的出版，標(biāo)志著博弈論作為一門(mén)學(xué)科的建立，也被視為數(shù)理經(jīng)濟(jì)學(xué)學(xué)科建立的里程碑。巨著出版前后的若干年中，合作博弈理論的研究得到了迅速的發(fā)展，提出了各種概念，并在20世紀(jì)50年代達(dá)到了研究的高峰。不久，庫(kù)克于1950年定義了“囚徒的困境”，納什在1950年和1951年發(fā)表了兩篇關(guān)于非合作博弈的重要文章，這兩位學(xué)者的研究工作，特別是納什的研究工作奠定了非合作博弈論的基礎(chǔ)，所提出的納什均衡概念，在非合作博弈論中起著核心作用。8.1對(duì)策問(wèn)題的提出8.1.1對(duì)策論概述作3（3）發(fā)展階段20世紀(jì)60至80年代是博弈論體系的發(fā)展壯大時(shí)期。一方面，研究的領(lǐng)域從軍事戰(zhàn)略戰(zhàn)術(shù)問(wèn)題推廣應(yīng)用到經(jīng)濟(jì)領(lǐng)域；另一方面，研究的內(nèi)容也不斷發(fā)展出新。合作博弈理論繼續(xù)得到充實(shí)和豐富，而非合作博弈理論更是發(fā)展迅速，成為博弈論研究和應(yīng)用的主流。（4）成熟階段20世紀(jì)80年代至今是博弈論的完善和應(yīng)用期。此間博弈論本身發(fā)展成為了一個(gè)相對(duì)完善、內(nèi)容豐富的理論體系，羽翼已豐的非合作博弈理論在理論研究和實(shí)踐應(yīng)用中都占據(jù)了主導(dǎo)地位。更重要的是，博弈理論在各種經(jīng)濟(jì)學(xué)科中都得到了深入的應(yīng)用，在政治學(xué)、生物學(xué)、計(jì)算機(jī)科學(xué)、道德哲學(xué)、社會(huì)學(xué)等領(lǐng)域內(nèi)也產(chǎn)生了重要影響。1994年，納什、澤爾騰、海薩尼三人因博弈論及其在經(jīng)濟(jì)應(yīng)用方面的突出貢獻(xiàn)而榮獲諾貝爾經(jīng)濟(jì)學(xué)獎(jiǎng)，1996年諾貝爾經(jīng)濟(jì)學(xué)獎(jiǎng)再度授予了在博弈論研究方面作出突出貢獻(xiàn)的維克里和莫里斯。由此，吸引了更多的學(xué)者投入到博弈論的研究當(dāng)中，使得博弈論成為世界范圍內(nèi)的研究熱點(diǎn)，博弈論也逐步趨于完善和成熟。2001年，研究博弈論的學(xué)者再一次獲得諾貝爾經(jīng)濟(jì)學(xué)獎(jiǎng)。美國(guó)教授喬治·阿克爾洛夫、邁克爾·斯彭斯和約瑟夫·斯蒂格利茨在20世紀(jì)70年代奠定了對(duì)充滿不對(duì)稱信息市場(chǎng)進(jìn)行分析的理論基礎(chǔ)，正是由于他們?cè)凇皩?duì)充滿不對(duì)稱信息市場(chǎng)進(jìn)行分析”領(lǐng)域所做出的重要貢獻(xiàn)，而分享了2001年諾貝爾經(jīng)濟(jì)學(xué)獎(jiǎng)。

（3）發(fā)展階段48.1.2對(duì)策論在現(xiàn)代物流管理中的運(yùn)用在現(xiàn)代物流管理實(shí)踐中，決策者們?yōu)榱酥\求自身的不斷發(fā)展，保持自身的競(jìng)爭(zhēng)優(yōu)勢(shì)，必須不斷地審時(shí)度勢(shì)、不停地進(jìn)行選擇和作出決定，以保證最大限度地降低物流成本、提高物流效率及服務(wù)水平。他們的選擇和決定會(huì)影響到競(jìng)爭(zhēng)對(duì)手的決策結(jié)果，同樣競(jìng)爭(zhēng)對(duì)手的選擇和決定也直接影響著他們的決策結(jié)果。也就是說(shuō)，決策者在決策時(shí)必須要考慮到對(duì)手的策略，因此，博弈論的思想已完全融入到現(xiàn)代物流管理的每一個(gè)環(huán)節(jié)中。博弈論在現(xiàn)代物流管理中的運(yùn)用主要有物流項(xiàng)目投資、物流市場(chǎng)競(jìng)爭(zhēng)對(duì)策、物流服務(wù)價(jià)格策略、物流中心選址、物流運(yùn)輸規(guī)劃、物流倉(cāng)儲(chǔ)優(yōu)化等內(nèi)容。以下僅就本書(shū)涉及到的有關(guān)博弈論中矩陣對(duì)策的例子作簡(jiǎn)要介紹。（1）物流市場(chǎng)競(jìng)爭(zhēng)博弈【例8.1】?jī)蓚€(gè)競(jìng)爭(zhēng)對(duì)手A公司和B公司，都計(jì)劃在某一個(gè)城市增加產(chǎn)品的銷(xiāo)售點(diǎn)，地點(diǎn)可選擇安排在城市中心或城市郊區(qū)。如果兩個(gè)對(duì)手都決定在城市中心建立銷(xiāo)售點(diǎn)，那么每年A公司產(chǎn)品的利潤(rùn)要比B公司產(chǎn)品的利潤(rùn)多10000元；如果兩個(gè)公司都決定在城市郊區(qū)建立銷(xiāo)售點(diǎn)，那么A公司產(chǎn)品的利潤(rùn)要比B公司產(chǎn)品的利潤(rùn)要少20000元；如果A公司安排在城市郊區(qū)，而B(niǎo)公司安排在城市中心，那么A公司的利潤(rùn)要比B公司的利潤(rùn)多40000元；如果A公司安排在城市中心，而B(niǎo)公司安排在城市郊區(qū)，那么A公司的利潤(rùn)要比B公司少30000元。試問(wèn)各公司安排銷(xiāo)售點(diǎn)的最好位置是哪里？在選擇自己銷(xiāo)售點(diǎn)位置時(shí)，不得不考慮對(duì)手銷(xiāo)售點(diǎn)的選擇，因?yàn)樗鼘?duì)我們的銷(xiāo)售會(huì)產(chǎn)生很大的影響。最好位置的含義是使雙方都能發(fā)揮最大的能力，而不是使總銷(xiāo)售額達(dá)到最高，當(dāng)然，所謂“最好”在這里也是相對(duì)的。此外對(duì)位置的選擇可以有不同的解釋，這就是博弈了。8.1.2對(duì)策論在現(xiàn)代物流管理中的運(yùn)用在現(xiàn)5（2）物流倉(cāng)儲(chǔ)優(yōu)化策略【例8.2】一倉(cāng)儲(chǔ)供應(yīng)中心為其下游的一家生產(chǎn)企業(yè)供應(yīng)某種原料。生產(chǎn)企業(yè)根據(jù)產(chǎn)品訂單情況對(duì)原料的需求進(jìn)行分析，分別有淡季、旺季和正常三種情況，在正常情況下需要原料15噸，在淡季和旺季情況下分別需要原料10噸和20噸；而原料的價(jià)格與原料市場(chǎng)的需求有關(guān)，在淡季、正常、旺季三種情況下，每噸原料的價(jià)格分別為100元、150元和200元，已知此時(shí)每噸原料的價(jià)格為100元。問(wèn)在生產(chǎn)企業(yè)對(duì)原料的需求沒(méi)有確定預(yù)知的條件下，此時(shí)應(yīng)采購(gòu)多少噸原料才能使倉(cāng)儲(chǔ)供應(yīng)中心的總成本最少（不計(jì)存儲(chǔ)費(fèi)用）？這個(gè)問(wèn)題可看成一個(gè)博弈問(wèn)題。即倉(cāng)儲(chǔ)供應(yīng)中心針對(duì)可能出現(xiàn)的三種不同的原料需求狀況，運(yùn)用三種儲(chǔ)量策略來(lái)進(jìn)行應(yīng)對(duì)，通過(guò)對(duì)各種情況下成本費(fèi)用的計(jì)算，找出最佳的策略來(lái)。在現(xiàn)代物流管理中，這種不同策略的相互應(yīng)對(duì)非常普遍，如投資與外包等。（3）物流運(yùn)輸對(duì)策分析【例8.3】甲、乙兩個(gè)貨物運(yùn)輸公司在同一地區(qū)從事運(yùn)輸。兩個(gè)公司都想通過(guò)改革經(jīng)營(yíng)管理以獲取更多運(yùn)輸市場(chǎng)的份額。甲公司考慮的策略措施有：①降低運(yùn)輸價(jià)格；②提高運(yùn)輸質(zhì)量；③推出新的運(yùn)輸方式。乙公司考慮的策略措施有：①增加廣告費(fèi)用；②增設(shè)服務(wù)網(wǎng)；③改進(jìn)原有設(shè)備。假定市場(chǎng)份額一定，由于各自采取的策略措施不同，相應(yīng)的兩個(gè)公司的市場(chǎng)占有份額將會(huì)發(fā)生變化。如經(jīng)預(yù)測(cè)，當(dāng)甲公司采用①策略，乙公司采用①策略時(shí)，甲公司市場(chǎng)份額會(huì)有10%的增長(zhǎng)，相應(yīng)還會(huì)有其他各種策略對(duì)應(yīng)的預(yù)測(cè)值。那么甲、乙兩公司的選擇是什么呢？和上面的例題一樣，我們通過(guò)競(jìng)爭(zhēng)對(duì)策分析，就可以確定兩個(gè)公司各自的最優(yōu)策略了。由此可見(jiàn)，博弈就是競(jìng)爭(zhēng)過(guò)程中，參與競(jìng)爭(zhēng)者理性地選擇自身策略的過(guò)程。那么有效地預(yù)測(cè)對(duì)手的策略，全面地分析策略的得失，是博弈取勝的關(guān)鍵。返回（2）物流倉(cāng)儲(chǔ)優(yōu)化策略返回68.2對(duì)策論模型博弈論分析的是人們進(jìn)行決策時(shí)策略選擇的相互影響，現(xiàn)實(shí)中存在著極其多樣的這種形勢(shì)。為了進(jìn)行規(guī)范分析，有必要從中抽象出最基本的組成要素構(gòu)成最簡(jiǎn)單的模型，利用數(shù)學(xué)工具進(jìn)行求解，分析結(jié)論的現(xiàn)實(shí)意義，然后再逐步加入更復(fù)雜的因素，使模型更能描述現(xiàn)實(shí)。這樣最簡(jiǎn)單的對(duì)策模型，一般都有以下三個(gè)基本要素。8.2.1對(duì)策模型的基本要素（1）局中人在一個(gè)對(duì)策行為中，有權(quán)決定自己行動(dòng)方案的對(duì)策參加者被稱為局中人。局中人除了理解為個(gè)人外還可以理解為集體，如球隊(duì)、交戰(zhàn)國(guó)、企業(yè)公司等，也可以把大自然理解為局中人（因?yàn)槿祟?lèi)經(jīng)常處于和大自然斗爭(zhēng)的狀態(tài)中）；另外，還假定局中人都是聰明的，有理智的和利己的。同時(shí)，為使所研究的問(wèn)題更加清晰，把那些利益完全一致的參加者們看做一個(gè)局中人，因?yàn)樗麄兝σ恢?，必使他們齊心合力，相互配合行動(dòng)如一個(gè)人。例如，橋牌游戲中，東西雙方利益一致，南北兩方得失相當(dāng)，所以雖有四人參加，只能算有兩個(gè)局中人。一個(gè)對(duì)策中一般要求至少有兩個(gè)局中人。每個(gè)局中人用i表示，局中人的集合用字母I表示，則I＝｛1，2，…，n｝。我們稱只有兩個(gè)局中人的對(duì)策現(xiàn)象為“兩人對(duì)策”，如象棋、橋牌等，顯然上述齊王賽馬中局中人也是兩人，即I＝｛1，2｝。而多于兩個(gè)局中人的對(duì)策稱為“多人對(duì)策”。另外根據(jù)局中人之間是否允許進(jìn)行合作，還可有“結(jié)盟對(duì)策”和“不結(jié)盟對(duì)策”，或稱為“合作博弈”和“非合作博弈”。8.2對(duì)策論模型博弈論分析的是人們進(jìn)行決策時(shí)7（2）策略在一局對(duì)策中，可供局中人選擇的一個(gè)實(shí)際可行的自始至終通盤(pán)籌劃的完整行動(dòng)方案稱為這個(gè)局中人的一個(gè)“策略”。參加對(duì)策的局中人i（i∈I）的所有可供選擇的策略的全體所構(gòu)成的集合叫做局中人i的“策略集”，簡(jiǎn)記作Si。（3）贏得函數(shù)一局對(duì)策結(jié)束之后，對(duì)每個(gè)局中人來(lái)說(shuō)，不外乎是勝利或失敗，名次的前后，以及其他物質(zhì)的收入或支出等，這些可以統(tǒng)稱為“得失”或“益損”。在齊王與田忌賽馬的例子中，最后田忌贏得一千金，而齊王損失一千金，即為這局對(duì)策（結(jié)局時(shí)）雙方的“得失”。實(shí)際上，每個(gè)局中人在一局對(duì)策結(jié)束時(shí)的得失，與局中人所選定的策略有關(guān)。例如，上述賽馬的例子中，當(dāng)齊王出策略“上、中、下”，田忌出策略“下、上、中”時(shí)，田忌得千金；而如果與田忌都出策略“上、中、下”時(shí)，田忌就得付出三千金了。因此，在一局對(duì)策中，當(dāng)局勢(shì)給定以后，對(duì)策的結(jié)果也就確定了。一局對(duì)策結(jié)束時(shí)，每個(gè)局中人的“得失”是全體局中人所決定的一組策略即“局勢(shì)”的函數(shù)，我們稱之為“贏得函數(shù)”。在最終局勢(shì)ω下，局中人i∈I的贏得函數(shù)記作：H（i,ω）。在一局對(duì)策中，如果在任一“局勢(shì)”中，全體局中人的“得失”相加總和為零，就稱該對(duì)策為“零和對(duì)策”，否則，就稱為“非零和對(duì)策”。上述齊王與田忌賽馬的例子中，不論比賽雙方的策略如何，比賽的結(jié)果，一方的所得必為另一方的所失，因此該對(duì)策就是一個(gè)零和對(duì)策。一般來(lái)說(shuō)，當(dāng)上述三個(gè)基本要素確定以后，一個(gè)對(duì)策模型就確定了。（2）策略88.2.2對(duì)策的分類(lèi)對(duì)策的種類(lèi)很多，可以依據(jù)不同的原則進(jìn)行分類(lèi)。如前所述，根據(jù)參與博弈的局中人的數(shù)量可分為二人對(duì)策和多人對(duì)策；根據(jù)局中人之間是否允許進(jìn)行合作（一般是多人博弈中），可分為合作博弈和非合作博弈；根據(jù)局中人策略集中策略的有限或無(wú)限，可分為有限對(duì)策和無(wú)限對(duì)策；根據(jù)各局中人贏得函數(shù)值的和是否為零，可分為零和對(duì)策和非零和對(duì)策，非零和又可分為常和對(duì)策與變和對(duì)策；此外，根據(jù)對(duì)策與時(shí)間的關(guān)系可將凈對(duì)策分為靜態(tài)對(duì)策和動(dòng)態(tài)對(duì)策；根據(jù)大家是否都清楚各種對(duì)局情況下每個(gè)局中人的得益，可分為完全信息對(duì)策和不完全信息對(duì)策；根據(jù)對(duì)策的數(shù)學(xué)模型的類(lèi)型可分為矩陣對(duì)策、連續(xù)對(duì)策、微分對(duì)策、陣地對(duì)策、隨機(jī)對(duì)策等。目前世界比較流行的一種分類(lèi)方式是把靜態(tài)與動(dòng)態(tài)、完全信息與不完全信息這四種基本的對(duì)策組合起來(lái)形成四類(lèi)博弈：完全信息靜態(tài)博弈，完全信息動(dòng)態(tài)博弈，不完全信息靜態(tài)博弈，不完全信息動(dòng)態(tài)博弈。完全信息是指博弈中的決策者對(duì)于博弈整體結(jié)構(gòu)有著充分的了解，唯一需要考慮的就是策略選擇問(wèn)題；不完全信息則是指博弈中的決策者對(duì)博弈結(jié)構(gòu)中某些部分的了解不充分；靜態(tài)博弈是指博弈中每個(gè)決策者的策略選擇僅進(jìn)行一次，在選擇時(shí)不知道其他人的策略選擇；動(dòng)態(tài)博弈則引入了決策的先后次序，局中人在進(jìn)行選擇時(shí)可以得到關(guān)于行動(dòng)歷史的一些信息。這四類(lèi)博弈一個(gè)比一個(gè)精彩，也一個(gè)比一個(gè)難。主要對(duì)策模型的分類(lèi)見(jiàn)圖8.1。8.2.2對(duì)策的分類(lèi)對(duì)策的種類(lèi)很多，可以依9圖8.1對(duì)策模型分類(lèi)圖8.1對(duì)策模型分類(lèi)10在眾多的對(duì)策模型中，完全信息靜態(tài)模型中的有限二人零和對(duì)策占有重要地位。這類(lèi)對(duì)策也叫矩陣對(duì)策，它是到目前為止在理論研究和求解方法方面都比較完善的一類(lèi)對(duì)策，而且這類(lèi)對(duì)策的研究思想和理論結(jié)果又是研究其他對(duì)策模型的基礎(chǔ)。這里我們僅討論矩陣對(duì)策模型。在眾多的對(duì)策模型中，完全信息靜態(tài)模型中的有限二118.2.3矩陣對(duì)策的基本模型矩陣對(duì)策是指對(duì)策中只有兩個(gè)局中人，每個(gè)局中人各有有限個(gè)可供選擇的策略。在每個(gè)對(duì)局中，兩個(gè)局中人獨(dú)立的選擇一個(gè)策略（互相都不知道對(duì)方所選的策略），而兩人的收益總和（“得失”相加）為零。這種對(duì)策中，兩個(gè)局中人的利益是完全相反的，即一個(gè)局中人的贏得值恰好是另一個(gè)人所損失的值。局中人雙方的利益是沖突的，因此不存在合作的可能，所以矩陣對(duì)策又稱為有限對(duì)抗對(duì)策。這種對(duì)策比較簡(jiǎn)單，在理論上也比較成熟，而且這些理論奠定了研究“對(duì)策現(xiàn)象”的基本思路，所以矩陣對(duì)策是對(duì)策論的基礎(chǔ)。下面繼續(xù)討論齊王賽馬的例子：以α1（上、中、下）表示齊王以“先用上等馬、再用中等馬、最后用下等馬”次序參加比賽。也就是說(shuō)它是齊王的一個(gè)策略。于是齊王共有6個(gè)策略（3的全排列P3＝3?。?×2×1＝6），即：α1（上、中、下）α2（上、下、中）α3（中、上、下）α4（中、下、上）α5（下、中、上）α6（下、上、中）同理，對(duì)田忌來(lái)講也有6個(gè)策略，分別是：β1（上、中、下）β2（上、下、中）β3（中、上、下）β4（中、下、上）β5（下、中、上）β6（下、上、中）8.2.3矩陣對(duì)策的基本模型矩陣對(duì)策是指對(duì)策12當(dāng)齊王選取策略α1（上、中、下），田忌選取策略β1（上、中、下）進(jìn)行比賽，就形成了一個(gè)局勢(shì)（α1，β1）。這時(shí)由于在同級(jí)的馬中，田忌的馬不如齊王的馬，所以齊王在這一局勢(shì)下每個(gè)等級(jí)的馬都勝過(guò)田忌的馬，齊王可以得到三千金。同樣，在局勢(shì)（α1，β2）下齊王可以得到一千金，而在局勢(shì)（α1，β6）下田忌可以得到一千金。齊王在不同局勢(shì)下的不同得失可用矩陣表示為矩陣中的元素1和3是表示齊王得到的千金數(shù)，同時(shí)也是田忌應(yīng)付的千金數(shù)；-1是齊王應(yīng)付的千金數(shù)，同時(shí)也是田忌所得到的千金數(shù)。對(duì)于矩陣對(duì)策來(lái)說(shuō)，局中人的贏得矩陣給定之后，兩個(gè)局中人就便于各自考慮選取最合適的策略，以謀取最大的收益。一般的，用Ⅰ、Ⅱ表示兩個(gè)局中人，局中人Ⅰ有m個(gè)策略，即α1，α2…，αm；局中人Ⅱ有n個(gè)策略，即β1，β2，…，βn。則局中人Ⅰ、Ⅱ的策略集分別為當(dāng)齊王選取策略α1（上、中、下），田忌選取策13S1＝｛α1，α2，…，αm｝S2＝｛β1，β2，…，βn｝當(dāng)Ⅰ選取策略αi，Ⅱ選取策略βj，就形成一個(gè)局勢(shì)（αi，βj），這時(shí)局中人Ⅰ的收益為αij，局中人Ⅱ的收益為-αij（共有m×n個(gè)局勢(shì)）。矩陣A＝(αij)稱為局中人Ⅰ的贏得矩陣，即當(dāng)局中人Ⅰ、Ⅱ和策略集S1、S2及局中人的贏得矩陣A確定后，一個(gè)矩陣對(duì)策就給定了。通常我們將矩陣對(duì)策記作：G＝｛Ⅰ，Ⅱ；S1，S2；A｝返回S1＝｛α1，α2，…，αm｝148.3矩陣對(duì)策的解法矩陣對(duì)策求解的方法很多，有圖解法、拉格朗日乘數(shù)法、方程組法和線性規(guī)劃法等。本節(jié)給出最常用的求解矩陣對(duì)策的方法：圖解法和線性規(guī)劃法。在介紹這兩種解法前我們首先講解一下關(guān)于矩陣對(duì)策的純策略和混合策略。8.3.1矩陣對(duì)策的純策略當(dāng)矩陣對(duì)策給定后，兩局中人所面臨的問(wèn)題是該問(wèn)題是否存在對(duì)自己最為有利的純策略，如果存在，局中人該如何選取對(duì)自己最為有利的純策略，以及求得在該策略下自己的最大的贏得值（或是最少的損失值）是多少。下面通過(guò)分析具體的矩陣對(duì)策的例子來(lái)回答上述問(wèn)題?！纠?.4】設(shè)有一矩陣對(duì)策，局中人Ⅰ的贏得矩陣為8.3矩陣對(duì)策的解法矩陣對(duì)策求解的方法很多15試研究雙方策略。解由A可以看出，局中人Ⅰ的最大收益值是9，要想達(dá)到這個(gè)目的，他就得選策略α3。然而局中人Ⅱ也在考慮，因?yàn)榫种腥刷裼谐靓?的心理狀態(tài)，要想使自己有較大的贏得，就想選β3作為對(duì)策。這樣不僅使局中人Ⅰ得不到9，反而會(huì)失去10（即得-10）。同樣，局中人Ⅰ也會(huì)想Ⅱ有出β3的可能，于是Ⅰ想出α4來(lái)對(duì)付Ⅱ，使他不但得不到10反而輸?shù)?……這樣一來(lái)，雙方都必然要考慮風(fēng)險(xiǎn)，考慮對(duì)方會(huì)設(shè)法使自己收入最??；因此，都應(yīng)當(dāng)從最壞處著想，去盡量爭(zhēng)取最好的結(jié)果。這就是所謂的保守準(zhǔn)則，保證最小收益，即maxmin準(zhǔn)則。對(duì)局中人Ⅰ來(lái)說(shuō)，若他選擇策略α1，他的收益可能就是-8（當(dāng)Ⅱ選擇策略β3），這是他選擇α1時(shí)能保證得到的最小收益。同樣，他選擇α2、α3、α4時(shí)，能保證得到的最小收益分別是2、-10、-3，即對(duì)應(yīng)行的最小元素；因此，當(dāng)他選擇策略α2時(shí)，他可以保證收益至少為2，而當(dāng)他選擇其他策略時(shí)，他的收益可能少于2。在這個(gè)意義下（也即maxmin準(zhǔn)則），我們說(shuō)α2是Ⅰ的最優(yōu)策略。同樣，局中人Ⅱ選擇策略β1、β2、β3時(shí)，他的損失分別為9、2、6，即對(duì)應(yīng)列的最大元素。因此，他的最優(yōu)策略（按minmax準(zhǔn)則）是β2，可保證損失不超過(guò)2。試研究雙方策略。16結(jié)果，局中人Ⅰ按maxmin準(zhǔn)則選取策略α2，局中人Ⅱ按minmax準(zhǔn)則選取β2，雙方都得到了他們預(yù)想的收益，這是一種最穩(wěn)妥的行為。我們把（α2，β2）稱為對(duì)策G的最優(yōu)局勢(shì)。求最優(yōu)策略的過(guò)程用數(shù)學(xué)式子描述如下：對(duì)局中人Ⅰ來(lái)講，就先在矩陣A每一行元素中取最小值，即第一行：min{-6,1,-8}＝-8第二行：min{3,2,4}＝2第三行：min{9,-1,-10}＝-10第四行：min{-3,0,6}＝-3再?gòu)倪@些最小值中取最大值，即max{-8,2,-10,-3}＝2因此，由上面矩陣A可知，局中人Ⅰ的最優(yōu)策略為α2。對(duì)局中人Ⅱ來(lái)講，先在矩陣A每一列元素中取最大值，即第一列：max{-6,3,9,-3}＝9第二列：max{1,2,-1,0}＝2第三列：max{-8,4,-10,6}＝6再?gòu)倪@些最大值中取最小值，即min{9,2,6}＝2因此，由上面可知，對(duì)局中人Ⅱ來(lái)講最優(yōu)策略為β2。2是對(duì)策G的值，對(duì)策值用VG表示，即VG＝2

結(jié)果，局中人Ⅰ按maxmin準(zhǔn)則選取策略17一般的，設(shè)局中人Ⅰ、Ⅱ都采用保守準(zhǔn)則保證最小收益，即maxmin準(zhǔn)則。那么對(duì)局中人Ⅰ來(lái)說(shuō)，他應(yīng)對(duì)自己每一種可以選擇的策略求出其最小的收益，再選擇最小收益中收益最大的那個(gè)策略。對(duì)贏得矩陣A＝(aij)來(lái)說(shuō)，就是先在每一行中求最小值，再在這些最小值中選出最大值。即

對(duì)局中人Ⅱ來(lái)說(shuō)，A是他的損失矩陣，他的收益是-αij，所以他對(duì)A使用保守準(zhǔn)則時(shí)，應(yīng)當(dāng)先在每一列中求出最大值，再在這些最大值中選擇最小的那個(gè)，即

通過(guò)上面的討論可以看到：在對(duì)策中，局中人Ⅰ、Ⅱ都采用保守準(zhǔn)則，最后出現(xiàn)了一個(gè)平衡局勢(shì)（αi*，βj*），這個(gè)局勢(shì)雙方均可接受，且對(duì)雙方來(lái)說(shuō)都是一個(gè)最穩(wěn)妥的結(jié)果。我們把這個(gè)平衡局勢(shì)（αi*，βj*）稱為鞍點(diǎn)。鞍點(diǎn)的定義：設(shè)對(duì)策G的贏得矩陣為A＝（αij），若，且等于矩陣元素αi*j*；那么，（αi*，βj*）稱為對(duì)策G的一個(gè)鞍點(diǎn)，αi*稱為局中人Ⅰ的最優(yōu)純策略，βj*稱為局中人Ⅱ的最優(yōu)純策略，VG＝αi*j*稱為對(duì)策G的值。=一般的，設(shè)局中人Ⅰ、Ⅱ都采用保守準(zhǔn)則保證最小188.3.2矩陣對(duì)策的混合策略由上面的討論可知，在一個(gè)矩陣對(duì)策A＝（αij）中，局中人Ⅰ能保證最小可得為局中人Ⅱ能保證的最大所失為一般而言，局中人Ⅰ的收益不會(huì)多于局中人Ⅱ的所失，所以總有v1≤v2即有8.3.2矩陣對(duì)策的混合策略由上面的討論可知19若等號(hào)成立，即v1＝v2時(shí)，矩陣對(duì)策在純策略意義下有解，且VG＝v1＝v2。然而，實(shí)際中出現(xiàn)的更多情況是等號(hào)不成立，即為若等號(hào)成立，即v1＝v2時(shí)，矩陣對(duì)策在純策208.3.3矩陣對(duì)策圖示法現(xiàn)在討論矩陣對(duì)策的圖解法，這種方法不僅為贏得矩陣為2×n和m×2階的對(duì)策問(wèn)題提供了一個(gè)直觀的解法而且通過(guò)這種方法的討論可以使我們?cè)趲缀紊侠斫鈱?duì)策論的思想。下面利用例子來(lái)說(shuō)明如何求出最優(yōu)策略?！纠?.8】設(shè)有對(duì)策矩陣，其中矩陣中的元素表示局中人Ⅰ的得分，即試求出每個(gè)局中人的最優(yōu)策略，并問(wèn)其對(duì)策值是多少？解我們知道，在上面對(duì)策中，局中人Ⅰ有2種策略，局中人Ⅱ有3種策略。假定p是局中人Ⅰ選取第一行的概率，那么1－p是他選取第二行的概率。下面依據(jù)p來(lái)計(jì)算局中人Ⅰ的期望收益值。如果局中人選擇第一列，那么局中人Ⅰ的期望收益值等于4p－（1－p），即E1＝5p－1（圖8.2中直線①）類(lèi)似的,若局中人選擇第二列和第三列,則局中人Ⅰ的期望收益值分別為E1＝4－5p（圖8.2中直線②）E1＝2－2p（圖8.2中直線③）8.3.3矩陣對(duì)策圖示法現(xiàn)在討論矩陣對(duì)策的21另外,我們以E1為y軸,p為x軸,作出直線①、直線②和直線③。以局中人Ⅱ的角度來(lái)看，他希望局中人Ⅰ得分盡可能少，因?yàn)檫@樣能使自己得分盡可能多。因此，局中人Ⅱ?qū)⑦x擇這樣的策略（直線）使其高度最低。由于每條直線的高度表示局中人Ⅰ的得分多少。換言之，局中人Ⅱ的最優(yōu)策略即是圖8.2中粗黑的折線A1AA2A3。圖8.2例8.8最優(yōu)策略選擇示意圖另外,我們以E1為y軸,p為x軸,作出直線①22局中人Ⅰ認(rèn)識(shí)到這一點(diǎn)，就將選擇p的值，使自己能獲得更多的分?jǐn)?shù)。這樣p的值出現(xiàn)在直線①和直線③的交點(diǎn)A處，交點(diǎn)坐標(biāo)為p=3/7，E1=8/7于是局中人Ⅰ的最優(yōu)策略是以37的概率選擇第一行和以47的概率選擇第二行。在這種情況下，這個(gè)對(duì)策的值是E1＝8/7。為求出局中人Ⅱ的最優(yōu)策略，要注意局中人Ⅰ的最優(yōu)策略是根據(jù)對(duì)策矩陣的第一列和第三列所計(jì)算出的得分?jǐn)?shù)而得到的，在例8.8的矩陣中刪去第二列所構(gòu)成的矩陣為現(xiàn)在，由式（82）可求出局中人Ⅱ的最優(yōu)策略為q1=2/7,q2=0，q3=5/7于是局中人Ⅱ的最優(yōu)策略是以27的概率選擇第一列，以5/7的概率選擇第三列，而始終不選擇第二列（即被刪除的列）。局中人Ⅰ認(rèn)識(shí)到這一點(diǎn)，就將選擇p的值，使自己238.3.4矩陣對(duì)策線性規(guī)劃法前面討論了圖解法，解決了贏得矩陣為2×n和m×2階對(duì)策問(wèn)題的求解。對(duì)于一般的矩陣對(duì)策問(wèn)題，可以用線性規(guī)劃法來(lái)進(jìn)行求解，因?yàn)檫@種方法可以求解任何矩陣對(duì)策。若一個(gè)矩陣對(duì)策中，局中人Ⅰ的贏得矩陣為A，則他的最優(yōu)混合策略x＝（x1，x2，…,xm）是線性規(guī)劃問(wèn)題的解；而局中人Ⅱ的最優(yōu)策略y＝（y1，y2，…ym）是問(wèn)題8.3.4矩陣對(duì)策線性規(guī)劃法前面討論了圖解法24的解，容易驗(yàn)證問(wèn)題（P）和問(wèn)題（D）是互為對(duì)偶的線性規(guī)劃問(wèn)題。這樣求解矩陣對(duì)策可等價(jià)地轉(zhuǎn)化為對(duì)偶的線性規(guī)劃問(wèn)題（P）和（D）。在問(wèn)題（P）中，令x′I=xi/v1，i＝1，2，…，m（不妨設(shè)v1＞0）（8.3）則問(wèn)題（P）的約束條件變?yōu)榈慕?，容易?yàn)證問(wèn)題（P）和問(wèn)題（D）是互為對(duì)偶25故問(wèn)題（P）等價(jià)于問(wèn)題（P′）同理,令

y′j=yj/v2，j=1,2,…,m（不妨設(shè)v2＞0）（8.4）可知問(wèn)題（D）等價(jià)于問(wèn)題（D′）故問(wèn)題（P）等價(jià)于問(wèn)題（P′）同理,令26顯然問(wèn)題（P′）和（D′）是互為對(duì)偶的線性規(guī)劃，可利用單純形法和對(duì)偶單純形法求解。求解后再通過(guò)式（8.3）和式（8.4）進(jìn)行變換，即可求得矩陣對(duì)策的解和對(duì)策值。返回顯然問(wèn)題（P′）和（D′）是互為對(duì)偶的線性規(guī)劃27知識(shí)歸納1.對(duì)策論主要研究的是決策者在決策主體各方相互作用情況下如何進(jìn)行決策及有關(guān)這種決策的均衡問(wèn)題，它所強(qiáng)調(diào)的是競(jìng)爭(zhēng)。2.對(duì)策模型包括局中人、策略和贏得函數(shù)三個(gè)要素。它是我們研究對(duì)策問(wèn)題的基礎(chǔ)。3.矩陣對(duì)策指對(duì)策中包含兩個(gè)局中人，各自的策略集均由有限個(gè)策略組成，且一方所得恰為對(duì)方所失。其模型（贏得矩陣）為一般記為G＝｛Ⅰ，Ⅱ；S1，S2；A｝。知識(shí)歸納1.對(duì)策論主要研究的是決策者在決策主體各方相284.矩陣對(duì)策的純策略是指其滿足，此時(shí)矩陣有鞍點(diǎn)。5.矩陣對(duì)策的混合策略是指當(dāng)（一般為＜），此時(shí)矩陣無(wú)鞍點(diǎn)，雙方都無(wú)最優(yōu)策略，只能采用混合策略。6.矩陣對(duì)策的解法。（1）如果贏得矩陣有鞍點(diǎn)則通過(guò)maxmin準(zhǔn)則求解。（2）如果贏得矩陣無(wú)鞍點(diǎn)先通過(guò)優(yōu)勢(shì)準(zhǔn)則進(jìn)行簡(jiǎn)化。對(duì)于2×2贏得矩陣直接用下面公式求解。

對(duì)于2×n或m×2贏得矩陣直接用圖解法進(jìn)行求解。對(duì)于一般贏得矩陣采用線性規(guī)劃法進(jìn)行求解。返回4.矩陣對(duì)策的純策略是指其滿足29習(xí)題與思考題

8.1已知A、B兩人進(jìn)行對(duì)抗，A的贏得矩陣如下，求雙方的最優(yōu)策略和對(duì)策值。習(xí)題與思考題8.1已知A、B兩人進(jìn)行對(duì)抗，A308.2用圖解法求下列對(duì)策

人人文庫(kù)> 全部分類(lèi)> 教育資料 > 課件下載

溫馨提示

1. 本站所有資源如無(wú)特殊說(shuō)明，都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請(qǐng)下載最新的WinRAR軟件解壓。
2. 本站的文檔不包含任何第三方提供的附件圖紙等，如果需要附件，請(qǐng)聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
3. 本站RAR壓縮包中若帶圖紙，網(wǎng)頁(yè)內(nèi)容里面會(huì)有圖紙預(yù)覽，若沒(méi)有圖紙預(yù)覽就沒(méi)有圖紙。
4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
5. 人人文庫(kù)網(wǎng)僅提供信息存儲(chǔ)空間，僅對(duì)用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理，對(duì)用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯，并不能對(duì)任何下載內(nèi)容負(fù)責(zé)。
6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容，請(qǐng)與我們聯(lián)系，我們立即糾正。
7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶因使用這些下載資源對(duì)自己和他人造成任何形式的傷害或損失。

對(duì)策問(wèn)題的提出對(duì)策論模型矩陣對(duì)策的解法◎知識(shí)歸納

文檔簡(jiǎn)介

溫馨提示

最新文檔

評(píng)論

對(duì)策問(wèn)題的提出對(duì)策論模型矩陣對(duì)策的解法◎知識(shí)歸納

文檔簡(jiǎn)介

溫馨提示

最新文檔

評(píng)論

相關(guān)文檔