




版權(quán)說(shuō)明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請(qǐng)進(jìn)行舉報(bào)或認(rèn)領(lǐng)
文檔簡(jiǎn)介
8對(duì)策論教學(xué)目的與要求通過(guò)對(duì)本章的學(xué)習(xí),使學(xué)生對(duì)博弈論的產(chǎn)生、發(fā)展和研究現(xiàn)狀有較全面的了解,對(duì)博弈論在現(xiàn)代物流管理中的運(yùn)用有較全面的認(rèn)識(shí),掌握博弈論的概念、特點(diǎn)、分類(lèi)和基本要素,掌握博弈論最基本的矩陣對(duì)策模型的建立,掌握矩陣對(duì)策的純策略和混合策略的運(yùn)用,掌握矩陣對(duì)策中圖解法和線性規(guī)劃解法,能夠運(yùn)用博弈論的方法對(duì)物流管理問(wèn)題進(jìn)行分析、建模并求解。對(duì)策論也稱游戲理論、競(jìng)賽論、博弈論,源自英文“GameTheory”?,F(xiàn)廣為學(xué)術(shù)界接受的是博弈論這一名稱。作為現(xiàn)代數(shù)學(xué)的一個(gè)新分支和運(yùn)籌學(xué)中的一個(gè)重要學(xué)科,它主要研究的是決策者在決策主體各方面相互作用的情況下如何進(jìn)行決策及有關(guān)這種決策的均衡問(wèn)題,其強(qiáng)調(diào)的是決策主體各方策略的相互依存性及其最優(yōu)組合。簡(jiǎn)單地說(shuō)就是對(duì)方如何行動(dòng),而我們又將如何應(yīng)對(duì)。由于它提供了一種研究人類(lèi)理性行為的通用方法,運(yùn)用這些方法可以更為清晰完整地分析各種社會(huì)經(jīng)濟(jì)力量沖突與合作的形勢(shì),因此,博弈論在經(jīng)濟(jì)學(xué)、社會(huì)學(xué)、心理學(xué)、政治學(xué)等各類(lèi)社會(huì)科學(xué)中得到了廣泛運(yùn)用,對(duì)進(jìn)化生物學(xué)和計(jì)算機(jī)科學(xué)等自然科學(xué)也產(chǎn)生了重要影響。8對(duì)策論教學(xué)目的與要求通過(guò)對(duì)本章的學(xué)習(xí),使學(xué)生對(duì)18對(duì)策論8.1對(duì)策問(wèn)題的提出8.2對(duì)策論模型8.3矩陣對(duì)策的解法◎知識(shí)歸納◎習(xí)題與思考題8對(duì)策論8.1對(duì)策問(wèn)題的提出28.1對(duì)策問(wèn)題的提出8.1.1對(duì)策論概述作為一門(mén)現(xiàn)代學(xué)科,博弈論建立的時(shí)間并不長(zhǎng),然而博弈的思想源遠(yuǎn)流長(zhǎng),博弈現(xiàn)象無(wú)處不有。小到棋牌之類(lèi)的游戲,中到經(jīng)濟(jì)生活中的各種交易,大到國(guó)家之間的征伐斗爭(zhēng),無(wú)不涉及人與人之間的斗智。博弈論的產(chǎn)生正是來(lái)自于人類(lèi)對(duì)這種斗智現(xiàn)象的觀察與思考?,F(xiàn)代博弈論起源于19世紀(jì)末20世紀(jì)初,二戰(zhàn)后發(fā)展成為一門(mén)完整而豐富的理論學(xué)科。學(xué)術(shù)界一般將其發(fā)展歷程分為以下幾個(gè)階段:(1)萌芽階段從19世紀(jì)末到20世紀(jì)30年代可以說(shuō)是博弈論的萌芽期,表現(xiàn)為學(xué)者們對(duì)社會(huì)經(jīng)濟(jì)理論和現(xiàn)實(shí)的一些思考,研究者以數(shù)學(xué)家為主。(2)產(chǎn)生階段20世紀(jì)四五十年代可說(shuō)是博弈論的體系建立時(shí)期。1944年諾依曼和摩根斯坦的巨著《博弈論和經(jīng)濟(jì)行為》的出版,標(biāo)志著博弈論作為一門(mén)學(xué)科的建立,也被視為數(shù)理經(jīng)濟(jì)學(xué)學(xué)科建立的里程碑。巨著出版前后的若干年中,合作博弈理論的研究得到了迅速的發(fā)展,提出了各種概念,并在20世紀(jì)50年代達(dá)到了研究的高峰。不久,庫(kù)克于1950年定義了“囚徒的困境”,納什在1950年和1951年發(fā)表了兩篇關(guān)于非合作博弈的重要文章,這兩位學(xué)者的研究工作,特別是納什的研究工作奠定了非合作博弈論的基礎(chǔ),所提出的納什均衡概念,在非合作博弈論中起著核心作用。8.1對(duì)策問(wèn)題的提出8.1.1對(duì)策論概述作3(3)發(fā)展階段20世紀(jì)60至80年代是博弈論體系的發(fā)展壯大時(shí)期。一方面,研究的領(lǐng)域從軍事戰(zhàn)略戰(zhàn)術(shù)問(wèn)題推廣應(yīng)用到經(jīng)濟(jì)領(lǐng)域;另一方面,研究的內(nèi)容也不斷發(fā)展出新。合作博弈理論繼續(xù)得到充實(shí)和豐富,而非合作博弈理論更是發(fā)展迅速,成為博弈論研究和應(yīng)用的主流。(4)成熟階段20世紀(jì)80年代至今是博弈論的完善和應(yīng)用期。此間博弈論本身發(fā)展成為了一個(gè)相對(duì)完善、內(nèi)容豐富的理論體系,羽翼已豐的非合作博弈理論在理論研究和實(shí)踐應(yīng)用中都占據(jù)了主導(dǎo)地位。更重要的是,博弈理論在各種經(jīng)濟(jì)學(xué)科中都得到了深入的應(yīng)用,在政治學(xué)、生物學(xué)、計(jì)算機(jī)科學(xué)、道德哲學(xué)、社會(huì)學(xué)等領(lǐng)域內(nèi)也產(chǎn)生了重要影響。1994年,納什、澤爾騰、海薩尼三人因博弈論及其在經(jīng)濟(jì)應(yīng)用方面的突出貢獻(xiàn)而榮獲諾貝爾經(jīng)濟(jì)學(xué)獎(jiǎng),1996年諾貝爾經(jīng)濟(jì)學(xué)獎(jiǎng)再度授予了在博弈論研究方面作出突出貢獻(xiàn)的維克里和莫里斯。由此,吸引了更多的學(xué)者投入到博弈論的研究當(dāng)中,使得博弈論成為世界范圍內(nèi)的研究熱點(diǎn),博弈論也逐步趨于完善和成熟。2001年,研究博弈論的學(xué)者再一次獲得諾貝爾經(jīng)濟(jì)學(xué)獎(jiǎng)。美國(guó)教授喬治·阿克爾洛夫、邁克爾·斯彭斯和約瑟夫·斯蒂格利茨在20世紀(jì)70年代奠定了對(duì)充滿不對(duì)稱信息市場(chǎng)進(jìn)行分析的理論基礎(chǔ),正是由于他們?cè)凇皩?duì)充滿不對(duì)稱信息市場(chǎng)進(jìn)行分析”領(lǐng)域所做出的重要貢獻(xiàn),而分享了2001年諾貝爾經(jīng)濟(jì)學(xué)獎(jiǎng)。
(3)發(fā)展階段48.1.2對(duì)策論在現(xiàn)代物流管理中的運(yùn)用在現(xiàn)代物流管理實(shí)踐中,決策者們?yōu)榱酥\求自身的不斷發(fā)展,保持自身的競(jìng)爭(zhēng)優(yōu)勢(shì),必須不斷地審時(shí)度勢(shì)、不停地進(jìn)行選擇和作出決定,以保證最大限度地降低物流成本、提高物流效率及服務(wù)水平。他們的選擇和決定會(huì)影響到競(jìng)爭(zhēng)對(duì)手的決策結(jié)果,同樣競(jìng)爭(zhēng)對(duì)手的選擇和決定也直接影響著他們的決策結(jié)果。也就是說(shuō),決策者在決策時(shí)必須要考慮到對(duì)手的策略,因此,博弈論的思想已完全融入到現(xiàn)代物流管理的每一個(gè)環(huán)節(jié)中。博弈論在現(xiàn)代物流管理中的運(yùn)用主要有物流項(xiàng)目投資、物流市場(chǎng)競(jìng)爭(zhēng)對(duì)策、物流服務(wù)價(jià)格策略、物流中心選址、物流運(yùn)輸規(guī)劃、物流倉(cāng)儲(chǔ)優(yōu)化等內(nèi)容。以下僅就本書(shū)涉及到的有關(guān)博弈論中矩陣對(duì)策的例子作簡(jiǎn)要介紹。(1)物流市場(chǎng)競(jìng)爭(zhēng)博弈【例8.1】?jī)蓚€(gè)競(jìng)爭(zhēng)對(duì)手A公司和B公司,都計(jì)劃在某一個(gè)城市增加產(chǎn)品的銷(xiāo)售點(diǎn),地點(diǎn)可選擇安排在城市中心或城市郊區(qū)。如果兩個(gè)對(duì)手都決定在城市中心建立銷(xiāo)售點(diǎn),那么每年A公司產(chǎn)品的利潤(rùn)要比B公司產(chǎn)品的利潤(rùn)多10000元;如果兩個(gè)公司都決定在城市郊區(qū)建立銷(xiāo)售點(diǎn),那么A公司產(chǎn)品的利潤(rùn)要比B公司產(chǎn)品的利潤(rùn)要少20000元;如果A公司安排在城市郊區(qū),而B(niǎo)公司安排在城市中心,那么A公司的利潤(rùn)要比B公司的利潤(rùn)多40000元;如果A公司安排在城市中心,而B(niǎo)公司安排在城市郊區(qū),那么A公司的利潤(rùn)要比B公司少30000元。試問(wèn)各公司安排銷(xiāo)售點(diǎn)的最好位置是哪里?在選擇自己銷(xiāo)售點(diǎn)位置時(shí),不得不考慮對(duì)手銷(xiāo)售點(diǎn)的選擇,因?yàn)樗鼘?duì)我們的銷(xiāo)售會(huì)產(chǎn)生很大的影響。最好位置的含義是使雙方都能發(fā)揮最大的能力,而不是使總銷(xiāo)售額達(dá)到最高,當(dāng)然,所謂“最好”在這里也是相對(duì)的。此外對(duì)位置的選擇可以有不同的解釋,這就是博弈了。8.1.2對(duì)策論在現(xiàn)代物流管理中的運(yùn)用在現(xiàn)5(2)物流倉(cāng)儲(chǔ)優(yōu)化策略【例8.2】一倉(cāng)儲(chǔ)供應(yīng)中心為其下游的一家生產(chǎn)企業(yè)供應(yīng)某種原料。生產(chǎn)企業(yè)根據(jù)產(chǎn)品訂單情況對(duì)原料的需求進(jìn)行分析,分別有淡季、旺季和正常三種情況,在正常情況下需要原料15噸,在淡季和旺季情況下分別需要原料10噸和20噸;而原料的價(jià)格與原料市場(chǎng)的需求有關(guān),在淡季、正常、旺季三種情況下,每噸原料的價(jià)格分別為100元、150元和200元,已知此時(shí)每噸原料的價(jià)格為100元。問(wèn)在生產(chǎn)企業(yè)對(duì)原料的需求沒(méi)有確定預(yù)知的條件下,此時(shí)應(yīng)采購(gòu)多少噸原料才能使倉(cāng)儲(chǔ)供應(yīng)中心的總成本最少(不計(jì)存儲(chǔ)費(fèi)用)?這個(gè)問(wèn)題可看成一個(gè)博弈問(wèn)題。即倉(cāng)儲(chǔ)供應(yīng)中心針對(duì)可能出現(xiàn)的三種不同的原料需求狀況,運(yùn)用三種儲(chǔ)量策略來(lái)進(jìn)行應(yīng)對(duì),通過(guò)對(duì)各種情況下成本費(fèi)用的計(jì)算,找出最佳的策略來(lái)。在現(xiàn)代物流管理中,這種不同策略的相互應(yīng)對(duì)非常普遍,如投資與外包等。(3)物流運(yùn)輸對(duì)策分析【例8.3】甲、乙兩個(gè)貨物運(yùn)輸公司在同一地區(qū)從事運(yùn)輸。兩個(gè)公司都想通過(guò)改革經(jīng)營(yíng)管理以獲取更多運(yùn)輸市場(chǎng)的份額。甲公司考慮的策略措施有:①降低運(yùn)輸價(jià)格;②提高運(yùn)輸質(zhì)量;③推出新的運(yùn)輸方式。乙公司考慮的策略措施有:①增加廣告費(fèi)用;②增設(shè)服務(wù)網(wǎng);③改進(jìn)原有設(shè)備。假定市場(chǎng)份額一定,由于各自采取的策略措施不同,相應(yīng)的兩個(gè)公司的市場(chǎng)占有份額將會(huì)發(fā)生變化。如經(jīng)預(yù)測(cè),當(dāng)甲公司采用①策略,乙公司采用①策略時(shí),甲公司市場(chǎng)份額會(huì)有10%的增長(zhǎng),相應(yīng)還會(huì)有其他各種策略對(duì)應(yīng)的預(yù)測(cè)值。那么甲、乙兩公司的選擇是什么呢?和上面的例題一樣,我們通過(guò)競(jìng)爭(zhēng)對(duì)策分析,就可以確定兩個(gè)公司各自的最優(yōu)策略了。由此可見(jiàn),博弈就是競(jìng)爭(zhēng)過(guò)程中,參與競(jìng)爭(zhēng)者理性地選擇自身策略的過(guò)程。那么有效地預(yù)測(cè)對(duì)手的策略,全面地分析策略的得失,是博弈取勝的關(guān)鍵。返回(2)物流倉(cāng)儲(chǔ)優(yōu)化策略返回68.2對(duì)策論模型博弈論分析的是人們進(jìn)行決策時(shí)策略選擇的相互影響,現(xiàn)實(shí)中存在著極其多樣的這種形勢(shì)。為了進(jìn)行規(guī)范分析,有必要從中抽象出最基本的組成要素構(gòu)成最簡(jiǎn)單的模型,利用數(shù)學(xué)工具進(jìn)行求解,分析結(jié)論的現(xiàn)實(shí)意義,然后再逐步加入更復(fù)雜的因素,使模型更能描述現(xiàn)實(shí)。這樣最簡(jiǎn)單的對(duì)策模型,一般都有以下三個(gè)基本要素。8.2.1對(duì)策模型的基本要素(1)局中人在一個(gè)對(duì)策行為中,有權(quán)決定自己行動(dòng)方案的對(duì)策參加者被稱為局中人。局中人除了理解為個(gè)人外還可以理解為集體,如球隊(duì)、交戰(zhàn)國(guó)、企業(yè)公司等,也可以把大自然理解為局中人(因?yàn)槿祟?lèi)經(jīng)常處于和大自然斗爭(zhēng)的狀態(tài)中);另外,還假定局中人都是聰明的,有理智的和利己的。同時(shí),為使所研究的問(wèn)題更加清晰,把那些利益完全一致的參加者們看做一個(gè)局中人,因?yàn)樗麄兝σ恢?,必使他們齊心合力,相互配合行動(dòng)如一個(gè)人。例如,橋牌游戲中,東西雙方利益一致,南北兩方得失相當(dāng),所以雖有四人參加,只能算有兩個(gè)局中人。一個(gè)對(duì)策中一般要求至少有兩個(gè)局中人。每個(gè)局中人用i表示,局中人的集合用字母I表示,則I={1,2,…,n}。我們稱只有兩個(gè)局中人的對(duì)策現(xiàn)象為“兩人對(duì)策”,如象棋、橋牌等,顯然上述齊王賽馬中局中人也是兩人,即I={1,2}。而多于兩個(gè)局中人的對(duì)策稱為“多人對(duì)策”。另外根據(jù)局中人之間是否允許進(jìn)行合作,還可有“結(jié)盟對(duì)策”和“不結(jié)盟對(duì)策”,或稱為“合作博弈”和“非合作博弈”。8.2對(duì)策論模型博弈論分析的是人們進(jìn)行決策時(shí)7(2)策略在一局對(duì)策中,可供局中人選擇的一個(gè)實(shí)際可行的自始至終通盤(pán)籌劃的完整行動(dòng)方案稱為這個(gè)局中人的一個(gè)“策略”。參加對(duì)策的局中人i(i∈I)的所有可供選擇的策略的全體所構(gòu)成的集合叫做局中人i的“策略集”,簡(jiǎn)記作Si。(3)贏得函數(shù)一局對(duì)策結(jié)束之后,對(duì)每個(gè)局中人來(lái)說(shuō),不外乎是勝利或失敗,名次的前后,以及其他物質(zhì)的收入或支出等,這些可以統(tǒng)稱為“得失”或“益損”。在齊王與田忌賽馬的例子中,最后田忌贏得一千金,而齊王損失一千金,即為這局對(duì)策(結(jié)局時(shí))雙方的“得失”。實(shí)際上,每個(gè)局中人在一局對(duì)策結(jié)束時(shí)的得失,與局中人所選定的策略有關(guān)。例如,上述賽馬的例子中,當(dāng)齊王出策略“上、中、下”,田忌出策略“下、上、中”時(shí),田忌得千金;而如果與田忌都出策略“上、中、下”時(shí),田忌就得付出三千金了。因此,在一局對(duì)策中,當(dāng)局勢(shì)給定以后,對(duì)策的結(jié)果也就確定了。一局對(duì)策結(jié)束時(shí),每個(gè)局中人的“得失”是全體局中人所決定的一組策略即“局勢(shì)”的函數(shù),我們稱之為“贏得函數(shù)”。在最終局勢(shì)ω下,局中人i∈I的贏得函數(shù)記作:H(i,ω)。在一局對(duì)策中,如果在任一“局勢(shì)”中,全體局中人的“得失”相加總和為零,就稱該對(duì)策為“零和對(duì)策”,否則,就稱為“非零和對(duì)策”。上述齊王與田忌賽馬的例子中,不論比賽雙方的策略如何,比賽的結(jié)果,一方的所得必為另一方的所失,因此該對(duì)策就是一個(gè)零和對(duì)策。一般來(lái)說(shuō),當(dāng)上述三個(gè)基本要素確定以后,一個(gè)對(duì)策模型就確定了。(2)策略88.2.2對(duì)策的分類(lèi)對(duì)策的種類(lèi)很多,可以依據(jù)不同的原則進(jìn)行分類(lèi)。如前所述,根據(jù)參與博弈的局中人的數(shù)量可分為二人對(duì)策和多人對(duì)策;根據(jù)局中人之間是否允許進(jìn)行合作(一般是多人博弈中),可分為合作博弈和非合作博弈;根據(jù)局中人策略集中策略的有限或無(wú)限,可分為有限對(duì)策和無(wú)限對(duì)策;根據(jù)各局中人贏得函數(shù)值的和是否為零,可分為零和對(duì)策和非零和對(duì)策,非零和又可分為常和對(duì)策與變和對(duì)策;此外,根據(jù)對(duì)策與時(shí)間的關(guān)系可將凈對(duì)策分為靜態(tài)對(duì)策和動(dòng)態(tài)對(duì)策;根據(jù)大家是否都清楚各種對(duì)局情況下每個(gè)局中人的得益,可分為完全信息對(duì)策和不完全信息對(duì)策;根據(jù)對(duì)策的數(shù)學(xué)模型的類(lèi)型可分為矩陣對(duì)策、連續(xù)對(duì)策、微分對(duì)策、陣地對(duì)策、隨機(jī)對(duì)策等。目前世界比較流行的一種分類(lèi)方式是把靜態(tài)與動(dòng)態(tài)、完全信息與不完全信息這四種基本的對(duì)策組合起來(lái)形成四類(lèi)博弈:完全信息靜態(tài)博弈,完全信息動(dòng)態(tài)博弈,不完全信息靜態(tài)博弈,不完全信息動(dòng)態(tài)博弈。完全信息是指博弈中的決策者對(duì)于博弈整體結(jié)構(gòu)有著充分的了解,唯一需要考慮的就是策略選擇問(wèn)題;不完全信息則是指博弈中的決策者對(duì)博弈結(jié)構(gòu)中某些部分的了解不充分;靜態(tài)博弈是指博弈中每個(gè)決策者的策略選擇僅進(jìn)行一次,在選擇時(shí)不知道其他人的策略選擇;動(dòng)態(tài)博弈則引入了決策的先后次序,局中人在進(jìn)行選擇時(shí)可以得到關(guān)于行動(dòng)歷史的一些信息。這四類(lèi)博弈一個(gè)比一個(gè)精彩,也一個(gè)比一個(gè)難。主要對(duì)策模型的分類(lèi)見(jiàn)圖8.1。8.2.2對(duì)策的分類(lèi)對(duì)策的種類(lèi)很多,可以依9圖8.1對(duì)策模型分類(lèi)圖8.1對(duì)策模型分類(lèi)10在眾多的對(duì)策模型中,完全信息靜態(tài)模型中的有限二人零和對(duì)策占有重要地位。這類(lèi)對(duì)策也叫矩陣對(duì)策,它是到目前為止在理論研究和求解方法方面都比較完善的一類(lèi)對(duì)策,而且這類(lèi)對(duì)策的研究思想和理論結(jié)果又是研究其他對(duì)策模型的基礎(chǔ)。這里我們僅討論矩陣對(duì)策模型。在眾多的對(duì)策模型中,完全信息靜態(tài)模型中的有限二118.2.3矩陣對(duì)策的基本模型矩陣對(duì)策是指對(duì)策中只有兩個(gè)局中人,每個(gè)局中人各有有限個(gè)可供選擇的策略。在每個(gè)對(duì)局中,兩個(gè)局中人獨(dú)立的選擇一個(gè)策略(互相都不知道對(duì)方所選的策略),而兩人的收益總和(“得失”相加)為零。這種對(duì)策中,兩個(gè)局中人的利益是完全相反的,即一個(gè)局中人的贏得值恰好是另一個(gè)人所損失的值。局中人雙方的利益是沖突的,因此不存在合作的可能,所以矩陣對(duì)策又稱為有限對(duì)抗對(duì)策。這種對(duì)策比較簡(jiǎn)單,在理論上也比較成熟,而且這些理論奠定了研究“對(duì)策現(xiàn)象”的基本思路,所以矩陣對(duì)策是對(duì)策論的基礎(chǔ)。下面繼續(xù)討論齊王賽馬的例子:以α1(上、中、下)表示齊王以“先用上等馬、再用中等馬、最后用下等馬”次序參加比賽。也就是說(shuō)它是齊王的一個(gè)策略。于是齊王共有6個(gè)策略(3的全排列P3=3?。?×2×1=6),即:α1(上、中、下)α2(上、下、中)α3(中、上、下)α4(中、下、上)α5(下、中、上)α6(下、上、中)同理,對(duì)田忌來(lái)講也有6個(gè)策略,分別是:β1(上、中、下)β2(上、下、中)β3(中、上、下)β4(中、下、上)β5(下、中、上)β6(下、上、中)8.2.3矩陣對(duì)策的基本模型矩陣對(duì)策是指對(duì)策12當(dāng)齊王選取策略α1(上、中、下),田忌選取策略β1(上、中、下)進(jìn)行比賽,就形成了一個(gè)局勢(shì)(α1,β1)。這時(shí)由于在同級(jí)的馬中,田忌的馬不如齊王的馬,所以齊王在這一局勢(shì)下每個(gè)等級(jí)的馬都勝過(guò)田忌的馬,齊王可以得到三千金。同樣,在局勢(shì)(α1,β2)下齊王可以得到一千金,而在局勢(shì)(α1,β6)下田忌可以得到一千金。齊王在不同局勢(shì)下的不同得失可用矩陣表示為矩陣中的元素1和3是表示齊王得到的千金數(shù),同時(shí)也是田忌應(yīng)付的千金數(shù);-1是齊王應(yīng)付的千金數(shù),同時(shí)也是田忌所得到的千金數(shù)。對(duì)于矩陣對(duì)策來(lái)說(shuō),局中人的贏得矩陣給定之后,兩個(gè)局中人就便于各自考慮選取最合適的策略,以謀取最大的收益。一般的,用Ⅰ、Ⅱ表示兩個(gè)局中人,局中人Ⅰ有m個(gè)策略,即α1,α2…,αm;局中人Ⅱ有n個(gè)策略,即β1,β2,…,βn。則局中人Ⅰ、Ⅱ的策略集分別為當(dāng)齊王選取策略α1(上、中、下),田忌選取策13S1={α1,α2,…,αm}S2={β1,β2,…,βn}當(dāng)Ⅰ選取策略αi,Ⅱ選取策略βj,就形成一個(gè)局勢(shì)(αi,βj),這時(shí)局中人Ⅰ的收益為αij,局中人Ⅱ的收益為-αij(共有m×n個(gè)局勢(shì))。矩陣A=(αij)稱為局中人Ⅰ的贏得矩陣,即當(dāng)局中人Ⅰ、Ⅱ和策略集S1、S2及局中人的贏得矩陣A確定后,一個(gè)矩陣對(duì)策就給定了。通常我們將矩陣對(duì)策記作:G={Ⅰ,Ⅱ;S1,S2;A}返回S1={α1,α2,…,αm}148.3矩陣對(duì)策的解法矩陣對(duì)策求解的方法很多,有圖解法、拉格朗日乘數(shù)法、方程組法和線性規(guī)劃法等。本節(jié)給出最常用的求解矩陣對(duì)策的方法:圖解法和線性規(guī)劃法。在介紹這兩種解法前我們首先講解一下關(guān)于矩陣對(duì)策的純策略和混合策略。8.3.1矩陣對(duì)策的純策略當(dāng)矩陣對(duì)策給定后,兩局中人所面臨的問(wèn)題是該問(wèn)題是否存在對(duì)自己最為有利的純策略,如果存在,局中人該如何選取對(duì)自己最為有利的純策略,以及求得在該策略下自己的最大的贏得值(或是最少的損失值)是多少。下面通過(guò)分析具體的矩陣對(duì)策的例子來(lái)回答上述問(wèn)題?!纠?.4】設(shè)有一矩陣對(duì)策,局中人Ⅰ的贏得矩陣為8.3矩陣對(duì)策的解法矩陣對(duì)策求解的方法很多15試研究雙方策略。解由A可以看出,局中人Ⅰ的最大收益值是9,要想達(dá)到這個(gè)目的,他就得選策略α3。然而局中人Ⅱ也在考慮,因?yàn)榫种腥刷裼谐靓?的心理狀態(tài),要想使自己有較大的贏得,就想選β3作為對(duì)策。這樣不僅使局中人Ⅰ得不到9,反而會(huì)失去10(即得-10)。同樣,局中人Ⅰ也會(huì)想Ⅱ有出β3的可能,于是Ⅰ想出α4來(lái)對(duì)付Ⅱ,使他不但得不到10反而輸?shù)?……這樣一來(lái),雙方都必然要考慮風(fēng)險(xiǎn),考慮對(duì)方會(huì)設(shè)法使自己收入最??;因此,都應(yīng)當(dāng)從最壞處著想,去盡量爭(zhēng)取最好的結(jié)果。這就是所謂的保守準(zhǔn)則,保證最小收益,即maxmin準(zhǔn)則。對(duì)局中人Ⅰ來(lái)說(shuō),若他選擇策略α1,他的收益可能就是-8(當(dāng)Ⅱ選擇策略β3),這是他選擇α1時(shí)能保證得到的最小收益。同樣,他選擇α2、α3、α4時(shí),能保證得到的最小收益分別是2、-10、-3,即對(duì)應(yīng)行的最小元素;因此,當(dāng)他選擇策略α2時(shí),他可以保證收益至少為2,而當(dāng)他選擇其他策略時(shí),他的收益可能少于2。在這個(gè)意義下(也即maxmin準(zhǔn)則),我們說(shuō)α2是Ⅰ的最優(yōu)策略。同樣,局中人Ⅱ選擇策略β1、β2、β3時(shí),他的損失分別為9、2、6,即對(duì)應(yīng)列的最大元素。因此,他的最優(yōu)策略(按minmax準(zhǔn)則)是β2,可保證損失不超過(guò)2。試研究雙方策略。16結(jié)果,局中人Ⅰ按maxmin準(zhǔn)則選取策略α2,局中人Ⅱ按minmax準(zhǔn)則選取β2,雙方都得到了他們預(yù)想的收益,這是一種最穩(wěn)妥的行為。我們把(α2,β2)稱為對(duì)策G的最優(yōu)局勢(shì)。求最優(yōu)策略的過(guò)程用數(shù)學(xué)式子描述如下:對(duì)局中人Ⅰ來(lái)講,就先在矩陣A每一行元素中取最小值,即第一行:min{-6,1,-8}=-8第二行:min{3,2,4}=2第三行:min{9,-1,-10}=-10第四行:min{-3,0,6}=-3再?gòu)倪@些最小值中取最大值,即max{-8,2,-10,-3}=2因此,由上面矩陣A可知,局中人Ⅰ的最優(yōu)策略為α2。對(duì)局中人Ⅱ來(lái)講,先在矩陣A每一列元素中取最大值,即第一列:max{-6,3,9,-3}=9第二列:max{1,2,-1,0}=2第三列:max{-8,4,-10,6}=6再?gòu)倪@些最大值中取最小值,即min{9,2,6}=2因此,由上面可知,對(duì)局中人Ⅱ來(lái)講最優(yōu)策略為β2。2是對(duì)策G的值,對(duì)策值用VG表示,即VG=2
結(jié)果,局中人Ⅰ按maxmin準(zhǔn)則選取策略17一般的,設(shè)局中人Ⅰ、Ⅱ都采用保守準(zhǔn)則保證最小收益,即maxmin準(zhǔn)則。那么對(duì)局中人Ⅰ來(lái)說(shuō),他應(yīng)對(duì)自己每一種可以選擇的策略求出其最小的收益,再選擇最小收益中收益最大的那個(gè)策略。對(duì)贏得矩陣A=(aij)來(lái)說(shuō),就是先在每一行中求最小值,再在這些最小值中選出最大值。即
對(duì)局中人Ⅱ來(lái)說(shuō),A是他的損失矩陣,他的收益是-αij,所以他對(duì)A使用保守準(zhǔn)則時(shí),應(yīng)當(dāng)先在每一列中求出最大值,再在這些最大值中選擇最小的那個(gè),即
通過(guò)上面的討論可以看到:在對(duì)策中,局中人Ⅰ、Ⅱ都采用保守準(zhǔn)則,最后出現(xiàn)了一個(gè)平衡局勢(shì)(αi*,βj*),這個(gè)局勢(shì)雙方均可接受,且對(duì)雙方來(lái)說(shuō)都是一個(gè)最穩(wěn)妥的結(jié)果。我們把這個(gè)平衡局勢(shì)(αi*,βj*)稱為鞍點(diǎn)。鞍點(diǎn)的定義:設(shè)對(duì)策G的贏得矩陣為A=(αij),若,且等于矩陣元素αi*j*;那么,(αi*,βj*)稱為對(duì)策G的一個(gè)鞍點(diǎn),αi*稱為局中人Ⅰ的最優(yōu)純策略,βj*稱為局中人Ⅱ的最優(yōu)純策略,VG=αi*j*稱為對(duì)策G的值。=一般的,設(shè)局中人Ⅰ、Ⅱ都采用保守準(zhǔn)則保證最小188.3.2矩陣對(duì)策的混合策略由上面的討論可知,在一個(gè)矩陣對(duì)策A=(αij)中,局中人Ⅰ能保證最小可得為局中人Ⅱ能保證的最大所失為一般而言,局中人Ⅰ的收益不會(huì)多于局中人Ⅱ的所失,所以總有v1≤v2即有8.3.2矩陣對(duì)策的混合策略由上面的討論可知19若等號(hào)成立,即v1=v2時(shí),矩陣對(duì)策在純策略意義下有解,且VG=v1=v2。然而,實(shí)際中出現(xiàn)的更多情況是等號(hào)不成立,即為若等號(hào)成立,即v1=v2時(shí),矩陣對(duì)策在純策208.3.3矩陣對(duì)策圖示法現(xiàn)在討論矩陣對(duì)策的圖解法,這種方法不僅為贏得矩陣為2×n和m×2階的對(duì)策問(wèn)題提供了一個(gè)直觀的解法而且通過(guò)這種方法的討論可以使我們?cè)趲缀紊侠斫鈱?duì)策論的思想。下面利用例子來(lái)說(shuō)明如何求出最優(yōu)策略?!纠?.8】設(shè)有對(duì)策矩陣,其中矩陣中的元素表示局中人Ⅰ的得分,即試求出每個(gè)局中人的最優(yōu)策略,并問(wèn)其對(duì)策值是多少?解我們知道,在上面對(duì)策中,局中人Ⅰ有2種策略,局中人Ⅱ有3種策略。假定p是局中人Ⅰ選取第一行的概率,那么1-p是他選取第二行的概率。下面依據(jù)p來(lái)計(jì)算局中人Ⅰ的期望收益值。如果局中人選擇第一列,那么局中人Ⅰ的期望收益值等于4p-(1-p),即E1=5p-1(圖8.2中直線①)類(lèi)似的,若局中人選擇第二列和第三列,則局中人Ⅰ的期望收益值分別為E1=4-5p(圖8.2中直線②)E1=2-2p(圖8.2中直線③)8.3.3矩陣對(duì)策圖示法現(xiàn)在討論矩陣對(duì)策的21另外,我們以E1為y軸,p為x軸,作出直線①、直線②和直線③。以局中人Ⅱ的角度來(lái)看,他希望局中人Ⅰ得分盡可能少,因?yàn)檫@樣能使自己得分盡可能多。因此,局中人Ⅱ?qū)⑦x擇這樣的策略(直線)使其高度最低。由于每條直線的高度表示局中人Ⅰ的得分多少。換言之,局中人Ⅱ的最優(yōu)策略即是圖8.2中粗黑的折線A1AA2A3。圖8.2例8.8最優(yōu)策略選擇示意圖另外,我們以E1為y軸,p為x軸,作出直線①22局中人Ⅰ認(rèn)識(shí)到這一點(diǎn),就將選擇p的值,使自己能獲得更多的分?jǐn)?shù)。這樣p的值出現(xiàn)在直線①和直線③的交點(diǎn)A處,交點(diǎn)坐標(biāo)為p=3/7,E1=8/7于是局中人Ⅰ的最優(yōu)策略是以37的概率選擇第一行和以47的概率選擇第二行。在這種情況下,這個(gè)對(duì)策的值是E1=8/7。為求出局中人Ⅱ的最優(yōu)策略,要注意局中人Ⅰ的最優(yōu)策略是根據(jù)對(duì)策矩陣的第一列和第三列所計(jì)算出的得分?jǐn)?shù)而得到的,在例8.8的矩陣中刪去第二列所構(gòu)成的矩陣為現(xiàn)在,由式(82)可求出局中人Ⅱ的最優(yōu)策略為q1=2/7,q2=0,q3=5/7于是局中人Ⅱ的最優(yōu)策略是以27的概率選擇第一列,以5/7的概率選擇第三列,而始終不選擇第二列(即被刪除的列)。局中人Ⅰ認(rèn)識(shí)到這一點(diǎn),就將選擇p的值,使自己238.3.4矩陣對(duì)策線性規(guī)劃法前面討論了圖解法,解決了贏得矩陣為2×n和m×2階對(duì)策問(wèn)題的求解。對(duì)于一般的矩陣對(duì)策問(wèn)題,可以用線性規(guī)劃法來(lái)進(jìn)行求解,因?yàn)檫@種方法可以求解任何矩陣對(duì)策。若一個(gè)矩陣對(duì)策中,局中人Ⅰ的贏得矩陣為A,則他的最優(yōu)混合策略x=(x1,x2,…,xm)是線性規(guī)劃問(wèn)題的解;而局中人Ⅱ的最優(yōu)策略y=(y1,y2,…ym)是問(wèn)題8.3.4矩陣對(duì)策線性規(guī)劃法前面討論了圖解法24的解,容易驗(yàn)證問(wèn)題(P)和問(wèn)題(D)是互為對(duì)偶的線性規(guī)劃問(wèn)題。這樣求解矩陣對(duì)策可等價(jià)地轉(zhuǎn)化為對(duì)偶的線性規(guī)劃問(wèn)題(P)和(D)。在問(wèn)題(P)中,令x′I=xi/v1,i=1,2,…,m(不妨設(shè)v1>0)(8.3)則問(wèn)題(P)的約束條件變?yōu)榈慕?,容易?yàn)證問(wèn)題(P)和問(wèn)題(D)是互為對(duì)偶25故問(wèn)題(P)等價(jià)于問(wèn)題(P′)同理,令
y′j=yj/v2,j=1,2,…,m(不妨設(shè)v2>0)(8.4)可知問(wèn)題(D)等價(jià)于問(wèn)題(D′)故問(wèn)題(P)等價(jià)于問(wèn)題(P′)同理,令26顯然問(wèn)題(P′)和(D′)是互為對(duì)偶的線性規(guī)劃,可利用單純形法和對(duì)偶單純形法求解。求解后再通過(guò)式(8.3)和式(8.4)進(jìn)行變換,即可求得矩陣對(duì)策的解和對(duì)策值。返回顯然問(wèn)題(P′)和(D′)是互為對(duì)偶的線性規(guī)劃27知識(shí)歸納1.對(duì)策論主要研究的是決策者在決策主體各方相互作用情況下如何進(jìn)行決策及有關(guān)這種決策的均衡問(wèn)題,它所強(qiáng)調(diào)的是競(jìng)爭(zhēng)。2.對(duì)策模型包括局中人、策略和贏得函數(shù)三個(gè)要素。它是我們研究對(duì)策問(wèn)題的基礎(chǔ)。3.矩陣對(duì)策指對(duì)策中包含兩個(gè)局中人,各自的策略集均由有限個(gè)策略組成,且一方所得恰為對(duì)方所失。其模型(贏得矩陣)為一般記為G={Ⅰ,Ⅱ;S1,S2;A}。知識(shí)歸納1.對(duì)策論主要研究的是決策者在決策主體各方相284.矩陣對(duì)策的純策略是指其滿足,此時(shí)矩陣有鞍點(diǎn)。5.矩陣對(duì)策的混合策略是指當(dāng)(一般為<),此時(shí)矩陣無(wú)鞍點(diǎn),雙方都無(wú)最優(yōu)策略,只能采用混合策略。6.矩陣對(duì)策的解法。(1)如果贏得矩陣有鞍點(diǎn)則通過(guò)maxmin準(zhǔn)則求解。(2)如果贏得矩陣無(wú)鞍點(diǎn)先通過(guò)優(yōu)勢(shì)準(zhǔn)則進(jìn)行簡(jiǎn)化。對(duì)于2×2贏得矩陣直接用下面公式求解。
對(duì)于2×n或m×2贏得矩陣直接用圖解法進(jìn)行求解。對(duì)于一般贏得矩陣采用線性規(guī)劃法進(jìn)行求解。返回4.矩陣對(duì)策的純策略是指其滿足29習(xí)題與思考題
8.1已知A、B兩人進(jìn)行對(duì)抗,A的贏得矩陣如下,求雙方的最優(yōu)策略和對(duì)策值。習(xí)題與思考題8.1已知A、B兩人進(jìn)行對(duì)抗,A308.2用圖解法求下列對(duì)策
溫馨提示
- 1. 本站所有資源如無(wú)特殊說(shuō)明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請(qǐng)下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請(qǐng)聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
- 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁(yè)內(nèi)容里面會(huì)有圖紙預(yù)覽,若沒(méi)有圖紙預(yù)覽就沒(méi)有圖紙。
- 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
- 5. 人人文庫(kù)網(wǎng)僅提供信息存儲(chǔ)空間,僅對(duì)用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對(duì)用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對(duì)任何下載內(nèi)容負(fù)責(zé)。
- 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請(qǐng)與我們聯(lián)系,我們立即糾正。
- 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶因使用這些下載資源對(duì)自己和他人造成任何形式的傷害或損失。
最新文檔
- 內(nèi)購(gòu)房轉(zhuǎn)讓合同范本
- 個(gè)人轉(zhuǎn)讓德文合同范本
- 分包混凝土合同范本
- 買(mǎi)賣(mài)車(chē)位轉(zhuǎn)讓合同范本
- 包子工用工合同范本
- 創(chuàng)業(yè)加盟合同范本
- 廣西買(mǎi)房合同范本
- 出國(guó)勞務(wù)外派合同范本
- 勞動(dòng)合同范本工資
- 出租包車(chē)合同范本
- 2022-2023學(xué)年湖南省長(zhǎng)沙市統(tǒng)招專升本語(yǔ)文模擬練習(xí)題三及答案
- 社會(huì)救助法課件
- 1.裝配式建筑概述(裝配式混凝土結(jié)構(gòu)施工技術(shù))
- 第七講+漢字字音
- 新零件的成熟保障MLA
- 【基于杜邦分析法的企業(yè)盈利能力研究國(guó)內(nèi)外文獻(xiàn)綜述4000字】
- 初中語(yǔ)文七下-上下句默寫(xiě)
- 《董存瑞舍身炸碉堡》PPT課件新
- 新川教版信息技術(shù)六年級(jí)下冊(cè)全冊(cè)教案
- 第20章補(bǔ)充芯片粘接技術(shù)
- 旅行社運(yùn)營(yíng)實(shí)務(wù)電子課件 5.1 旅行社電子商務(wù)概念
評(píng)論
0/150
提交評(píng)論