博弈論關(guān)注的是對策略互動(dòng)的一般性分析_第1頁
博弈論關(guān)注的是對策略互動(dòng)的一般性分析_第2頁
博弈論關(guān)注的是對策略互動(dòng)的一般性分析_第3頁
博弈論關(guān)注的是對策略互動(dòng)的一般性分析_第4頁
博弈論關(guān)注的是對策略互動(dòng)的一般性分析_第5頁
已閱讀5頁,還剩18頁未讀, 繼續(xù)免費(fèi)閱讀

下載本文檔

版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進(jìn)行舉報(bào)或認(rèn)領(lǐng)

文檔簡介

1、 博弈論關(guān)注的是對策略互動(dòng)的博弈論關(guān)注的是對策略互動(dòng)的一般性分析,它可以應(yīng)用于企業(yè)運(yùn)一般性分析,它可以應(yīng)用于企業(yè)運(yùn)營博弈、政治談判和經(jīng)濟(jì)行為。營博弈、政治談判和經(jīng)濟(jì)行為。n策略互動(dòng)可以涉及許多參與人和許多策策略互動(dòng)可以涉及許多參與人和許多策略,但我們的分析卻只限于策略數(shù)量有略,但我們的分析卻只限于策略數(shù)量有限的雙人博弈。限的雙人博弈。n我們用收益矩陣來表示博弈。我們用收益矩陣來表示博弈。n收益矩陣可以描述策略參與人在選擇策收益矩陣可以描述策略參與人在選擇策略時(shí)各自的收益。它可以幫助參與人做略時(shí)各自的收益。它可以幫助參與人做出策略選擇。出策略選擇。n假如有兩位同學(xué)假如有兩位同學(xué)A A和和B B玩

2、一個(gè)游戲,玩一個(gè)游戲, A A在紙上單在紙上單獨(dú)寫?yīng)殞憽吧虾拖律虾拖隆?,B B在紙上單獨(dú)寫在紙上單獨(dú)寫“左和右左和右” ” 。n如果如果A A寫了寫了“上上”,B B寫了寫了“左左”,則,則A A得得1 1塊錢塊錢獎(jiǎng)勵(lì),獎(jiǎng)勵(lì),B B得得2 2塊錢獎(jiǎng)勵(lì)。塊錢獎(jiǎng)勵(lì)。n如果如果A A寫了寫了“上上”,B B寫了寫了“右右”,則,則A A得得0 0塊錢塊錢獎(jiǎng)勵(lì),獎(jiǎng)勵(lì),B B得得1 1塊錢獎(jiǎng)勵(lì)。塊錢獎(jiǎng)勵(lì)。n如果如果A A寫了寫了“下下”,B B寫了寫了“左左”,則,則A A得得2 2塊錢塊錢獎(jiǎng)勵(lì),獎(jiǎng)勵(lì),B B得得1 1塊錢獎(jiǎng)勵(lì)。塊錢獎(jiǎng)勵(lì)。n如果如果A A寫了寫了“下下”,B B寫了寫了“右右”,則,則A

3、 A得得1 1塊錢塊錢獎(jiǎng)勵(lì),獎(jiǎng)勵(lì),B B得得0 0塊錢獎(jiǎng)勵(lì)。塊錢獎(jiǎng)勵(lì)。你如果是你如果是A A,你該寫什么,如果是,你該寫什么,如果是B B,該寫什么?,該寫什么?n首先描述參與人,一個(gè)左,一個(gè)上;首先描述參與人,一個(gè)左,一個(gè)上;n再描述每個(gè)參與人各自可選的策略;再描述每個(gè)參與人各自可選的策略;n再寫出每個(gè)策略下參與人的收益,左邊的數(shù)字代再寫出每個(gè)策略下參與人的收益,左邊的數(shù)字代表寫在左邊的參與人的收益,右邊的數(shù)字代表寫表寫在左邊的參與人的收益,右邊的數(shù)字代表寫在上邊的參與人的收益。在上邊的參與人的收益。同學(xué)同學(xué)A同學(xué)同學(xué)B上上下下左左右右1,20,12,11,0n如果你是如果你是A A,選擇,

4、選擇“下下”總是要好一些,因?yàn)樗偸且靡恍?,因?yàn)樗x選“下下”的收益(的收益(2 2或或1 1)大于他選擇)大于他選擇“上上”的收的收益(益(1 1或或0 0)。)。n如果是如果是B B,選擇,選擇“左左”的結(jié)果總是要好一些,因的結(jié)果總是要好一些,因?yàn)樗x為他選“左左”的收益(的收益(2 2或或1 1)大于他選擇)大于他選擇“右右”的收益(的收益(1 1或或0 0)。)。n在這種情況下,出現(xiàn)了占優(yōu)策略。它指無論其他在這種情況下,出現(xiàn)了占優(yōu)策略。它指無論其他參與人如何選擇,每個(gè)參與人都有一個(gè)最有選擇。參與人如何選擇,每個(gè)參與人都有一個(gè)最有選擇。即無論即無論B B選什么,選什么,A A選選“下下

5、”都要好一些,無論都要好一些,無論A A選什么,選什么,B B選選“左左”要好一些。要好一些。n如果在某個(gè)博弈中,每人參與人都有一如果在某個(gè)博弈中,每人參與人都有一個(gè)占優(yōu)策略,那么,這個(gè)占優(yōu)策略組合個(gè)占優(yōu)策略,那么,這個(gè)占優(yōu)策略組合(即(即A A選選“下下”B B選選“左左”)是該博弈的)是該博弈的均衡結(jié)果。因?yàn)闊o論其他參與人如何選均衡結(jié)果。因?yàn)闊o論其他參與人如何選擇,占優(yōu)策略都是該參與人最優(yōu)的策略。擇,占優(yōu)策略都是該參與人最優(yōu)的策略。n在上一個(gè)例子中,我們發(fā)現(xiàn)無論在上一個(gè)例子中,我們發(fā)現(xiàn)無論B B選什么,選什么,A A選選“下下”都要好,但有時(shí)這種情況不能滿足。都要好,但有時(shí)這種情況不能滿足

6、。n例如例如: :nB B選選“左左”時(shí),時(shí),A A選選“上上”好;好;B B選選“右右”時(shí),時(shí),A A選選“下下”好。好。A A的最優(yōu)選擇取決于他對的最優(yōu)選擇取決于他對B B的選擇的預(yù)的選擇的預(yù)期。期。n因此,每個(gè)人都有動(dòng)機(jī)去了解對方的最優(yōu)選擇。因此,每個(gè)人都有動(dòng)機(jī)去了解對方的最優(yōu)選擇。同學(xué)同學(xué)A同學(xué)同學(xué)B上上下下左左右右2 ,10,00,01,2n如果給定如果給定B B的選擇,的選擇,A A的選擇是最優(yōu)的,并且給定的選擇是最優(yōu)的,并且給定A A的選擇,的選擇,B B的選擇也是最優(yōu)的,那么,這樣一組的選擇也是最優(yōu)的,那么,這樣一組策略就是一個(gè)納什均衡。策略就是一個(gè)納什均衡。n注意:每個(gè)人在做

7、選擇時(shí),都不知道另一個(gè)人的注意:每個(gè)人在做選擇時(shí),都不知道另一個(gè)人的策略,但每個(gè)人都會(huì)對另一個(gè)人將要選擇的策略策略,但每個(gè)人都會(huì)對另一個(gè)人將要選擇的策略作出預(yù)期。作出預(yù)期。n一個(gè)納什均衡可以看作是關(guān)于每個(gè)參與人的策略一個(gè)納什均衡可以看作是關(guān)于每個(gè)參與人的策略選擇的一組預(yù)期,這些預(yù)期使得當(dāng)任何一個(gè)人的選擇的一組預(yù)期,這些預(yù)期使得當(dāng)任何一個(gè)人的選擇被揭示后,沒有人愿意改變自己的行為。選擇被揭示后,沒有人愿意改變自己的行為。n在以下收益矩陣中,策略(上,左)是一個(gè)納在以下收益矩陣中,策略(上,左)是一個(gè)納什均衡。因?yàn)槿绻簿狻R驗(yàn)槿绻鸄 A的最優(yōu)選擇是的最優(yōu)選擇是“上上”,B B的的最優(yōu)選擇是最優(yōu)

8、選擇是“左左”;如果;如果B B的最優(yōu)選擇是的最優(yōu)選擇是“左左”,A A的最優(yōu)選擇是的最優(yōu)選擇是“上上”。即給定期他。即給定期他人的選擇,每個(gè)參與人都做出了最優(yōu)的選擇。人的選擇,每個(gè)參與人都做出了最優(yōu)的選擇。n同時(shí),(下,右)也是一個(gè)納什均衡。同時(shí),(下,右)也是一個(gè)納什均衡。n古諾均衡也是納什均衡。古諾均衡也是納什均衡。同學(xué)同學(xué)A同學(xué)同學(xué)B上上下下左左右右2 ,10,00,01,2n如果如果A A選擇選擇“上上”,B B會(huì)選擇會(huì)選擇“左左”,而,而B B選擇選擇“左左”,A A又選擇又選擇“下下”。同樣,如果。同樣,如果A A選擇選擇“下下” ” ,B B會(huì)選擇會(huì)選擇“右右”,但如果,但如果

9、B B會(huì)選擇會(huì)選擇“右右”, A A又會(huì)選擇又會(huì)選擇“上上”。此時(shí),不存在納。此時(shí),不存在納什均衡。什均衡。同學(xué)同學(xué)A同學(xué)同學(xué)B上上下下左左右右0 ,00,-11,0-1,3n純策略:每個(gè)人只選擇一種策略并一直堅(jiān)持這個(gè)純策略:每個(gè)人只選擇一種策略并一直堅(jiān)持這個(gè)選擇。前面我們所講到的博弈是一種純策略。選擇。前面我們所講到的博弈是一種純策略。n混合策略:參與人選擇策略是隨機(jī)的。即參與人混合策略:參與人選擇策略是隨機(jī)的。即參與人一定的概率來選擇策略。例如:一定的概率來選擇策略。例如:A A可能以可能以50%50%的概的概率選擇率選擇“上上” ” , 50%50%的概率選擇的概率選擇“下下” ” ,B

10、 B以以50%50%的概率選擇的概率選擇“左左” ” ,以,以50%50%的概率選擇的概率選擇“右右”,此時(shí),此時(shí),A A的平均收益為的平均收益為0 0,B B的平均收益的平均收益為為1/21/2。n混合策略納什均衡:給定其他人參與人的策略選混合策略納什均衡:給定其他人參與人的策略選擇概率,每個(gè)參與人都為自己確定了選擇每一種擇概率,每個(gè)參與人都為自己確定了選擇每一種策略的策略的最優(yōu)概率最優(yōu)概率。n該問題要說明:博弈的納什均衡并不一定導(dǎo)致該問題要說明:博弈的納什均衡并不一定導(dǎo)致帕累托有效率。帕累托有效率。n有兩個(gè)囚徒被單獨(dú)關(guān)在兩個(gè)房間里接受審訊。有兩個(gè)囚徒被單獨(dú)關(guān)在兩個(gè)房間里接受審訊。每個(gè)囚徒都

11、可選擇坦白或抵賴。如果兩個(gè)都坦每個(gè)囚徒都可選擇坦白或抵賴。如果兩個(gè)都坦白,他們將被拘留白,他們將被拘留3 3個(gè)月;如果只有一個(gè)人坦個(gè)月;如果只有一個(gè)人坦白,那么坦白的可以免予刑事處分,而抵賴的白,那么坦白的可以免予刑事處分,而抵賴的那一位將入獄那一位將入獄6 6個(gè)月。如果兩個(gè)都抵賴,根據(jù)個(gè)月。如果兩個(gè)都抵賴,根據(jù)法律,兩位都只能被拘留法律,兩位都只能被拘留1 1個(gè)月。個(gè)月。n請問:兩個(gè)囚徒的最優(yōu)選擇是什么?有沒有納請問:兩個(gè)囚徒的最優(yōu)選擇是什么?有沒有納什均衡?什均衡?n從囚徒從囚徒A A的角度來看,不管囚徒的角度來看,不管囚徒B B是否坦白,是否坦白,A A坦坦白要好。同樣的情形適用于白要好

12、。同樣的情形適用于B B。因此,兩個(gè)囚徒。因此,兩個(gè)囚徒都坦白,是占優(yōu)策略均衡,也是納什均衡。都坦白,是占優(yōu)策略均衡,也是納什均衡。n但這個(gè)均衡是低效率的。如果雙方都選擇抵賴,但這個(gè)均衡是低效率的。如果雙方都選擇抵賴,其境況要好一些。(抵賴,抵賴)是怕累托低效其境況要好一些。(抵賴,抵賴)是怕累托低效率的策略組合率的策略組合沒有其他策略選擇能夠使他們沒有其他策略選擇能夠使他們的境況變得更好。的境況變得更好。囚徒囚徒A囚徒囚徒B坦白坦白抵賴抵賴坦白坦白抵賴抵賴-3,-30,-6-6,0-1,-1n囚徒困境在經(jīng)濟(jì)和政治生活中有著廣泛的應(yīng)用。囚徒困境在經(jīng)濟(jì)和政治生活中有著廣泛的應(yīng)用。n例如,軍備競賽

13、問題,我們把策略例如,軍備競賽問題,我們把策略“坦白坦白”改改為為“部署導(dǎo)彈部署導(dǎo)彈”,把抵賴改為,把抵賴改為“不部署導(dǎo)彈不部署導(dǎo)彈”。納什均衡是雙方都會(huì)部署導(dǎo)彈。這是低效率的。納什均衡是雙方都會(huì)部署導(dǎo)彈。這是低效率的。n例如,卡特爾中的欺騙問題。假如當(dāng)初約定好例如,卡特爾中的欺騙問題。假如當(dāng)初約定好安限額生產(chǎn),即安限額生產(chǎn),即“抵賴抵賴”,但每家廠商只要超,但每家廠商只要超額生產(chǎn)(額生產(chǎn)(“坦白坦白”)是有利可圖的,則每家企)是有利可圖的,則每家企業(yè)都將超額生產(chǎn)業(yè)都將超額生產(chǎn)“坦白坦白”。n在上述例子中,雙方約定在上述例子中,雙方約定“抵賴抵賴”是沒用的。是沒用的。如果要實(shí)現(xiàn)這一策略,就必須

14、有懲罰機(jī)制。如果要實(shí)現(xiàn)這一策略,就必須有懲罰機(jī)制。重復(fù)博弈。重復(fù)博弈。n如果參與人僅如果參與人僅“相遇相遇”一次,博弈的結(jié)果是使一次,博弈的結(jié)果是使他們陷入囚徒困境。但是,如果相同的參與人他們陷入囚徒困境。但是,如果相同的參與人重復(fù)地進(jìn)行這個(gè)博弈,每個(gè)參與人將面對新的重復(fù)地進(jìn)行這個(gè)博弈,每個(gè)參與人將面對新的可選擇策略。因?yàn)槿绻硡⑴c人在某局博弈中可選擇策略。因?yàn)槿绻硡⑴c人在某局博弈中被背信,那么,其他參與人在下一局中也選擇被背信,那么,其他參與人在下一局中也選擇背信。因此,背信人將背信。因此,背信人將“受到懲罰受到懲罰”。從而激。從而激勵(lì)參與人勵(lì)參與人“守信守信”。n但這種策略可行,要取決于

15、這種博弈是有限次但這種策略可行,要取決于這種博弈是有限次重復(fù)博弈還是無限次重復(fù)博弈。重復(fù)博弈還是無限次重復(fù)博弈。n如果參與人事先都知道,博弈將進(jìn)行某個(gè)固定的如果參與人事先都知道,博弈將進(jìn)行某個(gè)固定的次數(shù),如次數(shù),如1010次。則每個(gè)參與人會(huì)在每一局選擇背次。則每個(gè)參與人會(huì)在每一局選擇背信。因?yàn)槿绻麉⑴c人無法在最后一局實(shí)行合作,信。因?yàn)槿绻麉⑴c人無法在最后一局實(shí)行合作,那么,在倒數(shù)第那么,在倒數(shù)第2 2局也將無法實(shí)行合作。局也將無法實(shí)行合作。n假如參與人處在第假如參與人處在第1010局(最后一局),因?yàn)檫@是局(最后一局),因?yàn)檫@是最后一次博弈,每個(gè)參與人都會(huì)選擇背信(這是最后一次博弈,每個(gè)參與人

16、都會(huì)選擇背信(這是占優(yōu)策略均衡),即最后一次博弈如一次性博弈。占優(yōu)策略均衡),即最后一次博弈如一次性博弈。那么在第那么在第9 9局,參與人也就都會(huì)采取背信。因?yàn)榫?,參與人也就都會(huì)采取背信。因?yàn)槿绻氵x擇合作,另一個(gè)人將利用你的善良獲利,如果你選擇合作,另一個(gè)人將利用你的善良獲利,背信仍是他的占優(yōu)策略。以此類推,在每一局中,背信仍是他的占優(yōu)策略。以此類推,在每一局中,參與人都會(huì)不守信。參與人都會(huì)不守信。n參與人之所以合作,是因?yàn)樗麄兿M献鲿?huì)引參與人之所以合作,是因?yàn)樗麄兿M献鲿?huì)引致將來的進(jìn)一步合作,在有限次重復(fù)博弈中,致將來的進(jìn)一步合作,在有限次重復(fù)博弈中,由于最后一局不再有將來博弈的可能,

17、沒有人由于最后一局不再有將來博弈的可能,沒有人愿意合作。愿意合作。n而如果是無限次重復(fù)博弈,你就有辦法影響對而如果是無限次重復(fù)博弈,你就有辦法影響對手的行為:如果這次他拒絕合作,那么下一次,手的行為:如果這次他拒絕合作,那么下一次,你也可以拒絕合作。只要雙方都關(guān)心將來的收你也可以拒絕合作。只要雙方都關(guān)心將來的收益,那么,將來不合作的威脅就足以使他們采益,那么,將來不合作的威脅就足以使他們采取帕累托有效率的策略取帕累托有效率的策略合作。合作。無限次重復(fù)博弈和卡特爾無限次重復(fù)博弈和卡特爾n實(shí)行卡特爾是指兩家壟斷廠商共同索要高價(jià)從而獲實(shí)行卡特爾是指兩家壟斷廠商共同索要高價(jià)從而獲取巨額利潤。如果有一家

18、廠商索要高價(jià),則另一家取巨額利潤。如果有一家廠商索要高價(jià),則另一家廠商稍微降價(jià)就能奪取對方的市場,獲得比合作更廠商稍微降價(jià)就能奪取對方的市場,獲得比合作更高的利潤。如果兩家廠商都選擇降價(jià),他們只能獲高的利潤。如果兩家廠商都選擇降價(jià),他們只能獲得比合作更低的利潤。無論對手索要什么價(jià)格,你得比合作更低的利潤。無論對手索要什么價(jià)格,你降價(jià)總是有利。因此,納什均衡是雙方都降價(jià)。降價(jià)總是有利。因此,納什均衡是雙方都降價(jià)。n但是如果博弈重復(fù)無限次,則每家廠商會(huì)采取針鋒但是如果博弈重復(fù)無限次,則每家廠商會(huì)采取針鋒相對的策略,即你降價(jià)我也降價(jià),并且每個(gè)參與人相對的策略,即你降價(jià)我也降價(jià),并且每個(gè)參與人都知道對

19、方會(huì)采取針鋒相對的策略,則每個(gè)人就會(huì)都知道對方會(huì)采取針鋒相對的策略,則每個(gè)人就會(huì)擔(dān)心因自己的降價(jià)而觸發(fā)價(jià)格戰(zhàn)。擔(dān)心因自己的降價(jià)而觸發(fā)價(jià)格戰(zhàn)。n因此,針鋒相對所隱含的威脅將維持卡特爾。(例因此,針鋒相對所隱含的威脅將維持卡特爾。(例如:機(jī)票定價(jià))如:機(jī)票定價(jià))n我們前面所研究的博弈都是參與人同時(shí)采取行動(dòng),我們前面所研究的博弈都是參與人同時(shí)采取行動(dòng),但在許多情況下,一個(gè)參與人先采取行動(dòng),一個(gè)但在許多情況下,一個(gè)參與人先采取行動(dòng),一個(gè)參與人在做出反應(yīng)。例如:前面的斯塔克爾伯格參與人在做出反應(yīng)。例如:前面的斯塔克爾伯格模型。模型。n序貫博弈的收益矩陣。序貫博弈的收益矩陣。 假如假如A A先做選擇,先做

20、選擇,B B后做選擇后做選擇參與人參與人A參與人參與人B上上下下左左右右1,81,90,02,1當(dāng)博弈以這種形式表達(dá)時(shí),有兩個(gè)納什均衡當(dāng)博弈以這種形式表達(dá)時(shí),有兩個(gè)納什均衡: :(上,左)和(下,右),但其實(shí)有一個(gè)均衡是不存在的。(上,左)和(下,右),但其實(shí)有一個(gè)均衡是不存在的。n用收益矩陣表達(dá)博弈時(shí),容易掩蓋這樣一個(gè)事用收益矩陣表達(dá)博弈時(shí),容易掩蓋這樣一個(gè)事實(shí):其中一個(gè)參與人在做出自己的選擇以前,實(shí):其中一個(gè)參與人在做出自己的選擇以前,必須先要揣測另一個(gè)人的選擇。因此,我們用必須先要揣測另一個(gè)人的選擇。因此,我們用擴(kuò)展形式來表達(dá)博弈。它可以顯示選擇的次序。擴(kuò)展形式來表達(dá)博弈。它可以顯示選擇的次序。參與人參與人A的選擇的選擇上上下下參與人參與人B的選擇的選擇左左A,BA,B1,81,81,91,90,00,02,12,1右右左左右右最終最終選擇選擇Why?因?yàn)橐驗(yàn)锳 A一開始只會(huì)一開始只會(huì)選擇選擇“下下”,因?yàn)?,因?yàn)樗雷约喝绻x他知道自己如果選“下下”,B B肯定選肯定選“右右”n現(xiàn)在假設(shè)現(xiàn)在假設(shè)B B威脅威脅A A,自己只會(huì)選擇,自己只會(huì)選擇“

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會(huì)有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫網(wǎng)僅提供信息存儲(chǔ)空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負(fù)責(zé)。
  • 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

評(píng)論

0/150

提交評(píng)論