版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進行舉報或認領(lǐng)
文檔簡介
博弈策略的生活解讀主講人:黃春建電話弈策略的生活解讀主講人:黃春建1走近博弈論對于許多非數(shù)學(xué)專業(yè)和經(jīng)濟學(xué)專業(yè)人士來說,博弈論應(yīng)該是一個極為陌生的概念。但在國外,博弈論作為現(xiàn)代經(jīng)濟學(xué)的前沿領(lǐng)域,已成為占據(jù)主流的基本分析工具之一。博弈之道是古已有之,但博弈思想的系統(tǒng)化、數(shù)學(xué)化卻是近幾十年發(fā)展起來的。正是因為博弈科學(xué)是一門新學(xué)科,我國管理界、經(jīng)濟界對博弈論與信息經(jīng)濟學(xué)的研究還是停留在引進介紹層面上,他們發(fā)表的成果大多是堆砌龐雜的數(shù)學(xué)算法與令人眩目的數(shù)學(xué)模型。
走近博弈論對于許多非數(shù)學(xué)專業(yè)和經(jīng)濟學(xué)專業(yè)人士來說,博弈論應(yīng)該2我們學(xué)習(xí)博弈的目的就是通過博弈相關(guān)知識及著名的博弈案例,諸如囚徒困境、智豬博弈、斗雞博弈等等,研究人們?nèi)绾芜M行決策,以及這種決策如何達到均衡的問題。每個博弈者在決定采取何種行動時,不但要根據(jù)自身的利益和目的行事,還必須考慮到他的決策行為對其他人的可能影響,以及其他人的反應(yīng)行為的可能后果,通過選擇最佳行動計劃,來尋求收益或效用的最大化。這門課在一定程度上,是為了提高在校大學(xué)生感性認識和理性認識的融合,明白做人做事的道理,掌握分析和處理一些事情的方法和技巧。我們學(xué)習(xí)博弈的目的就是通過博弈相關(guān)知識及著名的博弈案例,諸如3一、博弈基礎(chǔ)知識博弈的定義:一些個人、團隊或其他組織,面對一定的環(huán)境條件、在一定的規(guī)則約束下,依靠所掌握的信息,同時或先或后,一次或多次,從各自允許選擇的行為或策略進行選擇并加以實施,并從中各自取得相應(yīng)結(jié)果或收益的過程。博弈的構(gòu)成要素:1、博弈要有2個或2個以上的參與者(Player)。2、博弈要有參與各方爭奪的資源或收益(Resources或Payoff)。3、參與者有自己能夠選擇的策略(Strategy)。4、參與者擁有一定量的信息(Information)。一、博弈基礎(chǔ)知識博弈的定義:一些個人、團隊或其他組織,面對一4博弈的分類:1、分為合作博弈與非合作博弈。如果各博弈方能達成某種有約束力的契約或默契,以選擇共同的策略,此種博弈就是合作博弈。反之,就屬于非合作博弈。2、分為零和博弈、常和博弈與變和博弈。零和博弈指的是所有博弈方的得益總和為零。常和博弈則是指所有博弈方的得益總和等于非零的常數(shù)。變和博弈則是指隨著博弈參與者選擇的策略不同,各方的得益總和也不同。3、分為靜態(tài)博弈與動態(tài)博弈。所有博弈方同時或可看作同時選擇策略,采取行動的博弈是靜態(tài)博弈。4、分為完全信息博弈與不完全信息博弈。博弈的分類:1、分為合作博弈與非合作博弈。如果各博弈方能達成5納什均衡定義:在給定別人最優(yōu)的情況下,自己最優(yōu)選擇達成的均衡。假設(shè)有n個局中人參與博弈,給定其他人策略的條件下,每個局中人選擇自己的最優(yōu)策略(個人最優(yōu)策略可能依賴于也可能不依賴于他人的戰(zhàn)略),從而使自己利益最大化。所有局中人策略構(gòu)成一個策略組合(StrategyProfile)。納什均衡指的是這樣一種戰(zhàn)略組合,這種策略組合由所有參與人最優(yōu)策略組成。即在給定別人策略的情況下,沒有人有足夠理由打破這種均衡。納什均衡,從實質(zhì)上說,是一種非合作博弈狀態(tài)。納什均衡達成時,并不意味著博弈雙方都處于不動的狀態(tài),在順序博弈中這個均衡是在博弈者連續(xù)的動作與反應(yīng)中達成的。納什均衡也不意味著博弈雙方達到了一個整體的最優(yōu)狀態(tài),以下的囚徒困境就是一個例子。納什均衡6二、囚徒困境兩個共同偷竊的犯罪嫌疑人甲和乙被帶進警察局。警方對兩名犯罪嫌疑人實行隔離關(guān)押,隔離審訊,每個犯罪嫌疑人都無法觀察同伴的選擇。警方懷疑他們作案,但手中并沒有掌握確鑿證據(jù),于是明確地分別告知兩名犯罪嫌疑人:對他們犯罪事實的認定及相應(yīng)的量刑完全取決于他們自己的供認。如果其中一方坦白,而另一方抵賴,供認方將不受懲罰,無罪釋放,另一方會被重判10年;如果雙方都供認,各被判5年;而如果雙方均不認罪,因為警方找不到其他證據(jù),則無罪釋放。乙抵賴乙供認甲抵賴二人無罪釋放
甲判10年,乙無罪釋放甲供認甲無罪釋放,乙判10年甲乙各判5年
二、囚徒困境兩個共同偷竊的犯罪嫌疑人甲和乙被帶進警察局。警方7體現(xiàn)囚徒困境基本精神——背叛形成囚徒困境的機制——擔(dān)心自己成為傻瓜(處于囚徒困境時,兩害相權(quán)取其輕)啟示:囚徒困境這個模型,幾乎是博弈論的代名詞。兩個基于“坦白從寬,抗拒從嚴(yán)”審訊的囚徒,從理性的角度出發(fā),會產(chǎn)生怎樣的結(jié)局?結(jié)果卻是,從個人理性并追求個人利益最大化,那么二人皆坦白,也就是背叛。這在四種策略中并不占優(yōu),那為什么不采用集體最優(yōu)策略而合作呢?很簡單的集體優(yōu)化,必然侵害個人利益的最大化。當(dāng)然這一切前提是理性假設(shè),也就是著名的經(jīng)濟人假設(shè):經(jīng)濟學(xué)中的人都是“小人”(管理學(xué)則認為人是“君子”)。破解這一困境的途徑則是打破信息孤立,而執(zhí)法者的反制則是維持孤立或者加強威脅。無論背叛還是合作,誰在這里面堅持到最后,誰將取勝。體現(xiàn)囚徒困境基本精神——背叛8三、重復(fù)博弈—合作的開始重復(fù)博弈是一種特殊的博弈,在博弈中,同樣結(jié)構(gòu)的博弈重復(fù)許多次,其中的每次博弈稱為“階段博弈”(stagegames)。在每個階段博弈中,參與人可能同時行動,也可能不同時行動。因為其他參與人過去的行動的歷史是可以觀測的,因此在重復(fù)博弈中,每個參與人可以使自己在每個階段選擇的策略依賴于其他參與人過去的行為。對未來的預(yù)期是影響我們行為的重要因素。一種是預(yù)期收益:我這樣做,將來有什么好處;一種是預(yù)期風(fēng)險:我這樣做可能將來面臨什么問題。這都將影響個人的策略。資深的博弈論專家羅伯特-奧曼在1959年指出,人與人的長期交往是避免短期沖突、走向協(xié)作的重要機制。三、重復(fù)博弈—合作的開始重復(fù)博弈是一種特殊的博弈,在博弈中,9
在現(xiàn)實環(huán)境中,存在著一些道德因素,可以化解個人理性與群體理性的矛盾,維系整個社會的穩(wěn)定。有限次的囚徒困境.情況不同于無限次的囚徒困境的重復(fù)博弈。當(dāng)臨近博弈的終點時,采取不合作策略的可能性加大。即使參與人以前的所有策略均為合作策略,如果被告知下一次博弈是最后一次,那么肯定采取不合作的策略。所以要是博弈終點不確定性,只要存在繼續(xù)合作的機會,背叛就會被抑制。無名氏定理:博弈中雙方合作時得益最大,但若一方不遵守合作約定,必定是另一方合作者吃虧。所以需要引入懲罰機制:誰違約,就要處罰他,使他不敢違約。博弈一方之所以會與另外一位合作,只是因為他知道,如果他今天被騙,明天還能對欺騙實施懲罰。奧曼先生把這一洞察結(jié)論稱之為“無名氏定理”在現(xiàn)實環(huán)境中,存在著一些道德因素,可以化解個人理性與群10啟示:每一次人際交往其實都可以簡化為兩種基本選擇:合作還是背叛。在人際交往中普遍存在囚徒困境:明知合作能帶來雙贏,但理性的自私和信任的缺乏導(dǎo)致合作難以產(chǎn)生。而且,如果博弈是一次性,那么必然加劇雙方進行“坦白”的決心,選擇相互背叛。而現(xiàn)實生活中反復(fù)交往的人際關(guān)系,則是一種“不定次數(shù)的重復(fù)博弈”。在較長的視野內(nèi),人與人交往關(guān)系的重復(fù)造成“低頭不見抬頭見”的關(guān)系,可以使交往主體之間走向合作。博弈策略的生活解讀114、一報還一報
—人際交往個體原則重復(fù)博弈理論上導(dǎo)致了合作的產(chǎn)生,但是誰也不能保證合作的繼續(xù),合作的代價是建立在對方背叛的風(fēng)險之上的。如果個人放棄未來收益或當(dāng)前背叛收益大于未來收益,背叛的風(fēng)險仍然存在。哪么在重復(fù)博弈怎樣的策略才是最優(yōu)。經(jīng)過若干科學(xué)家在計算機PK后,及其原始的“以牙還牙”策略脫穎而出,固然這個策略簡單至極,其威力卻無窮,以至于人們在推捧這一策略的后發(fā)現(xiàn),這一策略有其可怕性。一旦某個環(huán)節(jié)出現(xiàn)背叛,據(jù)此原則行事的博弈將永無休止背叛下去。所以我們又設(shè)計了修正的一報還一報策略,作為人際關(guān)系中的指導(dǎo)。4、一報還一報
—人際交往個體原則重復(fù)博弈理論上導(dǎo)致了合作12生活中有很多事情,法律和道德不好約束美國密西根大學(xué)學(xué)者羅伯特·愛克斯羅德提出了一報還一報策略。他是一個政治科學(xué)家,研究方向是人與人之間的合作關(guān)系。研究前提:一、每個人都是自私的;二、沒有權(quán)威干預(yù)個人決策。研究的問題:一、人為什么要合作。二、人什么時候合作、什么時候不合作。三、如何使別人與你合作。生活中有很多事情,法律和道德不好約束13一報還一報策略優(yōu)點:1、善良,是指它第一部總是向?qū)Ψ奖磉_善意。它堅持永遠不首先背叛對方,開始總是選擇合作,而不是一開始就選擇背叛或主動作弊。
2、可激怒,是指對方出現(xiàn)背叛行動時,它能夠及時識別并一定要采取背叛的行動來報復(fù),不會讓背叛者逍遙法外。
3、寬容,是指它不會因為別人一次背叛,長時間懷恨在心或者沒完沒了的報復(fù),而是在對方改過自新、重新回到合作軌道時,能既往不咎的恢復(fù)合作。
4、簡單,是指它的邏輯清晰,易于識別,能讓對方在較短時間內(nèi)辨別出來其策略所在。
5、不妒忌,是指它不耍小聰明,不占對方便宜,不在任何雙邊關(guān)系中爭強好勝。
一報還一報策略優(yōu)點:14一報還一報策略應(yīng)用于現(xiàn)實社會的缺陷:由于現(xiàn)實中的人會有誤會的存在,一報還一報應(yīng)用于現(xiàn)實社會主要由兩個缺陷:一是太容易激發(fā)背叛;二是它缺少一個宣布“到此為止”的機制。如何克服:在“在一在二不在三”的原則下,采用修正的一報還一報策略,一是寬大的一報還一報,即以一定的概率不報復(fù)對方的背叛;二是悔過的一報還一報,即以一定的概率主動停止背叛。處事哲學(xué):以直報怨(擯棄以德報怨和以怨報怨)一報還一報策略應(yīng)用于現(xiàn)實社會的缺陷:由于現(xiàn)實中的人會有誤會的15對于正在戀愛中的人們來說,獲得幸福愛情的博弈原則應(yīng)該是:
(1)善意而不是惡意的對待戀人。這個道理很簡單了,無須多說。
(2)寬容而不是尖刻地對待戀人。幸福的戀人可能并不是忠貞不二的,當(dāng)然也肯定不是見異思遷的,他們能夠生活得愉快,關(guān)鍵是能夠彼此寬容,既寬容對方的缺點,甚至也寬容他偶爾的不忠貞。而尖刻地對待戀人的人,對戀人的偶爾不忠貞總是不肯遷就的人,往往也都不會幸福。(3)強硬而不是軟弱地對待戀人。就是要在我永遠愛你的善意的前提下,做到有愛必報,有恨也必報,以眼還眼,以牙還牙,以其人之道,還治其人之身。這其中,當(dāng)然是要有限度和分寸的。比如對戀人與其他異性的親熱行為,要有極其強烈的敏感與斬釘截鐵地回報,當(dāng)然,每次發(fā)脾氣都是有限度的,而且還要能寬容對方。
(4)簡單明了而不是山環(huán)水繞地對待戀人。愛克斯羅德的實驗證明,在博弈過程中,過分復(fù)雜的策略使得對手難于理解,無所適從,因而難以建立穩(wěn)定的合作關(guān)系。
對于正在戀愛中的人們來說,獲得幸福愛情的博弈原則應(yīng)該是:
16其實,戀愛只是一個例子,在生活中的各種各樣的人類交往中,修正的一報還一報策略都是上上之選,因為它促進了人們之間的長久的合作,取得了共贏。那么在交往中具體采用什么樣的方法提高合作性呢?
(1)要建立持久地關(guān)系。即使是愛情,也需要建立婚姻契約以維持雙方的合作。
(2)要增強識別對方行動的能力,如果不清楚對方是合作還是不合作,就沒法回報他了。
(3)要維持聲譽,說要報復(fù)就一定要做到,人家才知道你是不好欺負的,才不敢不與你合作。
(4)能夠分步完成的對局不要一次完成,以維持長久關(guān)系,比如,貿(mào)易、談判都要分步進行,以促使對方采取合作態(tài)度。
(5)不要嫉妒人家的成功,"一報還一報"正是這樣的典范。
(6)不要首先背叛,以免擔(dān)上罪魁禍?zhǔn)椎牡赖聣毫Α?/p>
(7)不僅對背叛要回報,對合作也要作出回報。
(8)不要耍小聰明,占人家便宜。
友善、有原則、寬容、簡單、不嫉妒朋友的成功,這些信條應(yīng)是我們每個人的為人處世之道。其實,戀愛只是一個例子,在生活中的各種各樣的人類交往中,修正17
五、人質(zhì)困境
—多個人的囚徒困境
在一群人面對威脅或損失時,“第一個采取行動”的決定是很難做出的,因為它意味著將付出慘重代價。這個困境便就叫做人質(zhì)困境。需要協(xié)調(diào)和個人犧牲才能有所收獲的事情,做起來可能具有人們難以想像的難度。僅僅用道德的呼喚來讓人們挺身而出與邪惡作斗爭是不現(xiàn)實的,而且,要任何一個人在人質(zhì)困境中首先采取行動并獨自承擔(dān)報復(fù)的后果都是不公平的。解決方法:提升人的群體理性,加強溝通與合作。
五、人質(zhì)困境
—多個人的囚徒困境
在一群人面對威脅或損失18人質(zhì)困境問題產(chǎn)生的機制稱為“手風(fēng)琴效應(yīng)”,每一個折疊都會推動或拉動鄰近一個折疊。每一個體都做了相同的選擇,比如一車人面對兩個劫匪選擇沉默,但都是錯誤的選擇。個體理性和完全理性:以個體利益最大為目標(biāo)的利息沒那個被稱為個體理性,而有完美的分析判斷能力和不會犯選擇行為的錯誤被稱為完全理性。完全理性包括追求最大利益的理性意識、分析推理能力、識別判斷能力、記憶能力和準(zhǔn)確行為能力等多方面的完美表現(xiàn),其中任何一方面不完美就不屬于完全理性。人質(zhì)困境問題產(chǎn)生的機制稱為“手風(fēng)琴效應(yīng)”,每一個折疊都會推動19六、酒吧博弈
—混沌系統(tǒng)中的策略酒吧問題是美國人阿瑟(W.B.Arthur)教授提出的。酒吧問題是指這樣一個博弈:有一群人,比如總共有100人,每個周末均要決定,是去附近的一個酒吧活動還是呆在家里。該酒吧的容量是有限的,比如空間是有限的,或者座位是有限的。我們假定酒吧的容量是60人,或者說座位是60個。如果去酒吧的人數(shù)少于60,并且他也去了,他的決定就是正確的;或者,如果去酒吧的人超過60人,而他沒有去——當(dāng)然這只有事后才知道,他的決定也是正確的。否則,其決定是錯誤的。這里,我們假定他們之間不存在信息交流。我們看到,每個人根據(jù)對總的去酒吧人數(shù)的預(yù)測,而決定去酒吧與否。如果他預(yù)測去酒吧的人數(shù)超過60人,他將做出“不去酒吧”的決定,如果其預(yù)測不超過60人,他將做出“去酒吧”的決定。他們是如何做出預(yù)測呢?六、酒吧博弈
—混沌系統(tǒng)中的策略酒吧問題是美國人阿瑟(W.20“股票買賣”、“交通擁擠”以及“足球博彩”等等問題都是酒吧博弈模型的延伸。在現(xiàn)行的說法中,對這一類博弈統(tǒng)統(tǒng)稱為“少數(shù)人博弈”。酒吧博弈的研究,對于我們的現(xiàn)實啟示就在于:1、從一個非線性系統(tǒng)的整體來說,其變化往往是不可預(yù)測的。要采取正確的決策,必須了解其變化規(guī)律。所謂非線性的混沌系統(tǒng),也以理解為:2是1的2倍,但100萬并不是1的100倍。2、對于出身于一個混沌系統(tǒng)中的個體來說,在無法預(yù)測的過程中可以采取恰當(dāng)?shù)牟呗裕⑶铱梢在吋軆?。在這樣的策略中,少數(shù)者策略是值得關(guān)注的。“股票買賣”、“交通擁擠”以及“足球博彩”等等問題都是酒吧博21混沌系統(tǒng)中的解決方案:1、尋找臨界點在線性系統(tǒng)中,整體正好等于所有部分的相加,因此系統(tǒng)中的每一部分都可以自由地做自己的事情而不需要關(guān)心其他部分。在非線性系統(tǒng)中,整體并不等于所有部分的相加,它可能大于所有部分的相加,因為系統(tǒng)中的一切都是相關(guān)聯(lián)的。2、巧妙利用帶動效應(yīng),注重積累千萬不要輕視了細微的力量,而且更要堅持將一絲一毫的力量積累成最后的成功!3、運用“少數(shù)者”策略往往是那些與大眾不同的少數(shù)者,能夠順風(fēng)順?biāo)馗淖兠\。4、避開競爭激烈的獨木橋
改變以自己的需求為中心的傳統(tǒng)想法,另辟蹊徑。
混沌系統(tǒng)中的解決方案:1、尋找臨界點22七、槍手博弈這個博弈模型體現(xiàn)了王者的悲哀。三人對槍自決,甲乙丙槍法優(yōu)劣遞減。槍手們自己知道,在多方對戰(zhàn)的時候,最關(guān)鍵的并不在于先擊倒哪個對手,而是要先保全自己。這些成就了最后無奈而神奇的結(jié)局,結(jié)局不取決于同時開槍還是先后開槍,最優(yōu)良的槍手,倒下的概率最高。而最差的槍手,存貨的希望卻最大。因為沒有人會把威脅最小的槍手列為一號目標(biāo)。在這里,后發(fā)制人的弱勢者將勝出。這個博弈模型,給了弱勢者一份希望。七、槍手博弈這個博弈模型體現(xiàn)了王者的悲哀。三人對槍自決,甲乙23兩種對弈方式:第一種互動方式是同時發(fā)生。比如囚徒困境故事中的情節(jié),參與者同時出招,完全不知道其他人走哪一步。不過,每個人必須心中有數(shù),知道這個博弈游戲存在其他參與者,而這些人反過來也非常清楚這一點。因此,每個人必須設(shè)想一下若是自己處在其他人的位置,會做出什么反應(yīng),從而預(yù)計自己這一步會帶來什么結(jié)果。他選擇的最佳策略也是這一全盤考慮的一個組成部分。第二種方式是參與者的行動相繼發(fā)生,輪流出招。每個參與者在輪到自己的時候.必須展望一下他的這一步行動將會給其他人以后的行動造成什么影響,反過來又會對自己以后的行動造成什么影響。也就是說,相繼出招的博弈中,每一個參與者必須預(yù)計其他參與者接下來會有什么反應(yīng),據(jù)此盤算自己的最佳招數(shù)。這種向前展望、倒后推理的方法非常重要,是確定策略時的一個基本準(zhǔn)則。兩種對弈方式:第一種互動方式是同時發(fā)生。比如囚徒困境故事中的24置身槍手博弈中的解決方法:1、明了同時和相繼出招的策略博弈法則:假如你有一個優(yōu)勢策略.請照辦。不要考慮你的對手會怎么做。假如你沒有一個優(yōu)勢策略,但你的對手有,那么就假定他會采用這個優(yōu)勢策珞,相應(yīng)選擇你自己最好的做法。2、注重對手以外博弈方的影響
除了預(yù)測對手的行動之外,還必須對第三方的策略有清醒的估計。博弈中可以通過放棄自己的攻擊機會.而取得更好的結(jié)果。你的幸存機會不僅取決于你自己的本事,還要看你威脅到的人。
3、慎重對待進攻方向的選擇如果在多方參與的博弈中,自己未能占據(jù)實力上的優(yōu)勢??梢苑治鲞x擇方向,在某個局部點,集中自己所有的資源并加以整合,造成在細分的環(huán)節(jié)上對強者的優(yōu)勢,從而成為博弈中的勝利者。4、要有置身事外的智慧即使是槍手博弈.在槍彈橫飛之前甚至之中,也仍然會出現(xiàn)某種回旋空間。當(dāng)另外兩方相爭,第三者越是保持自己的含糊態(tài)度,保持一種對另外兩方的威脅態(tài)勢.其地位越是重要。置身槍手博弈中的解決方法:1、明了同時和相繼出招的策略2、注25八、獵鹿博弈:集體優(yōu)化獵鹿博弈又稱獵鹿模型(StagHuntModel)、獵人的帕累托效率,源自啟蒙思想家盧梭的著作《論人類不平等的起源和基礎(chǔ)》中的一個故事。奧曼于1987年提出了“相關(guān)均衡”機制。所謂相關(guān)均衡是指,通過某種客觀的信號裝置以及當(dāng)事人對信號的反應(yīng),使本來各自為政的個體行為之間相互發(fā)生關(guān)系,形成一種共贏的結(jié)果。在一個博弈中,參與者的策略往往有四種組合:第一,都采取合作的方式,絕不背叛,這對集體來說是最優(yōu)的策略;第二,本人采取不合作的方式但個人收益是最大的,這對個人來說是最優(yōu)的策略;第三,所有的參與者都選擇背叛,這對集體來說是最壞的結(jié)果,同時對個人而言也有可能是最壞的結(jié)果;第四,就是當(dāng)別人采取不合作態(tài)度時自己卻堅守合作的方式,這種情況對個人和集體來說都不是最優(yōu)策略,而且從個人追求自身效益最大化的動機來看,做出這種選擇幾乎不可能。
八、獵鹿博弈:集體優(yōu)化獵鹿博弈又稱獵鹿模型(StagHun26帕累托(Pareto)效率最優(yōu):經(jīng)濟的效率體現(xiàn)于配置社會資源以改善人們的境況,特別要看資源是否已經(jīng)被充分利用。如果資源已經(jīng)被充分利用,要想改善再改善我就必須損害你,要想再改善你就必須損害我,一句話,如果要想再改善任何人都必須損害別人,這時候就說一個經(jīng)濟已經(jīng)實現(xiàn)了帕累托效率最優(yōu)。說明:1.Pareto效率只關(guān)心每個人的福利,而不是不同人的相對福利,不關(guān)心不平等。使富人變好、窮人原地踏步的變化仍然是帕累托改進。2.Pareto效率認為,每個人對自己福利的感覺最重要,個人是“自己需要什么”的最好裁判。帕累托(Pareto)效率最優(yōu):27格雷特?哈定(1915-2003)是美國著名的生態(tài)學(xué)家,他創(chuàng)立了世界上第一部《生態(tài)法》,其成名之作為1968年發(fā)表在《科學(xué)》雜志上的論文《共有地悲劇》(TragedyofCommons)。文章揭示了一種人類共有資產(chǎn)的集體困境,哈定指出:“在共享公有物的社會中,每個人,也就是所有人都追求各自的最大利益。這就是悲劇的所在。每個人都被鎖定在一個迫使他在有限范圍內(nèi)無節(jié)制地增加牲畜的制度中。毀滅是所有人都奔向的目的地。因為在信奉公有物自由的社會當(dāng)中,每個人均追求自己的最大利益?!弊詈蟆肮形镒杂山o所有人帶來了毀滅”,這就是所謂的“共有地悲劇”,也稱為“哈定悲劇”。哈丁悲劇反映的社會問題:人口爆炸、污染、過度捕撈、過度砍伐和不可再生資源的消耗等等。防止哈丁悲劇的辦法一是制度上,建立中心化的權(quán)利機構(gòu)二是道德約束,使道德約束與非中心化的獎懲聯(lián)系在一起。格雷特?哈定(1915-2003)是美國著名的生態(tài)學(xué)家,他創(chuàng)28九、智豬博弈
——付出與收獲的啟示假設(shè)豬圈里有一頭大豬、一頭小豬。豬圈的一頭有豬食槽,另一頭安裝著控制豬食供應(yīng)的按鈕,按一下按鈕會有10個單位的豬食進槽,但是誰按按鈕就會首先付出2個單位的成本,若大豬先到槽邊,大小豬吃到食物的收益比是9∶1;同時到槽邊,收益比是7∶3;小豬先到槽邊,收益比是6∶4。那么,在兩頭豬都有智慧的前提下,最終結(jié)果是小豬選擇等待。小豬行動小豬等待大豬行動5,14,4大豬等待9,-10,0九、智豬博弈
——付出與收獲的啟示假設(shè)豬圈里有一頭大豬、一頭29重復(fù)剔除嚴(yán)格劣勢策略:首先找出某參與人的嚴(yán)格劣勢策略,將它剔除,重新構(gòu)造一個不包括已剔除策略的新博弈;然后,繼續(xù)剔除這個新的博弈中某一參與人的嚴(yán)格劣勢策略;重復(fù)這一過程,直到剩下唯一的策略組合為止。剩下的這個唯一的策略組合,就是這個博弈的均衡解,稱為“重復(fù)剔除的占有策略均衡”。對管理者啟示:為杜絕這種搭便車行為,可采用三個方案:1、減量方案。2、增量方案。3、減量加移位方案。重復(fù)剔除嚴(yán)格劣勢策略:首先找出某參與人的嚴(yán)格劣勢策略,將它剔30十、警察與小偷博弈
——隨機策略的選擇某個小鎮(zhèn)上只有一名警察,他負責(zé)整個鎮(zhèn)的治安?,F(xiàn)在我們假定,小鎮(zhèn)的一頭有一家酒館,另一頭有一家銀行。再假定該地只有一個小偷。因為分身乏術(shù),警察一次只能在一個地方巡邏;而小偷也只能去一個地方。若警察選擇了小偷偷盜的地方巡邏,就能把小偷抓住;而如果小偷選擇了沒有警察巡邏的地方偷盜,就能夠偷竊成功。假定銀行需要保護的財產(chǎn)價格為2萬元,酒館的財產(chǎn)價格為1萬元。警察怎么巡邏才能使效果最好?最常見的做法是,警察對銀行進行巡邏。這樣,警察可以保住2萬元的財產(chǎn)不被偷竊。但是假如小偷去了酒館,偷竊一定成功。這種做法是警察的最好做法嗎?答案是否定的。警察最好的策略是,抽簽決定去銀行還是酒館。銀行的價值是酒館的兩倍,用兩個簽代表,比如抽到1、2號簽去銀行,抽到3號簽去酒館。這樣警察有2/3的機會去銀行巡邏,1/3的機會去酒館。小偷的最優(yōu)策略是:以同樣抽簽的辦法決定去銀行還是去酒館偷盜,與警察不同的是抽到1、2號簽去酒館,抽到3號簽去銀行。這樣小偷有1/3的機會去銀行,2/3的機會去酒館。十、警察與小偷博弈
——隨機策略的選擇某個小鎮(zhèn)上只有一名警31純策略:指參與者在他的策略空間中選取唯一確定的策略,是參與者一次性選取并且一直堅持的策略混合策略:是指參與者在各種被選策略中采取隨機方式選取并且可以改變,而使之滿足一定的概率的策略最大最小定理:在二人零和博弈中,參與者的利益嚴(yán)格相反(一人所得等于另一人所失),每個參與者盡量使對手的最大收益最小化,而他的對手則努力使自己的最小收益最大化。純策略:指參與者在他的策略空間中選取唯一確定的策略,是參與者32十一、斗雞博弈
——狹路相逢的策略試想有兩人狹路相逢,每人有兩個行動選擇:一是退下來,一是進攻。如果一方退下來,而對方?jīng)]有退下來,對方獲得勝利,這人就很丟面子;如果對方也退下來,雙方則打個平手;如果自己沒退下來,而對方退下來,自己則勝利,對方則失?。蝗绻麅扇硕记斑M,那么則兩敗俱傷。因此,對每個人來說,最好的結(jié)果是,對方退下來,而自己不退。乙前進乙后退甲前進-2,-21,-1甲后退-1,1-1,-1十一、斗雞博弈
——狹路相逢的策略試想有兩人狹路相逢,每人33啟示:兩只斗雞在決斗的時候,無論選擇進或退都是一個難題,因為納什均衡已經(jīng)給出了一勝一敗的最優(yōu)策略。在很多較量下,死拼將是得不償失的,因為很可能給第三者機會。因此,兩個已經(jīng)在戰(zhàn)場的強勢力很可能自覺的遵循納什均衡,當(dāng)一方攻擊時,另一方暫退。雖然可能某方暫時受損,但較之于兩敗俱傷是好得多的。不過,要維持這一狀況,必須保證下一次先期受損的一方發(fā)動攻勢的時候,另一方同樣的后退。于是這樣的攻擊性行為開始變得“儀式化”,沒有人真正流血。啟示:兩只斗雞在決斗的時候,無論選擇進或退都是一個難題,因為34十二、協(xié)和謬誤20世紀(jì)60年代,英法兩國政府聯(lián)合投資開發(fā)大型超音速客機,即協(xié)和飛機。該種飛機機身大、裝飾豪華并且速度快,其開發(fā)可以說是一場豪賭,單是設(shè)計一個新引擎的成本就可能高達數(shù)億元。難怪政府也會被牽涉進去,竭力要為本國企業(yè)提供更大的支持。項目開展不久,英法兩國政府發(fā)現(xiàn):繼續(xù)投資開發(fā)這樣的機型,花費會急劇增加,但這樣的設(shè)計定位能否適應(yīng)市場還不知道;但是停止研制也是可怕的,因為以前的投資將付諸東流。隨著研制工作的深入,他們更是無法做出停止研制工作的決定。協(xié)和飛機最終研制成功,但因飛機的缺陷(如耗油大、噪音大、污染嚴(yán)重等)以及運營成本太高,不適合市場競爭,英法政府為此蒙受很大的損失。在研制過程中,如果英法政府能及早放棄,本來可以使損失減少,但他們沒能做到。最后,英國和法國航空公司宣布協(xié)和飛機退出民航市場,才算是從這個無底洞中脫身。這也是“壯士斷腕”的無奈之舉。十二、協(xié)和謬誤20世紀(jì)60年代,英法兩國政府聯(lián)合投資開發(fā)大型35人們往往會陷入類似的誤區(qū):一項工作的成本越大,對它的后續(xù)投入就越多。其實不僅是在制造協(xié)和飛機這樣的重大項目上,就是在日常的生活中,人們在決定是否繼續(xù)做一件事情的時候,不僅是看它對自己有沒有好處,而且也過于注意自己是不是已經(jīng)在這件事情上面有過投入。我們把那些已經(jīng)發(fā)生、不可收回的支出,如時間、金錢、精力稱為“沉沒成本”。沉沒的意思是說,你在正式完成交易之前投入的成本,如果一旦交易不成,就會白白損失掉。但如果對沉沒成本過分眷戀,就會繼續(xù)原來的錯誤,造成更大的虧損。怎么才能讓自己擺脫沉沒成本的羈絆呢?一是在進行一項事業(yè)之前的決策要慎重,要在掌握了足夠信息的情況下,對可能的收益與損失進行全面的評估;二是一旦形成了沉沒成本,就必須要承認現(xiàn)實,認賠服輸,避免造成更大的損失。人們往往會陷入類似的誤區(qū):一項工作的成本越大,對它的后續(xù)投入36鱷魚法則:假定一只鱷魚咬住你的腳,如果你用手去試圖掙脫你的腳,鱷魚便會同時咬住你的腳與手。你愈掙扎,就被咬住得越多。所以,萬一鱷魚咬住你的腳,你唯一的辦法就是犧牲一只腳。鱷魚法則就是:當(dāng)你發(fā)現(xiàn)自己的行動背離了既定的方向,必須立即止損,不得有任何延誤,不得存有任何僥幸。
機會成本:為選擇最優(yōu)方案而放棄的次優(yōu)方案的價值協(xié)和謬誤的啟示:人生最大的效率其實在于,真正有勇氣來改變可以改變的事情,有度量接受不可改變的事情,有智慧來分辨兩者的不同。鱷魚法則:機會成本:為選擇最優(yōu)方案而放棄的次優(yōu)方案的價值協(xié)和37十三、蜈蚣博弈
——從終點出發(fā)的思維一場顛前倒后的博弈。蜈蚣博弈的機理是以最終的結(jié)果倒退至開始。這是一個睿智的策略,因果相報,把握好因緣,自有好結(jié)果。它的另一個好處,就是使得未來的計劃明晰化,使你不再徘徊。只可惜,很多時候,我們?nèi)鄙倏赐该跃值难劬?。一個典型的海盜分金模型,提供了一個新的推理方法,倒推法。它存在一個線性思維鏈:假如我這么做,我的對手可以那么做,反過來我應(yīng)該這樣應(yīng)對……。它實際上是通過“向前展望—倒后推理”的法則,找出最佳行動方式。很多學(xué)者已經(jīng)用科學(xué)的方法推導(dǎo)出:倒推法是分析完全且完美信息下的動態(tài)博奔的有用工具,也符合人們的直覺,但是在某種情況下卻存在著無法解釋的缺陷。這個博弈告訴我們,更多時候,決定命運的是選擇,而非機會。十三、蜈蚣博弈
——從終點出發(fā)的思維一場顛前倒后的博弈。蜈38海盜分金有5個海盜搶得100枚金幣,在如何分贓問題上爭吵不休。于是他們決定:(1)抽簽決定各人的號碼【1,2,3.4.5】。(2)由1號提出分配方案,然后5人表決,如果方案超過半數(shù)同意就被通過.否則他將被扔進大海喂鯊魚。(3)1號死后,由2號提方案,4人表決.當(dāng)且僅當(dāng)超過半數(shù)同意時方案通過,否則2號同樣被扔進大海。(4)依次類推,直到找到一個每個人都接受的方案。如果只剩下5號,他當(dāng)然接受一人獨吞的結(jié)果。假定海盜都是理性的,判決都能執(zhí)行,那么,如果你是第一個強盜,你該如何提出分配方案才能使自己的收益最大化?海盜分金有5個海盜搶得100枚金幣,在如何分贓問題上爭吵不休39具體分析:5號:巴不得把所有人都進去喂鯊魚4號:如果1~3號強盜都喂了鯊魚,只剩4號和5號的話,5號一定投反對票讓4號喂鯊魚。以獨吞全部金幣。所以,4號唯有支持3號才能保命。3號:會提出【100,0,0】的分配方案2號:2號可以推知3號的方案,就會提出[98,0,1,1]的方案,即放棄3號,而給予4號和5號各1枚金幣。
1號:1號可以推知2號的方案,所以1號并將提出【97,0.1,2,0】或【97,0,1,0,2】的方案,即放棄2號,而給3號1枚金幣,同時給4號或5號2枚金幣。具體分析:5號:巴不得把所有人都進去喂鯊魚40十四、分蛋糕博弈兩個小孩怎么分蛋糕?經(jīng)典的故事,經(jīng)典的解答:一個分,一個選?,F(xiàn)實多如此,權(quán)利的合理分配將有效促進公平與效率。經(jīng)營權(quán)與所有權(quán)的分置的確使得生活更有活力。不過分蛋糕的進階模型卻強調(diào)了討價還價的策略,分蛋糕不是一次性的,而是多回合的,而且出現(xiàn)成本:蛋糕在融化。時間成本的加入,將使得分配變得復(fù)雜化。雙方如果不能及時達成交易,不僅集體的收益將減量,而且個體的收益也將減少。結(jié)論:假如步驟數(shù)是偶數(shù),各得一半;假如步驟數(shù)n是奇數(shù),A得到(n十1)/(2n)而B得到(n-I)/(2n)。貼現(xiàn)率是指將未來支付改變?yōu)楝F(xiàn)值所使用的利率,或指持票人以沒有到期的票據(jù)向銀行要求兌現(xiàn),銀行將利息先行扣除所使用的利率。十四、分蛋糕博弈兩個小孩怎么分蛋糕?經(jīng)典的故事,經(jīng)典的解答:41十五、鷹鴿博弈
——進化中的路徑依賴這個博弈很多人等同于斗雞博弈。不過,斗雞是兩個兼具侵略性的個體,鷹鴿卻是兩個不同群體的博弈,一個和平,一個侵略。在只有鴿子一個苞谷場里,突然加入的鷹將大大獲益,并吸引同伴加入。但結(jié)果不是鷹將鴿逐出苞谷場,而是一定比例共存,因為鷹群增加一只鷹的邊際收益趨零時(鷹群發(fā)生內(nèi)斗),均衡將到來。由此產(chǎn)生了ESS進化上的穩(wěn)定策略,也就是說一旦均衡形成,偏離的運動會受到自然選擇的打擊。也就是鷹群飽滿后,再試圖加入的鷹將會被鷹群排擠。進化上的穩(wěn)定均衡最大的好處莫過于保持穩(wěn)定。但問題在于形成強勢的路徑依賴,也就是勝出的不一定是最好的。因為最好的會被當(dāng)作出頭鳥吃掉,這是個體的失敗。QWERTY鍵盤、火車軌道是兩匹馬的寬度等等都使我們體會到了路徑依賴的可怕。十五、鷹鴿博弈
——進化中的路徑依賴這個博弈很多人等同于斗42鷹鴿演進博弈的的穩(wěn)定演進策略共有三種:
一種是鷹的世界,即霍布斯的原始叢林;
一種是鴿的天堂,既各種烏托邦;
還有一種是鷹鴿共生演進的策略,這要求混合采取強硬或者合作的策略。進化上的穩(wěn)定策略即ESS:是指凡是種群的大部分成員采用某種策略,而且這種策略的好處為其他策略所比不上的,這種策略就是進化上的穩(wěn)定策略或ESS。換句話講,對于個體來說,最好的策略取決于種群的大多數(shù)成員在做什么。鷹鴿演進博弈的的穩(wěn)定演進策略共有三種:
一種是鷹的世界,即霍43路徑依賴:在制度變遷中,由于存在自我強化的機制,這種機制使得制度變遷一旦走上某一路徑,它的既定方向會在以后的發(fā)展中得到強化。即在制度選擇過程中,初始選擇對制度變遷的軌跡具有相當(dāng)強的影響力和制約力。人們一旦確定了一種選擇,就會對這種選擇產(chǎn)生依賴性;這種初始選擇本身也就具有發(fā)展的慣性,具有自我積累放大效應(yīng),從而不斷強化自己。馬太效應(yīng):1973年,美國科學(xué)史研究者默頓用這幾句話來概括一種社會心理現(xiàn)象:“對已經(jīng)有相當(dāng)聲譽的科學(xué)家做出的科學(xué)貢獻給予的榮譽越來越多,而對那些未出名的科學(xué)家則不承認他們的成績?!彼麑⑦@種社會心理現(xiàn)象命名為“馬太效應(yīng)”路徑依賴:在制度變遷中,由于存在自我強化的機制,這種機制使得44十六、臟臉博弈
——共同知識的機制三個人在屋子里,不許說話。美女進來說:你們當(dāng)中至少一個人臉是臟的。三人環(huán)看,沒有反應(yīng)。美女又說:你們知道嗎?三人再看,頓悟,臉都紅了。為什么?因為美女后一句廢話點破天機,三個人都知道臟臉的存在,而且推測知道對方也知道了臟臉的存在(因為另兩人臉沒紅,說明他們看到臟臉了),而且知道對方知道自己已經(jīng)想到上一步……循環(huán)開始,知識開始共同化,真相大白:三個人都是臟臉,所有人都臉紅了。這就是共同知識的作用,它的作用顯得有點可怕的強大。現(xiàn)實雖然存在類似現(xiàn)象,不過共同知識更大的作用在于減少交易成本。因為某些規(guī)則人盡皆知,雙方只要各自依之行事就可以了。這也被稱為共同認知理論,所謂共同認知就是:對一件事,若所有的博弈當(dāng)事人對事件都有了解,并且所有的當(dāng)事人都知道其他當(dāng)事人也知道這件事情,那么這樣的事件就是共同認知。在博弈的世界里,任何一個博弈者都不可能在行動之前得知另一方的整個計劃。這樣就需要當(dāng)事人在行動之前就要識破對方的策略從而試試自己的策略。很多時候,你并不能看見自己,沒有條件給你看清自己的處境,這個時候你能做的就是要通過別人的角色來揣測分析自己。十六、臟臉博弈
——共同知識的機制三個人在屋子里,不許說話45有3頂黑帽子,2頂白帽子。讓三個人從前到后站成一排。給他們每個人頭上戴一頂帽子。每個人都看不見自己戴的帽子的顏色.只能看見站在前面那些人的帽子顏色。最后那個人可以看見前面兩個人頭上帽子的顏色,中間那個人看得見前面那個人的帽子顏色但看不見在他后面那個人的帽子顏色。而最前面那個人誰的帽子都看不見。從最后那個人開始,問他是不是知道自己戴的帽子的顏色,如果他回答說不知道,就繼續(xù)問他前面那個人?,F(xiàn)在最后面一個人說他不知道,中間那個人也說不知道,當(dāng)問到排在最前面的人的時候.他卻說已經(jīng)知道。為什么?共同知識:最初是由邏輯學(xué)家李維斯提出的,對一個事件來說,如果所有博弈當(dāng)事人對該事件都有了解,并且當(dāng)事人都知道其他當(dāng)事人也知道這一事件,并且所有當(dāng)事人都知道所有當(dāng)事人都知道所有當(dāng)事人都知道這一事件,那么該事件就是共同知識舉例:A、B兩人和事件F,如果A、B都知道F,并且A、B雙方均知道對方知道F,并且他們各自都知道對方知道自己知道F,那么F就是A、B的共同知道是有3頂黑帽子,2頂白帽子。讓三個人從前到后站成一排。給他們每46十七、信息相關(guān)
劣幣驅(qū)逐良幣規(guī)律是這樣表現(xiàn)的:當(dāng)金銀市場比價與法定比價發(fā)生偏差時,法定價值過低的金屬鑄幣就會退出流通,而法定價值過高的貨幣則會充斥市場。逆向選擇是指由于交易雙方信息不對稱和市場價格下降產(chǎn)生的劣質(zhì)品驅(qū)逐優(yōu)質(zhì)品,進而出現(xiàn)市場交易產(chǎn)品平均質(zhì)量下降的現(xiàn)象。信息傳遞是指人們通過聲音、文字或圖像相互溝通消息的意思。信息傳遞研究的是什么人,向誰說什么,用什么方式說,通過什么途徑說,達到什么目的。
十七、信息相關(guān)
劣幣驅(qū)逐良幣規(guī)律是這樣表現(xiàn)的:當(dāng)金銀市場比價47信息甄別(screening)是市場交易中沒有私人信息的一方為了減弱非對稱信息對自己的不利影響,能夠區(qū)別不同類型的交易對象而提出的一種交易方式,方法(或契約、合同)。信息甄別與信號傳遞的差異還在于,在信息甄別機制中,沒有私人信息的一方先行動,而在信號傳遞機制中,有私人信息的一方先行動。
信息甄別(screening)是市場交易中沒有私人信息的一方48最后,祝愿同學(xué)們:學(xué)業(yè)有成、事業(yè)有望!最后,49博弈策略的生活解讀主講人:黃春建電話弈策略的生活解讀主講人:黃春建50走近博弈論對于許多非數(shù)學(xué)專業(yè)和經(jīng)濟學(xué)專業(yè)人士來說,博弈論應(yīng)該是一個極為陌生的概念。但在國外,博弈論作為現(xiàn)代經(jīng)濟學(xué)的前沿領(lǐng)域,已成為占據(jù)主流的基本分析工具之一。博弈之道是古已有之,但博弈思想的系統(tǒng)化、數(shù)學(xué)化卻是近幾十年發(fā)展起來的。正是因為博弈科學(xué)是一門新學(xué)科,我國管理界、經(jīng)濟界對博弈論與信息經(jīng)濟學(xué)的研究還是停留在引進介紹層面上,他們發(fā)表的成果大多是堆砌龐雜的數(shù)學(xué)算法與令人眩目的數(shù)學(xué)模型。
走近博弈論對于許多非數(shù)學(xué)專業(yè)和經(jīng)濟學(xué)專業(yè)人士來說,博弈論應(yīng)該51我們學(xué)習(xí)博弈的目的就是通過博弈相關(guān)知識及著名的博弈案例,諸如囚徒困境、智豬博弈、斗雞博弈等等,研究人們?nèi)绾芜M行決策,以及這種決策如何達到均衡的問題。每個博弈者在決定采取何種行動時,不但要根據(jù)自身的利益和目的行事,還必須考慮到他的決策行為對其他人的可能影響,以及其他人的反應(yīng)行為的可能后果,通過選擇最佳行動計劃,來尋求收益或效用的最大化。這門課在一定程度上,是為了提高在校大學(xué)生感性認識和理性認識的融合,明白做人做事的道理,掌握分析和處理一些事情的方法和技巧。我們學(xué)習(xí)博弈的目的就是通過博弈相關(guān)知識及著名的博弈案例,諸如52一、博弈基礎(chǔ)知識博弈的定義:一些個人、團隊或其他組織,面對一定的環(huán)境條件、在一定的規(guī)則約束下,依靠所掌握的信息,同時或先或后,一次或多次,從各自允許選擇的行為或策略進行選擇并加以實施,并從中各自取得相應(yīng)結(jié)果或收益的過程。博弈的構(gòu)成要素:1、博弈要有2個或2個以上的參與者(Player)。2、博弈要有參與各方爭奪的資源或收益(Resources或Payoff)。3、參與者有自己能夠選擇的策略(Strategy)。4、參與者擁有一定量的信息(Information)。一、博弈基礎(chǔ)知識博弈的定義:一些個人、團隊或其他組織,面對一53博弈的分類:1、分為合作博弈與非合作博弈。如果各博弈方能達成某種有約束力的契約或默契,以選擇共同的策略,此種博弈就是合作博弈。反之,就屬于非合作博弈。2、分為零和博弈、常和博弈與變和博弈。零和博弈指的是所有博弈方的得益總和為零。常和博弈則是指所有博弈方的得益總和等于非零的常數(shù)。變和博弈則是指隨著博弈參與者選擇的策略不同,各方的得益總和也不同。3、分為靜態(tài)博弈與動態(tài)博弈。所有博弈方同時或可看作同時選擇策略,采取行動的博弈是靜態(tài)博弈。4、分為完全信息博弈與不完全信息博弈。博弈的分類:1、分為合作博弈與非合作博弈。如果各博弈方能達成54納什均衡定義:在給定別人最優(yōu)的情況下,自己最優(yōu)選擇達成的均衡。假設(shè)有n個局中人參與博弈,給定其他人策略的條件下,每個局中人選擇自己的最優(yōu)策略(個人最優(yōu)策略可能依賴于也可能不依賴于他人的戰(zhàn)略),從而使自己利益最大化。所有局中人策略構(gòu)成一個策略組合(StrategyProfile)。納什均衡指的是這樣一種戰(zhàn)略組合,這種策略組合由所有參與人最優(yōu)策略組成。即在給定別人策略的情況下,沒有人有足夠理由打破這種均衡。納什均衡,從實質(zhì)上說,是一種非合作博弈狀態(tài)。納什均衡達成時,并不意味著博弈雙方都處于不動的狀態(tài),在順序博弈中這個均衡是在博弈者連續(xù)的動作與反應(yīng)中達成的。納什均衡也不意味著博弈雙方達到了一個整體的最優(yōu)狀態(tài),以下的囚徒困境就是一個例子。納什均衡55二、囚徒困境兩個共同偷竊的犯罪嫌疑人甲和乙被帶進警察局。警方對兩名犯罪嫌疑人實行隔離關(guān)押,隔離審訊,每個犯罪嫌疑人都無法觀察同伴的選擇。警方懷疑他們作案,但手中并沒有掌握確鑿證據(jù),于是明確地分別告知兩名犯罪嫌疑人:對他們犯罪事實的認定及相應(yīng)的量刑完全取決于他們自己的供認。如果其中一方坦白,而另一方抵賴,供認方將不受懲罰,無罪釋放,另一方會被重判10年;如果雙方都供認,各被判5年;而如果雙方均不認罪,因為警方找不到其他證據(jù),則無罪釋放。乙抵賴乙供認甲抵賴二人無罪釋放
甲判10年,乙無罪釋放甲供認甲無罪釋放,乙判10年甲乙各判5年
二、囚徒困境兩個共同偷竊的犯罪嫌疑人甲和乙被帶進警察局。警方56體現(xiàn)囚徒困境基本精神——背叛形成囚徒困境的機制——擔(dān)心自己成為傻瓜(處于囚徒困境時,兩害相權(quán)取其輕)啟示:囚徒困境這個模型,幾乎是博弈論的代名詞。兩個基于“坦白從寬,抗拒從嚴(yán)”審訊的囚徒,從理性的角度出發(fā),會產(chǎn)生怎樣的結(jié)局?結(jié)果卻是,從個人理性并追求個人利益最大化,那么二人皆坦白,也就是背叛。這在四種策略中并不占優(yōu),那為什么不采用集體最優(yōu)策略而合作呢?很簡單的集體優(yōu)化,必然侵害個人利益的最大化。當(dāng)然這一切前提是理性假設(shè),也就是著名的經(jīng)濟人假設(shè):經(jīng)濟學(xué)中的人都是“小人”(管理學(xué)則認為人是“君子”)。破解這一困境的途徑則是打破信息孤立,而執(zhí)法者的反制則是維持孤立或者加強威脅。無論背叛還是合作,誰在這里面堅持到最后,誰將取勝。體現(xiàn)囚徒困境基本精神——背叛57三、重復(fù)博弈—合作的開始重復(fù)博弈是一種特殊的博弈,在博弈中,同樣結(jié)構(gòu)的博弈重復(fù)許多次,其中的每次博弈稱為“階段博弈”(stagegames)。在每個階段博弈中,參與人可能同時行動,也可能不同時行動。因為其他參與人過去的行動的歷史是可以觀測的,因此在重復(fù)博弈中,每個參與人可以使自己在每個階段選擇的策略依賴于其他參與人過去的行為。對未來的預(yù)期是影響我們行為的重要因素。一種是預(yù)期收益:我這樣做,將來有什么好處;一種是預(yù)期風(fēng)險:我這樣做可能將來面臨什么問題。這都將影響個人的策略。資深的博弈論專家羅伯特-奧曼在1959年指出,人與人的長期交往是避免短期沖突、走向協(xié)作的重要機制。三、重復(fù)博弈—合作的開始重復(fù)博弈是一種特殊的博弈,在博弈中,58
在現(xiàn)實環(huán)境中,存在著一些道德因素,可以化解個人理性與群體理性的矛盾,維系整個社會的穩(wěn)定。有限次的囚徒困境.情況不同于無限次的囚徒困境的重復(fù)博弈。當(dāng)臨近博弈的終點時,采取不合作策略的可能性加大。即使參與人以前的所有策略均為合作策略,如果被告知下一次博弈是最后一次,那么肯定采取不合作的策略。所以要是博弈終點不確定性,只要存在繼續(xù)合作的機會,背叛就會被抑制。無名氏定理:博弈中雙方合作時得益最大,但若一方不遵守合作約定,必定是另一方合作者吃虧。所以需要引入懲罰機制:誰違約,就要處罰他,使他不敢違約。博弈一方之所以會與另外一位合作,只是因為他知道,如果他今天被騙,明天還能對欺騙實施懲罰。奧曼先生把這一洞察結(jié)論稱之為“無名氏定理”在現(xiàn)實環(huán)境中,存在著一些道德因素,可以化解個人理性與群59啟示:每一次人際交往其實都可以簡化為兩種基本選擇:合作還是背叛。在人際交往中普遍存在囚徒困境:明知合作能帶來雙贏,但理性的自私和信任的缺乏導(dǎo)致合作難以產(chǎn)生。而且,如果博弈是一次性,那么必然加劇雙方進行“坦白”的決心,選擇相互背叛。而現(xiàn)實生活中反復(fù)交往的人際關(guān)系,則是一種“不定次數(shù)的重復(fù)博弈”。在較長的視野內(nèi),人與人交往關(guān)系的重復(fù)造成“低頭不見抬頭見”的關(guān)系,可以使交往主體之間走向合作。博弈策略的生活解讀604、一報還一報
—人際交往個體原則重復(fù)博弈理論上導(dǎo)致了合作的產(chǎn)生,但是誰也不能保證合作的繼續(xù),合作的代價是建立在對方背叛的風(fēng)險之上的。如果個人放棄未來收益或當(dāng)前背叛收益大于未來收益,背叛的風(fēng)險仍然存在。哪么在重復(fù)博弈怎樣的策略才是最優(yōu)。經(jīng)過若干科學(xué)家在計算機PK后,及其原始的“以牙還牙”策略脫穎而出,固然這個策略簡單至極,其威力卻無窮,以至于人們在推捧這一策略的后發(fā)現(xiàn),這一策略有其可怕性。一旦某個環(huán)節(jié)出現(xiàn)背叛,據(jù)此原則行事的博弈將永無休止背叛下去。所以我們又設(shè)計了修正的一報還一報策略,作為人際關(guān)系中的指導(dǎo)。4、一報還一報
—人際交往個體原則重復(fù)博弈理論上導(dǎo)致了合作61生活中有很多事情,法律和道德不好約束美國密西根大學(xué)學(xué)者羅伯特·愛克斯羅德提出了一報還一報策略。他是一個政治科學(xué)家,研究方向是人與人之間的合作關(guān)系。研究前提:一、每個人都是自私的;二、沒有權(quán)威干預(yù)個人決策。研究的問題:一、人為什么要合作。二、人什么時候合作、什么時候不合作。三、如何使別人與你合作。生活中有很多事情,法律和道德不好約束62一報還一報策略優(yōu)點:1、善良,是指它第一部總是向?qū)Ψ奖磉_善意。它堅持永遠不首先背叛對方,開始總是選擇合作,而不是一開始就選擇背叛或主動作弊。
2、可激怒,是指對方出現(xiàn)背叛行動時,它能夠及時識別并一定要采取背叛的行動來報復(fù),不會讓背叛者逍遙法外。
3、寬容,是指它不會因為別人一次背叛,長時間懷恨在心或者沒完沒了的報復(fù),而是在對方改過自新、重新回到合作軌道時,能既往不咎的恢復(fù)合作。
4、簡單,是指它的邏輯清晰,易于識別,能讓對方在較短時間內(nèi)辨別出來其策略所在。
5、不妒忌,是指它不耍小聰明,不占對方便宜,不在任何雙邊關(guān)系中爭強好勝。
一報還一報策略優(yōu)點:63一報還一報策略應(yīng)用于現(xiàn)實社會的缺陷:由于現(xiàn)實中的人會有誤會的存在,一報還一報應(yīng)用于現(xiàn)實社會主要由兩個缺陷:一是太容易激發(fā)背叛;二是它缺少一個宣布“到此為止”的機制。如何克服:在“在一在二不在三”的原則下,采用修正的一報還一報策略,一是寬大的一報還一報,即以一定的概率不報復(fù)對方的背叛;二是悔過的一報還一報,即以一定的概率主動停止背叛。處事哲學(xué):以直報怨(擯棄以德報怨和以怨報怨)一報還一報策略應(yīng)用于現(xiàn)實社會的缺陷:由于現(xiàn)實中的人會有誤會的64對于正在戀愛中的人們來說,獲得幸福愛情的博弈原則應(yīng)該是:
(1)善意而不是惡意的對待戀人。這個道理很簡單了,無須多說。
(2)寬容而不是尖刻地對待戀人。幸福的戀人可能并不是忠貞不二的,當(dāng)然也肯定不是見異思遷的,他們能夠生活得愉快,關(guān)鍵是能夠彼此寬容,既寬容對方的缺點,甚至也寬容他偶爾的不忠貞。而尖刻地對待戀人的人,對戀人的偶爾不忠貞總是不肯遷就的人,往往也都不會幸福。(3)強硬而不是軟弱地對待戀人。就是要在我永遠愛你的善意的前提下,做到有愛必報,有恨也必報,以眼還眼,以牙還牙,以其人之道,還治其人之身。這其中,當(dāng)然是要有限度和分寸的。比如對戀人與其他異性的親熱行為,要有極其強烈的敏感與斬釘截鐵地回報,當(dāng)然,每次發(fā)脾氣都是有限度的,而且還要能寬容對方。
(4)簡單明了而不是山環(huán)水繞地對待戀人。愛克斯羅德的實驗證明,在博弈過程中,過分復(fù)雜的策略使得對手難于理解,無所適從,因而難以建立穩(wěn)定的合作關(guān)系。
對于正在戀愛中的人們來說,獲得幸福愛情的博弈原則應(yīng)該是:
65其實,戀愛只是一個例子,在生活中的各種各樣的人類交往中,修正的一報還一報策略都是上上之選,因為它促進了人們之間的長久的合作,取得了共贏。那么在交往中具體采用什么樣的方法提高合作性呢?
(1)要建立持久地關(guān)系。即使是愛情,也需要建立婚姻契約以維持雙方的合作。
(2)要增強識別對方行動的能力,如果不清楚對方是合作還是不合作,就沒法回報他了。
(3)要維持聲譽,說要報復(fù)就一定要做到,人家才知道你是不好欺負的,才不敢不與你合作。
(4)能夠分步完成的對局不要一次完成,以維持長久關(guān)系,比如,貿(mào)易、談判都要分步進行,以促使對方采取合作態(tài)度。
(5)不要嫉妒人家的成功,"一報還一報"正是這樣的典范。
(6)不要首先背叛,以免擔(dān)上罪魁禍?zhǔn)椎牡赖聣毫Α?/p>
(7)不僅對背叛要回報,對合作也要作出回報。
(8)不要耍小聰明,占人家便宜。
友善、有原則、寬容、簡單、不嫉妒朋友的成功,這些信條應(yīng)是我們每個人的為人處世之道。其實,戀愛只是一個例子,在生活中的各種各樣的人類交往中,修正66
五、人質(zhì)困境
—多個人的囚徒困境
在一群人面對威脅或損失時,“第一個采取行動”的決定是很難做出的,因為它意味著將付出慘重代價。這個困境便就叫做人質(zhì)困境。需要協(xié)調(diào)和個人犧牲才能有所收獲的事情,做起來可能具有人們難以想像的難度。僅僅用道德的呼喚來讓人們挺身而出與邪惡作斗爭是不現(xiàn)實的,而且,要任何一個人在人質(zhì)困境中首先采取行動并獨自承擔(dān)報復(fù)的后果都是不公平的。解決方法:提升人的群體理性,加強溝通與合作。
五、人質(zhì)困境
—多個人的囚徒困境
在一群人面對威脅或損失67人質(zhì)困境問題產(chǎn)生的機制稱為“手風(fēng)琴效應(yīng)”,每一個折疊都會推動或拉動鄰近一個折疊。每一個體都做了相同的選擇,比如一車人面對兩個劫匪選擇沉默,但都是錯誤的選擇。個體理性和完全理性:以個體利益最大為目標(biāo)的利息沒那個被稱為個體理性,而有完美的分析判斷能力和不會犯選擇行為的錯誤被稱為完全理性。完全理性包括追求最大利益的理性意識、分析推理能力、識別判斷能力、記憶能力和準(zhǔn)確行為能力等多方面的完美表現(xiàn),其中任何一方面不完美就不屬于完全理性。人質(zhì)困境問題產(chǎn)生的機制稱為“手風(fēng)琴效應(yīng)”,每一個折疊都會推動68六、酒吧博弈
—混沌系統(tǒng)中的策略酒吧問題是美國人阿瑟(W.B.Arthur)教授提出的。酒吧問題是指這樣一個博弈:有一群人,比如總共有100人,每個周末均要決定,是去附近的一個酒吧活動還是呆在家里。該酒吧的容量是有限的,比如空間是有限的,或者座位是有限的。我們假定酒吧的容量是60人,或者說座位是60個。如果去酒吧的人數(shù)少于60,并且他也去了,他的決定就是正確的;或者,如果去酒吧的人超過60人,而他沒有去——當(dāng)然這只有事后才知道,他的決定也是正確的。否則,其決定是錯誤的。這里,我們假定他們之間不存在信息交流。我們看到,每個人根據(jù)對總的去酒吧人數(shù)的預(yù)測,而決定去酒吧與否。如果他預(yù)測去酒吧的人數(shù)超過60人,他將做出“不去酒吧”的決定,如果其預(yù)測不超過60人,他將做出“去酒吧”的決定。他們是如何做出預(yù)測呢?六、酒吧博弈
—混沌系統(tǒng)中的策略酒吧問題是美國人阿瑟(W.69“股票買賣”、“交通擁擠”以及“足球博彩”等等問題都是酒吧博弈模型的延伸。在現(xiàn)行的說法中,對這一類博弈統(tǒng)統(tǒng)稱為“少數(shù)人博弈”。酒吧博弈的研究,對于我們的現(xiàn)實啟示就在于:1、從一個非線性系統(tǒng)的整體來說,其變化往往是不可預(yù)測的。要采取正確的決策,必須了解其變化規(guī)律。所謂非線性的混沌系統(tǒng),也以理解為:2是1的2倍,但100萬并不是1的100倍。2、對于出身于一個混沌系統(tǒng)中的個體來說,在無法預(yù)測的過程中可以采取恰當(dāng)?shù)牟呗裕⑶铱梢在吋軆?。在這樣的策略中,少數(shù)者策略是值得關(guān)注的?!肮善辟I賣”、“交通擁擠”以及“足球博彩”等等問題都是酒吧博70混沌系統(tǒng)中的解決方案:1、尋找臨界點在線性系統(tǒng)中,整體正好等于所有部分的相加,因此系統(tǒng)中的每一部分都可以自由地做自己的事情而不需要關(guān)心其他部分。在非線性系統(tǒng)中,整體并不等于所有部分的相加,它可能大于所有部分的相加,因為系統(tǒng)中的一切都是相關(guān)聯(lián)的。2、巧妙利用帶動效應(yīng),注重積累千萬不要輕視了細微的力量,而且更要堅持將一絲一毫的力量積累成最后的成功!3、運用“少數(shù)者”策略往往是那些與大眾不同的少數(shù)者,能夠順風(fēng)順?biāo)馗淖兠\。4、避開競爭激烈的獨木橋
改變以自己的需求為中心的傳統(tǒng)想法,另辟蹊徑。
混沌系統(tǒng)中的解決方案:1、尋找臨界點71七、槍手博弈這個博弈模型體現(xiàn)了王者的悲哀。三人對槍自決,甲乙丙槍法優(yōu)劣遞減。槍手們自己知道,在多方對戰(zhàn)的時候,最關(guān)鍵的并不在于先擊倒哪個對手,而是要先保全自己。這些成就了最后無奈而神奇的結(jié)局,結(jié)局不取決于同時開槍還是先后開槍,最優(yōu)良的槍手,倒下的概率最高。而最差的槍手,存貨的希望卻最大。因為沒有人會把威脅最小的槍手列為一號目標(biāo)。在這里,后發(fā)制人的弱勢者將勝出。這個博弈模型,給了弱勢者一份希望。七、槍手博弈這個博弈模型體現(xiàn)了王者的悲哀。三人對槍自決,甲乙72兩種對弈方式:第一種互動方式是同時發(fā)生。比如囚徒困境故事中的情節(jié),參與者同時出招,完全不知道其他人走哪一步。不過,每個人必須心中有數(shù),知道這個博弈游戲存在其他參與者,而這些人反過來也非常清楚這一點。因此,每個人必須設(shè)想一下若是自己處在其他人的位置,會做出什么反應(yīng),從而預(yù)計自己這一步會帶來什么結(jié)果。他選擇的最佳策略也是這一全盤考慮的一個組成部分。第二種方式是參與者的行動相繼發(fā)生,輪流出招。每個參與者在輪到自己的時候.必須展望一下他的這一步行動將會給其他人以后的行動造成什么影響,反過來又會對自己以后的行動造成什么影響。也就是說,相繼出招的博弈中,每一個參與者必須預(yù)計其他參與者接下來會有什么反應(yīng),據(jù)此盤算自己的最佳招數(shù)。這種向前展望、倒后推理的方法非常重要,是確定策略時的一個基本準(zhǔn)則。兩種對弈方式:第一種互動方式是同時發(fā)生。比如囚徒困境故事中的73置身槍手博弈中的解決方法:1、明了同時和相繼出招的策略博弈法則:假如你有一個優(yōu)勢策略.請照辦。不要考慮你的對手會怎么做。假如你沒有一個優(yōu)勢策略,但你的對手有,那么就假定他會采用這個優(yōu)勢策珞,相應(yīng)選擇你自己最好的做法。2、注重對手以外博弈方的影響
除了預(yù)測對手的行動之外,還必須對第三方的策略有清醒的估計。博弈中可以通過放棄自己的攻擊機會.而取得更好的結(jié)果。你的幸存機會不僅取決于你自己的本事,還要看你威脅到的人。
3、慎重對待進攻方向的選擇如果在多方參與的博弈中,自己未能占據(jù)實力上的優(yōu)勢??梢苑治鲞x擇方向,在某個局部點,集中自己所有的資源并加以整合,造成在細分的環(huán)節(jié)上對強者的優(yōu)勢,從而成為博弈中的勝利者。4、要有置身事外的智慧即使是槍手博弈.在槍彈橫飛之前甚至之中,也仍然會出現(xiàn)某種回旋空間。當(dāng)另外兩方相爭,第三者越是保持自己的含糊態(tài)度,保持一種對另外兩方的威脅態(tài)勢.其地位越是重要。置身槍手博弈中的解決方法:1、明了同時和相繼出招的策略2、注74八、獵鹿博弈:集體優(yōu)化獵鹿博弈又稱獵鹿模型(StagHuntModel)、獵人的帕累托效率,源自啟蒙思想家盧梭的著作《論人類不平等的起源和基礎(chǔ)》中的一個故事。奧曼于1987年提出了“相關(guān)均衡”機制。所謂相關(guān)均衡是指,通過某種客觀的信號裝置以及當(dāng)事人對信號的反應(yīng),使本來各自為政的個體行為之間相互發(fā)生關(guān)系,形成一種共贏的結(jié)果。在一個博弈中,參與者的策略往往有四種組合:第一,都采取合作的方式,絕不背叛,這對集體來說是最優(yōu)的策略;第二,本人采取不合作的方式但個人收益是最大的,這對個人來說是最優(yōu)的策略;第三,所有的參與者都選擇背叛,這對集體來說是最壞的結(jié)果,同時對個人而言也有可能是最壞的結(jié)果;第四,就是當(dāng)別人采取不合作態(tài)度時自己卻堅守合作的方式,這種情況對個人和集體來說都不是最優(yōu)策略,而且從個人追求自身效益最大化的動機來看,做出這種選擇幾乎不可能。
八、獵鹿博弈:集體優(yōu)化獵鹿博弈又稱獵鹿模型(StagHun75帕累托(Pareto)效率最優(yōu):經(jīng)濟的效率體現(xiàn)于配置社會資源以改善人們的境況,特別要看資源是否已經(jīng)被充分利用。如果資源已經(jīng)被充分利用,要想改善再改善我就必須損害你,要想再改善你就必須損害我,一句話,如果要想再改善任何人都必須損害別人,這時候就說一個經(jīng)濟已經(jīng)實現(xiàn)了帕累托效率最優(yōu)。說明:1.Pareto效率只關(guān)心每個人的福利,而不是不同人的相對福利,不關(guān)心不平等。使富人變好、窮人原地踏步的變化仍然是帕累托改進。2.Pareto效率認為,每個人對自己福利的感覺最重要,個人是“自己需要什么”的最好裁判。帕累托(Pareto)效率最優(yōu):76格雷特?哈定(1915-2003)是美國著名的生態(tài)學(xué)家,他創(chuàng)立了世界上第一部《生態(tài)法》,其成名之作為1968年發(fā)表在《科學(xué)》雜志上的論文《共有地悲劇》(TragedyofCommons)。文章揭示了一種人類共有資產(chǎn)的集體困境,哈定指出:“在共享公有物的社會中,每個人,也就是所有人都追求各自的最大利益。這就是悲劇的所在。每個人都被鎖定在一個迫使他在有限范圍內(nèi)無節(jié)制地增加牲畜的制度中。毀滅是所有人都奔向的目的地。因為在信奉公有物自由的社會當(dāng)中,每個人均追求自己的最大利益?!弊詈蟆肮形镒杂山o所有人帶來了毀滅”,這就是所謂的“共有地悲劇”,也稱為“哈定悲劇”。哈丁悲劇反映的社會問題:人口爆炸、污染、過度捕撈、過度砍伐和不可再生資源的消耗等等。防止哈丁悲劇的辦法一是制度上,建立中心化的權(quán)利機構(gòu)二是道德約束,使道德約束與非中心化的獎懲聯(lián)系在一起。格雷特?哈定(1915-2003)是美國著名的生態(tài)學(xué)家,他創(chuàng)77九、智豬博弈
——付出與收獲的啟示假設(shè)豬圈里有一頭大豬、一頭小豬。豬圈的一頭有豬食槽,另一頭安裝著控制豬食供應(yīng)的按鈕,按一下按鈕會有10個單位的豬食進槽,但是誰按按鈕就會首先付出2個單位的成本,若大豬先到槽邊,大小豬吃到食物的收益比是9∶1;同時到槽邊,收益比是7∶3;小豬先到槽邊,收益比是6∶4。那么,在兩頭豬都有智慧的前提下,最終結(jié)果是小豬選擇等待。小豬行動小豬等待大豬行動5,14,4大豬等待9,-10,0九、智豬博弈
——付出與收獲的啟示假設(shè)豬圈里有一頭大豬、一頭78重復(fù)剔除嚴(yán)格劣勢策略:首先找出某參與人的嚴(yán)格劣勢策略,將它剔除,重新構(gòu)造一個不包括已剔除策略的新博弈;然后,繼續(xù)剔除這個新的博弈中某一參與人的嚴(yán)格劣勢策略;重復(fù)這一過程,直到剩下唯一的策略組合為止。剩下的這個唯一的策略組合,就是這個博弈的均衡解,稱為“重復(fù)剔除的占有策略均衡”。對管理者啟示:為杜絕這種搭便車行為,可采用三個方案:1、減量方案。2、增量方案。3、減量加移位方案。重復(fù)剔除嚴(yán)格劣勢策略:首先找出某參與人的嚴(yán)格劣勢策略,將它剔79十、警察與小偷博弈
——隨機策略的選擇某個小鎮(zhèn)上只有一名警察,他負責(zé)整個鎮(zhèn)的治安?,F(xiàn)在我們假定,小鎮(zhèn)的一頭有一家酒館,另一頭有一家銀行。再假定該地只有一個小偷。因為分身乏術(shù),警察一次只能在一個地方巡邏;而小偷也只能去一個地方。若警察選擇了小偷偷盜的地方巡邏,就能把小偷抓?。欢绻⊥颠x擇了沒有警察巡邏的地方偷盜,就能夠偷竊成功。假定銀行需要保護的財產(chǎn)價格為2萬元,酒館的財產(chǎn)價格為1萬元。警察怎么巡邏才能使效果最好?最常見的做法是,警察對銀行進行巡邏。這樣,警察可以保住2萬元的財產(chǎn)不被偷竊。但是假如小偷去了酒館,偷竊一定成功。這種做法是警察的最好做法嗎?答案是否定的。警察最好的策略是,抽簽決定去銀行還是酒館。銀行的價值是酒館的兩倍,用兩個簽代表,比如抽到1、2號簽去銀行,抽到3號簽去酒館。這樣警察有2/3的機會去銀行巡邏,1/3的機會去酒館。小偷的最優(yōu)策略是:以同樣抽簽的辦法決定去銀行還是去酒館偷盜,與警察不同的是抽到1、2號簽去酒館,抽到3號簽去銀行。這樣小偷有1/3的機會去銀行,2/3的機會去酒館。十、警察與小偷博弈
——隨機策略的選擇某個小鎮(zhèn)上只有一名警80純策略:指參與者在他的策略空間中選取唯一確定的策略,是參與者一次性選取并且一直堅持的策略混合策略:是指參與者在各種被選策略中采取隨機方式選取并且可以改變,而使之滿足一定的概率的策略最大最小定理:在二人零和博弈中,參與者的利益嚴(yán)格相反(一人所得等于另一人所失),每個參與者盡量使對手的最大收益最小化,而他的對手則努力使自己的最小收益最大化。純策略:指參與者在他的策略空間中選取唯一確定的策略,是參與者81十一、斗雞博弈
——狹路相逢的策略試想有兩人狹路相逢,每人有兩個行動選擇:一是退下來,一是進攻。如果一方退下來,而對方?jīng)]有退下來,對方獲得勝利,這人就很丟面子;如果對方也退下來,雙方則打個平手;如果自己沒退下來,而對方退下來,自己則勝利,對方則失?。蝗绻麅扇硕记斑M,那么則兩敗俱傷。因此,對每個人來說,最好的結(jié)果是,對方退下來,而自己不退。乙前進乙后退甲前進-2,-21,-1甲后退-1,1-1,-1十一、斗雞博弈
——狹路相逢的策略試想有兩人狹路相逢,每人82啟示:兩只斗雞在決斗的時候,無論選擇進或退都是一個難題,因為納什均衡已經(jīng)給出了一勝一敗的最優(yōu)策略。在很多較量下,死拼將是得不償失的,因為很可能給第三者機會。因此,兩個已經(jīng)在戰(zhàn)場的強勢力很可能自覺的遵循納什均衡,當(dāng)一方攻擊時,另一方暫退。雖然可能某方暫時受損,但較之于兩敗俱傷是好得多的。不過,要維持這一狀況,必須保證下一次先期受損的一方發(fā)動攻勢的時候,另一方同樣的后退。于是這樣的攻擊性行為開始變得“儀式化”,沒有人真正流血。啟示:兩只斗雞在決斗的時候,無論選擇進或退都是一個難題,因為83十二、協(xié)和謬誤20世紀(jì)60年代,英法兩國政府聯(lián)合投資開發(fā)大型超音速客機,即協(xié)和飛機。該種飛機機身大、裝飾豪華并且速度快,其開發(fā)可以說是一場豪賭,單是設(shè)計一個新引擎的成本就可能高達數(shù)億元。難怪政府也會被牽涉進去,竭力要為本國企業(yè)提供更大的支持。項目開展不久,英法兩國政府發(fā)現(xiàn):繼續(xù)投資開發(fā)這樣的機型,花費會急劇增加,但這樣的設(shè)計定位能否適應(yīng)市場還不知道;但是停止研制也是可怕的,因為以前的投資將付諸東流。隨著研制工作的深入,他們更是無法做出停止研制工作的決定。協(xié)和飛機最終研制成功,但因飛機的缺陷(如耗油大、噪音大、污染嚴(yán)重等)以及運營成本太高,不適合市場競爭,英法政府為此蒙受很大的損失。在研制過程中,如果英法政府能及早放棄,本來可以使損失減少,但他們沒能做到。最后,英國和法國航空公司宣布協(xié)和飛機退出民航市場,才算是從這個無底洞中脫身。這也是“壯士斷腕”的無奈之舉。十二、協(xié)和謬誤20世紀(jì)60年代,英法兩國政府聯(lián)合投資開發(fā)大型84人們往往會陷入類似的誤區(qū):一項工作的成本越大,對它的后續(xù)投入就越多。其實不僅是在制造協(xié)和飛機這樣的重大項目上,就是在日常的生活中,人們在決定是否繼續(xù)做一件事情的時候,不僅是看它對自己有沒有好處,而且也過于注意自己是不是已經(jīng)在這件事情上面有過投入。我們把那些已經(jīng)發(fā)生、不可收回的支出,如時間、金錢、精力稱為“沉沒成本”。沉沒的意思是說,你在正式完成交易之前投入的成本,如果一旦交易不成,就會白白損失掉。但如果對沉沒成本過分眷戀,就會繼續(xù)原來的錯誤,造成更大的虧損。怎么才能讓自己擺脫沉沒成本的羈絆呢?一是在進行一項事業(yè)之前的決策要慎重,要在掌握了足夠信息的情況下,對可能的收益與損失進行全面的評估;二是一旦形成了沉沒成本,就必須要承認現(xiàn)實,認賠服輸,避免造成更大的損失。人們往往會陷入類似的誤區(qū):一項工作的成本越大,對它的后續(xù)投入85鱷魚法則:假定一只鱷魚咬住你的腳,如果你用手去試圖掙脫你的腳,鱷魚便會同時咬住你的腳與手。你愈掙扎,就被咬住得越多。所以,萬一鱷魚咬住你的腳,你唯一的辦法就是犧牲一只腳。鱷魚法則就是:當(dāng)你發(fā)現(xiàn)自己的行動背離了既定的方向,必須立即止損,不得有任何延誤,不得存有任何僥幸。
機會成本:為選擇最優(yōu)方案而放棄的次優(yōu)方案的價值協(xié)和謬誤的啟示:人生最大的效率其實在于,真正有勇氣來改變可以改變的事情,有度量接受不可改變的事情,有智慧來分辨兩者的不同。鱷魚法則:機會成本:為選擇最優(yōu)方案而放棄的次優(yōu)方案的價值協(xié)和86十三、蜈蚣博弈
——從終點出發(fā)的思維一場顛前倒后的博弈。蜈蚣博弈的機理是以最終的結(jié)果倒退至開始。這是一個睿智的策略,因果相報,把握好因緣,自有好結(jié)果。它的另一個好處,就是使得未來的計劃明晰化,使你不再徘徊。只可惜,很多時候,我們?nèi)鄙倏赐该跃值难劬?。一個典型的海盜分金模型,提供了一個新的推理方法,倒推法。它存在一個線性思維鏈:假如我這么做,我的對手可以那么做,反過來我應(yīng)該這樣應(yīng)對……。它實際上是通過“向前展望—倒后推理”的法則,找出最佳行動方式。很多學(xué)者已經(jīng)用科學(xué)的方法推導(dǎo)出:倒推法是分析完全且完美信息下的動態(tài)博奔的有用工具,也符合人們的直覺,但是在某種情況下卻存在著無法解釋的缺陷。這個博弈告訴我們,更多時候,決定命運的是選擇,而非機會。十三、蜈蚣博弈
——從終點出發(fā)的思維一場顛前倒后的博弈。蜈87海盜分金有5個海盜搶得100枚金幣,在如何分贓問題上爭吵不休。于是他們決定:(1)抽簽決定各人的號碼【1,2,3.4.5】。(2)由1號提出分配方案,然后5人表決,如果方案超過半數(shù)同意就被通過.否則他將被扔進大海喂鯊魚。(3)1號死后,由2號提方案,4人表決.當(dāng)且僅當(dāng)超過半數(shù)同意時方案通過,否則2號同樣被扔進大海。(4)依次類推,直到找到一個每個人都接受的方案。如果只剩下5號,他當(dāng)然接受一人獨吞的結(jié)果。假定海盜都是理性的,判決都能執(zhí)行,那么,如果你是第一個強盜,你該如何提出分配方案才能使自己的收益最大化?海盜分金有5個海盜搶得100枚金幣,在如何分贓問題上爭吵不休88具體分析:5號:巴不得把所有人都進去喂鯊魚4號:如果1~3號強盜都喂了鯊
溫馨提示
- 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
- 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
- 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
- 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負責(zé)。
- 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請與我們聯(lián)系,我們立即糾正。
- 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時也不承擔(dān)用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。
最新文檔
- 蘇教版數(shù)學(xué)一年級下冊教案
- 2024年游艇碼頭物業(yè)委托管理及船舶維護服務(wù)協(xié)議3篇
- 2024年甲乙雙方關(guān)于物聯(lián)網(wǎng)技術(shù)研發(fā)與推廣的合同
- 商場工作計劃模板七篇
- 減溫減壓閥行業(yè)行業(yè)發(fā)展趨勢及投資戰(zhàn)略研究分析報告
- 簡短的個人述職報告
- 2022新學(xué)期開學(xué)感悟(10篇)
- 以家為話題作文15篇
- 幼兒園大班體育教案教學(xué)
- 土木工程認知實習(xí)報告4篇
- 專題06手拉手模型(原卷版+解析)
- 《珍愛生命拒絕毒品》主題班會課件
- 儲能鋰離子電池 液冷熱管理系統(tǒng)運行和維護規(guī)范
- GB/T 32399-2024信息技術(shù)云計算參考架構(gòu)
- 宮腔鏡手術(shù)并發(fā)癥及處理
- 安全生產(chǎn)治本攻堅三年行動方案2024~2026(工貿(mào))
- 2024版內(nèi)蒙古自治區(qū)勞動合同書(臨時工、季節(jié)工、農(nóng)民輪換工)
- 急性化膿性中耳炎病人的護理課件
- 中小學(xué)美術(shù)教學(xué)論
- 臨床醫(yī)學(xué)研究生畢業(yè)答辯模板
- 中藥煎煮協(xié)議書
評論
0/150
提交評論