版權(quán)說(shuō)明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請(qǐng)進(jìn)行舉報(bào)或認(rèn)領(lǐng)
文檔簡(jiǎn)介
博弈論與決策管理主講老師:王若文博弈論與決策管理主講老師:王若文王若文,湖南長(zhǎng)沙人;1987年畢業(yè)于北京大學(xué)中興通訊企管部經(jīng)理、總裁秘書(shū)三一重工人力資源總監(jiān)、行政副總裁彩虹集團(tuán)人力資源總監(jiān)、副總裁神州通集團(tuán)人力資源總監(jiān)、培訓(xùn)總監(jiān)中華網(wǎng)CHINA.COM
中國(guó)區(qū)人力資源總監(jiān)
2003年深圳首屆“十大金領(lǐng)”人物之一;
2004年深圳百名“特區(qū)之子”人物之一;
2010年最受歡迎的“中式人本管理專家”;
2011年金蝶公司全國(guó)巡場(chǎng)“領(lǐng)袖峰會(huì)”金牌主持2013年培訓(xùn)TOP100-最佳人力資源及領(lǐng)導(dǎo)力管理專家。清華大學(xué)總裁班、北京大學(xué)匯豐商學(xué)院、浙江大學(xué)、新疆財(cái)經(jīng)大學(xué)、上海財(cái)經(jīng)大學(xué)EMBA班特聘領(lǐng)導(dǎo)力和人力資源講師。上市企業(yè)現(xiàn)職:廣州通盈投資公司董事長(zhǎng)王若文,湖南長(zhǎng)沙人;1987年畢業(yè)于北京大學(xué)上現(xiàn)職:廣州通盈七“到”輪回獲取思想,更在乎獲得方法;獲得知識(shí),更在乎解決問(wèn)題。錯(cuò)少多學(xué)心到眼到耳到口到手到悟到做到練為什么要學(xué)?習(xí)七“到”輪回獲取思想,更在乎獲得方法;錯(cuò)少多學(xué)心到眼到耳到口P-4頁(yè)知道悟到做到得到優(yōu)秀管理者的絕密八字P-4頁(yè)知道悟到做到得到優(yōu)秀管理者的絕密八字克服貪嗔癡表達(dá)"好"心情微笑、主動(dòng)、回避、韜光幽默、語(yǔ)氣、適可、得讓謙卑、順從、真誠(chéng)、舍得一打方法:先處理好心情,再學(xué)習(xí)好課程克服貪嗔癡表達(dá)"好"心情微笑、主動(dòng)、回避、韜光一打方法:先斯大林時(shí)代的蘇聯(lián),一個(gè)樂(lè)隊(duì)指揮坐火車時(shí)看樂(lè)譜,兩個(gè)克格勃軍官以為是密碼,就將他抓了起來(lái),他說(shuō)那是柴可夫斯基的樂(lè)譜,但無(wú)無(wú)濟(jì)于事。第二天,克格勃告訴他,已把他的同伙柴可夫斯基也抓起來(lái)了,正在招供。他們倆面臨一種艱難的選擇:如一方招供另一方不招,坦白者從寬判1年,抗拒者從嚴(yán)判25年;如果雙方都招供,則各以間諜罪判10年;如雙方均不招供,克格勃無(wú)法定罪,各自坐牢3年。他們被分別關(guān)押,請(qǐng)問(wèn)應(yīng)該招、還是不招?招還是不招?這是個(gè)問(wèn)題斯大林時(shí)代的蘇聯(lián),一個(gè)樂(lè)隊(duì)指揮坐火車時(shí)看樂(lè)譜,兩個(gè)克格勃軍官可能的思想斗爭(zhēng)是什么?坦白的原因
1、可能會(huì)被判的很輕
2、最壞的結(jié)果-10,-1,比-25,-3要好抵賴的原因
1、我沒(méi)犯罪,不愿意招
2、雙方抵賴各-3,比雙方坦白各-10好
3、人云:坦白從寬牢底坐穿,抗拒從嚴(yán)回家過(guò)年可能的思想斗爭(zhēng)是什么?一、博弈論簡(jiǎn)介
博弈論(GameTheory)又名對(duì)策論,游戲論失火了,屋里人很多,你往哪個(gè)門跑—這就是博弈你的行動(dòng)結(jié)果不僅取決于你的策略選擇,同時(shí)也取決于他人的策略選擇。它研究個(gè)體或組織之間存在利益沖突情況下如何進(jìn)行最優(yōu)決策。一、博弈論簡(jiǎn)介博弈論是40年代數(shù)學(xué)家馮·諾依曼和經(jīng)濟(jì)學(xué)家?jiàn)W斯卡·摩根斯坦首先提出的。在經(jīng)濟(jì)學(xué)、政治學(xué)、社會(huì)學(xué)獲得了巨大的應(yīng)用。1994年諾貝爾經(jīng)濟(jì)學(xué)獎(jiǎng)?lì)C發(fā)給了3位博弈論專家:
納什Nash
、澤爾騰Selten
、哈桑尼Harsanyi
。中國(guó)人研究博弈論是有優(yōu)勢(shì)的:《三國(guó)演義》《孫子兵法》《三十六計(jì)》《厚黑學(xué)》都是博弈論教材,如何在人與人的博弈中取得成功。博弈論是40年代數(shù)學(xué)家馮·諾依曼和經(jīng)濟(jì)
1994年諾貝爾經(jīng)濟(jì)學(xué)獎(jiǎng)獲得者:美國(guó)數(shù)學(xué)家JohnF.Nash;德國(guó)經(jīng)濟(jì)學(xué)家ReinhardSelten;美籍匈牙利經(jīng)濟(jì)學(xué)家JohnC.Harsanyi。
1928年Nash出生于美國(guó),1950年獲Princeton大學(xué)數(shù)學(xué)博士學(xué)位,曾先后任教于MIT和Princeton大學(xué)。其博士論文《非合作博弈》首次區(qū)分了合作博弈與非合作博弈,并且提出了非合作博弈的納什均衡概念。1930年
Selten出生于現(xiàn)屬于波蘭的德國(guó)城市,1961年獲法蘭克福大學(xué)數(shù)學(xué)博士學(xué)位,曾先后任教于柏林自由大學(xué)、比勒菲爾特大學(xué)和波恩大學(xué)。Selten的主要貢獻(xiàn)是首次對(duì)分析動(dòng)態(tài)策略交互作用深化了Nash均衡的概念。1920年Harsanyi出生于匈牙利,1947年獲布達(dá)佩斯大學(xué)博士學(xué)位,后逃亡澳大利亞,再到美國(guó),1954年獲斯坦福大學(xué)博士學(xué)位,曾先后任教于澳大利亞國(guó)立大學(xué)、加州伯克利分校。于2000年去世。Harsanyi研究和分析了不完全信息博弈,從而為信息經(jīng)濟(jì)學(xué)提供了一個(gè)理論基礎(chǔ)。1994年諾貝爾經(jīng)濟(jì)學(xué)獎(jiǎng)獲得者:1928年Nash出生于美1996年,兩位將博弈論應(yīng)用于不對(duì)稱信息下機(jī)制設(shè)計(jì)的經(jīng)濟(jì)學(xué)家莫里斯(Mirrlees)和維克里(Vickrey)獲諾貝爾經(jīng)濟(jì)學(xué)獎(jiǎng)。2001年三位經(jīng)濟(jì)學(xué)家阿克洛夫(Akerlof)、斯蒂格利茨(Stiglitz)和斯賓塞(Spence)因運(yùn)用博弈論研究信息經(jīng)濟(jì)學(xué)所取得的成就而成為該年度的諾貝爾經(jīng)濟(jì)學(xué)獎(jiǎng)得主。2005年諾貝爾經(jīng)濟(jì)學(xué)獎(jiǎng)授予羅伯特·奧曼和托馬斯·謝林,以表彰他們“運(yùn)用博弈論的分析方法對(duì)現(xiàn)實(shí)的政治、經(jīng)濟(jì)問(wèn)題進(jìn)行分析,改變了我們對(duì)沖突與合作的理解”。1996年,兩位將博弈論應(yīng)用于不對(duì)稱信息下機(jī)制設(shè)計(jì)的經(jīng)濟(jì)學(xué)家博弈的分類1、靜態(tài)博弈與動(dòng)態(tài)博弈參與者行動(dòng)的先后順序,靜態(tài)博弈是同時(shí)作出決策(不了解對(duì)手的決策方案),動(dòng)態(tài)博弈是參與者先后作出決策(后行動(dòng)的人知道先行動(dòng)者的行動(dòng)方案)。2、完全信息博弈與不完全信息博弈對(duì)其他參與者收益支付信息的掌握程度。不完全信息博弈中至少有一人不能確切了解其它決策者收益函數(shù)。3、合作博弈與非合作博弈能否達(dá)成一個(gè)有約束力的協(xié)議,合作博弈強(qiáng)調(diào)集體理性。(經(jīng)濟(jì)學(xué)主要討論非合作博弈)4、一次性博弈與重復(fù)博弈博弈重復(fù)多次進(jìn)行。(注意區(qū)分動(dòng)態(tài)博弈)博弈的分類1、靜態(tài)博弈與動(dòng)態(tài)博弈嚴(yán)格地講,博弈論并不是經(jīng)濟(jì)學(xué)的一個(gè)分支,它是一種方法,應(yīng)用范圍除經(jīng)濟(jì)學(xué)外,還包括政治學(xué)、軍事學(xué)、外交學(xué)、國(guó)際關(guān)系學(xué)、犯罪學(xué)等。但為何博弈論受到經(jīng)濟(jì)學(xué)的重視呢?主要原因有:1、博弈論在經(jīng)濟(jì)學(xué)中得到最廣泛、最成功的應(yīng)用,尤其在寡頭市場(chǎng)理論中得到直接的應(yīng)用。2、博弈論的許多成果也是借助于經(jīng)濟(jì)學(xué)的例子來(lái)發(fā)展的,經(jīng)濟(jì)學(xué)家對(duì)博弈論的貢獻(xiàn)最大。3、博弈論與經(jīng)濟(jì)學(xué)的研究模式一樣:理性人在給定約束條件追求自己的效用最大化。
由于上述原因博弈論逐漸成為主流經(jīng)濟(jì)學(xué)最重要的組成部分。嚴(yán)格地講,二、博弈論基本模型囚徒困境(完全信息靜態(tài)博弈)(A、B共同犯罪被抓,警察分開(kāi)審問(wèn))
BA
坦白不坦白
A=10年A=25年
B=10年B=1年
A=1年A=3年
B=25年B=3年坦白不坦白每一個(gè)人的結(jié)局不僅取決于自身的選擇,同時(shí)也取決于對(duì)手的選擇不管B坦白不坦白,我坦白總是會(huì)少坐一些牢1、囚徒博弈二、博弈論基本模型囚徒困境(完全信息靜態(tài)博弈)坦白不坦白每一囚徒困境(完全信息下的靜態(tài)博弈)“囚徒的困境(Prisoners’Dilemma)”,從博弈論角度看,這是一個(gè)存在占優(yōu)均衡的博弈:因?yàn)閷?duì)囚犯A,B來(lái)說(shuō),無(wú)論對(duì)方如何選擇,“坦白”都是各自的最優(yōu)選擇。雖然從兩名囚犯共同利益看,最好的選擇是合作,即同時(shí)選擇保持沉默,然而,由于猜忌,試圖獲得更大好處等競(jìng)爭(zhēng)性動(dòng)機(jī)阻礙了它們達(dá)到更好的互利選擇,我們將看到,寡頭壟斷廠商經(jīng)常面臨類似的困境。啟示:個(gè)體理性決策常常導(dǎo)致集體非理性結(jié)果囚徒困境(完全信息下的靜態(tài)博弈)“囚徒的困境(Prisone“囚徒的困境”還對(duì)亞當(dāng)·斯密的“看不見(jiàn)的手”的原理提出挑戰(zhàn)。這位經(jīng)濟(jì)學(xué)圣人在《國(guó)富論》中的名言:“每個(gè)人都力圖利用好他的資本,使其能實(shí)現(xiàn)最大的價(jià)值。一般說(shuō)來(lái),他并不企圖增進(jìn)公共福利,他所追求的僅僅是他個(gè)人的利益。但在他這樣做的時(shí)候,有一只看不見(jiàn)的手引導(dǎo)著他去實(shí)現(xiàn)另一種目標(biāo),這種目標(biāo)并非是他本意所要追求的東西。通過(guò)追逐個(gè)人利益,他經(jīng)常增進(jìn)社會(huì)利益。”按照斯密的理論,在市場(chǎng)經(jīng)濟(jì)中,每一個(gè)人都從利己的目的出發(fā),而最終全社會(huì)達(dá)到利他的效果。從某種意義上說(shuō),納什提出的非合作博弈的囚徒悖論實(shí)際上動(dòng)搖了西方經(jīng)濟(jì)學(xué)的基石?!扒敉降睦Ь场边€對(duì)亞當(dāng)·斯密的“看不見(jiàn)的手”的原理提出挑戰(zhàn)。例:投標(biāo)總工程量50,賄賂成本5,甲乙雙方實(shí)力相當(dāng)甲賄賂不賄賂
賄賂不賄賂20200454502525問(wèn)題:賄賂還是不賄賂?均衡:(賄賂,賄賂)乙2、投標(biāo)博弈例:投標(biāo)不賄賂200453、智豬博弈背景:在豬圈里住著一大一小兩頭豬。它們從同一個(gè)食槽獲得食物。但食槽的按鈕與食物的出口分布在相反的兩端。每按一次按鈕,可得10個(gè)單位食物,但需付出2個(gè)單位勞動(dòng)。規(guī)則:若大豬按按鈕:大豬吃6個(gè)單位,小豬吃4個(gè)單位;若小豬按按鈕:大豬吃9個(gè)單位,小豬吃1個(gè)單位;若一起去按:大豬吃7個(gè)單位,小豬吃3個(gè)單位;問(wèn)題:哪頭豬將會(huì)去按按鈕?
小豬按等待按5,14,4
等待9,-10,0大豬3、智豬博弈背景:大豬經(jīng)濟(jì)學(xué)中,這頭小豬也被稱為“免費(fèi)搭便車者”
現(xiàn)實(shí)社會(huì)之中的大豬和小豬何其之多:山寨版的橫行股份公司治理中的大股東與小股東大企業(yè)的人才培訓(xùn)與小企業(yè)的挖腳股市中的散戶跟隨大戶體制改革中的出頭者職場(chǎng)團(tuán)隊(duì)中的小組長(zhǎng)與組員公共設(shè)施或基礎(chǔ)設(shè)施投資:富人與窮人…………經(jīng)濟(jì)學(xué)中,這頭小豬也被稱為“免費(fèi)搭便車者”4、斗雞博弈假設(shè)兩只公雞遇到一起,每只都有兩個(gè)行動(dòng)選擇:進(jìn)攻或后退。后退是很丟面子的事情,若雞甲進(jìn)攻,乙后退,則甲贏。雙方前進(jìn),兩敗俱傷。
雞乙進(jìn)退
雞甲進(jìn)-4,-41,-1退-1,1-1,-1雙方都沒(méi)有占優(yōu)策略存在兩個(gè)穩(wěn)定的狀態(tài)(納什均衡):(-1,1);(1,-1)4、斗雞博弈假設(shè)兩只公雞遇到一起,每只都有兩個(gè)行動(dòng)選擇:進(jìn)攻
雙方都避免兩敗俱傷,斗雞博弈有兩個(gè)納什均衡,一方前進(jìn),另一方后退。由于有兩個(gè)均衡點(diǎn),結(jié)果無(wú)法預(yù)知。具體博弈結(jié)果還取決于其他因素。20世紀(jì)60年代蘇美間的古巴導(dǎo)彈危機(jī)就是一個(gè)斗雞博弈的很好例子。古巴導(dǎo)彈危機(jī)是冷戰(zhàn)時(shí)期蘇美之間最嚴(yán)重的一次危機(jī),赫魯曉夫1962年偷偷將導(dǎo)彈運(yùn)到古巴對(duì)付美國(guó),被美國(guó)U2飛機(jī)偵察到,美國(guó)派出攜帶核武器的戰(zhàn)機(jī)、航母,威脅蘇聯(lián)限期從古巴撤出導(dǎo)彈。蘇美這兩只大公雞均在考慮進(jìn)還是退?戰(zhàn)爭(zhēng)的結(jié)果當(dāng)然是兩敗俱傷,但任何一方退下來(lái)則是很不光彩的事。博弈結(jié)果是蘇聯(lián)從古巴撤回了導(dǎo)彈,做了丟面子的“撤退的雞”,而美國(guó)堅(jiān)持了自己的策略,做了“不退的雞”。當(dāng)然為了給蘇聯(lián)面子,同時(shí)也擔(dān)心戰(zhàn)爭(zhēng),美國(guó)也從土耳其撤了一些導(dǎo)彈。雙方都避免兩敗俱傷,斗雞博弈有兩個(gè)納什均衡,一方前進(jìn)例:兩個(gè)寡頭進(jìn)行價(jià)格戰(zhàn)博弈的收益矩陣。10,1050,50-50,100100,-50低價(jià)低價(jià)高價(jià)高價(jià)廠商B廠商A三、博弈論中的均衡博弈論中的均衡是一組穩(wěn)定的博弈結(jié)果。雙方均不愿先改變策略。博弈的均衡是穩(wěn)定的,因而是可以預(yù)測(cè)的。例:兩個(gè)寡頭進(jìn)行價(jià)格戰(zhàn)博弈的收益矩陣。10,1050,50占優(yōu)策略,又稱支配性策略(dominantstrategy)此類博弈中存在一種策略,無(wú)論B選擇何行動(dòng),該策略對(duì)A都是最優(yōu),則稱此策略為博弈者A的占優(yōu)策略。在本例中,廠商A和廠商B都有不受他人策略影響的占優(yōu)策略,即選擇低價(jià)。占優(yōu)均衡,支配均衡每個(gè)參與者都有并都選擇占優(yōu)策略,由此實(shí)現(xiàn)的均衡稱占優(yōu)均衡。本例為(10,10)。1、占優(yōu)均衡占優(yōu)策略,又稱支配性策略(dominantstrategy2、納什均衡納什均衡(非合作性均衡):納什均衡是這樣一組策略,它使所有博弈參與者都不能再提高其收益。此時(shí),雙方在對(duì)方給定的策略下均不愿意調(diào)整自己的策略。下例中,A有占優(yōu)策略即正常價(jià)格策略,而廠商B沒(méi)有占優(yōu)策略,它必須根據(jù)A的占優(yōu)策略來(lái)確定其戰(zhàn)略選擇,即其選擇受A的選擇的影響。100,20010,10150,-30-20,150高價(jià)格正常價(jià)格廠商B廠商A高價(jià)格正常價(jià)格2、納什均衡納什均衡(非合作性均衡):100,20010,13、占優(yōu)均衡與納什均衡的區(qū)別
占優(yōu)均衡:我所做的是:不管你做什么我所能做的最好的。你所做的是:不管我做什么你所能做的最好的。納什均衡:我所做的是:給定你所做的我所能做的最好的。你所做的是:給定我所做的你所能做的最好的。占優(yōu)均衡是納什均衡的一個(gè)特例3、占優(yōu)均衡與納什均衡的區(qū)別占優(yōu)均衡:我所做的是:不管四、最大最小策略迄今為止,對(duì)廠商行為的分析都建立在利潤(rùn)最大化基礎(chǔ)上。但在一些競(jìng)爭(zhēng)激烈的寡頭壟斷市場(chǎng),馮·諾依曼和摩根斯坦認(rèn)為決策者也可能采取一種風(fēng)險(xiǎn)厭惡策略,即確保在最壞的結(jié)果中得到最好的結(jié)果。這種決策規(guī)則稱最大最小策略(MaximinStrategy):博弈者在可能最少的利潤(rùn)方案中選擇利潤(rùn)最大的方案。四、最大最小策略迄今為止,對(duì)廠商行為的分析都建立在利潤(rùn)最大化風(fēng)險(xiǎn)與均衡由于納什均衡要求理性共識(shí)和一致預(yù)期,當(dāng)人們可能犯小小的錯(cuò)誤時(shí),納什均衡不一定被選擇。如下面這個(gè)博弈中,假定你是A,則多數(shù)人將選擇“下”而不是“上”。上下
左
右8,10-1000,97,66,5只要B有千分之一的概率錯(cuò)誤地選擇右,A的后果將是災(zāi)難性的,A將極力避免這種風(fēng)險(xiǎn),因此會(huì)選擇下。所以,出現(xiàn)的不是納什均衡BA風(fēng)險(xiǎn)與均衡由于納什均衡要求理性共識(shí)和一致預(yù)期,當(dāng)人們可能犯小
如果企業(yè)謀求利潤(rùn)最大化,將有兩個(gè)納什均衡,一家企業(yè)投資推出新產(chǎn)品,另一家企業(yè)不投資產(chǎn)品。最大最小策略,不是利潤(rùn)最大化策略,準(zhǔn)確說(shuō),它是用來(lái)避免十分不利結(jié)果的。對(duì)企業(yè)1來(lái)說(shuō),如果它不投資新產(chǎn)品,利潤(rùn)最小是300萬(wàn),如果它投資,利潤(rùn)最小是200萬(wàn)。對(duì)企業(yè)2數(shù)字也相同。兩家企業(yè)都在最小利潤(rùn)中選最大值。結(jié)果是兩家企業(yè)都不投資新產(chǎn)品。因?yàn)檫@樣的策略能保證至少獲得300萬(wàn)利潤(rùn)。戰(zhàn)略不投資投資投資4,43,66,32,2廠商1廠商2(單位百萬(wàn))不投資
雙寡頭企業(yè)都在考慮是否投資推出新產(chǎn)品。如果企業(yè)謀求利潤(rùn)最大化,將有兩個(gè)納什均衡,一家企業(yè)投資最大最小策略的結(jié)果并不是兩種納什均衡中的一種。原因是這種決策所用的準(zhǔn)則,不是利潤(rùn)最大化,而是避免虧損過(guò)多,最大最小策略是一種保守的策略。不同的決策目標(biāo)可能導(dǎo)致人們選擇不同的策略,最終導(dǎo)致不同的博弈結(jié)果。最大最小策略的結(jié)果并不是兩種納什均衡中的一種。五、重復(fù)剔除嚴(yán)格劣戰(zhàn)略“重復(fù)剔除嚴(yán)格劣戰(zhàn)略”的思路如下:1、首先找出博弈參與人的劣戰(zhàn)略(dominatedstrategy)(假定存在的話),把這個(gè)劣戰(zhàn)略剔除后,剩下的是一個(gè)不包含已剔除劣戰(zhàn)略的新的博弈;然后再剔除這個(gè)新的博弈中的劣戰(zhàn)略;繼續(xù)這個(gè)過(guò)程,直到?jīng)]有劣戰(zhàn)略存在。如果剩下的戰(zhàn)略組合是唯一的,這個(gè)唯一的戰(zhàn)略組合就是“重復(fù)剔除占優(yōu)均衡”。2、如果這樣的解存在,該博弈是“重復(fù)剔除占優(yōu)可解的”。1,01,30,10,40,22,0左中右上下1,01,30,40,2左中1,01,3左中五、重復(fù)剔除嚴(yán)格劣戰(zhàn)略“重復(fù)剔除嚴(yán)格劣戰(zhàn)略”的思路如下:1連續(xù)排除劣勢(shì)策略兩者都沒(méi)有占優(yōu)策略,怎么辦?玩家2玩家1100,10090,11050,120110,4080,8045,50120,3050,3540,40策略ABCabcABCabc90,11050,12050,3540,40
80,8045,50
50,3540,40玩家2玩家1策略連續(xù)排除劣勢(shì)策略兩者都沒(méi)有占優(yōu)策略,怎么辦?玩家2玩家1普林斯頓大學(xué)的一道習(xí)題題目:如果給你兩個(gè)師的兵力,由你來(lái)當(dāng)“司令”,任務(wù)是攻克“敵人”占據(jù)的一座城市,而敵軍的守備力量是三個(gè)師,規(guī)定雙方的兵力只能整師調(diào)動(dòng)。通往城市的道路只有甲乙兩條。當(dāng)你發(fā)起攻擊的時(shí)候,你的兵力超過(guò)敵人,你就獲勝;你的兵力比敵人的守備兵力少或者相等,你就失敗。那么,你將如何制定攻城方案?敵人你方(3,0);(2,1);(1,2);(0,3)(2,0);(1,1);(0,2)其實(shí),這次模擬“作戰(zhàn)”,每一方取勝的概率都是50%,即誰(shuí)勝誰(shuí)負(fù)的可能性是一半對(duì)一半。你這個(gè)司令能否神機(jī)妙算,指揮隊(duì)伍克敵制勝,還得看你的本事。普林斯頓大學(xué)的一道習(xí)題敵人你方(3,0);(2,1);(1六、重復(fù)博弈“囚徒的困境”暗含有一次性博弈假定,結(jié)果陷入了個(gè)體理性決策導(dǎo)致(因?yàn)椴录桑┘w非理性結(jié)果的困境。現(xiàn)在我們改變假定條件,討論博弈可以多次進(jìn)行的重復(fù)博弈(RepeatedGame)。如,囚徒困境博弈中,假定博弈或重復(fù)多次,A對(duì)B宣布如下方針:我將選擇沉默,并要求你也如此來(lái)增進(jìn)各自利益;然而,如果你半途背叛選擇坦白,我從下一階段游戲開(kāi)始便一直采取坦白。這一方針與A利益一致,因而是可信的。六、重復(fù)博弈“囚徒的困境”暗含有一次性博弈假定,結(jié)果陷入了個(gè)重復(fù)博弈中,聲譽(yù)(名聲)十分重要從B角度來(lái)看,和A合作可在每階段得到較好結(jié)果;中途變卦,固然當(dāng)期可得更好結(jié)果,但此后便每次面臨更壞的后果,顯然是不利的。因而,重復(fù)性博弈中,“沉默+沉默”點(diǎn)可能成為對(duì)雙方最佳選擇,因而成為納什均衡點(diǎn)?!捎诓┺臈l件由一次性變?yōu)橹貜?fù)性,均衡狀態(tài)隨之發(fā)生變化。欺騙一次對(duì)方就會(huì)警覺(jué),導(dǎo)致合作失敗。在重復(fù)博弈中,名聲對(duì)得出什么樣的結(jié)果十分重要。重復(fù)博弈中,聲譽(yù)(名聲)十分重要從B角度來(lái)看,和A合作可在每重復(fù)博弈導(dǎo)致合作的例子重復(fù)博弈導(dǎo)致合作的例子我還以為上了戰(zhàn)場(chǎng)就可以亂放槍呢,誰(shuí)知竟有這麼多狗屁規(guī)矩。
“不過(guò)我們也不能全走出去,不然他給你來(lái)個(gè)一窩揣也說(shuō)不定。每次出去一個(gè),其他人守著?!彼麄兙嫖摇叭绻挟?dāng)官的來(lái)了就要特別小心,當(dāng)官的不了解內(nèi)情,一聲令下,他們不想打也得打,你站在外面就活該倒霉?!?/p>
很有道理,我想我又上了一課,希望下課前我還沒(méi)死。戰(zhàn)場(chǎng)上不用考試的,不合格的學(xué)生全得死,沒(méi)有補(bǔ)考的機(jī)會(huì)。這是個(gè)恐怖的課堂!我想學(xué)校里如果成績(jī)不佳就馬上拉出去槍斃的話,學(xué)生們會(huì)怎樣玩命學(xué)習(xí)呢。
類似的例子:一戰(zhàn)的戰(zhàn)場(chǎng)上“我們不開(kāi)槍,你們不開(kāi)槍”標(biāo)語(yǔ)我還以為上了戰(zhàn)場(chǎng)就可以亂放槍呢,誰(shuí)知竟有這麼多狗屁規(guī)矩。
多個(gè)博弈論專家為此編制策略模型,兩兩配對(duì)進(jìn)行比較,博弈反復(fù)多次進(jìn)行,結(jié)果下述簡(jiǎn)單策略效果最好
“針?shù)h相對(duì)”策略:以合作開(kāi)局,隨后博弈參與者就模仿競(jìng)爭(zhēng)對(duì)手上一期的行動(dòng),對(duì)手欺騙(削價(jià)),則下一期我也欺騙(削價(jià))。如果對(duì)方采取合作態(tài)度(提價(jià)),則下期我也合作(提價(jià))。在非合作的、重復(fù)性博弈中,個(gè)體或企業(yè)有不取決于博弈內(nèi)容的最優(yōu)策略嗎?換言之:有沒(méi)有一種簡(jiǎn)單的策略讓我們可以在重復(fù)博弈中利益最大化?多個(gè)博弈論專家為此編制策略模型,兩兩配對(duì)進(jìn)行比較,博弈反復(fù)多針?shù)h相對(duì)策略在重復(fù)博弈中的優(yōu)勢(shì):1、簡(jiǎn)單,不易誤解;2、針?shù)h相對(duì)決不是先搞欺騙,先搞欺騙會(huì)導(dǎo)致合作瓦解;3、決不慫恿欺騙行為,不允許對(duì)這類行為不加懲罰;4、針?shù)h相對(duì)是寬大的,它允許迅速恢復(fù)合作。可以說(shuō),這種策略既是毫不留情的,又是毫不記恨的。真正是“善有善報(bào),惡有惡報(bào)”,而且“無(wú)論善惡,立即得報(bào)”。毛主席的:人不犯我、我不犯人,人若犯我,我必犯人。不幸的是,如果確定知道博弈次數(shù),針?shù)h相對(duì)的策略可能失效。每一方都企圖在最后一次博弈搞欺騙(對(duì)手已沒(méi)機(jī)會(huì)報(bào)復(fù)),前一次也沒(méi)必要合作…,又回到了囚徒困境模式。針?shù)h相對(duì)策略在重復(fù)博弈中的優(yōu)勢(shì):毛主席的:人不犯我、我不犯人七、行動(dòng)有先后:順序性博弈通常的博弈不是參與者同時(shí)選擇,即不是靜態(tài)博弈。在動(dòng)態(tài)博弈中,各博弈方先后依次行動(dòng)。-5,-5-5,-520,1010,20咸餅干咸餅干甜餅干甜餅干廠商B廠商A下面支付矩陣描述了一個(gè)博弈,如果同時(shí)行動(dòng),它有兩個(gè)納什均衡點(diǎn)(“甜,咸”與“咸,甜”)。假定廠商A可以先推出甜餅干(如利潤(rùn)較高),我們就有了序列博弈:A先作決策,B隨后選擇。A決策時(shí)必須考慮競(jìng)爭(zhēng)者的理性反應(yīng):它知道不論自己推出那種餅干,B出于自身利益會(huì)推出另一種。因而A推出甜餅干,B在給定A決策時(shí)選擇咸餅干。結(jié)果兩個(gè)納什均衡點(diǎn)收斂為一個(gè),其中A由于具有先行者優(yōu)勢(shì)(FirstMover’sAdvantage)而得到較大利益,七、行動(dòng)有先后:順序性博弈通常的博弈不是參與者同時(shí)選擇,即不先行優(yōu)勢(shì)
沃爾瑪進(jìn)入不進(jìn)入進(jìn)入-1000,-10002500,0
不進(jìn)入0,30000,0最終的結(jié)果取決于誰(shuí)先采取行動(dòng),如果一方搶先進(jìn)入,另一方只能放棄。(很多企業(yè)寧愿虧損也要多處布點(diǎn))家樂(lè)福鋼鐵大王安德魯·卡內(nèi)基曾經(jīng)說(shuō)過(guò):“第一個(gè)來(lái)的人得到了牡蠣,而第二個(gè)人只得到了貝殼。”如果沃爾瑪和家樂(lè)福兩家公司都想在某一中小城市開(kāi)設(shè)商業(yè)網(wǎng)點(diǎn),由于市場(chǎng)容量有限,當(dāng)兩家公司都進(jìn)入時(shí),大家都可能虧損先行優(yōu)勢(shì)家樂(lè)福鋼鐵大王安德魯·卡內(nèi)基曾經(jīng)說(shuō)過(guò):“第一個(gè)來(lái)的人規(guī)模上千億美元的世界芯片市場(chǎng)提供了另一個(gè)例證:近十幾年來(lái),芯片的需求急劇膨脹,一方面源于個(gè)人電腦和手機(jī)爆炸性需求的拉動(dòng),另一方面諸如汽車、立體聲設(shè)備等產(chǎn)品的日益電子化、精密化。進(jìn)行新投資的時(shí)間問(wèn)題是這一行業(yè)經(jīng)營(yíng)制勝的重要一環(huán)。建立一個(gè)芯片工廠往往要耗資十億多美元,但設(shè)備在3-5年內(nèi)就會(huì)過(guò)時(shí)。80年代初,美國(guó)半導(dǎo)體企業(yè)壟斷了整個(gè)芯片行業(yè)。1984年,價(jià)格的下降使得Intel和德州儀器推遲了建立新的芯片工廠的計(jì)劃。預(yù)計(jì)到這個(gè)形勢(shì),東芝、NEC和Oki電子公司等日本企業(yè)馬上作出反應(yīng),投資增加新的生產(chǎn)能力。80年代末,日本企業(yè)占領(lǐng)了世界芯片市場(chǎng)的80%,而美國(guó)企業(yè)只有可憐的15%,一些美國(guó)企業(yè)如英特爾干脆退出了低端芯片行業(yè)。規(guī)模上千億美元的世界芯片市場(chǎng)提供了另一個(gè)例證:1990年代,這種機(jī)制又得到重演,這次扮演擴(kuò)大生產(chǎn)能力進(jìn)攻者角色的是韓國(guó)。1990年前后,正處于行業(yè)衰退中,主要日本廠商都減少了芯片生產(chǎn)規(guī)模,同時(shí),日本經(jīng)濟(jì)進(jìn)入蕭條狀態(tài),導(dǎo)致籌措資金步履維艱,因此,日本企業(yè)推遲了興建新的芯片工廠的計(jì)劃。相反,韓國(guó)現(xiàn)代,三星和金星電子等則紛紛斥巨資興建芯片工廠。到1994年,韓國(guó)已經(jīng)占有世界芯片市場(chǎng)36%的份額,三星也成為世界最大的芯片生產(chǎn)廠商。1990年代中后期,臺(tái)灣也加入了該產(chǎn)業(yè)的博弈行動(dòng)中,獲得了較大的市場(chǎng)份額。這些公司贏得優(yōu)勢(shì)的主要做法之一就是在商業(yè)周期低谷時(shí)大量投資,形成過(guò)剩生產(chǎn)能力。等到經(jīng)濟(jì)開(kāi)始復(fù)蘇,其他競(jìng)爭(zhēng)對(duì)手發(fā)現(xiàn)再投資已無(wú)利可圖。1990年代,這種機(jī)制又得到重演,這次扮演擴(kuò)大生產(chǎn)能力進(jìn)攻者八、言語(yǔ)博弈:威脅和承諾為了在博弈中獲得對(duì)已有利的結(jié)果,往往會(huì)產(chǎn)生“威脅”和“承諾”的行為。語(yǔ)言哲學(xué)認(rèn)為,語(yǔ)言就是行動(dòng)。言語(yǔ)博弈涉及:聲稱的策略和實(shí)際的策略?,F(xiàn)實(shí)中,各國(guó)的外交聲明,企業(yè)發(fā)出的威脅等。伊拉克對(duì)美國(guó):如果你打我們,我就使用大規(guī)模殺傷性武器。臺(tái)灣問(wèn)題:美國(guó)聲稱,如果中國(guó)武力攻打臺(tái)灣,美國(guó)將介入。中國(guó)聲稱,是否收回臺(tái)灣是中國(guó)內(nèi)政,中國(guó)原來(lái)的不率先使用核武器的聲明在國(guó)內(nèi)戰(zhàn)爭(zhēng)中不適用,溫家寶的“不惜一切代價(jià)”。中國(guó)用“不首先使用核武器”的承諾。八、言語(yǔ)博弈:威脅和承諾為了在博弈中獲得對(duì)已有利的結(jié)果,往往1、威脅:可信的與不可信的B公司降價(jià)不降價(jià)降價(jià)100,200200,-100不降價(jià)600,10001000,700A公司A公司降價(jià)的威脅可信嗎?不可信!如果A公司要讓B公司相信其威脅是可信的,只有一個(gè)途徑:建立一種不按牌理出牌的形象。公司之間經(jīng)常相互發(fā)出信號(hào)以表明他們的意圖、動(dòng)機(jī)和目標(biāo)。有些信號(hào)是威脅性的。例如,A公司宣布,如果誰(shuí)挑起價(jià)格戰(zhàn),它將堅(jiān)決奉陪到底,并宣稱其規(guī)模在本行業(yè)中名列前茅,最有降價(jià)的實(shí)力。是否所有的威脅都是可信的?1、威脅:可信的與不可信的2、威脅的可信度
以前述餅干生產(chǎn)廠為例:先行者有優(yōu)勢(shì),但在雙方都沒(méi)投產(chǎn)之前,廠商B宣布不管其他廠家如何,他都將投產(chǎn)甜餅干,當(dāng)然A可能沒(méi)有理由非得相信他。此時(shí)B訂購(gòu)大宗蔗糖合同,同時(shí)投放昂貴廣告,傳達(dá)相關(guān)信息。A可能就會(huì)放棄。只有威脅變得可信時(shí)才會(huì)生效。此策略可能很有效,但很危險(xiǎn),取決于對(duì)信息的充分了解。不按常理出牌,而形成一種非理性或“瘋子”的名聲,在重復(fù)博弈中可能會(huì)大大增加獲益的機(jī)會(huì)。-5,-5-5,-520,1010,20咸餅干咸餅干甜餅干甜餅干廠商B廠商A2、威脅的可信度以前述餅干生產(chǎn)廠為例:-5,-5-5,-53、阻止市場(chǎng)進(jìn)入的威脅在一般的情況中,一個(gè)市場(chǎng)中不一定只能容納一家企業(yè)。假定在一個(gè)市場(chǎng)中,某企業(yè)是市場(chǎng)壟斷者?,F(xiàn)在有另一企業(yè)作為潛在的競(jìng)爭(zhēng)者,試圖進(jìn)入這個(gè)市場(chǎng)。對(duì)壟斷者來(lái)說(shuō),會(huì)設(shè)法阻止?jié)撛诟?jìng)爭(zhēng)者的進(jìn)入。在這個(gè)博弈中,潛在競(jìng)爭(zhēng)者有兩種策略可以選擇,即進(jìn)入或不進(jìn)入;壟斷者也有兩種策略,或者與進(jìn)入者打一場(chǎng)價(jià)格戰(zhàn),或者默許它的進(jìn)入。該博弈的策略選擇順序是:首先由潛在進(jìn)入者作出進(jìn)入市場(chǎng)或不進(jìn)入市場(chǎng)的選擇,然后再由壟斷者來(lái)決定是默許它的進(jìn)入還是與進(jìn)入者進(jìn)行一場(chǎng)價(jià)格戰(zhàn)。這個(gè)博弈的得益矩陣如表所示:-200,6000,30000,3000900,1100價(jià)格戰(zhàn)進(jìn)入不價(jià)格戰(zhàn)不進(jìn)入壟斷者潛入者可信嗎:壟斷者對(duì)潛在進(jìn)入者進(jìn)行威脅:“如果你進(jìn)入市場(chǎng),我將采取價(jià)格戰(zhàn)的策略”空頭威脅!3、阻止市場(chǎng)進(jìn)入的威脅在一般的情況中,一個(gè)市場(chǎng)中不一定只能4、承諾與可信性承諾,是指對(duì)局者所采取的某種行動(dòng),這種行動(dòng)使其威脅成為一種令人可信的威脅。與承諾行動(dòng)相比,空頭威脅無(wú)法有效阻止市場(chǎng)進(jìn)入的主要原因是,它不需要任何成本。阻止市場(chǎng)進(jìn)入的有效承諾就是通過(guò)投資來(lái)形成一部分剩余的生產(chǎn)能力。這部分生產(chǎn)能力在沒(méi)有其他企業(yè)進(jìn)入市場(chǎng)的時(shí)候是多余的,但在進(jìn)入發(fā)生時(shí)則成為其低價(jià)競(jìng)爭(zhēng)的有力武器。生產(chǎn)能力的擴(kuò)大需要額外的投入,我們假定壟斷者需要投資800萬(wàn)元來(lái)實(shí)行這個(gè)承諾。這一投資將改變博弈的得益矩陣,新的得益矩陣如下表:-400,4000,22000,2200900,300價(jià)格戰(zhàn)進(jìn)入不價(jià)格戰(zhàn)不進(jìn)入壟斷者潛入者4、承諾與可信性承諾,是指對(duì)局者所采取的某種行動(dòng),這種行動(dòng)例:運(yùn)用公布價(jià)格策略搶占市場(chǎng)
德克薩斯儀器公司宣布了DRAM兩年內(nèi)的價(jià)格。一周后,鮑默公司宣布以低于德克薩斯公司的價(jià)格生產(chǎn)這種產(chǎn)品。幾周后,摩托羅拉也宣稱將以比鮑默公司更低的價(jià)格生產(chǎn)這種產(chǎn)品。終于在幾周后,德克薩斯公司宣布其價(jià)格比摩托羅拉公司的價(jià)格還要低50%,而其他兩家公司則宣稱經(jīng)過(guò)慎重考慮,他們不打算生產(chǎn)這種產(chǎn)品。某公司的董事長(zhǎng)聽(tīng)到這則消息后,認(rèn)為應(yīng)該學(xué)習(xí)德克薩斯公司的策略。他的公司計(jì)劃開(kāi)發(fā)一種新產(chǎn)品,兩年后投放市場(chǎng),雖然其生產(chǎn)成本并不比同時(shí)進(jìn)入市場(chǎng)的其他競(jìng)爭(zhēng)性產(chǎn)品的成本低,但仍具有一定的競(jìng)爭(zhēng)力。該董事長(zhǎng)認(rèn)為,應(yīng)該將新產(chǎn)品的價(jià)格公布很低,目的是誘使其他企業(yè)放棄該新產(chǎn)品的開(kāi)發(fā)計(jì)劃。
如果你是這家公司的顧問(wèn),你認(rèn)為董事長(zhǎng)公布一個(gè)較低的新產(chǎn)品價(jià)格有哪些好處和壞處?例:運(yùn)用公布價(jià)格策略搶占市場(chǎng)德克薩斯儀器公司宣布了DRAM某警察負(fù)責(zé)A、B兩地治安,兩地相隔較遠(yuǎn),他每晚只能去一個(gè)地方巡邏,該地區(qū)有一小偷,他每晚也只能選擇偷一個(gè)地方,A地財(cái)產(chǎn)價(jià)格2萬(wàn)元,B地財(cái)產(chǎn)價(jià)格1萬(wàn)元,若警察選A地巡邏,而小偷也選擇去了A地,則會(huì)放棄偷竊,警察保全了3萬(wàn)元財(cái)產(chǎn);若警察選擇A巡邏,小偷去了B地,則B地財(cái)產(chǎn)被盜。
問(wèn):警察如何巡邏效果最好?策略1:警察只對(duì)A巡邏,這樣可保住2萬(wàn)元的財(cái)產(chǎn)不被竊。
這個(gè)做法是最優(yōu)的嗎?有沒(méi)有改進(jìn)的措施?策略2:既去A地,又去B地。那么去A地多少次,B地多少次最優(yōu)?九、混合策略博弈——警察與小偷某警察負(fù)責(zé)A、B兩地治安,兩地相隔較遠(yuǎn),他每晚只能去一個(gè)
小偷警察盜竊A地盜竊B地巡邏A地(3,0)(2,1)巡邏B地(1,2)(3,0)顯然,警察的最好做法是:通過(guò)擲骰子決定去A地還是B地,1/3的機(jī)會(huì)去B地,2/3的機(jī)會(huì)去A地。(對(duì)6個(gè)面的骰子,1-4點(diǎn)去A地,5、6點(diǎn)去B地。)對(duì)小偷也是如此,擲骰子來(lái)決定是偷什么地方,只是1-4點(diǎn)去B地,5、6點(diǎn)去A地。小偷盜竊A地盜竊B地巡邏A地(3警察和小偷的損益分析:警察到A地時(shí),小偷有1/3機(jī)會(huì)到A,2/3機(jī)會(huì)去B,此時(shí)警察得益:同理警察到B地時(shí),得益也為7/3。由于警察到A的可能為2/3,到B的可能為1/3,其總得益為:可以看出警察的總得益大于2,該策略優(yōu)于只巡邏A的策略1。小偷的得益有什么改變呢?(2/3)警察和小偷的損益分析:該博弈為零和博弈(一方之所得,即為另一方之所失),只有混和策略均衡點(diǎn),不會(huì)有純策略的納什均衡點(diǎn)。警察與小偷博弈如同剪刀-石頭-布游戲,或猜拳游戲,是混合策略博弈,參與者在多種備選策略中隨機(jī)選擇。在這樣的游戲中,不存在純策略均衡(不能選擇單一策略),對(duì)每個(gè)人來(lái)說(shuō),出剪刀、布、還是石頭的策略應(yīng)當(dāng)是隨機(jī)的,不能讓對(duì)方知道自己的策略,哪怕是策略的“傾向性”,如果對(duì)方知道你出哪一個(gè)策略的可能性較大,你在游戲中輸?shù)目赡苄跃驮龃?。該博弈為零和博弈(一方之所得,即為另一方之所失),只有混和策二、策略式博弈?shù)學(xué)基礎(chǔ)設(shè)在一個(gè)n人博弈中,諸局中人的策略集為S1,…Sn,每個(gè)局中人的支付/收益為u1,…,un,都是定義在S1×S2×…×Sn上的函數(shù),我們將這個(gè)博弈記作G={S1,…Sn;u1,…,un}。這種表述方法稱為博弈的策略型表述或者正規(guī)型表述。博弈者采取Si策略的概率記為σi,則收益ui=f(σi,Si)二、策略式博弈數(shù)學(xué)基礎(chǔ)設(shè)在一個(gè)n人博弈中,諸局中人的策略4,35,16,22,18,43,63,09,62,8策略LMRUMD玩家2玩家1σ1(U)+σ1(M)+σ1(D)=1σ1=(1/3,1/3,1/3)σ1i=(0,1/2,1/2)則:U1=1/3(0*4+1/2*5+1/2*6)+1/3(0*2+1/2*8+1/2*3)+1/3(0*3+1/2*9+1/2*2)=11/2;U2=27/64,35,16,22,18,43,63,09,62,8策略L
某國(guó)有6個(gè)省,A、B、C、D、E、F,總統(tǒng)選舉由這些省的代表投票選出,票數(shù)由不同省人口比例分配。A10票,B9票,C7票,D3票,E1票,F(xiàn)1票,總數(shù)31票。候選人有兩位,如某候選人獲過(guò)半,即16票以上通過(guò),就得以當(dāng)選。立法也是如些,票數(shù)過(guò)半則通過(guò)。該政治體制運(yùn)行了多年,但D、E、F的人民總覺(jué)得他們不同的聲音往往得不到重視。試問(wèn)該國(guó)的民主機(jī)制有什么問(wèn)題嗎?十、公共選擇理論(聯(lián)盟博弈)十、公共選擇理論(聯(lián)盟博弈)雖然D、E、F分別有3票,1票,1票,但事實(shí)上在表決時(shí),這3個(gè)省在任何情況下都不起作用。因?yàn)樗麄儾皇侨魏潍@勝聯(lián)盟的關(guān)鍵加入者?,F(xiàn)任總統(tǒng)知道了漏洞,提出要增加DEF的權(quán)力,但要求:1、人多的省權(quán)力要大些;2、人數(shù)少的地區(qū)也要有一定的權(quán)力;3、不要對(duì)現(xiàn)行制度作太大的修改,以免實(shí)施困難。你認(rèn)為如何對(duì)現(xiàn)行體制進(jìn)行修改好呢?雖然D、E、F分別有3票,1票,1票,但事實(shí)上在表決時(shí),這3最簡(jiǎn)單的方法是:多給A地區(qū)兩張選票,總票數(shù)33張,獲17張選票才能勝出,這樣就能增加三個(gè)弱小省的權(quán)力。提示:在合作博弈中,票數(shù)是一個(gè)虛假的指標(biāo),權(quán)力指數(shù)才真正起作用。(夏普里值,ShapleyValue)權(quán)力指數(shù):某一方作為關(guān)鍵加入者的獲勝聯(lián)盟的個(gè)數(shù)。簡(jiǎn)例:A、B、C三人,A有兩票,B、C各有一票,三人群體對(duì)某議題的表決,服從大多數(shù)原則,即若獲3票,則通過(guò),這三人各自的權(quán)力指數(shù)多大?解:獲勝聯(lián)盟有:AB、AC、ABC,其中A在3個(gè)組合中均是關(guān)鍵加入者,而B(niǎo),只對(duì)AB是關(guān)鍵加入者。所以A的權(quán)力指數(shù)是3,B的權(quán)力指數(shù)是1,而C的權(quán)力指數(shù)也是1。最簡(jiǎn)單的方法是:多給A地區(qū)兩張選票,總票數(shù)33張,獲17張選省票數(shù)權(quán)力指數(shù)權(quán)力指數(shù)(%)A10433.3B9433.3C7433.3D300E100F100省票數(shù)權(quán)力指數(shù)權(quán)力指數(shù)(%)A121834.6B91426.9C71426.9D323.8E123.8F123.8總票31時(shí)各省權(quán)力指數(shù)總票33時(shí)各省權(quán)力指數(shù)省票數(shù)權(quán)力指數(shù)權(quán)力指數(shù)(%)A10433.3B9433.3C
從權(quán)力指數(shù)角度看股份公司案例五個(gè)股東A、B、C、D、E合資成立一股份公司,各出資20%,公司運(yùn)行的兩原則:1、一股一票原則;2、大多數(shù)原則(51%通過(guò)才能執(zhí)行某決議)。第一年年底,A表示想增持一部分股份,而B(niǎo)CDE愿意減持一些股份,但又不想讓A控股,于是BCDE各減持了3%,A的股份為32%,BCDE各為17%。第二年年初,A提出要BCDE各自再轉(zhuǎn)讓1%股份,BCDE一想,A持有的股份36%,不超過(guò)50%,就同意了,此時(shí)BCDE各有16%股份。
請(qǐng)問(wèn):如果你是B,你會(huì)同意第一次減持3%嗎?你會(huì)同意第二次減持1%嗎?為什么?從權(quán)力指數(shù)角度看股份公司案例股東最初股份%第一年未股份%權(quán)力指數(shù)權(quán)力指數(shù)%A2032620B2017620C2017620D2017620E2017620股東第二年初股份%權(quán)力指數(shù)權(quán)力指數(shù)%A361463.6B1629.1C1629.1D1629.1E1629.1股東最初股份%第一年未股份%權(quán)力指數(shù)權(quán)力指數(shù)%A203262三人分配財(cái)產(chǎn)案假定有100萬(wàn)元,在三人間分配,A有50%的投票權(quán),B有40%有投票權(quán),C有10%,規(guī)則規(guī)定,當(dāng)超過(guò)50%的票認(rèn)可某方案,才能分配財(cái)產(chǎn),否則三人一無(wú)所有。你認(rèn)為分配的比例會(huì)是什么樣的呢?
A50萬(wàn),B40萬(wàn),C10萬(wàn)合理嗎?三人分配財(cái)產(chǎn)案A50萬(wàn),B40萬(wàn),C10萬(wàn),不合理,因?yàn)镃可以提出:A60萬(wàn),B0萬(wàn),C40萬(wàn)B可以提出:A70萬(wàn),B30萬(wàn),C0萬(wàn)C可以再提:A80萬(wàn),B0萬(wàn),C20萬(wàn)
………
當(dāng)A分得太多,B、C都分得太少時(shí),B和C會(huì)聯(lián)合起來(lái),寧可不得,這時(shí)A又會(huì)作出讓步。多次博弈的均衡是,按權(quán)力指數(shù)來(lái)計(jì)算分配(實(shí)踐中還取決于每一方的談判能力)A50萬(wàn),B40萬(wàn),C10萬(wàn),不合理,因?yàn)?/p>
民主的方式中,少數(shù)人支持的候選人能贏嗎?一個(gè)n個(gè)人組成的社會(huì),設(shè)n=300,對(duì)候選人A和B選舉,如果全民投票,有2/3的人選B,只有1/3會(huì)選A,有沒(méi)有一種辦法設(shè)計(jì)一種規(guī)則,通過(guò)“民主的”投票使A當(dāng)選呢?答案是肯定的。
民主規(guī)則也就是大多數(shù)原則,但具體實(shí)行方式可以商量?,F(xiàn)在我們將這300人分成3組,每組中誰(shuí)占多數(shù),誰(shuí)就贏得這一組,3組中贏得2組,就算贏了。(很公平吧?。┟裰鞯姆绞街?,少數(shù)人支持的候選人能贏嗎?答案是肯定的。
現(xiàn)在我們假定第一組50人,第二組100人,第三組150人,第一組中有30人贊成A,第二組有60人贊成A,第三組中有10人贊成A,這樣,A會(huì)贏得第一組和第二組的選舉,從而順利當(dāng)選。如果不分組,直接選舉,B會(huì)當(dāng)選。
布坎南《同意的計(jì)算》舉了一例,一個(gè)25人的社會(huì),只需9人同意某議案就可使它通過(guò)。分成5個(gè)區(qū),每區(qū)5個(gè)人,只要3個(gè)區(qū)中的多數(shù)通過(guò),即9個(gè)人,就能使某一議案通過(guò)。當(dāng)人數(shù)更多時(shí),數(shù)學(xué)計(jì)算表明,通過(guò)某議案只需總?cè)藬?shù)的1/4多一些即可,而無(wú)需多于1/2的人同意。如總數(shù)為39601人(199*199),只需10000人同意?,F(xiàn)在我們假定第一組50人,第二組100人,第三組1下述一次性選舉:有4個(gè)人,A、B、C、D,假定26%的人最喜歡A,各有25%的人喜歡B和C,有24%的人最喜歡D,假設(shè)B、C、D三個(gè)候選對(duì)象與A區(qū)別很大,喜歡他們?nèi)齻€(gè)的都最不喜歡A,現(xiàn)在進(jìn)行一次性選舉,誰(shuí)可能當(dāng)選?雖然有74%的人最不喜歡A,但A卻當(dāng)選了。
你可能會(huì)說(shuō),一次性選舉不是就能避免上述問(wèn)題嗎?公共選擇與私人選擇的不同,不正當(dāng)?shù)慕Y(jié)果也可能發(fā)生。公民選舉中,最不被喜歡的人可能當(dāng)選。例如臺(tái)灣2000年大選,(陳、宋、連、李)下述一次性選舉:你可能會(huì)說(shuō),一次性選舉不是就能避免上述問(wèn)題嗎民主投票的缺陷--不同的選舉規(guī)則導(dǎo)致不同的結(jié)果臺(tái)灣的選舉是“民主選舉”,各黨派平等競(jìng)爭(zhēng)。2000年臺(tái)灣大選,四個(gè)候選人:宋楚瑜、連戰(zhàn)、陳水扁、李敖。最終結(jié)果是陳水扁以微弱優(yōu)勢(shì)當(dāng)選。假設(shè)臺(tái)灣選舉不是直選,選舉規(guī)則是先角逐出兩個(gè)候選人而不是多個(gè)候選人,然后再在這兩個(gè)候選人間進(jìn)行競(jìng)選,會(huì)出現(xiàn)什么結(jié)果呢?美國(guó)選舉是間接選舉,而臺(tái)灣是直接選舉。
與此相同的例子,中國(guó)申辦2000年奧運(yùn)會(huì),投票規(guī)則是逐步淘汰制,每一輪得票最少的城市被淘汰。前兩輪北京一直領(lǐng)先,剩下北京、悉尼、柏林,第三輪同樣北京獲選票最多,柏林被淘汰,但最后一輪,北京與悉尼角逐時(shí),北京卻輸了。民主投票的缺陷--不同的選舉規(guī)則導(dǎo)致不同的結(jié)果與此相同的例子投票的悖論與阿羅不可能定律
三個(gè)人(或三組)每一個(gè)都有一票,他們必須在跳舞、打牌、看電影三種不同選項(xiàng)進(jìn)行選擇。這三個(gè)人有完全不同的意見(jiàn):
史密斯打牌>看電影>跳舞布朗看電影>跳舞>打牌
瓊斯跳舞>打牌>看電影投票者投票者對(duì)提案的不同選擇跳舞打牌看電影布朗第2第3第1史密斯第3第1第2瓊斯第1第2第3投票的悖論與阿羅不可能定律投票者投票者對(duì)提案的不同選擇跳舞打在多數(shù)票規(guī)則下,每個(gè)人投出他最喜歡的票。當(dāng)跳舞與打牌表決時(shí),跳舞勝出,2:1當(dāng)打牌與看電影表決時(shí),打牌勝出,2:1但是如果跳舞與看電影表決,是不是一定會(huì)贏呢?主席在議會(huì)中的重要性:確定議程的權(quán)力就可能決定結(jié)果。結(jié)論:加總社會(huì)個(gè)體成員偏好,不能得知社會(huì)的選擇。多數(shù)投票制度并不能告訴我們社會(huì)真正想要什么結(jié)果。換而言之,不能簡(jiǎn)單地將民主理解為“少數(shù)服從多數(shù)”在多數(shù)票規(guī)則下,每個(gè)人投出他最喜歡的票。結(jié)論:加總社會(huì)個(gè)體成阿羅:是否存在著任何能夠避免循環(huán)結(jié)果的合理投票辦法?結(jié)論令人吃驚:那種能保證效率、尊重各人選擇、并且不依賴議事日程的多數(shù)規(guī)則的投票辦法是不存在的。民主與效率是存在矛盾的。阿羅定理還告訴我們,民主并不象盧梭理解的那樣能夠達(dá)到"公意",而是象波普爾理解的那樣能夠防止"最壞"的情況發(fā)生,從而嚴(yán)格論證了民主的功能究竟何在。阿羅:是否存在著任何能夠避免循環(huán)結(jié)果的合理投票辦法?結(jié)論令人西方民主世界的領(lǐng)袖美國(guó),經(jīng)常發(fā)生“議員選選民”的怪現(xiàn)象。
“蜥蜴腳尾”現(xiàn)象美國(guó)政治的兩個(gè)重要特征。第一,美國(guó)社會(huì)表面上是個(gè)“大熔爐”,其實(shí)因種族、宗教、窮富等因素造成的社會(huì)分化極其嚴(yán)重,如2000年總統(tǒng)大選90%以上黑人選民投票支持戈?duì)枺闶且焕?。第二,美?guó)選區(qū)的劃分,大都由各州州議會(huì)自行決定,是個(gè)可以上下其手的過(guò)程。舉例說(shuō),假設(shè)美國(guó)選民總體對(duì)民主、共和兩黨的支持基本是一半對(duì)一半,那么只要一個(gè)選區(qū)的黑人比例超過(guò)全國(guó)平均值幾個(gè)百分點(diǎn),他們90%投民主黨的的選票,就會(huì)將這一選區(qū)變成民主黨的“鐵票”地盤(pán)。因此產(chǎn)生了美國(guó)選區(qū)地圖的“蜥蜴腳尾”現(xiàn)象。此名來(lái)自19世紀(jì)初的麻薩諸塞州州長(zhǎng)杰里,他專搞選區(qū)劃分手腳,以便自己和同黨可以順利當(dāng)選,結(jié)果在地圖上選區(qū)常常奇形怪狀,就像蜥蜴,又長(zhǎng)“腳”又長(zhǎng)“尾巴”。甚至出現(xiàn)過(guò)沿一條公路伸展幾百英里、寬度卻幾乎不出一英里的怪物選區(qū)。西方民主世界的領(lǐng)袖美國(guó),經(jīng)常發(fā)生“議員選選民”的怪現(xiàn)象。最近,得克薩斯州的共和黨人憑在州議會(huì)的多數(shù),強(qiáng)行重劃選區(qū),演出了“蜥蜴腳尾”的新一幕。其中的精彩插曲,是州議會(huì)少數(shù)黨民主黨議員為了抵制,兩次大批“逃亡”,使州議會(huì)不到法定人數(shù),無(wú)法通過(guò)議案。結(jié)果共和黨控制的州政府要求警方“通緝”逃亡的州議員,上演了一場(chǎng)鬧劇。民主黨最后屈服,得州終于通過(guò)了新的國(guó)會(huì)選區(qū)劃分,例如原先得州西部的第19選區(qū)如今像條細(xì)蛇,宛延伸展到得州中部。原先是民主黨地盤(pán)的第11選區(qū)被完全重劃,也是又細(xì)又長(zhǎng),目的是幫助布什總統(tǒng)的一個(gè)盟友當(dāng)選眾議員。得州南部的新選區(qū)地圖像“一套細(xì)條紋西裝”,由許多南北向的狹長(zhǎng)選區(qū)組成,目的是將拉美裔的選民集中壓縮到寥寥幾個(gè)選區(qū)?!度A盛頓郵報(bào)》發(fā)表社論《得克薩斯蘇維埃共和國(guó)》,批評(píng)得州的“蜥蜴腳尾”選區(qū),實(shí)質(zhì)上是“議員選選民”,選舉結(jié)果早由這些“蜥蜴腳尾”選區(qū)預(yù)定,和前蘇聯(lián)共產(chǎn)黨統(tǒng)治下的“選舉”并無(wú)不同。美國(guó)以“民主典范”自居,老是要對(duì)其他國(guó)家指手劃腳??墒敲绹?guó)自身的“蜥蜴腳尾”和近日“得克薩斯蘇維埃共和國(guó)”故事,體現(xiàn)了西方諺語(yǔ):自己住在玻璃房子里,最好別亂扔石頭。
最近,得克薩斯州的共和黨人憑在州議會(huì)的多數(shù),強(qiáng)行重劃選區(qū),演美國(guó)的人口演變大勢(shì),特別是少數(shù)民族人口的快速增長(zhǎng),總的來(lái)說(shuō)對(duì)民主黨有利。但是由于美國(guó)選舉的“贏者通吃”制度,加上普遍的“蜥蜴腳尾”游戲,卻造成對(duì)民主黨十分不利的局面。
原來(lái)民主黨支持者偏于下層收入者和少數(shù)族裔,這些族群的分布往往集中在城市,造成城市選區(qū)的民主黨人高票當(dāng)選,浪費(fèi)大量票源。而共和黨的支持者分布比較均勻,再加上“蜥蜴腳尾”選區(qū)劃分,使得共和黨可以在更多的選區(qū)勝出。2000年總統(tǒng)大選,就是一個(gè)很好的例子。戈?duì)栐谌珖?guó)贏得多數(shù)票,可是小布什卻贏得更多的州,從而靠“選舉人票”多數(shù)當(dāng)選總之,議員選選民的“蜥蜴腳尾”把戲,對(duì)美國(guó)政治有極重要的影響。在這樣的“民主”制度下,例如布什政府這樣的少數(shù)集團(tuán),盡管在環(huán)保、墮胎、槍支管制等方面并不代表美國(guó)多數(shù)民意,卻能繼續(xù)主導(dǎo)美國(guó)的政治。美國(guó)的人口演變大勢(shì),特別是少數(shù)民族人口的快速增長(zhǎng),總的來(lái)說(shuō)對(duì)演講完畢,謝謝觀看!演講完畢,謝謝觀看!博弈論與決策管理主講老師:王若文博弈論與決策管理主講老師:王若文王若文,湖南長(zhǎng)沙人;1987年畢業(yè)于北京大學(xué)中興通訊企管部經(jīng)理、總裁秘書(shū)三一重工人力資源總監(jiān)、行政副總裁彩虹集團(tuán)人力資源總監(jiān)、副總裁神州通集團(tuán)人力資源總監(jiān)、培訓(xùn)總監(jiān)中華網(wǎng)CHINA.COM
中國(guó)區(qū)人力資源總監(jiān)
2003年深圳首屆“十大金領(lǐng)”人物之一;
2004年深圳百名“特區(qū)之子”人物之一;
2010年最受歡迎的“中式人本管理專家”;
2011年金蝶公司全國(guó)巡場(chǎng)“領(lǐng)袖峰會(huì)”金牌主持2013年培訓(xùn)TOP100-最佳人力資源及領(lǐng)導(dǎo)力管理專家。清華大學(xué)總裁班、北京大學(xué)匯豐商學(xué)院、浙江大學(xué)、新疆財(cái)經(jīng)大學(xué)、上海財(cái)經(jīng)大學(xué)EMBA班特聘領(lǐng)導(dǎo)力和人力資源講師。上市企業(yè)現(xiàn)職:廣州通盈投資公司董事長(zhǎng)王若文,湖南長(zhǎng)沙人;1987年畢業(yè)于北京大學(xué)上現(xiàn)職:廣州通盈七“到”輪回獲取思想,更在乎獲得方法;獲得知識(shí),更在乎解決問(wèn)題。錯(cuò)少多學(xué)心到眼到耳到口到手到悟到做到練為什么要學(xué)?習(xí)七“到”輪回獲取思想,更在乎獲得方法;錯(cuò)少多學(xué)心到眼到耳到口P-77頁(yè)知道悟到做到得到優(yōu)秀管理者的絕密八字P-4頁(yè)知道悟到做到得到優(yōu)秀管理者的絕密八字克服貪嗔癡表達(dá)"好"心情微笑、主動(dòng)、回避、韜光幽默、語(yǔ)氣、適可、得讓謙卑、順從、真誠(chéng)、舍得一打方法:先處理好心情,再學(xué)習(xí)好課程克服貪嗔癡表達(dá)"好"心情微笑、主動(dòng)、回避、韜光一打方法:先斯大林時(shí)代的蘇聯(lián),一個(gè)樂(lè)隊(duì)指揮坐火車時(shí)看樂(lè)譜,兩個(gè)克格勃軍官以為是密碼,就將他抓了起來(lái),他說(shuō)那是柴可夫斯基的樂(lè)譜,但無(wú)無(wú)濟(jì)于事。第二天,克格勃告訴他,已把他的同伙柴可夫斯基也抓起來(lái)了,正在招供。他們倆面臨一種艱難的選擇:如一方招供另一方不招,坦白者從寬判1年,抗拒者從嚴(yán)判25年;如果雙方都招供,則各以間諜罪判10年;如雙方均不招供,克格勃無(wú)法定罪,各自坐牢3年。他們被分別關(guān)押,請(qǐng)問(wèn)應(yīng)該招、還是不招?招還是不招?這是個(gè)問(wèn)題斯大林時(shí)代的蘇聯(lián),一個(gè)樂(lè)隊(duì)指揮坐火車時(shí)看樂(lè)譜,兩個(gè)克格勃軍官可能的思想斗爭(zhēng)是什么?坦白的原因
1、可能會(huì)被判的很輕
2、最壞的結(jié)果-10,-1,比-25,-3要好抵賴的原因
1、我沒(méi)犯罪,不愿意招
2、雙方抵賴各-3,比雙方坦白各-10好
3、人云:坦白從寬牢底坐穿,抗拒從嚴(yán)回家過(guò)年可能的思想斗爭(zhēng)是什么?一、博弈論簡(jiǎn)介
博弈論(GameTheory)又名對(duì)策論,游戲論失火了,屋里人很多,你往哪個(gè)門跑—這就是博弈你的行動(dòng)結(jié)果不僅取決于你的策略選擇,同時(shí)也取決于他人的策略選擇。它研究個(gè)體或組織之間存在利益沖突情況下如何進(jìn)行最優(yōu)決策。一、博弈論簡(jiǎn)介博弈論是40年代數(shù)學(xué)家馮·諾依曼和經(jīng)濟(jì)學(xué)家?jiàn)W斯卡·摩根斯坦首先提出的。在經(jīng)濟(jì)學(xué)、政治學(xué)、社會(huì)學(xué)獲得了巨大的應(yīng)用。1994年諾貝爾經(jīng)濟(jì)學(xué)獎(jiǎng)?lì)C發(fā)給了3位博弈論專家:
納什Nash
、澤爾騰Selten
、哈桑尼Harsanyi
。中國(guó)人研究博弈論是有優(yōu)勢(shì)的:《三國(guó)演義》《孫子兵法》《三十六計(jì)》《厚黑學(xué)》都是博弈論教材,如何在人與人的博弈中取得成功。博弈論是40年代數(shù)學(xué)家馮·諾依曼和經(jīng)濟(jì)
1994年諾貝爾經(jīng)濟(jì)學(xué)獎(jiǎng)獲得者:美國(guó)數(shù)學(xué)家JohnF.Nash;德國(guó)經(jīng)濟(jì)學(xué)家ReinhardSelten;美籍匈牙利經(jīng)濟(jì)學(xué)家JohnC.Harsanyi。
1928年Nash出生于美國(guó),1950年獲Princeton大學(xué)數(shù)學(xué)博士學(xué)位,曾先后任教于MIT和Princeton大學(xué)。其博士論文《非合作博弈》首次區(qū)分了合作博弈與非合作博弈,并且提出了非合作博弈的納什均衡概念。1930年
Selten出生于現(xiàn)屬于波蘭的德國(guó)城市,1961年獲法蘭克福大學(xué)數(shù)學(xué)博士學(xué)位,曾先后任教于柏林自由大學(xué)、比勒菲爾特大學(xué)和波恩大學(xué)。Selten的主要貢獻(xiàn)是首次對(duì)分析動(dòng)態(tài)策略交互作用深化了Nash均衡的概念。1920年Harsanyi出生于匈牙利,1947年獲布達(dá)佩斯大學(xué)博士學(xué)位,后逃亡澳大利亞,再到美國(guó),1954年獲斯坦福大學(xué)博士學(xué)位,曾先后任教于澳大利亞國(guó)立大學(xué)、加州伯克利分校。于2000年去世。Harsanyi研究和分析了不完全信息博弈,從而為信息經(jīng)濟(jì)學(xué)提供了一個(gè)理論基礎(chǔ)。1994年諾貝爾經(jīng)濟(jì)學(xué)獎(jiǎng)獲得者:1928年Nash出生于美1996年,兩位將博弈論應(yīng)用于不對(duì)稱信息下機(jī)制設(shè)計(jì)的經(jīng)濟(jì)學(xué)家莫里斯(Mirrlees)和維克里(Vickrey)獲諾貝爾經(jīng)濟(jì)學(xué)獎(jiǎng)。2001年三位經(jīng)濟(jì)學(xué)家阿克洛夫(Akerlof)、斯蒂格利茨(Stiglitz)和斯賓塞(Spence)因運(yùn)用博弈論研究信息經(jīng)濟(jì)學(xué)所取得的成就而成為該年度的諾貝爾經(jīng)濟(jì)學(xué)獎(jiǎng)得主。2005年諾貝爾經(jīng)濟(jì)學(xué)獎(jiǎng)授予羅伯特·奧曼和托馬斯·謝林,以表彰他們“運(yùn)用博弈論的分析方法對(duì)現(xiàn)實(shí)的政治、經(jīng)濟(jì)問(wèn)題進(jìn)行分析,改變了我們對(duì)沖突與合作的理解”。1996年,兩位將博弈論應(yīng)用于不對(duì)稱信息下機(jī)制設(shè)計(jì)的經(jīng)濟(jì)學(xué)家博弈的分類1、靜態(tài)博弈與動(dòng)態(tài)博弈參與者行動(dòng)的先后順序,靜態(tài)博弈是同時(shí)作出決策(不了解對(duì)手的決策方案),動(dòng)態(tài)博弈是參與者先后作出決策(后行動(dòng)的人知道先行動(dòng)者的行動(dòng)方案)。2、完全信息博弈與不完全信息博弈對(duì)其他參與者收益支付信息的掌握程度。不完全信息博弈中至少有一人不能確切了解其它決策者收益函數(shù)。3、合作博弈與非合作博弈能否達(dá)成一個(gè)有約束力的協(xié)議,合作博弈強(qiáng)調(diào)集體理性。(經(jīng)濟(jì)學(xué)主要討論非合作博弈)4、一次性博弈與重復(fù)博弈博弈重復(fù)多次進(jìn)行。(注意區(qū)分動(dòng)態(tài)博弈)博弈的分類1、靜態(tài)博弈與動(dòng)態(tài)博弈嚴(yán)格地講,博弈論并不是經(jīng)濟(jì)學(xué)的一個(gè)分支,它是一種方法,應(yīng)用范圍除經(jīng)濟(jì)學(xué)外,還包括政治學(xué)、軍事學(xué)、外交學(xué)、國(guó)際關(guān)系學(xué)、犯罪學(xué)等。但為何博弈論受到經(jīng)濟(jì)學(xué)的重視呢?主要原因有:1、博弈論在經(jīng)濟(jì)學(xué)中得到最廣泛、最成功的應(yīng)用,尤其在寡頭市場(chǎng)理論中得到直接的應(yīng)用。2、博弈論的許多成果也是借助于經(jīng)濟(jì)學(xué)的例子來(lái)發(fā)展的,經(jīng)濟(jì)學(xué)家對(duì)博弈論的貢獻(xiàn)最大。3、博弈論與經(jīng)濟(jì)學(xué)的研究模式一樣:理性人在給定約束條件追求自己的效用最大化。
由于上述原因博弈論逐漸成為主流經(jīng)濟(jì)學(xué)最重要的組成部分。嚴(yán)格地講,二、博弈論基本模型囚徒困境(完全信息靜態(tài)博弈)(A、B共同犯罪被抓,警察分開(kāi)審問(wèn))
BA
坦白不坦白
A=10年A=25年
B=10年B=1年
A=1年A=3年
B=25年B=3年坦白不坦白每一個(gè)人的結(jié)局不僅取決于自身的選擇,同時(shí)也取決于對(duì)手的選擇不管B坦白不坦白,我坦白總是會(huì)少坐一些牢1、囚徒博弈二、博弈論基本模型囚徒困境(完全信息靜態(tài)博弈)坦白不坦白每一囚徒困境(完全信息下的靜態(tài)博弈)“囚徒的困境(Prisoners’Dilemma)”,從博弈論角度看,這是一個(gè)存在占優(yōu)均衡的博弈:因?yàn)閷?duì)囚犯A,B來(lái)說(shuō),無(wú)論對(duì)方如何選擇,“坦白”都是各自的最優(yōu)選擇。雖然從兩名囚犯共同利益看,最好的選擇是合作,即同時(shí)選擇保持沉默,然而,由于猜忌,試圖獲得更大好處等競(jìng)爭(zhēng)性動(dòng)機(jī)阻礙了它們達(dá)到更好的互利選擇,我們將看到,寡頭壟斷廠商經(jīng)常面臨類似的困境。啟示:個(gè)體理性決策常常導(dǎo)致集體非理性結(jié)果囚徒困境(完全信息下的靜態(tài)博弈)“囚徒的困境(Prisone“囚徒的困境”還對(duì)亞當(dāng)·斯密的“看不見(jiàn)的手”的原理提出挑戰(zhàn)。這位經(jīng)濟(jì)學(xué)圣人在《國(guó)富論》中的名言:“每個(gè)人都力圖利用好他的資本,使其能實(shí)現(xiàn)最大的價(jià)值。一般說(shuō)來(lái),他并不企圖增進(jìn)公共福利,他所追求的僅僅是他個(gè)人的利益。但在他這樣做的時(shí)候,有一只看不見(jiàn)的手引導(dǎo)著他去實(shí)現(xiàn)另一種目標(biāo),這種目標(biāo)并非是他本意所要追求的東西。通過(guò)追逐個(gè)人利益,他經(jīng)常增進(jìn)社會(huì)利益?!卑凑账姑艿睦碚?,在市場(chǎng)經(jīng)濟(jì)中,每一個(gè)人都從利己的目的出發(fā),而最終全社會(huì)達(dá)到利他的效果。從某種意義上說(shuō),納什提出的非合作博弈的囚徒悖論實(shí)際上動(dòng)搖了西方經(jīng)濟(jì)學(xué)的基石?!扒敉降睦Ь场边€對(duì)亞當(dāng)·斯密的“看不見(jiàn)的手”的原理提出挑戰(zhàn)。例:投標(biāo)總工程量50,賄賂成本5,甲乙雙方實(shí)力相當(dāng)甲賄賂不賄賂
賄賂不賄賂20200454502525問(wèn)題:賄賂還是不賄賂?均衡:(賄賂,賄賂)乙2、投標(biāo)博弈例:投標(biāo)不賄賂200453、智豬博弈背景:在豬圈里住著一大一小兩頭豬。它們從同一個(gè)食槽獲得食物。但食槽的按鈕與食物的出口分布在相反的兩端。每按一次按鈕,可得10個(gè)單位食物,但需付出2個(gè)單位勞動(dòng)。規(guī)則:若大豬按按鈕:大豬吃6個(gè)單位,小豬吃4個(gè)單位;若小豬按按鈕:大豬吃9個(gè)單位,小豬吃1個(gè)單位;若一起去按:大豬吃7個(gè)單位,小豬吃3個(gè)單位;問(wèn)題:哪頭豬將會(huì)去按按鈕?
小豬按等待按5,14,4
等待9,-10,0大豬3、智豬博弈背景:大豬經(jīng)濟(jì)學(xué)中,這頭小豬也被稱為“免費(fèi)搭便車者”
現(xiàn)實(shí)社會(huì)之中的大豬和小豬何其之多:山寨版的橫行股份公司治理中的大股東與小股東大企業(yè)的人才培訓(xùn)與小企業(yè)的挖腳股市中的散戶跟隨大戶體制改革中的出頭者職場(chǎng)團(tuán)隊(duì)中的小組長(zhǎng)與組員公共設(shè)施或基礎(chǔ)設(shè)施投資:富人與窮人…………經(jīng)濟(jì)學(xué)中,這頭小豬也被稱為“免費(fèi)搭便車者”4、斗雞博弈假設(shè)兩只公雞遇到一起,每只都有兩個(gè)行動(dòng)選擇:進(jìn)攻或后退。后退是很丟面子的事情,若雞甲進(jìn)攻,乙后退,則甲贏。雙方前進(jìn),兩敗俱傷。
雞乙進(jìn)退
雞甲進(jìn)-4,-41,-1退-1,1-1,-1雙方都沒(méi)有占優(yōu)策略存在兩個(gè)穩(wěn)定的狀態(tài)(納什均衡):(-1,1);(1,-1)4、斗雞博弈假設(shè)兩只公雞遇到一起,每只都有兩個(gè)行動(dòng)選擇:進(jìn)攻
雙方都避免兩敗俱傷,斗雞博弈有兩個(gè)納什均衡,一方前進(jìn),另一方后退。由于有兩個(gè)均衡點(diǎn),結(jié)果無(wú)法預(yù)知。具體博弈結(jié)果還取決于其他因素。20世紀(jì)60年代蘇美間的古巴導(dǎo)彈危機(jī)就是一個(gè)斗雞博弈的很好例子。古巴導(dǎo)彈危機(jī)是冷戰(zhàn)時(shí)期蘇美之間最嚴(yán)重的一次危機(jī),赫魯曉夫1962年偷偷將導(dǎo)彈運(yùn)到古巴對(duì)付美國(guó),被美國(guó)U2飛機(jī)偵察到,美國(guó)派出攜帶核武器的戰(zhàn)機(jī)、航母,威脅蘇聯(lián)限期從古巴撤出導(dǎo)彈。蘇美這兩只大公雞均在考慮進(jìn)還是退?戰(zhàn)爭(zhēng)的結(jié)果當(dāng)然是兩敗俱傷,但任何一方退下來(lái)則是很不光彩的事。博弈結(jié)果是蘇聯(lián)從古巴撤回了導(dǎo)彈,做了丟面子的“撤退的雞”,而美國(guó)堅(jiān)持了自己的策略,做了“不退的雞”。當(dāng)然為了給蘇聯(lián)面子,同時(shí)也擔(dān)心戰(zhàn)爭(zhēng),美國(guó)也從土耳其撤了一些導(dǎo)彈。雙方都避免兩敗俱傷,斗雞博弈有兩個(gè)納什均衡,一方前進(jìn)例:兩個(gè)寡頭進(jìn)行價(jià)格戰(zhàn)博弈的收益矩陣。10,1050,50-50,100100,-50低價(jià)低價(jià)高價(jià)高價(jià)廠商B廠商A三、博弈論中的均衡博弈論中的均衡是一組穩(wěn)定的博弈結(jié)果。雙方均不愿先改變策略。博弈的均衡是穩(wěn)定的,因而是可以預(yù)測(cè)的。例:兩個(gè)寡頭進(jìn)行價(jià)格戰(zhàn)博弈的收益矩陣。10,1050,50占優(yōu)策略,又稱支配性策略(dominantstrategy)此類博弈中存在一種策略,無(wú)論B選擇何行動(dòng),該策略對(duì)A都是最優(yōu),則稱此策略為博弈者A的占優(yōu)策略。在本例中,廠商A和廠商B都有不受他人策略影響的占優(yōu)策略,即選擇低價(jià)。占優(yōu)均衡,支配均衡每個(gè)參與者都有并都選擇占優(yōu)策略,由此實(shí)現(xiàn)的均衡稱占優(yōu)均衡。本例為(10,10)。1、占優(yōu)均衡占優(yōu)策略,又稱支配性策略(dominantstrategy2、納什均衡納什均衡(非合作性均衡):納什均衡是這樣一組策略,它使所有博弈參與者都不能再提高其收益。此時(shí),雙方在對(duì)方給定的策略下均不愿意調(diào)整自己的策略。下例中,A有占優(yōu)策略即正常價(jià)格策略,而廠商B沒(méi)有占優(yōu)策略,它必須根據(jù)A的占優(yōu)策略來(lái)確定其戰(zhàn)略選擇,即其選擇受A的選擇的影響。100,20010,10150,-30-20,150高價(jià)格正常價(jià)格廠商B廠商A高價(jià)格正常價(jià)格2、納什均衡納什均衡(非合作性均衡):100,20010,13、占優(yōu)均衡與納什均衡的區(qū)別
占優(yōu)均衡:我所做的是:不管你做什么我所能做的最好的。你所做的是:不管我做什么你所能做的最好的。納什均衡:我所做的是:給定你所做的我所能做的最好的。你所做的是:給定我所做的你所能做的最好的。占優(yōu)均衡是納什均衡的一個(gè)特例3、占優(yōu)均衡與納什均衡的區(qū)別占優(yōu)均衡:我所做的是:不管四、最大最小策略迄今為止,對(duì)廠商行為的分析都建立在利潤(rùn)最大化基礎(chǔ)上。但在一些競(jìng)爭(zhēng)激烈的寡頭壟斷市場(chǎng),馮·諾依曼和摩根斯坦認(rèn)為決策者也可能采取一種風(fēng)險(xiǎn)厭惡策略,即確保在最壞的結(jié)果中得到最好的結(jié)果。這種決策規(guī)則稱最大最小策略(MaximinStrategy):博弈者在可能最少的利潤(rùn)方案中選擇利潤(rùn)最大的方案。四、最大最小策略迄今為止,對(duì)廠商行為的分析都建立在利潤(rùn)最大化風(fēng)險(xiǎn)與均衡由于納什均衡要求理性共識(shí)和一致預(yù)期,當(dāng)人們可能犯小小的錯(cuò)誤時(shí),納什均衡不一定被選擇。如下面這個(gè)博弈中,假定你是A,則多數(shù)人將選擇“下”而不是“上”。上下
左
右8,10-1000,97,66,5只要B有千分之一的概率錯(cuò)誤地選擇右,A的后果將是災(zāi)難性的,A將極力避免這種風(fēng)險(xiǎn),因此會(huì)選擇下。所以,出現(xiàn)的不是納什均衡BA風(fēng)險(xiǎn)與均衡由于納什均衡要求理性共識(shí)和一致預(yù)期,當(dāng)人們可能犯小
如果企業(yè)謀求利潤(rùn)最大化,將有兩個(gè)納什均衡,一家企業(yè)投資推出新產(chǎn)品,另一家企業(yè)不投資產(chǎn)品。最大最小策略,不是利潤(rùn)最大化策略,準(zhǔn)確說(shuō),它是用來(lái)避免十分不利結(jié)果的。對(duì)企業(yè)1來(lái)說(shuō),如果它不投資新產(chǎn)品,利潤(rùn)最小是300萬(wàn),如果它投資,利潤(rùn)最小是200萬(wàn)。對(duì)企業(yè)2數(shù)字也相同。兩家企業(yè)都在最小利潤(rùn)中選最大值。結(jié)果是兩家企業(yè)都不投資新產(chǎn)品。因?yàn)檫@樣的策略能保證至少獲得300萬(wàn)利潤(rùn)。戰(zhàn)略不投資投資投資4,43,66,32,2廠商1廠商2(單位百萬(wàn))不投資
雙寡頭企業(yè)都在考慮是否投資推出新產(chǎn)品。如果企業(yè)謀求利潤(rùn)最大化,將有兩個(gè)納什均衡,一家企業(yè)投資最大最小策略的結(jié)果并不是兩種納什均衡中的一種。原因是這種決策所用的準(zhǔn)則,不是利潤(rùn)最大化,而是避免虧損過(guò)多,最大最小策略是一種保守的策略。不同的決策目標(biāo)可能導(dǎo)致人們選擇不同的策略,最終導(dǎo)致不同的博弈結(jié)果。最大最小策略的結(jié)果并不是兩種納什均衡中的一種。五、重復(fù)剔除嚴(yán)格劣戰(zhàn)略“重復(fù)剔除嚴(yán)格劣戰(zhàn)略”的思路如下:1、首先找出博弈參與人的劣戰(zhàn)略(dominatedstrategy)(假定存在的話),把這個(gè)劣戰(zhàn)略剔除后,剩下的是一個(gè)不包含已剔除劣戰(zhàn)略的新的博弈;然后再剔除這個(gè)新的博弈中的劣戰(zhàn)略;繼續(xù)這個(gè)過(guò)程,直到?jīng)]有劣戰(zhàn)略存在。如果剩下的戰(zhàn)略組合是唯一的,這個(gè)唯一的戰(zhàn)略組合就是“重復(fù)剔除占優(yōu)均衡”。2、如果這樣的解存在,該博弈是
溫馨提示
- 1. 本站所有資源如無(wú)特殊說(shuō)明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請(qǐng)下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請(qǐng)聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
- 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁(yè)內(nèi)容里面會(huì)有圖紙預(yù)覽,若沒(méi)有圖紙預(yù)覽就沒(méi)有圖紙。
- 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
- 5. 人人文庫(kù)網(wǎng)僅提供信息存儲(chǔ)空間,僅對(duì)用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對(duì)用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對(duì)任何下載內(nèi)容負(fù)責(zé)。
- 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請(qǐng)與我們聯(lián)系,我們立即糾正。
- 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶因使用這些下載資源對(duì)自己和他人造成任何形式的傷害或損失。
最新文檔
- 2024-2025學(xué)年西和縣三上數(shù)學(xué)期末綜合測(cè)試模擬試題含解析
- 2025年瀝青路面養(yǎng)護(hù)車項(xiàng)目立項(xiàng)申請(qǐng)報(bào)告模稿
- 2025年日用陶瓷制品項(xiàng)目申請(qǐng)報(bào)告模范
- 2025年潤(rùn)滑油添加劑項(xiàng)目申請(qǐng)報(bào)告模范
- 高一名著讀書(shū)心得800字
- 工程工作計(jì)劃模板五篇
- 幼兒園中秋節(jié)演講10篇
- 個(gè)人原因辭職報(bào)告(15篇)
- 2021初中教師教學(xué)總結(jié)匯報(bào)模板10篇
- 檢驗(yàn)員個(gè)人工作總結(jié)五篇
- PICC+CVC+輸液港使用與維護(hù)
- 梨山老母玄妙真經(jīng)
- 知識(shí)產(chǎn)權(quán)三星蘋(píng)果專利戰(zhàn)課件
- 壓力容器安全技術(shù)規(guī)程
- 藥品上量實(shí)用
- 白疕(銀屑?。┲嗅t(yī)護(hù)理效果評(píng)價(jià)表
- GB/T 17129-1997無(wú)色光學(xué)玻璃化學(xué)穩(wěn)定性試驗(yàn)方法粉末法
- GB 3452.1-1992液壓氣動(dòng)用O形橡膠密封圈尺寸系列及公差
- 國(guó)家開(kāi)放大學(xué)電大《藥物化學(xué)》期末題庫(kù)及答案
- 電工二級(jí)技師測(cè)試題與答案
- 養(yǎng)老機(jī)構(gòu)公建民營(yíng)合同
評(píng)論
0/150
提交評(píng)論