




版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進(jìn)行舉報或認(rèn)領(lǐng)
文檔簡介
1、第二講 完全信息靜態(tài)博弈 所謂完全信息靜態(tài)博弈即各博弈方同時決策,且所有博弈方對博弈中的各種情況下的得益都完全了解的博弈問題l納什均衡l無限策略博弈的解和反應(yīng)函數(shù)l混合策略l納什均衡的存在性2.1 納什均衡l博弈的解和納什均衡l嚴(yán)格下策反復(fù)消去法與納什均衡2.1.1博弈的解和納什均衡定義定義 在博弈 中,如果策略組合 中任一博弈方i的策略 都是對其余博弈方的策略組合 的最佳對策,也即 對任意 都成立,則稱 為G的一個納什均衡納什均衡。11,.,;,.,nnGSS uu*1(,.)nss*is*111( ,.,., )iinssss*111111( ,.,., )( ,., ,., )iiini
2、iijinu ss ssu ss s ssijisS*1(,.)nss 斯特恩巴赫是費城的一個家庭保健醫(yī)生,她很奇怪為什么輝瑞公司(Pfizer)的五位不同推銷員重復(fù)上門到她的診所推銷同樣的止痛藥Betra及Celebrex。她在貯藏室里一個像冰箱大的柜子里已裝滿了Bextra和Celebrex,她說,“眾多的推銷員重復(fù)同樣的產(chǎn)品,沒有任何新意,實在是離奇?!?長達(dá)十年的招聘狂潮使制藥業(yè)的推銷員人數(shù)增加到90000,為原來人數(shù)的三倍。制藥業(yè)人士篤信:只要推銷員與醫(yī)生推銷一種藥越頻繁,醫(yī)生越有可能多開此藥。 據(jù)統(tǒng)計,2010年制藥業(yè)在推銷員工上花費為120多億美元,在藥物廣告上花費為27.6億美
3、元。根據(jù)聯(lián)邦政府的報告,美國國內(nèi)在處方藥上的支出激增14%,達(dá)到1,610億美元。專欄專欄制藥公司的銷售大戰(zhàn)制藥公司的銷售大戰(zhàn)(摘自華爾街日報)(摘自華爾街日報)輝瑞推銷員止痛藥醫(yī)生2010年美國制藥業(yè)推銷員工與藥物廣告花費(單位:億美元)專欄專欄制藥公司的銷售大戰(zhàn)制藥公司的銷售大戰(zhàn)(摘自華爾街日報)(續(xù))(摘自華爾街日報)(續(xù)) 盡管如此,沒有任何一家制藥商愿意第一個單方面裁軍。葛蘭素史克公司(GlaxoSmithKline)的推銷員隊伍是如此壯大:它只需要七天就可以聯(lián)系到美國80%以上的醫(yī)生?!斑@有必要嗎?”葛蘭素史克的CEO加涅爾說:“應(yīng)該說是沒有必要,但是如果我的競爭對手能而我做不到,
4、我們就處于劣勢。這的確是以最壞可能的方式進(jìn)行的軍備競賽?!?“擁有眾多的推銷員不是競爭優(yōu)勢的源泉”,默克公司的主席和CEO吉爾馬丁補(bǔ)充說。他說制藥商通過發(fā)現(xiàn)新藥來獲得優(yōu)勢。然而,默克公司2001年起在美國已增加了1500名推銷員,使得總數(shù)達(dá)到約7000人。 既然誰都知道擁有眾多的推銷員并不是競爭優(yōu)勢的源泉,那為什么各家制藥公司的推銷員仍然在不斷膨脹呢? 引自周林,商業(yè)戰(zhàn)略決策:博弈論的應(yīng)用同步,一次博弈同步,一次博弈- -標(biāo)準(zhǔn)式博弈標(biāo)準(zhǔn)式博弈l構(gòu)成標(biāo)準(zhǔn)式博弈的要素有:參與者:參加博弈并做出決策的個體策略:參與者可能采取的行動得益:參與者采取不同策略帶來的利益或損失參與者 2參與者 1策略策略A
5、 AB BCCa a3 3,2 22 2,3 35 5,4 4b b2 2,1 11 1,2 23 3,3 3c c1 1,6 61 1,4 44 4,5 5標(biāo)準(zhǔn)式博弈標(biāo)準(zhǔn)式博弈: :均衡分析均衡分析l假設(shè)參與者1認(rèn)為參與者2選擇 “A”參與者 2參與者 1策略策略A AB BCCa a3 3,2 22 2,3 35 5,4 4b b2 2,1 11 1,2 23 3,3 3c c1 1,6 61 1,4 44 4,5 5標(biāo)準(zhǔn)式博弈標(biāo)準(zhǔn)式博弈: :均衡分析均衡分析l則參與者1應(yīng)該選擇 “a”參與者1對 “A”的最優(yōu)反應(yīng)是 “a”.參與者 2參與者 1策略策略A AB BCCa a3 3,2 2
6、2 2,3 35 5,4 4b b2 2,1 11 1,2 23 3,3 3c c1 1,6 61 1,4 44 4,5 5標(biāo)準(zhǔn)式博弈標(biāo)準(zhǔn)式博弈: :均衡分析均衡分析l假設(shè)參與者1認(rèn)為參與者2選擇 “B”.參與者 2參與者 1策略策略A AB BCCa a3 3,2 22 2,3 35 5,4 4b b2 2,1 11 1,2 23 3,3 3c c1 1,6 61 1,4 44 4,5 5標(biāo)準(zhǔn)式博弈標(biāo)準(zhǔn)式博弈: :均衡分析均衡分析l則參與者1應(yīng)該選擇 “a”.參與者1對 “B”的最優(yōu)反應(yīng)是 “a”.參與者 2參與者 1策略策略A AB BCCa a3 3,2 22 2,3 35 5,4 4b
7、 b2 2,1 11 1,2 23 3,3 3c c1 1,6 61 1,4 44 4,5 5標(biāo)準(zhǔn)式博弈標(biāo)準(zhǔn)式博弈: :均衡分析均衡分析l如果參與者1認(rèn)為參與者2選擇 C參與者1對“C”的最優(yōu)反應(yīng)是“a”.參與者 2參與者 1策略策略A AB BCCa a3 3,2 22 2,3 35 5,4 4b b2 2,1 11 1,2 23 3,3 3c c1 1,6 61 1,4 44 4,5 5占優(yōu)策略占優(yōu)策略l不管參與者2是選擇A、B還是C, 參與者1都會選擇“a”!l“a” 是參與者1的占優(yōu)策略!l占優(yōu)策略(上策) 不管對手做什么,對一個參與者都能獲得最高得益的策略參與者 2參與者 1策略策略
8、A AB BCCa a3 3,2 22 2,3 35 5,4 4b b2 2,1 11 1,2 23 3,3 3c c1 1,6 61 1,4 44 4,5 5站到對手的立場上,想站到對手的立場上,想l參與者2會怎么做呢?n 參與者2 沒有占優(yōu)策略!n但是參與者2應(yīng)該能夠推斷出1會選擇 “a”n因此參與者2會選擇 “C”參與者 2參與者 1策略策略A AB BCCa a3 3,2 22 2,3 35 5,4 4b b2 2,1 11 1,2 23 3,3 3c c1 1,6 61 1,4 44 4,5 5結(jié)果結(jié)果“a” 是參與者1對 “C”的最優(yōu)反應(yīng).“C” 是參與者2對 “a”的最優(yōu)反應(yīng).此
9、結(jié)果被稱為納什均衡納什均衡: 在給定其他參與者策略情況下,沒有一個參與者能通過單方面改變自己的策略而使自己的得益提高,從而沒有人有積極性打破這種均衡參與者 2參與者 1策略策略A AB BCCa a3 3,2 22 2,3 35 5,4 4b b2 2,1 11 1,2 23 3,3 3c c1 1,6 61 1,4 44 4,5 5關(guān)鍵點:關(guān)鍵點:l尋找占優(yōu)策略 檢查一下你是否存在占優(yōu)策略,如果有,就選擇占優(yōu)策略l站在對手的位置上思考問題 如果你沒有占優(yōu)策略,那么從你對手角度考慮博弈。如果對手有占優(yōu)策略,預(yù)期他將按占優(yōu)策略行動l納什均衡 我所做的是:給定你所做的,我所做的是最好的; 你所做的
10、是:給定我所做的,你所做的是最好的同步,一次博弈的應(yīng)用同步,一次博弈的應(yīng)用l專欄的博弈分析(制藥公司銷售大戰(zhàn))策略適中龐大適中10,105,13龐大13,57,7默克輝瑞納什均衡納什均衡l彩電價格大戰(zhàn)策略低價高價低價0,03,-1高價-1,31,1伯特蘭德寡頭壟斷(同質(zhì)產(chǎn)品,價格競爭)海信長虹納什均衡納什均衡2.1.1博弈的解和納什均衡l劃線法 囚徒2 不坦白 坦白 囚 不坦白 徒 1 坦白 l箭頭法 囚徒2 不坦白 坦白 囚 不坦白 徒 1 坦白 1 1,1 1 8 8,0 0 0 0,8 8 5 5,5 51 1,1 1 8 8,0 0 0 0,8 8 5 5,5 5 劃線法劃線法1, 0
11、1, 30, 10, 40, 22, 0-5, -50, -8-8, 0-1, -1囚囚徒徒困困境境-1, 11, -11, -1-1, 1猜猜硬硬幣幣2, 10, 00, 01, 3夫夫妻妻之之爭爭 箭頭法箭頭法1, 01, 30, 10, 40, 22, 0-5, -50, -8-8, 0-1, -1囚囚徒徒困困境境-1, 11, -11, -1-1, 1猜猜硬硬幣幣2, 10, 00, 01, 3夫夫妻妻之之爭爭 2.1.2 嚴(yán)格下策反復(fù)消去法嚴(yán)格下策反復(fù)消去法嚴(yán)格下策嚴(yán)格下策:不管其它博弈方的策略如何變化,給一個博弈方帶來的收益總是比另一種策略給他帶來的收益小的策略嚴(yán)格下策反復(fù)消去:1
12、,01,30,10,40,22,0左左中中右右上上下下1,01,30,40,2左左中中1,01,3左左中中國家戰(zhàn)略:軍備競賽國家戰(zhàn)略:軍備競賽 l兩國之間的軍備競賽可以用囚徒困境來描述。l兩國都可以聲稱有兩種選擇:增加軍備(背叛)、或是達(dá)成削減武器協(xié)議(合作)l兩國都無法肯定對方會遵守協(xié)議,因此兩國最終會傾向增加軍備l似乎自相矛盾的是,雖然增加軍備會是兩國的“理性”行為,但結(jié)果卻顯得“非理性”(例如會對經(jīng)濟(jì)造成都有損壞等)l這種被稱作“遏制理論”的推論,就是以強(qiáng)大的軍事力量來遏制對方的進(jìn)攻,以達(dá)到和平 你要給我小你要給我小心點啊!心點??!我也不是好我也不是好惹的!惹的!博弈論與企業(yè)競爭企業(yè)、政
13、府與商業(yè)環(huán)境軍事力量是軍事力量是世界制衡的世界制衡的砝碼砝碼為什么要削減武器?為什么要削減武器?我們還是好好談?wù)劙晌覀冞€是好好談?wù)劙刹┺恼撆c企業(yè)競爭企業(yè)、政府與商業(yè)環(huán)境l彩電價格大戰(zhàn)策略低價高價低價0,03,-1高價-1,31,1伯特蘭德寡頭壟斷(同質(zhì)產(chǎn)品,價格競爭)伯特蘭德寡頭壟斷(同質(zhì)產(chǎn)品,價格競爭)海信海信長虹長虹納什均衡納什均衡博弈論與企業(yè)競爭企業(yè)、政府與商業(yè)環(huán)境2.2 無限策略的解和反應(yīng)函數(shù)l古諾的寡頭模型l反應(yīng)函數(shù)l伯特蘭德的寡頭模型l公共資源問題2.2.1古諾的寡頭模型 博弈方1 1利潤: 博弈方2 2利潤: 在本博弈中, 的納什均衡的充分必要條件是 和 的最大值問題: 社會收益
14、最大化: 假設(shè)總產(chǎn)量為Q Q,總收益為U UQPQP(Q Q)CQCQ Q Q(8-Q8-Q)2Q2Q6Q6QQ Q2 2 其最大值為Q Q* *=3,U=9=3,U=9 該結(jié)果與納什均衡有較大的差異,這就是納什均衡是源于各廠商追求自身利益最大化的結(jié)果。2111 1112111 21( )8 ()26uqP QCqqqqqqqqq2222221222122( )8()26uq P QC qqqqqqq qq*12(,)qq*1q*2q12*21121*22122max(6)max(6)qqqq qqqq qq*122, u=8qq4.5,4.55,3.753.75,54,4不突破不突破突破突破
15、廠商廠商2不突破不突破 突破突破廠廠商商1以自身最大利益為目標(biāo):各生產(chǎn)2單位產(chǎn)量,各自得益為4以兩廠商總體利益最大:各生產(chǎn)1.5單位產(chǎn)量,各自得益為4.5兩寡頭間的囚徒困境博弈兩寡頭間的囚徒困境博弈28分析經(jīng)營管理的實踐案例分析經(jīng)營管理的實踐案例29誠信之道誠信之道p當(dāng)一個社會缺乏信用、蔑視契約時,是難以建立人與人之間的互信基礎(chǔ)的。所以從建立對信用和契約神圣的認(rèn)知,并用強(qiáng)制措施加以保障。30誠信的選擇誠信的選擇u道德乎?u策略乎?31社會學(xué)家和經(jīng)濟(jì)學(xué)家的爭辯社會學(xué)家和經(jīng)濟(jì)學(xué)家的爭辯p社會學(xué)家云:誠信是人在較低層次的需求得到適當(dāng)滿足之后自然出現(xiàn)的一種較高層次的需求;誠信帶給人的滿足感會超過逐利帶
16、來的滿足感 。p經(jīng)濟(jì)學(xué)家云:人們在重復(fù)博弈、反復(fù)切磋過程中謀求長期的、穩(wěn)定的物質(zhì)利益的一種策略選擇。32誠信案例誠信案例假定A 是一名生產(chǎn)商,B 是一名銷售商,AB 雙方互為博弈對手,會出現(xiàn)以下4種博弈的可能性:u雙方都講誠信,A 按約交貨,B 按約付款,各得其所,每人都得到的效用都是10;uA 誠信而B不誠信,A 交了貨而B 不付款,那麼B可以獲得自己最大的利益,得15,而A 吃虧了,得-10;uA 不誠信而B誠信,即A 收了錢而不發(fā)貨,則A 的利益實現(xiàn)了最大化,得15,而B 得-10;uA B 雙方互不信任,也互不守信,生意泡湯了,各自的效用都為0。 33矩陣分析矩陣分析 生產(chǎn)方銷售方誠信
17、不誠信誠信10 10 -10 15不誠信15 -100 0l交易34案例研討案例研討自身利益最大化: 對方講誠信,自己不講誠信合理結(jié)果: 都不講誠信 雙贏: 都講誠信35誠信缺失的案例誠信缺失的案例l安然l安達(dá)信l丑聞36背景背景n 安達(dá)信是全球五大會計事務(wù)所之一。它代理著美國23000家上市公司的審計業(yè)務(wù),占美國上市公司總數(shù)的17%。2002年安達(dá)信卻因為假帳問題被美國國會、司法部、證券交易委員會調(diào)查,接下來包括福特汽車、默克制藥、聯(lián)邦快遞、德爾塔航空公司在內(nèi)的36家大客戶與安達(dá)信解除了合同。37共贏案利共贏案利中銀消費信貸卡38背景背景n中銀消費信貸記錄卡是中國銀行消費信貸業(yè)務(wù)中一創(chuàng)新產(chǎn)品
18、,是為客戶提供貸款購物且具無抵押、零首付、減免息等優(yōu)點的消費記錄憑證。它依附于中國銀行長城信用卡或長城電子借記卡,由北京市商業(yè)信息資詢中心監(jiān)制,北京資和信咨詢公司負(fù)責(zé)發(fā)行管理。 39經(jīng)營分析經(jīng)營分析得到付出基礎(chǔ)客戶免減息;無首付;無抵押;信用循環(huán);便捷年費誠信銀行收益、人氣信用卡平臺誠信商戶收益、人氣貼息誠信中介收益、人氣管理誠信2.2.2 反應(yīng)函數(shù) 反應(yīng)函數(shù)反應(yīng)函數(shù)每個博弈方針對其他博弈方所有策略的最佳反應(yīng)構(gòu)成的函數(shù)。而各個博弈方反應(yīng)函數(shù)的交點交點(如果有的話)就是納什均衡。2.2.2 反應(yīng)函數(shù)古諾模型l在古諾模型中廠商1和廠商2的反應(yīng)函數(shù)分別為1122221111()(6), ()(6)2
19、2qR qqqR qqq2q1(0,6)(0,3)R1(q2)R2(q1)(2,2)60(3,0)(6,0) 從左圖可以看出,當(dāng)一方的選擇為0時,另一方的最佳反應(yīng)為3,這正是我們前面所說過的實現(xiàn)總體最大利益的產(chǎn)量,因為一家產(chǎn)量為零,意味著另一家壟斷市場。當(dāng)一方的產(chǎn)量達(dá)到6時,另一方則被迫選擇0,因為實際上堅持生產(chǎn)已無利可圖。2.2.3 伯特蘭德的寡頭模型 l在該模型中廠商選擇價格而不是產(chǎn)量l廠商1的價格與需求函數(shù): P1, 廠商2的價格與需求函數(shù): P2, 其中,d1,d20為兩廠商產(chǎn)品的替代系數(shù)。假設(shè)兩廠商無固定成本,邊際成本分別為c1和c2。收益:納什均衡:221222221 ( ,)qq
20、 P Pab Pd P11121 11 11111 11 222122 22 22222 22 1( ,)()()( ,)()()uu P PPqcqPcabPd Puu P PPqc qPcab Pd P*12122 211 11 2121 212*21211 122 21 2121 2122()()442()()44dbPab cabcbbd dbbd ddbPabcab cbbd dbbd d111211 112(,) qq P Pab Pd Pl公共地悲劇l英國人哈定:十八世紀(jì)以前,蘇格蘭地區(qū)大量草地,由于屬公共資源導(dǎo)致過度放牧,致使草地消失,生態(tài)破壞2.2.4公共資源問題l公共產(chǎn)品的
21、供給 如果大家都出錢興辦公用事業(yè),所有人的福利都會增加。問題是,如果我出錢你不出錢,我得不償失,而如果你出錢我不出錢,我就可以占你的便宜。所以每個人的最優(yōu)選擇都是“不出錢”,結(jié)果使所有人的福利都得不到提高。l軍備競賽 兩國都不搞軍備競賽,都把資源用于民用,兩國福利都變好。但由于都怕受威脅而大搞軍備競賽,結(jié)果兩國福利都變得更糟。l經(jīng)濟(jì)改革 經(jīng)濟(jì)改革要付出成本(包括風(fēng)險),而改革的成果大家享受,結(jié)果是,盡管人人都認(rèn)為改革好,卻很難有人真正去改革,大家只好在都不滿意的體制下繼續(xù)生活下去。2.2.4公共資源問題2.2.4公共資源問題l公共資源 (1)沒有哪個個人、企業(yè)或其他經(jīng)濟(jì)組織擁有;(2)大家都可
22、以自由利用這兩個特征的自然資源或人類生產(chǎn)的供大眾免費使用的設(shè)施或財貨。l例 設(shè)某村莊有n個農(nóng)戶,一公共草地,可養(yǎng)羊數(shù)為qi(i=1,n)為n個農(nóng)戶各自的策略空間,當(dāng)各戶養(yǎng)羊數(shù)為q1,qn時,總數(shù)為Q q1 qn,每只羊的產(chǎn)出為羊的總數(shù)Q的減函數(shù)VV(Q)=V(q1 qn),假設(shè)每只羊的成本為c,則農(nóng)戶i養(yǎng)qi只羊的得益為:ui= qiV(Q)-qic2.2.4公共資源問題實例 設(shè)n3,V100Q100(q1q2q3),c4 三農(nóng)戶的得益函數(shù)和反應(yīng)函數(shù): u1q1100(q1q2q3)4q1, q1R1(q2,q3)=48-0.5q2-0.5q3 u2q2100(q1q2q3)4q2, q2R1
23、(q1,q3)=48-0.5q1-0.5q3 u3q3100(q1q2q3)4q3, q3R1(q1,q2)=48-0.5q1-0.5q2 納什均衡: q1*=q2*=q3*=24, u1*=u2*=u3*=576 最大總體收益:u*=2304 Q*=48 由此說明,納什均衡的解常常是低效率的,而在現(xiàn)實生活中卻經(jīng)常出現(xiàn)。如果采取最佳策略(集體理性),那么個體的貪婪性將會來破壞這一平衡。1728576323047224348uQ47系統(tǒng)思維和雙贏策略系統(tǒng)思維和雙贏策略u“商場如戰(zhàn)場”企業(yè)在商戰(zhàn)中的惡性競爭不僅僅損害的是企業(yè)的利益,更可怕的是往往將一個行業(yè)做“爛”。u“雙贏”是一種相互的妥協(xié),也是
24、一種良性的競爭,它可以幫助我們實現(xiàn)共同利益的最大化。也就是說,它可以使我們都能分到“蛋糕”,而且可以使我們一起“把蛋糕做大”。48行業(yè)自律行業(yè)自律 道德約束道德約束組織形式: 中介組織;行會;保險公司每個博弈者建立各自的“圈子”A與B的生意可能只是一次性的,但是,A卻要長期與B所在“圈子”打交道,這樣,通過“圈子”,A與B的一次性博弈就轉(zhuǎn)化為A與B所在“圈子”的重復(fù)博弈。同時,“圈子”還有另一重作用,就是傳遞信息,是“雙盲”博弈變成“透明”博弈,提高合作的可能性 。49制度保證制度保證 政府監(jiān)管政府監(jiān)管保險制度 ; 信用制度健全法制,完善有關(guān)規(guī)章制度,讓不遵守游戲規(guī)則的投機(jī)取巧者、坑蒙拐騙者和
25、背信棄義者受到應(yīng)有的懲罰。 法律旨在使合作利益能夠順利實現(xiàn),旨在促進(jìn)繁榮,而并非為了威嚇百姓。我國最早文獻(xiàn)尚書.呂刑篇曾明確地指出:典獄非訖于威,唯訖于富。擺脫惡性競爭,建立規(guī)則。l位置博弈l商業(yè)布點、飛機(jī)航班、電視節(jié)目、政治選舉01/41/23/41ABA Bl智豬博弈 豬圈中有一頭大豬一頭小豬,豬圈一端有個按鈕,每按一下豬圈另一端食槽中會有10個單位豬食進(jìn)槽,但按一下會耗去相當(dāng)于2單位豬食的成本。如果大豬先到食槽,大豬吃到9單位食物,小豬只能吃到1單位;如小豬先到,小豬吃4單位而大豬吃6單位;如果同時按并同時到食槽,則大豬吃7單位而小豬吃3單位食物。按等待按5,14,4等待9,-10,0小
26、豬大豬納什均衡納什均衡關(guān)鍵點關(guān)鍵點l處于強(qiáng)勢的參與者為維護(hù)自己利益采取某種決策時,為其他弱勢參與者提供了搭便車的機(jī)會股市中的機(jī)構(gòu)大戶與散戶新產(chǎn)品研發(fā)與中小企業(yè)可口可樂、百事可樂與非品牌軟飲料產(chǎn)品(Scott)小狗策略大智若愚中的智慧貧困縣的教育撥款智豬博弈的進(jìn)一步分析智豬博弈的進(jìn)一步分析l答案是:小豬將選擇“搭便車”策略,也就是舒舒服服地等在食槽邊;而大豬則為一點殘羹不知疲倦地奔忙于踏板和食槽之間。l原因何在?因為,小豬踩踏板將一無所獲,不踩踏板反而能吃上食物。對小豬而言,無論大豬是否踩動踏板,不踩踏板總是好的選擇。反觀大豬,已明知小豬是不會去踩動踏板的,自己親自去踩踏板總比不踩強(qiáng)吧,所以只好
27、親力親為了。 l“小豬躺著大豬跑”的現(xiàn)象是由于故事中的游戲規(guī)則所導(dǎo)致的。規(guī)則的核心指標(biāo)是:每次落下的食物數(shù)量和踏板與投食口之間的距離。 l如果改變一下核心指標(biāo),豬圈里還會出現(xiàn)同樣的“小豬躺著大豬跑”的景象嗎? 博弈論與企業(yè)競爭企業(yè)、政府與商業(yè)環(huán)境智豬博弈的進(jìn)一步分析智豬博弈的進(jìn)一步分析改變一下指標(biāo),情景如何?改變一下指標(biāo),情景如何?l1.減量方案:投食僅原來的一半分量。l1.結(jié)果是小豬大豬都不去踩踏板了。小豬去踩,大豬將會把食物吃完;大豬去踩,小豬將也會把食物吃完。誰去踩踏板,就意味著為對方貢獻(xiàn)食物,所以誰也不會有踩踏板的動力了。 怎樣才能實現(xiàn)多勞多得?怎樣才能實現(xiàn)多勞多得?博弈論與企業(yè)競爭企
28、業(yè)、政府與商業(yè)環(huán)境按等待按(3.5-2)1.5,(1.5-2)-0.5-1,4等待5,-20,0小豬小豬大豬大豬納什均衡納什均衡智豬博弈的進(jìn)一步分析智豬博弈的進(jìn)一步分析l2.增量方案:投食為原來的一倍分量。 l.結(jié)果是小豬、大豬都會去踩踏板。誰想吃,誰就會去踩踏板。反正對方不會一次把食物吃完。小豬和大豬相當(dāng)于生活在物質(zhì)相對豐富的“共產(chǎn)主義”社會,所以競爭意識卻不會很強(qiáng)。 l3.減量加移位方案:投食僅原來的一半分量,但同時將投食口移到踏板附近。 l小豬和大豬都在拼命地?fù)屩忍ぐ濉5却卟坏檬?,而多勞者多得。每次的收獲剛好消費完。 企業(yè)、政府與商業(yè)環(huán)境博弈論與企業(yè)競爭智豬博弈的進(jìn)一步分析智豬博弈的
29、進(jìn)一步分析思考題:思考題:“聰明的豬聰明的豬”游戲游戲在企業(yè)經(jīng)營方面有哪些啟示?在企業(yè)經(jīng)營方面有哪些啟示?人力資源人力資源市場營銷市場營銷企業(yè)戰(zhàn)略企業(yè)戰(zhàn)略博弈論與企業(yè)競爭企業(yè)、政府與商業(yè)環(huán)境斗雞博弈斗雞博弈進(jìn)進(jìn) 退退“大將軍大將軍”“猛英雄猛英雄”進(jìn)進(jìn)退退-3,-32,00,20,0相對優(yōu)勢戰(zhàn)略圈定法相對優(yōu)勢戰(zhàn)略圈定法博弈論與企業(yè)競爭57企業(yè)、政府與商業(yè)環(huán)境討論討論l 先動優(yōu)勢先發(fā)制人、志在必得不戰(zhàn)而屈人之兵,善之善者也。l后動優(yōu)勢靜觀其變、從容應(yīng)付昔之善戰(zhàn)者,先為不可勝,以待敵之可勝。博弈論與企業(yè)競爭企業(yè)、政府與商業(yè)環(huán)境l協(xié)調(diào)博弈足球芭蕾足球2,10,0芭蕾0,01,2l情侶博弈女男策略22
30、0伏110伏220伏$100,$1000,0110伏0,0$100,$100企業(yè)B企業(yè)A此協(xié)調(diào)博弈有兩個納什均衡l產(chǎn)業(yè)標(biāo)準(zhǔn)(軟盤、CD的大小等) 國家標(biāo)準(zhǔn)(電壓、交通法等)關(guān)鍵點關(guān)鍵點l不是所有的博弈都涉及到利益沖突. l溝通能夠幫助解決協(xié)調(diào)問題.l順序行動能夠幫助解決協(xié)調(diào)問題.l先動優(yōu)勢的作用2.3 混合策略l概念l應(yīng)用2.3.1 概念的提出l在前面的例子,如猜硬幣,齊威王田忌賽馬,夫妻之爭等博弈問題不存在納什均衡策略組合,然而這類問題十分常見。l 例1 小偷與守衛(wèi)的博弈 守衛(wèi) 睡 不睡 小 偷 偷 不偷l例2 猜硬幣 1.若被對手事先知道出現(xiàn)哪一面,肯定輸 2.若正面出現(xiàn)的概率為p,負(fù)面為
31、1-p,且p0.5,則猜正面的話贏的幾率就比較大。V,-DV,-D-P,0-P,00,S0,S0,00,0猜硬幣博弈猜硬幣博弈 猜硬幣方猜硬幣方 正面正面 反面反面 蓋蓋 硬硬 正面正面 幣幣 方方 反面反面該博弈與上一個例子相似,即取勝的關(guān)鍵都是不該博弈與上一個例子相似,即取勝的關(guān)鍵都是不 能讓另一方猜到能讓另一方猜到自己的策略而同時自己又要盡可能猜出對方的策略。若自己的策略而同時自己又要盡可能猜出對方的策略。若p1/2,則則猜硬幣方全猜正面,他的期望得益為猜硬幣方全猜正面,他的期望得益為p1+(1-p) (-1)=2p-10,即平均來說,猜硬幣方贏多輸少。即平均來說,猜硬幣方贏多輸少。 -
32、1,11,-11,-1-1,1請找出這個博弈的納什均衡。請找出這個博弈的納什均衡。2.3.1 概念的提出l特點:1.自己的選擇不能讓對手預(yù)先知道2.若重復(fù)多次,則不讓對手發(fā)現(xiàn)其中的規(guī)律。除非有意輸(一種行賄的手段),注意行賄只是一個手段,有意無意間讓對手了解自己的策略或規(guī)律。2.3.1 概念的提出l定義:定義:在博弈G=s1,sn;u1,un中,博弈方i的策略空間為Si=si1,sik,則博弈方i以概率分布pi=(pi1,pik)隨機(jī)選擇其k個可選策略稱為一個“混合策略”,其中0pik1對k=1,k都成立且pi1+pik=1。l相對于這種以一定概率分布在一些策略中隨機(jī)選擇的混合策略,確定性的具
33、體的策略我們稱為“純策略”l混合策略的原則:自己的策略選擇不能被另一方預(yù)知或猜到。即在決策時利用隨機(jī)性。選擇每種策略的概率一定要恰好使對方無機(jī)可乘,即讓對方無法通過有針對性的傾向某一策略而占上風(fēng)。納什定理納什定理l納什均衡的存在性定理(納什,1950):l 每一個有限博弈至少存在一個納什均衡。博弈論與企業(yè)競爭企業(yè)、政府與商業(yè)環(huán)境納什均衡納什均衡l純戰(zhàn)略均衡是就是,不是就不是l混合戰(zhàn)略均衡:純戰(zhàn)略空間的概率分布是也不是,不是也是例:投硬幣博弈 博弈論與企業(yè)競爭企業(yè)、政府與商業(yè)環(huán)境混合戰(zhàn)略納什均衡混合戰(zhàn)略納什均衡警察與小偷警察與小偷出工出工 收手收手警察警察小偷小偷巡夜巡夜睡覺睡覺1,-10,0-
34、1,11,-1警察巡夜的效用警察巡夜的效用=q。 睡覺的效用睡覺的效用=-q+(1-q)效用無差別,效用無差別, q=-q+(1-q) q*=1/3P1-Pq 1-q小偷出工的效用小偷出工的效用=-p+(1-p)。 收手的效用收手的效用=-(1-p)效用無差別,效用無差別, -p+(1-p)=-(1-p) p*=2/3博弈論與企業(yè)競爭68企業(yè)、政府與商業(yè)環(huán)境討論:混合戰(zhàn)略納什均衡討論:混合戰(zhàn)略納什均衡l度:為與不為之間l兩難問題的一條出路l 博弈論與企業(yè)競爭企業(yè)、政府與商業(yè)環(huán)境2.3.2 應(yīng)用博弈方1 1選A A、B B的概率:p pA A,p pB B;博弈方2 2選C C、D D的概率:p
35、 pC C,p pD D。原則應(yīng)用:博弈方1選A和B的概率p pA和p pB B一定要使博弈方2 2選C C的期望得益和選D D的期望得益相等。即 p pA A 3 3 p pB B1 1 p pA A 2 2 p pB B5 5又由p pA A p pB B1 1,可得 p pA A0.80.8, p pB B0.20.2,此即博弈方1 1應(yīng)選的混合策略。 同理可得博弈方2 2的混合策略為 p pC C0.8, p0.8, pD D0.20.2。納什均衡:1 1(0.80.8,0.20.2),),2 2(0.80.8,0.20.2)期望得益:u1e pA. pC. u1(A,C) pA. p
36、D. u1(A,D) pB. pC. u1(B,C) pB. pD. u1(B,D)2.6 u2e2.6 單獨一次博弈的結(jié)果可能是四種狀態(tài)的任何一種,然而多次獨立重復(fù)博弈得到如上的結(jié)果是可能的。 2,35,23,11,5 2 2 C D C D A A 1 1 B B2022年2月18日712.3.2 應(yīng)用l一、案例:情侶博弈l(三)優(yōu)勢策略均衡(足球,足球),(時裝,時裝)2, 10, 00, 01, 3時時 裝裝足足 球球時裝時裝足球足球丈丈 夫夫妻妻子子夫妻之爭夫妻之爭2.3.2 應(yīng)用l混合策略的方法不僅可以解決不存在純策略納什均衡的博弈問題,同樣可應(yīng)用于存在多個純策略納什均衡的博弈問題。l例 夫妻之爭 該博弈與上一個博弈的不同之處在 于每一方所希望對方知道自己的策略選 擇以達(dá)到有利于自己的結(jié)果。現(xiàn)實中, 這類問題多通過協(xié)商解決以免兩敗俱傷。 在此我們假設(shè)夫妻雙方不可協(xié)商,互不通消息。 令p pw w(
溫馨提示
- 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
- 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
- 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
- 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負(fù)責(zé)。
- 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請與我們聯(lián)系,我們立即糾正。
- 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時也不承擔(dān)用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。
最新文檔
- 二手機(jī)器買賣服務(wù)合同范本
- 2025年惠州貨運上崗證模擬考試0題
- 業(yè)務(wù)外合同范本
- 2025年景德鎮(zhèn)貨運資格證考試答案
- 供應(yīng)商代發(fā)合同范本
- 臨時用工解除協(xié)議合同范本
- 初設(shè)評審合同范本
- 書供貨采購合同范本
- 佛山團(tuán)購合同范本
- 買車合作合同范本
- 售樓部銷售禮儀培訓(xùn)內(nèi)容
- 幼兒園木工坊安全教育
- 內(nèi)科主任年終述職報告
- (高清版)DZT 0347-2020 礦山閉坑地質(zhì)報告編寫規(guī)范
- 船舶起重安全管理規(guī)定規(guī)定培訓(xùn)
- 2024年不停電電源UPS相關(guān)項目營銷計劃書
- 智慧農(nóng)業(yè)中的農(nóng)業(yè)機(jī)械與設(shè)備管理技術(shù)
- 干式變壓器培訓(xùn)課件
- 公司SWOT分析表模板
- 2023年上海中考語文試卷(附答案)
- 解決問題的工作方案
評論
0/150
提交評論