版權說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權,請進行舉報或認領
文檔簡介
1、 理性是共同知識時的理性是共同知識時的博弈求解博弈求解 基本概念:理性、信念、混合策略與期望效用基本概念:理性、信念、混合策略與期望效用博弈求解:參與者是理性的博弈求解:參與者是理性的博弈求解:參與者是理性的且參與者知道博弈求解:參與者是理性的且參與者知道參與者是理性的參與者是理性的博弈求解:理性成為共同知識博弈求解:理性成為共同知識定位博弈定位博弈合伙人博弈合伙人博弈第4講 理性是共同知識時的博弈求解4.1 基本概念基本概念4.1.1基本概念基本概念理性理性 當一位參與者盡可能使自己的支付最大化并采取行動時, 就認為這位參與者是理性理性的。 參與者有足夠的能力對自身的處境進行判斷 參與者有足
2、夠的能力對其他參與者的行為進行預期 參與者有足夠的能力對各種行動方案進行評估 參與者以自身支付支付最大化原則采取行動 理性意味著僅僅追求自身的利益,而不管這些利益是如何 被定義的。偏好4.1 基本概念基本概念4.1.2基本概念基本概念信念信念 信念是參與人對其他參與人行為的主觀判斷。從數(shù)學上看,參與人i的信念是關于其他參與人的策略的一個概率分布,用-i來表示, -i S-i,其中S-i是指除了參與人i的其他所有參與人所采取策略的概率分布集合。 在兩方博弈中(-i=j),假定每個參與人都有有限數(shù)量的策略。參與人i對于參與人j所采取策略的信念是一個函數(shù)jSj,其中對于參與人j的每一個策略sjSj,
3、 j ( sj )表示參與人i認為參與人j可能采取sj的概率。 j性質(zhì):對于每一個sjSj , 有 j ( sj ) 0且 sjSj j ( sj ) =1 比如,參與人j的策略有A,B,C三種, j ( A )=1/3, j ( B)=1/6 , j ( C )=1/2。4.1 基本概念基本概念4.1.3基本概念基本概念混合策略混合策略 u 一個參與人的混合策略是指這個參與人根據(jù)一個概率分布來隨機選擇策略的行為。參與人i的混合策略用i表示, i Si, Si為參與人i的混合策略集合。 u 比如,一個參與人可以在U和D兩種策略之間進行選擇,他選擇U的概率為1/2,選擇D的概率也為1/2,則他的
4、混合策略為(1/2,1/2)。 i 性質(zhì): i中的每個元素不小于0,各元素之和為1. 混合策略包括了純策略,純策略是混合策略的一種特殊情況。 4.1 基本概念基本概念基本概念期望效用 (上) 一個參與人的期望效用是指這個參與人采取策略一個參與人的期望效用是指這個參與人采取策略si,而其,而其他人根據(jù)他人根據(jù)-i采取行動時的采取行動時的“平均平均”得益。得益。 以右圖所示的博弈為例,假設參與人1相信參與人2采取策略L的可能性為1/2,采取策略M和R的可能性都是1/4。即2(L)=1/2, 2(M)=1/4, 2(R)=1/4。這個信念簡寫為(1/2,1/4,1/4)。如果參與人1選擇U,他的期望
5、效用為:4.1 基本概念基本概念基本概念期望效用 (下) 當在博弈中有參與人使用混合策略時,參與人的支付也當在博弈中有參與人使用混合策略時,參與人的支付也使用期望效用來計算。使用期望效用來計算。仍以右圖所示的博弈為例,假設參與人2選擇M,參與人1采取混合策略(1/3,1/3,1/3),那么參與人1的支付為:u1(,M)=(1/3)*0+(1/3)*1+(1/3)*2=1參與人2的支付為: u2(,M)=(1/3)*2+(1/3)*2+(1/3)*3=7/3 【小練習】試計算參與人1采取混合策略(1/3,1/3,1/3),參與人2采取混合策略(0,1/2,1/2)時,雙方的支付情況。4.1 基本
6、概念基本概念基本概念最優(yōu)反應(上) 假設參與人i對于其他參與人采取的策略具有信念,-i S-i,參與人i的策略si Si如果對于任何si Si都滿足ui(si,i) ui(si,i),那么si是一個最優(yōu)反應。 以右圖所示的博弈為例,假設參與人1相信參與人2采取策略L的可能性為1/3,采取策略C的可能性為1/2,采取策略R的可能性為1/6.這個信念可表示為(1/3,1/2,1/6)。參與人1采取策略U、M、D的期望效用分別為: 4.1 基本概念基本概念基本概念最優(yōu)反應(下) 仍以右圖所示的博弈為例,假設參與人2對參與人1所采取的策略具有信念(1/2,1/4,1/4)。 參與人2采取策略L、C、R
7、的期望效用分別為: 4.2 博弈求解:參與者是理性的博弈求解:參與者是理性的 嚴格優(yōu)于(嚴格優(yōu)于(strictly dominates):無論其他對手):無論其他對手的策略是什么,若策略的策略是什么,若策略s產(chǎn)生的支付(收益)嚴格產(chǎn)生的支付(收益)嚴格高于高于s產(chǎn)生的收益,那么策略產(chǎn)生的收益,那么策略s為嚴格優(yōu)于策略為嚴格優(yōu)于策略s。 4.2 博弈求解:參與者是理性的博弈求解:參與者是理性的 弱優(yōu)于(弱優(yōu)于(weakly dominates):無論其他對手的策):無論其他對手的策略是什么,若策略略是什么,若策略s產(chǎn)生的支付(收益)不低于產(chǎn)生的支付(收益)不低于s產(chǎn)產(chǎn)生的收益,那么策略生的收益,
8、那么策略s為弱優(yōu)于策略為弱優(yōu)于策略s。4 4.2.2 .2.2 博弈求解:參與者是理性的博弈求解:參與者是理性的 弱優(yōu)于弱優(yōu)于4.2 博弈求解:參與者是理性的博弈求解:參與者是理性的 4 4.2.2 .2.2 博弈求解:參與者是理性的博弈求解:參與者是理性的 占有策略占有策略歌劇托斯卡的博弈情景反映了個人理性與歌劇托斯卡的博弈情景反映了個人理性與集體理性之間的重要區(qū)別。集體理性之間的重要區(qū)別。占優(yōu)策略(占優(yōu)策略(dominant strategy):如果一個策略嚴格):如果一個策略嚴格優(yōu)于其他策略,那么稱這個策略為占優(yōu)策略。優(yōu)于其他策略,那么稱這個策略為占優(yōu)策略。如果一個策略被占優(yōu),則稱為劣勢
9、策略。如果一個策略被占優(yōu),則稱為劣勢策略。 一個理性參與者從不使用嚴格劣勢策略,一個理性參與者從不使用嚴格劣勢策略,一個理性參與者總是使用占優(yōu)策略。一個理性參與者總是使用占優(yōu)策略。4.2 博弈求解:參與者是理性的博弈求解:參與者是理性的 4 4.2.4.2.4博弈求解:參與者是理性的博弈求解:參與者是理性的小練習小練習找出以下博弈中的劣勢策略:找出以下博弈中的劣勢策略:要點提示:要點提示:在一個策略未被純策略占優(yōu)時,要考慮在一個策略未被純策略占優(yōu)時,要考慮這個策略是否被混合策略占優(yōu)!這個策略是否被混合策略占優(yōu)!4.2 博弈求解:參與者是理性的博弈求解:參與者是理性的 4.2.5 博弈求解:參與
10、者是理性的博弈求解:參與者是理性的種族隔離種族隔離 4.2 博弈求解:參與者是理性的博弈求解:參與者是理性的 4.2.6 博弈求解:參與者是理性的博弈求解:參與者是理性的香煙廣告香煙廣告 兩家煙草公司:PM和RJR。香煙的年需求量為10億包。市場份額與廣告費成正比,PM的市場份額為:PM的銷售量為: 每包香煙獲利10美分,PM支出的廣告費用產(chǎn)生的收益為:RJR支出的廣告費用產(chǎn)生的收益為:4.2 博弈求解:參與者是理性的博弈求解:參與者是理性的 4.2.6 博弈求解:參與者是理性的博弈求解:參與者是理性的香煙廣告香煙廣告4.2 博弈求解:參與者是理性的博弈求解:參與者是理性的 4.2.7 4.2
11、.7 博弈求解:參與者是理性的博弈求解:參與者是理性的拍賣拍賣你對拍賣物品的估價為40萬元,對手的估價為30萬元,你們都知道彼此的估價。 一級價格拍賣(首價拍賣):競標價格最高者付款后將獲得拍賣品。如一級價格拍賣(首價拍賣):競標價格最高者付款后將獲得拍賣品。如果出價相同,各有果出價相同,各有1/21/2的概率得到拍賣品。的概率得到拍賣品。4.2 博弈求解:參與者是理性的博弈求解:參與者是理性的 4.2.7 4.2.7 博弈求解:參與者是理性的博弈求解:參與者是理性的拍賣拍賣你對拍賣物品的估價為40萬元,對手的估價為30萬元,你們都知道彼此的估價。 二級價格拍賣:競標價格最高者勝出,但他只需支
12、付第二競拍價格即可得二級價格拍賣:競標價格最高者勝出,但他只需支付第二競拍價格即可得到拍賣品。如果出價相同,各有到拍賣品。如果出價相同,各有1/2的概率得到拍賣品。的概率得到拍賣品。4.3 博弈求解:參與者是理性的且參與者知道參與者是理性的 4.3 博弈求解:參與者是理性的且參與者知道參與者是理性的 4.3.1 博弈求解:參與者是理性的且參與者知道參與者是理性的團隊合作14.3 博弈求解:參與者是理性的且參與者知道參與者是理性的 4.3.1 博弈求解:參與者是理性的且參與者知道參與者是理性的團隊合作24.3 博弈求解:參與者是理性的且參與者知道參與者是理性的 4.3.2 博弈求解:參與者是理性
13、的且參與者知道參與者是博弈求解:參與者是理性的且參與者知道參與者是理性的理性的上帝存在論上帝存在論 4.3 博弈求解:參與者是理性的且參與者知道參與者是理性的 4.3.3 博弈求解:參與者是理性的且參與者知道參與者是博弈求解:參與者是理性的且參與者知道參與者是理性的理性的智豬博弈智豬博弈 4.3 博弈求解:參與者是理性的且參與者知道參與者是理性的 4.3.4 博弈求解:參與者是理性的且參與者知道參與者是博弈求解:參與者是理性的且參與者知道參與者是理性的理性的小練習小練習 4.4 博弈求解:理性成為共同知識博弈求解:理性成為共同知識 黑衣人:好吧,毒藥在哪?這場游戲才剛剛開始。你先挑,然后我們同
14、時喝下,不管誰生誰死,游戲結束。威茲尼:這太簡單了吧。我只要猜你的想法就行。你喜歡把毒藥放在自己的杯子里還是對手的杯子里?聰明的人總是會把毒藥放在自己的杯子里,因為他知道只有大傻瓜才會選眼前的東西。我不是大傻瓜,所以我不會選擇你面前的酒。但是,你一定知道我不是大傻瓜,那么我當然也不會選擇放在自己面前的酒。 4.4 博弈求解:理性成為共同知識博弈求解:理性成為共同知識4.4.1 博弈求解:理性成為共同知識博弈求解:理性成為共同知識興奮劑博弈興奮劑博弈 4.4 博弈求解:理性成為共同知識博弈求解:理性成為共同知識4.4.1 博弈求解:理性成為共同知識博弈求解:理性成為共同知識興奮劑博弈興奮劑博弈
15、4.4 博弈求解:理性成為共同知識博弈求解:理性成為共同知識4.4.2 博弈求解:理性成為共同知識重復剔除嚴格劣勢策略步驟步驟步驟1 1:剔除原有博弈中的所有嚴格劣勢策略(這一步基于所:剔除原有博弈中的所有嚴格劣勢策略(這一步基于所有參與者都是理性的);有參與者都是理性的); 步驟步驟2 2:剔除完成第一步后博弈中的所有嚴格劣勢策略(這一:剔除完成第一步后博弈中的所有嚴格劣勢策略(這一步基于每個參與者相信所有參與者是理性的);步基于每個參與者相信所有參與者是理性的);步驟步驟3 3:剔除完成第二步后博弈中的所有嚴格劣勢策略(這一:剔除完成第二步后博弈中的所有嚴格劣勢策略(這一步基于每個參與者相
16、信所有參與者相信所有參與者都是理性步基于每個參與者相信所有參與者相信所有參與者都是理性的);的); 步驟步驟t t:剔除完成第(:剔除完成第(t-1t-1)步后博弈中的所有嚴格劣勢策略。)步后博弈中的所有嚴格劣勢策略。 4.4 博弈求解:理性成為共同知識博弈求解:理性成為共同知識4.4.3 博弈求解:理性成為共同知識重復剔除嚴格劣勢策略舉例第一步第一步 4.4 博弈求解:理性成為共同知識博弈求解:理性成為共同知識4.4.3 博弈求解:理性成為共同知識重復剔除嚴格劣勢策略舉例第二步第二步 4.4 博弈求解:理性成為共同知識博弈求解:理性成為共同知識4.4.3 博弈求解:理性成為共同知識重復剔除嚴
17、格劣勢策略舉例結果結果 4.4 博弈求解:理性成為共同知識博弈求解:理性成為共同知識4.4.4 重復剔除劣勢策略練習重復剔除劣勢策略練習【練習1】求解以下博弈: 4.4 博弈求解:理性成為共同知識博弈求解:理性成為共同知識4.4.4 重復剔除劣勢策略練習重復剔除劣勢策略練習【練習2】求解以下博弈: 4.4 博弈求解:理性成為共同知識博弈求解:理性成為共同知識4.4.4 重復剔除劣勢策略練習重復剔除劣勢策略練習【練習3】在下面的博弈中,參與人1選擇策略C是不是理性的?為什么?:策略C被混合策略(1/2,1/2,0)所占優(yōu),策略C是一個劣勢策略。選擇C不是理性的。 4.5 定位博弈定位博弈 假設某
18、個街區(qū)被分為5個大小相等的區(qū)域,參與人1和參與人2出售相同的商品G,一件G利潤為5元,每個區(qū)域每天商品G的需求量為10件。顧客會到最近的攤點購買商品G。請問參與人1和2如何確定攤點位置,以確保自身利潤最大?12345 4.5 定位博弈定位博弈12345最終結果為(3,3),也就是說參與者1和2都在3區(qū)設立攤點,兩人平分整個市場。 該占位博弈的結果,很好地說明了麥當勞與肯德基為什么經(jīng)常在一起出現(xiàn)。 4.6 合伙人博弈合伙人博弈 人們之間的互動合作對大部分工作是必須的。企業(yè)的成功離不開合作。但是,工作場所的特性可能會造成某種“扭曲”,自利的行為會阻礙聯(lián)合生產(chǎn)的效率。 考慮一個兩人合作的情形。公司的利潤,合伙人均分,但依賴于每個人的努力程度。假設利潤p=4(x+y+cxy),x是參與人1的努力程度,y是參與人2的努力程度,c是正常數(shù),介于0到1/4之間,代表兩人之間的互補程度。合伙人1和2的個人成本分別為x2和y2,x和y都介于0到4之間。 4.6 合伙人博弈合伙人博弈 參與人1
溫馨提示
- 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權益歸上傳用戶所有。
- 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預覽,若沒有圖紙預覽就沒有圖紙。
- 4. 未經(jīng)權益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
- 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負責。
- 6. 下載文件中如有侵權或不適當內(nèi)容,請與我們聯(lián)系,我們立即糾正。
- 7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。
最新文檔
- 2025年度土地拍賣代理及法律咨詢合同4篇
- 2025年度臨床試驗數(shù)據(jù)管理合同主體權利義務界定4篇
- 2025年度影視制作企業(yè)職工勞動合同及知識產(chǎn)權保護協(xié)議4篇
- 門店合伙人年度業(yè)績評估與獎勵合同范本20254篇
- 二零二五版跨境電商平臺入股合同
- 加油站的行業(yè)規(guī)范與政策解讀
- 2024年08月蘇州銀行吳江支行招聘1人筆試歷年參考題庫附帶答案詳解
- 2025年度跨境電商進口稅收優(yōu)惠政策實施合同4篇
- 2025年陜西民營企業(yè)勞動合同規(guī)范書及實施指南3篇
- 中國一次性麻袋項目投資可行性研究報告
- 氧氣霧化吸入法
- 6月大學英語四級真題(CET4)及答案解析
- 氣排球競賽規(guī)則
- 電梯維修保養(yǎng)報價書模板
- 危險化學品目錄2023
- FZ/T 81024-2022機織披風
- GB/T 33141-2016鎂鋰合金鑄錠
- 2023譯林版新教材高中英語必修二全冊重點短語歸納小結
- JJF 1069-2012 法定計量檢定機構考核規(guī)范(培訓講稿)
- 綜合管廊工程施工技術概述課件
- 公積金提取單身聲明
評論
0/150
提交評論