


下載本文檔
版權說明:本文檔由用戶提供并上傳,收益歸屬內容提供方,若內容存在侵權,請進行舉報或認領
文檔簡介
1、綜合I類與II類理性人的博弈策略兩人零和博弈作為較歸整的形式,在博弈論的早期研究中已經得到的深入討論。本文引入了I類理性與II類理性 的概念,認為現實博弈中的參與人往往既可能從I類理性的 角度采取戰(zhàn)略,也可能是從II類理性人的角度出發(fā),因此,構造了一個綜合了I類和II類理性特征的支付矩陣,通過 對一些常見的非零和博弈實例進行討論,認為這一模型可以 解決戰(zhàn)略選擇的不確定性問題。但本文沒有對此進行嚴格的 數學證明。在經濟學的博弈 理論中,一般假設參與人(PLAYERS) 具有理性人的特征,即總是尋求自身的最大化利益,選擇能使個人利益最大化的策略。在 計算收益的時候,使用的是個 人所得。這是一個 絕
2、對量”,而現實中,也存在著另外一種 情況,也就是參與者之間除了考慮自己的所得之外,也很關 心對方的所得,并比較相互間的差異,采取使相對”所得最大化的策略。我們不妨把以追求相對所得最大化的行為人稱 為II類理性人,并從博弈論的角度對他們的行為模式進行研究。具有II類理性特征的現象在很多方面都有存在。比如,我們在人際交往中確實會碰到一些損人利己”的人,也會見到 損人不利己”的人,從我們觀點看來,他們是非理性的, 但是進行換位思考就會發(fā)現,其實他們的行事原則是相對來 說,總要讓自己占便宜或者自己吃得虧比對方少,至于別人 是否會吃虧,不是他們考慮的因素, 這也是一種 理性”行為, 也有出于心理層面的考
3、慮 ,認為自己所得相對較少或者自己 損失較大是一種不公平,并從自己的角度出發(fā)進行策略選擇。 在激烈的市場角逐中,競爭雙方在短期內有時會不計代價地 采取大出血的策略而欲先致對手于死地,希望對手先被淘汰 而自己會堅持到最后。如果做不到這點,也要最大程度地削 弱對手力量,使其一蹶不振而不會對自己再構成威脅。這種 商場競爭,并期望自己能笑到最后的思維,也是理性”的。有研究表明,國際關系中這樣的 II類理性的例子更不少見。 這些雖然是比較極端的例子,現實生活中,更多的可能是, 每個人或組織都會考慮自己的所得,并期望自己的所得比別 人的大。關鍵是對兩種所得在考慮時的權數是隨情況不同而 變化的。如果否定在策
4、略選擇中的II類理性因素,可能會對一些現象無法解釋。盡管從道德角度講不值得提倡,而且從 價值評判上總是受到譴責,但作為一種存在的現象,仍然有必 要加以研究。但本文從II類理性個體的博弈戰(zhàn)略開始,并過 渡到一個綜合了 I類和II類理性行為的博弈模型,對例中設 計的參與人的戰(zhàn)略選擇,只進行 經濟學分析而不做道義上的衡量當博弈參與者是II類理性人時,此時收益矩陣的取值 有一定的規(guī)律。假設兩個參與人甲和乙都是 II類理性人時, 對比在I類理性的得益矩陣(圖1 )乙S1 S2甲 S1 (m1,n1) (m2,n2)S2 (m3,n3) (m4,n4)圖1.1類理性參與人收益矩陣II類理性參與人的得益矩陣
5、如下圖所示:乙-S1 S2甲 S1 (ml-n1,n1 -ml) (m2-n2,n2-m2)S2 (m3-n3,n3-m3) (m4-n4,n4-m4)圖2.I I類理性參與人收益 矩陣很明顯,在II類理性參與人進行的博弈里,在每一個戰(zhàn)略組合下,雙方的得益之和必為零,此時的博弈具有零和 的性質。這就是早期博弈論中重點研究的二人零和博弈的情形,在1910年1930年間,作為絕對競爭的形式,零和博弈被認 為是博弈 理論中的主要形態(tài)得到了深入的研究。而且對零和博弈的研究成果成為了 現代博弈理論中很多新 理論的基礎 概念。作為一個練習,我們把常見博弈模型改為零和博弈情 形,來看相應的結果會是怎樣的。一
6、般認為,零和博弈是一 種常和博弈,而最普遍意義下的博弈情形是非常和的。例1 .囚犯困境甲,乙涉嫌同謀犯罪,分別在兩個房間被提審。提審官預先向兩人交代政策:如果他們都承認犯罪事實,各判刑10年;如果兩人都否認,雙方都無罪釋放;如果一方認罪一方 抵賴,認罪方獲500元獎勵,抵賴方被判 15年。在非零和 博弈情形下的支付矩陣如下:乙承認抵賴甲 承認(-10,-10) (5,-15)抵賴(-15,5) (0,0)納什均衡策略 是(承認,承認),如果甲乙兩人是 理性人,他們的相應支付矩陣就變成了:乙承認抵賴甲 承認(0,0) (20,-20)抵賴(-20,20) (0,0)圖4可以看出,納什均衡策略還是
7、(承認,承認)。例2.春節(jié)前夕,某小鎮(zhèn)上兩個商鋪甲和乙同時看到一 個賺錢機會:去城里販一批鞭炮回來賣,購貨款加上運輸費 共5000元,如果沒有競爭對手,這批貨在小鎮(zhèn)上能賣 元;但如果另一家商鋪也同時在小鎮(zhèn)上賣鞭炮,價格下跌使 得這批鞭炮只能賣 4000元。對于甲乙都是I類理性人而言,有支付矩陣:乙進貨不進貨甲 進貨(-1000,-1000) (1000,0)II類6000不進貨(0,1000)(0,0)(不進貨,進貨)和(進貨,不進貨)為納什均衡策略但是問題在于,甲乙雙方同時行動,而互相不知道對方采取 的行動。如果甲乙都是II類理性人,那么情況會變成: 乙進貨 不進貨甲 進貨(0,0)(100
8、0,-1000)不進貨(-1000,1000) (0,0)圖6此時的納什均衡策略就是(進貨,進貨)。例3 .利己與利他甲乙作為I類理性人,其支付矩陣為乙利己利他甲利己(1,1) (4,0)利他(0,4) (3,3)圖7納什均衡是(利己,利己);甲乙作為II類理性人,其支付矩陣轉化為:乙利己利他 甲利己(0,0) (4,-4)利他(-4,4) (0,0)圖8納什均衡仍然是(利己,利己)。例4 .智豬博弈一頭大豬和一頭小豬被關在同一個豬圈里。豬圈的一頭安裝著一個特制的按鍵,另一頭安裝著一個食槽。但一頭豬 按下按鍵時,會有 10單位的食物進入槽中,但按鍵的豬會 付出2單位的成本;如果大豬先到食槽,則
9、小豬只能吃到1單位的殘羹剩飯;但若小豬先到的話,貝陀能吃到4單位的食物。若兩豬同時到,則小豬可吃到 3單位的食物。如果按照I類理性,有支付矩陣:小豬按鍵等待大豬 按鍵(5,1) (4,4)等待(9,-1) (0,0)圖9納什均衡策略是(按鍵,等待)。在II類理性下,重寫支付矩陣為:小豬按鍵等待大豬 按鍵(4,-4) (0,0)等待(10,-10) (0,0)圖10納什均衡是(按鍵,等待)和(等待,等待)。有趣的是,此時小豬一定會選擇等待(占優(yōu)戰(zhàn)略),而大豬無論怎么做,都是一無所獲!最終結果是兩頭豬都會餓 死。在這種情況下,兩頭豬的結局似乎和布里丹的饑餓的驢”有共同點,后者因為面對同樣兩堆干草不
10、能做出選擇而餓 死。在智豬博弈里,小豬認為自己的結果只能是損失或者既 無損失又無所得,這時它會選擇后者,而將責任推給大豬。 現實中,不大可能出現兩豬都餓死的結果,因為大豬最終會 明白,與其被餓死還不如去按鍵,此時自己會得到4單位的食物;而小豬也會因為大豬作出這樣的選擇,而同樣得到4單位的食物。例5.性別戰(zhàn)兩個戀人,男方想看拳擊,女方想看芭蕾。如果需要的 話,他們會犧牲自己的愛好而遷就對方。有下面的支付矩陣:女拳擊芭蕾男拳擊(2,1) (0,0)圖11納什均衡是(拳擊,拳擊)和(芭蕾,芭蕾)。將支付矩陣做個變換:女拳擊芭蕾男拳擊(1,-1) (0,0)芭蕾(0,0) (-1,1)圖12那么,(拳
11、擊,芭蕾)就是納什均衡策略。例6 .斗雞博弈兩個人舉著火棍從獨木橋兩端向中間前進,每個人都有 兩種戰(zhàn)略:前進或退下陣來。若兩人都繼續(xù)前進,則兩敗俱 傷;如果一方前進,另一方退下來,前進者取得勝利,退后 者丟了面子;若兩人都退了下來,則都丟了面子。支付矩陣 如下:A進退B 進(-3,-3) (2,0)退(0,2) (0,0)圖13納什均衡策略是(進,退)和(退,進)按II類理性對支付矩陣進行變換后得:A進退B 進(0,0) (2,-2)退(-2,2) (0,0)圖14納什均衡策略是(進,進)。在上面的討論中,可以看到,在例2中,對于I類理性參與人,(不進貨,進貨)和(進貨,不進貨)都是納 什均衡
12、策略,采取哪個戰(zhàn)略要取決于對方的行動,在一次靜 態(tài)博弈中是很難在行動之初就了解到對方的戰(zhàn)略的,因此存 在選擇上的不確定性。在智豬博弈中,對于II類理性參與人而言,不能根據支付矩陣決定出大豬的戰(zhàn)略,如何才能避免 在選擇時出現這樣的不確定狀態(tài)呢?有必要考慮某種混合 戰(zhàn)略。一般來講,博弈的每個參與者在某些時間會按I類理性人行為模式行事,而有時又會采用II類理性人模式行事。不妨將這種組合看成是決定于概率p和q。這時候,假設甲遵循I類理性的概率是p,那么他是II類理性人的概率就是 1-p, 乙遵循I類理性的概率是q,相應他是II類理性人的概率是 1-q。這時我們也可以構造出一種混合戰(zhàn)略,得到支付矩陣:甲
13、 S1 ml-(1 -p)n1,n1 -(1 -q)m1 m2-(1 -p)n2,n2-(1-q)m2S2 m3-(1-p)n3,n3-(1-q)m3 m4-(1-p)n4,n4-(1-q)m4圖15對于I類理性可以看作 p=1,q=1時的上述混合戰(zhàn)略的一 個特例;而II類理性對應p=0,q=0的情況。在現實中,還可能出現另一種情況,也就是甲乙兩個參 與者中,一方是I類理性的,而另一方是II類理性的,為方 便起見,我們假設甲是I類理性人,乙為II類理性人,那么 支付矩陣具有下面一般形式:乙S1S2甲 S1 (m1,n1 -m1) (m2,n2-m2)S2 (m3,n3-m3) (m4,n4-m
14、4)圖16這其實是在p=1,q=0時,混合戰(zhàn)略的一個特殊情況。對于上述常見博弈案例,在這種情況下進行演繹,相應 也會得到一些有趣的結果。例1 .囚犯困境乙承認抵賴甲 承認(-10,0) (5,-20)抵賴(-15,20) (0,0)圖17納什均衡策略仍是(承認,承認);例2 .進貨與不進貨乙進貨 不進貨甲 進貨(-1000,0) (1000,-1000)不進貨(0,1000) (0,0)圖18納什均衡策略是(不進貨,進貨)。例3 .利己與利他乙利己利他甲利己(1,0) (4,-4)利他(0,4) (3,0)圖19納什均衡策略仍是(利己,利己)。 例4 .智豬博弈小豬按鍵等待大豬 按鍵(5,-4
15、) (4,0)等待(9,-10) (0,0)圖20納什均衡策略是(按鍵,等待)。例5.性別戰(zhàn)女拳擊芭蕾男拳擊(2,-1) (0,0)芭蕾(0,0) (1,1)圖21納什均衡策略是(芭蕾,芭蕾)。例6 .斗雞博弈A進退B 進(-3,0) (2,-2)退(0,2) (0,0)圖22納什均衡策略是(退,進)可以發(fā)現,在多數情況下,II類理性人的結果都好于I類理性人現在使用如圖15的混合戰(zhàn)略,看看在例 2,性別戰(zhàn),斗雞博弈和智豬博弈中,戰(zhàn)略的選擇情況:在例2中,為方便起見,將原支付矩陣先轉換成:進貨不進貨甲 進貨(-1,-1) (1,0)不進貨(0,1) (0,0)圖2 3 再設甲乙為I類理性的概率為
16、p,q:乙進貨不進貨甲進貨(-p,-q) (1,q-1)不進貨(p-1,1) (0,0)圖2 4可以看到(進貨,不進貨)是一個可能的均衡策略,但若要使其成為唯一的納什均衡,還應該要求q-1>-q,即q>1/2同理,(不進貨,進貨)要在p>1/2才能成為唯一的納什均衡。 可以理解為,當甲更象是I類理性人是,此時乙如果認識到這一點,就應該采取進貨的戰(zhàn)略來應對;而當乙更象I類理 性人時,此時如果甲認識到這一點,應該采取進貨戰(zhàn)略。這 樣,就給出了一個選擇的指南,避免選擇不確定性問題的關鍵在于是否可以把握好參與方的理性傾向。例4的情形與此類似。而斗雞博弈中,相應地要求p>0.4,q>0.4即可確定出應 該采取的唯一的納什均衡策略。再看智豬博弈,得到支付矩陣為小豬按鍵等待大豬按鍵(4+p,5q-4) (4p,4q)等待(10-p,-10+9q) (0,0)圖2 5可以看出,大豬按鍵是占優(yōu)戰(zhàn)略,那么很容易得出(按鍵,等待)就是唯一的納什均衡了。同樣可以很圓滿地 解決選擇的不確定性 問題。以上通過實例,可以看出這里的 兩人一
溫馨提示
- 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯系上傳者。文件的所有權益歸上傳用戶所有。
- 3. 本站RAR壓縮包中若帶圖紙,網頁內容里面會有圖紙預覽,若沒有圖紙預覽就沒有圖紙。
- 4. 未經權益所有人同意不得將文件中的內容挪作商業(yè)或盈利用途。
- 5. 人人文庫網僅提供信息存儲空間,僅對用戶上傳內容的表現方式做保護處理,對用戶上傳分享的文檔內容本身不做任何修改或編輯,并不能對任何下載內容負責。
- 6. 下載文件中如有侵權或不適當內容,請與我們聯系,我們立即糾正。
- 7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。
最新文檔
- 2025年上半年寧夏石嘴山市礦業(yè)(集團)限責任公司人員招聘27名易考易錯模擬試題(共500題)試卷后附參考答案
- 【2025】貴州錦屏縣金森林業(yè)投資開發(fā)有限公司招聘合同制員筆試考點考試試題及答案
- 2024西安市自來水有限公司招聘擬初錄人員筆試參考題庫附帶答案詳解
- 2024福建輕紡集團秋季招聘筆試參考題庫附帶答案詳解
- 小學英語寫作技巧如何提高小學英語寫作能力
- 浙江鴨2025版高考化學二輪復習選擇題提升練五含解析
- 2025年個體防護裝備項目可行性研究報告
- 2025年PE吹塑薄膜項目可行性研究報告
- 江蘇專版2024中考道德與法治復習方案第二部分七下第05課時青春時光提分訓練
- 四年級心理降上冊4我是情緒的主人教案北師大版
- (二模)長春市2025屆高三質量監(jiān)測(二)地理試卷(含答案)
- 2025年河南省高職單招計算機類職業(yè)技能測試題(附答案)
- GB/T 18936-2025禽流感診斷技術
- 《主題四 雞蛋撞地球》教學設計-2023-2024學年六年級下冊綜合實踐活動遼師大版
- 2025年國航機務系統AMECO工程師崗位校園招聘筆試參考題庫附帶答案詳解
- 巨量千川中級營銷師認證考試題(附答案)
- 2025中智集團招聘高頻重點提升(共500題)附帶答案詳解
- 金融公司早會內容
- 藥劑學第9版課件:第一章-緒論
- 《下載-綜合布線》課件
- 可穿戴生理傳感器驅動的深度學習情緒識別模型在心理健康評估中的應用
評論
0/150
提交評論