第9章 虛擬變量回歸模型_第1頁(yè)
第9章 虛擬變量回歸模型_第2頁(yè)
第9章 虛擬變量回歸模型_第3頁(yè)
第9章 虛擬變量回歸模型_第4頁(yè)
第9章 虛擬變量回歸模型_第5頁(yè)
已閱讀5頁(yè),還剩53頁(yè)未讀, 繼續(xù)免費(fèi)閱讀

下載本文檔

版權(quán)說(shuō)明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請(qǐng)進(jìn)行舉報(bào)或認(rèn)領(lǐng)

文檔簡(jiǎn)介

第九章虛擬變量回歸模型

本章將主要介紹經(jīng)典單方程計(jì)量經(jīng)濟(jì)學(xué)模型中引入虛擬變量并在此基礎(chǔ)上對(duì)建立單方程計(jì)量經(jīng)濟(jì)學(xué)模型的方法論進(jìn)行簡(jiǎn)單的總結(jié)與討論。

在前面幾章中,主要介紹了經(jīng)典線性回歸模型及其在若干基本假定下的估計(jì)問(wèn)題,并分析了一個(gè)或多個(gè)假定不滿足時(shí)所產(chǎn)生的后果及其可能的改進(jìn)措施。然而上述方法還不能解決經(jīng)濟(jì)生活中遇到的全部問(wèn)題。

如何考察某一突發(fā)事件、性別、季節(jié)、受教育程度等對(duì)經(jīng)濟(jì)行為帶來(lái)的影響??例如:第九章虛擬變量回歸模型第九章虛擬變量回歸模型◆學(xué)習(xí)目的

了解虛擬變量、虛擬變量模型的概念,掌握虛擬變量設(shè)置的原則和引入模型的方法?!艋疽?)認(rèn)識(shí)到虛擬變量是建立計(jì)量經(jīng)濟(jì)學(xué)模型經(jīng)常會(huì)遇到的問(wèn)題;2)了解虛擬變量、虛擬變量模型的概念;3)掌握虛擬變量設(shè)置的原則、虛擬變量模型的建模方法及應(yīng)用?!籼摂M變量的性質(zhì)◆ANOVA模型第九章虛擬變量回歸模型◆ANCOVA模型◆鄒至莊檢驗(yàn)的虛擬變量方法◆使用虛擬變量的交互效應(yīng)◆季節(jié)分析中虛擬變量的使用◆分段線性回歸第九章虛擬變量回歸模型◆綜列數(shù)據(jù)回歸模型◆虛擬變量方法的某些技術(shù)問(wèn)題第一節(jié)虛擬變量的性質(zhì)為什么要引入“虛擬變量”??如商品需求量、價(jià)格、收入、產(chǎn)量等許多經(jīng)濟(jì)變量是可以定量度量的或者說(shuō)是可以直接觀測(cè)的但是也有一些影響經(jīng)濟(jì)變量的因素?zé)o法定量度量或者說(shuō)無(wú)法直接觀測(cè)

如職業(yè)、性別對(duì)收入的影響,戰(zhàn)爭(zhēng)、自然災(zāi)害對(duì)GDP的影響,季節(jié)對(duì)某些產(chǎn)品(如冷飲)銷售的影響等。

為了能夠在模型中反映這些因素的影響,并提高模型的精度,需要將它們?nèi)藶榈亍傲炕保@種“量化”通常是通過(guò)引入“虛擬變量”來(lái)完成的。

這種用兩個(gè)相異數(shù)字來(lái)表示對(duì)被解釋變量有重要影響而自身又沒(méi)有觀測(cè)數(shù)值的一類變量,稱為虛擬變量(dummyvariables)。虛擬變量也稱為啞變量或定性變量。這種變量實(shí)質(zhì)上就是一個(gè)將數(shù)據(jù)區(qū)分為相互排斥的類別的工具。虛擬變量的特點(diǎn)是:1.虛擬變量是對(duì)經(jīng)濟(jì)變化有重要影響的不可測(cè)變量。2.虛擬變量是賦值變量,一般根據(jù)這些因素的屬性類型,構(gòu)造只取“0”或“1”的人工變量,通常稱為虛擬變量,記為D。這是為了便于計(jì)算而把定性因素這樣數(shù)量化的,所以虛擬變量的數(shù)值只表示變量的性質(zhì)而不表示變量的數(shù)值。基礎(chǔ)類型和肯定類型取值為1;一般地,在虛擬變量的設(shè)置中,比較類型和否定類型取值為0。例如:1)表示性別的虛擬變量可取為D1=1男性0女性2)表示文化程度的虛擬變量可取為D2=1本科及以上學(xué)歷0本科以下學(xué)歷3)表示地區(qū)的虛擬變量可取為D3=1城市0農(nóng)村4)表示消費(fèi)心理的虛擬變量可取為D4=1喜歡某種商品0不喜歡某種商品5)表示天氣變化的虛擬變量可取為D5=0雨天1晴天第二節(jié)ANOVA模型一個(gè)回歸模型所包含的回歸元可以都是虛擬或定性變量。這種模型被稱為方差分析(analysisofvariance,ANOVA)模型。見(jiàn)下例。例9.1不同地理區(qū)域公立學(xué)校教師的薪水表9.11986年公立學(xué)校教師的州平均薪水obs薪水支出D2D3obs薪水支出D2D3119583.003346.0001.0000000.0000002620627.002821.0000.0000001.000000220263.003114.0001.0000000.0000002722795.003366.0000.0000001.000000320325.003554.0001.0000000.0000002821570.002920.0000.0000001.000000426800.004642.0001.0000000.0000002922080.002980.0000.0000001.000000529470.004669.0001.0000000.0000003022250.003731.0000.0000001.000000626610.004888.0001.0000000.0000003120940.002853.0000.0000001.000000730678.005710.0001.0000000.0000003221800.002533.0000.0000001.000000827170.005536.0001.0000000.0000003322934.002729.0000.0000001.000000925853.004168.0001.0000000.0000003418443.002305.0000.0000001.0000001024500.003547.0001.0000000.0000003519538.002642.0000.0000001.0000001124274.003159.0001.0000000.0000003620460.003124.0000.0000001.0000001227170.003621.0001.0000000.0000003721419.002752.0000.0000001.0000001330168.003782.0001.0000000.0000003825160.003429.0000.0000001.0000001426525.004247.0001.0000000.0000003922482.003947.0000.0000000.0000001527360.003982.0001.0000000.0000004020969.002509.0000.0000000.0000001621690.003568.0001.0000000.0000004127224.005440.0000.0000000.0000001721974.003155.0001.0000000.0000004225892.004042.0000.0000000.0000001820816.003059.0001.0000000.0000004322644.003402.0000.0000000.0000001918095.002967.0001.0000000.0000004424640.002829.0000.0000000.0000002020939.003285.0001.0000000.0000004522341.002297.0000.0000000.0000002122644.003914.0001.0000000.0000004625610.002932.0000.0000000.0000002224624.004517.0000.0000001.0000004726015.003705.0000.0000000.0000002327186.004349.0000.0000001.0000004825788.004123.0000.0000000.0000002433990.005020.0000.0000001.0000004929132.003608.0000.0000000.0000002523382.003594.0000.0000001.0000005041480.008349.0000.0000000.0000005125845.003766.0000.0000000.000000注:D2=1,若該州位于東北和中北部;0,其他地區(qū)。D3=1,若該州位于南部;0,其他地區(qū)。考慮如下模型:其中Yi=第i個(gè)州公立學(xué)校教師的平均薪水D2i=1若該州位于東北和中北部=0否則D3i=1若該州位于南部=0否則假定誤差項(xiàng)滿足通常的OLS假定,則對(duì)上式兩邊取期望得:東北和中北地區(qū)教師薪水均值為:南部教師薪水均值為:西部教師薪水均值:西部學(xué)校教師薪水由截距給出,而斜率系數(shù)和表示中東北地區(qū)和南部地區(qū)薪水的均值與西部地區(qū)的差別。得到如下回歸結(jié)果:西部教師薪水約為26158美元,東北和中北教師薪水約低1734美元為24424美元,南部教師薪水約低3265美元為22894美元。從回歸中看出,東中部地區(qū)的估計(jì)系數(shù)在統(tǒng)計(jì)上的不顯著的,p值為23%;南部地區(qū)是顯著的,p值為3.5%。因此,結(jié)論是,西部地區(qū)和東中部地區(qū)教師薪水的均值大致相同,而南部地區(qū)教師薪水的均值則統(tǒng)計(jì)上顯著的略低3265美元。注意:若定性變量有m個(gè)類別,則只需引入(m-1)個(gè)虛擬變量。否則會(huì)陷入虛擬變量陷阱,即完全共線性或完全多重共線性的情況。因此,若在例9.1中有教師性別的信息,就應(yīng)該再加一個(gè)(而非兩個(gè))虛擬變量,對(duì)女性取值為1對(duì)男性取值為0。不指定其虛擬變量的那一組被稱為基(base)組、基準(zhǔn)(benchmark)組、控制(control)組、比較(comparison)組、參照(reference)組。所有其他的組都與基準(zhǔn)組進(jìn)行比較。截距值代表了基準(zhǔn)組的均值。例9.1中基準(zhǔn)組為西部地區(qū)。虛擬變量的系數(shù)稱為級(jí)差截距系數(shù)。它告訴我們?nèi)≈禐?的地區(qū)的截距值與基準(zhǔn)組的截距值之間的差別。如-1734、-3265.基準(zhǔn)組的選擇完全取決于研究者。第三節(jié)含有兩個(gè)變量的ANOVA模型例9.2小時(shí)工資與婚姻狀況和居住地的關(guān)系從1985年5月的一個(gè)528人的樣本中得到如下結(jié)論:其中Y=小時(shí)工資(美元),D2=婚姻狀況;1=已婚,0=其他D3=居住地;1=南部,0=其他D2=婚姻狀況;1=已婚,0=其他D3=居住地;1=南部,0=其他基準(zhǔn)組:未婚的非南部居民組?;鶞?zhǔn)組的小時(shí)工資均值約為8.81美元。與其相比,已婚者的平均小時(shí)工資約高1.10美元,實(shí)際平均工資為9.91美元。對(duì)比之下,住在南部的人的平均小時(shí)工資約低1.67美元,實(shí)際小時(shí)工資為7.14美元。所有級(jí)差截距都是統(tǒng)計(jì)上顯著的,p值都相當(dāng)小。注意:遇到多于一個(gè)定性變量,所有其他組都是與基組進(jìn)行比較多。第四節(jié)ANCOVA模型同時(shí)含有一般解釋變量與虛擬變量的模型稱為協(xié)方差分析(analysisofcovariance,ANCOVA)模型。

在模型中,虛擬變量可作為解釋變量,也可作為被解釋變量,但主要是用作解釋變量。例9.3教師薪水與區(qū)域和對(duì)公立學(xué)校每個(gè)學(xué)生的支出之間的關(guān)系重新考慮例9.1,假設(shè)三個(gè)區(qū)域的教師薪水沒(méi)什么不同,考慮地方政府對(duì)公立學(xué)校的支出變量。Yi=公立學(xué)校教師的平均薪水(美元)Xi=對(duì)公立學(xué)校每個(gè)學(xué)生的支出(美元)D2i=1,若該州位于東北和中北部=0,其他D3i=1,若該州位于南部=0,其他在這個(gè)回歸中,把西部作為基準(zhǔn)組,除了兩個(gè)定性回歸元之外,還有一個(gè)定量變量X,在ANCOVA模型下,X被稱為協(xié)變量。在其他條件不變的情況下,公共支出每增加1美元,公立學(xué)校教師的薪水約上升3.29美元。東中北地區(qū)級(jí)差截距系數(shù)顯著,南部的系數(shù)不顯著。表示p值低于5%,表示p值高于5%。在=0的初始假定下,容易得到西部地區(qū)、東中北地區(qū)、南部地區(qū)公立學(xué)校教師薪水的函數(shù):西部地區(qū):

E(Yi|Xi,D2i=0,D3i=0)=β1+β4Xi東中北地區(qū):南部地區(qū):

E(Yi|Xi,D2i=1,D3i=0)=(β1+β2)+β4Xi

E(Yi|Xi,D2i=0,D3i=1)=(β1+β3)+β4Xi三個(gè)回歸線平行第四節(jié)鄒至莊檢驗(yàn)的虛擬變量方法第8章中討論過(guò)鄒至莊檢驗(yàn),以考察一個(gè)回歸模型的結(jié)構(gòu)穩(wěn)定性。例子,1970-1985年儲(chǔ)蓄與收入的關(guān)系,將樣本一分為二,1970-1981,1982-1995。鄒至莊檢驗(yàn)表明,儲(chǔ)蓄對(duì)收入的回歸在這兩個(gè)區(qū)間存在著差異。然而,我們不知道這兩個(gè)回歸的差異是源于截距項(xiàng)、斜率系數(shù)還是二者兼而有之。參照方程(8.8.1)和(8.8.2),我們看到四種可能性1.兩個(gè)回歸的截距和斜率都相同,叫做重合回歸(coincidentregressions)。2.兩個(gè)回歸的斜率相同但截距不同,叫做平行回歸(parallelregressions)。3.兩個(gè)回歸的截距相同但斜率不同,叫做同截距回歸(concurrentregressions)。4.兩個(gè)回歸的截距和斜率都不相同,叫做非相似回歸(dissimilarregressions)。第8章所討論的鄒至莊檢驗(yàn)程序只告訴我們兩個(gè)回歸是否不同,但沒(méi)有告訴我們這種不同來(lái)自哪里。通過(guò)做如下回歸,我們可以探明這種差異的來(lái)源:其中Y=儲(chǔ)蓄,X=收入,t=時(shí)間,D=1,1982-1995年之間的觀測(cè)0,其他(即1970-1981年之間的觀測(cè))如下表說(shuō)明了26個(gè)觀測(cè)值的數(shù)據(jù)矩陣。表9.2美國(guó)1970-1995年間的儲(chǔ)蓄與收入數(shù)據(jù)觀測(cè)儲(chǔ)蓄收入虛擬變量197061727.10197168.6790.20197263.6855.30197389.69650197497.61054.201975104.41159.20197696.412730197792.51401.401978112.61580.101979130.11769.501980161.81973.301981199.12200.201982205.52347.3119831672522.411984235.7281011985206.2300211986196.53187.611987168.43363.111988189.13640.811989187.83894.511990208.74166.811991246.44343.711992272.64613.711993214.44790.211994189.45021.711995249.35320.81假設(shè),我們得到:1970-1981年的均值儲(chǔ)蓄函數(shù):1982-1995年的均值儲(chǔ)蓄函數(shù):其實(shí),這是與(8.8.1)和(8.8.2)相同的函數(shù),其中α2是級(jí)差截距(differentialintercept),β2是級(jí)差斜率系數(shù)(differentialslopecoefficient,orslopedrifter)。β2表示的是,第二個(gè)儲(chǔ)蓄期間的斜率系數(shù)與第一個(gè)期間相比有多大的不同。這種虛擬變量的引入方式成為相加形式(additiveform)。虛擬變量的引入(9.5.2)(9.5.3)虛擬變量的引入引入虛擬變量D(D乘以X),使我們區(qū)分兩個(gè)期間的斜率系數(shù)。這種方式成為交互或相乘形式(interactiveormultipleform)。這與相加形式來(lái)區(qū)分兩個(gè)期間的截距殊途同歸。如下例:另一種方法例9.4美國(guó)儲(chǔ)蓄——收入回歸中的結(jié)構(gòu)差異:

虛擬變量方法例9.4美國(guó)儲(chǔ)蓄——收入回歸中的結(jié)構(gòu)差異:虛擬變量方法Eviews:Seriesdx=dum*incomeLssavingscdumincomedxDependentVariable:SAVINGSMethod:LeastSquaresDate:03/05/12Time:14:12Sample:19701995Includedobservations:26

VariableCoefficientStd.Errort-StatisticProb.C1.01611720.164830.0503910.9603DUM152.478633.082374.6090580.0001INCOME0.0803320.0144975.5413470DX-0.065470.015982-4.096340.0005R-squared0.881944Meandependentvar162.0885AdjustedR-squared0.865846S.D.dependentvar63.20446S.E.ofregression23.14996Akaikeinfocriterion9.262501Sumsquaredresid11790.25Schwarzcriterion9.456055Loglikelihood-116.413Hannan-Quinncriter.9.318238F-statistic54.78413Durbin-Watsonstat1.648454Prob(F-statistic)0

表示p值低于5%,表示p值高于5%。通過(guò)比較可以得到,級(jí)差截距α2和級(jí)差斜率系數(shù)β2都是統(tǒng)計(jì)上顯著的,這強(qiáng)烈地表明,兩個(gè)期間的儲(chǔ)蓄--收入回歸如圖(d)那樣是不同的。從回歸方程我們可以推導(dǎo)出如下方程::1970-1981年的儲(chǔ)蓄回歸函數(shù):1982-1995年的儲(chǔ)蓄回歸函數(shù):這與我們第8章中的(8.8.1a)和(8.8.2a)的結(jié)果完全相同。(chapter8,slide45)從該例可以看出,虛擬變量方法相對(duì)鄒至莊檢驗(yàn)有如下優(yōu)勢(shì):我們只需要做一個(gè)回歸,因?yàn)閭€(gè)別回歸很容易就能以(9.5.2)和(9.5.3)所指明的方式推導(dǎo)出來(lái)。單一回歸(9.5.1)可用于檢驗(yàn)各種假設(shè)。

溫馨提示

  • 1. 本站所有資源如無(wú)特殊說(shuō)明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請(qǐng)下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請(qǐng)聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁(yè)內(nèi)容里面會(huì)有圖紙預(yù)覽,若沒(méi)有圖紙預(yù)覽就沒(méi)有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫(kù)網(wǎng)僅提供信息存儲(chǔ)空間,僅對(duì)用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對(duì)用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對(duì)任何下載內(nèi)容負(fù)責(zé)。
  • 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請(qǐng)與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶因使用這些下載資源對(duì)自己和他人造成任何形式的傷害或損失。

最新文檔

評(píng)論

0/150

提交評(píng)論