面板數(shù)據(jù)原理_第1頁
面板數(shù)據(jù)原理_第2頁
面板數(shù)據(jù)原理_第3頁
面板數(shù)據(jù)原理_第4頁
面板數(shù)據(jù)原理_第5頁
已閱讀5頁,還剩15頁未讀 繼續(xù)免費閱讀

下載本文檔

版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進行舉報或認領(lǐng)

文檔簡介

1、1 .面板數(shù)據(jù)定義。時間序列數(shù)據(jù)或截面數(shù)據(jù)都是一維數(shù)據(jù)。例如時間序列數(shù)據(jù)是變量按時間得到的數(shù)據(jù);截面數(shù)據(jù)是變量在截面空間上的數(shù)據(jù)。面板數(shù)據(jù)(panel data )也稱時間序列截面數(shù)據(jù)(timeseries and cross section data)或混合數(shù)據(jù)(pool data)。面板數(shù)據(jù)是同時在時間和截面空間上取得的二維數(shù)據(jù)。面板數(shù)據(jù)示意圖見圖1。面板數(shù)據(jù)從橫截面(cross section )上看,是由若干個體(entity, unit, individual)在某一時刻構(gòu)成的截面觀測值,從縱剖面(longitudinal section)上看是一個時間序列。面板數(shù)據(jù)用雙下標變量表示

2、。例如yt,i= 1,2,,Nt= 1,2,,TN表示面板數(shù)據(jù)中含有N個個體。T表示時間序列的最大長度。若固定t不變,yi., (i= 1,2,,N)是橫截面上的N個隨機變量;若固定i不變,y.t, (t= 1,2,,T)是縱剖面上的一個時間序列(個體)例如1990-2000年30個省份的農(nóng)業(yè)總產(chǎn)值數(shù)據(jù)。固定在某一年份上,它是由30個農(nóng)業(yè)總產(chǎn)總值數(shù)字組成的截面數(shù)據(jù);固定在某一省份上,它是由個時間序列。面板數(shù)據(jù)由30個個體組成。共有330個觀測值。面板數(shù)據(jù)模型11年農(nóng)業(yè)總產(chǎn)值數(shù)據(jù)組成的對于面板數(shù)據(jù)yi t,i= 1,2,,N t= 1,2,,T來說,如果從橫截面上看,每個變量都有觀測值,從縱剖面

3、上看,每一期都有觀測值,則稱此面板數(shù)據(jù)為平衡面板數(shù)據(jù)(balanced panel data)。若在面板數(shù)據(jù)中丟失若干個觀測值,則稱此面板數(shù)據(jù)為非平衡面板數(shù)據(jù)(unbalanced panel data )。注意:EViwes、既允許用平衡面板數(shù)據(jù)也允許用非平衡面板數(shù)據(jù)估計模型。例1 (file:panel02 ): 1996-2002年中國東北、華北、華東15個省級地區(qū)的居民家庭人均消費(不變價格)和人均收入數(shù)據(jù)見表1和表2。數(shù)據(jù)是7年的,每一年都有15個數(shù)據(jù),共105組觀測值。人均消費和收入兩個面板數(shù)據(jù)都是平衡面板數(shù)據(jù),各有15個個體。人均消費和收入的面板數(shù)據(jù)從縱剖面觀察分別見圖2和圖3。

4、從橫截面觀察分別見圖4和圖5。橫截面數(shù)據(jù)散點圖的表現(xiàn)與觀測值順序有關(guān)。圖4和圖5中人均消費和收入觀測值順序是按地區(qū)名的漢語拼音字母順序排序的。表 1 1999-2002 年中國東北、華北、華東 15 個省級地區(qū)的居民家庭人均消費數(shù)據(jù)(不變價格)地區(qū)人均消費1996199719981999200020012002CP-AH (安徽)CP-BJ (北京)CP-FJ (福建)CP-HB (河北)CP-HLJ (黑龍江)CP-JL (吉林)CP-JS (江蘇)CP-JX (江西)CP-LN (遼寧)CP-NMG(內(nèi)蒙古)CP-SD (山東)CP-SH (上海)CP-SX (山西)CP-TJ (天津)C

5、P-ZJ (浙江)資料來源:中國統(tǒng)計年鑒1997-2003。表 2 1999-2002 年中國東北、華北、華東15 個省級地區(qū)的居民家庭人均收入數(shù)據(jù)(不變價格)地區(qū)人均收入1996199719981999200020012002IP-AH (安徽)IP-BJ (北京)IP-FJ (福建)IP-HB (河北)IP-HLJ (黑龍江)IP-JL (吉林)IP-JS (江蘇)IP-JX (江西)IP-LN (遼寧)IP-NMG (內(nèi)蒙古)IP-SD (山東)IP-SH (上海)IP-SX (山西)IP-TJ (天津)IP-ZJ (浙江)資料來源:中國統(tǒng)計年鑒1997-2003 o圖 2 15 個省級

6、地區(qū)的人均消費序列(縱剖面) 圖 3 15 個省級地區(qū)的人均收入序列(file:4panel02)1100010000900080007000600050004000300020001996199719981999200020012002一一CPAH:CPBJ-CPFJ-CPHBCPJL-CPJS- CPJX- CPLNCPSD 4 -CPSH CPSX一CPTJ-L- CPZJ-IPAHIPBJ-IPFJ-IPHBIPJL IPJS一一IPJXIPLNIPSDIPSH-IPSX一IPTJ一,一IPZJ用CP表示消費,IP表示收入。AH, BJ, FJ, HB, HLJ, JL, JS, JX

7、, LN, NMG, SD, SH,SX, TJ, ZJ分別表示安徽省、北京市、福建省、河北省、黑龍江省、吉林省、江蘇省、江 西省、遼寧省、內(nèi)蒙古自治區(qū)、山東省、上海市、山西省、天津市、浙江省。15個地區(qū)7年人均消費對收入的面板數(shù)據(jù)散點圖見圖6和圖7。圖6中每一種符號代表一個省級地區(qū)的7個觀測點組成的時間序列。相當于觀察15個時間序列。圖7中每一種符號代表一個年度的截面散點圖(共7個截面)。相當于觀察7個截面散點圖的疊加。圖 6 用 15 個時間序列表示的人均消費對收入的面板數(shù)據(jù)1400014000圖 4 15 個省級地區(qū)的人均消費散點圖圖 5 15 個省級地區(qū)的人均收入散點圖(7 個橫截面疊

8、加)(每條連線表示同一年度 15 個地區(qū)的消費值)(每條連線表示同一年度 15 個地區(qū)的收入值)CPAHCPBJCPFJCPHBCPHLJCPJLCPJSCPJXCPLNCPNMGCPSDCPSHCPSXCPTJCPZJ120001000080006000400020004610142812CP1996.CP1999CP2002- CP1997 -CP2000CP1998 -CP200112000100008000600040002000 iiJ ii2468101214一IP1996.IP1997- IP1998IP1999_IP2000 IP2001IP2002IP(1996-2002)-

9、0-*2000400060008000100001200014000圖 7 用 7 個截面表示的人均消費對收入的面板數(shù)據(jù)(7 個截面疊加)為了觀察得更清楚一些,圖8給出北京和內(nèi)蒙古1996-2002年消費對收入散點圖。從圖中可以看出,無論是從收入還是從消費看內(nèi)蒙古的水平都低于北京市。內(nèi)蒙古2002年的收入與消費規(guī)模還不如北京市1996年的大。圖9給出該15個省級地區(qū)1996和2002年的消費2 .面板數(shù)據(jù)的估計。用面板數(shù)據(jù)建立的模型通常有3種。即混合估計模型、固定效應模型和隨機效應模型?;旌瞎烙嬆P?。如果從時間上看,不同個體之間不存在顯著性差異;從截面上看,不同截面之間也不存在顯著性差異,那么

10、就可以直接把面板數(shù)據(jù)混合在一起用普通最小二乘法(OLS估計參12000100008000CP1996CP1997CP1998CP1999CP2000CP2001CP2002600040002000IP(1996-2002)圖如果從時間和截面看模型截距都不為零,且是一個相同的常數(shù),以二變量模型為例,則建立如下模型,和1不隨i ,t變化。稱模型(1)為混合估計模型。以例1中15個地區(qū)1996和2002年數(shù)據(jù)建立關(guān)于消費的混合估計模型,得結(jié)果如下:Dependent Variable: CP?Method: Pooled Least SquaresDate: 12A33/D4 Time: 22:06

11、Sample: 1996 2002Included obseivations:1NthrtberNthrtber cfcf cross-sectionscross-sections used:used: 1515TotalTotal pan&lpan&l (bsl3nced)(bsl3nced) observationsobservations- -105105VariableVariableCoefficientSid. Errori-Statistici-StatisticProbC129.631363.G92592Q352G 50.0444IP?07687260,0035

12、2273.E31S90.0000R-squared0.984036Mean dependent var4917.SEAdjusted R-sq0.983831S.O. dependent var1704.704S,E. of regression216.4270Sum squared redd4324536.F-statistic6349.204Durbin-Vatson stat0764107Prob (F-slat i Stic0.000000圖10EViwes估計方法:在打開工作文件窗口的基礎(chǔ)上,點擊主功能菜單中的Objects鍵,選New Object功能,從而打開New Object

13、(新對象)選擇窗。在Type of Object選擇區(qū) 選才i Pool(混合數(shù)據(jù)庫),點擊OK鍵,從而打開Pool(混合數(shù)據(jù))窗口。在窗口中輸入15個地區(qū)標識AH(安徽) 、BJ(北京)、ZJ(浙江)。工具欄中點擊Sheet鍵,從而打開Series List(列寫序列名)窗口,定義變量CP和IP ,點擊OK鍵,Pool(混合或合并數(shù)據(jù)庫)窗口顯示面板數(shù)據(jù)。 在Pool窗口的工具欄中點擊Estimate鍵,打開Pooled Estimation(混合估計)窗口如下圖。yit=+ixit+it,i= 1,2,=1,2,圖 11在Dependent Variable(相依變量)選擇窗填入CP;在C

14、ommon coefficients(系數(shù)相同)選擇窗填入IP; Cross section specific coefficients(截面系數(shù)不同)選擇窗保持空白;在Intercept(截距項)選擇窗點擊Common在Weighting(權(quán)數(shù))選擇窗點擊Noweighting。點擊Pooled Estimation(混合估計)窗口中的OKU。得輸出Z果如圖10。相應表達式是CPit= +IPR2= ,SSE= 4824588,(呻=15個省級地區(qū)的人均支出平均占收入的76%如果從時間和截面上看模型截距都為零,就可以建立不含截距項的(=0)的混合估計模型。以二變量模型為例,建立混合估計模型如

15、下,yit=1xit+it,i= 1, 2,,N t= 1, 2,,T(2)對于本例,因為上式中的截距項有顯著性(t= (103)=),所以建立截距項為零的混合估計模型是不合適的。EViwes估計方法:在Pooled Estimation(混合估計)對話框中Intercept(截距項) 選擇窗中選None,其余選項同上。固定效應模型。在面板數(shù)據(jù)散點圖中,如果對于不同的截面或不同的時間序列,模型的截距是不同的,則可以采用在模型中加虛擬變量的方法估計回歸參數(shù),稱此種模型為固定效應模型(fixedeffects regression model )。固定效應模型分為3種類型,即個體固定效應模型(en

16、tity fixed effects regression model)、時刻固定效應模型(time fixed effects regression model)和時刻個體固定效應模型ttime and entity fixed effects regression model)。下面分另1J介紹。(1)個體固定效應模型。個體固定效應模型就是對于不同的個體有不同截距的模型。如果對于不同的時間序列(個體)截距是不同的, 但是對于不同的橫截面,模型的截距沒有顯著性變化,那么就應該建立個體固定效應模型,表示如下,yt=ixit+iW +2W + +NW +it,t= 1, 2,,T其中 1,如果屬

17、于第 i i 個個體,i 1,2,,N。W=0,其他it,i= 1,2,,N t= 1,2,,T,表示隨機誤差項。yjxit,i= 1,2,,Nt= 1,2,,T分別表示被解釋變量和解釋變量。模型(3)或者表示為y1t=1+1x1t+1t,i= 1(對于第1個個體,或時間序列),t= 1,2,,T4y2t=2+1x2t+21,i= 2(對于第2個個體,或時間序列),t= 1,2,,T yN t=N+1XNt+Nt,i=Nl(對于第N個個體,或時間序列),t= 1, 2,,寫成矩陣形式,yi=(xi)1+X1+yN=(XN)上式中yi,1階列向量。為標量。 當模型中含有k個解釋變量時,為k1階列

18、向量。進一步寫成矩陣形式,X1V2X2yN N 1XN上式中的元素1, 0都是階列向量。面板數(shù)據(jù)模型用OLS方法估計時應滿足如下5個假定條件:(1)E(it|Xi1,Xi 2,,XiT,i) = 0。以Xi1,Xi2,,XiT,i為條件的it的期望(2)(Xi1,xi2,XT), (yi1,yi2,,y訂),i=1,2,N分別來自于同一個聯(lián)合分布總體,并相互獨立。(3)(Xit,it)具有非零的有限值4階矩。(4)解釋變量之間不存在完全共線性。(5) Cov(itis|xit,xis,i) = 0,t s。在固定效應模型中隨機誤差項it在時間上是非自相關(guān)的。其中Xit代表一個或多個解釋變量。對

19、模型(1)進彳T OLS估計,全部參數(shù)估計量都是無偏的和一致的。模型的自由度是NT當模型含有k個解釋變量,且N很大,相對較小時,因為模型中含有k+N個被估參數(shù),般軟件執(zhí)行OLS運算很困難。在計量經(jīng)濟學軟件中是采用一種特殊處理方式進行OLS古計。估計原理是,先用每個變量減其組內(nèi)均值,把數(shù)據(jù)中心化(entity-demeaned),然后用變換的數(shù)據(jù)先估計個體固定效應模型的回歸系數(shù)(不包括截距項)(2)用OLS法估計回歸參數(shù)(不包括截距項,即固定效應). . . . . . 、 . . . .在k個解釋變量條件下,把 焉用向量形式X表示,則利用中心化數(shù)據(jù),按OLS法估計公式計算個體固定效應模型中回歸

20、參數(shù)估計量的方差協(xié)方差矩陣估計式如下,Var(?) =?2(XX)-1?9其中?2=-,夕是相對于的殘差向量。NT N k(3)計算回歸模型截距項,即固定效應參數(shù)?i=YXi,然后利用組內(nèi)均值等式計算截距項。這種方法計算起來速度快。具體分3步如下。(4)(1)首先把變量中心化(仍以單解釋變量模型(yi其中Tyit,t 1xientity-demeaned3)為例,則有1Xi1,2,it,i= 1, 2,Nlo公式(1)、(4)相減得,(yityi1(Xit令(yit-Vi) =it,(xit-xi)=Xitit)=it,上式寫為yit,1Xit+it(6)用OLS法估計(1)、(6)式中的1,

21、結(jié)果是樣的,但是用(6)式估計,可以減少被估參(8)以例1 (file:panel02)為例得到的個體固定效應模型估計結(jié)果如下:Dependent Variable: CP?Methad: Poo led Least SquaresDate: 11AV/D4 Tims: 20:52Sample: 1996 2002Included observations: 7Num bor of era ss-s ections used: 15Total panal (balanced) observations: 1Q5VariableVariableCoeffieientCoeffieientStd.

22、Std. ErrorError tStatidiCtStatidiCProb.Prob.IP?0.6975610.01259254.96029O.OOCOFixed EffectsAH-C4793084BJ-C1063,180FJ-C457.9690HB-C361 3774HU-C345.9127JL-C540.1185JS-C480.4183JX-C195.9182LN-CB22.0415NMG-C306.0653孫C331.4397SH-C792.6001懿-C440.7252TJ-C552.8435ZJ-C714.2344R-squared0.992400Mean dependent v

23、ar4917.GC9Adjusted R-squared0.991222S 0 dependent他1704704S.E. of regression1597104Sum squared resid2270336.DurbiriWatsijn slat1 609517注意:個體固定效應模型的EViwes 輸出結(jié)果中沒有公共截距項。圖 12EViwes估計方法:在EViwes的Pooled Estimation對話中1中Intercept選項中選Fixed effects。其余選項同上。注意:(1) EViwes輸出結(jié)果中沒有給出描述個體效應的截距項相應的標準差和t值。不認為截距項是模型中的重要

24、參數(shù)。(2)當對個體固定效應模型選擇加權(quán)估計時,輸出結(jié)果將給出加權(quán)估計和非加權(quán)估計 兩種統(tǒng)計量評價結(jié)果。(3)點擊View選Residuals/Table, Graphs, Covariance Matrix, Correlation Matrix功能可以分別得到按個體計算的殘差序列表,殘差序列圖,殘差序列的方差協(xié)方差矩陣,殘差序列的相關(guān)系數(shù)矩陣。從結(jié)果看,北京、上海、浙江是消費函數(shù)截距(自發(fā)消費)最大的3個地區(qū)。相對于混合估計模型來說,是否有必要建立個體固定效應模型可以通過F檢驗來完成。原假設(shè)H):不同個體的模型截距項相同(建立混合估計模型)。備擇假設(shè)H:不同個體的模型截距項不同(建立個體固

25、定效應模型)。F統(tǒng)計量定義為:(SSErSSEU) /(NT 2) (NT N 1) _ (SSETSS耳)/(N 1)F=-(9)SSEU/(NT N 1)SSEU/(NT N 1)其中SSE, SSE分別表示約束模型(混合估計模型)和非約束模型(個體固定效應模型)的殘差平方和。非約束模型比約束模型多了N-1個被估參數(shù)。(混合估計模型給出公共截距項。)注意:當模型中含有k個解釋變量時,F(xiàn)統(tǒng)計量的分母自由度是NTN-ko用上例計算,已知SSE= 4824588 ,SSE= 2270386 ,F=(SSErSSEU)/(N 1)=(4824588 2270386)/(15 1)=182443=S

26、SEU/(NT N 1) 2270386/(105 15 1)25510(14, 89)=因為F= (14, 89)=,所以,拒絕原假設(shè)。結(jié)論是應該建立個體固定效應模型。(2)隨機效應模型在固定效應模型中采用虛擬變量的原因是解釋被解釋變量的信息不夠完整。也可以通過對誤差項的分解來描述這種信息的缺失。(15)u2)表布截面隨機誤差分量;VtN(0,v2)表布時間隨機誤差分量;wtN(0,w2)表示混和隨機誤差分量。同時還假定Ui,Vt,Wt之間互不相關(guān),各自分別不存在(14)其中誤差項在時間上和截面上都是相關(guān)的,用it=Ui+1X+3個分量表不如下。Vtit+wt其中UiN(0,截面自相關(guān)、時間

27、自相關(guān)和混和自相關(guān)。上述模型稱為隨機效應模型。隨機效應模型和固定效應模型比較,相當于把固定效應模型中的截距項看成兩個隨機變量。一個是截面隨機誤差項(Ui),一個是時間隨機誤差項(vt)。如果這兩個隨機誤差項都服從正態(tài)分布,對模型估計時就能夠節(jié)省自由度,因為此條件下只需要估計兩個隨機誤差項的均值和方差。假定固定效應模型中的截距項包括了截面隨機誤差項和時間隨機誤差項的平均效應,而且對均值的離差分別是Ui和Vt,固定效應模型就變成了隨機效應模型。為了容易理解,先假定模型中只存在截面隨機誤差項Ui,不存在時間隨機誤差分量(vt),yit=+ixit+(wt+u)=+iXit+it(16)截面隨機誤差項

28、Ui是屬于第個個體的隨機波動分量,并在整個時間范圍(t= 1,2,T)保持不變。隨機誤差項Ui,wt應滿足如下條件:E(Ui) =0,E(wt) = 0E(wt 2) =w2,E(Ui2)=U2,E(wtUj) =0,包括所有的i,t,j。E(wtwjs) =0,i j,t sE(uiUj) =0,i j因為根據(jù)上式有it=wt+Ui所以這種隨機效應模型又稱為誤差分量模型(error component model)。有結(jié)論,E(it) = E(w+Uj) = 0,(16)式,yit=+1Xit+ (wt+Ui),也可以寫成yit= (+Ui) +1Xit+w。服從正態(tài)分布的截距項的均值效應U

29、被包含在回歸函數(shù)的常數(shù)項中。E(it2) = E(w+Uj)2=w2+U2,E(itis) = E(Wt+ui)(Ws+ui) = E(wWis+uiWis+Witui+ui2)=u2,ti2,iT)=E(i)=w212(T T)+u1(T1)1(T 1)2uu2)其中I(TT)是(TT)階單位陣,1(T 1)是(T1)階列向量。因為第立的,所以NT個觀測值所對應的隨機誤差項的方差與協(xié)方差矩陣其中IN N表示由(T1)階列向量為元素構(gòu)成的單位陣,階列向量。表示科羅內(nèi)克積(Kronecker producta11Ba12Ba91Ba”BAN KB=2122a1KBa2KBaN1B aN2BaNK

30、B檢驗個體隨機效應的原假設(shè)與檢驗統(tǒng)計量是u2= 0o(混合估計模型)u20。 (個體隨機效應模型)LM=NT2(T 1)N T2u?ti 1 t 1 NTu?it2i1 t 1NT2(T 1)2u2u22)W u /期與j期觀測值是相互獨其中每一個元素)。其運算規(guī)則是T?i i 1 NT?it2i 1 t 11或0都是(T1)=NT T2L? u?2(T 1)i? i?其中6 6表示由個體隨機效應模型計算的殘差平方和。(?表示由混合估計模型計算的殘差平方和。統(tǒng)計量LMI艮從1個自由度的2分布??梢詫﹄S機效應模型進行廣義最小二乘估計。以觀測值方差的倒數(shù)為權(quán)。為了求權(quán)數(shù),必須采用兩階段最小二乘法估

31、計。因為各隨機誤差分量的方差一般是未知的,第一階段用普通最小二乘估計法對混合數(shù)據(jù)進行估計(采用固定效應模型)。用估計的殘差計算隨機誤差分量的方差。第二步用這些估計的方差計算參數(shù)的廣義最小二乘估計值。如果隨機誤差分量服從的是正態(tài)分布,模型的參數(shù)還可以用極大似然法估計。仍以例1為例給出隨機效應模型估計結(jié)果如下:圖 15NTLM= 一2(T 1)T2? ?2215 7 722501653 /2-1 = 52094824588Dependent Variable: CP?Method: GLS (Variance Components)Date: 12/04/04 Time U:12Sample: 19gB 2002Included observations:1Number of cross-sections used: 15Total panal (balancad) observations: 105VariableCoefficientStH Errort-StatisticPr&b.C345.179530 364924.295151O.tKODIP?7245690 01125764 365430.0000Rardam EftettsAH-C-2,553433EJ-C367.0439FJ

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預覽,若沒有圖紙預覽就沒有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負責。
  • 6. 下載文件中如有侵權(quán)或不適當內(nèi)容,請與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

評論

0/150

提交評論