![面板數(shù)據(jù)-計量經(jīng)濟學及Stata應(yīng)用_第1頁](http://file4.renrendoc.com/view10/M02/17/12/wKhkGWVsi4OAD8HJAADq1M_0U60896.jpg)
![面板數(shù)據(jù)-計量經(jīng)濟學及Stata應(yīng)用_第2頁](http://file4.renrendoc.com/view10/M02/17/12/wKhkGWVsi4OAD8HJAADq1M_0U608962.jpg)
![面板數(shù)據(jù)-計量經(jīng)濟學及Stata應(yīng)用_第3頁](http://file4.renrendoc.com/view10/M02/17/12/wKhkGWVsi4OAD8HJAADq1M_0U608963.jpg)
![面板數(shù)據(jù)-計量經(jīng)濟學及Stata應(yīng)用_第4頁](http://file4.renrendoc.com/view10/M02/17/12/wKhkGWVsi4OAD8HJAADq1M_0U608964.jpg)
![面板數(shù)據(jù)-計量經(jīng)濟學及Stata應(yīng)用_第5頁](http://file4.renrendoc.com/view10/M02/17/12/wKhkGWVsi4OAD8HJAADq1M_0U608965.jpg)
版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進行舉報或認領(lǐng)
文檔簡介
?陳強,2015年,《計量經(jīng)濟學及
Stata應(yīng)用》,高等教育出版社。第12章面板數(shù)據(jù)4312.1
面板數(shù)據(jù)的特點面板數(shù)據(jù)(panel
data
或 longitudinal
data),指在一段時間內(nèi)跟蹤同一組個體(individual)的數(shù)據(jù)。它既有橫截面維度(n
位個體),又有時間維度(T
個時期)。一個T
3的面板數(shù)據(jù)結(jié)構(gòu)如表 12.1。43表
12.1面板數(shù)據(jù)的結(jié)構(gòu)yx1x2x3個體
1:t
=
1個體
1:t
=
2個體
1:t
=
3個體
2:t
=
1個體
2:t
=
2個體
2:t
=
3個體n:t
=
1個體n:t
=
2個體n:t
=
343通常的面板數(shù)據(jù)T較小,n較大,在使用大樣本理論時讓n趨于無窮大,稱為“短面板”(short
panel)。如果T較大,n較小,則稱為“長面板”(long
panel)。在面板模型中,如果解釋變量包含被解釋變量的滯后值,稱為
“動態(tài)面板”(dynamic
panel);反之,稱為“靜態(tài)面板”(static
panel)。本書僅關(guān)注靜態(tài)面板。在面板數(shù)據(jù)中,如果每個時期在樣本中的個體完全一樣,則稱為“平衡面板”(balanced
panel);反之,則稱為“非平衡面板”(unbalanced
panel)。主要關(guān)注平衡面板,但在本章第 11
節(jié)討論非平衡面板。43面板數(shù)據(jù)的主要優(yōu)點如下。有助于解決遺漏變量問題:遺漏變量常由不可觀測的個體差異或“異質(zhì)性”(heterogeneity)造成(比如個體能力)。如果個體差異“不隨時間而改變”(time
invariant),則面板數(shù)據(jù)提供了解決遺漏變量問題的又一利器。提供更多個體動態(tài)行為的信息:面板數(shù)據(jù)有橫截面與時間兩個維度,可解決截面數(shù)據(jù)或時間序列不能解決的問題。43例 如何區(qū)分規(guī)模效應(yīng)與技術(shù)進步對企業(yè)生產(chǎn)效率的影響。截面數(shù)據(jù)沒有時間維度,無法觀測到技術(shù)進步。單個企業(yè)的時間序列數(shù)據(jù),也無法區(qū)分生產(chǎn)效率提高有多少由于規(guī)模擴大,有多少由于技術(shù)進步。例 對于失業(yè)問題,截面數(shù)據(jù)告訴我們在某個時點上哪些人失業(yè),時間序列告訴我們某個人就業(yè)與失業(yè)的歷史,但均無法告訴我們是否失業(yè)的總是同一批人(低流轉(zhuǎn)率),還是失業(yè)的人群總在變動(高流轉(zhuǎn)率)。如有面板數(shù)據(jù),就可能解決上述問題。(3)樣本容量較大:同時有截面與時間維度,面板數(shù)據(jù)的樣本容量通常更大,可提高估計精度。43面板數(shù)據(jù)也會帶來問題。樣本數(shù)據(jù)通常不滿足 iid
假定,因為同一個體在不同期的擾動項一般存在自相關(guān)。面板數(shù)據(jù)的收集成本通常較高,不易獲得。12.2
面板數(shù)據(jù)的估計策略一個極端策略是,將面板看成截面數(shù)據(jù)進行混合回歸(pooledregression),即要求樣本中每位個體擁有完全相同的回歸方程。混合回歸的缺點是,忽略個體不可觀測的異質(zhì)性(heterogeneity),而該異質(zhì)性可能與解釋變量相關(guān),導(dǎo)致估計不一致。43另一極端策略是,為每位個體估計單獨的回歸方程。分別回歸的缺點是,忽略個體的共性,可能沒有足夠大的樣本容量。實踐中常采用折衷的策略,即假定個體的回歸方程擁有相同的斜率,但可有不同截距項,以捕捉異質(zhì)性(參見圖 12.1)。圖
12.1 面板數(shù)據(jù)中不同個體的截距項可以不同4343這種模型稱為“個體效應(yīng)模型”(individual-specific
effects
model(i
u1, ,
n;
ti
it1, ,T
)yit
xi
t
zi(12.zi
為不隨時間而變(time
invariant)的個體特征(zit別;zi
,
t),比如xit
可以隨個體及時間而變(time-varying)。擾動項由(ui it
)
兩部分構(gòu)成,稱為“復(fù)合擾動項”(compositeerror
term)。不可觀測的隨機變量ui
是代表個體異質(zhì)性的截距項,即“個體效應(yīng)”(individual
effects)。43it
為隨個體與時間而改變的擾動項,稱為“idiosyncratic
error”。一般假設(shè){
it
}為獨立同分布,且與ui
不相關(guān)。如果ui
與某個解釋變量相關(guān),則進一步稱為“固定效應(yīng)模型”(Fixed
Effects
Model,簡記 FE)。此時 OLS
不一致。解決方法是轉(zhuǎn)換模型,消去ui
獲得一致估計。如果ui
與所有解釋變量(
xit
,
zi
)
均不相關(guān),則進一步稱為“隨機效應(yīng)模型”(Random
Effects
Model,簡記 RE)。與橫截面數(shù)據(jù)相比,面板數(shù)據(jù)提供了更豐富的模型與估計方法。4312.3
混合回歸如果所有個體都擁有完全一樣的回歸方程,則u1
u2將相同的個體效應(yīng)統(tǒng)一記為,方程(12.1)可寫為:un
。yitxi
t
zi it
(12.2)其中,xit
不包括常數(shù)項。把所有數(shù)據(jù)放在一起,像橫截面數(shù)據(jù)那樣進行 OLS
回歸,故稱“混合回歸”(pooled
regression)。雖可假設(shè)不同個體的擾動項相互獨立,但同一個體在不同時期的擾動項之間往往自相關(guān)。43每位個體不同時期的所有觀測值構(gòu)成一個“聚類”(cluster)。樣本觀測值可分為不同的聚類,在同一聚類里的觀測值互相相關(guān),不同聚類之間的觀測值不相關(guān),稱為“聚類樣本”(clustersample)。對于聚類樣本,仍可進行 OLS
估計,但需使用“聚類穩(wěn)健的標準誤”(cluster-robust
standard
errors),形式上也是夾心估計量,表達式更為復(fù)雜。對于樣本容量為nT
的平衡面板,共有n
個聚類,而每個聚類中包含T
期觀測值。43使用聚類穩(wěn)健標準誤的前提是,聚類中的觀測值數(shù)目T
較小,而聚類數(shù)目n較大(n
);此時聚類穩(wěn)健標準誤是真實標準誤的一致估計。聚類穩(wěn)健標準誤更適用于時間維度
T
比截面維度n小的短面板。在推導(dǎo)過程中未假定同方差,故聚類穩(wěn)健標準誤也是異方差穩(wěn)健的。混合回歸的基本假設(shè)是不存在個體效應(yīng),對此須進行統(tǒng)計檢驗,在下文介紹。12.4
固定效應(yīng)模型:組內(nèi)估計量考慮固定效應(yīng)模型:zyit
xi
t
i
i(12u.3)it其中,ui
與某解釋變量相關(guān),故OLS不一致。解決方法:通過模型變換,消掉個體效應(yīng)ui
。給定個體i,方程兩邊對時間取平均:yi
xizi
ui的定義類似。i(12.4)T143Tit
t1其中,yiiiy,x與43將原方程減去平均方程(12.4),可得離差形式:yityi
(
xit
xi
)(iti
)
(12.5)i
,則zi
與ui
被消去。定義
yit
yit
yi
,
xit
xitxi,itiyitxi
tit(12.6)只要新擾動項
it
與新解釋變量x
it
不相關(guān),則 OLS
一致,稱為“效應(yīng)估計量”(Fixed
Effects
Estimator),記為
?FE
。?FE
主要使用每位個體的組內(nèi)離差信息,也稱“組內(nèi)估計量”
(within
estimator)。43即使ui
與xit
相關(guān),只要使用組內(nèi)估計量,即可得一致估計,這是面板數(shù)據(jù)的一大優(yōu)勢。由于可能存在組內(nèi)自相關(guān),應(yīng)使用以每位個體為聚類的聚類穩(wěn)健標準誤。在離差變換過程中,
zi
也消掉,無法估計
。?
無法估計不隨時間而變的變量之影響,這是 FE
的一大缺點。FEit為保證(
i
)與(
xitxi
)不相關(guān),須假定個體
i
滿足嚴格外生it
xi1,(比前定變量或同期外生的假定更強),即E( ,
xiT
)0,因為xi
中包含了所有(
xi1, ,
xiT
)的信息。4312.5
固定效應(yīng)模型:LSDV法個體固定效應(yīng)ui
,傳統(tǒng)上視為個體
i
的待估參數(shù),即個體
i
的截距項。對于n位個體的n個不同截距項,可在方程中引入(n擬變量來體現(xiàn):n1)個個體虛y
x
zit
i
t
i
i
i
it(12.7)Di
2其中,個體虛擬變量D2
=1,如果為個體 2;否則,D2
=
0。其他(D3
,
,Dn
)的定義類似。用 OLS
估計此方程,稱為“最小二乘虛擬變量法”(Least
SquareDummy
Variable,LSDV)。43LSDV
法的估計結(jié)果與組內(nèi)估計量 FE
完全相同。正如線性回歸與離差形式的回歸在某種意義上等價(參見習題):yi
xiiyiy
(xi
x
)
(
i
)
(12.8做完 LSDV
后,如發(fā)現(xiàn)某些個體的虛擬變量不顯著而刪去,則LSDV
的結(jié)果就不會與 FE
相同。LSDV的好處是,可得到對個體異質(zhì)性ui
的估計。LSDV
法的缺點是,如果n
很大,須在回歸方程中引入很多虛擬變量,可能超出 Stata
所允許的變量個數(shù)。4312.6
固定效應(yīng)模型:一階差分法對于固定效應(yīng)模型,還可對原方程兩邊進行一階差分,消去個體效應(yīng)ui
:(i,
t
it
1
)yit
yi,
t
1
(
xit,
t1
)
(12.9)使用
OLS(First即得到“一階差分估計量”Differencing Estimator),記為
?FD
。只要擾動項的一階差分(
it i,
t
1
)
與解釋變量的一階差分xi,
t(xit
1
)不相關(guān),則?FD
一致。此一致性條件比保證?FE
一致的嚴格外生性假定更弱。43可以證明(參見習題),如果T
2,則?FD?FE
。對于T
2,如果實踐中,主要用it為獨立同分布,則?
比
?
更有效率。FE
FD?
,較少用
?
。FE
FD12.7
時間固定效應(yīng)個體固定效應(yīng)模型解決了不隨時間而變(time
invariant)但隨個體而異的遺漏變量問題。還可能存在不隨個體而變(individual
invariant),但隨時間而變
(time
varying)的遺漏變量問題。比如,企業(yè)經(jīng)營的宏觀經(jīng)濟環(huán)境。43在個體固定效應(yīng)模型中加入時間固定效應(yīng)(
t
):(12.1u0)t
izyit
xi
t
iit其中,
t
隨時間而變,但不隨個體而變。T可視
t
為第t
期特有的截距項,并解釋為“第t
期”對y
的效應(yīng);故稱
1,
,
為“時間固定效應(yīng)”(time
fixed
effects)。使用 LSDV
法,對每個時期定義一個虛擬變量,把(T
1)個時間虛擬變量包括在回歸方程中:Tyitxi
tzit
ti(12D.11)uitt
243時間虛擬變量D2
1,如果t
2;否則, D2
=
0;以此類推。方程(12.11)既考慮了個體固定效應(yīng),又考慮了時間固定效應(yīng),稱為“雙向固定效應(yīng)”(Two-way
FE)??赏ㄟ^檢驗這些時間虛擬變量的聯(lián)合顯著性來判斷是否應(yīng)使用雙向固定效應(yīng)模型。如果僅考慮個體固定效應(yīng),稱為“單向固定效應(yīng)”(One-way
FE)。有時為節(jié)省參數(shù)(比如,時間維度T較大),可引入時間趨勢項,以替代上述(T
1)個時間虛擬變量:yititxi
t
zi
t
ui
(12.12)43上式隱含假定,每個時期的時間效應(yīng)相等,即每期均增加
。如果此假定不太可能成立,應(yīng)在方程中加入時間虛擬變量。12.8
隨機效應(yīng)模型考慮隨機效應(yīng)模型:yitxi
t
zi
ui
it
(12.13)其中,個體效應(yīng)ui
與解釋變量均不相關(guān),故 OLS
一致。由于擾動項由(ui it
)
組成,不是球型擾動項,故 OLS
不是最有效率的。43假設(shè)不同個體之間的擾動項互不相關(guān)。由于ui
的存在,同一個體不同時期的擾動項之間仍存在自相關(guān)。對于t
s,可證明Cov(uiit
,
uiis
)Cov(ui
,
ui
)00C
o
v
(
ui
,Var(u
)20iu(12.14)其中,2Var(u
)為個體效應(yīng)u的方差。i
iu43如果t
s
,則Var(u2i)2(12.15)itu2其中,
Var( )為的方差(不隨i,t變化)。it
it當t
s時,個體i
擾動項的自相關(guān)系數(shù)為i
it
uit
,
ui is
)22Co
rr(uiCov(iu
it
i,
u
u)Vairs
(u)2(12.16)自相關(guān)系數(shù)
越大,則復(fù)合擾動項(ui it
)
中個體效應(yīng)的部分(ui
)越重要。Stata記為“rho”。由于擾動項(ui it
)
存在組內(nèi)自相關(guān),故 OLS
不是最有效率的。使用 GLS
轉(zhuǎn)換原模型,使變換后擾動項無自相關(guān)。定義u431(T22
)1
2(12.17)其中,T
為面板數(shù)據(jù)的時間維度。顯然,0 1。給定個體i
,將方程(12.13)兩邊對時間進行平均,然后同乘
:yi
xi
zi
uii(12.18)43將
原
方
程 (12.13)
減
去
方
程 (12.18)
可
得
“
廣
義
離
差
”(quasi-demeaned)模型:yit)z擾動項y
(
x x
)i
it
i(1i(1(21.19))ui(由于0差”。1,故(yityi
)只是減去yi
的一部分,故名“廣義離廣義離差方程的擾動項
(1)u
(iiti)
不再有自相此 方程進行 OLS
估計,即為 GLS
估計量。但 通常未知,須先估計
?,再進行 FGLS
估計??捎孟率絹砉烙?/p>
?:?43?
1(Tu
?
2(12.20)?
2
)1
2其中,
?u
與?分別為
u
與的樣本估計值。Stata
分別記
?u
、?與
?為“sigma_u”、“sigma_e”與“thet對于隨機效應(yīng)模型,由于 OLS
一致,且其擾動項為(ui it
),故2可用 OLS
的殘差估計(
2
)。u差另估一計方面2
。,F(xiàn)E也一致,且其擾動項為(iti
),故可用 FE
的殘43由此得到
?,再用 FGLS
估計原模型,可得“隨機效應(yīng)估計量”(Random
Effects
Estimator),記為
?RE
。如假設(shè)擾動項服從正態(tài)分布,可進行最大似然估計(MLE)。12.9
組間估計量對于隨機效應(yīng)模型,還可使用“組間估計量”。如每位個體的時間序列數(shù)據(jù)較不準確或噪音較大,可對每位個體取時間平均值,然后用平均值作橫截面回歸:(i
u1, ,
n)i
iyi
xi
zi(12.21)對上式用 OLS,即為“組間估計量”(Between
Estimator),記
?BE
。43由于 x
,
z 包含
x
,
z 的信息,如u
與x
,z
相關(guān),it
ii
i
it
i
i致。故不能在固定效應(yīng)模型下使用組間估計法。即使在隨機效應(yīng)模型下,由于面板數(shù)據(jù)被壓縮為截面數(shù)據(jù),損失較多信息量,組間估計法也不常用。12.10
擬合優(yōu)度的度量對于面板模型,如使用混合回歸,可直接用混合回歸的R2
衡量擬合優(yōu)度。如使用固定效應(yīng)或隨機效應(yīng),擬合優(yōu)度的度量略復(fù)雜。43對于有常數(shù)項的線性回歸模型,擬合優(yōu)度R2
等于被解釋變量y
與預(yù)測值y?
之間相關(guān)系數(shù)的平方,即R2
[corr(
y,
y?)]2
。給定估計量(
?, ?)
,Stata
提供了以下三種R2
。z
?
2(1) 對應(yīng)于原模型(12.1),稱[Corr(
y
,?x
)]
為“整體2
R
”it
it
i(
R2
overall),衡量估計量(
?, ?)
對原模型的擬合優(yōu)度。it
it2(2)
對應(yīng)于組內(nèi)模型(12.6)
,稱[Corr(
y
,
?x
)]
為“組2內(nèi)
R
”(
R2
within),衡量估計量(
?, ?)
對組內(nèi)模型的擬合優(yōu)度。z?
2(3)
對應(yīng)于組間模型(12.21),[稱Corr(
y
,
x?
)]
為“組2間R
”i
i
i(
R2
between),衡量估計量(
?, ?)
對組間模型的擬合優(yōu)度。43無論固定效應(yīng)、隨機效應(yīng)還是組間回歸,都可計算這三種R2
。對于固定效應(yīng)模型,建議使用組內(nèi)R2
;對于組間回歸模型,建議使用組間R2
。對于隨機效應(yīng)模型,這三種R2
都只是相應(yīng)的相關(guān)系數(shù)平方而已
(并非隨機效應(yīng)模型廣義離差回歸的R2
)。12.11
非平衡面板在面板數(shù)據(jù)中,如每個時期在樣本中的個體完全一樣,稱為“平衡面板數(shù)據(jù)” (balanced
panel)。但有時某些個體的數(shù)據(jù)可能缺失(比如,個體死亡、企業(yè)倒閉或43被兼并、個體不再參與調(diào)查),或者新個體在后來才加入到調(diào)查中來。如每個時期觀測到的個體不完全相同,稱為“非平衡面板”
(unbalanced
panel)或“不完全面板”(incomplete
panel)。非平衡面板數(shù)據(jù)不影響計算離差形式的組內(nèi)估計量(withinestimator),固定效應(yīng)模型的估計可照樣進行。對于隨機效應(yīng)模型,非平衡面板數(shù)據(jù)也無實質(zhì)影響。假設(shè)個體i的時間維度為Ti
,只要在做廣義離差變換時,為每位個體定義i
?
143?u?
2(Ti(12.22)?
2
)1
2即可照常進行 FGLS
估計。非平衡面板可能出現(xiàn)的最大問題是,那些原來在樣本中但后來
丟掉的個體,如果“丟掉”的原因內(nèi)生(與擾動項相關(guān)),則會導(dǎo)致樣本不具有代表性(不再是隨機樣本),導(dǎo)致估計量不一致。比如,低收入人群更易從面板數(shù)據(jù)中丟掉。如果從非平衡面板數(shù)據(jù)中提取一個平衡的面板數(shù)據(jù)子集,則必然會損失樣本容量,降低估計效率。如人為“丟掉”個體并非完全隨機,同樣會破壞樣本的隨機性。4312.12
究竟該用固定效應(yīng)還是隨機效應(yīng)模型處理面板數(shù)據(jù),究竟使用固定效應(yīng)還是隨機效應(yīng)是根本問題。檢驗原假設(shè)“ H0
:ui
與xit
,
zi
不相關(guān)”(隨機效應(yīng)為正確模型)。如果H0
成立,則 FE
與RE
都一致,但 RE
比 FE
更有效率。如果H0
不成立,則 FE
一致,而 RE
不一致。如果H0
成立,則 FE
與 RE
估計量將共同收斂于真實的參數(shù)值,二者的差距將在大樣本下消失,故(
??0
。)pFE
RE反之,如果二者的差距過大,則傾向于拒絕原假設(shè)。43以二次型度量此距離,豪斯曼檢驗(Hausman,
1978)的統(tǒng)計量為(
?FE
?RE?其中,K
為FE?RE1?)
VFEar?(
RE
())d2
(K
)(12.?FE
的維度,即xit
中隨時間而變的解釋變量個數(shù)。如果該統(tǒng)計量大于臨界值,則拒絕H0
。Var(此檢驗的缺點是,為計算
?FE RE
)
?,假設(shè)在H
0成立情況下,?RE
是最有效率的(fully
efficient)。但如果擾動項存在異方差,則?RE
并非最有效率。43傳統(tǒng)的豪斯曼檢驗不適用于異方差的情形,須使用異方差穩(wěn)健的豪斯曼檢驗(參見下文)。面板模型的Stata命令及實例面板數(shù)據(jù)的設(shè)定設(shè)定面板數(shù)據(jù)的 Stata
命令為xtset
panelvar
timevar命令“xtset”告訴 Stata
你的數(shù)據(jù)為面板數(shù)據(jù)。面板(個體)變量“panelvar”的取值須為整數(shù)且不重復(fù),相當于將樣本中每位個體進行編號。43“timevar”為時間變量。假如“panelvar”本來是字符串(比如,國家名字 country),可用以下命令轉(zhuǎn)換為數(shù)字型變量:encode
country,
gen(cntry)選擇項“gen(cntry)”表示將新生成的數(shù)字型變量記為 cntry。這樣,變量 cntry
就以“1,
2,
3, …”來指代不同的國家。顯示面板數(shù)據(jù)統(tǒng)計特性的 Stata
命令:xtdes (顯示面板數(shù)據(jù)的結(jié)構(gòu),是否為平衡面板)xtsum (顯示組內(nèi)、組間與整體的統(tǒng)計指標)43xtline
varname(對每位個體分別顯示該變量的時間序列圖;如希望將所有個體的時間序列圖疊放在一起,可加上選擇項
overlay)以數(shù)據(jù)集 lin_1992.dta
為例,取自 Lin(1992)對家庭聯(lián)產(chǎn)承包責任制(household
responsibility
system)與中國農(nóng)業(yè)增長的經(jīng)典研究。該省際面板包含中國 28
個省 1970—1987
年有關(guān)種植業(yè)的數(shù)據(jù)。被解釋變量為“種植業(yè)產(chǎn)值對數(shù)”(ltvfo,1980
年不變價格)。解釋變量包括:耕地面積對數(shù)(ltlan,千畝),種植業(yè)勞動力(ltwlab),機械動力與畜力對數(shù)(ltpow,千馬力),化肥使用量對數(shù)
(ltfer,千噸),截止年底采用家庭聯(lián)產(chǎn)承包制的生產(chǎn)隊比重(hrs),43農(nóng)村消費者價格與農(nóng)村工業(yè)投入品價格之比的一階滯后(mipric1,1950年=100),超額收購價格與農(nóng)村工業(yè)投入品價格之比(giprice,1950 年=100),復(fù)種指數(shù)(mci,播種面積除以耕地面積),非糧食作物占播種面積比重(ngca),時間趨勢(t),province(省),year(年)。為解決異方差問題,Lin
(1992)將種植業(yè)產(chǎn)量、耕地面積、種植業(yè)勞動力、機械動力與畜力、化肥使用量這些傳統(tǒng)的投入與產(chǎn)出變量都除以每省的生產(chǎn)隊數(shù)目(team)。兩個價格變量 mipric1
與 giprice
為全國性指標,各省都一樣,只隨時間變化。首先,設(shè)定 province
與 year
為面板(個體)變量及時間變量:.
use
lin_1992.dta,clear.
xtset
province
yearpanel
variable:time
variable:delta:province
(strongly
balanced)year,
70
to
871
unit這是一個平衡的面板數(shù)據(jù)(strongly
balanced)。其次,顯示數(shù)據(jù)集的結(jié)構(gòu):.
xtdesprovince:431,
2,
..Delta(year)
=
1
unitSpan(year) =
18
periods(province*year
uniquely
identifies
each
observation)T_i:min5%25%50%75%181818Freq.PercentCum.Pattern28100.00100.0011111111111111111128100.00XXXXXXXXXXXXXXXXXX43上表顯示,n
28,而T
18。n
大而T
小,故是短面板。顯示數(shù)據(jù)集中以上變量的統(tǒng)計特征:.
xtsum
ltvfo
ltlan
ltwlab
ltpow
ltfer
hrs
mipric1giprice
mci
ngcaVariableMeanStd.Dev.MinMaxObservationsltvfooverall7.647758.53319995.519.33N=504between.46119926.9822228.977222n=28within.28068885.614988.471647T=18ltlanoverall5.837877.80848664.577.76N=504between.81430364.6172227.697778n=28within.11388924.7589886.163988T=18ltwlaboverall3.19752.4193496.983.86N=504between.31957152.3038893.646111n=28within.27781231.6186314.053631T=18ltpowoverall2.692778.9463811.25.04N=504between.77020361.4754.180556n=28within.5678668.313.909444T=18ltferoverall2.15119.7903761-.233.98N=504between.56249351.0811113.649444n=28within.564791.41730163.510079T=18hrsoverall.3497479.452628301N=476between.0453814.2123529.4094118n=28within.4504245-.05966391.053866T=17mipric1overall2.248889.24313791.762.73N=504between02.2488892.248889n=28within.24313791.762.73T=18gipriceoverall2.858889.45375782.393.56N=504between02.8588892.858889n=28within.45375782.393.56T=18mcioverall1.538452.4931854.852.55N=504between.4972044.86666672.487222n=28within.06614121.3234521.880119T=18ngcaoverall.199623.07614543.06.91N=504between.0631671.1144444.3466667n=28within.0440777.1151786.8951786T=1843除 hrs
外,所有變量的觀測樣本均為2818 504。關(guān)鍵變量 hrs
的樣本容量僅為28hrs
觀測數(shù)據(jù)。17 476,因為缺失 1980
年的看被解釋變量 ltvfo
在 28
個省的時間趨勢圖,如圖 12.2。.
xtline
ltvfo圖 12.2
28
省種植業(yè)產(chǎn)值的時間趨勢圖4343不同省的種植業(yè)產(chǎn)值均隨時間而增長,但變化趨勢與時機不盡相同。種植業(yè)產(chǎn)值的省際差異有助于估計決定種植業(yè)產(chǎn)值的因素。
2.混合回歸作為參照系,首先進行混合回歸。Stata命令的基本格式為reg
y
x1
x2
x3,vce(cluster
id)其中,“id”指用來確定每位個體的變量。選擇項“vce(cluster
id)”表示以變量 id
作為聚類變量來計算聚類穩(wěn)健的標準誤。43.
reg
ltvfo
ltlan
ltwlab
ltpow
ltfer
hrs
mipric1giprice
mci
ngca,vce(cluster
province)選
擇
項
“ vce(cluster
province)
”
表
示
,
使
用
以“province”為聚類變量的聚類穩(wěn)健標準誤。將此結(jié)果儲存,并記為“OLS”。.
estimates
store
OLS43ltvfoCoef.RobustStd.
Err.tP>|t|[95%
Conf.Interval]ltlan.693795.1150246.030.000.4577853.9298048ltwlab.2650224.05662944.680.000.1488285.3812164ltpow-.0291884.0670385-0.440.667-.1667401.1083633ltfer.3110617.05313185.850.000.2020443.4200792hrs.2286926.04894584.670.000.1282642.329121mipric1.0122048.05477990.220.825-.1001943.1246039giprice-.0538892.0274468-1.960.060-.1102054.002427mci.6949202.16896924.110.000.34822411.041616ngca.3053056.52226390.580.564-.76629141.376903_cons1.080587.82698881.310.202-.61625442.777427(Std.
Err.
adjusted
for
28
clusters
in
province)R-squaredRoot
MSE==0.8685.19689Number
of
obs
=F(
9,Prob
>
FLinear
regression27)
=47681.39=
0.0000關(guān)鍵變量 hrs
在 1%水平上顯著為正。SourceSSdf
MSNumber
of
obs
=
476F(
9,
466)
=
342.09Model119.3559649
13.2617737Prob
>
F
=
0.0000Residual18.0652415466
.038766613R-squared
=
0.8685Adj
R-squared
=
0.8660Total137.421205475
.2893078Root
MSE
=
.19689ltvfoCoef.Std.
Err.
tP>|t|[95%
Conf.
Interval]ltlan.693795.0368914
18.810.000.6213008
.7662892ltwlab.2650224.0238406
11.120.000.2181741
.3118708ltpow-.0291884.0331891 -0.880.380-.0944073
.0360305ltfer.3110617.0206459
15.070.000.2704911
.3516324hrs.2286926.0307121
7.450.000.1683412
.289044mipric1.0122048.0533863
0.230.819-.0927028
.1171125giprice-.0538892.0271999 -1.980.048-.1073389 -.0004395mci.6949202.0522416
13.300.000.592262
.7975784ngca.3053056.1952732
1.560.119-.0784195
.6890306_cons1.080587.2832576
3.810.000.5239661
1.63720743如使用普通標準誤,則可輸入命令:.
reg
ltvfo
ltlan
ltwlab
ltpow
ltfer
hrs
mipric1giprice
mci
ngca43對比聚類穩(wěn)健標準誤與普通標準誤可知,前者大于后者。由于同一省不同年份之間的擾動項一般存在自相關(guān),而普通標準誤假設(shè)擾動項為獨立同分布,故普通標準誤的估計不準確。3.固定效應(yīng)由于每個省的“省情”不同,可能存在不隨時間而變的遺漏變量,考慮使用固定效應(yīng)模型(FE)。固定效應(yīng)模型(組內(nèi)估計量)的 Stata
命令格式為xtreg
y
x1
x2
x3,fe
r選擇項“fe”表示“fixed effects”(固定效應(yīng)估計量),默認為“re”表示“random
effects”(隨機效應(yīng)估計量)。43選擇項“ r
”表示使用聚類穩(wěn)健標準誤;如使用選擇項“vce(cluster
id)”也能達到相同效果。LSDV
法的 Stata
命令為reg
y
x1
x2
x3
i.id,vce(cluster
id)“id”表示用來確定個體的變量,“i.id”則表示根據(jù)變量
“id”而生成的虛擬變量。選擇項“vce(cluster
id)”表示使用聚類穩(wěn)健的標準誤。首先使用組內(nèi)估計量,并記其估計結(jié)果為“FE_robust”:.
xtreg
ltvfo
ltlan
ltwlab
ltpow
ltfer
hrsmipric1
giprice
mci
ngca,fe
r.
estimates
store
RE_robust43輸出Fixed-effects
(within)
regression Number
of
obs
=
476Group
variable:
province
Number
of
groups
=
28R-sq: within
=
0.8746
Obs
per
group:
min
=
17between
=
0.6483
avg
=
17.0overall
=
0.6993
max
=
17F(9,27)
=
274.25corr(u_i,
Xb) =
-0.3877
Prob
>
F
=
0.0000(Std.
Err.
adjusted
for
28
clusters
in
province)ltvfoRobustCoef.
Std.
Err.
t
P>|t| [95%
Conf.
Interval]ltlanltwlabltpowltferhrsmipric1gipricemcingca_cons.6370234
.1681335
3.79
0.001
.2920421
.9820048.1387786
.0624585
2.22
0.035
.0106242
.2669329.0577152
.0755568
0.76
0.452 -.0973146
.2127451.1826281
.043592
4.19
0.000
.0931846
.2720716.2134022
.0391104
5.46
0.000
.1331542
.2936501.0543577
.0590331
0.92
0.365 -.0667682
.1754837-.0151451
.0245968 -0.62
0.543 -.0656135
.0353233.1943697
.0770515
2.52
0.018
.0362731
.3524663.7562031
.3821261
1.98
0.058 -.0278549
1.5402612.337895
.8552224
2.73
0.011
.583124
4.092667sigma_usigma_e結(jié)果r包ho.30549743.10589274括.常8927數(shù)3901
項((fra_ctcioon
nosf
)v,arian是ce
du所e
有to
個u_i)體效應(yīng)ui
的平均值。43最后一行顯示,“rho=0.89”,故復(fù)合擾動項(ui主要來自個體效應(yīng)ui
的變動。it
)的方差究竟應(yīng)使用混合回歸還是個體固定效應(yīng)模型?在使用命令“xtreg,fe”時,如不加選擇項“r”(將估計結(jié)果記為“FE”),則輸出結(jié)果還包含一個F
檢驗,其原假設(shè)為“ H0
:所有ui
0
”,即可以接受混合回歸:.
xtreg
ltvfo
ltlan
ltwlab
ltpow
ltfer
hrsmipric1
giprice
mci
ngca,fe.
estimates
store
FE對于拒絕原Fixed-effects
(within)
regression=Number
ofNumber
ofF(9,439)obs=476Group
variable:
provincegroups=28R-sq: within
=
0.8746
Obs
per
group:
min
=17between
=
0.6483avg=17.0overall
=
0.6993max=17=3corr(u_i,
Xb) =
-0.3877 Prob
>
F0.0000ltvfoCoef.Std.
Err.tP>|t|[95%
Conf.
Inteltlan.6370234.06731919.460.000.5047156
.76ltwlab.1387786.02615545.310.000.0873732
.1ltpow.0577152.03325081.740.083-.0076352
.12ltfer.1826281.02199218.300.000.1394053
.2hrs.2134022.02238869.530.000.1694
.25mipric1.0543577.04216591.290.198-.0285145
.13giprice-.0151451.0187457-0.810.4200519876
.02mci.1943697.08768842.220.027.0220285
.3ngca.7562031.21681413.490.001.3300804
1.1_cons2.337895.3852536.070.0001.580726sigma_u原假設(shè)“sig所ma_e假設(shè),認為rho.30549743有u.1i0589274
0
”,最后一行F
檢驗的
p
值為 0.0000,故FE.892優(yōu)7390于1
(混frac合tion
o回f
var歸iance。due
to
u_i)F
test
that
all
u_i=0:=43.41F(27,
439)43Prob
>
F
=
0.000043由于未使用聚類穩(wěn)健標準誤,此F檢驗并不有效。進一步通過 LSDV
法來考察 (將估計結(jié)果記為“LSDV”):.
reg
ltvfo
ltlan
ltwlab
ltpow
ltfer
hrs
mipric1giprice
mci
ngca
vince,vce(cluster
province).
estimates
store
LSDVLinear
regressionNumberof
obs=476F(
8,
27)=.Prob
>
F=.R-squared=0.9642RootMSE=.10589(Std.Err.adjustedfor28
clusters
inprovince)RobustltvfoCoef.Std.Err.tP>|t|[95%Conf.Interval]ltlanltwlabltpowltfer
hrsmipric1gipricemcingcaprovincebeijingfujiangansuguangdongguangxiguizhouhebeiheilongjianghenanhubeihunanjiangsujiangxijilinliaoningneimongningxiaqinghaishaanxishangdongshanghaishanxisichuantianjin.6370234.17322673.680.001.2815916.9924553.1387786.06435062.160.040.0067421.2708151.0577152.07784570.740.465-.1020109.2174414.1826281.04491264.070.000.0904751.2747811.2134022.04029525.300.000.1307233.296081.0543577.06082140.890.379-.0704375.1791529-.0151451.0253419-0.600.555-.0671423.0368522.1943697.07938562.450.021.0314839.3572555.7562031.39370181.920.065-.05160631.564013-.1816498.1247829-1.460.157-.4376832.0743835.051657.05019161.030.313-.0513277.1546418-.8165674.1380808-5.910.000-1.099886-.5332489-.010488.055811-0.190.852-.1250028.1040268-.2304637.0570853-4.040.000-.3475932-.1133342-.2350768.0615353-3.820.001-.3613369-.1088167-.2923854.0997217-2.930.007-.4969974-.0877733-.1410195.2892268-0.490.630-.7344638.4524249-.0904581.0435714-2.080.048-.1798593-.0010569.1118905.03405843.290.003.0420085.1817725-.0373775.0607647-0.620.544-.1620563.0873014.1150954.03420583.360.002.0449109.18528-.1352577.0579781-2.330.027-.2542188-.0162965-.2220282.2253552-0.990.333-.6844189.2403624-.2789811.172656-1.620.118-.6332419.0752797-.9288069.2561317-3.630.001-1.454346-.403268-.8813594.1975659-4.460.000-1.286731-.4759877-.7062497.1521719-4.640.000-1.018481-.3940187-.3342067.0925991-3.610.001-.5242045-.144209-.0049215.0581511-0.50680.933-.1242377.1143947.113901.06486271.760.090-.0191862.2469882-.5312338.1514863-3.510.002-.8420581-.2204095.0251618.03207320.780.440-.040647.0909707-.3047612.1190042-2.560.016-.5489376-.0605848不少個體虛擬變量在 5%水平上顯著,可拒絕“所有個體虛擬變量都為 0”的原假設(shè),認為存在個體固定效應(yīng),不應(yīng)使用混合回歸。LSDV法的回歸系數(shù)與組內(nèi)估計量完全相同,但聚類穩(wěn)健的標準誤略有差別。對于固定效應(yīng)模型,也可使用一階差分法(FD)。Stata沒有專門執(zhí)行一階差分法的命令,但在使用命令“xtserial,output”對組內(nèi)自相關(guān)進行檢驗時,可附帶提供一階差分法的估計結(jié)果(將此結(jié)果記為“FD”):.
xtserial
ltvfo
ltlan
ltwlab
ltpow
ltfer
hrsmipric1
giprice
mci
ngca,output.
estimates
store
FD57Linear
regression Number
of
obs
=
420F(
9, 27)
=
902.61Prob
>
F =
0.0000R-squared =
0.5797RootMSE =
.11179(Std.
Err.
adjusted
for
28
clusters
in
province)D.ltvfoRobustCoef.
Std.Err.
t
P>|t| [95%
Conf.
Interval]ltlanD1..9807158
.0926143
10.59
0.000
.790687
1.170745ltwlabD1..2420082
.0734117
3.30
0.003
.0913798
.3926366ltpowD1.-.0171023
.0747984 -0.23
0.821 -.170576
.1363714ltferD1..2768317
.0589799
4.69
0.000
.155815
.3978485hrsD1..2427773
.0372382
6.52
0.000
.1663709
.3191837mipric1D1..0250908
.0357935
0.70
0.489 -.0483513
.0985329gipriceD1.-.0157708
.021774 -0.72
0.475 -.0604473
.0289057mciD1..1314675
.1260309
1.04
0.306 -.1271266
.3900616ngcaD1.-.0260777
.4846049 -0.05
0.957 -1.020405
.9682494Wooldridge
test
for
autocorrelation
in
panel
data
H0:no
first-order
autocorrelationF(
1, 27)
=
12.511
58Prob
>
F
=
0.001559一階差分估計量(FD)的估計系數(shù)與組內(nèi)估計量(FE)有一定差別。FE
比 FD
更有效率,故較少使用 FD。也可在固定效應(yīng)模型中考慮時間效應(yīng),即雙向固定效應(yīng)
(Two-way
FE),以捕捉技術(shù)進步等效應(yīng)。為節(jié)省待估參數(shù),首先加入時間趨勢項(將估計結(jié)果記為
“FE_trend”):.
xtreg
ltvfo
ltlan
ltwlab
ltpow
ltfer
hrsmipric1
giprice
mci
ngca
t,fe
r.
estimates
store
FE_trend59Fixed-effects
(within)
regression Number
of
obs
=
476Group
variable:
province
Number
of
groups
=
28R-sq:
within
=
0.8749
Obs
per
group:
min
=
17between
=
0.6490
avg
=
17.0overall
=
0.7006
max
=
17F(10,27)
=
247.93corr(u_i,
Xb) =
-0.3767
Prob
>
F
=
0.0000(Std.
Err.
adjusted
for
28
clusters
in
province)ltvfoRobustCoef.
Std.
Err.
t
P>|t| [95%
Conf.
Interval]ltlan.6517195
.1843858
3.53
0.001
.2733911
1.030048ltwlab.1431791
.0589267
2.43
0.022
.0222716
.2640866ltpow.0366317
.0991178
0.37
0.715 -.1667413
.2400047ltfer.180359
.0428995
4.20
0.000
.0923365
.2683816hrs.1916276
.0295596
6.48
0.000
.1309763
.2522789mipric1.0198772
.0515121
0.39
0.703 -.0858168
.1255713giprice-.026268
.0226875 -1.16
0.257 -.0728189
.0202829mci.2014685
.078794
2.56
0.016
.0397965
.3631404ngca.6761116
.421738
1.60
0.121 -.1892234
1.541447t.0063068
.0106492
0.59
0.559 -.0155436
.0281572_cons2.36174
.8262751
2.86
0.008
.6663633
4.057116sigma_usigma_e趨勢項rho.30327958.10589784t
.并89132不628
顯(fra著ction,of而var主iance要due
變to量u_i的)
顯著性不變。時間59其次,加入年度虛擬變量。為演示目的,定義年度虛擬變量:.
tab
year,gen(year)此yearFreq.PercentCum.70285.565.5671285.5611.1172285.5616.6773285.5622.2274285.5627.7875285.5633.3376285.5638.8977285.5644.4478285.5650.0079285.5655.5680285.5661.1181285.5666.6782285.5672.2283285.5677.7884285.5683.3385285.5688.8986285.5694.4487285.56100.00命令To將tal生成時5間04
虛擬10變0.00
量 year1,year2,…,year18。59加入年度虛擬變量后,由于價格變量 mipric1
與 giprice
在各省都一樣,無法包括在回歸方程中,以避免嚴格多重共線性。進行含時間虛擬變量的雙向固定效應(yīng)估計(將結(jié)果記為
“FE_TW”):.
xtreg
ltvfo
ltlan
ltwlab
ltpow
ltfer
hrs
mci
ngcayear2-year18,fe
r.
estimates
store
FE_TWnote:
year11
omitted
because
of
collinearity476
Group
variable:28R-sq:
within
=
0.8932 Obsper
group:
min=
17between=
0.6596
avg=
17.0overall=
0.7156
max=
17F(23,27)
=
949.82corr(u_i,
Xb)
=-0.3425 Prob>=
0.0000(Std.
Err.
adjusted
for
28
clusters
in
province)Fixed-effects
(within)
regressionNumber
ofobs=province Number
ofgroups
=FRobustltvfoCoef.Std.Err.t
P>|t| [95%Conf.
Interval]ltlan.5833594.1514909.0971114.1693346.1503752.1978373.7784081-.0240404-.1323624-.0377336.0058554.0096731-.0476465-.0869336.1745834.0585107.090911.0438098.0587581.0810587.4016301.023366.0404832.0357883.0500774.0566898.061423.06805793.34
0.002
.2251439
.94157492.59
0.015
.0314368
.2715451.07
0.295 -.0894225
.28364533.87
0.001
.0794444
.25922482.56
0.016
.0298136
.27093682.44
0.022
.0315186
.3641561.94
0.063 -.0456688
1.602485-1.03
0.313 -.0719836
.0239027-3.27
0.003 -.2154272 -.0492977-1.05
0.301 -.111165
.03569790.12
0.908 -.096895
.10860580.17
0.866 -.1066448
.1259911-0.78
0.445 -.1736761
.0783832-1.28
0.212 -.2265767
.0527096ltwlabltpowltferhrsmcingcayear2year3year4year5year6year7year8year9year10year11year12year13year14year15year16year17year18_cons64year1(1970年)作為基期,不包括在上述回歸命令中。1980
年的 hrs
數(shù)據(jù)缺失,故 year11(1980
年)也被去掉。在雙向固定效應(yīng)模型中,hrs
也在 5%水平上顯著為正。大多數(shù)的年度虛擬變量均不顯著 (但 year3
在 1%水平上顯著)。檢驗所有年度虛擬變量的聯(lián)合顯著性:.
test
year2
year3
year4
year5
year6
year7
year8year9
year10
year12
year13
year14
year15
year16year17
year186427)
=Prob
>
F
=14.820.0000(
1) year2
=
0(
2) year3
=
0(
3) year4
=
0(
4) year5
=
0(
5) year6
=
0(
6) year7
=
0(
7) year8
=
0(
8) year9
=
0(
9) year10
=
溫馨提示
- 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
- 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
- 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
- 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負責。
- 6. 下載文件中如有侵權(quán)或不適當內(nèi)容,請與我們聯(lián)系,我們立即糾正。
- 7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。
最新文檔
- 2025年度交通安全知識普及與駕駛技能培訓(xùn)合同
- 企業(yè)并購居間合同委托書
- 二零二五年度辦公室勞動合同地址確認及員工離職補償協(xié)議
- 三農(nóng)田灌溉方案與實施手冊
- 汽車維修保養(yǎng)規(guī)范手冊
- 醫(yī)療器械產(chǎn)品采購合同
- 石材購銷合同補充合同
- 合作收購不良資產(chǎn)協(xié)議
- 人力資源管理勞動法律法規(guī)遵守作業(yè)指導(dǎo)書
- 企業(yè)并購交易操作指導(dǎo)書
- 七年級數(shù)學新北師大版(2024)下冊第一章《整式的乘除》單元檢測習題(含簡單答案)
- 2024年財政部會計法律法規(guī)答題活動題目及答案一
- 定向鉆出入土點平面布置圖(可編輯)
- 生理產(chǎn)科學-正常分娩期的護理(助產(chǎn)學課件)
- 高考日語基礎(chǔ)歸納總結(jié)與練習(一輪復(fù)習)
- 煤場用車輛倒運煤的方案
- PPK計算模板完整版
- 居民自建房經(jīng)營業(yè)態(tài)不超過三種承諾書
- 河南省陜州區(qū)王家后鄉(xiāng)滹沱鋁土礦礦產(chǎn)資源開采與生態(tài)修復(fù)方案
- 中國高血壓臨床實踐指南(2022版)解讀
- 最常用漢字5000個
評論
0/150
提交評論