面板數(shù)據(jù)-計量經(jīng)濟學及Stata應(yīng)用_第1頁
面板數(shù)據(jù)-計量經(jīng)濟學及Stata應(yīng)用_第2頁
面板數(shù)據(jù)-計量經(jīng)濟學及Stata應(yīng)用_第3頁
面板數(shù)據(jù)-計量經(jīng)濟學及Stata應(yīng)用_第4頁
面板數(shù)據(jù)-計量經(jīng)濟學及Stata應(yīng)用_第5頁
已閱讀5頁,還剩79頁未讀 繼續(xù)免費閱讀

下載本文檔

版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進行舉報或認領(lǐng)

文檔簡介

?陳強,2015年,《計量經(jīng)濟學及

Stata應(yīng)用》,高等教育出版社。第12章面板數(shù)據(jù)4312.1

面板數(shù)據(jù)的特點面板數(shù)據(jù)(panel

data

或 longitudinal

data),指在一段時間內(nèi)跟蹤同一組個體(individual)的數(shù)據(jù)。它既有橫截面維度(n

位個體),又有時間維度(T

個時期)。一個T

3的面板數(shù)據(jù)結(jié)構(gòu)如表 12.1。43表

12.1面板數(shù)據(jù)的結(jié)構(gòu)yx1x2x3個體

1:t

=

1個體

1:t

=

2個體

1:t

=

3個體

2:t

=

1個體

2:t

=

2個體

2:t

=

3個體n:t

=

1個體n:t

=

2個體n:t

=

343通常的面板數(shù)據(jù)T較小,n較大,在使用大樣本理論時讓n趨于無窮大,稱為“短面板”(short

panel)。如果T較大,n較小,則稱為“長面板”(long

panel)。在面板模型中,如果解釋變量包含被解釋變量的滯后值,稱為

“動態(tài)面板”(dynamic

panel);反之,稱為“靜態(tài)面板”(static

panel)。本書僅關(guān)注靜態(tài)面板。在面板數(shù)據(jù)中,如果每個時期在樣本中的個體完全一樣,則稱為“平衡面板”(balanced

panel);反之,則稱為“非平衡面板”(unbalanced

panel)。主要關(guān)注平衡面板,但在本章第 11

節(jié)討論非平衡面板。43面板數(shù)據(jù)的主要優(yōu)點如下。有助于解決遺漏變量問題:遺漏變量常由不可觀測的個體差異或“異質(zhì)性”(heterogeneity)造成(比如個體能力)。如果個體差異“不隨時間而改變”(time

invariant),則面板數(shù)據(jù)提供了解決遺漏變量問題的又一利器。提供更多個體動態(tài)行為的信息:面板數(shù)據(jù)有橫截面與時間兩個維度,可解決截面數(shù)據(jù)或時間序列不能解決的問題。43例 如何區(qū)分規(guī)模效應(yīng)與技術(shù)進步對企業(yè)生產(chǎn)效率的影響。截面數(shù)據(jù)沒有時間維度,無法觀測到技術(shù)進步。單個企業(yè)的時間序列數(shù)據(jù),也無法區(qū)分生產(chǎn)效率提高有多少由于規(guī)模擴大,有多少由于技術(shù)進步。例 對于失業(yè)問題,截面數(shù)據(jù)告訴我們在某個時點上哪些人失業(yè),時間序列告訴我們某個人就業(yè)與失業(yè)的歷史,但均無法告訴我們是否失業(yè)的總是同一批人(低流轉(zhuǎn)率),還是失業(yè)的人群總在變動(高流轉(zhuǎn)率)。如有面板數(shù)據(jù),就可能解決上述問題。(3)樣本容量較大:同時有截面與時間維度,面板數(shù)據(jù)的樣本容量通常更大,可提高估計精度。43面板數(shù)據(jù)也會帶來問題。樣本數(shù)據(jù)通常不滿足 iid

假定,因為同一個體在不同期的擾動項一般存在自相關(guān)。面板數(shù)據(jù)的收集成本通常較高,不易獲得。12.2

面板數(shù)據(jù)的估計策略一個極端策略是,將面板看成截面數(shù)據(jù)進行混合回歸(pooledregression),即要求樣本中每位個體擁有完全相同的回歸方程。混合回歸的缺點是,忽略個體不可觀測的異質(zhì)性(heterogeneity),而該異質(zhì)性可能與解釋變量相關(guān),導(dǎo)致估計不一致。43另一極端策略是,為每位個體估計單獨的回歸方程。分別回歸的缺點是,忽略個體的共性,可能沒有足夠大的樣本容量。實踐中常采用折衷的策略,即假定個體的回歸方程擁有相同的斜率,但可有不同截距項,以捕捉異質(zhì)性(參見圖 12.1)。圖

12.1 面板數(shù)據(jù)中不同個體的截距項可以不同4343這種模型稱為“個體效應(yīng)模型”(individual-specific

effects

model(i

u1, ,

n;

ti

it1, ,T

)yit

xi

t

zi(12.zi

為不隨時間而變(time

invariant)的個體特征(zit別;zi

,

t),比如xit

可以隨個體及時間而變(time-varying)。擾動項由(ui it

)

兩部分構(gòu)成,稱為“復(fù)合擾動項”(compositeerror

term)。不可觀測的隨機變量ui

是代表個體異質(zhì)性的截距項,即“個體效應(yīng)”(individual

effects)。43it

為隨個體與時間而改變的擾動項,稱為“idiosyncratic

error”。一般假設(shè){

it

}為獨立同分布,且與ui

不相關(guān)。如果ui

與某個解釋變量相關(guān),則進一步稱為“固定效應(yīng)模型”(Fixed

Effects

Model,簡記 FE)。此時 OLS

不一致。解決方法是轉(zhuǎn)換模型,消去ui

獲得一致估計。如果ui

與所有解釋變量(

xit

,

zi

)

均不相關(guān),則進一步稱為“隨機效應(yīng)模型”(Random

Effects

Model,簡記 RE)。與橫截面數(shù)據(jù)相比,面板數(shù)據(jù)提供了更豐富的模型與估計方法。4312.3

混合回歸如果所有個體都擁有完全一樣的回歸方程,則u1

u2將相同的個體效應(yīng)統(tǒng)一記為,方程(12.1)可寫為:un

。yitxi

t

zi it

(12.2)其中,xit

不包括常數(shù)項。把所有數(shù)據(jù)放在一起,像橫截面數(shù)據(jù)那樣進行 OLS

回歸,故稱“混合回歸”(pooled

regression)。雖可假設(shè)不同個體的擾動項相互獨立,但同一個體在不同時期的擾動項之間往往自相關(guān)。43每位個體不同時期的所有觀測值構(gòu)成一個“聚類”(cluster)。樣本觀測值可分為不同的聚類,在同一聚類里的觀測值互相相關(guān),不同聚類之間的觀測值不相關(guān),稱為“聚類樣本”(clustersample)。對于聚類樣本,仍可進行 OLS

估計,但需使用“聚類穩(wěn)健的標準誤”(cluster-robust

standard

errors),形式上也是夾心估計量,表達式更為復(fù)雜。對于樣本容量為nT

的平衡面板,共有n

個聚類,而每個聚類中包含T

期觀測值。43使用聚類穩(wěn)健標準誤的前提是,聚類中的觀測值數(shù)目T

較小,而聚類數(shù)目n較大(n

);此時聚類穩(wěn)健標準誤是真實標準誤的一致估計。聚類穩(wěn)健標準誤更適用于時間維度

T

比截面維度n小的短面板。在推導(dǎo)過程中未假定同方差,故聚類穩(wěn)健標準誤也是異方差穩(wěn)健的。混合回歸的基本假設(shè)是不存在個體效應(yīng),對此須進行統(tǒng)計檢驗,在下文介紹。12.4

固定效應(yīng)模型:組內(nèi)估計量考慮固定效應(yīng)模型:zyit

xi

t

i

i(12u.3)it其中,ui

與某解釋變量相關(guān),故OLS不一致。解決方法:通過模型變換,消掉個體效應(yīng)ui

。給定個體i,方程兩邊對時間取平均:yi

xizi

ui的定義類似。i(12.4)T143Tit

t1其中,yiiiy,x與43將原方程減去平均方程(12.4),可得離差形式:yityi

(

xit

xi

)(iti

)

(12.5)i

,則zi

與ui

被消去。定義

yit

yit

yi

,

xit

xitxi,itiyitxi

tit(12.6)只要新擾動項

it

與新解釋變量x

it

不相關(guān),則 OLS

一致,稱為“效應(yīng)估計量”(Fixed

Effects

Estimator),記為

?FE

。?FE

主要使用每位個體的組內(nèi)離差信息,也稱“組內(nèi)估計量”

(within

estimator)。43即使ui

與xit

相關(guān),只要使用組內(nèi)估計量,即可得一致估計,這是面板數(shù)據(jù)的一大優(yōu)勢。由于可能存在組內(nèi)自相關(guān),應(yīng)使用以每位個體為聚類的聚類穩(wěn)健標準誤。在離差變換過程中,

zi

也消掉,無法估計

。?

無法估計不隨時間而變的變量之影響,這是 FE

的一大缺點。FEit為保證(

i

)與(

xitxi

)不相關(guān),須假定個體

i

滿足嚴格外生it

xi1,(比前定變量或同期外生的假定更強),即E( ,

xiT

)0,因為xi

中包含了所有(

xi1, ,

xiT

)的信息。4312.5

固定效應(yīng)模型:LSDV法個體固定效應(yīng)ui

,傳統(tǒng)上視為個體

i

的待估參數(shù),即個體

i

的截距項。對于n位個體的n個不同截距項,可在方程中引入(n擬變量來體現(xiàn):n1)個個體虛y

x

zit

i

t

i

i

i

it(12.7)Di

2其中,個體虛擬變量D2

=1,如果為個體 2;否則,D2

=

0。其他(D3

,

,Dn

)的定義類似。用 OLS

估計此方程,稱為“最小二乘虛擬變量法”(Least

SquareDummy

Variable,LSDV)。43LSDV

法的估計結(jié)果與組內(nèi)估計量 FE

完全相同。正如線性回歸與離差形式的回歸在某種意義上等價(參見習題):yi

xiiyiy

(xi

x

)

(

i

)

(12.8做完 LSDV

后,如發(fā)現(xiàn)某些個體的虛擬變量不顯著而刪去,則LSDV

的結(jié)果就不會與 FE

相同。LSDV的好處是,可得到對個體異質(zhì)性ui

的估計。LSDV

法的缺點是,如果n

很大,須在回歸方程中引入很多虛擬變量,可能超出 Stata

所允許的變量個數(shù)。4312.6

固定效應(yīng)模型:一階差分法對于固定效應(yīng)模型,還可對原方程兩邊進行一階差分,消去個體效應(yīng)ui

:(i,

t

it

1

)yit

yi,

t

1

(

xit,

t1

)

(12.9)使用

OLS(First即得到“一階差分估計量”Differencing Estimator),記為

?FD

。只要擾動項的一階差分(

it i,

t

1

)

與解釋變量的一階差分xi,

t(xit

1

)不相關(guān),則?FD

一致。此一致性條件比保證?FE

一致的嚴格外生性假定更弱。43可以證明(參見習題),如果T

2,則?FD?FE

。對于T

2,如果實踐中,主要用it為獨立同分布,則?

?

更有效率。FE

FD?

,較少用

?

。FE

FD12.7

時間固定效應(yīng)個體固定效應(yīng)模型解決了不隨時間而變(time

invariant)但隨個體而異的遺漏變量問題。還可能存在不隨個體而變(individual

invariant),但隨時間而變

(time

varying)的遺漏變量問題。比如,企業(yè)經(jīng)營的宏觀經(jīng)濟環(huán)境。43在個體固定效應(yīng)模型中加入時間固定效應(yīng)(

t

):(12.1u0)t

izyit

xi

t

iit其中,

t

隨時間而變,但不隨個體而變。T可視

t

為第t

期特有的截距項,并解釋為“第t

期”對y

的效應(yīng);故稱

1,

,

為“時間固定效應(yīng)”(time

fixed

effects)。使用 LSDV

法,對每個時期定義一個虛擬變量,把(T

1)個時間虛擬變量包括在回歸方程中:Tyitxi

tzit

ti(12D.11)uitt

243時間虛擬變量D2

1,如果t

2;否則, D2

=

0;以此類推。方程(12.11)既考慮了個體固定效應(yīng),又考慮了時間固定效應(yīng),稱為“雙向固定效應(yīng)”(Two-way

FE)??赏ㄟ^檢驗這些時間虛擬變量的聯(lián)合顯著性來判斷是否應(yīng)使用雙向固定效應(yīng)模型。如果僅考慮個體固定效應(yīng),稱為“單向固定效應(yīng)”(One-way

FE)。有時為節(jié)省參數(shù)(比如,時間維度T較大),可引入時間趨勢項,以替代上述(T

1)個時間虛擬變量:yititxi

t

zi

t

ui

(12.12)43上式隱含假定,每個時期的時間效應(yīng)相等,即每期均增加

。如果此假定不太可能成立,應(yīng)在方程中加入時間虛擬變量。12.8

隨機效應(yīng)模型考慮隨機效應(yīng)模型:yitxi

t

zi

ui

it

(12.13)其中,個體效應(yīng)ui

與解釋變量均不相關(guān),故 OLS

一致。由于擾動項由(ui it

)

組成,不是球型擾動項,故 OLS

不是最有效率的。43假設(shè)不同個體之間的擾動項互不相關(guān)。由于ui

的存在,同一個體不同時期的擾動項之間仍存在自相關(guān)。對于t

s,可證明Cov(uiit

,

uiis

)Cov(ui

,

ui

)00C

o

v

(

ui

,Var(u

)20iu(12.14)其中,2Var(u

)為個體效應(yīng)u的方差。i

iu43如果t

s

,則Var(u2i)2(12.15)itu2其中,

Var( )為的方差(不隨i,t變化)。it

it當t

s時,個體i

擾動項的自相關(guān)系數(shù)為i

it

uit

,

ui is

)22Co

rr(uiCov(iu

it

i,

u

u)Vairs

(u)2(12.16)自相關(guān)系數(shù)

越大,則復(fù)合擾動項(ui it

)

中個體效應(yīng)的部分(ui

)越重要。Stata記為“rho”。由于擾動項(ui it

)

存在組內(nèi)自相關(guān),故 OLS

不是最有效率的。使用 GLS

轉(zhuǎn)換原模型,使變換后擾動項無自相關(guān)。定義u431(T22

)1

2(12.17)其中,T

為面板數(shù)據(jù)的時間維度。顯然,0 1。給定個體i

,將方程(12.13)兩邊對時間進行平均,然后同乘

:yi

xi

zi

uii(12.18)43將

程 (12.13)

程 (12.18)

”(quasi-demeaned)模型:yit)z擾動項y

(

x x

)i

it

i(1i(1(21.19))ui(由于0差”。1,故(yityi

)只是減去yi

的一部分,故名“廣義離廣義離差方程的擾動項

(1)u

(iiti)

不再有自相此 方程進行 OLS

估計,即為 GLS

估計量。但 通常未知,須先估計

?,再進行 FGLS

估計??捎孟率絹砉烙?/p>

?:?43?

1(Tu

?

2(12.20)?

2

)1

2其中,

?u

與?分別為

u

與的樣本估計值。Stata

分別記

?u

、?與

?為“sigma_u”、“sigma_e”與“thet對于隨機效應(yīng)模型,由于 OLS

一致,且其擾動項為(ui it

),故2可用 OLS

的殘差估計(

2

)。u差另估一計方面2

。,F(xiàn)E也一致,且其擾動項為(iti

),故可用 FE

的殘43由此得到

?,再用 FGLS

估計原模型,可得“隨機效應(yīng)估計量”(Random

Effects

Estimator),記為

?RE

。如假設(shè)擾動項服從正態(tài)分布,可進行最大似然估計(MLE)。12.9

組間估計量對于隨機效應(yīng)模型,還可使用“組間估計量”。如每位個體的時間序列數(shù)據(jù)較不準確或噪音較大,可對每位個體取時間平均值,然后用平均值作橫截面回歸:(i

u1, ,

n)i

iyi

xi

zi(12.21)對上式用 OLS,即為“組間估計量”(Between

Estimator),記

?BE

。43由于 x

,

z 包含

x

,

z 的信息,如u

與x

,z

相關(guān),it

ii

i

it

i

i致。故不能在固定效應(yīng)模型下使用組間估計法。即使在隨機效應(yīng)模型下,由于面板數(shù)據(jù)被壓縮為截面數(shù)據(jù),損失較多信息量,組間估計法也不常用。12.10

擬合優(yōu)度的度量對于面板模型,如使用混合回歸,可直接用混合回歸的R2

衡量擬合優(yōu)度。如使用固定效應(yīng)或隨機效應(yīng),擬合優(yōu)度的度量略復(fù)雜。43對于有常數(shù)項的線性回歸模型,擬合優(yōu)度R2

等于被解釋變量y

與預(yù)測值y?

之間相關(guān)系數(shù)的平方,即R2

[corr(

y,

y?)]2

。給定估計量(

?, ?)

,Stata

提供了以下三種R2

。z

?

2(1) 對應(yīng)于原模型(12.1),稱[Corr(

y

,?x

)]

為“整體2

R

”it

it

i(

R2

overall),衡量估計量(

?, ?)

對原模型的擬合優(yōu)度。it

it2(2)

對應(yīng)于組內(nèi)模型(12.6)

,稱[Corr(

y

,

?x

)]

為“組2內(nèi)

R

”(

R2

within),衡量估計量(

?, ?)

對組內(nèi)模型的擬合優(yōu)度。z?

2(3)

對應(yīng)于組間模型(12.21),[稱Corr(

y

,

x?

)]

為“組2間R

”i

i

i(

R2

between),衡量估計量(

?, ?)

對組間模型的擬合優(yōu)度。43無論固定效應(yīng)、隨機效應(yīng)還是組間回歸,都可計算這三種R2

。對于固定效應(yīng)模型,建議使用組內(nèi)R2

;對于組間回歸模型,建議使用組間R2

。對于隨機效應(yīng)模型,這三種R2

都只是相應(yīng)的相關(guān)系數(shù)平方而已

(并非隨機效應(yīng)模型廣義離差回歸的R2

)。12.11

非平衡面板在面板數(shù)據(jù)中,如每個時期在樣本中的個體完全一樣,稱為“平衡面板數(shù)據(jù)” (balanced

panel)。但有時某些個體的數(shù)據(jù)可能缺失(比如,個體死亡、企業(yè)倒閉或43被兼并、個體不再參與調(diào)查),或者新個體在后來才加入到調(diào)查中來。如每個時期觀測到的個體不完全相同,稱為“非平衡面板”

(unbalanced

panel)或“不完全面板”(incomplete

panel)。非平衡面板數(shù)據(jù)不影響計算離差形式的組內(nèi)估計量(withinestimator),固定效應(yīng)模型的估計可照樣進行。對于隨機效應(yīng)模型,非平衡面板數(shù)據(jù)也無實質(zhì)影響。假設(shè)個體i的時間維度為Ti

,只要在做廣義離差變換時,為每位個體定義i

?

143?u?

2(Ti(12.22)?

2

)1

2即可照常進行 FGLS

估計。非平衡面板可能出現(xiàn)的最大問題是,那些原來在樣本中但后來

丟掉的個體,如果“丟掉”的原因內(nèi)生(與擾動項相關(guān)),則會導(dǎo)致樣本不具有代表性(不再是隨機樣本),導(dǎo)致估計量不一致。比如,低收入人群更易從面板數(shù)據(jù)中丟掉。如果從非平衡面板數(shù)據(jù)中提取一個平衡的面板數(shù)據(jù)子集,則必然會損失樣本容量,降低估計效率。如人為“丟掉”個體并非完全隨機,同樣會破壞樣本的隨機性。4312.12

究竟該用固定效應(yīng)還是隨機效應(yīng)模型處理面板數(shù)據(jù),究竟使用固定效應(yīng)還是隨機效應(yīng)是根本問題。檢驗原假設(shè)“ H0

:ui

與xit

,

zi

不相關(guān)”(隨機效應(yīng)為正確模型)。如果H0

成立,則 FE

與RE

都一致,但 RE

比 FE

更有效率。如果H0

不成立,則 FE

一致,而 RE

不一致。如果H0

成立,則 FE

與 RE

估計量將共同收斂于真實的參數(shù)值,二者的差距將在大樣本下消失,故(

??0

。)pFE

RE反之,如果二者的差距過大,則傾向于拒絕原假設(shè)。43以二次型度量此距離,豪斯曼檢驗(Hausman,

1978)的統(tǒng)計量為(

?FE

?RE?其中,K

為FE?RE1?)

VFEar?(

RE

())d2

(K

)(12.?FE

的維度,即xit

中隨時間而變的解釋變量個數(shù)。如果該統(tǒng)計量大于臨界值,則拒絕H0

。Var(此檢驗的缺點是,為計算

?FE RE

)

?,假設(shè)在H

0成立情況下,?RE

是最有效率的(fully

efficient)。但如果擾動項存在異方差,則?RE

并非最有效率。43傳統(tǒng)的豪斯曼檢驗不適用于異方差的情形,須使用異方差穩(wěn)健的豪斯曼檢驗(參見下文)。面板模型的Stata命令及實例面板數(shù)據(jù)的設(shè)定設(shè)定面板數(shù)據(jù)的 Stata

命令為xtset

panelvar

timevar命令“xtset”告訴 Stata

你的數(shù)據(jù)為面板數(shù)據(jù)。面板(個體)變量“panelvar”的取值須為整數(shù)且不重復(fù),相當于將樣本中每位個體進行編號。43“timevar”為時間變量。假如“panelvar”本來是字符串(比如,國家名字 country),可用以下命令轉(zhuǎn)換為數(shù)字型變量:encode

country,

gen(cntry)選擇項“gen(cntry)”表示將新生成的數(shù)字型變量記為 cntry。這樣,變量 cntry

就以“1,

2,

3, …”來指代不同的國家。顯示面板數(shù)據(jù)統(tǒng)計特性的 Stata

命令:xtdes (顯示面板數(shù)據(jù)的結(jié)構(gòu),是否為平衡面板)xtsum (顯示組內(nèi)、組間與整體的統(tǒng)計指標)43xtline

varname(對每位個體分別顯示該變量的時間序列圖;如希望將所有個體的時間序列圖疊放在一起,可加上選擇項

overlay)以數(shù)據(jù)集 lin_1992.dta

為例,取自 Lin(1992)對家庭聯(lián)產(chǎn)承包責任制(household

responsibility

system)與中國農(nóng)業(yè)增長的經(jīng)典研究。該省際面板包含中國 28

個省 1970—1987

年有關(guān)種植業(yè)的數(shù)據(jù)。被解釋變量為“種植業(yè)產(chǎn)值對數(shù)”(ltvfo,1980

年不變價格)。解釋變量包括:耕地面積對數(shù)(ltlan,千畝),種植業(yè)勞動力(ltwlab),機械動力與畜力對數(shù)(ltpow,千馬力),化肥使用量對數(shù)

(ltfer,千噸),截止年底采用家庭聯(lián)產(chǎn)承包制的生產(chǎn)隊比重(hrs),43農(nóng)村消費者價格與農(nóng)村工業(yè)投入品價格之比的一階滯后(mipric1,1950年=100),超額收購價格與農(nóng)村工業(yè)投入品價格之比(giprice,1950 年=100),復(fù)種指數(shù)(mci,播種面積除以耕地面積),非糧食作物占播種面積比重(ngca),時間趨勢(t),province(省),year(年)。為解決異方差問題,Lin

(1992)將種植業(yè)產(chǎn)量、耕地面積、種植業(yè)勞動力、機械動力與畜力、化肥使用量這些傳統(tǒng)的投入與產(chǎn)出變量都除以每省的生產(chǎn)隊數(shù)目(team)。兩個價格變量 mipric1

與 giprice

為全國性指標,各省都一樣,只隨時間變化。首先,設(shè)定 province

與 year

為面板(個體)變量及時間變量:.

use

lin_1992.dta,clear.

xtset

province

yearpanel

variable:time

variable:delta:province

(strongly

balanced)year,

70

to

871

unit這是一個平衡的面板數(shù)據(jù)(strongly

balanced)。其次,顯示數(shù)據(jù)集的結(jié)構(gòu):.

xtdesprovince:431,

2,

..Delta(year)

=

1

unitSpan(year) =

18

periods(province*year

uniquely

identifies

each

observation)T_i:min5%25%50%75%181818Freq.PercentCum.Pattern28100.00100.0011111111111111111128100.00XXXXXXXXXXXXXXXXXX43上表顯示,n

28,而T

18。n

大而T

小,故是短面板。顯示數(shù)據(jù)集中以上變量的統(tǒng)計特征:.

xtsum

ltvfo

ltlan

ltwlab

ltpow

ltfer

hrs

mipric1giprice

mci

ngcaVariableMeanStd.Dev.MinMaxObservationsltvfooverall7.647758.53319995.519.33N=504between.46119926.9822228.977222n=28within.28068885.614988.471647T=18ltlanoverall5.837877.80848664.577.76N=504between.81430364.6172227.697778n=28within.11388924.7589886.163988T=18ltwlaboverall3.19752.4193496.983.86N=504between.31957152.3038893.646111n=28within.27781231.6186314.053631T=18ltpowoverall2.692778.9463811.25.04N=504between.77020361.4754.180556n=28within.5678668.313.909444T=18ltferoverall2.15119.7903761-.233.98N=504between.56249351.0811113.649444n=28within.564791.41730163.510079T=18hrsoverall.3497479.452628301N=476between.0453814.2123529.4094118n=28within.4504245-.05966391.053866T=17mipric1overall2.248889.24313791.762.73N=504between02.2488892.248889n=28within.24313791.762.73T=18gipriceoverall2.858889.45375782.393.56N=504between02.8588892.858889n=28within.45375782.393.56T=18mcioverall1.538452.4931854.852.55N=504between.4972044.86666672.487222n=28within.06614121.3234521.880119T=18ngcaoverall.199623.07614543.06.91N=504between.0631671.1144444.3466667n=28within.0440777.1151786.8951786T=1843除 hrs

外,所有變量的觀測樣本均為2818 504。關(guān)鍵變量 hrs

的樣本容量僅為28hrs

觀測數(shù)據(jù)。17 476,因為缺失 1980

年的看被解釋變量 ltvfo

在 28

個省的時間趨勢圖,如圖 12.2。.

xtline

ltvfo圖 12.2

28

省種植業(yè)產(chǎn)值的時間趨勢圖4343不同省的種植業(yè)產(chǎn)值均隨時間而增長,但變化趨勢與時機不盡相同。種植業(yè)產(chǎn)值的省際差異有助于估計決定種植業(yè)產(chǎn)值的因素。

2.混合回歸作為參照系,首先進行混合回歸。Stata命令的基本格式為reg

y

x1

x2

x3,vce(cluster

id)其中,“id”指用來確定每位個體的變量。選擇項“vce(cluster

id)”表示以變量 id

作為聚類變量來計算聚類穩(wěn)健的標準誤。43.

reg

ltvfo

ltlan

ltwlab

ltpow

ltfer

hrs

mipric1giprice

mci

ngca,vce(cluster

province)選

“ vce(cluster

province)

,

使

以“province”為聚類變量的聚類穩(wěn)健標準誤。將此結(jié)果儲存,并記為“OLS”。.

estimates

store

OLS43ltvfoCoef.RobustStd.

Err.tP>|t|[95%

Conf.Interval]ltlan.693795.1150246.030.000.4577853.9298048ltwlab.2650224.05662944.680.000.1488285.3812164ltpow-.0291884.0670385-0.440.667-.1667401.1083633ltfer.3110617.05313185.850.000.2020443.4200792hrs.2286926.04894584.670.000.1282642.329121mipric1.0122048.05477990.220.825-.1001943.1246039giprice-.0538892.0274468-1.960.060-.1102054.002427mci.6949202.16896924.110.000.34822411.041616ngca.3053056.52226390.580.564-.76629141.376903_cons1.080587.82698881.310.202-.61625442.777427(Std.

Err.

adjusted

for

28

clusters

in

province)R-squaredRoot

MSE==0.8685.19689Number

of

obs

=F(

9,Prob

>

FLinear

regression27)

=47681.39=

0.0000關(guān)鍵變量 hrs

在 1%水平上顯著為正。SourceSSdf

MSNumber

of

obs

=

476F(

9,

466)

=

342.09Model119.3559649

13.2617737Prob

>

F

=

0.0000Residual18.0652415466

.038766613R-squared

=

0.8685Adj

R-squared

=

0.8660Total137.421205475

.2893078Root

MSE

=

.19689ltvfoCoef.Std.

Err.

tP>|t|[95%

Conf.

Interval]ltlan.693795.0368914

18.810.000.6213008

.7662892ltwlab.2650224.0238406

11.120.000.2181741

.3118708ltpow-.0291884.0331891 -0.880.380-.0944073

.0360305ltfer.3110617.0206459

15.070.000.2704911

.3516324hrs.2286926.0307121

7.450.000.1683412

.289044mipric1.0122048.0533863

0.230.819-.0927028

.1171125giprice-.0538892.0271999 -1.980.048-.1073389 -.0004395mci.6949202.0522416

13.300.000.592262

.7975784ngca.3053056.1952732

1.560.119-.0784195

.6890306_cons1.080587.2832576

3.810.000.5239661

1.63720743如使用普通標準誤,則可輸入命令:.

reg

ltvfo

ltlan

ltwlab

ltpow

ltfer

hrs

mipric1giprice

mci

ngca43對比聚類穩(wěn)健標準誤與普通標準誤可知,前者大于后者。由于同一省不同年份之間的擾動項一般存在自相關(guān),而普通標準誤假設(shè)擾動項為獨立同分布,故普通標準誤的估計不準確。3.固定效應(yīng)由于每個省的“省情”不同,可能存在不隨時間而變的遺漏變量,考慮使用固定效應(yīng)模型(FE)。固定效應(yīng)模型(組內(nèi)估計量)的 Stata

命令格式為xtreg

y

x1

x2

x3,fe

r選擇項“fe”表示“fixed effects”(固定效應(yīng)估計量),默認為“re”表示“random

effects”(隨機效應(yīng)估計量)。43選擇項“ r

”表示使用聚類穩(wěn)健標準誤;如使用選擇項“vce(cluster

id)”也能達到相同效果。LSDV

法的 Stata

命令為reg

y

x1

x2

x3

i.id,vce(cluster

id)“id”表示用來確定個體的變量,“i.id”則表示根據(jù)變量

“id”而生成的虛擬變量。選擇項“vce(cluster

id)”表示使用聚類穩(wěn)健的標準誤。首先使用組內(nèi)估計量,并記其估計結(jié)果為“FE_robust”:.

xtreg

ltvfo

ltlan

ltwlab

ltpow

ltfer

hrsmipric1

giprice

mci

ngca,fe

r.

estimates

store

RE_robust43輸出Fixed-effects

(within)

regression Number

of

obs

=

476Group

variable:

province

Number

of

groups

=

28R-sq: within

=

0.8746

Obs

per

group:

min

=

17between

=

0.6483

avg

=

17.0overall

=

0.6993

max

=

17F(9,27)

=

274.25corr(u_i,

Xb) =

-0.3877

Prob

>

F

=

0.0000(Std.

Err.

adjusted

for

28

clusters

in

province)ltvfoRobustCoef.

Std.

Err.

t

P>|t| [95%

Conf.

Interval]ltlanltwlabltpowltferhrsmipric1gipricemcingca_cons.6370234

.1681335

3.79

0.001

.2920421

.9820048.1387786

.0624585

2.22

0.035

.0106242

.2669329.0577152

.0755568

0.76

0.452 -.0973146

.2127451.1826281

.043592

4.19

0.000

.0931846

.2720716.2134022

.0391104

5.46

0.000

.1331542

.2936501.0543577

.0590331

0.92

0.365 -.0667682

.1754837-.0151451

.0245968 -0.62

0.543 -.0656135

.0353233.1943697

.0770515

2.52

0.018

.0362731

.3524663.7562031

.3821261

1.98

0.058 -.0278549

1.5402612.337895

.8552224

2.73

0.011

.583124

4.092667sigma_usigma_e結(jié)果r包ho.30549743.10589274括.常8927數(shù)3901

項((fra_ctcioon

nosf

)v,arian是ce

du所e

有to

個u_i)體效應(yīng)ui

的平均值。43最后一行顯示,“rho=0.89”,故復(fù)合擾動項(ui主要來自個體效應(yīng)ui

的變動。it

)的方差究竟應(yīng)使用混合回歸還是個體固定效應(yīng)模型?在使用命令“xtreg,fe”時,如不加選擇項“r”(將估計結(jié)果記為“FE”),則輸出結(jié)果還包含一個F

檢驗,其原假設(shè)為“ H0

:所有ui

0

”,即可以接受混合回歸:.

xtreg

ltvfo

ltlan

ltwlab

ltpow

ltfer

hrsmipric1

giprice

mci

ngca,fe.

estimates

store

FE對于拒絕原Fixed-effects

(within)

regression=Number

ofNumber

ofF(9,439)obs=476Group

variable:

provincegroups=28R-sq: within

=

0.8746

Obs

per

group:

min

=17between

=

0.6483avg=17.0overall

=

0.6993max=17=3corr(u_i,

Xb) =

-0.3877 Prob

>

F0.0000ltvfoCoef.Std.

Err.tP>|t|[95%

Conf.

Inteltlan.6370234.06731919.460.000.5047156

.76ltwlab.1387786.02615545.310.000.0873732

.1ltpow.0577152.03325081.740.083-.0076352

.12ltfer.1826281.02199218.300.000.1394053

.2hrs.2134022.02238869.530.000.1694

.25mipric1.0543577.04216591.290.198-.0285145

.13giprice-.0151451.0187457-0.810.4200519876

.02mci.1943697.08768842.220.027.0220285

.3ngca.7562031.21681413.490.001.3300804

1.1_cons2.337895.3852536.070.0001.580726sigma_u原假設(shè)“sig所ma_e假設(shè),認為rho.30549743有u.1i0589274

0

”,最后一行F

檢驗的

p

值為 0.0000,故FE.892優(yōu)7390于1

(混frac合tion

o回f

var歸iance。due

to

u_i)F

test

that

all

u_i=0:=43.41F(27,

439)43Prob

>

F

=

0.000043由于未使用聚類穩(wěn)健標準誤,此F檢驗并不有效。進一步通過 LSDV

法來考察 (將估計結(jié)果記為“LSDV”):.

reg

ltvfo

ltlan

ltwlab

ltpow

ltfer

hrs

mipric1giprice

mci

ngca

vince,vce(cluster

province).

estimates

store

LSDVLinear

regressionNumberof

obs=476F(

8,

27)=.Prob

>

F=.R-squared=0.9642RootMSE=.10589(Std.Err.adjustedfor28

clusters

inprovince)RobustltvfoCoef.Std.Err.tP>|t|[95%Conf.Interval]ltlanltwlabltpowltfer

hrsmipric1gipricemcingcaprovincebeijingfujiangansuguangdongguangxiguizhouhebeiheilongjianghenanhubeihunanjiangsujiangxijilinliaoningneimongningxiaqinghaishaanxishangdongshanghaishanxisichuantianjin.6370234.17322673.680.001.2815916.9924553.1387786.06435062.160.040.0067421.2708151.0577152.07784570.740.465-.1020109.2174414.1826281.04491264.070.000.0904751.2747811.2134022.04029525.300.000.1307233.296081.0543577.06082140.890.379-.0704375.1791529-.0151451.0253419-0.600.555-.0671423.0368522.1943697.07938562.450.021.0314839.3572555.7562031.39370181.920.065-.05160631.564013-.1816498.1247829-1.460.157-.4376832.0743835.051657.05019161.030.313-.0513277.1546418-.8165674.1380808-5.910.000-1.099886-.5332489-.010488.055811-0.190.852-.1250028.1040268-.2304637.0570853-4.040.000-.3475932-.1133342-.2350768.0615353-3.820.001-.3613369-.1088167-.2923854.0997217-2.930.007-.4969974-.0877733-.1410195.2892268-0.490.630-.7344638.4524249-.0904581.0435714-2.080.048-.1798593-.0010569.1118905.03405843.290.003.0420085.1817725-.0373775.0607647-0.620.544-.1620563.0873014.1150954.03420583.360.002.0449109.18528-.1352577.0579781-2.330.027-.2542188-.0162965-.2220282.2253552-0.990.333-.6844189.2403624-.2789811.172656-1.620.118-.6332419.0752797-.9288069.2561317-3.630.001-1.454346-.403268-.8813594.1975659-4.460.000-1.286731-.4759877-.7062497.1521719-4.640.000-1.018481-.3940187-.3342067.0925991-3.610.001-.5242045-.144209-.0049215.0581511-0.50680.933-.1242377.1143947.113901.06486271.760.090-.0191862.2469882-.5312338.1514863-3.510.002-.8420581-.2204095.0251618.03207320.780.440-.040647.0909707-.3047612.1190042-2.560.016-.5489376-.0605848不少個體虛擬變量在 5%水平上顯著,可拒絕“所有個體虛擬變量都為 0”的原假設(shè),認為存在個體固定效應(yīng),不應(yīng)使用混合回歸。LSDV法的回歸系數(shù)與組內(nèi)估計量完全相同,但聚類穩(wěn)健的標準誤略有差別。對于固定效應(yīng)模型,也可使用一階差分法(FD)。Stata沒有專門執(zhí)行一階差分法的命令,但在使用命令“xtserial,output”對組內(nèi)自相關(guān)進行檢驗時,可附帶提供一階差分法的估計結(jié)果(將此結(jié)果記為“FD”):.

xtserial

ltvfo

ltlan

ltwlab

ltpow

ltfer

hrsmipric1

giprice

mci

ngca,output.

estimates

store

FD57Linear

regression Number

of

obs

=

420F(

9, 27)

=

902.61Prob

>

F =

0.0000R-squared =

0.5797RootMSE =

.11179(Std.

Err.

adjusted

for

28

clusters

in

province)D.ltvfoRobustCoef.

Std.Err.

t

P>|t| [95%

Conf.

Interval]ltlanD1..9807158

.0926143

10.59

0.000

.790687

1.170745ltwlabD1..2420082

.0734117

3.30

0.003

.0913798

.3926366ltpowD1.-.0171023

.0747984 -0.23

0.821 -.170576

.1363714ltferD1..2768317

.0589799

4.69

0.000

.155815

.3978485hrsD1..2427773

.0372382

6.52

0.000

.1663709

.3191837mipric1D1..0250908

.0357935

0.70

0.489 -.0483513

.0985329gipriceD1.-.0157708

.021774 -0.72

0.475 -.0604473

.0289057mciD1..1314675

.1260309

1.04

0.306 -.1271266

.3900616ngcaD1.-.0260777

.4846049 -0.05

0.957 -1.020405

.9682494Wooldridge

test

for

autocorrelation

in

panel

data

H0:no

first-order

autocorrelationF(

1, 27)

=

12.511

58Prob

>

F

=

0.001559一階差分估計量(FD)的估計系數(shù)與組內(nèi)估計量(FE)有一定差別。FE

比 FD

更有效率,故較少使用 FD。也可在固定效應(yīng)模型中考慮時間效應(yīng),即雙向固定效應(yīng)

(Two-way

FE),以捕捉技術(shù)進步等效應(yīng)。為節(jié)省待估參數(shù),首先加入時間趨勢項(將估計結(jié)果記為

“FE_trend”):.

xtreg

ltvfo

ltlan

ltwlab

ltpow

ltfer

hrsmipric1

giprice

mci

ngca

t,fe

r.

estimates

store

FE_trend59Fixed-effects

(within)

regression Number

of

obs

=

476Group

variable:

province

Number

of

groups

=

28R-sq:

within

=

0.8749

Obs

per

group:

min

=

17between

=

0.6490

avg

=

17.0overall

=

0.7006

max

=

17F(10,27)

=

247.93corr(u_i,

Xb) =

-0.3767

Prob

>

F

=

0.0000(Std.

Err.

adjusted

for

28

clusters

in

province)ltvfoRobustCoef.

Std.

Err.

t

P>|t| [95%

Conf.

Interval]ltlan.6517195

.1843858

3.53

0.001

.2733911

1.030048ltwlab.1431791

.0589267

2.43

0.022

.0222716

.2640866ltpow.0366317

.0991178

0.37

0.715 -.1667413

.2400047ltfer.180359

.0428995

4.20

0.000

.0923365

.2683816hrs.1916276

.0295596

6.48

0.000

.1309763

.2522789mipric1.0198772

.0515121

0.39

0.703 -.0858168

.1255713giprice-.026268

.0226875 -1.16

0.257 -.0728189

.0202829mci.2014685

.078794

2.56

0.016

.0397965

.3631404ngca.6761116

.421738

1.60

0.121 -.1892234

1.541447t.0063068

.0106492

0.59

0.559 -.0155436

.0281572_cons2.36174

.8262751

2.86

0.008

.6663633

4.057116sigma_usigma_e趨勢項rho.30327958.10589784t

.并89132不628

顯(fra著ction,of而var主iance要due

變to量u_i的)

顯著性不變。時間59其次,加入年度虛擬變量。為演示目的,定義年度虛擬變量:.

tab

year,gen(year)此yearFreq.PercentCum.70285.565.5671285.5611.1172285.5616.6773285.5622.2274285.5627.7875285.5633.3376285.5638.8977285.5644.4478285.5650.0079285.5655.5680285.5661.1181285.5666.6782285.5672.2283285.5677.7884285.5683.3385285.5688.8986285.5694.4487285.56100.00命令To將tal生成時5間04

虛擬10變0.00

量 year1,year2,…,year18。59加入年度虛擬變量后,由于價格變量 mipric1

與 giprice

在各省都一樣,無法包括在回歸方程中,以避免嚴格多重共線性。進行含時間虛擬變量的雙向固定效應(yīng)估計(將結(jié)果記為

“FE_TW”):.

xtreg

ltvfo

ltlan

ltwlab

ltpow

ltfer

hrs

mci

ngcayear2-year18,fe

r.

estimates

store

FE_TWnote:

year11

omitted

because

of

collinearity476

Group

variable:28R-sq:

within

=

0.8932 Obsper

group:

min=

17between=

0.6596

avg=

17.0overall=

0.7156

max=

17F(23,27)

=

949.82corr(u_i,

Xb)

=-0.3425 Prob>=

0.0000(Std.

Err.

adjusted

for

28

clusters

in

province)Fixed-effects

(within)

regressionNumber

ofobs=province Number

ofgroups

=FRobustltvfoCoef.Std.Err.t

P>|t| [95%Conf.

Interval]ltlan.5833594.1514909.0971114.1693346.1503752.1978373.7784081-.0240404-.1323624-.0377336.0058554.0096731-.0476465-.0869336.1745834.0585107.090911.0438098.0587581.0810587.4016301.023366.0404832.0357883.0500774.0566898.061423.06805793.34

0.002

.2251439

.94157492.59

0.015

.0314368

.2715451.07

0.295 -.0894225

.28364533.87

0.001

.0794444

.25922482.56

0.016

.0298136

.27093682.44

0.022

.0315186

.3641561.94

0.063 -.0456688

1.602485-1.03

0.313 -.0719836

.0239027-3.27

0.003 -.2154272 -.0492977-1.05

0.301 -.111165

.03569790.12

0.908 -.096895

.10860580.17

0.866 -.1066448

.1259911-0.78

0.445 -.1736761

.0783832-1.28

0.212 -.2265767

.0527096ltwlabltpowltferhrsmcingcayear2year3year4year5year6year7year8year9year10year11year12year13year14year15year16year17year18_cons64year1(1970年)作為基期,不包括在上述回歸命令中。1980

年的 hrs

數(shù)據(jù)缺失,故 year11(1980

年)也被去掉。在雙向固定效應(yīng)模型中,hrs

也在 5%水平上顯著為正。大多數(shù)的年度虛擬變量均不顯著 (但 year3

在 1%水平上顯著)。檢驗所有年度虛擬變量的聯(lián)合顯著性:.

test

year2

year3

year4

year5

year6

year7

year8year9

year10

year12

year13

year14

year15

year16year17

year186427)

=Prob

>

F

=14.820.0000(

1) year2

=

0(

2) year3

=

0(

3) year4

=

0(

4) year5

=

0(

5) year6

=

0(

6) year7

=

0(

7) year8

=

0(

8) year9

=

0(

9) year10

=

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負責。
  • 6. 下載文件中如有侵權(quán)或不適當內(nèi)容,請與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

評論

0/150

提交評論