stata命令大全全_第1頁
stata命令大全全_第2頁
stata命令大全全_第3頁
stata命令大全全_第4頁
stata命令大全全_第5頁
已閱讀5頁,還剩15頁未讀, 繼續(xù)免費(fèi)閱讀

下載本文檔

版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進(jìn)行舉報(bào)或認(rèn)領(lǐng)

文檔簡介

1、*面板數(shù)據(jù)計(jì)量分析與軟件實(shí)現(xiàn)*說明:以下do文件相當(dāng)一部分內(nèi)容來自于中山大學(xué)連玉君STATA教程,感謝他的貢獻(xiàn)。本人做了一定的修改與篩選。* 面板數(shù)據(jù)模型* 1.靜態(tài)面板模型:FE和RE* 2.模型選擇:FEvsPOLS,REvsPOLS,FEvsRE(pols混合最小二乘估計(jì))* 3.異方差、序列相關(guān)和截面相關(guān)檢驗(yàn)* 4.動(dòng)態(tài)面板模型(DID-GMM,SYS-GM)M* 5.面板隨機(jī)前沿模型* 6.面板協(xié)整分析(FMOLS,DOLS)*說明:1-5均用STAT儆件實(shí)現(xiàn),6用GAUS軟件實(shí)現(xiàn)。*生產(chǎn)效率分析(尤其指TFP):數(shù)據(jù)包絡(luò)分析(DEA)與隨機(jī)前7&分析(SFA)*說明:DE岫

2、DEAP2.1軟件實(shí)現(xiàn),SFA由Frontier4.1實(shí)現(xiàn),尤其后者,側(cè)重于比較C-D與Translog生產(chǎn)函數(shù),一步法與兩步法的區(qū)別。常應(yīng)用于地區(qū)經(jīng)濟(jì)差異、FDI溢出效應(yīng)(SpilloversEffect)、工業(yè)行業(yè)效率狀況等。*空間計(jì)量分析:SLM莫型與SEM1型* 說明:STATgMatlab結(jié)合使用。常應(yīng)用于空間溢出效應(yīng)(R&D、財(cái)政分權(quán)、地方政府公共行為等。* 一、常用的數(shù)據(jù)處理與作圖* 指定面板格式xtsetidyear(id為截面名稱,year為時(shí)間名稱)xtdes/*數(shù)據(jù)特征*/xtsumlogyh/*數(shù)據(jù)統(tǒng)計(jì)特征*/sumlogyh/*數(shù)據(jù)統(tǒng)計(jì)特征*/* 添加標(biāo)簽或更

3、改變量名labelvarh"人力資本"renamehhum* 排序sortidyear/*是以STATAU板數(shù)據(jù)格式出現(xiàn)*/sortyearid/*是以DE船式出現(xiàn)*/* 刪除個(gè)別年份或省份dropifyear<1992dropifid=2/*注意用=*/*如何得到連續(xù)year或id編號(hào)(當(dāng)完成上述操作時(shí),year或id就不連續(xù),為形成panel格式,需要用egen命令)egenyear_new=group(year)xtsetidyear_new* *保留變量或保留觀測值keepinv/*刪除變量*/* *或keepifyear=2000* *排序sortidyea

4、r/*是以STATAU板數(shù)據(jù)格式出現(xiàn)sortyearid/*是以DE醺式出現(xiàn) 長數(shù)據(jù)和寬數(shù)據(jù)的轉(zhuǎn)換* 長 >>>寬數(shù)據(jù)reshape wide logy,i(id) j(year)1 寬>>>長數(shù)據(jù)reshapelogy,i(id)j(year)2 *追加數(shù)據(jù)(用于面板數(shù)據(jù)和時(shí)間序列)xtsetidyear3 或者xtdestsappend,add(5)/表示在每個(gè)省份再追加5年,用于面板數(shù)據(jù)/tsset4 或者tsdes.tsappend,add(8)/表示追加8年,用于時(shí)間序列/5 方差分解,比如三個(gè)變量Y,X,Z都是面板格式的數(shù)據(jù),且滿足Y=X+Z,求

5、方差var(Y),協(xié)方差Cov(X,Y)和Cov(Z,Y)bysortyear:corrYXZ,cov6 *生產(chǎn)虛擬變量7 生成年份虛擬變量tabyear,gen(yr)8 生成省份虛擬變量tabid,gen(dum)9 *生成滯后項(xiàng)和差分項(xiàng)xtsetidyeargenylag=l.y/ 面板數(shù)據(jù)的結(jié)構(gòu)( 兼具截面資料和時(shí)間序列資料的特征)use product.dta, clearbrowsextset id yearxtdes* * - 固定效應(yīng)模型* * 實(shí)質(zhì)上就是在傳統(tǒng)的線性回歸模型中加入 N-1 個(gè)虛擬變量,* 使得每個(gè)截面都有自己的截距項(xiàng),* 截距項(xiàng)的不同反映了個(gè)體的某些不隨時(shí)間改

6、變的特征* 例如: lny = a_i + b1*lnK + b2*lnL + e_it*考慮中國29個(gè)省份的C-D生產(chǎn)函數(shù)* 畫圖 * 散點(diǎn)圖+線性擬合直線twoway (scatter logy h) (lfit logy h)產(chǎn)生一階滯后項(xiàng)),同樣可產(chǎn)生二階滯后項(xiàng)*/genylag2=L2.ygendy=D.y/*產(chǎn)生差分項(xiàng)*/10 求出各省2000年以前的openinv的平均增長率collapse(mean)openinvifyear<2000,by(id)變量排序,當(dāng)變量太多,按規(guī)律排列??捎妹頰order或者orderfdiopeninsti11*二、靜態(tài)面板模型*散點(diǎn)圖+

7、二次擬合曲線twoway(scatterlogyh)(qfitlogyh)* 散點(diǎn)圖+線性擬合直線+置信區(qū)間twoway(scatterlogyh)(lfitlogyh)(lfitcilogyh)* 按不同個(gè)體畫出散點(diǎn)圖和擬合線,可以以做出fevsre的初判斷*twoway(scatterlogyhifid<4)(lfitlogyhifid<4)(lfitlogyhifid=1)(lfitlogyhifid=2)(lfitlogyhifid=3)* 按不同個(gè)體畫散點(diǎn)圖,sobeautiful!*graphtwowayscatterlogyhifid=1|scatterlogyhif

8、id=2,msymbol(Sh)|scatterlogyhifid=3,msymbol(T)|scatterlogyhifid=4,msymbol(d)|,legend(position(11)ring(0)label(1"北京")label(2"天津")label(3"河北")label(4"山西")* *每個(gè)省份logy與h的散點(diǎn)圖,并將各個(gè)圖形合并twowayscatterlogyh,by(id)ylabel(,format(%3.0f)xlabel(,format(%3.0f)* 每個(gè)個(gè)體的時(shí)間趨勢圖*xt

9、linehifid<11,overlaylegend(on)* 一個(gè)例子:中國29個(gè)省份的C-D生產(chǎn)函數(shù)的估計(jì)tabid,gen(dum)list* 回歸分析reglogylogklogldum*,eststorem_olsxtreglogylogklogl,feeststorem_feesttablem_olsm_fe,b(%6.3f)star(0.10.050.01)* Wald檢驗(yàn)testlogk=logl=0testlogk=logl*stata的估計(jì)方法解析* 目的:如果截面的個(gè)數(shù)非常多,那么采用虛擬變量的方式運(yùn)算量過大* 因此,要尋求合理的方式去除掉個(gè)體效應(yīng)* 因?yàn)?,我們關(guān)注

10、的是x的系數(shù),而非每個(gè)截面的截距項(xiàng)* 處理方法:* y_it=u_i+x_it*b+e_it(1)* ym_i=u_i+xm_i*b+em_i(2)組內(nèi)平均* ym=um+xm*b+em(3)樣本平均* (1)-(2),可得:4) /*within estimator*/* (y_it-ym_i)=(x_it-xm_i)*b+(e_it-em_i)* (4)+(3),可得:* (y_it-ym_i+ym)=um+(x_it-xm_i+xm)*b+(e_it-em_i+em)* 可重新表示為:* Y_it=a_0+X_it*b+E_it個(gè)體內(nèi)部平均*/樣本平均 */* 對該模型執(zhí)行OLS估計(jì),即

11、可得到b的無偏估計(jì)量stata 后臺(tái)操作,揭開fe 估計(jì)的神秘面紗!egen y_meanw = mean(logy), by(id) /* egen y_mean = mean(logy) /*egenk_meanw=mean(logk),by(id)egenk_mean=mean(logk)egenl_meanw=mean(logl),by(id)egenl_mean=mean(logl)gendyw=logy-y_meanwgendkw=logk-k_meanwgendlw=logl-l_meanwregdywdkwdlw,noconseststorem_statagendy=logy-

12、y_meanw+y_meangendk=logk-k_meanw+k_meangendl=logl-l_meanw+l_meanregdydkdleststorem_stataesttablem_*,b(%6.3f)star(0.10.050.01)*解讀xtreg,fe的估計(jì)結(jié)果xtreglogyhinvgovopen,fe* -RA2* y_it=a_0+x_it*b_o+e_it(1)pooledOLS* y_it=u_i+x_it*b_w+e_it(2)withinestimator* ym_i=a_0+xm_i*b_b+em_i(3)betweenestimator*R2* ->

13、;R-sq:within模型對應(yīng)的R2,是一個(gè)真正意義上的* ->R-sq:betweencorrxm_i*b_w,ym_iA2* ->R-sq:overallcorrx_it*b_w,y_itA2* -F(4,373)=855.93檢驗(yàn)除常數(shù)項(xiàng)外其他解釋變量的聯(lián)合顯著性* -corr(u_i,Xb)=-0.2347* -sigma_u,sigma_e,rho* rho=sigma_uA2/(sigma_uA2+sigma_eA2)dise(sigma_u)A2/(e(sigma_u)A2+e(sigma_e)A2)* 個(gè)體效應(yīng)是否顯著?* F(28,373)=338.86H0:a

14、1=a2=a3=a4=a29* Prob>F=0.0000表明,固定效應(yīng)高度顯著* -如何得到調(diào)整后的R2,即adj-R2?ereturnlistreglogyhinvgovopendum* -擬合值和殘差* y_it=u_i+x_it*b+e_it* predictnewvar,option/*xbxb,fittedvalues;thedefaultstdpcalculatestandarderrorofthefittedvaluesueu_i+e_it,thecombinedresidualxbuxb+u_i,predictionincludingeffectuu_i,thefixe

15、d-orrandom-errorcomponentee_it,theoverallerrorcomponent 7.2.1 時(shí)間效應(yīng)(雙向固定 (隨機(jī) ) 效應(yīng)模型)* 7.2.2 模型的篩選* 7.2.3 面板數(shù)據(jù)常見問題* 7.2.4 面板數(shù)據(jù)的轉(zhuǎn)換/xtreglogylogklogl,fepredicty_hatpredicta,upredictres,epredictcres,uegenares=a+reslistarescresin1/10*隨機(jī)效應(yīng)模型*y_it=x_it*b+(a_i+u_it)=x_it*b+v_it*基本思想:將隨機(jī)干擾項(xiàng)分成兩種* 一種是不隨時(shí)間改變的,即個(gè)

16、體效應(yīng)a_iu_it* 另一種是隨時(shí)間改變的,即通常意義上的干擾項(xiàng)* 估計(jì)方法:FGLSVar(v_it)=sigma_aA2+sigma_uA2Cov(v_it,v_is)=sigma_aA2* Cov(v_it,v_js)=0* 利用PooledOLS,WithinEstimator,BetweenEstimator* 可以估計(jì)出sigma_aA2和sigma_uA2,進(jìn)而采用GLSFGLS* Re估計(jì)量是Fe估計(jì)量和B時(shí)計(jì)量的加權(quán)平均* yr_it=y_it-theta*ym_i* xr_it=x_it-theta*xm_i* theta=1-sigma_u/sqrt(T*sigma_a

17、A2+sigma_uA2)* 解讀xtreg,re的估計(jì)結(jié)果useproduct.dta,clearxtreglogylogklogl,re*-R2*->R-sq:withincorr(x_it-xm_i)*b_r,y_it-ym_iA2*->R-sq:betweencorrxm_i*b_r,ym_iA2*->R-sq:overallcorrx_it*b_r,y_itA2* 上述R潴B不是真正意義上的R2,因?yàn)镽e莫型采用的是GLS古計(jì)* rho=sigma_uA2/(sigma_uA2+sigma_eA2)dise(sigma_u)A2/(e(sigma_u)A2+e(si

18、gma_e)A2)* corr(u_i,X)=0(assumed)* 這是隨機(jī)效應(yīng)模型的一個(gè)最重要,也限制該模型應(yīng)用的一個(gè)重要假設(shè)* 然而,采用固定效應(yīng)模型,我們可以粗略估計(jì)出corr(u_i,X)xtregmarketinveststock,fe* Waldchi2(2)=10962.50Prob>chi2=0.0000*時(shí)間效應(yīng)、模型的篩選和常見問題時(shí)間效應(yīng)* 單向固定效應(yīng)模型* y_it=u_i+x_it 基本步驟* 情形1: huasman為正數(shù)xtreg logy logk logl, feest store m_fextreg logy logk logl, reest st

19、ore m_rehausman m_fe m_reb+e_it* 雙向固定效應(yīng)模型* y_it=u_i+f_t+x_it*b+e_itquitabyear,gen(yr)dropyr1xtreglogylogkloglyr*,fe* 隨機(jī)效應(yīng)模型中的時(shí)間效應(yīng)xtreglogylogkloglyr*,fe*模型的篩選* 固定效應(yīng)模型還是PooledOLS?xtreglogylogkloglyr*,fe/*Wald檢驗(yàn)*/quitabid,gen(dum)/*LR檢驗(yàn)*/reglogylogklogl/*POLS*/eststorem_olsreglogylogklogldum*,noconses

20、tstorem_felrtestm_olsm_feesttablem_*,b(%6.3f)star(0.10.050.01)* REvsPooledOLS?* H0:Var(u)=0* 方法一:B-P檢驗(yàn)xtreglogylogklogl,rexttest0*FEvsRE?*y_it=u_i+x_it*b+e_it和Re都是一致的,但Re更有效 仍然有效,但Re有偏的* -Hausman檢驗(yàn)-* 基本思想:如果Corr(u_i,x_it)=0,Fe* 如果Corr(u_i,x_it)!=0,Fe*情形2:quixtreglogyhinvgovopen,feeststorefequixtregl

21、ogyhinvgovopen,reeststorerehausmanfere* Hausman檢驗(yàn)值為負(fù)怎么辦?* 通常是因?yàn)镽E莫型的基本假設(shè)Corr(x,u_i)=0無法得到滿足* 檢驗(yàn)過程中兩個(gè)模型的方差-協(xié)方差矩陣都采用Fe模型的hausmanfere,sigmaless* 兩個(gè)模型的方差-協(xié)方差矩B輕采用Re莫型的hausmanfere,sigmamore*=為何有些變量會(huì)被drop掉?usenlswork.dta,cleartssetidcodeyearxtregln_wagehourstenurettl_exp,fe/ 假設(shè)檢驗(yàn) - *= 組間異方差檢驗(yàn)(截面數(shù)據(jù)的特征)* Va

22、r(e_i) = sigma_iA2* Fe 模型xtreg logy logk logl, fexttest3* Re 模型* Re 本身已經(jīng)較大程度的考慮了異方差問題,主要體現(xiàn)在sigma_uA2 上*= 序 列相關(guān)檢驗(yàn)* Fe 模型* xtserial Wooldridge(2002) ,若無序列相關(guān),則一階差分后殘差相關(guān)系數(shù)應(yīng)為xtserial logy logk logl正常執(zhí)行*/* 產(chǎn)生種族虛擬變量tabrace,gen(dum_race)xtregln_wagehourstenurettl_expdum_race2dum_race3,fe* 為何dum_race2和dum_ra

23、ce3會(huì)被dropped?* 固定效應(yīng)模型的設(shè)定:y_it=u_i+x_it*b+e_it(1)* 由于個(gè)體效應(yīng)u_i不隨時(shí)間改變,* 因此若x_it包含了任何不隨時(shí)間改變的變量,* 都會(huì)與u_i構(gòu)成多重共線性,Stata會(huì)自動(dòng)刪除之。*異方差、序列相關(guān)和截面相關(guān)問題簡介* y_it=x_it*b+u_i+e_it* 由于面板數(shù)據(jù)同時(shí)兼顧了截面數(shù)據(jù)和時(shí)間序列的特征,* 所以異方差和序列相關(guān)必然會(huì)存在于面板數(shù)據(jù)中;* 同時(shí),由于面板數(shù)據(jù)中每個(gè)截面(公司、個(gè)人、國家、地區(qū))之間還可能存在內(nèi)在的聯(lián)系,* 所以,截面相關(guān)性也是一個(gè)需要考慮的問題。* 此前的分析依賴三個(gè)假設(shè)條件:* (1)Vare_it

24、=sigmaA2同方差假設(shè)* (2)Corre_it,e_it-s=0序列無關(guān)假設(shè)* (3)Corre_it,e_jt=0截面不相關(guān)假設(shè)* 當(dāng)這三個(gè)假設(shè)無法得到滿足時(shí),便分別出現(xiàn)異方差、序列相關(guān)和截面相關(guān)問題;* 我們一方面要采用各種方法來檢驗(yàn)這些假設(shè)是否得到了滿足;-0.5* 另一方面,也要在這些假設(shè)無法滿足時(shí)尋求合理的估計(jì)方法。xtseriallogylogklogl,output* Re模型xtreglogylogklogl,rexttest1/*提供多個(gè)統(tǒng)計(jì)檢驗(yàn)量*/*=截面相關(guān)檢驗(yàn)* xttest2命令H0:所有截面殘差的相關(guān)系數(shù)都相等xtreglogylogklogl,fextte

25、st2* 由于檢驗(yàn)過程中執(zhí)行了SUE古計(jì),所以要求T>Nxtreglogylogkloglifid<6,fexttest2* xtcsd命令(提供了三種檢驗(yàn)方法)xtreglogylogklogl,fextcsd,pesaran/*Pesaran(2004)*/xtcsd,friedman/*Friedman(1937)*/xtreglogylogklogl,rextcsd,pesaran*估計(jì)方法*異方差穩(wěn)健型估計(jì)xtreglogyhinvgovopen,ferobusteststorefe_rbxtreglogyhinvgovopen,ferobusteststorefe*結(jié)果

26、對比esttabfe_rbfe,b(%6.3f)se(%6.3f)mtitle(fe_rbfe)=序列相關(guān)估計(jì)* 一階自相關(guān)xtregar,fe/re(1)* 模型:y_it=u_i+x_it*b+v_it* v_it=rho*v_it-1+z_it(2)xtregarlogyhinvgovopen,feeststorefe_ar1xtregarlogyhinvgovopen,felbi/*Baltagi-WuLBItest*/* 說明:* (1)這里的Durbin-Watson=1.280677具有較為復(fù)雜的分布,* 不同于時(shí)間序列中的D-W統(tǒng)計(jì)量。* (2)其臨界值見Bhargavaeta

27、l.(1982,TheReviewofEconomicStudies49:553-549)* (3)Baltagi-WuLBI=1.4739834基本上沒有太大的參考價(jià)值,* 因?yàn)樗麄儾⑽刺峁┡R界值表,而該統(tǒng)計(jì)量的分布又相當(dāng)復(fù)雜xtregarlogyhinvgovopen,reeststorere_ar1* 兩階段估計(jì)xtregarlogyhinvgovopen,fetwostepeststorefe_ar1_two* 結(jié)果對比xtreglogyhinvgovopen,feeststorefelocalmodels"fefe_ar1re_ar1fe_ar1_two"estt

28、ab'models',b(%6.3f)se(%6.3f)mtitle('models')r2sca(r2_wcorr)* 高階自相關(guān)* newey2 命令newey2 logy h inv gov open, lag(2)= 組間相關(guān)(截面相關(guān))* cluster 選項(xiàng)use xtcs.dta, clearxtreg logy h inv gov open, fe cluster(id) est store fe_clusterxtreg logy h inv gov open, re cluster(id) est store re_cluster* 看過去很

29、暈,采用一種綜合處理:* xtgls 命令* xtpcse 命令簡介( Greene, 2000, chp15 )* 模型* y=X*b+U* 重點(diǎn)在于考慮干擾項(xiàng)U的結(jié)構(gòu),包括* (1)異方差(2)序列相關(guān)(3)截面相關(guān)性* 應(yīng)用范圍:多用于大T,小N”型面板數(shù)據(jù),* 因?yàn)?,此時(shí)截面的異質(zhì)性并不是重點(diǎn)關(guān)注的,而時(shí)序特征則較為明顯* 因此,模型設(shè)定中未考慮個(gè)體效果*= xtgls 命令use invest2.dta, clearxtgls market invest stock, panels(iid) /*iid, est store g_0reg market invest stockest

30、 store g_olsxtgls market invest stock, panel(het) /* est store g_phetxtgls market invest stock, corr(ar1) /*est store g_par1xtgls market invest stock, corr(psar1) /*est store g_psar1xtgls market invest stock, panel(corr) /* est store g_pcorrxtgls market invest stock, p(c) corr(ar1)est store g_all* 檢

31、驗(yàn)異方差xtgls market invest stock, panel(het) /* xttest3* 檢驗(yàn)序列相關(guān)xtserial market invest stock* 檢驗(yàn)截面相關(guān)xtgls market invest stock, panel(het) xttest2* 結(jié)果對比xtreg market invest stock, feest store felocal models "fe g_0 g_ols"- 估計(jì)和檢驗(yàn)等同于 Pooled OLS*/截面異方差*/所有截面具有相同的自相關(guān)系數(shù)每個(gè)截面有自己的自相關(guān)系數(shù)*/截面間相關(guān)且異方差*/截面異方差

32、*/*/esttab'models',b(%6.3f)se(%6.3f)mtitle('models')r2sca(r2_w)localmodels"feg_phetg_par1g_psar1g_pcorrg_all"esttab'models',b(%6.3f)se(%6.3f)mtitle('models')r2sca(r2_w)compress* 說明:* 為何xtgls不匯報(bào)R2?* 因?yàn)榇藭r(shí)的R狄必介于0和1之間,不具有傳統(tǒng)線性回歸模型中R2的含義*=xtpcse命令* 默認(rèn)假設(shè):存在截面異方差和截面

33、相關(guān)* 估計(jì)方法:OLS或Prais-Winsten回歸* 有別于xtgls(采用FGLS古計(jì))* 更適于方塊面板N不大(10-20),T不大(10-40)* 與xtgls的區(qū)別:估計(jì)方法不同* xtgls采用GLS®行估at,而xtpsce采用OLSuseinvest2.dta,clearxtpcseinvestmarketstockeststorepcse_full/ 模型: yit = a0*yit-1 + a1*xit + a2*wit + u_i + eitOLS估計(jì),調(diào)整異方差和截面相關(guān)后的標(biāo)準(zhǔn)誤*/xtglsinvestmarketstock,panels(correl

34、ated)eststorem_xtgls/*FGLS估計(jì),異方差和截面相關(guān)*/xtpcseinvestmarketstock,correlation(ar1)eststorepcse_ar1/*Prais_Winsten估計(jì),共同的自相關(guān)系數(shù)*/xtpcseinvestmarketstock,correlation(ar1)hetonlyeststorepcse_ar1/*不考慮截面相關(guān)*/* 結(jié)果對比xtreginvestmarketstock,feeststorefelocalmodels"fepcse_fullm_xtglspcse_ar1pcse_ar1"estta

35、b'models',b(%6.3f)se(%6.3f)mtitle('models')r2sca(r2_w)* xtpcse的結(jié)果與xtgls非常相似,但前者可以匯報(bào)R2* 當(dāng)Nt大時(shí),采用該方法會(huì)非常費(fèi)時(shí),* 因?yàn)榉讲顓f(xié)方差矩陣是采用OLS古計(jì)的殘差計(jì)算的usextcs.dta,clearxtdesxtpcsetlsizendtstangtobinnpr/*大約5-8分鐘*/eststorextpcsextregtlsizendtstangtobinnpr,feeststorefe*結(jié)果對比localmodels"fextpcse"estt

36、ab'models',b(%6.3f)se(%6.3f)mtitle('models')r2sca(r2_w)*系數(shù)估計(jì)值有較大差別,但符號(hào)和顯著性是一致的。*動(dòng)態(tài)面板模型PartI*動(dòng)態(tài)面板模型*簡介*一階差分IV估計(jì)量(AndersonandHisao,1982)*一階差分GMMr計(jì)量(ArellanoandBond,1991)*系統(tǒng)GMMr計(jì)量(AB,1995;BB,1998)*=簡介=*特征:解釋變量中包含了被解釋變量的一階滯后項(xiàng)可以是非平行面板,但要保證時(shí)間連續(xù)*xit嚴(yán)格外生變量Ex_it,e_is=0foralltands*即,所有干擾項(xiàng)與x都未相

37、關(guān)* wit*yit-1*u_i先決變量Ew_it,e_is!=0fors<t,butEx_it,v_is=0foralls>=t即,前期干擾項(xiàng)與W期一x相關(guān),但當(dāng)期和未殺加工擾項(xiàng)與x不相關(guān)。內(nèi)生變量Ex_it,e_is!=0fors<=t即,前期和當(dāng)期,關(guān)詢當(dāng)期干擾項(xiàng)與x相關(guān)隨機(jī)效應(yīng),在截面間是iid的。u_i與eit獨(dú)立。*內(nèi)生性問題:*(1)若假設(shè)u_i為隨機(jī)效應(yīng),則Corr(yi,t-1,u_i)!=0*(2)若假設(shè)u_i為個(gè)體效應(yīng),需要想辦法去除之,因?yàn)閿?shù)據(jù)為“大N/J、T"*一階差分:D.yi,t-1=yi,t-1-yi,t-2D.ei,t=ei,t-e

38、i,t-1顯然:Corr(D.yi,t-1,D.ei,t)!=0,差分方程存在內(nèi)生問題;組內(nèi)去心:ymi,t-1=yi,t-1-1/(T-1)等價(jià)于*xtivreg n L2.n L(0/1).w L(0/2).(k ys) yr1981-yr1984 (L.n = L3.n), fd * = *= 一階差分 gmM計(jì)量= *=AB91=* L.Hansen (1982) 提出 GMM* Arellano and Bond (1991)*模型:(yi,t-1+yi,T)*emi,t=ei,t-1/T*(ei,t+ei,t-1+ei,T)仍然存在內(nèi)生性問題*顯然:Corr(ymi,t-1,emi

39、,t)!=0,*處理辦法:IV估計(jì)或GMMr計(jì),選擇合適的工具變量*矩條件:Ee_it,z_it=0*=*=一階差分IV估計(jì)量=*=AndersonandHisao(1982)=*基本思想:采用一階差分去除個(gè)體效應(yīng)u_i,* y的滯后二階作為D.yit-1的工具變量* 同時(shí),D.yit-2也可以作為D.yit-1的工具變量useabdata.dta,cleardes/*變量的定義*/tssetidyear* 模型:n_it=b1*n_it-1+b2*n_it-2* +b3*w_it+b4*w_it-1* +b5*k_it+b6*k_it-1+b7*k_it-2* +b8*ys_it+b9*ys

40、_it-1+b10*ys_it-2*xtivregnL2.nwL1.wkL1.kL2.kysLl.ysL2.ysyr1981-yr1984/(L.n=L3.n),fd* yit=a0 -2- GMM-type 和 Standard 兩種類型的工具變量有何差異? (xtabond,p.27)yit-1+a1*xit+a2*wit+u_i+vit* 假設(shè)條件:* 干擾項(xiàng)vit不存在序列相關(guān);*適用范圍:大N,小T隨后,我們會(huì)介紹為、n大r型動(dòng)態(tài)面板的估計(jì)方法* 基本思想:* 在AndersonandHisao(1982)基礎(chǔ)上增加了更多可用的工具變量* 在t=3處,y_i1可以作為所有滯后項(xiàng)的工具

41、變量* 在t=4處,y_i1,y_i2可以作為所有滯后項(xiàng)的工具變量* D.yit=a1*D.yit-1+a2*D.Xit+D.vitX_it=x_it,w_it* 因此,所有工具變量構(gòu)成的矩陣如下:* Z_i的行數(shù)為T-2* Z_i的列數(shù)為sum_(m=1)A(T-2)m+K,K為X的列數(shù)* 以T=7,K=3為例,則Z_i的列數(shù)為(1+2+3+4+5)+3=18* 設(shè)定工具變量的基本原則:* 對-內(nèi)生-變量的處理:與上述方法類似,* 即滯后兩階以上的水平變量均可作為差分方程的工具變量(GMMtype)* 對-先決-變量的處理:滯后一階以上的水平變量均可作為工具變量(GMMtype)* 對-外生

42、-變量的處理:自己作為自己的工具變量(StandardIV)*=例1:一階差分估計(jì)量的基本設(shè)定* 解釋變量僅包含y_it的一階滯后項(xiàng),默認(rèn)設(shè)定* 干擾項(xiàng)同方差,一階段估計(jì)useabdata.dta,clearxtabondnL(0/1).wL(0/2).(kys)yr1980-yr1984eststoreab_0*-結(jié)果釋疑*-1-工具變量的個(gè)數(shù)是如何確定的?(xtdpd,p.74)* 外生變量的工具變量等于外生變量的個(gè)數(shù)* L(0/1).wL(0/2).(kys)yr1980-yr1984共13個(gè)* 內(nèi)生變量的工具變量:共27個(gè)*listidyearnL2.nDL2.nifid=140* 差

43、分方程的可用工具變量* yearofYearsofNumberof* differenceequationinstrumentsinstruments*197819761*19791976-19772*19801976-19783*19811976-19794*19821976-19805*19831976-19816*19841976-19827* GMM-type是針對內(nèi)生變量或先決變量而言的工具變量,有多列* Standard是針對外生變量而言的工具變量,只有一列* -過度識(shí)別檢驗(yàn)(工具變量的使用是否合理)estatsargan* 說明:* H0:overidentifyingrestr

44、ictionsarevalid* 這里,我們拒絕了原假設(shè),但AB91指出,當(dāng)干擾項(xiàng)存在異方差時(shí),* Sargan檢驗(yàn)傾向于過度拒絕原假設(shè),因此此處得到的結(jié)論并不可信。* 采用兩階段估計(jì),然后再執(zhí)行Sargan檢驗(yàn)較為穩(wěn)妥:*xtabondnL(0/1).wL(0/2).(kys)yr1980-yr1984,twostepestatsargan* 說明:不過,AB91發(fā)現(xiàn),* 若存在異方差,在兩階段估計(jì)后執(zhí)行Sargan檢驗(yàn)往往傾向于* Underreject問題,即過度接受原假設(shè)。* 通常而言,這很可能是我們的模型設(shè)定不當(dāng),或是工具變量的選擇不合理。*-干擾項(xiàng)序列相關(guān)檢驗(yàn)* AB91一階差分估

45、計(jì)量要求原始模型的干擾項(xiàng)不存在序列相關(guān),* 顯然,差分后的干擾項(xiàng)必然存在一階序列相關(guān),* 因此,我們需要檢驗(yàn)差分方程的殘差是否存在二階(或更高階)序列相關(guān)即可* 默認(rèn),二階序列相關(guān)檢驗(yàn)xtabondnL(0/1).wL(0/2).(kys)yr1980-yr1984,vce(robust)estatabond*說明:若存在二階相關(guān),則意味著選取的工具變量不合理*高階序列相關(guān)檢驗(yàn)xtabondnL(0/1).wL(0/2).(kys)yr1980-yr1984,vce(robust)artest(3)estatabond*=穩(wěn)健型估計(jì)xtabondnL(0/1).wL(0/2).(kys)yr1

46、980-yr1984,lags(2)robusteststoreab4_one_rb*此時(shí),無法Sargan統(tǒng)計(jì)量estatsargan*=兩階段估計(jì)AB91(Tab4(a2)考慮異方差問題* 利用第一階段估計(jì)得到的殘差構(gòu)造方差-協(xié)方差矩陣,進(jìn)而重新估計(jì)模型*xtabondnL(0/1).wL(0/2).(kys)yr1980-yr1984,lags(2)twostepeststoreab4_twostep* 此時(shí),Sargan檢驗(yàn)無法拒絕原假設(shè)*estatsargan* AB91重要建議:* (1)采用一階段估計(jì)結(jié)果進(jìn)行系數(shù)顯著性的統(tǒng)計(jì)推斷;* (2)采用兩階段估計(jì)給出的Sargan統(tǒng)計(jì)量進(jìn)

47、行模型篩選* 進(jìn)一步的討論:* 雖然AB91建議不要采用兩階段(非穩(wěn)健)估計(jì)進(jìn)行統(tǒng)計(jì)推斷,* 彳!Windmeijer(2005,JournalofEconometrics)通過模擬分析表明,* 采用糾偏(bias-corrected,WC)后的穩(wěn)健性VCE可以更好地進(jìn)行統(tǒng)計(jì)推斷xtabondnL(0/1).wL(0/2).(kys)yr1980-yr1984,lags(2)twostepvce(robust)eststoreab_wc_rb* 結(jié)果對比localmm"ab4_one_rbab4_twostepab_wc_rb"esttab'mm',mtit

48、le('mm')* 結(jié)論:* AB91_onestep_rb的結(jié)果與AB91_WC_rb的參數(shù)估計(jì)相同,后者標(biāo)準(zhǔn)誤較大* 建議采用Windmeijer(2005)兩階段-糾偏-穩(wěn)健型估計(jì)量。*=先決變量的設(shè)定* 由于當(dāng)期干擾項(xiàng)顯然會(huì)影響后續(xù)w和k,所以把它們設(shè)定為先決變量更為合理* 注意:此時(shí)逗號(hào)前就不能再出現(xiàn)這兩個(gè)變量了xtabondnL(0/1).ysyr1980-yr1984,lags(2)twostep/pre(wk)eststoreab4_preestatsargan* 從Sarganp值來看,將w和k設(shè)為先決變量似乎更為合理* pre()選項(xiàng)的設(shè)定xtabondnL

49、(0/1).ysyr1980-yr1984,lags(2)twostep/pre(w,lag(1,3)pre(k,lag(2,.)* 解釋:* pre(w,lag(1,3)* lag(1,3)中的1表示L.w也會(huì)作為解釋變量,*lag(1,3)中的3表示L2.w和L3.w可以作為L.w的工具變量,但L4.w不可以;*pre(k,lag(2,.)*lag(2,.)中的2表示L1.k,L2.k都會(huì)作為解釋變量;*lag(2,.)中的.表示L3.k,L4.k.都可以作為L2.k的工具變量* 說明:上述設(shè)定都可附加-vce(robust)-選項(xiàng)以便獲得穩(wěn)健型標(biāo)準(zhǔn)誤。*=工具變量過多導(dǎo)致的問題* 過多的

50、工具變量往往導(dǎo)致過度約束假設(shè)無法滿足* 估計(jì)結(jié)果的有效性降低,因?yàn)椴糠止ぞ咦兞颗c內(nèi)生或先決變量的相關(guān)性很弱* 對矩陣尺寸的要求增加* 解決辦法:限制最大的滯后階數(shù)xtabondnL(0/1).ysyr1980-yr1984,lags(2)twostep/pre(w,lag(1,3)pre(k,lag(2,3)*=系數(shù)估計(jì)的上下限* 雖然PooledOLS和FixedEffects估計(jì)都是有偏的,* 但是二者卻決定了y_it-1真是估計(jì)值的上界和下界* 換言之,PooledOLS估計(jì)高估了真實(shí)值* 而Fixedeffects估計(jì)則低估了真實(shí)值*=*=系統(tǒng)GMMfi計(jì)量=*=AB95,BB98=*

51、=* ArellanoandBover(1995),* BlundellandBond(1998)* Haha(1999),JudsonandOwen(1999)* 適用范圍:* 大N,小T* AB91的局限* (1)當(dāng)yi,t-1的系數(shù)較大,即yi,t表現(xiàn)出強(qiáng)烈的序列相關(guān)時(shí);* (2)當(dāng)Varu_i/Vare_it較大時(shí),即個(gè)體效應(yīng)的波動(dòng)遠(yuǎn)大于常規(guī)干擾項(xiàng)的波動(dòng);* AB91的表現(xiàn)欠佳。* 原因在于,水平滯后項(xiàng)是差分方程中內(nèi)生變量的-弱工具變量-;* 因此,需要尋求更佳的工具變量*=基本思想:幾個(gè)概念*水平值yx差分值D.yD.x水平方程:y_it=b1 采用 xtabond2 估計(jì) AB91

52、 文中表 4 的結(jié)果y_it-1+b2*x_it+u_i+v_it可用工具變量:D.yi,t-1可以作為yi,t-1的工具變量差分方程:D.y_it=b1*D.y_it-1+b2*D.x_it+D.v_it可用工具變量:yi,t-2,yi,t-3.都可以作為D.yi,t-1的工具變量差分GMM計(jì)量與系統(tǒng)GMM計(jì)量的區(qū)別* (1)差分GMM計(jì)量采用水平值的滯后項(xiàng)作為差分變量的工具變量;* 如y_it-3是D.y_it-1的工具變量* (2)系統(tǒng)GMM計(jì)量進(jìn)一步采用差分變量的滯后項(xiàng)作為水平值的工具變量;* 相當(dāng)于進(jìn)一步增加了可用的工具變量,* 且估計(jì)過程中同時(shí)使用水平方程和差分方程* (3)主要原

53、因在于差分GM的工具變量往往是弱工具變量,即corr(X,Z)過低* -xtabond2命令-Roodman(2005)* 既可以估計(jì)差分GMM估計(jì)量,也可以估計(jì)系統(tǒng)GMM估計(jì)量;* 同時(shí)可以估計(jì)一般化的回歸模型* 提供兩階自相關(guān)檢驗(yàn),Sargan檢驗(yàn),Hansen檢驗(yàn),以及工具變量外生性檢驗(yàn)* -xtdpdsys命令-Stata官方命令,以xtabond2命令為基礎(chǔ)*xtabond2命令* 適用于Stata8-10各個(gè)版本* 既可以完成-一階差分gmiMt計(jì)-* 也可以完成-系統(tǒng)gmMt計(jì)-* 詳細(xì)參考資料:* Roodman,D.2006.HowtoDoxtabond2:* AnIntroductionto"Difference"and"System"GMMinStata.* WorkingPaper103.CenterforGlobalDevelopment,Washington.*=使用xtabond2命令得到-一階差分估計(jì)量-*-附加-noleveleq-選項(xiàng)即可* ArellanoandBond(1991),Table4* Column(a1)useabdata,clearxtabond2nL(1/2).nL(0/1).wL(0/2).(kys

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會(huì)有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫網(wǎng)僅提供信息存儲(chǔ)空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負(fù)責(zé)。
  • 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

評論

0/150

提交評論