面板數(shù)據(jù)講義_第1頁
面板數(shù)據(jù)講義_第2頁
面板數(shù)據(jù)講義_第3頁
面板數(shù)據(jù)講義_第4頁
面板數(shù)據(jù)講義_第5頁
已閱讀5頁,還剩72頁未讀, 繼續(xù)免費閱讀

下載本文檔

版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進(jìn)行舉報或認(rèn)領(lǐng)

文檔簡介

1、面板數(shù)據(jù)模型與應(yīng)用1面板數(shù)據(jù)定義panel data的中譯:面板數(shù)據(jù)、桌面數(shù)據(jù)、平行數(shù)據(jù)、縱列數(shù)據(jù)、時間序列截面數(shù)據(jù)、混合數(shù)據(jù)(pool data)、固定調(diào)查對象數(shù)據(jù)。面板數(shù)據(jù)定義(1)面板數(shù)據(jù)定義為相同截面上的個體在不同時點的重復(fù)觀測數(shù)據(jù)。(2)稱為縱向(longitudinal)變量序列(個體)的多次測量。面板數(shù)據(jù)從橫截面(cross section)看,是由若干個體(entity, unit, individual)在某一時點構(gòu)成的截面觀測值,從縱剖面(longitudinal section)看每個個體都是一個時間序列。圖1 N=7,T=50的面板數(shù)據(jù)示意圖面板數(shù)據(jù)用雙下標(biāo)變量表示。例

2、如yi t, i = 1, 2, , N; t = 1, 2, , Ti對應(yīng)面板數(shù)據(jù)中不同個體。N表示面板數(shù)據(jù)中含有N個個體。t對應(yīng)面板數(shù)據(jù)中不同時點。T表示時間序列的最大長度。若固定t不變,yi ., ( i = 1, 2, , N)是橫截面上的N個隨機變量;若固定i不變,y. t, (t = 1, 2, , T)是縱剖面上的一個時間序列(個體)。2. 面板數(shù)據(jù)模型面板數(shù)據(jù)模型是利用面板數(shù)據(jù)構(gòu)建的模型。面板數(shù)據(jù)系一組個體在一段時間內(nèi)的觀測值形成的數(shù)據(jù)集,這里“個體”可以是個人、家庭、企業(yè)、行業(yè)、地區(qū)或國家(Baltagi,2008)。1966年,Balestra & Nerlove發(fā)

3、表了第一篇利用面板數(shù)據(jù)模型研究天然氣需求估計的論文,此后,面板數(shù)據(jù)模型這一新的計量分析方法在理論和應(yīng)用上得到迅速發(fā)展,已形成現(xiàn)代計量經(jīng)濟學(xué)的一個相對獨立的分支。面板數(shù)據(jù)模型由于同時使用了截面數(shù)據(jù)(cross-sectional data)和時間序列數(shù)據(jù)(time series data),因而可以控制個體的異質(zhì)性,識別、測量單純使用這兩種數(shù)據(jù)無法估計的效應(yīng);并且具有包含更多的信息、更大的變異和自由度、變量間的共線性也更弱的特性,可得到更精確的參數(shù)估計(Hsiao,2003、2008)。面板數(shù)據(jù)涉及個體(N)和時間(T)兩個維度,有微觀面板(micro panels)和宏觀面板(macro pa

4、nels)之分。微觀面板源于截面數(shù)據(jù)的計量分析,是針對個體的調(diào)查數(shù)據(jù),其特點是個體數(shù)N較大(通常是幾百或幾千個),而時期數(shù)T較小(最少為2年,最長不超過20年),主要應(yīng)用于勞動經(jīng)濟學(xué)以及需求分析、成本分析和生產(chǎn)函數(shù)分析等。宏觀面板一般具有適度規(guī)模的個體N(從7到100或200不等,如G7,OECD、歐盟、發(fā)達(dá)國家或發(fā)展中國家),時期數(shù)T一般在20至60之間,甚至更大。這類數(shù)據(jù)可以刻畫一些制度或政策的外生變化,常用于識別政策效應(yīng)研究中的關(guān)注參數(shù)。宏觀和微觀面板要求使用不同的計量建模方法。微觀面板通常研究T固定而N較大時(簡稱“大N小T”)的漸近性質(zhì),而宏觀面板則是同時考慮T和N都較大時(簡稱“大

5、N大T”)的漸近性質(zhì),此時可以分為對角極限、序貫極限和聯(lián)合極限三種情形來討論。對于宏觀面板,當(dāng)T較大時需要考慮數(shù)據(jù)的非平穩(wěn)(如單位根和協(xié)整)與結(jié)構(gòu)變化等特征;微觀面板由于時間短,一般不需要處理非平穩(wěn)問題。在處理宏觀面板時,還必須考慮個體之間的相關(guān)性,即截面相關(guān),而在微觀面板中,如果個體是隨機抽樣產(chǎn)生,則個體之間不大可能存在相關(guān)性,不需要考慮此類問題(Baltagi,2008)。假設(shè)有N個個體T期的觀測值和,;是在、和一組固定參數(shù)的條件下,概率分布產(chǎn)生的隨機結(jié)果,其中是不可觀測的影響因素。(如何理解?)面板數(shù)據(jù)建模的目的是利用全部的樣本信息來對進(jìn)行推斷。假定感興趣的影響因素是,通常的做法是通過在

6、時間和個體上的變化,即來反映不可觀測的異質(zhì)性;因此,給定,的條件密度為。此時如果不對進(jìn)行任何約束,該模型就只有描述性作用,不能進(jìn)行任何的統(tǒng)計推斷(如何理解 ?)。常用的施加在上的約束條件是將分解為,其中不隨時間和個體變動,稱為結(jié)構(gòu)參數(shù)(structural parameters),稱為冗余參數(shù)(incidental parameters),迄今,面板數(shù)據(jù)的文獻(xiàn)主要集中在控制了后如何對進(jìn)行推斷。進(jìn)一步,如果不對施加約束也不能對做出推斷,因為將會耗盡所有的樣本信息。一般的處理思路是:假定可觀測變量的影響不隨時間和個體變化,由描述;冗余參數(shù)代表了以外隨個體和時間變化的異質(zhì)性影響,這種影響可以分解為個

7、體效應(yīng)、時間效應(yīng)以及隨個體和時間變化的效應(yīng)。個體效應(yīng)和時間效應(yīng)可以設(shè)定為隨機變量,也可以設(shè)定為固定的參數(shù),分別形成了隨機效應(yīng)(random effects)模型和固定效應(yīng)(fixed effects)模型。所要研究的問題:1. 模型的設(shè)定2. 模型估計3. 模型的檢驗4. 模型的應(yīng)用問題: 是否可將前面計量經(jīng)濟學(xué)所教授的內(nèi)容直接應(yīng)用于面板數(shù)據(jù)計量經(jīng)濟學(xué)模型。答案是否定的。盡管基本的思路有相似之處,但面板數(shù)據(jù)模型有其自身的特點。特點:1.模型的設(shè)定 :FE(Fixed Effect)、RE(Random Effect)Pool等等; 2. 估計 Within估計,估計等等.檢驗異方差性檢驗、Ha

8、usman檢驗等等;如何理解估計、推斷、檢驗、設(shè)定等方面的問題?經(jīng)典的面板數(shù)據(jù)模型可以分為靜態(tài)模型和動態(tài)模型。靜態(tài)面板數(shù)據(jù)模型設(shè)定的一般形式為: (1)其中,與不相關(guān)。若和為固定的常數(shù),模型(1)稱為固定效應(yīng)模型;為了避免dummy陷阱,設(shè)定,通常采用組內(nèi)(within-group)(Within VS Between)方法來估計,并通過F檢驗或Wald檢驗考察固定效應(yīng)是否存在(為什么要檢驗?檢驗什么?如何檢驗?)。若和為隨機變量,模型(1)稱為隨機效應(yīng)模型。此時除了假定與不相關(guān),還需進(jìn)一步假定和與不相關(guān)。對于隨機效應(yīng)模型,可以采用FGLS的方法來估計。上述兩種效應(yīng)的設(shè)定各有特點。固定效應(yīng)模型

9、允許個體效應(yīng)(時間效應(yīng))與解釋變量相關(guān),但待估參數(shù)個數(shù)隨著樣本容量的增大而增大,即存在冗余參數(shù)問題,且模型中不能包含非時變的變量。(會出現(xiàn)什么問題?)隨機效應(yīng)模型中,待估參數(shù)個數(shù)不隨樣本容量的變化而變化,當(dāng)隨機的個體效應(yīng)(時間效應(yīng))與不相關(guān)時能夠得到更有效的估計量,模型中可以包括不隨時間變化的變量;其缺點在于若隨機的個體效應(yīng)(時間效應(yīng))與相關(guān)時,F(xiàn)GLS估計量是不一致的。通過Hausman檢驗,即原假設(shè)下兩個一致統(tǒng)計量是否有顯著差異可以判斷采用何種設(shè)定更合適。(操作細(xì)節(jié)?)很多經(jīng)濟關(guān)系具有動態(tài)性,可以通過在模型中加入被解釋變量的滯后作為解釋變量來刻畫: (2)其中,個體效應(yīng)可以是固定或隨機的;

10、若為隨機的,則假定與不相關(guān)。式(2)稱為動態(tài)面板數(shù)據(jù)模型,其在時間上的記憶性來自兩個方面:一是作為解釋變量所引起的自相關(guān);二是由個體效應(yīng)所引起的自相關(guān)。無論將設(shè)定為固定效應(yīng)還是隨機效應(yīng),即使是,模型(2)也會產(chǎn)生內(nèi)生性問題,對應(yīng)的估計量均是不一致的。為什么?為了解決這一問題,早期的研究采取方法有:一是對模型(2)進(jìn)行一階差分,然后進(jìn)行IV估計或GMM估計(Anderson&Hsiao,1981)。Arellano&Bond(1991)擴展了一般的GMM估計,建議使用變量水平值的所有滯后項作為差分變量的工具變量以提高估計的有效性,這一方法稱為差分GMM估計;差分GMM估計的一個缺

11、點是差分會導(dǎo)致模型擾動項出現(xiàn)序列相關(guān)。為此,Arellano&Bover(1995)建議通過正交離差(orthogonal deviation)的變換來消除個體效應(yīng)的影響。差分GMM估計的另一個缺陷是估計量在有限樣本下存在較大的偏差,當(dāng)自回歸系數(shù)接近1時尤為嚴(yán)重;Blundell和Bond(1998)的研究表明,差分GMM估計的這一不良表現(xiàn)源于使用變量水平值的滯后項作為差分變量的工具變量所導(dǎo)致的弱工具變量問題(Staiger&Stock,1997),因而提出系統(tǒng)GMM估計的方法,建議在進(jìn)行差分GMM估計的同時使用另一組矩條件來估計參數(shù),即使用變量差分值的滯后項作為水平變量的工具

12、變量。Blundell&Bond(1998)的推導(dǎo)與模擬表明,系統(tǒng)GMM估計能有效克服弱工具變量的問題,極大地改進(jìn)了估計量的有限樣本表現(xiàn),在降低偏差的同時提高了估計的精度。早期的面板數(shù)據(jù)模型均假定截面之間是相互獨立的。但是,忽略個體之間的截面相關(guān)將會影響估計量的有效性甚至導(dǎo)致估計量的不一致(Pesaran,2006)。近年來,面板數(shù)據(jù)模型的一個重要發(fā)展方向是考慮截面相關(guān)的面板數(shù)據(jù)模型的估計與推斷。與時序數(shù)據(jù)中度量序列相關(guān)不同,截面相關(guān)并沒有一個直接的度量方式。因此,為了刻畫模型的截面相關(guān),必須對模型施加很強的假定。常用的兩種度量截面相關(guān)的方法是空間的方法(spatial approac

13、h)和因子的方法(factor approach)??臻g的方法是通過空間加權(quán)矩陣建立起個體之間的相依性,往往用于刻畫由于經(jīng)濟活動的相互依賴、相互影響而呈現(xiàn)的相關(guān),如源于地理位置相近,文化、歷史的相似,或由于存在貿(mào)易往來、勞動力流動、產(chǎn)業(yè)結(jié)構(gòu)關(guān)聯(lián)等。由空間方法刻畫的截面相關(guān)反映不同個體之間存在一般的相關(guān)性,即截面相關(guān)陣的特征根有界,是一種截面弱相關(guān)。理論上空間加權(quán)矩陣可以出現(xiàn)在模型中的任何位置(因變量、自變量和擾動項),因自變量的空間相關(guān)不會產(chǎn)生新的估計問題,所以相關(guān)研究集中在因變量和擾動項的空間相關(guān),對應(yīng)的模型分別稱為空間滯后模型和空間誤差模型。這兩類模型一般采用工具變量估計(廣義矩估計)或極

14、大似然估計。因子的方法描述的是由凌駕于整個區(qū)域市場的經(jīng)濟波動或行政力量沖擊造成的結(jié)果,表現(xiàn)為一種共同沖擊,即不同個體之間的相關(guān)性是由某個共同的因子引起,因此截面相關(guān)陣存在O(n)階的發(fā)散特征根,屬于截面強相關(guān)。因子模型的一般形式為:(3)其中,是維的隨機因子,是維的非隨機因子載荷系數(shù)。代表異質(zhì)的沖擊,與相互獨立,且在截面之間相互獨立。Bai(2009)對式(3)所刻畫的因子模型的估計和推斷做了詳細(xì)的討論。Pesaran&Tosetti(2011)考慮了如下更一般的模型來同時刻畫截面強相關(guān)與截面弱相關(guān):(4)其中,是的可觀測的共同效應(yīng)(common effects),是的個體特質(zhì)的解釋變

15、量,是的不可觀測的共同因子,用于刻畫截面強相關(guān),假定存在空間相關(guān),用于刻畫截面弱相關(guān)。Pesaran&Tosetti(2011)指出,對于該模型,可以采用Pesaran(2006)提出的CCEP方法來得到參數(shù)的一致估計。除了上述討論的幾類面板數(shù)據(jù)模型外,文獻(xiàn)中還有很多其它類型的面板數(shù)據(jù)模型,如微觀計量模型中的離散因變量模型(包括靜態(tài)和動態(tài))、受限因變量模型(包括截斷和歸并)在面板數(shù)據(jù)下的擴展,以及非線性面板數(shù)據(jù)模型(閾值面板數(shù)據(jù)模型、平滑轉(zhuǎn)移的面板數(shù)據(jù)模型等)、多方程面板數(shù)據(jù)模型等等(Hsiao,2003;Baltagi,2008)。這些模型也是未來面板數(shù)據(jù)模型理論和應(yīng)用研究的重要發(fā)展

16、方向。 下面以例子來加以說明如何理解上述描述:例1:1996-2002年中國東北、華北、華東15個省級地區(qū)的居民家庭固定價格的人均消費(CP)和人均收入(IP)數(shù)據(jù)見5panel02.wf1。數(shù)據(jù)是7年的,每一年都有15個數(shù)據(jù),共105組(個)觀測值。人均消費和收入兩個面板數(shù)據(jù)都是平衡(balance)面板數(shù)據(jù),各有15個時間序列數(shù)據(jù)。人均消費和收入的面板數(shù)據(jù)從縱剖面觀察分別見圖2和圖3。從橫截面觀察分別見圖4和圖5。橫截面數(shù)據(jù)散點圖的表現(xiàn)與觀測值順序有關(guān)。圖4和圖5中人均消費和收入觀測值順序是按地區(qū)名的漢語拼音字母順序排序的。 圖2 15個省級地區(qū)的人均消費序列(縱剖面) 圖3 15個省級地

17、區(qū)的人均收入序列(5panel02)圖4 7個時點人均消費橫截面數(shù)據(jù)(含15個地區(qū)) 圖5 7個時點人均收入橫截面數(shù)據(jù)(含15個地區(qū))(每條連線數(shù)據(jù)表示同一年度15個地區(qū)的消費值) (每條連線數(shù)據(jù)表示同一年度15個地區(qū)的收入值)用CP表示消費,IP表示收入。AH, BJ, FJ, HB, HLJ, JL, JS, JX, LN, NMG, SD, SH, SX, TJ, ZJ分別表示安徽省、北京市、福建省、河北省、黑龍江省、吉林省、江蘇省、江西省、遼寧省、內(nèi)蒙古自治區(qū)、山東省、上海市、山西省、天津市、浙江省。圖6 人均消費對收入的面板數(shù)據(jù)散點圖(15個時間序列疊加)圖7 人均消費對收入的面板數(shù)

18、據(jù)散點圖(7個截面疊加) 圖8 北京和內(nèi)蒙古1996-2002年消費對收入散點圖 圖9 1996和2002年15個地區(qū)的消費對收入散點圖2面板數(shù)據(jù)模型分類用面板數(shù)據(jù)建立的模型通常有3種,即混合回歸模型、固定效應(yīng)回歸模型和隨機效應(yīng)回歸模型。2.1 混合回歸模型(Pooled model)。如果一個面板數(shù)據(jù)模型定義為, yit = a + Xit 'b +eit, i = 1, 2, , N; t = 1, 2, , T (1)其中yit為被回歸變量(標(biāo)量),a表示截距項,Xit為k ´1階回歸變量列向量(包括k個回歸量),b為k ´1階回歸系數(shù)列向量,eit為誤差項(

19、標(biāo)量)。則稱此模型為混合回歸模型?;旌匣貧w模型的特點是無論對任何個體和截面,回歸系數(shù)a和b都相同。如果模型是正確設(shè)定的,解釋變量與誤差項不相關(guān),即Cov(Xit,eit) = 0。那么無論是N®¥,還是T®¥,模型參數(shù)的混合最小二乘估計量(Pooled OLS)都是一致估計量。2.2 固定效應(yīng)回歸模型(fixed effects regression model)。固定效應(yīng)模型分為3種類型,即個體固定效應(yīng)回歸模型、時點固定效應(yīng)回歸模型和個體時點雙固定效應(yīng)回歸模型。下面分別介紹。2.2.1個體固定效應(yīng)回歸模型(entity fixed effects re

20、gression model)如果一個面板數(shù)據(jù)模型定義為, yit = ai + Xit 'b +eit, i = 1, 2, , N; t = 1, 2, , T (2)其中ai是隨機變量,表示對于i個個體有i個不同的截距項,且其變化與Xit有關(guān)系;yit為被回歸變量(標(biāo)量),eit為誤差項(標(biāo)量),Xit為k ´1階回歸變量列向量(包括k個回歸量),b為k ´1階回歸系數(shù)列向量,對于不同個體回歸系數(shù)相同,則稱此模型為個體固定效應(yīng)回歸模型。ai作為隨機變量描述不同個體建立的模型間的差異。因為ai是不可觀測的,且與可觀測的解釋變量Xit的變化相聯(lián)系,所以稱(2)式為

21、個體固定效應(yīng)回歸模型。個體固定效應(yīng)回歸模型也可以表示為 yit = a1 + a2 D2 + +aN DN + Xit 'b +eit, t = 1, 2, , T (3)其中Di =設(shè)定個體固定效應(yīng)回歸模型的原因如下。假定有面板數(shù)據(jù)模型 yit = b0 + b1 xit +b2 zi +eit, i = 1, 2, , N; t = 1, 2, , T (4)其中b0為常數(shù),不隨時間、截面變化;zi表示隨個體變化,但不隨時間變化的難以觀測的變量。上述模型可以被解釋為含有N個截距,即每個個體都對應(yīng)一個不同截距的模型。令ai = b0 +b2 zi,于是(4)式變?yōu)?yit = ai

22、+ b1 xit +eit, i = 1, 2, , N; t = 1, 2, , T (5)這正是個體固定效應(yīng)回歸模型形式。對于每個個體回歸函數(shù)的斜率相同(都是b1),截距ai卻因個體不同而變化??梢妭€體固定效應(yīng)回歸模型中的截距項ai中包括了那些隨個體變化,但不隨時間變化的難以觀測的變量的影響。ai是一個隨機變量。以案例1為例,省家庭平均人口數(shù)就是這樣的一個變量。對于短期面板來說,這是一個基本不隨時間變化的量,但是對于不同的省份,這個變量的值是不同的。以案例1為例(file:panel02)得到的個體固定效應(yīng)模型估計結(jié)果如下:注意:個體固定效應(yīng)模型的EViwes輸出結(jié)果中沒有公共截距項。圖1

23、0 個體固定效應(yīng)回歸模型的估計結(jié)果2.2.2 時點固定效應(yīng)回歸模型(time fixed effects regression model)如果一個面板數(shù)據(jù)模型定義為, yit = gt + Xit 'b +eit, i = 1, 2, , N (6)其中g(shù)t是模型截距項,隨機變量,表示對于T個截面有T個不同的截距項,且其變化與Xit有關(guān)系;yit為被回歸變量(標(biāo)量),eit為誤差項(標(biāo)量),滿足通常假定條件。Xit為k ´1階回歸變量列向量(包括k個回歸變量),b為k ´1階回歸系數(shù)列向量,則稱此模型為時點固定效應(yīng)回歸模型。時點固定效應(yīng)回歸模型也可以加入虛擬變量表

24、示為 yit = g1 + g2 W2 + +g T WT + Xit 'b +eit, i = 1, 2, , N; t = 1, 2, , T (7)其中Wt =設(shè)定時點固定效應(yīng)回歸模型的原因。假定有面板數(shù)據(jù)模型 yit = b0 + b1 xit +b2 zt +eit, i = 1, 2, , N; t = 1, 2, , T (8)其中b0為常數(shù),不隨時間、截面變化;zt表示隨不同截面(時點)變化,但不隨個體變化的難以觀測的變量。上述模型可以被解釋為含有T個截距,即每個截面都對應(yīng)一個不同截距的模型。令gt = b0 +b2 zt,于是(8)式變?yōu)?yit = gt + b1

25、xit +eit, i = 1, 2, , N; t = 1, 2, , T (9)這正是時點固定效應(yīng)回歸模型形式。對于每個截面,回歸函數(shù)的斜率相同(都是b1),gt卻因截面(時點)不同而異??梢姇r點固定效應(yīng)回歸模型中的截距項gt包括了那些隨不同截面(時點)變化,但不隨個體變化的難以觀測的變量的影響。gt是一個隨機變量。以案例1為例,“全國零售物價指數(shù)”就是這樣的一個變量。對于不同時點,這是一個變化的量,但是對于不同省份(個體),這是一個不變化的量。圖112.2.3 個體時點雙固定效應(yīng)回歸模型(time and entity fixed effects regression model)如果一

26、個面板數(shù)據(jù)模型定義為, yit = ai +gt + Xit 'b +eit, i = 1, 2, , N; t = 1, 2, , T (11)其中yit為被回歸變量(標(biāo)量);ai是隨機變量,表示對于N個個體有N個不同的截距項,且其變化與Xit有關(guān)系;gt是隨機變量,表示對于T個截面(時點)有T個不同的截距項,且其變化與Xit有關(guān)系;Xit為k ´1階回歸變量列向量(包括k個回歸量);b為k ´1階回歸系數(shù)列向量;eit為誤差項(標(biāo)量)滿足通常假定(eit êXit, ai, gt) = 0;則稱此模型為個體時點固定效應(yīng)回歸模型。個體時點固定效應(yīng)回歸模型

27、還可以表示為, yit = a1+a2 D2 +aN DN +g2 W2 +g T WT + Xit 'b +eit, t = 1, 2, , (12)其中 Di = (13)Wt = (14)如果模型形式是正確設(shè)定的,并且滿足模型通常的假定條件,對模型(12)進(jìn)行混合OLS估計,全部參數(shù)估計量都是不一致的。正如個體固定效應(yīng)回歸模型可以得到一致的、甚至有效的估計量一樣,一些計算方法也可以使個體時點雙固定效應(yīng)回歸模型得到更有效的參數(shù)估計量。以例1為例得到的截面、時點固定效應(yīng)模型估計結(jié)果如下:圖12回歸系數(shù)為0.67,這與個體固定效應(yīng)回歸模型給出的估計結(jié)果0.70基本一致。在上述三種固定效

28、應(yīng)回歸模型中,個體固定效應(yīng)回歸模型最為常用。2.3 隨機效應(yīng)模型對于面板數(shù)據(jù)模型 yit = ai + Xit'b +eit, i = 1, 2, , N; t = 1, 2, , T (15)如果ai為隨機變量,其分布與Xit無關(guān);yit為被回歸變量(標(biāo)量),eit為誤差項(標(biāo)量),Xit為k ´1階回歸變量列向量(包括k個回歸量),b為k ´1階回歸系數(shù)列向量,對于不同個體回歸系數(shù)相同,這種模型稱為個體隨機效應(yīng)回歸模型(隨機截距模型、隨機分量模型)。其假定條件是ai iid(a, sa2), eit iid(0, se2)都被假定為獨立同分布,但并未限定何種分布

29、。 同理也可定義時點隨機效應(yīng)回歸模型和個體時點隨機效應(yīng)回歸模型,但個體隨機效應(yīng)回歸模型最為常用。個體隨機效應(yīng)模型又稱為等相關(guān)模型(Equicorrelated model)。原因如下。隨機效應(yīng)模型可以看作是混合模型的特例。對于個體隨機效應(yīng)回歸模型yit = ai + Xit 'b +eit,可以把ai并入誤差項eit。模型改寫為yit = Xit 'b + (ai +eit) = Xit 'b + uit (16)其中uit = (ai +eit)。如果有ai(a, sa2),eit (0, se2)成立,那么,Cov(uit,uis) = Cov(ai +eit)(

30、ai +eis) = (17)因為對于t ¹ s,有r(uit,uis) = = (18)相關(guān)系數(shù)r(uit,uis)與 (t s) 即相隔期數(shù)長短無關(guān)。所以個體隨機效應(yīng)模型也稱作等相關(guān)模型,或者可交換誤差模型(exchangeable model)。對于個體隨機效應(yīng)模型,E(ai êXit) = a,則有,E(yit êxit) = a + Xit'b,對yit可以識別。所以隨機效應(yīng)模型參數(shù)的混合OLS估計量具有一致性,但不具有有效性。注意:“固定效應(yīng)模型”這個術(shù)語用得并不十分恰當(dāng),容易產(chǎn)生誤解。其實固定效應(yīng)模型應(yīng)該稱之為“相關(guān)效應(yīng)模型”,而隨機效應(yīng)模型

31、應(yīng)該稱之為“非相關(guān)效應(yīng)模型”。因為固定效應(yīng)模型和隨機效應(yīng)模型中的ai都是隨機變量。3面板數(shù)據(jù)模型估計方法面板數(shù)據(jù)模型中b的估計量既不同于截面數(shù)據(jù)估計量,也不同于時間序列估計量,其性質(zhì)隨設(shè)定固定效應(yīng)模型是否正確而變化。3.1 混合最小二乘(Pooled OLS)估計混合OLS估計方法是在時間上和截面上把NT個觀測值混合在一起,然后用OLS法估計模型參數(shù)。給定混合模型 yit = a + Xit 'b +eit, i = 1, 2, , N; t = 1, 2, , T (19)如果模型是正確設(shè)定的,且解釋變量與誤差項不相關(guān),即Cov(Xit,eit) = 0。那么無論是N®&#

32、165;,還是T®¥,模型參數(shù)的混合最小二乘估計量都具有一致性。對混合模型通常采用的是混合最小二乘(Pooled OLS)估計法。然而,在誤差項服從獨立同分布條件下由OLS法得到的方差協(xié)方差矩陣,在這里通常不會成立。因為對于每個個體i及其誤差項來說通常是序列相關(guān)的。NT個相關(guān)觀測值要比NT個相互獨立的觀測值包含的信息少。從而導(dǎo)致誤差項的標(biāo)準(zhǔn)差常常被低估,估計量的精度被虛假夸大。如果模型存在個體固定效應(yīng),即ai與Xit相關(guān),那么對模型應(yīng)用混合OLS估計方法,估計量不再具有一致性。解釋如下:假定模型實為個體固定效應(yīng)模型yit = ai + Xit 'b +eit,但卻當(dāng)

33、作混合模型來估計參數(shù),則模型可寫為yit = a + Xit 'b + (ai -a +eit) = a + Xit 'b + uit (20)其中uit = (ai -a +eit)。因為ai與Xit相關(guān),也即uit與Xit相關(guān),所以個體固定效應(yīng)模型的參數(shù)若采用混合OLS估計,估計量不具有一致性。3.2平均(between)OLS估計 平均OLS估計法的步驟是首先對面板數(shù)據(jù)中的每個個體求平均數(shù),共得到N個平均數(shù)(估計值)。然后利用yit和Xit的N組觀測值估計參數(shù)。以個體固定效應(yīng)回歸模型yit = ai + Xit 'b +eit (21)為例,首先對面板中的每個個體

34、求平均數(shù),從而建立模型= ai +'b +, i = 1, 2, , N (22)其中=,=,=,i = 1, 2, , N。變換上式得= a +'b +(a i - a +), i = 1, 2, , N (23)上式稱作平均模型。對上式應(yīng)用OLS估計,則參數(shù)估計量稱作平均OLS估計量。此條件下的樣本容量為N,(T=1)。 如果與(a i - a +)相互獨立,a和b的平均OLS估計量是一致估計量。平均OLS估計法適用于短期面板的混合模型和個體隨機效應(yīng)模型。對于個體固定效應(yīng)模型來說,由于ai和Xit相關(guān),也即ai和相關(guān),所以,回歸參數(shù)的平均OLS估計量是非一致估計量。3.3

35、離差(within)OLS估計 對于短期面板數(shù)據(jù),離差OLS估計法的原理是先把面板數(shù)據(jù)中每個個體的觀測值變換為對其平均數(shù)的離差觀測值,然后利用離差數(shù)據(jù)估計模型參數(shù)。具體步驟是,對于個體固定效應(yīng)回歸模型yit = ai + Xit'b +eit (24)中的每個個體計算平均數(shù),可得到如下模型,= ai +'b +其中、的定義見(22)式。上兩式相減,消去了ai,得yit -= (Xit -)'b + (eit -)此模型稱作離差數(shù)據(jù)模型。對上式應(yīng)用OLS估計,所得b的估計量稱作離差OLS估計量。對于個體固定效應(yīng)回歸模型,b的離差OLS估計量是一致估計量。如果eit還滿足獨

36、立同分布條件,b的離差OLS估計量不但具有一致性而且還具有有效性。如果對固定效應(yīng)ai感興趣,也可按下式估計。=-' (27)個體固定效應(yīng)回歸模型的估計通常采用的就是離差(within)OLS估計法。在短期面板條件下,即便ai的分布、以及ai和Xit的關(guān)系都已知到,ai的估計量仍不具有一致性。當(dāng)個體數(shù)N不大時,可采用OLS虛擬變量估計法估計ai和b。離差OLS估計法的主要缺點是不能估計非時變回歸變量構(gòu)成的面板數(shù)據(jù)模型。比如Xit = Xi(非時變變量),那么有= Xi,計算離差時有Xi -= 0。3.4 一階差分(first difference)OLS估計 在短期面板條件下,一階差分O

37、LS估計就是對個體固定效應(yīng)模型中的回歸量與被回歸量的差分變量構(gòu)成的模型的參數(shù)進(jìn)行OLS估計。具體步驟是,對個體固定效應(yīng)回歸模型yit = ai + Xit 'b +eit取其滯后一期關(guān)系式y(tǒng)it-1 = ai + Xit-1'b +eit-1上兩式相減,得一階差分模型(ai被消去)yit -yit-1 = (Xit - Xit -1) 'b + (eit -eit-1) , i = 1, 2, , N; t = 1, 2, , T對上式應(yīng)用OLS估計得到的b的估計量稱作一階差分OLS估計量。盡管ai不能被估計,b的估計量是一致估計量。 在T>2,eit獨立同分布條

38、件下得到的b的一階差分OLS估計量不如離差OLS估計量有效。3.5 隨機效應(yīng)(random effects)估計法(可行GLS(feasible GLS)估計法)有個體固定效應(yīng)模型yit = ai + Xit 'b +eiai,eit服從獨立同分布。對其作如下變換yit -= (1-)m + (Xit -)'b + vit (29)其中vit = (1-)ai + (eit -)漸近服從獨立同分布,l = 1-,應(yīng)用OLS估計,則所得估計量稱為隨機效應(yīng)估計量或可行GLS估計量。當(dāng)= 0時,(29)式等同于混合OLS估計;當(dāng)=1時,(29)式等同于離差OLS估計。 對于隨機效應(yīng)模

39、型,可行GLS估計量不但是一致估計量,而且是有效估計量,但對于個體固定效應(yīng)模型,可行GLS估計量不是一致估計量。面板數(shù)據(jù)模型估計量的穩(wěn)健統(tǒng)計推斷。在實際的經(jīng)濟面板數(shù)據(jù)中,N個個體之間相互獨立的假定通常是成立的,但是每個個體本身卻常常是序列自相關(guān)的,且存在異方差。為了得到正確的統(tǒng)計推斷,需要克服這兩個因素。對于第i個個體,當(dāng)N®¥,Xi×的方差協(xié)方差矩陣仍然是T´T有限階的,所以可以用以前的方法克服異方差。采用GMM方法還可以得到更有效的估計量。EViwes中對隨機效應(yīng)回歸模型的估計采用的就是可行(feasible )GLS估計法。4面板數(shù)據(jù)模型設(shè)定檢驗方

40、法4.1 F檢驗先介紹原理。F統(tǒng)計量定義為 其中SSEr 表示施加約束條件后估計模型的殘差平方和,SSEu 表示未施加約束條件的估計模型的殘差平方和,m表示約束條件個數(shù),T 表示樣本容量,k表示未加約束的模型中被估參數(shù)的個數(shù)。在原假設(shè)“約束條件真實”條件下,F(xiàn)統(tǒng)計量漸近服從自由度為( m , T k )的F分布。以檢驗個體固定效應(yīng)回歸模型為例,介紹F檢驗的應(yīng)用。建立假設(shè)H0:ai =a。模型中不同個體的截距相同(真實模型為混合回歸模型)。H1:模型中不同個體的截距項ai不同(真實模型為個體固定效應(yīng)回歸模型)。F統(tǒng)計量定義為:F= (31)其中SSEr表示約束模型,即混合估計模型的殘差平方和,S

41、SEu表示非約束模型,即個體固定效應(yīng)回歸模型的殘差平方和。非約束模型比約束模型多了N-1個被估參數(shù)。以案例1為例,已知SSEr= 4824588,SSEu= 2270386,F(xiàn)= = 8.1 (32)F0.05(6, 87) = 1.8因為F= 8.1 > F0.05(14, 89) = 1.8,推翻原假設(shè),比較上述兩種模型,建立個體固定效應(yīng)回歸模型更合理。4.2 Hausman檢驗對同一參數(shù)的兩個估計量差異的顯著性檢驗稱作Hausman檢驗,簡稱H檢驗。H檢驗由Hausman1978年提出,是在Durbin(1914)和Wu(1973)基礎(chǔ)上發(fā)展起來的。所以H檢驗也稱作Wu-Hausm

42、an檢驗,和Durbin-Wu-Hausman檢驗。先介紹Hausman檢驗原理例如在檢驗單一方程中某個回歸變量(解釋變量)的內(nèi)生性問題時得到相應(yīng)回歸參數(shù)的兩個估計量,一個是OLS估計量、一個是2SLS估計量。其中2SLS估計量用來克服回歸變量可能存在的內(nèi)生性。如果模型的解釋變量中不存在內(nèi)生性變量,那么OLS估計量和2SLS估計量都具有一致性,都有相同的概率極限分布。如果模型的解釋變量中存在內(nèi)生性變量,那么回歸參數(shù)的OLS估計量是不一致的而2SLS估計量仍具有一致性,兩個估計量將有不同的概率極限分布。更一般地,假定得到q個回歸系數(shù)的兩組估計量和,則H檢驗的零假設(shè)和被擇假設(shè)是:H0: plim(

43、-) = 0H1: plim(-) ¹ 0假定兩個估計量的差作為統(tǒng)計量也具有一致性,在H0成立條件下, (-) N(0, VH)其中VH是(-)的極限分布方差矩陣。則H檢驗統(tǒng)計量定義為H = (-)' (N-1)-1 (-) ® c2(q) (33)其中(N-1)是(-)的估計的方差協(xié)方差矩陣。在H0成立條件下,H統(tǒng)計量漸近服從c2(q)分布。其中q表示零假設(shè)中約束條件個數(shù)。H檢驗原理很簡單,但實際中VH的一致估計量并不容易。一般來說,N-1= Var(-) = Var()+Var()-2Cov(,) (34)Var(),Var()在一般軟件計算中都能給出。但Cov

44、(,)不能給出。致使H統(tǒng)計量(33)在實際中無法使用。實際中也常進(jìn)行如下檢驗。H0:模型中所有解釋變量都是外生的。H1:其中某些解釋變量都是內(nèi)生的。在原假設(shè)成立條件下, H = (-)' (-)-1 (-)c2(k) (36)其中和分別是對Var()和Var()的估計。與(34)式比較,這個結(jié)果只要求計算Var()和Var(),H統(tǒng)計量(36)具有實用性。當(dāng)q表示一個標(biāo)量時,H統(tǒng)計量(36)退化為, H = c2(1)其中和分別表示和的樣本方差值。H檢驗用途很廣??捎脕碜瞿P蛠G失變量的檢驗、變量內(nèi)生性檢驗、模型形式設(shè)定檢驗、模型嵌套檢驗、建模順序檢驗等。下面詳細(xì)介紹面板數(shù)據(jù)中利用H統(tǒng)計

45、量進(jìn)行模型形式設(shè)定的檢驗。假定面板模型的誤差項滿足通常的假定條件,如果真實的模型是隨機效應(yīng)回歸模型,那么b的離差OLS估計量和隨機GLS法估計量都具有一致性。如果真實的模型是個體固定效應(yīng)回歸模型,則參數(shù)b的離差OLS法估計量是一致估計量,但隨機GLS估計量是非一致估計量??梢酝ㄟ^H統(tǒng)計量檢驗(-)的非零顯著性,檢驗面板數(shù)據(jù)模型中是否存在個體固定效應(yīng)。原假設(shè)與備擇假設(shè)是H0: 個體效應(yīng)與回歸變量無關(guān)(個體隨機效應(yīng)回歸模型)H1: 個體效應(yīng)與回歸變量相關(guān)(個體固定效應(yīng)回歸模型)例:=0.7747,s() = 0.00868(計算結(jié)果對應(yīng)圖15);=0.7246,s() = 0.0106(計算結(jié)果取

46、自EViwes個體固定效應(yīng)估計結(jié)果) H = = = 68.4因為H =68.4 > c20.05 (1) = 3.8,所以模型存在個體固定效應(yīng)。應(yīng)該建立個體固定效應(yīng)回歸模型。5面板數(shù)據(jù)建模案例分析 圖13 混合估計散點圖 圖14 平均估計散點圖以案例1為例,圖13是混合估計對應(yīng)數(shù)據(jù)的散點圖?;貧w結(jié)果如下CP = 129.63 + 0.76 IP(2.0) (79.7)圖14是平均值數(shù)據(jù)散點圖。先對數(shù)據(jù)按個體求平均數(shù)和。然后用15組平均值數(shù)據(jù)回歸,= -40.88+0.79(-0.3) (41.1) 圖15 離差估計散點圖 圖16 差分估計散點圖圖15是離差數(shù)據(jù)散點圖。先計算CP、IP分

47、別對、的離差數(shù)據(jù),然后用離差數(shù)據(jù)計算OLS回歸。CPM = 0.77 IPM (90)圖16是一階差分?jǐn)?shù)據(jù)散點圖。先對CP、IP各個體作一階差分,然后用一階差分?jǐn)?shù)據(jù)回歸。DCP = 0.71 DIP(24)案例2(file:5panel01a)美國公路交通事故死亡人數(shù)與啤酒稅的關(guān)系研究見Stock J H and M W Watson, Introduction to Econometrics, Addison Wesley, 2003第8章。美國每年有4萬高速公路交通事故,約1/3涉及酒后駕車。這個比率在飲酒高峰期會上升。早晨13點25%的司機飲酒。飲酒司機出交通事故數(shù)是不飲酒司機的13倍。

48、現(xiàn)有19821988年48個州共336組美國公路交通事故死亡人數(shù)(number)與啤酒稅(beertax)的數(shù)據(jù)。 圖17 1982年數(shù)據(jù)散點圖(File: 5panel01a-graph01) 圖18 1988年數(shù)據(jù)散點圖(File:5panel01a- graph07)1982年數(shù)據(jù)的估計結(jié)果(散點圖見圖17)1982 = 2.01 + 0.15 beertax1982 (0.15) (0.13)1988年數(shù)據(jù)的估計結(jié)果(散點圖見圖18)1988 = 1.86 + 0.44 beertax1988 (0.11) (0.13)圖19 混合估計共336個觀測值。估計結(jié)果仍不可靠。(file:

49、5panel01b)19821988年混合數(shù)據(jù)估計結(jié)果(散點圖見圖19)19821988 = 1.85 + 0.36 beertax19821988 (42.5) (5.9) SSE=98.75顯然以上三種估計結(jié)果都不可靠(回歸參數(shù)符號不對)。原因是啤酒稅之外還有許多因素影響交通事故死亡人數(shù)。個體固定效應(yīng)估計結(jié)果(散點圖見圖1)it = 2.375 + - 0.66 beertax it (24.5) (-3.5) SSE=10.35雙固定效應(yīng)估計結(jié)果(散點圖見圖1)it = 2.37 + - 0.65 beertax it (23.3) (-3.25) SSE=9.92以上兩種回歸系數(shù)的估計

50、結(jié)果非常近似。下面的F檢驗證實參數(shù)-0.66和0.65比較合理。用F檢驗判斷應(yīng)該建立混合模型還是個體固定效應(yīng)模型。H0:ai =a?;旌匣貧w模型(約束截距項為同一參數(shù))。H1:ai各不相同。個體固定效應(yīng)回歸模型(截距項任意取值)F= (以EViwes5.0計算自由度) = 50.8F0.05(48, 286) = 1.2因為F= 50.8 > F0.05(14, 89) = 1.2,推翻原假設(shè),比較上述兩種模型,建立個體固定效應(yīng)回歸模型更合理。下面討論面板差分?jǐn)?shù)據(jù)的估計結(jié)果。利用1988年和1982年數(shù)據(jù)的差分?jǐn)?shù)據(jù)得估計結(jié)果(散點圖見圖3)1988 -1982 = -0.072 - 1.

51、04 (beertax1988 - beertax1982) (0.065) (0.36) 圖20 差分?jǐn)?shù)據(jù)散點圖(File:5panel01a- graph08)6面板數(shù)據(jù)的單位根檢驗下面介紹幾種檢驗方法。6.1 LLC(Levin-Lin-Chu,2002)檢驗(適用于相同根(common root)情形)LLC檢驗原理是仍采用ADF檢驗式形式。但使用的卻是和的剔出自相關(guān)和確定項影響的、標(biāo)準(zhǔn)的代理變量。具體做法是(1)先從D yit和yit中剔出自相關(guān)和確定項的影響,并使其標(biāo)準(zhǔn)化,成為代理變量。(2)用代理變量做ADF回歸,=r + vit。LLC 修正的漸近服從N(0,1)分布。詳細(xì)步驟

52、如下:H0: r = 0(有單位根); H1: r < 0。LLC檢驗為左單端檢驗。LLC檢驗以如下ADF檢驗式為基礎(chǔ): D yit = r yi t-1 +D yi t-j + Zit'f + eit, i = 1, 2, , N; t = 1, 2, , T (38)其中Zit表示外生變量(確定性變量)列向量,f 表示回歸系數(shù)列向量。(1)估計代理變量。首先確定附加項個數(shù)ki,然后作如下兩個回歸式, D yit = D yi t-j + Zit'+ yi t-1 = D yi t-j + Zit'+移項得 = D yit -D yi t-j - Zit' = yit -D yi t-j - Zit'把和標(biāo)準(zhǔn)化, = /si = /si其中si, i = 1, 2, , N 是用(38)式對每個個體回歸時得到的殘差的標(biāo)準(zhǔn)差,從而得到D yit和yit-1的代理變量和。(2)用代理變量和作如下回歸,=r+ vitLLC證明,上式中估計量的如下修正的統(tǒng)計量漸近地服從標(biāo)準(zhǔn)正態(tài)分布。= ® N (0, 1)其中表示標(biāo)準(zhǔn)的t統(tǒng)計量;N是截面容量;=T-1,(T為個體容量);SN是每個個體長期標(biāo)準(zhǔn)差與新息標(biāo)準(zhǔn)差之比的平均數(shù);是誤差項vit的方差;是標(biāo)準(zhǔn)誤差;和分別是均值和標(biāo)準(zhǔn)差的調(diào)整項。 見圖21輸出結(jié)果,LLC = 9.

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負(fù)責(zé)。
  • 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時也不承擔(dān)用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

評論

0/150

提交評論