內(nèi)生性產(chǎn)生的原因及解決方案課件_第1頁
內(nèi)生性產(chǎn)生的原因及解決方案課件_第2頁
內(nèi)生性產(chǎn)生的原因及解決方案課件_第3頁
內(nèi)生性產(chǎn)生的原因及解決方案課件_第4頁
內(nèi)生性產(chǎn)生的原因及解決方案課件_第5頁
已閱讀5頁,還剩110頁未讀 繼續(xù)免費閱讀

下載本文檔

版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進行舉報或認領(lǐng)

文檔簡介

第五講內(nèi)生性內(nèi)生性產(chǎn)生的原因及解決方案OLS經(jīng)典假設(shè)

所有的解釋變量Xi與隨機誤差項彼此之間不相關(guān)。若解釋變量Xi和ui相關(guān),則OLS估計量是非一致的,也就是即使當樣本容量很大時,OLS估計量也不會接近回歸系數(shù)的真值。當解釋變量和隨機誤差項相關(guān)時,模型存在著內(nèi)生性問題。內(nèi)生性產(chǎn)生的原因及解決方案在計量經(jīng)濟學中,把所有與擾動項相關(guān)的解釋變量都稱為“內(nèi)生變量”。這與一般經(jīng)濟學理論中的定義有所不同。1。與誤差項相關(guān)的變量稱為內(nèi)生變量(endogenousvariable)。2。與誤差項不相關(guān)的變量稱為外生變量(exogenousvariable)。內(nèi)生性產(chǎn)生的原因及解決方案造成誤差項與回歸變量相關(guān)(內(nèi)生性)的原因很多,但我們主要考慮如下幾個方面:遺漏變量偏差變量有測量誤差雙向因果關(guān)系。內(nèi)生性產(chǎn)生的原因及解決方案遺漏變量偏差內(nèi)生性產(chǎn)生的原因及解決方案內(nèi)生性產(chǎn)生的原因及解決方案變量有測量誤差測量數(shù)據(jù)正確時:假設(shè)方程為:當存在測量誤差時:方程為:所以我們有:內(nèi)生性產(chǎn)生的原因及解決方案可知,誤差項中包含所以可以得到:如果則回歸結(jié)果有偏,非一致我們假設(shè)則有內(nèi)生性產(chǎn)生的原因及解決方案結(jié)論:1。由于2?;貧w的性質(zhì)決定于w的標準差內(nèi)生性產(chǎn)生的原因及解決方案雙向因果關(guān)系之前我們假定因果關(guān)系是從回歸變量到因變量的(X導(dǎo)致了Y)。但如果因果關(guān)系同時也是從因變量到一個或多個回歸變量(Y導(dǎo)致了X)的呢?如果是這樣的話,因果關(guān)系是向前的也是“向后”的,即存在雙向因果關(guān)系,如果存在雙向因果關(guān)系,則OLS回歸中同時包含了這兩個效應(yīng),因此OLS估計量是有偏的、非一致的。內(nèi)生性產(chǎn)生的原因及解決方案可以推導(dǎo)出:內(nèi)生性產(chǎn)生的原因及解決方案檢驗方法:豪斯曼檢驗檢驗豪斯曼檢驗(Hausmanspecificationtest)H0:所有解釋變量均為外生變量。H1:至少有一個解釋變量為內(nèi)生變量。

quietlyreglw80s80expr80tenure80iqeststoreolsquietlyivregress2slslw80expr80tenure80(s80iq=medkwwmrtage)eststoreivhausmanivols,若Hausman檢驗失效(檢驗統(tǒng)計量為負值),則使用dmexogxt,否則仍Hausman檢驗為主。內(nèi)生性產(chǎn)生的原因及解決方案使用Davidson-MacKinnon檢驗xtivreg后使用dmexogxt*Davidson-MacKinnon(1993)檢驗

*H0:OLS和xtivreg都是一致的,即內(nèi)生性問題對OLS的估計結(jié)果影響不大

xtivregtlsizendtstang(npr=tobinL1.npr),fe

dmexogxt

Davidson-MacKinnon檢驗得到F統(tǒng)計量的P值小于0.05,代表有內(nèi)生性內(nèi)生性產(chǎn)生的原因及解決方案遺漏變量偏差可采用在多元回歸中加入遺漏變量的方法加以解決,但前提是只有當你有遺漏變量數(shù)據(jù)時上述方法才可行。雙向因果關(guān)系偏差是指如果有時因果關(guān)系是從X到Y(jié)又從Y到X時,此時僅用多元回歸無法消除這一偏差。同樣,變量有測量誤差也無法用我們前面學過的方法解決。因此我們就必須尋找一種新的方法。內(nèi)生性產(chǎn)生的原因及解決方案二、內(nèi)生性的解決方案

事實上,僅僅為了解決內(nèi)生性問題,并不需要我們對內(nèi)生性問題的緣起有很深入的理解。對于應(yīng)用型的實證研究而言,我們只需要掌握解決內(nèi)生性問題的具體方案即可。內(nèi)生性問題的解決方案一共四種,理論上來講,這四種方案應(yīng)對內(nèi)生性問題都很有效。但于我個人而言,我對四種方法的評價是有高低的,由高到低分別介紹如下。

內(nèi)生性產(chǎn)生的原因及解決方案1.自然實驗法所謂自然實驗,就是發(fā)生了某些外部突發(fā)事件,使得研究對象仿佛被隨機分成了實驗組或控制組。這是我最喜歡的方法,只是自然實驗需要尋找一個事件,并且這個事件只影響解釋變量而不影響被解釋變量。遇著這種事件是一種緣分,還要能識別出來,這對學者的眼光也是一種挑戰(zhàn)。有很多文章聲稱使用了自然實驗,但嚴格來講,并沒有做到對研究對象進行了隨機分組。雖然如此,我對此類文章仍然很是喜歡。

內(nèi)生性產(chǎn)生的原因及解決方案自然實驗包括的要素有:一個政策措施(treatment),一個觀察到的結(jié)果(outeome),一個對照組(contorlgoruP)。在評估“政策措施”對“結(jié)果”是否發(fā)揮作用時,對照組充當一個參照系。而一個“準自然實驗”和自然實驗的區(qū)別在于處理組和對照組的選取是否隨機。這里的“結(jié)果”是以受政策影響的縣和沒有受政策影響的縣之間在增長速度上的差異來衡量。簡單連接改革措施和被直管縣績效的做法并不恰當。這樣的做法無法排除其他政策或是整體經(jīng)濟的影響,因而是無法衡量改革真實效果的。17內(nèi)生性產(chǎn)生的原因及解決方案2.雙重差分法

Difference-in-Difference

(DID)一般稱為雙重差分法,或倍差法。倘若出現(xiàn)了一次外部沖擊,這次沖擊影響了一部分樣本,對另一部分樣本則無影響,而我們想看一下這次外部沖擊到底有何影響,雙重差分法就是用來研究這次沖擊的凈效應(yīng)的。其基本思想是,將受沖擊的樣本視作實驗組,再按照一定標準在未受沖擊的樣本中尋求與實驗組匹配的對照組,而后做差,做差剩下來的便是這次沖擊的凈效應(yīng)。雙重差分法實際上是固定效應(yīng)的一個變種,差分的過程實際上是排除固定效應(yīng)的過程。ZERA在《計量論文寫作和發(fā)表的黑客教程》有一個非常簡明風趣的舉例,我轉(zhuǎn)述于此,以饗讀者。內(nèi)生性產(chǎn)生的原因及解決方案DifferenceindifferencemodelsMaybethemostpopularidentificationstrategyinappliedworktodayAttemptstomimicrandomassignmentwithtreatmentand“comparison”sampleApplicationoftwo-wayfixedeffectsmodel19內(nèi)生性產(chǎn)生的原因及解決方案ProblemsetupCross-sectionalandtimeseriesdataOnegroupis‘treated’withinterventionHavepre-postdataforgroupreceivinginterventionCanexaminetime-serieschangesbut,unsurehowmuchofthechangeisduetosecularchanges20內(nèi)生性產(chǎn)生的原因及解決方案DifferenceindifferencemodelsBasictwo-wayfixedeffectsmodelCrosssectionandtimefixedeffectsUsetimeseriesofuntreatedgrouptoestablishwhatwouldhaveoccurredintheabsenceoftheinterventionKeyconcept:cancontrolforthefactthattheinterventionismorelikelyinsometypesofstates21內(nèi)生性產(chǎn)生的原因及解決方案ThreedifferentpresentationsTabularGraphicalRegressionequation22內(nèi)生性產(chǎn)生的原因及解決方案DifferenceinDifferenceBeforeChangeAfterChangeDifferenceGroup1(Treat)Yt1Yt2ΔYt=Yt2-Yt1Group2(Control)Yc1Yc2ΔYc=Yc2-Yc1DifferenceΔΔYΔYt–ΔYc23內(nèi)生性產(chǎn)生的原因及解決方案timeYt1t2Yt1Yt2treatmentcontrolYc1Yc2Treatmenteffect=(Yt2-Yt1)–(Yc2-Yc1)24內(nèi)生性產(chǎn)生的原因及解決方案KeyAssumptionControlgroupidentifiesthetimepathofoutcomesthatwouldhavehappenedintheabsenceofthetreatmentInthisexample,YfallsbyYc2-Yc1

evenwithouttheinterventionNotethatunderlying‘levels’ofoutcomesarenotimportant(returntothisintheregressionequation)25內(nèi)生性產(chǎn)生的原因及解決方案BasicEconometricModelDatavariesbystate(i)time(t)OutcomeisYitOnlytwoperiodsInterventionwilloccurinagroupofobservations(e.g.states,firms,etc.)26內(nèi)生性產(chǎn)生的原因及解決方案ThreekeyvariablesTit=1ifobsibelongsinthestatethatwilleventuallybetreatedAit=1intheperiodswhentreatmentoccursTitAit--interactionterm,treatmentstatesaftertheinterventionYit=β0+β1Tit+β2Ait+β3TitAit+εit27內(nèi)生性產(chǎn)生的原因及解決方案Yit=β0+β1Tit+β2Ait+β3TitAit+εitBeforeChangeAfterChangeDifferenceGroup1(Treat)β0+β1β0+β1+β2+β3ΔYt

=β2+β3Group2(Control)β0β0+β2ΔYc=β2DifferenceΔΔY=β328內(nèi)生性產(chǎn)生的原因及解決方案MoregeneralmodelDatavariesbystate(i)time(t)OutcomeisYitManyperiodsInterventionwilloccurinagroupofstatesbutatavarietyoftimes29內(nèi)生性產(chǎn)生的原因及解決方案uiisastateeffectvtisacompletesetofyear(time)effectsAnalysisofcovariancemodelYit=β0+β3TitAit+ui+λt+εit30內(nèi)生性產(chǎn)生的原因及解決方案GroupeffectsCapturedifferencesacrossgroupsthatareconstantovertimeYeareffectsCapturedifferencesovertimethatarecommontoallgroups31內(nèi)生性產(chǎn)生的原因及解決方案其中,d就是雙重差分估計量,Y為研究的結(jié)局變量,右側(cè)腳標中treatment和control分布代表干預(yù)組和對照組,t0和t1分別代表干預(yù)前和干預(yù)后。構(gòu)造了差分估計量之后,就要根據(jù)不同的數(shù)據(jù)類型和不同的結(jié)局變量Y,分別選用相應(yīng)的參數(shù)檢驗方法來進行建模。32內(nèi)生性產(chǎn)生的原因及解決方案(1)適用于獨立混合橫截面數(shù)據(jù)獨立混合橫截面數(shù)據(jù)是在不同時點從同一個的大總體內(nèi)部分別進行隨機抽樣,將所得的數(shù)據(jù)混合起來的一種數(shù)據(jù)集。該類數(shù)據(jù)的特點為每一條數(shù)據(jù)都是獨立的觀測值。通過將不同時點的多個觀測值結(jié)合起來,從而可以加大樣本量以獲得更精密的估計量和更具功效的檢驗統(tǒng)計量;也可加入新的變量———時間(即干預(yù)前后),以便判斷干預(yù)前后的差別。對于總體一致、范圍較大、涉及不同時間點的調(diào)查研究,多收集此類數(shù)據(jù)33內(nèi)生性產(chǎn)生的原因及解決方案34內(nèi)生性產(chǎn)生的原因及解決方案35內(nèi)生性產(chǎn)生的原因及解決方案36內(nèi)生性產(chǎn)生的原因及解決方案(2)適用于綜列數(shù)據(jù)面板數(shù)據(jù)的DID模型面板數(shù)據(jù)要求在不同時點調(diào)查相同的研究對象。它與獨立混合橫截面數(shù)據(jù)最大的不同在于,不同時點的觀測值并不是獨立分布的。這類數(shù)據(jù)的特點在于:由于研究的個體相同,一些不隨時間改變的不可觀測的因素(如個人特質(zhì)等)對不同時點的觀測值會產(chǎn)生影響,可以通過控制這些影響從而得到較為真實的結(jié)果;37內(nèi)生性產(chǎn)生的原因及解決方案38內(nèi)生性產(chǎn)生的原因及解決方案39內(nèi)生性產(chǎn)生的原因及解決方案由于一般大規(guī)模的人群調(diào)查存在較大的變異性問題,僅在模型中納入虛擬變量“分組(A)”、“時間(T)”是遠遠不夠的。為了提高解釋系數(shù)R2,需要加入其他可能影響被解釋變量的因素,即控制除分組、時間變量以外的其他變量。40內(nèi)生性產(chǎn)生的原因及解決方案sscinstalldiff

helpdiffdiffy,t(treated)p(t)robust如果有控制變量,可以利用cov()添加41內(nèi)生性產(chǎn)生的原因及解決方案工具變量(instrumentalvariable,IV)回歸是當回歸變量X與誤差項u相關(guān)時獲得總體回歸方程未知系數(shù)一致估計量的一般方法。我們經(jīng)常稱其為IV估計。其基本思想是:假設(shè)方程是:我們假設(shè)ui與Xi相關(guān),則OLS估計量一定是有偏的和非一致的。工具變量估計是利用另一個“工具”變量Z將Xi分離成與ui相關(guān)和不相關(guān)的兩部分。3.工具變量法內(nèi)生性產(chǎn)生的原因及解決方案我們的工作就是要尋找相應(yīng)的工具變量將解釋變量分解成內(nèi)生變量和外生變量,然后利用兩階段最小二乘法(TSLS)進行估計。內(nèi)生性產(chǎn)生的原因及解決方案

工具變量的選取

一個有效的工具變量必須滿足稱為工具變量相關(guān)性和工具變量外生性兩個條件:即

(1)工具變量相關(guān)性:工具變量與所替代的隨機解釋變量高度相關(guān);

(2)工具變量外生性:工具變量與隨機誤差項不相關(guān);

內(nèi)生性產(chǎn)生的原因及解決方案一個合適的工具變量應(yīng)該同時滿足兩個條件:第一要能很好地解釋內(nèi)生變量,也就是說工具變量和內(nèi)生變量之間要足夠相關(guān);第二,工具變量要來自系統(tǒng)之外,即工具變量具備外生性。如果內(nèi)生性表現(xiàn)為聯(lián)立性問題,第二個標準尤其必要。雖然統(tǒng)計證據(jù)可以告訴我們工具變量和內(nèi)生變量是否相關(guān),但是其背后的因果鏈條和工具變量是否具備外生性的證明一樣,必須依賴令人置信的邏輯推導(dǎo)。工具變量的外生性在回歸中表現(xiàn)為和方程的殘差項正交,即工具變量不會對方程被解釋變量產(chǎn)生影響,如果產(chǎn)生影響則只能通過內(nèi)生變量起作用。內(nèi)生性產(chǎn)生的原因及解決方案兩階段最小二乘估計量若工具變量Z滿足工具變量相關(guān)性和外生性的條件,則可用稱為兩階段最小二乘(TSLS)的IV估計量估計系數(shù)?1。兩階段最小二乘估計量分兩階段計算:第一階段把X分解成兩部分:即與回歸誤差項相關(guān)的一部分以及與誤差項無關(guān)的一部分。第二階段是利用與誤差項無關(guān)的那部分進行估計。內(nèi)生性產(chǎn)生的原因及解決方案一般IV回歸模型因變量Yi。外生解釋變量W1i、W2i、…Wri。內(nèi)生解釋變量X1i、X2i、…Xki。我們引入工具變量Z1i、Z2i、…Zmi。內(nèi)生性產(chǎn)生的原因及解決方案第一階段回歸:利用OLS建立每個內(nèi)生變量(X1i、X2i、…Xki)關(guān)于工具變量(Z1i、Z2i、…Zmi)和外生變量(W1i、W2i、…Wri)的回歸,并得到所有回歸結(jié)果的擬合值Xi_hat。第二階段回歸:用Xi_hat取代原有的Xi,與原有的外生變量Wi一起進行第二次回歸,得到TSLS統(tǒng)計量βTSLS。注意:工具變量出現(xiàn)在第一階段回歸,但不出現(xiàn)在第二階段回歸。內(nèi)生性產(chǎn)生的原因及解決方案引入工具變量的個數(shù)假設(shè)我們有n個內(nèi)生解釋變量,引入了m個工具變量,n和m的關(guān)系是什么?n=m恰好識別n<m過度識別n>m不可識別只有恰好識別和過度識別才能用IV方法估計。內(nèi)生性產(chǎn)生的原因及解決方案兩階段最小二乘法的stata命令:ivregress2slsdepvar[varlist1](varlist2=instlist),r,first其中,“depvar”為被解釋變量,varlist1為外生解釋變量,varlist2為所有的內(nèi)生解釋變量集合,instlist為工具變量集合。選擇項r表示使用異方差穩(wěn)健的標準誤,選擇項“first”表示顯示第一階段的回歸。內(nèi)生性產(chǎn)生的原因及解決方案工具變量有效性的檢驗工具變量相關(guān)性工具變量相關(guān)性越強,也就是工具變量能解釋越多的X變動,則IV回歸中能用的信息就越多,因此利用相關(guān)性更強的工具變量得到的估計量也更精確。弱工具變量:如果雖然

但是弱工具變量幾乎不能解釋X的變動。內(nèi)生性產(chǎn)生的原因及解決方案弱工具變量檢驗準則1.偏R2(Shea’spartialR2)含義:在第一階段回歸中,在控制外生變量影響的前提下,看其它變量對某內(nèi)生變量的解釋力,或者說,在第一階段回歸中,剔除掉外生變量的影響。2.最小特征值統(tǒng)計量F:經(jīng)驗上F應(yīng)該大于10。Stata命令:estatfirststage,allforcenonrobust內(nèi)生性產(chǎn)生的原因及解決方案3.Cragg-DonaldWaldF統(tǒng)計量4.Kleibergen-PaapWaldrkF統(tǒng)計量”

(當假定殘差項不滿足獨立同分布時,就看這個來判斷是否弱工具,原假設(shè)是弱工具,所以拒絕原假設(shè)就可以)F檢驗臨界值表

CHIDISTF(12(自變量數(shù)據(jù)m),600(自由度df=n(樣本數(shù))-m-1))=87.06Stata命令:ivreg2內(nèi)生性產(chǎn)生的原因及解決方案如果存在弱工具變量該怎么辦?1.如果有很多工具變量,有部分強工具變量和部分弱工具變量,可以舍棄較弱的工具變量而選用相關(guān)性較強的工具變量子集。在stata中,可以使用ivreg2命令進行“冗余檢驗”,以決定選擇舍棄哪個工具變量。(直觀上,冗余工具變量是那些第一階段回歸中不顯著的變量。)2.如果系數(shù)是恰好識別的,則你不能略去弱工具變量。在這種情況下,有兩個選擇:第一個選擇是尋找其他較強的工具變量。(難度較大)內(nèi)生性產(chǎn)生的原因及解決方案第二個選擇是利用弱工具變量繼續(xù)進行實證分析,但采用的方法不再是TSLS。而是對弱工具變量不太敏感的有限信息極大似然法(LIML)。在大樣本下,LIML與2SLS是漸近等價的,但在存在弱工具變量的情況下,LIML的小樣本性質(zhì)可能優(yōu)于2SLS。LIML的Stata命令為ivregresslimldepvar[varlist1](varlist2=instlist)內(nèi)生性產(chǎn)生的原因及解決方案工具變量外生性的檢驗剛才我們提到:只有恰好識別和過度識別才能用IV方法估計。一個很重要的命題是:只有過度識別情況下才能檢驗工具變量的外生性,而恰好識別情況下無法檢驗。內(nèi)生性產(chǎn)生的原因及解決方案過度識別約束檢驗基本思想:假設(shè)有一個內(nèi)生回歸變量,兩個工具變量且沒有包含的外生變量。則你可以計算兩個不同的TSLS估計量:其中一個利用第一個工具變量,而另一個利用第二個工具變量。由于抽樣變異性,這兩個估計量不會相同,但如果兩個工具變量都是外生的,則這兩個估計量往往比較接近。如果由這兩個工具變量得到估計非常不同,則你可以得出其中一個或兩個工具變量都有內(nèi)生性問題的結(jié)論。內(nèi)生性產(chǎn)生的原因及解決方案識別標準:

Sargan統(tǒng)計量:ivregress2sls過程中,實際的工具變量(組)是x*與z*。Sagan檢驗即檢驗這些工具變量是否外生(是否與擾動項相關(guān)),原假設(shè)是這些變量都與擾動項不相關(guān)。利用殘差對這些工具變量回歸。

sargen檢驗的P值應(yīng)該越大越好,一般超過0.1既可以說明不能拒絕工具變量有效的零假設(shè),不宜接近于1,一般大于0.4就是危險信號,工具變量過多,導(dǎo)致檢驗結(jié)果不可信。

Sargan統(tǒng)計量服從自由度為L-k的卡方分布,查表。在excel中輸入CHIDIST(x,iv-v),其中x是sargan統(tǒng)計量的值,iv是工具變量的秩,v是估計參數(shù)個數(shù)。回車。

內(nèi)生性產(chǎn)生的原因及解決方案HansenJ統(tǒng)計量C統(tǒng)計量,說明采用工具變量的合理性過度識別檢驗的Stata命令:estatoverid內(nèi)生性產(chǎn)生的原因及解決方案xtabond2alsoreportstestsofover-identifyingrestrictions--ofwhetherthe

instruments,asagroup,appearexogenous.

Forone-step,non-robustestimation,itreportstheSarganstatistic,whichistheminimizedvalueoftheone-stepGMMcriterionfunction.

TheSarganstatisticisnotrobusttoheteroskedasticityorautocorellation.

Soforone-step,robustestimation(穩(wěn)健估計andforalltwo-stepestimation),xtabond2alsoreportstheHansenJstatistic,whichistheminimizedvalueofthetwo-stepGMMcriterionfunction,andisrobust.xtabond2stillreportstheSarganstatisticinthesecasesbecausetheJtesthasitsownproblem:itcanbegreatlyweakenedbyinstrumentproliferation.內(nèi)生性產(chǎn)生的原因及解決方案究竟該用OLS還是工具變量法豪斯曼檢驗原假設(shè)為:H0:所有解釋變量均為外生變量regyx1x2eststoreolsivregress2slsyx1(x2=z1z2)eststoreivhausmanivols,sigmamore內(nèi)生性產(chǎn)生的原因及解決方案上述檢驗的缺點是,它假設(shè)在H0成立的情況下,OLS最有效率。但如果存在異方差,OLS并不最有效率(不是BLUE)。故傳統(tǒng)的豪斯曼檢驗不適用于異方差的情形。此時可以使用杜賓-吳-豪斯曼檢驗(DWH),該檢驗在異方差的情況下也適用,更為穩(wěn)健。stata命令:estatendogenous

為負值不存在內(nèi)生性內(nèi)生性產(chǎn)生的原因及解決方案例一Mincer(1958)最早研究了工資與受教育年限的正相關(guān)關(guān)系,但遺漏了“能力”這個變量,導(dǎo)致遺漏變量偏差。針對美國面板調(diào)查數(shù)據(jù)中的年輕男子組群(YoungMen’sCohortoftheNationalLongitudinalSurvey,簡記NLS-Y),Griliches(1976)采用工具變量法對遺漏變量問題進行了校正。BlackburnandNeumark(1992)更新了Griliches(1976)的數(shù)據(jù),即這個例子中將要使用的數(shù)據(jù)集grilic.dta。內(nèi)生性產(chǎn)生的原因及解決方案該數(shù)據(jù)集中包括以下變量:lw(工資對數(shù)),s(受教育年限),age(年齡),expr(工齡),tenure(在現(xiàn)單位的工作年數(shù)),iq(智商),med(母親的受教育年限),kww(在“knowledgeoftheWorldofWork”測試中的成績),mrt(婚姻虛擬變量,已婚=1),rns(美國南方虛擬變量,住在南方=1),smsa(大城市虛擬變量,住在大城市=1),year(有數(shù)據(jù)的最早年份,1966—1973年中的某一年)。內(nèi)生性產(chǎn)生的原因及解決方案這是一個兩期面板數(shù)據(jù),初始期為當以上變量有數(shù)據(jù)的最早年份,結(jié)束期為1980年。不帶80字樣的變量名為初始期,帶80字樣的變量名為1980年數(shù)據(jù)。比如,iq指的是初始期的智商,而lw80指的是1980年的工資對數(shù)。內(nèi)生性產(chǎn)生的原因及解決方案(1)先看一下數(shù)據(jù)的統(tǒng)計特征。usegrilic.dta,clearsum(2)考察智商與受教育年限的相關(guān)關(guān)系。pwcorriqs,sig(3)建立如下方程:reglw80s80expr80tenure80內(nèi)生性產(chǎn)生的原因及解決方案

繼續(xù)對方程進行分析:我們發(fā)現(xiàn)了如下問題:1。遺漏變量問題:認為方程遺漏了“能力”這個變量,加入iq(智商)作為“能力”的代理變量。reglw80s80iqexpr80tenure80內(nèi)生性產(chǎn)生的原因及解決方案2。測量誤差問題:iq(智商)對“能力”的測量存在誤差。3。變量內(nèi)生性問題:s80可能與擾動項中除“能力”以外的其他因素相關(guān),因此是內(nèi)生變量。解決方法:引入四個變量med,kww,mrt,age,作為內(nèi)生解釋變量iq與s80的工具變量。然后使用TSLS方法進行回歸。ivregress2slslw80expr80tenure80(s80iq=medkwwmrtage),first內(nèi)生性產(chǎn)生的原因及解決方案也可以使用GMM估計方法使用兩步GMM。

ivregressgmmlw80expr80tenure80(s80iq=medkwwmrtage)使用迭代GMM。

ivregressgmmlw80expr80tenure80(s80iq=medkwwmrtage),igmm內(nèi)生性產(chǎn)生的原因及解決方案幾點注意事項:1。first選項的目的是顯示TSLS第一階段的結(jié)果,如果省略,則僅顯示第二階段的結(jié)果。2。命令的用法比較嚴格,將被解釋變量和所有外生解釋變量放到括號外面,內(nèi)生解釋變量放到括號里面,等號后面為所有工具變量。3。2SLS只能通過stata完成,利用定義手動計算的結(jié)果是錯誤的,因為殘差序列是錯誤的。內(nèi)生性產(chǎn)生的原因及解決方案4。不可能單獨為每個內(nèi)生變量指定一組特定的工具變量,而是給所有內(nèi)生變量指定一系列工具變量。5。所有外生變變量都作為自己的工具變量。6。為了檢驗工具變量的外生性,本題為過度識別。7。在大樣本下,IV估計是一致的,但在小樣本下,IV估計并非無偏估計量,有些情況下偏誤可能很嚴重。內(nèi)生性產(chǎn)生的原因及解決方案弱工具變量檢驗檢驗方法:1。初步判斷可以用偏R2(partialR2)(剔除掉模型中原有外生變量的影響)。

2。Minimumeigenvaluestatistic(最小特征值統(tǒng)計量),經(jīng)驗上此數(shù)應(yīng)該大于10。這個方法類似于與書上的“第一階段F統(tǒng)計量”。內(nèi)生性產(chǎn)生的原因及解決方案工具變量外生性檢驗我們一般稱為過度識別約束J檢驗。

檢驗工具變量是否與干擾項相關(guān),即工具變量是否為外生變量。TSLS根據(jù)Sargan統(tǒng)計量進行過度識別檢驗。命令為:estatoverid檢驗工具變量的外生性。

H0:所有工具變量都是外生的。

H1:至少有一個工具變量不是外生的,與擾動項相關(guān)。內(nèi)生性產(chǎn)生的原因及解決方案

ivregress2slslw80expr80tenure80(s80iq=medkwwmrtage),firstestatfirststage,allforcenonrobustestatfirststageestatoverid內(nèi)生性產(chǎn)生的原因及解決方案究竟該用OLS還是IV解釋變量是否真的存在內(nèi)生性?假設(shè)能夠找到方程外的工具變量。1。如果所有解釋變量都是外生變量,則OLS比IV更有效。在這種情況下使用IV,雖然估計量仍然是一致的,會增大估計量的方差。2。如果存在內(nèi)生解釋變量,則OLS是不一致的,而IV是一致的。內(nèi)生性產(chǎn)生的原因及解決方案4.

動態(tài)面板回歸法基本思想是將解釋變量和被解釋變量的滯后項作為工具變量(IV)。其實,我是不認可這種處理方法,除非萬不得已,我不推薦這種方法,我也不太相信這種方法能真正緩解內(nèi)生性問題。內(nèi)生性產(chǎn)生的原因及解決方案廣義矩估計法:GMM基本思想:求解如下一般化目標函數(shù),使之最小化

J(b_GMM)=n*g(b_GMM)'*W*g(b_GMM)

其中,W為權(quán)重矩陣在球型擾動項的假定下,2SLS是最有效的。但如果擾動項存在異方差或自相關(guān),則廣義矩估計方法效果更好。GMM方法又分為兩步GMM法和迭代GMM方法。內(nèi)生性產(chǎn)生的原因及解決方案異方差性是相對于同方差而言的。所謂同方差,是為了保證回歸參數(shù)估計量具有良好的統(tǒng)計性質(zhì),經(jīng)典線性回歸模型的一個重要假定:總體回歸函數(shù)中的隨機誤差項滿足同方差性,即它們都有相同的方差。如果這一假定不滿足,即:隨機誤差項具有不同的方差,則稱線性回歸模型存在異方差性。對于模型

如果隨機誤差項的各期望值之間存在著相關(guān)關(guān)系,即

這時,稱隨機誤差項之間存在自相關(guān)性(autocorrelation)或序列相關(guān)內(nèi)生性產(chǎn)生的原因及解決方案有關(guān)GMM的Stata命令為ivregressgmmyx1(x2=z1z2)(兩步GMM)ivregressgmmyx1(x2=z1z2),igmm(迭代GMM)estatoverid(過度識別檢驗)內(nèi)生性產(chǎn)生的原因及解決方案例二reglwsexprtenurernssmsa,r

引入智商(iq)作為“能力”的代理變量,再進行OLS回歸。reglwsiqexprtenurernssmsa,r內(nèi)生性產(chǎn)生的原因及解決方案(2)由于用iq來度量能力存在“測量誤差”,故iq是內(nèi)生變量,考慮使用變量(med,kww,mrt,age)作為iq的工具變量,進行2SLS回歸,并使用穩(wěn)健標準誤。ivregress2slslwsexprtenurernssmsa(iq=medkwwmrtage),rfirst(3)進行過度識別檢驗,考察是否所有工具變量均外生,即與擾動項不相關(guān)。

estatoverid內(nèi)生性產(chǎn)生的原因及解決方案(4)我們懷疑(mrt,age)不滿足外生性,故使用C統(tǒng)計量檢驗這兩個工具變量的外生性。finditivreg2ivreg2lwsexprtenurernssmsa(iq=medkwwmrtage),rorthog(mrtage)(5)考慮僅使用變量(med,kww)作為iq的工具變量,再次進行2SLS回歸。ivregress2slslwsexprtenurernssmsa(iq=medkww),rfirst內(nèi)生性產(chǎn)生的原因及解決方案再次進行過度識別檢驗:estatoverid(6)弱工具變量檢驗estatfirststage,allforcenonrobust(7)為了穩(wěn)健起見,下面使用對弱工具變量更不敏感的有限信息最大似然法(LIML):ivregresslimllwsexprtenurernssmsa(iq=medkww),r內(nèi)生性產(chǎn)生的原因及解決方案(8)進一步考察弱工具變量問題,對工具變量kww進行冗余檢驗ivreg2lwsexprtenurernssmsa(iq=medkww),rredundant(kww)(9)利用豪斯曼檢驗判斷是否存在內(nèi)生解釋變量。quireglwiqsexprtenurernssmsaeststoreols1quiivregress2slslwsexprtenurernssmsa(iq=medkww)estimatesstoreiv1hausmaniv1ols1,sigmamore內(nèi)生性產(chǎn)生的原因及解決方案(10)由于傳統(tǒng)的豪斯曼檢驗在異方差的情形下不成立,下面進行異方差穩(wěn)健的DWH檢驗:estatendogenous異方差下也可以利用ivreg2命令進行文件的內(nèi)生性檢驗:ivreg2lwsexprtenurernssmsa(iq=medkww),rendog(iq)內(nèi)生性產(chǎn)生的原因及解決方案(11)如果存在異方差,則GMM比2SLS更有效率。為此,進行如下最優(yōu)GMM估計。ivregressgmmlwsexprtenurernssmsa(iq=medkww)進行過度識別檢驗:estatoverid考慮迭代GMM:ivregressgmmlwsexprtenurernssmsa(iq=med

kww),igmm

內(nèi)生性產(chǎn)生的原因及解決方案(12)結(jié)果的完整展現(xiàn):

quireglwsexprtenurernssmsa,reststoreols_no_iqquireglwiqsexprtenurernssmsa,reststoreols_with_iqquiivregress2slslwsexprtenurernssmsa(iq=medkww),reststoretslsquiivregresslimllwsexprtenurernssmsa(iq=medkww),reststorelimlquiivregressgmmlwsexprtenurernssmsa(iq=medkww)eststoregmmquiivregressgmmlwsexprtenurernssmsa(iq=medkww),igmmeststoreigmmoutreg2[ols_no_iqols_with_iqtslslimlgmmigmm]usingoutput.doc,replaceseeout內(nèi)生性產(chǎn)生的原因及解決方案遇到內(nèi)生性問題如何處理1.使用內(nèi)生解釋變量的滯后變量作為工具變量。2.尋找有創(chuàng)意的工具變量。內(nèi)生性產(chǎn)生的原因及解決方案內(nèi)生性的其它解決辦法(1)代理變量:某變量無法直接觀測,而用其它變量替代。

(2)前定變量:用變量的前一期或前幾期數(shù)據(jù)。

(3)面板數(shù)據(jù)模型。

到底如何對待內(nèi)生性問題(1)需要重點考慮的問題之一;

(2)最好的收集數(shù)據(jù)之前就加以考慮,尤其是準備獲取一手數(shù)據(jù)的情況下。如果考慮?應(yīng)用經(jīng)濟理論。內(nèi)生性產(chǎn)生的原因及解決方案本實例使用數(shù)據(jù)集“grilic.dta”??疾熘巧膛c受教育年限的相關(guān)關(guān)系:上表顯示,智商(在一定程度上可以視為能力的代理變量)與受教育年限具有強烈的正相關(guān)關(guān)系(相關(guān)系數(shù)為0.51)。作為一個參考系,先進行OLS回歸,并使用穩(wěn)健標準差:內(nèi)生性產(chǎn)生的原因及解決方案內(nèi)生性產(chǎn)生的原因及解決方案其中expr,tenure,rns,smsa均為控制變量,而我們主要感興趣的是變量受教育年限(s)。回歸的結(jié)果顯示,教育投資的年回報率為10.26%,這個似乎太高了??赡艿脑蚴?,由于遺漏變量“能力”與受教育正相關(guān),故“能力”對工資的貢獻也被納入教育的貢獻,因此高估了教育的回報率。引入智商iq作為能力的代理變量,再進行OLS回歸:內(nèi)生性產(chǎn)生的原因及解決方案內(nèi)生性產(chǎn)生的原因及解決方案雖然教育的投資回報率有所下降,但是依然很高。由于用iq作為能力的代理變量有測量誤差,故iq是內(nèi)生變量,考慮使用變量(med(母親的受教育年限)、kww(在“knowledgeoftheWorldofWork”中的成績)、mrt(婚姻虛擬變量,已婚=1)age(年齡))作為iq的工具變量,進行2SLS回歸,并使用穩(wěn)健的標準差:內(nèi)生性產(chǎn)生的原因及解決方案內(nèi)生性產(chǎn)生的原因及解決方案在此2SLS回歸中,教育回報率反而上升到13.73%,而iq對工資的貢獻居然為負值。使用工具變量的前提是工具變量的有效性。為此,進行過度識別檢驗,考察是否所有的工具變量均外生,即與擾動項不相關(guān):結(jié)果強烈拒絕所有工具變量均外生的原假設(shè)??紤]僅使用變量(med,kww)作為iq的工具變量,再次進行2SLS回歸,同時顯示第一階段的回歸結(jié)果:內(nèi)生性產(chǎn)生的原因及解決方案內(nèi)生性產(chǎn)生的原因及解決方案上表顯示,教育的回報率為6.08%,較為合理,再次進行過度識別檢驗:接受原假設(shè),認為(med,kww)外生,與擾動項不相關(guān)。進一步考察有效工具變量的第二個條件,即工具變量與內(nèi)生變量的相關(guān)性。從第一階段的回歸結(jié)果可以看出,工具變量對內(nèi)生變量具有較好的解釋力。更正式的檢驗如下內(nèi)生性產(chǎn)生的原因及解決方案內(nèi)生性產(chǎn)生的原因及解決方案從以上結(jié)果可看出,雖然Shea’spartialR^2不到0.04,但是F統(tǒng)計量為13.40>10。我們知道,雖然2SLS是一致的,但卻是有偏的,故使用2SLS會帶來“顯著性水平扭曲”(sizedistortion),而且這種扭曲隨著弱工具變量而增大。上表的最后部分顯示,如果在結(jié)構(gòu)方程中對內(nèi)生解釋變量的顯著性進行“名義顯著性水平”(nominalsize)為5%的沃爾德檢驗,加入可以接受的“真實顯著性水平”(truesize)不超過15%,則可以拒絕“弱工具變量”的原假設(shè),因為最小特征值統(tǒng)計量為14.91,大于臨界值11.59。總之我們有理由認為不存在弱工具變量。但為了穩(wěn)健起見,下面使用對弱工具變量更不敏感的有限信息最大似然法(LIML):內(nèi)生性產(chǎn)生的原因及解決方案內(nèi)生性產(chǎn)生的原因及解決方案結(jié)果發(fā)現(xiàn),LIML的系數(shù)估計值與2SLS

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負責。
  • 6. 下載文件中如有侵權(quán)或不適當內(nèi)容,請與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

評論

0/150

提交評論