版權說明:本文檔由用戶提供并上傳,收益歸屬內容提供方,若內容存在侵權,請進行舉報或認領
文檔簡介
1、計量經(jīng)濟學理論和應用,張紅霞 Zhanghx_,多重共線性的概念 實際經(jīng)濟問題中的多重共線性 多重共線性的后果 多重共線性的檢驗 克服多重共線性的方法 案例,多重共線性,對于模型 Yi=0+1X1i+2X2i+kXki+i i=1,2,n 其基本假設之一是解釋變量是互相獨立的。,如果某兩個或多個解釋變量之間出現(xiàn)了相關性,則稱為多重共線性(Multicollinearity)。,多重共線性的概念,如果存在 c1X1i+c2X2i+ckXki=0 i=1,2,n 其中: ci不全為0,則稱為解釋變量間存在完全共線性(perfect multicollinearity)。,如果存在 c1X1i+c2
2、X2i+ckXki+vi=0 i=1,2,n 其中ci不全為0,vi為隨機誤差項,則稱為 近似共線性(approximate multicollinearity)或交互相關(intercorrelated)。,多重共線性的概念,在矩陣表示的線性回歸模型 Y=X+中,完全共線性指:秩(X)k+1,即,中,至少有一列向量可由其他列向量(不包括第一列)線性表出。,如:X2= X1,則X2對Y的作用可由X1代替。,多重共線性的概念,注意: 完全共線性的情況并不多見,一般出現(xiàn)的是在一定程度上的共線性,即近似共線性。,多重共線性的概念,一般地,產(chǎn)生多重共線性的主要原因有以下三個方面: (1)經(jīng)濟變量相關的
3、共同趨勢 時間序列樣本:經(jīng)濟繁榮時期,各基本經(jīng)濟變量(收入、消費、投資、價格)都趨于增長;衰退時期,又同時趨于下降。 橫截面數(shù)據(jù):生產(chǎn)函數(shù)中,資本投入與勞動力投入往往出現(xiàn)高度相關情況,大企業(yè)二者都大,小企業(yè)都小。,實際經(jīng)濟問題中的多重共線性,實際經(jīng)濟問題中的多重共線性,(2)滯后變量的引入,在經(jīng)濟計量模型中,往往需要引入滯后經(jīng)濟變量來反映真實的經(jīng)濟關系。 例如,消費=f(當期收入, 前期收入) 顯然,兩期收入間有較強的線性相關性。,實際經(jīng)濟問題中的多重共線性,(3)樣本資料的限制和數(shù)據(jù)限制,由于完全符合理論模型所要求的樣本數(shù)據(jù)較難收集,特定樣本可能存在某種程度的多重共線性。X變量的變化范圍較小
4、、模型設定等也會引起共線性。 一般經(jīng)驗: 時間序列數(shù)據(jù)樣本:簡單線性模型,往往存在多重共線性。 截面數(shù)據(jù)樣本:問題不那么嚴重,但多重共線性仍然是存在的。,實際經(jīng)濟問題中的多重共線性,完全共線性下參數(shù)估計量不存在,如果存在完全共線性,則(XX)-1不存在,無法得到參數(shù)的估計量。以二元模型為例。,的OLS估計量為:,多重共線性的后果,1.近似共線性下OLS估計量非有效,近似共線性下,可以得到OLS參數(shù)估計量, 但參數(shù)估計量方差的表達式為,由于|XX|0,引起(XX) -1主對角線元素較大,使參數(shù)估計值的方差增大,OLS參數(shù)估計量非有效。,多重共線性的后果,以二元線性模型 y=1x1+2x2+ 為例
5、:,恰為X1與X2的線性相關系數(shù)的平方r2,由于 r2 1,故 1/(1- r2 )1,多重共線性的后果,多重共線性使參數(shù)估計值的方差增大,1/(1-r2)為方差膨脹因子(Variance Inflation Factor, VIF),當完全不共線時, r2 =0,當近似共線時, 0 r2 1,當完全共線時, r2=1,,多重共線性的后果,2.近似共線性下參數(shù)估計量經(jīng)濟含義不合理,如果模型中兩個解釋變量具有線性相關性,例如 X2= X1 , 這時,X1和X2前的參數(shù)1、2并不反映各自與被解釋變量之間的結構關系,而是反映它們對被解釋變量的共同影響。 1、2已經(jīng)失去了應有的經(jīng)濟含義,于是經(jīng)常表現(xiàn)出
6、似乎反常的現(xiàn)象:例如1本來應該是正的,結果恰是負的。,多重共線性的后果,多重共線性的后果,回歸系數(shù)符號反?,F(xiàn)象:,為考察回歸系數(shù)的符號問題,而 肯定大于0,故可以去掉,多重共線性的后果,多重共線性的后果,3.近似共線性下變量的顯著性檢驗失去意義,存在多重共線性時,參數(shù)估計值的方差與標準差變大,容易使通過樣本計算的t值小于臨界值, 誤導作出參數(shù)為0的推斷,可能將重要的解釋變量排除在模型之外,多重共線性的后果,4. 近似共線性下模型的預測功能失效,變大的方差容易使區(qū)間預測的“區(qū)間”變大,使預測失去意義。,多重共線性的后果,多重共線性的后果,5. OLS估計量及其標準誤對數(shù)據(jù)中的微小變化敏感 只要共
7、線性不完全,估計就是可能的。但估計值和標準誤對數(shù)據(jù)的微小變化很敏感。,多重共線性的后果,多重共線性的后果,結果:,注意:,除非是完全共線性,多重共線性并不意味著任何基本假設的違背;本質上是一種樣本現(xiàn)象。 因此,即使出現(xiàn)較高程度的多重共線性,OLS估計量仍具有線性性等良好的統(tǒng)計性質(BLUE)。 問題在于,即使OLS法仍是最好的估計方法,它卻不是“完美的”,尤其是在統(tǒng)計推斷上無法給出真正有用的信息。,多重共線性的后果,多重共線性檢驗的任務是: (1)檢驗多重共線性是否存在; (2)估計多重共線性的范圍,即判斷哪些變量之間存在共線性。,多重共線性表現(xiàn)為解釋變量之間具有相關關系,所以用于多重共線性的
8、檢驗方法主要是統(tǒng)計方法:如判定系數(shù)檢驗法、逐步回歸檢驗法等。,多重共線性的檢驗,檢驗多重共線性是否存在,(1)對兩個解釋變量的模型,采用簡單相關系數(shù)法 求出X1與X2的簡單相關系數(shù)r,若|r|接近1,則說明兩變量存在較強的多重共線性。,(2)對多個解釋變量的模型,采用綜合統(tǒng)計檢驗法,若 在OLS法下:R2與F值較大,但t檢驗值較小,說明各解釋變量對Y的聯(lián)合線性作用顯著,但各解釋變量間存在共線性而使得它們對Y的獨立作用不能分辨,故t檢驗不顯著。,多重共線性的檢驗,判明存在多重共線性的范圍,如果存在多重共線性,需進一步確定究竟由哪些變量引起。 (1) 判定系數(shù)檢驗法 使模型中每一個解釋變量分別以其
9、余解釋變量為解釋變量進行回歸,并計算相應的擬合優(yōu)度。 如果某一種回歸 Xji=1X1i+2X2i+LXLi 的判定系數(shù)較大,說明Xj與其他X間存在共線性。,多重共線性的檢驗,具體可進一步對上述回歸方程作F檢驗:,式中:Rj2為第j個解釋變量對其他解釋變量的回歸方程的決定系數(shù), 若存在較強的共線性,則Rj2較大且接近于1,這時(1- Rj2 )較小,從而Fj的值較大。 因此,給定顯著性水平,計算F值,并與相應的臨界值比較,來判定是否存在相關性。,構造如下F統(tǒng)計量,多重共線性的檢驗,在模型中排除某一個解釋變量Xj,估計模型; 如果擬合優(yōu)度與包含Xj時十分接近,則說明Xj與其它解釋變量之間存在共線性
10、。,另一等價的檢驗是:,多重共線性的檢驗,(2)逐步回歸法,以Y為被解釋變量,逐個引入解釋變量,構成回歸模型,進行模型估計。 根據(jù)擬合優(yōu)度的變化決定新引入的變量是否獨立。 如果擬合優(yōu)度變化顯著,則說明新引入的變量是一個獨立解釋變量; 如果擬合優(yōu)度變化很不顯著,則說明新引入的變量與其它變量之間存在共線性關系。,多重共線性的檢驗,找出引起多重共線性的解釋變量,將它排除出去。 以逐步回歸法得到最廣泛的應用。 注意:會導致模型設定上的偏誤,從而引起更嚴重的問題。,如果模型被檢驗證明存在多重共線性,則需要發(fā)展新的方法估計模型,最常用的方法有三類。,1、第一類方法:排除引起共線性的變量,克服多重共線性的方
11、法,2、第二類方法:差分法,時間序列數(shù)據(jù)、線性模型:將原模型變換為差分模型: Yi=1 X1i+2 X2i+k Xki+ i 可以有效地消除原模型中的多重共線性。,一般講,增量之間的線性關系遠比總量之間的線性關系弱得多。,克服多重共線性的方法,由表中的比值可以直觀地看到,增量的線性關系弱于總量之間的線性關系。,進一步分析: Y與C(-1)之間的判定系數(shù)為0.9988, Y與C(-1)之間的判定系數(shù)為0.9567,克服多重共線性的方法,但是,差分法可能導致序列相關性。,3.第三類方法:減小參數(shù)估計量的方差,多重共線性的主要后果是參數(shù)估計量具有較大的方差,所以 采取適當方法減小參數(shù)估計量的方差,雖
12、然沒有消除模型中的多重共線性,但確能消除多重共線性造成的后果。 例如: 增加樣本容量,可使參數(shù)估計量的方差減小。,克服多重共線性的方法,*嶺回歸法(Ridge Regression),70年代發(fā)展的嶺回歸法,以引入偏誤為代價減小參數(shù)估計量的方差,受到人們的重視。 具體方法是:引入矩陣D,使參數(shù)估計量為,其中矩陣D一般選擇為主對角陣,即 D=aI a為大于0的常數(shù)。,(*),顯然,與未含D的參數(shù)B的估計量相比,(*)式的估計量有較小的方差。,克服多重共線性的方法,根據(jù)理論和經(jīng)驗分析,影響糧食生產(chǎn)(Y)的主要因素有: 農(nóng)業(yè)化肥施用量(X1);糧食播種面積(X2) 成災面積(X3); 農(nóng)業(yè)機械總動力
13、(X4); 農(nóng)業(yè)勞動力(X5),已知中國糧食生產(chǎn)的相關數(shù)據(jù),建立中國糧食生產(chǎn)函數(shù): Y=0+1 X1 +2 X2 +3 X3 +4 X4 +4 X5 +,案例中國糧食生產(chǎn)函數(shù),1、用OLS法估計上述模型:,R2接近于1; 給定=5%,得F臨界值 F0.05(5,12)=3.11 F=638.4 15.19, 故認上述糧食生產(chǎn)的總體線性關系顯著成立。 但X4 、X5 的參數(shù)未通過t檢驗,且符號不正確,故解釋變量間可能存在多重共線性。,(-0.91) (8.39) (3.32) (-2.81) (-1.45) (-0.14),案例中國糧食生產(chǎn)函數(shù),2、檢驗簡單相關系數(shù),發(fā)現(xiàn): X1與X4間存在高度相關性。,列出X1,X2,X3,X4,X5的相關系數(shù)矩陣:,案例中國糧食生產(chǎn)函數(shù),3、找出最簡單的回歸形式,可見,應選第1個式子為初始的回歸模型。,分別作Y與X1,X2,X4,X5間的回歸:,(25.58) (11.49) R2=0.8919 F=132.1 DW=1.56,(-0.49) (1.14) R2=0.075 F=1.30 DW=0.12,(17.45) (6.68) R2=0.7527 F=48.7 DW=1.11,(-1.04) (2.66) R2=0.3064 F=7.07 DW=0.36
溫馨提示
- 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權益歸上傳用戶所有。
- 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內容里面會有圖紙預覽,若沒有圖紙預覽就沒有圖紙。
- 4. 未經(jīng)權益所有人同意不得將文件中的內容挪作商業(yè)或盈利用途。
- 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內容的表現(xiàn)方式做保護處理,對用戶上傳分享的文檔內容本身不做任何修改或編輯,并不能對任何下載內容負責。
- 6. 下載文件中如有侵權或不適當內容,請與我們聯(lián)系,我們立即糾正。
- 7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。
最新文檔
- 體育場館大白施工合同
- 專利代理人聘用合同律師
- 航空航天企業(yè)研發(fā)經(jīng)理聘用合同
- 實驗室施工合同模板
- 水利工程監(jiān)理服務協(xié)議
- 餐飲業(yè)財務人員招聘協(xié)議
- 外語翻譯專家聘用協(xié)議
- 中醫(yī)學說教師聘用合同
- 大型工廠給排水系統(tǒng)施工合同
- 江蘇省鹽城市大豐區(qū)部分學校2024-2025學年九年級上學期12月調研考試化學試題(含答案)
- 《上課用的小動物過冬》課件
- 2024版建筑工程設計居間協(xié)議3篇
- 醫(yī)學教程 梅毒
- 貴州省銅仁市2023-2024學年高二上學期期末質量監(jiān)測試題 地理 含答案
- 2025屆新高考語文必背74篇古詩詞譯文(解析版)
- 4.3.1海氣相互作用課件高中地理湘教版(2019)選擇性必修1
- 2023年天津南開區(qū)教育系統(tǒng)招聘筆試真題
- 人教版(2024新版)七年級上冊數(shù)學全冊重點知識點講義
- 維修電工題庫(300道)
- 地球歷史及其生命的奧秘學習通超星期末考試答案章節(jié)答案2024年
評論
0/150
提交評論