計量經濟學第八講_第1頁
計量經濟學第八講_第2頁
計量經濟學第八講_第3頁
計量經濟學第八講_第4頁
計量經濟學第八講_第5頁
已閱讀5頁,還剩13頁未讀, 繼續(xù)免費閱讀

下載本文檔

版權說明:本文檔由用戶提供并上傳,收益歸屬內容提供方,若內容存在侵權,請進行舉報或認領

文檔簡介

1、精選優(yōu)質文檔-傾情為你奉上三、多重共線性的檢驗(一) 相關系數檢驗 利用相關系數可以分析解釋變量之間的兩兩相關情況。在EViews軟件中可以直接計算(解釋)變量的相關系數矩陣: 命令方式COR 解釋變量名 菜單方式將所有解釋變量設置成一個數組,并在數組窗口中點擊ViewCorrelations.(二) 輔助回歸模型檢驗 相關系數只能判斷解釋變量之間的兩兩相關情況,當模型的解釋變量個數多于兩下、并且呈現出較為復雜的相關關系時,可以通過每個解釋變量對其他解釋變量的輔助回歸模型來檢驗多重共線性,即依次建立個輔助回歸模型: 如果,其中某些方程顯著,則表明存在多重共線性,所對應的變量可以近似地用其他解釋

2、變量線性表示。 輔助回歸模型檢驗不僅能檢驗多元回歸模型的多重共線性,而且可以得到多重共線性的具體形式;如果再結合偏相關關系檢驗,還能進一步判定是哪些解釋變量引起了多重共線性,這有助于分析如何消除多重共線性的影響。(三) 方差膨脹因子檢驗 對于多元線性回歸模型,的方差可以表示成: 其中,關于其他解釋變量輔助回歸模型的判定系數,為方差膨脹因子。隨著多重共線性程度的增強,VIF以及系數估計誤差都在增大。因此,可以用VIF作為衡量多重共線性的一個指標;一般當時,(此時),認為模型存在較嚴重的多重共線性。 另一個與VIF等價的指標是“容許度”(Tolerance),其定義為: 顯然,當與其他解釋變量高度

3、相關時,。因此,一般當時,認為模型存在較嚴重的多重共線性。(四) 特征值檢驗考察解釋變量的樣本數據矩陣 當模型存在完全多重共線性時,;而當模型存在嚴重的多重共線性時,。根據矩陣知識,若為矩陣個特征值,則有: 這表明特征值中至少有一個近似地等于零。因此,可以利用的特征值來檢驗模型的多重共線性。實際計算時,先對樣本數據做標準化處理,這樣矩陣轉化成解釋變量的相關系數矩陣,特征值也減少到個。 利用特征值還可以構造兩個用于檢驗多重共線性的指標:病態(tài)數Condition Number)和病態(tài)指數(Condition Index);其指標定義為: =最大特征值/最小特征值 這兩個指標都反映了特征值的離散程度

4、,數值越大,表明多重共線性越嚴重。一般當時,認為存在嚴重的多重共線性。四、多重共線性的解決方法 設定計量經濟模型的時候,為了全面反映各方面因素的影響,總是在理論和實踐認識的基礎上,盡量選取被解釋變量的所有影響因素。這樣在同時考慮多個影響因素的情況下,很可能產生多重共線性問題。在處理多重共線性之前,首先應該明確以下兩點:第一, 多重共線性的主要后果是無法區(qū)分每個解釋變量的單獨影響,因此,如果建立模型的目的是進行預測,只要模型的擬合優(yōu)度較高(即能正確反映所有解釋變量的總影響),并且解釋變量的相關類型在預測期內保持不變,則可以忽略多重共線性的問題。但是,如果是應用模型進行結構分析或政策評價,即利用系

5、數分析、比較各個解釋變量的單獨影響,則需要消除多重共線性的影響。第二, 引起多重共線性的原因是模型中存在相關的解釋變量,所以消除多重共線性的根本方法只能是從模型中剔除這些變量。但直接剔除變量可能會產生新的問題:(1)模型的經濟意義不合理;例如,生產函數中資金與勞動者人數通常是高度相關的,但從中剔除任何一個要素都不太合適。(2)如果剔除的是重要解釋變量。則這些變量的影響將反映在隨機誤差項中,使模型產生異方差性或自相關性。(3)若剔除不當還會產生設定誤差的問題,造成參數估計嚴重有偏。因此,為了解決這一矛盾,剔除變量時應該全面、慎重考慮,根據解釋變量的特點分別采用直接剔除和間接剔除兩種方式。(一)

6、直接剔除次要或可替代的變量根據經濟理論和實際經驗設定計量經濟模型時容易考慮過多的解釋變量,其中有些可能是無顯著影響的次要變量,還有一些變量的影響可以用模型中的其他變量來代替。所以在估計模型之前,為避免多重共線性的影響,應該從模型中先剔除這些變量。次要變量可以通過被解釋變量與解釋變量的相關系數檢驗、相關圖分析等統計分析加以鑒別;利用輔助回歸模型和特征值檢驗多重共線性時,又可以提供解釋變量之間相互替代性的信息。(二) 間接剔除重要的解釋變量對于有重要影響的解釋變量,可以通過以下方式將其“間接剔除”:1、 利用附加信息例如,著名的Cobb_Douglas生產函數中 勞動投入量L與資金投入量K之間通常

7、是高度相關的,如果已知附加信息: (規(guī)模報酬不變)則 或 記 則C-D生產函數可以表示成: 此時二元模型轉化成一元模型,當然不存在多重共線性的問題,可以利用OLS法估計,進而得到。又如,設工業(yè)能源需求函數為: 其中,分別為重、輕工業(yè)總產值,利用此模型不僅能反映工業(yè)經濟增長對能源的需求情況,而且可以反映工業(yè)結構變化對能源需求的影響。但是重、輕工業(yè)發(fā)展的共向性,很可能使模型產生多重共線性。由于分別是重、輕工業(yè)的單位能耗,如果根據歷史統計資料測得重工業(yè)的單位能耗(平均來說)是輕工業(yè)單位能耗的,即獲得以下附加信息: 則工業(yè)能源需求函數可以表示成: 其中,模型轉化成一元模型,估計出之后,又得到,從而在消

8、除多重共線性影響的情況下得到工業(yè)能源需求函數: 2、 變換模型的形式對原設定的模型進行適當的變換,也可以消除或削弱原模型中解釋變量之間的相關關系。具體有三種變換方式,一是變換模型的函數形式,如將線性模型轉換成雙對數模型、半對數模型、多項式模型等;二是變換模型的變量形式,如引入差分變量、相對數變量等;三是改變變量的統計指標,如將生產過程中的資金投入量取成固定資金或流動資金(或兩者之和),勞動投入量取成職工人數或工資總額,經濟增長指標取成GDP、GNP、國民收入等。再如,投資函數: 也可以變換成: 即以收入和收入增長來解釋投資的增長情況。3、 綜合使用時序數據與橫截面數據如果能同時獲得變量的時序數

9、據和橫截面數據,則先利用某類數據估計出模型中的部分參數,再利用另一類數據估計模型的其余參數。例如,設某類商品的需求函數為: 其中, 為商品需求量,分別為居民收入和該商品價格,并且已知在時序樣本數據中高度相關。為此分以下二步完成:(1) 收集最近一年該商品的銷售量和居民收入的統計資料(橫截面數據),由于商品價格在一年中的變化幅度不大,所以將需求函數取成: 利用橫截面資料估計該模型,得到需求的收入彈性。(2) 原需求函數中的也是需求的收入彈性,所以(此時實際上假設歷年的平均收入彈性與近期的收入彈性近似相等),將原模型變換成: 其中,。再利用歷年商品銷售量、居民收入和價格的統計資料(時序數據)估計模

10、型,得到,從而在消除多重共線性影響的情況下,估計出需求函數: 從上述三種方法的處理過程可以看出,最終還是通過減少模型中解釋變量個數的方式(即剔除引起多重共線性的變量)來消除多重共線性的影響,但并不是直接剔除有重要影響的解釋變量,模型中還是保留了這些變量的影響,所以稱之為“間接剔除)。(三) 逐步回歸建立計量經濟模型的時候,一般是將解釋變量全部引入模型,然后再根據統計檢驗和定性分析從中逐個剔除次要的或產生多重共線性的變量,選擇變量是一個“由多到少”的過程。而逐步回歸選擇變量時,卻是一個“由少到多”的過程,即從所有解釋變量中間先選擇影響最為顯著的變量建立模型,然后再將模型之外的變量逐個引入模型;每

11、引入一個變量,就對模型中的所有變量進行一次顯著性檢驗,并從中剔除不顯著的變量,逐步引入剔除引入,直到模型之外所有變量均不顯著時為止。許多統計分析軟件都有逐步回歸程序,但根據計算機軟件自動挑選的模型往往統計檢驗合理,經濟意義并不理想。因此,實際應用中一般是依據逐步回歸的原理,結合主觀分析來篩選變量。具體步驟為:(1) 利用相關系數從所有解釋變量中選取相關性最強的變量建立一元回歸模型。(2) 在一元回歸模型中分別引入第二個變量,共建立個二元回歸模型(設共有個解釋變量),從這些模型中再選取一個較優(yōu)的模型。選擇時要求:模型中每個解釋變量影響顯著,參數符號正確,值有所提高。(3) 在選取的二元回歸模型中

12、以同樣方式引入第三個變量;如此下去,直到無法引入新的變量時為止。例5服裝需求函數。根據理論和經驗分析,影響居民服裝需求的主要因素有:可支配收入X、流動資產擁有量K、服裝類價格指數P1和總物價指數P0。表3-4給出了有關統計資料。表3-4 服裝需求函數有關統計資料年份服裝需求可支配收入X流動資產擁有量K服裝類價格指數P1總物價指數P019791980198119821983198419851986198719888.49.610.411.412.214.215.817.919.320.882.988.099.9105.3117.7131.0148.0161.8174.2184.717.121.3

13、25.129.034.040.044.049.051.053.09293969410010110511211211294969797100101104109111111設服裝需求函數為: (1) 相關系數檢驗鍵入:COR Y X K P0 P1輸出的相關系數矩陣為:YXKP0XKP0P10.99770.98340.98870.97550.98830.98770.98040.96950.97000.9918可見每個因素都與服裝需求高度相關,而且解釋變量之間也是高度相關的?,F按照逐步回歸原理建立模型。(2) 建立一元回歸模型根據理論分析,可支配收入應該是服裝需求最主要的影響因素;相關系數檢驗也表明

14、,收入與服裝需求的相關性最強。所以以作為最基本的模型。(3) 將其余變量逐個引入模型,估計結果列入表3-5(其中括號里的數字為統計量值)。XP1P0K0.11790.99500.99560.1262(8.57)-0.0378(-0.57)0.99460.99580.1030(5.67)0.0857(0.83)0.99480.99600.1315(7.03)-0.0388(-0.74)0.99470.99590.1042(7.55)-0.1866(-2.47)0.3132(2.59)0.99700.99800.0978(3.71)-0.1972(2.24)0.3401(-2.20)0.0144(

15、0.30)0.99650.9980從表3-5的估計結果可以看出,在基本模型中引入P1之后,的符號正確,但P1的檢驗不顯著,同時擬合優(yōu)度提高不多,反而下降,同理再分別引入其他兩個解釋變量,引入的變量都不顯著,但相對來說,模型的擬合優(yōu)度最高,所以再將該模型作為基本模型,逐步引入其他變量。引入P1之后,模型中各個系數的符號合理,解釋變量的t檢驗也都是顯著的,并且擬合優(yōu)度都有所提高。在此基礎上再引入K,其檢驗不顯著,為多余變量。 經過以上的逐步引入檢驗過程,最終確定服裝需求函數為: 從本例的討論過程可以看出:(1)模型中引入相關性較強的解釋變量,會影響系數的估計值和檢驗值,這正是多重共線性的主要影響。

16、(2) 在模型中增添解釋變量,不論其影響是否顯著都會使的值上升;但的值卻不一定增加,增添不顯著的解釋變量甚至可能會使的值下降。所以比較不同模型的擬合優(yōu)度時,取比較合理。 另外,該需求模型還存在兩個問題,一是DW值接近于4,可能存在自相關性;二是樣本容量太小,卻要考慮引入4個解釋變量,樣本的自由度只有;所以模型的估計結果可能并不可靠,過高的擬合優(yōu)度也可能提供的是虛假信息。本例只是為了說明多重共線性的處理過程,實際應用中只有在樣本容量較大的情況下,才能考慮引入多個解釋變量。(四) 主成分回歸主成分回歸(Principal Components Regression,簡稱PCR)是根據多元統計分析中

17、的主成分分析原理、用于處理多重共線性模型的一種新的參數估計方法。其基本原理是:利用主成分分析將解釋變量轉換成若干個主成分,這些主成分從不同側面反映了解釋變量的綜合影響,并且互不相關。因此,可以將被解釋變量關于這些主成分進行回歸,再根據主成分與解釋變量之間的對應關系,求得原回歸模型的估計方程。主成分回歸的具體步驟為:(1) 對原始樣本數據做標準化處理,這樣矩陣即為解釋變量的相關系數矩陣。(2) 計算個特征值,以及相應的標準化特征向量。(3) 利用特征值檢驗多重共線性。模型存在多重共線性時,至少有一個特征值近似地等于零,不妨設近似為零,這表明解釋變量之間存在著個線性相關關系。(4) 設解釋變量(已

18、標準化)個主成分為: 其中,互不相關,并且近似為零。將(標準化的)被解釋變量關于個主成分進行回歸,得: (5) 根據主成分與解釋變量之間的關系式(3-18),將其代入主成分回歸方程(3-19)式,求得用標準化數據表示的的回歸方程: 系數與原模型中參數之間的關系為: 其中,、分別為和的標準差;由此可以計算出原回歸模型中的參數,進而得到: 例6中國民航客運量預測模型,為了研究我國民航客運量的變化趨勢及其成因,經分析選擇了以下解釋變量:居民消費額(億元)、政府消費額(億元)、鐵路客運量(萬人)、來華旅游入境人數(萬人)、民航航線里程(萬公里),并取中國民航客運量(萬人)作為被解釋變量。有關統計資料列

19、入表3-6。表3-6 民航客運量及其影響因素的統計資料年份民航客運量居民消費額政府消費額鐵路客運量來華旅游人數民航航線里程1978197919801981198219831984198519861987198819891990199119921993199419951996199719982312983434014453915547479971310144212831660217828863383403851175555563057551759.12005.42317.12604.12867.93182.53674.54589.05175.05961.27633.18523.59113.210

20、315.912459.815682.420809.826944.532152.334854.636921.14806146597057708381020118413671490172720332252283034924500598666907852872594858149186389922049530099922957129508099693941629257893620180.92420.39570.25776.71792.43947.701285.221783.302281.952690.233169.482450.142746.203335.653311.504152.704368.45

21、4638.655112.755758.796347.8414.8916.0019.5321.8223.2722.9126.0227.7232.4338.9137.3847.1950.6855.9183.6696.08104.56112.90116.65142.50150.58(1) 多重共線性檢驗由于選擇的影響因素較多,所以估計模型之前,應該先分析各個因素與被解釋變量之間的關系,以及因素之間的相關程度。利用SCAT命令觀察了與各個解釋變量的相關圖之后,再用COR命令進行相關系數檢驗輸出的相關系數矩陣為: 0.9862 0.9869 0.9969 -0.1199 -0.1567 -0.1569

22、0.9553 0.9377 0.9420 0.0779 0.9878 0.9778 0.9877 -0.1140 0.9569計算結果表明,除鐵路客運量之外 ,其他因素與民航客運量高度相關;而且解釋變量之間也是兩兩高度相關的。為了進一步檢驗解釋變量之間的相關關系,利用SPSS軟件計算出解釋變量相關系數矩陣的特征值為: 此時,即(標準化后的)樣本數據矩陣是一個病態(tài)矩陣,而且病態(tài)(條件)數和病態(tài)指數分別為: 因此,模型存在嚴重的多重共線性。如果此時用OLS法估計模型,將得到以下估計結果:模型中所有解釋變量的檢驗均不顯著,并且的系數符號不合理。(2) 主成分回歸 現采用主成分回歸解決多重共線性問題。根據SPSS軟件的計算結果,所對應主成分的累計貢獻率(貢獻率為:)達到98.77%;對應的標準化特征向量為: 所以兩個主成分為:其中,均為標準化后的解釋變量。從主成分中各變量的系數值可以看出,第一主成分主要反映了的變化,即綜合反映了與民航客運量正相關因素的影響;第二主成分主要反映了客運量的變化,即與民航客運量負相關因素的影響。 在SPS

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯系上傳者。文件的所有權益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網頁內容里面會有圖紙預覽,若沒有圖紙預覽就沒有圖紙。
  • 4. 未經權益所有人同意不得將文件中的內容挪作商業(yè)或盈利用途。
  • 5. 人人文庫網僅提供信息存儲空間,僅對用戶上傳內容的表現方式做保護處理,對用戶上傳分享的文檔內容本身不做任何修改或編輯,并不能對任何下載內容負責。
  • 6. 下載文件中如有侵權或不適當內容,請與我們聯系,我們立即糾正。
  • 7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

評論

0/150

提交評論