版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進行舉報或認領(lǐng)
文檔簡介
1、精選優(yōu)質(zhì)文檔-傾情為你奉上三、多重共線性的檢驗(一) 相關(guān)系數(shù)檢驗 利用相關(guān)系數(shù)可以分析解釋變量之間的兩兩相關(guān)情況。在EViews軟件中可以直接計算(解釋)變量的相關(guān)系數(shù)矩陣: 命令方式COR 解釋變量名 菜單方式將所有解釋變量設(shè)置成一個數(shù)組,并在數(shù)組窗口中點擊ViewCorrelations.(二) 輔助回歸模型檢驗 相關(guān)系數(shù)只能判斷解釋變量之間的兩兩相關(guān)情況,當模型的解釋變量個數(shù)多于兩下、并且呈現(xiàn)出較為復(fù)雜的相關(guān)關(guān)系時,可以通過每個解釋變量對其他解釋變量的輔助回歸模型來檢驗多重共線性,即依次建立個輔助回歸模型: 如果,其中某些方程顯著,則表明存在多重共線性,所對應(yīng)的變量可以近似地用其他解釋
2、變量線性表示。 輔助回歸模型檢驗不僅能檢驗多元回歸模型的多重共線性,而且可以得到多重共線性的具體形式;如果再結(jié)合偏相關(guān)關(guān)系檢驗,還能進一步判定是哪些解釋變量引起了多重共線性,這有助于分析如何消除多重共線性的影響。(三) 方差膨脹因子檢驗 對于多元線性回歸模型,的方差可以表示成: 其中,關(guān)于其他解釋變量輔助回歸模型的判定系數(shù),為方差膨脹因子。隨著多重共線性程度的增強,VIF以及系數(shù)估計誤差都在增大。因此,可以用VIF作為衡量多重共線性的一個指標;一般當時,(此時),認為模型存在較嚴重的多重共線性。 另一個與VIF等價的指標是“容許度”(Tolerance),其定義為: 顯然,當與其他解釋變量高度
3、相關(guān)時,。因此,一般當時,認為模型存在較嚴重的多重共線性。(四) 特征值檢驗考察解釋變量的樣本數(shù)據(jù)矩陣 當模型存在完全多重共線性時,;而當模型存在嚴重的多重共線性時,。根據(jù)矩陣知識,若為矩陣個特征值,則有: 這表明特征值中至少有一個近似地等于零。因此,可以利用的特征值來檢驗?zāi)P偷亩嘀毓簿€性。實際計算時,先對樣本數(shù)據(jù)做標準化處理,這樣矩陣轉(zhuǎn)化成解釋變量的相關(guān)系數(shù)矩陣,特征值也減少到個。 利用特征值還可以構(gòu)造兩個用于檢驗多重共線性的指標:病態(tài)數(shù)Condition Number)和病態(tài)指數(shù)(Condition Index);其指標定義為: =最大特征值/最小特征值 這兩個指標都反映了特征值的離散程度
4、,數(shù)值越大,表明多重共線性越嚴重。一般當時,認為存在嚴重的多重共線性。四、多重共線性的解決方法 設(shè)定計量經(jīng)濟模型的時候,為了全面反映各方面因素的影響,總是在理論和實踐認識的基礎(chǔ)上,盡量選取被解釋變量的所有影響因素。這樣在同時考慮多個影響因素的情況下,很可能產(chǎn)生多重共線性問題。在處理多重共線性之前,首先應(yīng)該明確以下兩點:第一, 多重共線性的主要后果是無法區(qū)分每個解釋變量的單獨影響,因此,如果建立模型的目的是進行預(yù)測,只要模型的擬合優(yōu)度較高(即能正確反映所有解釋變量的總影響),并且解釋變量的相關(guān)類型在預(yù)測期內(nèi)保持不變,則可以忽略多重共線性的問題。但是,如果是應(yīng)用模型進行結(jié)構(gòu)分析或政策評價,即利用系
5、數(shù)分析、比較各個解釋變量的單獨影響,則需要消除多重共線性的影響。第二, 引起多重共線性的原因是模型中存在相關(guān)的解釋變量,所以消除多重共線性的根本方法只能是從模型中剔除這些變量。但直接剔除變量可能會產(chǎn)生新的問題:(1)模型的經(jīng)濟意義不合理;例如,生產(chǎn)函數(shù)中資金與勞動者人數(shù)通常是高度相關(guān)的,但從中剔除任何一個要素都不太合適。(2)如果剔除的是重要解釋變量。則這些變量的影響將反映在隨機誤差項中,使模型產(chǎn)生異方差性或自相關(guān)性。(3)若剔除不當還會產(chǎn)生設(shè)定誤差的問題,造成參數(shù)估計嚴重有偏。因此,為了解決這一矛盾,剔除變量時應(yīng)該全面、慎重考慮,根據(jù)解釋變量的特點分別采用直接剔除和間接剔除兩種方式。(一)
6、直接剔除次要或可替代的變量根據(jù)經(jīng)濟理論和實際經(jīng)驗設(shè)定計量經(jīng)濟模型時容易考慮過多的解釋變量,其中有些可能是無顯著影響的次要變量,還有一些變量的影響可以用模型中的其他變量來代替。所以在估計模型之前,為避免多重共線性的影響,應(yīng)該從模型中先剔除這些變量。次要變量可以通過被解釋變量與解釋變量的相關(guān)系數(shù)檢驗、相關(guān)圖分析等統(tǒng)計分析加以鑒別;利用輔助回歸模型和特征值檢驗多重共線性時,又可以提供解釋變量之間相互替代性的信息。(二) 間接剔除重要的解釋變量對于有重要影響的解釋變量,可以通過以下方式將其“間接剔除”:1、 利用附加信息例如,著名的Cobb_Douglas生產(chǎn)函數(shù)中 勞動投入量L與資金投入量K之間通常
7、是高度相關(guān)的,如果已知附加信息: (規(guī)模報酬不變)則 或 記 則C-D生產(chǎn)函數(shù)可以表示成: 此時二元模型轉(zhuǎn)化成一元模型,當然不存在多重共線性的問題,可以利用OLS法估計,進而得到。又如,設(shè)工業(yè)能源需求函數(shù)為: 其中,分別為重、輕工業(yè)總產(chǎn)值,利用此模型不僅能反映工業(yè)經(jīng)濟增長對能源的需求情況,而且可以反映工業(yè)結(jié)構(gòu)變化對能源需求的影響。但是重、輕工業(yè)發(fā)展的共向性,很可能使模型產(chǎn)生多重共線性。由于分別是重、輕工業(yè)的單位能耗,如果根據(jù)歷史統(tǒng)計資料測得重工業(yè)的單位能耗(平均來說)是輕工業(yè)單位能耗的,即獲得以下附加信息: 則工業(yè)能源需求函數(shù)可以表示成: 其中,模型轉(zhuǎn)化成一元模型,估計出之后,又得到,從而在消
8、除多重共線性影響的情況下得到工業(yè)能源需求函數(shù): 2、 變換模型的形式對原設(shè)定的模型進行適當?shù)淖儞Q,也可以消除或削弱原模型中解釋變量之間的相關(guān)關(guān)系。具體有三種變換方式,一是變換模型的函數(shù)形式,如將線性模型轉(zhuǎn)換成雙對數(shù)模型、半對數(shù)模型、多項式模型等;二是變換模型的變量形式,如引入差分變量、相對數(shù)變量等;三是改變變量的統(tǒng)計指標,如將生產(chǎn)過程中的資金投入量取成固定資金或流動資金(或兩者之和),勞動投入量取成職工人數(shù)或工資總額,經(jīng)濟增長指標取成GDP、GNP、國民收入等。再如,投資函數(shù): 也可以變換成: 即以收入和收入增長來解釋投資的增長情況。3、 綜合使用時序數(shù)據(jù)與橫截面數(shù)據(jù)如果能同時獲得變量的時序數(shù)
9、據(jù)和橫截面數(shù)據(jù),則先利用某類數(shù)據(jù)估計出模型中的部分參數(shù),再利用另一類數(shù)據(jù)估計模型的其余參數(shù)。例如,設(shè)某類商品的需求函數(shù)為: 其中, 為商品需求量,分別為居民收入和該商品價格,并且已知在時序樣本數(shù)據(jù)中高度相關(guān)。為此分以下二步完成:(1) 收集最近一年該商品的銷售量和居民收入的統(tǒng)計資料(橫截面數(shù)據(jù)),由于商品價格在一年中的變化幅度不大,所以將需求函數(shù)取成: 利用橫截面資料估計該模型,得到需求的收入彈性。(2) 原需求函數(shù)中的也是需求的收入彈性,所以(此時實際上假設(shè)歷年的平均收入彈性與近期的收入彈性近似相等),將原模型變換成: 其中,。再利用歷年商品銷售量、居民收入和價格的統(tǒng)計資料(時序數(shù)據(jù))估計模
10、型,得到,從而在消除多重共線性影響的情況下,估計出需求函數(shù): 從上述三種方法的處理過程可以看出,最終還是通過減少模型中解釋變量個數(shù)的方式(即剔除引起多重共線性的變量)來消除多重共線性的影響,但并不是直接剔除有重要影響的解釋變量,模型中還是保留了這些變量的影響,所以稱之為“間接剔除)。(三) 逐步回歸建立計量經(jīng)濟模型的時候,一般是將解釋變量全部引入模型,然后再根據(jù)統(tǒng)計檢驗和定性分析從中逐個剔除次要的或產(chǎn)生多重共線性的變量,選擇變量是一個“由多到少”的過程。而逐步回歸選擇變量時,卻是一個“由少到多”的過程,即從所有解釋變量中間先選擇影響最為顯著的變量建立模型,然后再將模型之外的變量逐個引入模型;每
11、引入一個變量,就對模型中的所有變量進行一次顯著性檢驗,并從中剔除不顯著的變量,逐步引入剔除引入,直到模型之外所有變量均不顯著時為止。許多統(tǒng)計分析軟件都有逐步回歸程序,但根據(jù)計算機軟件自動挑選的模型往往統(tǒng)計檢驗合理,經(jīng)濟意義并不理想。因此,實際應(yīng)用中一般是依據(jù)逐步回歸的原理,結(jié)合主觀分析來篩選變量。具體步驟為:(1) 利用相關(guān)系數(shù)從所有解釋變量中選取相關(guān)性最強的變量建立一元回歸模型。(2) 在一元回歸模型中分別引入第二個變量,共建立個二元回歸模型(設(shè)共有個解釋變量),從這些模型中再選取一個較優(yōu)的模型。選擇時要求:模型中每個解釋變量影響顯著,參數(shù)符號正確,值有所提高。(3) 在選取的二元回歸模型中
12、以同樣方式引入第三個變量;如此下去,直到無法引入新的變量時為止。例5服裝需求函數(shù)。根據(jù)理論和經(jīng)驗分析,影響居民服裝需求的主要因素有:可支配收入X、流動資產(chǎn)擁有量K、服裝類價格指數(shù)P1和總物價指數(shù)P0。表3-4給出了有關(guān)統(tǒng)計資料。表3-4 服裝需求函數(shù)有關(guān)統(tǒng)計資料年份服裝需求可支配收入X流動資產(chǎn)擁有量K服裝類價格指數(shù)P1總物價指數(shù)P019791980198119821983198419851986198719888.49.610.411.412.214.215.817.919.320.882.988.099.9105.3117.7131.0148.0161.8174.2184.717.121.3
13、25.129.034.040.044.049.051.053.09293969410010110511211211294969797100101104109111111設(shè)服裝需求函數(shù)為: (1) 相關(guān)系數(shù)檢驗鍵入:COR Y X K P0 P1輸出的相關(guān)系數(shù)矩陣為:YXKP0XKP0P10.99770.98340.98870.97550.98830.98770.98040.96950.97000.9918可見每個因素都與服裝需求高度相關(guān),而且解釋變量之間也是高度相關(guān)的。現(xiàn)按照逐步回歸原理建立模型。(2) 建立一元回歸模型根據(jù)理論分析,可支配收入應(yīng)該是服裝需求最主要的影響因素;相關(guān)系數(shù)檢驗也表明
14、,收入與服裝需求的相關(guān)性最強。所以以作為最基本的模型。(3) 將其余變量逐個引入模型,估計結(jié)果列入表3-5(其中括號里的數(shù)字為統(tǒng)計量值)。XP1P0K0.11790.99500.99560.1262(8.57)-0.0378(-0.57)0.99460.99580.1030(5.67)0.0857(0.83)0.99480.99600.1315(7.03)-0.0388(-0.74)0.99470.99590.1042(7.55)-0.1866(-2.47)0.3132(2.59)0.99700.99800.0978(3.71)-0.1972(2.24)0.3401(-2.20)0.0144(
15、0.30)0.99650.9980從表3-5的估計結(jié)果可以看出,在基本模型中引入P1之后,的符號正確,但P1的檢驗不顯著,同時擬合優(yōu)度提高不多,反而下降,同理再分別引入其他兩個解釋變量,引入的變量都不顯著,但相對來說,模型的擬合優(yōu)度最高,所以再將該模型作為基本模型,逐步引入其他變量。引入P1之后,模型中各個系數(shù)的符號合理,解釋變量的t檢驗也都是顯著的,并且擬合優(yōu)度都有所提高。在此基礎(chǔ)上再引入K,其檢驗不顯著,為多余變量。 經(jīng)過以上的逐步引入檢驗過程,最終確定服裝需求函數(shù)為: 從本例的討論過程可以看出:(1)模型中引入相關(guān)性較強的解釋變量,會影響系數(shù)的估計值和檢驗值,這正是多重共線性的主要影響。
16、(2) 在模型中增添解釋變量,不論其影響是否顯著都會使的值上升;但的值卻不一定增加,增添不顯著的解釋變量甚至可能會使的值下降。所以比較不同模型的擬合優(yōu)度時,取比較合理。 另外,該需求模型還存在兩個問題,一是DW值接近于4,可能存在自相關(guān)性;二是樣本容量太小,卻要考慮引入4個解釋變量,樣本的自由度只有;所以模型的估計結(jié)果可能并不可靠,過高的擬合優(yōu)度也可能提供的是虛假信息。本例只是為了說明多重共線性的處理過程,實際應(yīng)用中只有在樣本容量較大的情況下,才能考慮引入多個解釋變量。(四) 主成分回歸主成分回歸(Principal Components Regression,簡稱PCR)是根據(jù)多元統(tǒng)計分析中
17、的主成分分析原理、用于處理多重共線性模型的一種新的參數(shù)估計方法。其基本原理是:利用主成分分析將解釋變量轉(zhuǎn)換成若干個主成分,這些主成分從不同側(cè)面反映了解釋變量的綜合影響,并且互不相關(guān)。因此,可以將被解釋變量關(guān)于這些主成分進行回歸,再根據(jù)主成分與解釋變量之間的對應(yīng)關(guān)系,求得原回歸模型的估計方程。主成分回歸的具體步驟為:(1) 對原始樣本數(shù)據(jù)做標準化處理,這樣矩陣即為解釋變量的相關(guān)系數(shù)矩陣。(2) 計算個特征值,以及相應(yīng)的標準化特征向量。(3) 利用特征值檢驗多重共線性。模型存在多重共線性時,至少有一個特征值近似地等于零,不妨設(shè)近似為零,這表明解釋變量之間存在著個線性相關(guān)關(guān)系。(4) 設(shè)解釋變量(已
18、標準化)個主成分為: 其中,互不相關(guān),并且近似為零。將(標準化的)被解釋變量關(guān)于個主成分進行回歸,得: (5) 根據(jù)主成分與解釋變量之間的關(guān)系式(3-18),將其代入主成分回歸方程(3-19)式,求得用標準化數(shù)據(jù)表示的的回歸方程: 系數(shù)與原模型中參數(shù)之間的關(guān)系為: 其中,、分別為和的標準差;由此可以計算出原回歸模型中的參數(shù),進而得到: 例6中國民航客運量預(yù)測模型,為了研究我國民航客運量的變化趨勢及其成因,經(jīng)分析選擇了以下解釋變量:居民消費額(億元)、政府消費額(億元)、鐵路客運量(萬人)、來華旅游入境人數(shù)(萬人)、民航航線里程(萬公里),并取中國民航客運量(萬人)作為被解釋變量。有關(guān)統(tǒng)計資料列
19、入表3-6。表3-6 民航客運量及其影響因素的統(tǒng)計資料年份民航客運量居民消費額政府消費額鐵路客運量來華旅游人數(shù)民航航線里程1978197919801981198219831984198519861987198819891990199119921993199419951996199719982312983434014453915547479971310144212831660217828863383403851175555563057551759.12005.42317.12604.12867.93182.53674.54589.05175.05961.27633.18523.59113.210
20、315.912459.815682.420809.826944.532152.334854.636921.14806146597057708381020118413671490172720332252283034924500598666907852872594858149186389922049530099922957129508099693941629257893620180.92420.39570.25776.71792.43947.701285.221783.302281.952690.233169.482450.142746.203335.653311.504152.704368.45
21、4638.655112.755758.796347.8414.8916.0019.5321.8223.2722.9126.0227.7232.4338.9137.3847.1950.6855.9183.6696.08104.56112.90116.65142.50150.58(1) 多重共線性檢驗由于選擇的影響因素較多,所以估計模型之前,應(yīng)該先分析各個因素與被解釋變量之間的關(guān)系,以及因素之間的相關(guān)程度。利用SCAT命令觀察了與各個解釋變量的相關(guān)圖之后,再用COR命令進行相關(guān)系數(shù)檢驗輸出的相關(guān)系數(shù)矩陣為: 0.9862 0.9869 0.9969 -0.1199 -0.1567 -0.1569
22、0.9553 0.9377 0.9420 0.0779 0.9878 0.9778 0.9877 -0.1140 0.9569計算結(jié)果表明,除鐵路客運量之外 ,其他因素與民航客運量高度相關(guān);而且解釋變量之間也是兩兩高度相關(guān)的。為了進一步檢驗解釋變量之間的相關(guān)關(guān)系,利用SPSS軟件計算出解釋變量相關(guān)系數(shù)矩陣的特征值為: 此時,即(標準化后的)樣本數(shù)據(jù)矩陣是一個病態(tài)矩陣,而且病態(tài)(條件)數(shù)和病態(tài)指數(shù)分別為: 因此,模型存在嚴重的多重共線性。如果此時用OLS法估計模型,將得到以下估計結(jié)果:模型中所有解釋變量的檢驗均不顯著,并且的系數(shù)符號不合理。(2) 主成分回歸 現(xiàn)采用主成分回歸解決多重共線性問題。根據(jù)SPSS軟件的計算結(jié)果,所對應(yīng)主成分的累計貢獻率(貢獻率為:)達到98.77%;對應(yīng)的標準化特征向量為: 所以兩個主成分為:其中,均為標準化后的解釋變量。從主成分中各變量的系數(shù)值可以看出,第一主成分主要反映了的變化,即綜合反映了與民航客運量正相關(guān)因素的影響;第二主成分主要反映了客運量的變化,即與民航客運量負相關(guān)因素的影響。 在SPS
溫馨提示
- 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
- 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
- 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
- 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負責。
- 6. 下載文件中如有侵權(quán)或不適當內(nèi)容,請與我們聯(lián)系,我們立即糾正。
- 7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。
最新文檔
- 浙江師范大學行知學院《建筑學專業(yè)導(dǎo)論》2023-2024學年第一學期期末試卷
- 中國音樂學院《生物信息技術(shù)》2023-2024學年第一學期期末試卷
- 鄭州衛(wèi)生健康職業(yè)學院《企業(yè)項目實踐》2023-2024學年第一學期期末試卷
- 學習領(lǐng)會《教育強國建設(shè)規(guī)劃綱要(2024-2035年)》心得體會
- 玉溪職業(yè)技術(shù)學院《數(shù)理統(tǒng)計及軟件》2023-2024學年第一學期期末試卷
- 物流行業(yè)智能化協(xié)作網(wǎng)絡(luò)設(shè)計
- IT業(yè)務(wù)數(shù)據(jù)季度總結(jié)模板
- 業(yè)務(wù)操作-房地產(chǎn)經(jīng)紀人《業(yè)務(wù)操作》名師預(yù)測卷1
- 農(nóng)業(yè)公司年度匯報
- 柏拉圖與《理想國》讀書筆記
- 高三期末家長會 高中期末考試成績分析會ppt
- 15.5-博物館管理法律制度(政策與法律法規(guī)-第五版)
- 水泥廠鋼結(jié)構(gòu)安裝工程施工方案
- 2023光明小升初(語文)試卷
- 三年級上冊科學說課課件-1.5 水能溶解多少物質(zhì)|教科版
- GB/T 7588.2-2020電梯制造與安裝安全規(guī)范第2部分:電梯部件的設(shè)計原則、計算和檢驗
- GB/T 14600-2009電子工業(yè)用氣體氧化亞氮
- 小學道德與法治學科高級(一級)教師職稱考試試題(有答案)
- 河北省承德市各縣區(qū)鄉(xiāng)鎮(zhèn)行政村村莊村名居民村民委員會明細
- 實用性閱讀與交流任務(wù)群設(shè)計思路與教學建議
- 應(yīng)急柜檢查表
評論
0/150
提交評論