第七章-多重共線性及其處理(共7頁)_第1頁
第七章-多重共線性及其處理(共7頁)_第2頁
第七章-多重共線性及其處理(共7頁)_第3頁
第七章-多重共線性及其處理(共7頁)_第4頁
第七章-多重共線性及其處理(共7頁)_第5頁
已閱讀5頁,還剩2頁未讀, 繼續(xù)免費閱讀

下載本文檔

版權說明:本文檔由用戶提供并上傳,收益歸屬內容提供方,若內容存在侵權,請進行舉報或認領

文檔簡介

1、精選優(yōu)質文檔-傾情為你奉上第七章 多重共線性及其處理一、簡答題1什么是變量之間的多重共線性?2什么是完全多重共線性?什么是不完全多重共線性?3多重共線性在多元線性回歸模型中普遍存在的主要原因有哪些? 4多重共線性可能造成哪些不利后果?5多重共線性的檢驗有哪些適當?shù)姆椒?6多重共線性的修正方法有哪些? 二、計算題分析題1某地區(qū)供水部門利用最近20年的用水年度數(shù)據(jù)得出如下估計模型:(-1.7) (0.9) (1.4) (-0.6) (-1.2) (-0.8)F=38.9式中,用水總量(百萬立方米),住戶總數(shù)(千戶),總人口(千人),人均收入(元),價格(元/100立方米),降雨量(毫米)。(1)根

2、據(jù)經(jīng)濟理論和直覺,請計回歸系數(shù)的符號是什么(不包括常量),為什么?觀察符號與你的直覺相符嗎?(2)在10%的顯著性水平下,請進行變量的t檢驗與方程的F-檢驗。T檢驗與F檢驗結果有相矛盾的現(xiàn)象嗎?(3)你認為估計值是(1)有偏的;(2)無效的;(3)不一致的嗎?詳細闡述理由。2下表是某地區(qū)1995年2004年食品需求量、可支配收入、食品類價格指數(shù)、物價總指數(shù)和流動資產(chǎn)擁有量的數(shù)據(jù)資料。食品需求函數(shù)有關統(tǒng)計資料年份食品需求量(億元)可支配收入(億元)食品類價格指數(shù)(1995年=100)物價總指數(shù)(1995年=100)流動資產(chǎn)擁有量(億元)199584829 9294171 199696880 93

3、96213 1997104999 9697251 19981141053 9497290 19991221177 100100340 20001421310 101101400 20011581482 105104440 20021791618 112109490 20031931742 112111510 20042081847 112111530 問題:(1)檢驗變量間的多重共線性。(2)利用法,建立適當?shù)幕貧w方程。 第四部分 習題答案一、簡答題1多重共線性指兩個或多個解釋變量之間不再彼此獨立,而是出現(xiàn)了相關性。2完全多重共線性指:在有多個解釋變量模型中,其中一個變量可以表示為其他多個變量

4、的完全線性函數(shù),即,其中至少有一個,與等式右邊線性組合的相關系數(shù)為1,則這種情況被稱為完全多重共線性。在此情況下,不能估計解釋變量各自對被解釋變量的影響。 不完全多重共線性指:在實際經(jīng)濟活動中,多個解釋變量之間存在多重共線性問題,但與等式右邊線性組合的相關系數(shù)不為1。3多重共線性產(chǎn)生的原因多元線性回歸模型產(chǎn)生多重共線性的原因很多,主要有:(1)經(jīng)濟變量的內在聯(lián)系。這是產(chǎn)生多重共線性的根本原因;(2)解釋變量中含有滯后變量;(3)經(jīng)濟變量變化趨勢的“共向性”。4多重共線性會產(chǎn)生以下問題:(1)增大了OLS估計量的方差;(2)難以區(qū)分每個解釋變量的單獨影響;(3)回歸模型缺乏穩(wěn)定性;(4)檢驗的可

5、靠性降低。5在應用多元回歸模型中,人們總結了許多檢驗多重共線性的方法。(1)系數(shù)判定法(2)用解釋變量之間所構成的回歸方程的決定系數(shù)進行判別(3)逐步回歸判別法以為被解釋變量逐個引入解釋變量,構成回歸模型,進行參數(shù)估計,根據(jù)決定系數(shù)的變化決定新引入的變量是否能夠加入模型之中。首先將對所有的解釋變量分別作回歸,得到所有的模型,取決定系數(shù)最大的模型中的解釋變量加入模型,作為第一個引入模型的變量;其次,將再對剩余的解釋變量分別加入模型,進行二元回歸,再次,取決定系數(shù)最大的解釋變量加入模型;依次做下去,直到模型的決定系數(shù)不再改善為止。(4)方差膨脹因子VIF判別法 對于多元線性回歸模型,的方差可以表示

6、成 一般當VIF10時(此時0.9),認為模型存在較嚴重的多重共線性。(5)修正的Frish判別法該方法不僅可以對多重共線性進行判別,同時也是處理多重共線性問題的一種有效方法。其步驟為:第一,用被解釋變量分別對每個解釋變量進行線性回歸,根據(jù)經(jīng)濟理論和統(tǒng)計檢驗從中選擇一個最合適的回歸模型作為基本回歸模型,通常選取決定系數(shù)最大的回歸模型。第二,在基本回歸模型中逐個增加其他解釋變量,重新進行線性回歸,如果新增加的這個解釋變量提高了回歸模型的決定系數(shù),并且回歸模型中的其他參數(shù)統(tǒng)計上仍然顯著,就在模型中保留該解釋變量;如果新增加的解釋變量沒有顯著提高回歸模型的擬合優(yōu)度,則不在模型中保留該解釋變量;如果新

7、增加的解釋變量提高了回歸模型的決定系數(shù),并且回歸模型中某些參數(shù)的數(shù)值或符號等受到顯著的影響,說明模型中存在多重共線性,對該解釋變量同與之相關的其他解釋變量進行比較,在模型中保留對被解釋變量影響較大的,剔除影響較小的。6多重共線性的解決方法有:(1)剔除引起共線性的變量;在估計模型之前,找出引起多重共線性的變量,將它剔除出去,是最有效的克服多重共線性問題的方法。(2)變換模型的形式對原模型進行適當?shù)淖儞Q,也可以消除或削弱原模型中解釋變量之間的相關關系。具體有三種變換方式:一是變換模型的函數(shù)形式;二是變換模型的變量形式;三是改變變量的統(tǒng)計指標。(3)綜合使用時序數(shù)據(jù)與橫截面數(shù)據(jù)如果能同時獲得變量的

8、時序數(shù)據(jù)和橫截面數(shù)據(jù),則先利用某類數(shù)據(jù)估計出模型中的部分參數(shù),再利用另一類數(shù)據(jù)估計模型的其余參數(shù)。(4)逐步回歸分析法逐步回歸選取變量時,是一個“由少到多”的過程,即從所有解釋變量中間先選擇影響最為顯著的變量建立模型,然后再將模型之外的變量逐個引入模型;每引入一個變量,就對模型中的所有變量進行一次顯著性檢驗,并從中剔除不顯著的變量;逐步引入剔除引入,直到模型之外所有變量均不顯著時為止。 (5)增加樣本容量由于多重共線性是一個樣本特性,如果理論上解釋變量之間不存在多重共線性,則可以通過收集更多的觀測值增加樣本容量,來避免或減弱多重共線性。二、計算題分析題1(1)在其他變量不變的情況下,一城市的人

9、口越多或房屋數(shù)量越多,則對用水的需求越高。所以可期望house和pop的符號為正;收入較高的個人可能用水較多,因此pcy的預期符號為正,但它可能是不顯著的。如果水價上漲,則用戶會節(jié)約用水,所以可預期price的系數(shù)為負。顯然如果降雨量較大,則草地和其他花園或耕地的用水需求就會下降,所以可以期望rain的系數(shù)符號為負。從估計的模型看,除了pcy之外,所有符號都與預期相符。(2)t-統(tǒng)計量檢驗單個變量的顯著性,F(xiàn)-統(tǒng)計值檢驗變量是否是聯(lián)合顯著的。這里t-檢驗的自由度為15-5-1=9,在10%的顯著性水平下的臨界值為1.833??梢?,所有參數(shù)估計值的t值的絕對值都小于該值,所以即使在10%的水平下

10、這些變量也不是顯著的。這里,F(xiàn)-統(tǒng)計值的分子自由度為5,分母自由度為9。10%顯著性水平下F分布的臨界值為2.61。可見計算的F值大于該臨界值,表明回歸系數(shù)是聯(lián)合顯著的。T檢驗與F檢驗結果的矛盾可能是由于多重共線性造成的。house、pop、pcy都是高度相關的,這將使它們的t-值降低且表現(xiàn)為不顯著。price和rain不顯著另有原因。根據(jù)經(jīng)驗,如果一個變量的值在樣本期間沒有很大的變化,則它對被解釋變量的影響就不能夠很好地被度量??梢灶A期水價與年降雨量在各年中一般沒有太大的變化,所以它們的影響很難度量。(3)多重共線性往往表現(xiàn)的是解釋變量間的樣本觀察現(xiàn)象,在不存在完全共線性的情況下,近似共線并

11、不意味著基本假定的任何改變,所以OLS估計量的無偏性、一致性和有效性仍然成立,即仍是BLUE估計量。但共線性往往導致參數(shù)估計值的方差大于不存在多重共線性的情況。2根據(jù)理論分析,食品需求量受四個因素的影響,建立回歸方程:利用表7.5中數(shù)據(jù),采用最小二乘法,得:給定顯著水平,查分布表,得臨界值為,故>,回歸方程線性關系顯著。現(xiàn)用軟件分別計算兩兩變量之間的相關系數(shù),得表:需求量、收入、類指數(shù)、物價總指數(shù)和資產(chǎn)的相關系數(shù)矩陣YY 1. 0. 0. 0. 0. 0. 1. 0. 0. 0. 0. 0. 1. 0. 0. 0. 0. 0. 1. 0. 0. 0. 0. 0. 1.可見解釋變量之間是高

12、度相關的。為了檢查和處理多重共線性,采用修正法。根據(jù)理論分析,可支配收入應該是食品需求最主要的影響因素,相關系數(shù)檢驗也表明,收入與食品需求的相關性最強。所以,首先建立以收入為解釋變量的一元回歸模型。 食品需求量與可支配收入的線性回歸結果Dependent Variable: YMethod: Least SquaresSample: 1995 2004Included observations: 10VariableCoefficientStd. Errort-StatisticProb. C-12.455543.-3.0.01070.0.41.937010.0000R-squared0. M

13、ean dependent var140.0000Adjusted R-squared0. S.D. dependent var43.01163S.E. of regression3. Akaike info criterion5.Sum squared resid75.39426 Schwarz criterion5.Log likelihood-24.29012 F-statistic1758.713Durbin-Watson stat2. Prob(F-statistic)0.依次將其余變量逐個引入模型,估計結果分別如表所示。食品需求量與可支配收入及食品類價格指數(shù)的線性回歸結果Varia

14、bleCoefficientStd. Errort-StatisticProb. C14.0470849.255430.0.78380.0.8.0.0001-0.0.-0.0.1061R-squared0. Mean dependent var140.0000Durbin-Watson stat2. Prob(F-statistic)0.食品需求量與收入、類價格指數(shù)及物價總指數(shù)的線性回歸結果VariableCoefficientStd. Errort-StatisticProb. C-127.592665.15987-1.0.09790.0.7.0.0003-1.0.-2.0.04853.1.2.0.0396R-squared0. Mean dependent var140.0000Durbin-Watson stat3. Prob(F-statistic)0.需求量、收入、類指數(shù)、物價總指數(shù)和資產(chǎn)的線性回歸結果VariableCoefficientStd. Errort-StatisticProb. C-135.335275.13155-1.0.13150.0.

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內容里面會有圖紙預覽,若沒有圖紙預覽就沒有圖紙。
  • 4. 未經(jīng)權益所有人同意不得將文件中的內容挪作商業(yè)或盈利用途。
  • 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內容的表現(xiàn)方式做保護處理,對用戶上傳分享的文檔內容本身不做任何修改或編輯,并不能對任何下載內容負責。
  • 6. 下載文件中如有侵權或不適當內容,請與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

最新文檔

評論

0/150

提交評論