多元回歸分析的步驟_第1頁
多元回歸分析的步驟_第2頁
多元回歸分析的步驟_第3頁
多元回歸分析的步驟_第4頁
多元回歸分析的步驟_第5頁
全文預(yù)覽已結(jié)束

下載本文檔

版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進(jìn)行舉報或認(rèn)領(lǐng)

文檔簡介

1、最新 料推薦三、研究方法本文采取多元線性回歸的方法來設(shè)定并建立模型, 再利用逐步回歸來對變量予以確認(rèn)和剔除。 逐步回歸是通過篩選, 挑選偏回歸平方和貢獻(xiàn)最大的因子建立回歸方程,在決定是否引入一個新的因素時, 回歸方程要用方差比進(jìn)行顯著性檢驗。如果判別該影響因子通過顯著性檢驗, 那么可選入方程中, 否則就不應(yīng)該進(jìn)入到回歸方程,回歸方程中剔除一個變量的標(biāo)準(zhǔn)也是用方差比進(jìn)行顯著性檢驗剔除偏回歸平方和貢獻(xiàn)最小的變量, 無論是入選回歸方程還是從回歸方程中剔除符合條件的選入項和剔除項為止, 逐步回歸的方法剔除了對因變量影響小的因素減小了分析問題的難度, 提高了計算效率和回歸方程的穩(wěn)定性有較好的預(yù)測精度。運

2、用多元線性回歸預(yù)測的基本思路是在確定因變量和多個自變量以及它們之間的關(guān)系后,通過設(shè)定自變量參數(shù)的回歸方程對因變量進(jìn)行預(yù)測。具體如下:y = c + a1x 1 + a2 x 2 + a n x n式中 : y 表示為糧食總產(chǎn)量, c 和 a 為回歸系數(shù), c、a 是待定參數(shù), x 為所選取的影響因素 . 多元線性回歸方法可分為強(qiáng)行進(jìn)入法、消去法、向前選擇法、向后剔除法和逐步進(jìn)入法等,本文運用 spss22.0 軟件,對選擇的自變量全部進(jìn)入回歸模型,即強(qiáng)行進(jìn)入法進(jìn)行預(yù)測。該模型的優(yōu)點是方法簡單、預(yù)測速度快、外推性好等。四、分析與結(jié)果本文選取 6 個解釋變量,研究河南省糧食產(chǎn)量 y,解釋變量為 :

3、x1 糧食播種面積, x2 農(nóng)業(yè)從業(yè)人, x3 農(nóng)用機(jī)械總動力, x4 農(nóng)田有效灌溉面積, x5化肥施用折純量, x6 農(nóng)村用電量。以河南省糧食產(chǎn)量為因變量,以如上6 個解釋變量為自變量做多元線性回歸(數(shù)據(jù)選取2014 年河南統(tǒng)計年鑒,見附錄一)。用 spss做變量的相關(guān)分析,從相關(guān)矩陣(表 4-1 )中可以看出 y 與自變量的相關(guān)系數(shù)大多都在 0.9 以上,說明所選擇變量與 y 高度線性相關(guān), 用 y 與自變量做多元線性回歸是合適的。表 4-1 相關(guān)x1x2x3x4x5x6yx11.687.965.918.927.970.978x2.6871.686.456.448.731.616x3.96

4、5.6861.946.930.990.985x4.918.456.9461.961.921.960x5.927.448.930.9611.901.965x6.970.731.990.921.9011.9791最新 料推薦y.978.616.985.960.965.9791用 spss做變量系數(shù)分析(表 4-2 )表 4-2 系數(shù)b標(biāo)準(zhǔn)錯誤betat顯著性(常數(shù))-6733.2683146.969-2.140.041x18.3152.765.2623.007.006x2.155.296.121.524.604x3-.199.105-.607-1.901.068x42.6192.687.169.9

5、74.338x55.7702.4921.0472.315.028x61.0865.174.089.210.835從(表 4-2)中可以得到解釋變量與因變量之間的方程為:y6733.2688.315x10.155x20.199x32.619x45.77x51.086x6表 4-3變異數(shù)分析平方和df平均值平方f顯著性回歸40712064.12666785344.021165.292.000殘差1149417.6792841050.631估計41861481.80534從(表 4-3 )中發(fā)現(xiàn) f=165.292,說明 6 個自變量整體對因變量y 產(chǎn)生顯著線性影響。但從表 (4-2) 中不難發(fā)現(xiàn)農(nóng)

6、業(yè)從業(yè)人員、農(nóng)田有效灌溉面積、農(nóng)村用電量的 p 值較大,說明方程某些解釋變量并不顯著, 對沒有通過檢驗的回歸系數(shù),在一定程度上說明他們對應(yīng)的自變量在方程中可有可無,一般為了使模型簡化,需要剔除不顯著的自變量, 重新建立回歸方程。 而且糧食播種面積、 農(nóng)業(yè)從業(yè)人員、農(nóng)田有效灌溉面積、化肥施用折純量、農(nóng)村用電量對國民總收入起正影響,農(nóng)用機(jī)械總動力卻對國民總收入起負(fù)影響,與常識相違背,可能存在多重共線性。應(yīng)用 spss進(jìn)行異方差性檢驗。用斯皮爾曼相關(guān)系數(shù)檢驗異方差性也就是檢驗隨機(jī)誤差項的方差與解釋變量觀測值之間的相關(guān)性。若相關(guān)系數(shù)較高, 則存在異方差性,則不能通過異方差性檢驗, 此時可能會導(dǎo)致參數(shù)o

7、ls估計的方差增大,t 檢驗失效,預(yù)測精度降低。表 4-4相關(guān)standard error ofx1x2x3x4x5x6predicted valuespex11.000.441.439.377.434.439-.090armx2.4411.000.993.952.991.993-.303anx3.439.9931.000.951.9981.000-.277的x4.377.952.9511.000.950.951-.258rhox5.434.991.998.950 1.000 .998-.294x6.439.9931.000.951.9981.000-.2772最新 料推薦standard e

8、rror of1.000-.090 -.303 -.277 -.258 -.294 -.277predicted value從表 4-4 中發(fā)現(xiàn)殘差絕對值預(yù)與解釋變量的皮爾遜相關(guān)系數(shù)最高為0.303 ,不能認(rèn)為殘差絕對值與解釋變量顯著相關(guān)。所以不存在異方差性。應(yīng)用 spss進(jìn)行自相關(guān)檢驗。檢驗自相關(guān)性就是檢驗針對不同的樣本點與隨機(jī)誤差項之間是否不相關(guān)。 如果存在某種相關(guān)性, 則認(rèn)為出現(xiàn)了序列相關(guān)性。 若存在自相關(guān)性,參數(shù)估計量仍然是線性的、無偏的,但非有效;ols估計量的被估方差是有偏的且會被低估,因而會使相應(yīng)的 t 值變大;甚至模型的 t 和 f 統(tǒng)計檢驗失效;導(dǎo)致最小二乘估計量對抽樣波動非

9、常敏感。 首先用杜賓和沃特森檢驗法來判斷其是否存在自相關(guān)性。表4-5模型摘要rr 平方調(diào)整后 r平方標(biāo)準(zhǔn)偏斜度錯誤durbin-watson.986a.973.967202.609551.616由表 4-5得到 dw檢驗為 1.616 。查表可知在 1%的上下界中 k=6,n=36 的dl=0.99 ,du=1.59 ,可知 dudw4-du,該模型不存在一階自相關(guān)性。從上述已知數(shù)據(jù)不存在異方差性和一階自相關(guān)性,用spss進(jìn)行多重共線性檢驗。若存在多重共線性, 將會引起參數(shù)估計量不存在;近似共線性下 ols估計量非有效;參數(shù)估計量經(jīng)濟(jì)含義不合理;變量的顯著性檢驗失去意義,可能將重要的解釋變量排

10、除在模型之外;模型的預(yù)測功能失效。表 4-6 系數(shù)b標(biāo)準(zhǔn)錯誤beta允差vif(常數(shù))-6733.2683146.969-2.140.041x18.3152.765.2623.007.006.1297.731x2.155.296.121.524.604.01854.325x3-.199.105-.607-1.901.068.010103.768x42.6192.687.169.974.338.03230.852x55.7702.4921.0472.315.028.005208.612x61.0865.174.089.210.835.005182.444從表 4-6 中可以發(fā)現(xiàn) x1 糧食播種面

11、積的vif 明顯小于 10,說明存在共線性。由于模型存在多重共線性,我們對模型進(jìn)行調(diào)整,應(yīng)用spss進(jìn)行逐步回歸來消除多重共線性。表 4-7 系數(shù)模型b標(biāo)準(zhǔn)錯誤betat顯著性(常數(shù))-1945.9211136.720-1.712.097x14.921.223.89322.038.000x54.3601.287.1373.388.002剔除變量 x2,x3,x4,x6 后的 r 20.984 可知解釋變量與因變量x1 糧食播種3最新 料推薦面積, x5 化肥施用折純量之間的相關(guān)系數(shù) r 2 0.967 ,兩者高度相關(guān),說明擬合程度很高。從表 4-7 中發(fā)現(xiàn) p 值都小于 0.5 ,說明通過顯著性檢驗。最終得到最優(yōu)回歸方程為:y1945.9214.921x14.36x5通過影響糧食產(chǎn)量因素的多元線性

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負(fù)責(zé)。
  • 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時也不承擔(dān)用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

評論

0/150

提交評論