應用回歸分析_第1頁
應用回歸分析_第2頁
應用回歸分析_第3頁
應用回歸分析_第4頁
應用回歸分析_第5頁
免費預覽已結束,剩余1頁可下載查看

下載本文檔

版權說明:本文檔由用戶提供并上傳,收益歸屬內容提供方,若內容存在侵權,請進行舉報或認領

文檔簡介

1、第五章自變量選擇對回歸參數(shù)的估計有何影響 答:全模型正確而誤用選模型時,我們舍去了 m-p 個自變量,用剩下的 p 個自變量去建立 選模型, 參數(shù)估計值是全模型相應參數(shù)的有偏估計。 選模型正確而誤用全模型時, 參數(shù)估計 值是選模型相應參數(shù)的有偏估計。自變量選擇對回歸預測有何影響(一)全模型正確而誤用選模型的情況估計系數(shù)有偏, 選模型的預測是有偏的, 選模型的參數(shù)估計有較小的方差, 選模型的預測殘 差有較小的方差 ,選模型預測的均方誤差比全模型預測的方差更小。(二)選模型正確而誤用全模型的情況 全模型的預測值是有偏的,全模型的預測方差的選模型的大,全模型的預測誤差將更大。 如果所建模型主要用于預

2、測,應該用哪個準則來衡量回歸方程的優(yōu)劣 答:應該用自由度調整復決定系數(shù)達到最大的準則。 當給模型增加自變量時, 復決定系數(shù)也 隨之增大, 然而復決定系數(shù)的增大代價是殘差自由度的減小, 自由度小意味著估計和預測的 可靠性低。應用自由度調整復決定系數(shù)達到最大的準則可以克服樣本決定系數(shù)的這一缺點 把 R2 給予適當?shù)男拚?,使得只有加入“有意義”的變量時,經過修正的樣本決定系數(shù)才會 增加,從而提高預測的精度。試述前進法的思想方法。解:主要是變量由少到多,每次增加一個,直至沒有可引入的變量為止。具體做法是:首先將全部m個自變量,分別對因變量 y建立m個一元線性回歸方程,并分別計算這m個一元回歸方程的 m

3、個回歸系數(shù)的F檢驗值,記為Fi1,F21,L ,f;,選其最大1 1 1 1 1者FjmaxF,丘丄,F(xiàn)m,給定顯著性水平,若FjF (1,n2),則首先將Xj引入回歸方程,假設Xj 。其次,將y分別與(X1,X2),(X1X3)丄,(xi,xm)建立m-i個二元線性回歸方程,對這 m-1個回歸方程中X2,X3,L,Xm的回歸系數(shù)進行 F檢驗,計算F值,記為F2 ,F3 ,L ,Fm ,選其最大的記為 FjmaXF22, F32,L , Fm2 ,若 Fj2,若F (1,n3),則X接著將j引入回歸方程。以上述方法做下去。直至所有未被引入方程的自變量的F值均小于F(1,n p 1)為止。試述后

4、退法的思想方法。首先用全部 m 個變量建立一個回歸方程,然后在這 m 個變量中選擇一個最不重要的變量, 將它從方程中剔除。前進法、后退法各有哪些優(yōu)缺點 解:都可以挑選出對因變量有顯著性影響的自變量,逐個挑選并排除顯著性較低的自變量。 前進法的缺點:不能反映引進新的自變量后的變化情況。后退法的缺點: 開始把全部自變量引入回歸方程, 計算量很大。一旦自變量被剔除,就不會 再被引入回歸方程。試述逐步回歸的思想方法?;舅枷耄河羞M有出。具體做法: 將變量一個個引入, 當每引進一個自變量后, 對已引入的變量要逐個檢驗, 當原 引入的變量由于后面的引入而變得不再顯著時, 要將其剔除。 引入一個變量或從回歸

5、方程中 提出一個變量,為逐步回歸的一步, 每一步都要進行 F檢驗,以確保每次引入新的變量之前 回歸方程中只包含顯著的變量。 直到既無顯著的自變量選入回歸方程, 也無不顯著自變量從 回歸方程中剔除為止。在運用逐步回歸法時,進與 出 的賦值原則是什么如果希望回歸方程中多保留一些自變量,進 應如何賦值答:在運用逐步回歸法時,要求引入自變量的顯著性水平進 小于剔除自變量的顯著性水平出。在運用逐步回歸法引入變量時,我們是在Fjp F (1,n p 1)時,將 xj 引入方程,所以如果希望回歸方程中多保留一些自變量, 則引入自變量時的的檢驗臨界值 F (1,n p 1)應盡可能地小一些,相應地,進 應盡可

6、能地大一些。在研究國家財政收入時,我們把財政收入按收入形式分為:各項稅收收入、企業(yè)收入、債務收入、 國家能源交通重點建設基金收入、 基本建設貸款歸還收入、 國家預算調節(jié)基金收入、其他收入等。為了建立國家財政收入回歸模型,我們以財政收入y (億元)為因變量,自變量如下:x1為農業(yè)增加值(億元);x2為工業(yè)增加值(億元);x3為建筑業(yè)增加值(億元)x4為人口數(shù)(萬人);x5為社會消費總額(億元);x6為受災面積(萬公頃)。據(jù)中國統(tǒng)計年鑒獲得與變量 y有較強的相關性,分別用后退法和逐步回歸法作自變量選元。表年份農業(yè)x1工業(yè)x2建筑業(yè)x3人口x4最終消費x5受災面積x6財政收入y19781607962

7、595076019799754239370198098705445301981100072397901982101654331301983103008347101367198427891043573189019851058515773443701986396710750765424714021221987109300420901988383181011102650870198942286484794112704469901990501768581143333847019911158235547019925800141511717151330199311851748830434919941198

8、5026796550401995119931211213363545821199612238946989740819971236265342919985262124810501459876表的數(shù)據(jù)是1968-1983年期間美國與電話線制造有關的數(shù)據(jù),各個變量的含義如下:X!年份;X2 國民生產總值(10億美元);X3新房動工數(shù)(單位:1000);X4 失業(yè)率(%);X5滯后6個月的最惠利率;X6用戶用線增量(%);y 年電話線銷量(百萬尺雙線)。(1)建立y對x2 x6的線性回歸方程;(2 )用后退法選擇自變量;(3)用逐步回歸法選擇自變量;(4)根據(jù)以上計算結果分析后退法與逐步回歸法的差異。表X1X2X3X4X5X6y196858731969785219708189197174941972853419738688197472701975502019766035(1 )解:利用SPSS尋回歸方程為:?5922.827 4.864冷2.374x3817.901x414.593x5846.867冷(2) 用后退發(fā)生剔除變量 X5,得最優(yōu)回歸方程:?6007.320 5.068X22.308x3824.261x4862.699x6(3) 用逐步回歸法依次引入 x3,X5,X4,得最優(yōu)回歸模型:? 1412.807 3.440x3 348

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網頁內容里面會有圖紙預覽,若沒有圖紙預覽就沒有圖紙。
  • 4. 未經權益所有人同意不得將文件中的內容挪作商業(yè)或盈利用途。
  • 5. 人人文庫網僅提供信息存儲空間,僅對用戶上傳內容的表現(xiàn)方式做保護處理,對用戶上傳分享的文檔內容本身不做任何修改或編輯,并不能對任何下載內容負責。
  • 6. 下載文件中如有侵權或不適當內容,請與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

評論

0/150

提交評論