第三講、用SAS作回歸分析ppt課件_第1頁(yè)
第三講、用SAS作回歸分析ppt課件_第2頁(yè)
第三講、用SAS作回歸分析ppt課件_第3頁(yè)
第三講、用SAS作回歸分析ppt課件_第4頁(yè)
第三講、用SAS作回歸分析ppt課件_第5頁(yè)
已閱讀5頁(yè),還剩16頁(yè)未讀, 繼續(xù)免費(fèi)閱讀

下載本文檔

版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請(qǐng)進(jìn)行舉報(bào)或認(rèn)領(lǐng)

文檔簡(jiǎn)介

1、回歸分析中SAS的運(yùn)用11、回歸分析計(jì)算PROC REG DATA=數(shù)據(jù)集名; MODEL 應(yīng)變量=自變量;RUN;PROC REG DATA=數(shù)據(jù)集名; MODEL 應(yīng)變量=自變量名列/ p cli clm RUN;22、回歸線作圖PROC REG DATA=數(shù)據(jù)集名; MODEL 應(yīng)變量=自變量/p cli clm r; PLOT y變量*x變量/選項(xiàng);RUN;利用plot語句可以繪制與擬合數(shù)據(jù)有關(guān)散點(diǎn)圖、回歸線和置信曲線、預(yù)測(cè)區(qū)間曲線3回歸線作圖PROC REG DATA=數(shù)據(jù)集名; MODEL 應(yīng)變量=自變量/p cli clm r; PLOT y變量*x變量/選項(xiàng);RUN;y變量和x

2、變量可以是應(yīng)變量、自變量和其它與回歸分析有關(guān)的變量:p.(predicted) 預(yù)測(cè)值r. (residual) 余差U95., L95. 預(yù)測(cè)值置信限U95M.,L95M.預(yù)測(cè)均值置信限選項(xiàng):conf 95作預(yù)測(cè)均值置信曲線pred95作預(yù)測(cè)值置信曲線overlay將語句中規(guī)定的圖迭置在一幅圖上AIC CP MSE SSE在圖上顯示相應(yīng)的統(tǒng)計(jì)量43、逐漸回歸分析計(jì)算-變量選擇PROC REG DATA=數(shù)據(jù)集名; MODEL 應(yīng)變量=自變量名列/p cli clm r selection=stepwise slentry=0.05 slstay=0.05 details;RUN;54、回歸診

3、斷例外值(outliers)或異常作用點(diǎn)的檢查從已擬合回歸的數(shù)據(jù)中分析線性模型的假定能否被破壞:應(yīng)變量的均值能否是獨(dú)立變量的線性函數(shù),能否需求對(duì)變量進(jìn)展變換或擬合曲線回歸余差(residuals)能否同方差,不相關(guān),正態(tài)分布獨(dú)立變量間能否存在線性關(guān)系(僅多元有)調(diào)查余差散點(diǎn)圖是進(jìn)展回歸診斷的必要步驟6回歸診斷7回歸診斷回歸分析的余差值是回歸診斷的重要工具rYYiii = - 個(gè)預(yù)測(cè)值為第其中 :余差的定義為iYYYriiii 利用余差可以調(diào)查余差和預(yù)測(cè)值的散點(diǎn)圖也可以檢驗(yàn)余差分布的正態(tài)性8回歸診斷3.4.1.2.模型適宜模型適宜應(yīng)改曲線模應(yīng)改曲線模型型不等方差不等方差觀測(cè)值不獨(dú)立觀測(cè)值不獨(dú)立9

4、回歸診斷生成余差在PROC REG的model語句加上選項(xiàng) p,就會(huì)輸出預(yù)測(cè)值和相應(yīng)的余差PROC REG DATA=數(shù)據(jù)集名; MODEL 應(yīng)變量=自變量/p; PLOT y變量*x變量/選項(xiàng);RUN;利用plot語句 plot r.*p. ; 就可得到余差-預(yù)測(cè)散點(diǎn)圖,其中可以把p值換成自變量x,就得到相應(yīng)的散點(diǎn)圖。10回歸診斷識(shí)別異常觀測(cè)值在PROC REG的model語句加上選項(xiàng) r,就會(huì)輸出與預(yù)測(cè)值和余差有關(guān)的一些統(tǒng)計(jì)量。他們可用于識(shí)別異常數(shù)據(jù)(outlier)及其影響PROC REG DATA=數(shù)據(jù)集名 ; MODEL 應(yīng)變量=自變量/r;RUN;Predict Value 預(yù)測(cè)值

5、Std Err Predict 預(yù)測(cè)值規(guī)范差Residual 余差Std Err Predict 余差規(guī)范差Student Residual student化的余差-2 -1 0 1 2 余差顯著性圖Cooks D Cooks D統(tǒng)計(jì)量其中D是間隔 的縮寫。11回歸診斷余差分布正態(tài)性有了余差的數(shù)據(jù),就可對(duì)其運(yùn)用圖形方法或正式的分布正態(tài)性的檢驗(yàn)在INSIGHT中可直接對(duì)數(shù)據(jù)表中的預(yù)測(cè)余差變量進(jìn)展分析在PROC REG可利用以下語句用圖形分析余差分布正態(tài)性PROC REG DATA=數(shù)據(jù)集名 graphics ; MODEL 應(yīng)變量=自變量; PLOT nqq.*student.(nqq.*r.)

6、;RUN;12回歸診斷識(shí)別有影響的觀測(cè)Cook D統(tǒng)計(jì)量度量一個(gè)觀測(cè)從分析中剔除時(shí)參數(shù)估計(jì)值的變化對(duì)一個(gè)觀測(cè)值其 Cook D 統(tǒng)計(jì)量的值超過 4/n 時(shí)(n為樣本容量),這個(gè)觀測(cè)存在反常效應(yīng), 其中4/n只是閱歷,沒有一致的規(guī)范。13回歸診斷識(shí)別有影響的觀測(cè)Dffitsi 度量第i 個(gè)觀測(cè)對(duì)預(yù)測(cè)值的影響iY第i個(gè)觀測(cè)的預(yù)測(cè)值 )(iY用排除第i個(gè)觀測(cè)的回歸對(duì)第i個(gè)觀測(cè)的預(yù)測(cè)值 )(iYS第i個(gè)觀測(cè)的預(yù)測(cè)值的規(guī)范差,是為了把數(shù)據(jù)規(guī)范化。其中Dffits越大越好,D是different和fit的縮寫闡明,)(Dffits)(iiiiYsYY npi/2? |Dffits|p 為模型中參數(shù)的個(gè)數(shù),

7、 n 為樣本容量其中14回歸診斷識(shí)別有影響的觀測(cè)Proc REG 的 Model語句加選項(xiàng) r 可獲得 Cook D 統(tǒng)計(jì)量Proc REG 的 Model語句加選項(xiàng) influence 可獲得 Dffits 等反映觀測(cè)值影響的統(tǒng)計(jì)量PROC REG DATA=數(shù)據(jù)集名 ; MODEL 應(yīng)變量=自變量/r influence;RUN;15選項(xiàng) influence 生成的統(tǒng)計(jì)量 Hat diag:帽子矩陣,可以把杠桿點(diǎn)找出來,用的較多。Dbet:表示某個(gè)點(diǎn)刪除前后統(tǒng)計(jì)量的變化。16五、影響點(diǎn)診斷proc reg data=e4;model y1=x1-x4/influence r;run;其中選

8、項(xiàng)其中選項(xiàng)influence 同上一頁(yè)。同上一頁(yè)。R主要給主要給出出Cook-distance.前面已有。前面已有。17六、共線性診斷共線性(collinearity, multicollinearity)問題是指獨(dú)立變量間存在線性關(guān)系1.變量間的線性關(guān)系會(huì)隱蔽變量的顯著性2.也會(huì)添加參數(shù)估計(jì)的方差3.產(chǎn)生不穩(wěn)定的模型只需擬合多元回歸才會(huì)發(fā)生這一問題共線性的診斷可運(yùn)用方差膨脹因子、條件指數(shù)和方差比例18回歸診斷共線性診斷-VIF方差膨脹因子(VIF)是對(duì)由于共線性而引起的參數(shù)估計(jì)量的方差添加的一個(gè)相對(duì)度量r2rTOL111VIFrR獨(dú)立時(shí)系數(shù)方差系數(shù)方差Rr2 是Xr關(guān)于模型中其它獨(dú)立變量回歸的R2普通采用 VIF 10 闡明存在共線性問題Proc REG 的Model語句加選項(xiàng) VIF19回歸診斷共線性診斷-條件指數(shù)和方差比例條件指數(shù)(condition index)和方差比例(variance proportion)結(jié)合運(yùn)用可確認(rèn)存在線性關(guān)系的變量組條件指數(shù)(hi=(lmax/li)1/2)在10-30間為弱相關(guān)在30-100間為中度相關(guān)大于100闡明有強(qiáng)相關(guān)大的條件指數(shù)伴隨方差比例 0.5 可確認(rèn)有共線性的獨(dú)立變量子集Proc REG: Model語句加選項(xiàng)collin 或 col

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請(qǐng)下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請(qǐng)聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁(yè)內(nèi)容里面會(huì)有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫(kù)網(wǎng)僅提供信息存儲(chǔ)空間,僅對(duì)用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對(duì)用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對(duì)任何下載內(nèi)容負(fù)責(zé)。
  • 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請(qǐng)與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶因使用這些下載資源對(duì)自己和他人造成任何形式的傷害或損失。

評(píng)論

0/150

提交評(píng)論