SPSS10.0高級教程十二:多元線性回歸與曲線擬合_第1頁
SPSS10.0高級教程十二:多元線性回歸與曲線擬合_第2頁
SPSS10.0高級教程十二:多元線性回歸與曲線擬合_第3頁
SPSS10.0高級教程十二:多元線性回歸與曲線擬合_第4頁
SPSS10.0高級教程十二:多元線性回歸與曲線擬合_第5頁
已閱讀5頁,還剩15頁未讀, 繼續(xù)免費閱讀

下載本文檔

版權說明:本文檔由用戶提供并上傳,收益歸屬內容提供方,若內容存在侵權,請進行舉報或認領

文檔簡介

1、SPSS 10.0高級教程十二:多元線性回歸與曲線擬回歸分析是處理兩個及兩個以上變量間線性依存關系的統計方法。在醫(yī)學領域中,此類問題很普遍,如人頭發(fā)中某種金屬元素的含量與血液中該元素的含量有關系,人的體表面積與身高、體重有關系;等等。回歸分析就是用于說明這種依存變化的數學關系。引0.1 Linear過程10.1.1簡單操作入門調用此過程可完成二元或多元的線性回歸分析。在多元線性回歸分析中,用戶還可根據需要,選用不同篩選自變量的方法(如:逐步法、向前法、向后法,等)。例10.1:請分析在數據集 Fat surfactant.sav中變量fat對變量spovl的大小有無影響?顯然,在這里spovl

2、是連續(xù)性變量,而fat是分類變量,我們可用用單因素方差分析來解決這個問題。但此處我們要采用和方差分析等價的分析方法-回歸分析來解決它?;貧w分析和方差分析都可以被歸入廣義線性模型中,因此他們在模型的定義、計算方法等許多方面都非常近似,下面大家很快就會看到。這里spovl是模型中的因變量,根據回歸模型的要求,它必須是正態(tài)分布的變量才可以,我們可以用直方圖來大致看一下,可以看到基本服從正態(tài),因此不再檢驗其正態(tài)性,繼續(xù)往下做。界面詳解在菜單中選擇Regression=>liner,系統彈出線性回歸對話框如下:除了大家熟悉的內容以外,里面還出現了一些特色菜,讓我們來一一品嘗?!綝e

3、pe ndent框】用于選入回歸分析的應變量?!綛lock按鈕組】由Previous和Next兩個按鈕組成,用于將下面Independent框中選入的自變量分 組。由于多元回歸分析中自變量的選入方式有前進、后退、逐步等方法,如果對 不同的自變量選入的方法不同,則用該按鈕組將自變量分組選入即可。下面的例子會講解其用法?!綢n depe ndent 框】用于選入回歸分析的自變量【Method下拉列表】用于選擇對自變量的選入方法,有Enter (強行進入法)、Stepwise (逐步法)、Remove (強制剔除法)、Backward (向后法)、Forward (向前法)五種。該選項對當前Inde

4、pendent框中的所有變量均有效?!維election Variable 框】選入一個篩選變量,并利用右側的Rules鈕建立一個選擇條件,這樣,只有滿足 該條件的記錄才會進入回歸分析?!綜ase Labels 框】選擇一個變量,他的取值將作為每條記錄的標簽。最典型的情況是使用記錄ID號的變量?!網LS>>鈕】可利用該按鈕進行權重最小二乘法的回歸分析。單擊該按鈕會擴展當前對話框, 出現WLS Weight框,在該框內選入權重變量即可?!維tatistics 鈕】彈出Statistics對話框,用于選擇所需要的描述統計量。有如下選項:oRegression Coefficients復

5、選框組:定義回歸系數的輸出情況, 選中Estimates可輸出回歸系數B及其標準誤,t值和p值,還有標準化的回歸系數beta;選中Co nfide nee in tervals則輸出每個回歸系數的95%可信區(qū)間;選中covarianee matrix則會輸出各個自變量的相關矩陣和方差、協方差矩陣。以上選項默認只選中Estimates。oResiduals復選框組:用于選擇輸出殘差診斷的信息,可選的有Durbin-Watson殘差序列相關性檢驗、超出規(guī)定的n倍標準誤的殘差列表。oModel fit復選框:模型擬合過程中進入、退出的變量的列表,以及一些有關擬合優(yōu)度的檢驗:,R,R2和調整的R2,標

6、準誤及方差分析表。oR squared change復選框:顯示模型擬合過程中R2、F值和p值的改變情況。oDescriptives復選框:提供一些變量描述,如有效例數、均數、標準差等,同時還給出一個自變量間的相關矩陣。oPart and partial correlations復選框:顯示自變量間的相關、部分相關和偏相關系數。oCollinearity diagnostics復選框:給出一些用于共線性診斷的統計量,如特征根( Eigen values)、方差膨脹因子(VIF)等。以上各項在默認情況下只有Estimates和Model fit復選框被選中。【Plot鈕】彈出Plot對話框,用于

7、選擇需要繪制的回歸分析診斷或預測圖??衫L制的有標準化殘差的 直方圖和正態(tài)分布圖,應變量、預測值和各自變量殘差間兩兩的散點圖等。【Save鈕】許多時候我們需要將回歸分析的結果存儲起來,然后用得到的殘差、預測值等做進一步的分析,Save鈕就是用來存儲中間結果的。可以存儲的有:預測值系列、殘差系列、距離(Distances)系列、預測值可信區(qū)間系列、波動統計量系列。下方的按鈕可以讓我們選擇將這些 新變量存儲到一個新的SPSS數據文件或XML中?!綩ptions鈕】設置回歸分析的一些選項,有:oStepping Method Criteria單選鈕組:設置納入和排除標準,可按P值或F值來設置。Incl

8、ude constant in equation復選框:用于決定是否在模型中包括常數項,默認選中。oMissing Values單選鈕組:用于選擇對缺失值的處理方式,可以是不分析任一選入的變量有缺失值的記錄(Exclude cases listwise )而無論該缺失變量最終是否進入模型; 不分析具體進入某變量時有缺失值的記錄(Exclude cases pairwise);將缺失值用該變量的均數代替(Replace with mean)。輸出結果解釋根據題目的要求,我們只需要在Dependent框中選入spovl , Independent框中選入fat即可,其他的選項一律不

9、管。單擊OK后,系統很快給出如下結果:RegressionV<ii idbles EmeiVariables VariablesModel Entered Removed Method1怡護一 EntEa. AH requested variables entered.b. Dependent Variable:這里的表格是擬合過程中變量進入/退出模型的情況記錄,由于我們只引入了一個自變量,所以只出現了一個模型1 (在多元回歸中就會依次出現多個回歸模型),該模型中fat為進入的變量,沒有移出的變量,具體的進入/退出方法為enter。Model SuinniaiyAdjusted Std.

10、 Erroi ofModel R R Square R Square the Estimatea Predictors: (Constant), fatwniiw,上表為所擬合模型的情況簡報,顯示在模型1中相關系數R為0.578,而決定系數 R2為0.334,校正的決定系數為 0.307。ANOVAbModelSum ofSquaresdfMean SquareFSiQ.1Regression9.3061830612 059002aResidual16.630246S9Toial24.835-25a. Predictors: (ConstarO.fatb. DeRendentVariable:

11、 8PVOLwwwiaonxom這是所用模型的檢驗結果, 可以看到這就是一個標準的方差分析表! 有興趣的讀者可以自己 用方差分析模型做一下, 就會發(fā)現出了最左側的一列名字不太一樣外, 其他的各個參數值都 是相同的。從上表可見所用的回歸模型 F值為12.059, P值為0.002,因此我們用的這個回 歸模型是有統計學意義的,可以繼續(xù)看下面系數分別檢驗的結果。3吏由于這里我們所用的回歸模型只有一個自變量, 因此模型的檢驗就等價與系數的檢驗, 在多元回歸中這兩者是不同的。Coefficieirts3Standard!zedUnstanidandizedCoefficienCoefficientsis

12、Model0 Std. Error BetatSig.-(Constant 59742711.923.000a. DependentVariatole: SPVOLwww.biogn.eQm上表給出了包括常數項在內的所有系數的檢驗結果,用的是t檢驗,同時還會給出標化/未標化系數??梢姵淀椇蚮at都是有統計學意義的,上表的內容如果翻譯成中文則如下所示:未標準化系數標準化系數模型系數b系數標準誤系數3t值P值1常數5.0970.42711.9230.000fat0.7000.2020.5783.4730.00210.1.2復雜實例操作分析實例例 10.2 :請分析在數據集 pla

13、stic.sav 中變量 extrusn、additive、gloss 和 opacity 對變量 tear_r es的大小有無影響?已知 extrusn對tear_res的大小有影響。顯然,這里是一個多元回歸,由于除了extrusn確有影響以外,我們不知道另三個變量有無影響,因此這里我們將extrusn放在第一個block,進入方法為enter (我們有把握 extrusn 一定有統計學意義);另三個變量放在第二個block,進入方法為stepwise (讓軟件自動選擇判斷),操作如下:1. An alyze=>Regressi on=>L iner2. Dependent 框:

14、選入 tear_res3. Independent 框:選入 extrusn; 單擊 next 鈕4. Independent 框:選入 additive、gloss 禾口 opacity ; Method 歹U表框:選擇 stepwise5. 單擊OK鈕結果解釋最終的結果如下:RegressionVnria I ties 日 it ei ed -Remove dbMb delVariables EnteredVariablesRemovedMethod1Eirtnjsion3rEnter2Additive Amount-Stepwise (Criteria:P raba bi

15、 I of-F-to- ente r<= .050.P raba bi I ifip-irf-F-ta- re m ove >= 100).乳 All requested variables entered.b. Dependent variable: Tear Resistant'* 'oon ee)m上面的表格依次列出了模型的篩選過程,模型1用進入法引入了extrusn,然后模型2用stepwise法引入了 additive,另兩個變量因沒有達到進入標準,最終沒有進入。上面的表格翻譯出來如下:模型進入的變量移出的變量變量篩選方法1extrus n進入法2addi

16、tivestepwise法(標準:進入概率小于0.05,移岀概率大于 0.1)Model SummaryAdjusted Std. Error ofMod創(chuàng)R R Square R Square the Estimate639dJ75.3752756b.586.538322Predictors: (Constant), Erustori工 Predictors: (Constant), ExtrusiorWKSfiiWWWStfflm上表是兩個模型變異系數的改變情況,從調整的R2可見,從上到下隨著新變量的引入,模型可解釋的變異占總變異的比例越來越大。ANOVACSum ofModelSquar

17、esdfMean SquareFSiQ.1Regression1.7401174012.408,002JResidual2.52518.140Total4 266132Regression2.50121.2501 2 048.001 bResidual1.76517.104Total19a Predictors: tConstant), Extrusionb. Predictors: (Constant), Extrusion, Additive Amountc. Dependent Variable: Tear Resistancewww.bioon.coni上表是所用兩個模型的檢驗結果,用

18、的方法是方差分析,可見二個模型都有統計學意義。Coefficiirts3ModelUnstandardizedCoefTrc tentsStandardizecf CcefTicientstSig.日Std. ErrorBeta1(Constant)5.90026522.278.000Extrusion500.167S393522.0022(Constan5.315,31416.926.000Extrusion590.144.0394 005001Additive Amount390.1444222.707.0153- De pend ent Variable: Tear Resii stan

19、ceMH上表仍然為三個模型中各個系數的檢驗結果,用的是t檢驗,可見在模型2中所有的系數都有統計學意義,上表的內容翻譯如下:未標化的系數標化的系數模型B標準誤Betat值P值1(常數)5.900.26522.278.000extrusi on.590.167.6393.522.0002(常數)5.315.31416.926.000extrusi on.590.144.6394.905.000additive.390.144.4222.707.000Exclmled ViiblescPartialCorrelationCollinearity StatisticsMode

20、lBeta IntSig.Tolerance1Gloss207J.986.336.233.744Opacity- 062J-.332,744090,994Additive Amount2707.015.5491.0002Gloss.013b.062,952015S24Ooacik-.mL142,2ZD-.274.928a. Predictors in the Model: (Constant), Extrusionb- Predictors in the Model: (Constant), Extrusion Additive Amount Dependent Variable: Tear

21、ResistanceWMHW.biocn.eOffl這是新出現的一個表格,反映的是沒有進入模型的各個變量的檢驗結果,可見在模型1中,未引入模型的候選變量 additive還有統計學意義,可能需要引入,而模型2中沒有引入的兩個變量其P值均大于0.05,無需再進行分析了。10.2 Curve Estimation 過程Curve Estimation過程可以用與擬合各種各樣的曲線,原則上只要兩個變量間存在某種可以被它所描述的數量關系,就可以用該過程來分析。但這里我們要指出,由于曲線擬合非常的 復雜,而該模塊的功能十分有限,因此最好采用將曲線相關關系通過變量變換的方式轉化為 直線回歸的形式來分析,或

22、者采用其他專用的模塊分析。10.2.1界面詳解Curve Estimation過程中有特色的對話框界面內容如下:這是新出現的一個表格,反映的是沒有進入模型的各個變量的檢驗結果,可見在模型1中,這是新出現的一個表格,反映的是沒有進入模型的各個變量的檢驗結果,可見在模型1中,Inijependent兩 Include constant ir這是新出現的一個表格,反映的是沒有進入模型的各個變量的檢驗結果,可見在模型1中,Case Labels:Hf =ModelsLinear廠Quadraltc廠 Logarithmic I- Cubic 廠 Inverse 廠 Power兩 Plot models

23、r Compound 廠 Growth 廠 S丨 Exponenlia廠 LogisticUpper bound:這是新出現的一個表格,反映的是沒有進入模型的各個變量的檢驗結果,可見在模型1中,廠 Display ANOVA tablewww. bio on.earn這是新出現的一個表格,反映的是沒有進入模型的各個變量的檢驗結果,可見在模型1中,這是新出現的一個表格,反映的是沒有進入模型的各個變量的檢驗結果,可見在模型1中,F面我們分別解釋一下它們的具體功能。【Depe ndent框】用于選入曲線擬和中的應變量,可選入多個,如果這樣,則對各個應變量分別擬合模型。【Independent單選框組

24、】用于選入曲線擬和中的自變量,有兩種選擇,可以選入普通的自變量,也可以選 擇時間作為自變量,如果這樣做,貝U所用的數據應為時間序列數據格式。【Models復選框組】是該對話框的重點,用于選擇所用的曲線模型,可用的有:* Linear:擬合直線方程,實際上與Lin ear過程的二元直線回歸相同;* Quadratic:擬合二次方程 Y = bO+b1X+b2X2 ;* Compound :擬合復合曲線模型 Y = b0 >b1X ;* Growth :擬合等比級數曲線模型Y = e(bO+b1X);* Logarithmic :擬合對數方程 Y = bO+b1lnX ;* Cubic:擬合

25、三次方程 Y = bO+b1X+b2X2+b3X3 ;* S:擬合 S 形曲線 Y = e(bO+b1/X);* Exponential :擬合指數方程 Y = bO eb1X;* Inverse:數據按 Y = b0+b1/X進行變換;* Power:擬合乘幕曲線模型 Y = b0X b1;* Logistic :擬合Logistic曲線模型 Y = 1/ (1/u + b0 >b1X),如選擇該線型則要求輸入上界。上面的幾種線型和其他的模塊有重復,如Logistic、Liner等,由于本模塊的功能有限,在重復的情況下建議用其它專用模塊來分析。【Include constant in

26、equation 復選框 】確定是否在方程中包含常數項【Plot models復選框】要求對模型做圖,包括原始數值的連線圖和擬合模型的曲線圖?!緎ave鈕】彈出SAVE對話框,用于定義想要存儲的中間結果,如預測值、預測值可信區(qū)間、殘差等?!綝isplay ANOVA table 復選框】要求顯示模型檢驗的方差分析表。10.2.2實例操作例10.3 :錫克試驗陰性率(%)隨著年齡的增長而增高,某地查得兒童年齡(歲) X與錫克試驗陰性率Y的資料如下,試擬合曲線。年齡(歲)1234567錫克試驗陰性率(%)57.1 76.0 90.9 93.0 96.7 95.6 96.2首先對年齡和陰性率作散點圖,發(fā)現兩者有斜率逐漸放緩的曲線趨勢,因此選擇二次曲線模型、三次曲線模型和對數曲線模型,最終取其中結果

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯系上傳者。文件的所有權益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網頁內容里面會有圖紙預覽,若沒有圖紙預覽就沒有圖紙。
  • 4. 未經權益所有人同意不得將文件中的內容挪作商業(yè)或盈利用途。
  • 5. 人人文庫網僅提供信息存儲空間,僅對用戶上傳內容的表現方式做保護處理,對用戶上傳分享的文檔內容本身不做任何修改或編輯,并不能對任何下載內容負責。
  • 6. 下載文件中如有侵權或不適當內容,請與我們聯系,我們立即糾正。
  • 7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

評論

0/150

提交評論