論文知識回歸分析_第1頁
論文知識回歸分析_第2頁
論文知識回歸分析_第3頁
論文知識回歸分析_第4頁
論文知識回歸分析_第5頁
已閱讀5頁,還剩63頁未讀 繼續(xù)免費(fèi)閱讀

下載本文檔

版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進(jìn)行舉報(bào)或認(rèn)領(lǐng)

文檔簡介

SPSS如何進(jìn)行線性回歸分析操作瀏覽:3113更新:2014-03-1310:11本節(jié)內(nèi)容主要介紹如何確定并建立線性回歸方程。包括只有一個自變量的一元線性回歸和和含有多個自變量的多元線性回歸。為了確保所建立的回歸方程符合線性標(biāo)準(zhǔn),在進(jìn)行回歸分析之前,我們往往需要對因變量與自變量進(jìn)行線性檢驗(yàn)。也就是類似于相關(guān)分析一章中講過的借助于散點(diǎn)圖對變量間的關(guān)系進(jìn)行粗略的線性檢驗(yàn),這里不再重復(fù)。另外,通過散點(diǎn)圖還可以發(fā)現(xiàn)數(shù)據(jù)中的奇異值,對散點(diǎn)圖中表示的可能的奇異值需要認(rèn)真檢查這一數(shù)據(jù)的合理性。一、一元線性回歸分析用SPSS進(jìn)行回歸分析,實(shí)例操作如下:1.單擊主菜單Analyze/Regression/Linear...,進(jìn)入設(shè)置對話框如圖7-9所示。從左邊變量表列中把因變量y選入到因變量(Dependent)框中,把自變量x選入到自變量(Independent)框中。在方法即Method—項(xiàng)上請注意保持系統(tǒng)默認(rèn)的選項(xiàng)Enter,選擇該項(xiàng)表示要求系統(tǒng)在建立回歸方程時(shí)把所選中的全部自變量都保留在方程中。所以該方法可命名為強(qiáng)制進(jìn)入法(在多元回歸分析中再具體介紹這一選項(xiàng)的應(yīng)用)。具體如下圖所示:2.請單擊Statistics...按鈕可以選擇需要輸出的一些統(tǒng)計(jì)量。如RegressionCoefficients(回歸系數(shù))中的Estimates,可以輸出回歸系數(shù)及相關(guān)統(tǒng)計(jì)量,包括回歸系數(shù)B、標(biāo)準(zhǔn)誤、標(biāo)準(zhǔn)化回歸系數(shù)BETA、T值及顯著性水平等。Modelfit項(xiàng)可輸出相關(guān)系數(shù)R,測定系數(shù)R2,調(diào)整系數(shù)、估計(jì)標(biāo)準(zhǔn)誤及方差分析表。上述兩項(xiàng)為默認(rèn)選項(xiàng),請注意保持選中。設(shè)置如圖7-10所示。設(shè)置完成后點(diǎn)擊Continue返回主對話框?;貧w方程建立后,除了需要對方程的顯著性進(jìn)行檢驗(yàn)外,還需要檢驗(yàn)所建立的方程是否違反回歸分析的假定,為此需進(jìn)行多項(xiàng)殘差分析。由于此部分內(nèi)容較復(fù)雜而且理論性較強(qiáng),所以不在此詳細(xì)介紹,讀者如有興趣,可參閱有關(guān)資料。用戶在進(jìn)行回歸分析時(shí),還可以選擇是否輸出方程常數(shù)。單擊Options...按鈕,打開它的對話框,可以看到中間有一項(xiàng)Includeconstantinequation可選項(xiàng)。選中該項(xiàng)可輸出對常數(shù)的檢驗(yàn)。在Options對話框中,還可以定義處理缺失值的方法和設(shè)置多元逐步回歸中變量進(jìn)入和排除方程的準(zhǔn)則,這里我們采用系統(tǒng)的默認(rèn)設(shè)置/如圖7-11所示。設(shè)置完成后點(diǎn)擊Continue返回主對話框。在主對話框點(diǎn)擊OK得到程序運(yùn)行結(jié)果。如題。我選擇的是線性回歸,得出了一堆表格和圖標(biāo)。我做的是生物學(xué)方面的統(tǒng)計(jì)。我的目標(biāo)是得出模擬方程,再根據(jù)已有的自變量來計(jì)算因變量。我是SPSS新手,而且我對逐步回歸也不了解。但由于工作原因,必須得到模擬方程。請高手告訴我我的這個統(tǒng)計(jì)符不符合線性關(guān)系,如果符合,怎么寫模擬方程,謝謝!以下是部分截圖分享到:2013-11-1619:52提問者米納x1,x2...x5是5個自變量,1個y因變量。系數(shù)a圖中是將x1與y建立一個線性回歸模型,常量為1.956E-6,sig.也即P值=1>0.05,無統(tǒng)計(jì)學(xué)意義,x1的斜率為-0.504,P=0.000v0.05,具有顯著意義,常量和斜率看非標(biāo)準(zhǔn)化系數(shù),得方程為y=-0.504x1+1.956E-6,這其實(shí)是個一元線性回歸方程;然后逐漸的加入x2,x3,x4,x5進(jìn)行二元線性回歸,三元線性回歸等。一旦有一個變量,如x3的P值〉0.05也就說明這個變量對模型的建立無統(tǒng)計(jì)學(xué)意義,在多元線性回歸中也就可以無情的剔除掉。而由系數(shù)a圖可知,x1,x2,x3,x4,x5的斜率P值都是0.000<0.05,也就是說都有意義,5個變量一個也不能剔除,全保留,也即要5個變量都有的模型6了。由模型匯總圖也可知,模型1到6的調(diào)整R方是越來越大的,也即擬合的越來越好了。那么最終的線性方程就看模型6啦,常量0.002,x1斜率-0.860,x2斜率-0.713...后面看不到了。也即y=0.002-0.860x1-0.713x2…常量P值=0.974>0.05無顯著性意義,說明擬合的線過原點(diǎn),也即常量值應(yīng)為0,但是否能改為0這個我也不確定,但0或0.002差別不會太大的。追問厲害,一看就是高手。不好意思,系數(shù)那個表里缺一塊,我現(xiàn)在補(bǔ)上,再把另外幾個表補(bǔ)上還有點(diǎn)問題想請指教。1.你說的那個常量為1.965E-6,這個E是什么意思?2?自變量一共有6個,從x1到x6,可能是我那個表缺一塊的原因吧,抱歉了。系數(shù)表缺的部分:其它表能否將最終的模擬方程式寫出來,不勝感激!回答1.965E-6是指1.965乘10的-6次方。已排除的變量表對應(yīng)系數(shù)a表,模型1對應(yīng)模型1,也即前一個表是進(jìn)入,相對的后一個就排除。模型1進(jìn)入了x1,排除的x2,x3,x4,x5,x6中的x2的P值<0.05還不能排除,還要進(jìn)入分析,模型2,3等依次類推,一個也排除不掉。全部進(jìn)入回歸方程。另,如果兩變量間存在共線性的話,是不能都進(jìn)入回歸方程的。判斷依據(jù)為膨脹因子VIFV10,倒數(shù)即容差〉0.1,已排除變量圖上可知各變量間不存在共線性,都不用排除。常量P值〉0.05可以去掉,各變量的斜率選用模型6的標(biāo)準(zhǔn)系數(shù)。因而最終回歸方程為:y=-0.860x1-0.713x2-0.567x3-0.414x4-0.254x5-0.130x6回歸分析是處理兩個及兩個以上變量間線性依存關(guān)系的統(tǒng)計(jì)方法。在醫(yī)學(xué)領(lǐng)域中,此類問題很普遍,如人頭發(fā)中某種金屬元素的含量與血液中該元素的含量有關(guān)系,人的體表面積與身高、體重有關(guān)系;等等?;貧w分析就是用于說明這種依存變化的數(shù)學(xué)關(guān)系。第一節(jié)Linear過程主要功能調(diào)用此過程可完成二元或多元的線性回歸分析。在多元線性回歸分析中,用戶還可根據(jù)需要,選用不同篩選自變量的方法(如:逐步法、向前法、向后法,等)。實(shí)例操作[例8.1]某醫(yī)師測得10名3歲兒童的身高(cm)、體重<kg)和體表面積(cm2)資料如下。試用多元回歸方法確定以身高、體重為自變量,體表面積為應(yīng)變量的回歸方程。兒童編號體表面積(Y)身高(X)1體重(X)212345675.3825.2995.3585.2925.6026.0145.83088.087.688.589.087.789.588.811.011.812.012.313.113.714.486.10290.414.996.07590.615.2106.41191.216.0數(shù)據(jù)準(zhǔn)備激活數(shù)據(jù)管理窗口,定義變量名:體表面積為Y,保留3位小數(shù);身高、體重分別為X1、X2,1位小數(shù)。輸入原始數(shù)據(jù),結(jié)果如圖8.1所示。圖8.1原始數(shù)據(jù)的輸入統(tǒng)計(jì)分析激活Statistics菜單選Regression中的Linear...項(xiàng),彈出LinearRegression對話框(如圖8.2示)。從對話框左側(cè)的變量列表中選y點(diǎn)擊A鈕使之進(jìn)入Dependent框,選xl、x2,點(diǎn)擊A鈕使之進(jìn)入Indepentdent(s)框;在Method處下拉菜單,共有5個選項(xiàng):Enter(全部入選法)、Stepwise(逐步法)、Remove(強(qiáng)制剔除法)、Backward(向后法)、Forward(向前法)。本例選用Enter法。點(diǎn)擊OK鈕即完成分析。用戶還可點(diǎn)擊Statistics...鈕選擇是否作變量的描述性統(tǒng)計(jì)、回歸方程應(yīng)變量的可信區(qū)間估計(jì)等分析;點(diǎn)擊Plots.??鈕選擇是否作變量分布圖(本例要求對標(biāo)準(zhǔn)化Y預(yù)測值作變量分布圖);點(diǎn)擊Save...鈕選擇對回歸分析的有關(guān)結(jié)果是否作保存(本例要求對根據(jù)所確定的回歸方程求得的未校正Y預(yù)測值和標(biāo)準(zhǔn)化Y預(yù)測值作保存);點(diǎn)擊Options...鈕選擇變量入選與剔除的a、B值和缺失值的處理方法。結(jié)果解釋在結(jié)果輸出窗口中將看到如下統(tǒng)計(jì)數(shù)據(jù)

2..X1MultipleR.94964RSquare.90181AdjustedRSquare.87376StandardError.14335AnalysisofVarianceDFSumofSquaresMeanSquareRegression21.32104.66052Residual7.14384.02055F=32.14499SignifF=.0003-VariablesintheEquation-VariableBSEBBetaTSigTXI.068701.074768.215256.919.3887X2.183756.056816.7576603.234.0144(Constant)-2.8564766.017776-.475.6495EndBlockNumber1Allrequestedvariablesentered.結(jié)果顯示,本例以XI、X2為自變量,Y為應(yīng)變量,采用全部入選法建立回歸方程。回歸方程的復(fù)相關(guān)系數(shù)為0.94964,決定系數(shù)(即r2)為0.90181,經(jīng)方差分析,F(xiàn)=34.14499,P=0.0003,回歸方程有效?;貧w方程為Y=0.0687101X1+0.183756X2-2.856476。本例要求按所建立的回歸方程計(jì)算Y預(yù)測值和標(biāo)準(zhǔn)化Y預(yù)測值(所謂標(biāo)準(zhǔn)化Y預(yù)測值是指將根據(jù)回歸方程求得的Y預(yù)測值轉(zhuǎn)化成按均數(shù)為0、標(biāo)準(zhǔn)差為1的標(biāo)準(zhǔn)正態(tài)分布的Y值)并將計(jì)算結(jié)果保存入原數(shù)據(jù)庫。系統(tǒng)將原始的X1、X2值代入方程求Y值預(yù)測值(即庫中pre_1欄)和標(biāo)準(zhǔn)化Y預(yù)測值(即庫中zpr_1欄),詳見圖8.3。圖8.3計(jì)算結(jié)果的保存本例還要求對標(biāo)準(zhǔn)化Y預(yù)測值作變量分布圖,系統(tǒng)將繪制的統(tǒng)計(jì)圖送向ChartCarousel窗口,雙擊該窗口可見下圖顯示結(jié)果。圖8.4對標(biāo)準(zhǔn)化Y預(yù)測值所作的正態(tài)分布圖第二節(jié)CurveEstimation過程主要功能調(diào)用此過程可完成下列有關(guān)曲線擬合的功能:1、Linear:擬合直線方程(實(shí)際上與Linear過程的二元直線回歸相同,即Y=b0+b1X);2、Quadratic:擬合二次方程(Y=b0+b1X+b2X2);3、Compound:擬合復(fù)合曲線模型(Y=b0Xb1X);4、Growth:擬合等比級數(shù)曲線模型(Y=e(b0+b1X));5、Logarithmic:擬合對數(shù)方程(Y=b0+b1lnX)6、Cubic:擬合三次方程(Y=b0+b1X+b2X2+b3X3);7、S:擬合S形曲線(Y=e(b0+b1/X));8、Exponential:擬合指數(shù)方程(Y=b0eb1X);9、Inverse:數(shù)據(jù)按Y=b0+b1/X進(jìn)行變換;10、Power:擬合乘幕曲線模型(Y=b0Xb1);11、Logistic:擬合Logistic曲線模型(Y=1/(1/u+b0Xb1X)。實(shí)例操作[例8.2]某地1963年調(diào)查得兒童年齡(歲)X與錫克試驗(yàn)陰性率(%)Y的資料如下,試擬合對數(shù)曲線。年齡(歲)錫克試驗(yàn)陰性率(%)657.176.090.993.096.795.696.2數(shù)據(jù)準(zhǔn)備激活數(shù)據(jù)管理窗口,定義變量名:錫克試驗(yàn)陰性率為Y,年齡為X,輸入原始數(shù)據(jù)。統(tǒng)計(jì)分析激活Statistics菜單選Regression中的CurveEstimation...項(xiàng),彈出CurveEstimation對話框(如圖8.5示)。從對話框左側(cè)的變量列表中選y,點(diǎn)擊A鈕使之進(jìn)入Dependent框,選x,點(diǎn)擊A鈕使之進(jìn)入Indepentdent(s)框;在Model框內(nèi)選擇所需的曲線模型,本例選擇Logarithmic模型(即對數(shù)曲線);選Plotmodels項(xiàng)要求繪制曲線擬合圖;點(diǎn)擊Save...鈕,彈出CurveEstimation:Save對話框,選擇Predictedvalue項(xiàng),要求在原始數(shù)據(jù)庫中保存根據(jù)對數(shù)方程求出的Y預(yù)測值,點(diǎn)擊Continue鈕返回CurveEstimation對話框,再點(diǎn)擊OK鈕即可。8.2.2.3結(jié)果解釋在結(jié)果輸出窗口中將看到如下統(tǒng)計(jì)數(shù)據(jù)在以X為自變量、Y為應(yīng)變量,采用對數(shù)曲線擬合方法建立的方程,決定系數(shù)R2=0.913(接近于1),作擬合優(yōu)度檢驗(yàn),方差分析表明:F=52.32,P=0.001,擬合度很好,對數(shù)方程為:Y=61.3259+20.6704lnX。本例要求繪制曲線擬合圖,結(jié)果如圖8.6所示。圖8.6對數(shù)曲線擬合情形根據(jù)方程Y=61.3259+20.6704lnX,將原始數(shù)據(jù)X值代入,求得Y預(yù)測值(變量名為fit_l)存入數(shù)據(jù)庫中,參見圖8.7。圖8.7計(jì)算結(jié)果的保存第三節(jié)Logistic過程主要功能調(diào)用此過程可完成Logistic回歸的運(yùn)算。所謂Logistic回歸,是指應(yīng)變量為二級計(jì)分或二類評定的回歸分析,這在醫(yī)學(xué)研究中經(jīng)常遇到,如:死亡與否(即生、死二類評定)的概率跟病人自身生理狀況和所患疾病的嚴(yán)重程度有關(guān);對某種疾病的易感性的概率(患病、不患病二類評定)與個體性別、年齡、免疫水平等有關(guān)。此類問題的解決均可借助邏輯回歸來完成。特別指出,本節(jié)介紹的Logistic過程,應(yīng)與日常所說的Logistic曲線模型(即S或倒S形曲線)相區(qū)別。用戶如果要擬合Logistic曲線模型,可調(diào)用本章第二節(jié)CurveEstimation過程,系統(tǒng)提供11種曲線模型,其中含有Logistic曲線模型(參見上節(jié))。在一般的多元回歸中,若以P(概率)為應(yīng)變量,則方程為P=bO+b1X1+b2X2+…+bkXk,但用該方程計(jì)算時(shí),常會出現(xiàn)P〉1或P〈0的不合理情形。為此,對P作對數(shù)單位轉(zhuǎn)換,即logitP=ln(P/1-P),于是,可得到Logistic回歸方程為:

ebO+blXl+b2X2+…+bkXk1+eb°+blXl+b2X2+…+bkXk8.3.2實(shí)例操作[例8.3]某醫(yī)師研究男性胃癌患者發(fā)生術(shù)后院內(nèi)感染的影響因素,資料如下表,請通過Logistic回歸統(tǒng)計(jì)方法對主要影響因素進(jìn)行分析。無5911有6.04無6422無9.16無3611有&48無4231有5.36無4842有4.65無5012有12.848.3.2.1數(shù)據(jù)準(zhǔn)備激活數(shù)據(jù)管理窗口,定義變量名:術(shù)后感染為Y(字符變量,有輸入Y、無輸入N),年齡為XI,手術(shù)創(chuàng)傷程度為X2,營養(yǎng)狀態(tài)為X3,術(shù)前預(yù)防性抗菌為X4(字符變量,有輸入Y、無輸入N),白細(xì)胞數(shù)為X5,癌腫病理分度為X6。按要求輸入原始數(shù)據(jù)。統(tǒng)計(jì)分析激活Statistics菜單選Regression中的Logistic...項(xiàng),彈出LogisticRegression對話框(如圖8.8示)。從對話框左側(cè)的變量列表中選y,點(diǎn)擊A鈕使之進(jìn)入Dependent框,選xl、x2、x3、x4、x5和x6,點(diǎn)擊A鈕使之進(jìn)入Covariates框;點(diǎn)擊Method處的下拉按鈕,系統(tǒng)提供7種方法:1、Enter:所有自變量強(qiáng)制進(jìn)入回歸方程;2、Forward:Conditional:以假定參數(shù)為基礎(chǔ)作似然比概率檢驗(yàn),向前逐步選擇自變量;3、Forward:LR:以最大局部似然為基礎(chǔ)作似然比概率檢驗(yàn),向前逐步選擇自變量;4、Forward:Wald:作Wald概率統(tǒng)計(jì)法,向前逐步選擇自變量;5、Backward:Conditional:以假定參數(shù)為基礎(chǔ)作似然比概率檢驗(yàn),向后逐步選擇自變量;6、Backward:LR:以最大局部似然為基礎(chǔ)作似然比概率檢驗(yàn),向后逐步選擇自變量;7、Backward:Wald:作Wald概率統(tǒng)計(jì)法,向后逐步選擇自變量。本例選用Forward:Conditional法,以便選擇有主要作用的影響因素;點(diǎn)擊Options...鈕,彈出LogisticRegression:Options對話框,在Display框中選取Atlaststep項(xiàng),要求只顯示最終計(jì)算結(jié)果,點(diǎn)擊Continue鈕返回LogisticRegression對話框,再點(diǎn)擊OK鈕即可。8.3.2.3結(jié)果解釋在結(jié)果輸出窗口中將看到如下統(tǒng)計(jì)數(shù)據(jù)

系統(tǒng)先對字符變量進(jìn)行重新賦值,對于應(yīng)變量Y,回答是(Y)的賦值為0,回答否(X)的賦值為1;對于應(yīng)變量X4,回答是(Y)的賦值為-1,回答否(X)的賦值為1。

EndBlockNumber1PIN=.0500Limitsreached.EndBlockNumber1PIN=.0500Limitsreached.FinalEquationforBlock1Estimationterminatedatiterationnumber12becauseLogLikelihooddecreasedbylessthan.01percent.-2LogLikelihood3.819GoodnessofFit3.000Overall93.33%Overall93.33%canceChi-SquaredfSignifiModelChi-Square15.2762.0005Improvement6.7661.0093ClassificationTableforYPredictedynPercentCorrectyInObserved++——+yy14I1I80.00%+——+——+nnI0I10I100.00%+——+——+VariablesintheEquation結(jié)果表明,第一步自變量X3入選,方程分類能力達(dá)80.00%;第二步自變量X6入選,方程分類能力達(dá)93.33%(參見結(jié)果中的分類分析表);方程有效性經(jīng)x2檢驗(yàn),x2=15.276,P=0.0005。Logistic回歸的分類概率方程為:e123.4053-30.5171X3-10.2797X6P=——————————————1+e123.4053-30.5171X3-10.2797X6根據(jù)該方程,若一胃癌患者營養(yǎng)狀態(tài)評分(X3)為3,癌腫病理分度(X6)為9,則其P=4.5X10-2廷0,這意味著術(shù)后將發(fā)生院內(nèi)感染;另一胃癌患者營養(yǎng)狀態(tài)評分(X3)為1,癌腫病理分度(X6)為4,則其P=0.98105~l,這意味著術(shù)后將不會發(fā)生院內(nèi)感染。第四節(jié)Probit過程主要功能調(diào)用此過程可完成劑量-效應(yīng)關(guān)系的分析。通過概率單位使劑量-效應(yīng)的S型曲線關(guān)系轉(zhuǎn)化成直線,從而利用回歸方程推算各效應(yīng)水平的相應(yīng)劑量值。實(shí)例操作[例8.4]研究抗瘧藥環(huán)氯胍對小白鼠的毒性,試驗(yàn)結(jié)果如下表所示。試計(jì)算環(huán)氯胍的半數(shù)致死劑量。數(shù)據(jù)準(zhǔn)備激活數(shù)據(jù)管理窗口,定義變量名:劑量為DOSE、試驗(yàn)動物數(shù)為OBSERVE、死亡動物數(shù)為DEATH。然后輸入原始數(shù)據(jù)。統(tǒng)計(jì)分析激活Statistics菜單選Regression中的Probit...項(xiàng),彈出ProbitAnalysis對話框(如圖8.9示)。從對話框左側(cè)的變量列表中選death,點(diǎn)擊A鈕使之進(jìn)入ResponseFrequency框;選observe,點(diǎn)擊A鈕使之進(jìn)入TotalObserved框;選dose,點(diǎn)擊A鈕使之進(jìn)入Covariate(s)框,并下拉Transform菜單,選Logbase10項(xiàng)(即要求對劑量進(jìn)行以10為底的對數(shù)轉(zhuǎn)換)。系統(tǒng)在Model欄中提供兩種模型,一是概率單位模型(Probit),另一是比數(shù)比自然對數(shù)模型(Logit)。本例選用概率單位模型。點(diǎn)擊Options...鈕,彈出ProbitAnalysis:Options對話框,在NaturalResponseRate欄選Calculatefromdata項(xiàng),要求計(jì)算各劑量組的實(shí)際反應(yīng)率。之后點(diǎn)擊Continue鈕返回ProbitAnalysis對話框,再點(diǎn)擊OK鈕即可。結(jié)果解釋在結(jié)果輸出窗口中將看到如下統(tǒng)計(jì)數(shù)據(jù):系統(tǒng)首先顯示,共有7組原始數(shù)據(jù)采概率單位模型進(jìn)行分析。回歸方程的各參數(shù)在經(jīng)過14次疊代運(yùn)算后確定,即PROBIT=5.95215-4.66313X。該方程擬合優(yōu)度X2檢驗(yàn)結(jié)果,X2=0.833,P=0.934,擬合良好。

MODELInformationONLYNormalSigmoidisrequested.NaturalResponseratetobeestimatedCONTROLgroupisnotprovided.Parameterestimatesconvergedafter14iterations.Optimalsolutionfound.ParameterEstimates(PROBITmodel:(PROBIT(p))=Intercept+BX):ErrorCoeff./S.E.DOSERegressionCoeff.Standard5.952152.39832ErrorCoeff./S.E.DOSERegressionCoeff.Standard5.952152.398322.481802.48180InterceptStandardInterceptStandardErrorIntercept/S.E.ErrorIntercept/S.E.-2.12017-4.663132.19942-2.12017-4.663132.19942EstimateofNaturalResponseRate=.000000withS.E.=.26448PearsonGoodness-of—FitChiSquare=.833DF=4EstimateofNaturalResponseRate=.000000withS.E.=.26448PearsonGoodness-of—FitChiSquare=.833DF=4P=.934接著,系統(tǒng)顯示劑量對數(shù)值(DOSE)、實(shí)際觀察例數(shù)(NumberofSubjects)、試驗(yàn)動物反應(yīng)數(shù)(ObservedResponses)、預(yù)期反應(yīng)數(shù)(ExpectedResponses)、殘差(Residual)和效應(yīng)的概率(Prob)。之后,顯示各效應(yīng)概率水平的劑量值及其95%可信區(qū)間值,按本例要求,環(huán)氯胍的半數(shù)致死劑量(即Prob=0.50時(shí))為6.07347,其95%可信區(qū)間為1.86305—7.54282。

.427.48745.7038.012.011.688.312.30757.6012.02.01.682.318.14016.485.0.0.171-.171.03413ConfidenceLimitsforEffectiveDOSE95%ConfidenceLimitsProbDOSELowerUpper.012.46942.027524.27407.022.74406.045344.54351.032.93394.062234.72430.043.08539.078954.86574.053.21433.095804.98445.063.32832.112945.08821.073.43158.130475.18134.083.52676.148455.26651.093.61561.166945.34550.103.69937.185975.41954.154.06733.290605.74092.204.38570.413956.01572.254.67862.560216.26792

.304.95831.734366.51010.355.23239.942616.75084.405.506461.192866.99754.455.785281.495297.25814.506.073471.863057.54282.556.376002.312997.86673.606.698862.865878.25522.657.049743.544388.75565.707.439434.363949.46545.757.884165.3068810.59748.80&410756.2906912.60617.859.069107.2151416.40564.909.97116&0941224.20725.9110.202168.2776026.73478.9210.459198.4689229.82525.9310.74928&6717733.68627.9411.082788.8912838.64769.9511.475809.1351145.27000.9611.955389.4157254.59759.9712.572529.7559068.85554.9813.4425010.2057793.92908.9914.9375110.92195153.73112最后,系統(tǒng)輸出以劑量對數(shù)值為自變量X、以概率單位為應(yīng)變量Y的回歸直線散點(diǎn)圖,從圖中各點(diǎn)的分布狀態(tài)亦可看出,回歸直線的擬合程度是很好的。圖8.10劑量-效應(yīng)關(guān)系回歸直線散點(diǎn)圖第五節(jié)Nonlinear過程主要功能調(diào)用此過程可完成非線性回歸的運(yùn)算。所謂非線性回歸,即為曲線型的回歸分析一些曲線模型我們已在本章第二節(jié)中述及。但在醫(yī)學(xué)研究中經(jīng),還經(jīng)常會遇到除本章第二節(jié)中述及的曲線模型,對此,SPSS提供Nonlinear過程讓用戶根據(jù)實(shí)際需要,建立各種曲線模型以用于研究變量間的相互關(guān)系。在醫(yī)學(xué)中,如細(xì)菌繁殖與培養(yǎng)時(shí)間關(guān)系的研究即可借助Nonlinear過程完成。下面一些曲線模型是在論文中較常見的,提供給用戶應(yīng)用時(shí)作參考:模型名稱模型表達(dá)式Asympt.Regression1Y=bl+b2Xexp(b3x)Asympt.Regression2Y=bl-(b2X(b3x))DensityY=(bl+b2XX)(-l/b3)

DensityGaussexp(-b2XXGaussexp(-b2XX2))Gompertzexp(-b3XX))Johnson-SchumacherLogModifiedLog-LogisticMetcherlichLawofDim.Ret.Y=MichaelisMentenMorgan-Mercer-FlorinPeal-ReedXX+b4XX2+b5XX3)))RatioofCubicsXX3)/(b5XX3)RatioofQuadraticsRichardsX))(1/b4))VerhulstVonBertalanffyXX))(1/(1-b4))WeibullXb4)YieldDensityY=b1Xexp(-b2XY=b1Xexp(-b2/(X+b3))Y=(b1+b3XX)b2Y=b1-ln(1+b2Xexp(-b3XX))b1+b2Xexp(-b3XX)Y=b1XX/(X+b2)Y=(b1Xb2+b3XXb4)/(b2+Xb4)=b1/(1+b2Xexp(-(b3Y=(b1+b2XX+b3XX2+b4Y=(b1+b2XX+b3XX2)/(b4XX2)Y=b1/((1+b3Xexp(-b2XY=b1/(1+b3Xexp(-b2XX))Y=(b1(1-b4)-b2Xexp(-b3=b1-b2Xexp(-b3XY=(b1+b2XX+b3XX2)(-1)8.5.2實(shí)例操作[例8.5]選取某地某年壽命表中40-80歲各年齡組的尚存人數(shù)資料如下表請就該資料試擬合Gompertz曲線(Y=blXb2?3x))。

年齡組(歲)年齡簡化值(X)尚存人數(shù)(Y)404550556065707580012345678812777925876532728506756859911508003932528074數(shù)據(jù)準(zhǔn)備激活數(shù)據(jù)管理窗口,定義變量名:年齡簡化值為X,尚存人數(shù)為Y。輸入原始數(shù)據(jù)。統(tǒng)計(jì)分析激活Statistics菜單選Regression中的Nonlinear...項(xiàng),彈出NonlinearRegression對話框(如圖8.11示)。從對話框左側(cè)的變量列表中選y,點(diǎn)擊鈕使之進(jìn)入Dependent框。由于SPSS系統(tǒng)尚無法智能地自動擬合用戶所需的曲線,故一方面要求用戶估計(jì)方程中常數(shù)項(xiàng)和各系數(shù)項(xiàng)進(jìn)行疊代運(yùn)算的起始值,另一方面要求用戶列出方程模型。對此,可首先點(diǎn)擊NonlinearRegression對話框的Parameters...鈕,彈出NonlinearRegression:Parameters對話框(圖8.12),在Name處定義系數(shù)名,在StartValue處輸入起始值(這項(xiàng)工作是十分重要的,否則系統(tǒng)可能無法運(yùn)算,甚至?xí)虔B代次數(shù)過大導(dǎo)致SPSS系統(tǒng)的崩潰),本例定義bl=8500、b2=l、b3=1.5,每定義一個系數(shù),即點(diǎn)擊Add鈕加以確定;若在后面的運(yùn)算中出錯,則還可修改系數(shù)項(xiàng)的起始值,修改后點(diǎn)擊Change鈕加以確定;然后點(diǎn)擊Continue鈕返回NonlinearRegression對話框。在ModelExpression處寫出曲線方程表達(dá)式,用戶可借助系統(tǒng)提供的數(shù)碼盤和函數(shù)列表寫出方程。本例要求計(jì)算根據(jù)回歸方程求出的預(yù)測值,可點(diǎn)擊Save鈕,在NonlinearRegression:SaveNewVariables對話框中選Predictedvalue項(xiàng)。最后點(diǎn)擊OK鈕即可。8.12系數(shù)項(xiàng)定義對話框結(jié)果解釋在結(jié)果輸出窗口中將看到如下統(tǒng)計(jì)數(shù)據(jù)

SSB1B2B31283271934638500.000001.000000001.500000001.11433343480080175.3427.7392405511.5000000021433343480080175.3427.7392405511.500000002.13.8505E+11194572.013.006502086-.216290772.2800135019.683185.8046.8429947971.198524303800135019.683185.8046.8429947971.198524303.11285737878881201.83221.015792671.429277913.2550558275.185774.2528.8504931971.214331274550558275.185774.2528.8504931971.214331274.1205793117.690637.3496.8594292121.252769325205793117.690637.3496.8594292121.252769325.149937888.6592251.6832.9059927001.33942536649937888.6592251.6832.9059927001.339425366.1438492814.383503.5809.9664210431.463656026.214165723.6591420.4568.9091126941.36083115714165723.6591420.4568.9091126941.360831157.18227661.24889440.0706.9234633151.3889894088227661.24889440.0706.9234633151.38898940&117416856.8685916.5498.9482999861.45005498&24600297.86688467.6768.9302963971.4079772494600297.86688467.6768.9302963971.407977249.12761649.68586538.9357.9437367071.44419408102761649.68586538.9357.9437367071.4441940810.1644830.076585633.9620.9497149171.4689666011644830.076585633.9620.9497149171.4689666011.1475140.368485680.9561.9493255671.4689804412475140.368485680.9561.9493255671.4689804412.1475135.426585679.2273.9493387131.46903683131.46903683475135.426585679.2273.94933871313.1475135.426285679.2477.9493385901.46903640Runstoppedafter30modelevaluationsand13derivativeevaluations.IterationshavebeenstoppedbecausetherelativereductionbetweensuccessiveresidualsumsofsquaresisatmostSSCON=1.000E—08NonlinearRegressionSummaryStatisticsDependentVariableYSourceSquareDFSumofSquaresMeanRegression09.2337121583327.6123738611Residual9.237716475135.426247918UncorrectedTotal937122058463.0(CorrectedTotal)82823635793.56Rsquared=1—ResidualSS/CorrectedSS=.99983Asymptotic95%AsymptoticConfidenceIntervalParameterEstimateStd.

經(jīng)30次疊代運(yùn)算后,相鄰兩次的方程剩余均方差值不大于規(guī)定的1X10-8,滿足要求;回歸方程的決定系數(shù)R2=0.99983,Gompertz曲線方程為:Y=85679.247671X0.94933859(1.469036403X)本例要求計(jì)算預(yù)測值,系統(tǒng)將結(jié)果存入原始數(shù)據(jù)庫中(圖8.13),系統(tǒng)以pred_作為預(yù)測值的變量名。由結(jié)果可見,預(yù)測值與實(shí)際值十分接近。圖8.13原始數(shù)據(jù)及其預(yù)測值多元回歸分析在大多數(shù)的實(shí)際問題中,影響因變量的因素不是一個而是多個,我們稱這類回問題為多元回歸分析??梢越⒆兞縴與各自變量xj(j=1,2,3,...,n)之間的多元線性回歸模型:其中:b0是回歸常數(shù);bk(k=1,2,3,…,n)是回歸參數(shù);e是隨機(jī)誤差。多元回歸在病蟲預(yù)報(bào)中的應(yīng)用實(shí)例:某地區(qū)病蟲測報(bào)站用相關(guān)系數(shù)法選取了以下4個預(yù)報(bào)因子;x1為最多連續(xù)10天誘蛾量(頭);x2為4月上、中旬百束小谷草把累計(jì)落卵量(塊);x3為4月中旬降水量(毫米),x4為4月中旬雨日(天);預(yù)報(bào)一代粘蟲幼蟲發(fā)生量y(頭/m2)。分級別數(shù)值列成表2-1。預(yù)報(bào)量y:每平方米幼蟲0~10頭為1級,11~20頭為2級,21~40頭為3級,40頭以上為4級。預(yù)報(bào)因子:x1誘蛾量0~300頭為I級,301~600頭為2級,601~1000頭為3級,1000頭以上為4級;x2卵量0~150塊為1級,151~300塊為2級,301~550塊為3級,550塊以上為4級;x3降水量0~10毫米為1級,10.1~13.2毫米為2級,13.3~17.0毫米為3級,17.0毫米以上為4級;x4雨日0~2天為級,3~4天為2級,5天為3級,6天或6天以上為4級。表2-1X1x2x3x4y年蛾量級別卵量級別降水量級別雨日級別幼蟲密度級別19601022411214.31211011961300144030.111141196269936717.511191196318764675417.147455419654318011.9121111966422220101013119678063510311.82322831976115124020.612171

197171831460418.444245419728033630413.433226319735722280213.224216219742641330342.243219219751981165271.84532331976461214017.515328319777693640444.7432444197825516510101112數(shù)據(jù)保存在“DATA6-5SAV〃文件中。1)準(zhǔn)備分析數(shù)據(jù)在SPSS數(shù)據(jù)編輯窗口中,創(chuàng)建''年份〃、''蛾量〃、“卵量〃、“降水量〃、“雨日〃和''幼蟲密度〃變量,并輸入數(shù)據(jù)。再創(chuàng)建蛾量、卵量、降水量、雨日和幼蟲密度的分級變量'x1〃、“x2”、“x3〃、“x4”和“y〃,它們對應(yīng)的分級數(shù)可以在SPSS數(shù)據(jù)編輯窗口中通過計(jì)算產(chǎn)生。編輯后的數(shù)據(jù)顯示如圖2-1。圖2-1或者打開已存在的數(shù)據(jù)文件“DATA6-5.SAV〃。2)啟動線性回歸過程單擊SPSS主菜單的“Analyze”下的“Regression”中“Linear”項(xiàng),將打開如圖2-2所示的線性回歸過程窗口。圖2-2線性回歸對話窗口設(shè)置分析變量設(shè)置因變量:用鼠標(biāo)選中左邊變量列表中的''幼蟲密度[y]〃變量,然后點(diǎn)擊“Dependent”欄左邊的向右拉按鈕,該變量就移至『'Dependent”因變量顯示欄里。設(shè)置自變量:將左邊變量列表中的“蛾量[x1]〃、“卵量[x2]〃、“降水量[x3]〃、“雨日[x4]〃變量,選移到“Independent(S)"自變量顯示欄里。設(shè)置控制變量:本例子中不使用控制變量,所以不選擇任何變量。選擇標(biāo)簽變量:選擇“年份〃為標(biāo)簽變量。選擇加權(quán)變量:本例子沒有加權(quán)變量,因此不作任何設(shè)置?;貧w方式本例子中的4個預(yù)報(bào)因子變量是經(jīng)過相關(guān)系數(shù)法選取出來的,在回歸分析時(shí)不做篩選。因此在'Method〃框中選中“Enter〃選項(xiàng),建立全回歸模型。5)設(shè)置輸出統(tǒng)計(jì)量單擊“Statistics〃按鈕,將打開如圖2-3所示的對話框。該對話框用于設(shè)置相關(guān)參數(shù)。其中各項(xiàng)的意義分別為圖2-3“Statistics"對話框①“RegressionCoefficients”回歸系數(shù)選項(xiàng):“Estimates”輸出回歸系數(shù)和相關(guān)統(tǒng)計(jì)量“Confideneeinterval"回歸系數(shù)的95%置信區(qū)間“Covariancematrix”回歸系數(shù)的方差-協(xié)方差矩陣本例子選擇“Estimates〃輸出回歸系數(shù)和相關(guān)統(tǒng)計(jì)量。②“Residuals”殘差選項(xiàng):“Durbin-Watson"Durbin-Watson檢驗(yàn)“CasewisediagnoStic”輸出滿足選擇條件的觀測量的相關(guān)信息。選擇該項(xiàng),下面兩項(xiàng)處于可選狀態(tài):“Outliersoutsidestandarddeviations"選擇標(biāo)準(zhǔn)化殘差的絕對值大于輸入值的觀測量;“Allcases〃選擇所有觀測量本例子都不選。③其它輸入選項(xiàng)“Modelfit〃輸出相關(guān)系數(shù)、相關(guān)系數(shù)平方、調(diào)整系數(shù)、估計(jì)標(biāo)準(zhǔn)誤、ANOVA表?!癛squaredchange”輸出由于加入和剔除變量而引起的復(fù)相關(guān)系數(shù)平方的變化?!癉escriptives”輸出變量矩陣、標(biāo)準(zhǔn)差和相關(guān)系數(shù)單側(cè)顯著水平矩陣。“Partandpartialcorrelation”相關(guān)系數(shù)和偏相關(guān)系數(shù)“Collinearitydiagnosties"顯示單個變量和共線性分析的公差。本例子選擇“Modelfit〃項(xiàng)。6)繪圖選項(xiàng)在主對話框單擊“Plots〃按鈕,將打開如圖2-4所示的對話框窗口。該對話框用于設(shè)置要繪制的圖形的參數(shù)。圖中的“X〃和“Y”框用于選擇X軸和Y軸相應(yīng)的變量。圖2-4“Plots”繪圖對話框窗口左上框中各項(xiàng)的意義分別為:“DEPENDNT”因變量。“ZPRED〃標(biāo)準(zhǔn)化預(yù)測值。“ZRESID〃標(biāo)準(zhǔn)化殘差?!癉RESID〃刪除殘差。“ADJPRED〃調(diào)節(jié)預(yù)測值?!癝RESID”學(xué)生氏化殘差。“SDRESID”學(xué)生氏化刪除殘差。“StandardizedResidualPlots”設(shè)置各變量的標(biāo)準(zhǔn)化殘差圖形輸出。其中共包含兩個選項(xiàng):“Histogram”用直方圖顯示標(biāo)準(zhǔn)化殘差?!癗ormalprobabilityplots”比較標(biāo)準(zhǔn)化殘差與正態(tài)殘差的分布示意圖?!癙roduceallpartialplot”偏殘差圖。對每一個自變量生成其殘差對因變量殘差的散點(diǎn)圖。本例子不作繪圖,不選擇。7)保存分析數(shù)據(jù)的選項(xiàng)在主對話框里單擊“Save!”鈕,將打開如圖2-5所示的對話框。圖2-5“Save”對話框①“PredictedValudS”測值欄選項(xiàng):Unstandardized非標(biāo)準(zhǔn)化預(yù)測值。就會在當(dāng)前數(shù)據(jù)文件中新添加一個以字符“PRE_”開頭命名的變量,存放根據(jù)回歸模型擬合的預(yù)測值。Standardized標(biāo)準(zhǔn)化預(yù)測值A(chǔ)djusted調(diào)整后預(yù)測值S.E.ofmeanpredictions預(yù)測值的標(biāo)準(zhǔn)誤。本例選中“Unstandardize非標(biāo)準(zhǔn)化預(yù)測值。②“Distance距?離欄選項(xiàng):Mahalanobis:距離。Cook's”:Cc距離。Leveragevalues:杠桿值。③“PredictionInterva預(yù)測區(qū)間選項(xiàng):Mean:區(qū)間的中心位置。Individual:觀測量上限和下限的預(yù)測區(qū)間。在當(dāng)前數(shù)據(jù)文件中新添加一個以字符“LICI_”頭命名的變量,存放預(yù)測區(qū)間下限值;以字符“UICI_”開頭命名的變量,存放預(yù)測區(qū)間上限值。ConfidenceInterval:置信度。本例不選?!癝avetoNewFile”保存為新文件:選中"Coefficientstatistics”項(xiàng)將回歸系數(shù)保存到指定的文件中。本例不選。“ExportmodelinformationtoXMLfile”導(dǎo)出統(tǒng)計(jì)

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負(fù)責(zé)。
  • 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

評論

0/150

提交評論