




版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進(jìn)行舉報(bào)或認(rèn)領(lǐng)
文檔簡介
1、第七章 回歸分析 第一節(jié) Linear過程 線性回歸第二節(jié) Curve Estimation過程 曲線回歸第三節(jié) Logistic過程 羅輯斯諦回歸第四節(jié) Probit過程 概率單位回歸第五節(jié) Nonlinear過程 非線性回歸n回歸的主要內(nèi)容:n從一組樣本數(shù)據(jù)出發(fā),確定這些變量間的定量關(guān)系式;n對這些關(guān)系式的可信度進(jìn)行各種統(tǒng)計(jì)檢驗(yàn);n從影響某一變量的諸多變量中,判斷哪些變量的影響顯著,哪些不顯著;n利用求得的關(guān)系式進(jìn)行預(yù)測和控制。n回歸的分類:n按是否線性分:線性回歸模型和非線性回歸模型。n按自變量個(gè)數(shù)分:簡單的一元回歸,多元回歸。n利用SPSS得到模型關(guān)系式,是否具有適用性,要看回歸方程的
2、顯著性檢驗(yàn)(F檢驗(yàn))和回歸系數(shù)b的顯著性檢驗(yàn)(T檢驗(yàn)),還要看擬合程度R2 (相關(guān)系數(shù)的平方,一元回歸用R square,多元回歸用Adjusted R Square)回歸分析的菜單選項(xiàng)及說明:n在回歸過程中包括:Liner:線性回歸Curve Estimation:曲線估計(jì)Binary Logistic: 二分變量邏輯回歸Multinomial Logistic:多分變量邏輯回歸Ordinal 序回歸Probit:概率單位回歸Nonlinear:非線性回歸Weight Estimation:加權(quán)估計(jì)2-Stage Least squares:二段最小平方法Optimal Scaling 最優(yōu)
3、編碼回歸 第一節(jié) Linear過程n7.1.1 主要功能n調(diào)用此過程可完成二元或多元的線性回歸分析。在多元線性回歸分析中,用戶還可根據(jù)需要,選用不同篩選自變量的方法(如:逐步法、向前法、向后法,等)。n一一元線性回歸方程: n多元線性回歸方程:n bxaynnxbxbby.110 回歸方程的假設(shè)1數(shù)據(jù)正態(tài)性假設(shè):誤差項(xiàng)的分布與自變量無關(guān),服 從均值0,方差常數(shù)的正態(tài)分布;2方差齊性假設(shè):對不同的自變量取值條件下,誤差分 布方差相同;3獨(dú)立性假設(shè):對不同的自變量取值條件下,誤差分布 期望為0;4無自相關(guān)性假設(shè):對不同的自變量取值條件下,誤差 不相關(guān);5隨機(jī)誤差與自變量對因變量的影響不相關(guān);4.
4、回歸方程的建立 Enter 所有變量都進(jìn)入方程(全模型) Remove 根據(jù)設(shè)定好的條件, 刪除部分變量, 通常根據(jù)變量與模型的相關(guān)性 Forward 向前選擇 根據(jù)條件從無自變量開始逐個(gè)選擇適合的變量進(jìn)入模型 Backward 向后剔除法 根據(jù)條件從全模型中逐個(gè)剔除變量 Stepwise 逐步進(jìn)入法 注:衡量變量在回歸模型中作用的大小,一般用偏回歸平方和刻畫,令S(i1, i2, , ik)表示方程中有變量(i1, i2, , ik)時(shí) 殘差平方和,則第 i個(gè)變量的偏回歸平方和定義為: Pi2= S(i1, i2, im-1,im+1, , ik)S(i1, i2, , ik) Pi越大表明
5、該變量越重要。)5. 參入分析的觀測量的選擇: 利用Selection 變量的取 值實(shí)現(xiàn)分析中 CASE的選擇6. Statistics 選項(xiàng)設(shè)置: R squared Chang : 表示當(dāng)回歸方程中引入或剔除 一個(gè)變量后R2的改變量。7. 共線性診斷:回歸方程中,雖然各自變量對因變量都是有意義的,但是某些自變量可能彼此相關(guān),即存在共線性問題,因此需要對方程中的自變量進(jìn)行共線性診斷。 如果存在常數(shù)C0 C1 C2,使C0= C1 X1+C2X2 則稱X1,X2具有精確共線性. 如果上式近似成立, 則稱近似共線性 當(dāng)一組自變量有精確共線性時(shí),必須刪除引起共線性的一個(gè)或多個(gè)自變量,當(dāng)共線性為近似
6、時(shí),要把引起共線性的自變量刪除,但必須保證模型丟失信息最少。 共線性診斷常用參數(shù):容許度() 在只有兩個(gè)變量的情況下,其間的貢獻(xiàn)性表現(xiàn)在兩個(gè)變量間 的相關(guān)系數(shù),相關(guān)系數(shù)為1時(shí),精確共線性,為0時(shí),不存 在共線性。多個(gè)變量時(shí),Xi 與其他自變量X之間的復(fù)相關(guān) 系數(shù)的平方體現(xiàn)了共線性,容許度 Toli = 1R2 當(dāng)容許度較小時(shí),自變量X與其他變量存在共線性。 容許度測量共線性的條件是:觀測量應(yīng)近似服從正態(tài)分布n方差膨脹因子(VIF)n方差膨脹因子 VIF=1/(1R2) 容許度的倒數(shù),值越大,自變量之間存在共線性可能性越大. 條件參數(shù)(Condition Index) Condition Ind
7、ex = 條件參數(shù)大于等于30時(shí)認(rèn)為有共線性存在的可能性 共線性問題的解決方法. 剔除不重要的有共線性的變量、增加樣本量、重新測量.n7.1.2實(shí)例分析 例7.1某醫(yī)師測得10名3歲兒童的身高(cm)、體重(kg)和體表面積(cm2)資料如下。試用多元回歸方法確定以身高、體重為自變量,體表面積為應(yīng)變量的回歸方程。n數(shù)據(jù)準(zhǔn)備:n激活數(shù)據(jù)管理窗口,定義變量名:體表面積為Y,保留3位小數(shù);身高、體重分別為X1、X2,1位小數(shù)。輸入原始數(shù)據(jù) 。 n數(shù)據(jù)文件:spssjiaoan例題數(shù)據(jù)身高體重體表面積回歸n統(tǒng)計(jì)分析n激活A(yù)naylze菜單選Regression中的Linear.項(xiàng),彈出Linear R
8、egression對話框。從對話框左側(cè)的變量列表中選y,點(diǎn)擊鈕使之進(jìn)入Dependent框,選x1、x2,點(diǎn)擊鈕使之進(jìn)入Indepentdent(s)框;在Method處下拉菜單,共有5個(gè)選項(xiàng):Enter(全部入選法)、Stepwise(逐步法)、Remove(強(qiáng)制剔除法)、Backward(向后法)、Forward(向前法)。本例選用Enter法。點(diǎn)擊OK鈕即完成分析。n結(jié)果顯示,本例以X1、X2為自變量,Y為應(yīng)變量,采用全部入選法建立回歸方程?;貧w方程的復(fù)相關(guān)系數(shù)為0.94964,決定系數(shù)(即r2)為0.90181,經(jīng)方差分析,F(xiàn)=34.14499,P=0.0003,回歸方程有效?;貧w方程
9、為Y=0.0687101X1+0.183756X2-2.856476。結(jié)果輸出: spssjiaoan例題數(shù)據(jù)身高體重體表面積回歸n實(shí)例分析例7.2n建立一個(gè)以初始工資Salbegin 、工作經(jīng)驗(yàn)prevexp 、工作時(shí)間jobtime 、工作種類jobcat 、受教育年限edcu等為自變量,當(dāng)前工資Salary為因變量的回歸模型。.數(shù)據(jù)文件:spssjiaoan例題數(shù)據(jù)回歸方程預(yù)測工資 。數(shù)據(jù)分析:數(shù)據(jù)文件:spssjiaoan例題數(shù)據(jù)回歸方程預(yù)測工資 。數(shù)據(jù)分析:1.先做數(shù)據(jù)散點(diǎn)圖,觀測因變量Salary與自變量Salbegin之間關(guān)系是否有線性特點(diǎn)nGraphs -Scatter-Sim
10、plenX Axis: SalbeginnY Axis: Salary2.若散點(diǎn)圖的趨勢大概呈線性關(guān)系,可以建立線性回歸模型nAnalyze-Regression-LinearnDependent: SalarynIndependents: Salbegin,prevexp,jobtime,jobcat,edcu等變量nMethod: Stepwisen比較有用的結(jié)果:n擬合程度Adjusted R2: 越接近1擬合程度越好n回歸方程的顯著性檢驗(yàn)Sign回歸系數(shù)表Coefficients的Model最后一個(gè)中的回歸系數(shù)B和顯著性檢驗(yàn)Sign得模型: Salary=-15038.6+1.37Sa
11、lbegin+5859.59jobcat- 19.55prevexp+154.698jobtime+539.64edcu第二節(jié) Curve Estimation過程7.2.1 主要功能n調(diào)用此過程可完成下列有關(guān)曲線擬合的功能:n7.2.2實(shí)例分析:n例7.3汽車問題n已知汽車 每加侖焰料行駛英里數(shù) mpq 汽車重量 Weight 的一組數(shù)據(jù),確定曲線回歸模型 .n數(shù)據(jù)文件:spssjiaoan例題數(shù)據(jù)汽車問題曲線回歸數(shù)據(jù)分析: 先做散點(diǎn)圖(Graphs -Scatter-Simple):weight(X)、mpg(Y),看每加侖汽油行駛里程數(shù)mpg(Y)隨著汽車自重weight(X)的增加而減
12、少的關(guān)系,也發(fā)現(xiàn)是曲線關(guān)系建立若干曲線模型(可試著選用所有模型Models)Analyze-Regression- Curve EstimationDependent: mpgIndependent: weightModels: 全選(除了最后一個(gè)邏輯回歸)選Plot models:輸出模型圖形比較有用的結(jié)果:各種模型的Adjusted R2,并比較哪個(gè)大,結(jié)果是指數(shù)模型Compound的Adjusted R2=0.70678最好(擬合情況可見圖形窗口), 結(jié)果方程為:mpg=60.15*0.999664weight說明:Growth和Exponential的結(jié)果也相同,也一樣。n結(jié)果文件:s
13、pssjiaoan例題數(shù)據(jù)汽車問題曲線回歸n實(shí)例操作n例8.2某地1963年調(diào)查得兒童年齡(歲)X與錫克試驗(yàn)陰性率(%)Y的資料如下,試擬合對數(shù)曲線。n數(shù)據(jù)準(zhǔn)備n激活數(shù)據(jù)管理窗口,定義變量名:錫克試驗(yàn)陰性率為Y,年齡為X,輸入原始數(shù)據(jù)。n數(shù)據(jù)文件:spssjiaoan例題數(shù)據(jù)擬合對數(shù)曲線。n激活A(yù)naylze菜單選Regression中的Curve Estimation.項(xiàng),彈出Curve Estimation對話框。從對話框左側(cè)的變量列表中選y,點(diǎn)擊鈕使之進(jìn)入Dependent框,選x,點(diǎn)擊鈕使之進(jìn)入Indepentdent(s)框;在Model框內(nèi)選擇所需的曲線模型,本例選擇Logarit
14、hmic模型(即對數(shù)曲線);選Plot models項(xiàng)要求繪制曲線擬合圖;點(diǎn)擊Save.鈕,彈出Curve Estimation:Save對話框,選擇Predicted value項(xiàng),要求在原始數(shù)據(jù)庫中保存根據(jù)對數(shù)方程求出的Y預(yù)測值,點(diǎn)擊Continue鈕返回Curve Estimation對話框,再點(diǎn)擊OK鈕即可。 n結(jié)果解釋n在結(jié)果輸出窗口中將看到如下統(tǒng)計(jì)數(shù)據(jù):n在以X為自變量、Y為應(yīng)變量,采用對數(shù)曲線擬合方法建立的方程,決定系數(shù)R2=0.913(接近于1),作擬合優(yōu)度檢驗(yàn),方差分析表明:F=52.32,P=0.001,擬合度很好,對數(shù)方程為:Y=61.3259+20.6704lnX。n結(jié)
15、果文件:spssjiaoan例題數(shù)據(jù)擬合對數(shù)曲線。第三節(jié)二項(xiàng)邏輯回歸(Binary Logistic)n 7.3.1 主要功能n調(diào)用此過程可完成Binary Logistic回歸的運(yùn)算。所謂Binary Logistic回歸,是指應(yīng)變量為二級計(jì)分或二類評定的回歸分析,這在醫(yī)學(xué)研究中經(jīng)常遇到,如:死亡與否(即生、死二類評定)的概率跟病人自身生理狀況和所患疾病的嚴(yán)重程度有關(guān);對某種疾病的易感性的概率(患病、不患病二類評定)與個(gè)體性別、年齡、免疫水平等有關(guān)。此類問題的解決均可借助邏輯回歸來完成。n本節(jié)介紹的Binary Logistic過程,應(yīng)與日常所說的Logistic曲線模型(即S或倒S形曲線)
16、相區(qū)別。用戶如果要擬合Logistic曲線模型,可調(diào)用第二節(jié)Curve Estimation過程,系統(tǒng)提供11種曲線模型,其中含有Logistic曲線模型。 nLogistic回歸方程為n7.3.2 實(shí)例操作n例7.3某醫(yī)師研究男性胃癌患者發(fā)生術(shù)后院內(nèi)感染的影響因素,資料如下表,請通過Logistic回歸統(tǒng)計(jì)方法對主要影響因素進(jìn)行分析。n數(shù)據(jù)文件:spssjiaoan例題數(shù)據(jù)術(shù)后感染的Logistic回歸n數(shù)據(jù)準(zhǔn)備n激活數(shù)據(jù)管理窗口,定義變量名:術(shù)后感染為Y(字符變量,有輸入Y、無輸入N),年齡為X1,手術(shù)創(chuàng)傷程度為X2,營養(yǎng)狀態(tài)為X3,術(shù)前預(yù)防性抗菌為X4(字符變量,有輸入Y、無輸入N),白
17、細(xì)胞數(shù)為X5,癌腫病理分度為X6。按要求輸入原始數(shù)據(jù)。n統(tǒng)計(jì)分析n激活A(yù)nayzle菜單選Regression中的Binary Logistic 項(xiàng),彈出Logistic Regression對話框。從對話框左側(cè)的變量列表中選y,點(diǎn)擊鈕使之進(jìn)入Dependent框,選x1、x2、x3、x4、x5和x6,點(diǎn)擊鈕使之進(jìn)入Covariates框;n點(diǎn)擊Method處的下拉按鈕,系統(tǒng)提供7種方法:n1、Enter:所有自變量強(qiáng)制進(jìn)入回歸方程;n2、Forward: Conditional:以假定參數(shù)為基礎(chǔ)作似然比概率檢驗(yàn),向前逐步選擇自變量;n3、Forward: LR:以最大局部似然為基礎(chǔ)作似然比概
18、率檢驗(yàn),向前逐步選擇自變量;n4、Forward: Wald:作Wald概率統(tǒng)計(jì)法,向前逐步選擇自變量;n5、Backward: Conditional:以假定參數(shù)為基礎(chǔ)作似然比概率檢驗(yàn),向后逐步選擇自變量;n6、Backward: LR:以最大局部似然為基礎(chǔ)作似然比概率檢驗(yàn),向后逐步選擇自變量;n7、Backward: Wald:作Wald概率統(tǒng)計(jì)法,向后逐步選擇自變量。n選用Forward: Conditional法,以便選擇有主要作用的影響因素;點(diǎn)擊Options.鈕,彈出Logistic Regression:Options對話框,在Display框中選取At last step項(xiàng),要
19、求只顯示最終計(jì)算結(jié)果,點(diǎn)擊Continue鈕返回Logistic Regression對話框,再點(diǎn)擊OK鈕即可。 n結(jié)果表明,第一步自變量X3入選,方程分類能力達(dá)80.00%;第二步自變量X6入選,方程分類能力達(dá)93.33%(參見結(jié)果中的分類分析表);方程有效性經(jīng)2檢驗(yàn),2=15.276,P=0.0005。nLogistic回歸的分類概率方程為:n e-219.405+54.517X3+18.280X6nP = n 1+ e-219.405+54.517X3+18.280X6n根據(jù)該方程,若一胃癌患者營養(yǎng)狀態(tài)評分(X3)為3,癌腫病理分度(X6)為9,則其P=4.510-270,這意味著術(shù)后將
20、發(fā)生院內(nèi)感染;另一胃癌患者營養(yǎng)狀態(tài)評分(X3)為1,癌腫病理分度(X6)為4,則其P=0.981051,這意味著術(shù)后將不會發(fā)生院內(nèi)感染。n結(jié)果文件:spssjiaoan例題數(shù)據(jù)術(shù)后感染的Logistic回歸n 第四節(jié) Probit過程(概率單位回歸)n7.4.1 主要功能n調(diào)用此過程可完成劑量-效應(yīng)關(guān)系的分析。通過概率單位使劑量-效應(yīng)的S型曲線關(guān)系轉(zhuǎn)化成直線,從而利用回歸方程推算各效應(yīng)水平的相應(yīng)劑量值。n7.4.2 實(shí)例操作n例7.4研究抗瘧藥環(huán)氯胍對小白鼠的毒性,試驗(yàn)結(jié)果如下表所示。試計(jì)算環(huán)氯胍的半數(shù)致死劑量。n數(shù)據(jù)準(zhǔn)備n激活數(shù)據(jù)管理窗口,定義變量名:劑量為DOSE、試驗(yàn)動(dòng)物數(shù)為OBSERV
21、E、死亡動(dòng)物數(shù)為DEATH。然后輸入原始數(shù)據(jù)。n 統(tǒng)計(jì)分析:激活A(yù)nayzle菜單選Regression中的Probit.項(xiàng),彈出Probit Analysis對話框。從對話框左側(cè)的變量列表中選death,點(diǎn)擊鈕使之進(jìn)入Response Frequency框;選observe,點(diǎn)擊鈕使之進(jìn)入Total Observed框;選dose,點(diǎn)擊鈕使之進(jìn)入Covariate(s)框,并下拉Transform菜單,選Log base 10項(xiàng)(即要求對劑量進(jìn)行以10為底的對數(shù)轉(zhuǎn)換)。 n系統(tǒng)在Model欄中提供兩種模型,一是概率單位模型(Probit),另一是比數(shù)比自然對數(shù)模型(Logit)。本例選用概率
22、單位模型。n點(diǎn)擊Options.鈕,彈出Probit Analysis: Options對話框,在Natural Response Rate欄選Calculate from data項(xiàng),要求計(jì)算各劑量組的實(shí)際反應(yīng)率。之后點(diǎn)擊Continue鈕返回Probit Analysis對話框,再點(diǎn)擊OK鈕即可。 n結(jié)果解釋n在結(jié)果輸出窗口中將看到如下統(tǒng)計(jì)數(shù)據(jù):n系統(tǒng)首先顯示,共有7組原始數(shù)據(jù)采概率單位模型進(jìn)行分析?;貧w方程的各參數(shù)在經(jīng)過14次疊代運(yùn)算后確定,即PROBIT = 5.95215 - 4.66313X 。該方程擬合優(yōu)度2檢驗(yàn)結(jié)果,2 = 0.833,P=0.934,擬合良好。n結(jié)果文件:sp
23、ssjiaoan例題數(shù)據(jù)半數(shù)致死劑量概率單位回歸n接著,系統(tǒng)顯示劑量對數(shù)值(DOSE)、實(shí)際觀察例數(shù)(Number of Subjects)、試驗(yàn)動(dòng)物反應(yīng)數(shù)(Observed Responses)、預(yù)期反應(yīng)數(shù)(Expected Responses)、殘差( Residual)和效應(yīng)的概率(Prob)。之后,顯示各效應(yīng)概率水平的劑量值及其95%可信區(qū)間值,按本例要求,環(huán)氯胍的半數(shù)致死劑量(即Prob = 0.50時(shí))為6.07347,其95%可信區(qū)間為1.863057.54282。 n最后,系統(tǒng)輸出以劑量對數(shù)值為自變量X、以概率單位為應(yīng)變量Y的回歸直線散點(diǎn)圖,從圖中各點(diǎn)的分布狀態(tài)亦可看出,回歸直
24、線的擬合程度是很好的。 第五節(jié) Nonlinear過程n7.5.1 主要功能n調(diào)用此過程可完成非線性回歸的運(yùn)算。所謂非線性回歸,即為曲線型的回歸分析,一些曲線模型我們已在本章第二節(jié)中述及。但在醫(yī)學(xué)研究中經(jīng),還經(jīng)常會遇到除本章第二節(jié)中述及的之外的曲線模型,對此,SPSS提供Nonlinear過程讓用戶根據(jù)實(shí)際需要,建立各種曲線模型以用于研究變量間的相互關(guān)系。在醫(yī)學(xué)中,如細(xì)菌繁殖與培養(yǎng)時(shí)間關(guān)系的研究即可借助Nonlinear過程完成。n下面一些曲線模型是在論文中較常見的,提供應(yīng)用時(shí)作參考: n7.5.2 實(shí)例操作n檢查某一藥品在應(yīng)用于某一對象后的濃度變化情況days(日期)bod(濃度)。數(shù)據(jù)文件:spssjiaoan例題數(shù)據(jù)非線性
溫馨提示
- 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
- 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
- 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
- 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負(fù)責(zé)。
- 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請與我們聯(lián)系,我們立即糾正。
- 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。
最新文檔
- 2025年山東省護(hù)資試題及答案
- 2025年java 開發(fā)算法面試題及答案
- 2025年針刺傷的測試題及答案
- 2025年腦力小游戲測試題及答案
- 2025年函授學(xué)位考試試題及答案
- 2025年銀行柜員面試試題及答案
- 2025年南豐美術(shù)面試題及答案
- 2025年今年地理考試題及答案
- 2025年綜合能力面試題型及答案
- 2025年美團(tuán)營銷筆試試題及答案
- 眼科與視功能檢查屈光參差課件
- GB/T 6433-2025飼料中粗脂肪的測定
- 2025年湖南司法警官職業(yè)學(xué)院單招職業(yè)傾向性測試題庫學(xué)生專用
- 2025年贛西科技職業(yè)學(xué)院單招職業(yè)技能測試題庫帶答案
- 急性ST段抬高型心肌梗死溶栓治療專家共識2024解讀
- 電影《哪吒之魔童降世》主題班會
- 四川德陽歷年中考語文文言文閱讀試題12篇(含答案與翻譯)(截至2024年)
- 10以內(nèi)加減法口算趣味學(xué)習(xí)500題(可打?。?/a>
- 合唱之美知到智慧樹章節(jié)測試課后答案2024年秋山東航空學(xué)院
- 人工智能應(yīng)用概論(第2版) 教案全套 莫少林
- 食品安全演練預(yù)案及流程
評論
0/150
提交評論