




版權說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權,請進行舉報或認領
文檔簡介
1、首都醫(yī)科大學流行病與衛(wèi)生統(tǒng)計學系羅艷俠Logistic回歸分類 按照反應變量類型二分類反應變量的logistic回歸多分類有序反應變量的logistic回歸多分類無序反應變量的logistic回歸 按照研究設計類型非條件logistic回歸(研究對象未經(jīng)匹配)條件logistic回歸(研究對象經(jīng)過匹配)(一)基本概念和原理(一)基本概念和原理1.1.應用背景應用背景 LogisticLogistic回歸模型是一種概率模型,適合于病例對照研究、隨訪研究和橫斷面研究,且結(jié)果發(fā)生的變量取值必須是二分的或多項分類的??捎糜绊懡Y(jié)果變量發(fā)生的因素為自變量與因變量,建立回歸方程。 設資料中有一個因變量y、p
2、個自變量x1, x2,xp,對每個實驗對象共有n次觀測結(jié)果,可將原始資料列成表1形式。2、LogisticLogistic回歸模型的數(shù)據(jù)結(jié)構(gòu) 表1 LogisticLogistic回歸模型的數(shù)據(jù)結(jié)構(gòu)實驗對象 y X1 X2 X3 . XP 1 y1 a11 a12 a13 a1p 2 y2 a21 a22 a23 a2p 3 y3 a31 a32 a33 a3p n yn an1 an2 an3 anp 表2 肺癌與危險因素的調(diào)查分析 例號 是否患病 性別 吸煙 年齡 地區(qū) 1 0 1 0 30 0 2 0 0 1 46 1 3 1 0 0 35 1 30 1 0 0 26 1 注:是否患病中
3、,0代表否,1代表是。性別中1代表男,0代表女,吸煙中1代表吸煙,0代表不吸煙。地區(qū)中,1代表農(nóng)村,0代表城市。 表3 配對資料(1:1) 對子號 病例 對照 x1 x2 x3 x1 x2 x3 1 1 3 0 1 0 1 2 0 3 1 1 3 0 3 0 1 2 0 2 0 10 2 2 2 0 0 0 注:X1蛋白質(zhì)攝入量,取值:0,1,2,3 X2不良飲食習慣,取值:0,1,2,3 X3精神狀況 ,取值:0,1,2 3 3、 Logistic回歸模型l 令:令: y=1 發(fā)?。栃浴⑺劳?、治愈等)發(fā)病(陽性、死亡、治愈等)l y=0 未發(fā)?。幮?、生存、未治愈等)未發(fā)病(陰性、生存、未
4、治愈等)l 將發(fā)病的概率記為將發(fā)病的概率記為P,它與自變量,它與自變量x x1 1, , x x2 2, ,x,xp p之間的之間的Logistic回歸模型為:回歸模型為: )exp(1)exp(110110ppppXXXXp 經(jīng)數(shù)學變換得定義Logistic變換Logistic回歸方程 ppXXpp 110)1/(ln)1/(ln)(logpppitppXXpLogit 110)( 4、回歸系數(shù)i的意義 流行病學的常用指標優(yōu)勢比(odds ratio,OR)或稱比數(shù)比,定義為:暴露人群發(fā)病優(yōu)勢與非暴露人群發(fā)病優(yōu)勢之比。 即Xi的優(yōu)勢比為:)1/()1/(0011PPPPORiiiPitPit
5、ORLn)0() 1()0(log)1 (log)(00解 釋 設第i個因素的回歸系數(shù)為bi,表示當有多個自變量存在時,其它自變量固定不變的情況下,自變量Xi每增加一個單位時,所得到的優(yōu)勢比的自然對數(shù)。也就是其它自變量固定不變的情況下,自變量Xi每增加一個單位時,影響因變量Y發(fā)生的倍數(shù)。 當bi0時,對應的優(yōu)勢比(odds ratio,記為ORi):ORi=exp(bi)1,說明該因素是危險因素;當bi0時,對應的優(yōu)勢比ORi=exp(bi)1,說明該因素是保護因素。 (二) Logistic回歸類型及其實例分析 1、非條件Logistic回歸 當研究設計為隊列研究、橫斷面研究或成組病例對照研
6、究時,要用非條件Logistic回歸。 例 為了探討糖尿病與血壓、血脂等因素的關系,某研究者對56例糖尿病病人和65例對照者進行病例-對照研究,收集了性別、年齡、學歷、體重指數(shù)、家族史、吸煙、血壓、總膽固醇、甘油三酯、高密度脂蛋白、低密度脂蛋白11個因素的資料(完整數(shù)據(jù)見SPSS數(shù)據(jù)文件)。性別性別年齡年齡學歷學歷體重指數(shù)體重指數(shù)家族史家族史吸煙吸煙血壓血壓總膽固醇總膽固醇甘油三甘油三脂脂hdlldl糖尿糖尿病病160221114.301.501.242.300148321114.601.321.152.300263211124.601.151.152.300168322114.151.431
7、.073.210145212113.421.22.632.300145332114.16.96.982.650159211114.321.021.053.490168331113.801.422.86.850263221113.871.552.44.810 表2 糖尿病影響因素賦值說明因素變量名賦值說明性別X1男=1,女=2年齡X2學歷X3小學以下=1,小學=2,初中=3,高中=4,大專及以上=5體重指數(shù)X424=1, 2426=2, 26=3家族史X5無=1,有=2吸煙X6不吸=1,吸=2血壓X7正常=1,高=2總膽固醇X8甘油三酯X9高密度脂蛋白 X10低密度脂蛋白 X11糖尿病Y對照=0
8、,病例=1 建立數(shù)據(jù)庫多因素的logistic回歸Case Processing SummaryCase Processing Summary121100.00.0121100.00.0121100.0Unweighted CasesaIncluded in AnalysisMissing CasesTotalSelected CasesUnselected CasesTotalNPercentIf weight is in effect, see classification table for the totalnumber of cases.a. 1. 基本數(shù)據(jù)描述Dependent V
9、ariable EncodingDependent Variable Encoding01Original Value無有Internal Value2. 因變量的編碼回歸模型的整體檢驗O Om mn ni ib bu us s T Te es st ts s o of f M Mo od de el l C Co oe ef ff fi ic ci ie en nt ts s95.49711.00095.49711.00095.49711.000StepBlockModelStep 1Chi-squaredfSig. Logistic回歸模型的擬合優(yōu)度檢驗H Ho os sm me er r
10、 a an nd d L Le em me es sh ho ow w T Te es st t4.3578.824Step1Chi-squaredfSig. Logistic回歸模型的預測準確度Model SummaryModel Summary71.575a.546.729Step1-2 LoglikelihoodCox & SnellR SquareNagelkerkeR SquareEstimation terminated at iteration number 7 becauseparameter estimates changed by less than .001.a. Cla
11、ssification TableClassification Tablea a59690.874987.589.3Observed無有糖尿病Overall PercentageStep 1無有糖尿病PercentageCorrectPredictedThe cut value is .500a. V Va ar ri ia ab bl le es s i in n t th he e E Eq qu ua at ti io on n.263.636.1711.6791.301.3744.527.085.0365.5211.0191.0891.0141.168-.699.2985.5131.0
12、19.497.277.8911.621.5528.6211.0035.0561.71414.9151.634.6825.7441.0175.1241.34719.4973.126.71419.1741.00022.7875.62392.3411.647.6706.0401.0145.1901.39619.298.606.4721.6471.1991.832.7274.6212.3121.0424.9291.02610.0981.31177.767-.914.4324.4841.034.401.172.934.017.416.0021.9671.017.4502.300-20.2074.6521
13、8.8661.000.000性別年齡學歷體重指數(shù)家族史吸煙血壓總膽固醇甘油三脂hdlldlConstantStep1aBS.E.WalddfSig.Exp(B)LowerUpper95.0% C.I.for EXP(B)Variable(s) entered on step 1: 性別, 年齡, 學歷, 體重指數(shù), 家族史, 吸煙, 血壓, 總膽固醇, 甘油三脂, hdl, ldl.a. 逐步Logistic回歸分析(1 1)向前法)向前法(forward selection)(forward selection) 開始方程中沒有變量,自變量由少到多一個一個引入回歸方程。按自變量對因變量的貢獻
14、(P值的大小)由小到大依次挑選,變量入選的條件是其P值小于規(guī)定進入方程的P界值Enter, 缺省值 P(0.05)。(2)后退法(backward selection) 開始變量都在方程中,然后按自變量因變量的貢獻(P值的大?。┯纱蟮叫∫来翁蕹兞刻蕹臈l件是其P值小于規(guī)定的剔除標準Remove, 缺省值 p(0.10)。 (3)逐步回歸法逐步引入-剔除法(stepwise selection) 前進前進逐步引入-剔除法 是在前進法的思想下,考慮剔除變量, 因此有兩個p界值Enter, Remove。 SPSS無論是條件還是非條件Logistic回歸,在多變量分析時均可以采用逐步回歸方法,實
15、現(xiàn)的方法是: 在 method后加選項: Enter:所有變量一次全部進入方程。 Forward:逐步向前法 Backward:后退法 變量移出方程所采取的檢驗方法: Conditional; LR; Ward(盡量不用) 調(diào)試法:P從大到小取值0.5,0.1,0.05, 一般實際用時,Enter、Remove應多次選取調(diào)整2.條件logistic回歸分析 配對設計的類型:1:1、1:m、n:m (可采用分層COX模型來擬合)。 例如:某市調(diào)查三種生活因素與胃癌的關系,資料見表5。 表5 配對資料(1:1) 對子號 病例 對照 x1 x2 x3 x1 x2 x3 1 1 3 0 1 0 1 2
16、 0 3 1 1 3 0 3 0 1 2 0 2 0 10 2 2 2 0 0 0 注:X1蛋白質(zhì)攝入量,取值:0,1,2,3 X2不良飲食習慣,取值:0,1,2,3 X3精神狀況 ,取值:0,1,2配對Logistic回歸SPSS操作步驟: Analyze-Survival-COX Regression-Time框(outcome)-Status框( Status )-Define Event: Single value 1:continue-Covariates框(x1、x2、x3)-Method = Forward Stepwise (Likelihood Ratio)-Strata框(
17、id)-Options-at last step-okCase Processing Summary1050.0%1050.0%20100.0%0.0%0.0%0.0%0.0%20100.0%EventaCensoredTotalCases availablein analysisCases with missing valuesCases with non-positivetimeCensored cases beforethe earliest event in astratumTotalCases droppedTotalNPercentDependent Variable: OUTCO
18、MEa. Omnibus Tests of Model Coefficientsa1.9207.0932.02911.9432.003Step2-2 LogLikelihood Chi-squaredfSig.Overall (score)Chi-squaredfSig.Change From Previous BlockBeginning Block Number 1. Method: Forward Stepwise (Likelihood Ratio)a. V Va ar ri ia ab bl le es s i in n t th he e E Eq qu ua at ti io on n1.727 1.249 1.9121.167 5.624.48665.0172.284 1.679 1.8521.174 9.821.366 263.620 x2x3Step2BSEWalddfSig. Exp(B) Lower Upper95.0% CI for Exp(B)Variables not in the Equationa.0371.847X1Step 2ScoredfSig.Residual Chi Square = .037 with 1 df Sig. = .847a. 在本
溫馨提示
- 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權益歸上傳用戶所有。
- 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預覽,若沒有圖紙預覽就沒有圖紙。
- 4. 未經(jīng)權益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
- 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負責。
- 6. 下載文件中如有侵權或不適當內(nèi)容,請與我們聯(lián)系,我們立即糾正。
- 7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。
最新文檔
- 榆林能源科技職業(yè)學院《播音表達訓練》2023-2024學年第二學期期末試卷
- 洛陽商業(yè)職業(yè)學院《基本統(tǒng)計分析軟件應用》2023-2024學年第二學期期末試卷
- 青島遠洋船員職業(yè)學院《建筑工程施工技術與組織》2023-2024學年第二學期期末試卷
- 中華女子學院《二維動畫設計與制作》2023-2024學年第二學期期末試卷
- 無錫太湖學院《土木工程測量》2023-2024學年第二學期期末試卷
- 民辦合肥財經(jīng)職業(yè)學院《橡膠工藝原理》2023-2024學年第二學期期末試卷
- 紅河學院《建筑結(jié)構(gòu)抗震設計》2023-2024學年第二學期期末試卷
- 玉溪職業(yè)技術學院《前端框架應用開發(fā)》2023-2024學年第二學期期末試卷
- 廣州鐵路職業(yè)技術學院《工程識圖與制圖》2023-2024學年第二學期期末試卷
- 遼寧地質(zhì)工程職業(yè)學院《民族文化專題實踐》2023-2024學年第二學期期末試卷
- 新星諾亞外語學校劍橋少兒英語一級上冊期中測試題
- QCT 291-2023 汽車機械式分動器總成性能要求和臺架試驗方法 (正式版)
- 浙教版勞動八年級下冊全冊教案教學設計
- 盤扣式腳手架培訓課件
- 【溫州眼鏡出口遭遇技術貿(mào)易壁壘的現(xiàn)狀及對策(定量論文)15000字】
- 2024年中國血糖健康管理行業(yè)白皮書
- 文華財經(jīng)“麥語言”函數(shù)手冊
- 大班數(shù)學PPT課件《實物填補數(shù)》
- 乳痛癥的健康宣教
- GB/Z 43281-2023即時檢驗(POCT)設備監(jiān)督員和操作員指南
- 吊籃檢查記錄
評論
0/150
提交評論