第十六章Logistic回歸分析_第1頁
第十六章Logistic回歸分析_第2頁
第十六章Logistic回歸分析_第3頁
第十六章Logistic回歸分析_第4頁
第十六章Logistic回歸分析_第5頁
已閱讀5頁,還剩35頁未讀, 繼續(xù)免費閱讀

下載本文檔

版權說明:本文檔由用戶提供并上傳,收益歸屬內容提供方,若內容存在侵權,請進行舉報或認領

文檔簡介

1、391 第十六章第十六章 logistic回歸分析回歸分析 (Logistic Regression)392ContentnLogistic regression nConditional logistic regression nApplication 393講述內容講述內容: :第一節(jié)第一節(jié) logisticlogistic回歸回歸第二節(jié)第二節(jié) 條件條件logisticlogistic回歸回歸第三節(jié)第三節(jié) logisticlogistic回歸的應用回歸的應用 及其注意事項及其注意事項394目的:目的:作出以多個自變量(危險因素)估計作出以多個自變量(危險因素)估計應變量(應變量(結果因素)

2、結果因素)的的logistic回歸方程?;貧w方程。屬于概率型非線性回歸。屬于概率型非線性回歸。資料:資料:1. 應變量為反映某現(xiàn)象發(fā)生與不發(fā)生的應變量為反映某現(xiàn)象發(fā)生與不發(fā)生的二值變量;二值變量;2. 自變量宜全部或大部分為分類自變量宜全部或大部分為分類變量,可有少數(shù)數(shù)值變量。分類變量要數(shù)量變量,可有少數(shù)數(shù)值變量。分類變量要數(shù)量化?;?。395用途:用途:研究某種疾病或現(xiàn)象發(fā)生和多個危研究某種疾病或現(xiàn)象發(fā)生和多個危 險因素(或保護因子)的數(shù)量關系。險因素(或保護因子)的數(shù)量關系。 用用 檢驗(或檢驗(或u檢驗)的檢驗)的局限性局限性: 1.只能研究只能研究1個危險因素;個危險因素; 2.只能得出

3、定性結論。只能得出定性結論。2396 種類種類: 1. 成組(非條件)成組(非條件)logistic回歸方程?;貧w方程。 2. 配對(條件)配對(條件)logistic回歸方程?;貧w方程。397第一節(jié)第一節(jié) logistic回歸回歸 (非條件(非條件logistic回歸回歸 )398 一、基本概念一、基本概念1 0 Y發(fā)生應變量未發(fā)生12,mXXX自變量,在m個自變量的作用下陽性結果發(fā)生的概率記作個自變量的作用下陽性結果發(fā)生的概率記作:),| 1(21mXXXYPP1P039911ZPe若令若令: mmXXXZ2211001122ln=1mmPXXXP0112211 exp ()mmPXXX回

4、回歸歸模模型型其中0為常數(shù)項, m,21為回歸系數(shù)。 概率概率P:01,logitP:。 取值范圍取值范圍 logitP3910圖圖16-1 logistic函數(shù)的圖形函數(shù)的圖形00.51-4-3-2-10123410.5PZ:, 0, : 0, 0.5, 1PZ3911模模型型參參數(shù)數(shù)的的意意義義01122ln=logit1mmPXXXPP常數(shù)項常數(shù)項 表示暴露劑量為表示暴露劑量為0時個體發(fā)病時個體發(fā)病與不發(fā)病概率之比的自然對數(shù)。與不發(fā)病概率之比的自然對數(shù)?;貧w系數(shù)回歸系數(shù) 表示自變量表示自變量 改變一個單位時改變一個單位時logitP 的改變量。的改變量。0), 2 , 1(mjjjX39

5、12流行病學衡量危險因素作用大小的流行病學衡量危險因素作用大小的比數(shù)比例比數(shù)比例指標。指標。計算公式為:計算公式為:1100/(1)/(1)jPPORPP優(yōu)勢比優(yōu)勢比OR(odds ratio)3913111000010010/(1)lnlnlogitlogit/(1)()()()jmmjttjtttjtjjPPORPPPPcXcXcc對對比比某某一一危危險險因因素素兩兩個個不不同同暴暴露露水水平平1cXj與與0cXj的的發(fā)發(fā)病病情情況況(假假定定其其它它因因素素的的水水平平相相同同) ,其其優(yōu)優(yōu)勢勢比比的的自自然然對對數(shù)數(shù)為為: 與與 logisticP 的關系的關系:39140, 1 ex

6、p, 0, 1 0, 1 jjjjjjOROROROR無作用危險因保子護因子則有101 , 1, 0 jccX暴非若暴露露由于jOR值與模型中的常數(shù)項0無關,0在危險因素分析中通常視其為無效參數(shù)。 1100/(1) 1, /(1)PPPORRRPP當則有10 exp()jjORcc即3915 11(1)iinYYiiiLPP 1lnln(1) ln(1)niiiiiLYPYP mbbbb,210 二、logistic回歸模型的參數(shù)估計回歸模型的參數(shù)估計 1. 參數(shù)估計參數(shù)估計 原理:最大似然原理:最大似然( likelihood )估計估計 3916 )(exp01ccbROjj若自變量jX只

7、有暴露和非暴露兩個水平, 則優(yōu)勢比jOR的1可信區(qū)間估計公式為 )exp(2/jbjSub 2. 優(yōu)勢比估計優(yōu)勢比估計 可反映某一因素兩個不同水平(c1,c0)的優(yōu)勢比。3917例16-1 表16-1是一個研究吸煙、飲酒與食道癌關系的病例對照資料,試作logistic回歸分析。 121 0 1 0 1 0 XXY吸煙不吸煙飲酒不飲酒病例對照確確定定各各變變量量編編碼碼 3918分層 吸煙 飲酒 觀察例數(shù) 陽性數(shù) 陰性數(shù) g X1 X2 ng dg ng dg 1 0 0 199 63 136 2 0 1 170 63 107 3 1 0 101 44 57 4 1 1 416 265 151

8、表表16-1 吸煙與食道癌關系的病例對照調查資料吸煙與食道癌關系的病例對照調查資料 3919=0.1572 吸煙與不吸煙的優(yōu)勢比:11expexp0.8856=2.42ORb 經(jīng)logistic回歸計算后得:0b=-0.9099,0bS=0.1358;1b=0.8856, 1bS=0.1500;2b=0.5261,2bS=0.1572 吸 煙 與 不 吸 煙 的 優(yōu) 勢 比 :1OR的 95可信區(qū)間: 110.05/ 2expexp(0.88561.960.1500)(1.81,3.25)bbuS 飲酒與不飲酒的優(yōu)勢比: 飲酒與不飲酒的優(yōu)勢比: 飲酒與不飲酒的優(yōu)勢比: 22expexp0.52

9、611.69ORb 22exp(1.96)exp(0.5261 1.96 0.1572)(1.24,2.30)bbS2OR的95可信區(qū)間: 3920 三、三、logistic回歸模型的假設檢驗回歸模型的假設檢驗 Wald 檢驗 將各參數(shù)的估計值jb與 0 比較,而用它的標準誤jbS作為參照,檢驗統(tǒng)計量為 2, 1jjjjbbbbuSS2 或 221220111022120.8856 34.860.15000.5261 11.200 :0, :0, 0.05,:0, :0,.157 0 05,2.HHHH 2值均大于 3.84,說明食道癌與吸煙、飲酒有關系,結論同前。 2.1.似然比檢驗3921

10、方法:方法:前進法、后退法和逐步法前進法、后退法和逐步法。檢驗統(tǒng)計量:檢驗統(tǒng)計量:不是不是 F 統(tǒng)計量,而是似然比統(tǒng)計量、統(tǒng)計量,而是似然比統(tǒng)計量、 Wald 統(tǒng)計量和計分統(tǒng)計量之一。統(tǒng)計量和計分統(tǒng)計量之一。四、變量篩選四、變量篩選例16-2 為了探討冠心病發(fā)生的有關危險因素,對為了探討冠心病發(fā)生的有關危險因素,對26例冠心病病人和例冠心病病人和28例對照者進行病例例對照者進行病例 對照研究,各對照研究,各因素的說明及資料見表因素的說明及資料見表16-2和表和表16-3。試用。試用logistic 逐逐步回歸分析方法篩選危險因素。步回歸分析方法篩選危險因素。)15. 0,10. 0(出入392

11、2表表16-2 冠心病冠心病8個可能的危險因素與賦值個可能的危險因素與賦值3923序號 X1 X2 X3 X4 X5 X6 X7 X8 Y 1 3 1 0 1 0 0 1 1 0 2 2 0 1 1 0 0 1 0 0 3 2 1 0 1 0 0 1 0 0 4 2 0 0 1 0 0 1 0 0 5 3 0 0 1 0 1 1 1 0 6 3 0 1 1 0 0 2 1 0 7 2 0 1 0 0 0 1 0 0 8 3 0 1 1 1 0 1 0 0 9 2 0 0 0 0 0 1 1 0 10 1 0 0 1 0 0 1 0 0 . . . . . . . . . . . . . . .

12、 . . . . . . . . . . . . . . . 51 2 0 1 1 0 1 2 1 1 52 2 1 1 1 0 0 2 1 1 53 2 1 0 1 0 0 1 1 1 54 3 1 1 0 1 0 3 1 1 表表16-3 冠心病危險因素的病例冠心病危險因素的病例 對照調查資料對照調查資料 3924 表表16-4 例例16-2進入方程中的自變量及有關參數(shù)的估計值進入方程中的自變量及有關參數(shù)的估計值 選入 變量 回歸系 數(shù) b 標準誤 bS Wald 2 P 值 標準回歸 系數(shù) b OR 常數(shù)項 -4.705 1.543 9.30 0.0023 - - X1 0.924 0.

13、477 3.76 0.0525 0.401 2.52 X5 1.496 0.744 4.04 0.0443 0.406 4.46 X6 3.136 1.249 6.30 0.0121 0.703 23.00 X8 1.947 0.847 5.29 0.0215 0.523 7.01 學會看結果!學會看結果!3925 最終進入 logistic 回歸模型的危險因素有4 個,它們分別是年齡增高)(1X、高血脂史)(5X、 動物脂肪攝入量)(6X和 A 型性格)(8X。 標準回歸系數(shù)3/jjjSbb可以用來比較各因素的相對重要性,jS為變量jX的標準差,=3.1416。 3926配對資料。最常用的是

14、每組中有一個病例和若干個對照, 即 1: M 配對研究(一般) 3M。 一、原理 第二節(jié) 條件logistic回歸 3927表表16-5 1: M 條件條件logistic回歸數(shù)據(jù)的格式回歸數(shù)據(jù)的格式 * t = 0 為病例,其他為對照 3928條件 logistic 模型0112211 exp (.)iimmPXXX 1,2, iniP 表示第 i 層在一組危險因素作用下發(fā)病的概率, i0 表示各層的效應,m,21 為待估計的參數(shù)。 與非條件 logistic 回歸模型不同之處在常數(shù)項上,不同匹配組的i0可以各不相同,但內在假定了每個危險因素的致病能力在不同匹配組中相同。 3929二、應用實

15、例例16-3 某北方城市研究喉癌發(fā)病的危險因素, 用1:2配對的病例對照研究方法進行了調查?,F(xiàn)選取了6 個可能的危險因素并節(jié)錄25對數(shù)據(jù), 各因素的賦值說明見表16-6,資料列于表16-7。試作條件logistic 逐步回歸分析。 表16-6 喉癌的危險因素與賦值說明 因素 變量名 賦值說明 咽炎 X1 無=1, 偶爾=2, 經(jīng)常=3 吸煙量(支/日) X2 0=1, 14=2, 59=3, 1020=4, 20=5 聲嘶史 X3 無=1, 偶爾=2, 經(jīng)常=3 攝食新鮮蔬菜 X4 少=1, 經(jīng)常=2, 每天=3 攝食水果 X5 很少=1, 少量=2, 經(jīng)常=3 癌癥家族史 X6 無=0, 有

16、=1 是否患喉癌 Y 病例=1, 對照=0 )15. 0,10. 0(出入3930表表16-7 喉癌喉癌1:2配對病例配對病例 對照調查資料整理表對照調查資料整理表 P344:3931表16-8 例16-3進入方程中的自變量及有關參數(shù)的估計值 選入的 4 個危險因素分別為吸煙量)(2X、 有聲嘶史)(3X、 是否經(jīng)常攝食新鮮蔬菜)(4X及癌癥家族史)(6X,其中攝食新鮮蔬菜為保護因素)0(4b。 采用逐步法 6個危險因素 變量篩選 4個進方程,結果見表16-9。 選選入入變變量量 回回歸歸系系數(shù)數(shù) b 標標準準誤誤 Sb Wald2 RO P 值值 X2 1.4869 0.5506 7.29

17、4.42 0.0069 X3 1.9166 0.9444 4.12 6.80 0.0424 X4 3.7641 1.8251 4.25 0.02 0.0392 X6 3.6321 1.8657 3.79 37.79 0.0516 3932一、logistic回歸的應用1流行病學危險因素分析 logistic回歸分析的特點之一是參數(shù)意義清楚,即得到某一因素的回歸系數(shù)后,可以很快估計出這一因素在不同水平下的優(yōu)勢比或近似相對危險度,因此非常適合于流行病學研究。logistic回歸既適合于隊列研究(cohort study),也適合于病例-對照研究(case-control study),同樣還可以用

18、于斷面研究(cross-sectional study)第三節(jié) logistic回歸的應用及其注意事項39332臨床試驗數(shù)據(jù)分析 臨床試驗的目的大多是為了評價某種藥物或治療方法的效果,如果有其他影響效果的非處理因素(如年齡、病情等)在試驗組和對照組中分布不均衡,就有可能夸大或掩蓋試驗組的治療效果。 盡管在分組時要求按隨機化原則分配,但由于樣本含量有限,非處理因素在試驗組和對照組內的分布仍有可能不均衡,需要在分析階段對構成混雜的非處理因素進行調整。當評價指標為二值變量時(如有效和無效),可以利用logistic回歸分析得到調整后的藥物評價結果。對于按分層設計的臨床試驗可以用相同的方法對分層因素進

19、行調整和分析。39343分析藥物或毒物的劑量反應 在一些藥物或毒物效價的劑量-反應實驗研究中,每一只動物藥物耐受量可能有很大的不同,不同劑量使動物發(fā)生“陽性反應”的概率分布常呈正偏態(tài),將劑量取對數(shù)后則概率分布接近正態(tài)分布。由于正態(tài)分布函數(shù)與logistic分布函數(shù)十分接近,如果用P表示在劑量為X時的陽性率,可用下述模型表示它們之間的關系)ln(exp110XP用這一模型可以求出任一劑量的陽性反應率用這一模型可以求出任一劑量的陽性反應率傳統(tǒng)的一些方法往往對實驗設計有嚴格的要求,如劑量按等比級傳統(tǒng)的一些方法往往對實驗設計有嚴格的要求,如劑量按等比級數(shù)排列,各劑量組的例數(shù)必須相同等數(shù)排列,各劑量組的例數(shù)必須相同等, 采用采用logistic回歸的方法則回歸的方法則沒有這些限制。沒有這些限制。 39354預測與判別 logistic回歸是一個概率型模型,因此可以利用它預測某事件發(fā)生的概率。例如在臨床上可以

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內容里面會有圖紙預覽,若沒有圖紙預覽就沒有圖紙。
  • 4. 未經(jīng)權益所有人同意不得將文件中的內容挪作商業(yè)或盈利用途。
  • 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內容的表現(xiàn)方式做保護處理,對用戶上傳分享的文檔內容本身不做任何修改或編輯,并不能對任何下載內容負責。
  • 6. 下載文件中如有侵權或不適當內容,請與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

最新文檔

評論

0/150

提交評論