生存分析 統(tǒng)計學_第1頁
生存分析 統(tǒng)計學_第2頁
生存分析 統(tǒng)計學_第3頁
生存分析 統(tǒng)計學_第4頁
生存分析 統(tǒng)計學_第5頁
已閱讀5頁,還剩74頁未讀, 繼續(xù)免費閱讀

下載本文檔

版權說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權,請進行舉報或認領

文檔簡介

1、復習、Logistic回歸模型為概率模型,適合于病例對照研究、隨訪研究和橫斷面研究,結果變量的取值應分為二分或多項分類。 影響結果變量產(chǎn)生的因素可以建立自變量和因素變量的回歸公式。 復習,1.Logistic回歸分析的數(shù)據(jù)結構2.Logistic回歸分析的模型3 .篩選變量的常用方法4.Logistic回歸分析的結果說明,目的:在多個參數(shù)(影響因素)中變形量(結果變量) 建立logistic回歸方程的估計資料:1.應變量是一種現(xiàn)象的發(fā)生和不發(fā)生的二值變量2 .自變量(影響因素)可能是二值數(shù)據(jù)或等級數(shù)據(jù)或計量數(shù)據(jù)。 分類變量量化的用途:研究某些疾病和現(xiàn)象的發(fā)生與多個危險因子(或保護因子)的數(shù)量關

2、系,1.Logistic回歸模型的數(shù)據(jù)結構,假設資料中有一個因素變量y,p個參數(shù)X1,X2,Xp,每個被實驗者有n次觀測結果,表示原始資料5、表1.Logistic回歸模型的數(shù)據(jù)結構實驗對象yx 1x2x3. XP 1y1a 11a 12 a13 p2y2a 22 a 23 a2p 3y3a 31a 33 a3 pny nan1an2an3np, 表2 .肺癌和危險因素的調(diào)查分析例子編號是否生病性別吸煙年齡地區(qū)10103002001461310035130100261疾?。?1為no,0為性別: 1為男性,0為女性吸煙: 1為吸煙,0為非吸煙地區(qū): 1為農(nóng)村,0為城市表3 .配對資料(1:1

3、x1x2x 311301203113012030120202525252525252525252525252525252525252525252525252525252525252525252 25352535253525353525353535353535353535353535353535353535353535353535353令: Y=1發(fā)病(陽性、死亡、治愈等) Y=0未發(fā)病(陰性、陰性然后將參數(shù)x1、x2、xp之間的Logistic回歸模型定義為:定義: Logistic變換,即:2.Logistic回歸模型,3 .篩選變量的常用方法正向后退法設逐次回歸法(stepwisesele

4、ction )、4.Logistic回歸的結果解釋,4.Logistic回歸的結果解釋,第I個要素的回歸系數(shù)為bi,在存在多個參數(shù)的情況下,在其他參數(shù)為一定的情況下,每增加1個單位就得到參數(shù)Xi 即,如果在其它參數(shù)是恒定的情況下,每當參數(shù)Xi增加1個單位,就會影響在變量Y=0處產(chǎn)生的倍數(shù),并且第I個元素的回歸系數(shù)為bi和bi0,則對應的優(yōu)勢比ORi=exp(bi)1與bi0相對應,指示該元素為危險元素說明這一因素是保護因素,宋曼殳公共衛(wèi)生學院傳染病和衛(wèi)生統(tǒng)計系、生存分析、醫(yī)學科學研究的統(tǒng)計學方法、急性疾病的治療效果評價一般可以使用治愈率、病死率等指標,但對于腫瘤、結核及其他慢性疾病,其預后可以

5、在短時間內(nèi)明確地判斷臨床試驗研究通常觀察各對象各時刻事件的發(fā)生情況(結局),評價臨床治療效果。 比較不同治療方法的治療效果時,不僅要考慮有效與否,還要考慮從試驗開始到治療效果出現(xiàn)的時間。 例:假設治療甲乙兩種藥物的病,其治愈率均為80,可以說兩種療效一致,也要考慮時間效果問題,甲藥平均3天治愈80,乙藥平均7天治愈80,甲藥比乙藥治療效果好。 評價18、2種治療方法的好壞,不能簡單地比較治愈率和效率,也能看到結果出現(xiàn)的時間的長短,所以在不包含t檢定和卡方檢定等時間要素的方法中,有必要學習新的方法。 長期隨訪疾病,可以統(tǒng)計一定年限后的生存和死亡情況來判斷治療效果。 這需要“生存分析”。主要內(nèi)容是

6、基本概念生存率估計和生存曲線生存曲線的log-rank檢驗,生存時間:由任意兩個相關事件之間的時間間隔、終點(故障)事件和開始事件之間的時間間隔、常用符號t表示。 廣義的生存時間被定義為從一個開始事件到結束事件的時間寬度。 狹義的生存時間多指患病患者從發(fā)病到死亡的時間范圍,一、基本概念、一、基本概念、生存時間(survivaltime ) :一邊看疾病治療的預后,一邊看結果的好壞,看其結果出現(xiàn)的時間的長度,把經(jīng)歷的時間稱為生存時間開始事件是反映生存時間開始特征的事件,如疾病的確診、某些疾病治療的開始、接觸毒物等,研究設計時需要明確規(guī)定。 終點事件是反映結局特征的事件,也稱為死亡事件、失效事件。

7、 腎移植患者腎功能喪失導致的死亡、急性白血病患者的復發(fā)、癌癥患者的死亡等。 在討論設計時也需要事先明確規(guī)定。 作為生存時間的例子,事件結束事件的治療開始(服藥)病已痊愈的死亡手術切除死亡接觸毒物的反應化療以緩解復發(fā),生存分析(survivalanalysis )是將事件結束事件和該結束事件的經(jīng)過時間結合起來分析的統(tǒng)計分析方法。 在可以分析完整數(shù)據(jù)的資料的同時,包含不完整數(shù)據(jù)的資料的生存分析和其他多因素分析的主要區(qū)別在于生存分析考慮了每觀測一次結局的時間長度。 一、基本概念、生存分析:不完整的數(shù)據(jù)提供了一些信息。 必須用特別的方法進行統(tǒng)計處理。 這種統(tǒng)計方法來源于壽命數(shù)據(jù)的統(tǒng)計分析,因此被稱為生

8、存分析。 生存分析:研究生存時間分布規(guī)律、生存時間與相關因素之間關系的統(tǒng)計分析方法。 主要反映慢性病的指標可以很好地處理不完整的隨訪資料,一方面基本概念、臨床試驗及其隨訪資料特征的一些研究對象可以觀察死亡,得到正確的生存時間,提供的信息稱為完整數(shù)據(jù)(completedata )。 其他一些患者由于失訪、事故或觀察結束時生存等原因,無法知道正確的生存時間,提供不完整的信息,稱為不完整的數(shù)據(jù)(切片數(shù)據(jù)、缺失數(shù)據(jù)censoreddata )。 生存時間的類型,完全數(shù)據(jù)(completedata ) :從起點到死亡(因研究的病死亡)的經(jīng)過時間。 切片數(shù)據(jù)(缺失數(shù)據(jù)、censoreddata ) :從起

9、點到切片點的經(jīng)過時間。 最后原因:失去訪問,死于其他疾病,觀察結束時患者還活著等。 資料收集、生存時間一般通過隨訪收集。 跟進內(nèi)容確定開始跟進的時間(觀察起點)。 例如住院時間、確診時間、開始治療的時間等。 例如乳腺癌:乳腺切除的第一天,出院日白血病:出院日,開始治療的日子。 確診時間、手術時間、治療開始時間、出院時間等比較正確,經(jīng)常作為隨訪開始時間。隨訪結果顯示,死亡,即處理無效,結束時間以“死亡”時間生存,但中途失去訪問,拒絕訪問,或失去聯(lián)系,中途退出考試,其結束時間以最后的訪問時間為基準,因與其他研究疾病無關的原因死亡,如肺癌患者因交通事故等死亡,其隨訪結束的時間是死亡時間隨訪結束,隨訪

10、研究結束時觀察對象生存的結束隨訪時間也是研究結束時間,是影響生存時間的因素(協(xié)變量),如患者的年齡、病程、術前健康狀態(tài)、經(jīng)濟、文化、 為了分析這些因素對生存時間的影響,隨訪方式、觀察對象整體同時受到處理措施,觀察最后一例的出現(xiàn)結果,或觀察事先決定的跟蹤期限時間,圖中的“”表示“死亡”的“o”失去訪問,或退出研究,或涉及本研究隨訪方式、所有觀察對象在不同時間接受治療處理,完成一定數(shù)量的隨訪病例后,決定隨訪期限、在事先規(guī)定的時間中止隨訪是臨床試驗最常見的形式,圖中“死亡”,“o”錯過訪問或脫離研究表示可能因與本研究無關的其他原因死亡,由于切片數(shù)據(jù)的處理對切片數(shù)據(jù)的處理不太好,很多臨床研究者在分析時

11、經(jīng)常廢棄因訪問或中止等原因引起的切片數(shù)據(jù)。 最后數(shù)據(jù)提供的信息雖然不完整,但有價值,不能輕易刪除。 例如:某研究者追蹤了100名患者治療后的生存狀況,第一年有30人死亡,第三年有20人死亡,40人失去訪問(退出觀察),10人生存。 估計生存率。 表4刪除切片數(shù)據(jù)時不刪除切片數(shù)據(jù)時切片數(shù)據(jù)n=60n=100生存數(shù)生存率1年3030/60=50p70/100=70%3年1010/60=13、跟蹤記錄表、跟蹤資料記錄的項目通常是小組、觀察開始日表4.9例患者的隨訪記錄病號性別開始日的結束日最終是1男08/31/8210/31/89死亡手術2男08/31/8208/28/86訪問非手術3女10/30/

12、8303/31/90死亡非手術4男12/01/8410/01/87 88死亡手術6男07/01/8510/01/88死亡手術7人男08/31/8712/30/90生存手術8人女07/11/8612/17/90死亡手術9人男08/31/8610/01/90死亡非手術nsextimeoutcometreat 1171123061041310506131713018041191410,表6 .膀胱腫瘤患者生存資料變量代入表,表7.6例膀胱腫瘤患者生存資料原始記錄表,生存分析的主要內(nèi)容, 第一,描述生存過程研究生存時間的分布特征,估計生存率、生存曲線;比較生存過程(假設檢測),比較兩組或多組生存率;分

13、析影響生存時間的因素,理解影響生存過程的因素,為改善預后提供指導。 例子記載在資料中,癌癥患者5人(n=5)的生存時間(月):610142020平均生存時間: mean=18、median=14、782535有截止日期數(shù)據(jù)的情況? “死亡概率”是指在某個時間段內(nèi)死亡的可能性的大小。 如果某一年內(nèi)死亡人數(shù)q某一年年初的人口數(shù)在年內(nèi)減少的話,用分母校正的人口數(shù):人口數(shù)年初人口數(shù)的1/2的減少數(shù),2,生存資料經(jīng)常計算的數(shù)量的比率,死亡概率是已經(jīng)在t時刻生存的個體,之后一段時間(從t開始)可能會死亡。 關于死亡概率的計算式,從t開始內(nèi)有截斷值,上述式的死亡概率也低,可以調(diào)整分母,短時,瞬時、死亡概率被

14、稱為t時刻的瞬時死亡概率,或被稱為危險函數(shù)(hazardfunction,h(t ) ),剛在t時刻生存的個體在t時刻死亡的概率生存概率(survivalprobability )表示在某單位期間開始生存的個體在該期間結束之前生存的可能性的大小,記為p。年生存概率的計算公式是,如果某年人數(shù)p年年初的人口數(shù)在年內(nèi)消失,分母校正人口數(shù)。 如果t到t期間有截斷值,還必須計算并調(diào)整生存概率生存概率與死亡概率的關系:p=1-q,生存率與生存函數(shù)、累積生存概率、簡稱生存率。 以S(t )為任意時刻t的生存率,t為生存期間,得到S(t)=P(Tt)0t,S(t )稱為生存率函數(shù),簡稱為生存率函數(shù),三、生存率

15、推定(記述),醫(yī)學研究中的生存資料分布多為不規(guī)則、不確定或未知的分布,所以用非參數(shù)法推定生存率根據(jù)樣品含量的大小,簡稱為1 .積分限制法(小樣品的情況)2.壽命表法(大樣品的情況)、1 .積分限制法Product-limitmethod、積分限制法或PL法,使用概率乘法原理直接推算生存率,是統(tǒng)計學家Kaplan和me 基本思想:把生存時間(包括切片數(shù)據(jù))按升序排列,對其中每個死亡點推算死亡概率、生存概率和生存率。 適用條件:數(shù)據(jù)數(shù)量少的情況。 Kaplan-Meier法計算生存率,該方法在計算生存率時,按每個個體的生存時間從小到大的順序排列,排序時如果截止值和非截止值的觀察時間相同,則指定比截

16、止值小的截止值,并排列在截止值之前。 然后,依次計算各時間段的死亡概率、生存概率,再計算從觀察開始到各時刻的生存率及其基準錯誤。 有研究人員分析了肺癌患者嗜酸性粒細胞(EC )陽性和陰性患者的生存情況,26名EC陰性和35名EC陽性患者的生存時間數(shù)據(jù)如下,計算兩組患者的生存率。 在26名EC陰性患者的觀察期內(nèi)死亡,其生存月數(shù)分別在0.3、1、2、2、3、4、4、6、6、7、7、8、8、11、12、12、14、18、21、2435名EC陽性患者的觀察期內(nèi)死亡28人生存月數(shù)分別為4、4、4、5、5、8、9、9、9、10、11、12、12、13、14、16、16、17、19、20、22、23、24、

17、26、26、30、32、36、36、36 計算順序*患者按生存時間從小到大排列排序。 數(shù)各時間段開始觀察時的病例數(shù)。 例如,第三列。 寫下各期間的死亡例數(shù),因為截止值沒有因病死亡,全部以0計算。 計算各期間的死亡概率q,得到第五列。 用公式p=1-q計算各時間段的生存概率,獲得第6列,6 .計算從患者的觀察到各時刻t為止的生存率S(t )。 從觀察開始到某個時刻的生存率是到此為止的各階段的生存概率的積,根據(jù)式,將第1行的生存率S(T4)=P1=32/35=0.914286行的生存率s (t5)=p1p2=32/3530/32=0. 857143,7 .各生存率的標準誤差說明采樣誤差的大小,式中的n是樣品含量,I是等級,表8.kalan-meier法計算生存率,0.857143,例如第2行和第9行,有截斷值的情況(12 ),計算sp(T13 )的情況下為1/(n-15 ) (n 表8.kalan-meier法計算生存率,0.857143樣本生存分析Kaplan-Meier方法在S

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預覽,若沒有圖紙預覽就沒有圖紙。
  • 4. 未經(jīng)權益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負責。
  • 6. 下載文件中如有侵權或不適當內(nèi)容,請與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

評論

0/150

提交評論