研究生醫(yī)學(xué)統(tǒng)計學(xué)-生存分析_第1頁
研究生醫(yī)學(xué)統(tǒng)計學(xué)-生存分析_第2頁
研究生醫(yī)學(xué)統(tǒng)計學(xué)-生存分析_第3頁
研究生醫(yī)學(xué)統(tǒng)計學(xué)-生存分析_第4頁
研究生醫(yī)學(xué)統(tǒng)計學(xué)-生存分析_第5頁
已閱讀5頁,還剩39頁未讀, 繼續(xù)免費閱讀

下載本文檔

版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進行舉報或認領(lǐng)

文檔簡介

生存分析的目的1.估計:根據(jù)樣本生存資料估計總體生存率及其他有關(guān)指標

(如中位生存期)等。2.比較:對不同組生存率進行比較。3.影響因素分析:為探索和了解影響生存時間長短的因素,或平衡某些因素后,研究某個或某些因素對生存的影響。4.預(yù)測:對具有不同因素、不同水平的個體進行生存預(yù)測。第一節(jié)生存時間資料的特點第二節(jié)小樣本生存率的kaplan-Meier估計第三節(jié)大樣本生存率的壽命表法估計第四節(jié)生存曲線比較的假設(shè)檢驗

第一節(jié)生存時間資料的特點一、數(shù)據(jù)結(jié)構(gòu)二、統(tǒng)計描述指標三、資料要求

一、數(shù)據(jù)結(jié)構(gòu)

在臨床醫(yī)學(xué)中,對病人療效考查:治療結(jié)局?生存時間?

“生存時間”的概念

開始事件終點事件

生物生存死亡

生存時間電腦開始使用正常出現(xiàn)故障疾病產(chǎn)生治愈疾病治愈復(fù)發(fā)陰性陽性 生存時間的三個要點

一、起始事件二、終點事件三、生存時間

醫(yī)學(xué)例子:起始事件

隨訪時間

終點事件

疾病確診 死亡治療開始 死亡 治療開始痊愈 接觸危險物出現(xiàn)反應(yīng)

治愈出院復(fù)發(fā) 廣義的“生存時間”也可為醫(yī)療費用(元)、醫(yī)療設(shè)備使用次數(shù)、車輛行駛總里程(公里)等

隨訪(follow-up)資料的記錄生存資料一般通過隨訪收集,記錄的項目:(起始與終止)隨訪事件生存時間(開始觀察日期與終止觀察日期)(年、月、天、小時、分、秒等)分組變量(處理方法)和其它協(xié)變量(性別、年齡、職業(yè)、文化程度等)月份(2000年)圖12-1生存時間原始記錄示意("+"截尾)天數(shù)圖12-2生存時間排序整理數(shù)據(jù)示意01167生存時間資料的特點

2個效應(yīng)變量(1)生存時間(天數(shù)),(2)結(jié)局(死亡與否、是否陽性等)刪失(截尾)數(shù)據(jù):在規(guī)定的觀察期內(nèi),對某些觀察對象由于某種原因未能觀察到死亡結(jié)局,并不知道確切的生存時間,稱為生存時間的刪失數(shù)據(jù)(censoreddata)。如表12-1中的1號和3號病人未觀察到底,不知他們究竟能活多長時間。產(chǎn)生結(jié)尾原因:(1)遷移(2)死于其他原因

(3)因其他客觀原因中途退出(4)研究結(jié)束時終點事件尚未發(fā)生分布類型復(fù)雜:生存時間分布不服從正態(tài)分布,常常呈正偏態(tài)分布、Weibull分布、Gamma分布或更為復(fù)雜的分布,因此要用特殊的統(tǒng)計方法。

2個效應(yīng)變量(1)生存時間(天數(shù)),(2)結(jié)局(死亡與否、是否陽性等)錯誤1:忽略生存時間,采用Logistic回歸分析死亡率錯誤2:忽略結(jié)局,采用t檢驗、線性回歸分析生存時間得不到確切的生存時間,但它們提供的生存時間長于觀察期的時間,這種數(shù)據(jù)為不完全數(shù)據(jù)?;蚪匚矓?shù)據(jù)、刪失數(shù)據(jù)或終檢值。(如有確切的生存時間,則這種數(shù)據(jù)稱為完全數(shù)據(jù)。)兩種錯誤的做法:錯誤1:丟棄截尾數(shù)據(jù),只考慮確切數(shù)據(jù)。(損失了信息)錯誤2:將截尾數(shù)據(jù)當(dāng)作確切數(shù)據(jù)處理。(低估了生存時間的平均水平)。截尾(刪失)數(shù)據(jù)或終檢值(censoreddata)

兩種錯誤的做法:錯誤1:采用平均生存時間而不是采用中位生存時間來表示生存時間的平均水平。錯誤2:采用常規(guī)t檢驗或方差分析進行組間比較。(應(yīng)采用log-rank檢驗比較幾組生存時間

)正偏態(tài)(positiveskewness)數(shù)據(jù)二、生存分析的統(tǒng)計描述指標1.死亡概率、生存概率2.生存率及其標準誤3.半數(shù)生存期(中位數(shù))及四分位數(shù)間距[例1]手術(shù)治療60例肺癌病人,術(shù)后每年死亡10例,無刪失。試求基本生存分析指標。N=60;術(shù)后年內(nèi)年內(nèi)年初年死亡死亡生存(t+1)年年死亡截尾觀察平均率概率概率生存率數(shù)例數(shù)例數(shù)例數(shù)例數(shù)p=1-q

tdcn0

n=no-d/2m=d/nq=d/n0

(n0-d)/n0

(n0-d)/N(1)(2)(3)(4)(5)(6)(7)(8)(9)

0~1006055.181.167.833.8331~1005045.222.200.800.6672~1004035.286.250.750.5003~1003025.400.333.667.3334~1002015.667.500.500.167

1.死亡率、死亡概率、生存概率(1)死亡率(mortalityrate,deathrate)

表示某單位時間內(nèi)的死亡強度。

年平均人口數(shù)=(年初人口數(shù)+年末人口數(shù))/2(2)死亡概率(mortalityprobability)

是指單位時段開始時存活的個體到該時段結(jié)束時死亡的可能性,即死于某時段t~t+n內(nèi)的概率。

=d/n0

年內(nèi)有刪失,分母用校正人口數(shù):校正人口數(shù)=年初人口數(shù)—刪失例數(shù)/2

=n0-c/2

(3)生存概率(survivalprobability)

指某單位時段開始時存活的個體到該時段結(jié)束時仍存活的可能性的大小。

=(n0-d)/n0

分子為年末尚存人數(shù),若年內(nèi)有刪失,分母用校正人口數(shù)。生存率(survivalrate)(累積生存概率cumulativeprobabilityofsurvival)

指病人經(jīng)歷t個單位時間后仍存活的概率。

生存概率指單個時段的概率,生存率指從0~t多個時段的積累概率。

2.生存率及其標準誤

生存率與生存概率僅一字之差,含義卻是不同的。生存概率是針對單位時間而言的,生存率是針對某個較長時間段的,它是生存概率的累積結(jié)果。如評價腫瘤預(yù)后常用的5年生存率,是指第1年存活、第2年也存活,……,直至第5年仍存活的累積概率,而這5年間每1年有不同的生存概率。

如數(shù)據(jù)中無刪失,生存率可用下式計算

如果有刪失數(shù)據(jù),則需分時段計算不同單位時間的生存概率Pi(i=1,2,…,t),然后利用概率乘法原理將Pi相乘得到t時刻生存率。

S(t)=P(T≥tk

)=p1p2…pk

例如手術(shù)治療50例肺癌病人,術(shù)后1,2,3年的死亡數(shù)分別為10,10,10例,無截尾數(shù)據(jù)。試求各年的生存概率和3年生存率。解:各年生存概率p1=(50–10)/50,

p2=(40–10)/40,

p3=(30–10)/303年生存率

S(3)=P(T≥3)=(n0-d)/N=(50–30)/50=0.4000

或S(3)=p1p2p3=0.4000生存率的標準誤

生存率置信區(qū)間

生存曲線以生存時間為橫軸,生存率為縱軸繪制的曲線

(a)研究終止在475天(b)研究終止在474天圖12-3乘積極限法生存曲線(階梯形)及其半數(shù)生存期(Md=158天)圖12-4壽命表法生存曲線(折線)及其半數(shù)生存期(Md=1.7年)生存曲線給我們的信息階梯狀;每一級階梯代表一個死亡時間點(在截尾時間點無階梯);如果最大時間點是截尾則生存曲線不與曲線相交(見下圖),否則與橫軸相交。DeathCensoredMedianSurvival1.8Years生存曲線給我們的信息3.半數(shù)生存期及四分位數(shù)間距半數(shù)生存期也稱中位生存期(mediansurvivaltime),即生存時間中位數(shù),表示恰好有50%的個體活過此時間,即生存率為50%時對應(yīng)的生存時間(集中趨勢指標)。其數(shù)值可借助生存曲線進行粗略的圖表法估計,或用線性內(nèi)插法求解精確的數(shù)值。刪失數(shù)據(jù)超過樣本量的50%時,無法估計中位生存時間。此時較為實際的做法是使用生存時間超過一給定時間長度的概率(如3年生存率或5年生存率)生存期的四分位數(shù)間距=t25-t75,反映離散程度大小三、資料的基本要求1.死亡例數(shù)(或死亡比例)不宜太少,否則宜出現(xiàn)偏性;2.截尾原因無偏性;3.生存時間盡可能記錄精確

生存率估計常用的兩種方法:

1.乘積極限法,即kaplan-Meier法(小樣本時)2.壽命表法(大樣本時)

第二節(jié)小樣本生存率的kaplan-Meier估計

乘積極限法(product-limitmethod)又稱Kaplan-Meier法,由Kaplan和Meier于1958年提出

,主要針對小樣本資料,也可用于大樣本,是一種非參數(shù)方法。基本思想:將生存時間由小到大依次排列,在每個死亡點上,計算其期初人數(shù)、死亡人數(shù)、死亡概率、生存概率和生存率。

11名接受“手術(shù)+化療”治療的乳腺癌患者的生存時間:10,14,15,16+,19,19,20,20+,24,26,28序號時間(月)死亡數(shù)刪失數(shù)期初例數(shù)生存概率生存率標準誤itidiciniPi=(ni-di)/niS(ti)SE(S(ti))110101110/11=0.90910.90910.086721410109/10=0.90000.81820.11633151098/9=0.88890.72730.1343416+0188/8=1.00000.727307=0.71430.519505=0.80000.41560.1562720+0144/4=1.00000.415603=0.66670.277102=0.50000.13850.124510281010/1=0.00000.0000-------

(a)研究終止在475天(b)研究終止在474天圖12-3乘積極限法生存曲線(階梯形)及其半數(shù)生存期(Md=158天)00第三節(jié)大樣本生存率的壽命表法估計

壽命表法(life-tablemethod)的應(yīng)用早于Kaplan-Meier法,它是Kaplan-Meier法的近似方法(頻數(shù)表法)

圖12-4壽命表法生存曲線(折線)及其半數(shù)生存期(Md=1.7年)壽命表法只估計時段右端點的生存率,省略了時段內(nèi)的生存率估計第四節(jié)生存曲線比較的假設(shè)檢驗Logrank(時序)檢驗(也稱為Cox-Mantel檢驗)

Breslo

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負責(zé)。
  • 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔(dān)用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

評論

0/150

提交評論