版權說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權,請進行舉報或認領
文檔簡介
1、Ainy 晴生存分析知識總結一、生存分析G基本概念生存分析是將事件G結果和出現(xiàn)此結果所經(jīng)歷G時間結合起來分析G統(tǒng)計分析方法。研究生存現(xiàn)象和響應時間數(shù)據(jù)及其統(tǒng)計規(guī)律G一門學科。對一個或多個非負隨機變量(生存時間)進行統(tǒng)計分析研究。對生存時間進行分析和推斷,研究生存時間和結局與眾多影響因素間關系 及其程度G統(tǒng)計分析方法。在綜合考慮相關因素(內(nèi)因和外因)G基礎上,對涉及生物學、醫(yī) 學(臨床、流行?。?、工程(可靠性)、保險精算學、公共衛(wèi)生學、社會學和人口學(老齡問題、 犯罪、婚姻)、經(jīng)濟學(市場學)等領域中,與事件(死亡,疾病發(fā)生、發(fā)展和緩解,失效,狀 態(tài)持續(xù))發(fā)生G時間(也叫壽命、存活時間或失效時間
2、,統(tǒng)稱生存時間)有關G問題提供相關 G統(tǒng)計規(guī)律G分析與推斷方法G學科。生存時間也叫壽命、存活時間、失效時間等等。比如:醫(yī)學上包括疾病發(fā)生時間、治療后 疾病復發(fā)時間;可靠性工程系為元件或系統(tǒng)失效時間;犯罪學方面是重罪犯人G假釋時間;社 會學上指首次婚姻持續(xù)時間;人口學上包括母乳喂養(yǎng)新生兒斷奶時間;經(jīng)濟學包括經(jīng)濟危機爆 發(fā)時間、發(fā)行債券G違約時間;保險精算學包括保險人G索賠時間、保險公司某一索賠中所付 保費;汽車工業(yè)包括汽車車輪轉(zhuǎn)數(shù);市場學中有報紙和雜志G篇幅和訂閱費。這些也可以說明, 生存時間可以不是具體G時間。二、生存分析G歷史生存分析方法最早可上溯至十九世紀G死亡壽命表。現(xiàn)代G生存分析則開始
3、于二十世紀三 十年代工業(yè)科學中G相關應用。二次世界大戰(zhàn)時期,武器裝備G可靠性研究,這一研究興趣延續(xù)到戰(zhàn)后。此時生存分析都 集中在參數(shù)模型。二十世紀六七十年代,醫(yī)學研究中大量臨床試驗G出現(xiàn),要求方法學有新G 突破,導致了生存分析G研究開始轉(zhuǎn)向非參數(shù)方法。D.R. Cox在72年提出G比例風險模型為此做出了劃時代G貢獻?,F(xiàn)在,生存分析方法G在醫(yī)學領域得到了廣泛G應用,而通過醫(yī)學研究要求G不斷提高, 這一方法也得到了飛速G發(fā)展。三、生存分析G研究目內(nèi)容和具體方法(一)研究目G主要由以下五個方面.描述生存過程:估計不同時間G總體生存率,計算中位生存期,繪制生存函數(shù)曲線。統(tǒng)計方 法包括 Kaplan-M
4、eier ( K-M )法、壽命表法。.比較:比較不同處理組G生存率,如比較不同療法治療腦瘤G生存率,以了解哪種治療方案 較優(yōu)。統(tǒng)計方法log-rank檢驗等。.影響因素分析:研究某個或某些因素對生存率或生存時間G影響作用。如為改善腦瘤病人G 預后,應了解影響病人預后G主要因素,包括病人G年齡、性別、病程、腫瘤分期、治療方案Ainy 晴Ainy 晴.統(tǒng)計方法Cox比例風險回歸模型等。.預測:建立 Cox回歸預測模型。 (二)主要研究內(nèi)容描述生存過程研究人群生存狀態(tài)G規(guī)律研究生存率曲線G變動趨勢是人壽保險業(yè)G基礎生存過程影響因素分析及結局預測識別與反應、生存及疾病等相關風險因素預測生存結局在臨床
5、中應用G非常廣泛(三)主要分析方法.參數(shù)法方法:首先要求觀察G生存時間t服從某一特定G分布,采用估計分布中參數(shù)G方法獲得生存率G估計值。生存時間G分布可能為指數(shù)分布、Weibull分布、對數(shù)正態(tài)分布等,這些分布曲線都有相應G生存率函數(shù)形式。只需求得相應參數(shù)G估計值,即可獲得生存率G估計值 和生存曲線。.非參數(shù)方法:實際工作中,多數(shù)生存時間G分布不符合上述所指G分布,就不宜用參數(shù)法進 行分析,應當用非參數(shù)法。這類方法G檢驗假設與以往所學G非參數(shù)法一樣,假設兩組或多組 G總體生存率曲線分布相同,而不論總體G分布形式和參數(shù)如何。非參數(shù)法是隨訪資料G常用分析方法。.半?yún)?shù)方法:只規(guī)定了影響因素和生存狀
6、況間G關系,但是沒有對時間(和風險函數(shù))G分 布情況加以限定。這種方法主要用于分析生存率G影響因素,屬多因素分析方法,其典型方法 是Cox比例風險模型。生存分析G典型G統(tǒng)計軟件主要有SAS、SPSS Stata、Excel、R。四、生存分析數(shù)據(jù)G數(shù)據(jù)類型(一)完全數(shù)據(jù)每個個體確切G生產(chǎn)時間都是知道G。這樣G數(shù)據(jù)稱為完全數(shù)據(jù)。但在實際G生存分析中,數(shù)據(jù)在很多情況下是很難完全觀察到O。(二)刪失生存數(shù)據(jù)一個重要G特點是:在研究結束時,無法獲得某些個體確切G生存時間。例如:失去聯(lián)系(病人搬走,電話號碼改變);無法觀察到結局(死于其他原因);研究截止,個體仍然存活;獲得G數(shù)據(jù)就是刪失數(shù)據(jù);對存在刪失G
7、個體,只知道刪失時間。刪失分為右刪失、左刪失和區(qū)間刪失.右刪失是指,在進行觀察或調(diào)查時,一個個體G確切生存時間不知道,而只知道其生存 時間大于時間L,則稱該個體G生存時間在L上是右刪失并稱 L為右刪失數(shù)據(jù)。右刪失有三種類型(按結束時間差別): I型刪失Ainy 晴Ainy 晴對所有個體G觀察停止在一個固定G時間,這種刪失即為I型刪失(或定時刪失)。例如:動物研究通常是以有固定數(shù)目G動物接受一種或多種處理開始,由于時間和費用G限制,研究者常常不能等到所有動物死亡。一種選擇就是在一個固定時間周期內(nèi)觀察,在截止時間之 后仍可能有些動物活著,但不繼續(xù)觀察了。這些動物G生存時間是不知道只知其不小于研 究
8、周期時間。I型刪失G刪失時間是固定內(nèi)。II型刪失同時對n個個體進行觀察,一直到有一固定數(shù)目( r n) G個體死亡(失效)為止,這種 刪失即為II型刪失。II型刪失G刪失時間是隨機內(nèi)。III型刪失所有個體在不同時間進入研究,某些個體在研究結束之前死亡,他們G確切生存時間是知 道其他個體在研究結束之前退出研究而不被跟蹤觀察或在研究結束時仍然活著。進入研究 G時間可能不同,刪失時間也可能不同,這種刪失叫做III型刪失,又稱為隨機刪失。.左刪失研究對象在時刻t開始接受觀察,而在此之前我們感興趣G時間已經(jīng)發(fā)生,這就是左刪失。例如:“您初次吸食大麻是在什么時候?”有一種回答:“我吸食過,但我不記得吸食G
9、具體時間了。這些回答G吸食時間數(shù)據(jù)就是左刪失;通過測試確定兒童學會完成特定任務G年齡,有些兒童在進入研究前就已經(jīng)可以完成某項特定任務,這些兒童G事件發(fā)生時間也是左刪失;出現(xiàn)左刪失同時,也可能出現(xiàn)右刪失,稱為雙刪失( Double censoring ) o例如:對吸食大麻G問卷 還有一種回答:“我從來沒有吸食過”,這樣G數(shù)據(jù)就是右刪失;.區(qū)間刪失若個體G確切生存時間不知道,只知道其生存時間在兩個觀察時間L和R之間(LR),則稱該個體G生存時間在 L,R上是區(qū)間刪失內(nèi)。實際工作中,凡是不能或者不愿作連續(xù)監(jiān)測時 就會遇到這樣G區(qū)間刪失。區(qū)間刪失分兩種:第一類區(qū)間刪失;第二類區(qū)間刪失。區(qū)間刪失,當對
10、個體只進行一次觀察,且個體G確切生存時間不知道,只知道其生存時間是否大于觀察時間(即 L=0或R=oo),這種刪失稱為第一類區(qū)間刪失,也稱為現(xiàn)實狀況數(shù)據(jù)當對個體進行兩次觀察,其觀察時間L和R滿足0 L R 笛時,這種刪失稱為第二類區(qū)間刪失,也稱為一般區(qū)間刪失,如果初始時間(如艾滋病感染時間)和發(fā)生時間均為區(qū)間刪失, 則稱生存時間為雙重區(qū)間刪失。(三)截斷在研究或者觀測中,淘汰了一些對象(樣本),使得研究者“意識不到他們G存在”。對截斷數(shù)據(jù)G分析構造似然采用條件分布。截斷包括兩種:左截斷和右截斷。.左截斷只有個體經(jīng)歷某種初始事件以后才能觀察到其生存時間,稱為左截斷,此時獲得G數(shù)據(jù)稱Ainy 晴A
11、iny 晴為左截斷數(shù)據(jù)例如:暴露于某疾病、發(fā)生死亡前G中間事件等。退休中心老年居民死亡時間(沒到年齡沒有進入觀測)左截斷與左刪失G區(qū)別:在左截斷G研究中,根本沒有考慮那些在進入研究之前已經(jīng)經(jīng)歷 了感興趣時間G個體,而在左刪失G研究中,我們能獲得這些個體G部分信息。即有左截斷又存在右刪失G情況,稱為左截斷右刪失.右截斷只有經(jīng)歷了某種終止事件才能觀察到生存時間(將要經(jīng)歷該事件G個體不包含在實驗樣本中),稱為右截斷,此時獲得G數(shù)據(jù)稱為右截斷數(shù)據(jù)。例如:對艾滋病感染和發(fā)病時間觀測數(shù)據(jù),有些個體感染病毒但尚未發(fā)病,這樣G個體不在樣本范圍之內(nèi)截斷G數(shù)學表示:設 Y是一個非負G表示生存時間G隨機變量;T是另
12、外一個表示截斷時間G隨機變量。在左截斷下,只有當 Y2T時,才能觀察到T和Y;在左截斷下,只有當 丫 T時,才能觀察到T和Y;五、生存分析G基本函數(shù)和模型(一)生存函數(shù)描述生存時間統(tǒng)計特征G基本函數(shù),也叫生存率(Survival Rate)設T表示生存時間,F(xiàn)(t)為T分布函數(shù),生存函數(shù)定義為S(t)= P(T t) =1 -F(t), 0 t :二二生存函數(shù)是非增函數(shù),滿足S(0 ) =lim S(x) =1; S(+二)=lim S(x) =0 x-0 -x 舉:當生存時間為連續(xù)型隨機變量時:S(t); P(T t) =1 -F = f(u)dutf(t) =-S(t)=dS(t)dt(二
13、)危險率函數(shù): 描述觀察個體在某時刻存活條件下,在以后G單位時間內(nèi)死亡G (條件)概率。P(T t h|T -t) ,(t)= lim .Lh)0h當 T連續(xù) Mt) =f (t)/S(t) =-dlnS(t)/dtAiny 晴Ainy 晴當T離散,取值為 ai a2 III,且f (ai) = P(T =a), i =1,2川則a處的危險率為i =P(T |T =f(a)S(ay)S(ay)-S(ai)S(ai)=1-坐Li =1,2,|HSQ)1 1S工“沙“骨)迅(1- i)危險率函數(shù)在工程上叫做失效率函數(shù)或損壞函數(shù),在生存分析和醫(yī)學統(tǒng)計中又稱為風險率 函數(shù)或瞬時死亡率、或死亡強度、或條
14、件死亡率、或年齡死亡率等。(三)累計危險率函數(shù)t累積危險率函數(shù):上-(u)du0t當 T 連續(xù) S(t) =expA(t) =expJK(u)du0上(t) = -lnS(t)當T離散時,危險率函數(shù)有兩種定義形式:A(t)= %和A(t)= ln(1-%)i|ai空舊i如果;的值很小,兩種定義形式的值接近(四)平均剩余壽命函數(shù)(s -t) f (s)dsr(t) = E(T -t|T t)=S(t)平均剩余壽命函數(shù)定義為:r(0)為平均壽命(五)常用G參數(shù)模型 生存時間G分布一般不呈正態(tài)分布。常用G分布有:指數(shù)分布威布爾(Weibull)分布伽瑪(Gamma)分布 對數(shù)羅吉斯蒂(logisti
15、c)分布對數(shù)正態(tài)分布六、風險回歸模型設(t;x) =lim P(t 0r(t,x)稱為相對風險。(t)為基準風險函數(shù)。x為協(xié)變量Ainy 晴Ainy 晴取 r(t,x)=expZ(t)即得 Cox model(t;x)= o(t)expZ(t)其中:Z(t)=乙(t)|,Zp(t)為協(xié)變量x和t的函數(shù)0(t)=(t|x) =(0,|l|,0)一:=(fIM;p)為未知的回歸參數(shù)Relative risk model (Cox model)expZ(t)P為參數(shù)部分P =(Pi|,Pp)為未知參數(shù)%(t)為非參數(shù)部分,未知基準函數(shù)因此,相對風險模型為半?yún)?shù)模型在Cox模型下:生存時間的分布函數(shù)為
16、S(t;x)=P(T t|x)t=exp-Y0(u)expZ(u) du0密度函數(shù)為:f (t;x) = (t;x)F(t;x)比例風險模型當Zt)=Z時,即協(xié)變量不依賴時間變化Mt;x) =%(t)expZB止匕時r(t, x) =expZ P為常數(shù)。故稱為比例風險模型。在風險比例模型下exp(Z:)S(t;x) =S0(t)tS0(t) =exp 1%(u)du為基準生存函數(shù)。tt這是因為:A(t;x)= pu;x)du = 1% (u)exp( Z P)du=Ao exp(Z P) 00故:S(t;x); exp-(t;x): exp(- 0(t)exp(Z ) = S0(t)exp(Z)相對風險模型參數(shù)估計基本方法:偏似然(partial likelihood )偏似然G定義:Ainy
溫馨提示
- 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權益歸上傳用戶所有。
- 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預覽,若沒有圖紙預覽就沒有圖紙。
- 4. 未經(jīng)權益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
- 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負責。
- 6. 下載文件中如有侵權或不適當內(nèi)容,請與我們聯(lián)系,我們立即糾正。
- 7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。
最新文檔
- 部編版三年級下冊語文表格式全冊教案及全套導學案
- 安全生產(chǎn)管理制度
- 環(huán)境微生物的表征與生物降解
- 高一化學本章測評:專題化學科學與人類文明
- 2024屆上海市華師大二附中高考化學一模試卷含解析
- 規(guī)范對液化石油氣供應站瓶庫建筑的設計要求
- 2024高中地理第五章區(qū)際聯(lián)系與區(qū)域協(xié)調(diào)發(fā)展整合提升精練含解析新人教必修3
- 2024高中生物專題4生物技術的安全性和倫理問題3禁止生物武器達標訓練含解析新人教版選修3
- 2024高中語文第三單元現(xiàn)當代散文第8課小狗包弟課時作業(yè)含解析新人教版必修1
- 2024高考地理一輪復習第十七章第3講旅游規(guī)劃和環(huán)境保護教案含解析新人教版
- 內(nèi)部調(diào)查與舉報制度
- 《賣火柴的小女孩》公開課一等獎創(chuàng)新教學設計(共兩課時)
- 山東省東營市(2024年-2025年小學四年級語文)統(tǒng)編版期末考試(上學期)試卷及答案
- 青島版數(shù)學五年級上冊解方程練習200道及答案
- 調(diào)研報告量化評分表
- 農(nóng)產(chǎn)品推廣合同協(xié)議書
- 冀教版五年級上冊小數(shù)乘法豎式計算題200道及答案
- 工程機械租賃服務方案
- 水利安全生產(chǎn)風險防控“六項機制”右江模式經(jīng)驗分享
- 《電力設備典型消防規(guī)程》(DL 5027-2015)宣貫
- 2023年山西普通高中會考信息技術真題及答案
評論
0/150
提交評論