T-CI 189-2023 疾病預(yù)測模型技術(shù)規(guī)范_第1頁
T-CI 189-2023 疾病預(yù)測模型技術(shù)規(guī)范_第2頁
T-CI 189-2023 疾病預(yù)測模型技術(shù)規(guī)范_第3頁
T-CI 189-2023 疾病預(yù)測模型技術(shù)規(guī)范_第4頁
T-CI 189-2023 疾病預(yù)測模型技術(shù)規(guī)范_第5頁
已閱讀5頁,還剩4頁未讀, 繼續(xù)免費閱讀

下載本文檔

版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進行舉報或認領(lǐng)

文檔簡介

學(xué)兔兔www.bzfxw.com標準下載ICS

11.020學(xué)兔兔www.bzfxw.com標準下載CCS

C

04 T/CI

189—2023疾病預(yù)測模型技術(shù)規(guī)范Technical

specifications

models

發(fā)布

實施 發(fā)

布學(xué)兔兔www.bzfxw.com標準下載T/CI

—2023學(xué)兔兔www.bzfxw.com標準下載 前言

.................................................................................

II1

...............................................................................

12 規(guī)范性引用文件

.....................................................................

13 術(shù)語和定義

.........................................................................

14 疾病預(yù)測模型構(gòu)建步驟

...............................................................

2研究問題提出

...................................................................

2研究設(shè)計和數(shù)據(jù)質(zhì)控

.............................................................

2預(yù)測因子編碼

...................................................................

2模型構(gòu)建

.......................................................................

3參數(shù)估計

.......................................................................

3模型評價

.......................................................................

3模型驗證

.......................................................................

3模型展示

.......................................................................

45 模型性能的評價指標

.................................................................

4概述

...........................................................................

4全局校準

.....................................................................

4斜率校準

.....................................................................

4

統(tǒng)計量......................................................................

5決策曲線

.....................................................................

5參考文獻

..............................................................................

6學(xué)兔兔www.bzfxw.com標準下載T/CI

—2023學(xué)兔兔www.bzfxw.com標準下載 本文件按照GB/T

—《標準化工作導(dǎo)則 第1部分:標準化文件的結(jié)構(gòu)和起草規(guī)則》的規(guī)定起草。請注意本文件的某些內(nèi)容可能涉及專利。本文件的發(fā)布機構(gòu)不承擔(dān)識別專利的責(zé)任。本文件由山東大學(xué)提出。本文件由中國國際科技促進會歸口??涤邢薰?、浪潮軟件集團有限公司。 毅、屈 靜、張 健、高 培、張清華、孫振棟、高傳貴。II學(xué)兔兔www.bzfxw.com標準下載T/CI

—2023學(xué)兔兔www.bzfxw.com標準下載1 范圍本文件確立了疾病預(yù)測模型構(gòu)建的過程和步驟,給出了衡量模型性能的多維度評價指標。本文件適用于疾病預(yù)測模型的構(gòu)建、評價與改進。2 規(guī)范性引用文件本文件沒有規(guī)范性引用文件。3 術(shù)語和定義下列術(shù)語和定義適用于本文件。研究設(shè)計

study

為構(gòu)建疾病預(yù)測模型而涉及的隊列研究設(shè)計。疾病預(yù)測模型

prediction

model記、環(huán)境因素等)來預(yù)測個體在未來某一時期內(nèi)患某種疾病的概率。預(yù)測因子

predictor可干預(yù)因子。隊列數(shù)據(jù)

data通過隊列研究設(shè)計所獲得的數(shù)值變量和分類變量的觀察值。疾病風(fēng)險

risk通過疾病預(yù)測模型所預(yù)測的結(jié)局發(fā)生的可能性。人群平均基準風(fēng)險

baseline

hazard在人群隊列中隨訪觀察到一定時期內(nèi)(如510年等)各年齡別發(fā)病率(或發(fā)病密度),可代表同性別同年齡的人群期內(nèi)發(fā)生某種健康/疾病結(jié)局的平均風(fēng)險水平。絕對風(fēng)險

absolute

risk具備某特定危險因素集的某個體在年齡α?xí)r未發(fā)生所研究的結(jié)局(如腦卒中)而在年齡(α+τ)時段內(nèi)發(fā)生該結(jié)局的概率,其中τ是人為規(guī)定的隨訪時間。crude

cumulative

risk相對絕對風(fēng)險

relative

absolute

risk體的絕對風(fēng)險是同年齡組所有人的平均絕對風(fēng)險的倍數(shù)。超額絕對風(fēng)險

absolute

risk險)之差,以反映每個個體的絕對風(fēng)險與同年齡組所有人的平均絕對風(fēng)險的差。學(xué)兔兔www.bzfxw.com標準下載T/CI

—2023學(xué)兔兔www.bzfxw.com標準下載競爭風(fēng)險

competing

risk性結(jié)局(如死亡等)。內(nèi)部有效性

internal

validity在研究預(yù)測模型的樣本中,能夠在完全相同的研究過程中復(fù)現(xiàn)研究結(jié)果的程度。外部有效性

external

validity預(yù)測模型類推到目標人群的有效性(普遍適應(yīng)性)。結(jié)局

預(yù)測因子(3.3)通過預(yù)測模型所預(yù)測的結(jié)局,以絕對風(fēng)險形式顯示。列線圖

alignment

各個變量之間的相對權(quán)重大小,同時為使用者提供簡潔的風(fēng)險計算方式。也稱諾莫圖(Nomogram)。校準度

calibration實際發(fā)生風(fēng)險的一致程度。4 疾病預(yù)測模型構(gòu)建步驟研究問題提出4.1.1 首先應(yīng)確定研究問題,即對結(jié)局和對應(yīng)預(yù)測因子的選擇。對預(yù)測因子的選擇應(yīng)具有可干預(yù)性、科學(xué)性、可行性、效益性。4.1.2 預(yù)測因子的選擇,應(yīng)由臨床專家和統(tǒng)計學(xué)專家共同商定。4.1.3 4.1.4 建模樣本的選擇,根據(jù)不同的研究設(shè)計,如隊列研究設(shè)計、巢式病例對照研究設(shè)計等,選擇相應(yīng)的研究對象,并計算樣本量。4.1.5 若使用既往臨床試驗的歷史數(shù)據(jù),也可為建立模型提供數(shù)據(jù)。4.1.6 在樣本的選擇中,根據(jù)實際情況選擇采用合適的抽樣方法,如整群抽樣、簡單隨機抽樣、復(fù)雜抽樣等。研究設(shè)計和數(shù)據(jù)質(zhì)控4.2.1 例對照研究設(shè)計。4.2.2 疾病預(yù)測模型應(yīng)使用隊列數(shù)據(jù),而不是橫斷面數(shù)據(jù)。4.2.3 數(shù)據(jù)集應(yīng)拆分為訓(xùn)練隊列數(shù)據(jù)集、驗證隊列數(shù)據(jù)集,訓(xùn)練隊列數(shù)據(jù)集用于模型訓(xùn)練,驗證隊列數(shù)據(jù)集用于模型的評估和調(diào)優(yōu)。4.2.4 應(yīng)對隊列數(shù)據(jù)進行質(zhì)量控制,包括數(shù)據(jù)測量的準確性,以及對數(shù)據(jù)的預(yù)處理,比如離群值、缺失值、不平衡和共線性等問題的處理。預(yù)測因子編碼預(yù)測因子的編碼應(yīng)從以下方面考慮:學(xué)兔兔www.bzfxw.com標準下載T/CI

—2023學(xué)兔兔www.bzfxw.com標準下載a)

候選預(yù)測因子宜包括人口統(tǒng)計學(xué)特征、臨床病史、體格檢查、疾病特征、實驗室結(jié)果以及既往的治療方法和基因組生物標記等。除了年齡和性別等不可干預(yù)的預(yù)測因子,盡量選擇具有臨床意義且可干預(yù)的指標作為預(yù)測因子;b)

應(yīng)首選因果鏈上的指標作為候選預(yù)測因子,且離結(jié)局越近的指標,預(yù)測效果越好;c)

分類變量和數(shù)值變量都可以作為預(yù)測因子,根據(jù)臨床需要選擇數(shù)值變量或者將數(shù)值變量轉(zhuǎn)化為分類變量;d)

對于預(yù)測因子的缺失數(shù)據(jù),要慎用統(tǒng)計學(xué)填補法,建議采用不確定性推理。模型構(gòu)建4.4.1 預(yù)測因子選擇在模型構(gòu)建之前應(yīng)選擇合適的預(yù)測因子,宜根據(jù)需求遵從以下幾個方面確定納入模型的預(yù)測因子:a)

根據(jù)現(xiàn)有的醫(yī)學(xué)文獻篩選預(yù)測因子;b)

單因素分析篩選預(yù)測因子;c)

多因素分析篩選預(yù)測因子;d)

根據(jù)臨床實際需要篩選預(yù)測因子;e)

對于預(yù)測因子篩選,高維數(shù)據(jù)宜用

lasso

回歸,低維數(shù)據(jù)宜用向后逐步回歸;f)

在保證預(yù)測效果前提下,納入的預(yù)測因子越少越好。4.4.2 模型選擇根據(jù)研究目的及研究設(shè)計選擇合適的模型,應(yīng)從以下方面考慮:a)

在保證預(yù)測效果的前提下,盡量選擇簡單的預(yù)測方法而非復(fù)雜的預(yù)測方法;b)

因素加權(quán)模型等)、生存機器學(xué)習(xí)模型(生存隨機森林模型等)、不確定推理模型(貝葉斯網(wǎng)絡(luò)等)等;c)

當(dāng)存在競爭風(fēng)險時,應(yīng)選擇競爭風(fēng)險模型(如原因別競爭風(fēng)險模型、部分分布競爭風(fēng)險模型等),以消除競爭風(fēng)險對結(jié)局預(yù)測的影響;d)

各種模型均有其特定的建模假設(shè),選擇模型時應(yīng)考慮隊列數(shù)據(jù)是否符合模型假設(shè)。例如,模型的等比例風(fēng)險假設(shè)等。參數(shù)估計模型確定之后,應(yīng)對模型參數(shù)進行估計,即估計模型的回歸系數(shù)。對于logistic回歸模型和Cox等比例風(fēng)險回歸模型,通常用似然方法估計系數(shù)。模型評價對于一個被提議的模型,研究人員應(yīng)確定其預(yù)測能力。應(yīng)從模型校準(全局校準(A、斜率校準(B5.3))、C統(tǒng)計量(C以及決策曲線(DABCD標。評價指標參考本文件第5模型驗證4.7.1 概述于內(nèi)部驗證。4.7.2 內(nèi)部有效性內(nèi)部有效性指模型的ABCD叉驗證、重采樣等驗證方法來評估。4.7.3 外部有效性學(xué)兔兔www.bzfxw.com標準下載T/CI

—2023學(xué)兔兔www.bzfxw.com標準下載外部有效性指模型的ABCD證)、來自其他地區(qū)的樣本(空間驗證)或在差異較大的環(huán)境下(強外部驗證)來評估。模型展示4.8.1 概述支持。宜選擇列線圖、風(fēng)險映射圖、打分卡等方式。4.8.2 列線圖列線圖的繪制應(yīng)遵循以下要求:a)

將模型中的多個預(yù)測指標整合,采用刻度線段,按一定比例繪制在同一平面上,以表達預(yù)測模型中各個變量之間的相對權(quán)重大??;b)

根據(jù)預(yù)測模型中各個預(yù)測因子對結(jié)局的貢獻程度,給每個預(yù)測因子的每個取值水平進行賦分,再將各個評分相加得到總評分,最后通過總評分與結(jié)局事件發(fā)生概率之間的函數(shù)轉(zhuǎn)換關(guān)系,計算出個體結(jié)局事件的風(fēng)險預(yù)測值。4.8.3 風(fēng)險映射圖風(fēng)險映射圖的繪制應(yīng)遵循以下要求:a)

繪制各年齡組人群的基準風(fēng)險圖,以人群平均基準風(fēng)險為界,將其劃分為高低風(fēng)險人群;b)

個體絕對風(fēng)險映射到基準風(fēng)險圖,計算相對絕對風(fēng)險、超額絕對風(fēng)險和個體相對絕對風(fēng)險。5 模型性能的評價指標概述模型性能的評價標準包括模型校準(全局校準、斜率校準)、C統(tǒng)計量和決策分析曲線,其中模型校準用于評估模型的預(yù)測概率與觀測結(jié)果的一致性,C統(tǒng)計量用于評估分類模型的性能,決策曲線用于際應(yīng)用中做出決策。A:全局校準即Alpha校準(Alpha

calibration-in-the-large),校準度是評估預(yù)測的概率與實際觀察到的概10橫坐標XY???險(R)。校準曲線公式如下:??

=

??

+?????(1)式中:R

——實際觀察到的結(jié)局發(fā)生的概率;A

——截距(Alpha);B

——斜率(Beta);???

——預(yù)測結(jié)局發(fā)生的概率。參考線是R=???,即A=0,B

預(yù)測風(fēng)險與實際風(fēng)險完全重合。AA行比較。因此,該參數(shù)表明預(yù)測值系統(tǒng)地過低或過高的程度。當(dāng)A接近于0時,預(yù)測模型的校準良好。B:斜率校準zfxw學(xué)兔兔www.b.com標準下載??

=

??TP

?

??????zfxw學(xué)兔兔www.b.com標準下載??

=

??TP

?

??????

×

1?????????

(2)即Beta校準(Beta

calibration

slope),B為校準曲線斜率。如果預(yù)測風(fēng)險大于實際風(fēng)險,即高估B小于1線在參考線以上,即B1。當(dāng)B接近于1時,模型預(yù)測的校準良好。C:C

統(tǒng)計量C統(tǒng)計量(Concordance

statistic),C統(tǒng)計量用來衡量模型的判別度,也稱為區(qū)分度。區(qū)分度是指作為區(qū)分度衡量指標。C-indexC-index計算方法為所有樣本對子中預(yù)測結(jié)果與實際結(jié)果一致的對子所占的比例,C=(一致對子數(shù)/對子數(shù))。等于ROC曲線下面積。曲線中,預(yù)測發(fā)病與不發(fā)病的最優(yōu)界值處于保持高特異度時靈敏度最高點對應(yīng)的發(fā)病風(fēng)險預(yù)測值。CCCC靠,模型效果越好。點估計宜遵從以下原則:a)

AUC、

值域在

,當(dāng)其取值為

時說明該模型沒有預(yù)測作用;b)

AUC、

在為較低準確度;c)

AUC、

在之間為中等準確度;d)

AUC、

高于

0.90

則為高準確度。D:決策曲線決策曲線分析(Decision-curve

analysis),評估預(yù)測模型的臨床獲益。用預(yù)測模型指導(dǎo)診療決策(不治療)或高風(fēng)險(需要治療)益進行量化時,宜考慮一個閾值范圍。確定閾值概率應(yīng)平衡獲益和風(fēng)險。與曲線確定的

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負責(zé)。
  • 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔(dān)用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

評論

0/150

提交評論