




版權(quán)說(shuō)明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請(qǐng)進(jìn)行舉報(bào)或認(rèn)領(lǐng)
文檔簡(jiǎn)介
1、2021年胸部CT肺結(jié)節(jié)數(shù)據(jù)集構(gòu)建及質(zhì)量控制專家共識(shí)(全文)摘要基于人工智能的肺結(jié)節(jié)輔助診斷、輔助檢測(cè)對(duì)于肺癌早期篩查具有重 要意義。由于當(dāng)前產(chǎn)品通常采用監(jiān)督學(xué)習(xí),研發(fā)與測(cè)試過程需要高質(zhì) 量的胸部CT肺結(jié)節(jié)數(shù)據(jù)集。目前,此類數(shù)據(jù)集的構(gòu)建和質(zhì)量控制尚 未建立具體的技術(shù)規(guī)范,業(yè)內(nèi)處于探索階段。隨舂人工智能醫(yī)療器械 標(biāo)準(zhǔn)化的推進(jìn),關(guān)于數(shù)據(jù)集通用要求的標(biāo)準(zhǔn)正在起草。為促進(jìn)產(chǎn)業(yè)發(fā) 展、推進(jìn)標(biāo)準(zhǔn)化進(jìn)程,本文以訓(xùn)練集為案例,提出了胸部CT肺結(jié)節(jié) 數(shù)據(jù)集的構(gòu)建流程,包括數(shù)據(jù)采集、數(shù)據(jù)標(biāo)注等環(huán)節(jié)。同時(shí),本文解 釋了該類數(shù)據(jù)集質(zhì)量特性的表現(xiàn)形式,提供了質(zhì)量控制思路。本文旨 在為數(shù)據(jù)集制造責(zé)任方提供參考路線,保障數(shù)
2、據(jù)資源的有序供給,促 進(jìn)肺結(jié)節(jié)人工智能產(chǎn)品的硏發(fā)生產(chǎn)。近年來(lái),國(guó)內(nèi)外多種人工智能(artificial intelligence , Al )算法致 力于解決肺結(jié)節(jié)檢出、分類、分割等熱點(diǎn)問題,輔助醫(yī)師快速精準(zhǔn)地 發(fā)現(xiàn)并診斷肺結(jié)節(jié),從而對(duì)肺結(jié)節(jié)的早期發(fā)現(xiàn)、早期診斷、早期治療 提供輔助解決方案。由于目前的AI輔助診斷、輔助檢測(cè)大多采用監(jiān)督學(xué)習(xí),產(chǎn)品的研發(fā)、 測(cè)試、質(zhì)量控制均需依托大量的標(biāo)準(zhǔn)檢查病例,因此監(jiān)管機(jī)構(gòu)、醫(yī)院、 企業(yè)、教育科研機(jī)構(gòu)等相關(guān)方(后稱數(shù)據(jù)集制造責(zé)任方)均在積極建 設(shè)胸部CT肺結(jié)節(jié)數(shù)據(jù)集(以下簡(jiǎn)稱為數(shù)據(jù)集),從而對(duì)肺結(jié)節(jié)AI產(chǎn) 品硏發(fā)上下游需求形成支撐,以促進(jìn)臨床使用。目前國(guó)際公認(rèn)
3、、開放 的胸部影像公共數(shù)據(jù)集為肺部圖像數(shù)據(jù)庫(kù)聯(lián)盟數(shù)據(jù)集(the lung image database consortium and image database resource initiative , LIDC-IDRI )。但這些數(shù)據(jù)庫(kù)的肺結(jié)節(jié)均偏大,且以實(shí)性 結(jié)節(jié)為主,而我國(guó)肺部磨玻璃結(jié)節(jié)的檢出率明顯高于國(guó)外,故這些國(guó) 外公共數(shù)據(jù)庫(kù)難以代表我國(guó)人群肺結(jié)節(jié)的分布特征和結(jié)構(gòu)特征。目前 國(guó)內(nèi)數(shù)據(jù)集的發(fā)展還處于各自為戰(zhàn)的狀態(tài),且數(shù)據(jù)質(zhì)量參差不齊, 容易影響產(chǎn)品質(zhì)量,甚至帶來(lái)風(fēng)險(xiǎn)。因此,數(shù)據(jù)集的建設(shè)需要科學(xué)引 導(dǎo),質(zhì)量和風(fēng)險(xiǎn)控制顯得尤為重要。為規(guī)范AI醫(yī)療器械使用的數(shù)據(jù)集質(zhì)量,我國(guó)起草了醫(yī)療器
4、械行業(yè)標(biāo)準(zhǔn) 人工智能醫(yī)療器械質(zhì)量要求和評(píng)價(jià)第2部分:數(shù)據(jù)集通用要求, 已經(jīng)進(jìn)入報(bào)批階段。為了指導(dǎo)包括肺結(jié)節(jié)輔助診斷、輔助檢測(cè)產(chǎn)品在 內(nèi)的AI醫(yī)療器械的審評(píng)審批,國(guó)家藥品監(jiān)督管理局醫(yī)療器械技術(shù)審評(píng) 中心發(fā)布了深度學(xué)習(xí)輔助決策醫(yī)療器械軟件審評(píng)要點(diǎn)以及肺炎 CT影像輔助分診與評(píng)估軟件審評(píng)要點(diǎn)(試行)等技術(shù)指導(dǎo)文件。在 此背景下,本文以肺結(jié)節(jié)數(shù)據(jù)集構(gòu)建及質(zhì)量評(píng)價(jià)的具體問題為導(dǎo)向, 以封閉式訓(xùn)練數(shù)據(jù)集為例提出指導(dǎo)意見,對(duì)于肺結(jié)節(jié)AI產(chǎn)品相關(guān)的數(shù) 據(jù)集建設(shè)和質(zhì)量管理給予示范及引導(dǎo),有助于全社會(huì)有序挖掘醫(yī)學(xué)數(shù) 據(jù)資源,促進(jìn)AI產(chǎn)業(yè)協(xié)調(diào)發(fā)展。數(shù)據(jù)集描述()數(shù)據(jù)集基本信息 參考衛(wèi)生信息數(shù)據(jù)集元數(shù)據(jù)規(guī)范的定義方式
5、,本文將胸 部CT肺結(jié)節(jié)數(shù)據(jù)集定義為:以胸部CT肺結(jié)節(jié)為主題, 可以標(biāo)識(shí)并可以被計(jì)算機(jī)化處理的數(shù)據(jù)集合。根據(jù)醫(yī)療器 械行業(yè)標(biāo)準(zhǔn)人工智能醫(yī)療器械質(zhì)量要求和評(píng)價(jià)第2部分: 數(shù)據(jù)集通用要求的征求意見稿,數(shù)據(jù)集按照預(yù)期用途、 數(shù)據(jù)來(lái)源、用戶類型、訪問管理方式、更新形式等維度, 可分為不同類型。數(shù)據(jù)集建設(shè)者需要預(yù)先明確數(shù)據(jù)集的類 型,因?yàn)樗谀撤N程度上決定了數(shù)據(jù)集建設(shè)、管理的嚴(yán)格 程度。本文所討論的數(shù)據(jù)集,主要針對(duì)基于私有數(shù)據(jù)構(gòu)建, 用于胸部CT肺結(jié)節(jié)模型訓(xùn)練的自用、封閉、靜態(tài)數(shù)據(jù)集。 自用指的是不提供給其他機(jī)構(gòu)使用。封閉指的是本機(jī)構(gòu)內(nèi) 部封閉,僅供特定人員使用,尤其注意不能與產(chǎn)品的測(cè)試 環(huán)節(jié)存在交叉。
6、對(duì)于該類數(shù)據(jù)集,建議對(duì)數(shù)據(jù)采集、預(yù)處 理、標(biāo)注、存儲(chǔ)、更新等環(huán)節(jié)建立規(guī)程和記錄,進(jìn)行體系 化管理,應(yīng)保證數(shù)據(jù)訪問蹤跡和數(shù)據(jù)變更蹤跡的可審計(jì) 性。訪問數(shù)據(jù)集需要授權(quán),具體權(quán)限分配由數(shù)據(jù)集制造責(zé) 任方自行定義。建議數(shù)據(jù)集在本地存儲(chǔ),采用備份、容災(zāi) 等必要措施,防止數(shù)據(jù)的意外損失。根據(jù)我國(guó)目前臨床需求與AI產(chǎn)品技術(shù)特點(diǎn),本數(shù)據(jù)集的 影像數(shù)據(jù)格式為醫(yī)學(xué)數(shù)字成像和通信(digital imaging and communications in medicine , DICOM ),數(shù)據(jù)來(lái)源包含體檢、門診、住院、急診和科研等不同場(chǎng)合獲取的 真實(shí)受試者圖像,也包括基線掃描、隨訪、預(yù)后等不同階 段的圖像。根據(jù)
7、產(chǎn)品研發(fā)的需要,可采集其他臨床信息, 如病理數(shù)據(jù)、臨床檢驗(yàn)數(shù)據(jù)、基因數(shù)據(jù)等,以配合良惡性 分類、病理亞型分類、基因突變、預(yù)后預(yù)測(cè)等產(chǎn)品預(yù)期用 途的實(shí)現(xiàn)。采集圖像的影像設(shè)備、設(shè)置參數(shù)、對(duì)比劑劑量 能夠代表不同地區(qū)不同條件的實(shí)際水平。本數(shù)據(jù)集適用于 肺結(jié)節(jié)AI產(chǎn)品的訓(xùn)練,產(chǎn)品預(yù)期用途為輔助診斷、輔助 檢測(cè)、輔助測(cè)量、輔助分診等,如對(duì)肺部結(jié)節(jié)進(jìn)行檢出、 分類、分割和定位;對(duì)結(jié)節(jié)最大長(zhǎng)徑進(jìn)行測(cè)量;對(duì)結(jié)節(jié)生 長(zhǎng)速度進(jìn)行測(cè)評(píng);對(duì)CT圖像能夠發(fā)現(xiàn)的其他呼吸系統(tǒng)疾 病或正常組織的變異給出提示;以及多模態(tài)數(shù)據(jù)、組學(xué)數(shù) 據(jù)的融合分析等。肺結(jié)節(jié)數(shù)據(jù)集的標(biāo)注對(duì)象包括肺內(nèi)實(shí)性結(jié)節(jié)、肺內(nèi)亞實(shí)性 結(jié)節(jié)(包括肺內(nèi)混雜磨玻璃密
8、度結(jié)節(jié)、純磨玻璃密度結(jié) 節(jié))、肺內(nèi)鈣化結(jié)節(jié)、胸膜結(jié)節(jié)與胸膜斑塊、胸膜鈣化結(jié) 節(jié)。其中肺內(nèi)實(shí)性結(jié)節(jié)、肺內(nèi)亞實(shí)性結(jié)節(jié)、肺內(nèi)鈣化結(jié)節(jié) 屬于肺結(jié)節(jié),胸膜結(jié)節(jié)與胸膜斑塊、胸膜鈣化結(jié)節(jié)屬于胸 膜病灶。同時(shí),數(shù)據(jù)集制造責(zé)任方可根據(jù)產(chǎn)品預(yù)期使用的 人群、地區(qū)、流行病學(xué)特征,對(duì)其他生理異?;虿∽冞M(jìn)行 標(biāo)注,作為算法訓(xùn)練的標(biāo)簽。肺結(jié)節(jié)訓(xùn)練數(shù)據(jù)集的元數(shù)據(jù)應(yīng)記錄數(shù)據(jù)集名稱、標(biāo)識(shí)符、 數(shù)據(jù)集發(fā)布方、數(shù)據(jù)集語(yǔ)種、數(shù)據(jù)集分類類目名稱、數(shù)據(jù) 集摘要等信息。適當(dāng)時(shí),數(shù)據(jù)集制造責(zé)任方應(yīng)記錄每個(gè)數(shù) 據(jù)集的版本、注冊(cè)機(jī)構(gòu)、分類模式、主管機(jī)構(gòu)。(二)數(shù)據(jù)采集1.倫理批準(zhǔn)與患者隱私保護(hù):肺結(jié)節(jié)胸部CT數(shù)據(jù)集,應(yīng) 使用通過倫理批準(zhǔn)或者豁免
9、的臨床脫敏數(shù)據(jù)。包括原始圖 像,用于統(tǒng)計(jì)用途的年齡、吸煙史、居住地等流行病學(xué)信 息,以及其他相關(guān)的臨床數(shù)據(jù)、信息資料等?;颊叩闹?權(quán)、同意書、補(bǔ)償應(yīng)當(dāng)滿足法規(guī)的要求。2數(shù)據(jù)脫敏、清洗、查重要求:(1 )數(shù)據(jù)脫敏:數(shù)據(jù)脫 敏是保護(hù)患者隱私的技術(shù)手段。圖像本身、頭文件、附屬 文件,以及數(shù)據(jù)集的元數(shù)據(jù)中均不應(yīng)包含與患者隱私有關(guān) 的任何信息;倫理批件或其他官方批件應(yīng)當(dāng)真實(shí)合規(guī)。從 志愿者、體檢中心、社區(qū)篩查項(xiàng)目、科研項(xiàng)目等其他途徑 獲取的圖像應(yīng)當(dāng)通過同等效力的批準(zhǔn)程序保證數(shù)據(jù)脫敏、 患者隱私安全和患者利益?;颊邆€(gè)人信息、醫(yī)保信息、活動(dòng)軌跡、社會(huì)經(jīng)濟(jì)狀況、家 庭情況、財(cái)務(wù)信息等個(gè)人隱私不得搜集和顯示。
10、圖像頭文 件中涉及患者隱私的字段必須進(jìn)行脫敏處理。數(shù)據(jù)的采 集、傳輸、保存和使用必須符合中華人民共和國(guó)網(wǎng)絡(luò)安 全法科技部人類遺傳資源管理辦法和原國(guó)家食品藥 品監(jiān)督管理總局醫(yī)療器械網(wǎng)絡(luò)安全注冊(cè)技術(shù)審查指導(dǎo)原 則等法律法規(guī)的要求。數(shù)據(jù)集制造責(zé)任方應(yīng)解析序列DICOM文件中的標(biāo)簽 (tag),檢查各個(gè)字段并去除敏感信息或隱私信息,尤 其是一些重要的共有字段,例如:機(jī)構(gòu)名稱(Institution Name ) 0x00080080,機(jī)構(gòu)地址(Institution Address ) 0x00080081 ,患者姓名(Patient Name ) 0x00100010 , 患者生日(Patient
11、Birth Date ) 0x00100030,患者地址(Patient Address ) 0x00101040o(2) 清洗:數(shù)據(jù)清洗的目的是對(duì)數(shù)據(jù)進(jìn)行檢查和確認(rèn), 去除不合格數(shù)據(jù),篩選滿足質(zhì)量要求的數(shù)據(jù)。圖像的質(zhì)量 要求一般包括格式的有效性、單個(gè)文件的完整性、序列的 完整性、圖像內(nèi)容的合理性等。例如不符合DICOM標(biāo)準(zhǔn) 的圖像、破損或無(wú)法讀取的圖像、不連續(xù)的圖像序列、與 肺部無(wú)關(guān)的序列都是應(yīng)去除的對(duì)象。數(shù)據(jù)集制造責(zé)任方可 根據(jù)需要,制定更具體的圖像質(zhì)量要求,如峰值信噪比等 指標(biāo)。圖像清洗應(yīng)當(dāng)建立規(guī)程,形成操作記錄。(3) 查重:數(shù)據(jù)查重的目的是保證數(shù)據(jù)的唯一性。圖像 數(shù)據(jù)不應(yīng)與其他公開數(shù)
12、據(jù)集發(fā)生重合;同一批數(shù)據(jù)內(nèi)部不 得出現(xiàn)圖像重合;所有病例應(yīng)當(dāng)真實(shí)唯一。在原始數(shù)據(jù)入 庫(kù)處理的過程中,數(shù)據(jù)集制造責(zé)任方可針對(duì)DCM文件解 析得到序列號(hào)和圖像實(shí)例編號(hào)的tag值,與數(shù)據(jù)集內(nèi)部和 其他公開數(shù)據(jù)集進(jìn)行比對(duì),也可以采用消息摘要算法等其 他信息進(jìn)行比對(duì)。若發(fā)現(xiàn)重復(fù),則對(duì)此部分?jǐn)?shù)據(jù)進(jìn)行記錄 和封存,從數(shù)據(jù)集中排除。3數(shù)據(jù)采集與多樣性要求:數(shù)據(jù)集應(yīng)當(dāng)使用標(biāo)準(zhǔn)DICOM 格式的醫(yī)院原始數(shù)據(jù),圖像矩陣不低于512x512。數(shù)據(jù) 集制造責(zé)任方應(yīng)確保脫敏后原始數(shù)據(jù)的完整性,避免有損 壓縮、篡改圖像等操作。每個(gè)病例的圖像應(yīng)當(dāng)保持連續(xù)完 整,不得出現(xiàn)缺層、錯(cuò)層等情況。每個(gè)病例的掃描范圍至 少?gòu)姆渭獾嚼唠踅?/p>
13、(包括全部肺),不相關(guān)的部位可以刪 除。圖像視野應(yīng)當(dāng)覆蓋整個(gè)肺部橫截面。成像過程應(yīng)當(dāng)符 合相關(guān)臨床規(guī)范和專家共識(shí),患者吸氣末一次屏氣完成掃 描,避免運(yùn)動(dòng)偽影、誤操作等。成像過程使用的設(shè)備應(yīng)當(dāng) 在有效期內(nèi),并做好日常質(zhì)量控制和期間核查。作為訓(xùn)練集,本數(shù)據(jù)集應(yīng)具有充分的多樣性,以提高算法 模型的泛化能力和魯棒性。由于不同地區(qū)、不同的臨床機(jī) 構(gòu)在人群組成、流行病學(xué)特征、數(shù)據(jù)采集設(shè)備、操作等方 面均可能存在差異,為保證數(shù)據(jù)集的多樣性,在數(shù)據(jù)采集 階段需要盡可能地覆蓋到更多具有通用性的統(tǒng)計(jì)維度,同 時(shí)降低數(shù)據(jù)集的覆蓋偏倚。這些維度包括以下。(1 )患者維度:主要應(yīng)考慮患者的年齡、性別、地區(qū)、 習(xí)慣(例如
14、吸煙史)等因素,這些因素與肺癌風(fēng)險(xiǎn)和肺結(jié) 節(jié)的檢出存在聯(lián)系,因此對(duì)于數(shù)據(jù)集的臨床代表性有重要 影響。從操作層面來(lái)說(shuō),數(shù)據(jù)的采集應(yīng)當(dāng)在不同地區(qū)不同 省市選擇有代表性的醫(yī)院。患者人群分布應(yīng)參考流行病學(xué) 統(tǒng)計(jì)進(jìn)行均勻隨機(jī)抽樣或按Zheng等研究(根據(jù)臨床上 高發(fā)年齡段分布,18-45歲抽樣25% , 46-65歲抽樣 50% , 66歲抽樣25% ;性別比為1 : 1 )的形式進(jìn)行分 層抽樣。(2)場(chǎng)所與設(shè)備及數(shù)據(jù)采集技術(shù)標(biāo)準(zhǔn):采集圖像的場(chǎng)所, 應(yīng)考慮體檢、篩查、門診、住院等不同場(chǎng)境。體檢、篩查 病例占總例數(shù)的40% (低劑量平掃CT,吸收劑量5 mSv ),門診、病房病例占總例數(shù)的60% (常規(guī)劑
15、量平掃 或增強(qiáng),吸收劑量1.5 mSv )。設(shè)備方面主要應(yīng)考慮CT制造廠家、CT型號(hào)、同一臺(tái)設(shè)備 的不同成像參數(shù)配置(如層厚、層間距、劑量設(shè)置、重建 算法等),這些因素影響圖像的對(duì)比度、分辨率、信噪比、 細(xì)節(jié)豐富程度等基本參數(shù),同時(shí)也會(huì)影響醫(yī)師的標(biāo)注或讀 片結(jié)論,如對(duì)肺結(jié)節(jié)的檢出、分類、測(cè)量等。從操作層面 來(lái)說(shuō),可以依據(jù)表1的參數(shù)范圍進(jìn)行選擇。(3 )病種維度:即各病種的數(shù)量和比例。作為對(duì)真實(shí)臨 床數(shù)據(jù)的抽樣,數(shù)據(jù)集的數(shù)據(jù)容量決定了抽樣誤差。抽樣 誤差越小,數(shù)據(jù)集越有代表意義。關(guān)于抽樣誤差的計(jì)算, 可以參照原國(guó)家食品藥品監(jiān)督管理總局發(fā)布的醫(yī)療器械 臨床試驗(yàn)設(shè)計(jì)指導(dǎo)原則給出的方法進(jìn)行計(jì)算,在條件
16、允許的情況下盡量提高樣本量。該方法的本意是用于保證臨 床試驗(yàn)的總體容量和各個(gè)病種、子集的容量滿足抽樣誤差 的要求,使臨床試驗(yàn)?zāi)軌驅(qū)τ谡鎸?shí)的靈敏度、特異性等指 標(biāo)進(jìn)行更精確的估計(jì)。根據(jù)醫(yī)療器械臨床試驗(yàn)設(shè)計(jì)指導(dǎo) 原則,對(duì)于統(tǒng)計(jì)分類問題,其評(píng)價(jià)指標(biāo)一般包括靈敏度 和特異度,用靈敏度計(jì)算陽(yáng)性組的樣本量,用特異度計(jì)算 陰性組的樣本。陽(yáng)性組/陰性組樣本量的估算公式為:,其中 /?為陽(yáng)性組/陰性組樣本量,Z1-O/2為標(biāo)準(zhǔn)正態(tài)分布的分位 數(shù),P為靈敏度或特異度的預(yù)期值,為P的允許誤差大 ?。磾?shù)據(jù)集的抽樣誤差),一般取P的95%ci寬度的 半,常用的取值為0.050.10??紤]產(chǎn)品硏發(fā)和學(xué)術(shù)研 究領(lǐng)域?qū)嶋H情
17、況,建議抽樣誤差不超過5%。以上公式適 用于二分類和多分類問題。由于肺結(jié)節(jié)各類型的患病率尚未獲得全國(guó)的流行病學(xué)統(tǒng) 計(jì),數(shù)據(jù)集的建設(shè)可依據(jù)各機(jī)構(gòu)掌握的先驗(yàn)數(shù)據(jù)設(shè)計(jì)病種 的比例,可進(jìn)行均勻隨機(jī)抽樣或按結(jié)節(jié)類型和長(zhǎng)短徑分布 進(jìn)行分層抽樣,并按照表2的形式描述數(shù)據(jù)集實(shí)際的結(jié)節(jié) 分布。4. 數(shù)據(jù)標(biāo)注信息:數(shù)據(jù)標(biāo)注質(zhì)量、標(biāo)注的全面性、標(biāo)注體 系的統(tǒng)一及標(biāo)注過程的質(zhì)量控制體系都會(huì)直接影響到AI 模型的臨床可靠性,而制定出一套科學(xué)的標(biāo)注管理體系既 需要嚴(yán)格的質(zhì)量管理辦法,更需要專家的持續(xù)參與,才能 保證生產(chǎn)出合格的數(shù)據(jù)標(biāo)簽供AI訓(xùn)練。本數(shù)據(jù)集標(biāo)注內(nèi) 容包括胸部CT肺結(jié)節(jié)檢出、分類和分割。具體肺結(jié)節(jié)的 標(biāo)注方法
18、可參考胸部CT肺結(jié)節(jié)數(shù)據(jù)標(biāo)注與質(zhì)量控制專 家共識(shí)(2018)。(三)數(shù)據(jù)樣本溯源信息記錄為了方便數(shù)據(jù)管理、提高樣本的可追溯性,建議對(duì)數(shù)據(jù)樣 本或存放每個(gè)影像序列的文件夾建立唯一標(biāo)識(shí),便于記錄 溯源信息。具體技術(shù)要求可參照醫(yī)療器械行業(yè)標(biāo)準(zhǔn)醫(yī)療 器械唯一標(biāo)識(shí)基本要求。對(duì)單個(gè)影像文件,唯一標(biāo)識(shí)可采用的字段舉例如圖1 ,其 信息應(yīng)與原始文件形成映射關(guān)系,便于檢索和預(yù)覽。當(dāng)數(shù) 據(jù)發(fā)生更新時(shí),二者保持同步。唯一標(biāo)識(shí)的編碼方式應(yīng)當(dāng) 進(jìn)行校驗(yàn),以保證整體或組成部分的正確性。表1胸部CT肺結(jié)節(jié)數(shù)據(jù)采集的設(shè)備與配置項(xiàng)日內(nèi)容層厚與層間距建議圖像涇厚不超過5 rmn 推薦肺結(jié)節(jié)診斷用層殍范田0625J.250 mm.
19、為較準(zhǔn)確地進(jìn)行計(jì)算機(jī)輔助檢5m者何以無(wú)間隔連續(xù)車建:層厚沢mm者蟲建間隔選擇準(zhǔn)宜層厚的,0%亠80%;叭 數(shù)據(jù)集應(yīng)注明薄設(shè)備廠家 探測(cè)器掃描參數(shù) 輻射制址包括但不味T(;Ehiii戶蝕準(zhǔn)能(東芝)、聯(lián)形東軟竽常見廠家且必須符合DIGOM 3.0協(xié)議標(biāo)H 14320 排管電FEC7O-140 kV)、倉(cāng)電流(1 ()“400 mA組合048.() mg也可以使用nvZmGy等找他單位描述劑最。建議掃描時(shí)開臨F扯報(bào)告(后e report) 生成的告送行當(dāng)規(guī)存儲(chǔ)謝寬與宙位推薦肺窗(窗位-700600寬1 5()02 00() H) 縱騙謝(宙位3070 KIL窗寬35O4()O HU);英値稱助讀片
20、例加骨窗蛋建方式采用標(biāo)準(zhǔn)算浚(軟組織算法)或考前算法和標(biāo)準(zhǔn)算淡(軟組織算法)同時(shí)進(jìn)行蟲組(注:在DICOM字段4 子的表述是多沖多樣的數(shù)據(jù)集制造責(zé)任方宜與設(shè)備制進(jìn)商塢認(rèn)兀含義顯示方式建議采用多平面至組及衆(zhòng)大密度投影閱片多平面車紙可多方位顯示肺結(jié)節(jié)的形態(tài)學(xué)待征表2胸部CT肺結(jié)節(jié)數(shù)據(jù)采集實(shí)際的結(jié)節(jié)分類及比例分類比例肺內(nèi)實(shí)性結(jié)節(jié)肺內(nèi)部分實(shí)性結(jié)節(jié)(混雜性腐玻璃密度結(jié)節(jié)) 肺內(nèi)純曆玻璃密度結(jié)節(jié)肺內(nèi)鈣化結(jié)節(jié)胸膜結(jié)節(jié)、胸膜斑塊、唐膜鈣化結(jié)節(jié)無(wú)結(jié)節(jié)30強(qiáng)(結(jié)節(jié)長(zhǎng)徑心mm為10冬結(jié)節(jié)長(zhǎng)徑上6 m阪為: 20強(qiáng)(結(jié)節(jié)長(zhǎng)徑心mm為5%:結(jié)節(jié)長(zhǎng)徑2& mm為1: 2()縮(結(jié)節(jié)長(zhǎng)徑心mm為10%:結(jié)節(jié)長(zhǎng)徑對(duì)mm為 5
21、%5%20瞅無(wú)明顯鼻常10%;苴他病變10倔)注:肺結(jié)節(jié)長(zhǎng)徑定義為結(jié)節(jié)內(nèi)最大橫截面空間最遠(yuǎn)兩點(diǎn)距二、數(shù)據(jù)集質(zhì)量評(píng)價(jià)為保證數(shù)據(jù)集的質(zhì)量,數(shù)據(jù)集制造責(zé)任方應(yīng)對(duì)數(shù)據(jù)集開展 質(zhì)量評(píng)價(jià)和風(fēng)險(xiǎn)分析,形成研究資料,作為后續(xù)管理與使 用的客觀依據(jù),并參考醫(yī)療器械行業(yè)標(biāo)準(zhǔn)人工智能醫(yī)療 器械質(zhì)量要求和評(píng)價(jià)第2部分:數(shù)據(jù)集通用要求(報(bào)批 稿)。具體的質(zhì)量特性與評(píng)價(jià)方式舉例說(shuō)明如下:1. 準(zhǔn)確度:準(zhǔn)確度的字面含義是指樣本符合真值的程度, 在不同的情境下存在多種含義。對(duì)醫(yī)學(xué)影像的溯源而言, 真值包括成像部位的生理解剖結(jié)果、臨床診斷的全標(biāo)準(zhǔn)等 形式;對(duì)數(shù)據(jù)采集活動(dòng)而言,醫(yī)院本地的原始數(shù)據(jù)、記錄、 患者原始的口述等可納入真
22、值的范疇;對(duì)數(shù)據(jù)標(biāo)注活動(dòng)而 言,符合臨床規(guī)范或?qū)<夜沧R(shí)的標(biāo)注結(jié)果、參考標(biāo)準(zhǔn)也可 以看作真值。對(duì)肺結(jié)節(jié)數(shù)據(jù)集而言,醫(yī)學(xué)溯源的限制較多, 例如不能對(duì)所有患者、所有結(jié)節(jié)都進(jìn)行活檢。因此,對(duì)準(zhǔn) 確度的考量需要考慮可行性,關(guān)注過程要素和輔助證據(jù), 例如對(duì)CT設(shè)備的有效性、人員操作的有效性進(jìn)行檢查, 對(duì)影像報(bào)告、檢查報(bào)告、標(biāo)注結(jié)果的正確性、數(shù)據(jù)形式的 合理性進(jìn)行抽查。在條件允許時(shí),可以使用體模對(duì)設(shè)備和 人員操作進(jìn)行過程驗(yàn)證。適當(dāng)時(shí),對(duì)影像標(biāo)注準(zhǔn)確度的抽 查建議由專業(yè)的第三方醫(yī)學(xué)專家團(tuán)隊(duì)進(jìn)行,第三方團(tuán)隊(duì)的 資質(zhì)、從業(yè)年限、檢查流程和分歧處理應(yīng)有明確的要求。 肺結(jié)節(jié)數(shù)據(jù)集的抽樣檢查可以將肺部CT序列作為基本單
23、 元,例如先計(jì)算每個(gè)序列的準(zhǔn)確度,進(jìn)而對(duì)整個(gè)數(shù)據(jù)集的 準(zhǔn)確度進(jìn)行統(tǒng)計(jì)估計(jì),因而適合采用計(jì)量型抽樣檢驗(yàn)方 法。2. 完備性:肺結(jié)節(jié)訓(xùn)練數(shù)據(jù)集應(yīng)包含支持產(chǎn)品訓(xùn)練、滿足 臨床適用場(chǎng)景需要的信息,例如結(jié)節(jié)類型、位置、邊界、 長(zhǎng)短徑,成像設(shè)備型號(hào)、設(shè)備廠家、管電壓、管電流、劑 量等;以及倫理批準(zhǔn)使用的非敏感信息,例如受試者年齡、 性別、良惡性分類、病理亞型分類、基因突變、預(yù)后等。 數(shù)據(jù)集制造責(zé)任方可制定具體的信息列表,對(duì)信息完備性 進(jìn)行抽查。由于每個(gè)肺部CT序列都可以明確其是否具有 完備性,因此可使用計(jì)量型抽樣檢驗(yàn)方法。3. 唯一性:如數(shù)據(jù)清洗部分所述,同一數(shù)據(jù)集內(nèi)的數(shù)據(jù)元 應(yīng)是唯一的,可沿用數(shù)據(jù)查重的
24、方法進(jìn)行評(píng)價(jià)。本部分同 樣適合計(jì)量型抽樣檢驗(yàn)。4. 致性:由于肺結(jié)節(jié)訓(xùn)練數(shù)據(jù)集通常從多個(gè)地區(qū)、不同 機(jī)構(gòu)采集數(shù)據(jù),有必要對(duì)其一致性進(jìn)行考量,防止出現(xiàn)混 亂。一致性可分為內(nèi)部一致性與外部一致性。內(nèi)部一致性 是指相同來(lái)源數(shù)據(jù)之間的相關(guān)性,例如來(lái)自同一醫(yī)院、同 時(shí)段的數(shù)據(jù)在成像參數(shù)、成像設(shè)備等方面的相關(guān)性,也 包括同一個(gè)序列在數(shù)據(jù)清洗、標(biāo)注等各個(gè)環(huán)節(jié)的一致性(保持不變)。外部一致性是指不同來(lái)源的數(shù)據(jù)在某一特 性方面的相關(guān)性,例如來(lái)自不同體檢機(jī)構(gòu)、低劑量的CT 序列應(yīng)具有相似的劑量范圍。一致性的計(jì)算可選擇多種參 數(shù),以受試者為單元,適用計(jì)量型抽樣。5. 確實(shí)性:確實(shí)性的含義是數(shù)據(jù)、元數(shù)據(jù)的真實(shí)可信性。
25、 對(duì)肺結(jié)節(jié)數(shù)據(jù)集而言,肺部生理結(jié)構(gòu)、影像征象、長(zhǎng)短徑、 位置、DICOM字段內(nèi)容應(yīng)符合臨床常識(shí),對(duì)離群值應(yīng)進(jìn) 行排除,例如錯(cuò)誤引入動(dòng)物實(shí)驗(yàn)數(shù)據(jù)、DICOM記錄劑量 的量級(jí)異常等情形。對(duì)確實(shí)性的評(píng)價(jià)可采用計(jì)量型抽樣檢 驗(yàn)。6. 時(shí)效性:從質(zhì)量管理的角度看,數(shù)據(jù)的采集、標(biāo)注、流 轉(zhuǎn)、歸檔、變更等活動(dòng)應(yīng)遵從明確的時(shí)限,以保證數(shù)據(jù)集 符合當(dāng)前的醫(yī)學(xué)認(rèn)知和產(chǎn)品開發(fā)需求,因此時(shí)效性也是數(shù) 據(jù)集建設(shè)的重要指標(biāo)。時(shí)效性的評(píng)價(jià)需要從數(shù)據(jù)集的過程 記錄中提取時(shí)間信息,計(jì)算實(shí)際時(shí)限,其符合性屬于計(jì)數(shù) 型抽樣檢驗(yàn)范疇。7可訪問性:肺結(jié)節(jié)訓(xùn)練數(shù)據(jù)集可被訪問的程度應(yīng)滿足模 型訓(xùn)練的需要和臨床適用范圍??稍L問性的評(píng)價(jià)包括對(duì)
26、數(shù) 據(jù)訪問方式、訪問控制的評(píng)價(jià),以實(shí)際操作為主。例如, 可按照數(shù)據(jù)集制造責(zé)任方的訪問控制策略,嘗試以不同身 份訪問訓(xùn)練集,驗(yàn)證授權(quán)機(jī)制,并且查看允許訪問的信息 量是否能支持算法訓(xùn)練、是否能體現(xiàn)臨床場(chǎng)景。8依從性:依從性指的是數(shù)據(jù)集開發(fā)過程依從于某些技術(shù) 標(biāo)準(zhǔn)、醫(yī)學(xué)規(guī)范、專家共識(shí)、操作規(guī)程等文獻(xiàn)。這些文獻(xiàn) 應(yīng)體現(xiàn)在數(shù)據(jù)集的文檔描述中,因此對(duì)依從性的評(píng)價(jià)需要 對(duì)數(shù)據(jù)集文檔進(jìn)行檢查。9保密性:由于肺結(jié)節(jié)數(shù)據(jù)集來(lái)源于受試者數(shù)據(jù),數(shù)據(jù)集 制造責(zé)任方需要對(duì)數(shù)據(jù)集的保密性負(fù)責(zé),建立必要的機(jī) 制,防止數(shù)據(jù)泄露、數(shù)據(jù)篡改、數(shù)據(jù)丟失等問題的發(fā)生, 形成相關(guān)記錄。對(duì)保密性的評(píng)價(jià)可采用過程驗(yàn)證、文件記 錄審核等方式進(jìn)
27、行。10.資源利用性:資源利用性描述的是數(shù)據(jù)集的用戶調(diào)用 數(shù)據(jù)集的速度,體現(xiàn)了數(shù)據(jù)集作為一種產(chǎn)品對(duì)使用壞境 的要求。資源利用性的評(píng)價(jià)可以采用在數(shù)據(jù)集制造責(zé)任方 規(guī)定的軟硬件與網(wǎng)絡(luò)壞境下,實(shí)際讀取、傳輸數(shù)據(jù)集,驗(yàn) 證操作的時(shí)間。門精度:精度在這里描述的是肺結(jié)節(jié)影像數(shù)據(jù)定量特征、 數(shù)據(jù)集總體定量特征、肺結(jié)節(jié)標(biāo)注結(jié)果等誤差大小的程 度,例如肺結(jié)節(jié)長(zhǎng)短徑測(cè)量的精度可用像素?cái)?shù)或毫米來(lái)表 述。對(duì)精度的驗(yàn)證可以采用比對(duì)試驗(yàn)、工具驗(yàn)證等方式實(shí) 現(xiàn)。12. 可追溯性:可追溯性指的是在肺結(jié)節(jié)數(shù)據(jù)集的全生命 周期,數(shù)據(jù)集制造責(zé)任方宜保證數(shù)據(jù)訪問蹤跡和數(shù)據(jù)變更 蹤跡的可審計(jì)性??勺匪菪缘脑u(píng)價(jià)主要通過對(duì)文檔和記錄 進(jìn)行
28、檢查,如原始數(shù)據(jù)來(lái)源、元數(shù)據(jù)來(lái)源、合規(guī)性證明、 數(shù)據(jù)采集活動(dòng)記錄、標(biāo)注人員選拔與培訓(xùn)記錄、數(shù)據(jù)標(biāo)注 流程記錄、標(biāo)注工具使用記錄等。13. 可理解性:可理解性指的是肺結(jié)節(jié)數(shù)據(jù)集能被授權(quán)用 戶預(yù)覽和解釋的程度,例如能否將肺結(jié)節(jié)標(biāo)注結(jié)果直觀地 呈現(xiàn)在原始圖像上,供用戶理解。對(duì)可理解性的評(píng)價(jià)主要 通過實(shí)際操作進(jìn)行,可能需要數(shù)據(jù)集制造責(zé)任方提供相關(guān) 工具。14. 可得性:可得性指的是數(shù)據(jù)集能被授權(quán)用戶訪問和檢 索的程度,例如數(shù)據(jù)能否復(fù)制粘貼、建立索引、由算法模 型調(diào)用。對(duì)可得性的評(píng)價(jià)同樣通過實(shí)際操作進(jìn)行。15. 可移植性:可移植性指的是數(shù)據(jù)能被存儲(chǔ)、替換或從 個(gè)系統(tǒng)轉(zhuǎn)移到另一個(gè)系統(tǒng)并保持已有質(zhì)量的程度,與數(shù) 據(jù)、元數(shù)據(jù)的存儲(chǔ)格式、編碼有關(guān)。如果數(shù)據(jù)集制造商需 要在不同操作系統(tǒng)、存儲(chǔ)壞境中使用肺結(jié)節(jié)數(shù)據(jù)集,可通 過實(shí)際操作驗(yàn)證數(shù)據(jù)集的可移植性。16. 可恢復(fù)性:從數(shù)據(jù)安全的角度考慮,肺結(jié)節(jié)數(shù)據(jù)集在 使用過程中宜保持質(zhì)量,適當(dāng)時(shí)能夠抵御失效事件,稱為 可恢復(fù)性。對(duì)可恢復(fù)性的評(píng)價(jià)可通過模擬失效事件、實(shí)際 操作驗(yàn)證。17. 代表性:當(dāng)數(shù)據(jù)集建成后,其數(shù)據(jù)特征層次、流行病 學(xué)統(tǒng)計(jì)、樣本來(lái)
溫馨提示
- 1. 本站所有資源如無(wú)特殊說(shuō)明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請(qǐng)下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請(qǐng)聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
- 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁(yè)內(nèi)容里面會(huì)有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
- 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
- 5. 人人文庫(kù)網(wǎng)僅提供信息存儲(chǔ)空間,僅對(duì)用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對(duì)用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對(duì)任何下載內(nèi)容負(fù)責(zé)。
- 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請(qǐng)與我們聯(lián)系,我們立即糾正。
- 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶因使用這些下載資源對(duì)自己和他人造成任何形式的傷害或損失。
最新文檔
- 《數(shù)智時(shí)代下的供應(yīng)鏈管理:理論與實(shí)踐》課件 第五章 供應(yīng)鏈的外包與集成
- 2025年中國(guó)納帕皮革內(nèi)飾行業(yè)市場(chǎng)全景分析及前景機(jī)遇研判報(bào)告
- 肺癌病人圍手術(shù)期的護(hù)理
- 基于鄉(xiāng)村振興背景探索農(nóng)村人才隊(duì)伍的建設(shè)路徑
- 腫瘤進(jìn)修護(hù)士進(jìn)修匯報(bào)
- 心衰病人護(hù)理
- 周末健康膳食規(guī)劃方案
- 車位購(gòu)置與社區(qū)安全保障服務(wù)協(xié)議
- 餐飲設(shè)備租賃及餐飲場(chǎng)所租賃合同
- 特色火鍋店服務(wù)員勞動(dòng)合同范本
- 高中復(fù)讀協(xié)議書
- 2025年四川省自貢市中考物理試卷及答案
- 2025年度衛(wèi)生招聘考試(財(cái)務(wù))新版真題卷(附詳細(xì)解析)
- 2024年深圳市中考生物試卷真題(含答案解析)
- 溝通與演講2023學(xué)習(xí)通超星課后章節(jié)答案期末考試題庫(kù)2023年
- 危險(xiǎn)化學(xué)品安全技術(shù)說(shuō)明書MSDS—汽油
- 三甲醫(yī)院必備醫(yī)療設(shè)備清單大全
- 暴雨產(chǎn)流計(jì)算(推理公式_四川省)
- 中考數(shù)學(xué)復(fù)習(xí)經(jīng)驗(yàn)交流PPT課件
- 內(nèi)部控制專項(xiàng)審計(jì)實(shí)施方案
- DSP課設(shè)——正弦波發(fā)生器
評(píng)論
0/150
提交評(píng)論