




版權(quán)說(shuō)明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請(qǐng)進(jìn)行舉報(bào)或認(rèn)領(lǐng)
文檔簡(jiǎn)介
1醫(yī)療大數(shù)據(jù)平臺(tái)技術(shù)指南第3部分:數(shù)據(jù)管理本文件規(guī)定了醫(yī)療大數(shù)據(jù)平臺(tái)數(shù)據(jù)管理的術(shù)語(yǔ)和定義以及相關(guān)技術(shù)要求,包含數(shù)據(jù)采集過(guò)程、數(shù)據(jù)存儲(chǔ)過(guò)程、數(shù)據(jù)處理過(guò)程框架等內(nèi)容。本文件適用于醫(yī)療大數(shù)據(jù)平臺(tái)數(shù)據(jù)管理過(guò)程的設(shè)計(jì)、開(kāi)發(fā)、選型和實(shí)施,可作為醫(yī)療大數(shù)據(jù)平臺(tái)數(shù)據(jù)采集接入時(shí)的評(píng)測(cè)依據(jù)。2規(guī)范性引用文件下列文件中的內(nèi)容通過(guò)文中的規(guī)范性引用而構(gòu)成本文件必不可少的條款。其中,注日期的引用文件,僅該日期對(duì)應(yīng)的版本適用于本文件;不注日期的引用文件,其最新版本(包括所有的修改單)適用于本文件。GB/T18391.1信息技術(shù)元數(shù)據(jù)注冊(cè)系統(tǒng)(MDR)第1部分:框架GB/T34960.5信息技術(shù)服務(wù)治理第5部分:數(shù)據(jù)治理規(guī)范GB/T36345信息技術(shù)通用數(shù)據(jù)導(dǎo)入接口GB/T35295信息技術(shù)大數(shù)據(jù)術(shù)語(yǔ)GB/T39725信息安全技術(shù)健康醫(yī)療數(shù)據(jù)安全指南GB/T35294信息技術(shù)科學(xué)數(shù)據(jù)引用GB/T37722信息技術(shù)大數(shù)據(jù)存儲(chǔ)與處理系統(tǒng)功能要求GB/T36073數(shù)據(jù)管理能力成熟度評(píng)估模型WS/T500(所有部分)電子病歷共享文檔規(guī)范WS/T303衛(wèi)生健康信息數(shù)據(jù)元標(biāo)準(zhǔn)化規(guī)則WS/T304衛(wèi)生健康信息數(shù)據(jù)模式描述指南WS/T305衛(wèi)生健康信息數(shù)據(jù)集元數(shù)據(jù)標(biāo)準(zhǔn)WS/T306衛(wèi)生健康信息數(shù)據(jù)集分類與編碼規(guī)則3術(shù)語(yǔ)和定義GB/T18391.1、GB/T34960.5、GB/T36345、GB/T35295、GB∕T39725、GB/T35294、GB/T37722、GB/T36073、WS/T500(所有部分)、WS/T303、WS/T304、WS/T305、WS/T306界定的以及下列術(shù)語(yǔ)和定義適用于本文件。3.1數(shù)據(jù)模型Datamodel數(shù)據(jù)模型為數(shù)據(jù)采集提供參考依據(jù),由于不同醫(yī)院的廠商、系統(tǒng)都可能不一致,而且醫(yī)院也存在更換系統(tǒng)的情況,統(tǒng)一的數(shù)據(jù)模型可以兼容醫(yī)院不同廠商的系統(tǒng),對(duì)外統(tǒng)一標(biāo)準(zhǔn)輸出。3.22數(shù)據(jù)映射Datamapping數(shù)據(jù)映射是指將醫(yī)院不同廠商的不同系統(tǒng)的業(yè)務(wù)數(shù)據(jù)存儲(chǔ)的字段與標(biāo)準(zhǔn)模型進(jìn)行對(duì)照,確保數(shù)據(jù)采集到數(shù)據(jù)模型對(duì)應(yīng)的內(nèi)容是一致的。3.3數(shù)據(jù)標(biāo)準(zhǔn)化Datastandardization數(shù)據(jù)標(biāo)準(zhǔn)化是指將醫(yī)療數(shù)據(jù)中的多個(gè)版本的字典、術(shù)語(yǔ)形成統(tǒng)一標(biāo)準(zhǔn)的過(guò)程,方便后續(xù)使用,目前不同系統(tǒng)、不同時(shí)期的數(shù)據(jù)標(biāo)準(zhǔn)存在較大差異,需要將源數(shù)據(jù)按照標(biāo)準(zhǔn)數(shù)據(jù)模型進(jìn)行轉(zhuǎn)換,符合數(shù)據(jù)標(biāo)準(zhǔn)要求。3.4主題層存儲(chǔ)為實(shí)現(xiàn)數(shù)據(jù)解耦而設(shè)計(jì)的數(shù)據(jù)存儲(chǔ)方式,根據(jù)數(shù)據(jù)之間的依賴性和業(yè)務(wù)關(guān)聯(lián),進(jìn)行數(shù)據(jù)主題域劃分,降低使用時(shí)數(shù)據(jù)跨表查詢復(fù)雜度。3.5實(shí)時(shí)數(shù)據(jù)存儲(chǔ)面向?qū)崟r(shí)性、海量的流式數(shù)據(jù)的存儲(chǔ)方式,支持將數(shù)據(jù)實(shí)時(shí)變化傳輸?shù)搅魇綌?shù)據(jù)存儲(chǔ)。3.6文件存儲(chǔ)面向醫(yī)療影像數(shù)據(jù)、文本文件、json對(duì)象、XML文件等數(shù)據(jù)的存儲(chǔ)方式。3.7數(shù)據(jù)治理datagovernance數(shù)據(jù)資源及其應(yīng)用過(guò)程中相關(guān)管控活動(dòng)、績(jī)效和風(fēng)險(xiǎn)管理的集合。[GB/T34960.5,術(shù)語(yǔ)和定義3.1]3.8數(shù)據(jù)管理datamanagement數(shù)據(jù)資源獲取、控制、價(jià)值提升等活動(dòng)的集合。[GB/T34960.5,術(shù)語(yǔ)和定義3.2]3.9數(shù)據(jù)資產(chǎn)dataasset組織擁有和控制的、能夠產(chǎn)生效益的數(shù)據(jù)資源。[GB/T34960.5,術(shù)語(yǔ)和定義3.3]3.103數(shù)據(jù)架構(gòu)dataarchitecture數(shù)據(jù)要素、結(jié)構(gòu)和接口等抽象及其相互關(guān)系的框架。[GB/T34960.5,術(shù)語(yǔ)和定義3.5]3.11元數(shù)據(jù)metadata定義和描述其他數(shù)據(jù)的數(shù)據(jù)。[GB/T18391.1,定義3.2.16]3.12醫(yī)院主數(shù)據(jù)hospitalmasterdata指系統(tǒng)間共享數(shù)據(jù)(例如,患者、醫(yī)療服務(wù)項(xiàng)目、財(cái)務(wù)項(xiàng)目、員工信息、醫(yī)療產(chǎn)品服務(wù)商/供應(yīng)商、固定資產(chǎn)/耗材等相關(guān)數(shù)據(jù))。3.13數(shù)據(jù)生存周期datalifecycle數(shù)據(jù)獲取、存儲(chǔ)、整合、分析、應(yīng)用、呈現(xiàn)、歸檔和銷毀等各種生存形態(tài)演變的過(guò)程。[GB/T34960.5,術(shù)語(yǔ)和定義3.7]3.14命名實(shí)體識(shí)別namedentityrecognition識(shí)別文本中具有特定意義的實(shí)體,主要包括人名、地名、機(jī)構(gòu)名、專有名詞等。3.15實(shí)體關(guān)系抽取relationextraction根據(jù)句子語(yǔ)義信息推測(cè)實(shí)體間的關(guān)系。3.16知識(shí)圖譜knowledgegraph基于圖的數(shù)據(jù)結(jié)構(gòu)描述知識(shí)資源及其載體,挖掘、分析、構(gòu)建、繪制和顯示知識(shí)及它們之間的實(shí)體關(guān)系。4縮略語(yǔ)下列縮略語(yǔ)適用于本文件:HIT:衛(wèi)生信息技術(shù)(HealthcareInformationTechnology);ESB:企業(yè)服務(wù)總線(EnterpriseServiceBus);ETL:抽取-轉(zhuǎn)換-加載(Extrat-Transform-Load);CDR:臨床數(shù)據(jù)中心(ClinicalDataRepository);4ODR:運(yùn)營(yíng)數(shù)據(jù)中心(OperationDataRepository);RDR:科研數(shù)據(jù)中心(ResearchDataRepository);BI:運(yùn)營(yíng)數(shù)據(jù)中心的可視化(BusinessIntelligence);AI:人工智能(ArtificialIntelligence);NLP:自然語(yǔ)言處理(NaturalLanguageProcessing);NER:命名實(shí)體識(shí)別(NamedEntityRecognition);SaaS:軟件即服務(wù)(Software-as-a-service);PaaS:平臺(tái)即服務(wù)(Platform-as-a-Service);IaaS:基礎(chǔ)設(shè)施即服務(wù)(Infrastructure-as-a-Service);SOA:面向服務(wù)的體系結(jié)構(gòu)(Service-OrientedArchitecture);HL7:衛(wèi)生信息交換標(biāo)準(zhǔn)(HealthLevelSeven);DICOM:醫(yī)學(xué)數(shù)字成像和通信(DigitalImagingandCommunicationsinMedicine);LOINC:觀測(cè)指標(biāo)標(biāo)識(shí)符邏輯命名與編碼系統(tǒng)(LogicalObservationIdentifiersNamesandCodes);SNOMEDCT:醫(yī)學(xué)系統(tǒng)命名法-臨床術(shù)語(yǔ)(SystematizedNomenclatureofMedicine--ClinicalTerms);ICD:國(guó)際疾病分類(InternationalClassificationofDisease);EMR:電子病歷(ElectronicMedicalRecord);HIS:醫(yī)院信息系統(tǒng)(HospitalInformationSystem);CIS:臨床信息系統(tǒng)(ClinicalInformationSystem);LIS:實(shí)驗(yàn)室信息系統(tǒng)(LaboratoryInformationSystem);RIS:放射學(xué)信息系統(tǒng)(RadiologyInformationSystem);PACS:影像歸檔和通信系統(tǒng)(PictureArchivingandCommunicationSystem);CRF:臨床研究表(CaseReportForm);CDSS:臨床決策支持系統(tǒng)(ClinicalDecisionSupportSystem)。TTL:生存時(shí)間價(jià)值(TimeToLive);MPP:大規(guī)模并行處理技術(shù)(MassivelyParallelProcessingSDK:軟件開(kāi)發(fā)工具包(SoftwareDevelopmentKitAPI:應(yīng)用程序接口(ApplicationProgrammingInterfaceETL:抽取、轉(zhuǎn)換、加載(Extract-Transform-LoadHDFS:分布式文件系統(tǒng)(HadoopDistributedFileSystemRedis:遠(yuǎn)程字典服務(wù)(RemoteDictionaryServerSQL:結(jié)構(gòu)化查詢語(yǔ)言(StructuredQueryLanguage)。MNLP:醫(yī)學(xué)自然語(yǔ)言處理技術(shù)(MedicineNaturalLanguageProcessing);ETL:抽取、轉(zhuǎn)換、加載(Extract-Transform-LoadLOINC:觀測(cè)指標(biāo)標(biāo)識(shí)符邏輯命名與編碼系統(tǒng)(LogicalObservationIdentifiersNamesandCodes);SNOMEDCT:醫(yī)學(xué)系統(tǒng)命名法-臨床術(shù)語(yǔ)(SystematizedNomenclatureofMedicine--ClinicalTerms);NoSQL:泛指非關(guān)系型數(shù)據(jù)庫(kù)(NotOnlySQL)5數(shù)據(jù)管理指南5.1數(shù)據(jù)采集技術(shù)指南5.1.1數(shù)據(jù)采集范圍5醫(yī)療大數(shù)據(jù)平臺(tái)接入數(shù)據(jù)源宜包括但不限于:HIS、EMR、護(hù)理、手術(shù)麻醉、LIS、PACS、RIS、病理、心電圖、超聲、體檢、隨訪EDC、生物樣本庫(kù)等院內(nèi)臨床業(yè)務(wù)系統(tǒng),以及基因數(shù)據(jù)庫(kù)、物聯(lián)設(shè)備監(jiān)測(cè)數(shù)據(jù)庫(kù)、公共衛(wèi)生數(shù)據(jù)庫(kù)等特殊衛(wèi)生健康數(shù)據(jù)。數(shù)據(jù)采集范圍包含但不限于:——HIS:患者基本信息(含門急診、住院)、就診記錄、診斷、醫(yī)囑、用藥、耗材、手術(shù)、輸血、檢查、檢驗(yàn)等臨床信息,人員、醫(yī)療組、科室、診斷編碼、手術(shù)編碼、項(xiàng)目編碼等主數(shù)據(jù)信息;——EMR:門診患者的門診病歷,住院患者的入院病歷、病程、術(shù)前討論、術(shù)后情況、出院小結(jié)、會(huì)診記錄等全部文書(shū);——病案首頁(yè):就診主索引、臨床首頁(yè)信息和編目首頁(yè)信息——護(hù)理:就診主索引、護(hù)理首頁(yè)、護(hù)理評(píng)估、護(hù)理記錄、護(hù)理措施、危重記錄、體征、外周血管置管等;——手術(shù)麻醉:就診主索引、麻醉記錄單、手術(shù)記錄單、監(jiān)控儀器數(shù)據(jù);——LIS:就診主索引、檢查項(xiàng)目、檢查細(xì)項(xiàng)、細(xì)項(xiàng)結(jié)果及正常值范圍;——RIS:就診主索引、CT/磁共振等檢查各類文字報(bào)告原始文件;——病理:就診主索引、檢查報(bào)告、涂片圖像原始文件;——心電圖:就診主索引、檢查報(bào)告、心電圖原始文件或pdf文件;——超聲:就診主索引、檢查報(bào)告、超聲圖像原始文件;——體檢:患者基本信息(體檢)、體檢項(xiàng)目清單、各項(xiàng)檢查結(jié)果及正常值范圍、各科室檢查結(jié)論、終檢結(jié)論、相關(guān)影像原始文件等;——隨訪:患者基本信息(隨訪)、臨床隨訪和病案隨訪數(shù)據(jù)及院外隨訪數(shù)據(jù);——生物樣本:醫(yī)療機(jī)構(gòu)生物樣本中心采集并留存的生物信息、存儲(chǔ)信息;——基因:患者基本信息、患者基因檢查結(jié)果記錄、基因原始數(shù)據(jù);——物聯(lián)網(wǎng)設(shè)備健康監(jiān)測(cè)數(shù)據(jù):患者基本信息,通過(guò)物聯(lián)網(wǎng)可穿戴健康監(jiān)測(cè)設(shè)備采集的實(shí)時(shí)監(jiān)測(cè)數(shù)據(jù)、健康監(jiān)測(cè)報(bào)告數(shù)據(jù);——公共衛(wèi)生數(shù)據(jù):涉及公共衛(wèi)生應(yīng)急、疾病預(yù)防控制、婦幼保健、精神衛(wèi)生、衛(wèi)生監(jiān)督、健康教育、120、血液等眾多衛(wèi)生健康數(shù)據(jù)。5.1.2采集作業(yè)要求大數(shù)據(jù)平臺(tái)數(shù)據(jù)采集作業(yè)管理宜包含作業(yè)策略、作業(yè)調(diào)度、作業(yè)監(jiān)控等基本功能,以保障采集作業(yè)高效穩(wěn)定。采集作業(yè)宜完成如下目標(biāo):——作業(yè)策略宜包括前期處理、執(zhí)行、任務(wù)日志、異常處理;——作業(yè)異常處理宜支持自動(dòng)重試、調(diào)用備用任務(wù)、手工重試等方式;——作業(yè)調(diào)度宜對(duì)數(shù)據(jù)采集任務(wù)進(jìn)行全局調(diào)用;——作業(yè)調(diào)度宜在滿足業(yè)務(wù)需求的前提下,最大限度減少數(shù)據(jù)采集頻率,降低數(shù)據(jù)源負(fù)擔(dān);——作業(yè)監(jiān)控宜充分考慮各采集任務(wù)存在的風(fēng)險(xiǎn)點(diǎn),制定監(jiān)控任務(wù),留存任務(wù)監(jiān)控記錄;——作業(yè)管理宜能夠通過(guò)短信、郵件等方式進(jìn)行異常告警,協(xié)助運(yùn)維人員及時(shí)準(zhǔn)確發(fā)現(xiàn)問(wèn)題;——作業(yè)管理者宜定期對(duì)數(shù)據(jù)采集作業(yè)監(jiān)控記錄進(jìn)行分析,制定作業(yè)優(yōu)化方法。5.1.3采集技術(shù)5.1.3.1綜述醫(yī)療大數(shù)據(jù)平臺(tái)數(shù)據(jù)接入方式針對(duì)不同業(yè)務(wù)需求、數(shù)據(jù)源適配情況常見(jiàn)技術(shù)包括業(yè)務(wù)系統(tǒng)數(shù)據(jù)庫(kù)備集成平臺(tái)等。65.1.3.2備份恢復(fù)備份恢復(fù)是通過(guò)數(shù)據(jù)庫(kù)備份技術(shù)對(duì)生產(chǎn)庫(kù)進(jìn)行實(shí)時(shí)\定期備份后,建立備份數(shù)據(jù)后通過(guò)數(shù)據(jù)恢復(fù)技術(shù)將數(shù)據(jù)恢復(fù)至大數(shù)據(jù)平臺(tái),其宜滿足如下要求:——宜被應(yīng)用于大批量數(shù)據(jù)采集且對(duì)時(shí)效性要求不高的采集任務(wù);——備份數(shù)據(jù)庫(kù)宜在提交給平臺(tái)前做好數(shù)據(jù)脫敏、加密處理等必要前期處理后,備份生產(chǎn)庫(kù);——數(shù)據(jù)源備份恢復(fù)時(shí)間宜避免在業(yè)務(wù)高峰時(shí)期,減少數(shù)據(jù)源負(fù)擔(dān)。5.1.3.3數(shù)據(jù)同步數(shù)據(jù)同步是通過(guò)傳統(tǒng)關(guān)系型數(shù)據(jù)庫(kù)自帶的數(shù)據(jù)同步技術(shù)進(jìn)行實(shí)時(shí)數(shù)據(jù)同步,其宜滿足如下要求:——宜被應(yīng)用于要求實(shí)時(shí)數(shù)據(jù)采集、吞吐量不大的采集任務(wù);——宜支持OracleGoldenGate、MysqlBinlog、SqlserverCDC等數(shù)據(jù)同步技術(shù);——同步任務(wù)宜配置數(shù)據(jù)量效驗(yàn)規(guī)則,防止數(shù)據(jù)同步過(guò)程中的數(shù)據(jù)丟失;——宜提供秒級(jí)的數(shù)據(jù)延時(shí)。5.1.3.4物化視圖物化視圖是包括一個(gè)查詢結(jié)果的數(shù)據(jù)庫(kù)對(duì)象,它是遠(yuǎn)程數(shù)據(jù)的本地副本,通過(guò)物化視圖可以實(shí)現(xiàn)數(shù)據(jù)從數(shù)據(jù)源復(fù)制到大數(shù)據(jù)平臺(tái),其宜滿足如下要求:——物化視圖復(fù)制宜包含只讀物化視圖復(fù)制、可更新物化視圖復(fù)制和可寫物化視圖復(fù)制;——物化視圖對(duì)數(shù)據(jù)源侵入性較大、數(shù)據(jù)源負(fù)擔(dān)大、安全性差,宜在其他方式均無(wú)法滿足需求時(shí)使5.1.3.5ETL采集ETL(ExtractTransformLoad)是一種流式數(shù)據(jù)采集,是一種高效的實(shí)時(shí)數(shù)據(jù)加工工具,可以實(shí)現(xiàn)流式數(shù)據(jù)的抽取、數(shù)據(jù)轉(zhuǎn)換和加工、數(shù)據(jù)裝載,其宜滿足如下要求:——ETL工具宜包括數(shù)據(jù)抽取、轉(zhuǎn)換、加載功能;——ETL工具宜提供圖形化界面,支持拖拽方式配置ETL任務(wù)節(jié)點(diǎn);——ETL工具transformation宜包含輸入、輸出、查詢、轉(zhuǎn)化、連接、腳本環(huán)節(jié);——ETL工具宜支持自定義數(shù)據(jù)轉(zhuǎn)換方法,腳本環(huán)節(jié)宜支持javaScropt、python腳本編寫的數(shù)據(jù)處理程序;——ETL工具宜支持主流數(shù)據(jù)源對(duì)接;——ETL工具宜支持向HIVE、Hbase、Greenplum等主流大數(shù)據(jù)平臺(tái)數(shù)據(jù)庫(kù)組件導(dǎo)入數(shù)據(jù)。5.1.3.6集成平臺(tái)數(shù)據(jù)提取醫(yī)院有集成平臺(tái)可以采用醫(yī)療大數(shù)據(jù)平臺(tái)從醫(yī)院集成平臺(tái)訂閱消息,獲取實(shí)時(shí)數(shù)據(jù)?!善脚_(tái)宜符合醫(yī)療行業(yè)標(biāo)準(zhǔn)接口定義規(guī)范;——集成平臺(tái)消息傳輸宜該具備應(yīng)答機(jī)制,形成消息閉環(huán);——消息通過(guò)接口傳輸需要進(jìn)行加密,提高消息傳輸安全性;——消息需要支持續(xù)傳,保證大數(shù)據(jù)平臺(tái)數(shù)據(jù)的準(zhǔn)確性及完整性。5.1.4采集質(zhì)控5.1.4.1為了保障數(shù)據(jù)采集接入時(shí)的數(shù)據(jù)質(zhì)量,在采集階段發(fā)現(xiàn)數(shù)據(jù)質(zhì)量問(wèn)題,宜在數(shù)據(jù)采集時(shí)根據(jù)實(shí)際任務(wù)要求,完成數(shù)據(jù)質(zhì)量基礎(chǔ)檢查、字段級(jí)檢查、表級(jí)檢查,以保障數(shù)據(jù)采集的完整性、連續(xù)性。75.1.4.2基礎(chǔ)檢查包括:——檢查數(shù)據(jù)采集范圍是否符合要求;——檢查數(shù)據(jù)采集實(shí)時(shí)性是否滿足要求;——檢查數(shù)據(jù)采集作業(yè)是否連續(xù);——檢查數(shù)據(jù)采集作業(yè)是否存在異常;5.1.4.3字段級(jí)檢查包括:——針對(duì)數(shù)值型字段可通過(guò)計(jì)算檢查是否存在異常;——針對(duì)業(yè)務(wù)關(guān)鍵字段可通過(guò)業(yè)務(wù)邏輯判斷檢查是否存在異常;——針對(duì)主鍵、外鍵等關(guān)鍵字段可通過(guò)字段關(guān)聯(lián)檢查是否存在異常;5.1.4.4表級(jí)檢查包括:——表級(jí)采集可通過(guò)數(shù)據(jù)量檢查是否存在異常;——表級(jí)采集可通過(guò)數(shù)據(jù)字段數(shù)檢查是否存在異常;5.1.4.5為了確保數(shù)據(jù)質(zhì)控規(guī)則能夠協(xié)助運(yùn)維者及時(shí)發(fā)現(xiàn)數(shù)據(jù)質(zhì)量問(wèn)題,應(yīng)實(shí)時(shí)警告數(shù)據(jù)質(zhì)量問(wèn)題,定期生成數(shù)據(jù)采集質(zhì)檢報(bào)告?!獢?shù)據(jù)質(zhì)控問(wèn)題宜根據(jù)業(yè)務(wù)進(jìn)行級(jí)別劃分,制定不同的告警級(jí)別;——數(shù)據(jù)采集質(zhì)檢報(bào)告宜反應(yīng)報(bào)告期間所有采集任務(wù)的完成時(shí)間、質(zhì)控檢查情況。5.1.5采集安全5.1.5.1數(shù)據(jù)采集接入時(shí),考慮部分隱私數(shù)據(jù)或者相關(guān)法律法規(guī)要求,宜對(duì)部分原始數(shù)據(jù)進(jìn)行對(duì)稱加密等安全處理,加密字段范圍可參照GB∕T39725-2020《信息安全技術(shù)健康醫(yī)療數(shù)據(jù)安全指南》數(shù)據(jù)加密字段約定范圍。5.1.5.2數(shù)據(jù)加密宜根據(jù)實(shí)際需求以及安全級(jí)別選擇對(duì)稱加密算法AES、DES或者散列算法MD5,對(duì)稱加密算法支持?jǐn)?shù)據(jù)在適當(dāng)情況進(jìn)行解密還原,散列算法是不可逆加密,無(wú)法復(fù)原。5.2數(shù)據(jù)存儲(chǔ)技術(shù)指南5.2.1數(shù)據(jù)存儲(chǔ)架構(gòu)由于醫(yī)療大數(shù)據(jù)平臺(tái)需要存儲(chǔ)的數(shù)據(jù)量大、類別多且復(fù)雜,在存儲(chǔ)時(shí)宜采用分層分域的存儲(chǔ)架構(gòu),降低數(shù)據(jù)之間的耦合性,宜建立包含主題層、匯總層、應(yīng)用層的數(shù)據(jù)存儲(chǔ)架構(gòu)。5.2.1.1主題層主題層是在在接口層采集的原始數(shù)據(jù)基礎(chǔ)上進(jìn)行主題劃分,形成關(guān)聯(lián)性強(qiáng)的主題域表,宜包括但不——病人信息;——就診信息;——醫(yī)囑信息;——費(fèi)用;——診斷;——過(guò)敏;——檢查;——檢驗(yàn);——手術(shù);——護(hù)理;——病案;——病歷文書(shū);——腫瘤;——報(bào)告卡;——體檢;——其他。5.2.1.2匯總層匯總層是在主題層基礎(chǔ)上,根據(jù)不同數(shù)據(jù)使用需求,對(duì)不同粒度的數(shù)據(jù)進(jìn)行一定匯總處理,提高數(shù)據(jù)使用效率,便于后續(xù)使用。其設(shè)計(jì)宜滿足如下原則:——宜保障匯總數(shù)據(jù)的共用性;——宜能夠提高數(shù)據(jù)使用效率;——宜與原始事實(shí)表維度保持一致;常用匯總層表如下:——費(fèi)用匯總表;——工作量匯總表;——用藥匯總表;——醫(yī)囑匯總表。5.2.1.3應(yīng)用層應(yīng)用層是在匯總層基礎(chǔ)上,通過(guò)構(gòu)建指標(biāo)集、標(biāo)簽集、應(yīng)用寬表等數(shù)據(jù)存儲(chǔ)形式,以滿足各類數(shù)據(jù)應(yīng)。其在醫(yī)療機(jī)構(gòu)主要支撐建立科研大數(shù)據(jù)應(yīng)用平臺(tái)、人工智能應(yīng)用平臺(tái)、運(yùn)營(yíng)管理系統(tǒng)等基于大數(shù)據(jù)的智慧應(yīng)用。其設(shè)計(jì)宜滿足如下原則:——指標(biāo)集、標(biāo)準(zhǔn)簽集、應(yīng)用寬表宜以低耦合、高內(nèi)聚為主要目標(biāo),避免重復(fù)構(gòu)建數(shù)據(jù)集合;——基于大數(shù)據(jù)的智慧應(yīng)用宜支持海量數(shù)據(jù)吞吐、高性能數(shù)據(jù)處理、快速響應(yīng)和智能數(shù)據(jù)挖掘;5.2.2數(shù)據(jù)存儲(chǔ)標(biāo)準(zhǔn)化5.2.2.1原則醫(yī)療數(shù)據(jù)中心中的醫(yī)療數(shù)據(jù)應(yīng)遵循統(tǒng)一的數(shù)據(jù)標(biāo)準(zhǔn)并優(yōu)先采用國(guó)家、衛(wèi)生行業(yè)已經(jīng)制定的相關(guān)數(shù)據(jù)標(biāo)準(zhǔn)作為基準(zhǔn),對(duì)非標(biāo)準(zhǔn)數(shù)據(jù)進(jìn)行轉(zhuǎn)換處理。若沒(méi)有相應(yīng)的國(guó)家或衛(wèi)生行業(yè)數(shù)據(jù)標(biāo)準(zhǔn)可以引用,應(yīng)按照國(guó)家衛(wèi)生信息標(biāo)準(zhǔn)制定的有關(guān)要求完成數(shù)據(jù)標(biāo)準(zhǔn)制定工作。5.2.2.2通用電子病歷數(shù)據(jù)標(biāo)準(zhǔn)對(duì)于醫(yī)療機(jī)構(gòu)的主要業(yè)務(wù)斷面和相關(guān)數(shù)據(jù),應(yīng)符合系列標(biāo)準(zhǔn)WS/T500(所有部分)電子病歷共享文檔規(guī)范。5.2.2.3未標(biāo)準(zhǔn)數(shù)據(jù)的標(biāo)準(zhǔn)化對(duì)于國(guó)家或者衛(wèi)生行業(yè)尚未制定標(biāo)準(zhǔn)的數(shù)據(jù),醫(yī)療大數(shù)據(jù)平臺(tái)數(shù)據(jù)集應(yīng)按照WS/T303衛(wèi)生健康信息數(shù)據(jù)元標(biāo)準(zhǔn)化規(guī)則、WS/T304衛(wèi)生健康信息數(shù)據(jù)模式描述指南、WS/T305衛(wèi)生健康信息數(shù)據(jù)集元數(shù)據(jù)標(biāo)準(zhǔn)、WS/T303衛(wèi)生健康信息數(shù)據(jù)集分類與編碼規(guī)則里的有關(guān)規(guī)定的要求形成標(biāo)準(zhǔn)化數(shù)據(jù)元,并按照附錄A要求構(gòu)建數(shù)據(jù)集及標(biāo)準(zhǔn)化存儲(chǔ)。95.2.3結(jié)構(gòu)化數(shù)據(jù)存儲(chǔ)技術(shù)指南結(jié)構(gòu)化數(shù)據(jù)存儲(chǔ)計(jì)算面向的是從結(jié)構(gòu)化數(shù)據(jù)庫(kù)采集的海量數(shù)據(jù),主要應(yīng)用于海量結(jié)構(gòu)化數(shù)據(jù)分析,應(yīng)用時(shí)需滿足以下技術(shù)要求:——結(jié)構(gòu)化數(shù)據(jù)存儲(chǔ)宜支持關(guān)系型數(shù)據(jù)庫(kù)或者基于MPP架構(gòu)實(shí)現(xiàn)的分布式列式數(shù)據(jù)倉(cāng)庫(kù);——宜提供標(biāo)準(zhǔn)的SQL接口,減少傳統(tǒng)數(shù)據(jù)應(yīng)用遷移成本,降低開(kāi)發(fā)運(yùn)維人員使用門檻;——宜提供準(zhǔn)實(shí)時(shí)的數(shù)據(jù)插入,以滿足用戶對(duì)實(shí)時(shí)數(shù)據(jù)的實(shí)時(shí)交互式分析;——宜提供壓縮存儲(chǔ),以有效節(jié)約存儲(chǔ)成本;——宜提供基于多種編程語(yǔ)言(如python、R、Java等)編寫的Map/Reduce程序或自定義函數(shù)的上傳接口,支持定制化數(shù)據(jù)處理需求;——宜支持多種計(jì)算引擎(如HiveSQL、Spark算子、SparkSQL、Map/Reduce等計(jì)算引擎)。5.2.4流式數(shù)據(jù)存儲(chǔ)技術(shù)指南流式數(shù)據(jù)存儲(chǔ)主要應(yīng)用于接收醫(yī)療生命體征監(jiān)測(cè)儀器、物聯(lián)網(wǎng)可穿戴設(shè)備采集的海量實(shí)時(shí)數(shù)據(jù),由于需要的數(shù)據(jù)吞吐能力、處理能力更高,傳統(tǒng)數(shù)據(jù)庫(kù)及處理方式難以滿足需求,實(shí)時(shí)數(shù)據(jù)存儲(chǔ)宜采用分布式流數(shù)據(jù)處理技術(shù),使其具有高可靠、高可用、高性能和動(dòng)態(tài)擴(kuò)展的特性,以滿足實(shí)時(shí)醫(yī)療大數(shù)據(jù)的存儲(chǔ)要求,應(yīng)用時(shí)需滿足以下技術(shù)要求:——宜集成通信網(wǎng)關(guān)實(shí)現(xiàn)數(shù)據(jù)采集,并通過(guò)數(shù)據(jù)采集網(wǎng)關(guān)對(duì)接多種醫(yī)療/可穿戴監(jiān)測(cè)設(shè)備,實(shí)現(xiàn)設(shè)備海量數(shù)據(jù)的自動(dòng)存??;——宜通過(guò)分布式消息隊(duì)列和分布式流計(jì)算框架,實(shí)現(xiàn)海量流式數(shù)據(jù)快速處理。5.2.5文件存儲(chǔ)技術(shù)指南文件存儲(chǔ)是面向醫(yī)療數(shù)據(jù)中海量的文檔型數(shù)據(jù)、醫(yī)學(xué)影像數(shù)據(jù)等以文件形式存儲(chǔ)的技術(shù)。應(yīng)用時(shí)宜滿足以下技術(shù)要求:——宜提供上傳、下載、讀寫、復(fù)制、移動(dòng)、刪除等基礎(chǔ)數(shù)據(jù)操作功能;——宜提供文件數(shù)據(jù)壓縮和加解密功能;——宜提供訪問(wèn)權(quán)限控制功能;——宜提供文件的位置檢索、批量操作、回收站、快照等功能;——宜支持彈性擴(kuò)展功能,支持動(dòng)態(tài)添加、刪除存儲(chǔ)空間;5.2.6數(shù)據(jù)存儲(chǔ)安全技術(shù)指南為保障大數(shù)據(jù)平臺(tái)數(shù)據(jù)存儲(chǔ)安全,應(yīng)按照數(shù)據(jù)分級(jí)分類原則制定不同等級(jí)的安全策略,實(shí)施時(shí)需滿足以下技術(shù)要求:——數(shù)據(jù)存儲(chǔ)應(yīng)支持多副本備份,保障數(shù)據(jù)存儲(chǔ)安全;——涉及數(shù)據(jù)分級(jí)分類的,宜按照GB∕T39725-2020信息安全技術(shù)健康醫(yī)療數(shù)據(jù)安全指南執(zhí)行;——涉及網(wǎng)絡(luò)和系統(tǒng)安全的,宜按照GB/T22081-2016、GB/T22239-2019執(zhí)行;——涉及基礎(chǔ)安全和數(shù)據(jù)服務(wù)安全的,宜按照GB/T35274-2017執(zhí)行;——涉及云計(jì)算安全的,宜按照GB/T31168執(zhí)行;——應(yīng)建立數(shù)據(jù)存儲(chǔ)安全應(yīng)急處置方案,以應(yīng)對(duì)數(shù)據(jù)存儲(chǔ)突發(fā)情況,快速恢復(fù)備份數(shù)據(jù);——數(shù)據(jù)存儲(chǔ)應(yīng)按照最小權(quán)限原則管理,對(duì)各數(shù)據(jù)使用用戶進(jìn)行權(quán)限管理,降低數(shù)據(jù)泄露風(fēng)險(xiǎn)。5.3數(shù)據(jù)存儲(chǔ)管理指南數(shù)據(jù)存儲(chǔ)管理包括數(shù)據(jù)的分類和標(biāo)準(zhǔn)的命名方法,數(shù)據(jù)的存儲(chǔ)、數(shù)據(jù)的保密規(guī)范和數(shù)據(jù)的備份要求等。管理要求宜包括以下內(nèi)容:——宜指定專人負(fù)責(zé)數(shù)據(jù)的管理,明確職責(zé);安排專人負(fù)責(zé)涉密數(shù)據(jù)資源的傳輸、存儲(chǔ)、共享和使——宜對(duì)存儲(chǔ)數(shù)據(jù)的設(shè)備及基礎(chǔ)設(shè)施重點(diǎn)做好安全防護(hù),包括落實(shí)數(shù)據(jù)存儲(chǔ)設(shè)備的操作終端安全管控措施及接入鑒權(quán)機(jī)制;——宜設(shè)置訪問(wèn)控制策略,定期實(shí)施安全風(fēng)險(xiǎn)評(píng)估,配置安全基線、部署必要的安全存儲(chǔ)技術(shù)手段——宜對(duì)不同安全等級(jí)的數(shù)據(jù)采用差異化安全存儲(chǔ);——宜根據(jù)數(shù)據(jù)備份制度和策略,按照操作規(guī)程進(jìn)行系統(tǒng)和數(shù)據(jù)日常備份,在出現(xiàn)異常時(shí)根據(jù)備份策略進(jìn)行恢復(fù)操作;——宜根據(jù)維護(hù)計(jì)劃定期進(jìn)行數(shù)據(jù)資源目錄、數(shù)據(jù)庫(kù)系統(tǒng)維護(hù);——宜加強(qiáng)數(shù)據(jù)備份介質(zhì)的管理,對(duì)各類介質(zhì)進(jìn)行控制和保護(hù);——宜根據(jù)所承載的數(shù)據(jù)和軟件的重要程度對(duì)介質(zhì)實(shí)行分類和標(biāo)識(shí),并實(shí)行存儲(chǔ)環(huán)境專人管理。5.4數(shù)據(jù)治理指南5.4.1綜述數(shù)據(jù)治理是組織中涉及數(shù)據(jù)使用的一整套管理行為。數(shù)據(jù)治理的最終目標(biāo)是提升數(shù)據(jù)的價(jià)值,它是一個(gè)管理體系,包括組織、制度、流程、工具,是醫(yī)院實(shí)現(xiàn)數(shù)字化轉(zhuǎn)型和數(shù)字戰(zhàn)略的基礎(chǔ)。醫(yī)療機(jī)構(gòu)數(shù)據(jù)治理源于組織的外部監(jiān)管、內(nèi)部數(shù)據(jù)管理及應(yīng)用的需求,應(yīng)滿足如下要求:——法律法規(guī)、行業(yè)監(jiān)管和內(nèi)部管控等對(duì)醫(yī)療機(jī)構(gòu)數(shù)據(jù)及其應(yīng)用的安全、合規(guī)的要求;——醫(yī)療機(jī)構(gòu)數(shù)據(jù)產(chǎn)品化、資產(chǎn)化和價(jià)值化的要求;——醫(yī)療機(jī)構(gòu)數(shù)據(jù)生存周期管理及應(yīng)用過(guò)程中數(shù)據(jù)架構(gòu)、數(shù)據(jù)模型、數(shù)據(jù)標(biāo)準(zhǔn)、數(shù)據(jù)質(zhì)量和數(shù)據(jù)安全等體系建設(shè)的要求?!t(yī)療機(jī)構(gòu)“以數(shù)據(jù)為中心、以醫(yī)療機(jī)構(gòu)為單位、以能力成熟度為準(zhǔn)則”進(jìn)行數(shù)據(jù)安全治理的要5.4.2數(shù)據(jù)治理框架元數(shù)據(jù)管理、主數(shù)據(jù)管理、數(shù)據(jù)質(zhì)量管理、數(shù)據(jù)資產(chǎn)管理、數(shù)據(jù)安全管理、醫(yī)學(xué)術(shù)語(yǔ)標(biāo)準(zhǔn)化指南。5.4.3元數(shù)據(jù)管理指南5.4.3.1一般要求元數(shù)據(jù)是描述醫(yī)療數(shù)據(jù)對(duì)象屬性的數(shù)據(jù),是關(guān)于數(shù)據(jù)的組織、數(shù)據(jù)域與關(guān)系的信息。應(yīng)提供但不限于如下信息:——數(shù)據(jù)采集信息:數(shù)據(jù)來(lái)源、數(shù)據(jù)采集日志、數(shù)據(jù)依賴關(guān)系、ETL任務(wù)信息;——數(shù)據(jù)存儲(chǔ)信息:數(shù)據(jù)物理位置、數(shù)據(jù)結(jié)構(gòu)、數(shù)據(jù)模型;——數(shù)據(jù)使用信息:數(shù)據(jù)稽核日志、數(shù)據(jù)訪問(wèn)日志。5.4.3.2功能要求元數(shù)據(jù)管理模塊是大數(shù)據(jù)平臺(tái)數(shù)據(jù)治理體系的重要組成部分。元數(shù)據(jù)管理用于定義和維護(hù)元數(shù)據(jù),建設(shè)將貫穿醫(yī)院大數(shù)據(jù)平臺(tái)建設(shè)、使用、運(yùn)營(yíng)、維護(hù)的全過(guò)程,應(yīng)提供如下功能:——支持常見(jiàn)關(guān)系型數(shù)據(jù)庫(kù)、大數(shù)據(jù)NoSQL數(shù)據(jù)庫(kù)等不同類型數(shù)據(jù)源的數(shù)據(jù)庫(kù)信息讀取,自動(dòng)采集數(shù)據(jù)源元數(shù)據(jù);——支持元數(shù)據(jù)列表可視化增、刪、改、查;——支持元數(shù)據(jù)通過(guò)發(fā)布、審批流程后,生成元數(shù)據(jù)接口服務(wù),其它系統(tǒng)或模塊使用元數(shù)據(jù)服務(wù);——支持?jǐn)?shù)據(jù)元字典可視化,便于內(nèi)外部更好地了解醫(yī)院數(shù)據(jù)概況;——提供全局元數(shù)據(jù)查詢檢索,便于快速定位元數(shù)據(jù);——提供血緣/影響分析功能,便于數(shù)據(jù)維護(hù)及問(wèn)題定位;——提供元數(shù)據(jù)可視化應(yīng)用,方便終端使用元數(shù)據(jù);——提供統(tǒng)一的基于元數(shù)據(jù)描述的管理產(chǎn)品,集中管理平臺(tái)開(kāi)放的內(nèi)外部API。5.4.4主數(shù)據(jù)管理指南5.4.4.1一般要求主數(shù)據(jù)是指一組約束和方法,用來(lái)管理醫(yī)院內(nèi)跨主題域和多系統(tǒng)的相關(guān)數(shù)據(jù)的含義和質(zhì)量,以保證醫(yī)院系統(tǒng)間數(shù)據(jù)協(xié)調(diào)和復(fù)用正確的業(yè)務(wù)數(shù)據(jù)(主數(shù)據(jù))。醫(yī)院主數(shù)據(jù)應(yīng)包括如下類型:——機(jī)構(gòu)主數(shù)據(jù):機(jī)構(gòu)信息、科室信息、科室分類、醫(yī)療組信息、員工信息等;——患者主數(shù)據(jù):個(gè)人信息(性別、地址、婚姻狀況、職業(yè)、血型、教育水平)、患者標(biāo)識(shí)類型;——業(yè)務(wù)主數(shù)據(jù):診斷字典、醫(yī)囑項(xiàng)目、檢查項(xiàng)目、檢驗(yàn)項(xiàng)目、手術(shù)字典、藥學(xué)項(xiàng);——財(cái)務(wù)主數(shù)據(jù):收費(fèi)項(xiàng)目、費(fèi)用類型、醫(yī)療產(chǎn)品服務(wù)商/供應(yīng)商等。5.4.4.2功能要求主數(shù)據(jù)維護(hù)用于檢索、定義、修改、發(fā)布服務(wù)等功能和數(shù)據(jù)質(zhì)量管理,主數(shù)據(jù)管理應(yīng)提供以下功能:——主數(shù)據(jù)標(biāo)準(zhǔn)體系管理:定義、維護(hù)、檢索數(shù)據(jù)標(biāo)準(zhǔn),應(yīng)為主數(shù)據(jù)管理和其他信息系統(tǒng)提供值域服務(wù);——主數(shù)據(jù)維護(hù):應(yīng)提供主數(shù)據(jù)新增、刪除、檢索功能;——主數(shù)據(jù)導(dǎo)入導(dǎo)出:應(yīng)提供批量導(dǎo)入和導(dǎo)出;——主數(shù)據(jù)審核、發(fā)布:需要發(fā)布的主數(shù)據(jù)應(yīng)建立審核流程;——主數(shù)據(jù)共享:應(yīng)提供主數(shù)據(jù)對(duì)外查詢接口及數(shù)據(jù)分發(fā)功能;——主數(shù)據(jù)監(jiān)控及日志:應(yīng)為跨系統(tǒng)使用主數(shù)據(jù)情況信息提供監(jiān)控以及日志管理功能;——主數(shù)據(jù)版本管理:應(yīng)提供版本管理工具,支持不同版本切換及對(duì)照功能,原始主數(shù)據(jù)版本不一致應(yīng)對(duì)各版本主數(shù)據(jù)做對(duì)照。5.4.5數(shù)據(jù)質(zhì)量管理指南5.4.5.1一般要求數(shù)據(jù)質(zhì)量管理包括數(shù)據(jù)采集質(zhì)量管理及數(shù)據(jù)治理質(zhì)量管理,本節(jié)主要對(duì)數(shù)據(jù)治理中的質(zhì)量管理進(jìn)行約束。數(shù)據(jù)質(zhì)量管理是通過(guò)定義數(shù)據(jù)質(zhì)量效驗(yàn)規(guī)則,定時(shí)效驗(yàn)大數(shù)據(jù)平臺(tái)數(shù)據(jù)治理情況,以識(shí)別數(shù)據(jù)質(zhì)量問(wèn)題,并定期提供數(shù)據(jù)質(zhì)量評(píng)估報(bào)告與預(yù)警。數(shù)據(jù)質(zhì)量檢查應(yīng)包括如下方面:——完整性:用于核查數(shù)據(jù)局部缺失、信息丟失情況;——唯一性;用于核查不規(guī)范的重復(fù)數(shù)據(jù);——準(zhǔn)確性:用于核查數(shù)據(jù)采集、處理過(guò)程中可能出現(xiàn)的數(shù)據(jù)偏差;——規(guī)范性:用于核查格式、值域、字典不規(guī)范數(shù)據(jù);——一致性:用于核查系統(tǒng)、模塊間記錄、編碼、引用不一致。5.4.5.2功能要求在大數(shù)據(jù)平臺(tái)建設(shè)中,數(shù)據(jù)質(zhì)量為其提供潔凈、結(jié)構(gòu)清晰的數(shù)據(jù),是大數(shù)據(jù)平臺(tái)開(kāi)發(fā)數(shù)據(jù)產(chǎn)品、提供數(shù)據(jù)服務(wù)、發(fā)揮大數(shù)據(jù)價(jià)值的必要前提,是醫(yī)院數(shù)據(jù)資產(chǎn)管理的關(guān)鍵因素。高效的數(shù)據(jù)質(zhì)量管理工具是提高數(shù)據(jù)質(zhì)量的重要途徑,應(yīng)提供如下功能:——標(biāo)準(zhǔn)管理:應(yīng)根據(jù)全國(guó)信息技術(shù)標(biāo)準(zhǔn)化技術(shù)委員會(huì)的指標(biāo)(GB/T36344-2018ICS35.24.01)從業(yè)務(wù)規(guī)則規(guī)范性設(shè)定質(zhì)量標(biāo)準(zhǔn),并提供標(biāo)準(zhǔn)查詢、定制功能;——自定義規(guī)則:應(yīng)提供可視化規(guī)則配置界面,支持對(duì)不同數(shù)據(jù)源進(jìn)行復(fù)雜規(guī)則制定,支持實(shí)現(xiàn)醫(yī)療內(nèi)涵數(shù)據(jù)質(zhì)控;——質(zhì)量監(jiān)控:應(yīng)提供監(jiān)控任務(wù)管理界面,支持對(duì)不同質(zhì)控規(guī)則設(shè)置具有邏輯關(guān)系的監(jiān)控任務(wù);——考核指標(biāo):應(yīng)根據(jù)數(shù)據(jù)質(zhì)量標(biāo)準(zhǔn)、質(zhì)量規(guī)則、監(jiān)控任務(wù)設(shè)定數(shù)據(jù)質(zhì)量驗(yàn)證指標(biāo)和考核辦法;——質(zhì)量分析:應(yīng)包含數(shù)據(jù)質(zhì)量告警、數(shù)據(jù)質(zhì)量分析報(bào)告、不定期數(shù)據(jù)質(zhì)量檢查等分析方式;——數(shù)據(jù)規(guī)整:應(yīng)包含數(shù)據(jù)質(zhì)量問(wèn)題處理模塊,支持對(duì)格式異常數(shù)據(jù)進(jìn)行轉(zhuǎn)換,臟數(shù)據(jù)清洗、剔除等功能;——數(shù)據(jù)補(bǔ)錄:應(yīng)提供便捷的數(shù)據(jù)補(bǔ)錄、更新工具,包括手工修正及自動(dòng)修正。5.4.6數(shù)據(jù)資產(chǎn)管理指南5.4.6.1一般要求數(shù)據(jù)資產(chǎn)化以資產(chǎn)的角度開(kāi)展數(shù)據(jù)管理工作,有助于多角度、全方位開(kāi)展數(shù)據(jù)的管理,明確數(shù)據(jù)安全級(jí)別,落實(shí)資產(chǎn)責(zé)任管理,是實(shí)現(xiàn)數(shù)據(jù)變現(xiàn)的必要前提。數(shù)據(jù)資產(chǎn)管理應(yīng)對(duì)數(shù)據(jù)進(jìn)行分級(jí)分類管理,建立統(tǒng)一管理的數(shù)據(jù)資源池,基于主數(shù)據(jù)、元數(shù)據(jù)實(shí)現(xiàn)全生命周期的數(shù)據(jù)流管理。5.4.6.2功能要求5.4.6.2.1安全認(rèn)證數(shù)據(jù)治理平臺(tái)應(yīng)使用統(tǒng)一的身份認(rèn)證服務(wù),由系統(tǒng)管理員統(tǒng)一管理運(yùn)維人員、使用人員權(quán)限,并支持多重身份認(rèn)證登錄(短信、郵箱等)。5.4.6.2.2權(quán)限管理數(shù)據(jù)治理平臺(tái)應(yīng)采用權(quán)限最小化原則進(jìn)行權(quán)限授予,且數(shù)據(jù)權(quán)限管理應(yīng)支持文件、表級(jí)、字段級(jí)、記錄級(jí)分配,實(shí)現(xiàn)細(xì)粒度最小化的權(quán)限管理機(jī)制。對(duì)于隱私、敏感數(shù)據(jù)應(yīng)采用更嚴(yán)格的權(quán)限審批流程和管理制度,確保數(shù)據(jù)安全使用。5.4.6.2.3數(shù)據(jù)加密數(shù)據(jù)加密應(yīng)針對(duì)不同的數(shù)據(jù)類型(結(jié)構(gòu)化、非結(jié)構(gòu)化、半結(jié)構(gòu)化)、安全等級(jí),設(shè)置不同的加密算法?!跀?shù)據(jù)存儲(chǔ)上,普通數(shù)據(jù)可以采用明文存儲(chǔ),敏感數(shù)據(jù)則需要加密后再存儲(chǔ),并附加校驗(yàn)碼;——在數(shù)據(jù)傳輸上,應(yīng)部署SSL證書(shū),確保敏感數(shù)據(jù)傳輸過(guò)程中的安全性;——加密算法選擇時(shí),應(yīng)支持國(guó)密加密技術(shù)。5.4.6.2.4數(shù)據(jù)生存周期管理要求數(shù)據(jù)生存周期管理用于管理系統(tǒng)中數(shù)據(jù)的流動(dòng),覆蓋范圍從數(shù)據(jù)的創(chuàng)建、存儲(chǔ)、到過(guò)時(shí)被刪除的全過(guò)程。應(yīng)包含但不限于如下功能:——支持?jǐn)?shù)據(jù)重要性等級(jí)定義與維護(hù),支持重要性與生存周期關(guān)聯(lián);——每個(gè)重要性等級(jí)對(duì)應(yīng)的數(shù)據(jù)生存周期設(shè)置,支持根據(jù)周期對(duì)數(shù)據(jù)進(jìn)行禁用、恢復(fù)、刪除等操作;5.4.6.2.5數(shù)據(jù)脫敏根據(jù)相關(guān)法律法規(guī)、標(biāo)準(zhǔn)規(guī)范以及業(yè)務(wù)需求,制定敏感數(shù)據(jù)的脫敏規(guī)則,對(duì)敏感數(shù)據(jù)進(jìn)行脫敏處理,保證數(shù)據(jù)可用性和安全性,數(shù)據(jù)脫敏需滿足以下要求:——脫敏方法定義:根據(jù)應(yīng)用場(chǎng)景和實(shí)現(xiàn)機(jī)制,數(shù)據(jù)脫敏方法可分為靜態(tài)數(shù)據(jù)脫敏和動(dòng)態(tài)數(shù)據(jù)脫敏;——敏感數(shù)據(jù)分類:在數(shù)據(jù)脫敏前,首先應(yīng)完整梳理數(shù)據(jù)中包含的所有信息分類,然后明確敏感信息,進(jìn)行敏感級(jí)別分類;——數(shù)據(jù)脫敏策略:首先對(duì)數(shù)據(jù)可用性和數(shù)據(jù)保密性進(jìn)行定級(jí),然后設(shè)置脫敏策略,各醫(yī)療機(jī)構(gòu)在具體場(chǎng)景下設(shè)置數(shù)據(jù)脫敏策略時(shí),應(yīng)充分考慮數(shù)據(jù)自身可用性及數(shù)據(jù)保密性尋求兩者間的平衡關(guān)系;——脫敏安全審計(jì):在數(shù)據(jù)脫敏的各個(gè)階段加入安全審計(jì)機(jī)制,詳細(xì)記錄數(shù)據(jù)處理過(guò)程中的相關(guān)信息,形成完整數(shù)據(jù)處理記錄,用于后續(xù)問(wèn)題排查與數(shù)據(jù)追蹤分析。5.4.6.2.6數(shù)據(jù)分類分級(jí)數(shù)據(jù)治理平臺(tái)能夠支持對(duì)數(shù)據(jù)資產(chǎn)安全進(jìn)行分級(jí)分類管理,根據(jù)數(shù)據(jù)的屬性、特征、敏感程度等,將其按照一定的原則和方法進(jìn)行區(qū)分和歸類,并支持根據(jù)各級(jí)別生成對(duì)應(yīng)的數(shù)據(jù)安全策略。數(shù)據(jù)分類分級(jí)一般包括如下功能:——支持多種敏感數(shù)據(jù)識(shí)別模式,包括預(yù)定義模式、自定義模式、相似數(shù)據(jù)發(fā)現(xiàn)模式等;——支持常見(jiàn)的敏感數(shù)據(jù)類型的脫敏,包括患者姓名、電話號(hào)碼、郵箱、身份證號(hào)碼、銀行卡號(hào)、住址、家屬基本信息、患者用藥數(shù)據(jù)、基因檢測(cè)數(shù)據(jù)等;——支持對(duì)數(shù)據(jù)進(jìn)行自定義分類和分級(jí),用戶可通過(guò)編寫不同的識(shí)別規(guī)則如正則表達(dá)、關(guān)鍵字匹配等來(lái)識(shí)別自定義的敏感數(shù)據(jù);——支持相似性敏感數(shù)據(jù)發(fā)現(xiàn)功能,通過(guò)對(duì)已指定的部分樣本數(shù)據(jù)進(jìn)行機(jī)器學(xué)習(xí),從而對(duì)其它類似數(shù)據(jù)進(jìn)行分類分級(jí);——支持對(duì)識(shí)別數(shù)據(jù)進(jìn)行標(biāo)記的管理,包括標(biāo)記自定義、標(biāo)記設(shè)置、標(biāo)記變更等功能;——應(yīng)包括數(shù)據(jù)分類分級(jí)的操作、變更過(guò)程進(jìn)行日志的記錄和分析功能。5.4.6.3功能要求數(shù)據(jù)資產(chǎn)的范圍和形式應(yīng)包含醫(yī)院擁有的各類數(shù)據(jù),如表、視圖、接口、程序等。同時(shí),隨著大數(shù)據(jù)的發(fā)展,還納入各種非/半結(jié)構(gòu)化的數(shù)據(jù)形式,如日志、網(wǎng)頁(yè)、圖片、音視頻等。數(shù)據(jù)資產(chǎn)標(biāo)識(shí)是一個(gè)有業(yè)務(wù)含義、分段式、全局唯一的字符串,用來(lái)區(qū)分識(shí)別數(shù)據(jù)資產(chǎn)的標(biāo)簽。資產(chǎn)標(biāo)識(shí)包含有資產(chǎn)所屬業(yè)務(wù)域、資產(chǎn)類型、提供者等信息。數(shù)據(jù)資產(chǎn)管理應(yīng)提供數(shù)據(jù)全生命周期管理,包括以下內(nèi)容:——數(shù)據(jù)資產(chǎn)目錄:醫(yī)療衛(wèi)生分類分級(jí)標(biāo)準(zhǔn)、業(yè)務(wù)分類、敏感程度分級(jí)等;——數(shù)據(jù)標(biāo)準(zhǔn)化;應(yīng)包括數(shù)據(jù)同趨化處理和無(wú)量綱化處理兩個(gè)方面;——數(shù)據(jù)資產(chǎn)運(yùn)營(yíng):應(yīng)從看、選、用、治、評(píng)五方面對(duì)數(shù)據(jù)資產(chǎn)進(jìn)行合理配置和有效利用;——數(shù)據(jù)資產(chǎn)服務(wù):應(yīng)包括數(shù)據(jù)分析與應(yīng)用管理;——數(shù)據(jù)資產(chǎn)消費(fèi):應(yīng)提供數(shù)據(jù)共享服務(wù)中心;——數(shù)據(jù)生命周期管理:應(yīng)從數(shù)據(jù)生命周期五階段提供管理功能;——數(shù)據(jù)資產(chǎn)管理服務(wù):集中提供數(shù)據(jù)資產(chǎn)服務(wù)對(duì)接內(nèi)外API;——數(shù)據(jù)血緣管理:應(yīng)包括數(shù)據(jù)來(lái)源、數(shù)據(jù)流向、流轉(zhuǎn)路徑以及路徑中的處理方式。5.4.7數(shù)據(jù)安全管理指南5.4.7.1一般要求統(tǒng)一數(shù)據(jù)治理平臺(tái)必須建立完整的信息安全管理措施和技術(shù)方案,加強(qiáng)大數(shù)據(jù)平臺(tái)與其它系統(tǒng)之間的數(shù)據(jù)信息安全管控?!獢?shù)據(jù)安全管理需求:制定數(shù)據(jù)安全管理目標(biāo)、方針和策略,并持續(xù)改進(jìn)和優(yōu)化,確保數(shù)據(jù)防篡改、防泄露和防損毀;——數(shù)據(jù)安全管理機(jī)構(gòu):明確數(shù)據(jù)安全管理的角色和責(zé)任,提升人員意識(shí)、能力和素質(zhì);——數(shù)據(jù)安全分類分級(jí):建立滿足不同業(yè)務(wù)場(chǎng)景、不同級(jí)別的數(shù)據(jù)安全規(guī)范和保護(hù)機(jī)制,確保數(shù)據(jù)的完整性、保密性、可用性以及數(shù)據(jù)的可追溯性;——數(shù)據(jù)安全管理視圖:識(shí)別數(shù)據(jù)應(yīng)用過(guò)程中的風(fēng)險(xiǎn),并建立數(shù)據(jù)泄露、應(yīng)急響應(yīng)、溝通協(xié)作和責(zé)任追究等安全管控機(jī)制;——數(shù)據(jù)權(quán)限管理:建立應(yīng)用過(guò)程中的授權(quán)、訪問(wèn)和審核機(jī)制;——數(shù)據(jù)安全審計(jì):建立數(shù)據(jù)安全監(jiān)測(cè)和預(yù)警系統(tǒng),對(duì)數(shù)據(jù)安全管理能力進(jìn)行監(jiān)督和風(fēng)險(xiǎn)評(píng)估。5.4.8醫(yī)學(xué)術(shù)語(yǔ)標(biāo)準(zhǔn)化指南5.4.8.1一般要求5.4.8.1.1術(shù)語(yǔ)網(wǎng)絡(luò)應(yīng)同時(shí)具備處理語(yǔ)義和醫(yī)學(xué)邏輯的能力,為深度學(xué)習(xí)解決了冷啟動(dòng)的難題。深度學(xué)習(xí)用于以下方面:——基于上下文環(huán)境以自動(dòng)的方式對(duì)知識(shí)進(jìn)行抽取,結(jié)合LSTM與CRF來(lái)實(shí)現(xiàn),將知識(shí)的抽取視為根據(jù)文字上下文對(duì)文字所扮演概念的角色做序列標(biāo)注的問(wèn)題;——預(yù)測(cè)概念之間的各種關(guān)系,包括挖掘概念之間的生成關(guān)系和上下文關(guān)系、同義關(guān)系等。5.4.8.1.2基于通用的知識(shí)圖譜引擎和技術(shù)框架,使用深度學(xué)習(xí)來(lái)優(yōu)化已有的知識(shí)體系,實(shí)現(xiàn)高效術(shù)語(yǔ)網(wǎng)絡(luò)建設(shè)和知識(shí)推理能力。5.4.8.2術(shù)語(yǔ)映射技術(shù)要求術(shù)語(yǔ)網(wǎng)絡(luò),宜整合“語(yǔ)義網(wǎng)絡(luò)”和“本體庫(kù)”的特點(diǎn),同時(shí)宜具備處理語(yǔ)義和醫(yī)學(xué)邏輯的能力,發(fā)展方向宜包括:——術(shù)語(yǔ)網(wǎng)絡(luò)內(nèi)容(附錄A)。依據(jù)使用的場(chǎng)景特征不同而分為以下四大類別:.藥品庫(kù)和檢驗(yàn)庫(kù),分別基于LOINC(觀測(cè)指標(biāo)標(biāo)識(shí)符邏輯命名與編碼系統(tǒng),LogicalObservationIdentifiersNamesandCodes)和CFDA藥物信息3.0版本構(gòu)建;CMeSH、ICD-O-3、ICD-10;.心臟超聲庫(kù)、心電圖庫(kù)、胸片庫(kù)、胸部CT庫(kù)、腦CT庫(kù)、腦電圖庫(kù)、乳腺庫(kù)等,輔助NLP的信息抽取和隊(duì)列搜索需求;.大量
溫馨提示
- 1. 本站所有資源如無(wú)特殊說(shuō)明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請(qǐng)下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請(qǐng)聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
- 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁(yè)內(nèi)容里面會(huì)有圖紙預(yù)覽,若沒(méi)有圖紙預(yù)覽就沒(méi)有圖紙。
- 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
- 5. 人人文庫(kù)網(wǎng)僅提供信息存儲(chǔ)空間,僅對(duì)用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對(duì)用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對(duì)任何下載內(nèi)容負(fù)責(zé)。
- 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請(qǐng)與我們聯(lián)系,我們立即糾正。
- 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶因使用這些下載資源對(duì)自己和他人造成任何形式的傷害或損失。
最新文檔
- GB/T 11856.1-2025烈性酒質(zhì)量要求第1部分:威士忌
- GB 19081-2025飼料加工系統(tǒng)粉塵防爆安全規(guī)范
- 勞動(dòng)合同范本 派遣
- 養(yǎng)殖場(chǎng)清糞車購(gòu)銷合同范本
- 區(qū)域銷售協(xié)議合同范本醫(yī)藥
- 包裝印刷公司采購(gòu)合同范本
- 買宅地合同范例
- 上海住房合同范本
- 個(gè)人與團(tuán)隊(duì)提成合同范本
- 線上按摩技師合同范本
- 部編版小學(xué)(2024版)小學(xué)道德與法治一年級(jí)下冊(cè)《有個(gè)新目標(biāo)》-第一課時(shí)教學(xué)課件
- 稅法(第5版) 課件 第13章 印花稅
- 2024-2025學(xué)年廣州市高二語(yǔ)文上學(xué)期期末考試卷附答案解析
- 咖啡店合同咖啡店合作經(jīng)營(yíng)協(xié)議
- 2025年山東鋁業(yè)職業(yè)學(xué)院高職單招職業(yè)技能測(cè)試近5年??及鎱⒖碱}庫(kù)含答案解析
- 全套電子課件:技能成就夢(mèng)想
- 2024年教育公共基礎(chǔ)知識(shí)筆記
- 2025年江蘇農(nóng)林職業(yè)技術(shù)學(xué)院高職單招職業(yè)技能測(cè)試近5年??及鎱⒖碱}庫(kù)含答案解析
- 異構(gòu)數(shù)據(jù)融合技術(shù)-深度研究
- 北京市朝陽(yáng)區(qū)2024-2025學(xué)年七年級(jí)上學(xué)期期末考試數(shù)學(xué)試卷(含答案)
- 2024年湖南汽車工程職業(yè)學(xué)院?jiǎn)握新殬I(yè)技能測(cè)試題庫(kù)標(biāo)準(zhǔn)卷
評(píng)論
0/150
提交評(píng)論