版權說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權,請進行舉報或認領
文檔簡介
新一代大數(shù)據(jù)中心需求說明序號功能模塊子系統(tǒng)功能要求數(shù)量單位1基礎環(huán)境搭建數(shù)據(jù)湖基礎環(huán)境搭建需支持海量原始數(shù)據(jù)存儲,支持結(jié)構化和非結(jié)構化數(shù)據(jù)存儲;1項2需支持將不同來源的業(yè)務數(shù)據(jù)通過流批一體的方式統(tǒng)一集成,支持業(yè)務實時數(shù)據(jù)捕捉接入數(shù)據(jù)湖,其他數(shù)據(jù)按需批量接入數(shù)據(jù)湖;1項3需支持實時增量數(shù)據(jù)更新和全量數(shù)據(jù)更新的湖倉模型;1項4需支持基于數(shù)據(jù)湖的多種數(shù)據(jù)查詢分析引擎,包括實時查詢、實時分析、離線分析;1項5需支持主流數(shù)據(jù)庫的數(shù)據(jù)采集適配,采用國產(chǎn)或開源大數(shù)據(jù)技術構建數(shù)據(jù)湖;1項6數(shù)據(jù)采集服務數(shù)據(jù)采集服務需支持Oracle、SQLServer、MySQL、MongoDB等主流數(shù)據(jù)庫全量和增量采集服務;1項7需支持數(shù)據(jù)日志、數(shù)據(jù)同步、數(shù)據(jù)備份、集成接口等數(shù)據(jù)采集服務方式,按指定頻率進行增量數(shù)據(jù)采集;1項8需提供對數(shù)據(jù)抽取過程日志的保存功能,保存數(shù)據(jù)同步及抽取運行情況,方便快速問題定位;1項9數(shù)據(jù)采集系統(tǒng)范圍包括但不限于:HIS、EMR、LIS、RIS、PACS、病理、護理、手麻、重癥等業(yè)務系統(tǒng),本次項目建設如產(chǎn)生接口服務費,由項目承建方承擔;1項10本平臺建設將制定面向數(shù)據(jù)開放的通用數(shù)據(jù)模型、面向業(yè)務分析的主題數(shù)據(jù)模型,并按照相關指南制定數(shù)據(jù)分類分級、業(yè)務域標準;1項11數(shù)據(jù)標準管理服務數(shù)據(jù)標準管理服務通用數(shù)據(jù)模型需參考電子病歷數(shù)據(jù)元、電子病歷數(shù)據(jù)元值域代碼、電子病歷基本數(shù)據(jù)集、電子病歷共享文檔規(guī)范、HL7等行業(yè)標準,制定覆蓋患者診療、醫(yī)院運營管理等業(yè)務領域的標化通用數(shù)據(jù)模型;1項12數(shù)據(jù)分級分類標準需參考《GB/T39725-2020信息安全技術健康醫(yī)療數(shù)據(jù)安全指南》,本項目將制定數(shù)據(jù)分類分級標準,包括數(shù)據(jù)分類組及數(shù)據(jù)分類,業(yè)務領域覆蓋臨床及運營管理等通用模型所覆蓋的業(yè)務域;1項13支持制定三級業(yè)務域標準,內(nèi)容需覆蓋通用模型所覆蓋的業(yè)務域;1項14標化數(shù)據(jù)治理服務通用數(shù)據(jù)模型服務需構建數(shù)據(jù)模型服務,構建以患者為中心的數(shù)據(jù)模型,模型需參考HL7、衛(wèi)健委電子病歷基本架構與數(shù)據(jù)標準等一系列國內(nèi)國際通用標準;可實現(xiàn)各業(yè)務信息系統(tǒng)的數(shù)據(jù)映射到以患者為中心的數(shù)據(jù)模型;1項15構建以運營為中心的數(shù)據(jù)模型服務,采集各業(yè)務系統(tǒng)產(chǎn)生的人、財、物數(shù)據(jù),根據(jù)國內(nèi)/國際通用/行業(yè)標準映射為醫(yī)院運營數(shù)據(jù)模型;1項16數(shù)據(jù)清洗服務需將業(yè)務系統(tǒng)采集數(shù)據(jù)映射到通用數(shù)據(jù)模型中,并對映射到通用數(shù)據(jù)模型的數(shù)據(jù)進行清洗,包括數(shù)據(jù)映射、數(shù)據(jù)過濾、刪除重復項、統(tǒng)一數(shù)據(jù)格式、代碼轉(zhuǎn)換等;1項17數(shù)據(jù)脫敏加密服務需參照《個人信息保護法》、信息安全等級保護、HIPAA、個人信息安全規(guī)范等法律法規(guī)對隱私及其他敏感信息處理的要求,進行數(shù)據(jù)脫敏或加密處理;1項18數(shù)據(jù)關聯(lián)服務需完善表與表之間的關聯(lián),還原原本數(shù)據(jù)表之間的關系,如患者表與就診表、就診表與處方表、處方主表與處方明細表,表間應該通過患者號、就診號、處方號等進行關聯(lián);1項19電子病歷解析服務需具備電子病歷自動解析能力,將電子病歷文檔類型映射到標準文檔類型(如:入院記錄、手術記錄、病程記錄、出院小結(jié)等);1項20支持根據(jù)每個文檔類型的模型定義,從原始電子病歷文書中進行章節(jié)文本拆分提?。ㄈ纾喝朐河涗洸鸱殖鲋髟V、現(xiàn)病史、既往史等章節(jié));1項21醫(yī)學實體識別服務需采用自然語言處理技術,對文本數(shù)據(jù)進行數(shù)據(jù)結(jié)構化自動提取和實體識別,支持從入院記錄、診斷、病理報告中進行結(jié)構化內(nèi)容提取,提取內(nèi)容包括診斷名稱、陽性癥狀、陰性癥狀、既往疾病史、個人史、免疫組化等;1項22需具備基于規(guī)則的結(jié)構化特征提取定義服務能力,如術后第一次血紅蛋白檢測值;1項23需具備基于實體識別、語法識別、語義理解基礎上的文本結(jié)構化解析服務能力;1項24醫(yī)學數(shù)據(jù)標準化服務醫(yī)學數(shù)據(jù)標準化需參照行業(yè)標準庫,如ICD10、ICD9-CM3、藥品ATC標準、衛(wèi)生信息數(shù)據(jù)元值域代碼及各類常規(guī)的行業(yè)標準字典,對采集數(shù)據(jù)自動進行統(tǒng)一的標準化處理;1項25標準化內(nèi)容應包括但不限于診斷、手術及操作、檢驗項目、檢查項目、藥品等;1項26需實現(xiàn)術語到標準術語映射轉(zhuǎn)換服務;1項27數(shù)據(jù)質(zhì)控服務需具備數(shù)據(jù)質(zhì)量監(jiān)控、問題發(fā)現(xiàn)、問題告警等功能,全程對數(shù)據(jù)質(zhì)量進行有效的監(jiān)督、控制和追溯;1項28數(shù)據(jù)質(zhì)控范圍包括:數(shù)據(jù)完整性、一致性、準確性、唯一性、及時性等數(shù)據(jù)質(zhì)量問題;1項29質(zhì)控方式需包括:自然屬性評估/完整性校驗、規(guī)范性校驗、傳輸差異校驗、孤兒數(shù)據(jù)統(tǒng)計、數(shù)據(jù)精準核查、質(zhì)控規(guī)則校驗、多版本數(shù)據(jù)比對、OLAP質(zhì)量多維度分析、閾值管理、自動預警等;1項30數(shù)據(jù)資產(chǎn)管理服務數(shù)據(jù)資產(chǎn)接入及信息維護需支持由實施人員分別將業(yè)務系統(tǒng)原始數(shù)據(jù)庫(如:HIS、EMR、LIS、PACS、護理、手麻、病案等)、增強數(shù)據(jù)庫、主題數(shù)據(jù)庫(結(jié)合業(yè)務應用需求模型建立的庫、表)導入到數(shù)據(jù)資產(chǎn)上,導入完成后維護數(shù)據(jù)庫資產(chǎn)的廠商名稱、數(shù)據(jù)開始時間、數(shù)據(jù)更新時間、所屬機構、業(yè)務系統(tǒng)類型、業(yè)務域、數(shù)據(jù)類型、更新頻率等關鍵信息;1項31原始數(shù)據(jù)關聯(lián)關系維護實施人員通過對業(yè)務的理解以及與信息科的溝通確認,對原始數(shù)據(jù)表與表之間的主鍵、外鍵關聯(lián)關系進行標注(維護的信息并非物理表的邏輯主外鍵);1項32數(shù)據(jù)分類分級管理服務初始化數(shù)據(jù)識別規(guī)則,客戶可結(jié)合自身實際情況新建識別規(guī)則;實施人員經(jīng)與客戶就關鍵字段敏感度的處理方案溝通后,創(chuàng)建數(shù)據(jù)識別任務,識別任務跑完后,實施人員需要人工進行確認;分類分級數(shù)據(jù)初始化完成后,數(shù)據(jù)資產(chǎn)中的數(shù)據(jù)庫默認表分級會標記為4級,客戶可結(jié)合自身實際情況進行調(diào)整,本庫包含的下屬表也會隨之進行調(diào)整;也可以對業(yè)務域進行分級維護,當業(yè)務域維護了分級,且數(shù)據(jù)庫、表設置了業(yè)務域?qū)傩裕瑯I(yè)務域的分級會高于數(shù)據(jù)庫單獨指定的分級設置;1項33業(yè)務域管理服務初始化業(yè)務域字典,客戶可結(jié)合自身實際情況對字典進行微調(diào);業(yè)務域初始化完成后,會對增強數(shù)據(jù)進行業(yè)務域?qū)傩缘某跏蓟?,通過映射邏輯反推,給原始數(shù)據(jù)的業(yè)務域?qū)傩再x值,由于本工作采用自動化完成,還需人工再此確認;1項34數(shù)據(jù)質(zhì)控規(guī)則維護服務由實施人員初始化默認質(zhì)控規(guī)則,可根據(jù)客戶關注的特定質(zhì)控需求自定義質(zhì)控規(guī)則,創(chuàng)建質(zhì)控調(diào)度計劃及周期,按需跑出質(zhì)控報告;對于評分較低的問題項,由實施工程師進行備注說明;1項35同時實施人員會對規(guī)則模版、規(guī)則標簽進行維護管理;1項36標準管理平臺主數(shù)據(jù)管理需支持提供組織機構、人員主數(shù)據(jù)的統(tǒng)一管理,支持將各系統(tǒng)中的主數(shù)據(jù)與標準主數(shù)據(jù)建立映射關系,提供對外主數(shù)據(jù)共享調(diào)用;1項37需支持提供對字典類型及字典項進行新增、修改、刪除及查詢功能,支持對字典類型進行分類管理;1項38需支持提供醫(yī)學術語的統(tǒng)一管理和查詢功能,包括:手術操作、診斷、藥品等;1項39需支持主數(shù)據(jù)碼表及映射關系訂閱;1項40元數(shù)據(jù)管理需支持對各信息系統(tǒng)采集的數(shù)據(jù)進行元數(shù)據(jù)自動提取,與之前提取的版本進行自動比對,可查看歷次元數(shù)據(jù)變更歷史;1項41需提供自定義數(shù)據(jù)模型,支持通過上傳EXCEL、CSV等格式的模型文件構建新的數(shù)據(jù)模型;1項42數(shù)據(jù)資產(chǎn)管理平臺資產(chǎn)概覽需支持統(tǒng)計展示業(yè)務系統(tǒng)類型數(shù)量、數(shù)據(jù)庫數(shù)量、數(shù)據(jù)表數(shù)量、數(shù)據(jù)字段數(shù)量和總數(shù)據(jù)量級;1項43需支持統(tǒng)計展示數(shù)據(jù)質(zhì)量評分;1項44需支持統(tǒng)計展示數(shù)據(jù)質(zhì)量規(guī)則;1項45資產(chǎn)地圖需支持可視化形式展示數(shù)據(jù)庫間關聯(lián)關系圖譜;1項46資產(chǎn)查詢需通過關鍵字對數(shù)據(jù)庫、數(shù)據(jù)表、數(shù)據(jù)字段進行全局檢索;通過多維篩選條件對數(shù)據(jù)庫、數(shù)據(jù)表、數(shù)據(jù)字段進行篩選,快速定位目標資產(chǎn);以列表形式展示符合篩選條件的對應資產(chǎn);1項47數(shù)據(jù)庫資產(chǎn)管理需支持查看數(shù)據(jù)庫概況;1項48需支持列表查看數(shù)據(jù)庫下數(shù)據(jù)表信息、元數(shù)據(jù)變更歷史、庫影響、庫血緣等;1項49需支持對數(shù)據(jù)庫屬性進行編輯管理;1項50數(shù)據(jù)表資產(chǎn)管理需支持查看數(shù)據(jù)表概況;1項51需支持展示某數(shù)據(jù)表下數(shù)據(jù)量的時間分布、表結(jié)構、表樣例數(shù)據(jù)、主外鍵關系、表影響、表血緣;1項52需支持對數(shù)據(jù)表屬性進行編輯管理;1項53字段資產(chǎn)管理需支持展示字段畫像信息;1項54需支持對字段屬性進行編輯管理;1項55SQL資產(chǎn)管理需支持通過關鍵字對SQL語句的名稱及SQL語句內(nèi)容進行搜索,搜索結(jié)果展示命中的SQL語句,包括:名稱、SQL語句、創(chuàng)建者等信息,選中一條SQL語句,用戶可對SQL語句進行編輯或運行;1項56數(shù)據(jù)質(zhì)控管理平臺數(shù)據(jù)質(zhì)量規(guī)則需支持提供對數(shù)據(jù)質(zhì)量監(jiān)控、問題發(fā)現(xiàn)、問題告警等功能,全程對數(shù)據(jù)質(zhì)量進行有效的監(jiān)督、控制和追溯;數(shù)據(jù)質(zhì)控范圍包括:數(shù)據(jù)完整性、一致性、準確性、唯一性、及時性等;1項57需支持根據(jù)實際應用需求,進行質(zhì)控規(guī)則新增、刪除、編輯、啟用、停用服務;1項58需支持對規(guī)則標簽的新增、刪除、編輯、查詢、展示;1項59需支持提供跨數(shù)據(jù)庫的質(zhì)控規(guī)則定義,包括設置規(guī)則邏輯、評價標準、規(guī)則權重和標簽;1項60需支持用戶自主新建正則類/SQL類的規(guī)則模版,包括規(guī)則標簽、權重和預警閾值配置;1項61質(zhì)量規(guī)則應用需支持建立單次、周期性調(diào)度質(zhì)控任務,支持查看質(zhì)控任務應用詳情;1項62數(shù)據(jù)質(zhì)量報告需支持自動生成數(shù)據(jù)質(zhì)控報告;1項63數(shù)據(jù)分級分類管理平臺數(shù)據(jù)分級管理需支持數(shù)據(jù)分級標準維護,支持數(shù)據(jù)分級對應的數(shù)據(jù)資產(chǎn)面板查看,展示不同分級對應的表數(shù)量、字段數(shù)量和安全數(shù)據(jù)分類數(shù)量;1項64系統(tǒng)需參考《GB/T39725-2020信息安全技術健康醫(yī)療數(shù)據(jù)安全指南》內(nèi)置5級數(shù)據(jù)分級;1項65安全數(shù)據(jù)分類需支持脫敏過濾條件配置,并基于配置進行行級別的字段脫敏,支持2個及以上條件的聯(lián)合分類管理;1項66業(yè)務數(shù)據(jù)分類需支持分類基本信息編輯、分類排序,支持業(yè)務數(shù)據(jù)分類查看,并可跳轉(zhuǎn)查看相應資產(chǎn)詳情;1項67數(shù)據(jù)識別規(guī)則需支持提供數(shù)據(jù)自動識別服務,包括數(shù)據(jù)識別規(guī)則、數(shù)據(jù)識別任務、數(shù)據(jù)識別記錄等;1項68需支持對數(shù)據(jù)識別規(guī)則進行管理,包括規(guī)則的查看、編輯、識別閾值設置,并內(nèi)置地址、姓名、身份證號等數(shù)據(jù)識別規(guī)則;1項69數(shù)據(jù)識別任務需支持具備數(shù)據(jù)識別任務查看及搜索功能,包括任務編號、任務狀態(tài)、數(shù)據(jù)庫名稱、數(shù)據(jù)庫中文名稱、數(shù)據(jù)表等內(nèi)容;1項70需支持自助添加數(shù)據(jù)識別任務,支持數(shù)據(jù)識別自定義表范圍設置;1項71數(shù)據(jù)識別記錄需支持具備數(shù)據(jù)識別記錄管理功能,支持對識別結(jié)果的確認和移除;1項72需支持字段分類識別、業(yè)務域識別記錄查看及模糊搜索定位;1項73業(yè)務域管理需支持提供業(yè)務域三級管理、業(yè)務域排序功能;1項74需支持支持業(yè)務域?qū)谋頂?shù)量的統(tǒng)計和展示;1項75數(shù)據(jù)分級分類初始化需支持內(nèi)置數(shù)據(jù)分類字典,包含人口學信息、健康史、就診記錄、體格檢查、病案首頁、藥品、手術麻醉、醫(yī)囑執(zhí)行、隨訪、體檢、生物樣本、病理檢查、護理、影像學檢查、基因檢測、實驗室檢驗、醫(yī)學診斷、處方醫(yī)囑、病程記錄、費用、放療、輸血等內(nèi)容;1項76需支持提供數(shù)據(jù)分類、業(yè)務域的初始化服務;1項77需支持基于映射邏輯自動解析字段血緣關系;1項78需支持提供基于數(shù)據(jù)識別規(guī)則的自動識別分類功能;1項79數(shù)據(jù)開放平臺數(shù)據(jù)查詢需支持對數(shù)據(jù)資產(chǎn)進行SQL數(shù)據(jù)查詢(需秒級響應)、數(shù)據(jù)導出(EXCEL、CSV、關系數(shù)據(jù)庫)和操作日志記錄;1項80需支持SQL查詢語句可保存并分享,分享后的SQL語句可以在資產(chǎn)平臺查詢,實現(xiàn)SQL語句的復用;1項81需支持對原始數(shù)據(jù)、加工數(shù)據(jù)、主題數(shù)據(jù)進行跨庫查詢,支持庫、表目錄搜索及詳情查看;1項82需支持對角色賬號設置脫敏或加密規(guī)則權限,根據(jù)權限級別查詢和導出對應類型數(shù)據(jù);1項83數(shù)據(jù)集管理需支持提供直連數(shù)據(jù)集、加工數(shù)據(jù)集、文件導入數(shù)據(jù)集等多種數(shù)據(jù)集構建功能;1項84需支持提供數(shù)據(jù)集的申請、創(chuàng)建、查詢、發(fā)布、展示、授權、使用等功能;1項85數(shù)據(jù)API需支持基于數(shù)據(jù)集封裝數(shù)據(jù)API申請,包括API名稱、API描述、接口方式、請求方式;1項86需支持提供數(shù)據(jù)API,包括結(jié)構化、標準化、脫敏技術等接口,支持第三方開發(fā)者在授權條件下調(diào)用;1項87需支持API中心提供列表顯示、關鍵詞搜索、在線申請、審批及調(diào)用功能;1項88數(shù)據(jù)開發(fā)需支持具備在線數(shù)據(jù)加工功能,包括拖拽組件、可視化數(shù)據(jù)處理邏輯編排、多種開發(fā)組件組合編排;1項89需支持具備周期調(diào)度任務的統(tǒng)一查看和管理功能,可配置單次、周期性任務調(diào)度;1項90需支持具備數(shù)據(jù)開發(fā)任務執(zhí)行及查看功能,包括任務運行、運行日志及樣例數(shù)據(jù)等;1項91需支持具備運行記錄管理功能,包括列表查看、詳情查看、運行監(jiān)控、異常通知等;1項92數(shù)據(jù)上報需支持通過平臺數(shù)據(jù)沙箱將數(shù)據(jù)上報的數(shù)據(jù)抽取與醫(yī)院實時業(yè)務相分離,有效降低抽取數(shù)據(jù)對醫(yī)院實時業(yè)務的影響;1項93需支持提供上報任務調(diào)度、數(shù)據(jù)轉(zhuǎn)換、數(shù)據(jù)推送、任務日志、失敗告警、超時告警等功能;1項94需支持全院上報數(shù)據(jù)集中管控,統(tǒng)一出口輸出、所有上報數(shù)據(jù)與操作都在平臺沉淀留痕;1項95數(shù)據(jù)安全管理平臺賬號角色管理需支持提供統(tǒng)一的賬號角色管理功能;包括角色新增、修改及刪除;支持角色設置,包括基本信息、數(shù)據(jù)權限和功能權限等;1項96數(shù)據(jù)安全管控及脫敏需支持提供數(shù)據(jù)安全管控及脫敏功能;1項97需支持具備角色安全等級設置,可自動過濾超出安全等級的數(shù)據(jù)庫表,超出角色安全等級的數(shù)據(jù)自動脫敏展示;1項98需支持授權高于角色安全等級的安全分類數(shù)據(jù)明文展示;1項99需支持對數(shù)據(jù)進行防泄漏安全配置,例如提供水印、防復制配置等;1項100審批管理需支持提供數(shù)據(jù)集審批管理功能,包括在線數(shù)據(jù)集申請、查看待審批記錄、申請同意或駁回操作;1項101運維監(jiān)控管理需支持提供數(shù)據(jù)采集、數(shù)據(jù)治理、數(shù)據(jù)導出、API監(jiān)控、SQL執(zhí)行記錄等操作日志,及資源運行運維監(jiān)控;1項102數(shù)據(jù)采集平臺數(shù)據(jù)源管理系統(tǒng)需支持待接入數(shù)據(jù)源的管理,增加數(shù)據(jù)源的配置相關信息,包括數(shù)據(jù)庫來源編碼、數(shù)據(jù)庫來源名稱、源數(shù)據(jù)庫名、發(fā)布前置機IP、數(shù)據(jù)發(fā)布器、發(fā)布器配置、源庫操作系統(tǒng)等相關內(nèi)容;1項103數(shù)據(jù)源配置需支持配置選定醫(yī)院的數(shù)據(jù)源信息,包括數(shù)據(jù)庫基礎信息、數(shù)據(jù)庫系統(tǒng)信息和數(shù)據(jù)庫備份恢復機制,配置完成后,在生產(chǎn)過程中,數(shù)據(jù)源會按照其配置去進行備份和恢復數(shù)據(jù)庫;1項104參數(shù)配置需支持配置備份接收目錄、存儲目錄、保留備份次數(shù)、告警目標;1項105表規(guī)則管理需支持對前置機的數(shù)據(jù)庫表和生產(chǎn)庫的表進行監(jiān)控配置,包括結(jié)構變化、行總量變化、行數(shù)輩分比變化、值變化等,配置完成后,當監(jiān)控到相應變化后,系統(tǒng)會進行預警;1項106脫敏配置需支持對前置恢復脫敏、DBLoader脫敏、TN脫敏配置統(tǒng)一管理;1項107脫敏配置文件需支持自動解析校驗存儲,支持DB和HIVE兩種類型輸入;1項108需支持實現(xiàn)對前置恢復脫敏、DBLoader脫敏、TN脫敏配置的統(tǒng)一管理;1項109需支持脫敏版本管理,所有的歷史數(shù)據(jù)變更可追溯;1項110需支持版本差異對比功能,提高問題排查追溯效率;1項111表監(jiān)控系統(tǒng)需支持對已配置監(jiān)控規(guī)則的表進行相應的監(jiān)控預警,系統(tǒng)展示表名、觸發(fā)的監(jiān)控規(guī)則及相關信息、告警時間等;1項112監(jiān)控告警系統(tǒng)需支持實時獲取各醫(yī)院下的數(shù)據(jù)庫狀態(tài),及時發(fā)現(xiàn)數(shù)據(jù)采集問題,監(jiān)控數(shù)據(jù)每天凌晨會自動匯總,通過郵件通知到數(shù)據(jù)采集人員及時處理;1項113數(shù)據(jù)治理平臺數(shù)據(jù)治理平臺系統(tǒng)為數(shù)據(jù)治理工程師提供數(shù)據(jù)匯聚、映射轉(zhuǎn)換等治理功能,解決數(shù)據(jù)治理的流程規(guī)范、過程追溯、以及任務調(diào)度和監(jiān)控困難等問題,提升數(shù)據(jù)治理的能力和效率;1項114投標人需具備一定的數(shù)據(jù)治理平臺開發(fā)能力;115需支持通過SQL語句將源數(shù)據(jù)映射到目標數(shù)據(jù)庫;1項116需支持數(shù)據(jù)快速預覽功能,在數(shù)據(jù)映射過程中可實時查看映射邏輯生產(chǎn)的真實數(shù)據(jù),并對重點字段的異常進行預警;1項117需支持SQL的語法、完整性和規(guī)則性校驗,提前攔截可能出現(xiàn)的問題,并可定位到對應的錯誤行;1項118數(shù)據(jù)標注平臺數(shù)據(jù)標注非結(jié)構化文本標注:1項119需支持對自然語言文本進行關鍵詞實體的標注,標注過程中會記錄標注結(jié)果,實體類型,開始位置和結(jié)束位置信息,為了保證數(shù)據(jù)質(zhì)量,標注任務可設置質(zhì)檢環(huán)節(jié);1項120實體標注:1項121標注結(jié)果中會包含文本內(nèi)容、文本開始位置和結(jié)束位置、實體類型等信息,需支持利用該工具方便的獲得各項NLP任務需要的標注語料;1項122工具需支持用算法模型對原始文本進行預標注,人工對算法結(jié)果進行確認,減少標注的工作量;1項123關系標注:1項124主要用于解決實體標注組件,無法標注實體關系的問題;1項125病歷標注:1項126病歷標注需支持提供根據(jù)病歷內(nèi)容進行結(jié)構化字段的標注功能,支持按照PID進行拆分任務、根據(jù)CRF表自動生成Form表單、支持多種字段類型、支持算法輔助的智能化標注、支持字段關鍵詞標注;1項127標注統(tǒng)計分析概覽統(tǒng)計:1項128需支持從月、周、日三個維度,查看參與人數(shù)、數(shù)據(jù)量、訂單數(shù)、任務數(shù)四個方面的數(shù)據(jù)趨勢;1項129標注工作量統(tǒng)計:1項1301、標注工作量統(tǒng)計、質(zhì)檢工作量統(tǒng)計、標注效率統(tǒng)計,為三個通用的統(tǒng)計報表,需支持根據(jù)項目自定義統(tǒng)計報表;1項1312、各統(tǒng)計頁面,需支持總覽統(tǒng)計和明細統(tǒng)計,并且可把統(tǒng)計數(shù)據(jù)以csv格式導出到本地;1項132標注效率統(tǒng)計:1項133需支持按照用戶和任務兩個維度查看標注效率,默認展示最近一個月的統(tǒng)計信息,支持自定義時間范圍;1項134需支持按照用戶維度的標注統(tǒng)計包括姓名、登錄賬號、任務數(shù)、數(shù)據(jù)條數(shù)、標注總量、總標注時長、平均注時長等信息;1項135需支持任務維度的標注統(tǒng)計包括姓名、登陸賬號、任務名稱、任務編號、數(shù)據(jù)條數(shù)、標注總量、總標注時長、平均注時長、領取時間、提交時間等信息;1項136數(shù)據(jù)導出:1項137需支持項目結(jié)束后支持下載標注結(jié)果文件,用于輔助算法模型及其它的用途,支持三種方式的數(shù)據(jù)導出;1項138標注組件管理注冊管理:1項139需支持平臺后臺管理,選擇“組件管理”,點“添加組件”,把組件名稱、組件英文名稱、組件類別、組件簡介等相關內(nèi)容填寫完成即可;1項140樣例數(shù)據(jù)維護管理:1項141需支持在對應的組件中,按照組件注冊的信息維護部分樣例數(shù)據(jù),實現(xiàn)樣例數(shù)據(jù)管理;1項142樣例圖片維護管理:1項143需支持在對應的組件中,選擇組件進行樣例圖片上傳功能;1項144標注組件庫管理:1項145需支持針對添加的所有組件,支持在組件庫中進行查看、增加、刪除、修改操作,實現(xiàn)組件庫的維護管理;1項146數(shù)據(jù)評估校驗完整性校驗需支持字段值有值率統(tǒng)計,實現(xiàn)字段值完整性校驗;1項147需支持跨字段或者跨表的完整性L2規(guī)則校驗,比如就診表出院狀態(tài)下,診斷表需要有入院診斷和出院診斷;1項148規(guī)范性校驗需支持字段值非標準率、違規(guī)率校驗;比如:藥品醫(yī)囑類型對應的醫(yī)囑內(nèi)容存在血常規(guī)等檢驗信息、婚姻狀態(tài)值超出了標準字典的范圍等;1項149傳輸差異性校驗需支持不同數(shù)據(jù)層之間相同業(yè)務類型表量級的傳輸差異校驗,便于預警生產(chǎn)流程中是否存在數(shù)據(jù)丟失;1項150孤兒數(shù)據(jù)統(tǒng)計需支持統(tǒng)計存在關聯(lián)關系的表與表之間的關聯(lián)率以及非關聯(lián)率統(tǒng)計
溫馨提示
- 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權益歸上傳用戶所有。
- 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預覽,若沒有圖紙預覽就沒有圖紙。
- 4. 未經(jīng)權益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
- 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負責。
- 6. 下載文件中如有侵權或不適當內(nèi)容,請與我們聯(lián)系,我們立即糾正。
- 7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。
最新文檔
- 2025服務員聘用合同
- 2025借款合同填寫注意事項
- 施工安全合同書(乙方承擔全部責任版)
- 課題申報參考:黎巴嫩女性文學中的性別敘事與國家建構
- 課題申報參考:老齡化背景下衰老信念對年長員工工作績效影響的機制研究
- 2025年新世紀版選修1歷史上冊階段測試試卷
- 2025年外研版三年級起點選擇性必修三語文上冊月考試卷
- 2024年華東師大版八年級地理上冊月考試卷含答案
- 2025年人教新起點八年級歷史下冊月考試卷含答案
- 2025年度物聯(lián)網(wǎng)設備制造與銷售合同范本4篇
- 2024年山東省泰安市高考物理一模試卷(含詳細答案解析)
- 護理指南手術器械臺擺放
- 腫瘤患者管理
- 2025年中國航空部附件維修行業(yè)市場競爭格局、行業(yè)政策及需求規(guī)模預測報告
- 2025春夏運動戶外行業(yè)趨勢白皮書
- 《法制宣傳之盜竊罪》課件
- 通信工程單位勞動合同
- 2024年醫(yī)療器械經(jīng)營質(zhì)量管理規(guī)范培訓課件
- 零部件測繪與 CAD成圖技術(中職組)沖壓機任務書
- 2024年計算機二級WPS考試題庫380題(含答案)
- 高低壓配電柜產(chǎn)品營銷計劃書
評論
0/150
提交評論