GB-T38327-《健康信息學中醫(yī)藥數據集分類》國家標準適用性評價研究_第1頁
GB-T38327-《健康信息學中醫(yī)藥數據集分類》國家標準適用性評價研究_第2頁
GB-T38327-《健康信息學中醫(yī)藥數據集分類》國家標準適用性評價研究_第3頁
GB-T38327-《健康信息學中醫(yī)藥數據集分類》國家標準適用性評價研究_第4頁
GB-T38327-《健康信息學中醫(yī)藥數據集分類》國家標準適用性評價研究_第5頁
已閱讀5頁,還剩7頁未讀 繼續(xù)免費閱讀

下載本文檔

版權說明:本文檔由用戶提供并上傳,收益歸屬內容提供方,若內容存在侵權,請進行舉報或認領

文檔簡介

1、    gb/t38327健康信息學中醫(yī)藥數據集分類國家標準適用性評價研究    劉洋 李海燕 賈李蓉 劉揚 甄思圓 孫華君 熊婕摘要:目的  對gb/t 38327-2019健康信息學 中醫(yī)藥數據集分類國家標準(以下簡稱“本標準”)的適用性進行評價,從用戶角度探索對本標準進行評價的方法。方法  本研究采用文獻調查法、對比驗證法等,選取6名測試人員對120個中醫(yī)藥數據集進行分類驗證,與本標準制訂人員進行一致性對比分析。結果  測試人員與本標準制訂人員分類平均一致率為:“創(chuàng)建者類型”分類代碼為79.72%,“數據來源類型”分類

2、代碼為71.67%,“主題類型”分類代碼為58.61%。經分析,發(fā)現(xiàn)可多重分類的數據集、綜合性主題數據集等是造成分類不一致的關鍵因素。結論  本標準所采用的適用性評價方法可作為分類編碼類標準研制過程中的分類優(yōu)化方法;本標準測試驗證過程中發(fā)現(xiàn)的問題可作為實施過程中制定有針對性推廣應用策略的依據,從而更有效地引導和方便用戶應用本標準實現(xiàn)數據集分類著錄、快捷檢索,最終達到本標準有效執(zhí)行之目的。關鍵詞:中醫(yī)藥數據集;分類標準;適用性評價:r2-03    :a    :2095-5707(2021)01-0007-06隨著我國中醫(yī)藥

3、事業(yè)的蓬勃發(fā)展和中醫(yī)藥信息化進程的加快,中醫(yī)藥行業(yè)各機構、各部門產生和積累了海量的科學數據和業(yè)務數據,為了解決大數據環(huán)境下龐大的數據資源分類組織與管理問題,gb/t 38327-2019健康信息學 中醫(yī)藥數據集分類國家標準(以下簡稱“本標準”)于2019年12月10日發(fā)布,并于2020年7月1日實施1。在標準實施的前期階段,需要探索各種有利于推進標準實施、提高標準質量的措施,而開展適用性評價研究正是其中一條有效途徑。在標準實施前的適用性評價體系中,評價指標和方法居于核心地位,設計出科學、合理而全面的評價標準是發(fā)揮實施前適用性評價實效的決定性因素。本文通過對中醫(yī)藥數據集分類標準的適用性評價研究,

4、從用戶角度探索對本標準進行評價的方法,制定有針對性的推廣策略,以便在本標準推廣應用過程中,更有效地引導和方便用戶應用本標準實現(xiàn)數據集分類著錄、快捷檢索,達到數據共享的目的,為本標準實施前期的進一步優(yōu)化提供參考依據。1  數據來源與評價方法1.1  數據來源本研究通過檢索萬方醫(yī)學網(http:/1.2  檢索策略選用關鍵詞檢索方法,檢索式為“(數據集or數據庫)and中醫(yī)藥”。在萬方醫(yī)學網中“論文檢索”的“資源分類限定”中限定“中國醫(yī)學”,篩選1998-2020年有關中醫(yī)藥的“數據集”“數據庫”相關文獻。在中國知網的“高級檢索”中,選擇“醫(yī)藥衛(wèi)生科技”類下列的“中醫(yī)

5、學”“中藥學”“中西醫(yī)結合”3個子類,篩選2003年10月30日-2020年5月11日的有關中醫(yī)藥的“數據集”“數據庫”相關文獻。檢索時間為2020年5月11日。1.3  納入標準根據中醫(yī)藥數據集定義,即有獨立主題,格式規(guī)范,能夠通過計算機采集、整合、存儲和展現(xiàn),可應用于中醫(yī)藥臨床、科研、管理和公眾服務等方面的相關數據的集合,能為各種用戶所共享,具有最小冗余度,數據間聯(lián)系密切,而又有較高的數據獨立性2。在萬方醫(yī)學網和中國知網文獻中,選擇有關中醫(yī)藥的“數據集”“數據庫”相關文獻。文獻類型包括:期刊;論著;會議記錄及摘要;綜述等。收集分析文獻中涵蓋的中醫(yī)藥數據集,做成中醫(yī)藥數據集匯總表。

6、1.4  排除標準排除標準:以現(xiàn)有的信息化系統(tǒng)為基礎,對現(xiàn)在的、歷史的、分散的業(yè)務數據集進行整合的綜合數據平臺,例如中醫(yī)藥多庫融合檢索平臺等。  利用計算機硬件、軟件、網絡通信設備及其他辦公設備進行信息的收集、傳輸、加工、儲存、更新、拓展和維護的管理信息系統(tǒng),例如醫(yī)院信息管理系統(tǒng)(his)等。涉及萬方醫(yī)學網和中國知網中有效的重復中醫(yī)藥數據集,保留中國知網的有效數據集。1.5  評價指標標準的適用性是指標準在某種條件下實現(xiàn)規(guī)定用途和功能的能力。構建標準適用性評價指標體系,有利于提高我國標準的立項、復審及標準建設的科學性3。標準適用性評價指標分為技術評價指標和綜合評價

7、指標兩大類4。1.5.1  技術評價指標  包括技術的合理性、級別的適當性、顆粒度的適宜性、水平的先進性、應用的廣泛性。技術的合理性,指從技術指標的全面性、精確性、可操作性考察標準的適用性。級別的適當性,指擬定標準的級別是否與其適用范圍和制發(fā)標準權限相符合,屬于強制性標準還是推薦性標準的判定是否恰當。顆粒度的適宜性,體現(xiàn)了標準結構方面的適用性,如果顆粒度不適宜就要進行新的整合。標準顆粒度是指某一標準所反映的標準化對象及其適用范圍、用途、內容等要素的量度單位。標準化對象適用范圍越小,用途越少,標準的顆粒度越小。水平的先進性,一是考察標準的技術水平與我國經濟社會發(fā)展是否同步,標

8、準技術水平是否體現(xiàn)本領域研究水平、本行業(yè)管理水平;二是看與同類型國際標準比較而言是否先進,主要看是否已采用國際標準及所采用的國際標準是否先進。應用的廣泛性,主要是指用戶使用該標準的情況及該標準被引用的情況4。1.5.2  綜合評價指標  包括完整性、系統(tǒng)性和協(xié)調性。標準的完整性,按照標準編寫規(guī)范時要求科學地界定并保證各子分類的完整性。標準的系統(tǒng)性,解決功能需求配置是否到位、分布是否平衡、顆粒度是否科學等問題。首先,標準的功能需求配置是否到位問題,主要在于標準需求描述是否清晰;其次,針對分布是否平衡問題,標準體系建設中要優(yōu)先建設急需標準和重點難點部分,將工作重點放在新興管理對

9、象標準體系的建設方面;最后,標準的顆粒度粗細適宜。標準顆粒度的粗細設置并非整齊劃一,從構成整個標準體系結構的標準來看,應當有大顆粒的指導性標準,也應有小顆粒的操作性標準。標準的協(xié)調性,包括技術協(xié)調和組織協(xié)調。首先,實現(xiàn)技術協(xié)調,應當明確國家標準、行業(yè)標準、團體標準和地方標準的關系,避免標準重復建設問題,保障標準體系的精簡高效;其次,實現(xiàn)組織協(xié)調,不同的行業(yè)主管部門或標準委員會條塊分割,要建立暢通的協(xié)調機制,杜絕出現(xiàn)標準交叉重復或矛盾現(xiàn)象。即各單位積極抽調人力組成標準建設項目小組,尊重項目負責人的權威,服從安排,協(xié)調配合,共同為實現(xiàn)標準建設項目而努力4。1.6  評價方法從萬方醫(yī)學網和

10、中國知網文獻檢索結果中,人工篩選中醫(yī)藥領域現(xiàn)有的各類數據集,再從中隨機抽樣篩選13%的涵蓋中醫(yī)藥各領域的數據集,例如:民國針灸文獻全文數據庫、中醫(yī)電子病歷基本數據集、海派中醫(yī)流派數據庫、中藥化學成分數據庫、中醫(yī)基本名詞術語英文同義詞數據庫、中國藏藥數據庫等。通過廣泛搜集原始數據項,并經過整理、歸類,將中醫(yī)藥數據集的“名稱”“制作單位”及“數據來源”的原始數據作為分類基礎,建立“健康信息學 中醫(yī)藥數據集分類國家標準編碼評價表”。選取2名科研人員和4名碩士、博士研究生作為測試人員,讓其充分了解本標準中第5項“分類與代碼表”的“創(chuàng)建者類型代碼表”“數據來源類型代碼表”和“主題類型代碼表”的說明,然后

11、將中醫(yī)藥數據集按照本標準進行分類驗證,將其分別對應到3個維度類目中,即“創(chuàng)建者類型”“數據來源類型”及“主題類型”類目并賦予代碼。6位測試人員和1位本標準制訂人員從3個維度的類目代碼下拉選項選擇、區(qū)分、判別、驗證、歸納中醫(yī)藥數據集。2  結果2.1  文獻檢索結果在萬方醫(yī)學網中檢索到符合納入標準與排除標準的有關中醫(yī)藥的“數據集”“數據庫”相關文獻    17 871篇,中國知網為1 598篇。綜合中醫(yī)藥文獻數據庫檢索結果,排除重復的中醫(yī)藥數據集,人工篩出中醫(yī)藥領域現(xiàn)有各類數據集926個。再從中隨機抽樣篩選13%的涵蓋中醫(yī)藥各領域數據集120個。

12、2.2  分類驗證結果將上述7位人員應用本標準的分類結果綜合匯總到健康信息學 中醫(yī)藥數據集分類國家標準編碼評價表(見表1),建立中醫(yī)藥數據集分類驗證一致性對比表,得出評價結果。將測試人員與本標準制訂人員的分類結果進行對比,其計算方法為:分類相同項除以120(即抽樣總分類數),來驗證結果的一致性。例如,“創(chuàng)建者類型”:測試人員4有86個分類與本標準制訂人員分類相同,86/120=71.67%,即兩類人員的一致性為71.67%。以此計算方法對本標準的適用性評價作出驗證,結果顯示,第一類目“創(chuàng)建者類型”分類代碼中:6名測試人員與1名本標準制訂人員分類結果的一致率分別為70.83%、90.8

13、3%、94.17%、71.67%、70.83%、80.00%。第二類目“數據來源類型”分類代碼中,一致率分別為69.17%、66.67%、62.50%、65.00%、70.00%、96.67%。第三類目“主題類型”分類代碼中,一致率分別為50.00%、57.50%、53.33%、50.00%、48.33%、92.50%。驗證結果,上述3個類目代碼的平均一致率分別為79.72%、71.67%、58.61%。中醫(yī)藥數據集分類驗證一致性對比數據表明,測試人員與本標準制訂人員分類一致率均為50%及以上。表1中,若一致性較高的主題分類相等時,以本標準制訂分類為主,如中醫(yī)基本名詞術語英文同義詞數據庫,一致

14、性較高的分類為2個教育管理和2個文化管理,此時以本標準制訂的“教育管理”分類為主,加“*”表示。表1中的“其他”項,根據代碼的不同其含義不同(具體詳見本標準中主題類型代碼表說明),如“029900其他”為數據主題未包含在“020000中醫(yī)”項下的“020100基礎理論”“020200臨床實踐”“020300養(yǎng)生保健”“020400中西醫(yī)結合”此4類中的其他中醫(yī)實踐活動產生的信息。2.3  評價結果2.3.1  技術評價結果  通過用戶分類驗證,對本標準進行如下技術評價:技術的合理性:本標準按照gb/t 1.1-2009標準化工作導則-第1部分:標準的結構和編寫提出

15、的規(guī)則起草,選擇中醫(yī)藥數據集最穩(wěn)定的本質屬性或特征作為分類的基礎和依據,使用面分類法和線分類法,將中醫(yī)藥數據集的屬性或特征按一定排列順序予以系統(tǒng)化,形成一個科學合理的分類體系,其技術內容完整,技術手段可行,技術合理。級別的適當性:本標準適用范圍廣,但非保障人體健康,人身、財產安全,工程建設質量、安全,衛(wèi)生標準及法律、行政法規(guī)規(guī)定的強制執(zhí)行標準,適宜作為推薦性標準。顆粒度的適宜性:本標準涉及中醫(yī)藥領域數據資源的各個方面,標準本身的顆粒度大。在具體結構方面,“創(chuàng)建者類型“和“數據來源類型”的分類層次為1層,測試分類一致性較高,“主題類型”分類層次為2層,分類一致性較前兩者低,可見,分類的顆粒度愈細

16、,則分類的一致性愈低。因而在實際應用時,建議用戶可以對主題進行多重分類。水平的先進性:本標準適應目前中醫(yī)藥信息化發(fā)展進程和大數據時代的數據管理需求,且與國際標準同步發(fā)布,水平先進性高。應用的廣泛性:本標準為眾多繁雜的中醫(yī)藥數據資源提供分類編碼,幫助數據進行分類組織與管理,中醫(yī)藥醫(yī)療、教育、科研、產業(yè)、養(yǎng)生保健、國際交流等各方面都將廣泛運用。2.3.2  綜合評價結果  標準的完整性:由于120個中醫(yī)藥數據集是從926個數據集中篩選,涵蓋中醫(yī)藥各個領域,在本標準里均能夠找到對應的分類類目與代碼,且類目概念明確,范圍清晰,不存在重復冗余,驗證了本標準的完整性。標準的系統(tǒng)性:標準

17、需求描述清晰,功能需求配置到位。在本標準引言中指出,面對龐雜的數據資源,需要建立標準來進行分類組織和管理。本標準在標準體系建設中適應大數據技術發(fā)展,將工作重點放在新興管理對象標準體系建設方面,因此分布平衡。從構成整個標準體系結構方面來看,屬于顆粒度大的指導性標準,指導中醫(yī)藥數據集分類組織和管理,不屬于顆粒度小的操作性標準。標準協(xié)調性:iso/ts 22558:2019健康信息學 中醫(yī)藥數據集分類國際標準與本標準同步采標,本標準對國際標準進行了修改,在主題類型代碼表中,增加了1個一級類目“中國少數民族醫(yī)藥”,并在此類目下設置了9個二級類目,以適應中國少數民族醫(yī)藥數據集分類的需要,避免了標準重復建

18、設問題,保障了本標準體系的精簡高效。3  討論與分析中醫(yī)藥數據集分類驗證結果,“創(chuàng)建者類型”“數據來源類型”“主題類型”平均不一致率分別為20.28%、28.33%、41.39%。分析其不一致的原因在于以下幾個方面。3.1  人員因素選取的6名測試人員是中醫(yī)藥科研人員及在讀碩士、博士研究生,因研究專業(yè)和職稱不同,驗證結果部分存在差異。且是否使用過本標準明顯影響驗證結果,使用過本標準的用戶對其評價比未使用者要高,會產生分類人為誤差。3.2  數據來源因素3.2.1  可多重分類的數據集  在本標準編碼評價表中,有些類目可進行多重分類,例如,“中醫(yī)

19、肺病數據庫”的“創(chuàng)建者類型”可多重分類,根據文獻描述,創(chuàng)建者為“河南中醫(yī)藥大學呼吸疾病診療與新藥研發(fā)河南省協(xié)同創(chuàng)新中心、河南省中醫(yī)藥防治呼吸病重點實驗室、南陽理工學院張仲景國醫(yī)國藥學院”共同創(chuàng)建,其“創(chuàng)建者類型”則可能分類到“研究機構”或“教育機構”類目代碼下,導致分類偏差。3.2.2  綜合性主題數據集  在本標準編碼評價表中,有些類目是綜合性中醫(yī)藥數據集,不屬于基本的數據單元,即非單一主題的數據集。例如,“中藥綜合數據庫”為非單一主題的中藥數據集,“主題類型”中,測試人員分別將其分類到“中藥”“方劑學”“中藥藥理學”和“其他”。3.2.3  不易分類的數據集

20、 在120個中醫(yī)藥數據集中,有一些數據集主題類型不易分類,也可能導致分類的不一致性。例如,“中醫(yī)基本名詞術語英文同義詞數據庫”的“主題類型”,測試人員將其分別分類到“教育管理”“文化管理”“中醫(yī)”和“其他”。3.3  解決對策3.3.1  加強標準宣傳推廣并制訂針對性的實施策略  提高中醫(yī)藥數據集分類標準使用單位人員的信息化職業(yè)素質,將本標準的分類描述作為培訓的重要內容。將用戶對本標準分類驗證的結果作為問題目標,在本標準實施過程中,制定有針對性的實施策略,更有效地引導和方便用戶應用本標準實現(xiàn)數據集分類著錄、快捷檢索,達到本標準有效執(zhí)行之目的。3.3.2

21、 多重分類基礎上推薦最優(yōu)分類  對于多主題的中醫(yī)藥數據集,可以給予導向,在多重分類基礎上推薦最優(yōu)分類。例如,“創(chuàng)建者類型”是多家單位共同創(chuàng)建,可選擇主要創(chuàng)建單位作為最優(yōu)分類,其他類型可以多重分類。針對“主題類型”的分類,在說明與舉例中可以做補充界定說明,可以進行多重分類,賦予數據集多個分類號。3.3.3  綜合類主題的數據集可歸入一級類目  對于綜合性和不易分類的中醫(yī)藥數據集,比如主題內部涉及包含關系、屬種關系、整體與部分關系,一般依據較大較全的主題歸類,分類到一級類目;如果重點是小主題,可根據需要按照小主題歸類。例如,“中藥綜合數據庫”的“主題類型”,

22、可分類到一級類目“中藥”項下,不具體分類到二級類目“中藥”“方劑學”“中藥藥理學”“其他”等子類目項下。4  小結本標準按照科學的規(guī)劃和設計制訂,具有較高的適用性,可操作性較強,用戶使用反饋良好;技術合理,級別適當,顆粒度適宜,水平較先進,應用廣泛;完整性、系統(tǒng)性和協(xié)調性程度較高,基本包含整個中醫(yī)藥行業(yè)內數據資源,使更多的用戶需求數據能夠規(guī)范化,達到中醫(yī)藥數據資源的集成與共享。在推廣應用時,根據本研究測試驗證過程中發(fā)現(xiàn)的問題,例如可以多重分類等,需制訂相對應的、有針對性的本標準實施推廣策略,更有效地引導和方便用戶應用本標準實現(xiàn)數據集分類著錄、快捷檢索,最終達到本標準有效執(zhí)行之目的。通過本次

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網頁內容里面會有圖紙預覽,若沒有圖紙預覽就沒有圖紙。
  • 4. 未經權益所有人同意不得將文件中的內容挪作商業(yè)或盈利用途。
  • 5. 人人文庫網僅提供信息存儲空間,僅對用戶上傳內容的表現(xiàn)方式做保護處理,對用戶上傳分享的文檔內容本身不做任何修改或編輯,并不能對任何下載內容負責。
  • 6. 下載文件中如有侵權或不適當內容,請與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

評論

0/150

提交評論