醫(yī)學(xué)一體化語(yǔ)言系統(tǒng)(UMLS)課件_第1頁(yè)
醫(yī)學(xué)一體化語(yǔ)言系統(tǒng)(UMLS)課件_第2頁(yè)
醫(yī)學(xué)一體化語(yǔ)言系統(tǒng)(UMLS)課件_第3頁(yè)
醫(yī)學(xué)一體化語(yǔ)言系統(tǒng)(UMLS)課件_第4頁(yè)
醫(yī)學(xué)一體化語(yǔ)言系統(tǒng)(UMLS)課件_第5頁(yè)
已閱讀5頁(yè),還剩46頁(yè)未讀, 繼續(xù)免費(fèi)閱讀

下載本文檔

版權(quán)說(shuō)明:本文檔由用戶(hù)提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請(qǐng)進(jìn)行舉報(bào)或認(rèn)領(lǐng)

文檔簡(jiǎn)介

1、醫(yī)學(xué)一體化語(yǔ)言系統(tǒng)(UMLS)中研信公司醫(yī)學(xué)一體化語(yǔ)言系統(tǒng)(UMLS)中研信公司前言20世紀(jì)中葉是情報(bào)語(yǔ)言學(xué)研究中人工語(yǔ)言發(fā)展的鼎盛時(shí)期,20世紀(jì)末葉是人工語(yǔ)言與自然語(yǔ)言相結(jié)合的新興階段。自然語(yǔ)言由于存在詞匯的同義、多義現(xiàn)象,詞匯的模糊性和不確定性,詞匯量的巨大,詞間關(guān)系不明晰等問(wèn)題,不可能單純使用它進(jìn)行檢索,所以需要用一種受控檢索語(yǔ)言對(duì)檢索和標(biāo)引所用的詞匯進(jìn)行控制,把用戶(hù)的語(yǔ)言和標(biāo)引人員的語(yǔ)言統(tǒng)一起來(lái)。 由于信息量的擴(kuò)充, 給人工語(yǔ)言的處理帶來(lái)了很大的困難。前言20世紀(jì)中葉是情報(bào)語(yǔ)言學(xué)研究中人工語(yǔ)言發(fā)展的鼎盛時(shí)期,2(1)工作量大。因?yàn)槠涔ぷ鞣彪y,國(guó)外的信息檢索系統(tǒng)中有75%的運(yùn)行費(fèi)用要用于

2、人工標(biāo)引。(2)效率低。標(biāo)引員要正確標(biāo)引一篇文獻(xiàn),往往要耗時(shí)一個(gè)半小時(shí)以上。(3)一致性差。美國(guó)的Cleverton曾做過(guò)一些試驗(yàn),他指出:兩組人為同一主題編出的敘詞表,其中詞的同一率僅60%。兩位有經(jīng)驗(yàn)的標(biāo)引員用同一敘詞表對(duì)同一篇文獻(xiàn)進(jìn)行標(biāo)引,其標(biāo)引詞的同一率僅有30%左右。兩個(gè)在同一庫(kù)中用同一檢索系統(tǒng)檢索同一問(wèn)題的人,檢索出的結(jié)果的同一率僅有40%。兩位科研人員根據(jù)同一提問(wèn)判斷一組指定文獻(xiàn)的相關(guān)性,其同一率不會(huì)超過(guò)60%。(1)工作量大。因?yàn)槠涔ぷ鞣彪y,國(guó)外的信息檢索系統(tǒng)中有75%(4)詞表的不完備性影響了標(biāo)引的質(zhì)量。詞表的更新趕不上時(shí)代發(fā)展的步伐。龐大的詞表,使標(biāo)引速度大大地降低。(5

3、)標(biāo)引員與檢索員都必需熟悉詞表才能工作,使用非常不便。因此,必須發(fā)展使用電腦來(lái)進(jìn)行自動(dòng)標(biāo)引。早在1956年,美國(guó)的H.P.Luhn就開(kāi)始了文獻(xiàn)自動(dòng)標(biāo)引的試驗(yàn);60年代初,美國(guó)的G.Salton教授在自動(dòng)標(biāo)引方面取得了令世界矚目的成就。中醫(yī)藥文獻(xiàn)數(shù)據(jù)庫(kù)在多年的建庫(kù)過(guò)程中,深刻體會(huì)到標(biāo)引工作的復(fù)雜性與耗時(shí)、人、財(cái)量。 (4)詞表的不完備性影響了標(biāo)引的質(zhì)量。詞表的更新趕不上時(shí)代發(fā)為實(shí)現(xiàn)自動(dòng)標(biāo)引與自由檢索,以及數(shù)據(jù)庫(kù)的深層次加工與數(shù)據(jù)挖掘?,F(xiàn)行方法有二個(gè)方面。數(shù)據(jù)庫(kù)結(jié)構(gòu)的拆分與細(xì)化。語(yǔ)言處理。 美國(guó)國(guó)立醫(yī)學(xué)圖書(shū)館研制了統(tǒng)一的醫(yī)學(xué)語(yǔ)言系統(tǒng)(Unified Medical Language System,

4、UMLS),其目的在于克服計(jì)算機(jī)生物醫(yī)學(xué)信息檢索中相同的概念具有不同的表達(dá)方式,有用的信息分散在不同的數(shù)據(jù)庫(kù)系統(tǒng)中。 為實(shí)現(xiàn)自動(dòng)標(biāo)引與自由檢索,以及數(shù)據(jù)庫(kù)的深層次加工與數(shù)據(jù)挖掘。一、UMLS的建立與發(fā)展過(guò)程建立目的: 旨在建立一個(gè)計(jì)算機(jī)化的可持續(xù)發(fā)展的生物醫(yī)學(xué)檢索語(yǔ)言集成系統(tǒng)和機(jī)讀情報(bào)資源指南系統(tǒng),其目的在于提高計(jì)算機(jī)程序“理解”用戶(hù)提問(wèn)中生物醫(yī)學(xué)詞匯語(yǔ)義的能力,并利用這種理解幫助用戶(hù)檢索和獲取相關(guān)的機(jī)讀情報(bào)。UMLS是計(jì)算機(jī)化的情報(bào)檢索語(yǔ)言集成系統(tǒng),它不僅是語(yǔ)言翻譯、自然語(yǔ)言處理及語(yǔ)言規(guī)范化的工具,而且是實(shí)現(xiàn)跨數(shù)據(jù)庫(kù)檢索的詞匯轉(zhuǎn)換系統(tǒng),它可以幫助用戶(hù)在聯(lián)接情報(bào)源,包括計(jì)算機(jī)化的病案記錄、書(shū)目

5、數(shù)據(jù)庫(kù)、事實(shí)數(shù)據(jù)庫(kù)以及專(zhuān)家系統(tǒng)的過(guò)程中對(duì)其中的電子式生物醫(yī)學(xué)情報(bào)作一體化檢索。是使醫(yī)療衛(wèi)生專(zhuān)業(yè)人員和研究工作者能夠通過(guò)多種交互檢索程序,克服由于不同系統(tǒng)語(yǔ)言差異性和不同數(shù)據(jù)庫(kù)相關(guān)情報(bào)的分散性所造成的諸多情報(bào)檢索問(wèn)題,幫助用戶(hù)從電子病案系統(tǒng)、書(shū)目數(shù)據(jù)庫(kù)、圖像數(shù)據(jù)庫(kù)、事實(shí)數(shù)據(jù)庫(kù)、專(zhuān)家系統(tǒng)等各種聯(lián)機(jī)情報(bào)源中檢索和獲取綜合性或特定性的情報(bào)信息。 主要解決:1)同一概念由于不同的人或在不同的數(shù)據(jù)庫(kù)中可能會(huì)有不同的表達(dá)方式; 2) 數(shù)據(jù)庫(kù)系統(tǒng)分散所造成的檢索不完整的問(wèn)題 。 一、UMLS的建立與發(fā)展過(guò)程建立目的:發(fā)展過(guò)程1986-1988的第一階段,其研究和開(kāi)發(fā)的重點(diǎn)是調(diào)查用戶(hù)需求、開(kāi)發(fā)研究工具、 確定U

6、MLS的性能及其實(shí)施方案、界定系統(tǒng)組成等。在此階段主要界定了UMLS的三個(gè)組成部分即超級(jí)敘詞表、語(yǔ)義網(wǎng)絡(luò)、情報(bào)源圖譜,并且進(jìn)行了包括Mesh、SNOMED、CMIT和PDQ詞表在內(nèi)的聯(lián)接試驗(yàn)。 1989-1991年為UMLS的發(fā)展階段,其開(kāi)發(fā)的重點(diǎn)是迅速研制和發(fā)行三個(gè)UMLS產(chǎn)品的試驗(yàn)版,同時(shí)繼續(xù)開(kāi)展用戶(hù)調(diào)查和UMLS功能開(kāi)發(fā)。 92年至今為應(yīng)用階段 ,1996年UMLS新增了一個(gè)組成部分即“專(zhuān)家詞典”。在此階段,許多研究機(jī)構(gòu)利用UMLS 進(jìn)行基于Internet的應(yīng)用開(kāi)發(fā),如決策支持系統(tǒng)DX plain、文獻(xiàn)檢索系統(tǒng)Web medicine、臨床Web搜索系統(tǒng)Clin web、醫(yī)學(xué)世界檢索M

7、edical world search以及集成化的Med weaver等。同時(shí)進(jìn)行了NLM/AHCPR大規(guī)模詞匯測(cè)試。 發(fā)展過(guò)程1986-1988的第一階段,其研究和開(kāi)發(fā)的重點(diǎn)是調(diào)二、UMLS的組成超級(jí)敘詞表(Metathesaurus)語(yǔ)義網(wǎng)絡(luò)( Semantic Network)情報(bào)源圖譜(Information sources Map ISM)專(zhuān)家詞典(Specialist Lexicon) 四個(gè)部分組成。這四部分緊密聯(lián)系、不可分割,構(gòu)成了一個(gè)有機(jī)的整體。 二、UMLS的組成超級(jí)敘詞表(Metathesaurus)( 1 )超級(jí)敘詞表超級(jí)敘詞表是生物醫(yī)學(xué)概念、術(shù)語(yǔ)、詞匯及其等級(jí)范疇的廣泛

8、集成?!癕eta”意即超越、含蓋。 1997年第8版的超級(jí)敘詞表收錄了來(lái)源于30多種生物醫(yī)學(xué)詞表和分類(lèi)表的能表達(dá)33萬(wàn)多個(gè)概念的739439個(gè)詞匯,2001年12版收錄了83萬(wàn)個(gè)概念,190萬(wàn)個(gè)詞。到2002年,第13版超級(jí)敘詞表收錄了776940個(gè)概念共210萬(wàn)個(gè)詞。來(lái)源:這些概念和詞來(lái)自60 多個(gè)生物醫(yī)學(xué)受控詞表、術(shù)語(yǔ)表、分類(lèi)表、專(zhuān)家系統(tǒng)中的詞匯、詞典及工具性詞表等,如Mesh表及其葡萄牙語(yǔ)、西班牙語(yǔ)、法語(yǔ)、德語(yǔ)、俄語(yǔ)等各種譯本、 醫(yī)學(xué)系統(tǒng)化術(shù)語(yǔ)表、 國(guó)際疾病分類(lèi)修訂第 10 版及其他各版、 護(hù)理診斷分類(lèi)、麻省總醫(yī)院研制開(kāi)發(fā)的DX plain專(zhuān)家系統(tǒng)、 多蘭氏圖解醫(yī)學(xué)辭典、 校對(duì)詞表3.1

9、 版等。( 1 )超級(jí)敘詞表醫(yī)學(xué)一體化語(yǔ)言系統(tǒng)(UMLS)課件概念組織: 敘詞表是依據(jù)概念(concept)或涵義(meaning)組織起來(lái)的,其根本目的是將相同概念的交替名稱(chēng)和不同形式聯(lián)系在一起,并識(shí)別不同概念之間的聯(lián)系。因此,可以說(shuō)概念是超級(jí)敘詞表組織系統(tǒng)的中心。保留原有詞表中概念與關(guān)系,同時(shí)增加了一個(gè)新的關(guān)聯(lián)。整合成一個(gè)龐大的可控的知識(shí)庫(kù)。對(duì)于同一概念的不同術(shù)語(yǔ)以及不同的變異形式,超級(jí)敘詞表采用三級(jí)結(jié)構(gòu)模式,即概念(I 級(jí))-術(shù)語(yǔ)(II 級(jí))-詞串(III 級(jí)),將一個(gè)概念的多種不同術(shù)語(yǔ)連同多個(gè)變異詞串有序地組織在一起。對(duì)于不同的概念,超級(jí)敘詞表采用多種“關(guān)系”概念如相關(guān)概念、組配概念、

10、共現(xiàn)概念等來(lái)描述不同概念之間的關(guān)系。 概念組織:醫(yī)學(xué)一體化語(yǔ)言系統(tǒng)(UMLS)課件表達(dá)相同概念的不同形式款目關(guān)聯(lián)表達(dá)相同概念的語(yǔ)詞串接起來(lái),并在不同概念間建立關(guān)系,便于主題相關(guān)性的判斷 。在Meta中的每一個(gè)概念都會(huì)被指定一個(gè)概念識(shí)別碼(unique concept identifier , 簡(jiǎn)稱(chēng)CUI)。CUI本身不具意義,只用作連結(jié)的指針。而每一個(gè)表達(dá)概念含意的字符串(name or string),不管是大小寫(xiě)的分別或語(yǔ)文上拼字的不同,凡是有差異者均視為一個(gè)獨(dú)立的字符串,而分別賦予不同的字符串識(shí)別碼(unique string identifier, 簡(jiǎn)稱(chēng)SUI)。由于Meta實(shí)際上是由

11、英文款目所構(gòu)成的,所以不同詞型間表達(dá)相同概念的語(yǔ)詞要能連結(jié)在一起,就必須依賴(lài)一般形式識(shí)別碼術(shù)語(yǔ)碼(common term identifier, 簡(jiǎn)稱(chēng)LUI)的指引。 表達(dá)相同概念的不同形式款目關(guān)聯(lián)表達(dá)相同概念的語(yǔ)詞串接起來(lái)醫(yī)學(xué)一體化語(yǔ)言系統(tǒng)(UMLS)課件Concept (CUI)Terms (LUIs)Strings (SUIs)C0004238 Atrial Fibrillation (preferred) Atrial Fibrillations Auricular Fibrillation Auricular FibrillationsL0004238 Atrial Fibrilla

12、tion (preferred) Atrial FibrillationsS0016668 Atrial Fibrillation (preferred)S0016669 Atrial FibrillationsL0004327 (synonym) Auricular Fibrillation Auricular FibrillationsS0016899 Auricular Fibrillation (preferred)S0016900 (plural variant) Auricular FibrillationsConcept (CUI)Terms (LUIs)Strin表1:字符串“

13、Atrial Fibrillation”(心房纖維顫動(dòng))和字符串“Atrial Fibrillations” 在系統(tǒng)中被視為不同的字符串,故分別給予不同的SUI編碼。然此二字符串實(shí)際上僅是單復(fù)數(shù)形上的差別,所以會(huì)被指引到相同的Term identifier (LUIs);同理“Auricular Fibrillation”和“Auricular Fibrillations”也會(huì)同樣被指引到另一個(gè)term identifier (LUIs)。而當(dāng)系統(tǒng)檢視term identifier時(shí)會(huì)發(fā)現(xiàn)“Artial Fibrillation” 和 “Auricular Fibrillation” 在意義上

14、是一致的,所以二個(gè)LUIs會(huì)被指引到相同的concept identifier (CUIs)。如此循序建立四個(gè)不同形式但表達(dá)相同概念之語(yǔ)詞間的關(guān)系。不同語(yǔ)詞間關(guān)系建立之后,會(huì)牽涉到選擇用語(yǔ)的問(wèn)題,如:概念的標(biāo)準(zhǔn)用語(yǔ)、參照互見(jiàn)及縮寫(xiě)形式等。為了節(jié)省在選擇選用語(yǔ)時(shí)所花費(fèi)的心力,Meta的處理程序是建立索引表間的優(yōu)先級(jí)。以UMLS現(xiàn)有的策略而言, MeSH是Meta所涵蓋索引詞中,擁有最高優(yōu)先權(quán)的索引系統(tǒng),所以MeSH中出現(xiàn)的概念詞均視為選用詞(preferred term),而其它索引表中若有出現(xiàn)表達(dá)相同概念而形式不同的語(yǔ)詞時(shí),則視為參照款目。同理,若在MeSH中未涵蓋的概念,則依第二順位的索引表

15、來(lái)決定選用詞的形式,依此類(lèi)推。 表1:醫(yī)學(xué)一體化語(yǔ)言系統(tǒng)(UMLS)課件Meta利用LUIs來(lái)串接SUIs及CUIs。但是這種處理方式有可能導(dǎo)致一個(gè)字符串若含有多種意義時(shí),可能會(huì)被錯(cuò)誤指引。尤其是Meta中包含多個(gè)索引表系統(tǒng),此類(lèi)狀況當(dāng)然可能發(fā)生。舉例:字符串Cold的含義可能指溫度上的冷,也可能是指一般感冒,因此在SUIs中將其分別定義為cold (1)、cold (2),在String部份就會(huì)產(chǎn)生四個(gè)與cold近似的字。因cold、cold (1)、cold (2)在拼字上僅有些許差異,故被指引到同一個(gè)LUI,相對(duì)的Common Cold則被指定為另一個(gè)LUI。而檢視Term identi

16、fier時(shí),根據(jù)語(yǔ)詞含義,再分別指引到所屬含義的CUIs,其中Cold因語(yǔ)義模糊,所以被指引到二個(gè)Concept identifier,系統(tǒng)以此方式解決同一字符串不同內(nèi)涵會(huì)被錯(cuò)誤指引的問(wèn)題。然而在以后的版本中,有關(guān)處理同形異義的問(wèn)題,可能會(huì)采用限定詞的方式,如“cold (temperature)”, “cold (disease)”等 。Meta利用LUIs來(lái)串接SUIs及CUIs。但是這種處理方FIGURE 2.Concepts (CUIs)Terms (LUIs)Strings (SUIs)C0009264 cold temperatureL0215040 cold temperatur

17、eS0288775 cold temperatureL0009264 Cold ColdS0007170 Cold S0026353 ColdC0009443 Common ColdL0009443 Common ColdS0026747 Common ColdL0009264 Cold ColdS0007171 Cold S0026353 ColdFIGURE 2.Concepts (CUIs)Terms不同概念間關(guān)聯(lián)的建立 在Meta中展示了不同概念間的各種關(guān)系,而這些關(guān)系的建立,有些是取自原有的索引表架構(gòu),有些則是在建構(gòu)Meta時(shí)所賦與的。例如“Atrial Fibrillation”

18、(心房纖維顫動(dòng))和“Arrhythmia”(心律失常)在MeSH中是以層級(jí)架構(gòu)來(lái)展示二詞間的隸屬關(guān)系。但“Atrial Fibrillation”在本質(zhì)上也是一種“Arrhythmia” 在MeSH中卻沒(méi)有被展現(xiàn),此即Meta在建構(gòu)時(shí)所新添的關(guān)系。另外,有時(shí)也會(huì)有來(lái)自其它索引典所建立起來(lái)的概念關(guān)系應(yīng)用到Meta上。例如概念詞“Paroxysmal Atrial Fibrillation” (陣發(fā)性心房纖維顫動(dòng))在Meta中被指引為“Atrial Fibrillation” 的下位詞(Narrowed term),即是取自MeSH, ICD-9, SNOMED等索引表中所建立的架構(gòu)。 不同概念間

19、關(guān)聯(lián)的建立 在Meta中展示了不同概念間的各種關(guān)系SNOMED(Systemized Nomenclature of Medicine) 是UMLS的重要子集 :文獻(xiàn)選用Mesh,而臨床術(shù)語(yǔ)多選自本系統(tǒng)。SNOMED已經(jīng)發(fā)展了超過(guò)20年 ,它包括解剖學(xué)、形態(tài)學(xué)、正常與非正常的功能、癥狀及疾病體癥、化學(xué)制品、藥品、酶及其它體蛋白、活有機(jī)體、物理因素、空間關(guān)系、職業(yè)、社會(huì)環(huán)境、疾病/診斷和操作。SNOMED的每一個(gè)術(shù)語(yǔ)(詞條)均有一個(gè)編碼與之對(duì)應(yīng),在疾病/診斷軸內(nèi),很多疾病概念還提供了與其它術(shù)語(yǔ)的交叉參照關(guān)系。 1999年2月以來(lái)在美國(guó)已經(jīng)有30多家單位開(kāi)始試驗(yàn)使用SNOMEDRT的測(cè)試版,每個(gè)單

20、位都有其測(cè)試的重點(diǎn),例如,數(shù)據(jù)的采集,數(shù)據(jù)的提取,或者聚合分析等應(yīng)用。 SNOMED(Systemized Nomenclature關(guān)系指向的處理程序 在不同的索引表間建立關(guān)聯(lián)主要會(huì)牽涉到二個(gè)問(wèn)題:一是選用語(yǔ)的取決;另一是如何把不同索引表中相同概念的語(yǔ)詞串連在一起。要想把來(lái)自不同索引表中表達(dá)相同概念的語(yǔ)詞串連起來(lái),就必須運(yùn)用到“關(guān)系移轉(zhuǎn)”的邏輯觀念。 如果A是B的同義詞,而B(niǎo)是C的同義詞,那么我們可以推論A和C應(yīng)該也具有同義的關(guān)系。 關(guān)系指向的處理程序 在不同的索引表間建立關(guān)聯(lián)主要會(huì)牽涉到二個(gè)(2)語(yǔ)義網(wǎng)絡(luò) 語(yǔ)義網(wǎng)絡(luò)是為建立概念、術(shù)語(yǔ)間錯(cuò)綜復(fù)雜的關(guān)系而設(shè)計(jì)的,它為超級(jí)敘詞表中所有概念提供了語(yǔ)義

21、類(lèi)型、語(yǔ)義關(guān)系和語(yǔ)義結(jié)構(gòu)。2002年版的語(yǔ)義網(wǎng)絡(luò)包括了134種語(yǔ)義類(lèi)型和54種語(yǔ)義關(guān)系。超級(jí)敘詞表中的每一個(gè)概念至少被標(biāo)引一種語(yǔ)義類(lèi)型。語(yǔ)義類(lèi)型是通過(guò)計(jì)算機(jī)程序指定的或在人工復(fù)審過(guò)程中增加的,它既是超級(jí)敘詞表與語(yǔ)義網(wǎng)絡(luò)之間的連接,也是超級(jí)敘詞表與情報(bào)源圖譜(ISM)的連接之一。語(yǔ)義網(wǎng)絡(luò)為超級(jí)敘詞表提供了指定給每一個(gè)概念至少一種語(yǔ)義類(lèi)型的信息,同時(shí)語(yǔ)義類(lèi)型也指定給情報(bào)源圖譜中特定的數(shù)據(jù)庫(kù),以表達(dá)情報(bào)資源之間的內(nèi)在聯(lián)系。UMLS的語(yǔ)義網(wǎng)絡(luò)不僅運(yùn)用了常規(guī)的語(yǔ)義控制手段,如語(yǔ)義等級(jí)、屬分、相關(guān)關(guān)系控制,而且在語(yǔ)義規(guī)范和語(yǔ)義關(guān)系分析、延伸等多方面有許多創(chuàng)新。語(yǔ)義網(wǎng)絡(luò)是試圖建立一種語(yǔ)義類(lèi)型及其相互關(guān)系的權(quán)

22、威規(guī)則,用以標(biāo)引每一個(gè)超級(jí)敘詞概念,或表達(dá)概念之間可能存在的相互關(guān)系。語(yǔ)義網(wǎng)絡(luò)的這種權(quán)威規(guī)則,既在文字上,也從等級(jí)關(guān)系或非等級(jí)關(guān)系上界定語(yǔ)義類(lèi)型及其相互間可能存在的關(guān)系與內(nèi)在涵義。 (2)語(yǔ)義網(wǎng)絡(luò) 語(yǔ)義網(wǎng)絡(luò)是為建立概念、術(shù)語(yǔ)間錯(cuò)綜復(fù)雜的關(guān)系而1)語(yǔ)義結(jié)構(gòu):目前語(yǔ)義類(lèi)型主要分為生物體、解剖結(jié)構(gòu)、生物功能、化學(xué)、事件、客觀物體、概念和觀念等。這些語(yǔ)義類(lèi)型的高層分為“物”和“事”兩大類(lèi),并由此層層展開(kāi)形成“樹(shù)形結(jié)構(gòu)” 。由全部語(yǔ)義類(lèi)型形成的等級(jí)結(jié)構(gòu)中,每一語(yǔ)義類(lèi)型除有一個(gè)樹(shù)狀等級(jí)號(hào)之外,還被賦予一個(gè)語(yǔ)義類(lèi)型代碼,如T071、T001等,這些代碼并無(wú)實(shí)質(zhì)上的含義。1)語(yǔ)義結(jié)構(gòu):醫(yī)學(xué)一體化語(yǔ)言系統(tǒng)(UM

23、LS)課件醫(yī)學(xué)一體化語(yǔ)言系統(tǒng)(UMLS)課件醫(yī)學(xué)一體化語(yǔ)言系統(tǒng)(UMLS)課件2)語(yǔ)義關(guān)系鏈:將語(yǔ)義類(lèi)型連結(jié)成為語(yǔ)義網(wǎng)絡(luò)。 在UMLS語(yǔ)義網(wǎng)絡(luò)中,語(yǔ)義類(lèi)型可以看成是有層次結(jié)構(gòu)的“節(jié)點(diǎn)”,而把這些節(jié)點(diǎn)連成網(wǎng)的連接,稱(chēng)為“鏈”(Link),“鏈”所表達(dá)的是語(yǔ)義類(lèi)型之間的“關(guān)系”(Relationship)。這種“鏈”可分為兩類(lèi):等級(jí)關(guān)系鏈(H) is a 一種。上、下位概念。 相關(guān)關(guān)系鏈(R) :分為五大類(lèi),物理上相關(guān)(physically-related-to),空間上相關(guān)(spatially-related-to),功能上相關(guān)(functionally-related-to),時(shí)間上相關(guān)(te

24、mporally-related-to)和概念上相關(guān)(conceptully-related-to)共53種。2)語(yǔ)義關(guān)系鏈:將語(yǔ)義類(lèi)型連結(jié)成為語(yǔ)義網(wǎng)絡(luò)。H.等級(jí)關(guān)系鏈isaR.相關(guān)關(guān)系鏈(1)物理上相關(guān)1.的部分2.由組成3.包含4.與相連5.分開(kāi)(2.)空間上相關(guān)1.位于2.與相鄰3.包圍,周?chē)?.穿過(guò)(3)功能上相關(guān)1.影響1. 1管理1. 2治療1. 3干擾1. 4并發(fā)1. 5與相互作用1. 6預(yù)防2.帶來(lái)、造成 2. 1產(chǎn)生 2. 2引起3.執(zhí)行 3. 1實(shí)施 3. 2展示 3. 3練習(xí)4.發(fā)生于情況下 4. 1.的進(jìn)程5.使用6.現(xiàn)象表達(dá)7.證實(shí)8.的結(jié)果、效果(4)時(shí)間上相關(guān)1.

25、與同時(shí)發(fā)生2.先于發(fā)生(5)概念上相關(guān)1.的評(píng)價(jià)2.的程度、等級(jí)3.分析 3. 1分析評(píng)估的影響4.的測(cè)量值5.測(cè)量6.診斷7.的特性8.衍生的9.的發(fā)育階段10.的方法11.的概念部分12.之中的焦點(diǎn)問(wèn)題H.等級(jí)關(guān)系鏈isaR.相關(guān)關(guān)系鏈(1)物理上相關(guān)1.例:例:醫(yī)學(xué)一體化語(yǔ)言系統(tǒng)(UMLS)課件醫(yī)學(xué)一體化語(yǔ)言系統(tǒng)(UMLS)課件醫(yī)學(xué)一體化語(yǔ)言系統(tǒng)(UMLS)課件醫(yī)學(xué)一體化語(yǔ)言系統(tǒng)(UMLS)課件醫(yī)學(xué)一體化語(yǔ)言系統(tǒng)(UMLS)課件醫(yī)學(xué)一體化語(yǔ)言系統(tǒng)(UMLS)課件語(yǔ)義關(guān)系的等級(jí)繼承規(guī)則和繼承阻斷 在語(yǔ)義類(lèi)型等級(jí)結(jié)構(gòu)的高層節(jié)點(diǎn)之間的語(yǔ)義關(guān)系,在任何可能的情況下都是固定的,正如上例所列舉的語(yǔ)義

26、關(guān)系“影響”鏈接的這些高層語(yǔ)義類(lèi)型節(jié)點(diǎn)。而且高層語(yǔ)義類(lèi)型之間的語(yǔ)義關(guān)系,一般地可通過(guò)等級(jí)結(jié)構(gòu)(isa鏈)繼承給這些節(jié)點(diǎn)的所有子類(lèi)。 在有些情況下,如果按照語(yǔ)義類(lèi)型的等級(jí)結(jié)構(gòu)及鏈的繼承規(guī)則,會(huì)使語(yǔ)義類(lèi)型與語(yǔ)義關(guān)系的連接產(chǎn)生歧義。例如,語(yǔ)義關(guān)系“的進(jìn)程”存在于語(yǔ)義類(lèi)型“生物體功能”和“生物體”之間,“生物體功能”有一個(gè)子類(lèi)是“心理功能”,而植物也是一種“生物體”,按照繼承規(guī)則,心理過(guò)程也是一種“植物的活動(dòng)、功能或狀態(tài)”,顯然,植物不可能有“心理過(guò)程”。不能繼承的鏈稱(chēng)為阻斷 。語(yǔ)義關(guān)系的等級(jí)繼承規(guī)則和繼承阻斷 在語(yǔ)義類(lèi)型等級(jí)結(jié)構(gòu)的高層節(jié)3)語(yǔ)義網(wǎng)絡(luò)使概念之間語(yǔ)義關(guān)系的準(zhǔn)確細(xì)致表達(dá) MeSH樹(shù)狀范圍表

27、所表達(dá)的MeSH上位詞與下位詞之間的關(guān)系,只是簡(jiǎn)單的較泛指與較專(zhuān)指關(guān)系。例如,MeSH“羊水”(Amnioticfluid)是MeSH“胚胎”(Embryo)的一個(gè)下位詞:EmbryoA16.254AmnioticfluidA16.254.72在UMLS語(yǔ)義網(wǎng)絡(luò)中,Embryo標(biāo)引的語(yǔ)義類(lèi)型是“胚胎結(jié)構(gòu)”(Embryonicstructure),Amnioticfluid標(biāo)引的語(yǔ)義類(lèi)型是“機(jī)體物質(zhì)”(BodySubstance),語(yǔ)義關(guān)系標(biāo)引的是“周?chē)?Surround)。所以“羊水”與“胚胎”之間的關(guān)系就被確切地表達(dá)為“胚胎結(jié)構(gòu)周?chē)臋C(jī)體物質(zhì)”。 3)語(yǔ)義網(wǎng)絡(luò)使概念之間語(yǔ)義關(guān)系的準(zhǔn)確細(xì)致表

28、達(dá) (3)情報(bào)源圖譜 情報(bào)源圖譜是一個(gè)關(guān)于生物醫(yī)學(xué)機(jī)讀情報(bào)資源的數(shù)據(jù)庫(kù),其目的是利用超級(jí)敘詞表和語(yǔ)義網(wǎng)絡(luò)實(shí)現(xiàn)以下功能:理解情報(bào)源與特定提問(wèn)的相關(guān)性,以便選取最合適的情報(bào)源;為用戶(hù)提供特定情報(bào)源的范圍、功能和檢索條件等人工可讀的信息。自動(dòng)鏈接相關(guān)情報(bào)源;在一個(gè)或多個(gè)情報(bào)源中自動(dòng)檢索并自動(dòng)組織檢索的結(jié)果。 1998年版的情報(bào)源圖譜(ISM)數(shù)據(jù)庫(kù)包括了71個(gè)情報(bào)源數(shù)據(jù)庫(kù),其中56個(gè)是NLM開(kāi)發(fā)和維護(hù)的,15個(gè)是其他機(jī)構(gòu)或個(gè)人開(kāi)發(fā)的。這些情報(bào)源多種多樣,不僅涵蓋生物醫(yī)學(xué)研究、臨床實(shí)踐和生物倫理學(xué)的主要書(shū)目數(shù)據(jù)庫(kù),而且包括AI/RHEUM、DXplain、QMR等專(zhuān)家系統(tǒng),還包括來(lái)自醫(yī)學(xué)史聯(lián)機(jī)圖像庫(kù)、

29、可視化人類(lèi)計(jì)劃等圖像數(shù)據(jù)庫(kù),以及有關(guān)遺傳學(xué)、蛋白質(zhì)和核酸序列、藥物、毒物學(xué)、環(huán)境衛(wèi)生的事實(shí)數(shù)據(jù)庫(kù)。 (3)情報(bào)源圖譜 情報(bào)源圖譜是一個(gè)關(guān)于生物醫(yī)學(xué)機(jī)讀情報(bào)資源的(4)專(zhuān)家詞典:專(zhuān)家詞典是一個(gè)包含眾多生物醫(yī)學(xué)詞匯的英語(yǔ)詞典。它是在美國(guó)國(guó)立醫(yī)學(xué)圖書(shū)館自然語(yǔ)言處理專(zhuān)家系統(tǒng)項(xiàng)目基礎(chǔ)上開(kāi)發(fā)出來(lái)的。2001年版的專(zhuān)家詞典約有140,000條詞匯記錄。每條詞匯記錄均記錄了它的句法、詞法和字法信息。詞條由詞或詞組組成。所有詞條均共享它們的基本形式和拼寫(xiě)變異。詞的基本形式包括詞的不變形式、名詞的單數(shù)形式、動(dòng)詞的原形以及形容詞和副詞的原級(jí)形式。詞匯信息包括句法分類(lèi)、詞形變異以及詞的補(bǔ)充成份。詞形變異有名詞的單復(fù)形

30、式、動(dòng)詞的規(guī)則與不規(guī)則變化形式、形容詞和副詞的原級(jí)、比較級(jí)、最高級(jí)形式等。專(zhuān)家詞典能識(shí)別11種句法分類(lèi)和引語(yǔ)部分:動(dòng)詞、名詞、形容詞、副詞、助詞、語(yǔ)氣詞、代詞、介詞、連詞、補(bǔ)語(yǔ)、定語(yǔ)。專(zhuān)家詞典包括一組詞典程序,它們可以確定英語(yǔ)詞匯的范圍以及識(shí)別生物醫(yī)學(xué)術(shù)語(yǔ)和文本詞的詞形變異。 (4)專(zhuān)家詞典:三、UMLS開(kāi)發(fā)原則1)多學(xué)科、多研究小組協(xié)同開(kāi)發(fā)原則 UMLS是一項(xiàng)規(guī)模宏大而又相當(dāng)復(fù)雜的長(zhǎng)期研究和開(kāi)發(fā)項(xiàng)目,需要多學(xué)科專(zhuān)家、多研究小組參與協(xié)作研究。所以美國(guó)國(guó)立醫(yī)學(xué)圖書(shū)館內(nèi)部成立了一個(gè)多學(xué)科研究小組,同時(shí)以競(jìng)爭(zhēng)和合同方式組織了許多以全美各地大學(xué)為基礎(chǔ)的醫(yī)學(xué)情報(bào)研究小組。 2)集中開(kāi)發(fā)與分散開(kāi)發(fā)相結(jié)合的

31、原則 UMLS的研究小組集中開(kāi)發(fā)、維護(hù)和修訂其產(chǎn)品,同時(shí)向廣大用戶(hù)分發(fā)其產(chǎn)品。只要用戶(hù)同意向NLM提供反饋信息以及遵守其版權(quán),即可免費(fèi)獲得。 三、UMLS開(kāi)發(fā)原則1)多學(xué)科、多研究小組協(xié)同開(kāi)發(fā)原則醫(yī)學(xué)一體化語(yǔ)言系統(tǒng)(UMLS)課件醫(yī)學(xué)一體化語(yǔ)言系統(tǒng)(UMLS)課件醫(yī)學(xué)一體化語(yǔ)言系統(tǒng)(UMLS)課件醫(yī)學(xué)一體化語(yǔ)言系統(tǒng)(UMLS)課件醫(yī)學(xué)一體化語(yǔ)言系統(tǒng)(UMLS)課件醫(yī)學(xué)一體化語(yǔ)言系統(tǒng)(UMLS)課件醫(yī)學(xué)一體化語(yǔ)言系統(tǒng)(UMLS)課件Narrower Concepts: None found.Broader Concepts: None found.Other Related Concepts: None found.Similar Concepts: None found.Related and Possibly Synonymous Concepts: None found.Source Asserted Synonymous Concepts: None found.Allowable Subheadings: historyAssociated Expressions: None found.Locator Information:ISN: MBD02Frequency: 6Frequency Note: *CITATIONSSUI: S0721347I

溫馨提示

  • 1. 本站所有資源如無(wú)特殊說(shuō)明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請(qǐng)下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請(qǐng)聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶(hù)所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁(yè)內(nèi)容里面會(huì)有圖紙預(yù)覽,若沒(méi)有圖紙預(yù)覽就沒(méi)有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫(kù)網(wǎng)僅提供信息存儲(chǔ)空間,僅對(duì)用戶(hù)上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對(duì)用戶(hù)上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對(duì)任何下載內(nèi)容負(fù)責(zé)。
  • 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請(qǐng)與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶(hù)因使用這些下載資源對(duì)自己和他人造成任何形式的傷害或損失。

評(píng)論

0/150

提交評(píng)論