第九章本體知識系統(tǒng) - 人工智能_第1頁
第九章本體知識系統(tǒng) - 人工智能_第2頁
第九章本體知識系統(tǒng) - 人工智能_第3頁
第九章本體知識系統(tǒng) - 人工智能_第4頁
第九章本體知識系統(tǒng) - 人工智能_第5頁
已閱讀5頁,還剩36頁未讀 繼續(xù)免費(fèi)閱讀

下載本文檔

版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進(jìn)行舉報(bào)或認(rèn)領(lǐng)

文檔簡介

1、Artificial IntelligenceOntology: 1 Graduate University , Chinese academy of Sciences. 人工智能人工智能Artificial IntelligenceArtificial IntelligenceOntology: 2 Graduate University , Chinese academy of Sciences. 本體知識系統(tǒng)本體知識系統(tǒng)Artificial IntelligenceOntology: 3 Graduate University , Chinese academy of Sciences.

2、 主要內(nèi)容主要內(nèi)容 本體的基本概念本體的基本概念 語義語義WebWeb 本體描述語言本體描述語言 本體構(gòu)造本體構(gòu)造 本體映射本體映射 本體知識管理本體知識管理 大規(guī)模知識系統(tǒng)大規(guī)模知識系統(tǒng)Artificial IntelligenceOntology: 4 Graduate University , Chinese academy of Sciences. 主要內(nèi)容主要內(nèi)容 本體的基本概念本體的基本概念 語義語義WebWeb 本體描述語言本體描述語言 本體構(gòu)造本體構(gòu)造 本體映射本體映射 本體知識管理本體知識管理 大規(guī)模知識系統(tǒng)大規(guī)模知識系統(tǒng)Artificial IntelligenceOnto

3、logy: 5 Graduate University , Chinese academy of Sciences. 本體的基本概念(本體的基本概念(1) 本體:本體: 哲學(xué)界:最初本體是哲學(xué)理論的術(shù)語,關(guān)于存在及其本質(zhì)規(guī)律的學(xué)說哲學(xué)界:最初本體是哲學(xué)理論的術(shù)語,關(guān)于存在及其本質(zhì)規(guī)律的學(xué)說,是表示對象及其相互關(guān)系的理論。,是表示對象及其相互關(guān)系的理論。 信息科學(xué):常用于指層次化的數(shù)據(jù)結(jié)構(gòu),其中包含了對象及其關(guān)系,信息科學(xué):常用于指層次化的數(shù)據(jù)結(jié)構(gòu),其中包含了對象及其關(guān)系,以及相關(guān)領(lǐng)域的規(guī)則以及相關(guān)領(lǐng)域的規(guī)則 人工智能:被用于知識管理、自然語言處理、電子商務(wù)、教育以及語人工智能:被用于知識管理、

4、自然語言處理、電子商務(wù)、教育以及語義義WEB等領(lǐng)域。語義等領(lǐng)域。語義WEB需要構(gòu)造不同的本體,用于不同的表示語需要構(gòu)造不同的本體,用于不同的表示語言、查詢語言和推理語言。言、查詢語言和推理語言。 一個(gè)本體定義了組成主題領(lǐng)域的詞匯的基本術(shù)語和關(guān)系,以及用一個(gè)本體定義了組成主題領(lǐng)域的詞匯的基本術(shù)語和關(guān)系,以及用于組合術(shù)語和關(guān)系以及定義詞匯外延的規(guī)則于組合術(shù)語和關(guān)系以及定義詞匯外延的規(guī)則Neches1991-即即要建立一個(gè)本體,首先要識別所面對領(lǐng)域的基本術(shù)語和這些術(shù)語要建立一個(gè)本體,首先要識別所面對領(lǐng)域的基本術(shù)語和這些術(shù)語的關(guān)系,然后要識別組合這些術(shù)語和關(guān)系的規(guī)則,并提供這些術(shù)的關(guān)系,然后要識別組合

5、這些術(shù)語和關(guān)系的規(guī)則,并提供這些術(shù)語和關(guān)系的規(guī)則語和關(guān)系的規(guī)則Artificial IntelligenceOntology: 6 Graduate University , Chinese academy of Sciences. 本體的基本概念(本體的基本概念(2)Gruber和和Borst1997的定義:的定義: 本體是概念化的一個(gè)顯式的規(guī)格說明本體是概念化的一個(gè)顯式的規(guī)格說明Gruber 1993 本體可定義為被共享的概念化的一個(gè)形式的規(guī)格說明本體可定義為被共享的概念化的一個(gè)形式的規(guī)格說明Borst1997共同點(diǎn):都強(qiáng)調(diào)了給出形式解釋的可能性共同點(diǎn):都強(qiáng)調(diào)了給出形式解釋的可能性主要缺點(diǎn)

6、:對主要缺點(diǎn):對“概念化概念化”一詞并沒有給出明確地解釋一詞并沒有給出明確地解釋概念化涉及通過標(biāo)示某個(gè)現(xiàn)象的相關(guān)概念而得到的這個(gè)現(xiàn)象的抽象模型。顯式地概念化涉及通過標(biāo)示某個(gè)現(xiàn)象的相關(guān)概念而得到的這個(gè)現(xiàn)象的抽象模型。顯式地指出所用的概念的類型,以及定義概念所使用的約束。形式化是指本體應(yīng)該是機(jī)指出所用的概念的類型,以及定義概念所使用的約束。形式化是指本體應(yīng)該是機(jī)器可讀的。共享反映了這樣一個(gè)觀念,即本體獲取了一致的知識,它不是某個(gè)個(gè)器可讀的。共享反映了這樣一個(gè)觀念,即本體獲取了一致的知識,它不是某個(gè)個(gè)體私有的,而是可以被一個(gè)群體所接受的。體私有的,而是可以被一個(gè)群體所接受的。Studer1998Ar

7、tificial IntelligenceOntology: 7 Graduate University , Chinese academy of Sciences. 本體的基本概念(本體的基本概念(3) 本體的作用本體的作用 1.人與組織之間的信息交流。本體的核心概念是知識共享,通過減少概念和術(shù)語上的歧義,本體描述為某一組織或是工作小組提供了一個(gè)統(tǒng)一框架或是規(guī)范模型,使得來自不同背景、持不同觀點(diǎn)和目的的人員之間的理解和交流成為可能,并保持語義上的一致性。2.系統(tǒng)之間的互操作。應(yīng)用程序使用本體論實(shí)現(xiàn)異構(gòu)系統(tǒng)之間的互操作,即不同系統(tǒng)或工具之間的數(shù)據(jù)傳輸。如語義Web服務(wù)就屬于此類。3.需求分析和

8、系統(tǒng)設(shè)計(jì)的基礎(chǔ)。4.支持知識重用。5. 顯式地定義對領(lǐng)域的認(rèn)識。以往在處理領(lǐng)域相關(guān)問題時(shí),領(lǐng)域知識往往被隱含地硬編碼到程序中去,這樣領(lǐng)域知識既難以發(fā)現(xiàn),又不便于改變。使用本體可以顯式的描述這種領(lǐng)域相關(guān)的知識,使得知識能夠清晰的從代碼中獨(dú)立出來。6.將領(lǐng)域知識同使用領(lǐng)域知識的操作性知識分離開來。 Artificial IntelligenceOntology: 8 Graduate University , Chinese academy of Sciences. 本體的基本概念(本體的基本概念(4)本體的種類本體的種類Artificial IntelligenceOntology: 9 Gra

9、duate University , Chinese academy of Sciences. 主要內(nèi)容主要內(nèi)容 本體的基本概念本體的基本概念 語義語義WebWeb 本體描述語言本體描述語言 本體構(gòu)造本體構(gòu)造 本體映射本體映射 本體知識管理本體知識管理 大規(guī)模知識系統(tǒng)大規(guī)模知識系統(tǒng)Artificial IntelligenceOntology: 10 Graduate University , Chinese academy of Sciences. 語義語義WebWeb (1)本體在本體在Web上的應(yīng)用導(dǎo)致了語義上的應(yīng)用導(dǎo)致了語義Web的誕生,其目的是解決的誕生,其目的是解決Web上信上信息

10、共享時(shí)的語義問題。息共享時(shí)的語義問題。語義語義Web提供了一個(gè)通用的框架,允許跨越不同應(yīng)用程序、企業(yè)和團(tuán)提供了一個(gè)通用的框架,允許跨越不同應(yīng)用程序、企業(yè)和團(tuán)體的邊界共享和重用數(shù)據(jù)體的邊界共享和重用數(shù)據(jù)。語義語義Web以資源描述框架(以資源描述框架(RDF)為基礎(chǔ)。)為基礎(chǔ)。RDF以以XML作為語法、作為語法、URI作為命名機(jī)制,將各種不同的應(yīng)用集成在一起作為命名機(jī)制,將各種不同的應(yīng)用集成在一起,對,對Web上的數(shù)據(jù)上的數(shù)據(jù)所進(jìn)行的一種抽象表示。語義所進(jìn)行的一種抽象表示。語義Web所指的所指的“語義語義”是是“機(jī)器可處理的機(jī)器可處理的”語義,而不是自然語言語義和人的推理等目前計(jì)算機(jī)所不能夠處理語

11、義,而不是自然語言語義和人的推理等目前計(jì)算機(jī)所不能夠處理的信息。的信息。從技術(shù)上講,語義從技術(shù)上講,語義Web要提供足夠而又合適的語義描述機(jī)制。然而,要提供足夠而又合適的語義描述機(jī)制。然而,從整個(gè)應(yīng)用構(gòu)想來看,語義從整個(gè)應(yīng)用構(gòu)想來看,語義Web要實(shí)現(xiàn)的是信息在知識級別上的共享要實(shí)現(xiàn)的是信息在知識級別上的共享和語義級別上的互操作性,這需要不同系統(tǒng)間有一個(gè)語義上的和語義級別上的互操作性,這需要不同系統(tǒng)間有一個(gè)語義上的“共同共同理解理解”才行。于是,本體自然地成為指導(dǎo)語義才行。于是,本體自然地成為指導(dǎo)語義Web發(fā)展的理論基礎(chǔ)。發(fā)展的理論基礎(chǔ)。 Artificial IntelligenceOntol

12、ogy: 11 Graduate University , Chinese academy of Sciences. 語義語義WebWeb (2)語義語義Web的基礎(chǔ)架構(gòu)的基礎(chǔ)架構(gòu)Tim Berners-Lee,2000 Artificial IntelligenceOntology: 12 Graduate University , Chinese academy of Sciences. 語義語義WebWeb (3)語義語義Web的基本構(gòu)建元素的基本構(gòu)建元素URI(Uniform Resource Identifiers)作為資源(任何東)作為資源(任何東西都可以看作資源)標(biāo)識機(jī)制,提供對

13、資源的標(biāo)準(zhǔn)化的名字西都可以看作資源)標(biāo)識機(jī)制,提供對資源的標(biāo)準(zhǔn)化的名字描述;描述;Unicode提供世界上各種語言的統(tǒng)一的字符編碼標(biāo)準(zhǔn);提供世界上各種語言的統(tǒng)一的字符編碼標(biāo)準(zhǔn);XML(Extensible Markup Language)定義了結(jié)構(gòu)化的數(shù)據(jù)定義了結(jié)構(gòu)化的數(shù)據(jù)描述方式,是數(shù)據(jù)互操作的語法基礎(chǔ);描述方式,是數(shù)據(jù)互操作的語法基礎(chǔ);Namespace提供將名字分類的機(jī)制,使得重名但含義不同提供將名字分類的機(jī)制,使得重名但含義不同的資源能夠一起使用。的資源能夠一起使用。Artificial IntelligenceOntology: 13 Graduate University , Ch

14、inese academy of Sciences. 語義語義WebWeb (4)語義語義Web的層次模型的層次模型(1)RDFRDF Schema Layer: RDF(Resource Description Framework)是描述數(shù)據(jù)語義的基礎(chǔ),它定義了描述資源以及陳述事實(shí)的三類對象:資源(resource)、屬性(property)和值(value)。資源是指網(wǎng)絡(luò)上的數(shù)據(jù),屬性是指用來描述資源的一個(gè)方面、特征、屬性以及關(guān)系,陳述則用來表示一個(gè)特定的資源,它包括一個(gè)命了名的屬性和它對應(yīng)資源的值,因此一個(gè)RDF描述實(shí)際上就是一個(gè)三元組: (objectresource, attribu

15、teproperty, valueresource or literal)Artificial IntelligenceOntology: 14 Graduate University , Chinese academy of Sciences. 語義語義WebWeb (5)語義語義Web的層次模型的層次模型(2)本體層:本體給出了數(shù)據(jù)的語義信息,即元數(shù)據(jù)。本體)本體層:本體給出了數(shù)據(jù)的語義信息,即元數(shù)據(jù)。本體的定義可以直接基于的定義可以直接基于RDF Schema。但是。但是RDF Schema的的詞匯集的表達(dá)能力有限,因此詞匯集的表達(dá)能力有限,因此W3C在參考了在參考了DAMLOIL(DA

16、RPA Agent Markup Language with Ontology Inference Layer)之后,又在之后,又在RDF之上制定了之上制定了OWL(Web Ontology Language)。(3)邏輯:邏輯層在本體所描述的知識之上提供邏輯推理能)邏輯:邏輯層在本體所描述的知識之上提供邏輯推理能力(基于規(guī)則)。力(基于規(guī)則)。Artificial IntelligenceOntology: 15 Graduate University , Chinese academy of Sciences. 語義語義WebWeb (6)語義語義Web的層次模型的層次模型(4)證明層:在

17、語義)證明層:在語義Web的開放環(huán)境中進(jìn)行推理是一個(gè)困難的任務(wù),因?yàn)槿魏我粋€(gè)推論的開放環(huán)境中進(jìn)行推理是一個(gè)困難的任務(wù),因?yàn)槿魏我粋€(gè)推論都可能涉及到大量信息的處理。研究者由此提出了語義都可能涉及到大量信息的處理。研究者由此提出了語義Web總線總線(Semantic Web Bus)的設(shè)想。的設(shè)想。 語義語義Web中充斥著各種信息處理器(圖中圓形所示),其中一些僅僅提供本體數(shù)據(jù)中充斥著各種信息處理器(圖中圓形所示),其中一些僅僅提供本體數(shù)據(jù)供其它處理器使用,另外一些則根據(jù)這些本體數(shù)據(jù)構(gòu)建邏輯規(guī)則,啟發(fā)式引擎則負(fù)供其它處理器使用,另外一些則根據(jù)這些本體數(shù)據(jù)構(gòu)建邏輯規(guī)則,啟發(fā)式引擎則負(fù)責(zé)根據(jù)本體、數(shù)據(jù)

18、和邏輯規(guī)則進(jìn)行推理,得到責(zé)根據(jù)本體、數(shù)據(jù)和邏輯規(guī)則進(jìn)行推理,得到“結(jié)論結(jié)論”(Proof),并把這種結(jié)論返回,并把這種結(jié)論返回到邏輯規(guī)則和本體數(shù)據(jù)中去。到邏輯規(guī)則和本體數(shù)據(jù)中去。Artificial IntelligenceOntology: 16 Graduate University , Chinese academy of Sciences. 語義語義WebWeb (7)語義語義Web的層次模型的層次模型(5)可信層:在之前所有層次的基礎(chǔ)之上,會形成無數(shù)對于)可信層:在之前所有層次的基礎(chǔ)之上,會形成無數(shù)對于某一事實(shí)的陳述,這些陳述合理與否依賴于它們所處的上下某一事實(shí)的陳述,這些陳述合理與

19、否依賴于它們所處的上下文環(huán)境。因此當(dāng)人或計(jì)算機(jī)訪問這些陳述時(shí),需要根據(jù)上下文環(huán)境。因此當(dāng)人或計(jì)算機(jī)訪問這些陳述時(shí),需要根據(jù)上下文和自己的需求自行判定該陳述是否可信(文和自己的需求自行判定該陳述是否可信(Trust)。采用)。采用加密技術(shù)和數(shù)字簽名技術(shù)(滲透到每個(gè)層次的規(guī)范中去)是加密技術(shù)和數(shù)字簽名技術(shù)(滲透到每個(gè)層次的規(guī)范中去)是實(shí)現(xiàn)判定可信性的一個(gè)重要手段,并可以由此形成一個(gè)可信實(shí)現(xiàn)判定可信性的一個(gè)重要手段,并可以由此形成一個(gè)可信的的Web。 Artificial IntelligenceOntology: 17 Graduate University , Chinese academy o

20、f Sciences. 主要內(nèi)容主要內(nèi)容 本體的基本概念本體的基本概念 語義語義WebWeb 本體描述語言本體描述語言 本體構(gòu)造本體構(gòu)造 本體映射本體映射 本體知識管理本體知識管理 大規(guī)模知識系統(tǒng)大規(guī)模知識系統(tǒng)Artificial IntelligenceOntology: 18 Graduate University , Chinese academy of Sciences. 本體描述語言(本體描述語言(1) 本體描述語言起源于人工智能領(lǐng)域?qū)χR表示的研究。本本體描述語言起源于人工智能領(lǐng)域?qū)χR表示的研究。本體表示語言一般要具有豐富而直觀的表達(dá)能力,用該語言體表示語言一般要具有豐富而直觀的

21、表達(dá)能力,用該語言表示的本體要能方便地被計(jì)算機(jī)理解、處理和應(yīng)用。表示的本體要能方便地被計(jì)算機(jī)理解、處理和應(yīng)用。 現(xiàn)在的本體表示語言多數(shù)采用了現(xiàn)在的本體表示語言多數(shù)采用了XML語法。語法。 本體描述語言還需解決一些重要問題,如對推理的有效支本體描述語言還需解決一些重要問題,如對推理的有效支持(包括計(jì)算復(fù)雜性和可判定性等),規(guī)范和充足的語義持(包括計(jì)算復(fù)雜性和可判定性等),規(guī)范和充足的語義表示機(jī)制,以及標(biāo)準(zhǔn)化問題。這將依靠基于描述邏輯的本表示機(jī)制,以及標(biāo)準(zhǔn)化問題。這將依靠基于描述邏輯的本體語言的發(fā)展。體語言的發(fā)展。Artificial IntelligenceOntology: 19 Gradua

22、te University , Chinese academy of Sciences. 本體描述語言(本體描述語言(2) RDF/S : 在提供了簡單的機(jī)器可理解語義模型的同時(shí),為領(lǐng)域在提供了簡單的機(jī)器可理解語義模型的同時(shí),為領(lǐng)域化的本休語言提供了建?;A(chǔ),并使得基于化的本休語言提供了建模基礎(chǔ),并使得基于RDF的應(yīng)的應(yīng)用可以方便地與這些本體語言所生成的本體進(jìn)行合并用可以方便地與這些本體語言所生成的本體進(jìn)行合并。 RDF的這一特性使得基于的這一特性使得基于RDF的語義描述結(jié)果具備了的語義描述結(jié)果具備了可以和更多的領(lǐng)域知識進(jìn)行交互的能力,也使基于可以和更多的領(lǐng)域知識進(jìn)行交互的能力,也使基于XML

23、和和RDF的的Web數(shù)據(jù)描述具備了良好的生命力。數(shù)據(jù)描述具備了良好的生命力。 OWL: 目前是本體的標(biāo)準(zhǔn)描述語言。目前是本體的標(biāo)準(zhǔn)描述語言。OWL建立在建立在RDF基礎(chǔ)上基礎(chǔ)上,以,以XML為書寫工具。主要用來表達(dá)需要計(jì)算機(jī)應(yīng)用為書寫工具。主要用來表達(dá)需要計(jì)算機(jī)應(yīng)用程序來處理的文件中的知識信息,程序來處理的文件中的知識信息, Artificial IntelligenceOntology: 20 Graduate University , Chinese academy of Sciences. 本體描述語言(本體描述語言(3) 都柏林核心元數(shù)據(jù)集都柏林核心元數(shù)據(jù)集 都柏林核心元數(shù)據(jù)集都柏林核

24、心元數(shù)據(jù)集(Dublin Core)是由美國是由美國OCLC公司發(fā)起,國際公司發(fā)起,國際性合作項(xiàng)目性合作項(xiàng)目Dublin Core Metadata Initiative設(shè)計(jì)的一套描述設(shè)計(jì)的一套描述Web資資源源(任何有標(biāo)識的數(shù)據(jù)任何有標(biāo)識的數(shù)據(jù))的元數(shù)據(jù)的規(guī)范,主要用于出版信息的描述,的元數(shù)據(jù)的規(guī)范,主要用于出版信息的描述,也被用于描述其他領(lǐng)域的信息,在很多本體描述規(guī)范中都有引用。也被用于描述其他領(lǐng)域的信息,在很多本體描述規(guī)范中都有引用。 Dublin Core定義了一組基本元素來描述資源的元數(shù)據(jù),很多知識描定義了一組基本元素來描述資源的元數(shù)據(jù),很多知識描述標(biāo)準(zhǔn)和規(guī)范如述標(biāo)準(zhǔn)和規(guī)范如RDF、

25、DAML+OIL里都有對里都有對Dublin Core的直接引用的直接引用,用來描述作者、主題等元數(shù)據(jù)。但另一方面,嚴(yán)格講,用來描述作者、主題等元數(shù)據(jù)。但另一方面,嚴(yán)格講Dublin Core還不是一個(gè)真正的本體描述語言,它只是一組還不是一個(gè)真正的本體描述語言,它只是一組“標(biāo)準(zhǔn)詞匯集標(biāo)準(zhǔn)詞匯集”而已。而已。 CycL 本質(zhì)上講,本質(zhì)上講,CycL是一階邏輯語言。但是為了增強(qiáng)知識表示的靈活性是一階邏輯語言。但是為了增強(qiáng)知識表示的靈活性,CycL在一階邏輯的基礎(chǔ)上增加缺省知識的表示、二階謂詞等,所在一階邏輯的基礎(chǔ)上增加缺省知識的表示、二階謂詞等,所以是一階謂詞邏輯的一種擴(kuò)展。以是一階謂詞邏輯的一種

26、擴(kuò)展。CycL中有大量的類和類之間的關(guān)系中有大量的類和類之間的關(guān)系A(chǔ)rtificial IntelligenceOntology: 21 Graduate University , Chinese academy of Sciences. 主要內(nèi)容主要內(nèi)容 本體的基本概念本體的基本概念 語義語義WebWeb 本體描述語言本體描述語言 本體構(gòu)造本體構(gòu)造 本體映射本體映射 本體知識管理本體知識管理 大規(guī)模知識系統(tǒng)大規(guī)模知識系統(tǒng)Artificial IntelligenceOntology: 22 Graduate University , Chinese academy of Sciences.

27、本體構(gòu)造(本體構(gòu)造(1) 本體構(gòu)建是從某個(gè)領(lǐng)域中抽取知識,形成描述該領(lǐng)域數(shù)據(jù)的本體構(gòu)建是從某個(gè)領(lǐng)域中抽取知識,形成描述該領(lǐng)域數(shù)據(jù)的語義概念、實(shí)例和其間的關(guān)系。語義概念、實(shí)例和其間的關(guān)系。 本體構(gòu)建包括本體語言和本體構(gòu)建方法兩個(gè)領(lǐng)域的研究。本體構(gòu)建包括本體語言和本體構(gòu)建方法兩個(gè)領(lǐng)域的研究。 本體構(gòu)建方法目前大多采用手工方式,即知識工程師借助于本體構(gòu)建方法目前大多采用手工方式,即知識工程師借助于本體編輯器全手工的構(gòu)建本體。本體編輯器全手工的構(gòu)建本體。 TOVE:是多倫多大學(xué)的本體研究項(xiàng)目:是多倫多大學(xué)的本體研究項(xiàng)目,它重點(diǎn)論述了本體設(shè)計(jì)和手它重點(diǎn)論述了本體設(shè)計(jì)和手工演化過程中遇到的關(guān)鍵問題工演化過

28、程中遇到的關(guān)鍵問題,包括應(yīng)用情景收集、術(shù)語的抽取和定包括應(yīng)用情景收集、術(shù)語的抽取和定義、問題的形式化等。義、問題的形式化等。 METHONTOLOGY:根據(jù)進(jìn)化原型法的思想,提出本體生命周期的根據(jù)進(jìn)化原型法的思想,提出本體生命周期的概念來管理整個(gè)本體生命過程。它采用了類似于軟件工程的開發(fā)過程概念來管理整個(gè)本體生命過程。它采用了類似于軟件工程的開發(fā)過程和方法,將本體生成過程和本體生命周期區(qū)分開來,在不同階段使用和方法,將本體生成過程和本體生命周期區(qū)分開來,在不同階段使用不同的技術(shù)予以支持。不同的技術(shù)予以支持。 Artificial IntelligenceOntology: 23 Graduat

29、e University , Chinese academy of Sciences. 本體構(gòu)造(本體構(gòu)造(2)企業(yè)建模法:是多倫多大學(xué)企業(yè)集成實(shí)驗(yàn)室的研究人員在企業(yè)建模法:是多倫多大學(xué)企業(yè)集成實(shí)驗(yàn)室的研究人員在TOVE項(xiàng)目實(shí)施時(shí)提出來的,通過構(gòu)建的一個(gè)虛擬企業(yè)本體項(xiàng)目實(shí)施時(shí)提出來的,通過構(gòu)建的一個(gè)虛擬企業(yè)本體,用來模擬企業(yè)中的生產(chǎn)、管理過程,目標(biāo)是建立一套為商,用來模擬企業(yè)中的生產(chǎn)、管理過程,目標(biāo)是建立一套為商業(yè)和公共企業(yè)建模的集成本體。作為該項(xiàng)目的一部分,他們業(yè)和公共企業(yè)建模的集成本體。作為該項(xiàng)目的一部分,他們設(shè)計(jì)了一套創(chuàng)建和評價(jià)本體的方法。設(shè)計(jì)了一套創(chuàng)建和評價(jià)本體的方法。激發(fā)場景:給出一

30、個(gè)應(yīng)用領(lǐng)域的場景,即確定目標(biāo)領(lǐng)域激發(fā)場景:給出一個(gè)應(yīng)用領(lǐng)域的場景,即確定目標(biāo)領(lǐng)域非形式化的能力問題:以應(yīng)用情景為基礎(chǔ),用問題形式提出本體構(gòu)非形式化的能力問題:以應(yīng)用情景為基礎(chǔ),用問題形式提出本體構(gòu)造需求造需求術(shù)語的規(guī)范化:用一種(本體)形式化語言定義對其進(jìn)行詞匯;術(shù)語的規(guī)范化:用一種(本體)形式化語言定義對其進(jìn)行詞匯;形式化的能力問題:把能力問題用形式化的術(shù)語定義出來;形式化的能力問題:把能力問題用形式化的術(shù)語定義出來;形式化公理:將本體中的公理用一階謂詞邏輯表示出來形式化公理:將本體中的公理用一階謂詞邏輯表示出來完備性定理:當(dāng)能力問題被形式化表述之后,定義在什么條件下這完備性定理:當(dāng)能力問題

31、被形式化表述之后,定義在什么條件下這些問題的解決方案是完備的。些問題的解決方案是完備的。Artificial IntelligenceOntology: 24 Graduate University , Chinese academy of Sciences. 本體構(gòu)造(本體構(gòu)造(3) METHONTOLOGY框架方法:框架方法:該方法是在骨架法的基礎(chǔ)上該方法是在骨架法的基礎(chǔ)上提出的一種更為通用的本體建設(shè)方法。本體開發(fā)過程包括:提出的一種更為通用的本體建設(shè)方法。本體開發(fā)過程包括: 項(xiàng)目管理活動:主要指本體開發(fā)項(xiàng)目的計(jì)劃、控制和質(zhì)量保證項(xiàng)目管理活動:主要指本體開發(fā)項(xiàng)目的計(jì)劃、控制和質(zhì)量保證 面向

32、開發(fā)的活動:包括規(guī)格說明、概念化、形式化和實(shí)現(xiàn)等步驟面向開發(fā)的活動:包括規(guī)格說明、概念化、形式化和實(shí)現(xiàn)等步驟 支持活動。與面向開發(fā)的活動同時(shí)展開,包括知識獲取、知識評價(jià)、支持活動。與面向開發(fā)的活動同時(shí)展開,包括知識獲取、知識評價(jià)、知識集成、產(chǎn)生文檔和配置管理等。知識集成、產(chǎn)生文檔和配置管理等。 該模式根據(jù)進(jìn)化原型法的思想,提出本體生命周期的概念來該模式根據(jù)進(jìn)化原型法的思想,提出本體生命周期的概念來管理整個(gè)本體的開發(fā)過程,使得本體開發(fā)過程更接近于軟件管理整個(gè)本體的開發(fā)過程,使得本體開發(fā)過程更接近于軟件工程中的軟件開發(fā)過程。工程中的軟件開發(fā)過程。 Artificial IntelligenceOn

33、tology: 25 Graduate University , Chinese academy of Sciences. 本體構(gòu)造(本體構(gòu)造(4)本體構(gòu)建方法學(xué):本體構(gòu)建實(shí)際上是一個(gè)知識獲取的過程。本體構(gòu)建方法學(xué):本體構(gòu)建實(shí)際上是一個(gè)知識獲取的過程。設(shè)計(jì)本體的基本準(zhǔn)則可以歸納為如下五條:設(shè)計(jì)本體的基本準(zhǔn)則可以歸納為如下五條:1. 明確性和客觀性明確性和客觀性(Clarity):本體應(yīng)該有效地傳達(dá)所定義的術(shù)語的內(nèi):本體應(yīng)該有效地傳達(dá)所定義的術(shù)語的內(nèi)涵。涵。2. 一致性一致性(Coherence):一個(gè)本體應(yīng)該是前后一致的,也就是說,由:一個(gè)本體應(yīng)該是前后一致的,也就是說,由它推斷出來的概念定義

34、應(yīng)該與本體中的概念定義一致。至少。所有它推斷出來的概念定義應(yīng)該與本體中的概念定義一致。至少。所有的公理應(yīng)該具有邏輯一致性。的公理應(yīng)該具有邏輯一致性。3. 可擴(kuò)展性可擴(kuò)展性(Extensibility):一個(gè)本體提供一個(gè)共享的詞匯,它應(yīng)該在:一個(gè)本體提供一個(gè)共享的詞匯,它應(yīng)該在預(yù)期的任務(wù)范圍內(nèi)提供概念的基礎(chǔ),同時(shí),它的表示應(yīng)該使得人們預(yù)期的任務(wù)范圍內(nèi)提供概念的基礎(chǔ),同時(shí),它的表示應(yīng)該使得人們能夠單調(diào)地?cái)U(kuò)展和專門化對這個(gè)詞匯的說明;也就是說,人們應(yīng)該能夠單調(diào)地?cái)U(kuò)展和專門化對這個(gè)詞匯的說明;也就是說,人們應(yīng)該能夠在不改變原有定義的前提下,以這組存在的詞匯為基礎(chǔ)定義新能夠在不改變原有定義的前提下,以這

35、組存在的詞匯為基礎(chǔ)定義新的術(shù)語。的術(shù)語。 Artificial IntelligenceOntology: 26 Graduate University , Chinese academy of Sciences. 本體構(gòu)造(本體構(gòu)造(5)本體構(gòu)建方法學(xué):本體構(gòu)建實(shí)際上是一個(gè)知識獲取的過程。本體構(gòu)建方法學(xué):本體構(gòu)建實(shí)際上是一個(gè)知識獲取的過程。設(shè)計(jì)本體的基本準(zhǔn)則可以歸納為如下五條:設(shè)計(jì)本體的基本準(zhǔn)則可以歸納為如下五條:4. 最小編碼偏差最小編碼偏差(Minimal encoding bias):本體應(yīng)該處于知識的層次:本體應(yīng)該處于知識的層次,而與特定的符號級編碼無關(guān)。,而與特定的符號級編碼無關(guān)。

36、5. 最小本體承諾最小本體承諾(Minimal commitment):一個(gè)本體應(yīng)該在提供必須的:一個(gè)本體應(yīng)該在提供必須的共享知識的條件下,要求有最小的本體承諾。也就是說,它應(yīng)該對共享知識的條件下,要求有最小的本體承諾。也就是說,它應(yīng)該對所模擬的事物產(chǎn)生盡可能少的推斷,而讓共享者自由地按照他們的所模擬的事物產(chǎn)生盡可能少的推斷,而讓共享者自由地按照他們的需要去專門化和實(shí)例化這個(gè)本體。需要去專門化和實(shí)例化這個(gè)本體。Artificial IntelligenceOntology: 27 Graduate University , Chinese academy of Sciences. 本體構(gòu)造(本

37、體構(gòu)造(6)在具體實(shí)施一個(gè)領(lǐng)域本體的構(gòu)建時(shí),可以分為在具體實(shí)施一個(gè)領(lǐng)域本體的構(gòu)建時(shí),可以分為8個(gè)步驟:個(gè)步驟:1. 本體需求分析本體需求分析2. 本體構(gòu)建規(guī)劃本體構(gòu)建規(guī)劃3. 獲取本體信息獲取本體信息4. 確定本體概念及關(guān)系確定本體概念及關(guān)系5. 本體形式化編碼本體形式化編碼6. 本體的評價(jià)本體的評價(jià)7. 本體的演化本體的演化8. 本體的表示等過程。本體的表示等過程。Artificial IntelligenceOntology: 28 Graduate University , Chinese academy of Sciences. 本體構(gòu)造(本體構(gòu)造(7)基于文本的本體自動構(gòu)建:對文本集

38、合應(yīng)用自然語言處理技基于文本的本體自動構(gòu)建:對文本集合應(yīng)用自然語言處理技術(shù)實(shí)現(xiàn)構(gòu)建本體所需要素的抽?。盒g(shù)實(shí)現(xiàn)構(gòu)建本體所需要素的抽?。夯谧值涞谋倔w構(gòu)建基于字典的本體構(gòu)建從機(jī)器可理解的字典中抽取相關(guān)概念以及從機(jī)器可理解的字典中抽取相關(guān)概念以及概念間的關(guān)系;概念間的關(guān)系;基于知識庫的本體構(gòu)建基于知識庫的本體構(gòu)建將現(xiàn)有的知識庫作為知識來源實(shí)現(xiàn)本體將現(xiàn)有的知識庫作為知識來源實(shí)現(xiàn)本體抽?。怀槿。换诎虢Y(jié)構(gòu)模式的本體構(gòu)建基于半結(jié)構(gòu)模式的本體構(gòu)建從預(yù)先定義結(jié)構(gòu)的知識來源(如從預(yù)先定義結(jié)構(gòu)的知識來源(如 XML Schema)中抽取本體;)中抽取本體;基于關(guān)系型模式的本體構(gòu)建基于關(guān)系型模式的本體構(gòu)建從數(shù)據(jù)庫中

39、抽取相關(guān)概念以及概念從數(shù)據(jù)庫中抽取相關(guān)概念以及概念間的關(guān)系形成本體。間的關(guān)系形成本體。 Artificial IntelligenceOntology: 29 Graduate University , Chinese academy of Sciences. 本體構(gòu)造(本體構(gòu)造(8)從基于文本的本體構(gòu)建方法來看,實(shí)現(xiàn)技術(shù)和手段可以分為從基于文本的本體構(gòu)建方法來看,實(shí)現(xiàn)技術(shù)和手段可以分為以下幾類:以下幾類:基于模式的抽取:通過詞語的出現(xiàn)模式刻畫詞語之間的關(guān)系,并匹基于模式的抽?。和ㄟ^詞語的出現(xiàn)模式刻畫詞語之間的關(guān)系,并匹配文本中連續(xù)詞語的出現(xiàn)模式以識別詞語之間的關(guān)系。配文本中連續(xù)詞語的出現(xiàn)模式

40、以識別詞語之間的關(guān)系。關(guān)聯(lián)規(guī)則:關(guān)聯(lián)規(guī)則可以利用已有的概念層次結(jié)構(gòu)作為背景知識來關(guān)聯(lián)規(guī)則:關(guān)聯(lián)規(guī)則可以利用已有的概念層次結(jié)構(gòu)作為背景知識來發(fā)現(xiàn)概念之間的非分類學(xué)關(guān)系。發(fā)現(xiàn)概念之間的非分類學(xué)關(guān)系。概念聚類:概念之間因?yàn)檎Z義距離的差異而形成概念集合并產(chǎn)生層概念聚類:概念之間因?yàn)檎Z義距離的差異而形成概念集合并產(chǎn)生層次結(jié)構(gòu)次結(jié)構(gòu)本體修剪:目的是基于不同的異構(gòu)的知識來源生成領(lǐng)域本體。本體修剪:目的是基于不同的異構(gòu)的知識來源生成領(lǐng)域本體。 概念學(xué)習(xí):從現(xiàn)實(shí)世界的文本集合中獲取新的概念并添加到已有的概念學(xué)習(xí):從現(xiàn)實(shí)世界的文本集合中獲取新的概念并添加到已有的本體中。本體中。Artificial Intelli

41、genceOntology: 30 Graduate University , Chinese academy of Sciences. 本體構(gòu)造(本體構(gòu)造(9)基于結(jié)構(gòu)化數(shù)據(jù)的本體構(gòu)建基于結(jié)構(gòu)化數(shù)據(jù)的本體構(gòu)建 :從關(guān)系數(shù)據(jù)庫中學(xué)習(xí)本體是:從關(guān)系數(shù)據(jù)庫中學(xué)習(xí)本體是一個(gè)半自動化的本體學(xué)習(xí)過程,它需要通過機(jī)器學(xué)習(xí)和手工一個(gè)半自動化的本體學(xué)習(xí)過程,它需要通過機(jī)器學(xué)習(xí)和手工的方法來進(jìn)行本體學(xué)習(xí)。手工方法構(gòu)造的本體一般具有較高的方法來進(jìn)行本體學(xué)習(xí)。手工方法構(gòu)造的本體一般具有較高的質(zhì)量和豐富的語義。但這種本體構(gòu)建方法枯燥單調(diào)、效率的質(zhì)量和豐富的語義。但這種本體構(gòu)建方法枯燥單調(diào)、效率低而且代價(jià)高。低而且代價(jià)

42、高。 第一次掃描數(shù)據(jù)庫的模式:用來創(chuàng)建概念,得到最初的一些粗糙的第一次掃描數(shù)據(jù)庫的模式:用來創(chuàng)建概念,得到最初的一些粗糙的概念集合。掃描一趟關(guān)系數(shù)據(jù)庫每張表,得到每張表的元數(shù)據(jù),從概念集合。掃描一趟關(guān)系數(shù)據(jù)庫每張表,得到每張表的元數(shù)據(jù),從而可以知道這張表是否有主鍵。如果有主鍵,我們就創(chuàng)建一個(gè)概念而可以知道這張表是否有主鍵。如果有主鍵,我們就創(chuàng)建一個(gè)概念第二趟數(shù)據(jù)庫模式的掃描:找到概念與概念之間的對象屬性關(guān)系。第二趟數(shù)據(jù)庫模式的掃描:找到概念與概念之間的對象屬性關(guān)系。具體來說就是,對于關(guān)系數(shù)據(jù)庫中那些有外鍵的表,認(rèn)為至少存在具體來說就是,對于關(guān)系數(shù)據(jù)庫中那些有外鍵的表,認(rèn)為至少存在一個(gè)對象屬性關(guān)

43、系,通過外鍵找到前面對應(yīng)的概念,然后再建立概一個(gè)對象屬性關(guān)系,通過外鍵找到前面對應(yīng)的概念,然后再建立概念之間的屬性關(guān)系。念之間的屬性關(guān)系。 Artificial IntelligenceOntology: 31 Graduate University , Chinese academy of Sciences. 主要內(nèi)容主要內(nèi)容 本體的基本概念本體的基本概念 語義語義WebWeb 本體描述語言本體描述語言 本體構(gòu)造本體構(gòu)造 本體映射本體映射 本體知識管理本體知識管理 大規(guī)模知識系統(tǒng)大規(guī)模知識系統(tǒng)Artificial IntelligenceOntology: 32 Graduate Unive

44、rsity , Chinese academy of Sciences. 本體映射(本體映射(1) 本體映射問題可以歸結(jié)為以下三個(gè)原因:本體映射問題可以歸結(jié)為以下三個(gè)原因: 本體之間知識共享的需要:同一領(lǐng)域知識的共同理解。本體之間知識共享的需要:同一領(lǐng)域知識的共同理解。 人機(jī)交互的需要:解決已有本體的維護(hù)和本體重用,以及本體的服務(wù)人機(jī)交互的需要:解決已有本體的維護(hù)和本體重用,以及本體的服務(wù)。 本體匹配(本體匹配(ontology matching)的需要:本體間的知識推理。)的需要:本體間的知識推理。 由于通過手工方式去發(fā)現(xiàn)和操作這些本體之間的映射是一項(xiàng)由于通過手工方式去發(fā)現(xiàn)和操作這些本體之間

45、的映射是一項(xiàng)費(fèi)時(shí)、費(fèi)力、易錯(cuò)的過程,顯然是不可取的。因此,研究和費(fèi)時(shí)、費(fèi)力、易錯(cuò)的過程,顯然是不可取的。因此,研究和開發(fā)本體映射工具、建立本體映射的機(jī)制和環(huán)境,可以看作開發(fā)本體映射工具、建立本體映射的機(jī)制和環(huán)境,可以看作是對大量的已有本體的有效利用,進(jìn)而達(dá)到真正意義上的知是對大量的已有本體的有效利用,進(jìn)而達(dá)到真正意義上的知識共享的關(guān)鍵問題。識共享的關(guān)鍵問題。 Artificial IntelligenceOntology: 33 Graduate University , Chinese academy of Sciences. 本體映射(本體映射(2) 本體映射體系結(jié)構(gòu)本體映射體系結(jié)構(gòu) :本

46、體映射的基本體系結(jié)構(gòu)有三種:本體映射的基本體系結(jié)構(gòu)有三種: 單本體結(jié)構(gòu):一個(gè)全局的本體為具體的語義說明提供了一個(gè)共享的詞單本體結(jié)構(gòu):一個(gè)全局的本體為具體的語義說明提供了一個(gè)共享的詞匯表。所有的信息源都聯(lián)系到這個(gè)全局本體上,因而它們在語義上是匯表。所有的信息源都聯(lián)系到這個(gè)全局本體上,因而它們在語義上是一致的。一致的。 多本體結(jié)構(gòu):每一個(gè)信息源都有自己的本地本體,它們并不一定使用多本體結(jié)構(gòu):每一個(gè)信息源都有自己的本地本體,它們并不一定使用同樣的詞匯表。每個(gè)本體都是獨(dú)立發(fā)展的,它們之間有松散的聯(lián)系。同樣的詞匯表。每個(gè)本體都是獨(dú)立發(fā)展的,它們之間有松散的聯(lián)系。要完成本體之間的互操作,必須建立映射的規(guī)則

47、。要完成本體之間的互操作,必須建立映射的規(guī)則。 混合結(jié)構(gòu):它綜合了前兩種方法的基本特征以克服它們的不足之處?;旌辖Y(jié)構(gòu):它綜合了前兩種方法的基本特征以克服它們的不足之處。像多本體方法一樣,每個(gè)信息源都有自己的本地本體。但本地本體是像多本體方法一樣,每個(gè)信息源都有自己的本地本體。但本地本體是在一個(gè)全局共享的詞匯表下發(fā)展起來的。共享詞匯表定義了領(lǐng)域內(nèi)的在一個(gè)全局共享的詞匯表下發(fā)展起來的。共享詞匯表定義了領(lǐng)域內(nèi)的基本術(shù)語,在本地本體中這些術(shù)語可以組合起來表達(dá)復(fù)雜的語義。基本術(shù)語,在本地本體中這些術(shù)語可以組合起來表達(dá)復(fù)雜的語義。 Artificial IntelligenceOntology: 34 G

48、raduate University , Chinese academy of Sciences. 本體映射(本體映射(3)本體映射方法分類本體映射方法分類 :可以將本體映射方法分類如下:可以將本體映射方法分類如下 Artificial IntelligenceOntology: 35 Graduate University , Chinese academy of Sciences. 本體映射(本體映射(4) 本體映射原型系統(tǒng)本體映射原型系統(tǒng) 斯坦福大學(xué)的本體代數(shù)斯坦福大學(xué)的本體代數(shù) :在此方法中,本體的映射由本體代數(shù)來:在此方法中,本體的映射由本體代數(shù)來執(zhí)行。它包括三個(gè)操作符,即集合交、集

49、合并和集合差。本體代數(shù)執(zhí)行。它包括三個(gè)操作符,即集合交、集合并和集合差。本體代數(shù)的目標(biāo)是提供一的目標(biāo)是提供一種能力用來咨詢那些存在大量語義且互斥的知識資種能力用來咨詢那些存在大量語義且互斥的知識資源。源。 CupidCupid:是一種基于元素級匹配和結(jié)構(gòu)級匹配的混合方法。它可用:是一種基于元素級匹配和結(jié)構(gòu)級匹配的混合方法。它可用于數(shù)據(jù)庫、本體論等多種領(lǐng)域的匹配任務(wù)。其思想是,如果兩個(gè)概于數(shù)據(jù)庫、本體論等多種領(lǐng)域的匹配任務(wù)。其思想是,如果兩個(gè)概念的子概念是相似的,那么這兩個(gè)概念就趨向于相似念的子概念是相似的,那么這兩個(gè)概念就趨向于相似; ; 如果兩個(gè)概如果兩個(gè)概念具有相似的祖先,那么它們也趨于相

50、似。念具有相似的祖先,那么它們也趨于相似。GLUEGLUE:用機(jī)器學(xué)習(xí)的方法來完成不同本體之間的匹配任務(wù),其思想:用機(jī)器學(xué)習(xí)的方法來完成不同本體之間的匹配任務(wù),其思想是多策略學(xué)習(xí)。它代表了一種自動合并不同匹配器是多策略學(xué)習(xí)。它代表了一種自動合并不同匹配器(learner)(learner)匹配匹配結(jié)果的組合方法,產(chǎn)生的是原子級的結(jié)果的組合方法,產(chǎn)生的是原子級的1: 11: 1的映射關(guān)系。的映射關(guān)系。Artificial IntelligenceOntology: 36 Graduate University , Chinese academy of Sciences. 主要內(nèi)容主要內(nèi)容 本體的

51、基本概念本體的基本概念 語義語義WebWeb 本體描述語言本體描述語言 本體構(gòu)造本體構(gòu)造 本體映射本體映射 本體知識管理本體知識管理 大規(guī)模知識系統(tǒng)大規(guī)模知識系統(tǒng)Artificial IntelligenceOntology: 37 Graduate University , Chinese academy of Sciences. 本體知識管理(本體知識管理(1)基于本體的知識管理基于本體的知識管理 : 基于本體知識管理可實(shí)現(xiàn)語義級知識服務(wù),提高知識利用的深度。還可以支持對隱性知識進(jìn)行推理,方便異構(gòu)知識服務(wù)之間實(shí)現(xiàn)互操作,方便融入領(lǐng)域?qū)<抑R及經(jīng)驗(yàn)知識結(jié)構(gòu)化等。 基于本體知識管理一般要求滿足以下基本功能:基于本體知識管理一般要求滿足以下基本功能:支持本體支持本體多種表示語言和存儲形式,具有本體導(dǎo)航功能;多種表示語言和存儲形式,具有本體導(dǎo)航功能;支持本體支持本體的基本操作如本體學(xué)習(xí)、本體映射、本體合并等;的基本操作如本體學(xué)習(xí)、本體映射、本體合并等;Artificial IntelligenceOntology: 38 Graduate University , Chinese academy of Sciences. 本體知識管理(本體知識管理(2)領(lǐng)域本體

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負(fù)責(zé)。
  • 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

最新文檔

評論

0/150

提交評論