版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進(jìn)行舉報(bào)或認(rèn)領(lǐng)
文檔簡介
1、本體與知識系統(tǒng)2011年8月10日1主要內(nèi)容本體的基本概念語義網(wǎng)本體描述語言本體構(gòu)造本體映射本體知識管理2本體的基本概念語義網(wǎng)本體描述語言本體構(gòu)造本體映射本體知識管理主要內(nèi)容3本體的基本概念(1)本體:哲學(xué)界:最初本體是哲學(xué)理論的術(shù)語,關(guān)于存在及其本質(zhì)規(guī)律的學(xué)說,是表示對象及其相互關(guān)系的理論。信息科學(xué):常用于指層次化的數(shù)據(jù)結(jié)構(gòu),其中包含了對象及其關(guān)系,以及相關(guān)領(lǐng)域的規(guī)則人工智能:被用于知識管理、自然語言處理、電子商務(wù)、教育以及語義WEB等領(lǐng)域。語義WEB需要構(gòu)造不同的本體,用于不同的表示語言、查詢語言和推理語言。一個(gè)本體定義了組成主題領(lǐng)域的詞匯的基本術(shù)語和關(guān)系,以及用于組合術(shù)語和關(guān)系以及定義詞
2、匯外延的規(guī)則Neches1991-即要建立一個(gè)本體,首先要識別所面對領(lǐng)域的基本術(shù)語和這些術(shù)語的關(guān)系,然后要識別組合這些術(shù)語和關(guān)系的規(guī)則,并提供這些術(shù)語和關(guān)系的規(guī)則4Gruber和Borst1997的定義: 本體是概念化的一個(gè)顯式的規(guī)格說明Gruber 1993 本體可定義為被共享的概念化的一個(gè)形式的規(guī)格說明Borst1997共同點(diǎn):都強(qiáng)調(diào)了給出形式解釋的可能性主要缺點(diǎn):對“概念化”一詞并沒有給出明確地解釋概念化涉及通過標(biāo)示某個(gè)現(xiàn)象的相關(guān)概念而得到的這個(gè)現(xiàn)象的抽象模型。顯式地指出所用的概念的類型,以及定義概念所使用的約束。形式化是指本體應(yīng)該是機(jī)器可讀的。共享反映了這樣一個(gè)觀念,即本體獲取了一致的
3、知識,它不是某個(gè)個(gè)體私有的,而是可以被一個(gè)群體所接受的。Studer1998本體的基本概念(2)5 本體的作用 人與組織之間的信息交流。本體的核心概念是知識共享,通過減少概念和術(shù)語上的歧義,本體描述為某一組織或是工作小組提供了一個(gè)統(tǒng)一框架或是規(guī)范模型,使得來自不同背景、持不同觀點(diǎn)和目的的人員之間的理解和交流成為可能,并保持語義上的一致性。系統(tǒng)之間的互操作。應(yīng)用程序使用本體論實(shí)現(xiàn)異構(gòu)系統(tǒng)之間的互操作,即不同系統(tǒng)或工具之間的數(shù)據(jù)傳輸。如語義Web服務(wù)就屬于此類。需求分析和系統(tǒng)設(shè)計(jì)的基礎(chǔ)。支持知識重用。 顯式地定義對領(lǐng)域的認(rèn)識。以往在處理領(lǐng)域相關(guān)問題時(shí),領(lǐng)域知識往往被隱含地硬編碼到程序中去,這樣領(lǐng)域
4、知識既難以發(fā)現(xiàn),又不便于改變。使用本體可以顯式的描述這種領(lǐng)域相關(guān)的知識,使得知識能夠清晰的從代碼中獨(dú)立出來。將領(lǐng)域知識同使用領(lǐng)域知識的操作性知識分離開來。 本體的基本概念(3)6本體的種類本體的基本概念(4)7本體的基本概念語義網(wǎng)本體描述語言本體構(gòu)造本體映射本體知識管理主要內(nèi)容8 6月15日,芬蘭總統(tǒng)哈洛寧在芬蘭首都赫爾辛基舉行的首屆“千年技術(shù)獎(jiǎng)”頒獎(jiǎng)儀式上,將100萬歐元的獎(jiǎng)金和名為“頂峰”的紀(jì)念獎(jiǎng)品頒發(fā)給“萬維網(wǎng)之父”英國科學(xué)家伯納斯李教授。今天,世界幾十億人得以坐在個(gè)人電腦前自由翱翔于網(wǎng)絡(luò)世界,就是因?yàn)椴{斯李發(fā)明的萬維網(wǎng)。語義網(wǎng)(1)9 萬維網(wǎng)(簡稱WWW或Web)是互聯(lián)網(wǎng)最重要和最廣
5、泛的應(yīng)用之一,利用萬維網(wǎng)用戶可以瀏覽互聯(lián)網(wǎng)上所有的信息資源。但是,萬維網(wǎng)存在兩個(gè)明顯的不足:(1)計(jì)算機(jī)不能理解網(wǎng)頁內(nèi)容的語義;(2)網(wǎng)上有用信息難找,即使借助功能強(qiáng)大的搜索引擎,查準(zhǔn)率也比較低,它在幫助網(wǎng)民得到成批相關(guān)網(wǎng)頁的同時(shí),也夾雜了許多用戶不需要的信息垃圾。10 為了使人們能夠按內(nèi)容的語義表達(dá)需求,迅速準(zhǔn)確地從成千上萬的網(wǎng)頁中過濾出自己感興趣的內(nèi)容,同時(shí)使計(jì)算機(jī)能夠理解網(wǎng)頁內(nèi)容,幫助人們處理許多煩瑣的日常事務(wù),1998年,在發(fā)明萬維網(wǎng)10年之后,伯納斯李提出了下一代萬維網(wǎng)“語義網(wǎng)”的理念。 語義網(wǎng)(2)11 語義網(wǎng)(Semantic Web) 是一個(gè)由萬維網(wǎng)聯(lián)盟的蒂姆伯納斯-李(Tim
6、 Berners-Lee)在1998年提出的一個(gè)概念,它的核心是:通過給萬維網(wǎng)上的文檔(如:HTML)添加能夠被計(jì)算機(jī)所理解的語義(Meta data),從而使整個(gè)互聯(lián)網(wǎng)成為一個(gè)通用的信息交換媒介。12 1990年,Tim Berners-Lee發(fā)明了萬維網(wǎng)(Web),目的是讓人們通過因特網(wǎng)(Internet)來獲得各種信息。十年后,2002年12月, Tim Berners-Lee在XML2000會(huì)議上提出了下一代因特網(wǎng)的概念語義網(wǎng)(Semantic Web),并于2001年5月在科學(xué)美國人雜志上發(fā)表同名論文“The Semantic Web”,為人們勾畫了一幅未來語義網(wǎng)的美好前景。13Ti
7、m Berners-Lee,W3C 總監(jiān),萬維網(wǎng)發(fā)明者14當(dāng)前的萬維網(wǎng)( The Current Web)Resources: 資源:根據(jù)URI來辨識未經(jīng)分門別類的聯(lián)接:有限的,無描述的User: 用戶:令人激動(dòng)的世界,但是,資源的語義要從內(nèi)容中一點(diǎn)點(diǎn)的撿出來, Machine: 機(jī)器:可得到的信息微乎其微- 有關(guān)聯(lián)接的重要性只能根據(jù)圍繞聯(lián)接點(diǎn)的上下文來證明。15語義網(wǎng) (The Semantic Web)Resources: 資源:通過URI全球獲得或者辨識地方重點(diǎn)可擴(kuò)充,相關(guān)的Links: 聯(lián)接:根據(jù)URI來辨識 可擴(kuò)充,相關(guān)的User: 用戶:更加令人激動(dòng)的世界, 更加豐富的用戶經(jīng)歷 M
8、achine: 機(jī)器:可得到更多能用機(jī)器處理的信息Computers and people: 計(jì)算機(jī)與人:有效的工作,學(xué)習(xí)和交流知識16語義Web (1)本體在Web上的應(yīng)用導(dǎo)致了語義Web的誕生,其目的是解決Web上信息共享時(shí)的語義問題。語義Web提供了一個(gè)通用的框架,允許跨越不同應(yīng)用程序、企業(yè)和團(tuán)體的邊界共享和重用數(shù)據(jù)。語義Web以資源描述框架(RDF)為基礎(chǔ)。RDF以XML作為語法、URI作為命名機(jī)制,將各種不同的應(yīng)用集成在一起,對Web上的數(shù)據(jù)所進(jìn)行的一種抽象表示。語義Web所指的“語義”是“機(jī)器可處理的”語義,而不是自然語言語義和人的推理等目前計(jì)算機(jī)所不能夠處理的信息。從技術(shù)上講,語
9、義Web要提供足夠而又合適的語義描述機(jī)制。然而,從整個(gè)應(yīng)用構(gòu)想來看,語義Web要實(shí)現(xiàn)的是信息在知識級別上的共享和語義級別上的互操作性,這需要不同系統(tǒng)間有一個(gè)語義上的“共同理解”才行。于是,本體自然地成為指導(dǎo)語義Web發(fā)展的理論基礎(chǔ)。 17語義Web的基礎(chǔ)架構(gòu)Tim Berners-Lee,2000 語義Web (2)18語義Web的基本構(gòu)建元素URI(Uniform Resource Identifiers)作為資源(任何東西都可以看作資源)標(biāo)識機(jī)制,提供對資源的標(biāo)準(zhǔn)化的名字描述;Unicode提供世界上各種語言的統(tǒng)一的字符編碼標(biāo)準(zhǔn);XML(Extensible Markup Language
10、)定義了結(jié)構(gòu)化的數(shù)據(jù)描述方式,是數(shù)據(jù)互操作的語法基礎(chǔ);Namespace提供將名字分類的機(jī)制,使得重名但含義不同的資源能夠一起使用。語義Web (3)19語義Web的層次模型(1)RDFRDF Schema Layer: RDF(Resource Description Framework)是描述數(shù)據(jù)語義的基礎(chǔ),它定義了描述資源以及陳述事實(shí)的三類對象:資源(resource)、屬性(property)和值(value)。資源是指網(wǎng)絡(luò)上的數(shù)據(jù),屬性是指用來描述資源的一個(gè)方面、特征、屬性以及關(guān)系,陳述則用來表示一個(gè)特定的資源,它包括一個(gè)命了名的屬性和它對應(yīng)資源的值,因此一個(gè)RDF描述實(shí)際上就是一個(gè)
11、三元組: (objectresource, attributeproperty, valueresource or literal)語義Web (4)20語義Web的層次模型(2)本體層:本體給出了數(shù)據(jù)的語義信息,即元數(shù)據(jù)。本體的定義可以直接基于RDF Schema。但是RDF Schema的詞匯集的表達(dá)能力有限,因此W3C在參考了DAMLOIL(DARPA Agent Markup Language with Ontology Inference Layer)之后,又在RDF之上制定了OWL(Web Ontology Language)。(3)邏輯:邏輯層在本體所描述的知識之上提供邏輯推理能
12、力(基于規(guī)則)。語義Web (5)21語義Web的層次模型(4)證明層:在語義Web的開放環(huán)境中進(jìn)行推理是一個(gè)困難的任務(wù),因?yàn)槿魏我粋€(gè)推論都可能涉及到大量信息的處理。研究者由此提出了語義Web總線(Semantic Web Bus)的設(shè)想。 語義Web中充斥著各種信息處理器(圖中圓形所示),其中一些僅僅提供本體數(shù)據(jù)供其它處理器使用,另外一些則根據(jù)這些本體數(shù)據(jù)構(gòu)建邏輯規(guī)則,啟發(fā)式引擎則負(fù)責(zé)根據(jù)本體、數(shù)據(jù)和邏輯規(guī)則進(jìn)行推理,得到“結(jié)論”(Proof),并把這種結(jié)論返回到邏輯規(guī)則和本體數(shù)據(jù)中去。語義Web (6)22語義Web的層次模型(5)可信層:在之前所有層次的基礎(chǔ)之上,會(huì)形成無數(shù)對于某一事實(shí)的
13、陳述,這些陳述合理與否依賴于它們所處的上下文環(huán)境。因此當(dāng)人或計(jì)算機(jī)訪問這些陳述時(shí),需要根據(jù)上下文和自己的需求自行判定該陳述是否可信(Trust)。采用加密技術(shù)和數(shù)字簽名技術(shù)(滲透到每個(gè)層次的規(guī)范中去)是實(shí)現(xiàn)判定可信性的一個(gè)重要手段,并可以由此形成一個(gè)可信的Web。 語義Web (7)23本體的基本概念語義Web本體描述語言本體構(gòu)造本體映射本體知識管理大規(guī)模知識系統(tǒng)主要內(nèi)容24本體描述語言(1)本體描述語言起源于人工智能領(lǐng)域?qū)χR表示的研究。本體表示語言一般要具有豐富而直觀的表達(dá)能力,用該語言表示的本體要能方便地被計(jì)算機(jī)理解、處理和應(yīng)用?,F(xiàn)在的本體表示語言多數(shù)采用了XML語法。本體描述語言還需解
14、決一些重要問題,如對推理的有效支持(包括計(jì)算復(fù)雜性和可判定性等),規(guī)范和充足的語義表示機(jī)制,以及標(biāo)準(zhǔn)化問題。這將依靠基于描述邏輯的本體語言的發(fā)展。25本體描述語言(2) RDF/S :在提供了簡單的機(jī)器可理解語義模型的同時(shí),為領(lǐng)域化的本休語言提供了建模基礎(chǔ),并使得基于RDF的應(yīng)用可以方便地與這些本體語言所生成的本體進(jìn)行合并。RDF的這一特性使得基于RDF的語義描述結(jié)果具備了可以和更多的領(lǐng)域知識進(jìn)行交互的能力,也使基于XML和RDF的Web數(shù)據(jù)描述具備了良好的生命力。 OWL:目前是本體的標(biāo)準(zhǔn)描述語言。OWL建立在RDF基礎(chǔ)上,以XML為書寫工具。主要用來表達(dá)需要計(jì)算機(jī)應(yīng)用程序來處理的文件中的知
15、識信息, 26本體描述語言(3) 都柏林核心元數(shù)據(jù)集 都柏林核心元數(shù)據(jù)集(Dublin Core)是由美國OCLC公司發(fā)起,國際性合作項(xiàng)目Dublin Core Metadata Initiative設(shè)計(jì)的一套描述Web資源(任何有標(biāo)識的數(shù)據(jù))的元數(shù)據(jù)的規(guī)范,主要用于出版信息的描述,也被用于描述其他領(lǐng)域的信息,在很多本體描述規(guī)范中都有引用。 Dublin Core定義了一組基本元素來描述資源的元數(shù)據(jù),很多知識描述標(biāo)準(zhǔn)和規(guī)范如RDF、DAML+OIL里都有對Dublin Core的直接引用,用來描述作者、主題等元數(shù)據(jù)。但另一方面,嚴(yán)格講Dublin Core還不是一個(gè)真正的本體描述語言,它只是一
16、組“標(biāo)準(zhǔn)詞匯集”而已。CycL 本質(zhì)上講,CycL是一階邏輯語言。但是為了增強(qiáng)知識表示的靈活性,CycL在一階邏輯的基礎(chǔ)上增加缺省知識的表示、二階謂詞等,所以是一階謂詞邏輯的一種擴(kuò)展。CycL中有大量的類和類之間的關(guān)系27本體的基本概念語義Web本體描述語言本體構(gòu)造本體映射本體知識管理大規(guī)模知識系統(tǒng)主要內(nèi)容28本體構(gòu)造(1)本體構(gòu)建是從某個(gè)領(lǐng)域中抽取知識,形成描述該領(lǐng)域數(shù)據(jù)的語義概念、實(shí)例和其間的關(guān)系。本體構(gòu)建包括本體語言和本體構(gòu)建方法兩個(gè)領(lǐng)域的研究。本體構(gòu)建方法目前大多采用手工方式,即知識工程師借助于本體編輯器全手工的構(gòu)建本體。TOVE:是多倫多大學(xué)的本體研究項(xiàng)目,它重點(diǎn)論述了本體設(shè)計(jì)和手工
17、演化過程中遇到的關(guān)鍵問題,包括應(yīng)用情景收集、術(shù)語的抽取和定義、問題的形式化等。METHONTOLOGY:根據(jù)進(jìn)化原型法的思想,提出本體生命周期的概念來管理整個(gè)本體生命過程。它采用了類似于軟件工程的開發(fā)過程和方法,將本體生成過程和本體生命周期區(qū)分開來,在不同階段使用不同的技術(shù)予以支持。 29本體構(gòu)造(2)企業(yè)建模法:是多倫多大學(xué)企業(yè)集成實(shí)驗(yàn)室的研究人員在TOVE項(xiàng)目實(shí)施時(shí)提出來的,通過構(gòu)建的一個(gè)虛擬企業(yè)本體,用來模擬企業(yè)中的生產(chǎn)、管理過程,目標(biāo)是建立一套為商業(yè)和公共企業(yè)建模的集成本體。作為該項(xiàng)目的一部分,他們設(shè)計(jì)了一套創(chuàng)建和評價(jià)本體的方法。激發(fā)場景:給出一個(gè)應(yīng)用領(lǐng)域的場景,即確定目標(biāo)領(lǐng)域非形式化
18、的能力問題:以應(yīng)用情景為基礎(chǔ),用問題形式提出本體構(gòu)造需求術(shù)語的規(guī)范化:用一種(本體)形式化語言定義對其進(jìn)行詞匯;形式化的能力問題:把能力問題用形式化的術(shù)語定義出來;形式化公理:將本體中的公理用一階謂詞邏輯表示出來完備性定理:當(dāng)能力問題被形式化表述之后,定義在什么條件下這些問題的解決方案是完備的。30本體構(gòu)造(3)METHONTOLOGY框架方法:該方法是在骨架法的基礎(chǔ)上提出的一種更為通用的本體建設(shè)方法。本體開發(fā)過程包括:項(xiàng)目管理活動(dòng):主要指本體開發(fā)項(xiàng)目的計(jì)劃、控制和質(zhì)量保證面向開發(fā)的活動(dòng):包括規(guī)格說明、概念化、形式化和實(shí)現(xiàn)等步驟支持活動(dòng)。與面向開發(fā)的活動(dòng)同時(shí)展開,包括知識獲取、知識評價(jià)、知識集
19、成、產(chǎn)生文檔和配置管理等。該模式根據(jù)進(jìn)化原型法的思想,提出本體生命周期的概念來管理整個(gè)本體的開發(fā)過程,使得本體開發(fā)過程更接近于軟件工程中的軟件開發(fā)過程。 31本體構(gòu)造(4)本體構(gòu)建方法學(xué):本體構(gòu)建實(shí)際上是一個(gè)知識獲取的過程。設(shè)計(jì)本體的基本準(zhǔn)則可以歸納為如下五條:明確性和客觀性(Clarity):本體應(yīng)該有效地傳達(dá)所定義的術(shù)語的內(nèi)涵。一致性(Coherence):一個(gè)本體應(yīng)該是前后一致的,也就是說,由它推斷出來的概念定義應(yīng)該與本體中的概念定義一致。至少。所有的公理應(yīng)該具有邏輯一致性??蓴U(kuò)展性(Extensibility):一個(gè)本體提供一個(gè)共享的詞匯,它應(yīng)該在預(yù)期的任務(wù)范圍內(nèi)提供概念的基礎(chǔ),同時(shí),
20、它的表示應(yīng)該使得人們能夠單調(diào)地?cái)U(kuò)展和專門化對這個(gè)詞匯的說明;也就是說,人們應(yīng)該能夠在不改變原有定義的前提下,以這組存在的詞匯為基礎(chǔ)定義新的術(shù)語。 32本體構(gòu)造(5)本體構(gòu)建方法學(xué):本體構(gòu)建實(shí)際上是一個(gè)知識獲取的過程。設(shè)計(jì)本體的基本準(zhǔn)則可以歸納為如下五條:最小編碼偏差(Minimal encoding bias):本體應(yīng)該處于知識的層次,而與特定的符號級編碼無關(guān)。最小本體承諾(Minimal commitment):一個(gè)本體應(yīng)該在提供必須的共享知識的條件下,要求有最小的本體承諾。也就是說,它應(yīng)該對所模擬的事物產(chǎn)生盡可能少的推斷,而讓共享者自由地按照他們的需要去專門化和實(shí)例化這個(gè)本體。33本體構(gòu)造
21、(6)在具體實(shí)施一個(gè)領(lǐng)域本體的構(gòu)建時(shí),可以分為8個(gè)步驟:本體需求分析本體構(gòu)建規(guī)劃獲取本體信息確定本體概念及關(guān)系本體形式化編碼本體的評價(jià)本體的演化本體的表示等過程。34本體構(gòu)造(7)基于文本的本體自動(dòng)構(gòu)建:對文本集合應(yīng)用自然語言處理技術(shù)實(shí)現(xiàn)構(gòu)建本體所需要素的抽取:基于字典的本體構(gòu)建從機(jī)器可理解的字典中抽取相關(guān)概念以及概念間的關(guān)系;基于知識庫的本體構(gòu)建將現(xiàn)有的知識庫作為知識來源實(shí)現(xiàn)本體抽??;基于半結(jié)構(gòu)模式的本體構(gòu)建從預(yù)先定義結(jié)構(gòu)的知識來源(如 XML Schema)中抽取本體;基于關(guān)系型模式的本體構(gòu)建從數(shù)據(jù)庫中抽取相關(guān)概念以及概念間的關(guān)系形成本體。 35本體構(gòu)造(8)從基于文本的本體構(gòu)建方法來看,
22、實(shí)現(xiàn)技術(shù)和手段可以分為以下幾類:基于模式的抽?。和ㄟ^詞語的出現(xiàn)模式刻畫詞語之間的關(guān)系,并匹配文本中連續(xù)詞語的出現(xiàn)模式以識別詞語之間的關(guān)系。關(guān)聯(lián)規(guī)則:關(guān)聯(lián)規(guī)則可以利用已有的概念層次結(jié)構(gòu)作為背景知識來發(fā)現(xiàn)概念之間的非分類學(xué)關(guān)系。概念聚類:概念之間因?yàn)檎Z義距離的差異而形成概念集合并產(chǎn)生層次結(jié)構(gòu)本體修剪:目的是基于不同的異構(gòu)的知識來源生成領(lǐng)域本體。 概念學(xué)習(xí):從現(xiàn)實(shí)世界的文本集合中獲取新的概念并添加到已有的本體中。36本體構(gòu)造(9)基于結(jié)構(gòu)化數(shù)據(jù)的本體構(gòu)建 :從關(guān)系數(shù)據(jù)庫中學(xué)習(xí)本體是一個(gè)半自動(dòng)化的本體學(xué)習(xí)過程,它需要通過機(jī)器學(xué)習(xí)和手工的方法來進(jìn)行本體學(xué)習(xí)。手工方法構(gòu)造的本體一般具有較高的質(zhì)量和豐富的語
23、義。但這種本體構(gòu)建方法枯燥單調(diào)、效率低而且代價(jià)高。 第一次掃描數(shù)據(jù)庫的模式:用來創(chuàng)建概念,得到最初的一些粗糙的概念集合。掃描一趟關(guān)系數(shù)據(jù)庫每張表,得到每張表的元數(shù)據(jù),從而可以知道這張表是否有主鍵。如果有主鍵,我們就創(chuàng)建一個(gè)概念第二趟數(shù)據(jù)庫模式的掃描:找到概念與概念之間的對象屬性關(guān)系。具體來說就是,對于關(guān)系數(shù)據(jù)庫中那些有外鍵的表,認(rèn)為至少存在一個(gè)對象屬性關(guān)系,通過外鍵找到前面對應(yīng)的概念,然后再建立概念之間的屬性關(guān)系。 37主要內(nèi)容本體的基本概念語義網(wǎng)本體描述語言本體構(gòu)造本體映射本體知識管理38本體映射(1)本體映射問題可以歸結(jié)為以下三個(gè)原因:本體之間知識共享的需要:同一領(lǐng)域知識的共同理解。人機(jī)交
24、互的需要:解決已有本體的維護(hù)和本體重用,以及本體的服務(wù)。本體匹配(ontology matching)的需要:本體間的知識推理。由于通過手工方式去發(fā)現(xiàn)和操作這些本體之間的映射是一項(xiàng)費(fèi)時(shí)、費(fèi)力、易錯(cuò)的過程,顯然是不可取的。因此,研究和開發(fā)本體映射工具、建立本體映射的機(jī)制和環(huán)境,可以看作是對大量的已有本體的有效利用,進(jìn)而達(dá)到真正意義上的知識共享的關(guān)鍵問題。 39本體映射(2)本體映射體系結(jié)構(gòu) :本體映射的基本體系結(jié)構(gòu)有三種:單本體結(jié)構(gòu):一個(gè)全局的本體為具體的語義說明提供了一個(gè)共享的詞匯表。所有的信息源都聯(lián)系到這個(gè)全局本體上,因而它們在語義上是一致的。多本體結(jié)構(gòu):每一個(gè)信息源都有自己的本地本體,它們
25、并不一定使用同樣的詞匯表。每個(gè)本體都是獨(dú)立發(fā)展的,它們之間有松散的聯(lián)系。要完成本體之間的互操作,必須建立映射的規(guī)則?;旌辖Y(jié)構(gòu):它綜合了前兩種方法的基本特征以克服它們的不足之處。像多本體方法一樣,每個(gè)信息源都有自己的本地本體。但本地本體是在一個(gè)全局共享的詞匯表下發(fā)展起來的。共享詞匯表定義了領(lǐng)域內(nèi)的基本術(shù)語,在本地本體中這些術(shù)語可以組合起來表達(dá)復(fù)雜的語義。 40本體映射(3)本體映射方法分類 :可以將本體映射方法分類如下 41本體映射(4)本體映射原型系統(tǒng) 斯坦福大學(xué)的本體代數(shù) :在此方法中,本體的映射由本體代數(shù)來執(zhí)行。它包括三個(gè)操作符,即集合交、集合并和集合差。本體代數(shù)的目標(biāo)是提供一種能力用來咨
26、詢那些存在大量語義且互斥的知識資源。 Cupid:是一種基于元素級匹配和結(jié)構(gòu)級匹配的混合方法。它可用于數(shù)據(jù)庫、本體論等多種領(lǐng)域的匹配任務(wù)。其思想是,如果兩個(gè)概念的子概念是相似的,那么這兩個(gè)概念就趨向于相似; 如果兩個(gè)概念具有相似的祖先,那么它們也趨于相似。GLUE:用機(jī)器學(xué)習(xí)的方法來完成不同本體之間的匹配任務(wù),其思想是多策略學(xué)習(xí)。它代表了一種自動(dòng)合并不同匹配器(learner)匹配結(jié)果的組合方法,產(chǎn)生的是原子級的1: 1的映射關(guān)系。42主要內(nèi)容本體的基本概念語義網(wǎng)本體描述語言本體構(gòu)造本體映射本體知識管理43本體知識管理(1)基于本體的知識管理 :基于本體知識管理可實(shí)現(xiàn)語義級知識服務(wù),提高知識利
27、用的深度。還可以支持對隱性知識進(jìn)行推理,方便異構(gòu)知識服務(wù)之間實(shí)現(xiàn)互操作,方便融入領(lǐng)域?qū)<抑R及經(jīng)驗(yàn)知識結(jié)構(gòu)化等。 基于本體知識管理一般要求滿足以下基本功能:支持本體多種表示語言和存儲(chǔ)形式,具有本體導(dǎo)航功能;支持本體的基本操作如本體學(xué)習(xí)、本體映射、本體合并等;44本體知識管理(2)領(lǐng)域本體學(xué)習(xí)環(huán)境OntoSphere,主要功能包括Web語料的獲取、文檔分析、本體概念和關(guān)系獲取,專家交互環(huán)境,最終建立滿足應(yīng)用需求的高質(zhì)量領(lǐng)域本體。本體管理環(huán)境OntoManager。OntoManager提供對已有本體的管理和修改編輯?;谥黧w的知識服務(wù)OntoService。提供面向語義的多主體知識服務(wù)。45本體
28、知識管理(3)一些管理工具ProtgProtg是一個(gè)基于Java的單機(jī)軟件,它的核心是本體編輯器。Protg采用了一種可擴(kuò)展的體系結(jié)構(gòu)使得它非常容易添加和整合新的功能。這些新的功能以插件(plug-in)方式加入系統(tǒng)。Protg的知識模型是基于框架和一階邏輯的。它的主要建模組件為類、槽、側(cè)面和實(shí)例。另外,Protg的知識模型允許使用PAL(KIF的子集)語言表示約束(constraints)和允許表示元類(metaclasses)。Protg也支持基于OWL語言的本體建模。一旦使用Protg建立了一個(gè)本體,本體應(yīng)用可以有多種方式訪問它。所有的本體中的詞項(xiàng)可以使用Protg Java API進(jìn)行訪問。Protg的本體可以采用多種方式進(jìn)行導(dǎo)入和導(dǎo)出。標(biāo)準(zhǔn)的Protg版本提供了對RDF/S,XML,XML Schema和OWL編輯和管理。46本體知識管理(4)一些管理工具知識管理系統(tǒng)KMSphere :計(jì)算所智能科學(xué)實(shí)驗(yàn)室研制 47本體知識管理(5)一些管理工具知識管理系統(tǒng)KMSphere :計(jì)算所智能科學(xué)實(shí)驗(yàn)室研制 OntoSphere:半自動(dòng)化本體獲取環(huán)境,主要提供:文檔獲取、源文檔預(yù)處理、相關(guān)度計(jì)算、種子本體管理和詞匯評價(jià)等。OntoManage
溫馨提示
- 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
- 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會(huì)有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
- 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
- 5. 人人文庫網(wǎng)僅提供信息存儲(chǔ)空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負(fù)責(zé)。
- 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請與我們聯(lián)系,我們立即糾正。
- 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。
最新文檔
- 二零二五年度家居建材加盟分銷合同范本3篇
- 二零二五年度倉儲(chǔ)合同:瓶裝水儲(chǔ)存保管協(xié)議2篇
- 2025年度敬老院老年人生活照料與生活助理服務(wù)合同3篇
- 二零二五年度建筑工程監(jiān)理補(bǔ)充協(xié)議范本(綠色施工標(biāo)準(zhǔn))3篇
- 2025年度教育設(shè)備運(yùn)輸及校園設(shè)施建設(shè)合同3篇
- 二零二五年度房地產(chǎn)項(xiàng)目環(huán)境影響評價(jià)與治理合同3篇
- 虛幻制片高級課程設(shè)計(jì)
- 2025年度知識產(chǎn)權(quán)保護(hù)委托擔(dān)保協(xié)議合同范本3篇
- 二零二五年度應(yīng)急救援項(xiàng)目投標(biāo)擔(dān)保委托保證合同3篇
- 添加文字課程設(shè)計(jì)
- 項(xiàng)目貸款保證函書
- 新版標(biāo)準(zhǔn)日本語(初級)上下冊單詞默寫表
- 面向5G網(wǎng)絡(luò)建設(shè)的站點(diǎn)供電技術(shù)應(yīng)用與發(fā)展
- 普通語文課程標(biāo)準(zhǔn)(2023年核心素養(yǎng)版)
- 洗滌劑常用原料
- 《報(bào)任安書》優(yōu)秀-課件
- 曼陀羅中毒課件
- (新版)焊工(初級)理論知識考試200題及答案
- 滿堂腳手架計(jì)算書
- MRAS系統(tǒng)標(biāo)準(zhǔn)用戶手冊
- HAPS系統(tǒng)實(shí)現(xiàn)協(xié)同仿真驗(yàn)證-基礎(chǔ)電子
評論
0/150
提交評論