2011-8-8-本體與知識系統(tǒng)

上傳人：g*** IP屬地：山西上傳時(shí)間：2022-08-07 格式：PPTX 頁數(shù)：51 大?。?51.59KB 積分：40 舉報(bào) 版權(quán)申訴

已閱讀5頁，還剩46頁未讀，繼續(xù)免費(fèi)閱讀

版權(quán)說明：本文檔由用戶提供并上傳，收益歸屬內(nèi)容提供方，若內(nèi)容存在侵權(quán)，請進(jìn)行舉報(bào)或認(rèn)領(lǐng)

文檔簡介

1、本體與知識系統(tǒng)2011年8月10日1主要內(nèi)容本體的基本概念語義網(wǎng)本體描述語言本體構(gòu)造本體映射本體知識管理2本體的基本概念語義網(wǎng)本體描述語言本體構(gòu)造本體映射本體知識管理主要內(nèi)容3本體的基本概念（1）本體：哲學(xué)界：最初本體是哲學(xué)理論的術(shù)語，關(guān)于存在及其本質(zhì)規(guī)律的學(xué)說，是表示對象及其相互關(guān)系的理論。信息科學(xué)：常用于指層次化的數(shù)據(jù)結(jié)構(gòu)，其中包含了對象及其關(guān)系，以及相關(guān)領(lǐng)域的規(guī)則人工智能：被用于知識管理、自然語言處理、電子商務(wù)、教育以及語義WEB等領(lǐng)域。語義WEB需要構(gòu)造不同的本體，用于不同的表示語言、查詢語言和推理語言。一個(gè)本體定義了組成主題領(lǐng)域的詞匯的基本術(shù)語和關(guān)系，以及用于組合術(shù)語和關(guān)系以及定義詞

2、匯外延的規(guī)則Neches1991-即要建立一個(gè)本體，首先要識別所面對領(lǐng)域的基本術(shù)語和這些術(shù)語的關(guān)系，然后要識別組合這些術(shù)語和關(guān)系的規(guī)則，并提供這些術(shù)語和關(guān)系的規(guī)則4Gruber和Borst1997的定義：本體是概念化的一個(gè)顯式的規(guī)格說明Gruber 1993 本體可定義為被共享的概念化的一個(gè)形式的規(guī)格說明Borst1997共同點(diǎn)：都強(qiáng)調(diào)了給出形式解釋的可能性主要缺點(diǎn)：對“概念化”一詞并沒有給出明確地解釋概念化涉及通過標(biāo)示某個(gè)現(xiàn)象的相關(guān)概念而得到的這個(gè)現(xiàn)象的抽象模型。顯式地指出所用的概念的類型，以及定義概念所使用的約束。形式化是指本體應(yīng)該是機(jī)器可讀的。共享反映了這樣一個(gè)觀念，即本體獲取了一致的

3、知識，它不是某個(gè)個(gè)體私有的，而是可以被一個(gè)群體所接受的。Studer1998本體的基本概念（2）5 本體的作用人與組織之間的信息交流。本體的核心概念是知識共享，通過減少概念和術(shù)語上的歧義，本體描述為某一組織或是工作小組提供了一個(gè)統(tǒng)一框架或是規(guī)范模型，使得來自不同背景、持不同觀點(diǎn)和目的的人員之間的理解和交流成為可能，并保持語義上的一致性。系統(tǒng)之間的互操作。應(yīng)用程序使用本體論實(shí)現(xiàn)異構(gòu)系統(tǒng)之間的互操作，即不同系統(tǒng)或工具之間的數(shù)據(jù)傳輸。如語義Web服務(wù)就屬于此類。需求分析和系統(tǒng)設(shè)計(jì)的基礎(chǔ)。支持知識重用。顯式地定義對領(lǐng)域的認(rèn)識。以往在處理領(lǐng)域相關(guān)問題時(shí)，領(lǐng)域知識往往被隱含地硬編碼到程序中去，這樣領(lǐng)域

4、知識既難以發(fā)現(xiàn)，又不便于改變。使用本體可以顯式的描述這種領(lǐng)域相關(guān)的知識，使得知識能夠清晰的從代碼中獨(dú)立出來。將領(lǐng)域知識同使用領(lǐng)域知識的操作性知識分離開來。本體的基本概念（3）6本體的種類本體的基本概念（4）7本體的基本概念語義網(wǎng)本體描述語言本體構(gòu)造本體映射本體知識管理主要內(nèi)容8 6月15日，芬蘭總統(tǒng)哈洛寧在芬蘭首都赫爾辛基舉行的首屆“千年技術(shù)獎(jiǎng)”頒獎(jiǎng)儀式上，將100萬歐元的獎(jiǎng)金和名為“頂峰”的紀(jì)念獎(jiǎng)品頒發(fā)給“萬維網(wǎng)之父”英國科學(xué)家伯納斯李教授。今天，世界幾十億人得以坐在個(gè)人電腦前自由翱翔于網(wǎng)絡(luò)世界，就是因?yàn)椴{斯李發(fā)明的萬維網(wǎng)。語義網(wǎng)（1）9 萬維網(wǎng)（簡稱WWW或Web）是互聯(lián)網(wǎng)最重要和最廣

5、泛的應(yīng)用之一，利用萬維網(wǎng)用戶可以瀏覽互聯(lián)網(wǎng)上所有的信息資源。但是，萬維網(wǎng)存在兩個(gè)明顯的不足：（1）計(jì)算機(jī)不能理解網(wǎng)頁內(nèi)容的語義；（2）網(wǎng)上有用信息難找，即使借助功能強(qiáng)大的搜索引擎，查準(zhǔn)率也比較低，它在幫助網(wǎng)民得到成批相關(guān)網(wǎng)頁的同時(shí)，也夾雜了許多用戶不需要的信息垃圾。10 為了使人們能夠按內(nèi)容的語義表達(dá)需求，迅速準(zhǔn)確地從成千上萬的網(wǎng)頁中過濾出自己感興趣的內(nèi)容，同時(shí)使計(jì)算機(jī)能夠理解網(wǎng)頁內(nèi)容，幫助人們處理許多煩瑣的日常事務(wù)，1998年，在發(fā)明萬維網(wǎng)10年之后，伯納斯李提出了下一代萬維網(wǎng)“語義網(wǎng)”的理念。語義網(wǎng)（2）11 語義網(wǎng)(Semantic Web) 是一個(gè)由萬維網(wǎng)聯(lián)盟的蒂姆伯納斯-李(Tim

6、 Berners-Lee)在1998年提出的一個(gè)概念，它的核心是：通過給萬維網(wǎng)上的文檔(如:HTML)添加能夠被計(jì)算機(jī)所理解的語義(Meta data)，從而使整個(gè)互聯(lián)網(wǎng)成為一個(gè)通用的信息交換媒介。12 1990年，Tim Berners-Lee發(fā)明了萬維網(wǎng)（Web)，目的是讓人們通過因特網(wǎng)（Internet)來獲得各種信息。十年后，2002年12月， Tim Berners-Lee在XML2000會(huì)議上提出了下一代因特網(wǎng)的概念語義網(wǎng)（Semantic Web)，并于2001年5月在科學(xué)美國人雜志上發(fā)表同名論文“The Semantic Web”，為人們勾畫了一幅未來語義網(wǎng)的美好前景。13Ti

7、m Berners-Lee，W3C 總監(jiān)，萬維網(wǎng)發(fā)明者14當(dāng)前的萬維網(wǎng)（ The Current Web）Resources: 資源：根據(jù)URI來辨識未經(jīng)分門別類的聯(lián)接：有限的，無描述的User: 用戶：令人激動(dòng)的世界，但是，資源的語義要從內(nèi)容中一點(diǎn)點(diǎn)的撿出來， Machine: 機(jī)器：可得到的信息微乎其微- 有關(guān)聯(lián)接的重要性只能根據(jù)圍繞聯(lián)接點(diǎn)的上下文來證明。15語義網(wǎng) （The Semantic Web）Resources: 資源：通過URI全球獲得或者辨識地方重點(diǎn)可擴(kuò)充，相關(guān)的Links: 聯(lián)接：根據(jù)URI來辨識可擴(kuò)充，相關(guān)的User: 用戶：更加令人激動(dòng)的世界，更加豐富的用戶經(jīng)歷 M

8、achine: 機(jī)器：可得到更多能用機(jī)器處理的信息Computers and people: 計(jì)算機(jī)與人：有效的工作，學(xué)習(xí)和交流知識16語義Web （1）本體在Web上的應(yīng)用導(dǎo)致了語義Web的誕生，其目的是解決Web上信息共享時(shí)的語義問題。語義Web提供了一個(gè)通用的框架，允許跨越不同應(yīng)用程序、企業(yè)和團(tuán)體的邊界共享和重用數(shù)據(jù)。語義Web以資源描述框架（RDF）為基礎(chǔ)。RDF以XML作為語法、URI作為命名機(jī)制，將各種不同的應(yīng)用集成在一起，對Web上的數(shù)據(jù)所進(jìn)行的一種抽象表示。語義Web所指的“語義”是“機(jī)器可處理的”語義，而不是自然語言語義和人的推理等目前計(jì)算機(jī)所不能夠處理的信息。從技術(shù)上講，語

9、義Web要提供足夠而又合適的語義描述機(jī)制。然而，從整個(gè)應(yīng)用構(gòu)想來看，語義Web要實(shí)現(xiàn)的是信息在知識級別上的共享和語義級別上的互操作性，這需要不同系統(tǒng)間有一個(gè)語義上的“共同理解”才行。于是，本體自然地成為指導(dǎo)語義Web發(fā)展的理論基礎(chǔ)。 17語義Web的基礎(chǔ)架構(gòu)Tim Berners-Lee，2000 語義Web （2）18語義Web的基本構(gòu)建元素URI（Uniform Resource Identifiers）作為資源（任何東西都可以看作資源）標(biāo)識機(jī)制，提供對資源的標(biāo)準(zhǔn)化的名字描述；Unicode提供世界上各種語言的統(tǒng)一的字符編碼標(biāo)準(zhǔn)；XML(Extensible Markup Language

10、)定義了結(jié)構(gòu)化的數(shù)據(jù)描述方式，是數(shù)據(jù)互操作的語法基礎(chǔ)；Namespace提供將名字分類的機(jī)制，使得重名但含義不同的資源能夠一起使用。語義Web （3）19語義Web的層次模型(1）RDFRDF Schema Layer： RDF（Resource Description Framework）是描述數(shù)據(jù)語義的基礎(chǔ)，它定義了描述資源以及陳述事實(shí)的三類對象：資源（resource）、屬性（property）和值（value）。資源是指網(wǎng)絡(luò)上的數(shù)據(jù)，屬性是指用來描述資源的一個(gè)方面、特征、屬性以及關(guān)系，陳述則用來表示一個(gè)特定的資源，它包括一個(gè)命了名的屬性和它對應(yīng)資源的值，因此一個(gè)RDF描述實(shí)際上就是一個(gè)

11、三元組： (objectresource, attributeproperty, valueresource or literal)語義Web （4）20語義Web的層次模型（2）本體層：本體給出了數(shù)據(jù)的語義信息，即元數(shù)據(jù)。本體的定義可以直接基于RDF Schema。但是RDF Schema的詞匯集的表達(dá)能力有限，因此W3C在參考了DAMLOIL(DARPA Agent Markup Language with Ontology Inference Layer)之后，又在RDF之上制定了OWL(Web Ontology Language)。（3）邏輯：邏輯層在本體所描述的知識之上提供邏輯推理能

12、力（基于規(guī)則）。語義Web （5）21語義Web的層次模型（4）證明層：在語義Web的開放環(huán)境中進(jìn)行推理是一個(gè)困難的任務(wù)，因?yàn)槿魏我粋€(gè)推論都可能涉及到大量信息的處理。研究者由此提出了語義Web總線(Semantic Web Bus)的設(shè)想。語義Web中充斥著各種信息處理器（圖中圓形所示），其中一些僅僅提供本體數(shù)據(jù)供其它處理器使用，另外一些則根據(jù)這些本體數(shù)據(jù)構(gòu)建邏輯規(guī)則，啟發(fā)式引擎則負(fù)責(zé)根據(jù)本體、數(shù)據(jù)和邏輯規(guī)則進(jìn)行推理，得到“結(jié)論”(Proof)，并把這種結(jié)論返回到邏輯規(guī)則和本體數(shù)據(jù)中去。語義Web （6）22語義Web的層次模型（5）可信層：在之前所有層次的基礎(chǔ)之上，會(huì)形成無數(shù)對于某一事實(shí)的

13、陳述，這些陳述合理與否依賴于它們所處的上下文環(huán)境。因此當(dāng)人或計(jì)算機(jī)訪問這些陳述時(shí)，需要根據(jù)上下文和自己的需求自行判定該陳述是否可信（Trust）。采用加密技術(shù)和數(shù)字簽名技術(shù)（滲透到每個(gè)層次的規(guī)范中去）是實(shí)現(xiàn)判定可信性的一個(gè)重要手段，并可以由此形成一個(gè)可信的Web。語義Web （7）23本體的基本概念語義Web本體描述語言本體構(gòu)造本體映射本體知識管理大規(guī)模知識系統(tǒng)主要內(nèi)容24本體描述語言（1）本體描述語言起源于人工智能領(lǐng)域?qū)χR表示的研究。本體表示語言一般要具有豐富而直觀的表達(dá)能力，用該語言表示的本體要能方便地被計(jì)算機(jī)理解、處理和應(yīng)用?，F(xiàn)在的本體表示語言多數(shù)采用了XML語法。本體描述語言還需解

14、決一些重要問題，如對推理的有效支持（包括計(jì)算復(fù)雜性和可判定性等），規(guī)范和充足的語義表示機(jī)制，以及標(biāo)準(zhǔn)化問題。這將依靠基于描述邏輯的本體語言的發(fā)展。25本體描述語言（2） RDF/S ：在提供了簡單的機(jī)器可理解語義模型的同時(shí)，為領(lǐng)域化的本休語言提供了建模基礎(chǔ)，并使得基于RDF的應(yīng)用可以方便地與這些本體語言所生成的本體進(jìn)行合并。RDF的這一特性使得基于RDF的語義描述結(jié)果具備了可以和更多的領(lǐng)域知識進(jìn)行交互的能力，也使基于XML和RDF的Web數(shù)據(jù)描述具備了良好的生命力。 OWL：目前是本體的標(biāo)準(zhǔn)描述語言。OWL建立在RDF基礎(chǔ)上，以XML為書寫工具。主要用來表達(dá)需要計(jì)算機(jī)應(yīng)用程序來處理的文件中的知

15、識信息， 26本體描述語言（3）都柏林核心元數(shù)據(jù)集都柏林核心元數(shù)據(jù)集(Dublin Core)是由美國OCLC公司發(fā)起，國際性合作項(xiàng)目Dublin Core Metadata Initiative設(shè)計(jì)的一套描述Web資源(任何有標(biāo)識的數(shù)據(jù))的元數(shù)據(jù)的規(guī)范，主要用于出版信息的描述，也被用于描述其他領(lǐng)域的信息，在很多本體描述規(guī)范中都有引用。 Dublin Core定義了一組基本元素來描述資源的元數(shù)據(jù)，很多知識描述標(biāo)準(zhǔn)和規(guī)范如RDF、DAML+OIL里都有對Dublin Core的直接引用，用來描述作者、主題等元數(shù)據(jù)。但另一方面，嚴(yán)格講Dublin Core還不是一個(gè)真正的本體描述語言，它只是一

16、組“標(biāo)準(zhǔn)詞匯集”而已。CycL 本質(zhì)上講，CycL是一階邏輯語言。但是為了增強(qiáng)知識表示的靈活性，CycL在一階邏輯的基礎(chǔ)上增加缺省知識的表示、二階謂詞等，所以是一階謂詞邏輯的一種擴(kuò)展。CycL中有大量的類和類之間的關(guān)系27本體的基本概念語義Web本體描述語言本體構(gòu)造本體映射本體知識管理大規(guī)模知識系統(tǒng)主要內(nèi)容28本體構(gòu)造（1）本體構(gòu)建是從某個(gè)領(lǐng)域中抽取知識，形成描述該領(lǐng)域數(shù)據(jù)的語義概念、實(shí)例和其間的關(guān)系。本體構(gòu)建包括本體語言和本體構(gòu)建方法兩個(gè)領(lǐng)域的研究。本體構(gòu)建方法目前大多采用手工方式，即知識工程師借助于本體編輯器全手工的構(gòu)建本體。TOVE：是多倫多大學(xué)的本體研究項(xiàng)目，它重點(diǎn)論述了本體設(shè)計(jì)和手工

17、演化過程中遇到的關(guān)鍵問題，包括應(yīng)用情景收集、術(shù)語的抽取和定義、問題的形式化等。METHONTOLOGY：根據(jù)進(jìn)化原型法的思想，提出本體生命周期的概念來管理整個(gè)本體生命過程。它采用了類似于軟件工程的開發(fā)過程和方法，將本體生成過程和本體生命周期區(qū)分開來，在不同階段使用不同的技術(shù)予以支持。 29本體構(gòu)造（2）企業(yè)建模法：是多倫多大學(xué)企業(yè)集成實(shí)驗(yàn)室的研究人員在TOVE項(xiàng)目實(shí)施時(shí)提出來的，通過構(gòu)建的一個(gè)虛擬企業(yè)本體，用來模擬企業(yè)中的生產(chǎn)、管理過程，目標(biāo)是建立一套為商業(yè)和公共企業(yè)建模的集成本體。作為該項(xiàng)目的一部分，他們設(shè)計(jì)了一套創(chuàng)建和評價(jià)本體的方法。激發(fā)場景：給出一個(gè)應(yīng)用領(lǐng)域的場景，即確定目標(biāo)領(lǐng)域非形式化

18、的能力問題：以應(yīng)用情景為基礎(chǔ)，用問題形式提出本體構(gòu)造需求術(shù)語的規(guī)范化：用一種（本體）形式化語言定義對其進(jìn)行詞匯；形式化的能力問題：把能力問題用形式化的術(shù)語定義出來；形式化公理：將本體中的公理用一階謂詞邏輯表示出來完備性定理：當(dāng)能力問題被形式化表述之后，定義在什么條件下這些問題的解決方案是完備的。30本體構(gòu)造（3）METHONTOLOGY框架方法：該方法是在骨架法的基礎(chǔ)上提出的一種更為通用的本體建設(shè)方法。本體開發(fā)過程包括：項(xiàng)目管理活動(dòng)：主要指本體開發(fā)項(xiàng)目的計(jì)劃、控制和質(zhì)量保證面向開發(fā)的活動(dòng)：包括規(guī)格說明、概念化、形式化和實(shí)現(xiàn)等步驟支持活動(dòng)。與面向開發(fā)的活動(dòng)同時(shí)展開，包括知識獲取、知識評價(jià)、知識集

19、成、產(chǎn)生文檔和配置管理等。該模式根據(jù)進(jìn)化原型法的思想，提出本體生命周期的概念來管理整個(gè)本體的開發(fā)過程，使得本體開發(fā)過程更接近于軟件工程中的軟件開發(fā)過程。 31本體構(gòu)造（4）本體構(gòu)建方法學(xué)：本體構(gòu)建實(shí)際上是一個(gè)知識獲取的過程。設(shè)計(jì)本體的基本準(zhǔn)則可以歸納為如下五條：明確性和客觀性(Clarity)：本體應(yīng)該有效地傳達(dá)所定義的術(shù)語的內(nèi)涵。一致性(Coherence)：一個(gè)本體應(yīng)該是前后一致的，也就是說，由它推斷出來的概念定義應(yīng)該與本體中的概念定義一致。至少。所有的公理應(yīng)該具有邏輯一致性?？蓴U(kuò)展性(Extensibility)：一個(gè)本體提供一個(gè)共享的詞匯，它應(yīng)該在預(yù)期的任務(wù)范圍內(nèi)提供概念的基礎(chǔ)，同時(shí)，

20、它的表示應(yīng)該使得人們能夠單調(diào)地?cái)U(kuò)展和專門化對這個(gè)詞匯的說明；也就是說，人們應(yīng)該能夠在不改變原有定義的前提下，以這組存在的詞匯為基礎(chǔ)定義新的術(shù)語。 32本體構(gòu)造（5）本體構(gòu)建方法學(xué)：本體構(gòu)建實(shí)際上是一個(gè)知識獲取的過程。設(shè)計(jì)本體的基本準(zhǔn)則可以歸納為如下五條：最小編碼偏差(Minimal encoding bias)：本體應(yīng)該處于知識的層次，而與特定的符號級編碼無關(guān)。最小本體承諾(Minimal commitment)：一個(gè)本體應(yīng)該在提供必須的共享知識的條件下，要求有最小的本體承諾。也就是說，它應(yīng)該對所模擬的事物產(chǎn)生盡可能少的推斷，而讓共享者自由地按照他們的需要去專門化和實(shí)例化這個(gè)本體。33本體構(gòu)造

21、（6）在具體實(shí)施一個(gè)領(lǐng)域本體的構(gòu)建時(shí)，可以分為8個(gè)步驟：本體需求分析本體構(gòu)建規(guī)劃獲取本體信息確定本體概念及關(guān)系本體形式化編碼本體的評價(jià)本體的演化本體的表示等過程。34本體構(gòu)造（7）基于文本的本體自動(dòng)構(gòu)建：對文本集合應(yīng)用自然語言處理技術(shù)實(shí)現(xiàn)構(gòu)建本體所需要素的抽取：基于字典的本體構(gòu)建從機(jī)器可理解的字典中抽取相關(guān)概念以及概念間的關(guān)系；基于知識庫的本體構(gòu)建將現(xiàn)有的知識庫作為知識來源實(shí)現(xiàn)本體抽??；基于半結(jié)構(gòu)模式的本體構(gòu)建從預(yù)先定義結(jié)構(gòu)的知識來源（如 XML Schema）中抽取本體；基于關(guān)系型模式的本體構(gòu)建從數(shù)據(jù)庫中抽取相關(guān)概念以及概念間的關(guān)系形成本體。 35本體構(gòu)造（8）從基于文本的本體構(gòu)建方法來看，

22、實(shí)現(xiàn)技術(shù)和手段可以分為以下幾類：基于模式的抽?。和ㄟ^詞語的出現(xiàn)模式刻畫詞語之間的關(guān)系，并匹配文本中連續(xù)詞語的出現(xiàn)模式以識別詞語之間的關(guān)系。關(guān)聯(lián)規(guī)則：關(guān)聯(lián)規(guī)則可以利用已有的概念層次結(jié)構(gòu)作為背景知識來發(fā)現(xiàn)概念之間的非分類學(xué)關(guān)系。概念聚類：概念之間因?yàn)檎Z義距離的差異而形成概念集合并產(chǎn)生層次結(jié)構(gòu)本體修剪：目的是基于不同的異構(gòu)的知識來源生成領(lǐng)域本體。概念學(xué)習(xí)：從現(xiàn)實(shí)世界的文本集合中獲取新的概念并添加到已有的本體中。36本體構(gòu)造（9）基于結(jié)構(gòu)化數(shù)據(jù)的本體構(gòu)建：從關(guān)系數(shù)據(jù)庫中學(xué)習(xí)本體是一個(gè)半自動(dòng)化的本體學(xué)習(xí)過程，它需要通過機(jī)器學(xué)習(xí)和手工的方法來進(jìn)行本體學(xué)習(xí)。手工方法構(gòu)造的本體一般具有較高的質(zhì)量和豐富的語

23、義。但這種本體構(gòu)建方法枯燥單調(diào)、效率低而且代價(jià)高。第一次掃描數(shù)據(jù)庫的模式：用來創(chuàng)建概念，得到最初的一些粗糙的概念集合。掃描一趟關(guān)系數(shù)據(jù)庫每張表，得到每張表的元數(shù)據(jù)，從而可以知道這張表是否有主鍵。如果有主鍵，我們就創(chuàng)建一個(gè)概念第二趟數(shù)據(jù)庫模式的掃描：找到概念與概念之間的對象屬性關(guān)系。具體來說就是，對于關(guān)系數(shù)據(jù)庫中那些有外鍵的表，認(rèn)為至少存在一個(gè)對象屬性關(guān)系，通過外鍵找到前面對應(yīng)的概念，然后再建立概念之間的屬性關(guān)系。 37主要內(nèi)容本體的基本概念語義網(wǎng)本體描述語言本體構(gòu)造本體映射本體知識管理38本體映射（1）本體映射問題可以歸結(jié)為以下三個(gè)原因：本體之間知識共享的需要：同一領(lǐng)域知識的共同理解。人機(jī)交

24、互的需要：解決已有本體的維護(hù)和本體重用，以及本體的服務(wù)。本體匹配（ontology matching）的需要：本體間的知識推理。由于通過手工方式去發(fā)現(xiàn)和操作這些本體之間的映射是一項(xiàng)費(fèi)時(shí)、費(fèi)力、易錯(cuò)的過程，顯然是不可取的。因此，研究和開發(fā)本體映射工具、建立本體映射的機(jī)制和環(huán)境，可以看作是對大量的已有本體的有效利用，進(jìn)而達(dá)到真正意義上的知識共享的關(guān)鍵問題。 39本體映射（2）本體映射體系結(jié)構(gòu) ：本體映射的基本體系結(jié)構(gòu)有三種：單本體結(jié)構(gòu)：一個(gè)全局的本體為具體的語義說明提供了一個(gè)共享的詞匯表。所有的信息源都聯(lián)系到這個(gè)全局本體上，因而它們在語義上是一致的。多本體結(jié)構(gòu)：每一個(gè)信息源都有自己的本地本體，它們

25、并不一定使用同樣的詞匯表。每個(gè)本體都是獨(dú)立發(fā)展的，它們之間有松散的聯(lián)系。要完成本體之間的互操作，必須建立映射的規(guī)則?；旌辖Y(jié)構(gòu)：它綜合了前兩種方法的基本特征以克服它們的不足之處。像多本體方法一樣，每個(gè)信息源都有自己的本地本體。但本地本體是在一個(gè)全局共享的詞匯表下發(fā)展起來的。共享詞匯表定義了領(lǐng)域內(nèi)的基本術(shù)語，在本地本體中這些術(shù)語可以組合起來表達(dá)復(fù)雜的語義。 40本體映射（3）本體映射方法分類：可以將本體映射方法分類如下 41本體映射（4）本體映射原型系統(tǒng) 斯坦福大學(xué)的本體代數(shù) ：在此方法中，本體的映射由本體代數(shù)來執(zhí)行。它包括三個(gè)操作符，即集合交、集合并和集合差。本體代數(shù)的目標(biāo)是提供一種能力用來咨

26、詢那些存在大量語義且互斥的知識資源。 Cupid：是一種基于元素級匹配和結(jié)構(gòu)級匹配的混合方法。它可用于數(shù)據(jù)庫、本體論等多種領(lǐng)域的匹配任務(wù)。其思想是，如果兩個(gè)概念的子概念是相似的，那么這兩個(gè)概念就趨向于相似; 如果兩個(gè)概念具有相似的祖先，那么它們也趨于相似。GLUE：用機(jī)器學(xué)習(xí)的方法來完成不同本體之間的匹配任務(wù)，其思想是多策略學(xué)習(xí)。它代表了一種自動(dòng)合并不同匹配器(learner)匹配結(jié)果的組合方法，產(chǎn)生的是原子級的1: 1的映射關(guān)系。42主要內(nèi)容本體的基本概念語義網(wǎng)本體描述語言本體構(gòu)造本體映射本體知識管理43本體知識管理（1）基于本體的知識管理：基于本體知識管理可實(shí)現(xiàn)語義級知識服務(wù)，提高知識利

27、用的深度。還可以支持對隱性知識進(jìn)行推理，方便異構(gòu)知識服務(wù)之間實(shí)現(xiàn)互操作，方便融入領(lǐng)域?qū)＜抑R及經(jīng)驗(yàn)知識結(jié)構(gòu)化等。基于本體知識管理一般要求滿足以下基本功能：支持本體多種表示語言和存儲(chǔ)形式，具有本體導(dǎo)航功能；支持本體的基本操作如本體學(xué)習(xí)、本體映射、本體合并等；44本體知識管理（2）領(lǐng)域本體學(xué)習(xí)環(huán)境OntoSphere，主要功能包括Web語料的獲取、文檔分析、本體概念和關(guān)系獲取，專家交互環(huán)境，最終建立滿足應(yīng)用需求的高質(zhì)量領(lǐng)域本體。本體管理環(huán)境OntoManager。OntoManager提供對已有本體的管理和修改編輯?；谥黧w的知識服務(wù)OntoService。提供面向語義的多主體知識服務(wù)。45本體

28、知識管理（3）一些管理工具ProtgProtg是一個(gè)基于Java的單機(jī)軟件，它的核心是本體編輯器。Protg采用了一種可擴(kuò)展的體系結(jié)構(gòu)使得它非常容易添加和整合新的功能。這些新的功能以插件（plug-in）方式加入系統(tǒng)。Protg的知識模型是基于框架和一階邏輯的。它的主要建模組件為類、槽、側(cè)面和實(shí)例。另外，Protg的知識模型允許使用PAL(KIF的子集)語言表示約束(constraints)和允許表示元類(metaclasses)。Protg也支持基于OWL語言的本體建模。一旦使用Protg建立了一個(gè)本體，本體應(yīng)用可以有多種方式訪問它。所有的本體中的詞項(xiàng)可以使用Protg Java API進(jìn)行訪問。Protg的本體可以采用多種方式進(jìn)行導(dǎo)入和導(dǎo)出。標(biāo)準(zhǔn)的Protg版本提供了對RDF/S，XML，XML Schema和OWL編輯和管理。46本體知識管理（4）一些管理工具知識管理系統(tǒng)KMSphere :計(jì)算所智能科學(xué)實(shí)驗(yàn)室研制 47本體知識管理（5）一些管理工具知識管理系統(tǒng)KMSphere :計(jì)算所智能科學(xué)實(shí)驗(yàn)室研制 OntoSphere:半自動(dòng)化本體獲取環(huán)境，主要提供：文檔獲取、源文檔預(yù)處理、相關(guān)度計(jì)算、種子本體管理和詞匯評價(jià)等。OntoManage

人人文庫> 全部分類> 教育資料 > 課件下載

溫馨提示

1. 本站所有資源如無特殊說明，都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
2. 本站的文檔不包含任何第三方提供的附件圖紙等，如果需要附件，請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
3. 本站RAR壓縮包中若帶圖紙，網(wǎng)頁內(nèi)容里面會(huì)有圖紙預(yù)覽，若沒有圖紙預(yù)覽就沒有圖紙。
4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
5. 人人文庫網(wǎng)僅提供信息存儲(chǔ)空間，僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理，對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯，并不能對任何下載內(nèi)容負(fù)責(zé)。
6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容，請與我們聯(lián)系，我們立即糾正。
7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

2011-8-8-本體與知識系統(tǒng)

文檔簡介

溫馨提示

最新文檔

評論

2011-8-8-本體與知識系統(tǒng)

文檔簡介

溫馨提示

最新文檔

評論

相關(guān)文檔