關(guān)系模型到本體模型映射方法研究_第1頁
關(guān)系模型到本體模型映射方法研究_第2頁
關(guān)系模型到本體模型映射方法研究_第3頁
關(guān)系模型到本體模型映射方法研究_第4頁
關(guān)系模型到本體模型映射方法研究_第5頁
全文預(yù)覽已結(jié)束

下載本文檔

版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進行舉報或認領(lǐng)

文檔簡介

1、m國學朮友叢廚www.qikanwang.nEt關(guān)系模型到本體模型映射方法研究摘要:本體通常用來描述內(nèi)容的語義,以實現(xiàn)基于語義的內(nèi)容共 享和集成。然而,手工構(gòu)建本體通常耗費巨大,使得本體構(gòu)建成為 一項艱巨的任務(wù)。因此,有必要研究基于結(jié)構(gòu)化數(shù)據(jù)的本體學習技 術(shù)。提出了從關(guān)系數(shù)據(jù)庫中學習本體的方法,定義了關(guān)系數(shù)據(jù)源到 本體的映射規(guī)則并與現(xiàn)有方法進行了詳細的比較,同時給出了應(yīng)用 實例及原型實現(xiàn)。分析表明,與現(xiàn)有方法相比,本文提出的方法在 映射的完整性及正確性方面有較大提高。關(guān)鍵詞:本體;關(guān)系模型;結(jié)構(gòu)化數(shù)據(jù);語義;原型relational model to the ontology model ma

2、pping methods study sun weiqia ng1,zha ng qia n2(l.liaoning equipment manufacture college,communicationengin eeri ng,she nyan g,110161,chi na;2 .n eusoft group,the tsd,she nyan g110179,chi na)abstract:the body is usually used to describe the semanticsof the content in order to achieve sema ntic-base

3、d content shari ng and in tegratio n.however,the manu ally con structed ontology is usually costly, the ontology construction is a difficult task.therefore,it is necessary to study the structured data-based ontology learning techniquesearning ontology from relational database,the definition of a rel

4、ational data source to the ontology mapping rules and a detailed comparison with existing methods,and application in sta nee and prototype impleme ntatio n. the an alysis showed that compared with exist ing methods,the proposed method has improved greatly in the integrity and accuracy of mapping.key

5、words: on tology;relati onal model;structured data;sema ntics;prototype本文主要研究如何從結(jié)構(gòu)化(主要是關(guān)系數(shù)據(jù)庫,面向?qū)ο髷?shù)據(jù)庫 應(yīng)用范圍有限,暫不討論)數(shù)據(jù)源獲取期望的本體。第一節(jié)對現(xiàn)有 相關(guān)工作進行了討論,并指出了其中存在的不足;第二節(jié)對本體與 w3c最新提出的本體描述語言owl作了簡要介紹;第三節(jié)描述了關(guān) 系模型到本體模型的映射,實現(xiàn)了一種從關(guān)系數(shù)據(jù)庫中學習本體的 方法。一、相關(guān)工作lawrence和giles 在1998年時估計互聯(lián)網(wǎng)上有 80%勺內(nèi)容存儲在 hidden web中1 , 2,所謂hidden we

6、b中的數(shù)據(jù)就是存儲在數(shù)據(jù) 庫中的數(shù)據(jù)。因此,如何從數(shù)據(jù)庫中學習有意義的本體是有必要的。實際上,20世紀90年代提出的關(guān)系數(shù)據(jù)庫逆向工程(relational database reverse engin eeri ng)3就是分析關(guān)系模式中所包含的語義,以生成更為復(fù)雜的模型結(jié)構(gòu)表達更為豐富的語義。在最新的 研究成果中,kashyap通過分析關(guān)系模式的語義得到一個侯選本體,然后通過分析用戶的查詢進一步修正該本體,由于用戶查詢的隨機 性,因而很難保證本體學習的質(zhì)量; manli等人通過分析關(guān)系表的屬性、主外鍵的依賴關(guān)系,來建立關(guān)系模式到本體模型的映射規(guī)則, 然后通過一系列評價方法修正這些規(guī)則并生成

7、最終的本體。然而, 現(xiàn)有的這些方法都存在著一定的不足,其映射規(guī)則的正確性值得商 榷。二、本體與owl本體是描述特定領(lǐng)域內(nèi)的概念、屬性及其關(guān)系的詞匯和公理的集合。下面給出本體的形式化定義。定義2.1本體定義為一個六元組:o=(c,attr,hc,rel,ao,i),其中c為本體o的概念集(“ owl:class ”的實例);hc c x c表示 概念間的繼承關(guān)系,如hc (ci,cj) 表示ci為cj的子概念。attr 表示概念集c的數(shù)據(jù)類型屬性集(“ owl: datatypeproperty ”的實 例)。rel c x c表示概念集c的對象屬性集(“owl:objectproperty”的

8、實例),描述了概念之間的關(guān)系。ao是附加到該本體的公理集,i是概念集c的實例集。owl是由w3c最新提出的本體描述語言,owl可以進一步細分為owl lite、owl dl 和 owl full 。其中,owl dl 忽略了對 rdfs (resource description framework schema ) 4的兼容性,主要對概念、屬 性及概念實例的關(guān)系進行描述,具有較強的語義表達能力;owl lite 是owl dl的一個子集,降低了 owl dl中的公理約束(例如owl dl 制定了類型分離原則,即類和實例、屬性是嚴格區(qū)分開的),保證 一個高效的推理過程。而 owl full實現(xiàn)

9、了對rdfs的向上兼容性, 但不能保證可判定推理18。三、關(guān)系模型到本體的映射(一)映射規(guī)則為便于描述,首先給出映射規(guī)則的幾個原語及其語義182P_key(ri):表示關(guān)系ri的主鍵集;f_key(ri):表示關(guān)系ri的外鍵集;attr(ri):表示關(guān)系ri的屬性集,滿足p_key(ri) attr(ri)f_key(ri) attr(ri);dom(ai):其中ai attr(ri) ,表示屬性ai的定義域;range(ai):其中ai attr(ri),表示屬性ai的值域。rule1 :對于任意 ri 與 rj ,i j ,若 p_key(ri)= p_key(rj) ,則將ri與rj映射為同一個類c,ri與rj屬性即為類c的屬性。或者將ri與rj分別映射為兩個類,并將這兩個類設(shè)置為等價類(equivale ntclass)。rule2 :任意 ai p_key(ri) ,且 ai attr(rj) ,i j ,貝U ri 單獨映射為一個類ci。若關(guān)系ri的主屬性不屬于任意attr(rj) , i j,表明ri描述的事 物與rj描述的不同。rule3 :若 attr(ri) n attr(rj)=,貝U ri 對應(yīng)的類 ci 與rj對應(yīng)的類cj存在dis

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負責。
  • 6. 下載文件中如有侵權(quán)或不適當內(nèi)容,請與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

評論

0/150

提交評論