




下載本文檔
版權(quán)說(shuō)明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請(qǐng)進(jìn)行舉報(bào)或認(rèn)領(lǐng)
文檔簡(jiǎn)介
1、m國(guó)學(xué)朮友叢廚www.qikanwang.nEt關(guān)系模型到本體模型映射方法研究摘要:本體通常用來(lái)描述內(nèi)容的語(yǔ)義,以實(shí)現(xiàn)基于語(yǔ)義的內(nèi)容共 享和集成。然而,手工構(gòu)建本體通常耗費(fèi)巨大,使得本體構(gòu)建成為 一項(xiàng)艱巨的任務(wù)。因此,有必要研究基于結(jié)構(gòu)化數(shù)據(jù)的本體學(xué)習(xí)技 術(shù)。提出了從關(guān)系數(shù)據(jù)庫(kù)中學(xué)習(xí)本體的方法,定義了關(guān)系數(shù)據(jù)源到 本體的映射規(guī)則并與現(xiàn)有方法進(jìn)行了詳細(xì)的比較,同時(shí)給出了應(yīng)用 實(shí)例及原型實(shí)現(xiàn)。分析表明,與現(xiàn)有方法相比,本文提出的方法在 映射的完整性及正確性方面有較大提高。關(guān)鍵詞:本體;關(guān)系模型;結(jié)構(gòu)化數(shù)據(jù);語(yǔ)義;原型relational model to the ontology model ma
2、pping methods study sun weiqia ng1,zha ng qia n2(l.liaoning equipment manufacture college,communicationengin eeri ng,she nyan g,110161,chi na;2 .n eusoft group,the tsd,she nyan g110179,chi na)abstract:the body is usually used to describe the semanticsof the content in order to achieve sema ntic-base
3、d content shari ng and in tegratio n.however,the manu ally con structed ontology is usually costly, the ontology construction is a difficult task.therefore,it is necessary to study the structured data-based ontology learning techniquesearning ontology from relational database,the definition of a rel
4、ational data source to the ontology mapping rules and a detailed comparison with existing methods,and application in sta nee and prototype impleme ntatio n. the an alysis showed that compared with exist ing methods,the proposed method has improved greatly in the integrity and accuracy of mapping.key
5、words: on tology;relati onal model;structured data;sema ntics;prototype本文主要研究如何從結(jié)構(gòu)化(主要是關(guān)系數(shù)據(jù)庫(kù),面向?qū)ο髷?shù)據(jù)庫(kù) 應(yīng)用范圍有限,暫不討論)數(shù)據(jù)源獲取期望的本體。第一節(jié)對(duì)現(xiàn)有 相關(guān)工作進(jìn)行了討論,并指出了其中存在的不足;第二節(jié)對(duì)本體與 w3c最新提出的本體描述語(yǔ)言owl作了簡(jiǎn)要介紹;第三節(jié)描述了關(guān) 系模型到本體模型的映射,實(shí)現(xiàn)了一種從關(guān)系數(shù)據(jù)庫(kù)中學(xué)習(xí)本體的 方法。一、相關(guān)工作lawrence和giles 在1998年時(shí)估計(jì)互聯(lián)網(wǎng)上有 80%勺內(nèi)容存儲(chǔ)在 hidden web中1 , 2,所謂hidden we
6、b中的數(shù)據(jù)就是存儲(chǔ)在數(shù)據(jù) 庫(kù)中的數(shù)據(jù)。因此,如何從數(shù)據(jù)庫(kù)中學(xué)習(xí)有意義的本體是有必要的。實(shí)際上,20世紀(jì)90年代提出的關(guān)系數(shù)據(jù)庫(kù)逆向工程(relational database reverse engin eeri ng)3就是分析關(guān)系模式中所包含的語(yǔ)義,以生成更為復(fù)雜的模型結(jié)構(gòu)表達(dá)更為豐富的語(yǔ)義。在最新的 研究成果中,kashyap通過(guò)分析關(guān)系模式的語(yǔ)義得到一個(gè)侯選本體,然后通過(guò)分析用戶的查詢進(jìn)一步修正該本體,由于用戶查詢的隨機(jī) 性,因而很難保證本體學(xué)習(xí)的質(zhì)量; manli等人通過(guò)分析關(guān)系表的屬性、主外鍵的依賴關(guān)系,來(lái)建立關(guān)系模式到本體模型的映射規(guī)則, 然后通過(guò)一系列評(píng)價(jià)方法修正這些規(guī)則并生成
7、最終的本體。然而, 現(xiàn)有的這些方法都存在著一定的不足,其映射規(guī)則的正確性值得商 榷。二、本體與owl本體是描述特定領(lǐng)域內(nèi)的概念、屬性及其關(guān)系的詞匯和公理的集合。下面給出本體的形式化定義。定義2.1本體定義為一個(gè)六元組:o=(c,attr,hc,rel,ao,i),其中c為本體o的概念集(“ owl:class ”的實(shí)例);hc c x c表示 概念間的繼承關(guān)系,如hc (ci,cj) 表示ci為cj的子概念。attr 表示概念集c的數(shù)據(jù)類型屬性集(“ owl: datatypeproperty ”的實(shí) 例)。rel c x c表示概念集c的對(duì)象屬性集(“owl:objectproperty”的
8、實(shí)例),描述了概念之間的關(guān)系。ao是附加到該本體的公理集,i是概念集c的實(shí)例集。owl是由w3c最新提出的本體描述語(yǔ)言,owl可以進(jìn)一步細(xì)分為owl lite、owl dl 和 owl full 。其中,owl dl 忽略了對(duì) rdfs (resource description framework schema ) 4的兼容性,主要對(duì)概念、屬 性及概念實(shí)例的關(guān)系進(jìn)行描述,具有較強(qiáng)的語(yǔ)義表達(dá)能力;owl lite 是owl dl的一個(gè)子集,降低了 owl dl中的公理約束(例如owl dl 制定了類型分離原則,即類和實(shí)例、屬性是嚴(yán)格區(qū)分開的),保證 一個(gè)高效的推理過(guò)程。而 owl full實(shí)現(xiàn)
9、了對(duì)rdfs的向上兼容性, 但不能保證可判定推理18。三、關(guān)系模型到本體的映射(一)映射規(guī)則為便于描述,首先給出映射規(guī)則的幾個(gè)原語(yǔ)及其語(yǔ)義182P_key(ri):表示關(guān)系ri的主鍵集;f_key(ri):表示關(guān)系ri的外鍵集;attr(ri):表示關(guān)系ri的屬性集,滿足p_key(ri) attr(ri)f_key(ri) attr(ri);dom(ai):其中ai attr(ri) ,表示屬性ai的定義域;range(ai):其中ai attr(ri),表示屬性ai的值域。rule1 :對(duì)于任意 ri 與 rj ,i j ,若 p_key(ri)= p_key(rj) ,則將ri與rj映射為同一個(gè)類c,ri與rj屬性即為類c的屬性?;蛘邔i與rj分別映射為兩個(gè)類,并將這兩個(gè)類設(shè)置為等價(jià)類(equivale ntclass)。rule2 :任意 ai p_key(ri) ,且 ai attr(rj) ,i j ,貝U ri 單獨(dú)映射為一個(gè)類ci。若關(guān)系ri的主屬性不屬于任意attr(rj) , i j,表明ri描述的事 物與rj描述的不同。rule3 :若 attr(ri) n attr(rj)=,貝U ri 對(duì)應(yīng)的類 ci 與rj對(duì)應(yīng)的類cj存在dis
溫馨提示
- 1. 本站所有資源如無(wú)特殊說(shuō)明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請(qǐng)下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請(qǐng)聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
- 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁(yè)內(nèi)容里面會(huì)有圖紙預(yù)覽,若沒(méi)有圖紙預(yù)覽就沒(méi)有圖紙。
- 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
- 5. 人人文庫(kù)網(wǎng)僅提供信息存儲(chǔ)空間,僅對(duì)用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對(duì)用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對(duì)任何下載內(nèi)容負(fù)責(zé)。
- 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請(qǐng)與我們聯(lián)系,我們立即糾正。
- 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶因使用這些下載資源對(duì)自己和他人造成任何形式的傷害或損失。
最新文檔
- 篷布帳篷設(shè)計(jì)原理考核試卷
- 礦產(chǎn)勘查安全生產(chǎn)與事故預(yù)防考核試卷
- 抗凝劑皮下注射技術(shù)臨床實(shí)踐指南(2024版)解讀
- 臨床常見(jiàn)管道的護(hù)理 4
- 7-9 數(shù)字系統(tǒng)設(shè)計(jì)實(shí)例3-數(shù)字乘法器處理器設(shè)計(jì)
- 二年級(jí)數(shù)學(xué)表內(nèi)乘法口算練習(xí)共800道
- 四川建筑職業(yè)技術(shù)學(xué)院《工程圖學(xué)(二)》2023-2024學(xué)年第二學(xué)期期末試卷
- 四川省達(dá)州市開江縣2025屆初三下學(xué)期第四次周練英語(yǔ)試題含答案
- 山東省寧陽(yáng)一中2025屆學(xué)業(yè)水平考試歷史試題含解析
- 南京視覺(jué)藝術(shù)職業(yè)學(xué)院《病原微生物免疫與健康》2023-2024學(xué)年第二學(xué)期期末試卷
- 露天礦山邊坡穩(wěn)定性分析與防治措施
- 農(nóng)產(chǎn)品質(zhì)量安全農(nóng)產(chǎn)品質(zhì)量安全風(fēng)險(xiǎn)分析
- 25題電控工程師崗位常見(jiàn)面試問(wèn)題含HR問(wèn)題考察點(diǎn)及參考回答
- 施工區(qū)域安全劃分與隔離
- 基于深度學(xué)習(xí)的文本生成技術(shù)
- 新人教版高中英語(yǔ)必修二課文原文及翻譯
- 家長(zhǎng)要求學(xué)校換老師的申請(qǐng)書
- 生產(chǎn)異常報(bào)告單
- 腦梗死恢復(fù)期康復(fù)臨床路徑
- 函授小學(xué)教育畢業(yè)論文-函授小學(xué)教育畢業(yè)論文題目
- 小升初語(yǔ)文閱讀考點(diǎn) 專題六 寫景狀物類文章閱讀指導(dǎo) 課件 人教統(tǒng)編版
評(píng)論
0/150
提交評(píng)論