信息系統(tǒng)建模與集成技術(shù)_第1頁
信息系統(tǒng)建模與集成技術(shù)_第2頁
信息系統(tǒng)建模與集成技術(shù)_第3頁
信息系統(tǒng)建模與集成技術(shù)_第4頁
信息系統(tǒng)建模與集成技術(shù)_第5頁
已閱讀5頁,還剩5頁未讀, 繼續(xù)免費閱讀

下載本文檔

版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進行舉報或認領(lǐng)

文檔簡介

1、信息系統(tǒng)建模與集成技術(shù)論文基于本體的信息系統(tǒng)建模摘要:針對信息系統(tǒng)建模的特點,我們提出了一種漸進式的本體建模方法。在這 個方法中,我們特別關(guān)注信息系統(tǒng)中存在的最一般的事物,并建立了一個最抽象 的核心本體以供其他的建模人員擴展使用。同時還列出了本體建模的一般步驟。 關(guān)鍵詞:本體,信息系統(tǒng)建模,本體建模The Information System Modeling Based on ontologyAbstract: We have explored an iterative method for ontology modeling in connection with its character

2、isetiI(n this method, we especially concern with the generic things in the domain in question, and have built an abstract core ontology for the other designer to extend. We have also given some general steps for ontology modeling.Key words: ontology,information system modeling, ontology modeling1引言近

3、年來,信息系統(tǒng)正在從獨立事務(wù)處理向進行多系統(tǒng)間的知識共享、事務(wù)協(xié) 作處理和互操作轉(zhuǎn)變,信息系統(tǒng)的功能和結(jié)構(gòu)的復(fù)雜程度不斷提高,信息系統(tǒng)開 發(fā)失敗的可能性也相應(yīng)的增加了。隨著對模型研究的不斷深入,研究人員們逐漸 認識到原有的信息系統(tǒng)模型實現(xiàn)方法已經(jīng)不能夠滿足當(dāng)今企業(yè)的計算環(huán)境。本體 論在知識工程和人工智能領(lǐng)域的成功,啟發(fā)了信息系統(tǒng)的開發(fā)者,通過將本體論 引入信息系統(tǒng)建模來克服現(xiàn)有建模方法的局限。將本體引入信息系統(tǒng)建模中,可 以更好的消除語義差異,實現(xiàn)不同系統(tǒng)間的知識共享和互操作,這是未來建模技 術(shù)的發(fā)展方向和趨勢。目前,本體模型的研究已經(jīng)進入實際應(yīng)用階段。許多研究 領(lǐng)域目前都建立了自己標準的本體

4、,Web上有許多可重用的本體資源庫,這使得 諸多領(lǐng)域?qū)<夷軌蚴褂盟鼈儊砉蚕砗驮u注領(lǐng)域中的信息。構(gòu)造本體的方法有很多,比如多倫多大學(xué)的企業(yè)建模法TOVE,以及根據(jù)TOVE 改進而來的骨架法,還有斯坦福大學(xué)的Natalya F. Noy和Deborah L.McGuinness 提出的本體開發(fā)101方法等。但是,沒有哪一種方法是能適用于所有領(lǐng)域的,由 于我們所要建立的本體的領(lǐng)域和目的不一樣,這些方法都不能很好的滿足我們 的需求,所以,我們綜合了企業(yè)建模法,骨架法,101方法,結(jié)合實際的需求,提出了一種漸進式的本體建模方法,這種方法在我們的實踐中證明是易于掌握并 且有效的。2本體與信息系統(tǒng)建模2.1

5、信息系統(tǒng)建模為什么需要本體隨著計算機技術(shù)的發(fā)展和應(yīng)用,不同的領(lǐng)域都開發(fā)了大量的信息系統(tǒng),每個 信息系統(tǒng)都是基于特定的需求而建立的,每個系統(tǒng)都有自己的數(shù)據(jù)模型。這些模 型的設(shè)計者和設(shè)計時期可能都不一樣,因此,即使是本質(zhì)上相同的一個事物,不 同的模型所使用的術(shù)語、結(jié)構(gòu)和表示方法也不一樣。這種模型上的不一致性和異 構(gòu)性,使得開發(fā)者對領(lǐng)域知識的理解難以為后來的開發(fā)者所共享和復(fù)用,進而增 大實現(xiàn)系統(tǒng)間互操作的困難。這里,我們講的互操作不僅僅是技術(shù)上的互操作, 還包括運行中的互操作。技術(shù)上的互操作已經(jīng)研究了幾十年,從最開始的DIS到 后來的HLA,到現(xiàn)在的Web services以及XMSF,盡管它們都解

6、決了一些互操作的 問題,但是它解決的僅僅是技術(shù)上的互操作問題一通過正確的協(xié)議或語法交換數(shù) 據(jù)的潛力。如果目標系統(tǒng)接收到由源系統(tǒng)所生成的數(shù)據(jù)(即使這些數(shù)據(jù)的語法都 是正確的),但它對這些數(shù)據(jù)的假設(shè)和概念的理解不同于源系統(tǒng)的理解,那么系 統(tǒng)之間的互操作仍然不能實現(xiàn)。因此,系統(tǒng)之間有意義的語義理解所需要的不僅是數(shù)據(jù)交換中的技術(shù)互操作 性,還有信息互操作性。系統(tǒng)必須有能力把語義從一種語言轉(zhuǎn)化為另一種語言, 或者通過一個參考系統(tǒng)比如能理解和包含語義的支持核心本體的模型來實現(xiàn)這 種轉(zhuǎn)化。除此之外,本體還可以應(yīng)用于軟件工程,輔助構(gòu)建和維護軟件系統(tǒng), 特別是有助于實現(xiàn)軟件的可復(fù)用性,可靠性和規(guī)范說明。用形式化

7、語言表示的本 體可以作為軟件系統(tǒng)的可復(fù)用或可共享的組件,形式化的表示有利于一致性的自 動檢查,本體概念的規(guī)范說明可以輔助信息系統(tǒng)的需求識別和規(guī)范定義過程。 2.2本體在信息系統(tǒng)領(lǐng)域的定義“本體”在不同的學(xué)科領(lǐng)域的定義內(nèi)涵有所不同。在哲學(xué)范疇內(nèi),本體就是 客觀存在的系統(tǒng)說明或解釋,這個概念所關(guān)注的是客觀現(xiàn)實的抽象本質(zhì)。當(dāng)本體 被引入到計算機和信息科學(xué)領(lǐng)域,人們對本體的認識和定義經(jīng)歷了一個不斷深化 的過程,很多學(xué)者曾經(jīng)從不同的角度對它進行重新定義和解釋。目前被大部分人 公認的定義是Gruber在1994年提出的:“本體是關(guān)于共享概念的一致約定。共 享概念包括用來對領(lǐng)域知識進行建模的概念框架、需要互

8、操作的主體之間用于交 互的與內(nèi)容相關(guān)的協(xié)議,以及用于表示特定領(lǐng)域的理論的共同約定。在知識共享 的情況下,本體的形式特化為具有代表性的詞匯的定義。一種最簡單的形式是一 種層次結(jié)構(gòu),用來詳細描述類和它們之間的包含關(guān)系。關(guān)系數(shù)據(jù)庫的框架 (Schemata)也是一種本體,它用來描述能共享的數(shù)據(jù)庫之間的關(guān)系和集成這些數(shù) 據(jù)庫需遵循的約束”。2.3本體在信息系統(tǒng)建模中的功能本體論是研究實體存在性和存在本質(zhì)等方面的通用理論,其研究對象是實體 的存在性和存在的本質(zhì),并且所研究的實體存在本質(zhì)上不依附于任何語言。因此, 本體可以幫助我們從概念上抽象地描述信息系統(tǒng)模型,提高信息系統(tǒng)模型的可重 用性,同時能夠?qū)崿F(xiàn)各

9、信息系統(tǒng)之間的知識(或資源)共享和語義互操作。從已有 的研究工作成果來看,在信息系統(tǒng)建模中本體的功能體現(xiàn)在以下3個方面。通信。這里主要是指人與人之間的通信,強調(diào)無二意性的本體,對本體 的形式化程度要求可以不高?;ゲ僮鳌V赶到y(tǒng)之間的互操作,即不同模型方法、不同范例、不同語言 和不同軟件工具的相互轉(zhuǎn)換。為此而建立的本體用于作為系統(tǒng)之間的交換格式。在系統(tǒng)工程領(lǐng)域的應(yīng)用。主要表現(xiàn)在:可重用性:本體可作為相關(guān)領(lǐng) 域中重要實體、屬性、進程及其相互關(guān)系的一種形式化的編碼。這個形式化的表 示可以成為軟件系統(tǒng)中一種可重用的或可共享的組件;知識獲?。涸诮⒅?識系統(tǒng)時,用一個相關(guān)的本體作為出發(fā)點去引導(dǎo)知識的獲取。

10、將加快知識獲取的 進程,提高所獲取知識的可靠性;可靠性:形式化的表示有利于軟件一致化 的自動檢查,從而產(chǎn)生更可靠的軟件; 軟件需求規(guī)格說明:本體可以用來輔 助需求的確定,并為信息系統(tǒng)定義規(guī)格說明。3信息系統(tǒng)建模中本體的分類方法3.1信息系統(tǒng)建模中本體的分類及層次信息系統(tǒng)建模中要求本體能夠清晰、準確并且簡潔地描述現(xiàn)實世界中所有事 物的關(guān)系和屬性,并且這種描述應(yīng)該具有普遍性和通用性。本體的分類明確了不 同本體之間的區(qū)別與聯(lián)系。目前尚沒有統(tǒng)一規(guī)范的本體分類方法,我們根據(jù)信息 系統(tǒng)建模中本體描述對象和功能的不同,將本體分為3個層次。第一層次是表示本體。提供用于信息系統(tǒng)建模的描述框架,不規(guī)定描述對象,

11、定義了框架、槽的概念,用以規(guī)范描述。第二層次包括領(lǐng)域本體和任務(wù)本體。領(lǐng)域本體:描述領(lǐng)域知識,依據(jù)表示本 體規(guī)定的描述框架和用戶的實際需求。它集聚了某一領(lǐng)域的概念實體、及其定義 與關(guān)聯(lián)。任務(wù)本體:任務(wù)本體主要研究可共享的與領(lǐng)域無關(guān)的問題求解方法,定 義通用任務(wù)和推理活動,如診斷等。它們都可以引用頂層本體中定義的詞匯來描 述自己的詞匯;任務(wù)本體主要涉及動態(tài)知識,而不是靜態(tài)知識。第三層次是應(yīng)用本體。按照實現(xiàn)功能分為角色對象本體、業(yè)務(wù)流本體和事務(wù) 處理本體。角色對象本體用來描述信息系統(tǒng)的結(jié)構(gòu)及傳遞的各種信息;業(yè)務(wù)流本 體用來描述各種內(nèi)部功能與外部功能之間的工作流與業(yè)務(wù)流;而事務(wù)處理本體是 與特定的工作

12、流環(huán)節(jié)相關(guān)的行為或者決策方法。這樣的信息系統(tǒng)描述和功能劃分方法,有助于對特定的功能或者問題單獨建 模,相互之間不會影響,提高信息系統(tǒng)模型的適應(yīng)性和敏捷性,使結(jié)構(gòu)與功能獨 立開來,適合于信息系統(tǒng)的快速構(gòu)建和可重用性。3.2領(lǐng)域本體和任務(wù)本體在信息系統(tǒng)建模中的作用領(lǐng)域本體和任務(wù)本體是信息系統(tǒng)模型的基礎(chǔ),它們的構(gòu)建是否成功直接影響 著系統(tǒng)模型的成敗。我們之所以在系統(tǒng)建模領(lǐng)域研究中應(yīng)用領(lǐng)域本體和任務(wù)本 體,是因為它們具有以下突出的特點??梢栽诓煌慕7椒?、范式、語言 和軟件工具之間進行翻譯和映射,以實現(xiàn)不同系統(tǒng)之間的互操作和繼承;適合 表示抽象的描述;可以為信息系統(tǒng)模型的構(gòu)建提供一個基本的結(jié)構(gòu); 提

13、供 的是一個嚴謹豐富的理論,而不單單是一個存放數(shù)據(jù)的結(jié)構(gòu)。4本體模型概念是對實體,事件或現(xiàn)象進行概念化的過程,也就是說,概念可以分為兩 種:一是關(guān)于實體的相對靜態(tài)概念,一是關(guān)于事件或現(xiàn)象的相對動態(tài)概念。那么, 在建立領(lǐng)域模型的時候,我們是否可以依據(jù)這樣的思路來做呢?我們先來看看C21EDM (C2信息交換數(shù)據(jù)模型,Command and Control Information Exchange Data Model)的方法。C2IEDM是一個已經(jīng)開發(fā)了20多年的 用于信息交換和數(shù)據(jù)管理的數(shù)據(jù)模型,它是基于實體的,所有的對象,現(xiàn)象,事 件,活動,狀態(tài),關(guān)系等都通過實體來描述。其中,對象(OBJE

14、CT-TYPE & OBJECT-ITEM)實體主要描述戰(zhàn)場空間中的物質(zhì)存在,包含五個子類型:單位 (ORGANISATION) 人員(PERSON)、物資(MATERIEL)、設(shè)施(FACILITY)和要素 (FEATURE)。把這五個子類型作為領(lǐng)域的基本元素,用來表示領(lǐng)域中的對象是合 理的。另外,活動(ACTION)實體主要描述戰(zhàn)場空間的行為和事件。因此,我們把 活動作為一個單獨的基本元素,用來表示領(lǐng)域中對象的各種行為和事件。我們再來參考REA( Resource-Event-Agent)模型中的分類。REA模型是由 William E.M cCarthy所建立,是傳統(tǒng)企業(yè)和電子商務(wù)系統(tǒng)中

15、的主要建模框架。 在REA模型中,市場交換的主要元素就是資源(Resource),事件(Event)和主體 (Agent),這里的資源和主體相當(dāng)于C2IEDM中的OBJECT,事件相當(dāng)于ACTION???以看出,兩種不同模型的分類方法都可以統(tǒng)一為ACTION和OBJECT.綜上所述,在大多數(shù)的領(lǐng)域本體中,特別是在為信息系統(tǒng)而建立的本體模型 中,所有的概念都可以分為對象概念和活動概念,其中對象概念包括五個子概念: 單位、人員、物資、設(shè)施和要素,這是一個完備的分類,領(lǐng)域中的所有實體對象 都應(yīng)該歸為這五個子概念中的一類。下面給出這些元素的基本定義:對象:描述領(lǐng)域中實際存在或抽象的實體集合。單位:表示

16、行政或者職責(zé)結(jié)構(gòu),用以完成一個目標,目的或任務(wù)。人員:在領(lǐng)域中具有特定身份的個人。物資:表示與行政或行為目的一致的裝備、器械或補給。設(shè)施:為特定目的服務(wù)而創(chuàng)建的一種對象類型,是通過它提供的服務(wù)而不 是通過它的內(nèi)容來識別的。要素:表示具有現(xiàn)實意義的控制要素。控制要素是指與活動或行為相關(guān)的, 用于表達那些描述規(guī)劃或協(xié)調(diào)行為的抽象對象,包括行政、政策和策略上的約束?;顒?ACTION):描述計劃或己經(jīng)執(zhí)行的行動,也可以描述有現(xiàn)實意義的突發(fā) 事件。通過這樣的分類,我們對領(lǐng)域中的概念都有了一個整體的清晰的認識,同時, 這個分類也可以指導(dǎo)領(lǐng)域概念的識別過程。當(dāng)需要建立新的本體模型,我們可以 直接利用和擴展

17、這些元素來設(shè)計我們的模型。5建模步驟我們這里提出的建模方法是一個不斷反復(fù),循環(huán)迭代的漸進過程。人對領(lǐng)域 的認識是一個過程,我們對領(lǐng)域的建模要反映我們對領(lǐng)域的認識,要反映領(lǐng)域的 現(xiàn)實。我們可能先定義了一個粗略的本體模型,隨著我們對領(lǐng)域認識的深入不斷 去評價和修改這個本體,通過解決在應(yīng)用中發(fā)現(xiàn)的問題,或者和該領(lǐng)域的專家討 論發(fā)現(xiàn)原先模型中存在的問題,不斷的去完善和增強這個本體模型。通常,這個方法包括以下幾個階段:5.1識別領(lǐng)域的相關(guān)概念根據(jù)以上的定義,識別領(lǐng)域概念就是要確定那些用來描述領(lǐng)域中實體,現(xiàn)象 和事件的術(shù)語。這里,我們關(guān)注的主要是表示概念的術(shù)語,而不是描述這些概念 的術(shù)語,后者是作為屬性來

18、表示的。識別概念的方法有:頭腦風(fēng)暴法:就是建模人員根據(jù)自己所掌握的領(lǐng)域知識,直接寫出相關(guān) 潛在的領(lǐng)域概念。這個方法的優(yōu)點是能直接得到一系列的領(lǐng)域概念,效率較高, 但這些概念可能是不準確,不充分的,需要與該領(lǐng)域的專家進行適當(dāng)?shù)膮f(xié)調(diào)。業(yè)務(wù)過程抽取法:建模人員通過分析每一個業(yè)務(wù)過程把與信息本體相關(guān) 的概念識別出來。這個方法的優(yōu)點是能得到比較完整的領(lǐng)域概念集,缺點是效率 較低,工作量大。以上兩種方法可以互為補充,交叉使用,在提高識別過程的效率的同時,提 高概念識別的準確性。前面已經(jīng)定義了可以表示領(lǐng)域中的所有概念的基本元素,在識別概念的過程 中,需要按這些基本元素對這些識別出來的概念進行初步的分類。在這

19、些基本類 型中,除了活動之外,其他的都是描述領(lǐng)域中的物質(zhì)存在,它們都是顯而易見的, 因此很容易識別,例如職工,配偶,經(jīng)手人等都是關(guān)于人員的概念,部門,科室 等都是關(guān)于單位的概念,車輛,電腦等是物資的概念,各種政策法規(guī)和指導(dǎo)文件 等是要素的概念,住房,倉庫等是設(shè)施的概念?;顒觿t是描述領(lǐng)域中的現(xiàn)象,事 件和行為等抽象的概念,一般來說,用帶有動詞意義的名詞表示的概念都是活動 的概念,例如,生產(chǎn),規(guī)劃,采購,維修,審計等。在這個過程中,一般需要對識別出來的概念給出一個明確的定義,這種定義 可以用自然語言來表示,也可以用形式化語言表示。這個定義主要陳述這個概念 的內(nèi)涵。5.2確定描述概念的屬性概念就是屬

20、性的集合,所以對于以上識別出來的領(lǐng)域概念,我們要說明用以 描述它們的屬性。確定概念的屬性必須遵循需求主導(dǎo)的原則,只描述與需求相關(guān) 的特性和結(jié)構(gòu),并不需要描述概念的所有特性。例如,每個人都有“膚色”這個 特征,但在我們的論域中并不關(guān)心這個特征,所以,人員的屬性中就不需要描述 “膚色”的特征。確概念屬性的方法有下面三種方式:從業(yè)務(wù)模型中提取:業(yè)務(wù)模型中的信息流包含了活動所需要的和產(chǎn)生的 信息,通常可以作為描述活動的屬性。從現(xiàn)有數(shù)據(jù)庫或信息系統(tǒng)中提取:正在使用的數(shù)據(jù)庫和信息系統(tǒng)都是問 題領(lǐng)域特定方面的模型,其中包含當(dāng)前系統(tǒng)所關(guān)心的對象和數(shù)據(jù)。向業(yè)務(wù)人員咨詢:概念的屬性是刻畫問題領(lǐng)域中我們所關(guān)心業(yè)務(wù)所

21、需要 的概念的特性,業(yè)務(wù)人員很清楚這方面的需求。確定概念的屬性和識別領(lǐng)域概念的過程是相互交叉的,通常都是在識別概念 的同時,確定這個概念的屬性以及它與其他概念的關(guān)系。確定了屬性之后,還需 要對屬性進行定義和描述,主要包括幾個方面的內(nèi)容:名稱、定義、數(shù)據(jù)類型、 取值范圍、基數(shù)、該屬性具有的性質(zhì)(自反性、傳遞性、函數(shù)性)。屬性的定義跟 概念的定義一樣,要用精確的無二義性的文本對屬性的內(nèi)涵進行說明。5.3確定概念的層次以上步驟得到的概念集合基本上是平面結(jié)構(gòu)的,沒有條理性,確定概念的層 次就是要將它們條理化。分類法是目前使用最多的對領(lǐng)域中信息條理化的方法, 分類體系的建立易于人們對領(lǐng)域迅速建立起整體視

22、圖,方便人們進行分析,因此 確定概念的層次也可參考分類法進行。確定概念層次可以采用下面三種方式,.自頂向下式開發(fā)過程。從定義最一般的概念開始,然后定義特殊的概念。 我們最先定義的基本元素就是這個自頂向下過程的體現(xiàn)。自底向上式開發(fā)過程。以定義最特殊的概念入手,從概念層次的葉節(jié)點 開始,然后把它歸類到一般的概念。結(jié)合式開發(fā)過程。該方法是自頂向下式和自底向上式的結(jié)合:先定義易 見的概念,然后適當(dāng)?shù)臍w納和專門研究。這三種方法里沒有那種一定比另外兩種好。采用那種方法取決于信息模型建 造人員對領(lǐng)域中知識的了解情況和觀點。例如,對于農(nóng)業(yè)生產(chǎn)中的“土地資源”,我們很容易知道它可以分為“耕 地”、“菜地”、“林

23、地”和“水面”等,而“耕地”又分為“旱地”和“水田”。 這樣就很容易白頂向下確定“土地資源”這個概念下的各級子概念。對于“農(nóng)業(yè) 生產(chǎn)政策”、“農(nóng)業(yè)生產(chǎn)制度”等,我們則可以根據(jù)它們具有的共同屬性,得出 它們的共同父級概念一“農(nóng)業(yè)生產(chǎn)政策標準”,并將它們的共同屬性作為“農(nóng) 業(yè)生產(chǎn)政策標準”的屬性。這就是采用自底向上的方式來確定類的層次。為了形成 概念體系,這個步驟可能會引進一些虛類,如上面提到的“農(nóng)業(yè)生產(chǎn)政策標準”。但一般情況下,盡量使用業(yè)務(wù)人員使用的概念或術(shù)語。5.4定義實例定義概念的一個實例需要:選擇要實例化的概念創(chuàng)建這個概念的一個實例給屬性賦值5.5本體模型的代碼化代碼化信息模型就是利用某種形式化語言顯式地表現(xiàn)上個階段的概念化成 果。主要內(nèi)容有:(1)選擇一種表現(xiàn)語言(能夠支持元本體)(2 )選擇一種模型編

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負責(zé)。
  • 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔(dān)用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

評論

0/150

提交評論