基于模式的CWM元數(shù)據(jù)交換方法的研究_第1頁(yè)
基于模式的CWM元數(shù)據(jù)交換方法的研究_第2頁(yè)
基于模式的CWM元數(shù)據(jù)交換方法的研究_第3頁(yè)
基于模式的CWM元數(shù)據(jù)交換方法的研究_第4頁(yè)
全文預(yù)覽已結(jié)束

下載本文檔

版權(quán)說(shuō)明:本文檔由用戶(hù)提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請(qǐng)進(jìn)行舉報(bào)或認(rèn)領(lǐng)

文檔簡(jiǎn)介

1、基于模式的CWM元數(shù)據(jù)交換方法的研究謝益武, 何宇峰, 曹志英 時(shí)間:2008年07月21日 字 體: 大 中 小關(guān)鍵詞:? 摘要:關(guān)鍵詞: 元數(shù)據(jù) 公共倉(cāng)儲(chǔ)元模型(CWM)? 元數(shù)據(jù)交換模式(MIP)? 模式?1-3。? 公共倉(cāng)儲(chǔ)元模型CWM提供了基于模型的元數(shù)據(jù)集成體系結(jié)構(gòu)所需的用于描述問(wèn)題域的語(yǔ)義完整的公共元模型。這些體系結(jié)構(gòu)是數(shù)據(jù)倉(cāng)庫(kù)和業(yè)務(wù)分析所需要的,只要構(gòu)建ISC用到的各種軟件產(chǎn)品、工具和數(shù)據(jù)庫(kù)產(chǎn)品就能與CWM元模型達(dá)成一致,它們就能理解CWM元模型的實(shí)例,因而可以很容易在組成ISC的軟件組件之間交換元數(shù)據(jù)。然而,依靠CWM語(yǔ)法本身并不能真正地確??苫ゲ僮鞯脑獢?shù)據(jù)的完整性,還需要提

2、供兩種手段來(lái)彌補(bǔ)CWM的不足,一是為模型解釋說(shuō)明一個(gè)語(yǔ)義環(huán)境的方法,另一個(gè)是管理CWM實(shí)例大小的方法。這正是元數(shù)據(jù)交換模式所要解決的問(wèn)題。1 基本概念介紹1.1 元數(shù)據(jù)? 元數(shù)據(jù)是指來(lái)自企業(yè)內(nèi)外的所有物理數(shù)據(jù)(軟件和其他介質(zhì)中含有的)和知識(shí)(員工和各種媒介中含有的),包括物理數(shù)據(jù)的格式、技術(shù)和業(yè)務(wù)過(guò)程、數(shù)據(jù)的規(guī)則和約束以及企業(yè)所使用數(shù)據(jù)的結(jié)構(gòu)1。數(shù)據(jù)倉(cāng)庫(kù)元數(shù)據(jù)分為技術(shù)元數(shù)據(jù)(Technical Metadata)和業(yè)務(wù)元數(shù)據(jù)(Business Metadata)兩種。技術(shù)元數(shù)據(jù)是為企業(yè)技術(shù)用戶(hù)和IT員工提供支持的元數(shù)據(jù),當(dāng)開(kāi)發(fā)人員和技術(shù)用戶(hù)對(duì)決策支持系統(tǒng)和操作型系統(tǒng)進(jìn)行維護(hù)和擴(kuò)展時(shí),技術(shù)元數(shù)據(jù)

3、為他們提供所需要的信息。業(yè)務(wù)元數(shù)據(jù)是為企業(yè)業(yè)務(wù)用戶(hù)提供支持的元數(shù)據(jù),它為決策支持分析人員提供了訪(fǎng)問(wèn)決策支持系統(tǒng)底層的數(shù)據(jù)倉(cāng)庫(kù)和數(shù)據(jù)集市中信息的線(xiàn)路圖。1.2 公共倉(cāng)儲(chǔ)元模型(CWM)? CWM是一個(gè)完整地描述數(shù)據(jù)倉(cāng)庫(kù)和業(yè)務(wù)分析領(lǐng)域的元模型,是OMG組織采納的一個(gè)使用共享元數(shù)據(jù)的開(kāi)放式行業(yè)標(biāo)準(zhǔn)。從技術(shù)的角度看,CWM擴(kuò)展了OMG組織建立的元建模體系結(jié)構(gòu),使其包含數(shù)據(jù)倉(cāng)庫(kù)和業(yè)務(wù)分析的領(lǐng)域。CWM支持用模型驅(qū)動(dòng)的方法進(jìn)行元數(shù)據(jù)交換,其中表示共享數(shù)據(jù)的形式模型是依據(jù)CWM元模型規(guī)范構(gòu)造的。這些模型以XML文檔的形式進(jìn)行存儲(chǔ)和交換2。它基于以下三個(gè)工業(yè)標(biāo)準(zhǔn):統(tǒng)一建模語(yǔ)言UML(Unified Model

4、ing Language)、元對(duì)象工具M(jìn)OF(Meta Object Facility)和元數(shù)據(jù)交換XMI(XML Metadata Interchange)2-3。? CWM總共包含21個(gè)包,分布在五個(gè)抽象程度不同的功能層中,每個(gè)包負(fù)責(zé)都解決數(shù)據(jù)倉(cāng)庫(kù)和業(yè)務(wù)分析領(lǐng)域的某個(gè)特定建模問(wèn)題。對(duì)象模型層包含定義基本元模型的概念、關(guān)系和約束的包,它是UML的一個(gè)子集;基礎(chǔ)層包含為有駐留在更高層次的其他包提供CWM特定服務(wù)的包;資源層中包含的CWM包主要描述在以CWM為中介的交換中即可作為源又可作為目標(biāo)的數(shù)據(jù)資源的結(jié)構(gòu);分析層的包描述的是作用于資源層中的包所描述的數(shù)據(jù)源和數(shù)據(jù)目標(biāo)上的服務(wù);管理層的包提供的

5、服務(wù)支持?jǐn)?shù)據(jù)倉(cāng)庫(kù)的日常操作和管理。一個(gè)完整的CWM方案是把一個(gè)或多個(gè)CWM包中的建模元素實(shí)例拼裝在一起而形成的。2 元數(shù)據(jù)交換模式 2.1 問(wèn)題的提出 ? 由于CWM的設(shè)計(jì)者不可能進(jìn)一步參與所有的CWM使用者所解決的整合問(wèn)題中,所以CWM被設(shè)計(jì)得相當(dāng)靈活、易于表達(dá),并且完全獨(dú)立于平臺(tái)和環(huán)境因素。然而,它不能提前預(yù)知其將會(huì)如何被使用,這和MOF、UML無(wú)法預(yù)知其是如何被用來(lái)為面向?qū)ο蟮能浖到y(tǒng)建模是一樣的。因此,這些形式化的建模語(yǔ)言都必須具有高度的靈活性和表達(dá)能力,這同時(shí)也就意味著用戶(hù)可以不考慮具體的用途而任意地進(jìn)行建模。但是,對(duì)于使用者來(lái)說(shuō),真正做到天衣無(wú)縫的、高互操作性的模式交換CWM模型是

6、一件非常困難的事情。具體表現(xiàn)在以下兩個(gè)方面:? (1)雖然CWM定義了形式化的語(yǔ)法來(lái)定義元數(shù)據(jù),但是對(duì)于CWM模型的內(nèi)容和結(jié)構(gòu)來(lái)說(shuō),什么是有用的直接取決于CWM元數(shù)據(jù)的產(chǎn)生者和使用者合理的期望。這種期望的集合被非形式化地定義為元數(shù)據(jù)交換的環(huán)境,但是對(duì)于描述一個(gè)理解和解釋給定CWM模型所需要的特定環(huán)境則已經(jīng)超出了CWM本身的范疇。? (2)任何CWM模型都潛在地包含了無(wú)數(shù)合法的模型元素的組合,在沒(méi)有正式的標(biāo)準(zhǔn)限定一個(gè)特定的CWM模型的物理擴(kuò)展時(shí),使用模型的進(jìn)程或者必須準(zhǔn)備接受大小不確定而又復(fù)雜的各種模型,或者必須判斷進(jìn)程中需要處理模型的哪些部分而忽略哪些部分。這就大大降低了元數(shù)據(jù)交換過(guò)程的可靠性

7、。? 基于模式的元數(shù)據(jù)交換方法的基本概念就是描述在元數(shù)據(jù)交換過(guò)程中,所有參與者所認(rèn)同的公共交換環(huán)境和對(duì)模型的物理外延的大小進(jìn)行限定或設(shè)置界限并在過(guò)程中確立。2.2 CWM MIP定義? CWM元數(shù)據(jù)交換模式(CWM MIP)元模型是在CWM標(biāo)準(zhǔn)的基礎(chǔ)上的擴(kuò)展,并沒(méi)有修改CWM元模型本身。這就允許CWM MIP用戶(hù)能夠使用任何符合CWM規(guī)范的數(shù)據(jù)倉(cāng)庫(kù)模型,并且可以增加一個(gè)描述怎樣構(gòu)建元數(shù)據(jù)交換單元的語(yǔ)義環(huán)境。? 定義:CWM元數(shù)據(jù)交換模式是CWM元模型的一個(gè)確定的子集(Subset),是在元模型子集的實(shí)例中加上相應(yīng)的約束4。? 其中,子集(Subset)包含了一個(gè)或多個(gè)CWM元模型,并且限定了元

8、模型的解空間。約束(如果有)則是建立在解空間的邊界上,注意:這些約束是模式本身的組成部分,不能跟CWM元模型固有的約束相混淆。這樣定義的主要優(yōu)點(diǎn)在于:它能夠通過(guò)使軟件工具商把注意力放在那些對(duì)給定工具所期望導(dǎo)入元數(shù)據(jù)有意義的元數(shù)據(jù)模型上,從而能夠極大地增強(qiáng)它們之間的可交換性和可互操作性。2.3 元數(shù)據(jù)交換模式的標(biāo)準(zhǔn)模板? 為了解決以上提出的所有問(wèn)題,給出的每一元數(shù)據(jù)交換模式必須定義一個(gè)公共的交換環(huán)境,從而使得參與交換的所有工具能夠清晰地理解所交換的元數(shù)據(jù)的含義;模式還必須在任何需要的地方約束特定模型元素的數(shù)量以減少模型中可能存在的元素的數(shù)量,以及避免因?yàn)槟愁?lèi)模型元素的多重性而造成的解釋不清晰的問(wèn)

9、題。因此為了保證模式的使用者可以很容易地理解這個(gè)模式,發(fā)布的模式說(shuō)明也應(yīng)該符合相同的語(yǔ)言和規(guī)格標(biāo)準(zhǔn)。根據(jù)參考文獻(xiàn)2、4可知,元數(shù)據(jù)交換模式的標(biāo)準(zhǔn)模板中的元素一般包括:? (1)模式名稱(chēng):該名稱(chēng)能夠或多或少地說(shuō)明這個(gè)模式的意圖。? (2)模式版本:即該模式的一個(gè)版本號(hào),這樣才可以支持這個(gè)模式的進(jìn)一步開(kāi)發(fā)。? (3)統(tǒng)一資源定位符URL:唯一的識(shí)別并為一個(gè)特定的元數(shù)據(jù)交換模式的說(shuō)明提供了地址。? (4)開(kāi)發(fā)者:定義、發(fā)布這個(gè)模式到模式目錄或模式團(tuán)體的人或組織的名稱(chēng)。? (5)結(jié)構(gòu)分類(lèi):主要包括宏模式、領(lǐng)域模式、微模式。? (6)使用分類(lèi):主要包括交換、映射、類(lèi)型劃分、擴(kuò)展、解釋、生成、結(jié)構(gòu)或構(gòu)造。

10、? (7)意圖:模式的整個(gè)意圖的一句話(huà)描述。? (8)別名:模式的同義詞列表。? (9)動(dòng)機(jī):模式所解決的元數(shù)據(jù)交換問(wèn)題的詳細(xì)說(shuō)明。? (10)實(shí)用性:對(duì)一個(gè)模式被典型地應(yīng)用的現(xiàn)實(shí)場(chǎng)景的描述。? (11)方案:用于為元數(shù)據(jù)交換建立一個(gè)公共環(huán)境M2層的方案的描述。? (12)約束:M2層的約束的描述用于約束或者限定方案實(shí)例的范圍,通常用自然語(yǔ)言或形式化語(yǔ)言來(lái)描述這些約束,例如對(duì)象約束語(yǔ)言(OCL)。? (13)用法:描述了模式實(shí)例的通常的用法,包括給對(duì)象屬性賦值和子類(lèi)替換。? (14)參數(shù):描述了一組用于實(shí)現(xiàn)模式的實(shí)例的參數(shù),參數(shù)最好用一張表來(lái)描述。? (15)注釋?zhuān)喝魏文軌蛴兄诿枋鋈绾问褂眠@

11、些模式的、非形式化的附加說(shuō)明。? (16)結(jié)果:在模式應(yīng)用中所產(chǎn)生的各種有利或不利結(jié)果的描述。? (17)已知的用例:對(duì)任何實(shí)際使用了這個(gè)模式的軟件系統(tǒng)的一個(gè)引用。? (18)相關(guān)的模式:與此模式相關(guān)的、與之合作的或是由其組成的任何其他的元數(shù)據(jù)交換模式列表。? (19)解決方案案例:一個(gè)如何使用這個(gè)模式來(lái)解決其相關(guān)的元數(shù)據(jù)交換模式的詳細(xì)例子。3 構(gòu)造模式StarSchema及實(shí)現(xiàn) ? 前面詳細(xì)介紹了元數(shù)據(jù)交換模式的基本原理和表達(dá)方式。根據(jù)參考文獻(xiàn)2所述的開(kāi)發(fā)交換模式的步驟,可逐步構(gòu)造一個(gè)具體的模式:StarSchema。? (1)要識(shí)別需要解決的交換問(wèn)題并提出解決問(wèn)題的模式。星型模型是廣泛應(yīng)用

12、于數(shù)據(jù)倉(cāng)庫(kù)和商業(yè)智能系統(tǒng)中將數(shù)據(jù)組織成維表模式的一種方式。它是由“事實(shí)表”(大表)以及多個(gè)“維表”(小表)所組成。因此,需要一個(gè)標(biāo)準(zhǔn)的模式來(lái)描述所有可能的星型模式數(shù)據(jù)庫(kù)的通用格式。? (2)確定幾個(gè)所提出的模式可以應(yīng)用的場(chǎng)景和與其他相關(guān)聯(lián)的模式。大多數(shù)數(shù)據(jù)倉(cāng)庫(kù)都采用星型模型。所有星型模型的數(shù)據(jù)結(jié)構(gòu),都可以看成是該模式的一個(gè)實(shí)例,它是“維表事實(shí)表”結(jié)構(gòu)數(shù)據(jù)交換的基礎(chǔ)。StarSchema有時(shí)也用其他一些模式名稱(chēng)替代,包括Relational Star Schema、Star join等。與StarSchema相關(guān)聯(lián)的典型模式是Surrogate Key pattern。一個(gè)StarSchema模式的實(shí)現(xiàn)可能包括了Surrogate Key模式的實(shí)現(xiàn)5? (5)定義方案中實(shí)例的所有約束。StarSchema模式需要對(duì)其方案中的實(shí)例施加兩個(gè)約束:一是至少有一個(gè)關(guān)系表(作為連接表)中的關(guān)鍵字是由其他兩個(gè)或更多關(guān)系表(維表)的關(guān)鍵字組成。每個(gè)關(guān)聯(lián)都是由連接表所屬的類(lèi)ForeignKey的實(shí)例來(lái)說(shuō)明;二是每個(gè)連接表都要明確地標(biāo)記出來(lái),由每個(gè)連接表相應(yīng)的TaggedValue類(lèi)實(shí)現(xiàn),即將TaggedValue.tag設(shè)為“isJoinTable”并且將TaggedValue.value的值設(shè)為“True”。? (6)設(shè)置模式實(shí)現(xiàn)的參數(shù)。在星型模式實(shí)現(xiàn)的過(guò)程中,任何一

溫馨提示

  • 1. 本站所有資源如無(wú)特殊說(shuō)明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請(qǐng)下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請(qǐng)聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶(hù)所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁(yè)內(nèi)容里面會(huì)有圖紙預(yù)覽,若沒(méi)有圖紙預(yù)覽就沒(méi)有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫(kù)網(wǎng)僅提供信息存儲(chǔ)空間,僅對(duì)用戶(hù)上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對(duì)用戶(hù)上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對(duì)任何下載內(nèi)容負(fù)責(zé)。
  • 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請(qǐng)與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶(hù)因使用這些下載資源對(duì)自己和他人造成任何形式的傷害或損失。

評(píng)論

0/150

提交評(píng)論