![大數(shù)據(jù)治理系列,第一部分 大數(shù)據(jù)治理統(tǒng)一流程模型概述和明確元數(shù)據(jù)管理策略_第1頁](http://file2.renrendoc.com/fileroot_temp3/2021-8/16/73e4bbc6-5619-4e6b-a224-ff3818320ae6/73e4bbc6-5619-4e6b-a224-ff3818320ae61.gif)
![大數(shù)據(jù)治理系列,第一部分 大數(shù)據(jù)治理統(tǒng)一流程模型概述和明確元數(shù)據(jù)管理策略_第2頁](http://file2.renrendoc.com/fileroot_temp3/2021-8/16/73e4bbc6-5619-4e6b-a224-ff3818320ae6/73e4bbc6-5619-4e6b-a224-ff3818320ae62.gif)
![大數(shù)據(jù)治理系列,第一部分 大數(shù)據(jù)治理統(tǒng)一流程模型概述和明確元數(shù)據(jù)管理策略_第3頁](http://file2.renrendoc.com/fileroot_temp3/2021-8/16/73e4bbc6-5619-4e6b-a224-ff3818320ae6/73e4bbc6-5619-4e6b-a224-ff3818320ae63.gif)
![大數(shù)據(jù)治理系列,第一部分 大數(shù)據(jù)治理統(tǒng)一流程模型概述和明確元數(shù)據(jù)管理策略_第4頁](http://file2.renrendoc.com/fileroot_temp3/2021-8/16/73e4bbc6-5619-4e6b-a224-ff3818320ae6/73e4bbc6-5619-4e6b-a224-ff3818320ae64.gif)
![大數(shù)據(jù)治理系列,第一部分 大數(shù)據(jù)治理統(tǒng)一流程模型概述和明確元數(shù)據(jù)管理策略_第5頁](http://file2.renrendoc.com/fileroot_temp3/2021-8/16/73e4bbc6-5619-4e6b-a224-ff3818320ae6/73e4bbc6-5619-4e6b-a224-ff3818320ae65.gif)
版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進行舉報或認領(lǐng)
文檔簡介
1、-作者xxxx-日期xxxx大數(shù)據(jù)治理系列,第一部分 大數(shù)據(jù)治理統(tǒng)一流程模型概述和明確元數(shù)據(jù)管理策略【精品文檔】大數(shù)據(jù)治理系列,第一部分: 大數(shù)據(jù)治理統(tǒng)一流程模型概述和明確元數(shù)據(jù)管理策略大數(shù)據(jù)治理的核心是為業(yè)務(wù)提供持續(xù)的、可度量的價值在各行各業(yè)中,隨處可見因數(shù)量、速度、種類和準確性結(jié)合帶來的大數(shù)據(jù)問題,為了更好地利用大數(shù)據(jù),大數(shù)據(jù)治理逐漸提上日程。大數(shù)據(jù)治理的核心是為業(yè)務(wù)提供持續(xù)的、可度量的價值。本文主要介紹大數(shù)據(jù)治理的基本概念和大數(shù)據(jù)治理統(tǒng)一流程參考模型的前兩步:“明確元數(shù)據(jù)管理策略”和“元數(shù)據(jù)集成體系結(jié)構(gòu)”。大數(shù)據(jù)治理概述(狹義)大數(shù)據(jù)是指無法使用傳統(tǒng)流程或工具在合理的時間和成本內(nèi)處理或分
2、析的信息,這些信息將用來幫助企業(yè)更智慧地經(jīng)營和決策。而廣義的大數(shù)據(jù)更是指企業(yè)需要處理的海量數(shù)據(jù),包括傳統(tǒng)數(shù)據(jù)以及狹義的大數(shù)據(jù)。(廣義)大數(shù)據(jù)可以分為五個類型:Web 和社交媒體數(shù)據(jù)、機器對機器(M2M)數(shù)據(jù)、海量交易數(shù)據(jù)、生物計量學數(shù)據(jù)和人工生成的數(shù)據(jù)。 Web 和社交媒體數(shù)據(jù):比如各種微博、博客、社交網(wǎng)站、購物網(wǎng)站中的數(shù)據(jù)和內(nèi)容。 M2M 數(shù)據(jù):也就是機器對機器的數(shù)據(jù),比如 RFID 數(shù)據(jù)、GPS 數(shù)據(jù)、智能儀表、監(jiān)控記錄數(shù)據(jù)以及其他各種傳感器、監(jiān)控器的數(shù)據(jù)。 海量交易數(shù)據(jù):是各種海量的交易記錄以及交易相關(guān)的半結(jié)構(gòu)化和非結(jié)構(gòu)化數(shù)據(jù),比如電信行業(yè)的 CDR、3G 上網(wǎng)記錄等,金融行業(yè)的網(wǎng)上交易
3、記錄、core banking 記錄、理財記錄等,保險行業(yè)的各種理賠等。 生物計量學數(shù)據(jù):是指和人體識別相關(guān)的生物識別信息,如指紋、DNA、虹膜、視網(wǎng)膜、人臉、聲音模式、筆跡等。 人工生成的數(shù)據(jù):比如各種調(diào)查問卷、電子郵件、紙質(zhì)文件、掃描件、錄音和電子病歷等。在各行各業(yè)中,隨處可見因數(shù)量、速度、種類和準確性結(jié)合帶來的大數(shù)據(jù)問題,為了更好地利用大數(shù)據(jù),大數(shù)據(jù)治理逐漸提上日程。在傳統(tǒng)系統(tǒng)中,數(shù)據(jù)需要先存儲到關(guān)系型數(shù)據(jù)庫/數(shù)據(jù)倉庫后再進行各種查詢和分析,這些數(shù)據(jù)我們稱之為靜態(tài)數(shù)據(jù)。而在大數(shù)據(jù)時代,除了靜態(tài)數(shù)據(jù)以外,還有很多數(shù)據(jù)對實時性要求非常高,需要在采集數(shù)據(jù)時就進行相應(yīng)的處理,處理結(jié)果存入到關(guān)系型
4、數(shù)據(jù)庫/數(shù)據(jù)倉庫、MPP 數(shù)據(jù)庫、Hadoop 平臺、各種 NoSQL 數(shù)據(jù)庫等,這些數(shù)據(jù)我們稱之為動態(tài)數(shù)據(jù)。比如高鐵機車的關(guān)鍵零部件上裝有成百上千的傳感器,每時每刻都在生成設(shè)備狀態(tài)信息,企業(yè)需要實時收集這些數(shù)據(jù)并進行分析,當發(fā)現(xiàn)設(shè)備可能出現(xiàn)問題時及時告警。再比如在電信行業(yè),基于用戶通信行為的精準營銷、位置營銷等,都會實時的采集用戶數(shù)據(jù)并根據(jù)業(yè)務(wù)模型進行相應(yīng)的營銷活動。大數(shù)據(jù)治理的核心是為業(yè)務(wù)提供持續(xù)的、可度量的價值。大數(shù)據(jù)治理人員需要定期與企業(yè)高層管理人員進行溝通,保證大數(shù)據(jù)治理計劃可以持續(xù)獲得支持和幫助。相信隨著時間的推移,大數(shù)據(jù)將成為主流,企業(yè)可以從海量的數(shù)據(jù)中獲得更多的價值,而大數(shù)據(jù)治
5、理的范圍和嚴格程度也將逐步上升。為了更好地幫助企業(yè)進行大數(shù)據(jù)治理,筆者在 IBM 數(shù)據(jù)治理統(tǒng)一流程模型基礎(chǔ)上結(jié)合在電信、金融、政府等行業(yè)進行大數(shù)據(jù)治理的經(jīng)驗,整理了大數(shù)據(jù)治理統(tǒng)一流程參考模型,整個參考模型分為必選步驟和可選步驟兩部分?;仨撌状髷?shù)據(jù)治理統(tǒng)一流程參考模型如圖 1 所示,大數(shù)據(jù)治理統(tǒng)一流程參考模型必要步驟分為兩個方向:一條子線是在制定元數(shù)據(jù)管理策略和確立體系結(jié)構(gòu)的基礎(chǔ)上實施全面的元數(shù)據(jù)管理,另一條子線是在定義業(yè)務(wù)問題、執(zhí)行成熟度評估的基礎(chǔ)上定義數(shù)據(jù)治理路線圖以及定義數(shù)值治理相關(guān)的度量值。在 11 個必要步驟的基礎(chǔ)上,企業(yè)可以在 7 個可選步驟中選擇一個或多個途徑進行特定領(lǐng)域的數(shù)據(jù)治理
6、,可選步驟為:主數(shù)據(jù)監(jiān)管、(狹義)大數(shù)據(jù)監(jiān)管、信息單一視圖監(jiān)管、運營分析監(jiān)管、預(yù)測分析監(jiān)管、管理安全與隱私以及監(jiān)管信息生命周期。企業(yè)需要定期對大數(shù)據(jù)治理統(tǒng)一流程進行度量并將結(jié)果發(fā)送給主管級發(fā)起人。圖 1. 大數(shù)據(jù)治理統(tǒng)一流程參考模型回頁首第一步:明確元數(shù)據(jù)管理策略在最開始的時候,元數(shù)據(jù)(Meta Data)是指描述數(shù)據(jù)的數(shù)據(jù),通常由信息結(jié)構(gòu)的描述組成,隨著技術(shù)的發(fā)展元數(shù)據(jù)內(nèi)涵有了非常大的擴展,比如 UML 模型、數(shù)據(jù)交易規(guī)則、用 Java,.NET,C+等編寫的 APIs、業(yè)務(wù)流程和工作流模型、產(chǎn)品配置描述和調(diào)優(yōu)參數(shù)以及各種業(yè)務(wù)規(guī)則、術(shù)語和定義等 1。在大數(shù)據(jù)時代,元數(shù)據(jù)還應(yīng)該包括對各種新數(shù)據(jù)
7、類型的描述,如對位置、名字、用戶點擊次數(shù)、音頻、視頻、圖片、各種無線感知設(shè)備數(shù)據(jù)和各種監(jiān)控設(shè)備數(shù)據(jù)等的描述等。元數(shù)據(jù)通常分為業(yè)務(wù)元數(shù)據(jù)、技術(shù)元數(shù)據(jù)和操作元數(shù)據(jù)等。業(yè)務(wù)元數(shù)據(jù)主要包括業(yè)務(wù)規(guī)則、定義、術(shù)語、術(shù)語表、運算法則和系統(tǒng)使用業(yè)務(wù)語言等,主要使用者是業(yè)務(wù)用戶。技術(shù)元數(shù)據(jù)主要用來定義信息供應(yīng)鏈(Information Supply Chain,ISC)各類組成部分元數(shù)據(jù)結(jié)構(gòu),具體包括各個系統(tǒng)表和字段結(jié)構(gòu)、屬性、出處、依賴性等,以及存儲過程、函數(shù)、序列等各種對象。操作元數(shù)據(jù)是指應(yīng)用程序運行信息,比如其頻率、記錄數(shù)以及各個組件的分析和其它統(tǒng)計信息等。從整個企業(yè)層面來說,各種工具軟件和應(yīng)用程序越來越
8、復雜,相互依存度逐年增加,相應(yīng)的追蹤整個信息供應(yīng)鏈各組件之間數(shù)據(jù)流動、了解數(shù)據(jù)元素含義和上下文的需求越來越強烈。在從應(yīng)用議程往信息議程的轉(zhuǎn)變過程中,元數(shù)據(jù)管理也逐漸從局部存儲和管理轉(zhuǎn)向共享。從總量上來看,整個企業(yè)的元數(shù)據(jù)越來越多,光現(xiàn)有的數(shù)據(jù)模型中就包含了成千上萬的表,同時還有更多的模型等著上線,同時隨著大數(shù)據(jù)時代的來臨,企業(yè)需要處理的數(shù)據(jù)類型越來越多。為了企業(yè)更高效地運轉(zhuǎn),企業(yè)需要明確元數(shù)據(jù)管理策略和元數(shù)據(jù)集成體系結(jié)構(gòu),依托成熟的方法論和工具實現(xiàn)元數(shù)據(jù)管理,并有步驟的提升其元數(shù)據(jù)管理成熟度。為了實現(xiàn)大數(shù)據(jù)治理,構(gòu)建智慧的分析洞察,企業(yè)需要實現(xiàn)貫穿整個企業(yè)的元數(shù)據(jù)集成,建立完整且一致的元數(shù)據(jù)管
9、理策略,該策略不僅僅針對某個數(shù)據(jù)倉庫項目、業(yè)務(wù)分析項目、某個大數(shù)據(jù)項目或某個應(yīng)用單獨制定一個管理策略,而是針對整個企業(yè)構(gòu)建完整的管理策略。元數(shù)據(jù)管理策略也不是技術(shù)標準或某個軟件工具可以取代的,無論軟件工具功能多強大都不能完全替代一個完整一致的元數(shù)據(jù)管理策略,反而在定義元數(shù)據(jù)集成體系結(jié)構(gòu)以及選購元數(shù)據(jù)管理工具之前需要定義元數(shù)據(jù)管理策略。元數(shù)據(jù)管理策略需要明確企業(yè)元數(shù)據(jù)管理的愿景、目標、需求、約束和策略等,依據(jù)企業(yè)自身當前以及未來的需要確定要實現(xiàn)的元數(shù)據(jù)管理成熟度以及實現(xiàn)目標成熟度的路線圖,完成基礎(chǔ)本體、領(lǐng)域本體、任務(wù)本體和應(yīng)用本體的構(gòu)建,確定元數(shù)據(jù)管理的安全策略、版本控制、元數(shù)據(jù)訂閱推送等。企業(yè)
10、需要對業(yè)務(wù)術(shù)語、技術(shù)術(shù)語中的敏感數(shù)據(jù)進行標記和分類,制定相應(yīng)的數(shù)據(jù)隱私保護政策,確保企業(yè)在隱私保護方面符合當?shù)仉[私方面的法律法規(guī),如果企業(yè)有跨國數(shù)據(jù)交換、元數(shù)據(jù)交換的需求,也要遵循涉及國家的法律法規(guī)要求。企業(yè)需要保證每個元數(shù)據(jù)元素在信息供應(yīng)鏈中每個組件中語義上保持一致,也就是語義等效(semantic equivalence)。語義等效可以強也可以弱,在一個元數(shù)據(jù)集成方案中,語義等效(平均)越強則整個方案的效率越高。語義等效的強弱程度直接影響元數(shù)據(jù)的共享和重用。本體(人工智能和計算機科學)本體(Ontology)源自哲學本體論,而哲學本體論則是源自哲學中“形而上學”分支。本體有時也被翻譯成本體
11、論,在人工智能和計算機科學領(lǐng)域本體最早源于上世紀 70 年代中期,隨著人工智能的發(fā)展人們發(fā)現(xiàn)知識的獲取是構(gòu)建強大人工智能系統(tǒng)的關(guān)鍵,于是開始將新的本體創(chuàng)建為計算機模型從而實現(xiàn)特定類型的自動化推理。之后到了上世紀 80 年代,人工智能領(lǐng)域開始使用本體表示模型化時間的一種理論以及知識系統(tǒng)的一種組件,認為本體(人工智能)是一種應(yīng)用哲學。最早的本體(人工智能和計算機科學)定義是 Neches 等人在 1991 給出的:“一個本體定義了組成主題領(lǐng)域的詞匯的基本術(shù)語和關(guān)系,以及用于組合術(shù)語和關(guān)系以及定義詞匯外延的規(guī)則”。而第一次被業(yè)界廣泛接受的本體定義出自 Tom Gruber,其在 1993 年提出:“
12、本體是概念化的顯式的表示(規(guī)格說明)”。Borst 在 1997 年對 Tom Gruber 的本體定義做了進一步的擴展,認為:“本體是共享的、概念化的一個形式的規(guī)范說明”。在前人的基礎(chǔ)上,Studer 在 1998 年進一步擴展了本體的定義,這也是今天被廣泛接受的一個定義:“本體是共享概念模型的明確形式化規(guī)范說明”。本體提供一個共享詞匯表,可以用來對一個領(lǐng)域建模,具體包括那些存在的對象或概念的類型、以及他們的屬性和關(guān)系 2。一個簡單的本體示例發(fā)票概念及其相互關(guān)系所構(gòu)成的語義網(wǎng)絡(luò)如圖 2 所示:圖 2. 簡單本體(發(fā)票)示例隨著時間的推移和技術(shù)的發(fā)展,本體從最開始的人工智能領(lǐng)域逐漸擴展到圖書館
13、學、情報學、軟件工程、信息架構(gòu)、生物醫(yī)學和信息學等越來越多的學科。與哲學本體論類似,本體(人工智能和計算機科學)依賴某種類別體系來表達實體、概念、事件及其屬性和關(guān)系。本體的核心是知識共享和重用,通過減少特定領(lǐng)域內(nèi)概念或術(shù)語上的分歧,使不同的用戶之間可以順暢的溝通和交流并保持語義等效性,同時讓不同的工具軟件和應(yīng)用系統(tǒng)之間實現(xiàn)互操作。根據(jù)研究層次可以將本體的種類劃分為“頂級本體”(top-level ontology)、應(yīng)用本體(application ontology)、領(lǐng)域本體(domain ontology)和任務(wù)本體(task ontology),各個種類之間的層次關(guān)系如圖 3 所示。圖
14、3. 本體層次關(guān)系 頂級本體,也被稱為上層本體(upper ontolog)或基礎(chǔ)本體(foundation ontology),是指獨立于具體的問題或領(lǐng)域,在所有領(lǐng)域都適用的共同對象或概念所構(gòu)成的模型,主要用來描述高級別且通用的概念以及概念之間的關(guān)系。 領(lǐng)域本體是指對某個特定的領(lǐng)域建模,顯式的實現(xiàn)對領(lǐng)域的定義,確定該領(lǐng)域內(nèi)共同認可的詞匯、詞匯業(yè)務(wù)含義和對應(yīng)的信息資產(chǎn)等,提供對該領(lǐng)域知識的共同理解。領(lǐng)域本體所表達的是適合自己領(lǐng)域的術(shù)語的特定含義,缺乏兼容性,因而在其他領(lǐng)域往往不適用。在同一領(lǐng)域內(nèi),由于文化背景、語言差異、受教育程度或意識形態(tài)的差異,也可能會出現(xiàn)不同的本體。很多時候,隨著依賴領(lǐng)域
15、本體系統(tǒng)的擴展,需要將不同的領(lǐng)域本體合并為更通用的規(guī)范說明,對并非基于同一頂級本體所構(gòu)建的本體進行合并是一項非常具有挑戰(zhàn)的任務(wù),很多時候需要靠手工來完成,相反,對那些基于同一頂級本體構(gòu)建的領(lǐng)域本體可以實現(xiàn)自動化的合并。 任務(wù)本體是針對任務(wù)元素及其之間關(guān)系的規(guī)范說明或詳細說明,用來解釋任務(wù)存在的條件以及可以被用在哪些領(lǐng)域或環(huán)境中。是一個通用術(shù)語的集合用來描述關(guān)于任務(wù)的定義和概念等。 應(yīng)用本體: 描述依賴于特定領(lǐng)域和任務(wù)的概念及概念之間的關(guān)系,是用于特定應(yīng)用或用途的本體,其范疇可以通過可測試的用例來指定。從詳細程度上來分,本體又可以分為參考本體(reference ontologies)和共享本體
16、(share ontologies),參考本體的詳細程度高,而共享本體的詳細程度低。本體(哲學)哲學中的本體(ontology)也被稱為存在論,源自哲學中“形而上學”分支,主要探討存在的本質(zhì),也就是存在的存在。英文 ontology 實際上就是來源于希臘文“”(存在)和“”(學科)的組合。本體是由早期希臘哲學在公元前 6 世紀到公元前 4 世紀提出的“始基”延伸出來的。始基(Principle,又稱本原)最早由泰勒斯(米利都學派)最早提出來,認為萬物由水而生,其學生阿那克西曼德認為萬物由一種簡單的原質(zhì)組成,該原質(zhì)不是水 3。而畢達哥拉斯(學派)認為“萬物都是數(shù)”,數(shù)不僅被看作萬物的本原,而且被
17、看作萬物的原型、世界的本體。后來巴門尼德(愛利亞學派)提出了“存在”的概念,認為存在才是唯一真正存在的真理,其創(chuàng)造了一種形而上學論證方式,之后的哲學一直到近時期為止,都從巴門尼德處接受了其“實體的不可毀滅性”。蘇格拉底繼承了巴門尼德的存在概念,主張“真正的善”并完善了巴門尼德弟子芝諾的辯證法,其學生柏拉圖提出了“理念論”,認為只要若干個個體擁有一個共同的名字,它們就有一個共同的理念或形式。亞里士多德(柏拉圖學生)總結(jié)了先哲們的思想,完成了形而上學,并將本體總結(jié)為:對世界上客觀存在事物的系統(tǒng)的描述,即存在論,也就是最形而上學的知識。形而上學不是指孤立、靜止之類的意思,而是指超越具體形態(tài)的抽象意思
18、,是關(guān)于物質(zhì)世界最普遍的、最一般的、最不具體的規(guī)律的學問?;仨撌椎诙剑涸獢?shù)據(jù)集成體系結(jié)構(gòu)在明確了元數(shù)據(jù)管理策略后需要確定實現(xiàn)該管理策略所需的技術(shù)體系結(jié)構(gòu),即元數(shù)據(jù)集成體系結(jié)構(gòu)。各個企業(yè)的元數(shù)據(jù)管理策略和元數(shù)據(jù)管理成熟度差別較大,因此元數(shù)據(jù)集成體系結(jié)構(gòu)也多種多樣。大體上元數(shù)據(jù)集成體系結(jié)構(gòu)可以分為點對點的元數(shù)據(jù)集成體系結(jié)構(gòu)、中央輻射式元數(shù)據(jù)體系結(jié)構(gòu)、基于 CWM(Common Warehouse MetaModel,公共倉庫元模型)模型驅(qū)動的點對點元數(shù)據(jù)集成體系結(jié)構(gòu)、基于 CWM 模型驅(qū)動的中央存儲庫元數(shù)據(jù)集成體系結(jié)構(gòu)、分布式(聯(lián)邦式)元數(shù)據(jù)集成體系結(jié)構(gòu)和層次/星型元數(shù)據(jù)集成體系結(jié)構(gòu)等。針對信息
19、供應(yīng)鏈中不同的組件,為了實現(xiàn)跨組件的元數(shù)據(jù)交換和集成,最開始人們采用點對點的方式進行,也就是每一對組件之間通過一個獨立的元數(shù)據(jù)橋(metadata bridge)進行元數(shù)據(jù)交換,橋一般是雙向的能夠理解兩個方向的元數(shù)據(jù)映射 4。點對點的元數(shù)據(jù)集成體系結(jié)構(gòu)幫助用戶實現(xiàn)了跨企業(yè)的元數(shù)據(jù)集成和元數(shù)據(jù)交換,對提升信息化水平提供了巨大幫助。這種體系結(jié)構(gòu)在應(yīng)用過程中,也暴露了很多問題,比如元數(shù)據(jù)橋的構(gòu)建工作量和耗時都非常大,對中間件廠商、應(yīng)用廠商、集成商和用戶來說都是一個巨大的挑戰(zhàn),而且構(gòu)建元數(shù)據(jù)橋還必須具有所有者的元數(shù)據(jù)模型和接口的詳細信息。構(gòu)建完成的橋很多時候無法在構(gòu)建其他元數(shù)據(jù)橋時進行重用,因此開發(fā)和
20、維護費用大幅度增加,用戶投資回報率(ROI)不高。以動態(tài)數(shù)據(jù)倉庫為例,其點對點的元數(shù)據(jù)集成體系結(jié)構(gòu)具體如圖 4 所示,信息供應(yīng)鏈各組件之間的空心箭頭表示全部的數(shù)據(jù)流,實心箭頭表示不同的元數(shù)據(jù)橋和與之關(guān)聯(lián)的元數(shù)據(jù)流。圖 4. 點對點的元數(shù)據(jù)集成體系結(jié)構(gòu)通過使用中央元數(shù)據(jù)存儲庫(central metadata repository)取代各個工具軟件和應(yīng)用程序之間的點對點連接方式,改成中央元數(shù)據(jù)存儲庫與各個工具軟件和應(yīng)用程序?qū)崿F(xiàn)元數(shù)據(jù)交換的訪問層(也是一種橋),可以有效降低總成本,減少建立點對點元數(shù)據(jù)橋的工作,提高投資回報率。信息供應(yīng)鏈各組件可以從存儲庫訪問元數(shù)據(jù),不必與其他產(chǎn)品進行點對點交互。這
21、種使用中央元數(shù)據(jù)存儲庫方式進行元數(shù)據(jù)集成的方式就是中央輻射式元數(shù)據(jù)體系結(jié)構(gòu)(hub-and-spoke meta data architecture),具體如圖 5 所示。由于特定的元數(shù)據(jù)存儲庫是圍繞其自身的元模型、接口和交付服務(wù)建立的,所以仍需要建立元數(shù)據(jù)橋?qū)崿F(xiàn)與 ISC 各組件的互相訪問。圖 5. 中央輻射式元數(shù)據(jù)體系結(jié)構(gòu)采用模型驅(qū)動的元數(shù)據(jù)集成方法(比如使用 CWM)可以有效降低元數(shù)據(jù)集成的成本和復雜度,無論點對點元數(shù)據(jù)集成體系結(jié)構(gòu)還是中央輻射式元數(shù)據(jù)集成體系結(jié)構(gòu)都可以因此受益。在點對點體系結(jié)構(gòu)中,通過使用基于模型的方法可以不必在每一對需要集成的產(chǎn)品之間構(gòu)建元數(shù)據(jù)橋,每個產(chǎn)品只需要提供一
22、個適配器(adapter)即可實現(xiàn)各個產(chǎn)品之間的元數(shù)據(jù)交換,適配器既了解公共的元模型也了解本產(chǎn)品元模型的內(nèi)部實現(xiàn)。如圖 6 所示,基于 CWM 模型驅(qū)動點對點元數(shù)據(jù)集成體系結(jié)構(gòu)使用通用元模型,不再需要在各個產(chǎn)品間建立元數(shù)據(jù)橋,在各個產(chǎn)品之間通過適配器實現(xiàn)了語義等價性。圖 6. 基于 CWM 模型驅(qū)動的點對點元數(shù)據(jù)集成體系結(jié)構(gòu)如圖 7 所示,在基于模型驅(qū)動(比如 CWM)的中央輻射式元數(shù)據(jù)體系結(jié)構(gòu)中,中央存儲庫包含公共元模型和整個領(lǐng)域(domain)用到的該元模型的各個實例(模型)、存儲庫自身元模型及其實例、理解元模型(公共元模型和自身元模型)的適配器層,當然存儲庫也可以直接實現(xiàn)公共元模型的某些
23、內(nèi)部表示。圖 7. 基于 CWM 模型驅(qū)動的中央存儲庫元數(shù)據(jù)集成體系結(jié)構(gòu)如圖 8 所示,這種體系架構(gòu)是基于 CWM 模型驅(qū)動的中央存儲庫元數(shù)據(jù)集成體系結(jié)構(gòu)的一個變種,兩個中央輻射式的拓撲結(jié)構(gòu)通過各自的元數(shù)據(jù)存儲庫連接起來,也被稱為分布式(Distributed)或聯(lián)邦(Federated)體系結(jié)構(gòu)。兩個元數(shù)據(jù)存儲庫之間通過元數(shù)據(jù)橋連接,兩個存儲庫使用相同的元模型和接口,也可以使用不同的元模型和接口。建立分布式元數(shù)據(jù)集成體系結(jié)構(gòu)的原因有很多種,比如企業(yè)基于多個區(qū)域單獨部署自己的應(yīng)用,每個區(qū)域有自己的數(shù)據(jù)中心。圖 8. 分布式(聯(lián)邦式)元數(shù)據(jù)集成體系結(jié)構(gòu)如圖 9 所示,這種體系結(jié)構(gòu)是分布式體系結(jié)構(gòu)的變體,根存儲庫實現(xiàn)了元模型的公共部分(橫跨整個企業(yè)),葉子存儲庫實現(xiàn)了一個或多個特定的公共元模型子集,并只保存這些自己所對應(yīng)的元數(shù)據(jù)實例。特定客戶可以主要訪問其感興趣的元數(shù)據(jù)所在的葉子
溫馨提示
- 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
- 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
- 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
- 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負責。
- 6. 下載文件中如有侵權(quán)或不適當內(nèi)容,請與我們聯(lián)系,我們立即糾正。
- 7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。
最新文檔
- 2025年新型建筑結(jié)構(gòu)材料租賃合作協(xié)議
- 貸款卡 行政許可申請書
- 2025年度農(nóng)業(yè)科技創(chuàng)新合伙土地承包合同
- 2025年度化肥品牌授權(quán)與連鎖經(jīng)營合同
- 2025年度教師培訓基地合作協(xié)議
- 2025年牛仔印花項目可行性研究報告
- 2025年度養(yǎng)老服務(wù)機構(gòu)管理服務(wù)合同
- 2025年中國配飾行業(yè)發(fā)展趨勢預(yù)測及投資戰(zhàn)略咨詢報告
- 2025年海綿粉帕項目投資可行性研究分析報告
- 2025年度公共租賃住房保障項目合作協(xié)議范本
- 培訓課件:律師客戶溝通技巧
- 2024年石柱土家族自治縣中醫(yī)院高層次衛(wèi)技人才招聘筆試歷年參考題庫頻考點附帶答案
- 西藏事業(yè)單位c類歷年真題
- 2025中國移動安徽分公司春季社會招聘高頻重點提升(共500題)附帶答案詳解
- 七年級英語下學期開學考試(深圳專用)-2022-2023學年七年級英語下冊單元重難點易錯題精練(牛津深圳版)
- 2025江蘇省全日制勞動合同書范本
- 放射科護理常規(guī)
- 儒釋道文化秒解
- 新時代中小學教師職業(yè)行為十項準則
- 人教版八年級上冊英語1-4單元測試卷(含答案)
- 初中數(shù)學教學經(jīng)驗分享
評論
0/150
提交評論