版權(quán)說(shuō)明:本文檔由用戶(hù)提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請(qǐng)進(jìn)行舉報(bào)或認(rèn)領(lǐng)
文檔簡(jiǎn)介
1、數(shù)據(jù)中心方案設(shè)計(jì)Bychj a、系統(tǒng)拓?fù)鋱Db、設(shè)計(jì)目標(biāo)建立一個(gè)集中分散、異構(gòu)、可擴(kuò)充、可集成、有統(tǒng)一數(shù)據(jù)模型、有多種角度視 圖的、可交換的和安全可靠的復(fù)合數(shù)據(jù)庫(kù)系統(tǒng)。它將成為政府各種業(yè)務(wù)系統(tǒng)、 政府部門(mén)之間協(xié)同工作的數(shù)據(jù)中心,是政府門(mén)戶(hù)的信息中心,多媒體、文檔資 料和政策法規(guī)的存儲(chǔ)中心和預(yù)測(cè)決策所需的數(shù)據(jù)倉(cāng)庫(kù)中心。數(shù)據(jù)中心設(shè)計(jì)基礎(chǔ)現(xiàn)狀分析對(duì)于一個(gè)完整的電子政務(wù)系統(tǒng)來(lái)說(shuō),統(tǒng)一的框架和相應(yīng)的數(shù)據(jù)模式是十分重要 的。電子政務(wù)的構(gòu)建,正經(jīng)歷著由以技術(shù)為中心向以數(shù)據(jù)為中心的方向轉(zhuǎn)變, 沒(méi)有數(shù)據(jù)也就沒(méi)有信息,也就沒(méi)有政府網(wǎng)站及電子政府。數(shù)據(jù)中心在電子政務(wù) 系統(tǒng)中處于中心地位,具有公共數(shù)據(jù)(信息)庫(kù)、模型庫(kù)
2、、文件交換站以及發(fā) 布信息的政府門(mén)戶(hù)網(wǎng)站的功能,各數(shù)據(jù)源將自己的數(shù)據(jù)上傳給數(shù)據(jù)中心,而各 部門(mén)根據(jù)自己的需要從數(shù)據(jù)中心獲取數(shù)據(jù),實(shí)施自己的應(yīng)用。按信息的應(yīng)用屬性,可將電子政務(wù)的數(shù)據(jù)類(lèi)型分為空間數(shù)據(jù)、基礎(chǔ)數(shù)據(jù)、政務(wù) 數(shù)據(jù)、專(zhuān)題數(shù)據(jù)和多媒體語(yǔ)音數(shù)據(jù)。整合政務(wù)信息資源,建設(shè)和改造政務(wù)數(shù)據(jù) 庫(kù),并建立人口、法人機(jī)構(gòu)、空間地理和自然資源、以及宏觀經(jīng)濟(jì)四個(gè)基礎(chǔ)數(shù) 據(jù)庫(kù),將成為我國(guó)今后數(shù)年電子政務(wù)建設(shè)的關(guān)鍵。由于我國(guó)政府各部門(mén)對(duì)信息化建設(shè)的深遠(yuǎn)意義認(rèn)識(shí)不夠,以及政務(wù)建設(shè)有一個(gè)發(fā)展過(guò)程,造成了政府各部門(mén)、城市各行業(yè)信息化發(fā)展步調(diào)不一,從而使政務(wù) 信息化建設(shè)存在一些問(wèn)題:、信息的共享、公開(kāi)沒(méi)有立發(fā),信息采集、儲(chǔ)
3、存標(biāo)準(zhǔn)不統(tǒng)一,造成了互聯(lián)互通不暢,共享程度低。、信息共享機(jī)制尚未建立,各職能部門(mén)內(nèi)部的信息相對(duì)封閉,產(chǎn)生了信息孤島效應(yīng),造成了信息資源的巨大浪費(fèi)。、大部分單位業(yè)務(wù)應(yīng)用系統(tǒng)還未形成一個(gè)內(nèi)部資源共享、有效運(yùn)行的整體,需要在電子政務(wù)設(shè)計(jì)建設(shè)的過(guò)場(chǎng)中進(jìn)行整合和改造。、網(wǎng)絡(luò)建設(shè)各自為政,結(jié)構(gòu)不合理,互連互通十分困難。、安全性存在隱患,人門(mén)還不放心在網(wǎng)上共享數(shù)據(jù)。基于以上問(wèn)題,需要在法律、技術(shù)、設(shè)備、管理等多方面加以考慮。政府?dāng)?shù)據(jù)資源的建設(shè),將有助于打破各級(jí)政府和部門(mén)對(duì)信息的壟斷和封閉,能夠有效整合政務(wù)信息資源,強(qiáng)化對(duì)信息資源的不斷開(kāi)發(fā)、更新和維護(hù);從長(zhǎng)遠(yuǎn)來(lái)說(shuō),這項(xiàng)工作的開(kāi)展,將有助于推動(dòng)政府信息資源對(duì)社
4、會(huì)的開(kāi)放,使之發(fā)揮 巨大的社會(huì)效益和經(jīng)濟(jì)效益。資源分類(lèi)數(shù)據(jù)中心是電子政務(wù)數(shù)據(jù)資源建設(shè)的基礎(chǔ), 它是各類(lèi)信息采集、 加工和整合的平 臺(tái)。數(shù)據(jù)中心資源大致可分為三大類(lèi), 一是元數(shù)據(jù)庫(kù)、 政務(wù)敘詞表和分類(lèi)體系與 代碼表,二是 GIS 平臺(tái),三是服務(wù)資源。( 1) 元數(shù)據(jù)庫(kù)考慮到今后各職能部門(mén)的信息聯(lián)接與交換, 電子政務(wù)元數(shù)據(jù)庫(kù)必需嚴(yán)格定義并向全網(wǎng)開(kāi)放,否則將造成今后機(jī)構(gòu)間數(shù)據(jù)交換無(wú)法實(shí)現(xiàn)。具體內(nèi)容請(qǐng)參見(jiàn)和節(jié)。( 2) 政務(wù)敘詞表 電子政務(wù)與電子商務(wù)的一個(gè)顯著不同是前者是為主題所驅(qū)動(dòng)的, 而后者是交易驅(qū) 動(dòng)的。在主題驅(qū)動(dòng)系統(tǒng)中,規(guī)范主題詞(敘詞)庫(kù)是至關(guān)重要的,因?yàn)樗菐?kù)內(nèi) 資源組織、 管理以及庫(kù)際資
5、源交換的基礎(chǔ)。 規(guī)范政務(wù)敘詞表即是對(duì)所有入庫(kù)資源 進(jìn)行科學(xué)標(biāo)引、 描述與分類(lèi), 通過(guò)敘詞嚴(yán)格的語(yǔ)義內(nèi)涵和位屬關(guān)聯(lián), 建立所有資 源在主題層的映射關(guān)系, 對(duì)各類(lèi)信息產(chǎn)品和服務(wù)過(guò)程起到基準(zhǔn)性、 規(guī)范性、 參照 性、結(jié)構(gòu)性和工具性的支持作用,以實(shí)現(xiàn)全庫(kù)資源的有序化,并提升其可用性。如"Internet"有"因特網(wǎng)"、"互聯(lián)網(wǎng)"、"網(wǎng)際網(wǎng)路"等名稱(chēng),僅以其中一個(gè)名稱(chēng)進(jìn) 行全文檢索、 關(guān)鍵詞檢索等并不能保證文獻(xiàn)的查全率。 而嚴(yán)格定義的敘詞表會(huì)在 這些表達(dá)間建立關(guān)聯(lián),同時(shí)還會(huì)給出相關(guān)同位詞,如 "Internet&q
6、uot; 的同位詞有 "Intranet"(即"內(nèi)部網(wǎng)"、"企業(yè)網(wǎng)"、"內(nèi)聯(lián)網(wǎng)"、"內(nèi)特網(wǎng)"等),以及"Extranet"("外部網(wǎng)"、"外聯(lián)網(wǎng)"、"外特網(wǎng)")等,上位詞有 "計(jì)算機(jī)網(wǎng)絡(luò) "、"網(wǎng)絡(luò)"以及" 無(wú)線(xiàn)互聯(lián)網(wǎng) " 、" 移動(dòng)互聯(lián)網(wǎng) " 等下位詞。資源庫(kù)中所有的文獻(xiàn)資源只有在標(biāo)引并與敘詞庫(kù)建立映射后, 才能使用戶(hù)在主題 查詢(xún)時(shí)能進(jìn)
7、退自如。政務(wù)資源敘詞表大致由如下分詞表組成: 機(jī)關(guān)公文主題詞表、 宏觀經(jīng)濟(jì)主題詞表、 行業(yè)主題詞表、 社會(huì)事業(yè)主題詞表以及科學(xué)與技術(shù)主題詞表 等。( 3)信息分類(lèi)、代碼和指標(biāo)體系表 分類(lèi)與代碼對(duì)于庫(kù)中信息的組織管理和服務(wù)是極其重要的, 同時(shí),隨著國(guó)際經(jīng)濟(jì) 一體化進(jìn)程的加快, 與國(guó)際標(biāo)準(zhǔn)信息分類(lèi)體系的兼容問(wèn)題也日益重要。 這些分類(lèi) 代碼體系涉及到國(guó)民經(jīng)濟(jì)行業(yè)分類(lèi)代碼、聯(lián)合國(guó)及各國(guó)海關(guān)協(xié)調(diào)制度(HS分類(lèi) 與代碼、北美工業(yè)標(biāo)準(zhǔn)分類(lèi)代碼(NAICS體系)、全國(guó)行政區(qū)劃分類(lèi)與代碼(擴(kuò) 展到鄉(xiāng)鎮(zhèn)級(jí))、全國(guó)工農(nóng)業(yè)產(chǎn)品 / 商品分類(lèi)代碼、各主導(dǎo)行業(yè)信息分類(lèi)與代碼以 及文件格式及其結(jié)構(gòu)描述規(guī)范代碼等。 此外,各
8、種指標(biāo)體系與格式化文件對(duì)于政府的宏觀管理和決策分析也是極其重要 的。此類(lèi)數(shù)據(jù)常以表格形式出現(xiàn), 并在各級(jí)機(jī)關(guān)部門(mén)中流轉(zhuǎn)生成, 它們之間的交 換也以表格形式進(jìn)行。所以,字段統(tǒng)一、代碼統(tǒng)一、格式統(tǒng)一、定義統(tǒng)一的表格 是主管部門(mén)從事經(jīng)濟(jì)分析、數(shù)據(jù)再處理和決策支持的前提。(4) GIS平臺(tái)幾乎所有的經(jīng)濟(jì)、產(chǎn)業(yè)與社會(huì)信息都與地理空間信息相關(guān),近年來(lái)GIS已融入IT 業(yè)的主體,并成為各類(lèi)數(shù)據(jù)綜合可視化的基礎(chǔ)平臺(tái)。與專(zhuān)業(yè)數(shù)據(jù)結(jié)合的各類(lèi) 專(zhuān)題電子地圖更是各地政府進(jìn)行區(qū)域經(jīng)濟(jì)與社會(huì)發(fā)展規(guī)劃、 開(kāi)展招商引資、 比較 本地與周邊地區(qū)競(jìng)爭(zhēng)優(yōu)勢(shì)不可缺少的工具。同時(shí),政務(wù)數(shù)據(jù)庫(kù)的資源只有在與GIS整合后,才能產(chǎn)生質(zhì)變,真
9、正為政府宏觀調(diào)控起到?jīng)Q策支持的作用。( 5)服務(wù)資源電子政務(wù)系統(tǒng)的服務(wù)對(duì)象有 4類(lèi):政府機(jī)構(gòu)、公務(wù)員、公民、企業(yè)單位。服務(wù)資 源即指直接為這 4 類(lèi)客戶(hù)提供服務(wù)的信息。 其中包括政府系統(tǒng)辦公數(shù)據(jù)、 各類(lèi)業(yè) 務(wù)數(shù)據(jù)、國(guó)家政策指令,各種政務(wù)圖像、視頻,還包括電子商務(wù)、工商、稅務(wù)、 金融、海關(guān)、法律、衛(wèi)生、醫(yī)療、教育、職業(yè)等基礎(chǔ)設(shè)施服務(wù)信息。數(shù)據(jù)特性( 1)靜態(tài)數(shù)據(jù)與動(dòng)態(tài)數(shù)據(jù) 電子政務(wù)數(shù)據(jù)中心必須滿(mǎn)足電子政務(wù)平臺(tái)進(jìn)行數(shù)據(jù)交換的需要, 同時(shí)還必須滿(mǎn)足 在平臺(tái)上建立的各業(yè)務(wù)系統(tǒng)進(jìn)行綜合業(yè)務(wù)處理的要求, 并為門(mén)戶(hù)系統(tǒng)提供各種靜 態(tài)和動(dòng)態(tài)的數(shù)據(jù)、 信息。所謂靜態(tài)信息是指對(duì)電子政務(wù)的運(yùn)行中不經(jīng)常變化, 供 各
10、個(gè)業(yè)務(wù)系統(tǒng)查詢(xún)、處理的數(shù)據(jù)或信息:政策、法規(guī)、元數(shù)據(jù)、資料庫(kù)、各種多 媒體數(shù)據(jù)等,它們會(huì)隨著時(shí)間而逐步增大。所謂動(dòng)態(tài)數(shù)據(jù)是指隨著運(yùn)行而增加、 修改的數(shù)據(jù):并聯(lián)審批中文件流轉(zhuǎn)狀態(tài)數(shù)據(jù),反映企業(yè)、個(gè)人所處狀態(tài)的數(shù)據(jù), 國(guó)民經(jīng)濟(jì)運(yùn)行狀態(tài)的數(shù)據(jù)等。 動(dòng)態(tài)數(shù)據(jù)同各個(gè)局委辦的信息密切相關(guān), 但又是面 向主題的,如社會(huì)保險(xiǎn)這個(gè)主題,實(shí)際上同保險(xiǎn)、工資、稅務(wù)和銀行密切相關(guān); 個(gè)人信用使用主題,它的數(shù)據(jù)與銀行、稅務(wù)、個(gè)人消費(fèi)、個(gè)人收入密切相關(guān)。(2)微觀應(yīng)用與宏觀應(yīng)用的數(shù)據(jù)共享 政府業(yè)務(wù)中的信息應(yīng)用有微觀的應(yīng)用與宏觀應(yīng)用之分, 微觀數(shù)據(jù)的應(yīng)用主要 是針對(duì)個(gè)案的事務(wù)處理。 比如工商登記, 業(yè)務(wù)申報(bào), 稅務(wù)處理,個(gè)
11、人勞保、補(bǔ)助、 婚喪、駕照、護(hù)照、醫(yī)療等等。微觀事務(wù)處理的業(yè)務(wù)既包含對(duì)社會(huì)市場(chǎng)秩序的監(jiān) 管,又包含對(duì)企業(yè)、 對(duì)公眾的服務(wù)。 這類(lèi)事務(wù)處理的工作主要是由基層的一線(xiàn)人 員來(lái)承擔(dān)的, 其信息共享的特點(diǎn)是: 由來(lái)自不同方面的信息要圍繞一個(gè)主體來(lái)整 合起來(lái),比如將醫(yī)療衛(wèi)生、 計(jì)劃生育、 社會(huì)保障等信息依據(jù)人的身份證號(hào)碼整合 起來(lái),這就構(gòu)成了以人為主題的數(shù)據(jù)庫(kù)。 同樣還可以建立以法人為主題的數(shù)據(jù)庫(kù) 來(lái)整合法人的信息咨詢(xún)。 實(shí)際上,微觀信息共享的核心是將不同來(lái)源的數(shù)據(jù)資源, 整合為主題數(shù)據(jù)庫(kù)。微觀數(shù)據(jù)的收集經(jīng)常是由不同的主管部門(mén)來(lái)做的, 如公安、稅務(wù)、衛(wèi)生部門(mén)、 社保部門(mén)、工商部門(mén)等。要讓這些部門(mén)收集的數(shù)據(jù)
12、依據(jù)主題 (主體) 整合起來(lái)并不 是容易的, 首先必須要解決這些部門(mén)主觀上的抵制, 這是一個(gè)政務(wù)改革與利益處 置的問(wèn)題。在技術(shù)上, 要求有非常標(biāo)準(zhǔn)化的唯一的主體編碼, 并要開(kāi)放數(shù)據(jù)結(jié)構(gòu), 這樣才有利于可共享的主題數(shù)據(jù)庫(kù)的誕生。 進(jìn)一步,我們應(yīng)當(dāng)盡量通過(guò)一表式的 調(diào)查、登記, 將盡可能多的數(shù)據(jù)集中地通過(guò)一次調(diào)查來(lái)完成, 從而能盡量地節(jié)約 成本。由于管理的角度不一樣, 我們很難通過(guò)一個(gè)主題數(shù)據(jù)來(lái)集中所有的共享數(shù) 據(jù),也許,我們還是需要幾個(gè)系統(tǒng)來(lái)分別處理各自的業(yè)務(wù),但是,經(jīng)過(guò)數(shù)據(jù)整合 設(shè)計(jì)之后的系統(tǒng), 肯定能夠降低數(shù)據(jù)收集的總成本, 并為微觀業(yè)務(wù)提供更有效的 服務(wù) 宏觀應(yīng)用的數(shù)據(jù)共享, 主要是為領(lǐng)導(dǎo)
13、層服務(wù), 希望通過(guò)共享數(shù)據(jù)資源來(lái)提高政府 的決策水平。 然而如何從紛繁龐雜的數(shù)據(jù)中挖掘出有用的信息進(jìn)行預(yù)測(cè)分析, 如 何更好地管理和決策呢我們可以選擇數(shù)據(jù)倉(cāng)庫(kù)(Data Warehouse)作為決策支持 系統(tǒng)的核心。數(shù)據(jù)倉(cāng)庫(kù)是支持管理決策過(guò)程的、面向主題的、集成的、不可更新 的且隨時(shí)間不斷變化的數(shù)據(jù)集合。利用數(shù)據(jù)倉(cāng)庫(kù),對(duì)源數(shù)據(jù)經(jīng)過(guò)提取、轉(zhuǎn)換、加 載形成統(tǒng)一的數(shù)據(jù)格式,再利用數(shù)據(jù)挖掘和 OLAP分析工具為決策者提供所需的 信息。數(shù)據(jù)倉(cāng)庫(kù)的使用者主要是機(jī)關(guān)單位、 市委領(lǐng)導(dǎo)等決策相關(guān)人員, 為他們提供在業(yè) 務(wù)辦公基礎(chǔ)數(shù)據(jù)庫(kù)的基礎(chǔ)上各種層次匯總的數(shù)據(jù),幫助他們進(jìn)行各種決策支持。對(duì)于數(shù)據(jù)倉(cāng)庫(kù)的概念我們可
14、以從兩個(gè)層次予以理解, 首先,數(shù)據(jù)倉(cāng)庫(kù)用于支持決 策,面向分析型數(shù)據(jù)處理,它不同于現(xiàn)有的業(yè)務(wù)型數(shù)據(jù)庫(kù);其次,數(shù)據(jù)倉(cāng)庫(kù)是對(duì) 多個(gè)異構(gòu)的數(shù)據(jù)源有效集成, 集成后按照主題進(jìn)行了重組, 并包含歷史數(shù)據(jù), 而 且存放在數(shù)據(jù)倉(cāng)庫(kù)中的數(shù)據(jù)一般不再修改。 數(shù)據(jù)倉(cāng)庫(kù)主要有三方面的作用: 首先, 數(shù)據(jù)倉(cāng)庫(kù)提供了標(biāo)準(zhǔn)的報(bào)表和圖表功能, 其中的數(shù)據(jù)來(lái)源于不同的多個(gè)事務(wù)處理 系統(tǒng),因此,數(shù)據(jù)倉(cāng)庫(kù)的報(bào)表和圖表是關(guān)于整個(gè)集成信息的報(bào)表和圖表;其次, 數(shù)據(jù)倉(cāng)庫(kù)支持多維分析, 多維分析是通過(guò)把一個(gè)實(shí)體的多項(xiàng)重要的屬性定義為多 個(gè)維度,使得用戶(hù)能方便地匯總數(shù)據(jù)集, 簡(jiǎn)化了數(shù)據(jù)的分析處理邏輯, 并能對(duì)不 同維度值的數(shù)據(jù)進(jìn)行比較,
15、而維度則表示了對(duì)信息的不同理解角度。 應(yīng)用多維分 析可以在一個(gè)查詢(xún)中對(duì)不同階段的數(shù)據(jù)進(jìn)行縱向或橫向比較, 這在決策過(guò)程中非 常有用;第三, 數(shù)據(jù)倉(cāng)庫(kù)是數(shù)據(jù)挖掘技術(shù)的關(guān)鍵基礎(chǔ), 數(shù)據(jù)挖掘技術(shù)要在已有數(shù) 據(jù)中識(shí)別數(shù)據(jù)的模式, 以幫助用戶(hù)理解現(xiàn)有的信息, 并在已有信息的基礎(chǔ)上, 對(duì) 未來(lái)的狀況作出預(yù)測(cè)。雖然數(shù)據(jù)倉(cāng)庫(kù)也有面向主題的定義, 但這些主題是較長(zhǎng)時(shí)間的, 具有戰(zhàn)略定義的 主題。由以上分析可見(jiàn), 根據(jù)數(shù)據(jù)庫(kù)的操作性、 數(shù)據(jù)的語(yǔ)義,應(yīng)該把數(shù)據(jù)庫(kù)分為三大類(lèi): 一般意義的數(shù)據(jù)庫(kù)即關(guān)系數(shù)據(jù)庫(kù)、文本數(shù)據(jù)庫(kù)(DB ;供綜合業(yè)務(wù)系統(tǒng)和門(mén)戶(hù)使 用的面向主題的數(shù)據(jù)庫(kù)(OSD ;數(shù)據(jù)倉(cāng)庫(kù),它是供內(nèi)門(mén)戶(hù)決策者使用的數(shù)
16、據(jù)庫(kù)(DW。DB數(shù)據(jù)主要分布在各局委辦,數(shù)據(jù)中心只有少量的;所以它是集中分布的。面向主題的操作數(shù)據(jù)庫(kù)(OSD是電子政務(wù)數(shù)據(jù)中心的主體,它是 DB按主 題映射的數(shù)據(jù)庫(kù);數(shù)據(jù)倉(cāng)庫(kù)建立在 DB和OSD之上的主題數(shù)據(jù)庫(kù)。這三種數(shù)據(jù)庫(kù)的關(guān)系描述如下:面向主題的操作數(shù)據(jù)庫(kù)是數(shù)據(jù)庫(kù)體系的中間層, 一方面包含全局一致的、 細(xì)節(jié)的、 當(dāng)前或接近當(dāng)前的數(shù)據(jù); 另一方面它是面向主題的, 集成的數(shù)據(jù)環(huán)境, 且數(shù)據(jù)量 小,供各個(gè)綜合業(yè)務(wù)系統(tǒng)查詢(xún)處理使用, 主要用作輔助完成日常決策的數(shù)據(jù)分析 處理。所以這種數(shù)據(jù)庫(kù)的主要特征是:l 系統(tǒng)功能表 4-1設(shè)計(jì)目標(biāo) 處理類(lèi)型 主要功能 需求特征中層輔助決策與綜合查詢(xún) 日常管理和控
17、制的決策, 事務(wù)處理與決策分析并存 聯(lián) 機(jī)事務(wù)處理聯(lián)機(jī)分析 綜合全局中層l 數(shù)據(jù)特征表 4-2內(nèi)容 來(lái)源 組織 穩(wěn)定性 綜合性 特征當(dāng)前或接近當(dāng)前的數(shù)據(jù) 政府系統(tǒng)內(nèi)部 主題 較穩(wěn)定允許更新 某一主題的綜合和詳細(xì)數(shù)據(jù) 全域一致的數(shù)據(jù)環(huán)境l 數(shù)據(jù)庫(kù)的主要用戶(hù)該數(shù)據(jù)庫(kù)是反映某一主題的數(shù)據(jù), 其用戶(hù)是政府工作人員和就某一主題進(jìn)行綜合 查詢(xún)的人員(3)集中分布式數(shù)據(jù)管理當(dāng)我們的微觀數(shù)據(jù)規(guī)模非常大的時(shí)候, 依靠集中的數(shù)據(jù)處理會(huì)是很不方便的, 我 們可以將數(shù)據(jù)庫(kù)建設(shè)分散化, 由本地來(lái)進(jìn)行數(shù)據(jù)收集、 整理和數(shù)據(jù)庫(kù)更新。 然而, 數(shù)據(jù)的使用卻不能是地區(qū)化的, 數(shù)據(jù)的查詢(xún)是全國(guó)范圍的。 這樣,共享數(shù)據(jù)的管 理與共
18、享數(shù)據(jù)的使用范圍就會(huì)不一致。 為了解決這一問(wèn)題, 可以考慮使用標(biāo)準(zhǔn)的 目錄數(shù)據(jù)庫(kù),統(tǒng)一結(jié)構(gòu)的目錄數(shù)據(jù)庫(kù)將允許多層次分布式的建立自己的子系統(tǒng), 而又能自然形成一個(gè)整體, 以支持統(tǒng)一的數(shù)據(jù)庫(kù)查詢(xún), 這對(duì)于建立大規(guī)模的主題 數(shù)據(jù)庫(kù)體系是非常有效的。 數(shù)據(jù)就近的管理與聯(lián)合統(tǒng)一的使用不僅會(huì)大大提高數(shù) 據(jù)共享的范圍,而且會(huì)有效地降低數(shù)據(jù)維護(hù)管理的成本。(4)數(shù)據(jù)源的異構(gòu)性 數(shù)據(jù)源異構(gòu)性主要表現(xiàn)在兩方面: s 系統(tǒng)異構(gòu), 數(shù)據(jù)源所依賴(lài)的應(yīng)用系統(tǒng)、 數(shù)據(jù)庫(kù)管理系統(tǒng)乃至操作系統(tǒng)之間的不 同構(gòu)成了系統(tǒng)異構(gòu)。s 模式異構(gòu), 數(shù)據(jù)源在存儲(chǔ)模式上的不同。 一般的存儲(chǔ)模式包括關(guān)系模式、 對(duì)象 模式、對(duì)象關(guān)系模式和文檔嵌套
19、模式等幾種, 其中關(guān)系模式為主流存儲(chǔ)模式。 需 要注意的是, 即便是同一類(lèi)存儲(chǔ)模式, 它們的模式結(jié)構(gòu)可能也存在著差異。 例如 Oracle 所采用的數(shù)據(jù)類(lèi)型與 SQLServer 所采用的數(shù)據(jù)類(lèi)型并不是完全一致的。 數(shù)據(jù)整合和集成需求異構(gòu)數(shù)據(jù)源的數(shù)據(jù)整合和集成的目的是為綜合應(yīng)用系統(tǒng)提供集成的、 統(tǒng)一的、安 全的、快捷的信息查詢(xún)、數(shù)據(jù)挖掘和決策支持服務(wù)。為了滿(mǎn)足這個(gè)需求條件,整 合、集成后的數(shù)據(jù)必須保證一定的集成性、完整性、一致性和訪(fǎng)問(wèn)安全性。1、集成性各種原先孤立的業(yè)務(wù)信息系統(tǒng)數(shù)據(jù)經(jīng)過(guò)整合、 集成后,應(yīng)該達(dá)到查詢(xún)一個(gè)綜合信 息不必再到各個(gè)業(yè)務(wù)系統(tǒng)進(jìn)行分別查詢(xún)和人工處理, 只要在數(shù)據(jù)中心中就可以
20、直 接訪(fǎng)問(wèn)到, 即整合、集成后的數(shù)據(jù)是各異構(gòu)業(yè)務(wù)數(shù)據(jù)的有機(jī)集成和關(guān)聯(lián)存儲(chǔ) (整 合、發(fā)掘出各業(yè)務(wù)數(shù)據(jù)間的內(nèi)在關(guān)聯(lián)關(guān)系),而不是簡(jiǎn)單、孤立的堆放在一個(gè)數(shù) 據(jù)庫(kù)系統(tǒng)里。2. 完整性 包括數(shù)據(jù)完整性和約束完整性?xún)煞矫妗 數(shù)據(jù)完整性是指完整提取數(shù)據(jù)本身,一般來(lái)說(shuō),這一點(diǎn)較容易達(dá)到。s 約束完整性, 約束是指數(shù)據(jù)與數(shù)據(jù)之間的關(guān)聯(lián)關(guān)系, 是唯一表征數(shù)據(jù)間邏輯的 特征。保證約束的完整性是良好的數(shù)據(jù)發(fā)布和交換的前提, 可以方便數(shù)據(jù)處理過(guò) 程,提高效率。3. 一致性 不同業(yè)務(wù)信息資源之間存在著語(yǔ)義上的區(qū)別。 這些語(yǔ)義上的不同會(huì)引起各種不完 整甚至錯(cuò)誤信息的產(chǎn)生, 從簡(jiǎn)單的名字語(yǔ)義沖突 (不同的名字代表相同的概
21、念) , 到復(fù)雜的結(jié)構(gòu)語(yǔ)義沖突 (不同的模型表達(dá)同樣的信息) 。語(yǔ)義沖突會(huì)帶來(lái)數(shù)據(jù)集 成結(jié)果的冗余,干擾數(shù)據(jù)處理、發(fā)布和交換。整合、集成后的數(shù)據(jù)應(yīng)該根據(jù)一定的數(shù)據(jù)轉(zhuǎn)換模式和業(yè)務(wù)規(guī)則進(jìn)行統(tǒng)一數(shù)據(jù)結(jié)構(gòu) 和字段語(yǔ)義編碼轉(zhuǎn)換。4. 訪(fǎng)問(wèn)安全性 由于數(shù)據(jù)庫(kù)資源可能歸屬不同的單位, 各業(yè)務(wù)數(shù)據(jù)系統(tǒng)有著各自的用戶(hù)權(quán)限管理 模式,訪(fǎng)問(wèn)和安全管理很不方便,不能集中、統(tǒng)一管理。所以既要保證能訪(fǎng)問(wèn)異 構(gòu)數(shù)據(jù)源中的數(shù)據(jù), 又要保障原有數(shù)據(jù)庫(kù)的權(quán)限不被侵犯, 實(shí)現(xiàn)對(duì)原有數(shù)據(jù)源訪(fǎng) 問(wèn)權(quán)限的隔離和控制, 就需要設(shè)計(jì)數(shù)據(jù)中心統(tǒng)一的用戶(hù)安全管理模式來(lái)解決此問(wèn) 題。值得注意的是,多個(gè)數(shù)據(jù)源之間的數(shù)據(jù)集成,并不是要將全部的數(shù)據(jù)進(jìn)行
22、集成, 那么如何定義要集成的范圍,就構(gòu)成了集成內(nèi)容的限定問(wèn)題。針對(duì)異構(gòu)數(shù)據(jù)源的整合和集成需求, 可以采用數(shù)據(jù)倉(cāng)庫(kù)技術(shù)和數(shù)據(jù)抽取工具來(lái)實(shí)現(xiàn)。另外,根據(jù)國(guó)務(wù)院 17 號(hào)文件精神,電子政務(wù)系統(tǒng)需要 "整合信息資源,建立 人口、法人單位、空間地理和自然資源、宏觀經(jīng)濟(jì)四個(gè)基礎(chǔ)數(shù)據(jù)庫(kù)" 。為什么選擇這四個(gè)庫(kù)而不選擇別的數(shù)據(jù)庫(kù)呢這是基于基礎(chǔ)性、 公益性、 戰(zhàn)略性考慮的。 由 于這四個(gè)數(shù)據(jù)庫(kù)對(duì)別的數(shù)據(jù)庫(kù)建設(shè)來(lái)說(shuō)是一種公共產(chǎn)品, 其它數(shù)據(jù)庫(kù)需要通過(guò)它 的服務(wù),在它的基礎(chǔ)上不斷發(fā)展,而產(chǎn)業(yè)庫(kù)可以由中介機(jī)構(gòu)來(lái)做。數(shù)據(jù)元標(biāo)準(zhǔn)化 很多信息的描述、定義、獲取、表示形式由于缺乏統(tǒng)一、嚴(yán)格的標(biāo)準(zhǔn),致使大量
23、 的信息數(shù)據(jù)處于分散的、 部門(mén)所有的和各自為政的狀態(tài), 造成數(shù)據(jù)信息資源浪費(fèi), 不利于實(shí)現(xiàn)全社會(huì)的數(shù)據(jù)共享。 為了提高政務(wù)信息的共享和集成分析, 保證為政 府的管理決策和社會(huì)各階層提供科學(xué)準(zhǔn)確的信息,迫切需要開(kāi)發(fā)出一種統(tǒng)一的、 以標(biāo)準(zhǔn)數(shù)據(jù)元形式的對(duì)政務(wù)信息的表示方法,以支持政務(wù)信息的共享和交換。 數(shù)據(jù)元( Data Element )是表示概念的一類(lèi)數(shù)據(jù),其特性可由支持信息交換的一 組數(shù)據(jù)元屬性來(lái)表示。 或者說(shuō)數(shù)據(jù)元是一組可識(shí)別和可定義的數(shù)據(jù)基本單元。 一 般來(lái)說(shuō)數(shù)據(jù)元由數(shù)據(jù)元的名稱(chēng)、屬性、表示三部分組成。 數(shù)據(jù)元是用一組屬性描述其定義、標(biāo)示、表達(dá)和允許值的一個(gè)數(shù)據(jù)單元。 組成 數(shù)據(jù)元規(guī)范的基
24、本屬性分為標(biāo)示類(lèi)屬性、 定義類(lèi)屬性、 關(guān)系類(lèi)屬性、表示類(lèi)屬性、 管理類(lèi)屬性。 當(dāng)然還可以根據(jù)需要增加擴(kuò)展屬性。 數(shù)據(jù)元屬性應(yīng)依照一種標(biāo)準(zhǔn)方 式來(lái)注冊(cè)和控制, 以便數(shù)據(jù)元字典中的數(shù)據(jù)元在信息交換中保持一致性, 并且能 夠在不同的數(shù)據(jù)管理環(huán)境中進(jìn)行數(shù)據(jù)元管理。數(shù)據(jù)元的基本屬性主要有以下幾 類(lèi): s 標(biāo)示類(lèi),適用于數(shù)據(jù)元標(biāo)示的屬性。包括名稱(chēng)、標(biāo)示符、版本、注冊(cè)機(jī)構(gòu)、同 義名稱(chēng)、相關(guān)環(huán)境。s 定義類(lèi),描述數(shù)據(jù)元語(yǔ)義方面的屬性。包括定義。s 關(guān)系類(lèi),描述數(shù)據(jù)元之間相互關(guān)聯(lián)和(或)數(shù)據(jù)元與分類(lèi)模式、數(shù)據(jù)元概念、 對(duì)象、實(shí)體之間關(guān)聯(lián)的屬性包括分類(lèi)模式、關(guān)鍵字、相關(guān)數(shù)據(jù)參照、關(guān)系類(lèi)型 s 表示類(lèi), 描述數(shù)據(jù)元
25、表示方面的屬性包括表示類(lèi)別、 表示形式、 數(shù)據(jù)元值的數(shù) 據(jù)類(lèi)型、數(shù)據(jù)元值的最大長(zhǎng)度、 數(shù)據(jù)元值的最小長(zhǎng)度、 表示格式、 數(shù)據(jù)元允許值。 s 管理類(lèi),描述數(shù)據(jù)元管理與控制方面的屬性包括主管機(jī)構(gòu)、 注冊(cè)狀態(tài)、 提交機(jī) 構(gòu)、備注。在這些基本屬性中名稱(chēng)、定義、表示類(lèi)別、表示形式、數(shù)據(jù)元值的數(shù)據(jù)類(lèi)型、數(shù) 據(jù)元值的最大長(zhǎng)度、 數(shù)據(jù)元值的最小長(zhǎng)度、 數(shù)據(jù)元允許值是在描述數(shù)據(jù)元時(shí)是必 選的。數(shù)據(jù)元表示是在數(shù)據(jù)處理和信息交換過(guò)程中數(shù)據(jù)元所采用的格式。如數(shù)據(jù)的長(zhǎng) 度、數(shù)據(jù)的類(lèi)型等都要給予說(shuō)明, 數(shù)據(jù)元的格式受數(shù)據(jù)元的屬性及應(yīng)用環(huán)境限定。 數(shù)據(jù)元可分為通用數(shù)據(jù)元和應(yīng)用數(shù)據(jù)元。 通用數(shù)據(jù)元是獨(dú)立于任何具體的應(yīng)用而 存
26、在的數(shù)據(jù)元,其功能是為應(yīng)用領(lǐng)域的數(shù)據(jù)元設(shè)計(jì)也就是為應(yīng)用數(shù)據(jù)元的設(shè)計(jì)提 供一部通用數(shù)據(jù)元字典。 應(yīng)用數(shù)據(jù)元是在特定領(lǐng)域內(nèi)使用的數(shù)據(jù)元集, 例如在電 子政務(wù)領(lǐng)域的應(yīng)用。 從這個(gè)意義上來(lái)講國(guó)家標(biāo)準(zhǔn) 數(shù)據(jù)元及交換格式、 信息交換、 日期和時(shí)間表示法就應(yīng)該是一部通用數(shù)據(jù)元字典。所謂數(shù)據(jù)元的標(biāo)準(zhǔn)化就是對(duì)數(shù)據(jù)元的總則、定義、描述、分類(lèi)、表示和注冊(cè)等制 定統(tǒng)一的標(biāo)準(zhǔn),并加以貫徹、實(shí)施的過(guò)程。在大量繁雜的政務(wù)信息中,哪些概念 可以作為我們定義數(shù)據(jù)元的基礎(chǔ), 數(shù)據(jù)元概念的特性中哪一個(gè)可以繼承下來(lái)作為 派生的通用數(shù)據(jù)元的特性, 通用數(shù)據(jù)元特性中的又有哪些可以被應(yīng)用數(shù)據(jù)元所繼 承。以上這些問(wèn)題都是數(shù)據(jù)元標(biāo)準(zhǔn)化過(guò)程所要
27、解決的。隨著社會(huì)的發(fā)展, 信息在社會(huì)各個(gè)行業(yè)中的作用不斷提高, 數(shù)據(jù)元標(biāo)準(zhǔn)也越來(lái)越 引起各個(gè)行業(yè)的重視。人們認(rèn)識(shí)到只要對(duì)信息按共同約定的規(guī)則進(jìn)行統(tǒng)一組織、 分類(lèi)與表示,使用同一的概念, 并用相同的表示, 就能做到共識(shí),不致產(chǎn)生歧義。 這種簡(jiǎn)化的概念表述,提高了數(shù)據(jù)的準(zhǔn)確性,有利于數(shù)據(jù)的共享、交換。各政務(wù)系統(tǒng)所要處理的對(duì)象主要是數(shù)據(jù), 數(shù)據(jù)元標(biāo)準(zhǔn)所要起的作用就是用一個(gè)統(tǒng) 一的標(biāo)準(zhǔn)來(lái)描述、定義、規(guī)范這些系統(tǒng)所要處理的數(shù)據(jù),為系統(tǒng)間的數(shù)據(jù)共享、 數(shù)據(jù)交換提供一個(gè)公用的信息接口。 這個(gè)公用的信息接口的基礎(chǔ)是政府部門(mén)的數(shù) 據(jù)環(huán)境建設(shè), 而數(shù)據(jù)環(huán)境建設(shè)的基礎(chǔ)就是用數(shù)據(jù)元標(biāo)準(zhǔn)來(lái)描述數(shù)據(jù)源, 建立電子 政務(wù)領(lǐng)
28、域的應(yīng)用數(shù)據(jù)元字典。 這個(gè)公用的信息接口實(shí)際上就是我們對(duì)政務(wù)領(lǐng)域的 信息以數(shù)據(jù)元標(biāo)準(zhǔn)進(jìn)行描述, 形成一個(gè)大家都廣泛接受, 并在政務(wù)系統(tǒng)的開(kāi)發(fā)過(guò) 程中遵守的規(guī)則。在此基礎(chǔ)上,各種系統(tǒng)之間的數(shù)據(jù)共享、數(shù)據(jù)交換成為可能。數(shù)據(jù)元的標(biāo)準(zhǔn)化過(guò)程起到了一個(gè)針對(duì)要處理的數(shù)據(jù)源進(jìn)行規(guī)范化的作用。 通過(guò)這 個(gè)過(guò)程,規(guī)范了其中的概念、定義、以及知識(shí)的描述,形成了數(shù)據(jù)元詞典,根據(jù) 這個(gè)詞典一方面數(shù)據(jù)庫(kù)的內(nèi)容的規(guī)范有了依據(jù), 另一方面數(shù)據(jù)庫(kù)的結(jié)構(gòu)也得到了 規(guī)范。模型設(shè)計(jì)基礎(chǔ)異類(lèi)軟件產(chǎn)品、 應(yīng)用程序、 和數(shù)據(jù)庫(kù)系統(tǒng)想要有效地互操作, 它們必須要對(duì) 彼此間的信息結(jié)構(gòu)有一個(gè)共同的理解。 元數(shù)據(jù)是描述數(shù)據(jù)的數(shù)據(jù), 或是與數(shù)據(jù)有
29、 關(guān)的信息, 通常由信息的結(jié)構(gòu)描述組成。 元數(shù)據(jù)對(duì)不同廠商提供的異類(lèi)軟件系統(tǒng) 和產(chǎn)品之間的集成起著不可或缺的作用。傳統(tǒng)的四層元數(shù)據(jù)體系結(jié)構(gòu)圖如下:圖 4-9 四層元數(shù)據(jù)體系結(jié)構(gòu)l 數(shù)據(jù)層( 0 層)是用戶(hù)對(duì)象層,它表示的是 " 目標(biāo)" 數(shù)據(jù),即我們所希望描述的 信息。比如在特定關(guān)系數(shù)據(jù)庫(kù)中表示為特定表的實(shí)例。 例如, 公民基本信息表中 某個(gè)具體公民的信息,相當(dāng)于公民基本信息表中的一條記錄。CitizenNo Name Age Address張三 28 武漢李四 45 北京l 模型層( 1 層)包含描述目標(biāo)數(shù)據(jù)的數(shù)據(jù)模型。比如在特定關(guān)系數(shù)據(jù)庫(kù)中表示 為特定的表、特定表的約束(
30、主鍵、外鍵等)、特定表的結(jié)構(gòu)等。例如,公民基 本信息表的結(jié)構(gòu),即該表中包含哪些列,以及各個(gè)列的數(shù)據(jù)類(lèi)型等。Table Column AttributeCitizen CitizenNo NumericName StringAge NumericAddress Stringl元模型(2層)包含了定義模型層的元數(shù)據(jù),也就是表示M1層元數(shù)據(jù)的抽象語(yǔ)言。比如在關(guān)系數(shù)據(jù)庫(kù)系統(tǒng)中,表示為特定數(shù)據(jù)庫(kù)中表的定義、列的定義、主 鍵的定義和外鍵的定義等。相當(dāng)于UML元模型定義的很多元素如類(lèi),操作,屬性, 關(guān)聯(lián)等等。DataStore Component File TableColumnAttrl 元元模型層( 3
31、 層)是由定義元數(shù)據(jù)結(jié)構(gòu)和語(yǔ)法的描述組成,也可以說(shuō)它是定 義各種元數(shù)據(jù)的抽象語(yǔ)言。傳統(tǒng)的元數(shù)據(jù)集成圖4-10是數(shù)據(jù)中心中一個(gè)典型的信息供應(yīng)鏈(ISC)的示例。信息從其源頭(即 原始數(shù)據(jù)的提供者)流出,經(jīng)過(guò)一系列精煉過(guò)程,最終產(chǎn)生信息產(chǎn)品。這些產(chǎn)品 可能對(duì)于高層決策者來(lái)說(shuō)具有重大的戰(zhàn)略?xún)r(jià)值。圖 4-10 數(shù)據(jù)中心中的信息供應(yīng)鏈以上每個(gè)軟件產(chǎn)品和工具, 在它們能在數(shù)據(jù)層上有效集成之前, 必須在元數(shù)據(jù)層 上被集成。 元數(shù)據(jù)集成是有效的數(shù)據(jù)集成的一個(gè)先決條件。 然而,元數(shù)據(jù)的集成 是十分困難的, 因?yàn)榇蠖鄶?shù)的業(yè)務(wù)產(chǎn)品使用千差萬(wàn)別的格式存儲(chǔ)元數(shù)據(jù)。 具有不 同元數(shù)據(jù)的工具, 往往是通過(guò)建立復(fù)雜的元數(shù)據(jù)橋
32、來(lái)集成的。 元數(shù)據(jù)橋是一種能 將一個(gè)產(chǎn)品的元數(shù)據(jù)轉(zhuǎn)換成另一個(gè)產(chǎn)品所需元數(shù)據(jù)格式的一段軟件。 元數(shù)據(jù)橋的 構(gòu)建是一項(xiàng)艱巨、 耗費(fèi)大的過(guò)程。 這樣的橋需要具有它要集成的每個(gè)產(chǎn)品的元數(shù) 據(jù)結(jié)構(gòu)和接口的詳細(xì)知識(shí);關(guān)于不同模型間如何相互映射的知識(shí)也要融入橋中。圖 4-11 在信息供應(yīng)鏈中增加一個(gè)元數(shù)據(jù)庫(kù)圖 4-11 中使用了元數(shù)據(jù)庫(kù),它突出顯示了定義對(duì)全局可獲得的、和廣泛被理解 的元數(shù)據(jù)是有必要的。 元數(shù)據(jù)庫(kù)是具有特定目的的數(shù)據(jù)庫(kù), 它存儲(chǔ)、 控制所處環(huán) 境中,除它自身之外的所有相關(guān)的元數(shù)據(jù)組件, 并對(duì)這些元數(shù)據(jù)組件是可獲得的。 從圖中我們可以看到, 各種軟件產(chǎn)品從中央元數(shù)據(jù)庫(kù)中提取全局?jǐn)?shù)據(jù), 而不是通
33、 過(guò)與其它產(chǎn)品的點(diǎn)到點(diǎn)連接。 這個(gè)存儲(chǔ)庫(kù)包含了定義信息供應(yīng)鏈 (可推廣至數(shù)據(jù) 中心)的所有元數(shù)據(jù)的單一定義。 這個(gè)定義基于一個(gè)針對(duì)存儲(chǔ)庫(kù)產(chǎn)品本身的元數(shù) 據(jù)模型。每個(gè)產(chǎn)品必須實(shí)現(xiàn)它自己的存儲(chǔ)庫(kù)訪(fǎng)問(wèn)層(即另一種形式的橋),該層 理解與特定存儲(chǔ)庫(kù)相關(guān)的元數(shù)據(jù)結(jié)構(gòu) (例如接口和元模型) ,還知道如何將這些 與存儲(chǔ)庫(kù)相關(guān)的結(jié)構(gòu)映射為與產(chǎn)品相關(guān)的元數(shù)據(jù)結(jié)構(gòu)。 這種類(lèi)型的配置通常稱(chēng)為 星型元數(shù)據(jù)體系結(jié)構(gòu)。以上這個(gè)方法雖然減輕了建立很多點(diǎn)到點(diǎn)的橋的需要, 但建立橋的問(wèn)題仍然沒(méi)有 完全消除。 我們還是需要為每一個(gè)軟件組件開(kāi)發(fā)一個(gè)不同的訪(fǎng)問(wèn)層 (該層可以由 產(chǎn)品廠商、 存儲(chǔ)庫(kù)廠商或者第三方顧問(wèn)開(kāi)發(fā)) ,每一個(gè)訪(fǎng)問(wèn)
34、層仍然是與某一特定 的存儲(chǔ)庫(kù)產(chǎn)品相關(guān)的?;谀P偷脑獢?shù)據(jù)集成可以有效地解決這個(gè)問(wèn)題。基于模型的元數(shù)據(jù)集成用一種形式化語(yǔ)言(如UML描述的模型(圖4-12 )可以被用來(lái)定義描述某種信 息結(jié)構(gòu)或模式的元數(shù)據(jù)。 這種形式化語(yǔ)言可以被翻譯成相應(yīng)的元數(shù)據(jù)定義, 后者 能被用來(lái)創(chuàng)建信息結(jié)構(gòu)本身的真正的實(shí)例。 這些各式各樣的形式化模型通常是平 臺(tái)無(wú)關(guān)的, 它們并不顯示用來(lái)配置實(shí)際的信息結(jié)構(gòu)的計(jì)算機(jī)平臺(tái)的物理特性, 因 為形式化建模語(yǔ)言(如UML以及其它各種數(shù)據(jù)建模語(yǔ)言)的定義通常是與平臺(tái)無(wú) 關(guān)的。一個(gè)SQLDDL語(yǔ)句集可以被看成是一個(gè)與平臺(tái)相關(guān)的模型,因?yàn)樗鼈冇靡?個(gè)特定計(jì)算機(jī)平臺(tái)的語(yǔ)言定義目標(biāo)信息結(jié)構(gòu) (
35、例如,一個(gè)與SQL兼容的關(guān)系數(shù)據(jù) 庫(kù)引擎)。將一個(gè)形式化模型轉(zhuǎn)換為 SQLDDL的假定的翻譯過(guò)程,稱(chēng)為將與平臺(tái) 無(wú)關(guān)的模型映射為與平臺(tái)相關(guān)的模型, 該映射是基于翻譯過(guò)程所實(shí)現(xiàn)的某些形式 化映射的規(guī)則集。圖 4-12 簡(jiǎn)單關(guān)系數(shù)據(jù)表模型由上我們可以得出三個(gè)非常重要的結(jié)論: 一個(gè)信息結(jié)構(gòu)的任何形式化模型都是定義該信息結(jié)構(gòu)的元數(shù)據(jù)(元數(shù)據(jù)本質(zhì) 上是它所描述的數(shù)據(jù)的一個(gè)形式化模型) 元數(shù)據(jù),當(dāng)用一個(gè)形式化的、與平臺(tái)無(wú)關(guān)的模型表示時(shí),可以獨(dú)立于任何特 定的目標(biāo)平臺(tái)而存在。 元數(shù)據(jù),當(dāng)用一個(gè)形式化的、與平臺(tái)無(wú)關(guān)的模型表示時(shí),可以被翻譯成若干 與平臺(tái)相關(guān)的模型中的任何一個(gè), 每一個(gè)代表一個(gè)不同的目標(biāo)平臺(tái) (
36、當(dāng)然要特定 適當(dāng)?shù)挠成湟?guī)則以及實(shí)現(xiàn)這些規(guī)則)。元數(shù)據(jù)集成的一個(gè)可能的方法就是開(kāi)發(fā)一個(gè)元數(shù)據(jù)的外部表示, 它不依賴(lài)于任何 一個(gè)特定的產(chǎn)品和工具。 這樣一個(gè)表示是基于信息結(jié)構(gòu)的形式化的、 與平臺(tái)無(wú)關(guān) 的模型,該模型用一種恰當(dāng)?shù)恼Z(yǔ)言(如 UML描述。一個(gè)產(chǎn)品用這樣一個(gè)形式化 模型作為它自己的元數(shù)據(jù)的基礎(chǔ),通過(guò)調(diào)用一個(gè)恰當(dāng)?shù)膶?dǎo)入映射( import mapping)過(guò)程將這個(gè)形式化模型翻譯成它自己的、 與產(chǎn)品相關(guān)的元數(shù)據(jù)的實(shí)例。 類(lèi)似的,一個(gè)產(chǎn)品可以通過(guò)一個(gè)將它自己的內(nèi)部元數(shù)據(jù)翻譯成一個(gè)與平臺(tái)無(wú)關(guān)的 形式化模型的導(dǎo)出映射(export mapping)過(guò)程,將它所有的元數(shù)據(jù)顯示給其它產(chǎn)品。這個(gè)方案在哪
37、些方面優(yōu)于前面提到元數(shù)據(jù)橋解決方案呢 元數(shù)據(jù)橋的主要問(wèn)題是 每座橋要在兩個(gè)與產(chǎn)品相關(guān)的模型之間進(jìn)行映射, 橋本質(zhì)上需要將元數(shù)據(jù)從一個(gè) 產(chǎn)品的元模型規(guī)定的格式轉(zhuǎn)換成另一個(gè)與產(chǎn)品相關(guān)的元模型所規(guī)定格式?,F(xiàn)在, 元模型本身被外部化( externalized ),與特定的實(shí)現(xiàn)平臺(tái)無(wú)關(guān);并且,產(chǎn)品交 換的元數(shù)據(jù)也基于這個(gè)公共的、 外部的元模型, 這樣,在各自的實(shí)現(xiàn)模型間翻譯 的問(wèn)題也就不存在了。 這種元數(shù)據(jù)級(jí)的集成和互操作方法稱(chēng)為模型驅(qū)動(dòng)的元數(shù)據(jù)體系結(jié)構(gòu)。從根本上 說(shuō),它是由軟件產(chǎn)品之間元數(shù)據(jù)的交換構(gòu)成,這里的元數(shù)據(jù)定義是以形式化的、 與平臺(tái)無(wú)關(guān)的模型來(lái)表示的。 參與的軟件產(chǎn)品和工具就定義整個(gè)域的公共
38、元模型 達(dá)成一致,這樣它們就能很方便的理解該元模型的任何實(shí)例 (例如可能被交換的、 任何共享的元數(shù)據(jù)) 。任何產(chǎn)品將這個(gè)共享的元數(shù)據(jù)映射為它自己內(nèi)部的元數(shù)據(jù) 表式方式。這要求元模型在它的領(lǐng)域有一個(gè)完整的描述。OMG勺公共倉(cāng)庫(kù)元模型(Com mon Warehouse Metamodgl CW就是一個(gè)基于模型 的元數(shù)據(jù)集成的實(shí)現(xiàn)典范,它是一個(gè)完整描述數(shù)據(jù)倉(cāng)庫(kù)和業(yè)務(wù)分析領(lǐng)域的元模 型。作為一個(gè)元模型,cwM提供了構(gòu)建元數(shù)據(jù)(例如模型或者元模型的實(shí)例)所 需勺語(yǔ)義和語(yǔ)法。CW實(shí)際上是由若干互不相同但又緊密相關(guān)的元模型構(gòu)成。圖4-13描述了 CWM的總體結(jié)構(gòu),每一塊代表CW啲一個(gè)元模型(或包)。由CW
39、I某個(gè)包的得到的某 特定的模型(例如,某個(gè)元模型的實(shí)例) 定義了描述對(duì)應(yīng)功能域中數(shù)據(jù)的元數(shù)據(jù)。 例如,由關(guān)系元模型得到的某個(gè)模型是描述某些關(guān)系數(shù)據(jù)的實(shí)例 (即產(chǎn)品數(shù)據(jù)表 的行集合)的元數(shù)據(jù)。管理層Management數(shù)據(jù)倉(cāng)庫(kù)處理包 Warehouse Process數(shù)據(jù)倉(cāng)庫(kù)操作包 Warehouse Operation分析層Analysis 轉(zhuǎn)換包Transformation 聯(lián)機(jī)分析、處理包 OLAP數(shù)據(jù)挖掘 包 Data Mining 信息可視化包 InformationVisualization 業(yè)務(wù)命名規(guī)則包BusinessNomenclature資源層 Resource 對(duì)象包 Ob
40、ject 關(guān)系包 Relational 記錄包 Record 多維包 Multidimensional XML 包 XML基礎(chǔ)層 Foundation 業(yè)務(wù)信息包 BusinessInformation 數(shù)據(jù)類(lèi)型包 Data Type 表達(dá)式包 Expressions 鍵和索引包 Keys and Indexes 軟件配置包 Software Deployment 類(lèi)型映射包 Type Mapping 對(duì)象模型層 Object Model 核心包 Core 行為包 Behavioral 聯(lián)系包 Relationships 實(shí)例包 Instance 圖CWM元模型層次圖 另外,基于模型的元數(shù)據(jù)集
41、成體系結(jié)構(gòu)要求有一種形式化語(yǔ)言, 它能夠以共享的、 與平臺(tái)無(wú)關(guān)的模型來(lái)表示元數(shù)據(jù)。在 CWM中,這種語(yǔ)言是UML(事實(shí)上是UML勺 一個(gè)特定子集)。首先,最低的一層是對(duì)象層,這個(gè)UML的子層用作CW啲基本元模型。對(duì)象層由4 個(gè)元模型構(gòu)成:核心元模型、行為元模型、關(guān)系元模型和實(shí)例元模型。其中的 關(guān)系元模型定義了模型元素之間的基本關(guān)系(如表和列之間的關(guān)聯(lián))?;A(chǔ)層為更高層次提供CW特定的服務(wù)。例如,數(shù)據(jù)類(lèi)型元模型為定義基本數(shù)據(jù) 類(lèi)型和構(gòu)造數(shù)據(jù)類(lèi)型提供基礎(chǔ)結(jié)構(gòu); 類(lèi)型映射元模型定義的新類(lèi)型使我們能夠在 不同類(lèi)型的系統(tǒng)之間建立映射模型 (對(duì)于確保不同軟件工具和平臺(tái)之間的互操作 性很顯然是必不可少的)
42、;索引元模型同樣以對(duì)象層的基本模型元素為基礎(chǔ), 定 義了唯一鍵和外鍵的抽象概念, 這對(duì)于建立關(guān)系數(shù)據(jù)庫(kù)的模型至關(guān)重要, 同時(shí)它 對(duì)面向記錄的和多維的數(shù)據(jù)庫(kù)同樣重要。 業(yè)務(wù)信息元模型定義的元素支持對(duì)基本 業(yè)務(wù)信息的建模。資源層定義了各種數(shù)據(jù)資源的不同類(lèi)型。 該層含有的元模型包, 允許描述面向?qū)?象的數(shù)據(jù)庫(kù)和應(yīng)用系統(tǒng)、 關(guān)系數(shù)據(jù)庫(kù)管理系統(tǒng)、 傳統(tǒng)的面向記錄的數(shù)據(jù)源 (諸如 文件和記錄模型數(shù)據(jù)庫(kù)管理系統(tǒng)),以及由聯(lián)線(xiàn)分析處理( OLAP工具和XML 流建立的多維數(shù)據(jù)庫(kù)。數(shù)據(jù)倉(cāng)庫(kù)和ISC (信息供應(yīng)鏈)中需要管理的各種數(shù)據(jù)資 源,我們可以用CW去定義表示各種類(lèi)型的數(shù)據(jù)資源的元數(shù)據(jù)。分析層中最重要的是轉(zhuǎn)
43、換元模型, 這個(gè)元模型定義的模型元素用來(lái)指定數(shù)據(jù)資源 模型(資源層元模型的實(shí)例) 之間源和目標(biāo)的映射及轉(zhuǎn)換, 同時(shí)也指定數(shù)據(jù)資源 模型和各種分析模型之間源和目標(biāo)的映射及轉(zhuǎn)換。 分析層還提供了數(shù)據(jù)挖掘、 業(yè)務(wù)術(shù)語(yǔ)、 信息可視化元模型, 它們支持對(duì)面向分析的元數(shù)據(jù)進(jìn)行建模。 數(shù)據(jù)挖 掘元模型定義的模型元素用來(lái)指定與各種數(shù)據(jù)挖掘工具相關(guān)的元數(shù)據(jù), 這些工具 經(jīng)常用來(lái)從各種數(shù)據(jù)資源中抽取重要的模式和趨勢(shì); 業(yè)務(wù)術(shù)語(yǔ)元模型定義的元數(shù) 據(jù)負(fù)責(zé)定義業(yè)務(wù)術(shù)語(yǔ)和概念并對(duì)其分類(lèi); 可視化元模型定義的模型元素能夠創(chuàng)建 與先進(jìn)的報(bào)表工具和可視化工具相關(guān)的元數(shù)據(jù)。 總而言之,這些元模型提供了建 立支持ISC (信息供應(yīng)
44、鏈)分析階段的那些元數(shù)據(jù)所需的語(yǔ)義結(jié)構(gòu)。最后,管理層元模型支持?jǐn)?shù)據(jù)倉(cāng)庫(kù)的日常操作和管理。 數(shù)據(jù)倉(cāng)庫(kù)過(guò)程元模型使我 們能夠?qū)δ承┨囟ǖ臄?shù)據(jù)倉(cāng)庫(kù)過(guò)程進(jìn)行建模, 例如 ETL (數(shù)據(jù)提取、轉(zhuǎn)換和裝載) 過(guò)程;數(shù)據(jù)倉(cāng)庫(kù)操作元模型定義的模型元素用來(lái)創(chuàng)建定義特定的周期性的常規(guī)操 作的元數(shù)據(jù),例如預(yù)定的事件及其相互的依賴(lài)關(guān)系。這些元數(shù)據(jù)對(duì)于ETL(數(shù)據(jù)提取,轉(zhuǎn)換和裝載)工具,基于時(shí)間的排序工具以及其它倉(cāng)庫(kù)管理工具十分有用。 由上,CW提供了基于模型的元數(shù)據(jù)集成體系結(jié)構(gòu)所需的、用于描述問(wèn)題域的語(yǔ) 義完整的公共元模型。 如果構(gòu)建數(shù)據(jù)中心用到的各種軟件產(chǎn)品、 工具和數(shù)據(jù)庫(kù)產(chǎn) 品就CWI元模型達(dá)成一致,它們就都能理
45、解CWI元模型的實(shí)例(模型或者元數(shù)據(jù)), 元數(shù)據(jù)很容易在各部分之間進(jìn)行交換和共享。一個(gè)關(guān)于數(shù)據(jù)中心的完整的模型, 從前端的數(shù)據(jù)資源,到轉(zhuǎn)換和凈化,再到終端用戶(hù)分析,再到數(shù)據(jù)倉(cāng)庫(kù)管理,都 能用CW啲元模型來(lái)建立。公共元模型, 作為基于模型的元數(shù)據(jù)集成方法的核心, 必須依照一定的形式化規(guī) 則(一種抽象語(yǔ)言)來(lái)建立,以確保所有的軟件都能用相同的、預(yù)期的方式對(duì)其進(jìn)行解釋。對(duì)CWM而言,OMG勺元對(duì)象設(shè)施MOf提供了所需的形式化規(guī)則集。MOF 是為元模型規(guī)范定義公共抽象語(yǔ)言的一種 0M(標(biāo)準(zhǔn)。MOF本質(zhì)上是一種元-元模 型,或者說(shuō)是元模型的模型(有時(shí)候稱(chēng)為本體( ontology ),它定義了對(duì)離散 系
46、統(tǒng)建模要用到的元模型中的基本元素、語(yǔ)法和結(jié)構(gòu)。MOF是UML和CW啲公共模型,M0使不同的元模型(代表不同領(lǐng)域)可以互操作。遵循 MOF規(guī)范的應(yīng)用 軟件一點(diǎn)也不了解某個(gè)模型實(shí)例與特定領(lǐng)域相關(guān)的接口的情況, 但是它仍然能夠 通過(guò)使用反射接口的通用操作對(duì)該模型進(jìn)行讀取和更新的操作。MOF 勺語(yǔ)義一般定義了支持模型創(chuàng)建、發(fā)現(xiàn)、轉(zhuǎn)換和更新的某些元數(shù)據(jù)庫(kù)服務(wù)。 特別的,MOF定義了模型生命周期的語(yǔ)義。模型生命周期定義了關(guān)于元數(shù)據(jù)的創(chuàng) 建和發(fā)布的有效操作,特別是結(jié)合到可視化建模的時(shí)候 (例如,面向UML建模的 工具)。例如,新開(kāi)發(fā)的元模型可以存儲(chǔ)在 MO存儲(chǔ)庫(kù)中,并與其它以存在的元 模型結(jié)合起來(lái)使用。一個(gè)
47、支持MOF勺存儲(chǔ)庫(kù)除了負(fù)責(zé)元數(shù)據(jù)的創(chuàng)建和獲取, 還提 供了很多重要的元數(shù)據(jù)相關(guān)服務(wù)(例如持續(xù)化、版本控制、查詢(xún)等)。總而言之,MOF式圖給出建立元對(duì)象模型的統(tǒng)一規(guī)范,其主要活動(dòng)是描述元對(duì)象 和建立元對(duì)象模型, 以便通過(guò)共享元數(shù)據(jù), 達(dá)到不同操作系統(tǒng)的、 不同應(yīng)用程序、 不同數(shù)據(jù)庫(kù)平臺(tái)等的互操作性的目的?;谀P偷脑獢?shù)據(jù)集成方法還要求有一個(gè)用于交換共享元數(shù)據(jù)實(shí)例的公共交換 格式,以及訪(fǎng)問(wèn)元數(shù)據(jù)的公共程序接口。 CW使用的XML互換編碼XMI是定義如 何將支持MOF勺元模型(如CWM映射到XML的一個(gè)OMGS準(zhǔn)。XMI精確定義了 在XML文檔中如何用XMLL標(biāo)簽定義CWI元模型的實(shí)例。CW元模型用
48、來(lái)定義以XML DTD形式表示的XMLL標(biāo)簽集。然后CW啲元數(shù)據(jù)(例如CWI元模型的實(shí)例)在XML 文檔中被序列化(serialized )。每個(gè)元數(shù)據(jù)的實(shí)例都作為XML元素的內(nèi)容存儲(chǔ) 起來(lái),而這些元素是由適當(dāng)?shù)脑P蜆?biāo)簽限定的。XMIXMI解決了用基于標(biāo)簽的語(yǔ)言表示對(duì)象及其關(guān)聯(lián)時(shí)面臨的許多難題。另外, 只是使用XML勺一種方法,這意味著標(biāo)簽和標(biāo)簽描述的項(xiàng)(元素內(nèi)容)可以打包 到同一個(gè)文件, 使得應(yīng)用程序能夠很容易的理解文檔內(nèi)容。 內(nèi)容的交流既是自描 述也是異步的,這也是基于XML和XMI的交互在分布異構(gòu)環(huán)境中為什么這么重要 的原因。對(duì)CW元數(shù)據(jù)資源的程序訪(fǎng)問(wèn)是由從支持 M0的元模型到各種編程
49、語(yǔ)言的映射標(biāo) 準(zhǔn)來(lái)定義的。M0規(guī)范特別定義了從任何支持 M0的元模型,例如CWM到OMG 的IDL的映射。CW規(guī)范包含完整的IDL定義。用選定的某種語(yǔ)言(例如 Java 或C+定義程序接口,必須使用適當(dāng)目標(biāo)語(yǔ)言編譯器將CWMDL編譯為符合目標(biāo)語(yǔ)言語(yǔ)法的接口定義。最后,我們認(rèn)為一個(gè)基于模型的元數(shù)據(jù)集成解決方案還必須提供一些擴(kuò)展模型的標(biāo)準(zhǔn)方法,這對(duì)于定義CWM沒(méi)有考慮到的、與產(chǎn)品高度相關(guān)的元數(shù)據(jù)而言是必不 可少的。數(shù)據(jù)庫(kù)類(lèi)型按數(shù)據(jù)庫(kù)所服務(wù)的業(yè)務(wù)功能,可把數(shù)據(jù)庫(kù)分成如下種類(lèi)(下圖僅供參考)圖 4-14 數(shù)據(jù)庫(kù)類(lèi)型四大基礎(chǔ)數(shù)據(jù)庫(kù): 包括人口數(shù)據(jù)庫(kù)、 法人單位數(shù)據(jù)庫(kù)、 空間地理和自然資源數(shù)據(jù) 庫(kù)、以及宏觀經(jīng)濟(jì)數(shù)據(jù)庫(kù)。主題操作數(shù)據(jù)庫(kù):
溫馨提示
- 1. 本站所有資源如無(wú)特殊說(shuō)明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請(qǐng)下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請(qǐng)聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶(hù)所有。
- 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁(yè)內(nèi)容里面會(huì)有圖紙預(yù)覽,若沒(méi)有圖紙預(yù)覽就沒(méi)有圖紙。
- 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
- 5. 人人文庫(kù)網(wǎng)僅提供信息存儲(chǔ)空間,僅對(duì)用戶(hù)上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對(duì)用戶(hù)上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對(duì)任何下載內(nèi)容負(fù)責(zé)。
- 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請(qǐng)與我們聯(lián)系,我們立即糾正。
- 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶(hù)因使用這些下載資源對(duì)自己和他人造成任何形式的傷害或損失。
最新文檔
- 2025屆江西省贛州市博雅文高三第四次模擬考試英語(yǔ)試卷含解析
- 2025屆上海市金山區(qū)高三下第一次測(cè)試英語(yǔ)試題含解析
- 江蘇省南通市示范中學(xué)2025屆高考語(yǔ)文倒計(jì)時(shí)模擬卷含解析
- 2025屆皖西省示范高中聯(lián)盟高三最后一卷語(yǔ)文試卷含解析
- 2025屆濱州市重點(diǎn)中學(xué)高三3月份模擬考試語(yǔ)文試題含解析
- 2025屆吉林省蛟河市高三3月份第一次模擬考試語(yǔ)文試卷含解析
- 《保險(xiǎn)公司早會(huì)流程》課件
- 《解熱鎮(zhèn)痛藥和非甾》課件
- 北京市東城區(qū)示范校2025屆高三第二次聯(lián)考數(shù)學(xué)試卷含解析
- 2025屆貴州省盤(pán)縣四中高考語(yǔ)文四模試卷含解析
- 2024-2025學(xué)年高二上學(xué)期期末復(fù)習(xí)【第五章 一元函數(shù)的導(dǎo)數(shù)及其應(yīng)用】十一大題型歸納(拔尖篇)(含答案)
- 【MOOC】法理學(xué)-西南政法大學(xué) 中國(guó)大學(xué)慕課MOOC答案
- 2024年新湘教版七年級(jí)上冊(cè)數(shù)學(xué)教學(xué)課件 第4章 圖形的認(rèn)識(shí) 章末復(fù)習(xí)
- 2024年民用爆炸物品運(yùn)輸合同
- 遼寧省普通高中2024-2025學(xué)年高一上學(xué)期12月聯(lián)合考試語(yǔ)文試題(含答案)
- 【MOOC】大學(xué)生創(chuàng)新創(chuàng)業(yè)教育-云南大學(xué) 中國(guó)大學(xué)慕課MOOC答案
- 【MOOC】信號(hào)與系統(tǒng)-北京郵電大學(xué) 中國(guó)大學(xué)慕課MOOC答案
- 2024年商用密碼應(yīng)用安全性評(píng)估從業(yè)人員考核試題庫(kù)-上(單選題)
- 幼兒園機(jī)器人課件ppt
- 俄語(yǔ)視聽(tīng)說(shuō)基礎(chǔ)教程1
- 團(tuán)員發(fā)展過(guò)程紀(jì)實(shí)簿(2016版本)(可編輯打印標(biāo)準(zhǔn)A4)
評(píng)論
0/150
提交評(píng)論