chaer數(shù)據(jù)倉庫設(shè)計_第1頁
chaer數(shù)據(jù)倉庫設(shè)計_第2頁
chaer數(shù)據(jù)倉庫設(shè)計_第3頁
chaer數(shù)據(jù)倉庫設(shè)計_第4頁
chaer數(shù)據(jù)倉庫設(shè)計_第5頁
已閱讀5頁,還剩68頁未讀, 繼續(xù)免費(fèi)閱讀

下載本文檔

版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進(jìn)行舉報或認(rèn)領(lǐng)

文檔簡介

第三章數(shù)據(jù)倉庫設(shè)計第3章數(shù)據(jù)倉庫設(shè)計3.1數(shù)據(jù)倉庫的需求與規(guī)劃3.1.1數(shù)據(jù)庫設(shè)計方法簡述3.1.2數(shù)據(jù)倉庫開發(fā)流程3.1.3數(shù)據(jù)倉庫需求分析3.1.4數(shù)據(jù)倉庫規(guī)劃3.2建立數(shù)據(jù)倉庫3.2.1數(shù)據(jù)倉庫的平臺與結(jié)構(gòu)選擇3.2.2數(shù)據(jù)倉庫接口與中間件設(shè)計

3.2.3數(shù)據(jù)倉庫的數(shù)據(jù)抽取、加載與復(fù)制3.2.4數(shù)據(jù)倉庫邏輯模型的確定3.2.5數(shù)據(jù)倉庫物理模型的確定3.2.6數(shù)據(jù)倉庫測試3.3數(shù)據(jù)倉庫典型解決方案3.1.1數(shù)據(jù)庫設(shè)計方法簡述在相當(dāng)長的一段時期內(nèi),數(shù)據(jù)庫設(shè)計主要采用的是手工試湊方法。按照規(guī)范設(shè)計的思想,一般將數(shù)據(jù)庫設(shè)計細(xì)分為數(shù)據(jù)庫需求分析階段、數(shù)據(jù)庫概念設(shè)計階段、數(shù)據(jù)庫邏輯設(shè)計階段、數(shù)據(jù)庫物理設(shè)計階段、數(shù)據(jù)庫實(shí)施階段和數(shù)據(jù)庫運(yùn)行、維護(hù)六個階段。在數(shù)據(jù)庫實(shí)施階段,設(shè)計人員的主要工作是使用DBMS所提供的語言和宿主語言,根據(jù)數(shù)據(jù)庫邏輯設(shè)計階段和數(shù)據(jù)庫物理設(shè)計階段的成果建立數(shù)據(jù)庫,并編制和調(diào)試數(shù)據(jù)庫應(yīng)用程序。在數(shù)據(jù)庫運(yùn)行和維護(hù)階段,設(shè)計人員的主要工作是將是運(yùn)行后的數(shù)據(jù)庫正式運(yùn)行,并在運(yùn)行過程中,對數(shù)據(jù)庫所反映出的問題不斷修改、評價、調(diào)試和完善。實(shí)際上,數(shù)據(jù)庫實(shí)際步驟也包括了數(shù)據(jù)庫應(yīng)用系統(tǒng)的設(shè)計過程。有關(guān)對數(shù)據(jù)處理特性的描述中,不同的數(shù)據(jù)庫的設(shè)計過程、數(shù)據(jù)庫設(shè)計的不同階段應(yīng)該具有不同的數(shù)據(jù)模式。如在需求分析階段,應(yīng)該是用戶應(yīng)用需求模式;在概念設(shè)計階段,應(yīng)該是產(chǎn)品的概念模式;而在邏輯設(shè)計階段,則應(yīng)該是有關(guān)數(shù)據(jù)產(chǎn)品支持的數(shù)據(jù)模型。從數(shù)據(jù)倉庫的應(yīng)用角度來看,DSS分析員一般是企業(yè)的中上層管理人員,他們對決策分析的需求不能預(yù)先做出規(guī)范的說明,只能給設(shè)計人員一個抽象的(模糊的)描述。圖3-1數(shù)據(jù)庫設(shè)計步驟應(yīng)用需求(數(shù)據(jù)、處理)轉(zhuǎn)換規(guī)則、DBMS功能、優(yōu)化方法需求收集和分析設(shè)計概念結(jié)構(gòu)設(shè)計邏輯結(jié)構(gòu)數(shù)據(jù)模型優(yōu)化設(shè)計物理結(jié)構(gòu)評價設(shè)計,性能預(yù)測物理實(shí)現(xiàn)試驗(yàn)性運(yùn)行使用、維護(hù)數(shù)據(jù)庫應(yīng)用要求,DBMS詳細(xì)特征需求分析階段概念設(shè)計階段邏輯設(shè)計階段物理設(shè)計階段數(shù)據(jù)庫實(shí)施階段數(shù)據(jù)庫運(yùn)行、維護(hù)階段不滿意不滿意圖3-2數(shù)據(jù)庫結(jié)構(gòu)設(shè)計(1)設(shè)計階段設(shè)計描述數(shù)據(jù)處理需求分析數(shù)據(jù)字典、全系統(tǒng)中數(shù)據(jù)項、數(shù)據(jù)流、數(shù)據(jù)存儲的描述數(shù)據(jù)流圖和判定表(判定樹)、數(shù)據(jù)字典中處理過程的描述概念結(jié)構(gòu)設(shè)計邏輯結(jié)構(gòu)設(shè)計概念模型(E-R圖)數(shù)據(jù)字典系統(tǒng)說明書包括:A.新系統(tǒng)要求、方案和概圖B.反映新系統(tǒng)信自流的數(shù)據(jù)流圖某種數(shù)據(jù)模型關(guān)系非關(guān)系系統(tǒng)結(jié)構(gòu)圖(模塊結(jié)構(gòu))圖3-2數(shù)數(shù)據(jù)據(jù)庫結(jié)結(jié)構(gòu)設(shè)設(shè)計((2))物理設(shè)計實(shí)施階段運(yùn)行維護(hù)性能監(jiān)監(jiān)測、、轉(zhuǎn)儲儲/恢恢復(fù)數(shù)據(jù)庫庫重組組和重重構(gòu)新舊系系統(tǒng)轉(zhuǎn)轉(zhuǎn)換、、運(yùn)行行、維維護(hù)((修正正性、、適應(yīng)性、、改善善性維維護(hù)))存儲安安排方法選選擇存取路路徑建建立分區(qū)1分區(qū)2模塊設(shè)設(shè)計IPO表IPO表………輸入::輸出::處理:編寫模式式裝入數(shù)據(jù)據(jù)數(shù)據(jù)庫試試運(yùn)行Creat…..Load……程序編碼碼、編譯聯(lián)結(jié)結(jié)、測試試Main()……If………Then……end圖3-3數(shù)據(jù)據(jù)庫的不不同模式式應(yīng)用要求求應(yīng)用要求求應(yīng)用要求求應(yīng)用要求求概念模式邏輯模式外模式外模式外模式外模式內(nèi)模式應(yīng)用1應(yīng)用2應(yīng)用3應(yīng)用4應(yīng)用1應(yīng)用2應(yīng)用3應(yīng)用4綜合轉(zhuǎn)換映象映象數(shù)數(shù)據(jù)據(jù)倉庫開開發(fā)流程程設(shè)計和建建立數(shù)據(jù)據(jù)倉庫應(yīng)應(yīng)采取工工程管理理的方式式進(jìn)行。。1.數(shù)據(jù)據(jù)倉庫系系統(tǒng)的4個階段段(1)設(shè)設(shè)想階段段:在數(shù)數(shù)據(jù)倉庫庫設(shè)想階階段,一一般是為為了適應(yīng)應(yīng)特定的的商業(yè)應(yīng)應(yīng)用提出出數(shù)據(jù)倉倉庫系統(tǒng)統(tǒng)的發(fā)展展前景。。(2)規(guī)規(guī)劃和成成長階段段:此階階段為開開展商業(yè)業(yè)活動。。(3)控制制階段::在這個個階段要要用控制制和整合合的辦法法將應(yīng)用用系統(tǒng)整整合,把把聚焦點(diǎn)點(diǎn)正確地地轉(zhuǎn)移到到“集中中化方法法”上,,以求在在企業(yè)級級的真正正數(shù)據(jù)倉倉庫中,,為企業(yè)業(yè)決策分分析提供供強(qiáng)有力力的支持持,從而而將多個個數(shù)據(jù)倉倉庫結(jié)合合起來,,形成一一個決策策支持環(huán)環(huán)境。(4)穩(wěn)穩(wěn)定階段段:主要要任務(wù)是是在使用用決策支支持和數(shù)數(shù)據(jù)倉庫庫過程中中不斷的的改進(jìn),,是數(shù)據(jù)據(jù)倉庫逐逐漸成熟熟。2.數(shù)數(shù)據(jù)倉倉庫的開開發(fā)流程程(1)數(shù)數(shù)據(jù)倉庫庫規(guī)劃分分析階段段,在該該階段的的工作內(nèi)內(nèi)容主要要包括::A.分析析數(shù)據(jù)倉倉庫應(yīng)用用環(huán)境,,調(diào)查數(shù)數(shù)據(jù)倉庫庫開發(fā)需需求,完完成數(shù)據(jù)據(jù)倉庫的的開發(fā)規(guī)規(guī)劃。B.建立立包括實(shí)實(shí)體關(guān)系系圖、星星型模型型、雪花花模型、、元數(shù)據(jù)據(jù)模型以以及數(shù)據(jù)據(jù)源分析析的主題題區(qū)數(shù)據(jù)據(jù)模型,,并根據(jù)據(jù)主題區(qū)區(qū)數(shù)據(jù)模模型開發(fā)發(fā)數(shù)據(jù)倉倉庫邏輯輯的模型型。(2)數(shù)數(shù)據(jù)倉庫庫設(shè)計實(shí)實(shí)施階段段,在該該階段的的工作內(nèi)內(nèi)容主要要包括::A.按照照數(shù)據(jù)倉倉庫的邏邏輯模型型設(shè)計數(shù)數(shù)據(jù)倉庫庫的體系系結(jié)構(gòu)。。B.設(shè)計計數(shù)據(jù)倉倉庫的物物理數(shù)據(jù)據(jù)庫。C.用物物理數(shù)據(jù)據(jù)庫元數(shù)數(shù)據(jù)填充充面向最最終用戶戶的元數(shù)數(shù)據(jù)庫。。D.對數(shù)數(shù)據(jù)倉庫庫中每個個目標(biāo)字字段確認(rèn)認(rèn)其在業(yè)業(yè)務(wù)系統(tǒng)統(tǒng)或外部部數(shù)據(jù)源源中的數(shù)數(shù)據(jù)來源源。E.開發(fā)發(fā)(或購購買)用用于抽取取、清潔潔、交換換和合并并數(shù)據(jù)等等中間件件的程序序。F.將數(shù)數(shù)據(jù)從現(xiàn)現(xiàn)有系統(tǒng)統(tǒng)中傳送送到倉庫庫中。(3)數(shù)數(shù)據(jù)倉庫庫的使用用維護(hù)階階段,在在該階段段的工作作內(nèi)容主主要包括括:A.將數(shù)數(shù)據(jù)倉庫庫投入實(shí)實(shí)際應(yīng)用用,并在在應(yīng)用中中改進(jìn)和和維護(hù)數(shù)數(shù)據(jù)倉庫庫。B.對數(shù)數(shù)據(jù)倉庫庫進(jìn)行效效益評價價,以為為下一個個循環(huán)提提供依據(jù)據(jù)。圖3-4數(shù)據(jù)據(jù)倉庫的的生命周周期開發(fā)發(fā)應(yīng)用全全過程開發(fā)概念模型規(guī)劃與確定需求數(shù)據(jù)倉庫評價數(shù)據(jù)倉庫維護(hù)數(shù)據(jù)倉庫應(yīng)用填充與測試數(shù)據(jù)倉庫開發(fā)中間件確定數(shù)據(jù)抽取源數(shù)據(jù)庫與元數(shù)據(jù)設(shè)計設(shè)計體系結(jié)構(gòu)開發(fā)邏輯模型數(shù)據(jù)倉庫庫開發(fā)過程程規(guī)劃分析階段段設(shè)計實(shí)施階段使用維護(hù)護(hù)階段3.數(shù)數(shù)據(jù)倉倉庫的開開發(fā)特點(diǎn)點(diǎn)數(shù)據(jù)倉庫庫的使用用也即在在數(shù)據(jù)倉倉庫中建建立DSS應(yīng)用用。數(shù)據(jù)據(jù)倉庫的的開發(fā)特特點(diǎn)包括括:(1)數(shù)數(shù)據(jù)倉庫庫開發(fā)要要從數(shù)據(jù)據(jù)出發(fā)(2)數(shù)數(shù)據(jù)倉庫庫使用的的需求不不可能在在開發(fā)初初期就明明確(3)數(shù)數(shù)據(jù)倉庫庫的開發(fā)發(fā)是一個個不斷循循環(huán)的過過程,是是啟發(fā)式式的開發(fā)發(fā)。數(shù)數(shù)據(jù)據(jù)倉庫需需求分析析數(shù)據(jù)倉庫庫的需求求分析根根據(jù)不同同領(lǐng)域可可以劃分分為業(yè)主主(投資資者)的的需求、、設(shè)計的的需求、、開發(fā)者者的需求求和最終終用戶的的需求等等方面。。(1)業(yè)業(yè)主需求求的分析析數(shù)據(jù)倉庫庫的業(yè)主主關(guān)心的的是創(chuàng)建建數(shù)據(jù)倉倉庫的目目標(biāo),建建立數(shù)據(jù)據(jù)倉庫給給組織戰(zhàn)戰(zhàn)略帶來來的影響響,創(chuàng)建建數(shù)據(jù)倉倉庫所需需的投資資費(fèi)用以以及所具具有的應(yīng)應(yīng)用前景景。業(yè)主主常常參參與數(shù)據(jù)據(jù)倉庫概概念模型型的認(rèn)可可和評審審,批準(zhǔn)準(zhǔn)開發(fā)方方案,為為系統(tǒng)以以后的不不斷升級級和連續(xù)續(xù)投資進(jìn)進(jìn)行決策策。(2)設(shè)設(shè)計者需需求的分分析數(shù)據(jù)倉庫庫設(shè)計者者不但要要收集業(yè)業(yè)主對數(shù)數(shù)據(jù)倉庫庫的需求求,還要要收集實(shí)實(shí)現(xiàn)這些些需求所所需的技技術(shù)要求求。設(shè)計計者介于于投資者者和實(shí)現(xiàn)現(xiàn)者之間間。企業(yè)結(jié)構(gòu)構(gòu)規(guī)劃((EAP)法是是用于結(jié)結(jié)構(gòu)設(shè)計計的一種種最有效效的方法法,在該該法中,,設(shè)計者者可以實(shí)實(shí)現(xiàn)以下下3種結(jié)結(jié)構(gòu)。A.數(shù)據(jù)據(jù)結(jié)構(gòu)。。B.應(yīng)用用程序結(jié)結(jié)構(gòu)。C.技術(shù)術(shù)結(jié)構(gòu)。。(3)開開發(fā)者需需求的分分析開發(fā)者者負(fù)責(zé)責(zé)數(shù)據(jù)據(jù)倉庫庫各個個構(gòu)件件的物物理安安裝和和集成成。開發(fā)者者需求求進(jìn)一一步包包括如如下四四個方方面::A.技技術(shù)需需求B.試試用需需求C.數(shù)數(shù)據(jù)倉倉庫產(chǎn)產(chǎn)品就就緒需需求D.開開發(fā)與與使用用人員員及其其技術(shù)術(shù)需求求(4))最終終用戶戶需求求的分分析數(shù)據(jù)倉倉庫相相對最最終用用戶而而言是是一個個黑箱箱,他他們只只能通通過查查詢、、報表表工具具和數(shù)數(shù)據(jù)倉倉庫內(nèi)內(nèi)部信信息的的某種種影射射關(guān)系系來訪訪問數(shù)數(shù)據(jù)倉倉庫內(nèi)內(nèi)部數(shù)數(shù)據(jù)。。因而而,最最終用用戶的的需求求主要要體現(xiàn)現(xiàn)在對對工作作流程程的分分析、、決策策的查查詢需需求、、報表表需求求、操操作需需求和和數(shù)據(jù)據(jù)需求求等方方面。。同時時,在在進(jìn)行行數(shù)據(jù)據(jù)倉庫庫的最最終用用戶需需求分分析時時,還還需要要對數(shù)數(shù)據(jù)倉倉庫的的主題題域、、信息息的粒粒度、、數(shù)據(jù)據(jù)倉庫庫的維維度進(jìn)進(jìn)行分分析。。數(shù)數(shù)據(jù)據(jù)倉庫庫規(guī)劃劃1.項項目開開發(fā)小小組(1))項目目開發(fā)發(fā)小組組概述述:不是所所有的的團(tuán)體體都是是小組組。一一個團(tuán)團(tuán)體要要作為為一個個小組組成功功地運(yùn)運(yùn)作,,必須須具備備三個個基本本的條條件::A.要要完成成的任任務(wù)必必須清清楚明明確。。B.小小組必必須是是明確確確定定的。。C.小小組必必須對對它的的項目目有自自始至至終的的控制制。建立高高效小小組的的四項項基本本原則則是內(nèi)內(nèi)聚力力、目目標(biāo)、、反饋饋和共共同工工作框框架。。(2))創(chuàng)建建項目目開發(fā)發(fā)小組組當(dāng)小組組開始始成為為整體體的時時候,,他們們首先先要確確定和和接受受一系系列共共同的的目標(biāo)標(biāo)。確立目目標(biāo)后后要做做的第第一件件事就就是明明確責(zé)責(zé)任。。沒有明明確的的職責(zé)責(zé)分工工,就就、小小組就就要花花一些些時間間去搞搞清楚楚什么么事情情必須須做、、決定定誰來來做哪哪一件件工作作、決決定什什么時時候做做和怎怎樣去去做。。小組確確定了了目標(biāo)標(biāo)、分分派好好角色色后,,就要要確定定一個個達(dá)到到目標(biāo)標(biāo)的戰(zhàn)戰(zhàn)略了了。小組成成員接接著再再確定定他們們將要要用來來開始始工作作的資資料,,并將將其存存檔。。小組成成員們們都很很忙,,他們們可能能沒有有多少少時間間來聚聚在一一起,,這就就破壞壞了小小組工工作的的一個個關(guān)鍵鍵———交流流。2.項項目開開發(fā)小小組對對數(shù)據(jù)據(jù)倉庫庫規(guī)劃劃與其他他項目目一樣樣,一一個好好的計計劃能能帶來來有效效的開開端,,數(shù)據(jù)據(jù)倉庫庫項目目開發(fā)發(fā)小組組必須須要對對即將將開發(fā)發(fā)的數(shù)數(shù)據(jù)倉倉庫項項目進(jìn)進(jìn)行整整體規(guī)規(guī)劃,,作出出項目目開發(fā)發(fā)計劃劃書,,以使使項目目變得得易于于理解解。表3-1數(shù)數(shù)據(jù)據(jù)倉庫庫項目目對照照表(1)項目目1項目目2業(yè)務(wù)驅(qū)驅(qū)動因因素競爭性性的市市場使使一家家金融融組織織認(rèn)識識到,,它必須開開始利利用其其日常?;顒觿又邪牡拇罅苛啃畔ⅰ?。企業(yè)業(yè)的資資產(chǎn)很很多,,但它它沒有有預(yù)測測其信用用卡使使用狀狀況和和利潤潤率的的能力力一家財財產(chǎn)和和事故故保險險公司司無法法為有有多張張保險單和和復(fù)雜雜保險險險種種的顧顧客傳傳遞統(tǒng)統(tǒng)一的的結(jié)賬數(shù)據(jù)據(jù)。因因此要要求將將多個個來源源中的的數(shù)據(jù)據(jù)與一個能能生成成統(tǒng)一一報表表和進(jìn)進(jìn)行用用戶查查詢的的數(shù)據(jù)模型型對應(yīng)應(yīng)起來來數(shù)據(jù)范范圍一個主主題區(qū)區(qū)“信信用卡卡”多個主主題區(qū)區(qū),包包括““收入入”、、“賠賠款””和“顧顧客””業(yè)務(wù)原原因向接受受該銀銀行信信用卡卡的組組織宣宣傳信信用卡卡(如趨勢勢、人人口統(tǒng)統(tǒng)計特特征等等)的的決策策支持持項目業(yè)務(wù)支支持,,數(shù)據(jù)據(jù)合并并分類戰(zhàn)略性性的戰(zhàn)術(shù)性性的時間范范圍3-6個月月的增增加業(yè)業(yè)務(wù)價價值6-9個月月取得得初步步成果果技術(shù)范范圍公司近近期政政策要要求把把所有有新的的商務(wù)務(wù)軟件件都放放在在客客戶戶機(jī)機(jī)/服服務(wù)務(wù)器器體體系系結(jié)結(jié)構(gòu)構(gòu)上上用現(xiàn)現(xiàn)在在技技術(shù)術(shù)迅迅速速產(chǎn)產(chǎn)生生結(jié)結(jié)果果,,以以后后可可以以加入入新新技技術(shù)術(shù)表3-1數(shù)數(shù)據(jù)據(jù)倉倉庫庫項項目目對對照照表表((2))項目目方方法法高度度循循環(huán)環(huán)性性的的DW開開發(fā)發(fā)項目目每每六六個個月月交交付付一一次次成成果果,,然然后后繼繼續(xù)續(xù)逐步步交交付付結(jié)結(jié)果果假設(shè)設(shè)/約約束束可以以得得到到優(yōu)優(yōu)秀秀的的員員工工;;最最終終用用戶戶一一開開始始就能能接接受受特特別別查查詢詢可以以得得到到優(yōu)優(yōu)秀秀員員工工角色色用戶戶項項目目代代表表項目目經(jīng)經(jīng)理理數(shù)據(jù)據(jù)建建模模人人員員業(yè)務(wù)務(wù)分分析析人人員員系統(tǒng)統(tǒng)分分析析員員開發(fā)發(fā)人人員員用戶戶主題題事事務(wù)務(wù)專專家家用戶戶項項目目代代表表項目目經(jīng)經(jīng)理理數(shù)據(jù)據(jù)建建模模人人員員業(yè)務(wù)務(wù)分分析析人人員員系統(tǒng)統(tǒng)分分析析員員開發(fā)發(fā)人人員員用戶戶主題題事事務(wù)務(wù)專專家家所選選的的步步驟驟建模模決策策者者的的需需求求主題題區(qū)區(qū)分分析析源系系統(tǒng)統(tǒng)分分析析最終終用用戶戶((EU))訪訪問問方方法法設(shè)設(shè)計計EU訪訪問問方方法法界界定定EU訪訪問問方方法法開開發(fā)發(fā)交換換設(shè)設(shè)計計物理理數(shù)數(shù)據(jù)據(jù)庫庫設(shè)設(shè)計計DW開開發(fā)發(fā)DW填填充充和和實(shí)實(shí)現(xiàn)現(xiàn)建模模DSS體體系系結(jié)結(jié)構(gòu)構(gòu)決策策者者的的需需求求主題題區(qū)區(qū)分分析析源系系統(tǒng)統(tǒng)分分析析EU訪訪問問方方法法設(shè)設(shè)計計變換換設(shè)設(shè)計計物理理數(shù)數(shù)據(jù)據(jù)庫庫設(shè)設(shè)計計DW開開發(fā)發(fā)DW填填充充和和實(shí)實(shí)現(xiàn)現(xiàn)除了了項項目目開開發(fā)發(fā)計計劃劃書書外外,,項項目目開開發(fā)發(fā)小小組組的的項項目目規(guī)規(guī)劃劃活活動動還還將將產(chǎn)產(chǎn)生生::A.文文檔檔化化的的業(yè)業(yè)務(wù)務(wù)驅(qū)驅(qū)動動因因素素。。B.數(shù)數(shù)據(jù)據(jù)范范圍圍。。C.時時間間范范圍圍。。D.業(yè)業(yè)務(wù)務(wù)原原因因。。E.總總體體方方法法。。F.參參與與者者及及其其作作用用。。G.假假設(shè)設(shè)和和約約束束。。H.項項目目管管理理戰(zhàn)戰(zhàn)略略。。數(shù)數(shù)據(jù)據(jù)倉倉庫庫的的平平臺臺與與結(jié)結(jié)構(gòu)構(gòu)選選擇擇1.數(shù)數(shù)據(jù)據(jù)倉倉庫庫的的技技術(shù)術(shù)平平臺臺(1))單單層層結(jié)結(jié)構(gòu)構(gòu)::主主要要是是指指在在數(shù)數(shù)據(jù)據(jù)源源和和數(shù)數(shù)據(jù)據(jù)倉倉庫庫之之間間共共享享平平臺臺,,或或者者讓讓數(shù)數(shù)據(jù)據(jù)源源、、數(shù)數(shù)據(jù)據(jù)倉倉庫庫、、數(shù)數(shù)據(jù)據(jù)集集市市與與最最終終用用戶戶工工作作站站使使用用同同一一個個平平臺臺。。(2))客客戶戶/服服務(wù)務(wù)器器兩兩層層結(jié)結(jié)構(gòu)構(gòu)::在在這這類類結(jié)結(jié)構(gòu)構(gòu)中中,,一一層層為為客客戶戶機(jī)機(jī),,一一層層為為服服務(wù)務(wù)器器。。最最終終用用戶戶訪訪問問工工具具在在客客戶戶層層運(yùn)運(yùn)行行,,而而數(shù)數(shù)據(jù)據(jù)源源、、數(shù)數(shù)據(jù)據(jù)倉倉庫庫和和數(shù)數(shù)據(jù)據(jù)集集市市位位于于服服務(wù)務(wù)器器上上。。該該技技術(shù)術(shù)結(jié)結(jié)構(gòu)構(gòu)一一般般用用于于普普通通規(guī)規(guī)模模的的數(shù)數(shù)據(jù)據(jù)倉倉庫庫。。(3)三三層客戶戶/服務(wù)務(wù)器結(jié)構(gòu)構(gòu):這類類結(jié)構(gòu)包包括基于于工作站站的客戶戶層、基基于服務(wù)務(wù)器的中中間層和和基于主主機(jī)的第第三層。。主機(jī)((宿主))層負(fù)責(zé)責(zé)管理數(shù)數(shù)據(jù)源和和可選的的源數(shù)據(jù)據(jù)轉(zhuǎn)換;;服務(wù)器器運(yùn)行數(shù)數(shù)據(jù)倉庫庫和數(shù)據(jù)據(jù)集市軟軟件,并并存儲倉倉庫的數(shù)數(shù)據(jù);客客戶工作作站運(yùn)行行查詢和和報表運(yùn)運(yùn)用程序序,且還還可以存存儲從數(shù)數(shù)據(jù)集市市或數(shù)據(jù)據(jù)倉庫卸卸載的局局部數(shù)據(jù)據(jù)。(4)多多層式結(jié)結(jié)構(gòu):這這是在三三層客戶戶/服務(wù)務(wù)器結(jié)構(gòu)構(gòu)上發(fā)展展起來的的數(shù)據(jù)倉倉庫結(jié)構(gòu)構(gòu)。2.數(shù)數(shù)據(jù)倉庫庫的體系系結(jié)構(gòu)(1)信信息獲取取層:負(fù)負(fù)責(zé)數(shù)據(jù)據(jù)的收集集、提純純、凈化化和聚合合,以及及從組織織外部數(shù)數(shù)據(jù)源和和組織的的業(yè)務(wù)處處理系統(tǒng)統(tǒng)中獲取取數(shù)據(jù)。。(2)信信息存儲儲層:提提供包含含時點(diǎn)信信息的單單一邏輯輯信息,,這種數(shù)數(shù)據(jù)通常常以最分分散的方方式存放放——需需要盡可可能使物物理設(shè)計計符合數(shù)數(shù)據(jù)模型型,這對對最終產(chǎn)產(chǎn)生滿足足各種設(shè)設(shè)計要求求的靈活活性是十十分重要要。(3)信信息傳遞遞層:是是數(shù)據(jù)倉倉庫結(jié)構(gòu)構(gòu)中支持持一套共共用的表表示工具具和分析析工具的的組成部部分。3.數(shù)據(jù)據(jù)倉庫的的數(shù)據(jù)庫庫設(shè)計數(shù)據(jù)倉庫庫的數(shù)據(jù)據(jù)庫主要要包含存存儲用戶戶進(jìn)行決決策分析析的數(shù)據(jù)據(jù)庫和描描繪數(shù)據(jù)據(jù)的元數(shù)數(shù)據(jù)庫。。存儲用戶戶分析數(shù)數(shù)據(jù)的數(shù)數(shù)據(jù)庫可可以采用用關(guān)系型型數(shù)據(jù)庫庫、多維維數(shù)據(jù)庫庫和對象象數(shù)據(jù)庫庫實(shí)現(xiàn)。。元數(shù)據(jù)庫庫是數(shù)據(jù)據(jù)倉庫的的靈魂。。沒有元元數(shù)據(jù)庫庫,用戶戶就無法法對數(shù)據(jù)據(jù)倉庫數(shù)數(shù)據(jù)進(jìn)行行良好的的定義、、組織和和管理。。數(shù)數(shù)據(jù)據(jù)倉庫接接口與中中間件設(shè)設(shè)計1.數(shù)據(jù)據(jù)倉庫的的數(shù)據(jù)源源確定以以及與業(yè)業(yè)務(wù)處理理系統(tǒng)接接口的設(shè)設(shè)計(1)數(shù)數(shù)據(jù)倉庫庫的數(shù)據(jù)據(jù)源確定定要為數(shù)據(jù)據(jù)倉庫從從數(shù)據(jù)源源中抽取取為管理理決策分分析所使使用的數(shù)數(shù)據(jù)源,,首先要要對所抽抽取的數(shù)數(shù)據(jù)源進(jìn)進(jìn)行正確確的定義義。數(shù)據(jù)據(jù)源的定定義要確確定數(shù)據(jù)據(jù)倉庫主主題所需需各數(shù)據(jù)據(jù)源的詳詳細(xì)情況況,包括括數(shù)據(jù)源源所在計計算機(jī)平平臺、擁擁有者、、數(shù)據(jù)結(jié)結(jié)構(gòu)、使使用該數(shù)數(shù)據(jù)源的的處理過過程、數(shù)數(shù)據(jù)倉庫庫更新計計劃等。。為了保證證數(shù)據(jù)的的更新需需要,還還需要為為數(shù)據(jù)倉倉庫中的的每個目目標(biāo)列確確認(rèn)它在在業(yè)務(wù)系系統(tǒng)或外外部數(shù)據(jù)據(jù)源中的的數(shù)據(jù)來來源規(guī)則則,以便便利用數(shù)數(shù)據(jù)獲取取中間件件,從源源系統(tǒng)中中獲取數(shù)數(shù)據(jù),并并加載到到數(shù)據(jù)倉倉庫中。。(2)數(shù)數(shù)據(jù)倉庫庫與業(yè)務(wù)務(wù)處理系系統(tǒng)的接接口設(shè)計計在確定了了數(shù)據(jù)倉倉庫的數(shù)數(shù)據(jù)源以以后,就就需要考考慮數(shù)據(jù)據(jù)倉庫與與作為數(shù)數(shù)據(jù)源的的業(yè)務(wù)處處理系統(tǒng)統(tǒng)的接口口設(shè)計。。由于業(yè)務(wù)務(wù)處理系系統(tǒng)環(huán)境境小,各各個應(yīng)用用系統(tǒng)都都有自己己獨(dú)立的的、特殊殊的需求求,在各各自的過過程中沒沒有考慮慮到以后后與其他他系統(tǒng)的的集成問問題,在在其基礎(chǔ)礎(chǔ)上建立立的數(shù)據(jù)據(jù)倉庫需需要完成成與業(yè)務(wù)務(wù)處理系系統(tǒng)接口口的設(shè)計計,所以以設(shè)計的的接口應(yīng)應(yīng)該具有有這樣一一些功能能:A.從面面向應(yīng)用用和操作作環(huán)境生生成完整整的數(shù)據(jù)據(jù)。B.數(shù)據(jù)據(jù)基于時時間的轉(zhuǎn)轉(zhuǎn)換。C.數(shù)據(jù)據(jù)的聚集集。D.對現(xiàn)現(xiàn)有數(shù)據(jù)據(jù)系統(tǒng)的的有效掃掃描,以以便今后后數(shù)據(jù)倉倉庫的數(shù)數(shù)據(jù)追加加。數(shù)據(jù)追加加的方法法主要有有:A.對操操作型數(shù)數(shù)據(jù)打上上時間戳戳。B.使用用系統(tǒng)日日志或?qū)弻徲嬋罩局尽.修改改程序代代碼。D.使用用前映像像或后映映像文件件。2.數(shù)數(shù)據(jù)倉倉庫的中中間件設(shè)設(shè)計(1)拷拷貝中間間件,主主要有如如下4種種:A.代碼碼發(fā)生器器。B.數(shù)據(jù)據(jù)復(fù)制工工具。C.數(shù)據(jù)據(jù)泵。D.廣義義數(shù)據(jù)獲獲取工具具和設(shè)備備。(2)用用于數(shù)據(jù)據(jù)庫訪問問的網(wǎng)關(guān)關(guān)中間件件:主要要用于解解決數(shù)據(jù)據(jù)倉庫與與數(shù)據(jù)源源和客戶戶端之間間的網(wǎng)絡(luò)絡(luò)協(xié)議不不同所造造成的數(shù)數(shù)據(jù)傳輸輸困難的的問題。。(3)對對數(shù)據(jù)倉倉庫進(jìn)行行監(jiān)控的的中間件件:主要要用于對對數(shù)據(jù)倉倉庫的應(yīng)應(yīng)用選擇擇適當(dāng)?shù)牡馁Y源,,如可以以根據(jù)系系統(tǒng)的負(fù)負(fù)載選擇擇恰當(dāng)?shù)牡挠嬎銠C(jī)機(jī)完成數(shù)數(shù)據(jù)庫事事務(wù);如如果有的的計算機(jī)機(jī)不可用用,可以以自動選選擇可用用的計算算機(jī)進(jìn)行行事務(wù)處處理;可可以根據(jù)據(jù)用戶對對數(shù)據(jù)倉倉庫的使使用頻率率以及數(shù)數(shù)據(jù)量來來調(diào)整數(shù)數(shù)據(jù)倉庫庫。數(shù)數(shù)據(jù)倉庫庫的數(shù)據(jù)據(jù)抽取、、加載與與復(fù)制1.數(shù)據(jù)據(jù)倉庫的的數(shù)據(jù)抽抽取數(shù)據(jù)倉庫庫的數(shù)據(jù)據(jù)抽取是是數(shù)據(jù)倉倉庫成功功的關(guān)鍵鍵?!袄M(jìn),,垃圾出出”的原原則說明明了數(shù)據(jù)據(jù)抽取的的重要性性。在操操作數(shù)據(jù)據(jù)上執(zhí)行行的數(shù)據(jù)據(jù)抽取,,應(yīng)該依依據(jù)元數(shù)數(shù)據(jù)中定定義的標(biāo)標(biāo)準(zhǔn)數(shù)據(jù)據(jù)格式處處理數(shù)據(jù)據(jù)。在抽抽取過程程中,應(yīng)應(yīng)該在將將數(shù)據(jù)傳傳遞到數(shù)數(shù)據(jù)倉庫庫系統(tǒng)之之前,從從元數(shù)據(jù)據(jù)存儲中中讀到這這種域定定義,將將數(shù)據(jù)轉(zhuǎn)轉(zhuǎn)換或修修補(bǔ)以適適合新標(biāo)標(biāo)準(zhǔn)。數(shù)據(jù)的抽抽取處理理實(shí)際上上被個別別情況所所驅(qū)動。。2.數(shù)數(shù)據(jù)倉庫庫的數(shù)據(jù)據(jù)加載在數(shù)據(jù)被被抽取后后,可把把數(shù)據(jù)加加載到數(shù)數(shù)據(jù)倉庫庫中。數(shù)數(shù)據(jù)加載載之前,,首先需需要對準(zhǔn)準(zhǔn)備加載載的數(shù)據(jù)據(jù)進(jìn)行清清理,即即對數(shù)據(jù)據(jù)按照標(biāo)標(biāo)準(zhǔn)進(jìn)行行格式化化處理,,這些清清理工作作可在一一個專門門的數(shù)據(jù)據(jù)清理區(qū)區(qū)或數(shù)據(jù)據(jù)準(zhǔn)備區(qū)區(qū)內(nèi)進(jìn)行行。數(shù)據(jù)清理理工作必必須嚴(yán)格格依據(jù)元元數(shù)據(jù)的的定義進(jìn)進(jìn)行,一一旦數(shù)據(jù)據(jù)清理結(jié)結(jié)束,則則將經(jīng)過過凈化和和轉(zhuǎn)換的的數(shù)據(jù)加加載到合合適的數(shù)數(shù)據(jù)倉庫庫事實(shí)表表中。在在數(shù)據(jù)加加載后,,還要更更新元數(shù)數(shù)據(jù)倉庫庫中的元元數(shù)據(jù),,以反映映剛完成成的數(shù)據(jù)據(jù)加載活活動,并并對受影影響的概概括數(shù)據(jù)據(jù)重新概概括處理理。3.數(shù)數(shù)據(jù)據(jù)倉庫庫數(shù)據(jù)據(jù)的復(fù)復(fù)制與與發(fā)行行一個完完整的的復(fù)制制結(jié)構(gòu)構(gòu)應(yīng)能能完成成以下下的復(fù)復(fù)雜任任務(wù)::.A.不不會受受到系系統(tǒng)失失敗等等問題題的影影響,,保證證提供供可靠靠的數(shù)數(shù)據(jù)復(fù)復(fù)制。。B.只只傳送送符合合數(shù)據(jù)據(jù)完整整性規(guī)規(guī)則的的一致致數(shù)據(jù)據(jù)。C.可可優(yōu)化化傳送送過程程,減減少在在捕獲獲或修修改數(shù)數(shù)據(jù)和和復(fù)制制品作作為結(jié)結(jié)果傳傳送之之間的的時間間。技術(shù)和和數(shù)據(jù)據(jù)結(jié)構(gòu)構(gòu)應(yīng)保保證數(shù)數(shù)據(jù)發(fā)發(fā)行系系統(tǒng)完完成以以下的的功能能:A.保保證數(shù)數(shù)據(jù)發(fā)發(fā)行以以適時時和有有效的的方式式進(jìn)行行。B.保保證只只發(fā)送送被排排序的的數(shù)據(jù)據(jù)。C.建建立正正確的的和所所需要要的服服務(wù)水水平標(biāo)標(biāo)準(zhǔn)。。數(shù)數(shù)據(jù)倉倉庫邏邏輯模模型的的確定定對數(shù)據(jù)據(jù)倉庫庫邏輯輯模型型的確確定要要涉及及數(shù)據(jù)據(jù)倉庫庫粒度度劃分分、數(shù)數(shù)據(jù)分分割策策略及及關(guān)系系模型型定義義等內(nèi)內(nèi)容。。1.數(shù)數(shù)據(jù)倉倉庫粒粒度劃劃分::數(shù)據(jù)據(jù)倉庫庫的邏邏輯設(shè)設(shè)計中中需要要解決決的一一個重重要問問題是是決定定數(shù)據(jù)據(jù)倉庫庫粒度度的層層次劃劃分;;粒度度層次次的劃劃分適適當(dāng)與與否直直接影影響到到數(shù)據(jù)據(jù)倉庫庫中要要存儲儲的數(shù)數(shù)據(jù)量量和查查詢方方法。。2.確確定數(shù)數(shù)據(jù)分分割策策略::數(shù)據(jù)據(jù)分割割是指指把邏邏輯上上整體體的數(shù)數(shù)據(jù)分分割成成較小小的、、可以以獨(dú)立立管理理的物物理單單元進(jìn)進(jìn)行存存儲的的方法法。使使用數(shù)數(shù)據(jù)分分割便便于數(shù)數(shù)據(jù)的的重構(gòu)構(gòu)、重重組和和恢復(fù)復(fù),從從而提提高創(chuàng)創(chuàng)建索索引和和順序序掃描描的效效率。。使用用數(shù)據(jù)據(jù)分割割的同同時也也可有有效地地支持持?jǐn)?shù)據(jù)據(jù)概括括。在設(shè)計計數(shù)據(jù)據(jù)倉庫庫的數(shù)數(shù)據(jù)分分割時時,最最主要要的是是選擇擇適當(dāng)當(dāng)?shù)姆址指顦?biāo)標(biāo)準(zhǔn)。。選擇擇適當(dāng)當(dāng)?shù)臄?shù)數(shù)據(jù)分分割標(biāo)標(biāo)準(zhǔn)一一般需需要考考慮以以下三三個方方面的的因素素。(1))數(shù)據(jù)據(jù)量::數(shù)據(jù)據(jù)量的的大小小是決決定是是否進(jìn)進(jìn)行數(shù)數(shù)據(jù)分分割和和如何何分割割的主主要因因素。。(2))數(shù)據(jù)據(jù)分析析處理理的對對象::數(shù)據(jù)據(jù)分割割是與與數(shù)據(jù)據(jù)處理理的對對象緊緊密聯(lián)聯(lián)系的的,不不同主主題內(nèi)內(nèi)數(shù)據(jù)據(jù)分割割的標(biāo)標(biāo)準(zhǔn)不不同。。(3)粒粒度分分割的的策略略:進(jìn)進(jìn)行數(shù)數(shù)據(jù)分分割設(shè)設(shè)計時時,更更重要要的是是將數(shù)數(shù)據(jù)分分割標(biāo)標(biāo)準(zhǔn)與與粒度度層次次的劃劃分策策略統(tǒng)統(tǒng)一起起來。。3.關(guān)關(guān)系模模型定定義無論數(shù)數(shù)據(jù)倉倉庫的的概念念模型型是ER模模型、、星型型模型型還是是雪花花模型型,其其最后后的物物理實(shí)實(shí)現(xiàn)必必然是是以各各種表表來完完成的的。這這些表表有的的是由由指標(biāo)標(biāo)實(shí)體體轉(zhuǎn)換換而成成,有有的是是由維維實(shí)體體而來來,有有的是是從詳詳細(xì)類類別實(shí)實(shí)體所所來。。指標(biāo)實(shí)實(shí)體在在轉(zhuǎn)換換成事事實(shí)表表時,,往往往會形形成多多個事事實(shí)表表。4.數(shù)數(shù)據(jù)倉倉庫的的實(shí)體體定義義在設(shè)計計邏輯輯模型型時,,必須須對邏邏輯模模型中中的每每個實(shí)實(shí)體進(jìn)進(jìn)行具具有的的定義義。在在定義義之前前必須須明確確實(shí)體體究竟竟是另另一個個實(shí)體體的部部分還還是具具有獨(dú)獨(dú)立性性的實(shí)實(shí)體。。在邏輯輯數(shù)據(jù)據(jù)模型型中不不僅要要確定定實(shí)體體、實(shí)實(shí)體之之間的的關(guān)系系和實(shí)實(shí)體所所具有有的列列,還還要進(jìn)進(jìn)一步步確定定實(shí)體體列中中的主主鍵列列,實(shí)實(shí)體之之間關(guān)關(guān)系的的外部部鍵列列,實(shí)實(shí)體物物理存存儲的的一些些特性性。要從實(shí)實(shí)體的的眾多多事實(shí)實(shí)數(shù)據(jù)據(jù)中識識別用用戶所所需要要的數(shù)數(shù)據(jù)就就需要要在不不同的的列中中選擇擇某個個可以以惟一一識別別數(shù)據(jù)據(jù)表行行的列列作為為主鍵鍵列,,主鍵鍵列通通常由由一個個或多多個列列組成成,要要求主主鍵列列必須須識別別實(shí)體體的一一個實(shí)實(shí)例。。在實(shí)體體的列列中除除了主主鍵列列的確確定外外,還還要確確定一一些侯侯選鍵鍵列和和外部部鍵列列。數(shù)數(shù)據(jù)倉倉庫物物理模模型的的確定定1.數(shù)數(shù)據(jù)倉倉庫設(shè)設(shè)計的的規(guī)范范由于在在數(shù)據(jù)據(jù)倉庫庫中包包含多多種表表、列列與域域等,,為保保證數(shù)數(shù)據(jù)倉倉庫的的設(shè)計計、實(shí)實(shí)施和和管理理保持持穩(wěn)定定,不不產(chǎn)生生混亂亂,需需要對對物理理數(shù)據(jù)據(jù)模型型中的的實(shí)體體、表表、列列等進(jìn)進(jìn)行規(guī)規(guī)范化化處理理,使使整個個數(shù)據(jù)據(jù)倉庫庫的物物理數(shù)數(shù)據(jù)模模型能能夠保保持一一致。。數(shù)據(jù)據(jù)倉庫庫的規(guī)規(guī)范化化內(nèi)容容主要要有完完整清清晰的的數(shù)據(jù)據(jù)定義義,合合適的的數(shù)據(jù)據(jù)格式式等。。2.確確定數(shù)據(jù)結(jié)結(jié)構(gòu)的類型型在數(shù)據(jù)倉庫庫的結(jié)構(gòu)中中,可能包包含這樣一一些數(shù)據(jù)類類型的任意意組合:細(xì)細(xì)節(jié)數(shù)據(jù)、、概括數(shù)據(jù)據(jù)、外部數(shù)數(shù)據(jù)、多維維數(shù)據(jù)、數(shù)數(shù)據(jù)子集、、專門數(shù)據(jù)據(jù)緩存、復(fù)復(fù)制數(shù)據(jù)和和存檔數(shù)據(jù)據(jù)。數(shù)據(jù)倉倉庫設(shè)計人人員必須確確定符合設(shè)設(shè)計目標(biāo)的的數(shù)據(jù)結(jié)構(gòu)構(gòu)類型。在數(shù)據(jù)倉庫庫中進(jìn)行數(shù)數(shù)據(jù)非規(guī)范范化處理的的優(yōu)點(diǎn)有::A.能夠夠減少對表表聯(lián)結(jié)的需需求,提高高數(shù)據(jù)倉庫庫性能。B.能夠減減少編寫專專門決策支支持應(yīng)用程程序的必要要性,因?yàn)闉檫\(yùn)用一些些專門的查查詢工具,,可以更容容易地訪問問數(shù)據(jù)。C.可讓用用戶以直觀觀的易于理理解的工具具查看數(shù)據(jù)據(jù)。3.確定索索引策略數(shù)據(jù)倉庫的的數(shù)據(jù)量很很大,要對對數(shù)據(jù)的存存取路徑進(jìn)進(jìn)行仔細(xì)的的設(shè)計和選選擇。由于于數(shù)據(jù)倉庫庫的數(shù)據(jù)一一般很少更更新,因而而可以設(shè)計計索引結(jié)構(gòu)構(gòu)來提高數(shù)數(shù)據(jù)存取效效率。4.確定數(shù)數(shù)據(jù)存放位位置

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負(fù)責(zé)。
  • 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時也不承擔(dān)用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

最新文檔

評論

0/150

提交評論