chaer數(shù)據(jù)倉(cāng)庫(kù)設(shè)計(jì)_第1頁(yè)
chaer數(shù)據(jù)倉(cāng)庫(kù)設(shè)計(jì)_第2頁(yè)
chaer數(shù)據(jù)倉(cāng)庫(kù)設(shè)計(jì)_第3頁(yè)
chaer數(shù)據(jù)倉(cāng)庫(kù)設(shè)計(jì)_第4頁(yè)
chaer數(shù)據(jù)倉(cāng)庫(kù)設(shè)計(jì)_第5頁(yè)
已閱讀5頁(yè),還剩68頁(yè)未讀, 繼續(xù)免費(fèi)閱讀

下載本文檔

版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請(qǐng)進(jìn)行舉報(bào)或認(rèn)領(lǐng)

文檔簡(jiǎn)介

第三章數(shù)據(jù)倉(cāng)庫(kù)設(shè)計(jì)第3章數(shù)據(jù)倉(cāng)庫(kù)設(shè)計(jì)3.1數(shù)據(jù)倉(cāng)庫(kù)的需求與規(guī)劃3.1.1數(shù)據(jù)庫(kù)設(shè)計(jì)方法簡(jiǎn)述3.1.2數(shù)據(jù)倉(cāng)庫(kù)開發(fā)流程3.1.3數(shù)據(jù)倉(cāng)庫(kù)需求分析3.1.4數(shù)據(jù)倉(cāng)庫(kù)規(guī)劃3.2建立數(shù)據(jù)倉(cāng)庫(kù)3.2.1數(shù)據(jù)倉(cāng)庫(kù)的平臺(tái)與結(jié)構(gòu)選擇3.2.2數(shù)據(jù)倉(cāng)庫(kù)接口與中間件設(shè)計(jì)

3.2.3數(shù)據(jù)倉(cāng)庫(kù)的數(shù)據(jù)抽取、加載與復(fù)制3.2.4數(shù)據(jù)倉(cāng)庫(kù)邏輯模型的確定3.2.5數(shù)據(jù)倉(cāng)庫(kù)物理模型的確定3.2.6數(shù)據(jù)倉(cāng)庫(kù)測(cè)試3.3數(shù)據(jù)倉(cāng)庫(kù)典型解決方案3.1.1數(shù)據(jù)庫(kù)設(shè)計(jì)方法簡(jiǎn)述在相當(dāng)長(zhǎng)的一段時(shí)期內(nèi),數(shù)據(jù)庫(kù)設(shè)計(jì)主要采用的是手工試湊方法。按照規(guī)范設(shè)計(jì)的思想,一般將數(shù)據(jù)庫(kù)設(shè)計(jì)細(xì)分為數(shù)據(jù)庫(kù)需求分析階段、數(shù)據(jù)庫(kù)概念設(shè)計(jì)階段、數(shù)據(jù)庫(kù)邏輯設(shè)計(jì)階段、數(shù)據(jù)庫(kù)物理設(shè)計(jì)階段、數(shù)據(jù)庫(kù)實(shí)施階段和數(shù)據(jù)庫(kù)運(yùn)行、維護(hù)六個(gè)階段。在數(shù)據(jù)庫(kù)實(shí)施階段,設(shè)計(jì)人員的主要工作是使用DBMS所提供的語(yǔ)言和宿主語(yǔ)言,根據(jù)數(shù)據(jù)庫(kù)邏輯設(shè)計(jì)階段和數(shù)據(jù)庫(kù)物理設(shè)計(jì)階段的成果建立數(shù)據(jù)庫(kù),并編制和調(diào)試數(shù)據(jù)庫(kù)應(yīng)用程序。在數(shù)據(jù)庫(kù)運(yùn)行和維護(hù)階段,設(shè)計(jì)人員的主要工作是將是運(yùn)行后的數(shù)據(jù)庫(kù)正式運(yùn)行,并在運(yùn)行過程中,對(duì)數(shù)據(jù)庫(kù)所反映出的問題不斷修改、評(píng)價(jià)、調(diào)試和完善。實(shí)際上,數(shù)據(jù)庫(kù)實(shí)際步驟也包括了數(shù)據(jù)庫(kù)應(yīng)用系統(tǒng)的設(shè)計(jì)過程。有關(guān)對(duì)數(shù)據(jù)處理特性的描述中,不同的數(shù)據(jù)庫(kù)的設(shè)計(jì)過程、數(shù)據(jù)庫(kù)設(shè)計(jì)的不同階段應(yīng)該具有不同的數(shù)據(jù)模式。如在需求分析階段,應(yīng)該是用戶應(yīng)用需求模式;在概念設(shè)計(jì)階段,應(yīng)該是產(chǎn)品的概念模式;而在邏輯設(shè)計(jì)階段,則應(yīng)該是有關(guān)數(shù)據(jù)產(chǎn)品支持的數(shù)據(jù)模型。從數(shù)據(jù)倉(cāng)庫(kù)的應(yīng)用角度來看,DSS分析員一般是企業(yè)的中上層管理人員,他們對(duì)決策分析的需求不能預(yù)先做出規(guī)范的說明,只能給設(shè)計(jì)人員一個(gè)抽象的(模糊的)描述。圖3-1數(shù)據(jù)庫(kù)設(shè)計(jì)步驟應(yīng)用需求(數(shù)據(jù)、處理)轉(zhuǎn)換規(guī)則、DBMS功能、優(yōu)化方法需求收集和分析設(shè)計(jì)概念結(jié)構(gòu)設(shè)計(jì)邏輯結(jié)構(gòu)數(shù)據(jù)模型優(yōu)化設(shè)計(jì)物理結(jié)構(gòu)評(píng)價(jià)設(shè)計(jì),性能預(yù)測(cè)物理實(shí)現(xiàn)試驗(yàn)性運(yùn)行使用、維護(hù)數(shù)據(jù)庫(kù)應(yīng)用要求,DBMS詳細(xì)特征需求分析階段概念設(shè)計(jì)階段邏輯設(shè)計(jì)階段物理設(shè)計(jì)階段數(shù)據(jù)庫(kù)實(shí)施階段數(shù)據(jù)庫(kù)運(yùn)行、維護(hù)階段不滿意不滿意圖3-2數(shù)據(jù)庫(kù)結(jié)構(gòu)設(shè)計(jì)(1)設(shè)計(jì)階段設(shè)計(jì)描述數(shù)據(jù)處理需求分析數(shù)據(jù)字典、全系統(tǒng)中數(shù)據(jù)項(xiàng)、數(shù)據(jù)流、數(shù)據(jù)存儲(chǔ)的描述數(shù)據(jù)流圖和判定表(判定樹)、數(shù)據(jù)字典中處理過程的描述概念結(jié)構(gòu)設(shè)計(jì)邏輯結(jié)構(gòu)設(shè)計(jì)概念模型(E-R圖)數(shù)據(jù)字典系統(tǒng)說明書包括:A.新系統(tǒng)要求、方案和概圖B.反映新系統(tǒng)信自流的數(shù)據(jù)流圖某種數(shù)據(jù)模型關(guān)系非關(guān)系系統(tǒng)結(jié)構(gòu)圖(模塊結(jié)構(gòu))圖3-2數(shù)數(shù)據(jù)據(jù)庫(kù)結(jié)結(jié)構(gòu)設(shè)設(shè)計(jì)((2))物理設(shè)計(jì)實(shí)施階段運(yùn)行維護(hù)性能監(jiān)監(jiān)測(cè)、、轉(zhuǎn)儲(chǔ)儲(chǔ)/恢恢復(fù)數(shù)據(jù)庫(kù)庫(kù)重組組和重重構(gòu)新舊系系統(tǒng)轉(zhuǎn)轉(zhuǎn)換、、運(yùn)行行、維維護(hù)((修正正性、、適應(yīng)性、、改善善性維維護(hù)))存儲(chǔ)安安排方法選選擇存取路路徑建建立分區(qū)1分區(qū)2模塊設(shè)設(shè)計(jì)IPO表IPO表………輸入::輸出::處理:編寫模式式裝入數(shù)據(jù)據(jù)數(shù)據(jù)庫(kù)試試運(yùn)行Creat…..Load……程序編碼碼、編譯聯(lián)結(jié)結(jié)、測(cè)試試Main()……If………Then……end圖3-3數(shù)據(jù)據(jù)庫(kù)的不不同模式式應(yīng)用要求求應(yīng)用要求求應(yīng)用要求求應(yīng)用要求求概念模式邏輯模式外模式外模式外模式外模式內(nèi)模式應(yīng)用1應(yīng)用2應(yīng)用3應(yīng)用4應(yīng)用1應(yīng)用2應(yīng)用3應(yīng)用4綜合轉(zhuǎn)換映象映象數(shù)數(shù)據(jù)據(jù)倉(cāng)庫(kù)開開發(fā)流程程設(shè)計(jì)和建建立數(shù)據(jù)據(jù)倉(cāng)庫(kù)應(yīng)應(yīng)采取工工程管理理的方式式進(jìn)行。。1.數(shù)據(jù)據(jù)倉(cāng)庫(kù)系系統(tǒng)的4個(gè)階段段(1)設(shè)設(shè)想階段段:在數(shù)數(shù)據(jù)倉(cāng)庫(kù)庫(kù)設(shè)想階階段,一一般是為為了適應(yīng)應(yīng)特定的的商業(yè)應(yīng)應(yīng)用提出出數(shù)據(jù)倉(cāng)倉(cāng)庫(kù)系統(tǒng)統(tǒng)的發(fā)展展前景。。(2)規(guī)規(guī)劃和成成長(zhǎng)階段段:此階階段為開開展商業(yè)業(yè)活動(dòng)。。(3)控制制階段::在這個(gè)個(gè)階段要要用控制制和整合合的辦法法將應(yīng)用用系統(tǒng)整整合,把把聚焦點(diǎn)點(diǎn)正確地地轉(zhuǎn)移到到“集中中化方法法”上,,以求在在企業(yè)級(jí)級(jí)的真正正數(shù)據(jù)倉(cāng)倉(cāng)庫(kù)中,,為企業(yè)業(yè)決策分分析提供供強(qiáng)有力力的支持持,從而而將多個(gè)個(gè)數(shù)據(jù)倉(cāng)倉(cāng)庫(kù)結(jié)合合起來,,形成一一個(gè)決策策支持環(huán)環(huán)境。(4)穩(wěn)穩(wěn)定階段段:主要要任務(wù)是是在使用用決策支支持和數(shù)數(shù)據(jù)倉(cāng)庫(kù)庫(kù)過程中中不斷的的改進(jìn),,是數(shù)據(jù)據(jù)倉(cāng)庫(kù)逐逐漸成熟熟。2.數(shù)數(shù)據(jù)倉(cāng)倉(cāng)庫(kù)的開開發(fā)流程程(1)數(shù)數(shù)據(jù)倉(cāng)庫(kù)庫(kù)規(guī)劃分分析階段段,在該該階段的的工作內(nèi)內(nèi)容主要要包括::A.分析析數(shù)據(jù)倉(cāng)倉(cāng)庫(kù)應(yīng)用用環(huán)境,,調(diào)查數(shù)數(shù)據(jù)倉(cāng)庫(kù)庫(kù)開發(fā)需需求,完完成數(shù)據(jù)據(jù)倉(cāng)庫(kù)的的開發(fā)規(guī)規(guī)劃。B.建立立包括實(shí)實(shí)體關(guān)系系圖、星星型模型型、雪花花模型、、元數(shù)據(jù)據(jù)模型以以及數(shù)據(jù)據(jù)源分析析的主題題區(qū)數(shù)據(jù)據(jù)模型,,并根據(jù)據(jù)主題區(qū)區(qū)數(shù)據(jù)模模型開發(fā)發(fā)數(shù)據(jù)倉(cāng)倉(cāng)庫(kù)邏輯輯的模型型。(2)數(shù)數(shù)據(jù)倉(cāng)庫(kù)庫(kù)設(shè)計(jì)實(shí)實(shí)施階段段,在該該階段的的工作內(nèi)內(nèi)容主要要包括::A.按照照數(shù)據(jù)倉(cāng)倉(cāng)庫(kù)的邏邏輯模型型設(shè)計(jì)數(shù)數(shù)據(jù)倉(cāng)庫(kù)庫(kù)的體系系結(jié)構(gòu)。。B.設(shè)計(jì)計(jì)數(shù)據(jù)倉(cāng)倉(cāng)庫(kù)的物物理數(shù)據(jù)據(jù)庫(kù)。C.用物物理數(shù)據(jù)據(jù)庫(kù)元數(shù)數(shù)據(jù)填充充面向最最終用戶戶的元數(shù)數(shù)據(jù)庫(kù)。。D.對(duì)數(shù)數(shù)據(jù)倉(cāng)庫(kù)庫(kù)中每個(gè)個(gè)目標(biāo)字字段確認(rèn)認(rèn)其在業(yè)業(yè)務(wù)系統(tǒng)統(tǒng)或外部部數(shù)據(jù)源源中的數(shù)數(shù)據(jù)來源源。E.開發(fā)發(fā)(或購(gòu)購(gòu)買)用用于抽取取、清潔潔、交換換和合并并數(shù)據(jù)等等中間件件的程序序。F.將數(shù)數(shù)據(jù)從現(xiàn)現(xiàn)有系統(tǒng)統(tǒng)中傳送送到倉(cāng)庫(kù)庫(kù)中。(3)數(shù)數(shù)據(jù)倉(cāng)庫(kù)庫(kù)的使用用維護(hù)階階段,在在該階段段的工作作內(nèi)容主主要包括括:A.將數(shù)數(shù)據(jù)倉(cāng)庫(kù)庫(kù)投入實(shí)實(shí)際應(yīng)用用,并在在應(yīng)用中中改進(jìn)和和維護(hù)數(shù)數(shù)據(jù)倉(cāng)庫(kù)庫(kù)。B.對(duì)數(shù)數(shù)據(jù)倉(cāng)庫(kù)庫(kù)進(jìn)行效效益評(píng)價(jià)價(jià),以為為下一個(gè)個(gè)循環(huán)提提供依據(jù)據(jù)。圖3-4數(shù)據(jù)據(jù)倉(cāng)庫(kù)的的生命周周期開發(fā)發(fā)應(yīng)用全全過程開發(fā)概念模型規(guī)劃與確定需求數(shù)據(jù)倉(cāng)庫(kù)評(píng)價(jià)數(shù)據(jù)倉(cāng)庫(kù)維護(hù)數(shù)據(jù)倉(cāng)庫(kù)應(yīng)用填充與測(cè)試數(shù)據(jù)倉(cāng)庫(kù)開發(fā)中間件確定數(shù)據(jù)抽取源數(shù)據(jù)庫(kù)與元數(shù)據(jù)設(shè)計(jì)設(shè)計(jì)體系結(jié)構(gòu)開發(fā)邏輯模型數(shù)據(jù)倉(cāng)庫(kù)庫(kù)開發(fā)過程程規(guī)劃分析階段段設(shè)計(jì)實(shí)施階段使用維護(hù)護(hù)階段3.數(shù)數(shù)據(jù)倉(cāng)倉(cāng)庫(kù)的開開發(fā)特點(diǎn)點(diǎn)數(shù)據(jù)倉(cāng)庫(kù)庫(kù)的使用用也即在在數(shù)據(jù)倉(cāng)倉(cāng)庫(kù)中建建立DSS應(yīng)用用。數(shù)據(jù)據(jù)倉(cāng)庫(kù)的的開發(fā)特特點(diǎn)包括括:(1)數(shù)數(shù)據(jù)倉(cāng)庫(kù)庫(kù)開發(fā)要要從數(shù)據(jù)據(jù)出發(fā)(2)數(shù)數(shù)據(jù)倉(cāng)庫(kù)庫(kù)使用的的需求不不可能在在開發(fā)初初期就明明確(3)數(shù)數(shù)據(jù)倉(cāng)庫(kù)庫(kù)的開發(fā)發(fā)是一個(gè)個(gè)不斷循循環(huán)的過過程,是是啟發(fā)式式的開發(fā)發(fā)。數(shù)數(shù)據(jù)據(jù)倉(cāng)庫(kù)需需求分析析數(shù)據(jù)倉(cāng)庫(kù)庫(kù)的需求求分析根根據(jù)不同同領(lǐng)域可可以劃分分為業(yè)主主(投資資者)的的需求、、設(shè)計(jì)的的需求、、開發(fā)者者的需求求和最終終用戶的的需求等等方面。。(1)業(yè)業(yè)主需求求的分析析數(shù)據(jù)倉(cāng)庫(kù)庫(kù)的業(yè)主主關(guān)心的的是創(chuàng)建建數(shù)據(jù)倉(cāng)倉(cāng)庫(kù)的目目標(biāo),建建立數(shù)據(jù)據(jù)倉(cāng)庫(kù)給給組織戰(zhàn)戰(zhàn)略帶來來的影響響,創(chuàng)建建數(shù)據(jù)倉(cāng)倉(cāng)庫(kù)所需需的投資資費(fèi)用以以及所具具有的應(yīng)應(yīng)用前景景。業(yè)主主常常參參與數(shù)據(jù)據(jù)倉(cāng)庫(kù)概概念模型型的認(rèn)可可和評(píng)審審,批準(zhǔn)準(zhǔn)開發(fā)方方案,為為系統(tǒng)以以后的不不斷升級(jí)級(jí)和連續(xù)續(xù)投資進(jìn)進(jìn)行決策策。(2)設(shè)設(shè)計(jì)者需需求的分分析數(shù)據(jù)倉(cāng)庫(kù)庫(kù)設(shè)計(jì)者者不但要要收集業(yè)業(yè)主對(duì)數(shù)數(shù)據(jù)倉(cāng)庫(kù)庫(kù)的需求求,還要要收集實(shí)實(shí)現(xiàn)這些些需求所所需的技技術(shù)要求求。設(shè)計(jì)計(jì)者介于于投資者者和實(shí)現(xiàn)現(xiàn)者之間間。企業(yè)結(jié)構(gòu)構(gòu)規(guī)劃((EAP)法是是用于結(jié)結(jié)構(gòu)設(shè)計(jì)計(jì)的一種種最有效效的方法法,在該該法中,,設(shè)計(jì)者者可以實(shí)實(shí)現(xiàn)以下下3種結(jié)結(jié)構(gòu)。A.數(shù)據(jù)據(jù)結(jié)構(gòu)。。B.應(yīng)用用程序結(jié)結(jié)構(gòu)。C.技術(shù)術(shù)結(jié)構(gòu)。。(3)開開發(fā)者需需求的分分析開發(fā)者者負(fù)責(zé)責(zé)數(shù)據(jù)據(jù)倉(cāng)庫(kù)庫(kù)各個(gè)個(gè)構(gòu)件件的物物理安安裝和和集成成。開發(fā)者者需求求進(jìn)一一步包包括如如下四四個(gè)方方面::A.技技術(shù)需需求B.試試用需需求C.數(shù)數(shù)據(jù)倉(cāng)倉(cāng)庫(kù)產(chǎn)產(chǎn)品就就緒需需求D.開開發(fā)與與使用用人員員及其其技術(shù)術(shù)需求求(4))最終終用戶戶需求求的分分析數(shù)據(jù)倉(cāng)倉(cāng)庫(kù)相相對(duì)最最終用用戶而而言是是一個(gè)個(gè)黑箱箱,他他們只只能通通過查查詢、、報(bào)表表工具具和數(shù)數(shù)據(jù)倉(cāng)倉(cāng)庫(kù)內(nèi)內(nèi)部信信息的的某種種影射射關(guān)系系來訪訪問數(shù)數(shù)據(jù)倉(cāng)倉(cāng)庫(kù)內(nèi)內(nèi)部數(shù)數(shù)據(jù)。。因而而,最最終用用戶的的需求求主要要體現(xiàn)現(xiàn)在對(duì)對(duì)工作作流程程的分分析、、決策策的查查詢需需求、、報(bào)表表需求求、操操作需需求和和數(shù)據(jù)據(jù)需求求等方方面。。同時(shí)時(shí),在在進(jìn)行行數(shù)據(jù)據(jù)倉(cāng)庫(kù)庫(kù)的最最終用用戶需需求分分析時(shí)時(shí),還還需要要對(duì)數(shù)數(shù)據(jù)倉(cāng)倉(cāng)庫(kù)的的主題題域、、信息息的粒粒度、、數(shù)據(jù)據(jù)倉(cāng)庫(kù)庫(kù)的維維度進(jìn)進(jìn)行分分析。。數(shù)數(shù)據(jù)據(jù)倉(cāng)庫(kù)庫(kù)規(guī)劃劃1.項(xiàng)項(xiàng)目開開發(fā)小小組(1))項(xiàng)目目開發(fā)發(fā)小組組概述述:不是所所有的的團(tuán)體體都是是小組組。一一個(gè)團(tuán)團(tuán)體要要作為為一個(gè)個(gè)小組組成功功地運(yùn)運(yùn)作,,必須須具備備三個(gè)個(gè)基本本的條條件::A.要要完成成的任任務(wù)必必須清清楚明明確。。B.小小組必必須是是明確確確定定的。。C.小小組必必須對(duì)對(duì)它的的項(xiàng)目目有自自始至至終的的控制制。建立高高效小小組的的四項(xiàng)項(xiàng)基本本原則則是內(nèi)內(nèi)聚力力、目目標(biāo)、、反饋饋和共共同工工作框框架。。(2))創(chuàng)建建項(xiàng)目目開發(fā)發(fā)小組組當(dāng)小組組開始始成為為整體體的時(shí)時(shí)候,,他們們首先先要確確定和和接受受一系系列共共同的的目標(biāo)標(biāo)。確立目目標(biāo)后后要做做的第第一件件事就就是明明確責(zé)責(zé)任。。沒有明明確的的職責(zé)責(zé)分工工,就就、小小組就就要花花一些些時(shí)間間去搞搞清楚楚什么么事情情必須須做、、決定定誰(shuí)來來做哪哪一件件工作作、決決定什什么時(shí)時(shí)候做做和怎怎樣去去做。。小組確確定了了目標(biāo)標(biāo)、分分派好好角色色后,,就要要確定定一個(gè)個(gè)達(dá)到到目標(biāo)標(biāo)的戰(zhàn)戰(zhàn)略了了。小組成成員接接著再再確定定他們們將要要用來來開始始工作作的資資料,,并將將其存存檔。。小組成成員們們都很很忙,,他們們可能能沒有有多少少時(shí)間間來聚聚在一一起,,這就就破壞壞了小小組工工作的的一個(gè)個(gè)關(guān)鍵鍵———交流流。2.項(xiàng)項(xiàng)目開開發(fā)小小組對(duì)對(duì)數(shù)據(jù)據(jù)倉(cāng)庫(kù)庫(kù)規(guī)劃劃與其他他項(xiàng)目目一樣樣,一一個(gè)好好的計(jì)計(jì)劃能能帶來來有效效的開開端,,數(shù)據(jù)據(jù)倉(cāng)庫(kù)庫(kù)項(xiàng)目目開發(fā)發(fā)小組組必須須要對(duì)對(duì)即將將開發(fā)發(fā)的數(shù)數(shù)據(jù)倉(cāng)倉(cāng)庫(kù)項(xiàng)項(xiàng)目進(jìn)進(jìn)行整整體規(guī)規(guī)劃,,作出出項(xiàng)目目開發(fā)發(fā)計(jì)劃劃書,,以使使項(xiàng)目目變得得易于于理解解。表3-1數(shù)數(shù)據(jù)據(jù)倉(cāng)庫(kù)庫(kù)項(xiàng)目目對(duì)照照表(1)項(xiàng)目目1項(xiàng)目目2業(yè)務(wù)驅(qū)驅(qū)動(dòng)因因素競(jìng)爭(zhēng)性性的市市場(chǎng)使使一家家金融融組織織認(rèn)識(shí)識(shí)到,,它必須開開始利利用其其日常常活動(dòng)動(dòng)中包包含的的大量量信息。。企業(yè)業(yè)的資資產(chǎn)很很多,,但它它沒有有預(yù)測(cè)測(cè)其信用用卡使使用狀狀況和和利潤(rùn)潤(rùn)率的的能力力一家財(cái)財(cái)產(chǎn)和和事故故保險(xiǎn)險(xiǎn)公司司無法法為有有多張張保險(xiǎn)單和和復(fù)雜雜保險(xiǎn)險(xiǎn)險(xiǎn)種種的顧顧客傳傳遞統(tǒng)統(tǒng)一的的結(jié)賬數(shù)據(jù)據(jù)。因因此要要求將將多個(gè)個(gè)來源源中的的數(shù)據(jù)據(jù)與一個(gè)能能生成成統(tǒng)一一報(bào)表表和進(jìn)進(jìn)行用用戶查查詢的的數(shù)據(jù)模型型對(duì)應(yīng)應(yīng)起來來數(shù)據(jù)范范圍一個(gè)主主題區(qū)區(qū)“信信用卡卡”多個(gè)主主題區(qū)區(qū),包包括““收入入”、、“賠賠款””和“顧顧客””業(yè)務(wù)原原因向接受受該銀銀行信信用卡卡的組組織宣宣傳信信用卡卡(如趨勢(shì)勢(shì)、人人口統(tǒng)統(tǒng)計(jì)特特征等等)的的決策策支持持項(xiàng)目業(yè)務(wù)支支持,,數(shù)據(jù)據(jù)合并并分類戰(zhàn)略性性的戰(zhàn)術(shù)性性的時(shí)間范范圍3-6個(gè)月月的增增加業(yè)業(yè)務(wù)價(jià)價(jià)值6-9個(gè)月月取得得初步步成果果技術(shù)范范圍公司近近期政政策要要求把把所有有新的的商務(wù)務(wù)軟件件都放放在在客客戶戶機(jī)機(jī)/服服務(wù)務(wù)器器體體系系結(jié)結(jié)構(gòu)構(gòu)上上用現(xiàn)現(xiàn)在在技技術(shù)術(shù)迅迅速速產(chǎn)產(chǎn)生生結(jié)結(jié)果果,,以以后后可可以以加入入新新技技術(shù)術(shù)表3-1數(shù)數(shù)據(jù)據(jù)倉(cāng)倉(cāng)庫(kù)庫(kù)項(xiàng)項(xiàng)目目對(duì)對(duì)照照表表((2))項(xiàng)目目方方法法高度度循循環(huán)環(huán)性性的的DW開開發(fā)發(fā)項(xiàng)目目每每六六個(gè)個(gè)月月交交付付一一次次成成果果,,然然后后繼繼續(xù)續(xù)逐步步交交付付結(jié)結(jié)果果假設(shè)設(shè)/約約束束可以以得得到到優(yōu)優(yōu)秀秀的的員員工工;;最最終終用用戶戶一一開開始始就能能接接受受特特別別查查詢?cè)兛梢砸缘玫玫降絻?yōu)優(yōu)秀秀員員工工角色色用戶戶項(xiàng)項(xiàng)目目代代表表項(xiàng)目目經(jīng)經(jīng)理理數(shù)據(jù)據(jù)建建模模人人員員業(yè)務(wù)務(wù)分分析析人人員員系統(tǒng)統(tǒng)分分析析員員開發(fā)發(fā)人人員員用戶戶主題題事事務(wù)務(wù)專專家家用戶戶項(xiàng)項(xiàng)目目代代表表項(xiàng)目目經(jīng)經(jīng)理理數(shù)據(jù)據(jù)建建模模人人員員業(yè)務(wù)務(wù)分分析析人人員員系統(tǒng)統(tǒng)分分析析員員開發(fā)發(fā)人人員員用戶戶主題題事事務(wù)務(wù)專專家家所選選的的步步驟驟建模模決策策者者的的需需求求主題題區(qū)區(qū)分分析析源系系統(tǒng)統(tǒng)分分析析最終終用用戶戶((EU))訪訪問問方方法法設(shè)設(shè)計(jì)計(jì)EU訪訪問問方方法法界界定定EU訪訪問問方方法法開開發(fā)發(fā)交換換設(shè)設(shè)計(jì)計(jì)物理理數(shù)數(shù)據(jù)據(jù)庫(kù)庫(kù)設(shè)設(shè)計(jì)計(jì)DW開開發(fā)發(fā)DW填填充充和和實(shí)實(shí)現(xiàn)現(xiàn)建模模DSS體體系系結(jié)結(jié)構(gòu)構(gòu)決策策者者的的需需求求主題題區(qū)區(qū)分分析析源系系統(tǒng)統(tǒng)分分析析EU訪訪問問方方法法設(shè)設(shè)計(jì)計(jì)變換換設(shè)設(shè)計(jì)計(jì)物理理數(shù)數(shù)據(jù)據(jù)庫(kù)庫(kù)設(shè)設(shè)計(jì)計(jì)DW開開發(fā)發(fā)DW填填充充和和實(shí)實(shí)現(xiàn)現(xiàn)除了了項(xiàng)項(xiàng)目目開開發(fā)發(fā)計(jì)計(jì)劃劃書書外外,,項(xiàng)項(xiàng)目目開開發(fā)發(fā)小小組組的的項(xiàng)項(xiàng)目目規(guī)規(guī)劃劃活活動(dòng)動(dòng)還還將將產(chǎn)產(chǎn)生生::A.文文檔檔化化的的業(yè)業(yè)務(wù)務(wù)驅(qū)驅(qū)動(dòng)動(dòng)因因素素。。B.數(shù)數(shù)據(jù)據(jù)范范圍圍。。C.時(shí)時(shí)間間范范圍圍。。D.業(yè)業(yè)務(wù)務(wù)原原因因。。E.總總體體方方法法。。F.參參與與者者及及其其作作用用。。G.假假設(shè)設(shè)和和約約束束。。H.項(xiàng)項(xiàng)目目管管理理戰(zhàn)戰(zhàn)略略。。數(shù)數(shù)據(jù)據(jù)倉(cāng)倉(cāng)庫(kù)庫(kù)的的平平臺(tái)臺(tái)與與結(jié)結(jié)構(gòu)構(gòu)選選擇擇1.數(shù)數(shù)據(jù)據(jù)倉(cāng)倉(cāng)庫(kù)庫(kù)的的技技術(shù)術(shù)平平臺(tái)臺(tái)(1))單單層層結(jié)結(jié)構(gòu)構(gòu)::主主要要是是指指在在數(shù)數(shù)據(jù)據(jù)源源和和數(shù)數(shù)據(jù)據(jù)倉(cāng)倉(cāng)庫(kù)庫(kù)之之間間共共享享平平臺(tái)臺(tái),,或或者者讓讓數(shù)數(shù)據(jù)據(jù)源源、、數(shù)數(shù)據(jù)據(jù)倉(cāng)倉(cāng)庫(kù)庫(kù)、、數(shù)數(shù)據(jù)據(jù)集集市市與與最最終終用用戶戶工工作作站站使使用用同同一一個(gè)個(gè)平平臺(tái)臺(tái)。。(2))客客戶戶/服服務(wù)務(wù)器器兩兩層層結(jié)結(jié)構(gòu)構(gòu)::在在這這類類結(jié)結(jié)構(gòu)構(gòu)中中,,一一層層為為客客戶戶機(jī)機(jī),,一一層層為為服服務(wù)務(wù)器器。。最最終終用用戶戶訪訪問問工工具具在在客客戶戶層層運(yùn)運(yùn)行行,,而而數(shù)數(shù)據(jù)據(jù)源源、、數(shù)數(shù)據(jù)據(jù)倉(cāng)倉(cāng)庫(kù)庫(kù)和和數(shù)數(shù)據(jù)據(jù)集集市市位位于于服服務(wù)務(wù)器器上上。。該該技技術(shù)術(shù)結(jié)結(jié)構(gòu)構(gòu)一一般般用用于于普普通通規(guī)規(guī)模模的的數(shù)數(shù)據(jù)據(jù)倉(cāng)倉(cāng)庫(kù)庫(kù)。。(3)三三層客戶戶/服務(wù)務(wù)器結(jié)構(gòu)構(gòu):這類類結(jié)構(gòu)包包括基于于工作站站的客戶戶層、基基于服務(wù)務(wù)器的中中間層和和基于主主機(jī)的第第三層。。主機(jī)((宿主))層負(fù)責(zé)責(zé)管理數(shù)數(shù)據(jù)源和和可選的的源數(shù)據(jù)據(jù)轉(zhuǎn)換;;服務(wù)器器運(yùn)行數(shù)數(shù)據(jù)倉(cāng)庫(kù)庫(kù)和數(shù)據(jù)據(jù)集市軟軟件,并并存儲(chǔ)倉(cāng)倉(cāng)庫(kù)的數(shù)數(shù)據(jù);客客戶工作作站運(yùn)行行查詢和和報(bào)表運(yùn)運(yùn)用程序序,且還還可以存存儲(chǔ)從數(shù)數(shù)據(jù)集市市或數(shù)據(jù)據(jù)倉(cāng)庫(kù)卸卸載的局局部數(shù)據(jù)據(jù)。(4)多多層式結(jié)結(jié)構(gòu):這這是在三三層客戶戶/服務(wù)務(wù)器結(jié)構(gòu)構(gòu)上發(fā)展展起來的的數(shù)據(jù)倉(cāng)倉(cāng)庫(kù)結(jié)構(gòu)構(gòu)。2.數(shù)數(shù)據(jù)倉(cāng)庫(kù)庫(kù)的體系系結(jié)構(gòu)(1)信信息獲取取層:負(fù)負(fù)責(zé)數(shù)據(jù)據(jù)的收集集、提純純、凈化化和聚合合,以及及從組織織外部數(shù)數(shù)據(jù)源和和組織的的業(yè)務(wù)處處理系統(tǒng)統(tǒng)中獲取取數(shù)據(jù)。。(2)信信息存儲(chǔ)儲(chǔ)層:提提供包含含時(shí)點(diǎn)信信息的單單一邏輯輯信息,,這種數(shù)數(shù)據(jù)通常常以最分分散的方方式存放放——需需要盡可可能使物物理設(shè)計(jì)計(jì)符合數(shù)數(shù)據(jù)模型型,這對(duì)對(duì)最終產(chǎn)產(chǎn)生滿足足各種設(shè)設(shè)計(jì)要求求的靈活活性是十十分重要要。(3)信信息傳遞遞層:是是數(shù)據(jù)倉(cāng)倉(cāng)庫(kù)結(jié)構(gòu)構(gòu)中支持持一套共共用的表表示工具具和分析析工具的的組成部部分。3.數(shù)據(jù)據(jù)倉(cāng)庫(kù)的的數(shù)據(jù)庫(kù)庫(kù)設(shè)計(jì)數(shù)據(jù)倉(cāng)庫(kù)庫(kù)的數(shù)據(jù)據(jù)庫(kù)主要要包含存存儲(chǔ)用戶戶進(jìn)行決決策分析析的數(shù)據(jù)據(jù)庫(kù)和描描繪數(shù)據(jù)據(jù)的元數(shù)數(shù)據(jù)庫(kù)。。存儲(chǔ)用戶戶分析數(shù)數(shù)據(jù)的數(shù)數(shù)據(jù)庫(kù)可可以采用用關(guān)系型型數(shù)據(jù)庫(kù)庫(kù)、多維維數(shù)據(jù)庫(kù)庫(kù)和對(duì)象象數(shù)據(jù)庫(kù)庫(kù)實(shí)現(xiàn)。。元數(shù)據(jù)庫(kù)庫(kù)是數(shù)據(jù)據(jù)倉(cāng)庫(kù)的的靈魂。。沒有元元數(shù)據(jù)庫(kù)庫(kù),用戶戶就無法法對(duì)數(shù)據(jù)據(jù)倉(cāng)庫(kù)數(shù)數(shù)據(jù)進(jìn)行行良好的的定義、、組織和和管理。。數(shù)數(shù)據(jù)據(jù)倉(cāng)庫(kù)接接口與中中間件設(shè)設(shè)計(jì)1.數(shù)據(jù)據(jù)倉(cāng)庫(kù)的的數(shù)據(jù)源源確定以以及與業(yè)業(yè)務(wù)處理理系統(tǒng)接接口的設(shè)設(shè)計(jì)(1)數(shù)數(shù)據(jù)倉(cāng)庫(kù)庫(kù)的數(shù)據(jù)據(jù)源確定定要為數(shù)據(jù)據(jù)倉(cāng)庫(kù)從從數(shù)據(jù)源源中抽取取為管理理決策分分析所使使用的數(shù)數(shù)據(jù)源,,首先要要對(duì)所抽抽取的數(shù)數(shù)據(jù)源進(jìn)進(jìn)行正確確的定義義。數(shù)據(jù)據(jù)源的定定義要確確定數(shù)據(jù)據(jù)倉(cāng)庫(kù)主主題所需需各數(shù)據(jù)據(jù)源的詳詳細(xì)情況況,包括括數(shù)據(jù)源源所在計(jì)計(jì)算機(jī)平平臺(tái)、擁?yè)碛姓?、、?shù)據(jù)結(jié)結(jié)構(gòu)、使使用該數(shù)數(shù)據(jù)源的的處理過過程、數(shù)數(shù)據(jù)倉(cāng)庫(kù)庫(kù)更新計(jì)計(jì)劃等。。為了保證證數(shù)據(jù)的的更新需需要,還還需要為為數(shù)據(jù)倉(cāng)倉(cāng)庫(kù)中的的每個(gè)目目標(biāo)列確確認(rèn)它在在業(yè)務(wù)系系統(tǒng)或外外部數(shù)據(jù)據(jù)源中的的數(shù)據(jù)來來源規(guī)則則,以便便利用數(shù)數(shù)據(jù)獲取取中間件件,從源源系統(tǒng)中中獲取數(shù)數(shù)據(jù),并并加載到到數(shù)據(jù)倉(cāng)倉(cāng)庫(kù)中。。(2)數(shù)數(shù)據(jù)倉(cāng)庫(kù)庫(kù)與業(yè)務(wù)務(wù)處理系系統(tǒng)的接接口設(shè)計(jì)計(jì)在確定了了數(shù)據(jù)倉(cāng)倉(cāng)庫(kù)的數(shù)數(shù)據(jù)源以以后,就就需要考考慮數(shù)據(jù)據(jù)倉(cāng)庫(kù)與與作為數(shù)數(shù)據(jù)源的的業(yè)務(wù)處處理系統(tǒng)統(tǒng)的接口口設(shè)計(jì)。。由于業(yè)務(wù)務(wù)處理系系統(tǒng)環(huán)境境小,各各個(gè)應(yīng)用用系統(tǒng)都都有自己己獨(dú)立的的、特殊殊的需求求,在各各自的過過程中沒沒有考慮慮到以后后與其他他系統(tǒng)的的集成問問題,在在其基礎(chǔ)礎(chǔ)上建立立的數(shù)據(jù)據(jù)倉(cāng)庫(kù)需需要完成成與業(yè)務(wù)務(wù)處理系系統(tǒng)接口口的設(shè)計(jì)計(jì),所以以設(shè)計(jì)的的接口應(yīng)應(yīng)該具有有這樣一一些功能能:A.從面面向應(yīng)用用和操作作環(huán)境生生成完整整的數(shù)據(jù)據(jù)。B.數(shù)據(jù)據(jù)基于時(shí)時(shí)間的轉(zhuǎn)轉(zhuǎn)換。C.數(shù)據(jù)據(jù)的聚集集。D.對(duì)現(xiàn)現(xiàn)有數(shù)據(jù)據(jù)系統(tǒng)的的有效掃掃描,以以便今后后數(shù)據(jù)倉(cāng)倉(cāng)庫(kù)的數(shù)數(shù)據(jù)追加加。數(shù)據(jù)追加加的方法法主要有有:A.對(duì)操操作型數(shù)數(shù)據(jù)打上上時(shí)間戳戳。B.使用用系統(tǒng)日日志或?qū)弻徲?jì)日志志。C.修改改程序代代碼。D.使用用前映像像或后映映像文件件。2.數(shù)數(shù)據(jù)倉(cāng)倉(cāng)庫(kù)的中中間件設(shè)設(shè)計(jì)(1)拷拷貝中間間件,主主要有如如下4種種:A.代碼碼發(fā)生器器。B.數(shù)據(jù)據(jù)復(fù)制工工具。C.數(shù)據(jù)據(jù)泵。D.廣義義數(shù)據(jù)獲獲取工具具和設(shè)備備。(2)用用于數(shù)據(jù)據(jù)庫(kù)訪問問的網(wǎng)關(guān)關(guān)中間件件:主要要用于解解決數(shù)據(jù)據(jù)倉(cāng)庫(kù)與與數(shù)據(jù)源源和客戶戶端之間間的網(wǎng)絡(luò)絡(luò)協(xié)議不不同所造造成的數(shù)數(shù)據(jù)傳輸輸困難的的問題。。(3)對(duì)對(duì)數(shù)據(jù)倉(cāng)倉(cāng)庫(kù)進(jìn)行行監(jiān)控的的中間件件:主要要用于對(duì)對(duì)數(shù)據(jù)倉(cāng)倉(cāng)庫(kù)的應(yīng)應(yīng)用選擇擇適當(dāng)?shù)牡馁Y源,,如可以以根據(jù)系系統(tǒng)的負(fù)負(fù)載選擇擇恰當(dāng)?shù)牡挠?jì)算機(jī)機(jī)完成數(shù)數(shù)據(jù)庫(kù)事事務(wù);如如果有的的計(jì)算機(jī)機(jī)不可用用,可以以自動(dòng)選選擇可用用的計(jì)算算機(jī)進(jìn)行行事務(wù)處處理;可可以根據(jù)據(jù)用戶對(duì)對(duì)數(shù)據(jù)倉(cāng)倉(cāng)庫(kù)的使使用頻率率以及數(shù)數(shù)據(jù)量來來調(diào)整數(shù)數(shù)據(jù)倉(cāng)庫(kù)庫(kù)。數(shù)數(shù)據(jù)倉(cāng)庫(kù)庫(kù)的數(shù)據(jù)據(jù)抽取、、加載與與復(fù)制1.數(shù)據(jù)據(jù)倉(cāng)庫(kù)的的數(shù)據(jù)抽抽取數(shù)據(jù)倉(cāng)庫(kù)庫(kù)的數(shù)據(jù)據(jù)抽取是是數(shù)據(jù)倉(cāng)倉(cāng)庫(kù)成功功的關(guān)鍵鍵?!袄M(jìn),,垃圾出出”的原原則說明明了數(shù)據(jù)據(jù)抽取的的重要性性。在操操作數(shù)據(jù)據(jù)上執(zhí)行行的數(shù)據(jù)據(jù)抽取,,應(yīng)該依依據(jù)元數(shù)數(shù)據(jù)中定定義的標(biāo)標(biāo)準(zhǔn)數(shù)據(jù)據(jù)格式處處理數(shù)據(jù)據(jù)。在抽抽取過程程中,應(yīng)應(yīng)該在將將數(shù)據(jù)傳傳遞到數(shù)數(shù)據(jù)倉(cāng)庫(kù)庫(kù)系統(tǒng)之之前,從從元數(shù)據(jù)據(jù)存儲(chǔ)中中讀到這這種域定定義,將將數(shù)據(jù)轉(zhuǎn)轉(zhuǎn)換或修修補(bǔ)以適適合新標(biāo)標(biāo)準(zhǔn)。數(shù)據(jù)的抽抽取處理理實(shí)際上上被個(gè)別別情況所所驅(qū)動(dòng)。。2.數(shù)數(shù)據(jù)倉(cāng)庫(kù)庫(kù)的數(shù)據(jù)據(jù)加載在數(shù)據(jù)被被抽取后后,可把把數(shù)據(jù)加加載到數(shù)數(shù)據(jù)倉(cāng)庫(kù)庫(kù)中。數(shù)數(shù)據(jù)加載載之前,,首先需需要對(duì)準(zhǔn)準(zhǔn)備加載載的數(shù)據(jù)據(jù)進(jìn)行清清理,即即對(duì)數(shù)據(jù)據(jù)按照標(biāo)標(biāo)準(zhǔn)進(jìn)行行格式化化處理,,這些清清理工作作可在一一個(gè)專門門的數(shù)據(jù)據(jù)清理區(qū)區(qū)或數(shù)據(jù)據(jù)準(zhǔn)備區(qū)區(qū)內(nèi)進(jìn)行行。數(shù)據(jù)清理理工作必必須嚴(yán)格格依據(jù)元元數(shù)據(jù)的的定義進(jìn)進(jìn)行,一一旦數(shù)據(jù)據(jù)清理結(jié)結(jié)束,則則將經(jīng)過過凈化和和轉(zhuǎn)換的的數(shù)據(jù)加加載到合合適的數(shù)數(shù)據(jù)倉(cāng)庫(kù)庫(kù)事實(shí)表表中。在在數(shù)據(jù)加加載后,,還要更更新元數(shù)數(shù)據(jù)倉(cāng)庫(kù)庫(kù)中的元元數(shù)據(jù),,以反映映剛完成成的數(shù)據(jù)據(jù)加載活活動(dòng),并并對(duì)受影影響的概概括數(shù)據(jù)據(jù)重新概概括處理理。3.數(shù)數(shù)據(jù)據(jù)倉(cāng)庫(kù)庫(kù)數(shù)據(jù)據(jù)的復(fù)復(fù)制與與發(fā)行行一個(gè)完完整的的復(fù)制制結(jié)構(gòu)構(gòu)應(yīng)能能完成成以下下的復(fù)復(fù)雜任任務(wù)::.A.不不會(huì)受受到系系統(tǒng)失失敗等等問題題的影影響,,保證證提供供可靠靠的數(shù)數(shù)據(jù)復(fù)復(fù)制。。B.只只傳送送符合合數(shù)據(jù)據(jù)完整整性規(guī)規(guī)則的的一致致數(shù)據(jù)據(jù)。C.可可優(yōu)化化傳送送過程程,減減少在在捕獲獲或修修改數(shù)數(shù)據(jù)和和復(fù)制制品作作為結(jié)結(jié)果傳傳送之之間的的時(shí)間間。技術(shù)和和數(shù)據(jù)據(jù)結(jié)構(gòu)構(gòu)應(yīng)保保證數(shù)數(shù)據(jù)發(fā)發(fā)行系系統(tǒng)完完成以以下的的功能能:A.保保證數(shù)數(shù)據(jù)發(fā)發(fā)行以以適時(shí)時(shí)和有有效的的方式式進(jìn)行行。B.保保證只只發(fā)送送被排排序的的數(shù)據(jù)據(jù)。C.建建立正正確的的和所所需要要的服服務(wù)水水平標(biāo)標(biāo)準(zhǔn)。。數(shù)數(shù)據(jù)倉(cāng)倉(cāng)庫(kù)邏邏輯模模型的的確定定對(duì)數(shù)據(jù)據(jù)倉(cāng)庫(kù)庫(kù)邏輯輯模型型的確確定要要涉及及數(shù)據(jù)據(jù)倉(cāng)庫(kù)庫(kù)粒度度劃分分、數(shù)數(shù)據(jù)分分割策策略及及關(guān)系系模型型定義義等內(nèi)內(nèi)容。。1.數(shù)數(shù)據(jù)倉(cāng)倉(cāng)庫(kù)粒粒度劃劃分::數(shù)據(jù)據(jù)倉(cāng)庫(kù)庫(kù)的邏邏輯設(shè)設(shè)計(jì)中中需要要解決決的一一個(gè)重重要問問題是是決定定數(shù)據(jù)據(jù)倉(cāng)庫(kù)庫(kù)粒度度的層層次劃劃分;;粒度度層次次的劃劃分適適當(dāng)與與否直直接影影響到到數(shù)據(jù)據(jù)倉(cāng)庫(kù)庫(kù)中要要存儲(chǔ)儲(chǔ)的數(shù)數(shù)據(jù)量量和查查詢方方法。。2.確確定數(shù)數(shù)據(jù)分分割策策略::數(shù)據(jù)據(jù)分割割是指指把邏邏輯上上整體體的數(shù)數(shù)據(jù)分分割成成較小小的、、可以以獨(dú)立立管理理的物物理單單元進(jìn)進(jìn)行存存儲(chǔ)的的方法法。使使用數(shù)數(shù)據(jù)分分割便便于數(shù)數(shù)據(jù)的的重構(gòu)構(gòu)、重重組和和恢復(fù)復(fù),從從而提提高創(chuàng)創(chuàng)建索索引和和順序序掃描描的效效率。。使用用數(shù)據(jù)據(jù)分割割的同同時(shí)也也可有有效地地支持持?jǐn)?shù)據(jù)據(jù)概括括。在設(shè)計(jì)計(jì)數(shù)據(jù)據(jù)倉(cāng)庫(kù)庫(kù)的數(shù)數(shù)據(jù)分分割時(shí)時(shí),最最主要要的是是選擇擇適當(dāng)當(dāng)?shù)姆址指顦?biāo)標(biāo)準(zhǔn)。。選擇擇適當(dāng)當(dāng)?shù)臄?shù)數(shù)據(jù)分分割標(biāo)標(biāo)準(zhǔn)一一般需需要考考慮以以下三三個(gè)方方面的的因素素。(1))數(shù)據(jù)據(jù)量::數(shù)據(jù)據(jù)量的的大小小是決決定是是否進(jìn)進(jìn)行數(shù)數(shù)據(jù)分分割和和如何何分割割的主主要因因素。。(2))數(shù)據(jù)據(jù)分析析處理理的對(duì)對(duì)象::數(shù)據(jù)據(jù)分割割是與與數(shù)據(jù)據(jù)處理理的對(duì)對(duì)象緊緊密聯(lián)聯(lián)系的的,不不同主主題內(nèi)內(nèi)數(shù)據(jù)據(jù)分割割的標(biāo)標(biāo)準(zhǔn)不不同。。(3)粒粒度分分割的的策略略:進(jìn)進(jìn)行數(shù)數(shù)據(jù)分分割設(shè)設(shè)計(jì)時(shí)時(shí),更更重要要的是是將數(shù)數(shù)據(jù)分分割標(biāo)標(biāo)準(zhǔn)與與粒度度層次次的劃劃分策策略統(tǒng)統(tǒng)一起起來。。3.關(guān)關(guān)系模模型定定義無論數(shù)數(shù)據(jù)倉(cāng)倉(cāng)庫(kù)的的概念念模型型是ER模模型、、星型型模型型還是是雪花花模型型,其其最后后的物物理實(shí)實(shí)現(xiàn)必必然是是以各各種表表來完完成的的。這這些表表有的的是由由指標(biāo)標(biāo)實(shí)體體轉(zhuǎn)換換而成成,有有的是是由維維實(shí)體體而來來,有有的是是從詳詳細(xì)類類別實(shí)實(shí)體所所來。。指標(biāo)實(shí)實(shí)體在在轉(zhuǎn)換換成事事實(shí)表表時(shí),,往往往會(huì)形形成多多個(gè)事事實(shí)表表。4.數(shù)數(shù)據(jù)倉(cāng)倉(cāng)庫(kù)的的實(shí)體體定義義在設(shè)計(jì)計(jì)邏輯輯模型型時(shí),,必須須對(duì)邏邏輯模模型中中的每每個(gè)實(shí)實(shí)體進(jìn)進(jìn)行具具有的的定義義。在在定義義之前前必須須明確確實(shí)體體究竟竟是另另一個(gè)個(gè)實(shí)體體的部部分還還是具具有獨(dú)獨(dú)立性性的實(shí)實(shí)體。。在邏輯輯數(shù)據(jù)據(jù)模型型中不不僅要要確定定實(shí)體體、實(shí)實(shí)體之之間的的關(guān)系系和實(shí)實(shí)體所所具有有的列列,還還要進(jìn)進(jìn)一步步確定定實(shí)體體列中中的主主鍵列列,實(shí)實(shí)體之之間關(guān)關(guān)系的的外部部鍵列列,實(shí)實(shí)體物物理存存儲(chǔ)的的一些些特性性。要從實(shí)實(shí)體的的眾多多事實(shí)實(shí)數(shù)據(jù)據(jù)中識(shí)識(shí)別用用戶所所需要要的數(shù)數(shù)據(jù)就就需要要在不不同的的列中中選擇擇某個(gè)個(gè)可以以惟一一識(shí)別別數(shù)據(jù)據(jù)表行行的列列作為為主鍵鍵列,,主鍵鍵列通通常由由一個(gè)個(gè)或多多個(gè)列列組成成,要要求主主鍵列列必須須識(shí)別別實(shí)體體的一一個(gè)實(shí)實(shí)例。。在實(shí)體體的列列中除除了主主鍵列列的確確定外外,還還要確確定一一些侯侯選鍵鍵列和和外部部鍵列列。數(shù)數(shù)據(jù)倉(cāng)倉(cāng)庫(kù)物物理模模型的的確定定1.數(shù)數(shù)據(jù)倉(cāng)倉(cāng)庫(kù)設(shè)設(shè)計(jì)的的規(guī)范范由于在在數(shù)據(jù)據(jù)倉(cāng)庫(kù)庫(kù)中包包含多多種表表、列列與域域等,,為保保證數(shù)數(shù)據(jù)倉(cāng)倉(cāng)庫(kù)的的設(shè)計(jì)計(jì)、實(shí)實(shí)施和和管理理保持持穩(wěn)定定,不不產(chǎn)生生混亂亂,需需要對(duì)對(duì)物理理數(shù)據(jù)據(jù)模型型中的的實(shí)體體、表表、列列等進(jìn)進(jìn)行規(guī)規(guī)范化化處理理,使使整個(gè)個(gè)數(shù)據(jù)據(jù)倉(cāng)庫(kù)庫(kù)的物物理數(shù)數(shù)據(jù)模模型能能夠保保持一一致。。數(shù)據(jù)據(jù)倉(cāng)庫(kù)庫(kù)的規(guī)規(guī)范化化內(nèi)容容主要要有完完整清清晰的的數(shù)據(jù)據(jù)定義義,合合適的的數(shù)據(jù)據(jù)格式式等。。2.確確定數(shù)據(jù)結(jié)結(jié)構(gòu)的類型型在數(shù)據(jù)倉(cāng)庫(kù)庫(kù)的結(jié)構(gòu)中中,可能包包含這樣一一些數(shù)據(jù)類類型的任意意組合:細(xì)細(xì)節(jié)數(shù)據(jù)、、概括數(shù)據(jù)據(jù)、外部數(shù)數(shù)據(jù)、多維維數(shù)據(jù)、數(shù)數(shù)據(jù)子集、、專門數(shù)據(jù)據(jù)緩存、復(fù)復(fù)制數(shù)據(jù)和和存檔數(shù)據(jù)據(jù)。數(shù)據(jù)倉(cāng)倉(cāng)庫(kù)設(shè)計(jì)人人員必須確確定符合設(shè)設(shè)計(jì)目標(biāo)的的數(shù)據(jù)結(jié)構(gòu)構(gòu)類型。在數(shù)據(jù)倉(cāng)庫(kù)庫(kù)中進(jìn)行數(shù)數(shù)據(jù)非規(guī)范范化處理的的優(yōu)點(diǎn)有::A.能夠夠減少對(duì)表表聯(lián)結(jié)的需需求,提高高數(shù)據(jù)倉(cāng)庫(kù)庫(kù)性能。B.能夠減減少編寫專專門決策支支持應(yīng)用程程序的必要要性,因?yàn)闉檫\(yùn)用一些些專門的查查詢工具,,可以更容容易地訪問問數(shù)據(jù)。C.可讓用用戶以直觀觀的易于理理解的工具具查看數(shù)據(jù)據(jù)。3.確定索索引策略數(shù)據(jù)倉(cāng)庫(kù)的的數(shù)據(jù)量很很大,要對(duì)對(duì)數(shù)據(jù)的存存取路徑進(jìn)進(jìn)行仔細(xì)的的設(shè)計(jì)和選選擇。由于于數(shù)據(jù)倉(cāng)庫(kù)庫(kù)的數(shù)據(jù)一一般很少更更新,因而而可以設(shè)計(jì)計(jì)索引結(jié)構(gòu)構(gòu)來提高數(shù)數(shù)據(jù)存取效效率。4.確定數(shù)數(shù)據(jù)存放位位置

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請(qǐng)下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請(qǐng)聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁(yè)內(nèi)容里面會(huì)有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫(kù)網(wǎng)僅提供信息存儲(chǔ)空間,僅對(duì)用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對(duì)用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對(duì)任何下載內(nèi)容負(fù)責(zé)。
  • 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請(qǐng)與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶因使用這些下載資源對(duì)自己和他人造成任何形式的傷害或損失。

最新文檔

評(píng)論

0/150

提交評(píng)論