




版權說明:本文檔由用戶提供并上傳,收益歸屬內容提供方,若內容存在侵權,請進行舉報或認領
文檔簡介
數(shù)據(jù)倉庫的技術與開發(fā)數(shù)據(jù)倉庫設計開發(fā)流程數(shù)據(jù)倉庫的技術與開發(fā)數(shù)據(jù)倉庫設計開發(fā)流程1數(shù)據(jù)庫系統(tǒng)的開發(fā)流程需求收集和分析設計概念結構設計邏輯結構數(shù)據(jù)模型優(yōu)化設計物理結構設計評價性能預測物理實現(xiàn)實驗性運行使用維護數(shù)據(jù)庫不滿意需求分析階段概念設計階段邏輯設計階段物理設計階段數(shù)據(jù)庫實施階段數(shù)據(jù)庫運行維護階段不滿意數(shù)據(jù)庫系統(tǒng)的開發(fā)流程需求收集和分析設計概念結構設計邏輯結構數(shù)2數(shù)據(jù)庫設計流程的特點有明確的應用需求;嚴格遵循系統(tǒng)生命同期的階段劃分,較清楚的設計開發(fā)步驟;良好的可操作性,每一步驟的任務、文檔內容與格式有細致的規(guī)定。舉例:項目文檔數(shù)據(jù)庫設計流程的特點有明確的應用需求;3數(shù)據(jù)庫設計舉例1.需求分析
(溝通、會議演示、軟件需求說明書)
2.系統(tǒng)概念設計
(系統(tǒng)功能結構、流程、數(shù)據(jù)結構等)
3.系統(tǒng)詳細設計
(E-R、功能模塊、界面、業(yè)務過程、接口)
5.系統(tǒng)實現(xiàn)
(數(shù)據(jù)庫實現(xiàn)、程序實現(xiàn))
4.系統(tǒng)測試與實施數(shù)據(jù)庫設計舉例1.需求分析
(溝通、會議演示、軟4數(shù)據(jù)庫與數(shù)據(jù)倉庫設計的區(qū)別數(shù)據(jù)庫與數(shù)據(jù)倉庫設計的區(qū)別5數(shù)據(jù)倉庫開發(fā)流程的特點原始需求不明確,且不斷變化與增加,不能較準確地預見到以后的需求;采用原型法開發(fā),從構建系統(tǒng)的簡單的基本框架著手;數(shù)據(jù)驅動,著眼于有效地抽取、綜合、集成和挖掘已有數(shù)據(jù)庫的數(shù)據(jù)資源。數(shù)據(jù)倉庫開發(fā)流程的特點原始需求不明確,且不斷變化與增加,不能6原型法原型(Prototype)是開發(fā)信息系統(tǒng)的一個可執(zhí)行模型或引導性版本;幫助得到目標系統(tǒng)明確而嚴格的需求,促進客戶和各階段系統(tǒng)人員之間的相互有效的信息交流,并以此為基礎進行需求分析和系統(tǒng)設計。從本質上看,原型是未來目標系統(tǒng)的一個模型。原型法原型(Prototype)是開發(fā)信息系統(tǒng)的一個可執(zhí)行模7原型法原型不是系統(tǒng)開發(fā)的最終產(chǎn)品,而是在某個開發(fā)階段中為達到一定的目的所生成的系統(tǒng)簡化模擬版本;可能只是目標系統(tǒng)的一個式樣,或只包含目標系統(tǒng)的某些功能,或僅僅是具有目標系統(tǒng)的一個結構。原型法原型不是系統(tǒng)開發(fā)的最終產(chǎn)品,而是在某個開發(fā)階段中為達到8原型法原型法9數(shù)據(jù)倉庫的開發(fā)流程規(guī)劃與確定需求開發(fā)概念模型開發(fā)邏輯模型設計體系結構數(shù)據(jù)庫與元數(shù)據(jù)設計確定數(shù)據(jù)源抽取開發(fā)中間件填充與測試數(shù)據(jù)倉庫數(shù)據(jù)倉庫應用數(shù)據(jù)倉庫維護數(shù)據(jù)倉庫評價數(shù)據(jù)倉庫開發(fā)過程規(guī)劃分析階段設計實施階段使用維護階段數(shù)據(jù)倉庫的開發(fā)流程規(guī)劃開發(fā)開發(fā)設計數(shù)據(jù)庫確定開發(fā)填充與數(shù)據(jù)數(shù)10數(shù)據(jù)倉庫的開發(fā)流程數(shù)據(jù)倉庫系統(tǒng)的開發(fā)是一個經(jīng)過不斷循環(huán)、反饋而使系統(tǒng)不斷增長與完善的過程,這也是原型法區(qū)別于系統(tǒng)生命周期法的主要特點。數(shù)據(jù)倉庫的開發(fā)流程數(shù)據(jù)倉庫系統(tǒng)的開發(fā)是一個經(jīng)過不斷循環(huán)、反饋11數(shù)據(jù)倉庫的設計步驟概念模型設計技術準備工作邏輯模型設計物理模型設計數(shù)據(jù)倉庫生成數(shù)據(jù)倉庫使用與維護數(shù)據(jù)倉庫的設計步驟概念模型設計12數(shù)據(jù)倉庫的設計步驟數(shù)據(jù)倉庫的設計步驟13數(shù)據(jù)倉庫的設計步驟概念模型設計技術準備工作邏輯模型設計物理模型設計數(shù)據(jù)倉庫生成數(shù)據(jù)倉庫運行與維護數(shù)據(jù)倉庫的設計步驟概念模型設計14概念模型設計任務:界定系統(tǒng)邊界
確定主題域及其屬性描述
數(shù)據(jù)模型(多維數(shù)據(jù)模型,或E-R)成果:是在原有的數(shù)據(jù)庫的基礎上建立一個較為穩(wěn)固的概念模型。概念模型設計任務:界定系統(tǒng)邊界
確定主15概念模型設計任務:界定系統(tǒng)邊界
確定主題域及其屬性描述
數(shù)據(jù)模型(多維數(shù)據(jù)模型,或E-R)成果:是在原有的數(shù)據(jù)庫的基礎上建立一個較為穩(wěn)固的概念模型。概念模型設計任務:界定系統(tǒng)邊界
確定主16界定系統(tǒng)邊界(初步需求分析)基本的方向性需求:
要做的決策類型有哪些?
決策者感興趣的是什么問題?
這些問題需要什么樣的信息?
要得到這些信息需要包含原有數(shù)據(jù)庫系統(tǒng)的哪些部分的數(shù)據(jù)?可以劃定一個當前的大致的系統(tǒng)邊界,集中精力進行最需要的部分的開發(fā)。界定系統(tǒng)邊界(初步需求分析)基本的方向性需求:
要做的決策類17概念模型設計任務:界定系統(tǒng)邊界
確定主題域及其屬性描述
數(shù)據(jù)模型(多維數(shù)據(jù)模型,或E-R)成果:是在原有的數(shù)據(jù)庫的基礎上建立一個較為穩(wěn)固的概念模型。概念模型設計任務:界定系統(tǒng)邊界
確定主18確定主題域及其內容確定主要的主題域對每個主題域的內容進行較明確的描述:
·主題域的公共碼鍵;
·主題域之間的聯(lián)系;
·充分代表主題的屬性組。舉例
以商場的數(shù)據(jù)倉庫設計為例確定主題域及其內容確定主要的主題域19商場數(shù)據(jù)倉庫概念模型設計日趨激烈的市場競爭要求商場經(jīng)營者更加準確地了解商場經(jīng)營狀況,跟蹤市場趨勢,更加合理地制定商品采購與銷售策略。由于商場以前的一些OLTP的需要,在各個部門建立了許多分散的數(shù)據(jù)庫,分別處理各自的業(yè)務。如在人事、采購、庫存、銷售等部門分別存儲著各自的數(shù)據(jù)庫,各個部門的數(shù)據(jù)按自己業(yè)務需要加以組織。這樣的組織使得數(shù)據(jù)各自為政,缺乏全局性,管理層想要在這些數(shù)據(jù)的基礎上得到一些全局報表、進行一些分析工作是比較困難的。因此商場的領導決定要在原有的數(shù)據(jù)庫系統(tǒng)的基礎上建立一個數(shù)據(jù)倉庫。商場數(shù)據(jù)倉庫概念模型設計日趨激烈的市場競爭要求20界定系統(tǒng)的邊界需求:主要是商品采購和銷售情況商場經(jīng)營者目前所要進行的分析主要有:
·分析顧客的購買趨勢;
·分析商品供應市場的變化趨勢;
·分析供應商信用等級。界定系統(tǒng)的邊界需求:主要是商品采購和銷售情況21界定系統(tǒng)的邊界所需要的數(shù)據(jù)應包括:
·商品銷售數(shù)據(jù);
·商品采購數(shù)據(jù);
·商品庫存數(shù)據(jù);
·顧客信息;
·供應商信息。所以,我們可以將系統(tǒng)的邊界定為包含原有的銷售子系統(tǒng)、采購子系統(tǒng)以及庫存子系統(tǒng)在內的集合。界定系統(tǒng)的邊界所需要的數(shù)據(jù)應包括:
·商品銷售數(shù)據(jù);
·商品22確定主要的主題域三個基本主題:商品、供應商和顧客。主題之間的聯(lián)系是:
供應商供應多種商品,一種商品可由多個供應商提供,即“商品”主題與“供應商”供應的商品直接聯(lián)系;
供應商供應的商品同樣也可以被不同的顧客購買,但“顧客”主題與“供應商”主題間并不是直接發(fā)生關系的,它們之間的聯(lián)系是經(jīng)過“商品”主題的間接聯(lián)系。確定主要的主題域三個基本主題:商品、供應商和顧客。23E-R模型E-R模型24各主題的屬性信息各主題的屬性信息25數(shù)據(jù)倉庫的設計步驟概念模型設計技術準備工作邏輯模型設計物理模型設計數(shù)據(jù)倉庫生成數(shù)據(jù)倉庫使用與維護數(shù)據(jù)倉庫的設計步驟概念模型設計26技術準備工作工作包括:技術評估,技術環(huán)境準備。成果是:技術評估報告,軟硬件配置方案,系統(tǒng)(軟、硬件)總體設計方案。技術準備工作工作包括:技術評估,技術環(huán)境準備。27數(shù)據(jù)倉庫的設計步驟概念模型設計技術準備工作邏輯模型設計物理模型設計數(shù)據(jù)倉庫生成數(shù)據(jù)倉庫使用與維護數(shù)據(jù)倉庫的設計步驟概念模型設計28邏輯模型設計分析主題域確定粒度層次劃分確定數(shù)據(jù)分割策略關系模式定義數(shù)據(jù)源及抽取模型的定義邏輯模型設計分析主題域29分析主題域對概念模型設計步驟中確定的幾個基本主題域進行分析,選擇首先要實施的主題域;如果所選擇的主題域很大并且很復雜,我們甚至可以針對它的一個有意義的子集來進行開發(fā);商場數(shù)據(jù)倉庫設計的例子:
“商品”主題既是一個商場的最基本的業(yè)務對象,又是進行決策分析的最主要的領域,因而較之另兩個主題來說,“商品”主題具有更重要的意義與作用。所以,我們可以先選定“商品”主題來實施。分析主題域對概念模型設計步驟中確定的幾個基本主題域進行分析,30粒度層次劃分粒度層次劃分適當與否直接影響到數(shù)據(jù)倉庫中的數(shù)據(jù)量和所適合的查詢類型;通過估算數(shù)據(jù)行數(shù)和所需的DASD數(shù),確定采用單一粒度或多重粒度,以及粒度劃分的層次。
DASD(DirectAccessStorageDevice)例子:商品主題--多重粒度粒度層次劃分粒度層次劃分適當與否直接影響到數(shù)據(jù)倉庫中的數(shù)據(jù)量31數(shù)據(jù)分割策略數(shù)據(jù)量的大小是決定是否進行數(shù)據(jù)分割和如何分割的主要因素;數(shù)據(jù)分析處理的要求是選擇數(shù)據(jù)分割標準的一個主要依據(jù);還要考慮到所選擇的數(shù)據(jù)分割標準應是自然的、易于實施的;同時也要考慮數(shù)據(jù)分割的標準與粒度劃分層次是適應的。數(shù)據(jù)分割策略數(shù)據(jù)量的大小是決定是否進行數(shù)據(jù)分割和如何分割的主32關系模式定義由多個表實現(xiàn);對于多維數(shù)據(jù)模型:事實表和維度表;
對于E-R模型:主題的相關信息的內容表
如,商品主題的關系模式定義包括:
商品固有信息、商品采購信息、商品銷售信息、商品庫存信息、其它數(shù)據(jù)等。關系模式定義由多個表實現(xiàn);33數(shù)據(jù)源及抽取模型的定義由三種表實現(xiàn);數(shù)據(jù)源抽取對象表;
數(shù)據(jù)源抽取規(guī)則表;
數(shù)據(jù)目標列與源列對應關系表。數(shù)據(jù)源及抽取模型的定義由三種表實現(xiàn);34數(shù)據(jù)倉庫的設計步驟概念模型設計技術準備工作邏輯模型設計物理模型設計數(shù)據(jù)倉庫生成數(shù)據(jù)倉庫使用與維護數(shù)據(jù)倉庫的設計步驟概念模型設計35物理模型設計工作:確定數(shù)據(jù)的存儲結構,確定索引策略,確定數(shù)據(jù)存放位置,確定存儲分配。前提要求:
1.全面了解所選用的數(shù)據(jù)庫管理系統(tǒng),特別是存儲結構和存取方法。
2.了解數(shù)據(jù)環(huán)境、數(shù)據(jù)的使用頻度、使用方式、數(shù)據(jù)規(guī)模以及響應時間要求等,這些是對時間和空間效率進行平衡和優(yōu)化的重要依據(jù)。
3.了解外部存儲設備的特性,如分塊原則,塊大小的規(guī)定,設備的I/O特性等。物理模型設計工作:確定數(shù)據(jù)的存儲結構,確定索引策略,確定數(shù)據(jù)36數(shù)據(jù)倉庫的設計步驟概念模型設計技術準備工作邏輯模型設計物理模型設計數(shù)據(jù)倉庫生成數(shù)據(jù)倉庫使用與維護數(shù)據(jù)倉庫的設計步驟概念模型設計37數(shù)據(jù)倉庫的生成工作:接口編程,數(shù)據(jù)裝入;成果:數(shù)據(jù)已經(jīng)裝入到數(shù)據(jù)倉庫中,可以在其上建立數(shù)據(jù)倉庫的應用,即DSS應用。數(shù)據(jù)倉庫的生成工作:接口編程,數(shù)據(jù)裝入;38數(shù)據(jù)倉庫的生成接口編程:在兩個不同環(huán)境的記錄系統(tǒng)之間建立一個接口,能完整、準確地完成從操作型環(huán)境到數(shù)據(jù)倉庫環(huán)境的數(shù)據(jù)抽取、轉換與集成。數(shù)據(jù)裝入:運行接口程序,將數(shù)據(jù)裝入到數(shù)據(jù)倉庫中。數(shù)據(jù)倉庫的生成接口編程:在兩個不同環(huán)境的記錄系統(tǒng)之間建立一個39數(shù)據(jù)倉庫的設計步驟概念模型設計技術準備工作邏輯模型設計物理模型設計數(shù)據(jù)倉庫生成數(shù)據(jù)倉庫使用與維護數(shù)據(jù)倉庫的設計步驟概念模型設計40數(shù)據(jù)倉庫使用與維護使用數(shù)據(jù)倉庫:在數(shù)據(jù)倉庫中建立起DSS應用;維護:根據(jù)用戶使用情況和反饋來的新的需求,開發(fā)人員進一步完善系統(tǒng),并管理數(shù)據(jù)倉庫的一些日常活動。
包括:刷新數(shù)據(jù)倉庫的當前詳細數(shù)據(jù),將過時的數(shù)據(jù)轉化成歷史數(shù)據(jù),清除不再使用的數(shù)據(jù),管理元數(shù)據(jù),利用接口定期從操作型環(huán)境向數(shù)據(jù)倉庫追加數(shù)據(jù),確定數(shù)據(jù)倉庫的數(shù)據(jù)刷新頻率,等等。數(shù)據(jù)倉庫使用與維護使用數(shù)據(jù)倉庫:在數(shù)據(jù)倉庫中建立起DSS應41數(shù)據(jù)倉庫使用與維護在“商品”主題的數(shù)據(jù)裝人數(shù)據(jù)倉庫后,就可以進行在“商品”主題上的分析處理,即建立“商品’這一分析領域上的DSS應用,如有關商品銷售情況的月統(tǒng)計分析或商品庫存情況的分析等。在分析應用中,我們會對“商品”主題有一個實踐基礎上的更深的認識,從而對原來的設計作出評價和調整。比如,實踐證明原來的粒度劃分不合理,就應該調整粒度定義。數(shù)據(jù)倉庫使用與維護在“商品”主題的數(shù)據(jù)裝人數(shù)據(jù)倉庫后,就可以42數(shù)據(jù)倉庫使用與維護在這一過程中,商場經(jīng)營者可能會提出新的要求,對消費市場進行分析研究,以進行市場定位等,那么就要著手開發(fā)“顧客”主題,并可能要對原有的“商品”主題進行調整,如“商品”主題中可能要增加“商品檔次”這么一個屬性。數(shù)據(jù)倉庫使用與維護在這一過程中,商場經(jīng)營者可能會提出新的要求43討論在學習了數(shù)據(jù)倉庫的相關知識和技術后,你覺得日常生活中,那些方面可以用到數(shù)據(jù)倉庫技術?討論在學習了數(shù)據(jù)倉庫的相關知識和技術后,你覺得日常生活中,那44舉例零售個性化系統(tǒng)。
在系統(tǒng)中,客戶閱讀到由零售商編制的目錄或宣傳廣告后促使他有了購買的念頭,或者至少想查詢一下目錄,結果是給零售商打電話。舉例零售個性化系統(tǒng)。
在系統(tǒng)中,客戶閱讀到由零售商編制的目錄45舉例舉例46舉例
當客戶定貨或咨詢情況時,零售商代表查出一些與此有關的其他信息,如:客戶上次購物的時間;上次購物的類型;客戶所屬的市場地段。舉例當客戶定貨或咨詢情況時,零售商代表查出一些與此有關47舉例
對話的過程中,銷售代表說出以下一些事情:“我記得我們曾在二月份通過話”“你購買的蘭色運動衫怎么樣?”“你的那條褲子的問題解決了嗎?”交談進行得很有人情味。這樣,將會更加激起客戶的購買欲望。舉例對話的過程中,銷售代表說出以下一些事情:48舉例數(shù)據(jù)倉庫的分析功能給出市場地段信息,如:男/女專業(yè)/其他用品市場城市/鄉(xiāng)村市場兒童用品市場(年齡、性別)體育用品市場舉例數(shù)據(jù)倉庫的分析功能給出市場地段信息,如:49舉例
對話可以進行得很個性化。銷售代表能夠根據(jù)客戶所屬的市場地段信息進行針對性的提問,如:“你知道我們在泳裝方面還有未公布的產(chǎn)品嗎?”“我們剛剛進一批意大利太陽鏡,我想你可能有興趣?!薄疤鞖忸A報這是打野鴨的寒冬,我們有一種特制的長筒靴。”舉例對話可以進行得很個性化。銷售代表能夠根據(jù)客戶所屬的50舉例
客戶已經(jīng)完全投入了電話對話中,個性化的電話和關于客戶對什么商品感興趣的知識使得銷售商在不增加資本投入、不增加廣告量的情況下增加了收入。舉例客戶已經(jīng)完全投入了電話對話中,個性化的電話和關于客51舉例
這種個性化的電話對話是通過對數(shù)據(jù)倉庫的間接訪問而完成的舉例這種個性化的電話對話是通過對數(shù)據(jù)倉庫的間接訪問而完52舉例后臺(即數(shù)據(jù)倉庫環(huán)境中)有一個分析程序在不斷讀入和分析客戶的記錄。這個分析程序通過一種復雜的方法掃描,分析客戶的歷史記錄。它定時地提供給操作型環(huán)境一個包括下面內容的文件:上次購物的類型;上次購物的日期;市場分析/市場地段信息。舉例后臺(即數(shù)據(jù)倉庫環(huán)境中)有一個分析程序在不斷讀入和分析客53數(shù)據(jù)倉庫的技術與開發(fā)數(shù)據(jù)倉庫設計開發(fā)流程數(shù)據(jù)倉庫的技術與開發(fā)數(shù)據(jù)倉庫設計開發(fā)流程54數(shù)據(jù)庫系統(tǒng)的開發(fā)流程需求收集和分析設計概念結構設計邏輯結構數(shù)據(jù)模型優(yōu)化設計物理結構設計評價性能預測物理實現(xiàn)實驗性運行使用維護數(shù)據(jù)庫不滿意需求分析階段概念設計階段邏輯設計階段物理設計階段數(shù)據(jù)庫實施階段數(shù)據(jù)庫運行維護階段不滿意數(shù)據(jù)庫系統(tǒng)的開發(fā)流程需求收集和分析設計概念結構設計邏輯結構數(shù)55數(shù)據(jù)庫設計流程的特點有明確的應用需求;嚴格遵循系統(tǒng)生命同期的階段劃分,較清楚的設計開發(fā)步驟;良好的可操作性,每一步驟的任務、文檔內容與格式有細致的規(guī)定。舉例:項目文檔數(shù)據(jù)庫設計流程的特點有明確的應用需求;56數(shù)據(jù)庫設計舉例1.需求分析
(溝通、會議演示、軟件需求說明書)
2.系統(tǒng)概念設計
(系統(tǒng)功能結構、流程、數(shù)據(jù)結構等)
3.系統(tǒng)詳細設計
(E-R、功能模塊、界面、業(yè)務過程、接口)
5.系統(tǒng)實現(xiàn)
(數(shù)據(jù)庫實現(xiàn)、程序實現(xiàn))
4.系統(tǒng)測試與實施數(shù)據(jù)庫設計舉例1.需求分析
(溝通、會議演示、軟57數(shù)據(jù)庫與數(shù)據(jù)倉庫設計的區(qū)別數(shù)據(jù)庫與數(shù)據(jù)倉庫設計的區(qū)別58數(shù)據(jù)倉庫開發(fā)流程的特點原始需求不明確,且不斷變化與增加,不能較準確地預見到以后的需求;采用原型法開發(fā),從構建系統(tǒng)的簡單的基本框架著手;數(shù)據(jù)驅動,著眼于有效地抽取、綜合、集成和挖掘已有數(shù)據(jù)庫的數(shù)據(jù)資源。數(shù)據(jù)倉庫開發(fā)流程的特點原始需求不明確,且不斷變化與增加,不能59原型法原型(Prototype)是開發(fā)信息系統(tǒng)的一個可執(zhí)行模型或引導性版本;幫助得到目標系統(tǒng)明確而嚴格的需求,促進客戶和各階段系統(tǒng)人員之間的相互有效的信息交流,并以此為基礎進行需求分析和系統(tǒng)設計。從本質上看,原型是未來目標系統(tǒng)的一個模型。原型法原型(Prototype)是開發(fā)信息系統(tǒng)的一個可執(zhí)行模60原型法原型不是系統(tǒng)開發(fā)的最終產(chǎn)品,而是在某個開發(fā)階段中為達到一定的目的所生成的系統(tǒng)簡化模擬版本;可能只是目標系統(tǒng)的一個式樣,或只包含目標系統(tǒng)的某些功能,或僅僅是具有目標系統(tǒng)的一個結構。原型法原型不是系統(tǒng)開發(fā)的最終產(chǎn)品,而是在某個開發(fā)階段中為達到61原型法原型法62數(shù)據(jù)倉庫的開發(fā)流程規(guī)劃與確定需求開發(fā)概念模型開發(fā)邏輯模型設計體系結構數(shù)據(jù)庫與元數(shù)據(jù)設計確定數(shù)據(jù)源抽取開發(fā)中間件填充與測試數(shù)據(jù)倉庫數(shù)據(jù)倉庫應用數(shù)據(jù)倉庫維護數(shù)據(jù)倉庫評價數(shù)據(jù)倉庫開發(fā)過程規(guī)劃分析階段設計實施階段使用維護階段數(shù)據(jù)倉庫的開發(fā)流程規(guī)劃開發(fā)開發(fā)設計數(shù)據(jù)庫確定開發(fā)填充與數(shù)據(jù)數(shù)63數(shù)據(jù)倉庫的開發(fā)流程數(shù)據(jù)倉庫系統(tǒng)的開發(fā)是一個經(jīng)過不斷循環(huán)、反饋而使系統(tǒng)不斷增長與完善的過程,這也是原型法區(qū)別于系統(tǒng)生命周期法的主要特點。數(shù)據(jù)倉庫的開發(fā)流程數(shù)據(jù)倉庫系統(tǒng)的開發(fā)是一個經(jīng)過不斷循環(huán)、反饋64數(shù)據(jù)倉庫的設計步驟概念模型設計技術準備工作邏輯模型設計物理模型設計數(shù)據(jù)倉庫生成數(shù)據(jù)倉庫使用與維護數(shù)據(jù)倉庫的設計步驟概念模型設計65數(shù)據(jù)倉庫的設計步驟數(shù)據(jù)倉庫的設計步驟66數(shù)據(jù)倉庫的設計步驟概念模型設計技術準備工作邏輯模型設計物理模型設計數(shù)據(jù)倉庫生成數(shù)據(jù)倉庫運行與維護數(shù)據(jù)倉庫的設計步驟概念模型設計67概念模型設計任務:界定系統(tǒng)邊界
確定主題域及其屬性描述
數(shù)據(jù)模型(多維數(shù)據(jù)模型,或E-R)成果:是在原有的數(shù)據(jù)庫的基礎上建立一個較為穩(wěn)固的概念模型。概念模型設計任務:界定系統(tǒng)邊界
確定主68概念模型設計任務:界定系統(tǒng)邊界
確定主題域及其屬性描述
數(shù)據(jù)模型(多維數(shù)據(jù)模型,或E-R)成果:是在原有的數(shù)據(jù)庫的基礎上建立一個較為穩(wěn)固的概念模型。概念模型設計任務:界定系統(tǒng)邊界
確定主69界定系統(tǒng)邊界(初步需求分析)基本的方向性需求:
要做的決策類型有哪些?
決策者感興趣的是什么問題?
這些問題需要什么樣的信息?
要得到這些信息需要包含原有數(shù)據(jù)庫系統(tǒng)的哪些部分的數(shù)據(jù)?可以劃定一個當前的大致的系統(tǒng)邊界,集中精力進行最需要的部分的開發(fā)。界定系統(tǒng)邊界(初步需求分析)基本的方向性需求:
要做的決策類70概念模型設計任務:界定系統(tǒng)邊界
確定主題域及其屬性描述
數(shù)據(jù)模型(多維數(shù)據(jù)模型,或E-R)成果:是在原有的數(shù)據(jù)庫的基礎上建立一個較為穩(wěn)固的概念模型。概念模型設計任務:界定系統(tǒng)邊界
確定主71確定主題域及其內容確定主要的主題域對每個主題域的內容進行較明確的描述:
·主題域的公共碼鍵;
·主題域之間的聯(lián)系;
·充分代表主題的屬性組。舉例
以商場的數(shù)據(jù)倉庫設計為例確定主題域及其內容確定主要的主題域72商場數(shù)據(jù)倉庫概念模型設計日趨激烈的市場競爭要求商場經(jīng)營者更加準確地了解商場經(jīng)營狀況,跟蹤市場趨勢,更加合理地制定商品采購與銷售策略。由于商場以前的一些OLTP的需要,在各個部門建立了許多分散的數(shù)據(jù)庫,分別處理各自的業(yè)務。如在人事、采購、庫存、銷售等部門分別存儲著各自的數(shù)據(jù)庫,各個部門的數(shù)據(jù)按自己業(yè)務需要加以組織。這樣的組織使得數(shù)據(jù)各自為政,缺乏全局性,管理層想要在這些數(shù)據(jù)的基礎上得到一些全局報表、進行一些分析工作是比較困難的。因此商場的領導決定要在原有的數(shù)據(jù)庫系統(tǒng)的基礎上建立一個數(shù)據(jù)倉庫。商場數(shù)據(jù)倉庫概念模型設計日趨激烈的市場競爭要求73界定系統(tǒng)的邊界需求:主要是商品采購和銷售情況商場經(jīng)營者目前所要進行的分析主要有:
·分析顧客的購買趨勢;
·分析商品供應市場的變化趨勢;
·分析供應商信用等級。界定系統(tǒng)的邊界需求:主要是商品采購和銷售情況74界定系統(tǒng)的邊界所需要的數(shù)據(jù)應包括:
·商品銷售數(shù)據(jù);
·商品采購數(shù)據(jù);
·商品庫存數(shù)據(jù);
·顧客信息;
·供應商信息。所以,我們可以將系統(tǒng)的邊界定為包含原有的銷售子系統(tǒng)、采購子系統(tǒng)以及庫存子系統(tǒng)在內的集合。界定系統(tǒng)的邊界所需要的數(shù)據(jù)應包括:
·商品銷售數(shù)據(jù);
·商品75確定主要的主題域三個基本主題:商品、供應商和顧客。主題之間的聯(lián)系是:
供應商供應多種商品,一種商品可由多個供應商提供,即“商品”主題與“供應商”供應的商品直接聯(lián)系;
供應商供應的商品同樣也可以被不同的顧客購買,但“顧客”主題與“供應商”主題間并不是直接發(fā)生關系的,它們之間的聯(lián)系是經(jīng)過“商品”主題的間接聯(lián)系。確定主要的主題域三個基本主題:商品、供應商和顧客。76E-R模型E-R模型77各主題的屬性信息各主題的屬性信息78數(shù)據(jù)倉庫的設計步驟概念模型設計技術準備工作邏輯模型設計物理模型設計數(shù)據(jù)倉庫生成數(shù)據(jù)倉庫使用與維護數(shù)據(jù)倉庫的設計步驟概念模型設計79技術準備工作工作包括:技術評估,技術環(huán)境準備。成果是:技術評估報告,軟硬件配置方案,系統(tǒng)(軟、硬件)總體設計方案。技術準備工作工作包括:技術評估,技術環(huán)境準備。80數(shù)據(jù)倉庫的設計步驟概念模型設計技術準備工作邏輯模型設計物理模型設計數(shù)據(jù)倉庫生成數(shù)據(jù)倉庫使用與維護數(shù)據(jù)倉庫的設計步驟概念模型設計81邏輯模型設計分析主題域確定粒度層次劃分確定數(shù)據(jù)分割策略關系模式定義數(shù)據(jù)源及抽取模型的定義邏輯模型設計分析主題域82分析主題域對概念模型設計步驟中確定的幾個基本主題域進行分析,選擇首先要實施的主題域;如果所選擇的主題域很大并且很復雜,我們甚至可以針對它的一個有意義的子集來進行開發(fā);商場數(shù)據(jù)倉庫設計的例子:
“商品”主題既是一個商場的最基本的業(yè)務對象,又是進行決策分析的最主要的領域,因而較之另兩個主題來說,“商品”主題具有更重要的意義與作用。所以,我們可以先選定“商品”主題來實施。分析主題域對概念模型設計步驟中確定的幾個基本主題域進行分析,83粒度層次劃分粒度層次劃分適當與否直接影響到數(shù)據(jù)倉庫中的數(shù)據(jù)量和所適合的查詢類型;通過估算數(shù)據(jù)行數(shù)和所需的DASD數(shù),確定采用單一粒度或多重粒度,以及粒度劃分的層次。
DASD(DirectAccessStorageDevice)例子:商品主題--多重粒度粒度層次劃分粒度層次劃分適當與否直接影響到數(shù)據(jù)倉庫中的數(shù)據(jù)量84數(shù)據(jù)分割策略數(shù)據(jù)量的大小是決定是否進行數(shù)據(jù)分割和如何分割的主要因素;數(shù)據(jù)分析處理的要求是選擇數(shù)據(jù)分割標準的一個主要依據(jù);還要考慮到所選擇的數(shù)據(jù)分割標準應是自然的、易于實施的;同時也要考慮數(shù)據(jù)分割的標準與粒度劃分層次是適應的。數(shù)據(jù)分割策略數(shù)據(jù)量的大小是決定是否進行數(shù)據(jù)分割和如何分割的主85關系模式定義由多個表實現(xiàn);對于多維數(shù)據(jù)模型:事實表和維度表;
對于E-R模型:主題的相關信息的內容表
如,商品主題的關系模式定義包括:
商品固有信息、商品采購信息、商品銷售信息、商品庫存信息、其它數(shù)據(jù)等。關系模式定義由多個表實現(xiàn);86數(shù)據(jù)源及抽取模型的定義由三種表實現(xiàn);數(shù)據(jù)源抽取對象表;
數(shù)據(jù)源抽取規(guī)則表;
數(shù)據(jù)目標列與源列對應關系表。數(shù)據(jù)源及抽取模型的定義由三種表實現(xiàn);87數(shù)據(jù)倉庫的設計步驟概念模型設計技術準備工作邏輯模型設計物理模型設計數(shù)據(jù)倉庫生成數(shù)據(jù)倉庫使用與維護數(shù)據(jù)倉庫的設計步驟概念模型設計88物理模型設計工作:確定數(shù)據(jù)的存儲結構,確定索引策略,確定數(shù)據(jù)存放位置,確定存儲分配。前提要求:
1.全面了解所選用的數(shù)據(jù)庫管理系統(tǒng),特別是存儲結構和存取方法。
2.了解數(shù)據(jù)環(huán)境、數(shù)據(jù)的使用頻度、使用方式、數(shù)據(jù)規(guī)模以及響應時間要求等,這些是對時間和空間效率進行平衡和優(yōu)化的重要依據(jù)。
3.了解外部存儲設備的特性,如分塊原則,塊大小的規(guī)定,設備的I/O特性等。物理模型設計工作:確定數(shù)據(jù)的存儲結構,確定索引策略,確定數(shù)據(jù)89數(shù)據(jù)倉庫的設計步驟概念模型設計技術準備工作邏輯模型設計物理模型設計數(shù)據(jù)倉庫生成數(shù)據(jù)倉庫使用與維護數(shù)據(jù)倉庫的設計步驟概念模型設計90數(shù)據(jù)倉庫的生成工作:接口編程,數(shù)據(jù)裝入;成果:數(shù)據(jù)已經(jīng)裝入到數(shù)據(jù)倉庫中,可以在其上建立數(shù)據(jù)倉庫的應用,即DSS應用。數(shù)據(jù)倉庫的生成工作:接口編程,數(shù)據(jù)裝入;91數(shù)據(jù)倉庫的生成接口編程:在兩個不同環(huán)境的記錄系統(tǒng)之間建立一個接口,能完整、準確地完成從操作型環(huán)境到數(shù)據(jù)倉庫環(huán)境的數(shù)據(jù)抽取、轉換與集成。數(shù)據(jù)裝入:運行接口程序,將數(shù)據(jù)裝入到數(shù)據(jù)倉庫中。數(shù)據(jù)倉庫的生成接口編程:在兩個不同環(huán)境的記錄系統(tǒng)之間建立一個92數(shù)據(jù)倉庫的設計步驟概念模型設計技術準備工作邏輯模型設計物理模型設計數(shù)據(jù)倉庫生成數(shù)據(jù)倉庫使用與維護數(shù)據(jù)倉庫的設計步驟概念模型設計93數(shù)據(jù)倉庫使用與維護使用數(shù)據(jù)倉庫:在數(shù)據(jù)倉庫中建立起DSS應用;維護:根據(jù)用戶使用情況和反饋來的新的需求,開發(fā)人員進一步完善系統(tǒng),并管理數(shù)據(jù)倉庫的一些日?;顒?。
包括:刷新數(shù)據(jù)倉庫的當前詳細數(shù)據(jù),將過時的數(shù)據(jù)轉化成歷史數(shù)據(jù),清除不再使用的數(shù)據(jù),管理元數(shù)據(jù),利用接口定期從操作型環(huán)境向數(shù)據(jù)倉庫追加數(shù)據(jù),確定數(shù)據(jù)倉庫的數(shù)據(jù)刷新頻率,等等。數(shù)據(jù)倉庫使用與維護使用數(shù)據(jù)倉庫:在數(shù)據(jù)倉庫中建立起DSS應94數(shù)據(jù)倉庫使用與維護在“商品”主題的數(shù)據(jù)裝人數(shù)據(jù)倉庫后,就可以進行在“商品”主題上的分析處理,即建立“商品’這一分析領域上的DSS應用,如有關商品銷售情況的月統(tǒng)計分析或商品庫存情況的分析等。在分析應用中,我們會對“商品”主題有一個實踐基礎上的更深的認識,從而對原來的設計作出評價和調整。比如,實踐證明原來的粒度劃分不合理,就應
溫馨提示
- 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權益歸上傳用戶所有。
- 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內容里面會有圖紙預覽,若沒有圖紙預覽就沒有圖紙。
- 4. 未經(jīng)權益所有人同意不得將文件中的內容挪作商業(yè)或盈利用途。
- 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內容的表現(xiàn)方式做保護處理,對用戶上傳分享的文檔內容本身不做任何修改或編輯,并不能對任何下載內容負責。
- 6. 下載文件中如有侵權或不適當內容,請與我們聯(lián)系,我們立即糾正。
- 7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。
最新文檔
- 2025年冀中職業(yè)學院單招職業(yè)適應性測試題庫1套
- 機器學習原理與應用課件 第8章 支持向量機
- 2025年貴州省貴陽市單招職業(yè)傾向性測試題庫完整版
- 機械原理 CH10學習資料
- 2025年數(shù)小腳標準教案反思
- 老舊小區(qū)基礎配套設施改造項目概述
- 商務英語課程思政教案
- 2025至2030年中國微型耕作機械數(shù)據(jù)監(jiān)測研究報告
- 山西省張?zhí)m鎮(zhèn)第一初級中學校人教新目標七年級英語上冊Unit7Howmucharethesesocks教案
- 2025年復烤煙葉項目建議書
- 開學第一課學生心理調適家長會PPT
- 工作指令回復單
- 政治經(jīng)濟學ppt課件匯總(完整版)
- (版)九年級化學學情分析報告
- 藍海華騰變頻器說明書
- 法律方法階梯PPT課件
- 口腔科四手操作[]通用課件
- 試論顱腦損傷診斷和治療和有效治療
- 故事我把媽媽弄丟了ppt課件
- NACE產(chǎn)品金屬材料要求
- 計算機科學與技術畢業(yè)論文88101
評論
0/150
提交評論