數(shù)據(jù)倉庫設(shè)計(jì)jk教程課件_第1頁
數(shù)據(jù)倉庫設(shè)計(jì)jk教程課件_第2頁
數(shù)據(jù)倉庫設(shè)計(jì)jk教程課件_第3頁
數(shù)據(jù)倉庫設(shè)計(jì)jk教程課件_第4頁
數(shù)據(jù)倉庫設(shè)計(jì)jk教程課件_第5頁
已閱讀5頁,還剩75頁未讀 繼續(xù)免費(fèi)閱讀

下載本文檔

版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請(qǐng)進(jìn)行舉報(bào)或認(rèn)領(lǐng)

文檔簡介

1、數(shù)據(jù)倉庫設(shè)計(jì)數(shù)據(jù)倉庫設(shè)計(jì)數(shù)據(jù)倉庫設(shè)計(jì)方法概述DW設(shè)計(jì)與DB設(shè)計(jì)DW設(shè)計(jì)的三級(jí)數(shù)據(jù)模型性能問題數(shù)據(jù)倉庫中的元數(shù)據(jù)數(shù)據(jù)倉庫設(shè)計(jì)步驟概念模型設(shè)計(jì)邏輯模型設(shè)計(jì)物理模型設(shè)計(jì)數(shù)據(jù)倉庫生成數(shù)據(jù)倉庫的使用和維護(hù)DW設(shè)計(jì)與DB設(shè)計(jì)方法比較處理類型不同DB : 操作型數(shù)據(jù)環(huán)境,面向業(yè)務(wù)DW: 面向主題的分析型數(shù)據(jù)環(huán)境,面向分析,從基本主題開始,不斷發(fā)展新主題面向需求不同DB : 一組較確定的應(yīng)用(業(yè)務(wù)處理)需求;較確定的數(shù)據(jù)流DW: 需求不確切(定);分析處理需求靈活;沒有固定模式;用戶對(duì)分析處理需求不甚明了;其設(shè)計(jì)很難以需求為基礎(chǔ)DW設(shè)計(jì)與DB設(shè)計(jì)方法比較(續(xù))設(shè)計(jì)目標(biāo)不同DB : 事務(wù)處理的性能(OLTP),

2、支持多用戶并發(fā)訪問,高效的增、刪、改操作DW: 建立DSS的數(shù)據(jù)環(huán)境,全局的分析環(huán)境,支持用戶快速的分析和查詢數(shù)據(jù)來源不同DB : 企業(yè)的業(yè)務(wù)流程中產(chǎn)生的數(shù)據(jù)DW: 系統(tǒng)內(nèi)部,主要從OLTP系統(tǒng)中獲取,經(jīng)過轉(zhuǎn)換、重組、綜合; 同時(shí)包括部分外部信息DW設(shè)計(jì)與DB設(shè)計(jì)方法比較(續(xù))設(shè)計(jì)方法不同DB : SDLC(System Development Life Cycle) 應(yīng)用需求驅(qū)動(dòng)DW: CLDS 數(shù)據(jù)驅(qū)動(dòng)需求驅(qū)動(dòng)Inmon: SDLC與CLDS方法比較SDLC與CLDS方法比較第1天到第n天現(xiàn)象在數(shù)據(jù)倉庫建設(shè)過程中明確需求數(shù)據(jù)倉庫建造過程中,如果開發(fā)者等完全明確需求之后開始工作,那么這個(gè)倉庫

3、永遠(yuǎn)建不起來開發(fā)人員與DSS分析員的反饋循環(huán)十分重要數(shù)據(jù)倉庫設(shè)計(jì)的原則堅(jiān)持“以數(shù)據(jù)驅(qū)動(dòng)為中心,數(shù)據(jù)驅(qū)動(dòng)和需求驅(qū)動(dòng)相結(jié)合”的原則。數(shù)據(jù)驅(qū)動(dòng)是指根據(jù)當(dāng)前數(shù)據(jù)基礎(chǔ)和質(zhì)量等情況,進(jìn)行數(shù)據(jù)源分析。需求驅(qū)動(dòng)是指根據(jù)業(yè)務(wù)方向性需求、業(yè)務(wù)問題等,確定系統(tǒng)范圍和需求框架。在實(shí)際工程中的設(shè)計(jì)方法(續(xù)I)確定范圍與項(xiàng)目定義主要任務(wù)系統(tǒng)邊界的界定定義并描述項(xiàng)目步驟了解用戶方向性需求,發(fā)現(xiàn)業(yè)務(wù)問題,確定范圍;對(duì)業(yè)務(wù)問題進(jìn)行排序,選擇高優(yōu)先級(jí)業(yè)務(wù)問題,界定系統(tǒng)邊界;定義和識(shí)別項(xiàng)目的目的、范圍、前景、價(jià)值、約束、風(fēng)險(xiǎn)、障礙等,制定質(zhì)量管理、配置管理等計(jì)劃,形成項(xiàng)目定義文檔;確定主題域,建立概念模型。數(shù)據(jù)驅(qū)動(dòng)系統(tǒng)設(shè)計(jì)方法的基

4、本思路從源數(shù)據(jù)出發(fā),分析數(shù)據(jù),為新應(yīng)用(分析處理)所用根據(jù)分析處理的特點(diǎn)重新考察數(shù)據(jù)間聯(lián)系,重組數(shù)據(jù)數(shù)據(jù)(結(jié)構(gòu))具有相對(duì)的穩(wěn)定性,而處理變化很快,強(qiáng)調(diào)數(shù)據(jù)模型的作用,支持識(shí)別DB 與DW 中的數(shù)據(jù)的“共同性”DW設(shè)計(jì)的三級(jí)數(shù)據(jù)模型數(shù)據(jù)模型:對(duì)現(xiàn)實(shí)世界的抽象不同的抽象程度對(duì)應(yīng)不同級(jí)別的數(shù)據(jù)模型DW與DB的三級(jí)數(shù)據(jù)模型的區(qū)別:DW的數(shù)據(jù)模型中擴(kuò)充了碼結(jié)構(gòu),包含時(shí)間元素DW的數(shù)據(jù)模型中不包含純操作型數(shù)據(jù);但包含一些導(dǎo)出數(shù)據(jù)過程模型與數(shù)據(jù)模型建模的不同層次間的關(guān)系穩(wěn)定性分析零件表 很少更改 不時(shí)更改 經(jīng)常更改DW設(shè)計(jì)的三級(jí)數(shù)據(jù)模型概念模型:“信息世界”中的信息結(jié)構(gòu)用ER方法,以主題替代實(shí)體邏輯模型:

5、一般采用關(guān)系模型物理模型: 物理存儲(chǔ)結(jié)構(gòu)、存儲(chǔ)方法如:建立數(shù)據(jù)分片、合并表,建立包括廣義索引在內(nèi)的各種索引機(jī)制,引入冗余,生成導(dǎo)出數(shù)據(jù)等Inmon的三級(jí)數(shù)據(jù)模型高級(jí)數(shù)據(jù)模型:采用ER方法中級(jí)數(shù)據(jù)模型:稱為dis(Data Item Set)一個(gè)dis與ER中的一個(gè)主題域(實(shí)體)對(duì)應(yīng)低級(jí)數(shù)據(jù)模型:物理模型確定集成范圍集成范圍:定義數(shù)據(jù)模型的邊界,確定實(shí)體屬于或不屬于模型范圍集成范圍需要在建模之前進(jìn)行定義集成范圍由系統(tǒng)的建模者、管理人員和最終用戶共同確定確定集成范圍(續(xù))企業(yè)ER企業(yè)ER圖是由反映不同用戶觀點(diǎn)的ER圖構(gòu)造而成的ER圖與DISER圖Er圖中每個(gè)實(shí)體都由與其對(duì)應(yīng)的dis進(jìn)一步定義DIS

6、的基本結(jié)構(gòu)其中:基本數(shù)據(jù)組:應(yīng)包括主題的碼和屬性,一個(gè)主題只存在一個(gè)基本數(shù)據(jù)組。如:“顧客”主題中的顧客號(hào)、顧客名、性別等。聯(lián)接數(shù)據(jù)組:反映主題之間的聯(lián)系,往往是一個(gè)主題的公共碼鍵。二級(jí)數(shù)據(jù)組:相對(duì)穩(wěn)定的數(shù)據(jù)組。如:顧客的地址、電話、文化程度等。 類型數(shù)據(jù)組:頻繁變動(dòng)的數(shù)據(jù)組。如:顧客的購物記錄。穩(wěn)定性:基本數(shù)據(jù)組 二級(jí)數(shù)據(jù)組 類型數(shù)據(jù)組基本數(shù)據(jù)組聯(lián)接數(shù)據(jù)組地址在ER圖中標(biāo)明的關(guān)系在DIS中由聯(lián)接數(shù)據(jù)組體現(xiàn)擴(kuò)展的DIS地址一個(gè)擴(kuò)展的DIS,表明銀行可提供的不同貸款類型貸款 住宅性能問題提高系統(tǒng)性能, 主要是要提高系統(tǒng)的物理I/O性能。在數(shù)據(jù)倉庫的設(shè)計(jì)中,應(yīng)盡量減少每次查詢處理要求的I/O次數(shù),

7、 而使每次I/O又能返回盡量多的記錄。提高數(shù)據(jù)倉庫性能的主要途徑:粒度劃分?jǐn)?shù)據(jù)分片選擇冗余進(jìn)一步分離數(shù)據(jù)導(dǎo)出數(shù)據(jù)粒度劃分粒度:數(shù)據(jù)倉庫中數(shù)據(jù)單元的細(xì)節(jié)程度或綜合程度的級(jí)別。例如:細(xì)節(jié)輕度綜合高度綜合有關(guān)專家認(rèn)為,如果數(shù)據(jù)量只有10000行時(shí),不考慮粒度,如果有一千萬行時(shí),需要考慮粒度級(jí)別。粒度的劃分,主要考慮是行數(shù)。因?yàn)榘葱薪M織索引,索引依賴于行數(shù),索引大小直接影響I/O次數(shù)??臻g/行數(shù)計(jì)算粒度設(shè)計(jì)過程中的一個(gè)參考提高數(shù)據(jù)粒度的方法當(dāng)源數(shù)據(jù)放入數(shù)據(jù)倉庫時(shí),對(duì)它進(jìn)行匯總當(dāng)源數(shù)據(jù)放入數(shù)據(jù)倉庫時(shí),對(duì)它求平均或進(jìn)行計(jì)算把最大/最小的一組值放入數(shù)據(jù)倉庫只把顯然需要的數(shù)據(jù)放入數(shù)據(jù)倉庫用條件邏輯選取記錄的一

8、個(gè)子集放入數(shù)據(jù)倉庫粒度劃分舉例:銀行業(yè)(I)銀行環(huán)境中的雙重粒度輕度綜合粒度長達(dá)10年的每月帳戶記錄檔案級(jí)銀行業(yè)(II)銀行環(huán)境中雙重粒度的另一種形式上個(gè)月的顧客文件過去十年的連續(xù)顧客記錄粒度劃分舉例:粒度劃分舉例:制造業(yè)制造業(yè)環(huán)境中的粒度級(jí)別輕度綜合級(jí)檔案級(jí)粒度劃分舉例:保險(xiǎn)業(yè)保險(xiǎn)業(yè)環(huán)境中保險(xiǎn)金的粒度級(jí)別保險(xiǎn)金支付記錄數(shù)量很少,沒必要用雙重粒度保險(xiǎn)金記帳有規(guī)律,可以創(chuàng)建數(shù)據(jù)數(shù)組數(shù)據(jù)分片分片:把邏輯上統(tǒng)一的數(shù)據(jù)分割成較小的、可以獨(dú)立管理的物理單元(分片)進(jìn)行存儲(chǔ)。可按時(shí)間、按地區(qū)、按業(yè)務(wù)類型進(jìn)行數(shù)據(jù)分片商品銷售數(shù)據(jù)的分割為什么需要數(shù)據(jù)分片在OLTP環(huán)境中,修改操作較為頻繁,采用數(shù)據(jù)分片技術(shù)容易

9、導(dǎo)致記錄在分片之間的轉(zhuǎn)移,轉(zhuǎn)移代價(jià)較高;在OLAP環(huán)境中,數(shù)據(jù)極少更新,利用數(shù)據(jù)分片技術(shù)可以大大提高性能。減少內(nèi)存的使用空間:系統(tǒng)僅需要將用戶查詢所涉及的數(shù)據(jù)調(diào)入內(nèi)存數(shù)據(jù)分片后,可以利用并行操作提升查詢的效率數(shù)據(jù)分片:選擇分片的標(biāo)準(zhǔn)選擇分片的標(biāo)準(zhǔn)數(shù)據(jù)量的大小(而非記錄行數(shù))數(shù)據(jù)分片處理的對(duì)象的特征以及屬性之間的相關(guān)性例如:商品按類和時(shí)間作為分片的標(biāo)準(zhǔn) 供應(yīng)商按地區(qū)和時(shí)間作為分片的標(biāo)準(zhǔn)易于實(shí)現(xiàn)(實(shí)施) 例如:按時(shí)間、業(yè)務(wù)類型與粒度劃分策略統(tǒng)一起來 例如:按時(shí)間與商品類對(duì)銷售數(shù)據(jù)進(jìn)行綜合(粒度劃分)每一粒度再按時(shí)間與商品類進(jìn)行分片,分片后仍便于做高度綜合。引入冗余一項(xiàng)數(shù)據(jù)屬性(主外碼不算此類)存在

10、于多個(gè)關(guān)系模式中例如:在采購表/銷售表中增加商品名稱、商品類型等提高了性能,省去了Join操作引入冗余:例盡管描述信息冗余,但很少更新,提高了查詢性能導(dǎo)出數(shù)據(jù)事先在源數(shù)據(jù)基礎(chǔ)上,進(jìn)行匯總或計(jì)算,生成導(dǎo)出數(shù)據(jù)導(dǎo)出數(shù)據(jù),只計(jì)算一次就可以永久使用了分離數(shù)據(jù)根據(jù)訪問概率的巨大差異進(jìn)一步分離數(shù)據(jù)數(shù)據(jù)倉庫中的索引技術(shù)位圖索引多級(jí)索引廣義索引將部分或全部索引裝入內(nèi)存對(duì)索引項(xiàng)進(jìn)行壓縮創(chuàng)建選擇索引或范圍索引數(shù)據(jù)倉庫設(shè)計(jì)數(shù)據(jù)倉庫設(shè)計(jì)方法概述DW設(shè)計(jì)與DB設(shè)計(jì)DW設(shè)計(jì)的三級(jí)數(shù)據(jù)模型性能問題數(shù)據(jù)倉庫中的元數(shù)據(jù)數(shù)據(jù)倉庫設(shè)計(jì)步驟概念模型設(shè)計(jì)邏輯模型設(shè)計(jì)物理模型設(shè)計(jì)數(shù)據(jù)倉庫生成數(shù)據(jù)倉庫的使用和維護(hù)數(shù)據(jù)倉庫中的元數(shù)據(jù)元數(shù)據(jù):

11、關(guān)于數(shù)據(jù)的數(shù)據(jù);描述數(shù)據(jù)結(jié)構(gòu)、內(nèi)容、碼、索引等信息。數(shù)據(jù)倉庫元數(shù)據(jù)的內(nèi)容源數(shù)據(jù)的描述:數(shù)據(jù)源名,存儲(chǔ)地點(diǎn),存儲(chǔ)內(nèi)容簡述記錄系統(tǒng)定義:主題名,屬性名,源表名,源屬性名數(shù)據(jù)倉庫中數(shù)據(jù)的描述主題描述:主題名,主題的公共碼鍵, 有關(guān)描述信息等邏輯模型的定義;關(guān)系名,屬性1,屬性2,。,屬性n粒度的定義數(shù)據(jù)分片的定義數(shù)據(jù)轉(zhuǎn)換的描述數(shù)據(jù)進(jìn)入數(shù)據(jù)倉庫的轉(zhuǎn)換規(guī)則元數(shù)據(jù)的重要性管理人員做分析時(shí),往往先從元數(shù)據(jù)入手。支持?jǐn)?shù)據(jù)轉(zhuǎn)換:DB環(huán)境的數(shù)據(jù) DW環(huán)境的數(shù)據(jù)元數(shù)據(jù)描述“轉(zhuǎn)換”;元數(shù)據(jù)本身具有良好的靈活性,適應(yīng)變化。支持對(duì)數(shù)據(jù)倉庫中數(shù)據(jù)的理解例如:結(jié)構(gòu)、粒度層次、分片策略、索引等數(shù)據(jù)倉庫設(shè)計(jì)數(shù)據(jù)倉庫設(shè)計(jì)方法概述D

12、W設(shè)計(jì)與DB設(shè)計(jì)DW設(shè)計(jì)的三級(jí)數(shù)據(jù)模型性能問題數(shù)據(jù)倉庫中的元數(shù)據(jù)數(shù)據(jù)倉庫設(shè)計(jì)步驟概念模型設(shè)計(jì)邏輯模型設(shè)計(jì)物理模型設(shè)計(jì)數(shù)據(jù)倉庫生成數(shù)據(jù)倉庫的使用和維護(hù)數(shù)據(jù)倉庫的設(shè)計(jì)步驟基本思路:數(shù)據(jù)驅(qū)動(dòng)從現(xiàn)存數(shù)據(jù)庫系統(tǒng)基礎(chǔ)上進(jìn)行開發(fā):抽取、綜合、集成服務(wù)于管理決策分析原型法不斷反饋、循環(huán)、理解需求,使系統(tǒng)增長、完善步驟是大體上的,不是絕對(duì)的順序決策人員的參與極其重要數(shù)據(jù)倉庫設(shè)計(jì)的基本步驟概念模型設(shè)計(jì)任務(wù)確定系統(tǒng)邊界確定主題域及其內(nèi)容確定系統(tǒng)邊界深入了解目前擁有的操作型數(shù)據(jù)了解方向性需求。如:決策類型;決策者感興趣的問題。確定信息需求,確定數(shù)據(jù)覆蓋范圍。了解源數(shù)據(jù)(DB系統(tǒng))的狀況例如“涉及的信息”包含DB中的哪

13、些部分確定主題域確定系統(tǒng)所包含的主題域確定主題域的內(nèi)容:公共碼鍵,代表主題的屬性組主題域之間的聯(lián)系商場DW的概念模型設(shè)計(jì): 確定系統(tǒng)邊界確定系統(tǒng)邊界了解方向性需求:把握商場的商品采購情況和銷售情況分析:顧客的購買趨勢;商品供應(yīng)市場的變化趨勢;供應(yīng)商信用等級(jí)所涉及的信息:商品銷售數(shù)據(jù)、采購數(shù)據(jù)、庫存數(shù)據(jù)、顧客信息、供應(yīng)商信息了解源數(shù)據(jù)(DB系統(tǒng))的狀況:采購、庫存、銷售、人事等子系統(tǒng),前三個(gè)子系統(tǒng)的數(shù)據(jù)集合為系統(tǒng)邊界商場DW的概念模型設(shè)計(jì):確定主題域確定主題域確定三個(gè)主題:商品、顧客、供應(yīng)商每個(gè)主題域的內(nèi)容主題域之間的聯(lián)系所涉及的信息:商品銷售數(shù)據(jù)、采購數(shù)據(jù)、庫存數(shù)據(jù)、顧客信息、供應(yīng)商信息商場D

14、W的概念模型設(shè)計(jì):每個(gè)主題的內(nèi)容商場DW的概念模型設(shè)計(jì):主題域之間的聯(lián)系邏輯模型設(shè)計(jì)任務(wù)對(duì)主題域中所包含的內(nèi)容進(jìn)行進(jìn)一步的細(xì)化,每一個(gè)主題域包含若干個(gè)數(shù)據(jù)組(表);消除純粹是操作型的數(shù)據(jù):如操作人員、校對(duì)人員、客戶電話號(hào)碼等對(duì)主題域之間的關(guān)系進(jìn)一步細(xì)化為表與表之間的關(guān)系,對(duì)多對(duì)多的關(guān)系進(jìn)行有效分解;增加時(shí)間屬性:數(shù)據(jù)倉庫中的數(shù)據(jù)反映歷史變化的過程,它是一定時(shí)間的數(shù)據(jù)快照,因此必須包含時(shí)間主鍵;邏輯模型設(shè)計(jì):分析主題域分析主題域?qū)Γ‥R)概念模型中的主題進(jìn)行選取,選取當(dāng)前實(shí)施的主題域。由于開發(fā)的過程是逐步完成的,DW中的主題可逐步增加所選主題域大小合適大:足以建立一個(gè)可應(yīng)用系統(tǒng)?。簩?shí)施快、方便例

15、如:實(shí)施“商品”主題大:可以滿足經(jīng)營決策者的初始要求?。褐挥幸粋€(gè)主題邏輯模型設(shè)計(jì):粒度層次劃分粒度層次的劃分(以商場DW為例)數(shù)據(jù)量很大,宜采用多重粒度 商品上千種;商品來源也許多,每月銷售數(shù)據(jù)更多 對(duì)商品銷售記錄:進(jìn)行銷售分析及銷售趨勢分析銷售數(shù)據(jù):主要關(guān)心銷售額、銷售量 粒度層次:商品(商品號(hào)、商品子類、商品大類) 時(shí)間段(周、月、季、年)邏輯模型設(shè)計(jì):數(shù)據(jù)分片策略數(shù)據(jù)分片策略數(shù)據(jù)量(不是記錄行數(shù))大小數(shù)據(jù)分析處理要求:與分析處理的對(duì)象有關(guān)分片標(biāo)準(zhǔn):盡量自然、易實(shí)施 例如:按時(shí)間、按地區(qū)、按業(yè)務(wù)類型與粒度層次劃分相適應(yīng)邏輯模型設(shè)計(jì):引入冗余將包含在多個(gè)表中的有關(guān)數(shù)據(jù)進(jìn)行合理合并數(shù)據(jù)通常一起

16、被查詢提高查詢效率減少Join操作邏輯模型設(shè)計(jì):增加導(dǎo)出數(shù)據(jù)增加導(dǎo)出數(shù)據(jù):對(duì)于用戶經(jīng)常需要分析的數(shù)據(jù),或者為了提供系統(tǒng)訪問的效率,可以適當(dāng)增加導(dǎo)出數(shù)據(jù);(以商場數(shù)據(jù)為例)簡要記錄把操作型數(shù)據(jù)中許多不同的、詳細(xì)記錄組合在一起以聚集形式代表許多條操作型記錄簡要記錄(續(xù))優(yōu)點(diǎn)為最終用戶的訪問和分析提供了一種緊湊方便的數(shù)據(jù)組織形式使數(shù)據(jù)量降低23個(gè)數(shù)量級(jí)缺點(diǎn)信息的細(xì)節(jié)程度降低邏輯模型設(shè)計(jì):關(guān)系模式定義關(guān)系模式定義由多個(gè)表來實(shí)現(xiàn)主題(組織主題域的數(shù)據(jù))各表之間依靠公共碼鍵相聯(lián)系表的劃分,各個(gè)表的關(guān)系模式細(xì)節(jié)數(shù)據(jù)用表來組織;綜合數(shù)據(jù)也用表來組織例:“商品”主題各個(gè)表的關(guān)系模式公共碼鍵: 商品號(hào)(1).商品

17、固有信息:商品表(商品號(hào), 商品名, 類型, 顏色) /* 細(xì)節(jié)級(jí)*/(2).商品采購信息: 采購表1(商品號(hào), 供應(yīng)商號(hào), 供應(yīng)日期, 供應(yīng)價(jià), 供應(yīng)數(shù)量, ) /*細(xì)節(jié)級(jí)*/ 采購表2(商品號(hào), 時(shí)間段1, 采購總量,) 采購表n(商品號(hào), 時(shí)間段n, 采購總量,) /* 時(shí)間段不等的綜合表*/(3).商品銷售信息: 銷售表1(商品號(hào), 顧客號(hào), 銷售日期, 售價(jià), 銷售量, ) /* 細(xì)節(jié)級(jí)*/銷售表2(商品號(hào), 時(shí)間段1, 銷售總量, )銷售表n(商品號(hào), 時(shí)間段n, 銷售總量, ) /* 時(shí)間段不等的綜合表*/(4).商品庫存信息: 庫存表1(商品號(hào), 庫房號(hào), 庫存量, 日期, )

18、 /* 細(xì)節(jié)級(jí)*/庫存表3(商品號(hào), 庫房號(hào), 庫存量, 月份, )庫存表n(商品號(hào), 庫房號(hào), 庫存量, 年份, ) /* 樣本數(shù)據(jù)粒度形式*/(5). 其它導(dǎo)出數(shù)據(jù): 其它邏輯模型設(shè)計(jì):定義記錄系統(tǒng)(I)定義記錄系統(tǒng)根據(jù)DW中多個(gè)表的關(guān)系模式,從源數(shù)據(jù)中選擇最合適的數(shù)據(jù)作為記錄系統(tǒng)所選數(shù)據(jù)所在表的關(guān)系模式最接近DW中多個(gè)表的關(guān)系模式記錄系統(tǒng)定義,記入DW的元數(shù)據(jù)中定義記錄系統(tǒng)(II)表述數(shù)據(jù)模型的最好數(shù)據(jù)最實(shí)時(shí)最準(zhǔn)確最完備與輸入現(xiàn)存系統(tǒng)環(huán)境的數(shù)據(jù)源最近最具有結(jié)構(gòu)兼容性現(xiàn)存系統(tǒng)環(huán)境例:“商品”主題定義記錄系統(tǒng)從原有的采購子系統(tǒng)、庫存子系統(tǒng)、銷售子系統(tǒng)中選擇合適的數(shù)據(jù):采購子系統(tǒng):商品號(hào)、類別、供應(yīng)商號(hào)、供價(jià)、進(jìn)貨日期、進(jìn)貨數(shù)量;庫存子系統(tǒng):商品號(hào)、商品名、類別、庫存量、時(shí)間、庫房號(hào)等;銷售子系統(tǒng):商品號(hào)、類別、顧客號(hào)、銷售價(jià)、銷售量、銷售日期等記錄系統(tǒng)定義在元數(shù)據(jù)中的描述定義記錄系統(tǒng)策略方面的考慮由于以下“變化動(dòng)因”,操作型環(huán)境處于一種“混亂”狀態(tài)系統(tǒng)老化技術(shù)老化組織上的巨變大幅改變了需求需要重建操作型處理環(huán)境數(shù)據(jù)體系結(jié)構(gòu)設(shè)計(jì)人員得將變化動(dòng)因與體系結(jié)構(gòu)的概念結(jié)合起來,實(shí)現(xiàn)操作型處理環(huán)境的重建物理模型設(shè)計(jì)任務(wù)確定數(shù)據(jù)的存儲(chǔ)結(jié)構(gòu)確定索引策略確定數(shù)據(jù)存放位置確定存儲(chǔ)分配物理模型設(shè)計(jì):存儲(chǔ)結(jié)構(gòu)、索引策略確定數(shù)據(jù)的存儲(chǔ)結(jié)構(gòu)選擇合適的存儲(chǔ)結(jié)構(gòu)時(shí)應(yīng)該權(quán)

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請(qǐng)下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請(qǐng)聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會(huì)有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫網(wǎng)僅提供信息存儲(chǔ)空間,僅對(duì)用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對(duì)用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對(duì)任何下載內(nèi)容負(fù)責(zé)。
  • 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請(qǐng)與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶因使用這些下載資源對(duì)自己和他人造成任何形式的傷害或損失。

評(píng)論

0/150

提交評(píng)論