![《商業(yè)分析概論》數(shù)據(jù)庫與數(shù)據(jù)倉庫_第1頁](http://file4.renrendoc.com/view/b7d7ff123fef9ed113c6059fb39012c9/b7d7ff123fef9ed113c6059fb39012c91.gif)
![《商業(yè)分析概論》數(shù)據(jù)庫與數(shù)據(jù)倉庫_第2頁](http://file4.renrendoc.com/view/b7d7ff123fef9ed113c6059fb39012c9/b7d7ff123fef9ed113c6059fb39012c92.gif)
![《商業(yè)分析概論》數(shù)據(jù)庫與數(shù)據(jù)倉庫_第3頁](http://file4.renrendoc.com/view/b7d7ff123fef9ed113c6059fb39012c9/b7d7ff123fef9ed113c6059fb39012c93.gif)
![《商業(yè)分析概論》數(shù)據(jù)庫與數(shù)據(jù)倉庫_第4頁](http://file4.renrendoc.com/view/b7d7ff123fef9ed113c6059fb39012c9/b7d7ff123fef9ed113c6059fb39012c94.gif)
![《商業(yè)分析概論》數(shù)據(jù)庫與數(shù)據(jù)倉庫_第5頁](http://file4.renrendoc.com/view/b7d7ff123fef9ed113c6059fb39012c9/b7d7ff123fef9ed113c6059fb39012c95.gif)
版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進(jìn)行舉報或認(rèn)領(lǐng)
文檔簡介
商業(yè)分析概論數(shù)據(jù)庫與數(shù)據(jù)倉庫目錄傳統(tǒng)數(shù)據(jù)庫從數(shù)據(jù)庫到數(shù)據(jù)倉庫數(shù)據(jù)倉庫的相關(guān)概念數(shù)據(jù)倉庫的相關(guān)模型數(shù)據(jù)倉庫的體系結(jié)構(gòu)34.1傳統(tǒng)數(shù)據(jù)庫:數(shù)據(jù)的描述與組織三個世界1.現(xiàn)實世界
2.信息世界
3.計算機世界(或數(shù)據(jù)世界)
事物集合事物性質(zhì)實體集合屬性實體數(shù)據(jù)項記錄文件現(xiàn)實世界信息世界數(shù)據(jù)世界數(shù)據(jù)組織的結(jié)構(gòu)4現(xiàn)實世界最新價格浦發(fā)銀行當(dāng)日行情歷史行情概念世界特
性個
股整
體整體間聯(lián)系邏輯世界屬
性實
體同質(zhì)實體集合異質(zhì)實體集合計算機世界字
段記
錄表文件數(shù)據(jù)庫數(shù)據(jù)組織的層次數(shù)據(jù)的組織一般分為:數(shù)據(jù)項——反映實體的某種屬性記錄——反映一個實體或其部分?jǐn)?shù)據(jù)文件——反映某類實體數(shù)據(jù)庫——反映整個實體集合54.1數(shù)據(jù)庫范式關(guān)系型數(shù)據(jù)庫設(shè)計時是要遵循一定的規(guī)則的,尤其是數(shù)據(jù)庫的設(shè)計范式。1NF(第一范式)2NF(第二范式)3NF(第三范式)4NF(第四范式)5NF(第五范式)各范式關(guān)系圖5NF4NFBCNF3NF2NF1NF第一范式(1NF)在關(guān)系模式R中的每一個具體關(guān)系,如果每個屬性值都是由不可分割的最小數(shù)據(jù)單位組成或者說每個屬性的值必須是唯一的,則稱R屬于第一范式,換一句話說是指:在關(guān)系每個元組的所有屬性上的值都必須是原子值,相反的凡具有集合屬性或嵌套子關(guān)系的關(guān)系都不是第一范式;例如:由“職工號”、“姓名”、“電話號碼”組成的表(一個人可能有一個辦公室電話和一個家庭電話號碼),這時將其規(guī)范成為1NF有三種方法:重復(fù)存儲“職工號”和“姓名”。此時,關(guān)鍵字只能是“電話號碼”?!奥毠ぬ枴睘殛P(guān)鍵字,“電話號碼”分為“單位電話”和“住宅電話”兩個屬性。“職工號”為關(guān)鍵字,但強制每條記錄只能有一個電話號碼。以上三個方法,第一種方法最不可取,按實際情況選取后面兩種情況。非第一范式表姓名系書本書名編號價格張三計算機數(shù)據(jù)結(jié)構(gòu)0000345物理0000134“書本”屬性不是一個不可再分的原子屬性,即他是由3個部分組成第二范式(2NF)
如果關(guān)系模式R為第一范式,并且R中每一個非主鍵屬性完全依賴于R的某個候選關(guān)鍵字(通常為主鍵),即所有非主鍵列的值都完全依賴于主鍵列,則稱關(guān)系R屬于第二范式。 例如:在選課關(guān)系表SCI(SNO,CNO,GRADE,CREDIT)中,SNO為學(xué)號,CNO為課程號,GRADE為成績,CREDIT為學(xué)分。由以上條件可知,關(guān)鍵字為組合關(guān)鍵字(SNO,CNO)。第三范式(3NF)
屬于第二范式,且表中的任何一個非主屬性都不傳遞函數(shù)依賴于任何主鍵,則為第3范式;如果關(guān)系模式R中的所有非主屬性對于任何候選鍵都不存在傳遞依賴,則稱關(guān)系R屬于第三范式。 即如果一個表中的任意三列A、B、C,存在著A決定B,且B決定C的情況,那么這個表就不屬于第三范式,因為A可以通過傳遞依賴決定C,這時應(yīng)該將傳遞依賴分解到兩個表中。同時上表中的3個表都屬于第3范式;
所謂傳遞函數(shù)依賴,指的是如果存在“A—>B—>C”的決定關(guān)系,則C傳遞函數(shù)依賴于A。因此,滿足第三范式的數(shù)據(jù)庫表應(yīng)該不存在如下依賴關(guān)系:
關(guān)鍵字段—>非主鍵字段x—>非主鍵字段y
假如學(xué)生關(guān)系表為Student(學(xué)號,姓名,年齡,所在學(xué)院,學(xué)院地點,學(xué)院電話),主鍵為“學(xué)號”,因為存在如下決定關(guān)系:(學(xué)號)—>(姓名,年齡,所在學(xué)院,學(xué)院地點,學(xué)院電話)這個數(shù)據(jù)庫表是符合2NF,但是不符合3NF,因為存在如下決定關(guān)系:(學(xué)號)—>(所在學(xué)院)—>(學(xué)院地點,學(xué)院電話)即存在非主鍵“學(xué)院地點,學(xué)院電話”對關(guān)鍵字段學(xué)號的傳遞函數(shù)依賴第三范式(3NF)它會存在數(shù)據(jù)冗余,更新異常,插入異常,刪除異常。將學(xué)生關(guān)系表分為如下兩個表:學(xué)生:(學(xué)號,姓名,年齡,所在學(xué)院)學(xué)院:(學(xué)院,學(xué)院地點,學(xué)院電話)這樣的數(shù)據(jù)庫表是符合3NF,消除了數(shù)據(jù)冗余,更新異常,插入異常,刪除異常。BCNF若關(guān)系模式R是第一范式,且每個屬性都不傳遞依賴于R的候選鍵。這種關(guān)系模式就是BCNF模式。即在第三范式的基礎(chǔ)上,數(shù)據(jù)庫表中如果不存在任何字段對任一候選關(guān)鍵字段的傳遞函數(shù)依賴則符合鮑依斯-科得范式。假設(shè)倉庫管理關(guān)系表為StorehouseManage(倉庫ID,存儲物品ID,管理員ID,數(shù)量),且有一個管理員只在一個倉庫工作;一個倉庫可以存儲多種物品。這個數(shù)據(jù)庫表中存在如下決定關(guān)系:(倉庫ID,存儲物品ID)→(管理員ID,數(shù)量)(管理員ID,存儲物品ID)→(倉庫ID,數(shù)量)所以,(倉庫ID,存儲物品ID)和(管理員ID,存儲物品ID)都是StorehouseManage的候選關(guān)鍵字,表中的唯一非關(guān)鍵字段為數(shù)量,它是符合第三范式的。但是,由于存在如下決定關(guān)系:(倉庫ID)→(管理員ID)(管理員ID)→(倉庫ID)即存在關(guān)鍵字段決定關(guān)鍵字段的情況,所以其不符合BCNF范式。它會出現(xiàn)如下異常情況:(1)刪除異常:
當(dāng)倉庫被清空后,所有"存儲物品ID"和"數(shù)量"信息被刪除的同時,"倉庫ID"和"管理員ID"信息也被刪除了。(2)插入異常:
當(dāng)倉庫沒有存儲任何物品時,無法給倉庫分配管理員。(3)更新異常:如果倉庫換了管理員,則表中所有行的管理員ID都要修改。把倉庫管理關(guān)系表分解為二個關(guān)系表:倉庫管理:StorehouseManage(倉庫ID,管理員ID);倉庫:Storehouse(倉庫ID,存儲物品ID,數(shù)量)。
這樣的數(shù)據(jù)庫表是符合BCNF范式的,消除了刪除異常、插入異常和更新異常。BCNF四種范式之間的關(guān)系
164.2從數(shù)據(jù)庫到數(shù)據(jù)倉庫傳統(tǒng)數(shù)據(jù)庫:是按一定組織方式存儲在計算機存儲器中的相互關(guān)聯(lián)的數(shù)據(jù)集合,數(shù)據(jù)庫的建立獨立于程序。數(shù)據(jù)庫管理系統(tǒng)是一個管理數(shù)據(jù)庫的軟件系統(tǒng),它為用戶提供了查詢、定義、操縱、控制數(shù)據(jù)庫的方法和命令。1、從傳統(tǒng)數(shù)據(jù)庫到數(shù)據(jù)倉庫17傳統(tǒng)數(shù)據(jù)庫以及聯(lián)機事務(wù)處理(OLTP)傳統(tǒng)數(shù)據(jù)庫在聯(lián)機事物處理中取得了較大的成功,但在基于事物處理的數(shù)據(jù)庫幫助決策分析時卻產(chǎn)生了很大的困難。主要原因是傳統(tǒng)數(shù)據(jù)庫的處理方式和決策分析中的數(shù)據(jù)需求不相稱,導(dǎo)致傳統(tǒng)數(shù)據(jù)庫無法支持決策分析活動。1、從傳統(tǒng)數(shù)據(jù)庫到數(shù)據(jù)倉庫從數(shù)據(jù)庫到數(shù)據(jù)倉庫18傳統(tǒng)數(shù)據(jù)庫決策處理的系統(tǒng)響應(yīng)問題在傳統(tǒng)的事務(wù)處理系統(tǒng)中,用戶對系統(tǒng)和數(shù)據(jù)庫的要求是數(shù)據(jù)存取頻率要高、操作時間要快。但在決策分析處理中,用戶對系統(tǒng)和數(shù)據(jù)的要求發(fā)生了很大的變化。有的決策問題處理請求,可能會導(dǎo)致系統(tǒng)長達(dá)數(shù)小時的運行。有的決策分析問題的解決,則需要遍歷數(shù)據(jù)庫中大部分?jǐn)?shù)據(jù)。決策數(shù)據(jù)需求的問題進(jìn)行決策分析時,需要有全面、正確的集成數(shù)據(jù),大量的歷史信息。這些集成數(shù)據(jù)不僅包含企業(yè)內(nèi)部各部門的有關(guān)數(shù)據(jù),而且還包含企業(yè)外部的、甚至競爭對手的相關(guān)數(shù)據(jù)。但是在傳統(tǒng)數(shù)據(jù)庫中,只存儲了當(dāng)前的業(yè)務(wù)處理信息、本部門的事務(wù)處理數(shù)據(jù),面沒有與決策問題有關(guān)的集成數(shù)據(jù),更沒有企業(yè)外部數(shù)據(jù)。例如:企業(yè)進(jìn)行兼并活動后,或者企業(yè)內(nèi)部不同部門開發(fā)了不兼容的程序,人事管理系統(tǒng)中關(guān)于性別的表達(dá):(男、女)、(M、F)、(0、1)19傳統(tǒng)數(shù)據(jù)庫(3)決策數(shù)據(jù)操作的問題事務(wù)處理遠(yuǎn)遠(yuǎn)不能滿足決策人員的需要。事務(wù)性處理基本上是典型的固定結(jié)構(gòu),操作人員只能使用系統(tǒng)所提供的有限參數(shù)進(jìn)行數(shù)據(jù)操作,用戶對數(shù)據(jù)的訪問受很大的限制。表達(dá)方式上只能以固定的報表方式為用戶提供信息。決策分析人員則往往希望以專業(yè)用戶的身份對數(shù)據(jù)進(jìn)行操作,并以商務(wù)智能的方式表達(dá)出來。對比內(nèi)容數(shù)據(jù)庫數(shù)據(jù)倉庫數(shù)據(jù)內(nèi)容當(dāng)前值歷史的、存檔的、歸納的、計算的數(shù)據(jù)數(shù)據(jù)目標(biāo)面向業(yè)務(wù)操作程序、重復(fù)處理面向主體域、管理決策分析應(yīng)用數(shù)據(jù)特性動態(tài)變化、按字段更新靜態(tài)、不能直接更新、只是定時添加數(shù)據(jù)結(jié)構(gòu)高度結(jié)構(gòu)化、復(fù)雜,適合操作計算簡單、適合分析使用頻率高中到低數(shù)據(jù)訪問量每個事務(wù)只訪問少量記錄有的事務(wù)可能要訪問大量記錄對相應(yīng)時間的要求以秒為單位計量以秒、分鐘、甚至小時為計量單位數(shù)據(jù)倉庫與傳統(tǒng)數(shù)據(jù)庫的比較214.3數(shù)據(jù)倉庫的概念數(shù)據(jù)倉庫它是一個提供決策支持功能的數(shù)據(jù)庫,它與公司的操作數(shù)據(jù)庫分開維護(hù)。為統(tǒng)一的歷史數(shù)據(jù)分析提供堅實的平臺,對信息處理提供支持定義“數(shù)據(jù)倉庫是一個面向主題的、集成的、隨時間而變化的、不容易丟失的數(shù)據(jù)集合,支持管理部門的決策過程adatawarehouseisasubject-oriented,integrated,non-volatile,time-variantcollectionofdatainsupportofmanagementdecisions..”—W.H.Inmon本質(zhì)DW在物理本質(zhì)上,和DB,FILESYSTEM一樣,也是一堆數(shù)據(jù)的集合數(shù)據(jù)倉庫的定義22數(shù)據(jù)倉庫的概念數(shù)據(jù)倉庫關(guān)鍵特征面向主題的集成的隨時間變化的非易失的數(shù)據(jù)倉庫23數(shù)據(jù)倉庫的概念3、數(shù)據(jù)倉庫關(guān)鍵特征面向主題(subject-oriented):數(shù)據(jù)倉庫顯著區(qū)別于關(guān)系數(shù)據(jù)庫系統(tǒng)的一個特征圍繞一些主題,如顧客、供應(yīng)商、產(chǎn)品等關(guān)注決策者的數(shù)據(jù)建模與分析,而不是集中于組織機構(gòu)的日常操作和事務(wù)處理。排除對于決策無用的數(shù)據(jù),提供特定主題的簡明視圖。例如,優(yōu)質(zhì)客戶分析采購信息(數(shù)量、品種):銷售部門客戶信用:財務(wù)部門客戶購買競爭對手產(chǎn)品的信息:從企業(yè)的銷售代理商或市場調(diào)查公司那里所獲取,不是企業(yè)的內(nèi)部24采購子系統(tǒng):
訂單(訂單號,供應(yīng)商號,商品號,類別,單價。數(shù)量,總金額,日期,…
)供應(yīng)商(供應(yīng)商號,供應(yīng)商名,地址,電話,…)銷售子系統(tǒng):客戶(客戶號,姓名,地址,電話,…
)銷售(客戶號,商品號,數(shù)量,單價,日期,…
)庫存子系統(tǒng):進(jìn)庫單(編號,商品號,數(shù)量,單價,日期,…
)出庫單(編號,商品號,數(shù)量,單價,日期,…
)庫存(商品號,庫房號,類別,單價,庫存數(shù)量,總金額,日期,…
)數(shù)據(jù)源
商品固有信息:商品號,類別,單價,顏色,…
商品采購信息:商品號,類別,供應(yīng)商號,供應(yīng)日期,單價,數(shù)量,…
商品銷售信息:商品號,客戶號,數(shù)量,單價,銷售日期,…
商品庫存信息:商品號,庫房號,庫存數(shù)量,日期,…
)商品主題域:采購子系統(tǒng)銷售子系統(tǒng)庫存子系統(tǒng)數(shù)據(jù)倉庫中的數(shù)據(jù)分為四個級別:早期細(xì)節(jié)級,當(dāng)前細(xì)節(jié)級,輕度綜合級,高度綜合級。2005~2012年銷售明細(xì)表2013~2015年銷售明細(xì)表2013~2015年每月銷售表2013~2015年每季度銷售表28數(shù)據(jù)倉庫的概念數(shù)據(jù)倉庫關(guān)鍵特征數(shù)據(jù)倉庫的集成性(integrated):是指根據(jù)決策分析的要求,將分散于各處的源數(shù)據(jù)進(jìn)行抽取、篩選、清理、綜合等工作,使數(shù)據(jù)倉庫的數(shù)據(jù)具有集成性。數(shù)據(jù)倉庫在從業(yè)務(wù)處理系統(tǒng)那里獲取數(shù)據(jù)時,并不能將源數(shù)據(jù)庫中的數(shù)據(jù)直接加載到數(shù)據(jù)倉庫中,而是需要進(jìn)行一系列的數(shù)據(jù)預(yù)處理,即數(shù)據(jù)的抽取、篩選、清理、綜合等集成工作。首先要從源數(shù)據(jù)庫中挑選出數(shù)據(jù)倉庫所需要的數(shù)據(jù),然后將這些來自不同數(shù)據(jù)庫中的數(shù)據(jù)按照某一標(biāo)準(zhǔn)進(jìn)行統(tǒng)一,即將不同數(shù)據(jù)源中的數(shù)據(jù)的單位、字長與內(nèi)容按照數(shù)據(jù)倉庫的要求統(tǒng)一起來,消除源數(shù)據(jù)中字段的同名異義、異名同義現(xiàn)象,這些工作稱為數(shù)據(jù)的清理(clean),把數(shù)據(jù)倉庫的數(shù)據(jù)呈現(xiàn)給用戶一個一致統(tǒng)一的視圖。29數(shù)據(jù)倉庫的概念數(shù)據(jù)倉庫關(guān)鍵特征數(shù)據(jù)倉庫的集成性(integrated):一個數(shù)據(jù)倉庫是通過集成多個異種數(shù)據(jù)源來構(gòu)造的。關(guān)系數(shù)據(jù)庫,一般文件,聯(lián)機事務(wù)處理記錄使用數(shù)據(jù)清理和數(shù)據(jù)集成技術(shù)。確保命名約定、編碼結(jié)構(gòu)、屬性度量等的一致性。當(dāng)數(shù)據(jù)被移到數(shù)據(jù)倉庫時,它們要經(jīng)過轉(zhuǎn)化。304.3數(shù)據(jù)倉庫的概念數(shù)據(jù)倉庫關(guān)鍵特征數(shù)據(jù)倉庫是從歷史的角度提供信息隨時間而變化(time-variant)數(shù)據(jù)倉庫的時間范圍比操作數(shù)據(jù)庫系統(tǒng)要長的多。操作數(shù)據(jù)庫系統(tǒng):主要保存當(dāng)前數(shù)據(jù)。數(shù)據(jù)倉庫:從歷史的角度提供信息(比如過去5-10年)314.3數(shù)據(jù)倉庫的概念數(shù)據(jù)倉庫關(guān)鍵特征數(shù)據(jù)倉庫關(guān)鍵特征四——數(shù)據(jù)不易丟失數(shù)據(jù)不易丟失(non-volatile)盡管數(shù)據(jù)倉庫中的數(shù)據(jù)來自于操作數(shù)據(jù)庫,但他們卻是在物理上分離保存的。操作數(shù)據(jù)庫的更新操作不會出現(xiàn)在數(shù)據(jù)倉庫環(huán)境下。不需要事務(wù)處理,恢復(fù)和并發(fā)控制等機制只需要兩種數(shù)據(jù)訪問:數(shù)據(jù)的初始轉(zhuǎn)載和數(shù)據(jù)訪問(讀操作)4.4數(shù)據(jù)倉庫的相關(guān)模型概念模型邏輯模型物理模型元數(shù)據(jù)模型粒度模型32現(xiàn)實世界概念模型(概念世界)邏輯模型(邏輯世界)物理模型(計算機世界)數(shù)據(jù)倉庫元數(shù)據(jù)模型粒度模型4.4數(shù)據(jù)倉庫的相關(guān)模型概念模型不能直接用傳統(tǒng)的E-R圖,但對某些元素修改后可使用因為數(shù)據(jù)倉庫中有了指標(biāo)實體(事實實體)和維度實體數(shù)據(jù)倉庫中的各個實體不對等,建設(shè)數(shù)據(jù)倉庫時需要考慮兩類模型星型模型雪花模型33概念模型事實表事實表是用于存放經(jīng)過匯總的歷史信息,也就是事實數(shù)據(jù)的表,是星型架構(gòu)或雪花型架構(gòu)的中心。每個數(shù)據(jù)倉庫或數(shù)據(jù)集市都包括一個或多個事實表。事實表一般不包含描述性信息,具有可以聚合的特點。維表維表是存儲描述事實表中事實數(shù)據(jù)特性的表,每個維表都是獨立于其它維表的,并且包含了事實特性的層次結(jié)構(gòu)信息。事實表維度表維度表維度表維度表維度表星型模型是最常用的數(shù)據(jù)倉庫設(shè)計結(jié)構(gòu)的實現(xiàn)模式。使數(shù)據(jù)倉庫形成了一個集成系統(tǒng),為用戶提供分析服務(wù)對象。核心是事實表,圍繞事實表的是維度表。通過事實表將各種不同的維度表連接起來,各個維度表都連接到中央事實表。每一個維度表通過一個主鍵與事實表進(jìn)行連接。維度表利用主鍵通過事實表中的外鍵約束于事實表中的某一行。事實表中的外鍵不得為空。星型模型星型模型實例
time_keydayday_of_the_weekmonthquarteryeartimelocation_keystreetcitystate_or_provincecountrylocationSalesFactTabletime_keyitem_keybranch_keylocation_keyunits_solddollars_soldavg_salesMeasuresitem_keyitem_namebrandtypesupplier_typeitembranch_keybranch_namebranch_typebranch星雪花模型是對星型模型的擴展,每一個維度都可以向外連接到多個詳細(xì)類別表。雪花模型對星型模型的維度表進(jìn)一步標(biāo)準(zhǔn)化,對星型模型中的維度表進(jìn)行了規(guī)范化處理。雪花模型事實表維度表維度表維度表維度表維度表詳細(xì)類別表詳細(xì)類別表雪花模式實例time_keydayday_of_the_weekmonthquarteryeartimelocation_keystreetcity_keylocationSalesFactTabletime_keyitem_keybranch_keylocation_keyunits_solddollars_soldavg_salesMeasuresitem_keyitem_namebrandtypesupplier_keyitembranch_keybranch_namebranch_typebranchsupplier_keysupplier_typesuppliercity_keycitystate_or_provincecountrycity4.3數(shù)據(jù)倉庫的相關(guān)模型粒度模型粒度是指數(shù)據(jù)倉庫中數(shù)據(jù)單元的詳細(xì)程度和級別。數(shù)據(jù)越詳細(xì),粒度就越小,數(shù)據(jù)綜合度越高,粒度就越大,級別就越高。粒度可定義成數(shù)據(jù)倉庫中數(shù)據(jù)細(xì)節(jié)的最低層次,如事務(wù)層次。這種數(shù)據(jù)層次是高度細(xì)節(jié)化的,這樣就能使用戶按所需的任何層次進(jìn)行匯總。根據(jù)粒度的劃分標(biāo)準(zhǔn)可以將數(shù)據(jù)劃分為:詳細(xì)數(shù)據(jù)、輕度總結(jié)、高度總結(jié)三級或更多級粒度。粒度的具體劃分將直接影響到數(shù)據(jù)倉庫中的數(shù)據(jù)量以及查詢質(zhì)量。39粒度級別綜合性數(shù)據(jù)細(xì)節(jié)低(如事務(wù))高(如匯總)低高非常高中等到低一年數(shù)據(jù)五年數(shù)據(jù)數(shù)據(jù)量(行數(shù))粒度劃分策略數(shù)據(jù)量(行數(shù))粒度劃分策略10,000,0001,000,000100,00010,000雙重粒度并仔細(xì)設(shè)計雙重粒度仔細(xì)設(shè)計不考慮20,000,00010,000,0001,000,000100,000雙重粒度并仔細(xì)設(shè)計雙重粒度仔細(xì)設(shè)計不考慮數(shù)據(jù)粒度的劃分第一步,是估算數(shù)據(jù)倉庫中將來要使用的數(shù)據(jù)行數(shù)和所需的直接存取存儲設(shè)備數(shù)。每一個表的存儲空間,應(yīng)該是每一個表的數(shù)據(jù)存儲空間和索引存儲空間之和。數(shù)據(jù)粒度的劃分考慮因素:要接受的分析類型可接受的數(shù)據(jù)最低粒度能存儲的數(shù)據(jù)量。粒度的層次定義越高,就越不能在該倉庫中進(jìn)行更細(xì)致的分析。通常在同一模式中使用多重粒度:對不同數(shù)據(jù)采用不同粒度。如存儲資源有一定的限制,只能采用較高粒度的數(shù)據(jù)粒度劃分策略。粒度的確定實質(zhì)上是業(yè)務(wù)決策分析、硬件、軟件和數(shù)據(jù)倉庫使用方法的一個折衷。數(shù)據(jù)粒度劃分策略一定要保證數(shù)據(jù)的粒度確實能夠滿足用戶的決策分析需要,這是數(shù)據(jù)粒度劃分策略中最重要的一個準(zhǔn)則。424.4數(shù)據(jù)倉庫的體系結(jié)構(gòu)數(shù)據(jù)分析/應(yīng)用層
數(shù)據(jù)獲取/管理層數(shù)據(jù)存儲層外部數(shù)據(jù)源
…..
業(yè)務(wù)數(shù)據(jù)倉庫元數(shù)據(jù)
數(shù)據(jù)集市
434.5數(shù)據(jù)倉庫的體系結(jié)構(gòu)單一數(shù)
溫馨提示
- 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
- 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
- 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
- 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負(fù)責(zé)。
- 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請與我們聯(lián)系,我們立即糾正。
- 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時也不承擔(dān)用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。
最新文檔
- 生態(tài)自然保護(hù)游合同
- 狂犬疫苗打完免責(zé)協(xié)議書(2篇)
- 【2022年新課標(biāo)】部編版七年級上冊道德與法治第三單元師長情誼6-7課共5課時聽課評課記錄
- 五年級數(shù)學(xué)上冊蘇教版《認(rèn)識平方千米》聽評課記錄
- 湘教版數(shù)學(xué)七年級上冊《2.5整式的加法和減法(2)》聽評課記錄6
- 人教版九年級數(shù)學(xué)下冊:28.1 《銳角三角函數(shù)》聽評課記錄8
- 湘教版地理八年級下冊:5.1 《四大地理區(qū)域的劃分》 聽課評課記錄
- 湘教版數(shù)學(xué)九年級上冊3.1《比例線段》聽評課記錄
- 七年級(人教版)集體備課聽評課記錄:2.1《整式(1)》
- 人教版數(shù)學(xué)七年級上冊3.4《實際問題與一元一次方程》復(fù)習(xí)聽評課記錄
- 2025年個人學(xué)習(xí)領(lǐng)導(dǎo)講話心得體會和工作措施例文(6篇)
- 2025大連機場招聘109人易考易錯模擬試題(共500題)試卷后附參考答案
- 2020-2025年中國中小企業(yè)行業(yè)市場調(diào)研分析及投資戰(zhàn)略咨詢報告
- 2025-2030年中國電動高爾夫球車市場運行狀況及未來發(fā)展趨勢分析報告
- 物流中心原材料入庫流程
- 河南省濮陽市2024-2025學(xué)年高一上學(xué)期1月期末考試語文試題(含答案)
- 長沙市2025屆中考生物押題試卷含解析
- 2024年08月北京中信銀行北京分行社會招考(826)筆試歷年參考題庫附帶答案詳解
- 2024年芽苗菜市場調(diào)查報告
- 蘇教版二年級數(shù)學(xué)下冊全冊教學(xué)設(shè)計
- 職業(yè)技術(shù)學(xué)院教學(xué)質(zhì)量監(jiān)控與評估處2025年教學(xué)質(zhì)量監(jiān)控督導(dǎo)工作計劃
評論
0/150
提交評論