電子商務(wù)數(shù)據(jù)倉庫_第1頁
電子商務(wù)數(shù)據(jù)倉庫_第2頁
電子商務(wù)數(shù)據(jù)倉庫_第3頁
電子商務(wù)數(shù)據(jù)倉庫_第4頁
電子商務(wù)數(shù)據(jù)倉庫_第5頁
已閱讀5頁,還剩36頁未讀, 繼續(xù)免費閱讀

下載本文檔

版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進(jìn)行舉報或認(rèn)領(lǐng)

文檔簡介

1、數(shù)據(jù)倉庫 數(shù)據(jù)倉庫的定義數(shù)據(jù)倉庫的定義 數(shù)據(jù)倉庫理論的創(chuàng)始人數(shù)據(jù)倉庫理論的創(chuàng)始人W.H.Inmon在其在其Building the Data Warehouse一書中,給出了數(shù)據(jù)倉庫的四個一書中,給出了數(shù)據(jù)倉庫的四個基本特征:基本特征:面向主題,數(shù)據(jù)是集成的,數(shù)據(jù)是不可更新面向主題,數(shù)據(jù)是集成的,數(shù)據(jù)是不可更新的,數(shù)據(jù)是隨時間不斷變化的的,數(shù)據(jù)是隨時間不斷變化的。基本概念n數(shù)據(jù)倉庫定義 數(shù)據(jù)倉庫是一個面向決策主題的、集成的、時變的、非易失、以讀為主的數(shù)據(jù)集合。n數(shù)據(jù)倉庫系統(tǒng)的分類Web數(shù)據(jù)倉庫;并行數(shù)據(jù)倉庫;多維數(shù)據(jù)倉庫;壓縮數(shù)據(jù)倉庫等。nOLAP定義 OLAP是針對某個特定的主題進(jìn)行聯(lián)機(jī)數(shù)據(jù)

2、訪問、處理和分析,通過直觀的方式從多個維度、多種數(shù)據(jù)綜合程度將系統(tǒng)的運營情況展現(xiàn)給用戶。n面向決策主題的 數(shù)據(jù)倉庫圍繞一些主題,排除對于決策無用的數(shù)據(jù),提供特定主體的簡明視圖。n集成的 構(gòu)造數(shù)據(jù)倉庫是將多個異種數(shù)據(jù)源集成在一起,確保命名約定,編碼結(jié)構(gòu),屬性度量等一致性。n時變的 數(shù)據(jù)存儲從歷史的角度提供信息.在數(shù)據(jù)倉庫,隱式或顯式地包含時間元素。n非易失的 數(shù)據(jù)倉庫總是物理地分離存放數(shù)據(jù);由于這種分離,數(shù)據(jù)倉庫不需要事務(wù)處理,恢復(fù)和并發(fā)控制。通常數(shù)據(jù)倉庫只需要兩種數(shù)據(jù)訪問:數(shù)據(jù)的初始化裝入和數(shù)據(jù)訪問。n以讀為主的 數(shù)據(jù)倉庫中的數(shù)據(jù)主要是提供決策進(jìn)行查詢,一般不一定都需要即時更新,可以定期刷新或

3、按需刷新。數(shù)據(jù)倉庫基本特性數(shù)據(jù)倉庫項目流程管理及系統(tǒng)性能管理和監(jiān)控數(shù)據(jù)倉庫項目流程管理及系統(tǒng)性能管理和監(jiān)控OLTP數(shù)據(jù)源數(shù)據(jù)源數(shù)據(jù)倉庫數(shù)據(jù)倉庫數(shù)據(jù)集市數(shù)據(jù)集市數(shù)據(jù)采集及整合數(shù)據(jù)采集及整合數(shù)據(jù)的映射規(guī)則、模型數(shù)據(jù)的映射規(guī)則、模型。 (元數(shù)據(jù)管理)(元數(shù)據(jù)管理)數(shù)據(jù)展現(xiàn)及決策數(shù)據(jù)展現(xiàn)及決策生產(chǎn)財務(wù)結(jié)算外部地區(qū)分析總量分析市場分析ETL數(shù)據(jù)分析、DM終端用戶終端用戶數(shù)據(jù)倉庫體系結(jié)構(gòu)數(shù)據(jù)倉庫的結(jié)構(gòu) 數(shù)據(jù)倉庫中的幾個重要概念 n ETLETL(Extract/Transformation/Load)用戶從數(shù)據(jù)源抽取出所需的數(shù)據(jù),經(jīng)過數(shù)據(jù)清洗、轉(zhuǎn)換,最終按照預(yù)先定義好的數(shù)據(jù)倉庫模型,將數(shù)據(jù)加載到數(shù)據(jù)倉庫中

4、去。n 元數(shù)據(jù)關(guān)于數(shù)據(jù)的數(shù)據(jù),指在數(shù)據(jù)倉庫建設(shè)過程中所產(chǎn)生的有關(guān)數(shù)據(jù)源定義、目標(biāo)定義、轉(zhuǎn)換規(guī)則等相關(guān)的關(guān)鍵數(shù)據(jù)。同時元數(shù)據(jù)還包含關(guān)于數(shù)據(jù)含義的商業(yè)信息。n Data Mart數(shù)據(jù)集市 - 小型的,面向部門或工作組級數(shù)據(jù)倉庫。n Operation Data Store操作數(shù)據(jù)存儲 ODS是能支持企業(yè)日常的全局應(yīng)用的數(shù)據(jù)集合,是不同于DB的一種新的數(shù)據(jù)環(huán)境, 是DW 擴(kuò)展后得到的一個混合形式。四個基本特點:面向主題的(Subject -Oriented)、集成的、可變的、 當(dāng)前或接近當(dāng)前的。n 粒度數(shù)據(jù)倉庫的數(shù)據(jù)單元中保存數(shù)據(jù)的細(xì)化或綜合程度的級別。細(xì)化程度越高,粒度級就越小;相反,細(xì)化程度越低

5、,粒度級就越大。n 分割結(jié)構(gòu)相同的數(shù)據(jù)可以被分成多個數(shù)據(jù)物理單元。任何給定的數(shù)據(jù)單元屬于且僅屬于一個分割。數(shù)據(jù)倉庫中的幾個重要概念 (續(xù))操作數(shù)據(jù)庫與數(shù)據(jù)倉庫的區(qū)別n操作數(shù)據(jù)庫系統(tǒng)的主要任務(wù)是聯(lián)機(jī)事務(wù)處理OLTPn數(shù)據(jù)倉庫在數(shù)據(jù)分析和決策方面為用戶提供服務(wù),這種系統(tǒng)稱為聯(lián)機(jī)分析處理OLAP操作型數(shù)據(jù)操作型數(shù)據(jù)分析型數(shù)據(jù)分析型數(shù)據(jù)細(xì)節(jié)的細(xì)節(jié)的綜合的,或提煉的綜合的,或提煉的在存取瞬間是準(zhǔn)確的在存取瞬間是準(zhǔn)確的代表過去的數(shù)據(jù)代表過去的數(shù)據(jù)可更新可更新不更新不更新操作需求事先可知道操作需求事先可知道操作需求事先不知道操作需求事先不知道生命周期符合生命周期符合SDLC完全不同的生命周期完全不同的生命周

6、期對性能要求高對性能要求高對性能要求寬松對性能要求寬松一個時刻操作一個單元一個時刻操作一個單元一個時刻操作一個集合一個時刻操作一個集合事物驅(qū)動事物驅(qū)動分析驅(qū)動分析驅(qū)動面向應(yīng)用面向應(yīng)用面向分析面向分析一次操作數(shù)據(jù)量小一次操作數(shù)據(jù)量小一次操作數(shù)據(jù)量大一次操作數(shù)據(jù)量大支持日常操作支持日常操作支持管理需求支持管理需求采購子系統(tǒng)采購子系統(tǒng): 訂單(訂單號,供應(yīng)商號,商品號,類別,單價。數(shù)訂單(訂單號,供應(yīng)商號,商品號,類別,單價。數(shù)量,總金額,日期,量,總金額,日期, ) 供應(yīng)商(供應(yīng)商號,供應(yīng)商名,地址,電話,供應(yīng)商(供應(yīng)商號,供應(yīng)商名,地址,電話,)銷售子系統(tǒng):銷售子系統(tǒng): 客戶(客戶號,姓名,地址

7、,電話,客戶(客戶號,姓名,地址,電話, ) 銷售(客戶號,商品號,數(shù)量,單價,日期,銷售(客戶號,商品號,數(shù)量,單價,日期, )庫存子系統(tǒng):庫存子系統(tǒng): 進(jìn)庫單(編號,商品號,數(shù)量,單價,日期,進(jìn)庫單(編號,商品號,數(shù)量,單價,日期, ) 出庫單(編號,商品號,數(shù)量,單價,日期,出庫單(編號,商品號,數(shù)量,單價,日期, ) 庫存(商品號,庫存(商品號, 庫房號,類別,單價,庫存數(shù)量,庫房號,類別,單價,庫存數(shù)量,總金額,日期,總金額,日期, ) 商品固有信息:商品號,類別,單價,顏色,商品固有信息:商品號,類別,單價,顏色, 商品采購信息:商品號,類別,供應(yīng)商號,供應(yīng)商品采購信息:商品號,類

8、別,供應(yīng)商號,供應(yīng)日期,單價,數(shù)量,日期,單價,數(shù)量, 商品銷售信息:商品號,客戶號,數(shù)量,單價,商品銷售信息:商品號,客戶號,數(shù)量,單價,銷售日期,銷售日期, 商品庫存信息:商品號,商品庫存信息:商品號, 庫房號,庫存數(shù)量,日庫房號,庫存數(shù)量,日期,期, )商品主題域:商品主題域:采購子系統(tǒng)采購子系統(tǒng)銷售子系統(tǒng)銷售子系統(tǒng)庫存子系統(tǒng)庫存子系統(tǒng)3、數(shù)據(jù)倉庫中的數(shù)據(jù)組織、數(shù)據(jù)倉庫中的數(shù)據(jù)組織 數(shù)據(jù)倉庫中的數(shù)據(jù)分為四個級別:早期細(xì)節(jié)級,當(dāng)數(shù)據(jù)倉庫中的數(shù)據(jù)分為四個級別:早期細(xì)節(jié)級,當(dāng)前細(xì)節(jié)級,輕度綜合級,高度綜合級。前細(xì)節(jié)級,輕度綜合級,高度綜合級。19851998年年銷售明細(xì)表銷售明細(xì)表199820

9、03年年銷售明細(xì)表銷售明細(xì)表19982003年年每月銷售表每月銷售表19982003年年每季度銷售表每季度銷售表 DW中還有一類重要的數(shù)據(jù):元數(shù)據(jù)(中還有一類重要的數(shù)據(jù):元數(shù)據(jù)(metedata)。)。元數(shù)據(jù)是元數(shù)據(jù)是“關(guān)于數(shù)據(jù)的數(shù)據(jù)關(guān)于數(shù)據(jù)的數(shù)據(jù)”(RDBMS中的數(shù)據(jù)字典中的數(shù)據(jù)字典就是一種元數(shù)據(jù))。就是一種元數(shù)據(jù))。 數(shù)據(jù)倉庫中的元數(shù)據(jù)描述了數(shù)據(jù)的結(jié)構(gòu)、內(nèi)容、索數(shù)據(jù)倉庫中的元數(shù)據(jù)描述了數(shù)據(jù)的結(jié)構(gòu)、內(nèi)容、索引、碼、數(shù)據(jù)轉(zhuǎn)換規(guī)則、粒度定義等。引、碼、數(shù)據(jù)轉(zhuǎn)換規(guī)則、粒度定義等。4、數(shù)據(jù)倉庫系統(tǒng)結(jié)構(gòu)、數(shù)據(jù)倉庫系統(tǒng)結(jié)構(gòu)RDBMS數(shù)據(jù)文件數(shù)據(jù)文件其他其他 綜合數(shù)據(jù)綜合數(shù)據(jù) 當(dāng)前數(shù)據(jù)當(dāng)前數(shù)據(jù) 歷史數(shù)據(jù)歷

10、史數(shù)據(jù) 元數(shù)據(jù)元數(shù)據(jù) 抽取、轉(zhuǎn)換、裝載抽取、轉(zhuǎn)換、裝載數(shù)據(jù)倉庫數(shù)據(jù)倉庫OLAP工具工具 DM工具工具 查詢工具查詢工具分析工具分析工具二、數(shù)據(jù)倉庫設(shè)計二、數(shù)據(jù)倉庫設(shè)計 數(shù)據(jù)倉庫的設(shè)計分為如下三個階段:數(shù)據(jù)倉庫的設(shè)計分為如下三個階段: 數(shù)據(jù)倉庫建模數(shù)據(jù)倉庫建模 分析主題域分析主題域 確定粒度層次確定粒度層次 確定數(shù)據(jù)分割策略確定數(shù)據(jù)分割策略 構(gòu)建數(shù)據(jù)倉庫構(gòu)建數(shù)據(jù)倉庫 數(shù)據(jù)的存儲結(jié)構(gòu)與存儲策略數(shù)據(jù)的存儲結(jié)構(gòu)與存儲策略 DSS應(yīng)用編程應(yīng)用編程 三、操作數(shù)據(jù)存儲(三、操作數(shù)據(jù)存儲(ODS ) 在許多情況下,在許多情況下,DB-DW的兩層體系結(jié)構(gòu)并不適合的兩層體系結(jié)構(gòu)并不適合企業(yè)的數(shù)據(jù)處理要求。因為,雖

11、然可以粗略地把數(shù)據(jù)處企業(yè)的數(shù)據(jù)處理要求。因為,雖然可以粗略地把數(shù)據(jù)處理分成操作型和分析型,但這兩種處理處理并不是涇渭理分成操作型和分析型,但這兩種處理處理并不是涇渭分明的。分明的。 ODS(Operational Data Store)作為一個中間層次,)作為一個中間層次,一方面,它包含企業(yè)全局一致的、細(xì)節(jié)的、當(dāng)前的或接一方面,它包含企業(yè)全局一致的、細(xì)節(jié)的、當(dāng)前的或接近當(dāng)前的數(shù)據(jù),另一方面,它又是一個面向主題、集成近當(dāng)前的數(shù)據(jù),另一方面,它又是一個面向主題、集成的數(shù)據(jù)環(huán)境,適合完成日常決策的分析處理。的數(shù)據(jù)環(huán)境,適合完成日常決策的分析處理。四、數(shù)據(jù)倉庫的實現(xiàn)四、數(shù)據(jù)倉庫的實現(xiàn) 數(shù)據(jù)倉庫的工具主

12、要有:數(shù)據(jù)預(yù)處理工具,數(shù)據(jù)數(shù)據(jù)倉庫的工具主要有:數(shù)據(jù)預(yù)處理工具,數(shù)據(jù)分析(分析( OLAP )工具,數(shù)據(jù)挖掘工具,)工具,數(shù)據(jù)挖掘工具,OLAP服務(wù)器。服務(wù)器。 數(shù)據(jù)倉庫和數(shù)據(jù)倉庫和OLAP工具基于工具基于多維數(shù)據(jù)模型多維數(shù)據(jù)模型(在數(shù)據(jù)(在數(shù)據(jù)倉庫中,通常以多維方式來存儲數(shù)據(jù)。倉庫中,通常以多維方式來存儲數(shù)據(jù)。 )。)?;靖拍罨靖拍?維維:人們觀察數(shù)據(jù)的特定角度。:人們觀察數(shù)據(jù)的特定角度。 維的層次維的層次:人們觀察數(shù)據(jù)的特定角度可能存在細(xì)節(jié):人們觀察數(shù)據(jù)的特定角度可能存在細(xì)節(jié)程度不同的多個描述方面,我們稱其為維的層次。程度不同的多個描述方面,我們稱其為維的層次。多維分析的基本動作多維分

13、析的基本動作 切片,旋轉(zhuǎn),上卷,下鉆切片,旋轉(zhuǎn),上卷,下鉆。lSales volume as a function of product, month, and regionProductRegionMonthDimensions: Product, Location, TimeHierarchical summarization pathsIndustry Region YearCategory Country QuarterProduct City Month Week Office DayTotal annual salesof TV in U.S.A.DateProductCountr

14、ysumsum TVVCRPC1Qtr2Qtr3Qtr4QtrU.S.ACanadaMexicosum 產(chǎn)品銷售 情況某年某月產(chǎn)品銷售情況選定兩個維:產(chǎn)品維和地區(qū)維選定兩個維:產(chǎn)品維和地區(qū)維時間維時間維數(shù)據(jù)切片數(shù)據(jù)切片產(chǎn)品維產(chǎn)品維地區(qū)維地區(qū)維產(chǎn)品維產(chǎn)品維地區(qū)維地區(qū)維基于RDBMS的數(shù)據(jù)倉庫實現(xiàn) 關(guān)系數(shù)據(jù)庫將多維數(shù)據(jù)庫中的多維結(jié)構(gòu)分為兩類:關(guān)系數(shù)據(jù)庫將多維數(shù)據(jù)庫中的多維結(jié)構(gòu)分為兩類:一類是事實表,用來存儲事實的度量值以及各個維的碼一類是事實表,用來存儲事實的度量值以及各個維的碼值;另一類是維表。值;另一類是維表。 數(shù)據(jù)倉庫的設(shè)計模型有數(shù)據(jù)倉庫的設(shè)計模型有:星型模式,雪花模式,混星型模式,雪花模式

15、,混合模式合模式 數(shù)據(jù)倉庫的設(shè)計也可以理解為面向數(shù)據(jù)倉庫的設(shè)計也可以理解為面向OLAP的數(shù)據(jù)庫的數(shù)據(jù)庫設(shè)計。設(shè)計。 在星型模式中,主要數(shù)據(jù)存儲在事實表中,沒有在星型模式中,主要數(shù)據(jù)存儲在事實表中,沒有冗余,并符合冗余,并符合3NF或或BCNF。 維值信息存儲在維表中。維表一般不需要規(guī)范化。維值信息存儲在維表中。維表一般不需要規(guī)范化。主要原因是維表是靜態(tài)的,是否會產(chǎn)生因更新而導(dǎo)致主要原因是維表是靜態(tài)的,是否會產(chǎn)生因更新而導(dǎo)致異常也就不重要了。異常也就不重要了。ProductsPid pname category priceLocationsLocid city state countryPid

16、timeid locid salesTimeid date month quarter year holiday_flagTimesSales定單號定單號銷售員號銷售員號客戶號客戶號產(chǎn)品號產(chǎn)品號日期標(biāo)識日期標(biāo)識地區(qū)名稱地區(qū)名稱數(shù)量數(shù)量總價總價定單號定單號定貨日期定貨日期客戶號客戶號客戶名稱客戶名稱客戶地址客戶地址銷售員號銷售員號姓名姓名城市城市產(chǎn)品號產(chǎn)品號產(chǎn)品名稱產(chǎn)品名稱單價單價日期標(biāo)識日期標(biāo)識日日月月年年地區(qū)名稱地區(qū)名稱省省事實表事實表星型模式星型模式定單號定單號銷售員號銷售員號客戶號客戶號產(chǎn)品號產(chǎn)品號日期標(biāo)識日期標(biāo)識地區(qū)名稱地區(qū)名稱數(shù)量數(shù)量總價總價定單號定單號定貨日期定貨日期客戶號客戶號客

17、戶名稱客戶名稱客戶地址客戶地址銷售員號銷售員號姓名姓名城市城市產(chǎn)品號產(chǎn)品號產(chǎn)品名稱產(chǎn)品名稱單價單價日期標(biāo)識日期標(biāo)識日日月月年年地區(qū)名稱地區(qū)名稱省省事實表事實表雪花模式雪花模式產(chǎn)品號產(chǎn)品號公司代碼公司代碼公司代碼公司代碼公司名稱公司名稱地址地址27銷售記錄代碼報修記錄代碼服務(wù)響應(yīng)代碼服務(wù)反饋代碼安全備件數(shù)量銷售記錄代碼客戶代碼商品代碼購買時間代碼報修記錄代碼報修時間故障現(xiàn)象服務(wù)響應(yīng)代碼服務(wù)人員代碼預(yù)判故障代碼預(yù)判備件代碼響應(yīng)時間代碼預(yù)約時間代碼服務(wù)承諾時間服務(wù)反饋代碼實際故障代碼到達(dá)時間代碼故障處理完畢時間代碼實際使用備件代碼服務(wù)承諾時間客戶代碼客戶名稱客戶地址聯(lián)系方式商品代碼商品名稱商品類型時

18、間代碼小時天月年故障代碼故障名稱故障描述故障機(jī)型故障類別備件代碼備件名稱備件類型備件庫存量時間代碼小時天月年人員代碼人員名稱技術(shù)專長人員薪酬服務(wù)事實表報修維表時間維表服務(wù)響應(yīng)維表人員維表故障維表備件維表服務(wù)反饋維表銷售記錄維表商品維表時間維表客戶維表時間代碼小時天月年時間維表數(shù)據(jù)倉庫的主要應(yīng)用n信息處理支持查詢和基本的統(tǒng)計分析,并使用表或圖進(jìn)行報告。n分析處理支持基本的OLAP操作,在匯總的和細(xì)節(jié)的歷史數(shù)據(jù)上操作。n數(shù)據(jù)挖掘支持知識發(fā)現(xiàn),包括找出隱藏的模式和關(guān)聯(lián),構(gòu)造分析模型,進(jìn)行分類和預(yù)測,并用可視化工具提供挖掘結(jié)果.OLAP發(fā)展背景n60年代,關(guān)系數(shù)據(jù)庫之父E.F.Codd提出了關(guān)系模型,

19、促進(jìn)了聯(lián)機(jī)事務(wù)處理(OLTP)的發(fā)展(數(shù)據(jù)以表格的形式而非文件方式存儲)。1993年,E.F.Codd提出了OLAP概念,認(rèn)為OLTP已不能滿足終端用戶對數(shù)據(jù)庫查詢分析的需要,SQL對大型數(shù)據(jù)庫進(jìn)行的簡單查詢也不能滿足終端用戶分析的要求。用戶的決策分析需要對關(guān)系數(shù)據(jù)庫進(jìn)行大量計算才能得到結(jié)果,而查詢的結(jié)果并不能滿足決策者提出的需求。因此,E.F.Codd提出了多維數(shù)據(jù)庫和多維分析的概念,即OLAP。n OLTP數(shù)據(jù) OLAP數(shù)據(jù)n 原始數(shù)據(jù) 導(dǎo)出數(shù)據(jù)n 細(xì)節(jié)性數(shù)據(jù) 綜合性和提煉性數(shù)據(jù)n 當(dāng)前值數(shù)據(jù) 歷史數(shù)據(jù)n 可更新 不可更新,但周期性刷新n 一次處理的數(shù)據(jù)量小 一次處理的數(shù)據(jù)量大n面向應(yīng)用,

20、事務(wù)驅(qū)動 面向分析,分析驅(qū)動n面向操作人員,支持日常操作 面向決策人員,支持管理需要什么是OLAP?n定義1 :OLAP(聯(lián)機(jī)分析處理)是針對特定問題的聯(lián)機(jī)數(shù)據(jù)訪問和分析。通過對信息(維數(shù)據(jù))的多種可能的觀察形式進(jìn)行快速、穩(wěn)定一致和交互性的存取,允許管理決策人員對數(shù)據(jù)進(jìn)行深入觀察。n定義2 :OLAP(聯(lián)機(jī)分析處理) 是使分析人員、管理人員或執(zhí)行人員能夠從多種角度對從原始數(shù)據(jù)中轉(zhuǎn)化出來的、能夠真正為用戶所理解的、并真實反映企業(yè)維特性的信息進(jìn)行快速、一致、交互地存取,從而獲得對數(shù)據(jù)的更深入了解的一類軟件技術(shù)。(OLAP委員會的定義)nOLAP的目標(biāo)是滿足決策支持或多維環(huán)境特定的查詢和報表需求,它

21、的技術(shù)核心是“維”這個概念,因此OLAP也可以說是多維數(shù)據(jù)分析工具的集合。OLAP相關(guān)基本概念1)維:是人們觀察數(shù)據(jù)的特定角度,是考慮問題時的一類屬性,屬性集合構(gòu)成一個維(時間維、地理維等)。2)維的層次:人們觀察數(shù)據(jù)的某個特定角度(即某個維)還可以存在細(xì)節(jié)程度不同的各個描述方面(時間維:日期、月份、季度、年)。3)維的成員:維的一個取值。是數(shù)據(jù)項在某維中位置的描述。(“某年某月某日”是在時間維上位置的描述)4)多維數(shù)組:維和變量的組合表示。一個多維數(shù)組可以表示為:(維1,維2,維n,變量)。(時間,地區(qū),產(chǎn)品,銷售額)5)數(shù)據(jù)單元(單元格):多維數(shù)組的取值。(2000年1月,上海,筆記本電腦

22、,$100000)OLAP特性n(1)快速性:用戶對OLAP的快速反應(yīng)能力有很高的要求。系統(tǒng)應(yīng)能在5秒內(nèi)對用戶的大部分分析要求做出反應(yīng)。n(2)可分析性:OLAP系統(tǒng)應(yīng)能處理與應(yīng)用有關(guān)的任何邏輯分析和統(tǒng)計分析。n(3)多維性:多維性是OLAP的關(guān)鍵屬性。系統(tǒng)必須提供對數(shù)據(jù)的多維視圖和分析,包括對層次維和多重層次維的完全支持。n(4)信息性:不論數(shù)據(jù)量有多大,也不管數(shù)據(jù)存儲在何處,OLAP系統(tǒng)應(yīng)能及時獲得信息,并且管理大容量信息。OLAP基本操作n上卷操作:通過維層次,在數(shù)據(jù)立方體上進(jìn)行聚集。n下鉆操作:是上卷操作的逆操作,由不太詳細(xì)的數(shù)據(jù)到更詳細(xì)的數(shù)據(jù)。n切片和切塊:切片在給定的數(shù)據(jù)立方體的一

23、個維上進(jìn)行選擇,切塊則是在兩個或兩個以上的維進(jìn)行選擇。n旋轉(zhuǎn)操作:是改變維度的位置關(guān)系,使最終用戶可以從其他視角來觀察多維數(shù)據(jù)。OLTP和OLAP的區(qū)別n用戶和系統(tǒng)的面向性:OLTP是面向顧客的,用于事務(wù)和查詢處理;OLAP是面向市場的,用于數(shù)據(jù)分析。n數(shù)據(jù)內(nèi)容:OLTP系統(tǒng)管理當(dāng)前數(shù)據(jù);OLAP系統(tǒng)管理大量歷史數(shù)據(jù),提供匯總和聚集機(jī)制。n數(shù)據(jù)庫設(shè)計:OLTP采用實體-聯(lián)系ER模型和面向應(yīng)用的數(shù)據(jù)庫設(shè)計;OLAP采用星型或雪花模型和面向主題的數(shù)據(jù)庫設(shè)計。n視圖:OLTP主要關(guān)注一個企業(yè)或部門內(nèi)部的當(dāng)前數(shù)據(jù),不涉及歷史數(shù)據(jù)或不同組織的數(shù)據(jù);OLAP則相反,不僅關(guān)注本企業(yè)或組織內(nèi)部的當(dāng)前數(shù)據(jù),而且更多地涉及到歷史數(shù)據(jù)和其他組織的數(shù)據(jù)。n訪問模式:OLTP系統(tǒng)的訪問主要由短的原子事務(wù)組成,這種系統(tǒng)需要并行和恢復(fù)機(jī)制。OLAP系統(tǒng)的訪問大部分是只讀操作。OLTP和OLAP的區(qū)別(續(xù))OLAP服務(wù)器類型n關(guān)系OLAP(ROLAP)模型使用關(guān)系或擴(kuò)充關(guān)系DBMS存放并管理數(shù)據(jù)倉庫。n多維OLAP(MOLAP)服務(wù)器這些服務(wù)器通過基于數(shù)組的多維存儲,支持?jǐn)?shù)組的多維視圖。n混合OLAP(HOLAP)服務(wù)器結(jié)合ROLAP和MOLAP技術(shù),得宜于ROLAP的可伸縮性和MOLAP的快速計算。ROLAP

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負(fù)責(zé)。
  • 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時也不承擔(dān)用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

評論

0/150

提交評論