高級數(shù)據(jù)庫技術(shù)-高級數(shù)據(jù)庫技術(shù)10-DW+olap原理-課件_第1頁
高級數(shù)據(jù)庫技術(shù)-高級數(shù)據(jù)庫技術(shù)10-DW+olap原理-課件_第2頁
高級數(shù)據(jù)庫技術(shù)-高級數(shù)據(jù)庫技術(shù)10-DW+olap原理-課件_第3頁
高級數(shù)據(jù)庫技術(shù)-高級數(shù)據(jù)庫技術(shù)10-DW+olap原理-課件_第4頁
高級數(shù)據(jù)庫技術(shù)-高級數(shù)據(jù)庫技術(shù)10-DW+olap原理-課件_第5頁
已閱讀5頁,還剩59頁未讀 繼續(xù)免費(fèi)閱讀

下載本文檔

版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進(jìn)行舉報(bào)或認(rèn)領(lǐng)

文檔簡介

數(shù)據(jù)倉庫與olap分析高級數(shù)據(jù)庫技術(shù)課程講義郭玉彬數(shù)據(jù)倉庫與olap分析高級數(shù)據(jù)庫技術(shù)課程講義數(shù)據(jù)倉庫與OLAP分析數(shù)據(jù)倉庫原理與實(shí)現(xiàn)技術(shù)ETL原理與實(shí)現(xiàn)技術(shù)數(shù)據(jù)倉庫與OLAP分析數(shù)據(jù)倉庫原理與實(shí)現(xiàn)技術(shù)

--技術(shù)現(xiàn)狀數(shù)據(jù)倉庫原理與實(shí)現(xiàn)技術(shù)

2007年olap技術(shù)發(fā)展:

Microsoft收購專業(yè)開發(fā)企業(yè)分析軟件的ProClarity,還發(fā)布了PerformancePointServer2007Oracle發(fā)布了具有內(nèi)嵌OLAP功能的數(shù)據(jù)庫產(chǎn)品10g,以及在2007年收購了專業(yè)的BI公司Hyperion數(shù)據(jù)倉庫原理與實(shí)現(xiàn)技術(shù)

--技術(shù)現(xiàn)狀2007年olap技術(shù)發(fā)展:數(shù)據(jù)倉庫原理與實(shí)現(xiàn)技術(shù)

數(shù)據(jù)倉庫原理與實(shí)現(xiàn)技術(shù)

--技術(shù)現(xiàn)狀Oracle的數(shù)據(jù)倉庫解決方案OracleExpress:OracleExpressServer是一個(gè)MOLAP(多維OLAP)服務(wù)器OracleExpressWebAgent支持基于Web的動態(tài)多維數(shù)據(jù)展現(xiàn)OracleExpressObjects前端數(shù)據(jù)分析工具,提供圖形化建模和假設(shè)分析功能,支持可視化開發(fā)和事件驅(qū)動編程技術(shù),提供兼容VisualBasic語法的語言,支持OCX和OLE;OracleExpressAnalyzer是通用的、面向最終用戶的報(bào)告和分析工具(目前僅支持Windows平臺)。OracleDiscoverer即席查詢工具是專門為最終用戶設(shè)計(jì)的,分為最終用戶版和管理員版。

數(shù)據(jù)倉庫原理與實(shí)現(xiàn)技術(shù)

數(shù)據(jù)倉庫原理與實(shí)現(xiàn)技術(shù)

--技術(shù)現(xiàn)狀Microsoft將OLAP功能集成到MicrosoftSQLServer7.0中,提供可擴(kuò)充的基于COM的OLAP接口。它通過一系列服務(wù)程序支持?jǐn)?shù)據(jù)倉庫應(yīng)用。

Sybase---WarehouseStudio包括數(shù)據(jù)倉庫的建模、數(shù)據(jù)抽取與轉(zhuǎn)換、數(shù)據(jù)存儲與管理、元數(shù)據(jù)管理以及可視化數(shù)據(jù)分析等工具。數(shù)據(jù)倉庫原理與實(shí)現(xiàn)技術(shù)

數(shù)據(jù)倉庫原理與實(shí)現(xiàn)技術(shù)

--技術(shù)現(xiàn)狀I(lǐng)BM:基于可視數(shù)據(jù)倉庫的商業(yè)智能(BI)解決方案,包括:VisualWarehouse(VW)、Essbase/DB2OLAPServer5.0、IBMDB2UDB,以及來自第三方的前端數(shù)據(jù)展現(xiàn)工具(如BO)和數(shù)據(jù)挖掘工具(如SAS)。BusinessObjects(BO)是集查詢、報(bào)表和OLAP技術(shù)為一身的智能決策支持系統(tǒng)。

SAS公司90年代加入數(shù)據(jù)倉庫市場的競爭,并提供了特點(diǎn)鮮明的數(shù)據(jù)倉庫解決方案,包括30多個(gè)專用模塊。數(shù)據(jù)倉庫原理與實(shí)現(xiàn)技術(shù)

數(shù)據(jù)倉庫原理與實(shí)現(xiàn)技術(shù)

--系統(tǒng)分層結(jié)構(gòu)圖數(shù)據(jù)層各種數(shù)據(jù)源計(jì)算層關(guān)系數(shù)據(jù)庫XML文本文件透視表服務(wù)數(shù)據(jù)挖掘其它可視化控制層呈現(xiàn)層數(shù)據(jù)倉庫原理與實(shí)現(xiàn)技術(shù)

系統(tǒng)總體架構(gòu)圖系統(tǒng)總體架構(gòu)圖數(shù)據(jù)倉庫原理與實(shí)現(xiàn)技術(shù)

--模塊劃分元數(shù)據(jù)(MetaData)數(shù)據(jù)立方體預(yù)計(jì)算(PreComputation)數(shù)據(jù)立方體查詢(QueryComputation)MDX解析(MDXParser)XMLA引擎(Engine)管理控制臺(ManagerConsole)XODBC數(shù)據(jù)訪問(XODBC)ETL數(shù)據(jù)倉庫原理與實(shí)現(xiàn)技術(shù)

數(shù)據(jù)倉庫基礎(chǔ)知識

--與數(shù)據(jù)庫區(qū)別用戶和系統(tǒng)的面向性:OLTP是面向顧客的,用于事務(wù)和查詢處理OLAP是面向市場的,用于數(shù)據(jù)分析數(shù)據(jù)內(nèi)容:OLTP系統(tǒng)管理當(dāng)前數(shù)據(jù).OLAP系統(tǒng)管理大量歷史數(shù)據(jù),提供匯總和聚集機(jī)制.是多操作數(shù)據(jù)庫系統(tǒng)中分離出來的用以提高兩個(gè)系統(tǒng)的性能數(shù)據(jù)倉庫基礎(chǔ)知識

數(shù)據(jù)倉庫原理與實(shí)現(xiàn)技術(shù)

--元數(shù)據(jù)管理技術(shù)現(xiàn)狀OMG組織的CWM標(biāo)準(zhǔn)(CommonWarehouseMetamodel)

一個(gè)特定于數(shù)據(jù)倉庫領(lǐng)域的元數(shù)據(jù)模型集,它獨(dú)立于具體數(shù)據(jù)倉庫的實(shí)現(xiàn),包含了各類有代表性的數(shù)據(jù)倉庫元數(shù)據(jù)的有效描述。已被IBM、UNISYS、NCR、Hyperion、Oracle等多家公司支持。較成熟的元數(shù)據(jù)管理解決方案Microsoft的MetaDataServiceSybase的WCC數(shù)據(jù)倉庫原理與實(shí)現(xiàn)技術(shù)

數(shù)據(jù)倉庫原理與實(shí)現(xiàn)技術(shù)

--元數(shù)據(jù)管理數(shù)據(jù)倉庫原理與實(shí)現(xiàn)技術(shù)

數(shù)據(jù)倉庫原理與實(shí)現(xiàn)技術(shù)

--元數(shù)據(jù)管理元數(shù)據(jù)業(yè)務(wù)流程圖解析XML文件XMl文件XML解析器元數(shù)據(jù)對象容器創(chuàng)建元數(shù)據(jù)對象數(shù)據(jù)庫或文本加載成員信息數(shù)據(jù)倉庫原理與實(shí)現(xiàn)技術(shù)

數(shù)據(jù)倉庫原理與實(shí)現(xiàn)技術(shù)

--元數(shù)據(jù)管理數(shù)據(jù)倉庫并沒有嚴(yán)格的數(shù)學(xué)理論基礎(chǔ),也沒有成熟的基本模式,具有強(qiáng)烈的工程性。從工作過程等方面來分析,其關(guān)鍵技術(shù):數(shù)據(jù)的抽取存儲與管理數(shù)據(jù)的表現(xiàn)數(shù)據(jù)倉庫原理與實(shí)現(xiàn)技術(shù)

數(shù)據(jù)倉庫基礎(chǔ)知識

--所研究主要問題數(shù)據(jù)的抽?。瓟?shù)據(jù)進(jìn)入倉庫的入口。通過抽取過程將數(shù)據(jù)從聯(lián)機(jī)事務(wù)處理系統(tǒng)、外部數(shù)據(jù)源、脫機(jī)的數(shù)據(jù)存儲介質(zhì)中導(dǎo)入到數(shù)據(jù)倉庫。數(shù)據(jù)抽取在技術(shù)上主要涉及互連、復(fù)制、增量、轉(zhuǎn)換、調(diào)度和監(jiān)控等方面。防止”GarbageInGarbageOut”數(shù)據(jù)倉庫基礎(chǔ)知識

數(shù)據(jù)倉庫基礎(chǔ)知識

--所研究主要問題數(shù)據(jù)的存儲和管理數(shù)據(jù)倉庫的組織管理方式?jīng)Q定了它有別于傳統(tǒng)數(shù)據(jù)庫,同時(shí)也決定了其對外部數(shù)據(jù)的表現(xiàn)形式。要決定采用什么產(chǎn)品和技術(shù)來建立數(shù)據(jù)倉庫的核心,則需要從數(shù)據(jù)倉庫的技術(shù)特點(diǎn)著手分析。數(shù)據(jù)倉庫基礎(chǔ)知識

數(shù)據(jù)倉庫基礎(chǔ)知識

--所研究主要問題數(shù)據(jù)表現(xiàn)--數(shù)據(jù)倉庫的門面主要集中在多維分析、數(shù)理統(tǒng)計(jì)和數(shù)據(jù)挖掘方面。多維分析又是數(shù)據(jù)倉庫的重要表現(xiàn)形式,近幾年來由于互聯(lián)網(wǎng)的發(fā)展,使得多維分析領(lǐng)域的工具和產(chǎn)品更加注重提供基于Web前端聯(lián)機(jī)分析界面,而不僅僅是在網(wǎng)上發(fā)布數(shù)據(jù)。

數(shù)據(jù)倉庫基礎(chǔ)知識

數(shù)據(jù)倉庫基礎(chǔ)知識

--數(shù)據(jù)倉庫系統(tǒng)的體系結(jié)構(gòu)

數(shù)據(jù)倉庫基礎(chǔ)知識

數(shù)據(jù)倉庫基礎(chǔ)知識

--數(shù)據(jù)倉庫系統(tǒng)的體系結(jié)構(gòu)數(shù)據(jù)源--數(shù)據(jù)倉庫系統(tǒng)的基礎(chǔ),是整個(gè)系統(tǒng)的數(shù)據(jù)源泉。通常包括企業(yè)內(nèi)部信息和外部信息。內(nèi)部信息包括各種業(yè)務(wù)處理數(shù)據(jù)和各類文檔數(shù)據(jù)。外部信息包括各類法律法規(guī)、市場信息和競爭對手的信息等等。

數(shù)據(jù)倉庫基礎(chǔ)知識

數(shù)據(jù)倉庫基礎(chǔ)知識

--數(shù)據(jù)倉庫系統(tǒng)的體系結(jié)構(gòu)數(shù)據(jù)存儲與管理數(shù)據(jù)倉庫的組織管理方式要決定采用什么產(chǎn)品和技術(shù)來建立數(shù)據(jù)倉庫的核心,則需要從數(shù)據(jù)倉庫的技術(shù)特點(diǎn)著手分析。針對現(xiàn)有各業(yè)務(wù)系統(tǒng)的數(shù)據(jù),進(jìn)行抽取、清理,并有效集成,按照主題進(jìn)行組織。數(shù)據(jù)倉庫按照數(shù)據(jù)的覆蓋范圍可以分為企業(yè)級數(shù)據(jù)倉庫和部門級數(shù)據(jù)倉庫(通常稱為數(shù)據(jù)集市)。虛擬數(shù)據(jù)倉庫—一種特殊存儲的數(shù)據(jù)倉庫

數(shù)據(jù)倉庫基礎(chǔ)知識

數(shù)據(jù)倉庫基礎(chǔ)知識

--數(shù)據(jù)倉庫系統(tǒng)的體系結(jié)構(gòu)OLAP服務(wù)器對分析需要的數(shù)據(jù)進(jìn)行有效集成,按多維模型予以組織,以便進(jìn)行多角度、多層次的分析,并發(fā)現(xiàn)趨勢。聚合數(shù)據(jù)存放于多維數(shù)據(jù)庫中。數(shù)據(jù)倉庫基礎(chǔ)知識

數(shù)據(jù)倉庫基礎(chǔ)知識

--數(shù)據(jù)倉庫系統(tǒng)的體系結(jié)構(gòu)

前端工具包括各種報(bào)表工具、查詢工具、數(shù)據(jù)分析工具、數(shù)據(jù)挖掘工具以及各種基于數(shù)據(jù)倉庫或數(shù)據(jù)集市的應(yīng)用開發(fā)工具。其中數(shù)據(jù)分析工具主要針對OLAP服務(wù)器報(bào)表工具、數(shù)據(jù)挖掘工具主要針對數(shù)據(jù)倉庫。

數(shù)據(jù)倉庫基礎(chǔ)知識

數(shù)據(jù)倉庫基礎(chǔ)知識

--一個(gè)實(shí)例采購子系統(tǒng):訂單(訂單號,供應(yīng)商號,商品號,類別,單價(jià)。數(shù)量,總金額,日期,…)供應(yīng)商(供應(yīng)商號,供應(yīng)商名,地址,電話,…)銷售子系統(tǒng):客戶(客戶號,姓名,地址,電話,…)銷售(客戶號,商品號,數(shù)量,單價(jià),日期,…)庫存子系統(tǒng):進(jìn)庫單(編號,商品號,數(shù)量,單價(jià),日期,…)出庫單(編號,商品號,數(shù)量,單價(jià),日期,…)庫存(商品號,庫房號,類別,單價(jià),庫存數(shù)量,總金額,日期,…)數(shù)據(jù)倉庫基礎(chǔ)知識

商品固有信息:商品號,類別,單價(jià),顏色,…商品采購信息:商品號,類別,供應(yīng)商號,供應(yīng)日期,單價(jià),數(shù)量,…商品銷售信息:商品號,客戶號,數(shù)量,單價(jià),銷售日期,…商品庫存信息:商品號,庫房號,庫存數(shù)量,日期,…)商品主題域:采購子系統(tǒng)銷售子系統(tǒng)庫存子系統(tǒng)商品主題域:采購子系統(tǒng)銷售子系統(tǒng)庫存子系統(tǒng)3、數(shù)據(jù)倉庫中的數(shù)據(jù)組織數(shù)據(jù)倉庫中的數(shù)據(jù)分為四個(gè)級別:早期細(xì)節(jié)級,當(dāng)前細(xì)節(jié)級,輕度綜合級,高度綜合級。1985~1998年銷售明細(xì)表1998~2003年銷售明細(xì)表1998~2003年每月銷售表1998~2003年每季度銷售表3、數(shù)據(jù)倉庫中的數(shù)據(jù)組織1985~1998年1998~200數(shù)據(jù)倉庫與數(shù)據(jù)挖掘數(shù)據(jù)倉庫基礎(chǔ)知識OLAP分析與多維數(shù)據(jù)模型數(shù)據(jù)倉庫實(shí)施過程數(shù)據(jù)倉庫與ETL原理數(shù)據(jù)倉庫與數(shù)據(jù)挖掘數(shù)據(jù)倉庫基礎(chǔ)知識多維數(shù)據(jù)模型與OLAP分析

--多維數(shù)據(jù)模型數(shù)據(jù)倉庫和OLAP工具基于多維數(shù)據(jù)模型,該模型將數(shù)據(jù)看作數(shù)據(jù)立方體形式數(shù)據(jù)立方體允許以多維對數(shù)據(jù)建模和觀察.多維數(shù)據(jù)模型與OLAP分析

多維數(shù)據(jù)模型與OLAP分析

--多維數(shù)據(jù)模型基本概念

維:人們觀察數(shù)據(jù)的特定角度。

維的層次:人們觀察數(shù)據(jù)的特定角度可能存在細(xì)節(jié)程度不同的多個(gè)描述方面,我們稱其為維的層次。多維分析的基本動作

切片,旋轉(zhuǎn),上卷,下鉆(OLAP中使用)多維數(shù)據(jù)模型與OLAP分析

Salesvolumeasafunctionofproduct,month,andregionProductRegionMonthDimensions:Product,Location,TimeHierarchicalsummarizationpathsIndustryRegionYearCategoryCountryQuarterProductCityMonthWeekOfficeDaySalesvolumeasafunctionofTotalannualsalesofTVinU.S.A.DateProductCountryAll,All,Allsumsum

TVVCRPC1Qtr2Qtr3Qtr4QtrU.S.ACanadaMexicosumTotalannualsalesDateProductC

產(chǎn)品銷售情況某年某月產(chǎn)品銷售情況選定兩個(gè)維:產(chǎn)品維和地區(qū)維時(shí)間維數(shù)據(jù)切片產(chǎn)品維地區(qū)維產(chǎn)品維地區(qū)維產(chǎn)品銷售某年某月產(chǎn)品銷售情況選定兩個(gè)維:產(chǎn)品維和地區(qū)維時(shí)多維數(shù)據(jù)模型與OLAP分析

--多維數(shù)據(jù)模型基于RDBMS的數(shù)據(jù)倉庫實(shí)現(xiàn)關(guān)系數(shù)據(jù)庫將多維數(shù)據(jù)庫中的多維結(jié)構(gòu)分為兩類:一類是事實(shí)表,用來存儲事實(shí)的度量值以及各個(gè)維的碼值;另一類是維表。數(shù)據(jù)倉庫的設(shè)計(jì)模型有:星型模式,雪花模式,混合模式數(shù)據(jù)倉庫的設(shè)計(jì)也可以理解為面向OLAP的數(shù)據(jù)庫設(shè)計(jì)。多維數(shù)據(jù)模型與OLAP分析

多維數(shù)據(jù)模型與OLAP分析

--多維數(shù)據(jù)模型星型,雪花和事實(shí)星座模式是主要的存在形式星型模式包含一個(gè)大的包含大批數(shù)據(jù)的事實(shí)表和一系列維表.雪花模式是星型模式的變種,不同的是將某些維表規(guī)范化.事實(shí)星座模式對應(yīng)多個(gè)事實(shí)表共享維表.多維數(shù)據(jù)模型與OLAP分析

在星型模式中,主要數(shù)據(jù)存儲在事實(shí)表中,沒有冗余,并符合3NF或BCNF。維值信息存儲在維表中。維表不需要規(guī)范化。主要原因是維表是靜態(tài)的,不關(guān)心更新異常ProductsPidpnamecategorypriceLocationsLocidcitystatecountryPidtimeidlocidsalesTimeiddatemonthquarteryearholiday_flagTimesSales在星型模式中,主要數(shù)據(jù)存儲在事實(shí)表中,沒有冗定單號銷售員號客戶號產(chǎn)品號日期標(biāo)識地區(qū)名稱數(shù)量總價(jià)定單號定貨日期客戶號客戶名稱客戶地址銷售員號姓名城市產(chǎn)品號產(chǎn)品名稱單價(jià)日期標(biāo)識日月年地區(qū)名稱省事實(shí)表星型模式定單號定單號客戶號銷售員號產(chǎn)品號日期標(biāo)識地區(qū)名稱事實(shí)表星型模定單號銷售員號客戶號產(chǎn)品號日期標(biāo)識地區(qū)名稱數(shù)量總價(jià)定單號定貨日期客戶號客戶名稱客戶地址銷售員號姓名城市產(chǎn)品號產(chǎn)品名稱單價(jià)日期標(biāo)識日月年地區(qū)名稱省事實(shí)表雪花模式產(chǎn)品號公司代碼公司代碼公司名稱地址定單號定單號客戶號銷售員號產(chǎn)品號日期標(biāo)識地區(qū)名稱事實(shí)表雪花模什么是OLAP?定義1:針對特定問題的聯(lián)機(jī)數(shù)據(jù)訪問和分析。通過對信息(維數(shù)據(jù))多種可能的觀察形式進(jìn)行快速、穩(wěn)定一致和交互性的存取,允許管理決策人員對數(shù)據(jù)進(jìn)行深入觀察。定義2:使分析人員、管理人員或執(zhí)行人員能夠從多種角度對從原始數(shù)據(jù)中轉(zhuǎn)化出來的、能夠真正為用戶所理解的、并真實(shí)反映企業(yè)維特性的信息進(jìn)行快速、一致、交互地存取,從而獲得對數(shù)據(jù)的更深入了解的一類軟件技術(shù)。(OLAP委員會的定義)OLAP的目標(biāo)是滿足決策支持或多維環(huán)境特定的查詢和報(bào)表需求,它的技術(shù)核心是“維”這個(gè)概念,因此OLAP也可以說是多維數(shù)據(jù)分析工具的集合。多維數(shù)據(jù)模型與OLAP分析

--OLAP分析什么是OLAP?多維數(shù)據(jù)模型與OLAP分析

多維數(shù)據(jù)模型與OLAP分析

--OLAP分析OLAP服務(wù)器類型關(guān)系OLAP模型(ROLAP),使用關(guān)系或擴(kuò)充關(guān)系DBMS存放并管理數(shù)據(jù)倉庫多維OLAP服務(wù)器(MOLAP),這些服務(wù)器通過基于數(shù)組的多維存儲,支持?jǐn)?shù)組的多維視圖混合服務(wù)器OLAP(HOLAP),結(jié)合ROLAP和MOLAP技術(shù),得宜于ROLAP的可伸縮性,和MOLAP的快速計(jì)算.多維數(shù)據(jù)模型與OLAP分析

OLAP多維數(shù)據(jù)分析1.切片和切塊(SliceandDice)在多維數(shù)據(jù)結(jié)構(gòu)中,按二維進(jìn)行切片,按三維進(jìn)行切塊,可得到所需要的數(shù)據(jù)。如在“城市、產(chǎn)品、時(shí)間”三維立方體中進(jìn)行切塊和切片,可得到各城市、各產(chǎn)品的銷售情況。2.鉆取(Drill)

鉆取包含向下鉆取(Drill-down)和向上鉆取(Drill-up)/上卷(Roll-up)操作,鉆取的深度與維所劃分的層次相對應(yīng)。

3.旋轉(zhuǎn)(Rotate)/轉(zhuǎn)軸(Pivot)通過旋轉(zhuǎn)可以得到不同視角的數(shù)據(jù)。OLAP多維數(shù)據(jù)分析1.切片和切塊(SliceandDiOLAP的分析方法(一)切片(slicing)、切塊(dicing)OLAP的分析方法(一)切片(slicing)、切塊(dicOLAP的分析方法(二)鉆取(drill-down)按時(shí)間維向下鉆取按時(shí)間維向上鉆取60OLAP的分析方法(二)鉆取(drill-down)按時(shí)間維OLAP的分析方法(三)旋轉(zhuǎn)OLAP的分析方法(三)旋轉(zhuǎn)回答的問題:2001年第三季度,整個(gè)英格蘭的總收入是多少?2000年英國每一類房產(chǎn)銷售的總收入是多少?2001年租借房產(chǎn)業(yè)務(wù)中每個(gè)城市哪個(gè)地域最受歡迎?與過去的兩年相比有何不同?每個(gè)分支機(jī)構(gòu)本月的房產(chǎn)銷售月收入是多少,并與剛過去的12個(gè)月相比較。如果對于10萬英鎊以上的房產(chǎn),法定價(jià)格上升3.5%而政府稅收下降1.5%,對英國不同區(qū)域的銷售會產(chǎn)生什么影響?在英國主要城市中,哪種類型的房產(chǎn)銷售價(jià)格高于平均房產(chǎn)銷售價(jià)格?這與人口統(tǒng)計(jì)數(shù)據(jù)有何聯(lián)系?回答的問題:2001年第三季度,整個(gè)英格蘭的總收入是多少?2數(shù)據(jù)倉庫與數(shù)據(jù)挖掘數(shù)據(jù)倉庫基礎(chǔ)知識OLAP分析與多維數(shù)據(jù)模型數(shù)據(jù)倉庫實(shí)施過程數(shù)據(jù)倉庫與ETL原理數(shù)據(jù)倉庫與數(shù)據(jù)挖掘數(shù)據(jù)倉庫基礎(chǔ)知識數(shù)據(jù)倉庫實(shí)施過程--設(shè)計(jì)步驟常采用原型法的思想來進(jìn)行數(shù)據(jù)倉庫的開發(fā);但是數(shù)據(jù)倉庫的設(shè)計(jì)開發(fā)又不同于一般意義上的原型法,數(shù)據(jù)倉庫的設(shè)計(jì)是數(shù)據(jù)驅(qū)動的。數(shù)據(jù)倉庫設(shè)計(jì)步驟

6.數(shù)據(jù)倉庫運(yùn)行與維護(hù)分析主題域,針對每一個(gè)選定的實(shí)施的主題域3.邏輯模型設(shè)計(jì)4.物理模型設(shè)計(jì)粒度層次劃分?jǐn)?shù)據(jù)分割策略記錄系統(tǒng)定義關(guān)系模式定義確定存儲結(jié)構(gòu)確定索引結(jié)構(gòu)確定存放位置確定存儲分配1.概念模型設(shè)計(jì)界定系統(tǒng)邊界確定主題域2.技術(shù)準(zhǔn)備工作技術(shù)環(huán)境準(zhǔn)備技術(shù)評估5.

數(shù)

據(jù)

成設(shè)計(jì)接口數(shù)據(jù)裝入數(shù)據(jù)倉庫實(shí)施過程--設(shè)計(jì)步驟常采用原型法的思想來進(jìn)行數(shù)據(jù)倉庫數(shù)據(jù)倉庫設(shè)計(jì)步驟概念模型設(shè)計(jì)界定系統(tǒng)邊界確定主要的主題域

技術(shù)準(zhǔn)備工作技術(shù)評估環(huán)境的準(zhǔn)備

邏輯模型設(shè)計(jì)確定要裝載的主題確定粒度層次劃分確定數(shù)據(jù)分割策略確定關(guān)系模式定義確定記錄系統(tǒng)定義數(shù)據(jù)倉庫設(shè)計(jì)步驟概念模型設(shè)計(jì)數(shù)據(jù)倉庫設(shè)計(jì)步驟物理模型設(shè)計(jì)確定數(shù)據(jù)的存儲結(jié)構(gòu)確定數(shù)據(jù)的索引策略確定數(shù)據(jù)的數(shù)據(jù)存放位置確定數(shù)據(jù)的存儲分配數(shù)據(jù)倉庫生成設(shè)計(jì)接口將數(shù)據(jù)裝入

數(shù)據(jù)倉庫運(yùn)行與維護(hù)開發(fā)決策支持系統(tǒng)DSS的應(yīng)用進(jìn)一步理解需求,調(diào)整和完善數(shù)據(jù)倉庫系統(tǒng),維護(hù)數(shù)據(jù)倉庫數(shù)據(jù)倉庫設(shè)計(jì)步驟物理模型設(shè)計(jì)數(shù)據(jù)倉庫的實(shí)施數(shù)據(jù)倉庫建立的基本框架數(shù)據(jù)倉庫的實(shí)施數(shù)據(jù)倉庫建立的基本框架項(xiàng)目計(jì)劃

項(xiàng)目計(jì)劃是指定義創(chuàng)建數(shù)據(jù)倉庫的項(xiàng)目目標(biāo)和確定項(xiàng)目范圍,包括對項(xiàng)目計(jì)劃的評估和流程的調(diào)整。

確定范圍的主要任務(wù)包括1、了解方向性分析處理需求2、確定信息需求3、確定數(shù)據(jù)覆蓋范圍。方向性需求包括:決策類型、決策者感興趣的問題(或?qū)ο螅┑?。?xiàng)目計(jì)劃項(xiàng)目計(jì)劃是指定義創(chuàng)建數(shù)據(jù)倉庫的項(xiàng)目目標(biāo)和確定項(xiàng)目范業(yè)務(wù)需求分析

深入了解數(shù)據(jù)源分析數(shù)據(jù)倉庫系統(tǒng)所包含的主題域及其相互之間的關(guān)系業(yè)務(wù)需求分析是數(shù)據(jù)倉庫中一個(gè)很重要的階段,好的業(yè)務(wù)需求分析會使項(xiàng)目成功的機(jī)率大大增加。業(yè)務(wù)需求分析深入了解數(shù)據(jù)源業(yè)務(wù)需求分析是數(shù)據(jù)倉庫中一數(shù)據(jù)線

數(shù)據(jù)線的實(shí)施可以分為模型設(shè)計(jì)、物理設(shè)計(jì)、數(shù)據(jù)預(yù)處理三個(gè)步驟,用以滿足對數(shù)據(jù)的有效組織和管理。數(shù)據(jù)線數(shù)據(jù)線的實(shí)施可以分為模型設(shè)計(jì)、物理設(shè)計(jì)、數(shù)據(jù)數(shù)據(jù)線-模型設(shè)計(jì)確定數(shù)據(jù)倉庫系統(tǒng)將來的藍(lán)圖。模型設(shè)計(jì)主要包括四個(gè)基本步驟:確定合適的主題、劃分粒度層次、設(shè)計(jì)維表和設(shè)計(jì)事實(shí)表。數(shù)據(jù)倉庫的邏輯設(shè)計(jì)一般采用星型模型和雪花模型設(shè)計(jì)其數(shù)據(jù)模型。包括選擇合適的主題,確定事實(shí)表、相關(guān)的維、屬性和粒度劃分,設(shè)計(jì)正確的表結(jié)構(gòu)和主鍵、外鍵關(guān)系等。數(shù)據(jù)線-模型設(shè)計(jì)確定數(shù)據(jù)倉庫系統(tǒng)將來的藍(lán)圖。數(shù)據(jù)線-模型設(shè)計(jì)ER圖數(shù)據(jù)線-模型設(shè)計(jì)ER圖數(shù)據(jù)線-模型設(shè)計(jì)ER圖中所示的數(shù)據(jù)模型中有四個(gè)相互關(guān)聯(lián)的簡單實(shí)體。如果數(shù)據(jù)庫設(shè)計(jì)只需要考慮數(shù)據(jù)模型的話,可以推斷所有的實(shí)體都是平等關(guān)系。換言之,從數(shù)據(jù)模型的設(shè)計(jì)角度來看,所有的實(shí)體之間的關(guān)系是對等的。僅僅從數(shù)據(jù)模型的角度來著手設(shè)計(jì)數(shù)據(jù)倉庫會產(chǎn)生一種“平面”效應(yīng)。實(shí)際上,由于種種原因,數(shù)據(jù)倉庫的實(shí)體絕不會是相互對等的。一些實(shí)體,要求有它們自己的特別處理。數(shù)據(jù)線-模型設(shè)計(jì)ER圖中所示的數(shù)據(jù)模型中有四個(gè)相互關(guān)聯(lián)的簡單數(shù)據(jù)線-模型設(shè)計(jì)首先確立主題,訂單是有大量數(shù)據(jù)的重要主題,那么“訂單”位于星型連接的中央。在其周圍分別是“產(chǎn)品”、“客戶”、“供應(yīng)商”和“發(fā)貨”實(shí)體。這些實(shí)體僅僅會產(chǎn)生不大的數(shù)據(jù)量。星型連接中央的“訂單”被稱作是“事實(shí)表”,而其周圍的其他實(shí)體—“產(chǎn)品”、“客戶”、“供應(yīng)商”和“發(fā)貨”則被稱為“維表”。事實(shí)表包含了“訂單”獨(dú)有的標(biāo)識數(shù)據(jù),也包含了訂單本身的獨(dú)有數(shù)據(jù)。事實(shí)表還包含了指向其周圍的表—維表的外鍵。數(shù)據(jù)線-模型設(shè)計(jì)首先確立主題,訂單是有大量數(shù)據(jù)的重要主題,那數(shù)據(jù)線-模型設(shè)計(jì)數(shù)據(jù)線-模型設(shè)計(jì)數(shù)據(jù)線-物理設(shè)計(jì)定義支持模型設(shè)計(jì)必需的物理結(jié)構(gòu)。其過程包括以下三個(gè)方面:1)確定物理存儲結(jié)構(gòu);2)確定索引策略;3)確定存儲分配。

數(shù)據(jù)線-物理設(shè)計(jì)定義支持模型設(shè)計(jì)必需的物理結(jié)構(gòu)。其過程包括以數(shù)據(jù)線-數(shù)據(jù)處理(1)數(shù)據(jù)預(yù)處理。(抽取、轉(zhuǎn)換、加載)數(shù)據(jù)的質(zhì)量問題很多工

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負(fù)責(zé)。
  • 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

評論

0/150

提交評論