商務(wù)智能在線分析處理_第1頁
商務(wù)智能在線分析處理_第2頁
商務(wù)智能在線分析處理_第3頁
商務(wù)智能在線分析處理_第4頁
商務(wù)智能在線分析處理_第5頁
已閱讀5頁,還剩29頁未讀, 繼續(xù)免費閱讀

下載本文檔

版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進行舉報或認領(lǐng)

文檔簡介

1、在線分析處理Online Analytical ProcessingOLAP發(fā)展背背景60年代代,關(guān)系系數(shù)據(jù)庫庫之父E.F.Codd提出出了關(guān)系系模型,促進了了聯(lián)機事事務(wù)處理理(OLTP)的發(fā)展展(數(shù)據(jù)據(jù)以表格格的形式式而非文文件方式式存儲)。1993年年,E.F.Codd提出了了OLAP概念念,認為為OLTP已不不能滿足足終端用用戶對數(shù)數(shù)據(jù)庫查查詢分析析的需要要,SQL對大大型數(shù)據(jù)據(jù)庫進行行的簡單單查詢也也不能滿滿足終端端用戶分分析的要要求。用用戶的決決策分析析需要對對關(guān)系數(shù)數(shù)據(jù)庫進進行大量量計算才才能得到到結(jié)果,而查詢詢的結(jié)果果并不能能滿足決決策者提提出的需需求。因因此,E.F.Codd提

2、出出了多維維數(shù)據(jù)庫庫和多維維分析的的概念,即OLAP。OLAP是目前前RDBMS不不可缺少少的功能能,可以以作為一一個獨立立的OLAP服服務(wù)器實實現(xiàn),也也可以集集成在RDBMS中。什么是OLAP?定義1:OLAP(聯(lián)機分分析處理理)是針對特特定問題題的聯(lián)機機數(shù)據(jù)訪訪問和分分析。通通過對信信息(維維數(shù)據(jù))的多種種可能的的觀察形形式進行行快速、穩(wěn)定一一致和交交互性的的存取,允許管管理決策策人員對對數(shù)據(jù)進進行深入入觀察。定義2:OLAP(聯(lián)機分分析處理理)是使分析析人員、管理人人員或執(zhí)執(zhí)行人員員能夠從從多種角角度對從從原始數(shù)數(shù)據(jù)中轉(zhuǎn)轉(zhuǎn)化出來來的、能能夠真正正為用戶戶所理解解的、并并真實反反映企業(yè)業(yè)維

3、特性性的信息息進行快快速、一一致、交交互地存存取,從從而獲得得對數(shù)據(jù)據(jù)的更深深入了解解的一類類軟件技技術(shù)。(OLAP委員員會的定定義)OLAP的目標(biāo)標(biāo)是滿足決決策支持持或多維維環(huán)境特特定的查查詢和報報表需求求,它的的技術(shù)核核心是“維”這這個概念念,因此此OLAP也可可以說是是多維數(shù)數(shù)據(jù)分析析工具的的集合。OLAP決策分分析OLAP分析屬屬于驗證證驅(qū)動型型發(fā)現(xiàn):用戶首首先提出出自己的的假設(shè),然后利利用OLAP工工具檢索索查詢以以驗證或或否定假假設(shè)。OLAP的數(shù)據(jù)據(jù)源OLTP & LegacyERPFlat FilesData Warehouses,Data Marts, ODSSpreadshe

4、etsOLAP基本概概念維:是人們觀觀察數(shù)據(jù)據(jù)的特定定角度,是考慮慮問題時時的一類類屬性(時間間維、地地理維等等)。維的層次次:人們觀察察數(shù)據(jù)的的某個特特定角度度(即某某個維)還可以以存在細細節(jié)程度度不同的的各個描描述方面面(時間間維:日日期、月月份、季季度、年年)。維的成員員:維的一個個取值。是數(shù)據(jù)據(jù)項在某某維中位位置的描描述。(“某年年某月某某日”是是在時間間維上位位置的描描述)多維數(shù)組組:維和變量量的組合合表示。一個多多維數(shù)組組可以表表示為:(維1,維2,維n,變量)。(時時間,地地區(qū),產(chǎn)產(chǎn)品,銷銷售額)數(shù)據(jù)單元元(單元元格):多維數(shù)組組的取值值。(2000年1月月,上海海,筆記記本電腦

5、腦,$100000)OLAP特性快速性:用戶對OLAP的快速速反應(yīng)能能力有很很高的要要求。系系統(tǒng)應(yīng)能能在5秒秒內(nèi)對用用戶的大大部分分分析要求求做出反反應(yīng)。客客戶/服服務(wù)器體體系結(jié)構(gòu)構(gòu)兩層層或三層層C/S結(jié)構(gòu)??煞治鲂孕?OLAP系統(tǒng)應(yīng)應(yīng)能處理理與應(yīng)用用有關(guān)的的任何邏邏輯分析析和統(tǒng)計計分析。多維性:多維性是是OLAP的關(guān)關(guān)鍵屬性性。系統(tǒng)統(tǒng)必須提提供對數(shù)數(shù)據(jù)的多多維視圖圖和分析析,包括括對層次次維和多多重層次次維的完完全支持持。信息性:不論數(shù)據(jù)據(jù)量有多多大,也也不管數(shù)數(shù)據(jù)存儲儲在何處處,OLAP系系統(tǒng)應(yīng)能能及時獲獲得信息息,并且且管理大大容量信信息。OLAP工具的的分類標(biāo)標(biāo)準(zhǔn)分成多維維數(shù)據(jù)庫庫工具

6、(MOLAP)、關(guān)系系型數(shù)據(jù)據(jù)庫工具具(ROLAP)和桌桌面型數(shù)數(shù)據(jù)庫工工具。支持多維維數(shù)據(jù)庫庫工具的的是多維維數(shù)據(jù)庫庫,而不不是傳統(tǒng)統(tǒng)上的關(guān)關(guān)系型數(shù)數(shù)據(jù)庫,數(shù)據(jù)存存儲不采采用傳統(tǒng)統(tǒng)關(guān)系模模型所使使用的記記錄及表表等方式式,而采采用矩陣陣(多維維矩陣)方式來來存儲數(shù)數(shù)據(jù)。與多維數(shù)數(shù)據(jù)庫工工具相比比,關(guān)系系型OLAP工工具在數(shù)數(shù)據(jù)庫層層次上有有標(biāo)準(zhǔn)的的關(guān)系模模型和標(biāo)標(biāo)準(zhǔn)的數(shù)數(shù)據(jù)訪問問方式及及其編程程接口,工具與與數(shù)據(jù)庫庫的互聯(lián)聯(lián)性較好好。桌面型OLAP工具是是指在微微機環(huán)境境下開發(fā)發(fā)的支持持簡單多多維分析析的用戶戶工具,這些工工具沒有有自己的的數(shù)據(jù)存存儲,而而把用戶戶提交的的查詢翻翻譯成對對數(shù)據(jù)

7、源源的查詢詢,然后后從數(shù)據(jù)據(jù)源中提提取結(jié)果果數(shù)據(jù),并將這這些結(jié)果果數(shù)據(jù)合合成最終終的結(jié)果果返回給給客戶。OLAP多維數(shù)據(jù)據(jù)結(jié)構(gòu)超立方結(jié)結(jié)構(gòu)(Hypercube)多維數(shù)據(jù)據(jù)集立方體或或超立方方結(jié)構(gòu)指指用三維維或更多多的維數(shù)數(shù)來描述述一個對對象,每每個維彼彼此垂直直。數(shù)據(jù)的測測量值發(fā)發(fā)生在維維的交叉叉點上,數(shù)據(jù)空空間的各各個部分分都有相相同的維維屬性(收縮縮超立方方結(jié)構(gòu),這種結(jié)結(jié)構(gòu)的數(shù)數(shù)據(jù)密度度更大,數(shù)據(jù)的的維數(shù)更更少,并并可加入入額外的的分析維維)??蛻舴N類類數(shù)量分分布多維維立方OLAP操作Codd從可視視化角度度提出,主要基基于統(tǒng)計計的方法法:切片和切切塊(SliceandDice)在多維數(shù)數(shù)

8、據(jù)結(jié)構(gòu)構(gòu)中,按按二維進進行切片片,按三三維進行行切塊,可得到到所需要要的數(shù)據(jù)據(jù)。如在在“城市市、產(chǎn)品品、時間間”三維維立方體體中進行行切塊和和切片,可得到到各城市市、各產(chǎn)產(chǎn)品的銷銷售情況況。鉆取(Drill)鉆取包含含向下鉆鉆取(Drill-down)和向向上鉆取取(Drill-up)/上上卷(Roll-up)操作作,鉆取取的深度度與維所所劃分的的層次相相對應(yīng)。旋轉(zhuǎn)(Rotate)/旋轉(zhuǎn)(Pivot)通過旋轉(zhuǎn)轉(zhuǎn)可以得得到不同同視角的的數(shù)據(jù)。輔之于各各種圖形形展示分分析結(jié)果果切片、切切塊銷售數(shù)據(jù)據(jù)的4-D表示示DicingExampleDicing:FilteringbyAUS1+AUS2 an

9、dWholesaleSlicing ExampleSlicing:FilteringbyAUS2Web數(shù)數(shù)據(jù)的多多維分析析鉆取數(shù)據(jù)聚集集旋轉(zhuǎn)時間產(chǎn)品財務(wù)指標(biāo)財務(wù)指標(biāo)產(chǎn)品時間pivotDrill-across:Distributionfirst,SalesOrg. second按城市的的銷售數(shù)數(shù)據(jù)按產(chǎn)品的的銷售數(shù)數(shù)據(jù)國際體育育用品公公司的數(shù)數(shù)據(jù)分析析(1)IBMVisual WarehouseV3.1LotusApproach或MicrosoftAccessIntelligentMinerfordata/text國際體育育用品公公司的數(shù)數(shù)據(jù)分析析(2)按地區(qū)劃劃分的頭頭盔銷售售數(shù)據(jù)按地區(qū)和和國家

10、劃劃分的頭頭盔銷售售數(shù)據(jù)國際體育育用品公公司的數(shù)數(shù)據(jù)分析析(3)按地區(qū)、國家和和城市劃劃分的頭頭盔銷售售數(shù)據(jù)山地車和和頭盔銷銷售的比比較Brio Enterprise豐豐富的鉆鉆取功能能圖4.5Cognos的鉆取操操作IBMCognos的鉆鉆取操作作OLAP分類按照存儲方式OLAPMOLAPHOLAPROLAP按照處理地點Client OLAPServer OLAPRelational databaseCubeMicrosoft SQL Server OLAP ServiceROLAPMOLAPHOLAP基于關(guān)系系數(shù)據(jù)庫庫的OLAPROLAP用關(guān)系表表達式描描述多維維概念大量的的關(guān)系表表。用星

11、型模模型、雪雪花模型型構(gòu)造維維模型。DBDW基礎(chǔ)數(shù)據(jù)元數(shù)據(jù)計算結(jié)果多維綜合引擎多維視圖SQL存取多維存取RDBMS服務(wù)器關(guān)系型OLAP 服務(wù)器 客戶MOLAP的多多維立方方體(Multicube)DBDW多維視圖 基礎(chǔ)數(shù)據(jù) 計算結(jié)果多維數(shù)據(jù)庫引擎客戶多維存取基于多維維數(shù)據(jù)庫庫(MDDB)的OLAPMOLAPOLAP服務(wù)器器:存儲儲OLAP服務(wù)務(wù)軟件和和多維數(shù)數(shù)據(jù)庫MDDB存儲:采用“超立方方體”形形式MDDB存?。憾嗑S操操作數(shù)據(jù)組織織形式RDB數(shù)據(jù)組織織-MDDB數(shù)據(jù)組織織- 關(guān)系系表中綜綜合數(shù)據(jù)據(jù)的存放放多維數(shù)據(jù)據(jù)庫中綜綜合數(shù)據(jù)據(jù)的存放放產(chǎn)品名稱地區(qū)銷售量冰箱東北50冰箱西北60冰箱華北10

12、0彩電東北40彩電西北70彩電華北80空調(diào)東北90空調(diào)西北120空調(diào)華北140東北西北華北冰箱5060100彩電407080空調(diào)90120140產(chǎn)品名稱地區(qū)銷售量冰箱東北50冰箱西北60冰箱華北100冰箱總和210彩電東北40彩電西北70彩電華北80彩電總和190空調(diào)東北90空調(diào)西北120空調(diào)華北140空調(diào)總和350總和東北180總和西北250總和華北320總和總和750東北西北華北總和冰箱5060100210彩電407080190空調(diào)90120140350總和180250320750ROLAP與MOLAP比較在MOLAP中中,不但但把多維維實視圖圖在概念念上看成成一個超超立方體體,而且且在物

13、理理上把多多維實視視圖組成成一個多多維數(shù)組組,而不不象ROLAP以表的的形式存存儲實視視圖。在MOLAP中中,維的的屬性值值被映射射成多維維數(shù)組的的下標(biāo)值值或下標(biāo)標(biāo)的范圍圍,而總總數(shù)據(jù)作作為多維維數(shù)組的的值存儲儲在數(shù)據(jù)據(jù)的單元元中。ROLAP在節(jié)節(jié)省存儲儲空間、靈活性性、與關(guān)關(guān)系數(shù)據(jù)據(jù)庫保持持一致性性等方面面有明顯顯的優(yōu)勢勢;MOLAP則在在性能和和管理的的簡便性性方面有有其優(yōu)點點。MOLAP的查查詢速度度比較快快,但有有下面限限制:用多維數(shù)數(shù)組實現(xiàn)現(xiàn)多維實實視圖,需要很很大的存存儲空間間。在實實際的數(shù)數(shù)據(jù)倉庫庫中,每每維的屬屬性值個個數(shù)可能能數(shù)萬。例如幾幾萬種產(chǎn)產(chǎn)品、幾幾萬個連連鎖店等等。而實實際的維維數(shù)可能能多達幾幾十乃至至幾百。耗費的的存儲空空間相當(dāng)當(dāng)可觀,由此帶帶來加載載、維護護等問題題。在多維數(shù)數(shù)組中,很可能能有些單單元是空空白的,如節(jié)假假日商店店不營業(yè)業(yè);某些些產(chǎn)品在在某些地地區(qū)不銷銷售等。MOLAP與關(guān)關(guān)系數(shù)據(jù)據(jù)庫系統(tǒng)統(tǒng)從存儲儲結(jié)構(gòu)到到查詢語語言都有有相當(dāng)大大的差別別,不可可能在RDBMS的基基礎(chǔ)上實實

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負責(zé)。
  • 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時也不承擔(dān)用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

評論

0/150

提交評論