




已閱讀5頁,還剩8頁未讀, 繼續(xù)免費(fèi)閱讀
版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進(jìn)行舉報或認(rèn)領(lǐng)
文檔簡介
精品文檔 1歡迎下載 1 1 BIBI Business Intelligence 即商業(yè)智能 商務(wù)智能綜合企業(yè)所有沉淀下來的信息 用科 學(xué)的分析方法 為企業(yè)領(lǐng)導(dǎo)提供科學(xué)決策信息的過程 BOSSBOSS業(yè)務(wù)運(yùn)營支撐系 BPMBPM企業(yè)績效管理 BPRBPR業(yè)務(wù)流程重整 CRMCRM客戶關(guān)系管理 CUBECUBE立方體 DMDM DatamartDatamart 數(shù)據(jù)集市 數(shù)據(jù)倉庫的子集 它含有較少的主題域且歷史時間更短數(shù)據(jù)量更 少 一般只能為某個局部范圍內(nèi)的管理人員服務(wù) 因此也稱之為部門級數(shù)據(jù)倉庫 DMDM DataMineDataMine 數(shù)據(jù)挖掘 DSSDSS決策支持系統(tǒng) EDMEDM企業(yè)數(shù)據(jù)模型 3 3 ERPERP Enterprise Resourse Planning企業(yè)資源規(guī)劃 它是一個以管理會計為核心的信息系統(tǒng) 識別和規(guī)劃企業(yè)資源 從而獲取客戶訂單 完成加工和交付 最后得到客戶付款 換言 之 ERP將企業(yè)內(nèi)部所有資源整合在一起 對八個采購 生產(chǎn) 成本 庫存 分銷 運(yùn)輸 財務(wù) 人力資源進(jìn)行規(guī)劃 從而達(dá)到最佳資源組合 取得最佳效益 4 ETLETL 數(shù)據(jù)抽取 Extract 轉(zhuǎn)換 Transform 清洗 Cleansing 裝載 Load 的過 程 構(gòu)建數(shù)據(jù)倉庫的重要一環(huán) 用戶從數(shù)據(jù)源抽取出所需的數(shù)據(jù) 經(jīng)過數(shù)據(jù)清洗 最終 按照預(yù)先定義好的數(shù)據(jù)倉庫模型 將數(shù)據(jù)加載到數(shù)據(jù)倉庫中去 KDDKDD數(shù)據(jù)庫中知識發(fā)現(xiàn) 5 5 KPIKPI 企業(yè)關(guān)鍵業(yè)績指標(biāo) KPI KeyProcessIndication 是通過對組織內(nèi)部流程的輸入端 輸出 端的關(guān)鍵參數(shù)進(jìn)行設(shè)置 取樣 計算 分析 衡量流程績效的一種目標(biāo)式量化管理指標(biāo) 是把企業(yè)的戰(zhàn)略目標(biāo)分解為可操作的工作目標(biāo)的工具 是企業(yè)績效管理的基礎(chǔ) LDMLDM邏輯數(shù)據(jù)模型 6 MDDMDD 多維數(shù)據(jù)庫 Multi Dimesional Database MDD 可以簡單地理解為 將數(shù)據(jù)存放在一 個n維數(shù)組中 而不是像關(guān)系數(shù)據(jù)庫那樣以記錄的形式存放 因此它存在大量稀疏矩陣 人們可以通過多維視圖來觀察數(shù)據(jù) 多維數(shù)據(jù)庫增加了一個時間維 與關(guān)系數(shù)據(jù)庫相比 它的優(yōu)勢在于可以提高數(shù)據(jù)處理速度 加快反應(yīng)時間 提高查詢效率 MetadataMetadata 元數(shù)據(jù) 它是 關(guān)于數(shù)據(jù)的數(shù)據(jù) 其內(nèi)容主要包括數(shù)據(jù)倉庫的數(shù)據(jù)字典 數(shù)據(jù) 的定義 數(shù)據(jù)的抽取規(guī)則 數(shù)據(jù)的轉(zhuǎn)換規(guī)則 數(shù)據(jù)加載頻率等信息 MOLAPMOLAP自行建立了多維數(shù)據(jù)庫 來存放聯(lián)機(jī)分析系統(tǒng)數(shù)據(jù) 7 ODSODS 四個特點 四個特點 Oprational Data Store 操作型數(shù)據(jù)存儲 是建立在數(shù)據(jù)準(zhǔn)備區(qū)和數(shù)據(jù)倉庫之間的一個部 件 用來滿足企業(yè)集成的 綜合的操作型處理需要 操作數(shù)據(jù)存儲是個可選的部件 對于 一些準(zhǔn)實時的業(yè)務(wù)數(shù)據(jù)庫當(dāng)中的數(shù)據(jù)的暫時存儲 支持一些同時關(guān)連到歷史數(shù)據(jù)與實時數(shù) 精品文檔 2歡迎下載 據(jù)分析的數(shù)據(jù)暫時存儲區(qū)域 8 什么是數(shù)據(jù)集市DM 數(shù)據(jù)集市可以看作是數(shù)據(jù)倉庫的一個子集 它含有較少的主題域且歷史時間更短數(shù)據(jù)量更 少 一般只能為某個局部范圍內(nèi)的管理人員服務(wù) 因此也稱之為部門級數(shù)據(jù)倉庫 二二 數(shù)據(jù)倉庫數(shù)據(jù)倉庫 DWDW Datawarehouse 數(shù)據(jù)倉庫是一個集合或過程 4要素面向主題 集成 時間相關(guān) 反映歷 史變化 穩(wěn)定 不可修改的數(shù)據(jù)集合 數(shù)據(jù)倉庫是在企業(yè)管理和決策中面向主題的 集成的 與時間相關(guān)的 不可修改的數(shù)據(jù)集 合 與其他數(shù)據(jù)庫應(yīng)用不同的是 數(shù)據(jù)倉庫更像一種過程 對分布在企業(yè)內(nèi)部各處的業(yè)務(wù) 數(shù)據(jù)的整合 加工和分析的過程 特點傳統(tǒng)操作型數(shù)據(jù)庫數(shù)據(jù)倉庫 面向主題菜市場 按功能來分類 每一個模塊就如一個小攤位 蘿卜 青菜都有 超市 按類型分類 如都為利潤的分為一個事實表 事實表和維表的分類 集成的與特定的應(yīng)用相關(guān) 數(shù)據(jù)庫之間獨 立的 有聯(lián)系 ETL的過程已經(jīng)是將多個數(shù)據(jù) 庫聯(lián)系統(tǒng)一 去除之間的不一致性 相對穩(wěn)定通常實時更新 數(shù)據(jù)根據(jù)需要及時 發(fā)生變化 供企業(yè)決策分析之用 數(shù)據(jù)操作主要 是數(shù)據(jù)查詢 一旦某個數(shù)據(jù)進(jìn)入數(shù)據(jù) 倉庫以后 一般情況下將被長期保留 也就是數(shù)據(jù)倉庫中一般有大量的查詢 操作 但修改和刪除操作很少 通常 定期的加載 刷新 反映歷史變 化 主要關(guān)心當(dāng)前某一個時間段內(nèi)的數(shù) 據(jù) 包含歷史信息 系統(tǒng)記錄了企業(yè)從過 去某一時點 精品文檔 3歡迎下載 下圖是一個典型的企業(yè)數(shù)據(jù)倉庫系統(tǒng) 通常包含數(shù)據(jù)源 數(shù)據(jù)存儲與管理 數(shù)據(jù)的訪問三 個部分 最為重要的一張圖最為重要的一張圖 這張圖可以看出四個特點中 面向?qū)ο?集成 數(shù)據(jù)源 是指企業(yè)操作型數(shù)據(jù)庫中的各種生產(chǎn)運(yùn)營數(shù)據(jù) 即OLIP 數(shù)據(jù)的存儲與管理 數(shù)據(jù)倉庫的存儲主要由元數(shù)據(jù)的存儲及數(shù)據(jù)的存儲兩部分組 成 元數(shù)據(jù)是關(guān)于數(shù)據(jù)的數(shù)據(jù) 其內(nèi)容主要包括數(shù)據(jù)倉庫的數(shù)據(jù)字典 數(shù)據(jù)的定義 數(shù) 據(jù)的抽取規(guī)則 數(shù)據(jù)的轉(zhuǎn)換規(guī)則 數(shù)據(jù)加載頻率等信息 各操作數(shù)據(jù)庫中的數(shù)據(jù)按照元 數(shù)據(jù)庫中定義的規(guī)則 經(jīng)過抽取 清理 轉(zhuǎn)換 集成 按照主題重新組織 依照相應(yīng)的 存儲結(jié)構(gòu)進(jìn)行存儲 數(shù)據(jù)的訪問 由OLAPOLAP 聯(lián)機(jī)分析處理 數(shù)據(jù)挖掘 統(tǒng)計報表 即席查詢等幾部分組 成 例如OLAP 針對特定的分析主題 設(shè)計多種可能的觀察形式 設(shè)計相應(yīng)的分析主題 結(jié)構(gòu) 即進(jìn)行事實表和維表的設(shè)計 使管理決策人員在多維數(shù)據(jù)模型的基礎(chǔ)上進(jìn)行快 速 穩(wěn)定和交互性的訪問 并進(jìn)行各種復(fù)雜的分析和預(yù)測工作 按照存儲方式來分 OLAP可以分成MOLAP以及ROLAP等方式 MOLAPMOLAP Multi Dimension OLAP 將OLAP分析所需的數(shù)據(jù)存放在多維數(shù)據(jù)庫中 分析主題的 數(shù)據(jù)可以形成一個或多個多維立方體 ROLAPROLAP Relational OLAP 將OLAP分析所需的數(shù)據(jù)存放在關(guān)系型數(shù)據(jù)庫中 分析主題的數(shù)據(jù) 以 事實表 維表 的星型模式組織 精品文檔 4歡迎下載 三 企業(yè)信息工廠企業(yè)信息工廠 企業(yè)信息工廠企業(yè)信息工廠 Corporate Information Factory 簡稱EIFEIF 是一種構(gòu)建數(shù)據(jù)倉庫的架構(gòu) 企業(yè)信息工廠企業(yè)信息工廠主要包括五個集成轉(zhuǎn)換層集成轉(zhuǎn)換層 I T 操作數(shù)據(jù)存儲 ODSODS 企業(yè)級數(shù)據(jù)倉 庫 EDWEDW 數(shù)據(jù)集市 DMDM 探索倉庫 EWEW 等部件 這些部件有機(jī)的結(jié)合在一起 為企業(yè)提供信息服務(wù) 企業(yè)級數(shù)據(jù)倉庫是企業(yè)信息工廠的核心部件 用來保存整個企業(yè)的數(shù)據(jù) 一般 也 稱數(shù)據(jù)倉庫 是用來滿足企業(yè)戰(zhàn)略決策的需要 數(shù)據(jù)倉庫的數(shù)據(jù)來自數(shù)據(jù)準(zhǔn)備區(qū)和操作 數(shù)據(jù)存儲 數(shù)據(jù)集市 的數(shù)據(jù)來源是數(shù)據(jù)倉庫 企業(yè)信息工廠中的數(shù)據(jù)集市一般來說是非規(guī)范化的 定制的和 匯總的 而多維體系架構(gòu)中的數(shù)據(jù)集市分為兩種 分別是原子數(shù)據(jù)集市和聚集數(shù)據(jù)集市 一般來說 企業(yè)信息工廠中的數(shù)據(jù)集市相當(dāng)于多維體系架構(gòu)中的聚集數(shù)據(jù)集市 企業(yè)信息工廠中的數(shù)據(jù)流向一般是從源系統(tǒng)到數(shù)據(jù)準(zhǔn)備區(qū)到操作數(shù)據(jù)存儲到數(shù)據(jù) 倉庫到數(shù)據(jù)集市 精品文檔 5歡迎下載 維維DimensionDimension 維 是人們觀察數(shù)據(jù)的特定角度 是考慮問題時的一類屬性 屬性集合構(gòu)成一個維 商店 時間和產(chǎn)品都是維 各個商店的集合是一個維 時間的集合是一個維 商品的集合也是一 個維 代理關(guān)鍵字 維代理關(guān)鍵字 維IDID 代理關(guān)鍵字一般是指維度表中使用順序 序列 分配的整數(shù)值作為主鍵 也稱為 代理鍵 代理關(guān)鍵字用于維度表和事實表的連接 使用代理關(guān)鍵字可以用來處理緩慢變化維緩慢變化維 維度表數(shù)據(jù)的歷史變化信息的保存是 數(shù)據(jù)倉庫設(shè)計的實施中非常重要的一部分 Kimball的緩慢變化維處理策略的核心就是 使用代理關(guān)鍵字 優(yōu)點 1緩沖 2性能 3建不存在的維度記錄 4緩慢變化維處理 緩慢變化維緩慢變化維 能力的體現(xiàn) 能力的體現(xiàn) 隨著時間的流失發(fā)生緩慢的變化 處理緩慢變化維的方法通常有三種方式 第一種方式是直接覆蓋原值 這樣處理 最容易實現(xiàn) 但是沒有保留歷史數(shù)據(jù) 無 法分析歷史變化信息 第一種方式通常簡稱為 TYPE 1 第二種方式是添加維度行 這樣處理 需要代理鍵的支持 實現(xiàn)方式是當(dāng)有維度屬 性發(fā)生變化時 生成一條新的維度記錄 主鍵是新分配的代理鍵 通過自然鍵可以和原 維度記錄保持關(guān)聯(lián) 第二種方式通常簡稱為 TYPE 2 第三種方式是添加屬性列 這種處理的實現(xiàn)方式是對于需要分析歷史信息的屬性添 加一列 來記錄該屬性變化前的值 而本屬性字段使用TYPE 1來直接覆蓋 這種方式 的優(yōu)點是可以同時分析當(dāng)前及前一次變化的屬性值 缺點是只保留了最后一次變化信 息 第三種方式通常簡稱為 TYPE 3 退化維度退化維度 事實表中的部分ID如訂單號 但他沒有對應(yīng)的維度表 這編號稱為退化維 微型維度微型維度 為了解決快變超大維度 解決的方法是 將分析頻率比較高或者變化 頻率比較大的字段提取出來 建立一個單獨的維度表 這個單獨的維度表就是微型維度 表 多維體系結(jié)構(gòu)多維體系結(jié)構(gòu) MD 中的三個關(guān)鍵性概念 一致性維度一致性維度 總線架構(gòu)總線架構(gòu) Bus Architecture 和一致性事實一致性事實 Conformed Fact 一致性維度一致性維度 解決數(shù)據(jù)倉庫的集成問題 在多維體系結(jié)構(gòu)中 沒有物理上的數(shù)據(jù)倉庫 由物理上的數(shù)據(jù)集市組合成邏輯上的 數(shù)據(jù)倉庫 而且數(shù)據(jù)集市的建立是可以逐步完成的 最終組合在一起 成為一個數(shù)據(jù)倉 庫 如果分步建立數(shù)據(jù)集市的過程出現(xiàn)了問題 數(shù)據(jù)集市就會變成孤立的集市 不能組 合成數(shù)據(jù)倉庫 而一致性維度的提出正式為了解決這個問題 精品文檔 6歡迎下載 一致性維度的范圍是總線架構(gòu)中的維 一致性維度建立的地點是多維體系結(jié)構(gòu)的后臺 Back Room 即數(shù)據(jù)準(zhǔn)備區(qū)數(shù)據(jù)準(zhǔn)備區(qū) 在同一個集市內(nèi) 一致性維度的意思是兩個維度如果有關(guān)系在同一個集市內(nèi) 一致性維度的意思是兩個維度如果有關(guān)系 事實表事實表 主要有三種事實表 分別是事務(wù)粒度事實表 Transaction Grain Fact Table 周期快照粒度事實表 Periodic Snapshot Grain Fact Table 和累積快照粒度事實表 Accumulating Snapshot Grain Fact Table 從用途 的不同來說 事實表可以分為三類 分別是原子事實表 聚集事實表和合并事實表 粒度分類 事務(wù)事實表事務(wù)事實表 Transaction fact table 記錄的事務(wù)層面的事實 保存的是最原子的數(shù) 據(jù) 也稱 原子事實表 周期快照事實表周期快照事實表 Periodic snapshot fact table 以具有規(guī)律性的 可預(yù)見的時間間 隔來記錄事實 時間間隔如每天 每月 每年等等 用途分類 聚集事實表聚集事實表 Aggregated Fact Table 是原子事實表上的匯總數(shù)據(jù) 也稱為匯總事 實表如只有月度維 求和 平均值等 合并事實表合并事實表 建立一個事實表 它的維度是兩個或多個事實表的相同維度的集合 聚集事實表和合并事實表的主要差別是合并事實表一般是從多個事實表合并而來 但是它們的差別不是絕對的 一個事實表既是聚集事實表又是合并事實表是很有可能 的 因為一般合并事實表需要按相同的維度合并 所以很可能在做合并的同時需要進(jìn)行 聚集 即粒度變粗 非重點非重點 預(yù)連接聚集表 pre joined aggregagte table 是通過對事實表和維度表的聯(lián)合查詢 而生成的一類匯總表 在預(yù)連接聚集表中 保存有維度表中的描述信息和事實表的事實 值 切片事實表 切片事實表的結(jié)構(gòu)與相對應(yīng)的基礎(chǔ)表相同 數(shù)據(jù)來源于相對應(yīng)的基礎(chǔ)表 切片事實 表由于縮小了表中數(shù)據(jù)的記錄數(shù) 所以查詢的效率得到了很大的提高 蜈蚣事實表 是指那些一張事實表中有太多維度的事實表 事實表相關(guān)的維度在15個以下為正常 如果 維度個數(shù)超過25個 就出現(xiàn) 了維度過多的蜈蚣事實表 一致性事實一致性事實 一致性事實和一致性維度有些不同 一致性維度是由專人維護(hù)在后臺 Back Room 發(fā)生修改時同步復(fù)制到每個數(shù)據(jù)集市 而事實表一般不會在多個數(shù)據(jù)集市間復(fù)制 需要 查詢多個數(shù)據(jù)集市中的事實時 一般通過交叉探查 drill across 來實現(xiàn) 精品文檔 7歡迎下載 1 51 5 數(shù)據(jù)集市 即席查詢即席查詢 即席查詢的位置通常是在關(guān)系型的數(shù)據(jù)倉庫中 操作數(shù)據(jù)存儲 ODS 是面向主題的 集成的 可變的 反映當(dāng)前數(shù)據(jù)值的和詳細(xì)的數(shù)據(jù)的集合 用來滿足企 業(yè)綜合的 集成的以及操作型的處理需求 個人不建議ODS保存相當(dāng)長周期的數(shù)據(jù) 同樣 ODS中的數(shù)據(jù)也盡量不做轉(zhuǎn)換 而是原封不動地與業(yè)務(wù)數(shù)據(jù)庫保持一致 即ODS只是 業(yè)務(wù)數(shù)據(jù)庫的一個備份或者映像 目的是為了使數(shù)據(jù)倉庫的處理和決策支持要求與 OLTP系統(tǒng)相隔離 減少決策支持要求對OLTP系統(tǒng)的影響 ODSODS的的四個四個作用作用 在業(yè)務(wù)系統(tǒng)和數(shù)據(jù)倉庫之間形成一個隔離層 分擔(dān)轉(zhuǎn)移一部分業(yè)務(wù)系統(tǒng)細(xì)節(jié)查詢的功能 完成數(shù)據(jù)倉庫中不能完成的一些功能 ODS是細(xì)節(jié) 數(shù)據(jù)倉庫是匯總 元數(shù)據(jù)元數(shù)據(jù) 隨著數(shù)據(jù)倉庫 DW 技術(shù)的不斷成熟 企業(yè)的數(shù)據(jù)逐漸變成了決策的主要依據(jù) 數(shù)據(jù)倉庫中的數(shù)據(jù)是從許多業(yè)務(wù)處理系統(tǒng)中抽取 轉(zhuǎn)換而來 對于這樣一個復(fù)雜的企業(yè) 數(shù)據(jù)環(huán)境 如何以安全 高效的方式來對它們進(jìn)行管理和訪問就變得尤為重要 解決這 一問題的關(guān)鍵就是建立數(shù)據(jù)倉庫元數(shù)據(jù) 精品文檔 8歡迎下載 ETLETL 重點 重點 ETL BI 1 3 ETL BI 1 3 BI BI的成敗的成敗 T ETL 2 3T ETL 2 3 soso T Bi 2 9 1 4T Bi 2 9 1 4 ETL是BI項目重要的一個環(huán)節(jié) 通常情況下 在BI項目中ETL會花掉整個項目的1 3的時間 ETL設(shè)計的好壞直接關(guān)接到BI項目的成敗 ETL三個部分中 花費(fèi)時間最長的是 T Transform 清洗 轉(zhuǎn)換 的部分 一般情況 下這部分工作量是整個ETL的2 3 就是整個項目的 差不多四分之一 ETL的實現(xiàn)有多種方法 常用的有三種 一種是借助ETL工具實現(xiàn) 一種是SQL方 式實現(xiàn) 另外一種是ETL工具和SQL相結(jié)合 數(shù)據(jù)抽取數(shù)據(jù)抽取 三種情況 1在DW數(shù)據(jù)庫服務(wù)器和原業(yè)務(wù)系統(tǒng)之間建立直接的鏈接關(guān)系就可以寫select語句直接訪問 2不同的數(shù)據(jù)源解決方法 ODBC的方式建立數(shù)據(jù)庫鏈接或方法三 3 txt xml利用數(shù)據(jù)庫工具將這些數(shù)據(jù)導(dǎo)入到指定的數(shù)據(jù)庫 然后從指定的數(shù)據(jù)庫中抽取 4增量更新的問題 數(shù)據(jù)清洗數(shù)據(jù)清洗 1不完整的數(shù)據(jù) 2錯誤的數(shù)據(jù) 3重復(fù)的數(shù)據(jù) 數(shù)據(jù)轉(zhuǎn)換數(shù)據(jù)轉(zhuǎn)換 1不一致數(shù)據(jù)轉(zhuǎn)換 抽取過來之后統(tǒng)一轉(zhuǎn)換成一個編碼 2數(shù)據(jù)粒度的轉(zhuǎn)換 業(yè)務(wù)系統(tǒng)數(shù)據(jù)按照數(shù)據(jù)倉庫粒度進(jìn)行聚合 3商務(wù)規(guī)則的計算 ETL中將這些數(shù)據(jù)指標(biāo)計算好了之后存儲在數(shù)據(jù)倉庫中 以供分析使用 數(shù)據(jù)加載數(shù)據(jù)加載策略 1時間戳方式 2日志表方式 3全表比對方式upset 4全表刪除插入方式 精品文檔 9歡迎下載 OLAPOLAP On Line Transaction Processing 聯(lián)聯(lián)機(jī)機(jī)事事務(wù)務(wù)處處理理 系系統(tǒng)統(tǒng) O OL LT TP P 也稱為面向交易的處理系統(tǒng) 其基本特征是顧客的原始數(shù)據(jù)可以立即傳送到計算中 心進(jìn)行處理 并在很短的時間內(nèi)給出處理結(jié)果 這樣做的最大優(yōu)點是可以即時地處理輸 入的數(shù)據(jù) 及時地回答 也稱為 實實時時系系統(tǒng)統(tǒng) Real time System OLAPOLAP 聯(lián)機(jī)分析處理系統(tǒng) 聯(lián)機(jī)分析處理系統(tǒng) 多維數(shù)據(jù)分析工具的集合 聯(lián)機(jī)分析處理是使分析人員 管理人員或執(zhí)行人員能夠從多種角度對從原始數(shù)據(jù)中轉(zhuǎn)化出 來的 能夠真正為用戶所理解的 并真實反映企業(yè)維特性的信息進(jìn)行快速 一致 交互地 存取 從而獲得對數(shù)據(jù)的更深入 了解的一類軟件技術(shù) 鉆取鉆取 Drill 它是改變維的層次 變換分析的粒度 鉆取包含向下鉆取 Drill down 和向上鉆取 Drill up 上卷 Roll up 操作 roll up是在某一維上將低層次的細(xì)節(jié)數(shù)據(jù)概 括到高層次的匯總數(shù)據(jù) 或者減少維數(shù) 而drill down則相反 它從匯總數(shù)據(jù)深入到細(xì) 節(jié)數(shù)據(jù)進(jìn)行觀察或增加新維 OLAPOLAP的實現(xiàn)方法的實現(xiàn)方法 根據(jù)存儲數(shù)據(jù)的方式不同可以分為ROLAPROLAP MOLAPMOLAP HOLAPHOLAP 表示基于關(guān)系數(shù)據(jù)庫的OLAP實現(xiàn) ROLAPROLAP 事實表維度表的設(shè)計 事實表維度表的設(shè)計 將多維數(shù)據(jù)庫的多維結(jié)構(gòu)劃分為兩類表 一類是事實表 用來存儲數(shù)據(jù)和維關(guān)鍵字 另一 類是維表 即對每個維至少使用一個表來存放維的層次 成員類別等維的描述信息 維表 精品文檔 10歡迎下載 和事實表通過主關(guān)鍵字和外關(guān)鍵字聯(lián)系在一起 形成了 星型模型 對于層次復(fù)雜的維 為避免冗余數(shù)據(jù)占用過大的存儲空間 可以使用多個表來描述 這種星型模型的擴(kuò)展稱為 雪花模型 MOLAPMOLAP 表示基于多維數(shù)據(jù)組織的OLAP實現(xiàn) Multidimensional OLAP 以多維數(shù)據(jù)組織方式為核 心 也就是說 MOLAP使用多維數(shù)組存儲數(shù)據(jù) 多維數(shù)據(jù)在存儲中將形成 立方塊立方塊 Cube 的結(jié)構(gòu) 在MOLAP中對立方塊的 旋轉(zhuǎn)旋轉(zhuǎn) 切塊切塊 切片切片 是產(chǎn)生多維數(shù)據(jù)報表的主要 技術(shù) 旋轉(zhuǎn)旋轉(zhuǎn) 行列轉(zhuǎn)換行列轉(zhuǎn)換一條記錄中的多個事實字段轉(zhuǎn)化為多條記錄 切塊切塊 切片切片的字段結(jié)構(gòu)和相應(yīng)的基礎(chǔ)表完全相同 差別在于存儲的記錄的范圍 切片事實表中保 存記錄的是相應(yīng)基礎(chǔ)表中記錄的子集 記錄數(shù)通常與某個維度記錄數(shù)相同 OLAP 存儲方式優(yōu)缺點 一 多維存儲方式 MOLAP MOLAP 在服務(wù)器上對數(shù)據(jù)立方體數(shù)組及其管理技術(shù)的實現(xiàn) 可以所有的信息查詢 都從 MOLAP 服務(wù)器上獲得 優(yōu)勢 性能好 響應(yīng)速度快 支持高性能的決策支持計算 復(fù)雜的跨維計算 多用戶的讀寫操作 缺點 占用的存儲空間較大 難以達(dá)到 TB 級數(shù)據(jù)量 需要進(jìn)行預(yù)計算 可能導(dǎo)致數(shù)據(jù)爆炸 無法支持維的動態(tài)變化 缺乏數(shù)據(jù)模型和數(shù)據(jù)訪問的標(biāo)準(zhǔn) 二 關(guān)系數(shù)據(jù)庫存儲方式 ROLAP ROLAP 充分利用關(guān)系數(shù)據(jù)庫技術(shù)將明細(xì)數(shù)據(jù)和聚合數(shù)據(jù)存儲在一個關(guān)系型結(jié)構(gòu)中 的存儲方式 優(yōu)勢 沒有大小限制 現(xiàn)有的關(guān)系數(shù)據(jù)庫的技術(shù)可以沿用 可以通過 SQL 實現(xiàn)詳細(xì)數(shù)據(jù)與概要數(shù)據(jù)的儲存 現(xiàn)有關(guān)系型數(shù)據(jù)庫已經(jīng)對 OLAP 做了很多優(yōu)化 包括并行存儲 并行 查詢 位圖索引 SQl 的 OLAP 擴(kuò)展等大大提高了 ROALP 的速度 查詢性能較不如 MOLAP 方式 占用的存儲空間較少 缺點 一般比 MDD 響應(yīng)速度慢 SQL 無法完成部分計算 主要是無法完成多行的計算 無法完成維之 間的計算 精品文檔 11歡迎下載 三 混合存儲方式 HOLAP 將聚合存儲到分析服務(wù)器計算機(jī)上的多維結(jié)構(gòu)中 并將分區(qū)的源數(shù)據(jù)保留在它現(xiàn) 有的關(guān)系型結(jié)構(gòu)中的存儲方式 特點 查詢性能介于以上兩種方式之間 占用的存儲空間介于以
溫馨提示
- 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
- 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
- 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
- 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負(fù)責(zé)。
- 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請與我們聯(lián)系,我們立即糾正。
- 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時也不承擔(dān)用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。
最新文檔
- 設(shè)立海外公司管理制度
- 設(shè)計開發(fā)變更管理制度
- 設(shè)計項目分級管理制度
- 診所醫(yī)保制度管理制度
- 診療科目各項管理制度
- 試驗檢測業(yè)務(wù)管理制度
- 財務(wù)銷售流程管理制度
- 財政財務(wù)票據(jù)管理制度
- 貨物搬運(yùn)現(xiàn)場管理制度
- 貨車安全生產(chǎn)管理制度
- 湖北黃岡歷年中考作文題(2002-2023)
- GB/T 10810.1-2025眼鏡鏡片第1部分:單焦和多焦
- 2024年煙臺市煙臺山醫(yī)院招聘考試真題
- 酒店前臺培訓(xùn)內(nèi)容
- 國開本科《人文英語3》期末機(jī)考總題庫及答案
- 2025年包養(yǎng)合同模板
- 《SPE固相萃取技術(shù)》課件
- 高中數(shù)學(xué)復(fù)習(xí) 導(dǎo)數(shù)壓軸大題歸類 (原卷版)
- 環(huán)境友好型飛機(jī)內(nèi)飾-深度研究
- 《crrt低血壓的處理》課件
- 馬詩聽評課記錄范文
評論
0/150
提交評論