




版權說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權,請進行舉報或認領
文檔簡介
第2-1章數(shù)據(jù)倉庫設計——維度建模1數(shù)據(jù)倉庫的數(shù)據(jù)模型分類2維度模型的相關概念3維度模型的結(jié)構2.1數(shù)據(jù)倉庫的數(shù)據(jù)模型分類
2.1數(shù)據(jù)倉庫的數(shù)據(jù)模型分類維度模型范式模型DataVault模型Anchor模型2.2維度模型的相關概念
RalphKimball,數(shù)據(jù)倉庫方面的知名學者,畢業(yè)于斯坦福大學。他創(chuàng)立的維度建模方法論(或Kimball方法論)已經(jīng)成為決策支持領域的金科玉律。該方法非常直觀,緊緊圍繞業(yè)務模型,不需要經(jīng)過特別的抽象處理,即可完成維度建模。2.2.1粒度(Granularity)
粒度是指數(shù)據(jù)倉庫中數(shù)據(jù)單元的詳細程度和級別,確定數(shù)據(jù)倉庫的粒度是設計數(shù)據(jù)倉庫的一個最重要方面。
數(shù)據(jù)越詳細,粒度越小級別就越低;數(shù)據(jù)綜合度越高,粒度越大級別就越高。例如,地址數(shù)據(jù)中“北京市”比“北京市海淀區(qū)”的粒度大。2.2.2維度(Dimension)和維度表
維度(簡稱為維)是指人們觀察事物的特定的角度,概念上類似于關系表的屬性。例如企業(yè)常常關心產(chǎn)品銷售數(shù)據(jù)隨著時間推移而變化的情況,這是從時間的角度來觀察產(chǎn)品的銷售,即時間維;企業(yè)也常常關心本企業(yè)的產(chǎn)品在不同地區(qū)的銷售分布情況,這是從地理分布的角度來觀察產(chǎn)品的銷售,即地區(qū)維。存放維數(shù)據(jù)的表稱為維表,如下表所示就是一個時間維表。維表中的數(shù)據(jù)具有維層次結(jié)構,包含維屬性和維成員。編號日期月份季度年份12015.1.52015年1月2015年1季度2015年22015.3.82015年3月2015年1季度2015年32015.10.12015年10月2015年4季度2015年42015.12.32015年12月2015年4季度2015年2.維屬性和維成員一個維是通過一組屬性來描述的,如時間維包含年份、季度、月份和日期等屬性,這里的年份、季度等稱為時間維的維屬性。維的一個取值稱為該維的一個維成員,如果一個維是多層次的,那么該維的維成員是在不同維層次的取值組合。例如,一個時間維具有年份、季度、月份、日期四個層次,分別在四個層次各取一個值,就得到時間維的一個維成員,即某年某季某月某日。編號日期月份季度年份12015.1.52015年1月2015年1季度2015年22015.3.82015年3月2015年1季度2015年32015.10.12015年10月2015年4季度2015年42015.12.32015年12月2015年4季度2015年3.維層次同一維度可以存在細節(jié)程度不同的各個值,可以將粒度大的值映射到粒度小的值,這樣構成維層次(或維層次結(jié)構)或概念分層,即將低層概念映射到更一般的高層概念,概念分層允許在各種抽象級審查和處理數(shù)據(jù)。例如對于地點維,有“杭州→浙江→中國”的維層次。又例如時間維,可以從年、季度、月份、日期來描述,那么“年份→季度→月份→日期”就是維層次。時間維維屬性2014/20152014年二季度2014年4月2014年4月25日維成員維層次2.2.3度量(Measure)或事實(Fact)度量是數(shù)據(jù)倉庫中的信息單元,即多維空間中的一個單元,用以存放數(shù)據(jù),也稱為事實(Fact)。通常是數(shù)值型數(shù)據(jù)并具有可加性。例如:
(日期,商品,地區(qū),銷售量,銷售金額)其中,銷售量、銷售金額就是兩個度量。事實表時間維鍵顧客維鍵地區(qū)維鍵商品維鍵銷售數(shù)量銷售金額(元)1111115001222250001333128001444375002.2.4多維數(shù)據(jù)集數(shù)據(jù)倉庫和OLAP服務是基于多維數(shù)據(jù)模型的,這種模型將多維數(shù)據(jù)集看作數(shù)據(jù)立方體(DataCube)形式。多維數(shù)據(jù)集可以用一個多維數(shù)組來表示,它是維和度量列表的組合表示。一個多維數(shù)組可以表示為:
(維1,維2,……,維n,度量列表)某商店銷售情況表按多維數(shù)組組織起來的三維立方體增加顧客維度后,按四維數(shù)組組織起來的多維立方體2.3維度模型的結(jié)構多維數(shù)據(jù)模型簡潔、面向主題的由維度表和事實表組成直觀的展示數(shù)據(jù)組織形式,利于數(shù)據(jù)的訪問常見的多維數(shù)據(jù)模型有三種結(jié)構:星型模型、雪花模型、事實星座模型1)
星形模型
星形模型(Starschema)是由一個事實表和一組維表組成,每個維表都有一個維主鍵,所有這些維組合成事實表的主鍵,換言之,事實表主鍵的每個元素都是維表的外鍵。該模式的核心是事實表,通過事實表將各種不同的維表連接起來,各個維表都連接到中央事實表。(1)星形模型的基本結(jié)構星形模型的基本結(jié)構如下:
【例2.1】一個“銷售”數(shù)據(jù)倉庫的星形模型如圖2.5所示。該模式包含一個中心事實表“銷售事實表”和4個維表:時間維表、銷售商品維表、銷售地點維表和顧客維表。在銷售事實表中存儲著四個維表的主鍵和兩個度量“銷售量”和“銷售金額”。提問:星形模型的特點:維度表只與事實表關聯(lián),維度表彼此之間沒有任何聯(lián)系。每個維度表中的主碼都只能是單列的,同時該主碼被放置在事實數(shù)據(jù)表中,作為事實數(shù)據(jù)表與維表連接的外碼。星型模式是以事實表為核心,其他的維度表圍繞這個核心表呈星型狀分布。2)雪花模型(1)雪花模型的基本結(jié)構
雪花模型(Snowflakeschema)是對星形模型的擴展,每一個維表都可以向外連接多個詳細類別表。在這種模式中,維表除了具有星形模型中維表的功能外,還連接對事實表進行詳細描述的詳細類別表,詳細類別表通過對事實表在有關維上的詳細描述達到了縮小事實表和提高查詢效率的目的,雪花模型的基本結(jié)構如下:維表數(shù)據(jù)規(guī)范化星形模型雖然是一個關系模型,但是它不是一個規(guī)范化的模型,在星形模型中,維表被故意地非規(guī)范化了,雪花模型對星形模型的維表進一步標準化,對星形模型中的維表進行了規(guī)范化處理。
【例2.2】在圖2.5的星形模型中,每維只用一個維表表示,而每個維表包含一組屬性。例如,銷售地點維表包含屬性集{Location_id,街道,城市,省,國家}。圖2.5這種模式可能造成某些冗余,例如,可能存在城市、省、國家字段的數(shù)據(jù)冗余:{101,“解放大道100號”,“武漢”,“湖北省”,“中國”}{201,“解放大道85號”,“武漢”,“湖北省”,“中國”}{255,“解放大道205號”,“武漢”,“湖北省”,“中國”}可以對地點維表進一步規(guī)范化,如圖2.7所示,這樣就構成了“銷售”數(shù)據(jù)倉庫的雪花模型。圖2.7地點維表數(shù)據(jù)規(guī)范化提問:雪花模型的特點:某個維表不與事實表直接關聯(lián),而是與另一個維表關聯(lián)??梢赃M一步細化查看數(shù)據(jù)的粒度。維表和與其相關聯(lián)的其他維表也是靠外碼關聯(lián)的。也以事實數(shù)據(jù)表為核心。(2)雪花模型和星形模型的比較比較項目星形模型雪花模型記錄行數(shù)多少表數(shù)量少多搜索維的時間快慢可讀性容易難3)事實星座模型(1)事實星座模型的基本結(jié)構通常一個星形模型或雪花模型對應一個問題的解決(一個主題域),它們都有多個維表,但是只能存在一個事實表。在一個多主題域的復雜數(shù)據(jù)倉庫中可能存放多個事實表,此時就會出現(xiàn)多個事實表共享某一個或多個維表的情況,這就是事實星座模型(FactConstellationsschema)。
【例2.3】在圖2.5的星形模型的基礎上,增加一個供貨分析主題,包括供貨時間(Time_id)、
溫馨提示
- 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權益歸上傳用戶所有。
- 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預覽,若沒有圖紙預覽就沒有圖紙。
- 4. 未經(jīng)權益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
- 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負責。
- 6. 下載文件中如有侵權或不適當內(nèi)容,請與我們聯(lián)系,我們立即糾正。
- 7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。
最新文檔
- 內(nèi)部員工肖像權使用合同協(xié)議范本
- 鋁制品買賣合同
- 裝修隊裝修合同范本
- 2025年度耕地租賃與農(nóng)業(yè)節(jié)水灌溉技術合作合同
- 2025年度離婚后小孩撫養(yǎng)權放棄及監(jiān)護權執(zhí)行合同
- 二零二五年度屋頂光伏租賃與技術研發(fā)合同
- 2025年度果園觀光旅游項目經(jīng)營權轉(zhuǎn)讓合同
- 2025年度服裝店專業(yè)設計師聘用合同書
- 2025年度美容院合伙人投資收益分成合同協(xié)議書
- 二零二五年度電影劇本修訂聘用合同
- 2025年海南保亭縣事業(yè)單位招聘綜合歷年高頻重點模擬試卷提升(共500題附帶答案詳解)
- 污水處理設施運維服務投標方案(技術標)
- 2024年蘇州高博軟件技術職業(yè)學院高職單招職業(yè)適應性測試歷年參考題庫含答案解析
- 紀念抗日戰(zhàn)爭暨世界反法西斯戰(zhàn)爭勝利70周年主題班會 課件
- AB變頻器使用說明書
- 新疆維吾爾自治區(qū)和田地區(qū)各縣區(qū)鄉(xiāng)鎮(zhèn)行政村村莊村名居民村民委員會明細及行政區(qū)劃代碼
- DB13-T2355-2016蒸壓加氣混凝土砌塊專用砂漿
- 【課件】時代與變革-為人生而藝術 課件高中美術人美版(2019)美術鑒賞
- DB44∕T 876-2011 物業(yè)服務 會務服務規(guī)范
- 橫河氧量變送器標定及檢修
- ArcGIS應用基礎培訓(共98張)
評論
0/150
提交評論