oracle_數(shù)據(jù)倉庫簡介ppt課件_第1頁
oracle_數(shù)據(jù)倉庫簡介ppt課件_第2頁
oracle_數(shù)據(jù)倉庫簡介ppt課件_第3頁
oracle_數(shù)據(jù)倉庫簡介ppt課件_第4頁
oracle_數(shù)據(jù)倉庫簡介ppt課件_第5頁
已閱讀5頁,還剩8頁未讀 繼續(xù)免費閱讀

下載本文檔

版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進行舉報或認領(lǐng)

文檔簡介

1、數(shù)據(jù)倉庫和BI簡介jianhui.wang 2021培訓(xùn)目的:1. 了解數(shù)據(jù)倉庫及BI的根本概念 2. 設(shè)計數(shù)據(jù)倉庫 3. 本公司目前數(shù)據(jù)庫倉庫構(gòu)造 4. BI建模分析及提供數(shù)據(jù)給決策層.第一課堂 根本概念一、數(shù)據(jù)倉庫 數(shù)據(jù)倉庫是面向主題的、集成的、穩(wěn)定的(不可更新的)、隨時間不斷變化(不同時間)的數(shù)據(jù)集合,用以支持運營管理中的決策制定過程。 a) 面向主題與傳統(tǒng)數(shù)據(jù)庫的面向運用相對應(yīng),主題是一個在較高層次上將數(shù)據(jù)歸類的規(guī)范,每個主題對應(yīng)一個宏觀的分析領(lǐng)域; b) 集成特性是指數(shù)據(jù)在進人數(shù)據(jù)倉庫前,必需經(jīng)過加工和集成,以一致原始數(shù)據(jù)中的矛盾之處,還要將原始數(shù)據(jù)構(gòu)造從面向運用轉(zhuǎn)變?yōu)槊嫦蛑黝}。 c

2、) 穩(wěn)定性是指數(shù)據(jù)倉庫反映的是已成為歷史的數(shù)據(jù),.而不是日常事務(wù)處置產(chǎn)生的數(shù)據(jù),數(shù)據(jù)經(jīng)加工和集成進入數(shù)據(jù)倉庫后極少或根本不修正,數(shù)據(jù)倉庫是不同時間的數(shù)據(jù)集合,它要求數(shù)據(jù)倉庫中的數(shù)據(jù)保管時不僅能滿足決策分析的需求,而且都要標明該數(shù)據(jù)的歷史時期。 d) 數(shù)據(jù)倉庫最根本的特點是物理地存放數(shù)據(jù),而且這些數(shù)據(jù)并不是最新的、專有的,而是來源于其他數(shù)據(jù)庫。傳統(tǒng)的數(shù)據(jù)庫系統(tǒng)主要擔(dān)任日常操作性的事務(wù)處置義務(wù),而數(shù)據(jù)倉庫承當(dāng)支持決策分析效力的數(shù)據(jù)平臺。. 面向主題圖解 操作型環(huán)境 數(shù)據(jù)倉庫 汽車 顧客 人壽 保險單 安康 保險費 不測傷亡 索賠 運用 主題 面向主題是經(jīng)過一組相關(guān)的表來詳細實現(xiàn)的。.二、構(gòu)建數(shù)據(jù)倉

3、庫的關(guān)鍵技術(shù) 數(shù)據(jù)倉庫的構(gòu)建偏向于工程,具有劇烈的工程性,其關(guān)鍵技術(shù)主要有數(shù)據(jù)抽取、數(shù)據(jù)組織、數(shù)據(jù)表現(xiàn)三個方面。 a)數(shù)據(jù)抽取 數(shù)據(jù)的抽取是數(shù)據(jù)進入數(shù)據(jù)倉庫的入口。由于數(shù)據(jù)倉庫是一個獨立的數(shù)據(jù)環(huán)境,它需求經(jīng)過抽取過程將數(shù)據(jù)從數(shù)據(jù)庫系統(tǒng)、外部數(shù)據(jù)源、脫機的數(shù)據(jù)存儲介質(zhì)中導(dǎo)入到數(shù)據(jù)倉庫。數(shù)據(jù)抽取在技術(shù)上主要涉及互連、復(fù)制、增量、轉(zhuǎn)換、調(diào)度和監(jiān)控等幾個方面。數(shù)據(jù)倉庫的數(shù)據(jù)并不要求與數(shù)據(jù)源堅持實時的同步,因此數(shù)據(jù)抽取可以定時進展,但多個抽取操作執(zhí)行的時間、相互的順序、成敗對數(shù)據(jù)倉庫中信息的有效性那么至關(guān)重要。 見以下圖所示:. . b)數(shù)據(jù)組織 數(shù)據(jù)倉庫是存儲數(shù)據(jù)的一種組織方式,它從傳統(tǒng)數(shù)據(jù)庫中獲得原

4、始數(shù)據(jù)(數(shù)據(jù)源),先按輔助決策的主題需求構(gòu)成當(dāng)前根本數(shù)據(jù)層(接口層,比如本公司數(shù)據(jù)庫RP用戶),再按綜合決策的要求構(gòu)成綜合數(shù)據(jù)層(中間層,比如MID用戶) 。隨著時間的推移,由時間控制機制將當(dāng)前根本數(shù)據(jù)層轉(zhuǎn)為歷史數(shù)據(jù)。 c)數(shù)據(jù)方式 數(shù)據(jù)倉庫中存放著不同綜合級別的數(shù)據(jù),可分為四個級別:早期細節(jié)級、當(dāng)前細節(jié)級、輕度綜合級和高度綜合級。源數(shù)據(jù)經(jīng)過綜合處置之后,首先進入當(dāng)前細節(jié)級,并根據(jù)詳細需求進一步的綜合,從而進入輕度綜合級乃至高度綜合級,老化的數(shù)據(jù)將進入早期細節(jié)級。 . d)確定數(shù)據(jù)粒度 數(shù)據(jù)粒度與數(shù)據(jù)倉庫構(gòu)造相關(guān),是指數(shù)據(jù)倉庫中一組數(shù)據(jù)單元所包含數(shù)據(jù)的詳盡程度。粒度越大,數(shù)據(jù)表示的細節(jié)程度那么

5、越低,綜合程度越高。粒度直接影響到駐留在數(shù)據(jù)倉庫里的數(shù)據(jù)量以及在同一時間里可以得到呼應(yīng)的查詢類型。對于大型的數(shù)據(jù)倉庫,往往需求建立多層粒度,其中一層對應(yīng)數(shù)據(jù)倉庫的當(dāng)前細節(jié)級數(shù)據(jù),一層對應(yīng)輕度綜合級數(shù)據(jù),其他層那么根據(jù)系統(tǒng)的性能要求以及業(yè)務(wù)的詳細要求來設(shè)計。 確定適當(dāng)?shù)牧6瘸潭龋紫纫獙?shù)據(jù)的記錄數(shù)和數(shù)據(jù)倉庫的磁盤空間進展估算,接著思索粒度的大小。通常利用閱歷選擇粒度程度,先創(chuàng)建部分數(shù)據(jù)倉庫讓用戶運用,當(dāng)用戶產(chǎn)生新的需求后,再對粒度進展調(diào)整,最終建立整個數(shù)據(jù)倉庫的粒度程度和存儲方式。 見以下圖:. 以中青寶游戲數(shù)據(jù)庫為例: . e)數(shù)據(jù)表現(xiàn) 數(shù)據(jù)表現(xiàn)本質(zhì)上是指數(shù)據(jù)倉庫的運用。目前,數(shù)據(jù)倉庫曾經(jīng)廣

6、泛地運用在銀行、金融效力、消費物品和零售零售部門,以及諸如基于需求的產(chǎn)品消費。就功能而言,數(shù)據(jù)倉庫的運用主要表達在信息處置、分析處置和數(shù)據(jù)發(fā)掘三個方面: 信息處置:支持查詢和根本的統(tǒng)計分析,并運用交又表、表、圖表或圖進展報告。數(shù)據(jù)倉庫信息處置的當(dāng)前趨勢是構(gòu)造低本錢的基于Web的存取工具,然后與Web閱讀器集成在一同。 分析處置:支持聯(lián)機分析處置OLAP。分析處置普通是在匯總的和細節(jié)的歷史數(shù)據(jù)上操作,主要優(yōu)勢在于支持多維數(shù)據(jù)分析。 數(shù)據(jù)發(fā)掘:支持知識發(fā)現(xiàn),包括尋覓隱藏的方式和關(guān)聯(lián),構(gòu)造分析方式,進展分類和預(yù)測,并用可視化工具提供發(fā)掘構(gòu)造??偟膩碚f,數(shù)據(jù)倉庫的性能,集中表如今多維分析、數(shù)據(jù)發(fā)掘方面

7、。. 總之,數(shù)據(jù)倉庫技術(shù)是數(shù)據(jù)庫技術(shù)的開展和運用。建立數(shù)據(jù)倉庫并不是要取代數(shù)據(jù)庫,而是在全面和完善的信息運用根底上進展數(shù)據(jù)分析,構(gòu)建決策支持系統(tǒng)。目前,數(shù)據(jù)倉庫、聯(lián)機分析處置和數(shù)據(jù)發(fā)掘技術(shù)的有效集成和運用,即聯(lián)機分析發(fā)掘系統(tǒng),是數(shù)據(jù)倉庫技術(shù)的運用趨勢,同時也成為智能化運用系統(tǒng)的重要組成部分。它們主要區(qū)有以下幾個方面: a) 運用數(shù)據(jù)庫面向操作運用, 數(shù)據(jù)倉庫面向主題分析; b) 運用數(shù)據(jù)庫允許DML操作, 數(shù)據(jù)倉庫不許修正數(shù)據(jù); c) 運用數(shù)據(jù)庫是詳細的數(shù)據(jù), 數(shù)據(jù)倉庫是概要精化的數(shù)據(jù); d) 運用數(shù)據(jù)庫為日常任務(wù)效力,數(shù)據(jù)倉庫是為管理者效力的; e) 數(shù)據(jù)倉庫是高度集成的,大部分是粒度化數(shù)據(jù)。.第二課堂 設(shè)計數(shù)據(jù)倉庫一、首先了解兩個概念(粒度和維度) 粒度是看問題的細膩程度,指定某一個維度的最小單位做為粒度,是指數(shù)據(jù)按什么單位存儲,可以按小時,天,周,月,季度,年等來存儲,粒度不需求他創(chuàng)建,詳細表達在他對數(shù)據(jù)的匯總級別上了(可以了解為,粒度只是察看問題詳細或粗略的級別程度),比如他匯總為月了,那么他只能出月報了,日報就能夠出不了。反之,他匯總為日粒度,日報,月報照樣出。比如:日結(jié)算表, 月結(jié)算表。 維度那么是多維數(shù)據(jù)集的構(gòu)造性特性。它們是現(xiàn)實數(shù)據(jù)表中用來描畫數(shù)據(jù)的分類的

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負責(zé)。
  • 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔(dān)用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

最新文檔

評論

0/150

提交評論