商務(wù)智能教學(xué)課件:04 Data Warehouse 3_第1頁
商務(wù)智能教學(xué)課件:04 Data Warehouse 3_第2頁
商務(wù)智能教學(xué)課件:04 Data Warehouse 3_第3頁
商務(wù)智能教學(xué)課件:04 Data Warehouse 3_第4頁
商務(wù)智能教學(xué)課件:04 Data Warehouse 3_第5頁
已閱讀5頁,還剩37頁未讀, 繼續(xù)免費(fèi)閱讀

下載本文檔

版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進(jìn)行舉報或認(rèn)領(lǐng)

文檔簡介

1、數(shù)據(jù)倉庫Data Warehouse數(shù)據(jù)倉庫從數(shù)據(jù)庫到數(shù)據(jù)倉庫數(shù)據(jù)倉庫及其四大特征數(shù)據(jù)倉庫的基本結(jié)構(gòu)數(shù)據(jù)集市與數(shù)據(jù)倉庫數(shù)據(jù)倉庫的應(yīng)用23建立數(shù)據(jù)集市的原因(1/2)在網(wǎng)絡(luò)環(huán)境中,即使存在多個可用的數(shù)據(jù)源,但最終用戶可能仍然得不到什么可用的信息早期的數(shù)據(jù)倉庫概念僅僅提供一個多數(shù)據(jù)源的數(shù)據(jù)集成功能,為最終用戶訪問多個數(shù)據(jù)源提供統(tǒng)一的數(shù)據(jù)視圖和訪問接口作為一種反映主題的全局性數(shù)據(jù)組織,數(shù)據(jù)倉庫提供統(tǒng)一的數(shù)據(jù)模式統(tǒng)一的數(shù)據(jù)表示統(tǒng)一的數(shù)據(jù)屬性4建立數(shù)據(jù)集市的原因(2/2)然而,全局性數(shù)據(jù)倉庫往往太大,在實(shí)際應(yīng)用中將它們按部門或個人分別建立反映各個子主題與區(qū)域的局部性數(shù)據(jù)組織,它們即是數(shù)據(jù)集市。因此,有時

2、我們也稱它為部門數(shù)據(jù)倉庫。例:在有關(guān)商品銷售的數(shù)據(jù)倉庫中可以建立多個不同主題的數(shù)據(jù)集市:商品采購數(shù)據(jù)集市庫房使用數(shù)據(jù)集市商品銷售數(shù)據(jù)集市操作型數(shù)據(jù)庫 vs. 數(shù)據(jù)集市5數(shù)據(jù)倉庫/數(shù)據(jù)集市體系(1/2)一個完整的數(shù)據(jù)倉庫/數(shù)據(jù)集市體系結(jié)構(gòu)一般由三個層次組成,它們是:數(shù)據(jù)源數(shù)據(jù)倉庫數(shù)據(jù)集市(Data Mart)三者之間通過數(shù)據(jù)倉庫管理軟件聯(lián)系起來構(gòu)成一個完整的數(shù)據(jù)體系6數(shù)據(jù)倉庫/數(shù)據(jù)集市體系(2/2)數(shù)據(jù)倉庫管理軟件ORACLESYBASESQL Server文 件數(shù)據(jù)集市數(shù)據(jù)集市數(shù)據(jù)集市建 模數(shù)據(jù)倉庫元數(shù)據(jù)管理抽 取7數(shù)據(jù)集市(1/2)數(shù)據(jù)倉庫與數(shù)據(jù)集市的關(guān)系類似于傳統(tǒng)關(guān)系數(shù)據(jù)庫系統(tǒng)中的 基表

3、與 視圖 的關(guān)系數(shù)據(jù)集市的數(shù)據(jù)來自數(shù)據(jù)倉庫,它是數(shù)據(jù)倉庫中數(shù)據(jù)的一個部分與局部,是一個數(shù)據(jù)的再抽取與組織的過程建立數(shù)據(jù)倉庫與數(shù)據(jù)集市的過程可以有兩條途徑,實(shí)際上反映了一個完整的企業(yè)級數(shù)據(jù)倉庫的建立過程:從 全局?jǐn)?shù)據(jù)倉庫 到 數(shù)據(jù)集市從 數(shù)據(jù)集市 到 全局?jǐn)?shù)據(jù)倉庫 8數(shù)據(jù)集市(2/2)數(shù)據(jù)集市的數(shù)據(jù)來源于數(shù)據(jù)倉庫,專門用以滿足特定商務(wù)單元、商務(wù)程序、或商務(wù)應(yīng)用的需求具有以下特點(diǎn)面向主題存儲了預(yù)聚集數(shù)據(jù)特定分析需求或用戶群快速獲取信息體現(xiàn)終端用戶的觀點(diǎn),面向數(shù)據(jù)倉庫的界面多層次、多維度9數(shù)據(jù)集市的兩種類型獨(dú)立型數(shù)據(jù)集市從屬性數(shù)據(jù)集市10數(shù)據(jù)倉庫與數(shù)據(jù)集市的關(guān)系自頂向下的結(jié)構(gòu)自底向上的結(jié)構(gòu)總線結(jié)構(gòu)的

4、數(shù)據(jù)集市企業(yè)級數(shù)據(jù)集市結(jié)構(gòu)11自頂向下的結(jié)構(gòu)(1/3)12自頂向下的結(jié)構(gòu)(2/3)構(gòu)建企業(yè)數(shù)據(jù)倉庫公共中央數(shù)據(jù)模型數(shù)據(jù)再加工減少冗余和不一致性搜集歷史的、細(xì)節(jié)的、全局的數(shù)據(jù)基于企業(yè)數(shù)據(jù)倉庫構(gòu)建數(shù)據(jù)集市選定企業(yè)模型下的部門主題聚集數(shù)據(jù)建立集市數(shù)據(jù)對企業(yè)數(shù)據(jù)倉庫的依賴關(guān)系Local Data MartExternal DataLocal Data MartOperational DataEnterprise Warehouse13自頂向下的結(jié)構(gòu)(3/3)優(yōu)點(diǎn)建立數(shù)據(jù)集市能夠減輕DW訪問負(fù)載各部門可以任意處理數(shù)據(jù)數(shù)據(jù)轉(zhuǎn)換和整合在DW階段統(tǒng)一完成具備數(shù)據(jù)緩沖功能缺點(diǎn)成本高、見效慢、數(shù)據(jù)集市間不共享資源

5、14自底向上的結(jié)構(gòu)(1/3)15自底向上的結(jié)構(gòu)(2/3)構(gòu)建數(shù)據(jù)集市劃定主題區(qū)域快速實(shí)施,本地自治易于復(fù)制數(shù)據(jù)再加工允許一定的冗余和不一致基于數(shù)據(jù)集市構(gòu)建企業(yè)數(shù)據(jù)倉庫確定各數(shù)據(jù)集市的可用性模型的合并消除不同數(shù)據(jù)集市之間的數(shù)據(jù)不一致性Local Data MartOperational Data (Global) & External DataOperational Data (Local)Operational Data (Local)Local Data MartEnterprise Warehouse16自底向上的結(jié)構(gòu)(3/3)優(yōu)點(diǎn)見效快、啟動資金少 缺點(diǎn)各個部門都要進(jìn)行數(shù)據(jù)清理整合可能造

6、成“蜘蛛網(wǎng)”、數(shù)據(jù)不一致等問題并且總體上沒有節(jié)約資金17總線結(jié)構(gòu)的數(shù)據(jù)集市(1/3)18總線結(jié)構(gòu)的數(shù)據(jù)集市(2/3)特點(diǎn)不建立數(shù)據(jù)倉庫而直接建立數(shù)據(jù)集市各個數(shù)據(jù)集市不是孤立的,相互之間通過一種共享維表和事實(shí)表的“總線結(jié)構(gòu)”緊密聯(lián)系在一起19總線結(jié)構(gòu)的數(shù)據(jù)集市(3/3)優(yōu)點(diǎn)共享維表和事實(shí)表,解決了建立數(shù)據(jù)集市的許多問題缺點(diǎn)這種結(jié)構(gòu)基于多維模型,應(yīng)用限制于OLAP多個數(shù)據(jù)源直接影響多個集市,造成數(shù)據(jù)倉庫結(jié)構(gòu)不十分穩(wěn)定20企業(yè)級數(shù)據(jù)集市結(jié)構(gòu)數(shù)據(jù)倉庫從數(shù)據(jù)庫到數(shù)據(jù)倉庫數(shù)據(jù)倉庫及其四大特征數(shù)據(jù)倉庫的基本結(jié)構(gòu)數(shù)據(jù)集市與數(shù)據(jù)倉庫數(shù)據(jù)倉庫的應(yīng)用2122數(shù)據(jù)倉庫的應(yīng)用在數(shù)據(jù)庫及數(shù)據(jù)倉庫中存貯有大量的數(shù)據(jù),它們具

7、有規(guī)范的結(jié)構(gòu)形式與可靠的來源,且數(shù)量大、保存期間長,是一種極為寶貴的數(shù)據(jù)資源。充分開發(fā)、利用這些數(shù)據(jù)資源是目前計算機(jī)界的一項重要工作數(shù)據(jù)資源的利用有三種方式數(shù)據(jù)資源的查詢服務(wù)數(shù)據(jù)資源的演繹演繹數(shù)據(jù)庫,知識庫統(tǒng)計分析軟件(SAS,SPSS)數(shù)據(jù)資源的歸納數(shù)據(jù)挖掘DB OLTPDW DSS23操作型、分析型環(huán)境間的數(shù)據(jù)流某些時候,存在從數(shù)據(jù)倉庫環(huán)境到操作型環(huán)境的數(shù)據(jù)回流。操作型環(huán)境中采用SQL等方式,直接訪問數(shù)據(jù)倉庫的“回流”是不正常的。24數(shù)據(jù)倉庫數(shù)據(jù)的直接訪問由操作型環(huán)境到數(shù)據(jù)倉庫數(shù)據(jù)的直接訪問有以下限制:從響應(yīng)時間的角度來考慮,請求數(shù)據(jù)倉庫數(shù)據(jù)的操作型處理通常不具有在線特性對數(shù)據(jù)的請求必須是

8、最小量的管理數(shù)據(jù)倉庫所用到的技術(shù)(如協(xié)議等)必須與管理操作型環(huán)境所用到的技術(shù)一致從數(shù)據(jù)倉庫取得的、準(zhǔn)備傳輸?shù)讲僮餍铜h(huán)境的數(shù)據(jù)必須不做或很少的格式化因此,由操作型環(huán)境到數(shù)據(jù)倉庫數(shù)據(jù)的直接訪問很少25數(shù)據(jù)倉庫數(shù)據(jù)的間接訪問(1/6)航空公司的傭金計算系統(tǒng) 考慮旅行社代表客戶與航空公司進(jìn)行訂票服務(wù),航空公司需進(jìn)行一個最佳傭金的計算。而最佳傭金的計算需要考慮當(dāng)前的預(yù)定情況和歷史情況當(dāng)前的預(yù)定情況提供了目前飛機(jī)票的預(yù)定情況,而歷史情況則提供了過去一段時間的訂票情況?;诙?,可以計算出一個最佳的傭金考慮到實(shí)際情況,航空公司采用離線方式完成傭金計算和航班歷史分析,離線計算和分析以周期性的方式進(jìn)行,并創(chuàng)建一

9、個小的易于訪問的航班狀態(tài)表。這樣,當(dāng)航空公司與旅行社交互時,很容易查閱當(dāng)前訂票情況和航班狀態(tài)表26數(shù)據(jù)倉庫數(shù)據(jù)的間接訪問(2/6)27數(shù)據(jù)倉庫數(shù)據(jù)的間接訪問(3/6)零售個性化系統(tǒng) 當(dāng)顧客與零售商銷售代表進(jìn)行電話咨詢時,銷售代表需要能夠立即查詢到顧客的個性化信息,如上次購物的日期,上次購物的類型,市場分析/市場類別信息這些個性化信息通??梢杂蓴?shù)據(jù)倉庫環(huán)境的一個后臺分析程序提供,后臺分析程序通常定時運(yùn)行以提供相關(guān)信息28數(shù)據(jù)倉庫數(shù)據(jù)的間接訪問(4/6)29數(shù)據(jù)倉庫數(shù)據(jù)的間接訪問(5/6) 由一個程序?qū)?shù)據(jù)倉庫進(jìn)行定期的分析,以檢驗相關(guān)的特征和標(biāo)準(zhǔn)。這種分析過程將在在線環(huán)境中產(chǎn)生一個小文件,其中包

10、括了有關(guān)企業(yè)方面的簡明信息。這樣這個小文件就能夠有效的被操作型環(huán)境所利用30數(shù)據(jù)倉庫數(shù)據(jù)的間接訪問(6/6)分析程序:擁有許多人工智能的特征可以運(yùn)行在任何可用的數(shù)據(jù)倉庫中在后臺運(yùn)行,這樣時間就不是一個大問題程序的運(yùn)行與數(shù)據(jù)倉庫發(fā)生變化的速度一致周期性刷新:不是經(jīng)常運(yùn)行以離線模式操作支持從數(shù)據(jù)倉庫到操作型環(huán)境的數(shù)據(jù)傳輸在線預(yù)分析數(shù)據(jù)文件:每個數(shù)據(jù)單元僅僅包含少量的數(shù)據(jù)總體上可以包含大量的信息準(zhǔn)確地包含了在線處理人員所需要的東西不被修改,但是以批量方式周期性更新是在線高性能訪問環(huán)境的一部分訪問效率高適合訪問單個數(shù)據(jù)單元,而不是大量數(shù)據(jù)分析型應(yīng)用客戶關(guān)系管理商業(yè)零售金融領(lǐng)域保險業(yè)電訊行業(yè)醫(yī)療保健政府

11、其他3132客戶關(guān)系管理(1/2)包括“客戶數(shù)據(jù)的集成”和“客戶信息的分析與挖掘”兩個部分客戶數(shù)據(jù)的集成客戶信息中的姓名和地址的集成對姓名和地址進(jìn)行解析,分成更細(xì)小的片斷對姓名和地址進(jìn)行標(biāo)準(zhǔn)化客戶數(shù)據(jù)的更新新客戶的識別老客戶的信息更新(可能需要使用數(shù)據(jù)倉庫中已有的歷史數(shù)據(jù))客戶關(guān)系管理(2/2)客戶信息的分析與挖掘客戶特征分類分析新客戶的發(fā)現(xiàn)客戶贏利分析優(yōu)質(zhì)客戶挖掘客戶行為分析客戶異常行為的發(fā)現(xiàn)客戶需求分析客戶反映分析提供一對一服務(wù)(One to One)防止已有客戶的流失3334商業(yè)零售(1/2)客戶信息管理與分析客戶關(guān)系管理客戶特征分析客戶購買行為與購買習(xí)慣分析銷售分析銷售額與銷售時間的關(guān)

12、系銷售額與商品的關(guān)系銷售額與銷售地區(qū)的關(guān)系銷售額與購買客戶的關(guān)系商業(yè)零售(2/2)貨種管理不同種類商品之間的關(guān)系分析市場分析商品銷售預(yù)測商品價格分析零售點(diǎn)設(shè)置布局庫存管理倉庫使用管理商品的庫存數(shù)量分析人力資源管理3536金融領(lǐng)域(1/2)帳戶信用等級的評估使用聚類分析等方法對銀行帳戶進(jìn)行分類,并得到帳戶的信用等級信用卡運(yùn)作新客戶的發(fā)現(xiàn)哪些客戶最有可能使用我們的信用卡,他們通常申請什么類型的信用卡?優(yōu)質(zhì)客戶挖掘哪些客戶是最有利可圖的?老客戶的保留怎樣才能讓他們更多的使用信用卡進(jìn)行支付?信用卡使用模式分析欺詐的識別與防止37金融領(lǐng)域(2/2)股票交易規(guī)律分析客戶分類分析客戶交易分析客戶帳戶分析客戶

13、價值分析財政預(yù)算和計劃38保險業(yè)保險費(fèi)率的確定可以從大量客戶投保數(shù)據(jù)中分析并取得不同條件、不同人員、不同險種、不同時間與年齡的保險費(fèi)率,使保險業(yè)主能獲得合理的利潤險種關(guān)聯(lián)分析可以分析客戶在購買了某種保險后是否同時還會購買另一種保險認(rèn)購險種的預(yù)測可以通過數(shù)據(jù)挖掘預(yù)測新險種的客戶群以及新險種的前景39電訊行業(yè)客戶開發(fā)開展新客戶,防止丟失很有利的客戶,查明哪些客戶會離開?為什么?活動成本管理需花多少錢來實(shí)現(xiàn)一個新線或建立一項新服務(wù)價格制定分時段制訂收費(fèi)標(biāo)準(zhǔn)調(diào)用詳細(xì)記錄分析了解每次通話記錄的詳細(xì)信息,包括通話類型、時長、通話位置等,以便于進(jìn)行定價和容量規(guī)劃。異常電話檢測(盜打,欠費(fèi)等)電信市場向客戶提供混合銷售、呼叫、等待、留

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負(fù)責(zé)。
  • 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時也不承擔(dān)用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

評論

0/150

提交評論