CRM系統(tǒng)中的商業(yè)智能技術培訓課件_第1頁
CRM系統(tǒng)中的商業(yè)智能技術培訓課件_第2頁
CRM系統(tǒng)中的商業(yè)智能技術培訓課件_第3頁
CRM系統(tǒng)中的商業(yè)智能技術培訓課件_第4頁
CRM系統(tǒng)中的商業(yè)智能技術培訓課件_第5頁
已閱讀5頁,還剩78頁未讀, 繼續(xù)免費閱讀

下載本文檔

版權說明:本文檔由用戶提供并上傳,收益歸屬內容提供方,若內容存在侵權,請進行舉報或認領

文檔簡介

第7章CRM系統(tǒng)中的商業(yè)智能技術數(shù)據(jù)倉庫技術數(shù)據(jù)挖掘理解三種技術的的應用CRM系統(tǒng)中商業(yè)智能技術本章主要內容:)聯(lián)機分析處理數(shù)據(jù)挖掘

OLAP的應用

數(shù)據(jù)挖掘應用基本步驟設計與實施數(shù)據(jù)倉庫技術體系結構數(shù)據(jù)倉庫客戶智能定義、構成OLAP技術應用商業(yè)智能第一節(jié)商業(yè)智能商業(yè)智能是從大量的數(shù)據(jù)和信息中發(fā)掘有用的知識,并用于決策以增加商業(yè)利潤,是一個從數(shù)據(jù)到信息到知識的處理過程。商業(yè)智能用來輔助商業(yè)活動作出快速反應,加快知識的獲取速度,減少企業(yè)不確定性因素的影響。因此能很好地滿足管理層和決策層對信息知識的時間性和準確性的要求。商業(yè)智能在我國尚處于起步階段,雖然其在發(fā)展和應用過程中仍存在很多不足,但商業(yè)智能正朝著實時性、標準化、集成性、實用性、大眾化方向發(fā)展。

商業(yè)智能的定義數(shù)據(jù)挖掘

OLAP的應用

數(shù)據(jù)挖掘應用基本步驟設計與實施數(shù)據(jù)倉庫技術體系結構數(shù)據(jù)倉庫客戶智能定義、構成OLAP技術應用商業(yè)智能支撐技術:數(shù)據(jù)倉庫為平臺,數(shù)據(jù)挖掘OLAP互補,進行分析體系結構:以Web服務形式提供,以XML形式發(fā)放BI應用的分析結果是新的發(fā)展趨勢。應用系統(tǒng):BI系統(tǒng)將更具專業(yè)化和行業(yè)化的特點,與企業(yè)門戶、企業(yè)應用集成緊密相連商業(yè)智能的發(fā)展商業(yè)智能的發(fā)展第一節(jié)商業(yè)智能數(shù)據(jù)挖掘

OLAP的應用

數(shù)據(jù)挖掘應用基本步驟設計與實施數(shù)據(jù)倉庫技術體系結構數(shù)據(jù)倉庫客戶智能定義、構成OLAP技術應用商業(yè)智能數(shù)據(jù)倉庫決策支持企業(yè)決策層OLAP數(shù)據(jù)挖掘數(shù)據(jù)存儲提取、清洗、轉化業(yè)務數(shù)據(jù)庫決策信息反饋到實際的業(yè)務系統(tǒng)中

商業(yè)智能系統(tǒng)的構成商業(yè)智能系統(tǒng)由業(yè)務數(shù)據(jù)倉庫系統(tǒng)、決策支持系統(tǒng)等部分構成。圖7-12商業(yè)智能系統(tǒng)的數(shù)據(jù)處理循環(huán)第一節(jié)商業(yè)智能數(shù)據(jù)挖掘

OLAP的應用

數(shù)據(jù)挖掘應用基本步驟設計與實施數(shù)據(jù)倉庫技術體系結構數(shù)據(jù)倉庫客戶智能定義、構成OLAP技術應用商業(yè)智能商務智能系統(tǒng)的三大支撐技術數(shù)據(jù)倉庫技術

OLAP

數(shù)據(jù)倉庫完成了數(shù)據(jù)的收集、集成、存儲、管理等工作,商務智能面對的是經(jīng)過加工的數(shù)據(jù),能更專注于信息的提取和知識的發(fā)現(xiàn)。OLAP從多種角度對原始數(shù)據(jù)進行分析,將其轉化為用戶所理解、并真實反映企業(yè)經(jīng)營情況的信息,為決策提供依據(jù)。數(shù)據(jù)挖掘技術

數(shù)據(jù)挖掘技術能高度自動化地分析數(shù)據(jù),做出歸納性推理,挖掘出潛在的模式,幫助決策者作出正確的決策。

商業(yè)智能系統(tǒng)的支撐技術第一節(jié)商業(yè)智能數(shù)據(jù)挖掘

OLAP的應用

數(shù)據(jù)挖掘應用基本步驟設計與實施數(shù)據(jù)倉庫技術體系結構數(shù)據(jù)倉庫客戶智能定義、構成OLAP技術應用商業(yè)智能客戶智能是創(chuàng)新和使用客戶知識,幫助企業(yè)提高優(yōu)化客戶關系的決策能力和整體運營能力的概念、方法、過程以及軟件的集合。

客戶智能客戶智能的理解理論基礎信息系統(tǒng)層面數(shù)據(jù)分析層面知識發(fā)現(xiàn)層面戰(zhàn)略層面

客戶智能的定義第一節(jié)商業(yè)智能數(shù)據(jù)挖掘

OLAP的應用

數(shù)據(jù)挖掘應用基本步驟設計與實施數(shù)據(jù)倉庫技術體系結構數(shù)據(jù)倉庫客戶智能定義、構成OLAP技術應用商業(yè)智能客戶知識,顧名思義,是有關客戶的知識??蛻糁R包括客戶的消費偏好、喜歡選用的接觸渠道、消費特征等許多描述客戶的知識。客戶知識是人們通過實踐認識到的、與客戶有關的規(guī)律性,而客戶智能是獲得客戶知識并使用客戶知識求解問題的能力??蛻糁悄苁菍ζ髽I(yè)戰(zhàn)略決策真正有價值的事物和行動。生成客戶知識的過程稱之為客戶知識的加工處理過程,客戶智能不僅包括了客戶知識的生成,而且強調了客戶知識在企業(yè)中的分發(fā)、使用,直到產(chǎn)生客戶智能。

客戶知識第一節(jié)商業(yè)智能數(shù)據(jù)挖掘

OLAP的應用

數(shù)據(jù)挖掘應用基本步驟設計與實施數(shù)據(jù)倉庫技術體系結構數(shù)據(jù)倉庫客戶智能定義、構成OLAP技術應用商業(yè)智能客戶知識生成客戶知識分發(fā)客戶檔案客戶知識使用營銷客戶服務。。。??蛻糁悄芸蛻糁悄軋D7-13客戶智能的生成、分發(fā)和使用第一節(jié)商業(yè)智能數(shù)據(jù)挖掘

OLAP的應用

數(shù)據(jù)挖掘應用基本步驟設計與實施數(shù)據(jù)倉庫技術體系結構數(shù)據(jù)倉庫客戶智能定義、構成OLAP技術應用商業(yè)智能

(1)客戶知識的生成(generation):使用商業(yè)智能提供的OLAP分析工具、數(shù)據(jù)挖掘工具或兩種工具的組合,發(fā)現(xiàn)存在于客戶數(shù)據(jù)中的模式、規(guī)則、概念、規(guī)律的整個過程,稱為客戶知識的生成。

(2)客戶知識的分發(fā)(distribution):客戶知識必須到達組織內每一個需要客戶知識的部分。將客戶知識存儲與動態(tài)知識庫,借助CRM的系統(tǒng)平臺,將客戶知識分發(fā)到需要的終端。

(3)客戶知識的使用(usingit):將客戶信息和知識投入使用是CRM的最后一個環(huán)節(jié)。許多CRM和知識發(fā)現(xiàn)沒有成功,很大程度上在于產(chǎn)生的與客戶有關的信息和知識不能投入使用。第一節(jié)商業(yè)智能數(shù)據(jù)挖掘

OLAP的應用

數(shù)據(jù)挖掘應用基本步驟設計與實施數(shù)據(jù)倉庫技術體系結構數(shù)據(jù)倉庫客戶智能定義、構成OLAP技術應用商業(yè)智能第二節(jié)數(shù)據(jù)倉庫概述數(shù)據(jù)倉庫的產(chǎn)生沒有(一致的)全局信息→很難產(chǎn)生正確的決策沒有(完整的)歷史數(shù)據(jù)→歷史數(shù)據(jù)分析(經(jīng)驗)發(fā)展趨勢預測隱含信息挖掘→更難支持企業(yè)決策研究企業(yè)范圍內的數(shù)據(jù)集成多數(shù)據(jù)庫系統(tǒng)面向問題的分析海量數(shù)據(jù)存儲產(chǎn)生一項新的信息技術

DataWarehousingDW的概念起源于20世紀80年代美國著名信息工程學家W.H.Inmon博士RecordSystemAtomicData→提出數(shù)據(jù)倉庫的概念DecisionSupportDatabase數(shù)據(jù)挖掘

OLAP的應用

數(shù)據(jù)挖掘應用基本步驟設計與實施數(shù)據(jù)倉庫技術體系結構數(shù)據(jù)倉庫客戶智能定義、構成OLAP技術應用商業(yè)智能第二二節(jié)節(jié)數(shù)數(shù)據(jù)據(jù)倉倉庫庫概概述述早期期數(shù)數(shù)據(jù)據(jù)倉倉庫庫的的定定義義的的重重要要文文獻獻::MartinHubel1986.10DataBaseandtheDataWarehousingConcept數(shù)據(jù)據(jù)倉倉庫庫的的定定義義AnArchitectureforaBusinessandInformationSystem—IBMSystemJournal其中中,,披披露露了了一一項項IBM的內內部部研研究究計計劃劃目的的::構構造造一一種種“以關關系系數(shù)數(shù)據(jù)據(jù)庫庫為為基基礎礎的的公公司司數(shù)數(shù)據(jù)據(jù)的的集集成成化化倉倉儲儲”倉儲儲的的使使用用者者::不不是是IT人員員而是是各各級級決決策策者者→→數(shù)據(jù)據(jù)倉倉庫庫1991年,,IBM公司司正正式式公公布布其其DW構架架INDEPTH→成功功開開發(fā)發(fā)DW數(shù)據(jù)據(jù)挖挖掘掘OLAP的的應應用用數(shù)據(jù)據(jù)挖挖掘掘應應用用基本本步步驟驟設計計與與實實施施數(shù)據(jù)據(jù)倉倉庫庫技技術術體系系結結構構數(shù)據(jù)據(jù)倉倉庫庫客戶戶智智能能定義義、、構構成成OLAP技術術應用用商業(yè)業(yè)智智能能第二二節(jié)節(jié)數(shù)數(shù)據(jù)據(jù)倉倉庫庫概概述述數(shù)據(jù)據(jù)倉倉庫庫(datawarehouse)是一一個個面面向向主主題題的的(subjectoriented)、集集成成的的(integrated)、非非易易失失的的(non-volatile)、隨隨時時間間變變化化的的(timevariant)數(shù)據(jù)據(jù)集集合合,,用用于于支支持持管管理理決決策策。。面向主題集成性非易失性時變性

在數(shù)據(jù)倉庫中,所有數(shù)據(jù)都是圍繞一定主題進行。對于同一主題:關系數(shù)據(jù)庫中,數(shù)據(jù)分布在相關的數(shù)據(jù)表中,在數(shù)據(jù)倉庫中,數(shù)據(jù)存放在同一數(shù)據(jù)表中。數(shù)據(jù)倉庫中數(shù)據(jù)都經(jīng)過清洗、過濾、轉換。都有統(tǒng)一得格式、消除了源數(shù)據(jù)中結構、表示方式、代碼含義,不一致性

對于支持決策,歷史數(shù)據(jù)非常重要。數(shù)據(jù)一旦寫入,幾乎不再更改,除非錯誤。對數(shù)據(jù)倉庫的操作只是數(shù)據(jù)追加。所以數(shù)據(jù)倉庫中數(shù)據(jù)是非易失的(穩(wěn)定的)數(shù)據(jù)倉庫中數(shù)據(jù)是只增不刪的,所以記錄了所有的數(shù)據(jù)。反映企業(yè)各個時期的信息,即反映企業(yè)隨時間動態(tài)變化的數(shù)據(jù)。數(shù)據(jù)據(jù)倉倉庫庫的的定定義義數(shù)據(jù)據(jù)挖挖掘掘OLAP的的應應用用數(shù)據(jù)據(jù)挖挖掘掘應應用用基本本步步驟驟設計計與與實實施施數(shù)據(jù)據(jù)倉倉庫庫技技術術體系系結結構構數(shù)據(jù)據(jù)倉倉庫庫客戶戶智智能能定義義、、構構成成OLAP技術術應用用商業(yè)業(yè)智智能能第二二節(jié)節(jié)數(shù)數(shù)據(jù)據(jù)倉倉庫庫概概述述面向主題案例數(shù)據(jù)據(jù)結結構構::銷售售管管理理系系統(tǒng)統(tǒng)顧客客((顧顧客客號號,,姓姓名名,,性性別別,,年年齡齡,,文文化化程程度度,,地地址址,,電電話話))銷售售((員員工工號號,,顧顧客客號號,,商品品號號,數(shù)量,單價,日期期)采購管理系統(tǒng)統(tǒng)訂單單(訂單號,,供應商號,,總金額,日日期)訂單細則(訂訂單號,商品號,類別,單價價,數(shù)量)供應商((供應商號,,供應商名,,地址,電話話)庫存管理系統(tǒng)統(tǒng)領料單(領料料單號,領料料人,商品號,數(shù)量,日期)進料單(進料料單號,訂單單號,進料人人,收料人,,日期)庫存(商商品號,庫房房號,庫存量量,日期)庫房(庫庫房號,倉庫庫管理員,地地點,庫存商商品描述)數(shù)據(jù)挖掘OLAP的應應用數(shù)據(jù)挖掘應用用基本步驟設計與實施數(shù)據(jù)倉庫技術術體系結構數(shù)據(jù)倉庫客戶智能定義、構成OLAP技術應用商業(yè)智能第二節(jié)數(shù)據(jù)據(jù)倉庫概述面向主題案例這種數(shù)據(jù)組織織的特點:對相關部門的的數(shù)據(jù)進行收收集和處理,,重點是“數(shù)據(jù)”和“處理”數(shù)據(jù)按部門的的組織結構和和業(yè)務活動特特點進行;數(shù)據(jù)是不斷變變化和反復更更新的,所以以,是動態(tài)的的,要求的是是處理的速度和和即時性(只只反映當時的的情況);數(shù)據(jù)庫中存儲儲的表與部門門中的業(yè)務報報表基本上是是對應的,所所以,直觀,處理方方便,易理解解;數(shù)據(jù)庫建立的的本質:數(shù)據(jù)據(jù)與處理分離離(在程序中中不分離)因為:很多應應用涉及同一一數(shù)據(jù)項,而而同一數(shù)據(jù)項項分散在不同同的數(shù)據(jù)庫中→→造成數(shù)據(jù)據(jù)的不一致性性。這樣的數(shù)據(jù)處處理方式稱為為“聯(lián)機事務處理理”——OLTP數(shù)據(jù)庫的存儲儲要求冗冗余?。ǜ鞲鞣N范式)速度快(保保留一定的冗冗余)數(shù)據(jù)挖掘OLAP的應應用數(shù)據(jù)挖掘應用用基本步驟設計與實施數(shù)據(jù)倉庫技術術體系結構數(shù)據(jù)倉庫客戶智能定義、構成OLAP技術應用商業(yè)智能第二節(jié)數(shù)據(jù)據(jù)倉庫概述按主題組織數(shù)數(shù)據(jù)的數(shù)據(jù)結結構:商品商品固有信息息(商品號,商品名,類別,顏色,…)商品采購信息息(商品號,供應商號,供應價,供應日期,供應量,…)商品銷售信息息(商品號,顧客號,售價,銷售日期,銷售量,….)商品庫存信息息(商品號,庫房號,庫存量,日期,…)供應商供應商固有信信息(供應商號,供應信息,地址,電話,…)供應商品信息息(供應商號,商品號,供應價,供應日期,供應量,…)顧客客顧客固有信息息(顧客號,顧客名,性別,年齡,文化程度,住址,電話,…)顧客購物信息息(顧客號,商品號,售價,購買日期,購買量,…)①企業(yè)關心的業(yè)業(yè)務方向:客客戶,商品,,供應商②對上述分析對對象,可圍繞繞主題進行數(shù)數(shù)據(jù)組織:采購銷售庫存商品(一致)信息息,便于聯(lián)聯(lián)機分析處理理OLAP數(shù)據(jù)挖掘OLAP的應應用數(shù)據(jù)挖掘應用用基本步驟設計與實施數(shù)據(jù)倉庫技術術體系結構數(shù)據(jù)倉庫客戶智能定義、構成OLAP技術應用商業(yè)智能(1)數(shù)據(jù)粒度面向數(shù)據(jù)挖掘掘面向OLAP粒度的大小反反映數(shù)據(jù)倉庫庫的數(shù)據(jù)綜合程程度。粒度越越小,數(shù)據(jù)越詳詳細,數(shù)據(jù)量量也越大。(表表7-1)反映的是抽樣樣率。抽樣率率的確定取決于源源數(shù)據(jù)量的大大小和數(shù)據(jù)挖掘的的具體要求。。源數(shù)據(jù)量越大,,抽樣率越低低。表7-1數(shù)數(shù)據(jù)粒度度的相關指標標數(shù)據(jù)粒度的劃劃分是設計最最重要的工作作,需考慮數(shù)數(shù)據(jù)倉庫可接接受的分析類類型和最低粒粒度以及能存存儲的數(shù)據(jù)量量。一般數(shù)據(jù)據(jù)倉庫都選擇擇多重粒度的的結構。重要概念第二節(jié)數(shù)據(jù)據(jù)倉庫概述數(shù)據(jù)挖掘OLAP的應應用數(shù)據(jù)挖掘應用用基本步驟設計與實施數(shù)據(jù)倉庫技術術體系結構數(shù)據(jù)倉庫客戶智能定義、構成OLAP技術應用商業(yè)智能數(shù)據(jù)分割常見見形式垂直分割水平分割圖解分割(2)數(shù)據(jù)分割數(shù)據(jù)分割就是將大量的的數(shù)據(jù)分成獨獨立的、較小小的單元進行行存儲以提高高數(shù)據(jù)處理的的效率。在進進行分割時要要考慮數(shù)據(jù)量量、數(shù)據(jù)對象象和粒度劃分分策略等幾個個方面。一個表垂直分分成兩部分,把把一個大表分成成兩個表,表之之間通過關鍵字段關聯(lián)。表按行分成兩兩部分,表被用用來存儲用戶聯(lián)聯(lián)系緊密的本地地重要數(shù)據(jù),減減少網(wǎng)絡查詢。。經(jīng)過多個分布布系統(tǒng)把一個圖分分解成兩部分,從從指定的服務器或或在多個服務器之之間建立連接而得得到一個表所需要要的全部數(shù)據(jù)。第二節(jié)數(shù)據(jù)據(jù)倉庫概述數(shù)據(jù)挖掘OLAP的應應用數(shù)據(jù)挖掘應用用基本步驟設計與實施數(shù)據(jù)倉庫技術術體系結構數(shù)據(jù)倉庫客戶智能定義、構成OLAP技術應用商業(yè)智能第二節(jié)數(shù)據(jù)據(jù)倉庫概述數(shù)據(jù)倉庫與數(shù)數(shù)據(jù)庫的區(qū)別別表7-2數(shù)據(jù)庫和數(shù)據(jù)據(jù)倉庫的區(qū)別別數(shù)據(jù)庫只存儲儲當前數(shù)據(jù),,而數(shù)據(jù)倉庫庫存放歷史數(shù)數(shù)據(jù);數(shù)據(jù)庫庫主要面向業(yè)業(yè)務操作,而而數(shù)據(jù)倉庫面面向數(shù)據(jù)分析析和決策支持持;數(shù)據(jù)庫中中的數(shù)據(jù)是動動態(tài)變化的,,隨時刷新,,而數(shù)據(jù)倉庫庫中的數(shù)據(jù)是是靜態(tài)的,一一般不會改變變;數(shù)據(jù)庫使使用頻率比數(shù)數(shù)據(jù)倉庫高,,數(shù)據(jù)訪問量量少,要求響響應時間短。。數(shù)據(jù)挖掘OLAP的應應用數(shù)據(jù)挖掘應用用基本步驟設計與實施數(shù)據(jù)倉庫技術術體系結構數(shù)據(jù)倉庫客戶智能定義、構成OLAP技術應用商業(yè)智能企業(yè)外部數(shù)據(jù)據(jù)數(shù)據(jù)倉庫存儲儲業(yè)務操作型系系統(tǒng)數(shù)據(jù)清洗/轉換數(shù)據(jù)提取提取倉庫數(shù)據(jù)挖掘系統(tǒng)/數(shù)據(jù)展現(xiàn)系統(tǒng)數(shù)據(jù)集市數(shù)據(jù)集市數(shù)據(jù)集市數(shù)據(jù)集市數(shù)據(jù)倉庫的體體系結構數(shù)據(jù)元數(shù)據(jù)據(jù)圖7-3數(shù)數(shù)據(jù)倉庫的體體系結構圖第二節(jié)數(shù)據(jù)據(jù)倉庫概述數(shù)據(jù)挖掘OLAP的應應用數(shù)據(jù)挖掘應用用基本步驟設計與實施數(shù)據(jù)倉庫技術術體系結構數(shù)據(jù)倉庫客戶智能定義、構成OLAP技術應用商業(yè)智能數(shù)據(jù)倉庫的體體系結構由于數(shù)據(jù)庫和和數(shù)據(jù)倉庫應應用的出發(fā)點點不同,因此此數(shù)據(jù)倉庫與與業(yè)務數(shù)據(jù)庫庫系統(tǒng)是相互互獨立的,但但數(shù)據(jù)倉庫又又同業(yè)務數(shù)據(jù)據(jù)庫系統(tǒng)密切切相關。數(shù)據(jù)倉庫是將將業(yè)務操作型型系統(tǒng)中的數(shù)數(shù)據(jù)提取出來來,輔以企業(yè)業(yè)外部數(shù)據(jù),,這些數(shù)據(jù)經(jīng)經(jīng)過清洗和轉轉換,存儲在在數(shù)據(jù)倉庫中中。數(shù)據(jù)倉庫庫不只存儲業(yè)業(yè)務數(shù)據(jù),還還存儲記錄數(shù)數(shù)據(jù)信息的元元數(shù)據(jù)。數(shù)據(jù)倉庫中還還可以抽取部部門型數(shù)據(jù)倉倉庫,即數(shù)據(jù)據(jù)集市。數(shù)據(jù)據(jù)最終傳送給給數(shù)據(jù)挖掘系系統(tǒng)或數(shù)據(jù)展展現(xiàn)系統(tǒng),以以供數(shù)據(jù)分析析或展現(xiàn)給用用戶。所以,,數(shù)據(jù)倉庫不不是簡單地對對數(shù)據(jù)進行存存儲,而是對對數(shù)據(jù)進行““再組織”。。第二節(jié)數(shù)據(jù)據(jù)倉庫概述數(shù)據(jù)挖掘OLAP的應應用數(shù)據(jù)挖掘應用用基本步驟設計與實施數(shù)據(jù)倉庫技術術體系結構數(shù)據(jù)倉庫客戶智能定義、構成OLAP技術應用商業(yè)智能傳統(tǒng)數(shù)據(jù)庫面面向操作型環(huán)環(huán)境,系統(tǒng)設設計人員能夠夠明確了解用用戶需求,因因此傳統(tǒng)數(shù)據(jù)據(jù)庫一般采用用系統(tǒng)生命周期期法(systemdevelopmentlifecycle,SDLC))。而數(shù)據(jù)倉倉庫面向分析析型應用,設設計人員要在在與用戶不斷斷溝通的基礎礎上,逐步明明確與完善系系統(tǒng)需求,因因此數(shù)據(jù)倉庫庫設計采用CLDS(cyclelifedevelopmentsystem)方法。需求分析貫穿穿整個數(shù)據(jù)倉倉庫設計過程程。數(shù)據(jù)倉庫的設設計方法與步步驟第二節(jié)數(shù)據(jù)據(jù)倉庫概述數(shù)據(jù)挖掘OLAP的應應用數(shù)據(jù)挖掘應用用基本步驟設計與實施數(shù)據(jù)倉庫技術術體系結構數(shù)據(jù)倉庫客戶智能定義、構成OLAP技術應用商業(yè)智能數(shù)據(jù)倉庫的設設計方法與步步驟第二節(jié)數(shù)據(jù)據(jù)倉庫概述圖7-4SDLC方法法和CLDS方法比較數(shù)據(jù)挖掘OLAP的的應用數(shù)據(jù)挖掘應應用基本步驟設計與實施施數(shù)據(jù)倉庫技技術體系結構數(shù)據(jù)倉庫客戶智能定義、構成成OLAP技術應用商業(yè)智能數(shù)據(jù)倉庫的的設計方法法與步驟第二節(jié)數(shù)數(shù)據(jù)倉庫概概述表7-3數(shù)數(shù)據(jù)倉庫設設計與數(shù)據(jù)據(jù)庫設計的的區(qū)別數(shù)據(jù)挖掘OLAP的的應用數(shù)據(jù)挖掘應應用基本步驟設計與實施施數(shù)據(jù)倉庫技技術體系結構數(shù)據(jù)倉庫客戶智能定義、構成成OLAP技術應用商業(yè)智能數(shù)據(jù)倉庫的的設計方法法與步驟第二節(jié)數(shù)數(shù)據(jù)倉庫概概述圖7-5數(shù)數(shù)據(jù)倉庫庫設計的主主要步驟數(shù)據(jù)挖掘OLAP的的應用數(shù)據(jù)挖掘應應用基本步驟設計與實施施數(shù)據(jù)倉庫技技術體系結構數(shù)據(jù)倉庫客戶智能定義、構成成OLAP技術應用商業(yè)智能第三節(jié)CRM系系統(tǒng)中的數(shù)數(shù)據(jù)倉庫技技術最終用戶信息使用者知識挖掘者數(shù)據(jù)倉庫的的用戶信息使用者者使用數(shù)據(jù)據(jù)倉庫是經(jīng)經(jīng)常性的、、重復性的的,只訪問問很少的一一部分數(shù)據(jù)據(jù)。每次查查詢也許是是相同的幾幾個指標,,運用數(shù)據(jù)據(jù)倉庫可以以快速、準準確地得到到他們所需需要的信息息。信息使使用者是操操作型用戶戶。知識挖掘者者不只查詢詢數(shù)據(jù)倉庫庫目前能夠夠提供的信信息,還通通過數(shù)據(jù)分分析找到其其中的隱含含信息,用用以發(fā)現(xiàn)更更深層次的的知識來指指導決策。。知識挖掘掘者是分析析型用戶。。知識挖掘者者在使用數(shù)數(shù)據(jù)倉庫時時,先對數(shù)數(shù)據(jù)進行概概括分析,,然后根據(jù)據(jù)需要從數(shù)數(shù)據(jù)倉庫中中抽取數(shù)據(jù)據(jù),對抽取取出來的數(shù)數(shù)據(jù)選擇合合適的數(shù)據(jù)據(jù)挖掘算法法進行建模模分析,最最后是根據(jù)據(jù)建模分析析得到的知知識對數(shù)據(jù)據(jù)倉庫進行行分類處理理。數(shù)據(jù)挖掘OLAP的的應用數(shù)據(jù)挖掘應應用基本步驟設計與實施施數(shù)據(jù)倉庫技技術體系結構數(shù)據(jù)倉庫客戶智能定義、構成成OLAP技術應用商業(yè)智能客戶數(shù)據(jù)倉庫的功能動態(tài)、整合合的客戶數(shù)數(shù)據(jù)管理和和查詢功能能基于數(shù)據(jù)倉倉庫支持的的客戶關系系結構和忠忠誠客戶識識別功能基于WEB數(shù)據(jù)倉庫的的信息共享享功能基于數(shù)據(jù)倉倉庫支持的的客戶購買買行為參考考功能基于數(shù)據(jù)倉倉庫支持的的客戶流失失警示功能能CRM系統(tǒng)統(tǒng)中數(shù)據(jù)倉倉庫的功能能CRM的數(shù)據(jù)倉庫庫必須是動動態(tài)的、整整合的數(shù)據(jù)據(jù)庫系統(tǒng)。。動態(tài)指數(shù)據(jù)庫能能夠實時地地提供客戶戶的基本資資料和歷史史交易行為為等信息,,并在客戶戶每次交易易完成后,,能夠自動動補充新的的信息;整合是指客戶數(shù)數(shù)據(jù)庫與企企業(yè)其他資資源和信息息系統(tǒng)要綜綜合、統(tǒng)一一,各業(yè)務務部門及人人員可根據(jù)據(jù)職能、權權限的不同同實施信息息查詢和更更新功能,,客戶數(shù)據(jù)據(jù)倉庫與企企業(yè)的各交交易渠道和和聯(lián)絡中心心必須緊密密結合等。。實施忠誠客客戶管理的的企業(yè)需要要制定一套套合理的建建立和保持持客戶關系系的格式或或結構。即即企業(yè)要像像建立雇員員的提升計計劃一樣,,建立一套套把新客戶戶提升為老老客戶的計計劃和方法法。例如,,航空公司司的里程積積累計劃——客戶飛行了了一定的里里程數(shù),便便可以獲得得相應的免免費里程,,或根據(jù)客客戶要求提提升艙位等等級等。企業(yè)運用客客戶數(shù)據(jù)倉倉庫,可以以使每一個個服務人員員在為客戶戶提供產(chǎn)品品和服務時時,明確客客戶的偏好好和習慣,,從而提供供更具有針針對性的個個性化服務務。例如,,讀者俱樂樂部都有定定制寄送服服務,他們們能根據(jù)會會員最后一一次的選擇擇和購買記記錄,以及及他們最近近一次與會會員交流獲獲得的有關關個人生活活信息,向向會員推薦薦不同的書書籍。企業(yè)的客戶戶數(shù)據(jù)倉庫庫將通過對對客戶歷史史交易行為為的觀察和和分析,發(fā)發(fā)揮警示客客戶異常購購買行為的的功能。如如一位客戶戶的購買周周期或購買買量出現(xiàn)顯顯著萎縮變變化時,就就是潛在的的客戶流失失跡象??涂蛻魯?shù)據(jù)庫庫通過自動動監(jiān)視客戶戶的交易資資料,對客客戶的潛在在流失現(xiàn)象象作出警示示。Web數(shù)據(jù)倉庫將將成為企業(yè)業(yè)信息共享享的基礎架架構??蛻魬魯?shù)據(jù)倉庫庫應擁有可可以通過瀏瀏覽器使用用的接口,,以成為支支持客戶關關系管理的的基本架構構,并且數(shù)數(shù)據(jù)倉庫要要能夠通過過用戶的簡簡單點擊就就可以獲得得分析結果果。CRM環(huán)境下連接接分散單位位的數(shù)據(jù)中中心建成關關鍵在于Web數(shù)據(jù)倉庫構構造之初就就為其所有有部分確立立一致的數(shù)數(shù)據(jù)元,并并通過一致致的數(shù)據(jù)元元實現(xiàn)數(shù)據(jù)據(jù)倉庫的總總線體系結結構。第三節(jié)CRM系系統(tǒng)中的數(shù)數(shù)據(jù)倉庫技技術數(shù)據(jù)挖掘OLAP的的應用數(shù)據(jù)挖掘應應用基本步驟設計與實施施數(shù)據(jù)倉庫技技術體系結構數(shù)據(jù)倉庫客戶智能定義、構成成OLAP技術應用商業(yè)智能能圖7-6客戶數(shù)據(jù)據(jù)倉庫的的體系結結構數(shù)據(jù)挖掘對分析的結果進行評估客戶信息客戶活動清洗、轉換外部數(shù)據(jù)聯(lián)機分析處理數(shù)據(jù)倉庫數(shù)據(jù)準備客戶數(shù)據(jù)集市CRM系系統(tǒng)中數(shù)數(shù)據(jù)倉庫庫的系統(tǒng)統(tǒng)結構第三節(jié)CRM系統(tǒng)統(tǒng)中的數(shù)數(shù)據(jù)倉庫庫技術數(shù)據(jù)挖掘掘OLAP的應用用數(shù)據(jù)挖掘掘應用基本步驟驟設計與實實施數(shù)據(jù)倉庫庫技術體系結構構數(shù)據(jù)倉庫庫客戶智能能定義、構構成OLAP技術應用商業(yè)智能能CRM系系統(tǒng)中數(shù)數(shù)據(jù)倉庫庫的系統(tǒng)統(tǒng)結構數(shù)據(jù)通過過抽取、轉轉換和裝裝載,形成數(shù)數(shù)據(jù)倉庫庫,并通通過OLAP和報表,,將客戶戶的整體體行為分分析和企企業(yè)運營營分析等等傳遞給給數(shù)據(jù)倉倉庫用戶戶。在數(shù)據(jù)倉倉庫中,,利用數(shù)數(shù)據(jù)倉庫庫的ETL(extraction-transformation-loading)工具,針針對行為為分組和和尋找重重點客戶戶的需要要,產(chǎn)生生相應的的數(shù)據(jù)集市市(DM),將分析析結果與與性能評評價等傳傳遞給CRM用戶。對對于客戶戶量巨大大、市場場策略對對企業(yè)影影響較大大的企業(yè)業(yè),CRM要以數(shù)據(jù)據(jù)倉庫為為核心。。數(shù)據(jù)來源客戶信息息客戶行為為生產(chǎn)系統(tǒng)統(tǒng)其他相關關數(shù)據(jù)第三節(jié)CRM系統(tǒng)統(tǒng)中的數(shù)數(shù)據(jù)倉庫庫技術數(shù)據(jù)挖掘掘OLAP的應用用數(shù)據(jù)挖掘掘應用基本步驟驟設計與實實施數(shù)據(jù)倉庫庫技術體系結構構數(shù)據(jù)倉庫庫客戶智能能定義、構構成OLAP技術應用商業(yè)智能能分析建立企業(yè)模型概念模型設計邏輯模型設計物理模型設計數(shù)據(jù)倉庫生成確定系統(tǒng)邊界及主題域技術準備工作確定數(shù)據(jù)的存儲結構

確定數(shù)據(jù)存放位置

確定存儲分配

CRM系系統(tǒng)中數(shù)數(shù)據(jù)倉庫庫的設計計與實施施第三節(jié)CRM系統(tǒng)統(tǒng)中的數(shù)數(shù)據(jù)倉庫庫技術數(shù)據(jù)挖掘掘OLAP的應用用數(shù)據(jù)挖掘掘應用基本步驟驟設計與實實施數(shù)據(jù)倉庫庫技術體系結構構數(shù)據(jù)倉庫庫客戶智能能定義、構構成OLAP技術應用商業(yè)智能能客戶數(shù)據(jù)倉庫的建立注意問題數(shù)據(jù)信息息收集和和集成確保數(shù)據(jù)據(jù)的質量量按規(guī)則更更新客戶戶數(shù)據(jù),保持對已已有客戶戶的統(tǒng)一一看法數(shù)據(jù)倉庫庫統(tǒng)一共共享,以以發(fā)揮最最大作用用為進一步步了解客客戶身份份及其需需求,并并做出預預測,企企業(yè)需要要花費一一些精力力進行分分析,因因此產(chǎn)生生了數(shù)據(jù)據(jù)信息搜搜集。成成功地使使用數(shù)據(jù)據(jù)信息搜搜集是CRM建設的重重要步驟驟。CRM的客戶數(shù)數(shù)據(jù)倉庫庫需要把把企業(yè)內內外的客客戶數(shù)據(jù)據(jù)集成起起來。就就客戶數(shù)數(shù)據(jù)集成成來講,,企業(yè)需需要對客客戶進行行匹配和和合并。。首先,在在建立CRM數(shù)據(jù)庫時時,一定定要確認認由應用用程序所所生成的的客戶編編碼的唯唯一性;;其次,,建立完完整、準準確的客客戶數(shù)據(jù)據(jù)倉庫,,姓名和和地址這這兩個信信息片段段是很重重要的,,一定要要進行分分解和規(guī)規(guī)范化;;最后,,對企業(yè)業(yè)想收集集又沒有有一定結結構且信信息量比比較大的的數(shù)據(jù)一一定要非非常慎重重,比如如文本信信息。首先識別別新數(shù)據(jù)據(jù)性質,,新客戶戶的數(shù)據(jù)據(jù)給一個個獨立的的標識,,在數(shù)據(jù)據(jù)倉庫中中插入一一條新的的記錄;;如果是是已有客客戶的數(shù)數(shù)據(jù),更更新客戶戶記錄的的相關信信息片段段。數(shù)據(jù)據(jù)更新要要求同步步化是CRM數(shù)據(jù)倉庫庫的特點點之一。。統(tǒng)一共享享的客戶戶數(shù)據(jù)倉倉庫把銷銷售、市市場營銷銷和客戶戶服務的的所有信信息連接接起來。。如果一一個企業(yè)業(yè)的信息息來源互互相獨立立,那么么這些信信息會不不可避免免地出現(xiàn)現(xiàn)重復、、互相沖沖突等現(xiàn)現(xiàn)象,這這對企業(yè)業(yè)的整體體運作效效率將產(chǎn)產(chǎn)生消極極的影響響。第三節(jié)CRM系統(tǒng)統(tǒng)中的數(shù)數(shù)據(jù)倉庫庫技術CRM系系統(tǒng)中數(shù)數(shù)據(jù)倉庫庫的設計計與實施施數(shù)據(jù)挖掘掘OLAP的應用用數(shù)據(jù)挖掘掘應用基本步驟驟設計與實實施數(shù)據(jù)倉庫庫技術體系結構構數(shù)據(jù)倉庫庫客戶智能能定義、構構成OLAP技術應用商業(yè)智能能CRM中數(shù)據(jù)倉庫的應用客戶行為為分析重點客戶戶發(fā)現(xiàn)市場性能能評估客戶行為為分析包包括整體行為為分析和群體行為為分析兩個方面面。整體行行為分析析用來發(fā)發(fā)現(xiàn)企業(yè)業(yè)所有客客戶的行行為規(guī)律律,行為為分組時時按照客客戶的不不同種類類的行為為,將客客戶劃分分成不同同的群體體。在行為分分組完成成后,要要進行客客戶理解解、客戶戶行為規(guī)規(guī)律發(fā)現(xiàn)現(xiàn)和客戶戶組間交交叉分析析等。重點客戶戶發(fā)現(xiàn)主主要是發(fā)發(fā)現(xiàn)能為為企業(yè)帶帶來潛在在效益的的重要客客戶。根根據(jù)客戶戶的屬性性特點就就可以挖挖掘出重重點客戶戶,然后后做好保保持和提提高這些些重點客客戶的忠忠誠度工工作。此此外,通通過數(shù)據(jù)據(jù)倉庫的的數(shù)據(jù)清清洗與集集中過程程,可以以將客戶戶對市場場的反饋饋自動輸輸入數(shù)據(jù)據(jù)倉庫中中,這個個獲得客客戶反饋饋的過程程,稱為為客戶行為為追蹤。根據(jù)客戶戶行為分分析,企企業(yè)可以以準確地地制定市市場策略略和市場場活動。然而,這這些市場場活動是是否能夠夠達到預預定的目目標,是是改進市市場策略略和評價價客戶行行為分組組性能的的重要指指標。因因此,在在CRM中必須須對行為為分析和和市場策策略進行行評估。第三節(jié)CRM系統(tǒng)統(tǒng)中的數(shù)數(shù)據(jù)倉庫庫技術CRM系系統(tǒng)中數(shù)數(shù)據(jù)倉庫庫的應用用數(shù)據(jù)挖掘掘OLAP的應用用數(shù)據(jù)挖掘掘應用基本步驟驟設計與實實施數(shù)據(jù)倉庫庫技術體系結構構數(shù)據(jù)倉庫客戶智能定義、構成OLAP技術應用商業(yè)智能第四節(jié)OLAP技術及其在CRM系統(tǒng)中中的應用OLAP是共享多維信信息的、針對對特定問題的的聯(lián)機數(shù)據(jù)快速訪問和分析的的軟件技術。。它通過對信信息的多種可可能的觀察形形式進行快速速、穩(wěn)定一致致和交互性的的存取,允許許管理決策人人員對數(shù)據(jù)進進行深入觀察察。相關概念變量維維的層次性維成員多維數(shù)組數(shù)據(jù)單元聯(lián)機分析處理理的概念數(shù)據(jù)挖掘OLAP的應應用數(shù)據(jù)挖掘應用用基本步驟設計與實施數(shù)據(jù)倉庫技術術體系結構數(shù)據(jù)倉庫客戶智能定義、構成OLAP技術應用商業(yè)智能變量:分析數(shù)據(jù)時要要考慮的屬性性,即描述數(shù)數(shù)據(jù)“是什么么”。維:是人們觀察數(shù)數(shù)據(jù)的特定角角度,是考慮慮問題時的一一類屬性,屬屬性集合構成一個維。維的層次性::人們觀察數(shù)據(jù)據(jù)的某個特定定角度(即某某個維)還可可以存在細節(jié)節(jié)程度不同的各各個描述方面面,我們稱這這多個描述方方面為維的層層次。一個維維往往具有多個層層次。維成員:維的一個取值值,若維分為為幾個層次,,那么維成員員就是不同維維層次取值的組合合。多維數(shù)組:多維數(shù)組是維維和變量的組組合表示。一一個多維數(shù)組組可以表示為為:(維1,維2,…,維n,變量)。。數(shù)據(jù)單元:數(shù)據(jù)單元是多多維數(shù)組的取取值。當多維維數(shù)組的各個個維都選中一一個維成員,這這些維成員的的組合就唯一一確定了一個個變量的值。。那么數(shù)據(jù)單單元就可以表示為為:(維1維維成員,維2維成員,……,維n維成成員,變量的的值)。聯(lián)機分析處理理的概念第四節(jié)OLAP技術及其在CRM系統(tǒng)中中的應用數(shù)據(jù)挖掘OLAP的應應用數(shù)據(jù)挖掘應用用基本步驟設計與實施數(shù)據(jù)倉庫技術術體系結構數(shù)據(jù)倉庫客戶智能定義、構成OLAP技術應用商業(yè)智能多維數(shù)據(jù)模型型上的OLAP操作對多維數(shù)據(jù)集集(維1、維2、維3……維n、變量值)在在維度i上選定一個維維成員,得到到一個n-1維多維數(shù)據(jù)集集,稱得到的的這個n-1維多維數(shù)據(jù)集集為原數(shù)據(jù)集集在第i維上的數(shù)據(jù)切切片。OLAP的分析方法數(shù)據(jù)切片數(shù)據(jù)切塊數(shù)據(jù)鉆取數(shù)據(jù)聚集數(shù)據(jù)旋轉在多維數(shù)據(jù)立立方體中,確確定某些維度度的取值范圍圍,得到一個個原立方體的的子立方體的的過程被稱為為數(shù)據(jù)切塊。。數(shù)據(jù)切塊與與數(shù)據(jù)切片得得到的多維數(shù)數(shù)組都是原多多維立方體的的子集,不同同的是數(shù)據(jù)切切片使多維立立方體降低了了一個維度,,而數(shù)據(jù)切塊塊得到的多維維立方體與原原立方體的維維度是相同的的。數(shù)據(jù)鉆取(數(shù)據(jù)下鉆),是由概括的的數(shù)據(jù)到詳細細的數(shù)據(jù)的過過程。數(shù)據(jù)鉆鉆取對應于維維的層次,它它是由維的高高層次展開到到低層次的一一個動作。比比如,我們由由“年”數(shù)據(jù)下鉆到“季度”數(shù)據(jù),這無疑疑會增加數(shù)據(jù)據(jù)細節(jié)和數(shù)據(jù)據(jù)量,得到更更詳細的數(shù)據(jù)據(jù)。數(shù)據(jù)鉆取取的具體操作作參見圖7—2中的數(shù)據(jù)鉆取取部分。數(shù)據(jù)聚集又叫叫數(shù)據(jù)上卷,,是數(shù)據(jù)鉆取取的逆過程。。數(shù)據(jù)聚集是是將詳細的數(shù)數(shù)據(jù)聚集為較較概括的數(shù)據(jù)據(jù),是一個綜綜合數(shù)據(jù)的動動作。數(shù)據(jù)旋轉即變變換維度的位位置,也就是是轉動數(shù)據(jù)的的視角,給用用戶提供一個個從不同的角角度觀察數(shù)據(jù)據(jù)的方法。第四節(jié)OLAP技術及其在CRM系統(tǒng)中中的應用數(shù)據(jù)挖掘OLAP的應應用數(shù)據(jù)挖掘應用用基本步驟設計與實施數(shù)據(jù)倉庫技術術體系結構數(shù)據(jù)倉庫客戶智能定義、構成OLAP技術應用商業(yè)智能原數(shù)據(jù)立方體體包含了時間間(年)、城城市、產(chǎn)品三三個維度,其其中a1,a2為產(chǎn)品名。鉆鉆取過程是按按時間下鉆,,由年數(shù)據(jù)得得到季度數(shù)據(jù)據(jù),數(shù)據(jù)由原原來的兩行展展為八行。聚聚集過程是按按地區(qū)維度上上卷,將城市市維上卷為國國家維,即將將北京、上海海兩城市數(shù)據(jù)據(jù)統(tǒng)計為中國國的數(shù)據(jù),將將東京、大阪阪兩城市的數(shù)數(shù)據(jù)統(tǒng)計為日日本的數(shù)據(jù)。。數(shù)據(jù)聚集和和數(shù)據(jù)鉆取為為用戶提供了了不同層次觀觀察數(shù)據(jù)的方方法。20073季20071季20061季20063季20074季20072季20064季20062季a1a2

北京上海東京大阪鉆取聚集a2a120062007中國日本20062007北京上海東京大阪a1a2圖7-7

數(shù)據(jù)鉆取與聚集聚集鉆取第四節(jié)OLAP技術及其在CRM系統(tǒng)中中的應用數(shù)據(jù)挖掘OLAP的應應用數(shù)據(jù)挖掘應用用基本步驟設計與實施數(shù)據(jù)倉庫技術術體系結構數(shù)據(jù)倉庫客戶智能定義、構成OLAP技術應用商業(yè)智能20062007A1200230A2456478A3100120A1A2A320062004561002007230478120圖7-8數(shù)據(jù)旋轉圖7-8是數(shù)據(jù)旋旋轉的一個簡簡單示例,只只體現(xiàn)了二維維表的旋轉。。當數(shù)據(jù)是三三維或是三維維以上的多維維數(shù)據(jù)時,數(shù)數(shù)據(jù)旋轉將更更有意義,每每進行一次數(shù)數(shù)據(jù)旋轉就可可以從一個新新的視角觀察察數(shù)據(jù)。第四節(jié)OLAP技術及其在CRM系統(tǒng)中中的應用數(shù)據(jù)挖掘OLAP的應應用數(shù)據(jù)挖掘應用用基本步驟設計與實施數(shù)據(jù)倉庫技術術體系結構數(shù)據(jù)倉庫客戶智能定義、構成OLAP技術應用商業(yè)智能OLAP的特點聯(lián)機分析處理理的用戶是企企業(yè)中的專業(yè)業(yè)分析人員及及管理決策人人員,在分析析業(yè)務經(jīng)營的的數(shù)據(jù)時,從從不同的角度度來審視業(yè)務務的衡量指標標是一種很自自然的思考模模式。比如,,分析銷售數(shù)數(shù)據(jù)時,綜合合時間周期、、產(chǎn)品類別、、分銷渠道、、地理分布、、客戶群類生生成一張張報報表,各個分分析角度的不不同組合又可可以生成不同同的報表,使使得IT人員的工作量量相當大。聯(lián)機分析處理理的主要特點點是直接仿照照用戶的多角角度思考模式式,預先為用用戶組建多維維的數(shù)據(jù)模型型。一旦多維維數(shù)據(jù)模型建建立完成,用用戶可以快速速地從各個分分析角度獲取取數(shù)據(jù),也能能動態(tài)地在各各個角度之間間切換或者進進行多角度綜綜合分析,具具有極大的分分析靈活性。。這也是聯(lián)機機分析處理近近年來被廣泛泛關注的根本本原因,它從從設計理念和和真正實現(xiàn)上上都與舊的管管理信息系統(tǒng)統(tǒng)有著本質的的區(qū)別。第四節(jié)OLAP技術及其在在CRM系系統(tǒng)中的應應用數(shù)據(jù)挖掘OLAP的的應用數(shù)據(jù)挖掘應應用基本步驟設計與實施施數(shù)據(jù)倉庫技技術體系結構數(shù)據(jù)倉庫客戶智能定義、構成成OLAP技術應用商業(yè)智能OLAP的應用數(shù)據(jù)倉庫系系統(tǒng)核心是是聯(lián)機分析處理,從應用的角角度來說,,數(shù)據(jù)倉庫還可以以采用傳統(tǒng)統(tǒng)的報表或或數(shù)理統(tǒng)計計和數(shù)據(jù)挖挖掘等人工工智能方法法,涵蓋的范圍圍更廣;從應用的范范圍來說,,聯(lián)機分析處處理往往根根據(jù)用戶分分析的主題題進行應用分類類,如銷售分析析、市場推推廣分析、、客戶利潤潤率分析等等,每一個分析的的主題形成成一個OLAP應用,而所所有的OLAP應用實際上上只是數(shù)據(jù)倉庫系系統(tǒng)的一部部分。以某家電企企業(yè)為例介介紹OLAP的應用。家家電的多維維分析涉及及產(chǎn)品、銷售售數(shù)量、地地區(qū)和時間間4個維。所有有抽查的數(shù)數(shù)據(jù)都是第第1季度的。第四節(jié)OLAP技術及其在在CRM系系統(tǒng)中的應應用數(shù)據(jù)挖掘OLAP的的應用數(shù)據(jù)挖掘應應用基本步驟設計與實施施數(shù)據(jù)倉庫技技術體系結構數(shù)據(jù)倉庫客戶智能定義、構成成OLAP技術應用商業(yè)智能冰箱銷售第1季度,冰箱箱在什么地地區(qū)銷售情情況最好??第1季度,哪個個省份的冰冰箱銷量處處于領先地地位?第1季度,哪個個城市的冰冰箱銷售數(shù)數(shù)量最高??負責冰箱銷銷售的副總總裁提出了了以下3個問題:解決方法需需要用到OLAP的兩種多維維分析方法法,即數(shù)據(jù)切片片/切塊和數(shù)據(jù)據(jù)鉆取,其他的分析析方法還有有數(shù)據(jù)旋轉轉和數(shù)據(jù)聚聚集等。第四節(jié)OLAP技術及其在在CRM系系統(tǒng)中的應應用數(shù)據(jù)挖掘OLAP的的應用數(shù)據(jù)挖掘應應用基本步驟設計與實施施數(shù)據(jù)倉庫技技術體系結構數(shù)據(jù)倉庫客戶智能定義、構成成OLAP技術應用商業(yè)智能產(chǎn)品地點時間電視冰箱空調華東東北西北2006.42007.12007.22007.3冰箱圖7-9運用數(shù)據(jù)切切片來進行行數(shù)據(jù)分析析首先使用數(shù)數(shù)據(jù)切片方方法來對第第一個問題題進行分析析。在圖7-9的數(shù)據(jù)立方體體中,時間間、地區(qū)和和產(chǎn)品分別別是3個維度,銷銷售額是度量變量。。在產(chǎn)品維維上選定“冰箱”則形成在產(chǎn)產(chǎn)品維上的的數(shù)據(jù)切片,顯示了了冰箱在各各地區(qū)和各各月份的銷銷售情況。。第四節(jié)OLAP技術及其在在CRM系系統(tǒng)中的應應用數(shù)據(jù)挖掘OLAP的的應用數(shù)據(jù)挖掘應應用基本步驟設計與實施施數(shù)據(jù)倉庫技技術體系結構數(shù)據(jù)倉庫客戶智能定義、構成成OLAP技術應用商業(yè)智能數(shù)據(jù)鉆取和和聚集會改改變維的層層次,變換換分析的粒粒度,在家家電企業(yè)的例子中,,必須采用用聯(lián)機分析析處理工具具深入的地地區(qū)維中,,通過數(shù)據(jù)據(jù)鉆取來查看某某地區(qū)維中中更細致的的數(shù)據(jù)。((如圖7-10所示示)。表7-4按按地區(qū)劃分分的銷售數(shù)數(shù)據(jù)通過模型驅驅動工具來來查詢數(shù)據(jù)據(jù)倉庫的數(shù)數(shù)據(jù),如表表7-4第四節(jié)OLAP技術及其在在CRM系系統(tǒng)中的應應用數(shù)據(jù)挖掘OLAP的的應用數(shù)據(jù)挖掘應應用基本步驟設計與實施施數(shù)據(jù)倉庫技技術體系結構數(shù)據(jù)倉庫客戶智能定義、構成成OLAP技術應用商業(yè)智能冰箱44899西北79954華東36040東北25309浙江29344江蘇17866吉林18174遼寧西北東北華東冰箱24632陜西20267甘肅25301山東圖7-10運用數(shù)據(jù)鉆鉆取來進行行數(shù)據(jù)分析析圖7-10表示示的是對地地區(qū)維數(shù)據(jù)據(jù)鉆取的第第一步,即即顯示了該該家電企業(yè)業(yè)按地區(qū)劃劃分的各省省份的冰箱箱銷售量(如表7-5所示);更深一步步的鉆取可可以顯示出出各城市的的銷售情況況,得到表表7-6。第四節(jié)OLAP技術及其在在CRM系系統(tǒng)中的應應用數(shù)據(jù)挖掘OLAP的的應用數(shù)據(jù)挖掘應應用基本步驟設計與實施施數(shù)據(jù)倉庫技技術體系結構數(shù)據(jù)倉庫客戶智能定義、構成成OLAP技術應用商業(yè)智能表7-5按按地地區(qū)和省進進行劃分的的銷售數(shù)據(jù)據(jù)第四節(jié)OLAP技術及其在在CRM系系統(tǒng)中的應應用數(shù)據(jù)挖掘OLAP的的應用數(shù)據(jù)挖掘應應用基本步驟設計與實施施數(shù)據(jù)倉庫技技術體系結構數(shù)據(jù)倉庫客戶智能定義、構成成OLAP技術應用商業(yè)智能表7-6按按地區(qū)區(qū)、省和城城市進行劃劃分的銷售售數(shù)據(jù)第四節(jié)OLAP技術及其在在CRM系系統(tǒng)中的應應用數(shù)據(jù)挖掘OLAP的的應用數(shù)據(jù)挖掘應應用基本步驟設計與實施施數(shù)據(jù)倉庫技技術體系結構數(shù)據(jù)倉庫客戶智能定義、構成成OLAP技術應用商業(yè)智能通過OLAP得出了負責責冰箱銷售售的副總裁裁所提出的的3個問題的答答案:2007年第1季度,冰箱箱在華東地地區(qū)銷售情情況最好。。2007年第1季度,在華華東地區(qū),,江蘇的冰冰箱銷售量量處于領先先地位。2007年第1季度,江蘇蘇的南京冰冰箱銷售量量最高。OLAP的應用第四節(jié)OLAP技術及其在在CRM系系統(tǒng)中的應應用數(shù)據(jù)挖掘OLAP的的應用數(shù)據(jù)挖掘應應用基本步驟設計與實施施數(shù)據(jù)倉庫技技術體系結構數(shù)據(jù)倉庫客戶智能定義、構成成OLAP技術應用商業(yè)智能第五節(jié)數(shù)數(shù)據(jù)挖掘掘概述數(shù)據(jù)挖掘((datamining)是從大量的的、不完全全的、有噪噪聲的、模模糊的、隨隨機的實際際應用數(shù)據(jù)據(jù)中提取人人們感興趣趣的知識,,這些知識識是隱含的的、事先未未知的、潛潛在有用的的信息。它它是通過分分析數(shù)據(jù)發(fā)發(fā)現(xiàn)數(shù)據(jù)內內部的信息息和知識過過程。數(shù)據(jù)挖掘的的基礎是大大量數(shù)據(jù),,所以具有有高效處理理大量數(shù)據(jù)據(jù)的能力。。這也是目目前數(shù)據(jù)挖挖掘技術的的一個難題題,一些算算法在小數(shù)數(shù)據(jù)集上效效果很好,,但數(shù)據(jù)量量增加到一一定程度,,算法的實實現(xiàn)代價過過大、效率率太低,甚甚至無法實實現(xiàn)。數(shù)據(jù)挖掘的的定義數(shù)據(jù)挖掘OLAP的的應用數(shù)據(jù)挖掘應應用基本步驟設計與實施施數(shù)據(jù)倉庫技技術體系結構數(shù)據(jù)倉庫客戶智能定義、構成成OLAP技術應用商業(yè)智能數(shù)據(jù)來源事務數(shù)據(jù)庫庫高級數(shù)據(jù)庫庫數(shù)據(jù)倉庫關系數(shù)據(jù)庫庫數(shù)據(jù)據(jù)挖挖掘掘的的數(shù)數(shù)據(jù)據(jù)來來源源關系系數(shù)數(shù)據(jù)據(jù)庫庫::關系系數(shù)數(shù)據(jù)據(jù)庫庫中中的的數(shù)數(shù)據(jù)據(jù)是是最最豐豐富富、、最最詳詳細細的的。。在在進進行行數(shù)數(shù)據(jù)據(jù)挖挖掘掘之之前前也也要要對對數(shù)據(jù)據(jù)進進行行清清洗洗和和轉轉換換。。數(shù)數(shù)據(jù)據(jù)的的真真實實性性和和一一致致性性是是進進行行數(shù)數(shù)據(jù)據(jù)挖挖掘掘的的前前提提和和保保證證。。數(shù)據(jù)據(jù)倉倉庫庫::數(shù)據(jù)據(jù)經(jīng)經(jīng)過過清清洗洗和和轉轉換換,,不不存存在在錯錯誤誤和和不不一一致致的的情情況況,,數(shù)數(shù)據(jù)據(jù)倉倉庫庫在在獲獲取取數(shù)數(shù)據(jù)據(jù)后后就不不需需要要再再進進行行這這些些數(shù)數(shù)據(jù)據(jù)處處理理工工作作了了。。數(shù)據(jù)據(jù)倉倉庫庫、、數(shù)數(shù)據(jù)據(jù)挖挖掘掘和和聯(lián)聯(lián)機機分分析析處處理理共共同同構構成成了了系系統(tǒng)統(tǒng)的的決決策策支支持持模模塊塊。。事務務數(shù)數(shù)據(jù)據(jù)庫庫::數(shù)據(jù)據(jù)挖挖掘掘可可從從事事務務數(shù)數(shù)據(jù)據(jù)庫庫中中提提取取數(shù)數(shù)據(jù)據(jù)。。其其每每個個記記錄錄代代表表一一個個事事務務。。在進進行行數(shù)數(shù)據(jù)據(jù)挖挖掘掘時時,,可可以以只只將將一一個個或或幾幾個個事事務務數(shù)數(shù)據(jù)據(jù)庫庫集集中中到到數(shù)數(shù)據(jù)據(jù)挖挖掘掘庫庫中中進進行行挖挖掘掘。。高級級數(shù)數(shù)據(jù)據(jù)庫庫::面向向對對象象的的數(shù)數(shù)據(jù)據(jù)庫庫、、空空間間數(shù)數(shù)據(jù)據(jù)庫庫、、時時間間和和時時間間序序列列數(shù)數(shù)據(jù)據(jù)庫庫、、文文本本和和多多媒媒體數(shù)數(shù)據(jù)據(jù)庫庫等等新新的的數(shù)數(shù)據(jù)據(jù)庫庫。。這這些些結結構構更更為為復復雜雜的的數(shù)數(shù)據(jù)據(jù)庫庫為為數(shù)數(shù)據(jù)據(jù)挖挖掘掘提提供供了了更更加加全全面面、、更更加多多元元化化的的數(shù)數(shù)據(jù)據(jù),,也也為為數(shù)數(shù)據(jù)據(jù)挖挖掘掘技技術術提提出出了了更更大大的的挑挑戰(zhàn)戰(zhàn)。。第五五節(jié)節(jié)數(shù)數(shù)據(jù)據(jù)挖挖掘掘概概述述數(shù)據(jù)據(jù)挖挖掘掘OLAP的的應應用用數(shù)據(jù)據(jù)挖挖掘掘應應用用基本本步步驟驟設計計與與實實施施數(shù)據(jù)據(jù)倉倉庫庫技技術術體系系結結構構數(shù)據(jù)據(jù)倉倉庫庫客戶戶智智能能定義義、、構構成成OLAP技術術應用用商業(yè)業(yè)智智能能數(shù)據(jù)據(jù)挖挖掘掘的的基基本本步步驟驟數(shù)據(jù)據(jù)挖挖掘掘包包括括確確定定分分析析和和預預測測目目標標、、建建立立數(shù)數(shù)據(jù)據(jù)挖挖掘掘庫庫、、分分析析數(shù)數(shù)據(jù)據(jù)、、建建立立模模型型、、模模型評估估與驗驗證、、模型型實施施等幾幾個基基本步步驟。。第五節(jié)節(jié)數(shù)數(shù)據(jù)據(jù)挖掘掘概述述圖7-11數(shù)數(shù)據(jù)挖挖掘的的基本本步驟驟數(shù)據(jù)挖挖掘OLAP的的應用用數(shù)據(jù)挖挖掘應應用基本步步驟設計與與實施施數(shù)據(jù)倉倉庫技技術體系結結構數(shù)據(jù)倉倉庫客戶智智能定義、、構成成OLAP技術應用商業(yè)智智能數(shù)據(jù)挖挖掘的的基本本步驟驟第五節(jié)節(jié)數(shù)數(shù)據(jù)據(jù)挖掘掘概述述數(shù)據(jù)挖掘的基本步驟1)確確定定分析析和預預測目目標確定分分析和和預測測目標標相當當于需需求分分析,主要要是明明確業(yè)業(yè)務目目標。。確定定分析析和預預測目目標是是數(shù)據(jù)據(jù)挖掘掘的基基礎條條件。。同時時,定定義了了數(shù)據(jù)據(jù)挖掘掘的分分析目目標也也就定定義了了評價價這一一挖掘掘模型型的標標準。2)建建立立數(shù)據(jù)據(jù)挖掘掘庫首先要要進行行數(shù)據(jù)收收集,對于于收集集到的的數(shù)據(jù)據(jù),應應對數(shù)數(shù)據(jù)的的來源源、大大小、、存儲儲位置置和數(shù)數(shù)據(jù)在在使用用上的的限制制等進進行詳詳細的的記錄。完成成數(shù)據(jù)據(jù)收集集后,要對對數(shù)據(jù)據(jù)進行行描述述。數(shù)據(jù)挖挖掘庫庫可以是是一個個單獨獨的數(shù)數(shù)據(jù)庫庫,也也可以以和數(shù)數(shù)據(jù)倉倉庫建建立在在相同同的物物理介介質上上。數(shù)數(shù)據(jù)挖挖掘庫庫中還還應包包括數(shù)數(shù)據(jù)的的元數(shù)數(shù)據(jù)。。3)分分析析數(shù)據(jù)據(jù)分析數(shù)數(shù)據(jù)即即對數(shù)數(shù)據(jù)挖挖掘庫庫中的的數(shù)據(jù)據(jù)進行行分析析,對對數(shù)據(jù)據(jù)有了了全面面、細細致的的了解解以后后,就就可以以針對對數(shù)據(jù)據(jù)挖掘掘分析析目標標選擇擇合適適的變變量和和記錄錄。對對于變變量的的選擇擇,首首先要要考慮慮對結結果有有影響響、可可以反反映結結果的的變量量。4)建建立立模型型建立模模型是是選擇擇合適適的方方法和和算法法對數(shù)數(shù)據(jù)進進行分分析,得到到一個個數(shù)據(jù)據(jù)挖掘掘模型型的過過程。。建立立模型型是一一個反反復進進行的的過程程,它它需要要不斷斷地改改進或或更換換算法法以尋尋找對對目標標分析析作用用最明明顯的的模型型,最最后得得到一一個最最合理理、最最適用用的模模型。5)模模型型評估估與驗驗證為了驗驗證模模型的的有效效性,一般般會將將數(shù)據(jù)據(jù)集分分為兩兩部分分:一一部分分用于于建立立模型型,另另一部部分則則用于于測試試模型型。對對模型型的驗驗證主主要需需要考考慮以以下幾幾個方方面:(1)模型的的準確確性;(2)模型的的可理理解性性;(3)模型的的性能能。模型型建立立和模模型檢檢驗是是一個個反復復的過過程。。6)模模型實實施模型的的實施施有兩兩種情情況:一種種是將將數(shù)據(jù)據(jù)挖掘掘模型型得到到的結結果提提供給給信息息需求求者或或者管管理者者,以以輔助助管理理者的的決策策分析析;還有一一種情情況就就是保保留模模型,以后后每遇遇到類類似問問題就就用這這個模模型進進行分分析,或者者將模模型用用于不不同的的數(shù)據(jù)據(jù)集上上(這這些數(shù)數(shù)據(jù)分分析需需要采采用相相同的的方法法)進進行分分析。。在模型型的使使用過過程中中,隨隨時間間及環(huán)環(huán)境的的變化化,還還應對對模型型進行行重新新測試試,并并對模模型進進行相相應的的修改改,這這就是是模型維維護的的過程程。數(shù)據(jù)挖挖掘OLAP的的應用用數(shù)據(jù)挖挖掘應應用基本步步驟設計與與實施施數(shù)據(jù)倉倉庫技技術體系結結構數(shù)據(jù)倉倉庫客戶智智能定義、、構成成OLAP技術應用商業(yè)智智能數(shù)據(jù)挖挖掘工工具及及其選選擇第五節(jié)節(jié)數(shù)數(shù)據(jù)據(jù)挖掘掘概述述數(shù)據(jù)挖挖掘工工具包包括數(shù)據(jù)挖挖掘(datamining)工具具和文本挖挖掘(textmining)工具具。數(shù)據(jù)據(jù)挖掘掘工具具主要要是用用來進進行聚聚類分分析、、關聯(lián)聯(lián)分析析、時時間序序列分分析以以及統(tǒng)統(tǒng)計分分析的的。文文本挖挖掘工工具主主要應應用在在市場場調研研報告告中或或呼叫叫中心心(callcenter)的的客戶戶抱怨怨定級級、專專利的的分類類、網(wǎng)網(wǎng)頁的的分類類以及及電子子郵件件的分分類等等方面面。一一般而而言,目前前市場場上這這些數(shù)數(shù)據(jù)挖挖掘工工具又又可以以分成成兩類類:企企業(yè)級級工具具以及及小型型工具具。數(shù)據(jù)挖挖掘OLAP的的應用用數(shù)據(jù)挖挖掘應應用基本步步驟設計與與實施施數(shù)據(jù)倉倉庫技技術體系結結構數(shù)據(jù)倉倉庫客戶智智能定義、、構成成OLAP技術應用商業(yè)智智能數(shù)據(jù)挖挖掘工工具及及其選選擇第五節(jié)節(jié)數(shù)數(shù)據(jù)據(jù)挖掘掘概述述數(shù)據(jù)挖掘工具的選擇①公司司的數(shù)數(shù)據(jù)挖挖掘需需求是是短期期行為為還是是長期期使用用②公司司的數(shù)數(shù)據(jù)挖挖掘經(jīng)經(jīng)驗和和水平平③公司司的數(shù)數(shù)據(jù)狀狀態(tài)④公司司的預預算⑤工具具的性性能數(shù)據(jù)挖挖掘OLAP的的應用用數(shù)據(jù)挖挖掘應應用基本步步驟設計與與實施施數(shù)據(jù)倉倉庫技技術體系結結構數(shù)據(jù)倉倉庫客戶智智能定義、、構成成OLAP技術應用商業(yè)智智能CRM中常用用的數(shù)數(shù)據(jù)挖挖掘算算法1)關聯(lián)聯(lián)分析析(associationanalysis)設I={i1,i2,……………im}是項的的集合合。設任務務相關關的數(shù)數(shù)據(jù)D是數(shù)據(jù)據(jù)庫事事務的的集合合,其其中每每個事事務T是項的的集合合,使使得T∈I。每一一個事事務有有一個個標識識符,,稱作作TID。設A是一個個項集集,事事務T包含A當且僅僅當A∈T。項的集集合稱稱為項項集((Itemset)。包含含k個項的的集合合稱為為K-項集。。項集的的出現(xiàn)現(xiàn)頻率率是包包含項項集的的事務務數(shù),,簡稱稱為項項集的的頻率率、支支持計計數(shù)或或計數(shù)數(shù)。關聯(lián)規(guī)規(guī)則是形如如AB的蘊含含式,,其中A∈I,B∈I,并且且A∩B=。規(guī)則AB在事務務集D中成立立,具具有支支持度度s,其中s是D中包含含A∪B的事務務的百百分比比。它是概概率P(A∪B)。規(guī)則AB在事務務集D中具有有置信信度c,如果D中包含含A的事務務中同同時也也包含含B的事務務的百百分比比是c。這是是條件件概率率P(B|A)。第五節(jié)節(jié)數(shù)數(shù)據(jù)據(jù)挖掘掘概述述數(shù)據(jù)挖挖掘OLAP的的應用用數(shù)據(jù)挖挖掘應應用基本步步驟設計與與實施施數(shù)據(jù)倉倉庫技技術體系結結構數(shù)據(jù)倉倉庫客戶智智能定義、、構成成OLAP技術應用商業(yè)智智能CRM中常用用的數(shù)數(shù)據(jù)挖挖掘算算法支持度Support(AB)=P(A∪B)置信度Confidence(AB)=P(B|A)同時滿足足最小支支持度和和最小置置信度的的規(guī)則稱稱為強規(guī)則。關聯(lián)規(guī)規(guī)則挖掘掘就是尋尋找強規(guī)規(guī)則的過過程。如果項集集滿足最最小支持持度,則則稱為頻頻繁項集集Apriori算法是一一個關于于單維、、單層、、布爾規(guī)規(guī)則的方方法。因因此它也也是關聯(lián)聯(lián)規(guī)則挖挖掘中形形式最簡簡單的方方法。Apriori算法是一一個逐層層迭代尋尋找頻繁繁集的方方法。如果項集集滿足最最小支持持度,稱稱為頻繁項集集。Apriori算法的性性質是頻繁項集集的所有有非空子子集一定定是頻繁繁的。Apriori算法第五節(jié)數(shù)數(shù)據(jù)據(jù)挖掘概概述1)關聯(lián)分分析(associationanalysis)數(shù)據(jù)挖掘掘OLAP的應用用數(shù)據(jù)挖掘掘應用基本步驟驟設計與實實施數(shù)據(jù)倉庫庫技術體系結構構數(shù)據(jù)倉庫庫客戶智能能定義、構構成OLAP技術應用商業(yè)智能能Apriori算法的實實例表7-7是一一個事務務數(shù)據(jù),,ID表示顧客客號,“購買商品品”表示顧客客一次購購買的商商品名稱稱。規(guī)定定最小支支持度為為60%,最小置置信度為為80%。表7-7事務務數(shù)據(jù)第四步,,L2與L2連接,得得到候選選項集。。根據(jù)Apriori算法的性性質去掉掉不符合合條件的的候選項項,即有有不頻繁繁子集的的項。然然后掃描描記錄,,對候選選集中剩剩余候選選項計算算支持度度。根據(jù)據(jù)最小支支持度得得到頻繁繁項集L3。第五步,繼續(xù)重復上上述動作,,直到所得得頻繁項集集Ln為空,則頻頻繁項集Ln-1即為最大頻頻繁項集。。第一步,掃描每條記記錄,對每每個項(即即每種商品品)出現(xiàn)的的次數(shù)計數(shù)數(shù)。第二步,根據(jù)最小支支持度確定定頻繁項集集L1。第三步,L1與L1連

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內容里面會有圖紙預覽,若沒有圖紙預覽就沒有圖紙。
  • 4. 未經(jīng)權益所有人同意不得將文件中的內容挪作商業(yè)或盈利用途。
  • 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內容的表現(xiàn)方式做保護處理,對用戶上傳分享的文檔內容本身不做任何修改或編輯,并不能對任何下載內容負責。
  • 6. 下載文件中如有侵權或不適當內容,請與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

評論

0/150

提交評論