版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進(jìn)行舉報(bào)或認(rèn)領(lǐng)
文檔簡介
第6章
CRM與數(shù)據(jù)挖掘
1精選2021版課件第6章CRM與數(shù)據(jù)挖掘6.1數(shù)據(jù)挖掘概述6.1.1數(shù)據(jù)挖掘的產(chǎn)生6.1.2數(shù)據(jù)挖掘的定義6.1.3數(shù)據(jù)挖掘的技術(shù)6.1.4數(shù)據(jù)挖掘的功能6.1.5數(shù)據(jù)挖掘的流程6.1.6數(shù)據(jù)挖掘的發(fā)展方向6.2CRM中數(shù)據(jù)挖掘應(yīng)用6.2.1從客戶生命周期角度數(shù)據(jù)挖掘技術(shù)的應(yīng)用6.2.2從行業(yè)角度分析數(shù)據(jù)挖掘技術(shù)的應(yīng)用6.3CRM數(shù)據(jù)挖掘應(yīng)用實(shí)例2精選2021版課件數(shù)據(jù)挖掘概述6.1.1數(shù)據(jù)挖掘的產(chǎn)生6.1.2數(shù)據(jù)挖掘的定義6.1.3數(shù)據(jù)挖掘的技術(shù)6.1.4數(shù)據(jù)挖掘的功能6.1.5數(shù)據(jù)挖掘的流程6.1.6數(shù)據(jù)挖掘的發(fā)展方向3精選2021版課件6.1.1數(shù)據(jù)挖掘的產(chǎn)生數(shù)據(jù)爆炸但知識貧乏支持?jǐn)?shù)據(jù)挖掘技術(shù)的基礎(chǔ)4精選2021版課件數(shù)據(jù)挖掘數(shù)據(jù)庫越來越大有價值的知識可怕的數(shù)據(jù)數(shù)據(jù)爆炸但知識貧乏5精選2021版課件數(shù)據(jù)挖掘的出現(xiàn)數(shù)據(jù)爆炸,知識貧乏苦惱:淹沒在數(shù)據(jù)中;不能制定合適的決策!數(shù)據(jù)知識決策模式趨勢事實(shí)關(guān)系模型關(guān)聯(lián)規(guī)則序列目標(biāo)市場資金分配貿(mào)易選擇在哪兒做廣告銷售的地理位置金融經(jīng)濟(jì)政府POS.人口統(tǒng)計(jì)生命周期數(shù)據(jù)爆炸但知識貧乏6精選2021版課件
更大,更便宜的存儲器
--磁盤密度以Moore’slaw增長--存儲器價格飛快下降更快,更便宜的信息處理器--分析更多的數(shù)據(jù)--適應(yīng)更多復(fù)雜的模型--引起更多查詢技術(shù)--激起更強(qiáng)的可視化技術(shù)數(shù)據(jù)挖掘處理技術(shù)--數(shù)理統(tǒng)計(jì)--人工智能--機(jī)器學(xué)習(xí)支持?jǐn)?shù)據(jù)挖掘技術(shù)的基礎(chǔ)7精選2021版課件數(shù)據(jù)挖掘的演化機(jī)器學(xué)習(xí)數(shù)據(jù)庫中的知識發(fā)現(xiàn)數(shù)據(jù)挖掘8精選2021版課件6.1.2數(shù)據(jù)挖掘的定義SAS研究所(1997):“在大量相關(guān)數(shù)據(jù)基礎(chǔ)之上進(jìn)行數(shù)據(jù)探索和建立相關(guān)模型的先進(jìn)方法”。Bhavani(1999):“使用模式識別技術(shù)、統(tǒng)計(jì)和數(shù)學(xué)技術(shù),在大量的數(shù)據(jù)中發(fā)現(xiàn)有意義的新關(guān)系、模式和趨勢的過程”。Handetal(2000):“數(shù)據(jù)挖掘就是在大型數(shù)據(jù)庫中尋找有意義、有價值信息的過程”。9精選2021版課件數(shù)據(jù)挖掘的定義技術(shù)角度的含義商業(yè)角度的含義與傳統(tǒng)方法的區(qū)別10精選2021版課件數(shù)據(jù)挖掘的技術(shù)上的定義數(shù)據(jù)挖掘(DataMining)就是從大量的、不完全的、有噪聲的、模糊的、隨機(jī)的實(shí)際應(yīng)用數(shù)據(jù)中,提取隱含在其中的、人們事先不知道的、但又是潛在有用的信息和知識的過程。這個定義包括好幾層含義(1)數(shù)據(jù)源必須是真實(shí)的、大量的、含噪聲的;(2)發(fā)現(xiàn)的是用戶感興趣的知識;(3)發(fā)現(xiàn)的知識要可接受、可理解、可運(yùn)用;(4)并不要求發(fā)現(xiàn)放之四海皆準(zhǔn)的知識,僅支持特定的發(fā)現(xiàn)問題。
11精選2021版課件數(shù)據(jù)挖掘的商業(yè)角度的定義按企業(yè)既定業(yè)務(wù)目標(biāo),對大量的企業(yè)數(shù)據(jù)進(jìn)行探索和分析,揭示隱藏的、未知的或驗(yàn)證已知的規(guī)律性,并進(jìn)一步將其模型化的先進(jìn)有效的方法。
12精選2021版課件數(shù)據(jù)挖掘與傳統(tǒng)分析方法的區(qū)別數(shù)據(jù)挖掘與傳統(tǒng)的數(shù)據(jù)分析(如查詢、報(bào)表、聯(lián)機(jī)應(yīng)用分析)的本質(zhì)區(qū)別是數(shù)據(jù)挖掘是在沒有明確假設(shè)的前提下去挖掘信息、發(fā)現(xiàn)知識.。數(shù)據(jù)挖掘所得到的信息應(yīng)具有先未知,有效和可實(shí)用三個特征.先前未知的信息是指該信息是預(yù)先未曾預(yù)料到的,既數(shù)據(jù)挖掘是要發(fā)現(xiàn)那些不能靠直覺發(fā)現(xiàn)的信息或知識,甚至是違背直覺的信息或知識,挖掘出的信息越是出乎意料,就可能越有價值。在商業(yè)應(yīng)用中最典型的例子就是一家連鎖店通過數(shù)據(jù)挖掘發(fā)現(xiàn)了小孩尿布和啤酒之間有著驚人的聯(lián)系
13精選2021版課件6.1.3數(shù)據(jù)挖掘技術(shù)數(shù)據(jù)挖掘的方法很多,大致可分為:統(tǒng)計(jì)方法、機(jī)器學(xué)習(xí)方法、神經(jīng)網(wǎng)絡(luò)方法和數(shù)據(jù)庫方法。其中,統(tǒng)計(jì)方法可細(xì)分為:回歸分析(多元回歸、自回歸等)、判別分析(貝葉斯判別、費(fèi)歇爾判別、非參數(shù)判別等)、聚類分析(系統(tǒng)聚類、動態(tài)聚類等)、探索性分析(主元分析法、相關(guān)分析法等)、以及模糊集、粗糙集、支持向量機(jī)等。機(jī)器學(xué)習(xí)中,可細(xì)分為:歸納學(xué)習(xí)方法(決策樹、規(guī)則歸納等)、基于范例的推理CBR、遺傳算法、貝葉斯信念網(wǎng)絡(luò)等。神經(jīng)網(wǎng)絡(luò)方法,可細(xì)分為:前向神經(jīng)網(wǎng)絡(luò)(BP算法等)、自組織神經(jīng)網(wǎng)絡(luò)(自組織特征映射、競爭學(xué)習(xí)等)等。數(shù)據(jù)庫方法主要是基于可視化的多維數(shù)據(jù)分析或OLAP方法,另外還有面向?qū)傩缘臍w納方法。
14精選2021版課件決策樹決策樹把數(shù)據(jù)歸入可能對一個目標(biāo)變量有不同效果的規(guī)則組。例如,我們希望發(fā)現(xiàn)可能會對直郵有反應(yīng)的個人特點(diǎn)。這些特點(diǎn)可以解釋為一組規(guī)則。15精選2021版課件決策樹假設(shè)您是一個銷售一種新的銀行服務(wù)的直郵計(jì)劃研究的負(fù)責(zé)人。為最大程度地獲益,您希望確定基于前次促銷活動的家庭細(xì)分最有可能響應(yīng)相似的促銷活動。通常這可以通過查找最能把響應(yīng)前次促銷的家庭和沒有響應(yīng)的家庭區(qū)分開的人口統(tǒng)計(jì)信息變量的組合來實(shí)現(xiàn)。決策樹為您提供諸如誰會最好地響應(yīng)新的促銷等重要線索,并通過只郵寄給最有可能響應(yīng)的人來最大程度地獲得直郵效益,提高整體響應(yīng)率,并極有希望同時增加銷售。16精選2021版課件決策樹建立決策樹中最上面的節(jié)點(diǎn)稱為根節(jié)點(diǎn),是整個決策樹的開始。本例把響應(yīng)客戶作為根節(jié)點(diǎn)。可以看到所有收到直郵信件的人中有7%有響應(yīng)。然后根據(jù)記錄字段的不同取值建立樹的分支,如分為有住房和無住房兩組,則15%的租戶有響應(yīng),而房主則只有5%。還可以在每個分支子集中重復(fù)建立下層結(jié)點(diǎn)和分支。我們可以繼續(xù)分組來發(fā)現(xiàn)最有可能響應(yīng)的組群。這一組群可以表示為一個規(guī)則,如“如果收件人是租戶,有較高的家庭收入,沒有儲蓄存款賬戶,那么他有45%的響應(yīng)概率”。簡單地說,有這些特點(diǎn)的組群中有45%可能會對直郵有響應(yīng)。17精選2021版課件決策樹圖18精選2021版課件決策樹應(yīng)用決策樹也是分析消耗(流線性生產(chǎn))、發(fā)現(xiàn)交叉銷售機(jī)會、進(jìn)行促銷、信用風(fēng)險或破產(chǎn)分析和發(fā)覺欺詐行為的得力工具。19精選2021版課件聚類分析聚類如同通常所說的“物以類聚”,是把一組個體按照相似性歸成若干類別。它的目的是使屬于同一類別的個體之間的距離盡可能的小,而不同類別上的個體間的距離盡可能的大。它反映同類事物共同性質(zhì)的特征型知識和不同事物之間的差異性質(zhì)的特征型知識。通過聚類,數(shù)據(jù)庫中的記錄可被劃分為一系列有意義的子集。聚類增強(qiáng)了人們對客觀現(xiàn)實(shí)的認(rèn)識,是進(jìn)行概念描述和偏差分析的先決條件。20精選2021版課件聚類分析簇(Cluster):一個數(shù)據(jù)對象的集合在同一個類中,對象之間具有相似性;不同類的對象之間是相異的。聚類分析把一個給定的數(shù)據(jù)對象集合分成不同的簇;聚類是一種無監(jiān)督分類法:沒有預(yù)先指定的類別;典型的應(yīng)用作為一個獨(dú)立的分析工具,用于了解數(shù)據(jù)的分布;作為其它算法的一個數(shù)據(jù)預(yù)處理步驟;21精選2021版課件聚類分析應(yīng)用市場銷售:幫助市場人員發(fā)現(xiàn)客戶中的不同群體,然后用這些知識來開展一個目標(biāo)明確的市場計(jì)劃;土地使用:在一個陸地觀察數(shù)據(jù)庫中標(biāo)識那些土地使用相似的地區(qū);保險:對購買了汽車保險的客戶,標(biāo)識那些有較高平均賠償成本的客戶;城市規(guī)劃:根據(jù)類型、價格、地理位置等來劃分不同類型的住宅;地震研究:根據(jù)地質(zhì)斷層的特點(diǎn)把已觀察到的地震中心分成不同的類;22精選2021版課件聚類分析的評判一個好的聚類方法要能產(chǎn)生高質(zhì)量的聚類結(jié)果——簇,這些簇要具備以下兩個特點(diǎn):高的簇內(nèi)相似性低的簇間相似性聚類結(jié)果的好壞取決于該聚類方法采用的相似性評估方法以及該方法的具體實(shí)現(xiàn);聚類方法的好壞還取決與該方法是能發(fā)現(xiàn)某些還是所有的隱含模式;23精選2021版課件人工神經(jīng)網(wǎng)絡(luò)神經(jīng)網(wǎng)絡(luò)近來越來越受到人們的關(guān)注,因?yàn)樗鼮榻鉀Q大復(fù)雜度問題提供了一種相對來說比較有效的簡單方法。神經(jīng)網(wǎng)絡(luò)可以很容易的解決具有上百個參數(shù)的問題(當(dāng)然實(shí)際生物體中存在的神經(jīng)網(wǎng)絡(luò)要比我們這里所說的程序模擬的神經(jīng)網(wǎng)絡(luò)要復(fù)雜的多)。神經(jīng)網(wǎng)絡(luò)常用于兩類問題:分類和回歸。24精選2021版課件遺傳算法遺傳算法(GeneticAlgorithms)是J.H.Holland根據(jù)生物進(jìn)化的模型提出的一種優(yōu)化算法。雖然GA剛提出時沒有受到重視,但近年來,人們把它應(yīng)用于學(xué)習(xí)、優(yōu)化、自適應(yīng)等問題中。模擬生物進(jìn)化過程的算法,由繁殖(選擇)、交叉(重組)、
變異(突變)三個基本算子組成。遺傳算法已在優(yōu)化計(jì)算、分類、機(jī)器學(xué)習(xí)等方面發(fā)揮了顯著作用。遺傳算法是基于進(jìn)化理論,并采用遺傳結(jié)合、遺傳變異、以及自然選擇等設(shè)計(jì)方法的優(yōu)化技術(shù)。
25精選2021版課件遺傳算法GA的算法首先在解空間中取一群點(diǎn),作為遺傳開始的第一代。每個點(diǎn)(基因)用一二進(jìn)制的數(shù)字串表示,其優(yōu)劣程度用一目標(biāo)函數(shù)(Fitnessfunction)來衡量。在向下一代的遺傳演變中,首先把前一代中的每個數(shù)字串根據(jù)由其目標(biāo)函數(shù)值決定的概率分配到配對池中。好的數(shù)字串以高的概率被復(fù)制下來,劣的數(shù)字串被淘汰掉。然后將配對池中的數(shù)字任意配對,并對每一數(shù)字串進(jìn)行交叉操作,產(chǎn)生新的子孫(數(shù)字串)。最后對新的數(shù)字串的某一位進(jìn)行變異。這樣就產(chǎn)生了新的一代。按照同樣的方法,經(jīng)過數(shù)代的遺傳演變后,在最后一代中得到全局最優(yōu)解或近似最優(yōu)解。
26精選2021版課件支持向量機(jī)支持向量機(jī)(SVM)是一種建立在統(tǒng)計(jì)學(xué)習(xí)理論基礎(chǔ)上的機(jī)器學(xué)習(xí)方法。通過學(xué)習(xí)算法,SVM可以自動尋找那些對分類有較好區(qū)分能力的支持向量,由此構(gòu)造出的分類器可以最大化類與類的間隔,因而有較好的推廣性能和較高的分類準(zhǔn)確率。SVM主要思想是針對兩類分類問題,在高維空間中尋找一個超平面作為兩類的分割,以保證最小的分類錯誤率。而且SVM一個重要的優(yōu)點(diǎn)是可以處理線性不可分的情況。用SVM實(shí)現(xiàn)分類,首先要從原始空間中抽取特征,將原始空間中的樣本映射為高維特征空間中的一個向量,以解決原始空間中線性不可分的問題。27精選2021版課件貝葉斯預(yù)測貝葉斯網(wǎng)絡(luò)是用來表示變量集合連接概率的圖形模式,它提供了一種自然的表示因果信息的方法,用來發(fā)現(xiàn)數(shù)據(jù)間的潛在關(guān)系。在這個網(wǎng)絡(luò)中,用節(jié)點(diǎn)表示變量,有向邊表示變量間的依賴關(guān)系。在數(shù)據(jù)挖掘中具有以下優(yōu)點(diǎn):可以處理不完整和帶有噪聲的數(shù)據(jù)集。它用概率測度的權(quán)重來描述數(shù)據(jù)間的相關(guān)性,從而解決了數(shù)據(jù)間的不一致性,甚至是相互獨(dú)立的問題;用圖形的方法描述數(shù)據(jù)間的相互關(guān)系,語義清晰、可理解性強(qiáng),這有助于利用數(shù)據(jù)間的因果關(guān)系進(jìn)行預(yù)測分析。28精選2021版課件規(guī)則推導(dǎo)規(guī)則推導(dǎo),從統(tǒng)計(jì)意義上對數(shù)據(jù)中的“如果-那么”規(guī)則進(jìn)行尋找和推導(dǎo),得到關(guān)聯(lián)規(guī)則。關(guān)聯(lián)規(guī)則挖掘發(fā)現(xiàn)大量數(shù)據(jù)中項(xiàng)集之間有趣的關(guān)聯(lián)或相關(guān)聯(lián)系。29精選2021版課件規(guī)則推導(dǎo)30精選2021版課件可視化技術(shù)用圖表等方式把數(shù)據(jù)特征用直觀地表述出來,如直方圖等,這其中運(yùn)用的許多描述統(tǒng)計(jì)的方法??梢暬夹g(shù)面對的一個難題是高維數(shù)據(jù)的可視化。信息可視化和數(shù)據(jù)挖掘是兩個可互為補(bǔ)充利用的相關(guān)研究領(lǐng)域。當(dāng)信息可視化作為數(shù)據(jù)挖掘的技術(shù)之一時,同其它技術(shù)相比,它有一個獨(dú)特之處:能極大地發(fā)揮用戶的主動參預(yù)性。由于對數(shù)據(jù)進(jìn)行了可視化,用戶愿意進(jìn)行探索(Explore),在探索過程中有可能發(fā)現(xiàn)意外的知識。31精選2021版課件其他技術(shù)近鄰算法,將數(shù)據(jù)集合中每一個記錄進(jìn)行分類的方法。統(tǒng)計(jì)分析方法,在數(shù)據(jù)庫字段項(xiàng)之間存在兩種關(guān)系:函數(shù)關(guān)系(能用函數(shù)公式表示的確定性關(guān)系)和相關(guān)關(guān)系(不能用函數(shù)公式表示,但仍是相關(guān)確定性關(guān)系),對它們的分析可采用回歸分析、相關(guān)分析、主成分分析等方法。模糊論方法,利用模糊集合理論,對實(shí)際問題進(jìn)行模糊判斷、模糊決策、模糊模式識別、模糊簇聚分析。32精選2021版課件6.1.4數(shù)據(jù)挖掘的功能自動預(yù)測趨勢和行為關(guān)聯(lián)分析對象分類聚類分析概念描述偏差檢測33精選2021版課件數(shù)據(jù)挖掘功能—預(yù)測數(shù)據(jù)挖掘自動在大型數(shù)據(jù)庫中尋找預(yù)測性信息,以往需要進(jìn)行大量手工分析的問題如今可以迅速直接由數(shù)據(jù)本身得出結(jié)論。一個典型的例子是市場預(yù)測問題,數(shù)據(jù)挖掘使用過去有關(guān)促銷的數(shù)據(jù)來尋找未來投資中回報(bào)最大的用戶,其它可預(yù)測的問題包括預(yù)報(bào)破產(chǎn)以及認(rèn)定對指定事件最可能作出反應(yīng)的群體。
34精選2021版課件數(shù)據(jù)挖掘功能—關(guān)聯(lián)分析數(shù)據(jù)關(guān)聯(lián)是數(shù)據(jù)庫中存在的一類重要的可被發(fā)現(xiàn)的知識。若兩個或多個變量的取值之間存在某種規(guī)律性,就稱為關(guān)聯(lián)。關(guān)聯(lián)可分為簡單關(guān)聯(lián)、時序關(guān)聯(lián)、因果關(guān)聯(lián)。關(guān)聯(lián)分析的目的是找出數(shù)據(jù)庫中隱藏的關(guān)聯(lián)網(wǎng)。有時并不知道數(shù)據(jù)庫中數(shù)據(jù)的關(guān)聯(lián)函數(shù),即使知道也是不確定的,因此關(guān)聯(lián)分析生成的規(guī)則帶有可信度。關(guān)聯(lián)是某種事物發(fā)生時其他事物會發(fā)生的這樣一種聯(lián)系。例如:每天購買啤酒的人也有可能購買香煙,比重有多大,可以通過關(guān)聯(lián)的支持度和可信度來描述。時序關(guān)聯(lián)是一種縱向的聯(lián)系。例如:今天銀行調(diào)整利率,明天股市的變化。35精選2021版課件數(shù)據(jù)挖掘功能—分類按照分析對象的屬性、特征,建立不同的組類來描述事物。例如:銀行部門根據(jù)以前的數(shù)據(jù)將客戶分成了不同的類別,現(xiàn)在就可以根據(jù)這些來區(qū)分新申請貸款的客戶,以采取相應(yīng)的貸款方案。36精選2021版課件數(shù)據(jù)挖掘功能—聚類
數(shù)據(jù)庫中的記錄可被化分為一系列有意義的子集,即聚類。聚類增強(qiáng)了人們對客觀現(xiàn)實(shí)的認(rèn)識,是概念描述和偏差分析的先決條件。聚類技術(shù)主要包括傳統(tǒng)的模式識別方法和數(shù)學(xué)分類學(xué)。聚類技術(shù)在劃分對象時不僅考慮對象之間的距離,還要求劃分出的類具有某種內(nèi)涵描述,從而避免了傳統(tǒng)技術(shù)的某些片面性。37精選2021版課件數(shù)據(jù)挖掘功能—概念描述概念描述就是對某類對象的內(nèi)涵進(jìn)行描述,并概括這類對象的有關(guān)特征。概念描述分為特征性描述和區(qū)別性描述,前者描述某類對象的共同特征,后者描述不同類對象之間的區(qū)別。生成一個類的特征性描述只涉及該類對象中所有對象的共性。生成區(qū)別性描述的方法很多,如決策樹方法、遺傳算法等。38精選2021版課件數(shù)據(jù)挖掘功能—偏差檢測數(shù)據(jù)庫中的數(shù)據(jù)常有一些異常記錄,從數(shù)據(jù)庫中檢測這些偏差很有意義。偏差包括很多潛在的知識,如分類中的反常實(shí)例、不滿足規(guī)則的特例、觀測結(jié)果與模型預(yù)測值的偏差、量值隨時間的變化等。偏差檢測的基本方法是,尋找觀測結(jié)果與參照值之間有意義的差別。偏差檢測對分析對象的少數(shù)的、極端的特例的描述,揭示內(nèi)在的原因。例如:在銀行的100萬筆交易中有500例的欺詐行為,銀行為了穩(wěn)健經(jīng)營,就要發(fā)現(xiàn)這500例的內(nèi)在因素,減小以后經(jīng)營的風(fēng)險。
39精選2021版課件6.1.5數(shù)據(jù)挖掘的流程
40精選2021版課件數(shù)據(jù)挖掘的流程確定業(yè)務(wù)對象數(shù)據(jù)準(zhǔn)備數(shù)據(jù)挖掘結(jié)果分析和知識同化41精選2021版課件數(shù)據(jù)挖掘的流程-確定業(yè)務(wù)對象清晰地定義出業(yè)務(wù)問題,認(rèn)清數(shù)據(jù)挖掘的目的是數(shù)據(jù)挖掘的重要一步。挖掘的最后結(jié)構(gòu)是不可預(yù)測的,但要探索的問題應(yīng)是有預(yù)見的,為了數(shù)據(jù)挖掘而數(shù)據(jù)挖掘則帶有盲目性,是不會成功的。
42精選2021版課件數(shù)據(jù)挖掘的流程-數(shù)據(jù)準(zhǔn)備數(shù)據(jù)的選擇:搜索所有與業(yè)務(wù)對象有關(guān)的內(nèi)部和外部數(shù)據(jù)信息,并從中選擇出適用于數(shù)據(jù)挖掘應(yīng)用的數(shù)據(jù)。數(shù)據(jù)的預(yù)處理:研究數(shù)據(jù)的質(zhì)量,為進(jìn)一步的分析作準(zhǔn)備.并確定將要進(jìn)行的挖掘操作的類型。數(shù)據(jù)的轉(zhuǎn)換:將數(shù)據(jù)轉(zhuǎn)換成一個分析模型.這個分析模型是針對挖掘算法建立的.建立一個真正適合挖掘算法的分析模型是數(shù)據(jù)挖掘成功的關(guān)鍵。
43精選2021版課件數(shù)據(jù)挖掘的流程-數(shù)據(jù)挖掘?qū)λ玫降慕?jīng)過轉(zhuǎn)換的數(shù)據(jù)進(jìn)行挖掘.除了完善從選擇合適的挖掘算法外,其余一切工作都能自動地完成。
44精選2021版課件數(shù)據(jù)挖掘的流程-分析和同化結(jié)果分析:解釋并評估結(jié)果,其使用的分析方法一般應(yīng)作數(shù)據(jù)挖掘操作而定,通常會用到可視化技術(shù)。知識的同化:將分析所得到的知識集成到業(yè)務(wù)信息系統(tǒng)的組織結(jié)構(gòu)中去。
45精選2021版課件數(shù)據(jù)挖掘過程工作量
在數(shù)據(jù)挖掘中被研究的業(yè)務(wù)對象是整個過程的基礎(chǔ),它驅(qū)動了整個數(shù)據(jù)挖掘過程,也是檢驗(yàn)最后結(jié)果和指引分析人員完成數(shù)據(jù)挖掘的依據(jù)。數(shù)據(jù)挖掘的過程并不是自動的,絕大多數(shù)的工作需要人工完成。其中60%的時間用在數(shù)據(jù)準(zhǔn)備上,這說明了數(shù)據(jù)挖掘?qū)?shù)據(jù)的嚴(yán)格要求,而后挖掘工作僅占總工作量的10%.46精選2021版課件數(shù)據(jù)挖掘過程工作量
47精選2021版課件數(shù)據(jù)挖掘需要的人員
數(shù)據(jù)挖掘過程的分步實(shí)現(xiàn),不同的步會需要是有不同專長的人員,他們大體可以分為三類。業(yè)務(wù)分析人員:要求精通業(yè)務(wù),能夠解釋業(yè)務(wù)對象,并根據(jù)各業(yè)務(wù)對象確定出用于數(shù)據(jù)定義和挖掘算法的業(yè)務(wù)需求。數(shù)據(jù)分析人員:精通數(shù)據(jù)分析技術(shù),并對統(tǒng)計(jì)學(xué)有較熟練的掌握,有能力把業(yè)務(wù)需求轉(zhuǎn)化為數(shù)據(jù)挖掘的各步操作,并為每步操作選擇合適的技術(shù)。數(shù)據(jù)管理人員:精通數(shù)據(jù)管理技術(shù),并從數(shù)據(jù)庫或數(shù)據(jù)倉庫中收集數(shù)據(jù)。
48精選2021版課件6.5.6數(shù)據(jù)挖掘未來研究方向
發(fā)現(xiàn)語言的形式化描述,即研究專門用于知識發(fā)現(xiàn)的數(shù)據(jù)挖掘語言,也許會像SQL語言一樣走向形式化和標(biāo)準(zhǔn)化;尋求數(shù)據(jù)挖掘過程中的可視化方法,使知識發(fā)現(xiàn)的過程能夠被用戶理解,也便于在知識發(fā)現(xiàn)的過程中進(jìn)行人機(jī)交互;研究在網(wǎng)絡(luò)環(huán)境下的數(shù)據(jù)挖掘技術(shù)(WebMining),特別是在因特網(wǎng)上建立DMKD服務(wù)器,并且與數(shù)據(jù)庫服務(wù)器配合,實(shí)現(xiàn)WebMining;加強(qiáng)對各種非結(jié)構(gòu)化數(shù)據(jù)的開采(DataMiningforAudio&Video),如對文本數(shù)據(jù)、圖形數(shù)據(jù)、視頻圖像數(shù)據(jù)、聲音數(shù)據(jù)乃至綜合多媒體數(shù)據(jù)的開采;處理的數(shù)據(jù)將會涉及到更多的數(shù)據(jù)類型,這些數(shù)據(jù)類型或者比較復(fù)雜,或者是結(jié)構(gòu)比較獨(dú)特。為了處理這些復(fù)雜的數(shù)據(jù),就需要一些新的和更好的分析和建立模型的方法,同時還會涉及到為處理這些復(fù)雜或獨(dú)特?cái)?shù)據(jù)所做的費(fèi)時和復(fù)雜數(shù)據(jù)準(zhǔn)備的一些工具和軟件。交互式發(fā)現(xiàn)和知識的維護(hù)更新。
49精選2021版課件OLAM聯(lián)機(jī)分析挖掘,又稱為OLAPMining。它是聯(lián)機(jī)分析處理技術(shù)與數(shù)據(jù)挖掘技術(shù)在數(shù)據(jù)庫或數(shù)據(jù)倉庫應(yīng)用中的結(jié)合,是聯(lián)機(jī)分析處理技術(shù)的新發(fā)展,也是近年來數(shù)據(jù)庫領(lǐng)域的研究重點(diǎn)和熱點(diǎn)。50精選2021版課件OLAM產(chǎn)生的原因OLAP與DM雖同為數(shù)據(jù)庫或數(shù)據(jù)倉庫的分析工具,但兩者側(cè)重點(diǎn)不同。同時,隨著OLAP與DM技術(shù)的應(yīng)用和發(fā)展,數(shù)據(jù)庫領(lǐng)域在OLAP基礎(chǔ)上對深層次分析的需求與人工智能領(lǐng)域中數(shù)據(jù)挖掘技術(shù)的融合最終促成了聯(lián)機(jī)分析挖掘技術(shù)。51精選2021版課件OLAM產(chǎn)生的原因一方面,分析工具OLAP功能雖強(qiáng)大,能為客戶端應(yīng)用程序提供完善的查詢和分析,但它也存在以下不足:1)OLAP是一種驗(yàn)證型分析工具,是由用戶驅(qū)動的。即在某個假設(shè)的前提下通過數(shù)據(jù)查詢和分析來驗(yàn)證或否定這個假設(shè),這很大程度上受到用戶假設(shè)能力的限制。2)OLAP分析事先需要對用戶的需求有全面而深人的了解,然而用戶的需求并不是確定的,難以把握。所以O(shè)LAP分析常常采用試湊法在大型數(shù)據(jù)庫或倉庫中搜索,不僅花時間,而且可能產(chǎn)生一些無用的結(jié)果。3)即使搜索到了有用的信息,由于缺乏應(yīng)有的維度,從不同的視圖得到的結(jié)果可能并不相同,容易產(chǎn)生誤導(dǎo)。52精選2021版課件OLAM產(chǎn)生的原因另一方面,數(shù)據(jù)挖掘雖然可以使用復(fù)雜算法來分析數(shù)據(jù)和創(chuàng)建模型表示有關(guān)數(shù)據(jù)的信息,用戶也不必提出確切的要求,系統(tǒng)就能夠根據(jù)數(shù)據(jù)本身的規(guī)律性,自動地挖掘數(shù)據(jù)潛在的模式,或通過聯(lián)想,建立新的業(yè)務(wù)模型以輔助決策。但它也存在一些缺點(diǎn):1)DM是挖掘型分析工具,是由數(shù)據(jù)驅(qū)動的。用戶需要事先提出挖掘任務(wù)。但對于用戶來講,很多時候預(yù)先是不知道想挖掘什么樣的知識的。2)由于數(shù)據(jù)庫或數(shù)據(jù)倉庫中存有大量數(shù)據(jù)和信息,用戶僅僅指出挖掘任務(wù),而不提供其他搜索線索,這樣DM工具就會遍歷整個數(shù)據(jù)庫,導(dǎo)致搜索空間太大。計(jì)算機(jī)將處于長時間的工作,而且結(jié)果中可能會生成很多無用信息。3)即使挖掘出了潛在有價值的信息,但它究竟用來做什么分析用,用戶也可能不清楚。53精選2021版課件OLAM產(chǎn)生兩種技術(shù)各存在不足,但同時也可以相輔相成。如果將OLAP同DM配合集成,一方面OLAP的分析結(jié)果給DM提供挖掘的依據(jù),引導(dǎo)DM的進(jìn)行;另一方面,在數(shù)據(jù)挖掘的結(jié)果中進(jìn)行OLAP分析,則OLAP分析的深度就可拓展。這樣用戶就可以靈活選擇所需的數(shù)據(jù)挖掘功能,并動態(tài)交換挖掘任務(wù),在數(shù)據(jù)倉庫的基礎(chǔ)上提供更有效的決策支持。鑒于OLAP與DM技術(shù)在決策分析中的這種互補(bǔ)性,促成了OLAM技術(shù)的形成。54精選2021版課件OLAM產(chǎn)生聯(lián)機(jī)分析挖掘概念正式提出是在1997年,由加拿大SimonFraser大學(xué)教授JiaweiHan等在數(shù)據(jù)立方體的基礎(chǔ)上提出多維數(shù)據(jù)挖掘的概念,稱為OLAPmining。這實(shí)際上是在OLAP系統(tǒng)的基礎(chǔ)上,把數(shù)據(jù)分析算法、數(shù)據(jù)挖掘算法引人進(jìn)來,解決多維數(shù)據(jù)環(huán)境的數(shù)據(jù)挖掘問題。55精選2021版課件OLAM體系結(jié)構(gòu)56精選2021版課件OLAM體系結(jié)構(gòu)OLAM的挖掘分析處理是建立在數(shù)據(jù)倉庫系統(tǒng)的數(shù)據(jù)立方體基礎(chǔ)上的。數(shù)據(jù)立方體的組織模型、計(jì)算和操作對與系統(tǒng)的執(zhí)行效率和響應(yīng)速度起著至關(guān)重要的作用。OLAM集成了傳統(tǒng)的OLAP和數(shù)據(jù)挖掘技術(shù),為用戶的在線分析挖掘操作提供接口。OLAM引擎通過用戶圖形接口接收用戶的分析請求指令和數(shù)據(jù),在元數(shù)據(jù)的指導(dǎo)下,對數(shù)據(jù)立方體進(jìn)行相應(yīng)的操作,包括集合運(yùn)算(如求和、求平均)和導(dǎo)向運(yùn)算(如選擇、旋轉(zhuǎn)、上鉆與下鉆)等,然后將挖掘分析的結(jié)果以可視化的形式展現(xiàn)給用戶,整個分析挖掘過程是動態(tài)進(jìn)行的。57精選2021版課件OLAM的系統(tǒng)特征
OLAM系統(tǒng)的主要目的就是實(shí)現(xiàn)OLAP與數(shù)據(jù)挖掘的功能互補(bǔ),提高數(shù)據(jù)分析挖掘的性能。建立在龐大復(fù)雜的數(shù)據(jù)倉庫基礎(chǔ)上的OLAM在實(shí)現(xiàn)過程中面臨最大的挑戰(zhàn)是數(shù)據(jù)分析挖掘執(zhí)行的效率的提高和對用戶請求的快速準(zhǔn)確響應(yīng)。目前專門的OLAM產(chǎn)品還沒有正式出現(xiàn),但根據(jù)OLAM系統(tǒng)的設(shè)計(jì)目的和用戶要求,OLAM應(yīng)具有其自己的系統(tǒng)及功能特征。58精選2021版課件OLAM的系統(tǒng)特征(1)多維分析和數(shù)據(jù)挖掘無縫集成,即多維分析與數(shù)據(jù)挖掘的完美結(jié)合需要理論基礎(chǔ),需要一套系統(tǒng)構(gòu)建方法。比如借助于OLAP對數(shù)據(jù)立方體進(jìn)行切片、切塊、旋轉(zhuǎn)、向下鉆取、向上匯總等操作的支持,應(yīng)能方便地對任何一部分?jǐn)?shù)據(jù)和不同抽象級別地?cái)?shù)據(jù)進(jìn)行挖掘。59精選2021版課件OLAM的系統(tǒng)特征(2)具有較高的執(zhí)行效率和較快的響應(yīng)速度。OLAM系統(tǒng)快速響應(yīng)能力的獲得是一個十分有挑戰(zhàn)性的問題,可以認(rèn)為是OLAM技術(shù)中最困難的問題之一。往往數(shù)據(jù)挖掘算法復(fù)雜且耗時,這時要求協(xié)調(diào)執(zhí)行效率和挖掘精度兩者的關(guān)系。60精選2021版課件OLAM的系統(tǒng)特征(3)支持迭代分析過程,即系統(tǒng)應(yīng)提供“回溯”能力,以便隨時標(biāo)記分析過程中的時空狀態(tài)點(diǎn),并在分析過程中隨時回到這一點(diǎn),有利于分析的靈活進(jìn)行,防止在進(jìn)行由淺人深的分析過程中用戶“迷失方向”。61精選2021版課件OLAM的系統(tǒng)特征(4)支持復(fù)雜信息建模,即要求OLAM系統(tǒng)支持多種異構(gòu)DBMS中多種數(shù)據(jù)類型的融合,全面處理企業(yè)內(nèi)的各種決策支持應(yīng)用。一方面,決策分析的數(shù)據(jù)對象來自于不同開發(fā)環(huán)境和目的的分立應(yīng)用系統(tǒng),數(shù)據(jù)的管理方法和數(shù)據(jù)結(jié)構(gòu)也可能不同,這就要求OLAM在數(shù)據(jù)方面有很強(qiáng)的包容性;另一方面,不同的數(shù)據(jù)挖掘方法要求不同的數(shù)據(jù)結(jié)構(gòu)支撐。62精選2021版課件OLAM的系統(tǒng)特征(5)良好的可擴(kuò)展性。要求OLAM系統(tǒng)支持多種挖掘算法的模塊的添加、多種工作對象的建構(gòu)、多種數(shù)據(jù)源的集成、多種前端工具的利用等擴(kuò)展功能。用戶能根據(jù)實(shí)際問題的不同,選用不同的挖掘算法。此外,OLAM因該具有支持這些擴(kuò)展的通用接口,以便與其它工具和算法銜接,或者嵌人用戶自己的算法。63精選2021版課件OLAM的系統(tǒng)特征(6)靈活友好的人機(jī)交互能力。OLAM中的決策分析過程是要在人的指導(dǎo)下進(jìn)行的,人作為系統(tǒng)的有機(jī)組成部分和系統(tǒng)應(yīng)用密不可分。人利用自己掌握的領(lǐng)域知識在OLAM系統(tǒng)的輔助下完成領(lǐng)域內(nèi)問題的求解,在這個過程中人與計(jì)算機(jī)分別承擔(dān)各自最擅長的工作,達(dá)到資源的合理配置。64精選2021版課件OLAM的系統(tǒng)特征(7)支持復(fù)雜事務(wù)模型及多任務(wù)優(yōu)化和調(diào)度。OLAM事務(wù)是有“內(nèi)部結(jié)構(gòu)”的數(shù)據(jù)庫操作集合,是一個有層次的復(fù)雜網(wǎng)絡(luò)結(jié)構(gòu),傳統(tǒng)的無內(nèi)部結(jié)構(gòu)、彼此孤立的、最小原子特性的事務(wù)模型只是這種模型的特例。OLAM事務(wù)之間具有廣泛的聯(lián)系,考慮在對事務(wù)分解的基礎(chǔ)上,充分利用不同事務(wù)中的公共子事務(wù)來優(yōu)化事務(wù)的調(diào)度。65精選2021版課件OLAM的分析操作從OLAM的定義來看,它是建立在多維數(shù)據(jù)視圖基礎(chǔ)之上的。因此,對于OLAM的操作應(yīng)是超立方體計(jì)算與傳統(tǒng)挖掘算法的結(jié)合。這里所說的立方體計(jì)算方法一般指切片、切塊、上卷、下鉆、旋轉(zhuǎn)等操作;而挖掘算法則是指關(guān)聯(lián)規(guī)則、分類、聚類等挖掘算法。根據(jù)立方體計(jì)算和數(shù)據(jù)挖掘所進(jìn)行的次序的不同組合可以有不同的模式。66精選2021版課件OLAM的分析操作先進(jìn)行立方體計(jì)算、后進(jìn)行數(shù)據(jù)挖掘。在進(jìn)行數(shù)據(jù)挖掘以前,先對多維數(shù)據(jù)進(jìn)行二定的立方體計(jì)算,以選擇合適的數(shù)據(jù)范圍和恰當(dāng)?shù)某橄蠹墑e。先對多維數(shù)據(jù)作數(shù)據(jù)挖掘,然后再利用立方體計(jì)算算法對挖掘出來的結(jié)果做進(jìn)一步的深人分析。立方體計(jì)算與數(shù)據(jù)挖掘同時進(jìn)行。在挖掘的過程中,可以根據(jù)需要對數(shù)據(jù)視圖做相應(yīng)的多維操作。這也意味著同一個挖掘算法可以應(yīng)用于多維數(shù)據(jù)視圖的不同部分?;厮莶僮鳌LAM的標(biāo)簽和回溯特性,允許用戶回溯一步或幾步,或回溯至標(biāo)志處,然后沿著另外的途徑進(jìn)行挖掘,這樣用戶在挖掘分析中可以交互式的進(jìn)行立方體計(jì)算和數(shù)據(jù)挖掘。67精選2021版課件OLAM技術(shù)的發(fā)展趨勢OLAM技術(shù)實(shí)現(xiàn)了OLAP和DM技術(shù)的互補(bǔ),它的發(fā)展趨勢是兩者更加可靠的集成、融合,有自己合理優(yōu)化的結(jié)構(gòu)體系和一套完備的技術(shù)理論基礎(chǔ),從整體上為決策分析提供完美支持。OLAM技術(shù)是一門交叉學(xué)科,涉及機(jī)器學(xué)習(xí)、模式識別、統(tǒng)計(jì)學(xué)、智能數(shù)據(jù)庫、人工智能、高性能計(jì)算、數(shù)據(jù)可視化、專家系統(tǒng)等綜合技術(shù)。這些相關(guān)學(xué)科的發(fā)展,無疑也將會推動OLAM技術(shù)的發(fā)展。特別是,近年來隨著數(shù)據(jù)庫技術(shù)的發(fā)展,出現(xiàn)了不同數(shù)據(jù)類型的高級數(shù)據(jù)庫,如面向?qū)ο髷?shù)據(jù)庫、對象關(guān)系型數(shù)據(jù)庫、空間數(shù)據(jù)庫、超文本數(shù)據(jù)庫、多媒體數(shù)據(jù)庫、時序數(shù)據(jù)庫等。因此,未來的OLAM技術(shù)應(yīng)用應(yīng)基于這些高級數(shù)據(jù)庫展開。隨著互聯(lián)網(wǎng)技術(shù)的發(fā)展,全球信息的共享,基于Web的聯(lián)機(jī)分析挖掘(Web0LAM),也將成為OLAM技術(shù)發(fā)展的一個新方向。68精選2021版課件6.2數(shù)據(jù)挖掘在CRM中的應(yīng)用從客戶生命周期角度分析數(shù)據(jù)挖掘技術(shù)的應(yīng)用從行業(yè)角度分析數(shù)據(jù)挖掘技術(shù)的應(yīng)用69精選2021版課件從客戶生命周期角度分析在客戶生命周期的過程中,各個不同的階段包含了許多重要的事件。數(shù)據(jù)挖掘技術(shù)可以應(yīng)用于客戶生命周期的各個階段提高企業(yè)客戶關(guān)系管理能力,包括爭取新的客戶,讓已有的客戶創(chuàng)造更多的利潤、保持住有價值的客戶等等。
70精選2021版課件從客戶各生命周期角度分析71精選2021版課件潛在客戶期市場活動及數(shù)據(jù)挖掘應(yīng)用潛在客戶獲得活動是針對目標(biāo)市場的營銷活動,尋找對企業(yè)產(chǎn)品或服務(wù)感興趣的人。值得注意的是,在這個階段缺乏客戶數(shù)據(jù)。數(shù)據(jù)挖掘可以把以前的客戶對類似活動的響應(yīng)進(jìn)行挖掘,從而把市場活動重點(diǎn)鎖定在以前的響應(yīng)者身上。一個更好的方法就是尋找和高價值的客戶類似的潛在客戶——只要一次就獲得正確的客戶。通常,獲得活動使用廣告和其它市場宣傳媒體。無論何種渠道,數(shù)據(jù)挖掘在發(fā)現(xiàn)最重要的客戶特定市場中發(fā)揮重要作用,決定著市場活動的類型、廣告空間等一些宣傳問題。
72精選2021版課件客戶響應(yīng)期市場活動及數(shù)據(jù)挖掘應(yīng)用潛在客戶通過以下幾種途徑成為響應(yīng)者:登陸企業(yè)網(wǎng)站;撥打免費(fèi)電話;填寫申請表等。把潛在客戶改變成為確定的客戶、能夠被鎖定和跟蹤的客戶。雖然響應(yīng)者還沒有購買任何產(chǎn)品或服務(wù),但他們有很大的可能性成為購買者,并成為企業(yè)客戶。數(shù)據(jù)挖掘通常被用來判定哪些潛在客戶會變成響應(yīng)者。預(yù)測模型也用來判定哪些響應(yīng)者會成為企業(yè)即得客戶。73精選2021版課件即得客戶市場活動及數(shù)據(jù)挖應(yīng)用(1)響應(yīng)者購買企業(yè)產(chǎn)品的時候就變成了企業(yè)即得客戶。這意味著他們已經(jīng)進(jìn)行了第一次的購買活動。在即得客戶階段包括許多活動。最重要的活動可以劃分為三:刺激使用(使用展現(xiàn)了客戶行為,當(dāng)使用是企業(yè)收入的主要來源,刺激使用就成為企業(yè)的重要目標(biāo)。使用模式因不同的客戶市場而有所不同);交叉銷售(鼓勵客戶購買與第一次購買不同的產(chǎn)品或服務(wù)的市場營銷活動);升級銷售(鼓勵客戶升級現(xiàn)有的產(chǎn)品和服務(wù)的市場營銷活動)。74精選2021版課件即得客戶市場活動及應(yīng)用(2)即得客戶是數(shù)據(jù)挖掘的重要區(qū)域。客戶使用活動提供了客戶行為模式的最本質(zhì)的東西。預(yù)測什么時候會發(fā)生客戶活動,判定哪個客戶可能對交叉銷售和升級銷售活動做出響應(yīng)對企業(yè)來講是極具價值的。但既得客戶的行為經(jīng)常被大量詳細(xì)的交易信息所淹沒。使用數(shù)據(jù)挖掘要求從其中抽出其特點(diǎn)。客戶早期的購買和使用模式是對企業(yè)來講是非常具有價值的,在一些行業(yè),首次行為預(yù)示了未來的使用信息。這些客戶可以是高消費(fèi)者或低消費(fèi)者,他們可能對一個或多個產(chǎn)品感興趣。這類行為通常在早期的購買行為中明顯的表現(xiàn)出來。75精選2021版課件客戶流失期市場活動及數(shù)據(jù)挖掘應(yīng)用在一些情況下,客戶停止購買企業(yè)產(chǎn)品。對此,有兩種基本不同的流失原因,第一種是主動離開,指的是不再是客戶的既得客戶。了解主動離開出現(xiàn)的原因非常重要,以下是客戶主動離開的一些基本原因:客戶離開了企業(yè)服務(wù)的地區(qū);客戶的生活方式發(fā)生了變化,并不再需要企業(yè)的產(chǎn)品和服務(wù);客戶已經(jīng)獲得了競爭者提供的更好的產(chǎn)品或服務(wù);客戶不再認(rèn)為使用企業(yè)產(chǎn)品有任何價值。第二種是非主動離開,既被動離開。指的是即得客戶不再是一個好的客戶,通常因?yàn)樗麄兺V怪Ц端麄兊膸?。區(qū)別主動離開和被動離開對企業(yè)來說是非常重要的。數(shù)據(jù)挖掘可以通過分析以前的客戶數(shù)據(jù)得出什么樣的客戶會在將來同樣的離開。即使客戶離開,也不是所有流失的客戶就完全失去了。贏得客戶活動的目標(biāo)就是重新獲得失去的客戶。76精選2021版課件從行業(yè)角度分析數(shù)據(jù)挖掘技術(shù)的應(yīng)用CRM中數(shù)據(jù)挖掘應(yīng)用的深度和廣度針對行業(yè)的不同而有所不同,特別是針對與客戶交流頻繁、客戶支持要求高的行業(yè),如銀行、證券、保險、電信、稅務(wù)、零售、旅游、航空、醫(yī)療保健等。零售業(yè)CRM中數(shù)據(jù)挖掘的應(yīng)用電信業(yè)CRM中數(shù)據(jù)挖掘的應(yīng)用金融業(yè)CRM中數(shù)據(jù)挖掘的應(yīng)用77精選2021版課件零售業(yè)CRM中數(shù)據(jù)挖掘的應(yīng)用零售業(yè)CRM是數(shù)據(jù)挖掘的主要應(yīng)用領(lǐng)域,特別是由于日益增長的Web或電子商務(wù)方式的興起零售數(shù)據(jù)挖掘可有助于識別客戶購買行為,發(fā)現(xiàn)客戶購買模式和趨勢,改進(jìn)服務(wù)質(zhì)量,取得更好的客戶保持力和滿意度,提高貨品銷量比率,設(shè)計(jì)更好的貨品運(yùn)輸與分銷策略,減少商業(yè)成本。例如:①使用多特征數(shù)據(jù)立方體進(jìn)行銷售、客戶、產(chǎn)品、時間和地區(qū)的多維分析;②使用多維分析和關(guān)聯(lián)分析進(jìn)行促銷活動的有效性分析;③序列模式挖掘可用于客戶忠誠分析;④利用關(guān)聯(lián)分析挖掘關(guān)聯(lián)信息進(jìn)行購買推薦和商品參照。78精選2021版課件電信業(yè)CRM中的數(shù)據(jù)挖掘電信業(yè)已經(jīng)迅速地從單純的提供市話服務(wù)演變?yōu)樘峁┚C合電信服務(wù)。電信網(wǎng)、因特網(wǎng)和各種其他方式的通信和計(jì)算的融合是目前的大勢所趨。利用數(shù)據(jù)挖掘技術(shù)可幫助理解商業(yè)行為、確定電信模式、捕捉盜用行為、更好的利用資源和提高服務(wù)質(zhì)量。例如:①電信數(shù)據(jù)的多維分析有助于識別和比較數(shù)據(jù)通信情況、系統(tǒng)負(fù)載、資源使用、用戶組行為、利潤等;②通過多維分析、聚類分析和孤立點(diǎn)分析進(jìn)行盜用模式分析和異常模式識別;③通過多維關(guān)聯(lián)和序列模式分析進(jìn)行電信服務(wù)組合和個性化服務(wù);④電信數(shù)據(jù)分析中可視化工具的使用。79精選2021版課件金融業(yè)CRM中的數(shù)據(jù)挖掘大部分銀行和金融機(jī)構(gòu)除提供豐富多樣的儲蓄服務(wù)、信用服務(wù)、投資服務(wù)外,還提供保險服務(wù)和股票投資服務(wù)。在銀行和金融機(jī)構(gòu)中產(chǎn)生的金融數(shù)據(jù)通常相對比較完整、可靠,這大大方便了系統(tǒng)化的數(shù)據(jù)分析和數(shù)據(jù)挖掘。以下給出幾種典型的應(yīng)用情況:①為多維數(shù)據(jù)分析和數(shù)據(jù)挖掘設(shè)計(jì)和構(gòu)造數(shù)據(jù)倉庫;②特征選擇和屬性相關(guān)性計(jì)算有助于貸款償還預(yù)測和客戶信用政策分析;③分類和聚類的方法可用于客戶群體的識別和目標(biāo)市場的分析[6];④通過數(shù)據(jù)可視化、鏈接分析、分類、聚類分析、孤立點(diǎn)分析、序列分析等分析工具幫助進(jìn)行洗黑錢和其他金融犯
溫馨提示
- 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
- 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
- 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
- 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負(fù)責(zé)。
- 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請與我們聯(lián)系,我們立即糾正。
- 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時也不承擔(dān)用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。
最新文檔
- 2024年租賃合同(設(shè)備)
- 2024年進(jìn)出口業(yè)務(wù)委托合同2篇
- 2024年環(huán)保公益捐贈合同3篇
- 2025年度美容院商鋪?zhàn)赓U及美容院品牌授權(quán)合同3篇
- 2024年西餐廳特許經(jīng)營權(quán)出租及轉(zhuǎn)讓合同
- 2025年度智能家電產(chǎn)品采購與市場推廣合同3篇
- 2024年遺體接送與防腐處理合同3篇
- 教育心理學(xué)復(fù)習(xí)參考試題
- 2025年度旅游景區(qū)門衛(wèi)安全責(zé)任書3篇
- 2024綠城物業(yè)服務(wù)公司戰(zhàn)略合作合同
- 礦用電纜市場發(fā)展預(yù)測和趨勢分析
- 失蹤老人歸家協(xié)議書模板
- 2024年初三數(shù)學(xué)競賽考試試題
- 單位委托員工辦理水表業(yè)務(wù)委托書
- 2024年江蘇省蘇州市中考英語真題
- 02S501-2 雙層井蓋圖集標(biāo)準(zhǔn)
- 醫(yī)藥制造企業(yè)資本結(jié)構(gòu)優(yōu)化研究以貴州百靈為例
- 小班幼兒能力測查與分析報(bào)告
- GB 31335-2024鐵礦開采和選礦單位產(chǎn)品能源消耗限額
- 醫(yī)院高風(fēng)險意外事件應(yīng)急措施和救護(hù)機(jī)制
- 停車場管理系統(tǒng)說明書
評論
0/150
提交評論