




版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請(qǐng)進(jìn)行舉報(bào)或認(rèn)領(lǐng)
文檔簡介
1、數(shù)據(jù)挖掘概述 2022/8/81Data Mining: Concepts and Techniques主要內(nèi)容1 背景2 數(shù)據(jù)挖掘定義3 主要功能4 數(shù)據(jù)挖掘模型5 實(shí)現(xiàn)流程6 數(shù)據(jù)挖掘的應(yīng)用7 主要工具2022/8/82Data Mining: Concepts and Techniques1 背景現(xiàn)實(shí)情況:人類積累的數(shù)據(jù)量以每月高于15%的速度增加,如果不借助強(qiáng)有力的挖掘工具,僅依靠人的能力來理解這些數(shù)據(jù)是不可能的?,F(xiàn)在人們已經(jīng)評(píng)估出世界上信息的數(shù)量每二十個(gè)月翻一番,并且數(shù)據(jù)庫的數(shù)量與大小正在以更快的速度增長。2022/8/83Data Mining: Concepts and Tech
2、niques1 背景 著名的“啤酒尿布”案例:美國加州某個(gè)超級(jí)賣場通過數(shù)據(jù)挖掘發(fā)現(xiàn),下班后前來購買嬰兒尿布的男顧客大都購買啤酒。于是經(jīng)理當(dāng)機(jī)立斷,重新布置貨架,把啤酒類商品布置在嬰兒尿布貨架附近,并在二者之間放置佐酒食品,同時(shí)還把男士日常用品就近布置。這樣,上述幾種商品的銷量大增。2022/8/84Data Mining: Concepts and Techniques2 數(shù)據(jù)挖掘定義數(shù)據(jù)挖掘(Data Mining)就是從大量的、不完全的、有噪聲的、模糊的、隨機(jī)的實(shí)際應(yīng)用數(shù)據(jù)中,提取隱含在其中的、人們事先不知道的、但又是潛在有用的信息和知識(shí)的過程。數(shù)據(jù)挖掘相近的包括:數(shù)據(jù)融合、數(shù)據(jù)分析和決策
3、支持等。發(fā)現(xiàn)的知識(shí)要可接受、可理解、可運(yùn)用;并不要求發(fā)現(xiàn)放之四海皆準(zhǔn)的知識(shí),僅支持特定的發(fā)現(xiàn)問題。2022/8/85Data Mining: Concepts and Techniques數(shù)據(jù)挖掘的演化進(jìn)化階段商業(yè)問題支持技術(shù)產(chǎn)品廠家產(chǎn)品特點(diǎn)數(shù)據(jù)搜集(60年代)“過去五年中我的總收入是多少?”計(jì)算機(jī)、磁帶和磁盤IBM,CDC提供歷史性的、靜態(tài)的數(shù)據(jù)信息數(shù)據(jù)訪問(80年代)“在新英格蘭的分部去年三月的銷售額是多少?”關(guān)系數(shù)據(jù)庫(RDBMS),結(jié)構(gòu)化查詢語言(SQL),ODBC Oracle、Sybase、Informix、IBM、MicrosoftOracle、Sybase、Informix、I
4、BM、Microsoft在記錄級(jí)提供歷史性的、動(dòng)態(tài)數(shù)據(jù)信息數(shù)據(jù)倉庫;決策支持(90年代)“在新英格蘭的分部去年三月的銷售額是多少?波士頓據(jù)此可得出什么結(jié)論?”聯(lián)機(jī)分析處理(OLAP)、多維數(shù)據(jù)庫、數(shù)據(jù)倉庫Pilot、Comshare、Arbor、Cognos、Microstrategy在各種層次上提供回溯的、動(dòng)態(tài)的數(shù)據(jù)信息數(shù)據(jù)挖掘(正在流行)“下個(gè)月波士頓的銷售會(huì)怎么樣?為什么?”高級(jí)算法、多處理器計(jì)算機(jī)、海量數(shù)據(jù)庫Pilot、Lockheed、IBM、SGI、其他初創(chuàng)公司提供預(yù)測性的信息2022/8/86Data Mining: Concepts and Techniques數(shù)據(jù)挖掘與其他科
5、學(xué)的關(guān)系 數(shù)據(jù)挖掘是一個(gè)交叉學(xué)科領(lǐng)域,受多個(gè)學(xué)科影響,包括數(shù)據(jù)庫系統(tǒng)、統(tǒng)計(jì)學(xué)、機(jī)器學(xué)習(xí)、可視化和信息科學(xué) 。2022/8/87Data Mining: Concepts and Techniques數(shù)據(jù)挖掘與傳統(tǒng)數(shù)據(jù)分析方法 統(tǒng)計(jì)學(xué)和數(shù)據(jù)挖掘的目標(biāo)非常相似,而且數(shù)據(jù)挖掘中的許多算法也源于數(shù)理統(tǒng)計(jì),統(tǒng)計(jì)學(xué)對(duì)數(shù)據(jù)挖掘發(fā)展的貢獻(xiàn)功不可沒。 聯(lián)系: 區(qū)別: 傳統(tǒng)的數(shù)據(jù)分析方法一般都是先給出一個(gè)假設(shè)然后通過數(shù)據(jù)驗(yàn)證,在一定意義上是假設(shè)驅(qū)動(dòng)的;與之相反,數(shù)據(jù)挖掘在一定意義上是發(fā)現(xiàn)驅(qū)動(dòng)的,模式都是通過大量的搜索工作從數(shù)據(jù)中自動(dòng)提取出來 。即數(shù)據(jù)挖掘是要發(fā)現(xiàn)那些不能靠直覺發(fā)現(xiàn)的信息或知識(shí),甚至是違背直覺的信息
6、或知識(shí),挖掘出的信息越是出乎意料,就可能越有價(jià)值。2022/8/88Data Mining: Concepts and Techniques3 主要功能1. 概念/類別描述(Concept/Class Description) 概念/類別描述是指對(duì)數(shù)據(jù)集做一個(gè)簡潔的總體性描述并/或描述它與某一對(duì)照數(shù)據(jù)集的差別。 例1:我們收集移動(dòng)電話費(fèi)月消費(fèi)額超出1000元的客戶資料,然后利用數(shù)據(jù)挖掘進(jìn)行分析,獲得這類客戶的總體性描述:3550歲,有工作,月收入5000元以上,擁有良好的信用度; 2022/8/89Data Mining: Concepts and Techniques3 主要功能2 關(guān)聯(lián)分析
7、(Association Analysis)關(guān)聯(lián)規(guī)則挖掘就是發(fā)現(xiàn)大量數(shù)據(jù)中項(xiàng)集之間有趣的關(guān)聯(lián)關(guān)聯(lián)規(guī)則挖掘的典型案例:購物籃問題 在商場中擁有大量的商品(項(xiàng)目),如:牛奶、面包等,客戶將所購買的商品放入到自己的購物籃中。 通過發(fā)現(xiàn)顧客放入購物籃中的不同商品之間的聯(lián)系,分析顧客的購買習(xí)慣。哪些物品經(jīng)常被顧客購買? 同一次購買中,哪些商品經(jīng)常會(huì)被一起購買? 一般用戶的購買過程中是否存在一定的購買時(shí)間序列?2022/8/810Data Mining: Concepts and Techniques3 主要功能基本表示形式: 前提條件結(jié)論支持度, 置信度 buys(x, “diapers”) buys(
8、x, “beers”) 0.5%, 66% major(x, “CS”) takes(x, “DB”) grade(x, “A”) 1%, 75% 具體應(yīng)用:利潤最大化 商品貨架設(shè)計(jì):更加適合客戶的購物路徑 貨存安排:實(shí)現(xiàn)超市的零庫存管理 用戶分類:提供個(gè)性化的服務(wù) 3 關(guān)聯(lián)分析(Association Analysis)關(guān)聯(lián)分析在交易數(shù)據(jù)分析、支持定向市場、商品目錄設(shè)計(jì)和其他業(yè)務(wù)決策等方面有著廣泛的應(yīng)用。2022/8/811Data Mining: Concepts and Techniques1.3 主要功能4 分類與預(yù)測(Classification and Prediction)研究已
9、分類資料的特征,分析對(duì)象屬性,據(jù)此建立一個(gè)分類函數(shù)或分類模型,然后運(yùn)用該模型計(jì)算總結(jié)出的數(shù)據(jù)特征,將其他未經(jīng)分類或新的數(shù)據(jù)分派到不同的組中。預(yù)測是根據(jù)對(duì)象屬性、過去的觀察值和有關(guān)資料對(duì)該屬性的未來值進(jìn)行預(yù)測,預(yù)測使用的技巧主要是回歸分析、神經(jīng)網(wǎng)絡(luò)方法等。2022/8/812Data Mining: Concepts and Techniques1.3 主要功能常用方法決策樹(decision tree)貝葉斯分類(bayes classification)人工神經(jīng)網(wǎng)絡(luò)(ANN)K最近鄰分類法(k-nearest neighbor classifier)基于事例的推理(case-based re
10、asoning)遺傳算法(genetic algorithm)粗糙集方法(rough set approach)模糊集方法(fuzzy set approach)回歸分析(regression analysis)2022/8/813Data Mining: Concepts and Techniques1.3 主要功能5. 聚類分析(Clustering Analysis)把數(shù)據(jù)對(duì)象的集合分組到不同的聚類中聚類原則同一類內(nèi)的數(shù)據(jù)盡可能相似不同類數(shù)據(jù)盡可能不相似聚類實(shí)際上是一個(gè)無導(dǎo)師分類:沒有預(yù)先給定類別信息2022/8/814Data Mining: Concepts and Techniqu
11、es1.3 主要功能常用方法基于劃分的聚類分析方法基于層次的聚類分析方法基于密度的聚類分析方法基于網(wǎng)格的聚類分析方法基于模型的聚類分析方法2022/8/815Data Mining: Concepts and Techniques1.3 主要功能6. 時(shí)間序列分析(Time-Series Analysis) 時(shí)間序列分析即預(yù)測(Prediction),是指通過對(duì)大量時(shí)間序列數(shù)據(jù)的分析找到特定的規(guī)則和感興趣的特性,包括搜索相似序列或者子序列,挖掘序列模式、周期性、趨勢和偏差。預(yù)測的目的是對(duì)未來的情況作出估計(jì)。 如對(duì)主要股票的交易數(shù)據(jù)進(jìn)行建模分析。方法:趨勢和偏差: 回歸分析序列模式匹配:周期性分
12、析基于類似性的分析2022/8/816Data Mining: Concepts and Techniques1.3 主要功能7 特異點(diǎn)分析(Outlier Analysis)與數(shù)據(jù)的一般行為或模式不一致。多數(shù)為噪聲或異常數(shù)據(jù),常被剔除。在某些應(yīng)用中,孤立點(diǎn)數(shù)據(jù)更有趣,如:銀行詐騙,洗黑錢、恐怖行為。有專門進(jìn)行孤立點(diǎn)研究的方法與技術(shù)。統(tǒng)計(jì)方法是占主流,考察數(shù)據(jù)的分布,用距離來度量。2022/8/817Data Mining: Concepts and Techniques1.4數(shù)據(jù)挖掘模型 為了使數(shù)據(jù)挖掘技術(shù)在產(chǎn)業(yè)界得到更好的應(yīng)用,歐洲委員會(huì)聯(lián)合一些數(shù)據(jù)挖掘軟件廠商開發(fā)了CRISP-DM(Cr
13、oss Industry Standard Process for Data Mining)模型,目的是把數(shù)據(jù)挖掘的過程標(biāo)準(zhǔn)化, 使數(shù)據(jù)挖掘項(xiàng)目的實(shí)施速度更快、成本更低、更可靠并且更容易管理。 CRISP-DM模型最先在1996年被提出,當(dāng)前的白皮書版本是1.0。2022/8/818Data Mining: Concepts and TechniquesCRISP-DM(Cross Industry Standard Process for Data Mining)模型2022/8/819Data Mining: Concepts and Techniques1.4數(shù)據(jù)挖掘模型 CRISP-D
14、M模型中,數(shù)據(jù)挖掘包括六個(gè)步驟: 1.業(yè)務(wù)理解(Business Understanding)階段 具體地,包括: 確定業(yè)務(wù)目標(biāo) 項(xiàng)目可行性分析確定數(shù)據(jù)挖掘目標(biāo) 提出初步的項(xiàng)目計(jì)劃2022/8/820Data Mining: Concepts and Techniques1.4數(shù)據(jù)挖掘模型確定業(yè)務(wù)目標(biāo):分析項(xiàng)目的背景,從業(yè)務(wù)視點(diǎn)分析項(xiàng)目的目標(biāo)和需求,確定業(yè)務(wù)角度的成功標(biāo)準(zhǔn);項(xiàng)目可行性分析:分析擁有的資源,條件和限制,風(fēng)險(xiǎn)估計(jì),成本和效益估計(jì);確定數(shù)據(jù)挖掘目標(biāo):明確確定數(shù)據(jù)挖掘的目標(biāo)和成功標(biāo)準(zhǔn),數(shù)據(jù)挖掘的目標(biāo)和業(yè)務(wù)目標(biāo)是不一樣的,前者指技術(shù)上的,例如生成一棵決策樹等;提出項(xiàng)目計(jì)劃:對(duì)整個(gè)項(xiàng)目做一
15、個(gè)計(jì)劃,初步估計(jì)用到的工具和技術(shù)。 2022/8/821Data Mining: Concepts and Techniques1.4數(shù)據(jù)挖掘模型 2數(shù)據(jù)理解(Data Understanding)階段 具體地,包括:收集原始數(shù)據(jù):收集本項(xiàng)目所涉及到的數(shù)據(jù),如有必要,把數(shù)據(jù)裝入數(shù)據(jù)處理工具,并作一些初步的數(shù)據(jù)集成的工作,生成相應(yīng)報(bào)告;描述數(shù)據(jù):對(duì)數(shù)據(jù)做一些大致的描述,例如記錄數(shù)、屬性數(shù)等,給出相應(yīng)報(bào)告;探索數(shù)據(jù):對(duì)數(shù)據(jù)做簡單的統(tǒng)計(jì)分析,例如關(guān)鍵屬性的分布等;檢查數(shù)據(jù)質(zhì)量:包括數(shù)據(jù)是否完整、數(shù)據(jù)是否有錯(cuò)、是否有缺失值等問題。 2022/8/822Data Mining: Concepts and
16、 Techniques1.4數(shù)據(jù)挖掘模型3數(shù)據(jù)準(zhǔn)備(Data Preparation)階段 具體地,包括:數(shù)據(jù)選擇:根據(jù)數(shù)據(jù)挖掘目標(biāo)和數(shù)據(jù)質(zhì)量選擇合適的數(shù)據(jù),包括表的選擇、記錄選擇和屬性選擇;數(shù)據(jù)清潔:提高選擇好的數(shù)據(jù)的質(zhì)量,例如去除噪音,估計(jì)缺失值等;數(shù)據(jù)創(chuàng)建:在原有數(shù)據(jù)的基礎(chǔ)上是生成新的屬性或記錄;2022/8/823Data Mining: Concepts and Techniques1.4數(shù)據(jù)挖掘模型數(shù)據(jù)合并:利用表連接等方式將幾個(gè)數(shù)據(jù)集合并在一起;數(shù)據(jù)格式化:把數(shù)據(jù)轉(zhuǎn)換成適合數(shù)據(jù)挖掘處理的格式。2022/8/824Data Mining: Concepts and Techniqu
17、es1.4數(shù)據(jù)挖掘模型4建立模型(Modeling)階段 具體地,包括:選擇建模技術(shù):確定數(shù)據(jù)挖掘算法和參數(shù),可能會(huì)利用多個(gè)算法;測試方案設(shè)計(jì):設(shè)計(jì)某種測試模型的質(zhì)量和有效性的機(jī)制;模型訓(xùn)練:在準(zhǔn)備好的數(shù)據(jù)集上運(yùn)行數(shù)據(jù)挖掘算法,得出一個(gè)或者多個(gè)模型;模型測試評(píng)估:根據(jù)測試方案進(jìn)行測試,從數(shù)據(jù)挖掘技術(shù)的角度確定數(shù)據(jù)挖掘目標(biāo)是否成功。 2022/8/825Data Mining: Concepts and Techniques1.4數(shù)據(jù)挖掘模型5模型評(píng)估(Evaluation)階段 具體地,包括:結(jié)果評(píng)估:從商業(yè)角度評(píng)估得到的模型,甚至實(shí)際試用該模型測試其效果;過程回顧:回顧項(xiàng)目的所有流程,確定每
18、一個(gè)階段都沒有失誤;確定下一步工作:根據(jù)結(jié)果評(píng)估和過程回顧得出的結(jié)論,確定是部署該挖掘模型還是從某個(gè)階段開始重新開始。 2022/8/826Data Mining: Concepts and Techniques1.4數(shù)據(jù)挖掘模型6部署(Deployment)階段 具體地,包括:部署計(jì)劃:對(duì)在業(yè)務(wù)運(yùn)作中部署模型作出計(jì)劃;監(jiān)控和維護(hù)計(jì)劃:如何監(jiān)控模型在實(shí)際業(yè)務(wù)中的使用情況,如何維護(hù)該模型;作出最終報(bào)告:項(xiàng)目總結(jié),項(xiàng)目經(jīng)驗(yàn)和項(xiàng)目結(jié)果;項(xiàng)目回顧:回顧項(xiàng)目的實(shí)施過程,總結(jié)經(jīng)驗(yàn)教訓(xùn);對(duì)數(shù)據(jù)挖掘的運(yùn)行效果做一個(gè)預(yù)測。 2022/8/827Data Mining: Concepts and Techniqu
19、es1.4數(shù)據(jù)挖掘模型 為保證項(xiàng)目的可靠性和可管理性,CRISP-DM規(guī)定一個(gè)數(shù)據(jù)挖掘項(xiàng)目應(yīng)該產(chǎn)生11個(gè)報(bào)告: 業(yè)務(wù)理解報(bào)告 原始數(shù)據(jù)收集報(bào)告 數(shù)據(jù)描述報(bào)告 數(shù)據(jù)探索報(bào)告 數(shù)據(jù)質(zhì)量報(bào)告 數(shù)據(jù)集描述報(bào)告 模型訓(xùn)練報(bào)告 模型評(píng)估報(bào)告 部署計(jì)劃 監(jiān)控和維護(hù)計(jì)劃 總結(jié)報(bào)告 通過這些報(bào)告,可以有效地控制數(shù)據(jù)挖掘項(xiàng)目進(jìn)程,減少開發(fā)風(fēng)險(xiǎn)。 2022/8/828Data Mining: Concepts and Techniques1.5 實(shí)現(xiàn)流程 各步驟之間互相影響、反復(fù)調(diào)整,形成一種螺旋式上升過程。2022/8/829Data Mining: Concepts and Techniques1.5 實(shí)現(xiàn)流程
20、數(shù)據(jù)準(zhǔn)備 KDD的處理對(duì)象是大量的數(shù)據(jù),這些數(shù)據(jù)一般存儲(chǔ)在數(shù)據(jù)庫系統(tǒng)中,是長期積累的結(jié)果。但往往不合適直接在這些數(shù)據(jù)上進(jìn)行知識(shí)挖掘,需要做一些準(zhǔn)備工作,也就數(shù)據(jù)的預(yù)處理。數(shù)據(jù)預(yù)處理包括數(shù)據(jù)的選擇(選擇相關(guān)數(shù)據(jù))、凈化(消除噪音、冗余數(shù)據(jù))、推測(推算缺值數(shù)據(jù))、轉(zhuǎn)換(離散型數(shù)據(jù)與連續(xù)型數(shù)據(jù)之間的轉(zhuǎn)換)、數(shù)據(jù)縮減(減少數(shù)據(jù)量)等。 數(shù)據(jù)準(zhǔn)備是KDD的第一個(gè)步驟,也是比較重要的一個(gè)步驟。數(shù)據(jù)準(zhǔn)備得好壞將直接影響數(shù)據(jù)挖掘的效率和準(zhǔn)確度以及最終模式的有效性。 2022/8/830Data Mining: Concepts and Techniques1.5 實(shí)現(xiàn)流程數(shù)據(jù)挖掘 數(shù)據(jù)挖掘是最為關(guān)鍵的步驟,
21、它根據(jù)KDD的目標(biāo),選取相應(yīng)算法的參數(shù),分析數(shù)據(jù),得到可能形成知識(shí)的模式模型。目前采用較多的技術(shù)有決策樹、分類、聚類、粗糙集、關(guān)聯(lián)規(guī)則、神經(jīng)網(wǎng)絡(luò)、遺傳算法等。 2022/8/831Data Mining: Concepts and Techniques1.5 實(shí)現(xiàn)流程模式的評(píng)估、解釋 通過上面步驟所得到的模式,有可能是沒有意義或沒有實(shí)用價(jià)值的,因此需要評(píng)估,確定那些是有效的、有用的模式。此外,大部分模式是用數(shù)學(xué)手段描述的表達(dá)式,很難被人理解,還需要將其解釋成可理解的方式以呈現(xiàn)給用戶。 2022/8/832Data Mining: Concepts and Techniques1.5 實(shí)現(xiàn)流程知
22、識(shí)運(yùn)用 發(fā)現(xiàn)知識(shí)是為了運(yùn)用,如何使知識(shí)能被運(yùn)用也是KDD的步驟之一。運(yùn)用知識(shí)有兩種方法:一種是只需看知識(shí)本身所描述的關(guān)系或結(jié)果,就可以對(duì)決策提供支持;另一種是要求對(duì)新的數(shù)據(jù)運(yùn)用知識(shí),由此可能產(chǎn)生新的問題,而需要對(duì)知識(shí)做進(jìn)一步的優(yōu)化。 KDD過程可能需要多次的循環(huán)反復(fù),每一個(gè)步驟一旦與預(yù)期目標(biāo)不符,都要回到前面的步驟,重新調(diào)整,重新執(zhí)行。2022/8/833Data Mining: Concepts and Techniques1.5 實(shí)現(xiàn)流程 數(shù)據(jù)挖掘過程的分步實(shí)現(xiàn),不同的步驟需要不同的專業(yè)人員參與完成,大體分為三類:1)業(yè)務(wù)分析人員:要求精通業(yè)務(wù),能夠解釋業(yè)務(wù)對(duì)象,并根據(jù)各業(yè)務(wù)對(duì)象確定出用于
23、數(shù)據(jù)定義和挖掘算法的業(yè)務(wù)需求。2)數(shù)據(jù)分析人員:精通數(shù)據(jù)分析技術(shù),并對(duì)統(tǒng)計(jì)學(xué)有較熟練的掌握,有能力把業(yè)務(wù)需求轉(zhuǎn)化為數(shù)據(jù)挖掘的各步操作,并為每步操作選擇合適的技術(shù)。3)數(shù)據(jù)管理人員:精通數(shù)據(jù)管理技術(shù),并從數(shù)據(jù)庫或數(shù)據(jù)倉庫中收集數(shù)據(jù)。2022/8/834Data Mining: Concepts and Techniques1.5 實(shí)現(xiàn)流程Increasing potentialto supportbusiness decisionsEnd UserBusiness Analyst DataAnalystDBADecision MakingData PresentationVisualizatio
24、n TechniquesData MiningInformation DiscoveryData ExplorationStatistical Summary, Querying, and ReportingData Preprocessing/Integration, Data WarehousesData SourcesPaper, Files, Web documents, Scientific experiments, Database Systems2022/8/835Data Mining: Concepts and Techniques1.5 實(shí)現(xiàn)流程 從上可見,數(shù)據(jù)挖掘是一個(gè)多
25、領(lǐng)域技術(shù)人員合作的過程,也是一個(gè)在資金上和技術(shù)上高投入的過程。這一過程要反復(fù)進(jìn)行,在反復(fù)過程中,不斷地趨近事物的本質(zhì),不斷地優(yōu)先問題的解決方案。 2022/8/836Data Mining: Concepts and Techniques1.6 數(shù)據(jù)挖掘的應(yīng)用金融領(lǐng)域營銷領(lǐng)域電子政務(wù)電信領(lǐng)域工業(yè)生產(chǎn)生物和醫(yī)學(xué)2022/8/837Data Mining: Concepts and Techniques1.6 數(shù)據(jù)挖掘的應(yīng)用Debt$40KQQQQII123456factor 1factor 2factor n神經(jīng)網(wǎng)絡(luò) Neural Networks聚類分析 ClusteringOpenAccnt
26、Add NewProductDecreaseUsage?Time序列分析 Sequence Analysis決策樹 Decision Trees 傾向性分析 客戶保留 客戶生命周期管理 目標(biāo)市場 價(jià)格彈性分析 客戶細(xì)分 市場細(xì)分 傾向性分析 客戶保留 目標(biāo)市場 欺詐檢測關(guān)聯(lián)分析 Association 市場組合分析 套裝產(chǎn)品分析 目錄設(shè)計(jì) 交叉銷售2022/8/838Data Mining: Concepts and Techniques1.6 數(shù)據(jù)挖掘的應(yīng)用-金融信用卡分析業(yè)務(wù)模型客戶信用等級(jí)評(píng)估客戶透支分析客戶利潤分析客戶消費(fèi)行為分析 客戶消費(fèi)異常行為分析2022/8/839Data Mi
27、ning: Concepts and Techniques1.6 數(shù)據(jù)挖掘的應(yīng)用-金融數(shù)據(jù)挖掘在反洗錢系統(tǒng)中的應(yīng)用2022/8/840Data Mining: Concepts and Techniques1.6 數(shù)據(jù)挖掘的應(yīng)用-營銷關(guān)聯(lián)分析-市場籃子分析,用于了解顧客的購買習(xí)慣和偏好,有助于決定市場商品的擺放和產(chǎn)品的捆綁銷售策略;序列模式與市場籃子分析相似,不過是用某時(shí)間點(diǎn)發(fā)現(xiàn)的產(chǎn)品購買或其他行為模式來預(yù)測將來購買產(chǎn)品或服務(wù)類別的概率;聚類用于市場細(xì)分,將顧客按其行為或特征模式的相似性劃分為若干細(xì)分市場,以采取有針對(duì)性的營銷策略;分類用于預(yù)測哪些人會(huì)對(duì)郵寄廣告和產(chǎn)品目錄、贈(zèng)券等促銷手段有反應(yīng)
28、,還可用于顧客定級(jí)、破產(chǎn)預(yù)測等。 2022/8/841Data Mining: Concepts and Techniques1.6 數(shù)據(jù)挖掘的應(yīng)用-營銷數(shù)據(jù)挖掘在營銷中的應(yīng)用流程2022/8/842Data Mining: Concepts and Techniques1.6 數(shù)據(jù)挖掘的應(yīng)用-營銷應(yīng)用實(shí)例1:美國運(yùn)通公司(American Express)有一個(gè)用于記錄信用卡業(yè)務(wù)的數(shù)據(jù)庫,通過對(duì)這些數(shù)據(jù)進(jìn)行挖掘,制定了“關(guān)聯(lián)結(jié)算(Relationship Billing)優(yōu)惠”的促銷策略,即如果一個(gè)顧客在一個(gè)商店用運(yùn)通卡購買一套時(shí)裝,那么在同一個(gè)商店再買一雙鞋,就可以得到比較大的折扣,既增加了商店的銷售量,也可以增加運(yùn)通卡在該商店的使用率。2022/8/843Data Mining: Concepts and Techniques1.6 數(shù)據(jù)挖掘的應(yīng)用-營銷應(yīng)用實(shí)例2:美國的讀者文摘(Reader s Digest)出版公司運(yùn)行著一個(gè)積累了40年的業(yè)務(wù)數(shù)據(jù)庫,其中容納有遍布全球的一億多個(gè)訂戶的資料,并保證數(shù)據(jù)不斷得到實(shí)時(shí)的更新,基于對(duì)客戶資料數(shù)據(jù)庫進(jìn)行數(shù)據(jù)挖掘的優(yōu)勢,使讀者文摘出版公司能夠從通俗雜
溫馨提示
- 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請(qǐng)下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請(qǐng)聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
- 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會(huì)有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
- 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
- 5. 人人文庫網(wǎng)僅提供信息存儲(chǔ)空間,僅對(duì)用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對(duì)用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對(duì)任何下載內(nèi)容負(fù)責(zé)。
- 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請(qǐng)與我們聯(lián)系,我們立即糾正。
- 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶因使用這些下載資源對(duì)自己和他人造成任何形式的傷害或損失。
最新文檔
- 加盟連鎖項(xiàng)目服務(wù)合同范本
- 農(nóng)村小區(qū)搬遷合同范本
- 中學(xué)食堂承包團(tuán)隊(duì)合同范本
- 人力股分紅合同范例
- 個(gè)人技術(shù)投資合同范本
- 制造模具合同范本
- 中建施工員合同范本
- 中藥原料采購合同范本
- 不需交社保員工合同范本
- 傳媒公司培訓(xùn)合同范例
- 機(jī)械設(shè)計(jì)傳送帶設(shè)計(jì)
- 圖解國家數(shù)據(jù)局《“數(shù)據(jù)要素×”三年行動(dòng)計(jì)劃(2024-2026 年)(征求意見稿)》
- 老年人預(yù)防跌倒健康宣教
- 7S管理檢查表文檔
- 《SolidWorks建模實(shí)例教程》第3章 基礎(chǔ)特征及實(shí)例
- APQP新產(chǎn)品開發(fā)計(jì)劃ABCD表
- SAP-QM質(zhì)量管理模塊前臺(tái)操作詳解(S4系統(tǒng))
- 初中學(xué)生數(shù)學(xué)學(xué)習(xí)狀況問卷調(diào)查及分析報(bào)告
- 印刷服務(wù)投標(biāo)方案(技術(shù)方案)
- 馬克思主義與傳統(tǒng)文化的契合
- 煙草招聘報(bào)名表填寫范本
評(píng)論
0/150
提交評(píng)論