




版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請(qǐng)進(jìn)行舉報(bào)或認(rèn)領(lǐng)
文檔簡(jiǎn)介
數(shù)據(jù)挖掘項(xiàng)目實(shí)施中的關(guān)鍵環(huán)節(jié)
深圳華策輝弘科技有限公司
專業(yè)服務(wù)部
2007–12-131公司介紹華策輝弘科技有限公司致力于商業(yè)數(shù)據(jù)分析的咨詢服務(wù),由具備豐富的國(guó)際、國(guó)內(nèi)項(xiàng)目經(jīng)驗(yàn)的國(guó)內(nèi)外資深專家創(chuàng)辦。公司有一支業(yè)界不多見的高水準(zhǔn)咨詢服務(wù)專業(yè)團(tuán)隊(duì),項(xiàng)目的經(jīng)驗(yàn)覆蓋亞洲太平洋地區(qū)包括中國(guó)、澳洲、香港、泰國(guó)、馬來西亞等地的金融業(yè)、電訊業(yè)以及零售業(yè),為這些不同國(guó)家和不同行業(yè)的客戶提供商業(yè)信息及分析性解決方案。2公司介紹華策輝弘科技有限公司歷史
1997–2002,共同創(chuàng)始人Eric工作于SAS中國(guó),Dick工作于SAS香港
2002–2004,獨(dú)立進(jìn)行咨詢顧問工作 2004–2006,Eric在北京創(chuàng)建了華策未來,Dick在香港創(chuàng)建了萬訊奧義 2006–至今,在深圳合并,成立了華策輝弘業(yè)務(wù)范圍
關(guān)于決策支持系統(tǒng)/客戶關(guān)系管理/數(shù)據(jù)挖掘/信用評(píng)分/分析的咨詢項(xiàng)目,其主要客戶是金融業(yè)和通訊行業(yè)基于SAS工具的數(shù)據(jù)處理和分析的開發(fā)服務(wù)提供針對(duì)SAS編程人員/分析師/設(shè)計(jì)師的培訓(xùn)3團(tuán)隊(duì)成員核心團(tuán)隊(duì)成員大都擁有超過八年以上有關(guān)各項(xiàng)服務(wù)的經(jīng)驗(yàn)﹐同時(shí)具備應(yīng)用SAS軟件八年以上的經(jīng)驗(yàn)﹐在銀行業(yè)、電訊業(yè)與保險(xiǎn)業(yè)也有豐富的行業(yè)經(jīng)驗(yàn),所擔(dān)任的角色分別從市場(chǎng)分析及報(bào)告到風(fēng)險(xiǎn)評(píng)估及管理。團(tuán)隊(duì)成員曾經(jīng)奪得第二屆國(guó)際智能數(shù)據(jù)分析比賽冠軍。專家團(tuán)隊(duì)中有來自英國(guó)皇家統(tǒng)計(jì)學(xué)會(huì)的注冊(cè)統(tǒng)計(jì)師。4團(tuán)隊(duì)成員在亞太地區(qū)及澳大利亞的各行業(yè)中的經(jīng)驗(yàn)銀行業(yè)中國(guó)工商銀行中國(guó)招商銀行中國(guó)建設(shè)銀行中國(guó)交通銀行中國(guó)中信銀行中國(guó)國(guó)家開發(fā)銀行中國(guó)廣東發(fā)展銀行中國(guó)人民銀行中國(guó)平安保險(xiǎn)中國(guó)證監(jiān)會(huì)日本JCB澳洲國(guó)民銀行澳洲Westpac銀行香港上海匯豐銀行渣打銀行美國(guó)大通信用卡大新銀行中國(guó)銀行信用卡(國(guó)際)有限公司海外信托銀行有限公司永享銀行香港星展銀行亞洲聯(lián)合財(cái)務(wù)有限公司泰國(guó)Ayudhya銀行泰國(guó)SiamCity銀行5電訊行業(yè)中國(guó)移動(dòng)有限公司中國(guó)聯(lián)通有限公司澳洲Optus電訊有限公司香港電訊(PCCW)有限公司香港和記黃埔有限公司香港和記環(huán)球電訊有限公司香港數(shù)碼通移動(dòng)通訊有限公司泰國(guó)電訊有限公司泰國(guó)AIS電訊有限公司馬來西亞Maxis電訊有限公司團(tuán)隊(duì)成員在亞太地區(qū)及澳大利亞的各行業(yè)中的經(jīng)驗(yàn)6團(tuán)隊(duì)成員在亞太地區(qū)及澳大利亞的各行業(yè)中的經(jīng)驗(yàn)保險(xiǎn)業(yè)澳洲MBF保險(xiǎn),澳洲蘇黎世保險(xiǎn)
零售業(yè)百佳超級(jí)市場(chǎng),加德士澳洲有限公司政府部門香港特別行政區(qū)統(tǒng)計(jì)處,香港貿(mào)易發(fā)展局中國(guó)海關(guān)總署半導(dǎo)體業(yè)摩托羅拉,英特爾媒體調(diào)研行業(yè)蓋洛普(中國(guó))有限公司北京電視臺(tái)特雷森信息中心7公司介紹華策輝弘科技有限公司更多信息:
請(qǐng)?jiān)L問公司網(wǎng)站
或者與我們聯(lián)系:+86755333611838數(shù)據(jù)挖掘概述數(shù)據(jù)挖掘?qū)嵤┓椒ㄕ摂?shù)據(jù)挖掘項(xiàng)目實(shí)施流程專題1:業(yè)務(wù)目標(biāo)選定專題2:數(shù)據(jù)挖掘項(xiàng)目評(píng)估方法專題3:數(shù)據(jù)挖掘項(xiàng)目管理專題4:數(shù)據(jù)挖掘項(xiàng)目實(shí)施中的重要規(guī)范主題9美國(guó)聯(lián)邦調(diào)查局(FBI)對(duì)地區(qū)調(diào)查員提交的大量報(bào)告進(jìn)行審查,尋找和爆炸事件的聯(lián)系。.使用鏈路分析,聚類和規(guī)則歸納等分析方法來識(shí)別可能的線索?,F(xiàn)實(shí)世界中的數(shù)據(jù)挖掘可以用來干什么?
——搜索制造爆炸的恐怖分子數(shù)據(jù)挖掘概述10現(xiàn)實(shí)世界中的數(shù)據(jù)挖掘可以用來干什么?
——誰會(huì)同意擴(kuò)大軍費(fèi)開支?美國(guó)國(guó)會(huì)對(duì)擴(kuò)大軍費(fèi)開支進(jìn)行投票。普遍認(rèn)為有軍隊(duì)服役背景的議員會(huì)投贊成票,真實(shí)情況是這樣的嗎?數(shù)據(jù)挖掘概述11就象解謎語一樣,數(shù)據(jù)挖掘從大量復(fù)雜的數(shù)據(jù)中發(fā)現(xiàn)直接有效的信息和知識(shí).面對(duì)成千上萬的客戶,
如何滿足您最好的客戶?
如何把損失降到最低?
如何更有效地分配資源?客戶洞察DATADATADATADATADATADATADATADATADATADATADATADATADATADATA答案是:數(shù)據(jù)挖掘數(shù)據(jù)挖掘概述12數(shù)據(jù)分析的最初
數(shù)據(jù)分析能力受到計(jì)算能力和存儲(chǔ)能力的限制.1959年,IBM大型機(jī)7090,0.5MHz處理器0.2MB內(nèi)存!一個(gè)600行,4列的數(shù)據(jù)集需要約3000張打孔卡片!分析時(shí),一次同時(shí)考慮的變量最多達(dá)到25個(gè)!數(shù)據(jù)挖掘概述13促進(jìn)數(shù)據(jù)挖掘發(fā)展的要素?cái)?shù)據(jù)
——大量的,運(yùn)營(yíng)型數(shù)據(jù)用戶和需求——業(yè)務(wù)決策支持的需求技術(shù)和方法——計(jì)算能力的飛速發(fā)展
——多學(xué)科領(lǐng)域研究的發(fā)展數(shù)據(jù)挖掘概述14數(shù)據(jù)試驗(yàn)性的
運(yùn)營(yíng)性的用途 研究 運(yùn)營(yíng)價(jià)值 科學(xué) 商業(yè)產(chǎn)生 主動(dòng)控制 被動(dòng)記錄數(shù)據(jù)量 小
大質(zhì)量 清潔 骯臟狀態(tài) 靜態(tài) 動(dòng)態(tài)數(shù)據(jù)挖掘概述15數(shù)據(jù)洪水已經(jīng)來臨:大量的數(shù)據(jù)在產(chǎn)生:金融、電信以及其它行業(yè)的交易數(shù)據(jù)科學(xué)實(shí)驗(yàn)數(shù)據(jù):天文、空間探索、生物及高能物理等Web數(shù)據(jù):文字、圖像及其它多媒體格式數(shù)據(jù)挖掘概述16擁有16個(gè)望遠(yuǎn)鏡的歐洲長(zhǎng)基線干擾儀在25天的觀察期中每秒鐘產(chǎn)生1G數(shù)據(jù)2003年,法國(guó)電信的呼叫數(shù)據(jù)為30TB,AT&T以26TB的數(shù)據(jù)量位居第二,如此多的呼叫數(shù)據(jù)以致于AT&T無法全部保存,對(duì)數(shù)據(jù)的分析也只能是“粗略”的Google,40億以上的頁面(2004年4月統(tǒng)計(jì)),數(shù)據(jù)量為nTB據(jù)加州大學(xué)伯克利分校的研究人員統(tǒng)計(jì),2002年新產(chǎn)生數(shù)據(jù)為1999年的2倍,而且數(shù)據(jù)的膨脹在不斷加速“天文”數(shù)據(jù)量:
數(shù)據(jù)挖掘概述17用戶和需求:
對(duì)于復(fù)雜現(xiàn)象的簡(jiǎn)單結(jié)論市場(chǎng)–誰將會(huì)購(gòu)買這個(gè)產(chǎn)品?預(yù)測(cè)–我們將面臨何種需求?忠誠(chéng)度–誰最有可能流失?信用-哪一類人群不還款的傾向嚴(yán)重?欺詐-什么時(shí)候會(huì)發(fā)生?數(shù)據(jù)挖掘概述18用戶和需求通用
客戶分群
客戶獲取/保留
數(shù)據(jù)庫(kù)營(yíng)銷
客戶生命期價(jià)值
交叉銷售銀行
信用記分
信用卡欺詐發(fā)現(xiàn)
產(chǎn)品組合分析
現(xiàn)金計(jì)劃保險(xiǎn)&醫(yī)療保健
理賠分析
欺詐行為電信
呼叫行為分析
流失管理
欺詐發(fā)現(xiàn)零售/市場(chǎng)
菜籃子分析
目錄管理
信用記分制造/公用事業(yè)
流程管理 質(zhì)量控制
需求模式
資源計(jì)劃
倉(cāng)儲(chǔ)計(jì)劃數(shù)據(jù)挖掘概述19數(shù)據(jù)挖掘概述技術(shù)和方法——計(jì)算能力的飛速發(fā)展Since1963Moore’sLaw:Theinformationdensityonsiliconintegratedcircuitsdoublesevery18to24months.Parkinson’sLaw:Workexpandstofillthetimeavailableforitscompletion.20技術(shù)和方法——多學(xué)科領(lǐng)域研究的發(fā)展廣泛的商業(yè)需求,需要出現(xiàn)一種挖掘數(shù)據(jù)背后隱藏的知識(shí)的手段。1989年8月在美國(guó)底特律召開的第11屆國(guó)際人工智能聯(lián)合會(huì)議的專題討論會(huì)上首次出現(xiàn)知識(shí)發(fā)現(xiàn)(KDD)這個(gè)術(shù)語,數(shù)據(jù)挖掘(DM)是知識(shí)發(fā)現(xiàn)(KDD)中的一個(gè)特定步驟和核心技術(shù)數(shù)據(jù)挖掘的研究重點(diǎn)逐漸從發(fā)現(xiàn)方法轉(zhuǎn)向系統(tǒng)應(yīng)用,注重多種發(fā)現(xiàn)策略和技術(shù)的集成,以及多種學(xué)科之間的相互滲透,現(xiàn)在已經(jīng)成為一個(gè)自成體系的應(yīng)用學(xué)科。數(shù)據(jù)挖掘概述神經(jīng)計(jì)算數(shù)據(jù)庫(kù)知識(shí)發(fā)現(xiàn)數(shù)據(jù)挖掘統(tǒng)計(jì)學(xué)模式識(shí)別機(jī)器學(xué)習(xí)人工智能21什么是數(shù)據(jù)挖掘?定義: 從海量的數(shù)據(jù)庫(kù)中選擇、探索、識(shí)別出有效的、新穎的、具有潛在效用的乃至最終可理解的模式以獲取商業(yè)利益的非平凡的過程
-Fayyad,Piatetsky
Shapiror1996特征:處理海量的數(shù)據(jù);揭示企業(yè)運(yùn)作中的內(nèi)在規(guī)律;為企業(yè)運(yùn)作提供直接決策分析,并為企業(yè)帶來巨大經(jīng)濟(jì)效益。數(shù)據(jù)挖掘概述22商業(yè)智能(BI)技術(shù)傳統(tǒng)的商業(yè)智能技術(shù)不能發(fā)現(xiàn)復(fù)雜的關(guān)系,也不能創(chuàng)建商業(yè)領(lǐng)域所需要的預(yù)測(cè)模型Ad-hocSQLEIS/DSS統(tǒng)計(jì)OLAP數(shù)據(jù)挖掘用戶直接發(fā)現(xiàn)自動(dòng)發(fā)現(xiàn)查詢復(fù)雜性(e.g.維度個(gè)數(shù))過去發(fā)生了什么?為什么會(huì)發(fā)生?未來會(huì)發(fā)生什么?希望未來發(fā)生什么?數(shù)據(jù)挖掘概述23預(yù)測(cè)的基本原理預(yù)測(cè)問題用于預(yù)測(cè)的歷史數(shù)據(jù)進(jìn)行預(yù)測(cè)分析的工具和方法數(shù)據(jù)挖掘概述24數(shù)據(jù)挖掘——學(xué)習(xí)知識(shí)的過程歷史數(shù)據(jù)學(xué)習(xí)過程(建模)模型輸出新數(shù)據(jù)模型輸出結(jié)果建模學(xué)習(xí)階段應(yīng)用實(shí)施階段數(shù)據(jù)挖掘概述25數(shù)據(jù)挖掘不是萬能的數(shù)據(jù)挖掘通過構(gòu)建模型發(fā)現(xiàn)特征模式和關(guān)系.模型,就象地圖,是事實(shí)的抽象表示.?dāng)?shù)據(jù)挖掘只是一個(gè)工具,不是一個(gè)萬能魔杖數(shù)據(jù)挖掘不能替代業(yè)務(wù)分析人員或者經(jīng)理們的角色,但是數(shù)據(jù)挖掘能為他們提供更有力的新工具以改善他們的工作數(shù)據(jù)挖掘既是一門藝術(shù)又是一門科學(xué)數(shù)據(jù)挖掘概述26數(shù)據(jù)挖掘概述數(shù)據(jù)挖掘?qū)嵤┓椒ㄕ摂?shù)據(jù)挖掘項(xiàng)目實(shí)施流程專題1:業(yè)務(wù)目標(biāo)選定專題2:數(shù)據(jù)挖掘項(xiàng)目評(píng)估方法專題3:數(shù)據(jù)挖掘項(xiàng)目管理專題4:數(shù)據(jù)挖掘項(xiàng)目實(shí)施中的重要規(guī)范主題27我們的日常生活工作離不開分析:
數(shù)據(jù)挖掘與一般的分析活動(dòng)的重要區(qū)別:數(shù)據(jù)挖掘是在有方法論指導(dǎo)的項(xiàng)目實(shí)踐中積累和推廣的數(shù)據(jù)挖掘?qū)嵤┓椒ㄕ撟鍪裁??怎么做?做!做完以后怎么樣?8以SPSS,NCR等公司為代表的CRISP-DM方法論CRISP-DM是跨行業(yè)數(shù)據(jù)挖掘標(biāo)準(zhǔn)流程(Cross-IndustryStandardProcessforDataMining)的縮寫強(qiáng)調(diào)以業(yè)務(wù)理解(Businessunderstanding)、數(shù)據(jù)理解(Dataunderstanding)、數(shù)據(jù)準(zhǔn)備(Datapreparation)、建模(Modeling)、評(píng)價(jià)(Evaluation)、發(fā)布(Deployment)為核心環(huán)節(jié),將數(shù)據(jù)挖掘目標(biāo)和商務(wù)目標(biāo)有機(jī)地聯(lián)系在一起數(shù)據(jù)挖掘?qū)嵤┓椒ㄕ?9數(shù)據(jù)挖掘方法論–CRISP-DMCRISP-DM30數(shù)據(jù)挖掘方法論–SEMMA以SAS公司為代表的SEMMA方法論
SEMMA方法論以抽樣(Sample)、探索(Explore)、修改(Modify)、建模(Model)、評(píng)估(Assess)為核心環(huán)節(jié),強(qiáng)調(diào)數(shù)據(jù)挖掘過程是這5個(gè)環(huán)節(jié)的有機(jī)循環(huán)抽樣(Sample)當(dāng)進(jìn)行數(shù)據(jù)挖掘時(shí),首先要從企業(yè)大量數(shù)據(jù)中取出一個(gè)與你要探索問題相關(guān)的樣板數(shù)據(jù)子集,而不是動(dòng)用全部企業(yè)數(shù)據(jù)。這就像在對(duì)開采出來礦石首先要進(jìn)行選礦一樣。通過數(shù)據(jù)樣本的精選,不僅能減少數(shù)據(jù)處理量,節(jié)省系統(tǒng)資源,而且能通過數(shù)據(jù)的篩選,使你想要它反映的規(guī)律性更加凸現(xiàn)出來從巨大的企業(yè)數(shù)據(jù)母體中取出哪些數(shù)據(jù)作為樣本數(shù)據(jù)呢?這要依你所要達(dá)到的目標(biāo)來區(qū)分采用不同的辦法
31數(shù)據(jù)挖掘方法論–SEMMA以SAS公司為代表的SEMMA方法論探索(Explore)前面所敘述的數(shù)據(jù)取樣,多少是帶著人們對(duì)如何達(dá)到數(shù)據(jù)挖掘目的的先驗(yàn)的認(rèn)識(shí)進(jìn)行操作的。當(dāng)我們拿到了一個(gè)樣本數(shù)據(jù)集后,它是否達(dá)到我們?cè)瓉碓O(shè)想的要求;其中有沒有什么明顯的規(guī)律和趨勢(shì);有沒有出現(xiàn)你所從未設(shè)想過的數(shù)據(jù)狀態(tài);因素之間有什么相關(guān)性;它們可區(qū)分成怎樣一些類別……這都是要首先探索的內(nèi)容修改(Modify)通過上述兩個(gè)步驟的操作,你對(duì)數(shù)據(jù)的狀態(tài)和趨勢(shì)可能有了進(jìn)一步的了解。對(duì)你原來要解決的問題可能會(huì)有了進(jìn)一步的明確;這時(shí)要盡可能對(duì)問題解決的要求能進(jìn)一步的量化。問題越明確,越能進(jìn)一步量化,問題就向它的解決更前進(jìn)了一步。這是十分重要的。因?yàn)樵瓉淼膯栴}很可能是諸如質(zhì)量不好、生產(chǎn)率低等模糊的問題,沒有問題的進(jìn)一步明確,你簡(jiǎn)直就無法進(jìn)行有效的數(shù)據(jù)挖掘操作針對(duì)問題的需要可能要對(duì)數(shù)據(jù)進(jìn)行增刪;也可能按照你對(duì)整個(gè)數(shù)據(jù)挖掘過程的新認(rèn)識(shí),要組合或者生成一些新的變量,以體現(xiàn)對(duì)狀態(tài)的有效的描述32數(shù)據(jù)挖掘方法論–SEMMA以SAS公司為代表的SEMMA方法論建模(Model)這一步是數(shù)據(jù)挖掘工作的核心環(huán)節(jié)。按照SAS提出的SEMMA方法論走到這一步時(shí),你對(duì)應(yīng)采用的技術(shù)已有了較明確的方向;你的數(shù)據(jù)結(jié)構(gòu)和內(nèi)容也有了充分的適應(yīng)性。SAS在這時(shí)也向你提供了充分的可選擇的技術(shù)手段:回歸分析方法等廣泛的數(shù)理統(tǒng)計(jì)方法;關(guān)聯(lián)分析方法;分類及聚類分析方法;人工神經(jīng)元網(wǎng)絡(luò);決策樹……等。在你的數(shù)據(jù)挖掘中使用哪一種方法,用SAS軟件包中什么方法來實(shí)現(xiàn),這主要取決于你的數(shù)據(jù)集的特征和你要實(shí)現(xiàn)的目標(biāo)。實(shí)際上這種選擇也不一定是唯一的。好在SAS軟件運(yùn)行效率十分高,你不妨多試幾種方法,從實(shí)踐中選出最適合于你的方法。評(píng)估(Assess)從上述過程中將會(huì)得出一系列的分析結(jié)果、模式或模型。同一個(gè)數(shù)據(jù)源可以利用多種數(shù)據(jù)分析方法和模型進(jìn)行分析,ASSESS的目的之一就是從這些模型中自動(dòng)找出一個(gè)最好的模型出來,另外就是要對(duì)模型進(jìn)行針對(duì)業(yè)務(wù)的解釋和應(yīng)用。若能從模型中得出一個(gè)直接的結(jié)論當(dāng)然很好。但更多的時(shí)候會(huì)得出對(duì)目標(biāo)問題多側(cè)面的描述。這時(shí)就要能很好的綜合它們的影響規(guī)律性提供合理的決策支持信息。所謂合理,實(shí)際上往往是要你在所付出的代價(jià)和達(dá)到預(yù)期目標(biāo)的可靠性的平衡上做出選擇。
33數(shù)據(jù)挖掘方法論–SEMMA完整的SEMMA方法論與外圍環(huán)節(jié)問題定義數(shù)據(jù)有效化取樣探索修改建模評(píng)估數(shù)據(jù)挖掘周期回顧模型實(shí)施環(huán)境評(píng)估取樣探索修改建模評(píng)估數(shù)據(jù)挖掘周期核心外圍SAS公司的數(shù)據(jù)挖掘項(xiàng)目方法論:34 實(shí)際上這兩種方法論本身并不矛盾,CRISP-DM強(qiáng)調(diào)高層的商務(wù)目的實(shí)現(xiàn)過程,SEMMA強(qiáng)調(diào)具體的數(shù)據(jù)挖掘技術(shù)實(shí)現(xiàn)過程,實(shí)際上,很多的項(xiàng)目中,是將二者有機(jī)地結(jié)合起來運(yùn)用的 方法論的實(shí)踐,需要人力資源、技術(shù)和經(jīng)驗(yàn)三方面的配合數(shù)據(jù)挖掘?qū)嵤┓椒ㄕ?5數(shù)據(jù)挖掘概述數(shù)據(jù)挖掘?qū)嵤┓椒ㄕ摂?shù)據(jù)挖掘項(xiàng)目實(shí)施流程專題1:業(yè)務(wù)目標(biāo)選定專題2:數(shù)據(jù)挖掘項(xiàng)目評(píng)估方法專題3:數(shù)據(jù)挖掘項(xiàng)目管理專題4:數(shù)據(jù)挖掘項(xiàng)目實(shí)施中的重要規(guī)范主題36數(shù)據(jù)挖掘過程是多個(gè)步驟相互連接、反復(fù)交互的過程。具體包括:
定義問題準(zhǔn)備數(shù)據(jù)
建立模型應(yīng)用模型確定業(yè)務(wù)問題和目標(biāo)將問題和目標(biāo)轉(zhuǎn)換為合適的分析方法確定建模數(shù)據(jù)結(jié)構(gòu)和原始數(shù)據(jù)的需求獲取原始數(shù)據(jù)對(duì)原始數(shù)據(jù)進(jìn)行預(yù)處理,生成建模數(shù)據(jù)訓(xùn)練和調(diào)整模型評(píng)估模型并選擇最佳模型解釋模型應(yīng)用模型或發(fā)現(xiàn)的模式和知識(shí)監(jiān)控和評(píng)價(jià)模型的應(yīng)用效果數(shù)據(jù)挖掘項(xiàng)目實(shí)施流程37數(shù)據(jù)挖掘所需知識(shí)和技能
某個(gè)領(lǐng)域的業(yè)務(wù)知識(shí)(業(yè)務(wù)專家)
——理解業(yè)務(wù)問題的細(xì)節(jié)和特殊性,背景業(yè)務(wù)知識(shí),內(nèi)容含義,術(shù)語,知道對(duì)該業(yè)務(wù)問題的當(dāng)前處理方法和優(yōu)劣。
數(shù)據(jù)知識(shí)和處理能力(數(shù)據(jù)專家)
——理解數(shù)據(jù)的結(jié)構(gòu),格式,數(shù)據(jù)源的狀況,數(shù)據(jù)量的大小,有對(duì)數(shù)據(jù)操作的能力。
分析方法和技能(分析專家)
——理解和該業(yè)務(wù)問題相關(guān)的分析方法的特點(diǎn)和局限,有使用相關(guān)算法進(jìn)行數(shù)據(jù)分析和建模的能力。
這三種知識(shí)和技能根據(jù)實(shí)際情況可能會(huì)體現(xiàn)在1個(gè)人,2個(gè)人或3個(gè)人身上。數(shù)據(jù)挖掘項(xiàng)目實(shí)施流程38最關(guān)鍵的是理解業(yè)務(wù)和技術(shù)的綜合能力基本專業(yè)和技能業(yè)務(wù)知識(shí)數(shù)據(jù)知識(shí)分析技能人才類型業(yè)務(wù)專家數(shù)據(jù)專家分析專家 8010 10 1080 10 3030 40具有分析架構(gòu)設(shè)計(jì)能力的分析專家,是建立數(shù)據(jù)和業(yè)務(wù)之間的橋梁!數(shù)據(jù)挖掘項(xiàng)目實(shí)施流程39確定業(yè)務(wù)問題和目標(biāo)為什么重要?常見的誤區(qū):很多人以為不需要事先確定問題和目標(biāo),只要對(duì)數(shù)據(jù)使用數(shù)據(jù)挖掘技術(shù),然后再對(duì)分析挖掘后的結(jié)果進(jìn)行尋找和解釋,自然會(huì)找到一些以前我們不知道的,有用的規(guī)律和知識(shí),這就是所謂的數(shù)據(jù)挖掘能夠發(fā)掘隱藏在數(shù)據(jù)背后的金塊的神奇魔力?!狧erbEdelstein“如果你有上TB的數(shù)據(jù),而你只是依賴于數(shù)據(jù)挖掘自動(dòng)的去數(shù)據(jù)中尋找一些有趣的東西給你,那么,在沒有開始尋找之前,你已經(jīng)迷失了?!薄叭藗兇_實(shí)需要知道他們?cè)趯ふ沂裁?,并且知道一旦找到了所要找的東西,要做些什么。”
-Beck1997定義問題
準(zhǔn)備數(shù)據(jù)
建立模型應(yīng)用模型數(shù)據(jù)挖掘項(xiàng)目實(shí)施流程40確定業(yè)務(wù)問題和目標(biāo)如何做好?先請(qǐng)看幾個(gè)例子:了解我們的客戶挽留更多的客戶對(duì)數(shù)據(jù)庫(kù)進(jìn)行聚類使用神經(jīng)元網(wǎng)絡(luò)對(duì)客戶進(jìn)行細(xì)分,了解不同客戶群的特征和需求,以便有針對(duì)性的營(yíng)銷。預(yù)測(cè)客戶的流失傾向和特征,以便提前主動(dòng)進(jìn)行有針對(duì)性的挽留。定義太寬泛而不明確另一個(gè)極端:過于技術(shù)化關(guān)鍵:業(yè)務(wù)語言和技術(shù)語言的良好溝通,確定以提升業(yè)務(wù)價(jià)值為核心,與分析相關(guān)的可操作性強(qiáng)的明確目標(biāo)。不要忽視業(yè)務(wù)人員和分析人員任何一方的參與。定義問題
準(zhǔn)備數(shù)據(jù)
建立模型應(yīng)用模型數(shù)據(jù)挖掘項(xiàng)目實(shí)施流程41將問題和目標(biāo)轉(zhuǎn)換為合適的分析方法預(yù)測(cè)聚類關(guān)聯(lián)其他不同的分析方法是針對(duì)不同的特定問題的,不同的分析方法對(duì)數(shù)據(jù)的要求也不同。定義問題
準(zhǔn)備數(shù)據(jù)
建立模型應(yīng)用模型數(shù)據(jù)挖掘項(xiàng)目實(shí)施流程42流失預(yù)測(cè)案例——定義問題分析的方法客戶流失率高,每年30%客戶流失
每年流失損失2億
無法預(yù)知客戶流失傾向
無法主動(dòng)有效的挽留客戶預(yù)測(cè)客戶的流失傾向識(shí)別高流失傾向客戶的特征以便提前主動(dòng)進(jìn)行有針對(duì)性的挽留從而降低流失率,減少流失損失
用預(yù)測(cè)模型預(yù)測(cè)客戶流失的可能性
用預(yù)測(cè)模型得到影響流失的重要因素
用統(tǒng)計(jì)方法和描述變量得到高流失概率客戶的其他特征
輸出高流失概率客戶列表和特征描述
分析的目的業(yè)務(wù)問題起源示例定義問題
準(zhǔn)備數(shù)據(jù)
建立模型應(yīng)用模型數(shù)據(jù)挖掘項(xiàng)目實(shí)施流程43確定建模數(shù)據(jù)結(jié)構(gòu)和原始數(shù)據(jù)的需求數(shù)據(jù)中必須包含你想分析的內(nèi)容數(shù)據(jù)的定義要符合業(yè)務(wù)規(guī)則利用業(yè)務(wù)知識(shí)建立新的變量使用最新的數(shù)據(jù)數(shù)據(jù)的可獲取性定義問題
準(zhǔn)備數(shù)據(jù)
建立模型應(yīng)用模型數(shù)據(jù)挖掘項(xiàng)目實(shí)施流程44獲取原始數(shù)據(jù)ETL系統(tǒng)架構(gòu)和流程
——考慮效率和對(duì)源系統(tǒng)的影響數(shù)據(jù)的完整性和一致性
——對(duì)原始數(shù)據(jù)的真實(shí)體現(xiàn)數(shù)據(jù)的檢查和清理
——數(shù)據(jù)質(zhì)量的保證定義問題
準(zhǔn)備數(shù)據(jù)
建立模型應(yīng)用模型數(shù)據(jù)挖掘項(xiàng)目實(shí)施流程45數(shù)據(jù)預(yù)處理數(shù)據(jù)匯總數(shù)據(jù)轉(zhuǎn)置計(jì)算生成衍生變量或指標(biāo)其他變換目的:形成符合建模需要的格式的數(shù)據(jù)表Acct
CK
SVG
MMF
CD
LOC
MTG213311000126531100003544101111以客戶為中心:每個(gè)客戶一條記錄定義問題
準(zhǔn)備數(shù)據(jù)
建立模型應(yīng)用模型數(shù)據(jù)挖掘項(xiàng)目實(shí)施流程46流失預(yù)測(cè)案例——準(zhǔn)備數(shù)據(jù)流失定義:流失——拆機(jī)/報(bào)拆/雙停30天;未流失——活動(dòng)客戶排除客戶:在網(wǎng)時(shí)長(zhǎng)少于一年,在簽約期間的客戶用戶的欠費(fèi)次數(shù)–月份1到月份6每個(gè)種類的總呼叫次數(shù)–月份1到月份6平均呼叫持續(xù)時(shí)間,對(duì)應(yīng)各個(gè)呼叫種類(國(guó)際,本地,長(zhǎng)途等)--月份1到月份6在網(wǎng)時(shí)間平均呼叫次數(shù),對(duì)應(yīng)各個(gè)呼叫種類(國(guó)際,本地,長(zhǎng)途等)--月份1到月份6……當(dāng)前時(shí)點(diǎn)目標(biāo)窗口觀測(cè)窗口示例定義問題
準(zhǔn)備數(shù)據(jù)
建立模型應(yīng)用模型數(shù)據(jù)挖掘項(xiàng)目實(shí)施流程47流失預(yù)測(cè)案例——準(zhǔn)備數(shù)據(jù).............................................客戶
A.........
客戶
B
客戶
C
客戶
Z流失X1X7X8X9XnX5X6X3X4X2分局號(hào)
客戶號(hào)
通話時(shí)長(zhǎng)446121331604461224442446127732124461265325044612801122491135447865630249645856302635328622542442762254165759分局號(hào)
客戶號(hào)
通話時(shí)長(zhǎng)44612133?49113544?56302496?62254244?示例定義問題
準(zhǔn)備數(shù)據(jù)
建立模型應(yīng)用模型數(shù)據(jù)挖掘項(xiàng)目實(shí)施流程48訓(xùn)練和調(diào)整模型合理的數(shù)據(jù)采樣:使數(shù)據(jù)有代表性,分層采樣,順序采樣,處理小概率事件數(shù)據(jù)分隔:分為訓(xùn)練,確認(rèn),測(cè)試三個(gè)數(shù)據(jù)集,避免過擬合,確保模型的穩(wěn)定數(shù)據(jù)探索:了解數(shù)據(jù)分布模式,發(fā)現(xiàn)數(shù)據(jù)異常必要的數(shù)據(jù)變換:處理缺失值,異常值,改變數(shù)據(jù)分布形態(tài),數(shù)據(jù)分段,減少有效變量數(shù)量模型參數(shù)的調(diào)整和優(yōu)化數(shù)據(jù)挖掘項(xiàng)目實(shí)施流程定義問題
準(zhǔn)備數(shù)據(jù)
建立模型應(yīng)用模型49評(píng)估和選擇最佳模型評(píng)價(jià)模型的穩(wěn)定性和準(zhǔn)確性:模型在確認(rèn)數(shù)據(jù)上的表現(xiàn)如何,是否穩(wěn)定?模型準(zhǔn)確度如何,和無模型相比有多少提升?哪一個(gè)模型最好?很多評(píng)估方法或圖形可以提供幫助:十分位數(shù)分析LiftCharts(又叫g(shù)ainschart)利潤(rùn)/損失圖(Profit/LossCharts)投資效益比圖(ROI)診斷分類圖ROCCharts各種基于臨界值的圖形(Threshold-basedCharts)模型復(fù)雜程度誤差驗(yàn)證數(shù)據(jù)訓(xùn)練數(shù)據(jù)數(shù)據(jù)挖掘項(xiàng)目實(shí)施流程定義問題
準(zhǔn)備數(shù)據(jù)
建立模型應(yīng)用模型50解釋模型對(duì)模型的結(jié)果進(jìn)行分析采用輔助手段是規(guī)律更加凸顯和易懂,如統(tǒng)計(jì),數(shù)據(jù)可視化,報(bào)表甚至外部調(diào)查用業(yè)務(wù)語言描述發(fā)現(xiàn)的規(guī)律或模式根據(jù)這些規(guī)律,提出業(yè)務(wù)上的解釋和建議需要業(yè)務(wù)知識(shí)和對(duì)數(shù)據(jù)的分析的緊密結(jié)合,集中體現(xiàn)業(yè)務(wù)領(lǐng)悟力和創(chuàng)造性,這是最激動(dòng)人心的時(shí)刻,發(fā)現(xiàn)了知識(shí)!同時(shí)也是需要你有耐心的時(shí)候。數(shù)據(jù)挖掘項(xiàng)目實(shí)施流程定義問題
準(zhǔn)備數(shù)據(jù)
建立模型應(yīng)用模型51流失預(yù)測(cè)案例——建立模型過采樣,處理小概率事件調(diào)整模型參數(shù)未流失流失無意義的分離505030302020完美的分離50505050流失未流失示例數(shù)據(jù)挖掘項(xiàng)目實(shí)施流程定義問題
準(zhǔn)備數(shù)據(jù)
建立模型應(yīng)用模型52流失預(yù)測(cè)案例——建立模型模型結(jié)果解釋模型評(píng)估}前30%預(yù)測(cè)流失客戶中就捕捉到58%的實(shí)際流失客戶示例數(shù)據(jù)挖掘項(xiàng)目實(shí)施流程定義問題
準(zhǔn)備數(shù)據(jù)
建立模型應(yīng)用模型隨著模型判斷流失可能性的下降,實(shí)際流失客戶減少53應(yīng)用模型和知識(shí)按照用途,模型可以用來做:
——評(píng)分,如客戶流失計(jì)分,客戶價(jià)值計(jì)分。
——設(shè)計(jì)策略,如不同客戶群的營(yíng)銷策略。按照實(shí)施方式,模型可以:
——集成在現(xiàn)有的業(yè)務(wù)系統(tǒng)中,實(shí)時(shí)評(píng)分。
——應(yīng)用于決策支持系統(tǒng)中,提供決策支持信息。 ——集成于在線客戶服務(wù)系統(tǒng),提供有意義的客戶信息。
——輸出客戶列表,為其他系統(tǒng)或應(yīng)用提供數(shù)據(jù)。是否能自動(dòng)應(yīng)用和如何使用,取決于實(shí)際IT系統(tǒng)環(huán)境和業(yè)務(wù)流程。定義問題
準(zhǔn)備數(shù)據(jù)
建立模型應(yīng)用模型數(shù)據(jù)挖掘項(xiàng)目實(shí)施流程54監(jiān)控和評(píng)價(jià)模型應(yīng)用效果隨著時(shí)間的推移,市場(chǎng)、客戶、數(shù)據(jù)的變化,模型的效力必然衰減,并最終失效。最直觀的監(jiān)控方法就是看看模型應(yīng)用到現(xiàn)實(shí)中的效果好壞,可以通過和控制組的比較評(píng)價(jià)效果。最終效果與模型,策略的設(shè)計(jì),活動(dòng)的執(zhí)行,其他因素都有關(guān)系,因此要對(duì)每個(gè)環(huán)節(jié)分析。如果對(duì)模型準(zhǔn)確性和穩(wěn)定性評(píng)估證明模型的表現(xiàn)已經(jīng)不可接受,就需要再訓(xùn)練模型。定義問題
準(zhǔn)備數(shù)據(jù)
建立模型應(yīng)用模型數(shù)據(jù)挖掘項(xiàng)目實(shí)施流程55流失預(yù)測(cè)案例——應(yīng)用模型流失概率高的客戶列表示例定義問題
準(zhǔn)備數(shù)據(jù)
建立模型應(yīng)用模型數(shù)據(jù)挖掘項(xiàng)目實(shí)施流程56小結(jié)
定義問題準(zhǔn)備數(shù)據(jù)
建立模型應(yīng)用模型數(shù)據(jù)挖掘是一個(gè)反復(fù)的過程,不是一次性的,一勞永逸的工作。需要業(yè)務(wù)專家,數(shù)據(jù)專家,分析專家在多個(gè)環(huán)節(jié)上的緊密合作。數(shù)據(jù)挖掘的價(jià)值必須通過可執(zhí)行的策略和活動(dòng)作用于業(yè)務(wù)上才能體現(xiàn)。關(guān)鍵是掌握從數(shù)據(jù)->知識(shí)->行動(dòng)->業(yè)務(wù)增值的方法論,建立一個(gè)良好的數(shù)據(jù)挖掘平臺(tái)和流程,從而具有按照實(shí)際業(yè)務(wù)的需要和環(huán)境的改變,再訓(xùn)練模型,優(yōu)化模型,開發(fā)新的模型的能力。數(shù)據(jù)挖掘項(xiàng)目實(shí)施流程57數(shù)據(jù)挖掘概述數(shù)據(jù)挖掘?qū)嵤┓椒ㄕ摂?shù)據(jù)挖掘項(xiàng)目實(shí)施流程專題1:業(yè)務(wù)目標(biāo)選定專題2:數(shù)據(jù)挖掘項(xiàng)目評(píng)估方法專題3:數(shù)據(jù)挖掘項(xiàng)目管理專題4:數(shù)據(jù)挖掘項(xiàng)目實(shí)施中的重要規(guī)范主題58描述性模型和預(yù)測(cè)性模型的目標(biāo)設(shè)計(jì)差異風(fēng)險(xiǎn)類模型的目標(biāo)設(shè)計(jì)營(yíng)銷類模型的目標(biāo)設(shè)計(jì)業(yè)務(wù)目標(biāo)選定59定義目標(biāo)模型種類模型類型選擇算法數(shù)據(jù)挖掘的最終目標(biāo)是什么?例如:希望用數(shù)據(jù)挖掘技術(shù)留住有價(jià)值的客戶,則需要建立模型來:一、區(qū)別那些客戶是有價(jià)值的客戶;二、那些客戶有可能離開。確定合適的模型種類:1、分類。描述一特定用戶或事件屬于哪一類;2、回歸。預(yù)測(cè)一個(gè)變量的值。例如可以用分類確定用戶的價(jià)值,用預(yù)測(cè)來確定那些用戶有可能會(huì)離開。選擇模型的類型,例如用聚類來做分類,神經(jīng)網(wǎng)絡(luò)、決策樹來做預(yù)測(cè),還是用統(tǒng)計(jì)模型,如:邏輯回歸,普通線性模型等。每種模型都可能用不同的算法來實(shí)現(xiàn),比如可以用回饋函數(shù)或radialbasis函數(shù)來建立神經(jīng)網(wǎng)絡(luò);決策樹還有CART、C5.0、QUEST、CHAID等。描述性模型和預(yù)測(cè)性模型的目標(biāo)設(shè)計(jì)差異60數(shù)據(jù)挖掘是從企業(yè)數(shù)據(jù)財(cái)富中導(dǎo)出客戶洞察的方法.客戶洞察通常以描述性或預(yù)測(cè)模型的形式得到.允許描述數(shù)據(jù)集發(fā)現(xiàn)數(shù)據(jù)中過去不知道的模式和趨勢(shì)不被目標(biāo)變量所“指導(dǎo)”舉例:
分群,關(guān)聯(lián)分析允許預(yù)測(cè)和解釋變量用于開發(fā)預(yù)測(cè)模型,該模型的建模過程受目標(biāo)變量的“指導(dǎo)”舉例:
提升/交叉銷售模型,獲取模型,流失模型描述性/無監(jiān)督模型預(yù)測(cè)/有指導(dǎo)模型數(shù)據(jù)挖掘描述性模型和預(yù)測(cè)性模型的目標(biāo)設(shè)計(jì)差異61①
預(yù)測(cè)
用過去的數(shù)據(jù)預(yù)測(cè)
未來發(fā)生什么
預(yù)測(cè)未來發(fā)生的可能性歷史數(shù)據(jù)預(yù)測(cè)模型
-神經(jīng)元網(wǎng)絡(luò)
-決策樹-回歸②描述
用過去的數(shù)據(jù)
描述
現(xiàn)在發(fā)生了什么描述現(xiàn)在已經(jīng)發(fā)生的規(guī)律歷史數(shù)據(jù)描述模型
-聚類-關(guān)聯(lián)描述性模型和預(yù)測(cè)性模型的目標(biāo)設(shè)計(jì)差異62風(fēng)險(xiǎn)類模型的目標(biāo)設(shè)計(jì)業(yè)務(wù)目的是預(yù)警和防范風(fēng)險(xiǎn),在業(yè)務(wù)管理上像“踩剎車”風(fēng)險(xiǎn)的種類
流失風(fēng)險(xiǎn) 信用風(fēng)險(xiǎn) 欺詐風(fēng)險(xiǎn) ……模型的目標(biāo)是預(yù)測(cè)Good/Bad數(shù)據(jù)準(zhǔn)備要包括已經(jīng)發(fā)生了風(fēng)險(xiǎn)的Bad情形和在一定期間內(nèi)沒有發(fā)生風(fēng)險(xiǎn)的Good情形業(yè)務(wù)目標(biāo)選定63風(fēng)險(xiǎn)類模型的目標(biāo)設(shè)計(jì)模型收益通過對(duì)客戶風(fēng)險(xiǎn)的預(yù)先量化判別,主動(dòng)采取措施規(guī)避風(fēng)險(xiǎn),控制風(fēng)險(xiǎn)損失通過模型預(yù)測(cè)的精確性與量化特征,可以有意識(shí)地引入可以容忍的風(fēng)險(xiǎn),合理降低風(fēng)險(xiǎn)控制門檻,從而擴(kuò)大業(yè)務(wù)發(fā)放規(guī)模模型的應(yīng)用模式利用模型對(duì)每個(gè)客戶預(yù)測(cè)的風(fēng)險(xiǎn)概率,對(duì)低風(fēng)險(xiǎn)客戶實(shí)施綠色通道處理,或增加信用額度,促進(jìn)其收益增長(zhǎng)利用模型對(duì)每個(gè)客戶預(yù)測(cè)的風(fēng)險(xiǎn)概率,對(duì)高風(fēng)險(xiǎn)客戶實(shí)施紅色預(yù)警處理,或降低信用額度,降低其風(fēng)險(xiǎn)損失利用模型預(yù)測(cè)的風(fēng)險(xiǎn)級(jí)別,減少人工風(fēng)控的工作量,將人工經(jīng)驗(yàn)用在模型情形處理的“刀刃”上,提高風(fēng)控管理的效率可以量化地控管客戶風(fēng)險(xiǎn)與規(guī)模、收益增長(zhǎng)的關(guān)系,輔助精細(xì)化管理可以利用客戶風(fēng)險(xiǎn)評(píng)分,監(jiān)控和評(píng)價(jià)客戶經(jīng)理的工作成效業(yè)務(wù)目標(biāo)選定64風(fēng)險(xiǎn)類模型的目標(biāo)設(shè)計(jì)可行性積累和整理足夠數(shù)量和足夠長(zhǎng)度的風(fēng)險(xiǎn)相關(guān)歷史數(shù)據(jù),包括是否發(fā)生風(fēng)險(xiǎn)的情形,與判斷風(fēng)險(xiǎn)相關(guān)的特征(如申請(qǐng)表或交易行為等)利用數(shù)據(jù)建立預(yù)測(cè)模型,為每個(gè)客戶建立風(fēng)險(xiǎn)評(píng)分針對(duì)風(fēng)險(xiǎn)評(píng)分的高低,采取不同的風(fēng)險(xiǎn)控制策略根據(jù)風(fēng)險(xiǎn)評(píng)分的分布,確定風(fēng)險(xiǎn)控制的門限(例如,對(duì)于信用卡申請(qǐng)的批準(zhǔn)率設(shè)置)業(yè)務(wù)目標(biāo)選定65風(fēng)險(xiǎn)類模型的目標(biāo)設(shè)計(jì)目標(biāo)的定義風(fēng)險(xiǎn)模型的目標(biāo)定義一般比業(yè)務(wù)上的風(fēng)險(xiǎn)定義要嚴(yán)格例如:信用風(fēng)險(xiǎn)的目標(biāo)定義往往是拖欠達(dá)到90天及以上,而實(shí)際的業(yè)務(wù)壞賬標(biāo)準(zhǔn)是拖欠達(dá)到180天及以上因?yàn)楦鼑?yán)格的目標(biāo)定義可以為業(yè)務(wù)操作上留取一定的調(diào)整空間;同時(shí),按照實(shí)際的業(yè)務(wù)壞賬標(biāo)準(zhǔn)定義的情形往往在預(yù)測(cè)期就已經(jīng)不可逆轉(zhuǎn),很難根據(jù)預(yù)測(cè)結(jié)果采取有效防范措施;另外,較嚴(yán)格的定義可以獲得更多的Bad樣本,技術(shù)上有利于建立預(yù)測(cè)模型模型上的風(fēng)險(xiǎn)定義也需要取得業(yè)務(wù)人員的認(rèn)可,因?yàn)閷?shí)際風(fēng)險(xiǎn)管理中也經(jīng)常將風(fēng)險(xiǎn)定義收嚴(yán),所以具備達(dá)成一致的條件當(dāng)然,模型風(fēng)險(xiǎn)定義的情形要被證明有足夠高的概率將轉(zhuǎn)換成業(yè)務(wù)上定義的壞賬(可以采用roll-rate分析)業(yè)務(wù)目標(biāo)選定66風(fēng)險(xiǎn)類模型的目標(biāo)設(shè)計(jì)目標(biāo)的定義是預(yù)測(cè)1個(gè)月出現(xiàn)零次話的用戶,還是預(yù)測(cè)連續(xù)2個(gè)月或3個(gè)月出現(xiàn)零次話的用戶?通過roll-rate分析,可以幫助我們進(jìn)行預(yù)測(cè)目標(biāo)的確定2005年1月不同狀態(tài)用戶數(shù)2005年2月不同狀態(tài)用戶數(shù)正常1個(gè)月零次戶2個(gè)月零次戶3個(gè)月零次戶4個(gè)月零次戶拆機(jī)正常
96989493987029504000520行%96.903.040000.051個(gè)月零次戶20191484801524000103行%24.01075.48000.512個(gè)月零次戶1248317100010721052行%13.700085.8800.423個(gè)月零次戶7564696000679177行%9.2000089.781.02
1個(gè)月零次話的用戶,在下一個(gè)月繼續(xù)為零次戶的可能性為75%,有24%的用戶下個(gè)月會(huì)自然回復(fù)正常
連續(xù)兩個(gè)月零次話的用戶,成為3個(gè)月零次戶的可能性為86%,自然回復(fù)正常的可能性為14%
從零次戶的自然回復(fù)正常比率和減少偶然性影響來看,最終決定以預(yù)測(cè)連續(xù)兩個(gè)月的零次戶為預(yù)測(cè)目標(biāo)業(yè)務(wù)目標(biāo)選定示例67風(fēng)險(xiǎn)類模型的目標(biāo)設(shè)計(jì)避免“偽預(yù)測(cè)”風(fēng)險(xiǎn)現(xiàn)象在發(fā)生之前可能已經(jīng)產(chǎn)生輕度風(fēng)險(xiǎn)現(xiàn)象,如果將此類現(xiàn)象當(dāng)作預(yù)測(cè)因子,將產(chǎn)生“偽預(yù)測(cè)” 例如,已經(jīng)發(fā)生“預(yù)約停機(jī)”情形的客戶發(fā)生離網(wǎng)流失的概率很高,但是,在業(yè)務(wù)上,如果這類客戶屬于值得挽留的客戶,已經(jīng)有對(duì)應(yīng)的流程去處理,對(duì)這個(gè)顯而易見的規(guī)律,預(yù)測(cè)失去了意義,無法體現(xiàn)對(duì)業(yè)務(wù)環(huán)節(jié)的提升;對(duì)業(yè)務(wù)人員來說,從表面上一直正常的客戶中發(fā)現(xiàn)突變的流失風(fēng)險(xiǎn),才能真正提高維系和挽留工作的效率。
但是,由于使用這類顯而易見的因素作為預(yù)測(cè)因子,在模型技術(shù)評(píng)估上可以獲得很高的預(yù)測(cè)性能指標(biāo),如果沒有完備綜合的評(píng)估體系,將會(huì)干擾對(duì)模型有效性的確切評(píng)估。業(yè)務(wù)目標(biāo)選定68市場(chǎng)類模型的目標(biāo)設(shè)計(jì)業(yè)務(wù)目的是提升市場(chǎng)營(yíng)銷能力,在業(yè)務(wù)管理上像“踩油門”市場(chǎng)模型的種類
交叉銷售 營(yíng)銷響應(yīng)
……模型的目標(biāo)是預(yù)測(cè)客戶接受營(yíng)銷的產(chǎn)品組合的機(jī)會(huì)數(shù)據(jù)準(zhǔn)備應(yīng)該包括已經(jīng)接受了營(yíng)銷推薦的情形和沒有接受營(yíng)銷推薦的情形業(yè)務(wù)目標(biāo)選定69市場(chǎng)類模型的目標(biāo)設(shè)計(jì)(以交叉銷售為例)模型收益促進(jìn)重點(diǎn)產(chǎn)品的發(fā)行增加客戶持有產(chǎn)品的數(shù)目增加持有多種產(chǎn)品的客戶規(guī)模模型的應(yīng)用模式以各個(gè)獨(dú)立產(chǎn)品之間的相關(guān)性輔助產(chǎn)品組合設(shè)計(jì)找到最強(qiáng)關(guān)聯(lián)的產(chǎn)品組合的購(gòu)買順序,設(shè)計(jì)交叉銷售方案列示出每個(gè)客戶最適合購(gòu)買的下一個(gè)或者下三個(gè)產(chǎn)品,進(jìn)行全接觸點(diǎn)的統(tǒng)一營(yíng)銷可行性通過客戶分群總結(jié)客戶全方位特征(數(shù)據(jù)挖掘+人工討論結(jié)果)通過客戶特征推斷客戶需求(人工討論為主)根據(jù)客戶需求選擇或設(shè)計(jì)產(chǎn)品(人工設(shè)計(jì)為主)根據(jù)現(xiàn)有產(chǎn)品的相關(guān)性設(shè)計(jì)產(chǎn)品組合(數(shù)據(jù)挖掘+人工討論結(jié)果)建立客戶需求與產(chǎn)品組合的匹配(人工設(shè)計(jì)為主)在技術(shù)上和業(yè)務(wù)管理上應(yīng)用交叉銷售模型的結(jié)果業(yè)務(wù)目標(biāo)選定70市場(chǎng)類模型的目標(biāo)設(shè)計(jì)(以交叉銷售為例)目標(biāo)的定義可以使用描述性模型方案,則本身沒有直接的預(yù)測(cè)目標(biāo)變量,而是利用產(chǎn)品購(gòu)買清單,發(fā)現(xiàn)產(chǎn)品間的潛在關(guān)聯(lián)關(guān)系可以使用預(yù)測(cè)性模型方案,即以每個(gè)產(chǎn)品的持有為一個(gè)目標(biāo)事件,利用人工神經(jīng)元網(wǎng)絡(luò)等模型進(jìn)行多目標(biāo)的預(yù)測(cè)在交叉銷售目標(biāo)定義中必須注意排除業(yè)務(wù)上固有的產(chǎn)品綁定和排斥規(guī)則,例如:語音通話和來電顯示自身就有很強(qiáng)的綁定性,而低價(jià)位普通手機(jī)和智能手機(jī)之間又具有互斥性避免“偽相關(guān)”分析中可能發(fā)現(xiàn)的強(qiáng)相關(guān)組合,可能因?yàn)闃I(yè)務(wù)本上就是捆綁銷售的產(chǎn)品組合,幾乎沒有分離銷售過,這將導(dǎo)致“偽相關(guān)”的分析結(jié)果因?yàn)橐郧暗慕壎ê芸赡苁桥哪X袋的結(jié)果,如果數(shù)據(jù)挖掘不排除這些情形,就會(huì)干擾發(fā)現(xiàn)真正具有自然相關(guān)性的產(chǎn)品組合的過程業(yè)務(wù)目標(biāo)選定71市場(chǎng)類模型的目標(biāo)設(shè)計(jì)(以營(yíng)銷響應(yīng)為例)模型收益在投放成本不變的情況下,取得最大化的營(yíng)銷響應(yīng)率模型的應(yīng)用模式根據(jù)營(yíng)銷響應(yīng)率預(yù)測(cè)的高低,針對(duì)性地選取投放對(duì)象,提升營(yíng)銷活動(dòng)的成本收益率根據(jù)營(yíng)銷響應(yīng)率預(yù)測(cè)的高低,進(jìn)行營(yíng)銷活動(dòng)的預(yù)演,在策劃階段就提高活動(dòng)的針對(duì)性利用不同產(chǎn)品營(yíng)銷響應(yīng)率的分布,進(jìn)行優(yōu)化的客戶-產(chǎn)品匹配設(shè)計(jì)業(yè)務(wù)目標(biāo)選定72市場(chǎng)類模型的目標(biāo)設(shè)計(jì)(以營(yíng)銷響應(yīng)為例)可行性根據(jù)已經(jīng)發(fā)生過的營(yíng)銷活動(dòng)的結(jié)果,準(zhǔn)備有/無響應(yīng)的客戶群體數(shù)據(jù)通過客戶分群總結(jié)客戶全方位特征(數(shù)據(jù)挖掘+人工討論結(jié)果)總結(jié)營(yíng)銷活動(dòng)的特征(人工分類)通過客戶特征、營(yíng)銷活動(dòng)特征與營(yíng)銷響應(yīng)結(jié)果建立營(yíng)銷響應(yīng)結(jié)果預(yù)測(cè)模型(數(shù)據(jù)挖掘)通過預(yù)測(cè)模型為建立基于響應(yīng)概率的客戶列表(數(shù)據(jù)挖掘)根據(jù)模型結(jié)果優(yōu)化營(yíng)銷投放目標(biāo)客戶群(數(shù)據(jù)挖掘+人工篩選)業(yè)務(wù)目標(biāo)選定73市場(chǎng)類模型的目標(biāo)設(shè)計(jì)(以營(yíng)銷響應(yīng)為例)目標(biāo)的定義營(yíng)銷響應(yīng)事件(有/無)需要規(guī)定響應(yīng)的程度(接到推薦/完整地接聽推薦/對(duì)推薦產(chǎn)程回饋(如回復(fù)短信)/表示對(duì)推薦的正面評(píng)價(jià)/購(gòu)買推薦的產(chǎn)品組合),最終購(gòu)買作為目標(biāo)可以直接關(guān)聯(lián)業(yè)務(wù)收益目標(biāo),但是存在跟蹤難度,因?yàn)楹芏嗫蛻舨⒉皇钱?dāng)場(chǎng)購(gòu)買,而是事后從別的渠道購(gòu)買通常,以對(duì)推薦產(chǎn)程回饋(如回復(fù)短信)為目標(biāo)響應(yīng)事件,因?yàn)榻咏罱K正面結(jié)果,同時(shí)可操作性強(qiáng)注意選取一定的考察期,對(duì)于營(yíng)銷活動(dòng)很長(zhǎng)時(shí)間后才響應(yīng)的客戶,視為不響應(yīng)業(yè)務(wù)目標(biāo)選定74數(shù)據(jù)挖掘概述數(shù)據(jù)挖掘?qū)嵤┓椒ㄕ摂?shù)據(jù)挖掘項(xiàng)目實(shí)施流程專題1:業(yè)務(wù)目標(biāo)選定專題2:數(shù)據(jù)挖掘項(xiàng)目評(píng)估方法專題3:數(shù)據(jù)挖掘項(xiàng)目管理專題4:數(shù)據(jù)挖掘項(xiàng)目實(shí)施中的重要規(guī)范主題75數(shù)據(jù)挖掘項(xiàng)目有沒有效果數(shù)據(jù)挖掘項(xiàng)目評(píng)估方法?技術(shù)指標(biāo)優(yōu)秀的模型好像幫不到業(yè)務(wù)指標(biāo)的提升為什么看到別人的案例收效很大,但是自己做的項(xiàng)目卻沒有類似的收效花了這么多功夫,如果做出來的模型響應(yīng)率達(dá)不到90%是不是還很失敗數(shù)據(jù)挖掘項(xiàng)目該如何評(píng)估76兼顧業(yè)務(wù)和技術(shù):
從模型的技術(shù)指標(biāo)和對(duì)業(yè)務(wù)的提升作用兩方面來評(píng)估,并注重其中的關(guān)聯(lián)性兼顧結(jié)果和過程
既要考察模型最終結(jié)果在業(yè)務(wù)和技術(shù)上的收效,也要看到模型開發(fā)過程中發(fā)現(xiàn)的問題和改善的環(huán)節(jié)兼顧絕對(duì)提升和相對(duì)提升
既要考察項(xiàng)目后技術(shù)指標(biāo)和業(yè)務(wù)指標(biāo)的絕對(duì)值水準(zhǔn),也要考察指標(biāo)相對(duì)于以前的相對(duì)提升考慮業(yè)界普遍規(guī)律
以業(yè)界的普遍水準(zhǔn)為參考,考察項(xiàng)目取得的收益。例如,直郵營(yíng)銷的普遍回復(fù)率不到1%,如果項(xiàng)目能夠提升到8%-10%,已經(jīng)是相當(dāng)突出的效果了。數(shù)據(jù)挖掘項(xiàng)目評(píng)估方法建立數(shù)據(jù)挖掘項(xiàng)目評(píng)估體系的要點(diǎn)77數(shù)據(jù)挖掘項(xiàng)目評(píng)估方法數(shù)據(jù)挖掘項(xiàng)目評(píng)估體系業(yè)務(wù)評(píng)估技術(shù)評(píng)估宏觀市場(chǎng)指標(biāo)評(píng)估占有率客戶構(gòu)成客戶貢獻(xiàn)度
成本/收益率
規(guī)模/增長(zhǎng)速度微觀市場(chǎng)指標(biāo)評(píng)估
客戶細(xì)分群構(gòu)成細(xì)分客戶貢獻(xiàn)度細(xì)分風(fēng)險(xiǎn)損失細(xì)分客戶親和力
細(xì)分客戶接觸效果評(píng)估特定業(yè)務(wù)活動(dòng)(如營(yíng)銷)的收效評(píng)估模型適用范圍評(píng)估模型技術(shù)性能評(píng)估模型/非模型提升率對(duì)比模型合理性評(píng)估模型魯棒性評(píng)估模型開發(fā)成本模型實(shí)施和維護(hù)成本項(xiàng)目投入成本評(píng)估業(yè)務(wù)實(shí)施投入技術(shù)實(shí)施投入時(shí)間成本機(jī)會(huì)成本項(xiàng)目過程收效評(píng)估模型對(duì)工作效率的提升模型建立過程中梳理業(yè)務(wù)問題和數(shù)據(jù)問題的潛在貢獻(xiàn)78業(yè)務(wù)評(píng)估:
從模型對(duì)業(yè)務(wù)和管理的實(shí)際提升效果來評(píng)估數(shù)據(jù)挖掘項(xiàng)目技術(shù)評(píng)估
從結(jié)果的性能、穩(wěn)定性和合理性等方面來評(píng)估數(shù)據(jù)挖掘項(xiàng)目數(shù)據(jù)挖掘項(xiàng)目評(píng)估方法79技術(shù)評(píng)估模型適用范圍評(píng)估
模型建立時(shí)使用的數(shù)據(jù)與最終投入應(yīng)用時(shí)不同,例如建模數(shù)據(jù)可能是一年前的業(yè)務(wù)環(huán)境下,或者只是幾個(gè)中心城市的數(shù)據(jù);在投入使用時(shí),需要將模型結(jié)果在最終投入應(yīng)用的數(shù)據(jù)上進(jìn)行驗(yàn)證,考察模型的性能在不同范圍的分布情形;最終的結(jié)論包括模型在不同地域、時(shí)間段范圍上的適用程度列表,進(jìn)而導(dǎo)出模型的適用范圍數(shù)據(jù)挖掘項(xiàng)目評(píng)估方法80技術(shù)評(píng)估模型技術(shù)性能評(píng)估
主要包括通常的顯著性檢驗(yàn),包括(但不限于) 衡量模型對(duì)于目標(biāo)和非目標(biāo)區(qū)分度的KS值,Gini系數(shù) 衡量預(yù)測(cè)模型效果的十分位分?jǐn)?shù)段分布檢驗(yàn) 衡量不同模型針對(duì)于不建模型的隨機(jī)序列的提升程度的LiftCharts(也叫GainCharts) 衡量預(yù)測(cè)模型命中效果的查全率、查準(zhǔn)率 衡量預(yù)測(cè)模型預(yù)測(cè)性能的預(yù)測(cè)-實(shí)際結(jié)果的誤差矩陣 衡量描述性模型的特征顯著性的指標(biāo)(例如分群特征相對(duì)于整體特征的差異比率) 衡量預(yù)測(cè)模型收益損失的綜合圖表 利潤(rùn)/損失圖(Profit/LossCharts) 投資效益比圖(ROI) 診斷分類圖 ROCCharts 各種基于臨界值的圖形(Threshold-basedCharts)數(shù)據(jù)挖掘項(xiàng)目評(píng)估方法81技術(shù)評(píng)估模型/非模型提升率對(duì)比
以LiftCharts(也叫GainCharts)為基礎(chǔ),設(shè)置相應(yīng)的控制組(controlgroup)來對(duì)比使用模型后的效果與不使用模型的效果;數(shù)據(jù)挖掘項(xiàng)目評(píng)估方法82技術(shù)評(píng)估模型合理性評(píng)估
判斷模型的結(jié)果是否合理,模型使用的分析變量是否合理,是否可以被業(yè)務(wù)上理解并應(yīng)用。 在一個(gè)實(shí)例中,價(jià)值模型評(píng)分后,大量VIP群體分?jǐn)?shù)較低,這個(gè)結(jié)論是不合理的,因此在合理性評(píng)估上被質(zhì)疑,經(jīng)調(diào)查,是因?yàn)榇罅縑IP群體由于有專門的客戶經(jīng)理專門應(yīng)對(duì),結(jié)果在系統(tǒng)移植時(shí),沒有將必要的客戶資料重新錄入到新系統(tǒng)中,造成VIP群體在數(shù)據(jù)上大量缺失,影響了建模結(jié)論。此時(shí)的合理性評(píng)估,起到了為業(yè)務(wù)應(yīng)用把關(guān)的作用。數(shù)據(jù)挖掘項(xiàng)目評(píng)估方法83技術(shù)評(píng)估模型魯棒性(Robustness)評(píng)估 即檢驗(yàn)?zāi)P驮跁r(shí)間推移、人群構(gòu)成變化等條件下性能的穩(wěn)定性。 常用的模型魯棒性檢驗(yàn)方法包括: 1、使用同時(shí)間段不同的樣本來檢驗(yàn),例如將數(shù)據(jù)劃分為訓(xùn)練、校驗(yàn)和測(cè)試數(shù)據(jù),使用部分參與建模的校驗(yàn)數(shù)據(jù)和完全沒有參與建模的測(cè)試數(shù)據(jù)進(jìn)行檢驗(yàn) 2、使用不同時(shí)間段的數(shù)據(jù)樣本進(jìn)行檢驗(yàn),例如3個(gè)月,6個(gè)月以后的數(shù)據(jù)進(jìn)行檢驗(yàn)
其中方法1常在在建模時(shí)采用,用于模型微調(diào); 方法2常在模型建立后一段監(jiān)控期內(nèi)采用,用于模型的跟蹤和調(diào)整; 在實(shí)際應(yīng)用中,更注重方法2的使用。數(shù)據(jù)挖掘項(xiàng)目評(píng)估方法84技術(shù)評(píng)估開發(fā)過程成本評(píng)估 模型開發(fā)成本 模型實(shí)施和維護(hù)成本數(shù)據(jù)挖掘項(xiàng)目評(píng)估方法85業(yè)務(wù)評(píng)估 宏觀市場(chǎng)指標(biāo)評(píng)估 占有率 客戶構(gòu)成
優(yōu)質(zhì)、中層、靜默等客戶的占比 客戶貢獻(xiàn)度
包括了客戶收益和客戶風(fēng)險(xiǎn)、以及其它成本因素 成本/收益率 規(guī)模/增長(zhǎng)速度數(shù)據(jù)挖掘項(xiàng)目評(píng)估方法86業(yè)務(wù)評(píng)估 微觀市場(chǎng)指標(biāo)評(píng)估 客戶細(xì)分群構(gòu)成
細(xì)分群體中優(yōu)質(zhì)、中層、靜默等客戶的占比 細(xì)分客戶貢獻(xiàn)度
包括了細(xì)分群體的客戶收益和客戶風(fēng)險(xiǎn)、以及其它成本因素 細(xì)分風(fēng)險(xiǎn)損失
細(xì)分客戶群的信用、流失、欺詐等風(fēng)險(xiǎn)損失 細(xì)分客戶親和力
細(xì)分客戶群對(duì)于呼叫中心呼入的傾向,接受外呼的程度,響應(yīng)客戶經(jīng)理或柜面預(yù)約訪談的程度,等等 細(xì)分客戶接觸效果評(píng)估
細(xì)分客戶在各個(gè)接觸點(diǎn)(例如電話營(yíng)銷、網(wǎng)絡(luò)、短信等)上的到達(dá)率、接受率、轉(zhuǎn)換率等指標(biāo)數(shù)據(jù)挖掘項(xiàng)目評(píng)估方法87業(yè)務(wù)評(píng)估特定業(yè)務(wù)活動(dòng)(如營(yíng)銷)的收效評(píng)估 針對(duì)特定業(yè)務(wù)活動(dòng)(如營(yíng)銷)所建立的數(shù)據(jù)挖掘模型,將考察特定業(yè)務(wù)活動(dòng)在使用模型前后的各項(xiàng)宏觀和微觀客戶考察指標(biāo)的對(duì)比情況數(shù)據(jù)挖掘項(xiàng)目評(píng)估方法88業(yè)務(wù)評(píng)估 項(xiàng)目投入成本評(píng)估 業(yè)務(wù)實(shí)施投入 技術(shù)實(shí)施投入 時(shí)間成本 機(jī)會(huì)成本 項(xiàng)目過程收效評(píng)估 模型對(duì)工作效率的提升 模型建立過程中梳理業(yè)務(wù)問題和數(shù)據(jù)問題的潛在貢獻(xiàn)數(shù)據(jù)挖掘項(xiàng)目評(píng)估方法89數(shù)據(jù)挖掘概述數(shù)據(jù)挖掘?qū)嵤┓椒ㄕ摂?shù)據(jù)挖掘項(xiàng)目實(shí)施流程專題1:業(yè)務(wù)目標(biāo)選定專題2:數(shù)據(jù)挖掘項(xiàng)目評(píng)估方法專題3:數(shù)據(jù)挖掘項(xiàng)目管理專題4:數(shù)據(jù)挖掘項(xiàng)目實(shí)施中的重要規(guī)范主題90數(shù)據(jù)挖掘項(xiàng)目管理計(jì)劃制定角色分配階段跟蹤變更管理問題處理91數(shù)據(jù)挖掘項(xiàng)目管理計(jì)劃制定
數(shù)據(jù)挖掘項(xiàng)目的計(jì)劃制定不同于一般的IT項(xiàng)目
一個(gè)典型的數(shù)據(jù)挖掘項(xiàng)目計(jì)劃(關(guān)鍵里程碑)樣例92數(shù)據(jù)挖掘項(xiàng)目管理計(jì)劃制定
數(shù)據(jù)挖掘項(xiàng)目的計(jì)劃制定不同于一般的IT項(xiàng)目 計(jì)劃目標(biāo)的設(shè)定 完成對(duì)業(yè)務(wù)問題和效果評(píng)估的明確定義
完成模型開發(fā)的技術(shù)環(huán)節(jié)
模型被業(yè)務(wù)上理解和接受
對(duì)于要求上線應(yīng)用的模型,還必須考慮: 模型具有持續(xù)評(píng)分的能力
模型具有監(jiān)控和調(diào)整體系 模型具備投入應(yīng)用的可能
93數(shù)據(jù)挖掘項(xiàng)目管理計(jì)劃制定
數(shù)據(jù)挖掘項(xiàng)目的計(jì)劃制定不同于一般的IT項(xiàng)目 核心環(huán)節(jié)
問題定義
數(shù)據(jù)準(zhǔn)備
數(shù)據(jù)質(zhì)量檢驗(yàn)
初步分析(數(shù)據(jù)探索,變量篩選等)
模型建立(包括模型開發(fā)和技術(shù)評(píng)估)
模型理解 模型監(jiān)控體系
模型部署 相關(guān)培訓(xùn)(針對(duì)開發(fā)維護(hù)人員和業(yè)務(wù)應(yīng)用人員兩方面)94數(shù)據(jù)挖掘項(xiàng)目管理耗時(shí)環(huán)節(jié)
數(shù)據(jù)準(zhǔn)備耗時(shí)指數(shù)★★★★★耗時(shí)原因: 以前很少提出如此全面深入的數(shù)據(jù)考察需求
數(shù)據(jù)字典的規(guī)范管理經(jīng)常性欠缺
數(shù)據(jù)源的梳理缺乏人力和系統(tǒng)支持
開發(fā)所需的熟練人員、軟件、硬件環(huán)境在前期往往比較“拮據(jù)”
數(shù)據(jù)轉(zhuǎn)換規(guī)則的確定會(huì)隨著開發(fā)過程出現(xiàn)反復(fù)
基礎(chǔ)數(shù)據(jù)經(jīng)常缺失 新老系統(tǒng)切換問題常導(dǎo)致處理邏輯產(chǎn)生中斷和分支95數(shù)據(jù)挖掘項(xiàng)目管理耗時(shí)環(huán)節(jié)
數(shù)據(jù)質(zhì)量檢驗(yàn)耗時(shí)指數(shù)★★★★耗時(shí)原因: 以前很少?gòu)臉I(yè)務(wù)邏輯的各個(gè)角度全面地考察數(shù)據(jù)質(zhì)量
數(shù)據(jù)質(zhì)量檢驗(yàn)缺乏規(guī)范
數(shù)據(jù)質(zhì)量的檢驗(yàn)方法缺乏工具支持而效率低下
數(shù)據(jù)質(zhì)量問題的原因查找往往需要業(yè)務(wù)和技術(shù)方面的人員都到位 技術(shù)原因的數(shù)據(jù)變形(例如,新老系統(tǒng)遷移)
業(yè)務(wù)原因的數(shù)據(jù)變形(例如:非必填信息的錄入錯(cuò)誤)96數(shù)據(jù)挖掘項(xiàng)目管理耗時(shí)環(huán)節(jié)
模型部署耗時(shí)指數(shù)★★★耗時(shí)原因: 數(shù)據(jù)挖掘模型的評(píng)分過程需要整合多方面的數(shù)據(jù),并且這個(gè)過程需要能夠持續(xù)上線運(yùn)轉(zhuǎn),運(yùn)算壓力超過一般的業(yè)務(wù)系統(tǒng)
模型開發(fā)時(shí)所用的系統(tǒng)語言可能與部署時(shí)不同 模型的評(píng)分和應(yīng)用涉及現(xiàn)有業(yè)務(wù)系統(tǒng)的改造或新系統(tǒng)開發(fā)97數(shù)據(jù)挖掘項(xiàng)目管理變數(shù)較多的環(huán)節(jié)
問題定義對(duì)于數(shù)據(jù)挖掘的分析目標(biāo)和結(jié)果期望可能很難達(dá)成共識(shí)
數(shù)據(jù)準(zhǔn)備可能沒有足夠多,足夠長(zhǎng),質(zhì)量合格的數(shù)據(jù)支持?jǐn)?shù)據(jù)挖掘
模型理解可能在業(yè)務(wù)上無法理解模型的結(jié)果,或者無法建立可操作的應(yīng)用
98數(shù)據(jù)挖掘項(xiàng)目管理角色分配
完整的角色定義
99數(shù)據(jù)挖掘項(xiàng)目管理階段跟蹤周計(jì)劃
將總體計(jì)劃分解到每個(gè)周內(nèi)每天的任務(wù)分配周狀態(tài)報(bào)告 項(xiàng)目概述 里程碑進(jìn)度 交付物進(jìn)度 本周任務(wù)完成情況 下周任務(wù)安排 出現(xiàn)的問題階段例會(huì)
每周或者雙周進(jìn)行,項(xiàng)目經(jīng)理和相關(guān)部門領(lǐng)導(dǎo)參加
100數(shù)據(jù)挖掘項(xiàng)目管理變更管理變更流程變更的發(fā)起:變更單的生成 項(xiàng)目經(jīng)理根據(jù)項(xiàng)目具體情況(考查或聽取組員意見),提出變更申請(qǐng),填寫變更單初始內(nèi)容變更的匯報(bào)與討論:變更單的上報(bào) 服務(wù)方和客戶方項(xiàng)目經(jīng)理溝通后向高層項(xiàng)目領(lǐng)導(dǎo)小組匯報(bào),提請(qǐng)討論變更的確認(rèn)與發(fā)布:變更單的確認(rèn) 被確認(rèn)的變更,向全項(xiàng)目發(fā)布,同時(shí)更新所有級(jí)別的項(xiàng)目計(jì)劃變更的駁回:變更單的拒絕 變更申請(qǐng)被拒絕,同時(shí)公開因不變更而產(chǎn)生的風(fēng)險(xiǎn)預(yù)估結(jié)論101數(shù)據(jù)挖掘項(xiàng)目管理變更管理變更單的內(nèi)容設(shè)置典型的變更單樣例
102數(shù)據(jù)挖掘項(xiàng)目管理變更管理變更管理的要點(diǎn)
一個(gè)項(xiàng)目存在過多的深層變更(涉及到項(xiàng)目交付目標(biāo)或關(guān)鍵里程碑的變更)時(shí),需要提請(qǐng)項(xiàng)目領(lǐng)導(dǎo)小組,重新評(píng)估項(xiàng)目的進(jìn)程和前景變更的必要性,變更與否的風(fēng)險(xiǎn)評(píng)估需要由一線實(shí)施人員和資質(zhì)的環(huán)節(jié)專家參與,同時(shí)必須獲得領(lǐng)導(dǎo)小組的理解,深層變更會(huì)議必須有領(lǐng)導(dǎo)小組的核心人員參與項(xiàng)目變更與計(jì)劃更新必須及時(shí)和全面,在各級(jí)計(jì)劃全部更新后方能發(fā)布變更通知,變更通知與更新的項(xiàng)目計(jì)劃需要同時(shí)到達(dá)每一個(gè)項(xiàng)目成員。103數(shù)據(jù)挖掘項(xiàng)目管理
問題處理文檔化管理
將口頭、臨時(shí)的模糊信息變?yōu)榭筛櫟拿鞔_信息 讓項(xiàng)目人員對(duì)問題有明確、詳細(xì)、無歧異的認(rèn)識(shí),提升了溝通效率
將解決的過程形成企業(yè)知識(shí)積累跟蹤機(jī)制
對(duì)于每個(gè)問題,有明確的問題負(fù)責(zé)人和回答負(fù)責(zé)人來跟蹤問題解決得狀態(tài)和過程 關(guān)鍵問題的跟蹤列入項(xiàng)目狀態(tài)報(bào)告和項(xiàng)目例會(huì)討論的內(nèi)容 整個(gè)過程體現(xiàn)在文檔上通知機(jī)制
項(xiàng)目領(lǐng)導(dǎo)小組和項(xiàng)目工作小組的全體成員均需知曉問題詳情和狀態(tài)
關(guān)鍵問題簡(jiǎn)述列入項(xiàng)目狀態(tài)報(bào)告通知項(xiàng)目組,并提供問題編號(hào)供關(guān)心的人員在項(xiàng)目問題文檔中隨時(shí)查閱問題詳情104數(shù)據(jù)挖掘項(xiàng)目管理問題處理的文檔要點(diǎn)<問題創(chuàng)建—問題提交人填寫>問題號(hào) (必須唯一,建議含有日期和提交人信息)題目 (問題的簡(jiǎn)要標(biāo)題,必填):涉及范圍:(項(xiàng)目的主題范圍)相關(guān)里程碑:是否突出問題:是(如果是,需要由項(xiàng)目組通報(bào)上級(jí)協(xié)調(diào)解決)問題影響:(描述)問題提交人:?jiǎn)栴}負(fù)責(zé)人:回答主管部門:回答負(fù)責(zé)人:提問時(shí)間(yyyy-mm-dd):期望解決時(shí)間(yyyy-mm-dd
溫馨提示
- 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請(qǐng)下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請(qǐng)聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
- 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會(huì)有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
- 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
- 5. 人人文庫(kù)網(wǎng)僅提供信息存儲(chǔ)空間,僅對(duì)用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對(duì)用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對(duì)任何下載內(nèi)容負(fù)責(zé)。
- 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請(qǐng)與我們聯(lián)系,我們立即糾正。
- 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶因使用這些下載資源對(duì)自己和他人造成任何形式的傷害或損失。
最新文檔
- 情侶之間合租協(xié)議書
- 自行回家協(xié)議書范文
- 項(xiàng)目轉(zhuǎn)讓協(xié)議書封面
- 責(zé)任承擔(dān)協(xié)議書建筑
- 學(xué)費(fèi)優(yōu)惠協(xié)議書范本
- 律師簽訂安置協(xié)議書
- 無解婚姻調(diào)解協(xié)議書
- 酒店簽約商旅協(xié)議書
- 農(nóng)村分地協(xié)議書范本
- 招聘技術(shù)入股協(xié)議書
- 模擬考保安證試題及答案
- 2025年上海楊浦城市建設(shè)投資集團(tuán)有限公司招聘筆試參考題庫(kù)附帶答案詳解
- 2025年浙江省杭州市余杭區(qū)中考語文模擬試卷含答案
- 攤鋪機(jī)租賃合同協(xié)議書范本
- 兒童畫教材課件
- 河南省鄭州市2025年高中畢業(yè)年級(jí)第二次質(zhì)量預(yù)測(cè)英語試題(含答案無聽力原文及音頻)
- 用戶畫像的構(gòu)建與應(yīng)用試題及答案
- 廣東省2025年普通高等學(xué)校招生全國(guó)統(tǒng)一考試模擬測(cè)試(一)英語試題及答案
- 2025年湖南省長(zhǎng)沙市初中學(xué)業(yè)水平考試模擬(一)歷史試題(原卷版+解析版)
- 國(guó)家義務(wù)教育質(zhì)量監(jiān)測(cè)八年級(jí)美術(shù)樣卷
- 2025年中考道德與法治全真模擬卷1(含答案解析)
評(píng)論
0/150
提交評(píng)論