版權(quán)說(shuō)明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請(qǐng)進(jìn)行舉報(bào)或認(rèn)領(lǐng)
文檔簡(jiǎn)介
第2章商務(wù)智能運(yùn)用
--分析型CRM企業(yè)在擴(kuò)展市場(chǎng)、提高效率和堅(jiān)持客戶的原始商業(yè)驅(qū)動(dòng)力不變的情況下,如何繼續(xù)堅(jiān)持競(jìng)爭(zhēng)的優(yōu)勢(shì)。有遠(yuǎn)見(jiàn)的公司都會(huì)認(rèn)識(shí)到,只需將本人建成可以對(duì)客戶作出迅速反響的公司才干獲得諸多收獲,這些收獲包括收入、新客戶、客戶稱心度、客戶回頭率以及公司效益的添加,從而使競(jìng)爭(zhēng)力大為提升。本章內(nèi)容:CRM概述CRM與商務(wù)智能客戶行為分析客戶分類案例分析CRM概述建立客戶關(guān)系管理〔CRM〕系統(tǒng)的目的是賦予企業(yè)更完善的與客戶交流的才干,即從潛在客戶識(shí)別、生成有需求的客戶,到銷售結(jié)束以及不斷進(jìn)展的效力和支持,提供全過(guò)程的自動(dòng)化處置和更好的協(xié)調(diào)與協(xié)作,以提高客戶稱心度和客戶忠實(shí)度,添加市場(chǎng)時(shí)機(jī)和銷售利潤(rùn),為企業(yè)開(kāi)展效力。操作型CRM的設(shè)計(jì)目的是為了讓業(yè)務(wù)人員在日常的任務(wù)中可以共享客戶資源,減少信息流動(dòng)滯留點(diǎn)。經(jīng)過(guò)市場(chǎng)營(yíng)銷、銷售和效力等業(yè)務(wù)流程的管理,將客戶的各種信息搜集并整合在一同,再將這些運(yùn)營(yíng)數(shù)據(jù)和外來(lái)的市場(chǎng)數(shù)據(jù)經(jīng)過(guò)整合和變換,裝載進(jìn)DW。協(xié)作型CRM就是可以讓企業(yè)客戶效力人員同客戶一同完成某項(xiàng)活動(dòng)。協(xié)作型運(yùn)用目前主要由呼叫中心、客戶多渠道聯(lián)絡(luò)中心、協(xié)助臺(tái)以及自助效力協(xié)助導(dǎo)航,向客戶解釋特定內(nèi)容的網(wǎng)頁(yè)等。
分析型CRM現(xiàn)實(shí)上是以改善業(yè)務(wù)管理為目的的分析活動(dòng),主要是分析現(xiàn)有的歷史數(shù)據(jù)或者操作型CRM中獲得的各種數(shù)據(jù),進(jìn)而為企業(yè)的運(yùn)營(yíng)、決策提供可靠的量化的根據(jù)。在一家銀行的信譽(yù)卡客戶中,能夠有80%的人幾乎不用信譽(yù)卡買賣,有10%的客戶偶爾用卡買賣,剩下10%的客戶會(huì)頻繁用卡買賣,而這一部分客戶能夠?yàn)殂y行信譽(yù)卡部帶來(lái)80%的收入,所以這10%自然是最有價(jià)值的客戶。利用分析型CRM系統(tǒng)對(duì)客戶進(jìn)展細(xì)分,就可以針對(duì)有價(jià)值的客戶開(kāi)展特別的促銷活動(dòng)、提供更個(gè)性化的效力,這無(wú)疑將使企業(yè)以最小的投入獲得最大的報(bào)答。商務(wù)智能與CRM假設(shè)說(shuō)操作型與協(xié)作型CRM是企業(yè)的臂膀,那么分析型CRM就是企業(yè)的大腦。數(shù)據(jù)整合――提供客戶全景視圖利用數(shù)據(jù)倉(cāng)庫(kù)技術(shù),可以將散落在各個(gè)業(yè)務(wù)數(shù)據(jù)庫(kù)中的客戶信息經(jīng)過(guò)ETL(抽取、轉(zhuǎn)換、加載)過(guò)程,清洗、轉(zhuǎn)化、銜接、概括、集成為一致的分析數(shù)據(jù);同時(shí),數(shù)據(jù)倉(cāng)庫(kù)強(qiáng)大的數(shù)據(jù)存儲(chǔ)及管理才干可以對(duì)海量客戶數(shù)據(jù)有效的存儲(chǔ)、索引、歸類。信息提交過(guò)程企業(yè)信息系統(tǒng)最終的關(guān)注點(diǎn)在于信息的傳送,實(shí)現(xiàn)從數(shù)據(jù)到信息的深層次轉(zhuǎn)化。(1)OLAP的多維立方體模型為用戶提供多維的分析視圖,經(jīng)過(guò)鉆取、旋轉(zhuǎn)、切片(塊)等操作,使得用戶可以隨心所欲地對(duì)客戶數(shù)據(jù)進(jìn)展多維分析,獲取關(guān)于客戶的細(xì)分市場(chǎng)、購(gòu)買方式、盈利才干等重要信息。(2)經(jīng)過(guò)簡(jiǎn)單易用的工具使得終端用戶可以自在的按照本人的意圖來(lái)支配數(shù)據(jù),從而為本人的業(yè)務(wù)問(wèn)題提供信息支持。(3)利用企業(yè)信息門戶戰(zhàn)略可以根據(jù)不同的用戶定制信息界面,從而保證信息在適當(dāng)?shù)臅r(shí)間、經(jīng)過(guò)適當(dāng)?shù)氖侄巍魉偷竭m當(dāng)?shù)娜耸种小?蛻糁R(shí)的深化發(fā)掘(1)根據(jù)從客戶知識(shí)開(kāi)掘的信息,計(jì)算客戶生命周期價(jià)值,以此作為客戶分類的根據(jù)。針對(duì)不同類別的客戶采取不同的措施;(2)預(yù)測(cè)客戶未來(lái)一段時(shí)期的需求;(3)預(yù)測(cè)客戶流失的能夠性,或者采取及時(shí)的補(bǔ)救措施,或者做出減少不用要的投資等決策,最大限制地保管客戶和降低企業(yè)的損失;(4)測(cè)評(píng)客戶忠實(shí)度,識(shí)別忠實(shí)客戶??蛻糁R(shí)的展現(xiàn)經(jīng)過(guò)商務(wù)智能技術(shù)所獲得的客戶知識(shí)(特征、忠實(shí)度、盈利才干、行為方式)必需經(jīng)過(guò)操作和協(xié)作型CRM系統(tǒng)才干最終實(shí)現(xiàn)為客戶提供更好效力的目的,從而構(gòu)成業(yè)務(wù)行動(dòng)的閉環(huán),真正發(fā)揚(yáng)CRM的各層次的綜合效應(yīng)??蛻糁悄芟到y(tǒng)構(gòu)造圖構(gòu)建一個(gè)完好的智能CRM系統(tǒng)的幾個(gè)步驟:1.整合客戶信息資源對(duì)于那些以前沒(méi)有運(yùn)用過(guò)任何CRM系統(tǒng)的企業(yè)來(lái)說(shuō),首先需求把孤立的業(yè)務(wù)系統(tǒng)整合到一個(gè)一致的平臺(tái)之下,處理“信息孤島〞。而對(duì)于己有CRM系統(tǒng)的企業(yè),那么需求建立一個(gè)企業(yè)信息門戶,使客戶和企業(yè)能在一個(gè)一致的界面下進(jìn)展數(shù)據(jù)和信息交換,從而保證客戶數(shù)據(jù)的一致性。2.建立客戶數(shù)據(jù)倉(cāng)庫(kù)規(guī)劃數(shù)據(jù)倉(cāng)庫(kù),以企業(yè)的業(yè)務(wù)模型為根底,確定需求建立可以描畫(huà)主要業(yè)務(wù)主題的數(shù)據(jù)模型;設(shè)計(jì)數(shù)據(jù)倉(cāng)庫(kù),根據(jù)邏輯模型和性能要求進(jìn)展物理模型的設(shè)計(jì),制定數(shù)據(jù)存儲(chǔ)戰(zhàn)略以及各種商業(yè)規(guī)那么等;
(3)構(gòu)造數(shù)據(jù)分析模型根據(jù)企業(yè)需求分析的對(duì)象和目的,構(gòu)造有針對(duì)性的分析模型。針對(duì)客戶對(duì)企業(yè)的奉獻(xiàn)差別,構(gòu)造客戶盈利才干分析模型;針對(duì)客戶對(duì)企業(yè)信譽(yù)程度的不同,構(gòu)造客戶信譽(yù)分析模型;根據(jù)客戶對(duì)產(chǎn)品功能的需求不同,構(gòu)造客戶分類分析模型;根據(jù)客戶的獲得、流失情況,構(gòu)造客戶獲取流失分析模型等等。(4)建立客戶知識(shí)管理系統(tǒng)建立一個(gè)動(dòng)態(tài)的客戶知識(shí)庫(kù)以及制定客戶知識(shí)的分發(fā)規(guī)那么和保管機(jī)制。與客戶數(shù)據(jù)倉(cāng)庫(kù)一樣,客戶知識(shí)管理系統(tǒng)也不是一開(kāi)場(chǎng)就能建立好的,它需求在運(yùn)用的過(guò)程中進(jìn)展不斷地調(diào)整和完善,是一個(gè)動(dòng)態(tài)完成的系統(tǒng)。客戶行為分析(獲取新客戶、客戶流失與堅(jiān)持分析、客戶盈利才干分析)獲取新客戶獲取新客戶就是“壓服〞本來(lái)不是他的客戶的消費(fèi)者成為他的客戶。這些消費(fèi)者能夠是對(duì)他的產(chǎn)品/效力不了解的顧客,也能夠是他的產(chǎn)品/效力的潛在消費(fèi)者,還能夠是他競(jìng)爭(zhēng)對(duì)手的客戶。針對(duì)這些不同的消費(fèi)者需求采用不同的戰(zhàn)略才干有效的獲取到新客戶。另外,在獲取新客戶之前,不得不確定哪些消費(fèi)者是值得努力的,預(yù)測(cè)不同客戶對(duì)營(yíng)銷努力的反映情況也是提高獲取新客戶勝利率的一個(gè)前提。還有,客戶分優(yōu)劣,有些客戶獲得時(shí)付出的努力要比他們成為公司客戶后奉獻(xiàn)的利潤(rùn)低,這樣的客戶還是不獲得為好。因此,企業(yè)要想經(jīng)過(guò)CRM有效獲得新客戶,必需明確不同客戶的特性。目的市場(chǎng)在哪里?哪些客戶是企業(yè)的潛在客戶?哪些潛在客戶是優(yōu)質(zhì)客戶?客戶獲取的難易程度如何?常用的數(shù)據(jù)發(fā)掘技術(shù)和方法有分類與預(yù)測(cè)、聚類、關(guān)聯(lián)分析和異類分析等。例如用關(guān)聯(lián)的方法,經(jīng)過(guò)發(fā)現(xiàn)諸如“在購(gòu)買A商品后,一段時(shí)間里顧客會(huì)接著購(gòu)買商品B,而后購(gòu)買商品C〞這樣的知識(shí),來(lái)構(gòu)成“A-B--C〞客戶行為方式。還可以對(duì)現(xiàn)有客戶特征進(jìn)展聚類分析,建立客戶特征模型,以最有效地預(yù)測(cè)目的市場(chǎng)和發(fā)現(xiàn)潛在客戶。
K-近鄰分類方法根本思想:K-近鄰分類是基于類比學(xué)習(xí)的,每個(gè)樣本代表d維空間的一個(gè)點(diǎn)。當(dāng)給定一個(gè)未知樣本時(shí),K-近鄰分類法將搜索樣本空間,找出最接近未知樣本的K個(gè)訓(xùn)練樣本,這K個(gè)訓(xùn)練樣本是未知樣本的K個(gè)“近鄰〞。近鄰性普通用歐幾里德間隔定義:或采用絕對(duì)值間隔:缺陷:計(jì)算量大優(yōu)點(diǎn):適宜各種數(shù)據(jù)類型的數(shù)據(jù)
利用K-近鄰方法進(jìn)展?jié)撛诳蛻纛A(yù)測(cè)調(diào)查的客戶本身屬性:企業(yè)總資產(chǎn)值、年銷售收入、距電器銷售公司的地理間隔及企業(yè)所處地域的經(jīng)濟(jì)興隆程度??蛻舻南M(fèi)屬性為過(guò)去一年內(nèi)對(duì)電器銷售公司的總購(gòu)買額。1.數(shù)據(jù)處置:銷售公司把客戶的消費(fèi)屬性分為10萬(wàn)元以下、10萬(wàn)至100萬(wàn)、100萬(wàn)500萬(wàn)、500萬(wàn)以上四個(gè)區(qū)間,分別取值1,2,3,4;把企業(yè)所處地域的經(jīng)濟(jì)興隆程度根據(jù)實(shí)踐情況分為貧困、欠興隆、興隆、極興隆四檔,分別取值1,2,3,4;其他客戶屬性(企業(yè)總資產(chǎn)值、年銷售收入、距銷售公司的地理間隔)也經(jīng)過(guò)區(qū)間劃分完成量化及歸一化處置。表1是經(jīng)過(guò)規(guī)范化處置的老客戶數(shù)據(jù),表2是經(jīng)過(guò)規(guī)范化處置的潛在客戶數(shù)據(jù)。表1老客戶數(shù)據(jù)老客戶總資產(chǎn)年銷售收入地理距離所處發(fā)達(dá)程度年總購(gòu)買額11.51.61.20.4221.53.21.20.63310.80.40.2141.53.20.40.84511.60.40.4260.51.60.40.42………………………………表2潛在客戶數(shù)據(jù)潛在客戶總資產(chǎn)年銷售收入地理距離所處發(fā)達(dá)程度年總購(gòu)買額A1.51.61.20.4待預(yù)測(cè)B0.81.20.40.2待預(yù)測(cè)………………………………2.預(yù)測(cè)為了預(yù)測(cè)客戶A對(duì)公司電器產(chǎn)品的年購(gòu)買額,我們只須從處置后的老客戶數(shù)據(jù)中找到K個(gè)最近鄰(這里設(shè)定K=2)。例如:A與客戶1的間隔:D(A,l)=(1.5-1)+(2.4-1.6)+(1.6-1.2)+(0.4-0.4)=1.7,同理計(jì)算可得到:D(A,2)=1.9,D(A,3)=3,D(A,4)=2.9,D(A,5)=1.6,D(A,6)=2.5可以看出,A的2個(gè)最近鄰為老客戶1和5,可以預(yù)測(cè)其對(duì)公司電器產(chǎn)品的年購(gòu)買額將在10萬(wàn)和100萬(wàn)之間,我們還可以從處置之前的老客戶數(shù)據(jù)庫(kù)中得到客戶1和5的實(shí)踐年購(gòu)買額,以對(duì)A的年購(gòu)買額進(jìn)展更準(zhǔn)確的估計(jì),假設(shè)銷售公司規(guī)定年總購(gòu)買額在500萬(wàn)以上的是公司的重點(diǎn)客戶,那么我們可以進(jìn)一步預(yù)測(cè)潛在客戶的類別,從而可以指定準(zhǔn)確的營(yíng)銷方案,來(lái)獲取客戶。將數(shù)據(jù)發(fā)掘運(yùn)用于客戶的獲取活動(dòng)與傳統(tǒng)的市場(chǎng)營(yíng)銷戰(zhàn)略比較其優(yōu)勢(shì)在哪里?下面我們經(jīng)過(guò)一個(gè)例子進(jìn)展詳細(xì)的闡明。某大銀行A進(jìn)展直郵的市場(chǎng)營(yíng)銷活動(dòng)以獲取信譽(yù)卡客戶,向100萬(wàn)名潛在客戶提供信譽(yù)卡的懇求表。運(yùn)用傳統(tǒng)的做法,A銀行向這100萬(wàn)名潛在客戶寄出信譽(yù)卡懇求表,共有6%的郵件得到懇求回應(yīng)。得到這些潛在客戶的回應(yīng)后,需根據(jù)信譽(yù)風(fēng)險(xiǎn)程度對(duì)它們的懇求進(jìn)展挑選,毫無(wú)疑問(wèn),往往是信譽(yù)差的潛在客戶更能夠懇求信譽(yù)卡,所以最終挑選后的結(jié)果只需16%的回應(yīng)者是符合信譽(yù)要求的,即大約占總潛在客戶的1%(6%×16%≈1%)成為最終客戶。A銀行郵寄一份懇求表需破費(fèi)¥1的費(fèi)用,每個(gè)客戶在隨后的兩年將為銀行帶來(lái)¥125的利潤(rùn)。那么用傳統(tǒng)方法營(yíng)銷得到的凈報(bào)答:¥250,000(¥125×10,000-¥1×1,000,000=Y250,000)數(shù)據(jù)發(fā)掘技術(shù)的運(yùn)用首先,A銀行寄出50,000份進(jìn)展測(cè)試,并對(duì)反響的結(jié)果進(jìn)展分析,將這些數(shù)據(jù)作為訓(xùn)練數(shù)據(jù)運(yùn)用數(shù)據(jù)發(fā)掘算法建立預(yù)測(cè)模型,包括潛在客戶的回應(yīng)的模型(可以用決策樹(shù)方法)和信譽(yù)評(píng)分模型(可以用神經(jīng)網(wǎng)絡(luò)方法)。然后,結(jié)合這兩個(gè)模型找出哪些潛在客戶的信譽(yù)風(fēng)險(xiǎn)低且很大能夠會(huì)接受提供的懇求表。根據(jù)這些方法,A銀行在剩下的950,000個(gè)潛在客戶中選取其中信譽(yù)好的700,000個(gè)進(jìn)展郵寄。結(jié)果是,經(jīng)過(guò)這郵寄的750,000份懇求表,共收到9,000個(gè)潛在客戶接受信譽(yù)卡,即接受的比率為1.2%(9,000÷750,000=1.2%),比傳統(tǒng)方法的1%提高了20個(gè)百分點(diǎn)。還有1,000個(gè)客戶在未寄的250,000個(gè)潛在客戶中,他們是被模型挑選掉的,很明顯,假設(shè)對(duì)他們也進(jìn)展郵寄的話,需破費(fèi)¥250,000但他們帶來(lái)的利益只需¥125,000(¥125×1,000=¥125,000),闡明為獲得這些客戶的本錢是大于他們所能帶來(lái)的收益的,故將他們放棄。表3傳統(tǒng)方法和數(shù)據(jù)發(fā)掘方法獲取新客戶的比較指標(biāo)傳統(tǒng)方法數(shù)據(jù)挖掘方法差異郵寄總數(shù)量1,000,000750,000250,000郵寄總成本¥1,000,000¥750,000¥250,000成為新客戶的數(shù)量10,0009,0001,000每個(gè)新客戶帶來(lái)的毛利¥125¥125¥0總毛利¥1,250,000¥1,125,000¥125,000凈利潤(rùn)¥250,000¥375,000¥125,000數(shù)據(jù)挖掘建模成本¥0¥40000¥40000最終凈利潤(rùn)¥250,000¥335,000¥85,000從表中可以看到,凈利潤(rùn)添加了¥125,000,即使減去數(shù)據(jù)發(fā)掘的本錢¥40,000其最終凈利潤(rùn)也還多出¥85,000。另外,本例中建立模型的投資報(bào)答率(ROT)也比較高,為212.5%(¥85,000÷¥40,000=212.5%。從而顯示了將數(shù)據(jù)發(fā)掘技術(shù)運(yùn)用與新客戶獲取中的優(yōu)勢(shì)所在。決策樹(shù)分類方法決策樹(shù)提供了一種展現(xiàn)類似在什么條件下會(huì)得到什么值這類規(guī)那么的方法。比如,在貸款懇求中,要對(duì)懇求的風(fēng)險(xiǎn)大小做出判別,圖1是為理處理這個(gè)問(wèn)題而建立的一棵決策樹(shù),從中我們可以看到?jīng)Q策樹(shù)的根本組成部分:決策節(jié)點(diǎn)、分支和葉子。是否是否是否收入>40000任務(wù)時(shí)間>5年高負(fù)債低風(fēng)險(xiǎn)高風(fēng)險(xiǎn)低風(fēng)險(xiǎn)高風(fēng)險(xiǎn)決策樹(shù)的每個(gè)節(jié)點(diǎn)子節(jié)點(diǎn)的個(gè)數(shù)與決策樹(shù)運(yùn)用的算法有關(guān)。如CART算法得到的決策樹(shù)每個(gè)節(jié)點(diǎn)有兩個(gè)分支,這種樹(shù)稱為二叉樹(shù)。允許節(jié)點(diǎn)含有多于兩個(gè)子節(jié)點(diǎn)的樹(shù)稱為多叉樹(shù)。每個(gè)分支要么是一個(gè)新的決策節(jié)點(diǎn),要么是樹(shù)的結(jié)尾,稱為葉子。在沿著決策樹(shù)從上到下遍歷的過(guò)程中,在每個(gè)節(jié)點(diǎn)都會(huì)遇到一個(gè)問(wèn)題,對(duì)每個(gè)節(jié)點(diǎn)上問(wèn)題的不同回答導(dǎo)致不同的分支,最后會(huì)到達(dá)一個(gè)葉子節(jié)點(diǎn)。這個(gè)過(guò)程就是利用決策樹(shù)進(jìn)展分類的過(guò)程,即利用幾個(gè)變量〔每個(gè)變量對(duì)應(yīng)一個(gè)問(wèn)題〕來(lái)判別所屬的類別〔最后每個(gè)葉子會(huì)對(duì)應(yīng)一個(gè)類別〕。常用的算法有分類回歸樹(shù)CART、ID3、和C4.5等
ID3算法運(yùn)用信息熵實(shí)際,選擇當(dāng)前樣本屬性集中具有最大信息增益值的屬性作為測(cè)試屬性。該屬性使得對(duì)結(jié)果劃分中的樣本分類所需的信息量最小,并反映劃分的最小隨機(jī)性或“不純性〞。這種信息實(shí)際方法使得對(duì)一個(gè)對(duì)象分類所需的期望測(cè)試數(shù)目到達(dá)最小,并確保找到一棵簡(jiǎn)單樹(shù)。設(shè)S是s個(gè)數(shù)據(jù)樣本的集合。假定類標(biāo)號(hào)屬性具有m個(gè)不同值,定義m個(gè)不同類(i=1,?,m)。設(shè)是類中的樣本數(shù)。對(duì)一個(gè)給定的樣本分類所需的期望信息是:其中是恣意樣本屬于的概率,并用估計(jì)。設(shè)屬性A為測(cè)試屬性,它具有V個(gè)不同的值用表示屬性A取值為的樣本子集屬于類的樣本數(shù)。那么按照屬性A的每個(gè)屬性值進(jìn)展分割的期望信息稱作A的熵,由下式給出:在A上分割獲得的信息增益定義為:根據(jù)上述方法,計(jì)算每個(gè)屬性的信息增益,屬性的信息增益越大,區(qū)分度越大。經(jīng)過(guò)對(duì)一組訓(xùn)練數(shù)據(jù)的學(xué)習(xí),構(gòu)造出決策樹(shù)方式的知識(shí)表示,在決策樹(shù)的內(nèi)部結(jié)點(diǎn)進(jìn)展屬性值的比較并根據(jù)不同的屬性值判別從該結(jié)點(diǎn)向下的分支,在決策樹(shù)葉結(jié)點(diǎn)得到結(jié)論。所以從根到葉結(jié)點(diǎn)的一條途徑就對(duì)應(yīng)著一條規(guī)那么,整棵決策樹(shù)就對(duì)應(yīng)著一組析取表達(dá)式規(guī)那么?;跊Q策樹(shù)學(xué)習(xí)算法的一個(gè)最大的優(yōu)點(diǎn)就是它在學(xué)習(xí)過(guò)程中不需求運(yùn)用者了解很多背景知識(shí)。這樣只需訓(xùn)練實(shí)例可以用屬性—結(jié)論式的方式表達(dá)出來(lái),就能運(yùn)用該算法來(lái)進(jìn)展學(xué)習(xí)。Id職業(yè)收入地區(qū)年齡反應(yīng)1銷售<=2000華北年輕02銷售<=2000華東年輕13銷售<=2000華東中年04非銷售>2000華東中年15非銷售>2000華北老年16非銷售>2000其它老年17非銷售<=2000西北中年08銷售>2000華北年輕19銷售>2000西北中年010銷售<=2000西北年輕011銷售<=2000東北中年012非銷售<=2000其它中年013銷售>2000華北年輕114非銷售>2000東北中年115銷售>2000西北年輕1根據(jù)表中的數(shù)據(jù),類反響有兩個(gè)不同的值(0,1),因此有兩個(gè)不同的類〔m=2〕。設(shè)類C1=0,類C2=1。那么類C1有7個(gè)樣本,類C2有8個(gè)樣本。那么給定樣本分類的期望信息為:I(s1,s2)=I(7,8)=-7/15㏒2(7/15)-8/15㏒2(8/15)=0.997如今計(jì)算每個(gè)屬性的熵,〔1〕職業(yè):銷售:S11=5,S21=4那么I(S11,S21)=0.991非銷售:S12=2,S22=4那么I(S12,S22)=0.918信息增益:E(職業(yè))=(S11+S21)*I(S11,S21)/S+(S12+S22)*I(S12,S22)/S=0.991*9/15+0.918*6/15=0.9618GAIN(職業(yè))=0.997-0.9618=0.0352同理:〔2〕收入:GAIN(收入)=0.4308〔3〕地域:GAIN(地域)=0.114〔4〕年齡:GAIN(年齡)=0.226圖2按照“收入〞分割得到的決策樹(shù)圖3最終決策樹(shù)從圖3中我們可以很直觀的分析出客戶懇求信譽(yù)卡對(duì)“收入〞、“年齡〞、“地域〞、“職業(yè)〞四個(gè)屬性的反響??梢缘贸鲆幌乱?guī)那么:1〕當(dāng)收入小于等于2000元,假設(shè)年齡為中年的話普通沒(méi)有興趣;2〕當(dāng)收入小于等于2000元,來(lái)自地域?yàn)槿A北、西北、東北或其它的年輕人,普通沒(méi)有興趣;3〕當(dāng)收入小于等于2000元,來(lái)自地域?yàn)槿A東且為年輕人普通有興趣;4〕當(dāng)收入大于2000元,且來(lái)自華北、華東、東北或其它地域,普通有興趣;5〕當(dāng)收入大于2000元,來(lái)自西北地域且為年輕人普通有興趣;6〕當(dāng)收入大于2000元,來(lái)自西北地域且為中年人普通沒(méi)有興趣。選擇了適宜的算法后,我們只需求把切分看成是把一組數(shù)據(jù)分成幾份,份與份之間盡量不同,而同一份內(nèi)的數(shù)據(jù)盡量一樣。假設(shè)經(jīng)過(guò)一次切分后得到的分組,每個(gè)分組中的數(shù)據(jù)都屬于同一個(gè)類別,顯然到達(dá)這樣效果的切分方法就是我們所追求的。假定我們利用歷史數(shù)據(jù)建立了一個(gè)包含幾百個(gè)屬性、輸出的類有十幾種的決策樹(shù),這樣的一棵樹(shù)對(duì)人來(lái)說(shuō)能夠太復(fù)雜了,但每一條從根結(jié)點(diǎn)到葉子節(jié)點(diǎn)的途徑所描畫(huà)的含義依然是可以了解的。決策樹(shù)的這種易了解性對(duì)數(shù)據(jù)發(fā)掘的運(yùn)用者來(lái)說(shuō)是一個(gè)顯著的優(yōu)點(diǎn)。然而決策樹(shù)的這種明確性能夠帶來(lái)誤導(dǎo)。比如,決策樹(shù)每個(gè)節(jié)點(diǎn)對(duì)應(yīng)分割的定義都是非常明確毫不模糊的,但在實(shí)踐生活中這種明確能夠帶來(lái)費(fèi)事〔憑什么說(shuō)年收入2001的人懇求信譽(yù)卡,而2000的人就沒(méi)有〕。另外,樹(shù)的大小與樣本數(shù)量無(wú)關(guān),計(jì)算量較小??蛻魣?jiān)持和流失客戶開(kāi)展階段:潛在客戶—新客戶—稱心的客戶—留住的客戶—老客戶。經(jīng)濟(jì)學(xué)廣泛運(yùn)用的“80/20定律〞(佩爾圖定律),詳細(xì)到CRM中是說(shuō)企業(yè)80%的利潤(rùn)是由前20%的客戶所發(fā)明的;又如1989年的哈佛商業(yè)評(píng)論中提到假設(shè)客戶堅(jiān)持率提高5%,平均每位客戶的價(jià)值就能添加25%到100%。這些數(shù)字都充分闡明了提高客戶的忠實(shí)度、堅(jiān)持好的客戶對(duì)于企業(yè)本身的利益是至關(guān)重要的。比如在美國(guó),挪動(dòng)通訊公司每獲得一個(gè)新用戶的本錢平均是300美圓,而挽留住一個(gè)老客戶的本錢能夠僅僅是通一個(gè)。因此客戶關(guān)系管理首先提倡的是堅(jiān)持現(xiàn)有客戶,實(shí)現(xiàn)現(xiàn)有客戶的反復(fù)購(gòu)買是企業(yè)追求的首要目的。其次才是開(kāi)辟新市場(chǎng),吸引新客戶。經(jīng)過(guò)數(shù)據(jù)發(fā)掘可以發(fā)現(xiàn)流失客戶的特征,這樣就可以在那些具有類似特征的客戶還未流失之前進(jìn)展針對(duì)性的彌補(bǔ)。例如一家挪動(dòng)通訊公司發(fā)掘出的結(jié)果是:年齡在26歲以下、開(kāi)通了WAP效力、挪動(dòng)價(jià)值(購(gòu)買時(shí))在1800-2800元、每月通話費(fèi)在250-350元之間(包月制那么是200元和280元兩檔)的男性流失的比例最高。掌握了這些信息,就可以針對(duì)每個(gè)人的奉獻(xiàn),滿足他們的一些需求??蛻袅魇У木売芍饕幸韵?種類型:自然流失客戶流失不是人為要素呵斥的,比如客戶的搬遷和死亡等。自然流失所占的比例很小。企業(yè)可以經(jīng)過(guò)建立連鎖效力網(wǎng)點(diǎn)和運(yùn)營(yíng)分公司,或者提供網(wǎng)上效力等方式,讓客戶在任何地方、任何時(shí)候都能方便快捷地運(yùn)用企業(yè)的產(chǎn)品和效力,減少自然流失的發(fā)生。惡意流失是指一些客戶為了滿足本人的某些私利而分開(kāi)企業(yè),比如很多電信運(yùn)營(yíng)商的用戶在拖欠了大額通訊費(fèi)用后分開(kāi)這家電信運(yùn)營(yíng)商,選擇其他電信運(yùn)營(yíng)商提供的效力,從而到達(dá)不交費(fèi)用的目的。惡意流失在客戶流失中所占的比例也不大。企業(yè)可以經(jīng)過(guò)客戶信譽(yù)管理制度和欺詐監(jiān)測(cè)來(lái)防止客戶的惡意流失行為。競(jìng)爭(zhēng)流失由于企業(yè)競(jìng)爭(zhēng)對(duì)手的影響而呵斥的流失稱為競(jìng)爭(zhēng)流失。市場(chǎng)上的競(jìng)爭(zhēng)突出表如今價(jià)錢戰(zhàn)和效力戰(zhàn)上。過(guò)失流失客戶流失都是由于企業(yè)本身任務(wù)中的過(guò)失引起客戶的不稱心而呵斥的,比如企業(yè)籠統(tǒng)不佳、產(chǎn)品性能不好、效力態(tài)度惡劣等。過(guò)失流失在客戶流失總量中所占的比例最高,但同時(shí)也是企業(yè)可以經(jīng)過(guò)采取一些有效手段來(lái)防止的??蛻袅魇ьA(yù)測(cè)分析能協(xié)助企業(yè)了解客戶將要分開(kāi)的信號(hào),使企業(yè)有充分的時(shí)間采取措施挽留有流失傾向的客戶。在客戶關(guān)系分析中,客戶流失預(yù)測(cè)分析模型的可解釋性非常重要,企業(yè)要能明晰地了解分類模型中的各個(gè)要素以及各個(gè)要素的作用程度,根據(jù)分類模型了解影響客戶流失的要素,以便于企業(yè)做出相應(yīng)的改良。影響客戶流失的要素主要從以下幾個(gè)層面思索,競(jìng)爭(zhēng)對(duì)手情況:競(jìng)爭(zhēng)對(duì)手最近開(kāi)發(fā)新產(chǎn)品情況、競(jìng)爭(zhēng)對(duì)手最近開(kāi)發(fā)新促銷戰(zhàn)略;企業(yè)和員工籠統(tǒng):產(chǎn)品更新快慢程度、員工的態(tài)度和籠統(tǒng)、員工的流動(dòng)率、企業(yè)文化和籠統(tǒng);客戶購(gòu)買行為:客戶能否接觸競(jìng)爭(zhēng)對(duì)手的產(chǎn)品、客戶對(duì)企業(yè)的稱心度、客戶與企業(yè)交往的時(shí)間長(zhǎng)度、客戶最近的購(gòu)買頻率和數(shù)量的變化情況;產(chǎn)品和效力質(zhì)量:效力體制能否完善、客戶贊揚(yáng)能否處置、效力質(zhì)量和效力的及時(shí)性、產(chǎn)品的質(zhì)量和價(jià)錢;客戶流失模型的建立和運(yùn)用過(guò)程如下:在客戶數(shù)據(jù)倉(cāng)庫(kù)中抽取適當(dāng)?shù)淖侄谓M成客戶分析數(shù)據(jù)庫(kù),為客戶描畫(huà)和客戶流失模型提供數(shù)據(jù)源;客戶流失預(yù)測(cè)分析屬于數(shù)據(jù)發(fā)掘中的分類,客戶能否己經(jīng)流失為類標(biāo)號(hào),因此,根據(jù)客戶能否流失情況,將客戶分析數(shù)據(jù)庫(kù)分別為當(dāng)前客戶數(shù)據(jù)庫(kù)和流失客戶數(shù)據(jù)庫(kù);對(duì)流失客戶數(shù)據(jù)庫(kù)進(jìn)展分析,建立客戶流失模型。隨機(jī)選擇流失客戶中的2/3為訓(xùn)練數(shù)據(jù),建立分類器,得出分類模型。將剩下的1/3數(shù)據(jù)作為測(cè)試數(shù)據(jù)代入分類模型中,預(yù)測(cè)準(zhǔn)確率。假設(shè)準(zhǔn)確率過(guò)低,那么反復(fù)以上過(guò)程,直到分類模型的準(zhǔn)確率滿足用戶的需求,得出客戶流失模型;從客戶流失模型中分析影響客戶流失的各種緣由,找出企業(yè)的缺乏之處,發(fā)現(xiàn)流失者的行為特征。運(yùn)用客戶流失模型在當(dāng)前客戶數(shù)據(jù)庫(kù)中發(fā)現(xiàn)預(yù)測(cè)有流失傾向的客戶群體。在預(yù)測(cè)客戶的流失建模中較為常用的數(shù)據(jù)發(fā)掘算法是CART(ClassificationandRegressionTrees,分類回歸樹(shù)),它是分類方法中決策樹(shù)的一種算法。雖然其他的一些數(shù)據(jù)發(fā)掘技術(shù),如神經(jīng)網(wǎng)絡(luò)也可以產(chǎn)生很好的預(yù)測(cè)模型,但是這些模型很難了解。當(dāng)用這些模型做預(yù)測(cè)分析時(shí),很難對(duì)客戶流失的緣由有深化的了解,更得不到如何對(duì)付客戶流失的任何線索。在這種情況下,普通需求運(yùn)用決策樹(shù)或聚類技術(shù)等分類方法進(jìn)一步的分類,來(lái)得到更深化的了解,所以生成的預(yù)測(cè)模型就相對(duì)復(fù)雜的多??蛻袅魇?shù)據(jù)集有其本身較為顯著的特點(diǎn):客戶流失數(shù)據(jù)集中包含較多的延續(xù)值屬性,如客戶的年齡,收入信息,各項(xiàng)消費(fèi)信息等??蛻袅魇?shù)據(jù)集是一個(gè)典型的非平衡分布數(shù)據(jù)集。流失客戶與非流失客戶之間相差的比例很大。流失客戶在數(shù)據(jù)集中普通只占一個(gè)較小的比例。分類算法在處置非平衡數(shù)據(jù)集的分類問(wèn)題時(shí),容易遭到樣本類別分布的影響,對(duì)少數(shù)類的分類精度不高,其效果并不理想。例如:TeleData為某電信運(yùn)營(yíng)商提供的客戶信息數(shù)據(jù)集,其中包括用戶的人口統(tǒng)計(jì)特征和通訊消費(fèi)特征,經(jīng)過(guò)數(shù)據(jù)發(fā)掘技術(shù),發(fā)掘出流失客戶的分類模型,從而提出戰(zhàn)略,指點(diǎn)客戶挽留。客戶忠實(shí)度分析客戶忠實(shí)度普通是指客戶堅(jiān)持反復(fù)購(gòu)買或惠顧本人喜歡的同一品牌的產(chǎn)品或效力,不受環(huán)境和市場(chǎng)的影響??蛻糁覍?shí)主要表如今以下幾個(gè)方面:〔1〕會(huì)經(jīng)常反復(fù)地購(gòu)買本企業(yè)的產(chǎn)品或效力,甚至可以定量分析出他們的購(gòu)買頻數(shù);〔2〕在購(gòu)買企業(yè)產(chǎn)品或效力時(shí),選擇呈多樣性,但是優(yōu)先關(guān)懷和選擇其忠實(shí)的企業(yè)品牌的產(chǎn)品或效力以及其產(chǎn)品或效力的開(kāi)展情況;〔3〕樂(lè)于向他人引薦本企業(yè)產(chǎn)品,被引薦者相對(duì)于其他客戶會(huì)更容易地認(rèn)同引薦的產(chǎn)品或效力;〔4〕會(huì)排斥本企業(yè)的競(jìng)爭(zhēng)對(duì)手,只需忠實(shí)的紐帶未被突破,他們甚至不屑于略勝一籌的競(jìng)爭(zhēng)對(duì)手。衡量客戶忠實(shí)的獨(dú)一尺度就是客戶能否反復(fù)或耐久地購(gòu)買企業(yè)的產(chǎn)品或者效力,顧客忠實(shí)表達(dá)為詳細(xì)的購(gòu)買行為,具有很強(qiáng)的客觀現(xiàn)實(shí)顏色,是實(shí)真實(shí)在的。而客戶忠實(shí)的誘因主要是客戶稱心,顧客稱心是一種期望值與感知效果的比較,是一種心思反響,它取決于顧客的“期望〞,具有很強(qiáng)的客觀顏色。所以,客戶忠實(shí)度分析規(guī)范是一個(gè)較為模糊的概念。首先可用聚類分析進(jìn)展客戶忠實(shí)度分析,根據(jù)所得的聚類結(jié)果,將每一類賦以詳細(xì)標(biāo)志,然后進(jìn)展分類,構(gòu)造出忠實(shí)客戶的詳細(xì)特征?;蛘呤墙?jīng)過(guò)行業(yè)專家進(jìn)展標(biāo)志。在現(xiàn)有數(shù)據(jù)庫(kù)信息資源的條件限定下,客戶忠實(shí)度的分析同客戶忠實(shí)度詳細(xì)的量化定義就有了親密的聯(lián)絡(luò)。根據(jù)需求,企業(yè)可以對(duì)客戶的一些詳細(xì)表現(xiàn)設(shè)定相應(yīng)的觀測(cè)變量,如:貨款到達(dá)的及時(shí)性、購(gòu)物占購(gòu)貨企業(yè)貨物銷量總量的比例、信息的虛偽程度、貨物價(jià)錢的接受程度、繼續(xù)買賣的時(shí)間、反復(fù)購(gòu)買的次數(shù)、購(gòu)買方式等。客戶忠實(shí)度分析模型的建立和運(yùn)用過(guò)程如下:〔1〕根據(jù)己有定義選定相關(guān)的分析變量;〔2〕從企業(yè)的業(yè)務(wù)數(shù)據(jù)庫(kù)中搜集整理原始數(shù)據(jù),按客戶忠實(shí)度分析所需的字段組建企業(yè)客戶的數(shù)據(jù)倉(cāng)庫(kù)系統(tǒng);〔3〕檢驗(yàn)分類與實(shí)踐的吻合程度,選取或確定適宜的分類數(shù),目前許多企業(yè)設(shè)定為5類;〔4〕察看分析每類的特點(diǎn),給每類賦以類標(biāo)志;〔5〕對(duì)帶有忠實(shí)度類標(biāo)志的數(shù)據(jù)建立分類模型;〔6〕根據(jù)忠實(shí)度模型描畫(huà)忠實(shí)度客戶的特征,協(xié)助企業(yè)識(shí)別忠實(shí)客戶,根據(jù)客戶忠實(shí)度的不同,提出相應(yīng)的營(yíng)銷與客戶管理措施??蛻舴Q心度分析客戶稱心度分析模型的建立過(guò)程和客戶忠實(shí)度分析類似:〔1〕首先,經(jīng)過(guò)多種方式進(jìn)展客戶稱心度調(diào)查,影響客戶稱心度模型的主要要素包括:效力和系統(tǒng)支持、產(chǎn)品/效力技術(shù)表現(xiàn)、客戶互動(dòng)的要素、情感要素等。不同行業(yè)影響客戶稱心度的要素各不一樣,但是根本都離不開(kāi)這幾個(gè)層次??蛻舻姆Q心程度普通分為5個(gè)檔次,1到5分別代表“很不稱心〞、“不很稱心〞、“根本稱心〞、“稱心〞和“很稱心’?!?〕將客戶稱心度調(diào)查結(jié)果搜集記錄到企業(yè)的數(shù)據(jù)庫(kù)中,構(gòu)建客戶數(shù)據(jù)倉(cāng)庫(kù),在客戶數(shù)據(jù)倉(cāng)庫(kù)中抽取適當(dāng)?shù)淖侄谓M成客戶稱心度分析數(shù)據(jù)。這些字段包括客戶根本描畫(huà)數(shù)據(jù)和稱心度調(diào)查數(shù)據(jù)。客戶的根本描畫(huà)數(shù)據(jù),包括客戶的受教育程度、客戶的性格偏好、客戶的職業(yè)等,由于這些要素會(huì)影響客戶對(duì)外界事務(wù)的態(tài)度,因此該當(dāng)給予思索。〔3〕客戶稱心度分析屬于數(shù)據(jù)發(fā)掘中的分類,對(duì)客戶稱心度數(shù)據(jù)實(shí)施數(shù)據(jù)發(fā)掘技術(shù),建立分類器,得出分類模型。〔4〕研討客戶稱心度的分類模型,在分類模型中越接近上層的要素越是主要要素。找出使客戶稱心的關(guān)鍵要素,企業(yè)繼續(xù)在這些方面努力從而進(jìn)一步提高客戶的稱心度。找出導(dǎo)致客戶不稱心的關(guān)鍵要素,協(xié)助企業(yè)認(rèn)清缺乏,加強(qiáng)管理。交叉銷售公司與其客戶之間的商業(yè)關(guān)系是一種繼續(xù)的不斷開(kāi)展的關(guān)系。在客戶與公司建立起這種雙向的商業(yè)關(guān)系后,可以有很多種方法來(lái)優(yōu)化這種關(guān)系:延伸這種關(guān)系的時(shí)間在維持這樣的關(guān)系期間添加相互的接觸在每一次相互接觸中獲得更多的利潤(rùn)作為公司,其目的是要到達(dá)雙贏的結(jié)果,即客戶和商家都可以從中獲益??蛻臬@益是由于他們得到了更好更貼切的效力質(zhì)量,商家那么由于添加了銷售量而獲利。因此,企業(yè)就需求向已有的客戶進(jìn)展銷售,這就是交叉銷售。交叉銷售就是指他向現(xiàn)有的客戶提供新的產(chǎn)品和效力的營(yíng)銷過(guò)程。在這里,我們看一下如何回答市場(chǎng)人員經(jīng)常問(wèn)的一個(gè)問(wèn)題:“我應(yīng)該向什么人銷售什么產(chǎn)品?〞。更準(zhǔn)確的來(lái)看,這可以分成以下三個(gè)問(wèn)題:1.哪些產(chǎn)品是經(jīng)常被一塊購(gòu)買的?2.哪些產(chǎn)品是經(jīng)常被同類型的顧客購(gòu)買的?3.顧客購(gòu)買某種商品的能夠性有多大?以上三個(gè)問(wèn)題可以分別用數(shù)據(jù)發(fā)掘中的關(guān)聯(lián)、聚類、預(yù)測(cè)分析加以處理。關(guān)聯(lián)分析關(guān)聯(lián)分析就是從給定的數(shù)據(jù)集中發(fā)現(xiàn)頻繁出現(xiàn)的項(xiàng)集方式知識(shí)〔又稱關(guān)聯(lián)規(guī)那么〕。典型例子是購(gòu)物籃分析。關(guān)聯(lián)規(guī)那么研討有助于發(fā)現(xiàn)買賣數(shù)據(jù)庫(kù)中不同商品〔項(xiàng)〕之間的聯(lián)絡(luò),找出顧客購(gòu)買行為方式,如購(gòu)買了某一商品對(duì)購(gòu)買其他商品的影響。有時(shí)并不知道數(shù)據(jù)庫(kù)中數(shù)據(jù)的關(guān)聯(lián)函數(shù),即使知道也不確定,因此關(guān)聯(lián)分析生成的規(guī)那么帶有可信度。通常關(guān)聯(lián)規(guī)那么具有AB的方式,即:A1A2…AmB1B2…Bn,其中,Ai,Bj均是屬性或項(xiàng),表示數(shù)據(jù)庫(kù)中滿足X中條件的記錄也一定滿足Y中的條件。涉及到兩個(gè)概念:支持度和可信度交易ID購(gòu)買商品2000A,B,C1000A,C4000A,D5000B,E,F頻繁項(xiàng)集支持度{A}75%{B}50%{C}50%{A,C}50%假設(shè)要確定{X,Y}Z的規(guī)那么,那么支持度s表示一次買賣中包含{X,Y,Z}的能夠性??尚哦萩表示包含{X,Y}的買賣中也包含Z的條件概率。例如:上述表格中左邊是買賣工程,右邊是根據(jù)買賣的現(xiàn)實(shí)來(lái)確定的支持度,那么如今來(lái)確定在買賣現(xiàn)實(shí)中能否存在AC的規(guī)那么。Confidence(AC)=support({A,C})/support({A})=66.6%為了發(fā)掘出具有價(jià)值的規(guī)那么,通常規(guī)定最小支持度和最小置信度作為兩個(gè)參數(shù)的閾值.關(guān)聯(lián)規(guī)那么發(fā)掘可以分解為兩個(gè)步驟:首先找出買賣工程中滿足最小支持度〔minSupp〕的項(xiàng)集〔稱其為頻繁項(xiàng)集〕;然后由頻繁項(xiàng)集生成關(guān)聯(lián)規(guī)那么,對(duì)于頻繁項(xiàng)集A,假設(shè)BA,且置信度confidence(BA-B)不小于最小置信度minConf,那么BA-B構(gòu)成關(guān)聯(lián)規(guī)那么。在第一步的根底上完成第二步比較容易,所以目前的研討主要集中第一步上。關(guān)聯(lián)規(guī)那么的運(yùn)用:交叉銷售:基于消費(fèi)者的購(gòu)買方式,自動(dòng)進(jìn)展交叉銷售;商品擺放:將經(jīng)常一同購(gòu)買的東西一同擺放;流失客戶分析:可分析能否是由于某些關(guān)鍵商品缺失引起的。
。,Apriori算法是發(fā)掘關(guān)聯(lián)規(guī)那么的經(jīng)典算法,發(fā)掘的對(duì)象是諸如售貨記錄之類的數(shù)據(jù)所組成的事務(wù)數(shù)據(jù)庫(kù),而發(fā)掘的結(jié)果那么是類似于“購(gòu)買面包的同時(shí)也能夠購(gòu)買黃油〞的關(guān)聯(lián)規(guī)那么。設(shè)I={I1,I2,…,Im}是項(xiàng)的全體構(gòu)成的集合,項(xiàng)的集合稱為項(xiàng)集,包含K個(gè)項(xiàng)的項(xiàng)集稱為K-項(xiàng)集。D是數(shù)據(jù)庫(kù)事務(wù)構(gòu)成的集合,其中每個(gè)事務(wù)T又是一個(gè)項(xiàng)集,且TI。Apriori運(yùn)用一種稱作逐層搜索的迭代方法:(K-1)—項(xiàng)集用于搜索K-項(xiàng)集。即:首先找出頻繁1-項(xiàng)集的集合,記做L1;L1用于找出頻繁2-項(xiàng)集的集合L2,如此下去,直到找到Lk,k不再添加。為了提高頻繁集逐層產(chǎn)生的效率,一個(gè)稱作Apriori性質(zhì)用于緊縮搜索空間。Apriori性質(zhì):頻繁項(xiàng)集的一切非空子集都必需是頻繁的。根據(jù)定義項(xiàng)集I不滿足最小支持度閾值,那么I不是頻繁的,假設(shè)項(xiàng)A添加到I中,那么結(jié)果項(xiàng)集〔IA〕不能夠比I更頻繁。銜接:為了找LK,經(jīng)過(guò)LK-1與本人銜接產(chǎn)生候選K-項(xiàng)集的集合CK。設(shè):li是LK-1中的項(xiàng)集,li[j]表示li的第j項(xiàng)。那么Lk-1的元素l1、l2是可以銜接的,假設(shè)滿足:l1[1]=l2[1]l1[2]=l2[2]…l1[k-2]=l2[k-2]l1[k-1]<l2[k-1]那么銜接l1、l2的結(jié)果項(xiàng)集是l1[1]l1[2]l1[k-1]l2[k-1]。剪枝:CK是LK的超集。掃描數(shù)據(jù)庫(kù)確定CK中每個(gè)候選項(xiàng)集的計(jì)數(shù),從而確定LK。然而CK能夠很大,可以利用Apriori性質(zhì)進(jìn)展剪枝。假設(shè)一個(gè)候選K-項(xiàng)集的〔k-1〕-子集不在LK-1中,那么該候選也不能夠是頻繁的,可以從CK中刪除。Apriori算法主要由兩步組成:銜接與剪枝TID項(xiàng)ID列表T100I1,I2,I5T200I2,I4T300I2,I3T400I1,I2,I4T500I1,I3T600I2,I3T700I1,I3T800I1,I2,I3,I5T900I1,I2,I3項(xiàng)集計(jì)數(shù){I1}6{I2}7{I3}6{I4}2{I5}2項(xiàng)集計(jì)數(shù){I1,I2}4{I1,I3}4{I1,I4}1{I1,I5}2{I2,I3}4{I2,I4}2{I2,I5}2{I3,I5}1C1項(xiàng)集計(jì)數(shù){I1}6{I2}7{I3}6{I4}2{I5}2L1C2項(xiàng)集計(jì)數(shù){I1,I2}4{I1,I3}4{I1,I5}2{I2,I3}4{I2,I4}2{I2,I5}2L2項(xiàng)集計(jì)數(shù){I1,I2}4{I1,I3}4{I1,I5}2{I2,I3}4{I2,I4}2{I2,I5}2項(xiàng)集計(jì)數(shù){I1,I2,I3}2{I1,I2,I5}2項(xiàng)集計(jì)數(shù){I1,I2,I3}2{I1,I2,I5}2C3由頻繁項(xiàng)集產(chǎn)生關(guān)聯(lián)規(guī)那么:1)對(duì)于每個(gè)頻繁項(xiàng)集L,產(chǎn)生L的一切非空子集。2〕對(duì)于L的每個(gè)非空子集S,假設(shè)support(L)/support(S)minconf,那么輸出規(guī)那么S(L-S)例如:頻繁項(xiàng)集l={I1,I2,I5}的非空子集有:{I1,I2},{I1,I5},{I2,I5},{I1},{I2}和{I5}。關(guān)聯(lián)規(guī)那么如下:I1I2I5,confidence=2/4=50%I1I5I2,confidence=2/2=100%I2I5I1,confidence=2/2=100%I1I2I5,confidence=2/6=33%I2I1I5,confidence=2/7=29%I5I1I2,confidence=2/2=100%假設(shè)最小置信度閾值為70%,那么只需3個(gè)規(guī)那么輸出。3.3客戶分類客戶分類的方式多種多樣,企業(yè)可以根據(jù)實(shí)踐需求和本身特點(diǎn)對(duì)客戶進(jìn)展各種主題背景下的分類,例如:假設(shè)以客戶的盈利才干為橫軸,以忠實(shí)度為縱軸,可把客戶劃分為四類:高盈利才干且忠實(shí)、高盈利才干而不忠實(shí)、低盈利才干而忠實(shí)、低盈利才干而不忠實(shí);按照客戶稱心度可分為:非常稱心、很稱心、根本稱心、不稱心、很不稱心;也可以按照客戶的行業(yè)或行為進(jìn)展分類??蛻舴诸惤Y(jié)果的有效性取決于分類目的和分類方法的選擇,用于評(píng)價(jià)分類的目的需反映出客戶的特征以及企業(yè)進(jìn)展客戶分類的目的。分類目的的選擇要遵照一定的客觀規(guī)律,并應(yīng)根據(jù)企業(yè)所處的行業(yè)特點(diǎn)以及企業(yè)本身的實(shí)踐情況來(lái)選擇恰當(dāng)?shù)姆诸惸康?。客戶分類的方法:分類和聚類以K為參數(shù),把n個(gè)對(duì)象分為個(gè)簇,聚類目的是簇內(nèi)具有較高的類似度,而簇間的類似度較低。聚類的處置流程如下:首先,隨機(jī)地選擇K個(gè)對(duì)象,每個(gè)對(duì)象代表一個(gè)簇的平均值或中心。對(duì)剩余的每個(gè)對(duì)象,根據(jù)其與各個(gè)簇中心的間隔,將它劃分到最近的簇。然后重新計(jì)算每個(gè)簇的平均值。這個(gè)過(guò)程不斷反復(fù),直到準(zhǔn)那么函數(shù)收斂。通常,采用平方誤差準(zhǔn)那么,其定義如下:K-均值聚類算法的關(guān)鍵是處理如下問(wèn)題:選擇適宜的簇?cái)?shù);選擇適宜的間隔函數(shù)和評(píng)判函數(shù)。(1)確定屬性根據(jù)中國(guó)電信的行業(yè)現(xiàn)狀,可以把客戶的屬性分為三種:根本屬性、效力屬性和分析屬性。根本屬性:指客戶的原始特征,也是分辨客戶的最根本方式。包括客戶的姓名、年齡、身份證號(hào)、國(guó)籍、戶口、地域、地址、學(xué)歷、任務(wù)單位、工齡、收入、婚否、家庭情況等客戶專有特征。效力屬性指客戶與中國(guó)電信之間由效力關(guān)系和方式而產(chǎn)生的費(fèi)用與過(guò)程。包括客戶每月市內(nèi)費(fèi)、通話次數(shù)、手機(jī)通話費(fèi)、通話頻率、長(zhǎng)途通話費(fèi)及由此產(chǎn)生的效力費(fèi)、安裝費(fèi)等一系列相關(guān)效力費(fèi)用。分析屬性指電信經(jīng)過(guò)分析而產(chǎn)生的分析值。包括客戶忠實(shí)度、行為分析目的、流失率、綜合價(jià)值等分析目的。〔2〕數(shù)據(jù)規(guī)范化聚類之前普通的數(shù)據(jù)都要進(jìn)展處置,這是聚類算法與其他算法的不同之處,由于聚類算法中需求計(jì)算間隔。客戶聚類中所用的數(shù)據(jù)都是區(qū)間標(biāo)度變量,變量的度量單位的選擇將直接影響聚類分析的結(jié)果。例如,將時(shí)間單位由“年〞改為“月〞,能夠產(chǎn)生非常不同的聚類結(jié)果。普通情況下,所用的度量單位越小,變量能夠的值域就越大,這樣對(duì)聚類結(jié)果的影響也越大,為了防止對(duì)度量單位選擇的依賴,數(shù)據(jù)該當(dāng)規(guī)范化。常用的規(guī)范化的方法是將原來(lái)的度量值轉(zhuǎn)換為無(wú)單位的值,對(duì)于客戶聚類分析中的變量我們分為三種,對(duì)每種采取不同的規(guī)范化方法。1〕增益變量,即該變量的值越大,客戶價(jià)值越大,包括客戶的購(gòu)買次數(shù)、客戶在本企業(yè)的消費(fèi)額、客戶與企業(yè)堅(jiān)持買賣的時(shí)間長(zhǎng)度。對(duì)該類變量采用如下的處置方法:,2〕損益變量,即該變量的值越小,客戶價(jià)值越大,包括客戶最近一次購(gòu)買到如今的時(shí)間長(zhǎng)度。對(duì)該類變量采用如下的處置方法:3〕不能用增益和損益來(lái)衡量,即客戶提出建議或意見(jiàn)的次數(shù)。對(duì)該類變量采用如下的處置方法:〔3〕間隔度量方法的選擇K一平均聚類算法采用基于對(duì)象間的間隔來(lái)計(jì)算各個(gè)對(duì)象間的相異度?!?〕確定KK-均值聚類算法必需事先給定聚類的簇k的數(shù)目,在詳細(xì)運(yùn)用中,普通根據(jù)聚類的目的而設(shè)定聚類簇的數(shù)目。例如客戶價(jià)值分類:RFM方法是衡量客戶價(jià)值的一種重要方法,遵照現(xiàn)代管理巨匠佩拍斯先生的劃分觀念,將客戶劃分為三類:最有價(jià)值客戶、最具增長(zhǎng)性客戶、負(fù)值客戶,企業(yè)的高層經(jīng)理級(jí)決策者普通從比較宏觀的角度來(lái)了解客戶,所以將客戶分為3簇。運(yùn)用K一平均聚類算法,輸入初始參數(shù):包含47060條記錄的數(shù)據(jù)庫(kù),k=3,聚類實(shí)驗(yàn)時(shí)只選擇了幾個(gè)主要變量,其他的變量沒(méi)有參與計(jì)算。選擇的變量有:R表示客戶最近一次購(gòu)買到如今的時(shí)間長(zhǎng)度〔天〕、F表示最近兩年的購(gòu)買次數(shù)、M表示最近兩年客
溫馨提示
- 1. 本站所有資源如無(wú)特殊說(shuō)明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請(qǐng)下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請(qǐng)聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
- 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁(yè)內(nèi)容里面會(huì)有圖紙預(yù)覽,若沒(méi)有圖紙預(yù)覽就沒(méi)有圖紙。
- 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
- 5. 人人文庫(kù)網(wǎng)僅提供信息存儲(chǔ)空間,僅對(duì)用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對(duì)用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對(duì)任何下載內(nèi)容負(fù)責(zé)。
- 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請(qǐng)與我們聯(lián)系,我們立即糾正。
- 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶因使用這些下載資源對(duì)自己和他人造成任何形式的傷害或損失。
最新文檔
- 二零二五版滅火器經(jīng)銷商招募與培訓(xùn)合同3篇
- 2025年度冷鏈?zhǔn)称飞a(chǎn)項(xiàng)目1#車間能源管理服務(wù)合同4篇
- 2025年度土地經(jīng)營(yíng)權(quán)流轉(zhuǎn)合同范本
- 二零二五年度城市更新項(xiàng)目安置房租賃合同范本3篇
- 2025年陽(yáng)臺(tái)封閉工程節(jié)能環(huán)保材料供應(yīng)合同2篇
- 二零二五年度在線教育平臺(tái)股權(quán)出售合同4篇
- 二零二五版農(nóng)業(yè)機(jī)械租賃與供應(yīng)鏈管理合同4篇
- 二零二五年度電視劇特效制作與采購(gòu)合同4篇
- 二零二四年度醫(yī)院保潔人員綠化養(yǎng)護(hù)與病蟲(chóng)害防治合同3篇
- 二零二五年度智能交通系統(tǒng)承包商款項(xiàng)安全保障合同4篇
- 無(wú)人化農(nóng)場(chǎng)項(xiàng)目可行性研究報(bào)告
- 《如何存款最合算》課件
- 社區(qū)團(tuán)支部工作計(jì)劃
- 拖欠工程款上訪信范文
- 2024屆上海市金山區(qū)高三下學(xué)期二模英語(yǔ)試題(原卷版)
- 學(xué)生春節(jié)安全教育
- 《wifi協(xié)議文庫(kù)》課件
- 《好東西》:女作者電影的話語(yǔ)建構(gòu)與烏托邦想象
- 教培行業(yè)研究系列(七):出國(guó)考培的再研究供需變化的新趨勢(shì)
- GB/T 44895-2024市場(chǎng)和社會(huì)調(diào)查調(diào)查問(wèn)卷編制指南
- 高三日語(yǔ)一輪復(fù)習(xí)助詞「で」的用法課件
評(píng)論
0/150
提交評(píng)論