




版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進(jìn)行舉報或認(rèn)領(lǐng)
文檔簡介
本文格式為Word版,下載可任意編輯——粗糙集屬性約簡在客戶流失預(yù)測中的應(yīng)用
李惟肖
客戶流失預(yù)計作為客戶關(guān)系管理的主要問題,一直受到研究學(xué)者們的關(guān)注。企業(yè)通過內(nèi)部和外部的數(shù)據(jù)信息,對客戶流失狀況進(jìn)行預(yù)計,針對還未流失但有流失傾向的客戶采取相應(yīng)的營銷策略。大數(shù)據(jù)時代使得數(shù)據(jù)信息爆炸式增多,如何處理高維數(shù)據(jù)信息成為客戶流失預(yù)計的難點。利用粗糙集理論進(jìn)行屬性約簡可以降低數(shù)據(jù)維度,并有效地實現(xiàn)客戶特征選擇,從而降低客戶流失預(yù)計的運算難度,提高預(yù)計性能。
Customerchurnprediction,asthemainproblemofcustomerrelationshipmanagement,hasalwaysbeenthefocusofresearchers.Basedoninternalandexternaldatainformation,enterprisescanforecastcustomerturnoverandadoptcorrespondingmarketingstrategiesforcustomerswhohavenotyetlostbuthaveatendencytolose.Theeraofbigdatamakesdatainformationincreaseexplodes,andhowtodealwithhigh-dimensionaldatainformationbecomesthedifficultyofcustomerchurnprediction.Theattributereductionusingroughsettheorycanreducethedatadimensionandeffectivelyrealizethecustomerfeatureselection,soastoreducetheoperationaldifficultyofcustomerchurnpredictionandimprovethepredictionperformance.
粗糙集;客戶流失預(yù)計;屬性約簡;特征選擇
roughset;customerchurnprediction;attributereduction;featureselection
F274;TP18
A
1673-1069(2021)07-0120-02
1引言
客戶關(guān)系管理理論是20世紀(jì)90年代由營銷管理理論衍生出的理論分支,一直備受從業(yè)者和學(xué)者的廣泛關(guān)注??蛻絷P(guān)系管理就是圍繞客戶,一個客戶為中心進(jìn)行的營銷過程,這一過程通過客戶獲得管理、客戶識別管理、客戶保持管理3個階段來實現(xiàn)客戶與企業(yè)之間長期的合作關(guān)系。這樣不僅有助于降低企業(yè)的交易成本和開發(fā)成本,也能提高營銷效率,加強營銷效果。
客戶流失管理是客戶關(guān)系管理的重要組成部分,客戶流失一般來說就是指客戶不再消費本企業(yè)的產(chǎn)品或服務(wù),也是每個企業(yè)都會面臨的問題??蛻袅魇且粋€不確定事件,客戶流失的形成非一朝一夕,但是往往又悄無聲息、無法覺察。因此,只能通過數(shù)據(jù)分析把握這種不確定的流失規(guī)律,從而防范因客戶流失產(chǎn)生的經(jīng)營風(fēng)險和收益損失。近年來,有大量因素都促成了客戶流失預(yù)計的快速發(fā)展,大數(shù)據(jù)、人工智能、云計算等互聯(lián)網(wǎng)技術(shù)和信息技術(shù)不斷發(fā)展,使得企業(yè)可以通過收集客戶信息,再運用大數(shù)據(jù)計算、機器學(xué)習(xí)、數(shù)據(jù)挖掘等技術(shù)手段處理數(shù)據(jù),建立客戶流失預(yù)計模型。通過模型可以提取客戶的特征信息,分析預(yù)示客戶流失的行為,計算客戶在未來流失的概率。但同時,數(shù)據(jù)增多也造成了數(shù)據(jù)“維度災(zāi)難〞,分析高維數(shù)據(jù)需要花費大量的時間和成本。因此,需要在高維的數(shù)據(jù)中提取出與客戶流失相關(guān)的客戶特征,并對這些特征進(jìn)行屬性約簡,兼顧預(yù)計精度和預(yù)計效率。
2粗糙集理論
粗糙集理論是1982年由波蘭Pawlak教授提出的,用來處理模糊、不確定、不完整信息和知識的工具,它能在保持辨別能力不變的狀況下,通過知識約簡,實現(xiàn)決策或分類。與其他方法相比,粗糙集方法僅利用數(shù)據(jù)本身所提供的信息發(fā)現(xiàn)問題的規(guī)律。粗糙集理論可以與神經(jīng)網(wǎng)絡(luò)、遺傳算法等機器學(xué)習(xí)技術(shù)相結(jié)合,實現(xiàn)更廣泛、更強大、更優(yōu)良的功能,在知識獲取、智能算法、知識的不確定性度量、數(shù)據(jù)挖掘等方面都有成熟的應(yīng)用。
定義1:粗糙集理論的知識表達(dá)系統(tǒng)表示為S=(U,A,V,F(xiàn)),其中:U={u1,u2,…,u|U|}是研究對象的非空有限集合,稱為論域;A={a1,a2,…,a|U|}是屬性的非空集合;V=UVa,其中a∈A,Va是屬性a的值域;f:U×A→V是一個信息函數(shù),反映了每個研究對象每個屬性的信息,即?坌a∈A,x∈U,f(x,a)∈Va。知識表達(dá)系統(tǒng)也叫信息系統(tǒng),S=(U,A,V,f)可以簡化為S=(U,A)。
定義2:當(dāng)集合A能被集合C和集合D表示,且滿足A=C∪D,C∩D=?覫那么稱集合C為條件屬性集,集合D為決策屬性集。
屬性子集C"?哿C關(guān)于D的重要性被定義為:σCD(C")=γC(D)-γC-C"(D)。
當(dāng)C"={a}時,屬性a?哿C關(guān)于D的重要性被定義為:σCD(a)=γC(D)-γC-(a)(D)。
定義3:對于給定的信息系統(tǒng)S=(U,A,V,f),若R?哿ind(K),X?哿U,則X的R上近似集和X的R下近似集被定義為:
3粗糙集屬性約簡
粗糙集屬性約簡是粗糙集理論的一個核心內(nèi)容。大數(shù)據(jù)時代,數(shù)據(jù)信息量的增大讓學(xué)者們能更確切真實地進(jìn)行知識發(fā)現(xiàn),但高維的數(shù)據(jù)也讓整個研究過程變得繁雜和煩瑣。在信息系統(tǒng)中,并不是所有的信息都對人們作出決策或進(jìn)行預(yù)計有幫助,這其中包含了大量對目標(biāo)問題毫無貢獻(xiàn)的冗余屬性。因此,在保證信息系統(tǒng)分類不變的狀況下,從眾多數(shù)據(jù)信息中去除冗余屬性,不僅可以保持結(jié)果的確切性,還能降低運算的難度和減少運算的時間。這就是粗糙集屬性約簡的過程。
給定一個信息系統(tǒng)S=(U,A,V,f),集合C為系統(tǒng)的條件屬性集,集合D為系統(tǒng)的決策屬性集。當(dāng)A滿足以下2個條件時,稱A是條件屬性C關(guān)于決策屬性D的一個相對屬性約簡:
①posA(D)=posC(D)。
②對于A的任何一個真子集B,posB(D)=posC(D)。
條件①保證了原有的相對正域不變,條件②說明白A這個相對屬性約簡中的屬性不可再減少。設(shè)條件屬性集C={ci|i=1,2,…,n},那么對于屬性ci來說,假如滿足posC=posC-{C},則說明屬性ci對于決策是不重要的,可以刪除。條件屬性集C中的每一個屬性都需要經(jīng)過這一判斷的過程,從而形成相對屬性約簡集合A。
4基于粗糙集屬性約簡的客戶流失預(yù)計
客戶流失預(yù)計包含2個方面:一個是識別流失客戶;另一個就是客戶價值評估。識別流失客戶就是識別潛在的流失客戶,在客戶流失之前采取行動挽留客戶,這可以看作是一種“防衛(wèi)性〞的營銷方法。由于吸引新用戶的成本比挽留老用戶的成本要高3~8倍,但是老客戶的利潤貢獻(xiàn)是新客戶的10倍以上??蛻魞r值評估是客戶流失預(yù)計的另一關(guān)鍵任務(wù),不是所有的客戶都會給企業(yè)帶來利益。實際上,根據(jù)80/20法則,大多數(shù)狀況下,20%的關(guān)鍵客戶為企業(yè)創(chuàng)造了80%的收入。那么這種狀況下,企業(yè)就需要識別客戶并對客戶價值進(jìn)行評估,形成具有相像特征的多個客戶群體,向不同的客戶群體分派不同的資源,這樣才能以更少的成本支出獲得更多的經(jīng)濟收益。進(jìn)行客戶流失預(yù)計的主要目的是希望根據(jù)預(yù)計結(jié)果有針對性地進(jìn)行營銷挽留,假如只有確切的預(yù)計而沒有特性化的營銷方案是不夠的,所以識別流失客戶和客戶價值評估對于客戶流失預(yù)計來說同等重要。粗糙集屬性約簡在客戶流失預(yù)計中的應(yīng)用也主要在這2個方面。
粗糙集屬性約簡在識別流失客戶中的應(yīng)用主要表達(dá)在特征選擇。在海量的數(shù)據(jù)中選擇最有效的特征以降低數(shù)據(jù)維度,從而提高預(yù)計的性能。粗糙集屬性約簡常與機器學(xué)習(xí)方法結(jié)合進(jìn)行客戶流失預(yù)計,但高維數(shù)據(jù)會使機器學(xué)習(xí)的算法大幅增加。而且粗糙集特別適用于處理不確定性的問題,能夠處理不完整、不確定的數(shù)據(jù)。粗糙集理論是在保證不丟失原始信息的狀況下,對數(shù)據(jù)屬性進(jìn)行約簡,約簡過后的屬性特征是剔除了冗余特征后具有代表性的屬性特征,由于這些屬性特征包含了全部的信息,所以預(yù)計的結(jié)果還是有很高的可信度,卻可以大大降低機器學(xué)習(xí)的運算時間和運算量。
粗糙集屬性約簡在客戶價值評估中的應(yīng)用主要表達(dá)在客戶畫像。通過粗糙集進(jìn)行特征選擇后,每個客戶在這些特征中的表現(xiàn)不一樣,因此可以得到全方位的客戶畫像。對于企業(yè)來說,看重客戶選擇自己的產(chǎn)品或服務(wù)時能給自己帶來多少收益,這也就是企業(yè)眼中的客戶價值,企業(yè)尋常根據(jù)客戶畫像來評價和分析客戶價值。對于有流失傾向的客戶,需要通過客戶畫像才能制定出特性化的、準(zhǔn)確化的、有針對性的客戶挽留營銷方法。有高流失風(fēng)險同時又有高價值的客戶,企業(yè)可以花費更多的成本進(jìn)行挽留。同時客戶畫像也反映了客戶需求、客戶偏好、客戶行為等信息,針對這些信息可以提前準(zhǔn)備營銷策略和產(chǎn)品配置,從而預(yù)防客戶流失,盡可能地延長客
溫馨提示
- 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
- 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
- 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
- 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負(fù)責(zé)。
- 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請與我們聯(lián)系,我們立即糾正。
- 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時也不承擔(dān)用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。
最新文檔
- 醫(yī)藥公司勞動合同范本
- 醫(yī)院收費合同范本
- 農(nóng)體產(chǎn)品加工合同范本
- 醫(yī)院制氧機采購合同范本
- 絲接頭采購合同范本
- 公司買賣合同范本
- 買賣小商鋪合同范本
- 企業(yè)房產(chǎn)轉(zhuǎn)讓合同范本
- 單位考察合同范本
- 信息化合同范本
- 中國傳統(tǒng)文化 英文
- 2022年咖啡師資格證考試參考題庫及答案
- 2023年新改版教科版科學(xué)三年級下冊活動手冊參考答案(word可編輯)
- 2023年P(guān)10戶外全彩LED顯示屏預(yù)算方案報價預(yù)算
- GB/T 554-1996帶纜樁
- 馬工程教材《公共財政概論》PPT-第四章 政府消費支出
- GB/T 20313-2006建筑材料及制品的濕熱性能含濕率的測定烘干法
- 比較政治制度導(dǎo)論
- 農(nóng)村土地承包調(diào)解仲裁與仲裁庭審技巧課件
- 拉擠樹脂及其成型工藝介紹課件
- 山東省中考物理總復(fù)習(xí) 八上 第6講 質(zhì)量與密度
評論
0/150
提交評論