基于概率神經(jīng)網(wǎng)絡(luò)的潛在客戶挖掘_第1頁
基于概率神經(jīng)網(wǎng)絡(luò)的潛在客戶挖掘_第2頁
基于概率神經(jīng)網(wǎng)絡(luò)的潛在客戶挖掘_第3頁
基于概率神經(jīng)網(wǎng)絡(luò)的潛在客戶挖掘_第4頁
基于概率神經(jīng)網(wǎng)絡(luò)的潛在客戶挖掘_第5頁
已閱讀5頁,還剩2頁未讀, 繼續(xù)免費(fèi)閱讀

下載本文檔

版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進(jìn)行舉報或認(rèn)領(lǐng)

文檔簡介

1、摘 要 本文利用概率神經(jīng)網(wǎng)絡(luò)對潛在客戶的相關(guān)數(shù)據(jù)進(jìn) 行分析處理,訓(xùn)練神經(jīng)網(wǎng)絡(luò)得到潛在客戶對促銷響應(yīng)的預(yù)測模 型,模型將客戶分為響應(yīng)客戶和不響應(yīng)客戶兩類,指導(dǎo)企業(yè)有 效地進(jìn)行促銷活動,提高企業(yè)的投資收益率。關(guān)鍵詞 概率神經(jīng)網(wǎng)絡(luò) 數(shù)據(jù)挖掘 客戶響應(yīng)率1 引言客戶是企業(yè)收入的直接來源,不斷獲得新客戶是企業(yè)持續(xù) 成長的關(guān)鍵,但是企業(yè)在促銷中如果對所有客戶進(jìn)行宣傳,花費(fèi) 的成本太高,因此企業(yè)迫切需要在眾多潛在客戶中挖掘那些最 有可能對產(chǎn)品響應(yīng)的客戶,以提高企業(yè)的促銷響應(yīng)率。本文利 用概率神經(jīng)網(wǎng)絡(luò)對潛在客戶的相關(guān)數(shù)據(jù)進(jìn)行分析處理,訓(xùn)練神 經(jīng)網(wǎng)絡(luò)得到潛在客戶對促銷響應(yīng)的預(yù)測模型,模型將客戶分為 響應(yīng)客戶和不

2、響應(yīng)客戶兩類,指導(dǎo)企業(yè)有效地進(jìn)行促銷活動, 提高企業(yè)的投資收益率。概率神經(jīng)網(wǎng)絡(luò)是由Specht博士在1989年提出的,他采用 Parzen提出的由高斯函數(shù)為基函數(shù)來形成聯(lián)合概率密度分布的估 計方法和貝葉斯優(yōu)化規(guī)則,是一種可用于模式分類的神經(jīng)網(wǎng)絡(luò), 其實質(zhì)是基于貝葉斯最小風(fēng)險準(zhǔn)則發(fā)展而來的一種并行算法。 該網(wǎng)絡(luò)是將Bayes網(wǎng)絡(luò)與前饋神經(jīng)網(wǎng)絡(luò)相結(jié)合的概率神經(jīng)網(wǎng)絡(luò)模 型,具有訓(xùn)練時間短和能產(chǎn)生Bayes后驗概率的輸出的特點(diǎn)。概率神經(jīng)網(wǎng)絡(luò)構(gòu)造了一種概率密度分類估計、并行處理的 4層神經(jīng)網(wǎng)絡(luò)結(jié)構(gòu)。與其他方法相比,概率神經(jīng)網(wǎng)絡(luò)為單向網(wǎng) 絡(luò),不需要多次重復(fù)的訓(xùn)練,穩(wěn)定收斂于貝葉斯優(yōu)化解,只進(jìn) 行滑因子的估

3、計,網(wǎng)絡(luò)訓(xùn)練速度高出BP網(wǎng)絡(luò)5個數(shù)量級以上,完 全滿足現(xiàn)場學(xué)習(xí)的要求,為構(gòu)造應(yīng)用系統(tǒng)提供了有力工具。實 例計算表明,概率神經(jīng)網(wǎng)絡(luò)在潛在客戶分類中優(yōu)于傳統(tǒng)的方法 如線性回歸、BP神經(jīng)網(wǎng)絡(luò)。2 基于概率神經(jīng)網(wǎng)絡(luò)的潛在客戶挖掘2.1 確定業(yè)務(wù)對象企業(yè)將要推出一款新的產(chǎn)品,為了進(jìn)行宣傳推廣,要對潛基于概率神經(jīng)網(wǎng)絡(luò)的潛在客戶挖掘陳曉琴(重慶交通大學(xué)·重慶南岸在的客戶進(jìn)行推銷,需要找出哪些是企業(yè)的潛在客戶。企業(yè)在 過去營銷過程中積累了大量的歷史數(shù)據(jù),而且可以獲得大量的 相關(guān)客戶的公眾信息,以及這些客戶在以往銷售過程中的反應(yīng) 情況。企業(yè)可利用概率神經(jīng)網(wǎng)絡(luò)對這些商業(yè)數(shù)據(jù)進(jìn)行分析,得 到客戶接觸響應(yīng)的

4、預(yù)測模型。2.2 數(shù)據(jù)準(zhǔn)備將以往相似產(chǎn)品的銷售歷史記錄建立客戶分類模型, 對于每個目標(biāo)客戶,可以搜集的數(shù)據(jù)有如下特征信息:某一 特定辦公地點(diǎn)的員工數(shù)(Local Emp、整個企業(yè)的員工數(shù) (Ttl Emp、某一特定辦公地點(diǎn)的年銷售額(Local Sale、 整個企業(yè)的銷售額(Ttl Sale、該企業(yè)是否有海外業(yè)務(wù) (International Flag等等。這些都不與該企業(yè)是否購買推 銷產(chǎn)品做出回應(yīng)有明顯的直接關(guān)系,但通過概率神經(jīng)網(wǎng)絡(luò)可以 發(fā)現(xiàn)它們之間的內(nèi)在聯(lián)系,對這些客戶進(jìn)行分類,區(qū)分哪些是 高可能性的客戶,并將這些數(shù)據(jù)整理在data_rough.txt文件 中,前11列數(shù)據(jù)表示客戶的相關(guān)屬

5、性,最后一列表示該客戶是 否購買企業(yè)的類似產(chǎn)品。共有1000條不同潛在客戶的特征信 息,其中有一些會對銷售宣傳回應(yīng)。將非數(shù)值型的數(shù)據(jù)修改為數(shù)值型的數(shù)據(jù),導(dǎo)入Matlab工作 區(qū),利用Matlab中概率神經(jīng)網(wǎng)絡(luò)算法實施實驗。2.3 數(shù)據(jù)挖掘利用Matlab神經(jīng)網(wǎng)絡(luò)工具包中提供的概率神經(jīng)網(wǎng)絡(luò)的處理 工具進(jìn)行潛在客戶挖掘??蛻繇憫?yīng)預(yù)測的Matlab程序:function ifResponse=pnnCustomerMing(data_train,data_customer,ip_train=data_train(:,1:11;p_train=p_train't_train=data_trai

6、n(:,12;t_train=t_train'制訂完善各種具體的、有針對性的、可操作性強(qiáng)的素質(zhì)教育的 制度辦法,推進(jìn)素質(zhì)逐步邁向規(guī)范化、可持續(xù)化道路。除常規(guī) 的、一般的制度外,學(xué)校應(yīng)當(dāng)制定素質(zhì)教育的近期和中長期規(guī) 劃,使教育不斷向素質(zhì)教育靠近;同時要把如何開展教研活 動、提升教師素質(zhì)、實施素質(zhì)教育具體化,使素質(zhì)教育不斷深 化,使教師逐步自覺實施素質(zhì)教育,在實踐中提高自身素質(zhì), 從一專一能向一專多能發(fā)展。5 學(xué)校在素質(zhì)教育實踐上應(yīng)當(dāng)直接參與我國教育家葉圣陶先生就說過:“教是為了不教”。 要讓學(xué)生不僅學(xué)會,而且“會學(xué)”。“會學(xué)”就是要學(xué)生掌 握讀書、解題、思考、分析等具體的學(xué)法,從而用手中

7、的鑰 匙去開啟智慧的大門。既要根據(jù)學(xué)科特點(diǎn),盡量讓學(xué)生多動 手動腳,動口動腦,讓學(xué)生學(xué)會發(fā)現(xiàn)問題,解決問題,找出 方法,養(yǎng)成愿學(xué)、會學(xué)、樂學(xué)的習(xí)慣。也要讓學(xué)生接受課程 以外的日常生活知識和生存本領(lǐng)。因此,除老師直接組織策 劃、直接組織實施的日常素質(zhì)教育外,學(xué)校也應(yīng)當(dāng)投入足夠 的人力物力,直接組織和策劃,直接參與一些活動的全過 程。比如,有的學(xué)校每年都在開展 “素質(zhì)教育夏令營”、 “素質(zhì)教育冬令營”、“春季踏青活動”、“秋季拓展訓(xùn) 練”等活動,每次活動分組策劃主題,邀請教學(xué)經(jīng)驗豐富的 老師、有實踐經(jīng)驗的專家周密部署和指導(dǎo),以突出實踐素質(zhì) 教育主題的科學(xué)性、針對性,實踐主題應(yīng)突出培訓(xùn)學(xué)生的自 我管

8、理能力的培養(yǎng)、良好學(xué)習(xí)生活習(xí)慣的養(yǎng)成,自我認(rèn)知能 力、獨(dú)立生存能力、人際溝通能力、團(tuán)隊協(xié)作能力、挫折承 受能力、應(yīng)變能力、學(xué)習(xí)能力和創(chuàng)新能力以及全腦學(xué)習(xí)系統(tǒng) 的開發(fā)等等,這對全面提高學(xué)生的素質(zhì)大有裨益。 2011.No16t_train=ind2vec(t_train;net=newpnn(p_train,t_train,i;ifResponse=vec2ind(sim(net,data_customer'-1;(1數(shù)據(jù)導(dǎo)入與分組。將數(shù)據(jù)data_prepared.mat導(dǎo)入工 作區(qū)。將數(shù)據(jù)分為兩組,訓(xùn)練數(shù)據(jù)集和測試數(shù)據(jù)集。利用訓(xùn)練 數(shù)據(jù)集訓(xùn)練神經(jīng)網(wǎng)絡(luò),得到潛在客戶挖掘模型,測試數(shù)據(jù)集

9、用 來檢驗神經(jīng)網(wǎng)絡(luò)模型的可靠性。利用Matlab提供的函數(shù),可以設(shè)計算法對數(shù)據(jù)隨機(jī)分組, 生成訓(xùn)練數(shù)據(jù)集data_train和測試數(shù)據(jù)集data_test。生成訓(xùn)練 數(shù)據(jù)集和測試數(shù)據(jù)集,data_train=data_prepared(index_train,:,data_test=data_prepared(index_test,:。(2訓(xùn)練神經(jīng)網(wǎng)絡(luò)。利用Matlab神經(jīng)網(wǎng)絡(luò)工具包中提供的 概率神經(jīng)網(wǎng)絡(luò)的處理函數(shù)針對訓(xùn)練數(shù)據(jù)集進(jìn)行概率神經(jīng)網(wǎng)絡(luò)的構(gòu) 建。并生成輸入矩陣、輸出目標(biāo)矩陣、訓(xùn)練概率神經(jīng)網(wǎng)絡(luò)。(3模型檢驗。下面利用測試數(shù)據(jù)集data_test對構(gòu)建 的神經(jīng)網(wǎng)絡(luò)在潛在客戶分類中的有效性進(jìn)

10、行檢驗,并通過比較 選擇最佳的spread值。生成輸入矩陣,生成預(yù)期輸出結(jié)果,利 用訓(xùn)練好的神經(jīng)網(wǎng)絡(luò)模型對測試數(shù)據(jù)集客戶進(jìn)行分類。得到 模型的實際輸出結(jié)果,這可以利用Matlab中的sim函數(shù)完成, o_test=sim(net,p_test。得到的o_test是一個稀疏矩陣, 需要將其轉(zhuǎn)化為1×500的各個客戶所屬類別的向量,這利用 ind2vec的逆操作vec2ind完成,o_test=vec2ind(o_test。(4結(jié)果檢驗和模型選擇。有兩個輸出結(jié)果:模型輸出 結(jié)果和預(yù)期輸出結(jié)果。模型輸出結(jié)果是我們的神經(jīng)網(wǎng)絡(luò)模型利 用提供的客戶相關(guān)信息,對客戶是否對產(chǎn)品做出相應(yīng)的一個預(yù) 測。

11、預(yù)期輸出結(jié)果是實際發(fā)生的數(shù)值,是客觀現(xiàn)實,我們希望 模型輸出結(jié)果與預(yù)期輸出結(jié)果一致。在大量測試數(shù)據(jù)集中,模 型輸出結(jié)果與預(yù)期輸出結(jié)果一致的數(shù)量越多,說明模型的預(yù)測 效果越好。同時,由于在訓(xùn)練過程中我們利用hold-out方法選擇 spread值,對spread值取10000、5000、3000、2000、1000、 500、100、60、40、30、20、10、5、1、0.5、0.1、0.05、 0.04、0.03、0.01時分別對模型進(jìn)行訓(xùn)練,得到神經(jīng)網(wǎng)絡(luò)模型 net1到net20。在模型檢驗中要根據(jù)不同模型的分類效果,選擇 最佳的spread值和概率神經(jīng)網(wǎng)絡(luò)模型。這需要對20個模型的預(yù) 測

12、結(jié)果分別進(jìn)行檢驗,當(dāng)spread值達(dá)到10000時,預(yù)測出的實 際對產(chǎn)品做出響應(yīng)的客戶的個數(shù)幾乎為0,而當(dāng)spread值小于 或等于0.03時,總體預(yù)測準(zhǔn)確率、響應(yīng)客戶預(yù)測準(zhǔn)確率和不響 應(yīng)客戶預(yù)測準(zhǔn)確率基本上達(dá)到穩(wěn)定。從總體預(yù)測準(zhǔn)確率來看, spread值為10時,預(yù)測效果最佳,但此時響應(yīng)客戶預(yù)測率不是 最高的,而本文需要預(yù)測的是在預(yù)測為響應(yīng)客戶的客戶中實際 上為響應(yīng)客戶的個數(shù),所以選擇響應(yīng)客戶預(yù)測率最高的一個, 即是說spread值為0.04時預(yù)測效果最好。2.4 不同方法潛在客戶挖掘結(jié)果比較分析在利用概率神經(jīng)網(wǎng)絡(luò)進(jìn)行潛在客戶挖掘的同時,我們也 利用傳統(tǒng)的處理方法線性回歸和常用的神經(jīng)網(wǎng)絡(luò)BP

13、神經(jīng)網(wǎng)絡(luò) (Back Propagation Neural Networks,BPNN來對潛在客戶 進(jìn)行分類,試圖發(fā)現(xiàn)那些最有可能對促銷做出響應(yīng)的客戶。在利用BP神經(jīng)網(wǎng)絡(luò)進(jìn)行客戶分類的過程中,首先建立3層BP神經(jīng)網(wǎng)絡(luò),輸入層11個神經(jīng)元,中間隱含層8個神經(jīng)元, 輸出層1個神經(jīng)元,隱含層選激活函數(shù)tansig,輸出層選激在線性回歸方法中,首先建立線性回歸方程: 。其中t表 示n×1預(yù)期目標(biāo)輸出,p為n×11的輸入矩陣, 為誤差項。根據(jù) 訓(xùn)練數(shù)據(jù)集中的數(shù)據(jù),運(yùn)用Matlab線性回歸函數(shù)得到線性回歸 模型的參數(shù) ,b=regress(t,p。這樣,就可以利用線性回歸模 型預(yù)測客戶的類型,并把預(yù)測結(jié)果跟預(yù)期結(jié)果比較,計算預(yù)測 準(zhǔn)確度,分析模型的預(yù)測效果。由上表可以看出,從總體預(yù)測準(zhǔn)確率來看,用概率神經(jīng)網(wǎng) 絡(luò)的方法進(jìn)行潛在客戶挖掘不完全是效果最佳的,但是本文需 要預(yù)測的是在預(yù)測為響應(yīng)客戶的客戶中實際上為響應(yīng)客戶的個 數(shù),所以我們應(yīng)從響應(yīng)客戶預(yù)測率方面來考慮,從中可以看出 概率神經(jīng)網(wǎng)絡(luò)方法優(yōu)于BP神經(jīng)網(wǎng)絡(luò)和線性回歸方法。3 總結(jié)概率神經(jīng)網(wǎng)絡(luò)(PNN在實際應(yīng)用中,尤其是在解決分類 問題的應(yīng)用中,它的優(yōu)勢在于用線性學(xué)習(xí)算法來完成以往非線 性學(xué)習(xí)算法所做的工作,同時又能保持非線性算法的高精度等 特性

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負(fù)責(zé)。
  • 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時也不承擔(dān)用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

最新文檔

評論

0/150

提交評論