本科畢業(yè)論文--基于數(shù)據(jù)挖掘的edpcrm系統(tǒng)設計及實現(xiàn)_第1頁
本科畢業(yè)論文--基于數(shù)據(jù)挖掘的edpcrm系統(tǒng)設計及實現(xiàn)_第2頁
本科畢業(yè)論文--基于數(shù)據(jù)挖掘的edpcrm系統(tǒng)設計及實現(xiàn)_第3頁
本科畢業(yè)論文--基于數(shù)據(jù)挖掘的edpcrm系統(tǒng)設計及實現(xiàn)_第4頁
本科畢業(yè)論文--基于數(shù)據(jù)挖掘的edpcrm系統(tǒng)設計及實現(xiàn)_第5頁
已閱讀5頁,還剩62頁未讀 繼續(xù)免費閱讀

下載本文檔

版權說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權,請進行舉報或認領

文檔簡介

畢業(yè)設計論文基于數(shù)據(jù)挖掘的EDP-CRM系統(tǒng)設計及實現(xiàn)

摘要CRM(CustomerRelationshipManagement)系統(tǒng)的目的在于建立一個整合客戶服務、市場競爭、銷售以及技術支持的系統(tǒng),為企業(yè)帶來長久的競爭優(yōu)勢。作為一種典型的交互式系統(tǒng),CRM系統(tǒng)是企業(yè)管理中信息技術和應用解決方案的集成。它既是管理客戶關系的一系列信息技術、方法和措施,又是運用信息技術將企業(yè)涉及的銷售、客戶服務、內(nèi)部管理等業(yè)務流程自動化的軟件及硬件系統(tǒng)。而隨著企業(yè)對CRM系統(tǒng)的長期使用,會積累大量的數(shù)據(jù),他們迫切需要從現(xiàn)有大量數(shù)據(jù)中提取出數(shù)據(jù)中潛在的知識,因此對CRM系統(tǒng)進行數(shù)據(jù)挖掘的需求已經(jīng)必不可少。本文以某高校EDP-CRM項目為背景,介紹了CRM系統(tǒng)中客戶管理模塊和數(shù)據(jù)挖掘模塊的設計與實現(xiàn)。通過該EDP-CRM系統(tǒng),既可以方便地對客戶開展基本的客戶管理、產(chǎn)品管理、售后管理等客戶管理功能,又可以在此基礎上對現(xiàn)有數(shù)據(jù)進行聚類、分類、關聯(lián)、時間序列分析等數(shù)據(jù)挖掘操作。本文主要研究在數(shù)據(jù)挖掘的基礎上構建CRM系統(tǒng)的技術。圍繞某高校EDP-CRM系統(tǒng)的客戶關系管理和數(shù)據(jù)挖掘兩大功能模塊進行了詳細的研究分析。文中詳細介紹了客戶關系管理系統(tǒng)和數(shù)據(jù)挖掘技術。首先,客戶管理模塊著重介紹了模塊的軟硬件架構,流程設計和功能實現(xiàn),從而保證CRM系統(tǒng)的基本功能的實現(xiàn)。而數(shù)據(jù)挖掘模塊描述了模塊實現(xiàn)的流程和技術,并在系統(tǒng)現(xiàn)有功能情況基礎上,作者研究了數(shù)據(jù)挖掘的建模方案,主要重點討論了數(shù)據(jù)倉庫的構建模型和構建過程,從操作型環(huán)境抽取數(shù)據(jù)并導入數(shù)據(jù)倉庫方法,對數(shù)據(jù)進行綜合處理的實現(xiàn)技術,以及后期數(shù)據(jù)如何追加到數(shù)據(jù)倉庫的機制,并詳細介紹了關聯(lián)規(guī)則挖掘模型,聚類挖掘模型和分類挖掘模型的實現(xiàn)技術。在確定了系統(tǒng)的關鍵技術后,完成了其CRM的系統(tǒng)的設計和實現(xiàn)。最后作者總結全文,并提出了進一步工作的方向。第一章緒論一、研究背景及研究意義隨著市場對知識要求的提高,越來越多的企業(yè)高層對知識在企業(yè)競爭發(fā)揮的作用有了深刻認識,EDP教育也逐步發(fā)展起來。但是,當前EDP教育產(chǎn)業(yè)在國內(nèi)由于發(fā)展時間較短,也存在一些問題影響EDP教育的進一步發(fā)展,其中,如何在激烈的市場競爭環(huán)境下開發(fā)和占領市場以使EDP教育產(chǎn)業(yè)獲得生存和發(fā)展是決定一個EDP教育產(chǎn)業(yè)能否良性發(fā)展的關鍵問題。為了解決這個問題,客戶資源的有效利用是一個關鍵。對于現(xiàn)代企業(yè)來說,客戶資源正成為最具價值的資產(chǎn),建立客戶信息數(shù)據(jù)庫,對這些最有價值的資產(chǎn)進行有效管理,成為企業(yè)的核心任務之一。EDP教育產(chǎn)業(yè)也是如此。因此,在解決客戶資源管理環(huán)節(jié),EDP教育產(chǎn)業(yè)也可以借鑒其他產(chǎn)業(yè)的經(jīng)驗,將CRM(CustomerRelationshipManagement,客戶關系管理)引入到EDP教育的客戶資源管理之中。CRM是90年代西方發(fā)展起來的新型的管理策略,它在國外的應用己經(jīng)取得了極大的成功,而我國對它的認識和應用才剛剛起步。當今許多企業(yè)的CRM數(shù)據(jù)庫或數(shù)據(jù)倉庫中都搜集和存儲大量關于客戶的寶貴數(shù)據(jù),這些數(shù)據(jù)涵蓋了從客戶基本數(shù)據(jù)、購買記錄及客戶反饋的個個環(huán)節(jié)。充分利用這些數(shù)據(jù),深入分析、挖掘隱含在這些數(shù)據(jù)中的有用信息,將有助于企業(yè)更好地管理客戶關系,實現(xiàn)CRM的功能和目標。然而,由于缺乏在大量數(shù)據(jù)中發(fā)現(xiàn)深層次信息的能力,許多企業(yè)對于這些數(shù)據(jù)的利用還只是停留在基礎層的瀏覽、檢索、查詢和應用層的繼承、組合、整理等方面,而無法將這些數(shù)據(jù)轉化為更加有用的知識。因此,如何更加有效地管理企業(yè)數(shù)據(jù)庫中快速增長的海量數(shù)據(jù),將數(shù)據(jù)資源的利用提高到知識創(chuàng)新的高級階段,己經(jīng)成為企業(yè)當前需要迫切解決的問題,數(shù)據(jù)挖掘(DataMining,簡稱DM)技術的運用就可以幫助企業(yè)很好地解決這個問題。所謂數(shù)據(jù)挖掘,簡單地說,就是從大量的、不完全的、有噪聲的、模糊的、隨機的實際應用數(shù)據(jù)中,提取隱含在其中的、人們事先不知道的、但又是潛在有用的信息和知識的過程。數(shù)據(jù)挖掘作為一門交叉學科,受到多門學科的影響,包括數(shù)據(jù)庫系統(tǒng)、統(tǒng)計學、機器學習、可視化和信息科學。需要特別指出的是,數(shù)據(jù)挖掘從一開始就是面向應用的,因此如何利用數(shù)據(jù)挖掘技術解決特定領域的問題,是研究數(shù)據(jù)挖掘應用的核心問題[1][2][3][4]。近年來,該技術已經(jīng)在商務管理,生產(chǎn)控制,市場分析,工程設計和科學探索等領域得到廣泛的應用。綜上所述,為了解決EDP教育中存在的客戶關系管理混亂無序的現(xiàn)狀,本文將根數(shù)EDP教育的特點設計EDP-CRM系統(tǒng)并將其實現(xiàn),并為了進一步開發(fā)客戶關系中的潛在的價值,將數(shù)據(jù)挖掘技術引入到EDP-CRM系統(tǒng)之后,通過對客戶資源進一步進行細分,提高客戶開發(fā)的效率,并對客戶資源進行進一步的有效開發(fā),從而達到有效利用客戶的價值目的。二、國內(nèi)外研究綜述(一)國外研究現(xiàn)狀1.數(shù)據(jù)挖掘研究現(xiàn)狀隨著信息技術的迅猛發(fā)展,數(shù)據(jù)庫的規(guī)模不斷擴大,從而產(chǎn)生了大量的數(shù)據(jù)。這些數(shù)據(jù)背后隱藏著許多重要的信息,人們希望通過對這些信息進行更高層次的分析,以便更好地利用這些數(shù)據(jù)。但大量復雜的數(shù)據(jù)往往使人們無法辨別隱藏在其中的能對決策提供支持的信息,而傳統(tǒng)的查詢、報表工具無法滿足挖掘這些信息的需求。因此,需要一種新的數(shù)據(jù)分析技術處理大量數(shù)據(jù),并從中抽取有價值的潛在知識,數(shù)據(jù)挖掘(DataMining)技術由此應運而生。數(shù)據(jù)挖掘技術也正是伴隨著數(shù)據(jù)倉庫技術的發(fā)展而逐步完善起來的[5,6]。數(shù)據(jù)挖掘最早出現(xiàn)在20世紀80年代后期,它是在計算機信息技術的基礎上發(fā)展而來的,而數(shù)據(jù)挖掘的概念是1989年在美國底特律召開的第十一屆國際聯(lián)合人工智能學術會議上最早被正式提出來。此次會議首次正式提出了KDD(KnowledgeDiscoveryinDatabase)這個術語。并且在后來的1991年、1993年和1994年都舉行了關于KDD的專題討論會,匯集來自各個領域的研究人員和應用開發(fā)者,集中討論數(shù)據(jù)統(tǒng)計、海量數(shù)據(jù)分析算法、知識表示、知識運用等問題。隨著與會人員的不斷增多,KDD國際會議發(fā)展成為年會。1998年在美國紐約舉行的第四屆知識發(fā)現(xiàn)與數(shù)據(jù)挖掘國際學術會議21不僅進行了學術討論,并且有30多家軟件公司展示了他們的數(shù)據(jù)挖掘軟件產(chǎn)品,不少軟件已在北美、歐洲等國得到應用。經(jīng)歷十多年的發(fā)展,數(shù)據(jù)挖掘已經(jīng)成為一個自成體系的應用學科。目前,國外數(shù)據(jù)挖掘的發(fā)展趨勢及其研究主要有以下方面:Berry和Linoff[7]主要側重于基于數(shù)據(jù)挖掘的商務應用對數(shù)據(jù)挖掘進行了介紹;Fayyad等[8]介紹了數(shù)據(jù)挖掘以及如何將數(shù)據(jù)挖掘與整個知識發(fā)現(xiàn)過程協(xié)調(diào);Lambert[9]考察統(tǒng)計學在大型數(shù)據(jù)集上的應用,并對數(shù)據(jù)挖掘與統(tǒng)計學各自的角色提出一些評論;Glymour等[10]考慮統(tǒng)計學可能為數(shù)據(jù)挖掘提供的教訓;Smyth等[11]討論諸如數(shù)據(jù)流、圖形和文本等新的數(shù)據(jù)類型和應用如何推動數(shù)據(jù)挖掘演變。在數(shù)據(jù)挖掘的應用方面,數(shù)據(jù)挖掘技術使得KDD商業(yè)軟件工具不斷完善和發(fā)展,使得KDD更注重建立解決問題的整體系統(tǒng),而不是孤立的過程。數(shù)據(jù)挖掘的用戶主要集中在大型銀行、保險公司、電信公司和銷售業(yè)。國外很多計算機公司非常重視數(shù)據(jù)挖掘的開發(fā)應用,IBM和微軟都成立了相應的研究中心進行這方面的工作,此外,一些公司的相關軟件也開始在國內(nèi)銷售,如Platinum、BO以及IBM[12]。2.CRM研究現(xiàn)狀客戶關系管理(CRM)的理論基礎來源于西方的市場營銷理論,它是在關系營銷和數(shù)據(jù)庫營銷基礎上誕生的一種全新的管理模式。和客戶關系管理相關聯(lián)最早的理論應該算是20世紀80年代初的“接觸管理”(ContactManagement),即專門收集整理客戶與公司聯(lián)系的所有信息。到20世紀90年代初期這一理論則演變成為包括電話服務中心與支持資料分析的客戶關懷(CustomerCare),后來又從重視贏得新客戶和處理基礎營銷工作逐漸轉移到對客戶關系進行有效管理的客戶保持工作上來[13]??蛻絷P系管理這個名詞首先從北美傳出,但是一般認為把客戶關系管理理論最早概念化的是美國的計算機咨詢集團——GartnerGroup,該機構在1997年提出:客戶關系管理就是為企業(yè)提供全方位的管理視角,賦予企業(yè)更完善的客戶交流能力,最大化客戶的收益率[14]。在“客戶關系管理”被正式提出之后,國外涌現(xiàn)出了很多關于實施客戶關系管理的研究著作。如StanleyA.Brown[15]《Customerrelationshipmanagement:astrategicintheworldofe-business》一書,對客戶忠誠、客戶關懷、客戶獲得等客戶戰(zhàn)略問題,網(wǎng)絡、工作流管理、數(shù)據(jù)倉庫、數(shù)據(jù)挖掘等技術問題進行論述。JillDyche[16]所著的《TheCRMhandbook:abusinessguidetocustomerrelationshipmanagement》是一本涉及到客戶關系管理各個層面的著作。JoePeppard[17]等提出了基于企業(yè)電子商務、渠道管理、關系管理和前后端辦公室整合的客戶關系管理框架,對金融服務業(yè)的客戶關系管理進行了研究。國外很多學者根據(jù)實際的經(jīng)驗,針對實施客戶關系管理的一些問題提出了自己的觀點。這些研究成果對于成功地實施客戶關系管理提供了很好的借鑒經(jīng)驗。商業(yè)戰(zhàn)略家和演講家弗列德·威爾斯馬在《客戶聯(lián)盟》中通過對大量國際上享有盛名的企業(yè)進行調(diào)查和細致研究,全面闡述了被這些成功企業(yè)大量運用并被證明是行之有效的新型商業(yè)運作模式—客戶聯(lián)盟,同時對客戶關系管理及客戶聯(lián)盟的概念及關系做了深入的闡述。Lawrence認為客戶關系管理并不只是收集、存儲、處理客戶信息,它應該對客戶服務進行根本性的改變??蛻絷P系管理需要的是由技術支持的商業(yè)戰(zhàn)略,而不僅僅是削減營銷成本或與客戶更有效地進行交互。實施客戶關系管理需要圍繞關系戰(zhàn)略重新設計和分配相關流程、技術和人力資源。PaulineA.Wilcox提出,一個高效的客戶關系管理戰(zhàn)略需要引入以客戶為中心的企業(yè)文化。3.數(shù)據(jù)挖掘在CRM中的研究現(xiàn)狀目前,學者們已經(jīng)意識到客戶是極為重要的商業(yè)資源,隨著數(shù)據(jù)挖掘技術的發(fā)展并引入到CRM之中,大大提高了企業(yè)CRM系統(tǒng)的運作效率。國外一些學者對數(shù)據(jù)挖掘在CRM系統(tǒng)中的應用作了重要闡述。Tillett.L.Scott[18]認為數(shù)據(jù)挖掘優(yōu)化了CRM的服務功能,可以為客戶服務提供準確的參考信息,提高對客戶事務處理的能力。AdamRombe[19]認為客戶關系管理為客戶與銀行之間創(chuàng)建了一個溝通渠道,數(shù)據(jù)挖掘技術進一步優(yōu)化銀行內(nèi)部的業(yè)務流程,使這一渠道變得更加高效與快捷,并且通過分析客戶得交易行為,更好的了解客戶和保留客戶,挖掘客戶的愛好和興趣,從而以最快的速度響應客戶的需求,為客戶提供最優(yōu)質的服務,極大地提高客戶的忠誠度。GrothR[20]認為集成有數(shù)據(jù)挖掘技術的營銷輔助工具可以提供高精確度的模式識別和預測功能,使商業(yè)人員有效地策劃和開展營銷活動。除了研究數(shù)據(jù)挖掘在CRM領域的應用之外,外國學者還研究了數(shù)據(jù)挖掘中的各種規(guī)則(如分類規(guī)則、聚類規(guī)則、關聯(lián)規(guī)則等)在不同領域的CRM系統(tǒng)中的應用。ZengyouHe[21]向我們介紹了數(shù)據(jù)挖掘的概念、算法和應用,并將其應用到客戶關系管理之中。接下來IrajMahdavi[22]對用一種帶自主機制的聚類算法對e-CRM上的文檔數(shù)據(jù)進行分析,從而設計了一種客戶利益導向型的客戶關系管理模式,然后,IrajMahdavi[23]進一步研究,著重研究一種自適應的遺傳算法,通過遺傳算法,將客戶數(shù)據(jù)引導到以客戶為中心上來進行客戶關系管理。BeomsooShim[24]研究了關聯(lián)規(guī)則和序列分析在小規(guī)模電子購物網(wǎng)站的客戶關系管理中的策略,通過關聯(lián)規(guī)則對客戶進行分類從而實施不同的營銷策略。(二)國內(nèi)研究現(xiàn)狀1.數(shù)據(jù)挖掘研究現(xiàn)狀與國外相比,國內(nèi)對數(shù)據(jù)挖掘的研究起步稍晚且不成熟。1993年國家自然科學基金首次支持我國在該領域的研究項目。目前,國內(nèi)的許多科研單位和高等院校紛紛開展知識發(fā)現(xiàn)的基礎理論及其應用研究,這些單位包括清華大學、中科院計算技術研究所、空軍第三研究所、海軍裝備論證中心等。其中,北京系統(tǒng)工程研究所對模糊方法在知識發(fā)現(xiàn)中的應用進行了較深入的研究,北京大學也在開展對數(shù)據(jù)立方體代數(shù)的研究,華中理工大學、復旦大學、浙江大學、中國科技大學、中科院數(shù)學研究所、吉林大學等單位開展了對關聯(lián)規(guī)則開采算法的優(yōu)化和改造;南京大學、四川聯(lián)合大學和上海交通大學等單位探討、研究了非結構化數(shù)據(jù)的知識發(fā)現(xiàn)以及Web數(shù)據(jù)挖掘。除了這些學校和科研機構之外,我國的一些研究者也對數(shù)據(jù)倉庫和數(shù)據(jù)挖掘的展開了研究。王毅凱、張大雷[32]描述了數(shù)據(jù)挖掘技術的概念,然后對數(shù)據(jù)挖掘系統(tǒng)的構成和數(shù)據(jù)挖掘的流程進行了介紹,最后詳細分析了數(shù)據(jù)挖掘的常用方法。蔡雅琳[33]對數(shù)據(jù)庫中數(shù)據(jù)挖掘技術包括數(shù)據(jù)挖掘技術的產(chǎn)生背景、應用領域、分類及主要挖掘技術作了概述,還從模式識別的角度討論了數(shù)據(jù)挖掘技術的重要任務,包括分類、回歸、聚類和關聯(lián)等4種模式的識別;列舉了當前數(shù)據(jù)挖掘技術的實際應用并指出今后的發(fā)展趨勢。唐笑林[34]論述了數(shù)據(jù)挖掘的概念、算法、實際的挖掘過程,分析了C5.0決策樹算法。張雪松、毛云龍、檀竹南[35]總結并評價了國內(nèi)外數(shù)據(jù)挖掘技術的發(fā)展現(xiàn)狀,對各個領域的數(shù)據(jù)挖掘技術應用進行了系統(tǒng)的評價與綜述。劉明亮、李雄飛、孫濤、許曉晴[36]在將數(shù)據(jù)挖掘標準劃分為過程標準、接口標準、語言標準和Web標準等四類進行分析介紹后,給出一個綜合多種標準的應用程序框架,最后總結出數(shù)據(jù)挖掘標準化領域面臨的問題和挑戰(zhàn),并對發(fā)展趨勢予以展望。王銳、馬德濤、陳晨[37]論述了數(shù)據(jù)挖掘的主要方法以及對數(shù)據(jù)挖掘在國民經(jīng)濟和軍事領域的應用作了介紹。2.CRM研究現(xiàn)狀我國最初客戶關系管理(CRM)是由國外的IT廠商基于軟件的使用而引入的。1999年8月6日,朗訊科技公司商業(yè)通訊系統(tǒng)部在北京舉辦了以“營造完美電信呼叫中心”為主題的研討會,介紹了其全新的客戶關系管理解決方案,并強調(diào)指出,商業(yè)部門必須著眼于客戶關系,提供獨具特色的個性化服務,才能在網(wǎng)絡時代中立于不敗之地。國外先進管理理念的傳入和信息時代的到來,為我國客戶關系管理研究奠定了理論基礎和技術支持??蛻絷P系管理是在關系營銷等理論基礎上進一步發(fā)展起來的,它綜合運用數(shù)據(jù)庫、網(wǎng)絡、圖形圖像、媒體、人工智能等技術,整合先進的管理思想、業(yè)務流程及信息技術于一體,構筑出現(xiàn)實信息平臺的一種管理系統(tǒng)。我國的一些研究者也對客戶關系管理展開了研究。陳旭[25]研究了客戶關系管理的內(nèi)涵和管理思想,分析了客戶關系管理的主要功能,辨析了客戶關系管理與SCM和ERP的關系,討論了客戶關系管理的發(fā)展趨勢。成棟、宋遠方[26]在研究當前各種客戶關系管理的管理理論的基礎上提出了客戶關系管理的理論框架體系,以澄清客戶關系管理與其他管理理論的關系。周權[27]認為傳統(tǒng)企業(yè)的銷售、市場、客戶服務及技術支持等部門的工作很多都是獨立和垂立進行的,各部門的溝通存在障礙,客戶關系管理能夠解決上述的問硯。他主要介紹客戶關系管理的概念、體系以及分析型客戶關系管理的概念、特點、利弊問題的研究,重點立足于其業(yè)內(nèi)一般性定義的分析型客戶關系管理的利弊問題進行探討。謝良安[28]提出實施客戶關系管理的策略包括以客戶為中心的商業(yè)戰(zhàn)略、企業(yè)文化建設、利用信息技術對企業(yè)的業(yè)務流程進行重組。黃中實[29]認為實施客戶關系管理的主要步驟包括擬定客戶關系管理目標和實施路線,構建客戶智能平臺,構建客戶交互平臺,重新設計工作流程,績效的分析與衡量。魯江、熊燕[30]認為實施客戶關系管理的關鍵因素包括:企業(yè)全體員工的營銷理念的更新,企業(yè)高層管理的大力支持,組織的再造和業(yè)務流程的重構。孫國輝[31]提出,客戶關系管理項目應該是由業(yè)務驅動,選擇合適的中國軟件企業(yè)實施客戶關系管理需要解決信息流、貨幣流、物流、服務、產(chǎn)品、組織機構等幾個方面的問題。3.數(shù)據(jù)挖掘在CRM中的研究現(xiàn)狀 在中國,將數(shù)據(jù)挖掘引入到CRM中進行研究并不久,但是,卻在這個領域出來了很多的研究成果。魏曉云[38]將數(shù)據(jù)挖掘技術引入到CRM系統(tǒng)中,充分闡述了數(shù)據(jù)挖掘的原理以及具體聚類和分類算法的應用的思路。易珺[39]將數(shù)據(jù)挖掘技術應用于酒店的CRM系統(tǒng)之中,來提高酒店的競爭力。陳建輝[40]具體的提出了一種基于數(shù)據(jù)挖掘的CRM系統(tǒng)的框架,并將其實現(xiàn)。滕蕾[41]則具體的就聚類規(guī)則在CRM系統(tǒng)中的應用進行了闡述。三、論文的研究目標、內(nèi)容及框架(一)研究內(nèi)容本文的組織結構是按照CRM系統(tǒng)的客戶關系管理和數(shù)據(jù)挖掘兩大功能模塊的分析,設計和實現(xiàn)的順序進行,并對每個步驟按照提出問題,解決問題,進行驗證的方法組織內(nèi)容。闡述了項目中遇到的問題以及解決問題的具體方法和所采用的新技術。(二)論文結構本論文的總體結構如下:1.介紹了研究背景,課題來源,CRM的發(fā)展現(xiàn)狀,數(shù)據(jù)挖掘的發(fā)展現(xiàn)狀,課題完成的工作以及本論文的組織結構。2.介紹了CRM和數(shù)據(jù)挖掘的理論,并簡單介紹了EDP教育的內(nèi)容以及當前的發(fā)展現(xiàn)狀。3.詳細介紹了福州大學管理學院EDP教育中心CRM系統(tǒng)的總體分析以及進一步的設計。包括CRM系統(tǒng)應用,系統(tǒng)架構,客戶關系管理模塊的需求分析和核心功能分析,數(shù)據(jù)挖掘模塊的基本介紹和核心功能介紹。4.詳細闡述了CRM客戶關系管理數(shù)據(jù)挖掘的設計和實現(xiàn),包括模塊功能結構,模塊流程設計,以及實現(xiàn)技術。5.詳細闡述了CRM數(shù)據(jù)挖掘模塊的設計和實現(xiàn),介紹了模塊的實現(xiàn)描述,包括模塊的實現(xiàn)流程,采用技術,并對銷售分析模塊的應用進行分析,研究了如何進行銷售分析建模,來更好地指導市場營銷活動方案。6.總結本論文并展望未來CRM的發(fā)展。第二章相關理論綜述一、客戶關系管理理論(一)CRM的產(chǎn)生發(fā)展隨著信息技術的發(fā)展和網(wǎng)絡化經(jīng)濟的快速進步,傳統(tǒng)的商業(yè)模式發(fā)生了根本性的變化。在很多行業(yè),所提供的產(chǎn)品和服務日益商品化,產(chǎn)品的同質化傾向越來越強,獨特的競爭優(yōu)勢越來越難以獲得,業(yè)務比以前更具競爭性。與此同時,客戶的期望也在快速變化。由于計算機、通訊技術和網(wǎng)絡的飛速發(fā)展,客戶完全可以控制要選擇誰、何時選擇和如何選擇,客戶選擇擺脫了傳統(tǒng)地理關系的限制,變成了“點擊鼠標的一瞬間”;客戶對隨時隨地得到服務的要求更高,對質量、個性化和價值的要求更挑剔。在這種環(huán)境下,客戶的親和力和忠誠度是取得成功的重要因素,建立和維持客戶關系成為企業(yè)取得競爭優(yōu)勢的最重要的基礎。據(jù)統(tǒng)計,93%的CEO認為客戶關系管理是企業(yè)成功和更有競爭能力的重要因素,2/3的客戶離開其供應商是因為客戶關懷不夠,一個非常滿意的客戶其購買意愿將六倍于一個滿意的客戶,在客戶滿意度方而的5%的提高將使企業(yè)利潤加倍。為了提高客戶滿意度,企業(yè)必須完整掌握客戶信息,準確把握客戶要求,快速響應個性化需求,提供便捷的購買渠道、良好的售后服務與經(jīng)常性的客戶關懷等。而在傳統(tǒng)的客戶關系管理(CustomerRelationshipManagement,簡稱CRM)中,來自銷售、客戶服務、市場、制造、庫存等部門的信息分散在企業(yè)內(nèi),客戶信息的分散性和片段性使得無法對客戶有全而的了解,就是在同一個企業(yè)內(nèi)部對客戶的定義和理解也極不相同,各部門難以在統(tǒng)一的信息的基礎上面對客戶。這種客戶信息的分散性和片段性對企業(yè)的經(jīng)營活動造成了極大的困擾,浪費了很多的資源,失去了很多的機會,在市場競爭中處于不利的地位。加強對客戶關系管理的研究具有重要意義。在我國,許多企業(yè)的內(nèi)部管理混亂和隨意,有的企業(yè)脫胎于過去的“計劃經(jīng)濟”,連市場營銷、公共關系、細分市場等都是新名詞,如何在客戶數(shù)據(jù)中分析購買習慣,針對不同的客戶進行不同的營銷策略,企業(yè)沒有積累經(jīng)驗;自動銷售系統(tǒng)在我國還沒有普及,我國企業(yè)中真正運用CTI而不僅僅是電話交換系統(tǒng)的呼叫中心屈指可數(shù),網(wǎng)上商城則尚在萌芽階段。要在手工操作的基礎上一步達到多渠道和客戶進行友好持續(xù)交流的目的,非常有挑戰(zhàn)性。另一方面,我國企業(yè)的這種跨越式的發(fā)展和飛躍也能少走彎路,充分發(fā)揮我國企業(yè)的后發(fā)優(yōu)勢,在CRM整體設計、多系統(tǒng)兼容和接口問題等方面我國會比比國外企業(yè)容易。技術發(fā)展與現(xiàn)實需要的反差,是我國企業(yè)發(fā)展的現(xiàn)狀與競爭環(huán)境的挑戰(zhàn),使加強CRM研究成為具有重要的理論、現(xiàn)實意義和緊迫性的課題(二)CRM的定義目前對CRM的定義有很多,但總的來說,CRM實際上是一種以客戶為中心的管理機制和經(jīng)營戰(zhàn)略,它以信息技術為手段,對業(yè)務功能進行重新設計,并且對工作流程進行重組,提高客戶滿意度,從而最終達到企業(yè)利潤最大化。它所強調(diào)的是客戶價值,要充分利用以客戶為中心的各種資源,采用先進的數(shù)據(jù)庫和其他信息技術來獲取客戶數(shù)據(jù),從而有針對性地為顧客提供產(chǎn)品或服務。由此可知,客戶關系管理實際上包含了3個方面的含義:a.CRM首先是一種管理理念。其核心思想是將企業(yè)的客戶(最終客戶、分銷商、和合作伙伴)作為最重要的企業(yè)資源,通過完善的客戶服務和深人的客戶分析來滿足客戶的需求。b.CRM也是一種旨在改善企業(yè)和客戶之間關系的新型管理機制。是企業(yè)戰(zhàn)略的一種,它實施于企業(yè)的市場營銷、銷售、客戶與技術支持等與客戶相關的領域,以使企業(yè)更好地圍繞顧客行為來有效地管理自己的經(jīng)營。c.CRM又是一種管理軟件和技術。它將最佳的商業(yè)實踐與數(shù)據(jù)挖掘、數(shù)據(jù)倉庫、一對一營銷、銷售自動化以及其他信息技術緊密結合在一起,為企業(yè)的銷售、客戶服務和決策支持等領域提供一個業(yè)務自動化的解決方案。(三)CRM的分類目前的CRM產(chǎn)品按照功能可分為3類:操作型、分析型和協(xié)作型。1.操作型操作型CRM主要設計目的是讓銷售、營銷、客戶服務、技術支持等部門的業(yè)務人員在日常工作中能夠共享客戶資源,減少信息流動滯留點,同時具有一定的分析能力。很容易通過多個渠道快速、全面的獲得客戶的信息,以及相關的聯(lián)系等,使得與客戶的聯(lián)系變得連續(xù),呈現(xiàn)給客戶的信息一致。2.分析型分析型CRM主要利用大量的客戶數(shù)據(jù),從中提取有用的信息進行分析,以及對將來的趨勢做出預測,協(xié)助企業(yè)制定市場計劃和發(fā)展方向。3.協(xié)作型協(xié)作型CRM是指能夠讓企業(yè)銷售、客戶服務人員同客戶一起完成某項活動。協(xié)作型目前主要應用于呼叫中心(CallCenter)、多渠道聯(lián)絡中心、幫助臺、以及自助服務幫助導航等。二、數(shù)據(jù)挖掘理論(一)數(shù)據(jù)挖掘的定義數(shù)據(jù)挖掘(DataMining),也叫數(shù)據(jù)開采,數(shù)據(jù)采掘等,是按照既定的業(yè)務目標從海量數(shù)據(jù)中提取出潛在、有效并能被人理解的模式的高級處理過程。在較淺的層次上,它利用現(xiàn)有數(shù)據(jù)庫管理系統(tǒng)的查詢、檢索及報表功能,與多維分析、統(tǒng)計分析方法相結合,進行聯(lián)機分析處理(OLAP),從而得出可供決策參考的統(tǒng)計分析數(shù)據(jù)。在深層次上,則是從數(shù)據(jù)庫中發(fā)現(xiàn)前所未有的、隱含的知識,OLAP的出現(xiàn)早于數(shù)據(jù)挖掘,它們都是從數(shù)據(jù)庫中抽取有用信息的方法,就決策支持的需要而言兩者是相輔相成的。OLAP可以看作一種廣義的數(shù)據(jù)挖掘方法,它旨在簡化和支持聯(lián)機分析,而數(shù)據(jù)挖掘的目的是便這一過程盡可能自動化。數(shù)據(jù)挖掘基于的數(shù)據(jù)庫類型主要有:關系型數(shù)據(jù)庫、面向對象數(shù)據(jù)庫、事務數(shù)據(jù)庫、演繹數(shù)據(jù)庫、時態(tài)數(shù)據(jù)庫、多媒體數(shù)據(jù)庫、主動數(shù)據(jù)庫、空間數(shù)據(jù)庫、遺留數(shù)據(jù)庫、異質數(shù)據(jù)庫、文本型、Internet信息庫以及新興的數(shù)據(jù)倉庫(DateWarehouse)等。而挖掘后獲得的知識包括關聯(lián)規(guī)則、特征規(guī)則、區(qū)分規(guī)則、分類規(guī)則、總結規(guī)則、偏差規(guī)則、聚類規(guī)則、模式分析及趨勢分析等。(二)數(shù)據(jù)挖掘的模式1.分類模式(Classification)分類就是構造一個分類函數(shù)(分類模型),把具有某些特征的數(shù)據(jù)項映射到某個給定的類別上。該過程由兩步構成:模型創(chuàng)建和模型使用.模型創(chuàng)建是指通過對訓練數(shù)據(jù)集的學習來建立分類模型;模型使用是指使用分類模型對測試數(shù)據(jù)和新的數(shù)據(jù)進行分類。其中的訓練數(shù)據(jù)集是帶有類標號的,也就是說在分類之前,要劃分的類別是己經(jīng)確定的。通常分類模型是以分類規(guī)則、決策樹或數(shù)學表達式的形式給出的。2.聚類模式(Clustering)聚類就是將數(shù)據(jù)項分組成多個類或簇,類之間的數(shù)據(jù)差別應盡可能大,類內(nèi)的數(shù)據(jù)差別應盡可能小,即為“最小化類間的相似性,最大化類內(nèi)的相似性”,原則。與分類模式不同的是,聚類中要劃分的類別是未知的,它是一種不依賴于預先定義的類和帶類標號的訓練數(shù)據(jù)集的非監(jiān)督學習(unsupervisedlearning),無需背景知識,其中類的數(shù)量由系統(tǒng)按照某種性能指標自動確定。3.回歸模式(Regression)回歸模式的函數(shù)定義與分類模式相似,主要差別在于分類模式采用離散預測值(例如類標號),而回歸模式采用連續(xù)的預測值。在這種觀點下,分類和回歸都是預測問題,但在數(shù)據(jù)挖掘業(yè)界,大家普遍認為:用預測法預測類標號為分類,預測連續(xù)值(例如使用回歸方法)為預測。許多問題可以用線性回歸解決,對于許多非線性問題可以通過對變量進行變換,從而轉換為線性問題來解決。4.關聯(lián)模式(Association)關聯(lián)分析用于發(fā)現(xiàn)大量數(shù)據(jù)中項集之間有意義的關聯(lián)或相互關系,尋找給定數(shù)據(jù)集中數(shù)據(jù)項之間的有趣聯(lián)系。關聯(lián)規(guī)則的支持度和置信度是兩個規(guī)則興趣度的度量標準,它們分別反映發(fā)現(xiàn)規(guī)則的有用性和確定性。5.序列模式(Sequential)實時狀態(tài)數(shù)據(jù)的存在需要在數(shù)據(jù)挖掘過程中加入時間因素。序列模式分析主要是通過對歷史事件中頻繁發(fā)生的事件序列進行分析,形成預測模式.來對未來行為進行預測。6.偏差模式(Deviation)數(shù)據(jù)庫中可能包含一些數(shù)據(jù)對象與大部分數(shù)據(jù)對象的一般行為或模式不一致,這些不一致的數(shù)據(jù)就成為孤立點。大部分數(shù)據(jù)挖掘方法將孤立點視為噪聲或異常數(shù)據(jù)丟掉,然而在一些應用中,罕見的事件可能比正常的事件包含更多潛在有用的知識。由此可見,從數(shù)據(jù)集合中檢測這些孤立點并加以分析是十分有意義的。數(shù)據(jù)演變分析描述行為隨時間變化的對象的規(guī)律或趨勢。它包括趨勢分析、相似性查找和周期性模式分析等方面。(三)數(shù)據(jù)挖掘的過程數(shù)據(jù)挖掘是一個完整的、反復的人機交互處理過程,該過程需要經(jīng)歷多個相互聯(lián)系的步驟。而且因為應用領域的分析目標需求不同,以及數(shù)據(jù)來源和含義的不同,其中的步驟也不會完全一樣。一般來說,數(shù)據(jù)挖掘的過程主要包含五個階段:數(shù)據(jù)準備、數(shù)據(jù)選擇、數(shù)據(jù)預處理、數(shù)據(jù)挖掘、轉換模型及模式評價。1.數(shù)據(jù)準備數(shù)據(jù)是數(shù)據(jù)挖掘工作成功與否的基礎。要進行數(shù)據(jù)挖掘,數(shù)據(jù)準備階段必不可少。因為數(shù)據(jù)挖掘要處理的數(shù)據(jù)來自不同的數(shù)據(jù)源,數(shù)據(jù)量龐大,數(shù)據(jù)結構復雜,還有大量數(shù)據(jù)重復,并且里面夾雜著空缺數(shù)據(jù)、噪聲數(shù)據(jù)、冗余數(shù)據(jù)等對數(shù)據(jù)挖掘有負面影響的數(shù)據(jù)。因此,數(shù)據(jù)準備在數(shù)據(jù)挖掘過程中起著至關重要作用,是數(shù)據(jù)挖掘工作的基礎。數(shù)據(jù)準備主要包含以下三個方面:1)確定項目目標,制定挖掘計劃、2)數(shù)據(jù)收集和獲取、3)數(shù)據(jù)集成。2.數(shù)據(jù)選擇數(shù)據(jù)挖掘通常并不需要使用一個部門或者用戶所擁有的全部數(shù)據(jù),有些數(shù)據(jù)對于建立模型和發(fā)掘模式是沒有任何意義的,而且如果數(shù)據(jù)與此挖掘項目的目標有所偏差,則還有可能給數(shù)據(jù)挖掘帶來負面影響,造成挖掘結果不準確,模式不可用。數(shù)據(jù)選擇就是在相關領域專家的指導下,數(shù)據(jù)挖掘人員從經(jīng)過集成后的數(shù)據(jù)庫或數(shù)據(jù)倉庫中檢索出與此次挖掘項目任務相關的數(shù)據(jù)集合,從而縮小范圍,保證數(shù)據(jù)正確性和語義完整性,避免盲目搜索,從而提高數(shù)據(jù)挖掘的質量和效率。3.數(shù)據(jù)預處理數(shù)據(jù)預處理可以保證數(shù)據(jù)挖掘所需數(shù)據(jù)集合的質量。對于數(shù)據(jù)挖掘來說,數(shù)據(jù)質量是一個關鍵的問題,因為如果數(shù)據(jù)挖掘基于的數(shù)據(jù)不準確,那么挖掘出來的結果也會是不準確的。挖掘基于的原始數(shù)據(jù)是從各個實際應用系統(tǒng)中獲取的,由于各應用系統(tǒng)的數(shù)據(jù)缺乏統(tǒng)一的標準定義,數(shù)據(jù)結構也有較大的差異,因此各系統(tǒng)間的數(shù)據(jù)存在較大的不一致性,往往不能直接拿來使用。面對這些問題數(shù)據(jù),需要對收集好數(shù)據(jù)進行清理,以使其適用于以后的數(shù)據(jù)處理。4.數(shù)據(jù)挖掘數(shù)據(jù)挖掘就是建立模型解決問題的過程。這是一個反復的過程。需要分別考察不同的模型以判斷模型對相關問題有效性。先用一部分數(shù)據(jù)建立模型,然后再用剩下的數(shù)據(jù)來測試和驗證這個模型。有時還有第三個數(shù)據(jù)集,稱為驗證集,因為測試集可能受模型的特性的影響,這時需要一個獨立的數(shù)據(jù)集來驗證模型的準確性。訓練和測試數(shù)據(jù)挖掘模型需要把數(shù)據(jù)至少分成兩個部分:一個用于模型訓練,另一個用于模型測試。5.轉換模型及模式評價數(shù)據(jù)挖掘完成之后,必須評價得到結果、解釋模型的價值。從測試集中得到的準確率只對用于建立模型的數(shù)據(jù)有意義。在實際應用中,需要進一步了解錯誤的類型和由此帶來的相關成本。經(jīng)驗證有效的模型并不一定是正確的模型。造成這一點的直接原因就是模型建立中隱含的各種假定。因此直接在現(xiàn)實世界中測試模型很重要。先在小范圍內(nèi)應用,取得測試數(shù)據(jù)以及測試結果,對模式評價通過之后再將模式推廣應用。三、EDP教育介紹第三章EDP-CRM系統(tǒng)分析一、背景介紹作者在撰寫碩士論文期間,參加了福州大學EDP中心CRM系統(tǒng)的研究、設計和開發(fā)工作。通過對系統(tǒng)的設計、分析和開發(fā),使我對CRM系統(tǒng)的總體結構有了一個較為全面的認識。在系統(tǒng)設計和開發(fā)過程中,還將數(shù)據(jù)挖掘技術與企業(yè)的具體情況相結合,對數(shù)據(jù)挖掘在CRM系統(tǒng)實際應用進行了的嘗試和探索性的研究。因此,在論文中,我以福州大學EDP中心的CRM系統(tǒng)為背景,以系統(tǒng)設計開發(fā)的具體過程為線索,依次介紹客戶管理管理、數(shù)據(jù)倉庫和數(shù)據(jù)挖掘技術的理論發(fā)展及其它們在系統(tǒng)中的實際應用情況。最后在此基礎上,論述了基于數(shù)據(jù)挖掘的EDP-CRM系統(tǒng)的框架體系及實現(xiàn)。二、EDP-CRM系統(tǒng)可行性分析(一)EDP-CRM客戶信息管理模塊可行性分析1.經(jīng)濟可行性EDP中心的服務都是針對特定領域的客戶,而中心能否良好發(fā)展的關鍵在于客戶需要的滿足。而實施CRM系統(tǒng),能夠保證為客戶提供良好的服務,能夠及時準確的向客戶提供產(chǎn)品服務的信息,在發(fā)掘新客戶、保持老客戶、防止老客戶流失等方面都有明顯的效果,而由于EDP中心的特點,每增加一名客戶,能夠獲得非常大的經(jīng)濟效益,因此實施CRM系統(tǒng)能夠明顯提高企業(yè)的經(jīng)濟效益。與之相比,雖然實施CRM系統(tǒng)需要在前期投入一筆軟件開發(fā)與運行維護的成本,但與提高客戶滿意度從而增加的利潤相比只是九牛一毛。因此,福州大學管理學院EDP中心實施客戶關系管理系統(tǒng)在經(jīng)濟上完全是可行的。2.技術可行性進入21世紀,信息技術的不斷進步,也進一步推進了CRM的發(fā)展。計算機技術、通訊技術、網(wǎng)絡應用技術使得CRM系統(tǒng)的實施與應用不在僅僅停留在想象階段。而伴隨著企業(yè)信息化水平的提升,辦公自動化程度、員工計算機應用能力也不斷提高,同時企業(yè)管理方式也相應轉變,這些都有利于客戶關系管理的實施。3.管理可行性福州大學管理學院EDP中心由于受所處高校影響,管理理念非常先進。中心的管理思想早已成功完成從以產(chǎn)品為中心向以客戶為中心的轉變,而管理思想的轉變也影響了管理方式的轉變。而先進的思想將有利于中心工作人員輕松適應CRM系統(tǒng)的應用。因此發(fā)展CRM的時機己經(jīng)成熟,通過CRM對該企業(yè)的客戶資源進行有效的管理,不但會提高企業(yè)收益,也將進一步改變企業(yè)運行的戰(zhàn)略思維。(二)EDP-CRM數(shù)據(jù)挖掘模塊可行性分析數(shù)據(jù)挖掘可以從大量數(shù)據(jù)中挖掘隱藏的知識,為決策人員和客戶經(jīng)理提供決策和工作的依據(jù)。對EDP中心而言,對中心客戶進行數(shù)據(jù)挖掘是可行的,因為福州大學管理學院EDP中心的客戶資料已達到了數(shù)據(jù)挖掘所需要的海量;而公司的經(jīng)營者也希望獲得更大的利潤,所以都支持數(shù)據(jù)挖掘,希望充分利用現(xiàn)有的數(shù)據(jù),挖掘數(shù)據(jù)背后的知識,提高中心效益;而且公司的信息化建設比較好,數(shù)據(jù)比較完備,網(wǎng)絡設置和員工的計算機水平都比較好。三、EDP-CRM系統(tǒng)需求分析需求分析是軟件開發(fā)中的一個重要的階段,他就是描述系統(tǒng)的需求的過程。分析的根本目的是在系統(tǒng)開發(fā)者與用戶之間建立一種理解和溝通的機制。(一)主要業(yè)務分析一個企業(yè)業(yè)務流程是系統(tǒng)設計的關鍵,要實施開發(fā)CRM系統(tǒng),必須確定系統(tǒng)的功能需求,這就必須先了解企業(yè)的業(yè)務流程,從業(yè)務流程中分析系統(tǒng)的需求。而EDP-CRM系統(tǒng)的主要業(yè)務流程如下圖:(二)、業(yè)務用例業(yè)務用例是在調(diào)研階段得到的信息基礎上提取的,是從用戶和業(yè)務的角度來描述系統(tǒng)提供需要執(zhí)行的功能。福州大學管理學院EDP中心客戶管理管理系統(tǒng)主要實現(xiàn)五大功能,其用例圖如下:1.基本信息管理基本信息管理功能是整個CRM系統(tǒng)的核心模塊,它將所有基礎信息作為連接其余各個系統(tǒng)模塊的主線,也是CRM系統(tǒng)的主要數(shù)據(jù)來源。主要包括客戶信息管理、產(chǎn)品信息管理、員工信息管理。客戶信息管理是對EDP中心的客戶信息進行詳細的管理,主要實現(xiàn)對個人客戶信息管理和對集團客戶信息管理的兩個子功能。產(chǎn)品信息管理是對EDP中心的產(chǎn)品信息進行詳細的管理,主要實現(xiàn)對集團產(chǎn)品和對個人產(chǎn)品兩個子功能。但是這兩個子功能又可以進一步細分,具體的就是將集團產(chǎn)品管理功能繼續(xù)細分為企業(yè)優(yōu)化咨詢信息管理和集團培訓信息管理。而個人產(chǎn)品管理功能又可以繼續(xù)細分為包括學位教育信息管理和講座公開課信息管理。員工信息管理是對EDP中心的員工信息進行詳細的管理,主要實現(xiàn)對營銷人員信息管理、對教師信息進行管理和對教務人員進行管理三個子功能。基本信息管理的需求圖如下所示:集團客戶信息管理主要是對以下信息進行管理:客戶名稱、性質、地址、聯(lián)系人信息、客戶經(jīng)營狀況信息(客戶檔案、客戶戰(zhàn)略發(fā)展、財務狀況信息。此外客戶信息還包括客戶與本企業(yè)發(fā)生的業(yè)務信息、接受本企業(yè)服務的信息等;個人客戶信息管理主要是對以下信息進行管理:客戶姓名、年齡、學歷、性別、職位、所屬單位、地址、手機、電話、傳真、電子郵箱、身份證號碼等;咨詢優(yōu)化信息管理主要是對以下信息進行管理:項目名稱、項目起始時間、項目客戶、優(yōu)化內(nèi)容、價格等;集團培訓信息管理主要是對以下信息進行管理:培訓名稱、培訓起始時間、培訓地點、培訓客戶、培訓對象、培訓價格、培訓內(nèi)容等;學位教育信息管理主要是對以下信息進行管理:班級名稱、價格、學制、證書性質、課程、授課形式、授課時間等信息;講座公開課信息管理主要是對以下信息進行管理:講座公開課名稱、講座公開課時間、講座公開課地點、講座公開課內(nèi)容、講座公開課教師、講座公開課價格等信息;銷售人員信息管理主要是對以下信息進行管理:員工姓名、年齡、學歷、性別、職位、家庭地址、手機、電話、傳真、電子郵箱、身份證號碼、負責產(chǎn)品等;教師信息管理主要是對以下信息進行管理:教師姓名、年齡、性別、職務、所屬單位、聯(lián)系地址、手機、電話、傳真、電子郵箱、身份證號碼、研究領域等;教務人員信息管理主要是對以下信息進行管理:員工姓名、年齡、學歷、性別、職位、家庭地址、手機、電話、傳真、電子郵箱、身份證號碼、服務項目等。2.業(yè)務管理業(yè)務管理是根據(jù)福州大學管理學院EDP中心的業(yè)務流程,從開發(fā)新客戶開始到產(chǎn)品服務銷售完畢之間發(fā)生的一系列業(yè)務的過程,主要記錄這些業(yè)務的數(shù)據(jù)。主要包括營銷管理、銷售管理、客戶服務管理、售后管理。該功能模塊是整個系統(tǒng)的客戶信息收集的渠道。營銷行為管理是用來記錄銷售人員與客戶的一系列接觸過程,分布記錄營銷每個階段的客戶信息,實現(xiàn)客戶資源有記錄,保證客戶資源有記錄,保證中心掌握客戶資源。銷售管理可以明細記錄銷售過程和銷售業(yè)務信息,并能夠動態(tài)的查看銷售狀態(tài),保證銷售過程按計劃進行??蛻舴展芾碛涗浀氖强蛻粼谫徺I產(chǎn)品后接受產(chǎn)品服務過程中的一系列數(shù)據(jù),保證了客戶能夠接受良好的服務,并記錄顧客在服務中的表現(xiàn)。售后管理就是客戶反饋管理,是記錄客戶對產(chǎn)品質量的反饋意見,以及客戶服務人員對客戶意見的處理結果,增加與客戶的交流。業(yè)務管理與企業(yè)的業(yè)務流程息息相關,因此我們根據(jù)業(yè)務流程圖畫出業(yè)務管理的需求圖如下:營銷管理主要是對營銷信息的管理,主要記錄的是營銷員工編號、客戶編號、營銷時間、營銷內(nèi)容;銷售管理主要是對銷售信息的管理,主要記錄的是員工編號、客戶編號、產(chǎn)品編號、銷售時間;客戶服務管理主要是對客戶服務信息的管理,主要記錄的是員工編號、教師編號、客戶編號、產(chǎn)品編號;售后管理主要是對售后服務信息的管理,主要記錄的是員工編號、客戶編號、售后服務時間、售后服務內(nèi)容。3.綜合管理流程管理是記錄產(chǎn)品從營銷至售后之間的詳細流程,從而保證中心的運作符合規(guī)定的流程,保證中心合理、安全、有效的運行。而費用管理是對公司發(fā)生的業(yè)務的費用管理,保證公司的成本控制在合理范圍以內(nèi)。主要包括營銷流程管理、銷售流程管理、客戶服務流程管理、售后流程管理和費用管理。其需求圖如下所示:4.查詢分析管理查詢分析模塊主要包括綜合查詢、綜合統(tǒng)計和分析預測的功能。綜合查詢能夠將現(xiàn)有數(shù)據(jù)按查詢的條件展示信息,綜合統(tǒng)計模塊能夠按照條件對數(shù)據(jù)進行簡單操作,進行進一步統(tǒng)計,而分析預測模塊根據(jù)要求和分析預測模型來對現(xiàn)有數(shù)據(jù)進行分析預測,通過以上模塊,管理者能對中心運行現(xiàn)狀有清晰的了解,也能進一步對未來可能的發(fā)展有一個預測。該模塊是整個系統(tǒng)的核心模塊,也是體現(xiàn)數(shù)據(jù)挖掘效果的模塊。通過數(shù)據(jù)的綜合查詢、統(tǒng)計、分析,發(fā)現(xiàn)數(shù)據(jù)背后潛在的知識,從而達到輔助決策的目的,實現(xiàn)CRM系統(tǒng)對企業(yè)管理和指導功能。該模塊是體現(xiàn)數(shù)據(jù)挖掘功能的模塊,當前階段需要的是三個功能,分別是潛在客戶識別、潛在客戶分類以及客戶滿意度分析。潛在客戶識別是通過數(shù)據(jù)挖掘的分類技術對當前客戶進行分析,進而得出客戶的特征,用這些客戶特征作為標準來分析潛在客戶;潛在客戶分類是通過數(shù)據(jù)挖掘的聚類技術將潛在客戶分類,針對不同類的特點設計營銷方式;客戶滿意度分析是通過數(shù)據(jù)挖掘的聚類技術將影響客戶滿意度的因素進行分類,針對滿意度因素的重要性和當前滿意度進行有針對性的改進措施。5.系統(tǒng)后臺管理系統(tǒng)后臺管理是對負責系統(tǒng)管理和維護的用戶進行授權,對系統(tǒng)部門進行管理;同時還要保證及時準確地對數(shù)據(jù)進行備份、恢復操作,保證系統(tǒng)安全穩(wěn)定的運行;同時還要記錄系統(tǒng)的更新及版本信息。(二)業(yè)務用例分析與建模業(yè)務建模是需求工程中最基礎的階段,也是整個項目的初始階段。其最主要的目的就是要梳理業(yè)務的流程,所以要保證需求的技術無關性,還要保證需求不要深入細節(jié)。用例模型描述的是外部執(zhí)行者所理解的系統(tǒng)功能。它的建立是系統(tǒng)開發(fā)者和用戶反復討論的結果,表明了開發(fā)者和用戶對需求規(guī)格達成的共識。在需求分析階段,可以用用例來捕獲用戶需求,以描述對系統(tǒng)感興趣的外部角色及其對系統(tǒng)的功能要求。1.業(yè)務主角、業(yè)務角色業(yè)務主角:參與處理業(yè)務的用戶就叫做業(yè)務主角,在本模型中,業(yè)務主角主要包括業(yè)務人員(銷售人員、教師、教務人員)、管理人員(部門經(jīng)理、高層管理)、系統(tǒng)管理員。業(yè)務角色:不同參與到系統(tǒng)中的人員所獲得的權限就是業(yè)務角色。在企業(yè)中,需要根據(jù)業(yè)務主角的工作任務來確定他們的管理權限,管理權限主要有瀏覽、查詢、修改、審批等。2.用例視角用例總是從參與者視角出發(fā),將用例表達出來。通常我們根據(jù)參與者的請求,來確定系統(tǒng)所要執(zhí)行事件的先后順序,從而能夠為參與者提供有序、可靠、可觀察、有價值的結果。下圖展示了本系統(tǒng)的業(yè)務用例圖((UseCaseDiagrams),它展示了整個系統(tǒng)。它的主要目的是幫助開發(fā)者以一種可視化的方式理解系統(tǒng)的功能需求,包括基于基本流程的“角色”(actors)關系,以及系統(tǒng)內(nèi)用例之間的關系。第四章、EDP-CRM系統(tǒng)設計一、設計目標隨著客戶的不斷增加,和客戶相關的信息資料也不斷增加,這就要求更多的人力和物力,才能整理這些龐雜信息資料。而且,為了能夠進一步利用現(xiàn)有的信息資源,對數(shù)據(jù)進行進一步的數(shù)據(jù)挖掘是必然的選擇。但是,顯而易見,如果僅僅依靠以往的人工技術或者簡單的應用office工具的話,這將是一項幾乎不可能的工作。因此,福州大學管理學院EDP中心客戶關系系統(tǒng)的設計目標首先是解決現(xiàn)有與客戶相關信息的管理工作,其次在此基礎上能夠運用數(shù)據(jù)挖掘技術對現(xiàn)有信息進行進一步分析。二、EDP-CRM系統(tǒng)功能結構設計根據(jù)企業(yè)的組織結構以及上文分析的企業(yè)的需求的功能,并結合CRM系統(tǒng)的特點,我們將福州大學管理學院EDP-CRM系統(tǒng)劃分為信息管理模塊、業(yè)務管理模塊、綜合管理模塊、決策管理模塊以及后臺管理模塊等五個模塊。通過這五個功能模塊主要完成以下功能:客戶信息管理、產(chǎn)品信息管理、員工信息管理、營銷管理、銷售管理、服務管理、售后管理、流程管理、費用管理、查詢決策支持分析、后臺管理等功能。具體的福州大學管理學院EDP-CRM系統(tǒng)功能模塊結構圖如下所示:三、EDP-CRM系統(tǒng)結構設計福州大學管理學院EDP中心的系統(tǒng)結構,主要是兩大部分組成,分別是信息管理和數(shù)據(jù)挖掘。其中,信息管理是數(shù)據(jù)的根本,為EDP中心的運營提供保障,也為數(shù)據(jù)挖掘提供數(shù)據(jù)支持;而數(shù)據(jù)挖掘是數(shù)據(jù)的進一步升華,是對數(shù)據(jù)基本功能外的進一步開發(fā),挖掘數(shù)據(jù)內(nèi)在的價值。數(shù)據(jù)挖掘和信息管理兩個部分的管理如下圖所示:四、EDP-CRM系統(tǒng)平臺結構設計福州大學管理學院EDP中心客戶關系管理系統(tǒng)擬采用Browser/Server平臺結構,由網(wǎng)絡服務器平臺、網(wǎng)絡數(shù)據(jù)庫平臺、系統(tǒng)文件和輔助開發(fā)工具組成。網(wǎng)絡服務平臺是Microsoft公司的IIS平臺,網(wǎng)絡數(shù)據(jù)庫平臺為Microsoft公司的SQLServer2000數(shù)據(jù)庫平臺,輔助開發(fā)工具選用的是Macromedia公司的可視化網(wǎng)頁編輯工具Dreamweaver8,在這個平臺下采用JSP進行開發(fā)。五、EDP-CRM系統(tǒng)數(shù)據(jù)庫設計六、EDP-CRM系統(tǒng)數(shù)據(jù)倉庫設計(一)、概念模型設計1.確定系統(tǒng)邊界隨著我國經(jīng)濟發(fā)展,整個社會對知識的需求日益增加,尤其是企業(yè)的中高層人員,擁有大量管理經(jīng)驗但缺乏相應的理論體系的指導。同時,隨著科技水平的告訴發(fā)展,越來越多的高新技術更快的投入到應用,也要求企業(yè)的管理人員需要與之相適應的技術能力和管理能力的支持。因此,近年來EDP高層教育培訓越來越受到社會大眾的關注,大量企業(yè)中高層精英愿意并開始參與到了EDP的學習之中。同時,進入新世紀以來,計算機技術的迅速發(fā)展以及數(shù)據(jù)庫管理系統(tǒng)的廣泛應用,使得EDP中心應用了許多業(yè)務系統(tǒng),比如教務管理系統(tǒng)、辦公自動化系統(tǒng)等。這些系統(tǒng)都是面向應用和事務的,它僅僅向管理者提供了進行簡單的歸類和匯總的業(yè)務數(shù)據(jù)。隨著這些系統(tǒng)的運行,積累的數(shù)據(jù)越來越多。激增的數(shù)據(jù)背后隱藏著許多重要的信息,管理者們希望能夠對其進行進一步的分析,以便更好地發(fā)掘這些數(shù)據(jù)背后的價值,來提高企業(yè)的效益。目前的數(shù)據(jù)庫系統(tǒng)可以高效地實現(xiàn)數(shù)據(jù)的錄入、查詢、刪除、查詢等功能,但無法發(fā)現(xiàn)數(shù)據(jù)中存在的關系和規(guī)則,無法根據(jù)現(xiàn)有的數(shù)據(jù)來預測未來的產(chǎn)品、企業(yè)的發(fā)展趨勢。缺乏挖掘數(shù)據(jù)的手段,導致了“數(shù)據(jù)爆炸但知識貧乏”的現(xiàn)象。隨著我國教育體制改革進程的不斷推進,越來越多的高校推出了高層培訓的課程服務。高校高層培訓市場的競爭愈演愈烈。面對激烈的市場競爭,福州大學EDP中心為了吸引新顧客、維持老顧客、發(fā)展新業(yè)務、提高顧客利潤率,需要建立科學的、適合本身業(yè)務需求的CRM系統(tǒng)。為了解決這些問題,福州大學管理學院EDP中心目前分析的對象主要是:客戶信息(包括個人客戶與集團客戶)、產(chǎn)品信息(包括集團產(chǎn)品與個人產(chǎn)品)、員工信息(包括教師、營銷人員和教務人員)。2.確定主題域主題是對應分析領域的分析對象,對原有分散的數(shù)據(jù)庫的分析,考慮各級分析人員的需求,在完成系統(tǒng)邊界劃分的基礎上我們確定福州大學管理學院EDP中心的數(shù)據(jù)倉庫的幾個基本主題。(1)客戶個人客戶是以個體為單位向福州大學管理學院EDP中心購買服務,一般以提升個人知識水平,從而達到提升自我素質的目的的客戶。中心向個人客戶提供各種學位班、講座、公開課等服務,從而收取相應的費用。集團客戶是以集團為單位向福州大學管理學院EDP中心購買服務,一般以滿足集團客戶企業(yè)優(yōu)化、內(nèi)部培訓目標,從而使集團企業(yè)更好優(yōu)化為目的的客戶。中心想集團客戶提供短訓班、流程優(yōu)化項目等服務,收取相應的費用。(2)產(chǎn)品福州大學管理學院EDP中心的業(yè)務就是它所提供的培訓項目,它是向企業(yè)中高層認識提供的服務型產(chǎn)品,通過免費、收費的不同業(yè)務,能分別起到提高中心知名度和提高中心經(jīng)濟效益的作用。而中心業(yè)務是否受歡迎,直接影響到中心各部門的經(jīng)濟效益。(3)員工當前,福州大學管理學院EDP中心的員工主要分為教師、教務人員與銷售人員。在福州大學管理學院EDP中心,銷售人員就是負責將中心的教育培訓服務介紹給客戶,并與客戶保持聯(lián)系,進而達成客戶購買服務。他們的目標主要是發(fā)展新客戶、維持老客戶并進一步挖掘客戶價值。教師是EDP-CRM系統(tǒng)區(qū)別于其他CRM系統(tǒng)的一個特殊主題。從本質上講,教師是EDP教育培訓服務的生產(chǎn)者,但是在授課過程中又部分承擔了銷售人員的角色。他們的任務是將顧客所需的知識傳授給顧客,從而提高顧客滿意度。教務人員負責對現(xiàn)有客戶進行管理,同時也是現(xiàn)有客戶接受購買服務的時候服務的提供者之一。同時,教務人員還承擔收集顧客在接受服務時的數(shù)據(jù),從而為下一步的數(shù)據(jù)分析提供信息支持,進一步提高顧客滿意度。(二)、邏輯模型設計邏輯模型設計是指在數(shù)據(jù)倉庫中如何描述主題。它是對概念模型設計的進一步細化。一般來說,數(shù)據(jù)倉庫都是在現(xiàn)有的關系型數(shù)據(jù)庫基礎上發(fā)展起來的。所以數(shù)據(jù)倉庫中的數(shù)據(jù)仍然是以數(shù)據(jù)表格的形式進行組織的。邏輯模型就是要把不同主題和維的信息映射到數(shù)據(jù)倉庫的具體的表中。這一階段的設計主要包括:分析主題和維信息,確定粒度層次劃分;關系模式的定義。1.分析主題域2.粒度劃分3.星型模型和雪花模型(三)、物理模型設計(四)、數(shù)據(jù)倉庫的系統(tǒng)結構七、EDP-CRM系統(tǒng)數(shù)據(jù)挖掘設計當今社會,企業(yè)間競爭越來越激烈,從而導致了客戶關系越來越重要,客戶關系已不再是從前那種簡單的用電話、短信或者郵件等方式來增加與客戶的溝通?,F(xiàn)在,針對客戶的決策會很大程度上影響到企業(yè)原有客戶和潛在客戶的去留,可以決定企業(yè)的成敗。因此,通過分析顧客的信息,經(jīng)客戶信息進行數(shù)據(jù)挖掘,發(fā)現(xiàn)數(shù)據(jù)間信息,從而做出正確的決策,對企業(yè)都顯得至關重要。事實上,數(shù)據(jù)挖掘在客戶關系管理中可以發(fā)揮相當巨大的作用,在客戶關系管理的各個階段都可以應用數(shù)據(jù)挖掘技術。數(shù)據(jù)挖掘能夠分析客戶的特點,從而將客戶分為不同類型,進而提供有針對性的服務;數(shù)據(jù)挖掘,能夠分析客戶對產(chǎn)品的不同方面的滿意度,從而進一步促進企業(yè)改進產(chǎn)品,提高客戶的滿意度;企業(yè)可以分析購買某一商品的客戶的特征,從而可以對具有相同特征的客戶進行針對性的營銷,提高營銷的準確性。本文著重從數(shù)據(jù)挖掘的角度出發(fā),結合EDP教育的特點,EDP-CRM系統(tǒng)的數(shù)據(jù)信息,主要實現(xiàn)EDP客戶關系管理中三個數(shù)據(jù)挖掘的功能。(一)功能設計 數(shù)據(jù)挖掘模塊共設計三個子模塊,分別是潛在客戶識別、潛在客戶分類以及影響客戶滿意度因素分析。 潛在客戶識別是通過對現(xiàn)有客戶的分析,對現(xiàn)有客戶進行分類,并通過數(shù)據(jù)挖掘的分類功能提取客戶分類的規(guī)則,按照規(guī)則對現(xiàn)有潛在客戶進行分析,識別其中的客戶類別,并針對不同客戶類別的特點進行有針對性的營銷。 潛在客戶分類是通過對現(xiàn)有潛在客戶接受的營銷數(shù)據(jù)進行分析,通過數(shù)據(jù)挖掘的聚類功能將潛在客戶按照營銷進度的不同進行聚類,按照聚類后的每個類的進度安排進一步的營銷的安排。 客戶滿意度分析是通過調(diào)查問卷,收集影響客戶滿意度的因素,對影響客戶滿意度的因素進行聚類,按照聚類結果提出相應的改進措施。(二)EDP-CRM系統(tǒng)的客戶識別對于許多企業(yè)來說,新客戶的獲得對他們是非常重要的,企業(yè)的發(fā)展需要不斷的獲得新的客戶。而對于EDP培訓教育來說,它的教育具有產(chǎn)品服務周期長、單個產(chǎn)品價格高、產(chǎn)品種類少、同產(chǎn)品無法重復購買的特點,因此,不管如何維持老客戶關系,它的老客戶也會不斷的流失,所以對EDP教育來說,獲得新客戶至關重要。客戶分類功能的主要對象主要是企業(yè)以前沒有關注到的客戶,由于某些客觀原因或者缺少數(shù)據(jù)支持的主觀推測,企業(yè)并沒有意識到那些客戶有購買企業(yè)產(chǎn)品的需求。通過數(shù)據(jù)挖掘,能夠幫企業(yè)成功識別這些具有潛在消費能力的客戶群體,從而使營銷行為更加有針對性,從而提高市場活動的響應率。1.功能實現(xiàn)流程2.算法選擇及介紹(1)算法選擇分類是數(shù)據(jù)挖掘技術的一個重要分支,因此,學者們份份展開了針對分類算法的研究,目前存在的主要分類算法有決策樹方法、KNN方法、神經(jīng)網(wǎng)絡和貝葉斯方法等。本文根據(jù)CRM中的客戶分類挖掘中的要求,選擇以決策樹方法進行CRM客戶分類研究,再根據(jù)數(shù)據(jù)的特點,選擇經(jīng)典的ID3算法進行實現(xiàn)。(2)ID3算法簡介ID3算法是一種其理論清晰,方法簡單,學習能力強的算法,普遍認為ID3算法適用于處理大規(guī)模的學習問題,一般來說,數(shù)據(jù)庫越大,ID3算法的效果越好,所以,ID3算法已經(jīng)成為了數(shù)據(jù)挖掘和機器學習領域中的一個極好范例,在世界上廣為使用,得到極大的關注。要理解ID3算法,首先要了解信息增益的概念。信息增益基于信息論中的熵的概念。熵是對事件對應的屬性的不確定性的度量。一個屬性的熵越大,它蘊含的不確定信息越大,越有利于數(shù)據(jù)的分類。因此,ID3算法首先根據(jù)信息增益找出熵最大的因素,然后將數(shù)據(jù)根據(jù)這個因素分成多個子集,每個子集又選擇最熵進行劃分,一直進行到所有子集僅包含同一類型的數(shù)據(jù)為止。據(jù)此,我們可以獲得一顆決策樹,根據(jù)決策樹,我們可以對新的樣例進行分類。(3)信息增益的計算設是個數(shù)據(jù)樣本的集合。假定類標號屬性具有個不同值,定義個不同類。設是類中的樣本數(shù)量。對給定的樣本分類所需的期望信息由以下公式給出:(1)其中是任意樣本屬于的概率,一般用來估計。設屬性具有個不同值。可以用屬性將劃分為個子集,其中包含中這樣一些樣本,他們在上具有值。如果作為測試屬性,則這些子集相對應于包含集合的節(jié)點生長出來的分支。設是子集中類的樣本數(shù)。根據(jù)由劃分成子集的熵由以下公式給出:(2)這里充當?shù)?個子集的權,并且等于子集中的樣本數(shù)除以中的樣本總數(shù)。熵值越小,子集劃分的純度越高。注意,根據(jù)上面給出的期望信息計算公式,對于給定的子集,其期望信息由以下公式計算(3)其中是中樣本屬于類的概率。 由期望信息和熵值可以得到對應的信息增益值。對于上分支將獲得的信息增益可以由下面的公式得到: (4) ID3算法計算每個屬性的信息增益,并選取具有最高增益的屬性作為給定集合的測試屬性。對被選取的測試屬性創(chuàng)建一個節(jié)點,并以該屬性標記,對該屬性的每個值創(chuàng)建一個分支,并依此劃分樣本。(三)EDP-CRM系統(tǒng)的客戶分類當企業(yè)掌握了足夠多的潛在客戶資源之后,就會針對客戶進行營銷行為,并會積累相應的營銷數(shù)據(jù)信息。這是,就會有另一個困擾管理者的問題,那就是無法區(qū)分潛在客戶之間的區(qū)別,這樣導致的結果是對所有潛在客戶采取同樣的措施,這就導致了兩個問題,首先是營銷成本的提高,其次還會影響營銷的效果,進而降低企業(yè)的效益。通過數(shù)據(jù)挖掘技術,企業(yè)能夠按照他們的需求,將客戶根據(jù)現(xiàn)在的營銷進度進行分類,將具有相同營銷進度的顧客歸為相同的類,對給定類的客戶根據(jù)這一類的特點制定針對性強、具有差異化的營銷策略。這樣做不僅能夠降低營銷的規(guī)模,有效的降低營銷的成本;同時,因為涉及的營銷策略是完全針對這一類的特點,從而使得營銷策略更加有針對性,提高營銷的效率。從這兩方面入手,能夠有效降低企業(yè)成本,提高企業(yè)的效益。更進一步的,企業(yè)甚至能根據(jù)這些類的特點來設計產(chǎn)品服務,從而提高企業(yè)競爭力。1.功能實現(xiàn)流程2.算法選擇及介紹聚類也是數(shù)據(jù)挖掘的重要模塊,聚類算法有很多,其中,K均值算法是聚類分析中一種基本的劃分方法,其理論可靠、算法簡單、收斂速度快、能有效處理大數(shù)據(jù)集,因此被廣泛使用。我們也選用K均值算法作為EDP-CRM系統(tǒng)的聚類算法。但該方法需要實現(xiàn)確定聚類中心數(shù)量K,而且算法受初始值影響很大,容易收斂于局部最優(yōu)解,所以,我們對K均值聚類算法進行適當改進,提出基于遺傳算法的可變K均值聚類方法,以提高算法的功能。(1)聚類分析的數(shù)學模型聚類是將樣本數(shù)據(jù)分類到不同的類或者簇的一個過程,聚類結果有效性可以通過內(nèi)部驗證指標和外部驗證指標進行驗證[5]。本文選取這些內(nèi)部指標中的Calinski-Harabaszindex(簡稱為CHindex)作為聚類的目標函數(shù)。設是給定空間中的有限數(shù)據(jù)集,將個數(shù)據(jù)樣本按照它們之間的相似度分為類,聚類的內(nèi)部聚合度用類內(nèi)的平方和表示:(1)式中,表示聚類中心:聚類的類外部分離度用類中心到樣本中心的平方和與類數(shù)量的乘積表示:(2)式中,表示所有個點的中心所以,聚類問題的目標函數(shù)是(3)式中,;為屬于第類的樣本個數(shù);表示樣本屬于第類;;為聚類中心個數(shù);為樣本數(shù)。對于聚類問題而言,類內(nèi)聚合度越小越好,而類間相似度越大越好,所以聚類問題的目標函數(shù)越大越好。(2)K均值算法簡介k均值算法,又稱為k-平均算法(k-Means),是一種得到最廣泛使用的聚類算法。k均值算法以k為參數(shù),把n個對象分為k個簇,以使得簇內(nèi)具有較高的相似度。相似度的計算根據(jù)是一個簇內(nèi)的平均值來進行。算法首先隨機的選擇k個對象,每個對象初始地代表了一個簇的平均值或者中心。對剩余的每個對象根據(jù)其余各個簇中心的距離,將它賦予最近的簇。然后重新計算每個簇的平均值。這個過程不斷重復,直到準則函數(shù)收斂。k均值算法的準則函數(shù)定義為即為上節(jié)聚類模型的內(nèi)部聚合度:這個準則可以保證生成的結果簇盡可能的緊湊和獨立。(3)算法改進k均值算法雖然有以上優(yōu)點,但是需要事先確定聚類中心數(shù)量k,因此具有先天的限制。本文算法的思想是在:在研究聚類問題時,將K均值算法與遺傳算法結合,來解決K均值無法求解K值缺點。(1)算法流程Step1.初始種群生成Step2.用K均值算法對篩選出來的個體進行優(yōu)化,并用優(yōu)化后的個體取代原來的個體Step3、對種群中的個體進行選擇、交叉、變異操作,并在完成后重新計算K值Step3.重復步驟Step2和Step3至滿足終止條件(2)染色體編碼設計染色體編碼方法很多,在聚類分析中常用基于聚類中心的浮點數(shù)編碼和基于聚類劃分的整數(shù)編碼。由于聚類算法具有多維、量大的特點,聚類樣本數(shù)目一般遠遠大于聚類數(shù)目,因此本文采用基于聚類中心的浮點數(shù)編碼。染色體結構為,其中K為基因的長度,為隨機產(chǎn)生的聚類中心個數(shù),為染色體第位的基因,它有個維度。,。(3)適應度函數(shù)設計遺傳算法中的適應度函數(shù)是用來評價個體、區(qū)別個體優(yōu)劣的標準。個體的適應度越高,其存活的概率就越大。本文以聚類的目標函數(shù)作為適應度函數(shù)。(4)選擇算子設計為了保證適應度函數(shù)越大的染色體保留到下一代的概率越大,本文采用了遺傳算法中經(jīng)典的輪盤賭選擇算子。該選擇算子具體操作如下:Step1.進行K均值操作,更新染色體;Step2.根據(jù)適應度函數(shù),計算當前種群染色體的適應度,并記錄其中適應度最大的個體;Step3.再根據(jù)個體的適應度值,來計算各個體的選擇概率;其中,個體選擇概率的計算方法是,為種群規(guī)模,即為聚類目標函數(shù)的值,為所有個體適應度的總和。Step4、根據(jù)計算出的選擇概率,使用輪盤賭法選出個體。(5)交叉算子設計隨機從種群中選擇對染色體作為父代,對每對染色體,產(chǎn)生隨機數(shù),當時,在兩個染色體中分別隨機產(chǎn)生交叉點,其中他們的交叉點范圍分別為和,對交叉點后的基因進行交叉運算,并重新計算交叉后的染色體長度,直到所有個體進行過交叉為止。(其中為交叉概率,)。(6)變異算子設計對每一個個體,每一個基因位,產(chǎn)生隨機數(shù),當時,對該基因位進行隨機變異運算,生成下一代種群。(其中為交叉概率)。(7)K均值操作本文的K均值操作,主要是在遺傳算法進行到變異之后,在下一次選擇之前進行,主要的操作主要有以下兩點:Step1.檢查染色體長度,當染色體長度大于最大聚類個數(shù)時,將這條染色體從種群中刪去;Setp2、先以變異并通過檢查后產(chǎn)生的染色體基因為中心,進行K均值聚類,然后用K均值聚類的結果來取代原來的染色體中的基因。(8)循環(huán)終止條件循環(huán)代數(shù)開始為0,每進行一次循環(huán),代數(shù)加1,若循環(huán)代數(shù)達到最大循環(huán)代數(shù)時結束循環(huán),輸出最后的聚類結果。(四)EDP-CRM系統(tǒng)的客戶滿意度分析在實現(xiàn)了潛在客戶發(fā)現(xiàn)與分類功能之后,如何分析和保證現(xiàn)有客戶的滿意度也是一個對企業(yè)至關重要的問題。客戶滿意程度是直接影響到客戶的忠誠度,通過客戶滿意度分析,企業(yè)能夠不斷改進影響客戶滿意度的環(huán)節(jié),增加現(xiàn)有客戶忠誠度,也增加自身產(chǎn)品服務的吸引力。客戶滿意度分析模塊通過對影響EDP教育服務客戶滿意度的因素進行分析,設計適用于EDP教育的客戶滿意度評價指標,并依據(jù)經(jīng)驗和專業(yè)知識選擇適當?shù)姆椒ù_定各評價指標的權重,通過一定的計算方法來獲得客戶對培訓服務的滿意情況,然后對客戶滿意度進行綜合分析,調(diào)整響應的客戶策略,使酒店有針對性的改善硬件產(chǎn)品和服務質量,從而提高客戶的滿意度,促進改善客戶關系。1.功能實現(xiàn)流程客戶滿意度就是反映的是客戶滿意的程度,屬于心理范疇,無法直接從客戶信息數(shù)據(jù)庫中獲得。因此,本文采用建立客戶滿意度評價指標體系,對客戶進行問卷調(diào)查的方式來衡量客戶的滿意度。調(diào)查研究工作主要分為以下步驟:確定研究的主要目標和研究對象;根據(jù)調(diào)研結果分析影響EDP中心客戶滿意度的主要因素,確定評價指標并建立滿意度評價模型;制定滿意度調(diào)查方案;實施調(diào)查;收集調(diào)查結果,將結果量化;對客戶滿意度情況進行分析,支持EDP中心的決策。具體流程如下圖所示:2.算法選擇與簡介在滿意度分析中,我們也采用k均值聚類的算法對滿意度進行分析,這樣能使計算的效率更高,具體的算法簡介如上節(jié)所述。第五章EDP-CRM系統(tǒng)架構與實現(xiàn)一、系統(tǒng)開發(fā)二、數(shù)據(jù)挖掘模塊的實現(xiàn)(一)客戶識別1.數(shù)據(jù)獲得與處理為了實現(xiàn)對客戶分類,必須從現(xiàn)有數(shù)據(jù)中提取每個客戶的特征信息,而EDP培訓教育的客戶涉及不同產(chǎn)業(yè),而且涉及的客戶所處的崗位、所承擔的工作各不相同,再加上客戶資料收集方式各不相同,因此,客戶的特征信息也五花八門。因此,我們選取客戶的通用特征信息來進行分析。福州大學管理學院EDP中心從建立以來一直都以客戶為中心,一直關注于客戶信息的搜集與信息反饋,因此,我們提取了中心306名客戶的信息。為了實現(xiàn)對客戶的分類劃分,需要對客戶各屬性信息進行處理,才能交由進行相應分類操作。(1)屬性選擇首先要對客戶特征表進行屬性選擇,刪除可用其它屬性來代替的屬性,或者有大量的不同取值且無法進行量化的客戶屬性。如客戶信息表中的身份證號碼、手機電話傳真號碼、郵箱等,它們的取值太多且雜,往往無法在該取值域內(nèi)進行量化操作,所以應將其刪除即可得到如下表所示的特征屬性表。編號性別年齡婚否年收入單位性質公司規(guī)模職位學歷地區(qū)1男53已婚30萬事業(yè)單位600人老師博士福州2女26未婚8萬公務員50-100人職員本科福州3女44已婚40萬私企100-500人財務總監(jiān)中專廈門4男38已婚120萬外企10-50人運營總監(jiān)碩士福州5男49離異1000萬上市公司1000人以上總裁大專福州(2)屬性概化對離散的數(shù)據(jù),我們用屬性概化閥值控制技術沿屬性概念分層進行概化。具體的離散方法如下,我們將客戶文化程度分為0-5六類,分別代表小學、初中、高中、大學、碩士、博士;對于單位類別可以按工作性質分為0-2三類,分別代表集體、私人和公職;客戶職位可以分為0-3,分別代表最高管理層、高級管理層、低級管理層、普通職員;而客戶性別顯然可分為0-1兩類,分別代表男和女;客戶婚否分為0-2三類,分別代表未婚、已婚以及離婚寡居;至于地區(qū),由于學校地處福州,主要客戶群在福州,因此我們將其分為0-1兩類,分別代表福州地區(qū)以及福州意外地區(qū)。而對于連續(xù)的數(shù)據(jù),我們將其按區(qū)間進行劃分。表中客戶年齡、年收入等數(shù)據(jù)為連續(xù)型數(shù)據(jù),一般在分類時,系統(tǒng)執(zhí)行離散型數(shù)據(jù)速度較快,因此需要對連續(xù)型數(shù)據(jù)進行離散化處理,根據(jù)數(shù)據(jù)特點,我們將客戶年齡分為0-3四類,分別代表20-30歲,30-40歲,40-50歲以及50-60歲;對于客戶年收入,我們將其分為分別代表0-3四類,分別代表0-10萬、10-100萬、100-1000萬、

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預覽,若沒有圖紙預覽就沒有圖紙。
  • 4. 未經(jīng)權益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負責。
  • 6. 下載文件中如有侵權或不適當內(nèi)容,請與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

評論

0/150

提交評論