![基于聚類分析的客戶關(guān)系管理——銀行分行案例分析_第1頁](http://file2.renrendoc.com/fileroot_temp3/2021-10/8/4f8db676-9740-424d-a6ae-2505227ee075/4f8db676-9740-424d-a6ae-2505227ee0751.gif)
![基于聚類分析的客戶關(guān)系管理——銀行分行案例分析_第2頁](http://file2.renrendoc.com/fileroot_temp3/2021-10/8/4f8db676-9740-424d-a6ae-2505227ee075/4f8db676-9740-424d-a6ae-2505227ee0752.gif)
![基于聚類分析的客戶關(guān)系管理——銀行分行案例分析_第3頁](http://file2.renrendoc.com/fileroot_temp3/2021-10/8/4f8db676-9740-424d-a6ae-2505227ee075/4f8db676-9740-424d-a6ae-2505227ee0753.gif)
![基于聚類分析的客戶關(guān)系管理——銀行分行案例分析_第4頁](http://file2.renrendoc.com/fileroot_temp3/2021-10/8/4f8db676-9740-424d-a6ae-2505227ee075/4f8db676-9740-424d-a6ae-2505227ee0754.gif)
![基于聚類分析的客戶關(guān)系管理——銀行分行案例分析_第5頁](http://file2.renrendoc.com/fileroot_temp3/2021-10/8/4f8db676-9740-424d-a6ae-2505227ee075/4f8db676-9740-424d-a6ae-2505227ee0755.gif)
版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進(jìn)行舉報(bào)或認(rèn)領(lǐng)
文檔簡介
1、基于聚類分析的客戶關(guān)系管理xx 銀行分行案例分析crm based on clusteringa case studyprof. li yong 摘 要i摘 要經(jīng)濟(jì)全球化,金融市場開放與競爭,信息技術(shù)突飛猛進(jìn),銀行業(yè)務(wù)的發(fā)展,促進(jìn)了 crm 在金融服務(wù)行業(yè)廣泛運(yùn)用。金融機(jī)構(gòu)正在應(yīng)用把客戶關(guān)系管理,整合客戶信息資源,發(fā)掘客戶價(jià)值,為客戶提供更加快捷、周到的產(chǎn)品和服務(wù),提高客戶滿意度和忠誠度,吸引更多的客戶,最終實(shí)現(xiàn)自身收益的最大化。在這種形勢下,如何細(xì)分客戶,通過從客戶的交易中了解客戶喜好,進(jìn)而進(jìn)行差異化管理,成為銀行面臨的重大挑戰(zhàn)。我們通過先進(jìn)的數(shù)據(jù)挖掘技術(shù)分析現(xiàn)有客戶的需求、愛好等,針對(duì)性的
2、提供個(gè)性化服務(wù),以改善銀行客戶經(jīng)理的營銷手段,提高銀行的經(jīng)濟(jì)效益。xx 銀行分行自成立以來,一直致力于客戶的差異化服務(wù),提升客戶的滿意度,取得良好的市場業(yè)績。隨著金融業(yè)的激烈競爭,外資銀行進(jìn)入中國市場,xx 銀行分行的戰(zhàn)略發(fā)展需要提升客戶的服務(wù)質(zhì)量,以適應(yīng)激烈的市場競爭,保持行業(yè)的領(lǐng)先地位。本文根據(jù) xx 銀行分行現(xiàn)狀和實(shí)際抽樣數(shù)據(jù)情況,明確了在數(shù)據(jù)分析和處理方面存在的問題和不足,分析了 xx 銀行分行的客戶現(xiàn)狀。在sas 聚類分析上,從信息技術(shù)和客戶關(guān)系管理相結(jié)合的角度出發(fā),對(duì)銀行客戶進(jìn)行分類,找出不同類型客戶的行為特征,以此對(duì)不同類別的客戶制定相關(guān)的客戶關(guān)系管理策略,提供有針對(duì)性的差異化個(gè)
3、性服務(wù),以使 xx 銀行分行在激烈的金融市場競爭中獲得大的收益,立于不敗之地。關(guān)鍵詞:數(shù)據(jù)挖掘,聚類分析,客戶分類,客戶關(guān)系管理重慶工商管理碩士學(xué)院畢業(yè)論文 abstractiiabstractthe globalization of the economy, liberalization and competition of financial market, advances in information technology, development of banking and business which promote crm wider application in the fi
4、nancial services industry. financial institutions are regarding customer relationship management as a strategy, through the integration of information resources. bank will improve customer satisfaction and loyalty and maintain and attract more customers maximize their own profits at last.under such
5、circumstances, how to cluster customers and how to understand customers characteristics achieve the differentiated customer management strategy all which will be the major challenges. we could raise banks economic efficiency, through advanced data mining analysis of existing customer needs, preferen
6、ces, etc.chongqing branch of the xx bank commitment to personalized customer service since its establishment and made good market performance. with the fierce competition in the financial sector, foreign banks enter the chinese market. chongqing branch of the xx bank need to apply high-tech software
7、 in order to meet the fierce market competition, and maintain industry leadership.in this paper, it is in this context; understand the question and the inadequate and analyses customers status. base on sas clustering analyses from the information technology and customer relationship management, the
8、banking clients were classified and identify different types of customer behavior characteristics. base on customers behavior characteristic provide personalized service. in order chongqing branch of xx bank to be the largest winner in the fierce competition of financial markets.keywords: data minin
9、g, clustering analyses, customer classify, crm 重慶工商管理碩士學(xué)院畢業(yè)論文 目 錄iii目 錄摘 要iabstractii1 緒 論 11.1 研究的目的和意義11.2 論文研究的主要內(nèi)容及框架12 客戶關(guān)系管理與數(shù)據(jù)挖掘的相關(guān)理論概述 32.1 客戶關(guān)系管理相關(guān)理論32.1.1 crm 的定義與內(nèi)涵32.1.2 crm 的核心管理思想42.1.3 crm 所需要的技術(shù)62.2 數(shù)據(jù)挖掘理論72.2.1 數(shù)據(jù)挖掘概述 72.2.2 數(shù)據(jù)挖掘的模式 82.2.3 數(shù)據(jù)挖掘在銀行客戶關(guān)系管理中的應(yīng)用 102.3 數(shù)據(jù)挖掘的聚類分析理論122.3.1
10、聚類的概念 122.3.2 聚類算法的一般特征 122.3.3 k-mean 算法簡介132.4 sas enterprise miner簡介133 xx 銀行分行客戶關(guān)系管理現(xiàn)狀分析173.1 xx 銀行分行簡介173.2 xx 銀行分行客戶數(shù)據(jù)分析與利用的現(xiàn)狀與問題173.3 xx 銀行分行客戶關(guān)系管理現(xiàn)狀183.4 基于數(shù)據(jù)挖掘的客戶價(jià)值研究總體思路194 面向 crm 的聚類分析204.1 問題描述204.2 數(shù)據(jù)采集與預(yù)處理214.2.1 數(shù)據(jù)模型 214.2.2 數(shù)據(jù)預(yù)處理 22重慶工商管理碩士學(xué)院畢業(yè)論文 目 錄iv4.3 聚類分析264.3.1 基于銀行收益數(shù)據(jù)的聚類分析 26
11、4.3.2 基于客戶活動(dòng)強(qiáng)度數(shù)據(jù)的聚類分析 284.4 聚類結(jié)果評(píng)估與解釋305 基于聚類的客戶關(guān)系管理 355.1 基于聚類的客戶分類355.1.1 基于銀行收益的客戶分類 355.1.2 基于活動(dòng)強(qiáng)度的客戶分類 395.1.3 基于客戶價(jià)值和活躍強(qiáng)度的客戶二維分類 435.2 基于聚類的客戶分類與銀行現(xiàn)有分類情況對(duì)比分析455.3 基于客戶細(xì)分的客戶關(guān)系管理策略475.3.1 針對(duì)高價(jià)值不同活動(dòng)強(qiáng)度客戶策略 475.3.2 針對(duì)中價(jià)值不同活動(dòng)強(qiáng)度客戶策略 495.3.3 針對(duì)低價(jià)值不同活動(dòng)強(qiáng)度客戶策略 525.4 預(yù)期應(yīng)用效果536 結(jié) 論 54致 謝 55參考文獻(xiàn) 56重慶工商管理碩士學(xué)
12、院畢業(yè)論文 1 緒 論11 緒 論1.1 研究的目的和意義隨著金融體制改革的深化和銀行業(yè)的改制,以及外資銀行進(jìn)入中國,銀行業(yè)的危機(jī)意識(shí)不斷增強(qiáng),國內(nèi)銀行業(yè)面臨更加激烈的競爭,特別是從 2007年 10 月份美國次貸危機(jī)引發(fā)的全球金融危機(jī),直至發(fā)展成為全球的金融海嘯,導(dǎo)致國內(nèi)外銀行受到嚴(yán)重的沖擊。今年 9 月份美國第四大投資銀行雷曼兄弟的破產(chǎn),引起了全球銀行和企業(yè)的破產(chǎn)風(fēng)潮,致使全球經(jīng)濟(jì)進(jìn)入冬天。在這種劇烈競爭和嚴(yán)重沖擊下,哪家銀行能夠準(zhǔn)確把握客戶的需求并提供差異化的產(chǎn)品和服務(wù),哪家銀行就可能取勝,達(dá)到提高客戶滿意度和銀行收益增加的客戶和銀行雙贏局面??蛻羰倾y行最重要的資源,是銀行收益的主要來源
13、??蛻絷P(guān)系管理(crm)就是一個(gè)通過詳細(xì)管理企業(yè)與客戶之間的關(guān)系,使客戶價(jià)值最大化與企業(yè)收益最大化之間達(dá)到平衡的有效途徑。xx 銀行分行于 1996 年 12 月在成立,堅(jiān)持秉承自上而下的“因勢而變”、 “因您而變”服務(wù)理念,充分發(fā)揮自身優(yōu)勢,不斷將 xx 銀行分行“一卡通”、 “一網(wǎng)通”、 “金葵花理財(cái)”、 “點(diǎn)金理財(cái)”、國際標(biāo)準(zhǔn)雙幣信用卡、 “財(cái)富帳戶”等金融服務(wù)品牌推向深入。隨著 xx 銀行分行規(guī)模不斷擴(kuò)大,客戶交易數(shù)據(jù)庫越來越龐大,為對(duì)龐大的客戶信息資源進(jìn)行有效管理,需要建立適合于銀行發(fā)展的體系,在客戶基礎(chǔ)信息數(shù)據(jù)庫建立的基礎(chǔ)上,再對(duì)數(shù)據(jù)進(jìn)行挖掘和全面深入的分析處理。數(shù)據(jù)挖掘聚類技術(shù)對(duì)
14、銀行龐大數(shù)據(jù)進(jìn)行分析的優(yōu)點(diǎn)是顯而易見的:第一,對(duì)大量的數(shù)據(jù)進(jìn)行科學(xué)準(zhǔn)確的分析,劃分出數(shù)據(jù)的規(guī)律;第二,根據(jù)劃分的數(shù)據(jù)規(guī)律,對(duì)客戶進(jìn)行分類,并找出各類客戶的特征;第三,對(duì)各類客戶有針對(duì)性的制定出客戶關(guān)系管理策略方案,提供個(gè)性化服務(wù)。本文針對(duì) xx 銀行分行的發(fā)展需要,以及在大量數(shù)據(jù)處理方面存在的不足,結(jié)合實(shí)際情況,提出一系列可執(zhí)行方案,具有很強(qiáng)的針對(duì)性以及實(shí)際應(yīng)用意義。1.2 論文研究的主要內(nèi)容及框架本文對(duì)xx銀行分行在數(shù)據(jù)處理方面存在的不足采用數(shù)據(jù)挖掘聚類技術(shù)進(jìn)行了分析,對(duì)客戶進(jìn)行分類,針對(duì)不同類別的客戶制定相關(guān)的客戶關(guān)系管理策略。論文的研究框架如圖1.1所示:重慶工商管理碩士學(xué)院畢業(yè)論文 1
15、 緒 論2論文研究的目的和意義數(shù)據(jù)挖掘和客戶關(guān)系管理的相關(guān)理論xx 銀行重慶分行的客戶關(guān)系管理現(xiàn)狀分析基于聚類的客戶分類客戶關(guān)系管理策略的實(shí)施與應(yīng)用客戶聚類分析圖 1.1 論文研究框架32 客戶關(guān)系管理與數(shù)據(jù)挖掘的相關(guān)理論概述2.1 客戶關(guān)系管理相關(guān)理論2.1.1 crm 的定義與內(nèi)涵客戶關(guān)系管理(crm) 是依靠信息技術(shù)實(shí)現(xiàn)的全新的管理模式,它強(qiáng)調(diào)客戶價(jià)值和便利,充分利用以客戶為中心的資源,拓展全新的銷售方式和銷售渠道。企業(yè)任何產(chǎn)品的銷售,都是建立在良好的客戶關(guān)系基礎(chǔ)之上的,客戶關(guān)系成為企業(yè)發(fā)展的本質(zhì)要素。因此,客戶應(yīng)該被作為一種寶貴的資源納入到企業(yè)的經(jīng)營發(fā)展中來1。crm 定義 crm 作
16、為新興的管理概念,大量研究人員及機(jī)構(gòu)都提出了各自的 crm 定義。下面給出幾個(gè)有代表性的 crm 定義。romano 認(rèn)為,crm 就是“吸引并保持有經(jīng)濟(jì)價(jià)值的客戶,驅(qū)逐并消除缺乏經(jīng)濟(jì)價(jià)值的客戶”。group 認(rèn)為,“crm 是指通過圍繞客戶細(xì)分來組織企業(yè),鼓勵(lì)滿足客戶需要的行為,并實(shí)現(xiàn)客戶與供應(yīng)商之間聯(lián)系等手段,來提高盈利、收入和客戶滿意度的、遍及整個(gè)企業(yè)的商業(yè)策略。 ”burghard 和 galimi 認(rèn)為,“crm 是一個(gè)圍繞客戶需要和需求、重新設(shè)計(jì)企業(yè)及其業(yè)務(wù)流程的信息技術(shù)(it)驅(qū)動(dòng)的概念,它將一系列方法、軟件以及互聯(lián)網(wǎng)接入能力同企業(yè)的以客戶為核心的商業(yè)戰(zhàn)略相結(jié)合,致力于利潤、收益
17、和客戶滿意度的提高”。muther 認(rèn)為,crm 是指“通過協(xié)調(diào)、整合、集成企業(yè)同客戶的所有接觸點(diǎn),既整合銷售、營銷和服務(wù)流程,增強(qiáng)企業(yè)的獲利能力,增加企業(yè)的收益,crm 致力于建立、關(guān)懷及開發(fā)利用與重要客戶之間的良好個(gè)人關(guān)系”。schulze 等人將 crm 定義為“一種客戶導(dǎo)向的管理方法,它是基于整合了前臺(tái)營銷、銷售、服務(wù)所有信息的信息系統(tǒng)”。swift 認(rèn)為,crm 是指“企業(yè)通過富有意義的溝通,理解并影響客戶行為,最終實(shí)現(xiàn)提高客戶獲得、客戶保留、客戶忠誠和客戶創(chuàng)利的目的”。crm 是一個(gè)將客戶信息轉(zhuǎn)化成積極的客戶關(guān)系的反復(fù)循環(huán)過程。上述這些關(guān)于 crm 的界定,各有其側(cè)重之處。roma
18、no 是從客戶關(guān)系本質(zhì)出發(fā),強(qiáng)調(diào)了“關(guān)系”的經(jīng)濟(jì)價(jià)值,這也是如今學(xué)術(shù)界較為普遍接受的一種定義;group 的定義強(qiáng)調(diào)了商業(yè)策略;osterle 和 muther 則是強(qiáng)調(diào)整合客戶接1 廖俊松, 張金隆, 蔡淑琴. 論電子商務(wù)時(shí)代的客戶關(guān)系管理. 軟科學(xué), 2001,15(1):93-94.4觸點(diǎn)和前臺(tái)各流程;schulze 等人認(rèn)為 crm 是一種管理方法,強(qiáng)調(diào)以信息系統(tǒng)為基礎(chǔ),前后臺(tái)信息共享;swift 強(qiáng)調(diào)的是管理與客戶的關(guān)系。crm 的內(nèi)涵由于 crm 是一種新興的營銷管理理論,企業(yè)界和理論界對(duì)其有不同的詮釋,可從下述三個(gè)層面來表述。首先 crm 被認(rèn)為是一種營銷管理理念。crm 的核心
19、思想是將企業(yè)的客戶(包括最終客戶、分銷商和合作伙伴)作為最重要的企業(yè)資源,通過完善的客戶服務(wù)和深入的客戶分析來滿足客戶的需求,保證實(shí)現(xiàn)客戶的終生價(jià)值;其次,crm 也是一種旨在改善企業(yè)和客戶之間關(guān)系的新型管理機(jī)制。它實(shí)施于企業(yè)的市場營銷、銷售、服務(wù)與技術(shù)支持等與客戶相關(guān)的領(lǐng)域,通過向企業(yè)的銷售、市場和客戶服務(wù)的專業(yè)人員提供全面、個(gè)性化的客戶資料,并強(qiáng)化跟蹤服務(wù)、信息分析的能力,使他們能夠協(xié)同建立和維護(hù)一系列與客戶和生意伙伴之間卓有成效的“一對(duì)一關(guān)系”。一方面使企業(yè)得以提供更快捷和周到的優(yōu)質(zhì)服務(wù)、提高客戶滿意度、吸引和保持更多的客戶,從而增加營業(yè)額;另一方面則通過信息共享和優(yōu)化商業(yè)流程來有效地降
20、低企業(yè)經(jīng)營成本;最后,crm 也是一套管理軟件和技術(shù)。它是企業(yè)借助電子商務(wù)、數(shù)據(jù)倉庫和數(shù)據(jù)挖掘、專家系統(tǒng)和人工智能各種技術(shù)手段,建立一個(gè)能搜集、追蹤和分析客戶信息的系統(tǒng),為企業(yè)的銷售、客戶服務(wù)和決策支持等領(lǐng)域提供一個(gè)業(yè)務(wù)自動(dòng)化的解決方案,實(shí)現(xiàn)了企業(yè)由傳統(tǒng)模式向以電子商務(wù)為基礎(chǔ)的現(xiàn)代企業(yè)的轉(zhuǎn)化1。crm 體現(xiàn)了兩個(gè)管理趨勢的轉(zhuǎn)變2。一是企業(yè)從以產(chǎn)品為中心的模式逐漸向以客戶為中心的模式轉(zhuǎn)化。其次,crm 也表明了企業(yè)管理視角從“內(nèi)視型”向“外視型”的轉(zhuǎn)移。長期以來,傳統(tǒng)企業(yè)管理更關(guān)注的重心是企業(yè)內(nèi)部的生產(chǎn)部門,對(duì)帶來更多效益的外部市場和客戶一直缺乏科學(xué)的管理,企業(yè)依靠“內(nèi)視型”的管理模式已難以適應(yīng)
21、激烈的競爭,因此必須轉(zhuǎn)換自己的視角,整合企業(yè)的資源。2.1.2 crm 的核心管理思想crm 的核心管理思想主要包括以下幾個(gè)方面:客戶是企業(yè)發(fā)展最重要的資源之一企業(yè)發(fā)展需要對(duì)自己的資源進(jìn)行有效的組織與計(jì)劃。隨著人類社會(huì)的發(fā)展,企業(yè)資源的內(nèi)涵也在不斷擴(kuò)展,早期的企業(yè)資源主要是指有形的資產(chǎn),包括土地、設(shè)備、廠房、原材料、資金等。其后企業(yè)資源概念擴(kuò)展到無形資1 王廣宇. 客戶關(guān)系關(guān)系方法論. 清華大學(xué)出版社, 2004(9): 87-106.2 魯江, 熊燕. 提升中國現(xiàn)代企業(yè)的核心競爭力建立客戶關(guān)系管理. 科技進(jìn)步與對(duì)策, 2002(5):98-99.5產(chǎn),包括品牌、商標(biāo)、專利、知識(shí)產(chǎn)權(quán)等。再后來
22、,人們認(rèn)識(shí)到人力資源才是企業(yè)發(fā)展最重要的資源。時(shí)至工業(yè)經(jīng)濟(jì)時(shí)代后期,信息又成為企業(yè)發(fā)展的一項(xiàng)重要資源。乃至人們將工業(yè)經(jīng)濟(jì)時(shí)代后期稱為“信息時(shí)代”。在人類社會(huì)從“產(chǎn)品”導(dǎo)向時(shí)代發(fā)展為“客戶”導(dǎo)向時(shí)代的今天,客戶的選擇決定著一個(gè)企業(yè)的命運(yùn)。因此,客戶已經(jīng)成為當(dāng)今企業(yè)最重要的資源之一。在很多行業(yè)中,完整的客戶檔案或數(shù)據(jù)庫就是一個(gè)企業(yè)頗具價(jià)值的資產(chǎn)。通過對(duì)客戶資料的深入分析并應(yīng)用銷售理論中的 2/8 法則將會(huì)顯著改善企業(yè)營銷業(yè)績。對(duì)企業(yè)與客戶發(fā)生的各種關(guān)系進(jìn)行全面管理企業(yè)與客戶之間發(fā)生的關(guān)系,不僅包括單純的銷售過程所發(fā)生的業(yè)務(wù)關(guān)系,如合同簽訂、定單處理、發(fā)貨、收款等,而且包括在企業(yè)營銷及售后服務(wù)過程中
23、發(fā)生的各種關(guān)系。如在企業(yè)市場活動(dòng)、市場推廣過程中與潛在客戶發(fā)生的關(guān)系;在與目標(biāo)客戶接觸過程中,內(nèi)部銷售人員的行為、各項(xiàng)活動(dòng)及其與客戶接觸全過程所發(fā)生的關(guān)系;還包括售后服務(wù)過程中,企業(yè)服務(wù)人員對(duì)客戶提供關(guān)懷活動(dòng)、各種服務(wù)活動(dòng)、服務(wù)內(nèi)容、服務(wù)效果的記錄等,這也是企業(yè)與客戶的售后服務(wù)關(guān)系。對(duì)企業(yè)與客戶間可能發(fā)生的各種關(guān)系進(jìn)行全面管理,將會(huì)顯著提升企業(yè)營銷能力,降低營銷成本,控制營銷過程中可能導(dǎo)致客戶抱怨的各種行為,這是 crm 的另一個(gè)重要管理思想。進(jìn)一步延伸企業(yè)供應(yīng)鏈管理20 世紀(jì) 90 年代提出的 erp,原來是為了滿足企業(yè)的供應(yīng)鏈管理需要,但 erp 的實(shí)際應(yīng)用并沒有達(dá)到企業(yè)供應(yīng)鏈管理的目標(biāo),
24、這既有 erp 本身功能方面的局限性,也有 it 技術(shù)發(fā)展階段的局限性,最終 erp 系統(tǒng)又退回到幫助企業(yè)實(shí)現(xiàn)內(nèi)部資金流、物流與信息流一體化管理的系統(tǒng)。crm 系統(tǒng)作為 erp 系統(tǒng)中銷售管理的延伸,借助 internet 技術(shù),突破了供應(yīng)鏈上企業(yè)間的地域邊界和不同企業(yè)之間信息交流的組織邊界,建立起企業(yè)自己的 b to b 和 b to c 網(wǎng)絡(luò)營銷模式。crm 系統(tǒng)與 erp 系統(tǒng)的集成運(yùn)行才真正解決了企業(yè)供應(yīng)鏈中的下游鏈管理問題,將客戶、經(jīng)銷商、企業(yè)銷售部整合到一起,實(shí)現(xiàn)企業(yè)對(duì)客戶個(gè)性化需求的快速響應(yīng)。同時(shí)也幫助企業(yè)清除了營銷體系中的中間環(huán)節(jié),通過新的扁平化營銷體系,縮短響應(yīng)時(shí)間,降低銷售
25、成本。80/20 定律80/20 定律是 19 世紀(jì)意大利經(jīng)濟(jì)學(xué)家佩爾圖(bilfredo.pareto)率先發(fā)表的一項(xiàng)研究成果,后來被稱為 80/20 定律(也稱佩爾圖定律)。此定律具體到企業(yè)業(yè)務(wù),可理解為:對(duì)于已經(jīng)與企業(yè)有業(yè)務(wù)往來的客戶,其中 80%的業(yè)務(wù)來自于 20%的客戶;同樣,對(duì)于暫時(shí)與企業(yè)還沒有業(yè)務(wù)往來但也是企業(yè)希望爭6取到的潛在客戶而言,其中 80%的潛在業(yè)務(wù)來自于 20%的潛在客戶(潛在客戶可被認(rèn)為是那些曾一次或多次與企業(yè)接觸過或企業(yè)與之接觸過的潛在客戶) 。80/20 定律不僅給我們的市場、銷售帶來收益,使企業(yè)準(zhǔn)確的把握市場,研發(fā)出具有市場占有力的產(chǎn)品,同時(shí)也作用于客戶服務(wù)這
26、一層面,因現(xiàn)代的客戶服務(wù)已遠(yuǎn)遠(yuǎn)不局限于僅為客戶提供售后服務(wù),而是在服務(wù)的基礎(chǔ)上分析并挖掘客戶的購買潛力,即購買資格。客戶知識(shí)管理世界經(jīng)濟(jì)正進(jìn)入知識(shí)經(jīng)濟(jì)時(shí)代,知識(shí)經(jīng)濟(jì)是以知識(shí)為基礎(chǔ)的經(jīng)濟(jì),是建立在知識(shí)和信息的生產(chǎn)、分配和使用之上的經(jīng)濟(jì)。知識(shí)管理的重點(diǎn)是知識(shí)的識(shí)別、獲取、開發(fā)、分解、存儲(chǔ)和共享,并為其構(gòu)建有效的途徑和機(jī)制,以運(yùn)用集體的智慧提高企業(yè)的應(yīng)變和創(chuàng)新能力。知識(shí)管理以信息管理為基礎(chǔ),是信息管理的延伸和發(fā)展,是利用技術(shù)去分享知識(shí)(或信息) 并把它們作為創(chuàng)新(發(fā)明)的手段或杠桿。知識(shí)管理是適應(yīng)知識(shí)經(jīng)濟(jì)時(shí)代要求的新型管理模式,是迎接新時(shí)代挑戰(zhàn)的重要戰(zhàn)略。客戶知識(shí)管理是通過一組解決方案的集合尋找和識(shí)
27、別與問題有關(guān)的關(guān)鍵性信息,并將這些信息進(jìn)行提取,形成對(duì)某一問題的專門知識(shí),并作為決策的依據(jù)??蛻艄芾淼哪康脑谟趨f(xié)助企業(yè)不斷的獲取、積累客戶知識(shí)并將這些知識(shí)運(yùn)用在企業(yè)的市場、銷售、客戶服務(wù)等各個(gè)領(lǐng)域,并讓這些知識(shí)發(fā)揮出杠桿作用,以提升企業(yè)客戶的滿意度和忠誠度,從而降低生產(chǎn)和銷售成本,縮短銷售周期,擴(kuò)大市場份額,提高企業(yè)的效率和效益。因此,客戶知識(shí)管理是客戶關(guān)系管理的本質(zhì)。企業(yè)必須將知識(shí)有效地運(yùn)用到制定策略上,并讓這些知識(shí)發(fā)揮出杠桿作用,才能有效地進(jìn)行客戶關(guān)系管理。2.1.3 crm 所需要的技術(shù)詳細(xì)的客戶信息,而并非僅僅是有關(guān)交易和財(cái)務(wù)支付的原始數(shù)據(jù),是成功企業(yè)贏得和留住贏利性客戶的根本。將原始
28、數(shù)據(jù)轉(zhuǎn)化為可操作的有效信息,對(duì)于營造一種有突破性的共同業(yè)務(wù)決策環(huán)境是十分必要的。凡是經(jīng)過分析處理且能夠“被理解”的知識(shí),都有助于我們在營銷、銷售、服務(wù)、行政管理、資源管理以及各層次的決策和計(jì)劃上做出明智的選擇。具體所需的技術(shù)有:數(shù)據(jù)庫技術(shù)數(shù)據(jù)庫是按一定的數(shù)據(jù)模型組織、描述和存儲(chǔ)的,有組織、可共享的數(shù)據(jù)集合,是構(gòu)成數(shù)據(jù)庫系統(tǒng)的重要部分。數(shù)據(jù)庫技術(shù)是在文件系統(tǒng)基礎(chǔ)上發(fā)展起來的計(jì)算機(jī)數(shù)據(jù)管理技術(shù),它有效的解決了數(shù)據(jù)的獨(dú)立性問題,實(shí)現(xiàn)了數(shù)據(jù)的統(tǒng)一管理,達(dá)到數(shù)據(jù)共享的目的。數(shù)據(jù)庫系統(tǒng)則指引進(jìn)數(shù)據(jù)庫技術(shù)后7的計(jì)算機(jī)系統(tǒng),它實(shí)際上是由有組織的、動(dòng)態(tài)存儲(chǔ)的有密切聯(lián)系的數(shù)據(jù)集合及對(duì)其進(jìn)行統(tǒng)一管理的計(jì)算機(jī)軟件和配
29、件資源所組成的系統(tǒng)。它將有關(guān)部門中反映客觀事物的大量信息進(jìn)行記錄、分類整理等定量、規(guī)范化處理,并以記錄為單位存貯于數(shù)據(jù)庫中。在數(shù)據(jù)庫系統(tǒng)的統(tǒng)一作用下,用戶通過應(yīng)用程序發(fā)出不同命令以得到滿足不同層次需要的各種信息1。數(shù)據(jù)倉庫和數(shù)據(jù)挖掘技術(shù)作為信息科學(xué)的一個(gè)重要研究領(lǐng)域,數(shù)據(jù)倉庫和數(shù)據(jù)挖掘技術(shù)是數(shù)據(jù)庫技術(shù)發(fā)展到一定程度的產(chǎn)物。按 inmon 的定義, “數(shù)據(jù)倉庫是一個(gè)面向主題的、集成的、時(shí)變的、非易失的數(shù)據(jù)集合,支持管理部門的決策過程”。而在數(shù)據(jù)倉庫基礎(chǔ)上的所謂數(shù)據(jù)挖掘,亦稱數(shù)據(jù)庫中的知識(shí)發(fā)現(xiàn),就是在海量數(shù)據(jù)中探索數(shù)據(jù)間的關(guān)系、并從中提取有效的、新穎的、有潛在價(jià)值的知識(shí)和規(guī)律的過程。它的作用是將數(shù)
30、據(jù)轉(zhuǎn)換成信息和知識(shí),以便做出正確的決策;提供將知識(shí)應(yīng)用到操作系統(tǒng)中的機(jī)制,以便采取正確的行動(dòng)。數(shù)據(jù)倉庫與數(shù)據(jù)挖掘技術(shù)的結(jié)合,不僅能提高數(shù)據(jù)倉庫對(duì)決策的支持能力,也能大大提高數(shù)據(jù)挖掘的工作效率2。crm 系統(tǒng)的建立和實(shí)現(xiàn)還涉及到其他許多技術(shù),如通信技術(shù)、計(jì)算機(jī)網(wǎng)絡(luò)技術(shù)、信息技術(shù)、人工智能技術(shù)等。本文著重討論數(shù)據(jù)庫技術(shù),因?yàn)閿?shù)據(jù)庫技術(shù)是進(jìn)行數(shù)據(jù)分析的基礎(chǔ),沒有數(shù)據(jù)庫技術(shù),也就沒有數(shù)據(jù)挖掘、數(shù)據(jù)倉庫等高級(jí)數(shù)據(jù)分析工具的應(yīng)用。利用數(shù)據(jù)庫技術(shù)設(shè)計(jì)了一個(gè) crm 系統(tǒng),待運(yùn)行穩(wěn)定后逐步引入數(shù)據(jù)倉庫和數(shù)據(jù)挖掘技術(shù),以便更好地分析客戶特征、了解客戶需求,更有效地進(jìn)行客戶關(guān)系管理。2.2 數(shù)據(jù)挖掘理論2.2.1
31、 數(shù)據(jù)挖掘概述數(shù)據(jù)挖掘,就是從數(shù)據(jù)集中提取隱含的、未知的、對(duì)決策有潛在價(jià)值的知識(shí)的過程。又稱作數(shù)據(jù)庫中的知識(shí)發(fā)現(xiàn)(knowledge discovery in database,簡記為 kdd),是從大量的、不完全的、有噪聲的、模糊的、隨機(jī)的數(shù)據(jù)中,提取隱含在其中的、人們事先不知道的、但又是潛在有用的信息和知識(shí)的過程。還有很多和這一術(shù)語相近似的術(shù)語,如從數(shù)據(jù)庫中發(fā)現(xiàn)知識(shí)(kdd) 、數(shù)據(jù)分析、數(shù)據(jù)融合(data fusion)以及決策支持等。人們把原始數(shù)據(jù)看作是形成知識(shí)的源泉,就像從礦石中采礦一樣。原始數(shù)據(jù)可以是結(jié)構(gòu)化的,如關(guān)系型數(shù)據(jù)庫中的數(shù)據(jù),也可以是半結(jié)構(gòu)化的,如文本、圖形、圖像數(shù)據(jù),1
32、鄧.皮泊斯, 馬沙.容格斯. 客戶關(guān)系管理. 中國金融出版社, 2006(1): 163-182.2 管正, 魏冠明. 中國企業(yè) crm 實(shí)施. 人民郵電出版社, 2003(3): 70-79.8甚至是分布在網(wǎng)絡(luò)上的異構(gòu)型數(shù)據(jù)。發(fā)現(xiàn)知識(shí)的方法可以是數(shù)學(xué)的,也可以是非數(shù)學(xué)的;可以是演繹的,也可以是歸納的。發(fā)現(xiàn)了的知識(shí)可以被用于信息管理、查詢優(yōu)化、決策支持、過程控制等,還可以用于數(shù)據(jù)自身的維護(hù)。因此,數(shù)據(jù)挖掘是一門廣義的交叉學(xué)科,它匯聚了不同領(lǐng)域的研究者,尤其是數(shù)據(jù)庫、人工智能、數(shù)理統(tǒng)計(jì)、可視化、并行計(jì)算等方面的學(xué)者和工程技術(shù)人員1。確定挖掘主題:在金融數(shù)據(jù)挖掘中,首先要清楚的明確數(shù)據(jù)挖掘的目的,
33、這是至關(guān)重要的一步。因?yàn)橥诰虻淖詈蠼Y(jié)果是不可預(yù)測的,但要探索的問題應(yīng)是有預(yù)見性的,所以不能進(jìn)行盲目的數(shù)據(jù)挖掘。數(shù)據(jù)選擇:查找所有和業(yè)務(wù)相關(guān)的內(nèi)部和外部數(shù)據(jù)信息,從中選擇適用于數(shù)據(jù)挖掘的相關(guān)數(shù)據(jù)。數(shù)據(jù)預(yù)處理:對(duì)選擇后的數(shù)據(jù)進(jìn)一步處理,檢查數(shù)據(jù)完整性以及數(shù)據(jù)的一致性,并通過一些操作減少數(shù)據(jù)量,將數(shù)據(jù)變換和統(tǒng)一成適合挖掘的形式。建立模型:讀入經(jīng)過預(yù)處理的數(shù)據(jù),建立模型,進(jìn)行數(shù)據(jù)挖掘。評(píng)價(jià)和解釋:對(duì)模型得出的結(jié)果進(jìn)行解釋,根據(jù)某種興趣度量,識(shí)別表示知識(shí)的真正有用的模式,并通過一致性檢查,以確信發(fā)現(xiàn)的知識(shí)不與以前發(fā)現(xiàn)的知識(shí)相抵觸,并用可視化技術(shù)展現(xiàn)給用戶。預(yù)測:應(yīng)用模型對(duì)未知數(shù)據(jù)進(jìn)行預(yù)測。數(shù)據(jù)挖掘技術(shù)是
34、人們長期對(duì)數(shù)據(jù)庫技術(shù)進(jìn)行研究和開發(fā)的結(jié)果。起初各種商業(yè)數(shù)據(jù)是存儲(chǔ)在計(jì)算機(jī)的數(shù)據(jù)庫中的,然后發(fā)展到可對(duì)數(shù)據(jù)庫進(jìn)行查詢和訪問,進(jìn)而發(fā)展到對(duì)數(shù)據(jù)庫的即時(shí)遍歷。數(shù)據(jù)挖掘使數(shù)據(jù)庫技術(shù)進(jìn)入了一個(gè)更高級(jí)的階段,他不但能對(duì)過去的數(shù)據(jù)進(jìn)行查詢和遍歷,并且能夠找出過去數(shù)據(jù)之間的潛在聯(lián)系,從而促進(jìn)信息的傳遞。商業(yè)數(shù)據(jù)庫正在以空前的速度增長,并且數(shù)據(jù)倉庫正在廣泛地應(yīng)用于各種行業(yè),數(shù)據(jù)挖掘經(jīng)過了十多年的發(fā)展已經(jīng)成為一種成熟、穩(wěn)定、易于理解和操作的技術(shù)。2.2.2 數(shù)據(jù)挖掘的模式數(shù)據(jù)挖掘功能用于指定數(shù)據(jù)挖掘任務(wù)中要找的模式類型。數(shù)據(jù)挖掘任務(wù)一般可以分兩類描述和預(yù)測。描述性挖掘任務(wù)刻畫數(shù)據(jù)庫中數(shù)據(jù)的一般特性。預(yù)測性挖掘任務(wù)
35、在當(dāng)前數(shù)據(jù)上進(jìn)行推斷,以進(jìn)行預(yù)測2。在某些情況下,用戶不知道他們的數(shù)據(jù)中有什么類型的模式是有趣的,因此可能想并行地搜索多種不同的模式。這樣,重要的是,數(shù)據(jù)挖掘系統(tǒng)要1 潘華, 項(xiàng)同德. 數(shù)據(jù)倉庫與數(shù)據(jù)挖掘原理,工具及應(yīng)用. 中國電力出版社. 2007(12): 83-84.2 袁玉波, 楊傳勝, 黃延祝, 徐成賢. 數(shù)據(jù)挖掘與最優(yōu)化技術(shù)及應(yīng)用, 2007(7):77-78.9能夠挖掘多種類型的模式,以適應(yīng)不同的用戶需求或不同的應(yīng)用。此外,數(shù)據(jù)挖掘系統(tǒng)應(yīng)當(dāng)能夠發(fā)現(xiàn)各種粒度即(不同的抽象層)的模式。數(shù)據(jù)挖掘系統(tǒng)應(yīng)當(dāng)允許用戶給出提示,指導(dǎo)或聚焦有趣模式的搜索。由于有些模式并非對(duì)數(shù)據(jù)庫中的所有數(shù)據(jù)都成
36、立,通常每個(gè)發(fā)現(xiàn)的模式帶上一個(gè)確定性或“可信性”度量。數(shù)據(jù)挖掘功能以及它們可以發(fā)現(xiàn)的模式類型介紹如下3。概念類描述特征化和區(qū)分?jǐn)?shù)據(jù)可以與類或概念相關(guān)聯(lián)。類和概念的描述稱為類/概念(class/concept description)描述。這種描述可以通過下述方法得到:1)數(shù)據(jù)特征化,一般地匯總所研究類(通常稱為目標(biāo)類)的數(shù)據(jù);2)數(shù)據(jù)區(qū)分,將目標(biāo)類與一個(gè)或多個(gè)比較類(通常稱為對(duì)比類)進(jìn)行比較數(shù)據(jù)特征化和比較;3)數(shù)據(jù)特征化和比較。數(shù)據(jù)特征化(data characterization)是目標(biāo)類數(shù)據(jù)的一般特征或特性的匯總。通常,用戶在指定類的數(shù)據(jù)通過數(shù)據(jù)庫查詢收集。例如,為研究上一年銷售增加 1
37、0%的軟件產(chǎn)品的特征,可以通過執(zhí)行一個(gè) sql 查詢收集關(guān)于這些產(chǎn)品的數(shù)據(jù)。有許多有效的方法,將數(shù)據(jù)特征化匯總。例如,基于數(shù)據(jù)立方體的olap 上卷操作可以用來執(zhí)行用戶控制的、沿著指定維的數(shù)據(jù)匯總。一種面向?qū)傩缘臍w納技術(shù)可以用來進(jìn)行數(shù)據(jù)的概化和特征化,而不必一步步地與用戶交互。數(shù)據(jù)特征的輸出可以用多種形式提供。包括餅圖、條圖、曲線、多維數(shù)據(jù)立方體和包括交叉表在內(nèi)的多維表。結(jié)果描述也可以用概化關(guān)系(generalized relation)或規(guī)則形式提供。數(shù)據(jù)區(qū)分(data discrimination)是將目標(biāo)類對(duì)象的一般特征與一個(gè)或多個(gè)對(duì)比類對(duì)象的一般特征相比較。目標(biāo)類和對(duì)比類由用戶指定,而
38、對(duì)應(yīng)的數(shù)據(jù)通過數(shù)據(jù)庫檢索。例如,可能希望將上一年銷售增加 10%的軟件產(chǎn)品與同一時(shí)期銷售至少下降 30%的那些產(chǎn)品進(jìn)行比較。用于數(shù)據(jù)區(qū)分的方法與用于數(shù)據(jù)特征化的類似。關(guān)聯(lián)分析關(guān)聯(lián)分析,即利用關(guān)聯(lián)規(guī)則進(jìn)行數(shù)據(jù)挖掘。數(shù)據(jù)關(guān)聯(lián)是數(shù)據(jù)庫中存在的一類重要的可被發(fā)現(xiàn)的知識(shí)。若兩個(gè)或多個(gè)變量的取值之間存在某種規(guī)律性,就稱為關(guān)聯(lián)。關(guān)聯(lián)可分為簡單關(guān)聯(lián)、時(shí)序關(guān)聯(lián)、因果關(guān)聯(lián)。關(guān)聯(lián)分析的目的是找出數(shù)據(jù)庫中隱藏的關(guān)聯(lián)網(wǎng)。有時(shí)并不知道數(shù)據(jù)庫中數(shù)據(jù)的關(guān)聯(lián)函數(shù),即使知道也是不確定的,因此關(guān)聯(lián)分析生成的規(guī)則帶有可信度。3 張喆. 數(shù)據(jù)挖掘及其在客戶關(guān)系管理中的應(yīng)用. 復(fù)旦大學(xué)出版社, 2007: 73-75.10分類和預(yù)測分類
39、(classification)是這樣一個(gè)過程,它找出描述并區(qū)分?jǐn)?shù)據(jù)類或概念的模型(或函數(shù)),以便能夠使用模型預(yù)測類標(biāo)記未知的對(duì)象類。導(dǎo)出模型是基于對(duì)訓(xùn)練數(shù)據(jù)集(即其類標(biāo)記已知的數(shù)據(jù)對(duì)象)的分析?!叭绾翁峁?dǎo)出模型?”導(dǎo)出模式可以用多種形式表示,如分類(if-then)規(guī)則、判定樹、數(shù)學(xué)公式或神經(jīng)網(wǎng)絡(luò)。判定樹是一個(gè)類似于流程圖的樹結(jié)構(gòu),每個(gè)節(jié)點(diǎn)代表一個(gè)屬性值上的測試,每個(gè)分支代表測試的一個(gè)輸出,樹葉代表類或類分布。判定樹容易轉(zhuǎn)換成分類規(guī)則。當(dāng)用于分類時(shí),神經(jīng)網(wǎng)絡(luò)是一組類似于神經(jīng)元的處理單元,單元之間加權(quán)連接。分類可以用于預(yù)測數(shù)據(jù)對(duì)象的類標(biāo)記。然而,在某些應(yīng)用中,人們可能希望預(yù)測某些空缺的或不知
40、道的數(shù)據(jù)值,而不是類標(biāo)記。當(dāng)被預(yù)測的值是數(shù)值數(shù)據(jù)時(shí),通常稱之為預(yù)測(prediction)。盡管預(yù)測可以涉及數(shù)據(jù)值預(yù)測和類標(biāo)識(shí)預(yù)測,通常預(yù)測限于值預(yù)測,并因此不同于分類。預(yù)測也包含基于可用數(shù)據(jù)的分類趨勢識(shí)別。相關(guān)分析(relevance analysis)可能需要在分類和預(yù)測之前進(jìn)行,它試圖識(shí)別對(duì)于分類和預(yù)測無用的屬性。這些屬性應(yīng)該排除。聚類分析與分類和預(yù)測不同,聚類(clustering)分析數(shù)據(jù)對(duì)象,而不考慮已知的類標(biāo)記。一般情況下,訓(xùn)練數(shù)據(jù)中不提供類標(biāo)記,因?yàn)椴恢缽暮伍_始。聚類,可以用于產(chǎn)生這種標(biāo)記。對(duì)象根據(jù)最大化類內(nèi)的相似性、最小化類間的相似性的原則進(jìn)行聚類或分組。即對(duì)象的簇(聚類)
41、這樣形成,使得在一個(gè)簇中的一個(gè)對(duì)象具有很高的相似性,而與其它簇中的對(duì)象很不相似。所形成的每個(gè)簇可以看作一個(gè)對(duì)象類,由它可以導(dǎo)出規(guī)則。聚類也便于分類編制,將觀察的內(nèi)容組織成類分層結(jié)構(gòu),把類似的對(duì)象組織在一起1。孤立點(diǎn)分析數(shù)據(jù)庫中可能包含一些數(shù)據(jù)對(duì)象,它們與數(shù)據(jù)的一般行為或模型不一致。這些數(shù)據(jù)對(duì)象是孤立點(diǎn)(outlier)。大部分?jǐn)?shù)據(jù)挖掘方法將孤立點(diǎn)視為噪聲或異常而丟棄。然而,在一些應(yīng)用中(如欺騙檢測),罕見的事件可能比正常出現(xiàn)的那些更有趣。孤立點(diǎn)數(shù)據(jù)分析稱作為孤立點(diǎn)挖掘(outlier mining)。孤立點(diǎn)可以使用統(tǒng)計(jì)試驗(yàn)檢測。它假定一個(gè)數(shù)據(jù)分布概率模型,并使用距離度量,到其他聚類的距離很大的
42、對(duì)象被視為孤立點(diǎn)?;谄畹姆椒ㄍㄟ^考察一群對(duì)象主要特征的差別識(shí)別孤立點(diǎn),而不是使用統(tǒng)計(jì)或距離度量。演變分析數(shù)據(jù)演變分析(evolution analysis)描述行為隨時(shí)間變化的對(duì)象的規(guī)律或趨1 羅洪群, 王情華, 田義江. 統(tǒng)計(jì)學(xué)基礎(chǔ). 清華大學(xué)出版社, 2008(3): 98-99.11勢,并對(duì)其建模。盡管這可能包括時(shí)間相關(guān)數(shù)據(jù)的特征化、區(qū)分、關(guān)聯(lián)、分類或聚類,這類分析的不同特點(diǎn)包括時(shí)間序列數(shù)據(jù)分析、序列或周期模式匹配和基于類似性的數(shù)據(jù)分析。2.2.3 數(shù)據(jù)挖掘在銀行客戶關(guān)系管理中的應(yīng)用本論文是以銀行客戶為基礎(chǔ)進(jìn)行分析研究,銀行系統(tǒng)的核心是構(gòu)建全行的大型數(shù)據(jù)庫系統(tǒng),然而,成功構(gòu)建數(shù)據(jù)庫系
43、統(tǒng)還只是基礎(chǔ),為了實(shí)現(xiàn)其輔助決策的目的,必須能夠有效利用數(shù)據(jù)挖掘技術(shù)對(duì)數(shù)據(jù)庫中的數(shù)據(jù)進(jìn)行分析和預(yù)測。對(duì)于銀行而言,數(shù)據(jù)挖掘在其客戶關(guān)系管理系統(tǒng)中可以起到的主要作用如下:客戶分類近年來,特別是在市場細(xì)分環(huán)境下一對(duì)一個(gè)性化服務(wù)正在受到銀行業(yè)的青睞。這意味著銀行要了解每一個(gè)客戶,并同其建立起持久的關(guān)系。利用數(shù)據(jù)挖掘技術(shù)可對(duì)大量的客戶分類,提供針對(duì)性的產(chǎn)品和服務(wù)。交叉服務(wù)現(xiàn)代銀行企業(yè)和客戶之間的關(guān)系是經(jīng)常變動(dòng)的,一旦擁有了新的客戶,就要竭力完善這種關(guān)系。需要對(duì)其進(jìn)行交叉銷售,為原有客戶提供新的銀行產(chǎn)品或服務(wù)。數(shù)據(jù)挖掘可以幫助銀行分析出最優(yōu)的合理的服務(wù)匹配??蛻舯3挚蛻舯3质橇糇±峡蛻?、防止客戶流失的過
44、程。由于銀行對(duì)老客戶的信息掌握的比較詳細(xì),而對(duì)潛在客戶的信息掌握得很少,所以對(duì)于銀行來說獲取一個(gè)新客戶遠(yuǎn)比保留一個(gè)老客戶的成本高得多。而且在目前開放的商業(yè)環(huán)境下,商業(yè)銀行之間的競爭越來越激烈,客戶保持也就成為銀行面臨的一個(gè)重要難題。在客戶保持過程中,首先要對(duì)已經(jīng)流失的客戶數(shù)據(jù)進(jìn)行分析,找到流失客戶的行為模式,同時(shí)分析流失客戶流失的原因。根據(jù)已經(jīng)流失的客戶的特點(diǎn)還可以預(yù)測現(xiàn)在客戶中有流失傾向的客戶。對(duì)于這些客戶,銀行應(yīng)該及時(shí)調(diào)整服務(wù)策略,針對(duì)用戶分類時(shí)得到的用戶特點(diǎn)采取相應(yīng)的措施挽留客戶。挽留一個(gè)老客戶,競爭對(duì)手就減少了一個(gè)新客戶,同時(shí)流失一個(gè)客戶就為競爭對(duì)手帶來一個(gè)新客戶。因此,客戶保持是客戶
45、關(guān)系管理中最為重要的一個(gè)部分。數(shù)據(jù)挖掘可以幫助銀行識(shí)別出潛在的客戶群,提高市場活動(dòng)的響應(yīng)率,使銀行決策人員做到心中有數(shù),有的放矢??蛻粜庞梅治龇治隹蛻粜庞脤?duì)銀行信用管理很有意義,對(duì)不同信用級(jí)別的客戶,采取不同的信貸方案等。數(shù)據(jù)挖掘可從大量歷史數(shù)據(jù)中分析出具體客戶的信用等12級(jí)??蛻粲芰Ψ治龊皖A(yù)測很顯然,不同客戶對(duì)于銀行來講,其價(jià)值是不同的。數(shù)據(jù)挖掘技術(shù)可以用來分析和預(yù)測不同市場活動(dòng)情況下客戶盈利能力的變化,幫助銀行制定適合的市場策略。根據(jù)本文緒論部分對(duì)客戶價(jià)值管理和 crm 之間關(guān)系的分析,可以看出客戶保持是銀行 crm 和客戶價(jià)值管理的核心。本文僅就將商業(yè)銀行的客戶流失預(yù)測模型作為研究的
46、重點(diǎn)是符合銀行客戶關(guān)系管理規(guī)律的。2.3 數(shù)據(jù)挖掘的聚類分析理論聚類分析是研究物以類聚的一種統(tǒng)計(jì)分析方法。用于對(duì)事物類別尚不清楚,甚至事物總共可能有幾類都不能確定的情況下進(jìn)行事物分類的場合。2.3.1 聚類的概念聚類(clustering)是指把一組個(gè)體按照相似性歸成若干類別。即“物以類聚”它的目的是使得屬于同一類別的個(gè)體之間的距離盡可能的小,二不用類別的個(gè)體之間的距離盡可能的大。組內(nèi)的對(duì)象相互之間是相似的,而不同組的對(duì)象是不同的。同一類別的個(gè)體之間的相似性盡可能大,而不同類別的個(gè)體之間的相似性盡可能小。組內(nèi)的相似性越大,組間差別越大,聚類就越好。相似性是根據(jù)描述對(duì)象的屬性來測算的,距離是經(jīng)常
47、采用的度量方式。聚類分析能夠幫助我們發(fā)現(xiàn)特征迥異的不同客戶群,和對(duì)客戶分群起關(guān)鍵作用的指標(biāo)變量,并輔助運(yùn)營商對(duì)各客戶群的特征進(jìn)行深刻洞察。聚類分析提供由個(gè)別數(shù)據(jù)對(duì)象所指派到簇的抽象。此外,一些聚類技術(shù)使用簇原理來刻畫簇特征。這些簇原型可以用作大量數(shù)據(jù)分析和數(shù)據(jù)處理技術(shù)的基礎(chǔ)。因此,聚類分析就是研究發(fā)現(xiàn)最有代表性的簇原型的技術(shù)。2.3.2 聚類算法的一般特征次序依賴性:對(duì)于某些算法,所產(chǎn)生的簇的質(zhì)量和個(gè)數(shù)可能因數(shù)據(jù)處理的次數(shù)不同而顯著的變化。非確定性:像 k 均值這樣的聚類算法不是次序依賴的,但是它們每次運(yùn)行都產(chǎn)生不同的結(jié)果,它們依賴于需要隨機(jī)選擇的初始化步驟。簇的質(zhì)量可能隨運(yùn)行而變化,因此需要
48、多此運(yùn)行??缮炜s性:包含數(shù)以萬計(jì)的數(shù)據(jù)集并不罕見,用于這種數(shù)據(jù)集的聚類算法應(yīng)當(dāng)具有線性或接近線性的時(shí)間空間復(fù)雜度。13參數(shù)選擇:大部分聚類算法都需要用戶設(shè)置一個(gè)或多個(gè)參數(shù)。選擇合適的參數(shù)值可能是困難的,因此通常的態(tài)度是“參數(shù)越少越好”。如果參數(shù)值的很小改變就會(huì)顯著就會(huì)顯著的改變結(jié)果,則選擇參數(shù)值就變得更加有挑戰(zhàn)性。最后,除非提供一個(gè)過程來確定參數(shù)值,否則算法的用戶就不得不通過試探法找到合適的參數(shù)值。變換聚類問題到其他領(lǐng)域:一種被某些聚類技術(shù)使用的方法是將聚類問題映射到不同的領(lǐng)域。將聚類作為最優(yōu)化問題處理:聚類常常被看做優(yōu)化問題:將點(diǎn)劃分成簇,更具用戶指定的目標(biāo)函數(shù)度量,最大化結(jié)果簇集合的優(yōu)良度
49、。例如:k 均值聚類算法試圖發(fā)現(xiàn)簇的集合,使每個(gè)點(diǎn)到最近的簇質(zhì)心距離的平方和最小。2.3.3 k-mean 算法簡介文中進(jìn)行聚類分析時(shí)采用的是k-means 算法。k-means 算法屬于聚類分析方法中一種基本的且應(yīng)用最廣泛的劃分算法,它是一種已知聚類類別數(shù)的聚類算法。指定類別數(shù)為 k,對(duì)樣本集進(jìn)行聚類,聚類的結(jié)果由 k 個(gè)聚類中心來表達(dá)。基于給定的聚類目標(biāo)函數(shù)(或者說是聚類效果判別準(zhǔn)則),算法采用迭代更新的方法,每一次迭代過程都是向目標(biāo)函數(shù)值減小的方向進(jìn)行,最終的聚類結(jié)果使目標(biāo)函數(shù)值取得極小值,達(dá)到較優(yōu)的聚類效果。k-means 算法根據(jù)它們之間的相似程度,分為若干組;其中相似的對(duì)象構(gòu)成一組
50、,這一過程就稱為聚類過程。一個(gè)聚類就是由彼此相似的一組對(duì)象所構(gòu)成的集合;不同聚類中對(duì)象是不相似的。從給定的數(shù)據(jù)集中搜索數(shù)據(jù)項(xiàng)之間所存在的有價(jià)值聯(lián)系。k-means 算法的工作過程說明如下:首先從n 個(gè)數(shù)據(jù)對(duì)象任意選擇k 個(gè)對(duì)象作為初始聚類中心;而對(duì)于所剩下其它對(duì)象, 則根據(jù)它們與這些聚類中心的相似度(距離) ,分別將它們分配給與其最相似的(聚類中心所代表的) 聚類; 然后再計(jì)算每個(gè)所獲新聚類的聚類中心(該聚類中所有對(duì)象的均值) ; 不斷重復(fù)這一過程直到標(biāo)準(zhǔn)測度函數(shù)開始收斂為止。一般都采用均方差作為標(biāo)準(zhǔn)測度函數(shù):21icpktmpei式中, e 為數(shù)據(jù)庫中所有對(duì)象的平方誤差的總和; p 為空間的
51、點(diǎn),表示給定的數(shù)據(jù)對(duì)象; mi 為簇ci 的平均值( p 和mi都是多維的) 。上式所示聚類標(biāo)準(zhǔn)旨在使所獲得的k 個(gè)聚類具有以下特點(diǎn):各聚類本身盡14可能緊湊, 而各聚類之間盡可能分開。k2means 算法的計(jì)算復(fù)雜度為o ( nkt ) ,因而它在處理大數(shù)據(jù)庫時(shí)也是相對(duì)有效的(具有可擴(kuò)展性) ;這里n 為對(duì)象個(gè)數(shù); k為聚類個(gè)數(shù);而t 為循環(huán)次數(shù)。通常有k n 和 t n 。 k-means 算法常常終止于局部最優(yōu)。2.4 sas enterprise miner 簡介sas 系統(tǒng)是世界公認(rèn)的權(quán)威統(tǒng)計(jì)分析軟件之一,是一個(gè)大型集成信息分析管理系統(tǒng)。sas 系統(tǒng)集數(shù)據(jù)訪問、數(shù)據(jù)管理、數(shù)據(jù)分析、數(shù)
52、據(jù)挖掘功能于一體。是一個(gè)功能強(qiáng)大且被國際公認(rèn)的標(biāo)準(zhǔn)統(tǒng)計(jì)分析軟件。隨著信息技術(shù)的發(fā)展,數(shù)據(jù)管理與數(shù)據(jù)分析已成為各領(lǐng)域發(fā)展的重要支柱,sas 系統(tǒng)也成為數(shù)據(jù)處理的首選工具。越來越多的企業(yè)感受到 sas 系統(tǒng)強(qiáng)大功能帶來的益處。要對(duì)實(shí)驗(yàn)數(shù)據(jù)進(jìn)行科學(xué)的分析,sas 系統(tǒng)軟件可以進(jìn)行處理,從而得到科學(xué)的研究結(jié)論1。sas(statistical analysis system)系統(tǒng)于 1966 年開始研制,1976 年由美國 sas 公司實(shí)現(xiàn)商業(yè)化,1985 年推出 sas/pc 版本,1987 年推出 6.03 版,目前已經(jīng)推出 windows 系統(tǒng)支持的 8.02 版和 9.0 版,是目前國際上公認(rèn)
53、的著名的數(shù)據(jù)統(tǒng)計(jì)分析軟件系統(tǒng)之一。sas 系統(tǒng)的最大特點(diǎn)就是將數(shù)據(jù)管理和統(tǒng)計(jì)分析融為一體。sas 系統(tǒng)軟件它提供一種交互式運(yùn)行 sas 程序。sas 系統(tǒng)的基礎(chǔ)是 sas 語言,sas 語言是一種近似自然語言的非過程語言。目前 sas 可以在不同的操作系統(tǒng)和不同的機(jī)器類型下運(yùn)行。該系統(tǒng)應(yīng)用的范圍廣。sas 為“statistical analysis system”的縮寫,意為統(tǒng)計(jì)分析系統(tǒng),是美國軟件研究所(sas institute inc.)研制的一套大型集成應(yīng)用軟件系統(tǒng),具有完備的數(shù)據(jù)存取、數(shù)據(jù)管理、數(shù)據(jù)分析、數(shù)據(jù)展現(xiàn)功能。利用它可以完成包括從簡單的描述性系統(tǒng)到復(fù)雜的多變數(shù)分析的各種運(yùn)算
54、,從而使人們從繁重的計(jì)算任務(wù)中解脫出來,有更多的時(shí)間和精力用于分析和解釋計(jì)算的結(jié)果,而不必為如何獲得這些結(jié)果花費(fèi)過多的時(shí)間和精力?;?sas 的生產(chǎn)過程分析系統(tǒng)充分地利用 sas 先進(jìn)的統(tǒng)計(jì)分析性能,將大大提高分析系統(tǒng)的效率和精度。特別是 sas 功能強(qiáng)大,統(tǒng)計(jì)方法齊、全、新,提供了從基本統(tǒng)計(jì)數(shù)的計(jì)算到各種試驗(yàn)設(shè)計(jì)的方差分析,相關(guān)回歸分析以及多變數(shù)分析的多種統(tǒng)計(jì)分析過程,幾乎囊括了所有最新分析方法,其分析技術(shù)先進(jìn)可靠。更為重要的是 sas 使用簡便、操作靈活,其編程語句簡潔、短小,通常只需很小的幾條語句即可完成一些復(fù)雜的運(yùn)算,得到滿意的結(jié)果,這將大大地提高開發(fā)效1 范金城. sas 數(shù)據(jù)分析
55、范例. 西安交通大學(xué)出版社, 2008(5):83-84.15率,增強(qiáng)系統(tǒng)的可維護(hù)性2。semma 是 sas 公司針對(duì)使用其數(shù)據(jù)挖掘工具 enterprise miner 而提出的數(shù)據(jù)挖掘方法論。它將數(shù)據(jù)挖掘過程劃分為以下幾個(gè)主要步驟:數(shù)據(jù)抽樣(sample),數(shù)據(jù)特征探索和分析(explore),數(shù)據(jù)調(diào)整與預(yù)處理(modify),算法的選擇、模型的建立或知識(shí)的發(fā)現(xiàn)(model),模型或知識(shí)的綜合解釋與評(píng)價(jià)(assess)。數(shù)據(jù)抽樣(sample)當(dāng)進(jìn)行數(shù)據(jù)挖掘時(shí),首先要從數(shù)據(jù)庫中取出一個(gè)與所探索的問題相關(guān)的樣本數(shù)據(jù)集,再根據(jù)所要達(dá)到的目標(biāo)采取不同的方法,如隨機(jī)抽樣、典型抽樣等。另外要注意數(shù)
56、據(jù)的質(zhì)量。數(shù)據(jù)特征探索、分析和預(yù)處理(explore)得到一個(gè)樣本數(shù)據(jù)集后,要進(jìn)行數(shù)據(jù)特征的探索和分析??雌渲杏袥]有什么明顯的規(guī)律和趨勢,有沒有出現(xiàn)你從未設(shè)想過的數(shù)據(jù)狀態(tài),因素之間有什么相關(guān)性等等。還可用聚類、因子分析等方法對(duì)數(shù)據(jù)進(jìn)行分類和篩選。這是一個(gè)反復(fù)試探和觀察的過程,需要豐富的知識(shí)和敏銳的觀察力。問題明確化、數(shù)據(jù)調(diào)整和技術(shù)選擇(modify)通過上述兩個(gè)步驟的操作,分析人員就可以按照問題的具體要求對(duì)數(shù)據(jù)進(jìn)行修改,如增刪、組合或者生成一些新的變量等。模型的研發(fā)、知識(shí)的發(fā)現(xiàn)(model)這一步是數(shù)據(jù)挖掘工作的中心環(huán)節(jié)。根據(jù)要實(shí)現(xiàn)的目標(biāo)和數(shù)據(jù)集的特征,選擇一種或幾種數(shù)據(jù)挖掘方法,如數(shù)理統(tǒng)計(jì)方
57、法,人工神經(jīng)元網(wǎng)絡(luò),決策樹等,從而將隱含在數(shù)據(jù)中的內(nèi)在關(guān)系定量化、模型化。這一步也需要不斷的試驗(yàn),以得到擬合效果最好的模型。模型和知識(shí)的綜合解釋和評(píng)價(jià)(assess)從上述過程中將會(huì)得出一系列的分析結(jié)果、模式或模型,它們是對(duì)目標(biāo)問題的多側(cè)面的描述。但要形成最終的決策支持信息,還需要結(jié)合研究的問題,對(duì)這些結(jié)果進(jìn)行綜合的解釋。此外,要根據(jù)一定的方法,對(duì)決策支持信息的適用性做出評(píng)價(jià)。如發(fā)現(xiàn)不完善,就需要重新進(jìn)行數(shù)據(jù)挖掘的過程。因此,數(shù)據(jù)挖掘是一個(gè)反復(fù)進(jìn)行的過程,在反復(fù)過程中,獲得有價(jià)值的信息。sas 系統(tǒng)的最大特點(diǎn)是把數(shù)據(jù)管理和數(shù)據(jù)分析融為一體。具體地說具有如下幾方面特點(diǎn):1)使用靈活方便,功能齊全
58、。用戶把要解決的問題用 sas 節(jié)點(diǎn)連接起來表達(dá)出來組成 sas 關(guān)聯(lián)圖,提交給 sas 系統(tǒng),就可以解決你的問題,用戶操作是在很友好的界面下進(jìn)行的。2 汪遠(yuǎn)征, 徐雅靜. sas 軟件與統(tǒng)計(jì)應(yīng)用教程. 機(jī)械工業(yè)出版社, 2007(1): 138-139.162)sas 系統(tǒng)把數(shù)據(jù)處理與統(tǒng)計(jì)分析融為一體:sas 程序的結(jié)構(gòu)是由兩個(gè)基本步驟任意組合而成,data 步用于對(duì)數(shù)據(jù)的加工處理,proc 應(yīng)用于分析數(shù)據(jù)和編寫報(bào)告。3)適用性強(qiáng),應(yīng)用面廣:sas 系統(tǒng)適用于任何經(jīng)驗(yàn)的人員 (初學(xué)者或有經(jīng)驗(yàn)的用戶),適用于任何類型的數(shù)據(jù),sas 系統(tǒng)可以訪問各種數(shù)據(jù)資源,如*.dbf 文件、*.exl 文件
59、及其他軟件 (spss)生成的數(shù)據(jù)文件、高級(jí)語言生成的數(shù)據(jù)文件等。sas 系統(tǒng)可以用來解決自然科學(xué)和社會(huì)科學(xué)各個(gè)領(lǐng)域中的各類問題如統(tǒng)計(jì)學(xué)、經(jīng)濟(jì)學(xué)、生物工程學(xué)衛(wèi)生醫(yī)療、金融證券、社會(huì)調(diào)查等。sas 系統(tǒng)具有多硬件廠商結(jié)構(gòu),可支持多種硬件平臺(tái),它可以在大型計(jì)算機(jī),小型計(jì)算機(jī)及微機(jī)上運(yùn)行,對(duì)于“軟件環(huán)境”,sas 系統(tǒng)可以在十幾種不同的操作系統(tǒng)下運(yùn)行(如 dos, os/2, windows, windows nt, unix,vse, mvs, cms, open vms, primos, aosns 等)1。4)擴(kuò)展性能強(qiáng)、沒有上限的軟件系統(tǒng):sas 系統(tǒng)模塊或結(jié)構(gòu)可以讓用戶靈活地按自己的需要去
60、選擇相關(guān)的模塊與 base sas 軟件一起完成各種應(yīng)用的需要。5)sas 系統(tǒng)可以作為用戶唯一需要的最經(jīng)濟(jì)的軟件系統(tǒng)。1 黃燕, 吳平. sas 統(tǒng)計(jì)分析及應(yīng)用. 機(jī)械工業(yè)出版社, 2007(11):1-2.重慶工商管理碩士學(xué)院畢業(yè)論文 3 xx 銀行重慶分行客戶關(guān)系管理現(xiàn)狀分析173 xx 銀行分行客戶關(guān)系管理現(xiàn)狀分析3.1 xx 銀行分行簡介xx 銀行成立于 1987 年 4 月 8 日,是我國第一家完全由企業(yè)法人持股的股份制商業(yè)銀行,總行設(shè)在深圳。自成立以來,xx 銀行先后進(jìn)行了四次增資擴(kuò)股,并于 2002 年 3 月成功發(fā)行了 15 億普通股,4 月 9 日在上交所掛牌(股票代碼:6
溫馨提示
- 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
- 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會(huì)有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
- 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
- 5. 人人文庫網(wǎng)僅提供信息存儲(chǔ)空間,僅對(duì)用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對(duì)用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對(duì)任何下載內(nèi)容負(fù)責(zé)。
- 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請與我們聯(lián)系,我們立即糾正。
- 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶因使用這些下載資源對(duì)自己和他人造成任何形式的傷害或損失。
最新文檔
- 現(xiàn)代通信技術(shù)在智慧農(nóng)場建設(shè)中的應(yīng)用研究
- 人教版九年級(jí)數(shù)學(xué)上冊22.1.4《二次函數(shù)y=a(x-h)2+k的圖象和性質(zhì)》聽評(píng)課記錄
- 湘教版數(shù)學(xué)八年級(jí)上冊5.2《二次根式的除法》聽評(píng)課記錄2
- 人教部編版歷史八年級(jí)下冊:第5課《三大改造》聽課評(píng)課記錄
- 電商平臺(tái)中消費(fèi)者隱私權(quán)保護(hù)的國際比較研究
- 構(gòu)建以生態(tài)文明教育為導(dǎo)的教育模式研究
- 2025年度海外市場銷售代理傭金支付合同
- 2025年度航空航天零部件采購及售后服務(wù)合同
- 現(xiàn)代科技在水環(huán)境治理中的應(yīng)用與展望
- 現(xiàn)代小區(qū)消防安全管理體系的智能化技術(shù)應(yīng)用
- 社區(qū)獲得性肺炎教學(xué)查房
- 病例展示(皮膚科)
- GB/T 39750-2021光伏發(fā)電系統(tǒng)直流電弧保護(hù)技術(shù)要求
- DB31T 685-2019 養(yǎng)老機(jī)構(gòu)設(shè)施與服務(wù)要求
- 燕子山風(fēng)電場項(xiàng)目安全預(yù)評(píng)價(jià)報(bào)告
- 高一英語課本必修1各單元重點(diǎn)短語
- 糖尿病運(yùn)動(dòng)指導(dǎo)課件
- 完整版金屬學(xué)與熱處理課件
- T∕CSTM 00640-2022 烤爐用耐高溫粉末涂料
- 心腦血管病的危害教學(xué)課件
- 民用機(jī)場不停航施工安全管理措施
評(píng)論
0/150
提交評(píng)論