版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進行舉報或認領(lǐng)
文檔簡介
1、數(shù)據(jù)挖掘技術(shù)在信用卡業(yè)務(wù)中的應(yīng)用案例分享信用卡業(yè)務(wù)具有透支筆數(shù)巨大、單筆金額小的特點,這使得數(shù)據(jù)挖掘技術(shù)在信用卡業(yè)務(wù)中的應(yīng)用成為必然。國外信用卡發(fā)卡機構(gòu)已經(jīng)廣泛應(yīng)用數(shù)據(jù)挖掘技術(shù)促進信用卡業(yè)務(wù)的發(fā)展,實現(xiàn)全面的績效管理。我國自1985年發(fā)行第一張信用卡以來,信用卡業(yè)務(wù)得到了長足的發(fā)展,積累了巨量的數(shù)據(jù),數(shù)據(jù)挖掘在信用卡業(yè)務(wù)中的重要性日益顯現(xiàn)。一、數(shù)據(jù)挖掘技術(shù)在信用卡業(yè)務(wù)中的應(yīng)用 數(shù)據(jù)挖掘技術(shù)在信用卡業(yè)務(wù)中的應(yīng)用主要有分析型客戶關(guān)系管理、風險管理和運營管理。 1.分析型CRM 分析型CRM應(yīng)用包括市場細分、客戶獲取、交叉銷售和客戶流失。信用卡分析人員搜集和處理大量數(shù)據(jù)
2、,對這些數(shù)據(jù)進行分析,發(fā)現(xiàn)其數(shù)據(jù)模式及特征,分析某個客戶群體的特性、消費習慣、消費傾向和消費需求,進而推斷出相應(yīng)消費群體下一步的消費行為,然后以此為基礎(chǔ),對所識別出來的消費群體進行特定產(chǎn)品的主動營銷。這與傳統(tǒng)的不區(qū)分消費者對象特征的大規(guī)模營銷手段相比,大大節(jié)省了營銷成本,提高了營銷效果,從而能為銀行帶來更多的利潤。對客戶采用何種營銷方式是根據(jù)響應(yīng)模型預測得出的客戶購買概率做出的,對響應(yīng)概率高的客戶采用更為主動、人性化的營銷方式,如電話營銷、上門營銷;對響應(yīng)概率較低的客戶可選用成本較低的電子郵件和信件營銷方式。除獲取新客戶外,維護已有優(yōu)質(zhì)客戶的忠誠度也很重要,因為留住一個原有客戶的成本要遠遠低于
3、開發(fā)一個新客戶的成本。在客戶關(guān)系管理中,通過數(shù)據(jù)挖掘技術(shù),找到流失客戶的特征,并發(fā)現(xiàn)其流失規(guī)律,就可以在那些具有相似特征的持卡人還未流失之前,對其進行有針對性的彌補,使得優(yōu)質(zhì)客戶能為銀行持續(xù)創(chuàng)造價值。 2.風險管理 數(shù)據(jù)挖掘在信用卡業(yè)務(wù)中的另一個重要應(yīng)用就是風險管理。在風險管理中運用數(shù)據(jù)挖掘技術(shù)可建立各類信用評分模型。模型類型主要有三種:申請信用卡評分卡、行為信用評分卡和催收信用評分卡,分別為信用卡業(yè)務(wù)提供事前、事中、和事后的信用風險控制。 申請評分模型專門用于對新申請客戶的信用評估,它應(yīng)用于信用卡征信審核階段,通過申請人填寫的有關(guān)個人信息,即可有效、快速地辨別和
4、劃分客戶質(zhì)量,決定是否審批通過并對審批通過的申請人核定初始信用額度,幫助發(fā)卡行從源頭上控制風險。申請評分模型不依賴于人們的主觀判斷或經(jīng)驗,有利于發(fā)卡行推行統(tǒng)一規(guī)范的授信政策。行為評分模型是針對已有持卡人,通過對持卡客戶的行為進行監(jiān)控和預測,從而評估持卡客戶的信用風險,并根據(jù)模型結(jié)果,智能化地決定是否調(diào)整客戶信用額度,在授權(quán)時決定是否授權(quán)通過,到期換卡時是否進行續(xù)卡操作,對可能出現(xiàn)的使其提前進行預警。催收評分模型是申請評分模型和行為評分模型的補充,是在持卡人產(chǎn)生了逾期或壞賬的情況下建立的。催收評分卡被用于預測和評估對某一筆壞賬所采取措施的有效性,諸如客戶對警告信件反應(yīng)的可能性。這樣,發(fā)卡行就可以
5、根據(jù)模型的預測,對不同程度的逾期客戶采取相應(yīng)措施進行處理。以上三種評分模型在建立時,所利用的數(shù)據(jù)主要是人口統(tǒng)計學數(shù)據(jù)和行為數(shù)據(jù)。人口統(tǒng)計學數(shù)據(jù)包括年齡、性別、婚姻狀況、教育背景、家庭成員特點、住房情況、職業(yè)、職稱、收入狀況等。行為數(shù)據(jù)包括持卡人在過去使用信用卡的表現(xiàn)信息,如使用頻率、金額、還款情況等。由此可見,數(shù)據(jù)挖掘技術(shù)的使用,可以使銀行有效地建立起事前、事中到事后的信用風險控制體系。 3.運營管理 雖然數(shù)據(jù)挖掘在信用卡運營管理領(lǐng)域的應(yīng)用不是最重要的,但它已為國外多家發(fā)卡公司在提高生產(chǎn)效率、優(yōu)化流程、預測資金和服務(wù)需求、提供服務(wù)次序等問題的分析上取得了較大成績。
6、;二、常用的數(shù)據(jù)挖掘方法 上述數(shù)據(jù)挖掘技術(shù)在信用卡領(lǐng)域的應(yīng)用中,有很多工具可用于開發(fā)預測和描述模型。有些用統(tǒng)計方法,如線性回歸和邏輯回歸;有些有非統(tǒng)計或混合方法,如神經(jīng)網(wǎng)絡(luò)、遺傳算法、決策樹及回歸樹。這里僅討論幾種常見的典型方法。 1.線性回歸 簡單線性回歸分析是量化兩個連續(xù)變量之間關(guān)系的一種統(tǒng)計技術(shù)。這兩個變量分別是因變量(預測變量。使用這一方法,可以發(fā)現(xiàn)一條穿過數(shù)據(jù)的線,線上的點使對應(yīng)數(shù)據(jù)點的方差最小。為市場營銷、風險和客戶關(guān)系管理建立模型時,通常有多個自變量,用多個獨立自變量來預測一個連續(xù)變量稱為多元線性回歸,用線性回歸方法建立的模型通常具有魯棒性。
7、0;2.邏輯回歸 邏輯回歸是使用最廣泛的建模技術(shù),與線性回歸很相似。兩者的主要區(qū)別在于邏輯回歸的因變量(想預測變量不是連續(xù)的,而是離散的或者類型變量。如申請評分模型可運用邏輯回歸方法,選取關(guān)鍵變量確定回歸系數(shù)。以申請者的關(guān)鍵變量x1,x2,xm為自變量,以y=1 申請者是壞客戶;0 申請者是好客戶,為因變量,則對于二分類因變量,一般假設(shè)客戶變壞的概率為 p(y=1=e0+1×1+mxm/1+e0+1×1+mxm式中,0,1,m是常數(shù),即1n(p/1-p=0+1×1+mxm 3.神經(jīng)網(wǎng)絡(luò) 神經(jīng)網(wǎng)絡(luò)處理和回歸處理大不相同,它不依照任何概率
8、分布,而是模仿人腦功能,可以認為它是從每一次經(jīng)驗中提取并學習信息。神經(jīng)網(wǎng)絡(luò)系統(tǒng)由一系列類似于人腦神經(jīng)元一樣的節(jié)點組成,這些節(jié)點通過網(wǎng)絡(luò)彼此互連。如果有數(shù)據(jù)輸入,它們便可以進行確定數(shù)據(jù)模式的工作。神經(jīng)網(wǎng)絡(luò)由相互連接的輸入層、中間層(或隱藏層、輸出層組成。中間層由多個節(jié)點組成,完成大部分網(wǎng)絡(luò)工作。輸出層輸出數(shù)據(jù)分析的執(zhí)行結(jié)果。 4.遺傳算法 與神經(jīng)元網(wǎng)絡(luò)類似,遺傳算法也不遵循任何概率分布,是源自“適者生存”的進化過程。它首先將問題的可能解按某種形式進行編碼,編碼后的解稱為染色體。隨機選取n個染色體作為初始種群,再根據(jù)預定的評價函數(shù)對每個染色體計算適應(yīng)值,性能較好的染色體有較高的
9、適應(yīng)值。選擇適應(yīng)值較高的染色體進行復制,并通過遺傳算子產(chǎn)生一群新的更適應(yīng)環(huán)境的染色體,形成新的種群,直至最后收斂到一個最適應(yīng)環(huán)境的個體,得到問題的最優(yōu)化解。 5.決策樹 決策樹的目標是逐步將數(shù)據(jù)分類到不同的組或分支中,在因變量的值上建立最強劃分。由于分類規(guī)則比較直觀,所以易于理解。圖1為客戶響應(yīng)的決策樹,從中很容易識別出響應(yīng)率最高的組。 三、實例分析 以下以邏輯回歸方法建立信用卡申請評分模型為例,說明數(shù)據(jù)挖掘技術(shù)在信用卡業(yè)務(wù)中的應(yīng)用。申請評分模型設(shè)計可分為7個基本步驟。 1.定義好客戶和壞客戶的標準 好客戶和壞客戶的標準根據(jù)適合管理的
10、需要定義。按照國外的經(jīng)驗,建立一個預測客戶好壞的風險模型所需的好、壞樣本至少各要有1000個左右。為了規(guī)避風險,同時考慮到信用卡市場初期,銀行的效益來源主要是銷售商的傭金、信用卡利息、手續(xù)費收入和資金的運作利差。因此,一般銀行把降低客戶的逾期率作為一個主要的管理目標。比如,將壞客戶定義為出現(xiàn)過逾期60天以上的客戶;將壞客戶定義為出現(xiàn)過逾期60天以上的客戶;將好客戶定義為沒有30天以上逾期且當前沒有逾期的客戶。 一般來講,在同一樣本空間內(nèi),好客戶的數(shù)量要遠遠大于壞客戶的數(shù)量。為了保證模型具有較高的識別壞客戶的能力,取好、壞客戶樣本數(shù)比率為1:1。 2.確定樣本空間
11、樣本空間的確定要考慮樣本是否具有代表性。一個客戶是好客戶,表明持卡人在一段觀察期內(nèi)用卡表現(xiàn)良好;而一個客戶只要出現(xiàn)過“壞”的記錄,就把他認定為壞客戶。所以,一般好客戶的觀察期要比壞客戶長一些、好、壞客戶可以選擇在不同的時間段,即不同的樣本空間內(nèi)。比如,好客戶的樣本空間為2003年11月-2003年12月的申請人,壞客戶的樣本空間為2003年11月-2004年5月的申請人,這樣既能保證好客戶的表現(xiàn)期較長,又能保證有足夠數(shù)量的壞客戶樣本。當然,抽樣的好、壞客戶都應(yīng)具有代表性。 3.數(shù)據(jù)來源 在美國,有統(tǒng)一的信用局對個人信用進行評分,通常被稱為“FICO評分”。美國的銀行、信用卡
12、公司和金融機構(gòu)在對客戶進行信用風險分析時,可以利用信用局對個人的數(shù)據(jù)報告。在我國,由于征信系統(tǒng)還不完善,建模數(shù)據(jù)主要來自申請表。隨著我國全國性征信系統(tǒng)的逐步完善,未來建模的一部分數(shù)據(jù)可以從征信機構(gòu)收集到。 4.數(shù)據(jù)整理 大量取樣的數(shù)據(jù)要真正最后進入模型,必須經(jīng)過數(shù)據(jù)整理。在數(shù)據(jù)處理時應(yīng)注意檢查數(shù)據(jù)的邏輯性、區(qū)分“數(shù)據(jù)缺失”和“0”、根據(jù)邏輯推斷某些值、尋找反常數(shù)據(jù)、評估是否真實??梢酝ㄟ^求最小值、最大值和平均值的方法,初步驗證抽樣數(shù)據(jù)是否隨機、是否具有代表性。 5.變量選擇 變量選擇要同時具有數(shù)學統(tǒng)計的正確性和信用卡實際業(yè)務(wù)的解釋力。Logistic回歸
13、方法是盡可能準確找到能夠預測因變量的自變量,并給予各自變量一定權(quán)重。若自變量數(shù)量太少,擬合的效果不好 ,不能很好地預測因變量的情況;若自變量太多,會形成過分擬合,預測因變量的效果同樣不好。所以應(yīng)減少一些自變量,如用虛擬變量表示不能量化的變量、用單變量和決策樹分析篩選變量。與因變量相關(guān)性差不多的自變量可以歸為一類,如地區(qū)對客戶變壞概率的影響,假設(shè)廣東和福建兩省對壞客戶的相關(guān)性分別為-0.381和-0.380,可將這兩個地區(qū)歸為一類,另外,可以根據(jù)申請表上的信息構(gòu)造一些自變量,比如結(jié)合申請表上“婚姻狀況”和“撫養(yǎng)子女”,根據(jù)經(jīng)驗和常識結(jié)合這兩個字段,構(gòu)造新變量“已婚有子女”,進入模型分析這個變量是
14、不真正具有統(tǒng)計預測性。 6.模型建立 借助SAS9軟件,用逐步回歸法對變量進行篩選。這里設(shè)計了一種算法,分為6個步驟。 步驟1:求得多變量相關(guān)矩陣(若是虛擬變量,則0.5屬于比較相關(guān);若是一般變量,則0.7-0.8屬于比較相關(guān)。 步驟2:旋轉(zhuǎn)主成分分析(一般變量要求0.8屬于比較相關(guān);虛擬變量要求0.6-0.7屬于比較相關(guān)。 步驟3:在第一主成分和第二主成分分別找出15個變量,共30個變量。 步驟4:計算所有30個變量對好/壞的相關(guān)性,找出相關(guān)性大的變量加入步驟3得出的變量。 步驟5:計算VIF。若VIF數(shù)值比較大,查看步驟1中的相關(guān)矩陣,并分別分析這兩個變量對模型的作用,
15、剔除相關(guān)性較小的一個。 步驟6:循環(huán)步驟4和步驟5,直到找到所有變量,且達到多變量相關(guān)矩陣相關(guān)性很而單個變量對模型貢獻作用大。7.模型驗證 在收集數(shù)據(jù)時,把所有整理好的數(shù)據(jù)分為用于建立模型的建模樣本和用于模型驗證的對照樣本。對照樣本用于對模型總體預測性、穩(wěn)定性進行驗證。申請評分模型的模型檢驗指標包括K-S值、ROC、AR等指標。雖然受到數(shù)據(jù)不干凈等客觀因素的影響,本例申請評分模型的K-S值已經(jīng)超過0.4,達到了可以使用的水平。 四、數(shù)據(jù)挖掘在國內(nèi)信用卡市場的發(fā)展前景 在國外,信用卡業(yè)務(wù)信息化程度較高,數(shù)據(jù)庫中保留了大量的數(shù)量資源,運用數(shù)據(jù)技術(shù)建立的各類模型在信用卡業(yè)務(wù)中的實施非常成功。目前國內(nèi)信用卡發(fā)卡銀行首先利用數(shù)據(jù)挖掘建立申請評分模型,作為在信用卡業(yè)務(wù)中應(yīng)用的第一步,不少發(fā)卡銀行已經(jīng)用
溫馨提示
- 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
- 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預覽,若沒有圖紙預覽就沒有圖紙。
- 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
- 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負責。
- 6. 下載文件中如有侵權(quán)或不適當內(nèi)容,請與我們聯(lián)系,我們立即糾正。
- 7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。
最新文檔
- 室外景觀設(shè)計師的植物配置與環(huán)境打造
- 保健品行業(yè)話務(wù)員工作總結(jié)
- 2025年中考物理一輪復習之物態(tài)變化
- 超市行業(yè)客服工作總結(jié)周到服務(wù)增添購物樂趣
- 化妝護膚行業(yè)銷售工作總結(jié)
- 餐飲服務(wù)員工作總結(jié)熱情招待細心服務(wù)顧客
- 【八年級下冊地理湘教版】專項02 港、澳、臺的經(jīng)濟發(fā)展
- 2024年熱鬧的元宵節(jié)教案
- 2024年石家莊理工職業(yè)學院單招職業(yè)技能測試題庫標準卷
- 《毛澤東思想和中國特色社會主義理論體系概論》復習大綱
- 雨雪天氣安全教育PPT
- 深基坑支護專項施工方案(咬合樁)
- 勞務(wù)派遣服務(wù)外包技術(shù)方案
- 采購管理實務(wù)全套教學課件
- 極致物業(yè)管理系統(tǒng)收費管理業(yè)務(wù)操作
- GB∕T 29639-2020 生產(chǎn)經(jīng)營單位生產(chǎn)安全事故應(yīng)急預案編制導則
- 貴州省工傷保險待遇申領(lǐng)授權(quán)委托書
- 媒介融合(ppt)課件
- 液壓系統(tǒng)中油管尺寸的選擇
- 視頻監(jiān)控臺賬參考模板
- 初一初三國家體育鍛煉標準評分表
評論
0/150
提交評論