版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進(jìn)行舉報或認(rèn)領(lǐng)
文檔簡介
1、項目目標(biāo):運用邏輯回歸建立信用卡欺詐評分卡本次實驗的數(shù)據(jù)均來自于我行真實數(shù)據(jù),只是在本文的作業(yè)中不會出現(xiàn)實際客戶信息以及真實的變量內(nèi)容以及全部代碼,僅僅只是一次嘗試,僅供參考。一】數(shù)據(jù)樣本的確定本次嘗試選取了時間窗口12年11月到13年1月,13年5月到13年7月1000140筆樣本數(shù)據(jù)。并按照6:4的比例分成測試集和訓(xùn)練集二】變量確定X變量:從申請表,第三方信息源等數(shù)據(jù)表中提煉出85個初始變量,包括原始變量,根據(jù)經(jīng)驗確定的中間變量。Y變量:在實際業(yè)務(wù)中被認(rèn)定的壞客戶,其他的為好客戶,分別用1和0表示三】變量異常值剔除,缺失值填補數(shù)值變量:運用計算99分位數(shù),把大于2倍99分位數(shù)的數(shù)值置為99
2、分位數(shù),把缺失值總量超過20%以上的變量剔除分類變量:運用插值法,把缺失的變量填回去。四】變量篩選1、 首先進(jìn)行單變量的邏輯回歸,刪除掉P值大于0.3的變量,2、 把數(shù)值變量進(jìn)行分段操作,使得分出的段之間有較大差異,并且是單調(diào)的。3、 計算IV值,把IV值小于0.02的剔除,小于0.02的被認(rèn)為是沒有預(yù)測能力的4、 運用聚類的方法,把分類變量進(jìn)行聚類,以降低分類變量的緯度最后篩選出的變量如下表(實際意義不加以說明,表示的是一些客戶的屬性)最終10變量IVPBC_CC_CNT_OPEN_L6TH_B0.572
3、6102PBC_CC_OPENDATE_INT_B0.3712097SPREADER_HIRE_DATE_B0.3466377APP_LOANCARD_NUM_B0.2145266PBC_SAME_MOBILE0.2075589APP_CITY0.1969697PBC_CC_LOAN0.1809676APP_SAME_OTHERMOBILE0.1449625APP_EDUCATION_DEGREE_B0.0929062SAME_COMPANY0.0867273PBC_COMPADDR_TIME_B0.0649564PBC_SAME_COMMUADDR0.0584656五】邏輯回歸運用逐步回歸法
4、,計算各變量的參數(shù)估計Proc logistic data=lg.F_BS_NEW_IND_TRAIN descoutest=LG.param_est;model TARGET_VAR_NEW=PBC_CC_CNT_OPEN_L6TH_WOEPBC_CC_OPENDATE_INT_WOEPBC_COMPADDR_TIME_WOESPREADER_HIRE_DATE_WOEAPP_LOANCARD_NUM_WOEPBC_SAME_MOBILE_WOEAPP_CITY_WOEPBC_SAME_COMMUADDR_WOEPBC_CC_LOAN_WOEAPP_SAME_OTHERMOBILE_WOEA
5、PP_EDUCATION_DEGREE_WOE/ selection=stepwise slentry=0.05 slstay=0.05outroc=LG.ROC ctable pprob=(0 to 1 by 0.1) details lackfit stb;output out=LG.PRED p=phat;Run;proc sort data=LG.PRED;by descending phat;Run;輸出結(jié)果六】模型評價運用洛倫茨圖和ROC圖來看下模型的效果提升圖:每一段的實際壞客戶占比單調(diào)下降,說明模型的效果不錯,如果呈現(xiàn)的是非單調(diào)的,則說明模型不可用。洛倫茨圖在30%的水平下比隨
6、機(jī)提升35%左右,模型效果可以再看下ROC圖,誤判30%的好客戶可以區(qū)分出75%的壞客戶,C值在0.76,一般評分卡的C值大于0.75就可以運用此模型。七】輸出評分卡/*/
7、 /*/
8、0; /* Automatically Generated Scorecard */
9、;
10、 /*/
11、0; /* SAS CODE */
12、0; /* Scorecard Scale : */ &
13、#160;
14、160; /* Odds of 1 : 1/300 at 1000 Points
15、0; with PDO of 120 */&
16、#160;
17、160; /*/
18、 /*/
19、0; /* START OF
20、SCORING DATA STEP */
21、 /*/
22、; /*/
23、60; DATA LG.MODELING; /* Modify */
24、160;
25、60; SET LG.MODELING; /* Modify */ &
26、#160; /*/
27、; /*/
28、60; /*/ &
29、#160; /* Base P
30、oints */
31、 /*/
32、 Points=520 ; &
33、#160;
34、160; /*/
35、 /* Variable : APP_LOA
36、NCARD_NUM */
37、0; /*/
38、160; IF APP_LOANCARD_NUM LE (1) THEN Points=Points +(62);
39、;
40、 IF APP_LOANCARD_NUM GT (1) AND APP_LOANCARD_NUM LE (2) THEN Points=Points +(-47);
41、 IF APP_LOANCARD_NUM GT (2) THEN Points=Points +(-112); &
42、#160; /*/
43、 /* Variable : PBC_CC_CNT_OPEN_L6TH */
44、;
45、 /*/
46、0; IF PBC_CC_CNT_OPEN_L6TH LE (0) THEN Points=Points +(8);
47、0; IF PBC_CC_CNT_OPEN_L6TH GT (0) AND PBC_CC_CNT_OPEN_L6TH LE (1) THEN Points=Points +(-27);
48、60; IF PBC_CC_CNT_OPEN_L6TH GT (1) THEN Points=Points +(-32); &
49、#160; /*/
50、 &
51、#160; /* Variable : PBC_CC_OPENDATE_INT */
52、 /*/
53、; IF PBC_CC_OPENDATE_INT LE (0) THEN Points=Point
54、s +(38);
55、 IF PBC_CC_OPENDATE_INT GT (0) AND PBC_CC_OPENDATE_INT LE (24) THEN Points=Points +(-26);
56、; IF PBC_CC_OPENDATE_INT GT (24) AND PBC_CC_OPENDATE_INT LE (48) THEN Points=Points +(-32); IF P
57、BC_CC_OPENDATE_INT GT (48) THEN Points=Points +(-47);
58、160; /*/ &
59、#160; /* Variable : SPREADER_HIRE_DATE */ &
60、#160; /*/
61、 &
62、#160; IF SPREADER_HIRE_DATE LE (6) THEN Points=Points +(22);
63、160; IF SPREADER_HIRE_DATE GT (6) THEN Points=Points +(-18);
64、60; IF SPREADER_HIRE_DATE = ""
65、THEN Points=Points +(66);
66、0; /*/
67、160; /* Variable : APP_CITY */
68、 /*/
69、0;
70、; IF APP_CITY = "Y" THEN Points=Points +(47);
71、 IF APP_CITY = "N" THEN Points=Points +(-40); &
72、#160;
73、160; IF APP_CITY = "U" THEN Points=Points +(-45);
74、60; /*/ &
75、#160; /* Variable : APP_EDUCATION_DEGREE &
76、#160; */ &
77、#160; /*/
78、; IF APP_EDUCATION_DEGREE = "F" THEN Points=Points +(-43); &
79、#160; IF APP_EDUCATIO
80、N_DEGREE = "E" THEN Points=Points +(-8);
81、; IF APP_EDUCATION_DEGREE = "D" THEN Points=Points +(-8); &
82、#160; IF APP_EDUCATION_DEGREE = "A" THEN Points=Points +(21);
83、0; IF APP_EDUCA
84、TION_DEGREE = "B" THEN Points=Points +(21);
85、160; IF APP_EDUCATION_DEGREE = "C" THEN Points=Points +(21);
86、; IF APP_EDUCATION_DEGREE = "G" THEN Points=Points +(52); &
87、#160; /*/
88、
89、 /* Variable : APP_SAME_OTHERMOBILE */
90、; /*/
91、60; IF APP_SAME_OTHERMOBILE = "Y&quo
92、t; THEN Points=Points +(-124);
93、; IF APP_SAME_OTHERMOBILE = "N" THEN Points=Points +(4);
94、0; /*/
95、60; /* Variable : PBC_CC_LOAN */
96、0;
97、; /*/
98、60; IF PBC_CC_LOAN = "Y" THEN Points=Points +(25);
99、160;
100、60; IF PBC_CC_LOAN = "N" THEN Points=Points +(-46); &
101、#160; /*/
102、; /* Variable : PBC_SAME_MOBILE */
103、160;
104、60; /*/
105、160; IF PBC_SAME_MOBILE = "Y" THEN Points=Points +(130);
106、60; IF PBC_SAME_MOBILE = "N" THEN
107、; Points=Points +(-76);
108、; IF PBC_SAME_MOBILE = "U" THEN Points=Points +(-66);
109、 /*/
110、 /* Variable : SAME_COMPANY */
溫馨提示
- 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
- 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
- 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
- 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負(fù)責(zé)。
- 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請與我們聯(lián)系,我們立即糾正。
- 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時也不承擔(dān)用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。
最新文檔
- 網(wǎng)絡(luò)犯罪與法律應(yīng)對-洞察分析
- 單位消防安全月活動總結(jié)范文(10篇)
- 舞蹈編導(dǎo)作品分析-洞察分析
- 營養(yǎng)咨詢國際化趨勢-洞察分析
- 頭痛患者腦血流速度研究-洞察分析
- 土木香提取物的抗菌活性研究-洞察分析
- 虛擬現(xiàn)實與增強(qiáng)現(xiàn)實融合技術(shù)-洞察分析
- 文化元素在目的地形象中的應(yīng)用-洞察分析
- 《保安員培訓(xùn)資料》課件
- 創(chuàng)建文明校園院長講話稿(13篇)
- 組織學(xué)與胚胎學(xué)智慧樹知到期末考試答案章節(jié)答案2024年中南大學(xué)
- 2023年云南省普通高中學(xué)業(yè)水平考試歷史試卷附答案
- 《數(shù)學(xué)文化》課程教學(xué)大綱
- 2021-2022學(xué)年天津市河西區(qū)八年級(上)期末物理試題及答案解析
- 新疆維吾爾自治區(qū)喀什地區(qū)各縣區(qū)鄉(xiāng)鎮(zhèn)行政村村莊村名居民村民委員會明細(xì)及行政區(qū)劃代碼
- 部編版語文六年級上冊總復(fù)習(xí)《判斷題》專項復(fù)習(xí)
- 一年級上學(xué)期樂考質(zhì)量分析
- 血液系統(tǒng)疾病病人常見癥狀體征護(hù)理
- [北京]輸變電工程標(biāo)準(zhǔn)工藝應(yīng)用圖冊(圖文并茂)
- 預(yù)制箱梁常見問題以及處理方案
- 《建筑施工現(xiàn)場環(huán)境與衛(wèi)生標(biāo)準(zhǔn)》(JGJ146)
評論
0/150
提交評論