下載本文檔
版權(quán)說(shuō)明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請(qǐng)進(jìn)行舉報(bào)或認(rèn)領(lǐng)
文檔簡(jiǎn)介
1、大數(shù)據(jù)個(gè)人信用體系、模型及案例綜述摘要:近年來(lái)隨著金融科技的迅猛發(fā)展,個(gè)人信用體系在大數(shù)據(jù)及云計(jì)算技術(shù)發(fā)展背景下拓寬了邊界和內(nèi)涵,解決了傳統(tǒng)信用評(píng)級(jí)覆蓋不足的痛點(diǎn)并能有效輔助識(shí)別真實(shí)貸款需求及貸后風(fēng)險(xiǎn),本文對(duì)近年大數(shù)據(jù)個(gè)人信融體系及個(gè)人信用體系模型搭建和進(jìn)行了綜述并對(duì)實(shí)用案例進(jìn)行分析。關(guān)鍵詞:大數(shù)據(jù)個(gè)人信用體系建模近十年來(lái),隨著移動(dòng)互聯(lián)網(wǎng)和金融科技的迅猛發(fā)展,傳統(tǒng)的個(gè)人信用體系已經(jīng)不能滿足市場(chǎng)需求,由于我國(guó)的個(gè)人信用體系建設(shè)起步較晚,直接影響了我國(guó)金融市場(chǎng)的交易秩序。為了夯實(shí)金融行業(yè)發(fā)展的基礎(chǔ)推動(dòng)我國(guó)市場(chǎng)經(jīng)濟(jì)健康發(fā)展,以大數(shù)據(jù)為基礎(chǔ)對(duì)個(gè)人信用體系進(jìn)行拓寬和優(yōu)化對(duì)我國(guó)征信行業(yè)的發(fā)展有著重要的意義
2、。一、大數(shù)據(jù)個(gè)人信用體系的構(gòu)建大數(shù)據(jù)不同于傳統(tǒng)數(shù)據(jù)主要體現(xiàn)在三個(gè)方面:一是體量大,體現(xiàn)在規(guī)模和傳輸量是流動(dòng)速度大,數(shù)據(jù)實(shí)時(shí)或接近實(shí)時(shí)獲取和傳輸;三是種類(lèi)多,數(shù)據(jù)結(jié)構(gòu)形式多樣。構(gòu)建個(gè)人信用體系的大數(shù)據(jù)來(lái)源有:一是個(gè)人產(chǎn)生的數(shù)據(jù),如社交網(wǎng)絡(luò)信息、產(chǎn)品評(píng)價(jià)、搜索記錄、購(gòu)物喜好等;二是商業(yè)過(guò)程數(shù)據(jù),如物流數(shù)據(jù)、支付數(shù)據(jù)等,也有數(shù)據(jù)公司采集傳統(tǒng)商業(yè)數(shù)據(jù),如大型百貨公司客流量、大型游樂(lè)場(chǎng)客流量等數(shù)據(jù);三是來(lái)自GPS定位、車(chē)輛軌跡和個(gè)人穿戴設(shè)備的數(shù)據(jù)(廖理,2019)。大數(shù)據(jù)的發(fā)展為傳統(tǒng)信用評(píng)級(jí)機(jī)構(gòu)提供了更為先進(jìn)的數(shù)據(jù)采集和數(shù)據(jù)分析手段,有效地克服了傳統(tǒng)征信單值測(cè)度的局限性(Lin,2015),不僅大幅度提
3、高了評(píng)估結(jié)果的準(zhǔn)確性,還將非傳統(tǒng)信用指標(biāo)納入了評(píng)級(jí)體系,從而推動(dòng)了普惠金融實(shí)踐(Packin&LevAretz,2016)。國(guó)內(nèi)研究者主要集中于研究大數(shù)據(jù)個(gè)人信用體系的構(gòu)建:蔡金鑫等(2018)等過(guò)改進(jìn)傳統(tǒng)的“5C信用評(píng)估法”,構(gòu)建基于大數(shù)據(jù)的個(gè)人信用評(píng)估指標(biāo)體系,為大數(shù)據(jù)征信的發(fā)展提供參考;王達(dá)山(2016)通過(guò)分析互聯(lián)網(wǎng)金融衍生的個(gè)人信用數(shù)據(jù),綜合傳統(tǒng)信用評(píng)價(jià)數(shù)據(jù),從個(gè)人身份、信用歷史、經(jīng)濟(jì)能力和社會(huì)信用屬性四個(gè)信用維度,提出了運(yùn)用個(gè)人信用能力模型來(lái)對(duì)個(gè)人信用能力進(jìn)行評(píng)價(jià);方匡南等(2018)提出了基于多源數(shù)據(jù)融合的個(gè)人信用模型,可以同時(shí)對(duì)多個(gè)數(shù)據(jù)集進(jìn)行建模和變量選擇,同時(shí)考慮了數(shù)據(jù)集間的
4、相似性和異質(zhì)性。所提出的整合模型在變量選擇和分類(lèi)效果方面都具有明顯的優(yōu)勢(shì)。此外,將整合模型應(yīng)用于城市和農(nóng)村兩個(gè)數(shù)據(jù)集的個(gè)人信用評(píng)分中發(fā)現(xiàn),整合模型在實(shí)際應(yīng)用中也有很好的表現(xiàn)。已有研究針對(duì)基于大數(shù)據(jù)的個(gè)人信用體系提出了諸多創(chuàng)造性的觀點(diǎn),更多的研究聚焦于深入探討如何應(yīng)用大數(shù)據(jù)建立個(gè)人信用評(píng)估模型。、大數(shù)據(jù)個(gè)人信用評(píng)估模型及方法袁章帥等(2019)將1GSO-BP協(xié)同集成學(xué)習(xí)算法應(yīng)用于社交網(wǎng)絡(luò)信用評(píng)價(jià)中,建立基于IGSO-BP協(xié)同集成學(xué)習(xí)算法的社交網(wǎng)絡(luò)信用評(píng)價(jià)模型。梁心怡(2019)通過(guò)統(tǒng)計(jì)分析,結(jié)合大學(xué)生網(wǎng)絡(luò)消費(fèi)信貸的個(gè)人信用數(shù)據(jù),通過(guò)定性和定量分析建立適合大學(xué)生的個(gè)人信用評(píng)分模型。宋麗平等(20
5、15)針對(duì)P2P網(wǎng)絡(luò)借貸平臺(tái)的特點(diǎn),確定個(gè)人信用風(fēng)險(xiǎn)評(píng)估指標(biāo),并以平臺(tái)借款人個(gè)人信用等級(jí)作為預(yù)測(cè)輸出目標(biāo),創(chuàng)建BP神經(jīng)網(wǎng)絡(luò)模型,使貸款人和網(wǎng)貸平臺(tái)能夠更好地了解借款人的信用狀況。都紅雯等(2018)以微貸網(wǎng)為例,在該平臺(tái)原有信用風(fēng)險(xiǎn)評(píng)估指標(biāo)基礎(chǔ)上,借鑒國(guó)外FICO信用評(píng)分方法和國(guó)內(nèi)芝麻信用評(píng)分方法,嘗試構(gòu)建適用于國(guó)內(nèi)P2P網(wǎng)貸平臺(tái)的信用評(píng)估指標(biāo)體系,用于評(píng)估借款者信用。并選取微貸網(wǎng)平臺(tái)網(wǎng)站6917個(gè)借款者的數(shù)據(jù)、采用SVM-Logistic組合模型、運(yùn)用修正后的指標(biāo)體系進(jìn)行信用風(fēng)險(xiǎn)評(píng)估,將測(cè)試結(jié)果與實(shí)際結(jié)果比較,優(yōu)化了信用風(fēng)險(xiǎn)評(píng)估體系。謝陳昕(2019)對(duì)比分析了基于Logistic回歸、決策
6、樹(shù)、隨機(jī)森林、支持向量機(jī)和神經(jīng)網(wǎng)絡(luò)的個(gè)人信用風(fēng)險(xiǎn)評(píng)估模型,并在此基礎(chǔ)上提出了采用4種機(jī)器學(xué)習(xí)算法綜合篩選重要變量再建立Logistic回歸模型的兩階段組合模型。應(yīng)用這一模型對(duì)“人人貸”平臺(tái)借款人數(shù)據(jù)進(jìn)行實(shí)證研究。結(jié)果表明:該模型相較于Logistic回歸模型有著更高的精確度,克服了數(shù)據(jù)維度及定性變量數(shù)量的限制,而且提高了單一機(jī)器學(xué)習(xí)算法的指標(biāo)解釋能力,說(shuō)明基于機(jī)器學(xué)習(xí)算法的Logistic回歸模型對(duì)P2P網(wǎng)貸平臺(tái)的借款人信用風(fēng)險(xiǎn)評(píng)估有更好的適應(yīng)性。陸健健等(2019)針對(duì)銀行客戶信用評(píng)估模型不健全不完善等問(wèn)題,在對(duì)比隨機(jī)森林(RF)、GBD向XGBoost三種集成算法基礎(chǔ)上,提出基于XGBoo
7、st算法的金融客戶信用評(píng)估模型。依據(jù)計(jì)算得到的相關(guān)多元評(píng)價(jià)指標(biāo)對(duì)個(gè)人信用評(píng)估進(jìn)行對(duì)比研究,實(shí)證結(jié)果表明,建立在XGBoost集成算法上的個(gè)人信用評(píng)估模型性能最優(yōu),在準(zhǔn)確率指標(biāo)上比隨機(jī)森林(RF)高出6%比GBDTT法高0.8%。王磊(2018)建立信用個(gè)人信用評(píng)價(jià)指標(biāo)體系,禾用BP神經(jīng)網(wǎng)絡(luò)算法,建立了借款人個(gè)人信用評(píng)價(jià)模型,為了達(dá)到更好的效果,采用不同的激活函數(shù)及權(quán)值調(diào)整方法進(jìn)行模型優(yōu)化,最終建立基于擬牛頓算法的BP神經(jīng)網(wǎng)絡(luò)模型,能達(dá)到對(duì)用戶信命評(píng)級(jí)96.28%的準(zhǔn)確率。張潔琳(2018)通過(guò)對(duì)貝葉斯網(wǎng)絡(luò)進(jìn)行分析,以最小風(fēng)險(xiǎn)決策準(zhǔn)則作為基本原則,在對(duì)用戶進(jìn)行信用評(píng)估時(shí)建立了一種全新的用戶信用評(píng)
8、估模型。在對(duì)數(shù)據(jù)進(jìn)行采集的過(guò)程中,通過(guò)交叉驗(yàn)證的方式對(duì)數(shù)據(jù)進(jìn)行了驗(yàn)證,最終檢測(cè)結(jié)果表明,在對(duì)用戶進(jìn)行信用評(píng)估的過(guò)程中基于最小風(fēng)險(xiǎn)準(zhǔn)則的貝葉斯以及貝葉斯網(wǎng)絡(luò)分類(lèi)模式可以有效的降低信用評(píng)估的風(fēng)險(xiǎn)。許彩艷等(2019)根據(jù)某商業(yè)銀行提供的客戶歷史數(shù)據(jù),首先基于8萬(wàn)條記錄,628個(gè)變量的原始數(shù)據(jù)進(jìn)行統(tǒng)計(jì)描述分析,篩選出有效數(shù)據(jù)集:其次利用Lasso估計(jì),找到最優(yōu)調(diào)節(jié)參數(shù)lambda,根據(jù)lambda與變量數(shù)目對(duì)應(yīng)走勢(shì)圖,最終篩選出19個(gè)變量,最后建立Lasso-logistic模型,分析結(jié)果顯示:訓(xùn)練集預(yù)測(cè)準(zhǔn)確率為84.62%,測(cè)試集預(yù)測(cè)準(zhǔn)確率為78.80%,模型外推效果良好。芝麻信用是是螞蟻金服20
9、15年初推出的第三方征信機(jī)構(gòu),它是根據(jù)各不同種數(shù)據(jù)類(lèi)型設(shè)計(jì)得出來(lái)的信用體系,通過(guò)阿里云計(jì)算、機(jī)器學(xué)習(xí)等技術(shù)手段來(lái)反映用戶的信用情況,已經(jīng)在消費(fèi)分期、現(xiàn)金分期、租賃等場(chǎng)景便用。以國(guó)際主流個(gè)人信用評(píng)分模式作為參考,芝麻信用分從低到高共分為五級(jí),由低到高代表著不同的信用等級(jí)。芝麻信用分?jǐn)?shù)越高則代表信用越高,相反則代表低信用。具體評(píng)分結(jié)果由五個(gè)維度共同決定,分別是:信用歷史、行為偏好、履約能力、身份特質(zhì)、人脈關(guān)系。利用大數(shù)據(jù)技術(shù),芝麻信用綜合考慮等五個(gè)維度信息,應(yīng)用了一種改進(jìn)的樹(shù)模型GBDT(GradientBoostingDecisionTree),深入挖掘特征之間的關(guān)聯(lián)性,衍生出具備較強(qiáng)信用預(yù)測(cè)能力的組合特征,并將該組合特征與原始特征一起使用邏輯回歸線性算法進(jìn)行訓(xùn)練,從而獲得一個(gè)具備可解釋性的準(zhǔn)確的線性預(yù)測(cè)模型。對(duì)個(gè)人用戶信息加工后得出最后評(píng)分結(jié)果。目前京東白條業(yè)務(wù)已面向全部用戶開(kāi)放,用戶申請(qǐng)開(kāi)通時(shí)京東會(huì)基于用戶消費(fèi)行為數(shù)據(jù),應(yīng)用大數(shù)據(jù)建模技術(shù)建立量化模型,實(shí)時(shí)評(píng)估違約風(fēng)險(xiǎn)和額度測(cè)算。京東白條可以得知白熱度信用評(píng)分主要基于用戶在京東商城注冊(cè)、瀏覽、下單、支付、配送、評(píng)價(jià)等的海量數(shù)據(jù),并結(jié)合用戶消費(fèi)和還款情況,深度挖掘用戶身份特征和偏好,評(píng)估用戶的履行能力,進(jìn)而預(yù)測(cè)用戶的信用風(fēng)險(xiǎn)水平。四、結(jié)語(yǔ)基于大數(shù)據(jù)的個(gè)人
溫馨提示
- 1. 本站所有資源如無(wú)特殊說(shuō)明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請(qǐng)下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請(qǐng)聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
- 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁(yè)內(nèi)容里面會(huì)有圖紙預(yù)覽,若沒(méi)有圖紙預(yù)覽就沒(méi)有圖紙。
- 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
- 5. 人人文庫(kù)網(wǎng)僅提供信息存儲(chǔ)空間,僅對(duì)用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對(duì)用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對(duì)任何下載內(nèi)容負(fù)責(zé)。
- 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請(qǐng)與我們聯(lián)系,我們立即糾正。
- 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶因使用這些下載資源對(duì)自己和他人造成任何形式的傷害或損失。
最新文檔
- 合同的補(bǔ)充協(xié)議
- 2025廣告制作合同范本
- 二零二五年度高性能混凝土工程供應(yīng)與施工服務(wù)合同3篇
- 二零二五版太陽(yáng)能光伏發(fā)電系統(tǒng)安裝及售后服務(wù)合同3篇
- 2025-2030年中國(guó)齒科材料行業(yè)發(fā)展現(xiàn)狀規(guī)劃研究報(bào)告
- 2025-2030年中國(guó)鎢精礦市場(chǎng)發(fā)展現(xiàn)狀規(guī)劃研究報(bào)告
- 二零二五年度林業(yè)生態(tài)補(bǔ)償項(xiàng)目承包協(xié)議4篇
- 2025-2030年中國(guó)鉬精礦市場(chǎng)深度評(píng)估及未來(lái)發(fā)展趨勢(shì)預(yù)測(cè)報(bào)告
- 2025-2030年中國(guó)金屬絲繩制造行業(yè)現(xiàn)狀分析與競(jìng)爭(zhēng)戰(zhàn)略研究報(bào)告
- 二零二五年度新能源儲(chǔ)能系統(tǒng)零部件采購(gòu)合同4篇
- 【智慧校園】-智慧校園系統(tǒng)方案
- 康佳液晶電視企業(yè)文化(課堂PPT)
- 個(gè)人養(yǎng)老金:是什么、怎么繳、如何領(lǐng)PPT個(gè)人養(yǎng)老金基礎(chǔ)知識(shí)培訓(xùn)PPT課件(帶內(nèi)容)
- 雞鴨屠宰生產(chǎn)企業(yè)安全風(fēng)險(xiǎn)分級(jí)管控資料
- 醫(yī)院感染管理組織架構(gòu)圖
- 《工程招投標(biāo)與合同管理》題庫(kù)試題及答案 共5套試卷
- 離子色譜法分析氯化物原始記錄 (1)
- 高等數(shù)學(xué)說(shuō)課稿PPT課件(PPT 49頁(yè))
- 造影劑腎病概述和性質(zhì)
- 單片機(jī)交通燈系統(tǒng)設(shè)計(jì)報(bào)告
- 標(biāo)桿房企人力資源體系研究之龍湖
評(píng)論
0/150
提交評(píng)論