銀行客戶的信用評級模型1_第1頁
銀行客戶的信用評級模型1_第2頁
銀行客戶的信用評級模型1_第3頁
銀行客戶的信用評級模型1_第4頁
銀行客戶的信用評級模型1_第5頁
已閱讀5頁,還剩23頁未讀, 繼續(xù)免費閱讀

下載本文檔

版權說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權,請進行舉報或認領

文檔簡介

1、目 錄內(nèi)容摘要IAbstractII1 導言11.1 研究背景11.2 國內(nèi)外研究現(xiàn)狀11.3 研究目的和意義31.4 研究思路及框架32 銀行客戶信用評級理論42.1 銀行客戶信用評級基本理論42.2 我國銀行信用評估現(xiàn)狀63 銀行客戶的信用評級模型實例研究83.1 數(shù)據(jù)處理與分析83.2 列聯(lián)表分析93.3 判別分析123.4 Logistic回歸分析164 結(jié)論204.1 研究結(jié)果204.2 研究不足與展望21參考文獻22附錄1:Logistic回歸對應R軟件代碼23附錄2:原始數(shù)據(jù)的前50個數(shù)據(jù)24致謝27內(nèi)容摘要:隨著經(jīng)濟的發(fā)展以及人民消費水平和觀念的改變,個人信貸的規(guī)模逐漸擴大,消

2、費貸款業(yè)務隨之迅速發(fā)展,個人信用風險受到了商業(yè)銀行和監(jiān)護者越來越多的關注。但相對于企業(yè)信用風險評估,個人信用風險評估顯得尤其薄弱,多數(shù)銀行基本依靠信貸人員的經(jīng)驗和定性分析來決定,面對業(yè)務量的不斷增長,信貸人員相對不足,傳統(tǒng)的授信措施造成了審批時間長,失誤上升,服務水平和管理風險的能力下降,導致銀行失去客戶和潛在客戶,不利于銀行競爭力的提高。尤其近年來,網(wǎng)上銀行的不斷發(fā)展,更是對傳統(tǒng)銀行帶來了不可控的沖擊,因此,構(gòu)建科學合理的個人信用評估模型顯得尤為重要。本文綜合考慮了國內(nèi)外信用風險評估的研究現(xiàn)狀以及研究成果,通過列聯(lián)表對定性數(shù)據(jù)進行關聯(lián)分析,并且運用判別分析對定量數(shù)據(jù)進行分類判別,再通過SPS

3、S軟件進行數(shù)據(jù)處理,確定相應的判別函數(shù),得出各個解釋變量對判別分類的影響,評估的結(jié)果可以作為銀行是否提供貸款的依據(jù)。另外,運用R軟件進行Logistic回歸,根據(jù)數(shù)據(jù)分析處理結(jié)果,確定回歸系數(shù),評估預測模型,進而運用到實際的信貸中,降低了銀行的信貸風險,保障銀行的長久健康發(fā)展。關鍵詞:信用風險評估;SPSS;判別分析;R;Logistic回歸Abstract:With the development of economy and people's consumption level and the change of the concept,Personal credit scale

4、expands gradually, consumer loan business with rapid development of personal credit risk by commercial Banks and care more and more attention. But relative to the enterprise credit risk evaluation, personal credit risk assessment is particularly weak, most basic rely on bank credit personnel experie

5、nce and qualitative analysis to determine, in the face of the growing business, relatively insufficient credit officers, the traditional credit measures caused a long time of examination and approval Error, service level and the ability to manage risk, Banks lose customers and potential customers, d

6、oes not favor the bank's ability to compete. Especially in recent years, the continuous development of online banking, but also the impact on the traditional bank brings uncontrollable, as a result, build a scientific and reasonable personal credit evaluation model is particularly important.Comp

7、rehensive consideration of the current research of credit risk assessment at home and abroad and the research results, through correlation analysis, contingency table for qualitative data and the use of discriminant analysis for quantitative data classification criterion, again through the SPSS soft

8、ware for data processing, determine the corresponding discriminant function, it is concluded that the explanatory variables influence on discriminant classification, the results of the assessment can be used as the basis of a bank loan. In addition, the logistic regression using R software, accordin

9、g to the results of data analysis, determine the regression coefficient, assess the prediction model, and then applied to the actual credit, reduce the bank's credit risk, safeguard the bank's long-term health development.Key Words: Credit risk assessment SPSS Discriminant analysis R Logisti

10、c regression1 導言1.1 研究背景巴塞爾新資本協(xié)議將商業(yè)銀行面臨的主要風險定義為信用風險、市場風險以及操作風險。其中,信用風險是最主要和最復雜的風險。信用風險可定義為銀行的借款人或交易對象不能按事先達成的協(xié)議履行義務的潛在可能性。信用風險管理的目標是通過將信用風險限制在可以接受的范圍內(nèi)而獲得最高的風險調(diào)整收益。信用風險中違約風險是主要因素之一。準確客觀的預測違約風險是規(guī)避信用風險的重要方式。特別是從2001年起,我國加入WTO世界貿(mào)易組織以來,國內(nèi)經(jīng)濟與國際經(jīng)濟聯(lián)系日益密切,資本市場也隨之開放,給國內(nèi)經(jīng)濟帶來了巨大的利益和風險。對我國銀行業(yè)來說,銀行的開放程度越來越強,面臨的風險

11、也越來越多。2008年,美國發(fā)生金融危機,信用泛濫并導致大量的次級按揭(次級貸款),并由此引發(fā)了華爾街金融風暴,使得國際銀行業(yè)深刻的意識到信用風險的重要性。由于全球化趨勢不斷加強,國內(nèi)推動利率市場化的步伐逐漸加快,同時,金融市場上的波動變大,商業(yè)銀行面臨著前所未有的信用風險挑戰(zhàn)。因此,2009年頒布了揭示全球銀行業(yè)風險管理的最新思想及技術的新資本協(xié)議框架完善建議。風險管理成為了現(xiàn)代銀行業(yè)管理的焦點。并且我國銀行的信貸業(yè)務是銀行的主要收入來源之一,因此信貸風險也是我國銀行面臨的主要風險,由于貸款個人信用缺失,導致銀行不良資產(chǎn)急劇增加,成為了銀行破產(chǎn)最常見的原因之一。面對越來越嚴峻的形式以及生存環(huán)

12、境,銀行必須制定一系列的措施來確保貸款信用安全性問題。有效科學的信用關系成為了銀行發(fā)展的重要因素。因此,這迫切要求我國銀行不斷研究風險管理方法,提高風險管理技術,完善風險管理制度。使用有效的評級模型對現(xiàn)代銀行經(jīng)營中存在的信用風險進行防范和控制,評判銀行對借款人的授信,對借款人的信用水平進行科學合理的評價,顯得尤為重要。1.2 國內(nèi)外研究現(xiàn)狀 國外研究現(xiàn)狀 在西方國家,個人信用已經(jīng)有一百多年的研究發(fā)展歷程。商業(yè)銀行也已經(jīng)經(jīng)過三百多年的發(fā)展歷程,形成了比較完善的風險管理體系。早在100對年前,美國提出信用評級這個概念。20世紀50年代,銀行的信用風險評價用傳統(tǒng)的主觀分析法,主要依靠專家的知識和經(jīng)驗

13、,對貸款的信用分先做出判斷。具有代表性的分析方法有專家分析法和CART風險分類法等。20世紀50年代后,隨著經(jīng)濟全球化的不斷推進,銀行面臨的金融風險也越來越復雜。為了削弱傳統(tǒng)經(jīng)驗分析方法的缺陷,提高定量評估和綜合分析,西方學者的研究方向轉(zhuǎn)為尋找合適的數(shù)學方法來解決信用風險中的定量評價問題。從上世紀80年代起,信用風險的評估從依靠銀行專家們的經(jīng)驗和主觀分析決定是否貸款,轉(zhuǎn)為基于財務指標的信貸評分模型。其中,Wiginton(1980)首次嘗試把Logistic回歸方法運用在信用評分模型中,并用判別分析方法做了對比。Makowski(1985)最早把決策樹方法運用在信用評分中,Coffman(19

14、86)將決策樹方法同判別分析做了對比,認為當變量之間存在相關性時,決策樹的方法明顯偏好。Mangasarian(1965)第一個將線性規(guī)劃方法嘗試用于分類問題。Desai等人用神經(jīng)網(wǎng)絡構(gòu)建了信用評分模型,并通過實證分析了神經(jīng)網(wǎng)絡的顯著優(yōu)勢。 國內(nèi)研究現(xiàn)狀從過往研究看,我國社會征信體系構(gòu)建緩慢,理論基礎和實例操作方面都相對落后。但是理論領域也有部分專家學者通過銀行數(shù)據(jù)進行信用評分模型,研究出了一定的成果。80年代后,國內(nèi)外一些專家開始用人工智能理論和神經(jīng)網(wǎng)絡理論等方法來研究信貸問題。而在我國,個人信用評估在一些地方體系不健全,缺少必要的信用評估機制和懲戒的規(guī)范機制。對個人信用評估十分薄弱,大部分

15、銀行基本是靠信貸員的經(jīng)驗和定性分析決定。隨著業(yè)務量大幅度上升,信貸人員的能力以及人員數(shù)量的缺乏,導致資產(chǎn)質(zhì)量的下降,失去潛在客戶,人為失誤上升,服務水平和風險管控能力下降,繼而失去潛在客戶,不利于銀行競爭力的提高。因此,為了幫助銀行提高個人授信效率,建立個人信用評估模型顯得尤為重要。近年來,銀行在防范和解決信貸風險方面做了大量的工作,強化信貸風險管理,取得了明顯的成績。1999年,中國建設銀行第一個實施個人信用等級評定辦法。通過銀行持卡人的學歷,收入,年齡,職業(yè)等14個指標,針對客戶還款能力和資信狀況等,設立了AAA、AA、A、BBB、BB、B、C七類個人信用等級。限定不同信用等級客戶不同的透

16、支額度。隨著2005年央行個人征信系統(tǒng)的聯(lián)網(wǎng)運行,商業(yè)銀行逐漸利用征信系統(tǒng)開展信用評分工作,建立了自己的信用評分體系,使得信用評估工作的發(fā)展越來越規(guī)范化。1.3 研究目的和意義信用風險是我國銀行業(yè)最核心的問題之一,有效的控制信用風險對銀行也來說意義重大。由于信用風險對銀行的重要性,通過科學的度量和有效的管理信用風險成為了銀行管理者迫切需要解決的問題。因此,降低銀行的信用風險,構(gòu)建科學合理的信用評估模型來預測銀行客戶的授信狀況,成為了研究的重點。因此,尋找合適的模型來進行信用評級尤為重要,通過客戶以往的信用歷史資料,利用信用風險評估模型,把客戶分為不同的信用等級,根據(jù)客戶的信用等級的高低,銀行可

17、以決定是否準予授信以及授信的額度和利率。個人信用評估綜合考察了個人以及家庭的內(nèi)外客觀原因,個人財產(chǎn),薪資待遇等,使用全面科學而嚴謹?shù)姆治龇椒?,對個人及家庭履約各種經(jīng)濟承諾的信用程度進行全面的評判和估計,為信貸決策提供科學依據(jù)。有利于銀行對自身資產(chǎn)狀況的妥善管理,也有利于借貸體系的建立和完善。提高資產(chǎn)利用率,促進經(jīng)濟和諧飛速的發(fā)展。1.4 研究思路及框架本文通過某銀行個人客戶的信貸數(shù)據(jù)為依據(jù),通過列聯(lián)表分析定性數(shù)據(jù)以及相互作用對是否違約的影響,并進行判別分析,研究定量數(shù)據(jù)對客戶違約狀況的研究。通過Logistic回歸,把定性與定量數(shù)據(jù)共同運用到模型中,分析各個變量對客戶違約狀況的影響。構(gòu)建合理的

18、信用評估模型。本文主要分為四章:第一章主要介紹了論文的研究背景、現(xiàn)狀及其研究方向。第二章分別介紹了銀行客戶信用評級的基本理論以及信用評級現(xiàn)狀。第三章通過某銀行借貸數(shù)據(jù)為依據(jù)進行實證分析,通過定性分析和定量分析以及定性分析和定量分析相結(jié)合的方式來評估信用模型。第四章總結(jié)概述,結(jié)合上文進行總結(jié)并指出論文的不足之處。研究思路如圖1.1所示。 圖1 研究流程圖2 銀行客戶信用評級理論2.1 信用評級基本理論2.2.1 信用及信用風險要了解信用評級模型,首先要了解信用以及信用風險的意義和特點。以下分兩方面分別對信用和信用風險進行概述。(1)信用在社會學中,信用理解為信任,在金融領域中,風險一般是指資產(chǎn)在

19、未來可能的損失值,但在社會心理學中,信用強調(diào)道德約束力。從經(jīng)濟的角度理解“信用”,它實際上是指“借”和“貸”的關系。這種賒銷行為是最早出現(xiàn)的“信用”。比如,銀行與企業(yè)、個人之間得信用是相互的。銀行要從企業(yè)與個人取得信用,提高自身信用使得企業(yè)和個人放心把錢存入銀行,也就是要向企業(yè)與個人借到錢,這是它們的生存之根基。同時,企業(yè)與個人也需要向銀行取得信用,即從銀行貸出相應的款額,企業(yè)用它解燃眉之急,或投資擴張等;個人用它應不時之需,提高生活質(zhì)量等。(2)信用風險不確定性即是風險,信用風險即是債務人與債權人之間關于履約狀況產(chǎn)生的不確定性。這種不確定性一般可以比較和衡量,它是一種流動的狀態(tài),受到經(jīng)濟主體

20、各方面的影響。同時,不確定性又劃分為外在不確定性和內(nèi)在不確定性,其中,外在不確定性多是由于全球經(jīng)濟影響、國家宏觀經(jīng)濟控制、行業(yè)經(jīng)濟波動、市場供需等方面。這些外在不確定性通常會沖擊整個市場,風險也難以規(guī)避。內(nèi)在不確定性往往由于主觀決策或者市場信息的不對稱,例如企業(yè)的生產(chǎn)規(guī)模、管理者的決策、產(chǎn)品的研發(fā)能力等因素。這種不確定性通??梢砸?guī)避。信用風險,又稱違約風險,是指債務人未能及時償還或未能全額償還債務時,給債權人造成的潛在損失。銀行客戶的信用風險即借款人由于各種原因未能及時足額償還銀行貸款而產(chǎn)生違約的可能性。發(fā)生違約的情況下,銀行必將由于未得到預期的收益而承擔財務上的損失。信用風險是金融市場中重要

21、的風險之一,巴塞爾銀行監(jiān)管委員會于1997年在有效銀行監(jiān)管的核心原則表示,信用風險是指交易對象無能力履約的風險,即債務人未能如愿及時償還其債務造成違約,進而給經(jīng)濟主體經(jīng)營帶來的風險。銀行方面的信用風險主要包括銀行對借款人調(diào)查的失誤,銀行風險識別能力有限,缺乏有效的信息披露制度,經(jīng)營改善狀況的動力不足。如何能夠有效的控制和改善銀行信用風險成為了銀行改革發(fā)展中的頭等大事。把握銀行體系中信用風險的主要原因,采取及時有目的性的防范措施,對于解決信用風險問題,保障經(jīng)濟健康發(fā)展有重要的意義。2.2.2 信用風險特征信用關系的普遍存在在一定程度上推動了市場經(jīng)濟的發(fā)展,因此,了解銀行客戶信用風險特征有利于管理

22、者有效管理。信用風險的特征分為非系統(tǒng)性、傳遞性和累積性、借貸雙方信息不對稱性、信用風險數(shù)據(jù)難以獲取性。信用風險的非系統(tǒng)性。盡管借款人的償債能力受到經(jīng)濟全球化影響,經(jīng)濟危機,國內(nèi)經(jīng)濟現(xiàn)狀等諸多不可控因素影響,但是最終決定償債能力的決定性因素仍是借款人自身的財務狀況、償還的意愿。信息風險的傳遞性和累積性。在市場交易活動中,尤其是企業(yè)交易活動中,某一方如果經(jīng)營困難,出現(xiàn)難以償還債務的情況,可能導致借款人各個關聯(lián)方企業(yè)都不能及時償還債務,進而導致更多的利益相關者的信用危機,產(chǎn)生了信用風險的傳遞鏈。而銀行作為整個信用鏈的“信號轉(zhuǎn)換器”,會受到更大的沖擊,使整個金融體系的崩潰,引發(fā)金融危機。借貸雙方的信息

23、不對稱。銀行的信貸業(yè)務中如果出現(xiàn)交易雙方信息不對稱現(xiàn)象,會導致整個金融市場的有效性降低,加大金融危機發(fā)生的肯能性。對于企業(yè)來說,如果企業(yè)向銀行申請借款時提供的信息有選擇性,規(guī)避了企業(yè)的不利信息,導致銀行不能全面掌握企業(yè)的真實情況,貸款定價和企業(yè)自身的風險程度不對等,那么將損害銀行的利益。對于個人來說,如果個人借貸提供的信息與真實信息不符,那么銀行有可能提供過多但個人無力償還的貸款額。信用風險數(shù)據(jù)難以獲取性。在我國,數(shù)據(jù)庫信息量少,信用產(chǎn)品交易的市場缺乏,難以獲取所需的信用風險數(shù)據(jù),限制了對信用風險評估模型的研究。 信用風險的特點(1)風險的潛在性。由于信息的不對稱性,很多企業(yè)不考慮自身的還款能

24、力,一味的增加企業(yè)的資產(chǎn)和負債,這種高負債的狀況造成了銀行效益下降,潛在的風險與日俱增,給銀行長久發(fā)展帶來隱患。(2)風險的長期性。企業(yè)或個人在對銀行借款時缺乏信用觀念,而觀念的轉(zhuǎn)變是一個長期的、潛移默化的過程。培養(yǎng)銀行與企業(yè)和個人之間的“契約”規(guī)則,建立有效而合理的信用體系,需要幾代人共同付出努力。(3)風險的破壞性。企業(yè)和個人需要樹立正確的信貸觀念,社會需要規(guī)范并加強思想道德建設。如果思想道德敗壞了,整個金融行業(yè)會越變越糟。不良資產(chǎn)一旦形成,如果企業(yè)本著合作的態(tài)度,雙方的損失也會降低到最低限度;但如果企業(yè)選擇不聞不問、能躲則躲的方式,使銀行耗費了大量的人力、物力、財力,同時也不能彌補所受的

25、損失。(4)控制的艱巨性。當前銀行對不良資產(chǎn)的處理措施,都存在滯后性,這即同銀行對不良資產(chǎn)的界定有關,也同銀行信貸風險預測機制、轉(zhuǎn)移機制、控制機制沒有完全統(tǒng)一有關。不良資產(chǎn)的補救措施行動遲緩,常常會造成難以彌補的損失。2.2 銀行客戶信用評估現(xiàn)狀信用評估方法可分為定性分析和定量分析。最早的個人信用評估通常采用定性分析,根據(jù)評估者主管評判來確定等級。主要的方法有3C評價原則和5C評價原則兩種。其中3C評價原則主要包括品行、能力、抵押擔保;5C評價原則包括品行、能力、抵押擔保、條件、資產(chǎn)。由于對評估人的能力和經(jīng)驗要求都相當高,并且對貸款人的個人信用難以全面有效評價,這種評價方法使用逐漸減少。隨著數(shù)

26、學在統(tǒng)計中的應用和統(tǒng)計方法的量化發(fā)展以及推廣,個人信用評估引進了定量分析。定量分析根據(jù)借款人以往信用記錄為依據(jù),使授信決策自動化。因為用這樣客觀的方法來反應借款人的信用狀況更加合理,使得更多的統(tǒng)計方法被使用。目前經(jīng)常使用的統(tǒng)計方法有判別分析、logistic分析、決策樹法、神經(jīng)網(wǎng)絡等。這些方法各有優(yōu)缺點,但是與定性分析相比,大大提高了評價模型的準確性。 定性方法“5C”分析法是一種可以確定信用可靠性的分析方法。它主要依靠經(jīng)驗豐富和判斷能力強的評估人對借款人的還款能力和意愿進行評估?!?C”是指:品行、能力、資本、條件、擔保物。品行是指借款人的信用狀況和能否按照借款合同準時足額償還債務的意愿。這

27、是保障信貸安全的首要因素。對于我國的個人信用現(xiàn)狀來說,品行決定這貸款的質(zhì)量。能力是指借款人有沒有償還借款金額的能力,通常根據(jù)借款人的收入狀況、消費狀況、債務水平等財務狀況來衡量。資本是個人或家庭的資產(chǎn)狀況,表示借款人的收入出現(xiàn)突發(fā)狀況時,用來償還債務的其他途徑。擔保是指為借款人有第三方人格擔保,能夠為貸款提供除了借款人收入和資本之外的還款保障。條件是指周圍環(huán)境狀況,主要包括貸款人的就業(yè)狀況、經(jīng)濟狀況、社會關系等?!?C”判別法主觀性強,受評估人的影響巨大,得出的結(jié)論科學相對性差。有可能會把一些信用良好,潛力大的借款人拒之門外,不利于銀行資產(chǎn)合理有效的運用,降低了金融市場資本流動性。2.2.2

28、定量方法定量分析方法實際上是通過客戶的歷史資料,利用一定的信用評分模型,判斷不同客戶不同的信用等級,以及是否授信和授信額度等。個人信貸狀況主要是根據(jù)自身的物質(zhì)條件來具體分析的。先分析影響個人信貸狀況的因素:收入水平的高低,對于個人的信貸狀況影響深遠,個人收入水平是用來衡量個人是否具有履約能力的重要指標。這里所研究的收入是居民的合法收入。個人收入月支出比例,月支出比率反映了借款人收入與支出流動性的比率。 除了上述主要因素,婚姻狀況,年齡,以往貸款情況、個人所處行業(yè)等,都是衡量個人資信狀況的重要參考指標。分析各個因素之后,利用借款人的信用記錄,通過判別分析、logistic分析、決策樹法、神經(jīng)網(wǎng)絡

29、等統(tǒng)計分析方法來建立模型,評判借款人違約狀況。3 銀行客戶的信用評級模型實例研究3.1 數(shù)據(jù)處理與分析以某商業(yè)銀行個人房貸信息為例,收集數(shù)據(jù)163個,我們以其中隨機抽取的150個為例,通過客戶申請金額,月供金額,償債比率值,月支出收入比,申請人收入,年齡,婚姻狀況,人行征信狀況,產(chǎn)品個數(shù)等來對個人房貸的征信狀況進行分析,以求得出可靠的評級模型。 描述性分析表1樣本類型及分類表屬性類型屬性名稱類型及含義貸款本身申請金額x1連續(xù),客戶貸款審批金額,101300萬月供金額x11連續(xù),客戶每個月需要的還款金額,1306.4946700.67償債比率值 x2 連續(xù),客戶的償債能力指標,00.538客戶本

30、身月支出收入比x3連續(xù),客戶的償債能力指標,00.66申請人年收入x4連續(xù),主副申請人年收入,4.8240萬年齡 x5連續(xù),申請人年齡,2160歲 婚姻狀況 x6離散,已婚,離婚,未婚人行政信用狀況 x7離散,良好,違約,無記錄產(chǎn)品個數(shù) x10客戶是否申請過該銀行的其他貸款,13個建筑本身建筑面積x8連續(xù),51.16883.1平米樓齡x9連續(xù),231年 確定相關參數(shù)在處理數(shù)據(jù)的過程中,對于定性變量;設置婚姻狀況x6 :已婚(M)為1,未婚(S)為2,離婚(D)為3設置征信狀況x7:良好(G)為1 ,違約(F)為2 ,無記錄(N)為33.2 列聯(lián)表分析為了對數(shù)據(jù)進行分析,我們引入了列聯(lián)表。列聯(lián)表

31、是由兩個或兩個以上變量交叉分類的頻數(shù)分布表,考察各屬性之間有無關聯(lián)。運用列聯(lián)表,除了可以對單個變量的數(shù)據(jù)分布情況進行分析外,還可以掌握多個變量在不同取值情況下的數(shù)據(jù)分布情況,從而進一步深入分析不同類型變量之間的關聯(lián)系數(shù),計算某些特殊的統(tǒng)計量。對此,引入了SPSS對個別數(shù)據(jù)進行列聯(lián)表分析。已知名義變量中:是否違約是y(“0”=不違約,“1”=違約),婚姻狀況x6(“1”=已婚,“2”=未婚,“3”=離婚),人行征信狀況x7(“1”=良好,“2”=違約,“3”=無記錄)。下面我們逐個分析其他變量對是否違約的影響。(1)人行征信狀況x7對客戶違約狀況y的影響。 對數(shù)據(jù)進行列聯(lián)表分析時,選取Analy

32、ze下的Descriptive Statistics 選項中的Crosstabs 表2樣本分類以及對應百分比表Crosstab客戶違約狀況Total不違約違約人行征信狀況良好Count1083111% within 人行征信狀況97.3%2.7%100.0% of Total72.0%2.0%74.0%違約Count14014% within 人行征信狀況100.0%.0%100.0% of Total9.3%.0%9.3%無記錄Count24125% within 人行征信狀況96.0%4.0%100.0% of Total16.0%.7%16.7%TotalCount1464150% wi

33、thin 人行征信狀況97.3%2.7%100.0% of Total97.3%2.7%100.0% 由上表可以看出,在人行征信狀況良好、違約、無記錄的情況下,客戶違約的個數(shù)以及對應的百分比??梢钥闯?,人行征信狀況良好、違約、無記錄的情況下客戶不違約的個數(shù)分別是108、14、24,對應的違約個數(shù)是3、0、1 。表3卡方檢驗表Chi-Square TestsValuedfAsymp. Sig. (2-sided)Pearson Chi-Square.555a2.758Likelihood Ratio.9062.636Linear-by-Linear Association.0381.845N o

34、f Valid Cases150a. 3 cells (50.0%) have expected count less than 5. The minimum expected count is .37. 在本文中,列聯(lián)表對應的卡方檢驗中,原假設為:人行征信狀況和客戶違約狀況兩屬性獨立。由Crosstabs 中Statistics 下的Chi-square ,Eta選項可得到以上圖表,根據(jù)第一個表中的結(jié)果,一致性的卡方檢驗(Likelihood Ratio的統(tǒng)計量)的sig=0.636>0.05,接受了原假設,即認為對違約狀況這個屬性來說,人行征信狀況取良好、違約、無記錄對客戶違約狀況沒

35、有影響。(2)婚姻狀況x6對客戶違約狀況y的影響用同樣的方法進行婚姻狀況已婚、未婚、離婚、喪偶對客戶違約狀況的影響進行分析。表4樣本分類表Crosstab客戶違約狀況Total不違約違約婚姻狀況已婚Count1134117% within 婚姻狀況96.6%3.4%100.0% of Total75.3%2.7%78.0%續(xù)表4樣本分類表Crosstab婚姻狀況未婚Count15015% within 婚姻狀況100.0%.0%100.0% of Total10.0%.0%10.0%離婚Count18018% within 婚姻狀況100.0%.0%100.0% of Total12.0%.0

36、%12.0%TotalCount1464150% within 婚姻狀況97.3%2.7%100.0% of Total97.3%2.7%100.0%表5卡方檢驗表Chi-Square TestsValuedfAsymp. Sig. (2-sided)Pearson Chi-Square1.159a2.560Likelihood Ratio2.0182.365Linear-by-Linear Association1.0161.313N of Valid Cases150a. 3 cells (50.0%) have expected count less than 5. The minimu

37、m expected count is .40.同上,在列聯(lián)表對應的卡方檢驗中,原假設為:婚姻狀況和客戶違約狀況兩屬性獨立。由第一張圖看出不同的婚姻狀況下客戶違約的人數(shù)及對應的百分比,在既定的150樣本下。有第二個表分析了一致性的卡方檢驗(Likelihood Ratio的統(tǒng)計量)的sig=0.365>0.05,接受了原假設,即認為婚姻狀況這個屬性對客戶是否違約是無影響的。3.3 判別分析判別分析主要目的是判別一個個體所屬類別,得到相應的函數(shù)關系式。當被解釋變量是屬性變量時,判別分析是一種常用的多元統(tǒng)計分析方法。判別分析能夠解決被解釋變量是兩組或者多組的情況,當被解釋變量是兩組的情況下,

38、稱作兩組判別分析,當解釋變量是三組或者更多組時,稱作多組判別分析。判別分析的假設之一,每一個判別變量(解釋變量)不能是其他判別變量的線性組合,因為為其他變量線性組合的判別變量不能提供新的信息,更重要的是在這種情況下無法估計判別函數(shù)。不僅如此,有時一個判別變量與另外的判別變量高度相關,或與另外的判別變量的線性組合高度相關,雖然能夠求解,但是參數(shù)估計的標準誤將變大,以至于參數(shù)估計統(tǒng)計上不顯著。這就是通常所說的多重共線性問題。判別分析的假設之二,各組變量的協(xié)方差矩陣相等。判別分析最簡單和最常見的形式是采用線性判別函數(shù),他們是判別變量的簡單線性組合。在各組協(xié)方差矩陣相等的假設條件下,可以使用簡單的公式

39、來計算判別函數(shù)和進行顯著性檢驗。判別分析的假設之三,各判別變量之間具有多元正態(tài)分布,即每個變量對于所有其他變量的固定值有正太分布。在這種條件下可以精確計算顯著性檢驗值和分組歸屬的概率。當違背該假設時,計算的概率將非常不準確。我們選取解釋變量:申請金額、申請人年收入、年齡、建筑面積、樓齡、產(chǎn)品個數(shù)和月供金額對客戶違約情況進行判別分析。通過用SPSS軟件中Analyze下的Classify Discriminant進行判別分析。以下是判別分析的結(jié)果。表6樣本缺失值檢驗表Analysis Case Processing SummaryUnweighted CasesNPercentValid1501

40、00.0ExcludedMissing or out-of-range group codes0.0At least one missing discriminating variable0.0Both missing or out-of-range group codes and at least one missing discriminating variable0.0Total0.0Total150100.0上圖為有效樣本量及變量缺失值圖。由上圖看出,數(shù)據(jù)有效值為150,即不存在無效數(shù)據(jù)。表7各組均值顯著性檢驗表Tests of Equality of Group MeansWilks

41、' LambdaFdf1df2Sig.申請金額.997.4931148.484償債比率值.9921.2571148.264月支出收入比.996.5891148.444申請人年收入.999.1891148.665年齡1.000.0301148.863建筑面積.996.6611148.417樓齡.997.3891148.534產(chǎn)品個數(shù).999.1991148.656月供金額.999.0901148.765由上圖可知各組變量的均值是否相等,包括Wilks lambda ,F(xiàn)統(tǒng)計量和它的自由度以及顯著性水平。原假設即各組變量的均值相同。其中Wilks lambda 是組內(nèi)平方和與總平方和之比,

42、取值范圍在01 。值越小越表示組間的差異很大。反之,越接近1越表示沒有組間差異。而F統(tǒng)計量表示組間均方與組內(nèi)均方的比值。自由度df1 表示分子自由度 df2表示分母自由度,用來取得顯著性水平。顯著性水平Sig.越小越表示組間差異顯著,反之越大表示組間差異不顯著??梢钥闯龈骶抵挟a(chǎn)品個數(shù)在0.05的置信度下有顯著差異,其他各個解釋變量均組間不顯著,即無顯著差異。表8判別函數(shù)特征根表EigenvaluesFunctionEigenvalue% of VarianceCumulative %Canonical Correlation1.044a100.0100.0.405a. First 1 can

43、onical discriminant functions were used in the analysis. 上圖分析典型判別函數(shù),可以看出判別函數(shù)的特征值0.044,方差百分比100%,累計百分比100%和典型判別函數(shù)的典型相關系數(shù)0.405。且只有一個典型判別函數(shù)。表9判別函數(shù)顯著性檢驗表Wilks' LambdaTest of Function(s)Wilks' LambdaChi-squaredfSig.1.9586.1579.007 上圖是對判別函數(shù)的顯著性檢驗,由Wilks' Lambda檢驗,認為在0.1的顯著性水平下是顯著的。表10標準化判別函數(shù)系數(shù)

44、表Standardized Canonical Discriminant Function CoefficientsFunction1申請金額.491償債比率值-.310月支出收入比.592申請人年收入.560年齡.029建筑面積.562樓齡-.380產(chǎn)品個數(shù).245月供金額-1.167由上表可得出標準化判別函數(shù)系數(shù)由此得知標準化的判別函數(shù),表示為:y=(0.491)*x1+(-0.310)*x2+(0.592)*x3+(0.560)*x4+(0.029)*x5+(0.562)*x8+(-0.380)*x9+(0.245)*x10+(-1.167)*x11表11各組分類過程表Classific

45、ation Processing SummaryProcessed150ExcludedMissing or out-of-range group codes0At least one missing discriminating variable0Used in Output150表12各組先驗概率表Prior Probabilities for Groups客戶違約狀況PriorCases Used in AnalysisUnweightedWeighted不違約.500146146.000違約.50044.000Total1.000150150.000表13分類函數(shù)系數(shù)表Classifi

46、cation Function Coefficients客戶違約狀況不違約違約申請金額5.961E-73.980E-8償債比率值15.16417.431月支出收入比13.9389.282申請人年收入2.011E-62.732E-7年齡.631.626建筑面積.026.017樓齡.393.533產(chǎn)品個數(shù)21.84020.353月供金額.000.000(Constant)-30.465-29.076Fisher's linear discriminant functions上兩個圖為分類的統(tǒng)計結(jié)果,第一張圖概括了分類過程,說明150個觀測都參與了分類。第二張圖說明各組的先驗概率。第三張圖表

47、示各組的分類函數(shù),也成為費歇線性判別函數(shù),由表中的結(jié)果可以說明:y=0這組的分類函數(shù)是f1=-30.465+5.961E-7*x1+15.164*x2+13.938*x3+2.011E-6*x4+0.631*x5+0.026*x8+0.393*x9+21.84*x10y=1這組的分類函數(shù)是f2=-29.076+3.980E-8*x1+17.431*x2+9.282*x3+2.732E-7*x4+0.626*x5+0.017*x8+0.533*x9+20.353*x10表14判別結(jié)果圖Classification Resultsb,c客戶違約狀況Predicted Group Membershi

48、pTotal不違約違約OriginalCount不違約11828146違約224%不違約80.819.2100.0違約50.050.0100.0由上表可知,客戶不違約(y=0)的樣本共有146個,其中118個被判別正確,客戶違約(y=1)的樣本共有4個,其中有2個被判別正確,通過運用判別分析共有120個被判別正確,從而有120/150=80%的原始數(shù)據(jù)被判別正確。即原始分組的正確判別率為80%。所以可以認為判別分析對于客戶是否違約的分類有一定的作用。3.4 Logistic回歸分析Logistic回歸分析是一種切實有效的數(shù)據(jù)處理分析方法,并且在經(jīng)濟學醫(yī)學生物學等都得到了廣泛的應用。其中,主要的

49、原因是:Logistic回歸模型是處理分類數(shù)據(jù)以及連續(xù)數(shù)據(jù)強有力的工具,且對解釋變量幾乎沒有任何的限制。分析的目的是挖掘數(shù)據(jù)中潛在的信息,用定量的方法來衡量解釋變量對被解釋變量的影響及影響程度。為現(xiàn)實生活中的預測提供科學的計算方法,為決策者提供相對準確的信息,幫助各種決策的制定和計劃的實施。由上文知選出了150個樣本作為統(tǒng)計分析的數(shù)據(jù)。在用Logistic回歸分析數(shù)據(jù)前,把數(shù)據(jù)隨機分為100個為一份,作為訓練集來建立模型,另外50個樣本作為測試集來評估模型的預測能力,進而判斷各個因素的作用下,模型求得是是否違約狀況與真實狀況的比較。運用R處理分析數(shù)據(jù),得出各個解釋變量同客戶違約狀況的影響程度盒

50、狀圖。圖2 盒狀圖從圖中可以對解釋變量進行描述性分析:(1)申請金額(x1),申請人年收入(x4),年齡(x5),建筑面積(x8),樓齡(x9),產(chǎn)品個數(shù)(x10)與客戶是否違約不存在明顯的關系。(2)根據(jù)盒狀圖中對應的中位數(shù)刻度線,違約客戶的償債比率值(x2),明顯低于沒有違約的客戶對應的償債比率值。(3)同理,對應的月支出收入比(x3),違約客戶的月支出收入比明顯高于沒有違約的月支出收入比。為了對解釋變量的顯著性進行檢驗,用似然比檢驗來檢驗模型的整體顯著性:表15異常分析表 Model 1: y 1 Model 2: y x1 + x2 + x3 + x4 + x5 + x6 + x7 + x8 + x9 + x10 + x11 Resid. Df Resid.Dev Df Deviance 1 99 26.94842 88 6.5287 11 20.42進而得到似然比檢驗的卡方統(tǒng)計量對應的P值:由P<0.05說明,該模型整體高度顯著,也就意味著11個被解釋變量中,至少有一個解釋變量與客戶違約狀況相關,也就是說,至少有一個解釋變量對客戶違約狀況具備一定的預測能力。為了分析哪個解釋變量對客戶違約狀況有影響,進行了方差分析如圖:表16方差分析表Response: yLR ChisqDf Pr(>Chisq)x1 6.4877 10.010862

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預覽,若沒有圖紙預覽就沒有圖紙。
  • 4. 未經(jīng)權益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負責。
  • 6. 下載文件中如有侵權或不適當內(nèi)容,請與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

評論

0/150

提交評論