數據挖掘在公積金異常提取中的應用研究_第1頁
數據挖掘在公積金異常提取中的應用研究_第2頁
數據挖掘在公積金異常提取中的應用研究_第3頁
數據挖掘在公積金異常提取中的應用研究_第4頁
全文預覽已結束

下載本文檔

版權說明:本文檔由用戶提供并上傳,收益歸屬內容提供方,若內容存在侵權,請進行舉報或認領

文檔簡介

1、 數據挖掘在公積金異常提取中的應用研究 張 松1 趙 泊1 徐 佳2摘要:大數據時代,數據挖掘方法已經被很多人熟悉和應用,此類模型算法也越來越多地應用在系統(tǒng)中。本文簡述了三種異常數據挖掘方法,探索在公積金提取業(yè)務中建立異常數據挖掘模型,尋找公積金異常提取業(yè)務,進一步探索公積金提取中的騙提、套取行為,以保護廣大繳存人的利益,保衛(wèi)住房資金安全,維護住房公積金正常的管理秩序。關鍵詞:異常數據挖掘;提?。蛔》抗e金;大數據數據挖掘應用于異常提取在大數據時代,數據挖掘“啤酒和尿布”的故事幾乎已經家喻戶曉,但數據挖掘還有一個專門方向異常數據挖掘,又稱離群點分析或偏差檢測。人們在數據分析中,經常碰到少量數據

2、,它與一般行為或模式不同,我們稱之為“異常數據”,異常數據不完全意味著錯誤或欺詐,但很可能預示著問題。異常的出現可能是體系本身背后隱藏的某種較強的未知力量作用的結果。通過識別、分析,往往能發(fā)現許多意想不到的新問題,新知識,從而幫助我們更深入地了解研究對象,發(fā)現問題,進而解決問題。此外,關注異常數據本身往往非常有意義。異常數據挖掘可以發(fā)現信用卡的欺詐交易、股市的操控行為、會計信息的造假、洗錢、保險欺詐、違規(guī)交易等。此外,審計也需要經常對異常數據進行審查。異常數據挖掘對公積金違規(guī)提取的研究意義住房公積金是國家規(guī)定的住房社會保障制度,它由單位和職工共同繳存的長期住房儲金組成,是住房分配貨幣化的主要形

3、式。其業(yè)務主要有歸集、提取、貸款發(fā)放和回收等。其中,提取業(yè)務涉及面廣,業(yè)務量大,自由度高,違規(guī)風險大。因而,在實際中有一些公積金套取、騙提情況發(fā)生,這不僅侵害了廣大公積金繳存人的利益,而且威脅住房資金的安全,也擾亂公積金的正常管理秩序。本文探索使用異常數據挖掘方法,分析公積金的異常提取,找出提取業(yè)務中不易被監(jiān)管者發(fā)現的違規(guī)提取。如:職業(yè)代辦人惡意套取、少量職工違規(guī)提取、個別政策漏洞、程序測試漏洞、經辦人操作失誤等。而監(jiān)管者有必要對此類異常數據進行進一步調查,以發(fā)現造成異常的原因,從而堵住提取漏洞,防控風險。異常數據挖掘模型1:benford定律檢測異常提取benford定律又稱首位數現象。它通

4、過分析業(yè)務金額中首位、第二來自ww位數字出現概率的分布,來判斷提取業(yè)務中有無欺詐。我來自www.lw5u.com們將每一個管理部,每種提取原因的提取業(yè)務數據集作為研究對象。計算出每個研究對象第一、第二位數字出現概率與所有提取業(yè)務第一、第二位數字出現概率平均值的差異度,發(fā)現離群研究對象,找出差異值最大的前幾名作為異常提取風險的指引,有針對性的指導審查異常提取。異常數據挖掘模型2:關聯規(guī)則檢測異常提取簡單地說,關聯規(guī)則就是找出兩個事物隱藏關系的數學方法。它通過定量化的數學模型,計算出x和y共同發(fā)生的概率,以及x的出現對y的出現有多大的影響。在公積金提取業(yè)務中,為了方便廣大職工,規(guī)定可由他人代理職工

5、提取公積金??梢哉f,該政策方便了廣大群眾,降低了群眾的提取成本。但是,也出現個別“職業(yè)代辦人”,即個別中介,代理不符合條件的職工違規(guī)提取公積金,并從中賺取手續(xù)費。針對此類問題,可以使用關聯規(guī)則繪制出關聯關系圖,它可以找出提取業(yè)務數據中隱藏的關聯和關系網,挖掘出隱藏在數據間的異常關系。按照數據的關聯關系找到違規(guī)提取。具體的,我們可以通過繪制關聯關系圖找出哪些經辦人嫌疑最大,哪類提取業(yè)務異常提取的風險最大。異常數據挖掘模型3:業(yè)務突增(業(yè)務數量、金額突增)預警模型一般的,在法規(guī)政策、管理制度,大病患病率等條件穩(wěn)定的前提下,每個季度,各類提取業(yè)務的提取數量和金額應該保持相對穩(wěn)定,不應大起大落。如果某

6、類“提取業(yè)務數量”、“提取業(yè)務總金額”某季度出現突然大幅度增加,那么,我們認為出現了異常。通過找出業(yè)務突增(業(yè)務數量、金額劇烈變化)的情況,預判提取業(yè)務的異常?;谶@個思路,一個時間段內各類提取、每季度提取總金額環(huán)比突增的前幾名可作為我們審計、風險和合規(guī)檢查的工作切入點。異常數據挖掘模型的匯總應用應當注意,異常數據的深層原因是體系背后隱藏的某種較強的未知力量的作用,異常數據并不能百分之百的證明該筆提取業(yè)務或經辦人有違規(guī)或舞弊。只能說異常數據預示著該筆業(yè)務有較大異常的風險,因而可以作為監(jiān)管、審計、風險工作的切入點和線索,輔助異常審查工作,進而提供一種有科學依據、可模型化、量化的方法輔助糾正工作偏差。參考文獻:1安利平,張松,仝凌云. 基于決策樹的olam及其應用研究j. 計算機工程與設計,2008(05).2何京玉.新一輪競

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯系上傳者。文件的所有權益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網頁內容里面會有圖紙預覽,若沒有圖紙預覽就沒有圖紙。
  • 4. 未經權益所有人同意不得將文件中的內容挪作商業(yè)或盈利用途。
  • 5. 人人文庫網僅提供信息存儲空間,僅對用戶上傳內容的表現方式做保護處理,對用戶上傳分享的文檔內容本身不做任何修改或編輯,并不能對任何下載內容負責。
  • 6. 下載文件中如有侵權或不適當內容,請與我們聯系,我們立即糾正。
  • 7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

評論

0/150

提交評論