版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進(jìn)行舉報或認(rèn)領(lǐng)
文檔簡介
數(shù)學(xué)建模醫(yī)保欺詐模型的主動發(fā)現(xiàn)數(shù)學(xué)建模醫(yī)保欺詐模型的主動發(fā)現(xiàn)數(shù)學(xué)建模醫(yī)保欺詐模型的主動發(fā)現(xiàn)資料僅供參考文件編號:2022年4月數(shù)學(xué)建模醫(yī)保欺詐模型的主動發(fā)現(xiàn)版本號:A修改號:1頁次:1.0審核:批準(zhǔn):發(fā)布日期:全國大學(xué)生數(shù)學(xué)建模競賽選拔賽承諾書我們完全明白,在競賽開始后參賽隊員不能以任何方式(包括電話、電子郵件、網(wǎng)上咨詢等)與隊外的任何人(包括指導(dǎo)教師)研究、討論與賽題有關(guān)的問題。我們知道,抄襲別人的成果是違反競賽章程和參賽規(guī)則的,如果引用別人的成果或其他公開的資料(包括網(wǎng)上查到的資料),必須按照規(guī)定的參考文獻(xiàn)的表述方式在正文引用處和參考文獻(xiàn)中明確列出。我們鄭重承諾,嚴(yán)格遵守競賽章程和參賽規(guī)則,以保證競賽的公正、公平性。如有違反競賽章程和參賽規(guī)則的行為,我們將受到嚴(yán)肅處理,并取消參賽資格。我們參賽選擇的題號是(從A/B/C/D中選擇一項填寫):A參賽隊員(打印后再手簽)::1.2.3.指導(dǎo)教師或指導(dǎo)教師組負(fù)責(zé)人(沒有可不填寫): (論文紙質(zhì)版與電子版中的以上信息必須一致,只是電子版中無需簽名。以上內(nèi)容請仔細(xì)核對,提交后將不再允許做任何修改。如填寫錯誤,論文可能被取消評獎資格。)日期:2015年7月29日
醫(yī)保欺詐的主動發(fā)現(xiàn)摘要醫(yī)療保險是關(guān)系到國計民生和國家發(fā)展的重大問題,醫(yī)保欺詐問題嚴(yán)重威脅醫(yī)?;鸢踩恋K醫(yī)保政策的有效實施,因此醫(yī)保欺詐行為的主動發(fā)現(xiàn)對醫(yī)療保險的發(fā)展、完善和社會穩(wěn)定發(fā)展有重大的意義。本提出了一種基于BP神經(jīng)網(wǎng)絡(luò)的識別的鑒別醫(yī)保欺詐行為的方法。對于數(shù)據(jù)的處理,我們選擇了Excel和Access根據(jù)病人ID將表病人資料和表費用明細(xì)表進(jìn)行了匯總和歸一,并剔除了包括記錄不完整、格式錯誤之內(nèi)的無效數(shù)據(jù),在這個過程中我們發(fā)現(xiàn)了所有的消費記錄只是買藥,并且在這個月的消費記錄中只有極少數(shù)病人存在轉(zhuǎn)科室行為,而且一部分病人是自費的,沒有醫(yī)保欺詐嫌疑,還有一些病人存在多人共用醫(yī)??ǖ默F(xiàn)象,直接確定其為醫(yī)保欺詐,這些病人的消費記錄為我們訓(xùn)練BP神經(jīng)網(wǎng)絡(luò)提供了樣本支持。對于這個問題,我們首先用Excel和Access從大量的數(shù)據(jù)中篩選出了對欺詐識別有用的信息,其中包括病人的年齡,性別,所在科室,當(dāng)月總消費以及當(dāng)月消費頻率等等你,又考慮到不同科室的消費情況存在差異因此我們求出了各個科室的平均消費額,并且做出了每個病人當(dāng)月的消費對對應(yīng)科室平均消費的相對差。有了這些欺詐因子和自費患者以及共用醫(yī)??ɑ颊叩南M記錄,我們建立了Logistic二元回歸模型,來評估各個欺詐因子對欺詐的可能性大小的影響進(jìn)而剔除了對欺詐可能性無效的欺詐因子,保留了對欺詐可能性影響顯著的欺詐因子作為輸入向量對BP神經(jīng)進(jìn)行訓(xùn)練,并且用訓(xùn)練后的網(wǎng)絡(luò)對醫(yī)保病人進(jìn)行了欺詐識別。最終我們認(rèn)為輸出結(jié)果為1的病人具有重大醫(yī)保欺詐嫌疑。關(guān)鍵詞醫(yī)保欺詐Logistic二元回歸BP神經(jīng)網(wǎng)絡(luò)數(shù)據(jù)
問題重述問題背景醫(yī)療保險是為解決公民或勞動者因為疾病和非因公負(fù)傷,喪失勞動能力后的治療費用及服務(wù),給予物質(zhì)幫助的一種社會保險制度。醫(yī)療保險欺詐行為是指違反醫(yī)療保險管理法規(guī)和政策,采用虛構(gòu)事實、隱瞞真相以及其他方法,向醫(yī)?;鸸芾頇C構(gòu)騙取醫(yī)?;鸹蜥t(yī)保待遇的行為。這一行為具有兩個基本特征:一是主觀表現(xiàn)為直接故意,并且以非法占有醫(yī)?;鸹蚍欠ǐ@得醫(yī)保待遇為目的,二是實施手段主要是通過虛構(gòu)事實和隱瞞真相,即故意虛構(gòu)未曾發(fā)生的保險事故,或者對發(fā)生的保險事故編造虛假的原因或者夸大損失程度,以達(dá)到騙取醫(yī)療保險基金或醫(yī)療保險待遇的目的。我國自城鎮(zhèn)職工醫(yī)療保險和新農(nóng)村合作醫(yī)療制度實施以來,欺騙醫(yī)?;鸬陌讣粩喟l(fā)生,事實上,醫(yī)療保險欺詐在許多國家每年都有數(shù)億美元的損失,對醫(yī)?;鸢踩珮?gòu)成了重大的威脅,妨礙了各國醫(yī)保政策的實施,因此醫(yī)療保險欺詐已成為各國非常重視的社會問題利用數(shù)學(xué)建模的方法分析醫(yī)療保險欺詐行為,建立相應(yīng)的數(shù)學(xué)模型可為發(fā)現(xiàn)醫(yī)療保險欺詐問題提供科學(xué)有力的依據(jù)。問題描述醫(yī)療保險欺詐行為具有兩個基本特征:一是主觀表現(xiàn)為直接故意,并且以非法占有醫(yī)?;鸹蚍欠ǐ@得醫(yī)保待遇為目的;二是實施手段主要是通過虛構(gòu)事實和隱瞞真相,即故意虛構(gòu)未曾發(fā)生的保險事故,或者對發(fā)生的保險事故編造虛假的原因或者夸大損失程度,以達(dá)到騙取醫(yī)療保險基金或醫(yī)療保險待遇的目的。騙保人進(jìn)行醫(yī)保欺詐時通常使用的手段有冒用他人醫(yī)療保險證、卡就醫(yī);異地就醫(yī)人員偽造或虛開醫(yī)療票據(jù)回來報銷;“掛床”住院就醫(yī);要求醫(yī)院開具本人不必要的診療項目或藥品,由他人代作或代用等。下面這些情況都有可能是醫(yī)保欺詐:單張?zhí)幏剿庂M特別高,一張卡在一定時間內(nèi)反復(fù)多次拿藥等。問題分析BP神經(jīng)網(wǎng)絡(luò)是一種按誤差你傳播算法訓(xùn)練的前饋網(wǎng)絡(luò),學(xué)習(xí)過程由信號的正向傳播與誤差的逆向傳播兩個過程組成.正向傳播時,模式作用于輸入層,經(jīng)隱層處理后,傳入誤差的逆向傳播階段,將輸出誤差按某形式,通過隱層向輸入層逐層返回,并“分?jǐn)偂苯o各層的所有單元,從而獲得各層單元的參考誤差或稱誤差信號,以作為修改各單元權(quán)值的依據(jù).權(quán)值不斷修改的過程,也就是網(wǎng)絡(luò)學(xué)習(xí)過程.此過程一直進(jìn)行到網(wǎng)絡(luò)輸出的誤差準(zhǔn)逐漸減少到可接受的程度或達(dá)到設(shè)定的學(xué)習(xí)次數(shù)為止。目前BP神經(jīng)網(wǎng)絡(luò)已在國內(nèi)外相關(guān)經(jīng)濟研究領(lǐng)域得到廣泛應(yīng)用,在國內(nèi)的證券、銀行等相關(guān)領(lǐng)域已有學(xué)者開始運用BP網(wǎng)絡(luò)進(jìn)行研究,葉明華將該方法運用到機動車保險欺詐的研究當(dāng)中,并且嘗試了統(tǒng)計回歸與神經(jīng)網(wǎng)絡(luò)的融合,證實了神經(jīng)網(wǎng)絡(luò)運用于保險欺詐的識別是可行的,并且通過回歸分析精煉后的識別因子能夠使神經(jīng)網(wǎng)絡(luò)具有更好的識別效果。在這個問題中,數(shù)據(jù)量巨大,同時自費患者和欺詐患者(共用醫(yī)??ǎ┨峁┝舜罅康臉颖?,而這些樣本恰好可以用于BP神經(jīng)網(wǎng)絡(luò)的訓(xùn)練,同時還可以用Logistic二元回歸分析篩選出影響顯著的欺詐因子,將定量與定性相結(jié)合,使結(jié)果更準(zhǔn)確。因此,對于這個問題,運用層次分析法和Logistic二元回歸分析相結(jié)合的方法進(jìn)行醫(yī)保欺詐的識別。模型假設(shè)1.自費病人無醫(yī)保欺詐嫌疑2.消費總額和消費數(shù)量為負(fù)數(shù)的視為記錄錯誤,取絕對值計算3.忽略這個月內(nèi)極少數(shù)病人轉(zhuǎn)科室治療的情況4.這個月當(dāng)?shù)貨]有地震等重大災(zāi)難的發(fā)生模型的建立與求解預(yù)處理數(shù)據(jù)樣本與欺詐因子選取根據(jù)附錄表格和中的病人資料和消費記錄中使用Excel和Access的數(shù)據(jù)處理函數(shù),結(jié)合相關(guān)資料,先做出各個科室的平均消費額,然后提取出包括病人科室,病人所在科室的平均消費額,病人當(dāng)月總費用,當(dāng)月拿藥頻次,年齡,性別在內(nèi)的6個欺詐因子,并將這些欺詐因子整合到病人ID中,表格見附件1。表欺詐因子匯總表醫(yī)保病人ID病人科室各科室平均消費額當(dāng)月拿藥頻次當(dāng)月總費用年齡性別36305015220.429162769018732.452116879915220.6462178614203996226497218732.529219905618732.646252473815220.348240626015220.448116730518732.647133196818732.830216121317357716126571095.1321自費病人與醫(yī)保卡共用病人從題目表病人資料醫(yī)??ㄌ栆粰谥泻Y選出醫(yī)??ㄌ枮?的病人,提取出他們的病人ID并確定他們?yōu)樽再M病人。對醫(yī)??ㄌ栆粰谶\用COUNTIF函數(shù)篩選一卡多用病人發(fā)現(xiàn)存在2人共用醫(yī)保卡以及3人共用醫(yī)??ǖ默F(xiàn)象,提取出他們的ID并確定其為共用醫(yī)??ú∪恕7謩e根據(jù)自費病人以及醫(yī)??ü灿貌∪说腎D作出如表格的欺詐因子匯總表便于進(jìn)一步分析。欺詐因子的精煉運用二元離散選擇模型對選取的6個欺詐因子進(jìn)行回歸分析,從中獲取具有顯著性的欺詐因子,我們通過IBMSPSSStatistics19軟件實現(xiàn)樣本數(shù)據(jù)的Logistic二元回歸分析。參數(shù)設(shè)定為:方法:Enter步進(jìn)概率:進(jìn)入=,刪除=;最大迭代次數(shù):50Exp(B)的.(X):95%。
表迭代歷史記錄迭代-2對數(shù)似然值系數(shù)Constant步驟01234567a.模型中包括常量。b.初始-2對數(shù)似然值:c.因為參數(shù)估計的更改范圍小于.001,所以估計在迭代次數(shù)7處終止。表為迭代歷史記錄,估計在迭代7次后終止,初始的-2對數(shù)似然值達(dá)到。表分類表已觀測已預(yù)測欺詐與否百分比校正01步驟0欺詐與否022585013750.0總計百分比a.模型中包括常量。b.切割值為.500在表中可見在輸入的樣本中有22585例被預(yù)測為0,有375例應(yīng)該為1的也被預(yù)測為0,預(yù)測正確率%。
表顯著性檢驗得分dfSig.步驟0變量相對差1.202當(dāng)月總費用1.006當(dāng)月拿藥頻次1.237年齡1.001性別(1)1.000病人科室1.000各科室平均消費額1.000總統(tǒng)計量7.000表是對模型的全局檢驗,為似然比檢驗,共給出七個結(jié)果:sig值<表明有統(tǒng)計學(xué)意義。從中可見病人當(dāng)月總費用,年齡,性別,病人所在科室以及病人所在科室的平均消費額對回歸具有顯著影響,而其他因素沒有影響。根據(jù)這個結(jié)論就可以建立醫(yī)保欺詐識別的BP網(wǎng)絡(luò)模型。醫(yī)保欺詐識別的BP網(wǎng)絡(luò)模型1) 設(shè)置初始權(quán)值W(0)為較小的隨機非零值。2) 給定輸入/輸出樣本集合,{誤差指標(biāo)E總誤差指標(biāo)E重復(fù)下列過程直至滿足收斂條件(Ealla) 對于任意一個樣本p,計算正向過程: 反向過程:b) 修正權(quán)值包括兩種學(xué)習(xí)方式:模式(Pattern)學(xué)習(xí)方式:訓(xùn)練(Epoch)學(xué)習(xí)方式:網(wǎng)絡(luò)輸入矩陣是由Logistic二元回歸分析獲取的具有模型顯著性的5個欺詐識別因子向量組成,網(wǎng)絡(luò)輸出向量矩陣是由是否欺詐(0和1)組成的一維矩陣,0代表該病人沒有欺詐,1代表欺詐。經(jīng)過反復(fù)多次試驗,本著誤差最小,訓(xùn)練時間最短的原則最終確定了有2個隱藏層的BP神經(jīng)網(wǎng)絡(luò)模型。設(shè)置目標(biāo)誤差為,最大迭代次數(shù)50000等。圖BP神經(jīng)網(wǎng)絡(luò)訓(xùn)練圖從圖中看出我們的BP神經(jīng)網(wǎng)絡(luò)經(jīng)過396個迭代周期,歷時2分50秒之后終于達(dá)到了目標(biāo)誤差。訓(xùn)練過程如圖所示。圖模擬訓(xùn)練過程圖欺詐病人識別根據(jù)訓(xùn)練好的BP神經(jīng)網(wǎng)絡(luò),對不能確定是否欺詐的病人進(jìn)行欺詐識別,找到可能的欺詐病人ID,并根據(jù)其欺詐可能性大小進(jìn)行了排序,排序越靠前欺詐嫌疑越大。最終結(jié)果請看附件5.
模型的評價與推廣模型的優(yōu)缺點本文采取采取Logistic回歸和BP神經(jīng)網(wǎng)絡(luò)結(jié)合的方法,運用Spss軟件對樣本進(jìn)行Logistic回歸分析提取具有模型顯著性的識別因子;將所得識別因子作為BP神經(jīng)網(wǎng)絡(luò)模型的輸入向量進(jìn)行訓(xùn)練,并選取檢驗樣本對模型的有效性進(jìn)行預(yù)測檢驗,證明了模型的準(zhǔn)確性和用這種方法用于醫(yī)保欺詐識別的可行性。本模型基于BP神經(jīng)網(wǎng)絡(luò)的方法具有很多優(yōu)點:BP神經(jīng)網(wǎng)絡(luò)的非線性映射能力強,數(shù)學(xué)理論證明三層的神經(jīng)網(wǎng)絡(luò)就能夠以任意精度逼近任何非線性連續(xù)函數(shù)。避開了求欺詐因子與欺詐與否之間復(fù)雜函數(shù)關(guān)系的過程,使問題的解決更加簡單,其次BP神經(jīng)網(wǎng)絡(luò)具有一定的容錯能力,BP神經(jīng)網(wǎng)絡(luò)在其局部的或者部分的神經(jīng)元受到破壞后對全局的訓(xùn)練結(jié)果不會造成很大的影響,也就是說即使系統(tǒng)在受到局部損傷時還是可以正常工作的。同時本模型也存在著一定的局限性,BP神經(jīng)網(wǎng)絡(luò)是一種局部搜索的優(yōu)化方法,它要解決的是一個復(fù)雜非線性化問題,網(wǎng)絡(luò)的權(quán)值是通過沿局部改善的方向逐漸進(jìn)行調(diào)整的,這樣會使算法陷入局部極值,加上BP神經(jīng)網(wǎng)絡(luò)對初始網(wǎng)絡(luò)權(quán)重非常敏感,以不同的權(quán)重初始化網(wǎng)絡(luò),其往往會收斂于不同的局部極小,這也是我們多次訓(xùn)練會得到不同結(jié)果的原因。其次,BP神經(jīng)網(wǎng)絡(luò)結(jié)構(gòu)的選擇至今尚無一種統(tǒng)一而完整的理論指導(dǎo),一般只能由經(jīng)驗選定。網(wǎng)絡(luò)結(jié)構(gòu)選擇過大,訓(xùn)練中效率不高,可能出現(xiàn)過擬合現(xiàn)象,造成網(wǎng)絡(luò)性能低,容錯性下降,若選擇過小,則又會造成網(wǎng)絡(luò)可能不收斂。而網(wǎng)絡(luò)的結(jié)構(gòu)直接影響網(wǎng)絡(luò)的逼近能力及推廣性質(zhì)。本文中我們采取了多次試驗的方法,確定了網(wǎng)絡(luò)的結(jié)構(gòu),具有一定的主觀性。模型的推廣該模型可有效檢測出醫(yī)保中發(fā)生的詐騙現(xiàn)象,這一模型基于BP神經(jīng)網(wǎng)絡(luò)可以很容易地推廣到其他類型的保險行業(yè)中,例如人壽保險,機動車險等。同時本模型雖然給出了具有重大醫(yī)保欺詐嫌疑的病人ID,遺憾的是我們并沒有給出每個病人欺詐的具體概率是多少,這也是我們模型需要改進(jìn)的地方。我們的結(jié)果可以為醫(yī)保欺詐的識別,提供一份寶貴的可參考的資料。參考文獻(xiàn)[1]林源.國內(nèi)外醫(yī)療保險欺詐研究現(xiàn)狀分析[J].INSURANCESTUDIES,2010,12(12):115-122[2]劉坤坤,車險保險欺詐識別和測量模型實證研究——基于廣東省車險歷史索賠數(shù)據(jù),暨南學(xué)報(哲學(xué)社會科學(xué)版),8:50-55,2012。[3]朱大奇,史慧編著.人工神經(jīng)網(wǎng)絡(luò)原理及應(yīng)用[M].科學(xué)出版社,2006[4]唐萬梅.BP神經(jīng)網(wǎng)絡(luò)網(wǎng)絡(luò)結(jié)構(gòu)優(yōu)化問題的研究[J].系統(tǒng)工程理論與實踐.2005(10)[5]劉彩紅.BP神經(jīng)網(wǎng)絡(luò)學(xué)習(xí)算法的研究[D].重慶:重慶師范大學(xué),2008.1-76[6]段超霞,田學(xué)民.基于正交最小二乘的傅立葉神經(jīng)網(wǎng)絡(luò)結(jié)構(gòu)選取方法[J].石油化工自動化.2012(06)[7]葉飛躍.數(shù)據(jù)挖掘過程中的模糊聚類方法[J].計算機與現(xiàn)代化.2003(09)[8]王學(xué)民編著.應(yīng)用多元分析[M].上海財經(jīng)大學(xué)出版社,1999[9]廖寧放,高稚允.BP神經(jīng)網(wǎng)絡(luò)用于函數(shù)逼近的最佳隱層結(jié)構(gòu)[J].北京理工大學(xué)學(xué)報.1998(04)[10]叢爽編著.面向MATLAB工具箱的神經(jīng)網(wǎng)絡(luò)理論與應(yīng)用[M].中國科學(xué)技術(shù)大學(xué)出版社,1998[11]鄧偉妮.基于BP神經(jīng)網(wǎng)絡(luò)的西安市PM10污染預(yù)報及其MATLAB實現(xiàn)[D].西安科大學(xué)2008
七、附錄訓(xùn)練BP程序clc,clearall;%definetheinputandoutputpqz=xlsread('E:\數(shù)學(xué)\數(shù)學(xué)建模\深圳杯2015\A題\篩選后的BP素材\欺詐者的樣本.xlsx','B2:G376')
溫馨提示
- 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
- 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
- 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
- 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負(fù)責(zé)。
- 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請與我們聯(lián)系,我們立即糾正。
- 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時也不承擔(dān)用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。
最新文檔
- 二零二五年電影院廣告投放與品牌合作合同2篇
- 二零二五年知識產(chǎn)權(quán)許可特別合同2篇
- 二零二五年度留學(xué)國家與學(xué)校選擇合同2篇
- 二零二五年網(wǎng)紅直播廣告合作合同1200字范本3篇
- 二零二五版礦山資產(chǎn)轉(zhuǎn)讓與資源補償合同3篇
- 二零二五年度邊溝工程防滲漏與防水害合同2篇
- 二零二五年度跨江大橋PC構(gòu)件預(yù)制及吊裝工程合同3篇
- 二零二五年度軟件許可與維護(hù)合同3篇
- 2025年度網(wǎng)絡(luò)安全防護(hù)軟件開發(fā)類框架合同3篇
- 小區(qū)物業(yè)保潔勞務(wù)合同(2篇)
- 2025年下半年貴州高速公路集團限公司統(tǒng)一公開招聘119人高頻重點提升(共500題)附帶答案詳解
- 資產(chǎn)評估服務(wù)房屋征收項目測繪實施方案
- 2025年經(jīng)濟形勢會議講話報告
- 北師大版小學(xué)三年級上冊數(shù)學(xué)第五單元《周長》測試卷(含答案)
- 國家安全責(zé)任制落實情況報告3篇
- 2024年度順豐快遞冷鏈物流服務(wù)合同3篇
- 六年級下冊【默寫表】(牛津上海版、深圳版)(漢譯英)
- 合同簽訂培訓(xùn)
- 電工基礎(chǔ)知識培訓(xùn)課程
- 鐵路基礎(chǔ)知識題庫單選題100道及答案解析
- 金融AI:顛覆與重塑-深化理解AI在金融行業(yè)的實踐與挑戰(zhàn)
評論
0/150
提交評論