下載本文檔
版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進(jìn)行舉報或認(rèn)領(lǐng)
文檔簡介
1、基于數(shù)據(jù)挖掘技術(shù)的醫(yī)保欺詐行為的主動發(fā)現(xiàn) 【摘 要】隨著數(shù)據(jù)挖掘技術(shù)的不斷發(fā)展與成熟,對數(shù)據(jù)挖掘的研究和應(yīng)用逐漸深入到各個行業(yè)。在醫(yī)療保險領(lǐng)域,醫(yī)保詐騙的現(xiàn)象時有發(fā)生,造成醫(yī)藥基金的損失,損害廣大參保人的利益。運用數(shù)據(jù)挖掘技術(shù),構(gòu)建較為完整的醫(yī)保數(shù)據(jù)倉庫,實現(xiàn)醫(yī)保信息化的構(gòu)建,進(jìn)而更為高效的使用和管理醫(yī)?;?。本文通過對比研究病人的所購藥品金額和藥品數(shù)量,結(jié)合醫(yī)囑時間,病人科室等項目,利用excel,spss進(jìn)行數(shù)據(jù)的篩選整理及描述性統(tǒng)計分析,建立檢測模型,篩選出異常值。異常值的檢測即為主動發(fā)現(xiàn)醫(yī)療欺詐檢測。 【關(guān)鍵詞】數(shù)據(jù)挖掘技術(shù);醫(yī)保欺詐 一、問題背景 (一)關(guān)于醫(yī)保欺詐的手段分析 醫(yī)保欺
2、詐及違規(guī)行為主要分為醫(yī)療保險參?;颊撸ㄐ璺剑┑钠墼p、違規(guī)行為,醫(yī)療保險服務(wù)供方(醫(yī)療機構(gòu)和藥店)和參?;颊吆现\的欺詐、違規(guī)行為,醫(yī)療保險服務(wù)供方的欺詐、違規(guī)行為。 根據(jù)表格數(shù)據(jù)項目和特點,主要能夠發(fā)現(xiàn)以下醫(yī)保欺詐行為: 1.冒名頂替。是指非參?;颊咭云渌麉⒈H松矸菰诙c醫(yī)療機構(gòu)就醫(yī),包括門急診、住院、加床等。具體在數(shù)據(jù)中的體現(xiàn)為:同一個人持多張醫(yī)??ň歪t(yī)。 2.販賣藥品。指醫(yī)保患者通過醫(yī)??ǘ嗫床。嗳∷幍姆椒?,然后將藥品販賣,達(dá)到騙取醫(yī)保基金的目的。 (二)醫(yī)保數(shù)據(jù)挖掘 我們通常將數(shù)據(jù)挖掘的任務(wù)主要分為描述和預(yù)測兩大類。預(yù)測任務(wù)是通過一些自變量屬性為目標(biāo)建立模型,用自變量的取值來預(yù)測目標(biāo)變量
3、的取值。描述任務(wù)則是對數(shù)據(jù)潛在聯(lián)系或模式的概括,包括關(guān)聯(lián)分析,聚類,異常檢測等。 本題主要是針對醫(yī)保欺詐的檢測。欺詐檢測是醫(yī)?;痫L(fēng)險防控中重要的一項任務(wù),通常根據(jù)專家知識分析可能的欺詐行為,并利用數(shù)據(jù)挖掘算法進(jìn)行檢測和驗證。 二、識別醫(yī)保欺詐行為 (一)識別單次購藥金額高且購藥數(shù)量多和單次購藥金額過高但購藥數(shù)量少的行為 在醫(yī)療保險的詐騙過程中,騙保人會反復(fù)使用醫(yī)保卡購買藥品,再將購買的藥品以高價出售,以此牟利。因此,當(dāng)某位患者單次購藥金額高且多次購藥或者雖然購藥數(shù)量少但單次金額過高,則意味著該患者有惡意騙保的可能。 1.識別單次購藥金額高且購藥數(shù)量多的行為 數(shù)據(jù)預(yù)處理 1)數(shù)據(jù)篩選。在費用明
4、細(xì)中,只保留病人id、藥品數(shù)量和總價格。 2)數(shù)據(jù)排序,數(shù)據(jù)分組。將病人id及按升序排列,對每一個病人購買藥品數(shù)量和總價進(jìn)行單獨分析。 3)通過數(shù)據(jù)透視表將屬于同一病人id的藥物費用加總。用=countif()函數(shù)計數(shù),用=sumif()函數(shù)進(jìn)行加和。 模型的建立及求解 1)將同一病人id下各藥品價格加總,即可求出單次購買藥品的金額。將同一病人id所對應(yīng)的各藥品數(shù)量加總,即可求出單次購買藥品的數(shù)量。 對“費用明細(xì)”中藥品價格,購藥種類,每種藥品的數(shù)量等數(shù)據(jù)帶入上述公式進(jìn)行計算,得出每位患者單次購藥的總價格和藥品總數(shù)量。 2)運用spss對單次購買的藥品金額進(jìn)行描述性統(tǒng)計,取顯著性水平= 1%,
5、按照“經(jīng)驗法則”約有99%的樣本值的平均數(shù)落在3個標(biāo)準(zhǔn)差的置信區(qū)間內(nèi),置信區(qū)間的上限為175.6480。超出該范圍的部分認(rèn)為有詐騙的嫌疑。 3)對于單次購藥金額超出175元的部分,我們對剩余數(shù)據(jù)進(jìn)行再次篩選處理。此次是篩選出一次購藥中購買藥物數(shù)量較大的數(shù)據(jù),取顯著性水平= 1%,按照“經(jīng)驗法則”約有99%的樣本值的平均值落在3個標(biāo)準(zhǔn)差的置信區(qū)間內(nèi),置信區(qū)間的上限為428.94。高于置信區(qū)間上限值的部分,符合滿足單筆金額大且所購藥品數(shù)量多的條件。 結(jié)論:經(jīng)過上述篩選過程后,可以識別出具有詐騙嫌疑的病人id。經(jīng)過篩選,大約有28.62%的病人有該種詐騙嫌疑。 2.識別單次購藥金額過高且購藥數(shù)量少的
6、行為 在醫(yī)療詐騙中,單次購藥金額過高同時購藥數(shù)量少的詐騙手段也常見。類似解決上一問的做法,本文從藥品總價和藥品數(shù)量入手,篩選出異常值。以此確定存在醫(yī)療詐騙行為的病人id。 模型的建立及求解 1)首先,對藥品購買金額按照降序排列,利用spss制作藥品購買金額的散點圖,如圖表組合二,觀察其特點。發(fā)現(xiàn)異常值大概在前1%左右,這些異常值可能是由醫(yī)療詐騙行為導(dǎo)致的。 2)再從藥品購買數(shù)量中篩選出低于428的數(shù)據(jù),與1%的異常值取交集,即可得到采取單次購藥金額過高且購藥數(shù)量少手段的病人id。分析結(jié)果如下表所示。 結(jié)論:使用上述方法,可以找到在醫(yī)療過程中,單筆金額過高且數(shù)量少的數(shù)據(jù)所對應(yīng)的病人id,通過核實
7、病例信息,醫(yī)囑子類,可以最終確定醫(yī)療詐騙行為,結(jié)果顯示,該部分的嫌疑人數(shù)量占到0.999%。 (二)識別同一人持有不同醫(yī)??ㄙ徦幍男袨?在醫(yī)療詐騙的過程中,通過借取,租用多張醫(yī)???,反復(fù)購買藥品再出售牟利,也是一種常見的手段。這種方法由于病人id不同,較難辨別而更加隱蔽。本文假設(shè),由于個人身體條件差異導(dǎo)致對藥物數(shù)量的需求差異較大,且不同種類藥物單價也不相同。因此,每次就醫(yī)所購買的藥品總金額應(yīng)當(dāng)具有一定差異。當(dāng)出現(xiàn)藥品總金額相同的情況時,則視為具有醫(yī)療欺詐的嫌疑。 這里使用雷同價格篩選法。 數(shù)據(jù)預(yù)處理 統(tǒng)計相同金額出現(xiàn)的頻數(shù),并按其大小進(jìn)行降序排列。 模型的建立及求解 1)將相同的藥品總金額及其對應(yīng)的頻數(shù)列成表格 2)將頻數(shù)按降序排列 3)運用spss對單次購買的藥品金額進(jìn)行描述性統(tǒng)計,統(tǒng)計每個價格出現(xiàn)的次數(shù),在篩選價格頻數(shù)時,首先考慮了中位數(shù)。但在操作中發(fā)現(xiàn)中位數(shù)為1,而最大值為483,說明該組數(shù)據(jù)偏態(tài)較高為28.872 ,使用中位數(shù)作為劃分依據(jù)不合理。因此使用新的篩選方法。 4)通過對藥品金額進(jìn)行描述性統(tǒng)計,從頻數(shù)發(fā)現(xiàn)相同金額出現(xiàn)次數(shù)在七次以內(nèi)的占總體的95.3%。可知,由于病人的醫(yī)
溫馨提示
- 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
- 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
- 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
- 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負(fù)責(zé)。
- 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請與我們聯(lián)系,我們立即糾正。
- 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時也不承擔(dān)用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。
最新文檔
- 師德師風(fēng)警示教育活動總結(jié)6篇
- 工程信息管理體系
- 國開《可編程控制器應(yīng)用》形考任務(wù)五實驗1
- 2024年淮南聯(lián)合大學(xué)高職單招職業(yè)適應(yīng)性測試歷年參考題庫含答案解析
- 2022年6月7日陜西省省直事業(yè)單位廣播電視局面試真題及答案
- 中國人民大學(xué)會計系列教材·第四版《成本會計學(xué)》課件-第六章
- 濕紙巾發(fā)展趨勢分析報告
- 2024年隴西縣第一人民醫(yī)院高層次衛(wèi)技人才招聘筆試歷年參考題庫頻考點附帶答案
- 如何提起證券交易代理合同糾紛訴訟培訓(xùn)講學(xué)
- 2024年泰山護(hù)理職業(yè)學(xué)院高職單招職業(yè)適應(yīng)性測試歷年參考題庫含答案解析
- 《常見包材工藝簡介》課件
- 運輸管理與鐵路運輸
- 寧德時代社招測評題庫
- 統(tǒng)編版六年級語文上冊專項 專題11文言文閱讀-原卷版+解析
- 高中數(shù)學(xué)筆記總結(jié)高一至高三很全
- 011(1)-《社會保險人員減員申報表》
- 電廠C級檢修工藝流程
- 函授本科《小學(xué)教育》畢業(yè)論文范文
- 高考高中英語單詞詞根詞綴大全
- 藥用輔料聚乙二醇400特性、用法用量
- 《中小學(xué)機器人教育研究(論文)11000字》
評論
0/150
提交評論