基于貝葉斯網絡分類器和粗糙集模型的通信識別_第1頁
基于貝葉斯網絡分類器和粗糙集模型的通信識別_第2頁
基于貝葉斯網絡分類器和粗糙集模型的通信識別_第3頁
基于貝葉斯網絡分類器和粗糙集模型的通信識別_第4頁
基于貝葉斯網絡分類器和粗糙集模型的通信識別_第5頁
全文預覽已結束

下載本文檔

版權說明:本文檔由用戶提供并上傳,收益歸屬內容提供方,若內容存在侵權,請進行舉報或認領

文檔簡介

基于貝葉斯網絡分類器和粗糙集模型的通信識別

1手機的覆蓋率21世紀,人們進入了快速發(fā)展的時代,手機的普及率不斷提高,成為人們生活中不可或缺的重要必需品之一。在一些發(fā)達的經濟城市,手機普及率達到100%。手機的普及以及通信業(yè)務發(fā)展也滋生了許多利用短信、電話等方式的犯罪行為,許多犯罪分子講手機作為很重要的作案交流工具。通過手機用戶通信賬單的數(shù)據(jù)深入挖掘,對手機用戶的行為特征與身份進行精確識別,對潛在犯罪分子的前期判定和對犯罪團伙的識別具有一定的意義,對維護社會安定具有一定的貢獻。2打擊多人犯罪或景觀犯罪成為公安偵查部門工作重心的重心近年來,隨著社會經濟的迅猛發(fā)展和政治爭端的不斷升溫,社會上各種不和諧、不穩(wěn)定因素持續(xù)增加,各類案件尤其是嚴重群體刑事案件的案發(fā)率不斷上升,在某些局部地區(qū)甚至已經使當?shù)厝嗣裆徒洕艿絿乐貍?。針對嚴重刑事案?如何快速準確地對犯罪分子進行搜捕捉獲、對傷害等惡劣刑事案件進行預防、對直接參與和有參與動機的犯罪團伙和作案人員加大打擊力度已成為各地公安部門面臨的巨大挑戰(zhàn)。因此,如何遏止、打擊多人犯罪或團伙犯罪就成為公安偵查部門工作重心的重中之重。雖然不能百分之百的確定具體的犯罪團伙,但是我們的識別工作可以給警察確定犯罪分子提供參考,有目的性的對犯罪分子進行調查,可以減輕他們很多的工作壓力。3具體示例:識別罪犯的模型3.1模型假設(1)已經確定了某些犯罪分子;(2)犯罪團伙溝通過程通過手機進行;(3)電信運營商處可獲取到正確、真實的通訊記錄數(shù)據(jù)。3.2罪犯通信圈的劃分由于無法獲取到犯罪分子通信網絡的真實數(shù)據(jù),所以接下來的研究是建立在假設某個用戶為犯罪分子的基礎上的。筆者假設1123438用戶為一個犯罪團伙的一個成員,并且筆者已經知道了他的身份,通過SPSS對用戶短信清單表和通話清單表進行統(tǒng)計分析,筆者可以確定他的通信網絡,并將他通信網絡中同伙的部分信息統(tǒng)計在表1。由于用戶的數(shù)據(jù)較分散,在進行貝葉斯網絡分類的時候不便運算,筆者將這些數(shù)據(jù)劃定范圍并將數(shù)值型數(shù)據(jù)轉換為字符型數(shù)據(jù)來衡量。根據(jù)犯罪分子通信圈中用戶與該名犯罪分子的通話次數(shù)、短信發(fā)送次數(shù)、通話總時長來決定是否是屬于同伙。類標號屬性“是否是同伙”具有兩個不同的值{是,否}。根據(jù)樸素貝葉斯分類方法,需要最大化p(XCi)p(Ci),i=1,2,每個類的先驗概率p(Ci)可以根據(jù)訓練樣本計算得出。3.3判定用戶為犯罪人員的同方性因此,將樣本X指派給類C1:“是否是同伙”=是。即在X=<通話次數(shù)=5,短信發(fā)送次數(shù)=50,通話總時長=400>的情況下判定用戶是屬于犯罪分子的同伙。該犯罪分子通信網絡中的其他用戶可依次算出,并最終確定其中的同伙成員,為警察抓捕犯罪分子提供參考??嘤跊]有真實的犯罪團伙的數(shù)據(jù)進行模型的驗證,筆者決定采取另一種方法對犯罪分子團伙進行識別,將兩種識別方法得到的結果進行相互驗證,以確定所采取的方法的正確性。3.4數(shù)學工具粗模擬在這里筆者通過一種能夠定量分析處理不精確、不一致、不完整信息與知識的數(shù)學工具粗糙集來對以上模型結果進行檢驗。粗糙集理論來源于比較簡單的信息模型,基本思想是通過關系數(shù)據(jù)庫分類歸納形成概念和規(guī)則,通過等價關系的分類以及分類對于目標的近似實現(xiàn)知識發(fā)現(xiàn)。符合我們研究問題的特征。3.4.1厚集模型的建立在提取出1123438用戶的犯罪團伙數(shù)據(jù)后,對其進行整理得出下表2:3.4.2屬性的等價集和下近似集計算(1)條件屬性的等價集(2)決策屬性D(d)的等價集(3)決策屬性的各等價集的下近似集(4)計算Pos(C,D)和r(C,D)3.4.3屬性中小型或決策屬性無明顯不合理(1)條件屬性C(b,c)的等價集:(2)決策屬性的等價集仍為Y1,Y2。(4)計算Pos(C-{a},D)和r(C-{a},D)(5)屬性a的重要程度:(6)結論:屬性a是不可忽略的。(1)條件屬性C(a,c)的等價集:去掉屬性b后,元組中出現(xiàn)的等價集為:(2)決策屬性的等價集仍為Y1,Y2。(4)計算Pos(C-,D)和r(C-,D)(5)屬性b的重要程度:(6)結論:屬性b是不可忽略的。(1)條件屬性C(a,b)的等價集:去掉屬性c后,元組中出現(xiàn)的等價集為:(2)決策屬性的等價集仍為Y1,Y2。(4)計算Pos(C-{c},D)和r(C-{c},D)(5)屬性c的重要程度:(6)結論:屬性c是不可忽略的。3.4.4用戶罪犯掃碼申請a為多b=b(1)由于E1∩Y1=E1,E5∩Y1=E5,E6∩Y1=E6,E7∩Y1=E7,E8∩Y1=E8,有規(guī)則:r11:Des(E1)→Des(Y1),即a=多∧b=多∧c=長→d=0,cf=1.r51:Des(E5)→Des(Y1),即a=中∧b=少∧c=長→d=0,cf=1r61:Des(E6)→Des(Y1),即a=少∧b=多∧c=長→d=0,cf=1r71:Des(E7)→Des(Y1),即a=多∧b=中∧c=中→d=0,cf=1r81:Des(E8)→Des(Y1),即a=少∧b=中∧c=長→d=0,cf=1(2)由于E2∩Y2=E2,E3∩Y2=E3,E4∩Y2=E4,E9∩Y2=E9,有規(guī)則:(3)最后的規(guī)則為:通話次數(shù)=多∧短信發(fā)送次數(shù)=多∧通話總時長=長→是通話次數(shù)=中∧短信發(fā)送次數(shù)=少∧通話總時長=長→是通話次數(shù)=少∧短信發(fā)送次數(shù)=多∧通話總時長=長→是通話次數(shù)=多∧短信發(fā)送次數(shù)=中∧通話總時長=中→是通話次數(shù)=少∧短信發(fā)送次數(shù)=少∧通話總時長=中→否通話次數(shù)=中∧短信發(fā)送次數(shù)=中∧通話總時長=中→否通話次數(shù)=少∧短信發(fā)送次數(shù)=少∧通話總時長=少→否通話次數(shù)=少∧短信發(fā)送次數(shù)=多∧通話總時長=少→否將用戶樣本X=<通話次數(shù)=5,短信發(fā)送次數(shù)=50,通話總時長=400>,轉換成字符型數(shù)值為X=<通話次數(shù)=多,短信發(fā)送次數(shù)=多,通話總時長=長>,根據(jù)粗糙集得出的規(guī)則可判定該樣本是犯罪同伙,這與貝葉斯網絡分類器得到的結果是一致的,說明這兩種方法是一種比較有效的方法。3.5粗模擬方法與程序本文在此部分提出的貝葉斯網絡模型能夠在數(shù)據(jù)量很大的情況下識別出犯罪團伙的成員,并且根據(jù)所運用的貝葉斯網絡具有的強大的不確定性問題處理能力,能夠在眾多的手機用戶中判別出可能的犯罪團伙,這對于維護社會治安和減輕警察的工作壓力都具有重要的意義。同時,為了克服沒有真實的犯罪團伙的數(shù)據(jù)的缺陷,筆者采取了另一種方法——粗糙集方法來對結果進行驗證,結果顯示二者求得的最終結果是一致的,說明這兩種方法都是比較有效的識別犯罪團伙的方法。但是本文的方法具有局限性,只是適用于已經確定一些犯罪分子的前提中進行判別,而且需要犯罪分子溝通需通過手機,否則,本文中的方法將無法進行下去。同時,進行粗糙集運算未利用計算機軟件進行,導致運算效率低而且繁瑣。4犯罪案件特征本文研究了如何在眾多的手機用戶當中識別特定類型的手機用戶—犯罪團伙,創(chuàng)新性的提出用兩種識別方法對比驗證所獲得的結果的正確性,本文的研究成果可以給公安部門縮短犯罪案件的偵破時間,在很大的程度上提高了工作效率。以具體的

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網頁內容里面會有圖紙預覽,若沒有圖紙預覽就沒有圖紙。
  • 4. 未經權益所有人同意不得將文件中的內容挪作商業(yè)或盈利用途。
  • 5. 人人文庫網僅提供信息存儲空間,僅對用戶上傳內容的表現(xiàn)方式做保護處理,對用戶上傳分享的文檔內容本身不做任何修改或編輯,并不能對任何下載內容負責。
  • 6. 下載文件中如有侵權或不適當內容,請與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

最新文檔

評論

0/150

提交評論