一種基于深度學習的身份證號碼識別方法_第1頁
一種基于深度學習的身份證號碼識別方法_第2頁
一種基于深度學習的身份證號碼識別方法_第3頁
全文預覽已結束

下載本文檔

版權說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權,請進行舉報或認領

文檔簡介

一種基于深度學習的身份證號碼識別方法

1身份證號碼的錄入2004年,中國開始采用第二代居民身份證。由于身份編號只能識別身份驗證信息,并且可以獲得一些個人信息,因此身份編號通常只記錄身份驗證信息。然而,登記仍然是手動的,這不僅耗時,而且效率低下。因此,快速輸入身份驗證信息是一個必須解決的問題,尤其是光學文本識別(orc)技術,并被納入認證行業(yè),并被廣泛使用。身份證號碼的識別技術屬于圖像字符識別領域,目前國內(nèi)外采用較多的方法主要有兩類:基于模板匹配OCR算法和基于神經(jīng)網(wǎng)絡的OCR算法2定位和提取簽名號2.1身份證號碼的定位雖然第二代居民身份證的大小是固定的,但是拍照不像掃描獲得的身份證圖像固定,因此,不能直接通過身份證圖像的大小來獲取它的位置。圖1(a)為通過拍照獲得的身份證圖像,要求拍照的背景不要復雜,比較簡單,能夠和身份證形成比較大的差異,并且身份證在圖像中的位置要居中和占據(jù)80%左右的空間,傾斜角不要太大,以保證能夠檢測到身份證,并不會對身份證號碼的定位造成影響。不管身份證的尺寸如何,身份證號碼在身份證上的位置總是固定的,結合先驗知識和獲得的身份證圖像,身份證號碼位置要大于圖像寬度的1/3。身份證上身份證號碼總是處于人臉之下,可以采用Matlab自帶的Vision工具箱檢測到人臉(如圖1(b)所示),身份證號碼大概在檢測到的人臉長度的1.2倍之下,從而截取出包括身份證號碼區(qū)域的一部分圖像,如圖1(c)所示。獲得的一部分圖像是彩色圖像,需要進行灰度化和二值化處理。常見的灰度化處理方法有平均值法、加權平均值法和最大值法等。通常加權平均值法式(1)中,F為像素的灰度值,R為彩色圖像中紅色分量的值,G為彩色圖像中綠色分量的值,B為彩色圖像藍色分量的值。常見的二值化處理方法有全局固定閾值、自適應閾值二值化和OSTU法。采用了迭代法進行二值化通常二值化后會用投影分割切割出身份證號碼,但是圖像區(qū)域還是略大,而且還有些其他的非號碼區(qū)域,因此,繼續(xù)采用一些圖像處理技術來更好地提取出身份證號碼圖像,達到要求。首先是對圖像進行開運算,使得圖像形成幾個連通域,接著用8鄰域標記連通域。因為身份證號碼高度基本一致,所以身份證號碼連通域?qū)⒈缓喜?。圖像形成的連通域可能不止包括身份證號碼,還有其他的部分,因此,需要計算連通域的面積來進行號碼區(qū)域匹配,選取匹配度接近1的連通域,并對目標區(qū)域分別向上下左右延伸7個像素,最后在原圖像上提取出身份證號碼圖像,如圖2所示。2.2單個字符的全化獲得身份證號碼圖像后,需要對圖像進行字符分割,提取出單個字符??梢酝ㄟ^投影分割的方法來實現(xiàn),步驟如下:(1)對圖像進行加權灰度化;(2)用迭代二值化方法二值化灰度圖像;(3)采用像素水平投影和垂直投影3基于堆疊神經(jīng)網(wǎng)絡字符的識別3.1多層網(wǎng)絡學習深度學習是機器學習研究中的一個新的領域,目的在于模仿人腦的機制來解釋數(shù)據(jù),例如圖像、聲音和文本。深度學習采用了神經(jīng)網(wǎng)絡的分層結構,系統(tǒng)包括輸入層、隱藏層和輸出層組成的多層網(wǎng)絡,只有相鄰的節(jié)點之間有連接,同一層以及跨層節(jié)點之間相互無連接,通過對給定的訓練集不斷訓練,主動學習一些特征,從而建立模型。深度學習首先利用無監(jiān)督學習對每一層網(wǎng)絡進行逐層預訓練,每次用無監(jiān)督學習只訓練一層,并將訓練結果作為更高一層的輸入,最后用監(jiān)督學習去調(diào)整所有層。CNN[7-9]是深度學習的一個重要算法,也是一種多層神經(jīng)網(wǎng)絡,通過卷積來模擬特征區(qū)分,并且通過卷積的權值共享及池化,來降低網(wǎng)絡參數(shù)數(shù)量級,最后通過神經(jīng)網(wǎng)絡3.2卷積層神經(jīng)元數(shù)、卷積層神經(jīng)元數(shù)和子采樣層神經(jīng)層數(shù)深度學習的CNN網(wǎng)絡結構主要考慮網(wǎng)絡層數(shù)、卷積層神經(jīng)元數(shù)和子采樣層神經(jīng)層數(shù),以及最后輸出層的神經(jīng)層數(shù)。CNN網(wǎng)絡結構如圖4所示,參考了CaffeNet4身份編碼和編碼本文由于采用了基于深度學習的身份證號碼識別方法,訓練需要大量的數(shù)據(jù)集,而從實際中獲取不現(xiàn)實,因此本文采用自己合成的數(shù)據(jù)集,用身份證號碼區(qū)域的背景,身份證號碼字體OCR-B10BT,融合了不同的高斯噪聲、不同的字體傾斜角、字體大小不同、RGB不同以及區(qū)域大小,并且將18位身份證號碼加入驗證,確保符合真實的身份證號碼要求,得到了10W張身份證號碼圖像,如圖5所示,并且每一張圖像都有標簽。用二值化和投影分割切出字符,將其分到11類中。本次實驗是基于ubuntu14.10,GTX980的機器,深度學習的框架是Caffe,通過輸入原圖像,將圖像歸一化為64*64大小,訓練圖像接近18W,其中有768個字符沒有切割出來,訓練迭代5W次,得到模型,訓練準確率接近100%。通過自己拍照獲得了541張身份證圖像,身份證號碼數(shù)共9738個,用之前的方法切割出9643個字符,切割正確率為99%,測試的識別率為98%,其中錯誤的共195個。實驗過程中有一些身份證號碼圖像切割出錯,測試識別出錯最多的是0,圖6為切割出錯的真實身份證號碼圖像示例。5基于深度學習的

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預覽,若沒有圖紙預覽就沒有圖紙。
  • 4. 未經(jīng)權益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負責。
  • 6. 下載文件中如有侵權或不適當內(nèi)容,請與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

評論

0/150

提交評論