![[碩士論文精品]車牌定位與識別相關方法研究.pdf_第1頁](http://file.renrendoc.com/FileRoot1/2019-7/15/c3ef7364-07e7-4b6e-866c-0663b0e59036/c3ef7364-07e7-4b6e-866c-0663b0e590361.gif)
![[碩士論文精品]車牌定位與識別相關方法研究.pdf_第2頁](http://file.renrendoc.com/FileRoot1/2019-7/15/c3ef7364-07e7-4b6e-866c-0663b0e59036/c3ef7364-07e7-4b6e-866c-0663b0e590362.gif)
![[碩士論文精品]車牌定位與識別相關方法研究.pdf_第3頁](http://file.renrendoc.com/FileRoot1/2019-7/15/c3ef7364-07e7-4b6e-866c-0663b0e59036/c3ef7364-07e7-4b6e-866c-0663b0e590363.gif)
![[碩士論文精品]車牌定位與識別相關方法研究.pdf_第4頁](http://file.renrendoc.com/FileRoot1/2019-7/15/c3ef7364-07e7-4b6e-866c-0663b0e59036/c3ef7364-07e7-4b6e-866c-0663b0e590364.gif)
![[碩士論文精品]車牌定位與識別相關方法研究.pdf_第5頁](http://file.renrendoc.com/FileRoot1/2019-7/15/c3ef7364-07e7-4b6e-866c-0663b0e59036/c3ef7364-07e7-4b6e-866c-0663b0e590365.gif)
已閱讀5頁,還剩88頁未讀, 繼續(xù)免費閱讀
[碩士論文精品]車牌定位與識別相關方法研究.pdf.pdf 免費下載
版權說明:本文檔由用戶提供并上傳,收益歸屬內容提供方,若內容存在侵權,請進行舉報或認領
文檔簡介
江蘇大學碩士學位論文 摘要 字符識別是模式識別的一個分支,它能大大提高信息的采集錄入 速度,減輕人們的工作強度。隨著計算機技術的飛速發(fā)展,字符識別 技術多年來不斷改進和完善,現(xiàn)在已經廣泛應用于各個領域,使大量 的文檔資料能快速、方便、省時省力和及時地自動輸入計算機,實現(xiàn) 信息處理的電子化。到目前為止,盡管人們在字符識別的研究中已取 得很多可喜成就,但還不能滿足我們日常的需求。研究字符識別技術, 提高字符識別率具有非常重要的意義。 本文針對字符識別的相關方法進行研究,主要工作包括: 1 進行字符識別前,先要進行圖像預處理,本文對圖像預處理 的一些方法進行了研究,像灰度化、二值化、噪聲處理、特征值提取 等。對灰度化和二值化的各種方法進行了性能比較,針對光照不均勻 的車牌圖像二值化效果不好的問題,給出了一種改進的局部閾值法的 二值化方法,使用這種改進的方法能夠有效的得n - 值化圖像。 2 圖像預處理階段,重點分析了圖像邊緣檢測方法,邊緣檢測 對字符輪廓的提取、車牌定位、字符特征值提取等都非常重要。本文 在深入研究傳統(tǒng)c a n n y 算子的基礎一k ,對雙閾值為極值點給予了證 明,并給出了一種改進的c a n n y 算子,通過對添加了椒鹽噪聲的圖像 進行大量實驗,證明了本文給出的方法性能好于傳統(tǒng)c a n n y 方法。 3 形狀上下文( s h a p ec o n t e x t ) 是一種形狀描述方法,本文給出了 一種改進的形狀上下文方法用于字符粘連的復雜驗證碼識別。傳統(tǒng)的 逐個像素點特征提取和模板匹配的方法,只能對簡單驗證碼進行識 別,而字符粘連的復雜驗證碼還無有效的識別方法。針對字符粘連不 江蘇大學碩士學位論文 能有效的提取單個字符特征的問題,本文給出了改進的形狀上下文方 法進行特征提取,并采用字符整體識別的方法,實現(xiàn)了對復雜驗證碼 的識別。 4 b p 神經網(wǎng)絡作為一種應用最為廣泛的神經網(wǎng)絡學習算法,在 車牌識別中得到了廣泛應用。針對b p 算法存在的收斂速度慢、易陷 入局部極小等缺點,本文引入動量因子和自適應學習速率、改進激勵 函數(shù)以及使用l m 算法對其進行改進。通過大量的車牌識別實驗,本 文將各種改進的b p 算法性能進行了比較,并將本文方法與傳統(tǒng)模板 匹配方法進行性能比較,證明了本文給出的算法性能優(yōu)于傳統(tǒng)模版匹 配方法。 關鍵詞:字符識別,灰度化,二值化,邊緣檢測,形狀上下文,b p 神經網(wǎng)絡 a b s t r a c t c h a r a c t e rr e c 。9 1 1 i t i 。n ,ab r a l l c ho fp a r t e m r e c o g n i t i 。n ,c o u l di n c r e a s e t 1 1 e s p e ? d 。fc 。l l e c t i n ga n di n p i 儺i n gi n f o r m a t i 。n 鏟e a t l y ,m e 枷m h e w 。r km e n s l t yc 7 b e l i g h t e n e d w i t h t h er a p i dd e v e l 。p m e n t0 f c o m p u t e r t e c h n 0 1 。g y ,c h a r a c t e rr e 。c o 簍:? t = o l o g y w a sa l s 0i m p r o v e da n dw i d ea p p l i e d i nm a n y f i e l d s ,d s t h 郵姒0 掣c 1 1 5 e i e c t r o n i 二i 。no fi n f o r m a t i 。nd i s p 。s a l ,t h a t i s ag r e a td e a l “d o c 啪咖1 7 f o 鼉竺( :n c a l lb ei n p i u ti n t oc 。m p u t c rq u i c l ( 1 y c 。n v e n i e n t l y a n da u t o m a n 砌l ym 1 1 i ? 三:t o n 。w ,t h o :幽t h ea c h i e v e m e n t si nm e s t u d y 。fc h a r a c t e rr e c o 印試o n a r c f m n f u l t h e y a r e :t i l ln :te n o u 曲t om e c t 。u rd a i l yl i e e d s t h e r e f o r e ,i t 1 so fk 曲沛p 。n a n c e 幻 肭t h e c h a r a c t e rr e c o g n i t i o nt e c h n o l o g ya n di m p r o v e r e c o 黜o n r a t 已 。a i m i n ga tt h em e t h 。d s r e l a t e dt oc h a r a c t e rr e c 。g n i t i o n ,t h i s p 印e rd l ds 。m e r e s e a r c ho nt h ef o l l o w i n ga s p e c t s : 1 b e f o r er e c o g n i z i n g ,t h ep i c t 岍es h 。u l d b ep r e t r e a t e d t h i sp a p e rs t u d i e ds o ? :_ e p r e t r e a t i n gm e t h 。d s ,s u c h a s g r a y i n g ,b i n a r y z a t i o n n 0 硫p r o c e s s i n 島e i 譬n v a l u 三 :x t r a c t i 。二t h r o u 出c 。m p 撕n gp e 墑m 鋤c e o fd i f f e r e mm 砒o d si n a y l n g 竺 b :x 。a 。i * r v az a t i 。n ,a i m i n ga tt h eb a db i n a r y z a t i 。n e f f e c tp r o b l e m “、,e h i c l eh c e n s 三 | 1 a : c a u s e d 。rb y 唧e v e nl i g h t ,t h i sp a p e r 晰n gu p a i li m p r o v e db i n a r y z a t i 咖c a l l e dl 。c a i t h 佗s h 0 1 dm e t h o d ,b yw h i c h w ec a l lg o tb e t t e rb i n a r yi m a g e 一 2 i i lt l l ei m a g ep r e t r e a t m e n t ,m i sp 印e r i n t r o d u c e di m a g e e d g e - d e t e c t i o nm e t h ,o d 丘r s t e d g ed e t e c t i 。n i sv e r yi m p 。n 鋤tt 0 c h a r a c t e ro u t l i n ee x t r 枷咀h c e n s e :1 之 l o c a t i 。n - c h a m c t e re i g e n v a l u e e x t r a c t i 。n ,e t c b a s e d o nm ed e l i b e r a t e ,r e s e 簍h 。! t r a d i t i 。烈c a i l 】吖。p e r a t 。r ,“sp a p e rp r o v e d t h a tt h ed o u b l e 嘶s h 0 1 d1 s e x 譬m : p o i n t , a 1 1 dp u tf o r w a r dm i m p r o v e dc 鋤yo p e r a t o r 伽u g hc 刪鷗瞅竺譬 e x p e r i m e n tf o rp i 帆鵬i n c r e a s e d s a l ta j l dp e p p e rn 。i s e ,t h em e t i l o dp r o p o s e dm t h i s n a d e rc a l ld e r f o 。r mb e t t e rt h a nt h e t r a d i t i o n a lc 鋤y 1 3 s h 二p ec o n t e x ti sas h a p e d e s c r i p t i o nm e t h o d t h i sp 印e rp r o p 。s e da l m p = d s h a p 三c o n :x t ,u s i n gf o rr e c 。g n i z i n g t h ea d h e r e da n dc 。m p l i c a t e qc a p t c ,h a 1 h e t r :“i 。n a lm e t h 。do fe x t r a c t i n gp i x e lp 。i n t s 。n eb y 。n e a n dt e m p l a t em a t c h l n g c a l l 。n l yr e c o g n i z es 硫p l e c a p t c h a ,w h i l em e r e i s n oe f f i c i e n tm e t h o d t o r e ,c o g ,n i z et h e a d h e r e da i l dc 。m p l i c a t e dc a p t c h a a i m i n g a tt h ep r o b l e mm a ts i n 9 1 ec h a r a c t e : f e a t u r ec a n ,tb ee x t r a c t e de f f i c i e n t l y1 ,e c a u s e 。fc 。n 酉u t i n a t 如n ,t h i s p a p e rp r 。p 。s e ( i i m p r o v e ds h a p ec 。n t e x t t 。e x 刪c b a r a c t e r f e a t u r e ,c 。m b i n e dw i t hc h a r a c t 盯g l o b a l i i i 江蘇大學碩士學位論文 r e c o g n i t i o n ,a n dr e a l i z e dt h ec o m p l i c a t e dc a p t c h ar e c o g n i t i o n 4 a so n eo ft h em o s tp o p u l a rn e u r a ln e t w o r ka l g o r i t h m ,b pn e u r a ln e t w o r kw a s w i d e l yu s e di nt h er e c o g n i t i o no fv e h i c l el i c e n s ep l a t e f o rt h e r ea res o m ed e f e c t s e x i s t e di nb p ,s u c ha sl o wc o n v e r g e n c er a t e ,e a s yt ot r a pi n t ol o c a lm i n i m u m ,t h i s p a p e ri m p r o v e di tt h r o u g hi n t r o d u c i n gm o m e n t u mf a c t o ra n ds e l f - a d a p t i v el e a m i n g r a t e ,i m p r o v i n ga c t i v a t i o nf u n c t i o n ,a n du s i n gl ma l g o r i t h m t h r o u g hag r e a td e a lo f v e h i c l ep l a t ee x p e r i m e n t s ,t h i sp a p e rc o m p a r e dt h ep e r f o r m a n c eo fa l lk i n d so f i m p r o v e db pa l g o r i t h m ,a n da l s oc o m p a r et h em e t h o dp r o p o s e di nt h i sp a p e rw i t ht h e t r a d i t i o n a lt e m p l a t em a t c h i n gm e t h o d ,p r o v e dt h a tt h ea l g o r i t h mp r o p o s e di nt h i s p a p e ri sb e t t e rt h a nt h et r a d i t i o n a lt e m p l a t em a t c h i n gm e t h o d k e yw o r d s :c h a r a c t e rr e c o g n i t i o n ,g r a y i n g ,b i n a r y z a t i o n ,e d g ed e t e c t i o n ,s h a p e c o n t e x t ,b pn e u r a ln e t w o r k i v 學位論文版權使用授權書 本學位論文作者完全了解學校有關保留、使用學位論文的規(guī)定,同意學校 保留并向國家有關部門或機構送交論文的復印件和電子版,允許論文被查閱和借 閱。本人授權江蘇大學可以將本學位論文的全部內容或部分內容編入有關數(shù)據(jù)庫 進行檢索,可以采用影印、縮印或掃描等復制手段保存和匯編本學位論文。 本學位論文屬于 學位論文作者簽名: zo fo 年f 月塢日 保密口,在年解密后適用本授權書。 不保密 勛 指導教師簽名: 2o fd 年f 月f 弓日 疑、易 v 獨倉i j 性申明 本人鄭重聲明:所呈交的學位論文,是本人在導師的指導下,獨立進行研究 工作所取得的成果。除文中已經注明引用的內容以外,本論文不包含任何其他個 人或集體已經發(fā)表或撰寫過的作品成果。對本文的研究做出重要貢獻的個人和集 體,均已在文中以明確方式標明。本人完全意識到本聲明的法律結果由本人承擔。 學位論文作者簽名: 露多安 2 f0 年,月,弓日 江蘇大學碩士學位論文 1 1 研究背景和意義 第一章緒論 光學字符識別( o p t i c a lc h a r a c t e rr e c o g n i t i o n ,o c r ) 技術1 】【2 】【3 1 是模式識別的 一個分支,通過掃描儀把印刷體或手寫體文稿掃描成圖像,然后識別成相應的計 算機可直接處理的字符。它能大大提高信息的采集錄入速度,減輕人們的工作強 度。o c r 技術伴隨著計算機技術的飛速發(fā)展,多年來不斷改進和完善,現(xiàn)在已經 廣泛應用于各個領域,使大量的文檔資料能快速、方便、省時省力和及時地自動 輸入計算機,實現(xiàn)信息處理的電子化。到目前為止,盡管人們在字符識別的研究 中已取得很多可喜成就,但還不能滿足我們日常的需求。 研究字符識別技術的一個直接而現(xiàn)實的意義【4 】是解決文字信息的高速、有 效、方便、自動地輸入到計算機的問題。另一方面,研究光學字符識別技術,在 社會生活的其它領域也有著重要意義,例如:企業(yè)生產自動化( 生產過程中的自 動包裝、印刷質量管理) 、智能交通管理系統(tǒng)( 車牌識別) 、信息采集中的證件識別 ( 身份證識別、名片識別等) 、網(wǎng)絡安全( 驗證碼識別) 等方面。 1 2 國內外研究現(xiàn)狀 1 2 1 字符識別的研究現(xiàn)狀 光學字符識別概念的誕生可以追溯到1 8 0 9 年一項幫助盲人閱讀的裝置的發(fā) 明專利。1 9 2 9 年,由德國的科學家t a u s h e c k 首先正式提出o c r 的概念,并且申 請了專利,美國科學家h a n d e l 也提出了對文字進行識別的方案。但真正的o c i l 系統(tǒng),直到電子計算機誕生后才變成為現(xiàn)實。 第一個o c r 軟件是在1 9 5 7 年開發(fā)的e r a ( e l e c t r i cr e a d i n ga u t o m a t i o n ) , 它是基于窺視孔方法實現(xiàn)的,識別的速度是每秒1 2 0 個英文字母。在此以后,世 界范圍內廣泛地進行著o c r 技術的研究和開發(fā)工作?,F(xiàn)代典型的商品化o c r 系統(tǒng)可分為三代: 1 9 6 0 年到1 9 6 5 年出現(xiàn)的商品化o c r 產品屬于第一代,n c r 公司、f a r r i n g t o n 江蘇大學碩士學位論文 公司、i b m 公司分別研制出了自己的o c r 軟件。這一代產品的特點是被識別的 字符的字體很少,是經過特殊設計或指定的,甚至于某些字符看上去都不太自然。 二十世紀6 0 年代中期到7 0 年代初期的o c r 產品屬于第二代。在這個時期, 有重要意義的事件是建立了一些供字符識別研究的標準化字符數(shù)據(jù)庫,使研究人 員可以很容易地評估自己的進展。 從2 0 世紀7 0 年代中期至今屬于第三代,主要解決的技術問題就是對于質量 較差的文檔及大字符集的識別,以及達到非常高的識別精度,例如漢字的識別, 高精度的手寫數(shù)字識別等。 我國在o c r 技術方面的研究工作起步較晚,在7 0 年代開始對數(shù)字、英文字 母及符號的識別進行研究;7 0 年代末開始進行漢字識別的研究;到1 9 8 6 年漢字 識別的研究進入一個實質性階段,取得了較大的成果,不少研究單位相繼推出了 中文o c r 產品。時至今日,對印刷體漢字的識別率最高可達到9 9 以上,可識 別宋體、黑體、楷體、仿宋體、繁體等多種字體,并且可以對多種字體、不同字 號混合排版進行識別;對手寫體漢字的識別率最高達到7 0 以上。 盡管文字識別率較高,但對于印刷質量較低、圖像傾斜、以及字符粘連斷裂 等干擾,識別正確率有明顯下降。i 司時,目前的版面分析技術,對于版面設計較 為簡單的文本可以達到很高的切分水平,但對于版面設計復雜,或印刷質量不高, 如圖像傾斜或噪聲點過多的文本的分析與切分實用化程度仍有待提高。 隨著計算機技術的飛速發(fā)展,為了適應計算機高速信息處理,作為計算機智 能接口重要組成部分之一的o c r 技術已經受到越來越多的人的重視。 1 2 2 相關方法的研究現(xiàn)狀 1 邊緣檢測 邊緣檢測是圖像處理領域中最基本的問題,它的解決對于進行高層次的特征 提取、特征描述、目標識別和圖像理解等有著重大的影響,因此,被廣泛應用與 模式識別、計算機視覺、圖像分割等眾多領域。近來,隨著科學技術的發(fā)展,一 些新的理論工具被運用到邊緣檢測中,如形態(tài)學、統(tǒng)計學方法、模糊理論、遺傳 算法、神經網(wǎng)絡等等【5 】【6 】【7 】【引。 c a n n y 算子【9 】作為一種優(yōu)化的邊緣檢測算子,具有比較好的信噪比和檢測精 2 江蘇大學碩士學位論文 度,得到了廣泛的應用。然而實際應用中,對于高噪聲的模糊圖像,c a n n y 算子 在抑制噪聲的同時往往錯過一些低強度的邊緣,而一些高強度噪聲被檢測為邊 緣。針對這些不足,國內外學者進行了很多研究,提出了許多的改進方法。文獻 【1 0 提出了一種基于模糊理論的邊緣檢測方法,將c a n n y 算子和模糊推理相結合 進行邊緣檢測,取得不錯的效果;文獻 1 1 】提出一種基于二維經驗模念分解 ( b e m d ) 的c a n n y 算子邊緣檢測算法,通過b e m d 將圖像分解成多層本征模函數(shù), 利用c a n n y 算子對各分量進行邊緣檢測,獲得較好的檢測性能;文獻【1 2 】提出了 一種改進的c a n n y 邊緣檢測算法,采用新的基于梯度方向的檢測和連接方法取 代了傳統(tǒng)的雙閾值法,充分利用邊緣點和噪聲點在梯度方向特性上的差異;文獻 【1 3 提出基于梯度幅度直方圖和類內方差最小化自適應的確定高低閾值的方法, 可針對不同的圖像,實現(xiàn)雙閾值的自適應提取,不需要人為設定任何參數(shù),采用 模糊控制技術提取邊緣像素。 2 形狀上下文( s h a p ec o n t e x t ) 形狀上下文方法【1 4 1 1 1 5 1 是一種以目標輪廓的有限點集合來表示物體特征的描 述方法。該方法首先對目標圖像進行輪廓提取操作( 或者是邊緣檢測操作) ,然 后選擇輪廓或邊緣上的一組離散點的集合來表示該目標的形狀信息。形狀上下作 為一種豐富的形狀特征描述方法,被廣泛的應用于驗證碼識別,人臉識別,基于 內容的圖像檢索技術,形狀匹配等。 傳統(tǒng)形狀上下文主要針對簡單形狀的形狀匹配,為了表示復雜形狀的形狀特 征,國內外一些學者進行了大量研究,提出了一些改進方法。文獻【1 6 】選擇字符 筆畫的一些轉彎點作為樣本像素點,極大的減少樣本像素點數(shù)量,加快形狀上下 文匹配速度;文獻 1 7 】改進邊界提取算法,并融入了擴散濾波的預處理算法和 數(shù)學歸一化方法對形狀上下文進行改進,能處理簡單形狀和人臉形狀匹配;文獻 【1 8 】選擇細化后的字符進行形狀上下文建模,減少了形狀上下文的復雜度,實現(xiàn) 對簡單驗證碼識別;文獻【1 9 】提出了一種結合形狀上下文分析的l a p l a c e 譜匹配算 法,首先使用l a p l a c e 矩陣的特征向量和特征值以及雙隨機矩陣的方法計算初始 匹配概率,然后借助于概率松弛算法,將用形狀上下文表示的局部相似性融入 l a p l a c e 譜匹配算法以優(yōu)化譜匹配的結果,獲得了比較高的精度。 3 b p 神經網(wǎng)絡 江蘇大學碩士學位論文 b p 神經網(wǎng)絡【2 0 】【2 1 】吲是基于誤差反向傳播算法( b a c k p r o p a g a t i o n ) 的多層前向 神經網(wǎng)絡,它是d e r u m e l h a r t 和j l m c c e l l a n d 及其研究小組在1 9 8 6 年研究并 設計出來的,已經成為目前應用最為廣泛的神經網(wǎng)絡學習算法。 由于b p 神經網(wǎng)絡采用的是經典的b p 算法,而b p 算法是基于梯度的最速下降 法,以誤差平方為目標函數(shù),所以不可避免的存在四個缺陷:網(wǎng)絡訓練易陷入局 部極小值;學習過程收斂速度緩慢;網(wǎng)絡的結構難以確定( 包括隱層數(shù)及各隱層 節(jié)點數(shù)的難以確定) ;所設計網(wǎng)絡泛化能力不能保證。近十幾年來,許多專家學 者對其性能做了大量的工作。文獻 2 3 1 提出在激勵函數(shù)中引入陡度因子;文獻 2 4 】 提出分段函數(shù)作為激勵函數(shù);文獻【2 5 】提出在標準誤差函數(shù)中加上一個懲罰項 p ( w ) ,p ( 們2 詈否i r ,從而能提高網(wǎng)絡的容錯能力;文獻【3 l 】通過研究k l 信息距離和神經網(wǎng)絡泛化能力的關系,構造一個新的神經網(wǎng)絡學習函數(shù),取得了 較好的效果;文獻 2 6 】通過引入求解大規(guī)模線性方程組的共軛梯度法,提出了一 種新的基于l m 的前饋網(wǎng)絡學習算法,該算法不僅具有l(wèi) m 優(yōu)化學習方法的快速收 斂性,并且降低了l m 法的計算復雜度,有較好的學習精度和推廣預測能力;文 獻【2 7 】提出了基于b l o c kh e s s i a n 矩陣的二階學習算法,能避免標準b p 算法收斂速 度慢、易陷入局部極小的缺點,并且能克h 艮n e w t o n 法的計算復雜、需大量內存 的缺點。 1 3 研究內容 本文工作的研究內容是以字符識別為研究載體,以字符識別的相關方法為研 究對象,對圖像處理、驗證碼識別、車牌識別進行大量實驗,通過實驗結果對本 文研究的相關方法進行詳細分析。具體的說,本文主要完成了如下幾個方面的不 同分析: 1 圖像預處理階段,對狄度化和二值化進行了研究,對現(xiàn)有的各種方法進行 了比較,給出了一種改進的局部閾值法的二值化方法,針對光照不均勻的車牌圖 像二值化效果不好的問題,使用這種改進的方法能夠有效的得到二值化圖像。 2 針對傳統(tǒng)c a n n y 算子在抑制噪聲和檢測低強度邊緣能力不足的問題,本 文給出一種l o g 算子和c a n n y 算子相結合的邊緣檢測方法。首先采用l o g 算 4 江蘇大學碩士學位論文 子對圖像進行噪聲過濾,然后使用改進的c a n n y 算子實現(xiàn)邊緣檢測。本文還對 c a n n y 算子雙閾值為極值點給予了證明。又通過對添加了椒鹽噪聲的圖像進行大 量實驗,證明了本文給出的方法性能好于傳統(tǒng)c a n n y 方法。 3 傳統(tǒng)的逐個像素點特征提取和模板匹配的方法,只能對簡單驗證碼進行識 別,而字符粘連的復雜驗證碼還無有效的識別方法。本文給出一種形狀上下文 ( s h a p ec o n t e x t ) 的改進方法,采用不對圖片進行切割,整體識別的方法,使用單 像素跟蹤算法獲取字符的輪廓,有效的減少了像素點數(shù)目,降低了形狀上下文描 述的復雜度,采用半圓形式的對數(shù)極坐標建模,解決了兩個字符粘連處字符建模 時互相干擾的問題,準確的描述出字符的特征,實現(xiàn)了對字符粘連的復雜驗證碼 的識別。 4 針對b p 算法存在的收斂速度慢、易陷入局部極小等缺點,本文從引入動 量因子和自適應學習速率、改進激勵函數(shù)以及使用l m 算法對其進行改進。通過 大量的車牌識別實驗,本文將各種改進的b p 算法性能進行了比較,并將本文方 法與傳統(tǒng)模板匹配方法進行性能比較,證明了本文給出的算法性能優(yōu)于傳統(tǒng)模版 匹配方法。 1 4 論文的組織結構 論文共分六章,主要內容概要如下: 第一章:介紹了本文的研究背景和意義及國內外的研究現(xiàn)狀,說明本文的研 究內容和論文的組織結構。 第二章:詳細介紹了字符識別的相關理論,對常見的字符識別進行了描述。 第三章:字符識別的預處理過程,對灰度化的各種方法進行了比較,對二值 化方法也進行了研究,重點對邊緣檢測方法進行了研究和實驗分析,給出了一種 改進的邊緣檢測算法。 第四章:形狀上下文方法和驗證碼識別理論,給出了一種改進的形狀上下文 方法,通過對復雜驗證碼識別進行實驗分析。 第五章:對b p 算法的學習過程進行了分析,給出了改進的b p 算法,通過車 牌識別實驗,分析了改進的b p 算法性能。 第六章:對本文的研究工作進行歸納和總結,探討進一步的研究方向。 江蘇大學碩士學位論文 第二章字符識別方法 模式識另1 ( p a t t e mr e c o g n i t i o n ) 3 l 常稱作模式分類,是指對表征事物或現(xiàn)象的 各種形式的( 數(shù)值的、文字的和邏輯關系的) 信息進行處理和分析,以對事物或現(xiàn) 象進行描述、辨認、分類和解釋的過程,是信息科學和人工智能的重要組成部分。 字符識別是模式識別的一個分支,一般分為數(shù)據(jù)獲取、預處理、特征抽取、 判別、后處理等模塊。其中預處理是字符識別中特別重要的一環(huán),它把原始的圖 像轉換成識別器所能接受的二進制形式。要識別字符首先要對其字符圖像進行預 處理,預處理的主要目的是去除字符圖像中的噪聲、冗余信息,得到規(guī)范化的點 陣,為識別做好準備。這就要求預處理在消除圖像中與識別無關的因素時盡量保 持原圖像的字符特征。字符識別在中文信息處理、辦公室自動化、機器翻譯、人 工智能等高技術領域,都有著重要的實用價值和理論意義。 2 1 光學字符識別系統(tǒng) 一個完整的o c r 系統(tǒng),如圖2 1 ,包括圖像獲取、預處理、特征提取、識 別分類、后處理、識別結果。 2 1 1 圖像獲取 圖2 1o c r 識別的一般步驟 通常采用c c d ( c h a r g ec o u p l e dd e v i c e ) 攝像機或光學掃描儀等獲取圖像, 其主要參數(shù)是圖像分辨率,分辨率包括空間分辨率和灰度分辨率,前者反映了像 素描述在空間上的精細程度,而后者則反映了像素描述在灰度( 色彩) 空問的明暗 程度。 2 1 2 預處理 6 江蘇大學碩士學位論文 預處理效果的好壞會直接影響到整個o c r 系統(tǒng)的性能。一般而言,預處理 的目的是為了濾除噪聲增強有用信息、對退化的信息進行復原。預處理方法一般 有灰度化、二值化、圖像去噪、字符細化、字符規(guī)范化等等。 1 灰度化 手寫體數(shù)字圖像主要是通過掃描儀或攝像機等工具對紙張上的數(shù)字進行數(shù) 據(jù)采集在計算機中成為一幅圖像。在圖像預處理中,人們只關心筆劃, 而不關 心其色彩。先要對讀入的圖像進行灰度化處理。由于2 5 6 色的位圖的調色板內容 比較復雜,使得圖像處理的許多算法都沒有辦法運用,因此首先要對它進行灰度 處理。所謂灰度圖像就是圖像的每一個象素的r 、g 、b 分量的值都是相等的。 彩色圖像的每個像素的r 、g 、b 值是不同的,所以顯示紅綠藍等各種顏色?;?度圖像沒有這些顏色差異,只是亮度不同。灰度值取值范圍是0 _ - 2 5 5 ,取值為0 時是黑色,取值為2 5 5 時是白色,所以灰度值大的像素點比較亮,反之則比較暗。 圖像灰度化有各種不同的算法,常用的一種就是給每個像素的r 、g 、b 值各自 一個加權系數(shù),然后求和,同時對調色板表項進行相應的處理0 2 二值化 在對圖片進行了灰度化處理后,圖像中的每個像素只有一個灰度值,它的大 小決定了像素的亮暗程度。為了以后更方便的對圖像進行處理,先進行二值化處 理。 圖像的二值化處理就是將圖像上點的灰度值置為0 或2 5 5 ,也就是將整個圖 像呈現(xiàn)出明顯的黑白效果。即將2 5 6 個亮度等級的灰度圖像通過選取適當?shù)拈撝?而獲得可以反映圖像整體和局部特征的二值化圖像。 圖像二值化的關鍵在于閾值的選擇。圖像的二值化有很多成熟的算法, 有 整體閾值二值化法、局部閾值二值化法、動態(tài)閾值二值化法等。 整體閾值化方法實現(xiàn)簡單,對于具有明顯雙峰直方圖的圖像效果明顯,而且 速度也是最快的。但是給定整體閾值法有很多缺點,不能根據(jù)每個字符來選擇最 佳閾值,整體閾值一旦給定就不能更改了。并且對于低對比度和光照不均勻的圖 像效果不佳,抗噪聲能力差,因而應用范圍受到極大限制,如分水嶺算法是一種 經典的整體閾值方法,它反映了整個圖像灰度分布情況,但它單一閾值的特性決 定了它的抗噪聲能力較差。 7 江蘇大學碩士學位論文 還有一種由灰度值直方圖確定的整體閾值法。這種方法根據(jù)圖像和背景的灰 度值自動確定整體閾值。灰度級直方圖給出了一幅圖灰度值的概貌描述。數(shù)字圖 像的直方圖一般有兩個峰值,一個峰值對應數(shù)字筆劃部分,另一個峰值對應背景 部分,閩值取在兩個峰值的波谷處,波谷越深陡,二值化效果越好。 局部閾值法能處理較為復雜的情況,但往往忽略了圖像的邊緣特征,容易出 現(xiàn)偽影現(xiàn)象。如經典的局部閾值化b e m s e n 算法,其閾值由考察點鄰域的灰度確 定,算法中不存在預定閾值,適應性比整體閾值法廣,但是當窗口的寬度較小時, 很容易出現(xiàn)偽影現(xiàn)象和目標的丟失;而當窗口寬度增大時,算法的速度將受到很 大影響。 動態(tài)閾值法充分考慮了像元的鄰域特征,能夠根據(jù)圖像的不同背景情況自適 應地改變閾值,可較精確地提取出二值圖像,但它過渡地夸大了像元的鄰域狄度 的變化,會把不均勻灰度分布的背景分割到目標中去,帶來許多不應出現(xiàn)的假目 標。 在數(shù)字圖像處理中,二值圖像占有非常重要的地位,特別是在實用的圖像處 理中,以二值圖像處理實現(xiàn)而構成的系統(tǒng)是很多的,要進行二值圖像的處理與分 析,首先要把灰度圖像二值化,得n - - 值化圖像,這樣有利于在對圖像做進一步 處理時,圖像的集合性質只與像素值為o 或2 5 5 的點的位置有關,不再涉及像素 的多級值,使處理變得簡單,而且數(shù)據(jù)的處理和壓縮量小。為了得到理想的二值 圖像,一般采用封閉、連通的邊界定義不交疊的區(qū)域。所有灰度大于或等于閥值 的像素被判定為屬于特定物體,其灰度值用2 5 5 表示,否則這些像素點被排除在 物體區(qū)域以外,灰度值為0 ,表示背景或者例外的物體區(qū)域。如果某特定物體在 內部有均勻一致的灰度值,并且其處在一個具有其他等級灰度值的均勻背景下, 使用閾值法就可以得到比較好的分割效果。如果物體同背景的差別表現(xiàn)不在灰度 值上( 比如紋理不同) ,可以將這個差別特征轉換為灰度的差別,然后利用閾值選 取技術來分割該圖像。動態(tài)調節(jié)閡值實現(xiàn)圖像的二值化可動態(tài)觀察其分割圖像的 具體結果。 3 圖像噪聲 ( 1 ) 圖像噪聲產生的途徑 一幅圖像在實際應用中可能存在各種各樣的噪聲,這些噪聲可能在傳輸中產 8 江蘇大學碩士學位論文 生,也可能在量化等處理中產生。根據(jù)噪聲和信號的關系可將其分為三種形式 1 2 8 1 : 假設f ( x ,y ) 表示給定原始圖像,g ( x ,y ) 表示圖像信號,n ( x ,y ) 表示噪聲。 加性噪聲,此類噪聲與輸入圖像信號無關,含有噪聲的圖像可表示為 f ( x ,y ) = g ( x ,y ) + n ( x ,y ) ,信道噪聲及光導攝像管的攝像機掃描圖像時產生 的噪聲就屬這類噪聲。 乘性噪聲,此類噪聲與圖像信號有關,含有噪聲的圖像可表示為 f ( x ,y ) = g ( x ,y ) + n ( x ,y ) g ( x ,y ) ,電視圖像中的相干噪聲,膠片中的顆粒噪聲就 屬于此類噪聲。 量化噪聲,此類噪聲與輸入圖像信號無關,是量化過程中存在的量化誤 差,在接收端產生。 ( 2 ) 去除圖像噪聲的幾種方法 均值濾波器 采用鄰域平均法的均值濾波器非常適用于去除通過掃描得到的圖像中的噪 聲。鄰域平均法有力地抑制了噪聲,同時也由于平均而引起了模糊現(xiàn)象,模糊程 度與領域半徑成正比。 幾何均值濾波器所達到的平滑度可以與算術均值濾波器相比,但在濾波過程 中會丟失更多的圖像細節(jié)。 諧波均值濾波器對鹽噪聲效果更好,但是不適用于胡椒噪聲。它善于處理像 高斯噪聲那樣的噪聲。 逆諧波均值濾波器更適合于處理脈沖噪聲,但它有個缺點,就是必須要知道 噪聲是暗噪聲還是亮噪聲,以便于選擇合適的濾波器階數(shù)符號,如果階數(shù)的符號 選擇錯了可能會引起相當嚴重的后果。 這個均值模板是一個低通濾波器,從上到下,從左到右是一個卷積過程,整 個取均值的過程是一個低通濾波過程。 用函數(shù)方法來描述均值法的效果原理:設有一幅數(shù)字噪聲圖像為 g ( x ,y ) = f ( x ,力+ h ( x ,j ,)( 2 1 ) 經均值濾波處理后的平滑圖像為 9 江蘇大學碩士學位論文 ;( 墨力= 擊丟鰣= ;荔朋棚+ ;蘇螂 ( 2 2 ) 在式( 2 1 ) 和( 2 2 ) 中,f ( x ,y ) 是原始圖像,h ( x ,y ) 是噪聲,j 是點( x ,y ) 鄰域內 的點集,丁是點集s 中的總點數(shù)。根據(jù)圖像是由許多狄度恒定的小塊組成的假設, 可以看出式( 2 2 ) 的第一項非常接近于原始圖像;而第二項代表平滑后圖像中的噪 聲,它的均值仍為零,方差為 。 ;善琊 2 專毛以加,d ,= ;蠢 c 2 可見,圖像經平滑處理后可使噪聲方差減小丁倍。因圖像細節(jié)信息主要分布 在高頻區(qū)域,因此均值濾波的過程會導致圖像變模糊。如果模板過大,則這種模 糊會加劇。模板選擇越小,去噪能力會下降。因此模板大小的選擇實際上是去噪 能力和保留圖像細節(jié)的一種折中。 自適應維納濾波器 在線性濾波理論中,維納濾波器是所要解決的最小均方誤差準則下的線性濾 波問題。這種濾波方法是在已知信號與噪聲的相關函數(shù)或功率譜的情況下,通過 求解維納一霍夫方程,對平穩(wěn)隨機信號進行最優(yōu)預測和濾波的。 該方法的濾波效果比均值濾波器效果要好,對保留圖像的邊緣和其他高頻部 分很有用,不過計算量較大。維納濾波器對具有白噪聲的圖像濾波效果最佳。 中值濾波器 它是一種常用的非線性平滑濾波器,其基本原理是把數(shù)字圖像或數(shù)字序列中 一個點的值用該點的一個鄰域中各點值的中間值來代換,其主要功能是讓周圍象 素灰度值的差比較大的像素改為與周圍的像素值接近的值,從而可以消除孤立的 噪聲點,所以中值濾波對于濾除圖像的椒鹽噪聲非常有效。中值濾波器可以做到 既去除噪聲又能保護圖像的邊緣,從而獲得較滿意的復原效果,而且,在實際運 算過程中不需要圖像的統(tǒng)計特性,相對來說這也減少了很多的麻煩,但對一些細 節(jié)特別是點、線、尖頂細節(jié)較多的圖像不宜采用中值濾波的方法。 形態(tài)學噪聲濾除器 將開和閉操作結合起來可用來濾除噪聲,首先對有噪聲圖像進行開操作,可 選擇結構元素矩陣比噪聲的尺寸大,因而丌操作的結果是將背景上的噪聲去除。 1 0 江蘇大學碩士學位論文 然后是對前一步得到的圖像進行閉操作,將圖像上的噪聲去掉。根據(jù)此方法的特 點可以知道,此方法適用的圖像類型是圖像中的對象尺寸都比較大,且沒有細小 的細節(jié),對這種類型的圖像去噪的效果會比較好。 小波去噪 這種方法保留了大部分包含信號的小波系數(shù),因此可以較好地保持圖像細 節(jié)。小波分析進行圖像去噪主要有3 個步驟,第一:對圖像信號進行小波分解。 第二:對經過層次分解后的高頻系數(shù)進行閾值量化。第三:利用二維小波重構圖 像信號。 4 圖像細化 在數(shù)字圖像處理中,很重要的環(huán)節(jié)就是進行分支的細化工作。細化就是在不 改變圖像像素的拓撲連接性關系的前提下,連續(xù)地剝落圖像的外層像素,使之最 終成為單像素寬的圖像骨架,細化后骨架的存儲量要比原來的圖像點陣少得多, 降低了圖像處理的工作量。它是在圖像目標形狀分析、信息壓縮、特征提取與描 述的模式識別等應用中經常運用的基本技術。幾乎所有的光學字符識別都是基于 細化算法的。因此,細化算法的好壞很大程度上決定了o c r 系統(tǒng)的好壞。一個 好的細化算法可以減少細化造成的形變,找到能反映字符真實形狀的特征點,使 系統(tǒng)有較高的識別率;相反,一個不好的細化算法會產生偽特征點,給字符分類 帶來困難,甚至導致誤識或拒識。 經典的細化算法有:h i l d i t c h 算法【2 9 】、r o s e n 算法【3 們,索引表算法,細化根 據(jù)是否使用迭代運算分為兩類:一類是非迭代算法,一次性的產生骨架,常見的 方法如基于距離變換和游程長度編碼等。另一類是迭代算法,即重復刪除滿足一 定條件的圖像邊緣像素,最終得到骨架。迭代方法又分成串行算法和并行算法, 在串行算法中,是否刪除像素在每次迭代的執(zhí)行過程中順序是固定的,它不僅取 決于前次迭代的結果,也取決于本次迭代中已處理過的像素點分布情況,而在并 行算法中,像素點刪除與否與像素值在圖像中的順序無關,僅取決于前次迭代的 結果。 h i l d i t c h 、p a v l i d i s 、r o s e n f e l d 細化算法:這類算法則是在程序中直接運算, 根據(jù)運算結果來判定是否可以刪除點的算法,差別在于不同算法的判定條件不 同。 江蘇大學碩士學位論文 索引表細化算法:經過預處理后得到待細化的圖像是o 、1 二值圖像。像素 值為1 的是需要細化的部分,像素值為0 的是背景區(qū)域?;谒饕淼乃惴ň褪?依據(jù)一定的判斷依據(jù),所做出的一張表,然后根據(jù)要細化的點的八個鄰域的情況 查詢,若表中元素是1 ,則刪除該點,若是0 則保留。因為一個像素的8 個鄰域 共有2 5 6 中可能情況,因此,索引表的大小一般為2 5 6 。 5 變形矯形 在圖2 2 中,原字符圖像f ( x ,y ) 的寬度和高度用w 1 和h l 表示,規(guī)整后字 符g ( x ,y ) 的寬度和高度表示為w 2 和h 2 。規(guī)整化處理的字符局中放置在規(guī)整圖 像內。規(guī)整圖像大小假設為l l ,l 一般設為3 2 或者6 4 像素。原字符圖像和 規(guī)整字符的縱橫比分別用r 1 和r 2 表示: lr :m i n ( w l , h , ) j 1 m a x ( w i ,q ) ( 2 4 ) i 4 l ir : 、72 r a i n ( w 2 , h 2 ) lm a x ( ,h 2 ) w l a ) 原始字符圖像b ) 規(guī)整后字符i 芏l 像 圖2 2 字符圖像大小和位置的規(guī)整化 常用的縱橫比設置包括固定比例( 心= 1 ) ,保持比例( r 2 = 蜀) ,平方根比例 = 周商僦洲r 2 = 瘌撇刪( 恐= 再煒 一旦設置了縱橫比關系,可以確定水平和豎直的縮放比例: 職 口= _ 二 :絲 |h l ( 2 5 ) 按照縮放比例,可以由前向映射( f o r w a r dm a p p i n g ) 或者后向映射( b a c k w a r d m a p p i n g ) 實現(xiàn)坐標變換。前向映射可表示為: 1 2 - xll 江蘇大學碩士學位論文 髓;品 億6 , 為了實現(xiàn)簡便,上式常用一維坐標近似: e 罱 仁7 , 式( 2 7 ) 表示的變換稱為一維規(guī)整方法。最簡單的是線性規(guī)整法 ( 1 i n e a r n o r m a l i z a t i o n ,u : 髓葛 億8 , l n 沒有用考慮像素點的局部分布,而基于線密度均衡的非線性規(guī)整法 ( n o n l i n e a m o r m a l i z t i o n ,n l n l 則考慮到這方面的因素: x 。= h x ( u ) ”? ( 2 9 ) y 、 y = h :哆( v ) v = o 式中h x ( x ) 矛hh y ( y ) ,分別為水平和豎直方向上的歸一化線密度投影。進一步 的,h x ( x ) 和h y ( y ) 分別表示為: 式中的或( x ,y ) 和嘭( x ,y ) 分別為水平和豎直方向上的局部線密度。文獻中, 有大量計算以( x ,y ) 和l d y ( x ,少) 的方法。 在n l n 之后,發(fā)展了大量其它一維和偽二維規(guī)整方法。常用的一維規(guī)整方 法包括一維矩規(guī)整法1 3 1 ( m o m e n tn o r m a l i z a t i o n ,m n ) 、一維雙矩規(guī)整法 1 3 2 ( b i m o m e n tn o r m a l i z a t i o n ,b m n ) 、一維中心邊界調整規(guī)整法 3 3 1 ( c e n t r o i d b o u n d a r ya l i g n
溫馨提示
- 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權益歸上傳用戶所有。
- 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內容里面會有圖紙預覽,若沒有圖紙預覽就沒有圖紙。
- 4. 未經權益所有人同意不得將文件中的內容挪作商業(yè)或盈利用途。
- 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內容的表現(xiàn)方式做保護處理,對用戶上傳分享的文檔內容本身不做任何修改或編輯,并不能對任何下載內容負責。
- 6. 下載文件中如有侵權或不適當內容,請與我們聯(lián)系,我們立即糾正。
- 7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。
最新文檔
- 藥渣委托處理協(xié)議書
- 酒店事故賠償協(xié)議書
- 路政改革擴建協(xié)議書
- 酒店經營管理協(xié)議書
- 鄰居違建協(xié)商協(xié)議書
- 門面轉讓退款協(xié)議書
- 項目資料移交協(xié)議書
- 解除店長職位協(xié)議書
- 鄰居物資互換協(xié)議書
- 隱名股東股東協(xié)議書
- 2024年7月貴州高中學業(yè)水平合格考生物試卷真題(含答案詳解)
- 單位空調維修協(xié)議書
- 2025-2030年少兒藝術培訓行業(yè)發(fā)展分析及前景趨勢與投資研究報告
- 2025AI智算中心基礎設施方案白皮書
- 花卉栽培高級工復習考試題庫(含答案)
- 2025遼寧中考:英語必考知識點
- 2025年中考物理仿真模擬試卷刷題卷 5套(含答案解析)
- 最新美術中國傳統(tǒng)玩具課件PPT
- 名著導讀《紅樓夢》PPT課件(完整版)
- GB∕T 10544-2022 橡膠軟管及軟管組合件 油基或水基流體適用的鋼絲纏繞增強外覆橡膠液壓型 規(guī)范
- Python編碼規(guī)范
評論
0/150
提交評論