基于數(shù)字圖像處理在車牌識別中的應用_第1頁
基于數(shù)字圖像處理在車牌識別中的應用_第2頁
基于數(shù)字圖像處理在車牌識別中的應用_第3頁
基于數(shù)字圖像處理在車牌識別中的應用_第4頁
基于數(shù)字圖像處理在車牌識別中的應用_第5頁
已閱讀5頁,還剩23頁未讀, 繼續(xù)免費閱讀

下載本文檔

版權說明:本文檔由用戶提供并上傳,收益歸屬內容提供方,若內容存在侵權,請進行舉報或認領

文檔簡介

目錄封面封面摘要IabstractII第一章緒論31.1論文的背景及意義31.2數(shù)字圖像處理技術31.3基于圖像處理的車牌識別技術的研究現(xiàn)狀41.4車牌識別存在的主要特點及難點51.5本文主要工作5第二章圖像預處理62.1圖像灰度化62.2圖像灰度拉伸82.3圖像濾波處理92.4水平和垂直彩色邊緣檢測結合旋轉投影校正方法13第三章車牌定位163.1各種車牌定位技術163.2本章提出的車牌定位方法19第四章車牌字符分割及識別224.1常用字符分割方法224.2車牌字符識別234.3基于神經(jīng)元網(wǎng)絡24結論30參考文獻31致謝32數(shù)字圖像處理技術在車牌識別中的應用摘要隨著城市化步伐加快,機動車日益普及,目前許多國家都存在交通事故頻發(fā)、交通擁堵情況嚴重等問題。如何高效的進行交通管理,已經(jīng)成為世界各國關注的焦點。在這種大的背景下,伴隨著計算機技術、通信技術、信息技術的飛速開展,智能交通系統(tǒng)(ITS,IntellingenceTrafficSystem)也隨之誕生,并且已經(jīng)成為當前交通管理開展的主要方向。車輛牌照識別(LPR)系統(tǒng)作為智能交通系統(tǒng)的核心,起著非常關鍵的作用。目前,圖像處理技術在車牌識別中的應用研究已經(jīng)成為科學界的一個重要研究領域。本文在分析圖像處理技術理論的根底上,以車輛牌照為研究對象,主要研究如何通過圖像的預處理、車牌的定位、車牌字符分割和字符識別等一系列過程,以完成汽車牌照的識別。關鍵詞:數(shù)字圖像處理;圖像預處理;車牌定位;車牌字符分割和字符識別TheApplicationOfDigitalImagesProcessingInLicenesePlateRecognition字體不對字體不對abstractWiththeaccelerationofurbanizationandincreasingpopularityofmotorvehicles,nowinmanycountriestherearefrequenttrafficaccidentsandjams.Howtomanagethetrafficefficentlyhasbecomethefocusofattentonaroundtheworld.Inthisenvironment,alongwiththerapiddevelopmentofcomputertechnology,communicationstechnologyandinformationtechnology,theintelligenttransportationsystem(ITS)hasbecomethemaindevelopmentdirectonofthecurrenttrafficmanagement.AsthecoreofITS,theLicensePlateRecognition(LPR)Systemplaysaveryimportantrole.Thisdissertationbaseonanalysisthetheoryofimageproeessingandthevehiclelicenseastheresearchobject.themainresearchhowtheimagepreprocessing,numberplate,positioning,licenseplatecharactersegmentationandcharacterrecognitionandaseriesofprocessesinordertocompletethevehiclelicense

identification.Keywords:Digitalimageprocessing;imagepre-processing;platepositioning;licenseplatecharactersegmentationandcharacterrecognition數(shù)字圖像處理技術在車牌識別中的應用電子信息工程2班,200795024067,安鵬飛指導老師:張昭這應該在封面中,看其他人的這應該在封面中,看其他人的第一章緒論1.1論文的背景及意義交通的開展是社會開展和人民生活水平提高的根本條件,隨著我國經(jīng)濟的快速開展,交通擁擠、交通事故、環(huán)境污染等問題日益突出,保持經(jīng)濟可持續(xù)開展,以提高現(xiàn)有道路、公路網(wǎng)絡的運輸能力和運輸效率的智能交通系統(tǒng)IntelligentTransportationSystem(ITS)成為解決交通運輸問題的一個重要途徑。車輛牌照識別(LPR)系統(tǒng)作為智能交通系統(tǒng)的核心功能局部,在以對行駛車輛的牌照進行自動識別根底上提供高速公路自動收費,電子警察抓拍系統(tǒng),重要交通節(jié)點的管理控制,無人停車場自動管理,小區(qū)智能車輛管理,違章車輛的追蹤以及失竊車輛的調查等功能,以此來提供交通系統(tǒng)的利用率,節(jié)省人力與資金,目前,伴隨著計算機科學技術等一系列相關科技的開展與完善、車輛牌照自動識別系統(tǒng)也逐漸從研究階段轉化到了實用推廣階段。1.2數(shù)字圖像處理技術“圖〞是物體透射光或反射光的分布,“像〞是人的視覺系統(tǒng)對圖的接收在大腦中形成的印象或認識。前者是客觀存在的,而后者為人的感覺,圖像應是兩者的結合。所謂圖像處理,就是對圖像信息進行加工處理,以滿足人的視覺心理和實際應用的要求。人類獲取外界信息有視覺、聽覺、觸覺、嗅覺、味覺等多種方法,但絕大局部(約80%)是來自視覺所接收的圖像信息,即所謂“百聞不如一見〞。由此可見視覺信息對人類的重要性,而圖像正是人類獲取視覺信息的主要途徑。圖像處理的手段有光學方法和電子學(數(shù)學)方法。前者己經(jīng)有很長的開展歷史,從簡單的光學濾波到現(xiàn)在的激光全息技術,光學處理理論已經(jīng)日趨完善,而且處理速度快,信息容量大,分辨率高,又很經(jīng)濟。但是光學處理圖像精度不夠高,穩(wěn)定性差,操作不便。從20世紀60年代起,隨著電子技術和計算機技術的不斷提高和普及,數(shù)字圖像處理進入高速開展時期。數(shù)字圖像處理的英文名稱是“DigitalImageProeessing〞。所謂數(shù)字圖像處理就是利用數(shù)字計算機或者其他數(shù)字硬件,對從圖像信息轉換而得到的電信號進行某些數(shù)字運算,以提高圖像的實用性。通常所說的數(shù)字圖像處理是指用計算機進行的處理,因此也稱為計算機圖像處理(ComputerInageProcessing)。數(shù)字圖像處理技術起源于20世紀20年代,目前,隨著信息高速公路,數(shù)字化地球概念的提出以及因特網(wǎng)的飛速開展,數(shù)字圖像以其信息量大、傳輸速度快、作用距離遠等一系列優(yōu)點已成為人類獲取信息的重要來源。而數(shù)字圖像處理那么因為其處理精度高、處理內容豐富、可進行復雜的非線性處理以及良好的變通能力取得了飛速的開展。1.3基于圖像處理的車牌識別技術的研究現(xiàn)狀基于圖像處理的車牌識別技術的研究在國外起步比擬早,在美國、意大利、德國、以色列、新加坡等國家,現(xiàn)在都已經(jīng)有比擬成熟的產品投入使用,比方美國的〔AUTOSCOF〕2003系統(tǒng)】、、以色列的Hi-Tech公司研制的See/CarSystem、德國西門子公司的ARTEM7SXI系統(tǒng)、新加坡的Optasia公司研制的VLPRS等車牌識別系統(tǒng),但因為我國車牌樣式的多樣性、車牌顏色的多樣性以及包含漢字等特點,這些車牌識別系統(tǒng)部適合我國國情。近幾年,國內也有許多公司以及科研機構進行這方面的研究,并且有一些實用化的產品,這些產品的車牌識別率都在90%以上,但對環(huán)境要求較高,在全天候的條件下,都存在識別精度不高、識別時間長凳缺點,車牌識別技術還存在很大的開展空間。目前,這一領域的研究很活潑?;趫D像處理的車牌識別技術主要包括車牌定位、車牌分割、字符識別等方面的技術。關于車牌定位方面,主要理由車牌的邊緣、形狀、顏色等特征,再結合數(shù)字圖像處理、形態(tài)學、小波變換、人工神經(jīng)網(wǎng)絡等技術對車牌進行定位?;谔卣鞯能嚺贫ㄎ坏姆椒ㄓ蠧.J.Setchel提出的基于字符邊緣檢測的車牌定位方法,通過圖像中的字符邊緣和水平掃描之間相交的邊緣之間的距離分布規(guī)律,確定可行的車牌區(qū)域,通過對區(qū)域的進一步分析來確定真是的車牌區(qū)域。fahmy提出一種基于迭代閾值的車牌定位方法,根據(jù)車牌上文字變化特點快速、準確地從復雜背景中分割車牌。車輛圖像經(jīng)閾值的反復迭代得到一滿意的閾值時,字符將和背景別離,再將圖像進行二值化來定位。這種方法迭代閾值的時間長,而且對噪聲比擬敏感,需要大量的去噪計算工作。完全基于形態(tài)學的算法有運用數(shù)學形態(tài)學的閉運算獲得車牌的候選區(qū),然后采用投影的方法剔除假車牌,定位針車牌。基于神經(jīng)元網(wǎng)絡的方法有基于BP網(wǎng)絡的牌照定位方法,在該算法中,使用一個滑動窗口作為采樣窗口,在灰度圖像上依次移動,將窗口覆蓋下的圖像塊作為神經(jīng)網(wǎng)絡的輸入,當輸出接近0.5時,表示滑動窗口下的圖像塊屬于車牌區(qū)域,當輸出近-0.5時,表示滑動窗口下的圖像屬于背景區(qū)域。人工神經(jīng)網(wǎng)絡算法抗干擾性好,但是由于圖像中的車牌區(qū)域通常只占2%~3%的面積,特征值難以提取,算法也比擬復雜。基于彩色的車牌定位方法有采用多層感知器網(wǎng)絡對輸入彩色圖像進行彩色分割及多級混合集成分類器的車牌自動識別方法。這種方法的主要思想是通過三層MLPN網(wǎng)絡將具體均勻色度的彩色圖像進行色彩分割,再利用投影法分割出潛在的各種底色的車牌區(qū)域。該方法識別正確率高、魯棒性好,車牌定位正確率到達98.6%。還有根據(jù)彩色邊緣檢測算子ColorPrewitt和彩色邊緣檢測與區(qū)域生長相結合的牌照定位算法。這種方法的主要思想是通過邊緣檢測算子ColorPrewitt和彩色邊緣檢測,增強牌照區(qū)域,并借助數(shù)學形態(tài)學膨脹技術實現(xiàn)區(qū)域的連通,采用區(qū)域生長方法標記候選區(qū)域,最后利用車牌的先驗知識,剔除虛假車牌區(qū)域,確定真正的車牌區(qū)域。1.4車牌識別存在的主要特點及難點從目前一些車牌識別產品的性能指標可以看出,LPR系統(tǒng)的識別率和識別速度有待提高。特別是在車牌定位方面,還沒有一種通用的方法,研究高速、準確的定位與識別算法依然是當前需要解決的一個研究方向,車牌定位和識別,特別對我國車牌識別技術,存在以下的難點:⑴漢字識別率問題。目前無論哪個車牌識別系統(tǒng),當圖像的分辨率降到一定程度時,漢字識別率都急劇下降。如何抽取漢字的有效特征使識別率提高,是目前研究的主要問題之一。⑵自然環(huán)境問題。監(jiān)控系統(tǒng)攝取的車牌圖像含有豐富的自然背景及車身背景信息,易受照明條件、天氣因素及運動失真和模糊的影響,因此所獲取的圖像質量一般都不高。⑶車牌種類的多樣性問題。國外許多國家汽車牌照的底色和字符通常只有比照度較強的兩種顏色,而我國汽車牌照僅底色就有藍、黃、黑、白等多中顏色,字符也有黑、紅、白等假設干種顏色;同時根據(jù)不同車輛、車型、用途,規(guī)定了多種牌照格式〔例如分為軍車、警車、普通車等〕。⑷其他因素。如車牌懸掛位置不標準,車牌受到嚴重污染等也嚴重影響了車牌的識別率。1.5本文主要工作本文以車牌照為研究對象,運用圖像處理和模式識別技術來實現(xiàn)車牌照的檢測與識別,其中對車牌照的定位與分割和車牌照字符的分割與識別提取進行了深入研究;主要研究了如何通過圖像的預處理、車牌的定位、車牌字符切分和字符識別等一系列過程完成汽車牌照的識別。本文主要工作如下:1、通過閱讀大量的文獻,對車牌自動識別技術的應用背景和研究意義、車牌識別系統(tǒng)的技術難點以及車牌自動識別技術的開展和研究現(xiàn)狀進行了系統(tǒng)的闡述。2、針對采集得來的車牌圖像質量低、噪聲大等缺點,在對車牌識別前得進行一系列的預處理,如灰度化、灰度拉伸、二值化、濾波等操作,并在此根底上提出一些改良的方法和技術。3、車牌識別精確度的上下主要取決于車牌定位精確度的上下,車牌定位在車牌識別中占據(jù)很重要的地方,本問對現(xiàn)有的定位技術進行簡單的分析,然后提出一種快速且魯棒性強的車牌定位算法。4、車牌字符分割和識別同樣是車牌識別的關鍵,文章對多中分割技術進行分析的同時指出其優(yōu)點和缺點;采用神經(jīng)元網(wǎng)絡識別技術對車牌的字符進行識別,詳盡介紹了BP網(wǎng)絡實現(xiàn)識別的步驟和原理。最后,對本文的工作進行了總結,并對后續(xù)的研究工作進行了一些探討。第二章圖像預處理在汽車成像的過程中,受多種因素的影響,圖像質量會有所下降,這種圖像質量下降的過程稱為圖像的退化。由于自然光照度的變化、車輛自身的運動,采集圖像設備本身的因素等的影響,會引起汽車圖像的退化,從而干擾對車牌信息的提取。為了改善退化的牌照圖像,必須對圖像進行預處理。對圖像進行預處理,主要包括圖像的二值化、灰度拉伸和增強等方法。2.1圖像灰度化目前,采集到的車牌原始圖像大都是通過攝像機、數(shù)碼相機等設備來拍攝獲取的。一般情況下,得到的都是彩色圖像。彩色圖像包含大量的顏色信息,它的每個像素都具有三個不同的顏色分量R、G、B,其需要占用的存儲空間很大,對其進行處理時會浪費較多的系統(tǒng)資源,降低系統(tǒng)的執(zhí)行速度?;叶葓D像是只含亮度信息不含色彩信息的圖像,其中亮度值量化為256級?;叶葓D進行算法處理相對簡便,首先RGB值一樣,且圖像數(shù)據(jù)就是調色板索引值,也就是實際的RGB亮度值,又因調色板是256色的,所以圖像數(shù)據(jù)中一個字節(jié)代表一個像素。如果是彩色的256色,那么經(jīng)過圖像算法處理后,可能產生不屬于這256種顏色的新顏色,而真彩色RGB圖像必須用三個與圖像尺寸相同的矩陣來存儲,這樣計算代價過大。所以,在實驗室中一般采用256級灰度圖來進行處理。本論文中用到的圖像,是用攝像機獲得的24位彩色位圖文件格式。位圖格式〔BMP格式〕的圖像由文件頭、位圖信息頭、圖像數(shù)據(jù)等局部組成。文件頭和信息頭包含文件類型、大小等信息。BMP圖像以像素為單位記錄圖像數(shù)據(jù)。24位BMP格式文件的每個像素點均用3個字節(jié)〔24位〕來表示像素值,3個字節(jié)分別存儲紅、綠、藍3原色的值。彩色位圖格式包含圖像的原始信息,所含信息豐富。但是彩色位圖圖像的原始數(shù)據(jù)量龐大,存儲空間大,處理速度慢。文中的車牌算法是基于灰度圖像實現(xiàn)的,因此需要先對整個圖像灰度化。這樣做可以同時提高處理速度與去掉無用的信息。顏色的三個分量分別用R,G,B表示,像素點的灰度值為Grey,圖像灰度化可采用下面方法實現(xiàn):Gray(x,y)=0.299×R(x,y)+0.587×G(x,y)+0.114×B(x,y)(2-1公式編輯器)公式編輯器Gray(x,y)是轉換后灰度圖像在點(x,y)的灰度值,R(x,y)、G(x,y)、B(x,y)分別為轉換前點(x,y)的R、G、B分量。如圖2-1所示為24位真彩圖車輛圖像及灰度圖:圖2-1圖2-12.2圖像灰度拉伸許多拍攝的圖像中,灰度級集中在很小的區(qū)域內,比照度不良,影響人機器對圖像的理解。此時可以利用灰度的線性拉伸將灰度范圍拓展到0-255的度范圍?;叶壤旌突叶鹊木€性變換有點類似,都用到了灰度的線性變換。不同之拉伸不是完全的線性變換,而是分段進行線性變換,它的拉伸范圍和拓展程度是可以自由選擇的?;叶壤斓暮瘮?shù)表達式如下:〔2-2〕式中(,)和(,)是圖2-2的兩個轉折點的坐標?;叶壤炜梢愿屿`活的控制輸出灰度直方圖的分布,它可以有改善輸出圖像。圖2-2所示的變換函數(shù)的運算結果是將原圖在和之間的灰度拉伸到和之間。圖2-2如果一幅圖像灰度集中在較暗的區(qū)域而導致圖像偏暗,可以用灰度拉伸功能來拓展(斜率>1)物體灰度區(qū)間以改善圖像;同樣如果圖像灰度集中在較亮的區(qū)域而導致圖像偏亮,也可以用灰度拉伸功能來壓縮(斜率<1)物體灰度區(qū)間以改善圖像質量?,F(xiàn)在關鍵的問題是如何選取適當?shù)?,、和、,使得比照度增強明顯,拉伸效果更理想。,、的選取有多種方法,總的原那么選取灰度最為集中的一段的左右端點。可以利用灰度直方圖,,、分別選取為直方圖的最大波峰兩側波谷所對應的灰度值。也可以固定灰度步長進行掃描,對步長內的像素點個數(shù)累積求和,找出最大值,x,、分別選取為取得最大值的灰度范圍的左右端點。在我們的系統(tǒng)中,,、選取為兩大谷底對應的灰度值,;,這樣就可以把高灰度區(qū)和低灰度區(qū)壓縮,中間灰度區(qū)域拉伸,取得了很好的效果,其處理效果如圖2-3所示。圖2-3灰度拉伸圖2-3灰度拉伸2.3圖像濾波處理經(jīng)圖像采集系統(tǒng)獲取的原始圖像,通常都含有各種各樣的噪聲與畸變,這將大大影響系統(tǒng)的識別精度。因此,在進一步處理之前,必須對圖像進行濾波。采用適當?shù)臑V波方法,可以將圖像中感興趣的特征突出,并削弱不需要的特征,以改善圖像的質量。圖像增強的方法分為空域法和頻域法兩類,空域法主要是對圖像中的各個像素點進行操作;而頻域法是在圖像的某個變換域對整個圖像進行操作,并修改變換后的系數(shù),如傅立葉變換、DCT變換等的系數(shù),然后再進行反變換,便可得到處理后的圖像。對圖像進行處理,通常采用空域濾波的方法,下面介紹幾種常用的空域濾波器。常用濾波方法介紹.1均值濾波均值濾波器適用于去除圖像中的顆粒噪聲。對于給定的圖像f(i,j)中的每個像素點(m,n)處的灰度,取其鄰域S。設S含有M個像素,取其平均值作為處理后所得圖像點(m,n)處的灰度。鄰域S的形狀和大小根據(jù)圖像特點確定。一般取的形狀是正方形、矩形和十字形等,S的形狀和大小可以在全圖處理過程中保持不變,也可根據(jù)圖像的局部統(tǒng)計特性而變化,類似點(m,n)一般位于S的中心。例如S為3×3鄰域,點(m,n)位于S中心,那么:(2-3文件要求右對齊)文件要求右對齊假設噪聲n是加性噪聲,空間中各點互不相關,且期望為0,方差為,g是未受污染的圖像,含有噪聲的圖像f經(jīng)過鄰域平均后為:(2-4)由公式〔2-4〕可知,經(jīng)鄰域平均后,噪聲的均值不變,方差,即噪聲方差變小,說明噪聲強度減弱了,抑制了噪聲。而且鄰域平均法也平滑了圖像信號,特別是可能使圖像目標區(qū)域的邊界變得模糊??梢宰C明,對圖像進行鄰域平均處理相當于圖像信號通過低通濾波器。.2中值濾波段前端后行距設置對嗎?段前端后行距設置對嗎?中值濾波器是一種非線性濾波器,也是一種典型的低通濾波器,中值濾波是將鄰域中的像素按照灰度大小排序,假設像素的數(shù)量為奇數(shù),那么取中間的數(shù)作為待處理像素的灰度值,假設像素的數(shù)量為偶數(shù),那么取中間的兩個像素灰度的平均值作為待處理像素的灰度值,假設一組數(shù)據(jù)按原來的位置排序為5、2、7、6、1,中值濾波的算法是將這組數(shù)排序為1、2、5、6、7,待處理的數(shù)為7,那么用5代替7,處理后的一組數(shù)變?yōu)?、2、5、6、1。事實上,中值濾波器是用n×n的濾波器除去那些相對于其鄰域像素更亮或更暗,并且其區(qū)域小于n2/2〔濾波器區(qū)域的一半〕的孤立像素集。中值濾波器能夠在抑制噪聲的同時不使邊緣模糊,而且方法簡單、易實現(xiàn),但有時會喪失圖像的細節(jié)。中值濾波器可以推廣到二維,對二維圖像操作,二維中值濾波器的窗口形狀和尺寸對濾波效果影響較大,對于不同內容不同應用要求的圖像,需要采用不同尺寸和形狀的窗口。窗口的形狀可以是矩形、圓形和十字形等,窗口的尺寸一般先用3點,再取5點然后逐點增大,直到到達滿意的效果。改良的快速中值濾波算法上述的各種方法,在去噪的效果上都取得了一定的效果,但是都沒有考慮到濾波的耗時問題。本文針對標準濾波的排序方法,根據(jù)窗口在移動過程中前后窗口之間的相關性,同時根據(jù)窗口內像素間的統(tǒng)計特性,采用方差和均值對像素點進行噪聲判斷,來降低對邊緣細節(jié)信息的影響,提高濾波效果和濾波的自適應性。此改良的快速中值濾波算法主要包括:中值確實定、噪聲點確實定和濾波處理三個環(huán)節(jié),下面予以詳述?!?〕中值確實定由于較大的窗口會倍增濾波時間,且窗口越大,圖像邊緣細節(jié)喪失越多,因此,在實際實驗中采用3×3窗口進行濾波。用一個3×3窗口在圖像中掃描,把窗口內包含的圖像像素按灰度級升序或降序排列,取圖像灰度值居中的像素灰度為窗口中心像素的灰度,便完成了中值確實定?!?〕噪聲點確實定噪聲點確實定主要是判斷該像素點的灰度值是否大于某一個閾值,如果大于那么為噪聲,反之那么為信號點。關于此閾值主要有兩種途徑得到,一是根據(jù)長期處理去噪的經(jīng)驗得來,二是采用窗口內像素點的均值來粗略估計。這兩種方法噪聲判斷率不高。本文根據(jù)像素點之間的統(tǒng)計特性,采用均值和方差同時作用來確定噪聲點。以噪聲圖像的像素Z(i,j)為中心,選取像素為3×3的窗口,求出該窗口內像素的均值M和方差〔2-5〕〔2-6〕根據(jù)噪聲的特性,該像素點值Z(i,j),如果滿足:Z(i,j)≥M+3δ或者Z(i,j)≤M-3δ,那么該像素為噪聲點?!?〕濾波處理根據(jù)上面噪聲點確定的結果,如果為噪聲點,那么用中值取代該像素點灰度值,否那么,該像素點的灰度值不變。此處理過程有效的降低了去噪過程對圖像邊緣細節(jié)信息的影響,提高了圖像的信噪比。通過以上研究分析,基于VC++采用了以上算法。對模擬圖像進行了濾波比擬,并分別用3×3窗口進行實驗,所得到的結果如圖2-4所示圖題在哪里圖題在哪里原圖效果圖2.4水平和垂直彩色邊緣檢測結合旋轉投影校正方法由于攝像機和車牌之間角度的變化,常常使所拍攝的車牌圖像產生傾斜現(xiàn)象,給字符分割帶來不利影響,造成誤分割和車牌識別率的下降。因此,需要在字符分割之前進行車牌的傾斜校正。目前的車牌傾斜校正方法主要有:(1)Hough變換法。通過Hough變換求取車牌的邊框,進而確定車牌的傾斜角;或者由Hough變換提取牌照邊框的參數(shù)后,再求解牌照區(qū)域四個頂點的坐標,然后通過雙線性空間變換對畸變圖像進行校正。(2)通過模板匹配尋找牌照區(qū)域的四個頂點,再通過雙線性空間變換重建矩形車牌區(qū)域。(3)通過求取車牌字符區(qū)域的局部極小和局部極大特征點,再進行投影確定車牌的傾斜角。(4)通過求取車牌上各字符連通域的中心點,然后擬合為直線來確定車牌的傾斜角。由于圖像中車牌的邊框有時并不明顯(如有的白牌白車),且因噪聲、污跡等干擾的影響,造成Hough變換后參數(shù)空間中的峰值點很分散,這使得方法(1)和方法(2)效果并不理想;當車牌上有污跡和噪聲時,方法(3)的檢測精度下降;由于二值化等原因,車牌上字符會有粘連和斷裂現(xiàn)象,就使得方法(4)的效果也不理想。而且,上述四種方法有一個共同的缺陷,就是當圖像比照度較小、光照不均時,檢測到的傾斜角誤差較大.本文提了一種新的車牌傾斜校正方法,該方法采用水平和垂直彩色邊緣檢測結合旋轉投影求取車牌的水平和垂直傾斜角度,然后進行雙線性插值傾斜校正。大量實驗說明,該方法簡單實用,對光照不敏感,抗干擾性強。水平和垂直彩色邊緣檢測設C〔〕代表圖像位置〔〕處的彩色向量,C〔〕=(R(),G〔〕,B()),以C〔〕為中心取一〔2w+1〕(2w+1)的窗口,其中,w為大于等于1的整數(shù)。令:(2-7)(2-8)〔2-9)(2-10)那么處的垂直彩色梯度和水平彩色梯度分布定義為:(2-11)(2-12)其中,||*||代表歐幾里得范數(shù)。設和分別代表DV的均值和標準方差,和分別代表DH的均值和標準方差,那么按下式對圖像進行二值化,獲取圖像的水平彩色邊緣和垂直彩色邊緣:(2-13這里不用黑體)這里不用黑體(2-14)雙線性插值在對車牌圖像進行傾斜校正時,輸出像素常被映射到圖像的非整數(shù)位置,最典型的是在四個輸入像素之間.因此,需進行彩色向量插值運算.插值方法主要有最近鄰插值、雙線性插值和高階插值等.最近鄰插值算法簡單、運算量小,但有塊狀效應;高階插值插值效果好,但運算量大.雙線性插值的運算量小于高階插值,插值效果雖不如高階插值,但明顯優(yōu)于最近鄰插值,完全能滿足車牌識別的需要.所以,本文選擇雙線性插值算法進行圖像插值運算.雙線性插值示意圖如圖2-5所示.像素C被C、C、C和C四個像素包圍,那么應改用公式編輯器〔2-15〕應改用公式編輯器圖2-5作為一種特殊情況,當像素C〔〕落在C和C之間時,那么有:〔2-16〕2.4.3由于道路的坡度、車牌的懸掛和攝像機與車牌之間傾斜角度的影響,使得拍攝到的車牌圖像產生了傾斜,這實際上是一種透視失真.一般情況下,可將傾斜的車牌圖像近似看成一個平行四邊形,可有三種傾斜模式:水平傾斜、垂直傾斜和水平垂直傾斜,分別如圖2-6、圖2-7和圖2-8所示.圖2-6為水平傾斜的兩種情況,這時字符根本上無傾斜,車牌的水平x軸與圖像的水平x軸有一個傾斜角度-,只要求取,將圖像繞x軸旋轉-即可.圖2-7為垂直傾斜的兩種情況.這時的傾斜實際上是同一行間像素的錯位偏移.只要檢測到垂直傾斜角度β進行錯位偏移校正即可.圖2-8為水平垂直傾斜的兩種情況,既存在水平傾斜又存在垂直傾斜,是最一般的情況.可先檢測水平傾斜角度進行水平傾斜校正,然后再求取垂直傾斜角度進行垂直傾斜校正.圖2-6水平傾斜圖2-7垂直傾斜圖2-8水平垂直傾斜每章完結要總結這一章的工作第三章車牌定位對于整個車牌識別系統(tǒng)來說,車牌識別精確度的上下主要取決于車牌定位精確度的上下,而車牌定位又是車牌識別中最難解決的一步,迄今為止,仍然沒有一個完全通用的智能化車牌定位的方法。當前車牌定位的方法主要有利用顏色信息、基于小波和形態(tài)學相結合的算法、二值化投影等。這些方法主要存在:參數(shù)的調節(jié)受識別環(huán)境的影響較大,在環(huán)境發(fā)生改變時由于參數(shù)的選擇不當往往會造成誤定位和漏定位;計算復雜度較高,定位速度較慢,影響車牌識別的實時性能。針對以上情況,本文提出了一種快速且魯棒性強的車牌定位算法。它主要根據(jù)車牌在水平方向上能量高且集中的特點,先通過一種自適應的高通能量濾波快速地粗分割出車牌的候選區(qū)域,再用車牌較為細致的紋理特征對候選區(qū)域進行校驗和修正,最后得到車牌的精確位置。3.1各種車牌定位技術基于邊界的車牌定位技術圖像邊界是圖像局部特征不連續(xù)性〔灰度突變、顏色突變、紋理結構突變等〕的反映,它標志著一個區(qū)域的終結和另一個區(qū)域的開始,邊界蘊含著豐富的內在信息〔如方向、階躍性質、形狀等〕,它是識別中重要的圖像特征之一。目前常用的基于邊界的分割技術包括邊緣算子法〔如一階微分算子、sobel算子、Hough變換等〕、模塊匹配法、邊緣跟蹤法、線擬合法等。基于特征的車牌車牌定位算法是利用一階微分算子對原始圖像的邊緣進行預處理,并在根底上運用數(shù)學形態(tài)學的閉運算獲得車牌的獲選區(qū),然后采用投影的方法剔除假車牌,定位真車牌,這種方法的算法簡單,減少了噪聲的干擾,能夠滿足實時定位的要求?;趨^(qū)域的車牌定位技術車輛圖像像一般是在室外拍攝的,其背景較復雜,而車輛牌照具有不因外部條件變化而改變的特征,即車牌內有多個根本成水平排列的字符,字符和牌照底面在灰度上存在跳變,呈現(xiàn)出規(guī)那么的紋理特征。基于區(qū)域的車牌識別技術就是根據(jù)車牌的紋理特征將圖像分成不同的區(qū)域,然后對目標區(qū)域進行檢測。目前基于區(qū)域分割的技術主要包括閾值化方法、特征空間聚類方法、區(qū)域生長法、分裂合并法等?;谧址螤钐卣鞯能嚺品指罘椒ǎ饕槍ε普兆址厮椒较蚺帕械囊?guī)那么紋理,采用了一種線性濾波器來初定車牌區(qū)域,采用平均值的方法選取閾值而進行二值化,然后利用投影的方法進行精確定位。這種方法能夠在對牌照的字符、牌照位置及其大小、顏色和車牌的背景等做最小限定的條件下,對牌照中字符串進行增強,實現(xiàn)復雜背景中車輛牌照的自動分割。基于神經(jīng)元網(wǎng)絡的車牌定位技術人工神經(jīng)元網(wǎng)絡是進行模式識別的一種重要方法,今年來,它以其抗噪聲、容錯、自適應等能力強而得到廣泛的應用。例如,ThanongsakSirithnaphong和KosinChamnongthai提出的基于BP網(wǎng)絡的牌照定位方法,M.H.terBrugge等人提出的利用DTCNN和模糊邏輯相結合的方法。在這些方法中,神經(jīng)元網(wǎng)絡相當于濾波器,這些濾波器通過分析牌照的顏色、紋理等對圖像進行分類,確定此像素屬于牌照區(qū)域還是屬于背景區(qū)域。在這類BP算法中,使用一個滑動窗口作為采樣窗口,在灰度圖像上依次移動,將窗口覆蓋下的圖像塊作為神經(jīng)網(wǎng)絡的輸入,所采用的BP網(wǎng)絡是三層全連接前饋網(wǎng)絡,其輸入層神經(jīng)元數(shù)目為滑動窗口的尺寸,其輸出層神經(jīng)元數(shù)目為1,當輸出接近時,表示滑動窗口下的圖像塊屬于車牌區(qū)域,當輸出接近—時,表示滑動窗口下的圖像屬于背景區(qū)域?;谛〔ǚ治龊妥兓嚺贫ㄎ患夹g小波變換是分析和處理非平穩(wěn)信號的一種有力工具,它是以局部化函數(shù)所形成的小波基作為基底而展開,是一種窗口大小固定不定但形狀可改變的時頻局部化分析方法,小波變換的根本思想是將原始信號通過伸縮及平移后,分解為一系列具有不同空間分辨率、不同頻率特性和方向特性的子帶信號,這些子帶信號有良好的時域、頻率等局部特性。它在信號的高頻局部,可以取得較好的時間分辨率,在信號的低頻局部,可以取得較好的頻率分辨率,這些特性可用來表示原始信號的局部特征,進而實現(xiàn)對信號時間、頻率的局部化分析,以克服Fourier分析在處理非平穩(wěn)的復雜圖像時所存在的局限性。用小波變換可以進行圖像增強、特征提取、邊緣檢測、圖像分割、紋理分析、圖像壓縮、模式識別等方面的處理。邊緣是圖像分析對象中的重要特征之一,而邊緣檢測又是圖像處理中一個困難的問題,這是因為實際景物圖像中的邊緣往往是各種類型的邊緣以及它們模糊化后結果的組合,對邊緣確實認有時甚至涉及心理學的因素,且實際圖像信號存在著噪聲,噪聲和邊緣一樣都屬于高頻信號,很難用頻帶作取舍。但邊緣與噪聲的顯著區(qū)別是兩者能量不同,邊緣有較大的能量和范圍,隱藏在平滑濾波作用下,它不會像噪聲那樣消失,而是表現(xiàn)為模糊化。利用小波檢測邊緣的一般方法就是先將圖像進行多尺度小波變換,然后在各尺度下求梯度方向和梯度矢量模,根據(jù)矢量模塊在各尺度下求邊緣提取及鏈化,然后根據(jù)設定的規(guī)那么進行多尺度匹配,符合多尺度邊緣鏈,重構圖像邊緣模型,最后對取得的邊緣信息進行投影處理,就是可以得到車牌所在確實定位置。采用小波分析提取邊緣的算法,能夠彌補傳統(tǒng)的邊緣檢測算法的缺乏,在有效地抑制噪聲影響的同時,提供了較高的邊緣定位精度。基于顏色空間的車牌定位方法由于車輛牌照具有與車牌號、車身、背景不同的底色,顏色反差較大,而且車牌的底色也比擬固定,可以在此根底上過濾一些背景信息和噪聲干擾,再結合神經(jīng)元網(wǎng)絡、形態(tài)學、邊緣算子、投影法等技術精確地分割出車牌。還有一種彩色分割及多級混合集成分類器的車牌自動識別技術,該方法采用多層感知器網(wǎng)絡對輸入彩色圖像進行彩色分割,通過投影法分割出潛在的車牌區(qū)域并進一步瘋出字符,由多級混合集成分類器給出字符識別的初步識別結果及置信度,經(jīng)過處理后得到最終的結果。這種方法的典型代表是彩色邊緣檢測算子ColorPrewitt和彩色邊緣檢測與區(qū)域生長相結合的牌照定位算法ColorLP.這種方法的思想是通過邊緣檢測算子ColorPrewitt和彩色邊緣檢測,增強牌照區(qū)域,并借助數(shù)學形態(tài)學膨脹技術實現(xiàn)區(qū)域的連通,采用區(qū)域生長法標記候選區(qū)域,最后利用車牌的先驗知識,剔除虛假車牌區(qū)域,確定真正的車牌區(qū)域?;谑噶苛炕能嚺贫ㄎ环椒ㄊ噶苛炕饕獞迷趫D像壓縮、編碼領域,其根本原理就是將圖像分割成根本的塊,將所有可能出現(xiàn)的塊組成一個數(shù)據(jù)空間。在這個數(shù)據(jù)空間中,一些特定的塊被選作參考矢量,又叫碼字,全部碼字的集合構為碼字。量化編碼過程就是為每一個塊在碼字中找一個與之最相似的碼字,然后用這個碼字的索引表示這個塊,通常用Eucclidean距離衡量某個塊與碼字之間的相似程度。由于碼書中碼字的數(shù)量總是少于所有可能出現(xiàn)的塊的數(shù)量,矢量量化是一種有損壓縮,采用矢量量化進行牌照定位的出發(fā)點在于圖像的矢量量化編碼過程隱含了對圖像紋理的分析過程。碼字和需要編碼的塊屬于同樣的數(shù)據(jù)空間,在塊的編碼的過程中,找出其最相似的碼字,實際上就完成了對塊內容的一種分類,因此它可以判別某個塊是否可能位于牌照區(qū)域。3.2本章提出的車牌定位方法基于能量濾波的車牌粗定位在數(shù)字圖像處理中,能量是一種描述紋理特征的統(tǒng)計參數(shù),其一般表達式為:〔3-1〕式中p(x,y)為坐標(x,y)的特征值。考慮到在實際捕獲的汽車圖片中,車牌往往是水平方向上亮度值跳變劇烈且集中的區(qū)域。因此,選取p(x,y)為水平方向上的亮度差分值,即〔3-2〕式中I(x,y)為坐標(x,y)的亮度值。那么車牌區(qū)域在圖像中表現(xiàn)為水平方向上能量高而集中的區(qū)域。所以,基于能量濾波的車牌定位的主要思想是先通過一種高通能量濾波快速地將圖片中絕大局部平滑區(qū)域(即能量低的區(qū)域)濾除掉,再在剩余區(qū)域根據(jù)車牌形狀的先驗知識粗分割出車牌的候選區(qū)域,最后對候選區(qū)域進行校驗和修正。在進行能量濾波之前,可先將原圖像平均劃分為(n一般取8)的小方塊,分別計算各個小方塊內的能量,即0≤i≤M′,0≤j≤N′〔3-3〕M′=M/n,N′=N/n這樣做的優(yōu)點是:1〕將M×N的圖像處理轉化為縮小了n×n倍且為M′×N′的二維數(shù)組的處理,極大地加快了車牌分割的速度;2〕可去除掉水平方向上亮度值跳變劇烈但分布稀疏的區(qū)域,從而最大限度地減少干擾源的影響。圖3-1是將各小方塊內的能量量化到(0,255)區(qū)間后得到的直方圖。圖3-1二維能量數(shù)組直方圖由圖可以看出,絕大局部區(qū)域(平滑區(qū)域)分布在能量低的區(qū)間少局部區(qū)域(車牌候選區(qū)域)分布在能量高的區(qū)間。因此,假設選取適宜的閾值,可以快速地粗分割出車牌候選區(qū)域,即〔3-4〕0≤i≤M’,0≤j≤N’式中Th為選取的閾值。B(i,j)=1表示(i,j)在原圖中對應n×n的區(qū)域,為車牌候選區(qū)域;反之,為其他區(qū)域而被濾除掉。然后根據(jù)車牌區(qū)域在水平方向上能量集中的特點和車牌形狀的先驗知識,在能量數(shù)組E(i,j)中找取K個滿足B(i,j)=1的連通體C(k)(k=1,?,K),并得到包圍C(k)的最小矩形框R(k)。再由R(k)的水平寬度可進一步去掉局部非車牌區(qū)域,即假設〔3-5〕那么R(k)為非車牌區(qū)域被濾除掉。式(3-5)中,Width表示水平寬度;為寬度閾值且與圖像中車牌的實際寬度成正比。剩余的候選區(qū)域留作下一步進行檢驗。在上面的處理中,式(3-4)中的Th取值至關重要。假設Th過大,真正的車牌區(qū)域有可能局部和全部被濾除掉,從而出現(xiàn)漏定位;假設Th過小,會出現(xiàn)大量的干擾區(qū)域,不僅會大幅度增加檢驗的時間,還會導致錯定位。因此,采取的自適應選取Th的算法為:1)選取初始的Th,且≤Th≤。2)由式(3-4)得到B(i,j),并檢查有無滿足式(3-5)的R(k)。假設有,執(zhí)行4〕;假設無,執(zhí)行3〕。3)假設Th-ω≥(ω為步長),那么Th=Th-ω重新執(zhí)行2〕;假設Th–ω<,那么判斷無車牌退出。4)檢驗R(k)是否為真車牌區(qū)域。假設有真車牌,那么輸出車牌的粗分割位置進行進一步修正;假設無,真車牌那么執(zhí)行3〕。算法中,上限的設置是為了防止初始的Th過大而過多地重復執(zhí)行第二步;下限的設置是為了防止初始的Th過小而引入過多的干擾區(qū)域。為了進一步增加算法的魯棒性,和也需通過輸入圖像的能量數(shù)組自適應地調節(jié),即〔3-6〕,車牌的校驗和修正車牌的檢驗非常重要,他直接影響到能量濾波閾值的選擇和去除干擾的能力。能量濾波主要利用了車牌較為粗略的紋理特征快速地分割出車牌的候選區(qū)域。而車牌的檢驗那么利用車牌較為細致的紋理特征進一步剔除那些干擾區(qū)域并將真正的車牌區(qū)域分割出來。根據(jù)我國車牌的特點,一般有7至10個字符。將車牌區(qū)域二值化并進行水平掃描后,一般可得到18至30次的跳變次數(shù),且在垂直方向上各行的跳變次數(shù)相差較小。因此選取候選區(qū)域在水平方向的跳變次數(shù)均值和各行跳變次數(shù)方差作為校驗車牌的特征,具體算法為:1〕二值化候選區(qū)域,提取中間行上下各m行〔包括中間行〕共2m+1行〔2m+1小于候選區(qū)域的垂直高度〕作為檢驗行。2〕水平掃描各行檢驗行,計算各行的跳變次數(shù)ch〔i〕〔i=1,2……2m+1〕。3〕計算跳變次數(shù)均值Mean和各行跳變次數(shù)方差Dev,即〔3-7〕〔3-8〕4〕由Mean和Dev判斷,假設〔3-9〕式中一般取40,那么該候選區(qū)域是車牌區(qū)域;否那么為非車牌區(qū)域。1〕中,取候選區(qū)域中間局部作為檢驗行,是為了防止因車牌上下邊定位的不準確和車牌傾斜帶來的負面影響。經(jīng)過車牌檢驗,干擾區(qū)域根本上被過濾掉,剩下的車牌區(qū)域因式〔3-4〕帶來的方塊效應可能存在左右和上下邊的錯位。所以,還需要進一步進行修改,以便車牌識別時字符的分割和識別。第四章車牌字符分割及識別車牌字符分割的目的是在正確提取出車牌區(qū)域的根底上,將車牌區(qū)域圖像分為七個(我國的車牌上有7個字符,首位為省名縮寫(漢字),次位為英文字母,第三位為英文字母或阿拉伯數(shù)字,后四位均為數(shù)字。字符總長409mm,其中單個字符統(tǒng)一寬度為45mm,高為90mm;第二、第三字符間間隔為34mm(中間小圓點的寬度為10mm,它與第二、第三個字符間的距離分別為12mm),其余字符間隔均為12mm。)獨立的字符子圖像,即把車牌中的每個字符從整個車牌圖像中切割出來成為單字符圖像。正確的車牌字符分割時特征提取和模式匹配的前提并且關系到后繼車牌識別能否順利進行。所以,正確的字符分割是字符識別的關鍵。車牌字符分割可以說是車牌識別中比擬簡單的的一環(huán)。但是要從各種各樣的車牌圖像中把字符一個個準確的分割出來也并非易事?,F(xiàn)在車牌的精確字符分割主要是因為實際拍攝的車牌圖像不同程度地存在噪聲干擾的問題。4.1常用字符分割方法常用的字符切分算法可以歸納為以下三類:直接分割法,基于識別根底的分割法,自適應分割線聚類法。直接分割法直接分割法較為簡單,但它的局限是分割點的準確性受噪聲干擾較大。固定邊界法是一種直接分割法。在車牌識別中,由于車牌尺寸大小和長寬比都是確定的,車牌中的字符大小、字體、個數(shù)也是確定的,字符分布也是有規(guī)律的,因此,在車牌定位準確、車牌圖像截取完整的情況下,可以直接根據(jù)車牌字符在圖像中的位置進行切割。但這種方法對截取的車牌圖像尺寸精度要求比擬高,否那么在切割字符時會造成字符不完整,以致影響后續(xù)的字符識別。垂直投影分割也是一種直接分割法,廣泛應用于固定間隙和固定字符寬度的字符分割中,針對字符間距、字符數(shù)、字體等紋理特征的統(tǒng)一性,設計一系列的特征函數(shù)和判決函數(shù)以突出其紋理特點,從而進行字符的分割。在車牌識別中,投影分割方法的原理是首先將車牌圖像轉換為二值圖像,即白色為1,黑色為0,然后將車牌像素灰度值在列方向上垂直累加,即所謂的垂直投影。由于車牌中字符之間的灰度值通常為0,因此,投影圖將會在字符之間形成谷底,或者說在字符處形成波峰。通過尋找兩個波峰之間的谷點,將其作為字符分割的位置,從而完成字符的分割。但是通常情況下,由于車牌圖像會有噪聲,因此,在投影時會造成谷底不明顯,甚至消失,使字符分割產生誤差甚至錯誤,最終影響字符的識別。另外,當截取的車牌圖像存在鉚釘時,也會影響谷底的判斷。因此,在投影前還需去除掉車牌鉚釘,以保證字符分割效果?;谧R別根底的分割法基于識別根底的分割是把識別和分割結合起來,但是需要識別的高準確性,它根據(jù)分割和識別的耦合程度又有不同的劃分。例如,針對高性能的印刷體文字識別系統(tǒng),采用多知識綜合判決的字符切分算法,字符分割看作是對字符邊界正確切分位置的一個決策過程,該決策需要同時考慮字符局部識別情況和全局的上下文關系。自適應分割線聚類法自適應分割線聚類法要建立一個分類器,由它來判斷圖像中的每一列是否是分割線,它是根據(jù)訓練樣本來進行自適應的神經(jīng)網(wǎng)絡,但是對于粘連的字符是很難訓練的,因為分割不可能做到完全正確。還有些算法考慮到二值圖像喪失掉很多信息,而且可能會造成字符粘連模糊或斷裂的缺陷,所以開始對灰度圖像進行直接處理,但它的分割路徑是非線性的,算法較為復雜??紤]到算法適用性,本文選用直接分割法即把垂直投影法作為主要的分割法,同時對噪聲、鉚釘進行特殊處理來完成字符分割。4.2車牌字符識別字符識別是對車牌上分割出來的漢字、字母和數(shù)字進行確認的過程,是整個車牌識別系統(tǒng)的核心,字符識別的準確率直接影響整個系統(tǒng)的最終識別結果。車牌字符識別技術分析車牌字符識別實際上就是對車牌上的漢字、字母、數(shù)字進行準確確認的過程。能否準確識別車牌字符,文字識別技術是一個重要因素。文字識別的根本原理是將輸入文字與各個標準文字進行模式匹配,計算相似度〔或距離〕,將具有最大相似度〔或最小距離〕的標準文字作為識別結果。車牌字符識別實際上是依附在車牌上的印刷體文字的識別,能否正確識別不僅是文字識別技術的問題,還要考慮車牌區(qū)域的影響。車牌字符識別技術是文字識別技術與車牌圖像自身因素協(xié)調兼顧的綜合性技術。車牌中的字符與其他字符相比有其特殊性,主要表達在以下幾點:〔1〕字符點陣分辨率低。由于是在一幅汽車圖像中分割出牌照,受攝像機分辨率的限制,字符所占的像素就比擬少,大約只有20×20個像素,這樣的分辨率對于英文字母和數(shù)字字符而言還比擬容易處理,但對于漢字來說那么導致漢字特征信息喪失太多,并造成筆劃的粘連,給識別帶來困難。〔2〕環(huán)境影響大。通常的OCR系統(tǒng)的工作環(huán)境一般在室內,光照條件較好且穩(wěn)定。而車牌識別系統(tǒng)需要在室外全天候工作,光照條件經(jīng)常變化,并且受天氣狀況等的影響,各種干擾也不可預測,導致實際取到的牌照的圖像由于光照度、觸發(fā)位置的不同,使得字符的大小、粗細、位置及傾斜度都不一樣?!?〕實時性要求。鑒于牌照自動識別系統(tǒng)的應用場合是智能交通管理,它要求能對駛過的車輛進行及時地采集圖像、處理圖像、牌照識別和自動數(shù)據(jù)庫登錄等一系列操作,實時性的要求高于其它OCR系統(tǒng)?,F(xiàn)有的車牌字符識別算法近年來,有不少學者在車牌字符的識別方面做了大量的工作,研究出了一些比擬成熟的算法,下面簡單加以介紹一下:〔1〕模板匹配法它是模式識別中最簡單的方法之一。其工作原理是:每一個漢字就有一個模板。將待識別字符的二值圖像的尺寸大小縮放為模板大小之后,然后與模板進行匹配,距離最小的模板所對應的漢字,就判定為輸入的待識別漢字。此種方法最大的缺陷就是容易受到環(huán)境的影響。所以為了提高準確率,往往需要使用更多的模板進行匹配,處理時間也會增加。因此對其進行改良,即先對待識別字符進行拓撲分析得到字符邊緣的關鍵點,然后對關鍵點進行拓撲分析,最后確定字符的分類。該算法有效地減少了模板中像素點的個數(shù),只利用字符的關鍵點進行模板匹配,提高了識別速度和識別率?!?〕特征分析匹配法這類方法是基于特征層面來進行匹配的,是使用率較高的一類方法,相比擬于模板匹配而言,它能更好地獲得字符的特征,有的特征對噪聲是不明顯的。根據(jù)所提取特征的類型,特征分析匹配的方法又可以分為:整體變換分析法、特征提取法、幾何和拓撲的方法。對于整體變換分析法,這些特征的提取是相對容易的,但是通常都需要較大的計算量。找到一個適宜的變換來較多地反映字符的主要特征是很關鍵的;對于由點的統(tǒng)計分布得到的特征抽取法,包括字符的軌跡、交叉點和距離等,可以接受字體的變化,速度較高,復雜性比擬小。但是通常這類特征的模型的生成比擬困難;對于幾何和拓撲的方法,這種方法是利用字符的結構,把字符分解成構成它的元素,主要是獲取字符的關鍵形狀特征,這類特征也是允許存在一定的字體變形,這種方法可以較高速地處理字符,但是通常特征提取的過程是復雜的,并且這些特征的模板也是不容易生成的?!?〕神經(jīng)網(wǎng)絡識別法人工神經(jīng)元網(wǎng)絡是由大量簡單的根本單元相互連接而成的非線性動態(tài)系統(tǒng),每個神經(jīng)元的結構和功能都比擬簡單,但由其組成的系統(tǒng)卻可能非常復雜,它具有人腦的某些特征,能用于聯(lián)想、識別和決策。神經(jīng)元具有非線性映射的能力,它們之間通過權系數(shù)相連接。這種大規(guī)模并行結構具有很高的計算速度,完全不同于傳統(tǒng)機器。模式識別中往往存在噪聲干擾或輸入模式的局部損失,而人工神經(jīng)元網(wǎng)絡將信息分布存儲于連接的權系數(shù)中,使網(wǎng)絡具有很高的容錯性和魯棒性;另外,人工神經(jīng)元網(wǎng)絡的自組織、自適應學習功能,大大放松了傳統(tǒng)識別方法所需的約束條件,使其對某些識別問題顯示出了極大的優(yōu)越性。神經(jīng)網(wǎng)絡的工作方式由兩個階段組成:第一階段——學習期:神經(jīng)元之間的連接權值可由學習規(guī)那么進行修改,以使目標函數(shù)到達最小。第二階段——工作期:連接權值不變,由網(wǎng)絡的輸入得到相應的輸出。4.3基于神經(jīng)元網(wǎng)絡神經(jīng)網(wǎng)絡模式識別是神經(jīng)網(wǎng)絡技術在模式識別中的應用,是仿生學的產物。它通過網(wǎng)絡結點間的連接來存儲信息并完成分類計算,是近幾年興起的模式識別領域的一個重要研究方向。由于神經(jīng)網(wǎng)絡的自學習、自組織和并行分布處理等特征符合人類視覺系統(tǒng)的根本工作原那么,基于神經(jīng)網(wǎng)絡的識別系統(tǒng)和傳統(tǒng)的識別系統(tǒng)相比擬具有以下明顯特點:具有很強的自適應學習能力;具有很強的容錯性、魯棒性;具有執(zhí)行非線性認為和去除噪聲的能力;提供了并行處理和并行分布信息的能力;具有聯(lián)想記憶功能和推理意識功能。因此,神經(jīng)網(wǎng)絡模式識別方法能夠實現(xiàn)基于計算理論層次上的模式識別理論所無法完成的模式信息處理工作,采用神經(jīng)網(wǎng)絡進行模式識別,突破了傳統(tǒng)模式識別技術的局限性,開辟了模式識別的心途徑。神經(jīng)元模型神經(jīng)元是人工神經(jīng)網(wǎng)絡的根本處理單元,它一般是一個多輸入/多輸出的非線性元件,神經(jīng)元輸出除受輸入信號的影響之外,同時也受到神經(jīng)元內部其他因素的影響。所以在人工神經(jīng)元的建設中,常常還加有一個額外輸入信號,稱為偏差,也被稱為閾值。根本神經(jīng)元模型的數(shù)學表達式如下:(4-1)其中為權值〔Weights〕,為閾值〔threshold〕,為作用函數(shù)。作用函數(shù)的根本作用是:①控制輸入對輸出的激活作用;②對輸入、輸出進行函數(shù)轉換;③將可能無限域的輸入變換成指定的有限范圍內的輸出?!?〕常用的作用函數(shù)有閾值型、線性型、S型函數(shù)。閾值型。〔4-2〕線性型。(4-3)此時,輸出與輸入成正比關系。S型函數(shù)?!?-4〕此時輸出和輸入成對數(shù)正切關系,選擇S型函數(shù)作為輸出函數(shù)具有以下有益特性:非線性,單調性,無限次可微,當權值很大時可近似閾值函數(shù),當權值很小時可近似線性函數(shù)。人工神經(jīng)網(wǎng)絡的學習法那么。ANN中的核心問題就是如何決定網(wǎng)絡連接的加權數(shù),常用的學習規(guī)那么主要有:Hebb學習規(guī)那么。它是一類相關學習,即如果兩個神經(jīng)元同時興奮,那么它們之間的突觸連接加強。用表示神經(jīng)元i的激活值,表示神經(jīng)元j的激活值,表示兩個神經(jīng)元之間的連接權,那么有:〔4-5〕其中,表示學習速率。學習規(guī)那么。它是用樣本作為教師信號對網(wǎng)絡進行學習,即設任一個神經(jīng)元i到j的權,那么其權的改變量為:〔4-6〕其中為步長,為誤差〔即要求值與真實值之差〕,為第q個神經(jīng)元的輸出。相近學習。設任一個神經(jīng)元i到j的權,為i個神經(jīng)元的輸出,那么:〔4-7〕〔4〕人工神經(jīng)網(wǎng)絡的構成。神經(jīng)網(wǎng)絡的性質主要決定于兩個因素:一個是網(wǎng)絡的拓撲結構,另一個是網(wǎng)絡的學習、工作規(guī)那么。兩者結合起來就可以構成一個網(wǎng)絡的主要特征。BP網(wǎng)絡的學習算法BP誤差反向傳播的算法步驟可歸納如下:初始化。選定合理的網(wǎng)絡結構,設置合理的可調參數(shù)〔權和閾值〕。對每一個樣本作如下計算:①向前計算:設n次迭代中第j個單元的輸出為,輸入為,單元j的凈輸入為:〔4-8〕其中p為加到單元j上輸入的個數(shù),為前一層單元i到單元j的連接權,那么有輸出:〔4-9〕其中為作用函數(shù),如單元j的作用函數(shù)為Sigmoid函數(shù),那么有:〔4-10〕〔4-11〕②反向計算。設期望輸出為,那么誤差信號為,輸出端總的平方誤差為:〔4-12〕其中q為輸出端的個數(shù),設訓練集中樣本總數(shù)為N個,那么平方誤差的均值為:〔4-13〕權值的修正量為:〔4-14〕負號表示修正量按梯度下降方向,其中稱為局部梯度,當單元j是一個輸出單元,那么有:(4-15)當單元j是隱單元時,那么有:〔4-16〕為單元j到后一層單元k的連接權。按下式修改權值:(4-17)(3)n=n+1,輸入新的樣本直至到達預定要求。BP網(wǎng)絡設計在進行BP網(wǎng)絡的設計時,一般應從網(wǎng)絡的層數(shù)、每層中神經(jīng)元個數(shù)和激活函數(shù)、初始值以及學習速率等幾個方面來進行考慮,BP網(wǎng)絡的根本結構如圖4-1所示:圖4-1BP神經(jīng)元網(wǎng)絡結構網(wǎng)絡層數(shù)確實定。一般來說,具有偏差和至少一個S型隱含層加上一個線性輸入層的網(wǎng)絡,能夠逼近任何有理函數(shù)。增加層數(shù)可以降低誤差、提高精度,但同時也增加了網(wǎng)絡的復雜性,延長了網(wǎng)絡權值的訓練時間,而誤差精確的提高可以通過增加隱含層的神經(jīng)元個數(shù)來確定,其訓練也比增加層數(shù)更容易實現(xiàn)?;谝陨系目紤],BP網(wǎng)絡只使用一個S型的隱含層,即一個三層的BP網(wǎng)絡。隱含層節(jié)點數(shù)確實定。隱含層節(jié)點數(shù)的選擇對網(wǎng)絡性能影響很大,一般是由網(wǎng)絡的具體用途來確定,不同的網(wǎng)絡有不同的要求,所以確定隱含層的節(jié)點是復雜的,常用的方法有:Kolmogorow定理指出:對N個輸入節(jié)點的單隱含層的神經(jīng)網(wǎng)絡,隱含層的節(jié)點數(shù)為2N+1。R.P.Lippmsnn提出的隱含層估算式是:如果T為模式的訓練數(shù),隱含層的節(jié)點數(shù)是。在實踐過程中,以上的估算式只能作為一個參考,實際的節(jié)點數(shù)是通過一系列比擬并經(jīng)過試湊的方法得出的。對同一樣本集用具有不同隱含節(jié)點數(shù)的網(wǎng)絡進行訓練,直到網(wǎng)絡穩(wěn)定為止。初始權值的選擇初始權值與訓練時間的長短、學習是否收斂有很大的關系。初始權值選得太大,可能會使加權后的輸入落在S型函數(shù)的飽和區(qū),使得權值的修改值接近于0,從而導致調節(jié)的過程幾乎停頓下來。所以,一般我們取初始權值在〔-1,1〕之間的隨機數(shù),使得初始加權后的每個神經(jīng)元的輸出接近于0,這樣可以保證每個神經(jīng)元的權重都能夠在它們S型函數(shù)變化最大的地方進行調節(jié)。學習速率的選擇。學習速率決定每一次循環(huán)訓練中所產生的權值變化量。大的學習速率可能導致系統(tǒng)的不穩(wěn)定,小的學習速率導致較長的訓練時間,可能收斂很慢,不過能保證網(wǎng)絡的誤差值不跳出誤差外表的低谷而最終趨于最小值。所以一般情況下傾向于選取較小的學習速率以保證系統(tǒng)的穩(wěn)定性,學習速率的選取范圍在0.01至0.8之間。對于較復雜的網(wǎng)絡,在誤差曲面的不同局部可能需要不同的學習速率,為了減少尋找學習速率的訓練次數(shù)以及訓練時間,比擬適宜的方法就是采用變化的

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內容里面會有圖紙預覽,若沒有圖紙預覽就沒有圖紙。
  • 4. 未經(jīng)權益所有人同意不得將文件中的內容挪作商業(yè)或盈利用途。
  • 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內容的表現(xiàn)方式做保護處理,對用戶上傳分享的文檔內容本身不做任何修改或編輯,并不能對任何下載內容負責。
  • 6. 下載文件中如有侵權或不適當內容,請與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

評論

0/150

提交評論