基于MATLAB的BP神經(jīng)網(wǎng)絡的數(shù)字圖像識別_第1頁
基于MATLAB的BP神經(jīng)網(wǎng)絡的數(shù)字圖像識別_第2頁
基于MATLAB的BP神經(jīng)網(wǎng)絡的數(shù)字圖像識別_第3頁
基于MATLAB的BP神經(jīng)網(wǎng)絡的數(shù)字圖像識別_第4頁
基于MATLAB的BP神經(jīng)網(wǎng)絡的數(shù)字圖像識別_第5頁
已閱讀5頁,還剩13頁未讀, 繼續(xù)免費閱讀

下載本文檔

版權說明:本文檔由用戶提供并上傳,收益歸屬內容提供方,若內容存在侵權,請進行舉報或認領

文檔簡介

1、基于MATLAB BP神經(jīng)網(wǎng)絡的數(shù)字圖像識別 基于MATLAB BP神經(jīng)網(wǎng)絡的數(shù)字圖像識別 【摘要】 隨著現(xiàn)代社會的發(fā)展,信息的形式和數(shù)量正在迅猛增長。其中很大一部分是圖像,圖像可以把事物生動的呈現(xiàn)在我們面前,讓我們更直觀地接受信息。同時,計算機已經(jīng)作為一種人們普遍使用的工具為人們的生產(chǎn)生活服務。如今我們也可以把這些技術應用在交通領域。作為智能交通系統(tǒng)(InteUigent Traffic System,簡稱ITS)中的一個重要組成部分的車牌識別技術,當然就是其中的重點研究對象。車輛牌照識別(License P1ate Recognition,簡稱LPR),是一種關于計算機的包括圖像處理、數(shù)學

2、技術、數(shù)據(jù)庫、信息技術以及智能技術于一體的綜合技術。用MATLAB做車牌識別比用其他工具有許多優(yōu)勢,因為MATLAB在圖像的灰度化、二值化、濾波等方面都有很大優(yōu)勢,所以,本次實驗我們利用MATLAB的這些優(yōu)點來對車牌進行識別。【關鍵詞】BP神經(jīng)網(wǎng)絡;圖像識別;字符識別;特征提取;車牌;Matlab 一 課題研究背景(一) 圖像識別的提出及應用隨著信息化時代的不斷發(fā)展,人們越來越多地使用信息化的手段來解決各種問題辦公自動化、先進制造業(yè)、電子商務等利用計算機技術而產(chǎn)生的新興行業(yè)正不斷靠近我們的生活。在信息社會中,我們每天都接觸大量的數(shù)據(jù)工作數(shù)據(jù)、個人數(shù)據(jù)、無意間獲得的數(shù)據(jù)等在這些數(shù)據(jù)中,有些數(shù)據(jù)需

3、要我們人工處理,而有些則可以利用計算機快速準確的完成字符識別就是其中的一個范疇。字符識別是一種圖像識別技術,他的輸入是一張帶有某種字符的圖片,而輸出則是計算機中對于圖片中字符的反應結果。所以,可以廣泛的應用于各種領域:如,車牌檢測、手寫識別、自動閱讀器、機器視覺在生活生產(chǎn)的各個方面都起到了非常重要的作用。(二)圖像識別技術的發(fā)展趨勢雖然圖像識別技術還不是非常成熟,但現(xiàn)其已經(jīng)有了很多可喜的成果,比如圖像模式識別,圖像文字識別。并且其還在飛速的發(fā)展著,圖像識別的應用正朝著不同的領域滲透著,像計算機圖像生成,圖像傳輸與圖像通信,高清晰度電視,機器人視覺及圖像測量,辦公室自動化,像跟蹤及光學制導,醫(yī)用

4、圖像處理與材料分析中的圖像分析系統(tǒng),遙感圖像處理和空間探測,圖像變形技術等等。從所列舉的圖像技術的多方面應用及其理論基礎可以看出,它們無一不涉及高科技的前沿課題,充分說明了圖像技術是前沿性與基礎性的有機統(tǒng)一。可以預計21世紀,圖像技術將經(jīng)歷一個飛躍發(fā)展的成熟階段,為深入人民生活創(chuàng)造新的文化環(huán)境,成為提高生產(chǎn)的自動化、智能化水平的基礎科學之一。圖像技術的基礎性研究,特別是結合人工智能與視覺處理的新算法,從更高水平提取圖像信息的豐富內涵,成為人類運算量最大、直觀性最強,與現(xiàn)實世界直接聯(lián)系的視覺和“形象思維”這一智能的模擬和復現(xiàn),是一個很難而重要的任務?!皥D像技術”這一上世紀后期誕生的高科技之花,其

5、前途是不可限量的。隨著21世紀經(jīng)濟全球化和信息時代的發(fā)展,作為信息來源的自動檢測、圖像識別技術越來越受到人們的重視。近年來計算機的飛速發(fā)展和數(shù)字圖像處理技術的日趨成熟,為傳統(tǒng)的交通管理帶來了巨大轉變。圖像處理技術發(fā)展相當快,而其中對汽車牌照等相關信息的自動采集和管理對于交通車輛管理、園區(qū)車輛管理、停車場管理、交警稽查等方面有著十分重要的意義,成為信息處理技術的一項重要研究課題。汽車牌照自動識別系統(tǒng)就是在這樣的背景與目的下進行研究開發(fā)的。車輛牌照識別(License Plate Recognition,LPR)技術作為交通管理自動化的重要手段之一,其任務是分析、處理汽車監(jiān)控圖像,自動識別汽車牌照

6、號碼,并進行相關智能化數(shù)據(jù)庫管理。(三)圖像識別的機理圖像識別是人工智能的一個重要領域。為了編制模擬人類圖像識別活動的計算機程序,人們提出了不同的圖像識別模型。例如模板匹配模型。這種模型認為,識別某個圖像,必須在過去的經(jīng)驗中有這個圖像的記憶模式,又叫模板。當前的刺激如果能與大腦中的模板相匹配,這個圖像也就被識別了。例如有一個字母A,如果在腦中有個A模板,字母A的大小、方位、形狀都與這個A模板完全一致,字母A就被識別了。這個模型簡單明了,也容易得到實際應用。但這種模型強調圖像必須與腦中的模板完全符合才能加以識別,而事實上人不僅能識別與腦中的模板完全一致的圖像,也能識別與模板不完全一致的圖像。例如

7、,人們不僅能識別某一個具體的字母A,也能識別印刷體的、手寫體的、方向不正、大小不同的各種字母A。同時,人能識別的圖像是大量的,如果所識別的每一個圖像在腦中都有一個相應的模板,也是不可能的。為了解決模板匹配模型存在的問題,格式塔心理學家又提出了一個原型匹配模型。這種模型認為,在長時記憶中存儲的并不是所要識別的無數(shù)個模板,而是圖像的某些“相似性”。從圖像中抽象出來的“相似性”就可作為原型,拿它來檢驗所要識別的圖像。如果能找到一個相似的原型,這個圖像也就被識別了。這種模型從神經(jīng)上和記憶探尋的過程上來看,都比模板匹配模型更適宜,而且還能說明對一些不規(guī)則的,但某些方面與原型相似的圖像的識別。但是,這種模

8、型沒有說明人是怎樣對相似的“刺激”進行辨別和加工的,它也難以在計算機程序中得到實現(xiàn)。因此又有人提出了一個更復雜的模型,即“泛魔”識別模型。所謂泛魔,即這個模型把圖像識別過程分為不同的層次,每一層次都有承擔不同職責的特征分析機制稱作一種小魔鬼,由于有許許多多這樣的機制在起作用,因此叫做“泛魔”識別模型。這一模型的特點在于它的層次的劃分。自20世紀60年代初期出現(xiàn)第一代產(chǎn)品開始,經(jīng)過30多年的不斷發(fā)展改進,字符識別技術的研究已經(jīng)取得了令人矚目的成果。目前印刷體的識別技術已經(jīng)達到較高水平。識別范圍也從原來指定的印刷體數(shù)字、英文字母和部分符號,發(fā)展成為可以自動進行版面分析、表格識別,實現(xiàn)混合文字、多字

9、體、多字號、橫豎混排識別的強大的計算機信息快速錄入工具。對印刷體漢字的識別率達到98以上,即使對印刷質量較差的文字其識別率也達到95以上。(四)本文的研究內容本文將以車牌作為研究對象,從數(shù)字、字母、漢字開始逐步提高識別的范圍,針對圖片中的字符提出一套切實可行的識別算法,并且在試驗中不斷改進。在開發(fā)期間,以功能強大的Matlab作為編程平臺,利用一些行之有效的技術提高識別算法的性能,從而完成相應的識別軟件。二 算法分析與設計 (一)特征分析中國汽車牌照中使用的字符集包括59個漢字、25個大寫英文字母(字母不包含I)和10個阿拉伯數(shù)(0-9),三種類型共94個,且都是印刷體,結構固定、筆畫規(guī)范。牌

10、照在圖像中占有的高度從20個像素到50個像素不等。對于國內牌照來說,一般的車輛正面牌照中水平排列著7個字符,其標準車牌樣式:XlX2:X3X4X5X6X7;X1是各省,直轄市的簡稱:如“蘇” 、“桂”,或者特種車輛類型如“警”;全角X2是英文字母,表示各省的不同地區(qū);X3從是英文字母或阿拉伯數(shù)字; ; X3X4X5X6X7均是阿拉伯數(shù)字。 (二)技術路線 1 原理分析 由于車輛牌照是機動車唯一的管理標識符號,在交通管理中具有不可替代的作用,因此車輛牌照識別系統(tǒng)應具有很高的識別正確率,對環(huán)境光照條件、拍攝位置和車輛行駛速度等因素的影響應有較大的容閾,并且要求滿足實時性要求。區(qū)域搜索與分割字符分割

11、歸一化字符特征提取單字識別圖像輸入預處理圖2-1 牌照識別系統(tǒng)原理圖該系統(tǒng)是計算機圖像處理與字符識別技術在智能化交通管理系統(tǒng)中的應用,它主要由牌照圖像的采集和預處理、牌照區(qū)域的定位和提取、牌照字符的分割和識別等幾個部分組成,如圖1所示。其基本工作過程如下:(1)當行駛的車輛經(jīng)過時,觸發(fā)埋設在固定位置的傳感器,系統(tǒng)被喚醒處于工作狀態(tài);一旦連接攝像頭光快門的光電傳感器被觸發(fā),設置在車輛前方、后方和側面的相機同時拍攝下車輛圖像;(2)由攝像機或CCD攝像頭拍攝的含有車輛牌照的圖像通視頻卡輸入計算機進行預處理,圖像預處理包括圖像轉換、圖像增強、濾波和水平矯正等;(3)由檢索模塊進行牌照搜索與檢測,定位

12、并分割出包含牌照字符號碼的矩形區(qū)域;(4)對牌照字符進行二值化并分割出單個字符,經(jīng)歸一化后輸入字符識別系統(tǒng)進行識別。2 總體設計方案車輛牌照識別整個系統(tǒng)主要是由車牌定位和字符識別兩部分組成,其中車牌定位又可以分為圖像預處理及邊緣提取模塊和牌照的定位及分割模塊;字符識別可以分為字符分割與特征提取和單個字符識別兩個模塊。為了用于牌照的分割和牌照字符的識別,原始圖像應具有適當?shù)牧炼龋^大的對比度和清晰可辯的牌照圖像。但由于該系統(tǒng)的攝像部分工作于開放的戶外環(huán)境,加之車輛牌照的整潔度、自然光照條件、拍攝時攝像機與牌照的距離和角度以及車輛行駛速度等因素的影響,牌照圖像可能出現(xiàn)模糊、歪斜和缺損等嚴重缺陷,因

13、此需要對原始圖像進行識別前的預處理。牌照的定位和分割是牌照識別系統(tǒng)的關鍵技術之一,其主要目的是在經(jīng)圖像預處理后的原始灰度圖像中確定牌照的具體位置,并將包含牌照字符的一塊子圖像從整個圖像中分割出來,供字符識別子系統(tǒng)識別之用,分割的準確與否直接關系到整個牌照字符識別系統(tǒng)的識別率。由于拍攝時的光照條件、牌照的整潔程度的影響,和攝像機的焦距調整、鏡頭的光學畸變所產(chǎn)生的噪聲都會不同程度地造成牌照字符的邊界模糊、細節(jié)不清、筆劃斷開或粗細不均,加上牌照上的污斑等缺陷,致使字符提取困難,進而影響字符識別的準確性。因此,需要對字符在識別之前再進行一次針對性的處理。車牌識別的最終目的就是對車牌上的文字進行識別。主

14、要應用的為模板匹配方法。因為系統(tǒng)運行的過程中,主要進行的都是圖像處理,在這個過程中要進行大量的數(shù)據(jù)處理,所以處理器和內存要求比較高,CPU要求主頻在600HZ及以上,內存在128MB及以上。系統(tǒng)可以運行于Windows98、Windows2000或者Windows XP操作系統(tǒng)下,程序調試時使用matlab。三 具體技術路線(1)圖像預處理及邊緣提取在車牌自動識別系統(tǒng)中,車輛圖像是通過圖像采集卡將運動的車輛圖像抓拍下來,并以位圖的格式存放到系統(tǒng)內存中,這時的車輛數(shù)字圖像雖然沒有被人為損傷過,但在實際道路上行駛的車輛常會因為各種各樣的原因使得所拍攝的車輛圖像效果不理想,如外界光線對車牌的不均勻反

15、射、極強陽光形成的車牌處陰影、攝像機快門值設置過大而引起的車輛圖像拖影、攝像頭聚焦或后背焦沒有調整到位而形成的車輛圖像不清晰、由于視頻傳輸線而引起的圖像質量下降、所拍攝圖像中存在的噪聲干擾、所安裝的車牌不規(guī)范或車輛行駛變形等,這些都給車牌的模糊識別增加了難度。圖像預處理技術可最大限度提高車牌正確識別率,這些圖像預處理包括圖像灰度化、平滑、傾斜校正、灰度修正等。 輸入車牌圖像灰度校正平滑處理提取邊緣 圖3-1 預處理及邊緣提取流程圖 1、圖像的采集與轉換考慮到現(xiàn)有牌照的字符與背景的顏色搭配一般有藍底白字、黃底黑字、白底紅字、綠底白字和黑底白字等幾種,利用不同的色彩通道就可以將區(qū)域與背景明顯地區(qū)分

16、出來,例如,對藍底白字這種最常見的牌照,采用藍色B有多余的空格。 通道時牌照區(qū)域為一亮的矩形,而牌照字符在區(qū)域中并不呈現(xiàn)。因為藍色(255,0,0)與白色(255,255,255)在通道中并無區(qū)分,而在G、R 通道或是灰度圖像中并無此便利。同理對白底黑字的牌照可用R 通道,綠底白字的牌照可以用G 通道就可以明顯呈現(xiàn)出牌照區(qū)域的位置,便于后續(xù)處理。原圖、灰度圖及其直方圖見圖2與圖3。對于將彩色圖像轉換成灰度圖像時,圖像灰度值可由下面的公式計算: (3-1) (3-2) 圖 3-2 原圖和它的灰度圖以及灰度直方圖2、邊緣提取邊緣是指圖像局部亮度變化顯著的部分,是圖像風、紋理特征提取和形狀特征提取等

17、圖像分析的重要基礎。所以在此我們要對圖像進行邊緣檢測。圖象增強處理對圖象牌照的可辨認度的改善和簡化后續(xù)的牌照字符定位和分割的難度都是很有必要的。增強圖象對比度度的方法有:灰度線性變換、圖象平滑處理等。(1)灰度校正由于牌照圖像在拍攝時受到種種條件的限制和干擾,圖像的灰度值往往與實際景物不完全匹配,這將直接影響到圖像的后續(xù)處理。如果造成這種影響的原因主要是由于被攝物體的遠近不同,使得圖像中央?yún)^(qū)域和邊緣區(qū)域的灰度失衡,或是由于攝像頭在掃描時各點的靈敏度有較大的差異而產(chǎn)生圖像灰度失真,或是由于曝光不足而使得圖像的灰度變化范圍很窄。這時就可以采用灰度校正的方法來處理,增強灰度的變化范圍、豐富灰度層次,

18、以達到增強圖像的對比度和分辨率。我們發(fā)現(xiàn)車輛牌照圖像的灰度取值范圍大多局限在r=(50,200)之間,而且總體上灰度偏低,圖象較暗。根據(jù)圖象處理系統(tǒng)的條件,最好將灰度范圍展開到s=(0,255)之間,為此我們對灰度值作如下的變換: s = T(r) r=r min,,r max (3-3) 使得SSmin, Smax,其中,T為線性變換,灰度線性變換 (3-4) 圖3-3 線性圖(3)若 r(50,200)s(0,255) 則: (3-5) (4) 圖3-4 灰度增強后的圖像(2)平滑處理 對于受噪聲干擾嚴重的圖像,由于噪聲點多在頻域中映射為高頻分量,因此可以在通過低通濾波器來濾除噪聲,但實際

19、中為了簡化算法,也可以直接在空域中用求鄰域平均值的方法來削弱噪聲的影響,這種方法稱為圖象平滑處理。例如,某一象素點的鄰域S有兩種表示方法:8鄰域和4鄰域分別對應的鄰域平均值為 (3-6) 23i,j144325i,j1678圖 3-5 鄰域及其鄰域模板 (5)其中,M 為鄰域中除中心象素點f(i,j) 之外包括的其它象素總數(shù),對于4鄰域M=4,8 鄰域M=8。然而,鄰域平均值的平滑處理會使得圖像灰度急劇變化的地方,尤其是物體邊緣區(qū)域和字符輪廓等部分產(chǎn)生模糊作用。為了克服這種平均化引起的圖像模糊現(xiàn)象,我們給中心點象素值與其鄰域平均值的差值設置一固定的閾值,只有大于該閾值的點才能替換為鄰域平均值,

20、而差值不大于閾值時,仍保留原來的值,從而減少由于平均化引起的圖像模糊。 圖3-6 平滑處理后的圖像圖像中車輛牌照是具有比較顯著特征的一塊圖像區(qū)域,這此特征表現(xiàn)在:近似水平的矩形區(qū)域;其中字符串都是按水平方向排列的;在整體圖像中的位置較為固定。正是由于牌照圖像的這些特點,再經(jīng)過適當?shù)膱D象變換,它在整幅中可以明顯地呈現(xiàn)出其邊緣。邊緣提取是較經(jīng)典的算法,此處邊緣的提取采用的是Roberts算子。 圖3-7未濾波直接提取出的邊緣,經(jīng)灰度校正后提取的邊緣以及經(jīng)平滑處理后提取的邊緣 對比以上幾幅圖片,圖8的邊緣已經(jīng)模糊掉了。圖7中包含的噪聲太多,圖9未經(jīng)濾波直接提取出的邊緣圖像最清晰,所包含的有用信息最多

21、。分析這種情況產(chǎn)生的原因,歸納起來主要有以下方面: 1、原始圖像清晰度比較高,從而簡化了預處理 2、圖像的平滑處理會使圖像的邊緣信息受到損失,圖像變得模糊 3、圖像的銳化可以增強圖像中物體的邊緣輪廓,但同時也使一些噪聲得到了增強綜上所述,結合MATLAB實驗過程,得出不是每一種圖像處理之初都適合濾波和邊界增強。本次汽車車牌的識別,為了保存更多的有用信息,經(jīng)過多次比較,選擇圖9作為后期處理的依據(jù)。 2 車牌的定位與分割 車牌定位對車牌識別系統(tǒng)來說至關重要,目前已經(jīng)提出了很多車牌定位的方法,這些方法都具有一個共同的出發(fā)點,即通過牌照區(qū)域的特征來判斷牌照。根據(jù)不同的實現(xiàn)方法,大致可以把現(xiàn)有的定位方法

22、分為直接法和間接法兩類。 1)直接法。直接分析圖像的特征,如基于線模板的二值化圖像中的角檢測算法,該算法利用車牌的邊框角點,檢測車牌的四個角點,并以此來定位車牌?;谥本€邊緣識別的圖像區(qū)域定位算法,并且利用該算法定位車牌的邊框線,以此定位車牌。利用車牌的尺寸、字符間距、字符特征等紋理特征定位車牌。利用車牌部分垂直高頻豐富的特點先利用小波提取圖像的垂直高頻信息,然后利用數(shù)學形態(tài)學方法對小波分解后的細節(jié)圖像進行一系列的形態(tài)運算,進一步消除無用的信息和噪聲,以定位車牌。 2)間接法。主要是指利用神經(jīng)網(wǎng)絡法或者遺傳算法定位車牌的方法。利用神經(jīng)網(wǎng)絡和遺傳算法等柔性方法進行計算是當前研究熱點之一。利用遺傳

23、算法對圖像進行優(yōu)化搜索,結合區(qū)域特征矢量構造的適應度函數(shù),最終尋找到車牌的牌照區(qū)域的最佳定位參量。目前較為常用的方法是先提取車輛圖像的邊緣,然后結合車輛牌照的幾何特征,分析二值化邊緣圖像像素在水平和垂直方向的投影,判斷出車輛牌照的位置。 對圖像進行腐蝕去除雜質通過計算尋找X和Y方向車牌的區(qū)域完成車牌定位對分割出的車牌做進一步處理 圖3-8 牌照定位于分割流程圖(1)牌照區(qū)域的定位牌照圖像經(jīng)過了以上的處理后,牌照區(qū)域已經(jīng)十分明顯,而且其邊緣得到了勾勒和加強。此時可進一步確定牌照在整幅圖像中的準確位置。這里選用的是數(shù)學形態(tài)學的方法,其基本思想是用具有一定形態(tài)的機構元素去量度和提取圖像中的對應形狀以

24、達到對圖像分析和識別的目的。數(shù)學形態(tài)學的應用可以簡化圖像數(shù)據(jù),保持它們基本的形態(tài)特征,并除去不相干的結構。在本程序中用到了膨脹和閉合這兩個基本運算,最后還用了bwareaopen來去除對象中不相干的小對象。 圖 3-9 腐蝕后圖像,平滑圖像的輪廓以及從對象中移除小對象后圖像(2)牌照區(qū)域的分割對車牌的分割可以有很多種方法,本程序是利用車牌的彩色信息的彩色分割方法。根據(jù)車牌底色等有關的先驗知識,采用彩色像素點統(tǒng)計的方法分割出合理的車牌區(qū)域,確定車牌底色藍色RGB對應的各自灰度范圍,然后行方向統(tǒng)計在此顏色范圍內的像素點數(shù)量,設定合理的閾值,確定車牌在行方向的合理區(qū)域。然后,在分割出的行區(qū)域內,統(tǒng)計

25、列方向藍色像素點的數(shù)量,最終確定完整的車牌區(qū)域。圖 3-10 行方向區(qū)域和最終定位出來的車牌(3)車牌進一步處理經(jīng)過上述方法分割出來的車牌圖像中存在目標物體、背景還有噪聲,要想從圖像中直接提取出目標物體,最常用的方法就是設定一個閾值T,用T將圖像的數(shù)據(jù)分成兩部分:大于T的像素群和小于T的像素群,即對圖像二值化。均值濾波是典型的線性濾波算法,它是指在圖像上對目標像素給一個模板,該模板包括了其周圍的臨近像素。再用模板中的全體像素的平均值來代替原來像素值。 圖 3-11 裁剪出來的車牌的進一步處理過程3 字符的分割與歸一化m,n=size(d),逐排檢查有沒有白色像素點,設置1=j0。在網(wǎng)絡訓練階段

26、用準備好的樣本數(shù)據(jù)依次通過輸入層、隱層和輸出層。比較輸出結果和期望值,若沒有達到要求的誤差程度或者訓練次數(shù),即經(jīng)過輸出層、隱層和輸入層,來調節(jié)權值,以便使網(wǎng)絡成為一定適應能力的模型。 用matlab 神經(jīng)網(wǎng)絡工具箱,用BP神經(jīng)網(wǎng)絡生成網(wǎng)絡函數(shù),部分程序如下:net=newff(pr,25 1,logsig purelin, traingdx, learngdm);net.trainParam.epochs=3000;net.trainParam.goal=0.001;net.trainParam.show=10;net.trainParam.lr=0.05;net=train(net,p,t)

27、即創(chuàng)建和訓練神經(jīng)網(wǎng)絡。其中權值函數(shù)為“l(fā)ogsig”,學習函數(shù)為:“purelin”.運行后,可在matlab上得到:LOADING.ans =LOAD OK.TRAINGDX, Epoch 0/3000, MSE 18.0267/0.001, Gradient 19.9528/1e-006TRAINGDX, Epoch 10/3000, MSE 6.55309/0.001, Gradient 1.92177/1e-006TRAINGDX, Epoch 20/3000, MSE 5.08303/0.001, Gradient 1.59205/1e-006TRAINGDX, Epoch 30/3

28、000, MSE 3.32551/0.001, Gradient 1.35881/1e-006TRAINGDX, Epoch 40/3000, MSE 1.70977/0.001, Gradient 0.830963/1e-006TRAINGDX, Epoch 50/3000, MSE 0.808399/0.001, Gradient 0.588341/1e-006TRAINGDX, Epoch 60/3000, MSE 0.255181/0.001, Gradient 0.301763/1e-006TRAINGDX, Epoch 70/3000, MSE 0.0629529/0.001, G

29、radient 0.146848/1e-006TRAINGDX, Epoch 80/3000, MSE 0.0175261/0.001, Gradient 0.0906425/1e-006TRAINGDX, Epoch 90/3000, MSE 0.0146519/0.001, Gradient 0.364925/1e-006TRAINGDX, Epoch 100/3000, MSE 0.0122441/0.001, Gradient 0.238192/1e-006TRAINGDX, Epoch 110/3000, MSE 0.010538/0.001, Gradient 0.158065/1

30、e-006TRAINGDX, Epoch 120/3000, MSE 0.00900871/0.001, Gradient 0.0498804/1e-006TRAINGDX, Epoch 130/3000, MSE 0.00778895/0.001, Gradient 0.0471643/1e-006TRAINGDX, Epoch 140/3000, MSE 0.00642256/0.001, Gradient 0.0267898/1e-006TRAINGDX, Epoch 150/3000, MSE 0.00506427/0.001, Gradient 0.0207391/1e-006TRA

31、INGDX, Epoch 160/3000, MSE 0.00378743/0.001, Gradient 0.0155848/1e-006TRAINGDX, Epoch 170/3000, MSE 0.00259925/0.001, Gradient 0.012315/1e-006TRAINGDX, Epoch 180/3000, MSE 0.00149217/0.001, Gradient 0.0137463/1e-006TRAINGDX, Epoch 190/3000, MSE 0.00134022/0.001, Gradient 0.0518653/1e-006TRAINGDX, Ep

32、och 200/3000, MSE 0.00132563/0.001, Gradient 0.0549096/1e-006TRAINGDX, Epoch 210/3000, MSE 0.00125472/0.001, Gradient 0.0293791/1e-006TRAINGDX, Epoch 220/3000, MSE 0.00120414/0.001, Gradient 0.0082813/1e-006TRAINGDX, Epoch 230/3000, MSE 0.00115466/0.001, Gradient 0.00760885/1e-006TRAINGDX, Epoch 240

33、/3000, MSE 0.00108049/0.001, Gradient 0.00798138/1e-006TRAINGDX, Epoch 248/3000, MSE 0.000995008/0.001, Gradient 0.00708329/1e-006TRAINGDX, Performance goal met.即神經(jīng)網(wǎng)絡訓練過程。誤差曲線即測試樣例經(jīng)訓練后的實際輸出結果和期望輸出的差值情況。其變化如圖21,圖22。 圖 3-15 訓練過程中誤差曲線變化 圖 3-16 訓練結束時誤差曲線 可見,當神經(jīng)網(wǎng)絡訓練完成后,其樣本得出的輸出結果和期望輸出結果完全相同,即誤差為零。下面就圖23所

34、示測試樣例進行測試。 圖 3 -17 測試樣例識別結果如下:FileName:D:testa = 3答案正確。其識別圖形如圖24。 圖 3-18 識別結果圖形訓練后神經(jīng)網(wǎng)絡以及權重結果信息為:net = Neural Network object: architecture: numInputs: 1 numLayers: 2 biasConnect: 1; 1 inputConnect: 1; 0 layerConnect: 0 0; 1 0 outputConnect: 0 1 targetConnect: 0 1 numOutputs: 1 (read-only) numTargets:

35、 1 (read-only) numInputDelays: 0 (read-only) numLayerDelays: 0 (read-only) subobject structures: inputs: 1x1 cell of inputs layers: 2x1 cell of layers outputs: 1x2 cell containing 1 output targets: 1x2 cell containing 1 target biases: 2x1 cell containing 2 biases inputWeights: 2x1 cell containing 1

36、input weight layerWeights: 2x2 cell containing 1 layer weight functions: adaptFcn: trains initFcn: initlay performFcn: mse trainFcn: traingdx parameters: adaptParam: .passes initParam: (none) performParam: (none) trainParam: .epochs, .goal, .lr, .lr_dec, .lr_inc, .max_fail, .max_perf_inc, .mc, .min_

37、grad, .show, .time weight and bias values: IW: 2x1 cell containing 1 input weight matrix LW: 2x2 cell containing 1 layer weight matrix b: 2x1 cell containing 2 bias vectors other: userdata: (user stuff) 由此可見,程序可滿足期望要求。當然,也經(jīng)常有識別錯誤的情況發(fā)生。對于識別錯誤情況的分析可知,主要原因:一是牌照自身的污漬等影響了圖像的質量;二是牌照字符的分割失敗導致的識別錯誤;再就是部分字符的

38、形狀相似性,比如,B 和8;A 和4 等字符識別結果可能發(fā)生混淆的情況。總之,盡管目前牌照字符的識別率還不理想,但是只要在分割出的字符的大小、位置的歸一化,以及嘗試提取分類識別能力更好的特征值和設計分類器等環(huán)節(jié)上再完善,進一步提高識別率是完全可行的。四 總結(一)課題小結 在車輛牌照字符識別系統(tǒng)的研究領域,近幾年出現(xiàn)了許多切實可行的識別技術和方法,從這些新技術和方法中可以看到兩個明顯的趨勢:一是單一的預處理和識別技術都無法達到理想的結果,多種方法的有機結合才能使系統(tǒng)有效識別能力提高。在此次實驗中,也汲取了以上一些算法的思想,結合實際,反復比較,綜合分析;二是在有效性和實用的原則下,結合神經(jīng)網(wǎng)絡和人工智能的新技術的應用是研究的一個方向。 根據(jù)車牌特點,一般采用的車牌定位算法有:1.邊緣檢測定位算法;2.利用哈夫變換進行車牌定位;3.色彩分割提取車牌等。這里我采用的是邊緣檢測的方法實現(xiàn)定位的。字符

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內容里面會有圖紙預覽,若沒有圖紙預覽就沒有圖紙。
  • 4. 未經(jīng)權益所有人同意不得將文件中的內容挪作商業(yè)或盈利用途。
  • 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內容的表現(xiàn)方式做保護處理,對用戶上傳分享的文檔內容本身不做任何修改或編輯,并不能對任何下載內容負責。
  • 6. 下載文件中如有侵權或不適當內容,請與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

評論

0/150

提交評論