畢業(yè)設計方案_第1頁
畢業(yè)設計方案_第2頁
畢業(yè)設計方案_第3頁
畢業(yè)設計方案_第4頁
畢業(yè)設計方案_第5頁
已閱讀5頁,還剩3頁未讀 繼續(xù)免費閱讀

下載本文檔

版權說明:本文檔由用戶提供并上傳,收益歸屬內容提供方,若內容存在侵權,請進行舉報或認領

文檔簡介

1、畢業(yè)設計方案題 目 : 基于神經網絡的圖像識別方法研究 學 院 : 忻州師范學院 系 別 : 計算機系 本0904班 學 號 : 201108112013 姓 名 :楊旭東 指導老師: 曹建芳 2012年12月11日一、 選題背景與意義1 隨著圖像技術各種基本理論的發(fā)展,各種應用圖文系統在國民經濟各部門得到了廣泛的應用?,F在,通信、廣播、計算機技術、工業(yè)自動化、國防工業(yè)、,乃至印刷、醫(yī)療等部門的尖端課題無一不與圖像技術的發(fā)展密切相關。事實上,圖像技術已成為各種高技術領域的匯流點,更有人預言,“圖像識別技術”將是21世紀影響國民經濟、國家防務和世界經濟的舉足輕重的關鍵技術。圖像識別是近二十年發(fā)展

2、起來的一門新型技術科學,它以研究某些對象或者過程(統稱圖像)的分類與描述為主要內容。圖像識別在很多領域中得到了應用,如人臉和指紋識別、字符識別、醫(yī)學診斷,等等。簡單的說,圖像識別是圖像中的物體的模式分類,同時包括物體特征的確定,如位置、方向和尺寸等。傳統方法主要是統計模式識別、光學模式識別、分形識別、信息熵識別方法,但這些傳統方法自適應能力很差,而且是在沒有噪聲干擾的情況下進行的。這幾年神經網絡圖像識別技術作為一種新型圖像識別技術,在圖像識別中的應用越來越廣泛。2 人工神經網絡是由大規(guī)模神經元互聯組成的高度非線性動力學系統,是在認識、理解人腦組織結構和運行機制的基礎上模擬起結構和智能行為的一種

3、工程系統,它具有很強的學習、容錯和信息處理能力,并有很高的靈活心及計算機并行性。最初,神經網絡作為模式識別分類器和聚類技術在圖像處理領域中得到應用,如印刷體和手寫字符識別、語音識別,以及指紋、人臉識別,等等。隨著人們對神經網絡理論的進一步研究,神經網絡在圖像處理的很多領域也得到了成功的應用。如圖像壓縮、圖像特征提取、圖像變換編碼,等等。如今,人工神經網絡已經成為當今科學研究的熱點之一。二、設計內容 1.圖像識別技術的基本原理和相應的處理技術,對目前常用的圖像識別方法進行了分析、討論和比較。2.神經網絡的基本原理、網絡結構及網絡的學習方式,研究了神經網絡用于圖像識別的原理及優(yōu)點。3.圖像識別中常

4、用的前饋神經網絡及其采用的BP算法,并將具有全局優(yōu)化功能的遺傳算法與前饋神經網絡相結合,提出了一種遺傳與BP相結合的圖像識別方法,解決7BP算法容易陷入局部極小的不足。并給出了仿真實驗。4.支持向量機的基本知識及其分類識別的原理。詳細介紹了支持向量機的分類策略和核函數的選擇問題。并在此基礎上,將二迸制編碼引入到圖像識別的支持向量機分類策略中,提高了支持向量機在圖像識別中的識別速度。并在此分類策略上提出了一種動態(tài)的自動樣本類別增】Jnill練方法。5.遺傳一BP網絡和支持向量機在車牌及人臉識別中具體的應用方法及結果分析。三、設計方案 1 引言人工神經網絡(Artificial Neural Ne

5、tworks)(簡稱ANN)系統從20世紀40年代末誕生至今僅短短半個世紀,但由于它具有信息的分布存儲、并行處理以及自學習能力等優(yōu)點,已經大信息處理、模式識別、智能是基于誤差反向傳播(Error Back Propagation)算法的多層前饋網絡(Multiple-Layer Feedforward Network)(簡稱BP網絡),可以以任意精度逼近任意的連續(xù)函數,所以廣泛應用魚非線性建模、函數逼近、模式分類等方面。 目標識別是模式領域的一項傳統的課題,這是因為目標識別不是一個孤立的問題,而是模式識別領域中大多數課題都會遇到的問題,并且在不同的課題中,由于具體的條件不同,解決的方法也不盡相

6、同,因而目標識別的研究仍具有理論和實踐意義,這里討論的是將要識別的目標物體用成像頭(紅外或可見光等)攝入后形成的圖像信號序列送入計算機,用神經網絡識別圖像的問題。2 BP神經網絡2.1 BP 神經網絡BP網絡是采用Widrow-Hoff學習算法和非線性可微轉移的多層網絡。一個典型的BP網絡采用的是梯度下降算法,也就是Widrow-Hoff算法規(guī)定的。Backpropagation就是指的為非線性多層網絡計算梯度的方法,一個典型的BP網絡結構如圖1所示其中:對于第k個模式對,輸出層單元的j的加權輸入為該單元的實際輸出為而隱含層單元i的加權輸入為該單元的實際輸出為函數f為可微分遞減函數其算法描述如

7、下:(1) 初始化網絡及學習參數,如設置網絡初始權矩陣、學習因子等。(2) 提供訓練模式,訓練網絡,直到滿足學習要求。(3) 前向傳播過程:對給定訓練模式輸入,計算網絡的輸出模式,并與期望模式比較,若有誤差,則執(zhí)行(4);否則,返回(2)。(4) 后向傳播過程:a.計算同一層單元的誤差;b.修正權值和閥值;c.返回(2)。2.2 BP網絡隱層個數的選擇 對于含有一個隱層的三層BP網絡可以實現輸入到輸出的任何非線性映射。增加網絡隱層數可以降低誤差,提高精度,但同時也使網絡復雜化,增加網絡的訓練時間。誤差精度的提高也可以通過增加隱層結點數來實現。一般情況下,應優(yōu)先考慮增加隱含層的結點數。2.3 隱

8、含層神經元個數的選擇當用神經網絡實現網絡映射時,隱含層神經元個數直接影響著神經網絡的學習能力和歸納能力。隱含層神經元數目較少時,網絡每次學習的時間較短,但有可能因為學習不足導致網絡無法記住全部學習內容;隱含層神經元數目較大時,學習能力增強,網絡每次學習的時間較長,網絡的存儲容量隨之變大,導致網絡對未知輸入的歸納能力下降,因為對隱含層神經元個數的選擇尚無理論上的指導,一般憑經驗確定。3 神經網絡圖像識別系統人工神經網絡方法實現模式識別,可處理一些環(huán)境信息十分復雜,背景知識不清楚,推理規(guī)則不明確的問題,允許樣品有較大的缺損、畸變,神經網絡方法的缺點是其模型在不斷豐富完善中,目前能識別的模式類還不夠

9、多,神經網絡方法允許樣品有較大的缺損和畸變,其運行速度快,自適應性能好,具有較高的分辨率。神經網絡的圖像識別系統是神經網絡模式識別系統的一種,原理是一致的。一般神經網絡圖像識別系統由預處理,特征提取和神經網絡分類器組成。預處理就是將原始數據中的無用信息刪除,平滑,二值化和進行幅度歸一化等。神經網絡圖像識別系統中的特征提取部分不一定存在,這樣就分為兩大類: 有特征提取部分的:這一類系統實際上是傳統方法與神經網絡方法技術的結合,這種方法可以充分利用人的經驗來獲取模式特征以及神經網絡分類能力來識別目標圖像。特征提取必須能反應整個圖像的特征。但它的抗干擾能力不如第2類。 無特征提取部分的:省去特征抽取

10、,整副圖像直接作為神經網絡的輸入,這種方式下,系統的神經網絡結構的復雜度大大增加了,輸入模式維數的增加導致了網絡規(guī)模的龐大。此外,神經網絡結構需要完全自己消除模式變形的影響。但是網絡的抗干擾性能好,識別率高。本文采用無特征提取的神經網絡識別方法。 當BP 網用于分類時,首先要選擇各類的樣本進行訓練,類樣本的個數要近似相等。其原因在于一方面防止訓練后網絡對樣本多的類別響應過于敏感而對樣本數少的類別不敏感。另一方面可以大幅度提高訓練速度,避免網絡陷入局部最小點。由于BP 網絡不具有不變識別的能力,所以要使網絡對模式的平移、旋轉、伸縮具有不變性,要盡可能選擇各種可能情況的樣本。例如要選擇不同姿態(tài)、不

11、同方位、不同角度、不同背景等有代表性的樣本,這樣可以保證網絡有較高的識別率。構造神經網絡分類器首先要選擇適當的網絡結構:神經網絡分類器的輸入就是圖像的特征向量;神經網絡分類器的輸出節(jié)點應該是類別數。隱層數要選好,每層神經元數要合適,目前有很多采用一層隱層的網絡結構。然后要選擇適當的學習算法,這樣才會有很好的識別效果。在學習階段應該用大量的樣本進行訓練學習,通過樣本的大量學習對神經網絡的各層網絡的連接權值進行修正,使其對樣本有正確的識別結果,這就像人記數字一樣,網絡中的神經元就像是人腦細胞,權值的改變就像是人腦細胞的相互作用的改變,神經網絡在樣本學習中就像人記數字一樣,學習樣本時的網絡權值調整就

12、相當于人記住各個數字的形象,網絡權值就是網絡記住的內容,網絡學習階段就像人由不認識數字到認識數字反復學習過程是一樣的。神經網絡是按整個特征向量的整體來記憶圖像的,只要大多數特征符合曾學習過的樣本就可識別為同一類別,所以當樣本存在較大噪聲時神經網絡分類器仍可正確識別。在圖像識別階段,只要將圖像的點陣向量作為神經網絡分類器的輸入,經過網絡的計算,分類器的輸出就是識別結果。4 仿真實驗4.1 實驗對象本實驗用MATLAB 完成了對神經網絡的訓練和圖像識別模擬。從實驗數據庫中選擇09 這十個數字的BMP 格式的目標圖像。圖像大小為168 像素,每個目標圖像分別加10、20、30、40、50大小的隨機噪

13、聲,共產生60 個圖像樣本。將樣本分為兩個部分,一部分用于訓練,另一部分用于測試。實驗中用于訓練的樣本為40個,用于測試的樣本為20 個。隨機噪聲調用函數randn(m,n)產生。4.2 網絡結構本試驗采用三層的BP 網絡,輸入層神經元個數等于樣本圖像的象素個數168 個。隱含層選24 個神經元,這是在試驗中試出的較理想的隱層結點數。輸出層神經元個數就是要識別的模式數目,此例中有10 個模式,所以輸出層神經元選擇10 個,10 個神經元與10 個模式一一對應。4.3 基于MATLAB 語言的網絡訓練與仿真建立并初始化網絡% =S1 = 24;% 隱層神經元數目S1 選為24R,Q = size

14、(numdata);S2,Q = size(targets);F = numdata;P=double(F);net = newff(minmax(P),S1 S2,logsiglogsig,traingda,learngdm)這里numdata 為訓練樣本矩陣,大小為12840, targets 為對應的目標輸出矩陣,大小為1040。newff(PR,S1 S2SN,TF1 TF2TFN,BTF,BLF,PF)為MATLAB 函數庫中建立一個N 層前向BP 網絡的函數,函數的自變量PR 表示網絡輸入矢量取值范圍的矩陣Pmin Pmax;S1SN 為各層神經元的個數;TF1TFN 用于指定各層

15、神經元的傳遞函數;BTF 用于指定網絡的訓練函數;BLF 用于指定權值和閥值的學習函數;PF 用于指定網絡的性能函數,缺省值為mse。設置訓練參數net.performFcn = sse; %平方和誤差性能函數net.trainParam.goal = 0.1; %平方和誤差目標net.trainParam.show = 20; %進程顯示頻率net.trainParam.epochs = 5000;%最大訓練步數net.trainParam.mc = 0.95; %動量常數網絡訓練net=init(net);%初始化網絡net,tr = train(net,P,T);網絡訓練對訓練好的網絡進行仿真D=sim(net,P);A = sim(net,B);B 為測試樣本向量集,12820 的點陣。D 為網絡對訓練樣本的識別結果,A 為測試樣本的網絡識別結果。實驗結果表明:網絡對訓練樣本和對測試樣本的識別率均為100。如圖(3)為64579五個數字添加50%隨機噪聲后網絡的識別結果。5 結 論由實驗可知,采用神經網絡識別圖像是切實可行的,由于時間關系,目前

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯系上傳者。文件的所有權益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網頁內容里面會有圖紙預覽,若沒有圖紙預覽就沒有圖紙。
  • 4. 未經權益所有人同意不得將文件中的內容挪作商業(yè)或盈利用途。
  • 5. 人人文庫網僅提供信息存儲空間,僅對用戶上傳內容的表現方式做保護處理,對用戶上傳分享的文檔內容本身不做任何修改或編輯,并不能對任何下載內容負責。
  • 6. 下載文件中如有侵權或不適當內容,請與我們聯系,我們立即糾正。
  • 7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

評論

0/150

提交評論