




版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進行舉報或認領(lǐng)
文檔簡介
數(shù)字圖像技術(shù)
(DigitalImageProcessingTechnology)1整理ppt本課程的主要內(nèi)容
1、圖像的獲取
2、圖像變換
3、圖像的增強與濾波4、圖像的邊緣檢測5、圖像的分割6、圖像形態(tài)學(xué)7、圖像的特征提取與分析8、圖像識別與應(yīng)用9、計算機視覺初步2整理ppt
第8章圖像的識別技術(shù)3整理ppt
主要內(nèi)容8.1模式識別概述8.2一些常用的基本概念8.3基于決策理論的圖像識別8.4基于模板匹配的圖像識別8.5基于神經(jīng)網(wǎng)絡(luò)的圖像識別8.6基于支持向量機的圖像識別4整理ppt8.1模式識別概述
模式識別(PatternRecognition)是指對表征事物或現(xiàn)象的各種形式的(數(shù)值的、文字的和邏輯關(guān)系的)信息進行處理和分析,以對事物或現(xiàn)象進行描述、辨認、分類和解釋的過程,是信息科學(xué)和人工智能的重要組成部分。模式識別又常稱作模式分類,從處理問題的性質(zhì)和解決問題的方法等角度,模式識別分為有監(jiān)督的分類(SupervisedClassification)和無監(jiān)督的分類(UnsupervisedClassification)兩種。二者的主要差別在于,各實驗樣本所屬的類別是否預(yù)先已知。一般說來,有監(jiān)督的分類往往需要提供大量已知類別的樣本,無監(jiān)督的分類就是根據(jù)樣本特征(features)將同類特征樣本歸類于同一類。5整理ppt
一般狹義的模式識別所指的主要是對語音波形、地震波、心電圖、腦電圖、圖片、照片、文字、符號、生物傳感器等對象的具體模式進行辨識和分類。6整理ppt模式識別的一般過程原始信息輸入特征提取分類器識別結(jié)果識別的關(guān)鍵是分類器的設(shè)計7整理ppt圖像識別與模式識別的關(guān)系1、模式識別包含了、波形、語音、圖形、圖像等各種信息輸入形式,圖像識別屬于模式識別的一部分;2、模式識別的許多方法如:決策理論、貝葉斯分類器、神經(jīng)網(wǎng)絡(luò)分類器、支持向量機等都可以用到圖像識別中來;3、圖像識別有自己獨特的方法。8整理ppt8.2一些常用的基本概念1、特征向量---用于描述對象的一組特征參數(shù),以n×1維的向量形式表示出來。如:9整理ppt1、向量的相似性度量---距離(1)兩向量的歐式距離設(shè)兩向量則它們之間的歐式距離用下式度量10整理ppt(2)向量與向量族組成員的距離
設(shè)則距離d11整理ppt則它們之間的歐式距離用下式度量可用下列MATLAB語句實現(xiàn):12整理ppt(2)向量族與向量族成員的距離
設(shè)向量族Xp×n
向量族Yq×n
則向量族X的i行與向量族Y的第j列間歐式距離用下矩陣表達13整理ppt(3)Mahalanobis距離----向量與向量組均值的相似性度量則它們之間的歐式距離用下式度量均值:協(xié)方差矩陣:14整理ppt8.3基于決策理論的圖像識別圖像識別的方式基于決策理論方法空間模板匹配最小距離分類器基于結(jié)構(gòu)的識別頻域模板匹配貝葉斯分類器神經(jīng)網(wǎng)絡(luò)分類器支持向量機分類器使用基元符號使用數(shù)值向量串結(jié)構(gòu)識別樹、圖結(jié)構(gòu)識別15整理ppt1、基于最小距離分類器的圖像識別
決策理論的基本思想:將圖像進行特征提取,用提取的特征構(gòu)成一個特征向量x={x1,x2,…,xn},對于W個模式分類ω1,ω2,ωw,設(shè)計W個決策函數(shù)d1(x),d2(x),…,dw(x),滿足下列條件:將x歸于ωi類16整理ppt最小距離分類器就是將每個模式分類用它的均值向量來表示,設(shè)x是待分類的模式向量,分別求模式向量到各類均值向量的距離,將x歸屬于距離最小的那個類別。用決策函數(shù)表示:這里,mj是均值向量,它計算如下:17整理ppt求Dj(x)最小,等價于求最大。因此我們可以選擇決策函數(shù)18整理ppt對于:將其歸于ωi
類。不難看出,在ωi
和ωj之間的邊界為19整理ppt8.4基于模板匹配的圖像識別
模板匹配(TemplateMatching)是圖像識別方法中最具代表性的基本方法之一,它是將從待識別的圖像或者圖像區(qū)域S(i,j)中提取的若干特征量逐個進行比較,計算它們之間規(guī)格化的相關(guān)性系數(shù),其中相關(guān)性系數(shù)最大的一個就表示其相似程度最高,可以將圖像歸與相應(yīng)的類。20整理ppt模板匹配的基本概念:模板就是一幅已知的具有標準尺寸和標準內(nèi)容的圖像。模板匹配就是在一幅圖像中按一定算法搜尋目標,將目標的特征和已知模板比較,從而確定目標是否存在以及存在目標所在的坐標位置。以8位灰度圖像(1個像素由1個字節(jié)描述)為例,模板T(m*n個像素)疊放在被搜索圖S(M*N個像素)上平移,模板覆蓋被搜索圖的那塊區(qū)域叫子圖Sij。i,j為子圖左上角在被搜索圖S上的坐標,如圖所示。搜索范圍是MXN。通過比較模板T和Sij的相似性,完成模板匹配過程。(1)普通模板匹配算法21整理pptmnMN模板及其搜索圖子圖Sij(a)搜索圖模板T一般可以采用下面測度來衡量T和Sij的相似度:
22整理ppt展開則有右邊第三項表示模板的總能量,是一個和位置(i,j)無關(guān)的常數(shù),第一項是模板下的子圖的能量,它隨搜索位置的改變緩慢變化,第二項是子圖像和模板的互相關(guān),隨(i,j)而變,T和Sij匹配時這一項取得最大值,因此可以采用下列歸一化相關(guān)函數(shù)作為相似測度:23整理ppt為了減少圖像強度絕對值的影響,可先分別計算T和Sij的均值Tm和Sm,然后在上式中減去均值,可得下列相關(guān)函數(shù)24整理ppt
按灰度匹配的計算量是很大的,一般將原始圖像按比例縮小,采用相對較小的模板來進行匹配。盡管模板匹配有很多不足的地方,但目前仍然是一種較為可靠的模式識別方法,在工業(yè)機器視覺中得到廣泛應(yīng)用[].對常用焊接結(jié)構(gòu)灰度圖象可以通過二值化填充得到由0和1組成的黑白圖象,因此進行模板匹配可以相當于比較待識別圖象和模板為“1”的相同個數(shù),比較相同可以采用“點異或”的方式進行。如果模板與待識別圖象相同,則相關(guān)系數(shù)可用下式表達:25整理ppt(2)快速模板匹配---序貫相似性檢測算法
由于普通模板計算量大,速度慢,人們提出一類叫序貫相似性檢測的算法,簡稱SSDA。SSDA的要點如下:1)定義絕對誤差值,有式中,2)取一個不變閾值;26整理ppt3)在子圖Sij(m,n)中隨機選取像點(mk
,nk),計算它同T中對應(yīng)點的誤差值ε(i,j,mk
,nk),然后把這個差值和其他點對的差值累加起來,當累加r次誤差超過Tk,則停止累加,并記下次數(shù)r。定義SSDA的檢測曲面為I(i,j)=r4)把取值最大的I(i,j)對應(yīng)的(i,j)點作為匹配點,因為這點上需要很多次累加才使總誤差超過,如下圖所示。圖中給出了在A,B,C三參考點上得到的誤差累計增長曲線。A,B反映模板T不在匹配點上,這時總誤差增長很快,超出閾值,曲線C中總誤差增長很慢,很可能是一匹配的候選點。27整理pptABCI(i,j)010204030Tk圖4-2-2誤差累計曲線28整理ppt3、基于頻域模板匹配的圖像識別在頻域分析中,我們將空間域的相關(guān)運算轉(zhuǎn)化為頻域的的共軛相乘,即:空間域上的相關(guān)頻率域上的相乘
如果將f(x,y)視為待識別的圖像,g(x,y)視為標準模板則就可以采用頻域上的相乘,取代空間域上基于相關(guān)運算的模板匹配,可以縮短匹配計算的時間。29整理ppt8.5基于神經(jīng)網(wǎng)絡(luò)的圖像識別W=p=輸入的R維向量對應(yīng)的權(quán)值行向量b是偏置8.5.1神經(jīng)網(wǎng)絡(luò)基礎(chǔ)30整理pptn是輸入向量元素的加權(quán)求和,定義如下:寫成向量內(nèi)積的形式:a
是神經(jīng)元的輸出,f是神經(jīng)元的傳遞函數(shù),定義如下:31整理ppt進行神經(jīng)網(wǎng)絡(luò)分析時,可以將上面的神經(jīng)元簡略表達如下:32整理ppt
包含多個神經(jīng)元的一層神經(jīng)元33整理ppt34整理ppt一層具有S個神經(jīng)元簡約表示35整理ppt多層神經(jīng)網(wǎng)36整理ppt多層神經(jīng)網(wǎng)的簡約表示37整理ppt用IW表示輸入的權(quán)值矩陣,LW表示層間的權(quán)值矩陣,而用上標表示層間的關(guān)系則有:在MATLAB中把IW和LW設(shè)置成Cell單元類型38整理ppt同時向量(無順序)順序向量(按順序)兩種基本類型的輸入向量輸入數(shù)據(jù)的結(jié)構(gòu)形式39整理ppt同時向量的仿真所謂仿真SIM是指神經(jīng)網(wǎng)絡(luò)的結(jié)構(gòu)參數(shù):權(quán)值矩陣W、偏置b、和傳遞函數(shù)f確定后,在給定輸入激勵下,神經(jīng)網(wǎng)絡(luò)的輸出。40整理pptnet=newlin([13;13],1);使用下列函數(shù)建立一個線性神經(jīng)網(wǎng)絡(luò)設(shè)定網(wǎng)絡(luò)的權(quán)值和偏置為:net.IW{1,1}=[12];net.b{1}=0Net是一個結(jié)構(gòu),可以設(shè)定它的權(quán)值和偏置41整理ppt設(shè)有4組輸入向量,它們是:P=[1223;2131];4組輸入向量,以一個矩陣的形式產(chǎn)生輸入42整理pptA=sim(net,P)A=5485使用產(chǎn)生的網(wǎng)絡(luò)net,和同時輸入向量P為參數(shù),用sim函數(shù)進行神經(jīng)網(wǎng)絡(luò)的仿真,上例的結(jié)果為:43整理ppt順序向量的仿真所謂仿真SIM是指神經(jīng)網(wǎng)絡(luò)的結(jié)構(gòu)參數(shù):權(quán)值矩陣W、偏置b、和傳遞函數(shù)f確定后,在給定輸入激勵下,神經(jīng)網(wǎng)絡(luò)的輸出。44整理pptBP神經(jīng)元結(jié)構(gòu)和簡約畫法45整理ppt具有輸入、隱層、輸出層結(jié)構(gòu)的BP神經(jīng)網(wǎng)絡(luò)隱層4個神經(jīng)元輸出層3個神經(jīng)元2維輸入向量46整理ppt常用傳遞函數(shù)f類型47整理pptnet=newff([-12;05],[3,1],{'tansig','purelin'},'traingd');在MATLAB7.0下使用newff創(chuàng)建BP神經(jīng)網(wǎng)。例如我們創(chuàng)建一個2維輸入向量,具有3個隱層節(jié)點和一個輸出節(jié)點的3層結(jié)構(gòu)的BP神經(jīng)網(wǎng)絡(luò):隱節(jié)點數(shù)輸出節(jié)點數(shù)8.5.2BP神經(jīng)網(wǎng)絡(luò)的創(chuàng)建、訓(xùn)練與仿真1、BP神經(jīng)網(wǎng)絡(luò)的創(chuàng)建隱層傳遞函數(shù)輸出層傳遞函數(shù)輸入分量范圍訓(xùn)練方式48整理ppt2、BP神經(jīng)網(wǎng)絡(luò)的訓(xùn)練
當確定完神經(jīng)網(wǎng)絡(luò)的具體結(jié)構(gòu)—輸入向量維數(shù)、隱層節(jié)點數(shù)、輸出節(jié)點數(shù),就要采用一定的訓(xùn)練方法對神經(jīng)網(wǎng)絡(luò)進行訓(xùn)練,目前應(yīng)用最多的是—梯度下降法。在Matlab神經(jīng)網(wǎng)絡(luò)工具箱中,設(shè)置了這一算法。并通過train()函數(shù)來實現(xiàn)神經(jīng)網(wǎng)絡(luò)的訓(xùn)練?;菊Z法為:Trained_net=train(net,P,T)待訓(xùn)練的網(wǎng)完成的訓(xùn)練網(wǎng)輸入的特征向量訓(xùn)練目標49整理ppt3、BP神經(jīng)網(wǎng)絡(luò)的仿真仿真是對已經(jīng)訓(xùn)練完成的BP神經(jīng)網(wǎng)絡(luò)進行應(yīng)用模擬,以檢查神經(jīng)網(wǎng)絡(luò)的響應(yīng)性能。即當網(wǎng)絡(luò)權(quán)值w,偏移值確定后,通過給定輸入Pgiven,檢查實際輸出y與期望是否相符。對于仿真結(jié)果滿足要求的網(wǎng)絡(luò)就可定型。仿真采用下列函數(shù):y=sim(trained_net,P);完成的訓(xùn)練網(wǎng)輸入的特征向量網(wǎng)絡(luò)的實際輸出50整理ppt8.5.3基于BP神經(jīng)網(wǎng)絡(luò)的圖像識別實例1、手寫數(shù)字字符的識別2、人臉的識別3、車型的識別4、車牌的識別5、指紋的識別6、虹膜的識別6、剛體目標的識別7、人體目標的識別51整理ppt
第九章計算機視覺初步1、基本概念計算機視覺就是用各種視覺傳感器代替視覺器官作為輸入感應(yīng)手段,由計算機來代替大腦完成所得到的圖像信息的處理和解釋。計算機視覺的最終研究目標就是使計算機能象人那樣通過視覺觀察和理解世界,具有自主適應(yīng)環(huán)境的能力。目前二維機器視覺和三維立體視覺兩大類。52整理ppt2、攝像機成像模型攝像機的景物成像應(yīng)該基于物理學(xué)的透鏡成像原理,由于透鏡成像較為復(fù)雜,目前基本采用針孔成像模型來近似處理。如圖所示,Oc為攝像機的光軸中心點,π'為攝像機的成像平面,按針孔成像原理,攝像機前的物體在像平面π'上的像是倒立的實像。像的尺寸和物體實際的大小成正比,與物體到光心的距離成反比。為方便分析,將像平面π'沿光軸移到光心前面的對稱平面,這樣物體的像就和實物方向相同,根據(jù)這樣的假設(shè),下面建立物象的透射投影關(guān)系。以攝像機的光心Oc為攝像機的坐標原點,以光軸作為攝像機的Zc軸,取從攝像機到景物的方向為Zc軸正方向,Xc軸方向取圖像坐標沿水平增加的方向。在攝像機的坐標系中,設(shè)空間點P的坐標為,P在像平面π的像點p的物理坐標為,則按小孔成像的比例關(guān)系有:53整理ppt攝像機小孔成像簡化模型:按小孔成像的比例關(guān)系有:54整理ppt
應(yīng)用齊次坐標的概念,將以上關(guān)系用矩陣的形式表達如下:
一般攝像機是放在某個空間坐標里(一般稱世界坐標),因此可用坐標變換的平移—旋轉(zhuǎn)關(guān)系,表達攝像機坐標(xc,yc,zc)和世界坐標(xw,yw,zw
)的關(guān)系:55整理ppt
攝像機采集的圖像以數(shù)字圖像的形式存儲的,一般每幅數(shù)字圖像在計算機內(nèi)以M行N列的圖像像素坐標(Pixel)來表達的,圖像坐標的原點一般設(shè)在左上角或左下角。由于(9-2)是以物理單位(如毫米)建立的透射投影關(guān)系,需要將其轉(zhuǎn)化為計算機的圖像坐標,設(shè)數(shù)字圖像的像素坐
溫馨提示
- 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
- 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
- 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
- 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負責(zé)。
- 6. 下載文件中如有侵權(quán)或不適當內(nèi)容,請與我們聯(lián)系,我們立即糾正。
- 7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。
最新文檔
- 投資項目協(xié)議書合作合同
- 天文競賽測試題及答案
- 2025年壁紙采購供應(yīng)合同模板
- 社會工作者備考試題及答案分析
- 鹽霧試驗試題及答案
- 2025年軟件評測師考試備考小組合作策略試題及答案
- 高鐵乘務(wù)考試試題及答案
- 小溪流的測試題及答案
- 系統(tǒng)集成項目跟蹤與反饋試題及答案
- 呼吸機模式試題及答案
- 廣州市人力資源和社會保障局事業(yè)單位招聘工作人員【共500題含答案解析】模擬檢測試卷
- 發(fā)動機機械-01.1cm5a4g63維修手冊
- 馬克思主義新聞觀十二講之第八講堅持新聞?wù)鎸嵲瓌t課件
- 交通信號控制系統(tǒng)檢驗批質(zhì)量驗收記錄表
- 護理部用藥安全質(zhì)量評價標準
- 電子印鑒卡講解
- 中國本土私募股權(quán)基金的投資管理及退出(清華)
- 深基坑工程安全檢查表范本
- 汽車零部件規(guī)范申報ppt課件
- 門護板設(shè)計指導(dǎo)書RYSAT
- 沙盤游戲治療(課堂PPT)
評論
0/150
提交評論