數(shù)字圖像chp1_第1頁(yè)
數(shù)字圖像chp1_第2頁(yè)
數(shù)字圖像chp1_第3頁(yè)
數(shù)字圖像chp1_第4頁(yè)
數(shù)字圖像chp1_第5頁(yè)
已閱讀5頁(yè),還剩20頁(yè)未讀, 繼續(xù)免費(fèi)閱讀

下載本文檔

版權(quán)說(shuō)明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請(qǐng)進(jìn)行舉報(bào)或認(rèn)領(lǐng)

文檔簡(jiǎn)介

1、數(shù)字圖像處理天津工業(yè)大學(xué)計(jì)算機(jī)學(xué)院 張錚關(guān)于我張錚1981.2博士畢業(yè)于天津大學(xué)主要研究方向?yàn)閿?shù)字圖像處理,模式識(shí)別,機(jī)器視覺(jué),人臉識(shí)別,表情識(shí)別1.著作著作數(shù)字圖像處理與機(jī)器視覺(jué)初步人民郵電出版社Windows程序設(shè)計(jì)(第2版)人民郵電出版社2.譯著譯著專(zhuān)業(yè)Linux系統(tǒng)管理人民郵電出版社3.主要主要論文論文A Novel Two-Stage Illumination Estimation Framework for Expression Recognition The Scientific World Journal, SCI IndexExpression Recognition Bas

2、ed on Multi-scale Block Local Gabor Binary Patterns with Dichotomy-Dependent WeightsSpringers Lecture Notes in Computer Science EI檢索號(hào): 200937123040003D Representative Face and Clustering Based Illumination Estimation for Face Recognition and Expression RecognitionSpringers Lecture Notes in Computer

3、Science EI檢索號(hào): 20093712304211A Distributed Face Recognition Framework Based on Data Fusion International Journal of Database Theory and Application, EI Journal3.相關(guān)專(zhuān)利相關(guān)專(zhuān)利1.一種辦公事務(wù)過(guò)程管理系統(tǒng)的實(shí)現(xiàn)方法2.一種點(diǎn)陣均勻的網(wǎng)屏編碼的識(shí)別方法3.在紙介質(zhì)文件上埋入信息的處理方法關(guān)于本課程 30學(xué)時(shí),需要課下動(dòng)手實(shí)踐學(xué)時(shí),需要課下動(dòng)手實(shí)踐 平時(shí)成績(jī)(出勤、課上回答問(wèn)題、實(shí)驗(yàn)作業(yè))平時(shí)成績(jī)(出勤、課上回答問(wèn)題、實(shí)驗(yàn)作業(yè))+期末成績(jī)

4、期末成績(jī) 教材教材數(shù)字圖像處理與機(jī)器視覺(jué)(第數(shù)字圖像處理與機(jī)器視覺(jué)(第2版)版)人民郵電出版社人民郵電出版社 參考書(shū)數(shù)字圖像處理(第3版)岡薩雷斯,電子工業(yè)出版社 實(shí)驗(yàn)軟件Matlab關(guān)于本課程Chpter1 初識(shí)數(shù)字圖像處理與機(jī)器視覺(jué) 認(rèn)識(shí)圖像 圖像圖像是指能在人的視覺(jué)系統(tǒng)中產(chǎn)生視覺(jué)印象的客觀對(duì)象,包括自然景物、拍攝到的圖片、用數(shù)學(xué)方法描述的圖形等等。圖像的要素有幾何要素(刻畫(huà)對(duì)象的輪廓、形狀等)和非幾何要素(刻畫(huà)對(duì)象的顏色、材質(zhì)等)。 自然界中的圖像都是模擬量,在計(jì)算機(jī)普遍應(yīng)用之前,電視、電影、照相機(jī)等圖像記錄與傳輸設(shè)備都是使用模擬信號(hào)對(duì)圖像進(jìn)行處理。但是,計(jì)算機(jī)只能處理數(shù)字量,而不能直接

5、處理模擬圖像。認(rèn)識(shí)數(shù)字圖像 簡(jiǎn)單地說(shuō),數(shù)字圖像就是能夠在計(jì)算機(jī)上顯示和處理的圖像,可根據(jù)其特性分為兩大類(lèi) 位圖和矢量圖。 位圖:BMP、JPG、GIF等; 矢量圖:PNG等。 可以將一幅圖像視為一個(gè)二維函數(shù)f(x, y),其中x和y是空間坐標(biāo),而在x y平面中的任意一對(duì)空間坐標(biāo)(x, y)上的幅值幅值f稱(chēng)為該點(diǎn)圖像的灰度灰度、亮度亮度或強(qiáng)度強(qiáng)度。此時(shí),如果f、x、y均為非負(fù)有限離散,則稱(chēng)該圖像為數(shù)字圖像數(shù)字圖像(位圖位圖)。 一個(gè)大小為MN數(shù)字圖像是由M行N列的有限元素組成的,每個(gè)元素都有特定的位置和幅值,代表了其所在行列位置上的圖像物理信息,如灰度和色彩等。這些元素稱(chēng)為圖像元素圖像元素或像素

6、像素。數(shù)字圖像的顯示 計(jì)算機(jī)顯示器,都是由許多點(diǎn)構(gòu)成的,顯示圖像時(shí)這些點(diǎn)對(duì)應(yīng)著圖像的像素,稱(chēng)顯示器為位映像設(shè)備。所謂位映像,就是一個(gè)二維的像素矩陣,而位圖也就是采用位映像方法顯示和存儲(chǔ)的圖像。當(dāng)一幅數(shù)字圖像被放大后就可以明顯地看出圖像是由很多方格形狀的像素構(gòu)成的數(shù)字圖像的分類(lèi) 根據(jù)每個(gè)像素所代表信息的不同,可將圖像分為: 二值圖像 灰度圖像 RGB圖像(24位真彩色) 索引圖像(調(diào)色板(Palette)/顏色查找表(LUT:Look Up Table)一個(gè)長(zhǎng)、寬各為200像素,顏色數(shù)為16的彩色圖像,每個(gè)像素都用RGB三個(gè)分量表示。則存儲(chǔ)它需要的空間是多少?索引圖像的適用情況是什么?圖像較大并

7、且顏色數(shù)目不是很多數(shù)字圖像的實(shí)質(zhì) 函數(shù)函數(shù):數(shù)字圖像f(x, y)的定義僅適用于最為一般的情況,即靜態(tài)的灰度圖像。更嚴(yán)格地說(shuō),數(shù)字圖像可以是2個(gè)變量(對(duì)于靜止圖像,static image)或3個(gè)變量(對(duì)于動(dòng)態(tài)畫(huà)面,video sequence)的離散函數(shù)。在靜態(tài)圖像的情況下是的f (x, y),而如果是動(dòng)態(tài)畫(huà)面,則還需要時(shí)間參數(shù)t,即f (x, y, t);函數(shù)值可能是一個(gè)數(shù)值(對(duì)于灰度圖像),也可能是一個(gè)向量(對(duì)于彩色圖像)。 矩陣:矩陣:從線性代數(shù)和矩陣論的角度,數(shù)字圖像就是一個(gè)由圖像信息組成的二維矩陣,矩陣的每個(gè)元素代表對(duì)應(yīng)位置上的圖像亮度和/或色彩信息。當(dāng)然,這個(gè)二維矩陣在數(shù)據(jù)表示和

8、存儲(chǔ)上可能不是二維的,這是因?yàn)槊總€(gè)單位位置的圖像信息可能需要不只一個(gè)數(shù)值來(lái)表示,這樣可能需要一個(gè)三維矩陣來(lái)對(duì)其進(jìn)行表示。數(shù)字圖像的數(shù)字圖像的表示表示數(shù)字圖像的數(shù)字圖像的表示表示圖像的空間和灰度級(jí)分辨率從從數(shù)字圖像處理到數(shù)字圖像處理到識(shí)別識(shí)別圖像識(shí)別圖像分析圖像處理符號(hào)目標(biāo)像素抽象性數(shù)據(jù)量小大大小機(jī)器視覺(jué)機(jī)器視覺(jué)(Machine Vision)(Machine Vision) 機(jī)器視覺(jué)機(jī)器視覺(jué)(Machine Vision),又稱(chēng)計(jì)算機(jī)視覺(jué)計(jì)算機(jī)視覺(jué)(Computer Vision)。它是將數(shù)字圖像處理和數(shù)字圖像分析、圖像識(shí)別結(jié)合起來(lái),試圖開(kāi)發(fā)出一種能與人腦的部分機(jī)能比擬,能夠理解自然景物和環(huán)境

9、的系統(tǒng),在機(jī)器人領(lǐng)域中為機(jī)器人提供類(lèi)人視覺(jué)的功能。計(jì)算機(jī)視覺(jué)是數(shù)字成像領(lǐng)域的尖端方向,具有最綜合的內(nèi)容和最廣泛的涵蓋面。 廣義概念上的圖像處理與識(shí)別數(shù)字圖像處理和識(shí)別的應(yīng)用實(shí)例相關(guān)領(lǐng)域相關(guān)領(lǐng)域典型應(yīng)用典型應(yīng)用安全監(jiān)控安全監(jiān)控指紋驗(yàn)證,基于人臉識(shí)別的門(mén)禁指紋驗(yàn)證,基于人臉識(shí)別的門(mén)禁系統(tǒng)系統(tǒng)工業(yè)控制工業(yè)控制產(chǎn)品無(wú)損檢測(cè),商品自動(dòng)分類(lèi)產(chǎn)品無(wú)損檢測(cè),商品自動(dòng)分類(lèi)醫(yī)療保健醫(yī)療保健X光照片增強(qiáng),光照片增強(qiáng),CT,核磁共振,核磁共振,病灶自動(dòng)檢測(cè)病灶自動(dòng)檢測(cè)生活?yuàn)蕵?lè)生活?yuàn)蕵?lè)基于表情識(shí)別的笑臉自動(dòng)檢測(cè),基于表情識(shí)別的笑臉自動(dòng)檢測(cè),汽車(chē)自動(dòng)駕駛,手寫(xiě)字符識(shí)別汽車(chē)自動(dòng)駕駛,手寫(xiě)字符識(shí)別數(shù)字圖像處理和識(shí)別的應(yīng)用實(shí)例

10、數(shù)字圖像處理和識(shí)別的應(yīng)用實(shí)例數(shù)字圖像處理的預(yù)備知識(shí) 鄰接性、連通性、區(qū)域和邊界1. 鄰接性(Adjacency)除了位置因素,還要考慮像素值的相似性除了位置因素,還要考慮像素值的相似性 4鄰接(4-Neighbor):如果 QN4(P),則稱(chēng)具有V中數(shù)值的兩個(gè)像素P和Q是4鄰接的。 8鄰接(8-Neighbor):如果 QN8(P),則稱(chēng)具有V中數(shù)值的兩個(gè)像素P和Q是8鄰接的。V是用于決定鄰接性的灰度值集合,它是一種相似性的度量。如在二值圖像中,如認(rèn)為只有灰度值為1的像素是相似的,則即V=1,當(dāng)然相似性的規(guī)定具有主觀標(biāo)準(zhǔn),因此也可以認(rèn)為V=0,1,此時(shí)鄰接性完全由位置決定數(shù)字圖像處理的預(yù)備知識(shí)

11、數(shù)字圖像處理的預(yù)備知識(shí)2.連通性像素像素P到像素到像素Q的通路(的通路(Path)指的是一個(gè)特定的像素序列(x0, y0), (x1, y1), , (xn, yn),其中(x0, y0) = (xp, yp),(xn, yn) = (xq, yq)。并且像素(xi, yi) 和(xi-1, yi-1) 在滿足1in時(shí)是鄰接的。在上面的定義中,n是通路的長(zhǎng)度,若(x0, y0) = (xn, yn),則這條通路是閉合通路。相對(duì)應(yīng)于鄰接的概念,在這里有4通路和8通路。像素的連通性(像素的連通性(Contiguous):令S代表一幅圖像中的像素子集。如果在S中全部像素之間存在一個(gè)通路,則可以稱(chēng)2個(gè)

12、像素P和Q在S中是連通的。此外,對(duì)于S中的任何像素P,S中連通到該像素的像素集叫做S的連通分量連通分量。如果S中僅有一個(gè)連通分量,則集合S叫做連通集連通集。數(shù)字圖像處理的預(yù)備知識(shí)數(shù)字圖像處理的預(yù)備知識(shí) 3. 區(qū)域和邊界區(qū)域的定義建立在連通集的基礎(chǔ)上的。令R是圖像中的一個(gè)像素子集,如果R同時(shí)是連通集,則稱(chēng)R為一個(gè)區(qū)域(區(qū)域(Region)。邊界(邊界(Boundary)的概念是相對(duì)于區(qū)域而言的。一個(gè)區(qū)域的邊界(或邊緣、輪廓)是區(qū)域中所有有一個(gè)或多個(gè)不在區(qū)域R中的鄰接像素的像素所組成的集合。顯然,如果區(qū)域R是整幅圖像,那么邊界就由圖像的首行、首列、末行和末列定義。因而,通常情況下,區(qū)域指一幅圖像的

13、子集,并包括區(qū)域的邊緣。而區(qū)域的邊緣(邊緣(Edge)由具有某些導(dǎo)數(shù)值的像素組成,是一個(gè)像素及其直接鄰域的局部性質(zhì),是一個(gè)有大小和方向?qū)傩缘氖噶俊?shù)字圖像處理的預(yù)備知識(shí)數(shù)字圖像處理的預(yù)備知識(shí) 距離度量的幾種方法 基于上一小節(jié)提到的相關(guān)知識(shí),我們來(lái)理解距離度量的概念。假設(shè)對(duì)于像素P(xp, yp),Q(xq, yq),R(xr, yr)而言,有函數(shù)D滿足如下三個(gè)條件,則函數(shù)D可被稱(chēng)為距離函數(shù)或度量。 D(P, Q) 0,當(dāng)且僅當(dāng)P = Q時(shí)有D(P, Q) = 0 D(P, Q) = D(Q, P) D(P, Q) D(P, R) + D(R, Q) 數(shù)字?jǐn)?shù)字圖像處理的預(yù)備知識(shí)圖像處理的預(yù)備知識(shí)圖像的基本運(yùn)算圖像的基本運(yùn)算1. 點(diǎn)運(yùn)算和鄰域運(yùn)算點(diǎn)運(yùn)算指的是對(duì)圖像中的每一個(gè)像素逐個(gè)進(jìn)行同樣的灰度變換運(yùn)算。設(shè)r和s分別是輸入圖像f(x, y)和輸出圖像g(x, y)在任一點(diǎn)(x, y)的灰度值,則點(diǎn)運(yùn)算可以使用下式定義: s = T(r)而如果將點(diǎn)運(yùn)算擴(kuò)展,對(duì)圖像中每一個(gè)小范圍(鄰域)內(nèi)的像素進(jìn)行灰度變換運(yùn)算,即稱(chēng)為鄰域運(yùn)算或鄰域?yàn)V波。這可以

溫馨提示

  • 1. 本站所有資源如無(wú)特殊說(shuō)明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請(qǐng)下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請(qǐng)聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁(yè)內(nèi)容里面會(huì)有圖紙預(yù)覽,若沒(méi)有圖紙預(yù)覽就沒(méi)有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫(kù)網(wǎng)僅提供信息存儲(chǔ)空間,僅對(duì)用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對(duì)用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對(duì)任何下載內(nèi)容負(fù)責(zé)。
  • 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請(qǐng)與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶因使用這些下載資源對(duì)自己和他人造成任何形式的傷害或損失。

最新文檔

評(píng)論

0/150

提交評(píng)論