數(shù)字圖像chp1資料_第1頁
數(shù)字圖像chp1資料_第2頁
數(shù)字圖像chp1資料_第3頁
數(shù)字圖像chp1資料_第4頁
數(shù)字圖像chp1資料_第5頁
已閱讀5頁,還剩21頁未讀, 繼續(xù)免費(fèi)閱讀

下載本文檔

版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請(qǐng)進(jìn)行舉報(bào)或認(rèn)領(lǐng)

文檔簡介

1、數(shù)字圖像處理天津工業(yè)大學(xué)計(jì)算機(jī)學(xué)院(xuyun) 張錚共二十六頁關(guān)于(guny)我張錚1981.2博士畢業(yè)于天津大學(xué)主要研究方向?yàn)閿?shù)字圖像處理,模式識(shí)別,機(jī)器視覺,人臉識(shí)別,表情識(shí)別1.著作數(shù)字圖像處理與機(jī)器視覺初步人民郵電出版社Windows程序設(shè)計(jì)(第2版)人民郵電出版社2.譯著(y zh)專業(yè)Linux系統(tǒng)管理人民郵電出版社3.主要論文A Novel Two-Stage Illumination Estimation Framework for Expression Recognition The Scientific World Journal, SCI IndexExpression

2、 Recognition Based on Multi-scale Block Local Gabor Binary Patterns with Dichotomy-Dependent WeightsSpringers Lecture Notes in Computer Science EI檢索號(hào): 200937123040003D Representative Face and Clustering Based Illumination Estimation for Face Recognition and Expression RecognitionSpringers Lecture No

3、tes in Computer Science EI檢索號(hào): 20093712304211A Distributed Face Recognition Framework Based on Data Fusion International Journal of Database Theory and Application, EI Journal3.相關(guān)專利1.一種辦公事務(wù)過程管理系統(tǒng)的實(shí)現(xiàn)方法2.一種點(diǎn)陣均勻的網(wǎng)屏編碼的識(shí)別方法3.在紙介質(zhì)文件上埋入信息的處理方法共二十六頁關(guān)于(guny)本課程30學(xué)時(shí),需要課下動(dòng)手實(shí)踐平時(shí)成績(出勤、課上回答(hud)問題、實(shí)驗(yàn)作業(yè))+期末成績教材數(shù)字圖

4、像處理與機(jī)器視覺(第2版)人民郵電出版社參考書數(shù)字圖像處理(第3版)岡薩雷斯,電子工業(yè)出版社實(shí)驗(yàn)軟件Matlab共二十六頁關(guān)于(guny)本課程共二十六頁Chpter1 初識(shí)數(shù)字圖像處理與機(jī)器(j q)視覺 共二十六頁認(rèn)識(shí)(rn shi)圖像圖像是指能在人的視覺系統(tǒng)中產(chǎn)生視覺印象的客觀對(duì)象,包括自然景物、拍攝到的圖片、用數(shù)學(xué)方法描述的圖形等等。圖像的要素有幾何要素(刻畫對(duì)象的輪廓、形狀等)和非幾何要素(刻畫對(duì)象的顏色、材質(zhì)等)。自然界中的圖像都是模擬量,在計(jì)算機(jī)普遍應(yīng)用之前,電視(dinsh)、電影、照相機(jī)等圖像記錄與傳輸設(shè)備都是使用模擬信號(hào)對(duì)圖像進(jìn)行處理。但是,計(jì)算機(jī)只能處理數(shù)字量,而不能直

5、接處理模擬圖像。共二十六頁認(rèn)識(shí)(rn shi)數(shù)字圖像簡單地說,數(shù)字圖像就是能夠在計(jì)算機(jī)上顯示和處理的圖像,可根據(jù)其特性分為兩大類 位圖和矢量圖。位圖:BMP、JPG、GIF等;矢量圖:PNG等??梢詫⒁环鶊D像視為一個(gè)二維函數(shù)f(x, y),其中(qzhng)x和y是空間坐標(biāo),而在x y平面中的任意一對(duì)空間坐標(biāo)(x, y)上的幅值f稱為該點(diǎn)圖像的灰度、亮度或強(qiáng)度。此時(shí),如果f、x、y均為非負(fù)有限離散,則稱該圖像為數(shù)字圖像(位圖)。一個(gè)大小為MN數(shù)字圖像是由M行N列的有限元素組成的,每個(gè)元素都有特定的位置和幅值,代表了其所在行列位置上的圖像物理信息,如灰度和色彩等。這些元素稱為圖像元素或像素。共

6、二十六頁數(shù)字圖像的顯示(xinsh)計(jì)算機(jī)顯示器,都是由許多點(diǎn)構(gòu)成的,顯示圖像時(shí)這些點(diǎn)對(duì)應(yīng)著圖像的像素,稱顯示器為位映像設(shè)備(shbi)。所謂位映像,就是一個(gè)二維的像素矩陣,而位圖也就是采用位映像方法顯示和存儲(chǔ)的圖像。當(dāng)一幅數(shù)字圖像被放大后就可以明顯地看出圖像是由很多方格形狀的像素構(gòu)成的共二十六頁數(shù)字圖像的分類(fn li)根據(jù)每個(gè)像素所代表信息的不同(b tn),可將圖像分為:二值圖像灰度圖像RGB圖像(24位真彩色)索引圖像(調(diào)色板(Palette)/顏色查找表(LUT:Look Up Table)一個(gè)長、寬各為200像素,顏色數(shù)為16的彩色圖像,每個(gè)像素都用RGB三個(gè)分量表示。則存儲(chǔ)它需

7、要的空間是多少?索引圖像的適用情況是什么?圖像較大并且顏色數(shù)目不是很多共二十六頁數(shù)字圖像的實(shí)質(zhì)(shzh)函數(shù):數(shù)字圖像f(x, y)的定義僅適用于最為一般的情況,即靜態(tài)的灰度圖像。更嚴(yán)格地說,數(shù)字圖像可以是2個(gè)變量(對(duì)于靜止圖像,static image)或3個(gè)變量(對(duì)于動(dòng)態(tài)畫面,video sequence)的離散函數(shù)。在靜態(tài)圖像的情況下是的f (x, y),而如果是動(dòng)態(tài)畫面,則還需要時(shí)間參數(shù)t,即f (x, y, t);函數(shù)值可能是一個(gè)數(shù)值(對(duì)于灰度圖像),也可能是一個(gè)向量(對(duì)于彩色圖像)。矩陣:從線性代數(shù)和矩陣論的角度,數(shù)字圖像就是一個(gè)由圖像信息組成的二維矩陣,矩陣的每個(gè)元素代表對(duì)應(yīng)位

8、置上的圖像亮度和/或色彩信息。當(dāng)然,這個(gè)(zh ge)二維矩陣在數(shù)據(jù)表示和存儲(chǔ)上可能不是二維的,這是因?yàn)槊總€(gè)單位位置的圖像信息可能需要不只一個(gè)數(shù)值來表示,這樣可能需要一個(gè)三維矩陣來對(duì)其進(jìn)行表示。共二十六頁數(shù)字圖像的表示(biosh)共二十六頁數(shù)字圖像的表示(biosh)共二十六頁圖像(t xin)的空間和灰度級(jí)分辨率共二十六頁從數(shù)字圖像處理到識(shí)別(shbi)圖像識(shí)別圖像分析圖像處理符號(hào)目標(biāo)像素抽象性數(shù)據(jù)量小大大小共二十六頁機(jī)器(j q)視覺(Machine Vision)機(jī)器視覺(Machine Vision),又稱計(jì)算機(jī)視覺(Computer Vision)。它是將數(shù)字圖像處理和數(shù)字圖像分析

9、、圖像識(shí)別結(jié)合起來,試圖開發(fā)出一種能與人腦的部分機(jī)能比擬,能夠理解自然景物和環(huán)境(hunjng)的系統(tǒng),在機(jī)器人領(lǐng)域中為機(jī)器人提供類人視覺的功能。計(jì)算機(jī)視覺是數(shù)字成像領(lǐng)域的尖端方向,具有最綜合的內(nèi)容和最廣泛的涵蓋面。廣義概念上的圖像處理與識(shí)別共二十六頁數(shù)字圖像處理和識(shí)別(shbi)的應(yīng)用實(shí)例相關(guān)領(lǐng)域典型應(yīng)用安全監(jiān)控指紋驗(yàn)證,基于人臉識(shí)別的門禁系統(tǒng)工業(yè)控制產(chǎn)品無損檢測(cè),商品自動(dòng)分類醫(yī)療保健X光照片增強(qiáng),CT,核磁共振,病灶自動(dòng)檢測(cè)生活?yuàn)蕵坊诒砬樽R(shí)別的笑臉自動(dòng)檢測(cè),汽車自動(dòng)駕駛,手寫字符識(shí)別共二十六頁數(shù)字圖像處理和識(shí)別(shbi)的應(yīng)用實(shí)例共二十六頁數(shù)字圖像處理和識(shí)別(shbi)的應(yīng)用實(shí)例共二十

10、六頁數(shù)字圖像處理的預(yù)備(ybi)知識(shí)鄰接性、連通性、區(qū)域和邊界1. 鄰接性(Adjacency)除了(ch le)位置因素,還要考慮像素值的相似性4鄰接(4-Neighbor):如果 QN4(P),則稱具有V中數(shù)值的兩個(gè)像素P和Q是4鄰接的。8鄰接(8-Neighbor):如果 QN8(P),則稱具有V中數(shù)值的兩個(gè)像素P和Q是8鄰接的。V是用于決定鄰接性的灰度值集合,它是一種相似性的度量。如在二值圖像中,如認(rèn)為只有灰度值為1的像素是相似的,則即V=1,當(dāng)然相似性的規(guī)定具有主觀標(biāo)準(zhǔn),因此也可以認(rèn)為V=0,1,此時(shí)鄰接性完全由位置決定共二十六頁數(shù)字圖像處理的預(yù)備(ybi)知識(shí)2.連通性像素P到像素

11、Q的通路(Path)指的是一個(gè)特定的像素序列(x0, y0), (x1, y1), , (xn, yn),其中(x0, y0) = (xp, yp),(xn, yn) = (xq, yq)。并且像素(xi, yi) 和(xi-1, yi-1) 在滿足1in時(shí)是鄰接的。在上面的定義中,n是通路的長度,若(x0, y0) = (xn, yn),則這條通路是閉合通路。相對(duì)(xingdu)應(yīng)于鄰接的概念,在這里有4通路和8通路。像素的連通性(Contiguous):令S代表一幅圖像中的像素子集。如果在S中全部像素之間存在一個(gè)通路,則可以稱2個(gè)像素P和Q在S中是連通的。此外,對(duì)于S中的任何像素P,S中連

12、通到該像素的像素集叫做S的連通分量。如果S中僅有一個(gè)連通分量,則集合S叫做連通集。共二十六頁數(shù)字圖像處理的預(yù)備(ybi)知識(shí)3. 區(qū)域和邊界區(qū)域的定義建立在連通集的基礎(chǔ)上的。令R是圖像中的一個(gè)像素子集,如果R同時(shí)是連通集,則稱R為一個(gè)區(qū)域(Region)。邊界(Boundary)的概念是相對(duì)于區(qū)域而言的。一個(gè)區(qū)域的邊界(或邊緣(binyun)、輪廓)是區(qū)域中所有有一個(gè)或多個(gè)不在區(qū)域R中的鄰接像素的像素所組成的集合。顯然,如果區(qū)域R是整幅圖像,那么邊界就由圖像的首行、首列、末行和末列定義。因而,通常情況下,區(qū)域指一幅圖像的子集,并包括區(qū)域的邊緣。而區(qū)域的邊緣(Edge)由具有某些導(dǎo)數(shù)值的像素組成

13、,是一個(gè)像素及其直接鄰域的局部性質(zhì),是一個(gè)有大小和方向?qū)傩缘氖噶俊9捕摂?shù)字圖像處理的預(yù)備(ybi)知識(shí)距離度量的幾種方法基于(jy)上一小節(jié)提到的相關(guān)知識(shí),我們來理解距離度量的概念。假設(shè)對(duì)于像素P(xp, yp),Q(xq, yq),R(xr, yr)而言,有函數(shù)D滿足如下三個(gè)條件,則函數(shù)D可被稱為距離函數(shù)或度量。D(P, Q) 0,當(dāng)且僅當(dāng)P = Q時(shí)有D(P, Q) = 0D(P, Q) = D(Q, P) D(P, Q) D(P, R) + D(R, Q) 共二十六頁數(shù)字(shz)圖像處理的預(yù)備知識(shí)共二十六頁圖像(t xin)的基本運(yùn)算1. 點(diǎn)運(yùn)算和鄰域運(yùn)算點(diǎn)運(yùn)算指的是對(duì)圖像中的每

14、一個(gè)像素逐個(gè)進(jìn)行同樣的灰度變換運(yùn)算。設(shè)r和s分別(fnbi)是輸入圖像f(x, y)和輸出圖像g(x, y)在任一點(diǎn)(x, y)的灰度值,則點(diǎn)運(yùn)算可以使用下式定義:s = T(r)而如果將點(diǎn)運(yùn)算擴(kuò)展,對(duì)圖像中每一個(gè)小范圍(鄰域)內(nèi)的像素進(jìn)行灰度變換運(yùn)算,即稱為鄰域運(yùn)算或鄰域?yàn)V波。這可以使用下式定義:g(x, y) = Tf(x*, y*)共二十六頁圖像(t xin)的基本運(yùn)算2. 線性和非線性操作令H是一種算子,其輸入輸出都是圖像(t xin)。若對(duì)于任意兩幅(或兩組)圖像(t xin)F1和F2及任意兩個(gè)標(biāo)量a和b都有如下關(guān)系成立:則稱H為線性算子。線性操作由于其穩(wěn)定性的特點(diǎn)而在圖像處理中占有非常重要的地位。盡管非線性算子常常也能夠提供較好的性能,但它的不可預(yù)測(cè)性使其在一些如軍事圖像處理和醫(yī)學(xué)圖像處理等嚴(yán)格的應(yīng)用領(lǐng)域中難以獲得廣泛的應(yīng)用。共二十六頁內(nèi)容摘要數(shù)字圖像處理。數(shù)字圖像處理與機(jī)器視覺

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請(qǐng)下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請(qǐng)聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會(huì)有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫網(wǎng)僅提供信息存儲(chǔ)空間,僅對(duì)用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對(duì)用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對(duì)任何下載內(nèi)容負(fù)責(zé)。
  • 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請(qǐng)與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶因使用這些下載資源對(duì)自己和他人造成任何形式的傷害或損失。

最新文檔

評(píng)論

0/150

提交評(píng)論