第2章-數(shù)字圖像處理基礎(chǔ)_第1頁(yè)
第2章-數(shù)字圖像處理基礎(chǔ)_第2頁(yè)
第2章-數(shù)字圖像處理基礎(chǔ)_第3頁(yè)
第2章-數(shù)字圖像處理基礎(chǔ)_第4頁(yè)
第2章-數(shù)字圖像處理基礎(chǔ)_第5頁(yè)
已閱讀5頁(yè),還剩34頁(yè)未讀, 繼續(xù)免費(fèi)閱讀

下載本文檔

版權(quán)說(shuō)明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請(qǐng)進(jìn)行舉報(bào)或認(rèn)領(lǐng)

文檔簡(jiǎn)介

數(shù)字圖像處理第2章數(shù)字圖像處理基礎(chǔ)2.1數(shù)字圖像2.2數(shù)字圖像處理與識(shí)別2.3數(shù)字圖像處理的預(yù)備知識(shí)2.1數(shù)字圖像2.1.1什么是數(shù)字圖像

(1)圖:是物體反射或者透射電磁波的分布。(2)像:是人的視覺(jué)系統(tǒng)對(duì)接收的圖信息在大腦中形成的印象。(3)圖像:是“圖”和“像”的結(jié)合。具體來(lái)說(shuō),就是用各種觀測(cè)系統(tǒng)以不同形式和手段觀測(cè)客觀世界而獲得的、可以直接或間接作用于人的視覺(jué)系統(tǒng)而產(chǎn)生的視知覺(jué)實(shí)體。2.1什么是數(shù)字圖像處理?

2.1.1什么是數(shù)字圖像

數(shù)字圖像是圖像的數(shù)字表示,像素是其最小的單位。數(shù)字圖像的描述是指如何用一個(gè)數(shù)值方式來(lái)表示一個(gè)圖像。

2.1.1什么是數(shù)字圖像

(4)數(shù)字圖像就是能夠在計(jì)算機(jī)上顯示和處理的圖像。根據(jù)其特性可分為兩大類(lèi)——位圖和矢量圖。位圖通常用數(shù)字陣列【像素】來(lái)表示,常見(jiàn)格式有.bmp、.jpg、.gif等矢量圖由矢量數(shù)據(jù)庫(kù)【數(shù)學(xué)矢量】來(lái)表示,接觸較多的.png圖形(5)

一幅圖像可定義為一個(gè)二維函數(shù)(6)M×N的數(shù)字圖像由M行N列的有限元素組成,每個(gè)元素都有特定的位置和幅值,代表了其所在行列位置上的圖像物理信息,如灰度和色彩等。(7)這些元素稱(chēng)為圖像元素或像素。(8)圖像的兩個(gè)本質(zhì)屬性:幅值f、空間坐標(biāo)(x,y)

2.1.1什么是數(shù)字圖像因?yàn)榫仃囀嵌S的,所以可以用矩陣來(lái)描述數(shù)字圖像。描述數(shù)字圖像的矩陣目前采用的是整數(shù)陣,即每個(gè)像素的亮暗,用一個(gè)整數(shù)來(lái)表示。2.1.2數(shù)字圖像的顯示2.1.2數(shù)字圖像的顯示數(shù)字圖像(位圖):f,x,y,非負(fù)有限離散把連續(xù)的感知數(shù)據(jù)轉(zhuǎn)換為數(shù)字形式:對(duì)坐標(biāo)值進(jìn)行數(shù)字化稱(chēng)為采樣對(duì)幅值數(shù)字化稱(chēng)為量化

1.二值圖像0表示黑色1表示白色2.灰度圖像灰度級(jí)L=2k(k=8L=256)3.RGB彩色圖像通過(guò)控制RGB三原色的合成比例可決定該像素最終顯示的顏色2.1.3數(shù)字圖像的分類(lèi)———依據(jù)每個(gè)像素代表的信息的不同灰度圖像是指每個(gè)像素的信息由一個(gè)量化的灰度級(jí)來(lái)描述的圖像,沒(méi)有彩色信息。數(shù)字圖像的概念與描述

——

彩色圖像彩色圖像是指每個(gè)像素的信息由RGB三原色構(gòu)成的圖像,其中RGB是由不同的灰度級(jí)來(lái)描述的。彩色圖像不能用一個(gè)矩陣來(lái)描述了,一般是用三個(gè)矩陣同時(shí)來(lái)描述。顏色紅色分量(R)綠色分量(G)藍(lán)色分量(B)黑色000白色255255255紅色25500

綠色02550

藍(lán)色00255青色0255255品紅(紫色)2550255黃色2552550灰色128128128橄欖色1281280深青色0128128銀色192192192常用顏色的RGB值組合在RGB圖像中每個(gè)像素都是用24位二進(jìn)制數(shù)表示,故也稱(chēng)為24位真彩色圖像。

4.索引圖像調(diào)色板顏色查找表1.靜態(tài)圖像f(x,y)和動(dòng)態(tài)圖像f(x,y,t)2.二維矩陣和二維數(shù)組【MatlabIPT】2.1.4數(shù)字圖像的實(shí)質(zhì)2.1.5數(shù)字圖像的表示“f”

二值圖像的3種不同的表示方式:離散點(diǎn)集

覆蓋區(qū)域

矩陣表達(dá)2.1.5數(shù)字圖像的表示矩陣是按照行列的順序來(lái)定位數(shù)據(jù)的,但是圖像是在平面上定位數(shù)據(jù)的,所以有一個(gè)坐標(biāo)系定義上的特殊性。為了編程方便起見(jiàn),這里以矩陣坐標(biāo)系來(lái)定義圖像的坐標(biāo)。行(i)列(j)矩陣A(i,j)矩陣坐標(biāo)系X軸(i)Y軸(j)圖像f(i,j)直角坐標(biāo)系2.1.5數(shù)字圖像的表示2.1.5數(shù)字圖像的表示“(x,y)”數(shù)字圖像的坐標(biāo)約定M行N列1024*768f(x,y)空間分辨率

M×N

空間分辨率變化對(duì)圖像視覺(jué)效果的影響2.1.6圖像的空間和灰度級(jí)分辨率對(duì)坐標(biāo)值進(jìn)行數(shù)字化稱(chēng)為采樣(a)(b)(c)(d)(e)(f)灰度分辨率變化對(duì)圖像視覺(jué)效果的影響圖像的大小比特?cái)?shù)bitb=M×N×k圖像的灰度級(jí)階數(shù)L=2k[0L-1]灰度級(jí)分辨率L=256=28(a)(b)(c)(d)(e)(f)灰度分辨率變化對(duì)圖像視覺(jué)效果的影響示例

對(duì)幅值數(shù)字化稱(chēng)為量化?;叶确直媛视址Q(chēng)為色階,是指圖像中可分辨的灰度級(jí)數(shù)目,L。數(shù)字圖像處理是指使用電子計(jì)算機(jī)對(duì)量化的數(shù)字圖像進(jìn)行處理,具體地說(shuō)就是通過(guò)對(duì)圖像進(jìn)行各種加工來(lái)改善圖像的外觀,是對(duì)圖像的修改和增強(qiáng)。圖像處理的輸入是從傳感器或其他來(lái)源獲取的原始數(shù)字圖像,輸出是經(jīng)過(guò)處理后的輸出圖像。數(shù)字圖像處理2.2數(shù)字圖像處理與識(shí)別數(shù)字圖像分析是指對(duì)圖像中感興趣的目標(biāo)進(jìn)行檢測(cè),以獲得可觀的信息。數(shù)字圖像分析通常是指將一幅圖像轉(zhuǎn)化為另一種圖像的抽象形式,例如圖像中某物體與測(cè)量者的距離,目標(biāo)對(duì)象的計(jì)數(shù)或其尺寸等。圖像分析的輸入是經(jīng)過(guò)處理的數(shù)字圖像,其輸出通常不再是數(shù)字圖像,而是一系列與目標(biāo)相關(guān)的圖像特征(目標(biāo)的描述),如目標(biāo)的長(zhǎng)度、顏色、曲率和個(gè)數(shù)等。數(shù)字圖像分析2.2數(shù)字圖像處理與識(shí)別數(shù)字圖像識(shí)別主要是研究圖像中各目標(biāo)的性質(zhì)和相互關(guān)系,識(shí)別出目標(biāo)對(duì)象的類(lèi)別,從而理解圖像的含義。圖像識(shí)別是圖像分析的延伸,它根據(jù)圖像分析中得到的相關(guān)描述(特征)對(duì)目標(biāo)進(jìn)行歸類(lèi),輸出我們感興趣的目標(biāo)類(lèi)別標(biāo)號(hào)信息(符號(hào))。數(shù)字圖像識(shí)別2.2數(shù)字圖像處理與識(shí)別2.2.1從圖像處理到圖像識(shí)別2.2數(shù)字圖像處理與識(shí)別景物

光學(xué)圖像膠片圖像數(shù)字圖像處理結(jié)果輸出物體計(jì)算機(jī)系統(tǒng)顯示、打印、記錄設(shè)備或機(jī)械執(zhí)行機(jī)構(gòu)數(shù)字?jǐn)z影機(jī)圖像處理軟件專(zhuān)用圖像處理硬件視覺(jué)傳感器機(jī)器視覺(jué)系統(tǒng)的一般架構(gòu)2.2.2什么是機(jī)器視覺(jué)計(jì)算機(jī)視覺(jué)?機(jī)器視覺(jué)就是用機(jī)器代替人眼來(lái)做測(cè)量和判斷。機(jī)器視覺(jué)系統(tǒng)是指通過(guò)視覺(jué)傳感器(即圖像采集裝置,分CMOS和CCD兩種)將被攝取目標(biāo)轉(zhuǎn)換成圖像信號(hào),傳送給專(zhuān)用的圖像處理系統(tǒng),根據(jù)像素分布和亮度、顏色等信息,轉(zhuǎn)變成數(shù)字化信號(hào);圖像系統(tǒng)對(duì)這些信號(hào)進(jìn)行各種運(yùn)算來(lái)抽取目標(biāo)的特征,進(jìn)而根據(jù)判別的結(jié)果來(lái)控制現(xiàn)場(chǎng)的設(shè)備動(dòng)作。計(jì)算機(jī)視覺(jué)是指用計(jì)算機(jī)實(shí)現(xiàn)人類(lèi)的視覺(jué)功能,即對(duì)客觀世界中三維場(chǎng)景的感知、加工和理解。

視覺(jué)研究的原始目的是把握和理解有關(guān)場(chǎng)景的圖像,辨識(shí)和定位其中的目標(biāo),確定他們的結(jié)構(gòu),空間排列和分布以及目標(biāo)間的相互關(guān)系等。計(jì)算機(jī)視覺(jué)的研究目標(biāo)是根據(jù)感知到的圖像對(duì)客觀世界中實(shí)際的目標(biāo)和場(chǎng)景作出有意義的判斷。2.3.1鄰接性、連通性、區(qū)域和邊界2.3數(shù)字圖像處理的預(yù)備知識(shí)像素鄰域4-鄰域8-鄰域?qū)?鄰域8-鄰域像素鄰域8-鄰域像素鄰接“相似性”8-鄰接4-鄰接定義V是用于決定鄰接性的灰度集合,它是一種相似性的度量,用于確定所需判斷的像素之間的相似程度連通性:令S代表圖像中的像素子集。如果在S中全部像素之間存在一個(gè)通路,則可以稱(chēng)2個(gè)像素P和Q在S中是連通的。連通分量:對(duì)于S中的任何像素P,S中連通到該像素的像素集叫做S的連通分量。連通集:如果S中僅有一個(gè)連通分量,則集合S叫做連通集。區(qū)域:令R是圖像中的一個(gè)像素子集,如果R同時(shí)是連通集,則稱(chēng)R是一個(gè)區(qū)域。通路:像素P到Q的通路是一個(gè)特定的像素序列,(x0,y0)=(xp,yp),(xn,yn)=(xq,yq)。且(xi,yi)和(xi-1,yi-1)在滿足1≤i≤n時(shí)是鄰接的,n為通路長(zhǎng)度。邊界:一個(gè)區(qū)域的邊界是區(qū)域中所有包含一個(gè)或多個(gè)不在區(qū)域R中的鄰接像素的像素所組成的集合。通常情況下,區(qū)域指的是一幅圖像的子集,并包括區(qū)域的邊緣。邊緣:區(qū)域的邊緣由具有某些導(dǎo)數(shù)值的像素組成,是一個(gè)像素及其直接鄰域的局部性質(zhì),是個(gè)有大小方向?qū)傩缘氖噶?。邊界和邊緣是不同的。邊界是和區(qū)域有關(guān)的全局概念,而邊緣表示圖像函數(shù)的局部性質(zhì)。

相似性度量和變化檢測(cè)是圖像技術(shù)的兩個(gè)根本途徑。

1、距離度量函數(shù)

對(duì)于坐標(biāo)分別位于(x,y),(u,v)和(w,z)處的像素p、q和r,如果:

(1)D(p,q)≥0(D(p,q)=0,當(dāng)且僅當(dāng)p=q,即p和q是指同一像素);

(2)D(p,q)=D(q,p);

(3)D(p,q)≤D(p,r)

+D(q,r)。則D是距離度量函數(shù)。

2.3.2距離度量的幾種方法非負(fù)性;等價(jià)性;兩點(diǎn)之間“距離”最短

2、歐氏距離

像素p和q之間的歐氏(Euclidean)距離定義為:

De(p,q)=[(x-u)2+(y-v)2]1/2也即,所有距像素點(diǎn)(x,y)的歐氏距離小于或等于d的像素都包含在以(x,y)為中心,以d為半徑的圓平面中。

3、街區(qū)距離

像素p和q之間的D4距離,也即街區(qū)(city-block)距離,定義為:

D4(p,q)=|x-u|+|y-v|也即,所有相距像素點(diǎn)(x,y)的D4距離為小于d或等于d的像素組成一個(gè)中心點(diǎn)在(x,y)的菱形。

3、街區(qū)距離(續(xù))

比如,那些與點(diǎn)(x,y)的D4距離為小于2或等于2的像素組成了如下圖所示的等距離輪廓。

2

212

21012

2122

4、棋盤(pán)距離

像素p和q之間的D8距離,也即棋盤(pán)距離,定義為:

D8(p,q)=max(|x-u|,|y-v|)也即,所有距像素點(diǎn)(x,y)的D8距離為小于d或等于d的像素組成一個(gè)中心點(diǎn)在(x,y)的方形。

4、棋盤(pán)距離

比如,距點(diǎn)(x,y)的D8距離小于或等于2的像素組成了如下圖所示的等距離輪廓。

22222

21112

21012

21112

22222

De(p,q)=?D4(p,q)=?D8(p,q)=?2.3.2距離度量的幾種方法2.3.3基本的圖像操作

1、點(diǎn)運(yùn)算和鄰域運(yùn)算

點(diǎn)運(yùn)算鄰域運(yùn)算令f1(x,y)與H[f1(x,y)]、f2(x,y)與H[f2(x,y)]分別代表兩對(duì)不同的輸入和輸出圖像,H是一種算子(理解為運(yùn)算處理過(guò)程,或稱(chēng)操作

溫馨提示

  • 1. 本站所有資源如無(wú)特殊說(shuō)明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請(qǐng)下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請(qǐng)聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁(yè)內(nèi)容里面會(huì)有圖紙預(yù)覽,若沒(méi)有圖紙預(yù)覽就沒(méi)有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫(kù)網(wǎng)僅提供信息存儲(chǔ)空間,僅對(duì)用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對(duì)用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對(duì)任何下載內(nèi)容負(fù)責(zé)。
  • 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請(qǐng)與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶因使用這些下載資源對(duì)自己和他人造成任何形式的傷害或損失。

評(píng)論

0/150

提交評(píng)論