《智能視覺技術(shù)及應(yīng)用》課件第5章_第1頁
《智能視覺技術(shù)及應(yīng)用》課件第5章_第2頁
《智能視覺技術(shù)及應(yīng)用》課件第5章_第3頁
《智能視覺技術(shù)及應(yīng)用》課件第5章_第4頁
《智能視覺技術(shù)及應(yīng)用》課件第5章_第5頁
已閱讀5頁,還剩104頁未讀, 繼續(xù)免費閱讀

下載本文檔

版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進行舉報或認(rèn)領(lǐng)

文檔簡介

第5章圖像預(yù)處理技術(shù)5.1圖像預(yù)處理的作用5.2圖像的表達、顯示與存儲5.3灰度變換5.4幾何變換5.5

直方圖均衡化5.6圖像濾波5.7圖像銳化5.8圖像二值化本章小結(jié)

5.1圖像預(yù)處理的作用

圖像采集后,為了更有效地獲取其中的信息,需要對圖像進行進一步加工處理。與人類的視覺過程相似,圖像采集的過程就像人類的眼睛。但是,即便有了眼睛,如果沒有大腦,我們也不能“看”到任何事物。所以,對這些圖像數(shù)據(jù)的處理是機器視覺的關(guān)鍵。

圖像在傳送和轉(zhuǎn)換(成像、掃描、傳輸以及顯示等)過程中,由于噪聲、衰減等原因,一般會造成不同程度的圖像質(zhì)量下降。在攝像過程中,由于光學(xué)系統(tǒng)的失真、相機的相對運

動、大氣流動的影響等都會造成攝制圖像模糊以及平移、旋轉(zhuǎn)等問題。因此,通過圖像預(yù)處理來改善圖像質(zhì)量顯得十分重要。圖像預(yù)處理通常是針對給定圖像的應(yīng)用場合,有目的地強調(diào)圖像的整體或局部特性,將原來不清晰的圖像變得清晰或強調(diào)某些感興趣的特征,抑制不感興趣的特征,擴大圖像中不同特征之間的差別,改善圖像質(zhì)量,豐富信息量,提升圖

像分析和識別的效果。

常用的圖像預(yù)處理方式包括灰度變換、直方圖修正、圖像平滑、圖像銳化、圖像二值化等。圖像增強與感興趣的物體特性、觀察者的習(xí)慣和處理目的密切相關(guān),盡管處理方式多種多樣,但它帶有很強的針對性。因此,圖像預(yù)處理算法的應(yīng)用也是有針對性的,并不存在一種通用的、適應(yīng)各種應(yīng)用場合的預(yù)處理算法。一般情況下,為了得到比較滿意的增強效果,常常需要同時對幾種增強算法進行大量試驗,從中選出視覺較好、計算量較小、同時滿足要求的算法作為最優(yōu)的預(yù)處理算法。

5.2圖像的表達、顯示與存儲

5.2.1圖像的表達與顯示根據(jù)應(yīng)用領(lǐng)域的不同,可以有多種不同的方法來表達和表示圖像,或?qū)D像以一定的形式顯示出來。圖像表達是圖像顯示的基礎(chǔ),而圖像顯示是機器視覺系統(tǒng)的重要模塊之一。

要對圖像進行表達和顯示,需要對圖像的各個單元進行表達和顯示。圖像中的每個基本單元叫作圖像元素,用Picture表示圖像時稱為像素(PictureElement)。對于2D圖像,

英文里常用Pixel代表像素。對于3D圖像,英文里常用Voxel代表其基本單元,簡稱體素(VolumeElement)。

1.圖像表達

一幅2D圖像可以用一個2D數(shù)組來表示,常將一幅2D圖像寫成一個2D的M×N矩陣(其中M和N分別為圖像像素的總行數(shù)和總列數(shù)):

上式就是圖像的矩陣表達形式,矩陣中的每個元素對應(yīng)一個像素。

2.圖像顯示

圖像的顯示和表達是密切相關(guān)的,圖像顯示是圖像的可視表達方式。對2D圖像的顯示可以采取多種形式,其基本思路是將2D圖像看作在2D空間中的一種幅度分布。根據(jù)圖像

的不同,采取的顯示方式也不同。對于二值圖像,在每個空間位置的取值只有兩個,可用黑白來區(qū)分,也可用0和1來區(qū)分。

圖5-1所示為對同一幅2D的二值圖像的3種不同的顯

示方式。在圖像表達的數(shù)學(xué)模型中,一個像素區(qū)域常用其中心來表示,基于這些中心的表達形式就是將圖像顯示成平面上的離散點集,對應(yīng)于圖5-1(a);如果將像素區(qū)域用其所覆蓋的區(qū)域來表示,就得到圖5-1(b)所示的圖形;把幅度值標(biāo)在圖像中相應(yīng)的位置,就得到圖5-1(c)所示的類似矩陣表達的結(jié)果。用圖5-1(b)所示的形式也可表示有多個灰度的圖像,此時需要用不同深淺的色調(diào)表示不同的灰度。用圖5-1(c)所示的形式也可表示有多個灰度的圖像,此時將不同灰度用不同的數(shù)值表示。圖5-1表達同一幅4×4二值圖像的3種方式

圖5-2所示為兩幅典型的灰度圖像,它們是常用的公開圖像,或稱標(biāo)準(zhǔn)圖像。圖5-2(a)所用的坐標(biāo)系統(tǒng)常在屏幕顯示中被采用(屏幕掃描是從左向右、從上向下進行的),它的原點在圖像的左上角,縱軸標(biāo)記圖像的行,橫軸標(biāo)記圖像的列。f(x,y)既可代表這幅圖像,也可表示在(x,y)行列交點處的圖像值。圖5-2(b)所用的坐標(biāo)系統(tǒng)常在圖像計算中被采用,它的原點在圖像的左下角,橫軸為x軸,縱軸為y軸(與常用的笛卡兒坐標(biāo)系相同)。同樣,f(x,y)既可代表這幅圖像,也可表示在(x,y)坐標(biāo)處像素的值。圖5-2標(biāo)準(zhǔn)圖像顯示示例

5.2.2圖像的存儲

1.BMP格式

BMP格式是Windows環(huán)境中的一種標(biāo)準(zhǔn)(但很多Macintosh應(yīng)用程序不支持它),它的全稱是Microsoft設(shè)備獨立位圖(DeviceIndependentBitmap,DIB)。BMP圖像文件也稱

位圖文件,包括3部分:

①位圖文件頭(也稱表頭);

②位圖信息(常稱調(diào)色板);

③位圖陣列(即圖像數(shù)據(jù))。

2.GIF格式

GIF格式是一種公用的圖像文件格式標(biāo)準(zhǔn),它是8位文件格式(一個像素一個字節(jié)),最多只能存儲256色圖像。GIF文件中的圖像數(shù)據(jù)均為壓縮過的。GIF文件結(jié)構(gòu)較復(fù)雜,一

般包括7個數(shù)據(jù)單元,分別為:文件頭、通用調(diào)色板、圖像數(shù)據(jù)區(qū)以及4個補充區(qū)。其中,表頭和圖像數(shù)據(jù)區(qū)是不可缺少的單元。一個GIF文件中可以存放多幅圖像(這個特點對實現(xiàn)網(wǎng)頁上的動畫效果很有利),所以文件頭中包含適用于所有圖像的全局?jǐn)?shù)據(jù)和僅屬于其后那幅圖像的局部數(shù)據(jù)。

3.TIFF格式

TIFF格式是一種獨立于操作系統(tǒng)和文件系統(tǒng)的格式(在Windows環(huán)境和Macintosh機上都可使用),便于在軟件之間進行圖像數(shù)據(jù)交換。TIFF圖像文件包括文件頭(表頭)、文件目錄(標(biāo)識信息區(qū))和文件目錄項(圖像數(shù)據(jù)區(qū))。文件頭只有一個,且在文件前端,包含數(shù)據(jù)存放順序、文件目錄的字節(jié)偏移信息。文件目錄包含文件目錄項的個數(shù)信息,并有一組標(biāo)識信息,它會給出圖像數(shù)據(jù)區(qū)的地址。文件目錄項是存放信息的基本單位,也稱為域。

TIFF格式支持任意大小的圖像,文件可分為:二值圖像、灰度圖像、調(diào)色板彩色圖像和全彩色圖像四類。一個TIFF文件中可以存放多幅圖像,也可存放多份調(diào)色板數(shù)據(jù)。

4.JPEG格式

JPEG格式源自對靜止灰度或彩色圖像的一種壓縮標(biāo)準(zhǔn)JPEG,在使用有損壓縮方式時可節(jié)省相當(dāng)大的空間,目前數(shù)碼相機中均使用這種格式。JPEG標(biāo)準(zhǔn)只是定義了一個規(guī)范

的編碼數(shù)據(jù)流,并沒有規(guī)定圖像數(shù)據(jù)文件的格式。CubeMicrosystems公司定義了一種JPEG文件交換格式(JPEGFileInterchangeFormat,JFIF),JFIF圖像是一種使用灰度來表示或使用Y、Cb、Cr分量彩色表示的JPEG圖像,它包含一個與JPEG兼容的文件頭。一個JFIF文件通常包含單個圖像,該圖像可以是灰度的(其中的數(shù)據(jù)為單個分量),也可以

是彩色的(其中的數(shù)據(jù)是Y、Cb、Cr分量)。

5.3灰度變換

在圖像處理中,空域是指由像素組成的空間,也就是圖像域??沼蛟鰪姺椒ㄖ钢苯幼饔糜谙袼夭⒏淖兤涮匦缘念A(yù)處理方法。具體的增強操作可僅定義在每個像素位置(x,y)上,此時稱為點操作。增強操作還可定義在每個(x,y)的某個鄰域上,此時常稱為鄰域操作,定義為其中,f(x,y)和g(x,y)分別為增強前后的圖像,而E代表增強操作。

點操作是一種通過對圖像中的每個像素值(即像素點上的灰度值)進行計算的操作,又叫作點運算。

通常鄰域是指一個遠遠小于圖像尺寸的形狀規(guī)則的像素塊,例如2×2、3×3、4×4的正方形,或用來近似表示圓及橢圓等形狀的多邊形。一幅圖像所定義的鄰域應(yīng)該具有相同的大小,信號與系統(tǒng)分析中的卷積基本運算,在實際的圖像處理中都體現(xiàn)為某種特定的鄰域運算。

5.3.1點運算

點運算是像素的逐點運算,它將輸入圖像映射為輸出圖像,輸出圖像每個像素點的灰度值僅由對應(yīng)的輸入像素點的灰度值決定。點運算不會改變圖像內(nèi)像素點之間的空間關(guān)

系。設(shè)輸入圖像為A(x,y),輸出圖像為B(x,y),則點運算可表示為

1.線性點運算

線性點運算是指灰度變換函數(shù)f為線性函數(shù)時的運算。用DA表示輸入點的灰度值,DB表示相應(yīng)輸出點的灰度值,如圖5-3所示,則函數(shù)的形式如下:

當(dāng)a>1時,輸出圖像的對比度會增大;當(dāng)a<1時,輸出圖像的對比度會減小;當(dāng)a=1、b=0時,輸出圖像就是輸入圖像的簡單復(fù)制;當(dāng)a=1、b>0(或b<0)時,輸出圖像在整體效果上比輸入圖像要明亮(或灰暗)。

例如,如果對圖5-4(a)所示的PCB板子利用如圖5-3(b)所示的灰度變換函數(shù)進行點運算,那么將產(chǎn)生如圖5-4(b)所示的效果。圖5-3線性變換函數(shù)圖5-4圖像對比度減小前、后的比較

2.非線性點運算

非線性點運算常用的有伽馬變換,又稱為指數(shù)變換或冪變換,是一種常用的灰度非線性變換。伽馬變換所用數(shù)學(xué)表達式為

其中,c為尺度比例常數(shù),γ為伽馬系數(shù),f(x,y)與g(x,y)的取值范圍均為[0,1],esp為補償系數(shù)。

在進行變換時,通常需要先將0~255的灰度動態(tài)范圍變換到0~1的動態(tài)范圍,然后執(zhí)行伽馬變換后再恢復(fù)原動態(tài)范圍。和對數(shù)變換一樣,伽馬變換可以強調(diào)圖像的某個部分。伽馬變換結(jié)果如圖5-5所示,其中圖5-5(a)為原圖,圖(b)和圖(c)為伽馬系數(shù)分別取0.5和1.8時變換后得到的圖像。圖5-5-圖像的伽馬變換

5.3.2圖像的鄰域操作

鄰域操作包括滑動鄰域操作和分離鄰域操作兩種類型。在進行滑動鄰域操作時,輸入圖像將以像素為單位進行處理,即對于輸入圖像的每一個像素,指定的操作將決定輸出圖像相應(yīng)的像素值。分離鄰域操作是基于像素鄰域的數(shù)值進行的,輸入圖像一次處理一個鄰域,即圖像被劃分為矩形鄰域,分離鄰域操作將分別對每一個鄰域進行操作,求取相應(yīng)輸出鄰域的像素值。

1.滑動鄰域操作

滑動鄰域操作一次處理一個像素,輸出圖像的每個像素都是通過對輸入圖像某鄰域內(nèi)的像素值采用某種代數(shù)運算得到的。圖5-6所示為一個5×6矩陣中三個元素的2×3滑動

鄰域,每一個鄰域的中心像素都用一個黑點標(biāo)出。

實現(xiàn)一個滑動鄰域操作需要以下幾個步驟:選擇一個單獨的待處理像素;判斷像素的鄰域;對鄰域中的像素值應(yīng)用一個函數(shù)求值并返回計算結(jié)果;找到輸出圖像與輸入圖像對

應(yīng)位置處的像素,將該像素的數(shù)值設(shè)置為上一步得到的返回值。對輸入圖像的每一個像素重復(fù)上述步驟。圖5-65×6矩陣中三個元素的2×3滑動鄰域

圖5-7所示描述了一個均衡化操作?;瑒余徲虿僮魇紫葘︵徲騼?nèi)的6個像素值求和,然后除以6,將結(jié)果作為鄰域中心像素的取值。注意,鄰域內(nèi)某些像素很可能會丟失,尤其是當(dāng)中心像素位于圖像邊界時。

使用滑動鄰域操作可以實現(xiàn)許多濾波操作(如線性濾波的卷積操作),這些操作在本質(zhì)上都是非線性操作。圖5-7滑動鄰域操作前、后圖像顯示效果比較

2.分離鄰域操作

分離鄰域是將矩陣劃分為m×n后得到的矩形部分。分離鄰域從左上角開始覆蓋整個矩陣,鄰域之間沒有重疊部分。如果分割的鄰域不能很好地適應(yīng)圖像的大小,那么需要為

圖像進行零填充。圖5-8所示為一個被劃分為九個2×4鄰域的5×10矩陣,零填充過程將數(shù)值0添加到圖像矩陣所需的底部和右邊,此時圖像矩陣大小變?yōu)?×12。圖5-8劃分為9個2×4鄰域的5×10矩陣

5.4幾何變換

5.4.1幾何運算與坐標(biāo)系統(tǒng)空間變換的一般定義為其中,f表示輸入圖像;g表示輸出圖像;坐標(biāo)(x',y')指的是空間變換后的坐標(biāo),要注意這時的坐標(biāo)已經(jīng)不是原來的坐標(biāo)(x,y)了;a(x,y)和b(x,y)分別是圖像的x和y坐標(biāo)的空間變換函數(shù)。

顯然,要了解空間變換,首先就要對圖像的坐標(biāo)系統(tǒng)有一個清楚的了解。圖像處理過程中一般采用像素坐標(biāo)系統(tǒng)和空間坐標(biāo)系統(tǒng)兩種坐標(biāo)系統(tǒng)。描述位置最方便的方法就是采

用像素坐標(biāo)。在這種坐標(biāo)系統(tǒng)下,圖像被視為如圖5-9(a)所示的離散元素網(wǎng)格,網(wǎng)格按照從上到下、從左到右的順序排列。在很多情況下,空間坐標(biāo)系統(tǒng)是非常有用的,此時坐標(biāo)(3.3,1.2)是有意義的,該位置與坐標(biāo)(3,1)是有區(qū)別的。圖5-9(b)說明了這種空間坐標(biāo)系統(tǒng)的定位方法。圖5-9像素坐標(biāo)系統(tǒng)和空間坐標(biāo)系統(tǒng)

實現(xiàn)幾何運算有兩種方法:

一為前向映射法,即將輸入像素的灰度一個個地轉(zhuǎn)移到輸出圖像中,如果一個輸入像素被映射到四個輸出像素之間的位置,則其灰度值就按插值法在四個輸出像素之間進行分配;

二為后向映射法(像素填充法),即將輸出像素逐個地映射

回輸入圖像中,若輸出像素被映射到四個輸入像素之間的位置,則其灰度由它們的插值來確定。

5.4.2灰度插值

灰度插值是用來估計像素在圖像像素間某一位置處取值的過程。

灰度插值的方法有很多種,但是插值操作都是相同的。無論使用何種插值方法,首先都需要找到與輸出圖像像素相對應(yīng)的輸入圖像點,然后通過計算該點附近某一像素集合的加權(quán)平均值來確定輸出像素的灰度值。像素的權(quán)重是根據(jù)像素到點的距離而定的,不同插值方法的區(qū)別就在于所考慮的像素集合不同。

最近鄰插值是一種最簡單的插值方法,但是這種方法有時不夠精確。復(fù)雜一點的方法是雙線性插值,該方法利用的是(x,y)點的四個最近鄰像素的灰度值,如圖5-10所示,先利用(0,0)和(1,0)處的值f(0,0)和f(1,0)線性插值出(x,0)處的值f(x,0),利用(0,1)和(1,1)處的值f(0,1)和f(1,1)線性插值出(x,1)處的值f(x,1),然后利用(x,0)和(x,1)處的值f(x,0)和f(x,1)線性插值出(x,y)處的值f(x,y)。圖5-10雙線性插值示意圖

5.4.3空間變換

空間變換用于將輸入圖像的像素位置映射到輸出圖像的新位置處。常用的圖像幾何操作(如調(diào)整圖像大小、旋轉(zhuǎn)或剪切)都是空間變換的例子。空間變換既包括可用數(shù)學(xué)函數(shù)表達的簡單變換(如平移、拉伸等仿射變換),也包括依賴于實際圖像而不易用函數(shù)形式描述的復(fù)雜變換。

空間變換又叫仿射變換,其思想是通過仿射變換矩陣,把旋轉(zhuǎn)后的圖像坐標(biāo)仿射回原圖像點,并通過一定的方法計算出該點在原圖像上的灰度值,作為旋轉(zhuǎn)后的圖像上該點的

灰度值。仿射變換可以用以下函數(shù)來描述:

其中,A是變形矩陣,b是平移矢量。

在二維空間中,可以按照以下四種方式對圖像應(yīng)用仿

射變換:

對一幅圖像分別進行以上四種仿射變換,產(chǎn)生的效果如圖5-11所示。圖5-11各種仿射變換的效果

最終的變形矩陣可以表示為

5.5-直方圖均衡化

直方圖均衡化又稱為灰度均衡化,是指通過某種灰度映射使輸入圖像轉(zhuǎn)換為在每一灰度級上都有近似相同的像素點數(shù)的輸出圖像(即輸出的直方圖是均勻的)。在經(jīng)過均衡化處理后的圖像中,像素將占有盡可能多的灰度級并且分布均勻。

由上面的分析可得直方圖均衡化計算過程如下:

(1)列出原始圖像和變換后圖像的灰度級i,j=0,1,…,L-1,其中L是灰度級數(shù);

(2)統(tǒng)計原圖像各灰度級的像素個數(shù)ni;

(3)計算原始圖像直方圖P(i)=ni/n,n為原始圖像像素總個數(shù);

(4)計算累積直方圖

(5)利用灰度變換函數(shù)計算變換后的灰度值,并四舍五入取整,j=INT[(L-1)Pj+0.5-];

(6)確定灰度變換關(guān)系f(m,n)=i,據(jù)此將原圖像的灰度值修正為g(m,n)=j;

(7)統(tǒng)計變換后各灰度級的像素個數(shù)nj;

(8)計算變換后圖像的直方圖P(j)=nj/n。

例如,設(shè)有一幅大小為64×64、包含灰度值0~7共8個灰度級的數(shù)字圖像,其各灰度級的像素個數(shù)見表5-1,要求對其直方圖均衡化,求出灰度變換關(guān)系和變換后的直方圖。

解首先計算原圖像的灰度直方圖:

式中,L=8,n=64×64。然后計算累積直方圖:

最后求取變換關(guān)系和變換后的灰度值。

圖5-12所示是直方圖均衡化的實驗效果。從圖5-12中可以看出,當(dāng)原始圖像的直方圖不同而圖像的結(jié)構(gòu)性內(nèi)容相同時,直方圖均衡化得到的結(jié)構(gòu)在視覺上幾乎是完全一致的。圖5-12圖像直方圖均衡化的結(jié)果圖5-12圖像直方圖均衡化的結(jié)果

5.6圖像濾波

濾波是在圖像空間借助模板進行鄰域操作來實現(xiàn)的。在空域內(nèi),濾波器的實現(xiàn)過程如圖5-13所示。圖5-13用3×3模板進行空間濾波的示意圖

圖5-13(a)給出一幅圖像的一部分,其中標(biāo)注的是像素的灰度值。假設(shè)有一個3×3的模板如圖5-13(b)所示,模板內(nèi)所標(biāo)為模板系數(shù)。如果將k0所在的位置與圖中灰度值為s0的像素重合,即將模板中心放在圖中(x,y)位置,則模板的輸出響應(yīng)R為

將R賦給增強圖,作為在(x,y)位置的灰度值,如圖5-13(c)所示。

注意:在卷積操作開始之前,要先增加邊緣像素,比如3×3濾波時,要在圖像四周各填充一個像素的邊緣,這樣就確保圖像的邊緣能被處理,在卷積處理之后再去掉這些邊緣。常用的方法有:

(1)對稱法,就是以最邊緣像素為軸對稱復(fù)制(通常為默認(rèn)方法)。

(2)常量法,就是以一個常量像素值(由參數(shù)給定)填充擴充的邊界值,這種方式在仿射變換、透視變換中非常常見。

(3)復(fù)制法,就是復(fù)制最邊緣像素。

為了對比不同濾波方法的效果,下面選取圖5-14所示的大小為256×256的含有椒鹽噪聲的圖片作為對象進行實驗。圖5-14均值濾波效果圖

5.6.1均值濾波

均值濾波顧名思義是用平均值進行濾波。

鄰域平均是圖像平滑和濾波的一種直接的空域方法。對于給定的圖像f(x,y)中的每個像點(x,y),取其鄰域S。設(shè)S含有M個像素,取其平均值作為處理后所得圖像(x,y)處的灰度。用像素鄰域內(nèi)各像素灰度平均值來代替該像素原來的灰度,即為鄰域平均。經(jīng)圖像平滑后,像素對應(yīng)的輸出為

圖5-14所示是采用九點均值模板對圖像進行濾波的結(jié)果,圖5-14(a)是原圖,圖(b)是處理后的圖像。

1.加權(quán)均值濾波

加權(quán)均值濾波就是在均值濾波的基礎(chǔ)上改變均值濾波模板的值。以3×3大小為模板,對均值模板的權(quán)值進行改變,對靠近中心點的像素修改權(quán)值,越靠近中心點其對最終圖像

的像素影響越大。如下列H1為均值濾波模板,H2為加權(quán)均值濾波模板。選用H2模板加權(quán)均值濾波的效果如圖5-15所示。

實驗結(jié)果表明,相比均值濾波,加權(quán)均值濾波的直觀感受

是比均值濾波更加清晰,因為權(quán)值的改變,使得圖像的邊緣比平均更加明顯。

從以上模板形式可得出,平滑模板的特點是:模板內(nèi)系數(shù)全為正表示求和,所乘的小于1的系數(shù)表示取平均;模板系數(shù)之和為1表示對常數(shù)圖像(f(m,n)=常數(shù))處理前后不變,而對一般圖像而言,處理前后平均亮度基本保持不變。圖5-15-加權(quán)均值濾波效果圖

2.閾值均值濾波

帶有閾值的均值濾波如式(5.26)所示,當(dāng)像素點大小與其鄰域平均像素差高于一個閾值時,才能用模板對其濾波,否則保持不變。這樣可以有效去除噪聲點的干擾。

5.6.2中值濾波

對受到噪聲污染的退化進行還原時,采用線性濾波方法來處理比較有效。但是多數(shù)線性濾波器具有低通特性,在去除噪聲的同時也使圖像的邊緣模糊,所以有些情況下需要采用非線性濾波器。中值濾波是一種非線性信號處理方法,與其對應(yīng)的中值濾波器當(dāng)然也就是一種非線性濾波器。中值濾波器在一定條件下,可以克服線性濾波器由均值濾波等帶來的圖像細節(jié)的模糊,而且對濾除脈沖干擾及圖像掃描噪聲最為有效。在實際運算過程中并不需要圖像的統(tǒng)計特性,這也帶來不少方便。

中值濾波的工作原理如下:

(1)將模板在圖像中漫游,并將模板中心與圖中某個像素位置重合;

(2)讀取模板下各對應(yīng)像素的灰度值;

(3)將這些灰度值從小到大排列;

(4)找出這些值里排在中間的值;

(5)將這個中間值賦給對應(yīng)模板中心位置的像素。

對圖中帶有高斯噪聲的圖像進行中值濾波,結(jié)果如圖5-16所示。從圖中的濾波效果可以看出,中值濾波不僅消除了噪聲,而且保持了圖像的細節(jié)。對于椒鹽噪聲,中值濾波的濾波

效果最好。圖5-16中值濾波效果圖

5.6.3高斯濾波

高斯濾波器是一類根據(jù)高斯函數(shù)的形狀來選擇權(quán)值的線性平滑濾波器,其對于抑制服從正態(tài)分布的噪聲非常有效。對于圖像來說,常用二維離散高斯函數(shù)作為平滑濾波器。二

維高斯函數(shù)為

二維高斯函數(shù)具有旋轉(zhuǎn)對稱性,即濾波器在各個方向上的平滑程度是相同的。一般來說,一幅圖像的邊緣方向是事先不知道的。

高斯函數(shù)是單值函數(shù)。這表明,高斯濾波器用像素鄰域的加權(quán)均值來代替該點的像素值,而每一鄰域像素點權(quán)值是隨該點與中心點的距離單調(diào)遞減的。這一性質(zhì)非常重要,因

為邊緣是一種圖像局部特征,如果平滑運算對離算子中心很遠的像素點仍然有很大作用,則平滑運算會使圖像失真。

高斯函數(shù)的傅里葉變換頻譜是單瓣的,這一性質(zhì)是高斯函數(shù)傅里葉變換等于高斯函數(shù)本身這一事實的直接推論。圖像常被不希望的高頻信號所污染(噪聲和細紋理),而所希望的圖像特征(如邊緣)既含有低頻分量,又含有高頻分量。高斯函數(shù)傅里葉變換頻譜的單瓣意味著平滑圖像不會被不需要的高頻信號所污染,同時保留了大部分所需信號。

高斯濾波器寬度(決定著平滑系數(shù))由參數(shù)σ表征,而且其和平滑程度的關(guān)系非常簡單。σ越大,高斯濾波器的頻帶就越寬,平滑程度就越好。通過調(diào)節(jié)平滑程度參數(shù),可在圖像特征過分模糊(過平滑)與平滑圖像中由于噪聲和細紋所引起的過多的不希望突變量(欠平滑)之間取得折中。

對圖5-17(a)中帶有高斯噪聲的圖像進行高斯濾波,結(jié)果如圖5-17(b)所示,可以看出圖中的噪聲得到了抑制,同時原圖像的信息也基本得到了保留。圖5-17高斯濾波效果圖

5.7圖像銳化

5.7.1Robert算子圖像的邊緣總是以圖像中強度的突變形式出現(xiàn)的,所以景物邊緣包含著大量的信息。圖像的邊緣具有十分復(fù)雜的形態(tài),最常用的邊緣檢測方法是梯度檢測法,這里Robert算子圖像銳化的原理和邊緣檢測原理相同。

設(shè)f(x,y)是圖像灰度分布函數(shù),s(x,y)是圖像邊緣的梯度值,φ(x,y)是梯度的方向,則有

式(5.28)與式(5.29)可以得到圖像在(x,y)點處的梯度大小和梯度方向。而

g(x,y)稱為Robert邊緣檢測算子。事實上Robert邊緣檢測算子是一種利用局部差分方法尋找邊緣的算子,Robert梯度算子所采用的是對角方向相鄰兩像素值之差,所以用差分代替一階偏導(dǎo),算子形式可表示如下:

Robert算子的模板分為水平方向和垂直方向,如式(5.33)和(5.34)所示。實際應(yīng)用中,圖像中的每個像素點都用這兩個模板進行卷積運算。為避免出現(xiàn)負值,在邊緣檢測時常提取其絕對值。利用Robert算子模板進行圖像銳化,實驗結(jié)果如圖5-18所示。圖5-18Robert算子銳化效果圖

5.7.2Sobel算子

Sobel算子也是常用的圖像銳化算子之一。Sobel邊緣算子所采用的算法是先進行加權(quán)平均,然后進行微分運算。我們可以用差分代替一階偏導(dǎo),該算子的計算方法如下:

Sobel算子垂直方向和水平方向的模板如式(5.37)與式(5.38)所示,前者可以檢測出圖像中水平方向的邊緣,后者則可以檢測圖像中垂直方向的邊緣。實際應(yīng)用中,圖像中每一個像素點都用這兩個卷積核進行卷積運算,取其最大值作為輸出。運算結(jié)果是一幅體現(xiàn)邊緣幅度的圖像。

利用Sobel算子進行銳化的實驗效果如圖5-19所示。圖5-19Sobel算子銳化效果圖

5.7.3Laplace算子

Laplace算子是一種各向同性算子,屬于二階微分算子,在只關(guān)心邊緣的位置而不考慮其周圍的像素灰度差值時比較合適。Laplace算子對孤立像素的響應(yīng)要比對邊緣或線的響應(yīng)更強烈,因此只適用于無噪聲圖像。存在噪聲的情況下,使用Laplace算子檢測邊緣之前需要先進行低通濾波。所以,通常的分割算法都是把Laplace算子和平滑算子結(jié)合起來生成一個新的模板。Laplace算子也是最簡單的各向同性微分算子,具有旋轉(zhuǎn)不變性。

一個二維圖像函數(shù)的Laplace變換是各向同性的二階導(dǎo)數(shù),其定義為

用差分代替二階偏導(dǎo)時,與前述一階導(dǎo)數(shù)算子不同,Laplace算子的四鄰域與八鄰域離散形式分別為

Sobel算子相比,對圖像進行處理時,Laplace算子能使噪聲成分得到加強,對噪聲更敏感。

利用式(5.42)與式(5.43)所表示的模板進行圖像銳化,實驗結(jié)果如圖5-20所示。圖5-20Laplace算子銳化效果圖

5.8圖像二值化

圖像二值化,其目的是將目標(biāo)和背景分離,為后續(xù)的目標(biāo)定位、識別等任務(wù)做準(zhǔn)備?;叶葓D像的二值化處理最常用的方法是閾值法,它利用圖像中目標(biāo)與背景的差異,選取合適的閾值,將圖像分成兩個不同的像素值級別,以確定某像素是目標(biāo)還是背景部分,從而獲得二值化的圖像。

對于閾值法二值化,假設(shè)閾值設(shè)置為T,以T為邊界,把圖像分為兩個部分,則二值化的公式如下:

式中,f(x,y)表示在圖片(x,y)處的灰度值;g(x,y)表示二值化后的值,只能取0或者255。

在閾值法二值化中,最主要的是選取合適的閾值,這也是二值化的難點。

5.8.1雙峰法

1996年,Prewitt提出了直方圖雙峰法,即如果給定的圖像的灰度分布是比較有規(guī)律的,目標(biāo)和背景在圖像的直方圖上各自形成一個波峰,它們之間存在波谷。那么,閾值T可以在波谷處取值,如圖5-21所示。圖5-21雙峰直方圖

實現(xiàn)的表達式如下:

式中,Zt為圖5-21中的波谷,作為圖像二值化的閾值;f(x,y)表示原始圖像的灰度值

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負責(zé)。
  • 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時也不承擔(dān)用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

評論

0/150

提交評論