chp03 二值圖像分析說課講解_第1頁
chp03 二值圖像分析說課講解_第2頁
chp03 二值圖像分析說課講解_第3頁
chp03 二值圖像分析說課講解_第4頁
chp03 二值圖像分析說課講解_第5頁
已閱讀5頁,還剩30頁未讀, 繼續(xù)免費閱讀

下載本文檔

版權說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權,請進行舉報或認領

文檔簡介

1、Good is good, but better carries it.精益求精,善益求善。chp03 二值圖像分析-第三章二值圖像分析一幅數(shù)字圖像是一個二維陣列,陣列元素值稱為灰度值或強度值實際上,圖像在量化成數(shù)字圖像前是一個連續(xù)強度函數(shù)的集合,場景信息就包含在這些強度值中圖像強度通常被量化成256個不同灰度級,對某些應用來說,也常有32、64、128或512個灰度級的情況,在醫(yī)療領域里甚至使用高達4096(12bits)個灰度級很明顯,灰度級越高,圖像質(zhì)量越好,但所需的內(nèi)存也越大在機器視覺研究的早期,由于內(nèi)存和計算能力非常有限,而且十分昂貴,因此視覺研究人員把精力主要集中在研究輸入圖像僅包

2、含兩個灰度值的二值視覺系統(tǒng)上人們注意到,人類視覺在理解僅由兩個灰度級組成的線條、輪廓影像或其它圖像時沒有任何困難,而且應用場合很多,這一點對研究二值視覺系統(tǒng)的研究人員是一個極大的鼓舞隨著計算機計算能力的不斷增強和計算成本的不斷下降,人們普遍開始研究基于灰度圖像、彩色圖像和深度圖像的視覺系統(tǒng)盡管如此,二值視覺系統(tǒng)還是十分有用的,其原因如下:=1*GB2計算二值圖像特性的算法非常簡單,容易理解和實現(xiàn),并且計算速度很快=2*GB2二值視覺所需的內(nèi)存小,對計算設備要求低工作在256個灰度級的視覺系統(tǒng)所需內(nèi)存是工作在相同大小二值圖像視覺系統(tǒng)所需內(nèi)存的八倍如若利用游程長度編碼等技術(見34節(jié))還可使所需內(nèi)

3、存進一步減少由于二值圖像中的許多運算是邏輯運算而不是算術運算,所以所需的處理時間很短(3)許多二值視覺系統(tǒng)技術也可以用于灰度圖像視覺系統(tǒng)上在灰度或彩色圖像中,表示一個目標或物體的一種簡易方法就是使用物體模板(mask),物體模板就是一幅二值圖像,其中1表示目標上的點,0表示其它點在物體從背景中分離出來后,為了進行決策,還需要求取物體的幾何和拓撲特性,這些特性可以從它的二值圖像計算出來因此,盡管我們是在二值圖像上討論這些方法,但它們的應用并不限于二值圖像一般來說,當物體輪廓足以用來識別物體且周圍環(huán)境可以適當?shù)乜刂茣r,二值視覺系統(tǒng)是非常有用的當使用特殊的照明技術和背景并且場景中只有少數(shù)物體時,物體

4、可以很容易地從背景中分離出來,并可得到較好的輪廓,比如,許多工業(yè)場合都屬于這種情況二值視覺系統(tǒng)的輸入一般是灰度圖像,通常使用閾值法首先將圖像變成二值圖像,以便把物體從背景中分離出來,其中的閾值取決于照明條件和物體的反射特性二值圖像可用來計算特定任務中物體的幾何和拓撲特性,在許多應用中,這種特性對識別物體來說是足夠的二值視覺系統(tǒng)已經(jīng)在光學字符識別、染色體分析和工業(yè)零件的識別中得到了廣泛應用在下面的討論中,假定二值圖像大小為,其中物體像素值為1,背景像素值為031閾值視覺系統(tǒng)中的一個重要問題是從圖像中識別代表物體的區(qū)域(或子圖像),這種對人來說是件非常容易的事,對計算機來說卻是令人吃驚的困難為了將

5、物體區(qū)域同圖像其它區(qū)域分離出來,需要首先對圖像進行分割把圖像劃分成區(qū)域的過程稱為分割,即把圖像劃分成區(qū)域,使得每一個區(qū)域?qū)粋€候選的物體下面給出分割的嚴格定義定義分割是把像素聚合成區(qū)域的過程,使得:整幅圖像(是一個完備分割),(是一個完備分割)每個區(qū)域滿足一個謂詞,即區(qū)域內(nèi)的所有點有某種共同的性質(zhì)不同區(qū)域的圖像,不滿足這一謂詞正如上面所表明的,分割滿足一個謂詞,這一謂詞可能是簡單的,如分割灰度圖像時用的均勻灰度分布、相同紋理等謂詞,但在大多數(shù)應用場合,謂詞十分復雜在圖像理解過程中,分割是一個非常重要的步驟二值圖像可以通過適當?shù)胤指罨叶葓D像得到如果物體的灰度值落在某一區(qū)間內(nèi),并且背景的灰度值在

6、這一區(qū)間之外,則可以通過閾值運算得到物體的二值圖像,即把區(qū)間內(nèi)的點置成1,區(qū)間外的點置成0對于二值視覺,分割和閾值化是同義的閾值化可以通過軟件來實現(xiàn),也可以通過硬件直接完成通過閾值運算是否可以有效地進行圖像分割,取決于物體和背景之間是否有足夠的對比度設一幅灰度圖像中物體的灰度分布在區(qū)間內(nèi),經(jīng)過閾值運算后的圖像為二值圖像,即:(31)如果物體灰度值分布在幾個不相鄰區(qū)間內(nèi)時,閾值化方案可表示為:(32)其中Z是組成物體各部分灰度值的集合圖31是對一幅灰度圖像使用不同閾值得到的二值圖像輸出結(jié)果閾值算法與應用領域密切相關事實上,某一閾值運算常常是為某一應用專門設計的,在其它應用領域可能無法工作閾值選擇

7、常常是基于在某一應用領域獲取的先驗知識,因此在某些場合下,前幾輪運算通常采用交互式方式來分析圖像,以便確定合適的閾值但是,在機器視覺系統(tǒng)中,由于視覺系統(tǒng)的自主性能(autonomy)要求,必須進行自動閾值選擇現(xiàn)在已經(jīng)研究出許多利用圖像灰度分布和有關的物體知識來自動選擇適當閾值的技術其中的一些方法將在32節(jié)介紹圖31一幅灰度圖像和使用不同閾值得到的二值圖像結(jié)果上左:原始灰度圖像,上右:閾值T=100;左下:T=128右下:T1=100|T2=12832幾何特性通過閾值化方法從圖像中檢測出物體后,下一步就要對物體進行識別和定位在大多數(shù)工業(yè)應用中,攝像機的位置和環(huán)境是已知的,因此通過簡單的幾何知識就

8、可以從物體的二維圖像確定出物體的三維位置在大多數(shù)應用中,物體的數(shù)量不是很多,如果物體的尺寸和形狀完全不同,則可以利用尺度和形狀特征來識別這些物體實際上在許多工業(yè)應用中,經(jīng)常使用區(qū)域的一些簡單特征,如大小、位置和方向,來確定物體的位置并識別它們321尺寸和位置一幅二值圖像區(qū)域的面積(或零階矩)由下式給出:(33)在許多應用中,物體的位置起著十分重要的作用工業(yè)應用中,物體通常出現(xiàn)在已知表面(如工作臺面)上,而且攝像機相對臺面的位置也是已知的在這種情況下,圖像中的物體位置決定了它的空間位置確定物體位置的方法有許多,比如用物體的外接矩形、物體矩心(區(qū)域中心)等來表示物體的位置區(qū)域中心是通過對圖像進行“

9、全局”運算得到的一個點,因此它對圖像中的噪聲相對來說是不敏感的對于二值圖像,物體的中心位置與物體的質(zhì)心相同,因此可以使用下式求物體的中心位置:(34)其中和是區(qū)域相對于左上角圖像的中心坐標物體的位置為:(35)這些是一階矩注意,由于約定y軸向上,因此方程34和35的第二個式子的等號右邊加了負號322方向計算物體的方向比計算它的位置稍微復雜一點某些形狀(如圓)的方向不是唯一的,為了定義唯一的方向,一般假定物體是長形的,其長軸方向被定義為物體的方向通常,二維平面上與最小慣量軸同方向的最小二階矩軸被定為長軸圖像中物體的二階矩軸是這樣一條線,物體上的全部點到該線的距離平方和最小給出一幅二值圖像,計算物

10、體點到直線的最小二乘方擬合,使所有物體點到直線的距離平方和最?。?36)其中是物體點到直線的距離為了避免直線處于近似垂直時所出現(xiàn)的數(shù)值病態(tài)問題,人們一般把直線表示成極坐標形式:(37)如圖32所示,是直線的法線與x軸的夾角,是直線到原點的距離把點坐標代入直線的極坐標方程得出距離:(38)圖32直線的極坐標表示將方程38代入方程36并求極小化問題,可以確定參數(shù)和:(39)令對的導數(shù)等于零求解得:(310)它說明回歸直線通過物體中心用這一值代入上面的,則極小化問題變?yōu)椋?311)其中的參數(shù):(312)是二階矩表達式可重寫為:(313)對微分,并置微分結(jié)果為零,求解值:(314)因此,慣性軸的方向由

11、下式給出:(315)所以由的最小值可以確定方向軸注意,如果,那么物體就不會只有唯一的方向軸物體的伸長率是的最大值與最小值之比:(316)323密集度和體態(tài)比區(qū)域的密集度(compact)可用下面的式子來度量:(317)其中,和A分別為圖形的周長和面積根據(jù)這一衡量標準,圓是最密集的圖形,其密集密度為最大值,其它一些圖形的比值要小一些讓我們來看一下圓,當圓后仰時,形狀成了一橢圓,面積減小了而周長卻不象面積減小的那么快,因此密集度降低了在后仰到極限角時,橢圓被壓縮成了一條無限長直線,橢圓的周長為無窮大,故密集度變成了零對于數(shù)字圖像,是指物體尺寸(像素點數(shù)量)除以邊界長度的平方這是一種很好的散布性或密

12、集性度量方法這一比值在許多應用中被用作為區(qū)域的一個特征密集度的另一層意義是:在給定周長的條件下,密集度越高,圍成的面積就越大注意在等周長的情況下,正方形密集度大于長方形密集度體態(tài)比定義為區(qū)域的最小外接矩形的長與寬之比,正方形和圓的體態(tài)比等于1,細長形物體的體態(tài)比大于1圖3.3所示的是幾種形狀的外接矩形圖3.3幾種外接矩形示意圖33投影給定一條直線,用垂直該直線的一簇等間距直線將一幅二值圖像分割成若干條,每一條內(nèi)像素值為1的像素個數(shù)為該條二值圖像在給定直線上的投影(projection)當給定直線為水平或垂直直線時,計算二值圖像每一列或每一行上像素值為1的像素數(shù)量,就得到了二值圖像的水平和垂直投

13、影,如圖34所示由于投影包含了圖像的許多信息,所以投影是二值圖像的一種簡潔表示方式顯然,投影不是唯一的,同樣的投影可能對應不同的圖像圖34一幅二值圖像及其水平投影圖在某些應用中,投影可以作為物體識別的一個特征投影既是一種簡潔的圖像表示,又可以實現(xiàn)快速算法下面介紹對角線投影的求解方法對角線投影的關鍵是計算當前行和列對應的投影分布圖位置標號設行和列的標號分別用和表示若圖像矩陣為行列,則和的范圍分別為0到和0到假設對角線的標號用行和列的仿射變換(線性組合加上常數(shù))計算,即:(318)對角線投影共對應個條,其中仿射變換把右上角像素映射成對角線投影的第一個位置,把左下角像素映射成最后一個位置,如圖3.5

14、所示,則當前行列對應的標號d的公式為:(319)圖35二值圖像及其對角線上的投影圖34游程長度編碼游程長度編碼(run-lengthencoding)是另一種二值圖像的簡潔表示方法,它是用圖像像素值連續(xù)為1的個數(shù)(像素1的長度)來描述圖像這種編碼已被用于圖像傳輸另外,圖像的某些性質(zhì),如物體區(qū)域面積,也可以從游程長度編碼直接計算出來在游程長度編碼中經(jīng)常運用兩種方法,一種是使用1的起始位置和1的游程長度,另一種是僅僅使用游程長度,但須從1的游程長度開始描述,如圖3.6所示0110011100001111110100011111101111111111111110000010000011111的游程

15、(2,2)(6,3)(13,6)(20,1)(4,6)(11,10)(1,5)(11,1)(17,4)1和0的游程長度:0,2,2,3,4,6,1,10,3,6,1,105,5,1,5,4圖36一幅簡單二值圖像的游程長度編碼如果用第二種方法來表示圖像每行的游程長度,并用代表圖像第行的第個游程長度,則全部1的游程長度之和就是所求物體的面積(320)其中是第行游程個數(shù),取整,表示1的游程個數(shù)由游程長度編碼能很容易地計算水平投影而無需變成原來的圖像使用更巧妙的方法也能從游程長度編碼計算出垂直和對角線投影35二值圖像算法從背景中分離出物體是一個困難的問題,在此將不討論這個問題這里假設物體可以從背景中分

16、離,并且使用某一謂詞,可以對圖像中屬于物體的點進行標記因此,問題就變?yōu)槿绾螌⒁环鶊D像中所有被標記的點組合成物體圖像這里還假設物體點在空間上是非常接近的利用空間接近概念可以嚴格定義,利用此定義研究的算法可以把空間上非常接近的點聚合在一起,構成圖像的一個成分(component)下面首先引進一些定義,然后討論有關算法351定義(1)近鄰在數(shù)字圖像中,一個像素在空間上可能非常接近其它一些像素在用方格表示的數(shù)字圖像中,一個像素與其它四個像素有公共邊界,并與另外四個像素共享頂角如果兩個像素有公共邊界,則把它們稱為4近鄰(4-neighbors)同樣,如果兩個像素至少共享一個頂角,則稱它們?yōu)?近鄰例如,位

17、于的像素有四個4近鄰:,它的8近鄰包括這四個4近鄰,再加上,一個像素被認為與它的4近鄰是4連通(4connected)關系,與它的8近鄰是8連通關系(如圖37)圖37矩形像素網(wǎng)格的4近鄰和8近鄰示意圖像素位于圖的中心(2)路徑從像素到像素的路徑(path)是指一個像素序列,其中像素是像素的近鄰像素,如果近鄰關系是4連通的,則路徑是4路徑;如果是8連通的,則稱為8路徑圖38即為路徑的兩個簡單例子圖384路徑和8路徑示意圖(3)前景圖像中值為1的全部像素的集合稱為前景(foreground),用S表示(4)連通性已知像素,如果存在一條從p到q的路徑,且路徑上的全部像素都包含在S中,則稱p與q是連通

18、的注意,連通性(connectivity)是等價關系對屬于S的任意三個像素p、q和r,有下列性質(zhì):像素p與p本身連通(自反性)如果p與q連通,則q與p連通(互換性)如果p與q連通且q與r連通,則p與r連通(傳遞性)(5)連通成份一個像素集合,如果集合內(nèi)的每一個像素與集合內(nèi)其它像素連通,則稱該集合為一個連通成份(connectedcomponent)(6)背景S(S的補集)中包含圖像邊界點的所有連通成份的集合稱為背景(background)S中所有其它元稱為洞考慮下面的兩個圖像首先看左圖中有幾個洞和幾個物體如果從前景和背景來考慮4連通,有四個大小為個像素的物體和一個洞如果考慮8連通,那么有一個物

19、體而沒有洞直觀地,在這兩種情況下出現(xiàn)了不確定性情況右圖為另一個類似的不確定問題其中如果1是連通的,那么0就應該是不連通的為了避免這種難以處理的情況,對物體和背景應使用不同的連通如果我們對S使用8連通,那么對S就應使用4連通(7)邊界S的邊界(boundary)是S中與S中有4連通關系的像素集合邊界通常記為(8)內(nèi)部內(nèi)部(interior)是中不屬于它的邊界的像素集合的內(nèi)部等于(9)包圍如果從S中任意一點到圖像邊界的4路徑必須與區(qū)域T相交,則區(qū)域T包圍(surrounds)區(qū)域S(或S在T內(nèi))圖39即為一幅簡單二值圖像和它的邊界、內(nèi)部、包圍示意圖圖39一幅二值圖像與它的邊界,內(nèi)部和包圍352連通

20、成份標記在一幅圖像中找出連通成份是機器視覺中最常見的運算之一連通區(qū)域內(nèi)的點構成表示物體的候選區(qū)域機器視覺中的大多數(shù)物體都有表面,顯然,物體表面點投影到圖像平面上會形成空間上密集的點集這里應該指出,連通成份算法常常會在二值視覺系統(tǒng)中形成瓶頸效應,原因是連通成份運算是一個全局性的運算,這種算法在本質(zhì)上是序貫的如果圖像中僅有一個物體,那么找連通成份就沒有必要;如果圖像中有許多物體,且需要求出物體的特性與位置,則必須確定連通成份連通標記算法可以找到圖像中的所有連通成份,并對同一連通成份中的所有點分配同一標記圖310表示的是一幅圖像和已標記的連通成份在很多應用中,要求在標記連通成份的同時算出連通成份的特

21、征,如尺寸、位置、方向和外接矩形下面介紹兩種連通成份標記算法:遞歸算法和序貫算法Jain1995圖3.10一副圖像及其連通成分圖像()遞歸算法遞歸算法在串行處理器上的計算效率是很低的,因此,這一算法主要用于并行機上算法31連通成份遞歸算法1掃描圖像,找到?jīng)]有標記的1點,給它分配一個新的標記L3遞歸分配標記L給1點的鄰點3如果不存在沒標記的點,則停止4返回第一步()序貫算法序貫算法通常要求對圖像進行二次處理由于這一算法一次僅運算圖像的兩行,因此當圖像以文件形式存貯且空間不允許把整幅圖像載入內(nèi)存時也能使用這一算法這一算法(見算法32)可以查看某一點的鄰點,并且可以給像素值為1的鄰點分配一個已經(jīng)使用

22、過的標記如果圖像的鄰點有兩種不同的標記,則用一個等價表(equivalenttable)來記錄所有的等價標記在第二次處理過程中,使用這一等價表來給某一連通成份中所有像素點分配唯一的標記本算法在從左到右、從上到下掃描圖像時,算法僅能查詢到某一像素點的4近鄰中的兩個近鄰點,即上點與左點設算法已經(jīng)查到了該像素的這兩個近鄰點,此時出現(xiàn)三種情況:(1)如果這兩個近鄰點中沒有一點為1,則該像素點需要一個新的標記(2)如果這兩個近鄰點中只有一點為1,且分配了標記L,那么該像素點的標記也為L(3)如果這兩個鄰點都為1,且已分配了標記L,則該像素點的標記還是L;但是當近鄰點被分配了不同標記M與N,則這兩個標記被

23、用于了同一組元,應該把它們合并在這種情況下,應把其中的一個標記(一般選用最小的那個標記)分配給該像素點,并在等價表中登記為等價標記等價表包含了給每一連通成份分配唯一標記的信息在第一次掃描中,所有屬于同一連通成份的標記被視為是等價的在第二次掃描中,從一個等價集(equivalentset)中選擇一個標記并分配給連通成份中所有像素點通常將最小的標記分配給一個連通成份第二次掃描將給每一連通成份分配唯一的標記在找到所有的連通成份后,應該統(tǒng)計等價表,以便刪除其中的空格;然后將等價表作為查找表對圖像重新進行掃描,以便重新統(tǒng)計圖像中的標記計算每一連通成份的面積、一階矩、二階矩是序貫連通成份算法的一個部分當然

24、,必須使用分離變量來累加每一區(qū)域的矩信息當區(qū)域合并后,每一區(qū)域的矩累計值也應加到一起算法324連通序貫連通成份算法1從左至右、從上到下掃描圖像2如果像素點為1,則:(a)如果上面點和左面點有一個標記,則復制這一標記(b)如果兩點有相同的標記,復制這一標記(c)如果兩點有不同的標記,則復制上點的標記且將兩個標記輸入等價表中作為等價標記(d)否則給這一個像素點分配一新的標記并將這一標記輸入等價表3如果需考慮更多的點,則回到第二步4在等價表的每一等價集中找到最低的標記5掃描圖像,用等價表中的最低標記取代每一標記353歐拉數(shù)在許多應用中,虧格數(shù)(genus)或歐拉數(shù)可作為識別物體的特征虧格數(shù)定義為連通

25、成份數(shù)減去空洞數(shù),(321)其中,和分別是歐拉數(shù)、連通成份數(shù)與空洞數(shù)這個式子給出了一個簡單的拓樸特征,這種拓撲特征具有平穩(wěn)、旋轉(zhuǎn)和比例不變特性圖311給出了一些例子及其對應的歐拉數(shù)圖311字母“A”、“B”、“”及它們的歐拉數(shù)注意前景用了8連通,而背景用了4連通354區(qū)域邊界連通成份S的邊界是那些屬于S且與S鄰接的點集使用簡單的局部運算就可找到邊界點在大多數(shù)應用中,我們都想用一特定的順序跟蹤邊界點一般的算法是按順時針方向跟蹤區(qū)域的所有點此處討論一個簡單的邊界跟蹤算法假定物體邊界不在圖像的邊界上(即物體完全在圖像內(nèi)部),邊界跟蹤算法先選擇一起始點,然后跟蹤邊界直到回到起始點這種算法概括在算法33

26、中這種算法對尺寸大于1個象素的所有區(qū)域都是有效的用這種算法求區(qū)域8鄰點的邊界如圖312(a)所示為了得到平滑的圖像邊界,可以在檢測和跟蹤圖像邊界后,利用邊界點的方向信息來平滑邊界。顯然,圖像邊界噪聲越大,圖像邊界點變化越劇烈,圖像邊界相鄰點的方向變化數(shù)(與差分鏈碼有一點區(qū)別,鏈碼見第七章)也越大根據(jù)這一特點,設置一個邊界點方向變化數(shù)閾值,把方向變化數(shù)大于這一閾值的圖像邊界點濾除,由此可得到平滑的圖像邊界。圖3.12(b)所示的是一個經(jīng)過平滑過的區(qū)域邊界示意圖,其中的方向變化數(shù)閾值為1。注意,由于采用8鄰點邊界跟蹤,因此方向變化數(shù)的最大值為4。如果閾值設成4,則對原始邊界沒有平滑。邊界跟蹤和平滑

27、常常結(jié)合在一起使用,見計算機作業(yè)3.5。圖312邊界跟蹤算法結(jié)果,(a)圖像邊界跟蹤結(jié)果;(b)邊界跟蹤與平滑結(jié)果算法33邊界跟蹤算法=1*GB3從左到右、從上到下掃描圖像,求區(qū)域S的起始點.=2*GB3用c表示當前邊界上被跟蹤的像素點置,記c左4鄰點為b,=3*GB3按逆時針方向從b開始將c的8個8鄰點分別記為,,=4*GB3從b開始,沿逆時針方向找到第一個,=5*GB3置,=6*GB3重復步驟=3*GB3、=4*GB3、=5*GB3,直到。355距離測量在許多應用中,找到一幅圖像中兩個像素點或兩個連通成份之間的距離是很有必要的目前還沒有定義數(shù)字圖像距離的唯一方法,但對所有的像素點p、q和r

28、,任何距離度量都必須滿足下列性質(zhì):1,當且僅當時,23下面是一些常用的距離函數(shù)歐幾里德距離:(322)街區(qū)距離:(323)棋盤距離:(324)356中軸如果對中像素的所有鄰點有下式成立:(325)則中像素到的距離是局部最大值中所有到的距離是局部最大值的像素點集合稱為對稱軸或中軸,通常記為使用4近鄰的中軸變換的一些例子見圖313圖313b表明少量噪聲會使中軸變換結(jié)果產(chǎn)生顯著的差異由和中每一點到的距離能重構原始像素集是的簡潔表示可用來表示一個區(qū)域的形狀通過去除中與距離較小的像素點,可以生成一個簡化的集中軸可作為物體的一種簡潔表示但是,二值圖像中的區(qū)域也可用其邊界來表示邊界跟蹤算法可用來獲得表示邊界

29、的序列點在第七章還將討論用鏈碼來簡潔地表示邊界的方法對任意物體,邊界將是區(qū)域的簡潔表示但要明確給定像素點是否在某一區(qū)域內(nèi),中軸則是更好的表示,因為使用中軸上的像素點和每一個給定像素點的最大距離圓盤(中軸距離變換),可以很容易地檢測出給定像素是否在中軸定義的區(qū)域中圖313中軸變換舉例357細化細化(thinning)是一種圖像處理運算,可以把二值圖像區(qū)域縮成線條,以逼近區(qū)域的中心線,也稱之為骨架或核線細化的目的是減少圖像成份,直到只留下區(qū)域的最基本信息,以便進一步分析和識別雖然細化可以用在包含任何區(qū)域形狀的二值圖像,但它主要對細長形(而不是凸圓形或水滴狀)區(qū)域有效細化一般用于文本分析預處理階段,

30、以便將文本圖像中線條圖畫或字符筆畫表示成單像素線條細化要求如下:連通圖像區(qū)域必須細化成連通線結(jié)構細化結(jié)果最少應該是8連通(下面將要解釋)保留近似終止線的位置細化結(jié)果應該近似于中軸線由細化引起的附加突刺(短分支)應該是最小的細化結(jié)果應該保證第一條要求中所定義的連通性,這一點是最基本的要求,它保證了連通線結(jié)構的數(shù)量等于原始圖像中連通區(qū)域的數(shù)量第二條要求保證所得到的線條總是含有8連通圖像的最小數(shù)量第三條要求說明終止線位置應該保持不變細化可以通過迭代方式不斷去除邊界點來實現(xiàn),重要的是在迭代過程中不要去除端點像素,因為這樣不僅會縮短細化線,丟掉結(jié)構信息,而且不能保持其位置不變第四條要求說明所得線段應能最

31、好地逼近原始區(qū)域的中線,如兩個像素點寬的豎線或水平線的真正中線應該位于這兩個像素之間半個像素間距的位置在數(shù)字圖像中表示半個像素間距是不可能的,因此得到的結(jié)果是一條位于原直線一側(cè)的直線第五條要求沒有明確指出噪聲的影響控制到最低程度,因為判斷噪聲本身是一件很難的事一般不希望原始區(qū)域含有會引起突刺的隆起,但當某些較大隆起是區(qū)域特征時,卻必須識別它們應該指出,某些細化算法有去除突刺的參數(shù),不過最好將細化和去除噪聲分開進行,這是由于某些情況下不需要的突刺,可能是另一些情況下所需要的短線因此,最好的辦法是先進行細化,然后單獨去除長度低于某一特定最小值的任何突刺一種常用的細化手段是在至少鄰域內(nèi)檢查圖像的每一

32、點,剝?nèi)^(qū)域邊界一次剝?nèi)ヒ粚訄D像,直至區(qū)域被細化成一條線這一過程是用迭代法實現(xiàn)的,如算法4在每次迭代時,每一個像素點用窗函數(shù)檢查,為了保持連通性或線末端位置,將單像素厚的邊界擦除在圖314中將會看到,在每次迭代中,值為1的外層區(qū)域就是用這種方式削掉的當?shù)Y(jié)果沒有變化時,迭代過程結(jié)束,圖像得到細化算法近鄰細化迭代算法對于每一個像素,如果沒有上近鄰(下近鄰左近鄰右近鄰)不是孤立點或終止線去除該像素點不會斷開區(qū)域則去除該像素點重復這一步驟直到?jīng)]有像素點可以去除圖314細化手寫體“華”的迭代過程(a)原圖像,(b)(f)為五次迭代過程,每次迭代削去一層邊界358擴展與收縮圖像中的一個連通成份可以進行

33、全方位的擴展(expanding)或收縮(shrinking)如果某一連通成份可以變化,使得一些背景像素點變成1,這一運算就稱為擴展如果物體像素點全方位地消減或變?yōu)?時,則稱為收縮一種簡單的擴展與收縮實現(xiàn)方法如下:擴展:如果近鄰點是1,則將該點從0變?yōu)?收縮:如果近鄰點是0,則將該點從1變?yōu)?這樣,收縮可以看作是擴展背景這類運算的例子見圖315需要指出,擴展與收縮這樣簡單的運算可以完成非常有用而又貌似很復雜的運算下面引進符號:S擴展倍:S收縮倍其中下列性質(zhì)必須滿足:先擴展后收縮算法能補上不希望存在的洞,如圖3.15(b)(d)所示;先收縮后擴展算法則能去除孤立的噪聲點,見圖315(c)(e)請

34、注意,擴展與收縮可用來確定孤立組元或簇注意,擴展后收縮有效地填滿了空洞卻沒有去除噪聲;相反,收縮后擴展能去除噪聲卻沒有填滿空洞在地形圖像處理和膨脹與腐蝕運算中,擴展與收縮算法的一般形式被廣泛地用于許多任務中圖315對字母“h”收縮與擴展算法實驗結(jié)果(a)原始噪聲圖像;(b)擴展運算;(c)收縮運算;(d)擴展后收縮運算;(e)收縮后擴展運算36形態(tài)算子數(shù)學形態(tài)(morphology)這一名稱是從形狀研究得來的這種方法也說明了一個事實,即在許多機器視覺算法設計中,根據(jù)形狀來思考問題是最自然,也是最容易的形態(tài)方法有助于進行基于形狀或圖形思考形態(tài)方法中圖像信息的基本單元是二值像素任意兩個二值圖像和的

35、交是一個二值圖像,記為,即與中皆為1的圖像點p的集合:(326)和B的并,記為,是一個二值圖像,是或B或兩者中為1的所有圖像點p的集合,用符號表示為:(327)設是全值二值圖像(所有的像素值皆為),是二值圖像的補集是中1與0互相交換后的二值圖像,即:(328)標號為與的兩像素點和,其向量和是標號為的像素點向量差是標號為的像素點若是二值圖像,是二值圖像中的一個像素點,則被平移后的二值圖像由下式表示:(329)即二值圖像被一個像素點平移是指將的原點移到(1)膨脹已知二值圖像,如果是由二值圖像中像素值為1的點平移得到的,則由平移的并稱為被膨脹,即;(330)膨脹具有結(jié)合性、交換性這樣,在進行膨脹的步

36、驟序列中,完成運算的順序就不重要了這就允許我們將一個復雜的形狀拆成幾個簡單的形狀,然后重新組合成為膨脹序列(2)腐蝕腐蝕是膨脹的相反過程二值圖像經(jīng)二值圖像腐蝕后在點仍為1的充分必要條件是:平移到后,中的1像素也是A中的1像素被腐蝕可用下式表示:(331)二值圖像常常是規(guī)則圖像,是作用于圖像中的一種探針,也稱為結(jié)構元腐蝕在許多應用中起著十分重要的作用結(jié)構元對一幅圖像進行腐蝕會生成一幅包含結(jié)構元所有位置的圖像圖316到317是一個倒T形結(jié)構元對一個簡單物體進行膨脹與腐蝕運算的示意圖用結(jié)構元進行膨脹或腐蝕運算也可以描述為:結(jié)構元的原點像素經(jīng)過待膨脹的二值圖像中所有1像素點時,對應結(jié)構元所有像素的待膨脹二值圖像像素置為像素;在腐蝕運算過程中,結(jié)構元的原點像素經(jīng)過待腐蝕的二值圖像中所有1像素點時,如果結(jié)構元中有一個像素沒有對應待腐蝕二值圖像的像素,則對應結(jié)構元原點的待腐蝕二值圖像

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預覽,若沒有圖紙預覽就沒有圖紙。
  • 4. 未經(jīng)權益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負責。
  • 6. 下載文件中如有侵權或不適當內(nèi)容,請與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

評論

0/150

提交評論