圖象分割與邊緣檢測

上傳人：卓*** IP屬地：廣東上傳時間：2023-05-26 格式：PPT 頁數(shù)：95 大?。?.83MB 積分：18 舉報 版權(quán)申訴

已閱讀5頁，還剩90頁未讀，繼續(xù)免費閱讀

版權(quán)說明：本文檔由用戶提供并上傳，收益歸屬內(nèi)容提供方，若內(nèi)容存在侵權(quán)，請進行舉報或認領(lǐng)

文檔簡介

圖象分割與邊緣檢測第一頁，共九十五頁，編輯于2023年，星期五5.1圖像分割5.1.1概述圖像分割是將圖像劃分成若干個互不相交的小區(qū)域的過程，小區(qū)域是某種意義下具有共同屬性的像素的連通集合。如不同目標物體所占的圖像區(qū)域、前景所占的圖像區(qū)域等。連通是指集合中任意兩個點之間都存在著完全屬于該集合的連通路徑。對于離散圖像而言，連通有4連通和8連通之分，如圖5-1所示。第二頁，共九十五頁，編輯于2023年，星期五圖5-14連通和8連通第三頁，共九十五頁，編輯于2023年，星期五4連通指的是從區(qū)域上一點出發(fā)，可通過4個方向，即上、下、左、右移動的組合，在不越出區(qū)域的前提下，到達區(qū)域內(nèi)的任意像素；8連通方法指的是從區(qū)域上一點出發(fā)，可通過左、右、上、下、左上、右上、左下、右下這8個方向的移動組合來到達區(qū)域內(nèi)的任意像素。圖像分割有三種不同的途徑：其一是將各像素劃歸到相應(yīng)物體或區(qū)域的像素聚類方法,即區(qū)域法；其二是通過直接確定區(qū)域間的邊界來實現(xiàn)分割的邊界方法；其三是首先檢測邊緣像素，再將邊緣像素連接起來構(gòu)成邊界形成分割。在圖像分割技術(shù)中，最常用的是利用閾值化處理進行的圖像分割。第四頁，共九十五頁，編輯于2023年，星期五5.1.2灰度閾值法分割常用的圖像分割方法是把圖像灰度分成不同的等級，然后用設(shè)置灰度門限（閾值）的方法確定有意義的區(qū)域或分割物體的邊界。常用的閾值化處理就是圖像的二值化處理，即選擇一閾值，將圖像轉(zhuǎn)換為黑白二值圖像，用于圖像分割及邊緣跟蹤等預(yù)處理。圖像閾值化處理的變換函數(shù)表達式為(5-1)第五頁，共九十五頁，編輯于2023年，星期五圖5-2閾值變換曲線第六頁，共九十五頁，編輯于2023年，星期五在圖像的閾值化處理過程中，選用不同的閾值其處理結(jié)果差異很大。如圖5-3所示,閾值過大，會提取多余的部分；而閾值過小，又會丟失所需的部分（注意：當前背景為黑色，對象為白色時剛好相反）。因此，閾值的選取非常重要。圖5-3(a)原始圖像的直方圖如圖5-4所示。分析該直方圖可知，該直方圖具有雙峰特性，圖像中的目標（細胞）分布在較暗的灰度級上形成一個波峰，圖像中的背景分布在較亮的灰度級上形成另一個波峰。此時，用其雙峰之間的谷低處灰度值作為閾值T進行圖像的閾值化處理，便可將目標和背景分割開來。第七頁，共九十五頁，編輯于2023年，星期五圖5-3不同閾值對閾值化結(jié)果的影響(a)原始圖像；(b)閾值T=91；(c)閾值T=130；(d)閾值T=43(a)(b)(c)(d)第八頁，共九十五頁，編輯于2023年，星期五圖5-4圖5-3(a)所示圖像的直方圖第九頁，共九十五頁，編輯于2023年，星期五

1.判別分析法確定最佳閾值判別分析法確定最佳閾值的準則，是使進行閾值處理后分離的像素類之間的類間方差最大。判別分析法只需計算直方圖的0階矩和1階矩，是圖像閾值化處理中常用的自動確定閾值的方法。設(shè)圖像總像素數(shù)為N，灰度值為i的像素數(shù)為Ni，則至灰度級K的灰度分布的0階矩及1階矩分別定義為0階矩：(5-2)第十頁，共九十五頁，編輯于2023年，星期五1階矩：(5-3)當K=L-1時，ω(L-1)=1；μ(L-1)＝μT，μT稱為圖像的平均灰度。設(shè)有M-1個閾值：0≤k1＜k2＜…＜KM-1≤L-1。將圖像分割成M個灰度值的類Cj（Cj∈［kj-1+1,…,kj］;j=1,2,…,M;k0=0,kM=L），則各類Cj的發(fā)生概率ωj和平均值μj為(5-4)(5-5)式中,ω(0)=0，μ(0)=0。第十一頁，共九十五頁，編輯于2023年，星期五由此可得各類的類間方差為將使上式的σ2值為最大的閾值組(k1,k2，…,kM－1)，作為M值化的最佳閾值組。若取M為2，即分割成2類，則可用上述方法求出二值化的閾值。(5-6)第十二頁，共九十五頁，編輯于2023年，星期五

2.p尾法確定閾值

p尾法僅適用于事先已知目標所占全圖像百分比的場合。若一幅圖像由亮背景和黑目標組成，已知目標占圖像的(100－p)%面積，則使得至少(100－p)%的像素閾值化后匹配為目標的最高灰度，將選作用于二值化處理的閾值。第十三頁，共九十五頁，編輯于2023年，星期五5.1.3區(qū)域生長分割的目的是把一幅圖像劃分成一些區(qū)域，最直接的方法就是把一幅圖像分成滿足某種判據(jù)的區(qū)域，也就是說，把點組成區(qū)域。為了實現(xiàn)分組，首先要確定區(qū)域的數(shù)目，其次要確定一個區(qū)域與其他區(qū)域相區(qū)別的特征，最后還要產(chǎn)生有意義分割的相似性判據(jù)。第十四頁，共九十五頁，編輯于2023年，星期五分割區(qū)域的一種方法叫區(qū)域生長或區(qū)域生成。假定區(qū)域的數(shù)目以及在每個區(qū)域中單個點的位置已知，則從一個已知點開始，加上與已知點相似的鄰近點形成一個區(qū)域。相似性準則可以是灰度級、彩色、組織、梯度或其他特性，相似性的測度可以由所確定的閾值來判定。方法是從滿足檢測準則的點開始，在各個方向上生長區(qū)域，當其鄰近點滿足檢測準則就并入小塊區(qū)域中。當新的點被合并后再用新的區(qū)域重復這一過程，直到?jīng)]有可接受的鄰近點時生成過程終止。第十五頁，共九十五頁，編輯于2023年，星期五圖5-5給出一個簡單的例子。此例的相似性準則是鄰近點的灰度級與物體的平均灰度級的差小于2。圖中被接受的點和起始點均用下劃線標出，其中（a）圖是輸入圖像；（b）圖是第一步接受的鄰近點；（c）圖是第二步接受的鄰近點；（d）圖是從6開始生成的結(jié)果。第十六頁，共九十五頁，編輯于2023年，星期五圖5-5區(qū)域生長示例第十七頁，共九十五頁，編輯于2023年，星期五當生成任意物體時，接收準則可以結(jié)構(gòu)為基礎(chǔ)，而不是以灰度級或?qū)Ρ榷葹榛A(chǔ)。為了把候選的小群點包含在物體中，可以檢測這些小群點，而不是檢測單個點，如果它們的結(jié)構(gòu)與物體的結(jié)構(gòu)足夠相似時就接受它們。第十八頁，共九十五頁，編輯于2023年，星期五5.1.4區(qū)域聚合區(qū)域聚合可直接用于圖像分割，它要求聚合中的各個點必須在平面上相鄰接而且特性相似。區(qū)域聚合的步驟是首先檢查圖像的測度集，以確定在測度空間中聚合的位置和數(shù)目，然后把這些聚合的定義用于圖像，以得到區(qū)域聚合。區(qū)域聚合技術(shù)可以說明如下。首先，在圖片上定義某個等價關(guān)系。例如，最簡單的等價關(guān)系可定義為p(i,j)＝p(k,l)。也就是說，如果p(i,j)＝p(k,l)，就說明p(i,j)與p(k,l)等價。任何在點的格子上的等價關(guān)系又可劃分為等價類。例如，p(i,j)的取值范圍為0到63，就可以產(chǎn)生64個等價類的模板。如果關(guān)系滿足，它的值等于1，否則為0。第十九頁，共九十五頁，編輯于2023年，星期五模板的圖像是兩兩不相交的，那么64個模板就會充滿整個格子。這些等價的類又可進一步分為最大連接的子集（連接分量）。連接性可以用點(i,j)的鄰點來定義，如4連通鄰點、8連通鄰點等等。假如R是屬于格子的子集，在R中存在一個點序列，第一個點是p1，最后一個點是p2，屬于格子的子集R的兩個點p1和p2是被連接起來的，這樣，相繼的各點是4連接相鄰的。通過這樣的連接關(guān)系可以定義一個屬于R的子集，這個子集形成一個區(qū)域，在這個區(qū)域中，任何點都與R有關(guān)。利用等價模板可分成最大的連接區(qū)域，然后，這些最大的連接區(qū)域又可以像搭積木一樣形成有意義的分割。第二十頁，共九十五頁，編輯于2023年，星期五1970年布萊斯和芬尼瑪提出一種分割方法，如圖5-6所示。圖（a）是具有灰度級的3×3的G陣列，圖（b）是對G的分割結(jié)果。其中，圖像格子為G，它是大格子S的子格子。G為n×m的格子，S是（2n＋1）×（2m＋1）的大格子。在大格子中，G(i,j)點位于S的(2i+1,2j+1)點上。G中的點與S中的點相對應(yīng)，其中每一下標都是奇數(shù)，其余的點用來代表區(qū)域的邊界。以這種形式表現(xiàn)的區(qū)域，產(chǎn)生一種尋找最大連接區(qū)域的方法。G中的點與它上邊和右邊的點相比較，灰度級相同就合并，灰度級不同就插入邊界線。把圖像中的每個點都處理過之后，整個圖像就被分割成區(qū)域。在這個例子中，由于采用了4連通等價關(guān)系，因此，由圖可見，在對角線方向上的等灰度級產(chǎn)生了隔開的區(qū)域。第二十一頁，共九十五頁，編輯于2023年，星期五圖5-6布萊斯和芬尼瑪分割方法第二十二頁，共九十五頁，編輯于2023年，星期五5.2邊緣檢測在Marr的視覺計算理論框架中，抽取二維圖像上的邊緣、角點、紋理等基本特征，是整個系統(tǒng)框架中的第一步。這些特征所組成的圖稱為基元圖。Yuille等指出，在不同“尺度”意義下的邊緣點，在一定條件下包含了原圖像的全部信息。圖5-7畫出了一幅圖像中的邊緣點，僅僅根據(jù)這些邊緣點，就能識別出三維物體，可見邊緣點確實包含了圖像中的大量信息。第二十三頁，共九十五頁，編輯于2023年，星期五圖5-7圖像中的邊緣點第二十四頁，共九十五頁，編輯于2023年，星期五（1）空間曲面上的不連續(xù)點。如標為A的邊緣線，這些邊緣線為兩個不同曲面的或平面的交線，該點處物體表面的法線方向不連續(xù)，在A類邊緣線的兩邊，圖像的灰度值有明顯的不同。（2）B類邊緣線。B類邊緣線是由不同材料或相同材料不同顏色產(chǎn)生的。圖中桌面由兩種不同材料組成，由于它們對光的反射系數(shù)不同，使B邊緣線的兩側(cè)灰度有明顯不同。第二十五頁，共九十五頁，編輯于2023年，星期五（3）C類邊緣線。C類邊緣線是物體與背景的分界線。如圖中圓柱上有兩條C類邊緣線，這類邊緣線一般稱為外輪廓線。在C類邊緣點上，三維物體表面的法線方向是連續(xù)的，出現(xiàn)邊緣點是由于從一定視角看物體時，C類邊界點是物體與背景的交界處。由于物體與背景在光照條件與材料反射系數(shù)等方面差異很大，因此在C類邊緣兩側(cè)，圖像的灰度也有很大差異。圖中標以C′的邊緣，即是物體與背景的交界處，也是物體上表面法線的不連續(xù)處，但引起它兩側(cè)灰度躍變的原因是前者。（4）D邊緣。D是陰影引起的邊緣。由于物體表面某一部分被另一物體遮擋，使它得不到光源的照射，從而引起邊緣點兩側(cè)灰度值有較大的差異。第二十六頁，共九十五頁，編輯于2023年，星期五5.2.1邊緣檢測與微分運算如前所述，邊緣點是信號“變化劇烈”的地方，但這么說并不準確，需要定義一個準確的邊緣數(shù)學模型。以一維信號為例，圖5-8（a）是一種階躍信號，我們當然認為A點處為邊緣點。在實際情況中，物理信號不可能有理想的突變，而是如圖5-8（b）所示的逐漸增大的信號，對圖5-8（b）中所示A、B、C三點，一般稱B點為邊緣點。在圖5-8（c）和5-8（d）中，如果臺階比較窄，即可以認為B點為邊緣點，也可以認為該信號有兩個邊緣點A與C。第二十七頁，共九十五頁，編輯于2023年，星期五圖5-8不同的邊緣信號第二十八頁，共九十五頁，編輯于2023年，星期五圖5-9圖像中不同類型的邊界（a）邊界；（b）線；（c）折線變化；（d）緩慢的平滑變化(a)(b)(d)(c)第二十九頁，共九十五頁，編輯于2023年，星期五圖5-10用Prewitt算子進行邊緣檢測的結(jié)果圖5-10第三十頁，共九十五頁，編輯于2023年，星期五5.2.2高斯-拉普拉斯(LOG)算子噪聲點對邊緣檢測有較大的影響，效果更好的邊緣檢測器是高斯-拉普拉斯(LOG)算子。它把高斯平滑濾波器和拉普拉斯銳化濾波器結(jié)合起來，先平滑掉噪聲，再進行邊緣檢測，所以效果更好。常用的LOG算子是5×5的模板：第三十一頁，共九十五頁，編輯于2023年，星期五圖5-11LOG算子中心點的距離與位置加權(quán)系數(shù)的關(guān)系第三十二頁，共九十五頁，編輯于2023年，星期五若將圖5-11繞y軸作旋轉(zhuǎn)一周后，LOG算子很像一頂墨西哥草帽，所以，LOG又叫墨西哥草帽濾波器。在圖像邊緣檢測中，還有Wallis算子、過零點檢測（Marr-Hildreth算子）、Canny邊緣檢測方法、SUSAN（SmallestUnivalueSegmentAssimilatingNucleus）邊緣檢測等。第三十三頁，共九十五頁，編輯于2023年，星期五5.3輪廓跟蹤與提取5.3.1輪廓跟蹤在識別圖像中的目標時，往往需要對目標邊緣作跟蹤處理，也叫輪廓跟蹤。顧名思義，輪廓跟蹤就是通過順序找出邊緣點來跟蹤邊界的。若圖像是二值圖像或圖像中不同區(qū)域具有不同的像素值，但每個區(qū)域內(nèi)的像素值是相同的，則如下算法可完成基于4連通或8連通區(qū)域的輪廓跟蹤。第三十四頁，共九十五頁，編輯于2023年，星期五步驟1：首先按從上到下，從左到右的順序掃描圖像，尋找沒有標記跟蹤結(jié)束記號的第一個邊界起始點A0，A0是具有最小行和列值的邊界點。定義一個掃描方向變量dir，該變量用于記錄上一步中沿著前一個邊界點到當前邊界點的移動方向，其初始化取值為(1)對4連通區(qū)域取dir=3，如圖5-12(a)所示；(2)對8連通區(qū)域取dir=7，如圖5-12(b)所示。第三十五頁，共九十五頁，編輯于2023年，星期五圖5-12方向變量的初始化第三十六頁，共九十五頁，編輯于2023年，星期五步驟2：按逆時針方向搜索當前像素的3×3鄰域，其起始搜索方向設(shè)定如下：(1)對4連通區(qū)域取(dir+3)mod4，如圖5-13(a)所示；(2)對8連通區(qū)域，若dir為奇數(shù)取(dir+7)mod8，如圖5-13(b)所示；若dir為偶數(shù)取(dir+6)mod8，如圖5-13(c)所示。第三十七頁，共九十五頁，編輯于2023年，星期五圖5-133×3鄰域起始搜索方向第三十八頁，共九十五頁，編輯于2023年，星期五在3×3鄰域中搜索到的第一個與當前像素值相同的像素便為新的邊界點An，同時更新變量dir為新的方向值。步驟3：如果An等于第二個邊界點A1且前一個邊界點An-1等于第一個邊界點A0，則停止搜索，結(jié)束跟蹤，否則重復步驟2繼續(xù)搜索。步驟4：由邊界點A0、A1、A2、…、An-2構(gòu)成的邊界便為要跟蹤的邊界。算法中步驟1中所采用的準則稱為“探測準則”，其作用是找出第一個邊界點；步驟3中所采用的準則稱為“跟蹤準則”，其作用是找出所有邊界點。第三十九頁，共九十五頁，編輯于2023年，星期五圖5-14輪廓跟蹤示例第四十頁，共九十五頁，編輯于2023年，星期五5.3.2輪廓提取二值圖像輪廓提取的算法非常簡單，就是掏空內(nèi)部點：如果原圖像中有一點為黑，且它的8個鄰點都是黑色時，說明該點是內(nèi)部點，將該點刪除（置為白色像素值255）。對圖像中所有像素點執(zhí)行該操作便可完成圖像輪廓的提取。在此不對其作過多說明，請讀者參考配套光盤的源程序。第四十一頁，共九十五頁，編輯于2023年，星期五5.4圖像匹配5.4.1模板匹配模板匹配是指用一個較小的圖像，即模板與源圖像進行比較，以確定在源圖像中是否存在與該模板相同或相似的區(qū)域，若該區(qū)域存在，還可確定其位置并提取該區(qū)域。模板匹配常用的一種測度為模板與原圖像對應(yīng)區(qū)域的誤差平方和。設(shè)f(x,y)為M×N的原圖像，t(j,k)為J×K(J≤M，K≤N)的模板圖像，則誤差平方和測度定義為（5-7）第四十二頁，共九十五頁，編輯于2023年，星期五將式（5-7）展開可得(5-8)第四十三頁，共九十五頁，編輯于2023年，星期五令第四十四頁，共九十五頁，編輯于2023年，星期五DS(x,y)稱為原圖像中與模板對應(yīng)區(qū)域的能量，它與像素位置(x,y)有關(guān)，但隨像素位置(x,y)的變化，DS(x,y)變化緩慢。DST(x,y)稱為模板與原圖像對應(yīng)區(qū)域的互相關(guān)，它隨像素位置(x,y)的變化而變化，當模板t(j,k)和原圖像中對應(yīng)區(qū)域相匹配時取得最大值。DT(x,y)稱為模板的能量，它與圖像像素位置(x,y)無關(guān)，只用一次計算便可。顯然，用式(5-8)計算誤差平方和測度可以減少計算量。第四十五頁，共九十五頁，編輯于2023年，星期五基于上述分析，若設(shè)DS(x,y)也為常數(shù)，則用DST(x,y)便可進行圖像匹配，當DST(x,y)取最大值時，便可認為模板與圖像是匹配的。但假設(shè)DS(x,y)為常數(shù)會產(chǎn)生誤差，嚴重時將無法正確地完成匹配，因此可用歸一化互相關(guān)作為誤差平方和測度，其定義為(5-9)第四十六頁，共九十五頁，編輯于2023年，星期五圖5-15給出了模板匹配的示意圖，其中假設(shè)原圖像f(x,y)和模板圖像t(k,l)的原點都在左上角。對任何一個f(x,y)中的(x,y)，根據(jù)式（5-9）都可以算得一個R(x,y)值。當x和y變化時，t(j,k)在原圖像區(qū)域中移動并得出R(x,y)所有值。R(x,y)的最大值便指出了與t(j,k)匹配的最佳位置，若從該位置開始在原圖像中取出與模板大小相同的一個區(qū)域，便可得到匹配圖像。第四十七頁，共九十五頁，編輯于2023年，星期五圖5-15模板匹配示意圖第四十八頁，共九十五頁，編輯于2023年，星期五用歸一化互相關(guān)求匹配的計算工作量非常大，因為模板要在(M－J＋1)×(N－K＋1)個參考位置上做相關(guān)計算，其中，除最佳匹配點外，其余做的都是無效運算，所以有必要對其進行改進，以提高運算速度。常用的方法有序貫相似性檢測算法、幅度排序相關(guān)算法、FFT相關(guān)算法、分層搜索序貫判決算法等。模板匹配的主要局限性在于它只能進行平行移動，如原圖像中要匹配的目標發(fā)生旋轉(zhuǎn)或大小變化，該算法無效。另外，如原圖像中要匹配的目標只有部分可見，該算法也無法完成匹配。第四十九頁，共九十五頁，編輯于2023年，星期五模板匹配程序的核心代碼如下：//****************************************//函數(shù)名稱：BOOLTemplateMatch()//基本功能：本函數(shù)對傳入的CDibObject圖像對象進行圖像匹配運算//參數(shù)說明：CDibObject*pTemplate 模板圖像數(shù)據(jù)指針// CDibObject*pDibObject 圖像對象指針//返回值：BOOL成功時返回TRUE，失敗時返回FALSE////****************************************BOOLCAreaPro::TemplateMatch(CDibObject*pTemplate,CDibObject*pDibObject){第五十頁，共九十五頁，編輯于2023年，星期五//其他變量定義、獲取圖像數(shù)據(jù)區(qū)及開辟臨時內(nèi)存等代碼//循環(huán)變量inti,j,m,n;//中間結(jié)果doubledSigmaST;doubledSigmaS;doubledSigmaT;//相關(guān)性測度doubleR;//最大相關(guān)性測度doubleMaxR;//最大相關(guān)性出現(xiàn)位置intnMaxWidth,nMaxHeight;…第五十一頁，共九十五頁，編輯于2023年，星期五//計算dSigmaTdSigmaT=0;//計算模板能量for(n=0;n<nTempHeight;n++){for(m=0;m<nTempWidth;m++){pTemplateTemp=pTempBits+nTempWidthBytes*n+m;templatepixel=*pTemplateTemp;dSigmaT+=(double)templatepixel*templatepixel; } }第五十二頁，共九十五頁，編輯于2023年，星期五//找到圖像中最大相關(guān)性的出現(xiàn)位置MaxR=0.0;for(j=0;j<nHeight-nTempHeight+1;j++){for(i=0;i<nWidth-nTempWidth+1;i++){dSigmaST=0;dSigmaS=0;//計算源圖像中與模板對應(yīng)區(qū)域的能量及其與模板的互相關(guān)for(n=0;n<nTempHeight;n++){for(m=0;m<nTempWidth;m++){第五十三頁，共九十五頁，編輯于2023年，星期五pOldTemp=pOldBits+nWidthBytes*(j+n)+(i+m);pTemplateTemp=pTempBits+nTempWidthBytes*n+m;pixel=*pOldTemp;templatepixel=*pTemplateTemp;dSigmaS+=(double)pixel*pixel;dSigmaST+=(double)pixel*templatepixel;}}//計算相關(guān)性R=dSigmaST/(sqrt(dSigmaS)*sqrt(dSigmaT));//與最大相關(guān)性比較第五十四頁，共九十五頁，編輯于2023年，星期五if(R>MaxR){MaxR=R;nMaxWidth=i;nMaxHeight=j;}}}//將最大相關(guān)性出現(xiàn)區(qū)域部分復制到目標圖像for(n=0;n<nTempHeight;n++){第五十五頁，共九十五頁，編輯于2023年，星期五for(m=0;m<nTempWidth;m++){pTemplateTemp=pTempBits+nTempWidthBytes*n+m;pNewTemp=pNewBits+nWidthBytes*(n+nMaxHeight)+(m+nMaxWidth);*pNewTemp=*pTemplateTemp;}}//釋放內(nèi)存等代碼return(TRUE);}…第五十六頁，共九十五頁，編輯于2023年，星期五圖5-16模板匹配示例(a)原圖像與匹配結(jié)果；(b)模板；（c）街坊（CityBlock）距離法顏色匹配的結(jié)果第五十七頁，共九十五頁，編輯于2023年，星期五5.4.2直方圖匹配顏色是描述圖像內(nèi)容的一個重要特征。人們已經(jīng)提出了多種借助顏色特征對圖像進行檢索的方法。常用的顏色空間有R、G、B和H、S、I。實際上，利用H、S、I顏色空間進行檢索的效果更好一些，但以下討論主要以R、G、B空間為例。為利用圖像的顏色特征描述圖像，可借助圖像特征的統(tǒng)計直方圖。利用直方圖進行圖像的匹配，這便是直方圖匹配。由于篇幅所限，在此只給出常用直方圖匹配的數(shù)學原理公式，有關(guān)算法請讀者自行設(shè)計完成。第五十八頁，共九十五頁，編輯于2023年，星期五1.直方圖相交法設(shè)HQ(k)和HD(k)分別為查詢圖像Q和數(shù)據(jù)庫圖像D的特征統(tǒng)計直方圖，則兩圖像之間的匹配值d(Q,D)為(5-10)第五十九頁，共九十五頁，編輯于2023年，星期五

2.歐幾里得距離法為減少計算量，可采用直方圖的均值來粗略地表達顏色信息，對圖像的R、G、B三個分量，匹配的特征矢量f是(5-11)式中,μR、μG、μB分別是R、G、B三個分量直方圖的0階距。此時查詢圖像Q和數(shù)據(jù)庫圖像D之間的匹配值為(5-12)第六十頁，共九十五頁，編輯于2023年，星期五3.中心矩法對直方圖來說，均值為0階矩，更高階的矩也可使用。設(shè)用分別表示查詢圖像Q的R、G、B三個分量直方圖的i(i≤3)階中心矩；用分別表示數(shù)據(jù)庫圖像D的R、G、B三個分量直方圖的i(i≤3)階中心矩，則它們之間的匹配值為式中，WR，WG，WB為加權(quán)系數(shù)。第六十一頁，共九十五頁，編輯于2023年，星期五

4.參考顏色法歐幾里得距離法太粗糙，直方圖相交法計算量太大，一種折衷的方法是將圖像顏色用一組參考色表示，這組參考色應(yīng)能覆蓋視覺上可感受到的各種顏色。參考色的數(shù)量要比原圖像少，這樣可計算簡化的直方圖，所以匹配的特征矢量是f=［r1,r2…rN］T (5-14)式中：ri是第i種顏色出現(xiàn)的頻率，N是參考顏色表的尺寸。加權(quán)后的查詢圖像Q和數(shù)據(jù)庫圖像D之間的匹配值為(5-15)第六十二頁，共九十五頁，編輯于2023年，星期五式中：前面4種方法中，后3種主要是從減少計算量的角度對第1種方法進行簡化，但直方圖相交法還有另外一個問題。當圖像中的特征并不能取遍所有的可取值時，統(tǒng)計直方圖中會出現(xiàn)一些零值。這些零值的出現(xiàn)會給直方圖的相交帶來影響，從而使得由式(5-10)求得的匹配值并不能正確反映兩圖間的顏色差別。第六十三頁，共九十五頁，編輯于2023年，星期五

5.閔可夫斯基距離法若兩幅圖像Q和D的直方圖分別為HQ和HK，則顏色直方圖匹配的計算方法可以利用度量空間的閔可夫斯基 (λ=1,也叫“街坊”（CityBlock）距離)，按如下方法進行匹配(5-16)第六十四頁，共九十五頁，編輯于2023年，星期五

R、G、B圖像顏色是由不同亮度的紅、綠、藍三基色組成，因此式(5-16)可以改寫成：(5-17)式(5-17)在具體實施時，必須從所讀取的各像素顏色值中分離出R、G、B三基色的亮度值。這種方法進行顏色匹配的例子如圖5-16（c）所示。第六十五頁，共九十五頁，編輯于2023年，星期五如前所述，由于直方圖丟失了顏色的位置信息，因此兩幅圖像可能內(nèi)容完全不同，但直方圖相似。所以，僅用簡單的顏色直方圖匹配也容易造成誤識別。一種改進的方法是將圖像劃分成若干子塊，分別對各子塊進行匹配。1991年，A.Nagasaka和Y.Tanaka提出了一種將視頻幀或圖像分割成4×4相同大小的子塊并比較相應(yīng)子塊的方法。這種方法對兩幅視頻幀或圖像的相應(yīng)子塊進行比較，廢棄差別最大的一對，其余的比較結(jié)果參與最后的識別。B.Shahraray也曾提出類似的方法：將視頻幀或圖像分割成子塊并進行塊匹配，對所有子塊匹配的結(jié)果采用一種非線性的統(tǒng)計算法進行綜合評價。由于子塊的位置固定，各子塊的直方圖在一定程度上反映了顏色的位置特征，因此子塊劃分與匹配的方法可以對物體運動、攝像機運動、鏡頭縮放等情況有更好的適應(yīng)性。第六十六頁，共九十五頁，編輯于2023年，星期五6.X2直方圖匹配X2直方圖匹配的計算公式如下：(5-18)對于R、G、B圖像，X2直方圖匹配的計算公式又可以變?yōu)?5-19)第六十七頁，共九十五頁，編輯于2023年，星期五X2直方圖匹配與模板匹配或顏色直方圖匹配相比具有更好的識別率，識別鏡頭切換(AbruptSceneChange)上效果良好。A.Nagasaka和Y.Tanaka通過對灰度和、灰度模板匹配、灰度直方圖匹配、彩色模板匹配、顏色直方圖匹配和X2直方圖匹配六種匹配方法進行了實驗比較。結(jié)果表明，采用圖像分塊加上X2直方圖匹配在鏡頭切換識別上具有很好的效果，但對鏡頭漸變識別效果不好。第六十八頁，共九十五頁，編輯于2023年，星期五5.4.3形狀匹配形狀也是描述圖像內(nèi)容的一個重要特征，利用形狀進行匹配需要考慮三個問題。首先，形狀常與目標聯(lián)系在一起，所以相對于顏色，形狀特征可以看作是更高層次的圖像特征。要獲得有關(guān)目標的形狀參數(shù)，常常要先對圖像進行分割，所以形狀特征會受圖像分割效果的影響。其次，目標形狀的描述是一個非常復雜的問題，至今還沒有找到能與人的感覺相一致的圖像形狀的確切數(shù)學定義。最后，從不同視角獲取的圖像中目標形狀可能會有很大差別，為準確進行形狀匹配，需要解決平移、尺度、旋轉(zhuǎn)變換不變性的問題。第六十九頁，共九十五頁，編輯于2023年，星期五目前，常用的形狀匹配方法主要有幾何參數(shù)法（Niblack，1993）、（Scassellati，1994）、特征模表示法（Pentland，PicardandSclaroff，1996）、不變矩法（Mehtre，1997）、邊界方向直方圖法（Jain，1996）、小波重要系數(shù)法（Jacobs，1995）、小波輪廓表示法（楊翔英、章毓晉，1999）等。第七十頁，共九十五頁，編輯于2023年，星期五目標的形狀常?？梢杂媚繕说妮喞獊肀硎?，而輪廓是由一系列邊界點所組成的。一般認為，在較大尺度下常常能較可靠地消除誤檢并檢測到真正的邊界點，但在大尺度下對邊界的定位不易準確。相反，在較小尺度下對真正邊界點的定位常比較準確，但在小尺度下誤檢的比例會增加。所以，可考慮先在較大尺度下檢測出真正的邊界點，再在較小尺度下對真正邊界點進行較精確的定位。小波變換和分析作為一種多尺度、多通道分析工具，比較適合對圖像進行多尺度的邊界檢測，可參考有關(guān)文獻。第七十一頁，共九十五頁，編輯于2023年，星期五5.5投影法與差影法5.5.1投影法顧名思義，投影法就是把圖像在某一方向（常用的是水平方向和垂直方向）上進行投影。在投影圖上便可反映出圖像中目標對象的位置、尺寸等信息。圖5-17是一幅圖像分別在水平方向和垂直方向上的投影?？梢钥闯鐾队胺ㄊ且环N很自然的方法，有點像灰度直方圖。為了得到更好的效果，投影法經(jīng)常和閾值化一起使用。由于噪聲點對投影有一定的影響，所以處理前最好先做一次平滑，去除噪聲，然后進行閾值化處理，再對閾值化后的二值圖像在某個方向上進行投影運算。第七十二頁，共九十五頁，編輯于2023年，星期五圖5-17投影法第七十三頁，共九十五頁，編輯于2023年，星期五圖5-18華盛頓紀念碑圖第七十四頁，共九十五頁，編輯于2023年，星期五圖5-19閾值化后的華盛頓紀念碑第七十五頁，共九十五頁，編輯于2023年，星期五圖5-20垂直方向投影第七十六頁，共九十五頁，編輯于2023年，星期五5.5.2差影法1.圖像的代數(shù)運算圖像的代數(shù)運算是指對兩幅輸入圖像進行點對點的加、減、乘、除四則運算而得到輸出圖像的運算。如果記輸入圖像為A(x,y)和B(x,y)，輸出圖像為C(x,y)，則四種圖像代數(shù)運算的表達式如下：C(x,y)＝A(x,y)＋B(x,y)C(x,y)＝A(x,y)－B(x,y)C(x,y)＝A(x,y)×B(x,y)C(x,y)＝A(x,y)／B(x,y)第七十七頁，共九十五頁，編輯于2023年，星期五另外，還可通過適當?shù)慕M合，形成涉及幾幅圖像的復合代數(shù)運算方程。圖像相加一般用于對同一場景的多幅圖像求平均，以便有效地降低加性噪聲。通常，圖像采集系統(tǒng)中采集圖像時有這樣的參數(shù)可供選擇。其實，直接采集的圖像品質(zhì)較好，不需要這樣的處理，但是對于經(jīng)過長距離模擬通信方式傳送的圖像（如太空航天器傳回的星際圖像）這種處理是不可缺少的。但利用求平均法降低噪聲信號，提高信噪比的方法，只有當噪聲可以用同一個獨立分布的隨機模型描述時才會有效。第七十八頁，共九十五頁，編輯于2023年，星期五圖像相減常用于檢測變化及運動物體，圖像相減運算又稱為圖像差分運算。差分方法可以分為控制環(huán)境下的簡單差分方法和基于背景模型的差分方法。在控制環(huán)境下，或者在很短的時間間隔內(nèi)，可以認為背景是固定不變的，可以直接使用差分運算檢測變化及運動的物體。這種方法與閾值化處理結(jié)合往往是建立機器視覺系統(tǒng)最有效的方法之一。在相對穩(wěn)定的環(huán)境下，可以假設(shè)背景變化緩慢，且符合一定的分布規(guī)律，通過建立背景模型，實施差分方法來檢測運動物體，也可獲得很好的效果。第七十九頁，共九十五頁，編輯于2023年，星期五乘法運算可以用來實現(xiàn)掩模處理，即屏蔽掉圖像的某些部分。此外由于時域的卷積和相關(guān)運算與頻域的乘積運算對應(yīng)，因此乘法運算有時也作為一種技巧來實現(xiàn)卷積或相關(guān)處理。除法運算可用于校正成像設(shè)備的非線性影響，在特殊形態(tài)的圖像（如CT等醫(yī)學圖像）處理中用到。第八十頁，共九十五頁，編輯于2023年，星期五2.差影法所謂差影法，實際上就是圖像的相減運算(又稱減影技術(shù))，是指把同一景物在不同時間拍攝的圖像或同一景物在不同波段的圖像相減。差值圖像提供了圖像間的差異信息，能用以指導動態(tài)監(jiān)測、運動目標檢測和跟蹤、圖像背景消除及目標識別等。其算法流程圖如圖5-21所示。第八十一頁，共九十五頁，編輯于2023年，星期五圖5-21差影法檢測變化目標流程圖第八十二頁，共九十五頁，編輯于2023年，星期五差影法是非常有用的，比如說可以用在監(jiān)控系統(tǒng)中。在銀行金庫內(nèi)，攝像頭每隔一小段時間拍攝一幅圖像，并與上一幅圖像做差影，如果圖像差別超過了預(yù)先設(shè)置的閾值，說明有異常情況發(fā)生，這時就應(yīng)該拉響警報。在利用遙感圖像進行動態(tài)監(jiān)測時，用差值圖像可以發(fā)現(xiàn)森林火災(zāi)、洪水泛濫，監(jiān)測災(zāi)情變化及估計損失等；也能用來監(jiān)測河口、海岸的泥沙淤積及監(jiān)視江河、湖泊、海岸等的污染。利用差值圖像還能鑒別出耕地及不同的作物覆蓋情況。第八十三頁，共九十五頁，編輯于2023年，星期五利用差影技術(shù)消除圖像背景也有很明顯的效果。例如，在血管造影技術(shù)中，腎動脈造影術(shù)對診斷腎臟疾病就有獨特效果。為了減少誤診，人們希望提供反映游離血管的清晰圖像。通常的腎動脈造影在造影劑注入后，雖然能夠看出腎動脈血管的形狀及分布，但由于腎臟周圍血管受到脊椎及其他組織影像的重疊，難以得到理想的游離血管圖像。對此，可攝制出腎動脈造影前后的兩幅圖像，相減后就能把脊椎及其他組織的影像去掉，而僅保留血管圖像。類似的技術(shù)也可用于診斷印刷線路板及集成電路掩模的缺陷。電影特技中應(yīng)用的“藍幕”技術(shù)，其實也包含差影法的原理。第八十四頁，共九十五頁，編輯于2023年，星期五圖像在作差影法運算時必須使兩相減圖像的對應(yīng)像點位于空間同一目標點上。否則，必須先作幾何校正與配準。當將一個場景中系列圖像相減用來檢測運動或其他變化時，難以保證準確對準。這時就需要更進一步的考慮。假定差圖像由下式給定：(5-20)如果Δx很小，那么上式可以近似為(5-21)第八十五頁，共九十五頁，編輯于2023年，星期五注意到本身也是一幅圖像，我們將其直方圖以H′(D)表示。因此，由式(5-21)表示的位移差圖像的直方圖為(5-22)由式（5-22）可知，減去稍微有些不對準的一幅圖像的復制品可得到偏導數(shù)圖像。偏導數(shù)的方向為圖像位移的方向。第八十六頁，共九十五頁，編輯于2023年，星期五根據(jù)以上理論，利用VC++可以編寫出實現(xiàn)圖像加減運算的函數(shù)，其核心代碼如下://*****************************************//函數(shù)名稱：voidAddBuffer()//基本功能：本函數(shù)對傳入的兩幅圖像數(shù)據(jù)進行加操作//參數(shù)說明：unsignedchar*pOut指向輸出圖像數(shù)據(jù)的指針// unsignedchar*pIn 指向輸入圖像數(shù)據(jù)的指針// LONGlSize 圖像數(shù)據(jù)的大?。╪WidthBytes*nHeight）//返回值：無//注意：此函數(shù)聲明為保護型，只能在CAreaPro類中使用//*****************************************第八十七頁，共九十五頁，編輯于2023年，星期五voidCAreaPro::MinusBuffer(unsignedchar*pOut,

人人文庫> 全部分類> 教育資料 > 課件下載

溫馨提示

1. 本站所有資源如無特殊說明，都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
2. 本站的文檔不包含任何第三方提供的附件圖紙等，如果需要附件，請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
3. 本站RAR壓縮包中若帶圖紙，網(wǎng)頁內(nèi)容里面會有圖紙預(yù)覽，若沒有圖紙預(yù)覽就沒有圖紙。
4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
5. 人人文庫網(wǎng)僅提供信息存儲空間，僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護處理，對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯，并不能對任何下載內(nèi)容負責。
6. 下載文件中如有侵權(quán)或不適當內(nèi)容，請與我們聯(lián)系，我們立即糾正。
7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

圖象分割與邊緣檢測

文檔簡介

溫馨提示

最新文檔

評論

圖象分割與邊緣檢測

文檔簡介

溫馨提示

最新文檔

評論

相關(guān)文檔