版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進(jìn)行舉報(bào)或認(rèn)領(lǐng)
文檔簡介
第一章緒論概述人類在征服自然、改造自然和推動(dòng)社會(huì)進(jìn)步的過程中,面臨著自身能力、能量的局限性,因而發(fā)明和創(chuàng)造了許多機(jī)器來輔助或代替人類完成任務(wù)。智能機(jī)器或智能機(jī)器人是這種機(jī)器最理想的模式。智能機(jī)器能模擬人類的功能、能感知外部世界,有效解決問題。人類感知外部世界:視覺、聽覺、嗅覺、味覺、觸覺眼耳鼻舌身所以對于智能機(jī)器,賦予人類視覺功能極其重要。機(jī)器視覺:用計(jì)算機(jī)來模擬生物(外顯或宏觀)視覺功能的科學(xué)和技術(shù)。機(jī)器視覺目標(biāo):用圖像創(chuàng)建或恢復(fù)現(xiàn)實(shí)世界模型,然后認(rèn)知現(xiàn)實(shí)世界。機(jī)器視覺的研究內(nèi)容1輸入設(shè)備成像設(shè)備:攝像機(jī)、紅外線、激光、超聲波、X射線、CCD、數(shù)字掃描儀、超聲成像、CT等數(shù)字化設(shè)備2低層視覺(預(yù)處理):對輸入的原始圖像進(jìn)行處理(濾波、增強(qiáng)、邊緣檢測),提取角點(diǎn)、邊緣、線條色彩等特征。3中層視覺:恢復(fù)場景的深度、表面法線,通過立體視覺、運(yùn)動(dòng)估計(jì)、明暗特征、紋理分析。系統(tǒng)標(biāo)定4高層視覺:在以物體為中心的坐標(biāo)系中,恢復(fù)物體的完整三維圖,識別三維物體,并確定物體的位置和方向。5體系結(jié)構(gòu):根據(jù)系統(tǒng)模型(非具體的事例)來研究系統(tǒng)的結(jié)構(gòu)。(某時(shí)期的建筑風(fēng)格一據(jù)此風(fēng)格設(shè)計(jì)的具體建筑)1.3機(jī)器視覺的應(yīng)用工業(yè)檢測一文件處理,毫微米技術(shù)一多媒體數(shù)據(jù)庫。許多人類視覺無法感知的場合,精確定量感知,危險(xiǎn)場景,不可見物感知等機(jī)器視覺更顯其優(yōu)越十足。1零件識別與定位生產(chǎn)線機(jī)器人足球賽2產(chǎn)品檢驗(yàn)外形、表面、裝配位置、超聲探測內(nèi)部裂紋和氣孔3移動(dòng)機(jī)器人雙目識別恢友場景。無人駕駛汽車4遙感圖像分析航空攝影、氣象衛(wèi)星、資源衛(wèi)星航空攝影:利用普通攝影機(jī)航拍。制圖、制導(dǎo)用氣象衛(wèi)星:紅外成像、氣象云圖海洋資源:合成孔徑雷達(dá),獲取海辰形象。找礦農(nóng)作物調(diào)查,自然災(zāi)害測報(bào),生態(tài)環(huán)境檢測。5醫(yī)學(xué)圖像分析X射線、CT(ComputerTomography),核磁共振MRI(magneticresonanceimaging),超聲成像。作用:(1)圖像增強(qiáng)、標(biāo)記、染色(2)專家系統(tǒng),自動(dòng)研制6安全鑒別、監(jiān)視跟蹤車輛識別、車牌號識別人臉、眼底、指紋、表情7其他體育運(yùn)動(dòng)分析:游泳制衣(人體掃描)
影視制作人類視覺簡介1人眼所能看到的光譜范圍,只是電磁波輻射范圍的很小的一部分,為380nm—780nm,可見光譜紫外3,紫藍(lán)青綠黃橙紅 7平紅外2人眼的構(gòu)造角膜占表面的1/6具有屈光作用晶狀體、玻璃體等都有屈光作用視網(wǎng)膜:桿狀細(xì)胞(暗)錐狀細(xì)胞(明)3視覺信息處理亮度(2)形狀(3)運(yùn)動(dòng)(4)顏色(5)深度感(6)通道(7)并行人眼對運(yùn)動(dòng)物體特別敏感錐狀細(xì)胞有三種,分別對430、540、570,敏感,構(gòu)成了三基色原理的基礎(chǔ)。深度感因視差而產(chǎn)生視覺過程:
(1)視覺的時(shí)間特性(1)視覺的時(shí)間特性視覺在時(shí)間上有累積效應(yīng)對一般的物體進(jìn)行觀察時(shí),接收光的總能量E與物體可見面積、表面寬度L和時(shí)間距(觀察時(shí)間長度)T成正比。另外:人對光的感覺有潛伏期,多次閃光會(huì)導(dǎo)致閃爍的知覺。降龍十八章(2)視覺的空間特性小而弱的光點(diǎn)單獨(dú)呈現(xiàn)時(shí)可能看不見,但當(dāng)多個(gè)連在一起作為一個(gè)大的光點(diǎn)時(shí)同時(shí)呈現(xiàn)時(shí)便能看見了。
視覺度表示人所能看到景物細(xì)節(jié)的準(zhǔn)確性。覺察:檢測在視野中的某個(gè)給定物體是否存在覺察定位覺察定位定位:對兩物體相對位置精確辨別的能力解像:對一視覺形狀各組成部分之間距離的辨別能力認(rèn)知:綜合的能力和方法,包括明度識別,一定的解像力和定位能力。(3)形狀知覺:輪廓、圖形、背景輪廓:輪廓把物體與視野中的其它部分區(qū)分開來,輪廓不等于形狀。輪廓只是邊界,是局部概念,而形狀則是全體概念。主觀輪廓:主觀輪廓產(chǎn)生的必要條件是有些不完整的因素出現(xiàn)將它完整起來就有一種把它變成簡單和穩(wěn)定正規(guī)圖案的傾向。(4)視覺的相對性視覺感知的結(jié)果不僅僅取決于刺激本身,還與經(jīng)驗(yàn)對比有關(guān)系。(早晨、中午的太陽哪個(gè)更近)前景與背景:前景:視覺關(guān)心的主體。背景則是與前景相關(guān)聯(lián)的其它刺激(2)前景受背景的影響視覺知覺的對比:(1)前景和背景可相互置換(2)前景受背景的影響(5)視覺的選擇性聽而不聞視而不見。依賴先驗(yàn)知識而取向。(6)視覺的整體性對部分感知之和而產(chǎn)生的一種整體知覺經(jīng)驗(yàn)(7)視覺的恒常性亮度恒常性:黑布、白布各自一半在陽光下,一半在陰影中,我們?nèi)匀荒軌蚺卸ㄋ鼮楹诓及撞肌?/p>
大小恒常性:物體在視網(wǎng)膜上的象隨距離而變化,但我們的感覺則并不是大小的變化而是距離的變化。(感覺到遠(yuǎn)方的牛仍然比近處的狗大)形狀恒常性:直線投影為一點(diǎn),通過經(jīng)驗(yàn)加以矯正顏色恒常性:在相當(dāng)寬的光明變化條件中,能夠感受到顏色的恒常。(8)視覺的組織性相似性O(shè)OO
OOO
OOO
十。十o oo o oO O OO O Oo O O三列點(diǎn)列O O OO O Ooooooo四行點(diǎn)列oooooooooooooooooo?oo?ooOOooOOOooOOOoooOOoooOOooOOO?ooooOoooooOoooooOoooooOoooooO按列封閉性封閉輪廓更容易夠成圖形。連續(xù)性一條直線和曲線的多次交匯,心理上傾向于連續(xù)。(9)錯(cuò)視現(xiàn)象高度長度主從錯(cuò)覺高度長度主從錯(cuò)覺馬赫帶■■■■■Hering方格錯(cuò)覺(10)眼球微動(dòng)現(xiàn)象顏色和知覺牛頓用三棱鏡研究白光的折射,就此便發(fā)現(xiàn)白光可被分解成一系列從紫到紅的連續(xù)光譜。從而證明白光是由不同顏色的光線相混合而形成的,而這些光實(shí)際上是不同頻率的電磁波。(1)無顏色白—一灰一黑 黑白系列顏色(2)有顏色除黑白系列之外的各種顏色色覺的產(chǎn)生:光源的光一^反射或透射一f視網(wǎng)膜一?人腦解釋物體均勻的反射各種光—白色物體只反射某種或某幾種顏色—彩色CIE國際明度委員會(huì)R:700nm (570)G:546.Inm(540)光的三基色B:435.8nm(430)二基色疊加形成三補(bǔ)色顏料的三基色正是光的三補(bǔ)色。人眼的錐狀細(xì)胞有三種,分別對430,540,570光譜敏感。設(shè)三種刺激量分別為:X、Y、Z則:Y X ZV- ,X= ,Z=Z+Y+Z X+Y+Z X+Y+Z為刺激量的比例系數(shù),稱為色系數(shù)??梢?x+y+z=lCIE1931色度圖(D三色比例系數(shù)x、y、z均大于零。②Y的數(shù)值正好是彩色光亮度。?x=y=z表示標(biāo)準(zhǔn)白光。這樣:
■(X)--2.76891.75171.1302""r'(Y)=1.04.59070.0601G_(Z).00.05655.5943B①每一點(diǎn)對應(yīng)一種顏色。②色度圖邊界上二點(diǎn)代表純顏色。③連接兩端點(diǎn)直線上的點(diǎn)可由二端點(diǎn)顏色合成。3端點(diǎn)三角形內(nèi)的顏色可由三端點(diǎn)顏色合成。3基色不能組合出所有的顏色。補(bǔ)色律:兩個(gè)以適當(dāng)比例混合能得到白色或灰色的顏色,互稱為補(bǔ)色。中間色律:兩個(gè)非補(bǔ)色混合,便產(chǎn)生一個(gè)新的中間色或混合色,色調(diào)的混合比例確定。代替律:如顏色X+Y?B,A+B?C則有A+X+Y?C顏色模型①RGB模型(面向顯示器、打印機(jī)等硬設(shè)備)規(guī)劃為單位正方體則所有RGB的值在[0,1]R=700nmG=546.1nm
YIQ、HSV(HIS)標(biāo)準(zhǔn)白色的RGB光通量R、0g、Ob為:R:%:%= 1:4.5907:0.0601這樣把光通量為ILm的紅色,4.5079流明的綠光,0.0601流明的藍(lán)光作為三基色的單位基色量。這樣某彩色光通量(C)=R(R)+G(G))+B(B)(C)表示光的明亮程度,其色度只取決于R、G、B之間的比例關(guān)系。?4??口R G,Br= ,g= ,b= r、g、b為色度坐標(biāo),r+gr、g、b為色度坐標(biāo),r+g+b=1②CMYY黃/_/紅,, L 品紅綠 白2r 1//香 藍(lán)C各種光也都可以用CMY三基色混合而成。\ \780nm-1.5-1380nm 0.5 11.5r?MRGB,由黑一白,增色過程。CMY,由白 黑,減色過程。(繪圖,打印機(jī))顏料。④YIQ保證彩色電視和黑白電視的兼容。NTSC(國際電視系統(tǒng))協(xié)會(huì)。Y④YIQ保證彩色電視和黑白電視的兼容。NTSC(國際電視系統(tǒng))協(xié)會(huì)。Y對應(yīng)于XYZ中的Y,為亮度信息。選擇三色的基色量為R=0.299,G=0.587,B=0.114:.Y=0.299R+0.587G+0.114B-0.27(B-Y)+0.41(B-Y)0.587 0.114-0.274-0.322-0.5230.312這里RGB為NTSC制式RGB⑤HIS模型H:色調(diào)?;旌瞎庾V中的主要波長。S:飽和度。一定色調(diào)的純度。純光譜色是完全飽和,加入反光飽和度逐漸減小。I:密度、亮度(與反射率成正比)
RGB至ljHIS轉(zhuǎn)換/=;(R+G+8)3S=Jd「D[mm(R,G8)]a+G4-o“二arccos{/"G+I2yl(R-G)2+(R-G)(G-B)HIS轉(zhuǎn)至l]RGBS,/e[O,l]凡S,/e[O,l]凡G,Be[0,1]He[0,120°]R=,u+^^G=3I-(B+R)發(fā)光強(qiáng)度定義:光源540x10微“%的單色光,在指定方向輻射強(qiáng)度為%83%「1.6光度學(xué)光度學(xué):研究光的強(qiáng)弱的學(xué)科。(Photometry)當(dāng)光源足夠小,或足夠遠(yuǎn),以至于眼睛無法分辨形狀時(shí),光源為點(diǎn)光源。點(diǎn)光源Q沿某個(gè)方向r的發(fā)光強(qiáng)度I定義為此方向上單位立體角內(nèi)發(fā)出的光通量嗨。單位為流明(Lm).以r為軸取一個(gè)立體角元dQ,dQ內(nèi)的光通量為沿r方向的發(fā)光強(qiáng)度為:/=生(單位角內(nèi)的光通量)發(fā)光強(qiáng)度的單位為cd(坎[德拉]),lcd=l1%.led發(fā)光強(qiáng)度的點(diǎn)發(fā)出的總光通量為4n1m。sr為球面度,球心對球面的總球面度為4no
實(shí)際中的光源總有一定的發(fā)光面積一擴(kuò)展光源。擴(kuò)展光源表面的每個(gè)面元ds沿某個(gè)方向r有一定發(fā)光強(qiáng)度di沿r觀察,則ds'=dscos0 投影面積則面元ds沿r方向的光度學(xué)亮度B定義為在此方向上單位投影面積的發(fā)光強(qiáng)度。高度:Bdldi d(/)~~dS'~dS-cos0~JQJScos6>被照表面照度:一個(gè)被光線照射的表面上的照度,為照射在單位面積上的光通量,設(shè)面積ds上的光通量為d巾,則:照度后=案單位:IX(勒[克斯]) \Lx=1%2lm/mJ照度光學(xué)系統(tǒng)的像面照度和其他表面的照度是必須了解的光學(xué)量。參看圖1.4-1,從軸向上的面元dA|、輻射到接收面上的面元dA2的輻射通量為:d①2=LdAidQ,CosO式中dA2cos0.aLl}= r\2物而 接收而物而 接收而圖XX輻射的傳播而從物面輻射到接收面的總輻射通量為①2二LJaiLY^dAxdAydA2rn設(shè)物面是朗伯面,即L與而元dA]的位置無關(guān),則中產(chǎn)必"加出3必陷rn= 史里2必得rn由此察=%=以2%生%觸式中口2稱為輻射傳輸系數(shù),它只與表面的形狀、位置、大小和方向有關(guān)。是一純粹幾何量。邑2是一二重積分量,很難計(jì)算,不過現(xiàn)在已經(jīng)對一些典型情況,計(jì)算出了結(jié)果,并且列出了表格,可供查閱。像面照度光學(xué)系統(tǒng)像面上的照度會(huì)受兩方面的影響:(1)光學(xué)系統(tǒng)的會(huì)聚和發(fā)散作用;(2)光學(xué)系統(tǒng)的吸收、反射.、散射和擋光的作用:為了簡單起見,將忽略第(2)種影響,而對于第(1)種影響將通過光學(xué)系統(tǒng)的幾何度G表示出來,并使這一計(jì)算變得很簡單。幾何度G的定義為G=ALL皿普必陷42=AQr式中r\2這是投影立體角,它是接收面dA?對物面dAI所張立體角在物面法線方向的投影的積分。幾何度G只和光源的幾何尺寸、光源到光學(xué)系統(tǒng)的距離、光學(xué)系統(tǒng)的入瞳尺寸以及光學(xué)系統(tǒng)的結(jié)構(gòu)有關(guān)。當(dāng)光能通過光學(xué)系統(tǒng)且不存在損失時(shí),G是不變量,即在光學(xué)系統(tǒng)內(nèi)的不同截面上,G都是相同的。若從圖1.4一2觀察則有Gs=Ge=Gx=Gi式中Gs、Ge、Gx、Gi分別是光學(xué)系統(tǒng)的物面S、入瞳面e、出瞳面x、像面i的兒何度。
物平面s圖1.4一物平面s圖1.4一2從上可以看出;(1)幾何度G可以表示光學(xué)系統(tǒng)傳輸輻射的能力;(2)可以根據(jù)易于計(jì)算的截面上的G值,計(jì)算出任一截面上的照度。例如:(1)光能無損失的光學(xué)系統(tǒng)像面中心的輻射度由中=LA"?得到①E=—=LT2A_ttD1n—L——=——4/2 44(1-?)式中,a是光學(xué)系統(tǒng)的縱向放大率。(2)視場角為e處像平面上的輻照度。比較物方側(cè)物點(diǎn)1和軸上點(diǎn)0所對應(yīng)立體角的大小。對于物點(diǎn)1,入瞳所對應(yīng)的立體角為=Ae—c°s"2=&cos'0=5cos33(I!cosOy/式中Q。是入瞳對軸上點(diǎn)0所張的立體角,故軸外點(diǎn)像平面的輻照度為E,=—Leos0(—~)2~7cos304V1(1-?)2冗 2 1 4a=- -cos04 (1-a)2上式說明:像面照度耳與光學(xué)系統(tǒng)的相對孔徑(一)的平面成正比,乂和視場角0的余弦的需要特別注意的是:E,oocos46>,這將嚴(yán)重影響像面照度的均勻性。但是,對■于野外景物,它并不是朗伯體,而是各向均勻發(fā)光體,則E’oocos'e。1.7視覺的空間知覺人眼能在高和寬為2D空間上形成的視象得到?個(gè)3D視覺空間。①非視覺性深度線索眼睛聚焦調(diào)節(jié):觀察遠(yuǎn)點(diǎn)不同的物體時(shí),眼睛調(diào)節(jié)晶狀體,使成清晰象,這種調(diào)節(jié)活動(dòng)給大腦提供信息,提供深度估計(jì)。據(jù)此一共焦測距法雙眼視軸的融合觀察遠(yuǎn)近不同的物體,雙眼自動(dòng)調(diào)節(jié)使視軸對準(zhǔn)視網(wǎng)膜中心,做幅合運(yùn)動(dòng)。提供距離信息—三角測距法②雙眼深度線索中央眼確定主觀視覺方向,視覺是產(chǎn)生立體知覺和深度知覺。(單獨(dú)產(chǎn)生)(圖像復(fù)合后相當(dāng)于1只眼睛看到)③單眼深度線索大?。撼叽缦嘟奈矬w,近:成像大:遠(yuǎn):成像小物體的遮擋:遮擋來判斷物體的前后距離光亮與陰影:近:物體明亮;遠(yuǎn):物體灰暗顏色分布:近:黃或紅;遠(yuǎn):藍(lán)空氣透視:近:輪廓清晰:遠(yuǎn):模糊不清紋理:近:紋理稀疏;遠(yuǎn):紋理密集運(yùn)動(dòng):近:視角變化大;遠(yuǎn):視角變化?。ㄗ囘^電線桿,和遠(yuǎn)處的樹)第二章圖像的采集和量化2.1采集裝置的性能指標(biāo)接受外界的激勵(lì)并產(chǎn)生響應(yīng),把模擬的響應(yīng)轉(zhuǎn)化為數(shù)字化的信號,從而可被計(jì)算機(jī)利用。采集裝置功能:①接受輻射(光、聲、電)②進(jìn)行模數(shù)轉(zhuǎn)換。采集裝置性能指標(biāo):①線性響應(yīng):輸入物理信號的強(qiáng)度與輸出響應(yīng)信號的強(qiáng)度之間關(guān)系是否線性。②靈敏度:絕對靈敏度用能拾測到的最小光子數(shù)表示。相對靈敏度用能使輸出發(fā)生一級變化所需光子數(shù)表示。③信噪比:所采集的圖像中有用信號與無用干擾的(能量或強(qiáng)度)比值。④陰影(不均勻度):輸入物理信號為常數(shù)而輸出的數(shù)字形式不為常數(shù)的現(xiàn)象。⑤象素形狀:?般為正方形,但也有其它形狀(如運(yùn)動(dòng))。@頻譜靈敏度:對不同頻率輻射的相對靈敏度。⑦快門速度:采集拍攝時(shí)間。⑧讀取速度:信號數(shù)據(jù)從敏感單元讀取(傳輸)的數(shù)率。2.2電荷藕合攝像器件面陣CCD原理。(幀轉(zhuǎn)移型,隔列轉(zhuǎn)移型,線轉(zhuǎn)移型)面陣CCD的基本特性參數(shù):①光電轉(zhuǎn)移特性光電轉(zhuǎn)換因子Y,?般99.7%。②光譜響應(yīng)③動(dòng)態(tài)范圍:輸出信號峰值電壓與均方根噪聲電壓之比。噪聲源:電荷注入器件引起的噪聲。電荷轉(zhuǎn)移過程中,電荷量變化引起的噪聲。拾測時(shí)產(chǎn)生的噪聲。④暗電流:正常工作時(shí),MOS電容處于未飽和的非平衡狀態(tài),但由于熱激發(fā)產(chǎn)生的少量載流子使系統(tǒng)趨向平衡。暗電流是判斷?個(gè)系統(tǒng)好壞的重要標(biāo)志。⑤分辨率:像元位數(shù)高的器件具有更高的分辨率。面陣CCD,只評價(jià)其水平分辨率,且用電視線數(shù)的評價(jià)方法。在一幅圖像上,在水平方向能夠分辨出的黑白條數(shù)一一分辨率?!酢酢酢酢酢酢酢酢酢酢酢酢酢酢酢酡尢畛湎禂?shù)Fb電敏感區(qū)域占整個(gè)矩陣面的比例 bb=〃佇4x100%bxb⑦拖影:由寄存器電荷移位時(shí)留下的剩余電荷量產(chǎn)生。三管CCD彩色攝像機(jī)分光棱鏡一*三色一?三CCD接收—?RGB信號單管CCD彩色攝像機(jī)柵狀濾色器一?三色—?三CCD接收—?RGB信號(例舉液晶顯示器)特種CCD圖像傳感器微光CCD圖像傳感器(多幀積累)直視夜視儀一微光透視圖像傳感器特點(diǎn):便于圖像處理,實(shí)現(xiàn)遠(yuǎn)距傳輸或遙控,實(shí)現(xiàn)自動(dòng)控制直接用于制導(dǎo)、錄像并長期保存。紅外CCD圖像傳感器(IRCCD)用于夜視,、跟蹤制導(dǎo)、紅外偵察、預(yù)警。(海灣戰(zhàn)爭)主動(dòng)紅外電視攝像:紅外光源(紅外光源,半導(dǎo)體激光器)紅外攝像器件(CCD)紅外變像管:把不可見的紅外線轉(zhuǎn)變成可見光。③X光CCD圖像傳感器一醫(yī)療影像+工業(yè)探測目標(biāo):小劑量X光照射,圖像遠(yuǎn)程傳輸。CCD相機(jī)①分類:彩色相機(jī)黑白相機(jī)②按靈敏度劃分:普通型(照度1?3lux),月光型(照度0.1lux)星光型(照度0.01lux),紅外型(紅外照明,天光線)③按CCD靈敏度尺寸分為1/4inch,1/3inch,1/2inch,1inch相機(jī)。④按掃描方式:有面掃描和線掃描方式,面掃描乂分為逐行掃描和隔行掃描。⑤按同步方式:內(nèi)掃描(普通相機(jī)),外同步功能相機(jī)。CCD相機(jī)主要功能調(diào)節(jié)①同步方式選擇:內(nèi)同步(利用內(nèi)置的同步信號發(fā)生器產(chǎn)生同步信號);外同步(外觸發(fā)信號);電源同步(利用電源完成垂直同步);②自動(dòng)增益控制:CCD信號的視頻放大器,對不同照度而隨之改變增益,可使相機(jī)在較大的光照范圍內(nèi)進(jìn)行工作。③背光補(bǔ)償:自動(dòng)補(bǔ)償(AGC)以整個(gè)視場平均值來確定(亮背景,暗前景)啟動(dòng)背光補(bǔ)償,則AGC只對前景視場求平均確定增益。④電子快門:CCD僅輸出快門開啟時(shí)的光電荷信號,其余時(shí)間則被泄放。最短電子快門為1/1000So⑤Y校正:Z=7(機(jī)器視覺Y=l)光(L)-CCD一電(V)f顯示器f光。要保持二次轉(zhuǎn)換中的綜合特性具有線性。⑥自平衡(僅用于彩色相機(jī)):對景物圖像進(jìn)行色溫補(bǔ)償,分為自動(dòng)調(diào)節(jié)和手動(dòng)調(diào)節(jié)兩種。CCD相機(jī)接口:①光學(xué)接口②信號接口:RS422:雙絞線,相機(jī)具有110。終端負(fù)載。CameraLink:控制信號、視頻信號、串行通訊。LVDS(低振幅差分信號):低電壓和低電壓驅(qū)動(dòng)實(shí)現(xiàn)了低噪聲和低功耗。IEEE1394:串行接口(Firewire)-400Mbps,不需要集線器就可以連接63臺(tái)設(shè)備,連接電腦可省去圖像采集卡。彩色數(shù)碼相機(jī)圖像一鏡頭fCCD-A/D-數(shù)字信息存儲(chǔ)數(shù)碼相機(jī)的最大特點(diǎn)是它的一系列的二進(jìn)制數(shù)據(jù)和標(biāo)準(zhǔn)的圖像存儲(chǔ)方式把所攝圖像存放在機(jī)內(nèi)存儲(chǔ)器,并可以通過專用接口與通用計(jì)算機(jī)聯(lián)機(jī),實(shí)現(xiàn)圖像傳輸和計(jì)算機(jī)處理的功能。分辨率高達(dá)3060x2036.主要性能:.分辨率:常有1600x1200,1024x768,640x780。.色彩深度:專業(yè)的達(dá)到36位或24位。.焦距:可高達(dá)10倍光學(xué)變焦,數(shù)碼變焦。.光圈快門:快門1/500?16s廣角光圈25?f!6;長焦光圈f3.8?f24。.圖像存儲(chǔ):內(nèi)置存儲(chǔ)卡JPG格式120K。.取景器“觀看拍攝效果和編輯修改(液晶)。.接口功能:RS232、SCSI,USB。1394接口。.其他接口:自動(dòng)測光、自動(dòng)調(diào)焦、自動(dòng)閃光、自拍。常用的圖像文件格式BMPGIFTIFF(TIF)JPEG(JPG)(依據(jù)數(shù)字圖像處理內(nèi)容簡單擴(kuò)展)照明系統(tǒng)設(shè)計(jì)照明系統(tǒng)設(shè)計(jì)的基本因素:①鏡頭的視場:被測物尺寸一鏡頭視場f最佳照明(照亮整個(gè)視場)②照明系統(tǒng)與工作間距:鏡頭到工作距離一照明系統(tǒng)到工作間距一光源到工作距離③工件的外形,條紋及顏色:工作表面形狀、平坦度、粗糙度、顏色成像物鏡自配:針對確定的成像物鏡進(jìn)行光源設(shè)計(jì)一劃痕、缺陷、印紋等能被清晰顯現(xiàn)。照度自配:根據(jù)CCD的光表面動(dòng)態(tài)響應(yīng)范圍確定合適的像表面度。照明系統(tǒng)的選擇:①直接型:沐光方式高環(huán)形光反射型低角度方式低環(huán)形光漫反射條形方式條形光源聚光方式聚光高亮方式(激光)②投射型:高亮投射照明導(dǎo)光面(光板)投射照明線條光源投射照明③同軸光照明:與光軸平行的平行光均勻照明工件。④不同頻率光線照明(多彩)第三章二值圖像分析一幅數(shù)字圖像是一個(gè)二維陣列,陣列元素值稱為灰度值或強(qiáng)度值.實(shí)際上,圖像在量化成數(shù)字圖像前是一個(gè)連續(xù)強(qiáng)度函數(shù)的集合,場景信息就包含在這些強(qiáng)度值中.圖像強(qiáng)度通常被量化成256個(gè)不同灰度級,對某些應(yīng)用來說,也常有32、64、128或512個(gè)灰度級的情況,在醫(yī)療領(lǐng)域里甚至使用高達(dá)4096(12bits)個(gè)灰度級.很明顯,灰度級越高,圖像質(zhì)量越好,但所需的內(nèi)存也越大.在機(jī)器視覺研究的早期,山于內(nèi)存和計(jì)算能力非常有限,而且十分昂貴,因此視覺研究人員把精力主要集中在研究輸入圖像僅包含兩個(gè)灰度值的二值視覺系統(tǒng)上.人們注意到,人類視覺在理解僅由兩個(gè)灰度級組成的線條、輪廓影像或其它圖像時(shí)沒有任何困難,而且應(yīng)用場合很多,這一點(diǎn)對研究二值視覺系統(tǒng)的研究人員是一個(gè)極大的鼓舞.隨著計(jì)算機(jī)計(jì)算能力的不斷增強(qiáng)和計(jì)算成本的不斷下降,人們普遍開始研究基于灰度圖像、彩色圖像和深度圖像的視覺系統(tǒng).盡管如此,二值視覺系統(tǒng)還是十分有用的,其原因如下:⑴計(jì)算二值圖像特性的算法非常簡單,容易理解和實(shí)現(xiàn),并且計(jì)算速度很快.⑵二值視覺所需的內(nèi)存小,對計(jì)算設(shè)備要求低.工作在256個(gè)灰度級的視覺系統(tǒng)所需內(nèi)存是工作在相同大小二值圖像視覺系統(tǒng)所需內(nèi)存的八倍.如若利用游程長度編碼等技術(shù)(見3.4節(jié))還可使所需內(nèi)存進(jìn)一步減少.由于二值圖像中的許多運(yùn)算是邏輯運(yùn)算而不是算術(shù)運(yùn)算,所以所需的處理時(shí)間很短.(3)許多二值視覺系統(tǒng)技術(shù)也可以用于灰度圖像視覺系統(tǒng)上.在灰度或彩色圖像中,表示一個(gè)目標(biāo)或物體的一種簡易方法就是使用物體模板(mask),物體模板就是一幅二值圖像,其中1表示目標(biāo)上的點(diǎn),0表示其它點(diǎn).在物體從背景中分離出來后,為了進(jìn)行決策,還需要求取物體的幾何和拓?fù)涮匦?這些特性可以從它的二值圖像計(jì)算出來.因此,盡管我們是在二值圖像上討論這些方法,但它們的應(yīng)用并不限于二值圖像.一般來說,當(dāng)物體輪廓足以用來識別物體且周圍環(huán)境可以適當(dāng)?shù)乜刂茣r(shí),二值視覺系統(tǒng)是非常有用的.當(dāng)使用特殊的照明技術(shù)和背景并且場景中只有少數(shù)物體時(shí),物體可以很容易地從背景中分離出來,并可得到較好的輪廓,比如,許多工業(yè)場合都屬于這種情況.二值視覺系統(tǒng)的輸入一般是灰度圖像,通常使用閾值法首先將圖像變成二值圖像,以便把物體從背景中分離出來,其中的閾值取決于照明條件和物體的反射特性.二值圖像可用來計(jì)算特定任務(wù)中物體的幾何和拓?fù)涮匦?,在許多應(yīng)用中,這種特性對識別物體來說是足夠的.二值視覺系統(tǒng)已經(jīng)在光學(xué)字符識別、染色體分析和工業(yè)零件的識別中得到了廣泛應(yīng)用.在下面的討論中,假定二值圖像大小為mx〃,其中物體像素值為1,背景像素值為0.1閾值視覺系統(tǒng)中的一個(gè)重要問題是從圖像中識別代表物體的區(qū)域(或子圖像),這種對人來說是件非常容易的事,對計(jì)算機(jī)來說卻是令人吃驚的困難.為了將物體區(qū)域同圖像其它區(qū)域分離出來,需要首先對圖像進(jìn)行分割.把圖像劃分成區(qū)域的過程稱為分割,即把圖像Ri,刃劃分成區(qū)域Pl,P2,…,P",使得每一個(gè)區(qū)域?qū)?yīng),,個(gè)候選的物體.下面給出分割的嚴(yán)格定義.定義分割是把像素聚合成區(qū)域的過程,使得:Uti£=整幅圖像({〃}是一個(gè)完備分割).P^PJ=0,z*j,({用是一個(gè)完備分割).
每個(gè)區(qū)域6滿足一個(gè)謂詞,即區(qū)域內(nèi)的所有點(diǎn)有某種共同的性質(zhì).不同區(qū)域的圖像,不滿足這一謂詞.正如上面所表明的,分割滿足一個(gè)謂詞,這一謂詞可能是簡單的,如分割灰度圖像時(shí)用的均勻灰度分布、相同紋理等謂詞,但在大多數(shù)應(yīng)用場合,謂詞十分復(fù)雜.在圖像理解過程中,分割是一個(gè)非常重要的步驟.二值圖像可以通過適當(dāng)?shù)胤指罨叶葓D像得到.如果物體的灰度值落在某一區(qū)間內(nèi),并且背景的灰度值在這一區(qū)間之外,則可以通過閾值運(yùn)算得到物體的:值圖像,即把區(qū)間內(nèi)的點(diǎn)置成1,區(qū)間外的點(diǎn)置成0.對于二值視覺,分割和閾值化是同義的.閾值化可以通過軟件來實(shí)現(xiàn),也可以通過硬件直接完成.通過閾值運(yùn)算是否可以有效地進(jìn)行圖像分割,取決于物體和背景之間是否有足夠的對比度.設(shè)一幅灰度圖像尸上力中物體的灰度分布在區(qū)間團(tuán),心]內(nèi),經(jīng)過閾值運(yùn)算后的圖像為二值圖像F/i,力,即:J1如果Tx<F[i,j]<T2FT*1]。其它 31)如果物體灰度值分布在幾個(gè)不相鄰區(qū)間內(nèi)時(shí),閾值化方案可表示為:(3.2)如果(3.2)其它其中Z是組成物體各部分灰度值的集合.圖3.1是對一幅灰度圖像使用不同閾值得到的二值圖像輸出結(jié)果.閾值算法與應(yīng)用領(lǐng)域密切相關(guān).事實(shí)上,某閾值運(yùn)算常常是為某一應(yīng)用專門設(shè)計(jì)的,在其它應(yīng)用領(lǐng)域可能無法工作.閾值選擇常常是基于在某一應(yīng)用領(lǐng)域獲取的先驗(yàn)知識,因此在某些場合下,前幾輪運(yùn)算通常采用交互式方式來分析圖像,以便確定合適的閾值.但是,在機(jī)器視覺系統(tǒng)中,由于視覺系統(tǒng)的自主性能(autonomy)要求,必須進(jìn)行自動(dòng)閾值選擇.現(xiàn)在已經(jīng)研究出許多利用圖像灰度分布和有關(guān)的物體知識來自動(dòng)選擇適當(dāng)閾值的技術(shù).其中的一些方法將在3.2節(jié)介紹.圖3.1一幅灰度圖像和使用不同閾值得到的二值圖像結(jié)果.上左:原始灰度圖像,上右:
閾值T=100;左下:T=128.右下:Tl=100|T2=128.3.2幾何特性通過閾值化方法從圖像中檢測出物體后,下?步就要對?物體進(jìn)行識別和定位.在大多數(shù)工業(yè)應(yīng)用中,攝像機(jī)的位置和環(huán)境是已知的,因此通過簡單的幾何知識就可以從物體的二維圖像確定出物體的三維位置.在大多數(shù)應(yīng)用中,物體的數(shù)量不是很多,如果物體的尺寸和形狀完全不同,則可以利用尺度和形狀特征來識別這些物體.實(shí)際上在許多工業(yè)應(yīng)用中,經(jīng)常使用區(qū)域的一些簡單特征,如大小、位置和方向,來確定物體的位置并識別它們.3.2.1尺寸和位置一幅二值圖像區(qū)域的面積(或零階矩)由下式給出:”一1m—\A=ZX8/,力 (3-3)1=0j=0在許多應(yīng)用中,物體的位置起著十分重要的作用.工業(yè)應(yīng)用中,物體通常出現(xiàn)在已知表面(如工作臺(tái)面)上,而且攝像機(jī)相對臺(tái)面的位置也是已知的.在這種情況下,圖像中的物體位置決定了它的空間位置.確定物體位置的方法有許多,比如用物體的外接矩形、物體矩心(區(qū)域中心)等來表示物體的位置.區(qū)域中心是通過對圖像進(jìn)行“全局”運(yùn)算得到的一個(gè)點(diǎn),因此它對圖像中的噪聲相對來說是不敏感的.對于二值圖像,物體的中心位置與物體的質(zhì)心相同,因此可以使用下式求物體的中心位置:A—1,”一1 〃-11tZZ郎,力=ZZ1/如?,力i=oJ=o i=o六0 (34)〃一1,〃一1 一一1m—11=0j=0 ?=0;=0其中無和y是區(qū)域相對于左上角圖像的中心坐標(biāo).物體的位置為:〃一1,“一1ZZ網(wǎng)力— i=0y=0X= A?一!.一!
即,力-_ /=0j=Q這些是一階矩.注意,由于約定y軸向上,因此方程3.4和3.5的第二個(gè)式子的等號右邊加了負(fù)號.3.2.2方向計(jì)算物體的方向比計(jì)算它的位置稍微復(fù)雜一點(diǎn).某些形狀(如圓)的方向不是唯一的,為了定義唯一的方向,一般假定物體是長形的,其長軸方向被定義為物體的方向.通常,二維平面上與最小慣量軸同方向的最小二階矩軸被定為長軸.圖像中物體的二階矩軸是這樣一條線,物體上的全部點(diǎn)到該線的距離平方和最小.給出一幅二值圖像刃,計(jì)算物體點(diǎn)到直線的最小二乘方擬合,使所有物體點(diǎn)到直線的距離平方和最小:
n—\ni—\(3.6)=(3.6)1=0y=0其中%是物體點(diǎn)口,力到直線的距離.為了避免直線處于近似垂直時(shí)所出現(xiàn)的數(shù)值病態(tài)問題,人們一般把直線表示成極坐標(biāo)形式:(3.7)把點(diǎn)&力坐標(biāo)/7=xcos0+(3.7)把點(diǎn)&力坐標(biāo)如圖3.2所示,。是直線的法線與x軸的夾角,0是直線到原點(diǎn)的距離.r~=(xcos8+ysin。r~=(xcos8+ysin。一夕)(3.8)將方程3.8代入方程3.6并求極小化問題,可以確定參數(shù)p和6:“一1"I/=ZE(/cos^+y/7sin0-p)2B[i,j] (3.9)i=0j=Q令z2對P的導(dǎo)數(shù)等于零求解P得:夕=(元cosO+ysin。) (3.10)它說明回歸直線通過物體中心(元刃.用這一0值代入上面的Z?,則極小化問題變?yōu)椋?1=acos2^+/?sin^cos^+csin20 (3.11)其中的參數(shù):4一].-1a=ZZ(x廣守甌力i=0j=0n—1m—\b=2gZ(%-元)(4-歹)砥,刃 (3.12)/=0y=0〃一1m-\c=ZZ(y"-?w,j]i=0j-0
是二階矩.表達(dá)式/可重寫為:,111/=—(^+c)+—(a-c)cos2^+—Z?sin2^ (3.13)對12微分,并置微分結(jié)果為零,求解。值:btan20= (3.14)a-c因此,慣性軸的方向由下式給出:sin20=±byjb2+(a-c)2_ (3.15)cos20=±i&c
y]b~+(〃-C)-所以由的最小值可以確定方向軸.注意,如果b=0,Q=C,那么物體就不會(huì)只有唯一的方向軸.物體的伸長率E是/的最大值9最小值之比:(3.16)E_Zmax
(3.16)3.2.3密集度和體態(tài)比A區(qū)域的密集度(compact)可用卜面的式子來度量:A(3.17)其中,。和4分別為圖形的周長和面積.根據(jù)這一衡量標(biāo)準(zhǔn),圓是最密集的圖形,其密集密度為最大值1/4萬,其它一些圖形的比值要小一些.讓我們來看一下圓,當(dāng)圓后仰時(shí),形狀成了一橢圓,面積減小了而周長卻不象面積減小的那么快,因此密集度降低了.在后仰到極限角時(shí),橢圓被壓縮成了-一條無限長直線,橢圓的周長為無窮大,故密集度變成了零.對于數(shù)字圖像,是指物體尺寸(像素點(diǎn)數(shù)量)除以邊界長度的平方.這是一種很好的散布性或密集性度量方法.這一比值在許多應(yīng)用中被用作為區(qū)域的一個(gè)特征.密集度的另一層意義是:在給定周長的條件下,密集度越高,圍成的面積就越大.注意在等周長的情況下,正方形密集度大于長方形密集度.體態(tài)比定義為區(qū)域的最小外接矩形的長與寬之比,正方形和圓的體態(tài)比等于1,細(xì)長形物體的體態(tài)比大于1.圖3.3所示的是幾種形狀的外接矩形.
圖3.3圖3.3幾種外接矩形示意圖3.3投影給定一條宜線,用垂宜該直線的一簇等間距直線將一幅二值圖像分割成若干條,每條內(nèi)像素值為1的像素個(gè)數(shù)為該條二值圖像在給定直線上的投影(projection).當(dāng)給定直線為水平或垂直直線時(shí),計(jì)算二值圖像每一列或每一行上像素值為1的像素?cái)?shù)量,就得到了二值圖像的水平和垂直投影,如圖3.4所示.由于投影包含了圖像的許多信息,所以投影是二值圖像的一種簡潔表示方式.顯然,投影不是唯一的,同樣的投影可能對應(yīng)不同的圖像.圖3.4一幅二值圖像及其水平投影圖在某些應(yīng)用中,投影可以作為物體識別的一個(gè)特征.投影既是一種簡潔的圖像表示,又可以實(shí)現(xiàn)快速算法.下面介紹對角線投影的求解方法.對角線投影的關(guān)鍵是計(jì)算當(dāng)前行和列對應(yīng)的投影分布圖位置標(biāo)號.設(shè)行和列的標(biāo)號分別用i和/表示.若圖像矩陣為〃行加列,則i和,的范圍分別為0到〃-1和0到m-1.假設(shè)對角線的標(biāo)號d用行和列的仿射變換(線性組合加上常數(shù))計(jì)算,即:d=ai+bj+c (3.18)對角線投影共對應(yīng)〃+m-l個(gè)條,其中仿射變換把右上角像素映射成對角線投影的第一個(gè)位置,把左下角像素映射成最后一個(gè)位置,如圖3.5所示,則當(dāng)前行列對應(yīng)的標(biāo)號d的公式為:d=i-J+//J—1 (3.19)
圖3.5二值圖像及其對角線上的投影圖3.4游程長度編碼游程長度編碼(run-lengthencoding)是另一種二值圖像的簡潔表示方法,它是用圖像像素值連續(xù)為1的個(gè)數(shù)(像素1的長度)來描述圖像.這種編碼已被用于圖像傳輸.另外,圖像的某些性質(zhì),如物體區(qū)域面積,也可以從游程長度編碼直接計(jì)算出來.在游程長度編碼中經(jīng)常運(yùn)用兩種方法,一種是使用1的起始位置和1的游程長度,另一種是僅僅使用游程長度,但須從1的游程長度開始描述,如圖3.6所示.0110011100001111110100011111101111111111111110000010000011111的游程(2,2) (6,3) (13,6) (20,1)(4,6) (11,10)(1,5) (11,1) (17,4)1和0的游程長度:0,2,2,3,4,6,1,10,3,6,1,105,5,1,5,4圖3.6一幅簡單二值圖像的游程長度編碼.如果用第二種方法來表示圖像每行的游程長度,并用以代表圖像第i行的第女個(gè)游程長度,則全部1的游程長度之和就是所求物體的面積.收A=Z》如 ⑶20)i=0%=0其中乃是第i行游程個(gè)數(shù),(叫-1)/2取整,表示1的游程個(gè)數(shù).
由游程長度編碼能很容易地計(jì)算水平投影而無需變成原來的圖像.使用更巧妙的方法也能從游程長度編碼計(jì)算出垂宜和對角線投影.5二值圖像算法從背景中分離出物體是一個(gè)困難的問題,在此將不討論這個(gè)問題.這里假設(shè)物體可以從背景中分離,并且使用某一謂詞,可以對圖像中屬于物體的點(diǎn)進(jìn)行標(biāo)記.因此,問題就變?yōu)槿绾螌⒁环鶊D像中所有被標(biāo)記的點(diǎn)組合成物體圖像.這里還假設(shè)物體點(diǎn)在空間上是非常接近的.利用空間接近概念可以嚴(yán)格定義,利用此定義研究的算法可以把空間上非常接近的點(diǎn)聚合在一起,構(gòu)成圖像的一個(gè)成分(component).下面首先引進(jìn)一些定義,然后討論有關(guān)算法.5.1定義(1)近鄰在數(shù)字圖像中,一個(gè)像素在空間上可能非常接近其它一些像素.在用方格表示的數(shù)字圖像中,一個(gè)像素與其它四個(gè)像素有公共邊界,并與另外四個(gè)像素共享頂角.如果兩個(gè)像素有公共邊界,則把它們稱為4一近鄰(4-neighbors).同樣,如果兩個(gè)像素至少共享一個(gè)頂角,則稱它們?yōu)?—近鄰.例如,位于口,刃的像素有四個(gè)4一近鄰:[i-lj],[z+l,j].[/,;-1],[zj+l].它的8—近鄰包括這四個(gè)4一近鄰,再加上[/-1J-1],[Z+1J-1],[/-1J+1],[MJ-1][MJ][MJ-1][MJ][M.J+1][?>1][>J]UJ+1JU+1J-1][/+1J+1][z+1,7+1].一個(gè)像素被認(rèn)為與它的4—近鄰是4—連通(4-connected)關(guān)系,與它的8—近鄰是8-連通關(guān)系(如圖3.7).圖3.7矩形像素網(wǎng)格的4一近鄰和8—近鄰示意圖.像素口,刃位于圖的中心.(2)路徑從像素[io/]到像素的路徑(path)是指一個(gè)像素序列瓦,力],口,...,其中像素瓦,jj是像素瓦+1,九+/的近鄰像素,0<k<n-\.如果近鄰關(guān)系是4一連通的,則路徑是4一路徑;如果是8一連通的,則稱為8一路徑.圖3.8即為路徑的兩個(gè)簡單例子.
(3)前景圖像中值為1的全部像素的集合稱為前景(fbreground),用S表示.(4)連通性已知像素p,qeS,如果存在一條從p到q的路徑,且路徑上的全部像素都包含在S中,則稱p與g是連通的.注意,連通性(connectivity)是等價(jià)關(guān)系.對屬于S的任意三個(gè)像素p、q和r,有下列性質(zhì):.像素P與P本身連通(自反性)..如果p與q連通,則q與p連通(互換性)..如果p與q連通且q與r連通,則p與r連通(傳遞性).(5)連通成份一個(gè)像素集合,如果集合內(nèi)的每一個(gè)像素與集合內(nèi)其它像素連通,則稱該集合為一個(gè)連通成份(connectedcomponent).(6)背景S(5的補(bǔ)集)中包含圖像邊界點(diǎn)的所有連通成份的集合稱為背景(background).S中所有其它元稱為洞.考慮下面的兩個(gè)圖像.XjOXjO首先看左圖中有幾個(gè)洞和幾個(gè)物體.如果從前景和背景來考慮4一連通,有四個(gè)大小為一個(gè)像素的物體和一個(gè)洞.如果考慮8一連通,那么有一個(gè)物體而沒有洞.直觀地,在這兩種情況下出現(xiàn)了不確定性情況.右圖為另一個(gè)類似的不確定問題.其中如果1是連通的,那么0就應(yīng)該是不連通的.為了避免這種難以處理的情況,對物體和背景應(yīng)使用不同的連通.如果我們對S使用8一連通,那么對M就應(yīng)使用4一連通.(7)邊界
S的邊界(boundary)是S中與M中有4一連通關(guān)系的像素集合.邊界通常記為S'.(8)內(nèi)部內(nèi)部(interior)是S中不屬于它的邊界的像素集合.S的內(nèi)部等于S-S'.(9)包圍如果從S中任意一點(diǎn)到圖像邊界的4一路徑必須與區(qū)域T相交,則區(qū)域T包圍(surrounds)區(qū)域S(或S在T內(nèi)).圖3.9即為一幅簡單二值圖像和它的邊界、內(nèi)部、包圍示意圖.圖3.9圖3.9一幅二值圖像與它的邊界■■■■?內(nèi)部■和包圍"□5.2連通成份標(biāo)記在一幅圖像中找出連通成份是機(jī)器視覺中最常見的運(yùn)算之一.連通區(qū)域內(nèi)的點(diǎn)構(gòu)成表示物體的候選區(qū)域.機(jī)器視覺中的大多數(shù)物體都有表面,顯然,物體表面點(diǎn)投影到圖像平面上會(huì)形成空間上密集的點(diǎn)集.這里應(yīng)該指出,連通成份算法常常會(huì)在二值視覺系統(tǒng)中形成瓶頸效應(yīng),原因是連通成份運(yùn)算是個(gè)全局性的運(yùn)算,這種算法在本質(zhì)上是序貫的.如果圖像中僅有一個(gè)物體,那么我連通成份就沒有必要;如果圖像中有許多物體,且需要求出物體的特性與位置,則必須確定連通成份.連通標(biāo)記算法可以找到圖像中的所有連通成份,并對同一連通成份中的所有點(diǎn)分配同-標(biāo)記.圖3.10表示的是--幅圖像和已標(biāo)記的連通成份.在很多應(yīng)用中,要求在標(biāo)記連通成份的同時(shí)算出連通成份的特征,如尺寸、位置、方向和外接矩形.下面介紹兩種連通成份標(biāo)記算法:遞歸算法和序貫算法[Jain1995].圖3.10圖3.10一副圖像及其連通成分圖像(1)遞歸算法遞歸算法在串行處理器上的計(jì)算效率是很低的,因此,這一算法主要用于并行機(jī)上.算法3.1連通成份遞歸算法1.掃描圖像,找到?jīng)]有標(biāo)記的1點(diǎn),給它分配一個(gè)新的標(biāo)記L..遞歸分配標(biāo)記L給1點(diǎn)的鄰點(diǎn)..如果不存在沒標(biāo)記的點(diǎn),則停止..返回第一步.(2)序貫算法序貫算法通常要求對圖像進(jìn)行二次處理.由于這一算法一次僅運(yùn)算圖像的兩行,因此當(dāng)圖像以文件形式存貯且空間不允許把整幅圖像載入內(nèi)存時(shí)也能使用這一算法.這一算法(見算法3.2)可以查看某一點(diǎn)的鄰點(diǎn),并且可以給像素值為1的鄰點(diǎn)分配一個(gè)已經(jīng)使用過的標(biāo)記.如果圖像的鄰點(diǎn)有兩種不同的標(biāo)記,則用一個(gè)等價(jià)表(equivalenttable)來記錄所有的等價(jià)標(biāo)記.在第二次處理過程中,使用這一等價(jià)表來給某一連通成份中所有像素點(diǎn)分配唯一的標(biāo)記.本算法在從左到右、從上到下掃描圖像時(shí),算法僅能查詢到某一像素點(diǎn)的4一近鄰中的兩個(gè)近鄰點(diǎn),即上點(diǎn)與左點(diǎn).設(shè)算法已經(jīng)查到了該像素的這兩個(gè)近鄰點(diǎn),此時(shí)出現(xiàn)三種情況:(1)如果這兩個(gè)近鄰點(diǎn)中沒有一點(diǎn)為1,則該像素點(diǎn)需要一個(gè)新的標(biāo)記.(2)如果這兩個(gè)近鄰點(diǎn)中只有一點(diǎn)為1,且分配了標(biāo)記L,那么該像素點(diǎn)的標(biāo)記也為L.(3)如果這兩個(gè)鄰點(diǎn)都為1,且已分配了標(biāo)記L,則該像素點(diǎn)的標(biāo)記還是L:但是當(dāng)近鄰點(diǎn)被分配了不同標(biāo)記M與N,則這兩個(gè)標(biāo)記被用于了同一組元,應(yīng)該把它們合并.在這種情況下,應(yīng)把其中的一個(gè)標(biāo)記(一般選用最小的那個(gè)標(biāo)記)分配給該像素點(diǎn),并在等價(jià)表中登記為等價(jià)標(biāo)記.等價(jià)表包含了給每一連通成份分配唯一標(biāo)記的信息.在第一次掃描中,所有屬于同一連通成份的標(biāo)記被視為是等價(jià)的.在第二次掃描中,從一個(gè)等價(jià)集(equivalentset)中選擇一個(gè)標(biāo)記并分配給連通成份中所有像素點(diǎn).通常將最小的標(biāo)記分配給一個(gè)連通成份.第二次掃描將給每一連通成份分配唯一的標(biāo)記.在找到所有的連通成份后,應(yīng)該統(tǒng)計(jì)等價(jià)表,以便刪除其中的空格;然后將等價(jià)表作為查找表對圖像重新進(jìn)行掃描,以便重新統(tǒng)計(jì)圖像中的標(biāo)記.計(jì)算每一連通成份的面積、-階矩、二階矩是序貫連通成份算法的-個(gè)部分.當(dāng)然,必須使用分離變量來累加每一區(qū)域的矩信息.當(dāng)區(qū)域合并后,每一區(qū)域的矩累計(jì)值也應(yīng)加到一起.算法3.24一連通序貫連通成份算法.從左至右、從上到下掃描圖像..如果像素點(diǎn)為1,貝IJ:(a)如果上面點(diǎn)和左面點(diǎn)有?個(gè)標(biāo)記,則復(fù)制這一標(biāo)記.(b)如果兩點(diǎn)有相同的標(biāo)記,復(fù)制這一標(biāo)記.(c)如果兩點(diǎn)有不同的標(biāo)記,則復(fù)制上點(diǎn)的標(biāo)記且將兩個(gè)標(biāo)記輸入等價(jià)表中作為等價(jià)標(biāo)記.(d)否則給這一個(gè)像素點(diǎn)分配?新的標(biāo)記并將這一標(biāo)記輸入等價(jià)表..如果需考慮更多的點(diǎn),則回到第二步..在等價(jià)表的每?等價(jià)集中找到最低的標(biāo)記..掃描圖像,用等價(jià)表中的最低標(biāo)記取代每一標(biāo)記.5.3歐拉數(shù)在許多應(yīng)用中,虧格數(shù)(genus)或歐拉數(shù)可作為識別物體的特征.虧格數(shù)定義為連通成份數(shù)減去空洞數(shù),E=C-H (3.21)其中,E,C和”分別是歐拉數(shù)、連通成份數(shù)與空洞數(shù).這個(gè)式子給出了一個(gè)簡單的拓樸特征,這種拓?fù)涮卣骶哂衅椒€(wěn)、旋轉(zhuǎn)和比例不變特性.圖3.11給出了一些例子及其對應(yīng)的圖3.11字母“A”、"B”、“i”及它們的歐拉數(shù).注意前景
用了8一連通,而背景用了4一連通.5.4區(qū)域邊界連通成份S的邊界是那些屬于S且與W鄰接的點(diǎn)集.使用簡單的局部運(yùn)算就可找到邊界點(diǎn).在大多數(shù)應(yīng)用中,我們都想用一特定的順序跟蹤邊界點(diǎn).一般的算法是按順時(shí)針方向跟蹤區(qū)域的所有點(diǎn).此處討論一個(gè)簡單的邊界跟蹤算法.假定物體邊界不在圖像的邊界上(即物體完全在圖像內(nèi)部),邊界跟蹤算法先選擇?起始點(diǎn)swS,然后跟蹤邊界直到回到起始點(diǎn).這種算法概括在算法3.3中.這種算法對尺寸大于1個(gè)象素的所有區(qū)域都是有效的.用這種算法求區(qū)域8一鄰點(diǎn)的邊界如圖3.12(a)所示.為了得到平滑的圖像邊界,可以在檢測和跟蹤圖像邊界后,利用邊界點(diǎn)的方向信息來平滑邊界。顯然,圖像邊界噪聲越大,圖像邊界點(diǎn)變化越劇烈,圖像邊界相鄰點(diǎn)的方向變化數(shù)(與差分鏈碼有?點(diǎn)區(qū)別,鏈碼見第七章)也越大.根據(jù)這一特點(diǎn),設(shè)置一個(gè)邊界點(diǎn)方向變化數(shù)閾值,把方向變化數(shù)大于這一閾值的圖像邊界點(diǎn)濾除,由此可得到平滑的圖像邊界。圖3.12(b)所示的是一個(gè)經(jīng)過平滑過的區(qū)域邊界示意圖,其中的方向變化數(shù)閾值為1。注意,由于采用8一鄰點(diǎn)邊界跟蹤,因此方向變化數(shù)的最大值為4。如果閾值設(shè)成4,則對原始邊界沒有平滑。邊界跟蹤和平滑常常結(jié)合在一起使用,見計(jì)算機(jī)作業(yè)3.5。
□□□□□□□□□□□□□□□□□□□□□□□□□□□□□□□□□□□□□□□□□□□n□□□□□□□□□口□□O口□□□□□□□□□□□□□□口□□□□□□□□□□□□□□□□□□□□□□□□□□□□□□□□□□□□□□□□□□□□□□□□□□□□□□□□n□□□□□□□□□口□□O口□□□□□□□□□□□□□□口□□□□□□□□□□□□□口口口□□□□□□□□□□□□□o□□□□□□□□□□□□□□□□□□□□□□□□□□□□□□□□□□□□□□□□□■口口口□□□□□□□□■□□□□□□□□□□□□O□□□□on□□□□□□□□□□□□□□□□□□□□□□□□□□□□□□□□□□□□□□□□□□□□□□□□□□□□□□□□□□□□□□□□□□□□□□圖3.12邊界跟蹤算法結(jié)果,(a)圖像邊界跟蹤結(jié)果;(b)邊界跟蹤與平滑結(jié)果.算法3.3邊界跟蹤算法①從左到右、從上到下掃描圖像,求區(qū)域$的起始點(diǎn)5(女)=。(女),曠伏)),女=0.②用C表示當(dāng)前邊界上被跟蹤的像素點(diǎn).置c=s(k),記C左4一鄰點(diǎn)為b,b&S.按逆時(shí)針方向從b開始將c的8個(gè)8—鄰點(diǎn)分別記為〃],〃2.…,如,k=k+1,從b開始,沿逆時(shí)針方向找到第一個(gè)〃,wS,⑤置c=s(k)=%,b=〃”],?重復(fù)步驟③、④、⑤,直到s(k)=s(O)。3.5.5距離測量在許多應(yīng)用中,找到?幅圖像中兩個(gè)像素點(diǎn)或兩個(gè)連通成份之間的距離是很有必要的.目前還沒有定義數(shù)字圖像距離的唯一方法,但對所有的像素點(diǎn)p、q和r,任何距離度量都必須滿足下列性質(zhì):d(p,q)>0,當(dāng)且僅當(dāng)p=q時(shí),d(p,g)=0d(p,q)=d(q,p)d(p,r)<d(p,q)+d(q,r)下面是一些常用的距離函數(shù)歐兒里德距離:“Euclidean(四,j4息,/D=而if)2+(力一)2 (3.22)街區(qū)距離:“Blocki"1-,2I+I一,2I? ⑶23)棋盤距離:dChess-max(|t,-i2|,|y,-j2|). (3.24)5.6中軸如果對S中像素[i,力的所有鄰點(diǎn)[〃,v]有下式成立:J([/,j],S)>J([m,v]J) (3.25)則s中像素口,力到亍的距離小口,力,3)是局部最大值.s中所有到手的距離是局部最大值的像素點(diǎn)集合稱為對稱軸或中軸,通常記為S*.使用[",04一近鄰的中軸變換的一些例子見圖3.13.圖3.13b表明少量噪聲會(huì)使中軸變換結(jié)果產(chǎn)生顯著的差異.由S"和S'中每一點(diǎn)到6的距離能重構(gòu)原始像素集S.5*是S的簡潔表示.S*可用來表示一個(gè)區(qū)域的形狀.通過去除5*中與9距離較小的像素點(diǎn),可以生成一個(gè)簡化的S*集.中軸可作為物體的一種簡潔表示.但是,二值圖像中的區(qū)域也可用其邊界來表示.邊界跟蹤算法可用來獲得表示邊界的序列點(diǎn).在第七章還將討論用鏈碼來簡潔地表示邊界的方法.對任意物體,邊界將是區(qū)域的簡潔表示.但要明確給定像素點(diǎn)是否在某一區(qū)域內(nèi),中軸則是更好的表示,因?yàn)槭褂弥休S上的像素點(diǎn)和每一個(gè)給定像素點(diǎn)的最大距離圓盤(中軸距離變換),可以很容易地檢測出給定像素是否在中軸定義的區(qū)域中.圖3.13中軸變換舉例
5.7細(xì)化細(xì)化(thinning)是一種圖像處理運(yùn)算,可以把二值圖像區(qū)域縮成線條,以逼近區(qū)域的中心線,也稱之為骨架或核線.細(xì)化的目的是減少圖像成份,直到只留下區(qū)域的最基本信息,以便進(jìn)一步分析和識別.雖然細(xì)化可以用在包含任何區(qū)域形狀的二值圖像,但它主要對細(xì)長形(而不是凸圓形或水滴狀)區(qū)域有效.細(xì)化一?般用于文本分析預(yù)處理階段,以便將文本圖像中線條圖畫或字符筆畫表示成單像素線條.細(xì)化要求如下:\1/\!/\JZ\1/\!/\JZ\|712345Ziv>/<>zl\細(xì)化結(jié)果最少應(yīng)該是8一連通(下面將要解釋).保留近似終止線的位置.細(xì)化結(jié)果應(yīng)該近似于中軸線.由細(xì)化引起的附加突刺(短分支)應(yīng)該是最小的.細(xì)化結(jié)果應(yīng)該保證第一條要求中所定義的連通性,這一點(diǎn)是最基本的要求,它保證了連通線結(jié)構(gòu)的數(shù)量等于原始圖像中連通區(qū)域的數(shù)量.第二條要求保證所得到的線條總是含有8一連通圖像的最小數(shù)量.第三條要求說明終止線位置應(yīng)該保持不變.細(xì)化可以通過迭代方式不斷去除邊界點(diǎn)來實(shí)現(xiàn),重要的是在迭代過程中不要去除端點(diǎn)像素,因?yàn)檫@樣不僅會(huì)縮短細(xì)化線,丟掉結(jié)構(gòu)信息,而且不能保持其位置不變.第四條要求說明所得線段應(yīng)能最好地逼近原始區(qū)域的中線,如兩個(gè)像素點(diǎn)寬的豎線或水平線的真正中線應(yīng)該位于這兩個(gè)像素之間半個(gè)像素間距的位置.在數(shù)字圖像中表示半個(gè)像素間距是不可能的,因此得到的結(jié)果是一條位于原直線?側(cè)的直線.第五條要求沒有明確指出噪聲的影響控制到最低程度,因?yàn)榕袛嘣肼暠旧硎且患茈y的事.一般不希望原始區(qū)域含有會(huì)引起突刺的隆起,但當(dāng)某些較大隆起是區(qū)域特征時(shí),卻必須識別它們.應(yīng)該指出,某些細(xì)化算法有去除突刺的參數(shù),不過最好將細(xì)化和去除噪聲分開進(jìn)行,這是由于某些情況下不需要的突刺,可能是另一些情況下所需要的短線.因此,最好的辦法是先進(jìn)行細(xì)化,然后單獨(dú)去除長度低于某一特定最小值的任何突刺.?種常用的細(xì)化手段是在至少3x3鄰域內(nèi)檢查圖像的每一點(diǎn),剝?nèi)^(qū)域邊界.一次剝?nèi)ヒ粚訄D像,直至區(qū)域被細(xì)化成…條線.這一過程是用迭代法實(shí)現(xiàn)的,如算法3.4.在每次迭代時(shí),每一個(gè)像素點(diǎn)用〃X〃窗函數(shù)檢查,為了保持連通性或線末端位置,將單像素厚的邊界擦除.在圖3.14中將會(huì)看到,在每次迭代中,值為1的外層區(qū)域就是用這種方式削掉的.當(dāng)?shù)Y(jié)果沒有變化時(shí),迭代過程結(jié)束,圖像得到細(xì)化算法3.4 4一近鄰細(xì)化迭代算法?對于每?個(gè)像素,如果(1)沒有上近鄰(下近鄰'左近鄰'右近鄰)(2)不是孤立點(diǎn)或終止線(3)去除該像素點(diǎn)不會(huì)斷開區(qū)域則去除該像素點(diǎn).?重復(fù)這一步驟直到?jīng)]有像素點(diǎn)可以去除.
圖3.14細(xì)化手寫體“華”的迭代過程.(a)原圖像,(b)—(f)為
五次迭代過程,每次迭代削去一層邊界.3.5.8擴(kuò)展與收縮圖像中的?個(gè)連通成份可以進(jìn)行全方位的擴(kuò)展(expanding)或收縮(shrinking).如果某?連通成份可以變化,使得一些背景像素點(diǎn)變成1,這一運(yùn)算就稱為擴(kuò)展.如果物體像素點(diǎn)全方位地消減或變?yōu)?時(shí),則稱為收縮.?種簡單的擴(kuò)展與收縮實(shí)現(xiàn)方法如下:擴(kuò)展:如果近鄰點(diǎn)是1,則將該點(diǎn)從0變?yōu)?.收縮:如果近鄰點(diǎn)是0,則將該點(diǎn)從1變?yōu)?.這樣,收縮可以看作是擴(kuò)展背景.這類運(yùn)算的例子見圖3.15.需要指出,擴(kuò)展與收縮這樣簡單的運(yùn)算可以完成非常有用而又貌似很復(fù)雜的運(yùn)算.下面引進(jìn)符號5(&):S擴(kuò)展女倍.:S收縮左倍.其中下列性質(zhì)必須滿足:Su(S*L先擴(kuò)展后收縮算法能補(bǔ)上不希望存在的洞,如圖3.15(b)(d)所示;先收縮后擴(kuò)展算法則能去除孤立的噪聲點(diǎn),見圖3.15(c)(e).請注意,擴(kuò)展與收縮可用來確定孤立組元或簇.注意,擴(kuò)展后收縮有效地填滿了空洞卻沒有去除噪聲;相反,收縮后擴(kuò)展能去除噪聲卻沒有填滿空洞.在地形圖像處理和膨脹與腐蝕運(yùn)算中,擴(kuò)展與收縮算法的?般形式被廣泛地用于許多任務(wù)中.圖3.15對字母“h”收縮與擴(kuò)展算法實(shí)驗(yàn)結(jié)果.(a)原始噪聲圖像;(b)擴(kuò)展運(yùn)算;(c)
收縮運(yùn)算;(d)擴(kuò)展后收縮運(yùn)算;(e)收縮后擴(kuò)展運(yùn)算.第4章光學(xué)圖樣的測量全息技術(shù)使用相干光記錄和再現(xiàn)的,通過二布操作完成的成像技術(shù)①記錄激光ff曝光干板二光源有光程差X角相位差延遲a在平板上產(chǎn)生了沿y方向延伸的等間距的平行干涉條紋條紋x方向周期27/2,對比度0(x,y),條紋橫向位移6(x,y)來自物體的光以干涉條紋的形式被記錄下來振幅為條紋的對比度;相位為條紋的橫向間距;②再現(xiàn)再現(xiàn)全息圖時(shí),參考光要和記錄時(shí)的條線相同,這時(shí)平板相當(dāng)于具有正弦透過率的衍射光柵。再現(xiàn)光通過光柵后沿三個(gè)方向出射,形成0級,+1級,-1級衍射光,由于干涉條紋受到原來物光復(fù)振幅的調(diào)制。這時(shí)由衍射光形成再現(xiàn)象。③全息光的特征全息技術(shù)三個(gè)必備條件.物光與參考光必須是相干光.全息圖為極細(xì)微的光強(qiáng)分布,需高分辨率記錄介質(zhì).曝光時(shí)間內(nèi),物體阿和光學(xué)系統(tǒng)必須是靜止的特點(diǎn).不借助透鏡,可進(jìn)行像的記錄和再現(xiàn)。.像中保存著光波的相位信息。.可得到三維圖像。.物光為漫反射,局部全息缺陷,不影響圖像質(zhì)量.全息圖可高密度的存儲(chǔ)信息。.可對再現(xiàn)圖像進(jìn)行各種處理缺點(diǎn).成像面局限于被激光照明的范圍。.物體陰影會(huì)對成像產(chǎn)生影響。.不適用于運(yùn)動(dòng)的物體.受相干照明散斑噪聲的影響(表面粗糙)④全息干涉法:全息只在玻璃和金屬研磨面上,而全息干涉可以進(jìn)行?般物體的測量。
二次曝光法:使物光和參考光相干,在全息板上做記錄,稍微移動(dòng)一下物體,再進(jìn)行第二次曝光,則二次的虛像可同時(shí)再現(xiàn)。前后二次的光波形成干涉條紋在物體的像上,對應(yīng)于1/2波可形成一條干涉條紋一得到對應(yīng)于位移分布的等高線。頻閥二次曝光法一測量震動(dòng)的物體雙重脈沖二次曝光法一測量運(yùn)動(dòng)的物體(大功率激光器二次照明)利用計(jì)算機(jī)全息圖的干涉:在物體形狀已知的情況下,用計(jì)算機(jī)計(jì)算其衍射光的復(fù)振幅,繪到成全息圖。用計(jì)算機(jī)制作的標(biāo)準(zhǔn)光波面與被檢物體產(chǎn)生的光波面相干涉,就能精確的測量被檢物體的形狀。激光器干涉像面激光器干涉像面3.2散斑測量技術(shù)激光投射到使光散射的粗糙面的物體匕就呈現(xiàn)普通光見不到的斑點(diǎn)狀的圖樣,每個(gè)斑點(diǎn)稱為散斑(Speckle)產(chǎn)生原因:各點(diǎn)上的散射光具有表面微觀凹凸相對應(yīng)于的不規(guī)則相位關(guān)系,它的相互干涉疊加而形成的散斑的微細(xì)程度取決于照射表面光點(diǎn)的形狀和大小。性質(zhì):1.在散射面的被照明范圍內(nèi),其微觀結(jié)構(gòu)的統(tǒng)計(jì)性質(zhì)相同。2.散斑的明暗依賴于散射面上宏觀的強(qiáng)度分布,大小與散射面和觀察面間的距離成正比。電子散斑干涉測量(ESPI)物光A”=a”exp(i%)參考光A?1n/iexp(i%i)合成像L=a:+a:+2aita2lcos(%-%)物體移位后參考光無變化,物光相位A。,則A2=a“exp(iQu+ZX。)這時(shí)成像/2=a:|+成+2%[a21cos(%-仍1+△0)當(dāng)△0=2n7時(shí),散斑干涉圖不發(fā)生變化。%X(p=(2n+l)7T,變形前后合成光強(qiáng)度變化最大。這樣物表面分布著與有關(guān)的條紋,這種條紋反映出兩次散斑干涉光強(qiáng)之間的相干性,稱為相關(guān)條紋。應(yīng)用:測量變形,位移,震動(dòng),運(yùn)動(dòng)(轉(zhuǎn)速,速度,運(yùn)動(dòng)軌跡),表面粗糙度,透鏡檢查,視力檢查。3.3莫爾條紋測量技術(shù)莫爾是指將直線組成曲線組相重登產(chǎn)生另外一種條紋圖樣的現(xiàn)象。設(shè)pq為參變量,則光柵間距為a和b的兩個(gè)直線組,取直角坐標(biāo)x,y時(shí)一組直線光柵x=bp與之成。角的另一組光柵為y=xctgO—(agsin。)聯(lián)立上列二式求交,則有Y=xctg0一(Nd/SinQ)這里d=ab/\la2+b2-2abCos6SinQ=bSin0/yja2+b2-2abCos3這樣間隔為d的莫爾條紋會(huì)出現(xiàn)在圖中的Q角方向上“和”型、“積”型莫爾條紋兩個(gè)正弦形光柵一(1+Cos27T(0,x) —(l+2Cos2乃@x)2 2“和”型為;(1+Cos2iqx)+;(l+2Cos27qx)=1+Cos)(例+電)xCos乃(例+32)x"積”型為g(1+Cos2iqx)xg(l+2Cos2^d)2x)=Cos2兀①[XCos2乃@X1 2=—[Cos乃((D\+令)X+Cos)(①I-0)2)x]~總之,在產(chǎn)生的莫爾條紋中,總要出現(xiàn)兩個(gè)給定的頻率成分婦”具有較高的頻2率成分,形成精細(xì)的結(jié)構(gòu)。色二也具有較低頻率成分,形成緩慢變化的強(qiáng)度分布。2莫爾條紋的形成①光柵與光柵比接重疊(夾縫內(nèi)取出一條莫爾條紋)②光柵與光柵像重疊(測量試中表面畸變)③光柵像與光柵像相重疊。光柵拓?fù)浣Y(jié)特點(diǎn).不需要激光,利用非相干光的測量,容易使用。.可對粗糙表面進(jìn)行測量。.可使三位物體的形狀圖形化。.較全息和散斑是靈敏度,能實(shí)現(xiàn)位移和震動(dòng)測量的圖樣化。.可進(jìn)行運(yùn)動(dòng)物體三維形狀的圖形測量。3.4微圖像測量技術(shù).顯微鏡.微小缺陷測量。(A)利用微小凹凸產(chǎn)生的散射光4.1區(qū)域和邊緣區(qū)域:相互連結(jié)的具有相似特性的一組像素邊緣:區(qū)域邊界上的像素把所有對應(yīng)于一個(gè)物體的像素組合到一起,并進(jìn)行標(biāo)記.基于區(qū)域的分割基于邊緣檢測的分割圖像分割最簡形式:把灰度圖轉(zhuǎn)換成二值圖4000020000l100000。030000圖像分割最簡形式:把灰度圖轉(zhuǎn)換成二值圖4000020000l100000。030000圖像中的物體、背景各具有一灰度值,灰度分布曲線是由正態(tài)分布函數(shù)疊加而成.圖像中的物體、背景各具有一灰度值,灰度分布曲線是由正態(tài)分布函數(shù)疊加而成.圖像直方圖將會(huì)出現(xiàn)分離的峰值,閾值選波谷最佳.(2)迭代式閾值選擇圖像直方圖將會(huì)出現(xiàn)分離的峰值,閾值選波谷最佳.(2)迭代式閾值選擇迭代式闞值選擇算法迭代式闞值選擇算法.選一初始閾值,如:灰度均值.利用閾值把圖像分割成兩組,R1和R2.計(jì)算區(qū)域R1和R2的均值vl、v2.選擇新的閾值T=(vl+v2)/2.重復(fù)2—4步,直到vl和v2的均值不變?yōu)橹归撝档母倪M(jìn)策略是這一方法的關(guān)鍵(3)自適應(yīng)閾值化方法場景照明不均勻時(shí),一個(gè)閾值?把圖像分成NXN個(gè)子圖像,求出子圖像的閾值。所有子圖像分割的邏輯歸并。ALA(5)雙閾值方法(5)雙閾值方法#數(shù)與物體的某些灰度值已知.#還有些灰度值可能屬于物體,可能屬于背景.1)選擇兩個(gè)閾值T1和T2.2)把圖像分割成三個(gè)區(qū)域,R1包含所有灰度值低于T1的像素;R2包含所有灰度值位于T1和T2之間的像素;R3包含所有灰度值高于T2的像素.3)查看分配給區(qū)域R2中的每一個(gè)像素.如果某一像素鄰接區(qū)域RL把這一像素重新分配給RL4)重復(fù)步驟3)直到?jīng)]有像素被重新分配.5)把區(qū)域R2剩下的所有像素重新分配給R3.R1是區(qū)域核,R2是邊緣區(qū),R3是背景直方圖方法的局限性#恒定灰度值#沒有利用圖像強(qiáng)度的空間信息例如,用直方圖無法區(qū)分黑白棋格圖像具有不同灰度空間分布的圖像可能具有類似的直方圖.用直方圖無法區(qū)分隨機(jī)分布的黑白點(diǎn)圖像、黑白棋格圖像和黑白各半的圖像.直方圖的全局特性限制了其在復(fù)雜圖像中的應(yīng)用.直方圖完全沒有考慮由于物體表面的連續(xù)性,而使得物體圖像點(diǎn)常常在空間上非常密集這一特點(diǎn).
第5章干涉條紋圖像處理光測條紋圖像處理的目的是精確地、自動(dòng)地提取條紋圖的相位場分布,從而得出待測的物理量分布。隨機(jī)噪聲:由電子、熱、光敏不均,光柵或物體不清造成條紋圖噪聲。系統(tǒng)噪聲:背景光強(qiáng)的變化和條紋幅值的變化使圖像質(zhì)量退化(對比度弱,背景太強(qiáng)、太弱,變化太大)。干涉條紋圖數(shù)學(xué)形成與特征各種干涉條紋圖的光強(qiáng)分布可用數(shù)學(xué)形式表達(dá)為:1(x,y)=Io(x,y)+l|(x,y)cos(p(x,y)+In(x,y)其中,Io(x,y)為背景光強(qiáng),11(x,y)為條紋幅值(p(x,y)為相位場I£x,y)為可加性隨機(jī)噪聲△條紋圖分布特征:①I(x,y)是唯一可測的量,即已知量,(p(x,y)為有待測量求解的物理量②條紋圖是對相位場(p(x,y)的余弦調(diào)制結(jié)果,表現(xiàn)為條紋分布。③Io(x,y)為變化的背景光強(qiáng)場,它主要取決于環(huán)境光場及被測物體的表面光學(xué)特征④h(x,y)是變化的條紋幅值,也稱條紋對比度。主要取決于光源、環(huán)境等條件。⑤條紋間距、條紋密度或條紋的空間頻率表示相位場的變化梯度,變化梯度越大,條紋越密。同時(shí)決定灰度分布的變化梯度。⑥條紋方位分布表示了相位變化的梯度方向八由但小+小d(p(x,y)_dl(x,y)_在條紋的切線方向 =0,、,〃=0dt dt即在切線上,相位場與灰度變化大約為零所以條紋等值線對應(yīng)于相位等值線在條紋的法線方向n上:則@=max慳區(qū)力dn dp
dn[_dpP為某行求導(dǎo)方向所以在法線上,相位場與灰度梯度變化最大⑦由于cosip的周期性,只能測量出相位場的二階主值⑧若只考慮costp的周期性的影響,條紋的中心線點(diǎn)的相位為n階⑨由于余弦的偶函數(shù)性cos(p=cos(-q)卜若沒有其它光驗(yàn)信息,則無法從圖像灰度信息中確定相位的符號⑩相位場的物理意義取決于所用的實(shí)驗(yàn)技術(shù)。即是那種實(shí)驗(yàn)干涉條紋圖(距離、位移、振幅、變形等)圖像預(yù)處理方法①均值濾波濾波:②帶有閥值的均值濾波③高斯濾波④中值濾波增強(qiáng)①線形增強(qiáng)②去極值的線形增強(qiáng)③直方圖均衡化增強(qiáng)條紋倍增法(數(shù)字條紋倍增法)①雙幅圖條紋倍增法在條紋等差線中,有明場和暗場等差線之分,互為相反暗場Io=Id[l-cos(p(x,y)]明場Ii=Ii[1+coscos(p(x,y)]這里hah作如下運(yùn)算可得:[R(x,y)="L;-=2Lc0stp(x,y)=I+I|COS[2(p(X5y)]相位實(shí)現(xiàn)了倍增,即條紋數(shù)增加了一倍②任意相移雙圖條紋倍增法一幅條紋圖l(x,y尸I0(x,y)+L(x,y)cos(p(x,y)使其相位場平移A(p:T(x,y)=I0(x,y)+L(x,y)cos[(p(x,y)+A(p]兩幅圖作如下運(yùn)算:IR=[I(x,y)-r(x,y)]2/Ic=Ij2[cos(p(x,y)-cos((p(x,y)4-A(p)]2/Ic=41:sin2(A(p)sin2[(p(x,y)+A(p/2]/Ic=I2(x,y)+I2(x,y)cos[2(p(x,y)+A(p]其中12(x,y)=2[Lsin(A(p/2)f/【c,&p'=Ap+7i,%為常量,k用來保持條紋倍增后的圖象范圍在[0,255]中③單幅圖條紋兩倍倍增法若將一幅條紋圖背景和條紋振幅在全場常數(shù)化,這時(shí)體噢阿文圖表示為:I(x,y)=l0+Iicos(p(x,y)做簡單運(yùn)算 11(x,y)=[I(x,y)-1?!?1J=I。+I,Cos[2^(x,y)]就實(shí)現(xiàn)了條紋的二倍倍增④單幅圖條紋三倍倍增法對上述正則化條紋圖(背景和條紋幅值,全場常數(shù)化)利用下面的三角公式:cos(30)=4cos30-3cos0作變換:in(x,y)=I。+4[I(x,y)-Io]3/Io-3[I(x,y)-I0]=I0+I,cos[3(p(x,y)]就實(shí)現(xiàn)了三倍倍增(附圖)條紋圖的旋濾波算法普通濾波不能將條紋與噪聲信號清楚地分開,在濾掉噪聲的同時(shí)使條紋模,使條紋特征畸變。旋濾波思想:找出條紋的切線方向,只在切線方向上對條紋圖進(jìn)行低通濾波。(找出條紋灰度的等值線,在灰度等值線上作低通濾波)這樣既濾掉噪聲,又不對條紋產(chǎn)生模糊、畸變效應(yīng)。構(gòu)造一個(gè)一維濾波窗口一繞當(dāng)前像素點(diǎn)旋轉(zhuǎn)一周f確定條紋切線方向f在切線方向進(jìn)行低通濾波。步驟:①以當(dāng)前點(diǎn)為中心的nXn像素點(diǎn)窗口內(nèi)等角度間隔的方向?yàn)V波(附圖)②在每條方向?yàn)V波線上,計(jì)算其灰度平均值A(chǔ):ni=iij表示當(dāng)前點(diǎn)的位置,k表示第k個(gè)方向,③計(jì)算每個(gè)方向線上各點(diǎn)灰度值與改線均值之差的絕對值之和,或均方差即d;=£|g:—a;|1=1或D;=£(G:-A:)2 D:表示了K方向上的灰度分布的變化1=1④在條紋的切線方向D;取極小值,并用kk表示kk=dir[min(D;)],這樣確定了切線的方向⑤沿條紋切線方向kk進(jìn)行一維中值濾波或均值濾波中值濾波:將該方向排序?yàn)橹兄档没叶热〈?dāng)前點(diǎn)的灰度。(可濾去鼓勵(lì)的大噪聲)均值濾波:將該方向灰度平均值取代當(dāng)前點(diǎn)的灰度。(可濾去高斯分布的隨機(jī)噪聲)⑥對條紋圖全場每個(gè)點(diǎn)重復(fù)上述步驟。(旋濾波可對一幅條紋圖應(yīng)用多次)第6章立體視覺被動(dòng)測距傳感:視覺系統(tǒng)接收來自場景發(fā)射或反射的光能量,形成有關(guān)場景光能量分布函數(shù)(灰度圖象)。主動(dòng)測距傳感:視覺系統(tǒng)首先向場景發(fā)射能量,然后接收場景對所發(fā)射的能量的反射能量f形成圖象。立體成像共匏點(diǎn):同一幅景點(diǎn)在兩個(gè)不同圖象中的投影點(diǎn)。視差:兩幅圖象重疊時(shí),共朝點(diǎn)對之間的位置之差。外極平面:通過場景點(diǎn)和兩個(gè)投影中心的平面外極線:外極平面與圖像平面的郊縣外極點(diǎn):同?圖像平面的所有外極線交于?點(diǎn),即外極點(diǎn)(附圖)垂直視差,外極線假定與圖像行重合,即假定垂直視差為零。兩攝像機(jī)光軸不平行,在空間相交于一點(diǎn)。視差與光軸夾角有關(guān),存在視差為零表面(附圖)基本約束①外極線約束步驟:一幅圖中選一特征點(diǎn)—另一幅中搜索對應(yīng)特征點(diǎn) 二維搜索一幅圖中選一特征點(diǎn)f求外極線f另一幅圖外極線上求特征點(diǎn) 以為搜索②,?致性約束左右攝像機(jī)的光強(qiáng)可能差別較大,難以進(jìn)行相似性質(zhì)而已,需對圖像進(jìn)行規(guī)范化處理左圖力(i,j)右圖/(i,j)這樣在mxn圖像窗內(nèi)規(guī)范化圖像函數(shù)為:£(,,/)=(/&力一勺)/%其中U是圖像窗內(nèi)光強(qiáng)的平均值,。是光強(qiáng)分布函數(shù)2/ 4j=i/=!據(jù)此評價(jià)函數(shù)為差值絕對值之和分=ZZ瓦&力-冗億網(wǎng);=1(=1③唯一性約束一幅圖像上每一特征點(diǎn)只能與另一幅圖上唯一的一個(gè)特征對應(yīng)④連續(xù)性約束光滑物體=投影連續(xù)=>視差連續(xù)近界處=連續(xù)約束不成立邊緣匹配邊緣特征使用高斯函數(shù)的一階導(dǎo)數(shù)獲得,使用邊緣匹配的步驟如F:①使用高斯濾波器對立體圖像進(jìn)行四次濾波,前一次濾波的寬度是下一次濾波器寬度的兩倍。(高斯濾波:去處高頻噪聲,不破壞邊緣特性)②在某一列上計(jì)算各個(gè)邊緣的位置。③計(jì)算比較邊緣的方向和強(qiáng)度粗略地進(jìn)行邊緣匹配(水平邊緣是無法進(jìn)行匹配的)④通過精細(xì)計(jì)算得到更準(zhǔn)確的匹配,得到精細(xì)的視差估計(jì)。匹域相關(guān)性邊緣匹配計(jì)算比較成熟,但邊緣一般對應(yīng)物體的邊界,而邊界的深度值大部分情況卜.是不確定的。=>在圖像對中識別無趣點(diǎn),匹配兩圖像對中的相對應(yīng)的無趣點(diǎn)。無趣點(diǎn):盡可能容易地被識別和匹配。(均勻區(qū)域不合適)具有有限大變化的區(qū)域:有足夠多相互分離的區(qū)域。在以某一點(diǎn)為中心的窗函數(shù)中,計(jì)算在不同方向上象素的變化量。方向的變化量:6=X萬(x,y)-f(x,y+i)f(x,y)Gs/2=Z[/(x,y)-/(x+l,y)]2X[/U,y)-/(x+l,y+l)f(x,y)ws[4=£[f(x,y)-f(x+l,y-l)T(x,y)€Js:窗函數(shù)中的所有象素,一般為5X5-114范圍,取其方向變量最小值為中心象素點(diǎn)(工,第)的無趣值 /(xc,yc)=min(/t,I2,I3,I4)匹配方法:一幅圖像中的特征點(diǎn)為中心的一個(gè)小窗函數(shù)內(nèi)的象素與另幅圖中各潛在對應(yīng)點(diǎn)為中心的同樣窗函數(shù)內(nèi)的象素進(jìn)行相關(guān)值計(jì)算。具有最大相關(guān)值的特點(diǎn)就是匹配特征(只有滿足外極線約束的點(diǎn)才能是匹配點(diǎn))相關(guān)系數(shù):(圖像力,力)特征點(diǎn)對的視差為(乂,4.)
X"i(x,y)-/J"2(x+dx,y+dy)-/2],dy)={X Z[f2^+dX,y+dy)-f2]i}'>2(x,y)ws (x,y)€s7r了2被匹配的兩個(gè)區(qū)域中所有象素灰度平均值。從x恢復(fù)形狀的方法.光度立體:攝像機(jī)和目標(biāo)靜止不動(dòng),使用不同方位的三個(gè)光源來得到同一場景的三幅圖像。確定物體表面的反射特性。計(jì)算三個(gè)光源照明的所有點(diǎn)的局部表面方位。(間接深度計(jì)算).從明喑恢復(fù)形狀使用圖像明暗變化來恢復(fù)物體形狀信息。表面方向的變化可轉(zhuǎn)化為圖像強(qiáng)度的相應(yīng)變化,由圖像強(qiáng)度的變化可以恢復(fù)表面形狀。(間接深度計(jì)算).從紋理恢復(fù)形狀從圖像的紋理特性變化,如方向、密度、方位(間接深度計(jì)算).從運(yùn)動(dòng)恢復(fù)形狀使用運(yùn)動(dòng)攝像機(jī)獲取靜止圖像,場景點(diǎn)的視差取決于場景是否到攝像機(jī)的距離。=靜止攝像機(jī)獲取運(yùn)動(dòng)圖像,在圖像序列中產(chǎn)生運(yùn)動(dòng)視差取決于物體表面點(diǎn)位置和速度。.6測距成像結(jié)構(gòu)光測距結(jié)構(gòu)光測距時(shí)的場景是
溫馨提示
- 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
- 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會(huì)有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
- 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
- 5. 人人文庫網(wǎng)僅提供信息存儲(chǔ)空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負(fù)責(zé)。
- 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請與我們聯(lián)系,我們立即糾正。
- 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。
最新文檔
- 2025年四川雅安市棧道商務(wù)信息咨詢有限責(zé)任公司招聘筆試參考題庫附帶答案詳解
- 2025年甘肅天??h農(nóng)業(yè)產(chǎn)業(yè)扶貧開發(fā)有限責(zé)任公司招聘筆試參考題庫附帶答案詳解
- 環(huán)??萍荚谵r(nóng)業(yè)中的應(yīng)用與前景
- 二零二五年度社區(qū)便利店水果專柜承包合同3篇
- 二零二五年度車輛牌照租賃與二手車置換服務(wù)合同4篇
- 二零二五年度出租車司機(jī)職業(yè)發(fā)展規(guī)劃合同樣本4篇
- 2025年度土地資源開發(fā)與利用合同3篇
- 煙臺(tái)2024年山東煙臺(tái)市公安局招錄警務(wù)輔助人員32人筆試歷年參考題庫附帶答案詳解
- 溫州浙江溫州蒼南縣人武部招聘民兵教練員駕駛員筆試歷年參考題庫附帶答案詳解
- 二零二五年度圖書編輯出版合同范本3篇
- 2024-2025學(xué)年人教版數(shù)學(xué)七年級上冊期末復(fù)習(xí)卷(含答案)
- 2024年決戰(zhàn)行測5000題言語理解與表達(dá)(培優(yōu)b卷)
- 四年級數(shù)學(xué)上冊人教版24秋《小學(xué)學(xué)霸單元期末標(biāo)準(zhǔn)卷》考前專項(xiàng)沖刺訓(xùn)練
- 中國游戲發(fā)展史課件
- (完整版)減數(shù)分裂課件
- 銀行辦公大樓物業(yè)服務(wù)投標(biāo)方案投標(biāo)文件(技術(shù)方案)
- 第01講 直線的方程(九大題型)(練習(xí))
- 《基礎(chǔ)會(huì)計(jì)》教學(xué)課件-整套教程電子講義
- 微粒貸逾期還款協(xié)議書范本
- 人教版七年級上冊數(shù)學(xué)全冊課時(shí)練習(xí)帶答案
- NBT 47013.4-2015 承壓設(shè)備無損檢測 第4部分:磁粉檢測
評論
0/150
提交評論