




版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請(qǐng)進(jìn)行舉報(bào)或認(rèn)領(lǐng)
文檔簡介
摘要數(shù)字圖像處理就是利用計(jì)算機(jī)對(duì)圖像信息進(jìn)行加工,以滿足人的視覺心理或者應(yīng)用需求。圖像識(shí)別所討論的問題,是研究用計(jì)算機(jī)代替人自動(dòng)地處理大量的物理信息,解決人類所不能識(shí)別的問題。對(duì)于計(jì)算機(jī)來說,在實(shí)際工作環(huán)境里,圖像場(chǎng)景已有較大的變化。因此要區(qū)分圖像屬于哪一類,往往要通過一系列關(guān)鍵技術(shù)來實(shí)現(xiàn)。由此產(chǎn)生的圖像識(shí)別方法也有很多。本文在較廣泛地調(diào)研文獻(xiàn)的根底上,對(duì)圖像識(shí)別系統(tǒng)進(jìn)行了較為全面的綜述,并以較為大量文字和具體的實(shí)例,通過使用常用的仿真語言和軟件對(duì)基于數(shù)字圖像處理的障礙物的識(shí)別進(jìn)行了研究。第一局部通過中值濾波、梯度法銳化和邊緣檢測(cè)進(jìn)行處理后,將目標(biāo)圖像與背景圖像差分;第二局部再進(jìn)行形態(tài)學(xué)膨脹、最小外接矩形特征計(jì)算后,在分割的根底上選擇需要提取的特征,對(duì)某些參數(shù)進(jìn)行測(cè)量后,根據(jù)測(cè)量結(jié)果做分類和識(shí)別,通過對(duì)標(biāo)記區(qū)域計(jì)算質(zhì)心進(jìn)行定位識(shí)別,最后通過MATLAB軟件對(duì)其進(jìn)行了仿真,獲得了較理想的識(shí)別結(jié)果。關(guān)鍵詞:數(shù)字圖像處理;圖像識(shí)別;背景差分;膨脹處理;最小外接矩形ABSTRACTThedigitalimageprocessingistousethecomputertocarryontheprocessingimageinformation,tomeettheperson'svisualpsychologyorapplicationrequirements.Theproblemsdiscussedimagerecognition,isthestudyusedcomputerinsteadofpeopleautomaticallywiththeamountofphysicalinformation,solvetheproblemofhumanbeingscan'tidentify.Forcomputerspeaking,theactualworkenvironment,imagesceneforgreaterchange.Sotodistinguishbetweenimagewhatkind,oftentothroughaseriesofkeytechnology.Theresultingimagerecognitionmethodalsohasalotof.Thispaperinawidelyresearchliterature,andonthebasisofimagerecognitionsystemforacomprehensivereview,andtobealotofwrittenandaspecificexample,throughtheuseofcommonlanguageandsoftwaresimulationbasedondigitalimageprocessingofobstaclesrecognition.Thefirstpartthroughthemedianfiltering,gradientmethodsharpenandedgedetectionafterprocessing,willtargetimageandthebackgroundimagedifference;Thesecondpartofmorphologicalinflationagain,minimumcircumscribedrectangularfeaturecalculation,inthedivisionofthebasisofthechoiceneedtoextractcharacteristicofsomeparametersformeasurement,themeasurementresultsdoclassificationandidentification,throughtothemarkerareascalculationcentroidlocalizationrecognition,thelastthroughthesoftwareMATLABsimulation,obtainedaidealrecognitionresults.Keywords:Digitalimageprocessing;Imagerecognition;Backgrounddifference;Expansionprocess;Minimumboundingrectangle 目錄摘要 1關(guān)鍵詞 1ABSTRACT 2Keywords 21緒論 11.1數(shù)字圖像處理簡介 11.2數(shù)字圖像處理的特點(diǎn) 21.3課題目的和意義 31.4論文結(jié)構(gòu)安排 42圖像識(shí)別系統(tǒng)簡介 52.1圖像預(yù)處理 5灰度化和二值化 5光照補(bǔ)償 6圖像差分 9圖像平滑 11圖像銳化 12邊緣檢測(cè) 152.2形態(tài)處理 172.3圖像的識(shí)別 182.4小結(jié) 183基于數(shù)字圖像處理的障礙物識(shí)別 193.1仿真環(huán)境簡介 193.2預(yù)處理 21灰度化 213.2.2背景差分 22二值化 24中值濾波 25Robert梯度算子銳化和邊緣檢測(cè) 253.3膨脹處理和目標(biāo)識(shí)別 283.3.1膨脹處理 28目標(biāo)識(shí)別 283.4小結(jié) 304總結(jié)與展望 32致謝 34參考文獻(xiàn) 35附錄一〔程序代碼〕 36附錄二〔程序運(yùn)行結(jié)果〕 381緒論1.1數(shù)字圖像處理簡介數(shù)字圖像處理一般是利用計(jì)算機(jī)或其它含有微處理器的嵌入式數(shù)字設(shè)備對(duì)圖像進(jìn)行處理。由于計(jì)算機(jī)等數(shù)字設(shè)備只能處理離散數(shù)字信號(hào),因此它所處理的對(duì)象也只能是數(shù)字圖像。而在我們?nèi)粘I钪谐霈F(xiàn)的圖像信號(hào)絕大局部都是模擬信號(hào),所以必須通過某種方式將模擬圖像信號(hào)轉(zhuǎn)化為數(shù)字圖像信號(hào)。這個(gè)過程稱之為模數(shù)轉(zhuǎn)換,需要用到采樣、量化理論。圖像處理技術(shù)是20世紀(jì)60年代隨著計(jì)算機(jī)技術(shù)和VLSI的開展而產(chǎn)生、開展和不斷成熟起來的一個(gè)新興技術(shù)領(lǐng)域,它在理論上和實(shí)際應(yīng)用中都取得了巨大的成就。視覺是人類最重要的感知手段,圖像又是視覺的根底。早期圖像處理的目的是改善圖像質(zhì)量,它以人為對(duì)象,以改善人的視覺效果為目的。圖像處理中輸入的是質(zhì)量低的圖像,輸出的是改善質(zhì)量后的圖像。常用的圖像處理方法有圖像增強(qiáng)、復(fù)原、編碼、壓縮等。首次獲得成功應(yīng)用的是美國噴氣推進(jìn)實(shí)驗(yàn)室。他們對(duì)空間探測(cè)器“徘徊者〞7號(hào)在1964年發(fā)回的幾千張?jiān)虑蛘掌M(jìn)行圖像處理,如幾何校正、灰度變換、去除噪聲等,并考慮了太陽位置和月球環(huán)境的影響,由計(jì)算機(jī)成功地繪制出月球外表地圖,獲得了巨大的成功。在以后的宇航空間技術(shù)探測(cè)研究中,數(shù)字圖像處理技術(shù)都發(fā)揮了巨大的作用。圖像處理技術(shù)取得的另一個(gè)巨大成就是在醫(yī)學(xué)上。1972年英國EMI公司工程師Hounsfield創(chuàng)造了用于頭顱診斷的X射線計(jì)算機(jī)斷層攝影裝置,也就是我們通常所說的CT。CT的根本方法是根據(jù)人的頭部截面的投影,經(jīng)計(jì)算機(jī)處理來重建截面圖像,稱為圖像重建。1975年EMI公司又成功研制出全身用的CT裝置,獲得了人體各個(gè)部位鮮明清晰的斷層圖像。1979年,這項(xiàng)無損傷診斷技術(shù)被授予諾貝爾獎(jiǎng),以表彰它對(duì)人類做出的劃時(shí)代奉獻(xiàn)。從20世紀(jì)70年代中期開始,隨著計(jì)算機(jī)技術(shù)和人工智能、思維科學(xué)研究的迅速開展,數(shù)字圖像處理技術(shù)向更高、更深層次開展。人們已開始研究如何用計(jì)算機(jī)系統(tǒng)解釋圖像,類似人類視覺系統(tǒng)理解外部世界,這被稱為圖像理解或計(jì)算機(jī)視覺。其中代表性的成果是70年代末MIT的Marr提出的視覺計(jì)算理論,這個(gè)理論成為計(jì)算機(jī)視覺領(lǐng)域其后十多年的主導(dǎo)思想。20世紀(jì)80年代末期,人們開始將其應(yīng)用于地理信息系統(tǒng),研究海圖的自動(dòng)讀入、自動(dòng)生成方法。數(shù)字圖像處理技術(shù)的應(yīng)用領(lǐng)域不斷拓展。圖像處理技術(shù)的大開展是從20世紀(jì)90年代初開始的。自1986年以來,小波理論與變換方法迅速開展,它克服了傅里葉分析不能用于局局部析等方面的缺乏之處,被認(rèn)為是調(diào)和分析半個(gè)世紀(jì)以來工作之結(jié)晶。1988年,小波分析被有效地應(yīng)用于圖像分解和重構(gòu)。小波分析被認(rèn)為是信號(hào)與圖像分析在數(shù)學(xué)方法上的重大突破。隨后數(shù)字圖像處理技術(shù)迅猛開展,到目前為止,圖像處理在圖像通訊、辦公自動(dòng)化系統(tǒng)、地理信息系統(tǒng)、醫(yī)療設(shè)備、衛(wèi)星照片傳輸及分析和工業(yè)自動(dòng)化領(lǐng)域的應(yīng)用越來越多。進(jìn)入21世紀(jì),隨著計(jì)算機(jī)技術(shù)的迅猛開展和相關(guān)理論的不斷完善,圖像處理技術(shù)在許多應(yīng)用領(lǐng)域受到廣泛重視并取得了重大的開拓性成就。屬于這些領(lǐng)域的有航空航天、生物醫(yī)學(xué)工程、工業(yè)檢測(cè)、機(jī)器人視覺、公安司法、軍事制導(dǎo)、文化藝術(shù)等。該技術(shù)成為一門引人注目、前景遠(yuǎn)大的新型學(xué)科。1.2數(shù)字圖像處理的特點(diǎn)根據(jù)數(shù)字圖像處理所涉及到的數(shù)字設(shè)備、技術(shù)本身以及技術(shù)的具體實(shí)現(xiàn)形式——軟件,數(shù)字圖像處理的特點(diǎn)可以分為以下幾點(diǎn):(1)再現(xiàn)性好:計(jì)算機(jī)圖像處理與模擬圖像處理的根本不同在于,它不會(huì)因圖像的存儲(chǔ)、傳輸或復(fù)制等一系列變換操作而導(dǎo)致圖像質(zhì)量的退化。只要圖像在數(shù)字化時(shí)準(zhǔn)確地表現(xiàn)了原稿,那么數(shù)字圖像處理過程始終能保持圖像的真實(shí)再現(xiàn);(2)處理精度高:按目前的技術(shù),幾乎可將一幅模擬圖像數(shù)字化為任意大小的二維數(shù)組,這主要取決于圖像數(shù)字化設(shè)備的能力?,F(xiàn)代掃描儀可以把每個(gè)像素的灰度等級(jí)量化為16位甚至更高,這意味著圖像的數(shù)字化精度可以滿足任一應(yīng)用需求。從原理上講不管圖像的精度有多高,處理總是能實(shí)現(xiàn)的,只要在處理時(shí)改變程序中的數(shù)組參數(shù)就可以了;(3)適用面寬:圖像可以來自多種信息源。從圖像反映的客觀實(shí)體尺度看,可以小到電子顯微鏡圖像,大到航空照片、遙感圖像甚至天文望遠(yuǎn)鏡圖像。這些來自不同信息源的圖像只要被變換為數(shù)字編碼形式后,均是用二維數(shù)組表示的灰度圖像組合而成,因而均可用計(jì)算機(jī)來處理;(4)靈活性高:由于圖像的光學(xué)處理從原理上講只能進(jìn)行線性運(yùn)算,極大地限制了光學(xué)圖像處理能實(shí)現(xiàn)的目標(biāo);而數(shù)字圖像處理不僅能完成線性運(yùn)算,且能實(shí)現(xiàn)非線性處理,即但凡可以用數(shù)學(xué)公式或邏輯關(guān)系來表達(dá)的一切運(yùn)算均可用數(shù)字圖像處理實(shí)現(xiàn);(5)信息壓縮的潛力大:計(jì)算機(jī)圖像中各個(gè)像素不是獨(dú)立的,其相關(guān)性大。在圖像畫面上,經(jīng)常有很多像素有相同或接近的灰度。就電視畫面而言,同一行中相鄰兩個(gè)像素或相鄰兩行間的像素,其相關(guān)系數(shù)可達(dá)0.9以上,而相鄰兩幀之間相關(guān)性比幀內(nèi)相關(guān)性一般說還要大些。因此,圖像處理中信息壓縮的潛力很大。圖像處理就是對(duì)圖像信息加工以滿足人的視覺心理或應(yīng)用需求的方法。圖像處理方法有光學(xué)方法和電子學(xué)方法。而數(shù)字圖像處理就是利用數(shù)字計(jì)算機(jī)或其它的硬件設(shè)備對(duì)圖像信息轉(zhuǎn)換而得到的電信號(hào)進(jìn)行某些數(shù)學(xué)處理以提高圖像的實(shí)用性。計(jì)算機(jī)進(jìn)行圖像處理一般有兩個(gè)目的:(1)產(chǎn)生更適合人觀察和識(shí)別的圖像。(2)希望能由計(jì)算機(jī)自動(dòng)識(shí)別和理解圖像。總的來說,數(shù)字圖像處理包括點(diǎn)運(yùn)算、幾何處理、圖像增強(qiáng)、圖像復(fù)原、圖像形態(tài)學(xué)處理、圖像編碼、圖像重建、圖像識(shí)別等。本文的主要內(nèi)容那么是其中的圖像識(shí)別。圖像識(shí)別所討論的問題,是研究用計(jì)算機(jī)代替人自動(dòng)地處理大量的物理信息,解決人類生理器官所不能識(shí)別的問題,從而局部代替人的腦力勞動(dòng)。人類識(shí)別圖像的過程總是先找到它們外形或顏色的某些特征進(jìn)行比擬分析和判斷,然后加以分門別類,即識(shí)別它們。研究計(jì)算機(jī)識(shí)別圖像時(shí)也借鑒人的思維活動(dòng),采取同樣的方法。然而圖像的灰度與彩色是由光強(qiáng)和波長不同的光波引起的,與景物外表的特性、方向、光線條件以及干擾等多種因素有關(guān)。因此要區(qū)分圖像屬于哪一類,往往要經(jīng)過預(yù)處理、分割、特征提取、分析、分類、識(shí)別等一系列過程?,F(xiàn)在這些技術(shù)完全可以用計(jì)算機(jī)模擬、對(duì)圖像信息進(jìn)行處理來到達(dá)對(duì)它的識(shí)別。1.3課題目的和意義“識(shí)別〞這兩個(gè)字分開來解釋有“認(rèn)識(shí)〞和“區(qū)別〞的含義。說“識(shí)別某物體〞包含有認(rèn)識(shí)它而且能從一堆物件中把它與別的物件區(qū)別開來的意思。通常我們說認(rèn)識(shí)某事物,這一定是經(jīng)歷過中曾經(jīng)見過或者接觸過它,因而了解它的特性。一旦你認(rèn)識(shí)了它,自然也能把它與其他事物區(qū)別開來。根據(jù)存儲(chǔ)在大腦中的模式,就能對(duì)物體進(jìn)行識(shí)別,這種識(shí)別就是“模式識(shí)別〞。圖像識(shí)別,可以認(rèn)為是圖像的模式識(shí)別,它是在模式識(shí)別技術(shù)在圖像領(lǐng)域中的具體運(yùn)用。模式識(shí)別的研究對(duì)象根本上可以概括為兩大類:一類是有直覺形象的圖像,如圖像、相片、文字等;一類是沒有直覺形象而只有數(shù)據(jù)或信息波形,如語音、心電脈沖、地震波等。模式識(shí)別研究的目的是研制能夠自動(dòng)處理某些信息的機(jī)器系統(tǒng),以便代替人完成分類和辨識(shí)的任務(wù)。所以,狹義地講,圖像識(shí)別所研究的模式就是圖像。本文的目的是通過對(duì)圖像識(shí)別原理的研究,對(duì)障礙物識(shí)別技術(shù)的原理進(jìn)行分析研究,通過中值濾波、背景差分、梯度法銳化與邊緣檢測(cè)進(jìn)行預(yù)處理后,利用形態(tài)學(xué)的膨脹處理和最小外接矩形的計(jì)算與定位,對(duì)障礙物目標(biāo)進(jìn)行識(shí)別,并通過MATLAB軟件仿真對(duì)其進(jìn)行了仿真實(shí)現(xiàn)。圖像識(shí)別是立體視覺、運(yùn)動(dòng)分析、數(shù)據(jù)融合等實(shí)用技術(shù)的根底,在導(dǎo)航、地圖與地形配準(zhǔn)、自然資源分析、天氣預(yù)報(bào)、環(huán)境監(jiān)測(cè)、生理病變研究等許多領(lǐng)域重要的應(yīng)用價(jià)值。1.4論文結(jié)構(gòu)安排在本章中,我們首先總結(jié)歸納了圖像的概念,數(shù)字圖像處理開展的歷程及其特點(diǎn),以便對(duì)數(shù)字圖像處理有一個(gè)感性的認(rèn)識(shí)和把握,并對(duì)我們所研究的課題有一個(gè)較為客觀的定位。接下來就引入了本文所研究的課題的本質(zhì)——圖像識(shí)別,按本文的思路對(duì)圖像識(shí)別系統(tǒng)進(jìn)行了較為完整的表達(dá)。接下來的章節(jié)中,將作如下安排:第2章對(duì)圖像識(shí)別系統(tǒng)的關(guān)鍵技術(shù)進(jìn)行介紹;第3章介紹基于數(shù)字圖像處理的障礙物識(shí)別的原理和算法。這樣的安排,是因?yàn)楸疚牡亩ㄎ皇腔跀?shù)字圖像處理的圖像識(shí)別,另外還要對(duì)目前圖像識(shí)別領(lǐng)域的關(guān)鍵技術(shù)做一個(gè)比擬全面的綜述。2圖像識(shí)別系統(tǒng)簡介圖像識(shí)別所討論的問題,是研究用計(jì)算機(jī)代替人自動(dòng)地處理大量的物理信息,解決人類所不能識(shí)別的問題。對(duì)于計(jì)算機(jī)來說,在各種惡劣的工作環(huán)境里,圖像與景物已有較大的差異。因此要區(qū)分圖像屬于哪一類,往往要通過預(yù)處理、形態(tài)學(xué)處理或特征提取、分析分類與識(shí)別等一系列關(guān)鍵技術(shù)來實(shí)現(xiàn)。由此產(chǎn)生的圖像識(shí)別方法也有很多。本文所研究的圖像識(shí)別系統(tǒng)的思路是預(yù)處理、形態(tài)學(xué)處理、提取特征量來對(duì)目標(biāo)障礙物進(jìn)行識(shí)別。2.1圖像預(yù)處理圖像預(yù)處理是相對(duì)于圖像識(shí)別而言的一種前期處理。不管采用何種裝置,輸入的圖像往往不能令人滿意。例如圖像中物體的輪廓過于鮮明而顯得不協(xié)調(diào);按檢測(cè)對(duì)象大小和形狀的要求看,圖像的邊緣過于模糊;在相當(dāng)滿意的一幅圖像上會(huì)發(fā)現(xiàn)多了一些不知來源的黑點(diǎn)或白點(diǎn);以及圖像的失真、變形等等??傊?,輸入的圖像在視覺效果和識(shí)別方便性等方面可能存在諸多問題,這類問題不妨統(tǒng)稱為“質(zhì)量〞問題。盡管由于目的、觀點(diǎn)、愛好等的不同,圖像質(zhì)量很難有統(tǒng)一的定義和標(biāo)準(zhǔn),但是,根據(jù)應(yīng)用要求改善圖像質(zhì)量卻是一個(gè)共同的愿望。改善圖像質(zhì)量的處理稱之為圖像預(yù)處理,主要是指按需要對(duì)圖像進(jìn)行適當(dāng)?shù)淖儞Q突出某些有用的信息,去除或削弱無用的信息,如改變圖像的比照度,去除噪聲或強(qiáng)調(diào)邊緣的處理等等。2.1.1灰度化和二值化在圖像預(yù)處理階段,都要把采集的圖像進(jìn)行灰度化處理,這樣既可以提高后續(xù)算法速度,而且可以提高系統(tǒng)綜合應(yīng)用實(shí)效,到達(dá)更為理想的要求。圖像灰度化技術(shù)的研究具有重要意義。顏色可分為黑白色和彩色。黑白色指顏色中不包含任何的色彩成分,僅由黑色和白色組成。在RGB顏色模型中,如果R=G=B,那么顏色〔R,G,B〕表示一種黑白顏色;其中R=G=B的值叫做灰度值,所以黑白色又叫做灰度顏色。彩色和灰度之間可以互相轉(zhuǎn)化,由彩色轉(zhuǎn)化為灰度的過程叫做灰度化處理;由灰度化轉(zhuǎn)為彩色的過程稱為偽彩色處理。相應(yīng)地,數(shù)字圖像可分為灰度圖像和彩色圖像。通過灰度化處理和偽彩色處理,可以使偽彩色圖像與灰度圖像相互轉(zhuǎn)化。圖像灰度化就是使彩色的R,G,B分量值相等的過程。二值圖像就是指只有兩個(gè)灰度級(jí)的圖像。在數(shù)字圖像處理中,二值圖像占有非常重要的地位,特別是在實(shí)用的圖像處理中,以二值圖像處理實(shí)現(xiàn)而構(gòu)成的系統(tǒng)是很多的,要進(jìn)行二值圖像的處理與分析,首先要把灰度圖像二值化,得到二值化圖像,這就不再涉及像素的多級(jí)值,使處理變得簡單,而且數(shù)據(jù)的處理和壓縮量小。二值圖像具有存儲(chǔ)空間小,處理速度快。更重要的是,在二值圖像的根底上,還可以進(jìn)一步對(duì)圖像處理,獲得該圖像的一些幾何特征或者其他更多特征。二值化分為全局二值化和局部自適應(yīng)二值化。一幅圖像包括目標(biāo)物體、背景還有噪聲,要想從多值的數(shù)字圖像中直接提取出目標(biāo)物體,最常用的方法就是設(shè)定一個(gè)全局的閾值T,用T將圖像的數(shù)據(jù)分成兩局部:大于T的像素群和小于T的像素群。將大于T的像素群的像素值設(shè)定為白色〔或者黑色〕,小于T的像素群的像素值設(shè)定為黑色〔或者白色〕。這樣就做到了全局二值化。全局二值化在表現(xiàn)圖像細(xì)節(jié)方面存在很大缺陷。為了彌補(bǔ)這個(gè)缺陷,出現(xiàn)了局部二值化方法。局部二值化的方法就是按照一定的規(guī)那么將整幅圖像劃分為N個(gè)窗口,對(duì)這N個(gè)窗口中的每一個(gè)窗口再按照一個(gè)統(tǒng)一的閾值T將該窗口內(nèi)的像素劃分為兩局部,進(jìn)行二值化處理。局部二值化也有一個(gè)缺陷。這個(gè)缺陷存在于那個(gè)統(tǒng)一閾值的選定。這個(gè)閾值是沒有經(jīng)過合理的運(yùn)算得來,一般是取該窗口的平均值。這就導(dǎo)致在每一個(gè)窗口內(nèi)仍然出現(xiàn)的是全局二值化的缺陷。為了解決這個(gè)問題,就出現(xiàn)了局部自適應(yīng)二值化方法。局部自適應(yīng)二值化,該方法就是在局部二值化的根底之上,將閾值的設(shè)定更加合理化。該方法的閾值是通過對(duì)該窗口像素的平均值E、像素之間的差平方P、像素之間的均方根值Q等各種局部特征,設(shè)定一個(gè)參數(shù)方程進(jìn)行閾值的計(jì)算。二值化是圖像處理的根本操作,任何圖像處理根本離不開二值化的操作。其應(yīng)用非常廣泛。2.1.2光照補(bǔ)償在圖像的獲取過程中,由于拍攝環(huán)境的復(fù)雜性,當(dāng)光照條件〔包括強(qiáng)度和光譜組成〕變化時(shí),采集的圖像差異較大,影響圖像的定性和定量分析,因而必須對(duì)圖像進(jìn)行光照補(bǔ)償。光照強(qiáng)度補(bǔ)償主要是消除由于實(shí)際光照條件不均勻,偏光、側(cè)光、高光等導(dǎo)致的過亮、過暗、陰影的影響。在光照強(qiáng)度補(bǔ)償算法中,對(duì)于均勻的光照變化,常使用直方圖均衡法、Gamma校正和對(duì)數(shù)變換等方法;對(duì)于非均勻的光照變化,代表性的方法有基于頻域的同態(tài)濾波方法和雙立方插值法等。同態(tài)濾波能減少光照并銳化邊緣和細(xì)節(jié),廣泛應(yīng)用于不均勻光照以下圖像的補(bǔ)償,且只能直接對(duì)灰度圖像進(jìn)行處理。所以,這里介紹同態(tài)濾波法。圖像f(x,y)可以用它的入射分量i(x,y)與反射分量r(x,y)的乘積來表示,即:f(x,y)=i(x,y)·r(x,y)式(2.1)不均勻光照表達(dá)在入射分量i(x,y)中,屬于變化緩慢的低頻成分;而圖像的細(xì)節(jié)等特性那么主要反映在圖像的反射分量r(x,y)中,屬于高頻成分。對(duì)于照明不均勻的圖像的處理,就是要盡量削減入射分量的影響,即壓制圖像的低頻分量,同時(shí)增強(qiáng)物體的反射分量,即放大圖像的高頻分量[4]。同態(tài)濾波是增強(qiáng)圖像比照度和壓縮圖像亮度范圍的濾波方法,減少低頻成分并增加高頻成分,從而減少光照變化并銳化邊緣或細(xì)節(jié),但不影響圖像像素變化,所以在灰度化之后進(jìn)行同態(tài)濾波,然后才進(jìn)行中值濾波。同態(tài)濾波的主要過程描述如下:(1)首先對(duì)圖像函數(shù)f(x,y)取對(duì)數(shù),lnfx,y=lnf(2)對(duì)上式進(jìn)行傅里葉變換,得到:Flnu,v=FT(3)將上式乘以同態(tài)濾波函數(shù)H(u,v),作濾波處理:Glnu,v=Fln(4)求傅里葉反變換:FT-1Gln(u,v)=(5)最后求指數(shù)變換,得到同態(tài)濾波處理的圖像,即:gx,y=explngi同態(tài)濾波增強(qiáng)圖像的效果與濾波曲線的分布形狀有關(guān),實(shí)際應(yīng)用中,需要根據(jù)不同圖像的特性和增強(qiáng)的需要,選用不同的濾波曲線,可以到達(dá)滿意的效果。同態(tài)濾波過程如圖2.1所示,圖中H(u,v)成為同態(tài)濾波函數(shù)。ff(x,y)對(duì)數(shù)運(yùn)算(log)
離散傅里葉變換(DFT)傅里葉逆變換(IDFT)指數(shù)運(yùn)算(exp)
g(x,y)H(u,v)圖2.1同態(tài)濾波過程根據(jù)圖像特性和需要,選用不同的濾波器傳遞函數(shù)H(u,v),它能以不同的方法影響傅立葉變換的高、低頻成分,同態(tài)濾波函數(shù)關(guān)系如圖2.2所示。圖中:Rh代表高頻增益,R1代表低頻增益,D(u,v)表示頻率(u,v)到濾波器中心(uHH(u,v)D(u,v)RR圖2.2同態(tài)濾波函數(shù)同態(tài)濾波器是通過高通濾波器進(jìn)行修改得到與其對(duì)應(yīng)的同態(tài)濾波器,常用的巴特沃斯同態(tài)濾波器濾波函數(shù)為:Hu,v=Rh式中,D0為〔u0,v0〕=〔0,0〕時(shí)D(u,v)的值,表示截止頻率。常熟c被引入用來控制濾波器函數(shù)斜面的銳化,它在Rh和R1之間過渡,當(dāng)Rh>1、R1<1時(shí),減小低頻和增強(qiáng)高頻,使得動(dòng)態(tài)范圍壓縮和比照2.1.3圖像差分圖像差分運(yùn)算又稱為圖像相減運(yùn)算,常用于檢測(cè)變化及運(yùn)動(dòng)物體。差分方法可以分為控制環(huán)境下的簡單差分方法和基于背景模型的差分方法。在可控制環(huán)境下,或者在很短的時(shí)間內(nèi),可以認(rèn)為背景是固定不變的,可以直接使用差分運(yùn)算檢測(cè)變化或運(yùn)動(dòng)的物體。背景圖像差分是最直接、最簡單的一種方法。差分運(yùn)算的方法是,首先將選定的背景圖片儲(chǔ)存,再計(jì)算目標(biāo)圖像和設(shè)定的場(chǎng)景背景模型的差,然后通過比擬計(jì)算的差和根據(jù)實(shí)際情況設(shè)定的閾值的不同來檢測(cè)目標(biāo),所得結(jié)果直接反映了目標(biāo)的位置、大小、形狀等信息。對(duì)于背景靜止的目標(biāo),圖像的背景差分能很好的實(shí)現(xiàn)目標(biāo)的檢測(cè)。使用背景差分的前提是預(yù)先知道背景,除了直接獲取背景之外,獲取背景還可以使用統(tǒng)計(jì)平均法,它是通過對(duì)連續(xù)的圖像序列進(jìn)行統(tǒng)計(jì)平均來獲得背景的。在攝像機(jī)固定的情況下,背景的變化是緩慢的。比方,當(dāng)背景中固定對(duì)象的移動(dòng)和外界光照條件變化、背景物體出現(xiàn)擾動(dòng)〔如樹枝、樹葉的搖動(dòng)等〕,或者固定的攝像機(jī)出現(xiàn)抖動(dòng)等,概括起來,可分為兩類變化:場(chǎng)景的光照變化和場(chǎng)景構(gòu)成的改變。背景圖像出現(xiàn)變化后,待識(shí)別圖像的背景與背景圖像就不是完全相同的了,而是局部相同。背景圖像發(fā)生緩慢變化情況時(shí),需要對(duì)背景圖像進(jìn)行更新,以消除上述干擾,使得背景圖像也能適應(yīng)后來的圖像的差分運(yùn)算。利用背景估計(jì)算法或高斯模型可以很好地解決背景出現(xiàn)變化的問題。簡單的背景更新算法就是將背景圖像與當(dāng)前幀圖像取均值,將結(jié)果作為新的背景估計(jì),實(shí)際應(yīng)用中往往是給背景圖像和當(dāng)前圖像賦予不同的權(quán)值,求它們的加權(quán)平均。進(jìn)行差分運(yùn)算時(shí),假設(shè)差值小于某個(gè)閾值,那么用該點(diǎn)當(dāng)前像素值更新背景圖像,否那么該點(diǎn)的背景圖像值不變。實(shí)際應(yīng)用中這種方法運(yùn)算量少,對(duì)背景漸變跟蹤較快,但無法應(yīng)對(duì)背景的突變情況,造成誤檢和漏檢[6]。高斯模型就是用高斯概率密度函數(shù)〔正態(tài)分布曲線〕精確地量化事物,將一個(gè)事物分解為假設(shè)干的基于高斯概率密度函數(shù)形成的模型。圖像灰度直方圖可以認(rèn)為是圖像灰度概率密度的估計(jì)。如果圖像所包含的目標(biāo)區(qū)域和背景區(qū)域相比比擬大,且背景區(qū)域和目標(biāo)區(qū)域在灰度上有一定的差異,那么該圖像的灰度直方圖呈現(xiàn)雙峰-谷形狀,其中一個(gè)峰對(duì)應(yīng)于目標(biāo)灰度,另一個(gè)峰對(duì)應(yīng)于背景中心灰度。對(duì)于復(fù)雜的圖像,一般是多峰的,通過將直方圖的多峰特性看作是多個(gè)高斯分布的疊加,可以解決圖像的分割問題。圖像的某點(diǎn)像素值符合前景高斯分布時(shí),就認(rèn)為該點(diǎn)屬于前景目標(biāo);符合背景高斯分布時(shí),就認(rèn)為該點(diǎn)屬于背景,并進(jìn)行背景更新[6]。高斯模型屬于概率統(tǒng)計(jì)模型。背景一般可以分為單模態(tài)和多模態(tài)兩種,前者在每個(gè)背景點(diǎn)上的像素值分布比擬集中,可以用單個(gè)概率分布模型來描述,后者的分布那么比擬分散,需要多個(gè)分布模型來共同描述。自然界中的很多景物和人造物體,如水面的波紋、搖擺的樹枝、飄揚(yáng)的旗幟等,都呈現(xiàn)出多模態(tài)的特性,在多云天氣條件下的交通場(chǎng)景也表現(xiàn)為多模態(tài)特點(diǎn),即背景忽明忽暗。在背景估計(jì)過程中,假設(shè)背景模型中每個(gè)圖像點(diǎn)是獨(dú)立的,并且像素值的分布是位置無關(guān)的,對(duì)它們的處理也是獨(dú)立的[6]。因此高斯模型分為單高斯模型和高斯混合模型兩種。在背景差分的前提下,二者的優(yōu)劣比擬有以下四點(diǎn):(1)單高斯模型需要進(jìn)行初始化,比方在進(jìn)行視頻背景分割時(shí),這意味著如果人體在前幾幀就出現(xiàn)在攝像頭前,人體將會(huì)被初始化為背景,而使模型無法使用;(2)單高斯模型只能進(jìn)行微小性漸變,而不可突變。如戶外亮度隨時(shí)間的漸變是可以適應(yīng)的,如果在明亮的室內(nèi)突然關(guān)燈,單高斯模型就會(huì)將整個(gè)室內(nèi)全部判斷為前景。又如,假設(shè)在監(jiān)控范圍內(nèi)開了一輛車,并在攝像頭下開始停留。由于與模型無法匹配,車會(huì)一直被視為前景。當(dāng)車過很長時(shí)間離去時(shí),由于車停留點(diǎn)的亮度發(fā)生了很大的變化,因此已經(jīng)無法與先前的背景模型相匹配;(3)單高斯模型無法適應(yīng)背景有多個(gè)狀態(tài),如風(fēng)吹的樹葉。單高斯模型無法表示這種情況,而使得前景檢測(cè)混亂,而高斯混合模型能夠很好地描述不同狀態(tài);(4)相對(duì)于單高斯模型的自適應(yīng)變化,混合高斯模型的自適應(yīng)變化要強(qiáng)大的多。它能解決單高斯模型很多不能解決的問題。如無法解決同一樣本點(diǎn)的多種狀態(tài),無法進(jìn)行模型狀態(tài)轉(zhuǎn)化等。很明顯,高斯混合模型的應(yīng)用范圍較單高斯模型更廣,由于具有多個(gè)模型,劃分更為精細(xì),適用于多類別的劃分。2.1.4圖像平滑在圖像的獲取和傳輸過程中原始圖像會(huì)受到各種噪聲的干擾,使圖像質(zhì)量下降。為了抑制噪聲、改善圖像質(zhì)量,要對(duì)圖像進(jìn)行平滑處理。抑制或消除這些噪聲而改善圖像質(zhì)量的過程稱為圖像的平滑。圖像平滑的目的是為了消除噪聲。在圖像處理中的濾波屬于空間濾波,它是一種著眼于灰度的空間分布。常用的方法是運(yùn)用一個(gè)K×K的模板對(duì)全圖像做卷積運(yùn)算。濾波的目的有兩個(gè),一個(gè)是將隨機(jī)空間噪聲平滑掉;二是保持、突出目標(biāo)的某種空間結(jié)構(gòu)??沼?yàn)V波可增強(qiáng)圖像目標(biāo)的信噪比,大局部噪聲,如由紅外成像器件、傳輸通道、A/D轉(zhuǎn)換器等引起的噪聲,通常表現(xiàn)為孤立像素的離散化變化,不是空間相關(guān)的,與它們的相鄰像素顯著不同,這種現(xiàn)象是許多噪聲去除算法的根底。一般情況下,減少噪聲的方法主要有鄰域平均法、中值濾波法、低通濾波法等。(1)鄰域平均法鄰域平均法是一種局部空間域處理的方法,就是對(duì)含有噪聲的原始圖像f(x,y)的每個(gè)像素點(diǎn)取一個(gè)鄰域S,計(jì)算S中所有像素灰度級(jí)的平均值,作為空間域平均處理后圖像g(x,y)的像素值,即g(x,y)=1M(m,n∈S)f(m,n)式(式中f(x,y)為N×N的陣列;x,y=0,1,2,…,N-1;S是以(x,y)點(diǎn)為中心的鄰域的集合,M為鄰域S中的像素點(diǎn)數(shù),S鄰域可取四點(diǎn)鄰域或八點(diǎn)鄰域(如圖2.3)。圖2.3四點(diǎn)領(lǐng)域和八點(diǎn)領(lǐng)域(2)中值濾波法中值濾波法是一種非線性平滑技術(shù),是基于排序統(tǒng)計(jì)理論的一種能有效噪聲的非線性信號(hào)處理技術(shù),根本原理是把數(shù)字圖像或數(shù)字序列中一點(diǎn)的值用該點(diǎn)的一個(gè)鄰域中各點(diǎn)值的中值代替,讓周圍的像素值接近真實(shí)值,從而消除孤立的噪聲點(diǎn)。中值濾波是一種非線性濾波,由于它在實(shí)際運(yùn)算過程中并不需要圖像的統(tǒng)計(jì)特性,所以比擬方便。中值濾波首先是被應(yīng)用在一維信號(hào)處理技術(shù)中,后來被二維圖像信號(hào)處理技術(shù)所應(yīng)用。在一定的條件下,可以克服線性濾波器所帶來的圖像細(xì)節(jié)模糊,而且對(duì)濾除脈沖干擾及圖像掃描噪聲最為有效,但對(duì)于線、尖頂?shù)燃?xì)節(jié)多的圖像不宜采用中值濾波。使用二維中值濾波最值得注意的是保持圖像中有效的細(xì)線狀物體。與平均濾波器相比,中值濾波器從總體上來說,能夠較好地保存原圖像中的躍變局部。(3)低通濾波法圖像經(jīng)過傅里葉變換以后,噪聲頻譜一般位于空間頻率較高的區(qū)域,而圖像本身的頻率分量那么處于空間頻率較低的區(qū)域內(nèi),因此可以通過低通濾波的方法,使高頻成分受到抑制,而使低頻成分順利通過,從而實(shí)現(xiàn)圖像的平滑。低通濾波可以在空間域和頻域中進(jìn)行。eq\o\ac(○,1)空間域低通濾波。在空間域中實(shí)現(xiàn)低通濾波是采用離散卷積,與高通濾波所用卷積表達(dá)式相同,即為式(2.9)式中輸出圖像g(m1,m2)是M×M方陣,輸入圖像f(n1,n2eq\o\ac(○,2)頻域低通濾波。這是一種頻域處理法。對(duì)于一幅圖像,它的邊緣、細(xì)節(jié)、跳躍局部以及噪聲都代表圖像的高頻分量,而大面積的背景區(qū)和緩慢變化局部那么代表圖像的低頻分量,用頻域低通濾波法除去其高頻分量就能去掉噪聲,從而得到平滑。2.1.5圖像銳化在圖像增強(qiáng)過程中,通常利用各類圖像平滑算法消除噪聲,圖像的常見噪聲主要有加性噪聲、乘性噪聲和量化噪聲等。一般來說,圖像的能量主要集中在其低頻局部,噪聲所在的頻段主要在高頻段,同時(shí)圖像邊緣信息也主要集中在其高頻局部。這將導(dǎo)致原始圖像在平滑處理之后,圖像邊緣和圖像輪廓模糊的情況出現(xiàn)。為了減少這類不利效果的影響,就需要利用圖像銳化技術(shù),使圖像的邊緣變得清晰。圖像銳化處理的目的是為了使圖像的邊緣、輪廓線以及圖像的細(xì)節(jié)變得清晰,經(jīng)過平滑的圖像變得模糊的根本原因是因?yàn)閳D像受到了平均或積分運(yùn)算,因此可以對(duì)其進(jìn)行逆運(yùn)算(如微分運(yùn)算)就可以使圖像變得清晰。從頻率域來考慮,圖像模糊的實(shí)質(zhì)是因?yàn)槠涓哳l分量被衰減,因此可以用高通濾波器來使圖像清晰。但要注意能夠進(jìn)行銳化處理的圖像必須有較高的性噪比,否那么銳化后圖像性噪比反而更低,從而使得噪聲增加的比信號(hào)還要多,因此一般是先去除或減輕噪聲后再進(jìn)行銳化處理。圖像銳化算子有一階微分算子和二階微分算子。其中一階微分算子主要有Robert梯度算子、Prewitt梯度算子、Sobel算子;二階導(dǎo)數(shù)算子為Laplacian算子。(1)一階微分算子一階微分主要指梯度模運(yùn)算,利用一階導(dǎo)數(shù)檢測(cè)邊緣點(diǎn)的方法就稱為梯度算子法。圖像的梯度值包含了邊界及細(xì)節(jié)信息,梯度值正比于像素之差。對(duì)于一幅圖像中突出的邊緣區(qū),其梯度值較大;在平滑區(qū)域梯度值??;對(duì)于灰度級(jí)為常數(shù)的區(qū)域,梯度為零。eq\o\ac(○,1)Robert梯度算子Robert梯度就是采用對(duì)角方向相鄰兩像素之差,故也稱為四點(diǎn)差分法,即用4點(diǎn)進(jìn)行差分,以求得梯度。其缺點(diǎn)是對(duì)噪聲較敏感,常用于不含噪聲的圖像邊緣點(diǎn)檢測(cè)。梯度算子類邊緣檢測(cè)方法的效果類似于高通濾波,有增強(qiáng)高頻分量,抑制低頻分量的作用。eq\o\ac(○,2)Prewitt梯度算子〔平均差分法〕因?yàn)槠骄軠p少或消除噪聲,Prewitt梯度算子法就是先求平均,再求差分來求梯度。利用檢測(cè)模板可求得水平和垂直方向的梯度,再通過梯度合成和邊緣點(diǎn)判定,就可得到平均差分法的檢測(cè)結(jié)果。eq\o\ac(○,3)Sobel算子〔加權(quán)平均差分法〕Sobel算子就是對(duì)當(dāng)前行或列對(duì)應(yīng)的值加權(quán)后,再進(jìn)行平均和差分,也稱為加權(quán)平均差分。Sobel算子和Prewitt算子一樣,都在檢測(cè)邊緣點(diǎn)的同時(shí)具有抑制噪聲的能力,檢測(cè)出的邊緣寬度至少為二像素。由于它們都是先平均后差分,平均時(shí)會(huì)喪失一些細(xì)節(jié)信息,使邊緣有一定的模糊。但由于Sobel算子的加權(quán)作用,其使邊緣的模糊程度要稍低于程度要稍低于Prewitt算子。(2)二階導(dǎo)數(shù)算子對(duì)于階躍狀邊緣,其二階導(dǎo)數(shù)在邊緣點(diǎn)處出現(xiàn)過零交叉,即邊緣點(diǎn)兩旁的二階導(dǎo)數(shù)取異號(hào),據(jù)此可以通過二階導(dǎo)數(shù)來檢測(cè)邊緣點(diǎn)。這里主要介紹Laplacian算子。對(duì)數(shù)字圖像f(m,n),用差分代替二階偏導(dǎo),那么Laplacian算子為:Gi,j=4fLaplacian算子是最簡單的各向同性微分算子,具有旋轉(zhuǎn)不變性,比擬適用于改善因?yàn)楣饩€的漫反射造成的圖像模糊。經(jīng)過推導(dǎo)可以發(fā)現(xiàn)當(dāng)圖像的模糊是由光的漫反射造成時(shí),不模糊圖像等于模糊圖像減去它的拉普拉斯變換的常數(shù)倍。另外,人們還發(fā)現(xiàn),即使模糊不是由于光的漫反射造成的,對(duì)圖像進(jìn)行拉普拉斯變換也可以使圖像更清晰。Laplacian銳化的一維處理表達(dá)式是:式(2.11)在二維情況下,Laplacian算子使走向不同的輪廓能夠在垂直的方向上具有類似于一維那樣的銳化效應(yīng)。綜上所述,首先,圖像過渡的邊緣(也就是沿整個(gè)斜坡),一階微分都不為零,經(jīng)過二階微分后,非零值只出現(xiàn)在抖坡的起始處和終點(diǎn)處??梢缘贸鼋Y(jié)論:一階微分產(chǎn)生較粗的邊緣,二階微分那么細(xì)。其次,孤立的噪聲點(diǎn)。在孤立點(diǎn)及其周圍點(diǎn),二階微分比一階微分響應(yīng)要強(qiáng)。第三,細(xì)線,也是一種細(xì)節(jié)。對(duì)線的響應(yīng)要比對(duì)階梯強(qiáng),且點(diǎn)比線強(qiáng)。所以,可以總結(jié)出一階微分和二階微分的區(qū)別:(1)一階微分處理通常會(huì)產(chǎn)生較寬的邊緣,二階微分處理得到的邊緣那么細(xì);(2)二階微分處理對(duì)細(xì)節(jié)有較強(qiáng)的響應(yīng),如細(xì)線和孤立點(diǎn);(3)一階微分處理一般對(duì)灰度階梯有較強(qiáng)的響應(yīng);(4)二階微分處理對(duì)灰度級(jí)階梯變化產(chǎn)生雙響應(yīng);(5)二階微分在圖像中灰度值變化相似時(shí),對(duì)線的響應(yīng)要比對(duì)階梯強(qiáng),且點(diǎn)比線強(qiáng)。大多數(shù)應(yīng)用中,對(duì)圖像增強(qiáng)來說,二階微分處理比一階微分好,因?yàn)樾纬杉?xì)節(jié)的能力強(qiáng),而一階微分處理主要用于提取邊緣。2.1.6邊緣檢測(cè)圖像的邊緣是圖像的重要特征之一,數(shù)字圖像的邊緣檢測(cè)是圖像分割、目標(biāo)區(qū)域識(shí)別、區(qū)域形狀提取等圖像分析領(lǐng)域十分重要的根底,其目的是精確定位邊緣,同時(shí)較好地抑制噪聲,因此邊緣檢測(cè)是機(jī)器視覺系統(tǒng)中必不可少的重要環(huán)節(jié)。所謂邊緣是指圖像局部特性的不連續(xù)性,是圖像局部強(qiáng)度變化最顯著的局部?;叶然蚪Y(jié)構(gòu)等信息的突變處稱為邊緣,例如:灰度級(jí)的突變,顏色的突變,紋理結(jié)構(gòu)的突變等。邊緣是一個(gè)區(qū)域的結(jié)束,也是另一個(gè)區(qū)域的開始,利用該特征可以分割圖像。邊緣主要存在于目標(biāo)與目標(biāo)、目標(biāo)與背景、區(qū)域與區(qū)域(包括不同色彩)之間,是圖像分割、紋理特征和形狀特征等圖像分析的重要根底。圖像分析和理解的第一步常常是邊緣檢測(cè)。邊緣檢測(cè)的實(shí)質(zhì)是采用某種算法來提取出圖像中對(duì)象與背景間的交界線。圖像灰度的變化情況可以用圖像灰度分布的梯度來反映,因此可以用局部圖像微分技術(shù)來獲取邊緣檢測(cè)算子。經(jīng)典的邊緣檢測(cè)方法是對(duì)原始圖像中的像素的某個(gè)鄰域來構(gòu)造邊緣檢測(cè)算子。目前,提取邊緣常用邊緣算子法、曲面擬合法、模板匹配法等。這里只介紹邊緣檢測(cè)算子法。在圖像銳化局部曾經(jīng)討論過,梯度算子,特別是Robert算子等,可以對(duì)邊緣進(jìn)行提取,這里再介紹一下Canny算子和LoG算子。Canny邊緣檢測(cè)算子在灰度圖像中得到廣泛應(yīng)用。根據(jù)邊緣檢測(cè)的有效性和定位的可靠性,Canny研究了最優(yōu)邊緣檢測(cè)器所需的特性,推導(dǎo)出最優(yōu)邊緣檢測(cè)器的數(shù)學(xué)表達(dá)式。對(duì)于各種類型的邊緣,Canny邊緣檢測(cè)算子的最優(yōu)形式是不同的。Canny給出了評(píng)價(jià)邊緣檢測(cè)性能優(yōu)劣的三個(gè)指標(biāo):好的信噪比;好的定位性能;對(duì)單一邊緣僅有唯一響應(yīng)。Canny首次將上述判據(jù)用數(shù)學(xué)的形式表示出來,然后采用最優(yōu)化數(shù)值方法,得到了對(duì)應(yīng)給定邊緣類型的最正確邊緣檢測(cè)模板。對(duì)于二維圖像,需要使用假設(shè)干方向的模板分別對(duì)圖像進(jìn)行卷積處理,再取最可能的邊緣方向。Canny所提出的邊緣檢測(cè)方法屬于先平滑然后求導(dǎo)數(shù)的方法。主要由以下步驟實(shí)現(xiàn):eq\o\ac(○,1)圖像平滑。Canny建議用高斯函數(shù)進(jìn)行圖像平滑:高斯函數(shù):Gx,y=exp-x圖像卷積:IGx,y=Gx,y其中:是一個(gè)尺度參數(shù),越小,那么函數(shù)越“集中〞,即僅在一個(gè)很小的局部范圍內(nèi)平滑,越大,那么表示圖像在一個(gè)較大的范圍內(nèi)進(jìn)行平滑;I(x,y)為原始圖像。eq\o\ac(○,2)邊緣點(diǎn)定位。Canny指出用梯度方向的二階導(dǎo)數(shù)的零交叉作為判別邊緣點(diǎn)的準(zhǔn)那么。假設(shè)該點(diǎn)滿足以下條件,那么該點(diǎn)為邊緣點(diǎn):?2G?α其中:為平滑的梯度方向:α=tan-1?Ieq\o\ac(○,3)邊緣強(qiáng)度假設(shè)某像素滿足邊緣定位條件,那么該像素的邊緣強(qiáng)度為:式(2.16)利用圖像強(qiáng)度二階導(dǎo)數(shù)的零交叉點(diǎn)來求邊緣點(diǎn)的算法很容易受到噪聲干擾,所以在邊緣檢測(cè)前濾除噪聲是十分必要的。為此產(chǎn)生了LoG(LaplacianofGaussian)算法,也稱之為拉普拉斯高斯算法。它的根本特征有:eq\o\ac(○,1)平滑濾波器是高斯濾波器;eq\o\ac(○,2)增強(qiáng)步驟采用二階導(dǎo)數(shù)(二維拉普拉斯函數(shù));eq\o\ac(○,3)邊緣檢測(cè)判據(jù)是二階導(dǎo)數(shù)零交叉點(diǎn)并對(duì)應(yīng)一階導(dǎo)數(shù)的較大峰值;eq\o\ac(○,4)使用線性內(nèi)插方法在子象素分辨率水平上估計(jì)邊緣的位置。常用的LoG算子是5×5的模板,如以下圖2.4所示:圖2.4拉普拉斯算子卷積模板模板中各點(diǎn)到中心點(diǎn)的距離與位置加權(quán)系數(shù)的關(guān)系如圖2.5所示。圖2.5LOG到中心點(diǎn)的距離與位置加權(quán)系數(shù)的關(guān)系曲線由于圖像的平滑會(huì)引起邊緣的模糊。LoG算法中的高斯平滑運(yùn)算會(huì)導(dǎo)致圖像中邊緣和其他鋒利不連續(xù)局部的模糊。值越大,噪聲濾波效果越好,但同時(shí)會(huì)喪失一些重要的邊緣信息;值小時(shí)又會(huì)平滑不完全而留有太多噪聲。只有當(dāng)兩者結(jié)合的很好時(shí)才能較好地檢測(cè)出圖像的最正確邊緣。2.2形態(tài)處理數(shù)學(xué)形態(tài)學(xué)是由一組形態(tài)學(xué)的代數(shù)運(yùn)算子組成的,它的根本運(yùn)算有4個(gè):膨脹〔或擴(kuò)張〕、腐蝕〔或侵蝕〕、開運(yùn)算和閉運(yùn)算,它們?cè)诙祱D像和灰度圖像中各有特點(diǎn)?;谶@些根本運(yùn)算還可推導(dǎo)和組合成各種數(shù)學(xué)形態(tài)學(xué)實(shí)用算法,用它們可以進(jìn)行圖像形狀和結(jié)構(gòu)的分析及處理。形態(tài)學(xué)圖像處理表現(xiàn)為一種鄰域運(yùn)算形式;一種特殊定義的鄰域稱之為“結(jié)構(gòu)元素〞〔結(jié)構(gòu)元素是指具有某種確定形狀的根本結(jié)構(gòu)元素,例如一定大小的矩形等〕,在每個(gè)像素位置上它與二值圖像對(duì)應(yīng)的區(qū)域進(jìn)行特定的邏輯運(yùn)算,邏輯運(yùn)算的結(jié)果為輸出圖像的相應(yīng)像素。膨脹是將與目標(biāo)區(qū)域接觸的背景點(diǎn)合并到該目標(biāo)物中,是目標(biāo)邊界向外部擴(kuò)張的處理。膨脹可以用來填補(bǔ)目標(biāo)區(qū)域中存在的某些空洞,以及消除包含在目標(biāo)區(qū)域中的小顆粒噪聲。通常是用以連接間斷的線或?qū)⒁蚨祷幚?,使原本?yīng)該在一起的區(qū)域被間斷開的區(qū)域重新連接時(shí)采用。簡單說,就是將間斷的輪廓線連在一起,并將其中的空點(diǎn)填充。腐蝕處理是膨脹處理的對(duì)偶,是消除邊界點(diǎn),使邊界向內(nèi)部收縮的過程??梢杂脕硐《覠o意義的目標(biāo)物。如果兩目標(biāo)物之間有細(xì)小的連通,可以選取足夠大的結(jié)構(gòu)元素,將細(xì)小連通腐蝕掉。腐蝕處理通常在去除小顆粒噪聲以及消除目標(biāo)物之間的粘連是非常有效的。腐蝕處理可以表示成用結(jié)構(gòu)元素對(duì)圖像進(jìn)行探測(cè),找出圖像中可以放下該結(jié)構(gòu)元素的區(qū)域,而膨脹處理可以理解成是對(duì)圖像的補(bǔ)集進(jìn)行腐蝕處理。開運(yùn)算即使用同一個(gè)結(jié)構(gòu)元素對(duì)圖像進(jìn)行先腐蝕再膨脹的運(yùn)算,在結(jié)構(gòu)元素S下的開運(yùn)算定義為:F°S=F?S?S式(2.1開運(yùn)算通常用來消除小對(duì)象物、在纖細(xì)點(diǎn)處別離物體、平滑較大物體的邊界的同時(shí)并不明顯改變其面積。開運(yùn)算可以去除小顆粒噪聲,以及斷開目標(biāo)物之間的粘連,主要作用與腐蝕處理相似,但與腐蝕處理相比,優(yōu)點(diǎn)是可以根本保持目標(biāo)原有大小不變。閉運(yùn)算是使用同一個(gè)結(jié)構(gòu)元素對(duì)圖像先膨脹再腐蝕的運(yùn)算,在結(jié)構(gòu)元素S下的閉運(yùn)算定義為:F?S=F?S?S式(2.1閉運(yùn)算通常用來填充目標(biāo)內(nèi)細(xì)小空洞、連接斷開的臨近目標(biāo)、平滑其邊界的同時(shí)不明顯改變其面積。閉運(yùn)算與膨脹處理的作用相似,與膨脹處理相比,可以根本保持目標(biāo)原有大小不變。2.3圖像的識(shí)別圖像識(shí)別多用統(tǒng)計(jì)方法,以數(shù)學(xué)的決策理論為根底,建立統(tǒng)計(jì)學(xué)識(shí)別模型。根本方法是在對(duì)研究的圖像進(jìn)行大量的統(tǒng)計(jì)分析,找出規(guī)律性認(rèn)識(shí),抽取出反響圖像本質(zhì)特點(diǎn)的特征進(jìn)行識(shí)別。這其中的主要工作在于如何抽取圖像的特征或決定統(tǒng)計(jì)參數(shù),必須把圖像的大量信息縮減為少數(shù)的特征。為了抽取特征,有時(shí)要對(duì)原始圖像信息進(jìn)行各種變換,把多維的圖像點(diǎn)簡化為較低的維數(shù)。在圖像識(shí)別領(lǐng)域,文字識(shí)別的研究最為深入,取得的成果也較大。除了統(tǒng)計(jì)方法識(shí)別外,近年來模糊數(shù)學(xué)和神經(jīng)網(wǎng)絡(luò)在圖像識(shí)別方面也有了廣泛應(yīng)用。2.4小結(jié)本章主要介紹了圖像識(shí)別的一些關(guān)鍵技術(shù)的原理,為下一章論述基于數(shù)字圖像處理的障礙物識(shí)別打好理論根底。下一章將著重介紹基于數(shù)字圖像處理的障礙物識(shí)別的原理和相關(guān)算法,并在MATLAB中進(jìn)行仿真。3基于數(shù)字圖像處理的障礙物識(shí)別障礙物的檢測(cè)識(shí)別作為圖像識(shí)別的重要內(nèi)容,利用計(jì)算機(jī)對(duì)獲得的圖像進(jìn)行分析和提取其中的目標(biāo)信息,到達(dá)識(shí)別障礙物的目的。由于受距離、復(fù)雜環(huán)境及技術(shù)條件的限制,拍攝的圖像一般都較復(fù)雜,這為置于背景下目標(biāo)的提取及識(shí)別帶來了較大的困難。通過對(duì)圖像識(shí)別系統(tǒng)的學(xué)習(xí)和分析,本章利用圖像識(shí)別的技術(shù)到達(dá)對(duì)障礙物的識(shí)別的主要目的,以路面及路面車輛的圖像為例,在正常光照條件下進(jìn)行識(shí)別。3.1仿真環(huán)境簡介MATLAB是由美國Mathworks公司發(fā)布的主要面對(duì)科學(xué)計(jì)算、可視化以及交互式程序設(shè)計(jì)的高科技計(jì)算環(huán)境。它將數(shù)值分析、矩陣計(jì)算、科學(xué)數(shù)據(jù)可視化以及非線性動(dòng)態(tài)系統(tǒng)的建模和仿真等諸多強(qiáng)大功能集成在一個(gè)易于使用的視窗環(huán)境中,為科學(xué)研究、工程設(shè)計(jì)以及必須進(jìn)行有效數(shù)值計(jì)算的眾多科學(xué)領(lǐng)域提供了一種全面的解決方案,并在很大程度上擺脫了傳統(tǒng)非交互式程序設(shè)計(jì)語言〔如C、Fortran〕的編輯模式,代表了當(dāng)今國際科學(xué)計(jì)算軟件的先進(jìn)水平。用MATLAB進(jìn)行科技編程相對(duì)于傳統(tǒng)的科技編程語言有諸多的優(yōu)點(diǎn)。主要包括:(1)友好的工作平臺(tái)編程環(huán)境。MATLAB由一系列工具組成。這些工具方便用戶使用MATLAB的函數(shù)和文件,其中許多工具采用的是圖形用戶界面。包括MATLAB桌面和命令窗口、歷史命令窗口、編輯器和調(diào)試器、路徑搜索和用于用戶瀏覽幫助、工作空間、文件的瀏覽器。隨著MATLAB的商業(yè)化以及軟件本身的不斷升級(jí),MATLAB的用戶界面也越來越精致,更加接近Windows的標(biāo)準(zhǔn)界面,人機(jī)交互性更強(qiáng),操作更簡單。而且新版本的MATLAB提供了完整的聯(lián)機(jī)查詢、幫助系統(tǒng),極大的方便了用戶的使用。簡單的編程環(huán)境提供了比擬完備的調(diào)試系統(tǒng),程序不必經(jīng)過編譯就可以直接運(yùn)行,而且能夠及時(shí)地報(bào)告出現(xiàn)的錯(cuò)誤及進(jìn)行出錯(cuò)原因分析。(2)簡單易用的程序語言。MATLAB是一個(gè)高級(jí)的矩陣/陣列語言,它包含控制語句、函數(shù)、數(shù)據(jù)結(jié)構(gòu)、輸入和輸出和面向?qū)ο缶幊烫攸c(diǎn)。用戶可以在命令窗口中將輸入語句與執(zhí)行命令同步,也可以先編寫好一個(gè)較大的復(fù)雜的應(yīng)用程序〔M文件〕后再一起運(yùn)行。新版本的MATLAB語言是基于最為流行的C++語言根底上的,因此語法特征與C++語言極為相似,而且更加簡單,更加符合科技人員對(duì)數(shù)學(xué)表達(dá)式的書寫格式。使之更利于非計(jì)算機(jī)專業(yè)的科技人員使用。而且這種語言可移植性好、可拓展性極強(qiáng),這也是MATLAB能夠深入到科學(xué)研究及工程計(jì)算各個(gè)領(lǐng)域的重要原因。(3)強(qiáng)大的科學(xué)計(jì)算機(jī)數(shù)據(jù)處理能力。MATLAB是一個(gè)包含大量計(jì)算算法的集合。其擁有600多個(gè)工程中要用到的數(shù)學(xué)運(yùn)算函數(shù),可以方便的實(shí)現(xiàn)用戶所需的各種計(jì)算功能。函數(shù)中所使用的算法都是科研和工程計(jì)算中的最新研究成果,而前經(jīng)過了各種優(yōu)化和容錯(cuò)處理。在通常情況下,可以用它來代替底層編程語言,如C和C++。在計(jì)算要求相同的情況下,使用MATLAB的編程工作量會(huì)大大減少。MATLAB的這些函數(shù)集包括從最簡單最根本的函數(shù)到諸如矩陣,特征向量、快速傅立葉變換的復(fù)雜函數(shù)。函數(shù)所能解決的問題其大致包括矩陣運(yùn)算和線性方程組的求解、微分方程及偏微分方程的組的求解、符號(hào)運(yùn)算、傅立葉變換和數(shù)據(jù)的統(tǒng)計(jì)分析、工程中的優(yōu)化問題、稀疏矩陣運(yùn)算、復(fù)數(shù)的各種運(yùn)算、三角函數(shù)和其他初等數(shù)學(xué)運(yùn)算、多維數(shù)組操作以及建模動(dòng)態(tài)仿真等。(4)出色的圖形處理功能。MATLAB自產(chǎn)生之日起就具有方便的數(shù)據(jù)可視化功能,以將向量和矩陣用圖形表現(xiàn)出來,并且可以對(duì)圖形進(jìn)行標(biāo)注和打印。高層次的作圖包括二維和三維的可視化、圖象處理、動(dòng)畫和表達(dá)式作圖??捎糜诳茖W(xué)計(jì)算和工程繪圖。新版本的MATLAB對(duì)整個(gè)圖形處理功能作了很大的改良和完善,使它不僅在一般數(shù)據(jù)可視化軟件都具有的功能方面更加完善,而且對(duì)于一些其他軟件所沒有的功能〔例如圖形的光照處理、色度處理以及四維數(shù)據(jù)的表現(xiàn)等〕,MATLAB同樣表現(xiàn)了出色的處理能力。同時(shí)對(duì)一些特殊的可視化要求,例如圖形對(duì)話等,MATLAB也有相應(yīng)的功能函數(shù),保證了用戶不同層次的要求。另外新版本的MATLAB還著重在圖形用戶界面〔GUI〕的制作上作了很大的改善,對(duì)這方面有特殊要求的用戶也可以得到滿足。(5)應(yīng)用廣泛的模塊集合工具箱。MATLAB對(duì)許多專門的領(lǐng)域都開發(fā)了功能強(qiáng)大的模塊集和工具箱。一般來說,它們都是由特定領(lǐng)域的專家開發(fā)的,用戶可以直接使用工具箱學(xué)習(xí)、應(yīng)用和評(píng)估不同的方法而不需要自己編寫代碼。目前,MATLAB已經(jīng)把工具箱延伸到了科學(xué)研究和工程應(yīng)用的諸多領(lǐng)域,諸如數(shù)據(jù)采集、數(shù)據(jù)庫接口、概率統(tǒng)計(jì)、樣條擬合、優(yōu)化算法、偏微分方程求解、神經(jīng)網(wǎng)絡(luò)、小波分析、信號(hào)處理、圖像處理、系統(tǒng)辨識(shí)、控制系統(tǒng)設(shè)計(jì)、LMI控制、魯棒控制、模型預(yù)測(cè)、模糊邏輯、金融分析、地圖工具、非線性控制設(shè)計(jì)、實(shí)時(shí)快速原型及半物理仿真、嵌入式系統(tǒng)開發(fā)、定點(diǎn)仿真、DSP與通訊、電力系統(tǒng)仿真等,都在工具箱〔Toolbox〕家族中有了自己的一席之地。(6)實(shí)用的程序接口和發(fā)布平臺(tái)。新版本的MATLAB可以利用MATLAB編譯器和C/C++數(shù)學(xué)庫和圖形庫,將自己的MATLAB程序自動(dòng)轉(zhuǎn)換為獨(dú)立于MATLAB運(yùn)行的C和C++代碼。允許用戶編寫可以和MATLAB進(jìn)行交互的C或C++語言程序。另外,MATLAB網(wǎng)頁效勞程序還容許在Web應(yīng)用中使用自己的MATLAB數(shù)學(xué)和圖形程序。MATLAB的一個(gè)重要特色就是具有一套程序擴(kuò)展系統(tǒng)和一組稱之為工具箱的特殊應(yīng)用子程序。工具箱是MATLAB函數(shù)的子程序庫,每一個(gè)工具箱都是為某一類學(xué)科專業(yè)和應(yīng)用而定制的,主要包括信號(hào)處理、控制系統(tǒng)、神經(jīng)網(wǎng)絡(luò)、模糊邏輯、小波分析和系統(tǒng)仿真等方面的應(yīng)用。(7)應(yīng)用軟件開發(fā)〔包括用戶界面〕。在開發(fā)環(huán)境中,使用戶更方便地控制多個(gè)文件和圖形窗口;在編程方面支持了函數(shù)嵌套,有條件中斷等;在圖形化方面,有了更強(qiáng)大的圖形標(biāo)注和處理功能,包括對(duì)性對(duì)起連接注釋等;在輸入輸出方面,可以直接向Excel和HDF5進(jìn)行連接。MATLAB的根本數(shù)據(jù)單位是矩陣,它的指令表達(dá)式與數(shù)學(xué)、工程中常用的形式十分相似,故用MATLAB來解算問題要比用C、FORTRAN等語言完成相同的事情簡捷得多,并且MATLAB也吸收了像Maple等軟件的優(yōu)點(diǎn),使MATLAB成為一個(gè)強(qiáng)大的數(shù)學(xué)軟件。在新的版本中也參加了對(duì)C、FORTRAN、C++、JAVA的支持??梢灾苯诱{(diào)用,用戶也可以將自己編寫的實(shí)用程序?qū)氲組ATLAB函數(shù)庫中方便自己以后調(diào)用,此外許多的MATLAB愛好者都編寫了一些經(jīng)典的程序,用戶可以直接進(jìn)行下載就可以用。3.2預(yù)處理圖像預(yù)處理環(huán)節(jié),主要采用了灰度化、中值濾波、Robert梯度算子銳化及邊緣檢測(cè)。為下一環(huán)節(jié)的圖像差分和膨脹處理做準(zhǔn)備。灰度化圖像灰度化就是使彩色的R,G,B分量值相等的過程。由于R,G,B的取值范圍是[0,255],所以灰度的級(jí)別只有256級(jí),即灰度圖像僅能表現(xiàn)256種顏色〔灰度〕?;叶然奶幚矸椒ㄖ饕腥缦?種:(1)最大值法:使R,G,B的值等于3值中最大的一個(gè),即R=G=B=max(R,G,,B)式(3.1)顯然,最大值法會(huì)形成亮度很高的灰度圖像。(2)平均值法:使R,G,B的值求出平均值,即R=G=B=R+G+B3式(3.2平均值法會(huì)形成比擬柔和的灰度圖像。(3)加權(quán)平均值法:根據(jù)重要性或其他指標(biāo)給R,G,B賦予不同的權(quán)值,并使R,G,B的值加權(quán)平均,即R=G=B=WrR+W其中Wr,Wg,Wb分別為R,G,B的權(quán)值。Wr,Wg,Wb取不同的值,加權(quán)平均值法就形成不同的灰度圖像。由于人眼對(duì)綠色的敏感度最高,紅色次之,對(duì)藍(lán)色最低,因此使Wr>Wg>WVgray=0.30R+0.59G+0.11B式時(shí),能得到最合理的灰度圖像。MATLAB中,RGB模式的圖像進(jìn)行灰度化處理時(shí),調(diào)用函數(shù)語句為:I=imread('*.bmp');J=rgb2gray(I);即可實(shí)現(xiàn)對(duì)彩色圖像的灰度化處理,為后續(xù)工作做好準(zhǔn)備。3.2.2背景差分目標(biāo)分割要對(duì)圖像進(jìn)行差分處理,以獲得目標(biāo)區(qū)域,克服噪聲影響。背景差分即是將當(dāng)前圖像與背景圖像的對(duì)應(yīng)像素值相減,再對(duì)差值取絕對(duì)值后輸出,得到包含有目標(biāo)信息的圖像。背景差分需要設(shè)定一個(gè)閾值,將亮度大于閾值的點(diǎn)作為目標(biāo)點(diǎn),反之作為背景點(diǎn),從而得到目標(biāo)區(qū)域,這種方法適合用來在背景圖像較為穩(wěn)定的情況下檢測(cè)目標(biāo)。閾值選取方法分為固定閾值和自適應(yīng)閾值。固定閾值是一個(gè)常數(shù),當(dāng)圖像使用固定閾值得不到有效分割時(shí),就使用自適應(yīng)閾值進(jìn)行處理。自適應(yīng)閾值是圖像灰度值的函數(shù),隨圖像灰度值分布的不同而調(diào)整,適用于亮度不均的圖像。對(duì)于靜態(tài)場(chǎng)景,使用固定閾值即可得到有效分割。通過分析背景圖像的灰度值,閾值的選取公式為:T=μ+K×σ式(3.5)其中,μ為背景均值,σ為背景標(biāo)準(zhǔn)差,K一般取3~5,。閾值處理的公式如下:gx,y=1f(x,y)>T其中,g(x,y)表示閾值處理后的二值圖像,T表示閾值,f(x,y)為待處理圖像的灰度值。本文選取的圖像是靜態(tài)的,背景圖像是直接獲取的,所以選用固定閾值。經(jīng)過分析背景圖像的灰度值,閾值T=0.2。在背景差分時(shí),為了應(yīng)對(duì)非道路局部的變化〔如光照緩慢變化、路旁樹枝的搖動(dòng)、草地上出現(xiàn)行人等〕,由于實(shí)際場(chǎng)景中這些變化不一定會(huì)單獨(dú)出現(xiàn),所以單高斯模型無法應(yīng)對(duì)這樣的背景變化,所以選用高斯混合模型對(duì)背景圖像進(jìn)行更新,以應(yīng)對(duì)背景場(chǎng)景出現(xiàn)的干擾,保證差分后圖像只出現(xiàn)待識(shí)別的目標(biāo)圖像。高斯混合模型使用K〔一般為3~5〕個(gè)高斯模型來表征圖像中各個(gè)像素點(diǎn)的特征,統(tǒng)計(jì)圖像中相同像素點(diǎn)的最近t幀值Xt,式(3.7)式中,μi表示該像素點(diǎn)顏色值的R、G、B分量;權(quán)值ωi≥0;i=1,2,…,k。k個(gè)高斯分布總是按照優(yōu)先級(jí)λi,t=ωi,tσi,t2(對(duì)某像素點(diǎn)的每個(gè)樣本更新點(diǎn)Xt+1,判斷其與已存在的K個(gè)高斯分布進(jìn)行匹配,假設(shè)滿足條件Xt+1-μt<2.5σi,那么Xt+1高斯分布的權(quán)重、均值和方差分別按照式(3.8)、式(3.9)和式(3.10)更新。對(duì)于匹配的分布Mi,t+1=1;否那么ωi,t+1=μi,t+1=1-ρμi,t其中,ρ=αωi,t+1。高斯模型更新完畢之后,重新排列優(yōu)先級(jí)λi,t式(3.11)式(3.12)該模型中有兩個(gè)重要參數(shù)α和H,其中1/α表示訓(xùn)練P(Xt)的最大樣本空間中的樣本點(diǎn)個(gè)數(shù);H用來確定作為背景模型的分布算法總體的流程如下:(1)計(jì)算當(dāng)前像素值是否歸屬于存在的正態(tài)分布中的某一個(gè);(2)假設(shè)找到一個(gè)匹配,那么更新每個(gè)分布的權(quán)值ω,引入一個(gè)學(xué)習(xí)參數(shù)α,其大小由噪聲水平?jīng)Q定,更新公式為:ωt(3)假設(shè)沒有找到任何匹配,那么認(rèn)為當(dāng)前像素值屬于前景,并用一個(gè)新的正態(tài)分布取代排序在最后面的正態(tài)分布。新的正態(tài)分布ωtωt=在具體實(shí)驗(yàn)中,通常把n個(gè)分布中ωσ在進(jìn)行背景差分后二值化,再對(duì)目標(biāo)區(qū)域進(jìn)行膨脹處理,對(duì)目標(biāo)區(qū)域進(jìn)行標(biāo)記,求取最小外接矩形。3.2.3二值化圖像的二值化處理就是將圖像上的點(diǎn)的灰度置為0或255,也就是使整個(gè)圖像呈現(xiàn)出明顯的黑白效果。即將256個(gè)亮度等級(jí)的灰度圖像通過適當(dāng)?shù)拈撝颠x取而獲得仍然可以反映圖像整體和局部特征的二值化圖像。二值化的原理即設(shè)定某一閾值,將灰度圖像的像素分成大于閾值的像素群和小于閾值的像素群兩局部。設(shè)輸人灰度圖像函數(shù)為,輸出二值圖像函數(shù)為,那么gx,y=0f(x,y)<T閾值T是把目標(biāo)和背景區(qū)分開的標(biāo)尺,選取適當(dāng)?shù)拈撝稻褪羌纫M可能保存圖像信息,又要盡可能減少背景和噪聲的干擾,這是選擇閾值的原那么。MATLAB中二值化圖像函數(shù)主要有dither和im2bw函數(shù)。dither函數(shù)通過顏色抖動(dòng)來到達(dá)轉(zhuǎn)換圖像的目的。語法如下:BW=dither(I)Image是圖像矩陣資料,BW是二值化圖像矩陣;而im2bw函數(shù)通過對(duì)灰度值進(jìn)行閾值判斷的方法到達(dá)目的。語法如下:BinaryImage=im2bw(Image,[Level])Image是輸入圖像矩陣資料,Level是二值化程度值,介于0到1之間,BW是二值化圖像矩陣。本文采用im2bw函數(shù)。3.2.4中值濾波中值濾波是一種非線性濾波,一般采用含有奇數(shù)個(gè)點(diǎn)的滑動(dòng)窗口,用窗口中個(gè)點(diǎn)灰度值的中值來代替指定點(diǎn)的灰度值。對(duì)于奇數(shù)個(gè)元素,中值是按照大小排序后中間的數(shù)值;對(duì)于偶數(shù)個(gè)元素,中值是指排序后中間兩個(gè)元素灰度值的平均值。這里,中心點(diǎn)像素減去近鄰8個(gè)值的中值來置換該點(diǎn)像素。輸入像素f(x,y)的8個(gè)臨近像素值從小到大排列并標(biāo)記為:x0、x1、x3,…g(x,y)=f(x,y)-m(x,y)式(3.15)式中m(x,y)定義為:mx,y=x3+對(duì)于二維序列進(jìn)行中值濾波時(shí),濾波窗口也是二維的,但這種二維窗口可以有各種不同的形狀,如線狀、方形、圓形、十字形、圓環(huán)形等。二維數(shù)據(jù)的中值濾波可以表示為:式(3.16)在實(shí)際使用窗口時(shí),窗口的尺寸一般先用3×3,再取5×5逐漸增大,直到其濾波效果滿意為止。對(duì)于有緩變的較長輪廓線物體的圖像,采用方形或圓形窗口為宜,對(duì)于包含尖頂角物體的圖像,適宜用十字形窗口。本文選取的圖像噪聲水平較小,所以中值濾波處理選用3×3模板。相關(guān)的MATLAB語句為:Image_BW_medfilt=medfilt2(image_bw,[33]);figure;imshow(Image_BW_medfilt)中值濾波器是典型的低通濾波器,由于它在實(shí)際運(yùn)算過程中并不需要圖像的統(tǒng)計(jì)特性,所以比擬方便。在一定的條件下,對(duì)濾除脈沖干擾及圖像掃描噪聲最為有效,但對(duì)于線、尖頂?shù)燃?xì)節(jié)多的圖像不宜采用中值濾波。中值濾波對(duì)圖像的平滑有顯著效果,很好地去除了椒鹽噪聲,并有效保存了圖像邊緣細(xì)節(jié)。3.2.5Robert梯度算子銳化和邊緣檢測(cè)梯度算子用于計(jì)算梯度值,通常認(rèn)為它也是邊界提取算子,具有極值性、位移不變性和旋轉(zhuǎn)不變性。圖像在點(diǎn)處的梯度定義為一個(gè)二維列矢量:式(3.17)梯度的幅值即模值,為:式(3.18)梯度的方向在最大變化率方向上,方向角可表示為:式(3.19)在不引起歧義時(shí),為了方便,一般將梯度矢量的模值簡稱為梯度。實(shí)用中,梯度模還有很多近似式,此處不加列舉。對(duì)圖像f施用梯度模算子,便可產(chǎn)生所謂的梯度圖像g,g與f像素之間的關(guān)系是式(3.20)式中G為梯度模算子。由于梯度圖像g反映了圖像f的灰度變化分布信息,因此對(duì)其進(jìn)行某種適當(dāng)?shù)奶幚砗妥儞Q,或?qū)⒆儞Q后的梯度圖像和原圖像組合作為f銳化后的圖像。Robert梯度算子用4點(diǎn)進(jìn)行差分,以求得梯度,即采用對(duì)角方向相鄰兩像素之差,故也稱為四點(diǎn)差分法。對(duì)應(yīng)的水平和垂直方向的模板為:式(3.21)標(biāo)注·的是當(dāng)前像素的位置(i,j)為當(dāng)前像素的位置,其計(jì)算公式如下:Gi,j=fi,j-f(i+1,j+1)當(dāng)梯度計(jì)算完后,如何確定銳化輸出的圖像是一個(gè)需要考慮的問題,根據(jù)需要,可以生成不同的梯度增強(qiáng)圖像。具體有五種方法:(1)直接以梯度值作為銳化輸出,即:f'i,j=G(i,j)式(這種方法直截了當(dāng),簡單易行,缺點(diǎn)是增強(qiáng)的圖像僅顯示灰度變化劇烈的邊緣,對(duì)灰度變化平緩的區(qū)域那么呈現(xiàn)黑色,整體表現(xiàn)暗的特性。(2)輔以門限判決:f'i,j=Gi,j式中,T是一個(gè)非負(fù)的門限值。只有梯度超過一定值時(shí)才用梯度值替代原灰度值。適中選取T值,既可以增強(qiáng)明顯的邊緣,又不會(huì)破壞灰度變化平緩的區(qū)域。(3)給邊緣規(guī)定一個(gè)特定的灰度級(jí),即:f'x,y=LG式中,T是一個(gè)非負(fù)的門限值,LG(4)給背景規(guī)定特定的灰度級(jí),即:f'i,j=Gi,j這種方法將背景用一個(gè)特定的灰度級(jí)來實(shí)現(xiàn)LB(5)將背景與邊緣用二值圖像來表示,即:f'i,j=LGG(i,j)≥T這種方法主要突出了邊界的位置,其中LG,LRobert梯度算子對(duì)噪聲較敏感,常用于不含噪聲的圖像邊緣點(diǎn)檢測(cè)。梯度算子類邊緣檢測(cè)方法的效果類似于高通濾波,有增強(qiáng)高頻分量,抑制低頻分量的作用。圖像邊緣得到銳化加強(qiáng),圖像的細(xì)節(jié)得到加強(qiáng)。灰度平緩變化的局部由于梯度較小而顯得很黑。第2章中說過,梯度算子也可以用來進(jìn)行邊緣檢測(cè)。Robert算子適用于邊緣明顯且噪聲較少的圖像分割,常用來提取道路圖像。本文中,道路圖像并不復(fù)雜,而且在邊緣檢測(cè)之前已經(jīng)用中值濾波對(duì)圖像進(jìn)行了處理,消除了噪聲,所以這里仍然采用Robert算子進(jìn)行邊緣檢測(cè)。Robert算子的定義為:Gf(x,y)=f(x+1,y+1)-f(x,y)2+由于上述算法的處理工作量很大,因此在實(shí)用上常采用絕對(duì)差算法對(duì)上式化簡如下:Gf(x,y)≈fx+1,y-fGf(x,y)≈fx+1,y+1Robert算子采用對(duì)角線方向的相鄰兩像素之差進(jìn)行梯度幅度檢測(cè),其檢測(cè)水平、垂直方向邊緣的性能要好于斜線方向邊緣,且檢測(cè)定位精度比擬高,但對(duì)噪聲較敏感。3.3膨脹處理和目標(biāo)識(shí)別3.3.1膨脹處理對(duì)于灰度圖像,膨脹就是在結(jié)構(gòu)元素的范圍內(nèi),求取結(jié)構(gòu)元素與圖像中對(duì)應(yīng)元素的和,看哪個(gè)和最大,然后這個(gè)和就作為圖像中心點(diǎn)的值,當(dāng)然這個(gè)中心點(diǎn)是指和結(jié)構(gòu)元素中心位置對(duì)應(yīng)的那個(gè)圖像位置上的,然后繼續(xù)滑動(dòng)結(jié)構(gòu)元素。而對(duì)于二值圖像,膨脹就是用結(jié)構(gòu)元素在圖像上移動(dòng),只要結(jié)構(gòu)元素中有一個(gè)點(diǎn)與圖像中的點(diǎn)重疊即可,膨脹的結(jié)果是結(jié)構(gòu)元素中心點(diǎn)劃過的區(qū)域的內(nèi)部,所以圖像的邊緣就被擴(kuò)大了。設(shè)二值圖像為F,結(jié)構(gòu)元素為S,當(dāng)一個(gè)結(jié)構(gòu)元素S的原點(diǎn)移動(dòng)到圖像的點(diǎn)(x,y)處時(shí),將其記作Sxy。此時(shí)圖像X被結(jié)構(gòu)元素SD=F?S=其含義為,當(dāng)結(jié)構(gòu)元素S的原點(diǎn)移動(dòng)到(x,y)位置,假設(shè)S中包含至少一個(gè)像素值為1的點(diǎn),那么在膨脹后的圖像上該點(diǎn)為1,否那么為0。具體步驟如下:(1)將預(yù)先設(shè)定好形狀以及原點(diǎn)位置的結(jié)構(gòu)元素的原點(diǎn)移動(dòng)到圖像中可包容的所有像素點(diǎn);(2)判斷該結(jié)構(gòu)元素所覆蓋范圍內(nèi)的像素值是否存在至少一個(gè)為1的點(diǎn),假設(shè)存在,那么膨脹后的圖像中與結(jié)構(gòu)元素原點(diǎn)相同位置上的像素值置為1,假設(shè)該覆蓋范圍內(nèi)的所有像素的值為0,那么膨脹后的圖像中與結(jié)構(gòu)元素原點(diǎn)相同位置上的像素值置為0.(3)對(duì)原圖中所有像素值為1的點(diǎn)重復(fù)前兩步。MATLAB中實(shí)現(xiàn)膨脹處理的函數(shù)如下:BW2=dilate(BW1,SE)BW2=dilate(BW1,SE,…,n)其中,BW2=dilate(BW1,SE)表示使用二值結(jié)構(gòu)要素矩陣SE對(duì)圖像數(shù)據(jù)矩陣BW1執(zhí)行膨脹操作。輸入圖像BW1的類型為double或unit8,輸出圖像BW2的類型為unit8。而BW2=dilate(BW1,SE,…,n)表示執(zhí)行膨脹操作n次。3.3.2目標(biāo)識(shí)別膨脹處理后對(duì)膨脹后的圖像進(jìn)行標(biāo)記,標(biāo)記區(qū)域的方法是利用每一個(gè)區(qū)域的連通域來定的。MATLAB中的bwlabel函數(shù)可以在二值圖像中標(biāo)記連通區(qū)域,主要對(duì)二維二值圖像中各個(gè)別離局部進(jìn)行標(biāo)注〔多維用bwlabeln,用法類似,這里不作介紹〕。用法介紹如下:L=bwlabel(BW,n)[L,num]=bwlabel(BW,n)返回一個(gè)和BW大小相同的L矩陣,包含了標(biāo)記了BW中每個(gè)連通區(qū)域的類別標(biāo)簽,這些標(biāo)簽的值為1、2、num〔連通區(qū)域的個(gè)數(shù)〕。n的值為4或8,表示是按4連通尋找區(qū)域或按8連通尋找,默認(rèn)為8。這里num返回的就是BW中連通區(qū)域的個(gè)數(shù)。接下來對(duì)標(biāo)記圖像進(jìn)行最小外接矩形的計(jì)算。圖像的外接矩形是指完全包含了圖形上所有的點(diǎn)、線,且各邊均與圖形相接觸的矩形。一個(gè)圖形的外接矩形有無窮多個(gè),其中面積最小者稱為最小外接矩形。由定義可知幾何圖形的最小外接矩形是唯一的,它在一定程度上描述了該圖形的某些幾何特征即長和寬。計(jì)算最小外接矩形的一種方法是旋轉(zhuǎn)法,即將圖像在90(1)將圖像邊緣點(diǎn)繞該圖像形心點(diǎn)x0,(2)計(jì)算出每旋轉(zhuǎn)θ后的最大橫坐標(biāo)xmax、最小橫坐標(biāo)xmin和最大縱坐標(biāo)ymax、最小縱坐標(biāo)yS=xmax-(3)在旋轉(zhuǎn)θ,重復(fù)執(zhí)行前兩步,直到旋轉(zhuǎn)角度到達(dá)90(4)在所有的圖像邊緣外接矩形面積中,找出面積S最小時(shí)的xmax、xmin、ymax為保證精度,每次旋轉(zhuǎn)的角度θ=輸入目標(biāo)圖像輸入目標(biāo)圖像計(jì)算形心設(shè)置每次旋轉(zhuǎn)角度θ旋轉(zhuǎn)9計(jì)算最小和最大橫的坐標(biāo)與縱坐標(biāo)求出外接矩形面積找出面積最小的外接矩形求出面積最小時(shí)的坐標(biāo)值NY圖3.1旋轉(zhuǎn)法對(duì)最小外接矩形計(jì)算后,對(duì)目標(biāo)進(jìn)行特征參數(shù)提取,提取出表征目標(biāo)信息的特征參量,即可到達(dá)定位和識(shí)別目標(biāo)障礙物的目的。特征參數(shù)提取是要獲得表征目標(biāo)的特征參量,作為檢測(cè)結(jié)果輸出,對(duì)于二值圖像,常使用質(zhì)心作為特征參量來表征目標(biāo)位置信息。具體方法是對(duì)標(biāo)記區(qū)域進(jìn)行質(zhì)心運(yùn)算,然后找到該標(biāo)記區(qū)域在x軸和y軸上區(qū)域的最正確邊緣點(diǎn)。質(zhì)心的計(jì)算公式如下:式(3.33)式中,xm和ym分別為質(zhì)心的橫縱坐標(biāo),n為圖像中目標(biāo)區(qū)域的像素個(gè)數(shù),xk和yk分別為確定目標(biāo)的質(zhì)心后,就可以通過質(zhì)心位置確定目標(biāo)位置,加上最小外接矩形的標(biāo)示,從而到達(dá)定位和識(shí)別目標(biāo)障礙物的目的。3.4小結(jié)基于數(shù)字圖像處理的障礙物的識(shí)別需要在圖像處理環(huán)節(jié)對(duì)待識(shí)別的圖像進(jìn)行較好的處理,首先進(jìn)行對(duì)圖像灰度化和去噪處理,然后銳化了圖像中目標(biāo)的邊緣之后進(jìn)行圖像的背景差分,將圖像中的感興趣區(qū)域和非感興趣區(qū)域區(qū)別開,之后對(duì)目標(biāo)圖像進(jìn)行膨脹處理、最小外接矩形計(jì)算,最后定位識(shí)別。對(duì)靜態(tài)圖像的處理和識(shí)別較視頻圖像簡單,特別是最小外接矩形的計(jì)算是定位和識(shí)別的關(guān)鍵。4總結(jié)與展望作為一種比擬有潛力的識(shí)別技術(shù),障礙物的識(shí)別受到了廣泛關(guān)注,開發(fā)出可靠高效的障礙物識(shí)別方法不但具有重要的理論意義,而且有很高的實(shí)用價(jià)值。本文針對(duì)圖像的特性,分析和研究了障礙物識(shí)別的相關(guān)技術(shù),主要從數(shù)字圖像處理的角度出發(fā),將中值濾波法、梯度法銳化與邊緣檢測(cè)、形態(tài)學(xué)膨脹處理和最小外接矩形應(yīng)用于障礙物的識(shí)別??偨Y(jié)前面的研究,本文完成了以下工作:(1)綜合分析了障礙物識(shí)別技術(shù)的開展現(xiàn)狀和幾種趨勢(shì),選擇了通過數(shù)字圖像處理技術(shù),以路面圖像為例,主要是用中值濾波對(duì)圖像進(jìn)行去噪處理,然后用Robert算子對(duì)圖像進(jìn)行分割。(2)對(duì)分割后的圖像進(jìn)行了膨脹處理,將
溫馨提示
- 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請(qǐng)下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請(qǐng)聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
- 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會(huì)有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
- 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
- 5. 人人文庫網(wǎng)僅提供信息存儲(chǔ)空間,僅對(duì)用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對(duì)用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對(duì)任何下載內(nèi)容負(fù)責(zé)。
- 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請(qǐng)與我們聯(lián)系,我們立即糾正。
- 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶因使用這些下載資源對(duì)自己和他人造成任何形式的傷害或損失。
最新文檔
- 對(duì)賭協(xié)議跟投資協(xié)議書
- 電工師傅帶徒弟協(xié)議書
- 揭陽公積金抵扣協(xié)議書
- 電梯補(bǔ)簽協(xié)議書
- 聯(lián)姻合作協(xié)議書
- 遺產(chǎn)贈(zèng)予協(xié)議書
- 追資投資協(xié)議書
- 碰傷調(diào)解協(xié)議書
- 美國后勤協(xié)議書
- 工程股份制合同協(xié)議書
- 《基于STM32單片機(jī)健康監(jiān)測(cè)模塊的設(shè)計(jì)與實(shí)現(xiàn)》7200字(論文)
- 靜脈留置針留置護(hù)理
- 設(shè)備技術(shù)規(guī)范書模板
- 2025年浙江寧波慈溪工貿(mào)集團(tuán)限公司面向社會(huì)公開招聘工作人員16人高頻重點(diǎn)提升(共500題)附帶答案詳解
- 公路橋梁工程前場(chǎng)安全培訓(xùn)
- 企業(yè)門衛(wèi)培訓(xùn)課件
- 企業(yè)門衛(wèi)培訓(xùn)內(nèi)容
- 年產(chǎn)1000噸方便面工廠設(shè)計(jì)說明書
- 2024-2025學(xué)年數(shù)學(xué)滬科版七年級(jí)上冊(cè)期末綜合測(cè)試卷(四)(含答案)
- 2025年中考英語模擬試卷猜題卷(含答案)
- 基礎(chǔ)護(hù)理學(xué)選擇試題庫+答案
評(píng)論
0/150
提交評(píng)論