基于數字圖像處理的障礙物識別_第1頁
基于數字圖像處理的障礙物識別_第2頁
基于數字圖像處理的障礙物識別_第3頁
基于數字圖像處理的障礙物識別_第4頁
基于數字圖像處理的障礙物識別_第5頁
已閱讀5頁,還剩32頁未讀, 繼續(xù)免費閱讀

下載本文檔

版權說明:本文檔由用戶提供并上傳,收益歸屬內容提供方,若內容存在侵權,請進行舉報或認領

文檔簡介

摘要數字圖像處理就是利用計算機對圖像信息進行加工,以滿足人的視覺心理或者應用需求。圖像識別所討論的問題,是研究用計算機代替人自動地處理大量的物理信息,解決人類所不能識別的問題。對于計算機來說,在實際工作環(huán)境里,圖像場景已有較大的變化。因此要區(qū)分圖像屬于哪一類,往往要通過一系列關鍵技術來實現。由此產生的圖像識別方法也有很多。本文在較廣泛地調研文獻的根底上,對圖像識別系統進行了較為全面的綜述,并以較為大量文字和具體的實例,通過使用常用的仿真語言和軟件對基于數字圖像處理的障礙物的識別進行了研究。第一局部通過中值濾波、梯度法銳化和邊緣檢測進行處理后,將目標圖像與背景圖像差分;第二局部再進行形態(tài)學膨脹、最小外接矩形特征計算后,在分割的根底上選擇需要提取的特征,對某些參數進行測量后,根據測量結果做分類和識別,通過對標記區(qū)域計算質心進行定位識別,最后通過MATLAB軟件對其進行了仿真,獲得了較理想的識別結果。關鍵詞:數字圖像處理;圖像識別;背景差分;膨脹處理;最小外接矩形ABSTRACTThedigitalimageprocessingistousethecomputertocarryontheprocessingimageinformation,tomeettheperson'svisualpsychologyorapplicationrequirements.Theproblemsdiscussedimagerecognition,isthestudyusedcomputerinsteadofpeopleautomaticallywiththeamountofphysicalinformation,solvetheproblemofhumanbeingscan'tidentify.Forcomputerspeaking,theactualworkenvironment,imagesceneforgreaterchange.Sotodistinguishbetweenimagewhatkind,oftentothroughaseriesofkeytechnology.Theresultingimagerecognitionmethodalsohasalotof.Thispaperinawidelyresearchliterature,andonthebasisofimagerecognitionsystemforacomprehensivereview,andtobealotofwrittenandaspecificexample,throughtheuseofcommonlanguageandsoftwaresimulationbasedondigitalimageprocessingofobstaclesrecognition.Thefirstpartthroughthemedianfiltering,gradientmethodsharpenandedgedetectionafterprocessing,willtargetimageandthebackgroundimagedifference;Thesecondpartofmorphologicalinflationagain,minimumcircumscribedrectangularfeaturecalculation,inthedivisionofthebasisofthechoiceneedtoextractcharacteristicofsomeparametersformeasurement,themeasurementresultsdoclassificationandidentification,throughtothemarkerareascalculationcentroidlocalizationrecognition,thelastthroughthesoftwareMATLABsimulation,obtainedaidealrecognitionresults.Keywords:Digitalimageprocessing;Imagerecognition;Backgrounddifference;Expansionprocess;Minimumboundingrectangle 目錄摘要 1關鍵詞 1ABSTRACT 2Keywords 21緒論 11.1數字圖像處理簡介 11.2數字圖像處理的特點 21.3課題目的和意義 31.4論文結構安排 42圖像識別系統簡介 52.1圖像預處理 5灰度化和二值化 5光照補償 6圖像差分 9圖像平滑 11圖像銳化 12邊緣檢測 152.2形態(tài)處理 172.3圖像的識別 182.4小結 183基于數字圖像處理的障礙物識別 193.1仿真環(huán)境簡介 193.2預處理 21灰度化 213.2.2背景差分 22二值化 24中值濾波 25Robert梯度算子銳化和邊緣檢測 253.3膨脹處理和目標識別 283.3.1膨脹處理 28目標識別 283.4小結 304總結與展望 32致謝 34參考文獻 35附錄一〔程序代碼〕 36附錄二〔程序運行結果〕 381緒論1.1數字圖像處理簡介數字圖像處理一般是利用計算機或其它含有微處理器的嵌入式數字設備對圖像進行處理。由于計算機等數字設備只能處理離散數字信號,因此它所處理的對象也只能是數字圖像。而在我們日常生活中出現的圖像信號絕大局部都是模擬信號,所以必須通過某種方式將模擬圖像信號轉化為數字圖像信號。這個過程稱之為模數轉換,需要用到采樣、量化理論。圖像處理技術是20世紀60年代隨著計算機技術和VLSI的開展而產生、開展和不斷成熟起來的一個新興技術領域,它在理論上和實際應用中都取得了巨大的成就。視覺是人類最重要的感知手段,圖像又是視覺的根底。早期圖像處理的目的是改善圖像質量,它以人為對象,以改善人的視覺效果為目的。圖像處理中輸入的是質量低的圖像,輸出的是改善質量后的圖像。常用的圖像處理方法有圖像增強、復原、編碼、壓縮等。首次獲得成功應用的是美國噴氣推進實驗室。他們對空間探測器“徘徊者〞7號在1964年發(fā)回的幾千張月球照片進行圖像處理,如幾何校正、灰度變換、去除噪聲等,并考慮了太陽位置和月球環(huán)境的影響,由計算機成功地繪制出月球外表地圖,獲得了巨大的成功。在以后的宇航空間技術探測研究中,數字圖像處理技術都發(fā)揮了巨大的作用。圖像處理技術取得的另一個巨大成就是在醫(yī)學上。1972年英國EMI公司工程師Hounsfield創(chuàng)造了用于頭顱診斷的X射線計算機斷層攝影裝置,也就是我們通常所說的CT。CT的根本方法是根據人的頭部截面的投影,經計算機處理來重建截面圖像,稱為圖像重建。1975年EMI公司又成功研制出全身用的CT裝置,獲得了人體各個部位鮮明清晰的斷層圖像。1979年,這項無損傷診斷技術被授予諾貝爾獎,以表彰它對人類做出的劃時代奉獻。從20世紀70年代中期開始,隨著計算機技術和人工智能、思維科學研究的迅速開展,數字圖像處理技術向更高、更深層次開展。人們已開始研究如何用計算機系統解釋圖像,類似人類視覺系統理解外部世界,這被稱為圖像理解或計算機視覺。其中代表性的成果是70年代末MIT的Marr提出的視覺計算理論,這個理論成為計算機視覺領域其后十多年的主導思想。20世紀80年代末期,人們開始將其應用于地理信息系統,研究海圖的自動讀入、自動生成方法。數字圖像處理技術的應用領域不斷拓展。圖像處理技術的大開展是從20世紀90年代初開始的。自1986年以來,小波理論與變換方法迅速開展,它克服了傅里葉分析不能用于局局部析等方面的缺乏之處,被認為是調和分析半個世紀以來工作之結晶。1988年,小波分析被有效地應用于圖像分解和重構。小波分析被認為是信號與圖像分析在數學方法上的重大突破。隨后數字圖像處理技術迅猛開展,到目前為止,圖像處理在圖像通訊、辦公自動化系統、地理信息系統、醫(yī)療設備、衛(wèi)星照片傳輸及分析和工業(yè)自動化領域的應用越來越多。進入21世紀,隨著計算機技術的迅猛開展和相關理論的不斷完善,圖像處理技術在許多應用領域受到廣泛重視并取得了重大的開拓性成就。屬于這些領域的有航空航天、生物醫(yī)學工程、工業(yè)檢測、機器人視覺、公安司法、軍事制導、文化藝術等。該技術成為一門引人注目、前景遠大的新型學科。1.2數字圖像處理的特點根據數字圖像處理所涉及到的數字設備、技術本身以及技術的具體實現形式——軟件,數字圖像處理的特點可以分為以下幾點:(1)再現性好:計算機圖像處理與模擬圖像處理的根本不同在于,它不會因圖像的存儲、傳輸或復制等一系列變換操作而導致圖像質量的退化。只要圖像在數字化時準確地表現了原稿,那么數字圖像處理過程始終能保持圖像的真實再現;(2)處理精度高:按目前的技術,幾乎可將一幅模擬圖像數字化為任意大小的二維數組,這主要取決于圖像數字化設備的能力?,F代掃描儀可以把每個像素的灰度等級量化為16位甚至更高,這意味著圖像的數字化精度可以滿足任一應用需求。從原理上講不管圖像的精度有多高,處理總是能實現的,只要在處理時改變程序中的數組參數就可以了;(3)適用面寬:圖像可以來自多種信息源。從圖像反映的客觀實體尺度看,可以小到電子顯微鏡圖像,大到航空照片、遙感圖像甚至天文望遠鏡圖像。這些來自不同信息源的圖像只要被變換為數字編碼形式后,均是用二維數組表示的灰度圖像組合而成,因而均可用計算機來處理;(4)靈活性高:由于圖像的光學處理從原理上講只能進行線性運算,極大地限制了光學圖像處理能實現的目標;而數字圖像處理不僅能完成線性運算,且能實現非線性處理,即但凡可以用數學公式或邏輯關系來表達的一切運算均可用數字圖像處理實現;(5)信息壓縮的潛力大:計算機圖像中各個像素不是獨立的,其相關性大。在圖像畫面上,經常有很多像素有相同或接近的灰度。就電視畫面而言,同一行中相鄰兩個像素或相鄰兩行間的像素,其相關系數可達0.9以上,而相鄰兩幀之間相關性比幀內相關性一般說還要大些。因此,圖像處理中信息壓縮的潛力很大。圖像處理就是對圖像信息加工以滿足人的視覺心理或應用需求的方法。圖像處理方法有光學方法和電子學方法。而數字圖像處理就是利用數字計算機或其它的硬件設備對圖像信息轉換而得到的電信號進行某些數學處理以提高圖像的實用性。計算機進行圖像處理一般有兩個目的:(1)產生更適合人觀察和識別的圖像。(2)希望能由計算機自動識別和理解圖像。總的來說,數字圖像處理包括點運算、幾何處理、圖像增強、圖像復原、圖像形態(tài)學處理、圖像編碼、圖像重建、圖像識別等。本文的主要內容那么是其中的圖像識別。圖像識別所討論的問題,是研究用計算機代替人自動地處理大量的物理信息,解決人類生理器官所不能識別的問題,從而局部代替人的腦力勞動。人類識別圖像的過程總是先找到它們外形或顏色的某些特征進行比擬分析和判斷,然后加以分門別類,即識別它們。研究計算機識別圖像時也借鑒人的思維活動,采取同樣的方法。然而圖像的灰度與彩色是由光強和波長不同的光波引起的,與景物外表的特性、方向、光線條件以及干擾等多種因素有關。因此要區(qū)分圖像屬于哪一類,往往要經過預處理、分割、特征提取、分析、分類、識別等一系列過程?,F在這些技術完全可以用計算機模擬、對圖像信息進行處理來到達對它的識別。1.3課題目的和意義“識別〞這兩個字分開來解釋有“認識〞和“區(qū)別〞的含義。說“識別某物體〞包含有認識它而且能從一堆物件中把它與別的物件區(qū)別開來的意思。通常我們說認識某事物,這一定是經歷過中曾經見過或者接觸過它,因而了解它的特性。一旦你認識了它,自然也能把它與其他事物區(qū)別開來。根據存儲在大腦中的模式,就能對物體進行識別,這種識別就是“模式識別〞。圖像識別,可以認為是圖像的模式識別,它是在模式識別技術在圖像領域中的具體運用。模式識別的研究對象根本上可以概括為兩大類:一類是有直覺形象的圖像,如圖像、相片、文字等;一類是沒有直覺形象而只有數據或信息波形,如語音、心電脈沖、地震波等。模式識別研究的目的是研制能夠自動處理某些信息的機器系統,以便代替人完成分類和辨識的任務。所以,狹義地講,圖像識別所研究的模式就是圖像。本文的目的是通過對圖像識別原理的研究,對障礙物識別技術的原理進行分析研究,通過中值濾波、背景差分、梯度法銳化與邊緣檢測進行預處理后,利用形態(tài)學的膨脹處理和最小外接矩形的計算與定位,對障礙物目標進行識別,并通過MATLAB軟件仿真對其進行了仿真實現。圖像識別是立體視覺、運動分析、數據融合等實用技術的根底,在導航、地圖與地形配準、自然資源分析、天氣預報、環(huán)境監(jiān)測、生理病變研究等許多領域重要的應用價值。1.4論文結構安排在本章中,我們首先總結歸納了圖像的概念,數字圖像處理開展的歷程及其特點,以便對數字圖像處理有一個感性的認識和把握,并對我們所研究的課題有一個較為客觀的定位。接下來就引入了本文所研究的課題的本質——圖像識別,按本文的思路對圖像識別系統進行了較為完整的表達。接下來的章節(jié)中,將作如下安排:第2章對圖像識別系統的關鍵技術進行介紹;第3章介紹基于數字圖像處理的障礙物識別的原理和算法。這樣的安排,是因為本文的定位是基于數字圖像處理的圖像識別,另外還要對目前圖像識別領域的關鍵技術做一個比擬全面的綜述。2圖像識別系統簡介圖像識別所討論的問題,是研究用計算機代替人自動地處理大量的物理信息,解決人類所不能識別的問題。對于計算機來說,在各種惡劣的工作環(huán)境里,圖像與景物已有較大的差異。因此要區(qū)分圖像屬于哪一類,往往要通過預處理、形態(tài)學處理或特征提取、分析分類與識別等一系列關鍵技術來實現。由此產生的圖像識別方法也有很多。本文所研究的圖像識別系統的思路是預處理、形態(tài)學處理、提取特征量來對目標障礙物進行識別。2.1圖像預處理圖像預處理是相對于圖像識別而言的一種前期處理。不管采用何種裝置,輸入的圖像往往不能令人滿意。例如圖像中物體的輪廓過于鮮明而顯得不協調;按檢測對象大小和形狀的要求看,圖像的邊緣過于模糊;在相當滿意的一幅圖像上會發(fā)現多了一些不知來源的黑點或白點;以及圖像的失真、變形等等??傊斎氲膱D像在視覺效果和識別方便性等方面可能存在諸多問題,這類問題不妨統稱為“質量〞問題。盡管由于目的、觀點、愛好等的不同,圖像質量很難有統一的定義和標準,但是,根據應用要求改善圖像質量卻是一個共同的愿望。改善圖像質量的處理稱之為圖像預處理,主要是指按需要對圖像進行適當的變換突出某些有用的信息,去除或削弱無用的信息,如改變圖像的比照度,去除噪聲或強調邊緣的處理等等。2.1.1灰度化和二值化在圖像預處理階段,都要把采集的圖像進行灰度化處理,這樣既可以提高后續(xù)算法速度,而且可以提高系統綜合應用實效,到達更為理想的要求。圖像灰度化技術的研究具有重要意義。顏色可分為黑白色和彩色。黑白色指顏色中不包含任何的色彩成分,僅由黑色和白色組成。在RGB顏色模型中,如果R=G=B,那么顏色〔R,G,B〕表示一種黑白顏色;其中R=G=B的值叫做灰度值,所以黑白色又叫做灰度顏色。彩色和灰度之間可以互相轉化,由彩色轉化為灰度的過程叫做灰度化處理;由灰度化轉為彩色的過程稱為偽彩色處理。相應地,數字圖像可分為灰度圖像和彩色圖像。通過灰度化處理和偽彩色處理,可以使偽彩色圖像與灰度圖像相互轉化。圖像灰度化就是使彩色的R,G,B分量值相等的過程。二值圖像就是指只有兩個灰度級的圖像。在數字圖像處理中,二值圖像占有非常重要的地位,特別是在實用的圖像處理中,以二值圖像處理實現而構成的系統是很多的,要進行二值圖像的處理與分析,首先要把灰度圖像二值化,得到二值化圖像,這就不再涉及像素的多級值,使處理變得簡單,而且數據的處理和壓縮量小。二值圖像具有存儲空間小,處理速度快。更重要的是,在二值圖像的根底上,還可以進一步對圖像處理,獲得該圖像的一些幾何特征或者其他更多特征。二值化分為全局二值化和局部自適應二值化。一幅圖像包括目標物體、背景還有噪聲,要想從多值的數字圖像中直接提取出目標物體,最常用的方法就是設定一個全局的閾值T,用T將圖像的數據分成兩局部:大于T的像素群和小于T的像素群。將大于T的像素群的像素值設定為白色〔或者黑色〕,小于T的像素群的像素值設定為黑色〔或者白色〕。這樣就做到了全局二值化。全局二值化在表現圖像細節(jié)方面存在很大缺陷。為了彌補這個缺陷,出現了局部二值化方法。局部二值化的方法就是按照一定的規(guī)那么將整幅圖像劃分為N個窗口,對這N個窗口中的每一個窗口再按照一個統一的閾值T將該窗口內的像素劃分為兩局部,進行二值化處理。局部二值化也有一個缺陷。這個缺陷存在于那個統一閾值的選定。這個閾值是沒有經過合理的運算得來,一般是取該窗口的平均值。這就導致在每一個窗口內仍然出現的是全局二值化的缺陷。為了解決這個問題,就出現了局部自適應二值化方法。局部自適應二值化,該方法就是在局部二值化的根底之上,將閾值的設定更加合理化。該方法的閾值是通過對該窗口像素的平均值E、像素之間的差平方P、像素之間的均方根值Q等各種局部特征,設定一個參數方程進行閾值的計算。二值化是圖像處理的根本操作,任何圖像處理根本離不開二值化的操作。其應用非常廣泛。2.1.2光照補償在圖像的獲取過程中,由于拍攝環(huán)境的復雜性,當光照條件〔包括強度和光譜組成〕變化時,采集的圖像差異較大,影響圖像的定性和定量分析,因而必須對圖像進行光照補償。光照強度補償主要是消除由于實際光照條件不均勻,偏光、側光、高光等導致的過亮、過暗、陰影的影響。在光照強度補償算法中,對于均勻的光照變化,常使用直方圖均衡法、Gamma校正和對數變換等方法;對于非均勻的光照變化,代表性的方法有基于頻域的同態(tài)濾波方法和雙立方插值法等。同態(tài)濾波能減少光照并銳化邊緣和細節(jié),廣泛應用于不均勻光照以下圖像的補償,且只能直接對灰度圖像進行處理。所以,這里介紹同態(tài)濾波法。圖像f(x,y)可以用它的入射分量i(x,y)與反射分量r(x,y)的乘積來表示,即:f(x,y)=i(x,y)·r(x,y)式(2.1)不均勻光照表達在入射分量i(x,y)中,屬于變化緩慢的低頻成分;而圖像的細節(jié)等特性那么主要反映在圖像的反射分量r(x,y)中,屬于高頻成分。對于照明不均勻的圖像的處理,就是要盡量削減入射分量的影響,即壓制圖像的低頻分量,同時增強物體的反射分量,即放大圖像的高頻分量[4]。同態(tài)濾波是增強圖像比照度和壓縮圖像亮度范圍的濾波方法,減少低頻成分并增加高頻成分,從而減少光照變化并銳化邊緣或細節(jié),但不影響圖像像素變化,所以在灰度化之后進行同態(tài)濾波,然后才進行中值濾波。同態(tài)濾波的主要過程描述如下:(1)首先對圖像函數f(x,y)取對數,lnfx,y=lnf(2)對上式進行傅里葉變換,得到:Flnu,v=FT(3)將上式乘以同態(tài)濾波函數H(u,v),作濾波處理:Glnu,v=Fln(4)求傅里葉反變換:FT-1Gln(u,v)=(5)最后求指數變換,得到同態(tài)濾波處理的圖像,即:gx,y=explngi同態(tài)濾波增強圖像的效果與濾波曲線的分布形狀有關,實際應用中,需要根據不同圖像的特性和增強的需要,選用不同的濾波曲線,可以到達滿意的效果。同態(tài)濾波過程如圖2.1所示,圖中H(u,v)成為同態(tài)濾波函數。ff(x,y)對數運算(log)

離散傅里葉變換(DFT)傅里葉逆變換(IDFT)指數運算(exp)

g(x,y)H(u,v)圖2.1同態(tài)濾波過程根據圖像特性和需要,選用不同的濾波器傳遞函數H(u,v),它能以不同的方法影響傅立葉變換的高、低頻成分,同態(tài)濾波函數關系如圖2.2所示。圖中:Rh代表高頻增益,R1代表低頻增益,D(u,v)表示頻率(u,v)到濾波器中心(uHH(u,v)D(u,v)RR圖2.2同態(tài)濾波函數同態(tài)濾波器是通過高通濾波器進行修改得到與其對應的同態(tài)濾波器,常用的巴特沃斯同態(tài)濾波器濾波函數為:Hu,v=Rh式中,D0為〔u0,v0〕=〔0,0〕時D(u,v)的值,表示截止頻率。常熟c被引入用來控制濾波器函數斜面的銳化,它在Rh和R1之間過渡,當Rh>1、R1<1時,減小低頻和增強高頻,使得動態(tài)范圍壓縮和比照2.1.3圖像差分圖像差分運算又稱為圖像相減運算,常用于檢測變化及運動物體。差分方法可以分為控制環(huán)境下的簡單差分方法和基于背景模型的差分方法。在可控制環(huán)境下,或者在很短的時間內,可以認為背景是固定不變的,可以直接使用差分運算檢測變化或運動的物體。背景圖像差分是最直接、最簡單的一種方法。差分運算的方法是,首先將選定的背景圖片儲存,再計算目標圖像和設定的場景背景模型的差,然后通過比擬計算的差和根據實際情況設定的閾值的不同來檢測目標,所得結果直接反映了目標的位置、大小、形狀等信息。對于背景靜止的目標,圖像的背景差分能很好的實現目標的檢測。使用背景差分的前提是預先知道背景,除了直接獲取背景之外,獲取背景還可以使用統計平均法,它是通過對連續(xù)的圖像序列進行統計平均來獲得背景的。在攝像機固定的情況下,背景的變化是緩慢的。比方,當背景中固定對象的移動和外界光照條件變化、背景物體出現擾動〔如樹枝、樹葉的搖動等〕,或者固定的攝像機出現抖動等,概括起來,可分為兩類變化:場景的光照變化和場景構成的改變。背景圖像出現變化后,待識別圖像的背景與背景圖像就不是完全相同的了,而是局部相同。背景圖像發(fā)生緩慢變化情況時,需要對背景圖像進行更新,以消除上述干擾,使得背景圖像也能適應后來的圖像的差分運算。利用背景估計算法或高斯模型可以很好地解決背景出現變化的問題。簡單的背景更新算法就是將背景圖像與當前幀圖像取均值,將結果作為新的背景估計,實際應用中往往是給背景圖像和當前圖像賦予不同的權值,求它們的加權平均。進行差分運算時,假設差值小于某個閾值,那么用該點當前像素值更新背景圖像,否那么該點的背景圖像值不變。實際應用中這種方法運算量少,對背景漸變跟蹤較快,但無法應對背景的突變情況,造成誤檢和漏檢[6]。高斯模型就是用高斯概率密度函數〔正態(tài)分布曲線〕精確地量化事物,將一個事物分解為假設干的基于高斯概率密度函數形成的模型。圖像灰度直方圖可以認為是圖像灰度概率密度的估計。如果圖像所包含的目標區(qū)域和背景區(qū)域相比比擬大,且背景區(qū)域和目標區(qū)域在灰度上有一定的差異,那么該圖像的灰度直方圖呈現雙峰-谷形狀,其中一個峰對應于目標灰度,另一個峰對應于背景中心灰度。對于復雜的圖像,一般是多峰的,通過將直方圖的多峰特性看作是多個高斯分布的疊加,可以解決圖像的分割問題。圖像的某點像素值符合前景高斯分布時,就認為該點屬于前景目標;符合背景高斯分布時,就認為該點屬于背景,并進行背景更新[6]。高斯模型屬于概率統計模型。背景一般可以分為單模態(tài)和多模態(tài)兩種,前者在每個背景點上的像素值分布比擬集中,可以用單個概率分布模型來描述,后者的分布那么比擬分散,需要多個分布模型來共同描述。自然界中的很多景物和人造物體,如水面的波紋、搖擺的樹枝、飄揚的旗幟等,都呈現出多模態(tài)的特性,在多云天氣條件下的交通場景也表現為多模態(tài)特點,即背景忽明忽暗。在背景估計過程中,假設背景模型中每個圖像點是獨立的,并且像素值的分布是位置無關的,對它們的處理也是獨立的[6]。因此高斯模型分為單高斯模型和高斯混合模型兩種。在背景差分的前提下,二者的優(yōu)劣比擬有以下四點:(1)單高斯模型需要進行初始化,比方在進行視頻背景分割時,這意味著如果人體在前幾幀就出現在攝像頭前,人體將會被初始化為背景,而使模型無法使用;(2)單高斯模型只能進行微小性漸變,而不可突變。如戶外亮度隨時間的漸變是可以適應的,如果在明亮的室內突然關燈,單高斯模型就會將整個室內全部判斷為前景。又如,假設在監(jiān)控范圍內開了一輛車,并在攝像頭下開始停留。由于與模型無法匹配,車會一直被視為前景。當車過很長時間離去時,由于車停留點的亮度發(fā)生了很大的變化,因此已經無法與先前的背景模型相匹配;(3)單高斯模型無法適應背景有多個狀態(tài),如風吹的樹葉。單高斯模型無法表示這種情況,而使得前景檢測混亂,而高斯混合模型能夠很好地描述不同狀態(tài);(4)相對于單高斯模型的自適應變化,混合高斯模型的自適應變化要強大的多。它能解決單高斯模型很多不能解決的問題。如無法解決同一樣本點的多種狀態(tài),無法進行模型狀態(tài)轉化等。很明顯,高斯混合模型的應用范圍較單高斯模型更廣,由于具有多個模型,劃分更為精細,適用于多類別的劃分。2.1.4圖像平滑在圖像的獲取和傳輸過程中原始圖像會受到各種噪聲的干擾,使圖像質量下降。為了抑制噪聲、改善圖像質量,要對圖像進行平滑處理。抑制或消除這些噪聲而改善圖像質量的過程稱為圖像的平滑。圖像平滑的目的是為了消除噪聲。在圖像處理中的濾波屬于空間濾波,它是一種著眼于灰度的空間分布。常用的方法是運用一個K×K的模板對全圖像做卷積運算。濾波的目的有兩個,一個是將隨機空間噪聲平滑掉;二是保持、突出目標的某種空間結構??沼驗V波可增強圖像目標的信噪比,大局部噪聲,如由紅外成像器件、傳輸通道、A/D轉換器等引起的噪聲,通常表現為孤立像素的離散化變化,不是空間相關的,與它們的相鄰像素顯著不同,這種現象是許多噪聲去除算法的根底。一般情況下,減少噪聲的方法主要有鄰域平均法、中值濾波法、低通濾波法等。(1)鄰域平均法鄰域平均法是一種局部空間域處理的方法,就是對含有噪聲的原始圖像f(x,y)的每個像素點取一個鄰域S,計算S中所有像素灰度級的平均值,作為空間域平均處理后圖像g(x,y)的像素值,即g(x,y)=1M(m,n∈S)f(m,n)式(式中f(x,y)為N×N的陣列;x,y=0,1,2,…,N-1;S是以(x,y)點為中心的鄰域的集合,M為鄰域S中的像素點數,S鄰域可取四點鄰域或八點鄰域(如圖2.3)。圖2.3四點領域和八點領域(2)中值濾波法中值濾波法是一種非線性平滑技術,是基于排序統計理論的一種能有效噪聲的非線性信號處理技術,根本原理是把數字圖像或數字序列中一點的值用該點的一個鄰域中各點值的中值代替,讓周圍的像素值接近真實值,從而消除孤立的噪聲點。中值濾波是一種非線性濾波,由于它在實際運算過程中并不需要圖像的統計特性,所以比擬方便。中值濾波首先是被應用在一維信號處理技術中,后來被二維圖像信號處理技術所應用。在一定的條件下,可以克服線性濾波器所帶來的圖像細節(jié)模糊,而且對濾除脈沖干擾及圖像掃描噪聲最為有效,但對于線、尖頂等細節(jié)多的圖像不宜采用中值濾波。使用二維中值濾波最值得注意的是保持圖像中有效的細線狀物體。與平均濾波器相比,中值濾波器從總體上來說,能夠較好地保存原圖像中的躍變局部。(3)低通濾波法圖像經過傅里葉變換以后,噪聲頻譜一般位于空間頻率較高的區(qū)域,而圖像本身的頻率分量那么處于空間頻率較低的區(qū)域內,因此可以通過低通濾波的方法,使高頻成分受到抑制,而使低頻成分順利通過,從而實現圖像的平滑。低通濾波可以在空間域和頻域中進行。eq\o\ac(○,1)空間域低通濾波。在空間域中實現低通濾波是采用離散卷積,與高通濾波所用卷積表達式相同,即為式(2.9)式中輸出圖像g(m1,m2)是M×M方陣,輸入圖像f(n1,n2eq\o\ac(○,2)頻域低通濾波。這是一種頻域處理法。對于一幅圖像,它的邊緣、細節(jié)、跳躍局部以及噪聲都代表圖像的高頻分量,而大面積的背景區(qū)和緩慢變化局部那么代表圖像的低頻分量,用頻域低通濾波法除去其高頻分量就能去掉噪聲,從而得到平滑。2.1.5圖像銳化在圖像增強過程中,通常利用各類圖像平滑算法消除噪聲,圖像的常見噪聲主要有加性噪聲、乘性噪聲和量化噪聲等。一般來說,圖像的能量主要集中在其低頻局部,噪聲所在的頻段主要在高頻段,同時圖像邊緣信息也主要集中在其高頻局部。這將導致原始圖像在平滑處理之后,圖像邊緣和圖像輪廓模糊的情況出現。為了減少這類不利效果的影響,就需要利用圖像銳化技術,使圖像的邊緣變得清晰。圖像銳化處理的目的是為了使圖像的邊緣、輪廓線以及圖像的細節(jié)變得清晰,經過平滑的圖像變得模糊的根本原因是因為圖像受到了平均或積分運算,因此可以對其進行逆運算(如微分運算)就可以使圖像變得清晰。從頻率域來考慮,圖像模糊的實質是因為其高頻分量被衰減,因此可以用高通濾波器來使圖像清晰。但要注意能夠進行銳化處理的圖像必須有較高的性噪比,否那么銳化后圖像性噪比反而更低,從而使得噪聲增加的比信號還要多,因此一般是先去除或減輕噪聲后再進行銳化處理。圖像銳化算子有一階微分算子和二階微分算子。其中一階微分算子主要有Robert梯度算子、Prewitt梯度算子、Sobel算子;二階導數算子為Laplacian算子。(1)一階微分算子一階微分主要指梯度模運算,利用一階導數檢測邊緣點的方法就稱為梯度算子法。圖像的梯度值包含了邊界及細節(jié)信息,梯度值正比于像素之差。對于一幅圖像中突出的邊緣區(qū),其梯度值較大;在平滑區(qū)域梯度值??;對于灰度級為常數的區(qū)域,梯度為零。eq\o\ac(○,1)Robert梯度算子Robert梯度就是采用對角方向相鄰兩像素之差,故也稱為四點差分法,即用4點進行差分,以求得梯度。其缺點是對噪聲較敏感,常用于不含噪聲的圖像邊緣點檢測。梯度算子類邊緣檢測方法的效果類似于高通濾波,有增強高頻分量,抑制低頻分量的作用。eq\o\ac(○,2)Prewitt梯度算子〔平均差分法〕因為平均能減少或消除噪聲,Prewitt梯度算子法就是先求平均,再求差分來求梯度。利用檢測模板可求得水平和垂直方向的梯度,再通過梯度合成和邊緣點判定,就可得到平均差分法的檢測結果。eq\o\ac(○,3)Sobel算子〔加權平均差分法〕Sobel算子就是對當前行或列對應的值加權后,再進行平均和差分,也稱為加權平均差分。Sobel算子和Prewitt算子一樣,都在檢測邊緣點的同時具有抑制噪聲的能力,檢測出的邊緣寬度至少為二像素。由于它們都是先平均后差分,平均時會喪失一些細節(jié)信息,使邊緣有一定的模糊。但由于Sobel算子的加權作用,其使邊緣的模糊程度要稍低于程度要稍低于Prewitt算子。(2)二階導數算子對于階躍狀邊緣,其二階導數在邊緣點處出現過零交叉,即邊緣點兩旁的二階導數取異號,據此可以通過二階導數來檢測邊緣點。這里主要介紹Laplacian算子。對數字圖像f(m,n),用差分代替二階偏導,那么Laplacian算子為:Gi,j=4fLaplacian算子是最簡單的各向同性微分算子,具有旋轉不變性,比擬適用于改善因為光線的漫反射造成的圖像模糊。經過推導可以發(fā)現當圖像的模糊是由光的漫反射造成時,不模糊圖像等于模糊圖像減去它的拉普拉斯變換的常數倍。另外,人們還發(fā)現,即使模糊不是由于光的漫反射造成的,對圖像進行拉普拉斯變換也可以使圖像更清晰。Laplacian銳化的一維處理表達式是:式(2.11)在二維情況下,Laplacian算子使走向不同的輪廓能夠在垂直的方向上具有類似于一維那樣的銳化效應。綜上所述,首先,圖像過渡的邊緣(也就是沿整個斜坡),一階微分都不為零,經過二階微分后,非零值只出現在抖坡的起始處和終點處。可以得出結論:一階微分產生較粗的邊緣,二階微分那么細。其次,孤立的噪聲點。在孤立點及其周圍點,二階微分比一階微分響應要強。第三,細線,也是一種細節(jié)。對線的響應要比對階梯強,且點比線強。所以,可以總結出一階微分和二階微分的區(qū)別:(1)一階微分處理通常會產生較寬的邊緣,二階微分處理得到的邊緣那么細;(2)二階微分處理對細節(jié)有較強的響應,如細線和孤立點;(3)一階微分處理一般對灰度階梯有較強的響應;(4)二階微分處理對灰度級階梯變化產生雙響應;(5)二階微分在圖像中灰度值變化相似時,對線的響應要比對階梯強,且點比線強。大多數應用中,對圖像增強來說,二階微分處理比一階微分好,因為形成細節(jié)的能力強,而一階微分處理主要用于提取邊緣。2.1.6邊緣檢測圖像的邊緣是圖像的重要特征之一,數字圖像的邊緣檢測是圖像分割、目標區(qū)域識別、區(qū)域形狀提取等圖像分析領域十分重要的根底,其目的是精確定位邊緣,同時較好地抑制噪聲,因此邊緣檢測是機器視覺系統中必不可少的重要環(huán)節(jié)。所謂邊緣是指圖像局部特性的不連續(xù)性,是圖像局部強度變化最顯著的局部?;叶然蚪Y構等信息的突變處稱為邊緣,例如:灰度級的突變,顏色的突變,紋理結構的突變等。邊緣是一個區(qū)域的結束,也是另一個區(qū)域的開始,利用該特征可以分割圖像。邊緣主要存在于目標與目標、目標與背景、區(qū)域與區(qū)域(包括不同色彩)之間,是圖像分割、紋理特征和形狀特征等圖像分析的重要根底。圖像分析和理解的第一步常常是邊緣檢測。邊緣檢測的實質是采用某種算法來提取出圖像中對象與背景間的交界線。圖像灰度的變化情況可以用圖像灰度分布的梯度來反映,因此可以用局部圖像微分技術來獲取邊緣檢測算子。經典的邊緣檢測方法是對原始圖像中的像素的某個鄰域來構造邊緣檢測算子。目前,提取邊緣常用邊緣算子法、曲面擬合法、模板匹配法等。這里只介紹邊緣檢測算子法。在圖像銳化局部曾經討論過,梯度算子,特別是Robert算子等,可以對邊緣進行提取,這里再介紹一下Canny算子和LoG算子。Canny邊緣檢測算子在灰度圖像中得到廣泛應用。根據邊緣檢測的有效性和定位的可靠性,Canny研究了最優(yōu)邊緣檢測器所需的特性,推導出最優(yōu)邊緣檢測器的數學表達式。對于各種類型的邊緣,Canny邊緣檢測算子的最優(yōu)形式是不同的。Canny給出了評價邊緣檢測性能優(yōu)劣的三個指標:好的信噪比;好的定位性能;對單一邊緣僅有唯一響應。Canny首次將上述判據用數學的形式表示出來,然后采用最優(yōu)化數值方法,得到了對應給定邊緣類型的最正確邊緣檢測模板。對于二維圖像,需要使用假設干方向的模板分別對圖像進行卷積處理,再取最可能的邊緣方向。Canny所提出的邊緣檢測方法屬于先平滑然后求導數的方法。主要由以下步驟實現:eq\o\ac(○,1)圖像平滑。Canny建議用高斯函數進行圖像平滑:高斯函數:Gx,y=exp-x圖像卷積:IGx,y=Gx,y其中:是一個尺度參數,越小,那么函數越“集中〞,即僅在一個很小的局部范圍內平滑,越大,那么表示圖像在一個較大的范圍內進行平滑;I(x,y)為原始圖像。eq\o\ac(○,2)邊緣點定位。Canny指出用梯度方向的二階導數的零交叉作為判別邊緣點的準那么。假設該點滿足以下條件,那么該點為邊緣點:?2G?α其中:為平滑的梯度方向:α=tan-1?Ieq\o\ac(○,3)邊緣強度假設某像素滿足邊緣定位條件,那么該像素的邊緣強度為:式(2.16)利用圖像強度二階導數的零交叉點來求邊緣點的算法很容易受到噪聲干擾,所以在邊緣檢測前濾除噪聲是十分必要的。為此產生了LoG(LaplacianofGaussian)算法,也稱之為拉普拉斯高斯算法。它的根本特征有:eq\o\ac(○,1)平滑濾波器是高斯濾波器;eq\o\ac(○,2)增強步驟采用二階導數(二維拉普拉斯函數);eq\o\ac(○,3)邊緣檢測判據是二階導數零交叉點并對應一階導數的較大峰值;eq\o\ac(○,4)使用線性內插方法在子象素分辨率水平上估計邊緣的位置。常用的LoG算子是5×5的模板,如以下圖2.4所示:圖2.4拉普拉斯算子卷積模板模板中各點到中心點的距離與位置加權系數的關系如圖2.5所示。圖2.5LOG到中心點的距離與位置加權系數的關系曲線由于圖像的平滑會引起邊緣的模糊。LoG算法中的高斯平滑運算會導致圖像中邊緣和其他鋒利不連續(xù)局部的模糊。值越大,噪聲濾波效果越好,但同時會喪失一些重要的邊緣信息;值小時又會平滑不完全而留有太多噪聲。只有當兩者結合的很好時才能較好地檢測出圖像的最正確邊緣。2.2形態(tài)處理數學形態(tài)學是由一組形態(tài)學的代數運算子組成的,它的根本運算有4個:膨脹〔或擴張〕、腐蝕〔或侵蝕〕、開運算和閉運算,它們在二值圖像和灰度圖像中各有特點?;谶@些根本運算還可推導和組合成各種數學形態(tài)學實用算法,用它們可以進行圖像形狀和結構的分析及處理。形態(tài)學圖像處理表現為一種鄰域運算形式;一種特殊定義的鄰域稱之為“結構元素〞〔結構元素是指具有某種確定形狀的根本結構元素,例如一定大小的矩形等〕,在每個像素位置上它與二值圖像對應的區(qū)域進行特定的邏輯運算,邏輯運算的結果為輸出圖像的相應像素。膨脹是將與目標區(qū)域接觸的背景點合并到該目標物中,是目標邊界向外部擴張的處理。膨脹可以用來填補目標區(qū)域中存在的某些空洞,以及消除包含在目標區(qū)域中的小顆粒噪聲。通常是用以連接間斷的線或將因二值化處理,使原本應該在一起的區(qū)域被間斷開的區(qū)域重新連接時采用。簡單說,就是將間斷的輪廓線連在一起,并將其中的空點填充。腐蝕處理是膨脹處理的對偶,是消除邊界點,使邊界向內部收縮的過程。可以用來消除小而且無意義的目標物。如果兩目標物之間有細小的連通,可以選取足夠大的結構元素,將細小連通腐蝕掉。腐蝕處理通常在去除小顆粒噪聲以及消除目標物之間的粘連是非常有效的。腐蝕處理可以表示成用結構元素對圖像進行探測,找出圖像中可以放下該結構元素的區(qū)域,而膨脹處理可以理解成是對圖像的補集進行腐蝕處理。開運算即使用同一個結構元素對圖像進行先腐蝕再膨脹的運算,在結構元素S下的開運算定義為:F°S=F?S?S式(2.1開運算通常用來消除小對象物、在纖細點處別離物體、平滑較大物體的邊界的同時并不明顯改變其面積。開運算可以去除小顆粒噪聲,以及斷開目標物之間的粘連,主要作用與腐蝕處理相似,但與腐蝕處理相比,優(yōu)點是可以根本保持目標原有大小不變。閉運算是使用同一個結構元素對圖像先膨脹再腐蝕的運算,在結構元素S下的閉運算定義為:F?S=F?S?S式(2.1閉運算通常用來填充目標內細小空洞、連接斷開的臨近目標、平滑其邊界的同時不明顯改變其面積。閉運算與膨脹處理的作用相似,與膨脹處理相比,可以根本保持目標原有大小不變。2.3圖像的識別圖像識別多用統計方法,以數學的決策理論為根底,建立統計學識別模型。根本方法是在對研究的圖像進行大量的統計分析,找出規(guī)律性認識,抽取出反響圖像本質特點的特征進行識別。這其中的主要工作在于如何抽取圖像的特征或決定統計參數,必須把圖像的大量信息縮減為少數的特征。為了抽取特征,有時要對原始圖像信息進行各種變換,把多維的圖像點簡化為較低的維數。在圖像識別領域,文字識別的研究最為深入,取得的成果也較大。除了統計方法識別外,近年來模糊數學和神經網絡在圖像識別方面也有了廣泛應用。2.4小結本章主要介紹了圖像識別的一些關鍵技術的原理,為下一章論述基于數字圖像處理的障礙物識別打好理論根底。下一章將著重介紹基于數字圖像處理的障礙物識別的原理和相關算法,并在MATLAB中進行仿真。3基于數字圖像處理的障礙物識別障礙物的檢測識別作為圖像識別的重要內容,利用計算機對獲得的圖像進行分析和提取其中的目標信息,到達識別障礙物的目的。由于受距離、復雜環(huán)境及技術條件的限制,拍攝的圖像一般都較復雜,這為置于背景下目標的提取及識別帶來了較大的困難。通過對圖像識別系統的學習和分析,本章利用圖像識別的技術到達對障礙物的識別的主要目的,以路面及路面車輛的圖像為例,在正常光照條件下進行識別。3.1仿真環(huán)境簡介MATLAB是由美國Mathworks公司發(fā)布的主要面對科學計算、可視化以及交互式程序設計的高科技計算環(huán)境。它將數值分析、矩陣計算、科學數據可視化以及非線性動態(tài)系統的建模和仿真等諸多強大功能集成在一個易于使用的視窗環(huán)境中,為科學研究、工程設計以及必須進行有效數值計算的眾多科學領域提供了一種全面的解決方案,并在很大程度上擺脫了傳統非交互式程序設計語言〔如C、Fortran〕的編輯模式,代表了當今國際科學計算軟件的先進水平。用MATLAB進行科技編程相對于傳統的科技編程語言有諸多的優(yōu)點。主要包括:(1)友好的工作平臺編程環(huán)境。MATLAB由一系列工具組成。這些工具方便用戶使用MATLAB的函數和文件,其中許多工具采用的是圖形用戶界面。包括MATLAB桌面和命令窗口、歷史命令窗口、編輯器和調試器、路徑搜索和用于用戶瀏覽幫助、工作空間、文件的瀏覽器。隨著MATLAB的商業(yè)化以及軟件本身的不斷升級,MATLAB的用戶界面也越來越精致,更加接近Windows的標準界面,人機交互性更強,操作更簡單。而且新版本的MATLAB提供了完整的聯機查詢、幫助系統,極大的方便了用戶的使用。簡單的編程環(huán)境提供了比擬完備的調試系統,程序不必經過編譯就可以直接運行,而且能夠及時地報告出現的錯誤及進行出錯原因分析。(2)簡單易用的程序語言。MATLAB是一個高級的矩陣/陣列語言,它包含控制語句、函數、數據結構、輸入和輸出和面向對象編程特點。用戶可以在命令窗口中將輸入語句與執(zhí)行命令同步,也可以先編寫好一個較大的復雜的應用程序〔M文件〕后再一起運行。新版本的MATLAB語言是基于最為流行的C++語言根底上的,因此語法特征與C++語言極為相似,而且更加簡單,更加符合科技人員對數學表達式的書寫格式。使之更利于非計算機專業(yè)的科技人員使用。而且這種語言可移植性好、可拓展性極強,這也是MATLAB能夠深入到科學研究及工程計算各個領域的重要原因。(3)強大的科學計算機數據處理能力。MATLAB是一個包含大量計算算法的集合。其擁有600多個工程中要用到的數學運算函數,可以方便的實現用戶所需的各種計算功能。函數中所使用的算法都是科研和工程計算中的最新研究成果,而前經過了各種優(yōu)化和容錯處理。在通常情況下,可以用它來代替底層編程語言,如C和C++。在計算要求相同的情況下,使用MATLAB的編程工作量會大大減少。MATLAB的這些函數集包括從最簡單最根本的函數到諸如矩陣,特征向量、快速傅立葉變換的復雜函數。函數所能解決的問題其大致包括矩陣運算和線性方程組的求解、微分方程及偏微分方程的組的求解、符號運算、傅立葉變換和數據的統計分析、工程中的優(yōu)化問題、稀疏矩陣運算、復數的各種運算、三角函數和其他初等數學運算、多維數組操作以及建模動態(tài)仿真等。(4)出色的圖形處理功能。MATLAB自產生之日起就具有方便的數據可視化功能,以將向量和矩陣用圖形表現出來,并且可以對圖形進行標注和打印。高層次的作圖包括二維和三維的可視化、圖象處理、動畫和表達式作圖??捎糜诳茖W計算和工程繪圖。新版本的MATLAB對整個圖形處理功能作了很大的改良和完善,使它不僅在一般數據可視化軟件都具有的功能方面更加完善,而且對于一些其他軟件所沒有的功能〔例如圖形的光照處理、色度處理以及四維數據的表現等〕,MATLAB同樣表現了出色的處理能力。同時對一些特殊的可視化要求,例如圖形對話等,MATLAB也有相應的功能函數,保證了用戶不同層次的要求。另外新版本的MATLAB還著重在圖形用戶界面〔GUI〕的制作上作了很大的改善,對這方面有特殊要求的用戶也可以得到滿足。(5)應用廣泛的模塊集合工具箱。MATLAB對許多專門的領域都開發(fā)了功能強大的模塊集和工具箱。一般來說,它們都是由特定領域的專家開發(fā)的,用戶可以直接使用工具箱學習、應用和評估不同的方法而不需要自己編寫代碼。目前,MATLAB已經把工具箱延伸到了科學研究和工程應用的諸多領域,諸如數據采集、數據庫接口、概率統計、樣條擬合、優(yōu)化算法、偏微分方程求解、神經網絡、小波分析、信號處理、圖像處理、系統辨識、控制系統設計、LMI控制、魯棒控制、模型預測、模糊邏輯、金融分析、地圖工具、非線性控制設計、實時快速原型及半物理仿真、嵌入式系統開發(fā)、定點仿真、DSP與通訊、電力系統仿真等,都在工具箱〔Toolbox〕家族中有了自己的一席之地。(6)實用的程序接口和發(fā)布平臺。新版本的MATLAB可以利用MATLAB編譯器和C/C++數學庫和圖形庫,將自己的MATLAB程序自動轉換為獨立于MATLAB運行的C和C++代碼。允許用戶編寫可以和MATLAB進行交互的C或C++語言程序。另外,MATLAB網頁效勞程序還容許在Web應用中使用自己的MATLAB數學和圖形程序。MATLAB的一個重要特色就是具有一套程序擴展系統和一組稱之為工具箱的特殊應用子程序。工具箱是MATLAB函數的子程序庫,每一個工具箱都是為某一類學科專業(yè)和應用而定制的,主要包括信號處理、控制系統、神經網絡、模糊邏輯、小波分析和系統仿真等方面的應用。(7)應用軟件開發(fā)〔包括用戶界面〕。在開發(fā)環(huán)境中,使用戶更方便地控制多個文件和圖形窗口;在編程方面支持了函數嵌套,有條件中斷等;在圖形化方面,有了更強大的圖形標注和處理功能,包括對性對起連接注釋等;在輸入輸出方面,可以直接向Excel和HDF5進行連接。MATLAB的根本數據單位是矩陣,它的指令表達式與數學、工程中常用的形式十分相似,故用MATLAB來解算問題要比用C、FORTRAN等語言完成相同的事情簡捷得多,并且MATLAB也吸收了像Maple等軟件的優(yōu)點,使MATLAB成為一個強大的數學軟件。在新的版本中也參加了對C、FORTRAN、C++、JAVA的支持??梢灾苯诱{用,用戶也可以將自己編寫的實用程序導入到MATLAB函數庫中方便自己以后調用,此外許多的MATLAB愛好者都編寫了一些經典的程序,用戶可以直接進行下載就可以用。3.2預處理圖像預處理環(huán)節(jié),主要采用了灰度化、中值濾波、Robert梯度算子銳化及邊緣檢測。為下一環(huán)節(jié)的圖像差分和膨脹處理做準備?;叶然瘓D像灰度化就是使彩色的R,G,B分量值相等的過程。由于R,G,B的取值范圍是[0,255],所以灰度的級別只有256級,即灰度圖像僅能表現256種顏色〔灰度〕?;叶然奶幚矸椒ㄖ饕腥缦?種:(1)最大值法:使R,G,B的值等于3值中最大的一個,即R=G=B=max(R,G,,B)式(3.1)顯然,最大值法會形成亮度很高的灰度圖像。(2)平均值法:使R,G,B的值求出平均值,即R=G=B=R+G+B3式(3.2平均值法會形成比擬柔和的灰度圖像。(3)加權平均值法:根據重要性或其他指標給R,G,B賦予不同的權值,并使R,G,B的值加權平均,即R=G=B=WrR+W其中Wr,Wg,Wb分別為R,G,B的權值。Wr,Wg,Wb取不同的值,加權平均值法就形成不同的灰度圖像。由于人眼對綠色的敏感度最高,紅色次之,對藍色最低,因此使Wr>Wg>WVgray=0.30R+0.59G+0.11B式時,能得到最合理的灰度圖像。MATLAB中,RGB模式的圖像進行灰度化處理時,調用函數語句為:I=imread('*.bmp');J=rgb2gray(I);即可實現對彩色圖像的灰度化處理,為后續(xù)工作做好準備。3.2.2背景差分目標分割要對圖像進行差分處理,以獲得目標區(qū)域,克服噪聲影響。背景差分即是將當前圖像與背景圖像的對應像素值相減,再對差值取絕對值后輸出,得到包含有目標信息的圖像。背景差分需要設定一個閾值,將亮度大于閾值的點作為目標點,反之作為背景點,從而得到目標區(qū)域,這種方法適合用來在背景圖像較為穩(wěn)定的情況下檢測目標。閾值選取方法分為固定閾值和自適應閾值。固定閾值是一個常數,當圖像使用固定閾值得不到有效分割時,就使用自適應閾值進行處理。自適應閾值是圖像灰度值的函數,隨圖像灰度值分布的不同而調整,適用于亮度不均的圖像。對于靜態(tài)場景,使用固定閾值即可得到有效分割。通過分析背景圖像的灰度值,閾值的選取公式為:T=μ+K×σ式(3.5)其中,μ為背景均值,σ為背景標準差,K一般取3~5,。閾值處理的公式如下:gx,y=1f(x,y)>T其中,g(x,y)表示閾值處理后的二值圖像,T表示閾值,f(x,y)為待處理圖像的灰度值。本文選取的圖像是靜態(tài)的,背景圖像是直接獲取的,所以選用固定閾值。經過分析背景圖像的灰度值,閾值T=0.2。在背景差分時,為了應對非道路局部的變化〔如光照緩慢變化、路旁樹枝的搖動、草地上出現行人等〕,由于實際場景中這些變化不一定會單獨出現,所以單高斯模型無法應對這樣的背景變化,所以選用高斯混合模型對背景圖像進行更新,以應對背景場景出現的干擾,保證差分后圖像只出現待識別的目標圖像。高斯混合模型使用K〔一般為3~5〕個高斯模型來表征圖像中各個像素點的特征,統計圖像中相同像素點的最近t幀值Xt,式(3.7)式中,μi表示該像素點顏色值的R、G、B分量;權值ωi≥0;i=1,2,…,k。k個高斯分布總是按照優(yōu)先級λi,t=ωi,tσi,t2(對某像素點的每個樣本更新點Xt+1,判斷其與已存在的K個高斯分布進行匹配,假設滿足條件Xt+1-μt<2.5σi,那么Xt+1高斯分布的權重、均值和方差分別按照式(3.8)、式(3.9)和式(3.10)更新。對于匹配的分布Mi,t+1=1;否那么ωi,t+1=μi,t+1=1-ρμi,t其中,ρ=αωi,t+1。高斯模型更新完畢之后,重新排列優(yōu)先級λi,t式(3.11)式(3.12)該模型中有兩個重要參數α和H,其中1/α表示訓練P(Xt)的最大樣本空間中的樣本點個數;H用來確定作為背景模型的分布算法總體的流程如下:(1)計算當前像素值是否歸屬于存在的正態(tài)分布中的某一個;(2)假設找到一個匹配,那么更新每個分布的權值ω,引入一個學習參數α,其大小由噪聲水平決定,更新公式為:ωt(3)假設沒有找到任何匹配,那么認為當前像素值屬于前景,并用一個新的正態(tài)分布取代排序在最后面的正態(tài)分布。新的正態(tài)分布ωtωt=在具體實驗中,通常把n個分布中ωσ在進行背景差分后二值化,再對目標區(qū)域進行膨脹處理,對目標區(qū)域進行標記,求取最小外接矩形。3.2.3二值化圖像的二值化處理就是將圖像上的點的灰度置為0或255,也就是使整個圖像呈現出明顯的黑白效果。即將256個亮度等級的灰度圖像通過適當的閾值選取而獲得仍然可以反映圖像整體和局部特征的二值化圖像。二值化的原理即設定某一閾值,將灰度圖像的像素分成大于閾值的像素群和小于閾值的像素群兩局部。設輸人灰度圖像函數為,輸出二值圖像函數為,那么gx,y=0f(x,y)<T閾值T是把目標和背景區(qū)分開的標尺,選取適當的閾值就是既要盡可能保存圖像信息,又要盡可能減少背景和噪聲的干擾,這是選擇閾值的原那么。MATLAB中二值化圖像函數主要有dither和im2bw函數。dither函數通過顏色抖動來到達轉換圖像的目的。語法如下:BW=dither(I)Image是圖像矩陣資料,BW是二值化圖像矩陣;而im2bw函數通過對灰度值進行閾值判斷的方法到達目的。語法如下:BinaryImage=im2bw(Image,[Level])Image是輸入圖像矩陣資料,Level是二值化程度值,介于0到1之間,BW是二值化圖像矩陣。本文采用im2bw函數。3.2.4中值濾波中值濾波是一種非線性濾波,一般采用含有奇數個點的滑動窗口,用窗口中個點灰度值的中值來代替指定點的灰度值。對于奇數個元素,中值是按照大小排序后中間的數值;對于偶數個元素,中值是指排序后中間兩個元素灰度值的平均值。這里,中心點像素減去近鄰8個值的中值來置換該點像素。輸入像素f(x,y)的8個臨近像素值從小到大排列并標記為:x0、x1、x3,…g(x,y)=f(x,y)-m(x,y)式(3.15)式中m(x,y)定義為:mx,y=x3+對于二維序列進行中值濾波時,濾波窗口也是二維的,但這種二維窗口可以有各種不同的形狀,如線狀、方形、圓形、十字形、圓環(huán)形等。二維數據的中值濾波可以表示為:式(3.16)在實際使用窗口時,窗口的尺寸一般先用3×3,再取5×5逐漸增大,直到其濾波效果滿意為止。對于有緩變的較長輪廓線物體的圖像,采用方形或圓形窗口為宜,對于包含尖頂角物體的圖像,適宜用十字形窗口。本文選取的圖像噪聲水平較小,所以中值濾波處理選用3×3模板。相關的MATLAB語句為:Image_BW_medfilt=medfilt2(image_bw,[33]);figure;imshow(Image_BW_medfilt)中值濾波器是典型的低通濾波器,由于它在實際運算過程中并不需要圖像的統計特性,所以比擬方便。在一定的條件下,對濾除脈沖干擾及圖像掃描噪聲最為有效,但對于線、尖頂等細節(jié)多的圖像不宜采用中值濾波。中值濾波對圖像的平滑有顯著效果,很好地去除了椒鹽噪聲,并有效保存了圖像邊緣細節(jié)。3.2.5Robert梯度算子銳化和邊緣檢測梯度算子用于計算梯度值,通常認為它也是邊界提取算子,具有極值性、位移不變性和旋轉不變性。圖像在點處的梯度定義為一個二維列矢量:式(3.17)梯度的幅值即模值,為:式(3.18)梯度的方向在最大變化率方向上,方向角可表示為:式(3.19)在不引起歧義時,為了方便,一般將梯度矢量的模值簡稱為梯度。實用中,梯度模還有很多近似式,此處不加列舉。對圖像f施用梯度模算子,便可產生所謂的梯度圖像g,g與f像素之間的關系是式(3.20)式中G為梯度模算子。由于梯度圖像g反映了圖像f的灰度變化分布信息,因此對其進行某種適當的處理和變換,或將變換后的梯度圖像和原圖像組合作為f銳化后的圖像。Robert梯度算子用4點進行差分,以求得梯度,即采用對角方向相鄰兩像素之差,故也稱為四點差分法。對應的水平和垂直方向的模板為:式(3.21)標注·的是當前像素的位置(i,j)為當前像素的位置,其計算公式如下:Gi,j=fi,j-f(i+1,j+1)當梯度計算完后,如何確定銳化輸出的圖像是一個需要考慮的問題,根據需要,可以生成不同的梯度增強圖像。具體有五種方法:(1)直接以梯度值作為銳化輸出,即:f'i,j=G(i,j)式(這種方法直截了當,簡單易行,缺點是增強的圖像僅顯示灰度變化劇烈的邊緣,對灰度變化平緩的區(qū)域那么呈現黑色,整體表現暗的特性。(2)輔以門限判決:f'i,j=Gi,j式中,T是一個非負的門限值。只有梯度超過一定值時才用梯度值替代原灰度值。適中選取T值,既可以增強明顯的邊緣,又不會破壞灰度變化平緩的區(qū)域。(3)給邊緣規(guī)定一個特定的灰度級,即:f'x,y=LG式中,T是一個非負的門限值,LG(4)給背景規(guī)定特定的灰度級,即:f'i,j=Gi,j這種方法將背景用一個特定的灰度級來實現LB(5)將背景與邊緣用二值圖像來表示,即:f'i,j=LGG(i,j)≥T這種方法主要突出了邊界的位置,其中LG,LRobert梯度算子對噪聲較敏感,常用于不含噪聲的圖像邊緣點檢測。梯度算子類邊緣檢測方法的效果類似于高通濾波,有增強高頻分量,抑制低頻分量的作用。圖像邊緣得到銳化加強,圖像的細節(jié)得到加強?;叶绕骄徸兓木植坑捎谔荻容^小而顯得很黑。第2章中說過,梯度算子也可以用來進行邊緣檢測。Robert算子適用于邊緣明顯且噪聲較少的圖像分割,常用來提取道路圖像。本文中,道路圖像并不復雜,而且在邊緣檢測之前已經用中值濾波對圖像進行了處理,消除了噪聲,所以這里仍然采用Robert算子進行邊緣檢測。Robert算子的定義為:Gf(x,y)=f(x+1,y+1)-f(x,y)2+由于上述算法的處理工作量很大,因此在實用上常采用絕對差算法對上式化簡如下:Gf(x,y)≈fx+1,y-fGf(x,y)≈fx+1,y+1Robert算子采用對角線方向的相鄰兩像素之差進行梯度幅度檢測,其檢測水平、垂直方向邊緣的性能要好于斜線方向邊緣,且檢測定位精度比擬高,但對噪聲較敏感。3.3膨脹處理和目標識別3.3.1膨脹處理對于灰度圖像,膨脹就是在結構元素的范圍內,求取結構元素與圖像中對應元素的和,看哪個和最大,然后這個和就作為圖像中心點的值,當然這個中心點是指和結構元素中心位置對應的那個圖像位置上的,然后繼續(xù)滑動結構元素。而對于二值圖像,膨脹就是用結構元素在圖像上移動,只要結構元素中有一個點與圖像中的點重疊即可,膨脹的結果是結構元素中心點劃過的區(qū)域的內部,所以圖像的邊緣就被擴大了。設二值圖像為F,結構元素為S,當一個結構元素S的原點移動到圖像的點(x,y)處時,將其記作Sxy。此時圖像X被結構元素SD=F?S=其含義為,當結構元素S的原點移動到(x,y)位置,假設S中包含至少一個像素值為1的點,那么在膨脹后的圖像上該點為1,否那么為0。具體步驟如下:(1)將預先設定好形狀以及原點位置的結構元素的原點移動到圖像中可包容的所有像素點;(2)判斷該結構元素所覆蓋范圍內的像素值是否存在至少一個為1的點,假設存在,那么膨脹后的圖像中與結構元素原點相同位置上的像素值置為1,假設該覆蓋范圍內的所有像素的值為0,那么膨脹后的圖像中與結構元素原點相同位置上的像素值置為0.(3)對原圖中所有像素值為1的點重復前兩步。MATLAB中實現膨脹處理的函數如下:BW2=dilate(BW1,SE)BW2=dilate(BW1,SE,…,n)其中,BW2=dilate(BW1,SE)表示使用二值結構要素矩陣SE對圖像數據矩陣BW1執(zhí)行膨脹操作。輸入圖像BW1的類型為double或unit8,輸出圖像BW2的類型為unit8。而BW2=dilate(BW1,SE,…,n)表示執(zhí)行膨脹操作n次。3.3.2目標識別膨脹處理后對膨脹后的圖像進行標記,標記區(qū)域的方法是利用每一個區(qū)域的連通域來定的。MATLAB中的bwlabel函數可以在二值圖像中標記連通區(qū)域,主要對二維二值圖像中各個別離局部進行標注〔多維用bwlabeln,用法類似,這里不作介紹〕。用法介紹如下:L=bwlabel(BW,n)[L,num]=bwlabel(BW,n)返回一個和BW大小相同的L矩陣,包含了標記了BW中每個連通區(qū)域的類別標簽,這些標簽的值為1、2、num〔連通區(qū)域的個數〕。n的值為4或8,表示是按4連通尋找區(qū)域或按8連通尋找,默認為8。這里num返回的就是BW中連通區(qū)域的個數。接下來對標記圖像進行最小外接矩形的計算。圖像的外接矩形是指完全包含了圖形上所有的點、線,且各邊均與圖形相接觸的矩形。一個圖形的外接矩形有無窮多個,其中面積最小者稱為最小外接矩形。由定義可知幾何圖形的最小外接矩形是唯一的,它在一定程度上描述了該圖形的某些幾何特征即長和寬。計算最小外接矩形的一種方法是旋轉法,即將圖像在90(1)將圖像邊緣點繞該圖像形心點x0,(2)計算出每旋轉θ后的最大橫坐標xmax、最小橫坐標xmin和最大縱坐標ymax、最小縱坐標yS=xmax-(3)在旋轉θ,重復執(zhí)行前兩步,直到旋轉角度到達90(4)在所有的圖像邊緣外接矩形面積中,找出面積S最小時的xmax、xmin、ymax為保證精度,每次旋轉的角度θ=輸入目標圖像輸入目標圖像計算形心設置每次旋轉角度θ旋轉9計算最小和最大橫的坐標與縱坐標求出外接矩形面積找出面積最小的外接矩形求出面積最小時的坐標值NY圖3.1旋轉法對最小外接矩形計算后,對目標進行特征參數提取,提取出表征目標信息的特征參量,即可到達定位和識別目標障礙物的目的。特征參數提取是要獲得表征目標的特征參量,作為檢測結果輸出,對于二值圖像,常使用質心作為特征參量來表征目標位置信息。具體方法是對標記區(qū)域進行質心運算,然后找到該標記區(qū)域在x軸和y軸上區(qū)域的最正確邊緣點。質心的計算公式如下:式(3.33)式中,xm和ym分別為質心的橫縱坐標,n為圖像中目標區(qū)域的像素個數,xk和yk分別為確定目標的質心后,就可以通過質心位置確定目標位置,加上最小外接矩形的標示,從而到達定位和識別目標障礙物的目的。3.4小結基于數字圖像處理的障礙物的識別需要在圖像處理環(huán)節(jié)對待識別的圖像進行較好的處理,首先進行對圖像灰度化和去噪處理,然后銳化了圖像中目標的邊緣之后進行圖像的背景差分,將圖像中的感興趣區(qū)域和非感興趣區(qū)域區(qū)別開,之后對目標圖像進行膨脹處理、最小外接矩形計算,最后定位識別。對靜態(tài)圖像的處理和識別較視頻圖像簡單,特別是最小外接矩形的計算是定位和識別的關鍵。4總結與展望作為一種比擬有潛力的識別技術,障礙物的識別受到了廣泛關注,開發(fā)出可靠高效的障礙物識別方法不但具有重要的理論意義,而且有很高的實用價值。本文針對圖像的特性,分析和研究了障礙物識別的相關技術,主要從數字圖像處理的角度出發(fā),將中值濾波法、梯度法銳化與邊緣檢測、形態(tài)學膨脹處理和最小外接矩形應用于障礙物的識別。總結前面的研究,本文完成了以下工作:(1)綜合分析了障礙物識別技術的開展現狀和幾種趨勢,選擇了通過數字圖像處理技術,以路面圖像為例,主要是用中值濾波對圖像進行去噪處理,然后用Robert算子對圖像進行分割。(2)對分割后的圖像進行了膨脹處理,將

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯系上傳者。文件的所有權益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網頁內容里面會有圖紙預覽,若沒有圖紙預覽就沒有圖紙。
  • 4. 未經權益所有人同意不得將文件中的內容挪作商業(yè)或盈利用途。
  • 5. 人人文庫網僅提供信息存儲空間,僅對用戶上傳內容的表現方式做保護處理,對用戶上傳分享的文檔內容本身不做任何修改或編輯,并不能對任何下載內容負責。
  • 6. 下載文件中如有侵權或不適當內容,請與我們聯系,我們立即糾正。
  • 7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

最新文檔

評論

0/150

提交評論