圖像處理與理解課件_第1頁
圖像處理與理解課件_第2頁
圖像處理與理解課件_第3頁
圖像處理與理解課件_第4頁
圖像處理與理解課件_第5頁
已閱讀5頁,還剩68頁未讀, 繼續(xù)免費閱讀

下載本文檔

版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進行舉報或認(rèn)領(lǐng)

文檔簡介

圖像處理與理解

人類通過眼、耳、鼻、舌、身接受信息,感知世界。約有75%的信息是通過視覺系統(tǒng)獲取的。數(shù)字圖象處理是用數(shù)字計算機處理所獲取視覺信息的技術(shù)。第一章

緒論一、數(shù)字圖像處理的發(fā)展概況及應(yīng)用發(fā)展:上世紀(jì)20年代Bartlane電纜圖片傳輸系統(tǒng)(紐約和倫敦之間海底電纜)傳輸一幅圖片所需的時間由一周多減少到小于3個小時;上世紀(jì)50年代,計算機的發(fā)展,數(shù)字圖像處理才真正地引起人們的巨大興趣;1964年,數(shù)字圖像處理有效地應(yīng)用于美國噴氣推進實驗室(J.P.L)對“徘徊者七號”太空船發(fā)回的大批月球照片的處理;隨后幾年,繼續(xù)用于空間研究計劃;同時,在生物醫(yī)學(xué)、工業(yè)生產(chǎn)、軍事上得到應(yīng)用;應(yīng)用:通信:圖象傳輸,電視電話,HDTV等宇宙探測:星體圖片處理遙感:地形、地質(zhì)、礦藏探查,森林、水利、海洋、農(nóng)業(yè)等資源調(diào)查,自然災(zāi)害預(yù)測,環(huán)境污染的監(jiān)測,氣象云圖生物醫(yī)學(xué):CT,NMR,X射線成象,B超,紅外圖象,顯微圖象應(yīng)用:工業(yè)生產(chǎn):產(chǎn)品質(zhì)量檢測,生產(chǎn)過程控制,CAD,CAM交通運輸軍事:軍事目標(biāo)偵察,制導(dǎo)系統(tǒng),警戒系統(tǒng),自動火器控制,反偽裝等公安:現(xiàn)場照片,指紋,手跡,印章,人像等處理和鑒別機器人視覺娛樂:電影特技,動畫,廣告等氣象云圖氣象預(yù)報遙感圖像處理

在國土資源調(diào)查與環(huán)境評價及災(zāi)害監(jiān)測中的應(yīng)用1998年長江洪水災(zāi)害遙感圖像超聲圖象PhotocourtesyPhilipsResearch

Ultrasoundexaminationduringpregnancy

醫(yī)學(xué)圖象軍事應(yīng)用目標(biāo)跟蹤軍事應(yīng)用軍事應(yīng)用計算機合成圖像

以通過遙感圖像處理分析為例,可涉及圖像處理的主要技術(shù)數(shù)據(jù)壓縮和轉(zhuǎn)換技術(shù)

通過數(shù)據(jù)壓縮和數(shù)據(jù)轉(zhuǎn)換技術(shù)的研究,減少數(shù)據(jù)載體空間,節(jié)省運算時間,實現(xiàn)不同星系遙感數(shù)據(jù)應(yīng)用的一體化。圖像校正

在理想情況下,衛(wèi)星圖像上的像素值只依賴于進入傳感器的輻射強度;而輻射強度又只與太陽照射到地面的輻射強度和地物的輻射特性(反射率和發(fā)射率)有關(guān),使圖像上灰度值的差異直接反映了地物目標(biāo)光譜輻射特性的差異,從而區(qū)分地物目標(biāo)。分類方法

基于光譜信息(圖像像素)的分類

根據(jù)像素在分類特征(波段)上的像素值,選擇分類器,利用統(tǒng)計方法對每一像元進行分類。通常需要對下面一些問題進行研究:①分類器的確定;②光譜類的確定;③選擇訓(xùn)練樣本產(chǎn)生統(tǒng)計參數(shù);④分類特征的選擇??臻g信息輔助分類

基于光譜信息的分類存在著一些缺陷:如有些地類在光譜上難以區(qū)分,如水庫與河流?;诳臻g信息的地類類型或形狀分類。如城鎮(zhèn)居民點圖斑的分類結(jié)果往往是由水體、植被以及不同類型的建筑等所組成。要用到的主要圖像處理技術(shù):圖像增強處理、圖像分割技術(shù)(區(qū)域、邊緣提取)、圖像特征提取、圖像描述等。自動目標(biāo)識別技術(shù)(AutomaticTargetRecognition-簡稱ATR)實時光學(xué)圖像相關(guān)識別系統(tǒng)的核心技術(shù)是自動目標(biāo)識別技術(shù)。由于ATR技術(shù)在軍事上是導(dǎo)彈精確制導(dǎo)和武器防御系統(tǒng)的關(guān)鍵技術(shù)之一,是武器智能化程度的一個重要標(biāo)準(zhǔn),也代表著一個國家的國防高科技的水平。以軍事應(yīng)用為例

可能涉及圖像處理的主要技術(shù)因此,從20世紀(jì)60年代開始,美、英、俄、法等國家已投入大量人力、物力和財力開展ATR的理論研究和實際應(yīng)用推廣,并取得顯著成果,美國在中東戰(zhàn)爭中的精確武器打擊是最典型的成功范例。當(dāng)前精確制導(dǎo)武器所取得的成果還是有限的,最主要的問題是目前主要還是依靠人在導(dǎo)彈發(fā)射前發(fā)現(xiàn)目標(biāo),然后人工鎖定首幀目標(biāo)圖像進行自動跟蹤,而不能實現(xiàn)不需人工參與的由導(dǎo)彈自動識別目標(biāo),做不到“打了不管”。特別是在復(fù)雜背景下,機器如何像人一樣自動識別目標(biāo),目前是相當(dāng)困難的。雖然從20世紀(jì)70年代開始人工智能、智能信息處理技術(shù)、計算機視覺的理論研究取得了重大的進展,但是由于ATR領(lǐng)域中研究的背景和對象的復(fù)雜性和多樣性,特別是在實際環(huán)境中,背景與目標(biāo)不僅有很大的動態(tài)變化范圍,而且它們以未知的方式變化。目前的ATR的研究都是在一定假設(shè)條件下建立的,一旦這些假設(shè)條件不成立或不再完全成立時,其ATR系統(tǒng)就不再有效。另外,目前國內(nèi)外研究的很多ATR方法和算法,除了存在很大的局限性外,在實時實現(xiàn)方面還有很大的距離。因此,當(dāng)前國外發(fā)達國家鑒于精確制導(dǎo)武器在未來戰(zhàn)爭中的重要地位,還在投入大量人力財力開展ATR研究,如美國國防部已將ATR技術(shù)列為二十一世紀(jì)的關(guān)鍵技術(shù)之一。

我國從二十世紀(jì)七十年代以來對ATR技術(shù)研究也投入較大的人力財力。國防科工委、航天部、電子工業(yè)部等很多研究所以及國內(nèi)重點高校如國防科大、哈工大、北理工、華中科技大學(xué)、東南大學(xué)等都在開展此項研究,取得不少重要研究成果。但總的來看還是處于理論方法和算法的研究,所研制的ATR系統(tǒng)還處于實驗室樣機階段,其性能還有待提高,離真正實戰(zhàn)的要求還有較大的距離。涉及圖像處理的主要技術(shù)圖像分割:雖然國內(nèi)外學(xué)者已提出很多種圖像分割算法,但由于背景的多變性和復(fù)雜性,至今為止還沒有一種能適用于各種背景的圖像分割算法。當(dāng)前提出的小波分析、模糊集、分形等新的智能信息處理方法有可能找到新的圖像分割方法。

特征提?。河嬎忝枋瞿繕?biāo)的特征,如目標(biāo)的幾何形狀特征、統(tǒng)計特征、矩特征、紋理特征等

圖像識別:統(tǒng)計模式識別、模糊模式識別、人工神經(jīng)網(wǎng)絡(luò)等

圖像跟蹤

動態(tài)場景的視覺監(jiān)控動態(tài)場景的視覺監(jiān)控是計算機視覺領(lǐng)域一個新興的應(yīng)用方向.對于視覺監(jiān)控系統(tǒng)而言,一般涉及到運動檢測、運動目標(biāo)分類、運動目標(biāo)的跟蹤以及監(jiān)視場景中目標(biāo)行為的理解與描述幾個過程。以安保系統(tǒng)應(yīng)用為例其中,運動檢測、目標(biāo)分類、人的跟蹤屬于視覺中的低級和中級處理部分(Low-levelandIntermediate-levelVision),而行為理解和描述則屬于高級處理(High-levelVision)。運動檢測、運動目標(biāo)分類與跟蹤是視覺監(jiān)控中研究較多的三個問題,而行為理解與描述則是近年來被廣泛關(guān)注的研究熱點,它是指對目標(biāo)的運動模式進行分析和識別,并用自然語言等加以描述。由于智能房間的門禁系統(tǒng)、軍事安全基地的視覺監(jiān)控系統(tǒng)、高級人機交互等應(yīng)用需求,基于運動視覺的生物特征識別技術(shù)研究日益顯得迫切和重要。例如,在人機交互中不僅需要機器能知道人是否存在、人的位置和行為,而且還需要利用特征識別技術(shù)來識別與其交流的人是誰。

人運動分析與生物特征識別相結(jié)合的視覺監(jiān)控目前已經(jīng)成為一個流行的研究方向,特別是非接觸式遠距離的身份識別研究——基于運動視覺的第二代生物特征識別技術(shù),近來倍受關(guān)注。例如,美國高級研究項目署DARPA在2000年資助的重大項目——HID計劃(HumanIdentificationataDistance),它的任務(wù)就是開發(fā)多模式的監(jiān)控技術(shù)以實現(xiàn)遠距離情況下人的檢測、分類和識別,從而增強國防、民用等場合免受恐怖襲擊的保護能力。近距離時一般可通過跟蹤人臉來加以身份識別;如果是遠距離的監(jiān)控,臉的特征可能被隱藏,或者分辨率太低不易識別,然而進入監(jiān)控領(lǐng)域的人的步態(tài)是可見的,這激活了步態(tài)作為一個獨特的生物行為特征應(yīng)用于人的身份鑒別。作為一種新的行為特征,步態(tài)還具有難于隱藏和偽裝、易于捕捉等優(yōu)點,而且它也是一定距離時唯一可感知的行為特征。步態(tài)識別旨在不考慮衣服、視角、背景等情況下根據(jù)人們走路的姿勢進行人的身份識別。由于步態(tài)是一種時空變化的運動模式,因此它的處理數(shù)據(jù)量相對較大。當(dāng)然,像其它生物特征一樣,步態(tài)也受一些諸如醉酒、懷孕、關(guān)節(jié)受傷等物理因素的影響。盡管步態(tài)識別是一個相當(dāng)新的研究領(lǐng)域,目前已涌現(xiàn)出一些嘗試性的工作馬里蘭大學(xué)、麻省理工學(xué)院等26家高?;蚬緟⑴c了該項目的研究工作,其目前焦點在于臉像、步態(tài)或者特定行為的識別。二、圖像與數(shù)字圖像1、“圖”與“像”的定義:“圖”是物體透射或反射光的分布;“像”是人的視覺系統(tǒng)對圖的接收在大腦中形成的印象或認(rèn)識。2、模擬圖像的表示(物理圖像,人眼能看到的圖像)當(dāng)圖像內(nèi)容隨時間變化時,為時變圖像或運動圖像。反之,為靜止圖像。由于人眼的視野是有限的,因此圖像在空間上是有界的,而且通常定義為矩形,即圖像函數(shù)在某一點的值常稱為強度或灰度,與圖像在這一點的亮度相對應(yīng),并用正實數(shù)表示,而且這個值的大小是有限的。圖像函數(shù)是一個二元、有界、非負(fù)的連續(xù)函數(shù)。上面討論的人眼能夠看到的圖像稱之為模擬圖像,它的函數(shù)是連續(xù)的、可解析的,因而是可積的,有可逆的付里葉變換等。但是計算機無法接受模擬形式的圖像。3、數(shù)字圖像的表示一幅模擬圖像經(jīng)過采樣和量化使其在空間上和數(shù)值上都離散化,形成一個數(shù)字點陣,通常采用等間隔采樣和均勻量化。像素灰度級圖像分解成像素的方法根據(jù)平面設(shè)置有正方形陣列,正六角形陣列,正三角形陣列,其中正方形陣列最為常用。對于一幅圖像而言,從模擬圖像中獲取數(shù)字圖像,則必須按下圖所示的過程進行空間采樣和量化。采樣(Sampling)是指將空間上或時間上連續(xù)的圖象(模擬圖象)變換成離散采樣點(象素)集合的一種操作。

在實際的采樣過程中,采樣點間隔的選取是一個極其關(guān)鍵的問題。應(yīng)滿足采樣定理。

量化經(jīng)過采樣后,圖象已被分解成在時間和空間上離散的象素,但這些象素,但這些象素值(濃淡值)仍然是連續(xù)量。量化則是指把這些連續(xù)的濃淡值變換成離散值(整數(shù)值)的過程。圖象的量化分為兩類,一類是等間隔量化,另一類是非等間隔量化。等間隔量化即將采樣值的灰度范圍進行等間隔分于象素灰度值在黑-白范圍內(nèi)均勻分布的圖象,其量化誤差可變得最小,故又稱為均勻量化或線性量化。非等間隔量化

(1)將小的灰度值的級別間隔細(xì)分,而將大的灰度值的級別間隔粗分的方法,如對數(shù)量化;(2)使用象素灰度值的概率密度函數(shù),使輸入灰度值和量化級的均方誤差最小的方法,如Max量化;(3)在某一范圍內(nèi)的灰度值頻繁產(chǎn)生,而其它范圍灰度值幾乎不產(chǎn)生的場合,采用在這一范圍內(nèi)進行細(xì)量化,而該范圍之外進行粗量化。這種方法,其量化級數(shù)不變,又能降低量化誤差,稱錐形量化。分辨率640x480分辨率不同的圖象比較分辨率320x240分辨率160x120分辨率80x60分辨率640x480分辨率320x240分辨率160x120分辨率80x60查視力=檢測分辨率?

三、數(shù)字圖像處理(1)圖像處理

(2)

圖像識別

(3)

圖像理解

四、數(shù)字圖像處理的特點:處理信息量大;占用的頻帶較寬(圖像帶寬5.6MHZ,語音僅4KHZ);像素不獨立、相關(guān)性強;三維景物的二維投影;處理結(jié)果如果給人評價,受人的因素影響大。

五、

課程主要討論內(nèi)容圖像變換圖像壓縮編碼圖像增強和復(fù)原圖像分割圖像描述圖像識別圖像處理系統(tǒng)簡介教材:夏良正,李久賢數(shù)字圖

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負(fù)責(zé)。
  • 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時也不承擔(dān)用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

評論

0/150

提交評論