物體識(shí)別過(guò)程_第1頁(yè)
物體識(shí)別過(guò)程_第2頁(yè)
物體識(shí)別過(guò)程_第3頁(yè)
物體識(shí)別過(guò)程_第4頁(yè)
物體識(shí)別過(guò)程_第5頁(yè)
已閱讀5頁(yè),還剩1頁(yè)未讀, 繼續(xù)免費(fèi)閱讀

下載本文檔

版權(quán)說(shuō)明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請(qǐng)進(jìn)行舉報(bào)或認(rèn)領(lǐng)

文檔簡(jiǎn)介

1、在計(jì)算機(jī)視覺(jué)領(lǐng)域,一個(gè)典型的物體識(shí)別系統(tǒng)往包含以下幾個(gè)階段: 預(yù)處理, 特征提取,特征選擇,建模,匹配,定位。123預(yù)處理預(yù)處理幾乎是所有計(jì)算機(jī)視覺(jué)算法的第一步,其動(dòng)機(jī)是盡可能在不改變圖像 承載的本質(zhì)信息的前提下,使得每張圖像的表觀特性(如顏色分布,整體明暗, 尺寸大小等)盡可能的一致,以便于之后的處理過(guò)程。預(yù)處理有生物學(xué)的對(duì)應(yīng)。 瞳孔,虹膜和視網(wǎng)膜上的一些細(xì)胞的行為類似于某些預(yù)處理步驟,如自適應(yīng)調(diào)節(jié)入射光的動(dòng)態(tài)區(qū)域等等。預(yù)處理和特征提取之間的界線不完全分明。 有時(shí)兩者交 叉在一起。它主要完成模式的采集、模數(shù)轉(zhuǎn)換、濾波、消除模糊、減少噪聲、糾 正幾何失真等預(yù)處理操作。因此也要求相應(yīng)的設(shè)備來(lái)實(shí)現(xiàn)

2、。預(yù)處理經(jīng)常與具體的采樣設(shè)備和所處理的問(wèn)題有關(guān)。 例如,從圖象中將汽車 車牌的號(hào)碼識(shí)別出來(lái),就需要先將車牌從圖像中找出來(lái), 再對(duì)車牌進(jìn)行劃分,將 每個(gè)數(shù)字分別劃分開(kāi)。做到這一步以后,才能對(duì)每個(gè)數(shù)字進(jìn)行識(shí)別。以上工作都 應(yīng)該在預(yù)處理階段完成。從理論上說(shuō),像預(yù)處理這種先驗(yàn)式的操作是不應(yīng)該有的。 因?yàn)樗⒉粸槿魏?目的服務(wù),所以完全可以隨意為之而沒(méi)有“應(yīng)該怎么做”的標(biāo)準(zhǔn),大部分情況下 預(yù)處理是看著實(shí)驗(yàn)結(jié)果說(shuō)話。這是因?yàn)橛?jì)算機(jī)視覺(jué)目前沒(méi)有一個(gè)整體的理論框 架,無(wú)法從全局的高度來(lái)指導(dǎo)每一個(gè)步驟應(yīng)該如何進(jìn)行。在物體識(shí)別中所用到的典型的預(yù)處理方法不外乎直方圖均衡及濾波幾種。 像高斯模糊可以用來(lái)使得之后 的梯

3、度計(jì)算更為準(zhǔn)確;而直方圖均衡可以克服一定程度的光照影響。值得注意的是,有些特征本身已經(jīng)帶有預(yù)處理的屬性,因此不需要再進(jìn)行預(yù)處理操作。預(yù)處理通常包括五種基本運(yùn)算:(1) 編碼:實(shí)現(xiàn)模式的有效描述,適合計(jì)算機(jī)運(yùn)算。(2) 閥值或者濾波運(yùn)算:按需要選出某些函數(shù),抑制另一些。(3) 模式改善:排除或修正模式中的錯(cuò)誤,或不必要的函數(shù)值。(4) 正規(guī)化:使某些參數(shù)值適應(yīng)標(biāo)準(zhǔn)值,或標(biāo)準(zhǔn)值域。(5) 離散模式運(yùn)算:離散模式處理中的特殊運(yùn)算。2.4特征提取特征提取的目的是從模式樣本中提取能代表該模式特有的性質(zhì)。 這是模式分 類中最關(guān)鍵的一步,但又是最難以控制的一步。其準(zhǔn)則是提取盡量少的特征,而 能使分類的誤差最

4、小。但隨之而來(lái)就有了矛盾,特征提取在分類之前完成,事先 并不知道哪些特征能使分類誤差最小,目前還無(wú)法解決這個(gè)矛盾。特征提取負(fù)責(zé) 從圖像中得到重要的信息以交給下一層使用,而忽略不太重要的信息。特征提取 的設(shè)計(jì)關(guān)鍵點(diǎn)在于在“哪里提取特征”及“提取什么特征”。對(duì)于“在哪里提取特征”這個(gè)問(wèn)題,有兩種答案。某些系統(tǒng)僅在那些“應(yīng)該 提取”的地方提取特征,以保證得到的特征都是有效的,同時(shí)處理時(shí)間不會(huì)太長(zhǎng)。 為此就必須設(shè)計(jì)“興趣點(diǎn)檢測(cè)器”以在真正提取特征之前找到那些位置。此類檢 測(cè)器的設(shè)計(jì)思路是希一望這些點(diǎn)在仿射變換下保持不變,這樣就能獲得對(duì)于扭曲及光線變化的魯棒性。另一些系統(tǒng)則采用密集采樣方式,對(duì)于圖像上的

5、每一個(gè)點(diǎn) 都進(jìn)行特征提取。前一種方式具有效率高的特點(diǎn),然而如何選取興趣點(diǎn)檢測(cè)器本 身就是一個(gè)相當(dāng)艱難的任務(wù),并且會(huì)給系統(tǒng)引入不適當(dāng)?shù)南闰?yàn),使得最終結(jié)果隨 著被測(cè)物體類別的不同會(huì)有偏離,與物體識(shí)別的精神不相符合;后一種方式速度 是其較大的問(wèn)題。對(duì)于“提取什么特征”這個(gè)問(wèn)題,答案則要豐富許多。對(duì)于局部特征,已開(kāi) 發(fā)的系統(tǒng)中已存在很多可用的。局部特征也可以分為形狀(Shape)及材質(zhì)(Texture )兩類。這兩類特征編碼本質(zhì)上不同的信息,有不同的能力。形狀特征, 如線段,曲率,其具有的一大特性是對(duì)于光照及形變的不變性,然而同時(shí)也有提取時(shí)間長(zhǎng)及對(duì)遮擋敏感的缺點(diǎn),某些方法由于數(shù)學(xué)上的限制,無(wú)法用于自相

6、交或 者非閉合曲線等等在自然圖像中司空見(jiàn)慣的情況。另一方面,一些材質(zhì)特征,如圖像小塊,小波系數(shù)等等,提取時(shí)間相對(duì)較短,并且對(duì)于遮擋的抵抗強(qiáng)些,但是 缺乏各方面的不變性;還有一些材質(zhì)特征如直方圖,則具有相當(dāng)強(qiáng)的變換不變性, 但代價(jià)是丟失了空間信息。近年來(lái),子空間方法,如主成分分析(PCA),辨別成分分析(LDA),也成為 一種相對(duì)重要的特征提取手段。這種方法將圖像拉長(zhǎng)成為高維空間的向量, 并進(jìn) 行奇異值分解以得到特征方向。人臉識(shí)別便是其較為成功的應(yīng)用范例。 此類方法 能處理有全局噪聲的情況,并且模型相當(dāng)簡(jiǎn)單易實(shí)現(xiàn);然而這種算法割裂了圖像 的內(nèi)部結(jié)構(gòu),因此在本質(zhì)上是非視覺(jué)的,模型的內(nèi)在機(jī)制較難令人

7、理解,也沒(méi)有 任何機(jī)制能消去施加于圖像上的仿射變換。2.2圖像特征提取方法圖像特征提取就是提取出一幅圖像中不同于其他圖像的根本屬性,以區(qū)別不同的圖像。如灰度、亮度、紋理和形狀等等特征都是與圖像的視覺(jué)外觀相對(duì)應(yīng)的; 而還有一些則缺少自然的對(duì)應(yīng)性,如顏色直方圖、灰度直方圖和空間頻譜圖等。基于圖像特征進(jìn)行物體識(shí)別實(shí)際上是根據(jù)提取到圖像的特征來(lái)判斷圖像中 物體屬于什么類別。形狀、紋理和顏色等特征是最常用的視覺(jué)特征, 也是現(xiàn)階段 基于圖像的物體識(shí)別技術(shù)中采用的主要特征。下面分別介紹一下圖像的形狀、紋 理和顏色特征的提取方法。2.2.1圖像形狀特征提取形狀特征是反映出圖像中物體最直接的視覺(jué)特征,大部分物體

8、可以通過(guò)分辨 其形狀來(lái)進(jìn)行判別。所以,在物體識(shí)別中,形狀特征的正確提取顯得非常重要。常用的圖像形狀特征提取方法有兩種:基于輪廓的方法和基于區(qū)域的方法。 這兩種方法的不同之處在于:對(duì)于基于輪廓的方法來(lái)說(shuō),圖像的輪廓特征主要針 對(duì)物體的外邊界,描述形狀的輪廓特征的方法主要有: 樣條、鏈碼和多邊形逼近 等;而在基于區(qū)域的方法中,圖像的區(qū)域特征則關(guān)系到整個(gè)形狀區(qū)域,描述形狀的區(qū)域特征的主要方法有:區(qū)域的面積、凹凸面積、形狀的主軸方向、縱橫比、 形狀的不變矩等。這些關(guān)于形狀的特征目前已得到了廣泛的應(yīng)用。典型的形狀特 征描述方法有:邊界特征法,傅里葉形狀描述符法,幾何參數(shù)法,形狀不變矩法。222圖像紋理特

9、征提取圖像的紋理是與物體表面結(jié)構(gòu)和材質(zhì)有關(guān)的圖像的內(nèi)在特征,反映出來(lái)的是圖像的全局特征。圖像的紋理可以描述為:一個(gè)鄰域內(nèi)像素的灰度級(jí)發(fā)生變化的 空間分布規(guī)律,包括表面組織結(jié)構(gòu)、與周圍環(huán)境關(guān)系等許多重要的圖像信息。典 型的圖像紋理特征提取方法有:統(tǒng)計(jì)方法,幾何法,模型法,信號(hào)處理法。典型 的統(tǒng)計(jì)方法是灰度共生矩陣紋理特征分析方法,幾何法是建立在基本的紋理元素 理論基礎(chǔ)上的一種紋理特征分析方法,模型法是將圖像的構(gòu)造模型的參數(shù)作為紋 理特征,而信號(hào)處理法主要是小波變換為主。2.2.3圖像顏色特征提取圖像的顏色特征描述了圖像或圖像區(qū)域的物體的表面性質(zhì), 反映出的是圖像 的全局特征。一般來(lái)說(shuō),圖像的顏色

10、特征是基于像素點(diǎn)的特征, 只要是屬于圖像 或圖像區(qū)域內(nèi)的像素點(diǎn)都將會(huì)有貢獻(xiàn)。 典型的圖像顏色特征提取方法有:顏色直 方圖,顏色集,顏色矩。顏色直方圖是最常用的表達(dá)顏色特征的方法,它的優(yōu)點(diǎn)是能簡(jiǎn)單描述圖像中 不同色彩在整幅圖像中所占的比例,特別適用于描述一些不需要考慮物體空間位 置的圖像和難以自動(dòng)分割的圖像。而顏色直方圖的缺點(diǎn)是它無(wú)法描述圖像中的某 一具體的物體,無(wú)法區(qū)分局部顏色信息。顏色集可以看成是顏色直方圖的一種近似表達(dá)。 具體方法是:首先將圖像從 RGB顏色空間轉(zhuǎn)換到視覺(jué)均衡的顏色空間;然后將視覺(jué)均衡的顏色空間量化;最 后,采用色彩分割技術(shù)自動(dòng)地將圖像分為幾個(gè)區(qū)域, 用量化的顏色空間中的某

11、個(gè) 顏色分量來(lái)表示每個(gè)區(qū)域的索引,這樣就可以用一個(gè)二進(jìn)制的顏色索引集來(lái)表示一幅圖像顏色矩方法是基于圖像中任何的顏色分布都可以用相應(yīng)的矩來(lái)表示這個(gè)數(shù) 學(xué)基礎(chǔ)上的。由于顏色分布信息主要集中在低階矩中,因此,表達(dá)圖像的顏色分 布僅需要采用顏色的一階矩、二階矩和三階矩。125特征選擇再好的機(jī)器學(xué)習(xí)算法,沒(méi)有良好的特征都是不行的 ;然而有了特征之后,機(jī) 器學(xué)習(xí)算法便開(kāi)始發(fā)揮自己的優(yōu)勢(shì)。 在提取了所要的特征之后,接下來(lái)的一個(gè)可 選步驟是特征選擇。特別是在特征種類很多或者物體類別很多, 需要找到各自的 最適應(yīng)特征的場(chǎng)合。嚴(yán)格地來(lái)說(shuō),任何能夠在被選出特征集上工作正常的模型都 能在原特征集上工作正常,反過(guò)來(lái)進(jìn)行

12、了特征選擇則可能會(huì)丟掉一些有用的特 征;不過(guò)由十計(jì)算上的巨大開(kāi)銷,在把特征放進(jìn)模型里訓(xùn)練之前進(jìn)行特征選擇仍 然是相當(dāng)明智的。126建模一般物體識(shí)別系統(tǒng)賴以成功的關(guān)鍵基礎(chǔ)在于,屬于同一類的物體總是有一些 地方是相同的。而給定特征集合,提取相同點(diǎn),分辨不同點(diǎn)就成了模型要解決的 問(wèn)題。因此可以說(shuō)模型是整個(gè)識(shí)別系統(tǒng)的成敗之所在。 對(duì)于物體識(shí)別這個(gè)特定課 題,模型主要建模的對(duì)象是特征與特征之間的空間結(jié)構(gòu)關(guān)系;主要的選擇準(zhǔn)則, 一是模型的假設(shè)是否適用于當(dāng)前問(wèn)題;二是模型所需的計(jì)算復(fù)雜度是否能夠承 受,或者是否有盡可能高效精確或者近似的算法。2.7匹配在得到訓(xùn)練結(jié)果之后(在描述、生成或者區(qū)分模型中常表現(xiàn)為一

13、簇參數(shù)的取 值,在其它模型中表現(xiàn)為一組特征的獲得與存儲(chǔ)),接下來(lái)的任務(wù)是運(yùn)用目前的 模型去識(shí)別新的圖像屬于哪一類物體, 并且有可能的話,給出邊界,將物體與圖 像的其它部分分割開(kāi)。一般當(dāng)模型取定后,匹配算法也就自然而然地出現(xiàn)。 在描 述模型中,通常是對(duì)每類物體建模,然后使用極大似然或是貝葉斯推理得到類別 信息;生成模型大致與此相同,只是通常要先估出隱變量的值, 或者將隱變量積 分,這一步往往導(dǎo)致極大的計(jì)算負(fù)荷; 區(qū)分模型則更為簡(jiǎn)單,將特征取值代入分 類器即得結(jié)果。128定位在成功地識(shí)別出物體之后,對(duì)物體進(jìn)行定位成為進(jìn)一步的工作。一些模型, 如描述生成模型,或是基于部分的模型天生具有定位的能力,因

14、為它們所要處理 的對(duì)象就是特征的空間分布,而特征包方法相對(duì)較難定位,即使是能定位,準(zhǔn)確 程度也不如前者。不過(guò)近年來(lái)經(jīng)過(guò)改進(jìn)的特征包方法也可以做相當(dāng)精確的定位。 一部分是因?yàn)閳D像預(yù)分割及生成模型的引入, 另一部分則歸功于一些能夠?qū)μ卣?包得到的特征進(jìn)行重構(gòu)的方法。126分類器分類器是模式識(shí)別中研究最成熟的部分。按特征類型分為數(shù)值型分類器和符 號(hào)型兩大類。數(shù)值型分類器包括統(tǒng)計(jì)分類器(統(tǒng)計(jì)理論為基礎(chǔ))、模糊分類器(模 糊集理論為基礎(chǔ))、人工神經(jīng)元網(wǎng)絡(luò)(模擬生物神經(jīng)系統(tǒng)的電子系統(tǒng),也可以用 軟件在計(jì)算機(jī)上實(shí)現(xiàn))、人工智能分類器(基于邏輯推理或?qū)<蚁到y(tǒng)結(jié)構(gòu))。符號(hào) 型分類器包括句法分類器(基于句法分析和

15、自動(dòng)機(jī)理論)、人工智能分類器(基 于邏輯推理或?qū)<蚁到y(tǒng)結(jié)構(gòu))。其中符號(hào)型分類器具有更大的靈活性,所以能處理較為復(fù)雜的模式分類問(wèn) 題。但是目前對(duì)符號(hào)型分類器的研究遠(yuǎn)沒(méi)有數(shù)值型分類器成熟。所有模式識(shí)別系統(tǒng)都需要經(jīng)過(guò)訓(xùn)練、驗(yàn)證、改進(jìn),并反復(fù)多次,以完成最終 設(shè)計(jì)。127訓(xùn)練訓(xùn)練時(shí)分類器參數(shù)必需確定。為達(dá)到客觀、公正目的,樣本的制備是關(guān)鍵。 至少要滿足下列條件:具有充分的代表性和完備性;獨(dú)立于系統(tǒng)設(shè)計(jì),測(cè)試樣本 要與訓(xùn)練樣本相互獨(dú)立;標(biāo)準(zhǔn)化的設(shè)計(jì),標(biāo)準(zhǔn)化的使用規(guī)范;權(quán)威性。常見(jiàn)困難 是消耗大量時(shí)間、金錢和人力。在圖像模式識(shí)別的處理過(guò)程中,一般主要分為預(yù)處理,特征或基元提取,分 類訓(xùn)練,分類這幾個(gè)步驟。

16、(1)預(yù)處理它主要完成模式的采集、模數(shù)轉(zhuǎn)換、濾波、消除模糊、減少噪聲、糾正幾何 失真等預(yù)處理操作。因此也要求相應(yīng)的設(shè)備來(lái)實(shí)現(xiàn)(2)特征或基元提取特征提取實(shí)現(xiàn)由模式空間向特征空間的轉(zhuǎn)換,有效地壓縮維數(shù)。一般地說(shuō),它該是在一定分類準(zhǔn)則下的最佳或次最佳變換器。模式識(shí)別中,分類器的分類規(guī)則固然重要,但是,如果所基于的模式特征沒(méi) 有包含足夠的待識(shí)客體的信息或未能提取反映客體特征的信息,那么,識(shí)別的結(jié)果將面目全非。所以說(shuō),在設(shè)計(jì)分類器之前,能夠快速、有效地進(jìn)行特征提取是 模式識(shí)別的關(guān)鍵。不幸的是,直到目前為止還沒(méi)有形成特征提取的一般理論,隨著識(shí)別任務(wù)的不同,特征提取的方法也不一樣。此外,如果待識(shí)別的模式樣本本 身攜帶反映不同模式本質(zhì)特性的特征,則特征提取也不一定需要。(3)分類訓(xùn)練為了能使分類器有效地進(jìn)行分類判決,還必須對(duì)分類器進(jìn)行訓(xùn)練(學(xué)習(xí))。分類器的訓(xùn)練學(xué)習(xí)是模式識(shí)別的一

溫馨提示

  • 1. 本站所有資源如無(wú)特殊說(shuō)明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請(qǐng)下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請(qǐng)聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁(yè)內(nèi)容里面會(huì)有圖紙預(yù)覽,若沒(méi)有圖紙預(yù)覽就沒(méi)有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫(kù)網(wǎng)僅提供信息存儲(chǔ)空間,僅對(duì)用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對(duì)用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對(duì)任何下載內(nèi)容負(fù)責(zé)。
  • 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請(qǐng)與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶因使用這些下載資源對(duì)自己和他人造成任何形式的傷害或損失。

評(píng)論

0/150

提交評(píng)論