利用基于幾何圖像特征的支撐向量機分類實現(xiàn)高分辨率遙感圖像中人_第1頁
利用基于幾何圖像特征的支撐向量機分類實現(xiàn)高分辨率遙感圖像中人_第2頁
利用基于幾何圖像特征的支撐向量機分類實現(xiàn)高分辨率遙感圖像中人_第3頁
利用基于幾何圖像特征的支撐向量機分類實現(xiàn)高分辨率遙感圖像中人_第4頁
利用基于幾何圖像特征的支撐向量機分類實現(xiàn)高分辨率遙感圖像中人_第5頁
已閱讀5頁,還剩8頁未讀, 繼續(xù)免費閱讀

下載本文檔

版權說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權,請進行舉報或認領

文檔簡介

1、利用基于幾何圖像特征的支撐向量機分類實現(xiàn)高分辨率遙感圖像中人造目標的自動識別摘要隨著地球同步衛(wèi)星能夠在提供可見光范圍內(nèi)分辨率好于5米的遙感圖像,識別人造目標變得可能了,這在以前較差的分辨率情況下是做不到的。因為遙感圖像的大小和不斷提高的質(zhì)量,我們需要計算機輔助識別工具。在這篇論文里,我們闡述了一種圖像處理系統(tǒng),用來發(fā)現(xiàn)和識別高分辨率光學遙感圖像中的人造目標。發(fā)現(xiàn)在是指從圖像中找出一個包含人造目標的小矩形,識別是指將目標分類并進行標記。這些算法基于機器學習方法和一個包含十一種類型人造目標的樣本集。這個樣本集(每類至少150個樣本)是從衛(wèi)星SPOT 5 THR的圖像里人工選取出來的(分辨率2.5米

2、)為了構造一個與待識別目標類型無關的系統(tǒng),我們使用了一種基于支撐向量機的監(jiān)督式機器學習的方法。這個系統(tǒng)對每類目標都利用樣本集數(shù)據(jù)庫中樣本的幾何特征學習得到一個一般模型。本論文中主要創(chuàng)新的地方在于利用監(jiān)督式學習的方法,使用了很多幾何圖像特征,這樣可以將各類幾何屬性不同的目標區(qū)分開來。實驗結果顯示,該方法對人造目標的識別率能夠超過80%。關鍵字:目標識別,人造目標,支撐向量機,幾何面矩1. 介紹地球觀測圖像分辨率優(yōu)于5米的視覺識別使人造物體的地圖的興趣。傳感器的決議,接近1米或更好的讓一個更好的歧視,這類物品,但它們通常是一溜寬度小于太小(20公里)的地圖批量生產(chǎn)用于城鄉(xiāng)規(guī)劃。因此,傳感器等5點集

3、的高分辨率(2.5米)和(60公里)的增長大部分的興趣的衛(wèi)星圖像使用這個應用領域。衛(wèi)星數(shù)據(jù)允許快速映射的可能性的自然災害,比如。這類應用提交時間限制。然而,利用圖像的這樣一個大型含有高濃度的信息是耗時的,而且非常困難的,由一個照片譯員。事實上,超過400分析屏幕都需要一個場景。我們?yōu)榭蛻籼峁┱掌瑯s獲工具,幫助他們的視覺分析的任務。從用戶的角度來看,這是一個工具,它可以指出在整體形象是一種特別的對象是存在的,最終給予某種信心比率。本文的主要目的是探討認識對象的可能性高分辨率遙感影像中使用一個通用的方法,那就是,這種做法是不依賴于對象。一個主要的困難的數(shù)字圖像處理任務時,從圖像分辨率比10米度量粗

4、糙,是解決能夠應付高復雜性的內(nèi)容。這主要是由于高復雜性的事實,從用戶的角度來看,“元素的利息不僅僅是個人像素或表面結構的對象,而復雜,。同時分析了土地覆蓋中、低分辨率圖像可以通過一個像素明智的方法,對高分辨率圖像的特異性是我們感興趣的物體,只能被定義為他們的形狀和他們的鄰居。因此,很難實現(xiàn)通用的影像處理系統(tǒng)是基于經(jīng)典兩步-特征提取方法以及分類-的方法。另一方面,處理的高水平的概念,以規(guī)則為基礎的系統(tǒng)似乎松了genericity前的方法。事實上,這個目標識別問題的方法之一,可以手動定義一個幾何模板為每個對象和嘗試將它的形象。不幸的是,高可變性內(nèi)不同對象的類使得這種方法難以發(fā)揮。我們的主要問題之一

5、就是承認域?qū)ο蟮念惖膶ο蠖皇蔷唧w。雖然檢測與識別的對象使用特定的方法-調(diào)諧到這類對象提取-已經(jīng)解決了很長一段時間,在計算機視覺(特別是軍事),小的工作已經(jīng)發(fā)表的檢測與識別的對象的類在遙感圖像和通用的方法而不是具體的特定的對象。例如,關于自動提取道路提出的建模方法的道路網(wǎng)絡的路口,彼此之間的聯(lián)系交叉口繆群。費利克斯(1999),或提取使用(明確的)scale-dependent模型Hinz和費利克斯(2003)。審查的工作提出了代表(2003)列出的方法,但它們都是特定的道路或網(wǎng)絡。這個對象提取遙感影像大量文獻也呈現(xiàn)出多種方法提取,但是,又建筑,它們是具體的,這類物品。許多方法利用立體圖像雙輝

6、盛等。其他方法所需要的重要的先驗知識,對周圍建筑物Gerke等(2001)。解決這一問題的相關工作的信息檢索中遙感影像檔案存在,Datcu等。(1998),德國總理施羅德等。(1998年,2000),戴爾Acqua和Gamba(2001),Daschiel和Datcu(2005),應該鼓舞我們的方法。事實上,這些作品表明使用相關的特點及分類在特徵空間允許相關信息的檢索的一個高層語義定義為一個用戶通過一個小的例子。然而,問題的信息檢索中大量數(shù)據(jù)基地有著不同的約束條件的目標識別的問題相比,在一個單一的形象。事實上,所謂的圖像挖掘系統(tǒng)與數(shù)百到成千上萬的圖像,這需要一個很聰明的方式索引以允許一個短的反

7、應時間對用戶實時互動的系統(tǒng)。由于每個用戶的查詢可能不同,一個巨大的努力是為了建立一個系統(tǒng)可以連接用戶語義和低水平的圖像特征。另一方面,所有可能的圖像系統(tǒng)知道所有的事件的概率空間,所以使用貝葉斯學習是最適合和簡潔的方法來進行。據(jù)我們所知,這些系統(tǒng)不設法恢復復合對象的類,但只可定義為輻射特性的一個像素明智的方法。在目標識別問題,我們指的是要解決,只有少數(shù)的例子是可用的培訓系統(tǒng),因為高成本的實例數(shù)據(jù)基地建設。另外,每一圖像處理技術是一種新的圖像系統(tǒng),解決了現(xiàn)場找到的最好的解釋的數(shù)據(jù)庫數(shù)據(jù),Datcu等。(1998),不適合我們的問題。這樣做的目的是調(diào)查工作的可能性和識別物體的自動檢測在高分辨率遙感影

8、像。檢測是找到一個小矩形區(qū)域的圖像包含的對象。識別類的屬性的檢測對象。標簽,這個目標識別任務后,可以進行檢測。另一個可能的方法是運用識別算法進行了一切可能的位置,在圖像分析窗口。第二種方法是減少時,它是容易misdetections求取和應避免在操作系統(tǒng)。我們的解決方案是建立在一個快速預處理步驟旨在檢測的地區(qū)可能會感興趣的物體。這是一個細的低分辨率圖像的版本。這個圖像分割是基于視覺模型,索普等。(2001)。這是一個非常關鍵的一步,但任何識別系統(tǒng)的圖像預處理的細節(jié)的任務是本文的范圍。假設這個預處理步驟是可得到的,我們可以進行連續(xù)的興趣和直接識別方法進行了闡述。應具有較強魯棒性的識別算法、旋轉(zhuǎn)和

9、比例不變的照明。這將限制使用物體的外觀模型中,教皇和勞(1996),阿里發(fā)等。(2001)。另一個流行的方法是模板匹配的方法,Veltkamp和Hagedoorn(1999),但困難的是在這里找到正確的模板,可以處理intra-class變異性。為了應對這種困難時,我們可以采取監(jiān)督式學習方式,也就是說,我們將使該系統(tǒng)學習榜樣。這個例子所產(chǎn)生的數(shù)據(jù)模型,并對各班的對象可以自動地獲得了。這個系統(tǒng)會因此學會分類影像補丁包含對象的中心。這種約束來學習的步驟將允許一個精確的本地化的測定物體時圖像掃描檢測和識別階段。這意味著為對象,分析了大窗戶,多重發(fā)現(xiàn),每個人都要為每一個窗口的位置。最受歡迎的方法對建筑

10、實例對象模型的數(shù)據(jù)是由主成分分析、主成分分析法(PCA),這導致了eigenfaces方法,吐蕃與Pentland(1991),特(2001年):一個假設的像素的每個實例數(shù)據(jù)基地是一個隨機向量和主成分分析方法是為了得到一套特征向量(eigenfaces)中被用作一個分解的基礎。不幸的是,這種做法很約束特點的數(shù)據(jù)庫的構成和照明。在數(shù)據(jù)庫構成從遙感圖像,這些限制是太高了。這種方法的變量被看作例如Borgne等。(2004),獨立分量分析的主成分分析法(PCA)。我們的實驗用這些方法已成功。我們認為這個問題是有一小部份的例子intra-class高可變性。不允許獲得有關校長或獨立的部件。事實上,這種

11、分析方法具有良好的效果intra-class變化問題的例子是低和數(shù)據(jù)庫的建受控條件下(光照等)。其余的文章是這樣的。第二節(jié)描述的方法選擇我們的系統(tǒng)。物體的幾何特征之間的關系,提出了在第三節(jié)和特征向量分類方法在第四節(jié)描述。第五節(jié)介紹了系統(tǒng)的性能,探討了其優(yōu)化的可能性。最后,第六節(jié)介紹我們的結論。2. 選擇方法為了實現(xiàn)一個系統(tǒng)是通用的類型的對象被認可,我們采用一個通用的特征提取與選擇加分類方法使用高數(shù)量的幾何描述為了應付各種各樣的可能性為對象的興趣。我們正在面臨一個問題,在高維監(jiān)督分類特征空間,只有零點幾秒的例子可每個班。這種限制一個實際應用中存在的問題,并提出了由于數(shù)據(jù)有效性的生產(chǎn)成本數(shù)據(jù)庫。為

12、了克服這個詛咒的維數(shù),同時防止松散的信息以降維方法,我們選擇用支持向量機(SVM)。我們的目標是要正確的標簽識別系統(tǒng)的圖像修補收到作為輸入。為了這樣做每一圖像補丁將特征向量的描述將利用監(jiān)督分類方案。具有可操作性的識別系統(tǒng)可以建造全SPOT5場景序列化掃描。為了有一個系統(tǒng),具有良好的魯棒性,照明、光譜波段,植被變化,我們將只使用幾何形狀的圖像。事實上,這個類型的對象,我們正試圖檢測是很明確的空間屬性的邊緣和使用紋理的可變性來源可以引進照明和季節(jié)性效應比如,我們應該避免。訓練階段使用的一個子集的例子。每個影像補丁將被處理,為了獲得向量(第3節(jié))的描述將用來學習引擎(見第四章)。描述向量只會包含幾何

13、信息,但這一事實并不考慮由學習計劃。為了評估系統(tǒng)的性能,圖像補丁不被用于訓練階段將會被使用。每個影像補丁將被用來計算說明矢量將分類系統(tǒng)在訓練階段。這個系統(tǒng)的性能評價矩陣計算混亂。這個例子數(shù)據(jù)庫已經(jīng)建造的照片資料翻譯使用SPOT5全色影像(幾樂隊以2.5米,有明確的像素抽樣對象類:隔離十路(IB)、建筑和軌道()、路口(CR)、橋梁(3)、寬闊的大道(新西蘭),高速公路(硬件)、圓的下落(RA)、狹窄的道路(NR)、鐵路(RW)。當我們唯一感興趣的就是這類(3),太陽神,我們已經(jīng)包括了別人為了更好的表征。拒絕我們也創(chuàng)造了一個補充叫加班(其他)為了考慮不同的可能的景觀。路課程也很有趣,但他們可以提

14、取算法,使重構整個路網(wǎng)利用語境的方法,Rochery等。(2003),Stoica等。(2004),費利克斯等。(1999),Hinz和費利克斯(2003)。對于一個完整的參考書目看到檢查工作的代表(2003)。每堂課,超過150例已經(jīng)進入數(shù)據(jù)庫。每一個例子是100100個像素圖像補丁物體中心的形象。從不同的物體就會出現(xiàn)在同一類的對象,以形象是非常重要的,以便抬歧義的學習算法。這也會希望有良好產(chǎn)生檢測器(小),定位為鄰近多個發(fā)現(xiàn)斑塊可避免大的圖像掃描。因此每個影像補丁被視為屬于類的對象位于中心。圖1顯示的一個例子,每堂課的數(shù)據(jù)基礎。額外的例子已經(jīng)創(chuàng)造了采用輪作和對稱。這個場景用于數(shù)據(jù)SPOT5

15、基地被選中了不同地區(qū)在法國圖盧茲,馬賽和斯特拉斯堡(地區(qū)),在美國加州圣地牙哥,(CA)。3. 目標的幾何特性我們的目標是在描述物體的幾何信息的利用。在遙感領域開發(fā)利用工作,很少的幾何外形描述為識別的存在。戴爾Acqua和Gamba(2001)用點擴散技術,并且,但是這種做法是只有有效的對象的興趣已經(jīng)很明確的界限。在我們的例子中,一個對象可由幾組邊界。這個世界時是非常有用的,比較個體關閉,確定形狀,但它似乎不適合我們的問題。我們需要能統(tǒng)計學比較對比思考分析與判斷套,而且其他的幾何形狀描述我們將用兩種功能:區(qū)域邊界對齊。(即邊緣提取和線)使用完形方法由Desolneux等。(2000)。在此背景

16、下,這一事件被認為是有意義的期望發(fā)生的事件是否會非常小的一個隨機的形象??梢赃@樣認為,在一個隨機的圖像梯度的方向上是均勻分布,并且相鄰象素有一個很低的概率有相同的梯度方向。該算法,給出了一套直線段由兩個窮途末路的坐標。區(qū)域界限也用同樣的原則中提取的,但應用于地形圖level-lines表面時,假設像素灰色層次是海拔價值的形象,Desolneux等。(2001)。自從我們在開發(fā)水平線條,我們能夠獲得封閉的區(qū)域。這樣的例子,可以獲得的提取是顯示在圖2。一旦幾何提取,它必須被編碼,作為一個固定長度的描述。這是通過計算的特點。這些特征可分為兩類:低等特點和高層次的特點。3.1 低級的幾何特征兩種類型的

17、低級的描述符計算從地區(qū)的邊緣會使用,Fourier-Mellin幾何一致性描述符。3.1.1. 幾何時刻利用代數(shù)的理論,Ming-Kuel時刻獲得一家七不變量與平面轉(zhuǎn)換叫做胡不變性,胡(1962年)。那些不變量可以被看作是非線性組合的復雜幾何的時刻。在x和y的坐標是圖像f(x,y),我是虛構的單位和p + q cpq秩序。幾何的時刻是特別有用的比例變化的情況。胡不變量已經(jīng)很用于目標識別在過去的30年中,因為他們都不變,縮放、旋轉(zhuǎn)的翻譯。Flusser(2000)給他們的表情Dudani等。(1977)使用這些不變量進行飛機剪影。Flusser和泡有利用圖像的配準,Flusser和泡(1994)

18、。他們已經(jīng)被修改和完善幾個作者。Flusser使用這些時刻為了產(chǎn)生一個新家庭的描述符的訂單高于3、Flusser(2000)。這些描述符是存在旋轉(zhuǎn)和比例變化。他們有以下的表情。讓康樂及文化事務署大型活動組收(r)是一個因果作用(rN0),Fourier-Mellin變換、格式化,f,如果它的存在,是寫成。在k和v分別角和徑向頻率變換域和和r分別是極坐標圖像的領域。這個FMTcan被視為傅里葉變換為該團體的相似性(旋轉(zhuǎn),翻譯,dilations)。它是一種獨特的表達功能的f。它有幾種特性使它非常有用的灰色層次圖像分析,Derrode和Ghorbel(2001)。最重要的是我們要themodulu

19、s FMT系數(shù)的輪換和尺度不變下。3.2 高級幾何特征為每個區(qū)域提取的圖像修補(見圖2)(b),我們可以計算出下列參數(shù),compacity外線,表面之間的比例,定義為表面和廣場上的外線,重心。這個隊列(見圖2(c)可以被其長度、方向和位置。它們也可以被用來計算交叉口的位置。自從數(shù)量的地區(qū),是不同的,每一圖像比對補丁,我們必須找到一種方法使這些參數(shù)固定向量。我們這么做了,通過計算每個圖像的直方圖。因此我們將計算直方圖的compacities封閉的區(qū)域,或是直方圖的長度的隊列。這個參數(shù)相關崗位(重心位置的十字路口)的距離就變成了圖像的補丁的中心。相關的參數(shù),通過編碼為相對主定位-一個有更高的體重在

20、圖像的直方圖,以達到某種旋轉(zhuǎn)不變性。尺寸標準化的最高每幅圖為了獲得某種尺度不變性。用我們的高級功能系統(tǒng)。熵的方向的陣營。直方圖的交點的中心,分析窗口。直方圖長度的陣營。直方圖的封閉的地區(qū)的中心,分析窗口。直方圖的封閉的區(qū)域。4. 特征向量分類介紹了幾何描述符,使我們能夠建立一個每個人的影像補丁儲存在數(shù)據(jù)庫。通過選擇其中的一個子集的數(shù)據(jù)作為學習基礎、相輔相成的子集的試驗基地,我們可以建立一個物體識別系統(tǒng)的性能和措施。學習資料的基礎,我們想要得到一個分類系統(tǒng)中的每一種能夠標簽圖像的實驗基地的可能性,根據(jù)它屬于每個定義對象的類。自從我們有了一個例子,我們可以使用數(shù)據(jù)庫監(jiān)督學習技巧。然而,考慮到低數(shù)量

21、的例子和高維的特徵空間(圖像),每2500特征,我們不能用神經(jīng)網(wǎng)絡和貝葉斯學習?;A的學習方法一般內(nèi)核和支持向量機(SVM)在特殊情況下,介紹了在過去的十年中,學習理論的分類和回歸的任務,第一章是關于(1998)。支持向量機方法已成功地應用于文本分類,Joachims(1998),面部識別、Osuna等。(1997)。最近,他們已成功地用于高光譜遙感圖像分類,Bruzzone和Melgani(2002)。簡單的說,這個方法包括尋找分離之間的表面的兩類的一部分訓練樣本,最好描述之間的界限,兩類。這些被稱為支援向量和完全定義的分類系統(tǒng)。在這樣的情形:這兩類,是non-linearly分離方法使用一

22、個核擴張以使投射到更高的特征空間維度空間的課程的分離成線性。在我們的問題,我們不使用內(nèi)核的框架。實驗證據(jù)顯示5.2節(jié)會缺乏興趣,為我們的特定應用支持向量機非線性的。支持向量機分類的一個缺陷是,在他們的經(jīng)典的版本,他們僅能解決問題,以便。有些作品中存在的多領域的支持向量機(見Allwein等,2000,威斯和沃特金斯,1998,并將由許保忠,林,2001年),但他們并不適用于我們的系統(tǒng)。由于NN2類,既可以選擇trainNSVM(一階級和所有其他的),或是火車N(1)(SVM ?每一個階級反對別人)。在第二種方法,這是一個讓我們用,最后的決定是被選擇classwhich才是最常被選為成套的支持向

23、量機方法。分類的步驟包括的測試集,計算特征向量,然后采用支持向量機的pre-computed以決定分類。4.1 利用線性SVM進行特征選取采用超線性支持向量機在特征空間以選擇不同的每一個樣品,它坐落在特徵空間的平面。這種分類規(guī)則可以被看作是一個簡單的閾值的真正價值。這個值是正常的距離特征向量的平面的樣品。在主成分分析,這個距離可以被看作是一個新變量線性組合所獲得的變量(特征)所確立的特征向量。各具特色的重量在線性組合的程度成正比的正交的分類超平面。平行的特點是無用的分類超平面分類。這個解釋使我們的特點及分類的選擇最受矚目的分類問題。我們將用這種方法在5.2節(jié)。5. 系統(tǒng)的性能和結果為了表現(xiàn)目前

24、的系統(tǒng)性能,首先我們展現(xiàn)得到的結果,第二,我們研究了幾種系統(tǒng)優(yōu)化的概率。由于表現(xiàn)一個詳盡的衛(wèi)星圖像的結構是一項非常艱巨的任務物體中的所有場景必須手動提取和標記我們將使用圖像補丁的測試。為了通過分析窗口模擬掃描圖像的的行為,類型OT的實例-其他的-從場景5中被隨機的抽取。采用了一種對這些補丁的視覺分析,是為了消除那些包含一個靠近中心利益的類型對象的事物。物體附近的系統(tǒng)的行為模式會在部分分析。5. 1 結果分析在本節(jié)中,我們演示出該系統(tǒng)得到的結果。在訓練步驟中我們將75%的數(shù)據(jù)基礎。由于通過使用對稱性在數(shù)據(jù)庫我們已經(jīng)產(chǎn)生新的元素,每種類型的例子數(shù)目為每課例450。這給340例作為培訓,110例進行

25、檢測。特征向量有2569個部件。特點0-61是幾何時刻 (復雜的時刻,hu和Flusser時刻不變量),特點62-2125是Fourier-Mellin系數(shù),特點2126-2569是高級特征。我們演示了兩種類型的分析。首先,我們研究了兩種可分性問題,也就是,我們對我們的興趣分類的每種分類方面計算分類率(IB,BR,RA,OT)。這種分類率給了我們每種給定SVM的分類質(zhì)量。結果顯示在圖3。大家可以看到, IB (好于84%), RA(好于83%)還有 OT (好于87%)很好地分離其他類型。BR80%)進行了分離。你可以看到,大部分BR未分類級別與交叉路口和不同的道路有關。這可以這樣用這樣的事實

26、來解釋,一座橋梁都包含道路,橋是兩條不同水平道路的橫渡,交叉口,這從最低的觀點是很難區(qū)分的。第二種分析我們表現(xiàn)的是一種整體系統(tǒng)的性能,也就是,對各種類的分類率以及每個類型如何區(qū)別于其他類型的方面。結果以混合矩陣(表1) 顯示,在那里每一行i與這類測試圖像相關聯(lián),每一列對應類j與系統(tǒng)決定的類別相關,而且表中的每組都給出了區(qū)分每個事物的列j和行i之間的百分率。MD代表未分類級別,F(xiàn)A代表假警報。這個值取最近的整數(shù)。理想的系統(tǒng)100%會有一個對每個項目都有的對角線的對角矩陣。你從中可以看到,這對我們的系統(tǒng)并不是真正的情況,。然而,我們看到這兩類的利息(IB和RA)分別被檢測為87%和66%。我們也注

27、意到大多數(shù)未分類型的橋梁都被冠以十字路口,這是非邏輯的。同樣,PT的34%被分類為NR而且不同類型的道路也以其他道路類型沒有被分類,的鉑族元素被歸類為考察和不同類型的道路是misclassified為其他類型的道路,我們可以估計到,因為大多使用的描述符是規(guī)模不變的。為了給一個顯示混合矩陣信息的質(zhì)量標準,我們定義了對角指數(shù),也稱為全面準確性,如:aij是混合矩陣的行i列j中的元素。在理想系統(tǒng)的情況下,該指數(shù)等于100,等于100/N,N是以相同的概率在系統(tǒng)里對每個事物隨機抽取的類型的數(shù)量。我們也將系數(shù)計算Congalton(1991),它經(jīng)常被用來測量系統(tǒng)的分類性能,并被定義為:PO是對角矩陣元

28、素的平均值, Pz是可以被快速準確的分類的像素分數(shù)。對于表1的混合矩陣 ,我們有D = 36.9和= 99.330。因為我們正在試圖重現(xiàn)一個通常是由人類操作的任務,有趣的是比較系統(tǒng)的性能和由圖像翻譯器得出的結果。要做到這一點,我們給5個沒有參與這項數(shù)據(jù)基地建設的遙感專家提供的一個子集圖像數(shù)據(jù)基地,而且我們要求他們給每一個圖像補丁作標簽。每個操作員得出的混合矩陣的均值見表2。我們觀察可以得出,結果比我們利用全自動的系統(tǒng)采用全面準確性得到的結果(69%)要好。然而,我們獲得= 99.167,低于自動化系統(tǒng)所得的值。這可以理解為這個事實:自動化系統(tǒng)有系統(tǒng)誤差,而圖像翻譯器的誤差是不相關聯(lián)的。這也許是

29、自動化系統(tǒng)的一個額外的利益。有趣的是,在五種最多的分類中,四種對實驗是普遍的,IB, RA, SB, OT.此外,我們也有趣的注意到,我們有混淆BR和CR還有他們之間不同類型道路的共同趨勢。最后,我們分析得到的結果,只有三種級別的利益被考慮進去。所有其他類型都集中在表OT+中。這個設置允許我們用較少的支持向量機,得到一個更簡單、更不容易出錯的投票決定系統(tǒng)。這次我們分析系統(tǒng)對固定使用的描述符的敏感性。表3顯示了用低層次幾何描述符得到的結果,表4顯示了用高層次幾何描述符得到的結果。表5顯示了混合使用兩種描述符所得到的結果。大家可以看到,這使得整體精確性比整個系統(tǒng)選擇11種類型的時候要高。我們也可以

30、看到,高層次的幾何描述符的獨立分量比低層次幾何描述符要低,但最佳結果是在混合使用兩種描述符時得到的,整體的精確性達到85%。在三個實驗中,的系數(shù)是很高的,兩種方法的結合得到了最好的結果。5.2 系統(tǒng)優(yōu)化在圖像的操作進程上減少分類系統(tǒng)的計算量是非常重要。在這一節(jié)中我們研究為了加速進程撤銷一些在系統(tǒng)中使用的特點的概率。為了識別為我們的問題包含少量信息的特征,我們運用了4.1部分提到的方法。另一種方法,例如可以設想將不同的描述符進行學習和測試步驟,但是這很費時,如果想知道的每一個描述符真正的針對性的話。圖4顯示了與BRSVM抗衡的IB的每個特征的重量(分類超平面的方向)。值得注意的是,與低層次幾何相

31、比,高層次的幾何似乎更有用這對所有支持向量機都適用-Fourier-Mellin系數(shù)似乎沒有比幾何方法更重要。很有意思的一點是, Fourier-Mellin系數(shù)的重量似乎是跟著一個pseudo-periodic系數(shù)法的。由于這樣的事實,那就是他們的訂單是一種對數(shù)級既矢量(f,f)頻率的飛機,所以結果對其他組的分類也是類似的,但對所有的支持向量機來說,更重要的頻率是不一樣的。由于支持向量機分類的步驟包括從在特征空間計算一個歐氏距離,這比這些特征本身的計算要便宜多了。這意味著為了大大降低了識別系統(tǒng)的計算復雜度,我們必須減少需要計算的特征的數(shù)目。只是那些不是對于所有SVM(支持向量機)都很重要的特

32、征可以被忽略。為了確定這樣的特征,如果有的話,我們對系統(tǒng)里所有的SVM(支持向量機)計算特征的平均重量。結果顯示在圖5。你可以看到,這些特征重要性的排序是相同的,和單獨的支持向量機。最大價值的特征(數(shù)量2377、重量0.049)是regioncompacity histogram的一個值,但其重量的價值體現(xiàn)對整體貢獻小于5%。另一方面,每個Fourier-Mellin系數(shù)有一個非常小的貢獻,但他們的總體貢獻約30%。還有很有意思的一點是,我們發(fā)現(xiàn)在高層次幾何上,F(xiàn)ourier-Mellin變換的計算成本可以忽略不計,因為使用了FFT-based算法。這一結果使我們得出這樣一個結論,我們不可能確

33、定一套可抑制矢量的特征。我們的目標是要選擇的支持向量機最優(yōu)參數(shù),以最大限度地識別系統(tǒng)的性能。用于我們研究的支持向量機軟件SVM-light Joachims(1999),可以使用各種不同的內(nèi)核(線性、徑向基函數(shù),多項式和sigmoidal),每一種都有它自己的一套參數(shù)。訓練誤差和邊緣之間的平衡也是一個系統(tǒng)參數(shù)。這意味著一個包含學習測試循環(huán)周期的對支持向量機參數(shù)的詳盡的研究是一個非常昂貴的操作。使用誤差評估以及Joachims(2000)提出的精度和召回,就能很容易地對于一個給定的支持向量機定義下列成本函數(shù)。學習步之后SV的數(shù)量NSV,MC未分類的學習例子的數(shù)量,錯誤的誤差估計,精確精度,召回召

34、回。召回被定義為以分類的總的事物的數(shù)目來區(qū)分的好的探測數(shù)目,也就是說,檢測概率。精確的定義以探測的總數(shù)目來區(qū)分的好的探測數(shù)目。它的意義在于類似逆虛警概率。所以對于式Eq.(8),C的值越低, 支持向量機的泛化能力越好。有趣的是,在沒有使用一整套測試例子時這種成本函數(shù)可以在學習步后計算。另一方面,它只是一種悲觀的,理論估計。但它對于我們想要完成的那種分析已經(jīng)足夠了。采用Eq.(8)的成本函數(shù)式,我們已經(jīng)能夠按照支持向量機對幾種事物類型的不同參數(shù)設置的學習表現(xiàn)進行分類整理。我們的實驗中沒有顯示出任何一種內(nèi)核的趨勢。在對每兩種事物的分類的10個最佳支持向量機中,總有線性核。使用線形核的利益的核心是雙重的:第一,零件重量得出;第二,只有一個參數(shù)設置,就是設置誤差和邊緣值之間的平衡。這些結論促使我們選擇線性支持向量機,并且讓我們在平衡中集中

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預覽,若沒有圖紙預覽就沒有圖紙。
  • 4. 未經(jīng)權益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負責。
  • 6. 下載文件中如有侵權或不適當內(nèi)容,請與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

評論

0/150

提交評論