基于k-means算法的遙感圖像分類_第1頁
基于k-means算法的遙感圖像分類_第2頁
基于k-means算法的遙感圖像分類_第3頁
全文預覽已結束

下載本文檔

版權說明:本文檔由用戶提供并上傳,收益歸屬內容提供方,若內容存在侵權,請進行舉報或認領

文檔簡介

基于k-means算法的遙感圖像分類

0基于密度函數(shù)的聚類分析k-mean是基于分段的聚類算法。該算法簡單、快速,是一種得到最廣泛使用的聚類算法,在高光譜遙感圖像的非監(jiān)督分類中具有較強的實用性,并表現(xiàn)出明顯的優(yōu)點。K-means以K為參數(shù),把n個對象分為K個類別,以使類內具有較高的相似度、類間的相似度較低。根據(jù)一個類別中對象的平均值進行相似度的計算,對大數(shù)據(jù)集的處理,該算法是相對可伸縮和高效率的。但其缺點也非常明顯:①對初始值非常敏感,不同的初始值可能會導致不同的聚類結果;②必須預先設定預計劃分類數(shù)K。針對K-means的上述弱點,Stephen等提出采用kd-tree為K-means賦初始值。先用kd-tree估計數(shù)據(jù)在不同位置的密度,再用Katsavounidis算法修正選擇K-means的中心值,這種方法采用密度函數(shù)確定均值,是通過整個密度函數(shù)確定初始中心的比較完整的算法;但這種方法計算復雜、效率不高,而且對高維數(shù)據(jù)的效果不明顯。Lu等用分等級的方法為K-means選擇聚類中心,該方法的核心是把聚類看成加權聚類問題,依據(jù)分等級的方法可以選擇更好的初始中心值;但用該方法采樣時容易受到粗差的影響,且效率不高。本文提出的改進的K-means,首先對多光譜數(shù)據(jù)進行對數(shù)變換以突顯或強化類型特征;然后進行主成分變換,采用核密度估算第一主成分的概率密度函數(shù);根據(jù)概率密度函數(shù)確定初始分類數(shù)和相應的初始分類中心,通過迭代計算得到最終的分類圖。1改進的k-mean算法1.1《m》jmj,當K-means算法是MacQueen于1967年提出的,是至今運用最廣泛的聚類算法之一。對于一個觀測數(shù)據(jù)集X=(x1,x2,…,xn),每個觀測值是d維的實向量,K-means聚類就是把n個觀測值分為K個子集(K≤n),S=(s1,s2,…,sk)。具體過程如下:(1)從全部數(shù)據(jù)中隨機選取K個數(shù)據(jù)作為初始中心;(2)在第m次迭代中,對任一樣本X按如下的方法將其調整到K個類別中的某一類別中。對于所有的i≠j,i=1,2,…,K,如果‖X-Z(m)j(m)j‖<‖X-Z(m)i(m)i‖,則X∈S(m)j(m)j,其中,S(m)j(m)j是以Z(m)j(m)j為中心的類;(3)由過程(2)得到S(m)j(m)j類新的中心Z(m+1)j(m+1)j,即Ζ(m+1)j=1Νj∑X∈S(m)jX(1)式中,Nj為Sj類中的樣本數(shù);Z(m+1)j是按照使J最小的原則確定的,J的表達式為J=Κ∑j=1∑X∈S(m)j∥X-Ζj(m+1)∥2(2)(4)對于所有的i=1,2,…,m,如果Z(m+1)i=Z(m)i,則迭代結束,否則轉到過程(2)繼續(xù)進行迭代。1.2算法的效率比較多光譜數(shù)據(jù)用于分類研究和應用是當今遙感技術熱點之一,龐大的數(shù)據(jù)量往往會降低分類算法的效率。對多(高)光譜數(shù)據(jù)進行主成分變換,根據(jù)各主成分的貢獻率選擇參與分類的主成分數(shù),既實現(xiàn)了對數(shù)據(jù)的壓縮,也提高了分類效率。為了增強類別差異,一種有效的方法是先對觀測數(shù)據(jù)進行對數(shù)變換,然后進行主成分變換,最后再進行分類。1.3概率密度函數(shù)的密度在統(tǒng)計學中,核密度估計是一種非參估計隨機變量概率密度函數(shù)的方法。如果“x1,x2,…xn”~f是互相獨立分布的隨機樣本,那么它的概率密度函數(shù)的密度估計近似為?fh(x)=1nn∑i=1k(x-xih)(3)式中,k為某種密度核;h為平滑參數(shù)(也稱為帶寬)。通常采用均值為0、方差為單位陣的標準正態(tài)分布為密度核,這樣密度估計只和參數(shù)h相關。有多種選擇帶寬h的方法,本文采用下面的帶寬公式,因為它最接近帶寬最優(yōu)值,即h=δ(43n)15(4)式中,n為樣本數(shù);δ為樣本標準偏差。1.4初始分類中心的確定改進的K-means算法的具體流程如下:(1)對數(shù)化log(xi)→xi;(2)應用1.2節(jié)原理進行主成分變換:(U1,U2,…,Uk)Txi→xi;(3)采用核密度估算第一主成分的概率密度函數(shù);依據(jù)概率密度函數(shù)的峰態(tài)確定初始分類數(shù)和相應的分類中心;對第一主成分進行K-means分類,獲得各類的標簽;(4)按照主成分貢獻率k∑i=1Si/Ρ∑i=1Si≥85%的要求,選擇參與分類的主成分個數(shù);根據(jù)流程(3)得到的各類標簽,計算多個主成分的初始分類中心;(5)按照K-means分類法進行分類,最后進行分類精度評定。2實驗與結果分析2.1遙感測量方法實驗區(qū)位于亞利桑那州的Maricopa縣境內,主要地類包括綠地、水體、道路、裸地和居民建筑用地等。實驗采用的遙感數(shù)據(jù)是2004年3月17日獲取的QuickBird多波段圖像,圖像大小為317像素×315像素,空間分辨率為2.44m,有4個波段(藍光、綠光、紅光和近紅外波段)。圖1為近紅外波段(R)、紅光波段(G)、綠光波段(B)組合的假彩色合成圖像。2.2基于meas算法的分類方法(1)使用傳統(tǒng)的基于均值-方差的K-means方法,對QuickBird原始數(shù)據(jù)(4個波段)多次采用K-means分類,從中選擇結果最優(yōu)的一個(圖2);(2)采用本文提出的改進的K-means算法分類(圖3)。相應的精度評價見表1??梢钥闯?本文提出的改進的K-means算法優(yōu)于傳統(tǒng)的基于均值-方差的K-means算法?;诰?方差的K-means算法根據(jù)分類數(shù)據(jù)的均值μ和δ方差,將(μ-δ,μ+δ)分成K等分,獲得初始分類中心。此方法要求類別之間具有明顯的可分性,對于光譜特性相近的兩個類別往往存在誤分現(xiàn)象。本案例中,這種方法把水域和道路混為一個類。本文提出的改進的K-means通過對數(shù)變換強化類型特征(比較原始數(shù)據(jù)第一主成分密度函數(shù)(圖4)和對數(shù)—主成分變換第一主成分直方圖(圖5(a)),進一步用對數(shù)-主成分變換后的第一主成分密度函數(shù)(圖5(a))確定初始分類數(shù)和相應的類型幾何中心,然后用一維K-means法針對第一主成分確定的初始分類標簽作為多維K-means方法的初始輸入。由于對數(shù)-主成分變換后第一主成分最大限度地包含了地物類型信息,峰態(tài)更明顯,根據(jù)其密度函數(shù)(圖5(a))確定初始分類數(shù)(6類:綠地、房屋、裸地1、裸地2、道路和水域)和類型幾何中心,避開了隨機選取初值,得到的初始標簽也最大限度地反映了類型的真實情況。此外,根據(jù)主成分貢獻率(≥85%)確定的主成分數(shù)(第一、二兩個主成分),充分利用了多波段信息,壓縮了噪聲(可以看出圖5(c)和圖5(d)中第三、四主成分直方圖為單峰噪聲),因此所得分類結果優(yōu)于傳統(tǒng)的均值—方差K-means算法。3k-me病算法的分類結果(1)K-means分類算法是動態(tài)聚類,具有一定的自適應性;但是分類結果

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內容里面會有圖紙預覽,若沒有圖紙預覽就沒有圖紙。
  • 4. 未經(jīng)權益所有人同意不得將文件中的內容挪作商業(yè)或盈利用途。
  • 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內容的表現(xiàn)方式做保護處理,對用戶上傳分享的文檔內容本身不做任何修改或編輯,并不能對任何下載內容負責。
  • 6. 下載文件中如有侵權或不適當內容,請與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

評論

0/150

提交評論