高光譜數(shù)據(jù)降維與可分性準(zhǔn)則_第1頁
高光譜數(shù)據(jù)降維與可分性準(zhǔn)則_第2頁
高光譜數(shù)據(jù)降維與可分性準(zhǔn)則_第3頁
高光譜數(shù)據(jù)降維與可分性準(zhǔn)則_第4頁
高光譜數(shù)據(jù)降維與可分性準(zhǔn)則_第5頁
已閱讀5頁,還剩42頁未讀, 繼續(xù)免費閱讀

下載本文檔

版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進行舉報或認(rèn)領(lǐng)

文檔簡介

第1節(jié)高光譜數(shù)據(jù)降維與可分性準(zhǔn)則

武漢大學(xué)遙感信息工程學(xué)院

龔龑

《高光譜遙感》第四章高光譜數(shù)據(jù)處理1第一頁,共四十七頁。一、高光譜數(shù)據(jù)的降維問題二、類別可分性準(zhǔn)則三、基于幾何距離的可分性準(zhǔn)則四、基于類的概率密度的可分性準(zhǔn)則第四章第1節(jié)高光譜數(shù)據(jù)降維與可分性準(zhǔn)則2第二頁,共四十七頁。高光譜分辨率的影響在給定的波長區(qū)間內(nèi),高的光譜分辨率導(dǎo)致影像波段數(shù)眾多、連續(xù)。一方面,高光譜遙感的核心優(yōu)勢是反映光譜特征的細(xì)微差異;另一方面眾多的波段數(shù)目給數(shù)據(jù)處理帶來新的問題。一、高光譜數(shù)據(jù)的降維問題1.1高光譜數(shù)據(jù)的高維特征3第三頁,共四十七頁。波譜空間與光譜空間波段數(shù)眾多導(dǎo)致光譜空間維數(shù)的增多高光譜多光譜灰度值灰度值一、高光譜數(shù)據(jù)的降維問題1.1高光譜數(shù)據(jù)的高維特征波段數(shù)眾多導(dǎo)致波譜曲線信息的豐富“維數(shù)”是指光譜空間的維數(shù)4第四頁,共四十七頁。

高光譜影像屬于高維空間數(shù)據(jù),已有的研究結(jié)果表明,這種數(shù)據(jù)有許多不同于低維數(shù)據(jù)的分布特性,這些特性決定了人們在對高光譜影像分析時應(yīng)采用不同策略和方法。一、高光譜數(shù)據(jù)的降維問題1.1高光譜數(shù)據(jù)的高維特征5第五頁,共四十七頁。1.信息冗余大

波段數(shù)量多,但并非每個波段在任何時候都是有用信息。波段之間的相關(guān)性導(dǎo)致信息冗余很大,尤其是相鄰波段之間的相關(guān)性很強。一、高光譜數(shù)據(jù)的降維問題1.2高維特征帶來的新問題例如:對于有N個波段的高光譜數(shù)據(jù)來講,當(dāng)前應(yīng)用需求是區(qū)分w1類和w2類。如果利用任意一個波段都能達(dá)到這個目的,那么,僅取一個波段就包含了足夠信息,其余N-1維特征就是多余的。6第六頁,共四十七頁。根據(jù)超維立方體的體積公式,隨著空間維數(shù)的增加,超立方體的體積急劇增加,并且向角部分布。一、高光譜數(shù)據(jù)的降維問題1.2高維特征帶來的新問題2.超維幾何體體積7第七頁,共四十七頁。一、高光譜數(shù)據(jù)的降維問題1.2高維特征帶來的新問題2.超維幾何體體積伽馬函數(shù)超立方體中內(nèi)切求的體積與超立方體之比8第八頁,共四十七頁。例如:密度分析GRID算法一、高光譜數(shù)據(jù)的降維問題1.2高維特征帶來的新問題2.超維幾何體體積由于體積因素影響,高維空間中數(shù)據(jù)的分布呈現(xiàn)出稀疏、嚴(yán)重不規(guī)則等特點,使得常規(guī)的分析算法效果不佳。

9第九頁,共四十七頁。思考:既然不同波段包含了不同光譜信息,那么,在利用遙感影像分類時,是否波段越多,分類越精確?研究表明,事實并非如此一、高光譜數(shù)據(jù)的降維問題1.2高維特征帶來的新問題3.“維數(shù)災(zāi)難”問題10第十頁,共四十七頁。一、高光譜數(shù)據(jù)的降維問題1.2高維特征帶來的新問題3.“維數(shù)災(zāi)難”問題11第十一頁,共四十七頁。這說明高光譜數(shù)據(jù)區(qū)分地類之間的能力極大地受到訓(xùn)練樣本的限制,在分析高光譜影像時,要獲得好的分類精度就需要更多的訓(xùn)練樣本。如果訓(xùn)練樣本不足時,往往會出現(xiàn)在樣本點數(shù)目一定的前提下,分類精度隨著特征維數(shù)的增加“先增后降”的現(xiàn)象,這就是所謂的Hughes”維數(shù)災(zāi)難”現(xiàn)象。一、高光譜數(shù)據(jù)的降維問題1.2高維特征帶來的新問題3.“維數(shù)災(zāi)難”問題12第十二頁,共四十七頁。隨著空間維數(shù)的增加,要得到同樣精度的估計值將需要更多的樣本數(shù)。研究表明,對于監(jiān)督分類而言,若要得到比較滿意的分類結(jié)果:一、高光譜數(shù)據(jù)的降維問題1.2高維特征帶來的新問題4.高維空間中的參數(shù)估計問題線性分類器需要的樣本數(shù)與空間的維數(shù)呈線性關(guān)系。對于基于二次估計量的分類器,所需的樣本數(shù)與空間的維數(shù)呈平方關(guān)系。13第十三頁,共四十七頁。模式識別的類別統(tǒng)計信息向量均值和方差等根據(jù)訓(xùn)練樣本估算出來訓(xùn)練樣本的數(shù)目相對于特征空間的維數(shù)的比例參數(shù)估計不準(zhǔn)確分類精度較低多光譜圖像高高光譜圖像低一、高光譜數(shù)據(jù)的降維問題1.2高維特征帶來的新問題4.高維空間中的參數(shù)估計問題因此,“維數(shù)災(zāi)難”現(xiàn)象可以從樣本數(shù)量與數(shù)據(jù)復(fù)雜度關(guān)系理論來解釋分類精度較高參數(shù)估計較準(zhǔn)確14第十四頁,共四十七頁。

在高維數(shù)據(jù)空間中,除了數(shù)據(jù)點分布的絕對位置以外,數(shù)據(jù)分布的形狀和方向?qū)τ诜诸惥哂懈又匾挠绊懽饔?。一、高光譜數(shù)據(jù)的降維問題1.2高維特征帶來的新問題5.高階統(tǒng)計特性15第十五頁,共四十七頁。一、高光譜數(shù)據(jù)的降維問題1.2高維特征帶來的新問題5.高階統(tǒng)計特性16第十六頁,共四十七頁。在低維空間,只使用均值向量進行分類的結(jié)果比只使用方差信息得到的結(jié)果的精度高,說明在此種情況下,在分類過程中數(shù)據(jù)分布的位置比分布的形狀和方向作用要大的多,這也是人們通常遇到的情況。但是,當(dāng)維數(shù)增加時,只考慮均值信息進行分類的精度并不再增加,而考慮方差信息的分類精度卻隨著特征維數(shù)的增加而繼續(xù)增加。一、高光譜數(shù)據(jù)的降維問題1.2高維特征帶來的新問題5.高階統(tǒng)計特性17第十七頁,共四十七頁。綜上所述,高維特征引起了多種問題因此,在高光譜數(shù)據(jù)應(yīng)用的特定階段,可以對高維數(shù)據(jù)進行降維處理,得到具有代表意義的低維光譜特征,并在低維光譜空間中進行相應(yīng)分析(聚類分析)。信息冗余大超維幾何體體積“維數(shù)災(zāi)難”問題高維空間中的參數(shù)估計問題高階統(tǒng)計特性一、高光譜數(shù)據(jù)的降維問題1.2高維特征帶來的新問題18第十八頁,共四十七頁。若為D維空間中的一個容量為N的數(shù)據(jù)集合,假設(shè)其來自于維數(shù)為D的某一數(shù)據(jù)集的采樣。降維的目標(biāo)是探求數(shù)據(jù)集合適的低維坐標(biāo)描述,將原數(shù)據(jù)集合投影到低維空間,獲得原數(shù)據(jù)集合的低維簡潔表示。一、高光譜數(shù)據(jù)的降維問題1.3高光譜降維方法:波段選擇特征變換19第十九頁,共四十七頁。注意不要走向另一個極端:降維絕對不是對高維光譜信息的舍棄,而是立足于高維數(shù)據(jù),針對不同的使用目的得到相應(yīng)低維數(shù)據(jù)。圖書館的書種類繁多,不同專業(yè)的同學(xué)各取所需,只選一小部分,但并不意味著其它的書是多余的。一、高光譜數(shù)據(jù)的降維問題1.3高光譜降維20第二十頁,共四十七頁。高光譜數(shù)據(jù)降維的方法波段選擇特征變換具體內(nèi)容在下一講中介紹

降維后得到的低維特征空間是否有效進行類別區(qū)分?一、高光譜數(shù)據(jù)的降維問題1.3高光譜降維21第二十一頁,共四十七頁。一、高光譜數(shù)據(jù)的降維問題二、類別可分性準(zhǔn)則三、基于幾何距離的可分性準(zhǔn)則四、基于類的概率密度的可分性準(zhǔn)則第四章第1節(jié)高光譜數(shù)據(jù)降維與可分性準(zhǔn)則22第二十二頁,共四十七頁。降維得到低維特征形成特征空間分布不同可分性存在差異衡量可分性?可分性判據(jù)定量化的指標(biāo)指導(dǎo)降維二、類別可分性準(zhǔn)則2.1高光譜數(shù)據(jù)降維與類別可分性判據(jù)的關(guān)系23第二十三頁,共四十七頁。概念:從高維數(shù)據(jù)中得到了一組用來分類的特征,需要一個定量的標(biāo)準(zhǔn)來衡量特征對分類的有效性。2.2可分性準(zhǔn)則基本概念可分性準(zhǔn)則二、類別可分性準(zhǔn)則可分性準(zhǔn)則的主要類型:基于幾何距離的可分性準(zhǔn)則基于概率密度的可分性準(zhǔn)則特點:通過已知類別先驗知識,衡量當(dāng)前特征空間對類別的區(qū)分效果。24第二十四頁,共四十七頁。一、高光譜數(shù)據(jù)的降維問題二、類別可分性準(zhǔn)則三、基于幾何距離的可分性準(zhǔn)則四、基于類的概率密度的可分性準(zhǔn)則第四章第1節(jié)高光譜數(shù)據(jù)降維與可分性準(zhǔn)則25第二十五頁,共四十七頁。不同的類別不同的分布區(qū)域類別可分性區(qū)域可分性區(qū)域可分性通過幾何距離來度量三、基于幾何距離的可分性準(zhǔn)則3.1基本思想26第二十六頁,共四十七頁。1.點與點的距離在維特征空間中,特征點與特征點之間的歐氏距離為:3.2幾何距離可分性準(zhǔn)則原理三、基于幾何距離的可分性準(zhǔn)則27第二十七頁,共四十七頁。當(dāng)前點與點集中每個點逐個計算距離2.點與點集的距離3.2幾何距離可分性準(zhǔn)則原理三、基于幾何距離的可分性準(zhǔn)則28第二十八頁,共四十七頁??傮w的均值矢量類內(nèi)的均值矢量3.類內(nèi)及總體的均值矢量3.2幾何距離可分性準(zhǔn)則原理三、基于幾何距離的可分性準(zhǔn)則29第二十九頁,共四十七頁。類內(nèi)均方歐氏距離定義為:類內(nèi)均方距離也可定義為:3.2幾何距離可分性準(zhǔn)則原理4.類內(nèi)距離先求出各自到類心的距離的平方,再求和兩兩運算,不涉及類心三、基于幾何距離的可分性準(zhǔn)則30第三十頁,共四十七頁。類內(nèi)離差矩陣,反映類內(nèi)部樣本在均值周圍的散布情況。(矩陣的跡)與類內(nèi)均方歐氏距離的關(guān)系:3.2幾何距離可分性準(zhǔn)則原理5.類內(nèi)離差矩陣三、基于幾何距離的可分性準(zhǔn)則31第三十一頁,共四十七頁。兩類樣本之間的距離X1X2X3Y1Y2A類B類兩兩之間3.2幾何距離可分性準(zhǔn)則原理6.兩類之間的距離三、基于幾何距離的可分性準(zhǔn)則32第三十二頁,共四十七頁。取歐氏距離時,總的均方距離為總的樣本距離兩類樣本之間的距離類與類兩兩求和3.2幾何距離可分性準(zhǔn)則原理7.各類總的均方距離三、基于幾何距離的可分性準(zhǔn)則33第三十三頁,共四十七頁。第i類的離差矩陣第i類的比例A.總的類內(nèi)離差矩陣3.2幾何距離可分性準(zhǔn)則原理7.多類情況離差矩陣三、基于幾何距離的可分性準(zhǔn)則34第三十四頁,共四十七頁。第i類樣本均值總體樣本均值每一類只有一個代表B.類間離差矩陣3.2幾何距離可分性準(zhǔn)則原理7.多類情況離差矩陣三、基于幾何距離的可分性準(zhǔn)則35第三十五頁,共四十七頁。任一樣本實質(zhì)是樣本總體的協(xié)方差矩陣不涉及類的概念總體樣本均值C.總體離差矩陣3.2幾何距離可分性準(zhǔn)則原理7.多類情況離差矩陣三、基于幾何距離的可分性準(zhǔn)則36第三十六頁,共四十七頁。點與點的距離點到點集類內(nèi)的均值矢量類內(nèi)距離類內(nèi)均方距離類內(nèi)離差矩陣總體的均值矢量兩類之間的距離總體離差矩陣各類模式之間總的均方距離如何通過幾何距離衡量可分性?三、基于幾何距離的可分性準(zhǔn)則3.3判據(jù)構(gòu)造1.離差矩陣分析37第三十七頁,共四十七頁。樣本的散布程度樣本越分散矩陣數(shù)值越大類的內(nèi)部越緊密越好類之間越分散越好降維方案1降維方案2樣本的類別信息已知越小越好越大越好情況復(fù)雜三、基于幾何距離的可分性準(zhǔn)則3.3判據(jù)構(gòu)造1.離差矩陣分析38第三十八頁,共四十七頁。原則:數(shù)值的大小直接體現(xiàn)降維后特征空間的類別可分性。常見判據(jù):3.3判據(jù)構(gòu)造2.依據(jù)可分性準(zhǔn)則構(gòu)造判據(jù)三、基于幾何距離的可分性準(zhǔn)則39第三十九頁,共四十七頁。一、高光譜數(shù)據(jù)的降維問題二、類別可分性準(zhǔn)則三、基于幾何距離的可分性準(zhǔn)則四、基于類的概率密度的可分性準(zhǔn)則第四章第1節(jié)高光譜數(shù)據(jù)降維與可分性準(zhǔn)則40第四十頁,共四十七頁。先驗概率后驗概率條件概率在樣本集中,預(yù)先已知的某一類出現(xiàn)的概率P(Wi)對于樣本集中的某一模式x,它屬于某類Wi的概率P(Wi|x)在某一類Wi中,模式x出現(xiàn)的概率P(x|Wi)4.1基本概念回顧四、基于概率密度的可分性準(zhǔn)則41第四十一頁,共四十七頁。W1

W2

P(x|W1)P(x|W2)P100%0%W2W1100%W1

W2

P(x|W1)P(x|W2)P0%W1W2各類的條件概率密度函數(shù)P(x|Wi)重疊度越低,特征可分性越好。四、基于概率密度的可分性準(zhǔn)則4.2概率密度分析42第四十二頁,共四十七頁??煞中耘袚?jù)的設(shè)定衡量概率密度重疊度立足于基本性質(zhì):

Jp>=0;當(dāng)兩類概率密度完全不重疊時,Jp取最大值;當(dāng)兩類概率密度完全重疊時,Jp等于0;兩類概率密度具有“對稱性”。四、基于概率密度的可分性準(zhǔn)則4.3基本性質(zhì)43第四十三頁,共四十七頁。進行相關(guān)性運算,實際上是對兩個概率密度函數(shù)進行卷積運算。兩個概率密度函數(shù)越重合,卷積結(jié)果越大;當(dāng)二者完全重合時,相當(dāng)于對p(x)進行全概率積分,等于1;當(dāng)二者完全分離時,卷積結(jié)果等于零。在開區(qū)間(0,1)內(nèi),y=-ln(x)取值范圍為0至正無窮大。(性質(zhì)1,2,3)四、基于概率密度的可分性準(zhǔn)則4.4Bhattacharyya判據(jù)44第四十四頁,共四十七頁。更具一般性的判據(jù):S=0.5時,Chernoff判據(jù)即為Bhattacharyya判據(jù)四、基于概率密度的可分性準(zhǔn)則4.5Chernoff判據(jù)45第四十五頁,共四十七頁。特征空間對w1

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負(fù)責(zé)。
  • 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時也不承擔(dān)用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

評論

0/150

提交評論