基于haar小波變換的時(shí)間序列多尺度分辨方法_第1頁(yè)
基于haar小波變換的時(shí)間序列多尺度分辨方法_第2頁(yè)
基于haar小波變換的時(shí)間序列多尺度分辨方法_第3頁(yè)
基于haar小波變換的時(shí)間序列多尺度分辨方法_第4頁(yè)
基于haar小波變換的時(shí)間序列多尺度分辨方法_第5頁(yè)
全文預(yù)覽已結(jié)束

下載本文檔

版權(quán)說(shuō)明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請(qǐng)進(jìn)行舉報(bào)或認(rèn)領(lǐng)

文檔簡(jiǎn)介

基于haar小波變換的時(shí)間序列多尺度分辨方法

自20世紀(jì)90年代以來(lái),時(shí)間序列數(shù)據(jù)的研究有所增加。運(yùn)用各種挖掘方法和模型,對(duì)時(shí)間序列進(jìn)行分類、聚類、預(yù)測(cè)和關(guān)聯(lián)模式挖掘,能提取時(shí)間序列中隱含的模式和信息,具有重要的理論意義和應(yīng)用價(jià)值。由于時(shí)間序列來(lái)源于實(shí)際生活的各個(gè)應(yīng)用領(lǐng)域,采樣方法和測(cè)量標(biāo)準(zhǔn)都不一致,具有數(shù)據(jù)短期波動(dòng)頻繁、存在大量噪聲干擾、以及非穩(wěn)態(tài)的特點(diǎn),因此對(duì)時(shí)間序列的分析和處理較為復(fù)雜并有著特殊的要求。時(shí)間序列數(shù)據(jù)的聚類分析近年來(lái)得到廣泛研究。依據(jù)對(duì)數(shù)據(jù)的預(yù)處理方法以及數(shù)據(jù)的組織形式,時(shí)間序列聚類方法可分為以下3種:基于原始數(shù)據(jù)的時(shí)間序列聚類;基于特征提取的時(shí)間序列聚類;基于模型的時(shí)間序列聚類。文中主要研究基于特征提取的時(shí)間序列聚類。Agrawal等運(yùn)用離散傅里葉變換(DFT)將原始時(shí)間序列轉(zhuǎn)換為離散傅里葉系數(shù),從而將時(shí)間序列從時(shí)域轉(zhuǎn)換到頻域,將變換后的前幾個(gè)分量代替原始時(shí)間序列,對(duì)時(shí)間序列起到降維的作用,在此基礎(chǔ)上利用歐氏距離進(jìn)行時(shí)間序列的相似性查詢和聚類研究。Struzik等通過(guò)標(biāo)準(zhǔn)正交變換將時(shí)間序列轉(zhuǎn)換為一組Haar小波基,通過(guò)多分辨分析的方式對(duì)時(shí)間序列的局部斜率進(jìn)行估計(jì),得到基于Haar小波變換的符號(hào)表示法和對(duì)數(shù)差分表示法,對(duì)時(shí)間序列的相似性進(jìn)行度量。Gavrilov基于原始的、經(jīng)正規(guī)化處理的、由原始數(shù)據(jù)的一階導(dǎo)數(shù)組成的證券時(shí)間序列,分別運(yùn)用主成份分析、離散傅立葉變換和分段式正規(guī)化方法對(duì)時(shí)間序列進(jìn)行降維處理;然后采用層次凝聚法對(duì)降維后的數(shù)據(jù)進(jìn)行聚類分析。何蘭芳等運(yùn)用高斯調(diào)制小波作為母小波,通過(guò)對(duì)時(shí)間序列進(jìn)行多重小波分解,去掉部分高頻分量后對(duì)數(shù)據(jù)進(jìn)行重構(gòu),在一組實(shí)驗(yàn)數(shù)據(jù)和大地電磁測(cè)深數(shù)據(jù)上進(jìn)行實(shí)驗(yàn)。朱廣彬等依據(jù)小波多分辨分析的原理,利用Daubechies4小波對(duì)溫度異常時(shí)間序列進(jìn)行5層小波分解,得到分解后的小波系數(shù),將高頻小波系數(shù)賦零值然后進(jìn)行重構(gòu),對(duì)時(shí)間序列進(jìn)行消噪處理。Dokur和ue6c0lmez分離出第1和第2心音信號(hào),運(yùn)用小波變換對(duì)分割后的心音信號(hào)進(jìn)行特征提取;然后運(yùn)用增量式自組織神經(jīng)網(wǎng)絡(luò)(ISOM)對(duì)心音信號(hào)進(jìn)行分類。1時(shí)間序列自組織特征由于小波變換具有在時(shí)域和頻域同時(shí)局部化和多尺度分辨的功能,能對(duì)時(shí)間序列數(shù)據(jù)進(jìn)行很好的展開(kāi)和逼近。通過(guò)對(duì)時(shí)間序列進(jìn)行小波分析,分離和提取數(shù)據(jù)中的低頻分量和高頻分量,從而將原始數(shù)據(jù)中包含的信號(hào)與噪聲相互分離。通過(guò)保留低頻信號(hào),去除高頻噪聲,可獲取時(shí)間序列的總體趨勢(shì)和全局特征,達(dá)到降維的目的。采用的技術(shù)路線如圖1所示。獲取時(shí)間序列總體趨勢(shì)之后,計(jì)算時(shí)間序列的相關(guān)統(tǒng)計(jì)量,如:偏差、峰值、均值、方差、各階原點(diǎn)矩、各階中心矩等,獲得時(shí)間序列的基本統(tǒng)計(jì)特征。以適當(dāng)?shù)男问浇M合時(shí)間序列的總體趨勢(shì)和統(tǒng)計(jì)特征量,形成時(shí)間序列的待聚類組合特征量,作為自組織特征映射SOM神經(jīng)網(wǎng)絡(luò)聚類模型的輸入數(shù)據(jù),進(jìn)行聚類分析,可改善時(shí)間序列數(shù)據(jù)的聚類精度。這里的研究方案中,選取一階原點(diǎn)矩(均值)、二階中心矩(方差)和三階中心矩為統(tǒng)計(jì)特征量,突出時(shí)間序列數(shù)據(jù)的聚類特征。在幾組模擬生成的時(shí)間序列數(shù)據(jù)上進(jìn)行實(shí)驗(yàn)分析,并將此方法運(yùn)用于三江平原地區(qū)MODIS遙感影像中林地植被的聚類提取,進(jìn)行了應(yīng)用研究。2小波變換的局部化特性小波變換是在Fourier變換和Gabor變換的基礎(chǔ)上演變而來(lái)的,是繼傅立葉分析之后的又一個(gè)重大突破,被廣泛用于信號(hào)處理、圖像壓縮、模式識(shí)別、計(jì)算機(jī)視覺(jué)、量子物理以及眾多非線性分析領(lǐng)域。小波變換在時(shí)域和頻域都具有良好的局部化特性,是一種時(shí)頻局部化或稱為時(shí)頻定位的工具,被譽(yù)為“數(shù)學(xué)顯微鏡”;同時(shí)小波變換還具有多分辨分析的特點(diǎn),因此特別適用于對(duì)非平穩(wěn)信號(hào)進(jìn)行分析和處理。2.1haar小波尺度函數(shù)Haar小波是小波分析發(fā)展過(guò)程中出現(xiàn)最早的小波,Haar小波實(shí)質(zhì)上是一階的Daubechies小波,也是最簡(jiǎn)單的具有緊支特性的顯式正交小波。其小波函數(shù)定義為Haar小波尺度函數(shù)定義為規(guī)范化的Haar小波尺度函數(shù)為其中,j為尺度因子,改變j使函數(shù)圖形縮小或者放大;i為平移參數(shù),改變i使函數(shù)沿x軸方向平移;常數(shù)因子2j/2用以滿足內(nèi)積等于1的條件。2.2多尺度分解haar小波小波變換通過(guò)平移母小波可獲得信號(hào)的時(shí)間信息,而通過(guò)縮放小波的寬度或尺度可獲得信號(hào)的頻率特性。在小波變換中,近似值是大的縮放因子產(chǎn)生的系數(shù),表示信號(hào)的低頻分量。而細(xì)節(jié)值是小的縮放因子產(chǎn)生的系數(shù),表示信號(hào)的高頻分量。通過(guò)Haar小波變換對(duì)時(shí)間序列數(shù)據(jù)進(jìn)行多尺度分解,每次分解將時(shí)間序列數(shù)據(jù)分解成包含低頻分量的尺度信號(hào)和包含高頻分量和噪聲的細(xì)節(jié)信號(hào)。其中,尺度信號(hào)體現(xiàn)了時(shí)間序列數(shù)據(jù)的變化趨勢(shì)。對(duì)獲得的尺度信號(hào)再次執(zhí)行小波變換進(jìn)行2次分解,得到新的尺度信號(hào)和細(xì)節(jié)信號(hào)。在新的尺度信號(hào)上重復(fù)小波分解過(guò)程,直到分解和降維過(guò)程結(jié)束。每執(zhí)行1次Haar小波分解,時(shí)間序列的長(zhǎng)度縮短為本次分解前的1/2。長(zhǎng)度為n的原始時(shí)間序列經(jīng)過(guò)m次分解后,長(zhǎng)度縮短為n/2m,從而達(dá)到降低時(shí)間維度的目的。3實(shí)驗(yàn)分析3.1基于自組織特征的som神經(jīng)網(wǎng)絡(luò)訓(xùn)練過(guò)程模擬生成4種不同類型的時(shí)間序列信號(hào),即分別生成若干組正弦信號(hào)序列、余弦信號(hào)序列、正切信號(hào)序列和白噪聲信號(hào)序列。每組時(shí)間序列的長(zhǎng)度均為100,分別給這些信號(hào)(白噪聲信號(hào)除外)加上一定量的在[0,1]區(qū)間上服從正態(tài)分布的隨機(jī)噪聲(衰減到原信號(hào)量的40%)。對(duì)各組時(shí)間序列分別進(jìn)行3次Haar小波變換縮減維度,提取變換后的尺度信號(hào);然后計(jì)算該時(shí)間序列的一階原點(diǎn)矩、二階及三階中心矩等統(tǒng)計(jì)特征量。將尺度信號(hào)與各自的統(tǒng)計(jì)特征量組合成新的序列,作為自組織特征映射SOM神經(jīng)網(wǎng)絡(luò)的輸入訓(xùn)練樣本,對(duì)SOM神經(jīng)網(wǎng)絡(luò)進(jìn)行訓(xùn)練,以便能很好區(qū)分以上各類信號(hào)。用白噪聲信號(hào)作為以上4類信號(hào)的背景信號(hào),以檢驗(yàn)聚類算法的抗噪性能。3.1.1各類信號(hào)在二維平面上的排列服從均勻在尺度為50×50的二維平面上,生成160組含噪正弦時(shí)間序列、390組含噪余弦時(shí)間序列和280組含噪正切時(shí)間序列數(shù)據(jù),以及2500組信號(hào)強(qiáng)度在區(qū)間[0,1]上呈正態(tài)分布的隨機(jī)噪聲時(shí)間序列。所有時(shí)間序列的長(zhǎng)度均為100,并將噪聲序列的強(qiáng)度衰減到原信號(hào)量的30%。計(jì)算4類信號(hào)中各組時(shí)間序列在二維平面上的水平坐標(biāo)位置和垂直坐標(biāo)位置,使各類信號(hào)在該二維平面上的排列服從均勻分布。生成各類模擬信號(hào)量時(shí)間序列的計(jì)算式為:式(4)~式(7)中,T為取值從0~100的一組長(zhǎng)度為100的整型向量;randn(1,100)產(chǎn)生一組在[0,1]區(qū)間上取值服從正態(tài)分布的時(shí)間維度為100的隨機(jī)向量。各類信號(hào)在二維平面上的坐標(biāo)位置計(jì)算式分別為:式中,rand產(chǎn)生160組取值在[0,1]區(qū)間上服從均勻分布的隨機(jī)變量;X1={x1,x2,…,xi,…,x160}為160組正弦信號(hào)序列在以上二維平面上的水平坐標(biāo)矢量;Y1={y1,y2,…,yi,…,y160}為160組正弦信號(hào)序列在以上二維平面上的垂直坐標(biāo)矢量,即(xi,yi)為第i組正弦信號(hào)時(shí)間序列在二維平面上的坐標(biāo)位置。類似地,X2和Y2分別為390組余弦信號(hào)序列在二維平面上的水平坐標(biāo)矢量和垂直坐標(biāo)矢量;X3和Y3分別為280組正切信號(hào)序列在二維平面上的水平坐標(biāo)矢量和垂直坐標(biāo)矢量。模擬生成的實(shí)驗(yàn)數(shù)據(jù)在二維平面上的分布如圖2所示。3.1.2時(shí)間序列數(shù)據(jù)的統(tǒng)計(jì)特征量對(duì)模擬生成的正弦信號(hào)時(shí)間序列、余弦信號(hào)時(shí)間序列、正切信號(hào)時(shí)間序列分別進(jìn)行3次Haar小波變換,所產(chǎn)生的尺度分量和細(xì)節(jié)分量如圖3~圖5所示。計(jì)算以上3類時(shí)間序列數(shù)據(jù)的統(tǒng)計(jì)特征量,其中包括原始時(shí)間序列的一階原點(diǎn)矩,二階中心矩和三階中心矩。將各類時(shí)間序列數(shù)據(jù)的3個(gè)統(tǒng)計(jì)量依次附加在3次小波分解后產(chǎn)生的尺度分量之后,作為自組織特征映射SOM神經(jīng)網(wǎng)絡(luò)聚類模型的輸入訓(xùn)練樣本,進(jìn)行聚類分析。3.1.3時(shí)間序列聚類分析對(duì)以上3類時(shí)間序列數(shù)據(jù)以及高斯白噪聲數(shù)據(jù)進(jìn)行標(biāo)準(zhǔn)正規(guī)化變換;然后運(yùn)用主成份分析,提取時(shí)間序列數(shù)據(jù)的前10個(gè)主成份分量,作為SOM神經(jīng)網(wǎng)絡(luò)聚類模型的輸入向量,設(shè)定聚類類別數(shù)為6,對(duì)SOM神經(jīng)網(wǎng)絡(luò)進(jìn)行訓(xùn)練;然后用訓(xùn)練好的神經(jīng)網(wǎng)絡(luò)對(duì)以上3類時(shí)間序列數(shù)據(jù)進(jìn)行仿真聚類分析,所得到的結(jié)果如表1所示。表中,類別中元素總數(shù)指聚類算法判定為某類信號(hào)的時(shí)間序列的個(gè)數(shù),如表中聚類算法將303組時(shí)間序列判定為正弦序列;命中數(shù)指在該類信號(hào)中正確分類的時(shí)間序列的個(gè)數(shù),如表中分類得到的303組正弦序列中,有160組準(zhǔn)確的進(jìn)行了分類。對(duì)以上3類時(shí)間序列數(shù)據(jù)以及高斯白噪聲數(shù)據(jù)進(jìn)行3次Haar小波變換,取第3次小波變換后生成的尺度分量,作為SOM神經(jīng)網(wǎng)絡(luò)聚類模型的輸入向量;并設(shè)定聚類類別數(shù)為6,對(duì)SOM神經(jīng)網(wǎng)絡(luò)進(jìn)行訓(xùn)練,用訓(xùn)練好的神經(jīng)網(wǎng)絡(luò)對(duì)以上3類時(shí)間序列數(shù)據(jù)進(jìn)行仿真聚類分析,所得到的結(jié)果如表2所示。對(duì)以上3類時(shí)間序列數(shù)據(jù)以及高斯白噪聲數(shù)據(jù)進(jìn)行3次Haar小波變換;然后計(jì)算各類時(shí)間序列數(shù)據(jù)的一階原點(diǎn)矩、二階中心矩和三階中心矩,取第3次小波變換后生成的尺度分量,作為SOM神經(jīng)網(wǎng)絡(luò)輸入向量的前11個(gè)分量;將以上3個(gè)統(tǒng)計(jì)量依次作為后3個(gè)分量,設(shè)定聚類類別數(shù)為6,對(duì)SOM神經(jīng)網(wǎng)絡(luò)進(jìn)行訓(xùn)練,用訓(xùn)練好的神經(jīng)網(wǎng)絡(luò)對(duì)以上3類時(shí)間序列數(shù)據(jù)進(jìn)行仿真聚類分析,所得到的結(jié)果如表3所示。3.1.4聚類分析精度分析基于3種時(shí)間序列特征提取方法,即主成份分析法、Haar小波變換法和Haar小波變換結(jié)合統(tǒng)計(jì)特征量方法,運(yùn)用SOM神經(jīng)網(wǎng)絡(luò)對(duì)時(shí)間序列模擬數(shù)據(jù)進(jìn)行聚類分析,通過(guò)對(duì)聚類結(jié)果進(jìn)行分析發(fā)現(xiàn):在基于以上3種特征提取的聚類分析中,余弦信號(hào)的聚類精度都很高;在基于主成份分析的聚類分析中,正切信號(hào)易與背景白噪聲信號(hào)發(fā)生混分,使得對(duì)正切信號(hào)不能很好地分類和提取,而在基于Haar小波變換和基于Haar小波變換與統(tǒng)計(jì)特征量的聚類分析中,正切信號(hào)能得到很好地劃分和提取。對(duì)于正弦信號(hào),在基于以上3種特征提取的聚類分析中,都存在不同程度的誤分。在基于主成份分析的聚類分析中,誤分程度較高;在基于Haar小波變換的聚類分析中,誤分程度和漏分程度都較高;而在基于Haar小波變換與統(tǒng)計(jì)特征量的聚類分析中,只存在少量漏分,誤分程度得到很大改善。3.2基于nd-mi和k-me現(xiàn)行聚類分析的林地植被提取通過(guò)光譜分析和植被季相分析表明,在已獲取的三江平原地區(qū)MODIS影像數(shù)據(jù)中,由第129,161,193,209,241,257和289天的NDVI和NDMI以及可見(jiàn)光紅波段組成的多波段多時(shí)相的影像數(shù)據(jù),可以很好地用于三江平原地區(qū)林地植被的提取。因此取以上7個(gè)時(shí)相的NDVI,NDMI和可見(jiàn)光紅波段數(shù)據(jù)組合成實(shí)驗(yàn)用的時(shí)間序列數(shù)據(jù),以便基于實(shí)際遙感影像數(shù)據(jù)進(jìn)行實(shí)驗(yàn)分析。首先將以上7個(gè)時(shí)相的NDVI,NDMI和可見(jiàn)光紅波段的數(shù)據(jù)依次排列形成組合的時(shí)間序列數(shù)據(jù),對(duì)該數(shù)據(jù)進(jìn)行標(biāo)準(zhǔn)正規(guī)化變換,使其取值范圍統(tǒng)一到[0,1]區(qū)間上,對(duì)規(guī)范化的數(shù)據(jù)執(zhí)行EnhancedLee濾波;然后執(zhí)行最小噪聲分離MNF變換,取MNF變換后數(shù)據(jù)的前3個(gè)主成分,運(yùn)用K-Means聚類算法進(jìn)行聚類分析,提取影像中的林地植被。截取影像數(shù)據(jù)中林地植被比較集中的一塊區(qū)域,計(jì)算該區(qū)域范圍內(nèi)林地提取的生產(chǎn)者精度和用戶精度,得到漏分誤差為0,錯(cuò)分誤差為41.20%,其生產(chǎn)者精度為100%,用戶精度為58.80%。用以上方法提取的部分林地植被如圖6所示。對(duì)規(guī)范化后的MODIS影像時(shí)間序列數(shù)據(jù)執(zhí)行1次Haar小波變換;然后分別求得NDVI,ND-MI和可見(jiàn)光紅波段時(shí)間序列數(shù)據(jù)的一階原點(diǎn)矩、二階中心矩和三階中心矩,共9個(gè)統(tǒng)計(jì)量,將小波變換分解后得到的尺度分量與這9個(gè)統(tǒng)計(jì)量組合形成待聚類數(shù)據(jù),作為輸入向量輸入到SOM神經(jīng)網(wǎng)絡(luò)聚類模型中進(jìn)行聚類分析,得到提取的林地植被。取與圖6相同的影像區(qū)域,計(jì)算在此區(qū)域范圍內(nèi)聚類分析的生產(chǎn)者精度和用戶精度,得到生產(chǎn)者精度為95.88%,用戶精度為92.33%。圖7(a)是原始時(shí)間序列數(shù)據(jù)經(jīng)標(biāo)準(zhǔn)正規(guī)化變換所得到的時(shí)間序列;圖7(b)是左側(cè)的時(shí)間序列經(jīng)Haar小波變換及統(tǒng)計(jì)特征量提取后所形成時(shí)間序列;圖8顯示了基于小波變換與統(tǒng)計(jì)量進(jìn)行聚類分析所提取的林地植被;圖9是該研究區(qū)域內(nèi)林地植被的實(shí)際分布情況。分析實(shí)驗(yàn)結(jié)果發(fā)現(xiàn),基于小波變換與統(tǒng)計(jì)量,并運(yùn)用SOM聚類模型進(jìn)行林地植被提取,其生產(chǎn)者精度雖然略低于基于MNF變換和K-Means聚類算法提取林地植被的精度。前者的生產(chǎn)者精度為95.88%,后者的生產(chǎn)者精度接近100%。但基于小波變換與統(tǒng)計(jì)量所提取的林地分布范圍,其用戶精度較基于MNF變換法的提取精度有了較大提高。前者的用戶精度為92.33%,后者的用戶精度為58.80%。分析其原因,是由于原始時(shí)間序列中水體和林地植被之間光譜特征的差別并不十分明顯,因此聚類算法不能很好地分割水體和植被;而經(jīng)過(guò)小波變換和統(tǒng)計(jì)特征量提取之后,突顯了水體和林地植被在光譜特征上的統(tǒng)計(jì)差別,使得聚類算法能夠很好地劃分水體和林地植被。4時(shí)間序列自組織特征1)通過(guò)對(duì)時(shí)間序列數(shù)據(jù)進(jìn)行小波分析,將原始時(shí)間序列分解成信號(hào)成份(低頻分量)與噪聲成份(

溫馨提示

  • 1. 本站所有資源如無(wú)特殊說(shuō)明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請(qǐng)下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請(qǐng)聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁(yè)內(nèi)容里面會(huì)有圖紙預(yù)覽,若沒(méi)有圖紙預(yù)覽就沒(méi)有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫(kù)網(wǎng)僅提供信息存儲(chǔ)空間,僅對(duì)用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對(duì)用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對(duì)任何下載內(nèi)容負(fù)責(zé)。
  • 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請(qǐng)與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶因使用這些下載資源對(duì)自己和他人造成任何形式的傷害或損失。

評(píng)論

0/150

提交評(píng)論