基于時(shí)間序列相似性匹配算法的地震預(yù)測研究_第1頁
基于時(shí)間序列相似性匹配算法的地震預(yù)測研究_第2頁
基于時(shí)間序列相似性匹配算法的地震預(yù)測研究_第3頁
基于時(shí)間序列相似性匹配算法的地震預(yù)測研究_第4頁
基于時(shí)間序列相似性匹配算法的地震預(yù)測研究_第5頁
已閱讀5頁,還剩10頁未讀, 繼續(xù)免費(fèi)閱讀

下載本文檔

版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進(jìn)行舉報(bào)或認(rèn)領(lǐng)

文檔簡介

1、基于時(shí)間序列相似性匹配算法的地震預(yù)測研究論文摘要:把匹配抽象時(shí)間序列相似性的方法引入到地震預(yù)報(bào)的應(yīng)用中,結(jié)合大量地震歷史源數(shù)據(jù),地震領(lǐng)域的專家經(jīng)驗(yàn)知識(shí)和相關(guān)成果根底上,提出了一種簡化的抽象時(shí)間序列匹配模型。該模型在對海量數(shù)據(jù)進(jìn)行預(yù)處理篩選的根底上在進(jìn)行時(shí)間相似性匹配,增加了橫向和縱向多方位地區(qū)和多方位時(shí)間段的匹配,不同時(shí)間差和閾值的匹配,并通過大量實(shí)驗(yàn)對該模型進(jìn)行了反復(fù)驗(yàn)證,同時(shí)對我國地震頻繁地區(qū)近幾十年的地震歷史數(shù)據(jù)進(jìn)行了相似性匹配實(shí)驗(yàn)分析,取得了可信度較高的實(shí)驗(yàn)結(jié)果,實(shí)驗(yàn)結(jié)果驗(yàn)證了所給時(shí)間序列相似性匹配控制策略的有效性、實(shí)用性以及算法的優(yōu)越性。論文關(guān)鍵詞:時(shí)間序列,序列匹配,地震預(yù)測,算法

2、,地震相關(guān)地區(qū)0引言時(shí)間序列(Timeseries)泛指那些隨時(shí)間或空間有序變化的數(shù)據(jù)集合,這些數(shù)據(jù)記錄集合往往采用等時(shí)間或空間間隔進(jìn)行度量。如何有效的管理和利用海量數(shù)據(jù)序列,有效的發(fā)現(xiàn)和理解這些數(shù)據(jù)序列背后隱含的規(guī)律和知識(shí),已受到越來越多數(shù)據(jù)挖掘研究者廣泛關(guān)注。在其相應(yīng)的數(shù)據(jù)挖掘系統(tǒng)中,時(shí)間序列的相似性查詢是分析時(shí)間序列變化規(guī)律的一種重要方法。對于時(shí)間序列的分類、預(yù)測及知識(shí)發(fā)現(xiàn)都具有重要的現(xiàn)實(shí)意義。比方在我們熟悉的股票,期貨,具有相似性銷售的產(chǎn)品,恒星的光譜曲線中相似性度量都具有不可替代的作用。地震序列是一維時(shí)間序列,卻蘊(yùn)藏著動(dòng)態(tài)演化的中其它變量的痕跡和信息,因此對地震序列的研究具有重要意義

3、。時(shí)間序列相似度序列匹配是在時(shí)間,震級(jí)數(shù)據(jù)庫中找出與給定時(shí)間,震級(jí)序列模型相似的序列,對相似性度量的建立求解過程,是數(shù)據(jù)挖掘中一類重要問題,具體表現(xiàn)在大量數(shù)據(jù)中具有時(shí)間和另一性質(zhì)的二維相關(guān)性。在地震預(yù)報(bào)科學(xué)中,經(jīng)過大量的研究和積累,專家們發(fā)現(xiàn)在一定的區(qū)域中地震活動(dòng)具有同步漲落的現(xiàn)在。也就是說在一定的區(qū)域范圍中的兩個(gè)地區(qū),特定震級(jí)以上的有明顯震感的地震相伴發(fā)生的現(xiàn)象稱為地震的相關(guān)現(xiàn)象,也稱地震的區(qū)域相關(guān)性。地震的相關(guān)性反映了地球的自轉(zhuǎn),向心力相似,地質(zhì)構(gòu)造的相似,板塊運(yùn)動(dòng)等對地震發(fā)生的規(guī)律性的影響。所以尋找地震相關(guān)區(qū)域,進(jìn)而預(yù)報(bào)相關(guān)的地震,是人們最常用的預(yù)報(bào)地震的方法之一。鑒于傳統(tǒng)方法費(fèi)時(shí)費(fèi)力,

4、預(yù)報(bào)不精確等特點(diǎn)。本文把數(shù)據(jù)挖掘技術(shù)引入地震預(yù)報(bào)科學(xué)中,通過不同地區(qū)地震數(shù)目的不同,首先進(jìn)行粗相似匹配,即對原始地震數(shù)據(jù)中相差一定地震數(shù)目條數(shù)以下的地震區(qū)域?qū)⑵滢D(zhuǎn)化為粗相似格式,其次對粗相似區(qū)域中的數(shù)據(jù)項(xiàng)轉(zhuǎn)化為時(shí)間序列,對粗相似的區(qū)域進(jìn)行時(shí)間相似度匹配來發(fā)現(xiàn)地震相關(guān)區(qū)域,從而進(jìn)行地震預(yù)報(bào)。本文首先結(jié)合地震領(lǐng)域的相關(guān)知識(shí),定義了序列的相似度量模型,提出了一種基于相似度序列匹配的算法,利用相關(guān)的地震相似度全面的對時(shí)間,經(jīng)緯度和震級(jí)等地震相關(guān)信息進(jìn)行處理,從而快速,全面的找出地震的相關(guān)區(qū)域。1地震相關(guān)地區(qū)的序列相似性定義及度量模型地震相關(guān)地區(qū)相似度匹配研究可以分為以下幾個(gè)局部:相似性的定義,度量模型

5、的建立和相似度匹配算法的實(shí)現(xiàn)。相似性定義和度量模型一般根據(jù)不同的需求進(jìn)行定義,進(jìn)而轉(zhuǎn)化為一些抽象的數(shù)學(xué)模型來解決問題。傳統(tǒng)的相似性定義是根據(jù)時(shí)間序列數(shù)據(jù)的上升或下降的趨勢和需解決的問題相結(jié)合來定義。比擬典型的有ARMA(autoregressionmovingaverage)模型,采用的是隨機(jī)時(shí)間序列分析技術(shù);DFT(discretefouriertransform)模型,采用的是把時(shí)間序列轉(zhuǎn)化為空間中的點(diǎn),對這些點(diǎn)進(jìn)行分析處理。這些模型中都用了歐幾里德距離作為序列間的相似性評價(jià)函數(shù),也就是當(dāng)兩個(gè)序列間的歐氏距離小于一定的閾值時(shí),就認(rèn)為此序列相似。但在實(shí)際應(yīng)用中,由于序列長度不一,采樣率不同,

6、數(shù)據(jù)多少相差較大等問題,使得歐氏距離很難直接用于解決問題。由于地震數(shù)據(jù)記錄的每一次地震發(fā)生的時(shí)間,經(jīng)度,緯度,震級(jí)以及地震事件序列等。其具非線性特點(diǎn),傳統(tǒng)的時(shí)間序列相似性度量模型和匹配很難使用于地震數(shù)據(jù)。對此,本文根據(jù)地震相關(guān)領(lǐng)域知識(shí),通過適當(dāng)?shù)臄?shù)據(jù)預(yù)處理,將其轉(zhuǎn)化為一定震級(jí),一定時(shí)間,一定空間范圍內(nèi)的地震事件序列集。構(gòu)成不同的地震時(shí)間序列。下面給出地震序列及相似性定義及地震序列相似性的模型。定義1地震事件把預(yù)處理過的地震數(shù)據(jù)目錄中的每一條地震記錄定義為一次事件。按照不同的空間屬性劃分為不同的地震事件集。在地震事件集上t時(shí)刻發(fā)生的地震事件記為F(t)。定義2地震事件序列在一定的區(qū)域中發(fā)生在一定

7、的時(shí)間范圍H內(nèi)的地震事件集Ft=F(t)|tH在時(shí)間軸上的一個(gè)排列。定義3地震序列對預(yù)處理過的地震數(shù)據(jù)目錄里的地震數(shù)據(jù)提取其時(shí)間和震級(jí),抽象為地震序列。定義4完整地震序列在某些地震區(qū)域中,對于地震序列S,在沒有發(fā)生地震事件的時(shí)間上用空元素給予填充的地震序列。定義5地震相似性設(shè)x,y分別是兩個(gè)地震序列,用函數(shù)(x,y),(x,y)來表示其相似性。令(x,y)=1,假設(shè)|x(t)-y(t)|M;(x,y)=0,假設(shè)|x(t)-y(t)|M;x(t),y(t)表示x,y的時(shí)間點(diǎn),x(t)-y(t)表示其時(shí)間差。令(x,y)=1,假設(shè)|x(m)-y(m)|M;(x,y)=0,假設(shè)|x(m)-y(m)|

8、M;x(m),y(m)表示x,y的震級(jí)數(shù),x(m)-y(m)表示震級(jí)差。M為年份誤差的閾值,M;為震級(jí)誤差的閾值。M越小時(shí)間相差越小,M越小震級(jí)相差越小。所以x,y可以對應(yīng)不同的時(shí)間點(diǎn),M和M為用戶給定。定義6地震序列相似性模型設(shè)X和Y為兩個(gè)不同的地震序列,那么X和Y的序列相似性可以用這兩個(gè)序列中對應(yīng)每一組數(shù)據(jù)的相似進(jìn)行統(tǒng)計(jì),記為相似性加權(quán)累計(jì)和來度量。兩個(gè)地震序列的相似性度量模型定義為 2由于地震目錄數(shù)據(jù)的條數(shù)是相當(dāng)?shù)拇?,在存?chǔ)過程中難免會(huì)出現(xiàn)數(shù)據(jù)不一致的現(xiàn)象,例如數(shù)據(jù)日期不符合現(xiàn)實(shí)生活中的日期,所以要將類似于這樣的無效數(shù)據(jù)去掉,從而提高數(shù)據(jù)的質(zhì)量,有利于數(shù)據(jù)挖掘的質(zhì)量。 時(shí)間 日期 經(jīng)度

9、緯度 震級(jí) 區(qū)域 19650126 023000 102.9 29.1 3 78 19650420 060000 102.65 29 3.4 78 19710324 215416 98.1 35.5 6.5 67 19710325 202150 79.42 41.42 3.3 21 19710523 040330 92.3 32.5 6.7 55 2.2實(shí)驗(yàn)結(jié)果分析地震的時(shí)間序列相似性是指在一定時(shí)間空間范圍內(nèi),兩個(gè)地區(qū)發(fā)生的地震在時(shí)間,震級(jí)方面具有相似性。比方某區(qū)域A在1995,1997,1999,2003,2004有一定震級(jí)以上的地震,而在區(qū)域B在1997,1999,2001,2005,20

10、06也發(fā)生了地震,那么A和B兩個(gè)區(qū)域在時(shí)間序列相似度上具有很大的相似性,本文針對這一特點(diǎn),設(shè)計(jì)了3組實(shí)驗(yàn),在進(jìn)行粗相似的根底上分別從不同的時(shí)間差,時(shí)空差,粗細(xì)力度差等方面進(jìn)行相似性序列分布分析。本實(shí)驗(yàn)采用4.5級(jí)以上的地震序列,時(shí)間跨度為1987-2007年范圍內(nèi),對全國的相關(guān)區(qū)域進(jìn)行分析研究,發(fā)現(xiàn)有些區(qū)域有著相似性,結(jié)果如表2所示。 區(qū)域 時(shí)間范圍 經(jīng)度范圍 緯度范圍 地震條數(shù) 年份相似 震級(jí)相似 72 1985-2005 100-105 25-30 260 41 36 61 1985-2005 95-100 25-30 160 36 23 40 1985-2005 85-90 30-35

11、240 12 14 19 1985-2005 75-80 35-40 280 12 11 62 1985-2005 95-100 30-35 120 11 10 59 1985-2005 95-100 15-25 96 10 10 由表2可以看出四川和臺(tái)灣地區(qū)以及藏南和臺(tái)灣地區(qū)的相似度最高,本文針對這兩組區(qū)域時(shí)間差在30天以內(nèi)的地震相關(guān)工程進(jìn)行研究,發(fā)現(xiàn)四川和臺(tái)灣地區(qū)有41次地震具有相關(guān)性,藏南和臺(tái)灣地區(qū)有36次相匹配的地震工程,而且地 震震級(jí)相似性也很高,具有相同的趨勢和震匹配性。圖1給出四川地區(qū)經(jīng)度100-105,緯度25-30和臺(tái)灣地區(qū)經(jīng)度120-125,緯度20-25相關(guān)地震的M-T圖

12、。圖2給出了藏南地區(qū)經(jīng)度95-100,緯度25-30和臺(tái)灣地區(qū)經(jīng)度100-105,緯度25-30相關(guān)地震的M-T圖。實(shí)驗(yàn)2:固定時(shí)間差為1年的粗粒度相似性分析在實(shí)驗(yàn)1的根底上,我們把實(shí)驗(yàn)的時(shí)間閾值由30天放大到1年,局部震級(jí)有所調(diào)整的情況下由于四川臺(tái)灣地區(qū)數(shù)據(jù)較多,震級(jí)提高到5級(jí)以上,實(shí)驗(yàn)結(jié)果發(fā)現(xiàn)多了一些區(qū)域具有相似性,其中相似度提高最明顯的是四川和臺(tái)灣地區(qū)以及藏中和四川-云南交界地區(qū)。圖3表示了四川-云南交界地區(qū)經(jīng)度90-100, 緯度25-30和藏中地區(qū)經(jīng)度85-90,緯度30-35的M-T圖,相匹配的地震條數(shù)由16次增加到23次。圖4表示了四川地區(qū)經(jīng)度100-105,緯度25-30和臺(tái)灣地區(qū)經(jīng)度120-125,緯度20-25的M-T圖,相匹配的工程由28上升到41。實(shí)驗(yàn)3:固定時(shí)間差為10天的細(xì)粒度相似性分析在實(shí)驗(yàn)1和2的根底上,針對四川臺(tái)灣地區(qū)和四川云南,藏中兩組地區(qū)將時(shí)間閾值縮小到10天,震級(jí)閾值縮小到5級(jí),進(jìn)行相似度更為精確的相似匹配。得到實(shí)驗(yàn)結(jié)果如圖5和圖

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會(huì)有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫網(wǎng)僅提供信息存儲(chǔ)空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負(fù)責(zé)。
  • 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

評論

0/150

提交評論