教育資料(2021-2022年收藏的)資料質量控制和分析方法_第1頁
教育資料(2021-2022年收藏的)資料質量控制和分析方法_第2頁
教育資料(2021-2022年收藏的)資料質量控制和分析方法_第3頁
教育資料(2021-2022年收藏的)資料質量控制和分析方法_第4頁
教育資料(2021-2022年收藏的)資料質量控制和分析方法_第5頁
已閱讀5頁,還剩3頁未讀, 繼續(xù)免費閱讀

下載本文檔

版權說明:本文檔由用戶提供并上傳,收益歸屬內容提供方,若內容存在侵權,請進行舉報或認領

文檔簡介

1、第二章 資料、質量控制和分析方法2.1 研究區(qū)域和資料本文研究范圍為石家莊市所轄全部區(qū)縣。區(qū)域邊界及其所用的17個氣象觀測站點位置分布見圖2.1。區(qū)域經度范圍為114.13°115.21°,緯度范圍為37.59°38.45°,海拔高度在35.9m255.5m之間。各氣象站基本信息見表1。(表1 應增加觀測記錄年份和遷站時間等信息)圖2.1 石家莊地區(qū)17個氣象站點分布本文研究范圍為石家莊地區(qū)所轄全部17個觀測站(各站分布見圖2.1),經度范圍為114.13°115.21°,緯度范圍為37.59°38.45°,海拔高

2、度在35.9m255.5m之間,各站基本信息見表1。表1 石家莊地區(qū)17個觀測站基本信息站點經度緯度海拔高度(m)石家莊市區(qū)114.42°38.03°81新樂114.68°38.35°70.8辛集115.21°37.91°35.9贊皇114.36°37.65°137.4平山114.2°38.25°131井陘114.13°38.03°255.5正定114.56°38.15°71行唐114.55°38.45°96.2靈壽114.38

3、6;38.3°108.9藁城114.81°38.01°53.5晉州115.06°38.01°42.4無極114.96°38.2°45.4深澤115.18°38.18°38.1欒城114.63°37.88°52.9趙縣114.73°37.76°38.5元氏114.53°37.75°66.4高邑114.61°37.59°48.9本文后面氣溫和降水兩章所用資料為石家莊市氣象局業(yè)務科提供的石家莊地區(qū)所轄17個觀測站的逐日平均氣溫、最低

4、、最高氣溫和降水資料。,由于各站資料的時間序列長度不同,為了對比分析,因此在溫度、降水變化特征中統(tǒng)一采用1972-2008年37年的時間長度的資料。周期分析中所用資料為石家莊市區(qū)站建站以來即1955年至2008年的逐日平均氣溫、降水資料。城市氣候一章城市化對氣溫和降水量的影響分析所用資料為石家莊市區(qū)站和16個郊區(qū)站1972-2008年逐日平均氣溫和降水資料。其中城市氣候一章5.1和5.2小節(jié)所用資料為石家莊市區(qū)站以及藁城、元氏、平山和新樂四個距離市區(qū)站較近的郊區(qū)站19622009年近48年的逐日平均氣溫、最低氣溫和最高氣溫。四個郊區(qū)站分布在市區(qū)站東、南、西、北四個方向,海拔高度與市區(qū)站接近,因

5、此不必做高度低訂正,減少了分析誤差;且探測環(huán)境受城市化影響較小。分析日變化時采用2009年3月至2010年2月加密的逐時氣溫資料。城市熱島強度以城市站和郊區(qū)站氣溫差表示,即 城市氣候一章城市化對氣溫和降水量的影響分析所用資料為石家莊市區(qū)站和16個郊區(qū)站1972-2008年逐日平均氣溫和降水資料。這里定義城市站平均溫度變化速率與郊區(qū)站平均溫度變化速率之差為城市熱島增溫率,熱島增溫率在其總增溫率中所占的百分比為熱島增溫貢獻率。所用資料均由石家莊氣象局相關業(yè)務單位進行了初步的質量控制,訂正了由于各種人為因素造成的錯誤值。所用資料進行了初步的質量控制,訂正了由于各種人為因素造成的錯誤值。其中季節(jié)劃分為

6、:春季(3-5月)、夏季(6-8月)、秋季(9-11月)、冬季(12月至次年2月)。本文選用19712000年的平均值作為氣候基準期。2.2資料質量控制均一化訂正本文借鑒李慶祥等65檢驗和訂正國家基本、基準站氣溫數(shù)據(jù)時所采用的E-P方法,對所用氣溫資料進行了均一性檢驗和訂正。周雅清等32也曾采用這種方法檢驗和訂正華北地區(qū)的氣溫資料。降水資料的時間序列對于臺站位置變動等影響沒有溫度那么敏感,所以本文對降水資料沒有進行嚴格的均一性檢驗和訂正。首先對所有臺站建立氣溫變化序列dT/dt,計算待檢臺站dT/dt 序列和它附近臺站的dT/dt序列的相關系數(shù),選取5個與之正相關最大的臺站作為參考臺站。利用參

7、考臺站序列和待檢序列相關系數(shù)的平方作為權重建立參考dT/dt 序列,再反算得到參考序列。然后采用滑動t檢驗法檢測待檢序列和參考序列的差異序列的不連續(xù)點,并通過臺站歷史沿革資料確定其合理性。如果不連續(xù)點附近存在站址遷移,則認為該不連續(xù)點是合理的,并進一步進行訂正;否則保留原始記錄。對于那些被確認的有合理不連續(xù)點的待檢序列,計算其與參考序列的差異序列在不連續(xù)點前后5年的差值,以此作為補償值來訂正不連續(xù)點。為了與以后的資料合并使用,訂正是以最近的資料為基礎從后向前進行的。由于上述方法要求序列子段必須多于5年,因此,如果不連續(xù)點是在開始年后或結束年前的5年內,檢驗的結果也只能出現(xiàn)在開始后或結束前的第5

8、年。這就需要參考臺站的沿革資料進行鑒別,確定其真實不連續(xù)點的位置和補償值。通過訂正,使得包括臺站遷移、儀器更換、觀測方法改變等對資料均一性的影響盡可能減少到最小。在對各站年平均氣溫進行均一性檢驗過程中(圖2.2),發(fā)現(xiàn)17個站均在1993年出現(xiàn)斷點,排除了遷站和儀器更換的原因,因此各站的年平均氣溫在1993年是一次正常的突變。各站年平均最低氣溫(圖略)與年平均氣溫類似,斷點出現(xiàn)在1987年和1993年,同樣排除了遷站和儀器更換的原因。各站年平均最高氣溫則比較均一,沒有出現(xiàn)一致的斷點現(xiàn)象。圖2.2 石家莊地區(qū)各站年平均氣溫均一性檢驗(黑實線為=0.05的顯著性水平)通過對各站年平均氣溫、年平均最

9、高、最低氣溫進行檢驗,發(fā)現(xiàn)有1個站(5.9%)的平均氣溫資料存在非均一性引起的偏差,有1個站(5.9%)的平均最高氣溫資料存在非均一性引起的偏差,有3個站(17.6%)的平均最低氣溫資料存在非均一性引起的偏差,檢驗表明石家莊地區(qū)近四十年氣溫資料中的非均一性現(xiàn)象并不嚴重,資料質量較好。這些偏差主要是由臺站遷移造成的,訂正后主要由于臺站遷移引起的溫度資料非均一性問題獲得了比較好的解決。2.3分析方法66(1不能把文獻引用序號放標題上,要在后邊具體位置引用;2。下文公式應簡化,所保留公式要有出處,要統(tǒng)一編號)(1)滑動平均滑動平均是用確定時間序列的平滑值來顯示要素的低頻變化特點,經過滑動平均后,序列

10、中短于滑動長度的波動或周期大大削弱。對樣本容量為n的序列x,其滑動平均序列表示為: j=1,2,n-k+1式中k為滑動長度,本文k值取5。(2)距平一組數(shù)據(jù)的某一個數(shù)與均值之間的差就是距平,即,氣候變量的一組數(shù)據(jù)與其均值的差異就構成了距平序列 2.1在氣候診斷分析中,常用距平序列2.1來代替氣候變量本身的觀測數(shù)據(jù)。任何氣候變量序列,經過距平化處理,都可以化為平均值為0的序列。這樣處理可以給分析帶來很多便利,計算結果也更直觀。(3)線性趨勢用表示樣本量為的某一氣候變量,用表示所對應的時間,建立與之間的一元線性回歸: , i=1,2, 2.2方程(2.2)可以看作一種特殊的、最簡單的線性回歸形式。

11、它的含義是用一條合理的直線表示與其時間之間的關系。上式中為回歸常數(shù),為回歸系數(shù)(即傾向值)。和可以用最小二乘法進行估汁。,其中,利用回歸系數(shù)與相關系數(shù)之間的關系,求出時間與變量之間的相關系數(shù):回歸系數(shù)的符號表示氣候變量的趨勢傾向。>0時,說明隨時間的增加呈上升趨勢;<0時,說明隨時間的增加呈下降趨勢。值的大小反映了上升或下降的速率,即表示上升或下降的傾向程度。相關系數(shù)表示與時間之間線性相關的密切程度。要判斷變化趨勢的程度是否顯著,就要對相關系數(shù)進行顯著性檢驗。確定顯著性水平,若,表明隨的變化趨勢是顯著的,否則表明變化趨勢是不顯著的。本文選取=0.05,=0.01和=0.001三個顯

12、著性水平進行檢驗,值越小,值越大,表明變化趨勢越顯著。(4)滑動檢驗滑動檢驗是通過考察兩組樣本平均值的差異是否顯著來檢驗突變。其基本思想是把一氣候序列中兩段子序列均值有無顯著差異的問題來檢驗。如果兩段子序列的均值差異超過了一定的顯著性水平,可以認為均值發(fā)生了質變,有突變發(fā)生。對于具有個樣本量的時間序列,人為設置某一時刻為基準點,基準點前后兩段子序列和的樣本分別為和,兩段子序列平均值分別為和,方差分別為和。定義統(tǒng)計量: 2.3其中 方程2.3遵從自由度的分布。給定顯著性水平,查分布表得到臨界值,若,則認為基準點前后的兩字序列均值無顯著差異,否則認為基準點時刻出現(xiàn)了突變。本文給定顯著性水平=0.0

13、5。(5)皮爾遜相關系數(shù)皮爾遜相關系數(shù)是描述兩個隨機變量線形相關的統(tǒng)計量,一般簡稱為相關系數(shù)或點相關系數(shù),用來表示。設有兩個變量 和 相關系數(shù)計算公式為相關系數(shù)的取值在-1.0+1.0之間,當0時,表明兩變量呈正相關,越接近于1.0,正相關越顯著;當0時,表明兩變量呈負相關,越接近于-1.0,負相關越顯著;當0,則表示兩變量相互獨立。計算出的相關系數(shù)是否顯著,需要經過顯著性檢驗。(6)功率譜功率譜分析是以傅立葉變換為基礎的頻域分析方法,其意義為將時間序列的總能量分解到不同頻率上的分量,根據(jù)不同頻率波的方差貢獻診斷出序列的主要周期,從而確定周期的主要頻率,既序列隱含的顯著周期。功率譜是應用極為廣

14、泛的一種分析周期的方法。根據(jù)譜密度與自相關函數(shù)互為傅立葉變換的重要性質,通過自相關函數(shù)間接做出連續(xù)功率譜估計。對一時間序列,最大滯后時間長度為的自相關系數(shù)(=0,1,2,)為 由下列得到不同波數(shù)的粗譜估計值: =0,1,2, 式中表示第個時間間隔上的相關函數(shù)。在實際計算中考慮端點特性,常用下列形式: 最大滯后長度的選取十分重要,一般取為為宜。這種方法得到的譜估計與真實譜存在一定誤差。因而對粗譜估計需要作平滑處理,以便得到連續(xù)性的譜值。常用漢寧平滑系數(shù) 來進行平滑。(7)Mann-Kendall方法Mann-Kendall法是一種非參數(shù)統(tǒng)計檢驗方法,非參數(shù)統(tǒng)計檢驗方法亦稱無分布檢驗,其優(yōu)點是不需

15、要樣本遵從一定的分布,也不受少數(shù)異常值的干擾,更適用于類型變量和順序變量,計算也比較簡便。對于具有n個樣本量的時間序列x,構造一秩序列:Sk=,k=2,3,n, 其中ri= j=1 ,2,i可見,秩序列Sk是第i時刻數(shù)值大于j時刻數(shù)值個數(shù)的累計數(shù)。在時間序列隨機獨立的假定下,定義統(tǒng)計量UFK=,k=1 ,2,n, 式中UF1=0,E(Sk),Var(Sk)是累計數(shù)Sk的均值和方差,在x1, x2, xn相互獨立,且有相同連續(xù)分布時,它們可由下式算出:UFi為標準正態(tài)分布,它是按時間系列x順序x1, x2, xn計算出的統(tǒng)計量序列,給定顯著性水平a,查正態(tài)分布表,若|UFi|>Ua,則表明序列存在明顯的趨勢變化。按時間序列x逆序xn,xn-1,x1,再重復上述過程,同時使UBK=UFK(k=n,n-1,1), UB1=0。這一方法的優(yōu)點在于不僅計算簡便,而且可以明確突變開始的時間

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內容里面會有圖紙預覽,若沒有圖紙預覽就沒有圖紙。
  • 4. 未經權益所有人同意不得將文件中的內容挪作商業(yè)或盈利用途。
  • 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內容的表現(xiàn)方式做保護處理,對用戶上傳分享的文檔內容本身不做任何修改或編輯,并不能對任何下載內容負責。
  • 6. 下載文件中如有侵權或不適當內容,請與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

評論

0/150

提交評論