工程水文學第三章水文統(tǒng)計_第1頁
工程水文學第三章水文統(tǒng)計_第2頁
工程水文學第三章水文統(tǒng)計_第3頁
工程水文學第三章水文統(tǒng)計_第4頁
工程水文學第三章水文統(tǒng)計_第5頁
已閱讀5頁,還剩60頁未讀, 繼續(xù)免費閱讀

下載本文檔

版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進行舉報或認領(lǐng)

文檔簡介

工程水文學第三章水文統(tǒng)計第一頁,共六十五頁,2022年,8月28日內(nèi)容:3.1水文統(tǒng)計的意義及基本概念3.2頻率和概率3.3經(jīng)驗頻率曲線3.4隨機變量的統(tǒng)計參數(shù)3.5理論頻率曲線3.6抽樣誤差3.7水文頻率分析方法3.8相關(guān)分析重點:水文頻率及水文相關(guān)分析等水文統(tǒng)計基本知識;水文頻率及水文相關(guān)分析等水文統(tǒng)計計算。難點:

水文頻率及水文相關(guān)分析等水文統(tǒng)計計算第二頁,共六十五頁,2022年,8月28日3.1水文統(tǒng)計的意義及基本概念3.1.1水文統(tǒng)計的意義水文現(xiàn)象具有必然性、偶然性(隨機性);利用概率論和數(shù)理統(tǒng)計的理論和方法,研究和分析水文的隨機現(xiàn)象(已經(jīng)觀測到的水文現(xiàn)象),找出水文現(xiàn)象的統(tǒng)計規(guī)律性;以此為基礎(chǔ),對水文現(xiàn)象未來可能的長期變化做出概率意義下的定量預(yù)估,以滿足工程規(guī)劃、設(shè)計、施工以及運營期間的需要。第三頁,共六十五頁,2022年,8月28日3.1.2事件隨機試驗:對隨機現(xiàn)象的觀測事件:隨機試驗的結(jié)果。包括:1)必然事件:在一定能夠的條件組合下,必然會發(fā)生的事情。2)不可能是件:在一定的條件組合下,一定不可能發(fā)生的事情。3)隨機事件:在一定的條件組合下,可能發(fā)生也可能不發(fā)生的事件。第四頁,共六十五頁,2022年,8月28日3.1.3總體、樣本、樣本容量隨機變量:受隨機因素影響,遵循統(tǒng)計規(guī)律的變量。通俗地講,指在隨機試驗中測量到的數(shù)量。對于水文現(xiàn)象而言,指某種水文特征值,如某地區(qū)流域出口的年徑流量和洪峰流量等。分:連續(xù)性隨機變量,如水位、流量;離散性隨機變量,如投擲硬幣的正反面。總體:隨機變量所能取值的全體,分有限和無限總體。樣本:從總體中隨機抽取出的一組觀測值。樣本容量:樣本中所含隨機變量的項數(shù)。第五頁,共六十五頁,2022年,8月28日有的現(xiàn)象無法得到總體,例如水文現(xiàn)象。水文統(tǒng)計:各種水文現(xiàn)象的調(diào)查和實測過程當作隨機試驗,把已觀測到的水文資料當作總體的一個隨機樣本(樣本應(yīng)足夠大,才能比較好的反應(yīng)總體的近似情況),利用數(shù)理統(tǒng)計的方法分析樣本的統(tǒng)計規(guī)律,考慮抽樣誤差.作為總體的規(guī)律,應(yīng)用到工程中去解決實際問題。第六頁,共六十五頁,2022年,8月28日3.1.4數(shù)理統(tǒng)計法對水文資料的要求檢查資料的可靠性;檢查資料的一致性;要求所使用的資料系列必須是同一類型或者在同一條件下產(chǎn)生的。如:暴雨洪水和雨雪洪水;瞬時水位和日平均水位。檢查資料的代表性;一般認為資料系列越長,平豐枯水段齊全,其代表性越高。檢查資料的隨機性;檢查資料的獨立性。第七頁,共六十五頁,2022年,8月28日3.2頻率和概率概率和頻率(1)頻率指在具體重復的實驗中,某隨機事件A出現(xiàn)的次數(shù)(頻數(shù))m與試驗總次數(shù)n的比值,即:第八頁,共六十五頁,2022年,8月28日(2)概率概率是指隨即事件在客觀上出現(xiàn)的可能性,即該事件的發(fā)生率,亦稱為機率。根據(jù)事件出現(xiàn)的可能性是能夠預(yù)先估計出來,可分為事先概率和事后概率:事先概率:試驗之前某隨機事件出現(xiàn)的可能性可以預(yù)先估計出來,如投硬幣出現(xiàn)正面和反面的機率;事后概率:隨機事件出現(xiàn)的可能性不能在試驗之前預(yù)先估計出來,必須通過大量的重復試驗之后才能估計出它出現(xiàn)的可能性。第九頁,共六十五頁,2022年,8月28日(3)頻率與概率的關(guān)系(表3.1)頻率是經(jīng)驗值,概率是經(jīng)驗值;可以通過實測樣本的頻率分析來推論事件總體概率特性;樣本容量越大,結(jié)果越準確;對于水文現(xiàn)象,只能采用有限的多年實測水文資料組成樣本系列,推求頻率作為概率的近似值。第十頁,共六十五頁,2022年,8月28日3.2.2概率運算定律(1)概率相加定理互斥事件:在一次試驗中,只有一個事件發(fā)生,其余事件均不能發(fā)生,這類事件稱為互斥事件;概率相加定理:互斥的各事件中,至少有一個發(fā)生的概率等于各個事件發(fā)生的概率總和。(2)概率相乘定理獨立事件:多個事件中,某一事件的出現(xiàn)并不影響其他事件的出現(xiàn)。概率相乘定理:幾個獨立事件一并出現(xiàn)的概率等于各事件出現(xiàn)概率之積。(3)條件概率第十一頁,共六十五頁,2022年,8月28日【例】某測站有40年的實測枯水位記錄,各種水位出現(xiàn)的頻率如表3.2所示,試確定水位H≥2.0m和H≥2.7m的概率?某站水位頻率計算表3.2

序號水位H(m)頻數(shù)f(a)頻率W(%)累積頻率P(%)123454.03.52.72.01.921016935254022.57.55307092.5100∑—40100—第十二頁,共六十五頁,2022年,8月28日3.2.3隨機變量的概率分布隨機變量與其概率一一對應(yīng),這種隨機變量與概率一一對應(yīng)的關(guān)系稱為隨機變量的概率分布規(guī)律簡稱概率分布隨機變量可分為兩類:離散型隨機變量和連續(xù)型隨機變量水文學關(guān)心隨機變量取值大于等于某一定值的概率,即P(X≥xi),而該概率是x的函數(shù)【例3.6】

離散型隨機變量及其概率分布Xx1x2……xi

……P(X=xi)p1p2……pi……第十三頁,共六十五頁,2022年,8月28日第十四頁,共六十五頁,2022年,8月28日F(X)=P(X≥x)

代表X大于某一取值x的概率,其幾何曲線稱為概率分布曲線;如果用實測資料點繪的,水文上稱為累積頻率曲線。第十五頁,共六十五頁,2022年,8月28日3.2.4累積頻率和重現(xiàn)期(1)累積頻率和隨機變量的關(guān)系水文特征值屬于連續(xù)性隨機變量在分析水文系列的概率分布時,不用單個的隨機變量(x=xi)的概率,而是用x≥xi(或者x≤xi

)的概率P(x≥xi

)(或者P(

x≤xi

))。累計頻率指等于或大于(等于或小于)某水文要素出現(xiàn)可能性的量度。一般在實際應(yīng)用中,用樣本的頻率分析曲線代替總體系列的概率分布。累積頻率第十六頁,共六十五頁,2022年,8月28日樣本足夠大時,可以繪出累積頻率曲線。在一個確定的隨機變量系列內(nèi),各個隨機變量對應(yīng)著一個累積頻率值,隨機變量的大小于累積頻率成反比。工程上一般把累積頻率為頻率。根據(jù)選用樣本的不同,頻率分為

年頻率和次頻率。第十七頁,共六十五頁,2022年,8月28日(2)重現(xiàn)期重現(xiàn)期:指等于及大于(或等于及小于)一定數(shù)量級的水文要素出現(xiàn)一次的平均間隔年數(shù),以該量級頻率的倒數(shù)。當洪峰流量、洪水位、暴雨時,使用的設(shè)計頻率P﹤50%,則

T=1/P當研究枯水流量、枯水位時,設(shè)計頻率P常采用大于50%的值,則

T=1/(1-P)(設(shè)計保證率)水文現(xiàn)象無固定的周期性。注意:累積頻率是指多年平均出現(xiàn)的機會;重現(xiàn)期則是平均若干年出現(xiàn)一次,而不是固定的周期。**年一遇

第十八頁,共六十五頁,2022年,8月28日3.2.5設(shè)計標準水文現(xiàn)象具有明顯的地區(qū)性和隨機性,因而無法用水文特征值出現(xiàn)的量值為工程設(shè)計的標準。主管部門根據(jù)工程的規(guī)模、工程在國民經(jīng)濟中的地位以及工程失事后果等因素,在各種工程設(shè)計規(guī)范中規(guī)定各種水文特征值的設(shè)計頻率(或重現(xiàn)期)作為工程設(shè)計標準。各地工程業(yè)務(wù)部門,根據(jù)當?shù)貙崪y的水文資料,通過水文分析計算,求出對應(yīng)于設(shè)計頻率的水文特征值,作為工程設(shè)計的依據(jù)。第十九頁,共六十五頁,2022年,8月28日3.3經(jīng)驗頻率曲線3.3.1經(jīng)驗頻率公式我國目前采用的數(shù)學期望公式為:當m=1時,P=1/(n+1)當T=100a,則

T=1/P=n+1=100m—xm在n項觀測資料中按遞減順序排列的序號,即在n次觀測試驗中大于或等于xm的次數(shù)第二十頁,共六十五頁,2022年,8月28日3.3.2經(jīng)驗頻率曲線的繪制和應(yīng)用如果有n年的水文資料。1)將按時間順序排列的實測資料按其數(shù)值大小進行遞減順序的排列。成x1,x2,…xn,對應(yīng)序號m為1,2,…,n2)利用公式分別計算對應(yīng)各個變量的經(jīng)驗頻率。3)以實測資料為變量

x作為縱坐標,以頻率P為橫坐標,在坐標紙上點繪經(jīng)驗頻率點距(Pi,xi),通過點群中心,目估繪制一條光滑的曲線,該曲線為經(jīng)驗頻率曲線。4)根據(jù)工程設(shè)計指定的頻率,在該曲線上查出設(shè)計所需的相應(yīng)設(shè)計頻率的水文數(shù)據(jù)。

將某水文變量f

按遞減順序排列,排列中的序號不僅表示排列大小的次序,而且也表示變量自大到小(大于或等于)的累積次數(shù)。3.3.3經(jīng)驗頻率曲線的外延第二十一頁,共六十五頁,2022年,8月28日概率格紙水平:正態(tài)曲線的概率分布制成分格制成的。非正態(tài)曲線:兩端曲線坡度變緩,有利于曲線外延第二十二頁,共六十五頁,2022年,8月28日3.4隨機變量的統(tǒng)計參數(shù)統(tǒng)計參數(shù)是反映隨機變量系列數(shù)值大小、變化幅度、對稱程度等情況的數(shù)量特征值,因而能反映水文現(xiàn)象基本的統(tǒng)計規(guī)律,概括水文現(xiàn)象的基本特征和分布特點,也是進行理論頻率曲線估計的基礎(chǔ)。統(tǒng)計參數(shù)有總體統(tǒng)計參數(shù)和樣本統(tǒng)計參數(shù)。在水文學中主要應(yīng)用樣本統(tǒng)計參數(shù),來估計總體統(tǒng)計參數(shù)。水文頻率分析主要使用的統(tǒng)計參數(shù)包括

均值變差系數(shù)偏態(tài)系數(shù)矩第二十三頁,共六十五頁,2022年,8月28日

3.4.1均值均值是反映隨機變量系列平均情況的數(shù)。加權(quán)平均法算術(shù)平均法若實測系列內(nèi)各隨機變量很少重復出現(xiàn),可以不考慮出現(xiàn)次數(shù)的影響,用算術(shù)平均法求均值。

對于水文系列,一年內(nèi)只選一個樣或者幾個樣,水文特征值重復出現(xiàn)的機會很少,一般使用算術(shù)平均值,若系列內(nèi)出現(xiàn)了相同的水文特征值,將相同值排在一起,各占一個序號。

推求的是累積頻率第二十四頁,共六十五頁,2022年,8月28日均值特性平均數(shù)反映了隨機變量的平均水平,代表整個隨機變量系列的水平高低,故又稱數(shù)學期望。利用均值可以推求設(shè)計頻率的水文特征值。利用均值表示各種水文特征值的空間分布情況,繪制成各種等值線圖。模比系數(shù)

第二十五頁,共六十五頁,2022年,8月28日3.4.2均方差和變差系數(shù)

要反映整個系列的變化幅度,或者系列在均值兩側(cè)分布的離散程度,需要使用均方差和變差系數(shù)。(1)均方差為了避免一階離差代數(shù)和為0,一般取的平均值的開方作為離散程度的計量標準,稱為均方差。即:對于樣本系列有下列修正公式:

第二十六頁,共六十五頁,2022年,8月28日

均方差表征的意義:表示分布函數(shù)的絕對離散程度。均方差越大,系列在均值兩旁分布越分散,其值變化幅度越大;反之,依然?!纠?/p>

甲系列:48,49,50,51,52其均值=50;56均值51

乙系列:10,30,50,70,90其均值=50;80均值55

經(jīng)計算后甲系列的均方差s甲=1.58,s乙=31.4。甲系列離散程度小,乙系列離散程度大。例:平均值相同,均方差不同進行比較。均方差小的均值代表性好,均方差大的系列均值代表性差第二十七頁,共六十五頁,2022年,8月28日(2)變差系數(shù)均方差不僅受到系列分布的影響,也與系列的水平有關(guān)。

變差系數(shù)又稱離差系數(shù)或者離勢系數(shù),是一個系列的均方差與其均值的比值

用模比系數(shù)帶入上式有:【例】同上一例,計算得Cv甲=0.005,Cv乙=0.33,甲系列在均值兩旁要集中,離散程度小【例】見教材p50例3.8【思考】一條河流上、下游斷面的年平均流量的Cv值哪個大?為什么?

第二十八頁,共六十五頁,2022年,8月28日3.4.3偏態(tài)系數(shù)偏態(tài)系數(shù):對系列在均值兩旁的對稱情況的反映。表達式(對于樣本系列):當Cs=0時,系列在均值兩旁對稱分布;當Cs>0屬正偏分布;當Cs<0屬負偏分布;

第二十九頁,共六十五頁,2022年,8月28日一般認為沒有上百年的資料,無法獲得比較合理的Cs值。因此一般在實際計算中往往按照Cs和Cv的經(jīng)驗關(guān)系確定。設(shè)計暴雨量:Cs=3.5Cv設(shè)計最大流量:Cv<0.5Cs=(3~4)Cv

Cv>0.5Cs=(2~3)Cv年徑流及年降水:Cs=2Cv第三十頁,共六十五頁,2022年,8月28日3.5理論頻率曲線經(jīng)驗頻率曲線的缺點:由于實測系列的項數(shù)較小,所繪經(jīng)驗頻率曲線往往不能滿足推求稀遇頻率特征值的要求目估定線或外延會產(chǎn)生較大的誤差。需要借助某些數(shù)字形式的頻率曲線作為定線和外延的依據(jù)。通常在實測資料中選取或者算的2~3個有代表性的特征值作參數(shù),并據(jù)此選配一些數(shù)學方程作為總體系列頻率密度曲線的假想數(shù)學模型,在按一定的方法確定累積頻率曲線。這種用數(shù)學形式確定的、符合經(jīng)驗點據(jù)分布規(guī)律的的曲線稱為理論頻率曲線【外延和內(nèi)插的工具】

我國水文分析常用到的理論頻率曲線有:皮爾遜Ⅲ型曲線;特殊情況下也可以用指數(shù)Γ分布曲線,對數(shù)Γ分布曲線,極值分布曲線,對數(shù)正態(tài)分布和威布爾分布曲線。第三十一頁,共六十五頁,2022年,8月28日理論頻率曲線—皮爾遜Ⅲ型曲線英國生物學家皮爾遜研究各種非正態(tài)的分布函數(shù)曲線形式,提出了13種分布曲線類型,其中第III型被引入水文學中,并被我國采納。(1)皮爾遜Ⅲ型曲線是一條一端有限、一端無限的不對稱單峰正偏曲線,數(shù)學上常稱伽瑪分布。

第三十二頁,共六十五頁,2022年,8月28日曲線特點:只有一個眾數(shù)曲線的兩端或一端以橫軸為漸近線由此建立微分方程式求解得:Γ(α)―α的伽瑪函數(shù)、、a0分別為形狀參數(shù)、尺度參數(shù)和位置參數(shù)。α﹥0,β﹥0。第三十三頁,共六十五頁,2022年,8月28日、、a0一經(jīng)確定,PIII型密度函數(shù)隨之確定。可以證明,三參數(shù)與均值、Cv、Cs有如下關(guān)系:皮爾遜Ⅲ型頻率曲線的密度函數(shù)可表示為以、Cv、Cs為參數(shù)的函數(shù)

y=f(,Cv,Cs,x)第三十四頁,共六十五頁,2022年,8月28日(2)皮爾遜Ⅲ型頻率曲線及其繪制水文計算中,一般需要求出指定頻率P所相應(yīng)的隨機變量取值xp,也就是通過對密度曲線進行積分,即:

求出等于及大于xp的累積頻率P值。直接由上式計算P值非常麻煩,實際做法是通過變量轉(zhuǎn)換,變換成下面的積分形式

離均系數(shù)第三十五頁,共六十五頁,2022年,8月28日被積函數(shù)只含一個參數(shù)Cs。只要給定Cs就可以算出ФP和p的對應(yīng)值,最終制定出ФP~Cs~p的對應(yīng)數(shù)值表。(教材附錄3)如何來繪制在頻率計算中,現(xiàn)由已知的Cs查Ф值表得出不同頻率下P的離均系數(shù)ФP,然后將ФP及已知的x,Cv帶入下式,即可求得對應(yīng)于頻率P的水文特征值xp。由不同的P及相應(yīng)的xp,可繪制出一條與參數(shù)相應(yīng)的理論頻率曲線第三十六頁,共六十五頁,2022年,8月28日理論頻率曲線繪制的步驟如下:1)由實測的資料,統(tǒng)計并計算x,Cv2)確定Cs3)由Cs查表,得不同的P的離均系數(shù)ФP值。4)求出Kp5)由xp=Kpx,求不同P的xp,在海森概率格紙上,以P為橫坐標,xp為縱坐標,點繪理論點據(jù)(P,xp),根據(jù)理論點據(jù)分布趨勢,目估并繪制一條光滑曲線【例3.9】見教材p56。第三十七頁,共六十五頁,2022年,8月28日均值對頻率曲線的影響當皮爾遜Ⅲ型頻率曲的兩個參數(shù)Cv和Cs不變時,由于均值的不同,可以使頻率曲線發(fā)生很大的變化。(4)統(tǒng)計參數(shù)對頻率曲線的影響a.Cv、Cs相同時,均值大的曲線位于均值小的曲線之上;(與均值成正比關(guān)系)b.均值大的曲線較均值小的曲線陡。c.均值不同的理論頻率曲線無交點第三十八頁,共六十五頁,2022年,8月28日為了消除均值的影響,以模比系數(shù)K為變量繪制頻率曲線,如圖所示。圖中cs=1.0,cv=0時,隨機變量的取值都等于均值,此時頻率曲線即為k=1的一條水平線,隨著cv的增大,頻率曲線的偏離程度也隨之增大,曲線顯得越來越陡。不同Cv的曲線在Kp=1的位置處有交點變差系數(shù)對頻率曲線的影響第三十九頁,共六十五頁,2022年,8月28日偏態(tài)系數(shù)對頻率曲線的影響正偏情況下,Cv相同時,Cs愈大,均值(即圖中k=1)對應(yīng)的頻率愈小,頻率曲線的中部愈向左偏,且上段愈陡,下段愈平緩。第四十頁,共六十五頁,2022年,8月28日3.6抽樣誤差用一個樣本的統(tǒng)計參數(shù)來代替總體的統(tǒng)計參數(shù)是存在一定誤差的,這種誤差是由于從總體中隨機抽取的樣本與總體有差異而引起的,與計算誤差不同,稱為抽樣誤差。抽樣誤差的大小由均方誤差來衡量。計算均方誤差的公式與總體分布有關(guān)。[公式見教材p61公式3.31]抽樣誤差的大小,隨樣本項數(shù)n、Cv和Cs的大小而變化。樣本容量大,對總體的代表性就好,其抽樣誤差就小,這就是為什么在水文計算中總是想方設(shè)法取得較長的水文系列的原因。

第四十一頁,共六十五頁,2022年,8月28日3.7水文頻率分析方法水文頻率計算的目的是選配一條與經(jīng)驗點配合較好的理論頻率曲線,確定合適的參數(shù)作為總體參數(shù)的估計值,以推求設(shè)計頻率的水文特征值,作為工程規(guī)劃設(shè)計的依據(jù)。適線法先在機率格紙上按經(jīng)驗頻率公式點繪出水文系列的經(jīng)驗頻率點,選定頻率曲線線型,取與經(jīng)驗點據(jù)擬合最佳的那條曲線和相應(yīng)的參數(shù),作為最終的計算結(jié)果。確定最佳擬合頻率曲線,可使用不同的準則,因而有不同的方法和結(jié)果。目前常用到的適線法有兩種,包括經(jīng)驗適線法和優(yōu)化適線法。第四十二頁,共六十五頁,2022年,8月28日(1)經(jīng)驗適線法(目估適線法)根據(jù)實測資料和經(jīng)驗頻率數(shù)學期望公式可以繪出一條經(jīng)驗頻率曲線,由皮爾遜Ⅲ型頻率密度曲線積分,可以繪出一條理論頻率曲線。由于統(tǒng)計參數(shù)有誤差,兩者不一定配合得好,必須通過試算來確定合適的統(tǒng)計參數(shù).這種方法也叫試錯適線法。本法是以經(jīng)驗頻率點據(jù)為基礎(chǔ),給它們選配一條符合較好的理論頻率曲線,并以此來估計水文要素總體的統(tǒng)計規(guī)律。第四十三頁,共六十五頁,2022年,8月28日具體步驟如下:(1)將審核過的實測資料由大到小排列,計算各項的經(jīng)驗頻率,在頻率格紙上點繪經(jīng)驗點據(jù)(縱坐標為變量的取值,橫坐標為對應(yīng)的經(jīng)驗頻率);(2)計算均值、變差系數(shù),假定偏態(tài)系數(shù);(3)確定線型(一般選用皮爾遜Ⅲ型);(4)根據(jù)擬定的統(tǒng)計參數(shù)查表計算理論頻率曲線縱坐標,繪理論頻率曲線;(5)將此線畫在繪有經(jīng)驗點據(jù)的圖上,看與經(jīng)驗點據(jù)配合的情況。若不理想,可通過調(diào)整統(tǒng)計參數(shù)重新點繪頻率曲線。(6)最后根據(jù)頻率曲線與經(jīng)驗點據(jù)的配合情況,從中選出一條與經(jīng)驗點據(jù)配合較好的曲線作為采用曲線,相應(yīng)于該曲線的參數(shù)便看作是總體參數(shù)的估值。

第四十四頁,共六十五頁,2022年,8月28日【例】某站共有實測降水量資料24年,求頻率為10%和90%的年降水量。計算步驟為:1.將原始資按大小次序排列,列入表(4)欄。2.計算經(jīng)驗頻率Pm

=m/(n+1)列入表(5)欄,并與xm

對應(yīng)點繪于概率格紙上?;脽羝?63.計算出多年的平均值為666.4mm,Cv=0.234.選定CV=0.25,假定CS=0.50。查表得φP,求得

xP=x(φPCV+1)幻燈片46

根據(jù)表中(1)、(3)兩欄的對應(yīng)數(shù)值點繪曲線,發(fā)現(xiàn)曲線頭部和尾部都偏于經(jīng)驗頻率點據(jù)之下。第四十五頁,共六十五頁,2022年,8月28日第四十六頁,共六十五頁,2022年,8月28日第四十七頁,共六十五頁,2022年,8月28日

5.改變參數(shù),選定CV=0.30,CS=0.75,查表計算出各xP值。繪制頻率曲線,該線與經(jīng)驗點據(jù)配合較好,取為最后采用的頻率曲線。第四十八頁,共六十五頁,2022年,8月28日第四十九頁,共六十五頁,2022年,8月28日3.8相關(guān)分析3.8.1概述(1)相關(guān)分析的意義和應(yīng)用自然界中有許多現(xiàn)象之間是有一定聯(lián)系的。按數(shù)理統(tǒng)計法建立上述兩個或多個隨機變量之間的聯(lián)系,稱之為近似關(guān)系或相關(guān)關(guān)系。把對這種關(guān)系的分析和建立稱為相關(guān)分析。

相關(guān)分析可以用來延長和插補短系列。

第五十頁,共六十五頁,2022年,8月28日(2)相關(guān)的種類根據(jù)變量之間相互關(guān)系的密切程度,變量之間的關(guān)系有三種情況:即完全相關(guān)、零相關(guān)、統(tǒng)計相關(guān)。兩變量x與y之間,如果每給定一個x值,就有一個完全確定的y值與之對應(yīng),則這兩個變量之間的關(guān)系就是完全相關(guān)。兩變量之間毫無聯(lián)系,或某一現(xiàn)象(變量)的變化不影響另一現(xiàn)象(變量)的變化,這種關(guān)系則稱為零相關(guān)。第五十一頁,共六十五頁,2022年,8月28日若兩個變量之間的關(guān)系界于完全相關(guān)和零相關(guān)之間,則稱為統(tǒng)計相關(guān)。當只研究兩個變量的相關(guān)關(guān)系時,稱為簡單相關(guān);當研究3個或3個以上變量的相關(guān)關(guān)系時,則稱為復相關(guān)。在相關(guān)的形式上,又可分為直線相關(guān)和非直線相關(guān)。

第五十二頁,共六十五頁,2022年,8月28日(3)相關(guān)分析的內(nèi)容相關(guān)分析(或回歸分析)的內(nèi)容一般包括三個方面:判定變量間是否存在相關(guān)關(guān)系,若存在,計算其相關(guān)系數(shù),以判斷相關(guān)的密切程度;確定變量間的數(shù)量關(guān)系――回歸方程或相關(guān)線;根據(jù)自變量的值,預(yù)報或延長、插補倚變量的值,并對該估值進行誤差分析。第五十三頁,共六十五頁,2022年,8月28日3.8.2簡單直線相關(guān)(1)相關(guān)圖解法

設(shè)xi

和yi

代表兩系列的觀測值,共有n對,把對應(yīng)值點繪于方格紙上,得到很多相關(guān)點。如果相關(guān)點的平均趨勢近似直線,即可通過點群中間及、點繪出相關(guān)直線,第五十四頁,共六十五頁,2022年,8月28日(2)相關(guān)分析法直線回歸方程為避免相關(guān)圖解法在定線上的任意性,常采用相關(guān)計算法來確定相關(guān)線的方程,即回歸方程。簡直線相關(guān)方程的形式為:

y=a+bx

式中x

―自變量;

y

―倚變量;

a、b―待定常數(shù)。第五十五頁,共六十五頁,2022年,8月28日待定常數(shù)a、b由觀測點與直線擬合最佳,通過最小二乘進行估計。最后得到如下形式的回歸方程:

此式稱為y倚x的回歸方程,它的圖形稱為y倚x的回歸線,如前圖(a)線所示。若以y求x,則要應(yīng)用x倚y的回歸方程,如前圖(b)線所示,方程為將上式中x,y對調(diào)。一般y倚x與x倚y的兩回歸線并不重合,但有一個公共交點。第五十六頁,共六十五頁,2022年,8月28日相關(guān)系數(shù)與回歸系數(shù)1)相關(guān)系數(shù):反映兩個變量之間關(guān)系的密切程度。相關(guān)系數(shù)越接近于1,兩變量間關(guān)系越密切。第五十七頁,共六十五頁,2022年,8月28日2)回歸系數(shù):回歸直線的斜率在回歸方程中稱為回歸系數(shù)。兩個系列的均方差為經(jīng)整理有:直線回歸方程可以寫成:第五十八頁,共六十五頁,2022年,8月28日相關(guān)分析的誤差1)回歸線的誤差回歸線僅是

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負責。
  • 6. 下載文件中如有侵權(quán)或不適當內(nèi)容,請與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

評論

0/150

提交評論