版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請(qǐng)進(jìn)行舉報(bào)或認(rèn)領(lǐng)
文檔簡(jiǎn)介
第二章水文統(tǒng)計(jì)基本原理與方法第1頁,共135頁,2023年,2月20日,星期三
第一節(jié)水文統(tǒng)計(jì)的意義及基本概念一、水文統(tǒng)計(jì)的意義水文現(xiàn)象必然性隨機(jī)性成因分析法數(shù)理統(tǒng)計(jì)法分析方法分析方法第2頁,共135頁,2023年,2月20日,星期三水文統(tǒng)計(jì)的任務(wù):1、對(duì)于水文要素的大量觀測(cè)資料進(jìn)行統(tǒng)計(jì)分析,尋求其變化的規(guī)律;2、在此基礎(chǔ)上,進(jìn)一步預(yù)估出河流未來長(zhǎng)時(shí)期內(nèi)可能發(fā)生的水文情勢(shì),以滿足工程規(guī)劃、設(shè)計(jì)、施工以及運(yùn)營期間的需要。第3頁,共135頁,2023年,2月20日,星期三設(shè)計(jì)時(shí),對(duì)給定的概率P(即設(shè)計(jì)標(biāo)準(zhǔn),也稱為頻率),選擇滿足關(guān)系P(X≥xp)=P=F(xp)xp作為設(shè)計(jì)依據(jù)。F(x)為水文變量的累積概率函數(shù)(即統(tǒng)計(jì)規(guī)律),P稱為設(shè)計(jì)頻率,xp稱為設(shè)計(jì)值。第4頁,共135頁,2023年,2月20日,星期三
二、事件在概率論中,對(duì)隨機(jī)現(xiàn)象的觀測(cè)叫作隨機(jī)試驗(yàn),隨機(jī)試驗(yàn)的結(jié)果稱為事件,在水文統(tǒng)計(jì)中是表示水文現(xiàn)象。事件有兩種屬性:(1)數(shù)量性質(zhì):直接測(cè)量的量或計(jì)算的量。例如年降雨量、年徑流量、河流某斷面處最大洪峰流量等。(2)屬性性質(zhì):直接觀測(cè)到的現(xiàn)象。例如風(fēng)、雨、晴等。第5頁,共135頁,2023年,2月20日,星期三
分類(1)必然事件:在每次試驗(yàn)中一定會(huì)出現(xiàn)的事件稱為必然事件。例如,流域上降雨且產(chǎn)流的條件下,河中水位上升是必然事件。(2)不可能事件:在任何一次試驗(yàn)中都不會(huì)出現(xiàn)的事件稱為不可能事件。例如天然河流在洪水期間,發(fā)生斷流是不可能事件。(3)隨機(jī)事件:在一次隨機(jī)試驗(yàn)中可能出現(xiàn)也可能不出現(xiàn)的事件稱為隨機(jī)事件。例如河流某斷面處出現(xiàn)的年最大洪峰流量可能大于某一數(shù)值,也可能小于或等于某一數(shù)值,事先不能確定,屬于隨機(jī)事件。第6頁,共135頁,2023年,2月20日,星期三三、總體、樣本、樣本容量1、隨機(jī)變量用以表示隨機(jī)試驗(yàn)結(jié)果的一個(gè)數(shù)量(事先是未知的),由于它事先不能確定,是隨機(jī)的,稱為隨機(jī)變量。比如在工地上檢驗(yàn)一批鋼筋,可以隨機(jī)抽查幾組試件,每一組試件檢驗(yàn)不合格的根數(shù)就是隨機(jī)變量。水文現(xiàn)象中的隨機(jī)變量,一般指某個(gè)水文特征值(如年徑流量、年降雨量、洪峰流量等)。第7頁,共135頁,2023年,2月20日,星期三隨機(jī)變量的分類:①離散型隨機(jī)變量隨機(jī)變量?jī)H取得區(qū)間內(nèi)某些間斷的離散值,則稱為離散型隨機(jī)變量。如洪峰次數(shù),只能取0、1、2
,不能取相鄰兩數(shù)值之間的任何值。②連續(xù)型隨機(jī)變量隨機(jī)變量可以取得一個(gè)有限區(qū)間內(nèi)的任何數(shù)值,則稱為連續(xù)型隨機(jī)變量。如某河流斷面的流量可以取0~極限值之間的任何實(shí)數(shù)值。第8頁,共135頁,2023年,2月20日,星期三2、總體、樣本和樣本容量總體在統(tǒng)計(jì)數(shù)學(xué)中,把某種隨機(jī)變量所取數(shù)值的全體,稱為總體。如年徑流量的總體數(shù)是無窮的。樣本從總體中不帶主觀成分任意抽取的一部分,稱為樣本。樣本所包含的項(xiàng)數(shù),稱為樣本容量。如實(shí)測(cè)的水文資料是有限的,是一樣本。第9頁,共135頁,2023年,2月20日,星期三四、數(shù)理統(tǒng)計(jì)法對(duì)水文資料的要求1、可靠性2、一致性3、代表性4、隨機(jī)性5、獨(dú)立性第10頁,共135頁,2023年,2月20日,星期三第二節(jié)頻率和概率一、概率和頻率1、概率隨機(jī)事件在試驗(yàn)中可能出現(xiàn),也可能不出現(xiàn),但其出現(xiàn)(或不出現(xiàn))的可能性大小有所不同,為了比較這種可能性的大小,必須賦予一種數(shù)量標(biāo)準(zhǔn),這個(gè)標(biāo)準(zhǔn)就是事件的概率。第11頁,共135頁,2023年,2月20日,星期三簡(jiǎn)單(古典)的隨機(jī)事件的概率定義用下式表示:式中,P(A):一定條件下隨機(jī)事件A的概率;
n:試驗(yàn)中所有可能的出現(xiàn)的結(jié)果數(shù);
m:出現(xiàn)隨機(jī)事件A的結(jié)果數(shù)。
古典的隨機(jī)試驗(yàn)是指所有試驗(yàn)的可能結(jié)果都是等可能的,而且試驗(yàn)的可能結(jié)果的總數(shù)是有限的。但水文事件不一定符合這種性質(zhì),也就不能用上述計(jì)算概率的公式。為此,水文學(xué)中通常用頻率估算事件的概率。
第12頁,共135頁,2023年,2月20日,星期三2、頻率
對(duì)于不是古典概型事件,只能通過多次重復(fù)試驗(yàn)來估計(jì)事件的概率。設(shè)事件A在n次隨機(jī)試驗(yàn)中出現(xiàn)了m
次,則稱:為事件A在n次試驗(yàn)中出現(xiàn)的頻率。注意:n不是所有可能的結(jié)果總數(shù),僅是隨機(jī)試驗(yàn)的次數(shù)。第13頁,共135頁,2023年,2月20日,星期三3、概率和頻率的關(guān)系:頻率是經(jīng)驗(yàn)值,概率是理論值;可以通過實(shí)測(cè)樣本的頻率分析來推論事件總體概率特性;樣本容量越大,結(jié)果越準(zhǔn)確;對(duì)于水文現(xiàn)象,只能采用有限的多年實(shí)測(cè)水文資料組成樣本系列,推求頻率作為概率的近似值。第14頁,共135頁,2023年,2月20日,星期三二、隨機(jī)變量的概率分布1、對(duì)于離散型隨機(jī)變量隨機(jī)變量的取某一可能值的機(jī)會(huì)有的大有的小,即隨機(jī)變量取值都有一定的概率與之相對(duì)應(yīng),可表示為:
上式中P1、P2、…Pn
表示隨機(jī)變量X取值x1、x2、…xn
所對(duì)應(yīng)的概率。第15頁,共135頁,2023年,2月20日,星期三
一般將這種對(duì)應(yīng)關(guān)系稱作隨機(jī)變量的概率分布規(guī)律,簡(jiǎn)稱為分布律??梢杂靡韵碌姆植紙D形表示:
x1x2x3x4……xnXP
離散型隨機(jī)變量概率分布圖第16頁,共135頁,2023年,2月20日,星期三2、對(duì)于連續(xù)型隨機(jī)變量
由于它的所有可能取值有無限個(gè),而取個(gè)別值的概率為零,故無法研究個(gè)別值的概率。水文學(xué)上習(xí)慣研究隨機(jī)變量的取值等于或大于某個(gè)值的概率,表示為:P(X≥x)。
它是x的函數(shù),稱作隨機(jī)變量X的分布函數(shù),記作F(x),即
F(x)=P(X≥x)
表示隨機(jī)變量X大于或等于值x的概率,其幾何曲線稱作隨機(jī)變量的概率分布曲線(水文學(xué)上通常稱累計(jì)頻率曲線,簡(jiǎn)稱頻率曲線)。第17頁,共135頁,2023年,2月20日,星期三00.20.40.60.81.0500900年降雨量(mm)某站年雨量概率分布曲線
P(Xx)
由圖中可知,x=900,相應(yīng)的P(X≥
x)=0.15,說明大于900mm降雨的可能性為15%;同理,大于500mm降雨的可能性為60%。第18頁,共135頁,2023年,2月20日,星期三由概率的加法定理:隨機(jī)變量X落在(x
,x+x)的概率可用下式表示:
x
x+
x
PXP(Xx)P(X>x+x)
P(Xx)=P(X>x+x)+P(x+x>Xx)
P(x+x>Xx)=P(Xx)-P(X>x+x)=F(x)-F(x+x)則,降雨量落在900和500mm的可能性為:
60%-15%=45%
第19頁,共135頁,2023年,2月20日,星期三三、累積頻率和重現(xiàn)期1、累積頻率等量或超量值的累積頻數(shù)m與總觀測(cè)次數(shù)S之比,以P(x≥xi)表示。例:某橋位處測(cè)得40年最高水位資料,如表,求水位H≥25m的累積頻率。第20頁,共135頁,2023年,2月20日,星期三解:當(dāng)水位H=25m時(shí),W=25%
P=25+5=30%
表明:若水位為25m時(shí)對(duì)橋梁會(huì)有威脅,則高于25m的水位對(duì)橋梁都會(huì)有威脅,其發(fā)生的可能性應(yīng)為P=30%。
工程上習(xí)慣把累積頻率簡(jiǎn)稱為頻率。第21頁,共135頁,2023年,2月20日,星期三2、重現(xiàn)期
所謂的重現(xiàn)期是指某一隨機(jī)事件在很長(zhǎng)時(shí)期內(nèi)平均多長(zhǎng)時(shí)間出現(xiàn)一次(水文學(xué)中常稱為“多少年一遇”)。即在許多試驗(yàn)中,某一隨機(jī)事件重復(fù)出現(xiàn)的時(shí)間間隔的平均數(shù),即平均的重現(xiàn)間隔期。在水文分析中,重現(xiàn)期可以等效的替代頻率。第22頁,共135頁,2023年,2月20日,星期三頻率P與重現(xiàn)期T關(guān)系的兩種表示法:式中,T:重現(xiàn)期,以年計(jì);
P:大于某水文變量xP事件的頻率。例如,當(dāng)設(shè)計(jì)洪水的頻率為P=1%時(shí),代入上式得T=100年,稱為百年一遇洪水,表示大于等于這樣的洪水平均一百年會(huì)遇到一次。
(1)當(dāng)研究洪水或暴雨問題時(shí)水文上關(guān)心的是大于某洪水或某暴雨量發(fā)生的頻率,因此,重現(xiàn)期指在很長(zhǎng)時(shí)期N年內(nèi),出現(xiàn)大于某水文變量xP
事件的平均重現(xiàn)的間隔期T:第23頁,共135頁,2023年,2月20日,星期三(2)當(dāng)研究枯水問題
水文上關(guān)心的是小于xP的事件出現(xiàn)的頻率及相應(yīng)的重現(xiàn)期。重現(xiàn)期指在很長(zhǎng)的時(shí)期內(nèi)(N年)出現(xiàn)小于某水文變量xP事件的平均重現(xiàn)間隔期。若水文變量大于xP的頻率為P,則小于xP事件的頻率應(yīng)為1-P,在N年內(nèi)小于xP事件出現(xiàn)的次數(shù)應(yīng)為N(1-P),因此其重現(xiàn)期為:
第24頁,共135頁,2023年,2月20日,星期三例如,當(dāng)設(shè)計(jì)枯水流量的頻率P=80%時(shí),代入上式得T=5年,稱此為五年一遇的枯水流量,表示小于等于這樣的流量平均五年遇到一次。第25頁,共135頁,2023年,2月20日,星期三例:已知某水廠取水口流量Q≥800m3/s的頻率為96%,求Q<800m3/s設(shè)計(jì)枯水流量的重現(xiàn)期。由P(Q≥800)=96%,得P(Q<800)=1-96%=4%由重現(xiàn)期的定義,T(Q<800)=25即重現(xiàn)期為25年一遇。第26頁,共135頁,2023年,2月20日,星期三思考:重現(xiàn)期和物理學(xué)中的周期有何區(qū)別?
重現(xiàn)期T是指水文現(xiàn)象在長(zhǎng)時(shí)期內(nèi)平均T年出現(xiàn)一次,而不是每隔T年必然發(fā)生一次,它是對(duì)于類似于洪水這樣的隨機(jī)事件發(fā)生的可能性的一種定量描述。例如百年一遇的洪水,是指大于或等于這樣的洪水在長(zhǎng)時(shí)期內(nèi)平均100年發(fā)生一次,而不能理解為百年一遇的洪水每隔100年一定出現(xiàn)一次。實(shí)際上,百年一遇洪水可能間隔100年以上時(shí)間發(fā)生,也可能連續(xù)兩年接連發(fā)生。周期是固定多少時(shí)間出現(xiàn)一次,即為固定概念。而重現(xiàn)期為平均概念。第27頁,共135頁,2023年,2月20日,星期三四、設(shè)計(jì)標(biāo)準(zhǔn)指國家根據(jù)工程的重要性及建筑物的等級(jí)制定的允許破壞率及要求的安全率,以符號(hào)P表示。第28頁,共135頁,2023年,2月20日,星期三第三節(jié)經(jīng)驗(yàn)頻率曲線
一、經(jīng)驗(yàn)頻率公式例:已知某地年降雨量的觀測(cè)資料(n=12),并由大到小排列,按計(jì)算頻率。式中,P:大于或等于某一變量值x的經(jīng)驗(yàn)累積頻率;
m:x由大到小排列的序號(hào),即在n次觀測(cè)資料中出現(xiàn)大于或等于某一數(shù)值x的次數(shù)。第29頁,共135頁,2023年,2月20日,星期三經(jīng)驗(yàn)累積頻率計(jì)算表:第30頁,共135頁,2023年,2月20日,星期三
如果n項(xiàng)實(shí)測(cè)資料是總體,則上述計(jì)算經(jīng)驗(yàn)頻率公式是合理的;但水文實(shí)測(cè)資料是樣本資料,則計(jì)算的經(jīng)驗(yàn)頻率就不太合理,比如當(dāng)i=n時(shí),其頻率P=100%,即是說樣本的末項(xiàng)就是總體中的最小值,顯然不符合實(shí)際情況,因?yàn)殡S著觀測(cè)項(xiàng)數(shù)的增加,總會(huì)有更小的數(shù)值出現(xiàn)。
第31頁,共135頁,2023年,2月20日,星期三
為了修正由樣本推算總體出現(xiàn)的不合理估算,有如下幾個(gè)經(jīng)驗(yàn)頻率公式可供選擇:數(shù)學(xué)期望公式
切哥達(dá)也夫公式
海森公式
第32頁,共135頁,2023年,2月20日,星期三目前我國水文計(jì)算上廣泛采用的是數(shù)學(xué)期望公式,公式形式簡(jiǎn)單,計(jì)算結(jié)果也比較符合實(shí)際,且偏于安全。這樣,當(dāng)m=n=12
時(shí),第33頁,共135頁,2023年,2月20日,星期三二、經(jīng)驗(yàn)頻率曲線的繪制和應(yīng)用①將水文變量,按由大到小的次序排列xi,排列的序號(hào)不僅表示大小的次序,而且表示大于等于該水文變量的累積次數(shù);②用數(shù)學(xué)期望公式計(jì)算各項(xiàng)的經(jīng)驗(yàn)頻率Pi;③以水文變量為縱坐標(biāo),以其對(duì)應(yīng)的經(jīng)驗(yàn)頻率為橫坐標(biāo),點(diǎn)繪出經(jīng)驗(yàn)頻率點(diǎn)據(jù)。
第34頁,共135頁,2023年,2月20日,星期三④根據(jù)與點(diǎn)群配合最好的原則繪出一條平滑曲線,即為水文變量的經(jīng)驗(yàn)頻率曲線。在頻率格紙上繪制頻率曲線,如為正態(tài)曲線則成直線,如為偏態(tài)曲線則兩端的曲度也會(huì)大大變小,有利于特小頻率或特大頻率的點(diǎn)繪與查取。⑤有了經(jīng)驗(yàn)頻率曲線,即可在曲線上求得指定頻率的水文變量值。第35頁,共135頁,2023年,2月20日,星期三第36頁,共135頁,2023年,2月20日,星期三因頻率曲線的兩端特別陡峭,又因圖幅的限制,對(duì)于特小頻率或特大頻率,尤其是特大頻率的點(diǎn)子很難點(diǎn)在圖上。為此,設(shè)計(jì)一種“頻率格紙”,其橫坐標(biāo)的分劃就是按把標(biāo)準(zhǔn)正態(tài)分布頻率曲線拉成一條直線的原理計(jì)算出來的。這種頻率格紙的縱坐標(biāo)仍是普通分格,但橫坐標(biāo)的分格是不相等的,中間分格較密,越往兩端分格越稀,其間距在P=50%的兩端是對(duì)稱的。第37頁,共135頁,2023年,2月20日,星期三
經(jīng)驗(yàn)頻率曲線的特點(diǎn)
①當(dāng)n→∞時(shí),經(jīng)驗(yàn)頻率曲線將越來越光滑,且接近于理論頻率曲線,對(duì)于水文變量分布線型的選擇具有借鑒作用;②經(jīng)驗(yàn)頻率曲線計(jì)算工作量小,繪制簡(jiǎn)單,查用方便;③經(jīng)驗(yàn)頻率曲線外延比較盲目,誤差較大,往往難以滿足設(shè)計(jì)上的需要。因?yàn)樵谒挠?jì)算中,常需推求P=1%、0.1%、0.01%相應(yīng)的水文變量值。④不能求出統(tǒng)計(jì)參數(shù),難以進(jìn)行參數(shù)的地區(qū)綜合,無法解決無實(shí)測(cè)水文資料的小流域的水文計(jì)算問題。第38頁,共135頁,2023年,2月20日,星期三三、經(jīng)驗(yàn)頻率曲線的外延1、目估延長(zhǎng)局限性:(1)沒有實(shí)測(cè)點(diǎn)的控制,目估使曲線外延帶有相當(dāng)大的主觀成分。(2)由于水文現(xiàn)象的隨機(jī)性,有時(shí)點(diǎn)繪的經(jīng)驗(yàn)頻率點(diǎn)分布比較散亂,使得經(jīng)驗(yàn)累積頻率曲線的定線比較困難。第39頁,共135頁,2023年,2月20日,星期三2、選配合適的數(shù)學(xué)模型延長(zhǎng)經(jīng)驗(yàn)頻率曲線對(duì)水文資料的經(jīng)驗(yàn)頻率曲線選配合適的數(shù)學(xué)模型,利用數(shù)學(xué)方法來推求理論頻率曲線方程式,據(jù)此繪制理論頻率曲線,減小目估徒手定線的主觀因素影響。第40頁,共135頁,2023年,2月20日,星期三第四節(jié)隨機(jī)變量的統(tǒng)計(jì)參數(shù)隨機(jī)變量的概率分布曲線或分布函數(shù),比較完整地描述了隨機(jī)現(xiàn)象的分布規(guī)律。但是,在許多實(shí)際問題中,隨機(jī)變量的分布函數(shù)不易確定,有時(shí)不一定都需要用完整的形式來說明隨機(jī)變量,而只要用個(gè)別代表性的數(shù)值說明隨機(jī)變量的主要特征即可。例如,某地的年降水量是一個(gè)隨機(jī)變量,各年的降水量不同,具有一定的概率分布函數(shù),若要了解該地年降水量概括情況,可用多年平均降水量這個(gè)數(shù)量指標(biāo)來反映。這種能說明隨機(jī)變量統(tǒng)計(jì)規(guī)律的數(shù)字特征值,稱為隨機(jī)變量的統(tǒng)計(jì)參數(shù)。第41頁,共135頁,2023年,2月20日,星期三
統(tǒng)計(jì)參數(shù)有總體統(tǒng)計(jì)參數(shù)與樣本統(tǒng)計(jì)參數(shù)之分。水文現(xiàn)象的總體是無限的,它是指自古迄今以至未來長(zhǎng)遠(yuǎn)歲月所有的水文系列。顯然,水文隨機(jī)變量的總體是不知道的,只能靠有限的樣本觀測(cè)資料去估計(jì)總體的統(tǒng)計(jì)參數(shù)或總體的分布規(guī)律。
水文計(jì)算中常用的樣本統(tǒng)計(jì)參數(shù)有位置特征參數(shù)和離散特征參數(shù)。
第42頁,共135頁,2023年,2月20日,星期三一、位置特征參數(shù)位置特征參數(shù)就是描述隨機(jī)變量在數(shù)軸上位置的特征值。主要有:均值、中位數(shù)、眾數(shù)。1、均值設(shè)某水文變量的觀測(cè)系列(樣本)為x1、x2、……、xn,則其均值為
第43頁,共135頁,2023年,2月20日,星期三均值也稱算術(shù)平均值,表示系列的平均情況,可以說明這一系列總水平的高低。例如,按1956~1979年統(tǒng)計(jì),黃河流域多年平均降水量為475.9mm,長(zhǎng)江流域多年平均降水量為1070.5mm,說明長(zhǎng)江流域的水量比黃河流域豐沛。均值不僅是頻率計(jì)算中的一個(gè)重要參數(shù),而且還是水文現(xiàn)象的一個(gè)重要特征值。第44頁,共135頁,2023年,2月20日,星期三令k為模比系數(shù),則上式說明,當(dāng)我們把變量X的系列用其相對(duì)值即用模比系數(shù)k的系列表示時(shí),則其均值等于1。這是水文統(tǒng)計(jì)中的一個(gè)重要特征,即對(duì)于以模比系數(shù)k所表示的隨機(jī)變量,在其頻率曲線的方程中,可以減少均值這樣一個(gè)參數(shù)。第45頁,共135頁,2023年,2月20日,星期三2、中位數(shù)中位數(shù)是把概率密度曲線分為兩個(gè)相等部分的數(shù),記為Me(x)。對(duì)于離散型的隨機(jī)變量:將所有變量的可能取值按大小次序排列,位置居中的數(shù)字。第46頁,共135頁,2023年,2月20日,星期三對(duì)于連續(xù)的隨機(jī)變量:中位數(shù)滿足:式中,a、b分別為隨機(jī)變量X取值的上下限。Me(x)xf(x)1/21/2ab第47頁,共135頁,2023年,2月20日,星期三3、眾數(shù)
表示概率密度分布峰點(diǎn)所對(duì)應(yīng)的數(shù),記為M0(x)。對(duì)于離散型隨機(jī)變量:
M0(x)是使概率
P(=xi)等于最大時(shí)所相應(yīng)的
xi值。M0(x)=xiPi-1PiPi+1
Px離散型隨機(jī)變量的眾數(shù)第48頁,共135頁,2023年,2月20日,星期三對(duì)于連續(xù)型隨機(jī)變量:
M0(x)是概率密度函數(shù)f(x)等于最大時(shí)所對(duì)應(yīng)的xi值。M0(x)f(x)x連續(xù)的隨機(jī)變量的眾數(shù)第49頁,共135頁,2023年,2月20日,星期三
二、離散特征參數(shù)離散特征參數(shù)是刻劃隨機(jī)變量分布離散程度的指標(biāo),這種類型的參數(shù)有:標(biāo)準(zhǔn)差、離勢(shì)系數(shù)、偏態(tài)系數(shù)。
1、標(biāo)準(zhǔn)差(均方差)122>1f(x)x標(biāo)準(zhǔn)差對(duì)密度函數(shù)的影響值愈大,分布愈分散;值愈小,分布愈集中。第50頁,共135頁,2023年,2月20日,星期三例題:兩系列:甲——5,10,15;乙——1,10,19。比較其離散程度。表明:乙系列的離散程度大于甲系列。第51頁,共135頁,2023年,2月20日,星期三2、變差系數(shù)(離差系數(shù)、離勢(shì)系數(shù))對(duì)于均值不同的二個(gè)系列,用均方差來比較其離散程度就不合適,則要采用均方差和均值的比來表示系列的相對(duì)離散程度:CV值愈大,分布愈分散;CV值愈小,分布愈集中。CV1CV2CV2>CV1f(x)x變差系數(shù)對(duì)密度函數(shù)的影響第52頁,共135頁,2023年,2月20日,星期三例題:比較兩系列的離散程度:
甲——5,10,15;乙——995,1000,1005。表明:甲系列的離散程度大于乙系列。第53頁,共135頁,2023年,2月20日,星期三3、偏態(tài)系數(shù)在數(shù)理統(tǒng)計(jì)中主要采用偏態(tài)系數(shù)作為衡量系列不對(duì)稱程度的參數(shù)。上式右端的分子、分母同除以,則得第54頁,共135頁,2023年,2月20日,星期三
當(dāng)系列對(duì)稱時(shí),CS=0,此時(shí)隨機(jī)變量大于均值與小于均值的出現(xiàn)機(jī)會(huì)相等。當(dāng)系列不對(duì)稱時(shí),CS≠0,其中CS>0,稱為正偏,隨機(jī)變量大于均值比小于均值出現(xiàn)的機(jī)會(huì)?。籆S<0,稱為負(fù)偏,隨機(jī)變量大于均值比小于均值出現(xiàn)的機(jī)會(huì)多。f(x)x偏態(tài)系數(shù)對(duì)密度函數(shù)的影響Cs=0Cs<0Cs>0第55頁,共135頁,2023年,2月20日,星期三三、隨機(jī)變量系列統(tǒng)計(jì)參數(shù)的估計(jì)
水文隨機(jī)變量的總體是無限的,這就需要在總體不知道的情況下,靠抽出的樣本(觀測(cè)的系列)去估計(jì)總體參數(shù)。估算方法有:
矩法;
適線法;
極大似然法;
權(quán)函數(shù)法;
………第56頁,共135頁,2023年,2月20日,星期三矩法1、計(jì)算公式已知樣本的隨機(jī)系列:x1、x2、x3、…xn,分別求樣本的三個(gè)統(tǒng)計(jì)參數(shù):均值、CV、CS。樣本均值樣本標(biāo)準(zhǔn)差樣本離勢(shì)系數(shù)第57頁,共135頁,2023年,2月20日,星期三
樣本偏態(tài)系數(shù)
2、無偏估計(jì)量顯然,樣本的統(tǒng)計(jì)參數(shù)與相應(yīng)的總體同名參數(shù)不一定相等。但是,我們希望由樣本系列計(jì)算出來的統(tǒng)計(jì)參數(shù)與總體更接近些,因此,需要將上述樣本參數(shù)的計(jì)算公式加以修正。
第58頁,共135頁,2023年,2月20日,星期三定義:令θ′為未知參數(shù)θ的估計(jì)量,如果E(θ′)=θ,則稱θ′為參數(shù)θ的無偏估計(jì)量。換句話說,無偏估計(jì)是設(shè)想有很多個(gè)同樣容量的樣本資料,使其計(jì)算出來的統(tǒng)計(jì)參數(shù)的均值,可望等于總體的同名參數(shù)??梢宰C明,樣本均值是總體均值的無偏估計(jì)量。然而CV、CS則不是總體相應(yīng)參數(shù)的無偏估計(jì)量,稱為有偏估計(jì)量。故需要對(duì)參數(shù)CV、CS進(jìn)行修正,使其變成無偏估計(jì)量。
第59頁,共135頁,2023年,2月20日,星期三
求Cv、Cs的無偏估計(jì)量的修正計(jì)算式:
(當(dāng)n較大時(shí))第60頁,共135頁,2023年,2月20日,星期三第五節(jié)幾種常用的概率分布曲線
目的:在水文分析計(jì)算中,常常需要知道大于或等于某一特征值的頻率是多少,也就是要提供一定頻率的水文數(shù)值,這就需要繪制頻率曲線。分類:國內(nèi)外水文分析計(jì)算中使用的概率分布曲線俗稱水文頻率曲線,習(xí)慣上把由實(shí)測(cè)資料(樣本)繪制的頻率曲線稱為經(jīng)驗(yàn)頻率曲線,而把由數(shù)學(xué)方程式所表示的頻率曲線稱為理論頻率曲線。
第61頁,共135頁,2023年,2月20日,星期三頻率計(jì)算的內(nèi)容:分布線型的選擇與統(tǒng)計(jì)參數(shù)的估算。水文頻率分布線型:指所采用的理論頻率曲線(頻率函數(shù))的型式(水文中常用線型為正態(tài)分布型、極值分布型、皮爾遜Ⅲ分布型等),它的選擇主要取決于與大多數(shù)水文資料的經(jīng)驗(yàn)頻率點(diǎn)據(jù)的配合情況。
第62頁,共135頁,2023年,2月20日,星期三
探求頻率曲線的數(shù)學(xué)方程,即尋求水文頻率分布線型,一直是水文分析計(jì)算中爭(zhēng)論性很強(qiáng)的課題。水文隨機(jī)變量究竟服從何種分布,目前還沒有充足的論證,因?yàn)樗默F(xiàn)象非常復(fù)雜,我們所掌握的資料又非常短,難以從理論上推斷究竟服從何種分布線型,因此只能以某種理論線型近似代替。這些理論線型并不是從水文現(xiàn)象的物理性質(zhì)方面推導(dǎo)出來的,而是根據(jù)經(jīng)驗(yàn)資料從統(tǒng)計(jì)數(shù)學(xué)的已知頻率函數(shù)中選出來的。第63頁,共135頁,2023年,2月20日,星期三迄今為止,國內(nèi)外采用的理論線型已有10余種。如:正態(tài)分布(N)、皮爾遜Ⅲ型分布(P-Ⅲ)、對(duì)數(shù)皮爾遜Ⅲ型分布(LP-Ⅲ)、克里茨基一閔凱里分布(K-M)、指數(shù)伽瑪分布(Γ)、兩參數(shù)對(duì)數(shù)正態(tài)分布(LN2)、三參數(shù)對(duì)數(shù)正態(tài)分布(LN3)、I型極值分布(EVI)、通用極值分布(GEV)、韋布爾分布(Weibull)、指數(shù)分布(Exp)、P-V分布、耿貝爾分布(Gamble)。第64頁,共135頁,2023年,2月20日,星期三
不過,從現(xiàn)有資料看,P-Ⅲ型曲線和LP-Ⅲ型曲線比較符合水文隨機(jī)變量的分布。因此,這兩種曲線用得最多。我國在水文頻率計(jì)算中都是采用P-Ⅲ型頻率曲線,并在1993年國家發(fā)布的《水利水電工程設(shè)計(jì)洪水計(jì)算規(guī)范》規(guī)定“頻率曲線的線型一般應(yīng)采用皮爾遜Ⅲ型。特殊情況,經(jīng)分析論證后也可采用其它線型”。為此,下面介紹正態(tài)分布和P-Ⅲ型分布。
第65頁,共135頁,2023年,2月20日,星期三一、正態(tài)分布1、定義:如果隨機(jī)變量X的概率密度函數(shù)為則稱隨機(jī)變量X具有正態(tài)概率分布。正態(tài)分布具有兩個(gè)參數(shù):均值和均方差σ。e為自然對(duì)數(shù)的底。
第66頁,共135頁,2023年,2月20日,星期三2、特點(diǎn)a.單峰,只有一個(gè)眾數(shù);b.對(duì)于平均數(shù)對(duì)稱,Cs=0;c.曲線兩端趨于±∞,并以x軸為漸近線。第67頁,共135頁,2023年,2月20日,星期三4、應(yīng)用(1)誤差分析:正態(tài)分布的密度曲線與x軸所圍成的面積應(yīng)等于1。均值兩邊σ、2σ、3σ范圍內(nèi)的面積分別為顯然,均方差σ越小,由均值估計(jì)x值的誤差越小。正態(tài)分布的這種特性在誤差估算時(shí)得到了應(yīng)用。第68頁,共135頁,2023年,2月20日,星期三(2)頻率格紙:正態(tài)分布頻率曲線在普通方格紙上是一條規(guī)則的S形曲線,因頻率曲線的兩端特別陡峭,又因圖幅的限制,對(duì)于特小頻率或特大頻率,尤其是特大頻率的點(diǎn)子很難點(diǎn)在圖上。為此,設(shè)計(jì)一種“頻率格紙”,其橫坐標(biāo)的分劃就是按把標(biāo)準(zhǔn)正態(tài)分布頻率曲線拉成一條直線的原理計(jì)算出來的。這種頻率格紙的縱坐標(biāo)仍是普通分格,但橫坐標(biāo)的分格是不相等的,中間分格較密,越往兩端分格越稀,其間距在P=50%的兩端是對(duì)稱的。第69頁,共135頁,2023年,2月20日,星期三第70頁,共135頁,2023年,2月20日,星期三二、皮爾遜Ⅲ型分布1、定義英國生物學(xué)家Person研制的13種分布曲線中的第3種(簡(jiǎn)稱P—Ⅲ型),其密度函數(shù)為
式中,():
的伽瑪函數(shù),、、a0:三個(gè)參數(shù),它們與三個(gè)統(tǒng)計(jì)參數(shù)有一定的關(guān)系。第71頁,共135頁,2023年,2月20日,星期三2、特點(diǎn)(1)P-III型曲線是一條一端有限另一端無限的不對(duì)稱單峰正偏曲線。f(x)皮爾遜Ⅲ
型概率密度曲線
a0M0(x)Me(x)xPx第72頁,共135頁,2023年,2月20日,星期三(2)α、β、a0三個(gè)參數(shù)與、Cv、Cs的關(guān)系:(3)多數(shù)水文特征值的最小值必須大于或等于零。(4)Cs>0時(shí)為正偏,Cs=0時(shí)為正態(tài)分布。第73頁,共135頁,2023年,2月20日,星期三3、應(yīng)用
P—Ⅲ型曲線的分布函數(shù)為:F(x)=P(X≥xP)=P(1)兩類計(jì)算問題①規(guī)劃設(shè)計(jì)問題:由設(shè)計(jì)標(biāo)準(zhǔn)P,推求滿足設(shè)計(jì)標(biāo)準(zhǔn)的設(shè)計(jì)值xp;②評(píng)估決策問題:由實(shí)際發(fā)生值x,推求出現(xiàn)大于或等于該值的概率。第74頁,共135頁,2023年,2月20日,星期三
(2)計(jì)算方法直接計(jì)算:由分布函數(shù)和密度函數(shù)的關(guān)系,可得當(dāng)參數(shù)為已知時(shí),規(guī)劃設(shè)計(jì)問題為方程求根,評(píng)估決策問題為數(shù)值積分。第75頁,共135頁,2023年,2月20日,星期三查表計(jì)算:
將隨機(jī)變量經(jīng)標(biāo)準(zhǔn)化變換:
取標(biāo)準(zhǔn)變量,即
代入上式,、、a0以相應(yīng)的
和
關(guān)系式表示,簡(jiǎn)化后得:第76頁,共135頁,2023年,2月20日,星期三
被積函數(shù)含有參數(shù)、Cs
,而包含在中,制成對(duì)應(yīng)關(guān)系表。詳見附錄3,P228。
因此,由給定的CS及P,從P-III型曲線離均系數(shù)值表,查出P
,再由下式求: 即求出指定概率P所相應(yīng)的隨機(jī)變量的取值xP。第77頁,共135頁,2023年,2月20日,星期三第78頁,共135頁,2023年,2月20日,星期三例2:某站年平均徑流深系列符合P-Ⅲ型分布,已知該系列的R=650mm,σ=162.5mm,CS=2CV,計(jì)算設(shè)計(jì)保證率P=1%的設(shè)計(jì)年徑流量。解:由CV=σ/R=162.5/650=0.25,則CS=2CV=2×0.25=0.5,P=1%,查表得,Ф=2.68,則R1%=650×(1+2.68×0.25)=1085.5mm第79頁,共135頁,2023年,2月20日,星期三另外,當(dāng)CS/CV等于一定倍數(shù)時(shí),可令模比系數(shù)KP=1+ΦPCV,則變?yōu)閤P=(1+ΦPCV)=KP
,式中,KP與P和CS有關(guān),可查附表4。第80頁,共135頁,2023年,2月20日,星期三4、理論頻率曲線已知P—Ⅲ分布的三個(gè)參數(shù)、Cv、Cs值,由Φ值表可查得各種頻率P相應(yīng)的ΦP值,然后反變換得xp值。將點(diǎn)(P,xp)點(diǎn)繪在概率格紙上,即可連成一條光滑的頻率曲線,常常將此曲線稱為理論頻率曲線。=1000mm,Cv=0.5,Cs=1.0的頻率曲線如下。第81頁,共135頁,2023年,2月20日,星期三第82頁,共135頁,2023年,2月20日,星期三
5、統(tǒng)計(jì)參數(shù)對(duì)頻率曲線的影響:為了避免適線時(shí)調(diào)整參數(shù)的盲目性,必須了解統(tǒng)計(jì)參數(shù)對(duì)頻率曲線的影響。①均值對(duì)頻率曲線的影響當(dāng)Cv、Cs相同時(shí),均值大的頻率曲線位于均值小的頻率曲線之上,且均值大的頻率曲線比均值小的頻率曲線陡。
第83頁,共135頁,2023年,2月20日,星期三②離勢(shì)系數(shù)Cv對(duì)頻率曲線的影響為了消除均值的影響,以模比系數(shù)k為變量繪制頻率曲線。當(dāng)Cv=0時(shí),隨機(jī)變量的取值都等于均值,此時(shí)頻率曲線即為k=1的一條水平線,隨著Cv的增大,頻率曲線的偏離程度也隨之增大,曲線變得越來越陡,且有一種使整個(gè)頻率曲線順時(shí)針方向旋轉(zhuǎn)的作用。
第84頁,共135頁,2023年,2月20日,星期三③偏態(tài)系數(shù)Cs對(duì)頻率曲線的影響以模比系數(shù)k為變量繪制頻率曲線,在正偏情況下,當(dāng)Cs增大時(shí),頻率曲線的中部下降,且兩端上抬,上段變陡,下段變緩。xPPPxPPxP第85頁,共135頁,2023年,2月20日,星期三第六節(jié)抽樣誤差一、誤差來源1、觀測(cè)、記錄、整編和計(jì)算中有些假定不夠合理造成——隨著科學(xué)技術(shù)的發(fā)展逐漸減小。2、抽樣誤差由于水文系列總體是無限的,而樣本的容量是有限的,因此,由樣本求到的參數(shù)對(duì)于總體存在一定的誤差,則稱為抽樣誤差。因此,以樣本參數(shù)替代相應(yīng)的總體參數(shù)時(shí),必須考慮這一誤差。該誤差無法準(zhǔn)確求到,只能在概率意義下作出某種估計(jì)。第86頁,共135頁,2023年,2月20日,星期三二、抽樣誤差估算下面以矩法的樣本均值為例,說明抽樣誤差的概念和估算方法:假設(shè)從某隨機(jī)變量的總體中隨機(jī)抽取k個(gè)容量相同的樣本,分別算出各個(gè)樣本的均值,這些均值對(duì)其總體均值的抽樣誤差為,
有大有小,各種數(shù)值出現(xiàn)的機(jī)會(huì)不同,即每一數(shù)值都有一定的概率,也即為一隨機(jī)變量,它也有其分布,稱為抽樣誤差分布。
第87頁,共135頁,2023年,2月20日,星期三由誤差分布理論知,抽樣誤差可近似服從正態(tài)分布,而抽樣分布的均方差(標(biāo)準(zhǔn)差)可作為度量抽樣誤差的指標(biāo),也即大表示抽樣誤差大,小表示抽樣誤差小。為區(qū)別起見,將稱為樣本均值的均方誤。第88頁,共135頁,2023年,2月20日,星期三
由于抽樣分布通常為正態(tài)分布,由正態(tài)分布的特性可知:上式的物理意義是:如果隨機(jī)抽取一個(gè)樣本,以此樣本的均值作為總體均值的估計(jì)值,則有68.3%的可能性誤差不超過,有95%的可能性誤差不超過,有99.7%的可能性誤差不超過。以上對(duì)均值的討論同樣也適用于其它樣本參數(shù)。第89頁,共135頁,2023年,2月20日,星期三
根據(jù)統(tǒng)計(jì)理論,可導(dǎo)出各參數(shù)的均方誤公式,它們與總體分布有關(guān)。對(duì)于皮爾遜Ⅲ型分布且用矩法估算參數(shù)時(shí),樣本參數(shù)的均方誤公式為
第90頁,共135頁,2023年,2月20日,星期三
由上述公式可見,抽樣誤差的大小,隨樣本項(xiàng)數(shù)n、Cv和Cs的大小而變化。樣本容量大,對(duì)總體的代表性就好,其抽樣誤差就小,這就是為什么在水文計(jì)算中總是想方設(shè)法取得較長(zhǎng)的水文系列的原因。在均方誤的計(jì)算中,因含有CS的高次方,當(dāng)樣本容量n<100時(shí),由樣本直接計(jì)算CS的誤差很大,不能滿足水文計(jì)算的要求。第91頁,共135頁,2023年,2月20日,星期三第七節(jié)水文頻率計(jì)算方法
是以經(jīng)驗(yàn)頻率點(diǎn)據(jù)為基礎(chǔ),在一定的適線準(zhǔn)則下,求解與經(jīng)驗(yàn)點(diǎn)據(jù)擬合最優(yōu)的頻率曲線參數(shù)。該法既能估計(jì)總體的分布型式,又能求出其統(tǒng)計(jì)參數(shù),是一種能較好地滿足水文頻率分析要求的估計(jì)方法。
第92頁,共135頁,2023年,2月20日,星期三現(xiàn)行頻率計(jì)算方法——適線法(配線法)試錯(cuò)適線法(經(jīng)驗(yàn)適線法/目估適線法)1、步驟:(1)將實(shí)測(cè)資料由大到小排列,根據(jù)數(shù)學(xué)期望公式計(jì)算各項(xiàng)的經(jīng)驗(yàn)頻率,在頻率格紙上點(diǎn)繪經(jīng)驗(yàn)點(diǎn)據(jù)。(2)先采用矩法或其它方法估計(jì)出頻率曲線參數(shù)的初估值。因Cs的抽樣誤差太大,一般憑經(jīng)驗(yàn)初選比值Cs/Cv為某一倍數(shù)。倍數(shù)可選1.5、2、2.5、3…。已知:經(jīng)驗(yàn)頻率分布,求:總體分布參數(shù)第93頁,共135頁,2023年,2月20日,星期三
(3)選定水文頻率分布線型(一般選用皮爾遜III型)。(4)根據(jù)選定的參數(shù)、CV、CS,由P-III型曲線離均系數(shù)值表(附錄3)或P-III型曲線模比系數(shù)KP值表(附錄4),求出xP~P的理論頻率曲線,將其繪在有經(jīng)驗(yàn)點(diǎn)據(jù)的同一張圖上,看它們的配合好壞,若不理想,則修改有關(guān)的參數(shù)(主要調(diào)整CV及K=CS/CV
),重復(fù)以上的步驟,重新配線。(5)根據(jù)理論頻率曲線與經(jīng)驗(yàn)點(diǎn)據(jù)的配合情況,從中選出一條與經(jīng)驗(yàn)點(diǎn)據(jù)配合較好的曲線作為采用曲線,相應(yīng)于該曲線的參數(shù)便看作是總體參數(shù)的估值。
第94頁,共135頁,2023年,2月20日,星期三PxP理論頻率曲線經(jīng)驗(yàn)點(diǎn)據(jù)適線法的實(shí)質(zhì)是通過樣本經(jīng)驗(yàn)分布來推求總體分布,適線法的關(guān)鍵在于“最佳配合”的判別。(6)應(yīng)用試錯(cuò)適線法得到的統(tǒng)計(jì)規(guī)律,解決水文頻率分析的兩類計(jì)算問題。
第95頁,共135頁,2023年,2月20日,星期三
2、特點(diǎn)①配線法層次清楚,圖像顯明,方法靈活,操作容易,便于結(jié)合水文和統(tǒng)計(jì)概念調(diào)整參數(shù),所以該法在水文計(jì)算中被廣泛采用。②既能估計(jì)分布型式,又能推求統(tǒng)計(jì)參數(shù)。③外延比較準(zhǔn)確。④計(jì)算工作量大,計(jì)算結(jié)果因人而異。第96頁,共135頁,2023年,2月20日,星期三第八節(jié)相關(guān)分析一、概述
1、相關(guān)分析的概念水文現(xiàn)象中許多變量不是孤立的,相互之間存在聯(lián)系,則分析研究?jī)蓚€(gè)或兩個(gè)以上隨機(jī)變量之間的關(guān)系,稱作相關(guān)分析。第97頁,共135頁,2023年,2月20日,星期三2、相關(guān)分析的意義與應(yīng)用
應(yīng)用:相關(guān)分析可以用來延長(zhǎng)和插補(bǔ)短系列,從而提高系列的代表性,增加樣本估計(jì)總體的計(jì)算精度,如建立上、下游水位的相關(guān)關(guān)系,由上游水位預(yù)報(bào)下游水位。
前提:在相關(guān)分析時(shí),首先要分析隨機(jī)變量之間是否在成因上確有聯(lián)系,對(duì)毫無關(guān)聯(lián)的現(xiàn)象是不能用相關(guān)分析的。第98頁,共135頁,2023年,2月20日,星期三3、水文計(jì)算中的相關(guān)分析的主要任務(wù):(1)確定兩個(gè)變量間相關(guān)關(guān)系的數(shù)學(xué)表達(dá)式,以相關(guān)方程或回歸方程表示,用以由已知變量推求未知變量;(2)判斷兩個(gè)變量間相關(guān)關(guān)系的密切程度,用一稱為相關(guān)系數(shù)的參數(shù)來表示。第99頁,共135頁,2023年,2月20日,星期三4、相關(guān)關(guān)系的種類(1)按相關(guān)變量個(gè)數(shù)分為①簡(jiǎn)相關(guān):2個(gè)變量;②復(fù)相關(guān):≥3個(gè)變量。
第100頁,共135頁,2023年,2月20日,星期三(2)按相關(guān)程度分為①完全相關(guān)(函數(shù)相關(guān))如果兩個(gè)變量x、y,其中變量x的每一個(gè)值,變量y都有一個(gè)或多個(gè)確定值與之對(duì)應(yīng),而且x、y成函數(shù)關(guān)系,即x、y的關(guān)系點(diǎn)完全落在直線或曲線上,則稱這兩個(gè)變量是完全相關(guān)的。第101頁,共135頁,2023年,2月20日,星期三②零相關(guān)(沒有關(guān)系)
如果兩個(gè)變量x、y之間互不影響、互不相關(guān),則稱這兩個(gè)變量沒有關(guān)系或零相關(guān)。即x、y的關(guān)系點(diǎn)毫無規(guī)律,十分分散。零相關(guān)YX第102頁,共135頁,2023年,2月20日,星期三③統(tǒng)計(jì)相關(guān)(相關(guān)關(guān)系)
如果兩個(gè)變量x、y之間關(guān)系介于以上兩者之間,x、y的關(guān)系點(diǎn)雖有點(diǎn)分散,但有明顯的趨勢(shì),數(shù)學(xué)上可以用一定的表達(dá)式進(jìn)行擬合。則稱這二個(gè)變量關(guān)系為:統(tǒng)計(jì)相關(guān)或相關(guān)關(guān)系。yx第103頁,共135頁,2023年,2月20日,星期三二、簡(jiǎn)單直線(線性)相關(guān)1、圖解法設(shè)xi和yi代表兩系列(隨機(jī)變量)的觀測(cè)值,共有n對(duì),把對(duì)應(yīng)值點(diǎn)繪于方格紙上,得到很多相關(guān)點(diǎn)。如果相關(guān)點(diǎn)的平均趨勢(shì)近似直線,即可通過點(diǎn)群中間及()點(diǎn)繪出相關(guān)直線,如圖所示。稱這種直接作圖定出相關(guān)線的方法為相關(guān)圖解法。
第104頁,共135頁,2023年,2月20日,星期三
方法:從圖上量得直線的斜率b,直線與縱軸的截距a,則直線方程y=a+bx即為所求的相關(guān)直線方程。
特點(diǎn):方法簡(jiǎn)單,計(jì)算精度不高,適用于相關(guān)密切的變量。第105頁,共135頁,2023年,2月20日,星期三2、相關(guān)分析法
若相關(guān)點(diǎn)分布較散,目估定線有一定任意性,為保證一定精確性,最好采用分析法來確定相關(guān)直線的方程。設(shè)該直線方程形式為:y=a+bx式中,x:自變量
y:倚變量
a、b:分別為一常數(shù),待定。則相關(guān)點(diǎn)與直線在縱軸方向必然存在離差。第106頁,共135頁,2023年,2月20日,星期三xiy配合曲線與觀測(cè)點(diǎn)在縱軸方向的離差為:第107頁,共135頁,2023年,2月20日,星期三
要求配合曲線與所有的觀測(cè)點(diǎn)能“最佳”擬合,根據(jù)最小二乘法原理,即滿足所有的觀測(cè)點(diǎn)的離差y的平方和為最小,即:(1)回歸方程的確定欲使上式最小,可分別對(duì)其求一階偏導(dǎo)數(shù),并使其等于0,即令第108頁,共135頁,2023年,2月20日,星期三求解上述方程組可得第109頁,共135頁,2023年,2月20日,星期三式中,:分別為x、y系列的均方差;
:分別為x、y系列的平均值;
:x、y系列的變差系數(shù)(按不偏估計(jì)公式計(jì)算):
r:相關(guān)系數(shù);
Kxi
、Kyi:分別為xi、yi系列的模比系數(shù):第110頁,共135頁,2023年,2月20日,星期三將,代入y=a+bx中得:上式即為y倚x的回歸方程,其曲線稱為回歸線/相關(guān)線(僅是對(duì)點(diǎn)據(jù)擬合最佳一條線),亦可表示為:為回歸線的斜率,稱為y倚x的回歸系數(shù)。第111頁,共135頁,2023年,2月20日,星期三
若以y求x,則要應(yīng)用x倚y的回歸方程,它的圖形稱為x倚y的回歸線。同理,可推得x倚y的回歸方程,即
一般y倚x與x倚y的兩回歸線并不重合,但有一個(gè)公共交點(diǎn)。在作回歸分析時(shí)必須注意,由x求y用y倚x的回歸方程;由y求x用x倚y的回歸方程。第112頁,共135頁,2023年,2月20日,星期三(2)相關(guān)系數(shù)回歸線只是對(duì)觀測(cè)點(diǎn)的一條最佳配合線,它反映了兩個(gè)變量之間的平均關(guān)系。回歸線并不能說明兩個(gè)變量之間的關(guān)系是否密切。在數(shù)理統(tǒng)計(jì)法中,一般采用相關(guān)系數(shù)來描述和判別兩變量之間的相關(guān)程度。
第113頁,共135頁,2023年,2月20日,星期三相關(guān)系數(shù)的性質(zhì):①若r2=1,表示相關(guān)點(diǎn)(xi,yi)均落在回歸線上,兩變量間具有直線函數(shù)關(guān)系;②若r2=0,說明y的變化與x毫無直線關(guān)系,稱為零相關(guān);③若0<r2<1,r2愈接近于1,點(diǎn)據(jù)越靠近回歸直線,關(guān)系越密切。r為正時(shí),表示正相關(guān);r為負(fù)時(shí),表示負(fù)相關(guān)。第114頁,共135頁,2023年,2月20日,星期三(3)相關(guān)分析的誤差①回歸線的誤差
由于x、y并非確定性關(guān)系,對(duì)于x=x0,無法知道其相應(yīng)的真正值y0,通過回歸方程求到:僅僅是真正值y0的一個(gè)估計(jì)值。故其與真正值y0存在偏差。根據(jù)統(tǒng)計(jì)學(xué)的研究,由于隨機(jī)因素的影響,y0在估計(jì)值上下波動(dòng)呈正態(tài)分布,其誤差大小可用均方誤表示。第115頁,共135頁,2023年,2月20日,星期三第116頁,共135頁,2023年,2月20日,星期三
如用Sy表示y倚x回歸線的均方誤,yi為觀測(cè)值,為回歸線上的對(duì)應(yīng)值,n為系列項(xiàng)數(shù),則同樣,x倚y回歸線的均方誤Sx為第117頁,共135頁,2023年,2月20日,星期三回歸線的均方誤Sy與變量的均方差σy之間的關(guān)系:兩者之間從性質(zhì)上講是不同的,前者是由觀測(cè)點(diǎn)與回歸線之間的離差求得,而后者則由觀測(cè)點(diǎn)與它的均值之間的離差求得。按照誤差理論,這些可能的取值yi落在回歸線兩側(cè)一個(gè)均方誤范圍內(nèi)(y+Sy)的概率為68.3%,落在3個(gè)均方誤范圍內(nèi)(y+3Sy)的概率為99.7%。
第118頁,共135頁,2023年,2月20日,星期三②相關(guān)系數(shù)的誤差:在相關(guān)分析中,相關(guān)系數(shù)是根據(jù)有限的實(shí)測(cè)資料(樣本)計(jì)算出來的,必然會(huì)有抽樣誤差。一般通過相關(guān)系數(shù)的均方誤和相關(guān)系數(shù)的檢驗(yàn)來判斷樣本相關(guān)系數(shù)的可靠性,按統(tǒng)計(jì)學(xué)原理,相關(guān)系數(shù)的均方誤為相關(guān)系數(shù)的誤差也可以用隨機(jī)誤差(機(jī)誤)表示Er=0.6745σr。一般當(dāng)r>4Er時(shí),則認(rèn)為相關(guān)關(guān)系存在。第119頁,共135頁,2023年,2月20日,星期三③相關(guān)系數(shù)的檢驗(yàn)
必要性:有了相關(guān)系數(shù)r,只要它不為零,便可求出變量x與y之間的回歸直線。但是,相關(guān)系數(shù)是根據(jù)有限的樣本資料計(jì)算出來的,不免帶有抽樣誤差,即使總體是不相關(guān)的兩變量,其相關(guān)系數(shù)也不一定為零。因此,為了推斷兩變量之間是否真正存在相關(guān)關(guān)系,即為了避免把本來是不相關(guān)的兩變量,錯(cuò)誤地推斷為相關(guān),必須對(duì)樣本的相關(guān)系數(shù)作顯著性檢驗(yàn)。第120頁,共135頁,2023年,2月20日,星期三假設(shè)檢驗(yàn):先假設(shè)總體具有某種統(tǒng)計(jì)特性(如具有某種參數(shù),或遵從某種分布等),然后再檢驗(yàn)這個(gè)假設(shè)是否可信,這種方法稱為假設(shè)檢驗(yàn)。原假設(shè)H0:r總體=0(不相關(guān));備擇假設(shè)H1:r總體≠0(相關(guān))。先假設(shè)r總體=0,即總體不相關(guān)。
溫馨提示
- 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請(qǐng)下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請(qǐng)聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
- 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會(huì)有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
- 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
- 5. 人人文庫網(wǎng)僅提供信息存儲(chǔ)空間,僅對(duì)用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對(duì)用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對(duì)任何下載內(nèi)容負(fù)責(zé)。
- 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請(qǐng)與我們聯(lián)系,我們立即糾正。
- 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶因使用這些下載資源對(duì)自己和他人造成任何形式的傷害或損失。
最新文檔
- 2025年在地區(qū)農(nóng)業(yè)現(xiàn)場(chǎng)會(huì)上的講話模版(2篇)
- 2025年醫(yī)院副院長(zhǎng)競(jìng)聘演講稿(3篇)
- 煤礦安全隱患整改方案例文(2篇)
- 資料管理工作職責(zé)范文(2篇)
- 公司歡慶元旦晚會(huì)主題活動(dòng)方案(3篇)
- 幼兒園車輛管理制度(3篇)
- 2025年學(xué)風(fēng)建設(shè)表彰大會(huì)講話稿(5篇)
- 關(guān)于服裝店長(zhǎng)崗位職責(zé)(2篇)
- 配件驗(yàn)收員崗位責(zé)任制(3篇)
- 檢驗(yàn)人員崗位責(zé)任制范文(2篇)
- ××領(lǐng)導(dǎo)班子及成員分析研判報(bào)告(模板)
- 08S305-小型潛水泵選用及安裝圖集
- 視頻監(jiān)控室值班記錄表
- 歌曲《梁?!泛?jiǎn)譜完整版
- 四川2020版清單定額
- 教材編寫工作總結(jié)
- 企業(yè)員工上下班交通安全培訓(xùn)(簡(jiǎn)詳共2份)
- 城市高密度建成區(qū)合流制溢流污染系統(tǒng)研究-黃孝河機(jī)場(chǎng)河水環(huán)境綜合治理項(xiàng)目實(shí)踐
- word 公章 模板
- T∕ZSQX 008-2020 建設(shè)工程全過程質(zhì)量行為導(dǎo)則
- ISO-IEC17025-2017實(shí)驗(yàn)室管理體系全套程序文件
評(píng)論
0/150
提交評(píng)論