版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進行舉報或認(rèn)領(lǐng)
文檔簡介
第七章統(tǒng)計分析的基本原理§1事件及概率§2概率分布§3幾個重要的概率分布§4平均數(shù)的抽樣分布§5統(tǒng)計假設(shè)檢驗§6參數(shù)的區(qū)間估計§7方差分析原理第七章統(tǒng)計分析的基本原理
§1事件及概率
一、事件的類型:1、必然事件:在一定條件下一定會發(fā)生的事件。2、不可能事件:在一定條件下一定不會發(fā)生的事件3、隨機事件:在一定條件下可能發(fā)生,也可能不發(fā)生?;蛘甙l(fā)生這樣的結(jié)果也可能發(fā)生另一種結(jié)果。二、隨機試驗1、試驗:通常我們把根據(jù)某一研究目的,在一定條件下對自然現(xiàn)象所進行的觀察或試驗統(tǒng)稱為試驗。2、隨機試驗的特性(1)試驗可以在相同條件下多次重復(fù)進行;(2)每次試驗的可能結(jié)果不止一個,并且事先知道會有哪些可能的結(jié)果;(3)每次試驗總是恰好出現(xiàn)這些可能結(jié)果中的一個,但在每次試驗之前卻不能肯定這次試驗會出現(xiàn)哪一個結(jié)果。第七章統(tǒng)計分析的基本原理§1事件及概率三、概率1、概率的定義:
例:一批種子的發(fā)芽試驗:種子數(shù)n1020501002005001000發(fā)芽數(shù)m8174279164409816發(fā)芽率m/n0.80.850.840.790820.8180.816
在相同條件下進行n次重復(fù)試驗,如果隨機事件A發(fā)生的次數(shù)為m,那么m/n稱為隨機事件A的頻率(frequency);當(dāng)試驗重復(fù)數(shù)n逐漸增大時,隨機事件A的頻率越來越穩(wěn)定地接近某一數(shù)值p,那么就把p稱為隨機事件A的概率。第七章統(tǒng)計分析的基本原理§1事件及概率2、概率的基本性質(zhì):1)對于任何事件的概率,0≤P(A)≤1;2)必然事件的概率為1,即P(Ω)=13)不可能事件的概率為0,即P(ф)=0。4)隨機事件的概率為大于0,小于1,即:0<P(A)<1
概率記作:記作:P(A)==第七章統(tǒng)計分析的基本原理§1事件及概率3、小概率事件:
若隨機事件的概率很小,例如小于0.05、0.01、0.001,稱之為小概率事件。4、小概率原理:如果事件的概率為0.05、0.01、0.001以至接近0時,這種小概率事件我們在一次試驗中看成實際上不可能發(fā)生的事件。這被稱為“小概率事件實際不可能性原理”。第七章統(tǒng)計分析的基本原理§1事件及概率§2概率分布一、隨機變量
做一次試驗,其結(jié)果有多種可能。每一種可能結(jié)果都可用一個數(shù)來表示,這個數(shù)稱為隨機變量,用x表示。1、離散型隨機變量
(discreterandomvariable):
如果表示試驗結(jié)果的變量x,其可能取值可以一一列舉,這樣的隨機變量則稱x為離散型隨機變量。
2、連續(xù)型隨機變量
(continuousrandomvariable):
如果表示試驗結(jié)果的變量x,其可能取值為某范圍內(nèi)的任何數(shù)值,且不能一一列舉,這樣的隨機變量稱為連續(xù)型隨機變量。1、概率分布意義:
例1、一粒種子的發(fā)芽試驗,種子的發(fā)芽率為0.8X01P(x)0.20.8二、概率分布第七章統(tǒng)計分析的基本原理§2概率分布例2、一批種子檢驗其合格率為p=0.9,不合格率q=0.1,從中隨機抽取5顆,其合格種子的概率分布=通式:∑
pxqn-x=(p+q)nX543210f(x)0.95*0.100.94*0.110.93*0.120.92*0.130.91*0.140.90*0.150.950.328050.07290.00810.000450.15第七章統(tǒng)計分析的基本原理§2概率分布概率分布的定義:對于確定的隨機變量x可能取的值為:x1、x2、x3、……xn,與之對應(yīng)的概率之間的任何一一對應(yīng)的關(guān)系稱為隨機變量的概率分布。xx1x2
…xn
…pp1p2
…pn
…第七章統(tǒng)計分析的基本原理§2概率分布2、概率分布函數(shù):
一組隨機變量必定有一個概率分布,且是唯一確定的,并且這種概率可以用一個函數(shù)式來表示,這個函數(shù)式稱為概率分布函數(shù)。f(x)=px·qn-xf(x)≥0第七章統(tǒng)計分析的基本原理§2概率分布§3幾個重要的概率分布一、二項式分布1、二項式分布的意義:
設(shè)事件A和組成完備事件,事件A要么發(fā)生要么不發(fā)生,二者必居其一,且每次試驗中事件A發(fā)生的概率為常數(shù)p,事件A不發(fā)生的概率為q=1-p,在n次獨立重復(fù)試驗中,用x表示n次試驗中事件A發(fā)生的次數(shù),所以x取值為0、1、2……n,這n+1種取值有各自對應(yīng)的概率分布,這樣的概率分布稱為二項式分布。*從定義可以看出,二項式分布是非連續(xù)型隨機變量的概率分布。2、二項式分布的函數(shù)1)分布函數(shù)(密度函數(shù)):2)累積函數(shù):指x取值在某一范圍內(nèi)的概率之和。F(x)=P(m1≤x≤m2)=f(x)=F(x)=P(0≤x≤n)==1第七章統(tǒng)計分析的基本原理§3幾個重要的概率分布3、二項式分布的平均數(shù)和標(biāo)準(zhǔn)差1)平均數(shù):u=np2)標(biāo)準(zhǔn)差:σ=第七章統(tǒng)計分析的基本原理§3幾個重要的概率分布4、二項式概率分布圖像X543210f(x)0.590490.328050.07290.00810.000450.00005p=0.9q=0.1n=5Xf(x)第七章統(tǒng)計分析的基本原理§3幾個重要的概率分布p=0.4,q=0.6,n=20的二項分布圖示p=q=0.5,n=5的二項分布圖示第七章統(tǒng)計分析的基本原理§3幾個重要的概率分布(p+q)n=(0.1+0.9)n二項式分布圖像二項式分布圖像的特點:1)n很小,p≠q時,圖像是偏峰的折線2)n很小,p=q時,圖像是一個對稱的折線3)若n充分大時,圖像逐漸變成對稱平滑的曲線。
(p+q)20二項式分布圖像二、正態(tài)分布1.正態(tài)分布的定義:
若連續(xù)型隨機變量x的概率分布密度函數(shù)為:
其中μ為平均數(shù),σ2為方差,則稱隨機變量x服從正態(tài)分布(normaldistribution),記為x~N(μ,σ2)。累積函數(shù)為:
第七章統(tǒng)計分析的基本原理§3幾個重要的概率分布2、正態(tài)分布圖像:0.68260.95450.9973μ-3σμ-2σ
μ-1σμ
μ+1σμ+2σ
μ+3σxf(x)0.40.30.20.1第七章統(tǒng)計分析的基本原理§3幾個重要的概率分布3、正態(tài)分布的性質(zhì):1)正態(tài)分布曲線是單峰,左右對稱的鐘形曲線,對稱軸在x=μ處。
2)的絕對值愈大時,f(x)愈小,f(x)恒大于0;所以f(x)為正函數(shù),曲線向x軸兩端無限延伸,以x軸為漸近線。3)當(dāng)x=u時,f(x)為最大。第七章統(tǒng)計分析的基本原理§3幾個重要的概率分布4)x取值范圍為整個x軸,即:-∞<x<+∞。所以曲線與x軸圍成的面積等于1。即:
因此變量x取任何兩個定值a,b之間的概率等于曲線下介于這兩個定值間的面積占總面積的成數(shù)。即:
P(a≤x≤b)=第七章統(tǒng)計分析的基本原理§3幾個重要的概率分布圖4-4μ相同而σ不同的三個正態(tài)分布5)任何正態(tài)分布曲線都由兩個參數(shù)u,和σ決定的。μ確定曲線在x軸上的位置;σ確定曲線峰的高低。圖4-3σ相同而μ不同的三個正態(tài)分布6)x在下列取值區(qū)間時的累積概率X取值區(qū)間面積成數(shù)面積比例(u-1σ)≤x<(u+1σ)0.682768.27%(u-2σ)≤x<(u+2σ)0.954595.45%(u-3σ)≤x<(u+3σ)0.997399.73%(u-1.96σ)≤x<(u+1.96σ)0.9595%(u-2.576σ)≤x<(u+2.576σ)0.9999%-∞<x≤(u+1.645σ)0.9595%-∞<x≤(u+2.33σ)0.9999%P(a≤x≤b)=第七章統(tǒng)計分析的基本原理§3幾個重要的概率分布4、正態(tài)分布的概率計算:1)一般正態(tài)分布的概率:P(x1≤x≤x2)=概率是陰影的面積正態(tài)分布的概率第七章統(tǒng)計分析的基本原理§3幾個重要的概率分布2)標(biāo)準(zhǔn)的正態(tài)分布設(shè)隨機變量x服從正態(tài)分布:即:x~N(μ
,σ2)令:U=◆密度函數(shù)式:
這個函數(shù)式中μ=0,σ=1
所以:U~N(0,1)這個函數(shù)稱為標(biāo)準(zhǔn)的正態(tài)分布函數(shù)即:x~N(μ
,σ2)轉(zhuǎn)換成U~N(0,1)變量x轉(zhuǎn)換成UU稱為標(biāo)準(zhǔn)正態(tài)變量第七章統(tǒng)計分析的基本原理§3幾個重要的概率分布◆累積函數(shù)為:隨機變量U服從標(biāo)準(zhǔn)正態(tài)分布,記作U~N(0,1)這樣可以計算出U取任意值時的累積概率。累積概率見表2(p357頁)第七章統(tǒng)計分析的基本原理§3幾個重要的概率分布標(biāo)準(zhǔn)正態(tài)分布密度曲線Uf(x)0第七章統(tǒng)計分析的基本原理§3幾個重要的概率分布標(biāo)準(zhǔn)正態(tài)分布的三個常用概率
U第七章統(tǒng)計分析的基本原理§3幾個重要的概率分布
關(guān)于標(biāo)準(zhǔn)正態(tài)分布,以下幾種概率應(yīng)當(dāng)熟記:
P(-1≤U<1)=0.6826P(-2≤U<2)=0.9545
P(-3≤U<3)=0.9973P(-1.96≤U<1.96)=0.95P(-2.58≤U<2.58)=0.99第七章統(tǒng)計分析的基本原理§3幾個重要的概率分布
設(shè)u服從標(biāo)準(zhǔn)正態(tài)分布,則U在[U1,U2
)內(nèi)取值的概率為:3)標(biāo)準(zhǔn)正態(tài)分布的概率計算=Φ(U2)-Φ(U1)而Φ(U1)與Φ(U2)可由附表1查得第七章統(tǒng)計分析的基本原理§3幾個重要的概率分布
◆計算u所在一定區(qū)間的概率:例1:U
~
N(0,12)計算U取值在-2σ至+3σ區(qū)間的概率解:由題意可知:變量U所在總體的μ=0,σ=1變量U服從標(biāo)準(zhǔn)的正態(tài)分布,所以:
P(U-2σ≤U<U+3σ)=P(-2≤U<3)=P(-∞≤U<3)-P(-∞≤U<-2)=Φ(3)-Φ(-2)=0.99865-0.02275(查表得)=0.97889第七章統(tǒng)計分析的基本原理§3幾個重要的概率分布◆計算x取值所在區(qū)間的概率例2、x~N(10,52)求x取值為15至25的概率解:依題意可知,變量x所在的總體的平均數(shù)μ=10,標(biāo)準(zhǔn)差σ=5,該總體不是服從標(biāo)準(zhǔn)的正態(tài)分布。所以必須先進行標(biāo)準(zhǔn)化,將x變量轉(zhuǎn)換成u變量變量標(biāo)準(zhǔn)化轉(zhuǎn)換:xU,變量u所在總體的μ=0,σ=1P(U+1σ≤U<U+3σ)=P(1≤U<3)=P(-∞≤U<3)-P(-∞≤U<1)=Φ(3)-Φ(1)=0.99865-0.84134(查表1)=0.15731第七章統(tǒng)計分析的基本原理§3幾個重要的概率分布例3、P63頁例4.4解:依題意:變量x~N(30,52)◆求小于26的概率P(-∞≤U<U-0.8σ
)=P(-∞
≤U<-0.8)=Φ(-0.8)=0.2119變量U所在總體的μ=0,σ=1◆
介于26至40區(qū)間的概率P(-0.8<U<2)=Φ(2)-Φ(-0.8)=0.97725-0.21186=0.76539第七章統(tǒng)計分析的基本原理§3幾個重要的概率分布◆小于40的概率
U===2
P(-∞<U<2)=0.97725Φ(2)=F(40)=0.97725
◆
求大于40的概率
P(U+2σ≤U<∞)=P(2≤U<∞)=Φ(∞)
-Φ(2)=1-0.97725
=0.02275
第七章統(tǒng)計分析的基本原理§3幾個重要的概率分布作業(yè):
桂花一年生苗木平均高35cm,標(biāo)準(zhǔn)差15cm,問這批苗木
(1)高于60cm苗木所占比例;
(2)在20cm至60cm之間的苗木所占比例;
(3)小于20cm的苗木所占比例。第七章統(tǒng)計分析的基本原理§3幾個重要的概率分布§4平均數(shù)的抽樣分布一、樣本平均數(shù)二、樣本平均數(shù)的概率分布三、“t”分布四、兩個樣本平均數(shù)差數(shù)的概率分布一、樣本平均數(shù):1、樣本平均數(shù):
……s1s2……sn第七章統(tǒng)計分析的基本原理§4平均數(shù)的抽樣分布2、樣本平均數(shù)的平均數(shù):
樣本平均數(shù)的平均數(shù)等于總體的平均數(shù)
即:
:總體平均數(shù)
:樣本平均數(shù)的平均數(shù)
3、樣本平均數(shù)的標(biāo)準(zhǔn)差(標(biāo)準(zhǔn)誤)為:
其中::樣本平均數(shù)的標(biāo)準(zhǔn)差;:總體的標(biāo)準(zhǔn)差;n為樣本單元數(shù)
第七章統(tǒng)計分析的基本原理§4平均數(shù)的抽樣分布
注意:標(biāo)準(zhǔn)差與標(biāo)準(zhǔn)誤是既有聯(lián)系又有區(qū)別的兩個統(tǒng)計量,上式已表明了二者的聯(lián)系。二者的區(qū)別在于:
樣本標(biāo)準(zhǔn)差S是反映樣本中各觀測值,,…,變異程度大小的一個指標(biāo),它的大小說明了對該樣本代表性的強弱。
樣本標(biāo)準(zhǔn)誤是樣本平均數(shù)的標(biāo)準(zhǔn)差,它是抽樣誤差的估計值,其大小說明了樣本間變異程度的大小及精確性的高低。第七章統(tǒng)計分析的基本原理§4平均數(shù)的抽樣分布二、樣本平均數(shù)的概率分布:
統(tǒng)計量(如,)隨樣本的不同而有所不同,因而樣本統(tǒng)計量也是隨機變量,也有其概率分布。我們把統(tǒng)計量的概率分布稱為抽樣分布。
從有限總體中作重復(fù)隨機抽樣,所有可能的樣本數(shù)為Nn,其中N為總體容量,n為樣本含量。例如:如果從N=4的總體中抽取n=2的樣本,共可得42=16個樣本;如果樣本含量n為4,則一共可抽得44=256個樣本。第七章統(tǒng)計分析的基本原理§4平均數(shù)的抽樣分布例:設(shè)有一總體N=3,觀察值為:2、4、6,每次抽取2個單元組成樣本,
第一次抽取的數(shù)246第二次抽取的數(shù)246246246樣本的和468681081012樣本平均數(shù)234345456第七章統(tǒng)計分析的基本原理§4平均數(shù)的抽樣分布各種不同樣本容量的平均數(shù)()的抽樣分布表(p67頁表)n=1n=2n=4n=8f
f
f
f212121212.2582.542.5362.751123231032663.255043.5163.57843.7510164143419411074.2510164.5164.57844.755045251052665.251125.545.5365.72861616161總次數(shù)3981656144448/34/32/31/3例2:設(shè)有一總體N=3,觀察值為:2、4、6,以樣本容量n=1、n=2、n=4、n=8
(p67例4.7)N=3,n=1,k=31
,平均數(shù)概率分布圖
N=3,n=2,k=32
,平均數(shù)概率分布圖N=3,n=4,k=34
,平均數(shù)概率分布圖
N=3,n=8,k=38,平均數(shù)概率分布圖
第七章統(tǒng)計分析的基本原理§4平均數(shù)的抽樣分布1、樣本平均數(shù)的概率分布
不管原總體是否是正態(tài)分布,從中隨機抽取樣本,即使樣本容量很小(n=4),樣本平均數(shù)的分布卻趨向于正態(tài)分布形式。隨著樣本容量n的增大,樣本平均數(shù)的分布愈來愈從不連續(xù)趨向于連續(xù)的正態(tài)分布,當(dāng)n>30時,的分布就近似正態(tài)分布了。樣本平均數(shù)服從正態(tài)分布。記作:~N(,)第七章統(tǒng)計分析的基本原理§4平均數(shù)的抽樣分布1)若隨機變量x
服從正態(tài)分布x~N(μ,σ2),
x1、x2
、…、xn是由總體得來的隨機樣本,則統(tǒng)計量=∑x
/n的概率分布也是正態(tài)分布,
=μ,服從正態(tài)分布,
即:~
N(μ,σ2/n)。2、中心極限定律第七章統(tǒng)計分析的基本原理§4平均數(shù)的抽樣分布2)若隨機變量x
平均數(shù)是μ,方差是σ2的總體不是正態(tài)分布;,,…,是由此總體得來的隨機樣本,則統(tǒng)計量=Σx/n的概率分布,當(dāng)n相當(dāng)大時逼近正態(tài)分布,即:~N(μ,σ2/n)。第七章統(tǒng)計分析的基本原理§4平均數(shù)的抽樣分布中心極限定理告訴我們:不論變量x是連續(xù)型還是離散型,也不論x服從何種分布,一般只要n>30,就可認(rèn)為的分布是正態(tài)的。若x的分布不是很偏倚,在n>20時,的分布近似于正態(tài)分布。第七章統(tǒng)計分析的基本原理§4平均數(shù)的抽樣分布1、t分布函數(shù):(t-distribution)
由樣本平均數(shù)抽樣分布的性質(zhì)知道:若x~N(μ,σ2),則~N(μ,σ2/n)。將隨機變量標(biāo)準(zhǔn)化得:,則U~N(0,1)。
當(dāng)總體標(biāo)準(zhǔn)差σ未知時,以樣本標(biāo)準(zhǔn)差S代替σ將隨機變量標(biāo)準(zhǔn)化,標(biāo)準(zhǔn)化的變量記為t。在計算時,由于采用S來代替σ,使得t
變量不再服從標(biāo)準(zhǔn)正態(tài)分布,而是服從t分布。三、“t”分布:第七章統(tǒng)計分析的基本原理§4平均數(shù)的抽樣分布概率分布密度函數(shù)如下:t的取值范圍是(-∞,+∞)
df=n-1為自由度。第七章統(tǒng)計分析的基本原理§4平均數(shù)的抽樣分布2、分布曲線1)t分布受自由度的制約,每一個自由度都有一條t分布密度曲線。第七章統(tǒng)計分析的基本原理§4平均數(shù)的抽樣分布
不同自由度的t分布密度曲線第七章統(tǒng)計分析的基本原理§4平均數(shù)的抽樣分布2)t分布密度曲線以縱軸為對稱軸,左右對稱,且在t=0時,分布密度函數(shù)取得最大值。
3)與標(biāo)準(zhǔn)正態(tài)分布曲線相比,t分布曲線頂部略低,兩尾部稍高而平。df越小這種趨勢越明顯。df越大,t分布越趨近于標(biāo)準(zhǔn)正態(tài)分布。當(dāng)n>30時,t分布與標(biāo)準(zhǔn)正態(tài)分布的區(qū)別很??;n>100時,t分布基本與標(biāo)準(zhǔn)正態(tài)分布相同;n→∞時,t
分布與標(biāo)準(zhǔn)正態(tài)分布完全一致。第七章統(tǒng)計分析的基本原理§4平均數(shù)的抽樣分布通俗地說:
◆在樣本容量充分大(n≥30)時,或者總體的方差已知,樣本的平均數(shù)就服從正態(tài)分布,即:~
N()
◆
在樣本容量比較?。╪﹤30)時,而總體的方差未知,樣本的平均數(shù)就服從df=n-1的t分布。第七章統(tǒng)計分析的基本原理§4平均數(shù)的抽樣分布四、兩個樣本平均數(shù)的差數(shù)概率分布:
如果從一個總體隨機抽取一個樣本,樣本容量為n1,總體平均數(shù)為μ1,方差為,從另一個總體隨機抽取一個樣本,樣本容量為n2,總體平均數(shù)為μ2,方差為,根據(jù)數(shù)理統(tǒng)計推導(dǎo),兩個隨機獨立抽取的樣本平均數(shù)間的差數(shù)()的抽樣分布參數(shù)與兩個總體間存在如下關(guān)系:第七章統(tǒng)計分析的基本原理§4平均數(shù)的抽樣分布(1)差數(shù)的平均數(shù)等于兩個總體平均數(shù)之差,即:(2)差數(shù)的方差為:第七章統(tǒng)計分析的基本原理§4平均數(shù)的抽樣分布通俗地說:
◆在樣本容量充分大(n≥30)時,或者總體的方差已知,兩個樣本的平均數(shù)的差數(shù)就服從正態(tài)分布,即:~
N()
◆
在樣本容量比較?。╪1﹤30,n2
﹤30
)時,而兩個總體的方差未知,兩個樣本的平均數(shù)差數(shù)就服從df=(n1-1)+(n2-1)的t分布。第七章統(tǒng)計分析的基本原理§4平均數(shù)的抽樣分布
§5統(tǒng)計假設(shè)檢驗一、假設(shè)檢驗的基本原理1、幾個基本概念:⑴假設(shè)檢驗:用一定標(biāo)準(zhǔn)檢驗樣本的特征數(shù)與總體參數(shù)或兩個樣本特征數(shù)之間是否存在真正差異的一種統(tǒng)計方法叫假設(shè)檢驗,或差異顯著測驗。
樣本統(tǒng)計量與總體參數(shù)的差異可能的原因:隨機因素引起的,這是由于抽樣所產(chǎn)生的,叫做抽樣誤差。兩者本質(zhì)上存在的差異引起的,樣本的統(tǒng)計量與總體參數(shù)存在著本質(zhì)的差異?!艏僭O(shè)檢驗又叫差異顯著性檢驗(testofsignificance),其類型有:U檢驗t檢驗F檢驗
2檢驗等
第七章統(tǒng)計分析的基本原理§5統(tǒng)計假設(shè)檢驗⑵無效假設(shè)H0:假定樣本來源的總體參數(shù)u與假設(shè)的總體參數(shù)u0沒有真正的差異,
即H0
:u=u0
u為樣本來自的總體參數(shù),u0為假定的總體參數(shù)。⑶備擇假設(shè)HA:假定樣本來源的總體參數(shù)u與假設(shè)的總體參數(shù)u0間存在真正的差異,即HA
:u≠u0
⑷顯著性水平(α):在假設(shè)檢驗中選用的概率標(biāo)準(zhǔn),也就是對概率規(guī)定的數(shù)量界限,通常用α=0.05,α=0.01,α=0.001第七章統(tǒng)計分析的基本原理§5統(tǒng)計假設(shè)檢驗
引例:有5株水稻苗,屬于2個品種,某人自稱有鑒別能力,我們表示懷疑,怎樣才能判斷他有無鑒別能力?我們假設(shè)他沒有鑒別能力,憑猜。檢驗一下他猜對的可能性大小。2、假設(shè)檢驗的原理
有2株是A品種,3株是B品種他是怎么知道的?這5株水稻,有幾株是A品種,幾株是B品種?32、假設(shè)檢驗的原理
小概率原理:概率很?。ā?%或1%)的事件,在一定試驗(抽樣)中是不可能會出現(xiàn)的,若真正出現(xiàn),則認(rèn)為無效假設(shè)不正確而推翻無效假設(shè)。
第七章統(tǒng)計分析的基本原理§5統(tǒng)計假設(shè)檢驗
樣本平均數(shù)分布規(guī)律是:從總體中抽出100個樣本,有95%的樣本平均數(shù)在總體平均數(shù)左右各1.96個標(biāo)準(zhǔn)誤差范圍內(nèi),只有5%的樣本平均數(shù)在總體平均數(shù)左右1.96個標(biāo)準(zhǔn)差范圍以外,但是從總體中抽出一個樣本時,一般是在總體平均數(shù)左右各1.96標(biāo)準(zhǔn)差范圍之內(nèi),決不會在之外。
因此認(rèn)為樣本平均數(shù)與總體參數(shù)u之差(-u)不超過1.96個標(biāo)準(zhǔn)差,以95%的概率保證樣本平均數(shù)與總體平均數(shù)不存在差異故接受H0,樣本平均數(shù)與總體u0存在的差異是抽樣誤差。第七章統(tǒng)計分析的基本原理§5統(tǒng)計假設(shè)檢驗若從總體中抽一個樣本時,它的平均數(shù)落在總體平均數(shù)1.96個標(biāo)準(zhǔn)誤差范圍以外,即5%的概率范圍,這是不可能的。說明樣本平均數(shù)與假定的總體u0存在的差異不是抽樣誤差,而是樣本所在的總體與假定總體存在實質(zhì)性的差異。即u≠u0,故接受HA。第七章統(tǒng)計分析的基本原理§5統(tǒng)計假設(shè)檢驗3、兩種錯誤1)第一類錯誤是真實情況為H0成立,卻否定了它,犯了“棄真”錯誤,也叫Ⅰ型錯誤。
Ⅰ型錯誤:就是把非真實差異錯判為真實差異。
即:為真,卻接受了。
第七章統(tǒng)計分析的基本原理§5統(tǒng)計假設(shè)檢驗2)第二類錯誤是H0不成立,卻接受了它,犯了“納偽”錯誤,也叫Ⅱ型錯誤。
Ⅱ型錯誤:就是把真實差異錯判為非真實差異。即:為真,卻接受了。第七章統(tǒng)計分析的基本原理§5統(tǒng)計假設(shè)檢驗客觀事實否定H0接受H0H0成立犯Ⅰ型錯誤(概率為α)判斷正確(概率為1-α)H0不成立判斷正確(概率為1-β)犯Ⅱ型錯誤(概率為β)第七章統(tǒng)計分析的基本原理§5統(tǒng)計假設(shè)檢驗降低錯誤的措施:◆將α(小概率)值規(guī)定小一些◆增加試驗的樣本容量降低誤差
=
第七章統(tǒng)計分析的基本原理§5統(tǒng)計假設(shè)檢驗4、一尾測驗、兩尾測驗否定區(qū)間在分布曲線的兩端稱為兩尾檢驗否定區(qū)間在分布曲線的一端,稱為一尾測驗。
兩尾測驗
一尾測驗
第七章統(tǒng)計分析的基本原理§5統(tǒng)計假設(shè)檢驗5、差異顯著性測驗的基本方法1)建立無效假設(shè)H0,有一個備擇假設(shè)HA;2)選取適當(dāng)?shù)臋z驗顯著性水平α,并確定是一尾還是兩尾;3)確定統(tǒng)計量的分布,正態(tài)分布(大樣本),t分布(小樣本);4)計算樣本的統(tǒng)計量U(t),同時列出自由度df;5)據(jù)U值(自由度)及α查表得臨界值Uα(tα);6)統(tǒng)計推斷:用計算的U(t)與查表得的Uα(tα)比較,判斷接受H0或HA,
<Uα
或<tα
,則接受H0,否則接受HA。第七章統(tǒng)計分析的基本原理§5統(tǒng)計假設(shè)檢驗二、平均數(shù)差異顯著性測驗1、一個樣本的顯著性測驗
假定總體X~N(u0,σ2)分布,樣本容量為大樣本,測驗該樣本是否來源于假定總體。1)建立無效假設(shè)H0:u=u0,
所在的總體u與總體u0沒有差異;及備擇假設(shè)HA:u≠u0;
2)選擇α:α=0.05或α=0.01兩尾或一尾第七章統(tǒng)計分析的基本原理§5統(tǒng)計假設(shè)檢驗3)計算統(tǒng)計量,U=
σ,U0:
假定總體標(biāo)準(zhǔn)差及平均數(shù)
n:樣本容量4)依α查表3,得Uα值5)判斷︱U︱>Uα,否定H0,則認(rèn)為不屬于總體u0。樣本平均數(shù)所在的總體u與總體u0差異顯著或極顯著。第七章統(tǒng)計分析的基本原理§5統(tǒng)計假設(shè)檢驗
⑤推斷
>U0.05
說明值落在1.96標(biāo)準(zhǔn)差以外,故否定H0,說明新品種與當(dāng)?shù)氐钠废荡嬖谥@著差異。
例:據(jù)測定某當(dāng)?shù)匕謇跗贩N一年生苗高110cm,標(biāo)準(zhǔn)差σ=8.8cm,今引進一個新品種40株,一年生苗高為100cm,試問這個新品種株高與當(dāng)?shù)仄贩N是否存在顯著性差異。①建立無效假設(shè):H0:u=u0=110cm,HA
:u≠u0②選擇α=0.05兩尾測驗
=-7.19③
計算U==④依α=0.05,查表3得U0.05=1.96(查正態(tài)分布表)(大樣本,總體的σ已知)=
③計算樣本平均數(shù):=35.2g
例2(P82頁5.1例)依題意:U0=34g,n=8①建立無效假設(shè):H0:u=u0=34gHA:u≠u0②選擇α=0.05
兩尾測驗④計算樣本標(biāo)準(zhǔn)差:==1.64g⑤計算統(tǒng)計量:==0.58g⑥依據(jù)df=8-1=7,依α=0.05查表4,t0.05=2.365(P360)
⑦
判斷:︱t︱<t0.05,接受假設(shè)H0
說明新引進的品種的千粒重與當(dāng)?shù)亓挤N沒有顯著性差異。(小樣本,總體的σ未知)t=
2、兩個大樣本平均數(shù)差異顯著性測驗
1)成組數(shù)據(jù)的平均數(shù)的比較:①兩個大樣本或總體方差已知時,用u檢驗(正態(tài)分布檢驗)的差數(shù)標(biāo)準(zhǔn)誤為:
和
統(tǒng)計量:U==第七章統(tǒng)計分析的基本原理§5統(tǒng)計假設(shè)檢驗
例:(P83頁5.2題)σ2
=0.4=1.2n1=12=1.4gn2=8
H0:A、B兩種方法的產(chǎn)量相等,即:H0:===0.2887(kg)
=-0.69U0.05
=1.96(查表)U=︱U︱<U0.05
故接受H0,說明A、B兩種方法的產(chǎn)量沒有差異。HA:u1≠u2
u1-
u2
=0
σ2===0.4
第七章統(tǒng)計分析的基本原理§5統(tǒng)計假設(shè)檢驗~u1=~u2②兩小樣本平均數(shù),而總體方差未知時差異顯著性測驗用t檢驗
建立無效假設(shè)H0
:
=確定顯著性水平α(兩樣本差數(shù)標(biāo)準(zhǔn)差)計算統(tǒng)計量:t=
判斷:依自由度df=(n1-1)+(n2-1)查t分布表得tα
<tα
則接受H0,否則接受HAHA
:u1≠u2
即:u1=u2第七章統(tǒng)計分析的基本原理§5統(tǒng)計假設(shè)檢驗=428kgn1=5=440kgn2=5
=482.5=137.5=11.136(kg)
==t=
=-1.08=df=(5-1)+(5-1)=8,查表tα=2.306<tα=2.306兩種栽培密度的水稻產(chǎn)量沒有差異。
例:P84頁例5.3,依表計算得:第七章統(tǒng)計分析的基本原理§5統(tǒng)計假設(shè)檢驗2)成對數(shù)據(jù)的差異顯著性測驗建立無效假設(shè)H0
:u1=u2選擇α計算統(tǒng)計量
=
t==依α與df=n-1查附表4得tα
與tα
比較
≤tα,則接受H0第七章統(tǒng)計分析的基本原理§5統(tǒng)計假設(shè)檢驗例:P87例5.6解H0
:u1=u2
選擇:α=0.01計算,t值
=11.997==t=依α=0.01,df=7-1=6查表3得tα=3.707判斷t>t0.01認(rèn)為u1與u2有顯著差異,說明A、B兩種產(chǎn)量對鈍化病毒的效果有極顯著的差異。=-4.16
第七章統(tǒng)計分析的基本原理§5統(tǒng)計假設(shè)檢驗確定顯著性水平α三、百分?jǐn)?shù)的假設(shè)檢驗:1、單個樣本百分?jǐn)?shù)(成數(shù))的假設(shè)檢驗檢驗的步驟:建立無效假設(shè),即H0
:p=p0;備擇假設(shè)HA:p≠p0
計算統(tǒng)計量
(樣本標(biāo)準(zhǔn)差)=
U=判斷:依查u分布表得Uα
<Uα
則接受H0
否則接受HA第七章統(tǒng)計分析的基本原理§5統(tǒng)計假設(shè)檢驗例:P88頁5.8例
開紫花的大豆為=208÷289=0.7197,理論:p0=0.75選擇顯著性水平α=0.05計算統(tǒng)計量:
=
=0.0255
=
=-1.19U=
=
Uα=1.96(查表3)
<Uα接受H0,說明大豆的花色符合遺傳的分離規(guī)律。
第七章統(tǒng)計分析的基本原理§5統(tǒng)計假設(shè)檢驗2、兩個樣本百分?jǐn)?shù)相比較的假設(shè)檢驗:統(tǒng)計量:=
求兩個樣本百分?jǐn)?shù)的平均數(shù)
=1-
==U=
第七章統(tǒng)計分析的基本原理§5統(tǒng)計假設(shè)檢驗例:(P89頁5.9題,檢查ppt)
=93.92%=87.37%n1=378n2=396p1=p2建立無效假設(shè):H0:
選擇顯著性水平:α=0.05
計算統(tǒng)計量:=
=
=0.906
=1-0.906=0.094
===0.021
U===3.12
Uα=1.96
>Uα
否定H0,說明兩個麥田銹病率有顯著差異。
第七章統(tǒng)計分析的基本原理§5統(tǒng)計假設(shè)檢驗假設(shè)檢驗公式匯總表類型(標(biāo)準(zhǔn)誤)標(biāo)準(zhǔn)化變換查表單個樣本平均數(shù)與總體比較大樣本或總體σ2已知
表3小樣本而總體σ2未知
表4兩個樣本平均數(shù)比較大樣本(或已知)
表3小樣本成對資料
表4成組資料
(n1-1)+(n2-1)表4單個樣本百分?jǐn)?shù)(成數(shù))的假設(shè)檢驗
表3兩個樣本百分?jǐn)?shù)相比較的假設(shè)檢驗:
表3§6參數(shù)的區(qū)間估計
一、概念:1、參數(shù)估計:通過樣本資料的統(tǒng)計量來估計總體參數(shù)的一種統(tǒng)計方法。2、點估計:用樣本的統(tǒng)計量直接估計總體的參數(shù)的方法稱為點估計。4、置信區(qū)間:估計參數(shù)所在的區(qū)間范圍。
5、置信度(可靠性):保證參數(shù)在一定區(qū)間范圍內(nèi)的概率。3、區(qū)間估計:以樣本的統(tǒng)計量,在一定的概率的保證下估計總體參數(shù)在一定的區(qū)間內(nèi),這樣的估計方法稱為區(qū)間估計。這個區(qū)間稱為置信區(qū)間。區(qū)間的上、下限稱為置信限。
第七章統(tǒng)計分析的基本原理§6參數(shù)的區(qū)間估計μ-1.96-μ≤-μ<μ+1.96-μ-1.96≤-μ<+1.96(每一項減
)二、區(qū)間估計的原理μ-1.96≤<μ+1.96(每一項減μ)--1.96≤-μ<-+1.96
(每一項除以-1)+1.96>μ≥-1.96
第七章統(tǒng)計分析的基本原理§6參數(shù)的區(qū)間估計P(μ-1.96≤<μ+1.96)=1-α=0.95下限為:L1=-1.96總體平均數(shù)μ在(-1.96,+1.96)區(qū)間內(nèi)的概率為95%。
置信度為:P=1-α
上限為:L2=+1.96置信區(qū)間為:〔-1.96,+1.96〕第七章統(tǒng)計分析的基本原理§6參數(shù)的區(qū)間估計通式:
大樣本:(-Uα
)≤μ≤(+Uα
)誤差限為:±Uα
+tα(-tα)≤μ≤()小樣本:誤差限為:±tα第七章統(tǒng)計分析的基本原理§6參數(shù)的區(qū)間估計
=4.1(kg)σ=0.3(kg)
n=36置信度:P=1-α=99%α=0.01
查表3三、總體平均數(shù)μ的置信限:下限:L1=-Uα
上限:L2=+Uα例:(P92頁5.13例)解:已知
(
4.1-2.58×0.05)≤μ≤(4.1+2.58×0.05)
=4.0≤μ≤4.2U0.01=2.58
===0.051、總體方差σ2已知第七章統(tǒng)計分析的基本原理§6參數(shù)的區(qū)間估計2、總體方差σ2未知下限:L1=(-tα
)上限:L2=(+tα
)依df=n-1,α查表4的tα值例:(P93頁5.14例)解:已知=35.2(kg)=0.58
(kg)
n=8P=99%依df=n-1=8-1=7,查表t0.05=2.365L1=(35.2-2.365×0.58)=33.8L2=(35.2+2.365×0.58)=36.6第七章統(tǒng)計分析的基本原理§6參數(shù)的區(qū)間估計四、兩個總體平均數(shù)差數(shù)(μ1-μ2)的置信限
1、兩個總體方差已知或大樣本(p93)
下限:L1=()-Uα
上限:L2=()+Uα
2、總體方差未知:
下限:L1=()-tα
上限:L2=()+tα
第七章統(tǒng)計分析的基本原理§6參數(shù)的區(qū)間估計區(qū)間估計公式匯總表區(qū)間估計類型
下限(L1)上限(L2)標(biāo)準(zhǔn)誤查表Uα或tα總體方差σ2已知查表3總體方差σ2未知Df=n-1查表4兩個總體方差已知或大樣本查表3兩個總體方差未知或小樣本(n1-1)+(n2-1)查表4總體百分?jǐn)?shù)p查表3兩個百分?jǐn)?shù)的差數(shù)查表3§7方差分析原理
t檢驗法適用于樣本平均數(shù)與總體平均數(shù)及兩樣本平均數(shù)間的差異顯著性檢驗,但在生產(chǎn)和科學(xué)研究中經(jīng)常會遇到比較多個處理優(yōu)劣的問題,即需進行多個平均數(shù)間的差異顯著性檢驗。這時,若仍采用t檢驗就不適宜了。這是因為:
檢驗過程煩瑣無統(tǒng)一的試驗誤差,誤差估計的精確性和檢驗的靈敏性低推斷的可靠性低,檢驗的I型錯誤率大第七章統(tǒng)計分析的基本原理§7方差分析原理一、方差分析的意義:
方差分析就是將試驗的總的變異剖分為各個變異來源的相應(yīng)部分,從而找出產(chǎn)生變異的主要原因,將總變異中各種產(chǎn)生變異的原因分析出來后剩余部分就是試驗誤差。然后以試驗誤差作為假設(shè)檢驗的依據(jù),將其它原因的產(chǎn)生的變異與試驗誤差比較進行統(tǒng)計推斷。
方差分析法是一種在若干能相互比較的資料組中,把產(chǎn)生變異的原因加以區(qū)分開來的方法與技術(shù)。
第七章統(tǒng)計分析的基本原理§7方差分析原理二、自由度和平方和的分解我們可以將平方和和自由度分別進行分解。平方和自由度S2
=第七章統(tǒng)計分析的基本原理§7方差分析原理k個處理每個處理有n個觀測值的
數(shù)據(jù)模式
總變異有nk個觀察值,總自由度有df=nk-1
第七章統(tǒng)計分析的基本原理§7方差分析原理
表示第i個處理n個觀測值的和
表示全部觀測值的總和表示第i個處理的平均數(shù)表示全部觀測值的總平均數(shù)第七章統(tǒng)計分析的基本原理§7方差分析原理表中xij表示第i個處理的第j個觀測值,(i=1,2,…,k;j=1,2,…,n)
稱單因素試驗的線性模型,
其中表示全試驗觀測值總體的平均數(shù);
αi
是第i
個處理的效應(yīng);εij是試驗誤差。
第七章統(tǒng)計分析的基本原理§7方差分析原理也是單因素試驗的數(shù)學(xué)模型的性質(zhì)1)效應(yīng)的可加性2)分布的正態(tài)性3)方差的同質(zhì)性方差分析的前提或基本假定條件
第七章統(tǒng)計分析的基本原理§7方差分析原理試驗結(jié)果的總平方和
SST=
令:C
=
C為校正系數(shù)
總平方和:SST=
第七章統(tǒng)計分析的基本原理§7方差分析原理1、平方和的分解:
總平方和=組內(nèi)平方和(誤差)+組間平方和(處理平方和)即:SST=SSe+SSk
SST
=
=
處理間平方和:SSk=
=誤差平方和:SSe=SST-SSk
第七章統(tǒng)計分析的基本原理§7方差分析原理(P100,6.3)2、自由度的分解:
總自由度=組間自由度+組內(nèi)自由度即:dfT=dfk+
dfe總自由度:dfT=nk-1處理間自由度:dfk=k-1誤差自由度:dfe=dfT-dfk=k(n-1)其中:
溫馨提示
- 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
- 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
- 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
- 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負(fù)責(zé)。
- 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請與我們聯(lián)系,我們立即糾正。
- 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時也不承擔(dān)用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。
最新文檔
- 2025年個人股權(quán)委托管理轉(zhuǎn)讓合同范本3篇
- 2025年度個人合伙退伙合同范本精要3篇
- 現(xiàn)代社會生活中的常見隱患及其家庭預(yù)防策略研究報告
- 智慧醫(yī)療與健康科技的發(fā)展
- 二零二五年度車間承包與安全生產(chǎn)責(zé)任合同4篇
- 游戲化學(xué)習(xí)小學(xué)生注意力培養(yǎng)的新模式
- 網(wǎng)絡(luò)安全技術(shù)與隱私保護措施研究
- 2025年度虛擬現(xiàn)實體驗店租賃合同
- 網(wǎng)絡(luò)環(huán)境下家庭信息的安全存儲與分享策略
- 玉林2025年廣西玉林市第一人民醫(yī)院招聘24人筆試歷年參考題庫附帶答案詳解
- 基于視覺的工業(yè)缺陷檢測技術(shù)
- 案例分析:美國紐約高樓防火設(shè)計課件
- 老客戶維護方案
- 高處作業(yè)安全教育培訓(xùn)講義課件
- 移動商務(wù)內(nèi)容運營(吳洪貴)任務(wù)一 用戶定位與選題
- 萬科物業(yè)管理公司全套制度(2016版)
- 2021年高考化學(xué)真題和模擬題分類匯編專題20工業(yè)流程題含解析
- 工作證明模板下載免費
- (完整word)長沙胡博士工作室公益發(fā)布新加坡SM2考試物理全真模擬試卷(附答案解析)
- 機械點檢員職業(yè)技能知識考試題庫與答案(900題)
- 成熙高級英語聽力腳本
評論
0/150
提交評論