版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進(jìn)行舉報或認(rèn)領(lǐng)
文檔簡介
第六統(tǒng)計假設(shè)檢驗(yàn)演示文稿目前一頁\總數(shù)一百一十一頁\編于十點(diǎn)(優(yōu)選)第六統(tǒng)計假設(shè)檢驗(yàn)?zāi)壳岸揬總數(shù)一百一十一頁\編于十點(diǎn)一、統(tǒng)計推斷的概念
統(tǒng)計推斷:是指用一個或一系列樣本的結(jié)果去估計總體可能的結(jié)果的過程。統(tǒng)計推斷基本上包括兩大部分的內(nèi)容,一是假設(shè)測驗(yàn),二是參數(shù)估計。目前三頁\總數(shù)一百一十一頁\編于十點(diǎn)統(tǒng)計推斷參數(shù)估計假設(shè)測驗(yàn)點(diǎn)估計區(qū)間估計統(tǒng)計推斷的前提條件:資料必須來自隨機(jī)樣本;統(tǒng)計數(shù)的分布規(guī)律必須已知。目前四頁\總數(shù)一百一十一頁\編于十點(diǎn)
二、統(tǒng)計假設(shè)測驗(yàn)的意義[例]有一水稻施肥試驗(yàn),甲乙兩種施肥方法的水稻產(chǎn)量如下x1(甲)x2(乙)8.29.68.78.99.48.510.711.29.210.911.110.8Σ=53.3Σ=63.9=8.88=10.65能否僅憑這兩個平數(shù)的差值-=1.77,立即得出甲與乙兩種施肥方法的水稻產(chǎn)量不同的結(jié)論呢?目前五頁\總數(shù)一百一十一頁\編于十點(diǎn)
統(tǒng)計學(xué)認(rèn)為,這樣得出的結(jié)論是不可靠的。因?yàn)槿绻覀冊僮鲆淮渭滓覂煞N施肥方法試驗(yàn),又可得到兩個樣本資料。由于抽樣誤差的隨機(jī)性,兩樣本平均數(shù)就不一定是8.88和10.65,其差值也不一定是1.77。造成這種差異可能有兩種原因,一是兩種施肥方法不同造成的差異,即是兩種施肥方法本質(zhì)不同所致,另一可能是試驗(yàn)誤差(或抽樣誤差)。
二、統(tǒng)計假設(shè)測驗(yàn)的意義目前六頁\總數(shù)一百一十一頁\編于十點(diǎn)
對兩個樣本進(jìn)行比較時,必須判斷樣本間差異是抽樣誤差造成的,還是本質(zhì)不同引起的。如何區(qū)分兩類性質(zhì)的差異?怎樣通過樣本來推斷總體?這正是顯著性檢驗(yàn)要解決的問題。
二、統(tǒng)計假設(shè)測驗(yàn)的意義目前七頁\總數(shù)一百一十一頁\編于十點(diǎn)
二、統(tǒng)計假設(shè)測驗(yàn)的意義
兩個總體間的差異如何比較?一種方法是研究整個總體,即由總體中的所有個體數(shù)據(jù)計算出總體參數(shù)進(jìn)行比較。這種研究整個總體的方法是很準(zhǔn)確的,但常常是不可能進(jìn)行的,因?yàn)榭傮w往往是無限總體,或者是包含個體很多的有限總體。因此,不得不采用另一種方法,即研究樣本,通過樣本研究其所代表的總體。目前八頁\總數(shù)一百一十一頁\編于十點(diǎn)
二、統(tǒng)計假設(shè)測驗(yàn)的意義
設(shè)甲施肥方法的總體平均數(shù)為,乙施肥方法的總體平均數(shù)為,試驗(yàn)研究的目的,就是要給、是否相同做出推斷。由于總體平均數(shù)、未知,在進(jìn)行顯著性檢驗(yàn)時只能以樣本平均數(shù)、作為檢驗(yàn)對象,更確切地說,是以(-)作為檢驗(yàn)對象。目前九頁\總數(shù)一百一十一頁\編于十點(diǎn)觀測值由兩部分組成,即若樣本含量為n,則可得到n
個觀測值:樣本平均數(shù):對于接受不同處理的兩個樣本來說,則有:
二、統(tǒng)計假設(shè)測驗(yàn)的意義處理效應(yīng)試驗(yàn)誤差表面效應(yīng)目前十頁\總數(shù)一百一十一頁\編于十點(diǎn)
雖然處理效應(yīng)(-)未知,但試驗(yàn)的表面效應(yīng)是可以計算的,借助數(shù)理統(tǒng)計方法可以對試驗(yàn)誤差作出估計。所以,可從試驗(yàn)的表面效應(yīng)與試驗(yàn)誤差的權(quán)衡比較中間接地推斷處理效應(yīng)是否存在,這就是顯著性檢驗(yàn)的基本思想。
二、統(tǒng)計假設(shè)測驗(yàn)的意義目前十一頁\總數(shù)一百一十一頁\編于十點(diǎn)
先假設(shè)真實(shí)差異不存在,表面差異全為試驗(yàn)誤差。然后計算這一假設(shè)出現(xiàn)的概率,根據(jù)小概率事件實(shí)際不可能性原理,判斷假設(shè)是否正確。這是對樣本所屬總體所做假設(shè)是否正確的統(tǒng)計證明,稱為統(tǒng)計假設(shè)測驗(yàn)(statisticalhypothesistest)。
二、統(tǒng)計假設(shè)測驗(yàn)的意義目前十二頁\總數(shù)一百一十一頁\編于十點(diǎn)三、顯著性檢驗(yàn)的基本步驟
(一)首先對試驗(yàn)樣本所在的總體作假設(shè)無效假設(shè):=或-=0或無效假設(shè)是被檢驗(yàn)的假設(shè),通過檢驗(yàn)可能被接受,也可能被否定。提出H0的同時相應(yīng)地提出一對應(yīng)假設(shè),備擇假設(shè):或或備擇假設(shè)是在無效假設(shè)被否定時準(zhǔn)備接受的假設(shè)。目前十三頁\總數(shù)一百一十一頁\編于十點(diǎn)
如何才能判斷Ho是否正確?就需要一個界限和標(biāo)準(zhǔn)。統(tǒng)計區(qū)間:在統(tǒng)計假設(shè)檢驗(yàn)中“接受”或“否定”所提出的“無效假設(shè)”Ho的概率范圍,稱為統(tǒng)計區(qū)間。顯著水平:統(tǒng)計推斷時,衡量差異顯著性程度的概率標(biāo)準(zhǔn),稱為顯著性水平,以α表示。常用顯著水平α=0.05稱為5%的顯著水平
α=0.01稱為1%的顯著水平也有用
α=0.25稱為25%的顯著水平
α=0.10稱為10%的顯著水平
(一)首先對試驗(yàn)樣本所在的總體作假設(shè)目前十四頁\總數(shù)一百一十一頁\編于十點(diǎn)
μ0=360kg
,σ=40kgn=16,x=380kg-
μ
μ≠μ0?原品種新品系(二)在無效假設(shè)成立的前提下,計算無效假
設(shè)正確的概率目前十五頁\總數(shù)一百一十一頁\編于十點(diǎn)在H0:μ=μ0(360kg)為正確的前提下,樣本平均數(shù)=380kg則是此分布總體中的一個隨機(jī)變量,據(jù)此,就可以根據(jù)正態(tài)分布求概率的方法算出在平均數(shù)μ=360kg的總體中,抽到一個樣本平均數(shù)和μ相差≥20kg的概率,從而確定是接受或否定H0。(二)在無效假設(shè)成立的前提下,計算無效假
設(shè)正確的概率目前十六頁\總數(shù)一百一十一頁\編于十點(diǎn)(二)在無效假設(shè)成立的前提下,計算無效假
設(shè)正確的概率
0f()查附表2,即得u值對應(yīng)的概率p<0.05。表明20Kg差異屬于試驗(yàn)誤差的概率小于5%。根據(jù)小概率事件實(shí)際不可能性原理,這個假設(shè)應(yīng)被否定,即表面差異不全為試驗(yàn)誤差,新品系與原品種之間存在真實(shí)差異。目前十七頁\總數(shù)一百一十一頁\編于十點(diǎn)統(tǒng)計上,當(dāng)1%<p≤5%稱所測差異顯著,
p≤1%稱差異極顯著,
p>5%稱差異不顯著,所以,統(tǒng)計假設(shè)測驗(yàn)又叫差異顯著性測驗(yàn)(differencesignificancetest)判定是否屬小概率事件的概率值叫顯著水平(significantlevel),一般以α表示。農(nóng)業(yè)上常取0.05和0.01。凡計算出的概率p小于α的事件即為小概率事件。目前十八頁\總數(shù)一百一十一頁\編于十點(diǎn)從H0正確出發(fā),根據(jù)的抽樣分布劃出一個區(qū)間,如-μ的差數(shù)在這一區(qū)間則接受H0,簡稱為接受區(qū)間,則該差數(shù)應(yīng)解釋為隨機(jī)誤差;如-μ的差數(shù)在這一區(qū)間外則否定H0,簡稱為否定區(qū)間,則該差數(shù)應(yīng)解釋為本質(zhì)上不同的真實(shí)差異。區(qū)間的確定:接受區(qū)間與否定區(qū)間的兩個(二)在無效假設(shè)成立的前提下,計算無效假
設(shè)正確的概率目前十九頁\總數(shù)一百一十一頁\編于十點(diǎn)(二)在無效假設(shè)成立的前提下,計算無效假
設(shè)正確的概率若要在0.05水平上接受H0:μ=μ0α=0.05時,由附表2得u=1.96則u=μ0_x-σx-︳︳<1.96(σx-=σ√n)x-<μ0-1.96σx-()μ0+1.96σx-()<假設(shè)接受區(qū)域(acceptanceregion)假設(shè)否定區(qū)域(negationregion)x-≤(μ0-1.96σx-)σx-x-≥(μ0+1.96)或目前二十頁\總數(shù)一百一十一頁\編于十點(diǎn)接受區(qū)域
95%否定區(qū)域
2.5%否定區(qū)域2.5%360340.4379.5
α=0.05時H0:μ=μ0的接受區(qū)和否定區(qū)μ0-1.96σx-()μ0+1.96σx-()=360-1.96×10=340.4kg=360+1.96×10=379.5kg目前二十一頁\總數(shù)一百一十一頁\編于十點(diǎn)同理,α=0.01時,由附表2得u=2.58,則H0:μ=μ0的接受區(qū)域?yàn)閤-<μ0-2.58σx-()μ0+2.58σx-()<否定區(qū)域?yàn)?-x≤(μ0-2.58σx-)σx-x≥(μ0+2.58)或-(二)在無效假設(shè)成立的前提下,計算無效假
設(shè)正確的概率目前二十二頁\總數(shù)一百一十一頁\編于十點(diǎn)
在實(shí)際檢驗(yàn)時,計算概率可以簡化,因?yàn)樵跇?biāo)準(zhǔn)正態(tài)分布下:
P(|u|>1.96)=0.05,
P(|u|>2.58)=0.01,因此,在用u分布作檢驗(yàn)時,
|u|≥1.96,表明概率P<0.05,可在0.05水平上否定H0;
|u|≥2.58,表明概率P<0.01,可在0.01水平上否定H0|u|<1.96,表明P>0.05,可接受H0。不必再計算實(shí)際的概率。目前二十三頁\總數(shù)一百一十一頁\編于十點(diǎn)
否定區(qū)間
否定區(qū)間接受區(qū)間f(u)-uα0uαU
0μ
f()接受區(qū)間目前二十四頁\總數(shù)一百一十一頁\編于十點(diǎn)
(三)根據(jù)“小概率事件實(shí)際不可能性原理”否定或接受無效假設(shè)
在統(tǒng)計學(xué)上,把小概率事件在一次試驗(yàn)中看成是實(shí)際上不可能發(fā)生的事件,稱為小概率事件實(shí)際不可能原理。根據(jù)這一原理,當(dāng)試驗(yàn)的表面效應(yīng)是試驗(yàn)誤差的概率小于0.05時,可以認(rèn)為在一次試驗(yàn)中試驗(yàn)表面效應(yīng)是試驗(yàn)誤差實(shí)際上是不可能的,因而否定原先所作的無效假設(shè),接受備擇假設(shè)。目前二十五頁\總數(shù)一百一十一頁\編于十點(diǎn)四、兩尾測驗(yàn)和一尾測驗(yàn)統(tǒng)計假設(shè)測驗(yàn)中H0:μ=μ0具有兩個否定區(qū),HA:μ≠μ0,這類測驗(yàn)稱兩尾測驗(yàn)(two-tailedtest),在假設(shè)測驗(yàn)中所考慮的概率為左右兩尾概率之和。當(dāng)H0:μ≤μ0,HA:μ>μ0,則否定區(qū)在分布的右尾。x-x-當(dāng)H0:μ≥μ0,HA:μ<μ0,則否定區(qū)在分布的左尾。象這種在假設(shè)測驗(yàn)中所考慮的概率只用一尾概率的測驗(yàn)稱為一尾測驗(yàn)(one-tailedtest)。選用一尾測驗(yàn)還是兩尾測驗(yàn),應(yīng)根據(jù)專業(yè)知識而定。目前二十六頁\總數(shù)一百一十一頁\編于十點(diǎn)α=0.05時H0:μ≤μ0的接受區(qū)和否定區(qū)0.95α=0.05接受區(qū)否定區(qū)α=0.05否定區(qū)接受區(qū)0.95α=0.05時H0:μ≥μ0的接受區(qū)和否定區(qū)否定區(qū)間為否定區(qū)間為目前二十七頁\總數(shù)一百一十一頁\編于十點(diǎn)四、統(tǒng)計假設(shè)測驗(yàn)的兩類錯誤檢驗(yàn)結(jié)果有四種情況:第一類錯誤:把非真實(shí)差異錯判為真實(shí)差異。犯此錯誤的概率為α。
檢驗(yàn)結(jié)果真實(shí)情況否定H0接受H0H0正確第一類錯誤正確H0錯誤正確第二類錯誤f()μ0接受區(qū)間否定區(qū)間目前二十八頁\總數(shù)一百一十一頁\編于十點(diǎn)第二類錯誤:把真實(shí)差異錯判為非真實(shí)差異。犯此錯誤的概率為β。
由圖可見,β的大小與|μ-μ0|、α有反比關(guān)系;而與標(biāo)準(zhǔn)誤有正比關(guān)系。β
μ0μ否定區(qū)間
接受區(qū)間
β目前二十九頁\總數(shù)一百一十一頁\編于十點(diǎn)實(shí)際中控制犯兩類錯誤的措施有以下幾種:①適當(dāng)增大水平間差距,即增大|μ-μ0|。②增加n。③根據(jù)試驗(yàn)?zāi)康?,通過調(diào)整α的大小來控制犯錯誤的概率。即當(dāng)試驗(yàn)者主觀希望獲得差異顯著(不顯著)的檢驗(yàn)結(jié)果時,(此時易接受第一類(二類)錯誤),應(yīng)適當(dāng)減小(增大)α。目前三十頁\總數(shù)一百一十一頁\編于十點(diǎn)第二節(jié)單個平均數(shù)的假設(shè)檢驗(yàn)
單個平均數(shù)的假設(shè)檢驗(yàn)就是檢驗(yàn)?zāi)骋粯颖舅鶎倏傮w平均數(shù)是否和某一指定的總體平均數(shù)相同,檢驗(yàn)所依據(jù)的理論基是平均數(shù)的抽樣分布
目前三十一頁\總數(shù)一百一十一頁\編于十點(diǎn)一單個平均數(shù)u檢驗(yàn)(一)應(yīng)用條件:
1總體參數(shù)μ0和σ2為已知。
2總體參數(shù)μ0已知,σ2為未知,但為大樣本(n≥30),可用S2估計。目前三十二頁\總數(shù)一百一十一頁\編于十點(diǎn)(二)方法步驟[例1]已知某工廠排污水中石油濃度分布屬正態(tài)分布,經(jīng)處理后隨機(jī)采樣16次,得樣本平均數(shù)=48mg·L-1。已知原總體平均數(shù)μ=50mg·L-1,總體方差σ2=6.25,問污水處理前后石油含量有無顯著差異?
一單個平均數(shù)u檢驗(yàn)?zāi)壳叭揬總數(shù)一百一十一頁\編于十點(diǎn)統(tǒng)計假設(shè)
H0:μ=μ0(50g·L-1)
HA:μ≠μ0
計算均數(shù)標(biāo)準(zhǔn)誤和μ值
推斷u>u0.01(2.58),差異極顯著表明污水經(jīng)處理后石油含量極顯著地降低
目前三十四頁\總數(shù)一百一十一頁\編于十點(diǎn)(一)t分布二、單個平均數(shù)t檢驗(yàn)
不論X是否服從正態(tài)分布,只要n很大,都有~將隨機(jī)變量標(biāo)準(zhǔn)化得:
當(dāng)總體標(biāo)準(zhǔn)差σ未知時,以樣本標(biāo)準(zhǔn)差S代替σ所得到的統(tǒng)計量記為t目前三十五頁\總數(shù)一百一十一頁\編于十點(diǎn)t分布的定義:若X~N(μ,σ2),則t=
~t(df)——t分布。n……
,st=t總體
Xμ,σ2目前三十六頁\總數(shù)一百一十一頁\編于十點(diǎn)在計算時,由于采用S來代替σ,使得t
變量不再服從標(biāo)準(zhǔn)正態(tài)分布,而是服從t分布(t-distribution)。它的概率分布密度函數(shù)如下:(一)t分布df=n-1為自由度。
二、單個平均數(shù)t檢驗(yàn)
目前三十七頁\總數(shù)一百一十一頁\編于十點(diǎn)
1、t分布受自由度的制約,每一個自由度都有一條t分布密度曲線。
2、t分布密度曲線以縱軸為對稱軸,左右對稱,且在t=0時,分布密度函數(shù)取得最大值。
3、與標(biāo)準(zhǔn)正態(tài)分布曲線相比,t分布曲線頂部略低,兩尾部稍高而平。df越小這種趨勢越明顯。df越大,t分布越趨近于標(biāo)準(zhǔn)正態(tài)分布。當(dāng)n>30時,t分布與標(biāo)準(zhǔn)正態(tài)分布的區(qū)別很?。籲>100時,t分布基本與標(biāo)準(zhǔn)正態(tài)分布相同;n→∞時,t
分布與標(biāo)準(zhǔn)正態(tài)分布完全一致。t分布的主要特性:目前三十八頁\總數(shù)一百一十一頁\編于十點(diǎn)-3-2-10123t或u0.40.30.20.1f(t)或(u)Фu分布t分布(df=1)t分布及其與標(biāo)準(zhǔn)正態(tài)曲線的比較目前三十九頁\總數(shù)一百一十一頁\編于十點(diǎn)
4、P(a<t<b)==面積A
a0bt
f(t)At分布的主要特性:目前四十頁\總數(shù)一百一十一頁\編于十點(diǎn)表3為學(xué)生氏t值表(兩尾),表達(dá)式子P(|t|≥tα)=α中tα與α之間的關(guān)系,由α查找tα。如圖,有P(|t|≥tα)=P(t≤-tα+t≥tα)
=P(t≤-tα)+P(t≥tα)
查t表時所用參數(shù)為自由度df。-tα0tαt
目前四十一頁\總數(shù)一百一十一頁\編于十點(diǎn)例如,當(dāng)df=3時,查附表3得兩尾概率為0.05的臨界t值為t0.05,3=3.182。這表明從3.182~∞的概率和從-3.182~-∞的概率各為0.025。而兩尾概率為0.01的臨界t值為t0.01,3=5.841,由此可見,df不變時,P越大,t越小;P越小,t越大。兩尾測驗(yàn),H0:μ=μ0t≥tα(df),否定H0,反之接受H0。一尾測驗(yàn),H0:μ≤μ0t≥t2α(df),否定H0,反之接受H0。若H0:μ≥μ0t≤-t2α(df),否定H0,反之接受H0。這種用t分布計算所作假設(shè)的概率,進(jìn)行的假設(shè)測驗(yàn)叫t測驗(yàn)(t-test)目前四十二頁\總數(shù)一百一十一頁\編于十點(diǎn)0f(t)t-tα(df)=
-3.182tα(df)=3.182∞-∞df=30.0250.025t分布的兩尾測驗(yàn)和一尾測驗(yàn)臨界t值t2α(df)=2.353-t2α(df)=-2.353目前四十三頁\總數(shù)一百一十一頁\編于十點(diǎn)應(yīng)用條件:
總體參數(shù)μ0和σ2為已知或未知,樣本平均數(shù)來自小樣本(n<30)。二、單個平均數(shù)t檢驗(yàn)
目前四十四頁\總數(shù)一百一十一頁\編于十點(diǎn)方法步驟
[例2]種在受污染地區(qū)小麥千粒重平均為36.0g,隨機(jī)抽取未受污染地區(qū)10個點(diǎn)小麥千粒重為38.0、37.0、39.0、38.0、39.0、38.0、39.0、36.0、38.0、37.0g,問污染與無污染地區(qū)小麥千粒重有無顯著差異。二、單個平均數(shù)t檢驗(yàn)
目前四十五頁\總數(shù)一百一十一頁\編于十點(diǎn)方法步驟
第一步建立假設(shè)H0:μ=μ0(36.0g)HA:μ≠μ0
第二步確定顯著水準(zhǔn)α=0.05、0.01(兩尾)二、單個平均數(shù)t檢驗(yàn)
目前四十六頁\總數(shù)一百一十一頁\編于十點(diǎn)第三步計算統(tǒng)計量t值和自由度dfdf=n-1=10-1=9二、單個平均數(shù)t檢驗(yàn)
方法步驟
目前四十七頁\總數(shù)一百一十一頁\編于十點(diǎn)第四步查表找臨界t值tα,并作統(tǒng)計推斷:查表3得t0.05(9)=2.262,t0.01(9)=3.250∵|t|=6.05>t0.01(9)=3.250∴否定H0,認(rèn)為差異極顯著,即受污染地區(qū)極顯著地影響了小麥千粒重。二、單個平均數(shù)t檢驗(yàn)
目前四十八頁\總數(shù)一百一十一頁\編于十點(diǎn)
單個平均數(shù)的統(tǒng)計假設(shè)檢驗(yàn)
U檢驗(yàn)
t檢驗(yàn)適用情況正態(tài)分布或已知σ
或n≥30σ未知,n<30檢驗(yàn)方式兩尾檢驗(yàn)一尾檢驗(yàn)兩尾檢驗(yàn)一尾檢驗(yàn)
統(tǒng)計假設(shè)H0
μ=μ0μ=μ0μ=μ0μ=μ0HAμ≠μ0μ>μ0或μ<μ0μ≠μ0μ>μ0或μ<μ0檢驗(yàn)統(tǒng)計量
檢驗(yàn)臨界值C
UαU0.05=1.96U0.01=2.58
U2αU0.1=1.64U0.02=2.32tα(n-1)
t2α(n-1)統(tǒng)計推斷否定H0
U≥C
t≥C接受H0
U≤C
t≤C目前四十九頁\總數(shù)一百一十一頁\編于十點(diǎn)第三節(jié)兩個平均數(shù)相比較的假設(shè)檢驗(yàn)由||推斷μ1-μ2=0?目前五十頁\總數(shù)一百一十一頁\編于十點(diǎn)一成組數(shù)據(jù)的平均數(shù)比較成組數(shù)據(jù)其中n1、n2可等可不等。甲乙將試驗(yàn)單位完全隨機(jī)分為兩組,再隨機(jī)各實(shí)施一處理,這樣得到的數(shù)據(jù)稱為成組數(shù)據(jù),以組的平均數(shù)作為比較的標(biāo)準(zhǔn)。目前五十一頁\總數(shù)一百一十一頁\編于十點(diǎn)(一)u檢驗(yàn)1、應(yīng)用條件
兩個樣本總體方差σ12和σ22已知,總體方差未知,但n1≥30、n2≥30一般情況下,兩個總體的方差是未知的,因此這里著重討論兩個大樣本的比較。目前五十二頁\總數(shù)一百一十一頁\編于十點(diǎn)2、方法步驟假定甲、乙兩總體所屬的總體平均數(shù)分別為μ1和μ2,分別從甲、乙兩總體各隨機(jī)抽取一個大樣本,其中:
樣本I;
S1
n1
樣本Ⅱ:
S2
n2(一)u檢驗(yàn)?zāi)壳拔迨揬總數(shù)一百一十一頁\編于十點(diǎn)統(tǒng)計假設(shè)
H0:μ1=μ2,HA:μ1≠μ2計算樣平均數(shù)差數(shù)標(biāo)準(zhǔn)誤和u值
在無效假設(shè)H0:μ1=μ2時,μ1-μ2=0,故上式為:根據(jù)u值的大小推斷差異顯著性。目前五十四頁\總數(shù)一百一十一頁\編于十點(diǎn)[例3]不同季度監(jiān)測某工廠排污水中某污染物含量(mg/L)。結(jié)果列于表,試檢驗(yàn)兩個季度排污水中污染物含量有無顯著差異?季度污染物含量(mg/L)一季度3184713846465444882181624557623937692153445361457235627042883774428747466554285863546259305329627853二季度3144652240535450344946484931236958424424513243332549476636363433416238384066477124532025314160325638目前五十五頁\總數(shù)一百一十一頁\編于十點(diǎn)統(tǒng)計假設(shè)
H:μ1=μ2,HA:μ1≠μ2計算各樣本平均數(shù),方差S2,樣本平均數(shù)差數(shù)標(biāo)準(zhǔn)誤和u值
目前五十六頁\總數(shù)一百一十一頁\編于十點(diǎn)統(tǒng)計推斷
u>u0.01=2.58,差異極顯著,表明第一季度排污水中污染物含量極顯著高于第二季度。目前五十七頁\總數(shù)一百一十一頁\編于十點(diǎn)(二)t檢驗(yàn)1、應(yīng)用條件
兩個樣本總體方差σ12和σ22未知,但兩個樣本所在總體都服從正態(tài)分布,并且
目前五十八頁\總數(shù)一百一十一頁\編于十點(diǎn)可證:在滿足上述條件時,H0:下,有~t(n1+n2-2)具有自由度df=n1+n2-2其中差異標(biāo)準(zhǔn)誤(二)t檢驗(yàn)2、方法步驟目前五十九頁\總數(shù)一百一十一頁\編于十點(diǎn)(二)t檢驗(yàn)?zāi)壳傲揬總數(shù)一百一十一頁\編于十點(diǎn)[例4]對某地污灌區(qū)和非污灌區(qū)水稻產(chǎn)量進(jìn)行調(diào)查,各測定5個點(diǎn),每個點(diǎn)30m2,結(jié)果見表,試檢驗(yàn)污灌區(qū)和非污灌區(qū)水稻產(chǎn)量有無顯著差異?ni污灌區(qū)非污灌區(qū)161.03721.0065.04225.00261.53782.2566.74448.89362.33881.2966.34395.69462.53906.2567.14502.41563.13981.6167.84596.84∑310.419272.40332.922168.8362.0866.58目前六十一頁\總數(shù)一百一十一頁\編于十點(diǎn)解:第一步建立假設(shè)H0:μ1=μ2(兩種灌區(qū)的水稻產(chǎn)量無顯著差異)
HA:μ1
≠μ2
第二步確定顯著水準(zhǔn)α=0.05、0.01(兩尾)
目前六十二頁\總數(shù)一百一十一頁\編于十點(diǎn)第三步計算統(tǒng)計量t值和自由度dfdf=n1+n2-2
=5+5-2=8目前六十三頁\總數(shù)一百一十一頁\編于十點(diǎn)第四步查表找臨界t值tα,并作統(tǒng)計推斷:查表3得,t0.05(8)=2.306
t0.01(8)=3.55∵|t|=7.544>t0.01(8)=3.55,∴否定H0,差異極顯著,表明污灌區(qū)由于有毒物質(zhì)危害,其水稻產(chǎn)量極顯著地低于污灌區(qū)。目前六十四頁\總數(shù)一百一十一頁\編于十點(diǎn)(二)近似t檢驗(yàn)
1、應(yīng)用條件
兩個樣本總體方差σ12和σ22未知,并且
目前六十五頁\總數(shù)一百一十一頁\編于十點(diǎn)當(dāng),,則此時的不再準(zhǔn)確地服從t分布。因此Cochran和Con提出近似t測驗(yàn)法,用t′與t′α相比較,(二)近似t檢驗(yàn)
目前六十六頁\總數(shù)一百一十一頁\編于十點(diǎn)在進(jìn)行檢驗(yàn)時,如果兩個樣本的樣本容量相等,即n1=n2=n,可直接取df=n-1進(jìn)行檢驗(yàn);如果n1≠n2,則需采用轉(zhuǎn)換自由度的方法進(jìn)行,即先計算k值和(二)近似t檢驗(yàn)
目前六十七頁\總數(shù)一百一十一頁\編于十點(diǎn)[例5]調(diào)查某地受某重金屬污染區(qū)5個點(diǎn)的水稻產(chǎn)量,非污染區(qū)10個點(diǎn)的水稻產(chǎn)量,試檢驗(yàn)兩者有無顯著差異?(二)近似t檢驗(yàn)
統(tǒng)計假設(shè):H0:μ1=μ2,HA:μ1≠μ2目前六十八頁\總數(shù)一百一十一頁\編于十點(diǎn)計算K及df′:計算平均數(shù)差數(shù)標(biāo)準(zhǔn)誤及統(tǒng)計推斷:由df′=9查t值表得t0.01=3.25,>t0.01=3.25,差異極顯著,表明重金屬污染造成水稻嚴(yán)重減產(chǎn)。目前六十九頁\總數(shù)一百一十一頁\編于十點(diǎn)二成對數(shù)據(jù)的平均數(shù)比較當(dāng)試驗(yàn)單元間差異較大,用完全隨機(jī)試驗(yàn)將對試驗(yàn)指標(biāo)有明顯影響。可把條件一致的兩個供試單元配成一對,并設(shè)多個配對,再對每一配對兩個單元隨機(jī)獨(dú)立實(shí)施一處理,這就是配對試驗(yàn),實(shí)為處理數(shù)為2的隨機(jī)區(qū)組試驗(yàn),這樣得到的數(shù)據(jù)稱為成對數(shù)據(jù)。目前七十頁\總數(shù)一百一十一頁\編于十點(diǎn)配對設(shè)計試驗(yàn)資料的一般形式
例如,①半葉法試驗(yàn)資料②不同土層養(yǎng)分測定資料③同一供試單元上④單因素兩水平隨機(jī)區(qū)組作處理前后的對試驗(yàn)資料比資料樣號處理12…N甲x11x12…x1n乙x21x22…x2nd=x1-x2d1d2…dn
=-目前七十一頁\總數(shù)一百一十一頁\編于十點(diǎn)二成對數(shù)據(jù)的平均數(shù)比較方法步驟:
(一)提出無效假設(shè)與備擇假設(shè)
其中為兩樣本配對數(shù)據(jù)差值d總體平均數(shù),它等于兩樣本所屬總體平均數(shù)與之差,即
。所設(shè)無效假設(shè)、備擇假設(shè)相當(dāng)于
目前七十二頁\總數(shù)一百一十一頁\編于十點(diǎn)二成對數(shù)據(jù)的平均數(shù)比較方法步驟:(二)計算t值式中,為差數(shù)標(biāo)準(zhǔn)誤,計算公式為:d為兩樣本各對數(shù)據(jù)之差
Sd為d的標(biāo)準(zhǔn)差;n為配對的對子數(shù),即試驗(yàn)的重復(fù)數(shù)。
目前七十三頁\總數(shù)一百一十一頁\編于十點(diǎn)(三)查臨界t值,作出統(tǒng)計推斷
根據(jù)df=n-1查臨界t值:t0.05(n-1)和t0.01(n-1),將計算所得t值的絕對值與其比較,作出推斷。
二成對數(shù)據(jù)的平均數(shù)比較方法步驟:目前七十四頁\總數(shù)一百一十一頁\編于十點(diǎn)[例6]某地在同一地點(diǎn)采集不同土壤深度的土樣,共采10個點(diǎn),分別測定鎘含量,測定結(jié)果見表。試檢驗(yàn)不同深度土壤中鎘元素垂直分布有無顯著差異?鎘含量d1=x11-x120~20cmx120~40cmx210.280.36-0.060.006420.320.260.060.003630.270.24-0.020.000440.340.310.030.000950.290.32-0.030.000960.290.31-0.040.001670.330.320.010.000180.310.300.010.000190.290.34-0.050.0025100.280.2800∑-0.110.0165-0.011目前七十五頁\總數(shù)一百一十一頁\編于十點(diǎn)
1、提出無效假設(shè)與備擇假設(shè)
,即假定不同深度土壤中鎘含量無差異
,即假定有不同深度土壤中鎘含量差異
目前七十六頁\總數(shù)一百一十一頁\編于十點(diǎn)
2、計算t值目前七十七頁\總數(shù)一百一十一頁\編于十點(diǎn)
3、查臨界t值,作出統(tǒng)計推斷由df=9,查t值表得:t0.05(9)=2.262,因?yàn)閨t|<t0.05(9),接受,表明表明0-20cm與20-40cm兩層土壤鎘含量無顯著差異。目前七十八頁\總數(shù)一百一十一頁\編于十點(diǎn)
成對數(shù)據(jù)的比較是假定各個配對的差數(shù)的分布為正態(tài)分布,具有N(0,2);而每一配對的兩個供試單位是彼此相關(guān)的。
成組數(shù)據(jù)的比較是假定兩個樣本皆來自于各自的正態(tài)總體,兩個樣本的各個供試單位都是彼此獨(dú)立的,兩個樣本平均數(shù)的差數(shù)服從平均數(shù)為(1-2),方差為的正態(tài)分布。目前七十九頁\總數(shù)一百一十一頁\編于十點(diǎn)
成對數(shù)據(jù)由于加強(qiáng)了試驗(yàn)控制,使其可比性提高,因而提高了試驗(yàn)精確度。
成對比較不受兩樣本的總體方差的干擾,分析時不需考慮是否相等的問題,但成組數(shù)據(jù)要考慮是否相等的問題。目前八十頁\總數(shù)一百一十一頁\編于十點(diǎn)第四節(jié)百分?jǐn)?shù)的假設(shè)檢驗(yàn)
在第四章介紹二項(xiàng)分布時曾指出:由具有兩個屬性類別的質(zhì)量性狀利用統(tǒng)計次數(shù)法得來的次數(shù)資料進(jìn)而計算出的百分?jǐn)?shù)資料,如成活率、死亡率、孵化率、感染率、陽性率等是服從二項(xiàng)分布的。這類百分?jǐn)?shù)的假設(shè)檢驗(yàn)應(yīng)按二項(xiàng)分布進(jìn)行。即從二項(xiàng)式(p+q)n的展開式中求出某項(xiàng)屬性個體的百分?jǐn)?shù)的概率,然后根據(jù)概率的大小作出推斷。
目前八十一頁\總數(shù)一百一十一頁\編于十點(diǎn)第四節(jié)百分?jǐn)?shù)的假設(shè)檢驗(yàn)但是,當(dāng)樣本容量n較大,P不過分小,np和nq又均不小于5時,二項(xiàng)分布接近正態(tài)分布,因而可將百分?jǐn)?shù)資料作正態(tài)分布處理,從而作出近似的測驗(yàn)。目前八十二頁\總數(shù)一百一十一頁\編于十點(diǎn)np,nq小于5時,通過二項(xiàng)展開式計算概率;
np,nq大于5,小于30時,可以進(jìn)行u測驗(yàn),但要作連續(xù)性矯正;
np,nq大于30時,可進(jìn)行u測驗(yàn),無需作連續(xù)矯正。目前八十三頁\總數(shù)一百一十一頁\編于十點(diǎn)一、單個樣本百分?jǐn)?shù)的假設(shè)檢驗(yàn)需要檢驗(yàn)一個服從二項(xiàng)分布的樣本百分?jǐn)?shù)與已知的二項(xiàng)總體百分?jǐn)?shù)差異是否顯著,其目的在于檢驗(yàn)一個樣本百分?jǐn)?shù)所在二項(xiàng)總體百分?jǐn)?shù)p是否與已知二項(xiàng)總體百分?jǐn)?shù)p0相同,換句話說,檢驗(yàn)該樣本百分?jǐn)?shù)是否來自總體百分?jǐn)?shù)為p0的二項(xiàng)總體。目前八十四頁\總數(shù)一百一十一頁\編于十點(diǎn)方法步驟:(一)提出無效假設(shè)與備擇假設(shè)(二)計算u值或uc對于二項(xiàng)成數(shù)總體平均數(shù)總體方差總體標(biāo)準(zhǔn)差目前八十五頁\總數(shù)一百一十一頁\編于十點(diǎn)當(dāng)n→∞,p不是很小,np、nq>5時,二項(xiàng)分布→正態(tài)分布。此時有~N(,)。標(biāo)準(zhǔn)化后有~N(0,12)其中——差異標(biāo)準(zhǔn)誤。
在H0:p=p0下,~N(0,12)應(yīng)用條件:n>30,np、nq>5目前八十六頁\總數(shù)一百一十一頁\編于十點(diǎn)如果np或nq小于30,需進(jìn)行連續(xù)性矯正。經(jīng)矯正的正態(tài)離差用uc表示:目前八十七頁\總數(shù)一百一十一頁\編于十點(diǎn)
若(或)<1.96,接受,表明樣本百分?jǐn)?shù)與總體百分?jǐn)?shù)差異不顯著;若,否定,接受,表明樣本百分?jǐn)?shù)與總體百分?jǐn)?shù)PO差異顯著;
若,否定,接受,表明樣本百分?jǐn)?shù)與總體百分?jǐn)?shù)PO差異極顯著。方法步驟:(三)將計算所得的u或uc的絕對值與1.96、2.58比較,作出統(tǒng)計推斷
目前八十八頁\總數(shù)一百一十一頁\編于十點(diǎn)
[例7]
按規(guī)定,某工廠排污水中含某種污染物的超標(biāo)率應(yīng)低于8%(P)時即為合格,現(xiàn)采樣210次,超標(biāo)23次,問抽樣結(jié)果與超標(biāo)率低于8%有無顯著差別?1、提出無效假設(shè)與備擇假設(shè)
H0:P=P0=0.08,HA:P≠P02、計算u值目前八十九頁\總數(shù)一百一十一頁\編于十點(diǎn)3、作出統(tǒng)計推斷因?yàn)?,接受H0,差異不顯著,表明抽樣結(jié)果與超標(biāo)率低于8%,無顯著差別。目前九十頁\總數(shù)一百一十一頁\編于十點(diǎn)檢驗(yàn)服從二項(xiàng)分布的兩個樣本百分?jǐn)?shù)差異是否顯著。其目的在于檢驗(yàn)兩個樣本百分?jǐn)?shù)、所在的兩個二項(xiàng)總體百分?jǐn)?shù)P1、P2是否相同。當(dāng)兩樣本的np、nq均大于5時,可以近似地采用u檢驗(yàn)法進(jìn)行檢驗(yàn),但在np和(或)nq小于或等于30時,需作連續(xù)性矯正。檢驗(yàn)的基本步驟是:二、兩個樣本百分?jǐn)?shù)的假設(shè)檢驗(yàn)?zāi)壳熬攀豁揬總數(shù)一百一十一頁\編于十點(diǎn)二、兩個樣本百分?jǐn)?shù)的假設(shè)檢驗(yàn)(一)提出無效假設(shè)與備擇假設(shè)目前九十二頁\總數(shù)一百一十一頁\編于十點(diǎn)二、兩個樣本百分?jǐn)?shù)的假設(shè)檢驗(yàn)(二)計算u值或uc值其中,為兩個樣本百分?jǐn)?shù),為樣本百分?jǐn)?shù)差異標(biāo)準(zhǔn)誤為合并樣本百分?jǐn)?shù):目前九十三頁\總數(shù)一百一十一頁\編于十點(diǎn)(三)將u或uc的絕對值與1.96、2.58比較,作出統(tǒng)計推斷二、兩個樣本百分?jǐn)?shù)的假設(shè)檢驗(yàn)若(或)<1.96,p>0.05,接受,表明兩個樣本百分?jǐn)?shù)、差異不顯著;
若(或)<2.58,0.01<p≤0.05,否定,接受,表明兩個樣本百分?jǐn)?shù)、差異顯著;
若(或)>2.58,p≤0.01,否定,接受,表明兩個樣本百分?jǐn)?shù)、差異極顯著;目前九十四頁\總數(shù)一百一十一頁\編于十點(diǎn)[例5.4.2]調(diào)查高肥力地某小麥品種251株(n1),發(fā)現(xiàn)感白粉病的238株(x1),感病率為0.948(238/251),同時調(diào)查了中肥力地該品種324株(n2),感白粉病的有268株(x2),感病率為0.827(268/324),試檢驗(yàn)該小麥品種在高、中肥力地種植,感病率差異是否顯著?目前九十五頁\總數(shù)一百一十一頁\編于十點(diǎn)
本例為服從二項(xiàng)分布的百分率資料,樣本容量較大,n1
=251,n2
=324,且即、、、均大于5,并且大于30,可利用u檢驗(yàn)法,不需作連續(xù)矯正。目前九十六頁\總數(shù)一百一十一頁\編于十點(diǎn)第一步
建立假設(shè)H0:p1=p2(兩種肥力上的小麥的感白粉病無顯著差異)
HA:p1≠p2第二步確定顯著水準(zhǔn)α=0.05、0.01(兩尾)目前九十七頁\總數(shù)一百一十一頁\編于十點(diǎn)第三步計算統(tǒng)計量u值
目前九十八頁\總
溫馨提示
- 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
- 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
- 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
- 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負(fù)責(zé)。
- 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請與我們聯(lián)系,我們立即糾正。
- 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時也不承擔(dān)用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。
最新文檔
- 新蘇教版小學(xué)六年級科學(xué)上冊教學(xué)計劃
- 好人主義的整改措施
- 防火窗施工方案范文
- 聯(lián)席會議與決策管理制度
- 九、季節(jié)性施工措施特殊情況下的施工措施
- 2025年下學(xué)校工作計劃
- 雨季施工措施
- 2025疫情期間幼兒園大班秋期保育員工作計劃
- 村衛(wèi)生室基本公共衛(wèi)生服務(wù)工作計劃
- 讓我如此美麗半命題作文及范文
- 美的供應(yīng)鏈變革及智慧采購解決方案
- 高低壓電力系統(tǒng)預(yù)試驗(yàn)及維保服務(wù)方案
- 教師教育技能培訓(xùn)(3篇模板)
- 代發(fā)工資委托書格式樣本
- YBT 6246-2024《核電工程用熱軋帶肋鋼筋》
- 管桁架焊接 (1)講解
- 大學(xué)助農(nóng)直播創(chuàng)業(yè)計劃書
- 心理健康教育國內(nèi)外研究現(xiàn)狀
- 燃?xì)饨?jīng)營安全重大隱患判定標(biāo)準(zhǔn)課件
- 《經(jīng)濟(jì)學(xué)原理》題庫(含參考答案)
- 廣州社會保險退款申請表
評論
0/150
提交評論