田間試驗與統(tǒng)計方法-第五章假設(shè)檢驗_第1頁
田間試驗與統(tǒng)計方法-第五章假設(shè)檢驗_第2頁
田間試驗與統(tǒng)計方法-第五章假設(shè)檢驗_第3頁
田間試驗與統(tǒng)計方法-第五章假設(shè)檢驗_第4頁
田間試驗與統(tǒng)計方法-第五章假設(shè)檢驗_第5頁
已閱讀5頁,還剩45頁未讀, 繼續(xù)免費閱讀

下載本文檔

版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進行舉報或認領(lǐng)

文檔簡介

第五章假設(shè)檢驗概述總體與樣本之間的關(guān)系包括兩個方面:從總體到樣本的探討;由樣本推斷總體,它是以各種樣本統(tǒng)計量的抽樣分布為基礎(chǔ)的,一般是正態(tài)分布、t分布、χ2分布和F分布。對總體做統(tǒng)計推斷有兩種途徑,在實際應(yīng)用時可相互參照運用首先對所估計的總體做一假設(shè),然后通過樣本數(shù)據(jù)推斷這個假設(shè)是否接受,這種途徑稱為統(tǒng)計假設(shè)檢驗(statisticaltestofhypothesis);通過樣本統(tǒng)計量估計總體參數(shù),稱為總體參數(shù)估計(estimationofpopulationparameter)??傮w樣本統(tǒng)計量(X)估計&檢驗總體抽樣樣本(實驗結(jié)果)檢驗(抽樣分布規(guī)律)接受拒絕小概率事件未發(fā)生小概率事件發(fā)生某種假設(shè)統(tǒng)計假設(shè)檢驗圖解備擇假設(shè):≠10.00g總體(零假設(shè))Mean

X=10.23隨機樣本拒絕零假設(shè)!

接受備擇!5.1單個樣本的統(tǒng)計假設(shè)檢驗5.1.1一般原理及兩種類型的錯誤基本思想抽樣分布假設(shè)零假設(shè):記為H0,假設(shè)總體的平均數(shù)μ等于某一給定的值μ0,即μ-μ0=0,記為H0:μ-μ0=0(零假設(shè)是針對試驗考查的內(nèi)容提出的)備擇假設(shè):與零假設(shè)相對的假設(shè)記為HA它是在拒絕H0的狀況下,可供選擇的假設(shè)如HA:μ>μ0,HA:μ<μo及HA:μ≠μ0。備擇假設(shè)的選定視實際狀況而定。

小概率原理小概率的事務(wù)是指在一次試驗中,幾乎是不會發(fā)生的,若依據(jù)確定的假設(shè)條件計算出來的該事務(wù)發(fā)生的概率很小,而在一次試驗中它竟然發(fā)生了,則可認為原假設(shè)條件不正確,賜予否定。依據(jù)小概率原理所建立起來的檢驗方法稱為顯著性檢驗。在生物統(tǒng)計工作中,通常規(guī)定0.05或0.01以下為小概率,稱為顯著性水平,記為“α”。檢驗統(tǒng)計量:utχ2F等單側(cè)檢驗(one-sidedtest)上尾檢驗:拒絕H0后,接受μ>μ0,如左圖。下尾檢驗:拒絕H0后,接受μ<μ0,如右圖。樣本統(tǒng)計量樣本統(tǒng)計量樣本統(tǒng)計量臨界值雙側(cè)檢驗在生物學(xué)問題中,有時只要考慮μ是否等于μ0,并不關(guān)切原委是大于還是小于μ0,這時就要運用雙側(cè)檢驗。在α水平上,H0的拒絕域由P(∣U∣>uα/2)=α確定。拒絕域包括大于uα/2或小于-uα/2的區(qū)域,這兩個尾區(qū)的曲線下面積之和為α。由于單側(cè)檢驗時利用了已知有一側(cè)是不行能的這一條件,從而提高了它的辨別力,所以單側(cè)檢驗比雙側(cè)檢驗的辨別力更強些。實際應(yīng)用時,要盡量選用單側(cè)檢驗,但也要依據(jù)實際狀況而定。兩種類型的錯誤Ⅰ型錯誤:假設(shè)是正確的,卻錯誤地拒絕了它。犯Ⅰ型錯誤的概率不會大于α。(以真為假——棄真錯誤)Ⅱ型錯誤:當(dāng)μ≠μ0但錯誤地接受了μ=μ0的假設(shè)時所犯的錯誤,其慨率為β稱β錯誤。(以假為真——存?zhèn)五e誤)關(guān)于兩種類型錯誤的三點說明為了同時降低α和β就需增加樣本含量,當(dāng)樣本含量增加后,樣本標(biāo)準誤降低,曲線就會變得陡峭,則犯兩種錯誤的概率都會降低。樣本含量不變時,你不能同時削減兩類錯誤!當(dāng)μ1越接近于μ0時,犯Ⅱ型錯誤的概率愈大;當(dāng)μ1越遠離μ0時,犯Ⅱ型錯誤的概率愈小。在樣本含量和樣本平均數(shù)都固定時,為了降低犯Ⅰ型錯誤的概率α(就應(yīng)將圖中的豎線右移),必定增加犯Ⅱ型錯誤的概率。假設(shè)測驗基本程序

1、對樣本所屬的總體提出一個假設(shè),H0或者HA2、規(guī)定測驗的顯著水平α值3、在Ho為正確的假設(shè)下,依據(jù)平均數(shù)或其它統(tǒng)計數(shù)的抽樣分布,計算統(tǒng)計數(shù)的概率?;蛞罁?jù)已規(guī)定的概率,劃出兩個否定區(qū)域。4.將規(guī)定的α值和算得的概率相比較,或者將試驗結(jié)果和否定區(qū)域相比較,從而作出接受或否定的假設(shè)5.1.2單個樣本顯著性檢驗的程序假設(shè)零假設(shè):依據(jù)閱歷或試驗結(jié)果;依據(jù)某種理論或模型;依據(jù)預(yù)先的規(guī)定。備擇假設(shè):除零假設(shè)以外的值;擔(dān)憂會出現(xiàn)的值;希望會出現(xiàn)的值;有重要意義或其他意義的值。顯著性水平α=0.10試驗條件下不易限制或易產(chǎn)生較大誤差α=0.05α=0.01簡潔產(chǎn)生嚴峻后果的一些試驗,如藥物的毒性試驗兩種類型的錯誤α不宜定得太嚴,太嚴會增加β。在條件許可的狀況下盡量增加樣本含量n確定檢驗方法:u檢驗、t檢驗、X2檢驗、F檢驗等。建立在α水平上的Ho的拒絕域(留意單側(cè)或雙側(cè))

(一)在σ已知的狀況下,單個平均數(shù)的顯著性檢驗——u檢驗1、假設(shè)從σ已知的正態(tài)或近似正態(tài)總體中抽出含量為n的樣本。2、零假設(shè)H0:μ=μ0備擇假設(shè)HA:①μ>μ0②μ<μ0③μ≠μ03、顯著性水平在α=0.05水平上拒絕H0稱為差異顯著在α=0.01水平上拒絕H0稱為差異極顯著4、檢驗統(tǒng)計量5、相應(yīng)于2中各備擇假設(shè)之H0的拒絕域①u>uα②u<-uα③|u|>uα/26、得出結(jié)論并賜予說明例已知豌豆籽粒重量聽從正態(tài)分布N(377.2,3.32)在改善栽培條件后,隨機抽取9粒,其籽粒平均重為379.2,若標(biāo)準差仍為3.3,問改善栽培條件是否顯著提高了豌豆籽粒重量?解①已知豌豆的重量聽從正態(tài)分布,σ已知②假設(shè):H0:μ=377.2HA:μ>377.2③顯著性水平:α=0.05④σ已知,運用u檢驗⑤H0的拒絕域:因HA:μ>μ0,故為上尾檢驗。u0.05=1.645,u>u0.05,拒絕H0。⑥結(jié)論:u>u0.05,即P<0.05,所以拒絕零假設(shè)。栽培條件的改善,顯著地提高了豌豆籽粒重量。(二)σ未知時平均數(shù)的顯著性檢驗——t檢驗1、假設(shè)從σ未知的正態(tài)或近似正態(tài)總體中抽出含量為n的樣本。2、零假設(shè):H0:μ=μ0備擇假設(shè):HA:①μ>μ0②μ<μ0③μ≠μ03、顯著性水平:在α=0.05水平上拒絕H0稱為差異顯著在α=0.01水平上拒絕H0稱為差異極顯著4、檢驗統(tǒng)計量:當(dāng)σ未知時以s代替之,標(biāo)準化的變量稱為t,聽從n-1自由度的t分布。5、相應(yīng)于2中各備擇假設(shè)之H0的拒絕域:①t>tα②t<-tα③|t|>tα/26、得出結(jié)論并賜予說明。例已知某玉米種群的平均穗重μ0=300g。噴藥后,隨機抽取9個果穗,其穗重為:308、305、311、298、315、300、321、294、320g。問噴藥前后的果穗重差異是否顯著?解①σ未知②假設(shè):H0:μ=300HA:μ≠300藥物濃度適合時可促進生長,濃度過高反而會抑制生長,所以噴藥的效果未知,需接受雙側(cè)檢驗。③顯著性水平:α=0.05④σ未知應(yīng)運用t檢驗,已計算出=308,s=9.62⑤H0的拒絕域:因HA:μ≠μ0,故為雙側(cè)檢驗,當(dāng)|t|>t0.025時拒絕H0。t0.025=2.306。⑥結(jié)論:因|t|>t0.025,即P<0.05,所以拒絕零假設(shè)。噴藥前后果穗重的差異是顯著的。若規(guī)定α=0.01,t0.01/2=3.355,t<t0.005,因此噴藥前后果穗重的差異尚未達到“極顯著”。單個樣本的平均數(shù)的顯著性檢驗小結(jié)

單個樣本平均值的顯著性檢驗,是通過樣本值對總體做推斷,即推斷該樣本是否從零假設(shè)總體,在小概率原理的基礎(chǔ)上通過判定u

t

值是否具有顯著性差異來得出結(jié)論。5.2兩個樣本的差異顯著性檢驗

單個樣本的顯著性檢驗須要事先能夠提出合理的參數(shù)假設(shè)值和對參數(shù)有某種意義的備擇值。然而,實際工作中很難提出,故限制了實際應(yīng)用。在實際應(yīng)用時,常常選用兩個樣本,一個作為處理,一個作為比照,在這兩個樣本之間作比較,判定它們之間的差異是否用偶然性說明,若不能用偶然性說明時,則認為它們之間存在足夠顯著的差異,從而推斷這兩個樣原來自兩個不同的總體。兩個樣本平均數(shù)差異的測驗完全隨機設(shè)計(成組數(shù)據(jù))兩個不同的處理在不同的點上實施(有重復(fù)),各個點環(huán)境基本一樣。對處理平均數(shù)作誤差的測驗隨機區(qū)組設(shè)計(成對數(shù)據(jù))兩個不同的處理在不同的點上實施,各個點環(huán)境不盡一樣,但兩個處理同時出現(xiàn)在一個點上,保證了一個點的處理間,試驗環(huán)境基本一樣。所得的視察值為配對數(shù)據(jù),多個這樣的成對數(shù)據(jù)(對內(nèi)條件基本一樣,對間可能有差異),可以獲得兩處理的平均數(shù),對它們進行誤差的測驗。5.2.1兩個樣本總體方差(σ2)已知時,兩個平均數(shù)間差異顯著性的檢驗-成組數(shù)據(jù)u檢驗

1、從σ1和σ2已知的正態(tài)或近似正態(tài)總體中抽出含量分別為n1和n2的樣本。2、零假設(shè)H0:μ1=μ2備擇假設(shè)HA:①μ1>μ2,若已知μ1不行能小于μ2;②μ1<μ2,若已知μ1不行能大于μ2;③μ1≠μ2,包括μ1>μ2和μ1<μ2。3、顯著性水平在α=0.05水平上拒絕H0稱為差異顯著在α=0.01水平上拒絕H0稱為差異極顯著

4、檢驗統(tǒng)計量在σi已知時兩平均數(shù)差的標(biāo)準化變量:在H0:μ1=μ2下,檢驗統(tǒng)計量為:

上式的分母稱為平均數(shù)差的標(biāo)準誤差,記為5、相應(yīng)于2中各備擇假設(shè)之H0的拒絕域①u>uα②u<-uα③|u|>uα/26、得出結(jié)論并賜予生物學(xué)說明例調(diào)查兩個不同漁場的馬面鲀體長,每一漁場調(diào)查20條。平均體長分別為:=19.8cm,=18.5cm。σ1=σ2=7.2cm。問在α=0.05水平上,第一號漁場的馬面鲀是否顯著高于其次號漁場的馬面鲀體長?解①馬面鲀體長是聽從正態(tài)分布的隨機變量,σ1和σ2已知。②假設(shè):H0:μ1=μ2HA:μ1>μ2③顯著性水平:已規(guī)定為α=0.05④統(tǒng)計量的值:

⑤建立H0的拒絕域:上尾單側(cè)檢驗,當(dāng)u>u0.05時拒絕H0。從表中查出u0.05=1.645.⑥結(jié)論:u<u0.05,即P>0.05,尚不能拒絕H0,第一號漁場馬面鲀體長并不比其次號的長。5.2.2兩個樣本總體方差未知,但可假定σ12=σ22=σ2相等,兩個樣本為小樣本時,兩平均數(shù)間差異顯著性檢驗-成組數(shù)據(jù)t檢驗

5.2.3兩個樣本總體方差未知,且可能不相等時,兩個平均數(shù)間差異顯著性的檢驗-用近似t檢驗

5.2.4成對數(shù)據(jù)的顯著性檢驗-成對數(shù)據(jù)t檢驗

建立無效假設(shè)和備擇假設(shè)Ho:μ1=μ2HA:μ1≠μ2確定假設(shè)測驗的顯著水平α=0.05計算統(tǒng)計數(shù)(處理均數(shù)間差異)系隨機誤差所致的概率統(tǒng)計推斷

數(shù)

據(jù)

統(tǒng)

兩肥料試驗結(jié)果表

──────────試驗點X1X2d──────────1680820602950920303840880-404940870705780810-306880820607920880408810780309940890501078076020──────────

X1、X2為兩不同肥料d=X1-X2──────────

計算各差數(shù):

d1=880-820=60d2=950-920=30……d10=780-760=20計算差數(shù)的平均數(shù)計算差數(shù)平均數(shù)的標(biāo)準誤計算t值:

查表得該t值的概率范圍

配對法與成組法的比較配對法比成組法更簡潔檢出兩組數(shù)據(jù)平均數(shù)之間的差異。平均數(shù)及樣本含量均相同的條件下,s愈小則t值愈大,從而拒絕H0的可能性越大(即差異顯著)。而配對法比成組法的樣本方差小,所以配對法比成組法更簡潔檢出兩組數(shù)據(jù)平均數(shù)之間的差異。用配對法比較時,可解除數(shù)據(jù)之間可能存在的相關(guān),提高檢驗的實力,從而達到事半功倍的效果。5.2.5二項分布數(shù)據(jù)的顯著性檢驗——u檢驗在生物學(xué)探討中,有很多試驗或結(jié)果是用頻率(或百分數(shù))表示的,呈二項分布的試驗結(jié)果就是如此。如,卵的孵化率、動物幼體的死亡率、某藥物對某動物的急性致死率等。對二項分布數(shù)據(jù)的顯著性檢驗類似對平均數(shù)的檢驗(此檢驗方法的理論依據(jù):當(dāng)n很大時,二項分布近似正態(tài)分布)單樣本頻率的假設(shè)檢驗當(dāng)np或nq<10時,由二項式綻開式干脆檢驗當(dāng)np或nq>10時,二項分布趨近正態(tài),可用u檢驗。樣本頻率的標(biāo)準誤:u值的計算公式:(需進行連續(xù)性矯正。因二項分布的數(shù)據(jù)為離散型,用正態(tài)分布計算二項分布概率時應(yīng)當(dāng)計算隨機變量落在某一區(qū)間的概率。)連續(xù)性矯正后計算公式為:例:某商品鹵蟲休眠卵的保證孵化率為0.9,現(xiàn)隨機取1000粒在適宜條件下進行孵化檢驗,結(jié)果有877粒卵成功孵化,問這批休眠卵是否合格?解:H0:p=p0=0.9,HA:p<p0顯著性水平α=0.05p=877/1000=0.877當(dāng)u>u0.05時,拒絕H0;因u0.05=1.645<u,所以拒絕H0。結(jié)論:這批鹵蟲休眠卵不合格。兩個樣本頻率的假設(shè)檢驗假設(shè)有兩個二項分布總體,分別具有參數(shù)φ1和φ2,從上述總體中抽取含量為n1和n2的兩個樣本,出現(xiàn)某一類別的個體數(shù)分別為x1和x2,p1=x1/n1,p2=x2/n2,推斷p1和p2之間的差異顯著與否?(要求:)檢驗步驟:1、零假設(shè):H0:φ1=φ2備擇假設(shè):HA:φ1>φ2;φ1<φ2φ1≠φ22、顯著性水平:α=0.053、檢驗統(tǒng)計量:其中,φ以p1和p2的加權(quán)平均數(shù)代替,則因上式的u為近似聽從標(biāo)準正態(tài)分布,需對數(shù)據(jù)做連續(xù)性矯正,因為二項分布的數(shù)據(jù)為離散型,因此用正態(tài)分布計算二項分布概率時應(yīng)當(dāng)計算隨機變量落在某一區(qū)間的概率。此區(qū)間一般接受([x1-x2]-0.5,[x1-x2]+0.5)。經(jīng)過連續(xù)性矯正后統(tǒng)計量u計算式(p80式5.19)4、建立H0的拒絕域:①u>uα②u<-uα③|u|>uα/25、得出結(jié)論并做誕生物學(xué)說明。例調(diào)查了280名中學(xué)生發(fā)覺有140名學(xué)生睡眠不足,在減輕學(xué)生作業(yè)負擔(dān)后,調(diào)查120學(xué)生仍有40名睡眠不足,問減輕學(xué)生負擔(dān)的效果是否顯著?解:H0:φ1=φ2,HA:φ1>φ2

代入式5.19

查表u0.05=1.645,u>u0.05落在拒絕域內(nèi)。結(jié)論:減輕學(xué)生負擔(dān)后,學(xué)生的睡眠狀況有了明顯改善。兩個樣本間差異顯著性檢驗的小結(jié)假設(shè)檢驗再相識▲顯著性檢驗;▲科研數(shù)據(jù)處理的重要工具;▲某事發(fā)生了:是由于碰巧?還是由于必定的緣由?統(tǒng)計學(xué)家運用顯著性檢驗來處理這類問題。

問題的提出由于個體差異的存在,即使從同一總體中嚴格的隨機抽樣,X1、X2、X3、X4、、、,不同。

因此X1與X2不相同有兩種可能(而且只有兩種)可能:分別所代表的總體均數(shù)相同,由于抽樣誤差造成了樣本均數(shù)的差別。差別無顯著性

。分別所代表的總體均數(shù)不同。差別有顯著性。假設(shè)檢驗的目的假設(shè)檢驗的原理/思想反證法:當(dāng)一件事情的發(fā)生只有兩種可能A和B,為了確定其中的一種狀況A,但又不能干脆證明A,這時否定另一種可能B,則間接的確定了A。概率論:事務(wù)的發(fā)生不是確定的,只是可能性大小而已。推斷是由于何種緣由造成的差異,以做出樣本推斷總體的決策。

5.3總體參數(shù)的區(qū)間估計所謂參數(shù)估計就是用樣本統(tǒng)計量來估計總體參數(shù),有點估計(pointestimation)和區(qū)間估計(intervalestimation)之分。將樣本統(tǒng)計量干脆作為總體相應(yīng)參數(shù)的估計值叫點估計。點估計只給出了未知參數(shù)估計值的大小,沒有考慮試驗誤差的影響,也沒有指出估計的牢靠程度。區(qū)間估計是在確定概率保證下指出總體參數(shù)的可能范圍,所給出的可能范圍叫置信區(qū)間(confidenceinterval),給出的概率保證稱為置信度或置信概率(confidenceprobability)。本節(jié)介紹正態(tài)總體平均數(shù)和二項總體百分數(shù)P的區(qū)間估計。一、正態(tài)總體平均數(shù)的置信區(qū)間設(shè)有一來自正態(tài)總體的樣本,包含n個觀測值,樣本平均數(shù),標(biāo)準誤??傮w平均數(shù)為μ。因為聽從自由度為n-1的t分布。雙側(cè)概率為a時,有:,也就是說t在區(qū)間內(nèi)取值的可能性為1-a,即:對變形得:(5-13)亦即(5-13)式稱為總體平均數(shù)μ置信度為1-a的置信區(qū)間。其中稱為置信半徑;分別稱為置信下限和置信上限;置信上、下限之差稱為置信距,置信距越小,估計的精確度就越高。常用的置信度為95%和99%,故由(5-13)式可得總體平均數(shù)μ的95%和99%的置信區(qū)間如下:(5-14)

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負責(zé)。
  • 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔(dān)用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

評論

0/150

提交評論