【生物課件】高級生物統(tǒng)計-基本知識_第1頁
【生物課件】高級生物統(tǒng)計-基本知識_第2頁
【生物課件】高級生物統(tǒng)計-基本知識_第3頁
【生物課件】高級生物統(tǒng)計-基本知識_第4頁
【生物課件】高級生物統(tǒng)計-基本知識_第5頁
已閱讀5頁,還剩170頁未讀, 繼續(xù)免費閱讀

下載本文檔

版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進行舉報或認領(lǐng)

文檔簡介

高級生物統(tǒng)計學(xué)第三章多年多點試驗結(jié)果的聯(lián)合分析第一章單個自由度比較分析第二章裂區(qū)試驗設(shè)計及其統(tǒng)計分析第四章曲線回歸分析第五章多元回歸分析第六章協(xié)方差分析第七章一次回歸正交設(shè)計及其統(tǒng)計分析生物統(tǒng)計學(xué)基本知識回顧第八章二次回歸正交設(shè)計及其統(tǒng)計分析第九章二次旋轉(zhuǎn)設(shè)計及其統(tǒng)計分析主講教師:詹克慧碩士研究生課程基本知識回顧第三節(jié)生物統(tǒng)計學(xué)的基本方法第一節(jié)生物統(tǒng)計學(xué)的基本概念第四節(jié)農(nóng)業(yè)試驗及設(shè)計方法第二節(jié)生物統(tǒng)計學(xué)的基本原理第五節(jié)方差分析第六節(jié)

直線回歸分析生物統(tǒng)計學(xué)及其特點

生物統(tǒng)計學(xué)(BiometryorBio-statistics)是數(shù)學(xué)中的概率論與數(shù)理統(tǒng)計學(xué)在生物科學(xué)中的應(yīng)用而形成的一門系統(tǒng)性學(xué)科。統(tǒng)計學(xué)理論統(tǒng)計學(xué)即數(shù)理統(tǒng)計學(xué)應(yīng)用統(tǒng)計學(xué)社會科學(xué)領(lǐng)域的統(tǒng)計學(xué)自然科學(xué)領(lǐng)域的統(tǒng)計學(xué)1.邏輯性較強;2.假設(shè)較多,比較抽象;3.統(tǒng)計方法的分析過程復(fù)雜;4.規(guī)律性較強;5.分析方法的分析步驟不具靈活性。其特點:第一節(jié)生物統(tǒng)計學(xué)的基本概念

1.數(shù)據(jù)(data)——在科學(xué)試驗或調(diào)查過程中,對研究對象的某些特征、特性進行觀察記載得到的數(shù)字資料的總稱。數(shù)據(jù)具有變異性和趨中性。

2.變數(shù)(variable)——生物個體具有變異性的特征、特性。變數(shù)的某一具體數(shù)值稱為變量(variate)或觀測值(observedvalue)。

連續(xù)性變數(shù)(continuousvariable)是指觀測值在一定范圍內(nèi)可以取任何一個數(shù)值,這些觀測值一般是通過測量或稱量的方法獲得的。

離散性變數(shù)(discontinuousordiscretevariable)是指觀測值只能取0或正整數(shù)的變數(shù),其觀測值一般通過觀察和計數(shù)的方法獲得的。第一節(jié)生物統(tǒng)計學(xué)的基本概念3.總體(populationoruniverse)——根據(jù)研究目的而確定的,具有共同性質(zhì)的個體所組成的集團,或者說是整個研究對象中每個個體某一變數(shù)所有觀測值的總稱。5.樣本(sample)——從總體中抽出一部分有代表性的個體或觀測值。4.總體的參數(shù)或參量(parameter)——根據(jù)總體全體觀測值算出的總體特征數(shù)。常用希臘字母表示。如總體平均數(shù),方差2,標準差等。6.統(tǒng)計數(shù)或統(tǒng)計量(statastic)——根據(jù)樣本所有觀測值計算出的樣本特征數(shù)。常用英文字母表示。例如樣本平均數(shù)

,方差S2,標準差S等。第一節(jié)生物統(tǒng)計學(xué)的基本概念

算術(shù)平均數(shù):7.平均數(shù)(averageormean)是數(shù)據(jù)的代表值,表示資料中觀測值的中心位置。

中(位)數(shù)(median):

眾數(shù)(mode):

幾何平均數(shù)(geometricmean):

所有觀測值的總和除以觀測值數(shù)目所得的商。

將資料所有觀測值排序后,居于中間位置的那個觀測值的值(或,當(dāng)觀測值數(shù)目為偶數(shù)時,那兩個觀測值的和之半)。

資料中最常見的一數(shù),或次數(shù)分布表中次數(shù)最多的那組的組中值。

n個觀測值的乘積的n次方根。其中以算術(shù)平均數(shù)最為常用。第一節(jié)生物統(tǒng)計學(xué)的基本概念極差(range)—一組數(shù)據(jù)的最大值與最小值之差。

8.變異數(shù)—表示數(shù)據(jù)資料變異大小的數(shù)值。

離均差平方和簡稱平方和(sumofsquares,SS)可較好地衡量資料的變異。定義公式:計算公式:其中C為矯正數(shù),為資料中所有觀測值總和的平方除以觀測值的個數(shù)。第一節(jié)生物統(tǒng)計學(xué)的基本概念8.變異數(shù)—表示數(shù)據(jù)資料變異大小的數(shù)值。方差(variance)是平方和除以觀測值的個數(shù)??傮w方差(populationvariance):樣本方差(samplevariance):

分類資料:分類資料:第一節(jié)生物統(tǒng)計學(xué)的基本概念8.變異數(shù)—表示數(shù)據(jù)資料變異大小的數(shù)值。標準差(standarddeviation)是方差的正根值。總體標準差(PopulationSD):樣本標準差(SampleSD):變異系數(shù)(CoefficientofVariation,記為C.V.)是指資料的標準差與平均數(shù)之比。即:不可能事件自然界中每一件事物的每一種可能出現(xiàn)的情況。第二節(jié)生物統(tǒng)計學(xué)的基本原理隨機事件事件概率每一個事件出現(xiàn)的可能性。必然事件在特定情況下必定發(fā)生的事件;在特定情況下不可能發(fā)生的事件;在特定情況下可能發(fā)生也可能不發(fā)生的事件;某事件出現(xiàn)的概率用P()表示;例如P(A)、P(B)等。概率的有效范圍為0~1,即0≤P(A)≤1。必然事件記為,其概率為1,即P()=1。不可能事件記為,其概率為0,即P()=0。隨機事件的概率在0~1之間,即0<P(A)<1。1.事件(event)與概率(probability)第二節(jié)生物統(tǒng)計學(xué)的基本原理事件間的關(guān)系事件A和B至少有一件發(fā)生的事件,記為A+B。

和事件事件A和B同時發(fā)生的事件,記為AB。

積事件

互斥事件兩件不可能同時發(fā)生的事件,例如AB=。

對立事件兩件不可能同時發(fā)生,兩者中必定有一件發(fā)生的事件,例如AB=同時A+B=。事件系n個事件兩兩互斥,但其必定有一件發(fā)生,例如AiAj=同時A1+A2+…+An=。

事件的獨立性

若事件A發(fā)生與否不影響事件B發(fā)生的概率則稱事件A與事件B相互獨立。

完全事件系完全互斥事件系幾個相互有聯(lián)系的事件放在一起。各事件的和事件為必然事件的事件系,記為A1+A2+…+An=

。第二節(jié)生物統(tǒng)計學(xué)的基本原理計算事件概率的法則假定兩互斥事件A和B的概率分別為P(A)和P(B),則事件A與B的和事件的概率等于事件A的概率與事件B的概率之和。

互斥事件的加法定律可以引伸到:n個兩兩互斥的事件的概率等于這n個事件的概率之和。即:如果AB=,則P(A+B)=P(A)+P(B)。即:如果AiAj=,則P(Ai)=[P(Ai)]。第二節(jié)生物統(tǒng)計學(xué)的基本原理計算事件概率的法則

互斥事件的加法定律假定P(A)和P(B)是兩獨立事件A和B各自出現(xiàn)的概率,則事件A與B同時出現(xiàn)的概率等于事件A的概率與事件B的概率之乘積。

獨立事件的乘法定律可以引伸到:n個相互獨立的事件同時發(fā)生概率等于這n個事件各自發(fā)生的概率之乘積。即:P(AB)=P(A)P(B)。對立事件的概率若事件A的概率為,則其對立事件的概率為。

完全互斥事件系的概率之和為1。即,如果AiAj=同時A1+A2+…+An=,則P(Ai)=1。第二節(jié)生物統(tǒng)計學(xué)的基本原理2.二項分布(binomialdistribution):由對立事件構(gòu)成的總體稱為二項總體(binomialpopulation),二項總體觀測值的概率分布即為二項分布。若某事件出現(xiàn)的概率為p,其對立事件出現(xiàn)的概率為q=1-p,做n次重復(fù)獨立試驗,該事件出現(xiàn)X次的可能性(概率)有多大?現(xiàn)在是:n=2,p=3/4,q=1/4,X可以為0,1,2。P(X=0)=(1)(1/4)(1/4)=(1)(3/4)0(1/4)2=(1)p0q2-0P(X=1)=(2)(3/4)(1/4)=(2)(3/4)1(1/4)1=(2)p1q2-1P(X=2)=(1)(3/4)(3/4)=(1)(3/4)2(1/4)0=(1)p2q2-2其中系數(shù)為在n個中取X個進行組合的數(shù)目。所以,概率分布函數(shù)為:第二節(jié)生物統(tǒng)計學(xué)的基本原理比較下面兩個概率分布圖,會發(fā)現(xiàn)二項分布的形狀是由n和p兩個參數(shù)決定的。當(dāng)p=q=時,分布是對稱的;當(dāng)p≠q時,分布就不對稱;p和q差異越大,分布就越偏斜。p=0.35,q=0.65時:p=0.15,q=0.85時:第二節(jié)生物統(tǒng)計學(xué)的基本原理利用概率分布表,可以計算出隨機變量X的總體平均數(shù)和總體方差2。對數(shù)列求和得X的總體均數(shù)為:同法求得X的總體方差為:將方差開平方得X的總體標準差為:第二節(jié)生物統(tǒng)計學(xué)的基本原理于是,隨機變量X落在區(qū)間(X1,X2)內(nèi)的概率為:3.正態(tài)分布(normaldistribution)連續(xù)性變數(shù)的概率分布,其概率密度函數(shù)為:記為其中為X的平均數(shù),為X的方差。其概率分布函數(shù)為:第二節(jié)生物統(tǒng)計學(xué)的基本原理-2+2-3-++3f(x)x正態(tài)曲線的特性:⑴單峰,倒鐘狀,當(dāng)X=

時,f(x)達最大值;⑵當(dāng)X±時,f(x)0;⑶以X=為軸左右對稱;⑷曲線與橫軸間面積為1;⑸在X=

處有兩個拐點;⑹若不變,改變使曲線左右平移,形狀不變;=0時,對稱軸與縱軸重合;說明代表了數(shù)據(jù)的中心位置;⑺當(dāng)不變,改變使曲線形狀改變,對稱軸不變;當(dāng)變小時,曲線變高瘦,中部的面積變大;當(dāng)變大時,曲線變矮胖,中部的面積變?。徽f明

衡量了資料的變異程度。面積占68.27%面積占95.45%

X的某區(qū)間內(nèi)曲線與橫軸之間的面積就是隨機變量X落在該區(qū)間的概率。這部分的面積是如何計算的呢?第二節(jié)生物統(tǒng)計學(xué)的基本原理,那么將有:如果將服從

分布的隨機變量X進行變換:于是原變量X在區(qū)間(X1,X2)之間的概率就可以用u在區(qū)

間(u1,u2)之間的概率來計算。這個u稱為正態(tài)離差

u的密度函數(shù)記為:并稱為標準正態(tài)分布密度函數(shù)。相應(yīng)地記標準正態(tài)分布的概率函數(shù)為:因為X的平均數(shù)為,方差為2,所以的平均數(shù)為:方差為:統(tǒng)計學(xué)家已經(jīng)將標準正態(tài)分布的概率計算出來,我們只要學(xué)會查表就可以計算對應(yīng)于不同的u的(u)值。第二節(jié)生物統(tǒng)計學(xué)的基本原理統(tǒng)計學(xué)一個主要任務(wù)是研究總體和樣本之間的關(guān)系總體和樣本之間的關(guān)系可以從兩個方向進行研究:⑴從總體到樣本:即研究從總體中抽出的所有可能樣本的統(tǒng)計數(shù)的分布及其與原總體之間的關(guān)系。即抽樣分布的情況。⑵從樣本到總體:即研究從總體中抽出的一個隨機樣本,①用該樣本的統(tǒng)計數(shù)來估計總體的參數(shù),即參數(shù)估計;②對總體的參數(shù)作出推斷,即統(tǒng)計假設(shè)測驗。4.抽樣分布(samplingdistribution)研究樣本統(tǒng)計數(shù)的概率分布。第二節(jié)生物統(tǒng)計學(xué)的基本原理

研究樣本的方法對于比較小的總體,可以將總體中所有可能的樣本都抽出來進行研究樣本統(tǒng)計數(shù)的分布。對于較大或無限總體,可以從中抽出比較多的樣本來研究樣本統(tǒng)計數(shù)的分布。抽樣又分為復(fù)置抽樣和不復(fù)置抽樣復(fù)置抽樣

將抽得的個體放回總體繼續(xù)參加抽樣。不復(fù)置抽樣

抽得的個體不放回總體參加后續(xù)的抽樣。大數(shù)定律:對客觀事物進行足夠多地觀察,客觀事物的規(guī)律性就會充分顯現(xiàn)出來。大數(shù)定律保證了參數(shù)估計的可靠性。統(tǒng)計上

E()=,E(S2)=σ2,E(S)第二節(jié)生物統(tǒng)計學(xué)的基本原理樣本平均數(shù)的抽樣分布如果有一個總體,大小為N,平均數(shù)為,方差為2。從這總體中抽取一個大小為n的樣本,可以算出樣本平均數(shù)。這個不是常數(shù),而是一個隨機變量。因為你下次再從這總體中抽取一個大小為n的樣本,這個的值就不同了。如果N是個有限大的數(shù),將一共有m=Nn種可能的樣本。如果N是個無限大的數(shù),則m是個無限大的整數(shù)。這m個可以構(gòu)成一個總體。稱為樣本平均數(shù)的衍生總體。統(tǒng)計學(xué)已經(jīng)證明,樣本平均數(shù)總體的平均數(shù)等于原總體的平均數(shù),樣本平均數(shù)總體的方差等于原總體方差的n分之一。即,兩個獨立樣本平均數(shù)差數(shù)的總體分布如果從一個具有參數(shù)1,12的正態(tài)總體中抽取大小為

n1的樣本,樣本平均數(shù)為

;又從另一個具有參數(shù)2,

22的正態(tài)總體中抽取大小為n2的樣本,樣本平均數(shù)為。則兩樣本平均數(shù)之差數(shù)將服從總體平均數(shù)為,總體方差為

的正態(tài)分布。將轉(zhuǎn)換為正態(tài)離差就可以計算出差數(shù)落在某區(qū)間的概率。如果兩個獨立樣本來自同一非正態(tài)總體,即具有相同的參數(shù)和

2,則只有當(dāng)n1n2都足夠大時,兩樣本平均數(shù)之差數(shù)才服從上述的正態(tài)分布。如果兩個獨立樣本來自不同的非正態(tài)總體,只有當(dāng)

12≈22,且n1n2都足夠大時,兩樣本平均數(shù)之差數(shù)才近似服從正態(tài)分布。否則分布很難確定。第二節(jié)生物統(tǒng)計學(xué)的基本原理請注意,上面討論到的抽樣總體,不論是

樣本平均數(shù)總體還是

兩樣本平均數(shù)之差數(shù)的總體其平均數(shù)和方差與原總體的平均數(shù)和方差都有相應(yīng)的關(guān)系,該關(guān)系與原總體的分布無關(guān)。

如果原總體的分布為已知,則相應(yīng)的抽樣總體的分布就更為清楚了。

以下討論原總體的分布與相應(yīng)的抽樣總體的分布之間的關(guān)系。第二節(jié)生物統(tǒng)計學(xué)的基本原理實際應(yīng)用中,當(dāng)n>30時,就可以應(yīng)用此定理。如果原總體服從正態(tài)分布,則無論樣本容

量n是大是小,樣本平均數(shù)將服從平均數(shù)為,方差為的正態(tài)分布。即

如果原總體不是正態(tài)分布的,但已知其總體均數(shù)為,方差為,則當(dāng)從中抽取的樣本容量n足夠大時,中心極限定理指出,樣本平均數(shù)將服從平均數(shù)為,方差為的正態(tài)分布。即將轉(zhuǎn)換為正態(tài)離差u,就可以計算出落在某區(qū)間的概率。第二節(jié)生物統(tǒng)計學(xué)的基本原理在前面介紹了標準化正態(tài)分布即u分布的定義公式:

現(xiàn)在由此可以衍生出另外兩個符合正態(tài)分布的樣本平均數(shù)和樣本平均數(shù)差數(shù)衍生總體的u值轉(zhuǎn)換公式:樣本平均數(shù)衍生總體:樣本平均數(shù)差數(shù)衍生總體:正態(tài)總體中的數(shù)值正態(tài)總體的平均數(shù)正態(tài)總體的標準差第二節(jié)生物統(tǒng)計學(xué)的基本原理學(xué)生氏t分布t=若隨機變量t的概率密度函數(shù)為:則稱隨機變量t服從自由度為n-1的t分布。

t分布曲線的特性:⑴單峰,倒鐘狀,以t=0為軸左右對稱;⑵不同的df有不同的曲線,當(dāng)df小時,曲線肥矮,當(dāng)df大時,曲線高瘦,當(dāng)df時,曲線與標準正態(tài)曲線重合;⑶曲線與橫軸間面積為1。第二節(jié)生物統(tǒng)計學(xué)的基本原理f(t)tdf=5df=10df=30u分布第二節(jié)生物統(tǒng)計學(xué)的基本原理根據(jù)前面介紹了二項總體的理論分布,二項總體是由對立事件構(gòu)成的總體,其總體的觀測值是由抽樣次數(shù)“n”來定義的,因此同一種二項總體因n值不同,其總體內(nèi)的觀測值種類多少也是不相同的,這給研究其抽樣分布帶來了困難。為此,可將出現(xiàn)此事件記為X=1,出現(xiàn)彼事件記為X=0,這樣二項總體的觀測值都轉(zhuǎn)換為0和1的總體,這種總體稱為“二項分布的兩點總體”,以后統(tǒng)稱二項總體。先計算出這樣的總體的平均數(shù)和方差。若此事件出現(xiàn)的概率為p,彼事件出現(xiàn)的概率為q=1-p,可以計算出總體平均數(shù)=p和總體方差

2=pq。其實這就是前面所介紹的二項總體“n=1”的情況。

=(1p+0q)/(p+q)=p2

=(p(1-p)2+q(0-p)2)/(p+q)=(pq2+qp2)/(p+q)=pq第二節(jié)生物統(tǒng)計學(xué)的基本原理二項總體平均數(shù)的抽樣分布根據(jù)前面所介紹的知識,當(dāng)n比較大時,構(gòu)成的分布可近似符合正態(tài)分布,可將其轉(zhuǎn)換為u值或t值:從此總體中抽取大小為n的樣本,樣本平均數(shù)

X/n將服從平均數(shù)為p,方差為pq/n的二項分布。這里所說的樣本平均數(shù)是指成數(shù)或百分數(shù),也可用表示。

第二節(jié)生物統(tǒng)計學(xué)的基本原理從兩個二項總體中抽出兩個樣本容量分別為n1和n2的樣本,兩個樣本平均數(shù)差數(shù)d=將服從平均數(shù)為p1-p2,方差為的二項分布。二項總體平均數(shù)差數(shù)的抽樣分布同樣地,如果兩個樣本的容量都比較大,差數(shù)的分布也近似地符合正態(tài)分布,可以將其轉(zhuǎn)換為u值或t值:第二節(jié)生物統(tǒng)計學(xué)的基本原理

2分布(卡平方分布)隨機變量2的概率密度函數(shù)為:則稱隨機變量2服從自由度為n-1的2分布。從一正態(tài)總體N(,2)中抽出一個樣本,這個樣本的觀測值轉(zhuǎn)換為u值,所有u的平方之和定義為2。如果將所有樣本容量為n的樣本都抽出,得到很多的2值構(gòu)成了卡平方分布。即第二節(jié)生物統(tǒng)計學(xué)的基本原理

2分布曲線的特性:⑴2≥0,圖象都在第一象限;⑵不對稱的曲線,隨著自由度增加變得稍對稱但頂峰變矮,并逐漸趨向正態(tài)分布。⑶df≥3時,曲線與橫軸間面積為1;df<3時,曲線與縱橫兩軸間面積為1。df

=1df

=3df=5f(2)2第二節(jié)生物統(tǒng)計學(xué)的基本原理2分布總體雖然是從正態(tài)總體衍生來的,但是它解決的問題主要是離散型變數(shù)資料,尤其是計數(shù)資料。使用較多的不是它的定義公式而是它的計算公式

F分布隨機變量F的概率密度函數(shù)為:則稱隨機變量F服從第一自由度為n1-1的、第二自由度為n2-1的F分布。第二節(jié)生物統(tǒng)計學(xué)的基本原理從一正態(tài)總體N(,2)中抽出樣本容量分別為n1和n2的兩個樣本,兩個樣本方差的比值定義為F值。如果將該總體所有可能的樣本都抽出,得到很多的F值構(gòu)成了F分布。即F=S12/S22

F分布曲線的特性:⑴F≥0,圖象都在第一象限;⑵曲線受兩個自由度的影響,隨著自由度的增加趨向?qū)ΨQ;⑶不對稱的單尾型曲線,曲線與橫軸間面積為1。第二節(jié)生物統(tǒng)計學(xué)的基本原理df1=1,df2=5df1=2,df2=5df1=5,df2=4f(F)F第三節(jié)生物統(tǒng)計學(xué)的基本方法1.統(tǒng)計假設(shè)測驗:通過對抽樣調(diào)查得到的樣本數(shù)據(jù)進行分析而對樣本所來自的總體作出統(tǒng)計判斷的方法。一些常見的例子:

(1)產(chǎn)品檢驗:某產(chǎn)品某個技術(shù)指標值為,現(xiàn)從一批該產(chǎn)品中抽取大小為

的樣本,測得樣本平均數(shù)為,標準差為,試測驗該批產(chǎn)品的該技術(shù)指標平均數(shù)是否與已知的間有顯著差異。

(2)品種比較:調(diào)查A品種株,平均產(chǎn)量為,標準差為;調(diào)查B品種株,平均產(chǎn)量為,標準差為;試測驗兩品種的真正產(chǎn)量與之間有無顯著差異。*這種測驗稱為單個平均數(shù)的假設(shè)測驗。*這種測驗稱為兩個平均數(shù)相比較的假設(shè)測驗。第三節(jié)生物統(tǒng)計學(xué)的基本方法統(tǒng)計假設(shè)針對研究的問題對總體參數(shù)提出一對統(tǒng)計假設(shè)。其中:*認為試驗的處理沒有效應(yīng)的假設(shè)稱為無效假設(shè)(H0-nullhypothesis);*當(dāng)H0不能被接受時所采納的假設(shè)稱為備擇假設(shè)

(HA-alternativehypothesis)。如果是對總體平均數(shù)提出假設(shè),則一個總體

H0:

=0(C)對HA:

≠0H0:

0

對HA:

0H0:

0

對HA:

0兩個總體

H0:1

=2

對HA:1

≠2H0:1

2

對HA:1

2H0:1

2

對HA:1

2如果是對總體方差提出假設(shè),則一個總體

H0:2=02

(C)對HA:

2

≠02H0:

2

02

對HA:

2

02H0:

2

02

對HA:

2

02兩個總體

H0:12

=2

2對HA:12

≠22H0:1

2

22

對HA:1

2

22H0:12

22

對HA:1

2

22第三節(jié)生物統(tǒng)計學(xué)的基本方法

統(tǒng)計測驗的基本方法和一般步驟:2.利用試驗數(shù)據(jù)計算一個統(tǒng)計量的值。再根據(jù)該樣本統(tǒng)計量的抽樣分布,計算出當(dāng)H0為正確時出現(xiàn)這樣一個值的概率。對不同資料進行測驗時,由于統(tǒng)計量及其的分布不同,計算統(tǒng)計量和概率的公式有所不同。3.當(dāng)此概率小于預(yù)先設(shè)定的水平,就根據(jù)“小概率事件實際上不可能發(fā)生”原理拒絕H0,接受HA。該水平稱為顯著水平(記為)。常用的為5%或1%。1.針對研究的問題提出一對統(tǒng)計假設(shè)。其中:*認為試驗的處理沒有效應(yīng)的假設(shè)稱為無效假設(shè)(H0-nullhypothesis);*當(dāng)H0不能被接受時所采納的假設(shè)稱為備擇假設(shè)

(HA-alternativehypothesis)。第三節(jié)生物統(tǒng)計學(xué)的基本方法

兩尾測驗:接受區(qū)域位于中間,否定區(qū)域位于兩側(cè)的.-1.9601.9695%接受區(qū)域否定區(qū)域

單尾測驗:接受區(qū)域位于一側(cè),否定區(qū)域位于另一側(cè).-

01.64495%接受區(qū)域否定區(qū)域95%-

-4

-1.640接受區(qū)域否定區(qū)域第三節(jié)生物統(tǒng)計學(xué)的基本方法測驗:(記施用這種肥料后的真正產(chǎn)量為)1.設(shè)假設(shè)H0:

=0=35gvsHA:

≠0=35g例題:某玉米品種正常單株產(chǎn)量為0=35g,標準差=5g。施用某種肥料后,調(diào)查n=100株,算得樣本平均數(shù)=37g。問這種肥料是否對產(chǎn)量有顯著影響。2.如果H0是正確的話,從上章可知:

因此有統(tǒng)計量服從標準正態(tài)分布。即u有95%的可能落在(-1.96,1.96)之間。3.現(xiàn)在,,落在(-1.96,1.96)以外,若要用=5%為顯著水平,可斷言:H0不正確。這里的否定區(qū)域是分布在曲線的兩邊的,我們稱這樣的測驗為兩尾測驗。第三節(jié)生物統(tǒng)計學(xué)的基本方法例題:某玉米品種正常單株產(chǎn)量為0=35g,標準差=5g。施用某種肥料后,調(diào)查n=100株,算得樣本平均數(shù)=37g。問這種肥料是否對產(chǎn)量有顯著影響。問施用該肥料后,產(chǎn)量是否增加了。1.設(shè)假設(shè)H0:

0=35gvsHA:

0=35g2.如果H0是正確的話,從上章可知:

因此有統(tǒng)計量服從標準正態(tài)分布。即u有95%的可能落在(-,1.64)之間。3.現(xiàn)在,,落在(-,1.64)以外,若要用=5%為顯著水平,可斷言:H0不正確。這里的否定區(qū)域是分布在曲線的一邊的,我們稱這樣的測驗為一尾測驗。第三節(jié)生物統(tǒng)計學(xué)的基本方法假設(shè)測驗會出現(xiàn)兩種不同類型的錯誤。假設(shè)測驗依據(jù)“小概率事件實際上不可能發(fā)生原理”。利用估計值來對總體的相應(yīng)參數(shù)進行判斷。這種判斷不是絕對正確的,有可能會犯錯誤。假設(shè)測驗中犯這兩類型錯誤的概率有多大?第一類錯誤是指:將一個正確的H0錯判為不正確。例如,我們的例子中,H0:

=0vsHA:

≠0如果本來

=0,但卻判斷為

≠0,有多大可能?因為我們用1-的把握作推斷,只有當(dāng)算出的測驗值落在接受區(qū)間以外,才會推翻H0,所以犯第一類錯誤的概率等于。-u0u1-α否定區(qū)域接受區(qū)域第三節(jié)生物統(tǒng)計學(xué)的基本方法假設(shè)測驗會出現(xiàn)兩種不同類型的錯誤。假設(shè)測驗依據(jù)“小概率事件實際上不可能發(fā)生原理”。利用估計值來對總體的相應(yīng)參數(shù)進行判斷。這種判斷不是絕對正確的,有可能會犯錯誤。假設(shè)測驗中犯這兩類型錯誤的概率有多大?第二類錯誤是指:將一個錯誤的H0錯判為正確。例如,我們的例子中,H0:

=0vsHA:

≠0如果本來

≠0,但卻判斷為

=

0,有多大可能?我們稱犯第二類錯誤的概率為,的計算比較復(fù)雜,它要求真正的為已知。01-α接受區(qū)域接受區(qū)域01-α接受區(qū)域353699%第三節(jié)生物統(tǒng)計學(xué)的基本方法犯這兩類型錯誤的概率(與)之間的關(guān)系。接受區(qū)域353695%⑴如果樣本容量n不變,減少,則增大。353795%接受區(qū)域即提供置信度(減小顯著水平,或減少犯第一類錯誤的概率),將增大犯第二類錯誤的可能性;。⑵對于相同的n和,

0相距越遠,則越小。⑶當(dāng)n、、與0都相同時,越小則越小。353695%接受區(qū)域兩個樣本平均數(shù)相比較的假設(shè)測驗單個樣本平均數(shù)的假設(shè)測驗⑴當(dāng)總體方差2為已知時;⑵當(dāng)總體方差2為未知時;成組數(shù)據(jù)的平均數(shù)比較;成對數(shù)據(jù)的平均數(shù)比較;⑴兩總體方差12和22為已知時;⑵兩總體方差12和22為未知但可以認為12=22時;⑶兩總體方差12和22為未知但可認為12≠22時;第三節(jié)生物統(tǒng)計學(xué)的基本方法

—平均數(shù)的假設(shè)測驗⑴當(dāng)總體標準差為已知時的一般步驟:2.利用試驗數(shù)據(jù)計算一個統(tǒng)計量的值。3.根據(jù)“小概率事件實際上不可能發(fā)生”原理作判斷。1.針對研究的問題提出一對統(tǒng)計假設(shè)。

兩尾測驗時H0:

=0vsHA:

≠0計算統(tǒng)計量:(大端)一尾測驗時H0:

≤0vsHA:

>0(小端)一尾測驗時H0:

≥0vsHA:

<0

兩尾測驗時,|u|>u

則有(1-)的概率推翻H0;(大端)一尾測驗時,u>u

則有(1-)的概率推翻H0;(小端)一尾測驗時,u<-u

則有(1-)的概率推翻H0。用計算u,查

正態(tài)分布表。單個樣本平均數(shù)的假設(shè)測驗95%接受區(qū)域否定區(qū)域95%接受區(qū)域否定區(qū)域接受區(qū)域否定區(qū)域第三節(jié)生物統(tǒng)計學(xué)的基本方法第三節(jié)生物統(tǒng)計學(xué)的基本方法⑵當(dāng)總體標準差為未知時的一般步驟:2.利用試驗數(shù)據(jù)計算一個統(tǒng)計量的值。3.根據(jù)“小概率事件實際上不可能發(fā)生”原理作判斷。1.針對研究的問題提出一對統(tǒng)計假設(shè)。

兩尾測驗時H0:

=0vsHA:

≠0計算統(tǒng)計量:(大端)一尾測驗時H0:

≤0vsHA:

>0(小端)一尾測驗時H0:

≥0vsHA:

<0

兩尾測驗時,|t|>t

則有(1-)的概率推翻H0;(大端)一尾測驗時,t>t

則有(1-)的概率推翻H0;(小端)一尾測驗時,t<-t

則有(1-)的概率推翻H0。用s計算t,按自由度

df=n-1查t分布表。單個樣本平均數(shù)的假設(shè)測驗第三節(jié)生物統(tǒng)計學(xué)的基本方法⑴兩總體方差12和22為已知時的一般步驟:2.利用試驗數(shù)據(jù)計算一個統(tǒng)計量的值。3.根據(jù)“小概率事件實際上不可能發(fā)生”原理作判斷。1.針對研究的問題提出一對統(tǒng)計假設(shè)。計算統(tǒng)計量:

兩尾測驗時H0:1

=2vsHA:1

≠2(大端)一尾測驗時H0:1

≤2vsHA:1

>2(小端)一尾測驗時H0:1

≥2vsHA:1

<2

兩尾測驗時,|u|>u

則有(1-)的概率推翻H0;(大端)一尾測驗時,u>u

則有(1-)的概率推翻H0;(小端)一尾測驗時,u<-u

則有(1-)的概率推翻H0。

用12和22計算u,

查正態(tài)分布表。兩個樣本平均數(shù)相比較的假設(shè)測驗第三節(jié)生物統(tǒng)計學(xué)的基本方法⑵兩總體方差12和22為未知但可以認為12=22時2.利用試驗數(shù)據(jù)計算一個統(tǒng)計量的值。3.根據(jù)“小概率事件實際上不可能發(fā)生”原理作判斷。1.針對研究的問題提出一對統(tǒng)計假設(shè)。計算統(tǒng)計量:

兩尾測驗時H0:1

=2vsHA:1

≠2(大端)一尾測驗時H0:1

≤2vsHA:1

>2(小端)一尾測驗時H0:1

≥2vsHA:1

<2

兩尾測驗時,|t|>t

則有(1-)的概率推翻H0;(大端)一尾測驗時,t>t

則有(1-)的概率推翻H0;(小端)一尾測驗時,t<-t

則有(1-)的概率推翻H0。因為可以認為12=22=

2,所以變成但

2未知,用樣本方差se2估計,變成如果第一樣本的方差為第二樣本的方差為,那么合并樣本的方差將是

2的更好估計。于是公式變成用df=n1+n2-2

查t分布表。兩個樣本平均數(shù)相比較的假設(shè)測驗第三節(jié)生物統(tǒng)計學(xué)的基本方法⑶兩總體方差12和22為未知但可認為12≠22時2.利用試驗數(shù)據(jù)計算一個統(tǒng)計量的值。3.根據(jù)“小概率事件實際上不可能發(fā)生”原理作判斷。1.針對研究的問題提出一對統(tǒng)計假設(shè)。計算統(tǒng)計量:

兩尾測驗時H0:1

=2vsHA:1

≠2(大端)一尾測驗時H0:1

≤2vsHA:1

>2(小端)一尾測驗時H0:1

≥2vsHA:1

<2

兩尾測驗時,|t|>t

則有(1-)的概率推翻H0;(大端)一尾測驗時,t>t

則有(1-)的概率推翻H0;(小端)一尾測驗時,t<-t

則有(1-)的概率推翻H0。查t分布表。但自由度要經(jīng)過校正。因為不可以認為12=22,因此用s12估計12,用s22估計22,于是公式變成自由度的校正公式為:其中兩個樣本平均數(shù)相比較的假設(shè)測驗第三節(jié)生物統(tǒng)計學(xué)的基本方法成對數(shù)據(jù)的平均數(shù)比較成對數(shù)據(jù)一般是通過配對設(shè)計獲得的,該設(shè)計得到的數(shù)據(jù)結(jié)構(gòu)為:序號樣本1樣本2差值12…nX11X12…X1nX21X22…X2nd1=X11–X21d2=X12–X22

…dn=X1n–X2n可以看作一個樣本因此,可以按照單個樣本平均數(shù)的假設(shè)測驗的方法來分析第三節(jié)生物統(tǒng)計學(xué)的基本方法成對數(shù)據(jù)的平均數(shù)比較2.利用試驗數(shù)據(jù)計算一個統(tǒng)計量的值。3.根據(jù)“小概率事件實際上不可能發(fā)生”原理作判斷。1.針對研究的問題提出一對統(tǒng)計假設(shè)。計算統(tǒng)計量:

兩尾測驗時H0:1

=2vsHA:1

≠2(大端)一尾測驗時H0:1

≤2vsHA:1

>2(小端)一尾測驗時H0:1

≥2vsHA:1

<2

兩尾測驗時,|t|>t

則有(1-)的概率推翻H0;(大端)一尾測驗時,t>t

則有(1-)的概率推翻H0;(小端)一尾測驗時,t<-t

則有(1-)的概率推翻H0。對于成對數(shù)據(jù),應(yīng)先算出各對數(shù)據(jù)的差數(shù)d,所以統(tǒng)計假設(shè)也可以記為H0:d

=0

vsHA:d

≠0

(小端)一尾測驗時H0:d

≥0

vsHA:d

<0

(大端)一尾測驗時H0:d

≤0

vsHA:d

>0

兩尾測驗時H0:d

=0

vsHA:d

≠0

各對數(shù)據(jù)的差數(shù)d的平均數(shù)所以統(tǒng)計量為但因為未知,用代替計算,測驗統(tǒng)計量變?yōu)?按自由度df=n-1查t分布表。2.計算如果H0正確,20個卵中的正常孵化數(shù)大于等于19個的概率。對于二項資料百分數(shù)的假設(shè)測驗,理論上應(yīng)該按二項分布進行。例題:某品種家蠶的卵在某地區(qū)的自然孵化率為70%,即p=

0.7?,F(xiàn)將這種卵放入某種孵化器進行孵化。抽取大小為n=20的樣本,發(fā)現(xiàn)有19個卵能正常孵化。請用95%的置信度()測驗用這種孵化器進行孵化是否(比自然孵化)能顯著提高孵化率。,推翻H0,判斷差異顯著,即用這種孵化器能顯著提高孵化率。1.提出統(tǒng)計假設(shè)H0:p≤vsHA:p>

但如果n很大時,用此方法計算概率就很困難。在上一章討論二項總體的抽樣分布時指出,當(dāng)np和nq大于5時,可用正態(tài)分布來近似計算。

第三節(jié)生物統(tǒng)計學(xué)的基本方法兩個樣本百分數(shù)相比較的假設(shè)測驗單個樣本百分數(shù)的假設(shè)測驗⑴用觀察百分數(shù)進行計算的測驗公式;⑵連續(xù)性矯正的計算公式;⑴用觀察百分數(shù)進行計算的測驗公式;⑵連續(xù)性矯正的計算公式;這是測驗?zāi)骋粋€樣本百分數(shù)所來自的總體百分數(shù)p與已知的百分數(shù)p0之間是否有顯著差異的方法。因為百分數(shù)又稱為成數(shù),所以這種測驗又稱為成數(shù)的假設(shè)測驗。這是測驗兩個樣本百分數(shù)和所來自的總體百分數(shù)p1和p2之間是否有顯著差異的方法。對于這種測驗,通常假設(shè)兩總體的方差是相等的,即。第三節(jié)生物統(tǒng)計學(xué)的基本方法2.利用試驗數(shù)據(jù)計算一個統(tǒng)計量的值。3.根據(jù)“小概率事件實際上不可能發(fā)生”原理作判斷。1.針對研究的問題提出一對統(tǒng)計假設(shè)。

兩尾測驗時H0:p

=p0vsHA:p

≠p0計算統(tǒng)計量:(大端)一尾測驗時H0:p

≤p0vsHA:p

>p0(小端)一尾測驗時H0:p

≥p0vsHA:p

<p0

兩尾測驗時,|u|>u

則有(1-)的概率推翻H0;(大端)一尾測驗時,u>u

則有(1-)的概率推翻H0;(小端)一尾測驗時,u<-u

則有(1-)的概率推翻H0。查正態(tài)分布表⑴用觀察百分數(shù)進行計算的測驗公式;第三節(jié)生物統(tǒng)計學(xué)的基本方法單個樣本百分數(shù)的假設(shè)測驗95%接受區(qū)域否定區(qū)域95%接受區(qū)域否定區(qū)域接受區(qū)域否定區(qū)域2.利用試驗數(shù)據(jù)計算一個統(tǒng)計量的值。3.根據(jù)“小概率事件實際上不可能發(fā)生”原理作判斷。1.針對研究的問題提出一對統(tǒng)計假設(shè)。計算統(tǒng)計量:

兩尾測驗時H0:p

=p0vsHA:p

≠p0(大端)一尾測驗時H0:p

≤p0vsHA:p

>p0(小端)一尾測驗時H0:p

≥p0vsHA:p

<p0

兩尾測驗時,|u|>u

則有(1-)的概率推翻H0;(大端)一尾測驗時,u>u

則有(1-)的概率推翻H0;(小端)一尾測驗時,u<-u

則有(1-)的概率推翻H0。第三節(jié)生物統(tǒng)計學(xué)的基本方法⑵連續(xù)性矯正的計算公式;查正態(tài)分布表.精確地應(yīng)該計算這區(qū)域內(nèi)的面積。用正態(tài)近似后計算了這區(qū)域內(nèi)的面積。單個樣本百分數(shù)的假設(shè)測驗2.利用試驗數(shù)據(jù)計算一個統(tǒng)計量的值。3.根據(jù)“小概率事件實際上不可能發(fā)生”原理作判斷。1.針對研究的問題提出一對統(tǒng)計假設(shè)。計算統(tǒng)計量:

兩尾測驗時H0:p1

=p2vsHA:p1

≠p2(大端)一尾測驗時H0:p1

≤p2vsHA:p1

>p2(小端)一尾測驗時H0:p1

≥p2vsHA:p1

<p2

兩尾測驗時,|t|>t

則有(1-)的概率推翻H0;(大端)一尾測驗時,t>t

則有(1-)的概率推翻H0;(小端)一尾測驗時,t<-t

則有(1-)的概率推翻H0。第三節(jié)生物統(tǒng)計學(xué)的基本方法⑴用觀察百分數(shù)進行計算的測驗公式查正態(tài)分布表,或df=n1+n2-2的t分布表。其中兩個樣本百分數(shù)相比較的假設(shè)測驗2.利用試驗數(shù)據(jù)計算一個統(tǒng)計量的值。3.根據(jù)“小概率事件實際上不可能發(fā)生”原理作判斷。1.針對研究的問題提出一對統(tǒng)計假設(shè)。計算統(tǒng)計量:

兩尾測驗時H0:p1

=p2vsHA:p1

≠p2(大端)一尾測驗時H0:p1

≤p2vsHA:p1

>p2(小端)一尾測驗時H0:p1

≥p2vsHA:p1

<p2

兩尾測驗時,|t|>t

則有(1-)的概率推翻H0;(大端)一尾測驗時,t>t

則有(1-)的概率推翻H0;(小端)一尾測驗時,t<-t

則有(1-)的概率推翻H0。第三節(jié)生物統(tǒng)計學(xué)的基本方法查正態(tài)分布表,或df=n1+n2-2的t分布表。⑵連續(xù)性矯正的計算公式;兩個樣本百分數(shù)相比較的假設(shè)測驗第三節(jié)生物統(tǒng)計學(xué)的基本方法

-方差的同質(zhì)性測驗一個樣本方差與已知總體方差的統(tǒng)計測驗若從一個總體抽取一個大小為n的樣本,算得樣本方差為s2,想了解此總體方差2是否與已知方差02間有顯著的差異。兩個樣本方差是否來自同一總體方差的統(tǒng)計測驗多個樣本方差是否來自同一總體方差的統(tǒng)計測驗若樣本方差s12來自總體方差12,樣本方差s22來自總體方差22,想了解這兩個總體方差之間是否有顯著差異。若總共有k個樣本,第i個樣本的樣本方差si2來自總體方差i2。想了解這k個總體方差之間是否有顯著差異。第三節(jié)生物統(tǒng)計學(xué)的基本方法2.利用試驗數(shù)據(jù)計算一個統(tǒng)計量的值。3.根據(jù)“小概率事件實際上不可能發(fā)生”原理作判斷。1.針對研究的問題提出一對統(tǒng)計假設(shè)。

兩尾測驗時H0:2

=02vsHA:2

≠02

(大端)一尾測驗時H0:2

≤02vsHA:2

>02

(小端)一尾測驗時H0:2

≥02vsHA:2

<02

兩尾測驗時,2>2/2或2<

21-/2有(1-)概率推翻H0;(大端)一尾測驗時,2>2

,則有(1-)概率推翻H0;(小端)一尾測驗時,2<

21-,則有(1-)概率推翻H0。計算統(tǒng)計量:一個樣本方差與已知總體方差的統(tǒng)計測驗用df=n-1查2分布表。如果是大樣本,計算出的2值可利用正態(tài)分布轉(zhuǎn)為u值,直接與u比較,做出推斷。即:第三節(jié)生物統(tǒng)計學(xué)的基本方法2.利用試驗數(shù)據(jù)計算一個統(tǒng)計量的值。3.根據(jù)“小概率事件實際上不可能發(fā)生”原理作判斷。1.針對研究的問題提出一對統(tǒng)計假設(shè)。

兩尾測驗時H0:12

=22vsHA:12

≠22

(大端)一尾測驗時H0:12

≤22vsHA:12

>22

兩尾測驗時,F(xiàn)

>F/2或F

F1-/2有(1-)概率推翻H0;(大端)一尾測驗時,F(xiàn)

F

,則有(1-)概率推翻H0;計算統(tǒng)計量:用df

1=n1-1,df

2=n2-1查

F分布表。兩個樣本方差是否來自同一總體方差的統(tǒng)計測驗若大小為n1的樣本方差s12來自總體方差12,大小為n2的樣本方差s22來自總體方差22,想了解這兩個總體方差

12之間是否有顯著差異。第三節(jié)生物統(tǒng)計學(xué)的基本方法計算統(tǒng)計量:多個樣本方差是否來自同一總體方差的統(tǒng)計測驗若總共有k個樣本,第i個樣本的樣本方差si2來自總體方差i2。想了解這k個總體方差之間是否有顯著差異。

H0:12

=22

=…=k2

vsHA:并非都相等其中:2.利用試驗數(shù)據(jù)計算一個統(tǒng)計量的值。1.針對研究的問題提出一對統(tǒng)計假設(shè)。3.根據(jù)“小概率事件實際上不可能發(fā)生”原理作判斷。3.如果,2>2

,則有(1-)概率推翻H0。用df=k-1查2分布表第三節(jié)生物統(tǒng)計學(xué)的基本方法

-適合性測驗先將數(shù)據(jù)列成上面的表。⑴測驗假設(shè)

H0:比率為1:1vsHA:比率不是1:1⑵計算:⑶因為

2=

0.2927<

=

3.84,接受H0,認為實際比率與理論比率1:1相符。

例題:玉米花粉粒中形成淀粉?;蚝怯梢粚Φ任换蚩刂频男誀?。淀粉粒加碘將變藍色,而糊精加碘則不會變藍。如果等位基因的復(fù)制是等量的,并且在配子中分配是隨機的,F(xiàn)1代中的兩種花粉粒的數(shù)目應(yīng)該是1:1的?,F(xiàn)調(diào)查了6919?;ǚ郏l(fā)現(xiàn)有3437粒會變藍。問實際比率與理論比率1:1之間是否有顯著差異。碘反映觀察數(shù)(O)理論數(shù)(E)變藍34373459.5不變藍34823459.5共計69196919注意這里2的自由度為1。因為自由度=分組數(shù)-1。第三節(jié)生物統(tǒng)計學(xué)的基本方法

-獨立性測驗獨立性測驗是檢查兩個(對計數(shù)指標有)影響(的)因素是否相互獨立(或有關(guān))的方法。例如,“小麥種子是否經(jīng)過滅菌處理”與“長出的麥穗是否發(fā)病”這兩件事情是否有關(guān)。所以它的統(tǒng)計假設(shè)為:

H0:兩個因素相互獨立vsHA:兩個因素相互有關(guān)根據(jù)各因素的水平數(shù)多少分為:2×2

相依表的獨立性測驗2×C

相依表的獨立性測驗

R×C

相依表的獨立性測驗2×2

相依表的獨立性測驗

例題:調(diào)查經(jīng)過滅菌處理與未經(jīng)過滅菌處理的兩

類小麥種子長出的麥穗發(fā)生小麥散黑穗病的株數(shù),得

下表,試分析種子滅菌與否和植株是否發(fā)病有無關(guān)系。用于處理有兩行兩列的計數(shù)資料,即兩個因素各自可分為兩種水平時的情況。發(fā)病穗數(shù)無病穗數(shù)合計種子經(jīng)滅菌265076種子未滅菌184200384合計210250460第三節(jié)生物統(tǒng)計學(xué)的基本方法

-獨立性測驗H0:滅菌與否和發(fā)病無關(guān)

vsHA:發(fā)病與滅菌與否有關(guān)發(fā)病穗數(shù)無病穗數(shù)合計種子經(jīng)滅菌265076種子未滅菌184200384合計210250460如果H0正確,滅不滅菌的發(fā)病率都應(yīng)該等于210/460。經(jīng)滅菌的種子調(diào)查了76株,理論上應(yīng)有76(210/460)

=

株發(fā)病,統(tǒng)計推斷:種子滅菌與否和發(fā)病不發(fā)病有顯著關(guān)系。26(34.7)50(41.3)184(175.3)200(208.7)76-34.7=41.3株無病;未經(jīng)滅菌的調(diào)查了384株,理論上有384(210/460)

=175.

3株發(fā)病,384-175.3株無病。

注意2的自由度df

=1

比較兩種測

驗的結(jié)果。

再看連續(xù)性

矯正公式。第三節(jié)生物統(tǒng)計學(xué)的基本方法

-獨立性測驗方差分析解決的問題:

研究一個或兩個樣本平均數(shù)的假設(shè)測驗,可采用u測驗或t測驗的方法。但是對多個樣本的差異顯著性測驗,采用u測驗或t10=

0.5987<<0.95,這樣犯第一類錯誤的概率就增加了。到底采用什么方法來解決這一問題呢?

多個樣本平均數(shù)之間的差異大小可以用這些平均數(shù)計算出的方差St2來表示,方差大,差異大;方差小,差異小。但是必須要用一個比較的標準來判斷,如何確定這個標準呢?如果我們從一個總體中抽出若干個樣本,這些樣本平均數(shù)之間也會有差異,但不是本質(zhì)性的差異,這種差異叫抽樣誤差,也是隨機誤差的一種,可以計算出它們之間的方差Se2

。如果St2和Se2大小差不多,毫無疑問,這多個樣本之間沒有差異;如果St2比Se2大得多,那就說明它們之間有本質(zhì)性的差異。很顯然,要比較這兩種方差的差異,可以用F測驗來解決,即方差分析(analysisofvariance)的方法。因此,要達到這種目的,必須計算出這兩種變異的平方和、自由度和方差。第四節(jié)方差分析第四節(jié)方差分析

線性可加數(shù)學(xué)模型是將數(shù)據(jù)中的每一個觀測值劃分為若干個線性可加部分的數(shù)學(xué)表達式。對于一個總體xi

=

+i一個樣本xi=

+ei對于多個總體xij

=+i+ij

多個樣本xij=

+ti+eij

固定模型(fixedmodel):

隨機模型(randommodel)

試驗因素的效應(yīng)i是固定的,也稱為模型Ⅰ。

試驗因素的效應(yīng)i是隨機的,也稱為模型Ⅱ。例:某課題組研制出了5個防治小麥紋枯病的新配方,通過試驗來比較它們的防治效果,從中找出最好的配方。這5種配方和不噴藥的處理效應(yīng)與總平均效應(yīng)的差值是常數(shù),因此這些處理效應(yīng)為固定模型。統(tǒng)計假設(shè)為:

H0:vsHA:并非所有i都相等或:

H0:vsHA:并非所有都相等例:某植保站為了搞清目前在小麥生產(chǎn)上使用的防治小麥紋枯病的農(nóng)藥品種情況,從中隨機抽出20種來做試驗。其目的是通過這20種的試驗結(jié)果來反映目前使用農(nóng)藥的現(xiàn)狀,而不是找出最好的農(nóng)藥種類,因此這些處理效應(yīng)為隨機模型。統(tǒng)計假設(shè)為:

H0:vsHA:方差分析的基本思路:

將試驗數(shù)據(jù)的總變異分解為設(shè)置的若干可控因素引起的變異,扣除這些可控因素引起的變異后,把剩余的變異當(dāng)作為由誤差引起的。變異的分解主要是對平方和與自由度進行分解。分解后分別計算各自的方差,再將要試驗因素引起的方差與誤差引起的方差比較,如果試驗因素引起的方差顯著地大于誤差引起的方差,便判定該因素對研究的變數(shù)有顯著的效應(yīng),拒絕H0,,接受HA;否則,判定該因素對變數(shù)沒有顯著的效應(yīng),接受H0,拒絕HA

。第四節(jié)方差分析在方差分析中數(shù)據(jù)的變異用方差來衡量。

第四節(jié)方差分析xi.(Tt)x1.x2.…xk.1x11x21…xk12x12x22…xk2…nx1nx2n…xkn樣本1樣本2…樣本k多樣本的數(shù)據(jù)資料:第四節(jié)方差分析如果共有k

組數(shù)據(jù),每組有n個觀察值,各觀察值分別記為xij。其中i

=1,

2,…,

k;j=1,

2,…,

n。試比較不同組的數(shù)據(jù)間有無顯著差異。

H0:vsHA:并非所有都相等總變異分解為組間的變異和誤差引起的變異。各組的值以各組的平均數(shù)為代表。總變異分解為組間的變異和誤差引起的變異。誤差引起的變異用組內(nèi)方差衡量。容易證明:總平方和=組間平方和+組內(nèi)平方和。這項等于0同樣可以證明:總自由度=組間自由度+組內(nèi)自由度。第四節(jié)方差分析來看一個簡單數(shù)據(jù)的變異分解:利用定義公式計算:xij-4可以看出:SST=SSt+SSe第四節(jié)方差分析為方便起見,先計算出校正項:利用計算公式計算:把分解的結(jié)果列成方差分析表:變異來源自由度平方和均方F值F判別值F判別值組間k-1SStMSt=SSt/dftMST/MSeF0.05F0.01組內(nèi)k(n-1)SSeMSe=SSe/dfe總變異nk-1SSTMSt是樣本組間方差,估計了總體的組間差異和試驗誤差()。MSe是樣本組內(nèi)方差,估計了總體誤差()。

F=MSt/MSe測驗了統(tǒng)計假設(shè)H0:vsHA:如果F測驗顯著,說明組間有顯著差異。第四節(jié)方差分析把各種平方和及自由度的計算結(jié)果抄入一張表內(nèi)。稱它為方差分析表。計算出類間均方(方差)和誤差均方(方差)并將結(jié)果填入表中。162第四節(jié)方差分析樣本類間均方(方差)16估計了總體類間均方的

倍(即16);樣本誤差均方(方差)2估計了總體誤差均方:

(即2)。

F=16/2估計了。第四節(jié)方差分析從統(tǒng)計理論知:兩個方差之比服從第1自由度為分子自由度,第2自由度為分母自由度的F分布。將上表中的類間方差除以誤差方差,算出F值。若FF判斷類間差異顯著;若FF判斷類間差異極顯著。本例中,F=16/2=8F=4.26。第四節(jié)方差分析84.26多重比較(F測驗顯著基礎(chǔ)上進行)如果方差分析表顯示組間有顯著差異,你就會想知道,在所有的k組之間,共有k(k-1)/2對比較,到底是哪組與哪組之間有顯著差異,那些之間沒有差異。多重比較就是做這項工作的方法。多重比較的方法有很多種,但常用的主要有以下兩種:1.最小顯著差數(shù)法(LeastSignificantdifference---LSD法或t測驗法)2.最小顯著極差法即新復(fù)極差法(LeastSignificantRange---SSR法或Duncan法)第四節(jié)方差分析最小顯著差數(shù)法(LSD法)LSD法實質(zhì)上是t測驗法。其基本原理是:在樣本間的F測驗為顯著的前提下,計算出顯著水平為時的最小顯著差數(shù)LSD;任何兩個平均數(shù)的差數(shù)≥LSD

,即為在水平上差異顯著;反之,則為在水平上差異不顯著,這種方法又稱為F測驗保護下的最小顯著差數(shù)法。已知:若∣t∣≥t,即為在水平上顯著。因此,最小顯著差數(shù)為:當(dāng)兩樣本的容量n相等時,可用公共的方差Se2來計算樣本平均數(shù)的標準誤:用Se2的自由度查表F測驗分母的方差比較的平均數(shù)包含的觀測值個數(shù)該方法一般只適合兩個平均數(shù)之間的比較,特別是當(dāng)試驗中有對照(Check,簡稱CK),每一個樣本平均數(shù)與對照平均數(shù)進行比較時,或者在進行試驗前已確定的樣本平均數(shù)之間的比較,通常采用此方法。但是應(yīng)用LSD法必須先做F測驗,在F測驗顯著基礎(chǔ)上進行。第四節(jié)方差分析最小顯著極差法(LSR法)

在多重比較中,包括著多個樣本,這多個樣本中平均數(shù)最大的一個與平均數(shù)最小的一個比較,實際上已不再是一對獨立隨機樣本的比較,用LSD法,必然增大I型錯誤的概率,容易接受不真實的備擇假設(shè),為此提出了新復(fù)極差法,又稱最小顯著極差法(shortestsignificantranges,SSR),這種多重比較測驗方法是把多個樣本中兩個極端平均數(shù)的差數(shù)當(dāng)作極差對待,如果極差不顯著,則包括在這兩個極端處理平均數(shù)間的各處理平均數(shù)的任何成對比較,其差異也是不顯著的。極差是否顯著用極差相當(dāng)于樣本平均數(shù)標準誤的倍數(shù)來表示其中在一定自由度下,當(dāng)平均數(shù)個數(shù)為2、3、k時,SR值已由統(tǒng)計學(xué)家求出,見附表7。這樣只要計算出樣本平均數(shù)的標準誤,從附表7中查出SR,就可以計算出LSR:LSR法適合多個樣本平均數(shù)間的相互比較,在比較時,根據(jù)比較的平均數(shù)個數(shù)的不同采用的標準是不一樣的。該方法不需要F測驗保護,但與F測驗的結(jié)果也會出現(xiàn)一些較小的差異。第四節(jié)方差分析多重比較結(jié)果的表示方法

列梯形表法:下劃線法:字母標記法:將全部平均數(shù)從大到小順次排列,然后算出各平均數(shù)間的差數(shù)。凡達到水平的差數(shù)在右上角標一個“*”號,凡達到水平的差數(shù)在右上角標兩個“**”號,凡未達到水平的差數(shù)則不予標記。

將平均數(shù)按大小順序排列成一行,在不顯著極差的平均數(shù)后面劃一道橫線,有連線的平均數(shù)間差異不顯著,沒有的表示差異顯著。

該方法是最常用的多重比較結(jié)果的表示方法,在科技論文中一般采用此方法,但是比較過程較復(fù)雜。下面重點介紹其標記過程。=0.01乙甲丙丁32.1030.5824.28

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負責(zé)。
  • 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔(dān)用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

評論

0/150

提交評論