方差分析原理_第1頁
方差分析原理_第2頁
方差分析原理_第3頁
方差分析原理_第4頁
方差分析原理_第5頁
免費(fèi)預(yù)覽已結(jié)束,剩余20頁可下載查看

下載本文檔

版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請(qǐng)進(jìn)行舉報(bào)或認(rèn)領(lǐng)

文檔簡(jiǎn)介

1、2第六章方差分析第一節(jié)方差分析的基本原理上章介紹了 1個(gè)或兩個(gè)樣本平均數(shù)的假設(shè)測(cè)驗(yàn)方法。本章將介紹k(k>3)個(gè)樣本平均數(shù)的假設(shè)測(cè)驗(yàn)方法,即方差分析(analysis of varianee)。方差分析就是將總變異剖分為各個(gè)變異來源 的相應(yīng)部分,從而發(fā)現(xiàn)各變異原因在總變異中相對(duì)重要程度的一種統(tǒng)計(jì)分析方法。其中,扣除方差了各種試驗(yàn)原因所引起的變異后的剩余變異提供了試驗(yàn)誤差的無偏估計(jì),作為假設(shè)測(cè)驗(yàn)的依 據(jù)。因而,方差分析象上章的t測(cè)驗(yàn)一樣也是通過將試驗(yàn)處理的表面效應(yīng)與其誤差的比較來進(jìn) 行統(tǒng)計(jì)推斷的,只不過這里采用均方來度量試驗(yàn)處理產(chǎn)生的變異和誤差引起的變異而已。分析是科學(xué)的試驗(yàn)設(shè)計(jì)和分析中的

2、一個(gè)十分重要的工具。本章將在介紹方差分析基本原理和方法的基礎(chǔ)上進(jìn)一步介紹數(shù)學(xué)模型和基本假定。、自由度和平方和的分解方差是平方和除以自由度的商。 要將一個(gè)試驗(yàn)資料的總變異分解為各個(gè)變異來源的相應(yīng)變異,首先必須將總自由度和總平方和分解為各個(gè)變異來源的相應(yīng)部分。因此,自由度和平方和的分解是方差分析的第一步。下面先從簡(jiǎn)單的類型說起。設(shè)有k組數(shù)據(jù),每組皆具n個(gè)觀察值,6.1。則該資料共有nk個(gè)觀察值,其數(shù)據(jù)分組如表表6.1 每組具n個(gè)觀察值的k組數(shù)據(jù)的符號(hào)表組別觀察值(yij , i=1,2,,k; j=1, 2,n)總和平均均方1y11y12y1jy1nT1y12S12y21y22-y2jy2nT2y

3、22S2MMMMMMMMiyi1yi2yijyinTiyi2SiMMMMMMMkyk1yk2ykjyknTkYks2T 乏 yij =Zyy在表6.1中,總變異是nk個(gè)觀察值的變異,故其自由度 v=nk -1,而其平方和SST則為: nk_nk(6 1)SS =Z(yij y)2 =Zy2 -C1 1(6 1)中的C稱為矯正數(shù):(6 2)C=(竝工這里,nnk nk可通過總變異的恒等變換來闡明總變異的構(gòu)成。對(duì)于第i組的變異,有_2n _2n _2n _ n - -Syij -y) =11 yj -yVi y)N)十皆®$)( Vi y)+2($ y)二 2 2 = 2(yij yi)

4、 +n (yi y)j 4總變異為第1, 2,k組的變異相加,利用上式總變異(6 1)可以剖分為:knokn2k2SSt =送送® y) =SZ(yij-yi) +n Z(yy)即總平方和SSt=組內(nèi)(誤差)平方和SSe+處理平方和組間變異由k個(gè)yi的變異引起,故其自由度 V =k-1,組間平方和kkfSS =n無(yi -y)=送/n -C11/組內(nèi)變異為各組內(nèi)觀察值與組平均數(shù)的變異,故每組具有自由度n2Z(yij -yi)2 ;而資料共有k組,故組內(nèi)自由度 v=k(n 1),組內(nèi)平方和1(6 3)SStSS為:(6 4)V = n -1和平方和SSe 為:k n2sS3 =ZZ(

5、yij -%) =sst -SS1 1 因此,得到表6.1類型資料的自由度分解式為:(nk -1) =(k -1) +k(n -1)總自由度DFt=組間自由度DFt+組內(nèi)自由度 求得各變異來源的自由度和平方和后,(6-5)(6DFe-6)總的均方mst2=St組間的均方MSt=St2組內(nèi)均方MSe進(jìn)而可得n k -1=遼(弘y)2-SZ(yj - Yi)2ZZ( yj -y)2(67)k(n-1)若假定組間平均數(shù)差異不顯著 (或處理無效)時(shí),(6 7)中MSt與MSe是b2的兩個(gè)獨(dú)立估 值,均方用 MS表示,也用s2表示,兩者可以互換。其中組內(nèi)均方 MSe也稱誤差均方,它是 由多個(gè)總體或處理所

6、提供的組內(nèi)變異(或誤差)的平均值。例6.1 以A、B、C、D 4種藥劑處理水稻種子,其中A為對(duì)照,每處理各得 4個(gè)苗高觀察值(cm),其結(jié)果如表6.2,試分解其自由度和平方和。表6.2 水稻不同藥劑處理的苗高(cm)藥劑苗高觀察值總和Ti平均yiA18 21 20 137218B20 24 26 229223C10 15 17 145614D28 27 29 3211629T=336y =21根據(jù)(6 6)進(jìn)行總自由度的剖分:總變異自由度 DF T= (n k-1) = (4 x4)-1 = 15藥劑間自由度 DFt=(k-1) =4-1 =3藥劑內(nèi)自由度 DFe=k( n-1) =4x(4-

7、1) =12根據(jù)(6 3)進(jìn)行總平方和的剖分:T 23362C = = =7056nk 4 x4SS Zyi2 -C =182 +212 +A + 322 -C =602kSSt =-y) -STj2/n-C =(722 +922 +562 +1162)/4 -C =5042 2 2 2SSt =4X(18 -21) +(23 -21) +(14 -21) +(29 -21) =504k n2nk2k2/SSe =ZZ(yij -Vi) =Zyij -ZTi /n =SSt SS =602-504 =981 1 /=182 +212 +202 +132 -722/4 =38=202 +242

8、+262 +222 -922/4 =20=102 +152 +172 +142 -562/4 =262 2 2 2 2 丿=28 +27 +29 +32 -116 /4=14藥劑藥劑藥劑藥劑內(nèi):內(nèi):內(nèi):SSe=ZZ(yij-yi )2=38 +20 +26 +14 =98誤差平方和也可直接計(jì)算。進(jìn)而可得均方:MSt =sTMStMSe =s2以上藥劑內(nèi)均方s2 =8.17系4種藥劑內(nèi)變異的合并均方值,它是表 估計(jì);藥劑間均方 st2 =168.00,則是不同藥劑對(duì)苗高效應(yīng)的變異。所以=602/15 =40.13=504/3 =168.00=98/12 =8.176.2資料的試驗(yàn)誤差、F分布與F

9、測(cè)驗(yàn)分別求得其均方sj在一個(gè)平均數(shù)為 卩、方差為CT 2的正態(tài)總體中,隨機(jī)抽取兩個(gè)獨(dú)立樣本, 和s,將S12和s;的比值定義為F:(6 8)F(v V)2/2=& / S2此F值具有S12的自由度V1和s2的自由度V2。如果在給定的 匕和V2下按上述方法從正態(tài)總體中進(jìn)行一系列抽樣, 就可得到一系列的 F值而作成一個(gè)F分布。統(tǒng)計(jì)理論的研究證明,F(xiàn)分布乃具有平均數(shù) 4f=1和取值區(qū)間為0,8 的一組曲線;而某一特定曲線的形狀則僅決定 于參數(shù)V1和叫。在*1 = 1或*1=2時(shí),F(xiàn)分布曲線是嚴(yán)重傾斜成反向 J型;當(dāng)V1 > 3時(shí),曲線轉(zhuǎn) 為偏態(tài)(圖6.1)。F分布下一定區(qū)間的概率可從已

10、制成的統(tǒng) 計(jì)表查出。附表 5系各種v1和十2下右尾概率 a =0.05和a =0.01時(shí)的臨界F值(一尾概率 表)。如查附表 5, w=3,十2=12 時(shí),F(xiàn)0.05 = 3.49 , F0.01 = 5.95 ,即表示如以 V1 =3( n1=4)、 V2 = 12( n2=13)在一正態(tài)總體中進(jìn)行連續(xù)抽樣, 則所得F值大于3.49的概率僅有5%,而大于 5.95的僅有1%。附表5的數(shù)值設(shè)計(jì)是專供測(cè) 驗(yàn)s2的總體方差 切2是否顯著大于s2的總體方 差b;而設(shè)計(jì)的(H0: b; W b;對(duì)Ha : b; > b;)。這時(shí),F(xiàn) =S12/s;。若所得 F > F 0.05或 F0.0

11、1,則H0發(fā)生的概率小于等于0.05或0.01 ,應(yīng)該在a =0.05或a =0.01水平上否定 H。,接受 的概率大于0.05或0.01,應(yīng)接受H0。F圖6.1 F分布曲線(隨M和口的不同而不同)Ha;若所得 F< Fo.05或F V F0.01,貝U Ho發(fā)生在方差分析的體系中,F(xiàn)測(cè)驗(yàn)可用于檢測(cè)某項(xiàng)變異因素的效應(yīng)或方差是否真實(shí)存在。所以在計(jì)算F值時(shí),總是將要測(cè)驗(yàn)的那一項(xiàng)變異因素的均方作分子,而以另一項(xiàng)變異(例如試驗(yàn)誤差項(xiàng))的均方作分母。這個(gè)問題與方差分析的模型和各項(xiàng)變異來源的期望均方有關(guān),詳情見后。在此測(cè)驗(yàn)中,如果作分子的均方小于作分母的均方,則F<1 ;此時(shí)不必查F表即可確定

12、P>0.05,應(yīng)接受H0。2 2 2F測(cè)驗(yàn)需具備:(1)變數(shù)y遵循正態(tài)分布N (卩,CT),(2) S1和S2彼此獨(dú)立兩個(gè)條件。當(dāng) 資料不符合這些條件時(shí),需作適當(dāng)轉(zhuǎn)換,參見本章第六節(jié)。例6.2測(cè)定東方紅3號(hào)小麥的蛋白質(zhì)含量 10次,得均方sf =1.621 ;測(cè)定農(nóng)大139小麥的蛋白質(zhì)含量5次,得均方S; =0.135。試測(cè)驗(yàn)東方紅3號(hào)小麥蛋白質(zhì)含量的變異是否比農(nóng) 大139為大。假設(shè)H0:東方紅小麥總體蛋白質(zhì)含量的變異和農(nóng)大139 一樣,即H0: cr12=cr;,對(duì)Ha: crf2> 2。顯著水平取 a =0.05 , V1=9, V2=4 時(shí),F(xiàn)0.05=6.00。測(cè)驗(yàn)計(jì)算:F

13、 =1.621/0.135 =12.01 此 F > F0.05,即 P< 0.05。139。以上這種比較兩個(gè)事物變異大小的例子,在農(nóng)業(yè)研究中是常常遇到的。例如比較雜種 代和F1代的變異大小,比較兩種處理的草坪凍害程度等等,這些比較皆可應(yīng)用 必須以大均方作分子而計(jì)算F值。例6.3 在例6.1算得藥劑間均方St2 = 168.00,藥劑內(nèi)均方s2=8.17 ,V2 = 12。試測(cè)驗(yàn)藥劑間變異是否顯著大于藥劑內(nèi)變異? 假設(shè) H0: cr;=cr2對(duì) Ha: 寸 > 云,顯著水平取 a =0.05 , F0.05 = 3.49。測(cè)驗(yàn)計(jì)算:F =168.00/8.1 7 =20.56

14、計(jì)算得F=20.56表示處理項(xiàng)的均方為誤差項(xiàng)均方的20.56倍。查附表5F0.05=3.49 , F0.01 =5.95,實(shí)得 F > F0.01 > F0.05。F2F測(cè)驗(yàn),但都具自由度Vi=3,=3, V2=12 時(shí)推斷:否定H0,接受Ha,即東方紅3號(hào)小麥蛋白質(zhì)含量的變異大于農(nóng)大推斷:否定H0: bt2 = b;,接受Ha: 62 >b訂即藥劑間變異顯著地大于藥劑內(nèi)變異,不同藥劑對(duì)水稻苗高是具有不同效應(yīng)的。以上通過例6.1說明了對(duì)一組處理的重復(fù)試驗(yàn)數(shù)據(jù)經(jīng)對(duì)總平方和與總自由度的分解估計(jì) 出處理間均方和處理內(nèi)均方(誤差均方),并通過F =MSt/MSe測(cè)驗(yàn)處理間所表示出的差

15、異是 否真實(shí)(比誤差大),這一方法即為方差分析法。這里所測(cè)驗(yàn)的統(tǒng)計(jì)假設(shè)是H0 W或£ =4b =% =4d對(duì)Ha :屛或£、4b、卩C和Ad間存在差異(不一定 £、和 4d間均不等,可能部分不等)。例6.1和例6.3的分析結(jié)果可以歸納在一起,列出方差分析 表,如表6.3所示。表6.3水稻藥劑處理苗高方差分析表變異來源DFSSMSF顯著F值藥劑處理間3504168.0020.56 八Fo.O5(3,12) =3.49藥劑處理內(nèi)(誤差)12988.17Fo.O1(3,12) =5.95總15602第二節(jié)多重比較上節(jié)對(duì)一組試驗(yàn)數(shù)據(jù)通過平方和與自由度的分解,將所估計(jì)的處理

16、均方與誤差均方作比 較,由F測(cè)驗(yàn)推論處理間有顯著差異,對(duì)有些試驗(yàn)來說方差分析已算告一段落,但對(duì)有些試 驗(yàn)來說,其目的不僅在于了解一組處理間總體上有無實(shí)質(zhì)性差異,更在于了解哪些處理間存在真實(shí)差異,故需進(jìn)一步做處理平均數(shù)間的比較。一個(gè)試驗(yàn)中k個(gè)處理平均數(shù)間可能有k(k-1)/2個(gè)比較,因而這種比較是復(fù)式比較亦稱為多重比較(multiple comparisons)。通過方差分析后進(jìn)行平均數(shù)間的多重比較,不同于處理間兩兩單獨(dú)比較。因?yàn)椋?)誤差由多個(gè)處理內(nèi)的變異合并估計(jì),自由度增大了,因而比較的精確度也增大了;(2)由于F測(cè)驗(yàn)顯著,證實(shí)處理間總體上有真實(shí)差異后再做兩兩平均數(shù)的比較,不大會(huì)像單獨(dú)比較時(shí)

17、那樣將個(gè)別偶然性的差異誤判為真實(shí)差異。這種在F測(cè)驗(yàn)基礎(chǔ)上再做的平均數(shù)間多重比較稱為Fisher氏保護(hù)下的多重比較(Fisher 'p rotected multi pie comp ariso ns )。顯然在無F測(cè)驗(yàn)保護(hù)時(shí),4個(gè)處理做兩兩比較,每一比較的顯著水平 a =0.05 , 4個(gè)處理間有6個(gè)比較,若處理間總體上無差異,每一比較誤判 為有差異的概率為 0.05,貝y 6個(gè)比較中至少有1個(gè)被誤判的概率為 a '=1 0.95 6 =0.2649。 若處理數(shù)k=10,則a '= 1 -0.95 45 =0.9006,因而盡管單個(gè)比較的顯著水平為0.05,但從試驗(yàn)總體

18、上a(至少有1個(gè)誤判的概率)是很大的,這說明通過F測(cè)驗(yàn)作保護(hù)是非常必要的。多重比較有多種方法,本節(jié)將介紹常用的三種:最小顯著差數(shù)法、復(fù)極差法(q法)和Duncan氏新復(fù)極差法。、最小顯著差數(shù)法最小顯著差數(shù)法(least significant differenee,簡(jiǎn)稱LSD法),LSD法實(shí)質(zhì)上是第五章的t測(cè)驗(yàn)。其程序是:在處理間的F測(cè)驗(yàn)為顯著的前提下,計(jì)算出顯著水平為a的最小顯著差數(shù)LSDa;任何兩個(gè)平均數(shù)的差數(shù)(Vi -Vj),如其絕對(duì)值LSDa,即為在a水平上差異顯著;反之,則為在a水平上差異不顯著。這種方法又稱為 F測(cè)驗(yàn)保護(hù)下的最小顯著差數(shù)法(Fisher'Protected

19、LSD,或 FPLSD)。已知:t=匸亠,j=1, 2,A, k; i Hj) syi _yj若tl A t。, Vi -yj即為在a水平上顯著。因此,最小顯著差數(shù)為:-9),因此(6 9)中的LSDa=t4idj(6當(dāng)兩樣本的容量n相等時(shí),Sy =J2Se/n在方差分析中,上式的 S2有了更精確的數(shù)值 MSe (因?yàn)榇俗杂啥仍龃螅?0)(6Sy,占為:Syz =J2MSe/n例6.4 試以LSD法測(cè)驗(yàn)表6.2資料各種藥劑處理的苗高平均數(shù)間的差異顯著性。(2x8.17CCC,、Syi 衛(wèi)=J4 =2.02( cm)4, V = 12 時(shí),t0.05=2.179 , t0.01=3.055LSD

20、0.05=2.179 X 2.02 =4.40( cm) ; LSD0.01=3.055 X 2.02 =6.17( cm)由(例 6.3)計(jì)算得 F=20.56 為顯著,MSe=8.17,DFe=12,由附表 故然后將各種藥劑處理的苗高與對(duì)照苗高相比,差數(shù)大于4.40 cm為差異顯著;大于6.17 cm為差異極顯著。由表6.2可知:藥劑D與A、D與C、以及B與C處理平均數(shù)差數(shù)分別為11、15和9,大于6.17,說明在0.01水平上差異顯著;藥劑 D與B、B與A處理平均數(shù)差數(shù)分 別為6和5,大于4.40,說明在0.05水平上差異顯著;藥劑 A與C處理平均數(shù)差數(shù)為 4,小 于4.40,差異不顯著

21、。二、q法LSD法的t測(cè)驗(yàn)是根據(jù)兩個(gè)樣本平均數(shù)差數(shù)(k=2)的抽樣分布提出的,但是一組處理(k>2)是同時(shí)抽取k個(gè)樣本的結(jié)果。抽樣理論指出k=2時(shí)與k>2,例如k=10時(shí)其隨機(jī)極差是不同的,隨著k的增大而增大,因而用 k=2時(shí)的t測(cè)驗(yàn)有可能夸大了 k=10時(shí)最大與最小兩個(gè) 樣本平均數(shù)差數(shù)的顯著性。基于極差的抽樣分布理論Student-Newman-Keul提出了 q測(cè)驗(yàn)或稱復(fù)極差測(cè)驗(yàn),有時(shí)又稱 SNK測(cè)驗(yàn)或NK測(cè)驗(yàn)。q測(cè)驗(yàn)方法是將一組 k個(gè)平均數(shù)由大到小排列后, 根據(jù)所比較的兩個(gè)處理平均數(shù)的差數(shù)是 幾個(gè)平均數(shù)間的極差分別確定最小顯著極差LSR值的。q測(cè)驗(yàn)因是根據(jù)極差抽樣分布原理的,

22、其各個(gè)比較都可保證同一個(gè) a顯著水平。其尺度值構(gòu)成為:(6 11)LSRj =qa df, pSESE=jMSe/ n(6 12)式中2< pw k, p是所有比較的平均數(shù)按大到小順序排列所計(jì)算出的兩極差范圍內(nèi)所包含的平 均數(shù)個(gè)數(shù)(稱為秩次距),SE為平均數(shù)的標(biāo)準(zhǔn)誤, 可見在每一顯著水平下該法有k-1個(gè)尺度值。平均數(shù)比較時(shí),尺度值隨秩次距的不同而異。例6.5 試對(duì)表6.2資料的各平均數(shù)作q測(cè)驗(yàn)。由6.1資料得:SE =jMSe / n = J8.17/4 =1.4292 "43查附表7 q值表,當(dāng)DF = 12時(shí),p=2, 3, 4的值,并由(6 11)計(jì)算出尺度值LSR, 列

23、于表6.4。Pqo.o5qo.o1LSR0.05lSrd.0123.084.324.406.1833.775.045.397.2144.205.506.017.87表6.4 表6.2資料LSRa值的計(jì)算(q測(cè)驗(yàn))由此可得到:由表6.2可知,當(dāng)p=2 時(shí),p=3 時(shí),p=4 時(shí),VD=29cm, Vb =23cm, ya = 18cm , yc =14cm。Vd - Vb =6(cm)Va =5( cm)yc =4( cm) yA=11(cm)Yc =9(cm)Vc =15( cm)Vb-Va-Vd-yB-Vd-5 %水平上顯著;5 %水平上顯著; 不顯著。1 %水平上顯著;1 %水平上顯著。1

24、 %水平上顯著。三、新復(fù)極差法不同秩次距P下的最小顯著極差變幅比較大,(shortest significant ranges ,為此,D. B. Duncan(1955)SSR)。該法與q法相似,從表6.4可以發(fā)現(xiàn),提出了新復(fù)極差法,又稱最短顯著極差法其區(qū)別在于計(jì)算最小顯著極差LSRa時(shí)不是查q表而是查SSR表,所得最小顯著極差值隨著k增大通常比q測(cè)驗(yàn)時(shí)的減小。查得 SSR, P后,有LS = SE SSR, p(6 13)此時(shí),在不同秩次距 P下,平均數(shù)間比較的顯著水平按兩兩比較是a ,但按P個(gè)秩次距則為保護(hù)水平 a ' =1-(1 _a) Pd。例6.6 試對(duì)表6.2資料的各平均

25、數(shù)作新復(fù)極差測(cè)驗(yàn)。已知 Yd =29cm, Vb =23cm, Va =18cm, Vc =14cm, MSe=8.17 , SE=1.43(cm) 查附表8,得SSRt值,由(6 13)算得在p=2, 3, 4時(shí)的LS甩值(表6.5),即為測(cè)驗(yàn)不 同P時(shí)的平均數(shù)間極差顯著性的尺度值。表6.5 表6.2資料LSR值的計(jì)算(新復(fù)極差測(cè)驗(yàn))PSSF0.05SSFF).01LSRo.o5LSR0.0123.084.324.406.1833.234.554.626.5143.334.684.766.69當(dāng)p=2時(shí),yD- yB=6( cm)5 %水平顯著;yB- y A=5( cm)5 %水平顯著;y

26、A- yC=4( cm)不顯著。當(dāng)p=3 時(shí),yD- yA=11(cm)1 %水平上顯著;yB - yc=9(cm)1 %水平上顯著。當(dāng)p=4 時(shí),Yd - yC =15( cm)1 %水平上顯著。結(jié)論:表6.2資料的4個(gè)處理的苗高,除處理A與C差異不顯著外,其余處理間均達(dá)顯 著差異,本例結(jié)果與上面介紹的q測(cè)驗(yàn)法相同,但q法的LSR要比新復(fù)極差法的LSR大。四、多重比較結(jié)果的表示方法各平均數(shù)經(jīng)多重比較后,應(yīng)以簡(jiǎn)潔明了的形式將結(jié)果表示出來。常用的表示方法有:(一)列梯形表法將全部平均數(shù)從大到小順次排列,然后算出各平均數(shù)間的差數(shù)。凡達(dá)到a =0.05水平的差“* ”號(hào),凡未達(dá)到a =0.056.6

27、。數(shù)在右上角標(biāo)一個(gè)“* ”號(hào),凡達(dá)到a =0.01水平的差數(shù)在右上角標(biāo)兩個(gè) 水平的差數(shù)則不予標(biāo)記。若以列梯形表法表示,則成表處理平均數(shù)(yi)差異y -14Yi -18yi -23D2915*11*6*B239*5*A184C14表6.6 表6.2資料的差異顯著性(新復(fù)極差測(cè)驗(yàn))該法十分直觀,但占篇幅較大,特別是處理平均數(shù)較多時(shí)。因此,在科技論文中少見。(二)劃線法以第將平均數(shù)按大小順序排列,差異不顯著的平均數(shù)用橫線連接起來, 這種方法稱劃線法。下面就是表6.2法)。1個(gè)平均數(shù)為標(biāo)準(zhǔn)與以后各平均數(shù)比較,在平均數(shù)下方把依次以第2,,k-1個(gè)平均數(shù)為標(biāo)準(zhǔn)按上述方法進(jìn)行。資料用劃線法標(biāo)出0.01水平

28、下平均數(shù)差異顯著性結(jié)果(q29cm(D)23cm(B)18cm(A)14cm(C)該法直觀、簡(jiǎn)單方便,所占篇幅也較少。(三)標(biāo)記字母法:首先將全部平均數(shù)從大到小依次排列。然后在最大的平均數(shù)上標(biāo)上字母a;并將該平均數(shù)與以下各平均數(shù)相比,凡相差不顯著的,都標(biāo)上字母a,直至某一個(gè)與之相差顯著的平均數(shù)則標(biāo)以字母b(向下過程),再以該標(biāo)有b的平均數(shù)為標(biāo)準(zhǔn),與上方各個(gè)比它大的平均數(shù)比,凡不 顯著的也一律標(biāo)以字母 b(向上過程);再以該標(biāo)有b的最大平均數(shù)為標(biāo)準(zhǔn), 與以下各未標(biāo)記的Co平均數(shù)比,凡不顯著的繼續(xù)標(biāo)以字母 b,直至某一個(gè)與之相差顯著的平均數(shù)則標(biāo)以字母 如此重復(fù)進(jìn)行下去,直至最小的一個(gè)平均數(shù)有了標(biāo)記

29、字母且與以上平均數(shù)進(jìn)行了比較為止。這樣各平均數(shù)間,凡有一個(gè)相同標(biāo)記字母的即為差異不顯著,凡沒有相同標(biāo)記字母的即為差異顯著。在實(shí)際應(yīng)用時(shí),往往還需區(qū)分a =0.05水平上顯著和a =0.01水平上顯著。這時(shí)可以小寫 字母表示a =0.05顯著水平,大寫字母表示 a =0.01顯著水平。該法在科技論文中常常出現(xiàn)。例6.7試對(duì)例6.6測(cè)驗(yàn)結(jié)果作出字母標(biāo)記。在表6.7上先將各平均數(shù)按大小順序排列,并在yD行上標(biāo)a。由于與Vb呈顯著差異,6.7 o故Vb上標(biāo)b。然后以Vb為標(biāo)準(zhǔn)與Ya相比呈顯著差異,故標(biāo) C。以Va為標(biāo)準(zhǔn)與Vc比,無顯著 差異,仍標(biāo)C。同理,可進(jìn)行4個(gè)y在1 %水平上的顯著性測(cè)驗(yàn),結(jié)果列

30、于表表6.7 表6.2資料的差異顯著性(新復(fù)極差測(cè)驗(yàn))處 理苗高平均數(shù)(cm)差異顯著性0.050.01D29aAB23bABA18cBCC14cC由表6.7就可清楚地看出,該試驗(yàn)除 A與C處理無顯著差異外,D與B及A、C處理間 差異顯著性達(dá)到 a =0.05水平。處理 B與A、D與B、A與C無極顯著差異;D與A、C,B 與C呈極顯著差異。多重比較方法很多,可閱讀其它參考書籍,以上列舉的是常用的方法。五、多重比較方法的選擇以上介紹三種多重比較方法。方法越多便存在選用何種更好的問題。根據(jù)統(tǒng)計(jì)學(xué)家的意見每種方法都有依據(jù),也都有不足。這里提供幾點(diǎn)原則供選用時(shí)參考:(1)試驗(yàn)事先確定比較的標(biāo)準(zhǔn),凡與對(duì)

31、照相比較,或與預(yù)定要比較的對(duì)象比較,一般可選用最小顯著差數(shù)法;(2)根據(jù)否定一個(gè)正確的 Ho和接受一個(gè)不正確的 H0的相對(duì)重要性來決定。按上述同一資料(表6.2 資料)的測(cè)驗(yàn)計(jì)算,可以看到當(dāng) k=2時(shí),LSD法,SSR和q測(cè)驗(yàn)的顯著尺度都完全相同,并且 SS%=qa而q =t血,又由于=1,甩弋,所以q與F的關(guān)系是q。k> 3時(shí),三種FPLSD法進(jìn)行多重比較,不必采方法的顯著尺度不相同,LSD法最低,SSR法次之,q法最高。故LSD測(cè)驗(yàn)在統(tǒng)計(jì)推斷時(shí)犯第 一類錯(cuò)誤的概率最大,q測(cè)驗(yàn)最小,而SSR測(cè)驗(yàn)介于兩者之間,因此,對(duì)于試驗(yàn)結(jié)論事關(guān)重大 或有嚴(yán)格要求的, 宜用q測(cè)驗(yàn),q測(cè)驗(yàn)可以不經(jīng)過 F

32、測(cè)驗(yàn);一般試驗(yàn)可采用 SSR測(cè)驗(yàn);也有統(tǒng) 計(jì)學(xué)家近期認(rèn)為最小顯著差數(shù)法已由F測(cè)驗(yàn)保護(hù),可以采用用復(fù)雜的極差法測(cè)驗(yàn)。綜上所述,方差分析的基本步驟是:(1)將資料總變異的自由度和平方和分解為各變異原 因的自由度和平方和,并進(jìn)而算得其均方;(2)計(jì)算均方比,作出 F測(cè)驗(yàn),以明了各變異因素的重要程度;(3)對(duì)各平均數(shù)進(jìn)行多重比較。第三節(jié)方差分析的線性模型與期望均方、方差分析的線性數(shù)學(xué)模型方差分析是建立在一定的線性可加模型基礎(chǔ)上的。所謂線性可加模型是指總體每一個(gè)變量可以按其變異的原因分解成若干個(gè)線性組成部分,它是方差分析的理論依據(jù)。表6.1數(shù)據(jù)的線性模型可表示為:yij=卩 + 山 +別(6 14)上式

33、中,卩為總體平均數(shù),Ti為試驗(yàn)處理效應(yīng),£ij為隨機(jī)誤差具有分布 N(0 , b2)。 (6 14)說明,象表6.1類型的資料,其每一觀測(cè)值都由總體平均數(shù)4、處理效應(yīng)Ti和隨機(jī)誤差gjj三個(gè)部分相加而成。在以樣本符號(hào)表示時(shí),樣本的線性組成為:(6 15)yij=y + ti + eij其中,y是卩的無偏估計(jì)量,ti是Ti的無偏估計(jì)量,se =Seij /( n -1)為其所屬亞總體誤差方i y /差bi22 2 .O! =6 =A =b的無偏估計(jì)量。當(dāng)測(cè)驗(yàn)H0: A1=A2=A=Ak時(shí),假定出二巴二人二和二卩和f =cr2, s; =Zeij2/n -1)可看作是總體CT2的無偏估計(jì)

34、量。因而各亞總體 S:k n/合并的SeZeij才K n -1)也是b的無偏估計(jì)量。i ij 1/,故k個(gè)樣本的平方和是對(duì)于ti部分,每一樣本的平方和是nti2 = n(yi -y)2 k 2k22n£ti = n£(yi -y),而處理間方差St為:i iy2 n Zti n S(yi-y)St =k -1k1因?yàn)閠i =Ti +ei,故St2 =宜估計(jì)了 n 遷i i ik-1(k -1 n 丿k-1(6 16),或警?;?qū)憺?(6-17)這一部分,因試驗(yàn)?zāi)P偷牟煌兴鶇^(qū)別。、期望均方在線性可加模型中,關(guān)于 £部分的假定,由于對(duì) Ti有不同的解釋產(chǎn)生了固定模

35、型(I )和隨機(jī)模型(n)。從理論上講,固定模型是指各個(gè)處理的平均效應(yīng)Tih -)是固定的一個(gè)常量,且滿足Zii =0(或£ ni =0),但常數(shù)未知;隨機(jī)模型是指各個(gè)處理效應(yīng) Ti不是一個(gè)常量,而是從平 均數(shù)為零、方差為 疇的正態(tài)總體中得到的一個(gè)隨機(jī)變量,即TiN(0, CT ;)。研究中,前者主要是研究并估計(jì)處理效應(yīng);后者主要是研究并估計(jì)總體變異即方差。例如,若要了解幾個(gè)水稻新品種產(chǎn)量或幾種密度、幾種肥料、幾種農(nóng)藥的效應(yīng)等,那么研究對(duì)象是處理本身,處理效 應(yīng)T為固定的處理效應(yīng),就是固定模型。換言之,固定模型僅在于供試處理范圍內(nèi)了解處理 間的不同效應(yīng)。如果目的是要對(duì)這些處理所屬的總

36、體作出推論,例如研究江淮地區(qū)大豆地方品種的遺傳變異,從該地區(qū)大量地方品種中隨機(jī)抽取一部分品種作為代表進(jìn)行試驗(yàn),以便通過這部分供試品種的試驗(yàn)結(jié)果推論該地區(qū)大豆地方品種的總體情況,這種處理效應(yīng)便是隨機(jī)模型的處理效應(yīng)。在隨機(jī)模型中,因?yàn)楦魈幚韮H是所屬總體的隨機(jī)變量,故總體方差CT;是重要的研究對(duì)象。由上可知,固定模型和隨機(jī)模型,在試驗(yàn)設(shè)計(jì)思想和統(tǒng)計(jì)推斷上是有明顯不同的。固定模型中所得的結(jié)論僅在于推斷關(guān)于特定的處理;而隨機(jī)模型中試驗(yàn)結(jié)論則將用于推斷處理的總 體。此外,在期望均方和 F測(cè)驗(yàn)方面,固定模型和隨機(jī)模型也是有明顯不同的,后面的內(nèi)容 將予以說明。(一) 固定模型(fixed model )例6.

37、8 以5個(gè)水稻品種作大區(qū)比較試驗(yàn),每品種作 3次取樣,測(cè)定其產(chǎn)量,所得數(shù)據(jù) 為單向分組資料。本試驗(yàn)需明確各品種的效應(yīng), 故為固定模型,其方差分析和期望均方的參數(shù) 估計(jì)列于表6.8 。表6.8 5個(gè)水稻品種產(chǎn)量的方差分析和期望均方表變異來源DFSSMS期望均方(EMS):固定模型品 種 間487.621.90cr2+nK:2品種內(nèi)(試驗(yàn)誤差)1024.02.402Cy T2固定模型中t屬于固定效應(yīng),其限制條件為 送Ti =0, (6 77)中為固定效應(yīng)的方差,k 1用號(hào)2表示之,因而表 6.8的品種間均方估計(jì)了 b2 + nTC;。本例中品種內(nèi) MS估計(jì)了 CT2,因而C?2 =2.40 ;品種

38、間 MS估計(jì)了 CT2 + n瓷2因而 + ni?2=21.9,應(yīng)2 珂21.90 2.40)/3 =6.50。固定模型的F測(cè)驗(yàn)St2合2 + ni?2F 七=Se0若埼=0,則F值等于1。所以固定模型是測(cè)驗(yàn)假設(shè)H0: Ti =0(i=1 , 2,,k)對(duì)Ha: £工0,即測(cè)驗(yàn)H0:氣=卩2 =A =4k。因而,一般比較處理效應(yīng)的試驗(yàn)都應(yīng)當(dāng)采用固定模型。(二) 隨機(jī)模型(random model )例6.9研究秈粳稻雜交F5代系間單株干草重的遺傳變異,隨機(jī)抽取76個(gè)系進(jìn)行試驗(yàn),每系隨機(jī)取2個(gè)樣品測(cè)定干草重(g/株)。因這76個(gè)系是隨機(jī)抽取的樣本,要從這些樣本來估 計(jì)F5代系間單株干草

39、重的遺傳變異,故這是隨機(jī)模型。其單向分組分析結(jié)果見表6.9。表6.9秈粳雜種F5代干草重的方差分析和期望均方變異來源DFMS期望均方(EMS):隨機(jī)模型系 統(tǒng)間7572.792 2c +系統(tǒng)內(nèi)(試驗(yàn)誤差)7617.772c為隨機(jī)效應(yīng)的方差, k -1CT2,因而(?2 =17.77 ;-17.77)/2=27.51。因而表6.9的系統(tǒng)間均方估計(jì)了CT2系統(tǒng)間MS估計(jì)了 b2 + nb;因而& 隨機(jī)模型的F測(cè)驗(yàn)隨機(jī)模型中飛是從總體隨機(jī)抽出的,服從N(0 , CT;) , (6 ,17)中乙+ ncr;。本例中系統(tǒng)內(nèi) MS估計(jì)了2 2+ n&t=72.79 ,浮T =72.79S;

40、t?2 +nc?;F-IHa: b2=0。顯然,這是測(cè) 測(cè)驗(yàn)顯著則表示處理間的變 說明CT;是存在的。 暉=25.71測(cè)度了系統(tǒng) 凸2代表了環(huán)境條件所致的變異(記s2 少若假設(shè)CT; =0,貝U F=1。因而,隨機(jī)模型的假設(shè)為H0: CT2=0對(duì)驗(yàn)處理效應(yīng)的變異度(方差),而不是測(cè)驗(yàn)處理效應(yīng)本身。如果 F 異是顯著的。本例 F =72.79/17.7 7=4.09 > F0.05,,因而可求出遺傳型變異占表型變異的份量,這就是間變異。本例中,??;(或記為應(yīng)g)代表了系間遺傳型的變異; 作5;)。白g +0;代表了系間的表型變異 數(shù)量遺傳中常用的遺傳率h2,即:(6 18)這是隨機(jī)模型方差

41、分析在數(shù)量遺傳學(xué)中的應(yīng)用。在本例可求得:27 51h2 = =0.6076 或 60.76%27.51 +17.77即秈粳雜種F5家系間的表型變異中有 60.76 %歸屬于遺傳原因的變異。當(dāng)試驗(yàn)因素在2個(gè)或2個(gè)以上時(shí),可以在固定模型和隨機(jī)模型的基礎(chǔ)上產(chǎn)生第三種模型:混合模型(記作模型川)。混合模型乃既包括有固定模型的試驗(yàn)因素, 又包括有隨機(jī)模型的試驗(yàn)因素的模型。這類模型凡隨機(jī)因素仍用CT 2表示,固定模型用K2表示。混合模型中的期望均方組成因包括有不同的成份,應(yīng)選擇恰當(dāng)?shù)木竭M(jìn)行F測(cè)驗(yàn),第13章將作介紹。第四節(jié) 單向分組資料的方差分析如表6.1及6.2所示。所用的試驗(yàn)設(shè)單向分組資料是指觀察值僅

42、按一個(gè)方向分組的資料, 計(jì)為完全隨機(jī)試驗(yàn)設(shè)計(jì)。、組內(nèi)觀察值數(shù)目相等的單向分組資料的方差分析這是在k組處理中,每處理皆含有 n個(gè)供試單位的資料如表6.1。在作方差分析時(shí),其任一觀察值的線性模型皆由(6 14)表示,方差分析如表6.10 。表6.10組內(nèi)觀察值數(shù)目相等的單向分組資料的方差分析變異 來源自由度DF平方和SS均方MSF-期望均方ems固定模型隨機(jī)模型處理間k-12nS(yi -y)MStMSt/MSe2 2CT2 2b +ncyj誤差k(n-1)ZZWj -yj2MSe2C72C7總變異nk-1SWj y)2例6.10作一水稻施肥的盆栽試驗(yàn),設(shè)5個(gè)處理,A和B系分別施用兩種不同工藝流程

43、的氨水,C施碳酸氫銨,D施尿素,E不施氮肥。每處理 4盆(施肥處理的施肥量每盆皆為 折合純氮1.2克),共5X 4=20盆,隨機(jī)放置于同一網(wǎng)室中,其稻谷產(chǎn)量(克/盆)列于表6.11 ,試測(cè)驗(yàn)各處理平均數(shù)的差異顯著性。(1)分析步驟:)自由度和平方和的分解表6.11 水稻施肥盆栽試驗(yàn)的產(chǎn)量結(jié)果處理觀察值(yij)(克/盆)TViA (氨水1)2430282610827.0B (氨水2)272421269824.5C (碳酸氫銨)3128253011428.5D (尿素)3233332812631.5E (不施)212216218020.052626.3總變異自由度 DFt= nk-1 =5X 4

44、-1=19處理間自由度 DFt=k-1=5-1 =4誤差(處理內(nèi))自由度DFe=k( n-1) =5 X (4-1) =15矯正數(shù) C =T2/nk =5262/(5 I) =13833.8 SSt =2:y2 -C =242 +302 +A + 212 -C =402.2 SS =ZTi7n C =(1082 +982 +A +802) /4 C =301.2 SS =402.2 -301.2 =101.0F測(cè)驗(yàn)將上述結(jié)果錄入表 6.12 ,假設(shè)H。:=AbA =4e , Ha: A、4B、卩e不全相等。為了測(cè)驗(yàn)H。,計(jì)算處理間均方對(duì)誤差均方的比率,算得F =75.3/6.73 =11.19

45、,查F表當(dāng)v 1=4,V2 = 15時(shí),F(xiàn)0.01=4.89,現(xiàn)實(shí)得F = 11.19 > F0.01,故否定H0,推斷這個(gè)試驗(yàn)的處理平均數(shù)間是 有極顯著差異的。表6.12 表6.11資料的方差分析變異來源DFSSmsFF 0.01F 0.01處理間4301.275.3011.19 *3.064.89處理內(nèi)(試驗(yàn)誤差)15101.06.73總變異19402.2(3)各處理平均數(shù)的比較算得單個(gè)平均數(shù)的標(biāo)準(zhǔn)誤SE 6.73/4 =1.297根據(jù)V = 15,查SSR表得p=2, 3,4,5時(shí)的SSF0.05與SSR©值,將SSR值分別乘以SE 值,即得SRa值,列于表6.13。進(jìn)而

46、進(jìn)行多重比較(表 6.14)。LSRa值計(jì)算表 6.13多重比較時(shí)的PSSR.05SSR0.01LSR0.05LSR0.0123.014.173.905.4133.164.374.105.6743.254.504.225.8453.314.584.295.94表 6.14施肥效果的顯著性(SSR測(cè)驗(yàn))處理平均產(chǎn)量差異顯著性(克/盆)5%1%尿素31.5aA碳酸氫銨28.5abAB氨水127.0beAB氨水224.0eBC不施20.0dC推斷:根據(jù)表6.14多重比較結(jié)果可知, 施用氮肥(A、B、C和D)與不施氮肥有顯著差異, 且施用尿素、碳酸氫銨、氨水1與不施氮肥均有極顯著差異;尿素與碳酸氫銨、

47、碳酸氫銨與氨 水1、氨水1與氨水2處理間均無顯著差異。、組內(nèi)觀察值數(shù)目不等的單向分組資料的方差分析若k個(gè)處理中的觀察值數(shù)目不等,分別為n1, n2,,nk,在方差分析時(shí)有關(guān)公式因ni不相同而需作相應(yīng)改變。主要區(qū)別點(diǎn)如下:(1)自由度和平方和的分解總變異自由度處理間自由度誤差自由度DFt =送 ni -1DFt =k -1DFZ rij k(6 19)(2)多重比較平均數(shù)的標(biāo)準(zhǔn)誤為:Sst =2(y-y)2 =2y2 -Ckssni (Vi y)2 =2Ti2/ni Cizik mSS, =5:S(yij yj2 =SSr -SSt(6 20)(6GL 1/MSe 丄 MSe、 jlMSe/ 1

48、 丄 1、SE 2(+ )=(+) V2 nAne ¥ 2 nA ne上式的nA和ne系兩個(gè)相比較的平均數(shù)的樣本容量。但亦可先算得各(2>i)2 -送n,2門0 =(罰 i)(k1)(6 21)m的平均數(shù)no。-22)然后有:SE=jMSe/noSy,衛(wèi)=J2MSe/no例6.11某病蟲測(cè)報(bào)站,調(diào)查四種不同類型的水稻田百叢蟲口密度列于表 6.15,試問不同類型稻田的蟲口密度有否顯著差異?(6(6-23)-24)28塊,每塊田所得稻縱卷葉螟的號(hào)表6.15不同類型稻田縱卷葉螟的蟲口密度編12345678 iyi"iI1213141515161710214.577n1410

49、111314117312.176m921011121312118010.008IV1211109810127210.297T=327 y =11.68送山=28該資料送ni =7+6+8+7=28 故總變異自由度 DFt= 2 ni-1 =28-1 =27稻田類型間自由度 DFt=k-1 =4-1 =3誤差自由度 DFe= 2 ni-k=28-4 =24求得:2C =(327) /28 =3818.89SSt =122 中132 +A +122 C =4045.00 -3818.89 =226.11SSt =1022 /7 +732 /6 +802 /8 +722 /7 -C =96.13SS

50、e SS, -SSt =129.98列入方差分析表6.16。表6.16 表6.15資料的方差分析變異來源DFSSMSFF0.01稻田類型間396.1332.045.91 *4.72誤差24129.985.42總變異27226.11表6.16所得F = 5.91 > F0.01,因而應(yīng)否定 H0:片=卩2 =卩3二巴,即4塊麥田的蟲口密度 間有極顯著差異。F測(cè)驗(yàn)顯著,再作平均數(shù)間的比較。 需進(jìn)一步計(jì)算n0,并求得SE( LSR測(cè)驗(yàn))或(LSD測(cè)驗(yàn))。如在此可有:no28x2SE =J5.42/10=0.736 (頭)s -1.込-ij -y2x5.42T.。41 (頭)嚴(yán)2 "

51、2 +62 +82 +72)=10.46 10三、組內(nèi)又分亞組的單向分組資料的方差分析如果每組又分若干個(gè)亞組,而每個(gè)亞組內(nèi)又有若干個(gè)觀察值,則為組內(nèi)分或稱系統(tǒng)分組資料。 系統(tǒng)分組并不限于組內(nèi)僅分亞組,如此一環(huán)套一環(huán)地分下去。這種試驗(yàn)稱為巢式試驗(yàn)(n ested如對(duì)數(shù)塊土地取土樣分析,每塊地取了若 或調(diào)查某種果樹病害,隨機(jī)取若干株,每皆為系統(tǒng)分組資料。以下亞組內(nèi)還可分小單向分組資料, 亞組的單向分組資料, 組,小組內(nèi)還可分小亞組, exp erime nt)。在農(nóng)業(yè)試驗(yàn)上系統(tǒng)分組資料是常見的。 干樣點(diǎn),而每一樣點(diǎn)的土樣又作了數(shù)次分析的資料, 株取不同部位枝條,每枝條取若干葉片查其各葉片病斑數(shù)的資料等, 討論二級(jí)分組每組觀察值數(shù)目相等的系統(tǒng)

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請(qǐng)下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請(qǐng)聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會(huì)有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫(kù)網(wǎng)僅提供信息存儲(chǔ)空間,僅對(duì)用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對(duì)用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對(duì)任何下載內(nèi)容負(fù)責(zé)。
  • 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請(qǐng)與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶因使用這些下載資源對(duì)自己和他人造成任何形式的傷害或損失。

最新文檔

評(píng)論

0/150

提交評(píng)論