




版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進(jìn)行舉報或認(rèn)領(lǐng)
文檔簡介
1、第五章 方差分析(一),第一節(jié) 方差分析原理 (一個性質(zhì)、兩個分布、三個假定) 第二節(jié) 單向分組數(shù)據(jù) (各組觀察值個數(shù)有相同和不相同之分) 第三節(jié) 多向分組數(shù)據(jù) (含兩向分組、三向分組實(shí)例) 第四節(jié) 三個假定與數(shù)據(jù)轉(zhuǎn)換* (正態(tài)性、可加性、同質(zhì)性),第五章要點(diǎn)提示,方差分析是本課程的重點(diǎn),它與試驗(yàn)研究聯(lián)系最為密切。學(xué)習(xí)時要從完全隨機(jī)設(shè)計(單向分組)的試驗(yàn)數(shù)據(jù)著手,結(jié)合顯著性檢驗(yàn)的知識,深刻理解方差分析原理的全部內(nèi)涵,即一個性質(zhì)、兩個分布和 三個假定(某些情況下作數(shù)據(jù)轉(zhuǎn)換的必要性); 區(qū)分LSR法多重比較與t-test的異同點(diǎn); 重點(diǎn)掌握單因素隨機(jī)區(qū)組和拉丁方試驗(yàn)結(jié)果的方差分析法,能熟練地運(yùn)用字
2、母法標(biāo)記多重比較結(jié)果。 涉及教材內(nèi)容:第六章第一、二、五節(jié),第十二章第五、六、七節(jié)。 作業(yè)布置:教材第六章第四節(jié)內(nèi)容自習(xí);教材P150 T1、 T3、 T4、 T12、 T13、T14、 T21 、T22 、 T23 ,教材P325 T7、 T8、 T13。,第一節(jié) 方差分析原理,方差分析(analysis of variance),縮 寫詞原為ANOVA, 現(xiàn)在也用AOV。 它是對多個樣本平均數(shù)進(jìn)行假設(shè)測 驗(yàn)的方法, 因?yàn)閷θ齻€以上的平均數(shù)差 異進(jìn)行比較時, 采用只能就一個或兩個 樣本平均數(shù)差異進(jìn)行顯著性測驗(yàn)的方法 已不敷應(yīng)用,例如: 例5.1 某水產(chǎn)研究所為了比較 k=4種 不同配合飼料對
3、魚的飼喂效果,選取了 條件基本相同的魚20尾,隨機(jī)分成4組 , 投喂不同飼料,一個月后每個處理各得 n= 5個增重觀察值,且T=550.8, =27.54, 試予分析。 解 本例需要分析兩個方面的問題: 魚經(jīng)不同飼料投喂后增重是否 有顯著差異(即存在本質(zhì)差別)? 若有顯著差異的話, 在哪些飼料之間?,如果按第三章的方法, 直接進(jìn)行顯著性檢驗(yàn), 就要孤立地對以下6個兩兩差數(shù)做t-test,即: 順序 t t24.74 t26.28 t27.96 A1 31.18 6.44 4.9 3.22 A4 27.96 3.22 1.68 A2 26.28 1.54 A3 24.74,第一節(jié) 方差分析原理,
4、把一份完整的原始數(shù)據(jù)部分地撇開, 孤立地對兩兩差數(shù)進(jìn)行t-test,其消極后 果佛克倫這樣描述過: 從同一總體中抽樣, 每次抽兩個樣本 得1和2后求算 t 值, 若指定它超過某 值的概率為5%的話, 該值就是兩尾表中 查得的臨界值 t0.05 再以相同的樣本容 量每次抽三個樣本, 用最大的樣本和 最小的樣本求算 t 值, 此時它超過“t0.05 ” 的概率上升到14.3% ( 即“t0.05 ” = t0.143) 繼續(xù)以相同的容量每次抽四個樣本, 仍以最大的和最小的求算t 值, 則 上升到26.5%( 即 “t0.05 ”= t0.265 )以此 類推5個樣本40%以上。,比如本例針對藥劑A
5、1與藥劑A3的兩兩差數(shù)6.44 (最大 最小) 進(jìn)行的t-test: F= S大2 / S小2 =41.67/415.97/4 F0.05 Se2 = (SS1 + SS2) / (1+2) = 57.64/8 S 1-2 =Se2 ( 1/n1 + 1/n2 ) = 1.70 t =( 1- 2 ) (1-2) S1- 2 = 6.44 1.70 = 3.8 “t0.05”=2.306 由于撇開A、B孤立地進(jìn)行,否定HO的把握不到80%。,第一節(jié) 方差分析原理,一、數(shù)據(jù)整理 根據(jù)方差分析的先決條件,在“三個 假定”成立的前提下,對右表繼續(xù)整理: C= T 2/nk = 550.8 2/20
6、= 15169.03 SST =(Y ) 2 = Y 2 C =31.92 +28.52 15169 = 199.67 dfT = nk 1= 5 4 1 = 19 二、平方和、自由度的分解 Y = (Yt) + ( t ) 兩邊同時平方,得: (Y )2 = (Y t) 2 + ( t ) 2 +2 (Y t) ( t ) 由同一處理重復(fù)觀察值的累加: (Y)2=(Yt) 2 + (t ) 2 +2 ( t ) (Y t) = 0 (Y )2=(Y t) 2 + n ( t ) 2,再把全部處理觀察值的累加,得: (Y )2=(Yt) 2 + n ( t ) 2 即: SST = (組內(nèi))
7、SSe + (組間) SSt 其中 SSt = n ( t ) 2 = Tt 2 /n C = (155.9 2 +131.4 2 +123.7 2 +139.8 2 )/ 5 15169.03 = 114.27 于是SSe = SST SSt = 199.67 114.27 = 85.4 = SS1 + SS2 + SS3 +SS4 = 41.67 +5.43 +15.97+22.33 dft = k 1= 3 dfe= dfT dft =193 = df1 + df2 + df3 +df4= 4 +4 +4+4 = 16,第一節(jié) 方差分析原理,三、列ANOVA表,進(jìn)行F-test 變異來源
8、 DF SS MS F F 0.01 處理 3 114.27 38.09 7.13 * 5.29 誤差 16 85.4 5.34 總 19 199.67 ( F值右上角標(biāo)一個 * 達(dá)到0.05, 標(biāo)兩個 * 達(dá)到0.01 ) 這里進(jìn)行的F-test與第三章(Ho:大2 小2 ) 的相同之處是都做右尾測驗(yàn), 查的是同一張F(tuán) 臨界值表;不同之處是固定用誤差方差Se 2作 分母(Ho:t2 e2 ), 而不論其相對大小。 顯然, F值越大, 說明處理效應(yīng)引起的數(shù)據(jù)變 異不僅在量的方面所占比重較大, 而且相對于 誤差引起的變異來講顯得越重要、越突出; 本 例F-test結(jié)果顯示極顯著, 表明原始數(shù)據(jù)的
9、總變 異主要由不同的飼料種類引起, 各處理之間至 少有兩個存在著(極)顯著差異。,以上一、二、三就是R.A.Fisher創(chuàng)建的方差分析法,其原理歸納如下: 平方和與自由度的可加性; SST 綜合了全部觀察值的變異量, 它匯總了各變異來源 (SOV) 導(dǎo)致原始數(shù)據(jù)和全試驗(yàn)平均數(shù) ( ) 出現(xiàn)差異的分量, 包括可控因素分量和誤差分量兩類; “可加性” 證實(shí)前者就是觀察值按可控因素分組后算得的組間平方和 ( 可控因素可以是試驗(yàn)因素, 也可以是象單位組那樣的其它系統(tǒng)因素 ) 。 試驗(yàn)設(shè)計有幾個可控因素, 數(shù)據(jù)就會有幾種可能的分組方式, 也就可以算出幾個組間SS, 而本屬于組內(nèi)SS的誤差分量在平方和分解
10、時總是由SST 減去所有可控因素SS得到, 因此它又被稱為“剩余平方和”。 自由度的剖分與平方和的剖分一一對應(yīng)。 依據(jù)F分布進(jìn)行整體測驗(yàn); 只確定可控因素分量和誤差分量的相對 重要程度是否達(dá)到顯著水平。,第一節(jié) 方差分析原理,四、多重比較 R.A.Fisher 創(chuàng)建的方差分析法并沒有明確 (極)顯著差異究竟存在于哪些 “組平均數(shù)” 之間, F值(極)顯著所包含的信息只有通過 對C2n= k(k-1)/2個兩兩差數(shù)進(jìn)行多次連續(xù)性 測驗(yàn)才能完全揭露出來,這就是多重比較。 多重比較不論用哪一種方法, 區(qū)別于多 次孤立的 t-test 或者說體現(xiàn)其“連續(xù)性” 特征 之處有兩個, 一是必須使用同一個共用
11、的標(biāo) 準(zhǔn)誤, 記為“SE”), 本例SEMSe / n 5.345 =1.033 (10g); 二是所依據(jù)的抽樣分 布由計算MSe即Se2的自由度dfe決定, 并根據(jù) 兩兩差數(shù)秩次距“k”的不同而有所修正。如 本例k = 2、3、4,測驗(yàn)時依據(jù)dfe=16的 t 分 布并在k = 3和4時修正為SSR分布如右。,順序 t t24.74 t26.28 t27.96 A1 31.18 6.44 4.9 3.22 A4 27.96 3.22 1.68 A2 26.28 1.54 A3 24.74,=16,k =2 SSR= t2,=16,k =3,=16,k =4,3.23 3.15 3.00 ,第
12、一節(jié) 方差分析原理,附表6 列出了各自由度對應(yīng)的t 分布曲線 再按9 種秩次距修正出來的SSR分布當(dāng)兩尾 概率取0.05和0.01時臨界值,記為SSR0.05和 SSR0.01,其中k =2的那一條因?yàn)閷?shí)際就是 t 分布曲線壓縮橫坐標(biāo)刻度所得, 所以表中列 出的SSR0.05和SSR0.01就分別等于附表3所列 t0.05 和t0.01的2 倍; 其它k3的SSR分布隨 著P的遞增, 對 t 分布的修正幅度加大, 因此 表中列出的SSR0.05和SSR0.01也就隨之遞增。 多重比較測驗(yàn)兩兩差數(shù)的顯著性時不是 將它除以SE轉(zhuǎn)換成SSR(也是標(biāo)準(zhǔn)化變量!) 后再與SSR0.05 和SSR0.01
13、 比大小, 而是先將 SSR0.05和SSR0.01乘以SE算出“顯著尺”LSR, 再將它們直接和相應(yīng)秩次距的兩兩差數(shù)比 大小, 超過LSR0.05標(biāo)*, 超過LSR0.01 標(biāo)*。,順序 t t24.74 t26.28 t27.96 A1 31.18 6.44 * 4.9 * 3.22 * A4 27.96 3.22 ns 1.68 ns A2 26.28 1.54 ns A3 24.74,=16,k =2 SSR= t2,=16,k =3,=16,k =4,3.23 3.15 3.00 ,第一節(jié) 方差分析原理,按照兩兩差數(shù)在三角梯形表中的排列規(guī) 律,本例多重比較過程列表如下: LSR0.0
14、5= SE SSR0.05 LSR0.01= SE SSR0.01 順序 t t24.74 t26.28 t27.96 A1 31.18 6.44 * 4.9 * 3.22 * A4 27.96 3.22 ns 1.68 ns A2 26.28 1.54 ns A3 24.74 SE = 1.033,綜合包括多重比較在內(nèi)的方差分析 全過程,其原理可歸納為: 一個性質(zhì)(SS、DF的可加性) 兩個分布(F分布和SSR分布) 本例根據(jù)SSR分布進(jìn)行的多重比較 叫新復(fù)極差測驗(yàn), 簡稱SSR-test 。因?yàn)?不能缺少 F-test 顯著的前提,屬于 Fishers protected multipe
15、comparisons. 此前產(chǎn)生的復(fù)極差測驗(yàn) (簡稱q-test、又 稱SNK測驗(yàn)) 卻可以不經(jīng)過F-test, 原因 是q-test算LSR時要改查q 值表(附表7), 所依據(jù)的q分布是按極差抽樣分布原理 要保證各比較都是同一顯著水平, 因 而對 t 分布修正幅度隨秩次距k的遞增 而加大的速度要比SSR分布快, 所以秩 次距k3 時q0.05和q0.01 比相應(yīng)的SSR0.05 和SSR0.01大。,第二節(jié) 單向分組數(shù)據(jù),單向分組數(shù)據(jù)指觀察值僅按一個方 向分組的數(shù)據(jù)。如例5.1中將全部供試單 位(試驗(yàn)材料)隨機(jī)地分成若干組,然后 各組給以不同處理,即同組供試單位受 相同處理,不同組受不同處
16、理,這樣所 得的全部觀察值在設(shè)計上稱為完全隨機(jī) 試驗(yàn)數(shù)據(jù),而實(shí)際研究中下例5.2那樣的 調(diào)查結(jié)果也屬此類。 一、各組觀察值個數(shù)相等 例5.2 抽測 5個不同品種(k = 5)各5 頭母豬(n = 5)的窩產(chǎn)仔數(shù),結(jié)果如右表 所示,T = 265,試檢驗(yàn)不同品種的母豬 平均窩產(chǎn)仔數(shù)差異是否顯著。,1、數(shù)據(jù)整理 C = T 2/nk = 265 2/25 = 2809 SST =(Y ) 2 = Y 2 C =82 +132 +132 2809 = 136 dfT = nk 1= 5 5 1 = 24,第二節(jié) 單向分組數(shù)據(jù),2、平方和、自由度的分解 SSt = n ( t ) 2 = Tt 2 /
17、n C = 73.2 = (51 2 +41 2 +60 2 +48 2 +65 2 )/ 5 2809 于是 SSe = SST SSt = 13673.2 =62.8 dft = k 1= 4 dfe= dfT dft =244= 20 3、列ANOVA表,進(jìn)行F-test 假設(shè)是Ho:t2 e2 而不是Ho:t2 =e2 (和 Ho:1= 2= 3= 4= 5效果一樣) SOV DF SS MS F F 0.01 品種 4 73.2 18.3 5.83* 4.43 誤差 20 62.8 3.14 總 24 136 4、多重比較 SE=MSe / n =3.145 = 0.793,再根據(jù)附
18、表6的SSR進(jìn)而算得顯著尺: K SSR0.05 SSR0.01 LSR0.05 LSR0.01 2.95 4.02 2.339 3.188 3.10 4.22 2.458 3.346 3.18 4.33 2.522 3.434 5 3.25 4.40 2.577 3.489,第二節(jié) 單向分組數(shù)據(jù),本例的多重比較結(jié)果以三角梯形表表述如下: t 0.01 t 8.2 t 9.6 t 10.2 t 12.0 13.0 A 4.8* 3.4* 2.8* 1.0 12.0 A 3.8* 2.4 1.8 10.2 AB 2.0 0.6 9.6 AB 1.4 8.2 B,t 13.0 12.0 10.2
19、9.6 8.2,第二節(jié) 單向分組數(shù)據(jù),本例的多重比較結(jié)果以三角梯形表表述如下: t 0.05 t 8.2 t 9.6 t 10.2 t 12.0 13.0 a 4.8* 3.4* 2.8* 1.0 12.0 ab 3.8* 2.4 1.8 10.2 bc 2.0 0.6 9.6 bc 1.4 8.2 c,t 13.0 12.0 10.2 9.6 8.2,第二節(jié) 單向分組數(shù)據(jù),單向分組數(shù)據(jù)的觀察值也可以是交 叉試驗(yàn)的數(shù)據(jù)。即在同一試驗(yàn)中給試驗(yàn) 單位安排處理時分期進(jìn)行、交叉反復(fù)兩 次以上所獲得的試驗(yàn)結(jié)果。這種試驗(yàn)設(shè) 計方法能較好地消除試驗(yàn)動物個體(即 試驗(yàn)單位)以及試驗(yàn)時期間的差異對試 驗(yàn)數(shù)據(jù)影響
20、,特別是能夠利用較少的試 驗(yàn)動物獲得盡可能多的觀察值個數(shù)。由 于系同一批試驗(yàn)動物分期安排不同處理, 所得觀察值個數(shù)必然相等。 例5.3 研究新配方飼料對奶牛產(chǎn)奶 量(kg)的影響,設(shè)置對照飼料A1和和新 配方飼料A2兩個處理,采用 2 2交叉設(shè) 計,用條件相近的10頭奶牛分兩期獲得了 20個原始數(shù)據(jù),并算得二水平差值 d如右 表,試完成其方差分析過程。,第二節(jié) 單向分組數(shù)據(jù),1、數(shù)據(jù)整理 C = ( d ) 2/nk = 1.8 2/10 = 0.324 SST = d 2C = 75.116 =(1.7 ) 2 +(2.2 ) 2 +1.0 20.324 dfT = nk 1= 5 2 1
21、= 9 2、平方和、自由度的分解 SSt = Tt 2 /n C = 60.516 = (11.4) 2 +13.2 2/ 5 0.324 SSe = SST SSt = 75.11660.516 =14.6 dft = k 1= 1 dfe= dfT dft =91= 8 3、列ANOVA表,進(jìn)行F-test SOV DF SS MS F F 0.01 處理 1 60.516 60.52 33.16* 4.43 誤差 8 14.600 1.83 總 9 75.116,第二節(jié) 單向分組數(shù)據(jù),例5.4 研究飼喂尿素對奶牛產(chǎn)奶量(kg) 的影響,設(shè)置尿素配合飼料A1和和對照 飼料A2兩個處理,采用
22、 2 3交叉設(shè)計, 用條件相近的6頭奶牛分三期獲得了18個 原始數(shù)據(jù),并算得二水平差值 d如右表, 完成其方差分析的結(jié)果如下。 (和例5.3一樣,無需多重比較) ANOVA表: SOV DF SS MS F F 0.01 處理 1 1.6748 1.6748 1.60ns 7.71 誤差 4 4.1727 1.0432 總 5 17.72,第二節(jié) 單向分組數(shù)據(jù),二、各組觀察值個數(shù)不相等 例5.5 5個不同品種豬的育肥試驗(yàn),后 期30天增重(kg)分別得到6、6、5、4、 4個共25頭豬的觀察值(如下表),試 比較不同品種間的增重有無顯著性差異。 1、數(shù)據(jù)整理 k = 5 T = 460.5 n
23、i=25 C= T 2/ ni = 460.5 2/25 = 8482.41,SST = (Y ) 2 = Y 2 C = 21.52 +16.02 8482.41 = 85.34 dfT = ni 1= 25 1 = 24 可加性原理與前面例5.1、例5.2一樣 : SST = 組間 SS t + 組內(nèi) SS e dfT = 組間 df t + 組內(nèi) df e 由于各組觀察值個數(shù) ni 不全相等, 方差分析過程部分計算公式隨之改變, 須注意其與前面例5.1、例5.2的區(qū)別!,第二節(jié) 單向分組數(shù)據(jù),2、平方和、自由度的分解 SSt = ( Tt 2 / ni ) C = 46.5 = (121
24、2 /6+103 2 /6+91.5 2/5+78.5 2 /4 +66.5 2 /4 ) 8482.41 于是 SSe = SST SSt = 85.3446.5 =38.84 dft = k 1 = 4 dfe = dfT dft = 244 = 20 3、列ANOVA表,進(jìn)行F-test 假設(shè)是Ho:t2 e2 而不是Ho:t2 =e2 (和 Ho:1= 2= 3= 4= 5效果一樣) SOV DF SS MS F F 0.01 品種 4 46.5 11.63 5.99* 4.43 誤差 20 38.84 1.94 總 24 85.34 4、多重比較 SE= MSe / no =1.94
25、4.96 = 0.625,按dfe = 20查得SSR臨界值后比較如下: P LSR 順序 t 0.05 0.01 0.05 0.01 B1 20.2 a A 2.95 4.02 B4 19.6 a AB 3.10 4.22 B3 18.3 ab ABC 3.18 4.33 B2 17.2 b BC 5 3.25 4.40 B5 16.6 b C,第二節(jié) 單向分組數(shù)據(jù),組次數(shù)平均數(shù) no 的另一種計算公式: 6 (6+5+4+4) 6 (6+5+4+4) 5(6+6+4+4) 4 (6+6+5+4) 4( 6+6+5+4 ) 4 4 4 4 4 no= = 4.96 6 + 6 + 5 + 4
26、 + 4 本例說明取樣調(diào)查得到的數(shù)據(jù)觀察結(jié)果可按單向分組數(shù)據(jù)的模型進(jìn)行方差分 析, 而不論各組取樣獲得的觀察值個數(shù)是否相同(參見例5.1)。 實(shí)際應(yīng)用中,某些完全隨機(jī)試驗(yàn)設(shè)計即使各處理的小區(qū)個數(shù)相同,但因?yàn)樽?然條件限制或其它原因?qū)е聜€別小區(qū)無法得到觀察值時,就可以參照本例按各組 觀察值個數(shù)不同的數(shù)據(jù)結(jié)構(gòu)進(jìn)行分析。 由于取樣觀察所依據(jù)的原理是以概率論中定義的“隨機(jī)試驗(yàn)”為出發(fā)點(diǎn),因此, 試驗(yàn)統(tǒng)計中講授取樣調(diào)查結(jié)果決不算“離題”,也就是說,對教材名稱中的“試驗(yàn)” 一詞要全面理解,這是本課程簡稱“試驗(yàn)統(tǒng)計”比簡稱“生物統(tǒng)計”好的理由之一。 至于動物試驗(yàn)研究中按交叉設(shè)計得到的數(shù)據(jù),其方差分析因?yàn)槭怯?/p>
27、二水平差 值 d 進(jìn)行的,分析模型的數(shù)據(jù)結(jié)構(gòu)也屬于單向分組數(shù)據(jù)模式。,第三節(jié) 多向分組數(shù)據(jù),試驗(yàn)統(tǒng)計過程中,象前面三例那樣只需按不同試驗(yàn)處理( 即一個可控因素 ) 對數(shù)據(jù)進(jìn)行分組是很不夠的,因?yàn)檗r(nóng)業(yè)及生物學(xué)領(lǐng)域所進(jìn)行的試驗(yàn)研究由于受自 然條件的制約,導(dǎo)致試驗(yàn)所得各觀察值出現(xiàn)差異的可控因素決不僅僅局限于試驗(yàn) 因素。如在實(shí)施了局部控制的試驗(yàn)方案設(shè)計中,各單位組之間的差別就反映了系 統(tǒng)因素效應(yīng),此時的試驗(yàn)數(shù)據(jù)除了要按不同試驗(yàn)處理分組之外,還必須按不同的 單位組進(jìn)行分組。 由于區(qū)組可以不止一個方向,這就產(chǎn)生了兩向甚至三向分組數(shù)據(jù)的分析問題, 前者最典型的是隨機(jī)區(qū)組試驗(yàn)數(shù)據(jù),后者則以拉丁方試驗(yàn)結(jié)果為代表
28、,兩者都是 經(jīng)典試驗(yàn)設(shè)計與統(tǒng)計分析內(nèi)容;并且和完全隨機(jī)試驗(yàn)一樣,可以是單因素試驗(yàn), 也可以是復(fù)因素試驗(yàn)。鑒于復(fù)因素試驗(yàn)要專門安排一章來講授,本節(jié)只介紹單因 素隨機(jī)區(qū)組和拉丁方試驗(yàn)數(shù)據(jù)的方差分析。 例5.6 為了比較5種不同中草藥飼料添加劑對豬增重的效果,從4頭母豬所產(chǎn) 仔豬中,每窩選出性別相同、體重相近的仔豬各5頭,共20頭,組成4個單位組, 各單位組的每頭仔豬隨機(jī)飼喂不同的飼料添加劑。觀察值為平均日增重(g), 其結(jié)果如下表,試進(jìn)行方差分析。,第三節(jié) 多向分組數(shù)據(jù),SST = 處理 SS t + 區(qū)組 SS r + 剩余 SS e dfT = 處理 df t + 區(qū)組 df r + 剩余 d
29、f e SSt = Tt 2 /n C = (825 2 +925 2 +1065 2 +737 2 +1137 2) / 4 C = 27267.2 SSr = Tr 2 / kC = (1152 2 +1047 2 +1267 2 +1223 2) / 5 C = 5530.15 SSe = SST SSt SSr = 35890.9527267.2 5530.15 = 3093.6 dft = k 1= 4 dfr = 4 1= 3 dfe= dfT dft dfr =194 3= 12,一、數(shù)據(jù)整理 n = 4 k = 5 nk = 20 (隨機(jī)單位組) C = T 2/nk = 46
30、89 2/20 = 1099336.05 SST =(Y ) 2 = Y 2 C = 2052 +1682 +2822 1099336.05 = 35890.95 dfT = nk 1= 4 5 1 = 19 二、 SST、 dfT 的分解,第三節(jié) 多向分組數(shù)據(jù),三、列ANOVA表,進(jìn)行F-test (假設(shè)是Ho:t2 e2 而不是Ho:t2 =e2 ) SOV DF SS MS F F 0.01 區(qū)組 3 5530.15 1843.38 7.15* 5.95 處理 4 27267.2 6816.8 26.44* 5.41 誤差 12 3093.6 257.8 總 19 35890.95 總有
31、人用單位組SS、DF算MS并進(jìn)行 F-test,這樣做不妥當(dāng):單位組之間的差 異是試驗(yàn)設(shè)計時實(shí)行局部控制、轉(zhuǎn)化系統(tǒng) 因素效應(yīng)收到的效果,只參與SST、dfT 的 分解以控制試驗(yàn)誤差;一個單位組安排 了試驗(yàn)方案的一個完整重復(fù),單位組數(shù)就 是重復(fù)次數(shù),但“重復(fù)區(qū)組”只是構(gòu)成了估 計抽樣誤差的必要條件,不能提供其自身 ( 區(qū)組之間 )差異是否顯著的信息。,四、多重比較 SE=MSe / n =257.84 = 8.028 再根據(jù)附表5的q進(jìn)而算得顯著尺: k 2 3 4 5 q0.05 3.08 3.77 4.20 4.51 q0.01 4.32 5.04 5.50 5.84 LSR0.05 24.
32、73 30.27 33.72 36.21 LSR0.01 34.68 40.64 44.15 46.88 順序 t 0.05 0.01 A5 284.25 a A A3 266.25 a A A2 231.25 b B A1 206.25 c BC A4 184.25 c C,第三節(jié) 多向分組數(shù)據(jù),例5.7 為了研究5種不同溫度對蛋雞產(chǎn)蛋量的影響,將5棟雞舍的溫度分別設(shè) 為A、B、C、D、E,把各棟雞舍雞群(5群),每群產(chǎn)蛋期(5期)分別設(shè)置成 單位組,采用55拉丁方設(shè)計,其試驗(yàn)結(jié)果(個)如下,試予分析。 解 拉丁方試驗(yàn)在兩個方向都應(yīng)用了局部控制,使得縱橫兩向皆成區(qū)組。 其結(jié)果的分解原理構(gòu)成三
33、向分組:SST = SS t + SS r + SS c + SS e 即包括了三個可控因素,比隨機(jī)區(qū)組法: SST = SS t + SS r + SS e 多一個可控因素;比完全隨機(jī)法多兩個: SST = SS t + SS e 。 自由度的分解也是如此。,第三節(jié) 多向分組數(shù)據(jù),一、數(shù)據(jù)整理 n = k = 5 nk = 25 C = T 2/nk = 549 2/25 = 12056.04 SST = Y 2 C = 100.96 = 232 +212 +19212056.04 dfT = nk 1= 5 5 1 = 24 三、列ANOVA表,進(jìn)行F-test SOV DF SS MS
34、F F 0.01 行 4 27.36 列 4 22.16 溫度 4 33.36 8.34 5.56* * 5.41 誤差 12 18.08 1.50 總 24 100.96 不要試圖對橫行區(qū)組(行)或縱行區(qū)組 (列)進(jìn)行F-test !,二、 SST、 dfT 的分解 SSt = Tt 2 /n C = 33.36 = (116 2 +114 2 +105 2 +113 2 +101 2) / 5 C SSr = Tr 2 / kC = 27.36 = (108 2 +105 2 +116 2 +116 2 +104 2) / 5 C SSc= Tc 2 / kC = 22.16 = (109
35、 2 +108 2 +119 2 +107 2 +106 2) / 5 C SSe = SST SSt SSr SSc= 18.08 = 100.96 33.3627.36 22.16 dft = k 1= dfr = dfc= n 1= 4 dfe= dfT dft dfr dfc = 244 4 4 = 12,第三節(jié) 多向分組數(shù)據(jù),四、多重比較 SE=MSe / n =1.505 = 0.55 再根據(jù)附表5的q進(jìn)而算得顯著尺: k 2 3 4 5 q0.05 3.08 3.77 4.20 4.51 q0.01 4.32 5.04 5.50 5.84 LSR0.05 1.69 2.07 2.
36、31 2.48 LSR0.01 2.38 2.77 3.03 3.21 順序 t 0.05 0.01 A 23.2 a A B 22.8 a A D 22.6 a A C 21.0 ab A E 20.2 b A,多向分組數(shù)據(jù)不能象單向分組數(shù)據(jù)那樣 有各組觀察值個數(shù)相同和各組觀察值個數(shù) 不相同兩種數(shù)據(jù)結(jié)構(gòu),因?yàn)樵囼?yàn)設(shè)計決定 了其數(shù)據(jù)中各組觀察值個數(shù)必須相同。 即使試驗(yàn)實(shí)施后因?yàn)椴豢煽咕艿脑蚴?得個別小區(qū)觀察值缺失而導(dǎo)致該組觀察值 個數(shù)少于其它組,也要按“最小二乘法”在 卻失小區(qū)算出一個估計值補(bǔ)進(jìn)去才能進(jìn)行 方差分析,此時的“缺區(qū)估計”值無任何實(shí) 際意義,純粹是為了使方差分析時獲得的 誤差平方
37、和取最小值而確定的算術(shù)值,換 句話說,沒有獲得觀察值的小區(qū)只有用缺 區(qū)估計值參與方差分析才能使算出的誤差 平方和為最小值。,第四節(jié) 三個假定與數(shù)據(jù)轉(zhuǎn)換,在顯著性檢驗(yàn)一章知,針對兩個小樣本的平均數(shù)進(jìn)行 t-est 時,只有方差同 質(zhì)(即兩個樣本方差 S2 經(jīng)F-test不顯著)的情形才能合并方差進(jìn)而求算 t 值。 在例5.1中介紹SS、df 的可加性時,對組內(nèi)SSe、dfe進(jìn)行分析,知其實(shí)質(zhì)就 是多個樣本的合并方差,既然方差分析說到底依然是對多個樣本平均數(shù)的兩兩 差數(shù)做若干次連續(xù)的顯著性檢驗(yàn)(SSR-test或q-test),自然也應(yīng)該在多個樣本 的方差合并之前證實(shí)它們同質(zhì)才行,這可是方差分析的
38、條件問題!即使是多元 統(tǒng)計分析中建立生產(chǎn)過程的回歸模型(現(xiàn)代生物統(tǒng)計技術(shù))也少不得這個前提。 但本章從例5.1講到例5.5,也并沒有明示上述前提條件是否存在,這是因?yàn)?這些例題所用的原始數(shù)據(jù)已從其來源和性質(zhì)進(jìn)行“把關(guān)”,并根據(jù)其變化特點(diǎn)予 以“把握”,使方差的同質(zhì)(也叫“齊性”)有了一個基本的保證,具體有三條: 根據(jù)數(shù)據(jù)的來源和性質(zhì),判斷其是否符合方差分析的正態(tài)性假定; 根據(jù)數(shù)據(jù)各組觀察值的變化特點(diǎn)看是否符合方差分析的可加性假定; 根據(jù)Bartlett-test的結(jié)果看多個樣本方差是否符合方差分析的同質(zhì)性假定。,第四節(jié) 三個假定與數(shù)據(jù)轉(zhuǎn)換,一、正態(tài)性 指數(shù)據(jù)的各組觀察值必須圍繞其相應(yīng)的平均數(shù)作
39、正態(tài)分布。 因?yàn)閷Χ鄠€樣本的平均數(shù)進(jìn)行方差分析時所作的F-test是假定這些樣本皆從 各自的正態(tài)總體中抽出的前提下進(jìn)行的,以完全隨機(jī)設(shè)計為例: Y11、 Y12、 Y13、 Y1n 1 S12 N1(1,12) Y21、 Y22、 Y23、 Y2n 2 S2 2 N2(2,22) Yi1、 Yi2、 Yi3、 Yin i Si 2 Ni(i,i2) Yk1、 Yk2、 Yk3、 Ykn k Sk 2 Nk(k,k2) 換一種說法,就是所得數(shù)據(jù)的來源和性質(zhì)須滿足以下兩點(diǎn)要求: 各組觀察值必須是用隨機(jī)方法獲得的; 各正態(tài)總體的i與i2無任何函數(shù)關(guān)系,或者說i與i2彼此獨(dú)立。,第四節(jié) 三個假定與數(shù)據(jù)
40、轉(zhuǎn)換,各組觀察值必須是用隨機(jī)方法獲得的; 各正態(tài)總體的i與i2無任何函數(shù)關(guān)系,或者說i與i2彼此獨(dú)立。 因此,首先務(wù)必明確方差分析只能用于經(jīng)過隨機(jī)排列(分組)設(shè)計獲得的試 驗(yàn)數(shù)據(jù),或者是通過隨機(jī)取樣得到的調(diào)查結(jié)果,不能用于順序排列(分組)設(shè)計 獲得的試驗(yàn)數(shù)據(jù)或者未經(jīng)隨機(jī)取樣得到的調(diào)查結(jié)果。 二項資料的百分?jǐn)?shù)或統(tǒng)計次數(shù),其實(shí)質(zhì)乃二項總體抽樣所得,這類總體的 方差是平均數(shù)的函數(shù),即i2 = piqi=i (1i),服從的是二項分布; 稀有現(xiàn)象的次數(shù)數(shù)據(jù),如單位面積內(nèi)的某種雜草的株數(shù)或者昆蟲的頭數(shù), 某塊載玻片上細(xì)菌群落的計數(shù),每毫升溶液中某種微生物個體數(shù),每個顯微鏡 視野中某種細(xì)胞個數(shù)等等,它們所
41、屬的總體平均數(shù)和方差幾乎相等i=i2 , 可視其為來自Poisson總體,服從的是泊松分布。 以上兩類數(shù)據(jù)因?yàn)椴环险龖B(tài)性假定的第點(diǎn)要求,原則上都不能直接進(jìn) 行方差分析,必須通過數(shù)據(jù)轉(zhuǎn)換恢復(fù)正態(tài)性之后才能做方差分析,前者通常進(jìn) 行百分?jǐn)?shù)的反正弦轉(zhuǎn)換,后者通常進(jìn)行統(tǒng)計次數(shù)的平方根轉(zhuǎn)換或者對數(shù)轉(zhuǎn)換。,第四節(jié) 三個假定與數(shù)據(jù)轉(zhuǎn)換,例5.8 研究甲、乙、丙三個地區(qū)乳牛隱性乳房炎陽性率,其結(jié)果如下表,試對該資料進(jìn)行方差分析。 二項資料百分?jǐn)?shù)的反正弦轉(zhuǎn)換就是將成數(shù)p的平方根視為三角函數(shù)之正弦值, 反過來求其反正弦值,也就是轉(zhuǎn)化為0 90的角度數(shù),教材有附表供查閱。 如果所有的百分?jǐn)?shù)都介于30%70%之間,
42、則因?yàn)閜與q相差不懸殊,所服從 的二項分布很接近正態(tài)分布,因此可不做反正弦轉(zhuǎn)換,直接進(jìn)行方差分析。 本例的百分?jǐn)?shù)有許多70%的,和30%一樣,必須進(jìn)行數(shù)據(jù)轉(zhuǎn)換。,第四節(jié) 三個假定與數(shù)據(jù)轉(zhuǎn)換,將轉(zhuǎn)換后的 sin1 p 列表進(jìn)行F-test SOV DF SS MS F F 0.01 地區(qū) 2 2461.823 1230.911 14.03* * 6.01 誤差 18 1579.493 87.75 總 20 4041.316 SE = 87.757 = 3.54 多重比較結(jié)果作為文獻(xiàn)交流時,各處理反正弦值的平均數(shù) t 必須由其反轉(zhuǎn)換 得到的百分?jǐn)?shù)(即反轉(zhuǎn)% )替換下來,這樣在專業(yè)含義上才便于解釋,
43、為記牢這 一特點(diǎn),不妨稱之為“過河拆橋”或者“上屋抽梯”。,按dfe=18查得SSR再算LSR值后比較如下: k LSR 順序 t 反轉(zhuǎn)% 0.05 0.01 0.05 0.01 甲 53.27 64.2 a A 10.51 14.41 乙 32.58 29.0 b B 11.04 15.12 丙 28.56 22.8 b B,第四節(jié) 三個假定與數(shù)據(jù)轉(zhuǎn)換,二、可加性 指處理效應(yīng)與區(qū)組效應(yīng)具有可加性,即: 總SST誤差SSe = 處理SSt區(qū)組SSr 這一通式幾乎囊括所有數(shù)據(jù)結(jié)構(gòu)的平方 和SS的分解過程,現(xiàn)令其SSe = 0討論如下: 線性數(shù)據(jù) SST =152+52+52+152=500 SSt =2(102+102 )=400 SSr =2(52+52 )=100 故 SSt SSr SST 倍性數(shù)據(jù)
溫馨提示
- 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
- 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
- 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
- 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負(fù)責(zé)。
- 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請與我們聯(lián)系,我們立即糾正。
- 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時也不承擔(dān)用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。
最新文檔
- 城市更新項目廠房土地轉(zhuǎn)讓與城市基礎(chǔ)設(shè)施改造合同
- 產(chǎn)業(yè)園區(qū)場地租賃終止合同范本
- 廠房維修安全方案
- 中醫(yī)理療義診方案
- 招牌柱子施工方案
- 蘇幕遮高考試題及答案
- 2026版《全品高考》選考復(fù)習(xí)方案生物628 課時作業(yè)(二十六) DNA分子的結(jié)構(gòu)、復(fù)制及基因的本質(zhì)含答案
- 2026版《全品高考》選考復(fù)習(xí)方案生物08 7.2 物質(zhì)出入細(xì)胞的方式含答案
- 牙醫(yī)胸牌設(shè)計方案
- 中班健康:鱷魚怕怕
- 明星考試題及答案
- 小學(xué)生暑假安全教育主題班會教案
- 開展打擊電信網(wǎng)絡(luò)詐騙知識培訓(xùn)
- 冬雨季施工進(jìn)度保障措施
- 2025至2030中國食品軟管行業(yè)發(fā)展趨勢分析與未來投資戰(zhàn)略咨詢研究報告
- 跨文化沖突技術(shù)緩解方案-洞察及研究
- 2025年中新天津生態(tài)城教育系統(tǒng)教職人員招聘考試筆試試題
- 三非人員介紹課件
- 喝酒大賽活動方案
- 服務(wù)認(rèn)證培訓(xùn)課件
- 工地施工特種設(shè)備管理制度
評論
0/150
提交評論