第5章方差分析_第1頁(yè)
第5章方差分析_第2頁(yè)
第5章方差分析_第3頁(yè)
第5章方差分析_第4頁(yè)
第5章方差分析_第5頁(yè)
已閱讀5頁(yè),還剩2頁(yè)未讀, 繼續(xù)免費(fèi)閱讀

下載本文檔

版權(quán)說(shuō)明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請(qǐng)進(jìn)行舉報(bào)或認(rèn)領(lǐng)

文檔簡(jiǎn)介

1、第5章方差分析第5章方差分析方差分析是統(tǒng)計(jì)學(xué)的一個(gè)重要范疇,是對(duì)觀察結(jié)果的數(shù)據(jù)作分析的一種常用的統(tǒng)計(jì)方 法,目的是檢驗(yàn)兩個(gè)或多個(gè)樣本均數(shù)間差異的顯著性意義。這種命名是因?yàn)樵跈z驗(yàn)均數(shù)間 差異是否具有統(tǒng)計(jì)學(xué)意義的過(guò)程中,我們實(shí)際上是通過(guò)比較方差而得到結(jié)果的。方差分析 主要用于均數(shù)差別的顯著性檢驗(yàn)、分離各有關(guān)因素并估計(jì)其對(duì)總變異的作用、分析因素間 的交互作用和方差齊性檢驗(yàn)。方差分析具有廣泛的用途,例如醫(yī)學(xué)界研究幾種藥物對(duì)某種疾病的療效可以用方差分 析方法去解決。方差分析的概念在科學(xué)實(shí)驗(yàn)中常常要探討不同實(shí)驗(yàn)條件或處理方法對(duì)實(shí)驗(yàn)結(jié)果的影響。通常是比較不 同實(shí)驗(yàn)條件下樣本均值間差異。方差分析是檢驗(yàn)兩個(gè)或多

2、個(gè)樣本均數(shù)間差異是否具有統(tǒng)計(jì) 意義的一種方法。1 .方差分析原理方差分析的基本原理是認(rèn)為不同處理組的均數(shù)間的差別基本來(lái)源有兩個(gè):(1)隨機(jī)誤差,例如測(cè)量誤差造成的差異,稱為組內(nèi)差異。用變量在各組的均值與 該組內(nèi)變量值之偏(離均)差平方和的總和表示。記作SS組內(nèi)。(2)實(shí)驗(yàn)條件,即不同的處理造成的差異,稱為組間差異。用變量在各組的均值與總均值之偏(離均)差平方和 的總和表示。記作SS組間。SS組間、SS組內(nèi)除以各自的自由度得到其均方值即組間均方和組內(nèi)均方。一種情況是處理沒(méi)有作用,即各樣本均來(lái)自同一總體。MS組間/MS組內(nèi)=1。考慮抽 樣誤差的存在,則有MS組間/MS組內(nèi)-1。另一種情況是處理因素

3、確實(shí)有作用。組間均方是由于誤差與不同處理共同導(dǎo)致的結(jié)果, 即各樣本來(lái)自不同總體。那么,組間均方會(huì)遠(yuǎn)遠(yuǎn)大于組內(nèi)均方。MS組間組內(nèi)。US組間/MS組內(nèi)比值構(gòu)成F分布。用F值與其臨界值比較,推斷各樣本是否來(lái)自相同的總 體。 2.方差分析的假設(shè)檢驗(yàn)假設(shè)有m個(gè)樣本,如果原假設(shè)H0:樣本均數(shù)都相同U 1= U 2= U 3= U m= M , m個(gè)樣本有共同的方差。則m個(gè)樣本來(lái)白具有共同的方差。和相同的均數(shù)H的總體。如果經(jīng)過(guò)計(jì)算結(jié)果組間均方遠(yuǎn)遠(yuǎn)大于組內(nèi)均方的F>FO. 05(f組間,f組內(nèi)),(括號(hào)中的兩 個(gè)f是自由度)則pVO. 05,推翻原假設(shè),說(shuō)明樣本來(lái)自不同的正態(tài)總體,說(shuō)明處理造成 均值的差

4、異,有統(tǒng)計(jì)意義。否則,F(xiàn)VF0.05(f組間,f組內(nèi)),P>0. 05承認(rèn)原假設(shè),樣本 來(lái)自相同總體,處理無(wú)作用。方差分析中的術(shù)語(yǔ)方差分析中常用的術(shù)語(yǔ)有以下幾個(gè):1.因素與處理因素是影響因變量變化的客觀條件:處理是影響因變量變化的人為條件。也可以通稱 為因素,例如影響農(nóng)作物產(chǎn)量的因素有氣溫、降雨量、日照時(shí)間等;研究不同肥料對(duì)不同 種系農(nóng)作物產(chǎn)量的影響時(shí)農(nóng)作物的不同種系可稱為因素,所施肥料可視為不同的處理。一 般情況下Factors與Treatments在方差分析中可作相同理解。在要求進(jìn)行方差分析的數(shù) 據(jù)文件中均作為分類變量出現(xiàn)。即它們的值只有有限個(gè)取值。即使是氣溫、降雨量等平常 看作是連

5、續(xù)變量的,在方差分析中如果作為影響產(chǎn)量的因素進(jìn)行研究,就應(yīng)該將其數(shù)值用 分組定義水平的方法事先變?yōu)榫哂杏邢迋€(gè)取值的離散變量。2 .水平因素的不同等級(jí)稱作水平。例如,性別因素在一般情況下只研究?jī)蓚€(gè)水平:男、女。 化學(xué)實(shí)驗(yàn)或生物實(shí)驗(yàn)中的“劑量”必須離散化為幾個(gè)有限的水平數(shù)。如:1ml、2ml、4ml 三個(gè)水平。應(yīng)該特別注意的是在SPSS數(shù)據(jù)文件中,作為因素出現(xiàn)的變量不能是字符型變 量,必須是數(shù)值型變量。例如性別變量SEX,定義為數(shù)值型,取值為0、1。換句話說(shuō),因 素變量的值實(shí)際上是該變量實(shí)際值的代碼,代碼必須是數(shù)值型的??梢远x值標(biāo)簽F、M (或Female、male)來(lái)表明0、1兩個(gè)值的實(shí)際含義

6、,以便在打印方差分析結(jié)果時(shí)使用。使結(jié)果更加具有可讀性。3單元(Cell)在方差分析中Cell指各因素的水平之間的每個(gè)組合。例如研究問(wèn)題中的因素有性別 Sex,取值為1、2;有年齡,分三個(gè)水平1 (10歲)、2 (11歲)、3 ( 12歲)。兩個(gè)變 量的組合共可形成六個(gè)單元:1, 1、1, 2、1, 3、2, 1、2, 2、 2, 3,代表兩種性別與三種年齡的六種組合。4 .因素的主效應(yīng)和因素間的交互效應(yīng)這是在科學(xué)實(shí)驗(yàn)中常常遇到的問(wèn)題。舉例說(shuō)明之:有A、B兩種藥物治療缺鐵性貧血, 患者12例,分為4組。實(shí)驗(yàn)方案是:第一組用一般療法;第二組在一般療法基礎(chǔ)上加用A 藥:第三組在一般療法基礎(chǔ)上加用B藥

7、,第四組在一般療法基礎(chǔ)上A、B兩藥同時(shí)使用。 一個(gè)月后觀察紅細(xì)胞增加數(shù)。要求分析兩種藥物的療效(數(shù)據(jù)見(jiàn)表12 1)。數(shù)據(jù)來(lái)源于 醫(yī)用統(tǒng)計(jì)方法(金丕煥,人民衛(wèi)生出版社)。3表121實(shí)驗(yàn)數(shù)據(jù)(紅細(xì)胞增加數(shù)百萬(wàn)/m)第一組 第二組 第三組 第四組 0.8 1.3 0.9 2. 1 0.9 1.2 1. 1 2.2 0.7 1. 1 1.0 2.0各組平均值0.8 1.2 1.0 2.1這是個(gè)雙因素方差分析的問(wèn)題,因素A與因素及 每個(gè)因素均有用該藥與不用該藥兩 個(gè)水平,研究藥物A和B是否對(duì)紅細(xì)胞的增加有顯著影響是對(duì)紅細(xì)胞增加數(shù)的均值作以下 比較: (1)比較第二組的均值與第一組的均值是否有顯著性差異。

8、(2)比較第三組的均值與第一組的均值是否有顯著性差異。前兩項(xiàng)研究的是A、B兩因素的主效應(yīng)。 (3)除了比較第四組的均值與第一組的均值是否有顯著性差異外還要 研究A藥對(duì)B藥的療效是否有影響。若A藥對(duì)B藥療效無(wú)影響,那么除抽樣誤差外,第四 組與第二組均值之差應(yīng)該等于第三組均值減去第一組均值。但是實(shí)際上(2.1-1.2) =0.9: 8)=0.2。競(jìng)相差0.7,該差值幾乎與第一組均值相同。0.7的差值包括抽樣誤 差和A、B藥的相互作用。這種因素之間的相互作用在統(tǒng)計(jì)學(xué)上稱之為交互效應(yīng)。如果交 互效應(yīng)存在,說(shuō)明兩個(gè)因素不是相互獨(dú)立的。5.均值比較均值的相對(duì)比較是比較各因素對(duì)因變量的效應(yīng)的大小的相對(duì)比較。

9、例如研究A、B效 應(yīng)之和是否等于它們的交互效應(yīng)。或者研究A、B對(duì)紅細(xì)胞增加數(shù)的效應(yīng)是否相等,等。均值的多重比較是研窕因素單元對(duì)因變量的影響之間是否存在顯著性差異,例如例題 中研究A、B藥物對(duì)紅細(xì)胞增加數(shù)的療效是否存在顯著性差異。6.協(xié)方差分析在一般進(jìn)行方差分析時(shí),要求除研究的因素外應(yīng)該保證其他條件的一致。作動(dòng)物實(shí)驗(yàn) 往往采用同一胎動(dòng)物分組給F不同的處理,研究各種處理對(duì)研究對(duì)象的影響就是這個(gè)道理。 例如研究身高與體重的關(guān)系時(shí)要求按性別分別進(jìn)行分析。這樣消除性別因素的影響。不同 年齡的身高對(duì)體重的關(guān)系也是有區(qū)別的,被測(cè)對(duì)象往往是不同年齡的。要消除年齡的影響, 應(yīng)該采用協(xié)方差分析。7.重復(fù)測(cè)量(略)

10、在社會(huì)學(xué)研究中常常遇到的問(wèn)題是,研究社會(huì)某些條件對(duì)人類特定方面的特性的影響, 社會(huì)調(diào)查、數(shù)據(jù)采集量相當(dāng)大。往往是在某一個(gè)地區(qū)采樣100,另一個(gè)地區(qū)采樣100?。兩 個(gè)地區(qū)的社會(huì)條件對(duì)研究對(duì)象來(lái)說(shuō)可能是獨(dú)立的,但同一地區(qū)的wo個(gè)個(gè)體同處r-相同社 會(huì)條件下,彼此并不獨(dú)立。進(jìn)行方差分析時(shí)修正條件不獨(dú)立造成的誤差,或者比較組間因 素與組內(nèi)因素的效應(yīng),以便得出正確的分析結(jié)論,使用重復(fù)測(cè)量的方差分析。 方差分析過(guò)程SPSS提供的方差分析過(guò)程有:1. Oneway 過(guò)程O(píng)newny過(guò)程就是單因素簡(jiǎn)單方差分析過(guò)程,它在Analyze菜單中的Compare Means過(guò) 程組中,用One-Way ANOVA菜

11、單項(xiàng)調(diào)用,可以進(jìn)行單因素方差分析、均值多重比較和相 對(duì)比較。單因素方差分析單因素方差分析也稱作一維(元)方差分析。它檢驗(yàn)由單一因素影響的一個(gè)(或幾個(gè) 相互獨(dú)立的)因變量由因素各水平分組的均值之間的差異是否具有統(tǒng)計(jì)意義。還可以對(duì)該 因素的若干水平分組中哪一組與其他各組均值間具有顯著性差異進(jìn)行分析即進(jìn)行均值的多 重比較。ne-Way ANOVA過(guò)程要求因變量屬于正態(tài)分布總體、如果因變量的分布明顯的是 非正態(tài),不能使用該過(guò)程,而應(yīng)該使用非參數(shù)分析過(guò)程。如果幾個(gè)因變量之間彼此不獨(dú)立, 應(yīng)該用Repeated Measure命令調(diào)用GLM過(guò)程。舉例一 (datal201)用四種飼料喂豬,共19頭豬分為四

12、組,每組用一種飼料。一段時(shí)間后稱重。豬體重 增加數(shù)據(jù)如下:飼料比較數(shù)據(jù)資料飼料 A B C D 133.8 151.2 193.4 225.8 125.3 149.0 185.3 224.6 143. 1 162.7 182.8 220.4 128.9 143.8 188.5 212.3 135.7 153.5 198.6 Fodder 變量:數(shù)值型,取 值1、2、3、4分別代表A、B、C、D四種飼料。Weight變量:數(shù)值型,其值為豬體重的 增加數(shù)。應(yīng)該特別注意,不能把A、B、C、D定義為四個(gè)變量。操作步驟:(1)讀取數(shù)據(jù) datal2 01。(2)按 Analysis-*Compare M

13、eans-*One Way ANOVA 順序,展開(kāi)One-Way ANOVA主對(duì)話框。(3)指定因變量:Weight:因素變量:fodder:表1即為單因素變量飼料fodder對(duì)豬體重weight的影響分析結(jié)果。表的左上方是因 變量 weight 。(1)輸出結(jié)果說(shuō)明第一欄:方差來(lái)源,包括組間變差Between Groups:組內(nèi)變差:Within Groups和 總變差Totalo第二欄:離差平方和,組間離差平方和為20538. 698,組內(nèi)離差平方和為652. 159總 離差平方和為21190. 258,是組間離差平方和與組內(nèi)離差平方和相加之和。第三欄:白由度,組間自由度為3:組內(nèi)自由度為

14、15:總自由度為18。 第四欄:均方差,是 第二欄與第三欄之比。組間均方差為6846. 233。組內(nèi)均方差為43. 4770第五欄:F值,是 組間均方與組內(nèi)均方之比。第六欄:F值對(duì)應(yīng)的概率值。針對(duì)假設(shè)H0:組間均值無(wú)顯著性差異,即四種飼料對(duì)豬 體重的增加的平均值無(wú)顯著性差異)。計(jì)算的F值157. 4668,對(duì)應(yīng)的概率值為0. 000。(2)結(jié)果分析根據(jù)輸出的P值為0.000可以看出,無(wú)論臨界值取0.05,還是取0.01, p值均小于臨 界值。因此否定H0假設(shè),四種飼料對(duì)豬體重均數(shù)有顯著性意義,結(jié)論是四種飼料對(duì)豬體 重的增加明顯作用不同。根據(jù)該結(jié)論選擇飼料,犯錯(cuò)誤的概率幾乎為0。(3)存在問(wèn)題與

15、解決方法本例只考慮了豬體重的增加量,對(duì)其均值進(jìn)行了比較但實(shí)際工作中的問(wèn)題往往不是 這樣簡(jiǎn)單,例如是否應(yīng)該考慮每頭豬的進(jìn)食量對(duì)體重增加的影響,去除這個(gè)影響比較豬體 重的增加會(huì)對(duì)飼料比較得出更切合生產(chǎn)實(shí)際的結(jié)論。這個(gè)問(wèn)題應(yīng)該使用AN0VA過(guò)程的協(xié)方 差分析功能去解決。使用系統(tǒng)默認(rèn)值進(jìn)行單因素方差分析只能得出是否有顯著性差異的結(jié)論,本例數(shù)據(jù) 量少,哪兩組之間差別最大,哪種飼料使豬體重增加更快,幾乎是可以看出來(lái)的。實(shí)際工 作中往往需要兩兩的組間均值比較。這就需要使用one - Wny AN0VA進(jìn)行單因素方差分析 時(shí)使用選擇項(xiàng)從而獲得更豐富的信息,使分析更深入。單因素方差分析的選擇項(xiàng)單因素方差分析的選

16、擇項(xiàng)分為三類:Contrasts功能按鈕,可以指定一種要用t檢驗(yàn) 來(lái)檢驗(yàn)的Priori對(duì)比;Post Hoc功能按鈕,可以指定一種多重比較檢驗(yàn);option功能按 鈕,可以指定要輸出的統(tǒng)計(jì)量,指定處理缺失值的方法。分別使用主對(duì)話框中的三個(gè)按鈕 打開(kāi)相應(yīng)的對(duì)話框,然后進(jìn)行選擇。1 .進(jìn)行均值的多項(xiàng)式比較的選擇項(xiàng)在主對(duì)話框中,鼠標(biāo)單擊Contrasts按鈕,打開(kāi)Contrasts對(duì)話框。均值的多項(xiàng)式比較是包括兩個(gè)或更多個(gè)均值的比較。單因素方差分析的。ne way AN0V 過(guò)程允許進(jìn)行高達(dá)5次的均值多項(xiàng)式比較。多項(xiàng)式的系數(shù)需要由讀者自己根據(jù)研究的需要 輸入。具體的操作步驟如下:(1)選中polyn

17、omial復(fù)選項(xiàng),該操作激活其右面的Degree參數(shù)框。(2)單擊Degree參數(shù)框右面的向下箭頭展開(kāi)階次菜單,可以選擇Linear線性、 Quadratic二次、Cubic三次、4th四次、5th五次多項(xiàng)式。(3)為多項(xiàng)式指定各組均值的系數(shù)。方法是在Coefficients框中輸入一個(gè)系數(shù),單 擊Add按鈕,Coefficients框中的系數(shù)進(jìn)入下面的方框中。依次輸入各組均值的系數(shù), 在方形顯示框中形成一列數(shù)值。因素變量分為幾組,輸入幾個(gè)系數(shù),多出的無(wú)意義。如果 多項(xiàng)式中只包括第一組與第四組的均值的系數(shù),必須把第二個(gè)、第三個(gè)系數(shù)輸入為。值。 如果只包括第一組與第二組的均值,則只需要輸入前兩個(gè)

18、系數(shù),第三、四個(gè)系數(shù)可以不輸 入??梢酝瑫r(shí)建立多個(gè)多項(xiàng)式。一個(gè)多項(xiàng)式的一級(jí)系數(shù)輸入結(jié)束,激活Next按鈕,單擊 該按鈕后Coefficients框中清空,準(zhǔn)備接受下一組系數(shù)數(shù)據(jù)。如果認(rèn)為輸入的幾組系數(shù)中有錯(cuò)誤,可以分別單擊Previous或Next按鈕前后翻找出 錯(cuò)誤的一組數(shù)據(jù)。單擊出錯(cuò)的系數(shù),該系數(shù)顯示在編輯框中,可以在此進(jìn)行修改,修改 后年擊Change按鈕,在系數(shù)顯示框中出現(xiàn)正確的系數(shù)值。當(dāng)在系數(shù)顯示框中選中一個(gè)系 數(shù)時(shí),同時(shí)激活Remove按鈕:?jiǎn)螕粼摪粹o將選中的系數(shù)清除。(4)單擊previous或Next按鈕顯示輸入的各組系數(shù)檢查無(wú)誤后,按Continue按鈕 確認(rèn)輸入的系數(shù)并返回

19、到主對(duì)話框。要取消剛剛的輸入,單擊Cancel按鈕:需要查看系 統(tǒng)的幫助,單擊Help按鈕。2 .各組均數(shù)的多重比較選擇項(xiàng)在主對(duì)話框中,單擊Post Hoc按鈕,展開(kāi)Post Hoc Multiple Comparisons對(duì)話框, 在這對(duì)話框中選擇進(jìn)行均值多重比較的方法。多重比較有如下選擇項(xiàng):(1)方差具有齊次性時(shí)(equal variance assumed),該矩形框中有如下選擇方法: Least-significant difference (LSD)復(fù)選項(xiàng),用t檢驗(yàn)完成各組均值間的配對(duì) 比較。對(duì)多重比較誤差率不進(jìn)行調(diào)整。 TUKEY (Tukey's honestly sig

20、nificant difference)復(fù)選項(xiàng),用 Student-Range 統(tǒng)計(jì)量進(jìn)行所有組間均值的配對(duì)比較,用所有配對(duì)比較誤差率作為實(shí)驗(yàn)誤差率。 Duncan (Duncan's multiple range test)復(fù)選項(xiàng),指定一系列的 Range 值,逐步 進(jìn)行計(jì)算比較得出結(jié)論。(2)方差不具有齊次性時(shí)(Equal variance not assumed)檢驗(yàn)各均數(shù)間是否有差 異的方法有四種可供選擇: Tamhane' s T2復(fù)選項(xiàng),t檢驗(yàn)進(jìn)行配對(duì)比較。Dunnentt's T3復(fù)選項(xiàng),正態(tài)分布 下的配對(duì)比較。 3.輸出統(tǒng)計(jì)量的選擇在主對(duì)話框中,單擊option按鈕,展開(kāi)option對(duì)話框。各組選擇項(xiàng)的含義

溫馨提示

  • 1. 本站所有資源如無(wú)特殊說(shuō)明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請(qǐng)下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請(qǐng)聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁(yè)內(nèi)容里面會(huì)有圖紙預(yù)覽,若沒(méi)有圖紙預(yù)覽就沒(méi)有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫(kù)網(wǎng)僅提供信息存儲(chǔ)空間,僅對(duì)用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對(duì)用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對(duì)任何下載內(nèi)容負(fù)責(zé)。
  • 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請(qǐng)與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶因使用這些下載資源對(duì)自己和他人造成任何形式的傷害或損失。

最新文檔

評(píng)論

0/150

提交評(píng)論