精品課件《方差分析》_第1頁
精品課件《方差分析》_第2頁
精品課件《方差分析》_第3頁
精品課件《方差分析》_第4頁
精品課件《方差分析》_第5頁
已閱讀5頁,還剩49頁未讀, 繼續(xù)免費閱讀

下載本文檔

版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進行舉報或認領(lǐng)

文檔簡介

第八章

方差分析

§8.1

方差分析§8.2

多重比較§8.3

方差齊性分析

§8.1

方差分析8.1.1

問題的提出

實際工作中我們經(jīng)常碰到多個正態(tài)總體均值的比較問題,處理這類問題通常采用所謂的方差分析方法。

方差分析是統(tǒng)計檢驗的一種。由英國著名統(tǒng)計學家:

R.A.FISHER推導(dǎo)出來的,也叫F檢驗。

方差分析簡述方差分析主要用來檢驗兩個以上總體均值差異的顯著程度。對于比較不同生產(chǎn)工藝或設(shè)備條件下產(chǎn)量、質(zhì)量的差異,分析不同計劃方案效果的好壞和比較不同地區(qū)、不同人員有關(guān)的數(shù)量指標差異是否顯著時,方差分析是非常有用的。本章在討論方差分析基本原理的基礎(chǔ)上,重點介紹單因子試驗方差分析法、多重比較及方差齊性檢驗。在此之前,先介紹幾個常用術(shù)語。1、試驗指標(experimentalindex):

為了衡量試驗結(jié)果的好壞或處理效應(yīng)的高低,在試驗中具體測定的性狀或觀測的項目稱為試驗指標。由于試驗?zāi)康牟煌?,選擇的試驗指標也不相同。在畜禽、水產(chǎn)試驗中常用的試驗指標有:日增重、產(chǎn)奶量、產(chǎn)蛋率、瘦肉率等。在農(nóng)業(yè)試驗中常用的試驗指標是產(chǎn)量等2、試驗因子(experimentalfactor):試驗中所研究的影響試驗指標的因素叫試驗因子。如研究如何提高豬的日增重時,飼料的配方、豬的品種、飼養(yǎng)方式、環(huán)境溫濕度等都對日增重有影響,均可作為試驗因子來考慮。又如在農(nóng)業(yè)試驗中,作物的品種,化肥的品種,土地肥沃程度的等級都對作物的產(chǎn)量有影響,可作為試驗中感興趣的因子。當試驗中考察的因子只有一個時,稱為單因子試驗;若同時研究兩個或兩個以上因子對試驗指標的影響時,則稱為兩因子或多因子試驗。試驗因子常用大寫字母A、B、C、…等表示。3、因子水平(leveloffactor)

試驗因子所處的某種特定狀態(tài)或數(shù)量等級稱為因素水平,簡稱水平。如比較3個品種奶牛產(chǎn)奶量的高低,這3個品種就是奶牛品種這個試驗因子的3個水平;研究某種飼料中4種不同能量水平對肥豬瘦肉率的影響,這4種特定的能量水平就是飼料能量這一試驗因子的4個水平。因子水平用代表該因子的字母加添足標1,2,…,來表示。如A1、A2、…,B1、B2、…,等。例8.1.1

某大型集團公司的銷售主管想比較五種不同的推銷方法有無顯著的效果差異。在條件基本相同且無銷售經(jīng)驗的人員中選取若干名,分成五組分別進行不同銷售方法的培訓。培訓后觀察他們在一個月內(nèi)的銷售額列于下表:方法方法1方法2方法3方法4方法5銷售額20.024.916.017.525.216.821.320.118.226.617.922.617.320.226.921.230.220.917.729.323.929.922.019.130.426.822.526.818.429.722.420.720.816.525.2

在例8.1.1中的試驗指標為銷售額,銷售方法為因子,5種不同的方法代表5種不同的水平。這是一項單因子試驗,試驗的目的是了解不同銷售方法水平對銷售額有無顯著影響。

通常,在單因子試驗中,記因子為A,設(shè)其有r個水平,記為A1,A2,…,Ar.在每一水平下考察的指標可以看成一個總體,現(xiàn)有r個水平,故有r個總體.8.1.2單因子方差分析的統(tǒng)計模型假定:每一總體均為正態(tài)總體,記為N(i

,

i2),

i=1,2,…,r;各總體的方差相同:1

2=22=…=

r2=

2

;從每一總體中抽取的樣本是相互獨立的,即所有的試驗結(jié)果yij

都相互獨立。

比較各水平下的均值是否相同,即對如下的一個假設(shè)進行檢驗:H0

:1=2=…=r

(8.1.1)

備擇假設(shè)為H1

:1,2,…,r

不全相等在不會引起誤解的情況下,H1通??墒÷圆粚?。如果H0成立,因子A的r個水平均值相同,稱因子A的r個水平間沒有顯著差異,簡稱因子A不顯著;反之,當H0不成立時,因子A的r個水平均值不全相同,這時稱因子A的不同水平間有顯著差異,簡稱因子A顯著。

設(shè)從第i個水平下的總體獲得m個試驗結(jié)果,記yij

表示第i個總體的第j次重復(fù)試驗結(jié)果。共得如下n=rm個試驗結(jié)果:yij,

i=1,2,…,r,j=1,2,…,m,

其中r為水平數(shù),m為重復(fù)數(shù),i為水平編號,j為重復(fù)編號。在水平Ai下的試驗結(jié)果yij與該水平下的指標均值i一般總是有差距的,記ij

=yiji,ij

稱為隨機誤差。于是有

yij

=

i+ij

(8.1.2)(8.1.2)式稱為試驗結(jié)果yij

的數(shù)據(jù)結(jié)構(gòu)式。

單因子方差分析的統(tǒng)計模型:(8.1.3)

總均值與效應(yīng):

稱諸i的平均為總均值.

稱第i水平下的均值i與總均值

的差:

ai=i-為Ai的效應(yīng)。

模型(8.1.3)可以改寫為

(8.1.8)

假設(shè)(8.1.1)可改寫為

H0

:a1

=a2=…=ar=0(8.1.9)

一、試驗數(shù)據(jù)表

表8.1.2

單因子方差分析試驗數(shù)據(jù)

因子水平

試驗數(shù)據(jù)

平均

A1y11

y12

y1mT1A2y21

y22

y2mT2┆┆┆┆Aryr1

yr2

yrmTrT8.1.3平方和分解

表8.1.2中的最后二列的和與平均的含義如下:

數(shù)據(jù)間是有差異的。數(shù)據(jù)yij與總平均間的偏差可用yij

表示,它可分解為二個偏差之和(8.1.10)記二、組內(nèi)偏差與組間偏差

由于(8.1.11)所以

僅反映組內(nèi)數(shù)據(jù)與組內(nèi)平均的隨機誤差,稱為組內(nèi)偏差;而(8.1.12)除了反映隨機誤差外,還反映了第i個水平的效應(yīng),稱為組間偏差。在統(tǒng)計學中,把k個數(shù)據(jù)y1,y2,…,yk分別對其均值=(y1+…+yk

)/k的偏差平方和稱為k個數(shù)據(jù)的偏差平方和,它常用來度量若干個數(shù)據(jù)分散的程度。三、偏差平方和及其自由度在構(gòu)成偏差平方和Q的k個偏差y1

,…,yk

間有一個恒等式,這說明在Q中獨立的偏差只有k1個。在統(tǒng)計學中把平方和中獨立偏差個數(shù)稱為該平方和的自由度,常記為f,如Q的自由度為fQ=k1。自由度是偏差平方和的一個重要參數(shù)。

各yij間總的差異大小可用總偏差平方和

表示,其自由度為fT=n1;

四、總平方和分解公式

僅由隨機誤差引起的數(shù)據(jù)間的差異可以用

組內(nèi)偏差平方和

表示,也稱為誤差偏差平方和,其自由度為fe=nr;由于組間差異除了隨機誤差外,還反映了效應(yīng)間的差異,故由效應(yīng)不同引起的數(shù)據(jù)差異可用組間偏差平方和

表示,也稱為因子A的偏差平方和,其自由度為fA=r1;

定理8.1.1

在上述符號下,總平方和ST可以分解為因子平方和SA與誤差平方和Se之和,其自由度也有相應(yīng)分解公式,具體為:

ST=SA+Se,fT=fA+fe

(8.1.16)(8.1.16)式通常稱為總平方和分解式。

偏差平方和Q的大小與自由度有關(guān).為了便于在偏差平方和間進行比較,統(tǒng)計上引入了均方和的概念,它定義為MS=Q/fQ

,其意為平均每個自由度上有多少平方和,它比較好地度量了一組數(shù)據(jù)的離散程度。如今要對因子平方和SA與誤差平方和Se之間進行比較,用其均方和MSA=SA

/fA

,MSe=Se

/fe

進行比較,故用作為檢驗H0的統(tǒng)計量。8.1.4檢驗方法定理8.1.2

在單因子方差分析模型(8.1.8)及前述符號下,有

(1)Se/

2~

2(nr),從而E(Se)

=(nr)

2

,進一步,若H0成立,則有SA/

2~

2(r1)(2)SA與Se獨立。

由定理8.1.2,若H0成立,則檢驗統(tǒng)計量F服從自由度為fA和fe的F分布,因此拒絕域為W={FF1(fA

,fe)},通常將上述計算過程列成一張表格,稱為方差分析表。表8.1.3單因子方差分析表來源平方和自由度均方和F比因子SAfA=r1MSA=SA/fAF=MSA/MSe誤差Sefe=nrMSe=Se/fe總和STfT=n1對給定的,可作如下判斷:

若F

F1(fA

,fe)

,則說明因子A不顯著。該檢驗的p值也可利用統(tǒng)計軟件求出,若以Y記服從F(fA

,fe)的隨機變量,則檢驗的

p值為p=P(YF)。

如果F>F1(fA

,fe),則認為因子A顯著;常用的各偏差平方和的計算公式如下:

(8.1.19)

一般可將計算過程列表進行。

例8.1.1(續(xù))對例8.1.1中的假設(shè)進行檢驗方法方法1方法2方法3方法4方法5合計銷售額20.024.916.017.525.216.821.320.118.226.617.922.617.320.226.921.230.220.917.729.323.929.922.019.130.426.822.526.818.429.722.420.720.816.525.2Ti149172.1143.9127.6193.3T=785.9Ti2/m3171.574231.202958.172325.975337.8418024.75平方和

3243.304325.253030.992334.445365.9918295.74

算得各偏差平方和為:n=35,T2/n=17646.82,ST=18295.74-17646.82=648.92,SA=377.93,SE=ST

–SA=270.99,可列出如下方差分析表返回對于給定的顯著性水平α=0.05,由于F=10.46>F1-α(t-1,n-t)=F0.95(4,30)=2.69,拒絕H0,即不同的銷售方法對銷售額由顯著的影響。方差來源平方和自由度均方F比銷售方法377.93494.4810.46誤差270.99309.03總和648.9334單因素方差分析表例8.1.2

在飼料養(yǎng)雞增肥的研究中,某研究所提出三種飼料配方:A1是以魚粉為主的飼料,A2是以槐樹粉為主的飼料,A3是以苜蓿粉為主的飼料。為比較三種飼料的效果,特選24只相似的雛雞隨機均分為三組,每組各喂一種飼料,60天后觀察它們的重量。試驗結(jié)果如下表所示:

表8.1.2

雞飼料試驗數(shù)據(jù)

飼料A雞重(克)A110731009106010011002101210091028A21107109299011091090107411221001A310931029108010211022103210291048

解:

這是一個單因子方差分析問題.,將原始數(shù)據(jù)減去1000,列表給出計算過程:

表8.1.4例8.1.2的計算表水平數(shù)據(jù)(原始數(shù)據(jù)-1000)TiTi2A17396012129281943763610024A210792-101099074122158534222560355A3932980212232294835412531620984113350517791363

利用(8.1.19),可算得各偏差平方和為:把上述諸平方和及其自由度填入方差分析表表8.1.5例8.1.2的方差分析表

來源平方和自由度均方和F比因子9660.083324830.04173.5948

誤差28215.9584211343.6171總和37876.041723若取=0.05,則F0.95

(2

,21)=3.47

,由于F=3.5948>3.47,故認為因子A(飼料)是顯著的,即三種飼料對雞的增肥作用有明顯的差別。

8.1.5參數(shù)估計

在檢驗結(jié)果為顯著時,我們可進一步求出總均值

、各主效應(yīng)ai和誤差方差2的估計。

一、點估計由模型(8.1.8)知諸yij相互獨立,且yij~N(+ai

,2)

,因此,可使用極大似然方法求出一般平均

、各主效應(yīng)ai和誤差方差2的估計:由極大似然估計的不變性,各水平均值i的極大似然估計為,由于不是2的無偏估計,可修偏:

由于,可給出Ai的水平均值i的1-的置信區(qū)間為

其中。

二、置信區(qū)間例8.1.3

繼續(xù)例8.1.2,此處我們給出諸水平均值的估計。因子A的三個水平均值的估計分別為從點估計來看,水平2(以槐樹粉為主的飼料)是最優(yōu)的。

誤差方差的無偏估計為利用(8.1.23)可以給出諸水平均值的置信區(qū)間。此處,,若?。?.05

,則t1-/2(fe

)=t0.95(21

)=2.0796,,于是三個水平均值的0.95置信區(qū)間分別為

在單因子試驗的數(shù)據(jù)分析中可得到如下三個結(jié)果:

因子是否顯著;

試驗的誤差方差2的估計;

諸水平均值i的點估計與區(qū)間估計。

在因子A顯著時,通常只需對較優(yōu)的水平均值作參數(shù)估計,在因子A不顯著場合,參數(shù)估計無需進行。8.1.6重復(fù)數(shù)不等情形單因子方差分析并不要求每個水平下重復(fù)試驗次數(shù)全相等,在重復(fù)數(shù)不等場合的方差分析與重復(fù)數(shù)相等情況下的方差分析極為相似,只在幾處略有差別。

數(shù)據(jù):設(shè)從第i個水平下的總體獲得mi個試驗結(jié)果,記為yi1

,yi2…,yim

,i=1,2,…r,統(tǒng)計模型為:

(8.1.24)

總均值:諸i的加權(quán)平均(所有試驗結(jié)果的均值的平均)(8.1.25)稱為總均值或一般平均。

效應(yīng)約束條件:

各平方和的計算:SA的計算公式略有不同

例8.1.4

某食品公司對一種食品設(shè)計了四種新包裝。為考察哪種包裝最受顧客歡迎,選了10個地段繁華程度相似、規(guī)模相近的商店做試驗,其中二種包裝各指定兩個商店銷售,另二個包裝各指定三個商店銷售。在試驗期內(nèi)各店貨架排放的位置、空間都相同,營業(yè)員的促銷方法也基本相同,經(jīng)過一段時間,記錄其銷售量數(shù)據(jù),列于表8.1.6左半邊,其相應(yīng)的計算結(jié)果列于右側(cè)。

表8.1.6銷售量數(shù)據(jù)及計算表

包裝類型

銷售量

miTiTi2/miA11218230450468A2141213339507509A319172135710831091A4243025414581476和n=10T=180由此可求得各類偏差平方和如下

方差分析表如表8.1.8所示

.若?。?.01,查表得F0.01(3,6)=9.78,由于F=11.22>9.78,故我們可認為各水平間有顯著差異。

表8.1.7例8.1.4的方差分析表

來源平方和自由度均方和F比因子A25838611.22誤差e4667.67總和T3049

由于因子顯著,我們還可以給出諸水平均值的估計。因子A的四個水平均值的估計分別為由此可見,第四種包裝方式效果最好。誤差方差的無偏估計為

進一步,利用(8.1.23)也可以給出諸水平均值的置信區(qū)間,只是在這里

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負責。
  • 6. 下載文件中如有侵權(quán)或不適當內(nèi)容,請與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

評論

0/150

提交評論