應(yīng)用統(tǒng)計課件第六章:方差分析_第1頁
應(yīng)用統(tǒng)計課件第六章:方差分析_第2頁
應(yīng)用統(tǒng)計課件第六章:方差分析_第3頁
應(yīng)用統(tǒng)計課件第六章:方差分析_第4頁
應(yīng)用統(tǒng)計課件第六章:方差分析_第5頁
已閱讀5頁,還剩56頁未讀, 繼續(xù)免費閱讀

下載本文檔

版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進行舉報或認領(lǐng)

文檔簡介

1第六章方差分析

§6.1單因子方差分析

實踐例子:美國的Burke市場調(diào)查公司是一家最富經(jīng)驗的市場調(diào)研機構(gòu)之一。在一次研究中,一家Anon公司要評價兒童干谷類食品的潛在的新品種。Anon產(chǎn)品開發(fā)者認為可能改善食品味道的四類關(guān)鍵因素為:1.食品中小麥與玉米的比例。2.甜味劑的類型:白糖、蜂蜜或人工制劑。3.果味香料的有無。4.加工時間的長短。2用于研究由品嘗得來的數(shù)據(jù)的統(tǒng)計方法是方差分析。分析結(jié)果如下:*食品成分及甜味劑的類型對味道影響很大。*果味香精事實上破壞了食品的味道。*加工時間對味道沒有影響。這些信息幫助Anon識別出了可能產(chǎn)生最佳口味食品的因素。從而在生產(chǎn)方案中起了很大的作用。3在實際中常會遇到比較多個總體均值是否相等的問題。

例如某工廠的原料來自四個不同地區(qū),那么用不同地區(qū)的原料生產(chǎn)的產(chǎn)品的質(zhì)量是否一致?

再如某工廠有三個聯(lián)營廠,生產(chǎn)同一產(chǎn)品,生產(chǎn)工藝也相同,那么這幾個聯(lián)營廠的產(chǎn)品質(zhì)量是否一致?

4類似問題有許多,今后我們稱所要比較的地區(qū)、聯(lián)營廠等為因子,因子所處的狀態(tài)稱為水平,如四個地區(qū)是地區(qū)這個因子的四個水平。我們一般用大寫字母A、B、C等表示因子,用大寫字母加下標(biāo)表示該因子的水平,如A的水平用

等表示。5下面用一個例子來說明問題的提法。例6.1.1國民計算機公司(NCP)在亞特蘭大、達拉斯以及西雅圖的工廠生產(chǎn)計算機與傳真機。為確定這些工廠中有多少員工了解全面質(zhì)量管理,從每個工廠選取了一個由6名員工組成的隨機樣本,并對他們進行質(zhì)量意識考試。18名員工的考分列在下表中。管理者想用這些數(shù)據(jù)來檢驗假設(shè):三個工廠的平均考分相同。6表6.1員工的考分

觀察值亞特蘭大(工廠1)達拉斯(工廠2)西雅圖(工廠3)

1

85

71

59

2

7575

643

82

73

62

4

7674

69

5

71

69

756

8582

677在本例中我們要比較三個工廠的考分是否相同,為此把工廠看成一個因子,記為A,它有三個工廠,就看成因子A的三個水平,記。我們將第個工廠的第個工人的考分記為在本例中

.由于在每個工廠選的是隨機樣本,(工人間的差異控制在最小范圍)因此一個工廠的工人的不同考分可看成是在一個工廠的若干次重復(fù)觀察。所以可把一個工廠的考分看成一個總體。為比較三個工廠的平均考分是否相同,相當(dāng)于要比較三個總體的均值是否一致。為簡化起見,需要提出若干假定,把所要回答的問題歸結(jié)為一個統(tǒng)計問題,然后設(shè)法解決它。86.1.2

單因子方差分析的統(tǒng)計模型一、假定在單因子試驗中,設(shè)因子A有r個水平,

在每一水平下考察的指標(biāo)可以看成一個總體,現(xiàn)有r個水平,故有r個總體,并假定:(1)

每一總體均服從正態(tài)分布;(2)

每一總體的方差相同;(3)

從每一總體中抽取的樣本獨立。9要比較各個總體的均值是否一致,就是要檢驗各總體的均值是否相同,設(shè)第i個總體的均值為,那么要檢驗的假設(shè)為:

(6.1.1)其備擇假設(shè)為:

不全相同。通常

可以省略不寫。10當(dāng)

為真時,A的r個水平的均值相同,這時稱因子A的各水平間無顯著差異,簡稱因子A不顯著;反之,當(dāng)

不真時,各

不全相同,這時稱因子A的各水平間有顯著差異,簡稱因子A顯著。用于檢驗假設(shè)(6.1.1)的統(tǒng)計方法稱為方差分析法,其實質(zhì)是檢驗若干個具有相同方差的正態(tài)總體的均值是否相等的一種統(tǒng)計方法。若考察的因子只有一個,稱為單因子方差分析。11二、數(shù)據(jù)結(jié)構(gòu)及統(tǒng)計模型設(shè)從第i個總體獲得容量為的樣本,

在水平下獲得的與不會一致,記

稱為隨機誤差,有

(6.1.2)這是的數(shù)據(jù)結(jié)構(gòu)式。

12稱

為一般平均,其中。稱

為A的第i水平的主效應(yīng),簡稱為的效應(yīng)。在方差分析中引入一般平均與效應(yīng)的概念顯然有13(6.1.4)從而假設(shè)(6.1.1)可寫成:統(tǒng)計模型可以改寫成:146.1.3

檢驗方法一、誤差來源

驗數(shù)據(jù)

……

……

……15造成各差異的原因可能有兩個:(1)原假設(shè)

不真,即各水平下總體均值不同;(2)差異是由于隨機誤差引起的。

記表示水平下的數(shù)據(jù)和,

表示水平下數(shù)據(jù)的平均值,

為所有數(shù)據(jù)的總平均值。

16每一數(shù)據(jù)與總平均的偏差可以分解成兩部分:

(6.1.5)稱為組內(nèi)偏差,僅反映隨機誤差:

(6.1.6)

稱為組間偏差,除隨機誤差之外還有第i個水平的效應(yīng):

(6.1.7)17二、平方和分解稱為總偏差平方和。

稱為誤差偏差平方和

稱為因子A的偏差平方和

18三、檢驗統(tǒng)計量與拒絕域有計算公式:

可以證明有:19(1)求:利用正態(tài)總體中的結(jié)論(見第一章)有又由分布的可加性知:則有

20(2)求21從而有

22當(dāng)原假設(shè)為真時,各

相等且為0

,則取檢驗統(tǒng)計量為:(6.1.8)比較合理的拒絕域形式為:

對給定的顯著性水平

,

應(yīng)滿足

23可知當(dāng)為真

表6.1.1單因子方差分析表方差來源平方和自由度均方和

F比

24

例6.1.1的方差分析表方差來源平方和自由度均方和

比值5162258.9.000.0034301528.67

94617

P=0.003<0.05,故拒絕256.1.4

效應(yīng)與誤差方差的估計

一、點估計用MLE法求各效應(yīng)與方差的估計。

26加上約束條件,則MLE為:27

的MLE為,可以證明均為相應(yīng)參數(shù)的無偏估計。

不是

的無偏估計

的無偏估計為

28二、的置信水平為的置信區(qū)間我們來利用樞軸量法構(gòu)造的置信區(qū)間。從的點估計出發(fā),有

且它們獨立

29§6.2雙因子方差分析

一、問題對于雙因子試驗,試驗間差異同樣是(1)由于各因子水平變化所引起;(2)試驗誤差(包括未加控制或無法控制的因子的變化)所引起。和單因子試驗的情況一樣,在雙因子試驗中,方差分析的目的就是將試驗誤差所引起的結(jié)果差異與試驗條件的改變(即各因子不同的水平變化)所引起的結(jié)果差異區(qū)分開,以便能抓住問題的實質(zhì);此外,還要將試驗結(jié)果的主要因子和次要因子區(qū)分開來,以便集中力量研究幾個主要因子。301、例子我們考慮與管理類研究生入學(xué)考試(GMAT)有關(guān)的一次研究。GMAT是一種商學(xué)院研究生院用來評價申請者攻讀該領(lǐng)域研究生課程能力的標(biāo)準(zhǔn)化考試,其分數(shù)在200~800之間,分數(shù)越高表明能力越強。為嘗試提高考生在GMAT考試中的分數(shù),一所較大的得克薩斯洲的大學(xué)考慮提供下面三種GMAT輔導(dǎo)課程。(1)3小時的復(fù)習(xí),內(nèi)容覆蓋了GMAT中??嫉念}型。(2)

1天的課程,內(nèi)容覆蓋了有關(guān)考試材料,還有進行一次模擬考試并評分。(3)10周的強化班,涉及到發(fā)現(xiàn)每個考生的弱點并建立個人的改進課程。該研究中的一個因子就是GMAT輔導(dǎo)課程,它有三個水平:3小時復(fù)習(xí)、1天的課程和10周強化班。31通常GMAT的考生來自三類院校:商學(xué)院、工學(xué)院和藝術(shù)與科學(xué)學(xué)院。該試驗中第二個因子就是考生的本科所在的學(xué)院是否影響GMAT分數(shù)。有三個水平:商學(xué)院、工學(xué)院和藝術(shù)與科學(xué)學(xué)院。這兩個因子共有種水平組合,在每種水平組合下選取了由兩名考生組成的樣本。數(shù)據(jù)如下表:32表6.2.1

兩因子試驗的GMAT分數(shù)

因子B:學(xué)院

商學(xué)院工學(xué)院藝術(shù)與科學(xué)學(xué)院

3小時500540480

因子A:

580160400

輔導(dǎo)課程1天460560420

540620480

10周560600480

600580410

33對于表6.2.1中的數(shù)據(jù)進行方差分析計算可以回答下面的問題。*因子A的影響:輔導(dǎo)課程對于GMAT分數(shù)的影響是否不同?*因子B的影響:本科學(xué)院對于考生在GMAT中表現(xiàn)出來的能力方面的影響是否不同?*交互影響(因子A與因子B):是否某些學(xué)院的考生在一種輔導(dǎo)課程中表現(xiàn)不錯,但其他學(xué)院的考生卻在另一種輔導(dǎo)課程中表現(xiàn)很好。如果交互影響對于GMAT分數(shù)有顯著作用,那么我們可以得出輔導(dǎo)課程的類型的影響依賴于本科學(xué)院的結(jié)論。342、方差分析兩因子方差分析的平方和分解公式如下:

有以下記號:

35表6.2.2

有t個重復(fù)次數(shù)的兩因子試驗的ANOVA表方差來源平方和自由度均方因子A因子B交互作用誤差

總計

363、計算與結(jié)論

因子B的第j水平下的樣本均值;采用下面一些記號:─因子A第i水平和因子B的第

j水平下的第k個觀察值;

所有rst個觀察值的總樣本平均;因子A第i水平和因子B的第j水平組合下的樣本均值因子A的第i水平下的樣本均值;3738表6.2.3兩因子試驗的GMAT研究匯總數(shù)據(jù)

商學(xué)院工學(xué)院藝術(shù)與科學(xué)行合計因子A平均值3小時復(fù)習(xí)50058010805404601000480400880

2960

1天的課程46054010005606201180420480900

3080

10周強化班56060011606004801180480410890

3230

列合計因子B平均值3240336026709270合計

39表6.2.4兩因子GMAT研究的ANOVA表方差來源平方和自由度均方因子A610023050因子B45300222650交互作用1120042800

誤差1985092206

總計8245017

40二、數(shù)學(xué)模型因子A有r個水平,,因子B有s個水平

,在條件下指標(biāo)值

一般平均水平的(主)效應(yīng)水平的(主)效應(yīng)要檢驗:一切是否相等。若一切均相等,A,B不顯著;若一切不全相等,則A的水平有差異,B的水平有差異,或二者均有差異。令:41

與之間的關(guān)系如下:①②

效應(yīng)可加模型(無交互作用模型)42均不拒絕一切相等拒絕,不拒絕一切不等,原因,A顯著;拒絕,不拒絕一切不等,原因,B顯著;

均拒絕一切不等。條件下進行一次試驗,結(jié)果,因只進行了一次試驗,故不能考查其交互作用。有如下模型:

43②,與的交互效應(yīng)44有交互作用模型:在條件下進行m次(m≥2)試驗結(jié)果為45例(收率)一個因子水平的好壞程度與另一因子水平無關(guān)(此情況稱無交互作用,兩直線平行),一個因子水平的好壞程度受另一因子水平的制約(此情況稱有交互作用,兩直線不平行)。

B

A低高短5060長6575(55,80)46三、效應(yīng)可加模型的方差分析

1.數(shù)學(xué)模型47①分析各不同的原因1)不成立,A水平間有差異;2)不成立,B水平間有差異;3)隨機誤差48②平方和分解總的數(shù)據(jù)波動:令則總的偏差平方和為因子A的水平不同引起的數(shù)據(jù)波動:令

因子A的偏差平方和為

因子B的偏差平方和為49

只與誤差有關(guān)50③F比在為真時,,因為在為真時,在為真時,可證明:且與獨立51若

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負責(zé)。
  • 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時也不承擔(dān)用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

評論

0/150

提交評論