統(tǒng)計學(xué)方差分析_第1頁
統(tǒng)計學(xué)方差分析_第2頁
統(tǒng)計學(xué)方差分析_第3頁
統(tǒng)計學(xué)方差分析_第4頁
統(tǒng)計學(xué)方差分析_第5頁
已閱讀5頁,還剩96頁未讀, 繼續(xù)免費(fèi)閱讀

下載本文檔

版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進(jìn)行舉報或認(rèn)領(lǐng)

文檔簡介

關(guān)于統(tǒng)計學(xué)方差分析第十章方差分析第一節(jié)方差分析的基本問題第二節(jié)單因素方差分析第三節(jié)雙因素方差分析第2頁,共101頁,2024年2月25日,星期天學(xué)習(xí)目標(biāo)解釋方差分析的概念解釋方差分析的基本思想和原理2. 掌握單因素方差分析的方法及應(yīng)用3. 掌握雙因素方差分析的方法及應(yīng)用第3頁,共101頁,2024年2月25日,星期天第一節(jié)方差分析的基本問題一.方差分析內(nèi)容及其術(shù)語二.方差分析的基本思想和原理三.發(fā)差分析中的基本假定四、問題的一般提法第4頁,共101頁,2024年2月25日,星期天一.方差分析內(nèi)容及其術(shù)語第5頁,共101頁,2024年2月25日,星期天(一)什么是方差分析?

(analysisofvariance)檢驗(yàn)多個總體均值是否相等通過分析數(shù)據(jù)的誤差判斷各總體均值是否相等研究分類型自變量對數(shù)值型因變量的影響一個或多個分類尺度的自變量兩個或多個(k個)處理水平或分類一個間隔或比率尺度的因變量有單因素方差分析和雙因素方差分析單因素方差分析:涉及一個分類的自變量雙因素方差分析:涉及兩個分類的自變量第6頁,共101頁,2024年2月25日,星期天消費(fèi)者投訴次數(shù)與行業(yè)的關(guān)系

消費(fèi)者與產(chǎn)品生產(chǎn)者、銷售者或服務(wù)提供者之間經(jīng)常發(fā)生糾紛。當(dāng)發(fā)生糾紛后,消費(fèi)者常常會想消費(fèi)者協(xié)會投訴。為了對幾個行業(yè)的服務(wù)質(zhì)量進(jìn)行評價,消費(fèi)者協(xié)會在零售、旅游業(yè)、航空公司、家電制造業(yè)抽取了不同的企業(yè)作為樣本。其中所抽取零售業(yè)7家、旅游業(yè)6家、航空公司5家、家電制造業(yè)5家。每個行業(yè)中抽取的這些企業(yè),服務(wù)對象、服務(wù)內(nèi)容、企業(yè)規(guī)模等方面基本上相同的。然后統(tǒng)計出最近一年中消費(fèi)者對總共23家企業(yè)投訴的次數(shù),結(jié)果如下表:第7頁,共101頁,2024年2月25日,星期天【例10.1】為了對幾個行業(yè)的服務(wù)質(zhì)量進(jìn)行評價,消費(fèi)者協(xié)會在四個行業(yè)分別抽取了不同的企業(yè)作為樣本。最近一年中消費(fèi)者對總共23家企業(yè)投訴的次數(shù)如下表第8頁,共101頁,2024年2月25日,星期天分析四個行業(yè)之間的服務(wù)質(zhì)量是否有顯著差異,也就是要判斷“行業(yè)”對“投訴次數(shù)”是否有顯著影響作出這種判斷最終被歸結(jié)為檢驗(yàn)這四個行業(yè)被投訴次數(shù)的均值是否相等若它們的均值相等,則意味著“行業(yè)”對投訴次數(shù)是沒有影響的,即它們之間的服務(wù)質(zhì)量沒有顯著差異;若均值不全相等,則意味著“行業(yè)”對投訴次數(shù)是有影響的,它們之間的服務(wù)質(zhì)量有顯著差異。若它們的均值不全相等,則意味著行業(yè)對投訴次數(shù)是有影響的,它們之間的服務(wù)質(zhì)量應(yīng)該有顯著差異。第9頁,共101頁,2024年2月25日,星期天(二)方差分析中的有關(guān)術(shù)語因素或因子(factor)所要檢驗(yàn)的對象要分析行業(yè)對投訴次數(shù)是否有影響,行業(yè)是要檢驗(yàn)的因素或因子水平或處理(treatment)因子的不同表現(xiàn)零售業(yè)、旅游業(yè)、航空公司、家電制造業(yè)就是因子的水平觀察值在每個因素水平下得到的樣本數(shù)據(jù)每個行業(yè)被投訴的次數(shù)就是觀察值第10頁,共101頁,2024年2月25日,星期天4.試驗(yàn)這里只涉及一個因素,因此稱為單因素四水平的試驗(yàn)5.總體因素的每一個水平可以看作是一個總體比如零售業(yè)、旅游業(yè)、航空公司、家電制造業(yè)可以看作是四個總體6.樣本數(shù)據(jù)被投訴次數(shù)可以看作是從這四個總體中抽取的樣本數(shù)據(jù)第11頁,共101頁,2024年2月25日,星期天(案例2)【例】某飲料生產(chǎn)企業(yè)研制出一種新型飲料。飲料的顏色共有四種,分別為橘黃色、粉色、綠色和無色透明。這四種飲料的營養(yǎng)含量、味道、價格、包裝等可能影響銷售量的因素全部相同?,F(xiàn)從地理位置相似、經(jīng)營規(guī)模相仿的五家超級市場上收集了前一時期該飲料的銷售情況,見表10-2。試分析飲料的顏色是否對銷售量產(chǎn)生影響。第12頁,共101頁,2024年2月25日,星期天什么是方差分析?

(例子的進(jìn)一步分析)檢驗(yàn)飲料的顏色對銷售量是否有影響,也就是檢驗(yàn)四種顏色飲料的平均銷售量是否相同設(shè)

1為無色飲料的平均銷售量,

2粉色飲料的平均銷售量,

3為橘黃色飲料的平均銷售量,

4為綠色飲料的平均銷售量,也就是檢驗(yàn)下面的假設(shè)H0:1

2

3

4

H1:1,

2,

3,

4

不全相等檢驗(yàn)上述假設(shè)所采用的方法就是方差分析第13頁,共101頁,2024年2月25日,星期天從散點(diǎn)圖上可以看出(仍以例10.1為例)不同行業(yè)被投訴的次數(shù)是有明顯差異的同一個行業(yè),不同企業(yè)被投訴的次數(shù)也明顯不同家電制造被投訴的次數(shù)較高,航空公司被投訴的次數(shù)較低行業(yè)與被投訴次數(shù)之間有一定的關(guān)系如果行業(yè)與被投訴次數(shù)之間沒有關(guān)系,那么它們被投訴的次數(shù)應(yīng)該差不多相同,在散點(diǎn)圖上所呈現(xiàn)的模式也就應(yīng)該很接近二、方差分析的基本思想和原理

(一)圖形描述第14頁,共101頁,2024年2月25日,星期天方差分析的基本思想和原理

(圖形分析)

零售業(yè)旅游業(yè)航空公司家電制造第15頁,共101頁,2024年2月25日,星期天僅從散點(diǎn)圖上觀察還不能提供充分的證據(jù)證明不同行業(yè)被投訴的次數(shù)之間有顯著差異這種差異也可能是由于抽樣的隨機(jī)性所造成的需要有更準(zhǔn)確的方法來檢驗(yàn)這種差異是否顯著,也就是進(jìn)行方差分析所以叫方差分析,因?yàn)殡m然我們感興趣的是均值,但在判斷均值之間是否有差異時則需要借助于方差這個名字也表示:它是通過對數(shù)據(jù)誤差來源的分析判斷不同總體的均值是否相等。因此,進(jìn)行方差分析時,需要考察數(shù)據(jù)誤差的來源第16頁,共101頁,2024年2月25日,星期天比較兩類誤差,以檢驗(yàn)均值是否相等比較的基礎(chǔ)是方差比如果系統(tǒng)(處理)誤差明顯地不同于隨機(jī)誤差,則均值就是不相等的;反之,均值就是相等的誤差是由各部分的誤差占總誤差的比例來測度的(二)誤差分解第17頁,共101頁,2024年2月25日,星期天方差分析的基本思想和原理

(兩類誤差)隨機(jī)誤差因素的同一水平(總體)下,樣本各觀察值之間的差異。比如,同一行業(yè)下不同企業(yè)被投訴次數(shù)是不同的這種差異可以看成是隨機(jī)因素的影響,稱為隨機(jī)誤差

系統(tǒng)誤差素的不同水平(不同總體)下,各觀察值之間的差異比如,不同行業(yè)之間的被投訴次數(shù)之間的差異這種差異可能是由于抽樣的隨機(jī)性所造成的,也可能是由于行業(yè)本身所造成的,后者所形成的誤差是由系統(tǒng)性因素造成的,稱為系統(tǒng)誤差第18頁,共101頁,2024年2月25日,星期天數(shù)據(jù)的誤差用平方和(sumofsquares)表示,稱為方差組內(nèi)方差(withingroups)因素的同一水平(同一個總體)下樣本數(shù)據(jù)的方差比如,零售業(yè)被投訴次數(shù)的方差組內(nèi)方差只包含隨機(jī)誤差組間方差(betweengroups)因素的不同水平(不同總體)下各樣本之間的方差比如,四個行業(yè)被投訴次數(shù)之間的方差組間方差既包括隨機(jī)誤差,也包括系統(tǒng)誤差第19頁,共101頁,2024年2月25日,星期天(三)誤差分析若不同行業(yè)對投訴次數(shù)沒有影響,則組間誤差中只包含隨機(jī)誤差,沒有系統(tǒng)誤差。這時,組間誤差與組內(nèi)誤差經(jīng)過平均后的數(shù)值就應(yīng)該很接近,它們的比值就會接近1若不同行業(yè)對投訴次數(shù)有影響,在組間誤差中除了包含隨機(jī)誤差外,還會包含有系統(tǒng)誤差,這時組間誤差平均后的數(shù)值就會大于組內(nèi)誤差平均后的數(shù)值,它們之間的比值就會大于1當(dāng)這個比值大到某種程度時,就可以說不同水平之間存在著顯著差異,也就是自變量對因變量有影響判斷行業(yè)對投訴次數(shù)是否有顯著影響,實(shí)際上也就是檢驗(yàn)被投訴次數(shù)的差異主要是由于什么原因所引起的。如果這種差異主要是系統(tǒng)誤差,說明不同行業(yè)對投訴次數(shù)有顯著影響第20頁,共101頁,2024年2月25日,星期天三、方差分析中的基本假定第21頁,共101頁,2024年2月25日,星期天三、方差分析的基本假定每個總體都應(yīng)服從正態(tài)分布對于因素的每一個水平,其觀察值是來自服從正態(tài)分布總體的簡單隨機(jī)樣本比如,每個行業(yè)被投訴的次數(shù)必需服從正態(tài)分布各個總體的方差必須相同各組觀察數(shù)據(jù)是從具有相同方差的總體中抽取的比如,四個行業(yè)被投訴次數(shù)的方差都相等觀察值是獨(dú)立的比如,每個行業(yè)被投訴的次數(shù)與其他行業(yè)被投訴的次數(shù)獨(dú)立第22頁,共101頁,2024年2月25日,星期天

在上述假定條件下,判斷行業(yè)對投訴次數(shù)是否有顯著影響,實(shí)際上也就是檢驗(yàn)具有同方差的四個正態(tài)總體的均值是否相等

如果四個總體的均值相等,可以期望四個樣本的均值也會很接近四個樣本的均值越接近,推斷四個總體均值相等的證據(jù)也就越充分樣本均值越不同,推斷總體均值不同的證據(jù)就越充分第23頁,共101頁,2024年2月25日,星期天例10.1的假設(shè)

如果原假設(shè)成立,即H0:

m1=m2=m3=m4四個行業(yè)被投訴次數(shù)的均值都相等意味著每個樣本都來自均值為

、方差為

2的同一正態(tài)總體

Xf(X)

1

2

3

4

第24頁,共101頁,2024年2月25日,星期天

若備擇假設(shè)成立,即H1:

mi(i=1,2,3,4)不全相等至少有一個總體的均值是不同的四個樣本分別來自均值不同的四個正態(tài)總體

Xf(X)

3

1

2

4

第25頁,共101頁,2024年2月25日,星期天四、問題的一般提法第26頁,共101頁,2024年2月25日,星期天設(shè)因素有k個水平,每個水平的均值分別用

1,

2,,

k

表示要檢驗(yàn)k個水平(總體)的均值是否相等,需要提出如下假設(shè):H0:

1

2…

k

H1:

1,

2,,

k

不全相等設(shè)

1為零售業(yè)被投訴次數(shù)的均值,

2為旅游業(yè)被投訴次數(shù)的均值,

3為航空公司被投訴次數(shù)的均值,

4為家電制造業(yè)被投訴次數(shù)的均值,提出的假設(shè)為H0:

1

2

3

4

H1:

1,

2,

3,

4

不全相等第27頁,共101頁,2024年2月25日,星期天第二節(jié)單因素方差分析一、數(shù)據(jù)結(jié)構(gòu)二、分析步驟三、關(guān)系強(qiáng)度的測量四、用Excel進(jìn)行方差分析第28頁,共101頁,2024年2月25日,星期天一、數(shù)據(jù)結(jié)構(gòu)第29頁,共101頁,2024年2月25日,星期天一、單因素方差分析的數(shù)據(jù)結(jié)構(gòu)

(one-wayanalysisofvariance)

第30頁,共101頁,2024年2月25日,星期天二、單因素方差分析的步驟提出假設(shè)構(gòu)造檢驗(yàn)統(tǒng)計量統(tǒng)計決策方差分析表用Excel進(jìn)行方差分析第31頁,共101頁,2024年2月25日,星期天(一)提出假設(shè)一般提法H0

:m1=m2=…=mk

自變量對因變量沒有顯著影響

H1:m1

,m2

,…,mk不全相等自變量對因變量有顯著影響

注意:拒絕原假設(shè),只表明至少有兩個總體的均值不相等,并不意味著所有的均值都不相等第32頁,共101頁,2024年2月25日,星期天(二)構(gòu)造檢驗(yàn)的統(tǒng)計量為檢驗(yàn)H0是否成立,需確定檢驗(yàn)的統(tǒng)計量

構(gòu)造統(tǒng)計量需要計算水平的均值全部觀察值的總均值離差平方和均方(MS)

第33頁,共101頁,2024年2月25日,星期天1、計算水平的均值

假定從第i個總體中抽取一個容量為ni的簡單隨機(jī)樣本,第i個總體的樣本均值為該樣本的全部觀察值總和除以觀察值的個數(shù)

計算公式為式中:ni為第i個總體的樣本觀察值個數(shù)

xij為第i個總體的第j個觀察值

第34頁,共101頁,2024年2月25日,星期天

2、計算全部觀察值的總均值

全部觀察值的總和除以觀察值的總個數(shù)計算公式為第35頁,共101頁,2024年2月25日,星期天例10.1分析第36頁,共101頁,2024年2月25日,星期天3、計算各誤差平方和

(1)總誤差平方和SST全部觀察值與總平均值的離差平方和反映全部觀察值的離散狀況其計算公式為

前例的計算結(jié)果:

SST=(57-47.869565)2+…+(58-47.869565)2=115.9295第37頁,共101頁,2024年2月25日,星期天(2)計算水平項(xiàng)平方和SSA各組平均值與總平均值的離差平方和反映各總體的樣本均值之間的差異程度,又稱組間平方和該平方和既包括隨機(jī)誤差,也包括系統(tǒng)誤差計算公式為

前例的計算結(jié)果:SSA=1456.608696第38頁,共101頁,2024年2月25日,星期天(3)計算誤差項(xiàng)平方和SSE每個水平或組的各樣本數(shù)據(jù)與其組平均值的離差平方和反映每個樣本各觀察值的離散狀況,又稱組內(nèi)平方和該平方和反映的是隨機(jī)誤差的大小計算公式為

前例的計算結(jié)果:SSE=2708第39頁,共101頁,2024年2月25日,星期天補(bǔ)充例計算結(jié)果

第40頁,共101頁,2024年2月25日,星期天構(gòu)造檢驗(yàn)的統(tǒng)計量

(計算總離差平方和

SST)全部觀察值與總平均值的離差平方和反映全部觀察值的離散狀況其計算公式為

補(bǔ)例的計算結(jié)果:

SST=(26.5-28.695)2+(28.7-28.695)2+…+(32.8-28.695)2=115.9295第41頁,共101頁,2024年2月25日,星期天構(gòu)造檢驗(yàn)的統(tǒng)計量

(計算誤差項(xiàng)平方和

SSE)每個水平或組的各樣本數(shù)據(jù)與其組平均值的離差平方和反映每個樣本各觀察值的離散狀況,又稱組內(nèi)離差平方和該平方和反映的是隨機(jī)誤差的大小計算公式為

補(bǔ)例的計算結(jié)果:SSE=39.084第42頁,共101頁,2024年2月25日,星期天構(gòu)造檢驗(yàn)的統(tǒng)計量

(計算水平項(xiàng)平方和

SSA)各組平均值與總平均值的離差平方和反映各總體的樣本均值之間的差異程度,又稱組間平方和該平方和既包括隨機(jī)誤差,也包括系統(tǒng)誤差計算公式為

補(bǔ)例的計算結(jié)果:SSA=76.8455第43頁,共101頁,2024年2月25日,星期天構(gòu)造檢驗(yàn)的統(tǒng)計量

(三個平方和的關(guān)系)

總離差平方和(SST)、誤差項(xiàng)離差平方和(SSE)、水平項(xiàng)離差平方和(SSA)之間的關(guān)系SST=SSA+SSE

補(bǔ)例的計算結(jié)果:4164.608696=1456.608696+2708第44頁,共101頁,2024年2月25日,星期天構(gòu)造檢驗(yàn)的統(tǒng)計量

(三個平方和的關(guān)系)

總離差平方和(SST)、誤差項(xiàng)離差平方和(SSE)、水平項(xiàng)離差平方和(SSA)之間的關(guān)系SST=SSE+SSA第45頁,共101頁,2024年2月25日,星期天構(gòu)造檢驗(yàn)的統(tǒng)計量

(三個平方和的作用)

SST反映了全部數(shù)據(jù)總的誤差程度;SSE反映了隨機(jī)誤差的大小;SSA反映了隨機(jī)誤差和系統(tǒng)誤差的大小如果原假設(shè)成立,即H1=H2

=…=Hk為真,則表明沒有系統(tǒng)誤差,組間平方和SSA除以自由度后的均方與組內(nèi)平方和SSE和除以自由度后的均方差異就不會太大;如果組間均方顯著地大于組內(nèi)均方,說明各水平(總體)之間的差異不僅有隨機(jī)誤差,還有系統(tǒng)誤差判斷因素的水平是否對其觀察值有影響,實(shí)際上就是比較組間方差與組內(nèi)方差之間差異的大小為檢驗(yàn)這種差異,需要構(gòu)造一個用于檢驗(yàn)的統(tǒng)計量第46頁,共101頁,2024年2月25日,星期天4、計算統(tǒng)計量

(1)計算均方

MS)各離差平方和的大小與觀察值的多少有關(guān),為了消除觀察值多少對離差平方和大小的影響,需要將其平均,這就是均方,也稱為方差計算方法是用離差平方和除以相應(yīng)的自由度三個平方和的自由度分別是SST的自由度為n-1,其中n為全部觀察值的個數(shù)SSA的自由度為k-1,其中k為因素水平(總體)的個數(shù)SSE的自由度為n-k第47頁,共101頁,2024年2月25日,星期天組間方差:SSA的均方,記為MSA,計算公式為

組內(nèi)方差:SSE的均方,記為MSE,計算公式為第48頁,共101頁,2024年2月25日,星期天(2)計算檢驗(yàn)的統(tǒng)計量

F

將MSA和MSE進(jìn)行對比,即得到所需要的檢驗(yàn)統(tǒng)計量F

當(dāng)H0為真時,二者的比值服從分子自由度為k-1、分母自由度為n-k的F分布,即第49頁,共101頁,2024年2月25日,星期天構(gòu)造檢驗(yàn)的統(tǒng)計量

(F分布與拒絕域)如果均值相等,F(xiàn)=MSA/MSE1a

F分布F

(k-1,n-k)0拒絕H0不能拒絕H0F第50頁,共101頁,2024年2月25日,星期天(三)統(tǒng)計決策

將統(tǒng)計量的值F與給定的顯著性水平

的臨界值F

進(jìn)行比較,作出接受或拒絕原假設(shè)H0的決策根據(jù)給定的顯著性水平

,在F分布表中查找與第一自由度df1=k-1、第二自由度df2=n-k相應(yīng)的臨界值F

若F>F

,則拒絕原假設(shè)H0

,表明均值之間的差異是顯著的,所檢驗(yàn)的因素(A)對觀察值有顯著影響若F

F

,則不能拒絕原假設(shè)H0

,表明所檢驗(yàn)的因素(A)對觀察值沒有顯著影響第51頁,共101頁,2024年2月25日,星期天單因素方差分析表

(基本結(jié)構(gòu))MSE第52頁,共101頁,2024年2月25日,星期天單因素方差分析

(例10.1題方差分析結(jié)果)第53頁,共101頁,2024年2月25日,星期天單因素方差分析

(一個例子)【例】為了對幾個行業(yè)的服務(wù)質(zhì)量進(jìn)行評價,消費(fèi)者協(xié)會在零售業(yè)、旅游業(yè)、航空公司、家電制造業(yè)分別抽取了不同的樣本,其中零售業(yè)抽取7家,旅游業(yè)抽取了6家,航空公司抽取5家、家電制造業(yè)抽取了5家,然后記錄了一年中消費(fèi)者對總共23家服務(wù)企業(yè)投訴的次數(shù),結(jié)果如表9.7。試分析這四個行業(yè)的服務(wù)質(zhì)量是否有顯著差異?(

=0.05)第54頁,共101頁,2024年2月25日,星期天單因素方差分析

(一個例子)第55頁,共101頁,2024年2月25日,星期天單因素方差分析

(計算結(jié)果)解:設(shè)四個行業(yè)被投訴次數(shù)的均值分別為,m1、m2

、m3、m4

,則需要檢驗(yàn)如下假設(shè)

H0:m1=m2=m3=m4(四個行業(yè)的服務(wù)質(zhì)量無顯著差異)H1:m1

,m2

,m3,m4不全相等(有顯著差異)Excel輸出的結(jié)果如下

結(jié)論:拒絕H0。四個行業(yè)的服務(wù)質(zhì)量有顯著差異第56頁,共101頁,2024年2月25日,星期天三、關(guān)系強(qiáng)度的測量第57頁,共101頁,2024年2月25日,星期天關(guān)系強(qiáng)度的測量

拒絕原假設(shè)表明因素(自變量)與觀測值之間有關(guān)系組間平方和(SSA)度量了自變量(行業(yè))對因變量(投訴次數(shù))的影響效應(yīng)只要組間平方和SSA不等于0,就表明兩個變量之間有關(guān)系(只是是否顯著的問題)當(dāng)組間平方和比組內(nèi)平方和(SSE)大,而且大到一定程度時,就意味著兩個變量之間的關(guān)系顯著,大得越多,表明它們之間的關(guān)系就越強(qiáng)。反之,就意味著兩個變量之間的關(guān)系不顯著,小得越多,表明它們之間的關(guān)系就越弱第58頁,共101頁,2024年2月25日,星期天關(guān)系強(qiáng)度的測量

變量間關(guān)系的強(qiáng)度用自變量平方和(SSA)及殘差平方和(SSE)占總平方和(SST)的比例大小來反映自變量平方和占總平方和的比例記為R2,即其平方根R就可以用來測量兩個變量之間的關(guān)系強(qiáng)度

第59頁,共101頁,2024年2月25日,星期天關(guān)系強(qiáng)度的測量

(例題分析)

R=0.591404結(jié)論:行業(yè)(自變量)對投訴次數(shù)(因變量)的影響效應(yīng)占總效應(yīng)的34.9759%,而殘差效應(yīng)則占65.0241%。即行業(yè)對投訴次數(shù)差異解釋的比例達(dá)到近35%,而其他因素(殘差變量)所解釋的比例近為65%以上

R=0.591404,表明行業(yè)與投訴次數(shù)之間有中等以上的關(guān)系

第60頁,共101頁,2024年2月25日,星期天四、方差分析中的多重比較第61頁,共101頁,2024年2月25日,星期天方差分析中的多重比較

(作用)多重比較是通過對總體均值之間的配對比較來進(jìn)一步檢驗(yàn)到底哪些均值之間存在差異多重比較方法有多種,這里介紹Fisher提出的最小顯著差異方法,簡寫為LSD,該方法可用于判斷到底哪些均值之間有差異

LSD方法是對檢驗(yàn)兩個總體均值是否相等的t檢驗(yàn)方法的總體方差估計加以修正(用MSE來代替)而得到的第62頁,共101頁,2024年2月25日,星期天方差分析中的多重比較

(步驟)提出假設(shè)H0:mi=mj

(第i個總體的均值等于第j個總體的均值)H1:mi

mj

(第i個總體的均值不等于第j個總體的均值)檢驗(yàn)的統(tǒng)計量為若|t|

t

,拒絕H0;若|t|<t

,不能拒絕H0第63頁,共101頁,2024年2月25日,星期天方差分析中的多重比較

(基于統(tǒng)計量

xi-

xj的LSD方法)通過判斷樣本均值之差的大小來檢驗(yàn)H0檢驗(yàn)的統(tǒng)計量為:

xi–

xj檢驗(yàn)的步驟為

提出假設(shè)H0:mi=mj(第i個總體的均值等于第j個總體的均值)H1:mi

mj(第i個總體的均值不等于第j個總體的均值)計算LSD若|

xi-

xj|

LSD,拒絕H0,若|

xi-

xj|<LSD

,不能拒絕H0第64頁,共101頁,2024年2月25日,星期天方差分析中的多重比較

(實(shí)例)根據(jù)前面的計算結(jié)果:

x1=27.3;

x2=29.5;

x3=26.4;

x4=31.4提出假設(shè)H0:mi=mj

;H1:mi

mj計算LSD第65頁,共101頁,2024年2月25日,星期天方差分析中的多重比較

(實(shí)例)|

x1-

x2|=|27.3-29.5|=2.2>2.096

顏色1與顏色2的銷售量有顯著差異|

x1-

x3|=|27.3-26.4|=0.9<2.096

顏色1與顏色3的銷售量沒有顯著差異|

x1-

x4|=|27.3-31.4|=4.1>2.096

顏色1與顏色4的銷售量有顯著差異|

x2-

x3|=|29.5-26.4|=3.1>2.096

顏色2與顏色3的銷售量有顯著差異|

x2-

x4|=|29.5-31.4|=1.9<2.096

顏色2與顏色4的銷售量沒有顯著差異|

x3-

x4|=|26.4-31.4|=5>2.096

顏色3與顏色4的銷售量有顯著差異第66頁,共101頁,2024年2月25日,星期天五、用Excel進(jìn)行方差分析第67頁,共101頁,2024年2月25日,星期天用Excel進(jìn)行方差分析

(Excel檢驗(yàn)步驟)第1步:選擇“工具”下拉菜單第2步:選擇“數(shù)據(jù)分析

”選項(xiàng)第3步:在分析工具中選擇“單因素方差分析

,然后選擇“確定

”第4步:當(dāng)對話框出現(xiàn)時

在“輸入?yún)^(qū)域

”方框內(nèi)鍵入數(shù)據(jù)單元格區(qū)域在

方框內(nèi)鍵入0.05(可根據(jù)需要確定)在“輸出選項(xiàng)

”中選擇輸出區(qū)域

用Excel進(jìn)行方差分析第68頁,共101頁,2024年2月25日,星期天第三節(jié)雙因素方差分析一.雙因素方差分析的基本問題二.雙因素方差分析的數(shù)據(jù)結(jié)構(gòu)雙因素方差分析的步驟一個應(yīng)用實(shí)例第69頁,共101頁,2024年2月25日,星期天雙因素方差分析的基本問題第70頁,共101頁,2024年2月25日,星期天雙因素方差分析

(概念要點(diǎn))分析兩個因素(因素A和因素B)對試驗(yàn)結(jié)果的影響

分別對兩個因素進(jìn)行檢驗(yàn),分析是一個因素在起作用,還是兩個因素都起作用,還是兩個因素都不起作用如果A和B對試驗(yàn)結(jié)果的影響是相互獨(dú)立的,分別判斷因素A和因素B對試驗(yàn)指標(biāo)的影響,這時的雙因素方差分析稱為無交互作用的雙因素方差分析如果除了A和B對試驗(yàn)結(jié)果的單獨(dú)影響外,因素A和因素B的搭配還會對銷售量產(chǎn)生一種新的影響,這時的雙因素方差分析稱為有交互作用的雙因素方差分析

對于無交互作用的雙因素方差分析,其結(jié)果與對每個因素分別進(jìn)行單因素方差分析的結(jié)果相同第71頁,共101頁,2024年2月25日,星期天雙因素方差分析的基本假定每個總體都服從正態(tài)分布對于因素的每一個水平,其觀察值是來自正態(tài)分布總體的簡單隨機(jī)樣本各個總體的方差必須相同對于各組觀察數(shù)據(jù),是從具有相同方差的總體中抽取的觀察值是獨(dú)立的第72頁,共101頁,2024年2月25日,星期天雙因素方差分析的數(shù)據(jù)結(jié)構(gòu)

第73頁,共101頁,2024年2月25日,星期天雙因素方差分析的數(shù)據(jù)結(jié)構(gòu)

是因素A的第i個水平下各觀察值的平均值

是因素B的第j個水平下的各觀察值的均值

是全部kr個樣本數(shù)據(jù)的總平均值第74頁,共101頁,2024年2月25日,星期天雙因素方差分析的步驟第75頁,共101頁,2024年2月25日,星期天提出假設(shè)對因素A提出的假設(shè)為H0:m1=m2=…=mi=…=mk(mi為第i個水平的均值)H1:mi

(i=1,2,…,k)

不全相等對因素B提出的假設(shè)為H0:m1=m2=…=mj=…=mr(mj為第j個水平的均值)H1:mj

(j=1,2,…,r)

不全相等第76頁,共101頁,2024年2月25日,星期天構(gòu)造檢驗(yàn)的統(tǒng)計量為檢驗(yàn)H0是否成立,需確定檢驗(yàn)的統(tǒng)計量

構(gòu)造統(tǒng)計量需要計算總離差平方和水平項(xiàng)平方和誤差項(xiàng)平方和均方

第77頁,共101頁,2024年2月25日,星期天構(gòu)造檢驗(yàn)的統(tǒng)計量

(計算總離差平方和

SST)全部觀察值與總平均值的離差平方和反映全部觀察值的離散狀況計算公式為第78頁,共101頁,2024年2月25日,星期天構(gòu)造檢驗(yàn)的統(tǒng)計量

(計算SSA、SSB和SSE)因素A的離差平方和SSA因素B的離差平方和SSB誤差項(xiàng)平方和SSE第79頁,共101頁,2024年2月25日,星期天構(gòu)造檢驗(yàn)的統(tǒng)計量

(各平方和的關(guān)系)

總離差平方和(SST)、水平項(xiàng)離差平方和(SSA和SSB)、誤差項(xiàng)離差平方和(SSE)之間的關(guān)系SST=SSA+SSB+SSE

第80頁,共101頁,2024年2月25日,星期天構(gòu)造檢驗(yàn)的統(tǒng)計量

(計算均方

MS)各離差平方和的大小與觀察值的多少有關(guān),為消除觀察值多少對離差平方和大小的影響,需要將其平均,這就是均方,也稱為方差計算方法是用離差平方和除以相應(yīng)的自由度三個平方和的自由度分別是總離差平方和SST的自由度為kr-1因素A的離差平方和SSA的自由度為k-1因素B的離差平方和SSB的自由度為r-1隨機(jī)誤差平方和SSE的自由度為(k-1)×(r-1)

第81頁,共101頁,2024年2月25日,星期天構(gòu)造檢驗(yàn)的統(tǒng)計量

(計算均方

MS)因素A的均方,記為MSA,計算公式為因素B的均方,記為MSB

,計算公式為隨機(jī)誤差項(xiàng)的均方,記為MSE

,計算公式為第82頁,共101頁,2024年2月25日,星期天構(gòu)造檢驗(yàn)的統(tǒng)計量

(計算檢驗(yàn)的統(tǒng)計量

F)為檢驗(yàn)因素A的影響是否顯著,采用下面的統(tǒng)計量為檢驗(yàn)因素B的影響是否顯著,采用下面的統(tǒng)計量第83頁,共101頁,2024年2月25日,星期天統(tǒng)計決策

將統(tǒng)計量的值F與給定的顯著性水平

的臨界值F

進(jìn)行比較,作出接受或拒絕原假設(shè)H0的決策根據(jù)給定的顯著性水平

在F分布表中查找相應(yīng)的臨界值F

若FA

F

,則拒絕原假設(shè)H0

,表明均值之間的差異是顯著的,即所檢驗(yàn)的因素(A)對觀察值有顯著影響若FB

F

,則拒絕原假設(shè)H0

,表明均值之間有顯著差異,即所檢驗(yàn)的因素(B)對觀察值有顯著影響第84頁,共101頁,2024年2月25日,星期天雙因素方差分析表

(基本結(jié)構(gòu))第85頁,共101頁,2024年2月25日,星期天雙因素方差分析

(一個例子)【例】有四個品牌的彩電在五個地區(qū)銷售,為分析彩電的品牌(因素A)和銷售地區(qū)(因素B)對銷售量是否有影響,對每個品牌在各地區(qū)的銷售量取得以下數(shù)據(jù),見下表。試分析品牌和銷售地區(qū)對彩電的銷售量是否有顯著影響?第86頁,共101頁,2024年2月25日,星期天雙因素方差分析

(提出假設(shè))對因素A提出的假設(shè)為H0:m1=m2=m3=m4

(品牌對銷售量沒有影響)H1:mi

(i=1,2,…,4)

不全相等

(品牌對銷售量有影響)對因素B提出的假設(shè)為H0:m1=m2=m3=m4=m5

(地區(qū)對銷售量沒有影響)H1:mj

(j=1,2,…,5)

不全相等

(地區(qū)對銷售量有影響)第87頁,共101頁,2024年2月25日,星期天雙因素方差分析

(Excel輸出的結(jié)果)

結(jié)論:

FA=18.10777>F

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負(fù)責(zé)。
  • 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時也不承擔(dān)用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

評論

0/150

提交評論