實用統(tǒng)計學-8.方差分析_第1頁
實用統(tǒng)計學-8.方差分析_第2頁
實用統(tǒng)計學-8.方差分析_第3頁
實用統(tǒng)計學-8.方差分析_第4頁
實用統(tǒng)計學-8.方差分析_第5頁
已閱讀5頁,還剩54頁未讀, 繼續(xù)免費閱讀

下載本文檔

版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進行舉報或認領

文檔簡介

第八章方差分析(ANOVA)AnalysisofVariance

在參數(shù)假設檢驗中,我們經(jīng)常檢驗兩個總體分布的均值是否相同,其中運用的統(tǒng)計量主要是t統(tǒng)計量。如果有多個總體,則必須進行兩兩比較檢驗,顯然很繁瑣。而方差分析,可以一次完成對多個總體的均值是否相同的檢驗:

H0:1=2=3=...=sOne-FactorAnalysisofVariance

單因子方差分析如:s組人員的工資水平、s種同功能藥品的效果、s種訓練方法的訓練效果、等問題,有無顯著性差異。假設條件:樣本是隨機并獨立地抽取 (這個條件一定要滿足)所有總體都服從正態(tài)分布所有總體的方差都相等

單因素方差分析是對多套實驗方案的效果的對比分析,可以用來檢驗多組相關樣本之間均值有無顯著性差異。多個獨立樣本均值的比較--單因素方差分析1、資料類型

注意,s個樣本中含量不必相等?。。》桨?x11x12……方案2x21x22……方案3x31x32……………………方案sxs1xs2……單因素方差分析的假設檢驗H0:1=2=3=...=s=所有總體的均值都相等

各組均值之間沒有差異H1:1,2,3,…,s不全相等至少有兩個不相等 (其它可能相同!)不意味著有:

1

2

...

sOne-FactorANOVA:

H0:1=2=3=...=cH1:notallthekareequalTheNullHypothesisisTrue請注意其含義OneFactorANOVA:

H0:

1

=

2

=

3

=...=cH1:notallthekareequalTheNullHypothesisisNOTTrueTotalVariation總變異Xij=theithobservationingroupini=thenumberofobservationsingroupin=thetotalnumberofobservationsinallgroups

s=thenumberofgroups2、總變異的分解……方差分析的關鍵?。?!Among-GroupVariation組間變異ni

=thenumberofobservationsingroupis=thenumberofgroups

thesamplemeanofgroup

i

theoverallorgrandmeanijVariationDuetoDifferencesAmongGroups.XiX___Within-GroupVariation

組內(nèi)變異

thejthobservationingroupi

thesamplemeanofgroupi

iSummingthevariationwithineachgroupandthenaddingoverallgroups.Within-GroupVariation

iIfmorethan2groups,useFTest.For2groups,uset-Test.FTestmorelimited.One-WayANOVASummaryTable

單因子方差分析表SourceofVariationDegreesofFreedomSumofSquaresMeanSquare(Variance)Among(Factor)s-1SSAMSA=SSA/(s-1)

MSAMSWWithin(Error)n-sSSWMSW=SSW/(n-S)Totaln-1SST=SSA+SSWFTestStatistic=根據(jù)觀測值,計算出f值,若f>f(s-1,n-s)(顯著性水平為),則表明SSb較大,Xi–Xtotal的平方和較大,對應的總體參數(shù)是i-的絕對值較大,所以拒絕H0

,即至少有兩個方案之間的平均效果(均值)差異足夠大,方案之內(nèi)的差異相對小.反之,就接受H0,即不同方案的效果沒有顯著性差異.注:

用SPSS做方差分析中,輸出的結(jié)果是:統(tǒng)計值f右側(cè)的概率,其與給定顯著性水平進行比較.

如:查F表得:f,當ff,在SPPS的結(jié)果中是輸出f值右側(cè)概率p.ffpOne-FactorANOVAFTestExampleAsproductionmanager,youwanttoseeif3fillingmachineshavedifferentmeanfillingtimes.Youassign15similarlytrained&experiencedworkers,5permachine,tothemachines.Atthe0.05level,isthereadifferenceinmeanfillingtimes?

Machine1

Machine2

Machine3

25.40 23.40 20.00

26.31 21.80 22.20

24.10 23.50 19.75

23.74 22.75 20.60

25.10 21.60 20.40One-FactorANOVAExample:ScatterDiagram

272625242322212019X

XxxX=24.93

X=22.61

X=20.59X=22.71TimeinSeconds

Machine1

Machine2

Machine3

25.40 23.40 20.00

26.31 21.80 22.20

24.10 23.50 19.75

23.74 22.75 20.60

25.10 21.60 20.40__________One-FactorANOVAExampleComputationsX1=24.93X2=22.61X3=20.59X=22.71SSA=5[(24.93-22.71)2+(22.61-22.71)2+(20.59-22.71)2]=47.164SSW=4.2592+3.112+3.682=11.0532MSA=SSA/(s-1)=47.16/2=23.5820MSW=SSW/(n-s)=11.0532/12=0.9211

nj=5s=3n=15

Machine1

Machine2

Machine3

25.40 23.40 20.00

26.31 21.80 22.20

24.10 23.50 19.75

23.74 22.75 20.60

25.10 21.60 20.40_____SummaryTableSourceofVariationDegreesofFreedomSumofSquaresMeanSquare(Variance)F==25.60

Among(Machines)3-1=247.164023.5820Within(Error)15-3=1211.0532.9211Total15-1=1458.2172MSAMSWF03.89One-FactorANOVA

Example

SolutionH0:1=2=3H1:NotAllEqual=.05df1=2,df2=12CriticalValue(s):TestStatistic:Decision:Conclusion:Rejectat=0.05Thereisevidencethatatleastoneidiffersfromtherest.=0.05FMSAMSW2358209211256...2、[實例分析]

三組銷售不同包裝飲料商品的日均銷售量瓶裝組罐裝組袋裝(老包裝)757460707864667265696855716358問題:三種包裝的日平均銷售量是否有顯著差異?方差分析結(jié)果(=0.05)

ANOVAforSALESSdfMeanSquare F Sig.

Between420.367 2 210.183 14.661.001 Within172.033 12 14.336Total 592.400 14

結(jié)論:P=0.001<0.05,可以認為不同包裝下的飲料平均銷售量整體上表現(xiàn)出統(tǒng)計學意義上的差異。(注意,要想知道是哪兩種包裝之間有差異,尚須做兩量兩比較)舉例:一家銷售復印機的跨國公司采用了三種不同的方法來對新招收的市場營銷人員進行培訓,以便使他們盡快適應工作。在培訓結(jié)束時,培訓主管從這些接受過三種不同培訓方法的人當中隨機抽取了16名受訓人員,以研究不同培訓方法產(chǎn)生的效果。由于銷售額可以作為顯示培訓結(jié)果的一個重要指標,因此他收集了這16名受訓人員的季度銷售額并將結(jié)果匯總?cè)缦拢寒旓@著水平為0.05時,請根據(jù)記錄下來的季度銷售額確定:三種培訓方法是否會產(chǎn)生明顯不同的效果。H0

:三種培訓方法會產(chǎn)生相同的效果HA:至少有一種培訓方法產(chǎn)生的效果與另外兩種方法不同解:總平均值

:組間方差:組內(nèi)方差:0

臨界值,3.81F檢驗統(tǒng)計量,1.754臨界區(qū)域,0.05F檢驗統(tǒng)計量1=31=2,2=163=13F,1,2=F0.05,2,13=3.81檢驗統(tǒng)計量落在臨界區(qū)域之外(1.754<3.81) 接受H0數(shù)據(jù)顯示:當顯著水平為0.05時,三種培訓方法不會產(chǎn)生明顯不同的效果SPSS為我們提供了方便

--

閱讀并解釋輸出結(jié)果定義數(shù)據(jù)–變量圖有兩個變量有待定義–方法和銷售額SPSS為我們提供了方便

--

閱讀并解釋輸出結(jié)果輸入數(shù)據(jù)–數(shù)據(jù)圖有2欄、16排數(shù)據(jù)需要輸入SPSS為我們提供了方便

--

閱讀并解釋輸出結(jié)果進行分析–菜單條1.在菜單條中單擊分析比較均值單向方差分析…2.將銷售額放置到因變量表中,并將方法放置到因子中單擊選項…并檢查描述

方差的同質(zhì)性單擊繼續(xù)3.單擊OKSPSS為我們提供了方便

--

閱讀并解釋輸出結(jié)果

SPSS輸出結(jié)果–從輸出結(jié)果得到,F檢驗統(tǒng)計量=1.754p–值=0.667由于 p–值>(=0.05) 接受H0SPSS為我們提供了方便

--

閱讀并解釋輸出結(jié)果S2BS2W檢驗統(tǒng)計量p–值匯總后的標準差=3.716無重復實驗的雙因素方差分析問題:例如:對運動員進行訓練的效果,不僅與訓練方法有關,而且與運動員本身的特質(zhì)有關.我們選出了n組運動員,每個組的運動員都具有同樣的體質(zhì)特征,每組有s個運動員,用s種不同方法進行訓練.我們會得到sn個不同的訓練效果,怎樣判斷不同訓練方法的效果是否有顯著效果?將其概括為數(shù)學問題,如表:無重復,雙因素方差分析的已知條件因素A1因素A2因素As……因素B1因素B2因素Bn……x11x12x1n…..x21x22x2n…………xs1xs2xsn……問:因素A的不同水平(方案)的效果(均值),有無顯著不同?因素B的不同水平(方案)的效果(均值),有無顯著不同?

不同激勵方法的效果與被激勵者的素質(zhì)(文化環(huán)境,傳統(tǒng)觀念,等等)有關,是雙因素方差分析問題;不同藥品的治療效果,與病人的體質(zhì)有關,是雙因素方差分析問題;不同營銷方案的效果與產(chǎn)品的質(zhì)量有關等,是雙因素方差分析問題;等等.

除了上述訓練方法和運動員的特質(zhì)問題外,在實踐中常遇到的雙因素方差分析問題有:Two-WayANOVAAssumptions

雙因素方差分析的假設Normality(正態(tài)性假設)PopulationsarenormallydistributedHomogeneityofVariance(方差齊性假設)PopulationshaveequalvariancesIndependenceofErrors(獨立抽樣假設)Independentrandomsamplesaredrawn分析:

假設在Ai與Bj下的總體Xij服從N(ij,2)分布,(假設sn個總體分布的方差都相同)設:稱為總體Xij的總平均.稱為第j列總體的平均.稱為第i行總體

的平均.把“第i行的平均i·與總平均

之差”ai=i·-

,其中,i=1,2…,s稱為Ai的主效應.把“第j列的平均

·j與總平均

之差”

bj=

·j-

,其中,j=1,2…,n稱為Bj的主效應.如果Ai與Bj間不存在交互效應,就有

ij=+ai+

bj,其中,i=1,2…,s,j=1,2…,n也就是說,隨機樣本Xij的均值ij,是由“總平均”,“Ai的主效應ai”,“Bj的主效應bj”組成.隨機樣本Xij,可視為其總體均值ij與隨機誤差ij之和:式中,ij

服從N(0,2)分布,并且ij

之間相互獨立.于是有:

Xij=+ai+

bj+ij,其中,i=1,2…,s,j=1,2…,n稱為“無交互影響的雙因素(一元)模型”處理過程:1.假設零假設H0A

:i·=

,即ai=0,i=1,2…,sH0B

:

·j=

,即bj=0,j=1,2…,n備擇假設H1A

:1·,2·

,…,s·之間不完全相同,或ai不全等于0H1B

:

·1,

·2

,…,

·n之間不完全相同,或bj不全等于0式中:可以證明:在“無交互影響的雙因素模型”下,有以下結(jié)論:SA,SB,SE

相互獨立,且ST=SA+SB+SESE/2

服從2((s-1)(n-1))分布當H0A成立時,有SA/2服從2(s-1)分布當H0B成立時,有SB/2服從2(n-1)分布2

計算按下面公式,計算出SA,SB,SE所對應的值sA,sB,sE,進而算出與FA,FB對應的值fA,fB.定義統(tǒng)計量:總變差:行間變差:列間變差:總誤差平方和:(5)當H0A成立時,有服從F((s-1),(s-1)(n-1))分布(6)當H0B成立時,有服從F((n-1),(s-1)(n-1))分布3對給定的顯著性水平為,查表f((s-1),(s-1)(n-1)),若fA>f((s-1),(s-1)(n-1)),表明SA較大,則拒絕H0A,即至少A因素中有兩個水平之間的平均效果(均值),差異足夠大.反之,接受H0A,即A因素的不同水平的效果(均值)沒有顯著性差異.同理,對給定的顯著性水平為,查表f((n-1),(s-1)(n-1)),若fB>f((n-1),(s-1)(n-1)),表明SB較大,則拒絕H0B,即至少B因素中有兩個水平之間的平均效果(均值),差異足夠大.反之,接受H0B,即B因素的不同水平的效果(均值)沒有顯著性差異.2、變異分解及假設檢驗例:某公司對某產(chǎn)品設計了4種類型的產(chǎn)品包裝(用A,B,C表示),又設計了3種銷售方案,在某地區(qū)用3種銷售方案,對4種包裝的該產(chǎn)品試銷一個月,業(yè)績?nèi)绫硭尽,F(xiàn)在想知道:不同包裝、不同銷售方案,對銷售業(yè)績的影響是否有顯著差異。不同銷售方案對不同包裝的產(chǎn)品的銷售業(yè)績不同銷售方案包裝類型ABCD甲乙丙1031061358210211871100106526685這是一個典型的無重復實驗的雙因素方差分析問題。其模型是:

Xij=+ai+

bj+ij,其中,i=1,2…,s,j=1,2…,n注意:在SPSS中,數(shù)據(jù)按如下方式表達。

SPSS中數(shù)據(jù)存放方式包裝類型銷售方案銷售業(yè)績A甲103A乙106A丙135B甲85B乙102B丙118C甲71C乙100包裝類型銷售方案銷售業(yè)績C丙106D甲52D乙66D丙85用SPSS后的輸出結(jié)果為:CorrectedModel5815.66751163.13332.919.000Intercept105656.3331105656.3332990.274.000包裝類型3503.00031167.66733.047.000銷售方案2312.66721156.33332.726.001Error212.000635.333Total111684.00012CorrectedTotal6027.66711SourceSunofSquaresdfMeanSquareFSig.說明:Intercept:截距,相當于包裝類型:包裝類型的變差sA銷售方案:銷售方案的變差sB

Rrror:誤差(殘差)項的變差sE,相當于ij的平方和給定顯著性水平=0.05,從上表結(jié)果可知,其p值均小于0.05,所以在兩個因素的不同水平的不同組合下,至少有的效果之間,有顯著性差異.重復實驗的雙因素方差分析問題提出:仍以下面問題為例:對運動員進行訓練的效果問題。兩個因素,仍然是A:訓練方法s種,B:運動員本身的特質(zhì)n種,同樣體質(zhì)的運動員分在同一組,即有n組運動員。為了便于比較,每組安排st個具有同樣體質(zhì)的運動員,也就是說,每種訓練方法在每個組內(nèi),對t個運動員進行訓練。我們就會得到snt個不同的訓練效果值。怎樣判斷不同的訓練方法的效果是否有顯著效益?不同特質(zhì)對訓練效果是否有顯著影響?有重復,雙因素方差分析的已知條件問:因素A的不同水平(方案)的效果(均值),有無顯著不同?因素B的不同水平(方案)的效果(均值),有無顯著不同?因素A與B之間的交互作用如何?因素A1因素A2因素As……因素B1因素B2因素Bn……X111,X112,···,X11t

…..………………X121,X122,···,X12t

X1n1,X1n2,···,X1nt

X211,X212,···,X21t

X221,X222,···,X22t

X2n1,X2n2,···,X2nt

Xs11,Xs12,···,Xs1t

Xs21,Xs22,···,Xs2t

Xsn1,Xsn2,···,Xsnt

理論假設與分析:假設在Ai與Bj下的總體Xij服從N(ij,2)分布,(假設sn個總體分布的方差都相同,但均值可能不同),與上節(jié)相同,設:稱為總體Xij的總平均.稱為第j列總體的平均.稱為第i行總體

的平均.把“第i行的平均i·與總平均

之差”ai=i·-

,其中,i=1,2…,s稱為Ai的主效應.把“第j列的平均

·j與總平均

之差”bj=

·j-

,其中,j=1,2…,n稱為Bj的主效應.如果Ai與Bj間存在交互效應,就有cij

=ij-

ai-

bj-=ij-i·-

·j+稱為Ai與Bj的交互效應.于是,有ij

=+ai+

bj+cij,其中,i=1,2…,s,j=1,2…,n也就是說,隨機樣本Xij的均值ij,是由“總平均”,“Ai的主效應ai”,“Bj的主效應bj”,“Ai與Bj的交互效應cij”組成.式中,ijk服從N(0,2)分布,并且ijk之間相互獨立.于是,從重復抽樣的角度看,隨機樣本Xijk,可以視為其總體均值ij與隨機誤差ijk之和:

Xijk=+ai+

bj+cij+ijk

,其中,i=1,2…,s,j=1,2…,nk=1,2…,t,t是實驗次數(shù).稱為“有交互影響的雙因素(一元)模型”.處理過程:假設零假設:

H0A

:i·=

,即ai=0,i=1,2…,sH0B

:

·j=

,即bj=0,j=1,2…,nH0C

:

cij

=

ij-

ai-

bj-=0,i=1,2…,s,j=1,2…,n

備擇假設:

H1A

:1·,2·

,…,s·之間不完全相同,或ai

不全等于0

H1B

:

·1,

·2

,…,

·n之間不完全相同,或bj

不全等于0H1C

:

cij

=ij-

ai

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預覽,若沒有圖紙預覽就沒有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負責。
  • 6. 下載文件中如有侵權(quán)或不適當內(nèi)容,請與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

評論

0/150

提交評論