




版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進(jìn)行舉報(bào)或認(rèn)領(lǐng)
文檔簡介
第10章方差分析PowerPoint統(tǒng)計(jì)學(xué)10.1方差分析引論10.2單因素方差分析10.3雙因素方差分析第10章方差分析學(xué)習(xí)目標(biāo)解釋方差分析的概念解釋方差分析的基本思想和原理掌握單因素方差分析的方法及應(yīng)用理解多重比較的意義掌握雙因素方差分析的方法及應(yīng)用10.1方差分析引論10.1.1方差分析及其有關(guān)術(shù)語10.1.2方差分析的基本思想和原理10.1.3方差分析的基本假定10.1.4問題的一般提法方差分析及其有關(guān)術(shù)語什么是方差分析(ANOVA)?
(analysisofvariance)檢驗(yàn)多個(gè)總體均值是否相等通過分析數(shù)據(jù)的誤差判斷各總體均值是否相等實(shí)質(zhì)是研究分類型自變量對數(shù)值型因變量的影響一個(gè)或多個(gè)分類型自變量一個(gè)數(shù)值型因變量有單因素方差分析和雙因素方差分析單因素方差分析:涉及一個(gè)分類的自變量雙因素方差分析:涉及兩個(gè)分類的自變量什么是方差分析?
(例題分析)消費(fèi)者對四個(gè)行業(yè)的投訴次數(shù)行業(yè)觀測值零售業(yè)旅游業(yè)航空公司家電制造業(yè)12345675766494034534468392945565131492134404451657758【例10.1】為了對幾個(gè)行業(yè)的服務(wù)質(zhì)量進(jìn)行評價(jià),消費(fèi)者協(xié)會(huì)在4個(gè)行業(yè)分別抽取了不同的企業(yè)作為樣本。最近一年中消費(fèi)者對總共23家企業(yè)投訴的次數(shù)如下表什么是方差分析?
(例題分析)分析4個(gè)行業(yè)之間的服務(wù)質(zhì)量是否有顯著差異,也就是要判斷“行業(yè)”對“投訴次數(shù)”是否有顯著影響(分類變量“行業(yè)”對數(shù)值型變量“投訴次數(shù)”是否有影響)作出這種判斷最終被歸結(jié)為檢驗(yàn)這四個(gè)行業(yè)被投訴次數(shù)的均值是否相等(多個(gè)總體的均值是否相等)若它們的均值相等,則意味著“行業(yè)”對投訴次數(shù)是沒有影響的,即它們之間的服務(wù)質(zhì)量沒有顯著差異;若均值不全相等,則意味著“行業(yè)”對投訴次數(shù)是有影響的,它們之間的服務(wù)質(zhì)量有顯著差異方差分析中的有關(guān)術(shù)語因素或因子(factor)所要檢驗(yàn)的對象,通常是分類變量分析行業(yè)對投訴次數(shù)的影響,行業(yè)是要檢驗(yàn)的因子水平或處理(treatment)因子的不同表現(xiàn)零售業(yè)、旅游業(yè)、航空公司、家電制造業(yè)觀察值在每個(gè)因素水平下得到的樣本數(shù)據(jù)每個(gè)行業(yè)被投訴的次數(shù)方差分析中的有關(guān)術(shù)語試驗(yàn)這里只涉及一個(gè)因素,因此稱為單因素4水平的試驗(yàn)若設(shè)計(jì)到兩個(gè)因素,則稱為雙因素試驗(yàn)總體因素的每一個(gè)水平可以看作是一個(gè)總體零售業(yè)、旅游業(yè)、航空公司、家電制造業(yè)是4個(gè)總體樣本數(shù)據(jù)被投訴次數(shù)可以看作是從這4個(gè)總體中抽取的樣本數(shù)據(jù)方差分析的基本思想和原理方差分析的基本思想和原理
(例題分析)消費(fèi)者對四個(gè)行業(yè)的投訴次數(shù)行業(yè)觀測值零售業(yè)旅游業(yè)航空公司家電制造業(yè)12345675766494034534468392945565131492134404451657758【例10.1】為了對幾個(gè)行業(yè)的服務(wù)質(zhì)量進(jìn)行評價(jià),消費(fèi)者協(xié)會(huì)在4個(gè)行業(yè)分別抽取了不同的企業(yè)作為樣本。最近一年中消費(fèi)者對總共23家企業(yè)投訴的次數(shù)如下表方差分析的基本思想和原理
(圖形分析—散點(diǎn)圖)
零售業(yè)旅游業(yè)航空公司家電制造從散點(diǎn)圖上可以看出不同行業(yè)被投訴的次數(shù)有明顯差異同一個(gè)行業(yè),不同企業(yè)被投訴的次數(shù)也明顯不同家電制造被投訴的次數(shù)較高,航空公司被投訴的次數(shù)較低行業(yè)與被投訴次數(shù)之間有一定的關(guān)系如果行業(yè)與被投訴次數(shù)之間沒有關(guān)系,那么它們被投訴的次數(shù)的平均值應(yīng)該差不多相同,在散點(diǎn)圖上所呈現(xiàn)的模式也就應(yīng)該很接近,但散點(diǎn)圖的表現(xiàn)卻并非如此。方差分析的基本思想和原理
(圖形分析)散點(diǎn)圖觀察不能提供充分的證據(jù)證明不同行業(yè)被投訴的次數(shù)之間有顯著差異這種差異可能是由于抽樣的隨機(jī)性所造成的需要有更準(zhǔn)確的方法來檢驗(yàn)這種差異是否顯著,也就是進(jìn)行方差分析之所以叫方差分析,因?yàn)殡m然我們感興趣的是均值,但在判斷均值之間是否有差異時(shí)則需要借助于方差這個(gè)名字也表示:它是通過對數(shù)據(jù)誤差來源的分析判斷不同總體的均值是否相等。因此,進(jìn)行方差分析時(shí),需要考察數(shù)據(jù)誤差的來源方差分析的基本思想和原理方差分析的基本思想和原理
(兩類誤差)隨機(jī)誤差因素的同一水平(總體)下,樣本各觀察值之間的差異比如,同一行業(yè)下不同企業(yè)被投訴次數(shù)之間的差異這種差異可以看成是隨機(jī)因素的影響,稱為隨機(jī)誤差
系統(tǒng)誤差因素的不同水平(不同總體)之間觀察值的差異比如,不同行業(yè)之間的被投訴次數(shù)之間的差異這種差異可能是由于抽樣的隨機(jī)性所造成的,也可能是由于行業(yè)本身所造成的,后者所形成的誤差是由系統(tǒng)性因素造成的,稱為系統(tǒng)誤差方差分析的基本思想和原理
(誤差平方和—SS)數(shù)據(jù)的誤差用平方和(sumofsquares)表示組內(nèi)平方和
(誤差平方/殘差平方)記為SSE(SumSquaredError)因素的同一水平下數(shù)據(jù)誤差的平方和,反映了每個(gè)樣本內(nèi)各觀測值的總離散狀況比如,零售業(yè)被投訴次數(shù)的誤差平方和只包含隨機(jī)誤差組間平方和
(因素平方和)記為SSA(SumofSquaresforfactorA)因素的不同水平之間數(shù)據(jù)誤差的平方和,反映了樣本均值之間的差異程度比如,4個(gè)行業(yè)被投訴次數(shù)之間的誤差平方和既包括隨機(jī)誤差,也包括系統(tǒng)誤差方差分析的基本思想和原理
(均方—MS)若不同行業(yè)對投訴次數(shù)沒有影響,則在組間誤差中只包含隨機(jī)誤差,而沒有系統(tǒng)誤差。因此組間誤差的均值和組內(nèi)誤差的均值(又稱均方或均方差,即方差除以其自由度)就很接近,兩者的比值就會(huì)接近1若不同行業(yè)對投訴次數(shù)有影響,則組間誤差中除了隨機(jī)誤差還包含系統(tǒng)誤差,因此組間均方會(huì)大于組內(nèi)均方,它們之間的比值就會(huì)大于1當(dāng)這個(gè)比值大到某種程度時(shí),就可以說不同水平之間存在著顯著差異,即自變量對因變量有影響判斷行業(yè)對投訴次數(shù)是否有顯著影響,也就是檢驗(yàn)被投訴次數(shù)的差異主要是由于什么原因所引起的。如果這種差異主要是系統(tǒng)誤差,說明不同行業(yè)對投訴次數(shù)有顯著影響方差分析的基本假定方差分析的基本假定每個(gè)總體都應(yīng)服從正態(tài)分布對于因素的每一個(gè)水平,其觀察值是來自服從正態(tài)分布總體的簡單隨機(jī)樣本比如,每個(gè)行業(yè)被投訴的次數(shù)必須服從正態(tài)分布各個(gè)總體的方差必須相同各組觀察數(shù)據(jù)是從具有相同方差的總體中抽取的比如,4個(gè)行業(yè)被投訴次數(shù)的方差都相等觀察值是獨(dú)立的比如,每個(gè)行業(yè)被投訴的次數(shù)與其他行業(yè)被投訴的次數(shù)獨(dú)立方差分析中的基本假定在上述假定條件下,判斷行業(yè)對投訴次數(shù)是否有顯著影響,實(shí)際上也就是檢驗(yàn)具有同方差的4個(gè)正態(tài)總體的均值是否相等如果4個(gè)總體的均值相等,可以期望4個(gè)樣本的均值也會(huì)很接近4個(gè)樣本的均值越接近,推斷4個(gè)總體均值相等的證據(jù)也就越充分樣本均值越不同,推斷總體均值不同的證據(jù)就越充分
方差分析中基本假定如果4個(gè)行業(yè)被投訴次數(shù)的均值都相等意味著每個(gè)樣本都來自均值為、方差為2的同一正態(tài)總體
Xf(X)1
2
3
4
方差分析中基本假定若至少有一個(gè)總體的均值是不同的4個(gè)樣本分別來自均值不同的4個(gè)正態(tài)總體
Xf(X)3
1
2
4
問題的一般提法問題的一般提法設(shè)因素有k個(gè)水平,每個(gè)水平的均值分別用1,2,,k
表示要檢驗(yàn)k個(gè)水平(總體)的均值是否相等,需要提出如下假設(shè):H0:
12…k
H1:
1,2,,k
不全相等10.2單因素方差分析10.2.1數(shù)據(jù)結(jié)構(gòu)10.2.2分析步驟10.2.3關(guān)系強(qiáng)度的測量10.2.4方差分析中的多重比較單因素方差分析的數(shù)據(jù)結(jié)構(gòu)
(one-wayanalysisofvariance)
觀察值(j)因素(A)i
水平A1水平A2…水平Ak12::n
x11x21…xk1x12x22…xk2::::::::x1n
x2n
…xkn分析步驟提出假設(shè)構(gòu)造檢驗(yàn)統(tǒng)計(jì)量統(tǒng)計(jì)決策提出假設(shè)一般提法H0
:m1=m2=…=mk
自變量對因變量沒有顯著影響
H1:m1
,m2
,…
,mk不全相等自變量對因變量有顯著影響
注意:拒絕原假設(shè),只表明至少有兩個(gè)總體的均值不相等,并不意味著所有的均值都不相等
構(gòu)造檢驗(yàn)的統(tǒng)計(jì)量構(gòu)造統(tǒng)計(jì)量需要計(jì)算各樣本的均值用于輔助計(jì)算組內(nèi)誤差和組間誤差全部觀察值的總均值用于輔助計(jì)算組間誤差誤差平方和均方(MS)
構(gòu)造檢驗(yàn)的統(tǒng)計(jì)量
(計(jì)算各樣本的均值)假定從第i個(gè)總體中抽取一個(gè)容量為ni的簡單隨機(jī)樣本,第i個(gè)總體的樣本均值為該樣本的全部觀察值總和除以觀察值的個(gè)數(shù)
計(jì)算公式為式中:ni為第i個(gè)總體的樣本觀察值個(gè)數(shù)
xij為第i個(gè)總體的第j個(gè)觀察值
構(gòu)造檢驗(yàn)的統(tǒng)計(jì)量
(計(jì)算全部觀察值的總均值)全部觀測值的總均值=全部觀察值的總和除以觀察值的總個(gè)數(shù)計(jì)算公式為構(gòu)造檢驗(yàn)的統(tǒng)計(jì)量
(例題分析)構(gòu)造檢驗(yàn)的統(tǒng)計(jì)量
(計(jì)算總誤差平方和SST)SST
=全部觀察值與總平均值的離差平方和反映全部觀察值的離散狀況構(gòu)造統(tǒng)計(jì)量時(shí)沒有用到SST其計(jì)算公式為
前例的計(jì)算結(jié)果
SST=(57-47.869565)2+…+(58-47.869565)2=115.9295構(gòu)造檢驗(yàn)的統(tǒng)計(jì)量
(計(jì)算組間平方和SSA)SSA=各組平均值與總平均值的離差平方和(組間誤差)反映各總體的樣本均值之間的差異程度該平方和既包括隨機(jī)誤差,也包括系統(tǒng)誤差計(jì)算公式為
前例的計(jì)算結(jié)果SSA=1456.608696構(gòu)造檢驗(yàn)的統(tǒng)計(jì)量
(計(jì)算組內(nèi)平方和SSE)SSE=每個(gè)組的各樣本數(shù)據(jù)與其組平均值的離差平方和(組內(nèi)誤差)反映每個(gè)樣本各觀察值的離散狀況該平方和反映的是隨機(jī)誤差的大小計(jì)算公式為
前例的計(jì)算結(jié)果SSE=2708構(gòu)造檢驗(yàn)的統(tǒng)計(jì)量
(三個(gè)平方和的關(guān)系)總離差平方和(SST)、誤差項(xiàng)離差平方和(SSE)、水平項(xiàng)離差平方和(SSA)之間的關(guān)系SST=SSA+SSE前例的計(jì)算結(jié)果
4164.608696=1456.608696構(gòu)造檢驗(yàn)的統(tǒng)計(jì)量
(計(jì)算均方MS)各誤差平方和的大小與觀察值的多少有關(guān),為消除觀察值多少對誤差平方和大小的影響,需要將其平均,這就是均方,也稱為方差均方由誤差平方和除以相應(yīng)的自由度求得三個(gè)平方和對應(yīng)的自由度分別是SST的自由度為n-1,其中n為全部觀察值的個(gè)數(shù)SSA的自由度為k-1,其中k為因素水平(總體)的個(gè)數(shù)SSE的自由度為n-k構(gòu)造檢驗(yàn)的統(tǒng)計(jì)量
(計(jì)算均方MS)組間方差:SSA的均方,記為MSA,計(jì)算公式為組內(nèi)方差:SSE的均方,記為MSE,計(jì)算公式為構(gòu)造檢驗(yàn)的統(tǒng)計(jì)量
(計(jì)算檢驗(yàn)統(tǒng)計(jì)量F)當(dāng)H0為真時(shí),MSA和MSE的比值服從分子自由度為k-1、分母自由度為n-k的F分布,即構(gòu)造檢驗(yàn)的統(tǒng)計(jì)量
(F分布與拒絕域)如果均值相等,F(xiàn)=MSA/MSE1a
F分布F(k-1,n-k)0拒絕H0不能拒絕H0F統(tǒng)計(jì)決策
將統(tǒng)計(jì)量的值F與給定的顯著性水平的臨界值F進(jìn)行比較,作出對原假設(shè)H0的決策根據(jù)給定的顯著性水平,在F分布表中查找與第一自由度df1=k-1、第二自由度df2=n-k相應(yīng)的臨界值F
若F>F
,則拒絕原假設(shè)H0
,表明均值之間的差異是顯著的,所檢驗(yàn)的因素對觀察值有顯著影響若F<F
,則不拒絕原假設(shè)H0
,無證據(jù)表明所檢驗(yàn)的因素對觀察值有顯著影響單因素方差分析表
(基本結(jié)構(gòu))誤差來源平方和(SS)自由度(df)均方(MS)F值P值F臨界值組間(因素影響)SSAk-1MSAMSAMSE組內(nèi)(誤差)SSEn-kMSE總和SSTn-1單因素方差分析
(例題分析)用Excel進(jìn)行方差分析
(Excel分析步驟)第1步:選擇“工具”下拉菜單第2步:選擇【數(shù)據(jù)分析】選項(xiàng)第3步:在分析工具中選擇【單因素方差分析】
,然后選擇【確定】第4步:當(dāng)對話框出現(xiàn)時(shí)
在【輸入?yún)^(qū)域】方框內(nèi)鍵入數(shù)據(jù)單元格區(qū)域在【】方框內(nèi)鍵入0.05(可根據(jù)需要確定)
在【輸出選項(xiàng)】中選擇輸出區(qū)域方差分析的目的是判斷:()A.各總體是否存在方差B.各樣本數(shù)據(jù)之間是否有顯著差異C.分類型自變量對數(shù)值型因變量的影響是否顯著D.分類型因變量對數(shù)值型自變量的影響是否顯著
在方差分析中,某一水平下樣本數(shù)據(jù)之間的誤差為:()A.組內(nèi)誤差;B.總誤差和;C.組間誤差;D.組間平方(3)在方差分析中,不同水平下樣本數(shù)據(jù)之間的誤差為:()A.隨機(jī)誤差;B.非隨機(jī)誤差;C.系統(tǒng)誤差;D.隨機(jī)誤差和系統(tǒng)誤差練習(xí)(1)CAD(4)采用單因素方差分析檢驗(yàn)品牌對銷售量的影響,給定=0.05,得到的方差分析表如下,以下說法正確的是:()A.共有3個(gè)品牌B.共抽取了19個(gè)樣本C.p<0.05,品牌對銷售量有顯著影響D.F>F-crit,品牌對銷售量沒有顯著影響
C關(guān)系強(qiáng)度的測量關(guān)系強(qiáng)度的測量
組間平方和(SSA)度量了自變量(行業(yè))對因變量(投訴次數(shù))的影響效應(yīng)只要組間平方和SSA不等于0,就表明兩個(gè)變量之間有關(guān)系(只是是否顯著的問題)當(dāng)組間平方和(SSA)比組內(nèi)平方和(SSE)大,而且大到一定程度時(shí),就意味著兩個(gè)變量之間的關(guān)系顯著,大得越多,表明它們之間的關(guān)系就越強(qiáng)。反之,就意味著兩個(gè)變量之間的關(guān)系不顯著,小得越多,表明它們之間的關(guān)系就越弱關(guān)系強(qiáng)度的測量
可用自變量平方和(SSA)占總平方和(SST)的比例大小來反映變量間關(guān)系的強(qiáng)度將自變量平方和占總平方和的比例記為R2,即其平方根R就可以用來測量兩個(gè)變量之間的關(guān)系強(qiáng)度
(類似于相關(guān)系數(shù))關(guān)系強(qiáng)度的測量
(例題分析)
R=0.591404結(jié)論在投訴次數(shù)的總差異中,行業(yè)(自變量)對投訴次數(shù)(因變量)的影響造成的差異占差異的34.9759%,而同一行業(yè)內(nèi)其他因素引起的差異(殘差效應(yīng))則占65.0241%。即行業(yè)對投訴次數(shù)差異解釋的比例達(dá)到近35%,而其它因素(殘差變量)所解釋的比例近為65%以上
R=0.591404,表明行業(yè)與投訴次數(shù)之間有中等以上的關(guān)系
方差分析中的多重比較
(multiplecomparisonprocedures)概述通過方差分析方法可以得到對多個(gè)均值是否相等的判斷。若判斷出均值不等,如何找出哪些均值不等呢?多重比較的意義通過對總體均值之間的配對比較來進(jìn)一步檢驗(yàn)到底哪些均值之間存在差異可采用Fisher提出的最小顯著差異方法,簡寫為LSD(LeastSignificantDifference)LSD方法是根據(jù)檢驗(yàn)兩個(gè)總體均值是否相等的t檢驗(yàn)方法加以修正(用MSE來代替)而得到的
多重比較的步驟提出假設(shè)H0:mi=mj(第i個(gè)總體的均值等于第j個(gè)總體的均值)H1:mimj(第i個(gè)總體的均值不等于第j個(gè)總體的均值)構(gòu)造檢驗(yàn)的統(tǒng)計(jì)量(類似教材P170頁公式(7.16)),可證明,在原假設(shè)成立的前提下,有:
(該統(tǒng)計(jì)量成立也必須包含每個(gè)水平的總體服從正態(tài)分布、各總體方差相等、觀測值獨(dú)立等前提)故有:若,則拒絕H0;
若,則接受H0多重比較的步驟決策:若|t|>t/2,則拒絕H0;
若|t|<t/2,則不拒絕H0而令(因此,可以先計(jì)算
和LSD,再做決策)多重比較分析
(例題分析)第1步:提出假設(shè)檢驗(yàn)1:檢驗(yàn)2:檢驗(yàn)3:檢驗(yàn)4:檢驗(yàn)5:檢驗(yàn)6:方差分析中的多重比較
(例題分析)第2步:計(jì)算檢驗(yàn)統(tǒng)計(jì)量檢驗(yàn)1:檢驗(yàn)2:檢驗(yàn)3:檢驗(yàn)4:檢驗(yàn)5:檢驗(yàn)6:方差分析中的多重比較
(例題分析)第3步:計(jì)算LSD檢驗(yàn)1:檢驗(yàn)2:檢驗(yàn)3:檢驗(yàn)4:檢驗(yàn)5:檢驗(yàn)6:方差分析中的多重比較
(例題分析)第4步:作出決策不能認(rèn)為零售業(yè)與旅游業(yè)均值之間有顯著差異
不能認(rèn)為零售業(yè)與航空公司均值之間有顯著差異不能認(rèn)為零售業(yè)與家電業(yè)均值之間有顯著差異不能認(rèn)為旅游業(yè)與航空業(yè)均值之間有顯著差異不能認(rèn)為旅游業(yè)與家電業(yè)均值之間有顯著差異航空業(yè)與家電業(yè)均值有顯著差異對變量關(guān)系的強(qiáng)度系數(shù)R2的描述,正確的是:()A.R2越大,表示SSA越小;B.R2越大,表示SSA越??;C.R2越大,表示自變量對因變量的影響越大;D.R2的值可取任意非負(fù)實(shí)數(shù)
對若干個(gè)總體均值方差分析結(jié)果如下表,若已知第一個(gè)總體和第二個(gè)總體的樣本均值數(shù)分別為3和4,樣本均值為50和42,給定=0.05,以下結(jié)論錯(cuò)誤的是:()
A.拒絕三個(gè)總體相等的假設(shè);B.R2=73.99%;C.總共抽取了15個(gè)樣本;D.利用多重檢驗(yàn)應(yīng)接受1=2的假設(shè)練習(xí)(2)CDSSdfMSFP-valueF-crit組間615.62307.817.070.000313.885組內(nèi)216.41218合計(jì)83210.3雙因素方差分析10.3.1雙因素方差分析及其類型10.3.2無交互作用的雙因素方差分析10.3.3有交互作用的雙因素方差分析雙因素方差分析
(two-wayanalysisofvariance)
分析兩個(gè)因素(行因素Row和列因素Column)對試驗(yàn)結(jié)果的影響如果兩個(gè)因素對試驗(yàn)結(jié)果的影響是相互獨(dú)立的,分別判斷行因素和列因素對試驗(yàn)數(shù)據(jù)的影響,這時(shí)的雙因素方差分析稱為無交互作用的雙因素方差分析或無重復(fù)雙因素方差分析(Two-factorwithoutreplication)如果除了行因素和列因素對試驗(yàn)數(shù)據(jù)的單獨(dú)影響外,兩個(gè)因素的搭配還會(huì)對結(jié)果產(chǎn)生一種新的影響,這時(shí)的雙因素方差分析稱為有交互作用的雙因素方差分析或可重復(fù)雙因素方差分析
(Two-factorwithreplication)雙因素方差分析的基本假定每個(gè)總體都服從正態(tài)分布對于因素的每一個(gè)水平,其觀察值是來自正態(tài)分布總體的簡單隨機(jī)樣本各個(gè)總體的方差必須相同對于各組觀察數(shù)據(jù),是從具有相同方差的總體中抽取的觀察值是獨(dú)立的無交互作用的雙因素方差分析
(無重復(fù)雙因素分析)雙因素方差分析
(例題分析)不同品牌的彩電在5個(gè)地區(qū)的銷售量數(shù)據(jù)品牌因素地區(qū)因素地區(qū)1地區(qū)2地區(qū)3地區(qū)4地區(qū)5品牌1品牌2品牌3品牌4365345358288350368323280343363353298340330343260323333308298【例10.3】有4個(gè)品牌的彩電在5個(gè)地區(qū)銷售,為分析彩電的品牌(品牌因素)和銷售地區(qū)(地區(qū)因素)對銷售量的影響(假設(shè)品牌和銷售地區(qū)對銷售額的影響是相互獨(dú)立的),對每個(gè)品牌在各地區(qū)的銷售量取得以下數(shù)據(jù)。試分析品牌和銷售地區(qū)對彩電的銷售量是否有顯著影響?(=0.05)
例題對應(yīng)的數(shù)據(jù)結(jié)構(gòu)
行因素的k個(gè)水平和列因素的r個(gè)水平的組合可形成k×r個(gè)總體。在每個(gè)總體中抽取的樣本量為1的獨(dú)立隨機(jī)樣本,xij就是行因素的第i個(gè)水平和列因素第j個(gè)水平對應(yīng)的總體所抽取出來的樣本。例題對應(yīng)的數(shù)據(jù)結(jié)構(gòu)
是行因素的第i個(gè)水平下各觀察值的平均值是列因素的第j個(gè)水平下各觀察值的平均值是全部kr個(gè)樣本數(shù)據(jù)的總平均值上表中:分析步驟
(提出假設(shè))提出假設(shè)對行因素提出的假設(shè)為(mi為第i個(gè)水平的均值)H0:m1=m2=…=mi=…=mk
(行因素對因變量沒有顯著影響)H1:mi
(i=1,2,…,k)
不全相等(行因素對因變量有顯著影響)對列因素提出的假設(shè)為(mj為第j個(gè)水平的均值)H0:m1=m2=…=mj=…=mr(列因素對因變量沒有顯著影響)H1:mj
(j=1,2,…,r)
不全相等(列因素對因變量有顯著影響)分析步驟
(構(gòu)造檢驗(yàn)的統(tǒng)計(jì)量)構(gòu)造檢驗(yàn)統(tǒng)計(jì)量(1)計(jì)算平方和(SS)總誤差平方和SST行因素誤差平方和SSR列因素誤差平方和SSC隨機(jī)誤差項(xiàng)平方和SSE隨機(jī)誤差平方和可理解為:分析步驟
(構(gòu)造檢驗(yàn)的統(tǒng)計(jì)量)
總誤差平方和(SST)、行因素平方和(SSR)、列因素平方和(SSC)、誤差項(xiàng)平方和(SSE)之間的關(guān)系SST=SSR+SSC+SSEWhy?分析步驟
(構(gòu)造檢驗(yàn)的統(tǒng)計(jì)量)構(gòu)造檢驗(yàn)統(tǒng)計(jì)量(2)計(jì)算均方(MS)誤差平方和除以相應(yīng)的自由度三個(gè)平方和的自由度分別是總誤差平方和SST的自由度為kr-1行因素平方和SSR的自由度為k-1列因素平方和SSC的自由度為r-1誤差項(xiàng)平方和SSE的自由度為(k-1)×(r-1)
分析步驟
(構(gòu)造檢驗(yàn)的統(tǒng)計(jì)量)構(gòu)造檢驗(yàn)統(tǒng)計(jì)量(3)
計(jì)算均方(MS)行因素的均方,記為MSR,計(jì)算公式為列因素的均方,記為MSC
,計(jì)算公式為誤差項(xiàng)的均方,記為MSE
,計(jì)算公式為分析步驟
(構(gòu)造檢驗(yàn)的統(tǒng)計(jì)量)
構(gòu)造檢驗(yàn)統(tǒng)計(jì)量(4)
計(jì)算檢驗(yàn)統(tǒng)計(jì)量(F)在對行因素假設(shè)的前提下,有以下統(tǒng)計(jì)量成立:在對列因素假設(shè)的前提下,有以下統(tǒng)計(jì)量成立:分析步驟
(統(tǒng)計(jì)決策)統(tǒng)計(jì)決策將統(tǒng)計(jì)量的值F與給定的顯著性水平的臨界值F進(jìn)行比較,作出對原假設(shè)H0的決策根據(jù)給定的顯著性水平在F分布表中查找相應(yīng)的臨界值F
若FR>F
,拒絕原假設(shè)H0
,表明均值之間的差異是顯著的,即所檢驗(yàn)的行因素對觀察值有顯著影響;否則,接受原假設(shè)。若FC
>F
,拒絕原假設(shè)H0
,表明均值之間有顯著差異,即所檢驗(yàn)的列因素對觀察值有顯著影響;否則,接受原假設(shè)。雙因素方差分析表
(基本結(jié)構(gòu))誤差來源平方和(SS)自由度(df)均方(MS)F值P值F臨界值行因素SSRk-1MSRMSRMSE列因素SSCr-1MSCMSCMSE誤差SSE(k-1)(r-1)MSE總和SSTkr-1雙因素方差分析
(例題分析)不同品牌的彩電在5個(gè)地區(qū)的銷售量數(shù)據(jù)品牌因素地區(qū)因素地區(qū)1地區(qū)2地區(qū)3地區(qū)4地區(qū)5品牌1品牌2品牌3品牌4365345358288350368323280343363353298340330343260323333308298【例10.3】有4個(gè)品牌的彩電在5個(gè)地區(qū)銷售,為分析彩電的品牌(品牌因素)和銷售地區(qū)(地區(qū)因素)對銷售量的影響(假設(shè)品牌和銷售地區(qū)對銷售額的影響是相互獨(dú)立的),對每個(gè)品牌在各地區(qū)的銷售量取得以下數(shù)據(jù)。試分析品牌和銷售地區(qū)對彩電的銷售量是否有顯著影響?(=0.05)
雙因素方差分析
(例題分析)提出假設(shè)對品牌因素提出的假設(shè)為H0:m1=m2=m3=m4(品牌對銷售量無顯著影響)H1:mi
(i=1,2,…,4)
不全相等(有顯著影響)對地區(qū)因素提出的假設(shè)為H0:m1=m2=m3=m4=m5(地區(qū)對銷售量無顯著影響)H1:mj
(j=1,2,…,5)
不全相等(有顯著影響)
雙因素方差分析
(例題分析)
結(jié)論:
FR=18.10777>F=3.4903,拒絕原假設(shè)H0,說明彩電的品牌對銷售量有顯著影響
FC=2.100846<F=3.2592,不拒絕原假設(shè)H0,無證據(jù)表明銷售地區(qū)對彩電的銷售量有顯著影響(也可以使用P值作出判斷)更一般的雙因素方差分析數(shù)據(jù)結(jié)構(gòu)
(補(bǔ)充)
行因素的k個(gè)水平和列因素的r個(gè)水平的組合可形成k×r個(gè)總體。在每個(gè)總體中抽取的樣本量為m的獨(dú)立隨機(jī)樣本,xijl就是行因素的第i個(gè)水平和列因素第j個(gè)水平對應(yīng)的總體所抽取出來的第l個(gè)樣本。是列因素的第j個(gè)水平下各觀察值的平均值是行因素的第i個(gè)水平下各觀察值的平均值是全部krm個(gè)樣本數(shù)據(jù)的總平均值對上表數(shù)據(jù)定義:更一般的雙因素方差分析數(shù)據(jù)結(jié)構(gòu)
是第i行第j列對應(yīng)的所有樣本的平均值更一般的雙因素方差分析數(shù)據(jù)結(jié)構(gòu)
(構(gòu)造檢驗(yàn)的統(tǒng)計(jì)量(1))構(gòu)造檢驗(yàn)統(tǒng)計(jì)量(1)計(jì)算平方和(SS)總誤差平方和SST行因素誤差平方和SSR列因素誤差平方和SSC隨機(jī)誤差項(xiàng)平方和SSESST=SSR+SSC+SSE構(gòu)造檢驗(yàn)統(tǒng)計(jì)量(2)計(jì)算均方(MS)誤差平方和除以相應(yīng)的自由度三個(gè)平方和的自由度分別是總誤差平方和SST的自由度為krm-1行因素平方和SSR的自由度為k-1列因素平方和SSC的自由度為r-1誤差項(xiàng)平方和SSE的自由度為krm-k-r+1更一般的雙因素方差分析數(shù)據(jù)結(jié)構(gòu)
(構(gòu)造檢驗(yàn)的統(tǒng)計(jì)量(2))構(gòu)造檢驗(yàn)統(tǒng)計(jì)量(3)
計(jì)算均方(MS)行因素的均方,記為MSR,計(jì)算公式為列因素的均方,記為MSC
,計(jì)算公式為誤差項(xiàng)的均方,記為MSE
,計(jì)算公式為更一般的雙因素方差分析數(shù)據(jù)結(jié)構(gòu)
(構(gòu)造檢驗(yàn)的統(tǒng)計(jì)量(3))分析步驟
(構(gòu)造檢驗(yàn)的統(tǒng)計(jì)量)
構(gòu)造檢驗(yàn)統(tǒng)計(jì)量(4)
計(jì)算檢驗(yàn)統(tǒng)計(jì)量(F)在對行因素假設(shè)的前提下,可得到以下統(tǒng)計(jì)量在對列因素假設(shè)的前提下,可得到以下統(tǒng)計(jì)量雙因素方差分析
(關(guān)系強(qiáng)度的測量)行平方和(SSR)度量了品牌這個(gè)自變量對因變量(銷售量)的影響效應(yīng)列平方和(SSC)度量了地區(qū)這個(gè)自變量對因變量(銷售量)的影響效應(yīng)這兩個(gè)平方和加在一起則度量了兩個(gè)自變量對因變量的聯(lián)合效應(yīng)聯(lián)合效應(yīng)與總平方和的比值定義為R2,稱為多重判定系數(shù)其平方根R反映了這兩個(gè)自變量合起來與因變量之間的關(guān)系強(qiáng)度
雙因素方差分析
(關(guān)系強(qiáng)度的測量)例題分析品牌因素和地區(qū)因素合起來總共解釋了銷售量差異的83.94%其他因素(殘差變量)只解釋了銷售量差異的16.06%R=0.9162,表明品牌和地區(qū)兩個(gè)因素合起來與銷售量之間有較強(qiáng)的關(guān)系單、雙因素方差分析比較
(例題分析)若對例10.3中的兩個(gè)因素(品牌和地區(qū))分別作單因素方差分析,得到如下結(jié)果:品牌與銷售量地區(qū)與銷售量單、雙因素方差分析比較
(例題分析)若對例10.3中的兩個(gè)因素(品牌和地區(qū))分別作單因素方差分析,所得結(jié)果與雙因素方差分析的區(qū)別:(1)決策結(jié)果相同;(2)雙因素方差分析所得到的誤差平方和比單因素方差分析的誤差平方和小。因?yàn)樵陔p因素方差分析中所得到的誤差平方和是排除了兩個(gè)自變量(品牌和地區(qū))的影響后總誤差中剩下的部分,而單因素方差分析中的誤差平方和為排除一個(gè)因素引起的誤差后總誤差中剩下的部分。
對于兩個(gè)變量而言:雙因素方差分析優(yōu)于單因素方差分析。有交互作用的雙因素方差分析
(可重復(fù)雙因素分析)可重復(fù)雙因素分析
(例題)【例10.5】城市道路交通管理部門為研究不同的路段和不同的時(shí)間段對行車時(shí)間的影響,讓一名交通警察分別在兩個(gè)路段和高峰期與非高峰期親自駕車進(jìn)行試驗(yàn),通過試驗(yàn)共獲得20個(gè)行車時(shí)間(單位:min)的數(shù)據(jù),如下表。試分析路段、時(shí)段以及路段和時(shí)段的交互作用對行車時(shí)間的影響
數(shù)據(jù)結(jié)構(gòu)行因素的k個(gè)水平和列因素的r個(gè)水平的組合可形成k×r個(gè)總體。在每個(gè)總體中抽取的樣本量為m的獨(dú)立隨機(jī)樣本,xijl就是行因素的第i個(gè)水平和列因素第j個(gè)水平對應(yīng)的總體所抽取出來的第l個(gè)樣本。分析步驟
(提出假設(shè))提出假設(shè)對行因素提出的假設(shè)為(mi為第i個(gè)水平的均值)H0:m1=m2=…=mi=…=mk(行因素對車流量無顯著影響)H1:mi
(i=1,2,…,k)
不全相等對列因素提出的假設(shè)為(mj為第j個(gè)水平的均值)H0:m1=m2=…=mj=…=mr(列因素對車流量無顯著影響)H1:mj
(j=1,2,…,r)
不全相等對行列因素提出的假設(shè)為(mij為行因素第i個(gè)水平和列因素第j個(gè)水平總體的均值,H0:mij=mst
(1i,s
k,1j,tr)(行列交互因素對車流量無顯著影響)H1:mij
(i=1,2,…,k;j=1,2,…,r)
不全相等可重復(fù)雙因素分析
(平方和的計(jì)算)設(shè):
為對應(yīng)于行因素的第i個(gè)水平和列因素的第j個(gè)水平的第l行的觀察值
為行因素的第i個(gè)水平的樣本均值
為列因素的第j個(gè)水平的樣本均值
對應(yīng)于行因素的第i個(gè)水平和列因素的第j個(gè)水平組合的樣本均值
為全部n個(gè)觀察值的總均值
可重復(fù)雙因素分析
(平方和的計(jì)算)總平方和:行變量平方和:列變量平方和:交互作用平方和:誤差項(xiàng)平方和:SST=SSR+SSC+SSRC+SSE(可看作:)可重復(fù)雙因素方差分析
溫馨提示
- 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
- 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會(huì)有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
- 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
- 5. 人人文庫網(wǎng)僅提供信息存儲(chǔ)空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負(fù)責(zé)。
- 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請與我們聯(lián)系,我們立即糾正。
- 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。
最新文檔
- 3.1工藝模塊簡介
- 八月十五美容院活動(dòng)方案
- 公交公司七進(jìn)活動(dòng)方案
- 公交客運(yùn)節(jié)約活動(dòng)方案
- 小狗和小貓500字(8篇)
- 公眾號策劃活動(dòng)方案
- 公會(huì)協(xié)力活動(dòng)方案
- 公會(huì)趣味活動(dòng)方案
- 公關(guān)公司創(chuàng)意策劃方案
- 公關(guān)贊助活動(dòng)策劃方案
- JG/T 283-2010膨脹?;⒅檩p質(zhì)砂漿
- 前臺(tái)訂機(jī)票管理制度
- 浪潮新員工培訓(xùn)體系大綱
- 2025年7月浙江省普通高中學(xué)業(yè)水平考試歷史仿真模擬卷01(含答案)
- 2024福建省閩投深海養(yǎng)殖裝備租賃有限責(zé)任公司招聘7人筆試參考題庫附帶答案詳解
- 法人變更交接協(xié)議書
- 地七年級下冊全冊知識要點(diǎn)總復(fù)習(xí)-2024-2025學(xué)年七年級地理教學(xué)課件(人教版2024)
- 2024-2025學(xué)年部編版四年級語文下冊期末模擬試卷
- 車牌過戶協(xié)議書范本
- 2025年中考?xì)v史考試綱要解讀
- 2025年統(tǒng)編版八年級下冊道德與法治期末復(fù)習(xí)課件327張
評論
0/150
提交評論