版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進(jìn)行舉報(bào)或認(rèn)領(lǐng)
文檔簡介
單因素方差分析單因素方差分析單因素方差分析單因素方差分析單因素方差分析單因素方差分析章節(jié)安排第一節(jié)方差分析原理第二節(jié)F檢驗(yàn)第三節(jié)單因素方差分析第四節(jié)雙因素方差分析2章節(jié)安排第一節(jié)方差分析原理2第一節(jié)方差分析原理一、方差分析常用概念(一)應(yīng)用方差分析的原因1.檢驗(yàn)過程繁瑣2.無統(tǒng)一的試驗(yàn)誤差,誤差估計(jì)的精確性和檢驗(yàn)的靈敏性低3.推斷的可靠性低,檢驗(yàn)的I型錯誤率大由于上述原因,多個平均數(shù)的差異顯著性檢驗(yàn)不宜用t檢驗(yàn)法,必須采用方差分析法。3第一節(jié)方差分析原理一、方差分析常用概念(一)應(yīng)用方差分析(二)概念及術(shù)語方差分析(AnalysisofVariance)是由英國統(tǒng)計(jì)學(xué)家R.A.Fisher于1923年提出的。這種方法是將k個處理的觀測值作為一個整體看待,把觀測值總變異的平方和及自由度分解為相應(yīng)于不同變異來源的平方和及自由度,進(jìn)而獲得不同變異來源總體方差估計(jì)值;通過計(jì)算這些總體方差的估計(jì)值的適當(dāng)比值,就能檢驗(yàn)各樣本所屬總體平均數(shù)是否相等。方差分析實(shí)質(zhì)上是關(guān)于觀測值變異原因的數(shù)量分析,它在科學(xué)研究中應(yīng)用十分廣泛。4(二)概念及術(shù)語方差分析(AnalysisofV常用術(shù)語1.因素因素是指所要研究的變量,它可能對因變量產(chǎn)生影響。2.水平水平指各個因素的具體表現(xiàn)。3.指標(biāo)為衡量研究結(jié)果或處理效應(yīng)的好壞,在研究中具體測定的性狀或觀測項(xiàng)目稱為指標(biāo)。4.交互作用如果一個因素的效應(yīng)大小在另一個因素不同水平下明顯不同,則稱為兩因素間存在交互作用。當(dāng)存在交互作用時(shí),單純研究某個因素的作用是沒有意義的,必須在另一個因素的不同水平下研究該因素的作用大小。5常用術(shù)語1.因素5二、方差分析的基本思想方差分析就是通過對水平之間的方差和水平內(nèi)部的方差的比較,做出拒絕還是不能拒絕原假設(shè)的判斷。6二、方差分析的基本思想方差分析就是通過對水平之間的方差和水平怎樣解決下面的問題?來自不同地區(qū)的大學(xué)生每個月的平均生活費(fèi)支出是否不同呢?家電的品牌對它們的銷售量是否有顯著影響呢?不同的路段和不同的時(shí)段對行車時(shí)間有影響嗎?超市的位置和它的銷售額有關(guān)系嗎?不同的小麥品種產(chǎn)量有差異嗎?7怎樣解決下面的問題?來自不同地區(qū)的大學(xué)生每個月的平均生活費(fèi)支【例】研究員想挑選出能使小麥畝產(chǎn)量最大的化肥,選了三個品牌的化肥:A,B和C。因子水平
品牌觀測值A(chǔ)BC157066054025607605803610670530458071055055906305206580730560763064051086006805308【例】研究員想挑選出能使小麥畝產(chǎn)量最大的化肥,選了三個品研究分類自變量(因子factor)對數(shù)值因變量(觀測結(jié)果)的影響例如:“化肥品牌”是一個分類自變量兩個或多個水平(level)或分類。例如:3個化肥品牌一個數(shù)值型因變量,產(chǎn)量分析三個品牌的化肥的產(chǎn)量是否有顯著差異,也就是要判斷“品牌”對“產(chǎn)量”是否有顯著影響作出這種判斷最終被歸結(jié)為檢驗(yàn)這三個品牌的產(chǎn)量的均值是否相等若它們的均值相等,則意味著“品牌”對產(chǎn)量是沒有影響的;若均值不全相等,則意味著“品牌”對產(chǎn)量是有影響的。9研究分類自變量(因子factor)對數(shù)值因變量(觀測結(jié)果)的方差分析基本原理10方差分析基本原理10從散點(diǎn)圖上可以看出不同品牌的產(chǎn)量是有明顯差異的同一個品牌,不同地塊的產(chǎn)量也明顯不同B較高,C較低品牌與產(chǎn)量之間有一定的關(guān)系如果品牌與產(chǎn)量之間沒有關(guān)系,那么它們的產(chǎn)量應(yīng)該差不多相同,在散點(diǎn)圖上所呈現(xiàn)的模式也就應(yīng)該很接近方差分析的基本思想和原理
(圖形分析)11從散點(diǎn)圖上可以看出方差分析的基本思想和原理
(圖形分析)11方差分析的基本原理為了更容易的找出各化肥品牌的小麥平均產(chǎn)量的不同,我們對每個化肥品牌做一個箱線圖。12方差分析的基本原理為了更容易的找出各化肥品牌的小麥平均產(chǎn)量的僅從散點(diǎn)圖上觀察還不能提供充分的證據(jù)證明化肥品牌與小麥產(chǎn)量之間有顯著差異這種差異也可能是由于抽樣的隨機(jī)性所造成的需要有更準(zhǔn)確的方法來檢驗(yàn)這種差異是否顯著,也就是進(jìn)行方差分析所以叫方差分析,因?yàn)殡m然我們感興趣的是均值,但在判斷均值之間是否有差異時(shí)則需要借助于方差這個名字也表示:它是通過對數(shù)據(jù)誤差來源的分析判斷不同總體的均值是否相等。因此,進(jìn)行方差分析時(shí),需要考察數(shù)據(jù)誤差的來源方差分析的基本思想和原理13僅從散點(diǎn)圖上觀察還不能提供充分的證據(jù)證明化肥品牌與小麥產(chǎn)量之三、方差分析的前提和基本步驟(一)方差分析的基本前提1.樣本是獨(dú)立的隨機(jī)樣本。2.各樣本皆來自正態(tài)總體。3.總體方差具有齊性,即各總體方差相等。
(二)方差分析的基本步驟1.計(jì)算各項(xiàng)平方和與自由度。2.列出方差分析表,進(jìn)行F檢驗(yàn)。3.做出判斷。14三、方差分析的前提和基本步驟(一)方差分析的基本前提14第二節(jié)誤差分解與F檢驗(yàn)一、誤差分解組內(nèi)誤差(withingroups)樣本數(shù)據(jù)內(nèi)部各觀察值之間的差異比如,同一位置下不同超市之間銷售額的差異的差異反映隨機(jī)因素的影響,稱為隨機(jī)誤差組間誤差(betweengroups)不同樣本之間觀察值的差異比如,不同位置超市之間銷售額的差異可能是隨機(jī)誤差,也可能是超市位置本身所造成的系統(tǒng)性系統(tǒng)誤差總誤差(total)
全部觀測數(shù)據(jù)的誤差大小15第二節(jié)誤差分解與F檢驗(yàn)一、誤差分解組內(nèi)誤差(within誤差平方和的分解及其關(guān)系
總誤差總平方和(SST)隨機(jī)誤差處理誤差組內(nèi)平方和(SSE)組間平方和(SSA)==++16誤差平方和的分解及其關(guān)系
總誤差總平方和隨機(jī)誤差處理誤差組內(nèi)誤差度量
(均方—MS)用均方(meansquare)表示誤差大小,以消除觀測數(shù)據(jù)的多少對平方和的影響用平方和除以相應(yīng)的自由度均方也稱方差(variance)
組間均方也稱組間方差(between-groupsvariance),反映各因子間誤差的大小MSA=SSA÷自由度(因子個數(shù)-1)組內(nèi)均方也稱組內(nèi)方差(within-groupsvariance)
,反映隨機(jī)誤差的大小MSE=SSE÷自由度(數(shù)據(jù)個數(shù)-因子個數(shù))總平方和(SST)的自由度為n-117誤差度量
(均方—MS)用均方(meansquare)表示二、F分布與拒絕域如果均值相等,F(xiàn)=MSA/MSE1aF分布F(k-1,n-k)0拒絕H0不拒絕H0F18二、F分布與拒絕域如果均值相等,aF分布F(k-1,三、F-檢驗(yàn)將組間均方與組內(nèi)均方進(jìn)行比較,分析差異是否顯著F=(MSA÷MSE)~F(因子自由度,殘差自由度)用F分布作出決策,給定的顯著性水平若F>F(或P<),則拒絕原假設(shè)H0,表明均值之間的差異顯著,因素對觀察值有顯著影響19三、F-檢驗(yàn)將組間均方與組內(nèi)均方進(jìn)行比較,分析差異是否顯著1設(shè)1為化肥品牌A下產(chǎn)量的均值,2為化肥品牌B下產(chǎn)量的均值,3為化肥品牌C下產(chǎn)量的提出的假設(shè)為H0:
123
H1:
1,2,3
不全相等計(jì)算檢驗(yàn)統(tǒng)計(jì)量計(jì)算P值,作出決策第三節(jié)單因素方差分析20設(shè)1為化肥品牌A下產(chǎn)量的均值,2為化肥品牌B下產(chǎn)量的均值例題分析觀測值品牌ABC15706605402560760580361067053045807105505590630520658073056076306405108600680530樣本均值590685540樣本容量888總均值60521例題分析觀測值品牌ABC157066054025607605單因素方差分析表
(基本結(jié)構(gòu))誤差來源平方和(SS)自由度(df)均方(MS)F值P值F臨界值組間(因素影響)SSAk-1MSAMSAMSE組內(nèi)(誤差)SSEn-kMSE總和SSTn-122單因素方差分析表
(基本結(jié)構(gòu))誤差來源平方和自由度均方(MS由SPSS可以得到方差分析表:來源平方和比例自由度均方F-比p-值化肥868000.80224340042.60.00000004殘差214000.198211019總計(jì)1082001.00023該表說明我們要拒絕零假設(shè),各化肥品牌導(dǎo)致的小麥產(chǎn)量之間有顯著不同.單因素方差分析23由SPSS可以得到方差分析表:來源平方和比例自由度均方F-用Excel進(jìn)行方差分析
(Excel檢驗(yàn)步驟)第1步:選擇“工具”下拉菜單第2步:選擇“數(shù)據(jù)分析”選項(xiàng)第3步:在分析工具中選擇“單因素方差分析”
,然后選擇“確定”第4步:當(dāng)對話框出現(xiàn)時(shí)
在“輸入?yún)^(qū)域”方框內(nèi)鍵入數(shù)據(jù)單元格區(qū)域在方框內(nèi)鍵入0.05(可根據(jù)需要確定)在“輸出選項(xiàng)”中選擇輸出區(qū)域24用Excel進(jìn)行方差分析
(Excel檢驗(yàn)步驟)第1步:用SPSS進(jìn)行方差分析
(單因素方差分析)
用SPSS進(jìn)行方差分析第1步:選擇【Analyze】【CompareMeans】【One-Way-ANOVA】進(jìn)入主對話框第2步:在主對話框中將因變量(產(chǎn)量)選入【DependentList】,將自變量(品牌)選入【Factor)】第3步(需要多重比較時(shí))點(diǎn)擊【Post-Hoc】從中選擇一種方法,如LSD;(需要均值圖時(shí))在【Options】下選中【Meansplot】,(需要相關(guān)統(tǒng)計(jì)量時(shí))選擇【Descriptive】,點(diǎn)擊【Continue】回到主對話框。點(diǎn)擊【OK】25用SPSS進(jìn)行方差分析
(單因素方差分析)用SPSS進(jìn)第四節(jié)雙因素方差分析在小麥產(chǎn)量的例子中,我們將總效應(yīng)分為兩類:化肥變量的效應(yīng)和殘差變量的效應(yīng)。換句話說,我們只考慮了效應(yīng)的兩個來源,即來自化肥變量和隨機(jī)誤差。但是影響小麥產(chǎn)量的因素除了所用化肥的品牌,可能還有土壤、天氣等等因素的影響。考慮其他因素的好處是降低殘差的效應(yīng),即降低F統(tǒng)計(jì)量的分母,F(xiàn)值會變大,使我們拒絕均值相等的零假設(shè),或者說我們可以解釋更多的效應(yīng),從而減少誤差。本節(jié)討論雙因素方差分析(Two-WayANOVA),其分析方法可以很容易地被推廣到多因素方差分析(Multi-WayANOVA)。26第四節(jié)雙因素方差分析在小麥產(chǎn)量的例子中,我們將總效應(yīng)分為兩一、雙因素方差分析的種類
(two-wayanalysisofvariance)
分析兩個因素(行因素Row和列因素Column)對試驗(yàn)結(jié)果的影響如果兩個因素對試驗(yàn)結(jié)果的影響是相互獨(dú)立的,分別判斷行因素和列因素對試驗(yàn)數(shù)據(jù)的影響,這時(shí)的雙因素方差分析稱為無交互作用的雙因素方差分析或無重復(fù)雙因素方差分析(Two-factorwithoutreplication)如果除了行因素和列因素對試驗(yàn)數(shù)據(jù)的單獨(dú)影響外,兩個因素的搭配還會對結(jié)果產(chǎn)生一種新的影響,這時(shí)的雙因素方差分析稱為有交互作用的雙因素方差分析或可重復(fù)雙因素方差分析(Two-factorwithreplication)27一、雙因素方差分析的種類
(two-wayanalysis例題分析【例】個地區(qū)的交通管理局正準(zhǔn)備擴(kuò)大從郊區(qū)到商業(yè)中心的公車服務(wù),考慮四條路線:1號線、2號線、3號線、4號線。交管局想進(jìn)行檢驗(yàn)判斷四條路線的平均行駛時(shí)間是否存在差異。因?yàn)榭赡艽嬖诓煌緳C(jī),檢驗(yàn)時(shí)讓每一名司機(jī)都分別行駛四條路線。在0.05的顯著性水平下,四條路線的行駛時(shí)間的均值是否有差異?司機(jī)1號線2號線3號線4號線小張33353537小李36373939小王35384038小劉40364340小楊4139434028例題分析【例】個地區(qū)的交通管理局正準(zhǔn)備擴(kuò)大從郊區(qū)到商業(yè)中心的行駛時(shí)間平方和df均方F顯著性組間32.400310.8001.618.225組內(nèi)106.800166.675總數(shù)139.20019實(shí)際上p-值0.225遠(yuǎn)大于0.05,所以不能拒絕零假設(shè)。交管局得出結(jié)論四條路線的平均行駛時(shí)間無差異,沒有某條路線行駛速度快而被選擇的理由。如果不考慮司機(jī)因素—單因素分析29行駛時(shí)間平方和df均方F顯著性實(shí)際上p-值0.225遠(yuǎn)大于0二、無交互效應(yīng)的雙因素方差分析如果上例中我們只考慮路線引起的效應(yīng)而將其余的都?xì)w為隨機(jī)效應(yīng),那么我們沒有必要讓五名司機(jī)分別行駛四條路線。如果我們考慮不同司機(jī)的影響,我們就能減少殘差平方和,從而得到更大的F值。我們把本例中的司機(jī)因素稱為區(qū)組因素(blockingvariable),即在方差分析中能減少殘差平方和的第二個處理因素。在本例中將司機(jī)作為區(qū)組因素,從殘差平方和中提取出司機(jī)的影響能夠影響處理的F比值。這里介紹無交互作用的雙因素方差分析。30二、無交互效應(yīng)的雙因素方差分析如果上例中我們只考慮路線引起無交互效應(yīng)的雙因素方差分析因?yàn)槲覀兛紤]不同司機(jī)行使時(shí)間的差異,所以要對區(qū)組做假設(shè)檢驗(yàn)。兩組假設(shè)分別為:1.不同路線均值都相等各路線均值不全相等2.區(qū)組均值都相等各區(qū)組均值不全相等兩因素方差分析表的格式與單因素方差分析的格式一致,唯一的區(qū)別是加了一行區(qū)組變差。31無交互效應(yīng)的雙因素方差分析因?yàn)槲覀兛紤]不同司機(jī)行使時(shí)間的差異無交互效應(yīng)的雙因素方差分析32無交互效應(yīng)的雙因素方差分析32從該表可以看出,關(guān)于對司機(jī)的零假設(shè)的p-值是0.002,對路線的零假設(shè)的p-值是0.024??梢缘弥?.05的顯著性水平下,路線和區(qū)組的零假設(shè)都被拒絕。因此,路線和司機(jī)這兩個因素都對行駛時(shí)間有顯著作用,也就是說這兩個因素的不同水平的確造成了行駛時(shí)間的不同。這表明司機(jī)這個因素的引進(jìn),使得路線對行駛時(shí)間從沒有影響變成有顯著影響。無交互效應(yīng)的雙因素方差分析33從該表可以看出,關(guān)于對司機(jī)的零假設(shè)的p-值是0.002,對路例題分析線路因素和司機(jī)因素合起來總共解釋了行車時(shí)間差異的78.45%其他因素(殘差變量)只解釋了銷售量差異的21.55%無交互效應(yīng)的雙因素方差分析34例題分析無交互效應(yīng)的雙因素方差分析34三、有交互效應(yīng)的雙因素方差分析值得注意的是,對于上面的例子,我們僅僅分析了路線和司機(jī)這兩個因素分別對行駛時(shí)間的影響。也就是說因?yàn)樗緳C(jī)變化所帶來的行駛時(shí)間的變化是同行駛的路線是無關(guān)的。這顯然是值得斟酌的。對于一個實(shí)際問題,僅考慮因素各自的作用是不是合理?能不能回答我們關(guān)心的問題?那就得視具體問題而論了。因此,我們接下來簡單介紹帶交互作用的雙因素方差分析。要說明的是,如果每一種因素水平的組合只有一個觀測值,那么由于數(shù)據(jù)量不夠會導(dǎo)致無法判斷是否有交互作用。這時(shí)即使有交互作用,也混在誤差項(xiàng)中而無法分離出來。35三、有交互效應(yīng)的雙因素方差分析值得注意的是,對于上面的例子例7.3該地區(qū)的交管局還想研究司機(jī)變化所帶來的行駛時(shí)間的變化與行駛的路線是否有關(guān)?因此,我們假設(shè)對這個地區(qū)的交管局進(jìn)行了2次測試。獲得數(shù)據(jù)如下表所示司機(jī)1號線2號線3號線4號線小張3335353735373739小李3638373939413941小王3537384040423840小劉4042363843454042小楊4143394143454042有交互效應(yīng)的雙因素方差分析36例7.3該地區(qū)的交管局還想研究司機(jī)變化所帶來的行駛時(shí)間的m為樣本的行數(shù)有交互效應(yīng)的雙因素方差分析37m為樣本的行數(shù)有交互效應(yīng)的雙因素方差分析37有交互效應(yīng)的雙因素方差分析因變量:行駛時(shí)間源III型平方和df均方FSig.模型61906.000a203095.3001629.105.000司機(jī)*路線61.000125.0832.675.025司機(jī)155.000438.75020.395.000路線67.500322.50011.842.000誤差38.000201.900總計(jì)61944.00040a.R方=.999(調(diào)整R方=.999)從中可以看到,與無交互的雙因素方差分析結(jié)果一樣,路線和司機(jī)因素的p-值都小于0.05,檢驗(yàn)是高度顯著的。交互項(xiàng)“司機(jī)*路線”反映的是司機(jī)因素和路線因素聯(lián)合產(chǎn)生的對行駛時(shí)間的附加效應(yīng)。由于p-值0.025小于0.05,因此,檢驗(yàn)高度顯著,這表明司機(jī)因素和路線因素聯(lián)合產(chǎn)生的交互作用對行駛時(shí)間有顯著影響。換句話說,也就是不同路線的行駛時(shí)間差異會因?yàn)樗褂玫乃緳C(jī)的不同而不同,或者說不同司機(jī)的行駛時(shí)間差異會因?yàn)樗?jīng)過的路線不同而不同。38有交互效應(yīng)的雙因素方差分析因變量:行駛時(shí)間源III型平方和有交互效應(yīng)的雙因素方差分析交互作用的模型可以從點(diǎn)圖中直觀看出。圖7.4中的五條折現(xiàn)分別表示了每名司機(jī)行駛不同路線所需的平均時(shí)間。如果在有交互作用的模型中,這樣五條線還是平行的,那就說明司機(jī)因素和路線因素之間沒有交互作用。從該圖可以看出,這五條線并不平行,這從直觀上說明這兩個因素的主效應(yīng)不是簡單可加的,是有交互作用的。39有交互效應(yīng)的雙因素方差分析交互作用的模型可以從點(diǎn)圖中直觀看出本章小結(jié)方差分析(AnalysisofVariance,ANOVA)是20世紀(jì)20年代由英國統(tǒng)計(jì)學(xué)家費(fèi)雪首先提出的,最初主要應(yīng)用于生物和農(nóng)業(yè)田間試驗(yàn),以后推廣到各個領(lǐng)域應(yīng)用。它是直接對多個總體的均值是否相等進(jìn)行檢驗(yàn),這樣不但可以減少工作量,而且可以增加檢驗(yàn)的穩(wěn)定性。本章介紹了方差分析的基本思想與假定,以及如何做單因素方差分析和雙因素方差分析,要求學(xué)生學(xué)會方差分析的基本方法。40本章小結(jié)方差分析(AnalysisofVariance,本章練習(xí)P207—209的練習(xí)題。41本章練習(xí)P207—209的練習(xí)題。41謝謝觀賞!2020/11/542謝謝觀賞!2020/11/542單因素方差分析單因素方差分析單因素方差分析單因素方差分析單因素方差分析單因素方差分析章節(jié)安排第一節(jié)方差分析原理第二節(jié)F檢驗(yàn)第三節(jié)單因素方差分析第四節(jié)雙因素方差分析44章節(jié)安排第一節(jié)方差分析原理2第一節(jié)方差分析原理一、方差分析常用概念(一)應(yīng)用方差分析的原因1.檢驗(yàn)過程繁瑣2.無統(tǒng)一的試驗(yàn)誤差,誤差估計(jì)的精確性和檢驗(yàn)的靈敏性低3.推斷的可靠性低,檢驗(yàn)的I型錯誤率大由于上述原因,多個平均數(shù)的差異顯著性檢驗(yàn)不宜用t檢驗(yàn)法,必須采用方差分析法。45第一節(jié)方差分析原理一、方差分析常用概念(一)應(yīng)用方差分析(二)概念及術(shù)語方差分析(AnalysisofVariance)是由英國統(tǒng)計(jì)學(xué)家R.A.Fisher于1923年提出的。這種方法是將k個處理的觀測值作為一個整體看待,把觀測值總變異的平方和及自由度分解為相應(yīng)于不同變異來源的平方和及自由度,進(jìn)而獲得不同變異來源總體方差估計(jì)值;通過計(jì)算這些總體方差的估計(jì)值的適當(dāng)比值,就能檢驗(yàn)各樣本所屬總體平均數(shù)是否相等。方差分析實(shí)質(zhì)上是關(guān)于觀測值變異原因的數(shù)量分析,它在科學(xué)研究中應(yīng)用十分廣泛。46(二)概念及術(shù)語方差分析(AnalysisofV常用術(shù)語1.因素因素是指所要研究的變量,它可能對因變量產(chǎn)生影響。2.水平水平指各個因素的具體表現(xiàn)。3.指標(biāo)為衡量研究結(jié)果或處理效應(yīng)的好壞,在研究中具體測定的性狀或觀測項(xiàng)目稱為指標(biāo)。4.交互作用如果一個因素的效應(yīng)大小在另一個因素不同水平下明顯不同,則稱為兩因素間存在交互作用。當(dāng)存在交互作用時(shí),單純研究某個因素的作用是沒有意義的,必須在另一個因素的不同水平下研究該因素的作用大小。47常用術(shù)語1.因素5二、方差分析的基本思想方差分析就是通過對水平之間的方差和水平內(nèi)部的方差的比較,做出拒絕還是不能拒絕原假設(shè)的判斷。48二、方差分析的基本思想方差分析就是通過對水平之間的方差和水平怎樣解決下面的問題?來自不同地區(qū)的大學(xué)生每個月的平均生活費(fèi)支出是否不同呢?家電的品牌對它們的銷售量是否有顯著影響呢?不同的路段和不同的時(shí)段對行車時(shí)間有影響嗎?超市的位置和它的銷售額有關(guān)系嗎?不同的小麥品種產(chǎn)量有差異嗎?49怎樣解決下面的問題?來自不同地區(qū)的大學(xué)生每個月的平均生活費(fèi)支【例】研究員想挑選出能使小麥畝產(chǎn)量最大的化肥,選了三個品牌的化肥:A,B和C。因子水平
品牌觀測值A(chǔ)BC1570660540256076058036106705304580710550559063052065807305607630640510860068053050【例】研究員想挑選出能使小麥畝產(chǎn)量最大的化肥,選了三個品研究分類自變量(因子factor)對數(shù)值因變量(觀測結(jié)果)的影響例如:“化肥品牌”是一個分類自變量兩個或多個水平(level)或分類。例如:3個化肥品牌一個數(shù)值型因變量,產(chǎn)量分析三個品牌的化肥的產(chǎn)量是否有顯著差異,也就是要判斷“品牌”對“產(chǎn)量”是否有顯著影響作出這種判斷最終被歸結(jié)為檢驗(yàn)這三個品牌的產(chǎn)量的均值是否相等若它們的均值相等,則意味著“品牌”對產(chǎn)量是沒有影響的;若均值不全相等,則意味著“品牌”對產(chǎn)量是有影響的。51研究分類自變量(因子factor)對數(shù)值因變量(觀測結(jié)果)的方差分析基本原理52方差分析基本原理10從散點(diǎn)圖上可以看出不同品牌的產(chǎn)量是有明顯差異的同一個品牌,不同地塊的產(chǎn)量也明顯不同B較高,C較低品牌與產(chǎn)量之間有一定的關(guān)系如果品牌與產(chǎn)量之間沒有關(guān)系,那么它們的產(chǎn)量應(yīng)該差不多相同,在散點(diǎn)圖上所呈現(xiàn)的模式也就應(yīng)該很接近方差分析的基本思想和原理
(圖形分析)53從散點(diǎn)圖上可以看出方差分析的基本思想和原理
(圖形分析)11方差分析的基本原理為了更容易的找出各化肥品牌的小麥平均產(chǎn)量的不同,我們對每個化肥品牌做一個箱線圖。54方差分析的基本原理為了更容易的找出各化肥品牌的小麥平均產(chǎn)量的僅從散點(diǎn)圖上觀察還不能提供充分的證據(jù)證明化肥品牌與小麥產(chǎn)量之間有顯著差異這種差異也可能是由于抽樣的隨機(jī)性所造成的需要有更準(zhǔn)確的方法來檢驗(yàn)這種差異是否顯著,也就是進(jìn)行方差分析所以叫方差分析,因?yàn)殡m然我們感興趣的是均值,但在判斷均值之間是否有差異時(shí)則需要借助于方差這個名字也表示:它是通過對數(shù)據(jù)誤差來源的分析判斷不同總體的均值是否相等。因此,進(jìn)行方差分析時(shí),需要考察數(shù)據(jù)誤差的來源方差分析的基本思想和原理55僅從散點(diǎn)圖上觀察還不能提供充分的證據(jù)證明化肥品牌與小麥產(chǎn)量之三、方差分析的前提和基本步驟(一)方差分析的基本前提1.樣本是獨(dú)立的隨機(jī)樣本。2.各樣本皆來自正態(tài)總體。3.總體方差具有齊性,即各總體方差相等。
(二)方差分析的基本步驟1.計(jì)算各項(xiàng)平方和與自由度。2.列出方差分析表,進(jìn)行F檢驗(yàn)。3.做出判斷。56三、方差分析的前提和基本步驟(一)方差分析的基本前提14第二節(jié)誤差分解與F檢驗(yàn)一、誤差分解組內(nèi)誤差(withingroups)樣本數(shù)據(jù)內(nèi)部各觀察值之間的差異比如,同一位置下不同超市之間銷售額的差異的差異反映隨機(jī)因素的影響,稱為隨機(jī)誤差組間誤差(betweengroups)不同樣本之間觀察值的差異比如,不同位置超市之間銷售額的差異可能是隨機(jī)誤差,也可能是超市位置本身所造成的系統(tǒng)性系統(tǒng)誤差總誤差(total)
全部觀測數(shù)據(jù)的誤差大小57第二節(jié)誤差分解與F檢驗(yàn)一、誤差分解組內(nèi)誤差(within誤差平方和的分解及其關(guān)系
總誤差總平方和(SST)隨機(jī)誤差處理誤差組內(nèi)平方和(SSE)組間平方和(SSA)==++58誤差平方和的分解及其關(guān)系
總誤差總平方和隨機(jī)誤差處理誤差組內(nèi)誤差度量
(均方—MS)用均方(meansquare)表示誤差大小,以消除觀測數(shù)據(jù)的多少對平方和的影響用平方和除以相應(yīng)的自由度均方也稱方差(variance)
組間均方也稱組間方差(between-groupsvariance),反映各因子間誤差的大小MSA=SSA÷自由度(因子個數(shù)-1)組內(nèi)均方也稱組內(nèi)方差(within-groupsvariance)
,反映隨機(jī)誤差的大小MSE=SSE÷自由度(數(shù)據(jù)個數(shù)-因子個數(shù))總平方和(SST)的自由度為n-159誤差度量
(均方—MS)用均方(meansquare)表示二、F分布與拒絕域如果均值相等,F(xiàn)=MSA/MSE1aF分布F(k-1,n-k)0拒絕H0不拒絕H0F60二、F分布與拒絕域如果均值相等,aF分布F(k-1,三、F-檢驗(yàn)將組間均方與組內(nèi)均方進(jìn)行比較,分析差異是否顯著F=(MSA÷MSE)~F(因子自由度,殘差自由度)用F分布作出決策,給定的顯著性水平若F>F(或P<),則拒絕原假設(shè)H0,表明均值之間的差異顯著,因素對觀察值有顯著影響61三、F-檢驗(yàn)將組間均方與組內(nèi)均方進(jìn)行比較,分析差異是否顯著1設(shè)1為化肥品牌A下產(chǎn)量的均值,2為化肥品牌B下產(chǎn)量的均值,3為化肥品牌C下產(chǎn)量的提出的假設(shè)為H0:
123
H1:
1,2,3
不全相等計(jì)算檢驗(yàn)統(tǒng)計(jì)量計(jì)算P值,作出決策第三節(jié)單因素方差分析62設(shè)1為化肥品牌A下產(chǎn)量的均值,2為化肥品牌B下產(chǎn)量的均值例題分析觀測值品牌ABC15706605402560760580361067053045807105505590630520658073056076306405108600680530樣本均值590685540樣本容量888總均值60563例題分析觀測值品牌ABC157066054025607605單因素方差分析表
(基本結(jié)構(gòu))誤差來源平方和(SS)自由度(df)均方(MS)F值P值F臨界值組間(因素影響)SSAk-1MSAMSAMSE組內(nèi)(誤差)SSEn-kMSE總和SSTn-164單因素方差分析表
(基本結(jié)構(gòu))誤差來源平方和自由度均方(MS由SPSS可以得到方差分析表:來源平方和比例自由度均方F-比p-值化肥868000.80224340042.60.00000004殘差214000.198211019總計(jì)1082001.00023該表說明我們要拒絕零假設(shè),各化肥品牌導(dǎo)致的小麥產(chǎn)量之間有顯著不同.單因素方差分析65由SPSS可以得到方差分析表:來源平方和比例自由度均方F-用Excel進(jìn)行方差分析
(Excel檢驗(yàn)步驟)第1步:選擇“工具”下拉菜單第2步:選擇“數(shù)據(jù)分析”選項(xiàng)第3步:在分析工具中選擇“單因素方差分析”
,然后選擇“確定”第4步:當(dāng)對話框出現(xiàn)時(shí)
在“輸入?yún)^(qū)域”方框內(nèi)鍵入數(shù)據(jù)單元格區(qū)域在方框內(nèi)鍵入0.05(可根據(jù)需要確定)在“輸出選項(xiàng)”中選擇輸出區(qū)域66用Excel進(jìn)行方差分析
(Excel檢驗(yàn)步驟)第1步:用SPSS進(jìn)行方差分析
(單因素方差分析)
用SPSS進(jìn)行方差分析第1步:選擇【Analyze】【CompareMeans】【One-Way-ANOVA】進(jìn)入主對話框第2步:在主對話框中將因變量(產(chǎn)量)選入【DependentList】,將自變量(品牌)選入【Factor)】第3步(需要多重比較時(shí))點(diǎn)擊【Post-Hoc】從中選擇一種方法,如LSD;(需要均值圖時(shí))在【Options】下選中【Meansplot】,(需要相關(guān)統(tǒng)計(jì)量時(shí))選擇【Descriptive】,點(diǎn)擊【Continue】回到主對話框。點(diǎn)擊【OK】67用SPSS進(jìn)行方差分析
(單因素方差分析)用SPSS進(jìn)第四節(jié)雙因素方差分析在小麥產(chǎn)量的例子中,我們將總效應(yīng)分為兩類:化肥變量的效應(yīng)和殘差變量的效應(yīng)。換句話說,我們只考慮了效應(yīng)的兩個來源,即來自化肥變量和隨機(jī)誤差。但是影響小麥產(chǎn)量的因素除了所用化肥的品牌,可能還有土壤、天氣等等因素的影響??紤]其他因素的好處是降低殘差的效應(yīng),即降低F統(tǒng)計(jì)量的分母,F(xiàn)值會變大,使我們拒絕均值相等的零假設(shè),或者說我們可以解釋更多的效應(yīng),從而減少誤差。本節(jié)討論雙因素方差分析(Two-WayANOVA),其分析方法可以很容易地被推廣到多因素方差分析(Multi-WayANOVA)。68第四節(jié)雙因素方差分析在小麥產(chǎn)量的例子中,我們將總效應(yīng)分為兩一、雙因素方差分析的種類
(two-wayanalysisofvariance)
分析兩個因素(行因素Row和列因素Column)對試驗(yàn)結(jié)果的影響如果兩個因素對試驗(yàn)結(jié)果的影響是相互獨(dú)立的,分別判斷行因素和列因素對試驗(yàn)數(shù)據(jù)的影響,這時(shí)的雙因素方差分析稱為無交互作用的雙因素方差分析或無重復(fù)雙因素方差分析(Two-factorwithoutreplication)如果除了行因素和列因素對試驗(yàn)數(shù)據(jù)的單獨(dú)影響外,兩個因素的搭配還會對結(jié)果產(chǎn)生一種新的影響,這時(shí)的雙因素方差分析稱為有交互作用的雙因素方差分析或可重復(fù)雙因素方差分析(Two-factorwithreplication)69一、雙因素方差分析的種類
(two-wayanalysis例題分析【例】個地區(qū)的交通管理局正準(zhǔn)備擴(kuò)大從郊區(qū)到商業(yè)中心的公車服務(wù),考慮四條路線:1號線、2號線、3號線、4號線。交管局想進(jìn)行檢驗(yàn)判斷四條路線的平均行駛時(shí)間是否存在差異。因?yàn)榭赡艽嬖诓煌緳C(jī),檢驗(yàn)時(shí)讓每一名司機(jī)都分別行駛四條路線。在0.05的顯著性水平下,四條路線的行駛時(shí)間的均值是否有差異?司機(jī)1號線2號線3號線4號線小張33353537小李36373939小王35384038小劉40364340小楊4139434070例題分析【例】個地區(qū)的交通管理局正準(zhǔn)備擴(kuò)大從郊區(qū)到商業(yè)中心的行駛時(shí)間平方和df均方F顯著性組間32.400310.8001.618.225組內(nèi)106.800166.675總數(shù)139.20019實(shí)際上p-值0.225遠(yuǎn)大于0.05,所以不能拒絕零假設(shè)。交管局得出結(jié)論四條路線的平均行駛時(shí)間無差異,沒有某條路線行駛速度快而被選擇的理由。如果不考慮司機(jī)因素—單因素分析71行駛時(shí)間平方和df均方F顯著性實(shí)際上p-值0.225遠(yuǎn)大于0二、無交互效應(yīng)的雙因素方差分析如果上例中我們只考慮路線引起的效應(yīng)而將其余的都?xì)w為隨機(jī)效應(yīng),那么我們沒有必要讓五名司機(jī)分別行駛四條路線。如果我們考慮不同司機(jī)的影響,我們就能減少殘差平方和,從而得到更大的F值。我們把本例中的司機(jī)因素稱為區(qū)組因素(blockingvariable),即在方差分析中能減少殘差平方和的第二個處理因素。在本例中將司機(jī)作為區(qū)組因素,從殘差平方和中提取出司機(jī)的影響能夠影響處理的F比值。這里介紹無交互作用的雙因素方差分析。72二、無交互效應(yīng)的雙因素方差分析如果上例中我們只考慮路線引起無交互效應(yīng)的雙因素方差分析因?yàn)槲覀兛紤]不同司機(jī)行使時(shí)間的差異,所以要對區(qū)組做假設(shè)檢驗(yàn)。兩組假設(shè)分別為:1.不同路線均值都相等各路線均值不全相等2.區(qū)組均值都相等各區(qū)組均值不全相等兩因素方差分析表的格式與單因素方差分析的格式一致,唯一的區(qū)別是加了一行區(qū)組變差。73無交互效應(yīng)的雙因素方差分析因?yàn)槲覀兛紤]不同司機(jī)行使時(shí)間的差異無交互效應(yīng)的雙因素方差分析74無交互效應(yīng)的雙因素方差分析32從該表可以看出,關(guān)于對司機(jī)的零假設(shè)的p-值是0.002,對路線的零假設(shè)的p-值是0.024??梢缘弥?.05的顯著性水平下,路線和區(qū)組的零假設(shè)都被拒絕。因此,路線和司機(jī)這兩個因素都對行駛時(shí)間有顯著作用,也就是說這兩個因素的不同水平的確造成了行駛時(shí)間的不同。這表明司機(jī)這個因素的引進(jìn),使得路線對行駛時(shí)間從沒有影響變成有顯著影響。無交互效應(yīng)的雙因素方差分析75從該表可以看出,關(guān)于對司機(jī)的零假設(shè)的p-值是0.002,對路例題分析線路因素和司機(jī)因素合起來總共解釋了行車時(shí)間差異的78.45%其他因素(殘差變量)只解釋了銷售量差異的21.55%無交互效應(yīng)的雙因素方差分析76例題分析無交互效應(yīng)的雙因素方差分析34三、
溫馨提示
- 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
- 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
- 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
- 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負(fù)責(zé)。
- 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請與我們聯(lián)系,我們立即糾正。
- 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。
最新文檔
- 二零二五版申通快遞快遞運(yùn)輸服務(wù)協(xié)議范本3篇
- 二零二五年度寵物領(lǐng)養(yǎng)服務(wù)合同標(biāo)準(zhǔn)范本2篇
- 紡織行業(yè)紡織培訓(xùn)
- 二零二五版國際貨運(yùn)代理業(yè)投資監(jiān)管細(xì)則3篇
- 酒店管理的管理技能
- 二零二五年度物流倉儲行業(yè)搬運(yùn)工勞務(wù)派遣服務(wù)協(xié)議3篇
- 二零二五年度個人與企業(yè)個人間文化藝術(shù)交流活動合同規(guī)范3篇
- 二零二五年度跨境電商品牌授權(quán)區(qū)域代理銷售委托代銷合同3篇
- 二零二五年度個人教育培訓(xùn)貸款合同模板2篇
- 二零二五年度入學(xué)新生教育法律協(xié)議書(全面創(chuàng)新發(fā)展)3篇
- 致命性大出血急救專家共識
- 住院成人高血糖患者血糖監(jiān)測醫(yī)護(hù)協(xié)議處方共識
- DL-T5816-2020分布式電化學(xué)儲能系統(tǒng)接入配電網(wǎng)設(shè)計(jì)規(guī)范
- 2024年4月自考00832英語詞匯學(xué)試題
- 競賽試卷(試題)-2023-2024學(xué)年六年級下冊數(shù)學(xué)人教版
- 《電力用直流電源系統(tǒng)蓄電池組遠(yuǎn)程充放電技術(shù)規(guī)范》
- T-ACEF 095-2023 揮發(fā)性有機(jī)物泄漏檢測紅外成像儀(OGI)技術(shù)要求及監(jiān)測規(guī)范
- 骨科手術(shù)的術(shù)后飲食和營養(yǎng)指導(dǎo)
- 旅游定制師入行培訓(xùn)方案
- 2024年中國南方航空股份有限公司招聘筆試參考題庫含答案解析
- 六年級上冊數(shù)學(xué)應(yīng)用題100題
評論
0/150
提交評論