應(yīng)用統(tǒng)計學(xué) 第五章 方差分析.ppt_第1頁
應(yīng)用統(tǒng)計學(xué) 第五章 方差分析.ppt_第2頁
應(yīng)用統(tǒng)計學(xué) 第五章 方差分析.ppt_第3頁
應(yīng)用統(tǒng)計學(xué) 第五章 方差分析.ppt_第4頁
應(yīng)用統(tǒng)計學(xué) 第五章 方差分析.ppt_第5頁
已閱讀5頁,還剩77頁未讀, 繼續(xù)免費閱讀

下載本文檔

版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進行舉報或認領(lǐng)

文檔簡介

1、第五章 方差分析,概述 單因素方差分析(one-way ANOVA) 單響應(yīng)變量方差分析(ANOVA) 協(xié)方差分析(ANCOVA) 多響應(yīng)變量方差分析(MANOVA),一、概述,方差分析: 英國統(tǒng)計兼遺傳學(xué)家費舍爾在設(shè)計多種農(nóng)業(yè)試驗,特別是田間試驗,并對試驗進行評估中發(fā)展起來的。 主要用于研究某種因素(如廣告)對所感興趣的因變量(如銷售額)是否有顯著影響 抽樣得到的實驗數(shù)據(jù)顯示出實驗結(jié)果的差異性,其原因可能有兩類: 觀測條件不同(影響因素)引起試驗結(jié)果有所不同 此結(jié)果差異是系統(tǒng)性的 由于各種隨機因素的干擾,試驗結(jié)果也會有所不同 此差異是偶然性的,方差分析的目的,將觀測條件不同而引起的系統(tǒng)差異與

2、隨機因素引起的偶然差異用數(shù)量形式區(qū)別開來,以確定在實驗中有沒有系統(tǒng)性因素在起作用。,例1 某公司希望對新進銷售人員進行銷售培訓(xùn)以保證銷售業(yè)績。如何培訓(xùn)才能達到好的效果成為公司關(guān)注的問題。為此設(shè)置了兩組培訓(xùn)課程。為了比較它們的有效性,進行了一項實驗:隨機選擇三組新進銷售人員,每組五人。 一組接受A課程銷售訓(xùn)練 一組接受銷售B課程銷售訓(xùn)練 另一組C沒有參與任何訓(xùn)練(對照組) 當(dāng)前兩組的訓(xùn)練課程結(jié)束后,三組人員都開始實踐。兩個星期后統(tǒng)計了各組銷售人員的銷售記錄如下:,銷售培訓(xùn)會提高銷售人員的業(yè)績嗎?,不僅不同組中銷售員的業(yè)績有區(qū)別,同一組中接受相同培訓(xùn)的銷售員的業(yè)績也有區(qū)別,銷售業(yè)績:,組內(nèi)差異:隨

3、機因素造成 組間差異:培訓(xùn)和隨機因素造成 如果三組銷售人員的平均業(yè)績沒有顯著差別(組間差異不明顯),則說明銷售訓(xùn)練失敗 如果接受銷售訓(xùn)練的銷售人員的業(yè)績顯著突出,則說明銷售訓(xùn)練成功,影響業(yè)績的因素:,培訓(xùn)課程,隨機因素:如個人特質(zhì)、運氣,從上表可以看出,各組樣本數(shù)據(jù)差異較大,尤其是3組與1、2組的均值具有一定的差異。這是否說明銷售訓(xùn)練會提高銷售業(yè)績呢?當(dāng)然這種差異也許是由于隨機因素所造成,所以需要進行統(tǒng)計檢驗。,方差分析的假設(shè)為:,如果原假設(shè)成立,說明培訓(xùn)對銷售業(yè)績沒有顯著影響,組間差異與各組內(nèi)差異都是隨機因素造成的。,如果備擇假設(shè)成立,說明培訓(xùn)對銷售業(yè)績有顯著影響,各組內(nèi)的差異由隨機因素造成

4、,而組間差異則由隨機因素和銷售訓(xùn)練所導(dǎo)致的系統(tǒng)性差異造成。,方差分析的術(shù)語,因素:一個獨立的變量,是方差分析研究的對象。在例1中,“培訓(xùn)”就是一個待研究的因素。 水平:因素的不同狀態(tài)就稱為“水平”。分組是按因素的不同水平劃分的。例1中,因素“培訓(xùn)”分為三個水平(A課程、B課程、無訓(xùn)練)。 響應(yīng)變量(性能指標(biāo)):在分組試驗中,對試驗對象所觀測記錄的變量稱為“響應(yīng)變量”,它是受“因素”影響的變量,如例1中“銷售業(yè)績”。,方差分析的類型,單因素方差分析(一維方差分析):檢驗由單一因素影響的一個或幾個獨立的響應(yīng)變量的組間均值差異是否顯著。如上例,一個影響因素(培訓(xùn))的不同水平對一個響應(yīng)變量(銷售業(yè)績)

5、的影響分析。(one-way ANOVA 過程) 單響應(yīng)變量多因素方差分析:對一個響應(yīng)變量是否受一個或多個因素影響進行分析,包括協(xié)方差分析。常用的是雙因素方差分析。(Univariate 過程) 多響應(yīng)變量多因素方差分析:研究一個或多個因素變量與多個響應(yīng)變量集之間的關(guān)系。(Multivariate 過程) 重復(fù)測量方差分析:因素對響應(yīng)變量影響的試驗如果是重復(fù)測量的,就需要用重復(fù)測量方差分析。(Repeated Measures過程),問題的表述和假設(shè),按實驗因素水平形成分組數(shù)據(jù) 同一組中的數(shù)據(jù)看成是來自同一總體,它們有一個理論上的均值, 不同組的數(shù)據(jù)來自不同總體,一般認為這些總體具有相同方差(

6、其他條件保持不變),而它們的均值可能相同,也可能不同。 方差分析的目的:通過假設(shè)檢驗,判斷實驗因素對響應(yīng)變量是否有顯著影響,即各組均值是相同,還是不同 一般地,有 r個水平的因素,H0:1=2=r= 對上例,r=3,二、單因素方差分析,方差分析的檢驗方法:,基本思路: 判斷樣本均值的變異是由于因素的不同水平造成的,還是純粹由于隨機因素造成的。 研究數(shù)據(jù)間的“變異”(也稱為平方和),即離差平方和: 變異來源分解, 組內(nèi)變異:隨機因素造成,記作S組內(nèi)。 組間變異:可能單純由于隨機因素造成,也可能是因素的不同水平造成,記作S組間。,S組內(nèi)+ S組間=S總,S組間和S組內(nèi)的比值反映了兩種差異所占的比重

7、,該值越大說明因素各個水平引起的差異越顯著,服從F分布,通過F值與其臨界值的比較,推斷各組均值是否相同。,結(jié)論:在0.05水平上培訓(xùn)對銷售業(yè)績的影響不顯著。,平方和/自由度=均方和,檢驗統(tǒng)計量:,設(shè):因素有r個水平,各水平的實驗次數(shù)為nj ,得到樣本數(shù)據(jù)如表,單因素方差分析的一般模型,方差分析步驟,F檢驗,計算各水平均值和總均值,計算檢驗統(tǒng)計量F,計算離差平方和:S,計算均方和: S/自由度,計算水平均值和總均值,2、計算離差平方和,誤差項離差平方和:組內(nèi)變異S組內(nèi),總離差平方和(總變異S總),水平項離差平方和:組間變異S組間,三個離差平方和的關(guān)系為:,三個離差平方和的關(guān)系為:,證明:,3、計

8、算均方和,自由度:觀測值的個數(shù)約束條件數(shù),4、計算檢驗統(tǒng)計量和假設(shè)檢驗,F(r-1,n-r),建立假設(shè),本例r=3。,培訓(xùn)例,水平均值,計算水平均值和總均值,培訓(xùn)例-續(xù),F=3.173.89,接受原假設(shè),培訓(xùn)沒有顯著效果,單因素方差分析過程one-way ANOVA,analyzecompare meansone-way ANVOA,響應(yīng)變量,因素,Contrast對話框:均值多項式比較,例如:4mean1-mean3,Post Hoc對話框:選擇均值多重比較方法,方差相等時可選擇的比較方法,方差不等時可選擇的比較方法,與對照組的配對比較,用t檢驗完成各組均值的配對比較,Option對話框:輸

9、出統(tǒng)計量,描述統(tǒng)計量,固定因素和隨機效應(yīng)的統(tǒng)計量,等方差檢驗,顯示均值圖,培訓(xùn)-銷售業(yè)績SPSS輸出結(jié)果,單因素方差分析例,一DVD廠商希望了解不同年齡段(age group)的消費者對其生產(chǎn)的一種新型DVD的評價(dvdscore) 做單因素方差分析,畫出均值圖,第四組評價最高,第三組評價次高,比較第三組均值與第四組均值是否有顯著差異,一、二組評價較低,五、六組評價最低,比較32歲以下和46歲以上人群是否有顯著差異,用one-way ANOVA 中的contrast選項: 1)mean3-mean4 2)0.5mean1+0.5mean2-0.5mean5-0.5mean6,32歲到45歲的

10、評價無顯著差異,32歲以下和46歲以上消費者的評價無顯著差異,例:某企業(yè)準(zhǔn)備上市一種新型香水,需要進行市場調(diào)研。經(jīng)驗表明除香水氣味外,香水包裝對需求也有很大影響?,F(xiàn)對三種不同的包裝、三種不同香型的香水進行測試,每種組合采用一個不同的市場調(diào)查,調(diào)查結(jié)果見下表。,三、單響應(yīng)變量方差分析以雙變量方差分析為例,雙因素不重復(fù)試驗,兩因素分別為A(包裝)和B(香型),A有n種水平(n=3),B有m種水平(m=3),每種因素組合只有一個樣本值,這樣的實驗稱為不重復(fù)試驗。實驗數(shù)據(jù)建立下表,雙因素不重復(fù)試驗方差分析方法,與單因素方差分析類似,總變異可分成兩個因素的離差平方和及誤差平方和:,方差分析表,結(jié)論:包裝

11、與香型的影響都不顯著,雙因素重復(fù)試驗,兩因素分別為A和B,A有n種水平,B有m種水平,兩種因素不同水平共有mn中組合,在每種因素組合(i,j)下作d次重復(fù)試驗,以減輕誤差的干擾,實驗數(shù)據(jù)建立下表,B,雙因素方差分析符號說明,雙因素分析模型,在雙因素模型中可以進行多種檢驗:,因素A的主效應(yīng)檢驗,因素B的主效應(yīng)檢驗,因素A和因素B的交互作用檢驗,雙因素方差分析表,香水例,Univariate過程,數(shù)據(jù)格式,響應(yīng)變量,因素,協(xié)變量,隨機因素,Model對話框:模型設(shè)定,自定義模型,指定主效應(yīng),指定交互效應(yīng),指定所有兩維交互效應(yīng),指定所有三維交互效應(yīng),指定所有四維交互效應(yīng),本例只有主效應(yīng),選擇分解平方

12、和的方法:,指定模型類型,建立全模型,Contrast對話框:效應(yīng)比較,默認:無效應(yīng)比較,改變效應(yīng)比較設(shè)置,比較因素每個水平的效應(yīng),因素變量每一水平都與參考水平比較:選擇last或first為參考水平,因素每一水平都與其前面?zhèn)€水平比較,因素每一水平都與后續(xù)水平比較,Plots對話框:因變量均數(shù)分布圖,選擇橫坐標(biāo),選擇縱坐標(biāo),散點圖框,Post hoc對話框:多重比較,與one-way ANOVA相同,Save對話框:保存,Option對話框,比較主效應(yīng)均值,指定輸出統(tǒng)計量,效應(yīng)量估計,顯示觀測功效,參數(shù)估計:因變量與自變量的回歸系數(shù)等,等方差檢驗,觀測量均值對方差的圖,擬合度不足的檢驗,香型與

13、包裝方差分析結(jié)果,新食品定價和廣告策略研究,為了確定新食品的定價和廣告策略,某企業(yè)做了一次市場研究:選出24家商場分別以高、中、低三種價格,和高、低兩種廣告策略推銷產(chǎn)品,經(jīng)過一段時間之后統(tǒng)計各家商場的銷售量,并對此作方差分析。,新食品銷售的均值圖,1. 銷售量的價格效應(yīng)較明顯 2. 廣告效應(yīng)較不明顯 3. 交互作用:低價格高廣告的銷量較大,方差分析表,四、協(xié)方差分析,基本思想:在方差分析中引入其它獨立變量,以矯正由于非試驗因素對響應(yīng)變量的影響干擾方差分析的準(zhǔn)確性。 方差分析應(yīng)在“其它條件不變”下實施。但是,這一點有時難以做到。 前例:在研究價格和廣告對新食品銷售的影響時,如果所選擇的商場規(guī)模不

14、同,也會對銷售量產(chǎn)生影響。我們收集了各個參加試驗商場的規(guī)模,做銷售量對商場規(guī)模的散點圖,銷售量對商場規(guī)模散點圖:綠色點-高廣告,紅色點-低廣告,很明顯:做高廣告的商場規(guī)模偏小,低廣告的商場規(guī)模較大。一般來說,規(guī)模大的商場銷量較大,規(guī)模小的商場銷量較小。因此,商場規(guī)模的差異可能會干擾對廣告效應(yīng)的評估。,將Storesiz作為協(xié)變量引入后的方差分析結(jié)果,協(xié)變量調(diào)整后的均值圖,協(xié)變量調(diào)整前的均值圖,廣告效應(yīng)變得明顯了,協(xié)變量調(diào)整前,協(xié)變量調(diào)整后,協(xié)變量的作用機理,例:芬蘭曾有一條法規(guī):只有城市可以從事商業(yè)性賣酒。當(dāng)這條法規(guī)取消時,人們開始擔(dān)心農(nóng)村的交通事故會因此增多。 一些研究者在12個鄉(xiāng)村鎮(zhèn)進行了

15、試驗:其中4個村鎮(zhèn)只允許商店賣酒、4個村鎮(zhèn)商店和飯店都可以賣酒,最后4個村鎮(zhèn)作為對照組,不許賣酒。一年后統(tǒng)計的交通事故數(shù)如表。 對此數(shù)據(jù)進行方差分析,發(fā)現(xiàn)賣酒模式對交通事故影響不顯著。,結(jié)論是否可信?,影響交通事故的其他因素:由于道路狀況、天氣狀況等的差別,有些鄉(xiāng)鎮(zhèn)比另一些鄉(xiāng)鎮(zhèn)更容易發(fā)生交通事故,選取解禁前各鄉(xiāng)鎮(zhèn)年交通事故數(shù)numpre為參考變量,從數(shù)據(jù)表中可以看出,第二組各城鎮(zhèn)在未解禁前事故率就相當(dāng)高,解禁后的事故率相對來說并不很高。,不同城鎮(zhèn)的交通事故數(shù)差異很大(甚至同一試驗組的城鎮(zhèn)之間),原因何在?,accidnum,解禁后事故數(shù)vs解禁前事故數(shù),組間相關(guān),組內(nèi)亦相關(guān),且相關(guān)度更高,剔除

16、協(xié)變量影響后的組間變異與組內(nèi)變異,協(xié)變量調(diào)整后,組間變異增大,組內(nèi)變異減小,均值圖比較,未考慮協(xié)變量,協(xié)變量調(diào)整后,協(xié)變量調(diào)整后,協(xié)變量調(diào)整后,賣酒模式對交通事故數(shù)影響顯著,調(diào)整前調(diào)整后的成對比較,飯店里賣酒對交通事故影響最大,協(xié)方差分析中協(xié)變量的作用,減小組內(nèi)變異 調(diào)整組間變異,bT為X 對Z 回歸的系數(shù),X與Z的協(xié)方差為0時 SST(Xadj)=SST(X),X與Z的組內(nèi)協(xié)方差為0時 SSW(Xadj)=SSW(X),五、多響應(yīng)變量方差分析,解決響應(yīng)變量間的相關(guān)性帶來的影響,與單響應(yīng)變量比較,多響應(yīng)變量方差分析例,廣告策略分析 某一產(chǎn)品做廣告,設(shè)計兩種不同類型的廣告,研究哪種廣告策略更好

17、Hardsell, humorous 隨機抽取各30人分別觀看兩種廣告 調(diào)研問題 likability: 你有多喜歡這個產(chǎn)品? Intnbuy: 你購買此產(chǎn)品的可能性有多大?,分別進行單因素方差分析,多響應(yīng)變量方差分析,本章小結(jié),方差分析:因素不同水平對響應(yīng)變量的影響是否顯著 平方和分解:總平方和=主效應(yīng)+交叉效應(yīng)+殘差平房和 因素影響顯著性檢驗: 原假設(shè)和備擇假設(shè) F=組間變異/組內(nèi)變異,本章小結(jié)-續(xù),方差分析的類型 單因素方差分析 單響應(yīng)變量方差分析 多響應(yīng)變量方差分析 協(xié)方差分析,方差分析過程,多響應(yīng)變量方差分析 若拒絕原假設(shè),各響應(yīng)變量分別進行方差分析及均值比較 因素效應(yīng)顯著性檢驗 如果效應(yīng)顯著,根據(jù)因素水平均值分布圖進一步將這些差異提取出來,這就要作多重均值比較(如配對比較) 當(dāng)存在非實驗因素干擾協(xié)方差分析,多重比較檢驗方法,LSD(Least-significant difference)最小顯著性差異法:用t檢驗完成個組均值間的配對比較。 Duncan多重極差檢驗:將進行比較的各組均值分成幾個有顯著差異的子集。一個子集中均值之間的差異不顯著。 Dunnett法:指定一個組作對照組,其他各組分別與對照組進行配

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負責(zé)。
  • 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時也不承擔(dān)用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

評論

0/150

提交評論