統(tǒng)計(jì)培訓(xùn)教材31 方差分析.ppt_第1頁(yè)
統(tǒng)計(jì)培訓(xùn)教材31 方差分析.ppt_第2頁(yè)
統(tǒng)計(jì)培訓(xùn)教材31 方差分析.ppt_第3頁(yè)
統(tǒng)計(jì)培訓(xùn)教材31 方差分析.ppt_第4頁(yè)
統(tǒng)計(jì)培訓(xùn)教材31 方差分析.ppt_第5頁(yè)
已閱讀5頁(yè),還剩47頁(yè)未讀, 繼續(xù)免費(fèi)閱讀

下載本文檔

版權(quán)說(shuō)明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請(qǐng)進(jìn)行舉報(bào)或認(rèn)領(lǐng)

文檔簡(jiǎn)介

1、方差分析(ANOVA),主要內(nèi)容,變異 方差分析 假設(shè)檢驗(yàn) 假設(shè) 模型 ANOVA 模型 單因子方差分析(One-Way ANOVA) 雙因子方差分析(Two-Way ANOVA) 多因子方差分析(Multi-Factor ANOVA),變異的類型,固有變異 由許多不可避免的小因素累積而成的變異 通常也叫噪聲( noise) 特殊變異 a) 不適當(dāng)?shù)卣{(diào)教機(jī)器 b) 操作錯(cuò)誤 c) 原材料有缺陷,方差分析(ANOVA),方差分析 (ANOVA) 是 R.A. Fisher 在進(jìn)行農(nóng)業(yè)試驗(yàn)時(shí)發(fā)展起來(lái)的對(duì)實(shí)驗(yàn)數(shù)據(jù)的變異性進(jìn)行分析的一套統(tǒng)計(jì)方法。 方差分析做法:通過(guò)試驗(yàn),以觀察某一種或多種因素的變化,

2、對(duì)試驗(yàn)結(jié)果的觀察數(shù)值是否有顯著影響,從而選取最優(yōu)方案。 例:在化工生產(chǎn)中,影響結(jié)果的因素有:配方、設(shè)備、溫度、壓力、催化劑、操作人員等。需要通過(guò)觀察或試驗(yàn)判斷哪些因素是重要的,有顯著影響的,哪些因素是不重要的,沒(méi)有顯著影響的。,方差分析(ANOVA),試驗(yàn)中考慮的因素只有一個(gè),即只有一個(gè)因素在變,其他因素保持不變,這種試驗(yàn)稱為單因素方差分析 (One-Way ANOVA)。 試驗(yàn)中考慮的因素有兩個(gè),這種試驗(yàn)稱為雙因素方差分析(Two-Way ANOVA)。 試驗(yàn)中考慮的因素有 k 個(gè),這種試驗(yàn)稱為 k 因素方差分析(k-Way ANOVA)。,ANOVA 的應(yīng)用,因素所處的狀態(tài),稱為水平(Le

3、vel)。例如,溫度是一個(gè)因素,可在50, 60, 70三個(gè)水平下做試驗(yàn)。 ANOVA 可用于 估計(jì)每個(gè)變異來(lái)源對(duì)總變異的貢獻(xiàn)。 明確各效應(yīng)的顯著性 估計(jì)過(guò)程中的隨機(jī)誤差或噪聲 計(jì)算方差的成份,ANOVA 假設(shè)檢驗(yàn),H0 :1 = 2 = = r 所有總體均值相等 H1 :至少有兩個(gè)總體的均值不等 ANOVA 通過(guò)比較組間差和組內(nèi)差來(lái)進(jìn)行F-檢驗(yàn): 如果 ,則拒絕原假設(shè)。.,ANOVA 假設(shè)檢驗(yàn),N(1,1),N(2,2),N(3,3),N(4,4),N(groups,between),ANOVA 假設(shè),觀察值相互獨(dú)立. 各水平的數(shù)據(jù)服從正態(tài)分布,即 因子水平 i N(i,i) 各水平的方差相

4、同,即 1 = 2 = = r,ANOVA 模型,固定效應(yīng)模型 (ANOVA I) 因子水平是指定的 相關(guān)結(jié)論只能對(duì)指定的因子水平而言 隨機(jī)效應(yīng)模型 (ANOVA II) 因子水平是隨機(jī)抽取的 結(jié)論對(duì)整個(gè)處理總體有效 混合效應(yīng)模型 (ANOVA III) 有些因子是固定的,有些因子是隨機(jī)的,ANOVA 模型,一個(gè) kWay ANOVA 模型,是指試驗(yàn)中包含有k 個(gè)因素. kWay ANOVA I :k 個(gè)因素;所有因素效應(yīng)固定 kWay ANOVA II: k 個(gè)因素;所有因素效應(yīng)隨機(jī) kWay ANOVA III: k 個(gè)因素;有些因素效應(yīng)固定,有些 因素效應(yīng)隨機(jī) 注意:當(dāng) k 大于等于 2

5、 時(shí),還要考慮各因素之間的相互作用(或交互效應(yīng))(Interaction).,我們要觀察的一個(gè) input 變量(因子)有多個(gè)樣本時(shí), 我們實(shí)際上在實(shí)施 單因子實(shí)驗(yàn) (Single Factor Experiment). 我們要分析對(duì)象的 因子是否有水平間的差異 確定3個(gè)供應(yīng)商的平均交貨期是否有差異 確定某個(gè)機(jī)器的設(shè)定值在5個(gè)水平間變化時(shí),零件的尺寸是否不同 現(xiàn)在開始做第一次實(shí)驗(yàn)! 觀察.,One way ANOVA的概念(1) 概要,One ANOVA的概念(2) 例題,考慮如下情景:一個(gè)產(chǎn)品開發(fā)工程師要研究某個(gè)電阻焊接系統(tǒng)中5種不同的電流設(shè)置對(duì)焊接強(qiáng)度的影響 她要研究的電流范圍為15-19

6、安培。她將調(diào)查5個(gè)水平的輸入變量(因子): 15A, 16A, 17A, 18A 和 19A。她將對(duì)每個(gè)水平進(jìn)行5次實(shí)驗(yàn) 輸出: 焊接強(qiáng)度 輸入: 電流 這是一個(gè)具有5個(gè)水平的單因子實(shí)驗(yàn)(電流) 該實(shí)驗(yàn)的結(jié)果參考下頁(yè)., ? ?,One ANOVA的概念(3) 例題,存在電流對(duì)焊接強(qiáng)度的影響嗎?,對(duì)于這個(gè)設(shè)備使用哪個(gè)電流,你的結(jié)論是什么?為什么?,輸入結(jié)果DATA的 design matrix同下. 實(shí)習(xí): 打開窗口 Mont52.mtw 制作各列數(shù)據(jù)的 dotplot . 使用對(duì)所有變量相同的格式 (SCALE)!,One ANOVA的概念(3) 例題,各均值的 95% 置信區(qū)間(CI)如下

7、. DATA Stack 后 StatANOVAInterval Plot,對(duì)電流和焊接強(qiáng)度的關(guān)系做什么結(jié)論? 這結(jié)論的置信度是怎樣?,One way ANOVA的概念(3) 例題,設(shè)定假設(shè)!,One ANOVA的概念(4) 假設(shè),Ha: 至少有一個(gè)水平產(chǎn)生不同過(guò)程,H0: 數(shù)據(jù)只描述一個(gè)過(guò)程的自然散布,你認(rèn)為答案是什么?為什么?,One ANOVA的概念(5) 假設(shè),此設(shè)計(jì)的數(shù)學(xué)模型是:,Ho 假設(shè)處理項(xiàng)是零,數(shù)學(xué)模型假設(shè),常規(guī)假設(shè),Yti = +t+ti 其中: yti=來(lái)自處理t的單個(gè)響應(yīng) =總平均值 t=處理t ti=隨機(jī)誤差,One ANOVA的概念(6) 變量選定,輸入變量作為一個(gè)

8、因子。 在單因子設(shè)計(jì)中,因子被當(dāng)作特征變量處理,即使它可能是間隔值或比率。 如果因子自然為連續(xù)型的,可以把它分類成子群。 - 例如,我可以采用低和高來(lái)度量生產(chǎn)線的壓力值。 - 我們可以作中值分離(Median Split)來(lái)把因子分成兩個(gè)水平:低和高。 - 對(duì)于我們的例子,因?yàn)殡娏魇沁B續(xù)型變量,我們把它分成5個(gè)等級(jí)。 輸出一般以間隔值或比率范圍來(lái)度量(合格率,溫度,電壓,等等)輸出變量可以是分離型或間隔/比率變量,ANOVA的原理 (1) 總變動(dòng),因子A的水平是I個(gè),各水平的反復(fù)數(shù)都是m次,則數(shù)據(jù)矩陣 排列成下面的樣子,總均值 是用右邊的公式求.,利用各個(gè)DATA 和總均值 把總均值 分解為兩

9、個(gè), 同下表示. 左邊和右邊平方時(shí)同下.,ANOVA的原理 (2) 總變動(dòng),上面的第三項(xiàng)變?yōu)槿缦?,SS(total) SS(error) SS(factor),同樣第8頁(yè)式從寫如下,這意義的略寫SS(Sum of Squares)來(lái)表示.,ANOVA的原理 (3) 總變動(dòng),SS(total)的自由度 是,SS(factor)的自由度 是,SS(error)的自由度 是,因此,ANOVA的原理 (4) 自由度,在一個(gè)系統(tǒng)中不影響其他變量能夠獨(dú)立移動(dòng)的數(shù) Ex) a*b*c = 4 這式中變量的自由度是 2 . 假如 a,b定為 1,2, c必須是 2 . 即能夠自然的移動(dòng)的變量。,自由度是?,

10、自由度的計(jì)算,ANOVA的原理 (5) 方差分析表,方差分析表的制作,對(duì)錯(cuò)誤的均值平方因子,利用A的均值平方的大小 觀察 A效果的大小. F越大 A效果越大. ( 利用F 分布確認(rèn) P-value),ANOVA的原理 (6) F分布,F分布的參考,自由度 k1,k2的變量的 F值的 F(k1,k2:)按 的大小 占有面積(發(fā)生概率).,(顯著水平),F(k1,k2),F(k1,k2: ),F-分布,6,5,4,3,2,1,0,0,.,7,0,.,6,0,.,5,0,.,4,0,.,3,0,.,2,0,.,1,0,.,0,S,c,o,r,e,s,P,r,o,b,10%,1%,5%,Exercis

11、e,某個(gè) coating 工程認(rèn)為 反應(yīng)溫度對(duì)生產(chǎn)的 產(chǎn)品的強(qiáng)度有影響, 所以對(duì)反應(yīng)溫度變化強(qiáng)度有什么變化, 還有溫度在什么水平時(shí)強(qiáng)度最好,進(jìn)行了實(shí)驗(yàn). 反應(yīng)溫度設(shè)為因子水平,各溫度反復(fù)3回,總共12回實(shí)驗(yàn)數(shù)據(jù)隨機(jī)整理. 這結(jié)果同下表. 制作方差分析表(ANOVA table) . (參考Excel sheet.),ANOVA的原理 (7) 例題,ANOVA table,ANOVA的原理 (8) 例題,F分布表中 F是(3,8:0.05) = 4.07, F(3,8:0.01)=7.59 . 那么 A是顯著水平 1%中是否采用零假設(shè)? 還是推翻? - 要推翻.,ANOVA的原理 (9) 統(tǒng)計(jì)的

12、假定,輸出的總體方差在給定因子所有水平上都相等(方差均一性( Test for Equal Variance )。 我們可以用Stat ANOVA Test for Equal Variance程序來(lái)檢驗(yàn)這個(gè)假設(shè)。 響應(yīng)均值是獨(dú)立的,并服從正態(tài)分布。 - 如果使用隨機(jī)化和適當(dāng)?shù)臉颖緮?shù),這個(gè)假設(shè)一般有效。 - 警告:在化學(xué)過(guò)程中,均值相關(guān)的風(fēng)險(xiǎn)很高,應(yīng)永遠(yuǎn)考慮隨機(jī)化。 殘差(數(shù)學(xué)模型的誤差)是獨(dú)立的,其分布是均值=0,方差為恒量的正態(tài)分布。,單一因子實(shí)驗(yàn)分析,實(shí)驗(yàn)結(jié)果移動(dòng)到 MINITAB Worksheet. 數(shù)據(jù)有沒(méi)有異常點(diǎn)利用管理圖進(jìn)行確認(rèn). (穩(wěn)定性分析) 利用StatANOVATest

13、 for Equal Variance 進(jìn)行等方差檢驗(yàn). 方差同一時(shí)實(shí)施(p-value ANOVAOne-way 進(jìn)行分析 . 所有的數(shù)據(jù)在1列時(shí) (Stacked) : One-way 按水平別數(shù)據(jù)分幾列時(shí)(Unstacked) :采用 One-way(Unstacked.) . 解釋F-ratio. F-value 高 p-value 顯著水平時(shí)(一般 5-10%) 推翻零假設(shè)(Ho) . 推翻零假設(shè)時(shí), 利用StatANOVAMain Effects Plot 或StatANOVAInterval Plot 對(duì)均值差異利用區(qū)間圖說(shuō)明. 利用Minitab 的 Anova 視窗中的 殘差

14、項(xiàng)目(殘差 Plot) 對(duì)殘差實(shí)施評(píng)價(jià). 為測(cè)試實(shí)際的顯著性,對(duì)有影響的 Epsilon-Squared 進(jìn)行計(jì)算. 根據(jù)分析結(jié)果找出方案.,應(yīng)用MINITAB分析(1) 分析順序,零假設(shè) (Ho): 3名作業(yè)者刷漆厚度相同. 備擇假設(shè)(Ha): 作業(yè)者中至少有一名刷的厚度與其他作業(yè)者刷的厚度不同(或大或小).,應(yīng)用MINITAB分析(1) 老板的思考,是誰(shuí)刷漆刷的這么厚? Bob? Jane? Walt? 一定要查找出來(lái)! (顯著水平設(shè)為 5%),設(shè)置假設(shè),按照下列樣式在Minitab中輸入數(shù)據(jù),打開ANOVA.MPJ的 (3 Level ANOVA )worksheet,BobJaneWa

15、lt 25.296926.005628.4268 26.057825.940027.5085 24.070026.006327.5825 24.819926.435627.4018 25.985125.992724.9209 .,應(yīng)用MINITAB分析(2) 輸入數(shù)據(jù),1、判信,2、判量,參考MSA章節(jié),參考抽樣與樣本大小章節(jié),應(yīng)用MINITAB分析(3) 穩(wěn)定性分析,目的:確認(rèn)各水平數(shù)據(jù)中是否有異常現(xiàn)象(逃逸點(diǎn)、不隨機(jī)等). 路徑:Stat- Control Chart(參考下圖),3、判異,應(yīng)用MINITAB分析(3) 穩(wěn)定性分析,輸出結(jié)果,結(jié)論 各水平中的數(shù)據(jù)沒(méi)發(fā)現(xiàn)有異常點(diǎn), 可繼續(xù)往后

16、分析,應(yīng)用MINITAB分析(4) 正態(tài)性分析,目的:確認(rèn)各水平數(shù)據(jù)是否服從正態(tài)分布. 路徑:Stat- Basic Statistics - Normality Test(參考下圖),4、判形,應(yīng)用MINITAB分析(4) 正態(tài)性分析,輸出結(jié)果,結(jié)論 各水平中的數(shù)據(jù)都服從正態(tài)分布, 可繼續(xù)往后分析,應(yīng)用MINITAB分析(5) 等方差檢驗(yàn),目的:確認(rèn)各水平數(shù)據(jù)之間方差是否相等. 數(shù)據(jù)堆棧:路徑:Data- Stack - Columns(參考下圖),5、判散,應(yīng)用MINITAB分析(5) 等方差檢驗(yàn),等方差檢驗(yàn) 路徑: Stat- ANOVA - Test for Equal Varianc

17、es(參考下圖),P值大于0.05, 輸出結(jié)果, 結(jié)論:故3個(gè)人所油漆的厚度數(shù)據(jù)方差相等,應(yīng)用MINITAB分析(5) 等方差檢驗(yàn),應(yīng)用MINITAB分析(6) 均值檢驗(yàn),目的:確認(rèn)各水平數(shù)據(jù)集所對(duì)應(yīng)的總體均值是否相等. 路徑:(堆棧型)Stat- ANOVA - One-Way(參考左下圖) (非堆棧型)Stat- ANOVA - One-Way(Unstacked),6、判中,應(yīng)用MINITAB分析(6) 均值檢驗(yàn),應(yīng)用MINITAB分析(6) 均值檢驗(yàn),均值檢驗(yàn)輸出結(jié)果,均值檢驗(yàn)結(jié)論 各水平數(shù)據(jù)集所對(duì)應(yīng)的總體之間的均值至少有一個(gè)不相等,One-way ANOVA: Bob, Jane,

18、Walt Source DF SS MS F P Factor 2 80.386 40.193 44.76 0.000 Error 87 78.116 0.898 Total 89 158.502 S = 0.9476 R-Sq = 50.72% R-Sq(adj) = 49.58%,P 值小于顯著水平 5% 時(shí), 得到至少有一個(gè)總體均值與其他總體均值不同的結(jié)論. (推翻零假設(shè)) 這時(shí),推翻所有總體均值相同的零假設(shè)(Ho ) - 即至少有一個(gè)均值不同. 因隨機(jī)現(xiàn)象得到這樣大的F-值, 實(shí)際上其概率不足 1/10,000. 這與拋硬幣時(shí), 10次連續(xù)相同的情況是相同的.,群間方差與群內(nèi)方差相近時(shí)

19、, F值接近1 . 本例中, F-值很大.,子群大小相同時(shí)共有標(biāo)準(zhǔn)差,應(yīng)用MINITAB分析(7) 殘差分析,目的:二次檢驗(yàn)前面的分析是否有不可信的證據(jù)(殘差有異?,F(xiàn)象) 路徑: Stat- ANOVA - One-Way點(diǎn)擊Graph -點(diǎn)Four in one,7、判差,應(yīng)用MINITAB分析(7) 殘差分析,殘差輸出結(jié)果:,殘差分析結(jié)論:沒(méi)有足夠的證據(jù)證明其殘差分析有異常,主效果圖、箱圖及區(qū)間圖,應(yīng)用MINITAB分析(8) Plots,8、附圖,主效果圖及 箱圖,應(yīng)用MINITAB分析(8) Plots,StatANOVAMain Effects Plot,選擇GraphBoxplot,Interval Plot (95% 置信區(qū)間),區(qū)間圖,應(yīng)用MINITAB分析(8) Plots,Epsilon-Squared雖然是一個(gè)有爭(zhēng)議的統(tǒng)計(jì)量, 但其結(jié)果提供實(shí)質(zhì)性的顯著性情報(bào). Epsilon-Squared 根據(jù)適當(dāng)?shù)?i

溫馨提示

  • 1. 本站所有資源如無(wú)特殊說(shuō)明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請(qǐng)下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請(qǐng)聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁(yè)內(nèi)容里面會(huì)有圖紙預(yù)覽,若沒(méi)有圖紙預(yù)覽就沒(méi)有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫(kù)網(wǎng)僅提供信息存儲(chǔ)空間,僅對(duì)用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對(duì)用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對(duì)任何下載內(nèi)容負(fù)責(zé)。
  • 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請(qǐng)與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶因使用這些下載資源對(duì)自己和他人造成任何形式的傷害或損失。

評(píng)論

0/150

提交評(píng)論