《試驗設(shè)計與數(shù)據(jù)處理》lecture6_第1頁
《試驗設(shè)計與數(shù)據(jù)處理》lecture6_第2頁
《試驗設(shè)計與數(shù)據(jù)處理》lecture6_第3頁
《試驗設(shè)計與數(shù)據(jù)處理》lecture6_第4頁
《試驗設(shè)計與數(shù)據(jù)處理》lecture6_第5頁
已閱讀5頁,還剩6頁未讀, 繼續(xù)免費閱讀

下載本文檔

版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進行舉報或認領(lǐng)

文檔簡介

本文格式為Word版,下載可任意編輯——《試驗設(shè)計與數(shù)據(jù)處理》lecture6Lecture6——方差分析

一、方差分析概述

.方差分析的概念

–在科學(xué)試驗中往往要探討不同試驗條件或處理方法對試驗結(jié)果的影響。尋常是比較不同試驗條件下樣本均值間的差異。

–方差分析是檢驗多組樣本均值間的差異是否具有統(tǒng)計意義的一種方法。

例如:.研究幾種藥物對某種疾病的療效;.農(nóng)業(yè)研究土壤、肥料、日照時間等因素對某種農(nóng)作物產(chǎn)量的影響;.不同飼料對牲畜體重增長的效果等。.方差分析的基本思想

–若被考察的因素對試驗結(jié)果沒有顯著的影響,即所探討的各正態(tài)總體的均值相等,則試驗數(shù)據(jù)的波動完全由隨機誤差引起;

–假使各正態(tài)總體均值不全相等,則說明試驗數(shù)據(jù)的波動除了隨機誤差的影響外,還包含被考察因素效應(yīng)的影響。

–為此,需要構(gòu)造一個適當?shù)慕y(tǒng)計量,來描述數(shù)據(jù)的波動程度。將這個統(tǒng)計量分解為兩部分:

一部分是純隨機誤差造成的影響,另一部分是除隨機誤差的影響外來自于因素效應(yīng)的影響。然后將這兩部分進行比較,假使后者明顯比前者大,就說明因素的效應(yīng)是顯著的。.若方差分析只針對一個因素進行,稱為單因素方差分析。.假使同時針對多個因素進行,稱為多因素分析。在多因素方差分析中,雙因素方差分析里最常見的。.方差分析中進行檢驗假設(shè)的三個假定:–1、各個水平的觀測數(shù)據(jù)必需聽從正態(tài)分布:在水平Ai下的數(shù)據(jù)是來自正態(tài)總體的一個樣本,i=1,2…,r。

–2、方差一致或者叫方差齊性:r個正態(tài)總體的方差相等。–3、隨機性:所有數(shù)據(jù)都相互獨立。

–在上述三個假定條件下,判斷不同正態(tài)總體是否有顯著影響,實際上也就是檢驗具有同方差的正態(tài)總體的均值是否相等。–假使總體的均值相等,可以期望樣本的均值也會很接近:.樣本的均值越接近,推斷總體均值相等的證據(jù)也就越充分;.樣本均值越不同,推斷總體均值不同的證據(jù)就越充分。

.方差分析的假設(shè)檢驗–零假設(shè)H0:m組樣本均值都一致,即μ1=μ2==μm;

–若備擇假設(shè)成立,即H1:mi(i=1,2,……,m)不全相等。.至少有一個總體的均值是不同的;.樣本分別來自均值不同的正態(tài)總體。

.方差分析的目的是要檢驗各個水平的均值μ1,μ2……μm是否相等,實現(xiàn)這個目的的手段是通過方差的比較。

.假使n個總體的均值相等,然希望n個樣本的均值比較接近,事實上,n個樣本的均值愈接近,就愈有證據(jù)得出結(jié)論:總體均值相等,反之,若n個樣本均值的差異愈大,就得出結(jié)論,總體均值不相等。.樣本均值變動性小→支持H0,樣本均值變動性大→支持H1。.方差分析基本原理

–方差分析的關(guān)鍵是對全部數(shù)據(jù)的變異程度進行分解。

–總平均:–試驗總差異:.總平方和

–組內(nèi)平均值:.

(sumofsquaresfortotal)

.表示了各試驗值與總平均值的偏差的平方和;.反映了試驗結(jié)果之間存在的總差異。–認為不同處理組的均值間的區(qū)別基本來源有兩個:

.(1)隨機誤差,如測量誤差造成的差異或個體間的差異,稱為組內(nèi)差異,用變量在各組的均值與該組內(nèi)變量值之偏差平方和的總和表示,記作SSe(sumofsquareforerror)。

.反映了在各水平內(nèi),各試驗值之間的差異程度.由于隨機

誤差的作用產(chǎn)生

.(2)試驗條件,即不同的處理造成的差異,稱為組間差異。用變量在各組的均值與總均值之偏差平方和表示,記作SSA,(sumofsquareforfactorA)

.反映了各組內(nèi)平均值之間的差異程度;

.由于因素A不同水平的不同作用造成的。–三種離差平方和之間關(guān)系:

計算自由度(degreeoffreedom)–總自由度:dfT=n-1–組間自由度:dfA=r-1–組內(nèi)自由度:dfe=n-r

–三者關(guān)系:dfT=dfA+dfe

–組內(nèi)SSe、組間SSa除以各自的自由度(組內(nèi)n-m,組間m-1,其中n為樣本總數(shù),m為組數(shù)),得到其均方MSe和MSa。

–一種狀況是處理沒有作用,即各組樣本均來自同一總體,MSa/MSe≈1。另一種狀況是處理確實有作用,那么,MSa>>MSe。–MSa/MSe比值構(gòu)成F分布,用F值與其臨界值比較,推斷各樣本是否來自一致的總體。

–假使經(jīng)過計算結(jié)果組間均方遠遠大于組內(nèi)均方(MSa>>MSe),F(xiàn)>F0.05(dfa,dfe),p0.05不能拒絕零假設(shè),說明樣本來自一致的正態(tài)總體,處理間無差異。

二、單因素方差分析

.一、建立假設(shè)–方差分析的第一步是建立假設(shè)。針對我們關(guān)心的問題提出原假設(shè)和備擇假設(shè)。

–H0:μ1=μ2=……=μm各正態(tài)總體均數(shù)相等;–H1:μ1,μ2,……,μm各正態(tài)總體不全相等。

–注意:拒絕原假設(shè),只說明至少有兩個總體的均值不相等,并不意味著所有的均值都不相等。

.二、計算水平均值

–令表示第j種水平的樣本均值,則:,式中:xij為第j種水平下

的第i個觀測值,nj第j種水平的觀測值個數(shù)。

–計算總均值(總均值:是所有觀測值的總和除以觀測值的總數(shù))

(注:各個樣本容量相等)

.三、計算離差平方和

–1、總離差平方和SST(SumofSquaresforTotal)

.

–2、誤差項離差平方和(組內(nèi))SSE(SumofSquaresForError)

–3、水平項離差平方和(組間)SSA或SSb(SumofSquaresforfactorA)

–總離差平方和(SST)、誤差項離差平方和(SSE)、水平項離差平方和(SSA)之間的關(guān)系:即:

SST=SSA+SSE–三個平方和的作用

.SST反映全部數(shù)據(jù)總的誤差程度;SSE反映隨機誤差的大?。籗SA反映隨機誤差和系統(tǒng)誤差的大小

.假使原假設(shè)成立,則說明沒有系統(tǒng)誤差,組間平方和SSA除以自由度后的均方與組內(nèi)平方和SSE和除以自由度后的均方差異就不會太大;假使組間均方顯著地大于組內(nèi)均方,說明各水平(總體)之間的差異不僅有隨機誤差,還有系統(tǒng)誤差。

.判斷因素的水平是否對其觀測值有影響,實際上就是比較組間方差與組內(nèi)方差之間差異的大小

.四、計算平均平方

–用離差平方和除以自由度即可得到平均平方

–SST、SSA、SSE之間的自由度存在著如下的關(guān)系:n-r=(r-1)+(n-r)

.五、方差分析表

–F分布與拒絕域

.六、統(tǒng)計結(jié)果分析

–把F值與Fa值比較:

.若FA>F0.01(dfA,dfe),稱因素A對試驗結(jié)果有十分顯著的影響,用“**〞號表示;

.若F0.05(dfA,dfe)<FA<F0.01(dfA,dfe),則因素A對試驗結(jié)果有顯著的影響,用“*〞號表示;.若FA<F0.05(dfA,dfe),則因素A對試驗結(jié)果的影響不顯著。.單因素方差分析應(yīng)用實例

–為考察溫度對某種化工產(chǎn)品得率的影響,選取了五種不同的溫度,在同一溫度下各作三次試驗,試驗數(shù)據(jù)如表。試問溫度對得率有無明顯影響?

–yielddata.正態(tài)性檢驗

–shapiro.test(yield[temperature==\.方差齊性檢驗

–bartlett.test(yield~temperature,data=yielddata)

三、雙因素方差分析

.在大量實際問題中,需要考慮影響試驗數(shù)據(jù)的因素多于一個的情形。例如在化學(xué)合成反應(yīng)中,幾種原料的用量、反應(yīng)時間、溫度的控制等等都可能影響試驗結(jié)果,這就構(gòu)成多因素試驗問題。

.雙因素試驗的方差分析

–探討兩個因素對試驗結(jié)果影響的顯著性,又稱為二元方差分析。根據(jù)每種組合水平上的試驗次數(shù),可以將其分為無重復(fù)試驗和重復(fù)試驗的方差分析。.雙因素方差分析的基本假定

–每個總體都聽從正態(tài)分布.對于因素的每一個水平,其觀測值是來自正態(tài)分布總體的簡單隨機樣本

–各個總體的方差必需一致.對于各組觀測數(shù)據(jù),是從具有一致方差的總體中抽取的–觀測值是獨立的。

雙因素無重復(fù)試驗的方差分析–數(shù)據(jù)結(jié)構(gòu)

–分析步驟–1)提出假設(shè)

.對行因素提出的假設(shè)為:.H0:u1=u2=…=ui=…=uk(ui為第i個水平的均值);.H1:ui(i=1,2,…,k)不全相等

.對列因素提出的假設(shè)為:.H0:m1=m2=…=mj=…=mr(mj為第j個水平的均值).H1:mj(j=1,2,…,r)不全相等–2)構(gòu)造檢驗的統(tǒng)計量.總誤差平方和

.因素A引起離差的平方和:

.因素B引起離差的平方和:

.誤差平方和:

.計算自由度

–SSA的自由度:dfA=r-1–SSB的自由度:dfB=s-1–SSe的自由度:dfe=(r-1)(s-1)–SST的自由度:dfT=n-1=rs-1–dfT=dfA+dfB+dfe.計算均方

.F檢驗

–3)統(tǒng)計決策.FA聽從自由度為(dfA,dfe)的F分布;.對于給定的顯著性水平a,查F分布表:Fa(dfA,dfe),F(xiàn)a(dfB,dfe).若FA>Fa(dfA,dfe),則因素A對試驗結(jié)果有顯著影響,否則無顯著影響;.若FB>Fa(dfB,dfe),則因素B對試驗結(jié)果有顯著影響,否則無顯著影響;–(1)雙因素重復(fù)試驗方差分析試驗表

–(2)雙因素重復(fù)試驗方差分析的基本步驟.①計算平均值

.總平均:

.任一組合水平(Ai,Bj)上:

.Ai水平日:

.Bj水平日:.②計算離差平方和–總離差平方和:

–因素A引起離差的平方和:

–因素B引起離差的平方和:

–交互作用A×B引起離差的平方和:

.③計算自由度

–SSA的自由度:dfA=r-1–SSB的自由度:dfB=s-1–SSA×B的自由度:dfA×B=(r-1)(s-1)–SSe的自由度:dfe=rs(c-1)

–SST的自由度:dfT=n-1=rsc-1–dfT=dfA+dfB+dfA×B+dfe.④計算均方

.⑤F檢驗

–若FA>Fa(dfA,dfe),則認為因素A對試驗結(jié)果有顯著影響,否則無顯著影響;–若FB>Fa(dfB,dfe),則認為因素B對試驗結(jié)果有顯著影響,否則無顯著影響;–若FA×B>Fa(dfA×B,dfe),則認為交互作用A×B對試驗結(jié)果有顯著影響,否則無

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負責。
  • 6. 下載文件中如有侵權(quán)或不適當內(nèi)容,請與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

評論

0/150

提交評論