試驗(yàn)的方差分析_第1頁(yè)
試驗(yàn)的方差分析_第2頁(yè)
試驗(yàn)的方差分析_第3頁(yè)
試驗(yàn)的方差分析_第4頁(yè)
試驗(yàn)的方差分析_第5頁(yè)
已閱讀5頁(yè),還剩61頁(yè)未讀, 繼續(xù)免費(fèi)閱讀

下載本文檔

版權(quán)說(shuō)明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請(qǐng)進(jìn)行舉報(bào)或認(rèn)領(lǐng)

文檔簡(jiǎn)介

第2章試驗(yàn)的方差分析

問(wèn)題的提出:先看一個(gè)例子:考察溫度對(duì)某一化工廠產(chǎn)品的得率的影響,選了五種不同的溫度??偲骄寐?89.6%要分析溫度的變化對(duì)得率的影響從平均得率來(lái)看,溫度對(duì)得率的影響?1)同一溫度下得率并不完全一樣,產(chǎn)生這種差異的原因是由于試驗(yàn)過(guò)程中各種偶然性因素的干擾及測(cè)量誤差等所致,這一類誤差統(tǒng)稱為試驗(yàn)誤差;2)兩種溫度的得率在不同的試驗(yàn)中的傾向有所差別。如65oC與70oC相比較,第一次65oC比70oC好,而后二次70oC比65oC好。產(chǎn)生這種矛盾的現(xiàn)象也是由于試驗(yàn)誤差的干擾。由于試驗(yàn)誤差的存在,對(duì)于不同溫度下得率的差異自然要提出疑問(wèn),這差異是試驗(yàn)誤差造成的,還是溫度的影響呢?1)由于溫度的不同引起得率的差異叫做條件變差;例中的全部15個(gè)數(shù)據(jù),參差不齊,它們的差異叫做總變差(或總離差)。產(chǎn)生總變差的原因一是試驗(yàn)誤差,一是條件變差。2)方差分析解決這類問(wèn)題的思想是:a.由數(shù)據(jù)的總變差中分出試驗(yàn)誤差和條件變差,并賦予它們的數(shù)量表示;b.用條件變差和試驗(yàn)誤差在一定意義下進(jìn)行比較,如兩者相差不大,說(shuō)明條件的變化對(duì)指標(biāo)影響不大;反之,則說(shuō)明條件的變化影響是很大的,不可忽視;c.選擇較好的工藝條件或確定進(jìn)一步試驗(yàn)的方向;變差的數(shù)量表示:有n個(gè)參差不齊的數(shù)據(jù)x1,x2,…,xn,它們之間的差異稱為變差。如何給變差一個(gè)數(shù)量表示呢?1)一個(gè)最直觀的想法是用這n個(gè)數(shù)中最大值與最小值之差,即極差來(lái)表達(dá),用R記之;2)變差平方和,以S記之。S是每個(gè)數(shù)據(jù)離平均值有多遠(yuǎn)的一個(gè)測(cè)度,它越大表示數(shù)據(jù)間的差異越大。對(duì)變差平方和的進(jìn)一步討論(1):例:測(cè)得某高爐的六爐鐵水含碳量為:4.59,4.44,4.53,4.52,4.72,4.55,求其變差平方和。對(duì)變差平方和的進(jìn)一步討論(2):我們看到S的計(jì)算是比較麻煩的,原因是計(jì)算x時(shí)有效位數(shù)增加了,因而計(jì)算平方時(shí)工作量就大大增加。另外,在計(jì)算x時(shí)由于除不盡而四舍五入,在計(jì)算S時(shí),累計(jì)誤差較大。為此常用以下公式:對(duì)于前面的例子自由度的提出(1):例2:在上例的基礎(chǔ)上在同樣的工藝條件下又測(cè)了四爐鐵水,它們是:4.60,4.42,4.68,4.54,加上原來(lái)的六爐共十爐,求其變方和。自由度的提出(2):平均數(shù)與過(guò)去的結(jié)果是相近的,但平方和是顯著地變大了。我們要設(shè)法消除數(shù)據(jù)個(gè)數(shù)的多少給平方和帶來(lái)的影響。一個(gè)直觀的想法是用平方和除以相應(yīng)的項(xiàng)數(shù),但從數(shù)學(xué)理論上推知這不是一個(gè)最好的辦法,而應(yīng)把項(xiàng)數(shù)加以修正,這個(gè)修正的數(shù)就叫做自由度。自由度的提出(3):設(shè)有n個(gè)數(shù)y1,y2,…,yn,它們的平方和的自由度是多少呢?這就看{yi}之間有沒有線性約束關(guān)系,如果有m個(gè)(0<m<n)線性約束方程a11y1+a12y2+…+a1nyn=0a21y1+a22y2+…+a2nyn=0…am1y1+am2y2+…+amnyn=0并且這m個(gè)方程相互獨(dú)立,即方程系數(shù)矩陣的秩等于m,則S的自由度是n-m.自由度的提出(4):根據(jù)這個(gè)定義,如令yi=xi-(i=1,2,…,n)則顯然{yi}之間有一個(gè)線性約束關(guān)系,即即m=1,a11=a12=…=a1n=1所以變差平方和的自由度=n-m=n-1均方的概念:平均平方和(簡(jiǎn)稱均方)等于變差平方和除以相應(yīng)的自由度f(wàn).平均平方和以MS表示,它的開方叫做均方差對(duì)例1、MS=0.043483/5=0.0086966,均方差為0.09326對(duì)例2、MS=0.07949/9=0.0088322,均方差為0.09398我們看到六爐和十爐的MS是很相近的,這與工藝條件相同是吻合的,說(shuō)明用MS反映波動(dòng)的大小是更為合理的。一.方差分析的兩類誤差:1.隨機(jī)誤差:因素的同一水平(總體)下,樣本各觀察值之間的差異比如,同一溫度下產(chǎn)品的得率是不同的這種差異可以看成是隨機(jī)因素的影響,稱為隨機(jī)誤差

2.

系統(tǒng)誤差:因素的不同水平(不同總體)下,各觀察值之間的差異

比如,不同溫度之間的產(chǎn)品得率之間的差異

這種差異可能是由于抽樣的隨機(jī)性所造成的,也可能是由于溫度差異所造成的,后者所形成的誤差是由系統(tǒng)性因素造成的,稱為系統(tǒng)誤差二.方差分析的兩類方差:1.數(shù)據(jù)的誤差用平方和(sumofsquares)表示,稱為方差2.組內(nèi)方差(withingroups)因素的同一水平(同一個(gè)總體)下樣本數(shù)據(jù)的方差比如,同一溫度下產(chǎn)品得率的方差組內(nèi)方差只包含隨機(jī)誤差3.組間方差(betweengroups)因素的不同水平(不同總體)下各樣本之間的方差比如,不同溫度下產(chǎn)品得率之間的方差組間方差既包括隨機(jī)誤差,也包括系統(tǒng)誤差三.方差的比較:1.若不同溫度對(duì)產(chǎn)品得率沒有影響,則組間誤差中只包含隨機(jī)誤差,沒有系統(tǒng)誤差。這時(shí),組間誤差與組內(nèi)誤差經(jīng)過(guò)平均后的數(shù)值就應(yīng)該很接近,它們的比值就會(huì)接近1;2.若不同溫度對(duì)產(chǎn)品得率有影響,在組間誤差中除了包含隨機(jī)誤差外,還會(huì)包含有系統(tǒng)誤差,這時(shí)組間誤差平均后的數(shù)值就會(huì)大于組內(nèi)誤差平均后的數(shù)值,它們之間的比值就會(huì)大于1;3.當(dāng)這個(gè)比值大到某種程度時(shí),就可以說(shuō)不同水平之間存在著顯著差異,也就是自變量對(duì)因變量有影響。判斷溫度對(duì)產(chǎn)品得率是否有顯著影響,實(shí)際上也就是檢驗(yàn)產(chǎn)品得率的差異主要是由于什么原因所引起的。如果這種差異主要是系統(tǒng)誤差,說(shuō)明不同溫度對(duì)產(chǎn)品得率有顯著影響。四.方差的基本假定:1.每個(gè)總體都應(yīng)服從正態(tài)分布對(duì)于因素的每一個(gè)水平,其觀察值是來(lái)自服從正態(tài)分布總體的簡(jiǎn)單隨機(jī)樣本比如,每個(gè)溫度下產(chǎn)品的得率必需服從正態(tài)分布2.各個(gè)總體的方差必須相同各組觀察數(shù)據(jù)是從具有相同方差的總體中抽取的比如,五種溫度下產(chǎn)品的得率方差都相等3.觀察值是獨(dú)立的比如,每個(gè)溫度下產(chǎn)品的得率與其他溫度下產(chǎn)品的得率獨(dú)立2.1單因素試驗(yàn)的方差分析

(one-way

analysis

of

variance)2.1.1單因素試驗(yàn)方差分析基本問(wèn)題(1)目的:檢驗(yàn)一個(gè)因素對(duì)試驗(yàn)結(jié)果的影響是否顯著性(2)基本命題:設(shè)某單因素A有r種水平:A1,A2,…,Ar,在每種水平下的試驗(yàn)結(jié)果服從正態(tài)分布在各水平下分別做了ni(i=1,2,…,r)次試驗(yàn)判斷因素A對(duì)試驗(yàn)結(jié)果是否有顯著影響

(3)單因素試驗(yàn)數(shù)據(jù)表試驗(yàn)次數(shù)A1A2…Ai…Ar1x11x21…xi1…xr12x12x22…xi2…xr2…………………jx1jx2j…xij…xrj…………………nix1n1x2n2…xini…xrnr2.1.2單因素試驗(yàn)方差分析基本步驟(1)計(jì)算平均值組內(nèi)平均值:

總平均:(2)計(jì)算離差平方和①總離差平方和SST(sumofsquaresfortotal)

表示了各試驗(yàn)值與總平均值的偏差的平方和反映了試驗(yàn)結(jié)果之間存在的總差異②組間離差平方和SSA(sumofsquareforfactorA)

反映了各組內(nèi)平均值之間的差異程度由于因素A不同水平的不同作用造成的③組內(nèi)離差平方和SSe

(sumofsquareforerror)反映了在各水平內(nèi),各試驗(yàn)值之間的差異程度由于隨機(jī)誤差的作用產(chǎn)生三種離差平方和之間關(guān)系:(3)計(jì)算自由度(degreeoffreedom)總自由度:dfT=n-1組間自由度:dfA

=r-1組內(nèi)自由度:dfe

=n-r

三者關(guān)系:dfT=dfA

+dfe(4)計(jì)算平均平方均方=離差平方和除以對(duì)應(yīng)的自由度MSA——組間均方MSe——組內(nèi)均方/誤差的均方(5)F檢驗(yàn)服從自由度為(dfA,dfe)的F分布(Fdistribution)對(duì)于給定的顯著性水平

,從F分布表查得臨界值F

(dfA,dfe)

如果FA

>F

(dfA,dfe)

,則認(rèn)為因素A對(duì)試驗(yàn)結(jié)果有顯著影響,否則認(rèn)為因素A對(duì)試驗(yàn)結(jié)果沒有顯著影響(6)方差分析表若FA

>F0.01(dfA,dfe)

,稱因素A對(duì)試驗(yàn)結(jié)果有非常顯著的影響,用“**”號(hào)表示;若F0.05(dfA,dfe)

FA

<F0.01(dfA,dfe)

,則因素A對(duì)試驗(yàn)結(jié)果有顯著的影響,用“*”號(hào)表示;若FA

<F0.05(dfA,dfe)

,則因素A對(duì)試驗(yàn)結(jié)果的影響不顯著單因素試驗(yàn)的方差分析表差異源SSdfMSF顯著性組間(因素A)SSAr-1MSA=SSA/(r-1)MSA/MSe組內(nèi)(誤差)SSen-rMSe=SSe/(n-r)總和SSTn-1例2-1:(單因素的方差分析)人造纖維的抗拉強(qiáng)度是否受摻入其中的棉花的百分比的影響是有疑問(wèn)的?,F(xiàn)確定棉花百分比的5個(gè)水平:15%,20%,25%,30%,35%。每個(gè)水平中測(cè)5個(gè)抗拉強(qiáng)度的值,列于下表。問(wèn):抗拉強(qiáng)度是否受摻入棉花百分比的影響(α=0.01)?

解:(1)計(jì)算平均值

依題意,本例為單因素試驗(yàn)的方差分析,單因素為棉花的百分比,它有5種水平,即r=5,在每種水平下做了5次試驗(yàn),故ni=5(i=1,2,…5),總試驗(yàn)次數(shù)n=25。有關(guān)平均值的計(jì)算見表3-1棉花的百分比抗拉強(qiáng)度觀察值試驗(yàn)次數(shù)ni組內(nèi)和Ti組內(nèi)平均

總平均123451577151195499.81520121712191857715.425141818191958817.6301925221923510821.63571011151155410.8表3-1例3-1計(jì)算表(2)計(jì)算離差平方和(3)計(jì)算自由度(4)計(jì)算均方(5)F檢驗(yàn)說(shuō)明棉花的百分比對(duì)人造纖維的抗拉強(qiáng)度有影響。最后將有關(guān)計(jì)算結(jié)果列于方差分析表中。2.2雙因素試驗(yàn)的方差分析1.分析兩個(gè)因素(行因素Row和列因素Column)對(duì)試驗(yàn)結(jié)果的影響2.如果兩個(gè)因素對(duì)試驗(yàn)結(jié)果的影響是相互獨(dú)立的,分別判斷行因素和列因素對(duì)試驗(yàn)數(shù)據(jù)的影響,這時(shí)的雙因素方差分析稱為無(wú)交互作用的雙因素方差分析或無(wú)重復(fù)雙因素方差分析(Two-factorwithoutreplication)3.如果除了行因素和列因素對(duì)試驗(yàn)數(shù)據(jù)的單獨(dú)影響外,兩個(gè)因素的搭配還會(huì)對(duì)結(jié)果產(chǎn)生一種新的影響,這時(shí)的雙因素方差分析稱為有交互作用的雙因素方差分析或可重復(fù)雙因素方差分析

(Two-factorwithreplication)雙因素方差分析的基本假定:1.每個(gè)總體都服從正態(tài)分布對(duì)于因素的每一個(gè)水平,其觀察值是來(lái)自正態(tài)分布總體的簡(jiǎn)單隨機(jī)樣本2.各個(gè)總體的方差必須相同對(duì)于各組觀察數(shù)據(jù),是從具有相同方差的總體中抽取的3.觀察值是獨(dú)立的2.2.1雙因素?zé)o重復(fù)試驗(yàn)的方差分析(1)雙因素?zé)o重復(fù)試驗(yàn)2.2雙因素試驗(yàn)的方差分析B1B2…BsA1x11x12…x1sA2x21x22…x2s……………Arxr1xr2…xrs(2)雙因素?zé)o重復(fù)試驗(yàn)方差分析的基本步驟①計(jì)算平均值總平均:Ai水平時(shí):

Bj水平時(shí):②計(jì)算離差平方和總離差平方和:因素A引起離差的平方和:因素B引起離差的平方和:誤差平方和:③計(jì)算自由度SSA的自由度:dfA

=r-1SSB的自由度:dfB=s-1SSe的自由度:dfe=(r-1)(s-1)SST的自由度:dfT=n-1=rs-1dfT=dfA

+dfB+

dfe④計(jì)算均方

⑤F檢驗(yàn)FA服從自由度為(dfA,dfe)的F分布;FB服從自由度為(dfB,dfe)的F分布;對(duì)于給定的顯著性水平

,查F分布表:

F

(dfA,dfe),F(xiàn)

(dfB,dfe)若FA>F

(dfA,dfe),則因素A對(duì)試驗(yàn)結(jié)果有顯著影響,否則無(wú)顯著影響;若FB>F

(dfB,dfe),則因素B對(duì)試驗(yàn)結(jié)果有顯著影響,否則無(wú)顯著影響;差異源SSdfMSF顯著性因素ASSAr-1因素BSSBs-1誤差SSe總和SSTrs-1⑥無(wú)重復(fù)試驗(yàn)雙因素方差分析表無(wú)重復(fù)試驗(yàn)雙因素方差分析表為了方便計(jì)算,我們采用下面的簡(jiǎn)便計(jì)算公式:例2-2:(雙因素?zé)o交互作用的方差分析)使用4種燃料,3種推進(jìn)器作火箭射程試驗(yàn),每一種組合情況做一次試驗(yàn),則得火箭射程列在表中,試分析各種燃料(Ai)與各種推進(jìn)器(Bj)對(duì)火箭射程有無(wú)顯著影響(α=0.05)解:這里r=4,s=3,rs=12方差來(lái)源平方和自由度均方F比燃料43推進(jìn)器B22385211192.50.92誤差E73198612199.7總和T11134211給出的α=0.05,查出F0.05(3,6)=4.76,F0.05(2,6)=5.14因?yàn)镕1=0.43<4.76,F2=0.92<5.14故不同的燃料、不同的推進(jìn)器對(duì)火箭射程均無(wú)顯著影響。因素B1B2…BsA1…A2………………Ar…2.2.2雙因素重復(fù)試驗(yàn)的方差分析(1)雙因素重復(fù)試驗(yàn)方差分析試驗(yàn)表雙因素重復(fù)試驗(yàn)方差分析試驗(yàn)表(2)雙因素重復(fù)試驗(yàn)方差分析的基本步驟①計(jì)算平均值總平均:任一組合水平(Ai,Bj)上:Ai水平時(shí):Bj水平時(shí):②計(jì)算離差平方和總離差平方和:因素A引起離差的平方和:因素B引起離差的平方和:交互作用A×B引起離差的平方和:誤差平方和:③計(jì)算自由度SSA的自由度:dfA

=r-1SSB的自由度:dfB=s-1SSA×B的自由度:dfA×B

=(r-1)(s-1)SSe的自由度:dfe=rs(c

-1)SST的自由度:dfT=n-1=rsc-1dfT=dfA

+dfB+

dfA×B+

dfe④計(jì)算均方⑤F檢驗(yàn)若FA>F

(dfA,dfe),則認(rèn)為因素A對(duì)試驗(yàn)結(jié)果有顯著影響,否則無(wú)顯著影響;若FB>F

(dfB,dfe),則認(rèn)為因素B對(duì)試驗(yàn)結(jié)果有顯著影響,否則無(wú)顯著影響;若FA×B>F

(dfA×B,dfe),則認(rèn)為交互作用A×B對(duì)試驗(yàn)結(jié)果有顯著影響,否則無(wú)顯著影響。⑥重復(fù)試驗(yàn)雙因素方差分析表有交互作用的方差分析簡(jiǎn)化公式:【例】城市道路交通管理部門為研究不同的路段和不同的時(shí)間段對(duì)行車時(shí)間的影響,讓一名交通警察分別在兩個(gè)路段和高峰期與非高峰期親自駕車進(jìn)行試驗(yàn),通過(guò)試驗(yàn)取得共獲得20個(gè)行車時(shí)間(分鐘)的數(shù)據(jù),如下表。試分析路段、時(shí)段以及路段和時(shí)段的交互作用對(duì)行車時(shí)間的影響交互作用的圖示:路段與時(shí)段對(duì)行車時(shí)間的影響交互作用無(wú)交互作用行車時(shí)間路段1路段2高峰期非高峰期行車時(shí)間路段1路段2高峰期非高峰期2.3試驗(yàn)設(shè)計(jì)1.完全隨機(jī)化設(shè)計(jì)2.隨機(jī)化區(qū)組設(shè)計(jì)3.因子設(shè)計(jì)試驗(yàn)設(shè)計(jì)與方差分析完全隨機(jī)化設(shè)計(jì)因子設(shè)計(jì)試驗(yàn)設(shè)計(jì)隨機(jī)化區(qū)組設(shè)計(jì)可重復(fù)雙因素方差分析單因素方差分析無(wú)重復(fù)雙因素方差分析完全隨機(jī)化設(shè)計(jì)

(completelyrandomizeddesign)1.“處理”被隨機(jī)地指派給試驗(yàn)單元的一種設(shè)計(jì)“處理”是指可控制的因素的各個(gè)水平“試驗(yàn)單元(experimentunit)”是接受“處理”的對(duì)象或?qū)嶓w2.在試驗(yàn)性研究中,感興趣的變量是明確規(guī)定的,因此,研究中的一個(gè)或多個(gè)因素可以被控制,使得數(shù)據(jù)可以按照因素如何影響變量來(lái)獲取3.對(duì)完全隨機(jī)化設(shè)計(jì)的數(shù)據(jù)采用單因素方差分析【例】一家種業(yè)開發(fā)股份公司研究出3個(gè)新的小麥品種:品種1、品種2、品種3。為研究不同品種對(duì)產(chǎn)量的影響,需要選擇一些地塊,在每個(gè)地塊種上不同品種的小麥,然后獲得產(chǎn)量數(shù)據(jù)進(jìn)行分析。這一過(guò)程就是試驗(yàn)設(shè)計(jì)的過(guò)程。這里的“小麥品種”就是試驗(yàn)因子或因素,品種1、品種2、品種

溫馨提示

  • 1. 本站所有資源如無(wú)特殊說(shuō)明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請(qǐng)下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請(qǐng)聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁(yè)內(nèi)容里面會(huì)有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫(kù)網(wǎng)僅提供信息存儲(chǔ)空間,僅對(duì)用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對(duì)用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對(duì)任何下載內(nèi)容負(fù)責(zé)。
  • 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請(qǐng)與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶因使用這些下載資源對(duì)自己和他人造成任何形式的傷害或損失。

最新文檔

評(píng)論

0/150

提交評(píng)論