《應(yīng)用數(shù)理統(tǒng)計》 課件 6 方差分析_第1頁
《應(yīng)用數(shù)理統(tǒng)計》 課件 6 方差分析_第2頁
《應(yīng)用數(shù)理統(tǒng)計》 課件 6 方差分析_第3頁
《應(yīng)用數(shù)理統(tǒng)計》 課件 6 方差分析_第4頁
《應(yīng)用數(shù)理統(tǒng)計》 課件 6 方差分析_第5頁
已閱讀5頁,還剩23頁未讀, 繼續(xù)免費(fèi)閱讀

下載本文檔

版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進(jìn)行舉報或認(rèn)領(lǐng)

文檔簡介

方差分析主要用來檢驗(yàn)兩個以上總體均值差異的顯著程度,由此判斷樣本究竟是否抽自具有同一均值的總體,或不同總體間的均值是否有顯著性差異。方差分析對于比較不同生產(chǎn)工藝或設(shè)備條件下產(chǎn)量、質(zhì)量的差異,分析不同計劃方案效果的好壞和比較不同地區(qū)、不同人員有關(guān)的數(shù)量指標(biāo)差異是否顯著,是非常有用的。第六章方差分析§6.1單因素方差分析進(jìn)行方差分析的基本思路是:首先通過試驗(yàn)(試驗(yàn)或調(diào)查),取得不同因素、不同水平條件下被考察的隨機(jī)變量的樣本,然后利用樣本構(gòu)造統(tǒng)計量,檢驗(yàn)不同條件下的幾個不同總體的參數(shù)是否相等,如果參數(shù)相等的假設(shè)成立,則說明因素及水平對該變量影響不顯著,反之則影響顯著。6.1.1問題引入在參數(shù)假設(shè)檢驗(yàn)中,我們經(jīng)常檢驗(yàn)兩個總體分布的均值是否相同,如果有多個總體,則必須兩兩比較檢驗(yàn),十分繁瑣。而方差分析(ANOVA),可以一次完成對多個總體的均值是否相同的檢驗(yàn):

(6.1)方差分析是檢驗(yàn)多個總體均值是否相同,本質(zhì)上是研究分類型自變量對數(shù)值型因變量的影響。在分析均值之間是否有差異時,需要借助于方差,也即是數(shù)據(jù)誤差來源的分析,所以叫方差分析。第六章方差分析6.1.11、相關(guān)概念單因素方差分析的基本思想是,用方案之間的方差(服從卡方分布)與所有方案內(nèi)部的方差之和(也服從卡方分布)的比值(服從F分布)與fa

的比較,來判別s個方案的均值是否相同。設(shè)有s個技術(shù)方案,各方案的試驗(yàn)效果如表6.1所示,問怎樣判斷這s個方案的效果是否有顯著區(qū)別?所謂單因素,就是指只有“方案”這個變量(因素)。不同方案,就是“方案”這個變量的不同取值。單因素方差分析的目的,就是一次性地檢驗(yàn)各個方案的均值是否相同

單因素方差分析所使用的統(tǒng)計量,是F統(tǒng)計量。第六章方差分析例1已知在一組給定的條件下種植油菜所得畝產(chǎn)量服從正態(tài)分布。某農(nóng)場欲檢驗(yàn)四塊試驗(yàn)田對油菜畝產(chǎn)量的影響是否不相同(假定已經(jīng)經(jīng)過檢驗(yàn)表明不同試驗(yàn)田下的油菜產(chǎn)量方差相等)。為此,他們對四組初始條件完全相同的油菜種子,在完全相同的其他種植條件下,分別在四塊試驗(yàn)田種植。所得到的畝產(chǎn)量數(shù)據(jù)如下表。試分析不同試驗(yàn)田下的油菜畝產(chǎn)量是否存在顯著性差異?(a=0.05)第六章方差分析試驗(yàn)田123456試驗(yàn)田1370420450490試驗(yàn)田2490380400390500410試驗(yàn)田3330340400380470試驗(yàn)田4410480400420380410通常,在方差分析中,我們把對試驗(yàn)結(jié)果發(fā)生影響和起作用的自變量稱為因素。如果方差分析研究的是一個因素對于試驗(yàn)結(jié)果的影響和作用,就稱為單因素方差分析。在本例中,因素就是可能影響油菜畝產(chǎn)量的不同的試驗(yàn)田。因素的不同選擇方案稱之為因素的水平。上例中試驗(yàn)田有4種不同的選擇就說因素有4個水平。因素的水平實(shí)際上就是因素的取值或者是因素的分組,例如,可以在施肥量、光照時間、灌溉時長、商品包裝、質(zhì)量、價格和產(chǎn)地等方面取不同的值或分為不同的組,就表示因素選了不同的水平。方差分析要檢驗(yàn)的問題就是當(dāng)因素選不同的水平時,對結(jié)果有無顯著的影響。若無顯著影響,則隨便選擇哪一種方案都無所謂。否則就要選擇最終油菜畝產(chǎn)量最多的一種試驗(yàn)田方案。第六章方差分析打開數(shù)據(jù)文件“CH6例1試驗(yàn)田”。(1)在數(shù)據(jù)文件“CH6例1試驗(yàn)田”后,點(diǎn)擊:【分析】→【比較平均值】→【單因素ANOVA】,進(jìn)入單因素方差分析模塊。(2)在單因素方差分析模塊主窗口(圖6.1)中,選中左框的變量“畝產(chǎn)量”放入右邊的“因變量列表”框中。(3)選中左框的變量“試驗(yàn)田”,放入右邊的“因子”框中,如圖6.1所示。(4)點(diǎn)擊【確定】,系統(tǒng)輸出結(jié)果,如表6.3所示。

(5)結(jié)果說明:第六章方差分析表6.3方差分析表

平方和df均方F顯著性組之間7112.14332370.7141.012.412組內(nèi)39811.667172341.863

總計46923.81020

6.1.2單因素方差分析的原理1數(shù)學(xué)模型方差分析的基本假定是:每個總體都應(yīng)服從正態(tài)分布;各個總體的方差相同(SPSS操作時s個水平下的總體方差可不等,先進(jìn)行“方差齊性檢驗(yàn)”);不同水平下的樣本之間是相互獨(dú)立的。現(xiàn)設(shè)單因素A的s個水平下的總體均服從正態(tài)分布,均值分別為:

,與未知,對進(jìn)行估計和檢驗(yàn),需要重復(fù)試驗(yàn)。為了分析因素A的第i個水平,對進(jìn)行兩次分解。第一次,將分解成兩部分

(6.2)式中為因素A的第i個水平下的總體均值,試驗(yàn)誤差之間相互獨(dú)立且,是因?yàn)?/p>

(6.3)(6.4)(6.5)第六章方差分析6.1.2單因素方差分析的原理第二次,再對進(jìn)行分解,(6.6)式中,,稱為總平均,表示因素A的第i個水平下的總體平均值與總平均的差異,習(xí)慣上將其稱為水平Ai的效應(yīng)。由兩次分解得到單因素方差分析數(shù)學(xué)模型

第六章方差分析2方差分析檢驗(yàn)單因素方差分析的基本思想是,用方案之間的方差(服從卡方分布)與所有方案內(nèi)部的方差之和(也服從卡方分布)的比值(服從F分布),與fa的比較,來判別s個方案的均值是否相同。①求各方案之間的變差SA(用各方案的均值對所有數(shù)據(jù)的總均值的離差平方和來表達(dá))

(6.8)式中,,,為所有數(shù)據(jù)的總平均值;對應(yīng)于為第i個方案的樣本均值,SA的自由度是s-1。②求所有方案內(nèi)部變差SE(方案i的內(nèi)部變差是該方案的試驗(yàn)數(shù)據(jù)Xij對該方案試驗(yàn)數(shù)據(jù)均值的變差)

(6.9)

SE與誤差項(xiàng)相對應(yīng),SE的自由度是n-s。

第六章方差分析③計算方案間的方差與所有方案內(nèi)的方差之比

(6.10)若,則,,所以

(6.11)在上面的計算中,如果把Xij換成xij,就得到統(tǒng)計量F對應(yīng)的值f。④做假設(shè)檢驗(yàn)

從臨界值的角度考慮,若,則表明sA較大,的平方和較大,對應(yīng)的總體參數(shù)是的絕對值較大,所以,如果以a的概率(或在a水平上)拒絕H0,即至少有兩個方案之間的平均效果(均值),差異足夠大,方案之內(nèi)的差異相對小。反之,接受H0,即不同方案的效果(均值)沒有顯著差異。從p值法的角度考慮,在SPSS中,F(xiàn)檢驗(yàn)的判別和t檢驗(yàn)的類似,也可以用統(tǒng)計值f的外側(cè)概率p(顯著性概率)與a比較大小,來判別接受還是拒絕H0。而常規(guī)的數(shù)理統(tǒng)計學(xué),是用統(tǒng)計值(如等)與統(tǒng)計值的閾值(如等)比較大小,來判別接受還是拒絕。

第六章方差分析而由圖6.2可知,從統(tǒng)計值f與a所決定的閾值的角度看,若,則表明sA較大,的平方和較大,對應(yīng)的的絕對值較大,即。所以拒絕H0。即至少有兩個方案之間的平均效果(均值)的差異足夠大,方案之間的差異相對小。反之,接受H0,即不同方案之間的平均效果(均值)沒有顯著差異。由圖6.2可知,與f的右側(cè)概率p<=a是等價的,這就是SPSS的檢驗(yàn)判別方法。圖6.2單因素方差分析F檢驗(yàn)圖a

1-a

6.1.3單因素方差分析的SPSS操作1不同方案間存在顯著性差異上面的例1中不同試驗(yàn)田方案下的油菜畝產(chǎn)量不存在顯著性差異。所以,接下來就不用再進(jìn)一步分析了,也就是采取哪種試驗(yàn)田方案都可以。但是如果不同試驗(yàn)田方案存在顯著性差異呢?仍以例1為例,增加一列數(shù)據(jù)“畝產(chǎn)量新”,數(shù)據(jù)仍見“CH6例1試驗(yàn)田”。(1)點(diǎn)擊:【分析】→【比較平均值】→【單因素ANOVA】,進(jìn)入單因素方差分析模塊。(2)在單因素方差分析模塊主窗口(圖6.3)中,選中左框的變量“畝產(chǎn)量新”放入右邊的“因變量列表”框中。(3)選中左框的變量“試驗(yàn)田”,放入右邊的“因子”框中。如圖6.3所示。(4)點(diǎn)擊【確定】,系統(tǒng)輸出結(jié)果,如表6.4所示。第六章方差分析表6.4方差分析表

平方和df均方F顯著性組之間136921.667345640.5569.570.001組內(nèi)81078.333174769.314

總計218000.00020

2使用選項(xiàng)兩兩比較在前面的步驟(3)后增加選項(xiàng)操作。(5)點(diǎn)擊【選項(xiàng)】按鈕,系統(tǒng)彈出一個對話框,見圖6.4。在該對話框中, 描述性:選擇需要輸出的統(tǒng)計量。 方差同質(zhì)性檢驗(yàn):如果選擇,表示要進(jìn)行方差齊次性檢驗(yàn)(Levene檢驗(yàn)),并輸出檢驗(yàn)結(jié)果。這一選擇很重要,關(guān)系到【兩兩比較】窗口如何讀取計算結(jié)果。本例選擇此項(xiàng)。(6)點(diǎn)擊【繼續(xù)】按鈕,在主窗口中點(diǎn)擊【事后多重比較】,見圖6.5。(7)點(diǎn)擊【繼續(xù)】按鈕,返回主窗口(圖6.3)。(8)如果不是任何兩個分別兩兩比較,某兩個比較,或多個分組比較,可以點(diǎn)擊【對比】按鈕,彈出“對比”窗口(見圖6.6)。點(diǎn)擊該窗口中的“多項(xiàng)式”選項(xiàng),“度”被激活,點(diǎn)擊“度”右邊的小箭頭,出現(xiàn)下拉菜單,有線性、二次項(xiàng)、立方、四次項(xiàng)、五次項(xiàng)的多項(xiàng)式模型,可供選擇,一般選擇“線性”模型。第六章方差分析在“系數(shù)”的方框中,輸人各組均值的系數(shù),確定所要比較的組均值的組合。例如輸入1,再輸入0,點(diǎn)擊“添加”,再分別輸入0和-1,點(diǎn)擊“添加”,就完成了一個組合(1,0,0,-1),表示要對照檢驗(yàn)“1=試驗(yàn)田1”的平均畝產(chǎn)量與“4=試驗(yàn)田4”的平均畝產(chǎn)量有無顯著性差異。點(diǎn)擊【下一頁】,再輸入(1,-1,-1,-1),表示要對照檢驗(yàn)“1=試驗(yàn)田1”的平均畝產(chǎn)量與“2=試驗(yàn)田2”、“3=試驗(yàn)田3”、“4=試驗(yàn)田4”之和的平均畝產(chǎn)量有無顯著性差異。(9)點(diǎn)擊【確定】按鈕,輸出結(jié)果見下面的表格。由于顯著性概率,表示4個組的數(shù)據(jù)都不具有方差齊性。這里的方差同質(zhì)性檢驗(yàn)請參照上一章5.4.2節(jié)的內(nèi)容。由于在前面的檢驗(yàn)中,得知四種試驗(yàn)田方案下的畝產(chǎn)量平均值存在顯著性差異,所以,在進(jìn)行方差同質(zhì)性檢驗(yàn)之后,下面的表6.6給出了兩兩對照的結(jié)果。第六章方差分析表6.5方差同質(zhì)性檢驗(yàn)表Levene統(tǒng)計df1df2顯著性4.717317.0141第六章方差分析

表6.6兩兩多重比較結(jié)果

(I)試驗(yàn)田(J)試驗(yàn)田平均差(I-J)標(biāo)準(zhǔn)錯誤顯著性95%置信區(qū)間

下限值上限LSD(L)試驗(yàn)田1試驗(yàn)田2-152.500*44.578.003-246.55-58.45試驗(yàn)田348.50046.327.310-49.24146.24試驗(yàn)田415.83344.578.727-78.22109.89試驗(yàn)田2試驗(yàn)田1152.500*44.578.00358.45246.55試驗(yàn)田3201.000*41.818.000112.77289.23試驗(yàn)田4168.333*39.872.00184.21252.46試驗(yàn)田3試驗(yàn)田1-48.50046.327.310-146.2449.24試驗(yàn)田2-201.000*41.818.000-289.23-112.77試驗(yàn)田4-32.66741.818.445-120.9055.56試驗(yàn)田4試驗(yàn)田1-15.83344.578.727-109.8978.22試驗(yàn)田2-168.333*39.872.001-252.46-84.21試驗(yàn)田332.66741.818.445-55.56120.90Tamhane試驗(yàn)田1試驗(yàn)田2-152.50049.779.096-328.0423.04試驗(yàn)田348.50035.575.768-81.38178.38試驗(yàn)田415.83328.822.996-107.85139.51試驗(yàn)田2試驗(yàn)田1152.50049.779.096-23.04328.04試驗(yàn)田3201.000*49.642.02328.00374.00試驗(yàn)田4168.33345.049.056-4.52341.18試驗(yàn)田3試驗(yàn)田1-48.50035.575.768-178.3881.38試驗(yàn)田2-201.000*49.642.023-374.00-28.00試驗(yàn)田4-32.66728.585.877-140.0774.73試驗(yàn)田4試驗(yàn)田1-15.83328.822.996-139.51107.85試驗(yàn)田2-168.33345.049.056-341.184.52試驗(yàn)田332.66728.585.877-74.73140.07由于前面已經(jīng)得出了不具有方差齊性的結(jié)論,所以這里應(yīng)當(dāng)讀取Tamhane的檢驗(yàn)結(jié)果。假設(shè),則由于試驗(yàn)田2和試驗(yàn)田3之間,所以試驗(yàn)田2、3之間存在顯著性差異,該表格用*標(biāo)出了兩兩均值之間是否存在顯著性差異。接下來還可以按不同的組合進(jìn)行單因素方差分析,結(jié)果如表6.7所示。前面在判斷4塊試驗(yàn)田對應(yīng)的總體方差是否齊性時,得出了不具有方差齊性的結(jié)論,那么這里兩兩多重比較,也就是兩個總體間方差的判斷是否還應(yīng)讀取“不假定等方差”的檢驗(yàn)結(jié)果?我們不妨和上一章學(xué)的“獨(dú)立樣本T檢驗(yàn)”的SPSS結(jié)果做一下對比。第六章方差分析表6.7兩兩多重比較結(jié)果對比對比值標(biāo)準(zhǔn)錯誤tdf顯著性(雙尾)畝產(chǎn)量新假定等方差115.8344.578.35517.7272-953.17a61.123-15.59417.000不假定等方差115.8328.822.5494.803.6072-953.17a57.402-16.60511.833.000a.對比系數(shù)之和不為零。第1個組合方差的Levene檢驗(yàn)p=0.363>a=0.05,所以讀取表6.9中第一行結(jié)果,p=0.566>a=0.05,表示其組合的均值之間沒有顯著性差異,即試驗(yàn)田1和試驗(yàn)田4對油菜畝產(chǎn)量的影響無顯著性差異。結(jié)果的不同反映了SPSS內(nèi)部核心算法的不同。表6.10組統(tǒng)計量

試驗(yàn)田N均值標(biāo)準(zhǔn)差均值的標(biāo)準(zhǔn)誤畝產(chǎn)量新>=217466.47113.63027.559<24432.5050.58025.290表6.9獨(dú)立樣本檢驗(yàn)

方差方程的Levene檢驗(yàn)均值方程的t檢驗(yàn)FSig.tdfSig.(雙側(cè))均值差值標(biāo)準(zhǔn)誤差值差分的95%置信區(qū)間下限上限畝產(chǎn)量新假設(shè)方差相等.930.363.5998.56615.83326.426-45.10676.773假設(shè)方差不相等

.5494.803.60715.83328.822-59.17790.844表6.11獨(dú)立樣本檢驗(yàn)

方差方程的Levene檢驗(yàn)均值方程的t檢驗(yàn)FSig.tdfSig.(雙側(cè))均值差值標(biāo)準(zhǔn)誤差值差分的95%置信區(qū)間下限上限畝產(chǎn)量新假設(shè)方差相等1.703.208.57619.57233.97159.014-89.546157.488假設(shè)方差不相等

.90811.354.38333.97137.405-48.044115.986§6.2無重復(fù)試驗(yàn)的雙因素方差分析6.2.1問題引入為了理解雙因素方差分析的基本思路,我們先舉一個簡單的例子。例23種教學(xué)法在4個不同的學(xué)校的試驗(yàn)結(jié)果(數(shù)據(jù)見文件“CH6例2教學(xué)法”)如下試分析不同學(xué)校的試驗(yàn)效果是否存在顯著性差異?不同教學(xué)方法之間是否存在顯著性差異?1、雙因素方差分析模塊的SPSS操作示例:讀入數(shù)據(jù)后:(1)點(diǎn)擊:【分析】→【一般線性模型】→【單變量】,進(jìn)入單因素方差分析模塊。第六章方差分析學(xué)校A學(xué)校B學(xué)校C學(xué)校D方法180903020方法290804050方法31001006040§6.2無重復(fù)試驗(yàn)的雙因素方差分析6.2.1問題引入(2)在單因素方差分析模塊主窗口(圖6.7)中,選中左框的變量“試驗(yàn)結(jié)果”放入右邊的“因變量”框中。(3)選中左框的變量“方法”和“學(xué)校”,放入右邊的“固定因子”框中,如圖6.7所示。(4)點(diǎn)擊窗口右上側(cè)的【模型】①左邊的“指定模型”中的“全因子”(建立全模型,分析所有因素變量的主效應(yīng)和交互效應(yīng)),這是系統(tǒng)的默認(rèn)值。由于本例題是無重復(fù)試驗(yàn),不存在分析交互效應(yīng)問題,所以不選擇此項(xiàng)(點(diǎn)擊右邊的“定制”選項(xiàng))。②點(diǎn)擊【定制】(用戶自定義模型),中間的“構(gòu)建項(xiàng)”被激活,同時,左邊的“因子與協(xié)變量”框中的變量也被激活。③選擇所要分析的效應(yīng):點(diǎn)擊【構(gòu)建項(xiàng)】框中的下拉組合框小箭頭,出現(xiàn)一個下拉菜單見圖6.8。第六章方差分析§6.2無重復(fù)試驗(yàn)的雙因素方差分析6.2.1問題引入(5)點(diǎn)擊【繼續(xù)】,回到上一個對話窗口。(6)其它選項(xiàng)略。(7)點(diǎn)擊【確定】,輸出結(jié)果,見表6.8所示。第六章方差分析表6.8方差分析結(jié)果因變量:試驗(yàn)結(jié)果

源III類平方和自由度均方F顯著性校正的模型8366.667a51673.33318.825.001截距50700.000150700.000570.375.000方法800.0002400.0004.500.064學(xué)校7566.66732522.22228.375.001錯誤533.333688.889

總計59600.00012

校正后的總變異8900.00011

a.R平方=.940(調(diào)整后的R平方=.890)§6.2無重復(fù)試驗(yàn)的雙因素方差分析6.2.2無重雙因的算法步驟1、假設(shè)零假設(shè):備擇假設(shè):之間不完全相等(至少有兩個不等),或ai不全等于0。之間不完全相等(至少有兩個不等),或bi不全等于0。2、計算(1)算行間變差

(6.12)(2)算列間變差

(6.13)(3)算總誤差平方和

(6.14)(4)算總變差第六章方差分析可以證明,在無交互影響的雙因素模型下,有如下結(jié)論①當(dāng)H0A成立時

(6.16)②當(dāng)成立時

(6.17)(5)計算2個方差之比

(6.18)(6.19)3、做假設(shè)檢驗(yàn)對給定的a查表,若,則拒絕

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負(fù)責(zé)。
  • 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時也不承擔(dān)用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

評論

0/150

提交評論