




版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進行舉報或認領(lǐng)
文檔簡介
第七章方差分析方差分析的基本原理單因素實驗數(shù)據(jù)的方差分析兩因素實驗數(shù)據(jù)的方差分析2023/2/41現(xiàn)有5種治療蕁麻疹的新藥,為了比較其療效,將30個病人隨機分成5組,每組6人。讓同一組使用同一種新藥,各病人治愈天數(shù)如7-1表所示:
表7.1
5種治療蕁麻疹新藥治愈病人天數(shù)問:5種藥物的療效是否存在顯著差異?若存在顯著差異,差異體現(xiàn)在那些藥物之間?2023/2/42案例
五種新藥的療效一樣嗎藥物治愈天數(shù)A16877108A2466356A3644523A4746635A5945776一、方差分析的主要概念二、案例的直觀分析三、統(tǒng)計模型與基本假定四、離差平方和與自由度的分解2023/2/4版權(quán)所有BY統(tǒng)計學(xué)課程組3第一節(jié)方差分析的基本原理
方差分析:
是一種檢驗多個總體均值是否相等的統(tǒng)計方法。方差分析主要用來研究一個定量因變量與一個或多個定性自變量的關(guān)系。試驗因素:
試驗的設(shè)計者希望考察的試驗條件,或者說就是方差分析研究的對象,簡稱因素,也可稱為自變量,如案例中的藥物。因素水平:
試驗因素的某種特定狀態(tài)或數(shù)量等級稱為因素水平,簡稱水平,實際上就是因素的不同表現(xiàn)。如案例中的5種藥物。若方差分析只針對一個因素進行,則稱為單因素方差分析。若方差分析同時針對兩個因素進行,則稱為雙因素方差分析。2023/2/44一、方差分析的主要概念試驗指標(biāo):
衡量試驗結(jié)果好壞程度的指標(biāo),也可稱為因變量,其不同
的取值常稱為觀察值或試驗數(shù)據(jù)。在本章案例中,治愈天
數(shù)就是試驗指標(biāo)。處理:
按照因素的給定水平對實驗對象所做的操作。這種操作就
是對因素劃類或確定數(shù)量等級,形成因素的不同水平。因
素的一個水平就是一個處理。每個處理可看作一個試驗條
件或一個總體。試驗單元
接受處理的實驗對象稱為試驗單元,簡稱單元。如案例中
接受治療的患者,一個患者就是一個試驗單元。
2023/2/45一、方差分析的主要概念2023/2/4版權(quán)所有BY統(tǒng)計學(xué)課程組6一、方差分析的主要概念2023/2/4版權(quán)所有BY統(tǒng)計學(xué)課程組7一、方差分析的主要概念2023/2/4版權(quán)所有BY統(tǒng)計學(xué)課程組8二、案例的直觀分析·····治愈天數(shù)A1A2A3A4A51.從散點圖上可以看出
不同藥物的治愈天數(shù)是有明顯差異的同一個藥物不同患者的治愈天數(shù)也明顯不同2.藥物與治愈天數(shù)之間有一定的關(guān)系如果藥物與治愈天數(shù)之間沒有關(guān)系,那么患者被治
愈的天數(shù)應(yīng)該差不多相同,在散點圖上所呈現(xiàn)的模
式也就應(yīng)該很接近,不同藥物的平均治愈天數(shù)就幾
乎應(yīng)該在一條水平線上。2023/2/4版權(quán)所有BY統(tǒng)計學(xué)課程組9二、案例的直觀分析3.僅從散點圖上觀察還不能提供充分的證據(jù)證明不同藥物的治愈天數(shù)之間有顯著差異。4.需要有更準(zhǔn)確的方法來檢驗這種差異是否顯著,也就是進行方差分析。所以叫方差分析,因為雖然我們感興趣的是均值,但在判斷均值之間是否有差異時則需要借助于方差。5.不同藥物的治愈天數(shù)之間的差異可能是由于抽樣的隨機性所造成的,也有可能是系統(tǒng)性影響因素造成的。6.通過對數(shù)據(jù)誤差來源的分析,判斷不同總體的均值是否相等。2023/2/410二、案例的直觀分析數(shù)據(jù)誤差的來源分為隨機誤差和系統(tǒng)誤差。1.隨機誤差因素的同一水平(總體)下,樣本各觀察值之間的差異。比
如,同一藥物下不同患者的治愈天數(shù)是不同的。這種差異
可以看成是隨機因素影響的結(jié)果,稱為隨機誤差。2.系統(tǒng)誤差
因素的不同水平(不同總體)下,各觀察值之間存在差異。比如,不同藥物的治愈時間之間的差異。這種差異可能是由于抽樣的隨機性所造成的,也可能是由于藥物本身所造成的,后者所形成的誤差是由系統(tǒng)性因素造成的,稱為系統(tǒng)誤差。2023/2/411三、數(shù)據(jù)誤差的來源2023/2/4版權(quán)所有BY統(tǒng)計學(xué)課程組12四、統(tǒng)計模型與方差分析的基本假定處理觀測值合計平均A1……A2……………………………Ai……………………………Ak…合計——————方差分析的數(shù)據(jù)結(jié)構(gòu)(以單因素方差分析為例):因素A的第i個處理的第j次觀測值:第i個處理的n個觀測值之和:全部觀測值的總和:第i個處理平均數(shù):全部觀測值的總平均數(shù)2023/2/4版權(quán)所有BY統(tǒng)計學(xué)課程組131.符號定義方差分析中的統(tǒng)計模型,用來描述因素A的第i個處理的第j次觀測值的形成機理。結(jié)合本章案例,假設(shè)在第i個處理下的第j次觀測是患者張三,則張三的治愈天數(shù)應(yīng)該為:
張三治愈天數(shù)=張三所在處理組的平均天數(shù)+
隨機因素對張三治愈天數(shù)的影響(可正可負)
=總平均天數(shù)+張三所在組平均天數(shù)與總平均天數(shù)之差+隨機因素對治愈天數(shù)的影響2023/2/4版權(quán)所有BY統(tǒng)計學(xué)課程組142.統(tǒng)計模型這個差值說明了什么?設(shè)張三所在組的平均治愈天數(shù)為,總平均治愈天數(shù)為,隨機因素的影響為,張三所在組的平均治愈天數(shù)與總平均治愈天數(shù)之差為,則張三的治愈天數(shù)可表達為:2023/2/4152.統(tǒng)計模型(1)每個總體都應(yīng)服從正態(tài)分布對于因素的每一個水平,其觀察值是來自服從正態(tài)分布總體的簡單隨機樣本。(2)各個總體的方差必須相同各組觀察數(shù)據(jù)是從具有相同方差的總體中抽取的(3)觀察值是獨立的各觀測值彼此之間相互不影響在上述假定條件下,判斷藥物對治愈天數(shù)是否有顯著影響,實際上也就是檢驗具有同方差的五個正態(tài)總體的均值是否相等。2023/2/4版權(quán)所有BY統(tǒng)計學(xué)課程組163.方差分析的基本假定結(jié)合本章案例,方差分析要回答的問題就是5種不同的藥物對治愈天數(shù)是否有顯著影響,實際上就是檢驗五種藥物的平均治愈天數(shù)是否相等。所建立的假設(shè)為:
2023/2/4版權(quán)所有BY統(tǒng)計學(xué)課程組174.方差分析中假設(shè)的建立方差分析檢驗多個總體的均值是否相等,或是否存在顯著差異,是從對數(shù)據(jù)差異來源的分析入手的。從本章案例中可以看出,試驗數(shù)據(jù)的差異存在于如下三個方面:全部觀測值存在差異各水平(處理)內(nèi)部觀測值存在差異各水平(處理)之間觀測值存在差異上述各種差異產(chǎn)生的原因只有兩個方面,即系統(tǒng)性因素與隨機性因素。數(shù)據(jù)差異源分析,就是通過構(gòu)造反映數(shù)據(jù)差異的統(tǒng)計量即離差平方和,并對其進行分解,確定數(shù)據(jù)差異的原因。2023/2/418五、數(shù)據(jù)差異源分析——離差平方和及其分解總離差平方和反映全部觀測值總變異的程度。總變異可能是隨機因素與系統(tǒng)因素(試驗因素)共同影響形成的。2023/2/4191.總離差平方和SST處理內(nèi)(組內(nèi))離差平方和反映各處理內(nèi)觀測值的變異程度。組內(nèi)離差平方和是某一特定處理下試驗數(shù)據(jù)的差異程度,與試驗因素(系統(tǒng)因素)的變化無關(guān),所以該離差平方和反映了隨機因素所導(dǎo)致的數(shù)據(jù)差異,也稱誤差平方和。2023/2/4202.處理內(nèi)(組內(nèi))離差平方和SSE處理間(組間)離差平方和反映重復(fù)n次的處理間觀測值的變異程度。組間離差平方和既與試驗因素(系統(tǒng)因素)的變化有關(guān),也與隨機因素有關(guān),所以該離差平方和反映了試驗因素(系統(tǒng)因素)與隨機因素共同所導(dǎo)致的數(shù)據(jù)差異。2023/2/4213.處理間(組間)離差平方和SSA2023/2/4224.三項離差平方和之間的關(guān)系SST=SSA+SSE
總離差平方和因素A及隨機因素導(dǎo)致的變差隨機因素導(dǎo)致的變差組間離差平方和組內(nèi)離差平方和前述的各離差平方和的絕對值的大小受到處理的重復(fù)數(shù)的影響,為了消除重復(fù)數(shù)對離差平方和的影響,并實現(xiàn)各離差平方和之間的可比,需要將離差平方和改造為誤差均方(也可稱方差)。誤差均方是將各離差平方和與其對應(yīng)的自由度相除所得的結(jié)果。各離差平方和的自由度如下:2023/2/4235.誤差均方離差平方和自由度SSTSSESSA(1)組內(nèi)均方(組內(nèi)方差)(2)組間均方(組間方差)如果原假設(shè)成立,則表明沒有系統(tǒng)誤差,組間均方與組內(nèi)均方差異就不會太大;如果組間均方顯著地大于組內(nèi)均方,說明各水平(總體)之間的差異不僅有隨機誤差,還有系統(tǒng)誤差,判斷因素的水平是否對其觀察值有影響,實際上就是比較組間方差與組內(nèi)方差之間差異的大小。2023/2/4245.誤差均方2023/2/4255.誤差均方組間離差平方和組內(nèi)離差平方和組間方差組內(nèi)方差受因素A和隨機
因素的影響只受隨機
因素的影響通過比較組間均方與組內(nèi)均方之間的大小,來檢驗多個總體均值是否相等,是方差分析的基本思想。如果組間均方顯著地大于組內(nèi)均方,說明各水平(總體)之間的差異不僅受隨機因素,還有系統(tǒng)因素的影響,試驗因素對試驗指標(biāo)有顯著的影響;反之,若兩者很接近,說明各水平(總體)之間的差異僅有隨機因素的影響,試驗因素對試驗指標(biāo)無顯著的影響。根據(jù)這一思想,可以構(gòu)造檢驗的統(tǒng)計量。2023/2/426六、檢驗統(tǒng)計量如果因素A的不同水平對試驗結(jié)果沒有影響,那么在組間方差中只包含有隨機誤差,兩個方差的比值會接近1。如果不同水平對試驗結(jié)果有影響,組間方差就會大于組內(nèi)方差,組間方差與組內(nèi)方差的比值就會大于1。當(dāng)這個比值大到某種程度時,就可以說不同水平之間存在顯著差異,或者說因素A對試驗結(jié)果有顯著影響。2023/2/427六、檢驗統(tǒng)計量如果,則拒絕原假設(shè),認為各水平均值之間存在顯著差異,反之,不能拒絕原假設(shè),認為各水平均值之間沒有顯著差異。2023/2/428六、檢驗統(tǒng)計量a
F(k-1,nk-k)
0拒絕H0不能拒絕H0F變差來源離差平方和SS自由度df均方MSF值組間SSAk-1MSAMSA/MSE組內(nèi)SSEnk-kMSE總和SSTnk-1——2023/2/429七、方差分析表方差分析表(單因素)一般形式1.為什么要進行多重比較在方差分析中,不拒絕原假設(shè),表示拒絕總體均數(shù)相等的證據(jù)不足,分析終止;當(dāng)原假設(shè)被拒絕時,我們可以確定至少有兩個總體的均值有顯著差異。但要進一步檢驗?zāi)男┚抵g有顯著差異還需要采用多重比較的方法進行分析。2.什么是多重比較多重比較是同時對各個總體均值進行的兩兩比較。方法很多,如Fisher最小顯著差異(LeastSignificantDifference,LSD)方法、Tukey的誠實顯著差異(HSD)方法或Bonferroni的方法等。這里我們只介紹最小顯著差異方法。2023/2/430八、多重比較2023/2/431八、多重比較(最小顯著差異檢驗法的步驟)(1)提出假設(shè)
(2)計算檢驗的統(tǒng)計量(3)決策如果或則拒絕H0。2023/2/432八、多重比較(最小顯著差異檢驗法的步驟)實際應(yīng)用中,也可以按下列規(guī)則決策:首先計算檢驗統(tǒng)計量:其次計算檢驗臨界值:最后進行統(tǒng)計決策:若,則拒絕原假設(shè);反之不拒絕。1.提出假設(shè)2.計算各離差平方和及其自由度3.計算均方和F統(tǒng)計量4.列方差分析表,進行F檢驗5.對原假設(shè)進行決策。若拒絕原假設(shè),則進行多重比較2023/2/433九、方差分析的步驟根據(jù)安排的試驗因素的多少,方差分析分為單因素方差分析、兩因素方差分析和多因素方差分析。單因素方差分析根據(jù)各處理內(nèi)重復(fù)數(shù)是否相等,分為重復(fù)數(shù)相等與重復(fù)數(shù)不等的方差分析兩種情況。上節(jié)討論的是重復(fù)數(shù)相等的情況,而重復(fù)數(shù)不等的方差分析的基本原理與重復(fù)數(shù)相等時的過程是一致的,只是各離差平方和、自由度的計算,以及多重比較中標(biāo)準(zhǔn)誤差的計算略有不同。2023/2/434第二節(jié)單因素方差分析2023/2/435一、各處理重復(fù)數(shù)相等的方差分析(例)根據(jù)本章案例介紹過程。1.建立假設(shè):2.計算各均值、各離差平方和、各均方、F統(tǒng)計量,列方差分析表。這類計算比較麻煩,可借助相關(guān)軟件完成。2023/2/436一、各處理重復(fù)數(shù)相等的方差分析(例)差異源SSdfMSFP-valueFcrit組間47.47411.875.55
0.002452.76組內(nèi)53.5252.14總計100.9829--
----
--
方差分析表2023/2/437一、各處理重復(fù)數(shù)相等的方差分析(例)3.統(tǒng)計決策:從臨界值來看,由于,所以拒絕原假設(shè);從P值來看,由于,所以拒絕原假設(shè);4.進行多重比較在顯著性水平時,由于所以,水平1和水平2的均值之間存在顯著差異。余此類推【例】為了對幾個行業(yè)的服務(wù)質(zhì)量進行評價,某市消費者協(xié)會對該地的旅游業(yè)、居民服務(wù)業(yè)、公路客運業(yè)和保險業(yè)分別抽取了不同數(shù)量的企業(yè)。每個行業(yè)中的這些企業(yè)在服務(wù)內(nèi)容、服務(wù)對象、企業(yè)規(guī)模等方面基本相同。經(jīng)統(tǒng)計,最近一年消費者對這23家企業(yè)投訴的次數(shù)資料如表7-7所示,消費者協(xié)會想知道:這幾個行業(yè)之間的服務(wù)質(zhì)量是否有顯著差異?如果有,究竟是在哪些行業(yè)之間?如果能找出哪些行業(yè)的服務(wù)質(zhì)量最差,就可以建議對消費者權(quán)益保護法中該行業(yè)的某些條款作出修正。2023/2/438二、各處理重復(fù)數(shù)不相等的方差分析2023/2/439例題數(shù)據(jù)
某地消費者對四個行業(yè)的投訴次數(shù)觀測序列旅游業(yè)A1居民服務(wù)業(yè)A2公路客運業(yè)A3保險業(yè)A4157625170255495968346604863445545569554564760653557473.多重比較中檢驗統(tǒng)計量:4.其余操作與單因素方差分析過程一致。2023/2/4版權(quán)所有BY統(tǒng)計學(xué)課程組40分析過程2023/2/441計算與決策解:(1)建立假設(shè)H0:μ1=μ2=…=μm;H1:μ1,
μ2,…,
μm不
全相等
(2)計算有關(guān)均值及平方和
ST=1175.913,SE=422,SA=753.913
方差來源離差平方和S自由度均方離差F值組間SA=753.9133251.3043F=11.315組內(nèi)SE=4221922.21053總差異ST=1175.91322方差分析表(3)統(tǒng)計決策對于顯著性水平=0.05,F(xiàn)0.05(3.19)=3.1274由于檢驗統(tǒng)計量F=11.315>F0.05(3.19)
,所以拒絕原假設(shè)H0
,即有95%的把握認為不同的行業(yè)之間投訴的差異顯著。2023/2/4版權(quán)所有BY統(tǒng)計學(xué)課程組42計算與決策(1)點擊“工具”欄中的數(shù)據(jù)分析項;(2)在分析工具框中連擊“單因素方差分析”;(3)在對話框的“數(shù)據(jù)區(qū)域”框中鍵入A3:C6; 在α框中保持0.05不變(也可根據(jù)需要變?yōu)?.01); 在“輸出選項”中鍵入D3; 選擇“確定”,輸出結(jié)果如表7-9所示:2023/2/4版權(quán)所有BY統(tǒng)計學(xué)課程組43Excel中方差分析的計算步驟2023/2/444對四個行業(yè)的均值進行多重比較(=0.05)由題意及計算可知,k1=7,k2=6,k3=k4=5;第一步:提出假設(shè)假設(shè)1:H0:μ1=μ2;假設(shè)2:H0:μ1=μ3;假設(shè)3:H0:μ1=μ4假設(shè)4:H0:μ2=μ3;假設(shè)5:H0:μ2=μ4;假設(shè)6:H0:μ3=μ42023/2/4版權(quán)所有BY統(tǒng)計學(xué)課程組45第二步:計算檢驗統(tǒng)計量的值第三步:計算LSD。2023/2/4版權(quán)所有BY統(tǒng)計學(xué)課程組45對四個行業(yè)的均值進行多重比較(=0.05)2023/2/4版權(quán)所有BY統(tǒng)計學(xué)課程組46第四步:進行決策2023/2/4版權(quán)所有BY統(tǒng)計學(xué)課程組46由以上計算可知,檢驗統(tǒng)計量,,的值分別小于LSD1、LSD2、LSD4的值,顯示旅游業(yè)與居民服務(wù)業(yè)的投訴次數(shù)之間、旅游業(yè)與公路客運業(yè)投訴次數(shù)之間、居民服務(wù)業(yè)與公路客運業(yè)投訴次數(shù)之間沒有顯著差異;,,的值分別大于LSD3、LSD5、LSD6的值,顯示旅游業(yè)與保險業(yè)的投訴次數(shù)之間、公路客運業(yè)與保險業(yè)投訴次數(shù)之間有顯著差異。對四個行業(yè)的均值進行多重比較(=0.05)一、無交互作用的雙因素方差分析若記一因素為因素A,另一因素為因素B,對A與B同時進行分析,就屬于雙因素方差分析,即判斷是否有某一個或兩個因素對試驗指標(biāo)有顯著影響,兩個因素結(jié)合后是否有新效應(yīng)。在統(tǒng)計學(xué)中將各個因素的不同水平的搭配所產(chǎn)生的新的影響稱為交互作用。我們先討論無交互作用的雙因素方差分析問題,對于有交互作用的雙因素方差分析問題稍后再討論。2023/2/4版權(quán)所有BY統(tǒng)計學(xué)課程組47第三節(jié)雙因素方差分析假定因素A有r個水平:A1,A2,…,Ar
;因素B有s個水平:B1,B2,…,Bs
。在A的r個水平與B的s個水平的每種組合下作一次試驗,可得無交互作用的雙因素方差分析的數(shù)據(jù)結(jié)構(gòu)下表所示:2023/2/4版權(quán)所有BY統(tǒng)計學(xué)課程組48數(shù)據(jù)結(jié)構(gòu)因素B因素AB1B2…BS平均值A(chǔ)1x11x12…x1sA2x21x22…x2s………………Arxr1xr2…xrs平均值…
判斷因素A的影響是否顯著等價于檢驗假設(shè):
H01:μ1.=μ2.
=…=μi.
判斷因素B的影響是否顯著等價于檢驗假設(shè):H02:μ.1=μ.2
=…=μ.j
其中,μr
表示A的第i個水平所構(gòu)成的總體均值,
μs表示的B第j個水平所構(gòu)成的總體均值。2023/2/4版權(quán)所有BY統(tǒng)計學(xué)課程組49假設(shè)建立分解總離差平方和與單因素情況類似,能夠證明下列公式成立:
2023/2/4版權(quán)所有BY統(tǒng)計學(xué)課程組50自由度
由數(shù)理統(tǒng)計可以證明:當(dāng)時與單因素情況類似,可以證明ST、SA
、SB和SE的自由度分
別為2023/2/4版權(quán)所有BY統(tǒng)計學(xué)課程組51平方和分解定理平方和分解定理:設(shè)Q服從自由度為n的分布,又Q1+Q2+…+Qk=Q,其中,Q(i=1,2,3,…,k)是秩為fi的非負二次型,則Q相互獨立,并且服從自由度為fi的分布的充要條件是f1+f2+…+fk=n(這里不做證明,證明參見有關(guān)數(shù)理教材)。顯然,ST、SA
、SB和SE滿足平方和分解定理條件。2023/2/4版權(quán)所有BY統(tǒng)計學(xué)課程組52檢驗統(tǒng)計量由于SA反映因素A的各水平之間的差異,SB反映因素B的各水平之間的差異,SE反映在交互作用不顯著時試驗本身隨機誤差的大小。因此,可用以下統(tǒng)計量作為檢驗統(tǒng)計量:2023/2/4版權(quán)所有BY統(tǒng)計學(xué)課程組53雙因素(無交互作用)方差分析表方差來源方差S自由度f均方MSF值A(chǔ)的影響fA=r-1MSA=SA/fAFA=MSA/MSEB的影響fB=s-1MSB=SB/fBFB=MSB/MSE誤差fE=(r-1)(s-1)MSE=SE/fE總和fT=rs-12023/2/4版權(quán)所有BY統(tǒng)計學(xué)課程組54【例】為提高某種產(chǎn)品的合格率,考察原料用量和來源地對其是否有影響。原料來源地有三個:甲、乙、丙;原料用量有三種:現(xiàn)有量、增加5%、增加8%。每個水平組合各作一次試驗,得到的數(shù)據(jù)如表下所示。試分析原料用量和來源地對產(chǎn)品合格率的影響是否顯著?2023/2/4版權(quán)所有BY統(tǒng)計學(xué)課程組55例題例題數(shù)據(jù)原料用量原料來源地現(xiàn)有量B1增加5%B1增加8%B1甲地A1597066乙地A2637470丙地A36166712023/2/4版權(quán)所有BY統(tǒng)計學(xué)課程組56例題分析解:(1)建立假設(shè)H01:μ1.=μ2.=μ3.H02:μ.1=μ.2=μ.3
(2)計算相應(yīng)的均值和平方和:2023/2/4版權(quán)所有BY統(tǒng)計學(xué)課程組57(3)列方差分析表
方差分析表方差來源方差S自由度f均方MSF值因素ASA=26fA=2MSA=26/2=13FA=13/7=1.86因素BSB=146fB=2MSB=146/2=73FB=73/7=10.43誤差SE=28fE=4MSE=28/4=7總和ST=200fE=82023/2/4版權(quán)所有BY統(tǒng)計學(xué)課程組58例題分析(4)統(tǒng)計決策
對于顯著性水平=0.05,查表得臨界值F0.05(2,4)=6.94,
因為FA=1.86<F0.05(2,4),故不能拒絕H01;FB=1.86<F0.05(2,4),故拒絕H02.
即根據(jù)現(xiàn)有數(shù)據(jù),有95%的把握可以推斷原料來源地對產(chǎn)品合格率的影響不大,而原料用量對合格率有顯著影響。由于,說明B2
為最優(yōu)水平。既然原料來源地對產(chǎn)品合格率的影響不顯著,在保證質(zhì)量的前提下,可以選擇運費最省的地方作為原料來源地選擇時的首選。如果丙地的運費最省,則最優(yōu)方案為B2A3。
2023/2/4版權(quán)所有BY統(tǒng)計學(xué)課程組59例題分析以例7.2為例,設(shè)數(shù)據(jù)輸入到Excel工作表的區(qū)域為A2:C4,再按以下步驟進行:(1)點擊“工具”欄中的數(shù)據(jù)分析項。(2)分析工具框中連擊“方差分析:無重復(fù)的雙因素方差分
析”。(3)在對話框的“數(shù)據(jù)區(qū)域”框中鍵入B3:D5;在框中保持0.05不變(也可根據(jù)需要變?yōu)?.01);在“輸出選項”中
鍵入E2;選擇“確定”,輸出結(jié)果如表7-14所示:2023/2/4版權(quán)所有BY統(tǒng)計學(xué)課程組60Excel應(yīng)用無重復(fù)雙因素分析方差分析結(jié)果
方差分析:無重復(fù)雙因素分析SUMMARY觀測數(shù)求和平均方差行131956531行232076931行331986625列13183614列232107016列33207697方差分析差異源SSdfMSFP-valueFcrit行262131.85710.26896.9443列14627310.42860.02596.9443誤差2847總計2008
2023/2/4版權(quán)所有BY統(tǒng)計學(xué)課程組61交互作用,簡單來說就是不同因素對試驗指標(biāo)的復(fù)合作用,因素A和B的綜合效應(yīng)不是二因素效應(yīng)的簡單相加。為了能分辨出兩個因素的交互作用,一般每組試驗至少作兩次。數(shù)據(jù)結(jié)構(gòu):設(shè)因素A有r個水平:A1,A2,…,Ar;因素B有s個水平:B1,B2,…,Bs;則共有rs個水平組合,每個水平組合(試驗條件)重復(fù)t次試驗,每次試驗結(jié)果用xijk(i=1,2,…,r;j=1,2,…,s;k=1,2,…,t)表示,其數(shù)據(jù)結(jié)構(gòu)如表7-15所示:2023/2/4版權(quán)所有BY統(tǒng)計學(xué)課程組62二、有交互作用的雙因素方差分析表7-15有交互作用的雙因素方差分析數(shù)據(jù)結(jié)構(gòu)B1B2…BsA1x111,x112,…,x11tx121,x122,…,x12t…x1s1,x1s2,…,x1stA2x211,x212,…,x21tx221,x222,…,x22t…x2s1,x2s2,…,x2st……………Arxr11,xr12,…,xr1txr21,xr22,…,xr2t…xrs1,xrs2,…,xrst2023/2/4版權(quán)所有BY統(tǒng)計學(xué)課程組632.建立假設(shè)設(shè)xijk~N(μijk,σ2),各xijk相互獨立,μijk和σ2均為未知參數(shù),于是有xijk=μijk+εijkεijk~N(0,σ2
),各εijk相互獨立,并記:2023/2/4版權(quán)所有BY統(tǒng)計學(xué)課程組64我們稱i為水平Ai的效應(yīng),j為水平Bj的效應(yīng),rij為水平Ai和Bj的交互效應(yīng),μ為平均數(shù)。顯然有:獨立。2023/2/4版權(quán)所有BY統(tǒng)計學(xué)課程組65以上為雙因素方差分析的數(shù)學(xué)模型。對這一模型可設(shè)如下三個假設(shè):
H01:σ1=σ2=…=σr=0 H02:1=2=…=s=0 H03:γ11=γ12=…=γrs=02023/2/4版權(quán)所有BY統(tǒng)計學(xué)課程組663.方差分析
與單因素方差分析的平方和分解類似,有2023/2/4版權(quán)所有BY統(tǒng)計學(xué)課程組672023/2/4版權(quán)所有BY統(tǒng)計學(xué)課程組68數(shù)理統(tǒng)計可以證明:因此可用如下的檢驗統(tǒng)計量對H01,H02,H03進行檢驗:2023/2/4版權(quán)所有BY統(tǒng)計學(xué)課程組69表7.16雙因素(有交互作用)方差分析表方差來源方差S自由度f均方MSF值因素ASAfA=r-1MSA=SA/fAFA=MSA/MSE因素BSBfB=s-1MSB=SB/fBFB=MSB/MSE因素A*BSA*BfA*B=(r-1)(s-1)MSA*B=SA/fA*BFA*B=MSA*B/MSE誤差SEfE=rs(t-1)MSE=SE/fE總和STfE=rst-12023/2/4版權(quán)所有BY統(tǒng)計學(xué)課程組70
例7.3某公司想將橡膠、塑料和軟木的板材沖壓成密封墊片出售。市場上有兩種不同型號的沖壓機可供選擇。為了能對沖壓機每小時所生產(chǎn)的墊片數(shù)進行比較,并確定哪種機器使用何種材料生產(chǎn)墊片的能力更強,該公司使用每臺機器對每一種材料分別運行三段時間,得到的試驗數(shù)據(jù)(每小時生產(chǎn)的墊片數(shù))如表7-16所示,試運用方差分析確定最優(yōu)方案。2023/2/4版權(quán)所有BY統(tǒng)計學(xué)課程組71表7.17墊片材料和沖壓機的數(shù)據(jù)資料單位:千個
墊片材料沖壓機橡膠B1塑料B2軟木B3A13.364.014.313.423.944.273.483.894.4A23.913.483.943.83.533.813.853.423.992023/2/4版權(quán)所有BY統(tǒng)計學(xué)課程組72解:建立假設(shè):
H01:σ1=σ2=…=σr=0 H02:1=2=…=s=0 H03:γ11=γ12=…=γrs=0
(2)計算相應(yīng)的均值和平方和:2023/2/4版權(quán)所有BY統(tǒng)計學(xué)課程組73
表7.18結(jié)構(gòu)均值表2023/2/4版權(quán)所有BY統(tǒng)計學(xué)課程組74j=1j=2j=3i=13.8978i=2
=3.47673.63673.71174.12
=3.42
=3.9467
=4.3267
=3.8533
=3.9133(3)列方差分析表(7-19)表7.19方差分析表方差來源方差S自由度f均方MSF值因素ASA=0.10125fA=1MSA=0.10125FA=MSA/MSE=23.01因素BSB=0.8118fB=2MSB=0.4059FB=MSB/MSE=92.25因素A*BSA*B=0.768fA*B=2MSA*B=0.389FA*B=MSA*B/MSE=88.41誤差SE=0.05273fE=12MSE=0.0044總和ST=1.734fE=172023/2/4版權(quán)所有BY統(tǒng)計學(xué)課程組75(4)統(tǒng)計決策 由于FA=23.01>F0.05(2,12)=3.89,FB=92.25>F0.05(2,12)=3.89,FA*B=88.41>F0.05(2,12)=3.89
說明不僅沖壓機的型號和墊片材料對墊片數(shù)量有顯著影響,而且其交互作用也是顯著的。 由結(jié)構(gòu)均值表可知,在沖壓機中,第一種的均值較大;墊片材料中,木的均值較大,故最優(yōu)方案是A1B3。2023/2/4版權(quán)所有BY統(tǒng)計學(xué)課程組76
以例7.3為例,將數(shù)據(jù)輸入到Excel工作表的區(qū)域為B2:D7,沖壓機的二個水平A1、A2在第一列,墊片材料的水平B1、B2、B3在第一行。再按以下步驟進行:(1)點擊“工具”欄中的數(shù)據(jù)分析項。(2)分析工具框中連擊“方差分析:可重復(fù)雙因素方差分析”。(3)在對話框的“數(shù)據(jù)區(qū)域”框中鍵入A1:D7;在“每一樣本的行數(shù)”框中鍵入3。 在框中保持=0.05不變(也可根據(jù)需要變?yōu)?.01); 在“輸出選項”中鍵入空白地方,如F2; 選擇“確定”,輸出結(jié)果如表7-20所示:2023/2/4版權(quán)所有BY統(tǒng)計學(xué)課程組77有交互作用的雙因素方差分析中的Excel應(yīng)用7-20有重復(fù)雙因素方差分析結(jié)果SUMMARY橡膠B1塑料B2軟木B3總計A1
觀測數(shù)3339求和10.2611.8412.9835.08平均3.423.9466674.3266673.897778方差0.00360.0036330.0044330.158394A2
觀測數(shù)3339求和11.5610.4311.7433.73平均3.8533333.4766673.9133333.747778方差0.0030330.0030330.0086330.045694總計
觀測數(shù)666求和21.8222.2724.72平均3.6366673.7116674.12方差0.0589870.0689370.05648方差分析差異源SSdfMSFP-valueFcrit樣本0.1012510.1012523.040460.0004344.747225列0.81194420.40597292.383065.15E-083.885294交互0.76803320.38401787.386857.03E-083.885294內(nèi)部0.052733120.004394總計1.73396117
由表7-20于檢驗行因素沖壓機A(Excel表中為“樣本”)、用于檢驗列因素墊片材料B、用于檢驗沖壓機A和墊片材料B交互作用A*B的p值均小于0.05,故不僅因素A和B對試驗指標(biāo)有顯著影響,而且其交互作用也是顯著的。由于A1的試驗指標(biāo)均值大于A2的試驗指標(biāo)均值,B3的試驗指標(biāo)均值大于B1和B2的試驗指標(biāo)均值,故最優(yōu)方案應(yīng)為A1B3,買第一種型號的沖壓機、采用軟木材料,這種組合的單位時間內(nèi)生產(chǎn)的墊片最多。2023/2/4版權(quán)所有BY統(tǒng)計學(xué)課程組79一、試驗設(shè)計的概念和設(shè)計原則試驗設(shè)計有三個基本原則:重復(fù)性、隨機化和區(qū)組化。(1)重復(fù)性原則:重復(fù)性是指對一項試驗要在相同的條件下重復(fù)進行若干次。只有進行多次的試驗,才能掌握其規(guī)律性。(2)隨機化原則:隨機化是指試驗材料和試驗地點都要隨機地確定。這樣進行試驗得出的結(jié)論才具有客觀性和普遍性,且每次進行的試驗都可認為是相互獨立的。(3)區(qū)組化原則:一組試驗,試驗者總希望在相同或近似相同的條件下進行,以便在相互比較中得出正確的結(jié)論。2023/2/4版權(quán)所有BY統(tǒng)計學(xué)課程組80第四節(jié)正交試驗設(shè)計初步第一、盡量減少試驗誤差。在試驗時,要盡可能使對試驗產(chǎn)生影響的其他因素達到理論中要求的精確程度,這樣我們在對目的指標(biāo)進行測算時才能達到較為客觀的結(jié)果。在一項試驗中誤差是必然存在的,我們的目的就是要盡量減少該誤差。第二、盡量減少試驗次數(shù)。試驗的次數(shù)越多,進行試驗所耗費的人力、物力也就會相應(yīng)地增多,最佳的試驗就是用盡可能少的費用來獲得最有效的試驗結(jié)果。第三、所設(shè)計的試驗要便于對指標(biāo)值進行統(tǒng)計分析。影響一個事件的指標(biāo)是多樣的,在進行設(shè)計時要選擇比較容易測算且對事件影響較大的指標(biāo)進行計算。2023/2/4版權(quán)所有BY統(tǒng)計學(xué)課程組81在安排試驗時需要注意三點:
在現(xiàn)實問題中,影響試驗指標(biāo)的因素通常有很多個,要考察它們就涉及多因子的試驗設(shè)計問題。多因子試驗中一個很困難的問題就是因子數(shù)較多,而又需要進行多次的試驗。例如,有10個因子對某一指標(biāo)有顯著影響,而每個因子取兩個水平進行比較,那么就有210=1024個不同的水平組合,即每個水平組合作一次試驗,就需要進行1024次試驗,耗費的人力、財力可想而知,這在實際中是不可行的。因此,需要按照一定的方法從中選擇一部分進行試驗。常用的試驗設(shè)計方法有正交試驗設(shè)計法、參數(shù)設(shè)計法、回歸設(shè)計法、均勻設(shè)計法、混料設(shè)計法等。限于篇幅,這里僅介紹正交試驗設(shè)計的基礎(chǔ)知識,其他方法請讀者自行閱讀試驗設(shè)計的有關(guān)書籍。2023/2/4版權(quán)所有BY統(tǒng)計學(xué)課程組82
在多因子試驗中,各因子又有不同的水平數(shù),我們的目的是要從這些因子不同的水平組合中,找出一組或幾組組合使所要求的指標(biāo)達到最優(yōu)。下面以一個二因子的例子來具體認識一下多因子試驗問題。例7.4為提高合金鋼的強度,同時考慮碳(C)含量(因子)及鈦(Ti)與鋁(AL)的含量(因子)對強度Y的影響,希望找出最佳的含量組合,使強度Y達到最大(表7-21)。2023/2/4版權(quán)所有BY統(tǒng)計學(xué)課程組83二、多因子試驗問題2023/2/4版權(quán)所有BY統(tǒng)計學(xué)課程組84表7-21合金鋼的試驗數(shù)據(jù)2023/2/4版權(quán)所有BY統(tǒng)計學(xué)課程組85
一個因子的水平好壞或好壞的程度受另一個因子水平制約的情況,稱為因子A和B的交互作用,記作或AB。因子A和B的交互作用可以用圖形較為直觀地表示。
2023/2/4版權(quán)所有BY統(tǒng)計學(xué)課程組86三、交互作用2023/2/4版權(quán)所有BY統(tǒng)計學(xué)課程組87
因子間的交互作用會隨著因子個數(shù)的增加而增加。如四個因子A,B,C,D間的交互作用有以下幾類:(1)二級交互作用有6個:AB,
AC,
AD,
BC,
BD,
CD;(2)三級交互作用有4個:ABC,
ABD,
ACD,
BCD;(3)四級交互作用有1個:ABCD。交互作用共有11個,比因子個數(shù)還多。實踐經(jīng)驗表明,多數(shù)交互作用是不存在或者很小以至可以忽略不計的,一般我們主要考慮部分二級交互作用,但具體考察哪些二級交互作用還要根據(jù)下面的方法來決定。2023/2/4版權(quán)所有BY統(tǒng)計學(xué)課程組88
正交試驗設(shè)計法是利用正交表科學(xué)地挑選試驗條件,合理安排試驗的方法,是研究與處理多因素試驗的一種科學(xué)方法。正交設(shè)計有兩個重要的特點:(1)任意一對因子(也稱因素)的任一水平組合必在試驗中出現(xiàn),且出現(xiàn)的次數(shù)相同;(2)總試驗次數(shù)比全面試驗(所有因子的任一水平組合都進行搭配)要少許多次。例如,對7個二水平因子進行全面試驗要進行27=128次,而用正交表安排試驗只需要作8次。用正交表合理地安排試驗,可以做到省時、省力、省錢,還能得到令人滿意的檢驗效果,因此這種方法在改進產(chǎn)品質(zhì)量、研究采用新工藝、試制新產(chǎn)品、了解設(shè)備工藝性能以及改進技術(shù)管理等方面都有廣泛的應(yīng)用。2023/2/4版權(quán)所有BY統(tǒng)計學(xué)課程組89四、正交表及其類型
正交表是正交設(shè)計的工具,是運用組合數(shù)學(xué)理論在正交拉丁方的基礎(chǔ)上構(gòu)造的一種規(guī)格化表格,符號為:其中,L為正交表符號;
n為正交表的行數(shù)(試驗次數(shù),試驗方案數(shù));
j為正交表中每一列因子的水平個數(shù);
i為正交表的列數(shù)(試驗因子的個數(shù))。
2023/2/4版權(quán)所有BY統(tǒng)計學(xué)課程組901.正交表及其特性
例如,表示一張8行7列,每列有兩個水平的正交表(表7-22),它表示在這個試驗中,要作8次不同條件的試驗,共有7個影響因素,每個因素都有兩個水平,我們稱這張表為兩水平的正交表。2023/2/4版權(quán)所有BY統(tǒng)計學(xué)課程組912023/2/4版權(quán)所有BY統(tǒng)計學(xué)課程組92
正交表具有正交性,這是指它有如下兩個特征:(1)每列中不同的數(shù)字重復(fù)的次數(shù)相同。在表7.22中,每列有兩個不同的數(shù)字:1,2,每一個各出現(xiàn)4次。(2)將任意兩列的同行數(shù)字看成一個數(shù)對,那么任意可能數(shù)對重復(fù)的次數(shù)相等。在
中,任意兩列有4種可能數(shù)對:(1,1),(1,2),(2,1),(2,2),每一對各出現(xiàn)2次。2023/2/4版權(quán)所有BY統(tǒng)計學(xué)課程組932023/2/4版權(quán)所有BY統(tǒng)計學(xué)課程組942.正交表的分類正交表安排試驗的步驟如下:(1)明確試驗?zāi)康?,確定要考察的試驗指標(biāo)。(2)確定要考察的因子和因子的水平。(3)選用合格的正交表,進行表頭設(shè)計。(4)根據(jù)試驗號的安排進行試驗,并記錄試驗指標(biāo)的具體數(shù)據(jù)。(5)數(shù)據(jù)分析。對一個正交表形式的試驗設(shè)計通常有三種分析方法:一是用極差分析各因子對指標(biāo)影響程度的大小,這是一種較為簡單的直觀分析方法;二是用方差分析進行數(shù)據(jù)分析;三是貢獻率分析法。2023/2/4版權(quán)所有BY統(tǒng)計學(xué)課程組95五、無交互作用情況下的設(shè)計例7.5某化工廠生產(chǎn)的一種產(chǎn)品的收率較低,為此希望通過試驗提高收率。在試驗中考察如下三個因子三個水平(表7-23):表7-23因子水平表
2023/2/4版權(quán)所有BY統(tǒng)計學(xué)課程組96解由于所考察的因子是三水平的,因此選用三水平正交表,又現(xiàn)在只考察三個因子,故選擇安排試驗。選定了正交表后把因子放在正交表的列上去,稱為表頭設(shè)計。在例7.5中將三個因子置于前三列,將它寫成如下的表頭設(shè)計形式:
2023/2/4版權(quán)所有BY統(tǒng)計學(xué)課程組97九次試驗的結(jié)果——收率(%)分別是:516158726959878584(一)用極差分析各因子對指標(biāo)影響程度的大小1.用直觀分析表對該試驗進行分析為方便起見,把試驗結(jié)果寫在正交表的右邊一列上,并分別用表示,所有計算可以在表上進行。2023/2/4版權(quán)所有BY統(tǒng)計學(xué)課程組98
首先來看第一列,該列中的1,2,3分別表示因子的三個水平,按水平號將數(shù)據(jù)分為三組:“1”對應(yīng),“2”對應(yīng),“3”對應(yīng)。在第二列,該列中的1,2,3分別表示因子B的三個水平,按水平號將數(shù)據(jù)分為三組:“1”對應(yīng),“2”對應(yīng),“3”對應(yīng)。同理我們可以從圖中得到第三列的情況。2023/2/4版權(quán)所有BY統(tǒng)計學(xué)課程組99
分別對每一列每個水平的數(shù)據(jù)進行相加,得到這個水平下該因子對應(yīng)指標(biāo)值的和,例如,2023/2/4版權(quán)所有BY統(tǒng)計學(xué)課程組100
同理我們可以得到對應(yīng)C水平的T1,T2,T3的值,用每個水平得出的Ti的值去除以3就得到其均值。由以上計算可知,每個因子下間的差異反映了這個因子三個水平間的差異;分別對三個因子的各個水平進行數(shù)值大小比較:因子A的三個水平均值差異較大,其第三個水平的均值最大,故因子A的三水平最好。對第二、三列進行類似地分析,可知因子B的第二個水平好,因子C的第二個水平好。
2023/2/4版權(quán)所有BY統(tǒng)計學(xué)課程組101對第四列也可以進行上述分析,按其中的1,2,3分別將數(shù)據(jù)分為三組,但三組的水平組合相同,因此該列僅反映誤差。綜上可知,使指標(biāo)達到最佳的水平組合是,即反應(yīng)溫度為90度、加堿量為48公斤、選取乙類催化劑可以使轉(zhuǎn)化率達到最大。2023/2/4版權(quán)所有BY統(tǒng)計學(xué)課程組102
一個因子的極差是該因子各水平均值的最大值與最小值之差,如果該值大,則說明改變這一因子的水平會對指標(biāo)造成較大的變化,所以該因子對指標(biāo)的影響大,反之,則影響小。極差最大的列所對應(yīng)的因子是最主要因子。當(dāng)要求指標(biāo)愈高愈好時,可選R行中最大者,所對應(yīng)的水平為優(yōu)水平;當(dāng)要求指標(biāo)愈低愈好時,可選R行中最小者其所對應(yīng)的水平為優(yōu)水平。2023/2/4版權(quán)所有BY統(tǒng)計學(xué)課程組1032.用極差分析各因子對指標(biāo)影響程度的大小在例7.5中各個因子的極差分別是:它們被置于表7-24的最下方一行。從三個因子的極差可知因子A的影響最大,其次是C,而因子B的影響則最小,通常記為
2023/2/4版權(quán)所有BY統(tǒng)計學(xué)課程組1042023/2/4版權(quán)所有BY統(tǒng)計學(xué)課程組105表7-24例7.5的直觀分析計算表
用方差分析方法來說明影響指標(biāo)的因子的分析步驟如下:1.建
溫馨提示
- 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
- 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
- 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
- 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負責(zé)。
- 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請與我們聯(lián)系,我們立即糾正。
- 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時也不承擔(dān)用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。
最新文檔
- 2025年度假旅游項目建議書
- 2025年生物質(zhì)氣化機組項目發(fā)展計劃
- 2025年軌道車輛門系統(tǒng)合作協(xié)議書
- 鋼支撐支護工程 現(xiàn)場質(zhì)量檢驗報告單
- 2025年壬二酸項目發(fā)展計劃
- 動物用藥品零售企業(yè)ESG實踐與創(chuàng)新戰(zhàn)略研究報告
- 化痰止咳平喘中成藥批發(fā)企業(yè)數(shù)字化轉(zhuǎn)型與智慧升級戰(zhàn)略研究報告
- 硫酸銨(金屬硫酸鹽)企業(yè)數(shù)字化轉(zhuǎn)型與智慧升級戰(zhàn)略研究報告
- 篷房企業(yè)ESG實踐與創(chuàng)新戰(zhàn)略研究報告
- 紙漿及原料企業(yè)數(shù)字化轉(zhuǎn)型與智慧升級戰(zhàn)略研究報告
- 小學(xué)二年級下冊《勞動》教案
- 2025年河南機電職業(yè)學(xué)院單招職業(yè)技能考試題庫完整
- 2025年湖南生物機電職業(yè)技術(shù)學(xué)院單招職業(yè)技能測試題庫及參考答案
- 2025年深圳市高三一模英語試卷答案詳解講評課件
- 2025年黑龍江旅游職業(yè)技術(shù)學(xué)院單招職業(yè)適應(yīng)性測試題庫一套
- 山東省聊城市冠縣2024-2025學(xué)年八年級上學(xué)期期末地理試卷(含答案)
- 敲響酒駕警鐘堅決杜絕酒駕課件
- 2025年濰坊工程職業(yè)學(xué)院高職單招高職單招英語2016-2024歷年頻考點試題含答案解析
- 2025年江西青年職業(yè)學(xué)院高職單招職業(yè)技能測試近5年常考版參考題庫含答案解析
- 2025-2030年中國羽毛球行業(yè)規(guī)模分析及投資前景研究報告
- 凝血七項的臨床意義
評論
0/150
提交評論