方差分析與試驗設(shè)計【完成大部分】_第1頁
方差分析與試驗設(shè)計【完成大部分】_第2頁
方差分析與試驗設(shè)計【完成大部分】_第3頁
方差分析與試驗設(shè)計【完成大部分】_第4頁
方差分析與試驗設(shè)計【完成大部分】_第5頁
已閱讀5頁,還剩61頁未讀, 繼續(xù)免費閱讀

下載本文檔

版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進行舉報或認領(lǐng)

文檔簡介

6方差分析與實驗設(shè)計方差分析引論方差分析:k個總體均值相等性檢驗多重比較方法實驗設(shè)計:完全隨機化設(shè)計實驗設(shè)計:隨機化區(qū)組設(shè)計析因?qū)嶒炇裁词欠讲罘治隼耗彻驹趤喬靥m大、達拉斯以及西雅圖的工廠生產(chǎn)打印機與傳真機。為確定這些工廠中有多少員工了解全面質(zhì)量管理,從每個工廠選取一個由6名員工組成的隨機樣本,并對他們進行質(zhì)量意識考試。管理者想用這些數(shù)據(jù)來檢驗假設(shè):三個工廠的平均考分相同。ObservationAtlantaDallasSeattle185715927575643827362476746957169756858267樣本均值797466樣本方差342032樣本標準差5.834.475.66響應(yīng)變量、因子及處理兩個變量分別是工廠位置及質(zhì)量意識考試的分數(shù)。因為目的是判定亞特蘭大、達拉斯與西雅圖三個工廠的考分是否相同,所以考分就稱為因變量或響應(yīng)變量。工廠的位置為自變量或因子。用于研究的因子的值稱為因子水平或處理。本例中三個處理分別為亞特蘭大、達拉斯和西雅圖。方差分析的假定對每個總體,響應(yīng)變量服從正態(tài)分布。每個工廠的考試分數(shù)(響應(yīng)變量)必須服從正態(tài)分布。響應(yīng)變量的方差,對所有總體都相同。三個工廠考分的方差都相同。觀察值是獨立的。每個員工的考分都與其他員工的考分獨立。若樣本容量相等,方差分析對于總體服從正態(tài)分布的假定不敏感。問題的一般提法在上述假定條件下,判斷工廠位置對工廠的考分是否有顯著影響,實際上也就是檢驗具有同方差的三個正態(tài)總體的均值是否相等。如果三個總體的均值相等,可以期望三個樣本的均值也會很接近。三個樣本的均值越接近,推斷三個總體均值相等的證據(jù)也就越充分樣本均值越不同,推斷總體均值不同的證據(jù)就越充分總體方差的組間估計如果原假設(shè)成立,即H0:μ1=μ2=μ3意味著每個樣本都來自均值為μ、方差為2的同一正態(tài)總體xf(x)ObservationAtlantaDallasSeattle185715927575643827362476746957169756858267樣本均值797466樣本方差342032樣本標準差5.834.475.66總體方差的組內(nèi)估計如果備擇假設(shè)成立至少有一個總體的均值是不同的三個樣本分別來自均值不同的三個正態(tài)總體xf(x)1

236方差分析與實驗設(shè)計方差分析引論方差分析:k個總體均值相等性檢驗多重比較方法實驗設(shè)計:完全隨機化設(shè)計實驗設(shè)計:隨機化區(qū)組設(shè)計析因?qū)嶒灡粰z驗假設(shè)的一般形式H0:12…k

H1:1,2,,k不全相等令第j個處理的樣本均值第j個處理的樣本方差總體樣本均值如果每個樣本容量都為n,則總體方差的組間估計處理均方:總體方差的組間估計。處理平方和總體方差的組內(nèi)估計誤差均方

誤差平方和方差估計量的比較:F檢驗假定零假設(shè)為真,這時MSTR與MSE給出σ2的兩個獨立的無偏估計。對于正態(tài)分布,σ2的兩個獨立估計之比的抽樣分布服從F分布,其分子自由度為k-1,分母自由度為nT-k。aF(k-1,n-k)0拒絕H0不拒絕H0F方差估計量的比較:F檢驗k個總體均值相等性檢驗H0:12…k

H1:總體均值不全相等檢驗統(tǒng)計量顯著性水平α下的拒絕域ANOVA表ANOVA表:一種用來匯總方差分析計算和結(jié)果的表。包括顯示方差來源、平方和、自由度、均方和F值的列。總平方和

處理平方和

誤差平方和方差來源平方和自由度均方F處理5162258.009.00誤差4301528.67合計94617練習(xí)從3個總體中各選取了5個觀察值,得到如下資料。a.求σ2的組間估計量。(268)總體樣本均值:(153+169+158)/3=160,抽樣分布的方差:134/2=67,則組間估計量:67×4=268b.求σ2的組內(nèi)估計量。(92)組內(nèi)估計量:(96.67+97.33+82)/3=276/3=92觀察值樣本1樣本2樣本31165174169214916415431561801614142158148樣本均值153169158樣本方差96.6797.3382.00

d.構(gòu)造該問題的ANOVA表。(F=2.91<4.26,不能拒絕)方差來源平方和自由度均方F處理53622692.91誤差828992合計136411練習(xí)為檢驗三家工廠生產(chǎn)的機器混合一批原料所需平均時間是否相同,Jacobs化學(xué)公司得到了關(guān)于混合原料所需時間的如下數(shù)據(jù)。利用這些數(shù)據(jù)檢驗三家工廠混合一批原料所需平均時間是否相同。設(shè)α

=0.05。(F=10.64<4.26)方法完全同上例!制造商1制造商2制造商32028302626192431232227226方差分析與實驗設(shè)計方差分析引論方差分析:k個總體均值相等性檢驗多重比較方法實驗設(shè)計:完全隨機化設(shè)計實驗設(shè)計:隨機化區(qū)組設(shè)計析因?qū)嶒灦嘀乇容^方法多重比較方法:用于進行成對的總體均值或處理間比較的統(tǒng)計方法。用方差分析檢驗k個總體均值是否相等時,拒絕零假設(shè)只能得出總體均值不全相等的結(jié)論。有時我們需要進一步檢驗到底哪些均值之間有差異。FisherLSD方法FisherLSD

(最小顯著差異)方法例:通過方差分析,我們得出三個工廠總體平均考分不全相同的結(jié)論。這時,進一步的問題是:盡管我們承認這些工廠有差異,但到底差異出現(xiàn)在哪兩個廠之間呢?就是說,是總體1和總體2之間的均值不同,還是總體1和總體3之間的均值不同,還是總體2和總體3之間的均值不同?FisherLSD方法檢驗統(tǒng)計量拒絕法則式中,tα/2是基于自由度為nT-k的t分布。ObservationAtlantaDallasSeattle樣本均值797466樣本方差5.834.475.66樣本標準差342032方差來源平方和自由度均方F處理5162258.009.00誤差4301528.67合計94617基于統(tǒng)計量的FisherLSD方法檢驗統(tǒng)計量顯著性水平α下的拒絕法則式中使用FisherLSD方法的兩個總體均值之差的置信區(qū)間估計置信區(qū)間估計式中且tα/2是基于自由度為nT-k的t分布。第一類錯誤概率比較性第一類錯誤概率:對應(yīng)于單個配對比較的第一類錯誤概率。實驗性第一類錯誤概率:幾個配對比較中至少有1個犯第一類錯誤的概率,記為αEW。若總體個數(shù)較多,實驗性第一類錯誤概率則更大。控制實驗性錯誤概率Bonferroni修正在逐個檢驗中使用更小的比較性錯誤概率。如果要檢驗

C個配對比較并希望總的實驗性第一類錯誤的最大概率為

αEW,那么令比較性錯誤概率等于αEW/C對于固定的樣本容量,降低犯第一類錯誤的概率將導(dǎo)致犯第二類錯誤的概率增加。這類錯誤對應(yīng)于實際上兩個總體均值不相等,但卻接受了兩個總體均值相等的假設(shè)的情形。練習(xí)

觀察值樣本1樣本2樣本31165174169214916415431561801614142158148樣本均值153169158樣本方差96.6797.3382.00練習(xí)

觀察值樣本1樣本2樣本31165174169214916415431561801614142158148樣本均值153169158樣本方差96.6797.3382.00練習(xí)為檢驗三家工廠生產(chǎn)的機器混合一批原料所需平均時間是否相同,Jacobs化學(xué)公司得到了關(guān)于混合原料所需時間的如下數(shù)據(jù)。利用這些數(shù)據(jù)檢驗三家工廠混合一批原料所需平均時間是否相同。設(shè)α

=0.05。用FisherLSD方法檢驗廠家1與廠家3均值的相等性。(LSD=3.54,有顯著差異)用FisherLSD方法求總體1與總體2均值之差的95%的置信區(qū)間估計。(-8.54,-1.46)方法完全相同!制造商1制造商2制造商32028202626192431232227226方差分析與實驗設(shè)計方差分析引論方差分析:k個總體均值相等性檢驗多重比較方法實驗設(shè)計:完全隨機化設(shè)計實驗設(shè)計:隨機化區(qū)組設(shè)計析因?qū)嶒炘趯嶒炐匝芯恐?,感興趣的變量是明確規(guī)定的。因此,研究中的一個或多個因素可以被控制,使得數(shù)據(jù)可以按照因素如何影響變量來獲得。(因果關(guān)系)在觀察性或非實驗性研究中,則不去控制這些因素。(抽樣調(diào)查)單因子實驗只涉及到有k個總體或處理的一個因子的實驗。例:Chemitech開發(fā)了一種新的城市供水過濾系統(tǒng),其元件需從幾家供應(yīng)商處購買,然后Chemitech在位于南加州哥倫比亞的工廠裝配這些元件。由工程部負責確定新過濾系統(tǒng)的最佳裝配方法??紤]過各種可能之后,小組將范圍縮小至三種方法:方法A、方法B及方法C。這些方法在產(chǎn)品裝配步驟上有所不同。Chemitech的管理者希望確定哪種裝配方法每周生產(chǎn)的過濾系統(tǒng)數(shù)最大。完全隨機化設(shè)計處理被隨機地指派給實驗單元的一種實驗設(shè)計。假定從Chemitech的生產(chǎn)車間的全體裝配工人中抽取了由三名員工組成的樣本,這三名隨機抽取的工人被稱為實驗單元。隨機化的概念是所有實驗設(shè)計的一個重要原理。完全隨機化設(shè)計數(shù)據(jù)收集ObservationMethodAMethodBMethodC15858482646957355715946664475676849樣本均值626652樣本方差27.526.531.0樣本標準差5.245.155.57完全隨機化設(shè)計總體方差的組間估計總體方差的組內(nèi)估計方差估計量的比較:F檢驗ANOVA表方差來源平方和自由度均方F處理5202260.009.18誤差3401228.33合計86014完全隨機化設(shè)計配對比較結(jié)論:方法A與方法B要優(yōu)于方法C

練習(xí)

練習(xí)

6方差分析與實驗設(shè)計方差分析引論方差分析:k個總體均值相等性檢驗多重比較方法實驗設(shè)計:完全隨機化設(shè)計實驗設(shè)計:隨機化區(qū)組設(shè)計析因?qū)嶒灋闄z驗處理均值之間的差異,計算F值時使用了比值當外在因素(實驗中沒有考慮到的因素)引起的差異導(dǎo)致該比值中MSE項增大時,F(xiàn)值會變小。這樣,在實際中存在差異時,F(xiàn)值卻給出處理均值之間沒有差異的信號。隨機化區(qū)組設(shè)計區(qū)組劃分:在每個處理中使用相同或相近實驗單元的過程。目的是從誤差項中剔除外來方差,并因此給出總體或處理均值之間差異的更有力的檢驗方法。隨機化區(qū)組設(shè)計:采用區(qū)組劃分的一種實驗設(shè)計。例:空中交通管制員工作壓力測試一次衡量空中交通管制員的疲勞程度與工作壓力的研究得到的結(jié)果是建議改造并重新設(shè)計管制員工作站??紤]了工作站的若干設(shè)計方案后,由于三種方案最能減輕管制員壓力而被選出。關(guān)鍵問題是:三種方案對于管制員壓力的效果有多大差異?在完全隨機化實驗中,管制員的隨機樣本被指派給每個工作站方案。但是,管制員之間的差別是很大的。一名管制員認為是大的壓力對于另一名管制員來說可能是中等的壓力或甚至是小的壓力。將個人差異分離出來的一種辦法是使用隨機化區(qū)組設(shè)計。例:空中交通管制員工作壓力測試隨機化區(qū)組需要管制員的一個單個樣本,樣本中每個管制員都分別在三種工作站方案下接受檢驗。工作站是興趣因子,管制員為區(qū)組,與工作站因子有關(guān)的三個處理或總體分別對應(yīng)于三種工作站方案。為簡化起見,稱工作站方案為系統(tǒng)A、系統(tǒng)B、系統(tǒng)C。隨機化區(qū)組設(shè)計中的隨機化是指處理(系統(tǒng))指派給管制員的順序是隨機的。如果每個管制員測試三個系統(tǒng)的順序都是一樣的,任何觀察到的系統(tǒng)差異都可能歸因于檢驗順序而不是系統(tǒng)真正的差異。空中交通管制員壓力測試的隨機化區(qū)組設(shè)計處理系統(tǒng)A系統(tǒng)B系統(tǒng)C區(qū)組管制員1151518管制員2141414管制員3101115管制員4131217管制員5161316管制員6131313空中交通管制員壓力測試的壓力數(shù)據(jù)匯總處理區(qū)組合計區(qū)組均值系統(tǒng)A系統(tǒng)B系統(tǒng)C區(qū)組管制員11515184816.0管制員21414144214.0管制員31011153612.0管制員41312174214.0管制員51613164515.0管制員61313133913.0處理合計81789325214.0處理均值13.513.015.5ANOVA方法將總平方和分解成三部分:處理平方和、區(qū)組平方和以及誤差平方和。SST=SSTR+SSBL+SSE計算第1步:計算總平方和(SST)第2步:計算處理平方和(SSTR)第3步:計算區(qū)組平方和(SSBL)第4步:計算誤差平方和(SSE)計算方差來源平方和自由度均方F處理21210.510.5/1.9=5.53區(qū)組3056.0誤差19101.9合計7017隨機化區(qū)組設(shè)計在某些情形,區(qū)組的劃分是針對每個區(qū)組內(nèi)的“相似的”實驗單元而進行的。例如,假設(shè)在關(guān)于空中交通管制員的一個預(yù)先的測試中,管制員總體被分成從極高壓力組到極低壓力組的幾個組。通過讓來自壓力分類中每一類的三名管制員參加研究,仍然可以實現(xiàn)分區(qū)組。因為有b個區(qū)組導(dǎo)致自由度減少了b-1,所以隨機化區(qū)組設(shè)計的誤差自由度小于完全隨機化設(shè)計的誤差自由度。如果n很小,因為誤差自由度的減少,區(qū)組的潛在影響可能被掩蓋;當n很大時,這種影響被最小化了。練習(xí)考慮用如下隨機化區(qū)組設(shè)計的實驗結(jié)果,進行建立方差分析表所需的計算。用α

=0.05,檢驗顯著性差異。(F=6.58>4.46,拒絕)處理ABC區(qū)組1109821265318151442018185878練習(xí)對5種不同的審計方法的總審計時間進行比較。為控制屬于進行審計的個人的可能的方差,隨機選取了四名會計師當作實驗中的區(qū)組。由ANOVA方法得到下列數(shù)據(jù):SST=100,SSTR=45,SSBL=36。用α

=0.05檢驗5種審計方法平均總審計時間是否有顯著差異。(F=7.11>3.26,拒絕)6方差分析與實驗設(shè)計方差分析引論方差分析:k個總體均值相等性檢驗多重比較方法實驗設(shè)計:完全隨機化設(shè)計實驗設(shè)計:隨機化區(qū)組設(shè)計析因?qū)嶒炍鲆驅(qū)嶒炍鲆驅(qū)嶒灒涸试S進行關(guān)于兩個或兩個以上因子統(tǒng)計推斷的一種實驗設(shè)計。例:為嘗試提高考生在考試中的分數(shù),一所較大的得克薩斯州的大學(xué)考慮提供下面三種GMAT輔導(dǎo)課程:(1)3小時的復(fù)習(xí);(2)1天的課程;(3)10周的強化班。通常GMAT的考生來自三類院校:商學(xué)院、工學(xué)院和藝術(shù)與科學(xué)學(xué)院。兩因子實驗的GMAT分數(shù)BusinessEngineeringArtsandSciences3-hourreview5005404805804604001-dayprogram4

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負責。
  • 6. 下載文件中如有侵權(quán)或不適當內(nèi)容,請與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

最新文檔

評論

0/150

提交評論