假設(shè)試驗報告_第1頁
假設(shè)試驗報告_第2頁
假設(shè)試驗報告_第3頁
假設(shè)試驗報告_第4頁
假設(shè)試驗報告_第5頁
已閱讀5頁,還剩101頁未讀 繼續(xù)免費閱讀

下載本文檔

版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進行舉報或認(rèn)領(lǐng)

文檔簡介

假設(shè)試驗因研究蜜蜂的語言而榮獲諾貝爾獎

以蜂王為中心組成的井然有序的蜜蜂社會的生活,究竟是以什么樣的方式維持的呢?在很長一段時間,這是一大謎。特別是工蜂們的交流方式,人們幾乎一概不知。

澳大利亞出生的動物學(xué)家卡爾·馮·弗里奇(KarlvonFrisch)(1886-1982),通過孜孜不倦的實驗和觀察,揭示了蜜蜂是通過舞蹈的方式向同伴通報花和蜜源的地點。

在野外采集到蜜和花粉的蜜蜂返回蜂巢后,在蜂巢上起舞,因此被稱為“收獲舞”。同時,弗里奇還發(fā)現(xiàn),收獲舞有“圓形舞”和“擺尾舞”2種。他花了近40年的時間研究揭示出:蜜蜂用舞蹈的形式代替語言,向同伴通報花所在的距離和方位,對維護和繁榮自己所屬的蜂巢作出了貢獻(xiàn)。

弗里奇于1965年完成了《蜜蜂的舞蹈研究》這一大作。并且,在1973年,與尼可拉斯·丁伯根(NikolaasTinbergen)和康拉德·羅倫茲(KonradLorenz)同時榮獲了諾貝爾醫(yī)學(xué)生理學(xué)獎。以前不受人關(guān)注的動物行為學(xué)(Ethology)隨著這3名動物行動學(xué)家獲得了諾貝爾獎,取得了全球性進展。你在這里DOEDataAnalysisIMPROVEINSTRUCTORNOTES:HypothesistestingwasusedfordiscreteXsandcontinuousYs.RegressionisusedforcontinuousXsandYs.過程分析數(shù)椐分析組織原因假設(shè)試驗回歸分析控制定義測量改進分析目錄

檢測正態(tài)分布假設(shè)試驗概述比較兩組平均值:

t試驗

假設(shè)試驗的解釋比較兩組或更多組的平均值:ANOVA試驗

比較兩組或更多組的比例:χ2試驗復(fù)習(xí)檢測正態(tài)分布復(fù)習(xí):正態(tài)曲線定義:正態(tài)曲線是一種概率分布,最經(jīng)常發(fā)生的值位于中間,其他概率向兩側(cè)對稱下降。

此圖形有時稱為鐘形曲線。正態(tài)曲線概率標(biāo)準(zhǔn)正態(tài)分布將數(shù)據(jù)標(biāo)準(zhǔn)化為平均值=0標(biāo)準(zhǔn)偏差=1

正態(tài)分布使用實際數(shù)據(jù)平均值=17標(biāo)準(zhǔn)偏差=3

值Z值–30+3+2+1–2–1817262320111495.46%99.73%68.26%Z值:與標(biāo)準(zhǔn)正態(tài)值相同SX(興趣值)Z-=-3-2-10123平均值 = 0標(biāo)準(zhǔn)偏差= 1此標(biāo)尺上任何一處的Z值標(biāo)準(zhǔn)正態(tài)分布Z值興趣值遠(yuǎn)離平均值有多少個標(biāo)準(zhǔn)偏差Z值的概率標(biāo)準(zhǔn)正態(tài)曲線下的面積=概率Z值0的概率是多少?Z值2.84的概率是多少?-3-2-10123面積=1-3-2-10123概率=.5或50%面積=.5-3-2-10123興趣值面積=?P值=尾部面面積興趣值值以外外的曲線線下的的面積積處于或或超過過興趣趣值的的概率率小的P值(0到.05)意味著著:從該分分布產(chǎn)產(chǎn)生興興趣值值的概概率較較小。??赡苣軓钠淦渌址植籍a(chǎn)產(chǎn)生。。P值是興興趣值值的概概率興趣值興趣值興趣值興趣值P值=面積P值=面積A+BAB拒絕域域拒絕域域拒絕域域拒絕域域接受域域接受域域接受域域0123On-holdtime(min)并非所所有數(shù)數(shù)據(jù)都都呈正正態(tài)0123456#DefectsonInvoice

515253545CycleTime(days)僅在一一個方方向上上有長長尾巴巴的分分布被被稱為為不對對稱示例::使用用正態(tài)態(tài)曲線線計算算過程程均方差差要確定定過程程均方方差,找到超超出規(guī)規(guī)格界界限外外的缺缺陷面面積如果數(shù)數(shù)據(jù)不不是正正態(tài),,使使用方方法2((在測測量階階段已已討論論)估估計的的缺陷陷面積積就不不正確確,且且不能能如實實表示示過程程均方方差將正態(tài)方法用用于非正態(tài)數(shù)數(shù)據(jù)的后果USLUSL平均值陰影面積占多多大百分比??對于正態(tài)曲線線,此百分比比值是不同的的。受非正態(tài)數(shù)據(jù)影影響的方法方法非正態(tài)的結(jié)果果過程均方差計計算過程均方差值值不正確單值控制圖錯誤地發(fā)現(xiàn)某某些特殊原因因,丟失其它它信號假設(shè)試驗關(guān)于各組之間間差別的錯誤誤結(jié)論回歸錯誤地識別重重要因素;較較差的預(yù)測能能力實驗設(shè)計關(guān)于重要因素素的錯誤結(jié)論論;較差的預(yù)測能能力必須轉(zhuǎn)換非正正態(tài)數(shù)據(jù)(在高級課程中中講授)使用正態(tài)概率率圖檢查正態(tài)態(tài)以下是在Minitab(n=25)中生成的樣本本正態(tài)概率圖圖。Graph>ProbabilityPlot如果數(shù)據(jù)是正正態(tài),那些點點可連成一條條直線。直線表示在95%的置信范圍之之內(nèi)。如果大約95%的數(shù)數(shù)據(jù)點落在置置信范圍內(nèi),,可以說數(shù)據(jù)據(jù)是正

態(tài)的的。95%置信范圍什么是正態(tài)概概率圖?數(shù)據(jù)值在X軸上正態(tài)分布的百百分點在Y軸上(線條的的不等間隔是是故意設(shè)置的的)正態(tài)概率圖正態(tài)分布中有有十個間隔相等的百百分點間隔相等的百百分點將正態(tài)態(tài)曲線劃分為為相等的區(qū)域域百分點與正態(tài)態(tài)概率圖縱軸軸上的百分比比匹配2030107080905010%10%10%10%10%10%從兩個正態(tài)概概率圖得出的的結(jié)論結(jié)論偏離正態(tài)不嚴(yán)嚴(yán)重結(jié)論偏離正態(tài)嚴(yán)重重使用Minitab::

檢測正正態(tài)分布1. 在Minitab中打開一個新((空的)作業(yè)表表。2.根據(jù)平均值=10,,標(biāo)準(zhǔn)偏差=2的的正態(tài)分布生成由25個數(shù)據(jù)點點組成的隨機機樣本,然后保存在在C1中:Calc>RandomData>Normal>...使用Minitab::

檢測正正態(tài)分布(續(xù)續(xù))3.用剛保存在C1中的隨機數(shù)據(jù)據(jù)創(chuàng)建直方圖:Graph>Histogram>789101112131401234567C1頻率您的結(jié)果與此此圖不同使用Minitab::

檢測正正態(tài)分布(續(xù)續(xù))4.用保存在C1中的隨機數(shù)據(jù)據(jù)創(chuàng)建正態(tài)概率率圖:Graph>ProbabilityPlot您的結(jié)果與此此圖不同您得到什么結(jié)結(jié)論?假設(shè)試驗概述述什么是假設(shè)試試驗?假設(shè)試驗匯總總了數(shù)據(jù),這這樣您可檢測測到不同組之之間的差別。。假設(shè)試驗用于于在兩個組或或更多組之間間進行比較。。數(shù)據(jù)類型可以比較什么么示例連續(xù)比例供應(yīng)商A的的按時交貨貨比例是否與供應(yīng)商商B的相同?離散平均值變化形狀或分布三個班次的平平均產(chǎn)量是否否相同?采用新方法的的小組的結(jié)果果與采用舊方方法的小組的的結(jié)果相比變變化較小嗎??采用不同的方方法周期的分分布有何區(qū)別別?為什么使用假假設(shè)試驗?發(fā)現(xiàn)對于經(jīng)營營業(yè)務(wù)具有重重要意義的差差別。何時使用假設(shè)設(shè)試驗當(dāng)您需要比較較兩個組或更更多組的以下下因素時平均值可變性比例當(dāng)您無法確定定是否存在真真正的差別時時如何使用用假設(shè)試試驗確定適合合于您的的數(shù)據(jù)和和問題的的檢驗類類型在Minitab中合適安安排數(shù)據(jù)據(jù)從Statistics選項菜單單選擇適適當(dāng)?shù)臋z檢驗從Minitab輸出獲得得p值;如果果p<.05,則宣稱統(tǒng)統(tǒng)計上有有重大的的差異比較兩組組平均值值:t試驗t試驗:比較兩兩組平均均值的統(tǒng)統(tǒng)計檢驗驗使用稱為為t試驗(使用Minitab)的統(tǒng)計檢檢驗來判判斷兩組組平均值值之間的的差異。。t分布:比Z分布有更更大的變變化(因因此尾部部有不同同的面積積,這表表示不同同的P值)。其變化范范圍取決決于自由由度(df)。。我們不詳詳細(xì)解釋釋df;可把它看看作是估估計這兩兩組的平平均值和和標(biāo)準(zhǔn)偏偏差之后后樣本中中殘留的的信息量量。是適當(dāng)?shù)牡模驗闉槲覀児拦烙嬃似狡骄岛秃妥兓ǎú⒔?jīng)過過統(tǒng)計理理論證實實)。使用Minitab:比較兩組組的t試驗數(shù)據(jù):C:\ProcEx\Hypo_Mod\Research.MTW1.打開Minitab作業(yè)表。。它包含使使用標(biāo)準(zhǔn)準(zhǔn)方法的的100個生長周周期和使使用新方方法的50個生長周周期的時時間。2.按方法繪制研究時間間的分層點圖圖:Graph>Dotplot>(選擇‘Std’’和‘New’’作為變量量)>(選擇“eachcolumnconstitutesagroup”)3.對對這兩種種方法的的平均時時間之差差做t試驗:Stat>BasicStatistics>2Samplet……>Graphs>((選擇兩個個圖)不要選擇此框如果所有數(shù)據(jù)在一列中,而組標(biāo)簽在另一列中,則使用此按鈕

(我們使用的數(shù)據(jù)沒有這樣設(shè)

置)。使用Minitab:比較兩組組的t試驗(續(xù))使用Minitab:比較兩組組的t試驗(續(xù))使用Minitab:比較兩組組的t試驗(續(xù))結(jié)論因為P值很小(<.05),因此可得得出結(jié)論論:這兩兩種方法法的平均均研究時時間有統(tǒng)統(tǒng)計上重重大的差差異。(或者這兩種方方法的平平均研究究時間不不同。))注意:P值不是先先前報告告的.0007,因為使用用t分布比正正態(tài)分布布更適當(dāng)當(dāng)。兩個樣本本t試驗和置置信區(qū)間間Std與New的兩個樣樣本TN平均值StDevSE平均值muStd-muNew的95%CI(置信區(qū)間間):(0.35,1.49)t試驗muStd=muNew(與不是=):T=3.19P=0.0018DF=117t值觀察P值得出結(jié)結(jié)論。它它是否<.05?平均值的的標(biāo)準(zhǔn)誤誤差=平均值的的標(biāo)準(zhǔn)偏偏差Std-New平均值之之差的置置信區(qū)間間(下一頁中中討論))對話窗口口輸出解釋置信信區(qū)間95%置信區(qū)間間是應(yīng)包含這這兩組平均值之間的真真實差異異的值的的范圍。。它基于平平均值的的差異分分布,而而不是個個別觀測測數(shù)據(jù)之之間的差差異。它不表示示我們希希望的個個別生長長周期之之間的差差異值的的范圍;;該范圍圍應(yīng)該更更寬。如果組平平均值之之間沒有顯著差差異,置信區(qū)間將將包含0(即范圍從負(fù)負(fù)數(shù)[–]到正數(shù)[+])。。示例哪一組較快快?因為(AveSTD–AveNEW)是正數(shù),標(biāo)標(biāo)準(zhǔn)方法時時間較長,,而新方法法時間較短短(較快))。快多少?我我們有95%把把握認(rèn)為新方法平均均要比標(biāo)準(zhǔn)準(zhǔn)方法快大大約.35小時到1.49小時。個別值的差異分布平均值的差異分布(AveStd-AveNew)平均值差異的95%置信區(qū)間(.35小時到1.49小時);注意它不包含0解釋置信區(qū)區(qū)間(續(xù))t試驗總結(jié):比較較兩個平均均值t試驗是比較兩個平平均值的假假設(shè)試驗。假設(shè)兩組平平均值相同同。它們的差=0如果P值很小,則則拒絕該假假設(shè)。按照慣例,,如果P值<.05則被視為小小值常用符號虛(無效))假設(shè)H0:meanA=meanB替代(備擇擇)假設(shè)Ha:meanAmeanBt試驗總結(jié):比較兩兩個平均值(續(xù))步驟1.使用Minitab計算數(shù)數(shù)據(jù)的的t統(tǒng)計值值并提提供P值。2.如果P<.05,拒絕虛假設(shè)設(shè)(組平均均值相相同)),接受具有95%置信度度的備備擇假假設(shè)((組平平均值值不同同)。。3.如果P不是很很小(.05),,則可得得出結(jié)結(jié)論::拒絕絕虛假假設(shè)沒沒有足足夠的的證據(jù)據(jù)。有有下列列可能能的解解釋::a.這些組組相同同,或或b.變化過過大或或樣本本過小小無法法檢測測到差差異。。練習(xí)2:使用Minitab和t試驗比較兩兩組平平均均值目的::練習(xí)使使用Minitab進行t試驗以比較兩兩組平均均值并得得出結(jié)論論。時間:15分分鐘數(shù)據(jù):C:\ProcEx\Hypo_Mod\Techno.MTW背景:一個工具具材料供供應(yīng)商聲聲稱其產(chǎn)產(chǎn)品可增增加您部部門一臺臺極重要要的機器器的日加加工件數(shù)數(shù)。它安安排在該該月的前前五天((您的企企業(yè)最忙忙的時間間)進行行一次實實驗,以以演示該該產(chǎn)品。。下面是是實驗結(jié)結(jié)果,還還有上個個月前五五天的數(shù)數(shù)據(jù),以以便進行行比較。。日期件件數(shù)數(shù)材料8/110050Std8/29028Std8/312579Std8/48189Std8/513316Std9/110124New9/210860New9/315087New9/49633New9/512251New上個月當(dāng)月為了使條件一一致,加工檢檢驗僅比較白白班的完整加工周期。練習(xí)2:使用Minitab和t試驗比較兩組平均均值(續(xù))指示:1.使用Minitab分析數(shù)據(jù)。2.分小組討論并回答下下列問題。準(zhǔn)備報告您您的結(jié)論。a.數(shù)據(jù)是否支持持供應(yīng)商的聲聲稱?b.您是否將購買買該產(chǎn)品?c.如何提高確定定是否購買該該產(chǎn)品的決定定能力?d.購買該產(chǎn)品衍衍生的問題是是什么?練習(xí)2:答答案問題1:Minitab輸出練習(xí)2:答答案(續(xù))描述性統(tǒng)計數(shù)數(shù)字變量材料N平均值中值TrMeanStDev變量材材料SE平均值最小值最大值Q1Q3新方法平均值值要高959件兩種材料都有有相當(dāng)大的標(biāo)標(biāo)準(zhǔn)偏差。這這樣很難辨別別真實差異。。練習(xí)2:答答案(續(xù))問題1:Minitab輸出(續(xù))置信區(qū)間范圍圍從負(fù)數(shù)到正正數(shù),并包含含0P值.05兩個樣本t試驗和置信區(qū)區(qū)間材料的兩種樣樣本T材料N平均值標(biāo)標(biāo)準(zhǔn)偏偏差SE平均值mu(New)-mu(Std)的95%置置信區(qū)區(qū)間::(-2348,,4265)t試驗mu(New)=mu(Std)(對比不不等的的情況況):T=0.69P=0.51DF=7練習(xí)2::答案案(續(xù)續(xù))問題2a&2b::數(shù)據(jù)不不支持持供應(yīng)應(yīng)商的的聲稱稱。兩種方方法的的平均均日加加工件件數(shù)之之間沒沒有顯顯著差差異。。即使在在這5天天抽抽樣中中平均均多生生產(chǎn)959件件,,也沒沒有足足夠的的證據(jù)據(jù)可以以作為為購買買新材材料的的原因因。不不能將將差異異與隨隨機變變化區(qū)區(qū)別開開來。。問題2c&2d::改進分分析要提高高檢測測真實實差異異的能能力,,您可可:構(gòu)建一一個加加工變變化前前后((例如如前3個個月月)生生產(chǎn)的的件數(shù)數(shù)控制制圖,,以觀觀察這這五個個數(shù)據(jù)據(jù)點是是否適適合季季節(jié)或或月周周期。。收集更更多數(shù)數(shù)據(jù)((增大大樣品品大小小n)以進一步步減少平平均值的的變化。。比較工具具磨損模模式以檢檢測這兩兩種材料料中的其其它差異異。練習(xí)2:答案案(續(xù)))將t試驗應(yīng)用用于您的的企業(yè)考慮要點點考慮兩組組之間的的差異不不明顯—而兩組平平均值的的t試驗卻可能有有用這一一情況。。如果對您您的數(shù)據(jù)據(jù)使用t試驗,推測作作結(jié)論時時您所做做的假設(shè)設(shè)。(下一節(jié)我我們將深深入討論論。)需要澄清什么么問題?假設(shè)試驗的解解釋假設(shè)試驗如何何作用因為變化,沒沒有完全相似似的兩件事。。問題:您在樣樣本、組、過過程等等之間間看到的差異異是由于隨機的的普通原因變變化,還是由由于存在真實實差異。為了確定這點點,不同的假假設(shè)試驗可提提供不同方法法來評估在不不同情況下的的普通原因變變化。它們檢驗在該該情況下一個個差異是否明明顯要比預(yù)期期的普通原因因變化大。如果答案為否否,則差異沒沒有統(tǒng)計證據(jù)據(jù)。如果答案為是是,則可推斷斷這些組明顯顯不同。假設(shè)試驗使用用更大的樣本本,因為平均均值的變化隨隨著樣本大小小的增大而減減小。什么是假設(shè)試試驗?檢驗虛假設(shè)—H0:組之間沒有差差異與備擇假設(shè)相反—Ha:組不同獲得虛假設(shè)的的P值—使用數(shù)據(jù)和適適當(dāng)?shù)募僭O(shè)試試驗統(tǒng)計數(shù)字字獲得P值(使用Minitab)。如果P<.05,則拒絕H0并決定使用Ha如果P.05,,不能拒絕H0為何使用假設(shè)設(shè)試驗?當(dāng)無法確定是是否存在真實實差異時使用用假設(shè)試驗。。例如,分層點點圖顯示組平平均值之間沒沒有明顯差異異:您想知道平均均值的微小差差異是由于隨隨機變化還是是反映了真實實差異。假設(shè)試驗比分分層點圖提供供更明確的結(jié)結(jié)果(如果假假設(shè)滿足的話話)。假設(shè)試驗的假假設(shè)如果數(shù)據(jù)是連連續(xù)的,我們們假設(shè)基本分分布是正態(tài)。。您可能需要轉(zhuǎn)轉(zhuǎn)換非正態(tài)數(shù)數(shù)據(jù)(如周期期)。當(dāng)比較不同總體的組時,我們們假設(shè):獨立樣本。通過隨機抽樣實現(xiàn)。樣本是總體的的代表(沒有有偏差)。當(dāng)比較不同過程的組時,我們們假設(shè):每個過程都是是穩(wěn)定的。沒有特殊原因因或隨時間的的變化(沒有與時間相相關(guān)的差異))。樣本是過程的的代表(沒有有偏差)。這就是假設(shè)試驗是一種高級工具的原因。除非過程符合標(biāo)準(zhǔn),否則此假設(shè)不容易滿足P值定義假設(shè)試驗比較較觀測到的組之之間的差異。假設(shè)真實差異異為0(=虛假設(shè))),P值等于獲得觀觀測差異的概概率。P值范圍從0.0到1.0(0%可能性到100%可能性)。按照慣例,通通常將P<.05視作是差異明明顯的象征。如果P<.05,則可推斷真實實差異為0的概率很很小。討論:解釋P值有多種方法來來陳述根據(jù)P值得到的結(jié)論論。您認(rèn)為下下面哪些最容容易理解?P值用于判斷觀觀測到的組之之間差異是否否明顯大于普普通原因(隨隨機)變化((如果P<.05,結(jié)論是肯定的的)。如果P<.05,則拒絕H0而決定使用Ha。P<.05意味著組來自自相同分布的的概率小于5%。P值確定觀測到到的差異是否否在統(tǒng)計上看看較顯著(如如果P<.05,結(jié)論是肯定的的)。假設(shè)真實差異異為0,P值等于獲得觀觀測差異的概概率。如果P值很小(<.05),我們說觀測差差異必須顯著著,因為如果果沒有真實差差異,我們從從樣本中觀測測到這類差異異的概率就較較小。P值用于判斷拋拋棄虛假設(shè)是是否有足夠的的統(tǒng)計證據(jù)((如果P<.05,結(jié)論是肯定的的)。假設(shè)試驗的類類型假設(shè)試驗?zāi)康膖試驗成對t試驗ANOVA(F檢驗))((方差差的分分析))χ2試驗比較兩兩組平平均值值當(dāng)數(shù)據(jù)據(jù)匹配配時比比較兩兩組平平均值值比較兩兩組或或多組組平均均值比較兩兩組或或多組組方差差比較兩兩組或或多組組比例例將在高高級課課程中中解釋釋成對t試驗,,ANOVA和χ2試驗法法。Y(輸出))X(輸入))連續(xù)離散((比比例))離散(“組”))連續(xù)Χ2試驗t試驗成對t試驗ANOVA邏輯回回歸回歸不同數(shù)數(shù)據(jù)類類型的的適當(dāng)當(dāng)分析析方法法當(dāng)輸入入(X)變量是是離散散變量量時,,使用用假設(shè)設(shè)試驗驗。將離散散X當(dāng)作““分組組”或或由分層變變量來來看X。示例::如果果您希希望按產(chǎn)品比比較周周期,,那么么不同同產(chǎn)品品類型型就是是離散散X。如果X數(shù)據(jù)是是連續(xù)續(xù)的,,則使使用回回歸分分析判判斷它它們是是否與與輸出出(Y)變量相相關(guān)關(guān)。假設(shè)試試驗回歸分分析我使用用哪種種分析析方法法?否,X是連續(xù)續(xù)的回歸主主題χ2檢驗ANOVAt檢驗否,Y是離散散的((比例例)否,比比較更更多的的組((平均均值或或方差差)是是是是成對t試驗否,比比較兩兩個獨獨立的的組平平均值值將兩組組平均均值與與匹配配的數(shù)數(shù)據(jù)相相比較較X是否是是離離散的的?(組)Y是否是是連續(xù)續(xù)的??僅比較較2組嗎??Y1是否與與Y2匹配假設(shè)試試驗中中的兩兩種誤誤差實際(真相)組相同組不同接受Ho組相同結(jié)論或決定拒絕Ho

組不同沒有錯誤

第一類誤差沒有錯誤我們基基于假假設(shè)試試驗所所做的的任何何決定定都有有四種種可能能結(jié)果果:我我們可可決定定這些些組是是相同同還是是不同同,以以及我我們可可能是是對或或錯。。第二類類誤差差實際(真相相)無罪有罪無罪無罪有罪&釋放結(jié)論或或決定定有罪無罪&入監(jiān)獄獄有罪司法舉舉例:所有的的誤差差都是是重要要的偏重于于一類類誤差差會增增加產(chǎn)產(chǎn)生另另一類類誤差差的風(fēng)風(fēng)險增加采采樣樣樣本數(shù)數(shù)量:降低第第二類類風(fēng)險險可探測測到更更小的的差異異.α=一類誤誤差((TypeIError),β=二類誤誤差((TypeIIError)。SARS新藥臨臨床試試驗必必須設(shè)設(shè)立對對照組組,因因為對對照試試驗的的目的的為比比較新新藥與與對照照藥物物二組組治療療結(jié)果果的差差別有有無統(tǒng)統(tǒng)計學(xué)學(xué)顯著著意義義。由由于臨臨床治治療中中所獲獲得的的療效效可能能由藥藥物引引起,,也可可能由由非藥藥物的的因素素如休休息、、疾病病或癥癥狀自自愈等等引起起。當(dāng)當(dāng)A藥與B藥治療療結(jié)果果出現(xiàn)現(xiàn)差別別時,,首先要要確定定這種種差別別是藥藥物因因素造造成的的還是是非藥藥物因因素引引起的的,如A優(yōu)于B不是由由藥物物因素素引起起而是是非藥藥物因因素偶偶爾造造成,,稱為為假陽陽性。。統(tǒng)計計學(xué)上上用無無效假假設(shè)((NullHypothesis)來處理假假陽性誤差差,先假設(shè)A與B兩藥藥效之之間并無差差別,所出出現(xiàn)的差別別可能是非非藥物引起起的概率((Probability),當(dāng)這種種概率小到到一定程度度時,如<<5%或<1%,則前者者95%或后者99%的差別是是藥物之間間的差別所所引起,這這就顯示由由機遇(概概率)所造造成的可能能性很小,,從而否定定了前面假假定的無效效假設(shè),證證明A藥療效優(yōu)于于B藥不是概率率引起而是是藥物本身身存在療效效差別所引引起。臨床上把這這種可能存存在的假陽陽性誤差稱稱為I類誤差,用用α值表示,當(dāng)α=0.05,說明A優(yōu)于B的結(jié)論是在在95%顯著性水水平上排斥斥無效假設(shè)設(shè)的,也就就是說A優(yōu)于B由藥物因素素引起的可可能性為95%(置信度95%,仍有5%假陽性的的可能性;;若α=0.01,則A優(yōu)于B的假陽性只只有1%的可能性性.臨床試驗中中另一種誤差差為假陰性性誤差,用用β值表示。有時,A藥與B藥二藥之間實實際上存在著著藥物本身的的差別,但在在臨床試驗中中由于區(qū)別這這種差別的方方法不夠靈敏敏或能力有限限而區(qū)別不出出來,就是假假陰性誤差即即II類誤差,統(tǒng)計學(xué)上允允許假陰性誤誤差不能超過過20%,即β值一般定為0.1,不能>0.2。1-β為試驗中區(qū)別別兩種差別的的能力,即獲獲得A優(yōu)于B這一結(jié)果的把把握度,如β=O.2,則1-β=0.8,說明A優(yōu)于B的把握度為80%。在臨床試試驗設(shè)計中α值定得愈小,,A藥優(yōu)于B藥的顯著意義義愈大,假陽陽性愈小,但但試驗所需病病例數(shù)也就愈愈多;β值定得愈小,,1-β值就愈大,A藥優(yōu)于B藥的把握度就就愈大,但病病例數(shù)也就需需要愈多。通通常臨床試驗驗中。值可定定為0.05,β值定為0.2,已能滿足統(tǒng)統(tǒng)計學(xué)要求。。假設(shè)試驗中的的兩種誤差舉舉例:SARS新藥假設(shè)試驗驗重要差異與顯顯著差異顯著但不重要要的差異有時,您檢測測到一個統(tǒng)計計上顯著的差差異—但它小到對您您的企業(yè)沒有有實際的重要要性。示例:安裝機機器的兩種方方法新方法明顯要要比標(biāo)準(zhǔn)方法法快大約10分鐘。要證明實施新新方法的成本本是適當(dāng)?shù)模?,有必要減少少30分鐘。重要差異與顯顯著差異(續(xù))重要但不顯著著的差異有時,一個差差異在統(tǒng)計上上不能說是顯顯著的,但該該觀測差異對對于您的企業(yè)業(yè)而言卻很重重要。示例:密封容容器的兩種方方法在實驗時觀測測到每班增加加1000個容器。增加1000個個對企業(yè)很重要要。新技術(shù)有更高高的平均值,,但在統(tǒng)計上上卻不能宣稱稱有顯著的差差異(因為P.05)。觀測差異由于于隨機變化而而產(chǎn)生且不存存在真正的差差異,或者變變化太大(或或樣本大小太太?。┎荒軝z檢測到差異。。企業(yè)領(lǐng)導(dǎo)者需需要決定是否否值得冒險實實施新方法。。如果存在真正正的差異,您您最好實施新新方法。但是如果新方方法產(chǎn)生相同同的結(jié)果,則則只會徒勞無無功。在假設(shè)試驗中中處理非正態(tài)態(tài)連續(xù)數(shù)據(jù)方法找到一種使數(shù)數(shù)據(jù)近似為正正態(tài)的轉(zhuǎn)換方方法。對轉(zhuǎn)換的數(shù)據(jù)據(jù)進行“假設(shè)設(shè)試驗”。注意::數(shù)據(jù)據(jù)轉(zhuǎn)換換將在在高級級課程程中涵涵蓋。。比較兩兩組或或更多多組的的平均均值我采用用哪種種分析析方法法?Xs是否離散(組〕只比較2組組?Y1’s是否與Y2與Y2‘s相匹配?否,Xs連續(xù)回歸主題ANOVAt-試驗否,比較多組(平均值方差〕)是是配對t-試驗否,比較兩組獨立組平均值采用匹配數(shù)據(jù)比較兩組平均值比較平均值值?等方差試驗驗否,比較方方差)是Ys是否連續(xù)?X2否,Y離散比例例)是是討論:你你如何比較較7組?一個改進小小組有興趣趣比較一下下7個不同同的包裝材材料供應(yīng)商商,它們在在不同材料料上生產(chǎn)的的平均廢品品總量是否否存在任何何明顯差異異你如何進行行7個組的的比較?你如何能同同時發(fā)現(xiàn)7組的差異異?討論:答答案點圖有助于于你觀察比比較7個組組,但從數(shù)數(shù)學(xué)上,你你只能同時時比較2個個組,不能能同時比較較7個組。。如果你進行行配對比較較,每次次比較2組組,你最最終會做21個t試驗這沒有有效效的運用時時間和數(shù)據(jù)據(jù)(估計計方差)你也增加了了犯I類錯誤的可可能性(至少比較較之中有一一次)*我們必須尋尋求更好的的方法來同步比較較小組來有效利用用所有的數(shù)數(shù)據(jù)*TypeIerrorrate=1-(.95)21=.66=66%.方差分析以以尋找平均均值差異有一種統(tǒng)計計的方法是是運用方差差來同步比比較多個小小組的平均均值稱為ANOVA:方差分析與配對比較較平均值不不同,它將將組間方差差與組內(nèi)方方差進行比比較組間方差即即由該小組組平均值的的s2獲得組內(nèi)方差即即由各組的的s2與所有小組組合并后((或與與適當(dāng)?shù)淖宰杂啥冗M行行平均〕獲得如果組間方方差與組內(nèi)內(nèi)方差相同同,我們認(rèn)認(rèn)各為組間間平均值沒沒有差異分析方差而而非平均值值,續(xù)右圖有助于于理解7個個小組的““組間”和“組內(nèi)””方差(認(rèn)可每條線線為居中的的正態(tài)分布布)由圖可以看看出,組內(nèi)內(nèi)變化小于于組間變化化,因此,,試驗可能能會體現(xiàn)至至少有一組組與其他組組存在差異異。方差分析(ANOVA)獲得組間方方差獲得組內(nèi)方方差如果它們相相同,可斷斷定各組間間無明顯差差異:計算比率:兩方差比率率=F-統(tǒng)計我們可以從從F-分布中獲得得P-值Minitab菜單:Stat>ANOVA>Oneway意味著各小小組間平均均值無差異異ANOVA假設(shè)虛假設(shè):H0:平均值A(chǔ)=平均值B=平均值C=...(或)小組平均值值無差異(或)=替代假設(shè):Ha:至少有一組組的平均值值與其他組組相比存在在明顯差異異ANOVA假設(shè),續(xù)如果p.05不拒絕H0沒有充分的的證據(jù)說明明任何小組組間存在統(tǒng)統(tǒng)計意義上上的明顯差差異。如果確實存存在差異,,那么要么么是變差過過大或樣本本太小而不不能被察覺覺。如果p<.05拒絕H0,決定使用Ha至少有一組組與其他組組存在統(tǒng)計計差異檢查置信區(qū)區(qū)間以發(fā)現(xiàn)現(xiàn)哪組有差差異(非非重疊)措施:評評估重要性性和差異大大小(足足以保證進進一步的措措施?)使用Minitab:ANOVA數(shù)據(jù):C:\GENSixSigma\Hypo_Mod\Forms.MTW背景:一組數(shù)據(jù)包包括保險面面額,它是是7個不同同的險種(定義為為A-G)的15個條條款,總總計105個條款.1.按照險種的的面值編制制分層點圖圖:Graph>dotplot>(ByForm)使用Minitab:ANOVA,續(xù)2. 獲得得數(shù)據(jù)匯總總:Stat>BasicStatistics>DescriptiveStatistics>(FaceAmtbyForm)使用Minitab:ANOVA,cont.3.方差差分析(ANOVA)或F-試驗:Stat>ANOVA>OnewayUsethismenuiftheYdataareinonecolumnandthegrouplabelsareinanothercolumn.Ifeachgroupisinitsowncolumn,usethe"Oneway(Unstacked)"menu.只檢查框圖和點圖使用Minitab:ANOVA,cont.使用Minitab:ANOVA,cont.問題3:Minitab輸出“平方和”O(jiān)ne-wayAnalysisofVarianceAnalysisofVarianceforFaceAmtSourceDFSSMSFPFormError987622407778Total1041301653Individual95%CIsForMeanBasedonPooledStDevLevelNMeanStDev-------+---------+---------+---------A15446.00100.56(----*---)B15277.33105.46(----*---)C15376.67102.72(----*---)D15384.0082.27(---*----)E15476.0065.01(----*---)F15514.6771.70(---*----)G15414.0080.78(---*----)-------+---------+---------+---------組間方方差是是組內(nèi)內(nèi)方差差的11.5倍倍圓括號號表示示小組組平均均值的置置信區(qū)區(qū)間((非非單值值〕由P值得出出結(jié)論論我們假假設(shè)所所有小小組的的方差差相同同方差之間以內(nèi)使用Minitab:ANOVA,cont.結(jié)論由于p<.05,拒絕H0,判斷至至少有有一組組與其其他組組有明明顯差差異根據(jù)置置信區(qū)區(qū)間:險種B的平均均面值值比其其他險險種明明顯低低。險種F的平均均面值值比B,C,D,,G的明顯顯高,,但不不比A,E的明顯顯高ANOVA表明當(dāng)當(dāng)使用用險種種F,E或A時,其其保險險面值值要明明顯高高一些些。采用其其他的的原則則(如成成本,,易用用或其其他客客戶調(diào)調(diào)查)來來選擇這這三項項險種種ANOVA假假設(shè)樣本代代表母母體和和過程程過程是是穩(wěn)定定的.過程中中只有有正常常原因因引起起的波波動在在起作作用隨著時時間的的推移移沒有有移位位和趨趨勢出出現(xiàn)(沒沒有與與時間間相關(guān)關(guān)的異異常原原因)各組的的方差差相同同可采用用F-試驗進進行驗驗證(參參見下下節(jié))對假設(shè)設(shè)的違違背能能導(dǎo)致致在ANOVA分析中中出現(xiàn)現(xiàn)錯誤誤的判判斷.同樣假假設(shè)每每組的的基本本分布布也是是正態(tài)態(tài)分布布,這這可以以用在在回歸歸模塊塊中已已經(jīng)討討論過過的殘殘差正正態(tài)概概率圖圖進行行檢查查。比較兩組組或更多多組的比比例:χ2試驗我采用何何種分析析方法??Xs是否離散散(組〕只比較2組?Y1’s是否與Y2‘s相匹配??否,Xs連續(xù)回歸主題題ANOVAt-試驗否,比較多組(平均值方差〕)是配對t-試驗否,比較兩組獨立組平均值采用匹配數(shù)據(jù)比較兩組平均值比較平均均值?等方差試試驗否,比較較方差)是Ys是否連續(xù)續(xù)?X2否,Y離散比比例)是是Y(輸出)X(輸入)連續(xù)離散((比例))離散(“組”)連續(xù)Χ2試驗t試驗成對t試驗ANOVA邏輯回歸歸回歸不同數(shù)據(jù)據(jù)類型的的適當(dāng)分分析方法法當(dāng)輸入(X)變量是離離散變量量時,使使用假設(shè)設(shè)試驗。。將離散X當(dāng)作“分分組”或或由分層變量量來看X。示例:如果果您希望按產(chǎn)品比較周周期,那么么不同產(chǎn)品品類型就是是離散X。如果X數(shù)據(jù)是連續(xù)續(xù)的,則使使用回歸分分析判斷它它們是否與與輸出(Y)變量

相關(guān)關(guān)。假設(shè)試驗回歸分析盒圖,點圖圖分層圖分布圖所有列出的的圖形的產(chǎn)產(chǎn)生基于X和Y的數(shù)椐類型型的測量數(shù)數(shù)椐集合離散的X和Y數(shù)據(jù)離散Ys示例:技術(shù)要求符符合性(在要求之之內(nèi),之之下,之之外)客戶滿意度度(差,一般,好,優(yōu)優(yōu))包裝缺陷類類型(產(chǎn)產(chǎn)品編碼錯錯誤,紙紙箱損壞,缺隔板板,等.)記錄每個的的屬性可以數(shù)數(shù)每每種屬性的的個數(shù)個數(shù)通常在在表格中進進行匯總(表格稱稱為列聯(lián)表表)離散的X和Y數(shù)據(jù),續(xù).離散Xs示例地點(NY,LA,Denver)方法(標(biāo)準(zhǔn)準(zhǔn)的,新新的)產(chǎn)品類型(A,B,C,D)將數(shù)據(jù)分組組(它是是分層的或或跟隨某變變量)“隨著地地點結(jié)結(jié)果有有何不不同?”實例分分析:不不同地地點的的包裝裝抱怨怨是否否存在在明顯顯差異異?一個團團隊正正在進進行一一個持持續(xù)改改進項項目以以減少少一主主要客客戶在在A產(chǎn)品中中發(fā)現(xiàn)現(xiàn)的包包裝錯錯誤。。全國國共有有4個個生產(chǎn)產(chǎn)地點點,團團隊有有興趣趣了解解是否否針對對這4個生生產(chǎn)地地點的的抱怨怨明顯顯不同同,以以此來來確定定項目目的今今后步步驟。。對一一個月月前的的發(fā)貨貨進行行抽樣樣和評評估以以報告告包裝裝的問問題按照不不同地地點的的包裝裝抱怨怨匯總總?cè)绾问故褂脭?shù)數(shù)據(jù)來來回答答這個個問題題“地地點不不同,,抱怨怨率是是否明明顯不不同??”

東北

東南 中部 西部 總計有包裝抱怨

的發(fā)貨

次 46 17 5 21 89

無包裝抱怨

的發(fā)貨

次 270 186 102 223 781

總發(fā)貨次 316 203 107 244 870地點離散X離散Y實例分分析:不不同地地點的的包裝裝抱怨怨是否否存在在明顯顯差異異?使用比比例法法進行行理解解使用比比例(或或百分分比)讓你比比較不不同同的類類別樣樣本本大小小(或機機會面面積)你得出出什么么結(jié)論論?不同地地點的的抱怨怨率是是否明明顯不不同?在虛假假設(shè)的的基礎(chǔ)礎(chǔ)上即即所有有地點點具有有相同同的錯錯誤率率,你你如何何計算算P值?

東北 東南 中部 西部 總計有包裝抱怨發(fā)貨 15%8%5%9%10%

無包裝抱怨發(fā)貨 85% 92% 95% 91% 90%

總發(fā)貨 100% 100% 100% 100% 100%地點計算期期望值值假設(shè)不不同地地點間間不存存在實實際差差異來來計算算各數(shù)數(shù)據(jù)的的期望望值:如果各地點間間確實不存在在差異,我們們可以看到觀觀測值與期望望值接近X2分析實例續(xù)續(xù)地點東北東南中部西部Obs.Exp.Obs.Exp.Obs.Exp.Obs.Exp.總計有抱怨發(fā)貨貨4632.31720.8510.92125.089無抱怨發(fā)貨貨270283.7186182.210296.1223219.0781總發(fā)貨316203107244870X2分析實例續(xù)續(xù)c2(c2)統(tǒng)計用如下方法來來測評觀測值值與期望值的的差異:示例:將運用c2分布獲得本統(tǒng)統(tǒng)計的P值。Minitab菜單:Stat>Tables>Chi-SquareTestX2分析實例續(xù)續(xù)在表中計算一個單元的值,等式包括所有單元X2分析實例續(xù)續(xù)X2分布0尾巴面積=P-值c2假設(shè)X2試驗驗虛假設(shè)H0:各組比例相同同替代假設(shè)Ha:至少有一組的的比例與其他他組不同假設(shè)X2試驗,續(xù)如果P.05不拒絕H0沒有充分的證證據(jù)說明任何何小組比例間間存在統(tǒng)計意意義上的明顯顯差異。如果P<.05拒絕H0,決定使用Ha至少有一組比比例與其他組組存在統(tǒng)計差差異使用Minitab:X2試試驗,續(xù)數(shù)據(jù):C:\SixSigma\Hypo_Mod\Complaints.MTW1.在匯總的—非非原始的—數(shù)數(shù)據(jù)上進行X2試驗:Stat>Tables>Chi-SquareTest使用Minitab:X2試試驗,續(xù).*我們剛才使用用了MINITAB的兩種方法進進行X2試驗:一種方方法適合于原原始數(shù)據(jù),而而另一種適合合于表中的匯匯總數(shù)據(jù)。兩兩種方法得到到了完全相同同的X2值和P值。當(dāng)然,如如上所示,匯匯總數(shù)據(jù)中體體現(xiàn)的每個單單元的X2值可以用來確確定哪組的比比例值與其他他組的明顯不不同。計算每個單元元的x2,將高值畫上圈圈*X2試驗期望值置于觀測值之下

NEastSEastCentralWestTotal146175218932.3320.7710.9524.962270186102223781283.67182.2396.05219.04合計316203107244870Chi-Sq=5.784+0.683+3.230+0.629+0.659+0.078+0.368+0.072=11.502DF=3,P-Value=0.009抱怨無抱怨由第3項可以得到相同的結(jié)論,至少有一個抱怨率與其他的明顯不同

既然你有一個個明顯的X2,下一步作作什么?1.確定哪個組比例不同。。2.確定為什么這個組比例不不同。1.確定定哪個組比例例不同結(jié)論北部地點的抱抱怨率明顯較較高,中部地地點抱怨率明明顯較低。抱怨比期望多抱怨比期望少東北地點和中中部地點的抱抱怨在X2總和中占的比比重最大Chi-SquareTestExpectedcountsareprintedbelowobservedcounts

NEastSEastCentralWestTotal146175218932.3320.7710.9524.962270186102223781283.67182.2396.05219.04Total316203107244870Chi-Sq=5.784+0.683+3.230+0.629+0.659+0.078+0.368+0.072=11.502DF=3,P-Value=0.009抱怨無抱怨2.確定為為何小組比例例不同注意!查詢詢差異的原因因而非進行責(zé)責(zé)備!當(dāng)一組的錯誤誤率明顯比其其他各組(系系統(tǒng)〕高容易導(dǎo)致責(zé)備備,但最好把把它當(dāng)作改進進的契機成為數(shù)據(jù)偵察察員首先問如下4方面的問題題工作劃分:這類工作作是否不同?(也許復(fù)復(fù)雜的工作應(yīng)應(yīng)分配給經(jīng)驗驗豐富的人,,提高錯誤率率.)工作方法:工作軟件件,硬件和方方法與其他小小組相比如何何?工作流程:是否有標(biāo)標(biāo)準(zhǔn)流程,是是否使用,人員是否否經(jīng)過培訓(xùn)?個人差異:生理差異異(視力,左撇子,等.)是是否影響了了工作能力?下一步,它它們“離群””的時間有多多長?如果只是現(xiàn)在在,也許是是由于最近的的變化是導(dǎo)致致的。X2試驗的假假設(shè)樣本代表母體體或過程我們假設(shè)用于于X2試驗的離散數(shù)數(shù)據(jù)的基本分分布為二項分分布每個單元的期期望值5,否則試驗無法法恰當(dāng)進行如果期望值<5,可可能需要收收集更多的數(shù)數(shù)據(jù)(更大大的樣本)X2試驗值在制造業(yè)中,,通常收集離離散數(shù)據(jù)來分分析服務(wù)過程程的表現(xiàn)情況況如果兩組或多多組間沒有明明顯差異也就就避免了疑神神疑鬼可以從學(xué)習(xí)先先進或鼓勵后后進上有所收收獲可以發(fā)現(xiàn)小組組比例間的明明顯差異當(dāng)P-值小(<.05)表表明有必要要確定可能導(dǎo)導(dǎo)致小組間明明顯差異的根根源檢測每個單元元的x2值以確定存存在差異的小小組記住考慮是否否“統(tǒng)計明顯顯”的比例差差異的大小才才是對經(jīng)營具具有真正重要要的意義。練習(xí)5:運運用Minitab進行X22的試驗?zāi)繕?biāo):采用MINITAB進行X2試驗并分析結(jié)結(jié)果.時間:15分鐘.數(shù)據(jù):C:\SixSigma\Hypo_Mod\Mailers.MTW背景:我們一直在跟跟蹤3輛貨車車在兩個制造造廠間進行分分總成運輸?shù)牡臅r間,運貨貨記錄表明已已檢查了12個月,結(jié)果果匯總?cè)缦?練習(xí)5:答答案Minitab輸出結(jié)論:貨車車有差異.在在24至至36小時之之間,貨車C的發(fā)貨比期望望值高,在36至48小小時之間,貨貨車B的發(fā)貨

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負(fù)責(zé)。
  • 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時也不承擔(dān)用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

最新文檔

評論

0/150

提交評論