




版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請(qǐng)進(jìn)行舉報(bào)或認(rèn)領(lǐng)
文檔簡(jiǎn)介
1、第3部分:,單樣本 置信區(qū)間和 假設(shè)檢驗(yàn),第3部分:?jiǎn)螛颖局眯艆^(qū)間和假設(shè)檢驗(yàn),目的: 這一部分的目的是介紹連續(xù)數(shù)據(jù)的置信區(qū)間和假設(shè)檢驗(yàn)。 目標(biāo): 了解假設(shè)檢驗(yàn)和置信區(qū)間的基本原理- 確定所觀測(cè)的差異是真實(shí)的,還是偶然因素引起的。 計(jì)算樣本平均值的置信區(qū)間,并將這一平均值與期望(或目標(biāo))平均值相比較。 使用單樣本置信區(qū)間和假設(shè)檢驗(yàn),將平均值與目標(biāo)值相比較。,舉例 洗衣機(jī)傳動(dòng)裝置的總高度將影響制動(dòng)性能。項(xiàng)目Y是總高度,目標(biāo)值=5.394,加工這種部件時(shí)所使用的固定架共有8個(gè)。 您想了解什么?,使用第三個(gè)固定架生產(chǎn)出的部件的平均高度與目標(biāo)值是否一致?,分析步驟: 1. 將數(shù)據(jù)繪制成圖 2. 使用假設(shè)
2、檢驗(yàn)和置信區(qū)間來確定所觀測(cè)到的差異是否真實(shí)。 3. 得出結(jié)論。,設(shè)備3 的10 個(gè)部件的高度,用圖形來表示數(shù)據(jù),設(shè)備3中10個(gè)部件的高度 5.394 5.394 5.393 5.394 5.394 5.395 5.396 5.397 5.395 5.395,總體平均值的最可能的范圍是多少?x(5.3947)與目標(biāo)值(5.394)之間的差異是由于偶然因素造成的嗎?,置信區(qū)間,設(shè)備3所制造的所有部件的平均值最可能的取值范圍是什么? 讓我們來計(jì)算一下置信區(qū)間,以便找出該值! 單個(gè)平均值的置信區(qū)間,(1-)100%置信度,真正的總體均值 包含在置信區(qū)間內(nèi)。,什么是t分布? 類似于正態(tài)分布(z),正態(tài)分
3、布(z):已知總體標(biāo)準(zhǔn)差,,t分布(t):估計(jì)的標(biāo)準(zhǔn)差, s,用于提供有關(guān)平均值的結(jié)論(置信區(qū)間和假設(shè)檢驗(yàn)),我們將需要使用t分布,t = (x - )/(s / n),-,置信區(qū)間,其中: x = 樣本平均值 t = t表格中的t統(tǒng)計(jì)結(jié)果 a = a風(fēng)險(xiǎn) df = 自由度 = n -1 s = 樣本標(biāo)準(zhǔn)差 n = 樣本中的數(shù)據(jù)點(diǎn)數(shù)量,置信區(qū)間上限值 = x + t(a/2, df),置信區(qū)間下限值 = x - t(a/2, df),用所給出的有關(guān)部件的數(shù)據(jù)代入以上公式,置信區(qū)間,計(jì)算利用設(shè)備3所生產(chǎn)的傳輸設(shè)備平均高度的置信區(qū)間 使用=0.05(95%的置信區(qū)間) x = 5.3947 s =
4、 0.00116 n = 10 df = n - 1 = 9 t(a/2,df)取自t表格。 t (0.025,9) = 2.262,區(qū)間上限 = x + t (a/2, df),t表格,自由度為9, = .05 /2 = .025,范例-續(xù) 設(shè)備3所制造部件的平均值是否在目標(biāo)范圍之內(nèi)?,設(shè)備3生產(chǎn)出的部件總體的平均值最有可能是5.3947,但實(shí)際值可能比該值大一點(diǎn)或小一點(diǎn)。,5.393,5.394,5.395,5.396,5.397,設(shè)備3,高度 (英寸),目標(biāo)值 = 5.394英寸,平均值的95%置信區(qū)間,置信區(qū)間上限值 = 5.3955英寸,置信區(qū)間下限值 = 5.3939 英寸,設(shè)備3
5、所生產(chǎn)的部件的總體平均值最可能的取值范圍為5.3939到5.3955。,舉例-續(xù),置信區(qū)間說明 以這種方式構(gòu)成的區(qū)間的95%是正確的(包含真正的總體平均值),以此構(gòu)成的區(qū)間的5%是不正確的。 目標(biāo)值5.394包含在此區(qū)間內(nèi)。 統(tǒng)計(jì)評(píng)價(jià):沒有證據(jù)證明設(shè)備3所制造部件的平均高度不在目標(biāo)范圍之內(nèi)。 實(shí)際評(píng)價(jià):目標(biāo)值剛好在置信區(qū)間內(nèi)。計(jì)算時(shí)只用到10 個(gè)數(shù)據(jù)點(diǎn),并且=0.05。 您可以使用置信區(qū)間來進(jìn)一步調(diào)查設(shè)備3 獲得更多樣本(如果是實(shí)際的)并計(jì)算置信區(qū)間 使用不同的值來計(jì)算置信區(qū)間,置信區(qū)間量化了數(shù)據(jù)的不定性。,樣本大小對(duì)置信區(qū)間的影響,讓我們?nèi)?0個(gè)以上的樣本(總數(shù) n = 30),看一看對(duì)95
6、%的置信區(qū)間有何影響。 假設(shè)平均值和標(biāo)準(zhǔn)差保持不變:x = 5.3947 和 s = 0.00116 。,置信區(qū)間上限值 = x + t (a/2, df),置信區(qū)間下限值 = x - t (a/2, df),樣本大小對(duì)置信區(qū)間的影響-續(xù),通過增加樣本,可以證明設(shè)備3所制造部件的平均高度不在目標(biāo)范圍內(nèi)。,目標(biāo)值 = 5.394英寸,n = 10 的95%置信區(qū)間為5.3939 - 5.3955. n = 30的95%置信區(qū)間為 5.3943 - 5.3951. 唯一改變的是 n。,置信區(qū)間隨樣本容量的增加而減小。,對(duì)置信區(qū)間的影響,計(jì)算設(shè)備3所制造傳送裝置的平均高度的90%置信區(qū)間。取 n =
7、 10 ( x = 5.3947,s = 0.00116),計(jì)算設(shè)備3所制造傳送裝置的平均高度的99%置信區(qū)間。取 n = 10 ( x = 5.3947,s = 0.00116),對(duì)置信區(qū)間有何影響?,對(duì)置信區(qū)間的影響,唯一改變的是 a。 我們能夠以90% 置信度來說明設(shè)備3所制造的部件不在 目標(biāo)范圍內(nèi) 我們不能以99%的置信度說來說明設(shè)備3所制造的部件不在 目標(biāo)范圍內(nèi)。,置信區(qū)間隨著值的增大而增大。,另一種確定是否存在差異的方法: 假設(shè)檢驗(yàn),置信區(qū)間給出了總體值(參數(shù))的最可能的取值范圍。 假設(shè)檢驗(yàn)用于確定所觀測(cè)的差異是確實(shí)存在,還是偶然產(chǎn)生的。我們可以量化確實(shí)存在差異的置信程度。,所有
8、潛在 “ X”,關(guān)鍵少數(shù)“ X”,定義假設(shè):Ho 和 Ha,Ho 假設(shè)檢驗(yàn)的起點(diǎn)是零假設(shè)- H0。H0是相同或沒有差異假設(shè)。 舉例:總體均值等于檢驗(yàn)均值。 Ha 第二條假設(shè)是Ha- 備擇假設(shè),即差異假設(shè)。 舉例:總體均值不等于檢驗(yàn)均值。,您通常想表明差異是確實(shí)存在的(Ha)。 通過假定相等 (Ho)開始。 如果數(shù)據(jù)表明它們不相等,則它們一定存在差異(Ha)。,和風(fēng)險(xiǎn),風(fēng)險(xiǎn):當(dāng)H0為真時(shí),拒絕Ho-有時(shí)稱為廠商風(fēng)險(xiǎn) 風(fēng)險(xiǎn):當(dāng)H0為假時(shí),接受Ho-有時(shí)稱為消費(fèi)者風(fēng)險(xiǎn),t 檢驗(yàn),t檢驗(yàn)可用來檢驗(yàn): 目標(biāo)值(或檢驗(yàn)均值)與計(jì)算的樣本均值的對(duì)比 - 單樣本t檢驗(yàn),或者 兩個(gè)計(jì)算的樣本均值之間的對(duì)比 -
9、雙樣本t檢驗(yàn)(將在第4部分進(jìn)行討論) 讓我們使用Minitab來執(zhí)行單樣本t檢驗(yàn)。 將設(shè)備3的平均值與目標(biāo)值5.394進(jìn)行比較。 假設(shè)檢驗(yàn) Ho: = 5.394 Ha: 不等于5.394 在Minitab中打開文件“ lth” L:6sigmaMinitabTrainingMinitabSession 2lth.mtw,點(diǎn)擊“圖形”,雙擊“確定”按鈕運(yùn)行,單樣本檢驗(yàn) t-檢驗(yàn)-利用Minitab,選擇: Stat Basic Statistics 1-Sample t,點(diǎn)擊兩次“ OK”,運(yùn)行,鍵入目標(biāo)平均值,選擇 Ha,單擊 “ Graphs”,單擊 “ Boxplot of data”,
10、置信區(qū)間指出了總體平均值的近似值范圍。,Hmmmm 5.394剛好在置信區(qū)間內(nèi)。我們可能會(huì)進(jìn) 一步調(diào)查。,按目標(biāo)均值進(jìn)行設(shè)備3的單樣本t檢驗(yàn),Ho 和 Ha的假設(shè),置信區(qū)間指出總體均值的最可能的取值范圍。,P值 0.05; 不能拒絕 Ho,5.394剛剛落在置信區(qū)間內(nèi)。也許我們需要進(jìn)一步調(diào)查。,請(qǐng)注意 不得將假設(shè)檢驗(yàn)用作“行/不行”檢驗(yàn)。 所存在的差異是否真的很重要?,平均值的T-檢驗(yàn) Test of mu = 5.39400 vs mu not = 5.39400 Variable N Mean StDev SE Mean T P fix 3 10 5.39470 0.00116 0.000
11、37 1.91 0.089,有關(guān)差異的統(tǒng)計(jì)決策的三種方法,方法1 如果計(jì)算值大于()表格(關(guān)鍵)值,則拒絕Ho,接受存在差異。 方法2 如果計(jì)算的p值小于(),則拒絕Ho,接受存在差異。 方法3 如果檢驗(yàn)值(目標(biāo)值)不在置信區(qū)間內(nèi),則拒絕Ho,接受存在差異。,這3種方法將得出相同的結(jié)論。,何謂p值?,p值的統(tǒng)計(jì)定義 觀察到的顯著水平。 當(dāng)不存在差異時(shí), 接受Ha,即接受存在差異的概率 導(dǎo)致拒絕零假設(shè)的最小值。,這些都是很好的統(tǒng)計(jì)定義,但,我如何利用它?,如果 p ,則差異具有統(tǒng)計(jì)顯著性。 拒絕零假設(shè),接受存在差異。 將(1-p)看作存在差異的置信度。 舉例1:p = 0.001,則(1 - p
12、) = 0.999或99.9%。 您可以將99.9%看成是存在差異的置信度。 舉例2:p = 0.25,則(1- p) = 0.75或75% 您可以將75%看成是存在差異的置信度。,單樣本 t - 課堂練習(xí),3. 寫出有關(guān)設(shè)備3的平均值的結(jié)論。,設(shè)備1的10個(gè)部件的高度 5.390 5.389 5.390 5.389 5.388 5.391 5.391 5.391 5.391 5.389,1.計(jì)算設(shè)備1的95%置信區(qū)間的平均值。 n = _ x = _ s = _ df = _ 置信下限 = _ 置信上限 = _ 2.進(jìn)行假設(shè)檢驗(yàn),以確定平均值是否顯 著地不同于目標(biāo)值5.394 Ho: _ H
13、a: _,正態(tài)分布對(duì)有關(guān)平均值的命題有多重要?,根據(jù)中心極限定理,平均值趨于正態(tài)分布,即使單個(gè)變量并不具備正態(tài)分布特征。 只要樣本不是太小,而且沒有極端值,正態(tài)分布這個(gè)前提對(duì)于平均值的置信區(qū)間和假設(shè)檢驗(yàn)正態(tài)分布通常不成問題。,關(guān)鍵概念:-第3部分 置信區(qū)間與假設(shè)檢驗(yàn),1. 假設(shè) Ho:事物相同 Ha:事物不同 2. 置信區(qū)間:總體參數(shù)最可能的取值范圍(與數(shù)據(jù)一致的值)。 3.平均值 t檢驗(yàn)是一種假設(shè)檢驗(yàn),用于將樣本的平均值與目標(biāo)值或與其它樣本的平均值相比較。 單樣本t檢驗(yàn)用于將樣本平均值與目標(biāo)平均值相比較。,關(guān)鍵概念:-第3部分 置信區(qū)間與假設(shè)檢驗(yàn),統(tǒng)計(jì)風(fēng)險(xiǎn) 錯(cuò)誤:將實(shí)際上相同的事物說成不同(
14、在裝配線上拒絕合格的部件) 風(fēng)險(xiǎn):出現(xiàn)錯(cuò)誤的風(fēng)險(xiǎn) - 習(xí)慣上, 風(fēng)險(xiǎn)為5%(或 = 0.05) p值:所觀察到的顯著水平。在總體參數(shù)相同的情況下,觀察到顯著差異的概率。,如果觀察到的顯著水平(“ p”)小于可接受的風(fēng)險(xiǎn)(“ ”),則接受 Ha(否定Ho)。,如果觀察到的顯著水平(“ p”)大于可接受的風(fēng)險(xiǎn)(“ ”),則拒絕 Ha (不拒絕Ho)。,附錄,定義假設(shè),零假設(shè)假定總體/樣本相同。 公式選擇實(shí)際應(yīng)用 Ho: 1 = 假定設(shè)備相同 Ho: 1 - 2 = 0 Ho: 1 = 2 = 3 =.n Ho: 1 = 2 Ho: 1 = 2 = 3 =. n,Ha是可以得到證明的唯一假設(shè)!,假設(shè)
15、檢驗(yàn)的九個(gè)步驟,1.定義問題/陳述檢驗(yàn)的目的 2.建立假設(shè) - Ho和 Ha 陳述零假設(shè)(Ho):總體的參數(shù)相同 陳述備擇假設(shè)(Ha ):總體的參數(shù)不同 3.確定適當(dāng)?shù)慕y(tǒng)計(jì)檢驗(yàn) (假設(shè)的概率分布:t、F、或x2)。 4.陳述可接受的風(fēng)險(xiǎn)和風(fēng)險(xiǎn)水平: 風(fēng)險(xiǎn): 通常為 5% 風(fēng)險(xiǎn): 通常為 10-20%,假設(shè)檢驗(yàn)中的九個(gè)步驟(續(xù)),5.使用檢驗(yàn)靈敏度(/)確定樣本大小 6.制定抽樣計(jì)劃和收集樣本 7.根據(jù)數(shù)據(jù)計(jì)算檢驗(yàn)統(tǒng)計(jì)值(t、F或x2) 8.確定所計(jì)算的檢驗(yàn)統(tǒng)計(jì)值由于偶然因素引發(fā)的概率(p值): 如果概率(p) ,則拒絕Ho并接受 Ha 如果概率(p) ,則不能拒絕Ho(無法得出結(jié)論) 9.復(fù)制
16、結(jié)果,并將統(tǒng)計(jì)結(jié)論轉(zhuǎn)換為實(shí)際解決方案。,在每個(gè)假設(shè)檢驗(yàn)中,我們都在努力證明Ha,有關(guān)假設(shè)的注解,假設(shè)代表了實(shí)際問題向統(tǒng)計(jì)問題的轉(zhuǎn)換。在這種方法中,以各種術(shù)語來表述實(shí)際問題,以使其適于科學(xué)檢驗(yàn)和檢測(cè)。實(shí)質(zhì)上,假設(shè)就是與給定概率分布的參數(shù)相關(guān)的命題;如平均值和/或方差。換句話說,假設(shè)是這樣一些命題:使我們能夠在進(jìn)行調(diào)查之前提出所有可能的結(jié)果。在統(tǒng)計(jì)調(diào)查之后,我們只需接受或拒絕每個(gè)假設(shè),反過來,這些假設(shè)又為我們制定現(xiàn)實(shí)生活中的實(shí)際決策奠定了堅(jiān)實(shí)的基礎(chǔ)。 當(dāng)以零假設(shè)表述時(shí),假設(shè)通常的含義與偶發(fā)事件的分布相關(guān)。這種特殊的假設(shè)經(jīng)常被稱為“ 零假設(shè)”,并以“ Ho”表示。通常,它被稱為“名義上的假設(shè)?!逼湟?/p>
17、思非常簡(jiǎn)單-調(diào)查的全體參數(shù)相等;也就是說,我們所關(guān)心的所有參數(shù)(平均值和/或偏差)之間沒有差異。 直接與零假設(shè)相對(duì)的是備擇假設(shè)(Ha)。這類假設(shè)一般與非偶發(fā)事件的分布相關(guān),因而,被稱之為“統(tǒng)計(jì)顯著地不同”于偶發(fā)事件的分布,也就是說,觀察到的存在于所調(diào)查的樣本參數(shù)之間的差異不是源于樣本的隨機(jī)偏差。如果觀測(cè)到的樣本的差異不是偶發(fā)原因所致,我們可以得出結(jié)論,從一個(gè)或多個(gè)方面來說,樣本不同于我們所調(diào)查的總體。因此,我們接受不相同的備擇假設(shè),并認(rèn)為樣本是從其它總體、而不是從我們所調(diào)查的總體中 抽取的。 當(dāng)接受或拒絕零假設(shè)和備擇假設(shè)時(shí),我們冒已知程度的風(fēng)險(xiǎn)、具有一定的置信度。為此,我們規(guī)定(在調(diào)查之前)了可接受的決策風(fēng)險(xiǎn)的大小(、)和檢驗(yàn)靈敏度(/)。一旦選擇完畢,我們就擁有了所需的信息來確定“合理”的樣本大小。用于計(jì)算的數(shù)學(xué)等式確實(shí)存在;然而,我們必須將這些計(jì)算值與成本、時(shí)間和可用資源的實(shí)際限制范圍相平衡,以便得出“合理的”抽樣計(jì)劃。,t分布的性質(zhì),如果總體分布為未知,我們可以通過隨機(jī)取樣來進(jìn)行估計(jì)。當(dāng)樣本為無窮大時(shí),則不存在估算誤差;因此,我們可以應(yīng)用正態(tài)(z)分布來發(fā)現(xiàn)偶發(fā)事件的概率。然而,隨著樣本大小的降低,我們的不確定性也不斷提高;因此,對(duì)于同一概率,我們必須擴(kuò)大預(yù)測(cè)的范圍。換句話說,我們必須糾正z來彌
溫馨提示
- 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請(qǐng)下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請(qǐng)聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
- 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會(huì)有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
- 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
- 5. 人人文庫網(wǎng)僅提供信息存儲(chǔ)空間,僅對(duì)用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對(duì)用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對(duì)任何下載內(nèi)容負(fù)責(zé)。
- 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請(qǐng)與我們聯(lián)系,我們立即糾正。
- 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶因使用這些下載資源對(duì)自己和他人造成任何形式的傷害或損失。
最新文檔
- 有關(guān)溺水教學(xué)課件
- 廣聯(lián)達(dá)軟件教學(xué)課件
- 【漳州】2025年福建漳州市專項(xiàng)招聘緊缺急需醫(yī)衛(wèi)技人才123人筆試歷年典型考題及考點(diǎn)剖析附帶答案詳解
- 村 的教學(xué)課件
- 教育扶貧班會(huì)課件
- 新疆烏魯木齊市重點(diǎn)初中五校2020-2021屆九年級(jí)下學(xué)期第四次月考聯(lián)考化學(xué)試題
- 數(shù)學(xué)節(jié)目活動(dòng)方案
- 文明城市新崛起活動(dòng)方案
- 【瀘州】2025下半年四川瀘州市敘永縣事業(yè)單位考試招聘126人筆試歷年典型考題及考點(diǎn)剖析附帶答案詳解
- 文化公司災(zāi)后活動(dòng)方案
- 博物館展廳清潔保養(yǎng)技巧
- 《日語專業(yè)學(xué)術(shù)寫作與研究方法》課程教學(xué)大綱
- 職業(yè)教育專業(yè)教學(xué)資源庫建設(shè)
- “素養(yǎng)導(dǎo)向”初中生物大單元教學(xué)策略及案例
- PEP人教版小學(xué)英語五年級(jí)下冊(cè)單詞默寫表
- 2025年國家科技部農(nóng)業(yè)科技成果轉(zhuǎn)化合同模板
- 音樂劇排練課程設(shè)計(jì)
- 【MOOC期末】《信號(hào)與系統(tǒng)》(南京郵電大學(xué))期末中國大學(xué)慕課答案
- 舞蹈治療的實(shí)證研究-洞察分析
- 一個(gè)售樓處裝修報(bào)價(jià)清單
- 農(nóng)村污水管道改造施工方案
評(píng)論
0/150
提交評(píng)論