版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請(qǐng)進(jìn)行舉報(bào)或認(rèn)領(lǐng)
文檔簡(jiǎn)介
1、對(duì)比實(shí)驗(yàn)聯(lián)想集團(tuán) 歡迎光臨6sigma世界統(tǒng)計(jì)根底知識(shí)參數(shù)估計(jì)假設(shè)檢驗(yàn)對(duì)比實(shí)驗(yàn)報(bào)告編寫和練習(xí)課程進(jìn)程為什么要學(xué)習(xí)對(duì)比實(shí)驗(yàn)許多的問題需求就某些參數(shù)作出接受或回絕的決議,這闡明是一個(gè)假設(shè)。它代表把一個(gè)實(shí)務(wù)的問題演繹成統(tǒng)計(jì)學(xué)上的問題。而這個(gè)決策過程便稱為:Hypothesis Testing我們把實(shí)現(xiàn)假設(shè)檢驗(yàn)的過程成為對(duì)比實(shí)驗(yàn)。統(tǒng)計(jì)學(xué)上的測(cè)試能為我們就問題作出客觀講解,相比較以前,我們只能作出客觀的講解。這是后續(xù)學(xué)習(xí)內(nèi)容的根底。統(tǒng)計(jì)根底知識(shí)第一單元總體(Population):在統(tǒng)計(jì)問題中,我們把研討對(duì)象的全體成為總體個(gè)體:構(gòu)成總體的每個(gè)成員稱為個(gè)體樣本(Sample):從總體中抽取部分個(gè)體所組成的
2、集合稱為樣本樣品:樣本中的個(gè)體稱為樣品樣本容量:樣品的個(gè)數(shù)稱為樣本容量,常用n表示1.1總體和樣本樣本隨機(jī)樣本(Random sample):可以被推行運(yùn)用于更大的總體的樣本。總體的每個(gè)個(gè)體有一個(gè)知的有時(shí)是相等的時(shí)機(jī)被包含在該樣本中。簡(jiǎn)單隨機(jī)樣本(Simple random sample):1、同一性:樣本與總體有同樣的分布2、獨(dú)立性: 假設(shè)給定第一個(gè)事件,無論它的結(jié)果是什么,第二個(gè)事件的時(shí)機(jī)都一樣。1.2統(tǒng)計(jì)量和抽樣分布統(tǒng)計(jì)量:不含未知參數(shù)的樣本函數(shù)稱為統(tǒng)計(jì)量。抽樣分布:統(tǒng)計(jì)量的分布稱為抽樣分布。有序樣本: 是從總體X中隨機(jī)抽取的容量為n的樣本,將它們的觀測(cè)值從小到大排序,這便是有序樣本。統(tǒng)
3、計(jì)推斷過程統(tǒng)計(jì)學(xué)的主要義務(wù):1、研討總體是什么分布?2、這個(gè)總體即分布的均值、方差是多少?樣本總體樣本統(tǒng)計(jì)量例如:樣本均值、方差總體均值、方差抽樣1.2常用統(tǒng)計(jì)量描畫中心位置的統(tǒng)計(jì)量:1、眾數(shù)mode:一個(gè)變量的眾數(shù)是指出現(xiàn)次數(shù)最多的值,不過它不一定獨(dú)一。2、中位數(shù):3、均值mean:1.2常用統(tǒng)計(jì)量描畫數(shù)據(jù)分散程度的統(tǒng)計(jì)量:1、極差range:2、方差variance3、規(guī)范差standard deviation:4、規(guī)范誤差standard error :是很多不同樣本的均值的規(guī)范差。5、變異系數(shù):1.3正態(tài)分布正態(tài)分布:1.3正態(tài)分布規(guī)范正態(tài)分布:它是特殊的正態(tài)分布,服從規(guī)范的正態(tài)分布的
4、隨機(jī)變量記為z,概率密度函數(shù)記為z1.3正態(tài)分布規(guī)范正態(tài)分布的變換:1.3正態(tài)分布規(guī)范正態(tài)分布的分位數(shù):0.975是隨機(jī)變量z不超越1.96的概率1.96是規(guī)范正態(tài)分布N0,1)的0.975的分位數(shù),記為z0.9750.9750.0251.4常用的抽樣分布正態(tài)樣本均值的分布: =10Xn = 4Xn =16總體分布抽樣分布1.4常用的抽樣分布t分布: Xt 分布與正態(tài)分布的比較正態(tài)分布t 分布t不同自在度的t分布規(guī)范正態(tài)分布t (df = 13)t (df = 5)1.4常用的抽樣分布F分布:設(shè)X1,X2,Xn是來自正態(tài)總體N(1,12 )的一個(gè)樣本, Y1,Y2,Yn是來自正態(tài)總體N(2,2
5、2 )的一個(gè)樣本,且相互獨(dú)立,那么:將F(n-1 , m-1 )稱為第一自在度為(n-1),第二自在度為(m-1)的F分布1.4常用的抽樣分布F分布:F1,10)(5,10)(10,10)參數(shù)估計(jì)第二單元2.1點(diǎn)估計(jì)點(diǎn)估計(jì)的概念point estimation: 用樣本均值估計(jì)總體均值用樣本方差估計(jì)總體方差用樣本規(guī)范差估計(jì)總體規(guī)范差2.2區(qū)間估計(jì)區(qū)間估計(jì)的概念interval estimate:置信區(qū)間confidence interval: ,那么稱這種置信區(qū)間為等尾置信區(qū)間。2.2區(qū)間估計(jì) 置信區(qū)間下限值1 - aa/2a/2x 置信區(qū)間上限值點(diǎn)估計(jì)與區(qū)間估計(jì)的區(qū)別:我是意見是這個(gè)值是10
6、,但誤差在1之間。2.2區(qū)間估計(jì)2.2區(qū)間估計(jì)置信程度的概念: 是的置信程度為1-的置信區(qū)間。它的含義是能蓋住未知參數(shù)的概率為1-。置信區(qū)間量化了數(shù)據(jù)的不定性。2.2區(qū)間估計(jì)總體均值置信區(qū)間的計(jì)算: 知: 未知:2.2區(qū)間估計(jì)2分布:方差置信區(qū)間的計(jì)算:2.2區(qū)間估計(jì)置信區(qū)間的長(zhǎng)度:1、大的樣本產(chǎn)生較短的區(qū)間,小的樣本產(chǎn)生較長(zhǎng)的區(qū)間。2、低的置信程度產(chǎn)生較短的區(qū)間,高的置信程度產(chǎn)生較長(zhǎng)的區(qū)間。N=100N=200N=300N=400N=500ExercisesX=sXnDistribution of Sampling AveragesXX研討草莓醬的分量是多少?答案:=95的置信區(qū)間假設(shè)檢驗(yàn)第
7、三單元3.1假設(shè)檢驗(yàn)問題例:草莓醬的凈重服從正態(tài)分布N,2, 6月份從產(chǎn)品中隨機(jī)抽取50瓶稱重的平均分量為180.5克, 5月份從產(chǎn)品中隨機(jī)抽取50瓶稱重的平均分量為179.6克, ,問從總體上能否分量比原來少了?1、這不是一個(gè)參數(shù)估計(jì)問題2、要求對(duì)6-5=0作出回答:是與否3、這類問題被稱為統(tǒng)計(jì)假設(shè)檢驗(yàn)問題估計(jì)的主要義務(wù)是找參數(shù)值等于幾;假設(shè)檢驗(yàn)的興趣主要是看參數(shù)的值能否等于某個(gè)特別感興趣的值3.2定義假設(shè)H0和HaH0要判別0.9克這個(gè)值能否超出了樣本變換所能呵斥的差別的范圍,我們先要問一問在總體均值相等的情況下,樣本均值會(huì)發(fā)生什么情況,即能否兩個(gè)均值的差等于0,在統(tǒng)計(jì)學(xué)上被稱為零假設(shè)(n
8、ull hypothesis)之所以用零來修飾假設(shè),其緣由是假設(shè)的內(nèi)容總是沒有差別或沒有改動(dòng)3.2定義假設(shè)H0和HaHA零假設(shè)其邏輯上的反面假設(shè)是“兩個(gè)參數(shù)有區(qū)別。這種反面假設(shè)稱為備擇假設(shè)alternative hypothesis。當(dāng)零假設(shè)所提問的問題被否認(rèn)時(shí),備擇假設(shè)的答案就是正確的。假設(shè)樣本數(shù)據(jù)能證明對(duì)于零假設(shè)提出的問題應(yīng)該否認(rèn),那么我們就回絕reject零假設(shè)而傾向于備擇假設(shè)。3.3怎樣回答零假設(shè)所提出的問題概率:p-值p-值是當(dāng)零假設(shè)正確時(shí),得到所觀測(cè)的數(shù)據(jù)或更極端的數(shù)據(jù)的概率,這個(gè)概率稱為p-值p-value。當(dāng)p-值小到以致于幾乎不能夠在零假設(shè)正確時(shí)出現(xiàn)目前的觀測(cè)數(shù)據(jù)時(shí),我們就回
9、絕零假設(shè)。 p-值越小,回絕零假設(shè)的理由就越充分。留意: 有時(shí)錯(cuò)誤以為p-值與零假設(shè)對(duì)錯(cuò)的概率有關(guān),但這是不能夠的. p-值指的是關(guān)于數(shù)據(jù)的概率。 p-值通知我們?cè)谀晨傮w的許多樣本中,某一類數(shù)據(jù)出現(xiàn)的經(jīng)常程度。3.3怎樣回答零假設(shè)所提出的問題假設(shè)檢驗(yàn)機(jī)制:為了求p-值,統(tǒng)計(jì)實(shí)際指出要把觀測(cè)到的0.9這個(gè)樣本均值之差變換成規(guī)范得分。規(guī)范得分:0.0H00.00.510.9觀測(cè)到的差樣本均值的差規(guī)范得分2.142 p-值0.03473.3怎樣回答零假設(shè)所提出的問題假設(shè)檢驗(yàn)機(jī)制:t值等于2.142的概率是0.0347,因此兩個(gè)樣本均值之差等于0.9的概率也是0.0347 ,換句話說就是假設(shè)兩總體均值
10、相等的話,從均值相等的總體中抽取200個(gè)樣本兩兩相減所得之差只需3.47個(gè)樣本的樣本均值相差在0.9,是小概率0.05事件,我們回絕零假設(shè)。H00.00.510.9觀測(cè)到的差樣本均值的差規(guī)范得分2.142 p-值0.03473.4顯著程度顯著程度:我們不是在數(shù)據(jù)搜集終了之后計(jì)算p-值,而是在搜集數(shù)據(jù)以前就曾經(jīng)確定好的小概率來構(gòu)造一個(gè)區(qū)間。當(dāng)樣本數(shù)據(jù)落入這個(gè)區(qū)間時(shí)就回絕零假設(shè)。這個(gè)小概率 稱為檢驗(yàn)的顯著程度significant level,通常選0.05.一個(gè)檢驗(yàn)的顯著程度是抽樣所得的數(shù)據(jù)回絕了本來是正確的零假設(shè)的概率?;亟^域:當(dāng)樣本數(shù)據(jù)落入這個(gè)區(qū)間時(shí)就回絕零假設(shè),那么這個(gè)區(qū)間就稱為回絕域。臨
11、界值critical values:回絕域的邊境所對(duì)應(yīng)的規(guī)范得分的值。對(duì)于雙邊檢驗(yàn),樣本統(tǒng)計(jì)量的臨界值是兩個(gè)值。3.4顯著程度Ho值臨界值臨界值a/2 a/2 樣本統(tǒng)計(jì)量回絕域回絕域接受域抽樣分布1 - 置信程度3.5風(fēng)險(xiǎn)和sX=sXnDistribution of Sampling AveragesXX3.5和的關(guān)系sX=sXnDistribution of Sampling AveragesXX他不能同時(shí)減少兩類錯(cuò)誤!3.6假設(shè)檢驗(yàn)的步驟1、建立假設(shè)2、數(shù)據(jù)獨(dú)立性檢查3、數(shù)據(jù)正態(tài)性檢查4、如為One to One問題進(jìn)展方差的F檢驗(yàn)5、計(jì)算檢驗(yàn)統(tǒng)計(jì)量6、給出顯著性程度 ,通常 =0.057
12、、定出臨界值,寫出回絕域8、判別案例1例:草莓醬的凈重服從正態(tài)分布N180,22, 5月份隨機(jī)抽取50罐稱重的平均分量為179.6克,問能否符合規(guī)范?平均凈重:179.6g3.7One to Standard的問題是假設(shè)檢驗(yàn)的特例: 其中一個(gè) 知3.7One to Standard的問題計(jì)算規(guī)范得分: 知時(shí),運(yùn)用z統(tǒng)計(jì)量計(jì)算 未知時(shí),運(yùn)用t統(tǒng)計(jì)量計(jì)算雙側(cè)問題Ho值臨界值臨界值a/2 a/2 樣本統(tǒng)計(jì)量回絕域回絕域接受域抽樣分布1 - 置信程度3.7One to Standard的問題單側(cè)左檢驗(yàn) 表格值(臨界值)回絕范圍無法回絕HOHa: (大于)3.7One to Standard的問題單側(cè)右
13、檢驗(yàn)回絕范圍無法回絕HO 表格值(臨界值)Ha: (小于)3.7One to Standard的問題JMP中的操作3.7One to Standard的問題JMP中的操作3.7One to Standard的問題JMP中的操作案例2例:草莓醬的凈重服從正態(tài)分布N,2, 6月份從產(chǎn)品中隨機(jī)抽取50瓶稱重的平均分量為180.5克, 5月份從產(chǎn)品中隨機(jī)抽取50瓶稱重的平均分量為179.6克, ,問從總體上能否分量比原來少了?假設(shè)檢驗(yàn)的步驟1、建立假設(shè)2、數(shù)據(jù)獨(dú)立性檢查3、數(shù)據(jù)正態(tài)性檢查4、如為One to One問題進(jìn)展方差的F檢驗(yàn)5、計(jì)算檢驗(yàn)統(tǒng)計(jì)量6、給出顯著性程度 ,通常 =0.057、定出臨界
14、值,寫出回絕域8、判別3.8One to One的問題建立假設(shè):假設(shè)檢驗(yàn)的步驟1、建立假設(shè)2、數(shù)據(jù)獨(dú)立性檢查3、數(shù)據(jù)正態(tài)性檢查4、如為One to One問題進(jìn)展方差的F檢驗(yàn)5、計(jì)算檢驗(yàn)統(tǒng)計(jì)量6、給出顯著性程度 ,通常 =0.057、定出臨界值,寫出回絕域8、判別假設(shè)檢驗(yàn)的步驟1、建立假設(shè)2、數(shù)據(jù)獨(dú)立性檢查3、數(shù)據(jù)正態(tài)性檢查4、如為One to One問題進(jìn)展方差的F檢驗(yàn)5、計(jì)算檢驗(yàn)統(tǒng)計(jì)量6、給出顯著性程度 ,通常 =0.057、定出臨界值,寫出回絕域8、判別3.8One to One的問題FcritaF檢驗(yàn):假設(shè)檢驗(yàn)的步驟1、建立假設(shè)2、數(shù)據(jù)獨(dú)立性檢查3、數(shù)據(jù)正態(tài)性檢查4、如為One to
15、One問題進(jìn)展方差的F檢驗(yàn)5、計(jì)算檢驗(yàn)統(tǒng)計(jì)量6、給出顯著性程度 ,通常 =0.057、定出臨界值,寫出回絕域8、判別3.8One to One的問題 相等時(shí)t的計(jì)算:Sp為s1 ,s2的加權(quán)平均,稱為兩個(gè)樣本的結(jié)合方差。3.8One to One的問題 不等時(shí)t的計(jì)算:3.8One to One的問題假設(shè)檢驗(yàn)的步驟1、建立假設(shè)2、數(shù)據(jù)獨(dú)立性檢查3、數(shù)據(jù)正態(tài)性檢查4、如為One to One問題進(jìn)展方差的F檢驗(yàn)5、計(jì)算檢驗(yàn)統(tǒng)計(jì)量6、給出顯著性程度 ,通常 =0.057、定出臨界值,寫出回絕域8、判別3.8One to One的問題Ho值臨界值臨界值a/2 a/2 樣本統(tǒng)計(jì)量回絕域回絕域接受域抽樣
16、分布1 - 置信程度假設(shè)檢驗(yàn)的步驟1、建立假設(shè)2、數(shù)據(jù)獨(dú)立性檢查3、數(shù)據(jù)正態(tài)性檢查4、如為One to One問題進(jìn)展方差的F檢驗(yàn)5、計(jì)算檢驗(yàn)統(tǒng)計(jì)量6、給出顯著性程度 ,通常 =0.057、定出臨界值,寫出回絕域8、判別3.8One to One的問題由于Prob0.03470.05,所以我們回絕零假設(shè),接受備擇假設(shè)!3.8One to One的問題不等實(shí)驗(yàn)和報(bào)告編寫第四單元練習(xí)30分鐘例:兩家供應(yīng)商的硬盤性能目的數(shù)據(jù),問能否這兩個(gè)供應(yīng)商有顯著差別?謝謝大家!課程開發(fā)人員:孟繁一、高武附錄假設(shè)檢驗(yàn)術(shù)語(yǔ)零假設(shè) (Ho) -不存在變化或差別的命題。假設(shè)沒有充分的證據(jù)回絕它,就假設(shè)這一命題是真的。備擇假設(shè)(Ha) - 存在變化或差別的命題。假設(shè)回絕Ho,那么以為這一命題是真的。一類錯(cuò)誤 - 當(dāng)Ho 實(shí)踐上為真時(shí)而被回絕所產(chǎn)生的錯(cuò)誤,或是接受存在差別、但現(xiàn)實(shí)上卻沒有差別時(shí)所犯的錯(cuò)誤。二類錯(cuò)誤 - 當(dāng)Ho 實(shí)踐上為偽而沒有被回絕所產(chǎn)生的錯(cuò)誤,或是接受沒有差別、但現(xiàn)實(shí)上存在差別時(shí)所犯的錯(cuò)誤。假設(shè)檢驗(yàn)術(shù)語(yǔ)
溫馨提示
- 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請(qǐng)下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請(qǐng)聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
- 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁(yè)內(nèi)容里面會(huì)有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
- 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
- 5. 人人文庫(kù)網(wǎng)僅提供信息存儲(chǔ)空間,僅對(duì)用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對(duì)用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對(duì)任何下載內(nèi)容負(fù)責(zé)。
- 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請(qǐng)與我們聯(lián)系,我們立即糾正。
- 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶因使用這些下載資源對(duì)自己和他人造成任何形式的傷害或損失。
最新文檔
- 2025年度個(gè)人房地產(chǎn)抵押借款合同智能審核版
- 2025年度個(gè)人車庫(kù)買賣與車位使用權(quán)過戶合同2篇
- 二零二五年度模板木枋行業(yè)節(jié)能減排合作合同4篇
- 二零二五年度新型環(huán)保涂料研發(fā)與應(yīng)用推廣合同3篇
- 2025年度模具制造企業(yè)兼職用工合同范本3篇
- 二零二五年度海洋資源開發(fā)合作合同范本共3篇
- 2025年度離婚訴訟訴狀撰寫規(guī)范解讀4篇
- 2025年度個(gè)人二手房交易合同范本(含裝修款及違約責(zé)任)
- 2025年度農(nóng)業(yè)科技園區(qū)配套設(shè)施建設(shè)合同4篇
- 二零二五年度農(nóng)業(yè)科技培訓(xùn)與推廣合同8篇
- 中鐵十四局合同范本
- 農(nóng)耕研學(xué)活動(dòng)方案種小麥
- 七年級(jí)下冊(cè)-備戰(zhàn)2024年中考?xì)v史總復(fù)習(xí)核心考點(diǎn)與重難點(diǎn)練習(xí)(統(tǒng)部編版)
- 2024年佛山市勞動(dòng)合同條例
- 污水管網(wǎng)規(guī)劃建設(shè)方案
- 城鎮(zhèn)智慧排水系統(tǒng)技術(shù)標(biāo)準(zhǔn)
- 采購(gòu)管理制度及流程采購(gòu)管理制度及流程
- 五年級(jí)美術(shù)下冊(cè)第9課《寫意蔬果》-優(yōu)秀課件4人教版
- 節(jié)能降耗課件
- 尼爾森數(shù)據(jù)市場(chǎng)分析報(bào)告
- 氧氣霧化吸入法
評(píng)論
0/150
提交評(píng)論