統(tǒng)計(jì)學(xué)第六章 假設(shè)檢驗(yàn)_第1頁
統(tǒng)計(jì)學(xué)第六章 假設(shè)檢驗(yàn)_第2頁
統(tǒng)計(jì)學(xué)第六章 假設(shè)檢驗(yàn)_第3頁
統(tǒng)計(jì)學(xué)第六章 假設(shè)檢驗(yàn)_第4頁
統(tǒng)計(jì)學(xué)第六章 假設(shè)檢驗(yàn)_第5頁
已閱讀5頁,還剩62頁未讀, 繼續(xù)免費(fèi)閱讀

下載本文檔

版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請(qǐng)進(jìn)行舉報(bào)或認(rèn)領(lǐng)

文檔簡介

第六章假設(shè)檢驗(yàn)第一節(jié)假設(shè)檢驗(yàn)的基本概念第二節(jié)單個(gè)總體參數(shù)的假設(shè)檢驗(yàn)第三節(jié)兩個(gè)總體參數(shù)的假設(shè)檢驗(yàn)第四屆非參數(shù)檢驗(yàn)教學(xué)目的與要求:1.掌握假設(shè)檢驗(yàn)的相關(guān)概念及思路和步驟;2.掌握單個(gè)總體的假設(shè)檢驗(yàn)方法;3.了解兩個(gè)總體假設(shè)檢驗(yàn)方法;4.了解非參數(shù)檢驗(yàn)的特點(diǎn)和方法。第一節(jié)假設(shè)檢驗(yàn)概述一、假設(shè)檢驗(yàn)的基本概念(一)、假設(shè)檢驗(yàn)與區(qū)間參數(shù)估計(jì)的區(qū)別和聯(lián)系1、聯(lián)系:參數(shù)估計(jì)和假設(shè)檢驗(yàn)是統(tǒng)計(jì)推斷的兩個(gè)組成部分,都是利用樣本對(duì)總體進(jìn)行某種推斷。2、區(qū)別:推斷的角度不同,區(qū)間估計(jì)是用給定的大概率推斷出總體參數(shù)的范圍,而假設(shè)檢驗(yàn)是以小概率為標(biāo)準(zhǔn),對(duì)總體的狀況所做出的假設(shè)進(jìn)行判斷。假設(shè)檢驗(yàn)與區(qū)間估計(jì)結(jié)合起來,構(gòu)成完整的統(tǒng)計(jì)推斷內(nèi)容。(二)、假設(shè)檢驗(yàn)的兩大類別:一類是參數(shù)假設(shè)檢驗(yàn),另一類是非參數(shù)假設(shè)檢驗(yàn)。本章分別討論這兩類檢驗(yàn)方法。

大數(shù)定理表明:就大量觀察而言,事件的發(fā)生具有一定的規(guī)律性。根據(jù)概率的大小,人們處理的態(tài)度和方式很不一樣。在日常生活中,人們往往習(xí)慣于把概率很小的事件,當(dāng)作一次觀察中是極不可能看到的事件。例如,人們出門做事就有可能遇到不測事故,但卻很少人因此而不敢出門。原因是:小概率事件極不可能發(fā)生。(三)小概率原理

小概率原理:即指概率很小的事件在一次試驗(yàn)中實(shí)際上不可能出現(xiàn)。這種事件稱為“實(shí)際不可能事件”。

統(tǒng)計(jì)檢驗(yàn)的依據(jù)是小概率原理:一是認(rèn)為小概率事件在一次觀察中是極少出現(xiàn)的;二是如果在一次觀察中出現(xiàn)了小概率事件,那么應(yīng)該否定原有事件具有小概率的說法或者假設(shè)。二、單側(cè)檢驗(yàn)與雙側(cè)檢驗(yàn)(一)、雙側(cè)檢驗(yàn)α/21–αα/2-Zα/2

Zα/2雙側(cè)檢驗(yàn)雙側(cè)檢驗(yàn)中拒絕域位于正態(tài)分布的兩邊上,對(duì)于提出的,只要或二者之中有一個(gè)成立,就可以否定原假設(shè),這種假設(shè)有兩個(gè)拒絕域、兩個(gè)臨界值,每個(gè)拒絕域的面積為α/2,臨界值為-Zα/2、Zα/2。(二)單側(cè)檢驗(yàn)1、左單側(cè)檢驗(yàn)(下限檢驗(yàn))2、右單側(cè)檢驗(yàn)(上限檢驗(yàn))

α–Zα0

α0Zα左側(cè)檢驗(yàn)右側(cè)檢驗(yàn)假定:–Zα為臨界值

假定Zα為臨界值(三)、用單側(cè)檢驗(yàn)還是雙側(cè)檢驗(yàn),使用左側(cè)檢驗(yàn)還是右側(cè)檢驗(yàn),決定于備選假設(shè)中的不等式形式與方向。與“不相等”對(duì)應(yīng)的是雙側(cè)檢驗(yàn),與“小于”相對(duì)應(yīng)的是左側(cè)檢驗(yàn),與“大于”相對(duì)應(yīng)的是右側(cè)檢驗(yàn)。三、兩種類型的錯(cuò)誤

1、決策結(jié)果存在四種情形:

接受拒絕真實(shí)判斷正確棄真錯(cuò)誤(第一類錯(cuò)誤或α錯(cuò)誤)

不真實(shí)取偽錯(cuò)誤(第二類錯(cuò)誤或β錯(cuò)誤)

判斷正確

在統(tǒng)計(jì)檢驗(yàn)中,無論是拒絕或者接受原假設(shè),都不可能做到百分之百的正確,都有一定的錯(cuò)誤。1)、第一類錯(cuò)誤:原假設(shè)是真實(shí)的,判斷結(jié)論是拒絕原假設(shè),這種錯(cuò)誤叫著“棄真錯(cuò)誤”,在原假設(shè)為真的情況下,檢驗(yàn)統(tǒng)計(jì)量剛好落入小概率的拒絕區(qū)域,使我們拒絕原假設(shè),因此犯第一類錯(cuò)誤的概率大小等于顯著性水平α,我們可通過控制顯著性水平大小的方式來控制犯棄真錯(cuò)誤的概率。在統(tǒng)計(jì)學(xué)上把第一類錯(cuò)誤也叫著α錯(cuò)誤。2)、第二類錯(cuò)誤:原假設(shè)不真實(shí),結(jié)論是接受原假設(shè),這種錯(cuò)誤叫著“取偽錯(cuò)誤”,犯第二類錯(cuò)誤的概率記為,因此,在統(tǒng)計(jì)學(xué)上稱第二類錯(cuò)誤為錯(cuò)誤。3)、不管我們?nèi)绾芜x擇否定域,都不可能完全避免第一類錯(cuò)誤和第二類錯(cuò)誤,也不可能同時(shí)把犯兩類錯(cuò)誤的危險(xiǎn)壓縮到最小。對(duì)任何一個(gè)給定的檢驗(yàn)而言,犯第一類錯(cuò)誤的危險(xiǎn)越小,犯第二類錯(cuò)誤的概率就越大;反之亦然。一般來講,不可能具體估計(jì)出第二類錯(cuò)誤的概率值。第一類錯(cuò)誤則不然,犯第一類錯(cuò)誤的概率是否定域內(nèi)各種結(jié)果的概率之和。2、兩類錯(cuò)誤及其關(guān)系四、檢驗(yàn)功效1、檢驗(yàn)功效或檢驗(yàn)力:在犯第一類錯(cuò)誤的概率α得到控制的條件下,犯取偽錯(cuò)誤的概率β也要盡可能地小,或者說,不取偽的概率1-β應(yīng)盡可能增大。1-β越大,意味著當(dāng)原假設(shè)不真實(shí)時(shí),檢驗(yàn)判斷出原假設(shè)不真實(shí)的概率越大,檢驗(yàn)的判別能力就越好;1-β越小,意味著當(dāng)原假設(shè)不真實(shí)時(shí),檢驗(yàn)結(jié)論判斷出原假設(shè)不真實(shí)的概率越小,檢驗(yàn)的判別能力就越差。可見1-β是反映統(tǒng)計(jì)檢驗(yàn)判別能力大小的重要標(biāo)志,我們稱之為檢驗(yàn)功效或檢驗(yàn)力。2、影響檢驗(yàn)功效的因素1)、α取值:α大,檢驗(yàn)功效就大(1-β)2)、要滿足α、β都盡可能的小,只有增加樣本的容量,但樣本容量都是有限的,因此在實(shí)際應(yīng)用中會(huì)先控制α

原因如下:A、遵循統(tǒng)一原則,討論問題較方便。

B、原假設(shè)清晰,備選假設(shè)模糊,,對(duì)于一個(gè)模糊的假設(shè)和一個(gè)清晰地假設(shè),我們更關(guān)心原假設(shè)為真時(shí),我們卻把它放棄了的可能性有多大。

3)、原假設(shè)與備選假設(shè)的差異程度,差異明顯,則β減少,檢驗(yàn)功效就大。五、值 值是指在原假設(shè)為真的情況下,得到某一樣本觀察結(jié)果或更為極端情形出現(xiàn)的概率。如果值很小,說明小概率事件發(fā)生了,從而有理由拒絕原假設(shè),值愈小則拒絕的理由愈充分。與根據(jù)檢驗(yàn)統(tǒng)計(jì)量是否落入拒絕域的方法相比,利用值檢驗(yàn)要更精確。在前一種方法中,在顯著性水平確定后,拒絕域也就確定了,如果檢驗(yàn)統(tǒng)計(jì)量落入拒絕域,我們犯棄真的錯(cuò)誤就是,而不管得到這一樣本觀察結(jié)果或更為極端情形出現(xiàn)的概率大小,根據(jù)這一方法的做出決策對(duì)決策錯(cuò)誤的風(fēng)險(xiǎn)反映不夠。而值在決策風(fēng)險(xiǎn)度量上要更為精確。在應(yīng)用中,通常先確定一個(gè)顯著性水平,然后用值與比較,在雙側(cè)檢驗(yàn)中,時(shí)拒絕原假設(shè),在單側(cè)檢驗(yàn)中,

時(shí)拒絕原假設(shè)。(1)建立假設(shè)(2)確定統(tǒng)計(jì)量(4)計(jì)算檢驗(yàn)統(tǒng)計(jì)量(3)選擇顯著性水平和否定域(5)判定所所包有

含統(tǒng)的計(jì)步檢驟驗(yàn)

根據(jù)以往多年的統(tǒng)計(jì)表明,上海財(cái)大英語的平均成績?yōu)?0分,隨機(jī)抽取100個(gè)學(xué)生,其平均成績?yōu)?0分,問今年財(cái)大學(xué)生的英語成績是否下降?六、假設(shè)檢驗(yàn)的步驟(5個(gè))1.建立假設(shè)

1)、原假設(shè)(nullhypothesis):需要通過樣本去推斷其正確與否的命題稱為原假設(shè)。用表示,即:2)、備選假設(shè)(alternativehypothesis):與原假設(shè)對(duì)立的是假設(shè),備選假設(shè)是在原假設(shè)被否定時(shí)另一種可能成立的結(jié)論。備選假設(shè)比原假設(shè)還重要,這要由實(shí)際問題來確定,一般把期望出現(xiàn)的結(jié)論作為備選假設(shè)。用表示,備選假設(shè)與原假設(shè)相對(duì)立,原假設(shè)成立,則備選假設(shè)不真實(shí),如原假設(shè)不真實(shí),則備選假設(shè)成立。關(guān)于均值,原假設(shè)與備選假設(shè)有三種情況:

雙側(cè)檢驗(yàn)左側(cè)檢驗(yàn)右側(cè)檢驗(yàn)2、確定適當(dāng)?shù)臋z驗(yàn)統(tǒng)計(jì)量確定適當(dāng)?shù)慕y(tǒng)計(jì)量,且能在原假設(shè)成立的條件下知其分布。一般來說,檢驗(yàn)統(tǒng)計(jì)量的基本形式可表示如下:

3、選擇顯著性水平和否定域被我們事先選定的可以犯第一類錯(cuò)誤的概率,叫做檢驗(yàn)的顯著性水平(用α表示),它決定了否定域的大小。因此,有人也把第一類錯(cuò)誤稱之α錯(cuò)誤。相應(yīng)地第二類錯(cuò)誤被人稱為錯(cuò)誤。在原假設(shè)成立的條件下,統(tǒng)計(jì)檢驗(yàn)中所規(guī)定的小概率標(biāo)準(zhǔn)一般取為α=0.05或α=0.01。由α所決定的否定域與接受域之間的分界值被稱為臨界值,如Zα。4.計(jì)算檢驗(yàn)統(tǒng)計(jì)量

在完成了上述工作之后,接下來就是做一次與理想試驗(yàn)盡量相同的實(shí)際抽樣(比如實(shí)際做一次重復(fù)拋擲硬幣的試驗(yàn)),并從獲取的樣本資料算出檢驗(yàn)統(tǒng)計(jì)量。根據(jù)顯著性水平確定統(tǒng)計(jì)量的否定域或臨界值,并注意是單側(cè)檢驗(yàn)還是雙側(cè)檢驗(yàn)。5.判定

假設(shè)檢驗(yàn)系指拒絕或保留原假設(shè)的判斷,又稱顯著性檢驗(yàn)。在選擇否定域并計(jì)算檢驗(yàn)統(tǒng)計(jì)量之后,我們完成最后一道手續(xù),即根據(jù)計(jì)算結(jié)果決定假設(shè)的取與舍。如果結(jié)果落在否定域內(nèi),我們將在已知犯第一類錯(cuò)誤概率的條件下,否定零假設(shè)。反之,如果結(jié)果落在否定域外,則不否定零假設(shè),與此同時(shí),我們就有了犯第二類錯(cuò)誤的危險(xiǎn)。

第二節(jié)單個(gè)總體參數(shù)的假設(shè)檢驗(yàn)

一、總體均值檢驗(yàn)1、提出原假設(shè)和備選假設(shè)(有三種情況)雙側(cè)檢驗(yàn)左側(cè)檢驗(yàn)右側(cè)檢驗(yàn)2、確定統(tǒng)計(jì)量3、確定顯著性水平及拒絕域

(一)、總體σ已知,對(duì)總體均值的檢驗(yàn)1)、確定顯著性水平α

2)、雙側(cè)檢驗(yàn)時(shí),拒絕域?yàn)閆<-Zα/2或Z>Zα/2,即在

Z<-Zα/2或Z>Zα/2時(shí)拒絕原假設(shè),接受備選假設(shè),反

之接受原假設(shè),拒絕備選假設(shè)。如Z=Zα/2或Z=-Zα/2

為了慎重,一般先不下結(jié)論,應(yīng)再進(jìn)行一次抽檢。

3)、單側(cè)檢驗(yàn)時(shí),左單側(cè)檢驗(yàn)時(shí),拒絕域?yàn)閆<–Zα,即

Z<–Zα?xí)r拒絕原假設(shè),接受備選假設(shè);右單側(cè)檢驗(yàn)

時(shí),拒絕域?yàn)閆>Zα,即Z>Zα?xí)r,拒絕原假設(shè),接

受備選假設(shè)

4、計(jì)算統(tǒng)計(jì)量z的值

5、根據(jù)統(tǒng)計(jì)量的值與臨界值的關(guān)系,進(jìn)行判定是接受原假設(shè)還是拒絕備選假設(shè)1、根據(jù)長期經(jīng)驗(yàn)和資料的分析,某磚瓦廠生產(chǎn)的磚的“抗斷強(qiáng)度”服從正態(tài)分布,方差為1.21。從該廠產(chǎn)品中隨機(jī)抽取6塊,測得抗斷強(qiáng)度如下(單位:KG/):32.5629.6631.6430.0031.8731.03

檢驗(yàn)這批磚的平均抗斷強(qiáng)度為32.50是否成立?(α=0.05)2、某廠生產(chǎn)一種產(chǎn)品,原月產(chǎn)量服從平均值為u=75,方差為14的正態(tài)分布,設(shè)備更新后,為了考察產(chǎn)量是否提高,抽查了6個(gè)月產(chǎn)量,求得平均產(chǎn)量為78,假定方差不變,問在顯著性水平α=0.05下,設(shè)備更新后的月產(chǎn)量是否有顯著性提高?3、某批發(fā)商欲從廠家購進(jìn)一批燈泡,根據(jù)合同規(guī)定燈泡的使用壽命平均不能低于1000小時(shí)。已知燈泡燃燒壽命服從正態(tài)分布,標(biāo)準(zhǔn)差為200小時(shí)。在總體中隨機(jī)抽取了100個(gè)燈泡,得知樣本均值為960小時(shí),批發(fā)商是否應(yīng)購買這批燈泡?(二)、總體σ未知,對(duì)總體均值的檢驗(yàn)總體方差未知時(shí),可用樣本標(biāo)準(zhǔn)差與方差代替它們,檢驗(yàn)統(tǒng)計(jì)量應(yīng)改為自由度為N-1的T分布,即:稱為t-檢驗(yàn)統(tǒng)計(jì)量,這個(gè)檢驗(yàn)統(tǒng)計(jì)量適用于小樣本情況,在大樣本場合,t統(tǒng)計(jì)量與標(biāo)準(zhǔn)正態(tài)分布統(tǒng)計(jì)量近似,通常用z檢驗(yàn)代替t檢驗(yàn)。另T檢驗(yàn)的步驟與z檢驗(yàn)的步驟相同。1、提出原假設(shè)和備選假設(shè)(有三種情況)雙側(cè)檢驗(yàn)左側(cè)檢驗(yàn)右側(cè)檢驗(yàn)2、確定統(tǒng)計(jì)量3、確定顯著性水平及拒絕域

1)、確定顯著性水平α2)、雙側(cè)檢驗(yàn)時(shí),拒絕域?yàn)閠<-tα/2或t>tα/2,即在t<-tα/2或t>tα/2時(shí)拒絕原假設(shè),接受備選假設(shè),反之接受原假設(shè),拒絕備選假設(shè)。3)、單側(cè)檢驗(yàn)時(shí),左單側(cè)檢驗(yàn)時(shí),拒絕域?yàn)閠<–tα,即t<–tα?xí)r拒絕原假設(shè),接受備選假設(shè);右單側(cè)檢驗(yàn)時(shí),拒絕域?yàn)閠>tα,即t>tα?xí)r,拒絕原假設(shè),接受備選假設(shè)

4、計(jì)算統(tǒng)計(jì)量z的值

5、根據(jù)統(tǒng)計(jì)量的值與臨界值的關(guān)系,進(jìn)行判定是接受原假設(shè)還是拒絕備選假設(shè)

練習(xí):某機(jī)器制造的肥皂厚度為5cm,今欲了解機(jī)器性能是否良好,隨機(jī)抽取10塊肥皂為樣本,測得平均厚度為5.3cm,標(biāo)準(zhǔn)差為0.3cm,試分別以0.05、0.01的顯著性水平檢驗(yàn)機(jī)器性能良好(即機(jī)器厚薄符合規(guī)定的假設(shè))二、總體成數(shù)的檢驗(yàn)當(dāng)樣本容量較大時(shí),下列統(tǒng)計(jì)量服從標(biāo)準(zhǔn)正態(tài)分布:

上式中,ρ代表總體的成數(shù),p代表樣本的成數(shù)。以上的z統(tǒng)計(jì)量可以用作總體成數(shù)檢驗(yàn)的檢驗(yàn)統(tǒng)計(jì)量。檢驗(yàn)的步驟和總體均值的檢驗(yàn)步驟相同。練習(xí):一項(xiàng)調(diào)查結(jié)果表明某市老年人口比重為14.7%,該市老年人口研究會(huì)為了檢驗(yàn)該項(xiàng)調(diào)查是否可靠,隨機(jī)抽選了400名居民,發(fā)現(xiàn)其中有57人年齡在65歲以上,調(diào)查結(jié)果是否支持該市老年人口比重為14.7%的看法?(顯著性水平為0.05)三、p-值檢驗(yàn)1、定義:p-值檢驗(yàn)就是通過計(jì)算p-值,再將它與顯著性水平α作比較,決定拒絕還是接受原假設(shè)。所謂p-值就是拒絕原假設(shè)所需的最低顯著性水平。2、p-值判斷的原則是:如果p-值小于給定的顯著性水平α,則拒絕原假設(shè);否則,接受原假設(shè)?;蛘?,更直觀來說就是:如果p-值很小,拒絕原假設(shè),p-值很大,接受原假設(shè)。請(qǐng)大家注意的是這里的p-值是指概率,不要與成數(shù)指標(biāo)相混淆。3、z檢驗(yàn)的p-值:步驟1、2(作出假設(shè)、構(gòu)造檢驗(yàn)統(tǒng)計(jì)量)同

Z檢驗(yàn))步驟3:計(jì)算樣本統(tǒng)計(jì)量步驟4:檢驗(yàn)統(tǒng)計(jì)量為z統(tǒng)計(jì)量的p-值計(jì)算公式,表示檢驗(yàn)統(tǒng)計(jì)量的抽樣數(shù)據(jù),則p-值的計(jì)算方法如下:如果:,p-值=2 如果:,p-值= 如果:,p-值=步驟五:作出決策,如果p-值>顯著性水平,接受原假設(shè),反之拒絕原假設(shè)。4、t檢驗(yàn)的p-值與z檢驗(yàn)類同。四、總體方差檢驗(yàn)原假設(shè)為:

或或1.總體均值未知時(shí)假設(shè)~,但總體均值未知,此時(shí)可用樣本方差與的比來構(gòu)造檢驗(yàn)統(tǒng)計(jì)量,在原假設(shè)為真時(shí),統(tǒng)計(jì)量表達(dá)式為:~

當(dāng)采用雙側(cè)檢驗(yàn)時(shí),若或則拒絕,反之接受;當(dāng)進(jìn)行右側(cè)檢驗(yàn)時(shí),時(shí)拒絕,反之接受;當(dāng)進(jìn)行左側(cè)檢驗(yàn)時(shí),時(shí)拒絕,反之接受。2、總體均值已知時(shí)假設(shè)~,則從總體中抽得的樣本滿足~在原假設(shè)為真時(shí),可以構(gòu)造統(tǒng)計(jì)量:~進(jìn)而可以確定拒絕域。當(dāng)采用雙側(cè)檢驗(yàn)時(shí),或時(shí)拒絕,反之接受;當(dāng)進(jìn)行右側(cè)檢驗(yàn)時(shí),時(shí)拒絕,反之接受;當(dāng)進(jìn)行左側(cè)檢驗(yàn)時(shí),時(shí)拒絕,反之接受。第三節(jié)兩個(gè)總體參數(shù)假設(shè)檢驗(yàn)一、兩個(gè)總體均值之差的檢驗(yàn)原假設(shè)(或)1.已知時(shí)由于~,~,且相互獨(dú)立,所以有:~~

所以可用Z檢驗(yàn)統(tǒng)計(jì)量來檢驗(yàn)原假設(shè)成立與否。2.未知時(shí) 當(dāng)未知但樣本量較大時(shí),依然可以使用Z統(tǒng)計(jì)量進(jìn)行檢驗(yàn),此時(shí)總體分別用樣本方差代替,公式如下:~

當(dāng)未知且樣本量較小時(shí),則不能用代替的統(tǒng)計(jì)量來檢驗(yàn),此時(shí)需要使用t統(tǒng)計(jì)量。更具體了又可以分為兩種情況,一種是根據(jù)以往的大量經(jīng)驗(yàn)或者事先通過檢驗(yàn)知道有,另一種是不相等或無法判斷它們是否相等。我們先討論第一種情況,此時(shí)可以得到的標(biāo)準(zhǔn)差的估計(jì),,其中,于是可以構(gòu)造檢驗(yàn)統(tǒng)計(jì)量~

對(duì)于第二種情況,需要用來估計(jì),可以得到,我們?nèi)匀煌ㄟ^構(gòu)造t統(tǒng)計(jì)量來進(jìn)行檢驗(yàn)~

其中,

注意,此時(shí)統(tǒng)計(jì)量的自由度已不再是,而是近似服從自由度為的分布。二、兩個(gè)總體比例之差的檢驗(yàn)

實(shí)際中經(jīng)常要檢驗(yàn)兩個(gè)總體中具有某一特征單位數(shù)的比例之差是否滿足某一條件。此時(shí)需要用到兩個(gè)總體比例之差的檢驗(yàn)。設(shè)兩個(gè)總體都服從二項(xiàng)分布,兩個(gè)總體中具有某一特征單位數(shù)的比例分別為。從兩個(gè)總體中分別抽出樣本容量為的兩個(gè)樣本,樣本比例分別用表示。1.檢驗(yàn)兩個(gè)總體比例之差為零的假設(shè)設(shè)所要檢驗(yàn)的問題的原假設(shè)為:(或、)在原假設(shè)成立時(shí),可以得到兩個(gè)樣本合并后得到的比例估計(jì)量,其中分別表示兩個(gè)樣本中具有該特征的單位數(shù)。在大樣本條件下,可以構(gòu)造統(tǒng)計(jì)量進(jìn)行檢驗(yàn)~2.檢驗(yàn)兩個(gè)總體比例之差不為零的假設(shè)設(shè)所要檢驗(yàn)的問題的原假設(shè)為(或、)其中為不等于零的常數(shù)。在大樣本條件下,依舊構(gòu)造Z統(tǒng)計(jì)量進(jìn)行檢驗(yàn),但此時(shí)Z統(tǒng)計(jì)量的形式稍有變化。

~三、兩個(gè)總體方差比的檢驗(yàn)兩總體方差是否相等的檢驗(yàn)又稱為方差齊性檢驗(yàn)。實(shí)際中常常需要對(duì)兩個(gè)總體方差是否相等進(jìn)行檢驗(yàn),比如比較兩種資產(chǎn)的波動(dòng),比較生產(chǎn)工藝的穩(wěn)定性,等等。在前面介紹的方差未知且小樣本的兩總體均值之差檢驗(yàn)中,曾假定兩總體的方差相等或不相等。而實(shí)際中往往需要通過方差齊性檢驗(yàn)才能知道兩總體的方差是否相等。四、配對(duì)樣本的檢驗(yàn)在實(shí)際中,經(jīng)常會(huì)碰到檢驗(yàn)兩個(gè)相關(guān)樣本或配對(duì)樣本的平均數(shù)間是否有顯著差異的問題,比如檢驗(yàn)一組肥胖者參加減肥訓(xùn)練班后體重是否有明顯的變化,車間工人在培訓(xùn)前后生產(chǎn)效率是否有明顯的差異,等等。對(duì)于這類兩個(gè)樣本之間存在相關(guān)性的問題,采用匹配樣本的檢驗(yàn),可以提高效率。這里通過一個(gè)例子介紹配對(duì)樣本的均值之差的檢驗(yàn)[例6-13]某工廠為工人組織了一次技術(shù)培訓(xùn),為檢驗(yàn)這次培訓(xùn)是否有效果,隨機(jī)抽取了10名工人進(jìn)行調(diào)查,測得他們的培訓(xùn)前后每小時(shí)平均生產(chǎn)零件數(shù),如表6-2所示。第三節(jié)非參數(shù)檢驗(yàn)非參數(shù)檢驗(yàn)是對(duì)總體的分布不作任何限制的統(tǒng)計(jì)檢驗(yàn)。故非參數(shù)檢驗(yàn)又稱為自由分布檢驗(yàn)。非參數(shù)檢驗(yàn),無需做出經(jīng)典統(tǒng)計(jì)所必要的關(guān)于分布的任何假設(shè)。唯一需要的假設(shè)是:全部數(shù)據(jù)或數(shù)據(jù)對(duì)都出自相同的基本總體,且取樣是隨機(jī)的、相互獨(dú)立的?;谶@種原因,非參數(shù)檢驗(yàn)又稱為分布自由(或無分布)檢驗(yàn)?!盁o分布”不是指總體真的無分布,而是指雖有時(shí)對(duì)總體分布一無所知,但仍可以進(jìn)行分析。不僅如此,這些很容易理解的方法還可以用于處理等級(jí)的資料和定性的信息。正因?yàn)槿绱?,非參?shù)檢驗(yàn)成為管理科學(xué)中應(yīng)用較為廣泛的一種統(tǒng)計(jì)檢驗(yàn)方法。

一、自由分布檢驗(yàn)概述1、自由分布檢驗(yàn)概念:又稱為非參數(shù)檢驗(yàn),對(duì)總體分布未加限制的檢驗(yàn)。2、自由分布檢驗(yàn)對(duì)比參數(shù)檢驗(yàn),具有以下優(yōu)點(diǎn):首先,檢驗(yàn)條件比較寬松,適應(yīng)性強(qiáng)。其次,自由分布檢驗(yàn)的方法比較靈活,用途廣泛。對(duì)于那些不能進(jìn)行加、減、乘、除運(yùn)算的定類數(shù)據(jù)與定序數(shù)據(jù),可使用符號(hào)檢驗(yàn)、秩和檢驗(yàn)等方法進(jìn)行檢驗(yàn)。再次,自由分布檢驗(yàn)的計(jì)算相對(duì)簡單。由于自由分布的檢驗(yàn)方法不用復(fù)雜計(jì)算,一般使用計(jì)數(shù)方法就可以了,它的計(jì)數(shù)過程與結(jié)果都比較簡單、直觀與明顯。3、自由分布檢驗(yàn)缺點(diǎn)由于它對(duì)原始數(shù)據(jù)中包含的信息利用得不夠充分,檢驗(yàn)的功效相對(duì)較弱。當(dāng)總體的分布形式已知時(shí),基于這種分布類型的參數(shù)方法,一般說來比非參數(shù)方法為佳。例如,對(duì)于一批資料,可同時(shí)適用于參數(shù)的t-檢驗(yàn)、非參數(shù)的符秩檢驗(yàn)和符號(hào)檢驗(yàn)。其檢驗(yàn)功效是,t-檢驗(yàn)的最好,符秩檢驗(yàn)次之,符號(hào)檢驗(yàn)最差。這主要是由于符號(hào)檢驗(yàn)對(duì)信息的利用最不充分。二、符號(hào)檢驗(yàn)(最簡單的檢驗(yàn))該方法是建立在以正、負(fù)號(hào)表示樣本數(shù)據(jù)與假設(shè)參數(shù)值差異關(guān)系基礎(chǔ)上的,因此稱之為符號(hào)檢驗(yàn)。該方法既適用于單樣本場合,也適用于配對(duì)樣本場合。(一)單樣本場合的符號(hào)檢驗(yàn)中位數(shù)檢驗(yàn):

:=A樣本每個(gè)數(shù)據(jù)都減去A,只記錄其差數(shù)的符號(hào)。n+與n-分別是正、負(fù)符號(hào)的個(gè)數(shù),當(dāng)原假設(shè)為真是時(shí),n+與n-應(yīng)該很接近;若兩者相差太遠(yuǎn),就有有理由拒絕原假設(shè)。例4:設(shè)有20個(gè)工人,他們一天生產(chǎn)的產(chǎn)品件數(shù),抽樣結(jié)果如下:168,163,160,172,162,168,152,153,167,165,164,142,173,166,160,165,171,186,167,170。試以α=0.10的檢驗(yàn)水平,判定總體中位數(shù)是否是160。解:第一步:作出假設(shè)。:=160,:160由備選假設(shè)知,這個(gè)檢驗(yàn)是雙側(cè)的。第二步:計(jì)數(shù)。對(duì)樣本數(shù)據(jù),大于160的記下“+”,小于160的記下“-”,等于160的,予以剔除(以0記之),結(jié)果如下:++0+++--+++-++0+++++計(jì)數(shù)以上“+”的個(gè)數(shù)是n+=15,“-”的個(gè)數(shù)n-=3,剔除數(shù)據(jù)2個(gè)。最后有效的樣本個(gè)數(shù)為n=n++n-=18。第三步:確定拒絕域。顯著水平α=0.10,由于進(jìn)行雙側(cè)檢驗(yàn),拒絕域分布在兩邊,每側(cè)概率α/2=0.05,查二項(xiàng)分布臨界值表,得到拒絕域的臨界值是13。第四步:選擇n+、n-較大者,再與臨界值比較。結(jié)果是15>13。第五步:判斷。由于上一步的比較結(jié)果可知,樣本落入拒絕域,所以拒絕原假設(shè),認(rèn)為樣本數(shù)據(jù)不能證明總體中位數(shù)等于160件。(二)配對(duì)樣本場合的符號(hào)檢驗(yàn)樣本配對(duì)場合與單樣本場合的符號(hào)檢驗(yàn),基本原理是一致的。設(shè)從兩個(gè)總體中分別抽出一個(gè)容量相等的樣本,然后將兩樣本的數(shù)據(jù)進(jìn)行一一配對(duì),得到一組配對(duì)值。再將各對(duì)配對(duì)值相減,記錄下差數(shù)的符號(hào),計(jì)算出“+”的個(gè)數(shù)n+與“-”的個(gè)數(shù)n-。如果兩個(gè)樣本的總體差異不顯著,配對(duì)值之差的正負(fù)號(hào)出現(xiàn)的概率各是1/2,則n+與n-應(yīng)當(dāng)非常接近;如果n+、n-相差太大的話,說明兩總體存在顯著差異。例子見書上的。三、秩和檢驗(yàn)秩和檢驗(yàn)也稱Wilcoxon-Man-Whitney檢驗(yàn)。該檢驗(yàn)方法可用于檢驗(yàn)兩個(gè)獨(dú)立的樣本是否來自同一個(gè)總體,或判斷總體間是否存在顯著性的差異。它和符號(hào)檢驗(yàn)最主要的區(qū)別是,符號(hào)檢驗(yàn)只考慮樣本間差數(shù)的符號(hào),而秩和檢驗(yàn)還要考慮差數(shù)的順序,比符號(hào)檢驗(yàn)利用數(shù)據(jù)信息更加充分,因此,檢驗(yàn)功效就更強(qiáng)。秩和檢驗(yàn)原理:1、設(shè)分別從兩個(gè)未知的總體獨(dú)立、隨機(jī)地抽取容量為n1和n2的樣本,把樣本容量較小的總體稱為總體Ⅰ。如果兩樣本容量相等,就把任意一個(gè)總體稱作總體Ⅰ,另一個(gè)總體稱作總體Ⅱ,這里不妨設(shè)n1<n2。2、現(xiàn)將兩個(gè)樣本混合起來,并按數(shù)據(jù)的大小,從小到大排列編號(hào),每個(gè)數(shù)值的編號(hào)就是它的秩次。如果混合樣本中有若干個(gè)相同的數(shù)值,則把它們的秩次進(jìn)行簡單算術(shù)平均,用此平均值作為這些數(shù)值的秩次,計(jì)算來自總體Ⅰ的n1個(gè)數(shù)據(jù)在混合樣本中的秩次之和,記為T。3、顯然T最小的可能值是:T1=1+2+3+…+n1=[n1(n1+1)]/2;最大的可能值是T2=(n2+1)+(n2+2)+…+(n2+n1)=n1[(n2+1)+(n2+n1)]/2。如果兩個(gè)總體分布無顯著差異,則T值不應(yīng)太大或太小,等于中間值(T1+T2)/2;如果總體Ⅰ分布于總體Ⅱ的右邊,T將接近其最大值T2;如果總體Ⅰ位于總體Ⅱ的左邊,T將接近于它的最小值T1。因此,我們可以用秩和T作為檢驗(yàn)的統(tǒng)計(jì)量。4、第一種方法,當(dāng)n1和n2都不超過10時(shí),查“秩和檢驗(yàn)表”確定臨界值;第二種方法,當(dāng)n1和n2都超過10時(shí),秩和T服從正態(tài)分布:先對(duì)T進(jìn)行標(biāo)準(zhǔn)化變換,再利用標(biāo)準(zhǔn)正態(tài)分布表,確定檢驗(yàn)的臨界值。練習(xí):有A、B兩家廠商供應(yīng)同一種商品,兩家商品價(jià)格與性能一致,但使用壽命是否一致有待檢驗(yàn)。今分別從兩家生產(chǎn)產(chǎn)品中抽出樣本,測定產(chǎn)品使用壽命(見下表,單位:小時(shí)):試以

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請(qǐng)下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請(qǐng)聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會(huì)有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫網(wǎng)僅提供信息存儲(chǔ)空間,僅對(duì)用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對(duì)用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對(duì)任何下載內(nèi)容負(fù)責(zé)。
  • 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請(qǐng)與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶因使用這些下載資源對(duì)自己和他人造成任何形式的傷害或損失。

評(píng)論

0/150

提交評(píng)論