




版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進(jìn)行舉報或認(rèn)領(lǐng)
文檔簡介
第8章假設(shè)檢驗(yàn)PowerPoint統(tǒng)計(jì)學(xué)概述
參數(shù)估計(jì)和假設(shè)檢驗(yàn)是統(tǒng)計(jì)推斷的兩個組成部分。它們都是利用樣本對總體進(jìn)行某種推斷。參數(shù)估計(jì)是利用樣本去估計(jì)總體參數(shù),參數(shù)在估計(jì)前是未知的。假設(shè)檢驗(yàn)是先作出對總體參數(shù)、分布形式、相互關(guān)系等的假定,然后通過樣本信息對假定是否成立作出判斷。有參數(shù)假設(shè)檢驗(yàn)和非參數(shù)假設(shè)檢驗(yàn)。本章主要介紹參數(shù)假設(shè)檢驗(yàn)。參數(shù)假設(shè)檢驗(yàn)的方法是采用邏輯上的反證法,依據(jù)統(tǒng)計(jì)上的小概率原理第8章假設(shè)檢驗(yàn)8.1
假設(shè)檢驗(yàn)的基本問題8.2
一個總體參數(shù)的檢驗(yàn)8.3
兩個總體參數(shù)的檢驗(yàn)8.4
檢驗(yàn)問題的進(jìn)一步說明學(xué)習(xí)目標(biāo)了解假設(shè)檢驗(yàn)的基本思想掌握假設(shè)檢驗(yàn)的步驟對實(shí)際問題作假設(shè)檢驗(yàn)利用置信區(qū)間進(jìn)行假設(shè)檢驗(yàn)利用P-值進(jìn)行假設(shè)檢驗(yàn)8.1假設(shè)檢驗(yàn)的基本問題8.1.1假設(shè)問題的提出8.1.2假設(shè)的表達(dá)式8.1.3兩類錯誤8.1.4假設(shè)檢驗(yàn)的流程8.1.5利用P值進(jìn)行決策8.1.6單側(cè)檢驗(yàn)假設(shè)問題的提出什么是假設(shè)?
(hypothesis)對總體參數(shù)的數(shù)值所作的一種陳述總體參數(shù)包括總體均值、比例、方差等分析之前必須陳述舉例【例8.1】由統(tǒng)計(jì)資料得知,1989年某地新生兒的平均體重為3190克,現(xiàn)從1990年的新生兒中隨機(jī)抽取100個,測得其平均體重為3210克,問1990年的新生兒和1989年相比,體重有無顯著差異?問題的關(guān)鍵:兩年平均重量的20克差異是由抽樣的隨機(jī)性引起的還是由于總體均值的差異引起的。假設(shè):1989年和1990年新生兒平均重量沒有顯著差異。(若用0和分別表示1989年和1990年新生兒的平均體重,則假設(shè)可以表示為
=0或0-=0.)提出原假設(shè)和備擇假設(shè)什么是原假設(shè)?(nullhypothesis)待檢驗(yàn)的假設(shè),又稱“0假設(shè)”一般是研究者想收集證據(jù)予以反對的假設(shè)3. 原假設(shè)一般是確定的(包含等號,也可以包含不等號或)4. 表示為H0H0:
某一數(shù)值例如,H0:
3190(克)或=0
什么是備擇假設(shè)?(alternativehypothesis)—與原假設(shè)對立的假設(shè),也稱“研究假設(shè)”或“對立假設(shè)”。如果原假設(shè)不可接受,就接受該假設(shè)一般是研究者想收集證據(jù)予以支持的假設(shè)通常是非確定的式子,包含,
或表示為H1H1:
某一數(shù)值,或
>某一數(shù)值或
<某一數(shù)值例如,對原假設(shè)H0:
=3190,對應(yīng)的備擇假設(shè)為
H1:3910或
H1:>3910或
H1:
<3910備擇假設(shè)可以根據(jù)需要進(jìn)行設(shè)定,并非唯一的。提出原假設(shè)和備擇假設(shè)假設(shè)檢驗(yàn)的流程提出假設(shè)確定適當(dāng)?shù)臋z驗(yàn)統(tǒng)計(jì)量規(guī)定顯著性水平計(jì)算檢驗(yàn)統(tǒng)計(jì)量的值并作出統(tǒng)計(jì)決策假設(shè)檢驗(yàn)的流程舉例【例8.1】據(jù)統(tǒng)計(jì)資料可知:1989年某地新生兒的平均體重為3190克,現(xiàn)從1990年的新生兒中隨機(jī)抽取100個,測得其平均體重為3210克,問1990年的新生兒和1989年的新生兒相比,體重有無差異?
Step1:提出假設(shè)設(shè)表示1990年總體新生兒的平均體重
H0:=3190H1:3190什么是檢驗(yàn)統(tǒng)計(jì)量?1. 用于假設(shè)檢驗(yàn)決策的統(tǒng)計(jì)量2. 檢驗(yàn)統(tǒng)計(jì)量在原假設(shè)成立的前提下,需要滿足以下幾個條件:已知分布(z、2、t、F)在原假設(shè)成立的前提下,統(tǒng)計(jì)量的值可算或取值范圍可算(統(tǒng)計(jì)量可以包含,也可以不包含要檢驗(yàn)的參數(shù))確定適當(dāng)?shù)臋z驗(yàn)統(tǒng)計(jì)量假設(shè)檢驗(yàn)的流程舉例【例8.1】據(jù)統(tǒng)計(jì)資料可知:1989年某地新生兒的平均體重為3190克。現(xiàn)從1990年的新生兒中隨機(jī)抽取100個,測得其平均體重為3210克,若已知1990年新生兒體重的標(biāo)準(zhǔn)差為80。問1990年的新生兒和1989年的新生兒相比,體重有無差異?
Step2:確定適當(dāng)?shù)臋z驗(yàn)統(tǒng)計(jì)量在n充分大時,根據(jù)中心極限定理,樣本均值服從正態(tài)分布。故在原假設(shè)成立的前提下,可構(gòu)造如下統(tǒng)計(jì)量:規(guī)定顯著性水平
(significantlevel)什么是顯著性水平?1. 是一個概率值。表示小概率事件的概率。(實(shí)際上是原假設(shè)為真時,拒絕原假設(shè)的概率)2. 表示為(alpha)常用的值有0.01,0.05,0.103. 由研究者事根據(jù)本問題能接受的出錯范圍事先確定。假設(shè)檢驗(yàn)的流程舉例【例8.1】據(jù)統(tǒng)計(jì)資料可知:1989年某地新生兒的平均體重為3190克?,F(xiàn)從1990年的新生兒中隨機(jī)抽取100個,測得其平均體重為3210克,若已知1990年新生而提供的標(biāo)準(zhǔn)差為80。問1990年的新生兒和1989年的新生兒相比,體重有無差異?
Step3:給定顯著性水平
給定顯著性水平為0.05作出統(tǒng)計(jì)決策計(jì)算檢驗(yàn)的統(tǒng)計(jì)量根據(jù)給定顯著性水平,查表得出相應(yīng)的臨界值(如:z或z/2,t或t/2)將檢驗(yàn)統(tǒng)計(jì)量的值與水平的臨界值進(jìn)行比較得出決策:依據(jù)小概率原理:概率很小的事件在一次隨機(jī)試驗(yàn)中是幾乎不可能發(fā)生。決策:
(1)若統(tǒng)計(jì)量的值落入臨界域(拒絕域),則認(rèn)為出現(xiàn)小概率事件,拒絕原假設(shè)H0,接受備擇假設(shè)
(2)否則,接受原假設(shè)H0假設(shè)檢驗(yàn)流程舉例0z0.025-z0.02595%Step4:計(jì)算出統(tǒng)計(jì)量的值并作出決策。
z=(3210-3190)/(80/10)=2.5,查表可得:z0.025=1.96,-z0.025=1.962.5>1.96,統(tǒng)計(jì)量落入臨界域,拒絕原假設(shè),即1990年嬰兒的平均重量與1989年有顯著差異。臨界域臨界域臨界值臨界值雙側(cè)檢驗(yàn)和單側(cè)檢驗(yàn)雙側(cè)檢驗(yàn)雙側(cè)檢驗(yàn)
—左右兩側(cè)都有臨界域,每個拒絕域的面積為/2的檢驗(yàn)通常用于我們對于備擇假設(shè)偏離原假設(shè)的方向沒有一個強(qiáng)有力的先驗(yàn)性或理論性期望。雙側(cè)檢驗(yàn)對應(yīng)的備擇假設(shè)通常為0例如,某種零件的尺寸,要求其平均長度為10cm,大于或小于10cm均屬于不合格建立的原假設(shè)與備擇假設(shè)應(yīng)為
H0:
=10H1:
10雙側(cè)檢驗(yàn)
(顯著性水平與拒絕域)抽樣分布H0值臨界值臨界值a/2a/2
樣本統(tǒng)計(jì)量拒絕域拒絕域1-置信水平左單側(cè)檢驗(yàn)
(定義)左單側(cè)檢驗(yàn)
—只有一個臨界值,臨界域在左側(cè)的檢驗(yàn)通常用于對于備擇假設(shè)偏離原假設(shè)的方向確定,而且在原假設(shè)成立范圍內(nèi)計(jì)算得到的檢驗(yàn)統(tǒng)計(jì)量的值在由原假設(shè)與備擇假設(shè)邊界值計(jì)算得到的統(tǒng)計(jì)量值的左側(cè)。左單側(cè)檢驗(yàn)
(顯著性水平與拒絕域)H0值臨界值a樣本統(tǒng)計(jì)量拒絕域抽樣分布1-置信水平左單側(cè)檢驗(yàn)舉例(1)【例8.16】某批發(fā)商欲從廠家購進(jìn)一批燈泡,根據(jù)合同規(guī)定燈泡的使用壽命平均不能低于1000小時。已知燈泡燃燒壽命服從正態(tài)分布,標(biāo)準(zhǔn)差為100小時。在總體中隨機(jī)抽取了81個燈泡,得知樣本均值為990個小時,批發(fā)商是否應(yīng)該購進(jìn)這批燈泡。
Step1:提出假設(shè)
H0:
1000H1:
<1000左單側(cè)檢驗(yàn)舉例(2)Step2:確定適當(dāng)?shù)臋z驗(yàn)統(tǒng)計(jì)量Step3:
給定顯著性水平=0.05Step3:
計(jì)算出統(tǒng)計(jì)量的值并作出決策在原假設(shè)1000的前提下,有:查表有:-z0.05=-1.6449,0.9>-1.6449,統(tǒng)計(jì)量Z的值沒有落入臨界域,不拒絕原假設(shè)??少徣脒@批燈泡。左單側(cè)檢驗(yàn)
(顯著性水平與拒絕域)-0.9>ZZ=-1.6449a樣本統(tǒng)計(jì)量拒絕域抽樣分布1-右單側(cè)檢驗(yàn)
(定義)右單側(cè)檢驗(yàn)
—只有一個臨界值,臨界域在右側(cè)的檢驗(yàn)通常用于對于備擇假設(shè)偏離原假設(shè)的方向確定,而且在原假設(shè)成立范圍內(nèi)計(jì)算得到的檢驗(yàn)統(tǒng)計(jì)量的值在由原假設(shè)與備擇假設(shè)邊界值計(jì)算得到的統(tǒng)計(jì)量值的右側(cè)。右單側(cè)檢驗(yàn)
(顯著性水平與拒絕域)抽樣分布H0值臨界值a樣本統(tǒng)計(jì)量拒絕域1-置信水平右單側(cè)檢驗(yàn)舉例(1)【例8.16】某批發(fā)商欲從廠家購進(jìn)一批燈泡,根據(jù)合同規(guī)定燈泡的使用壽命平均高于1000小時。已知燈泡燃燒壽命服從正態(tài)分布,標(biāo)準(zhǔn)差為100小時。在總體中隨機(jī)抽取了81個燈泡,得知樣本均值為990個小時,批發(fā)商是否應(yīng)該購進(jìn)這批燈泡。
Step1:提出假設(shè)
H0:
1000H1:>1000右單側(cè)檢驗(yàn)舉例(2)Step2:確定適當(dāng)?shù)臋z驗(yàn)統(tǒng)計(jì)量
Step3:給定顯著性水平=0.05
Step4:計(jì)算出統(tǒng)計(jì)量的值并作出決策。
在原假設(shè)1000成立的前提下,有:查表有:Z0.05=1.6449>-0.9,不拒絕H0,故不購進(jìn)這批燈泡。雙側(cè)檢驗(yàn)與單側(cè)檢驗(yàn)
(假設(shè)的形式)假設(shè)對均值的假設(shè)檢驗(yàn)問題雙側(cè)檢驗(yàn)左側(cè)檢驗(yàn)右側(cè)檢驗(yàn)H0m=m0m
m0m
m0H1m≠m0m<m0m>m0對檢驗(yàn)結(jié)論的理解檢驗(yàn)結(jié)論是建立在概率基礎(chǔ)上的?!安痪芙^”和“接受”不代表為真。不拒絕原假設(shè)。是表示在我們能接受的出錯概率下,沒有充分的理由讓我們拒絕原假設(shè)?!熬芙^”不代表為假。拒絕原假設(shè),接受備擇假設(shè),是表示我們能在1-的置信水平上拒絕原假設(shè)或能在比較大的概率下拒絕原價設(shè),但不代表原假設(shè)一定為假。如何設(shè)置原假設(shè)和備擇假設(shè)
由例8.16可以看出:當(dāng)將原假設(shè)和備擇假設(shè)交換,檢驗(yàn)得到的最終結(jié)果不一定相同。對假設(shè)的設(shè)定沒有固定統(tǒng)一的標(biāo)準(zhǔn)。一般遵循的原則是:(1)把傳統(tǒng)的、被大多數(shù)人所認(rèn)可的觀點(diǎn)或結(jié)論放在原假設(shè),意為,在沒有充分證明其錯誤時,總是被認(rèn)定為正確的。(2)將新的、可能的、猜測的假設(shè)放在備擇假設(shè)。(3)將研究者關(guān)注的(要證明的)結(jié)論放在備擇假設(shè),這樣,如果通過假設(shè)檢驗(yàn)作出拒絕零假設(shè)而選擇備擇假設(shè)的判斷,會使檢驗(yàn)的結(jié)論更具說服力(拒絕原假設(shè)時是有充分的理由的,而接受原假設(shè)是在沒有充分理由拒絕它時才作出的決定)。(4)容易構(gòu)造統(tǒng)計(jì)量的角度來設(shè)置原假設(shè)和備擇假設(shè),因?yàn)樵僭O(shè)和備擇假設(shè)設(shè)置的不同可能會導(dǎo)致使用的統(tǒng)計(jì)量不同。設(shè)置原假設(shè)和備擇假設(shè)舉例
舉例:
(1)檢驗(yàn)采用新技術(shù)后,是否會使產(chǎn)品的壽命延長到5000小時以上
分析:設(shè)采用新技術(shù)后產(chǎn)品壽命的均值為,原來的情況是產(chǎn)品壽命沒有超過5000小時,在沒有充分證明前不應(yīng)該輕易否定,故
H0:5000(不能輕易否定的命題)H1:>5000(需要驗(yàn)證的命題)
(2)檢驗(yàn):與不吸煙相比,吸煙容易導(dǎo)致肺癌
分析:設(shè)1為吸煙人群肺癌的發(fā)病率,2為不吸煙人群肺癌的發(fā)病率,廣泛被人們所認(rèn)可的結(jié)論是:1>2,必須有充分的證據(jù)才能讓人們認(rèn)可“肺癌與吸煙無關(guān)”的新看法。因此,設(shè)置假設(shè)為:
H0:12;(不能輕易否定的命題)H1:1<2(需要驗(yàn)證的命題)設(shè)生產(chǎn)某種螺絲要求的直徑均值為1cm,從某生產(chǎn)線生產(chǎn)的該種螺絲中抽取100個,求得其直徑的均值為0.98cm,利用假設(shè)檢驗(yàn)方法來檢驗(yàn)該生產(chǎn)線生產(chǎn)的螺絲與標(biāo)準(zhǔn)均值相比是否有變化,下列正確的假設(shè)形式是:()A.H0:u=1;H1:u1
B.H0:u1;H1:u1
C.H0:u<1;H1:u1
D.H0:u1;H1:u1
在假設(shè)檢驗(yàn)中,以下說法正確的是:()A.不拒絕原價設(shè)表示原價設(shè)為真;B.接受備擇假設(shè)表示備擇假設(shè)為真;C.顯著性水平為含義為若原假設(shè)為真時,拒絕原假設(shè)的概率為;D.備擇假設(shè)和原假設(shè)有可能都成立;練習(xí)(1)AC(3)設(shè)u表示均值,使用的統(tǒng)計(jì)量為z,指出下列檢驗(yàn)?zāi)膫€屬于左側(cè)檢驗(yàn):()A.H0:u=1;H1:u1
B.H0:u1;H1:u1
C.H0:u<1;H1:u1
D.H0:u1;H1:u<1
(4)指出下列檢驗(yàn)形式的寫法哪個是錯誤的:()A.H0:u=u0;H1:uu0
B.H0:uu0;H1:u>u0
C.H0:u<u0;H1:uu0
D.H0:uu0;H1:u<u0
練習(xí)(2)DC利用P值進(jìn)行決策什么是P值?
(P-value)是一個概率值如果原假設(shè)為真,P-值是出現(xiàn)檢驗(yàn)統(tǒng)計(jì)量的樣本觀測結(jié)果或更極端結(jié)果的概率左側(cè)檢驗(yàn)時,P-值為小于等于檢驗(yàn)統(tǒng)計(jì)量值的概率右側(cè)檢驗(yàn)時,P-值為大于等于檢驗(yàn)統(tǒng)計(jì)量值的概率雙側(cè)檢驗(yàn)時,P-值為絕對值大于等于檢驗(yàn)統(tǒng)計(jì)量的值的概率被稱為觀察到的(或?qū)崪y的)顯著性水平是拒絕H0
的最小值雙側(cè)檢驗(yàn)的P值/
2/
2Z拒絕拒絕H0值臨界值計(jì)算出的樣本統(tǒng)計(jì)量計(jì)算出的樣本統(tǒng)計(jì)量臨界值1/2P值1/2P值左側(cè)檢驗(yàn)的P值H0值臨界值a樣本統(tǒng)計(jì)量拒絕域抽樣分布1-置信水平計(jì)算出的樣本統(tǒng)計(jì)量P值右側(cè)檢驗(yàn)的P值H0值臨界值a拒絕域抽樣分布1-置信水平計(jì)算出的樣本統(tǒng)計(jì)量P值利用P值進(jìn)行檢驗(yàn)
(決策準(zhǔn)則)雙(單)側(cè)檢驗(yàn)若p-值>,接受H0若p-值<,拒絕H0(教材P215描述有誤)假設(shè)檢驗(yàn)中的兩類錯誤(決策風(fēng)險)假設(shè)檢驗(yàn)中的兩類錯誤1.
第一類錯誤(拒真錯誤/錯誤)原假設(shè)為真時拒絕原假設(shè)第一類錯誤的概率記為即顯著性水平2. 第二類錯誤(取偽錯誤/錯誤)原假設(shè)為假時接受原假設(shè)第二類錯誤的概率記為(Beta)兩類錯誤的關(guān)系(1)=0拒真概率取偽概率(=0)(2)>00兩類錯誤的關(guān)系拒真概率(=0)(2)<00取偽概率(1)
=0兩類錯誤的關(guān)系對于一定的樣本量n,如果減小,則會增大,反之,減小就會增大,所以不能做到犯兩類錯誤的概率都很小。一般來說,哪類錯誤所帶來的后果嚴(yán)重,就會將哪類錯誤作為首要的控制目標(biāo),因?yàn)樵僭O(shè)常常是明確的,而備擇假設(shè)是模糊的,因此人們常常首先控制犯錯誤。給定顯著性水平和p值,以下描述正確的是:()A.p<,接受H0;B.p>,拒絕H0;C.p>,接受H1;D.p<,接受H1;
在假設(shè)檢驗(yàn)中,犯第一類錯誤的概率為,意為:()A.當(dāng)原假設(shè)錯誤時接受原假設(shè)的概率;B.當(dāng)備擇假設(shè)正確時接受備擇假設(shè)的概率;C.當(dāng)原假設(shè)正確時拒絕原假設(shè)的概率;
D.犯第二類錯誤的概率為1-;練習(xí)(3)DC8.2一個總體參數(shù)的檢驗(yàn)8.2.1檢驗(yàn)統(tǒng)計(jì)量的確定8.2.2總體均值的檢驗(yàn)8.2.3總體比例的檢驗(yàn)8.2.4總體方差的檢驗(yàn)一個總體參數(shù)的檢驗(yàn)Z檢驗(yàn)(單尾和雙尾)t檢驗(yàn)(單尾和雙尾)Z檢驗(yàn)(單尾和雙尾)
2檢驗(yàn)(單尾和雙尾)均值一個總體比例方差總體均值檢驗(yàn)總體均值的檢驗(yàn)
(檢驗(yàn)統(tǒng)計(jì)量)總體是否已知?用樣本標(biāo)準(zhǔn)差S代替t檢驗(yàn)小樣本量n否是z檢驗(yàn)
z檢驗(yàn)大總體均值的檢驗(yàn)
(2
已知或2未知大樣本)1. 假定條件總體服從正態(tài)分布或
在大樣本(n30)前提下,可用正態(tài)分布來近似使用Z-統(tǒng)計(jì)量2
已知:2
未知,大樣本:(當(dāng)n30時,z分布與t分布非常接近,故用z分布取代t分布)2
已知均值的檢驗(yàn)
(例題分析)【例8.4】某機(jī)床廠加工一種零件,根據(jù)經(jīng)驗(yàn)知道,該廠加工零件的橢圓度近似服從正態(tài)分布,其總體均值為0=0.081mm,總體標(biāo)準(zhǔn)差為=0.025
。今換一種新機(jī)床進(jìn)行加工,抽取n=200個零件進(jìn)行檢驗(yàn),得到的橢圓度為0.076mm。試問新機(jī)床加工零件的橢圓度的均值與以前有無顯著差異?(=0.05)雙側(cè)檢驗(yàn)2
已知均值的檢驗(yàn)
(例題分析)H0:
=0.081H1:
0.081
=
0.05n
=
200查表得臨界值(s):Z/2=1.96檢驗(yàn)統(tǒng)計(jì)量:Z01.96-1.96.025拒絕H0拒絕H0.025決策:結(jié)論:
在
=0.05的水平上拒絕H0有充分證據(jù)表明新機(jī)床加工的零件的橢圓度與以前有顯著差異2
已知均值的檢驗(yàn)
(P值的計(jì)算與應(yīng)用)第1步:進(jìn)入Excel表格界面,選擇“插入”下拉菜單第2步:選擇“函數(shù)”點(diǎn)擊第3步:在函數(shù)分類中點(diǎn)擊“統(tǒng)計(jì)”,在函數(shù)名的菜單下選擇字符“NORMSDIST”然后確定第4步:將Z的絕對值2.83錄入,得到的函數(shù)值為
0.997672537P值=2(1-0.997672537)=0.004654P值遠(yuǎn)遠(yuǎn)小于,故拒絕H02
已知均值的檢驗(yàn)
(小樣本例題分析)【例】根據(jù)過去大量資料,某廠生產(chǎn)的燈泡的使用壽命服從正態(tài)分布N~(1020,1002)。現(xiàn)從最近生產(chǎn)的一批產(chǎn)品中隨機(jī)抽取16只,測得樣本平均壽命為1080小時。試在0.05的顯著性水平下判斷這批產(chǎn)品的使用壽命是否有顯著提高?(=0.05)單側(cè)檢驗(yàn)2
已知均值的檢驗(yàn)
(小樣本例題分析)H0:
1020H1:>1020
=
0.05n
=
16臨界值(s):檢驗(yàn)統(tǒng)計(jì)量:在
=0.05的水平上拒絕H0有證據(jù)表明這批燈泡的使用壽命有顯著提高決策:結(jié)論:Z0拒絕域0.051.6452
未知大樣本均值的檢驗(yàn)
(例題分析)【例8.6】某電子元件批量生產(chǎn)的質(zhì)量標(biāo)準(zhǔn)為平均使用壽命1200小時。某廠宣稱他們采用一種新工藝生產(chǎn)的元件質(zhì)量大大超過規(guī)定標(biāo)準(zhǔn)。為了進(jìn)行驗(yàn)證,隨機(jī)抽取了80件作為樣本,測得平均使用壽命1245小時,標(biāo)準(zhǔn)差150小時。假設(shè)電子元件的壽命滿足正態(tài)分布。能否說該廠生產(chǎn)的電子元件質(zhì)量顯著地高于規(guī)定標(biāo)準(zhǔn)?(=0.05)單側(cè)檢驗(yàn)2
未知大樣本均值的檢驗(yàn)
(例題分析)H0:1200H1:>1200
=
0.05n=
100臨界值(s):檢驗(yàn)統(tǒng)計(jì)量:在
=0.05的水平上拒絕H0有充分理由相信該廠生產(chǎn)的元件壽命顯著地高于1200小時決策:結(jié)論:Z0拒絕域0.051.645總體均值的檢驗(yàn)
(2未知小樣本)1.
假定條件總體為正態(tài)分布2未知,且小樣本2. 使用t
統(tǒng)計(jì)量2
未知小樣本均值的檢驗(yàn)
(例題分析)【例8.7】某機(jī)器制造出的肥皂厚度為5cm,今欲了解機(jī)器性能是否良好,隨機(jī)抽取10塊肥皂為樣本,測得平均厚度為5.3cm,標(biāo)準(zhǔn)差為0.3cm,若肥皂厚度服從正態(tài)分布,試以0.05的顯著性水平檢驗(yàn)機(jī)器性能良好的假設(shè)。雙側(cè)檢驗(yàn)2
未知小樣本均值的檢驗(yàn)
(例題分析)H0:=5H1:
5
=0.05df=10-1=9臨界值(s):檢驗(yàn)統(tǒng)計(jì)量:在
=0.05的水平上拒絕H0說明該機(jī)器的性能不好
決策:結(jié)論:t02.262-2.262.025拒絕H0拒絕H0.0252
未知小樣本均值的檢驗(yàn)
(P值的計(jì)算與應(yīng)用)第1步:進(jìn)入Excel表格界面,選擇“插入”下拉菜單第2步:選擇“函數(shù)”點(diǎn)擊,并在函數(shù)分類中點(diǎn)擊“統(tǒng)計(jì)”,然后,在函數(shù)名的菜單中選擇字符“TDIST”,確定第3步:在彈出的X欄中錄入計(jì)算出的t值3.16
在自由度(Deg-freedom)欄中錄入9
在Tails欄中錄入2,表明是雙側(cè)檢驗(yàn)(單測檢驗(yàn)則在該欄內(nèi)錄入1)P值的結(jié)果為0.01155<0.025,拒絕H02
未知小樣本均值的檢驗(yàn)
(例題分析)
【例】一個汽車輪胎制造商聲稱,某一等級的輪胎的平均壽命在一定的汽車重量和正常行駛條件下不小于40000公里,對一個由20個輪胎組成的隨機(jī)樣本作了試驗(yàn),測得平均值為41000公里,標(biāo)準(zhǔn)差為5000公里。已知輪胎壽命的公里數(shù)服從正態(tài)分布,我們能否根據(jù)這些數(shù)據(jù)作出結(jié)論,該制造商的產(chǎn)品同他所說的標(biāo)準(zhǔn)相符?(
=0.05)單側(cè)檢驗(yàn)!均值的單尾t檢驗(yàn)
(計(jì)算結(jié)果)H0:
40000H1:
<40000
=0.05df=20-1=19臨界值(s):檢驗(yàn)統(tǒng)計(jì)量:
在
=0.05的水平上不拒絕H0不能認(rèn)為制造商的產(chǎn)品同他所說的標(biāo)準(zhǔn)不相符決策:
結(jié)論:
-1.7291t0拒絕域.05練習(xí)(4)P242:8.1、8.2、8.6總體比例的檢驗(yàn)
(Z
檢驗(yàn))概述
在實(shí)際問題中,常常需要檢驗(yàn)總體比例是否等于某個假設(shè)值0。例如:全部產(chǎn)品中的合格比例,競選的支持率等。一個總體比例檢驗(yàn)假定條件總體服從二項(xiàng)分布大樣本(np>5,nq>5)(比例問題往往使用大樣本,因?yàn)樾颖镜慕Y(jié)果不穩(wěn)定,受一個樣本結(jié)果影響大)在滿足上述條件下,樣本比例p滿足如下分布:0為假設(shè)的總體比例一個總體比例的檢驗(yàn)
(例題分析)【例8.8】一項(xiàng)統(tǒng)計(jì)結(jié)果聲稱,某市老年人口(年齡在65歲以上)的比重為14.7%,該市老年人口研究會為了檢驗(yàn)該項(xiàng)統(tǒng)計(jì)是否可靠,隨機(jī)抽選了400名居民,發(fā)現(xiàn)其中有57人年齡在65歲以上。調(diào)查結(jié)果是否支持該市老年人口比重為14.7%的看法?(=0.05)雙側(cè)檢驗(yàn)一個總體比例的檢驗(yàn)
(例題分析)H0:
=14.7%H1:
14.7%
=0.05n
=400臨界值(s):檢驗(yàn)統(tǒng)計(jì)量:在
=0.05的水平上不拒絕H0該市老年人口比重為14.7%決策:結(jié)論:Z01.96-1.96.025拒絕H0拒絕H0.025練習(xí)(5)P242:8.5總體方差的檢驗(yàn)
(2檢驗(yàn))概述
方差反映數(shù)據(jù)的離散程度。在實(shí)際問題中常需要檢驗(yàn)總體的方差。例如:產(chǎn)品的穩(wěn)定性、居民收入的分配情況等等。方差的卡方(2)
檢驗(yàn)檢驗(yàn)一個總體的方差或標(biāo)準(zhǔn)差假設(shè)總體近似服從正態(tài)分布則可構(gòu)造如下檢驗(yàn)統(tǒng)計(jì)量樣本方差假設(shè)的總體方差方差的卡方(2)
檢驗(yàn)
(例題分析)【例8.9】某廠商生產(chǎn)出一種新型的飲料裝瓶機(jī)器,按設(shè)計(jì)要求,該機(jī)器裝一瓶一升(1000cm3)的飲料誤差上下不超過1cm3。如果達(dá)到設(shè)計(jì)要求,表明機(jī)器的穩(wěn)定性非常好?,F(xiàn)從該機(jī)器裝完的產(chǎn)品中隨機(jī)抽取25瓶,分別進(jìn)行測定(用樣本減1000cm3),得到如下結(jié)果。若飲料重量服從正態(tài)分布檢驗(yàn)該機(jī)器的性能是否達(dá)到設(shè)計(jì)要求
(=0.05)0.3-0.4-0.71.4-0.6-0.3-1.50.6-0.91.3-1.30.71-0.50-0.60.7-1.5-0.2-1.9-0.51-0.2-0.61.1綠色健康飲品綠色健康飲品雙側(cè)檢驗(yàn)方差的卡方(2)
檢驗(yàn)
(例題分析)H0:
2=1H1:
2
1
=0.05df=
25-1=24臨界值(s):統(tǒng)計(jì)量:
在
=0.05的水平上不拒絕H0可以認(rèn)為該機(jī)器的性能達(dá)到設(shè)計(jì)要求
2039.3612.40/2=.05決策:結(jié)論:8.3兩個總體參數(shù)的檢驗(yàn)8.3.1檢驗(yàn)統(tǒng)計(jì)量的確定8.3.2兩個總體均值之差的檢驗(yàn)8.3.3兩個總體比例之差的檢驗(yàn)8.3.4兩個總體方差比的檢驗(yàn)8.3.5檢驗(yàn)中的匹配樣本概述
在許多問題中,人們需要比較兩個總體的參數(shù),看它們是否有顯著的區(qū)別。例如:在相同年齡組中,高學(xué)歷和低學(xué)歷的職工收入是否有明顯的差異;統(tǒng)一教學(xué)方法,在不同年級或不同內(nèi)容的課程中是否會有不同的效果,等等??梢岳脙蓚€總體參數(shù)的檢驗(yàn)來得到結(jié)果。獨(dú)立樣本總體均值之差的檢驗(yàn)兩個總體均值之差的檢驗(yàn)
(12、22
已知)1. 假定條件兩個樣本是獨(dú)立的隨機(jī)樣本兩個總體都是正態(tài)分布或不是正態(tài)分布,但抽自兩個總體的樣本很大(n130和n230)構(gòu)造檢驗(yàn)統(tǒng)計(jì)量為兩個總體均值之差的檢驗(yàn)
(假設(shè)的形式)假設(shè)研究的問題沒有差異有差異均值1均值2均值1<均值2均值1均值2均值1>均值2H0
1–2=0
1–20
1–20H1
1–20
1–2<0
1–2>0兩個總體均值之差的檢驗(yàn)
(例題分析)
雙側(cè)檢驗(yàn)!【例8.10】有兩種方法可用于制造某種以抗拉強(qiáng)度為重要特征的產(chǎn)品。根據(jù)以往的資料得知,第一種方法生產(chǎn)出的產(chǎn)品其抗拉強(qiáng)度的標(biāo)準(zhǔn)差為8公斤,第二種方法的標(biāo)準(zhǔn)差為10公斤。從兩種方法生產(chǎn)的產(chǎn)品中各抽取一個隨機(jī)樣本,樣本量分別為n1=32,n2=40,測得x1=50公斤,x2=44公斤。問這兩種方法生產(chǎn)的產(chǎn)品平均抗拉強(qiáng)度是否有顯著差別?(=0.05)兩個總體均值之差的檢驗(yàn)
(例題分析)H0:
1-2=0H1:1-2
0
=
0.05n1
=32,n2
=40臨界值(s):檢驗(yàn)統(tǒng)計(jì)量:決策:結(jié)論:
在
=0.05的水平上拒絕H0有證據(jù)表明兩種方法生產(chǎn)的產(chǎn)品其抗拉強(qiáng)度有顯著差異Z01.96-1.96.025拒絕H0拒絕H0.025兩個總體均值之差的檢驗(yàn)
(12、22
未知且相等,小樣本)檢驗(yàn)具有相等方差的兩個總體的均值假定條件兩個樣本是獨(dú)立的隨機(jī)樣本兩個總體都是正態(tài)分布兩個總體方差未知且相等12=22構(gòu)造的檢驗(yàn)統(tǒng)計(jì)量t(n1+n2-2)其中:兩個總體均值之差的檢驗(yàn)
(12、22
未知且不等,小樣本)檢驗(yàn)具有不等方差的兩個總體的均值假定條件兩個樣本是獨(dú)立的隨機(jī)樣本兩個總體都是正態(tài)分布兩個總體方差未知且不等1222構(gòu)造的檢驗(yàn)統(tǒng)計(jì)量:自由度為t(f)兩個總體均值之差的檢驗(yàn)
(例題分析)單側(cè)檢驗(yàn)
【例8.11】
“多吃谷物,將有助于減肥?!睘榱蓑?yàn)證這個假設(shè),隨機(jī)抽取了35人,詢問他們早餐和午餐的通常食譜,根據(jù)他們的食譜,將其分為二類,一類為經(jīng)常的谷類食用者(總體1),一類為非經(jīng)常谷類食用者(總體2)。然后測度每人午餐的大卡攝取量。經(jīng)過一段時間的實(shí)驗(yàn),得到如表8-3結(jié)果:若兩類早餐的熱量均服從正態(tài)分布,檢驗(yàn)該假設(shè)(=0.05)。兩個總體均值之差的檢驗(yàn)
(例題分析—用統(tǒng)計(jì)量進(jìn)行檢驗(yàn))設(shè)總體1和總體2熱量攝取的均值分別為1和2H0:1-2
0H1:
1-2<0
=0.05n1
=15,n2
=
20臨界值(s):檢驗(yàn)統(tǒng)計(jì)量:決策:結(jié)論:
在
=0.05的水平上拒絕H0沒有充分的證據(jù)表明多吃谷物將有助于減肥-1.694t0拒絕域.05兩個總體均值之差的檢驗(yàn)
(例題分析—用Excel進(jìn)行檢驗(yàn))第1步:選擇“工具”下拉菜單,并選擇“數(shù)據(jù)分析”選項(xiàng)第2步:選擇“t檢驗(yàn),雙樣本異方差假設(shè)”第3步:當(dāng)出現(xiàn)對話框后
在“變量1的區(qū)域”方框內(nèi)鍵入數(shù)據(jù)區(qū)域
在“變量2的區(qū)域”方框內(nèi)鍵入數(shù)據(jù)區(qū)域
在“假設(shè)平均差”的方框內(nèi)鍵入0
在“α(A)”框內(nèi)鍵入0.05
在“輸出選項(xiàng)”中選擇輸出區(qū)域
選擇“確定”兩個匹配(或配對)樣本的均值檢驗(yàn)兩個總體均值之差的檢驗(yàn)
(匹配樣本的t
檢驗(yàn))1. 檢驗(yàn)兩個總體的均值兩個總體的樣本是配對的或匹配的3. 假定條件兩個總體都服從正態(tài)分布如果不服從正態(tài)分布,是大樣本數(shù)據(jù)(n1
30,n230)匹配樣本的t
檢驗(yàn)
(假設(shè)的形式)假設(shè)研究的問題沒有差異有差異總體1總體2總體1<總體2總體1總體2總體1>總體2H0md
=0md
0md
0H1md
0md<0md
>0注:di=x1i-x2i
,對第i對觀察值匹配樣本的t
檢驗(yàn)
(數(shù)據(jù)形式)
觀察序號樣本1樣本2差值1x11x21d1=x11-x212x12x22d2=x12-x22MMMMix1ix2idi=x1i-x2iMMMMnx1nx2ndn=x1n-x2n匹配樣本的t
檢驗(yàn)
(大樣本,檢驗(yàn)統(tǒng)計(jì)量)樣本差值均值樣本差值標(biāo)準(zhǔn)差在大樣本條件下,構(gòu)造檢驗(yàn)統(tǒng)計(jì)量d0:總體均值差d已知:d未知:匹配樣本的t
檢驗(yàn)
(檢驗(yàn)統(tǒng)計(jì)量)在小樣本前提下,構(gòu)造檢驗(yàn)統(tǒng)計(jì)量【例8.15】一個以減肥為主要目標(biāo)的健美俱樂部聲稱,參加其訓(xùn)練班至少可以使減肥者平均體重減重8.5kg以上。為了驗(yàn)證該宣稱是否可信,調(diào)查人員隨機(jī)抽取了10名參加者,得到他們的體重記錄如下表:匹配樣本的t
檢驗(yàn)
(例題分析1-1)假設(shè)參加者減肥前后體重之差滿足正態(tài)分布(教材本例題應(yīng)增加此前提),在
=0.05的顯著性水平下,調(diào)查結(jié)果是否支持該俱樂部的聲稱?訓(xùn)練前94.5101110103.59788.596.5101104116.5訓(xùn)練后8589.5101.5968680.58793.593102樣本差值計(jì)算表訓(xùn)練前訓(xùn)練后差值di94.5101110103.59788.596.5101104116.58589.5101.5968680.58793.5931029.511.58.57.51189.57.51114.5合計(jì)—98.5匹配樣本的t
檢驗(yàn)
(例題分析1-2)匹配樣本的t
檢驗(yàn)
(例題分析1-3)差值均值差值標(biāo)準(zhǔn)差H0:
m1–m2
8.5H1:m1–m2
>8.5a
=0.05df=
10-1=9臨界值(s):檢驗(yàn)統(tǒng)計(jì)量:決策:結(jié)論:
在
=0.05的水平上拒絕H0有充分的理由認(rèn)為定俱樂部的宣稱可信匹配樣本的t
檢驗(yàn)
(例題分析1-4)Z01.833.05拒絕H0若在例8.5中,調(diào)查人員隨機(jī)抽取了10名參加者訓(xùn)練前的體重,又隨機(jī)抽取另外10名參加者訓(xùn)練后的體重記錄,同樣得到以下數(shù)據(jù)匹配樣本的t
檢驗(yàn)
(例題分析2-1)假設(shè)訓(xùn)練前后體重分別滿足正態(tài)分布且分布的方差相同,在
=0.05的顯著性水平下,調(diào)查結(jié)果是否與8.5的檢驗(yàn)相同?訓(xùn)練前94.5101110103.59788.596.5101104116.5訓(xùn)練后8589.5101.5968680.58793.593102由于減肥前后兩個樣本是獨(dú)立的隨機(jī)樣本減肥前體重總體和減肥后體重的總體都是正態(tài)分布兩個總體方差相等12=22使用檢驗(yàn)均值差的統(tǒng)計(jì)量t(n1+n2-2)如下:其中:匹配樣本的t檢驗(yàn)
(例題分析2-2)樣本樣本容量均值方差訓(xùn)練前訓(xùn)練后n1=10n2=10x1=101.25x2=91.4s12=63.4s22=50.49匹配樣本的t
檢驗(yàn)
(例題分析2-3)__進(jìn)而,根據(jù)可求得:H0:
m1–m2
8.5H1:m1–m2
>8.5a
=0.05df=
20-2=18臨界值(s):檢驗(yàn)統(tǒng)計(jì)量:決策:結(jié)論:
在
=0.05的水平上不拒絕H0沒有充分的理由認(rèn)為該俱樂部的宣可信匹配樣本的t
檢驗(yàn)
(例題分析2-4)Z01.734.05拒絕H0匹配樣本的t
檢驗(yàn)
(例題分析2-5)
由上兩例可以看出,對均值差相同的假設(shè),采用匹配樣本和獨(dú)立樣本得到的檢驗(yàn)結(jié)果不同。在本例中,采用匹配樣本的檢驗(yàn)更可信。因?yàn)榈诙N檢驗(yàn)中使用的獨(dú)立樣本可能會由于減肥前抽取的人和減肥后所抽取的人不同而增加了非減肥方法所產(chǎn)生的減肥效果,進(jìn)而,由也可以看出:匹配樣本本身就起著控制觀測變量影響因素的作用。
練習(xí)(6)P243:8.9、8.10兩個總體比例之差的檢驗(yàn)兩個總體比例之差的Z檢驗(yàn)1. 假定條件兩個總體是獨(dú)立的兩個總體都服從二項(xiàng)分布樣本量足夠大時(npi>5且nqi>5,即pi可以用正態(tài)分布來近似)在以上假定條件下,p1-p2近似服從以1-2為期望,為方差的正態(tài)分布,故可構(gòu)造
檢驗(yàn)統(tǒng)計(jì)量:兩個總體比例之差的檢驗(yàn)
(假設(shè)的形式)假設(shè)研究的問題沒有差異有差異比例1≥比例2比例1<比例2總體1≤比例2總體1>比例2H01–2=d01–2d01–2d0H11–2d01–2<d01–2>d0(-1<d0<1)兩個總體比例之差的Z檢驗(yàn)
(例題分析)單側(cè)檢驗(yàn)
【例8.13】有一項(xiàng)報告說青少年經(jīng)常網(wǎng)上聊天,男生的比例至少超過女生10個百分點(diǎn),即1-210%?,F(xiàn)對150個男生和150個女生進(jìn)行上網(wǎng)聊天的頻度調(diào)查,其中經(jīng)常聊天的男生有68人,經(jīng)常聊天的女生有54人,問調(diào)查結(jié)果是否支持研究報告的結(jié)論(=0.05)?兩個總體比例之差的Z檢驗(yàn)
(例題分析)H0:
1-
2
10%H1:
1-
2<10%
=
0.05n1
=150,n2
=150臨界值(s):檢驗(yàn)統(tǒng)計(jì)量:決策:結(jié)論:
在
=0.05的水平上不拒絕H0調(diào)查結(jié)果支持研究報告的結(jié)論-1.645Z0拒絕域兩個總體比例之差的Z檢驗(yàn)
(例題分析)單側(cè)檢驗(yàn)
【例】對兩個大型企業(yè)青年工人參加技術(shù)培訓(xùn)的情況進(jìn)
溫馨提示
- 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
- 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
- 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
- 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負(fù)責(zé)。
- 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請與我們聯(lián)系,我們立即糾正。
- 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時也不承擔(dān)用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。
最新文檔
- 山東城市建設(shè)職業(yè)學(xué)院《心理咨詢與輔導(dǎo)》2023-2024學(xué)年第二學(xué)期期末試卷
- 佳木斯職業(yè)學(xué)院《熱工與熱機(jī)》2023-2024學(xué)年第二學(xué)期期末試卷
- 東北師范大學(xué)《液壓與氣動》2023-2024學(xué)年第二學(xué)期期末試卷
- 北京語言大學(xué)《水資源利用》2023-2024學(xué)年第二學(xué)期期末試卷
- 浙江工業(yè)大學(xué)之江學(xué)院《生態(tài)環(huán)境保護(hù)基礎(chǔ)(三)》2023-2024學(xué)年第二學(xué)期期末試卷
- 浙江越秀外國語學(xué)院《市場營銷學(xué)概論》2023-2024學(xué)年第二學(xué)期期末試卷
- 中央美術(shù)學(xué)院《課堂教學(xué)技能訓(xùn)練》2023-2024學(xué)年第二學(xué)期期末試卷
- 石家莊理工職業(yè)學(xué)院《災(zāi)害衛(wèi)生學(xué)》2023-2024學(xué)年第二學(xué)期期末試卷
- 長垣烹飪職業(yè)技術(shù)學(xué)院《電工及電子學(xué)(二)》2023-2024學(xué)年第二學(xué)期期末試卷
- 益陽醫(yī)學(xué)高等??茖W(xué)?!堕_發(fā)技術(shù)》2023-2024學(xué)年第二學(xué)期期末試卷
- 出師表(選擇題)答案版
- (正式版)JBT 9229-2024 剪叉式升降工作平臺
- (高清版)DZT 0208-2020 礦產(chǎn)地質(zhì)勘查規(guī)范 金屬砂礦類
- (高清版)DZT 0368-2021 巖礦石標(biāo)本物性測量技術(shù)規(guī)程
- 礦山開采與環(huán)境保護(hù)
- 企業(yè)事業(yè)部制的管理與監(jiān)督機(jī)制
- 兒童體液平衡及液體療法課件
- 勞動防護(hù)用品培訓(xùn)試卷帶答案
- ORACLE執(zhí)行計(jì)劃和SQL調(diào)優(yōu)
- 2024年鐘山職業(yè)技術(shù)學(xué)院高職單招(英語/數(shù)學(xué)/語文)筆試歷年參考題庫含答案解析
- 2024年湖南交通職業(yè)技術(shù)學(xué)院高職單招(英語/數(shù)學(xué)/語文)筆試歷年參考題庫含答案解析
評論
0/150
提交評論