版權(quán)說(shuō)明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請(qǐng)進(jìn)行舉報(bào)或認(rèn)領(lǐng)
文檔簡(jiǎn)介
第8章假設(shè)檢驗(yàn)
(HypothesisTesting)
假設(shè)檢驗(yàn)是抽樣統(tǒng)計(jì)推斷的另一項(xiàng)
重要內(nèi)容。它是利用樣本的實(shí)際觀測(cè)資
料來(lái)檢驗(yàn)事先對(duì)總體某些數(shù)量特征所
作的假設(shè)是否可信的統(tǒng)計(jì)分析方法。根
據(jù)已有的知識(shí)(情報(bào))對(duì)總體的數(shù)量特
征和變動(dòng)規(guī)律做出一定的假設(shè),然后運(yùn)
用觀測(cè)到的樣本的資料和一定程序,來(lái)
判斷事先所作的假設(shè)是不是合理可信,
從而決定接受或拒絕這個(gè)假設(shè)。
8.1假設(shè)檢驗(yàn)的概念
小概率的原理
假設(shè)檢驗(yàn)的基本思想是應(yīng)用小概
率的原理。所謂小概率原理是指發(fā)生概
率很小的隨機(jī)事件在一次試驗(yàn)中幾乎
是不可能發(fā)生的。根據(jù)這一原理我們可
以做出是否接受原假設(shè)的決定,即進(jìn)行
假設(shè)檢驗(yàn)時(shí)必須事先確定一個(gè)作為接
受或拒絕的判斷界限的小概率標(biāo)準(zhǔn)。該
小概率標(biāo)準(zhǔn)就是統(tǒng)計(jì)假設(shè)檢驗(yàn)中的顯
著性水平。在假設(shè)檢驗(yàn)過(guò)程中,我們可
以依據(jù)顯著性水平的大小把概率分布
劃分為接受區(qū)間和拒絕區(qū)間。大于給定
標(biāo)準(zhǔn)的概率區(qū)間稱為接受區(qū)間,小于給
定的概率區(qū)間稱為拒絕區(qū)間。
假如給定的小概率標(biāo)準(zhǔn)為。=0.1,
凡概率小于10%的事件都稱為小概率事
件,均屬于拒絕區(qū)間。而概率大于等于
二90%的事件都稱為對(duì)立事件概率,
均屬
于接
受區(qū)
間。事
件屬
于接受區(qū)間,意味著原假設(shè)成立而無(wú)顯
著性差異;事件屬于拒絕區(qū)間,意味著
原假設(shè)不成立,而認(rèn)為有顯著性差異。
顯著性水平a所對(duì)應(yīng)的概率度t稱為a
的臨界值,記為L(zhǎng)例如。=0.1時(shí),
廿1.64。我們稱概率小于0.1的事件
為小概率事件。但實(shí)際假設(shè)檢驗(yàn)分析中
作為接受或拒絕的判斷尺度臨界值,比
顯著性水平戊更為常用。
根據(jù)我們所研究的對(duì)象的性質(zhì)和
特征的不同,統(tǒng)計(jì)假設(shè)檢驗(yàn)又可分為雙
側(cè)檢驗(yàn)和單側(cè)檢驗(yàn)兩種類型。當(dāng)我們的
研究只對(duì)檢驗(yàn)樣本和總體的平均數(shù),或
樣本和總體的平均數(shù)有沒(méi)有顯著性差
異關(guān)心,而不問(wèn)差異的方向(正差或負(fù)
差)時(shí)采用雙側(cè)檢驗(yàn)方法。但我們所要
檢驗(yàn)的是抽取樣本的總體的參數(shù)值偏
大于還是偏小于某個(gè)特定值時(shí)采用單
側(cè)檢驗(yàn)方法。因此,單側(cè)檢驗(yàn)方法有右
單側(cè)檢驗(yàn)和左單側(cè)檢驗(yàn)兩種。當(dāng)我們所
要檢驗(yàn)的是總體的參數(shù)值是否大于某
個(gè)特定值,應(yīng)采用右單側(cè)檢驗(yàn);反之,
應(yīng)采用左單側(cè)檢驗(yàn)。在雙側(cè)檢驗(yàn)中原假
設(shè)與替換假設(shè)通常采用等式,在單側(cè)檢
驗(yàn)中原假設(shè)與替換假設(shè)取不等式。
雙側(cè)檢驗(yàn):乩:4="。HH、
右單側(cè)檢驗(yàn):乩?A—Z^oH、:網(wǎng)
左單側(cè)檢驗(yàn):乩:心"。/:〃<〃。
〃為計(jì)算值為為假設(shè)值
總而言之,假設(shè)檢驗(yàn)是對(duì)我們所關(guān)
心的,卻又是未知的總體參數(shù)先做出假
設(shè),然后抽取樣本,利用樣本提供的信
息對(duì)假設(shè)的正確性進(jìn)行判斷的過(guò)程。它
是進(jìn)行各種經(jīng)濟(jì)行為、管理及決策的有
力工具。
8.2一個(gè)正態(tài)總體參數(shù)的假設(shè)檢驗(yàn)
根據(jù)已知條件,一個(gè)正態(tài)總體參數(shù)
的檢驗(yàn)方法通??梢苑譃閮煞N。一種方
法是當(dāng)總體的方差/為已知數(shù)時(shí),以Z
為檢驗(yàn)統(tǒng)計(jì)量進(jìn)行檢驗(yàn);另一種方法是
當(dāng)總體的方差〃為未知數(shù)時(shí),以廣作為
檢驗(yàn)統(tǒng)計(jì)量進(jìn)行檢驗(yàn)。
8.2.1總體平均數(shù)〃的假設(shè)檢驗(yàn)
8.2.L1總體的方差〃為已知數(shù)時(shí)
設(shè)隨機(jī)變量匕”,…,是從符合正態(tài)
分布的總體中抽取的樣本,且總體和樣
本的平均數(shù)及方差分別為“、元、。2、一
①原假設(shè)與替換假設(shè);H°:…
H]:〃W〃o
②檢驗(yàn)統(tǒng)計(jì)量(概率度)z;
(8-1)
③設(shè)定顯著性水平。
④計(jì)算檢驗(yàn)統(tǒng)計(jì)量(概率度)z值:
⑤做出統(tǒng)計(jì)決策:
若|Z|〈|4,2|,則接受原假設(shè)義,拒
絕替換假設(shè)”I
若團(tuán)>凡小則拒絕原假設(shè)“。,接
受替換假設(shè)/_
例8-1:設(shè)"=600,工=630,0=30,n=100,。=0.05。
試求雙側(cè)檢驗(yàn)(替換假設(shè)乩:〃#600)和右側(cè)檢驗(yàn)(替
換假設(shè)兄:4>600)時(shí)的臨界值。
解:LISASPROGRAM
DATAexamplel;
ALPHA=O.05;n=100;sigma=30;mu0=600;barX=630;
Zcal=(barX-muO)/(sigma/SQRT(n));zl=PR0BIT(ALPHA/2);
一雙側(cè)檢驗(yàn)(計(jì)算臨界值)
IFABS(Zcal)>=ABS(zl)THENRESULT1=,REJECT5;ELSE
RESULTS'ACCEPT;
z2=PR0BIT(l-ALPHA);一右側(cè)檢
驗(yàn)(計(jì)算臨界值)
IFZeal>=z2THENRESULT2='REJECT,;ELSE
RESULT2='ACCEPT;RUN;
PROCPRINT;VARALPHAZCALzlRESULT1z2RESULT2;RUN;
口運(yùn)行結(jié)果
OBSALPHAZCALZlRESULT1
Z2RESULT2
10.0510-1.95996REJECT
1.64485REJECT
利用SASPROGRAM計(jì)算的結(jié)果得,雙側(cè)檢驗(yàn)臨界值
Z°/2=±L96右側(cè)檢驗(yàn)臨界值=1.645;因?yàn)?/p>
z>|za/2|,z>|zJ,所以雙側(cè)檢驗(yàn)原假設(shè)%:〃=4
和右單側(cè)檢驗(yàn)的原假設(shè):4。均被否定.
(圖8-2)“°的接受區(qū)和拒絕區(qū)
(a)雙側(cè)檢驗(yàn)(b)右側(cè)檢驗(yàn)
-1.961.961.64
又與〃的關(guān)系替換假設(shè)的形態(tài)檢驗(yàn)方法
x>〃0"1:4〉右單側(cè)檢驗(yàn)
x<Ao“1:〃<〃0左單側(cè)檢驗(yàn)
8.2.1.2總體的方差一為未知數(shù)時(shí)
因?yàn)榭傮w的方差/為未知數(shù),不能
直接利用Z-統(tǒng)計(jì)量。所以利用廠-檢驗(yàn)
統(tǒng)計(jì)量(詳見(jiàn)8.6)o
(8-2)
當(dāng)〃230時(shí),玄令一?Z,即L分布
和Z-分布相接近,可設(shè)z=F,并把它
作為檢驗(yàn)統(tǒng)計(jì)量計(jì)算臨界值,這樣可以
不用考慮自由度的問(wèn)題。
例8-2:設(shè)某百貨商店的電冰箱銷售量服從正態(tài)分布。
已知gx,=10()(Xi代表第,天電冰箱銷售量);
r=1
10°
ZXj=23500o并設(shè)定"o:4212。試在。=0.05
t=\
的條件下檢驗(yàn)。
□SASPROGRAM
DATAexample2;
ALPHA=O.05;MU0=12;N=10;SUMX=100;SUMX2=23500;
BarX=sumX/n;s2=(sumX2-n*barX**2)/(n-l);
Tcal=(barX-muO)/SQRT(s2/n);
>TINV(ALPHA,n-1);
IFTcal=TTHENRESULT='REJECT';ELSE
RESULT='ACCEPT';RUN;
PROCPRINT;VARALPHATealtRESULT;RUN;
□運(yùn)行結(jié)果
OBSALPHATCALT
RESULT
10.05-0.12649
-1.83311ACCEPT
解:因?yàn)榭傮w的方差〃為未知數(shù),以「統(tǒng)計(jì)量作為檢
驗(yàn)統(tǒng)計(jì)量。又因?yàn)椤?。?>=12,所以替換假設(shè)為
根據(jù)題意作左側(cè)檢驗(yàn)。若廣〉一^則原假
設(shè)成立。利用SASPROGRAM計(jì)算的結(jié)果
T=-0.1265>-^=-1.833,所以,一天的電冰箱平均
銷售量超過(guò)12臺(tái)的原假設(shè)成立。
例8-3:若把例8-2的樣本容量由原來(lái)的10天增加到
100天(N=100),并設(shè)其他的條件不變。這時(shí)我們可以
利用Z-統(tǒng)計(jì)量。即
「一4)
7…(8-3)
計(jì)算結(jié)果Z=-0.4>Za=-1.64485,所以原假設(shè)成立。
例8-4:某生產(chǎn)燈泡企業(yè)的新職工,上班的第一個(gè)月生
產(chǎn)了100只燈泡,其中隨機(jī)抽出5只燈泡作了壽命試
驗(yàn),其壽命分別為70,75,80,85,90(天)。試檢驗(yàn)
燈泡的平均壽命為75天的可能性(設(shè)。=0.1)。
解:設(shè)“0:設(shè)<75,"]:〃>75。即作右側(cè)檢驗(yàn),
若T*<%則原假設(shè)成立。因?yàn)镹=100,所以利用有限總
體調(diào)整系數(shù)來(lái)計(jì)算。利用SASProgram計(jì)算的結(jié)果,
*
T=1.443680,=1.53321o所以燈泡的平均壽命不
能超過(guò)75天的原假設(shè)成立。
□SASPROGRAM
DATAEXAMPEL4;
INPUTX@@;
CARDS;
7075808590
RUN;
PROCMEANSNOPRINT;VARX;OUTPUTOUT=OUTPUTN=n
MEAN=BARXVAR=S2;RUN;
DATARESULT;SETOUTPUT;
ALPHA=O.1;MU0=75;CC=(100-n)/(100-1);
TCAL=(BARX-MUO)/SQRT((S2/N)*CC);T=TINV(1-ALPHA,N-1
);
IFTCAL=TTHENRESULT='REJECTJ;ELSE
RESULT='ACCEPTJ;RUN;
PROCPRINT;VARALPHATCALTRESULT;RUN;
□運(yùn)行結(jié)果
OBSALPHATCALT
RESULT
10.11.443681.53321
ACCEPT
8.3兩個(gè)正態(tài)總體參數(shù)檢驗(yàn)
8.3.1兩個(gè)正態(tài)均值之間的假設(shè)檢驗(yàn)
8.3.1.1、犬為已知數(shù)時(shí),兩個(gè)總
體平均值的假設(shè)檢驗(yàn)
在經(jīng)濟(jì)分析中,常常需要比較兩個(gè)
總體的參數(shù)。比如,北方地區(qū)和南方地
區(qū)的經(jīng)濟(jì)發(fā)展水平是否有顯著性差異
等,對(duì)這種兩個(gè)總體(地區(qū))的參數(shù)是
否有顯著性差異的問(wèn)題,可用兩個(gè)正態(tài)
總體參數(shù)檢驗(yàn)的方法來(lái)解決,其檢驗(yàn)步
驟如下:
第一步:設(shè)兩個(gè)總體的平均值和方
差分別為〃1、“2和4、成,原假設(shè)可設(shè)
定為兩個(gè)總體的平均值相等。即
H0:"\=〃2"I:41W
第二步:分別從兩個(gè)總體中抽出一
個(gè)樣本,得到樣本容量和平均數(shù)分別為
%、兄和叼,心的樣本。如果兄和院服
從正態(tài)分布,則兄士心也服從正態(tài)分
布。下面計(jì)算一下新的概率變量元-及
的平均值和方差。
E區(qū)-X2]=E區(qū)]-仇》21=從—4
???(8-8)__
V[Xl-X2]=V[Xi]+V[X2]-2Cov(Xi,X2)
—月和先是相互獨(dú)立的,所以其協(xié)方差2Cov(月,
x2)-0
22
V區(qū)-晨]=J+J
n{n2
???(8-9)
(X1-X2),
N[(?),(五+生)]-(8-10)
%〃2
把(月一月)進(jìn)行標(biāo)準(zhǔn)化得到標(biāo)準(zhǔn)化的檢驗(yàn)統(tǒng)計(jì)量;
Z=(XI-X2)-(41--2)
-
\%n2
???(8-11)
第三步:計(jì)算檢驗(yàn)統(tǒng)計(jì)量。并根據(jù)原假設(shè)設(shè)定雙
側(cè)檢驗(yàn)還是單側(cè)檢驗(yàn)。若原假設(shè)為
則需要雙側(cè)檢驗(yàn)土Zq/2;若“。:>°,則左側(cè)檢
驗(yàn)-Z*;若H。:"「從<0,則右側(cè)檢驗(yàn)Za/2o
第四步:根據(jù)所給定的顯著性水平a值和z的臨
界值,進(jìn)行判斷。
例8-7:某汽車公司為了檢驗(yàn)4型汽車和B型汽
車的耗油量,分別從A型和B型汽車中隨機(jī)抽出9輛
汽車作了試驗(yàn)。試驗(yàn)結(jié)果表明,當(dāng)消耗1升汽油時(shí),
兩種型號(hào)汽車的平均行駛距離分別為12Km.HKmo如
果A,8這兩種型號(hào)汽車的標(biāo)準(zhǔn)差分別服從i.5Km/升
和IKm/升的正態(tài)分布,試分析在顯著性水平為a=1%
的條件下,4—4二°的原假設(shè)是否成立。
解:根據(jù)題意,利用檢驗(yàn)統(tǒng)計(jì)量(8-11)進(jìn)行雙側(cè)檢
驗(yàn)。
Z=(X1-X2)-(〃1-〃2)=12-11-0
Jcr:/"i+cr;//211.52
V-99~
與顯著性水平為。=1%相對(duì)應(yīng)的臨界值為
土Za〃=±2.575,因?yàn)?Z0/2=-2.575<Z<Za/2=2.575,
所以原假設(shè)成立,即48兩種型號(hào)汽車的汽油消耗量
沒(méi)有顯著性差異。
DATAexample7;
ALPHA=0.01;nl=9;n2=9;barXl=12;barX2=ll;sl=l.5;
s2=l;
Zcal=(barXl-barX2)/SQRT(sl**2/nl+s2**2/n2);
Z=PROBIT(ALPHA/2);
IFABS(Zcal)>=ABS(Z)THENRESUL='REJECT';ELSE
RESULT」ACCEPT;RUN;
PROCPRINT;VARALPHAZealzRESULT;RUN;
□運(yùn)行結(jié)果
OBSALPHAZCALZRESULT
10.011.66410-2.57583ACCEPT
8.3.1.2M、4為未知數(shù)時(shí),兩個(gè)總
體均值之差的假設(shè)檢驗(yàn)
L樣本容量較大的情況
如果措、成為未知數(shù),但樣本為大
樣本時(shí),我們可用樣本的方差$;、s;代
替總體的斕、武,利用下面的近似公式
計(jì)算檢驗(yàn)統(tǒng)計(jì)量。
Z_(X]-X2)-(〃l-從2)_(x1-X2)-(4一〃2)
]2/72?+(T2/n2!n\+S;I口2
…(8-12)
在前面的例8-6中,假設(shè)b:、8是
未知數(shù)。如果把樣本容量由原來(lái)的9
個(gè)擴(kuò)大到32個(gè)時(shí),測(cè)得A3兩種型號(hào)汽
車的平均行駛距離分別為12Km/升、
n.5Km/升。這時(shí)我們可利用(8-12)
式來(lái)進(jìn)行假設(shè)檢驗(yàn)。
Z=(12TL5)=2
/1/32)2+(1/32f
顯著性水平為a=1%的條件下
±Za/2=±2.575,所以原假設(shè)成立。但如果
給定的顯著性水平為?=0.05%
(±Za/2=±1.96),則原假設(shè)不成立。
2.樣本容量較小的情況
如果統(tǒng)為未知數(shù),且樣本容量較
小時(shí),可利用下面的檢驗(yàn)統(tǒng)計(jì)量進(jìn)行假
設(shè)檢驗(yàn)(詳見(jiàn)8.6.3)。
t_(X]二〃2).、
n}+n2-2=『i-一L―???(8-13)
/(■T)s:+(%T)s;
s人=XL-%)
?十幾?
N—2nx+
但利用上面的檢驗(yàn)統(tǒng)計(jì)量,必須滿
足這樣的兩個(gè)條件。首先兩個(gè)總體必須
滿足正態(tài)分布;其次是兩個(gè)總體的方差
必須相等4=Cr2o
例8-8:在同屆畢業(yè)的文科和工科畢業(yè)生中各隨機(jī)抽出
10、15名,其調(diào)查結(jié)果表明,文科和工科類畢業(yè)生的
工資收入分別為80、75萬(wàn)(韓幣),方差分別為300、
200o試問(wèn)在顯著性水平a=0.05的條件下,同屆畢業(yè)
的文科和工科類畢業(yè)生的工資水平是否有顯著性差
異。
解:設(shè)同屆畢業(yè)的文科和工科類畢業(yè)生的工資水平?jīng)]
有顯著性差異。口
9)DATAexamples;
ALPHA=0.05;nl=10;n2=15;barX1=80;barX2=75;Sl=SQRT(300);S2=SQRT(200);
即Ho:〃]■/=0
-2_(%-l)s;+(〃2T)s;_(10-1)300+(15-1)200_55(
“1+〃2—210+15—22:
V^1=80,^2=75
在。=0.05的條件下,自由度為
%+々-2=10+15-2=23時(shí),相應(yīng)的臨界值查表可得
—taR23=±2.069。因?yàn)椤?2,23<,<%/2,23,所以同屆
畢業(yè)的文科和工科類畢業(yè)生的工資水平?jīng)]有顯著性差
異的原假設(shè)成立。
DATAexamples;
ALPHA=0.05;nl=10;n2=15;barXl=80;barX2=75;
Sl=SQRT(300);S2=SQRT(200);
Spooled=((nl-1)*sl**2+(n2-l)*s2**2)/(nl+n2-2);Tcal=
(barXl-barX2)/SQRT(Spooled*(l/nl+l/n2));
T=TINV(ALPHA/2,nl+n2-2);
Spooled=((nl-l)*sl**2+(n2-l)*s2**2)/(n1+n2-2);Tcal=(barX1-barX2)/SQRT(Spool.ed*(l/nl+l/n2));
T=TINV(ALPHA/2,nl+n2-2);
IFABS(Tcal)>=ABS(t)THENRESULT:'REJECT';ELSERESULT:'ACCEPT';RUN;
PROCPRINT;VARALPHATealtRESULT;RUN;
□運(yùn)行結(jié)果
OBSALPHATCALTRESULT
10.050.79201-2.06866ACCEPT
IFABS(Tcal)>=ABS(t)THENRESULTiREJECT;ELSE
RESULTiACCEPT,;RUN;
PROCPRINT;VARALPHATealtRESULT;RUN;
口運(yùn)行結(jié)果
OBSALPHATCALT
RESULT
10.050.79201-2.06866
ACCEPT
8.6假設(shè)一檢驗(yàn)
8.6.1一個(gè)總體平均數(shù)的一檢驗(yàn)
設(shè)隨機(jī)變量匕*2,…,X”是從符合
正態(tài)分布的總體中抽取的樣本,且總體
和樣本的平均數(shù)及方差分別為4、又、
,、當(dāng)總體方差M為未知數(shù)時(shí),不
能選擇Z統(tǒng)計(jì)量,此時(shí)需要用樣本方差
$2代替總體方差檢驗(yàn)統(tǒng)計(jì)量服從自
由度為〃-1的乙分布。J檢驗(yàn)步驟如下;
1)原假設(shè)與替換假設(shè):…="。
H、:N豐Ao
2)檢驗(yàn)統(tǒng)計(jì)量(概率度)匕
T*_x-A。_J7(x_〃。)???1
T~s/^~s(8-1
7)
在大樣本(隨機(jī)變量的容量〃2
30)的情況下,,?分布和Z?分布相接近。
樣本統(tǒng)計(jì)量,服從或趨近于期望值為0、
方
(圖8-5)l檢驗(yàn)的接受區(qū)和拒絕區(qū)差
為
1
的
標(biāo)
準(zhǔn)
正
態(tài)分布N(0,1)。根據(jù)實(shí)際抽樣調(diào)查資
料,計(jì)算樣本的平均數(shù)又及標(biāo)準(zhǔn)差S,
就可以具體確定統(tǒng)計(jì)量T*值。
設(shè)定顯著性水平a-計(jì)算檢驗(yàn)統(tǒng)
計(jì)量l值(K)一作出統(tǒng)計(jì)決策。若原
假設(shè)成立,則檢驗(yàn)統(tǒng)計(jì)量(概率度)服
從自由度為九-1的一分布。在顯著性水
準(zhǔn)a條件下,對(duì)不同的替換假設(shè),有不
同的統(tǒng)計(jì)決策。
%:〃>〃。,如果T*>%皿,則原假設(shè)
”。被否定(右單側(cè)檢驗(yàn))2)o
Hl:…。,如果:a,n-l,則原假
設(shè)/被否定(左單側(cè)檢驗(yàn))。
況:"玲,如果7|>乙/”「)則原
假設(shè)"。被否定(雙側(cè)檢驗(yàn))。
3)P-值及統(tǒng)計(jì)決策
值是檢驗(yàn)樣本和原假設(shè)之間一
致性程度的尺度。P-值可根據(jù)邏輯對(duì)立
假設(shè)計(jì)算。
15)t“.n“值等于自由度為n-1的t-分布的aX100%。
P=P(K.i>T*):右單側(cè)檢驗(yàn)時(shí),檢
驗(yàn)統(tǒng)計(jì)量T*的尸-值是自由度為〃-1的
L分布中,比檢驗(yàn)統(tǒng)計(jì)量/大的概率。
如果尸-值越小,則檢驗(yàn)統(tǒng)計(jì)量越接近一
分布的右尾部,原假設(shè)/被否定的可能
性越大;反之P-值越大,則原假設(shè)“。被
接受的可能性越大。
尸二尸(,一KT*):左單側(cè)檢驗(yàn)時(shí),檢驗(yàn)
統(tǒng)計(jì)量廠的夕-值是自由度為〃-1的,
分布中,比檢驗(yàn)統(tǒng)計(jì)量廠小的概率。如
果「值越大,則檢驗(yàn)統(tǒng)計(jì)量越接近分
布的左尾部,原假設(shè)“。被否定的可能性
越大,反之?-值越大,則原假設(shè)“。被
接受的可能性越大。
P=2P|):雙側(cè)檢驗(yàn)時(shí),檢
驗(yàn)統(tǒng)計(jì)量I廣I的P-值是自由度為n-l
的L分布中,比檢驗(yàn)統(tǒng)計(jì)量7*的絕對(duì)值
大的概率。如果P-值越大,則檢驗(yàn)統(tǒng)
計(jì)量越接近,-分布的左尾部,原假設(shè)“。
被否定的可能性越大,反之P-值越大,
則原假設(shè)“。被接受的可能性越大。
(圖8-6)P-雙側(cè)檢驗(yàn)接受區(qū)和拒絕區(qū)可
以
利
用
檢
驗(yàn)
統(tǒng)
計(jì)量T*的夕-值和顯著性水平。的相互
比較的方法,作出統(tǒng)計(jì)決策。在SAS統(tǒng)
計(jì)分析程序中,SAS軟件自動(dòng)把統(tǒng)計(jì)量
T值換算成相應(yīng)的尸-值工如果尸-值大
于顯著性水平%則原假設(shè)成立。如果
尸-值小于顯著性水平則原假設(shè)被否
定。即,若尸-值>1,則原假設(shè)"。成立;
若P-值則原假設(shè)“。被否定。P~
值可以提供更多的信息,不僅可以用尸-
值與規(guī)定的顯著性水平]比較,進(jìn)行檢
驗(yàn)統(tǒng)計(jì)決策,而且P-值顯示了樣本值在
一定范圍內(nèi)出現(xiàn)的概率。這有助于我們
對(duì)檢驗(yàn)對(duì)象有更進(jìn)一步的了解,同時(shí)也
為進(jìn)行更多靈活的檢驗(yàn)統(tǒng)計(jì)決策提供
可能。在SAS軟件中,就利用這一重要
的參數(shù)進(jìn)行假設(shè)檢驗(yàn)問(wèn)題分析,并把它
作為統(tǒng)計(jì)決策的依據(jù)。
例8-11:某生產(chǎn)電子原件的企業(yè),生產(chǎn)一種A元件。
過(guò)去A元件的平均壽命為25個(gè)月。但該企業(yè)的技術(shù)管
16)在SAS程序,SAS軟件對(duì)檢驗(yàn)統(tǒng)計(jì)量進(jìn)行雙側(cè)檢驗(yàn),算出IT的概率(即prob|T|)。
所以單側(cè)檢驗(yàn)時(shí),必須除以2。
理科認(rèn)為,通過(guò)引進(jìn)外國(guó)先進(jìn)設(shè)備及技術(shù)后,A元件的
平均壽命有明顯的提高。于是他們隨機(jī)抽出15個(gè)樣品
作了壽命試驗(yàn)。其試驗(yàn)結(jié)果如表8-2。(表8-2)A元件
壽命試驗(yàn)資料
282527311026302555122432284238
設(shè)A元件壽命服從正態(tài)分布,其顯著性水平a=0.05。
試求:1)15個(gè)樣品的平均數(shù)和標(biāo)準(zhǔn)差2)假定原假設(shè)
和替換假設(shè)3)計(jì)算檢驗(yàn)統(tǒng)計(jì)量的展值,并解釋其結(jié)
果
解:根據(jù)題意"。=25,假定原假設(shè)和替換假設(shè)。
H。:〃=〃。,即A元件的壽命沒(méi)有顯著提高;a:〃>"。
即A元件的壽命有顯著提高。
□SASPROGRAM
DATAexampl1;
INPUTX
DX=X-25;
*-(a)
CARDS;
282527311026301555122432284238
RUN;
PROCMEANSMEANSTDTPRTMAXDEC=2;TITLE,ONE-TAILED
TTEST,;VARDX;RUN;
一(b)
□PROGRAM解釋
(a)DX=X-25
用SAS程序分析樣品和總體平均數(shù)之間的顯著性差異時(shí),
SAS程序自動(dòng)的進(jìn)行雙側(cè)檢驗(yàn)分析,Ho:u=25,乩:口工25。
所以利用總體平均數(shù)和樣本的離差變量DX=X-25o
(b)PROCMEANSMEANSTDTPRTMAXDEC=2
PROCMEANSMEANSTDT是計(jì)算檢驗(yàn)統(tǒng)計(jì)量的命令。PRT
MAXDEC=2表示雙側(cè)檢驗(yàn),PRT命令將打印檢驗(yàn)統(tǒng)計(jì)量p-值。
□運(yùn)行結(jié)果及解釋
ONE-TAILEDTTEST
AnalysisVariable:DX
StdDev
Prob>|T|
11.44
0.2970
P/2=0.1485
拒絕Ho0.05
05=0.95
u=0
8,檢驗(yàn)統(tǒng)計(jì)量p-值=0.2970。因?yàn)樵赟AS程序自動(dòng)進(jìn)行雙側(cè)檢
驗(yàn),故p/2=0.1485X).05。所以原假設(shè)成立。
8.6.2一個(gè)總體兩個(gè)對(duì)應(yīng)比較上檢驗(yàn)
對(duì)應(yīng)比較一檢驗(yàn)是指對(duì)同一個(gè)總體
的同一個(gè)試驗(yàn)單位,作兩種不同的“處
理”之后出現(xiàn)的結(jié)果進(jìn)行對(duì)應(yīng)比較的方
法。比如,有一個(gè)電視機(jī)組裝車間,現(xiàn)
研究當(dāng)引進(jìn)新的組裝技術(shù)后,其組裝時(shí)
間是否比過(guò)去的組裝時(shí)間有所縮短的
問(wèn)題。在研究這類問(wèn)題時(shí)我們發(fā)現(xiàn)可以
采用對(duì)應(yīng)比較的的方法。因?yàn)榻M裝車間
(總體)沒(méi)變,試驗(yàn)單位(組裝工人)
也沒(méi)變,所以測(cè)定過(guò)去的組裝方法與新
的組裝方法的生產(chǎn)效率問(wèn)題時(shí),可以利
用對(duì)同一個(gè)試驗(yàn)單位的兩種不同的處
理結(jié)果,作簡(jiǎn)單的一分析。
①資料:設(shè)分。2,”是同一個(gè)總體中,〃
個(gè)對(duì)應(yīng)樣本(X,,匕)之差(。尸X
且對(duì)應(yīng)樣本的平均數(shù)(5)和標(biāo)準(zhǔn)差(5。)
定義如下。
對(duì)應(yīng)樣本的平均數(shù):
D=ET???(8-18)
對(duì)應(yīng)樣本的標(biāo)準(zhǔn)差:
2
(。-萬(wàn))???(8-19)
〃一1
②假設(shè):假定口,小,…,2相互獨(dú)立,且
和平均數(shù)2i具有相同的分布。當(dāng)對(duì)應(yīng)
樣本是小樣本(n<30)時(shí),有必要檢驗(yàn)
是否服從正態(tài)分布,但對(duì)大樣本
(n>30),不必檢驗(yàn)。
③提出原假設(shè):對(duì)應(yīng)樣本無(wú)差異,即
“():〃x二〃y或。二0
④檢驗(yàn)統(tǒng)計(jì)量:
DyjnD
???(8-20)
sD/VHSD
⑤檢驗(yàn)統(tǒng)計(jì)決策
若原假設(shè)成立,則檢驗(yàn)統(tǒng)計(jì)量服從自
由度為〃T的l分布。在顯著性水平a
條件下,對(duì)不同的替換假設(shè),有不同的
統(tǒng)計(jì)決策。
Hi:Av>Av如果T*>3『一」則原假
設(shè)被否定(右單側(cè)檢驗(yàn))。
"1:4<A如果則原假
設(shè)%被否定(左單側(cè)檢驗(yàn))。
H1:豐".、如果|廠|>ta/2,n-1,則原假
設(shè)“。被否定(雙側(cè)檢驗(yàn))。
⑥P-值及統(tǒng)計(jì)決策
值是檢驗(yàn)樣本和原假設(shè)之間一
致性程度的尺度。,-值可根據(jù)邏輯對(duì)立
假設(shè)計(jì)算。,二右單側(cè)檢驗(yàn);
17)ta,nT值等于自由度為nT的t-分布的a><100%。
,二P(5b)-左單根!I檢驗(yàn);P=2P
(金一1>|7*|)-雙側(cè)檢驗(yàn)。可以利用檢驗(yàn)
統(tǒng)計(jì)量T*的〃-值和顯著性水平a相互
比較的方法,作出統(tǒng)計(jì)決策。在SAS統(tǒng)
計(jì)分析程序中,SAS軟件自動(dòng)把統(tǒng)計(jì)量
〃值換算成相應(yīng)的〃-值。如果。-值大
于顯著性水平4,則原假設(shè)成立。如果
值小于顯著性水平則原假設(shè)被否
定。
例8-12:某電器組裝車間研究引進(jìn)新的組裝方法后,
組裝A產(chǎn)品的數(shù)量是否有所提高。于是他們從組裝A
產(chǎn)品的工人中隨機(jī)抽出15人,進(jìn)行一個(gè)月的新組裝技
術(shù)培訓(xùn)后,和過(guò)去的組裝方法作了比較。其資料見(jiàn)表
8-3(?=0.05)o
(表8-3)兩種組裝方法的生產(chǎn)量(臺(tái))
生產(chǎn)工人123456789101112131415
舊組裝方法342829452627241515272331203520
新組裝方法33365041374139212037211829
①提出原假設(shè)。
②兩種組裝方法的生產(chǎn)量差異變量(X,-匕),是
否服從正態(tài)分布。
③試求。的平均數(shù)和標(biāo)準(zhǔn)差。
④試求檢驗(yàn)統(tǒng)計(jì)量及P-值,并解釋其結(jié)果。
解:對(duì)新的變量。的正態(tài)分布分析,提出原假設(shè)及替換
假設(shè)。
"o:。服從正態(tài)分布〃|:。不服從正態(tài)分布。
□SASPROGRAM
DATAexampl13;
INPUTXY
D=X-Y;
CARDS;
34332836295045412637274124391521
1520273723213118202935382027
RUN;
PROCUNIVARIATENORMAL;一計(jì)算檢驗(yàn)統(tǒng)計(jì)量p-值,并分
析D的分布是否服從正態(tài)分布
VARD;一打印出變量D的描述性統(tǒng)計(jì)量,而且可計(jì)
算對(duì)樣本的t檢驗(yàn)統(tǒng)計(jì)量。
RUN;
口運(yùn)行結(jié)果及解釋:
UnivariateProcedure
Variable=D
Moments
Quantiles(Def=5)
N15SumWgts15100%Max
1399%13
Mean-5.93333Sum-8975%Q3
195%13
StdDev8.489209Variance72.0666750%Med
-790%4
Skewness0.498342Kurtosis0.6349125%QI
-1110%-15
USS1537CSS1008.9330%Min
-215%-21
CV-143.077StdMean2.191904
1%-21
T:Mean=0-2.70693Pr>|T|0.0170
Range34
Num'=015Num>04Q3-Q1
12
M(Sign)-3.5Pr>=|M|0.1185Mode
-21
SgnRank-41Pr>=|S|0.0181
W:Normal0.978148Pr<W0.9275
□運(yùn)行結(jié)果的解釋
從計(jì)算結(jié)果中可知,正態(tài)分布檢驗(yàn)統(tǒng)計(jì)量為
W=0.9275,其p值=0.978148o比顯著性水準(zhǔn)a=0.05
大得多,因此接受原假設(shè)。即新的變量D服從正態(tài)分
布,可以對(duì)對(duì)應(yīng)樣本進(jìn)行「檢定。對(duì)對(duì)應(yīng)樣本,提出
原假設(shè)及替換假設(shè)。
Ho:ux=uy(或D=0),H1:ux<uy(或D<0)
過(guò)去的組裝方法(X)和新的組裝方法(Y)的差異
變量D=X-Y的平均數(shù)為Mean=-5.93333,標(biāo)準(zhǔn)差為Std
Dev=8.489209o所以新組裝方法的生產(chǎn)量比過(guò)去的生
產(chǎn)量大。對(duì)應(yīng)樣本的檢驗(yàn)統(tǒng)計(jì)量7*=-2.707,其,值
=0.0170。因本題是單側(cè)(右側(cè))檢驗(yàn),故P/2=0.0085o
這比顯著性水準(zhǔn)a=0.05小得多,因此原假設(shè)被拒絕,
接受替換假設(shè),即引進(jìn)新的組裝方法,其生產(chǎn)量將有
顯著的提高。
8.6.3兩個(gè)總體平均差檢驗(yàn)
在許多情況下,人們需要比較兩個(gè)
總體參數(shù),看它們是否有顯著的區(qū)別。
平均差”檢驗(yàn)就是分析兩個(gè)不同總體
平均數(shù)之間的差異。例如,檢驗(yàn)兩種家
電產(chǎn)品的平均壽命差,用兩種方法所生
產(chǎn)出來(lái)的某種產(chǎn)品的平均耐磨強(qiáng)度的
差異,同一種教學(xué)方法在不同的年級(jí)或
不同內(nèi)容的課程中是否有不同的效果
等。對(duì)此,我們可利用平均差的”檢驗(yàn)
尋找答案。
如果無(wú)法直接得到總體平均數(shù)差
的數(shù)據(jù)時(shí),可以根據(jù)樣本數(shù)據(jù)來(lái)估計(jì)。
為了檢驗(yàn)兩個(gè)不同總體平均數(shù)之間的
差異,首先要檢驗(yàn)兩個(gè)總體的方差是否
相等。若兩個(gè)總體的方差相等,可直接
對(duì)其兩個(gè)樣本進(jìn)行”檢驗(yàn)。如果兩個(gè)總
體的方差不相等,要作Satterthwaite
Testo進(jìn)行平均差”檢驗(yàn)的步驟如下:
①資料:設(shè)有兩個(gè)樣本容量分別為
nx,叼的兩組隨機(jī)變量X1,X2,…,X”,
匕名,…,工兩個(gè)樣本的平均數(shù)和標(biāo)準(zhǔn)差
分別為H、9、Sx、Sy其兩個(gè)樣本的合
標(biāo)準(zhǔn)差為
_?T)"+(%T)s;
3-X(y1)+(4一1)…
(8-21)
②假定:假設(shè)兩個(gè)樣本都是從服從正
態(tài)分布的總體中隨機(jī)抽取的“,并且兩
個(gè)總體方差相等。肩二CT;
③提出原假設(shè)和替換假設(shè):
H0:"x=4yH1?〃x。"Y
④確定檢驗(yàn)統(tǒng)計(jì)量:
%一y
SpJl/%+1/%,…(8-22)
若接受原假設(shè),則檢驗(yàn)統(tǒng)計(jì)量的分布
19)當(dāng)某總體服從正態(tài)分布時(shí),其樣本的平均數(shù)也服從正態(tài)分布。
服從自由度為OX+〃L2)的"分布。
在顯著性水準(zhǔn)戊條件下,對(duì)不同的替換
假設(shè),有不同的統(tǒng)計(jì)決策。
⑤檢驗(yàn)統(tǒng)計(jì)決策:
Hi>Ay如果7*>L+.,_2,則原假
設(shè)名被拒絕(右單側(cè)檢驗(yàn))。
Hl:4Ov如果r*〈-九+"廠2,則原假
設(shè)”。被拒絕(左單側(cè)檢驗(yàn))。
H、:4W%如果|廠|>%+『,則原假
設(shè)名被拒絕(雙側(cè)檢驗(yàn))。
⑥〃-值及檢驗(yàn)統(tǒng)計(jì)決策:〃-值是檢驗(yàn)
資料和原假設(shè)之間一致性程度的尺度。
P-值可根據(jù)邏輯對(duì)立假設(shè)計(jì)算。
P=P(兀+“廠2>r)
P—P(乙+"一2<7*)
P=P(W2>|r|)
如果P-值>a,則原假設(shè)"。被接受;
如果P-值<1,則原假設(shè)名被拒絕。
如果兩個(gè)總體的方差不相等(城7或),
則需要作SatterthwaiteTest,
其檢驗(yàn)統(tǒng)計(jì)量為
T*無(wú)一歹
1=I=
(8-23)
若接受原假設(shè),則檢驗(yàn)統(tǒng)計(jì)量的分
布服從自由度為了的'分布,自由度/
可由Satterthwaite的自由度近似計(jì)
算公式算出。
f=({/4+1/%)2
(―-.T+($/")及T)
(8-24)
因此,對(duì)兩個(gè)方差不相等的總體,
按以上的方法計(jì)算檢驗(yàn)統(tǒng)計(jì)量P-值時(shí),
以自由度一代替自由度〃x+勺-2就可
以了。
8.6.4PROCTTEST
TTEST程序旨在對(duì)SAS文件中的兩
個(gè)平均數(shù)執(zhí)行t檢定。適用于兩個(gè)獨(dú)立
的樣本的t檢驗(yàn)。
PROCTTEST含四道指令,一般格式
如下:
PROCTTESTOPTION;
CLASS變量;
VAR變量;
BY變量;
1)class變量;
用class語(yǔ)句識(shí)別分析變量所屬的
類別,因此class語(yǔ)句后指定的變量只
可有兩個(gè)值,如果此變量的值是文字型
的,則長(zhǎng)度不能超過(guò)十六個(gè)字母。
2)var變量;
指明對(duì)哪些變量的平均數(shù)進(jìn)行t檢
定。若省略此指令,貝!Jsas對(duì)文件內(nèi)所
有數(shù)值變量(class指定的除外)執(zhí)行
t檢定。
3)by變量;
此指令按照所列舉的變量把文件
分成幾個(gè)小的文件,然后對(duì)每一個(gè)小的
文件執(zhí)行t檢定。當(dāng)選用此指令時(shí),文
件內(nèi)的數(shù)據(jù)必須先按照by后指定的變
量的值由大到小重新排列,可借助proc
sort來(lái)完成。
例8-13:某公司根據(jù)個(gè)人的業(yè)績(jī)及業(yè)務(wù)能力,發(fā)給職
工特別獎(jiǎng)金。為了分析在相同的業(yè)績(jī)及業(yè)務(wù)能力組中,
男職工和女職工的獎(jiǎng)金是否有顯著的差別,隨機(jī)抽出
18名男職工和15名女職工作了調(diào)查。其調(diào)查資料如表
8-4o特別獎(jiǎng)金是按一年總工資額的百分?jǐn)?shù)來(lái)表示,顯
著性水平是a=0.05O
①提出原假設(shè)和替換假設(shè)。
②試計(jì)算男女職工的描述性統(tǒng)計(jì)量。
③試檢驗(yàn)兩個(gè)總體(男女)的方差是否相等。
④試檢驗(yàn)發(fā)給男職工和女職工的特別獎(jiǎng)金額,是否
有顯著的差異。
(表8-4))男女特別獎(jiǎng)金資料
性特別獎(jiǎng)金(%)
別
女9.27.711.96.29.08.46.97.67.48.09.96.78.49.39.1.~7
(X)
10.48.911.712.08.79.49.89.09.29.79.18.87.99.910.09.310.412.0
(Y)
□SASPROGRAM
DATAexampl3;
INPUTXY@@;一①3名女職工的獎(jiǎng)金將出現(xiàn)空白(missing
value),用點(diǎn)'來(lái)表示。
CARDS;
溫馨提示
- 1. 本站所有資源如無(wú)特殊說(shuō)明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請(qǐng)下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請(qǐng)聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
- 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁(yè)內(nèi)容里面會(huì)有圖紙預(yù)覽,若沒(méi)有圖紙預(yù)覽就沒(méi)有圖紙。
- 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
- 5. 人人文庫(kù)網(wǎng)僅提供信息存儲(chǔ)空間,僅對(duì)用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對(duì)用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對(duì)任何下載內(nèi)容負(fù)責(zé)。
- 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請(qǐng)與我們聯(lián)系,我們立即糾正。
- 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶因使用這些下載資源對(duì)自己和他人造成任何形式的傷害或損失。
最新文檔
- 2025年度離婚財(cái)產(chǎn)分割協(xié)議書(shū)及無(wú)形資產(chǎn)評(píng)估范本3篇
- CISP0501信息安全法規(guī)、政策和標(biāo)準(zhǔn)-含網(wǎng)絡(luò)安全法
- 2024離婚冷靜期婚姻家庭關(guān)系咨詢與輔導(dǎo)服務(wù)合同3篇
- 二零二五版反擔(dān)保動(dòng)產(chǎn)質(zhì)押倉(cāng)儲(chǔ)管理服務(wù)合同2篇
- 2025年生態(tài)旅游PPP項(xiàng)目合同范本3篇
- 2025年度智能溫室大棚蔬菜種植技術(shù)服務(wù)合同4篇
- 2025年餐廳智能化改造及裝修一體化合同范本3篇
- 2024美容院專業(yè)美容師聘用合同模板3篇
- 圍墻粉刷涂料施工方案
- 招生咨詢專線
- 2024年智能科技項(xiàng)目開(kāi)發(fā)戰(zhàn)略合作框架協(xié)議
- 精神科健康宣教手冊(cè)-各種精神疾病宣教
- 人才交流中心聘用合同模板
- 騰訊云人工智能工程師認(rèn)證考試題(附答案)
- 2024版新能源汽車充電樁建設(shè)與運(yùn)營(yíng)合作框架協(xié)議3篇
- 掛靠免責(zé)協(xié)議書(shū)范本
- 廣東省廣州市天河區(qū)2023-2024學(xué)年高一上學(xué)期期末考試數(shù)學(xué)試卷(解析版)
- 鋼構(gòu)樓板合同范例
- 四年級(jí)全一冊(cè)《勞動(dòng)與技術(shù)》第四單元 活動(dòng)4《飼養(yǎng)動(dòng)物的學(xué)問(wèn)》課件
- 2024-2025學(xué)年人教版(2024)信息技術(shù)四年級(jí)上冊(cè) 第11課 嘀嘀嗒嗒的秘密 說(shuō)課稿
- 2024中考物理真題匯編:電與磁(含解析)
評(píng)論
0/150
提交評(píng)論