第8章 假設(shè)檢驗(yàn)_第1頁(yè)
第8章 假設(shè)檢驗(yàn)_第2頁(yè)
第8章 假設(shè)檢驗(yàn)_第3頁(yè)
第8章 假設(shè)檢驗(yàn)_第4頁(yè)
第8章 假設(shè)檢驗(yàn)_第5頁(yè)
已閱讀5頁(yè),還剩37頁(yè)未讀 繼續(xù)免費(fèi)閱讀

下載本文檔

版權(quán)說(shuō)明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請(qǐng)進(jìn)行舉報(bào)或認(rèn)領(lǐng)

文檔簡(jiǎn)介

第8章假設(shè)檢驗(yàn)

(HypothesisTesting)

假設(shè)檢驗(yàn)是抽樣統(tǒng)計(jì)推斷的另一項(xiàng)

重要內(nèi)容。它是利用樣本的實(shí)際觀測(cè)資

料來(lái)檢驗(yàn)事先對(duì)總體某些數(shù)量特征所

作的假設(shè)是否可信的統(tǒng)計(jì)分析方法。根

據(jù)已有的知識(shí)(情報(bào))對(duì)總體的數(shù)量特

征和變動(dòng)規(guī)律做出一定的假設(shè),然后運(yùn)

用觀測(cè)到的樣本的資料和一定程序,來(lái)

判斷事先所作的假設(shè)是不是合理可信,

從而決定接受或拒絕這個(gè)假設(shè)。

8.1假設(shè)檢驗(yàn)的概念

小概率的原理

假設(shè)檢驗(yàn)的基本思想是應(yīng)用小概

率的原理。所謂小概率原理是指發(fā)生概

率很小的隨機(jī)事件在一次試驗(yàn)中幾乎

是不可能發(fā)生的。根據(jù)這一原理我們可

以做出是否接受原假設(shè)的決定,即進(jìn)行

假設(shè)檢驗(yàn)時(shí)必須事先確定一個(gè)作為接

受或拒絕的判斷界限的小概率標(biāo)準(zhǔn)。該

小概率標(biāo)準(zhǔn)就是統(tǒng)計(jì)假設(shè)檢驗(yàn)中的顯

著性水平。在假設(shè)檢驗(yàn)過(guò)程中,我們可

以依據(jù)顯著性水平的大小把概率分布

劃分為接受區(qū)間和拒絕區(qū)間。大于給定

標(biāo)準(zhǔn)的概率區(qū)間稱為接受區(qū)間,小于給

定的概率區(qū)間稱為拒絕區(qū)間。

假如給定的小概率標(biāo)準(zhǔn)為。=0.1,

凡概率小于10%的事件都稱為小概率事

件,均屬于拒絕區(qū)間。而概率大于等于

二90%的事件都稱為對(duì)立事件概率,

均屬

于接

受區(qū)

間。事

件屬

于接受區(qū)間,意味著原假設(shè)成立而無(wú)顯

著性差異;事件屬于拒絕區(qū)間,意味著

原假設(shè)不成立,而認(rèn)為有顯著性差異。

顯著性水平a所對(duì)應(yīng)的概率度t稱為a

的臨界值,記為L(zhǎng)例如。=0.1時(shí),

廿1.64。我們稱概率小于0.1的事件

為小概率事件。但實(shí)際假設(shè)檢驗(yàn)分析中

作為接受或拒絕的判斷尺度臨界值,比

顯著性水平戊更為常用。

根據(jù)我們所研究的對(duì)象的性質(zhì)和

特征的不同,統(tǒng)計(jì)假設(shè)檢驗(yàn)又可分為雙

側(cè)檢驗(yàn)和單側(cè)檢驗(yàn)兩種類型。當(dāng)我們的

研究只對(duì)檢驗(yàn)樣本和總體的平均數(shù),或

樣本和總體的平均數(shù)有沒(méi)有顯著性差

異關(guān)心,而不問(wèn)差異的方向(正差或負(fù)

差)時(shí)采用雙側(cè)檢驗(yàn)方法。但我們所要

檢驗(yàn)的是抽取樣本的總體的參數(shù)值偏

大于還是偏小于某個(gè)特定值時(shí)采用單

側(cè)檢驗(yàn)方法。因此,單側(cè)檢驗(yàn)方法有右

單側(cè)檢驗(yàn)和左單側(cè)檢驗(yàn)兩種。當(dāng)我們所

要檢驗(yàn)的是總體的參數(shù)值是否大于某

個(gè)特定值,應(yīng)采用右單側(cè)檢驗(yàn);反之,

應(yīng)采用左單側(cè)檢驗(yàn)。在雙側(cè)檢驗(yàn)中原假

設(shè)與替換假設(shè)通常采用等式,在單側(cè)檢

驗(yàn)中原假設(shè)與替換假設(shè)取不等式。

雙側(cè)檢驗(yàn):乩:4="。HH、

右單側(cè)檢驗(yàn):乩?A—Z^oH、:網(wǎng)

左單側(cè)檢驗(yàn):乩:心"。/:〃<〃。

〃為計(jì)算值為為假設(shè)值

總而言之,假設(shè)檢驗(yàn)是對(duì)我們所關(guān)

心的,卻又是未知的總體參數(shù)先做出假

設(shè),然后抽取樣本,利用樣本提供的信

息對(duì)假設(shè)的正確性進(jìn)行判斷的過(guò)程。它

是進(jìn)行各種經(jīng)濟(jì)行為、管理及決策的有

力工具。

8.2一個(gè)正態(tài)總體參數(shù)的假設(shè)檢驗(yàn)

根據(jù)已知條件,一個(gè)正態(tài)總體參數(shù)

的檢驗(yàn)方法通??梢苑譃閮煞N。一種方

法是當(dāng)總體的方差/為已知數(shù)時(shí),以Z

為檢驗(yàn)統(tǒng)計(jì)量進(jìn)行檢驗(yàn);另一種方法是

當(dāng)總體的方差〃為未知數(shù)時(shí),以廣作為

檢驗(yàn)統(tǒng)計(jì)量進(jìn)行檢驗(yàn)。

8.2.1總體平均數(shù)〃的假設(shè)檢驗(yàn)

8.2.L1總體的方差〃為已知數(shù)時(shí)

設(shè)隨機(jī)變量匕”,…,是從符合正態(tài)

分布的總體中抽取的樣本,且總體和樣

本的平均數(shù)及方差分別為“、元、。2、一

①原假設(shè)與替換假設(shè);H°:…

H]:〃W〃o

②檢驗(yàn)統(tǒng)計(jì)量(概率度)z;

(8-1)

③設(shè)定顯著性水平。

④計(jì)算檢驗(yàn)統(tǒng)計(jì)量(概率度)z值:

⑤做出統(tǒng)計(jì)決策:

若|Z|〈|4,2|,則接受原假設(shè)義,拒

絕替換假設(shè)”I

若團(tuán)>凡小則拒絕原假設(shè)“。,接

受替換假設(shè)/_

例8-1:設(shè)"=600,工=630,0=30,n=100,。=0.05。

試求雙側(cè)檢驗(yàn)(替換假設(shè)乩:〃#600)和右側(cè)檢驗(yàn)(替

換假設(shè)兄:4>600)時(shí)的臨界值。

解:LISASPROGRAM

DATAexamplel;

ALPHA=O.05;n=100;sigma=30;mu0=600;barX=630;

Zcal=(barX-muO)/(sigma/SQRT(n));zl=PR0BIT(ALPHA/2);

一雙側(cè)檢驗(yàn)(計(jì)算臨界值)

IFABS(Zcal)>=ABS(zl)THENRESULT1=,REJECT5;ELSE

RESULTS'ACCEPT;

z2=PR0BIT(l-ALPHA);一右側(cè)檢

驗(yàn)(計(jì)算臨界值)

IFZeal>=z2THENRESULT2='REJECT,;ELSE

RESULT2='ACCEPT;RUN;

PROCPRINT;VARALPHAZCALzlRESULT1z2RESULT2;RUN;

口運(yùn)行結(jié)果

OBSALPHAZCALZlRESULT1

Z2RESULT2

10.0510-1.95996REJECT

1.64485REJECT

利用SASPROGRAM計(jì)算的結(jié)果得,雙側(cè)檢驗(yàn)臨界值

Z°/2=±L96右側(cè)檢驗(yàn)臨界值=1.645;因?yàn)?/p>

z>|za/2|,z>|zJ,所以雙側(cè)檢驗(yàn)原假設(shè)%:〃=4

和右單側(cè)檢驗(yàn)的原假設(shè):4。均被否定.

(圖8-2)“°的接受區(qū)和拒絕區(qū)

(a)雙側(cè)檢驗(yàn)(b)右側(cè)檢驗(yàn)

-1.961.961.64

又與〃的關(guān)系替換假設(shè)的形態(tài)檢驗(yàn)方法

x>〃0"1:4〉右單側(cè)檢驗(yàn)

x<Ao“1:〃<〃0左單側(cè)檢驗(yàn)

8.2.1.2總體的方差一為未知數(shù)時(shí)

因?yàn)榭傮w的方差/為未知數(shù),不能

直接利用Z-統(tǒng)計(jì)量。所以利用廠-檢驗(yàn)

統(tǒng)計(jì)量(詳見(jiàn)8.6)o

(8-2)

當(dāng)〃230時(shí),玄令一?Z,即L分布

和Z-分布相接近,可設(shè)z=F,并把它

作為檢驗(yàn)統(tǒng)計(jì)量計(jì)算臨界值,這樣可以

不用考慮自由度的問(wèn)題。

例8-2:設(shè)某百貨商店的電冰箱銷售量服從正態(tài)分布。

已知gx,=10()(Xi代表第,天電冰箱銷售量);

r=1

10°

ZXj=23500o并設(shè)定"o:4212。試在。=0.05

t=\

的條件下檢驗(yàn)。

□SASPROGRAM

DATAexample2;

ALPHA=O.05;MU0=12;N=10;SUMX=100;SUMX2=23500;

BarX=sumX/n;s2=(sumX2-n*barX**2)/(n-l);

Tcal=(barX-muO)/SQRT(s2/n);

>TINV(ALPHA,n-1);

IFTcal=TTHENRESULT='REJECT';ELSE

RESULT='ACCEPT';RUN;

PROCPRINT;VARALPHATealtRESULT;RUN;

□運(yùn)行結(jié)果

OBSALPHATCALT

RESULT

10.05-0.12649

-1.83311ACCEPT

解:因?yàn)榭傮w的方差〃為未知數(shù),以「統(tǒng)計(jì)量作為檢

驗(yàn)統(tǒng)計(jì)量。又因?yàn)椤?。?>=12,所以替換假設(shè)為

根據(jù)題意作左側(cè)檢驗(yàn)。若廣〉一^則原假

設(shè)成立。利用SASPROGRAM計(jì)算的結(jié)果

T=-0.1265>-^=-1.833,所以,一天的電冰箱平均

銷售量超過(guò)12臺(tái)的原假設(shè)成立。

例8-3:若把例8-2的樣本容量由原來(lái)的10天增加到

100天(N=100),并設(shè)其他的條件不變。這時(shí)我們可以

利用Z-統(tǒng)計(jì)量。即

「一4)

7…(8-3)

計(jì)算結(jié)果Z=-0.4>Za=-1.64485,所以原假設(shè)成立。

例8-4:某生產(chǎn)燈泡企業(yè)的新職工,上班的第一個(gè)月生

產(chǎn)了100只燈泡,其中隨機(jī)抽出5只燈泡作了壽命試

驗(yàn),其壽命分別為70,75,80,85,90(天)。試檢驗(yàn)

燈泡的平均壽命為75天的可能性(設(shè)。=0.1)。

解:設(shè)“0:設(shè)<75,"]:〃>75。即作右側(cè)檢驗(yàn),

若T*<%則原假設(shè)成立。因?yàn)镹=100,所以利用有限總

體調(diào)整系數(shù)來(lái)計(jì)算。利用SASProgram計(jì)算的結(jié)果,

*

T=1.443680,=1.53321o所以燈泡的平均壽命不

能超過(guò)75天的原假設(shè)成立。

□SASPROGRAM

DATAEXAMPEL4;

INPUTX@@;

CARDS;

7075808590

RUN;

PROCMEANSNOPRINT;VARX;OUTPUTOUT=OUTPUTN=n

MEAN=BARXVAR=S2;RUN;

DATARESULT;SETOUTPUT;

ALPHA=O.1;MU0=75;CC=(100-n)/(100-1);

TCAL=(BARX-MUO)/SQRT((S2/N)*CC);T=TINV(1-ALPHA,N-1

);

IFTCAL=TTHENRESULT='REJECTJ;ELSE

RESULT='ACCEPTJ;RUN;

PROCPRINT;VARALPHATCALTRESULT;RUN;

□運(yùn)行結(jié)果

OBSALPHATCALT

RESULT

10.11.443681.53321

ACCEPT

8.3兩個(gè)正態(tài)總體參數(shù)檢驗(yàn)

8.3.1兩個(gè)正態(tài)均值之間的假設(shè)檢驗(yàn)

8.3.1.1、犬為已知數(shù)時(shí),兩個(gè)總

體平均值的假設(shè)檢驗(yàn)

在經(jīng)濟(jì)分析中,常常需要比較兩個(gè)

總體的參數(shù)。比如,北方地區(qū)和南方地

區(qū)的經(jīng)濟(jì)發(fā)展水平是否有顯著性差異

等,對(duì)這種兩個(gè)總體(地區(qū))的參數(shù)是

否有顯著性差異的問(wèn)題,可用兩個(gè)正態(tài)

總體參數(shù)檢驗(yàn)的方法來(lái)解決,其檢驗(yàn)步

驟如下:

第一步:設(shè)兩個(gè)總體的平均值和方

差分別為〃1、“2和4、成,原假設(shè)可設(shè)

定為兩個(gè)總體的平均值相等。即

H0:"\=〃2"I:41W

第二步:分別從兩個(gè)總體中抽出一

個(gè)樣本,得到樣本容量和平均數(shù)分別為

%、兄和叼,心的樣本。如果兄和院服

從正態(tài)分布,則兄士心也服從正態(tài)分

布。下面計(jì)算一下新的概率變量元-及

的平均值和方差。

E區(qū)-X2]=E區(qū)]-仇》21=從—4

???(8-8)__

V[Xl-X2]=V[Xi]+V[X2]-2Cov(Xi,X2)

—月和先是相互獨(dú)立的,所以其協(xié)方差2Cov(月,

x2)-0

22

V區(qū)-晨]=J+J

n{n2

???(8-9)

(X1-X2),

N[(?),(五+生)]-(8-10)

%〃2

把(月一月)進(jìn)行標(biāo)準(zhǔn)化得到標(biāo)準(zhǔn)化的檢驗(yàn)統(tǒng)計(jì)量;

Z=(XI-X2)-(41--2)

-

\%n2

???(8-11)

第三步:計(jì)算檢驗(yàn)統(tǒng)計(jì)量。并根據(jù)原假設(shè)設(shè)定雙

側(cè)檢驗(yàn)還是單側(cè)檢驗(yàn)。若原假設(shè)為

則需要雙側(cè)檢驗(yàn)土Zq/2;若“。:>°,則左側(cè)檢

驗(yàn)-Z*;若H。:"「從<0,則右側(cè)檢驗(yàn)Za/2o

第四步:根據(jù)所給定的顯著性水平a值和z的臨

界值,進(jìn)行判斷。

例8-7:某汽車公司為了檢驗(yàn)4型汽車和B型汽

車的耗油量,分別從A型和B型汽車中隨機(jī)抽出9輛

汽車作了試驗(yàn)。試驗(yàn)結(jié)果表明,當(dāng)消耗1升汽油時(shí),

兩種型號(hào)汽車的平均行駛距離分別為12Km.HKmo如

果A,8這兩種型號(hào)汽車的標(biāo)準(zhǔn)差分別服從i.5Km/升

和IKm/升的正態(tài)分布,試分析在顯著性水平為a=1%

的條件下,4—4二°的原假設(shè)是否成立。

解:根據(jù)題意,利用檢驗(yàn)統(tǒng)計(jì)量(8-11)進(jìn)行雙側(cè)檢

驗(yàn)。

Z=(X1-X2)-(〃1-〃2)=12-11-0

Jcr:/"i+cr;//211.52

V-99~

與顯著性水平為。=1%相對(duì)應(yīng)的臨界值為

土Za〃=±2.575,因?yàn)?Z0/2=-2.575<Z<Za/2=2.575,

所以原假設(shè)成立,即48兩種型號(hào)汽車的汽油消耗量

沒(méi)有顯著性差異。

DATAexample7;

ALPHA=0.01;nl=9;n2=9;barXl=12;barX2=ll;sl=l.5;

s2=l;

Zcal=(barXl-barX2)/SQRT(sl**2/nl+s2**2/n2);

Z=PROBIT(ALPHA/2);

IFABS(Zcal)>=ABS(Z)THENRESUL='REJECT';ELSE

RESULT」ACCEPT;RUN;

PROCPRINT;VARALPHAZealzRESULT;RUN;

□運(yùn)行結(jié)果

OBSALPHAZCALZRESULT

10.011.66410-2.57583ACCEPT

8.3.1.2M、4為未知數(shù)時(shí),兩個(gè)總

體均值之差的假設(shè)檢驗(yàn)

L樣本容量較大的情況

如果措、成為未知數(shù),但樣本為大

樣本時(shí),我們可用樣本的方差$;、s;代

替總體的斕、武,利用下面的近似公式

計(jì)算檢驗(yàn)統(tǒng)計(jì)量。

Z_(X]-X2)-(〃l-從2)_(x1-X2)-(4一〃2)

]2/72?+(T2/n2!n\+S;I口2

…(8-12)

在前面的例8-6中,假設(shè)b:、8是

未知數(shù)。如果把樣本容量由原來(lái)的9

個(gè)擴(kuò)大到32個(gè)時(shí),測(cè)得A3兩種型號(hào)汽

車的平均行駛距離分別為12Km/升、

n.5Km/升。這時(shí)我們可利用(8-12)

式來(lái)進(jìn)行假設(shè)檢驗(yàn)。

Z=(12TL5)=2

/1/32)2+(1/32f

顯著性水平為a=1%的條件下

±Za/2=±2.575,所以原假設(shè)成立。但如果

給定的顯著性水平為?=0.05%

(±Za/2=±1.96),則原假設(shè)不成立。

2.樣本容量較小的情況

如果統(tǒng)為未知數(shù),且樣本容量較

小時(shí),可利用下面的檢驗(yàn)統(tǒng)計(jì)量進(jìn)行假

設(shè)檢驗(yàn)(詳見(jiàn)8.6.3)。

t_(X]二〃2).、

n}+n2-2=『i-一L―???(8-13)

/(■T)s:+(%T)s;

s人=XL-%)

?十幾?

N—2nx+

但利用上面的檢驗(yàn)統(tǒng)計(jì)量,必須滿

足這樣的兩個(gè)條件。首先兩個(gè)總體必須

滿足正態(tài)分布;其次是兩個(gè)總體的方差

必須相等4=Cr2o

例8-8:在同屆畢業(yè)的文科和工科畢業(yè)生中各隨機(jī)抽出

10、15名,其調(diào)查結(jié)果表明,文科和工科類畢業(yè)生的

工資收入分別為80、75萬(wàn)(韓幣),方差分別為300、

200o試問(wèn)在顯著性水平a=0.05的條件下,同屆畢業(yè)

的文科和工科類畢業(yè)生的工資水平是否有顯著性差

異。

解:設(shè)同屆畢業(yè)的文科和工科類畢業(yè)生的工資水平?jīng)]

有顯著性差異。口

9)DATAexamples;

ALPHA=0.05;nl=10;n2=15;barX1=80;barX2=75;Sl=SQRT(300);S2=SQRT(200);

即Ho:〃]■/=0

-2_(%-l)s;+(〃2T)s;_(10-1)300+(15-1)200_55(

“1+〃2—210+15—22:

V^1=80,^2=75

在。=0.05的條件下,自由度為

%+々-2=10+15-2=23時(shí),相應(yīng)的臨界值查表可得

—taR23=±2.069。因?yàn)椤?2,23<,<%/2,23,所以同屆

畢業(yè)的文科和工科類畢業(yè)生的工資水平?jīng)]有顯著性差

異的原假設(shè)成立。

DATAexamples;

ALPHA=0.05;nl=10;n2=15;barXl=80;barX2=75;

Sl=SQRT(300);S2=SQRT(200);

Spooled=((nl-1)*sl**2+(n2-l)*s2**2)/(nl+n2-2);Tcal=

(barXl-barX2)/SQRT(Spooled*(l/nl+l/n2));

T=TINV(ALPHA/2,nl+n2-2);

Spooled=((nl-l)*sl**2+(n2-l)*s2**2)/(n1+n2-2);Tcal=(barX1-barX2)/SQRT(Spool.ed*(l/nl+l/n2));

T=TINV(ALPHA/2,nl+n2-2);

IFABS(Tcal)>=ABS(t)THENRESULT:'REJECT';ELSERESULT:'ACCEPT';RUN;

PROCPRINT;VARALPHATealtRESULT;RUN;

□運(yùn)行結(jié)果

OBSALPHATCALTRESULT

10.050.79201-2.06866ACCEPT

IFABS(Tcal)>=ABS(t)THENRESULTiREJECT;ELSE

RESULTiACCEPT,;RUN;

PROCPRINT;VARALPHATealtRESULT;RUN;

口運(yùn)行結(jié)果

OBSALPHATCALT

RESULT

10.050.79201-2.06866

ACCEPT

8.6假設(shè)一檢驗(yàn)

8.6.1一個(gè)總體平均數(shù)的一檢驗(yàn)

設(shè)隨機(jī)變量匕*2,…,X”是從符合

正態(tài)分布的總體中抽取的樣本,且總體

和樣本的平均數(shù)及方差分別為4、又、

,、當(dāng)總體方差M為未知數(shù)時(shí),不

能選擇Z統(tǒng)計(jì)量,此時(shí)需要用樣本方差

$2代替總體方差檢驗(yàn)統(tǒng)計(jì)量服從自

由度為〃-1的乙分布。J檢驗(yàn)步驟如下;

1)原假設(shè)與替換假設(shè):…="。

H、:N豐Ao

2)檢驗(yàn)統(tǒng)計(jì)量(概率度)匕

T*_x-A。_J7(x_〃。)???1

T~s/^~s(8-1

7)

在大樣本(隨機(jī)變量的容量〃2

30)的情況下,,?分布和Z?分布相接近。

樣本統(tǒng)計(jì)量,服從或趨近于期望值為0、

(圖8-5)l檢驗(yàn)的接受區(qū)和拒絕區(qū)差

1

標(biāo)

準(zhǔn)

態(tài)分布N(0,1)。根據(jù)實(shí)際抽樣調(diào)查資

料,計(jì)算樣本的平均數(shù)又及標(biāo)準(zhǔn)差S,

就可以具體確定統(tǒng)計(jì)量T*值。

設(shè)定顯著性水平a-計(jì)算檢驗(yàn)統(tǒng)

計(jì)量l值(K)一作出統(tǒng)計(jì)決策。若原

假設(shè)成立,則檢驗(yàn)統(tǒng)計(jì)量(概率度)服

從自由度為九-1的一分布。在顯著性水

準(zhǔn)a條件下,對(duì)不同的替換假設(shè),有不

同的統(tǒng)計(jì)決策。

%:〃>〃。,如果T*>%皿,則原假設(shè)

”。被否定(右單側(cè)檢驗(yàn))2)o

Hl:…。,如果:a,n-l,則原假

設(shè)/被否定(左單側(cè)檢驗(yàn))。

況:"玲,如果7|>乙/”「)則原

假設(shè)"。被否定(雙側(cè)檢驗(yàn))。

3)P-值及統(tǒng)計(jì)決策

值是檢驗(yàn)樣本和原假設(shè)之間一

致性程度的尺度。P-值可根據(jù)邏輯對(duì)立

假設(shè)計(jì)算。

15)t“.n“值等于自由度為n-1的t-分布的aX100%。

P=P(K.i>T*):右單側(cè)檢驗(yàn)時(shí),檢

驗(yàn)統(tǒng)計(jì)量T*的尸-值是自由度為〃-1的

L分布中,比檢驗(yàn)統(tǒng)計(jì)量/大的概率。

如果尸-值越小,則檢驗(yàn)統(tǒng)計(jì)量越接近一

分布的右尾部,原假設(shè)/被否定的可能

性越大;反之P-值越大,則原假設(shè)“。被

接受的可能性越大。

尸二尸(,一KT*):左單側(cè)檢驗(yàn)時(shí),檢驗(yàn)

統(tǒng)計(jì)量廠的夕-值是自由度為〃-1的,

分布中,比檢驗(yàn)統(tǒng)計(jì)量廠小的概率。如

果「值越大,則檢驗(yàn)統(tǒng)計(jì)量越接近分

布的左尾部,原假設(shè)“。被否定的可能性

越大,反之?-值越大,則原假設(shè)“。被

接受的可能性越大。

P=2P|):雙側(cè)檢驗(yàn)時(shí),檢

驗(yàn)統(tǒng)計(jì)量I廣I的P-值是自由度為n-l

的L分布中,比檢驗(yàn)統(tǒng)計(jì)量7*的絕對(duì)值

大的概率。如果P-值越大,則檢驗(yàn)統(tǒng)

計(jì)量越接近,-分布的左尾部,原假設(shè)“。

被否定的可能性越大,反之P-值越大,

則原假設(shè)“。被接受的可能性越大。

(圖8-6)P-雙側(cè)檢驗(yàn)接受區(qū)和拒絕區(qū)可

驗(yàn)

統(tǒng)

計(jì)量T*的夕-值和顯著性水平。的相互

比較的方法,作出統(tǒng)計(jì)決策。在SAS統(tǒng)

計(jì)分析程序中,SAS軟件自動(dòng)把統(tǒng)計(jì)量

T值換算成相應(yīng)的尸-值工如果尸-值大

于顯著性水平%則原假設(shè)成立。如果

尸-值小于顯著性水平則原假設(shè)被否

定。即,若尸-值>1,則原假設(shè)"。成立;

若P-值則原假設(shè)“。被否定。P~

值可以提供更多的信息,不僅可以用尸-

值與規(guī)定的顯著性水平]比較,進(jìn)行檢

驗(yàn)統(tǒng)計(jì)決策,而且P-值顯示了樣本值在

一定范圍內(nèi)出現(xiàn)的概率。這有助于我們

對(duì)檢驗(yàn)對(duì)象有更進(jìn)一步的了解,同時(shí)也

為進(jìn)行更多靈活的檢驗(yàn)統(tǒng)計(jì)決策提供

可能。在SAS軟件中,就利用這一重要

的參數(shù)進(jìn)行假設(shè)檢驗(yàn)問(wèn)題分析,并把它

作為統(tǒng)計(jì)決策的依據(jù)。

例8-11:某生產(chǎn)電子原件的企業(yè),生產(chǎn)一種A元件。

過(guò)去A元件的平均壽命為25個(gè)月。但該企業(yè)的技術(shù)管

16)在SAS程序,SAS軟件對(duì)檢驗(yàn)統(tǒng)計(jì)量進(jìn)行雙側(cè)檢驗(yàn),算出IT的概率(即prob|T|)。

所以單側(cè)檢驗(yàn)時(shí),必須除以2。

理科認(rèn)為,通過(guò)引進(jìn)外國(guó)先進(jìn)設(shè)備及技術(shù)后,A元件的

平均壽命有明顯的提高。于是他們隨機(jī)抽出15個(gè)樣品

作了壽命試驗(yàn)。其試驗(yàn)結(jié)果如表8-2。(表8-2)A元件

壽命試驗(yàn)資料

282527311026302555122432284238

設(shè)A元件壽命服從正態(tài)分布,其顯著性水平a=0.05。

試求:1)15個(gè)樣品的平均數(shù)和標(biāo)準(zhǔn)差2)假定原假設(shè)

和替換假設(shè)3)計(jì)算檢驗(yàn)統(tǒng)計(jì)量的展值,并解釋其結(jié)

解:根據(jù)題意"。=25,假定原假設(shè)和替換假設(shè)。

H。:〃=〃。,即A元件的壽命沒(méi)有顯著提高;a:〃>"。

即A元件的壽命有顯著提高。

□SASPROGRAM

DATAexampl1;

INPUTX

DX=X-25;

*-(a)

CARDS;

282527311026301555122432284238

RUN;

PROCMEANSMEANSTDTPRTMAXDEC=2;TITLE,ONE-TAILED

TTEST,;VARDX;RUN;

一(b)

□PROGRAM解釋

(a)DX=X-25

用SAS程序分析樣品和總體平均數(shù)之間的顯著性差異時(shí),

SAS程序自動(dòng)的進(jìn)行雙側(cè)檢驗(yàn)分析,Ho:u=25,乩:口工25。

所以利用總體平均數(shù)和樣本的離差變量DX=X-25o

(b)PROCMEANSMEANSTDTPRTMAXDEC=2

PROCMEANSMEANSTDT是計(jì)算檢驗(yàn)統(tǒng)計(jì)量的命令。PRT

MAXDEC=2表示雙側(cè)檢驗(yàn),PRT命令將打印檢驗(yàn)統(tǒng)計(jì)量p-值。

□運(yùn)行結(jié)果及解釋

ONE-TAILEDTTEST

AnalysisVariable:DX

StdDev

Prob>|T|

11.44

0.2970

P/2=0.1485

拒絕Ho0.05

05=0.95

u=0

8,檢驗(yàn)統(tǒng)計(jì)量p-值=0.2970。因?yàn)樵赟AS程序自動(dòng)進(jìn)行雙側(cè)檢

驗(yàn),故p/2=0.1485X).05。所以原假設(shè)成立。

8.6.2一個(gè)總體兩個(gè)對(duì)應(yīng)比較上檢驗(yàn)

對(duì)應(yīng)比較一檢驗(yàn)是指對(duì)同一個(gè)總體

的同一個(gè)試驗(yàn)單位,作兩種不同的“處

理”之后出現(xiàn)的結(jié)果進(jìn)行對(duì)應(yīng)比較的方

法。比如,有一個(gè)電視機(jī)組裝車間,現(xiàn)

研究當(dāng)引進(jìn)新的組裝技術(shù)后,其組裝時(shí)

間是否比過(guò)去的組裝時(shí)間有所縮短的

問(wèn)題。在研究這類問(wèn)題時(shí)我們發(fā)現(xiàn)可以

采用對(duì)應(yīng)比較的的方法。因?yàn)榻M裝車間

(總體)沒(méi)變,試驗(yàn)單位(組裝工人)

也沒(méi)變,所以測(cè)定過(guò)去的組裝方法與新

的組裝方法的生產(chǎn)效率問(wèn)題時(shí),可以利

用對(duì)同一個(gè)試驗(yàn)單位的兩種不同的處

理結(jié)果,作簡(jiǎn)單的一分析。

①資料:設(shè)分。2,”是同一個(gè)總體中,〃

個(gè)對(duì)應(yīng)樣本(X,,匕)之差(。尸X

且對(duì)應(yīng)樣本的平均數(shù)(5)和標(biāo)準(zhǔn)差(5。)

定義如下。

對(duì)應(yīng)樣本的平均數(shù):

D=ET???(8-18)

對(duì)應(yīng)樣本的標(biāo)準(zhǔn)差:

2

(。-萬(wàn))???(8-19)

〃一1

②假設(shè):假定口,小,…,2相互獨(dú)立,且

和平均數(shù)2i具有相同的分布。當(dāng)對(duì)應(yīng)

樣本是小樣本(n<30)時(shí),有必要檢驗(yàn)

是否服從正態(tài)分布,但對(duì)大樣本

(n>30),不必檢驗(yàn)。

③提出原假設(shè):對(duì)應(yīng)樣本無(wú)差異,即

“():〃x二〃y或。二0

④檢驗(yàn)統(tǒng)計(jì)量:

DyjnD

???(8-20)

sD/VHSD

⑤檢驗(yàn)統(tǒng)計(jì)決策

若原假設(shè)成立,則檢驗(yàn)統(tǒng)計(jì)量服從自

由度為〃T的l分布。在顯著性水平a

條件下,對(duì)不同的替換假設(shè),有不同的

統(tǒng)計(jì)決策。

Hi:Av>Av如果T*>3『一」則原假

設(shè)被否定(右單側(cè)檢驗(yàn))。

"1:4<A如果則原假

設(shè)%被否定(左單側(cè)檢驗(yàn))。

H1:豐".、如果|廠|>ta/2,n-1,則原假

設(shè)“。被否定(雙側(cè)檢驗(yàn))。

⑥P-值及統(tǒng)計(jì)決策

值是檢驗(yàn)樣本和原假設(shè)之間一

致性程度的尺度。,-值可根據(jù)邏輯對(duì)立

假設(shè)計(jì)算。,二右單側(cè)檢驗(yàn);

17)ta,nT值等于自由度為nT的t-分布的a><100%。

,二P(5b)-左單根!I檢驗(yàn);P=2P

(金一1>|7*|)-雙側(cè)檢驗(yàn)。可以利用檢驗(yàn)

統(tǒng)計(jì)量T*的〃-值和顯著性水平a相互

比較的方法,作出統(tǒng)計(jì)決策。在SAS統(tǒng)

計(jì)分析程序中,SAS軟件自動(dòng)把統(tǒng)計(jì)量

〃值換算成相應(yīng)的〃-值。如果。-值大

于顯著性水平4,則原假設(shè)成立。如果

值小于顯著性水平則原假設(shè)被否

定。

例8-12:某電器組裝車間研究引進(jìn)新的組裝方法后,

組裝A產(chǎn)品的數(shù)量是否有所提高。于是他們從組裝A

產(chǎn)品的工人中隨機(jī)抽出15人,進(jìn)行一個(gè)月的新組裝技

術(shù)培訓(xùn)后,和過(guò)去的組裝方法作了比較。其資料見(jiàn)表

8-3(?=0.05)o

(表8-3)兩種組裝方法的生產(chǎn)量(臺(tái))

生產(chǎn)工人123456789101112131415

舊組裝方法342829452627241515272331203520

新組裝方法33365041374139212037211829

①提出原假設(shè)。

②兩種組裝方法的生產(chǎn)量差異變量(X,-匕),是

否服從正態(tài)分布。

③試求。的平均數(shù)和標(biāo)準(zhǔn)差。

④試求檢驗(yàn)統(tǒng)計(jì)量及P-值,并解釋其結(jié)果。

解:對(duì)新的變量。的正態(tài)分布分析,提出原假設(shè)及替換

假設(shè)。

"o:。服從正態(tài)分布〃|:。不服從正態(tài)分布。

□SASPROGRAM

DATAexampl13;

INPUTXY

D=X-Y;

CARDS;

34332836295045412637274124391521

1520273723213118202935382027

RUN;

PROCUNIVARIATENORMAL;一計(jì)算檢驗(yàn)統(tǒng)計(jì)量p-值,并分

析D的分布是否服從正態(tài)分布

VARD;一打印出變量D的描述性統(tǒng)計(jì)量,而且可計(jì)

算對(duì)樣本的t檢驗(yàn)統(tǒng)計(jì)量。

RUN;

口運(yùn)行結(jié)果及解釋:

UnivariateProcedure

Variable=D

Moments

Quantiles(Def=5)

N15SumWgts15100%Max

1399%13

Mean-5.93333Sum-8975%Q3

195%13

StdDev8.489209Variance72.0666750%Med

-790%4

Skewness0.498342Kurtosis0.6349125%QI

-1110%-15

USS1537CSS1008.9330%Min

-215%-21

CV-143.077StdMean2.191904

1%-21

T:Mean=0-2.70693Pr>|T|0.0170

Range34

Num'=015Num>04Q3-Q1

12

M(Sign)-3.5Pr>=|M|0.1185Mode

-21

SgnRank-41Pr>=|S|0.0181

W:Normal0.978148Pr<W0.9275

□運(yùn)行結(jié)果的解釋

從計(jì)算結(jié)果中可知,正態(tài)分布檢驗(yàn)統(tǒng)計(jì)量為

W=0.9275,其p值=0.978148o比顯著性水準(zhǔn)a=0.05

大得多,因此接受原假設(shè)。即新的變量D服從正態(tài)分

布,可以對(duì)對(duì)應(yīng)樣本進(jìn)行「檢定。對(duì)對(duì)應(yīng)樣本,提出

原假設(shè)及替換假設(shè)。

Ho:ux=uy(或D=0),H1:ux<uy(或D<0)

過(guò)去的組裝方法(X)和新的組裝方法(Y)的差異

變量D=X-Y的平均數(shù)為Mean=-5.93333,標(biāo)準(zhǔn)差為Std

Dev=8.489209o所以新組裝方法的生產(chǎn)量比過(guò)去的生

產(chǎn)量大。對(duì)應(yīng)樣本的檢驗(yàn)統(tǒng)計(jì)量7*=-2.707,其,值

=0.0170。因本題是單側(cè)(右側(cè))檢驗(yàn),故P/2=0.0085o

這比顯著性水準(zhǔn)a=0.05小得多,因此原假設(shè)被拒絕,

接受替換假設(shè),即引進(jìn)新的組裝方法,其生產(chǎn)量將有

顯著的提高。

8.6.3兩個(gè)總體平均差檢驗(yàn)

在許多情況下,人們需要比較兩個(gè)

總體參數(shù),看它們是否有顯著的區(qū)別。

平均差”檢驗(yàn)就是分析兩個(gè)不同總體

平均數(shù)之間的差異。例如,檢驗(yàn)兩種家

電產(chǎn)品的平均壽命差,用兩種方法所生

產(chǎn)出來(lái)的某種產(chǎn)品的平均耐磨強(qiáng)度的

差異,同一種教學(xué)方法在不同的年級(jí)或

不同內(nèi)容的課程中是否有不同的效果

等。對(duì)此,我們可利用平均差的”檢驗(yàn)

尋找答案。

如果無(wú)法直接得到總體平均數(shù)差

的數(shù)據(jù)時(shí),可以根據(jù)樣本數(shù)據(jù)來(lái)估計(jì)。

為了檢驗(yàn)兩個(gè)不同總體平均數(shù)之間的

差異,首先要檢驗(yàn)兩個(gè)總體的方差是否

相等。若兩個(gè)總體的方差相等,可直接

對(duì)其兩個(gè)樣本進(jìn)行”檢驗(yàn)。如果兩個(gè)總

體的方差不相等,要作Satterthwaite

Testo進(jìn)行平均差”檢驗(yàn)的步驟如下:

①資料:設(shè)有兩個(gè)樣本容量分別為

nx,叼的兩組隨機(jī)變量X1,X2,…,X”,

匕名,…,工兩個(gè)樣本的平均數(shù)和標(biāo)準(zhǔn)差

分別為H、9、Sx、Sy其兩個(gè)樣本的合

標(biāo)準(zhǔn)差為

_?T)"+(%T)s;

3-X(y1)+(4一1)…

(8-21)

②假定:假設(shè)兩個(gè)樣本都是從服從正

態(tài)分布的總體中隨機(jī)抽取的“,并且兩

個(gè)總體方差相等。肩二CT;

③提出原假設(shè)和替換假設(shè):

H0:"x=4yH1?〃x。"Y

④確定檢驗(yàn)統(tǒng)計(jì)量:

%一y

SpJl/%+1/%,…(8-22)

若接受原假設(shè),則檢驗(yàn)統(tǒng)計(jì)量的分布

19)當(dāng)某總體服從正態(tài)分布時(shí),其樣本的平均數(shù)也服從正態(tài)分布。

服從自由度為OX+〃L2)的"分布。

在顯著性水準(zhǔn)戊條件下,對(duì)不同的替換

假設(shè),有不同的統(tǒng)計(jì)決策。

⑤檢驗(yàn)統(tǒng)計(jì)決策:

Hi>Ay如果7*>L+.,_2,則原假

設(shè)名被拒絕(右單側(cè)檢驗(yàn))。

Hl:4Ov如果r*〈-九+"廠2,則原假

設(shè)”。被拒絕(左單側(cè)檢驗(yàn))。

H、:4W%如果|廠|>%+『,則原假

設(shè)名被拒絕(雙側(cè)檢驗(yàn))。

⑥〃-值及檢驗(yàn)統(tǒng)計(jì)決策:〃-值是檢驗(yàn)

資料和原假設(shè)之間一致性程度的尺度。

P-值可根據(jù)邏輯對(duì)立假設(shè)計(jì)算。

P=P(兀+“廠2>r)

P—P(乙+"一2<7*)

P=P(W2>|r|)

如果P-值>a,則原假設(shè)"。被接受;

如果P-值<1,則原假設(shè)名被拒絕。

如果兩個(gè)總體的方差不相等(城7或),

則需要作SatterthwaiteTest,

其檢驗(yàn)統(tǒng)計(jì)量為

T*無(wú)一歹

1=I=

(8-23)

若接受原假設(shè),則檢驗(yàn)統(tǒng)計(jì)量的分

布服從自由度為了的'分布,自由度/

可由Satterthwaite的自由度近似計(jì)

算公式算出。

f=({/4+1/%)2

(―-.T+($/")及T)

(8-24)

因此,對(duì)兩個(gè)方差不相等的總體,

按以上的方法計(jì)算檢驗(yàn)統(tǒng)計(jì)量P-值時(shí),

以自由度一代替自由度〃x+勺-2就可

以了。

8.6.4PROCTTEST

TTEST程序旨在對(duì)SAS文件中的兩

個(gè)平均數(shù)執(zhí)行t檢定。適用于兩個(gè)獨(dú)立

的樣本的t檢驗(yàn)。

PROCTTEST含四道指令,一般格式

如下:

PROCTTESTOPTION;

CLASS變量;

VAR變量;

BY變量;

1)class變量;

用class語(yǔ)句識(shí)別分析變量所屬的

類別,因此class語(yǔ)句后指定的變量只

可有兩個(gè)值,如果此變量的值是文字型

的,則長(zhǎng)度不能超過(guò)十六個(gè)字母。

2)var變量;

指明對(duì)哪些變量的平均數(shù)進(jìn)行t檢

定。若省略此指令,貝!Jsas對(duì)文件內(nèi)所

有數(shù)值變量(class指定的除外)執(zhí)行

t檢定。

3)by變量;

此指令按照所列舉的變量把文件

分成幾個(gè)小的文件,然后對(duì)每一個(gè)小的

文件執(zhí)行t檢定。當(dāng)選用此指令時(shí),文

件內(nèi)的數(shù)據(jù)必須先按照by后指定的變

量的值由大到小重新排列,可借助proc

sort來(lái)完成。

例8-13:某公司根據(jù)個(gè)人的業(yè)績(jī)及業(yè)務(wù)能力,發(fā)給職

工特別獎(jiǎng)金。為了分析在相同的業(yè)績(jī)及業(yè)務(wù)能力組中,

男職工和女職工的獎(jiǎng)金是否有顯著的差別,隨機(jī)抽出

18名男職工和15名女職工作了調(diào)查。其調(diào)查資料如表

8-4o特別獎(jiǎng)金是按一年總工資額的百分?jǐn)?shù)來(lái)表示,顯

著性水平是a=0.05O

①提出原假設(shè)和替換假設(shè)。

②試計(jì)算男女職工的描述性統(tǒng)計(jì)量。

③試檢驗(yàn)兩個(gè)總體(男女)的方差是否相等。

④試檢驗(yàn)發(fā)給男職工和女職工的特別獎(jiǎng)金額,是否

有顯著的差異。

(表8-4))男女特別獎(jiǎng)金資料

性特別獎(jiǎng)金(%)

女9.27.711.96.29.08.46.97.67.48.09.96.78.49.39.1.~7

(X)

10.48.911.712.08.79.49.89.09.29.79.18.87.99.910.09.310.412.0

(Y)

□SASPROGRAM

DATAexampl3;

INPUTXY@@;一①3名女職工的獎(jiǎng)金將出現(xiàn)空白(missing

value),用點(diǎn)'來(lái)表示。

CARDS;

溫馨提示

  • 1. 本站所有資源如無(wú)特殊說(shuō)明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請(qǐng)下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請(qǐng)聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁(yè)內(nèi)容里面會(huì)有圖紙預(yù)覽,若沒(méi)有圖紙預(yù)覽就沒(méi)有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫(kù)網(wǎng)僅提供信息存儲(chǔ)空間,僅對(duì)用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對(duì)用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對(duì)任何下載內(nèi)容負(fù)責(zé)。
  • 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請(qǐng)與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶因使用這些下載資源對(duì)自己和他人造成任何形式的傷害或損失。

最新文檔

評(píng)論

0/150

提交評(píng)論