第5章假設(shè)檢驗(yàn)(講稿)_第1頁
第5章假設(shè)檢驗(yàn)(講稿)_第2頁
第5章假設(shè)檢驗(yàn)(講稿)_第3頁
第5章假設(shè)檢驗(yàn)(講稿)_第4頁
第5章假設(shè)檢驗(yàn)(講稿)_第5頁
已閱讀5頁,還剩136頁未讀, 繼續(xù)免費(fèi)閱讀

下載本文檔

版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請(qǐng)進(jìn)行舉報(bào)或認(rèn)領(lǐng)

文檔簡介

STATISTICS統(tǒng)計(jì)學(xué)統(tǒng)計(jì)學(xué)原理統(tǒng)計(jì)學(xué)原理統(tǒng)計(jì)學(xué)原理第五章假設(shè)檢驗(yàn)(HypothesisTesting)推斷統(tǒng)計(jì)推斷統(tǒng)計(jì):研究如何利用樣本數(shù)據(jù)來推斷總體特征的統(tǒng)計(jì)方法內(nèi)容參數(shù)估計(jì)假設(shè)檢驗(yàn)(本章)相同之處都是利用樣本信息對(duì)總體特征進(jìn)行某種推斷4.不同之處推斷的角度不同總體樣本開篇案例--正常人的平均體溫是37oC嗎?

開篇案例--正常人的平均體溫是37oC嗎?

根據(jù)樣本數(shù)據(jù)計(jì)算的平均值是x=36.8oC,標(biāo)準(zhǔn)差為s=0.36oC根據(jù)參數(shù)估計(jì)方法得到的健康成年人平均體溫的95%的置信區(qū)間為(36.7,36.9)。研究人員發(fā)現(xiàn)這個(gè)區(qū)間內(nèi)并沒有包括37oC因此提出“不應(yīng)該再把37oC作為正常人體溫的一個(gè)有任何特定意義的概念”我們應(yīng)該放棄“正常人的平均體溫是37oC”這個(gè)共識(shí)嗎?本章的內(nèi)容就將提供一套標(biāo)準(zhǔn)統(tǒng)計(jì)程序來檢驗(yàn)這樣的觀點(diǎn)本章主要內(nèi)容一、假設(shè)檢驗(yàn)的基本原理二、總體均值的檢驗(yàn)三、總體比例的檢驗(yàn)四、假設(shè)檢驗(yàn)的其它問題學(xué)習(xí)目標(biāo)與要求理解假設(shè)檢驗(yàn)的基本原理掌握假設(shè)檢驗(yàn)的步驟掌握總體均值的檢驗(yàn)掌握總體比例的檢驗(yàn)一、假設(shè)檢驗(yàn)的基本原理1、假設(shè)檢驗(yàn)問題的提出---引例2、假設(shè)檢驗(yàn)的基本思想3、假設(shè)檢驗(yàn)的幾個(gè)基本概念4、假設(shè)檢驗(yàn)的臨界值方法及其工作步驟5、假設(shè)檢驗(yàn)的p值方法及其工作步驟6、假設(shè)檢驗(yàn)中的兩類錯(cuò)誤(決策風(fēng)險(xiǎn))1、假設(shè)檢驗(yàn)問題的提出---引例假如你口渴了,到超市買了一瓶某公司生產(chǎn)的飲料,迫不急待一飲而盡,還渴!怎么一瓶這么少?仔細(xì)一看,飲料瓶的標(biāo)簽上標(biāo)明容量為250毫升,標(biāo)準(zhǔn)差為4毫升。有這么多嗎?俗話說,無商不奸。不行,我要親自調(diào)查一下,看一看廠商是不是有欺騙行為。趕快動(dòng)手,從市場上隨機(jī)抽取50瓶,一瓶一瓶檢測(cè),發(fā)現(xiàn)其平均含量為248毫升。這50瓶的平均含量確實(shí)不到250毫升。那么,據(jù)此,到底可否斷定飲料廠商欺騙了消費(fèi)者?1、假設(shè)檢驗(yàn)問題的提出---引例對(duì)出現(xiàn)上述樣本平均含量低于廠商聲稱的平均含量的情況,分析原因,不外乎有兩種:一是可能由飲料廠商短斤少兩引起的,即飲料廠商存在欺詐行為。二是可能由抽樣誤差引起的,廠商沒有缺斤少兩。因?yàn)槌闃泳哂须S機(jī)性和波動(dòng)性,即使廠商沒有短斤少兩,樣本均值也可能低于總體參數(shù)值。那么,怎么確定到底是哪一種情況了?1、假設(shè)檢驗(yàn)問題的提出---引例那么,我們不妨先假設(shè)廠商未欺詐(做無罪假設(shè)),即假設(shè)每瓶飲料含量≥250毫升。然后通過抽樣去尋找是否與當(dāng)前假設(shè)相悖的證據(jù)。由抽樣分布理論可知,若該假設(shè)成立,又是大樣本抽樣,因此樣本均值(抽取50瓶飲料的平均含量)的抽樣分布服從均值(數(shù)學(xué)期望)為μ(總體均值),標(biāo)準(zhǔn)差為的正態(tài)分布。1、假設(shè)檢驗(yàn)問題的提出---引例若μ≥250ml為真,大樣本抽樣,樣本均值的抽樣分布250X248在這種情況下,抽到均值為248的樣本的概率是多大呢?如何認(rèn)識(shí)這個(gè)小概率事件?也就是說,如果廠商未欺詐,即μ≥250ml為真,那么抽到均值為248的樣本的概率為0.0002。1、假設(shè)檢驗(yàn)問題的提出---引例0.0002這個(gè)數(shù)字意味著,假若我們反復(fù)抽取n=50的樣本,在10000次的反復(fù)抽樣中才有可能出現(xiàn)2次使樣本均值等于或小于248毫升的樣本。如此小概率的事件,在一次抽樣中竟然發(fā)生了?你會(huì)怎么看待這個(gè)問題?能否斷定飲料廠商欺騙了消費(fèi)者?是看做廠商未欺騙,僅僅是由抽樣的隨機(jī)性引起的呢?還是認(rèn)為廠商有欺騙行為,恐怕不是由抽樣的隨機(jī)性引起的?如何決策?運(yùn)用假設(shè)檢驗(yàn)的方法來進(jìn)行決策。1、假設(shè)檢驗(yàn)問題的提出---引例問題:某種大量生產(chǎn)的袋裝食品,按規(guī)定每袋重量不得少于250g。今從一批該種食品中任意抽取50袋,發(fā)現(xiàn)有6袋低于250g。若規(guī)定不符合標(biāo)準(zhǔn)的比例達(dá)到5%,食品就不得出廠,問該批食品能否出廠。問題:某飛機(jī)制造廠經(jīng)理擬購一批共計(jì)10000張的鋁板,規(guī)定厚度為0.04寸(厚度過大將增加機(jī)身重量,過薄則影響應(yīng)有的強(qiáng)度)。經(jīng)檢測(cè)100張鋁板,其平均厚度為0.0408寸。這樣,經(jīng)理就面臨著是否相信該批鋁板的平均厚度與0.04寸無異的問題,從而面臨接收或拒收這批鋁板的兩種對(duì)立行動(dòng)的抉擇。1、假設(shè)檢驗(yàn)問題的提出---引例問題:某企業(yè)生產(chǎn)一種零件,以往的資料顯示零件平均長度為4cm,標(biāo)準(zhǔn)差為0.1cm。工藝改革后,抽查100個(gè)零件發(fā)現(xiàn)其平均長度為3.94cm。問:工藝改革后零件長度是否發(fā)生了顯著變化?問題:某廠有一日共生產(chǎn)了200件產(chǎn)品,按國家標(biāo)準(zhǔn),次品率不得超過3%才能出廠?,F(xiàn)從該批產(chǎn)品中隨機(jī)抽取10件,發(fā)現(xiàn)其中有2件次品,問這批產(chǎn)品能否出廠。問題:正常人的平均體溫是37oC嗎?(教材案例)2、假設(shè)檢驗(yàn)的基本思想假設(shè)檢驗(yàn)的基本思想可以用小概率原理來解釋。小概率原理:一個(gè)事件如果發(fā)生的概率很小的話,那么它在一次試驗(yàn)中是幾乎不可能發(fā)生的,但在多次重復(fù)試驗(yàn)中幾乎是必然發(fā)生的。那么,概率小到多少的事件為小概率事件?這個(gè)概率是在假設(shè)檢驗(yàn)之前由人們事先主觀選定的,用α表示。α究竟取多大為宜,應(yīng)視具體情況而定,通常取0.05、0.01或0.10。只要是小于或等于α的事件,稱為小概率事件。2、假設(shè)檢驗(yàn)的基本思想看前例:如果廠商未欺詐,即飲料平均含量μ≥250ml為真,那么抽到均值為248的樣本的概率為0.0002。如此小概率的事件,在一次抽樣中竟然發(fā)生了?你會(huì)怎么看待這個(gè)問題?能否斷定飲料廠商欺騙了消費(fèi)者?是看做廠商未欺騙,僅僅是由抽樣的隨機(jī)性引起的呢?還是認(rèn)為廠商有欺騙行為,恐怕不是由抽樣的隨機(jī)性引起的?根據(jù)小概率原理,在假設(shè)為真,即認(rèn)為廠商未欺騙時(shí),純粹由于抽樣隨機(jī)性而在一次抽樣中“抽到均值為248的樣本”這個(gè)事件幾乎不發(fā)生,其發(fā)生的話,我們寧愿相信后者,即廠商欺騙了消費(fèi)者。(這個(gè)決策有風(fēng)險(xiǎn)嗎?)2、假設(shè)檢驗(yàn)的基本思想這個(gè)決策是有風(fēng)險(xiǎn)的?也就是說可能會(huì)犯錯(cuò)誤?因?yàn)?,?dāng)假設(shè)為真,即廠商未欺騙時(shí),由于抽樣的隨機(jī)性,盡管概率很小,也有可能抽到均值為248的樣本,但是,實(shí)際處理時(shí),根據(jù)小概率原理,我們不這樣認(rèn)為,而是認(rèn)為廠商有欺騙行為。這樣的話,我們?cè)谧觥皬S商有欺騙行為”這個(gè)決策時(shí),就把“廠商未欺騙時(shí),由于抽樣的隨機(jī)性,也有可能抽到均值為248的樣本?!边@樣的情況拒絕了。(棄真錯(cuò)誤)(犯這種錯(cuò)誤的概率是多少呢?)2、假設(shè)檢驗(yàn)的基本思想上述決策過程實(shí)際上就是一個(gè)假設(shè)檢驗(yàn)過程,它相當(dāng)于一個(gè)帶有概率性質(zhì)的反證法。再一例:有一廠家生產(chǎn)了10000只燈泡,并聲稱該批燈泡的次品率為萬分之一,這批燈泡準(zhǔn)備賣給某一商場,可商場從這批燈泡中任抽一只發(fā)覺是壞的,于是拒絕買下這批貨物。商場拒買的理由是什么呢?2、假設(shè)檢驗(yàn)的基本思想商場拒買的理由是:假設(shè)這批燈泡是好的(次品率為萬分之一),那么“任抽一只是壞的”這樣的隨機(jī)事件發(fā)生的概率應(yīng)是萬分之一,這樣小的概率在一次抽樣中幾乎不可能發(fā)生,而今任抽一只是壞的,這樣的事件居然發(fā)生了,于是拒絕接受“該批燈泡次品率為萬分之一”的假設(shè)(次品率可能很高),于是堅(jiān)決拒買。或許有人要問,如果廠家的這批燈泡的次品率確實(shí)是萬分之一,而恰好抽取的是那僅有的一只壞燈泡呢?3、假設(shè)檢驗(yàn)的幾個(gè)基本概念(1)什么是假設(shè)檢驗(yàn)(2)什么是假設(shè)、原假設(shè)與備擇假設(shè)(3)什么是檢驗(yàn)統(tǒng)計(jì)量(4)什么是顯著性水平(1)什么是假設(shè)檢驗(yàn)所謂假設(shè)檢驗(yàn),就是事先對(duì)總體參數(shù)或總體分布形式提出某種假設(shè),然后利用樣本信息判斷假設(shè)是否成立。假設(shè)檢驗(yàn)分類①對(duì)總體參數(shù)(均值、比例、方差等)所作的假設(shè)進(jìn)行檢驗(yàn)稱為參數(shù)假設(shè)檢驗(yàn),簡稱參數(shù)檢驗(yàn);②對(duì)總體分布形式的假設(shè)進(jìn)行檢驗(yàn)一般稱為非參數(shù)檢驗(yàn)或自由分布檢驗(yàn)。我們只討論總體參數(shù)的假設(shè)檢驗(yàn),即參數(shù)檢驗(yàn)。(2)什么是假設(shè)、原假設(shè)與備擇假設(shè)假設(shè):對(duì)總體參數(shù)的數(shù)值所作的某種陳述。假設(shè)檢驗(yàn)的首要工作就是從關(guān)于某一總體參數(shù)的理論、主張或斷言開始的。假設(shè)檢驗(yàn)中的假設(shè)必須同時(shí)給出兩種陳述:一個(gè)是原假設(shè)(nullhypothesis),也叫零假設(shè),一般用H0表示;一個(gè)是備擇假設(shè)(alternativehypothesis),也叫研究假設(shè)、備選假設(shè),一般用H1表示。(2)什么是假設(shè)、原假設(shè)與備擇假設(shè)一般而言,原假設(shè)H0總是表示現(xiàn)狀或無差別,同時(shí)也是研究者想收集證據(jù)予以反對(duì)的假設(shè)。備擇假設(shè)H1是當(dāng)原假設(shè)不成立時(shí)供選擇的假設(shè),是研究者想收集證據(jù)予以支持的假設(shè)。二者是一個(gè)完備事件組,而且相互對(duì)立,確定一個(gè)另外一個(gè)就出來了,通??梢韵却_定備擇假設(shè)。P147(2)什么是假設(shè)、原假設(shè)與備擇假設(shè)【例5.1】一種零件的生產(chǎn)標(biāo)準(zhǔn)是直徑應(yīng)為10cm,為對(duì)生產(chǎn)過程進(jìn)行控制,質(zhì)量監(jiān)測(cè)人員定期對(duì)一臺(tái)加工機(jī)床檢查,確定這臺(tái)機(jī)床生產(chǎn)的零件是否符合標(biāo)準(zhǔn)要求。如果零件的平均直徑大于或小于10cm,則表明生產(chǎn)過程不正常,必須進(jìn)行調(diào)整。試陳述用來檢驗(yàn)生產(chǎn)過程是否正常的原假設(shè)和被擇假設(shè)P146解:研究者想收集證據(jù)予以證明的假設(shè)應(yīng)該是“生產(chǎn)過程不正?!薄=⒌脑僭O(shè)和備擇假設(shè)為

H0:

10cmH1:

10cm(2)什么是假設(shè)、原假設(shè)與備擇假設(shè)【例5.2】某品牌洗滌劑在它的產(chǎn)品說明書中聲稱:平均凈含量不少于500克。從消費(fèi)者的利益出發(fā),有關(guān)研究人員要通過抽檢其中的一批產(chǎn)品來驗(yàn)證該產(chǎn)品制造商的說明是否屬實(shí)。試陳述用于檢驗(yàn)的原假設(shè)與備擇假設(shè)。解:研究者抽檢的意圖是傾向于證實(shí)這種洗滌劑的平均凈含量并不符合說明書中的陳述。建立的原假設(shè)和備擇假設(shè)為

H0:

500H1:

<500(2)什么是假設(shè)、原假設(shè)與備擇假設(shè)【例5.3】一家研究機(jī)構(gòu)估計(jì),某城市中家庭擁有汽車的比例超過30%。為驗(yàn)證這一估計(jì)是否正確,該研究機(jī)構(gòu)隨機(jī)抽取了一個(gè)樣本進(jìn)行檢驗(yàn)。試陳述用于檢驗(yàn)的原假設(shè)與備擇假設(shè)解:研究者想收集證據(jù)予以支持的假設(shè)是“該城市中家庭擁有汽車的比例超過30%”。建立的原假設(shè)和備擇假設(shè)為

H0:

30%H1:

30%(2)什么是假設(shè)、原假設(shè)與備擇假設(shè)需要注意的是:原假設(shè)表達(dá)式中總是包含,或。這樣才便于在原假設(shè)成立的假定下討論檢驗(yàn)統(tǒng)計(jì)量的分布。慣例是只寫“=”。雖然依據(jù)前述定義,通常就能確定兩個(gè)假設(shè)的內(nèi)容,但是假設(shè)的確定本質(zhì)上帶有一定的主觀色彩,由于研究者的目的不同,對(duì)同一個(gè)問題有可能會(huì)提出截然相反的原假設(shè)和備擇假設(shè)。在一些應(yīng)用中,如何建立原假設(shè)和備擇假設(shè)并不是顯而易見的。需謹(jǐn)慎應(yīng)對(duì)并加強(qiáng)訓(xùn)練。(2)什么是假設(shè)、原假設(shè)與備擇假設(shè)假設(shè)檢驗(yàn)的目的主要是搜集證據(jù)拒絕原假設(shè)。原假設(shè)最初被假設(shè)是成立的,之后就是要根據(jù)樣本數(shù)據(jù),確定是否有足夠的不符合原假設(shè)的證據(jù)以拒絕原假設(shè)。定罪問題:被告人在審判前被認(rèn)為是無罪的(原假設(shè)被認(rèn)為是真),審判中需要提供證據(jù)。如果有足夠的證據(jù)與原假設(shè)(被告無罪)不符,則拒絕原假設(shè)(被告被認(rèn)為有罪)。如果沒有足夠的證據(jù)證明被告有罪,就不能認(rèn)定被告有罪(不拒絕原假設(shè))。但這里也沒有證明被告就是清白的。(2)什么是假設(shè)、原假設(shè)與備擇假設(shè)假設(shè)檢驗(yàn)得出的統(tǒng)計(jì)結(jié)論都是根據(jù)原假設(shè)進(jìn)行闡述的。我們要么拒絕原假設(shè),要么不拒絕原假設(shè)。當(dāng)不能拒絕原假設(shè)時(shí),從來不說“接受原假設(shè)”,因?yàn)闆]有證明原假設(shè)是真的(如果采用接受原假設(shè)的說法,則意味著你證明了原假設(shè)是正確的)。原假設(shè)在開始進(jìn)行檢驗(yàn)時(shí)被認(rèn)定是真的,當(dāng)我們沒有足夠的證據(jù)拒絕原假設(shè)時(shí),并不等于證明原假設(shè)是真的,它僅僅意味著:我們沒有足夠的證據(jù)拒絕原假設(shè),因此不能拒絕原假設(shè)。但是,當(dāng)我們拒絕原假設(shè)時(shí),得出的結(jié)論是清楚的。(2)什么是假設(shè)、原假設(shè)與備擇假設(shè)另外,對(duì)原假設(shè)和備擇假設(shè)而言,原假設(shè)往往處于受保護(hù)地位,根據(jù)小概率原理,在一次試驗(yàn)中,要想推翻原假設(shè)(拒絕原假設(shè))是不容易發(fā)生的。因此,在確定假設(shè)時(shí),往往把需要保護(hù)、沒有充分理由不能輕易否定或者一經(jīng)否定會(huì)產(chǎn)生重大影響的命題作為原假設(shè)。(你可以對(duì)其懷疑,但沒有充分證據(jù)時(shí),不能輕易推翻,總是被假定正確)(2)什么是假設(shè)、原假設(shè)與備擇假設(shè)原假設(shè)和備擇假設(shè)的三種形式(分別對(duì)應(yīng)三種檢驗(yàn)形式):

(1)雙側(cè)檢驗(yàn):

H0:0;H1:0

(2)左側(cè)檢驗(yàn):

H0:0;H1:<0

H0:≥0;H1:<0

(3)右側(cè)檢驗(yàn):

H0:0;H1:>0

H0:≤0;H1:>0

右側(cè)檢驗(yàn)和左側(cè)檢驗(yàn)統(tǒng)稱為單側(cè)檢驗(yàn)。采用雙側(cè)檢驗(yàn)還是單側(cè)檢驗(yàn),應(yīng)視所研究的問題的性質(zhì)而定。

(2)什么是假設(shè)、原假設(shè)與備擇假設(shè)對(duì)某型汽車,在一定條件下,其燃油效能為每升最多30公里,現(xiàn)開發(fā)了一種新型燃料噴射器,通過行車實(shí)驗(yàn),想尋找證據(jù)來證明新的系統(tǒng)確實(shí)能提高每升油料的效能。一項(xiàng)研究表明,采用新技術(shù)生產(chǎn)后,將會(huì)使產(chǎn)品的使用壽命明顯延長到1500小時(shí)以上。檢驗(yàn)這一結(jié)論是否成立。continued(2)什么是假設(shè)、原假設(shè)與備擇假設(shè)某飛機(jī)制造廠經(jīng)理擬購一批共計(jì)10000張的鋁板,規(guī)定厚度為0.04寸(厚度過大將增加機(jī)身重量,過薄則影響應(yīng)有的強(qiáng)度)。經(jīng)檢測(cè)100張鋁板,其平均厚度為0.0408寸。這樣,經(jīng)理就面臨著是否相信該批鋁板的平均厚度與0.04寸無異的問題,從而面臨接收或拒收這批鋁板的兩種對(duì)立行動(dòng)的抉擇。(2)什么是假設(shè)、原假設(shè)與備擇假設(shè)一項(xiàng)研究表明,改進(jìn)生產(chǎn)工藝后,會(huì)使產(chǎn)品的廢品率降低到2%以下。檢驗(yàn)這一結(jié)論是否成立。某燈泡制造商聲稱,該企業(yè)所生產(chǎn)的燈泡的平均使用壽命在1000小時(shí)以上。如果你準(zhǔn)備進(jìn)一批貨,怎樣進(jìn)行檢驗(yàn)?(2)什么是假設(shè)、原假設(shè)與備擇假設(shè)某企業(yè)生產(chǎn)一種零件,以往的資料顯示零件平均長度為4cm,標(biāo)準(zhǔn)差為0.1cm。工藝改革后,抽查100個(gè)零件發(fā)現(xiàn)其平均長度為3.94cm。問:工藝改革后零件長度是否發(fā)生了顯著變化?某廠有一日共生產(chǎn)了200件產(chǎn)品,按國家標(biāo)準(zhǔn),次品率不得超過3%才能出廠?,F(xiàn)從該批產(chǎn)品中隨機(jī)抽取10件,發(fā)現(xiàn)其中有2件次品,問這批產(chǎn)品能否出廠。(3)什么是檢驗(yàn)統(tǒng)計(jì)量在參數(shù)的假設(shè)檢驗(yàn)中,如同在參數(shù)估計(jì)中一樣,要借助于樣本統(tǒng)計(jì)量進(jìn)行統(tǒng)計(jì)推斷。用于假設(shè)檢驗(yàn)問題的樣本統(tǒng)計(jì)量稱為檢驗(yàn)統(tǒng)計(jì)量。若μ≥250ml成立,大樣本抽樣,樣本均值的抽樣分布250X2482、假設(shè)檢驗(yàn)的基本思想2500ZX248一般來說,檢驗(yàn)統(tǒng)計(jì)量是樣本統(tǒng)計(jì)量的標(biāo)準(zhǔn)化形式。(3)什么是檢驗(yàn)統(tǒng)計(jì)量檢驗(yàn)統(tǒng)計(jì)量的基本形式有Z統(tǒng)計(jì)量和t統(tǒng)計(jì)量。(3)什么是檢驗(yàn)統(tǒng)計(jì)量在具體問題里,選擇什么統(tǒng)計(jì)量作為檢驗(yàn)統(tǒng)計(jì)量,需要考慮的因素與參數(shù)估計(jì)相同。例如,用于進(jìn)行檢驗(yàn)的樣本是大樣本還是小樣本,總體方差已知還是未知,等等。在不同的條件下應(yīng)選擇不同的檢驗(yàn)統(tǒng)計(jì)量,然后計(jì)算檢驗(yàn)統(tǒng)計(jì)量的值。并通過這個(gè)值進(jìn)行檢驗(yàn)判斷。(4)什么是顯著性水平從假設(shè)檢驗(yàn)所應(yīng)用的小概率定理看,顯著性水平就是研究者事先給定的一個(gè)小概率事件的概率。在原假設(shè)為真時(shí),做實(shí)際抽樣,通過檢驗(yàn)統(tǒng)計(jì)量的值來確定該次抽樣的結(jié)果在不在這個(gè)小概率范圍內(nèi),在的話,就拒絕原假設(shè),但這種判定是有風(fēng)險(xiǎn)的,有可能會(huì)犯錯(cuò)誤,因?yàn)樾「怕适录皇墙^對(duì)不可能出現(xiàn),而是出現(xiàn)的可能性很小,這個(gè)可能性就是我們已經(jīng)給定的小概率。也就是說,小概率事件發(fā)生時(shí),原假設(shè)也能為真,但我們都給拒絕了,這樣的話,勢(shì)必就會(huì)犯錯(cuò)誤,犯錯(cuò)誤的概率就等于事先設(shè)定的小概率。(4)什么是顯著性水平因此,顯著性水平就是指當(dāng)原假設(shè)為真時(shí)人們卻把它拒絕了的概率或風(fēng)險(xiǎn)。表示為,常用的值有0.01,0.05,0.10。的選擇與決策者的風(fēng)險(xiǎn)偏好有關(guān)。一般由研究者事先確定4、假設(shè)檢驗(yàn)的臨界值方法及其工作步驟所謂臨界值方法,就是根據(jù)檢驗(yàn)統(tǒng)計(jì)量的分布形式,找出顯著性水平α對(duì)應(yīng)的臨界值,然后計(jì)算檢驗(yàn)統(tǒng)計(jì)量之值,最后把二者之值相比較來判斷是否拒絕原假設(shè)??辞懊胬樱杭偃缒称放骑嬃掀康臉?biāo)簽上標(biāo)明的容量為250毫升,標(biāo)準(zhǔn)差為4毫升。(廠商聲稱是這么樣的)如果你從市場上隨機(jī)抽取50瓶,發(fā)現(xiàn)其平均含量為248毫升。據(jù)此,可否斷定飲料廠商欺騙了消費(fèi)者?(顯著性水平α=0.01)。(用臨界值法進(jìn)行規(guī)范的假設(shè)檢驗(yàn)分析)4、假設(shè)檢驗(yàn)的臨界值方法及其工作步驟0Z250X248臨界值a=0.01-2.33檢驗(yàn)統(tǒng)計(jì)量的值-3.54拒絕域1-接受域4、假設(shè)檢驗(yàn)的臨界值方法及其工作步驟從圖形上看,運(yùn)用這種方法時(shí),也就是臨界值把檢驗(yàn)統(tǒng)計(jì)量的概率分布區(qū)域分成了兩部分:不超過臨界值的區(qū)域(大概率區(qū)域)和超過臨界值的區(qū)域(小概率區(qū)域)。把不超過臨界值的區(qū)域稱為接受域,把超過臨界值的區(qū)域(含臨界值點(diǎn))稱為拒絕域。臨界值:根據(jù)給定的顯著性水平確定的拒絕域的邊界值。拒絕域:能夠拒絕原假設(shè)的檢驗(yàn)統(tǒng)計(jì)量的所有可能取值的集合。(檢驗(yàn)統(tǒng)計(jì)量的值落在拒絕域即相當(dāng)于小概率事件發(fā)生了,從而拒絕原假設(shè)。)4、假設(shè)檢驗(yàn)的臨界值方法及其工作步驟檢驗(yàn)統(tǒng)計(jì)量的值的絕對(duì)值3.54大于臨界值的絕對(duì)值2.33,也就是說檢驗(yàn)統(tǒng)計(jì)量的值落入了拒絕域,小概率事件發(fā)生了,因此在0.01的顯著性水平上,拒絕原假設(shè),接受備擇假設(shè),也就是說有證據(jù)顯示飲料廠商欺騙了消費(fèi)者。4、假設(shè)檢驗(yàn)的臨界值方法及其工作步驟

雙側(cè)檢驗(yàn)時(shí)接受域與拒絕域示意圖原假設(shè)為真時(shí),檢驗(yàn)統(tǒng)計(jì)量的抽樣分布(假定為正態(tài)分布)0臨界值臨界值a/2a/2檢驗(yàn)統(tǒng)計(jì)量Z拒絕域拒絕域1-接受域4、假設(shè)檢驗(yàn)的臨界值方法及其工作步驟左側(cè)檢驗(yàn)時(shí)接受域與拒絕域示意圖0臨界值檢驗(yàn)統(tǒng)計(jì)量Z拒絕域1-接受域a顯著性水平原假設(shè)為真時(shí),檢驗(yàn)統(tǒng)計(jì)量的抽樣分布(假定為正態(tài)分布)4、假設(shè)檢驗(yàn)的臨界值方法及其工作步驟右側(cè)檢驗(yàn)時(shí)接受域與拒絕域示意圖H0值臨界值a顯著性水平檢驗(yàn)統(tǒng)計(jì)量Z拒絕域1-接受域原假設(shè)為真時(shí),檢驗(yàn)統(tǒng)計(jì)量的抽樣分布(假定為正態(tài)分布)4、假設(shè)檢驗(yàn)的臨界值方法及其工作步驟臨界值方法下的檢驗(yàn)準(zhǔn)則(如何判斷檢驗(yàn)統(tǒng)計(jì)量的值是否落在了拒絕域):(一定要記牢)若檢驗(yàn)統(tǒng)計(jì)量之值的絕對(duì)值小于的絕對(duì)值,那么就不拒絕原假設(shè);即,若︱檢驗(yàn)統(tǒng)計(jì)量之值︱<︱臨界值︱,不拒絕原假設(shè)若檢驗(yàn)統(tǒng)計(jì)量之值的絕對(duì)值大于或等于臨界值的絕對(duì)值,那么就拒絕原假設(shè)。即︱檢驗(yàn)統(tǒng)計(jì)量之值︱≥︱臨界值︱,拒絕原假設(shè)4、假設(shè)檢驗(yàn)的臨界值方法及其工作步驟再看前面例子:假如某品牌飲料瓶的標(biāo)簽上標(biāo)明的容量為250毫升,標(biāo)準(zhǔn)差為4毫升。(廠商聲稱是這么樣的)如果你從市場上隨機(jī)抽取50瓶,發(fā)現(xiàn)其平均含量為248毫升。據(jù)此,可否斷定飲料廠商欺騙了消費(fèi)者?(顯著性水平α=0.01)。(寫出完整步驟)4、假設(shè)檢驗(yàn)的臨界值方法及其工作步驟解:(1)先寫出零假設(shè)和備擇假設(shè):

H0:μ≥250;H1:μ<250

(2)確定適當(dāng)?shù)臋z驗(yàn)統(tǒng)計(jì)量:在零假設(shè)為真時(shí),由于是大樣本抽樣,樣本均值服從正態(tài)分布,總體標(biāo)準(zhǔn)差σ已知,因此選定的檢驗(yàn)統(tǒng)計(jì)量為(3)規(guī)定顯著性水平并確定臨界值(區(qū)分拒絕域和接受域):α=0.01,由于是左側(cè)檢驗(yàn),臨界值為-2.33

(4)應(yīng)用樣本數(shù)據(jù)計(jì)算檢驗(yàn)統(tǒng)計(jì)量的值:4、假設(shè)檢驗(yàn)的臨界值方法及其工作步驟

(5)比較檢驗(yàn)統(tǒng)計(jì)量的值與臨界值的大小,也就是確定檢驗(yàn)統(tǒng)計(jì)量的值落入的區(qū)域并做出推斷與結(jié)論。檢驗(yàn)統(tǒng)計(jì)量的值的絕對(duì)值3.54大于臨界值的絕對(duì)值2.33,也就是說檢驗(yàn)統(tǒng)計(jì)量的值落入了拒絕域,小概率事件發(fā)生了,因此在0.01的顯著性水平上,拒絕原假設(shè),接受備擇假設(shè),也就是說有證據(jù)顯示飲料廠商欺騙了消費(fèi)者。4、假設(shè)檢驗(yàn)的臨界值方法及其工作步驟

圖形表示檢驗(yàn)統(tǒng)計(jì)量Z的分布0Z臨界值a=0.01-2.33檢驗(yàn)統(tǒng)計(jì)量的值-3.54拒絕域1-接受域4、假設(shè)檢驗(yàn)的臨界值方法及其工作步驟上述解題過程顯示了運(yùn)用臨界值方法時(shí),假設(shè)檢驗(yàn)的工作步驟。即,①提出原假設(shè)和備擇假設(shè)(關(guān)鍵步驟→涉及到是應(yīng)用雙側(cè)檢驗(yàn)還是單側(cè)檢驗(yàn))②確定適當(dāng)?shù)臋z驗(yàn)統(tǒng)計(jì)量(關(guān)鍵步驟→涉及到如何確定臨界值和檢驗(yàn)統(tǒng)計(jì)量的值)③規(guī)定顯著性水平并確定臨界值(第一個(gè)需要確定的值)(區(qū)分拒絕域和接受域)④應(yīng)用樣本數(shù)據(jù)計(jì)算檢驗(yàn)統(tǒng)計(jì)量的值(第二個(gè)需要確定的值)⑤比較檢驗(yàn)統(tǒng)計(jì)量的值與臨界值并作出推斷和結(jié)論。5、假設(shè)檢驗(yàn)的P值方法及其工作步驟P值檢驗(yàn)法是另一種進(jìn)行假設(shè)檢驗(yàn)的方法。基本原理與前一種方法一樣。看前面例子:假如某品牌飲料瓶的標(biāo)簽上標(biāo)明的容量為250毫升,標(biāo)準(zhǔn)差為4毫升。(廠商聲稱是這么樣的)如果你從市場上隨機(jī)抽取50瓶,發(fā)現(xiàn)其平均含量為248毫升。據(jù)此,可否斷定飲料廠商欺騙了消費(fèi)者?(顯著性水平α=0.01)。(用P值法進(jìn)行假設(shè)檢驗(yàn)分析)5、假設(shè)檢驗(yàn)的P值方法及其工作步驟0Za=0.01-2.33-3.54拒絕域1-接受域0Za=0.01-2.33-3.54拒絕域1-接受域P值=0.00025、假設(shè)檢驗(yàn)的P值方法及其工作步驟在P值法中,檢驗(yàn)的基本準(zhǔn)則是:(一定要牢記)如果P值≥給定的顯著性水平α,則不拒絕原假設(shè)。如果P值<給定的顯著性水平α,則拒絕零假設(shè)。P假設(shè)檢驗(yàn)的工作步驟:①提出原假設(shè)和備擇假設(shè)②確定適當(dāng)?shù)臋z驗(yàn)統(tǒng)計(jì)量③應(yīng)用樣本數(shù)據(jù)計(jì)算檢驗(yàn)統(tǒng)計(jì)量的值④計(jì)算P值⑤將P值與給定的顯著性水平α相比較,做出判斷。5、假設(shè)檢驗(yàn)的P值方法及其工作步驟解:(1)先寫出零假設(shè)和備擇假設(shè):

H0:μ≥250;H1:μ<250

(2)確定適當(dāng)?shù)臋z驗(yàn)統(tǒng)計(jì)量:在零假設(shè)為真時(shí),由于是大樣本抽樣,樣本均值服從正態(tài)分布,總體標(biāo)準(zhǔn)差σ已知,因此選定的檢驗(yàn)統(tǒng)計(jì)量為(3)應(yīng)用樣本數(shù)據(jù)計(jì)算檢驗(yàn)統(tǒng)計(jì)量的值:5、假設(shè)檢驗(yàn)的P值方法及其工作步驟

(5)將P值與給定的顯著性水平α相比較,做出判斷。由于0.0002<0.01,拒絕原假設(shè),接受備擇假設(shè),也就是說有證據(jù)顯示飲料廠商欺騙了消費(fèi)者。(4)應(yīng)用樣本數(shù)據(jù)計(jì)算檢驗(yàn)統(tǒng)計(jì)量的值5、假設(shè)檢驗(yàn)的P值方法及其工作步驟雙側(cè)檢驗(yàn)的P值原假設(shè)為真時(shí),檢驗(yàn)統(tǒng)計(jì)量的抽樣分布(假定為正態(tài)分布)/

2/

2Z拒絕域拒絕域0臨界值計(jì)算出的檢驗(yàn)統(tǒng)計(jì)量值計(jì)算出的檢驗(yàn)統(tǒng)計(jì)量值臨界值1/2P值1/2P值P值是當(dāng)原假設(shè)為真時(shí),檢驗(yàn)統(tǒng)計(jì)量大于或等于根據(jù)實(shí)際觀測(cè)樣本數(shù)據(jù)計(jì)算得到的檢驗(yàn)統(tǒng)計(jì)量值絕對(duì)值的概率的兩倍。5、假設(shè)檢驗(yàn)的P值方法及其工作步驟左側(cè)檢驗(yàn)的P值0臨界值az拒絕域1-計(jì)算出的檢驗(yàn)統(tǒng)計(jì)量值P值原假設(shè)為真時(shí),檢驗(yàn)統(tǒng)計(jì)量的抽樣分布(假定為正態(tài)分布)P值是當(dāng)原假設(shè)為真時(shí),檢驗(yàn)統(tǒng)計(jì)量小于或等于根據(jù)實(shí)際觀測(cè)樣本數(shù)據(jù)計(jì)算得到的檢驗(yàn)統(tǒng)計(jì)量值的概率。5、假設(shè)檢驗(yàn)的P值方法及其工作步驟左側(cè)檢驗(yàn)的P值0臨界值a拒絕域1-計(jì)算出的檢驗(yàn)統(tǒng)計(jì)量值P值Z原假設(shè)為真時(shí),檢驗(yàn)統(tǒng)計(jì)量的抽樣分布(假定為正態(tài)分布)P值是當(dāng)原假設(shè)為真時(shí),檢驗(yàn)統(tǒng)計(jì)量大于或等于根據(jù)實(shí)際觀測(cè)樣本數(shù)據(jù)計(jì)算得到的檢驗(yàn)統(tǒng)計(jì)量值的概率。5、假設(shè)檢驗(yàn)的P值方法及其工作步驟對(duì)P值法的進(jìn)一步理解:P值也稱為觀察到的顯著性水平,是實(shí)際算出來的顯著性水平。利用P值進(jìn)行檢驗(yàn)?zāi)芴峁└嗟男畔?。也可以直接使用P值進(jìn)行決策。P值法的決策準(zhǔn)則易記易用。但手工計(jì)算P比較麻煩。統(tǒng)計(jì)軟件在分析時(shí)會(huì)輸出P值。6、假設(shè)檢驗(yàn)中的兩類錯(cuò)誤(決策風(fēng)險(xiǎn))假設(shè)檢驗(yàn)是依據(jù)樣本提供的信息進(jìn)行判斷的,也就是由部分來推斷整體,因而假設(shè)檢驗(yàn)不可能絕對(duì)準(zhǔn)確,它也可能犯錯(cuò)誤。第一類錯(cuò)誤是原假設(shè)H0為真卻被我們拒絕了。犯第一類錯(cuò)誤的概率就是顯著性水平,用α表示。因此第一類錯(cuò)誤也稱α錯(cuò)誤或棄真錯(cuò)誤。第二類錯(cuò)誤是原假設(shè)H0為假卻被我們接受了。犯第II類錯(cuò)誤的概率常用表示。因此第二類錯(cuò)誤也稱錯(cuò)誤或取偽錯(cuò)誤。這兩類錯(cuò)誤可以從假設(shè)檢驗(yàn)所運(yùn)用的小概率原理去理解。6、假設(shè)檢驗(yàn)中的兩類錯(cuò)誤(決策風(fēng)險(xiǎn))假設(shè)檢驗(yàn)決策結(jié)果表決策實(shí)際情況H0為真H0為假?zèng)]有拒絕H0正確決策(1–a)第二類錯(cuò)誤(b)拒絕H0第一類錯(cuò)誤(a)正確決策(1-b)6、假設(shè)檢驗(yàn)中的兩類錯(cuò)誤(決策風(fēng)險(xiǎn))α和β的關(guān)系對(duì)于一定的樣本容量,你不能同時(shí)減少兩類錯(cuò)誤!和的關(guān)系就像翹翹板,小就大,大就小6、假設(shè)檢驗(yàn)中的兩類錯(cuò)誤(決策風(fēng)險(xiǎn))若要同時(shí)減少與,須增大樣本容量n。但樣本容量不可能沒有限制,否則就會(huì)使抽樣調(diào)查失去意義。因此,在假設(shè)檢驗(yàn)中,就有一個(gè)對(duì)兩類錯(cuò)誤進(jìn)行控制的問題。一般地說,哪一類錯(cuò)誤所帶來的后果越嚴(yán)重,危害越大,在假設(shè)檢驗(yàn)中就應(yīng)當(dāng)把哪一類錯(cuò)誤作為首要的控制目標(biāo)。6、假設(shè)檢驗(yàn)中的兩類錯(cuò)誤(決策風(fēng)險(xiǎn))但在假設(shè)檢驗(yàn)中,大家都在執(zhí)行這樣一個(gè)原則,即首先控制犯α錯(cuò)誤原則,也就是說,在控制犯第一類錯(cuò)誤的概率α的條件下,盡可能使犯第Ⅱ類錯(cuò)誤的概率β減小。在假設(shè)檢驗(yàn)實(shí)踐中,該原則的含義是,原假設(shè)要受到保護(hù),使它不致被輕易否定,若要否定原假設(shè),必須有充分的理由。這樣做的原因主要有兩點(diǎn),一是大家都遵循一個(gè)統(tǒng)一的原則,討論問題就比較方便。二是從實(shí)用的觀點(diǎn)看,原假設(shè)是什么常常是明確的,而備擇假設(shè)是什么則常常是模糊的。6、假設(shè)檢驗(yàn)中的兩類錯(cuò)誤(決策風(fēng)險(xiǎn))假設(shè)檢驗(yàn)中的兩類錯(cuò)誤也可以用法庭對(duì)被告進(jìn)行審判的過程來說明。由于法庭采用無罪推定的審判準(zhǔn)則,在證明被告有罪之前先假定他是無罪的,即原假設(shè):被告無罪;備擇假設(shè):被告有罪。法庭可能犯的第Ⅰ類錯(cuò)誤是:被告無罪但判他有罪,即冤枉了好人;第Ⅱ類錯(cuò)誤是:被告有罪但判他無罪,即放過了壞人。為了減少冤枉好人的概率α,應(yīng)盡可能接受原假設(shè),判被告無罪,而這有可能增大了放過壞人的概率;反過來,為了不放過壞人,減少放過壞人的概率β,相應(yīng)地就又增加了冤枉好人的可能性。當(dāng)然,這只是在一定的證據(jù)下的兩難選擇。如果進(jìn)一步收集有關(guān)的證據(jù),在充分的證據(jù)下,就有可能做到既不冤枉好人,又不放過壞人。實(shí)踐中,在現(xiàn)有證據(jù)不充分的情況下,法庭會(huì)如何控制這兩類錯(cuò)誤?(根據(jù)案件的性質(zhì))6、假設(shè)檢驗(yàn)中的兩類錯(cuò)誤(決策風(fēng)險(xiǎn))審判結(jié)果的幾種情況陪審團(tuán)審判裁決實(shí)際情況H0:無罪H1:有罪無罪正確錯(cuò)誤有罪錯(cuò)誤正確6、假設(shè)檢驗(yàn)中的兩類錯(cuò)誤(決策風(fēng)險(xiǎn))注意:如果樣本數(shù)據(jù)與原假設(shè)一致,則我們得出“不能拒絕H0”而不是“接受H0”的結(jié)論,因?yàn)榻邮蹾0會(huì)發(fā)生第二類錯(cuò)誤。二、總體均值的檢驗(yàn)二、總體均值的檢驗(yàn)主要涉及檢驗(yàn)統(tǒng)計(jì)量的確定,其它方面:如檢驗(yàn)形式(單側(cè)和雙側(cè))及檢驗(yàn)的工作步驟基本都是一樣的。主要根據(jù)樣本容量的大小、總體分布形態(tài)、總體σ是否已知來確定檢驗(yàn)統(tǒng)計(jì)量。檢驗(yàn)統(tǒng)計(jì)量:Z檢驗(yàn)統(tǒng)計(jì)量(1)大樣本,總體σ已知檢驗(yàn)統(tǒng)計(jì)量:Z檢驗(yàn)統(tǒng)計(jì)量(2)大樣本,總體σ未知式中:S為樣本標(biāo)準(zhǔn)差。二、總體均值的檢驗(yàn)該情況下也可以用t檢驗(yàn)統(tǒng)計(jì)量。檢驗(yàn)統(tǒng)計(jì)量:Z檢驗(yàn)統(tǒng)計(jì)量(3)正態(tài)總體,小樣本,總體σ已知檢驗(yàn)統(tǒng)計(jì)量:t檢驗(yàn)統(tǒng)計(jì)量(4)正態(tài)總體,小樣本,總體σ未知式中:S為樣本標(biāo)準(zhǔn)差。自由度為:n-1二、總體均值的檢驗(yàn)二、總體均值的檢驗(yàn)如果是小樣本且非正態(tài)總體,則沒有適當(dāng)?shù)臋z驗(yàn)統(tǒng)計(jì)量進(jìn)行假設(shè)檢驗(yàn),唯一的解決辦法是增大樣本,以使樣本均值趨向于正態(tài)分布,從而再采用Z檢驗(yàn)統(tǒng)計(jì)量。二、總體均值的檢驗(yàn)二、總體均值的檢驗(yàn)三種檢驗(yàn)形式:雙側(cè)檢驗(yàn)0a/2a/2Z或t拒絕域拒絕域1-接受域左側(cè)檢驗(yàn)0a

Z或t拒絕域1-接受域二、總體均值的檢驗(yàn)右側(cè)檢驗(yàn)0aZ或t拒絕域1-接受域二、總體均值的檢驗(yàn)假設(shè)雙側(cè)檢驗(yàn)左側(cè)檢驗(yàn)右側(cè)檢驗(yàn)假設(shè)形式H0

:m=m0H1:mm0H0:mm0H1:m<m0H0:m

m0H1:m>m0統(tǒng)計(jì)量

已知

未知拒絕域P值決策拒絕H0(大樣本檢驗(yàn)方法的總結(jié))二、總體均值的檢驗(yàn)(小樣本檢驗(yàn)方法的總結(jié))二、總體均值的檢驗(yàn)P158二、總體均值的檢驗(yàn)二、總體均值的檢驗(yàn)二、總體均值的檢驗(yàn)二、總體均值的檢驗(yàn)二、總體均值的檢驗(yàn)二、總體均值的檢驗(yàn)二、總體均值的檢驗(yàn)二、總體均值的檢驗(yàn)開篇案例:二、總體均值的檢驗(yàn)解:

①提出零假設(shè)和備擇假設(shè)

H0:μ=370C;H1:μ≠370C

②確定適當(dāng)?shù)臋z驗(yàn)統(tǒng)計(jì)量

③規(guī)定顯著性水平并確定臨界值(區(qū)分拒絕域和接受域)

α=0.05,雙側(cè)檢驗(yàn),α/2=0.025,臨界值Zα/2=±1.96

④應(yīng)用樣本數(shù)據(jù)計(jì)算檢驗(yàn)統(tǒng)計(jì)量的值

⑤比較檢驗(yàn)統(tǒng)計(jì)量的值與臨界值并作出推斷和結(jié)論。

4>1.96,因此拒絕原假設(shè),接受被擇假設(shè),有證據(jù)表明正常人的體溫與370C顯著不同。二、總體均值的檢驗(yàn)例1:某企業(yè)生產(chǎn)一種零件,以往的資料顯示零件平均長度為4cm,標(biāo)準(zhǔn)差為0.1cm。工藝改革后,抽查100個(gè)零件發(fā)現(xiàn)其平均長度為3.94cm。問:工藝改革后零件長度是否發(fā)生了顯著變化?(α=0.05)哪一類型:大樣本,總體σ已知使用哪一個(gè)檢驗(yàn)統(tǒng)計(jì)量?二、總體均值的檢驗(yàn)解:

①提出零假設(shè)和備擇假設(shè)

H0:μ=4cm;H1:μ≠4cm

②確定適當(dāng)?shù)臋z驗(yàn)統(tǒng)計(jì)量

“Z檢驗(yàn)統(tǒng)計(jì)量”

③規(guī)定顯著性水平并確定臨界值(區(qū)分拒絕域和接受域)

α=0.05,雙側(cè)檢驗(yàn),α/2=0.025,臨界值Zα/2=±1.96

④應(yīng)用樣本數(shù)據(jù)計(jì)算檢驗(yàn)統(tǒng)計(jì)量的值

⑤比較檢驗(yàn)統(tǒng)計(jì)量的值與臨界值并作出推斷和結(jié)論。

-6<-1.96,因此拒絕原假設(shè),接受被擇假設(shè),有證據(jù)表明工藝改革后零件長度發(fā)生了顯著變化。二、總體均值的檢驗(yàn)例2:某機(jī)床廠加工一種零件,根據(jù)經(jīng)驗(yàn)知道,該廠加工零件的橢圓度近似服從正態(tài)分布,其總體均值為0=0.081mm,。今換一種新機(jī)床進(jìn)行加工,抽取n=200個(gè)零件進(jìn)行檢驗(yàn),得到的橢圓度為0.076mm。樣本標(biāo)準(zhǔn)差為0.025試問新機(jī)床加工零件的橢圓度的均值與以前有無顯著差異?(=0.05)哪一類型:大樣本,總體σ未知使用哪一個(gè)檢驗(yàn)統(tǒng)計(jì)量?二、總體均值的檢驗(yàn)例3:某鋼鐵公司生產(chǎn)鋼筋。如果生產(chǎn)過程運(yùn)行正常,那么生產(chǎn)出來的鋼筋的平均長度至少為28英尺,并且假定鋼筋長度總體服從正態(tài)分布,標(biāo)準(zhǔn)差為0.20英尺。更長一點(diǎn)的鋼筋仍可以使用或改動(dòng),但比這短的鋼筋只能當(dāng)做廢料處理。從生產(chǎn)線抽取25根鋼筋作為作為一個(gè)樣本,樣本的平均長度為2.73英尺。公司想知道生產(chǎn)設(shè)備是否需要調(diào)整?(α=0.05)哪一類型:正態(tài)總體,小樣本,總體σ已知使用哪一個(gè)檢驗(yàn)統(tǒng)計(jì)量?二、總體均值的檢驗(yàn)例4:某企業(yè)從長期實(shí)踐得知,其產(chǎn)品直徑X服從正態(tài)分布N(15,0.22)。從某日產(chǎn)品中隨機(jī)抽取10個(gè),測(cè)得其直徑分別為14.8,15.3,15.1,15.0,14.7,15.1,15.6,15.3,15.5,15.1(單位:厘米)。問在顯著性水平=0.05時(shí),該產(chǎn)品直徑是否符合直徑為15.0厘米的質(zhì)量標(biāo)準(zhǔn)?例5:一家食品加工公司的質(zhì)量管理部門規(guī)定,某種包裝食品每包的凈重不得少于20克。經(jīng)驗(yàn)表明,重量近似服從標(biāo)準(zhǔn)差為1.5克的正態(tài)分布。假定一個(gè)由15包食品構(gòu)成的隨機(jī)樣本產(chǎn)生的平均重量為19.5克,有無充分證據(jù)說明這些包裝食品的平均重量減少了?二、總體均值的檢驗(yàn)例6:一家經(jīng)營小禮品的函購公司不管郵件的重量如何,均按統(tǒng)一價(jià)格來收郵費(fèi)。這種政策是根據(jù)幾年前的一項(xiàng)研究成果采取的。這項(xiàng)研究表明,郵件的平均重量為17.5克,標(biāo)準(zhǔn)差為3.6克??傕]費(fèi)等于現(xiàn)行的每克郵費(fèi)乘17.5。該公司管理部門認(rèn)為,從長遠(yuǎn)的觀點(diǎn)來看,公司甚至?xí)捎卩]費(fèi)的損失而破產(chǎn)。但是,會(huì)計(jì)部門認(rèn)為,目前郵件的平均重量可能已經(jīng)不是17.5克,因而統(tǒng)一價(jià)格也許應(yīng)當(dāng)改變。于是,建議對(duì)這一假設(shè)進(jìn)行檢驗(yàn)。由于營業(yè)量已增長到如此之大,以致要像過去那樣進(jìn)行全面調(diào)查就太復(fù)雜了。于是,決定取100個(gè)郵件重量作隨機(jī)樣本,并根據(jù)樣本的結(jié)果來作出決策。假定郵件重量近似服從正態(tài)分布。二、總體均值的檢驗(yàn)例7:隨著我國加入WTO,我國的企業(yè)面臨著異常嚴(yán)重的挑戰(zhàn),汽車行業(yè)的形勢(shì)尤為嚴(yán)峻。是挑戰(zhàn)也是機(jī)遇,為了迎接挑戰(zhàn),國內(nèi)汽車行業(yè)紛紛采取各種應(yīng)對(duì)措施。A汽車集團(tuán)公司對(duì)本公司的A1型號(hào)汽車的發(fā)動(dòng)機(jī)系統(tǒng)進(jìn)行了一系列改進(jìn),提高了啟動(dòng)速度,降低了噪音,改稱為A2型。其中,公司關(guān)心的一個(gè)重要問題是汽車的節(jié)能性。節(jié)油是汽車的一個(gè)賣點(diǎn),改進(jìn)前的A1型汽車油耗較高,每百公里油耗為8.48升,公司希望改進(jìn)后的車型比改進(jìn)前節(jié)油,至少不比改進(jìn)前更廢油。二、總體均值的檢驗(yàn)為此,隨機(jī)抽取了15輛A2型汽車做試驗(yàn),測(cè)得15輛汽車的每百公里耗油量的數(shù)據(jù)如下表:

15輛汽車每百公里耗油量(單位:升)8.508.758.338.218.528.308.318.198.408.868.418.018.208.268.39其平均數(shù)為8.377。對(duì)此數(shù)據(jù),技術(shù)部經(jīng)理認(rèn)為可以肯定改進(jìn)后的汽車更省油。二、總體均值的檢驗(yàn)公司質(zhì)量部經(jīng)理對(duì)此結(jié)論有不同看法,他認(rèn)為這個(gè)現(xiàn)象有可能是由抽樣的隨機(jī)性造成的,現(xiàn)在就下結(jié)論說改進(jìn)后的汽車更省油還為時(shí)過早,應(yīng)該對(duì)此問題作統(tǒng)計(jì)上的假設(shè)檢驗(yàn)。質(zhì)量部的張工程師剛通過國家質(zhì)量工程師從業(yè)資格認(rèn)證考試,學(xué)會(huì)了不少統(tǒng)計(jì)方法,質(zhì)量部經(jīng)理就派張工解決這個(gè)問題。通過簡單的計(jì)算,很快張工就得到結(jié)論,他說,以現(xiàn)有的數(shù)據(jù)并不能認(rèn)為改進(jìn)前后汽車的油耗有明顯變化。那么,張工是怎樣作出他的統(tǒng)計(jì)分析結(jié)論的呢?二、總體均值的檢驗(yàn)例8:根據(jù)美國高爾夫球協(xié)會(huì)的準(zhǔn)則,只有射程和滾動(dòng)距離平均不超過280碼的高爾夫球可在比賽中使用。假定某公司最近開發(fā)了一種高技術(shù)生產(chǎn)方法,用這種方法生產(chǎn)的高爾夫球的射程和滾動(dòng)距離平均為280碼?,F(xiàn)在抽取一個(gè)有36個(gè)高爾夫球的隨機(jī)樣本來檢驗(yàn)該公司的陳述是否為真。數(shù)據(jù)如下表。(假定在顯著性水平為0.05的條件下進(jìn)行)。269301296275282276284272263300295265282263286260285264268288271260270293299293273278278279266269274277281291二、總體均值的檢驗(yàn)例9:尼爾森調(diào)查公司報(bào)到了2004每個(gè)家庭觀看電視的平均時(shí)間是每天7.25個(gè)小時(shí)假定尼爾森調(diào)查公司抽取了200個(gè)家庭的樣本,樣本標(biāo)準(zhǔn)差為2.5個(gè)小時(shí)。據(jù)報(bào)道,10年前,每個(gè)家庭觀看電視的平均時(shí)間是每天6.7個(gè)小時(shí)。用μ表示在2004年每個(gè)家庭觀看電視的平均小時(shí)數(shù)。檢驗(yàn)下列假設(shè)(α=0.01):二、總體均值的檢驗(yàn)例11:某電子元件批量生產(chǎn)的質(zhì)量標(biāo)準(zhǔn)為平均使用壽命1200小時(shí)。某廠宣稱他們采用一種新工藝生產(chǎn)的元件質(zhì)量大大超過規(guī)定標(biāo)準(zhǔn)。為了進(jìn)行驗(yàn)證,隨機(jī)抽取了150件作為樣本,測(cè)得平均使用壽命1245小時(shí),標(biāo)準(zhǔn)差300小時(shí)。能否說該廠生產(chǎn)的電子元件質(zhì)量顯著地高于規(guī)定標(biāo)準(zhǔn)?(=0.05)二、總體均值的檢驗(yàn)例12:某機(jī)器制造出的肥皂厚度為5cm,今欲了解機(jī)器性能是否良好,隨機(jī)抽取10塊肥皂為樣本,測(cè)得平均厚度為5.3cm,標(biāo)準(zhǔn)差為0.3cm,試以0.05的顯著性水平檢驗(yàn)機(jī)器性能良好的假設(shè)。例13:一個(gè)汽車輪胎制造商聲稱,某一等級(jí)的輪胎的平均壽命在一定的汽車重量和正常行駛條件下大于40000公里,對(duì)一個(gè)由20個(gè)輪胎組成的隨機(jī)樣本作了試驗(yàn),測(cè)得平均值為41000公里,標(biāo)準(zhǔn)差為5000公里。已知輪胎壽命的公里數(shù)服從正態(tài)分布,我們能否根據(jù)這些數(shù)據(jù)作出結(jié)論,該制造商的產(chǎn)品同他所說的標(biāo)準(zhǔn)相符?(α=0.05)二、總體均值的檢驗(yàn)例14:一家正在研究市場情況的公司對(duì)某居民區(qū)內(nèi)的家庭每周花費(fèi)在食品上的錢數(shù)感興趣。該公司的一個(gè)分析員相信每戶每周平均花費(fèi)在食品上的錢數(shù)少于40元。一個(gè)由100個(gè)家庭組成的隨機(jī)樣本所給出的平均值為38元,標(biāo)準(zhǔn)差為10元。這些數(shù)據(jù)是否支持這個(gè)分析員的看法?三、總體比例的檢驗(yàn)三、總體比例的檢驗(yàn)總體比例假設(shè)檢驗(yàn)的原理及步驟與總體均值假設(shè)檢驗(yàn)的原理及步驟相同,不同之處主要在于檢驗(yàn)統(tǒng)計(jì)量的構(gòu)造和選擇。如何構(gòu)造檢驗(yàn)統(tǒng)計(jì)量涉及到樣本比例的抽樣分布。根據(jù)前面所學(xué)知識(shí),我們知道在大樣本(即nπ≥5且n(1-π)≥5)情況下,p的抽樣分布近似服從正態(tài)分布。否則,p服從二項(xiàng)分布)。三、總體比例的檢驗(yàn)因此關(guān)于一個(gè)總體比例假設(shè)檢驗(yàn)的統(tǒng)計(jì)量為:Z檢驗(yàn)統(tǒng)計(jì)量其中:為假設(shè)的總體比例,p為樣本比例三、總體比例的檢驗(yàn)假設(shè)雙側(cè)檢驗(yàn)左側(cè)檢驗(yàn)右側(cè)檢驗(yàn)假設(shè)形式H0:=0H1:0H0

:0H1:<0H0

:0H1:>0統(tǒng)計(jì)量拒絕域P值決策拒絕H0三、總體比例的檢驗(yàn)三、總體比例的檢驗(yàn)三、總體比例的檢驗(yàn)三、總體比例的檢驗(yàn)例:一項(xiàng)統(tǒng)計(jì)結(jié)果聲稱,某市老年人口(年齡在65歲以上)的比重為14.7%,該市老年人口研究會(huì)為了檢驗(yàn)該項(xiàng)統(tǒng)計(jì)是否可靠,隨機(jī)抽選了400名居民,發(fā)現(xiàn)其中有57人年齡在65歲以上。調(diào)查結(jié)果是否支持該市老年人口比重為14.7%的看法?(=0.05)雙側(cè)檢驗(yàn)什么檢驗(yàn)形式?三、總體比例的檢驗(yàn)H0:=14.7%H1:

14.7%=0.05n

=400臨界值(s):檢驗(yàn)統(tǒng)計(jì)量:在

=0.05的水平上不拒絕H0該市老年人口比重為14.7%決策:結(jié)論:Z01.96-1.96.025拒絕H0拒絕H0.025continued三、總體比例的檢驗(yàn)例:在過去的一年內(nèi),某公司的生意有30%是賒賬交易,70%是現(xiàn)金交易,最近一個(gè)含有100筆交易的樣本顯示有40筆是賒賬交易,若取顯著性水平為0.05,問該公司的賒賬交易政策是否有所變化?例:某公司負(fù)責(zé)人發(fā)現(xiàn)開出去的發(fā)票有大量筆誤,而且斷定這些發(fā)票中,錯(cuò)誤的發(fā)票占20%以上。隨機(jī)檢查400張,發(fā)現(xiàn)錯(cuò)誤的發(fā)票占25%。這是否可以證明負(fù)責(zé)人的判斷正確(顯著性水平為0.05)?(雙側(cè)檢驗(yàn))(右側(cè)檢驗(yàn))三、總體比例的檢驗(yàn)例:某公司的董事長為了研究該公司雇員的安全記錄,每年撥出15000元的經(jīng)費(fèi)用于安全教育和安全宣傳。這家公司的會(huì)計(jì)認(rèn)為有75%以上的同類公司每年花在安全教育和安全宣傳上的經(jīng)費(fèi)超過15000元。當(dāng)董事長請(qǐng)這個(gè)會(huì)計(jì)提出證據(jù)來支持他的看法時(shí),該會(huì)計(jì)就以如下假設(shè)檢驗(yàn)作回答。(右側(cè)檢驗(yàn))三、總體比例的檢驗(yàn)例:某企業(yè)的產(chǎn)品暢銷國內(nèi)市場。據(jù)以往調(diào)查,購買該產(chǎn)品的顧客有50%是30歲以上的男子。該企業(yè)負(fù)責(zé)人關(guān)心這個(gè)比例是否發(fā)生了變化,而無論是增加還是減少。于是,該企業(yè)委托了一家咨詢機(jī)構(gòu)進(jìn)行調(diào)查,這家咨詢機(jī)構(gòu)從眾多的購買者中隨機(jī)抽選了400名進(jìn)行調(diào)查,結(jié)果有210名為30歲以上的男子。該廠負(fù)責(zé)人希望在顯著性水平0.05下檢驗(yàn)“50%的顧客是30歲以上的男子”這個(gè)假設(shè)。(雙側(cè)檢驗(yàn))三、總體比例的檢驗(yàn)例:某西紅柿醬生產(chǎn)廠向供應(yīng)商購一批西紅柿,規(guī)定若優(yōu)質(zhì)西紅柿的比例在40%及以上按一般市場價(jià)格收購,若達(dá)不到此標(biāo)準(zhǔn),應(yīng)低于市場價(jià)格收購,現(xiàn)隨機(jī)抽取了100個(gè)西紅柿作檢驗(yàn),只有34個(gè)優(yōu)質(zhì)西紅柿,樣本比例p=34%因而欲按低于市場價(jià)格收購,但供應(yīng)商認(rèn)為樣本比例不到40%,是隨機(jī)原因引起的,試用顯著性水平a=0.05進(jìn)行檢驗(yàn)并加以說明。(左側(cè)檢驗(yàn)→下面深入分析)三、總體比例的檢驗(yàn)因?yàn)槲骷t柿中優(yōu)質(zhì)的比例愈高愈好,主要是把不夠標(biāo)準(zhǔn)的檢驗(yàn)出來,因此是一個(gè)單側(cè)檢驗(yàn)問題。其次是根據(jù)研究的目的來建立原假設(shè)和備擇假設(shè),通常是想加以證實(shí)的問題放在備擇假設(shè)H1,因?yàn)檫@時(shí)犯錯(cuò)誤的概率α是可以知道的。這個(gè)例子中供應(yīng)商相當(dāng)于生產(chǎn)者,而西紅柿醬生產(chǎn)廠相當(dāng)于消費(fèi)者,生產(chǎn)方總是怕將合格品當(dāng)作不合格品而被拒絕,因此要把產(chǎn)品顯著低于標(biāo)準(zhǔn)才檢驗(yàn)出來,把p<40%放在H1

。三、總體比例的檢驗(yàn)例:某公司收到某企業(yè)發(fā)運(yùn)來的一批產(chǎn)品,合同規(guī)定產(chǎn)品合格率不低于95%,該公司隨機(jī)抽取11件進(jìn)行檢驗(yàn),結(jié)果合格率91%。問在0.05的顯著性水平下,該公司是否應(yīng)該接收這批產(chǎn)品?例:從某地區(qū)人口有限總體中用簡單隨機(jī)放還的方式抽取一個(gè)4900人的樣本,其中具有大學(xué)畢業(yè)文化程度的為60人。我們猜測(cè),在該地區(qū)人口隨機(jī)試驗(yàn)中任意一人具有大學(xué)畢業(yè)文化程度的概率是11‰。要求檢驗(yàn)上述猜測(cè)。(α=0.05)(左側(cè)檢驗(yàn))(雙側(cè)檢驗(yàn))四、假設(shè)檢驗(yàn)的其它問題1、關(guān)于檢驗(yàn)結(jié)果的解釋2、單側(cè)檢驗(yàn)中假設(shè)的建立3、用置信區(qū)間進(jìn)行檢驗(yàn)1、關(guān)于檢驗(yàn)結(jié)果的解釋1、關(guān)于檢驗(yàn)結(jié)果的解釋1.對(duì)于顯著性水平α的檢驗(yàn)準(zhǔn)則而言,如果出現(xiàn)拒絕H0的結(jié)果,我們可以說“結(jié)論H0為真出錯(cuò)的概率不超過α”。2.我們把假設(shè)檢驗(yàn)中出現(xiàn)不能拒絕H0的結(jié)果解釋為“在顯著性水平α下沒有發(fā)現(xiàn)充足的證據(jù)拒絕H0”,而不用“接受原假設(shè)H0”,因?yàn)槲覀儫o法證明原假設(shè)是真的。2、單側(cè)檢驗(yàn)中假設(shè)的建立2、單側(cè)檢驗(yàn)中假設(shè)的建立先看一個(gè)例子:某種燈泡的質(zhì)量標(biāo)準(zhǔn)是平均燃燒壽命不得低于1000小時(shí)。已知燈泡批量產(chǎn)品的燃燒壽命服從正態(tài)分布,且標(biāo)準(zhǔn)差為100小時(shí)。商店欲從工廠進(jìn)貨,隨機(jī)抽取81個(gè)燈泡檢查,測(cè)得平均燃燒壽命為990小時(shí),問商店是否決定購進(jìn)這批燈泡?(

=0.05

)用兩種不同的假設(shè)情況(H0:μ≥1000;H0:μ≤1000)做一做,你會(huì)發(fā)現(xiàn)什么問題?(第一種情況左側(cè)檢驗(yàn)臨界值Zα=-1.645,第二種情況右側(cè)檢驗(yàn)臨界值Zα=1.645;檢驗(yàn)統(tǒng)計(jì)量值Z=-0.9)是不是兩種情況下的推斷相互矛盾?原因何在?2、單側(cè)檢驗(yàn)中假設(shè)的建立原因在于假設(shè)的背景不同。前者對(duì)生產(chǎn)方有利;后者對(duì)生產(chǎn)方不利。為什么?第一種情況是,商店相信該廠的質(zhì)量一貫是不錯(cuò)的。原假設(shè)為H0:μ≥1000,這樣的話達(dá)到質(zhì)量標(biāo)準(zhǔn)的產(chǎn)品被拒收的概率就很低(α)。雖然,商店會(huì)面臨接受不合格產(chǎn)品的風(fēng)險(xiǎn),但廠家良好的歷史記錄顯示這種情況的可能性很小。第二種情況是,歷史記錄表明,廠家的產(chǎn)品質(zhì)量并不是很好。原假設(shè)H0:μ≤1000,這樣做,表明商店要求有較強(qiáng)的證據(jù)(顯著的進(jìn)步)才能相信該批產(chǎn)品質(zhì)量達(dá)到了標(biāo)準(zhǔn)。這樣做,就達(dá)到了至少吧100(1-α)%的不合格產(chǎn)品據(jù)之門外的目的。continued2、單側(cè)檢驗(yàn)中假設(shè)的建立由此可見,同一個(gè)問題,由于對(duì)背景

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請(qǐng)下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請(qǐng)聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會(huì)有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫網(wǎng)僅提供信息存儲(chǔ)空間,僅對(duì)用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對(duì)用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對(duì)任何下載內(nèi)容負(fù)責(zé)。
  • 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請(qǐng)與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶因使用這些下載資源對(duì)自己和他人造成任何形式的傷害或損失。

評(píng)論

0/150

提交評(píng)論