《統(tǒng)計學》第七章 假設(shè)檢驗_第1頁
《統(tǒng)計學》第七章 假設(shè)檢驗_第2頁
《統(tǒng)計學》第七章 假設(shè)檢驗_第3頁
《統(tǒng)計學》第七章 假設(shè)檢驗_第4頁
《統(tǒng)計學》第七章 假設(shè)檢驗_第5頁
已閱讀5頁,還剩63頁未讀, 繼續(xù)免費閱讀

下載本文檔

版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進行舉報或認領(lǐng)

文檔簡介

統(tǒng)計學第七章

假設(shè)檢驗第七章 假設(shè)檢驗假設(shè)檢驗:

也稱顯著性檢驗。 是抽樣推斷中運用甚廣的一種統(tǒng)計推斷方法?;静襟E:對研究總體的參數(shù)或分布形式提出假設(shè)根據(jù)抽樣分布原理,利用樣本實際資料計算相關(guān)統(tǒng)計量的取值檢驗所作假設(shè)是否合理分類:參數(shù)假設(shè)檢驗,簡稱參數(shù)檢驗;非參數(shù)檢驗或者自由分布檢驗。第七章 假設(shè)檢驗§1假設(shè)檢驗基本問題

§2一個總體參數(shù)的檢驗

§3二個總體參數(shù)的檢驗

§1假設(shè)檢驗基本問題§1.1假設(shè)檢驗的統(tǒng)計思想§1.2基本概念及檢驗步驟

§1.3關(guān)于值

§1.4兩類錯誤

§1.5假設(shè)的建立問題

§1.1假設(shè)檢驗的統(tǒng)計思想統(tǒng)計思想:小概率原理反證法思想主要表現(xiàn):1、主要理論依據(jù)是“小概率事件在現(xiàn)實中是不可能發(fā)生的”這一概率思想。2、采用的邏輯推理方法是反證法?!?.2基本概念及檢驗步驟1.原假設(shè)與備擇假設(shè)原假設(shè):待檢驗的假設(shè),也稱為零假設(shè)。備擇假設(shè):原假設(shè)的對立面,否定原假設(shè)后可供選擇的假設(shè)。

例:某種飲料包裝上注明“凈含量500ml”,是否可信?該假設(shè)可以表達為:其中,字母表示假設(shè),下標0表示原假設(shè),下標1表示備擇假設(shè)?!?.2基本概念及檢驗步驟零假設(shè)與備擇假設(shè)并不一定完全對稱。假設(shè)的形式:雙側(cè)檢驗:單側(cè)檢驗左側(cè)檢驗:(或者≥;)右側(cè)檢驗:(或者≤;)§1.2基本概念及檢驗步驟2.檢驗統(tǒng)計量檢驗使用的統(tǒng)計量稱為檢驗統(tǒng)計量檢驗統(tǒng)計量的構(gòu)造形式為:§1.2基本概念及檢驗步驟3.顯著性水平與臨界值

顯著性水平是為真卻被拒絕的概率,它也是假設(shè)檢驗統(tǒng)計思想中所指的小概率。給定了顯著件水平,可由統(tǒng)計量的概率分布確定其臨界值,臨界值將統(tǒng)計量的所有可能取值區(qū)間分為兩個互不相交的部分,即原假設(shè)的拒絕域和接受域?!?.2基本概念及檢驗步驟4.接受域與拒絕域接受域:使原假設(shè)不能被拒絕的統(tǒng)計量所在區(qū)域。拒絕域:使原假設(shè)能夠被拒絕的統(tǒng)計量所在區(qū)域。也稱否定域。這兩個區(qū)域是互補的關(guān)系,即檢驗統(tǒng)計量的實際值必落入且只能落入其中一個區(qū)域,它們之間的分界線即臨界值。對于不同形式的假設(shè),的接受域和拒絕域不同?!?.2基本概念及檢驗步驟如果是只需判斷有無顯著差異的情況,則采用雙側(cè)檢驗。雙側(cè)檢驗的接受域為檢驗統(tǒng)計量分布曲線上兩臨界值之間的區(qū)域,而拒絕域分別位于兩端;§1.2基本概念及檢驗步驟左側(cè)檢驗右側(cè)檢驗左側(cè)檢驗的拒絕域位于接受域的左側(cè);右側(cè)檢驗的拒絕域位于接受域的右側(cè)。如果需要判斷參數(shù)是否偏大(偏小)的情況,則采取左側(cè)(右側(cè))檢驗?!?.2基本概念及檢驗步驟5.假設(shè)檢驗的具體步驟

(1)建立假設(shè)。(2)確定檢驗統(tǒng)計量,并確定該統(tǒng)計量的分布情況,然后依據(jù)樣本信息計算該檢驗統(tǒng)計量的實際值。(3)設(shè)定檢驗的顯著性水平,并確定臨界值。(4)將檢驗統(tǒng)計量的實際值與臨界值進行比較,做出是否拒絕原假設(shè)的決策。§1.3關(guān)于p值

值:當零假設(shè)為真時,所得到樣本觀察結(jié)果或更極端結(jié)果的概率。值越小,樣本觀測結(jié)果出現(xiàn)的可能性越小,拒絕原假設(shè)理由就越充分。值能夠反映出某一樣本觀測結(jié)果與原假設(shè)不一致的的精確程度。利用值進行假設(shè)檢驗的準則:將值與事先確定的檢驗顯著性水平進行比較,若值小于,小概率事件發(fā)生,拒絕原假設(shè);若值大于,小概率事件未發(fā)生,不能拒絕原假設(shè)?!?.4兩類錯誤

進行假設(shè)檢驗時會犯兩種錯誤:①零假設(shè)正確卻被拒絕,稱之為“第I類錯誤”;②零假設(shè)不正確卻沒有被拒絕,稱之為“第II類錯誤”。

§1.4兩類錯誤犯第I類錯誤的概率記為,即前面提到的顯著性水平。犯第II類錯誤的概率記為。在一定樣本容量下,減少會引起增大,減少會引起的增大。假設(shè)檢驗中人們普遍執(zhí)行同一準則:

首先控制棄真錯誤(錯誤)?!?.5假設(shè)的建立問題實踐中一般采取“原假設(shè)處于被保護地位”的原則,即將沒有充分理由便不能拒絕的命題作為原假設(shè),其對立面作為備擇假設(shè)。一般將已有的、固有的、經(jīng)驗的命題作為原假設(shè),將想要證明成立的命題作為備擇假設(shè),這樣做可以有效減小犯第一類錯誤的概率?!?一個總體參數(shù)的檢驗§2.1總體均值的檢驗

§2.2總體比例的假設(shè)檢驗

§2.3正態(tài)總體的方差檢驗§2.1總體均值的檢驗§2.1.1.大樣本情況下樣本均值的抽樣分布均為正態(tài)分布,其數(shù)學期望為總體均值,方差為,其中為總體方差。檢驗統(tǒng)計量服從標準正態(tài)分布,即:§2.1總體均值的檢驗根據(jù)檢驗統(tǒng)計量計算公式計算檢驗統(tǒng)計量樣本值,當顯著水平為時,查分布表:在雙側(cè)檢驗中,如果≥,則拒絕原假設(shè);反之,則不能拒絕原假設(shè)。在左側(cè)檢驗中,如果,則拒絕原假設(shè);反之,則不能拒絕原假設(shè)。在右側(cè)檢驗中,如果,則拒絕原假設(shè);反之,則不能拒絕原假設(shè)。§2.1總體均值的檢驗【例7.1】某車間用一臺包裝機包裝成品食鹽,已知袋裝食鹽的凈重服從正態(tài)分布,且當機器正常時,其均值為0.5公斤,標準差為0.005公斤。某日開工后要檢驗包裝機是否正常運作,隨機抽取了40袋,稱得凈重如下(單位:公斤):請檢驗機器是否處于正常運作狀態(tài)?()§2.1總體均值的檢驗解:首先設(shè)立原假設(shè)與備擇假設(shè):;已知該總體服從正態(tài)分布及總體的標準差,故本題可以采用檢驗。由題中樣本數(shù)據(jù)及已知條件得到:,,,,,本題屬于雙側(cè)檢驗,根據(jù)正態(tài)分布,有:不能拒絕原假設(shè),即認為包裝機器運作正常?!?.1總體均值的檢驗【例7.2】某燈具廠生產(chǎn)一種白熾燈泡,根據(jù)長期觀察,得知該燈泡使用壽命服從正態(tài)分布,平均使用時間為1500小時,標準差為10小時。現(xiàn)準備采用新技術(shù)延長燈泡壽命,引用該生產(chǎn)技術(shù)后抽檢了16個燈泡進行試驗,使用壽命分別為:試以0.05的顯著性水平判斷該種新技術(shù)是否顯著提高燈泡的使用壽命?!?.1總體均值的檢驗解:顯然,本題屬于單側(cè)檢驗(右側(cè)檢驗),首先設(shè)立原假設(shè)與備擇假設(shè):;由題中樣本數(shù)據(jù)及已知條件得到:,,,,檢驗統(tǒng)計量因此,拒絕原假設(shè),即認為該種新技術(shù)顯著提高燈泡的使用壽命。§2.1總體均值的檢驗§2.1.2.小樣本情況下1.正態(tài)總體,已知

采用統(tǒng)計量對樣本均值進行檢驗

2.正態(tài)總體,未知

檢驗統(tǒng)計量服從自由度為()的分布,由于未知,一般用樣本標準差來代替總體標準差,即:

§2.1總體均值的檢驗對于給定的顯著性水平,查分布表:在雙側(cè)檢驗中,當時,拒絕原假設(shè);反之,則不能拒絕原假設(shè)。在左側(cè)檢驗中,當時,拒絕原假設(shè);反之,則不能拒絕原假設(shè)。在右側(cè)檢驗中,當時,拒絕原假設(shè);反之,則不能拒絕原假設(shè)?!?.1總體均值的檢驗【例7.3】(續(xù)例7.1)若其它條件不變,但抽查樣本量減為10,且事先并不知道機器正常時的標準差信息。試檢驗機器是否處于正常運作狀態(tài)?()解:首先設(shè)立原假設(shè)與備擇假設(shè):;由題中樣本數(shù)據(jù)及已知條件得到:,,,,因此,不能拒絕原假設(shè),即不能認為包裝機器運作不正常?!?.1總體均值的檢驗【例7.4】(續(xù)例7.2)若沒有燈泡壽命標準差的經(jīng)驗數(shù)據(jù),試檢驗判斷該種新技術(shù)是否顯著提高燈泡的使用壽命。()解:首先確定原假設(shè)與備擇假設(shè)不變,但檢驗統(tǒng)計量換為。由題中樣本數(shù)據(jù)及已知條件得到:,,,,檢驗統(tǒng)計量拒絕原假設(shè),即認為該種新技術(shù)顯著提高燈泡的使用壽命?!?.1總體均值的檢驗§2.1.3.選擇統(tǒng)計量的總結(jié)如何選擇檢驗統(tǒng)計量大樣本(§2.1總體均值的檢驗§2.1.4.計算機實現(xiàn)結(jié)果

例:SPSSSPSS軟件中對原始數(shù)據(jù)(樣本數(shù)據(jù))是否服從正態(tài)分布、方差是否已知并沒有太多的條件限制,對于均值檢驗采用的統(tǒng)計量均為t統(tǒng)計量。§2.2總體比例的假設(shè)檢驗總體服從二項分布,樣本量足夠大且滿足時,比例的抽樣分布可用正態(tài)分布近似。

的數(shù)學期望為, 的方差為,樣本比例經(jīng)標準化后的隨機變量則服從標準正態(tài)分布,即

§2.2總體比例的假設(shè)檢驗檢驗未知的總體比例等于某一假設(shè)值設(shè);(或;)檢驗統(tǒng)計量逼近正態(tài)分布,因未知的真實值,用樣本比例來代替,因此檢驗統(tǒng)計量調(diào)整為:

其中,為待檢驗的總體比例。§2.2總體比例的假設(shè)檢驗【例7.5】某研究機構(gòu)估計本市居民家庭的電腦擁有率為75%?,F(xiàn)隨機抽查了200個家庭,其中157個家庭擁有電腦。試問估計的該市居民家庭電腦擁有率是否可信?()解:首先根據(jù)題意建立原假設(shè)與備擇假設(shè):;(),,,

不能拒絕原假設(shè),即認為該研究機構(gòu)估計的該市居民家庭電腦擁有率是可信的。

§2.3正態(tài)總體的方差檢驗

檢驗方法——檢驗法。原假設(shè)形式為:雙側(cè)檢驗:;左側(cè)檢驗:;(或者≥;)右側(cè)檢驗:;(或者≤;)檢驗統(tǒng)計量為:其中,為樣本方差,為待檢驗的假設(shè)方差?!?.3正態(tài)總體的方差檢驗對于給定的顯著性水平,查分布表:在雙側(cè)檢驗中,首先確定臨界值和,當或者時,拒絕原假設(shè);反之,則不能拒絕原假設(shè)。在左側(cè)檢驗中,確定臨界值,當時,拒絕原假設(shè);反之,則不能拒絕原假設(shè)。在右側(cè)檢驗中,確定臨界值,當時,拒絕原假設(shè);反之,則不能拒絕原假設(shè)?!?.3正態(tài)總體的方差檢驗【例7.6】根據(jù)某飲料廠長期生產(chǎn)資料可知:該廠飲料灌裝線灌裝的飲料凈含量服從正態(tài)分布,標準差為0.20ml。某天進行生產(chǎn)線檢查,從灌裝線上隨機抽取20瓶飲料,測得樣本標準差為0.35ml。試判斷該條灌裝線的波動與平日有無顯著差異?()解:本題為雙側(cè)檢驗,首先設(shè)立原假設(shè)與備擇假設(shè):;根據(jù)條件已知:,,則檢驗統(tǒng)計量查分布表,由于,拒絕原假設(shè),即該條灌裝線的波動與平日有顯著差異?!?二個總體參數(shù)的檢驗

根據(jù)前提條件不同、檢驗?zāi)繕瞬煌纫蛩?,兩總體參數(shù)假設(shè)檢驗的統(tǒng)計量選擇情況可以由下圖來示意:§3二個總體參數(shù)的檢驗§3.1兩獨立樣本的均值檢驗

§3.2兩獨立樣本的方差檢驗§3.3兩獨立樣本比例之差的檢驗

§3.4兩匹配樣本的檢驗

§3.1兩獨立樣本的均值檢驗§3.1.1.不同情形下的檢驗方法三種情形:原假設(shè):或備擇假設(shè):或基于這個假設(shè)下,分別討論各種情形下的檢驗過程?!?.1兩獨立樣本的均值檢驗1.、已知情況下(檢驗法)檢驗統(tǒng)計量:

其中,、分別為兩個總體的樣本均值;、分別為兩個總體的方差;、分別為兩個總體的樣本量。§3.1兩獨立樣本的均值檢驗【例7.7】為比較甲、乙兩種降血糖藥物的藥效,將20名病情相仿的患者分成兩組,每組10人,設(shè)服藥后維持的藥效時間分別服從正態(tài)分布和,檢測數(shù)據(jù)如下(單位:小時),問兩種降血糖藥物的療效有無顯著差異?()§3.1兩獨立樣本的均值檢驗解:本題中、已知,且兩組樣本是獨立的。提出原假設(shè)與備擇假設(shè):或或

已知:,,,,,,

計算得到檢驗統(tǒng)計量的樣本值:由于,不能拒絕原假設(shè),即在顯著性水平條件下,甲藥物與乙藥物藥效時間均值之間無顯著性差異?!?.1兩獨立樣本的均值檢驗2.、未知,但(檢驗法)檢驗統(tǒng)計量:其中,、分別為兩個總體的樣本均值;、分別為兩個總體的樣本量;、分別為兩個總體的樣本方差?!?.1兩獨立樣本的均值檢驗【例7.8】若已知A、B兩種降血壓藥物維持的藥效時間服從正態(tài)分布和,其中具體值未知。問在顯著性水平下,這兩種降血壓藥物的療效時間有無顯著差異?§3.1兩獨立樣本的均值檢驗解:本題中、未知,但,且兩組樣本是獨立的。原假設(shè)與備擇假設(shè)不變,由于總體方差未知,所以選用統(tǒng)計量,由題中樣本數(shù)據(jù):,,,,,,計算得到檢驗統(tǒng)計量值:由于,因此不能拒絕原假設(shè),即在顯著性水平條件下,A藥物與B藥物藥效時間均值之間無顯著性差異?!?.1兩獨立樣本的均值檢驗3.、未知,樣本量充分大(檢驗法)檢驗統(tǒng)計量:注:用樣本標準差來代替總體標準差。其中,、分別為兩個總體的樣本均值;、分別為兩個總體的樣本量;、分別為兩個總體的樣本方差?!?.1兩獨立樣本的均值檢驗4.、未知,小樣本(檢驗法)檢驗統(tǒng)計量:其中,、分別為兩個總體的樣本均值;、分別為兩個總體樣本量;、分別為兩個總體的樣本方差?!?.1兩獨立樣本的均值檢驗§3.1.2.計算機實現(xiàn)結(jié)果統(tǒng)計軟件SPSS分組統(tǒng)計量表(表7—4)兩樣本均值分別為7.9610和7.4560標準差分別為0.86964和0.89617§3.1獨立樣本的均值檢驗獨立樣本檢驗表(表7—5)§3.1獨立樣本的均值檢驗表7—5中,“Levene‘sTestforEqualityofVariances”列即Levene’s方差齊性檢驗,該列可以看到值為0.054,Sig.為0.819,顯然大于設(shè)定的置信度水平0.05,因此可以認為兩樣本方差是齊性的,即方差相等。由于已經(jīng)通過方差齊性檢驗,因此接下來的均值檢驗要在方差相等的情況下判定,即參照“Equalvariancesassumed”行進行檢驗,該行中,樣本統(tǒng)計量等于1.279,Sig.(2-tailed)(雙尾概率值)為0.217,因此不能拒絕原假設(shè),即在顯著性水平條件下,A藥物與B藥物藥效時間均值之間無顯著性差異?!?.2兩獨立樣本的方差檢驗用于檢驗兩總體的某項指標波動幅度即方差是否相等,采用檢驗法,此類假設(shè)檢驗的原假設(shè)與備擇假設(shè)為:原假設(shè):或者備擇假設(shè):或者§3.2兩獨立樣本的方差檢驗檢驗兩個總體方差是否相等,選用統(tǒng)計量:其中,、分別為兩個總體的方差;、分別為兩個總體的樣本方差;、分別為兩個總體的樣本量。根據(jù)樣本數(shù)據(jù)計算檢驗統(tǒng)計量的值,其計算的基本公式為:§3.2兩獨立樣本的方差檢驗規(guī)定顯著性水平后,將與臨界點值相比較,根據(jù)比較結(jié)果進行決策:

在雙側(cè)檢驗中,若或者,則拒絕原假設(shè),即兩個總體的方差存在顯著差異;反之,則不能拒絕原假設(shè),即兩總體方差不存在顯著差異。在左側(cè)檢驗中,若,則拒絕原假設(shè);反之,則不能拒絕原假設(shè)。在右側(cè)檢驗中,若,則拒絕原假設(shè);反之,則不能拒絕原假設(shè)?!?.2兩獨立樣本的方差檢驗【例7.9】(續(xù)例7.8)樣本保持不變,問在顯著性水平下,這兩種降壓藥物療效時間的方差有無顯著差異?解:本題中兩組樣本試驗是獨立的,由題意,原假設(shè)與備擇假設(shè)為:或或由題中樣本數(shù)據(jù)及已知條件:,,,,計算得到檢驗統(tǒng)計量值:由于,因此不能拒絕原假設(shè),即在顯著性水平條件下,A藥物與B藥物藥效時間方差之間無顯著性差異?!?.3兩獨立樣本比例之差的檢驗

§3.3.1.檢驗兩個總體比例是否相等檢驗兩總體比例是否相等等價于檢驗兩總體比例之差是否為零,因此,該類檢驗的原假設(shè)與備擇假設(shè)為:(或)(或)檢驗統(tǒng)計量為:§3.3兩獨立樣本比例之差的檢驗用公共比例來近似替代真實值,即:其中,和分別是在兩樣本中具有某種特征單位的個數(shù),和分別表示兩樣本量。因此,檢驗統(tǒng)計量就轉(zhuǎn)換為:其中,?!?.3兩獨立樣本比例之差的檢驗【例7.10】現(xiàn)要比較兩小區(qū)電腦普及情況,某調(diào)查公司通過抽樣調(diào)查得到下列數(shù)據(jù):在甲小區(qū)被調(diào)查的160戶中有80戶擁有電腦;在乙公司被調(diào)查的180戶中有93戶擁有電腦。此外,該調(diào)查公司在每個小區(qū)的抽樣比都小于5%。在的置信水平下,可以判定兩個小區(qū)電腦普及率不同嗎?§3.3兩獨立樣本比例之差的檢驗解:首先建立原假設(shè)與備擇假設(shè):,根據(jù)已知條件得到:,檢驗統(tǒng)計量值為:當時,臨界值為,顯然,因此不能拒絕原假設(shè),即不能拒絕兩個小區(qū)電腦普及率相同這個假設(shè)?!?.3兩獨立樣本比例之差的檢驗§3.3.2.檢驗兩個總體比例之差為非零常數(shù)檢驗兩總體比例之差為一非零常數(shù),則原假設(shè)與備擇假設(shè)變?yōu)椋海ǎz驗統(tǒng)計量為:由于現(xiàn)實中真正的總體比例和往往是未知的,因此在這樣的情況下需要用樣本數(shù)據(jù)來近似替代真實值,此時檢驗統(tǒng)計量調(diào)整為:§3.3兩獨立樣本比例之差的檢驗【例7.11】某廠質(zhì)驗人員認為該廠A車間產(chǎn)品優(yōu)質(zhì)品率比B車間高5%,現(xiàn)從A車間和B車間分別抽取兩個獨立隨機樣本進行檢驗,很到如下數(shù)據(jù):在A車間抽檢的150個產(chǎn)品中有120個優(yōu)質(zhì)品,在B車間抽檢的150個產(chǎn)品中有115個優(yōu)質(zhì)品。問根據(jù)這些數(shù)據(jù),能否相信質(zhì)檢人員的說法。()解:首先建立原假設(shè)與備擇假設(shè):,根據(jù)已知條件得到:,本題屬于右側(cè)檢驗,當時,臨界值為,顯然,因此不能拒絕原假設(shè),不能支持該廠質(zhì)檢人員的說法?!?.4兩匹配樣本的檢驗

§3.4.1檢驗理論及實例

匹配樣本的檢驗的思

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預覽,若沒有圖紙預覽就沒有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負責。
  • 6. 下載文件中如有侵權(quán)或不適當內(nèi)容,請與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。