生物統(tǒng)計學與試驗設(shè)計:第四章 t-檢驗_第1頁
生物統(tǒng)計學與試驗設(shè)計:第四章 t-檢驗_第2頁
生物統(tǒng)計學與試驗設(shè)計:第四章 t-檢驗_第3頁
生物統(tǒng)計學與試驗設(shè)計:第四章 t-檢驗_第4頁
生物統(tǒng)計學與試驗設(shè)計:第四章 t-檢驗_第5頁
已閱讀5頁,還剩17頁未讀, 繼續(xù)免費閱讀

下載本文檔

版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進行舉報或認領(lǐng)

文檔簡介

第四章t-檢驗

百分率資料的假設(shè)檢驗

小樣本均數(shù)的假設(shè)檢驗

統(tǒng)計假設(shè)檢驗的基本原理

統(tǒng)計假設(shè)檢驗是生物統(tǒng)計學的核心內(nèi)容,是統(tǒng)計推斷的主要組成部分第一節(jié)統(tǒng)計假設(shè)檢驗的基本原理統(tǒng)計推斷(statisticalinference)就是通過樣本特征(統(tǒng)計量)來推斷相應總體特征(參數(shù))的方法

參數(shù)估計(parametricestimate)通過樣本統(tǒng)計量估計總體參數(shù)的方法

點估計(pointestimate)

區(qū)間估計(intervalestimate)直接用樣本統(tǒng)計量的數(shù)值估計出相應總體參數(shù)具體值的方法在一定的概率保證下(一般為95%或99%),根據(jù)樣本統(tǒng)計量的分布,計算出總體參數(shù)出現(xiàn)的數(shù)值范圍或區(qū)間,用該區(qū)間來估計總體參數(shù)的方法■參數(shù)估計是對總體參數(shù)的定量分析

統(tǒng)計假設(shè)檢驗(hypothesistest)根據(jù)某種實際需要,對未知的或不完全知道的總體參數(shù)提出一些假設(shè),然后根據(jù)樣本觀測值和統(tǒng)計量的分布,通過一定的計算,再作出在一定概率意義上應當接受哪種假設(shè)的方法統(tǒng)計假設(shè)檢驗的假設(shè)是對總體提出的,最后檢驗的結(jié)論只有兩種:比較的總體參數(shù)間要么存在顯著差異,要么不存在顯著差異■統(tǒng)計假設(shè)檢驗是對總體參數(shù)的定性分析

1.統(tǒng)計假設(shè)檢驗的意義

以兩個平均數(shù)之間差異的顯著性檢驗——t-檢驗為例現(xiàn)隨機挑選10名中國美女和10名韓國美女,請世界選美大賽評委和觀眾進行評分,試比較哪個國家美女更美?9.999.859.999.959.989.979.959.95中國美女的平均得分9.98韓國美女的平均得分9.91兩個國家美女的平均得分并不相等,其差值(表面效應)為:根據(jù)兩個樣本平均數(shù)的差值0.07,是否可以給兩個樣本所在總體的總體平均數(shù)下這樣的結(jié)論:中國美女總體的平均得分高于韓國美女總體的平均得分中國美女比韓國美女漂亮◆如果從經(jīng)典數(shù)學的角度來看,答案應該是肯定◆如果從生物統(tǒng)計學的角度來看,在未經(jīng)過統(tǒng)計假設(shè)檢驗以前,只能說“不一定”

事實上,僅僅憑借2個樣本平均數(shù)之差不等于0就得出其所屬的2個總體平均數(shù)不相等是不可靠的實際上,進行試驗研究的目的并不在于了解樣本的結(jié)果,而是要通過樣本了解總體,通過樣本來推斷總體,從而對總體給出一個全面的結(jié)論在統(tǒng)計學中,一般用樣本平均數(shù)、作為統(tǒng)計假設(shè)檢驗的對象

、以樣本平均數(shù)差數(shù)的大小來對樣本所在的總體平均數(shù)μ1與μ2是否相同作出統(tǒng)計推斷

以樣本平均數(shù)作為檢驗對象的依據(jù):

離均差平方和為最小,說明樣本平均數(shù)與樣本中各個觀測值之間相差最小,因此,平均數(shù)是一個樣本資料的最好代表值

樣本平均數(shù)是總體平均數(shù)的無偏估計值

根據(jù)中心極限定理,樣本平均數(shù)服從或逼近正態(tài)分布實際上,每個觀測值(數(shù)據(jù))都只是試驗的表面效應,而表面效應一般由兩部分組成:

試驗的處理效應

試驗的隨機誤差

樣本中每一觀測值xi可以被分解成兩部分:處理效應:用總體平均數(shù)μ表示誤差效應:用隨機誤差ε表示

樣本平均數(shù)為:總體平均數(shù)樣本平均數(shù)的差數(shù)也可分解成2部分:誤差平均數(shù)表面效應處理效應抽樣誤差2.統(tǒng)計假設(shè)檢驗的步驟

統(tǒng)計假設(shè)檢驗的基本原理和思路:■首先根據(jù)具體試驗目的提出一個假設(shè)■然后在假定該假設(shè)成立(或正確)的前提下進行試驗,并取得數(shù)據(jù),接著對這些資料進行統(tǒng)計分析,獲得該假設(shè)成立的概率■最后根據(jù)所獲得的概率值的大小來判斷假設(shè)是否成立如果所得概率較大,就表明我們沒有足夠的理由來否定所作假設(shè),即必須接受這一假設(shè)如果所得概率較小,就表明這一假設(shè)不大可能成立,應予否定,從而接受其對立假設(shè)例1:某地成年黑白花奶牛產(chǎn)奶量為52.3,標準差為5.38,現(xiàn)測得10頭黑白花奶牛產(chǎn)奶量分別為53.6,55.3,46.4,57.2,46.0,43.2,48.1,51.1,49.9,44.5;=49.53。試問這批黑白花奶牛是否來自于某地黑白花奶??傮w?(1)對所研究的總體提出假設(shè)研究某一隨機樣本所在的總體(用μ表示)和一已知總體(用μ0表示)是否為同一總體,也就是研究這一隨機樣本是否來自于已知總體假設(shè):兩個總體為同一個總體(即兩個總體的總體平均數(shù)相等)無效假設(shè)(nullhypothesis)

用H0表示即H0:μ=μ0

無效假設(shè)的含義:例1:無效假設(shè)就是假設(shè)兩總體的平均數(shù)相等,即H0:假設(shè)樣本平均數(shù)

與已知總體平均數(shù)由抽樣誤差引起的,并不是兩總體之間的真實差異兩總體之間的差異是由抽樣誤差所引起的為了在無效假設(shè)被否定后有可以被接受的假設(shè),因此應在設(shè)立無效假設(shè)的同時設(shè)立一個后備假設(shè)備擇假設(shè)(alternativehypothesis)用HA表示即HA:

備擇假設(shè)的統(tǒng)計學意義:例1:樣本所在總體與已知總體不是同一個總體,即兩總體平均數(shù)不等,即:兩總體之間的差異是真實差異,而不是由抽樣誤差引起的統(tǒng)計假設(shè)檢驗中完整的假設(shè)是:

兩總體之間的差異是真實差異(2)在假定無效假設(shè)成立的前提下,研究樣本平均數(shù)的抽樣分布,計算樣本平均數(shù)出現(xiàn)的概率樣本平均數(shù)與總體平均數(shù)間有一個實際存在的差值:這個差值就是表面效應,可能是抽樣誤差,也可能是真實差異,因此需要借助概率原理來進行判斷

第一種方法:計算差值-2.77出現(xiàn)的概率在無效假設(shè)成立的前提下,樣本所在的總體與已知總體為同一個總體,因此樣本所在總體的總體平均數(shù)和方差已知,即:由于總體方差已知,根據(jù)標準正態(tài)分布就可以計算出差值-2.77出現(xiàn)的概率

0.1~0.11

第二種方法:計算樣本平均數(shù)的接受區(qū)間根據(jù)標準化公式計算樣本平均數(shù)的接受區(qū)間:接受區(qū)間否定區(qū)間接受區(qū)間和否定區(qū)間是有一定的概率保證的,保證概率為1-α,常用的保證概率為95%和99%;α為顯著水平,常用的顯著水平有0.05和0.01倘若樣本平均數(shù)落在接受區(qū)間內(nèi),就接受H0,反之,倘若樣本平均數(shù)落在接受區(qū)間之外,就否定H0,接受HA作為0.05顯著水平上接受或否定無效假設(shè)的兩個臨界值作為0.01顯著水平上接受或否定無效假設(shè)的兩個臨界值95%的接受區(qū)間為:99%的接受區(qū)間為:(3)根據(jù)“小概率事件實際不可能性原理”接受或否定無效假設(shè)小概率事件實際不可能性原理是指在一次試驗中,概率很小的事件是不可能出現(xiàn)的當樣本平均數(shù)與總體平均數(shù)差值出現(xiàn)的概率小于5%時,就認為這種差異由抽樣誤差引起的概率較小,而是兩總體間的真實性差異,從而否定無效假設(shè)差值-2.77出現(xiàn)的概率為0.1~0.11,大于0.05,概率較大;說明樣本平均數(shù)與已知總體的總體平均數(shù)之間的差異是抽樣誤差的概率較大,而不大可能是真實差異接受無效假設(shè),也就是說這批黑白花奶牛是來自于某地黑白花奶牛總體總結(jié):統(tǒng)計假設(shè)檢驗的步驟(1)提出假設(shè)(2)計算樣本平均數(shù)抽樣分布的t值或u值(3)查附表,根據(jù)小概率原理作出接受或者否定無效假設(shè)的推斷,并結(jié)合專業(yè)知識作出合理的、科學的解釋例2:1995年,已知某地20歲應征男青年的平均身高為168.5cm。2005年在當?shù)?0歲應征男青年中隨機抽取85人,平均身高為171.2cm,標準差為5.3cm,問2005年當?shù)?0歲應征男青年的身高與1995年的是否相同?解:(1)提出假設(shè)H0:μ=168.5HA:μ≠168.5與1995年相比,2005年當?shù)?0歲應征男青年的身高沒有變化與1995年相比,2005年當?shù)?0歲應征男青年的身高有變化(2)計算u值(3)查表,作出推斷

u0.05=1.96,u0.01=2.58|u|=4.70>2.58=u0.01,

P<0.01根據(jù)“小概率事件原理”可以認為無效假設(shè)不成立,因此否定無效假設(shè),接受備擇假設(shè)樣本不是來自于已知總體,即2005年當?shù)?0歲應征男青年的身高有變化,比1995年增高了在顯著性檢驗中,否定或接受無效假設(shè)的依據(jù)是“小概率事件實際不可能性原理”

用來確定否定或接受無效假設(shè)的概率標準稱為顯著水平,記作α

若|u|<u0.05

P>0.05,

說明表面效應屬于試驗誤差的可能性大,不能否定無效假設(shè),兩個總體平均數(shù)間差異不顯著

若u0.05≤|u|<u0.01

P≤0.05,

說明表面效應屬于試驗誤差的概率P在0.01-0.05之間,表面效應屬于試驗誤差的可能性較小,應否定無效假設(shè),接受備擇假設(shè)兩個總體平均數(shù)間差異顯著

標記*

若|u|≥u0.01

P≤0.01,

說明表面效應屬于試驗誤差的概率P不超過0.01,表面效應屬于試驗誤差的可能性更小,應否定無效假設(shè),接受備擇假設(shè)

兩個總體平均數(shù)間差異極顯著

標記

**課堂練習:太湖豬母豬成年體重為75㎏,現(xiàn)從太湖豬產(chǎn)區(qū)隨機抽得60個個體,平均成年體重為70.8㎏,S=11.32㎏,問該樣本群就成年體重這一性狀來看,是否與總體符合?3.一尾檢驗和兩尾檢驗

所研究樣本的樣本平均數(shù),有可能大于已知總體的總體平均數(shù),也有可能小于已知總體的總體平均數(shù),即計算所得的u值可能會落在標準正態(tài)分布左邊否定區(qū),也有可能會落在右邊否定區(qū)既考慮左邊否定區(qū)又考慮右邊否定區(qū)即考慮分布曲線兩尾的檢驗稱為兩尾檢驗(two-tailedtest)在很多情況下,事先并不知道所抽樣本的樣本平均數(shù)是不是肯定大于總體平均數(shù)或肯定小于總體平均數(shù)因此,備擇假設(shè)HA:μ≠μ0中,有兩種可能性存在,既包括μ>μ0,又包括μ<μ0■兩尾檢驗是生物統(tǒng)計學中最常用的方法,應用范圍極其廣泛

有些時候,試驗目的是明確的,即所抽樣本的樣本平均數(shù)只可能大于總體平均數(shù)μ>μ0,或只可能小于總體平均數(shù)μ<μ0

在這種情況下,無效假設(shè)否定后的備擇假設(shè)只有一種情況:要么μ<μ0

,要么μ>μ0

只有一個否定區(qū)(一尾)的假設(shè)檢驗稱為一尾檢驗(one-tailedtest)

兩尾檢驗的假設(shè):H0:μ=μ0,HA:μ≠μ0

一尾檢驗的假設(shè):H0:μ>μ0,HA:μ<μ0

在樣本容量和顯著水平相同的情況下,一尾檢驗的效率高于兩尾檢驗,一尾檢驗比兩尾檢驗更容易否定無效假設(shè)若對同一資料進行兩尾檢驗和一尾檢驗,那么在α水平上一尾檢驗顯著,只相當于兩尾檢驗在2α水平上顯著。所以,同一資料兩尾檢驗與一尾檢驗所得的結(jié)論不一定相同兩尾檢驗顯著,一尾檢驗一定顯著一尾檢驗顯著,兩尾檢驗未必顯著4.假設(shè)檢驗的兩類錯誤在假設(shè)檢驗中,接受或者否定無效假設(shè)的依據(jù)是“小概率事件實際不可能性原理”,因此所得出的結(jié)論(不論是接受還是否定無效假設(shè))都沒有100%的把握,只是在一定的概率范圍內(nèi)認為這種結(jié)論是正確的

4.1第一類錯誤如果無效假設(shè)H0成立,即H0:μ=μ0為真,但:

檢驗結(jié)果發(fā)現(xiàn)“差異顯著”而否定了它(此時,只有95%的把握,要冒5%下錯結(jié)論的風險)檢驗結(jié)果發(fā)現(xiàn)“差異極顯著”而否定了它(此時,只有99%的把握,要冒1%下錯結(jié)論的風險)這一類錯誤稱為Ⅰ型錯誤或α型錯誤Ⅰ型錯誤的實質(zhì)就是把非真實差異(抽樣誤差)錯判為真實差異,即:H0:μ=μ0為真,卻接受了HA:μ≠μ0

棄真H0正確被否定犯Ⅰ型錯誤的概率不會超過顯著水平α(5%、1%)

4.2第二類錯誤

如果無效假設(shè)H0不成立,即H0:μ=μ0為假,但:

檢驗結(jié)果發(fā)現(xiàn)“差異不顯著”而接受了它,同時放棄了正確的備擇假設(shè)

在統(tǒng)計學中所謂的“差異不顯著”就是指沒有充分的理由去否定無效假設(shè),但也沒有充分的理由去接受備擇假設(shè),但生物統(tǒng)計學實行的是“非此即彼”的原則,因此,既然“差異不顯著”就必須接受無效假設(shè)。

這一類錯誤稱為Ⅱ型錯誤或β型錯誤Ⅱ型錯誤的實質(zhì)就是把真實差異錯

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預覽,若沒有圖紙預覽就沒有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負責。
  • 6. 下載文件中如有侵權(quán)或不適當內(nèi)容,請與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

最新文檔

評論

0/150

提交評論