假設(shè)檢驗的原理和方法_第1頁
假設(shè)檢驗的原理和方法_第2頁
假設(shè)檢驗的原理和方法_第3頁
假設(shè)檢驗的原理和方法_第4頁
假設(shè)檢驗的原理和方法_第5頁
已閱讀5頁,還剩37頁未讀, 繼續(xù)免費閱讀

下載本文檔

版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進行舉報或認(rèn)領(lǐng)

文檔簡介

統(tǒng)計推斷(statisticalinference)第四章第四章統(tǒng)計推斷統(tǒng)計推斷由一個樣本或一糸列樣本所得的結(jié)果來推斷總體的特征假設(shè)檢驗參數(shù)估計統(tǒng)計推斷的過程樣本統(tǒng)計量例如:樣本均值、方差總體均值、方差總體樣本ⅠⅡⅢⅣⅤ分析誤差產(chǎn)生的原因任務(wù)確定差異的性質(zhì)排除誤差干擾對總體特征做出正確判斷第四章第一節(jié)第二節(jié)第三節(jié)第四節(jié)第五節(jié)假設(shè)檢驗的原理與方法樣本平均數(shù)的假設(shè)檢驗樣本頻率的假設(shè)檢驗參數(shù)的區(qū)間估計與點估計方差的同質(zhì)性檢驗第一節(jié)假設(shè)檢驗的原理與方法一概念:

假設(shè)檢驗(hypothesistest)又稱顯著性檢驗(significancetest),就是根據(jù)總體的理論分布和小概率原理,對未知或不完全知道的總體提出兩種彼此對立的假設(shè),然后由樣本的實際原理,經(jīng)過一定的計算,作出在一定概率意義上應(yīng)該接受的那種假設(shè)的推斷。假設(shè)檢驗參數(shù)檢驗非參數(shù)檢驗平均數(shù)的檢驗頻率的檢驗方差的檢驗秩和檢驗符號檢驗二、假設(shè)測驗基本思想抽樣分布臨界值臨界值接受區(qū)樣本均數(shù)拒絕區(qū)拒絕區(qū)H0/2/21-采用邏輯上的反證法依據(jù)統(tǒng)計上的小概率原理小概率原理

概率很小的事件在一次抽樣試驗中實際是幾乎不可能發(fā)生的。

=0.05/0.01

如果假設(shè)一些條件,并在假設(shè)的條件下能夠準(zhǔn)確地算出事件A出現(xiàn)的概率α為很小,則在假設(shè)條件下的n次獨立重復(fù)試驗中,事件A將按預(yù)定的概率發(fā)生,而在一次試驗中則幾乎不可能發(fā)生。實例

例:某地區(qū)的當(dāng)?shù)匦←溒贩N一般畝產(chǎn)300kg,標(biāo)準(zhǔn)差75kg?,F(xiàn)有新品種通過25個小區(qū)的試驗,獲得其平均產(chǎn)量為330kg/畝,新品種與當(dāng)?shù)仄贩N是否有顯著差異?抽取隨機樣本提出假設(shè)我認(rèn)為小麥平均產(chǎn)量是300kg作出決策接受或拒絕假設(shè)均值x=330kg實例

例:某地區(qū)的當(dāng)?shù)匦←溒贩N一般畝產(chǎn)300kg,標(biāo)準(zhǔn)差75kg?,F(xiàn)有新品種通過25個小區(qū)的試驗,獲得其平均產(chǎn)量為330kg/畝,新品種與當(dāng)?shù)仄贩N是否有顯著差異?提出假設(shè)計算假設(shè)正確的概率=0.05統(tǒng)計決策…如果這是總體的真實均值330實例這個值是我們應(yīng)該得到的樣本均值?我們拒絕還是接受假設(shè)μ=300?

1.96xH0樣本均值抽樣分布μ=300?三、假設(shè)檢驗的步驟治療前

0

=126

2=240

N(126,240)治療后n=6x=136

未知那么=0?

即克矽平對治療矽肺是否有效?例:設(shè)矽肺病患者的血紅蛋白含量具平均數(shù)

0=126(mg/L),

2=240

(mg/L)2的正態(tài)分布。現(xiàn)用克矽平對6位矽肺病患者進行治療,治療后化驗測得其平均血紅蛋白含量x=136(mg/L)。1、提出假設(shè)對立無效假設(shè)/零假設(shè)/檢驗假設(shè)備擇假設(shè)/對應(yīng)假設(shè)

0

0

誤差效應(yīng)處理效應(yīng)H0HA例:克矽平治療矽肺病是否能提高血紅蛋白含量?平均數(shù)的假設(shè)檢驗檢驗治療后的總體平均數(shù)

是否還是治療前的126(mg/L)?x-

0=136-126=10(mg/L)這一差數(shù)是由于治療造成的,還是抽樣誤差所致。本例中零假設(shè)是指治療后的血紅蛋白平均數(shù)仍和治療前一樣,二者來自同一總體,接受零假設(shè)則表示克矽平?jīng)]有療效。而相對立的備擇假設(shè)表示拒絕H0,治療后的血紅蛋白平均數(shù)和治療前的平均數(shù)來自不同總體,即克矽平有療效。H0:μ=μ0=126(mg/L)HA:μ≠μ0

2、確定顯著水平

=0.05顯著水平*極顯著水平**能否定H0的人為規(guī)定的概率標(biāo)準(zhǔn)稱為顯著水平,記作

。統(tǒng)計學(xué)中,一般認(rèn)為概率小于0.05或0.01的事件為小概率事件,所以在小概率原理基礎(chǔ)上建立的假設(shè)檢驗也常取

=0.05和

=0.01兩個顯著水平

。P<

=0.01

=0.053、選定檢驗方法,計算檢驗統(tǒng)計量,確定概率值u=x-

x

136-126=√40=1.581P(u>1.581)=2×0.0571=0.1142根據(jù)研究設(shè)計的類型和統(tǒng)計推斷的目的選擇使用不同的檢驗方法。例:u=x-

x

4、作出推斷結(jié)論:是否接受假設(shè)P>

P<

小概率原理接受H0否定HA否定H0接受HA可能正確可能錯誤例:上例中

P=0.1142>0.05所以接受H0,從而得出結(jié)論:使用克矽平治療前后血紅蛋白含量未發(fā)現(xiàn)有顯著差異,其差值10應(yīng)歸于誤差所致。P(u>1.96)=0.05P(u>2.58)=0.01已知:

0.950.0250.025u>1.96u>2.58P(u)<0.05P(u)<0.01差異達顯著水平差異達極顯著水平無論什么樣的情況,假設(shè)檢驗時,首先要作出無效假設(shè)H0,且作出這個假設(shè)是要有依據(jù)的。

通常假設(shè)被比較的對象間沒有差異,或現(xiàn)在的狀況與已知的或原來的狀況相符合。經(jīng)測驗,當(dāng)H0被拒絕時,所接受的假設(shè)是與H0相對立的備擇假設(shè)HA。HA有如下三種情況可供選擇:

HA:;HA

:;即HA

三、雙尾檢驗與單尾檢驗抽樣分布臨界值臨界值接受區(qū)樣本均數(shù)拒絕區(qū)拒絕區(qū)H0/2/21-(一)雙尾測驗假設(shè)檢驗時所考慮的概率為分布曲線左右兩邊概率之和時,稱雙尾檢驗。雙尾檢驗在生物學(xué)中運用較多,如:一個新的飼料配方與舊配方相比,有可能好些,也可能差些;一種新的養(yǎng)殖技術(shù)或魚藥與舊的相比也是如此。又如有人試驗兩種不同方法養(yǎng)殖鰱魚:一種是只施肥不投餌料,另一種是既施肥又投餌料。問這兩種不同養(yǎng)鰱魚方法的鮮魚畝產(chǎn)量有否顯著性差異?顯然,研究者只考察兩種養(yǎng)鰱魚法鮮魚畝產(chǎn)量的差異,不問誰好誰歹。因此,應(yīng)進行兩尾測驗,選擇備擇假設(shè)HA:。一般認(rèn)為,兩尾測驗較為穩(wěn)妥,對結(jié)果考慮的思路較寬,故很常用。雙尾檢驗

0P(-1.96x<x<

+1.96

x)=0.95

-1.96x

+1.96x0.950.0250.025臨界值:+u

x左尾右尾否定區(qū)否定區(qū)接受區(qū)u

+1.96x雙尾檢驗(two-sidedtest)

0P(-2.58x<x<

+2.58

x)=0.99

-2.58x

+2.58x0.990.0050.005臨界值:+2.58x左尾右尾雙尾檢驗(two-sidedtest)否定區(qū)否定區(qū)接受區(qū)假設(shè)檢驗時所考慮的概率僅為分布曲線左邊或右邊一尾概率之時,稱單尾檢驗。單尾檢驗一般用于安全檢查,如生產(chǎn)安全、食品安全和衛(wèi)生防御等。

“勉強可吃、可用的就是不能吃、不能用”。1.895x拒絕區(qū)H0H00.05(二)單尾測驗抽樣分布0.950.950.050.051.64-1.64H0:≤0HA:>0假設(shè):否定區(qū)H0:≥0HA:<0左尾檢驗右尾檢驗單尾檢驗(one-sidedtest)接受區(qū)接受區(qū)u0.05=1.64u0.01=2.33單尾檢驗分位數(shù)雙尾檢驗分位數(shù)u0.05=1.96u0.01=2.58

2否定區(qū)否定區(qū)否定區(qū)接受區(qū)接受區(qū)查表時,單尾概率等于雙尾概率乘以2>

同一顯著水平下,雙尾檢驗的臨界值大于單尾檢驗的臨界值。如α=0.05時,雙尾|U|=1.96,而單尾為U=1.64或U=-1.64;α=0.01時,雙尾|U|=2.58,而單尾為U=2.33或U=-2.33。例2:某春小麥良種的千粒重

0=34g,現(xiàn)自外地引入一高產(chǎn)品種,在8個小區(qū)種植,得千粒重(g)35.6、37.6、33.4、35.1、32.7、36.8、35.9、34.6,問新引入品種的千粒重是否顯著高于當(dāng)?shù)亓挤N?H0:

34;對HA:

>34

=0.05(單尾)SS=18.83x=35.2g1.648Sx==0.58S=18.838-1=1.64t=35.2-340.58=2.069df=7時t0.05=1.895|t|>t0.05,P<0.05

否定H0:

34g,即新引進品種的千粒重顯著比當(dāng)?shù)亓挤N千粒重高。單尾檢驗

0ⅠⅡ四、兩類錯誤

a雖然是一很小的概率值如0.01,但并不等于0,只是很?。╝)而已。我們卻完全否認(rèn)這種可能性,認(rèn)為它不可能發(fā)生,從而拒絕H0。顯然,這是一種錯誤,這種在拒絕H0時犯下的錯誤,稱為“I型錯誤”或“棄真錯誤”或“a錯誤”。錯誤=

00.950.025Ⅰ和Ⅱ重合時

錯誤ⅠⅡC1C22

2

0

u

-u

Ⅰ和Ⅱ不重合

從圖可知,在a水平上,事件U<Ua,U既位于H0分布之下,同時也位于HA的分布之下。由于u屬于H0的分布的概率很大,為1-a,所以我們接受H0,但是,U同時也有大小為β的概率來自于HA分布,這時我們卻完全否認(rèn)這種可能性,顯然是一種錯誤。這種在接受H0時犯下的錯誤,稱為“Ⅱ型錯誤”或“β錯誤”或“納偽錯誤”(即無效假設(shè)H0是不正確的,我們卻接受了它)。這種統(tǒng)計錯誤的性質(zhì)是把真實差異錯判為非真實差異。犯這種類型的錯誤概率不會超過β。錯誤假設(shè)檢驗的兩類錯誤

H0正確

H0錯誤否定H0

錯誤()推斷正確(1-)接受H0

推斷正確(1-)

錯誤()第一類錯誤(typeIerror),又稱棄真錯誤或

錯誤;第二類錯誤(typeII

error

),又稱納偽錯誤或

錯誤1、兩類錯誤既有聯(lián)系又有區(qū)別

錯誤只在否定H0時發(fā)生

錯誤只在接受H0時發(fā)生

錯誤增加

錯誤減小

錯誤增加

錯誤減小結(jié)論2、還依賴于

-0的距離結(jié)論3、n

,

2可使兩類錯誤的概率都減小.單尾檢驗:

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負(fù)責(zé)。
  • 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時也不承擔(dān)用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

最新文檔

評論

0/150

提交評論