單變量推論統(tǒng)計:假設檢驗_第1頁
單變量推論統(tǒng)計:假設檢驗_第2頁
單變量推論統(tǒng)計:假設檢驗_第3頁
單變量推論統(tǒng)計:假設檢驗_第4頁
單變量推論統(tǒng)計:假設檢驗_第5頁
已閱讀5頁,還剩55頁未讀 繼續(xù)免費閱讀

下載本文檔

版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進行舉報或認領

文檔簡介

第七講假設檢驗編輯課件第一節(jié)假設檢驗的根本問題一、假設檢驗的根本概念對總體的概率分布或分布參數(shù)作出某種“假設〞,根據(jù)抽樣得到的樣本觀測值,運用社會統(tǒng)計的分析方法,檢驗這種“假設〞是否正確,從而決定接受或拒絕“假設〞,這就是本講要討論的假設檢驗問題。編輯課件1、什么是假設?假設:定義為一個調(diào)研者或管理者對被調(diào)查總體的某些特征所做的一種假定或猜測。本講所討論的假設都是經(jīng)驗假設,而非理論假設。是對總體參數(shù)的一種假設。常見的是對總體均值或比例和方差的檢驗;在分析之前,被檢驗的參數(shù)將被假定取一確定值。我認為到KFC消費的人平均花費15元!編輯課件2、社會調(diào)查中常見的假設檢驗問題根據(jù)以往資料,某地女青年的平均初婚年齡μ=20歲,但今年根據(jù)100名女青年的隨機抽樣調(diào)查,=21歲,問能否認為該地女青年的初婚年齡比以往有所推遲?根據(jù)隨機抽樣調(diào)查,文化程度高的家庭,平均子女數(shù)也要少些。兩者呈負相關r=-0.3。問這樣的結(jié)論是否具有普遍意義?可見,假設的內(nèi)容,都是數(shù)量化的內(nèi)容〔μ=20?r=-0.3〕,而驗證的依據(jù),都是憑借抽樣調(diào)查所得到的結(jié)果?!渤闃颖仨殢目傮w隨機抽取〕編輯課件什么是假設?對總體參數(shù)的一種看法總體參數(shù)包括總體均值、比例、方差等分析之前必需陳述編輯課件概念事先對總體參數(shù)或分布形式作出某種假設然后利用樣本信息來判斷原假設是否成立類型參數(shù)假設檢驗〔μ—檢驗法、t—檢驗法等〕非參數(shù)假設檢驗〔在總體方差未知或知道甚少的情況下,利用樣本數(shù)據(jù)對總體分布形態(tài)等進行推斷的方法,在推斷過程中不涉及有關總體分布的參數(shù),如卡方檢驗〕3.特點采用邏輯上的反證法依據(jù)統(tǒng)計上的小概率原理什么是假設檢驗?編輯課件...因此我們拒絕假設=

20...如果這是總體的真實均值樣本均值m

=50抽樣分布H0這個值不像我們應該得到的樣本均值...20假設檢驗的根本思想編輯課件3.小概率原理小概率原理是假設檢驗的根本依據(jù),即認為小概率事件在一次試驗中幾乎是不可能發(fā)生的。當進行假設檢驗時,先假設H0正確,在此假設下,假設小概率事件A出現(xiàn)的概率很小,例如P〔A〕=0.01,經(jīng)過取樣試驗后,A出現(xiàn)了,那么違反了上述原理,我們認為這是一個不合理的結(jié)果。例如,我們每天從電視、報紙上都能看到交通事故的發(fā)生,但人們絕不會因此而放棄交通工具的使用?!疤字腥栓暶刻鞄в陚?、雨鞋而被視作怪人??梢?,人們總是在不自覺地運用小概率原理。編輯課件這時,我們只能疑心作為小概率事件A的前提假設H0的正確性,于是否認H0。反之,如果試驗中A沒有出現(xiàn),我們就沒有理由否認假設H0,從而做出接受H0的結(jié)論。下面我們通過實例來說明假設檢驗的根本思想及推理方法。編輯課件4、原假設和備擇假設原假設H0是關于總體均值而非樣本統(tǒng)計量的假設總是假設原假設是正確的原假設可能被接受也可能被拒絕備擇假設H1是原假設的對立備擇假設可能被接受也可能被拒絕備擇假設是試圖要建立的檢驗編輯課件二、假設檢驗的根本思路與方法假設檢驗的步驟提出原假設和備擇假設確定適當?shù)臋z驗統(tǒng)計量規(guī)定顯著性水平計算檢驗統(tǒng)計量的值作出統(tǒng)計決策編輯課件(1)建立假設(2)求抽樣分布(4)計算檢驗統(tǒng)計量(3)選擇顯著性水平和否認域(5)判定所所包有

含統(tǒng)的計步檢驟驗根據(jù)以往多年的統(tǒng)計說明,宜賓學院?社會統(tǒng)計學?的平均成績?yōu)?0分,隨機抽取100個學生,其平均成績?yōu)?0分,問今年宜賓學院?社會統(tǒng)計學?成績是否下降?編輯課件提出原假設和備擇假設什么是原假設?(NullHypothesis)1.待檢驗的假設,又稱“0假設〞2.如果錯誤地作出決策會導致一系列后果3.總是有等號,或4.表示為H0H0:某一數(shù)值指定為=號,即或例如,H0:3190〔元〕為什么叫0假設編輯課件什么是備擇假設?(AlternativeHypothesis)1.與原假設對立的假設2.總是有不等號:

,

3.表示為H1H1:

<某一數(shù)值,或

某一數(shù)值例如,H1:

<3910(元),或

3910(元)提出原假設和備擇假設編輯課件什么檢驗統(tǒng)計量?用于假設檢驗問題的統(tǒng)計量選擇統(tǒng)計量的方法與參數(shù)估計相同,需考慮是大樣本還是小樣本總體方差還是未知檢驗統(tǒng)計量的根本形式為確定適當?shù)臋z驗統(tǒng)計量編輯課件規(guī)定顯著性水平

什么是顯著性水平?1.是一個概率值2.原假設為真時,拒絕原假設的概率被稱為抽樣分布的拒絕域3.表示為

(alpha)常用的值有0.01,0.05,0.104.由研究者事先確定編輯課件作出統(tǒng)計決策計算檢驗的統(tǒng)計量根據(jù)給定的顯著性水平,查表得出相應的臨界值Z或Z/2將檢驗統(tǒng)計量的值與水平的臨界值進行比較得出接受或拒絕原假設的結(jié)論編輯課件兩類錯誤分析小概率原理是假設檢驗的根本依據(jù),然而,對于小概率事件,無論其概率多么小,還是可能發(fā)生的,所以,利用小概率原理為根底的假設檢驗方法進行檢驗,可能會做出錯誤的判斷,主要有兩種形式〔1〕原假設H0實際是正確的,但卻錯誤地拒絕了H0,這樣就犯了“棄真〞的錯誤,通常稱為第一類錯誤。由于僅當所考慮的小概率事件A發(fā)生時才拒絕H0,所以犯第一類錯誤的概率就是條件概率:〔2〕原假設H0實際是不正確的,但是卻錯誤地接受了H0,這樣就犯了“納偽〞的錯誤,通常稱為第二類錯誤。犯第二類錯誤的概率記為。編輯課件編輯課件編輯課件我們自然希望犯這兩類錯誤的概率越小越好。但當樣本容量n確定后,犯這兩類錯誤的概率不可能同時被控制,通常在我們根據(jù)歷史經(jīng)驗選取恰當?shù)娘@著性水平

后,通過擴大樣本容量n的方式來使第二類錯誤的概率減小。編輯課件H0:無罪假設檢驗中的兩類錯誤〔決策結(jié)果〕陪審團審判裁決實際情況無罪有罪無罪正確錯誤有罪錯誤正確H0檢驗決策實際情況H0為真H0為假接受H01-a第二類錯誤(b)拒絕H0第一類錯誤(a)功效(1-b)假設檢驗就好似一場審判過程統(tǒng)計檢驗過程編輯課件

錯誤和

錯誤的關系

你不能同時減少兩類錯誤!和的關系就像翹翹板,小就大,大就小編輯課件第二節(jié)單一總體參數(shù)的假設檢驗Z檢驗(單尾和雙尾)t檢驗(單尾和雙尾)Z檢驗(單尾和雙尾)

c2檢驗(單尾和雙尾)均值一個總體比例方差編輯課件

建立假設的三種情況:農(nóng)村居民月人均收入水平的評估編輯課件檢驗中學老師對學生平均成績承諾的有效性:中學老師對學生學習成績的承諾編輯課件統(tǒng)計報表的驗證:統(tǒng)計數(shù)據(jù)是否真實的依據(jù)編輯課件雙側(cè)檢驗與單側(cè)檢驗

(假設的形式)假設研究的問題雙側(cè)檢驗左側(cè)檢驗右側(cè)檢驗H0m=m0m

m0m

m0H1m≠m0m<m0m>m0編輯課件根據(jù)否認域位置的不同,可以將假設檢驗分為雙側(cè)檢驗和單側(cè)檢驗。在統(tǒng)計中,必須把否認域分配到抽樣分布的兩端的檢驗,被稱為雙側(cè)檢驗。在統(tǒng)計中,可以事先能預測偏差方向,因而可以把否認域集中到抽樣分布更適宜的一端的檢驗,被稱為單側(cè)檢驗。雙側(cè)檢驗和單側(cè)檢驗編輯課件雙側(cè)檢驗

〔原假設與備擇假設確實定〕雙側(cè)檢驗屬于決策中的假設檢驗。也就是說,不管是拒絕H0還是接受H0,我們都必需采取相應的行動措施。例如,某單位職工上月平均收入為2100元,本月大于或小于2100元均屬于發(fā)生變化。建立的原假設與備擇假設應為H0:=2100H1:2100編輯課件雙側(cè)檢驗

〔確定假設的步驟〕1.某單位職工上月平均收入為2100元,本月調(diào)查了100名職工,平均收入為2200元,標準差為15元。問該單位職工本月平均收入與上月相比是否有變化?2.步驟從統(tǒng)計角度陳述問題(

=2100)從統(tǒng)計角度提出相反的問題(

2100)必需互斥和窮盡提出原假設(

=2100)提出備擇假設(

2100)有

符號編輯課件雙側(cè)檢驗

〔確定假設的步驟〕1.某單位職工上月平均收入為2100元,本月調(diào)查了100名職工,平均收入為2200元,標準差為15元。問該單位職工本月平均收入與上月相比是否有變化?[解]首先建立虛無假設〔H0〕和研究假設〔H1〕即有H0:μ=2100H1:2100選擇顯著性水平α=0.05,查標準正態(tài)分布得由于Z=6.67>所以,拒絕虛無假設,即從總體上說,該單位職工平均收入與上月相比有變化。編輯課件雙側(cè)檢驗

〔顯著性水平與拒絕域〕抽樣分布H0值臨界值臨界值a/2a/2

樣本統(tǒng)計量拒絕域拒絕域接受域1-

置信水平編輯課件雙側(cè)檢驗

〔顯著性水平與拒絕域〕H0值臨界值臨界值a/2a/2

樣本統(tǒng)計量拒絕域拒絕域接受域抽樣分布1-

置信水平編輯課件雙側(cè)檢驗

〔顯著性水平與拒絕域〕H0值臨界值臨界值

a/2a/2

樣本統(tǒng)計量拒絕域拒絕域接受域抽樣分布1-

置信水平編輯課件雙側(cè)檢驗

〔顯著性水平與拒絕域〕H0值臨界值臨界值a/2a/2

樣本統(tǒng)計量拒絕域拒絕域接受域抽樣分布1-

置信水平編輯課件[例]一位研究者試圖檢驗某一社會調(diào)查所運用的抽樣程序,該項調(diào)查是由一些缺乏經(jīng)驗的訪問員進行的。研究者疑心屬于干部和知識分子的家庭抽得過多。過去的統(tǒng)計資料說明,該街區(qū)的家庭收入是7500元,標準差是1500元;此次調(diào)查共抽取100個家庭樣本平均收入是7900元。問:該研究人員是否有理由懷疑該樣本有偏估?〔選用α=0.05〕總體均值和成數(shù)的單樣本檢驗1.σ,對總體均值的檢驗實際上是要檢驗“隨機抽樣〞這個零假設編輯課件[解]根據(jù)題意,可做如下假設,并做單側(cè)檢驗因α=0.05,查表得Z0.05=1.65,故否認域為根據(jù)中心極限定理,檢驗統(tǒng)計量計算得檢驗統(tǒng)計量Z的計算說明,樣本均值比總體均值大2.67個標準差〔〕,超過了顯著性水平規(guī)定的臨界值,調(diào)查者應該否認“隨機抽樣〞的零假設。也就是說,由于抽樣在程序上不合要求,這項社會調(diào)查有必要重新組織。編輯課件中心極限定理實際解決了大樣本均值的檢驗問題。假定樣本比較大(n>50,這在社會調(diào)查中一般都能得到滿足),樣本均值的抽樣分布就與總體分布無關,而服從正態(tài)分布。當H0成立時,樣本均值的觀察值比較集中地分布在總體均值μ周圍;當H0不成立時,將對μ有明顯偏離的趨勢。因而,我們可以在選定的顯著性水平上,通過計算檢驗統(tǒng)計量Z,對零假設進行檢定。注:當σ未知時,只要樣本量很大,就可用S來代替σ。但對于小樣本,Z檢驗就要用t檢驗來替代了,而且還必須嚴格限于正態(tài)總體。編輯課件[解]根據(jù)題意,可作如下的假設,并做雙側(cè)檢驗H0:μ=2330元H1:μ≠2330元因α=0.05,查正態(tài)分布表得Zα/2=1.96,故否認域|Z|≥1.96計算檢驗統(tǒng)計量Z=≈==1.20<1.96所以,不能認為該單位人均月收入不是2330元,即不能認為該統(tǒng)計報表有誤。

[例]某單位統(tǒng)計報表顯示,人均月收入為2330元,為了驗證該統(tǒng)計報表的正確性,作了共81人的抽樣調(diào)查,樣本人均月收入為2350元,標準差為150元,問能否說明該統(tǒng)計報表顯示的人均收入的數(shù)字有誤(取顯著性水平α=0.05)。

此乃“總體均值〞零假設的檢驗編輯課件為了驗證統(tǒng)計報表的正確性,作了共五十人的抽樣調(diào)查,人均收入的結(jié)果有:,問能否證明統(tǒng)計報表中人均收入μ=880元是正確的〔顯著性水平α=0.05〕。

假設檢驗與區(qū)間估計的聯(lián)系編輯課件

編輯課件單側(cè)檢驗

〔原假設與備擇假設確實定〕檢驗研究中的假設將所研究的假設作為備擇假設H1將認為研究結(jié)果是無效的說法或理論作為原假設H0。或者說,把希望(想要)證明的假設作為備擇假設先確立備擇假設H1編輯課件單側(cè)檢驗

〔原假設與備擇假設確實定〕例如,根據(jù)抽樣調(diào)查,九個人的平均初婚年齡是23.5歲,該地區(qū)平均初婚年齡是否超過20歲?屬于研究中的假設建立的原假設與備擇假設應為

H0:

20H1:

20編輯課件單側(cè)檢驗

〔原假設與備擇假設確實定〕檢驗某項聲明的有效性將所作出的說明(聲明)作為原假設對該說明的質(zhì)疑作為備擇假設先確立原假設H0除非我們有證據(jù)說明“聲明〞無效,否那么就應認為該“聲明〞是有效的編輯課件2.小樣本總體均值的檢驗〔學生t分布〕中心極限定理解決了大樣本均值的檢驗問題。但是當n較小時,用這種方法求出的概率可能是錯誤的,有必要做某種修正。于是有人設計了另一種檢驗統(tǒng)計量這個統(tǒng)計量最初是由戈塞特(1876一1937)用筆名“學生〞發(fā)表,所以這個統(tǒng)計量的抽樣分布稱為學生t分布。比較t和Z,我們注意到它們的分子相同,而分母卻稍有不同:①σ為S所代替(這一點無須解釋);②根號下是n―1。編輯課件

當Z為t替代時,雖用因子n—1所導致的修正看起來不大,但在樣本容量較小時,這種修正就會起很大作用了。所以當不知道σ值、且樣本容量較小時,我們應該考慮應用t分布而不是Z分布。采用n―1的原因:樣本數(shù)據(jù)的離散程度小于總體數(shù)據(jù)的離散程度。n―1實際為自由度數(shù)k。編輯課件[例]初婚年齡服從正態(tài)分布。根據(jù)10人的調(diào)查有=23.5歲,S=3歲,問是否可以認為該地區(qū)的平均初婚年齡已超過20歲?〔α=0.01〕[解]H0:=20;H1:>20因為n小,又不知σ值,因此用t檢驗對自由度9來講,單側(cè)檢驗和顯著性水平0.01,查表知否認域為t值等于或大于2.821。再計算檢驗統(tǒng)計量因此拒絕H0,即可以認為在顯著性水平為0.01的條件下,該地區(qū)的初婚年齡已超過20歲。編輯課件單側(cè)檢驗

〔顯著性水平與拒絕域〕H0值臨界值a樣本統(tǒng)計量拒絕域接受域抽樣分布1-

置信水平編輯課件左側(cè)檢驗

〔顯著性水平與拒絕域〕H0值臨界值a樣本統(tǒng)計量拒絕域接受域抽樣分布1-

置信水平觀察到的樣本統(tǒng)計量編輯課件左側(cè)檢驗

〔顯著性水平與拒絕域〕H0值臨界值a樣本統(tǒng)計量拒絕域接受域抽樣分布1-

置信水平編輯課件右側(cè)檢驗

〔顯著性水平與拒絕域〕H0值臨界值a樣本統(tǒng)計量拒絕域接受域抽樣分布1-

置信水平觀察到的樣本統(tǒng)計量編輯課件右側(cè)檢驗

〔顯著性水平與拒絕域〕H0值臨界值a樣本統(tǒng)計量接受域抽樣分布1-

置信水平拒絕域編輯課件提出原假設:H0:

25%選擇備擇假設:H1::

25%

學生中經(jīng)常上網(wǎng)的人數(shù)超過25%嗎?〔屬于研究中的假設,先提出備擇假設〕右側(cè)檢驗

〔例子〕編輯課件3.大樣本成數(shù)的檢驗有時,需要對總體中具有某種特征的單位在總體中所占的的比例p〔即總體成數(shù)〕作顯著性檢驗,如人口中的失業(yè)率、學齡兒童中的失學率等等。成數(shù)檢驗與二項檢驗的聯(lián)系是不言而愈的。因為在二項檢驗中,隨機變量是樣本的“成功〞次數(shù)x。而在成數(shù)檢驗中,隨機變量是樣本的“成功〞比例〔即樣本成數(shù)〕,這樣在n一定的情況下,顯然有編輯課件既然是一個隨機變量,那么把具體概率賦予樣本成數(shù)的每一個取值,我們就得到了樣本成數(shù)的抽樣分布。根據(jù)中心極限定理,我們不難想見,當n足夠大時,樣本成數(shù)的抽樣分布也服從正態(tài)分布。由于數(shù)學上很容易證明,,這樣一來,對于大樣本(n≥30,np≥5),成數(shù)的檢驗統(tǒng)計量Z可表示為編輯課件[例]某地區(qū)成年男性中吸煙者占64%,經(jīng)過戒煙宣傳后進行抽樣調(diào)查,發(fā)現(xiàn)100名被調(diào)查者中,有55人是吸煙者,試問戒煙宣傳是否有成效〔α=0.05〕[解]n=100>30,np=l00×0.64=64>5,故可使用正態(tài)檢驗。又知=0.55,p=0.64,q=0.36,那么H0:p=0.64H1:p<0.64據(jù)題意,選擇單側(cè)檢驗,因α=0.05,查正態(tài)分布表得否認域為|Z|≥1.65。再計算檢驗統(tǒng)計量

因此,否認零假設,即認為戒煙宣傳

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預覽,若沒有圖紙預覽就沒有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負責。
  • 6. 下載文件中如有侵權(quán)或不適當內(nèi)容,請與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

評論

0/150

提交評論