假設(shè)檢驗(yàn)基礎(chǔ)_第1頁
假設(shè)檢驗(yàn)基礎(chǔ)_第2頁
假設(shè)檢驗(yàn)基礎(chǔ)_第3頁
假設(shè)檢驗(yàn)基礎(chǔ)_第4頁
假設(shè)檢驗(yàn)基礎(chǔ)_第5頁
已閱讀5頁,還剩31頁未讀, 繼續(xù)免費(fèi)閱讀

下載本文檔

版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請(qǐng)進(jìn)行舉報(bào)或認(rèn)領(lǐng)

文檔簡(jiǎn)介

1、假設(shè)檢驗(yàn)基礎(chǔ)第1頁,共36頁,2022年,5月20日,1點(diǎn)44分,星期一2假設(shè)檢驗(yàn)(hypothesis test) 在數(shù)理統(tǒng)計(jì)上亦稱顯著性檢驗(yàn)是對(duì)所估計(jì)的總體首先提出一個(gè)假設(shè),然后通過樣本數(shù)據(jù)去推斷是否拒絕這一假設(shè)科研數(shù)據(jù)處理的重要工具;某事發(fā)生了: 是由于碰巧?還是由于必然的原因?統(tǒng)計(jì)學(xué)家運(yùn)用顯著性檢驗(yàn)來處理這類問題舉例:上課遲到,買雞蛋第2頁,共36頁,2022年,5月20日,1點(diǎn)44分,星期一3假設(shè)檢驗(yàn)的原因 由于個(gè)體差異的存在,即使從同一總體中嚴(yán)格的隨機(jī)抽樣,X1、X2、X3、X4、,不同。 因此,X1、X2 不同有兩種(而且只有兩種)可能:(1)分別所代表的總體均數(shù)相同,由于抽樣誤

2、差造成了樣本均數(shù)的差別。差別無統(tǒng)計(jì)學(xué)意義 。(2)分別所代表的總體均數(shù)不同。差別有統(tǒng)計(jì)學(xué)意義。第3頁,共36頁,2022年,5月20日,1點(diǎn)44分,星期一4 假設(shè)檢驗(yàn)的基本原理已知健康成年男子的脈搏均數(shù)為72次/分。某醫(yī)生在某山區(qū)隨機(jī)調(diào)查25名健康男子,求得脈搏均數(shù)為74.2次/分,標(biāo)準(zhǔn)差6.5次/分。能否認(rèn)為該山區(qū)的成年男子的脈搏均數(shù)高于一般成年男子的脈搏均數(shù)?樣本均數(shù)和總體均數(shù)的差異有兩種可能:抽樣誤差所致,有本質(zhì)差異n=25第4頁,共36頁,2022年,5月20日,1點(diǎn)44分,星期一5利用反證法思想,假設(shè)是由于第一個(gè)原因,計(jì)算產(chǎn)生 的概率(P)。若P較小,是小于或等于小概率事件的概率,即

3、在一次抽樣中一般不能發(fā)生,現(xiàn)在發(fā)生了,則有理由拒絕原假設(shè) ,接受與之對(duì)立的假設(shè)。若P不是很小,暫時(shí)接受原假設(shè)。 第5頁,共36頁,2022年,5月20日,1點(diǎn)44分,星期一6假設(shè)檢驗(yàn)的一般步驟建立假設(shè)、確定檢驗(yàn)水準(zhǔn)1兩種假設(shè):(1)檢驗(yàn)假設(shè):又稱無效假設(shè)、零假設(shè)、原假設(shè),是從反證法思想提出的。(2)備擇假設(shè):拒絕H0時(shí)而被接受的假設(shè),與H0對(duì)立。有三種情況: 雙側(cè)檢驗(yàn) 單側(cè)檢驗(yàn) 單側(cè)檢驗(yàn)2單、雙側(cè)的選擇:由專業(yè)知識(shí)來確定。3檢驗(yàn)水準(zhǔn):,又稱顯著性水準(zhǔn),是小概率事件的概率。通常取0.05。第6頁,共36頁,2022年,5月20日,1點(diǎn)44分,星期一7選定檢驗(yàn)方法,計(jì)算檢驗(yàn)統(tǒng)計(jì)量根據(jù)資料類型和推斷

4、目的選用不同的檢驗(yàn)方法。不同的檢驗(yàn)方法有相應(yīng)不同的檢驗(yàn)統(tǒng)計(jì)量及計(jì)算公式。所有檢驗(yàn)統(tǒng)計(jì)量都是在H0 成立的條件下計(jì)算出來的,反映了抽樣誤差的大小,并且服從已知的分布。 例: 成立條件下 , 則 用s代替,檢驗(yàn)統(tǒng)計(jì)量為 第7頁,共36頁,2022年,5月20日,1點(diǎn)44分,星期一8-2.0641.692 2.0640 =240.0250.025t0.05,24=2.064 P =P ( |t| 2.064 )=0.05 P=P(|t|1.692)0.05第8頁,共36頁,2022年,5月20日,1點(diǎn)44分,星期一9確定P值,作出推斷結(jié)論1P的含義:從規(guī)定的總體隨機(jī)抽得等于及大于(或等于及小于)現(xiàn)有

5、樣本獲得的檢驗(yàn)統(tǒng)計(jì)量值的概率。根據(jù)檢驗(yàn)統(tǒng)計(jì)量值,查相應(yīng)的界值表,確定P值。2得出結(jié)論:若 ,按檢驗(yàn)水準(zhǔn)拒絕H0 ,接受H1 ,有統(tǒng)計(jì)學(xué)意義;若 ,按檢驗(yàn)水準(zhǔn)不拒絕,無統(tǒng)計(jì)學(xué)意義。第9頁,共36頁,2022年,5月20日,1點(diǎn)44分,星期一10假設(shè)檢驗(yàn)特點(diǎn)1.類似于數(shù)學(xué)中的反證法 先建立假設(shè)(假設(shè)上課不遲到,雞蛋是新鮮的),然后通過計(jì)算證明,得出小概率事件發(fā)生,則該假設(shè)不成立。2.數(shù)學(xué)推斷是確定性的,而統(tǒng)計(jì)學(xué)推斷是以概率給出的,因此結(jié)論是相對(duì)的,得到任何結(jié)論都存在發(fā)生錯(cuò)誤的可能。第10頁,共36頁,2022年,5月20日,1點(diǎn)44分,星期一11u ( Z )檢驗(yàn)均數(shù)的 u 檢驗(yàn) 應(yīng)用條件:樣本含

6、量n較大,或總體標(biāo)準(zhǔn)差已知 1.單樣本u檢驗(yàn)2.兩大樣本的u檢驗(yàn) 第11頁,共36頁,2022年,5月20日,1點(diǎn)44分,星期一12例題71根據(jù)1983年大量調(diào)查結(jié)果,已知某地成年男子的脈搏均數(shù)為72次/分,某醫(yī)生2003年在該地隨機(jī)調(diào)查了75名成年男子,求其脈搏均數(shù)為74.2次/分,標(biāo)準(zhǔn)差為6.5次/分,能否據(jù)此認(rèn)為該地成年男子的脈搏不同于1983年?第12頁,共36頁,2022年,5月20日,1點(diǎn)44分,星期一13第13頁,共36頁,2022年,5月20日,1點(diǎn)44分,星期一14例題72為研究孕婦補(bǔ)鋅對(duì)胎兒生長(zhǎng)發(fā)育的影響,將96名孕婦隨機(jī)分為試驗(yàn)組和對(duì)照組,一組在孕期不同時(shí)間按要求補(bǔ)鋅,另

7、一組為對(duì)照,觀察兩組孕婦所生新生兒體重有無不同,兩組的例數(shù)、均數(shù)、標(biāo)準(zhǔn)差分別為:第14頁,共36頁,2022年,5月20日,1點(diǎn)44分,星期一15第15頁,共36頁,2022年,5月20日,1點(diǎn)44分,星期一16率的u檢驗(yàn)應(yīng)用條件:當(dāng)n較大,p和1-p均不太小時(shí),即np及n(1-p)均大于5時(shí) 1.樣本率與總體率的比較2.兩樣本率的比較第16頁,共36頁,2022年,5月20日,1點(diǎn)44分,星期一17例題7-3全國調(diào)查結(jié)果顯示,學(xué)齡前兒童營(yíng)養(yǎng)性貧血患病率為23.5%,某醫(yī)院為了解當(dāng)?shù)貙W(xué)齡前兒童營(yíng)養(yǎng)性貧血患病情況,對(duì)當(dāng)?shù)?396例學(xué)齡前兒童進(jìn)行了抽樣調(diào)查,查出營(yíng)養(yǎng)性貧血患兒363例,患病率26.

8、0%。問該地學(xué)齡前兒童營(yíng)養(yǎng)性貧血患病率是否不同于全國平均水平?第17頁,共36頁,2022年,5月20日,1點(diǎn)44分,星期一18第18頁,共36頁,2022年,5月20日,1點(diǎn)44分,星期一19例題7-4為了解某地在校男大學(xué)生肥胖與超重的情況,用隨機(jī)的方法分別調(diào)查了該地一所文科大學(xué)和一所工科大學(xué)的部分在校男生,其中文科大學(xué)調(diào)查了765人,檢出超重53人,超重率為6.9%,工科大學(xué)調(diào)查了882人,檢出超重22人,超重率為2.5%,試比較兩所大學(xué)男生的超重檢出率有無差別。第19頁,共36頁,2022年,5月20日,1點(diǎn)44分,星期一20第20頁,共36頁,2022年,5月20日,1點(diǎn)44分,星期一

9、21假設(shè)檢驗(yàn)兩類錯(cuò)誤 棄真錯(cuò)誤,即類錯(cuò)誤(),和存?zhèn)五e(cuò)誤,即類錯(cuò)誤( ) 大,則小,反之小大第21頁,共36頁,2022年,5月20日,1點(diǎn)44分,星期一22第22頁,共36頁,2022年,5月20日,1點(diǎn)44分,星期一23假設(shè)檢驗(yàn)中需注意的幾個(gè)問題1.建立假設(shè) “假設(shè)”是對(duì)總體特征的表述 H0與H1的表述隨資料性質(zhì)、分析目的和檢驗(yàn)方法而定。第23頁,共36頁,2022年,5月20日,1點(diǎn)44分,星期一24 2.不同變量或資料應(yīng)選用不同的檢驗(yàn) 3.資料的代表性與可比性 所謂代表性是指該樣本從相應(yīng)總體中經(jīng)隨機(jī)抽樣獲得,能夠代表總體的特征;所謂可比性是指各對(duì)比組間除了要比較的主要因素外,其它影響結(jié)

10、果的因素應(yīng)盡可能相同或相近 為了保證資料的可比性,必須要有嚴(yán)密的實(shí)驗(yàn)設(shè)計(jì),保證樣本隨機(jī)抽取于同質(zhì)總體,這是假設(shè)檢驗(yàn)得以正確應(yīng)用的前提 第24頁,共36頁,2022年,5月20日,1點(diǎn)44分,星期一254.結(jié)論不能絕對(duì)化 報(bào)告結(jié)果應(yīng)說明P 值。 5.統(tǒng)計(jì)結(jié)論必須與專業(yè)結(jié)論有機(jī)的結(jié)合 在做專業(yè)結(jié)論時(shí),應(yīng)在綜合考慮兩均數(shù)大小的實(shí)際意義、P值大小和設(shè)計(jì)科學(xué)性的基礎(chǔ)上進(jìn)行統(tǒng)計(jì)結(jié)論的專業(yè)解釋。第25頁,共36頁,2022年,5月20日,1點(diǎn)44分,星期一266.檢驗(yàn)水準(zhǔn)的確定 犯型錯(cuò)誤后果嚴(yán)重時(shí),要減小。 如一種新藥治療高血壓,該藥物副作用小,成本低。經(jīng)檢驗(yàn)若拒絕 ,則該藥有效,可推廣使用,這時(shí)為減小犯型

11、錯(cuò)誤的概率,降低 。 如新檢測(cè)方法與舊方法比較,不拒絕 ,可用新檢測(cè)方法代替舊方法,這時(shí)應(yīng)慎重,減少犯型錯(cuò)誤的概率,提高 。第26頁,共36頁,2022年,5月20日,1點(diǎn)44分,星期一277.單雙側(cè)的選擇:結(jié)合專業(yè)知識(shí)確定。 應(yīng)該用雙側(cè),用了單側(cè),易拒絕,易得出有差別的結(jié)論;應(yīng)該用單側(cè),用了雙側(cè),降低了檢驗(yàn)效能。 第27頁,共36頁,2022年,5月20日,1點(diǎn)44分,星期一28-2.0642.0640 =240.0250.025第28頁,共36頁,2022年,5月20日,1點(diǎn)44分,星期一29假設(shè)檢驗(yàn)的統(tǒng)計(jì)意義 1. P值的正確理解 2. 檢驗(yàn)結(jié)果的正確理解 . 統(tǒng)計(jì)結(jié)論的表述 . 假設(shè)檢

12、驗(yàn)與可信區(qū)間的區(qū)別與聯(lián)系 第29頁,共36頁,2022年,5月20日,1點(diǎn)44分,星期一30假設(shè)檢驗(yàn)的實(shí)際意義 P說明如果總體均數(shù)相等,得到本次實(shí)驗(yàn)(觀察結(jié)果(如兩樣本均數(shù)的差值)不大可能出現(xiàn),因而拒絕此H0,并不是說發(fā)現(xiàn)的差異一定有實(shí)際意義。從本章u檢驗(yàn)的所有計(jì)算公式中可以看出,假設(shè)檢驗(yàn)的結(jié)論與樣本大小有關(guān)。當(dāng)樣本量足夠大時(shí),標(biāo)準(zhǔn)誤趨于,無論兩樣本均數(shù)或兩樣本率相差多少,都能得足以拒絕H0的u值和P值。 反之,當(dāng)樣本很小時(shí),即使樣本均數(shù)差別較大也會(huì)得出較小的檢驗(yàn)統(tǒng)計(jì)量值和較大的P值而作出差別無統(tǒng)計(jì)意義的結(jié)論。因此,P值大小只能說明統(tǒng)計(jì)學(xué)意義的“顯著”,不一定有實(shí)際意義。 第30頁,共36頁,

13、2022年,5月20日,1點(diǎn)44分,星期一31影響檢驗(yàn)效能的4個(gè)因素 檢驗(yàn)效能用概率1-表示,其中為假設(shè)檢驗(yàn)不拒絕H0時(shí)犯類錯(cuò)誤的概率。檢驗(yàn)效能的意義是,當(dāng)兩總體確有差別,按檢驗(yàn)水準(zhǔn)假設(shè)檢驗(yàn)?zāi)馨l(fā)現(xiàn)其差別(拒絕H0)的能力。 .總體參數(shù)的差異越大,檢驗(yàn)效能越大。 .個(gè)體差異(標(biāo)準(zhǔn)差)越小,檢驗(yàn)效能越大。 3. 樣本量越大,檢驗(yàn)效能越大。 .檢驗(yàn)水準(zhǔn)(類錯(cuò)誤的概率)定得越寬,檢驗(yàn)效能越大。 第31頁,共36頁,2022年,5月20日,1點(diǎn)44分,星期一32多次重復(fù)檢驗(yàn)問題 多個(gè)觀察指標(biāo)的多次重復(fù)檢驗(yàn)問題 一個(gè)觀察指標(biāo)多次測(cè)量的重復(fù)檢驗(yàn)問題 第32頁,共36頁,2022年,5月20日,1點(diǎn)44分,星

14、期一33小結(jié)1.假設(shè)檢驗(yàn)的過程是:建立假設(shè);選擇檢驗(yàn)方法,計(jì)算檢驗(yàn)統(tǒng)計(jì)量;確定P值,得出結(jié)論。2.假設(shè)檢驗(yàn)的基本思想是:小概率事件在一次抽樣中不太可能出現(xiàn)。3.假設(shè)檢驗(yàn)方法很多,每種方法均有相應(yīng)的適用條件。綜合考慮研究目的、設(shè)計(jì)類型、變量類型、樣本含量等要素,才能選擇合適的檢驗(yàn)方法。第33頁,共36頁,2022年,5月20日,1點(diǎn)44分,星期一34u檢驗(yàn)資料檢驗(yàn)假設(shè)應(yīng)用條件計(jì)算公式大樣本均數(shù)和總體均數(shù)比較n30兩獨(dú)立大樣本均數(shù)比較n1與n2均大于30樣本率與總體率的比較np及n(1-p)均大于5兩獨(dú)立樣本率比較兩組np及n(1-p)均大于5第34頁,共36頁,2022年,5月20日,1點(diǎn)44分,星期一35習(xí)題1.兩個(gè)樣本均數(shù)比較,經(jīng)t檢驗(yàn),差別有統(tǒng)計(jì)學(xué)意義時(shí),P值越小,說明( ) A.兩樣本差別越大 B.兩總體均數(shù)差別越大C.越有理由認(rèn)為兩總體均數(shù)不同 D.越有理由認(rèn)為兩樣本均數(shù)不同 E.拒絕H1犯錯(cuò)誤的概率越小2.兩樣本均數(shù)比較時(shí),以下檢驗(yàn)水準(zhǔn)中第二類錯(cuò)誤最小的是(

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請(qǐng)下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請(qǐng)聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會(huì)有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫網(wǎng)僅提供信息存儲(chǔ)空間,僅對(duì)用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對(duì)用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對(duì)任何下載內(nèi)容負(fù)責(zé)。
  • 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請(qǐng)與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶因使用這些下載資源對(duì)自己和他人造成任何形式的傷害或損失。

評(píng)論

0/150

提交評(píng)論