統(tǒng)計學課件-ch03總體均數(shù)的估計與假設檢驗_第1頁
統(tǒng)計學課件-ch03總體均數(shù)的估計與假設檢驗_第2頁
統(tǒng)計學課件-ch03總體均數(shù)的估計與假設檢驗_第3頁
統(tǒng)計學課件-ch03總體均數(shù)的估計與假設檢驗_第4頁
統(tǒng)計學課件-ch03總體均數(shù)的估計與假設檢驗_第5頁
已閱讀5頁,還剩121頁未讀, 繼續(xù)免費閱讀

下載本文檔

版權說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權,請進行舉報或認領

文檔簡介

1、課件,1,第三章 總體均數(shù)的估計與假設檢驗,課件,2,講述內(nèi)容: 第一節(jié) 均數(shù)的抽樣誤差與標準誤 第二節(jié) t 分布 第三節(jié) 總體均數(shù)的估計 第四節(jié) t 檢驗 第五節(jié) 假設檢驗的注意事項 第六節(jié) 正態(tài)性檢驗和兩樣本方差比較的 F 檢驗,課件,3,第一節(jié) 均數(shù)的抽樣誤差與標準誤,課件,4,統(tǒng)計推斷:由樣本信息推斷總體特征。,正態(tài)(分布)總體: 推斷 ! 說明! 為說明抽樣誤差規(guī)律,先用一個實例,后引出理論。,課件,5,圖3-1 1999年某市18歲男生身高N(167.7, 5.32)的抽樣示意圖,課件,6,見P3436表3-1,課件,7,將此100個樣本均數(shù)看成新變量值,則這100個樣本均數(shù)構成一

2、新分布,繪制直方圖。,圖3-2 從正態(tài)分布總體N(167.7, 5.32)隨機抽樣所得樣本均數(shù)分布,課件,8, ,各樣本均數(shù) 未必等于總體均數(shù); 各樣本均數(shù)間存在差異; 樣本均數(shù)的分布為中間多,兩邊少,左右基本對稱。 樣本均數(shù)的變異范圍較之原變量的變異范圍大大縮小。 可算得這100個樣本均數(shù)的均數(shù)為167.69cm、標準差為1.69cm。,樣本均數(shù)的抽樣分布具有如下特點:,課件,9,1、抽樣誤差:,由個體變異產(chǎn)生的、抽樣造成的樣本統(tǒng)計量與總體參數(shù)的差別 均數(shù)的抽樣誤差:由于抽樣造成的樣本均數(shù)與總體均數(shù)的差別 原因:1)抽樣 2)個體差異,課件,10,本書以n=60為界限,課件,11,表示樣本統(tǒng)

3、計量抽樣誤差大小的統(tǒng)計指標。 均數(shù)標準誤:說明均數(shù)抽樣誤差的大小,總體計算公式 (3-1),2、標準誤(standard error, SE),實質(zhì):樣本均數(shù)的標準差,課件,12,數(shù)理統(tǒng)計證明:,課件,13,若用樣本標準差S 來估計 , (3-2) 降低抽樣誤差的途徑有: 通過增加樣本含量n; 通過設計減少S。,課件,14,第二節(jié) t 分布 (t-distribution),課件,15,一、t 分布的概念,課件,16,課件,17,式中 為自由度(degree of freedom, df),3實際工作中,由于 未知,用 代替,則 不再服從標準正態(tài)分布,而服從t 分布。,課件,18,二、t 分布

4、的圖形與特征,分布只有一個參數(shù),即自由度,課件,19,圖3-3 不同自由度下的t 分布圖,課件,20,1特征:,課件,21,2 t界值表:詳見附表2,可反映t分布曲線下的面積。 單側(cè)概率或單尾概率:用 表示; 雙側(cè)概率或雙尾概率:用 表示。,課件,22,課件,23,課件,24,第三節(jié) 總體均數(shù)的估計,課件,25,一、參數(shù)估計 用樣本統(tǒng)計量推斷總體參數(shù)。 總體均數(shù)估計:用樣本均數(shù)(和標準差)推斷總體均數(shù)。,課件,26,課件,27,按預先給定的概率(1)所確定的包含未知總體參數(shù)的一個范圍。 總體均數(shù)的區(qū)間估計:按預先給定的概率(1)所確定的包含未知總體均數(shù)的一個范圍。 如給定=0.05,該范圍稱為

5、參數(shù)的95%可信區(qū)間或置信區(qū)間; 如給定=0.01,該范圍稱為參數(shù)的99%可信區(qū)間或置信區(qū)間。,2區(qū)間估計(interval estimation):,課件,28,二、總體均數(shù)可信區(qū)間的計算,課件,29,1. 單一總體均數(shù)的可信區(qū)間,課件,30,課件,31,P25,15號樣本,課件,32,課件,33,課件,34,例3-3 某地抽取正常成年人200名,測得其血清膽固醇的均數(shù)為3.64 mmol/L,標準差為1.20mmol/L,估計該地正常成年人血清膽固醇均數(shù)的95%可信區(qū)間。,課件,35,故該地正常成年人血清膽固醇均數(shù)的雙側(cè)95%可信區(qū)間為(3.47, 3.81)mmolL。,課件,36,課件

6、,37,課件,38,課件,39,例3-4 為了解氨甲喋呤(MTX)對外周血IL-2水平的影響,某醫(yī)生將61名哮喘患者隨機分為兩組。其中對照組29例( ),采用安慰劑;實驗組32例( ),采用小劑量氨甲喋呤(MTX)進行治療。測得對照組治療前IL-2的均數(shù)為20.10 IU/ml ( ),標準差為7.02 IU/ml ( );試驗組治療前IL-2的均數(shù)為16.89 IU/ml ( ),標準差為8.46 IU/ml ( )。問兩組治療前基線的IL-2總體均數(shù)相差有多大?,課件,40,第一步:,課件,41,能否下兩組IL-2的總體均數(shù)“不同”或“有差別”的結(jié)論?,課件,42,三、可信區(qū)間的確切涵義,

7、課件,43,觀察p25表3-1: 當1=95%時,在算得的100個可信區(qū)間中,有95個可信區(qū)間包含了總體均數(shù),而另外5個(表3-1中第20號、31號、54號、76號和82號)不包括。,課件,44,如果能夠進行重復抽樣試驗,平均有1(如95%)的可信區(qū)間包含了總體參數(shù),而不是總體參數(shù)落在該范圍的可能性為1。但在實際工作中,只能根據(jù)一次試驗結(jié)果估計可信區(qū)間,如例3-3,95%的可信區(qū)間為3.47 3.81mmolL,就認為該區(qū)間包含了總體均數(shù) 。,可信區(qū)間的確切涵義:,課件,45,一是可信度1,愈接近1愈好,如99%的可信度比95%的可信度要好; 二是區(qū)間的寬度,區(qū)間愈窄愈好。 當樣本含量為定值時

8、,上述兩者互相矛盾。 在可信度確定的情況下,增加樣本含量可減小區(qū)間寬度。,可信區(qū)間估計的優(yōu)劣取決于兩個方面:,課件,46,四、總體均數(shù)可信區(qū)間 與參考值范圍的區(qū)別,課件,47,* 也可用對應于雙尾概率時), *也可用對應于雙尾概率時),表3-2 總體均數(shù)的可信區(qū)間與參考值范圍的區(qū)別,課件,48,第四節(jié) t 檢驗,課件,49,1、樣本均數(shù) 與已知某總體均數(shù) 比較的t檢驗 目的:推斷一個未知總體均數(shù) 與已知總體均 數(shù) 是否有差別,用單樣本設計。 2、兩個樣本均數(shù) 與 比較的t檢驗目的:推斷兩個未知總體均數(shù) 與 是否有差 別,用成組設計。 3、配對設計資料均數(shù)比較的t檢驗目的:推斷兩個未知總體均數(shù)

9、與 是否有差別用配對設計。,t 檢驗,亦稱student t 檢驗,有 下述情況:,課件,50,對于大樣本,也可以近似用u檢驗,課件,51,t 檢驗的應用條件:,課件,52,假設檢驗過去稱顯著性檢驗。它是利用小概率反證法思想,從問題的對立面(H0)出發(fā)間接判斷要解決的問題(H1)是否成立。然后在H0成立的條件下計算檢驗統(tǒng)計量,最后獲得P值來判斷。,假設檢驗基本思想及步驟,課件,53,例3-5 某醫(yī)生測量了36名從事鉛作業(yè)男性工人的血紅蛋白含量,算得其均數(shù)為130.83g/L,標準差為25.74g/L。問從事鉛作業(yè)工人的血紅蛋白是否不同于正常成年男性平均值140g/L?,課件,54,假設檢驗的目

10、的就是判斷差別是由哪種情況造成的,單純 抽樣誤差造成的 抽樣誤差和本質(zhì)差異造成的,課件,55,正常成年男性 血紅蛋白 140g/L,130.83g/L,男性鉛作業(yè)工人 血紅蛋白 140g/L,一種假設H0,另一種假設H1,抽樣誤差,總體不同,課件,56,課件,57,H1的內(nèi)容直接反映了檢驗單雙側(cè)。若H1中只是 0 或 0,則此檢驗為單側(cè)檢驗。它不僅考慮有無差異,而且還考慮差異的方向。 單雙側(cè)檢驗的確定,首先根據(jù)專業(yè)知識,其次根據(jù)所要解決的問題來確定。若從專業(yè)上看一種方法結(jié)果不可能低于或高于另一種方法結(jié)果,此時應該用單側(cè)檢驗。一般認為雙側(cè)檢驗較保守和穩(wěn)妥。,課件,58,(3) 檢驗水準,過去稱顯

11、著性水準,是預先規(guī)定的概率值,它確定了小概率事件的標準。在實際工作中常取 = 0.05??筛鶕?jù)不同研究目的給予不同設置。,課件,59,課件,60,課件,61,圖3-5 例3-5中P值示意圖,課件,62,課件,63,若 ,是否也能下“無差別”或“相等”的結(jié)論?,課件,64,一、單樣本 t 檢驗 (one sample / group t-test),即樣本均數(shù) (代表未知總體均數(shù))與已知總體均數(shù)0(一般為理論值、標準值或經(jīng)過大量觀察所得穩(wěn)定值等)的比較。其檢驗統(tǒng)計量按下式計算,課件,65,例3-5 某醫(yī)生測量了36名從事鉛作業(yè)男性工人的血紅蛋白含量,算得其均數(shù)為130.83g/L,標準差為25.

12、74g/L。問從事鉛作業(yè)工人的血紅蛋白是否不同于正常成年男性平均值140g/L? (1)建立檢驗假設,確定檢驗水準 H0: =0 =140g/L,即鉛作業(yè)男性工人平均血紅 蛋白含量與正常成年男性平均值相等 H1: 0=140g/L,即鉛作業(yè)男性工人平均血紅 蛋白含量與正常成年男性平均值不等 =0.05,課件,66,(2)計算檢驗統(tǒng)計量,課件,67,(3)確定P值,作出推斷結(jié)論,課件,68,配對t 檢驗適用于配對設計的計量資料。 配對設計類型:兩同質(zhì)受試對象分別接受兩種不同的處理;同一受試對象分別接受兩種不同處理;同一受試對象(一種)處理前后。,二、配對t 檢驗 (paired / matche

13、d t-test),課件,69,例3-6 為比較兩種方法對乳酸飲料中脂肪含量測定結(jié)果是否不同,某人隨機抽取了10份乳酸飲料制品,分別用脂肪酸水解法和哥特里羅紫法測定其結(jié)果如表3-3第(1)(3)欄。問兩法測定結(jié)果是否不同?,課件,70,表3-3 兩種方法對乳酸飲料中脂肪含量的測定結(jié)果(%),課件,71,(1)建立檢驗假設,確定檢驗水準 H0:d0,即兩種方法的測定結(jié)果相同 H1:d0,即兩種方法的測定結(jié)果不同 =0.05 (2)計算檢驗統(tǒng)計量 本例n=10,d=2.724,d2=0.8483,,課件,72,按公式(3-16) (3)確定P值,作出推斷結(jié)論 查附表2的t界值表得P0.001。按=

14、0.05水準,拒絕H0,接受H1,有統(tǒng)計學意義??烧J為兩種方法對脂肪含量的測定結(jié)果不同,哥特里羅紫法測定結(jié)果較高。,課件,73,三、兩樣本t檢驗 (two-sample / group t-test),又稱成組 t 檢驗,適用于完全隨機設計兩樣本均數(shù)的比較,此時人們關心的是兩樣本均數(shù)所代表的兩總體均數(shù)是否不等。兩組完全隨機設計是將受試對象完全隨機分配到兩個不同處理組。,課件,74,適用范圍: 完全隨機設計兩樣本均數(shù)的比較 檢驗方法:依兩總體方差是否齊性而定。,課件,75,課件,76,例3-7 為研究國產(chǎn)四類新藥阿卡波糖膠囊的降血糖效果,某醫(yī)院用40名II型糖尿病病人進行同期隨機對照試驗。試驗者

15、將這些病人隨機等分到試驗組(用阿卡波糖膠囊)和對照組(用拜唐蘋膠囊),分別測得試驗開始前和8周后的空腹血糖,算得空腹血糖下降值見表3-4,能否認為該國產(chǎn)四類新藥阿卡波糖膠囊與拜唐蘋膠囊對空腹血糖的降糖效果不同?,課件,77,課件,78,(2)計算檢驗統(tǒng)計量,課件,79,(3)確定P值,作出推斷結(jié)論,課件,80,若變量變換后總體方差齊性 可采用t 檢驗(如兩樣本幾何均數(shù)的t 檢驗,就是將原始數(shù)據(jù)取對數(shù)后進行t 檢驗); 若變量變換后總體方差仍然不齊 可采用t 檢驗或Wilcoxon秩和檢驗。,若兩總體方差不等( ),?,課件,81,2. Cochran & Cox近似t 檢驗(t 檢驗),課件,

16、82,課件,83,例3-8 在上述例3-7國產(chǎn)四類新藥阿卡波糖膠囊的降血糖效果研究中,測得用拜唐蘋膠囊的對照組20例病人和用阿卡波糖膠囊的試驗組20例病人,其8周時糖化血紅蛋白HbA1c(%)下降值如表3-5。問用兩種不同藥物的病人其HbA1c下降值是否不同?,課件,84,表3-5 對照組和試驗組HbA1c下降值(%),對照組方差是試驗組方差的3.77倍,經(jīng)方差齊性檢驗,認為兩組的總體方差不等,故采用近似 t 檢驗。,課件,85,(1)建立檢驗假設,確定檢驗水準(略),(2)計算檢驗統(tǒng)計量,課件,86,(3)確定P值,作出推斷結(jié)論。 查t界值表t0.05/2,19=2.093。,由t=0.96

17、50.05。按=0.05水準,不拒絕H0,無統(tǒng)計學意義。還不能認為用兩種不同藥物的病人其HbA1c下降值不同。,課件,87,3. Satterthwaite近似t檢驗 : Cochran & Cox法是對臨界值校正 而Satterthwaite法則是對自由度校正。,課件,88,以=28.428、t=0.965查附表2的t界值表得0.20P0.40。結(jié)論同前。,按Satterthwaite法對例3-8做檢驗,得,課件,89,3.Welch法近似t檢驗 Welch法也是對自由度進行校正。校正公式為,課件,90,對例3-8,如按Welch法,則,以=29.429、t =0.965查附表2的t界值表得

18、0.20P0.40。結(jié)論同前。,課件,91,第五節(jié) 假設檢驗注意事項,課件,92,一、I型錯誤和II型錯誤,假設檢驗是利用小概率反證法思想,根據(jù)P值判斷結(jié)果,此推斷結(jié)論具有概率性,因而無論拒絕還是不拒絕H0,都可能犯錯誤。見表3-8。,課件,93,表3-8 可能發(fā)生的兩類錯誤,課件,94,I 型錯誤:“實際無差別,但下了有差別的結(jié)論”,假陽性錯誤。犯這種錯誤的概率是(其值等于檢驗水準) II型錯誤:“實際有差別,但下了不拒絕H0的結(jié)論”,假陰性錯誤。犯這種錯誤的概率是(其值未知) 。 但 n 一定時, 增大, 則減少 。 1- :檢驗效能(power):當兩總體確有差別,按檢驗水準 所能發(fā)現(xiàn)這種差別的能力。,課件,95,圖3-6 I型錯誤與II型錯誤示意圖(以單側(cè)u檢驗為例),課件,96,減少I型錯誤的主要方法:假設檢驗時設定 值。,減少II型錯誤的主要方法:提高檢驗效能。,提高檢驗效能的最有效方法:增加樣本量。,如何選擇合適的樣本量:實驗設計。,課件,97,三、假設檢驗應注意的問題,1.要有嚴密的研究設計,尤其是下因果結(jié)論。 2.不同的資料應選用不同檢驗方法。 3.正確理解“顯著性”一詞的含義(用統(tǒng)計學意義一詞替代)。,課件,98,4.結(jié)論不能絕對

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預覽,若沒有圖紙預覽就沒有圖紙。
  • 4. 未經(jīng)權益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負責。
  • 6. 下載文件中如有侵權或不適當內(nèi)容,請與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

評論

0/150

提交評論