抽樣誤差與假設檢驗、t檢驗_第1頁
抽樣誤差與假設檢驗、t檢驗_第2頁
抽樣誤差與假設檢驗、t檢驗_第3頁
抽樣誤差與假設檢驗、t檢驗_第4頁
抽樣誤差與假設檢驗、t檢驗_第5頁
已閱讀5頁,還剩66頁未讀, 繼續(xù)免費閱讀

下載本文檔

版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進行舉報或認領

文檔簡介

1、第四章第四章 抽樣誤差與假設檢驗抽樣誤差與假設檢驗第四章第四章 抽樣誤差與假設檢驗抽樣誤差與假設檢驗 幾個概念:幾個概念: 計量資料:計量資料:測定每個觀察單位某項指標量的大測定每個觀察單位某項指標量的大小得到的數(shù)據(jù)(資料)。小得到的數(shù)據(jù)(資料)。 總體:總體:研究對象(某項變量值)的全體。研究對象(某項變量值)的全體。 樣本:樣本:總體中隨機抽取的一部分研究對象的某總體中隨機抽取的一部分研究對象的某項變量值。項變量值。 統(tǒng)計量:統(tǒng)計量:從樣本計算出來的統(tǒng)計指標。從樣本計算出來的統(tǒng)計指標。 參數(shù):參數(shù):總體的統(tǒng)計指標叫總體參數(shù)??傮w的統(tǒng)計指標叫總體參數(shù)。第四章第四章 抽樣誤差與假設檢驗抽樣誤差

2、與假設檢驗 統(tǒng)計推斷:統(tǒng)計推斷:用樣本信息推論總體特征的過程。用樣本信息推論總體特征的過程。 包括:包括: 參數(shù)估計參數(shù)估計: 運用統(tǒng)計學原理,用從樣本計算出運用統(tǒng)計學原理,用從樣本計算出來的統(tǒng)計指標量,對總體統(tǒng)計指標量進行估計。來的統(tǒng)計指標量,對總體統(tǒng)計指標量進行估計。 假設檢驗:假設檢驗:又稱顯著性檢驗,是指由樣本間存又稱顯著性檢驗,是指由樣本間存在的差別對樣本所代表的總體間是否存在著差在的差別對樣本所代表的總體間是否存在著差別做出判斷。別做出判斷。 方法:方法:均數(shù)的參數(shù)估計、均數(shù)均數(shù)的參數(shù)估計、均數(shù)t 檢驗檢驗第四章第四章 抽樣誤差與假設檢驗抽樣誤差與假設檢驗一、抽樣誤差與標準誤一、抽

3、樣誤差與標準誤(一)概念(一)概念 1、抽樣誤差抽樣誤差:是伴隨抽樣所產(chǎn)生的樣本統(tǒng)是伴隨抽樣所產(chǎn)生的樣本統(tǒng)計量與參數(shù)之間的差別。計量與參數(shù)之間的差別。 2、標準誤標準誤 :符號符號 ,表示抽,表示抽樣誤差大小的指標;也稱為樣本均數(shù)的標準樣誤差大小的指標;也稱為樣本均數(shù)的標準差;差;反映了用樣本均數(shù)代替總體均數(shù)的可靠反映了用樣本均數(shù)代替總體均數(shù)的可靠性程度的大小性程度的大小,增加樣本容量可以降低抽樣,增加樣本容量可以降低抽樣誤差。誤差。 )xxs、(抽樣誤差與抽樣分布抽樣誤差與抽樣分布第四章第四章 抽樣誤差與假設檢驗抽樣誤差與假設檢驗(二)、表達式與計算(二)、表達式與計算nsxnxs 樣本均數(shù)

4、的標準差樣本均數(shù)的標準差,也稱為,也稱為標準標準誤誤,反映了樣本均數(shù)間的離散程,反映了樣本均數(shù)間的離散程度,也反映了樣本均數(shù)與總體均度,也反映了樣本均數(shù)與總體均數(shù)的差異。數(shù)的差異。例例4.1 某市隨機抽查某市隨機抽查12歲男孩歲男孩100人,得身高均數(shù)人,得身高均數(shù)139.6cm,標標準差準差6.85cm,計算標準誤。計算標準誤。)(685. 010085. 6cmnsxs標準差與標準誤聯(lián)系與區(qū)別標準差與標準誤聯(lián)系與區(qū)別標準差標準差標準誤標準誤含含義義測量值的離散程度測量值的離散程度樣本均數(shù)的離散程度樣本均數(shù)的離散程度(統(tǒng)計量對參數(shù)的散度)(統(tǒng)計量對參數(shù)的散度)計計算算大大小小大大小小用用途途

5、描述測量值離散程度、計描述測量值離散程度、計算算cv、計算正常值范圍、計算正常值范圍、計算標準誤計算標準誤參數(shù)可信區(qū)間的估計參數(shù)可信區(qū)間的估計假設檢驗,表達誤差的內(nèi)涵假設檢驗,表達誤差的內(nèi)涵聯(lián)聯(lián)系系都是離散程度的指標都是離散程度的指標,標準誤是通過標準差來計算標準誤是通過標準差來計算1)()(22nxxnxsnsnxsx第四章第四章 抽樣誤差與假設檢驗抽樣誤差與假設檢驗二、抽樣分布、抽樣分布從正態(tài)總體中抽樣,樣本均數(shù)(從正態(tài)總體中抽樣,樣本均數(shù)( )的抽樣分布:)的抽樣分布:1. n較大時(較大時(n50), 服從正態(tài)分布服從正態(tài)分布,經(jīng)過標準化轉(zhuǎn)換經(jīng)過標準化轉(zhuǎn)換 服從標準正態(tài)分布即服從標準正

6、態(tài)分布即 u分布分布2. n較小時(較小時(n50),), 是非正態(tài)的單峰對稱分布是非正態(tài)的單峰對稱分布 就有小樣本統(tǒng)計量就有小樣本統(tǒng)計量( )的轉(zhuǎn)換值服從的轉(zhuǎn)換值服從t分布分布(是一組曲線)。(是一組曲線)。 xxxuxxxsxt第四章第四章 抽樣誤差與假設檢驗抽樣誤差與假設檢驗抽樣分布抽樣分布第四章第四章 抽樣誤差與假設檢驗抽樣誤差與假設檢驗 英國統(tǒng)計學家:哥塞德在英國統(tǒng)計學家:哥塞德在1908年以筆名年以筆名“student”提出了著名的提出了著名的t分布分布,故也稱為,故也稱為student t分布。分布。 t分布是描述分布是描述小樣本均值轉(zhuǎn)換度小樣本均值轉(zhuǎn)換度的分布。的分布。1、從正

7、態(tài)總體中抽樣,大樣本均數(shù)的轉(zhuǎn)換值服從、從正態(tài)總體中抽樣,大樣本均數(shù)的轉(zhuǎn)換值服從標準正太分布標準正太分布2、小樣本均數(shù)的轉(zhuǎn)換值服從、小樣本均數(shù)的轉(zhuǎn)換值服從t分布分布第四章第四章 抽樣誤差與假設檢驗抽樣誤差與假設檢驗(1)tu (n)(2)和)和N(0, 1)一樣都是單峰分布,以一樣都是單峰分布,以0為中心對為中心對稱稱(3) 越小,則越小,則 越大,越大,t值越分散,和值越分散,和N(0, 1)相比,集中在這部分的比例越少,尾部相比,集中在這部分的比例越少,尾部翹得越高。翹得越高。sx 2、t分布的特征分布的特征第四章第四章 抽樣誤差與假設檢驗抽樣誤差與假設檢驗第四章第四章 抽樣誤差與假設檢驗抽

8、樣誤差與假設檢驗t 分布(與分布(與u 分布分布 比較的特點)比較的特點)第四章第四章 抽樣誤差與假設檢驗抽樣誤差與假設檢驗 橫坐標為自由度橫坐標為自由度 ,縱坐標為概率,縱坐標為概率p,表中數(shù)字表示自由度為表中數(shù)字表示自由度為 、p為為 、t的界值,的界值,記記 如單側(cè)如單側(cè) =0.05, =20可查得可查得 =1.725 表示表示p(t1.725)=0.05 由由t分布的對稱性分布的對稱性p(t-1.725)=0.05 t,以外尾部面積的百分數(shù)是以外尾部面積的百分數(shù)是 3、t界值表界值表1 n)(t)(/2,t第四章第四章 抽樣誤差與假設檢驗抽樣誤差與假設檢驗 的界值的界值)(2/05.

9、0t第四章第四章 抽樣誤差與假設檢驗抽樣誤差與假設檢驗與u分布比較 U的臨界值小于的臨界值小于t曲線相應的臨界值的絕對曲線相應的臨界值的絕對值值當當n時,臨界值相近。時,臨界值相近。 自由度越小,自由度越小,t的臨界點越偏離的臨界點越偏離u的臨界點。的臨界點。第四章第四章 抽樣誤差與假設檢驗抽樣誤差與假設檢驗總體均數(shù)的參數(shù)估計總體均數(shù)的參數(shù)估計 參數(shù)估計參數(shù)估計:是指由樣本指標值(統(tǒng)計:是指由樣本指標值(統(tǒng)計量)估計總體指標值(參數(shù))量)估計總體指標值(參數(shù)),即用即用樣本均數(shù)樣本均數(shù)估計估計總體均數(shù)總體均數(shù),有兩種估計,有兩種估計方法:方法: (1)、點估計、點估計(近似值)(近似值) (2

10、)、區(qū)間估計、區(qū)間估計(近似范圍)(近似范圍)第四章第四章 抽樣誤差與假設檢驗抽樣誤差與假設檢驗一、點估計一、點估計 點估計點估計: 用樣本均數(shù)直接作為總體均數(shù)的估計用樣本均數(shù)直接作為總體均數(shù)的估計值值,未考慮抽樣誤差。未考慮抽樣誤差。 如用如用 估計相應的估計相應的 當當 時時,樣本均值趨近于總體均樣本均值趨近于總體均值值. 如果如果 ,則則 更可靠更可靠.x)(n21xxss 2xs第四章第四章 抽樣誤差與假設檢驗抽樣誤差與假設檢驗二、區(qū)間估計二、區(qū)間估計 1、概念、概念 可信區(qū)間:可信區(qū)間:也稱為置信區(qū)間(也稱為置信區(qū)間(confidence interval,CI),是按預先給定的概率

11、估計未知總體是按預先給定的概率估計未知總體均數(shù)的可能范圍均數(shù)的可能范圍. 事先給定的概率事先給定的概率1-稱為可信度,常取稱為可信度,常取95%或或99% 總體均數(shù)的總體均數(shù)的95%(或(或99%)可信區(qū)間:)可信區(qū)間:表示該表示該區(qū)間包括總體均數(shù)區(qū)間包括總體均數(shù)的概率為的概率為95%(或(或99%).第四章第四章 抽樣誤差與假設檢驗抽樣誤差與假設檢驗 根據(jù)總體標準差根據(jù)總體標準差是否已知,以及是否已知,以及樣本含量樣本含量n的大小而異。的大小而異。 (1)t分布法(n50) 2、計算方法、計算方法第四章第四章 抽樣誤差與假設檢驗抽樣誤差與假設檢驗(1)t分布法(分布法(未知,未知,n50)

12、總體均數(shù)的可信區(qū)間總體均數(shù)的可信區(qū)間. 已知已知: 未知但未知但n足夠大足夠大:),(2/2/nuxnux),(2/2/nsuxnsux第四章第四章 抽樣誤差與假設檢驗抽樣誤差與假設檢驗 u可以查表可以查表 某地某地12歲男孩身高均數(shù)的歲男孩身高均數(shù)的95%的可信區(qū)間的可信區(qū)間. 本例中本例中:n=100, =139.6,s=6.85,u0.05=1.96 該地該地12歲男孩身高均數(shù)的歲男孩身高均數(shù)的95%可信區(qū)間為可信區(qū)間為: 138.3(cm)141.0(cm) x),即(0 .1413 .138)10085. 696. 16 .139,10085. 696. 16 .139(第四章第四章

13、 抽樣誤差與假設檢驗抽樣誤差與假設檢驗注意 (1)統(tǒng)計意義:)統(tǒng)計意義:從總體中作大數(shù)次隨機抽從總體中作大數(shù)次隨機抽樣,有樣,有95%求得的可信區(qū)間包含總體均數(shù)。求得的可信區(qū)間包含總體均數(shù)。并不是做一次抽樣求得可信區(qū)間包括并不是做一次抽樣求得可信區(qū)間包括的概的概率是率是0.95,對一次抽樣而言只有兩種可能,對一次抽樣而言只有兩種可能,要么可信區(qū)間包含要么可信區(qū)間包含,要么不包含,要么不包含。 (2)與醫(yī)學正常值范圍不同與醫(yī)學正常值范圍不同第四章第四章 抽樣誤差與假設檢驗抽樣誤差與假設檢驗正常值范圍估計與可信區(qū)間估計正常值范圍估計與可信區(qū)間估計正常值范圍正常值范圍概念概念:絕大多數(shù)正常人的某指絕

14、大多數(shù)正常人的某指標范圍。(標范圍。(95%,99%, 指絕大指絕大多數(shù)正常人)多數(shù)正常人)計算公式:計算公式:用途:用途:判斷觀察對象的某判斷觀察對象的某項指標是否正常項指標是否正常.可信區(qū)間可信區(qū)間概念:概念:總體均數(shù)所在的數(shù)值總體均數(shù)所在的數(shù)值范圍(范圍( 95%,99% 指可信度)指可信度)計算公式:計算公式:用途:用途:估計總體均數(shù)估計總體均數(shù)第四章第四章 抽樣誤差與假設檢驗抽樣誤差與假設檢驗 假設檢驗(假設檢驗(hypothesis test)也稱顯著性檢驗)也稱顯著性檢驗(significance test)。二十世紀二、三十年代。二十世紀二、三十年代Neyman和和Pearso

15、n建立了統(tǒng)計假設檢驗問題的建立了統(tǒng)計假設檢驗問題的數(shù)學模型。數(shù)學模型。 假設檢驗假設檢驗: 建立在統(tǒng)計抽樣分布建立在統(tǒng)計抽樣分布,小概率事件原理小概率事件原理基礎上的對差別性質(zhì)進行風險推斷的一種邏輯思基礎上的對差別性質(zhì)進行風險推斷的一種邏輯思維方法維方法.第四章第四章 抽樣誤差與假設檢驗抽樣誤差與假設檢驗假設檢驗:假設檢驗:1、原因2、目的3、原理4、過程(步驟)、過程(步驟)5、結(jié)果第四章第四章 抽樣誤差與假設檢驗抽樣誤差與假設檢驗1、假設檢驗的原因、假設檢驗的原因 由于個體差異的存在,即使從同一總體中由于個體差異的存在,即使從同一總體中嚴格的隨機抽樣,嚴格的隨機抽樣,X1、X2、X3、X4

16、、,、,不同。不同。 因此,因此,X1、X2 不同有兩種(而且只有兩種)可能:不同有兩種(而且只有兩種)可能:(1)分別所代表的總體均數(shù)相同,由于抽樣誤差)分別所代表的總體均數(shù)相同,由于抽樣誤差造成了樣本均數(shù)的差別。差別無顯著性造成了樣本均數(shù)的差別。差別無顯著性 。(2)分別所代表的總體均數(shù)不同。差別有顯著性。)分別所代表的總體均數(shù)不同。差別有顯著性。第四章第四章 抽樣誤差與假設檢驗抽樣誤差與假設檢驗 根據(jù)大量調(diào)查,已知健康成年男子脈搏的根據(jù)大量調(diào)查,已知健康成年男子脈搏的均數(shù)為均數(shù)為72次次/分分,某醫(yī)生在一山區(qū)隨機調(diào)查,某醫(yī)生在一山區(qū)隨機調(diào)查了了30名健康成年男子,求得脈搏均數(shù)為名健康成年

17、男子,求得脈搏均數(shù)為74.2次次/分分, 標準差為標準差為6.5次次/分,能否據(jù)此認分,能否據(jù)此認為該山區(qū)成年男子的脈搏均數(shù)高于一般人為該山區(qū)成年男子的脈搏均數(shù)高于一般人?第四章第四章 抽樣誤差與假設檢驗抽樣誤差與假設檢驗 我們當然不能強求脈搏均數(shù)恰為我們當然不能強求脈搏均數(shù)恰為72次次/分時,分時,才認為山區(qū)成年男子的脈搏均數(shù)和一般人一才認為山區(qū)成年男子的脈搏均數(shù)和一般人一樣,因為即使一樣由于抽樣誤差的存在,樣樣,因為即使一樣由于抽樣誤差的存在,樣本均數(shù)未必等于本均數(shù)未必等于72,造成山區(qū)健康成年男子,造成山區(qū)健康成年男子的脈搏樣本均數(shù)與一般人不同的原因有的脈搏樣本均數(shù)與一般人不同的原因有:

18、 抽樣誤差抽樣誤差 環(huán)境因素的影響環(huán)境因素的影響要回答這一問題就是假設檢驗問題要回答這一問題就是假設檢驗問題第四章第四章 抽樣誤差與假設檢驗抽樣誤差與假設檢驗2、假設檢驗的目的、假設檢驗的目的l判斷是由于何種原因造成的不同,以做判斷是由于何種原因造成的不同,以做出決策。出決策。(推斷參數(shù)是否相等推斷參數(shù)是否相等)0100:H:H無效假設無效假設備擇假設備擇假設第四章第四章 抽樣誤差與假設檢驗抽樣誤差與假設檢驗 反證法:反證法:當一件事情的發(fā)生只有兩種可能當一件事情的發(fā)生只有兩種可能A和和B,為了肯定其中的一種情況為了肯定其中的一種情況A,但又不能直接證實,但又不能直接證實A,這時否定另一種可能

19、這時否定另一種可能B,則間接的肯定了,則間接的肯定了A。 小概率事件原理小概率事件原理: 小概率事件在一次抽樣中不可小概率事件在一次抽樣中不可能發(fā)生能發(fā)生. 概率論:概率論:事件的發(fā)生不是絕對的,只是可能性大事件的發(fā)生不是絕對的,只是可能性大小而已。即小而已。即,帶有風險性的推斷帶有風險性的推斷.第四章第四章 抽樣誤差與假設檢驗抽樣誤差與假設檢驗 建立一對假設建立一對假設(注意注意單雙側(cè)單雙側(cè))確定顯著性水準(確定顯著性水準( ): 無效假設無效假設(H0):兩個總體均數(shù)相等;:兩個總體均數(shù)相等; 備擇假設備擇假設(H1):與與 H0 相反相反; 預先給定的概率值預先給定的概率值(0.05或或

20、0.01),區(qū)分大小概率事件的標準區(qū)分大小概率事件的標準. 如上例,如上例,H0:1=72 H1:172 =0.05 計算統(tǒng)計量:計算統(tǒng)計量:(選擇不同的統(tǒng)計方法:選擇不同的統(tǒng)計方法:u檢驗檢驗, t檢驗檢驗,F檢驗等檢驗等) 確定概率值確定概率值p和做出統(tǒng)計推斷結(jié)論和做出統(tǒng)計推斷結(jié)論:(p值實際得到犯一類錯誤的可能性值實際得到犯一類錯誤的可能性,p,則統(tǒng)計推斷為按則統(tǒng)計推斷為按檢驗水準檢驗水準,不拒不拒絕絕H0。)第四章第四章 抽樣誤差與假設檢驗抽樣誤差與假設檢驗5、假設檢驗的結(jié)果、假設檢驗的結(jié)果 不拒絕無效假設不拒絕無效假設 拒絕拒絕無效假設無效假設 正確理解結(jié)論的概率性(都隱含著犯錯誤的

21、可能正確理解結(jié)論的概率性(都隱含著犯錯誤的可能性)。性)。第四章第四章 抽樣誤差與假設檢驗抽樣誤差與假設檢驗六、均數(shù)的假設檢驗 t檢驗(t test)也稱student t檢驗,是計量資料中最常用的假設檢驗方法,它以t分布為基礎. 本章將要介紹 單個樣本的單個樣本的t檢驗檢驗 ( (樣本均值與總體均值的比較樣本均值與總體均值的比較) ) 配對樣本配對樣本t檢驗檢驗 兩獨立樣本的兩獨立樣本的t檢驗檢驗 ( (兩樣本均值的比較兩樣本均值的比較, ,方差方差一致一致) )第四章第四章 抽樣誤差與假設檢驗抽樣誤差與假設檢驗單個樣本單個樣本t檢驗檢驗 單個樣本單個樣本t檢驗檢驗:是樣本均數(shù)是樣本均數(shù) 代

22、表的總體均代表的總體均數(shù)數(shù) 和已知總體均數(shù)和已知總體均數(shù) 的比較的比較. 適用條件:適用條件: (1) 已知一個總體均數(shù);已知一個總體均數(shù); (2) 可得到一個樣本均數(shù)及該樣本標準誤;可得到一個樣本均數(shù)及該樣本標準誤; (3) 樣本量樣本量小于小于50; (4) 樣本來自正態(tài)或近似正態(tài)總體。樣本來自正態(tài)或近似正態(tài)總體。x0第四章第四章 抽樣誤差與假設檢驗抽樣誤差與假設檢驗 例例: 根據(jù)大量調(diào)查根據(jù)大量調(diào)查,已知健康成年男子的脈已知健康成年男子的脈搏均數(shù)為搏均數(shù)為72次次/分分.某醫(yī)生在某山區(qū)隨機調(diào)查某醫(yī)生在某山區(qū)隨機調(diào)查30名健康男子名健康男子,求得脈搏均數(shù)為求得脈搏均數(shù)為74.2次次/分分,

23、標準差為標準差為6.5次次/分分.能否認為該山區(qū)的成年能否認為該山區(qū)的成年男子的脈搏均數(shù)高于一般成年男子的脈搏男子的脈搏均數(shù)高于一般成年男子的脈搏均數(shù)均數(shù)?第四章第四章 抽樣誤差與假設檢驗抽樣誤差與假設檢驗因本例已知因本例已知 =72次次/分分, =74.2次次/分分, s=6.5次次/分分,n=30, 由于已知由于已知 ,故選用單樣本故選用單樣本t檢驗檢驗0 x0 1 1、建立檢驗假設,確定概率水準、建立檢驗假設,確定概率水準 山區(qū)成年男子平均脈搏數(shù)與一般成年男子相同。山區(qū)成年男子平均脈搏數(shù)與一般成年男子相同。 山區(qū)成年男子平均脈搏數(shù)與一般成年男子不同。山區(qū)成年男子平均脈搏數(shù)與一般成年男子不

24、同。 2 2、計算檢驗統(tǒng)計量、計算檢驗統(tǒng)計量 在= 0成立的條件下,計算統(tǒng)計量為:05. 0:0100HH85. 1305 . 6722 .7400nsxsxtx第四章第四章 抽樣誤差與假設檢驗抽樣誤差與假設檢驗3 3、確定、確定p p值,做出推斷結(jié)論值,做出推斷結(jié)論1301 n查表查表2,可得,可得 t 0.05/2(29) =2.045 今今t0.05,無統(tǒng)計學意義,按無統(tǒng)計學意義,按水準,不拒絕水準,不拒絕H0,尚不能認為該山區(qū)成年男,尚不能認為該山區(qū)成年男子平均每分鐘脈搏數(shù)高于一般成年男子。子平均每分鐘脈搏數(shù)高于一般成年男子。第四章第四章 抽樣誤差與假設檢驗抽樣誤差與假設檢驗 配對樣本

25、均數(shù)配對樣本均數(shù)t t檢驗簡稱配對檢驗簡稱配對t t檢驗檢驗(paired (paired t t test),test),又稱又稱非獨立兩樣本均數(shù)非獨立兩樣本均數(shù)t t檢驗檢驗, ,適用于適用于配對設計計量資料均數(shù)配對設計計量資料均數(shù)的的比較比較, ,其比較目的是檢驗兩相關樣本均數(shù)所代表的未知總其比較目的是檢驗兩相關樣本均數(shù)所代表的未知總體均數(shù)是否有差別。體均數(shù)是否有差別。 配對設計配對設計(paired design)(paired design)是將受試對象按某些重要特征是將受試對象按某些重要特征相近的原則配成對子,每對中的兩個個體隨機地給予兩種相近的原則配成對子,每對中的兩個個體隨機地

26、給予兩種處理。處理。配對樣本配對樣本t檢驗檢驗(1 1)兩種同質(zhì)受試對象分別接受兩種處理:)兩種同質(zhì)受試對象分別接受兩種處理: 如:把同窩、同性別和體重相近的動物配成一對。(2 2)同一受試對象或同一樣本的兩個部分,分)同一受試對象或同一樣本的兩個部分,分別接受兩種不同處理:別接受兩種不同處理: 如:把服用兩種降糖藥的病人配成對(3 3)同一受試對象處理(實驗或治療)前后的)同一受試對象處理(實驗或治療)前后的結(jié)果比較:結(jié)果比較: 如:對高血壓患者治療前后 配對設計資料主要有三種類型:配對設計資料主要有三種類型:應用配對設計可以減少實驗的誤差和控制非處理因素,提高應用配對設計可以減少實驗的誤差

27、和控制非處理因素,提高統(tǒng)計處理的效率。統(tǒng)計處理的效率。第四章第四章 抽樣誤差與假設檢驗抽樣誤差與假設檢驗配對樣本配對樣本t檢驗的原理檢驗的原理 配對樣本配對樣本t檢驗實際上是配對設計的檢驗實際上是配對設計的差值均數(shù)差值均數(shù)與與總體均數(shù)總體均數(shù)0比較的比較的t檢驗檢驗 配對樣本配對樣本t檢驗的基本原理是假設兩種處理的檢驗的基本原理是假設兩種處理的效應相同效應相同,即即1=2,則則1-2=0(即即,已知總體均已知總體均數(shù)數(shù)d =0),即檢驗差值的樣本均數(shù)即檢驗差值的樣本均數(shù) 所代表的所代表的未知總體均數(shù)未知總體均數(shù)d 與與0的比較的比較.d第四章第四章 抽樣誤差與假設檢驗抽樣誤差與假設檢驗 公式:

28、公式: 自由度:自由度:對子數(shù)對子數(shù) - 1 適用條件:適用條件:兩組配對計量資料。兩組配對計量資料。樣本來自正態(tài)樣本來自正態(tài)分布總體,配對分布總體,配對t t檢驗要求差值服從正態(tài)分布,檢驗要求差值服從正態(tài)分布,實際應用時單峰對稱分布也可以;大樣本時,實際應用時單峰對稱分布也可以;大樣本時,用用u u 檢驗,且正態(tài)性要求可以放寬;檢驗,且正態(tài)性要求可以放寬;nsdsdsdtdddd0第四章第四章 抽樣誤差與假設檢驗抽樣誤差與假設檢驗患者編號(1)舒張壓(Kpa)治療前后差數(shù)d(4)(2)(3)d2(5)=(4)*(4)手術(shù)前(2)手術(shù)后(2)1 16.0 12.0 4.0 16.002 12.

29、0 13.3 -1.3 1.693 14.6 10.6 4.0 16.00 4 13.3 12.0 1.3 1.695 12.0 12.0 0 06 12.0 10.6 1.4 1.967 14.6 10.6 4.0 16.008 14.6 14.6 0 09 12.0 12.7 -0.7 0.4910 13.3 13.3 0 0合計 12.7 53.83d2d第四章第四章 抽樣誤差與假設檢驗抽樣誤差與假設檢驗例例 某醫(yī)院在研究腎動脈成形術(shù)前后血液動力學的某醫(yī)院在研究腎動脈成形術(shù)前后血液動力學的 改改變中,觀察了變中,觀察了1010例病人手術(shù)前后的例病人手術(shù)前后的 血壓變化情況見血壓變化情況見

30、表,試問手術(shù)前后舒張壓有無變化?表,試問手術(shù)前后舒張壓有無變化? 1 1、建立檢驗假設,確定檢驗水準、建立檢驗假設,確定檢驗水準H H0 0: : d d=0, =0, 即假設手術(shù)前后舒張壓無變化,樣本即假設手術(shù)前后舒張壓無變化,樣本 是從差數(shù)均數(shù)為是從差數(shù)均數(shù)為0 0的總體中抽得。的總體中抽得。H1H1:d d 0 0,即手術(shù)前后舒張壓有變化。,即手術(shù)前后舒張壓有變化。=0.05=0.05第四章第四章 抽樣誤差與假設檢驗抽樣誤差與假設檢驗 2 2、計算檢驗統(tǒng)計量、計算檢驗統(tǒng)計量 先計算差值先計算差值d d及及d d2 2, ,得得 計算差值均數(shù)計算差值均數(shù) 計算差值的標準差計算差值的標準差

31、計算差值的標準誤得計算差值的標準誤得83.53, 7 .122dd27. 1107 .12ndd05. 21)(22nnddds65. 0464. 34909. 2nsdds第四章第四章 抽樣誤差與假設檢驗抽樣誤差與假設檢驗計算計算t t值值95. 165. 027. 1dsdt 、確定、確定p p值,作出推斷結(jié)論值,作出推斷結(jié)論 自由度自由度n-1=10-1=9,n-1=10-1=9,t t 0.05/2(9)0.05/2(9)=2.262=2.262本例本例t t t t0.05/2(9)0.05/2(9), p, p0.05, 0.05, 按按0.050.05檢驗檢驗水準,不拒絕水準,不

32、拒絕H H0 0, , 即還不能認為手術(shù)前后的即還不能認為手術(shù)前后的舒張壓不同。舒張壓不同。第四章第四章 抽樣誤差與假設檢驗抽樣誤差與假設檢驗兩獨立樣本的兩獨立樣本的t檢驗檢驗 目的目的:由兩個樣本均數(shù)的差別推斷兩樣本由兩個樣本均數(shù)的差別推斷兩樣本 所代表的總體均數(shù)間有無差別。所代表的總體均數(shù)間有無差別。 計算公式及意義:計算公式及意義: 公式:公式: 2121xxxxts2) 1() 1(2)()()11(112222112212222212121221212nnsnsnnnnxxnxxnnsxxcccsss第四章第四章 抽樣誤差與假設檢驗抽樣誤差與假設檢驗 應用條件應用條件: (1 1)已

33、知)已知/ /可計算兩個樣本均數(shù)及它們的標可計算兩個樣本均數(shù)及它們的標準差準差 ; (2 2)兩個樣本之一的例數(shù)少于)兩個樣本之一的例數(shù)少于5050; (3 3)樣本來自正態(tài)或近似正態(tài)總體;樣本來自正態(tài)或近似正態(tài)總體; (4 4)方差齊方差齊。 自由度:自由度:2-21nn 第四章第四章 抽樣誤差與假設檢驗抽樣誤差與假設檢驗兩獨立樣本兩獨立樣本t t檢驗檢驗實例分析實例分析 例例5.3 255.3 25例糖尿病患者隨機分成兩組,例糖尿病患者隨機分成兩組,甲組單純用藥物治療,乙組采用藥物治療甲組單純用藥物治療,乙組采用藥物治療合并飲食療法,二個月后測空腹血糖合并飲食療法,二個月后測空腹血糖(mm

34、ol(mmol/L)/L)如表如表5-2 5-2 所示,問兩種療法治療所示,問兩種療法治療后患者血糖值是否相同?后患者血糖值是否相同?第四章第四章 抽樣誤差與假設檢驗抽樣誤差與假設檢驗表 5-2 25 名糖尿病患者兩種療法治療后二個月血糖值(mmol/L) 編號 甲組血糖值(X2) 編號 乙組血糖值(X2) 1 8.4 1 5.4 2 10.5 2 6.4 3 12.0 3 6.4 4 12.0 4 7.5 5 13.9 5 7.6 6 15.3 6 8.1 7 16.7 7 11.6 8 18.0 8 12.0 9 18.7 9 13.4 10 20.7 10 13.5 11 21.1 11

35、 14.8 12 15.2 12 15.6 13 18.7 第四章第四章 抽樣誤差與假設檢驗抽樣誤差與假設檢驗兩獨立樣本兩獨立樣本t t檢驗檢驗檢驗步驟檢驗步驟 1 1、建立檢驗假設,確定檢驗水準、建立檢驗假設,確定檢驗水準H H0 0: 1 1= = 2 2,兩種療法治療后患者血糖值的總體,兩種療法治療后患者血糖值的總體均數(shù)相同均數(shù)相同; ;H H1 1: 1 1 2 2,兩種療法治療后患者血糖值的總體,兩種療法治療后患者血糖值的總體均數(shù)不同;均數(shù)不同;0.050.05。 2 2、計算檢驗統(tǒng)計量、計算檢驗統(tǒng)計量第四章第四章 抽樣誤差與假設檢驗抽樣誤差與假設檢驗兩獨立樣本兩獨立樣本t t檢驗檢

36、驗檢驗步驟檢驗步驟由 原 始 數(shù)據(jù) 算 得:n1=12, X1=182.5, X12=2953.43, n2=13, X2=141.0, X22=1743.16,1X=X1/n1=182.5/12=15.21,2X=X2/n2=14.16/13=10.85 代入公式,得代入公式,得: :第四章第四章 抽樣誤差與假設檢驗抽樣誤差與假設檢驗兩獨立樣本兩獨立樣本t t檢驗檢驗實例分析實例分析按公式計算,算得按公式計算,算得: : 3 3、確定、確定P P值,作出推斷結(jié)論值,作出推斷結(jié)論兩獨立樣本兩獨立樣本t t檢驗自由度為檢驗自由度為 = =n n1 1+ +n n2 2-2-2=12+13-2=2

37、3=12+13-2=23; 查查t t界值表,界值表,t t0.05/2(23)0.05/2(23)=2.069=2.069,t t0.01/2(23)0.01/2(23)=2.807. =2.807. 639. 2652. 185.1021.15t第四章第四章 抽樣誤差與假設檢驗抽樣誤差與假設檢驗兩獨立樣本兩獨立樣本t t檢驗檢驗實例分析實例分析t t t t0.05/2(23)0.05/2(23),P P 0.050.05,按按 0.050.05的水準拒絕的水準拒絕H H0 0,接受,接受H H1 1,差異有統(tǒng)計學,差異有統(tǒng)計學意義。意義。故可認為該地兩種療法治療糖尿病患者二個月后故可認為

38、該地兩種療法治療糖尿病患者二個月后測得的空腹血糖值的均數(shù)不同。測得的空腹血糖值的均數(shù)不同。第四章第四章 抽樣誤差與假設檢驗抽樣誤差與假設檢驗配對配對兩樣本兩樣本隨機分配隨機分配多次對間隨機多次對間隨機完全隨機完全隨機計算方法計算方法誤差內(nèi)涵誤差內(nèi)涵測量誤差測量誤差抽樣誤差抽樣誤差誤差大小誤差大小小小大大效率效率高高低低ddsdt2121xxxxts第四章第四章 抽樣誤差與假設檢驗抽樣誤差與假設檢驗兩樣本含量較大時均數(shù)的比較兩樣本含量較大時均數(shù)的比較 當樣本含量較大時,可用當樣本含量較大時,可用u檢驗法檢驗法某醫(yī)院對某醫(yī)院對4050歲年齡組的男、女不同性別的歲年齡組的男、女不同性別的健康人群測定

39、了健康人群測定了 脂蛋白有無差別?脂蛋白有無差別?性別性別 人數(shù)人數(shù) 均值均值 標準差標準差男男 193 3.97 1.04女女 128 3.58 0.90第四章第四章 抽樣誤差與假設檢驗抽樣誤差與假設檢驗 1、建立假設并確定檢驗水準、建立假設并確定檢驗水準 H H0 0: : 1 1=2 2,即不同性別健康人群即不同性別健康人群 脂蛋白無脂蛋白無差別;差別; H H1 1: 1 1 2 2,即不同性別健康人群即不同性別健康人群 脂蛋白有脂蛋白有差別;差別; =0.05=0.05第四章第四章 抽樣誤差與假設檢驗抽樣誤差與假設檢驗 2、計算、計算u值值 57. 3222121212121nsns

40、xxsxxuxx第四章第四章 抽樣誤差與假設檢驗抽樣誤差與假設檢驗 3、確定、確定P值值 不必查表,雙側(cè)檢驗以不必查表,雙側(cè)檢驗以u u1.961.96時、時、P P0.050.05,今,今u u3.753.751.961.96,故,故p p0.050.05。按。按 =0.05=0.05的水準,拒絕的水準,拒絕H0H0,接受,接受H1H1。認為男性。認為男性 脂蛋白含量高于女性脂蛋白含量高于女性 脂蛋白含量。脂蛋白含量。第四章第四章 抽樣誤差與假設檢驗抽樣誤差與假設檢驗t檢驗中的注意事項檢驗中的注意事項 1. 1. 要有嚴密的抽樣研究計劃要有嚴密的抽樣研究計劃 要保證樣本是從同質(zhì)總體中隨機抽取

41、。要保證樣本是從同質(zhì)總體中隨機抽取。 除了對比的因素外,其它影響結(jié)果的因素應一致。除了對比的因素外,其它影響結(jié)果的因素應一致。2 2選用的假設檢驗方法應符合其應用條件選用的假設檢驗方法應符合其應用條件要了解變量的類型是計量的還是計數(shù)的,設計類型是配對設要了解變量的類型是計量的還是計數(shù)的,設計類型是配對設計還是成組設計,是大樣本還是小樣本。計還是成組設計,是大樣本還是小樣本。第四章第四章 抽樣誤差與假設檢驗抽樣誤差與假設檢驗假設檢驗的結(jié)論是根據(jù)概率推斷的,所以不是絕假設檢驗的結(jié)論是根據(jù)概率推斷的,所以不是絕對正確的:對正確的:(1)當 p , 不能拒絕不能拒絕 H0, 不能接受不能接受H1,按,

42、按不能接受不能接受H1下結(jié)論,也可能犯錯誤;下結(jié)論,也可能犯錯誤;3.3.正確理解假設檢驗的結(jié)論(概率性)正確理解假設檢驗的結(jié)論(概率性)第四章第四章 抽樣誤差與假設檢驗抽樣誤差與假設檢驗4.4.正確理解差別有無顯著性的統(tǒng)計意義正確理解差別有無顯著性的統(tǒng)計意義差別有顯著性,或有統(tǒng)計意義,指我們有很大的把握認為差別有顯著性,或有統(tǒng)計意義,指我們有很大的把握認為原假設不正確,并非是說它們有較大的差別。原假設不正確,并非是說它們有較大的差別。差別無顯著性,或無統(tǒng)計意義,我們只是認為以很大的把差別無顯著性,或無統(tǒng)計意義,我們只是認為以很大的把握拒絕原假設的理由還不夠充分,并不意味著我們很相握拒絕原假設的理由還不夠充分,

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預覽,若沒有圖紙預覽就沒有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負責。
  • 6. 下載文件中如有侵權(quán)或不適當內(nèi)容,請與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

評論

0/150

提交評論