終身模塊統(tǒng)計學(xué)抽樣誤差假設(shè)檢驗課件_第1頁
終身模塊統(tǒng)計學(xué)抽樣誤差假設(shè)檢驗課件_第2頁
終身模塊統(tǒng)計學(xué)抽樣誤差假設(shè)檢驗課件_第3頁
終身模塊統(tǒng)計學(xué)抽樣誤差假設(shè)檢驗課件_第4頁
終身模塊統(tǒng)計學(xué)抽樣誤差假設(shè)檢驗課件_第5頁
已閱讀5頁,還剩145頁未讀 繼續(xù)免費閱讀

下載本文檔

版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進(jìn)行舉報或認(rèn)領(lǐng)

文檔簡介

計量資料的統(tǒng)計推斷

statisticalinferenceofmeasurementdata張建軍汕大醫(yī)學(xué)院預(yù)防醫(yī)學(xué)教研室Tel/p>

zhangjj@

計量資料的統(tǒng)計推斷

statisticalinferenc統(tǒng)計推斷:參數(shù)估計,假設(shè)檢驗“世上有三種哄人的東西:謊言、該死的謊言、統(tǒng)計數(shù)據(jù)”----英國政治家迪斯雷里?!笆郎嫌腥龢蛹尤诵牡臇|西:宣傳、要命的宣傳、統(tǒng)計數(shù)據(jù)”。統(tǒng)計推斷:參數(shù)估計,假設(shè)檢驗均數(shù)的抽樣誤差和標(biāo)準(zhǔn)誤均數(shù)的抽樣誤差和標(biāo)準(zhǔn)誤均數(shù)的抽樣誤差samplingerrorofmean概念:由于總體中存在個體變異,抽樣研究中所抽取的樣本,只包含總體中一部分個體,因而樣本均數(shù)(或率)往往不等于總體均數(shù)(或率),樣本均數(shù)之間也互不相等,這種由抽樣引起的差異稱為均數(shù)的抽樣誤差。即:均數(shù)的抽樣誤差samplingerrorofmean12中心極限定理:如果隨機變量的總體均數(shù)及方差有限,當(dāng)樣本容量趨于無窮大時,樣本均數(shù)的分布趨近于均數(shù)為總體均數(shù),方差為的正態(tài)分布。1如何估計?用樣本均數(shù)的標(biāo)準(zhǔn)差來估計,稱標(biāo)準(zhǔn)誤(standarderror)。標(biāo)準(zhǔn)誤越大,均數(shù)的抽樣誤差越大,樣本均數(shù)與總體均數(shù)間的差異越大。計算公式:即:由總體標(biāo)準(zhǔn)差,樣本例數(shù)求得。但通常以樣本標(biāo)準(zhǔn)差作為總體標(biāo)準(zhǔn)差的估計值。因此:如何估計?與標(biāo)準(zhǔn)差的區(qū)別:標(biāo)準(zhǔn)差:表示一般變量值的離散程度;均數(shù)標(biāo)準(zhǔn)誤特別說明樣本均數(shù)這一變量值離散程度的指標(biāo)。標(biāo)準(zhǔn)誤的應(yīng)用:(1)用來衡量抽樣誤差的大小,標(biāo)準(zhǔn)誤越小,樣本均數(shù)與總體均數(shù)越接近,樣本均數(shù)的可信度越高;(2)結(jié)合標(biāo)準(zhǔn)正態(tài)分布與t分布曲線下的面積規(guī)律,估計總體均數(shù)的置信區(qū)間。(3)用于假設(shè)檢驗。與標(biāo)準(zhǔn)差的區(qū)別:假定2003年汕頭市15歲女學(xué)生的身高(cm)服從N(155.4,5.32)。用計算機做抽樣模擬試驗,每次抽出10個數(shù)字,組成一個樣本,求出樣本均數(shù)、樣本標(biāo)準(zhǔn)差S。再求得此100個樣本均數(shù)的均數(shù)、樣本均數(shù)的標(biāo)準(zhǔn)差(標(biāo)準(zhǔn)誤)。100個樣本均數(shù)構(gòu)成一個新的分布,也是正態(tài)分布(即使原分布為偏態(tài)分布,當(dāng)樣本含量足夠大時,新分布也近似正態(tài)分布)。新分布的集中趨勢用均數(shù)的均數(shù)來表示,離散趨勢用標(biāo)準(zhǔn)誤表示N(,)。各樣本均數(shù)的均數(shù)等于總體均數(shù)。假定2003年汕頭市15歲女學(xué)生的身高(cm)服從N(155正態(tài)總體中抽樣(樣本量5)正態(tài)總體中抽樣(樣本量10)正態(tài)總體中抽樣(樣本量30)抽樣時樣本量大小決定了樣本均數(shù)分布的形狀,當(dāng)樣本量足夠大時,均數(shù)分布趨向正態(tài)分布。正態(tài)總體中抽樣(樣本量5)正態(tài)總體中抽樣(樣本量10)正態(tài)總t分布(t-distribution)t分布(t-distribution)u分布:u轉(zhuǎn)換將正態(tài)分布轉(zhuǎn)換為標(biāo)準(zhǔn)正態(tài),N(0,1)。同理:將樣本均數(shù)的分布也可以轉(zhuǎn)換為標(biāo)準(zhǔn)正態(tài)分布即:實際工作中,總體標(biāo)準(zhǔn)差往往未知,常用S代替σ

計算標(biāo)準(zhǔn)誤,因此:就變?yōu)椋簎分布:u轉(zhuǎn)換也就是說:正態(tài)分布:標(biāo)準(zhǔn)正態(tài)分布正態(tài)變量實現(xiàn)這一轉(zhuǎn)變:也就是說:正態(tài)分布:均數(shù)的分布也是這樣如果我們采用另一個正態(tài)變量:于是,均數(shù)的分布變成了標(biāo)準(zhǔn)正態(tài)分布:均數(shù)的分布也是這樣如果我們采用另一個正態(tài)變量:但是,條件發(fā)生變化我們通常用代替

然而,

隨著樣本量的變化而變化,所以,我們稱之為

t-分布,雖然它是正態(tài)分布,但只有當(dāng)樣本量(自由度)無窮大的時候,它才是標(biāo)準(zhǔn)正態(tài)分布,此時,u=t但是,條件發(fā)生變化我們通常用代替t分布是一簇對稱于0的單峰分布曲線。自由度越小(相當(dāng)于標(biāo)準(zhǔn)差大),曲線的中間越低,兩邊越高;隨自由度增大,t分布曲線逐漸逼近于標(biāo)準(zhǔn)正態(tài)分布曲線。當(dāng)自由度無窮大時,t分布就是標(biāo)準(zhǔn)正態(tài)分布曲線。每一條t分布曲線,都對應(yīng)于相應(yīng)的自由度。t分布是一簇對稱于0的單峰分布曲線。自由度越小(相當(dāng)于標(biāo)準(zhǔn)差t分布曲線下的面積規(guī)律:與標(biāo)準(zhǔn)正態(tài)曲線下的面積規(guī)律相似:在某一個自由度下,兩側(cè)外部總面積為5%的界限的t值稱為t0.05/2(υ),把兩側(cè)外部總面積為1%的界限的t值稱為t0.01/2(υ)。中部占95%面積的t值范圍:t0.05/2(υ)--t0.05/2(υ),中部占99%面積的t值范圍:-t0.01/2(υ)--t0.01/2(υ)。t分布曲線下的面積規(guī)律:當(dāng)自由度確定時,占一定面積的t界限值,可以查表得出。參考附表6(p436)。例如:查當(dāng)自由度=20,兩側(cè)概率之和為0.05時,對應(yīng)的t值:t0.05/2(20)=2.086,單側(cè)概率為0.05時,對應(yīng)的t值:t0.05(20)=1.725,當(dāng)自由度確定時,占一定面積的t界限值,可以查表得出。參考附表t分布的主要應(yīng)用:(1)總體均數(shù)置信區(qū)間估計;(2)t檢驗;t分布的主要應(yīng)用:使用t值表注意:同一自由度下,P越小,t值越大;P值相同時,自由度越大,t越小;當(dāng)自由度無窮大時,t值與u值相等。這也是u分布與t分布的區(qū)別。使用t值表注意:總體均數(shù)置信區(qū)間的估計總體均數(shù)置信區(qū)間的估計參數(shù)估計:點估計(pointestimation):用樣本統(tǒng)計量作為對總體參數(shù)的估計值(μ)。比如均數(shù)的估計。區(qū)間估計(intervalestimation):根據(jù)選定的置信度估計總體均數(shù)所在的區(qū)間(a<μ<b).a,b為置信限(可信限)。參數(shù)估計:為何要進(jìn)行區(qū)間估計?點估計是用樣本均數(shù)來估計總體均數(shù),簡單易行,但未考慮抽樣誤差,而后者又是不可避免的。故常按照一定的概率估計總體均數(shù)在哪個范圍。置信度(confidencelevel):在估計總體均數(shù)的置信區(qū)間時,如果可能估計錯誤的概率為α,那么估計正確的概率為1-α,即為置信度.常用:95%,99%.置信區(qū)間(confidenceinterval,CI)根據(jù)置信度估計得到的區(qū)間,稱為置信區(qū)間。為何要進(jìn)行區(qū)間估計?如何進(jìn)行區(qū)間估計?1、總體標(biāo)準(zhǔn)差已知參照u分布,正態(tài)曲線下95%的u值在+-1.96之間,即:總體均數(shù)的95%置信區(qū)間:99%置信區(qū)間:如何進(jìn)行區(qū)間估計?1、總體標(biāo)準(zhǔn)差已知2、總體標(biāo)準(zhǔn)差未知,樣本例數(shù)(>50)足夠大也可參考u分布進(jìn)行95%置信區(qū)間:99%置信區(qū)間:2、總體標(biāo)準(zhǔn)差未知,樣本例數(shù)(>50)足夠大3、總體標(biāo)準(zhǔn)差未知,樣本例數(shù)較小按t分布原理,依據(jù)相應(yīng)的自由度,查出該自由度下某個概率相應(yīng)的界值,再按照中部占95%面積的t值范圍:-t0.05/2(υ)--t0.05/2(υ),中部占99%面積的t值范圍:-t0.01/2(υ)--t0.01/2(υ)進(jìn)行估計。因為:所以:95%置信區(qū)間:99%置信區(qū)間:3、總體標(biāo)準(zhǔn)差未知,樣本例數(shù)較小例子:p236課堂練習(xí)95%置信區(qū)間的意義:理論上,用一次抽樣所得的樣本均數(shù)估計總體均數(shù),犯錯誤的概率為5%.或進(jìn)行100次抽樣,可算得100個置信區(qū)間,平均有95個置信區(qū)間包括客觀存在的總體均數(shù),只有5個置信區(qū)間未包括總體均數(shù)。例子:p236課堂練習(xí)估計置信區(qū)間的注意事項:(1)區(qū)間是以上、下可信限為界的一個范圍。通常用表示置信限,用表示置信區(qū)間(2)置信區(qū)間與正常值范圍的意義、算法不同:95%正常值范圍一般是指同質(zhì)總體內(nèi)包括95%個體值的估計范圍,若總體為正態(tài)分布,常用:計算;95%置信區(qū)間是指按照95%置信度估計的總體參數(shù)的可能范圍,按照下式計算。

前者用標(biāo)準(zhǔn)差,后者用標(biāo)準(zhǔn)誤。估計置信區(qū)間的注意事項:假設(shè)檢驗的基本思想和步驟假設(shè)檢驗的基本思想和步驟假設(shè)檢驗(hypothesistesting):亦稱顯著性檢驗(significancetest).是統(tǒng)計推斷的另一個方面。

先對總體的參數(shù)或分布作出某種假設(shè),如假設(shè)總體均數(shù)(或總體率)為一定值,兩總體均數(shù)(或總體率)相等,總體服從正態(tài)分布或兩總體分布相同等。然后,用適當(dāng)方法根據(jù)樣本對總體提供的信息,推斷此假設(shè)應(yīng)當(dāng)拒絕或不拒絕。其結(jié)果將有助于研究者作出決策,采取措施。假設(shè)檢驗(hypothesistesting):亦稱顯著性在實際情況下:由于抽樣誤差,從某總體中隨機抽得的樣本,得到的樣本均數(shù)與該總體的均數(shù)不同;同一總體中兩次抽樣的樣本均數(shù)也不相同。這種差別的原因在于:要么總體均數(shù)不同;要么總體均數(shù)相同,差別僅由抽樣誤差所致。那么,當(dāng)我們遇到這種情況時,如何判斷?可以通過某種方法來判斷差別屬哪種情況,這種方法就是假設(shè)檢驗。在實際情況下:假設(shè)檢驗HypothesisTesting假設(shè)檢驗的反證思想

兩種說法非A即B。要證明B真,只要證明A偽即可。無效假設(shè)Nullhypothesis(H0)

意在推翻的假設(shè)(說法A)。備擇假設(shè)Alternativehypothesis(H1)

意在接受的假設(shè)(說法B)。從無效假設(shè)出發(fā),找出不支持這一假設(shè)的證據(jù),從而推翻它。假設(shè)檢驗HypothesisTesting假設(shè)檢驗的反證小概率事件

smallprobabilityevent事件A發(fā)生的概率是如此之小,以至于在一次試驗(抽樣)時,我們往往認(rèn)為它(事件A)不會發(fā)生。統(tǒng)計學(xué)中,小概率事件一般是指發(fā)生概率<0.05(檢驗水準(zhǔn))的事件。在假設(shè)檢驗中,如果在無效假設(shè)的前提下出現(xiàn)了小概率事件,我們則懷疑無效假設(shè)的真實性。小概率事件

smallprobabilityevent事例:兩種不同處理結(jié)果之間的差異效果

A處理結(jié)果A,B處理結(jié)果B

效果Effect:=結(jié)果A-結(jié)果B對于總體

如果

=0,則A處理和B處理之間沒有差別。

如果0,則A處理和B處理之間有差別。對于樣本

即使

=0,由于存在抽樣變異,往往樣本結(jié)果A–樣本結(jié)果B=0。問題在于這個差異是否僅僅是由于抽樣變異造成的?例:兩種不同處理結(jié)果之間的差異效果

A處理結(jié)果A,B處進(jìn)行假設(shè)檢驗的思路無效假設(shè):樣本結(jié)果A和B之間的差異僅僅是由于抽樣變異造成的。即H0:=0。備擇假設(shè):樣本結(jié)果A和B之間的差異不僅僅是由于抽樣變異造成的,還包含不同處理的效果。即H1:0。由無效假設(shè)出發(fā),我們可以計算出得到樣本差異或者更大差異的概率(P值)。如果P值小于檢驗水準(zhǔn),則認(rèn)為由此無效假設(shè)不太可能出現(xiàn)這樣的結(jié)果,從而推翻它,接受備擇假設(shè)(差異顯著性)。反之,接受無效假設(shè)。進(jìn)行假設(shè)檢驗的思路無效假設(shè):樣本結(jié)果A和B之間的差異僅僅是由檢驗統(tǒng)計量

statisticfortesting在無效假設(shè)的前提下,檢驗統(tǒng)計量的構(gòu)建是無效假設(shè)的關(guān)鍵。檢驗統(tǒng)計量一般服從某種分布。這樣我們就可以利用這種分布計算出由無效假設(shè)出發(fā),得到觀察到的差異或更大的差異的概率,從而作出推斷。檢驗統(tǒng)計量

statisticfortesting在無終身模塊統(tǒng)計學(xué)抽樣誤差假設(shè)檢驗課件界值criticalvalue對應(yīng)于檢驗水準(zhǔn)的分布上的某些數(shù)值。正態(tài)分布上的某些界值:單側(cè)0.05±1.645雙側(cè)0.05±1.96相同界值單側(cè)檢驗概率是雙側(cè)檢驗概率的一半界值criticalvalue對應(yīng)于檢驗水準(zhǔn)的分布上的某例題:兩個血糖均數(shù)不同,其原因可能是由于抽樣誤差;也可能是男性管理人員的總體血糖均數(shù)與一般正常成年男性的均數(shù)不同。假設(shè)檢驗過程:1、建立檢驗假設(shè)和設(shè)定檢驗水準(zhǔn)無效假設(shè)(nullhypothesis)H0,假設(shè)差異是由于抽樣誤差所致,而兩個總體參數(shù)相同。是從反證法的思想提出的。(μ=μ0)例題:兩個血糖均數(shù)不同,其原因可能是由于抽樣誤差;也可能是男備擇假設(shè)(alternativehypothesis),H1.即差別不僅是由抽樣誤差所致,而更是總體參數(shù)不同。H1是和H0相聯(lián)系的,對立的假設(shè)。(μ≠μ0,μ>μ0,μ<μ0)雙側(cè),單側(cè)檢驗:根據(jù)專業(yè)知識,μ可能大于也可能小于μ0,稱雙側(cè)檢驗;若認(rèn)為μ大于、等于μ0(或相反),為單側(cè)檢驗。若不能確定單側(cè)的情況,應(yīng)采用雙側(cè)檢驗。備擇假設(shè)(alternativehypothesis),確定檢驗水準(zhǔn)(sizeofatest),(也叫顯著性水準(zhǔn)significancelevel):用α表示。即:拒絕了實際上成立的H0的概率;一般取0.05,或0.01.本步驟一般寫成:H0:μ=μ0H1:μ≠μ0,(雙側(cè))或:H1:μ>μ0,(μ<μ0),(單側(cè))α=0.05確定檢驗水準(zhǔn)(sizeofatest),(也叫顯著性水2、計算統(tǒng)計量根據(jù)研究設(shè)計類型,資料特征,統(tǒng)計方法的適用條件,選擇和計算統(tǒng)計量。本例:計算統(tǒng)計量t值。2、計算統(tǒng)計量3、確定概率P值,作出統(tǒng)計推斷計算統(tǒng)計量后,根據(jù)事先確定的單側(cè)或雙側(cè)檢驗、自由度、檢驗水準(zhǔn)在相應(yīng)的統(tǒng)計用表中查出相應(yīng)的界值。將該界值與所計算的統(tǒng)計量比較,得出相應(yīng)的概率P。對本例t檢驗:小于界值的范圍,P大于α,是不拒絕H0的區(qū)間;大于或等于界值的范圍,P小于α,是拒絕H0的區(qū)間。3、確定概率P值,作出統(tǒng)計推斷P值是在由H0所規(guī)定的總體中作隨機抽樣,獲得等于及大于(或等于及小于)現(xiàn)有統(tǒng)計量的概率。P值是在由H0所規(guī)定的總體中作隨機抽樣,獲得等于及大于(或等若P≤α,統(tǒng)計上認(rèn)為是小概率事件,一次抽樣不可能發(fā)生。而一旦發(fā)生,即認(rèn)為:造成兩個均數(shù)差異的原因是總體不同(試驗因素所致,或相應(yīng)的因素導(dǎo)致等),無效假設(shè)是錯誤的,因此,拒絕H0,接受H1。稱差異有統(tǒng)計學(xué)意義。若P>α,則認(rèn)為是大概率事件,本次的差異僅為抽樣誤差所致,因此,接受H0,拒絕H1,認(rèn)為兩均數(shù)來自同一總體。稱差異無統(tǒng)計學(xué)意義。若P≤α,統(tǒng)計上認(rèn)為是小概率事件,一次抽樣不可能發(fā)生。而一本例t=0.844,而相應(yīng)的t界值:t0.05/2,25=2.0640.844<2.064,所以P>0.05按照α=0.05水平,不拒絕H0,不能認(rèn)為男性健康管理人員的血糖均數(shù)與一般成年男性的血糖均數(shù)不同。本例t=0.844,而相應(yīng)的t界值:t0.05/2,25=2兩均數(shù)比較時常用的判斷標(biāo)準(zhǔn)統(tǒng)計量u:單側(cè):u<1.645,雙側(cè):u<1.96,P>0.05,不拒絕H0;單側(cè):u≥1.645,雙側(cè):u≥1.96,P≤0.05,拒絕H0;統(tǒng)計量t:單側(cè);雙側(cè)P>0.05,不拒絕H0;單側(cè):雙側(cè)P≤0.05,拒絕H0;兩均數(shù)比較時常用的判斷標(biāo)準(zhǔn)統(tǒng)計量u:單側(cè):u<1.645,第一類錯誤與第二類錯誤

typeIerror&typeIIerror

假設(shè)檢驗的判斷,并非百分之百正確,有兩種可能錯誤:假陽性錯誤(falsepositiveerror),稱為第一類錯誤(typeIerror),用α表示,即檢驗水準(zhǔn)(levelofsignificance),

通常?。?.05。即:無效假設(shè)(H0:u=u0)原本是正確的,但被拒絕,誤判為有差別(棄真錯誤)。當(dāng)無效假設(shè)正確時,在100次抽樣中,可以有5次推斷是錯誤的。統(tǒng)計上有意義的界限是允許犯第一類錯誤的界限。第一類錯誤與第二類錯誤

typeIerror&typ假陰性錯誤(falsenegativeerror),稱為第二類錯誤(typeIIerror)。即,無效假設(shè)(H0:u=u0)原本是錯誤的(實際上應(yīng)是H1:u=u1),但所得統(tǒng)計量t沒有超過t0.05的水平從而接受了無效假設(shè),錯誤地得出無差別的結(jié)論(取偽錯誤)。用表示。檢驗效能(poweroftest):1-當(dāng)兩個總體存在差異時,所使用的統(tǒng)計檢驗?zāi)軌虬l(fā)現(xiàn)這種差異(拒絕H0)的能力。假陰性錯誤(falsenegativeerror),稱為盡管是小概率事件,它還是有可能發(fā)生的。I型錯誤:雖然無效假設(shè)為真,但由于抽到了較大檢驗統(tǒng)計量的樣本,使得P值小于檢驗水準(zhǔn)而導(dǎo)致被拒絕。是否為小概率事件是由檢驗水準(zhǔn)而定,所以犯錯誤的概率也由檢驗水準(zhǔn)而定。II型錯誤:雖然無效假設(shè)為假,但由于抽到了較小檢驗統(tǒng)計量的樣本,使得P值大于檢驗水準(zhǔn)而導(dǎo)致不被拒絕。盡管是小概率事件,它還是有可能發(fā)生的。選擇統(tǒng)計意義水平,應(yīng)考慮兩類錯誤對所要研究的事物的影響哪一個重要。一般來說,定0.05為有統(tǒng)計學(xué)意義的水平是比較適宜的。兩類錯誤的關(guān)系:在樣本含量固定的條件下,減少I類錯誤,會增大II類錯誤;增大I類錯誤,會減少II類錯誤。其他條件不變,增大樣本含量可使第二類錯誤的概率減小。同時正確的實驗設(shè)計能夠減少抽樣誤差,提高檢驗效能。選擇統(tǒng)計意義水平,應(yīng)考慮兩類錯誤對所要研究的事物的影響哪一個終身模塊統(tǒng)計學(xué)抽樣誤差假設(shè)檢驗課件tata實際差別與統(tǒng)計意義統(tǒng)計意義:抽到這樣大統(tǒng)計量的可能性很小,可以拒絕H0。但并不意味兩總體均數(shù)差別很大。樣本量很大時,即使均數(shù)差別不大,統(tǒng)計學(xué)意義卻顯著。樣本小時,即使均數(shù)差別很大,統(tǒng)計學(xué)意義卻不顯著。實際差別與統(tǒng)計意義理解檢驗統(tǒng)計量觀察到的量可以是一個樣本的均數(shù)、兩個樣本均數(shù)的差、一個樣本的百分構(gòu)成、兩個樣本百分構(gòu)成的差;檢驗統(tǒng)計量所服從的分布不一定是正態(tài)分布。但只要是已知的理論分布,都可以通過該分布求得P值。理解檢驗統(tǒng)計量觀察到的量可以是一個樣本的均數(shù)、兩個樣本均數(shù)的理解P值P值是指在無效假設(shè)的前提下,得到觀察到的量(或更極端的量)的概率。P值越小說明無效假設(shè)越不可靠?;蛘哒f,P值越小我們就越有理由推翻無效假設(shè)。至于P值是否屬于“小”,一般的,我們是根據(jù)事先確定的檢驗水準(zhǔn)來判斷的。當(dāng)P<時,我們就可以下諸如“差別有顯著性”的論斷。P值的大小與觀察到的量的大小之間沒有必然的聯(lián)系。理解P值P值是指在無效假設(shè)的前提下,得到觀察到的量(或更極端當(dāng)P>時非小概率事件

在無效假設(shè)的前提下,得到觀察到的量(或更極端的量)的可能性還是相當(dāng)大的,我們尚不能拒絕無效假設(shè)或者說拒絕無效假設(shè)的證據(jù)不足。具體問題,專業(yè)判斷

P=0.70與P=0.07當(dāng)P>時非小概率事件

在無效假設(shè)的前提下,得到觀察到的量(“差別有顯著性”與“差別顯著”“差別有高度顯著性”與“差別極為顯著”二者之間不存在必然的聯(lián)系。“差別顯著”不一定導(dǎo)致“差別有顯著性”,“差別不顯著”倒是有很大可能導(dǎo)致“差別有顯著性”。即使“差別有顯著性”,臨床上也不一定有意義?!安顒e有顯著性”與“差別顯著”“差別有高度顯著性”與“差別極單側(cè)檢驗還是雙側(cè)檢驗?

One-sidedortwo-sidedtest?雙側(cè)檢驗永遠(yuǎn)是正確的單側(cè)檢驗只有在少數(shù)情況下才是合適的即使要做單側(cè)檢驗,也必須事先確定單側(cè)檢驗還是雙側(cè)檢驗?

One-sidedortwo-st檢驗和u檢驗t檢驗和u檢驗是兩種常見的假設(shè)檢驗的方法,因其統(tǒng)計量為t,u而得名。u檢驗條件:總體標(biāo)準(zhǔn)差已知,資料服從正態(tài)分布情況下(1)樣本均數(shù)與總體均數(shù)比較(2)兩大樣本均數(shù)的比較;t檢驗條件:用于樣本量小、總體標(biāo)準(zhǔn)差未知時(1)樣本與總體均數(shù)比較(2)配對設(shè)計資料比較(3)兩樣本均數(shù)比較(同時要求兩樣本的總體方差相同,服從正態(tài)分布)是兩種常見的假設(shè)檢驗的方法,因其統(tǒng)計量為t,u而得名。一、樣本均數(shù)與總體均數(shù)的比較總體均數(shù):大量觀測得到的穩(wěn)定值或理論值,μ0

比較的目的是推斷樣本所代表的未知總體均數(shù)與已知總體均數(shù)是否相同。樣本均數(shù)與總體均數(shù)比較的t檢驗

P240例題14.10

注意步驟、符號寫法

一、樣本均數(shù)與總體均數(shù)的比較樣本均數(shù)與總體均數(shù)比較的u檢驗例題:若通過以往大規(guī)模調(diào)查,已知某地嬰兒出生體重均數(shù)為3.20kg,標(biāo)準(zhǔn)差0.39kg,今隨機查得25名難產(chǎn)兒平均出生體重為3.42kg,問:出生體重與難產(chǎn)是否有關(guān)?假定難產(chǎn)兒出生體重的標(biāo)準(zhǔn)差與一般兒童相同。樣本均數(shù)與總體均數(shù)比較的u檢驗例題:若通過以往大規(guī)模調(diào)查,已解題步驟據(jù)題意:要檢驗的是,難產(chǎn)兒出生體重總體均數(shù)是否等于3.20kg(),0.39看作總體標(biāo)準(zhǔn)差,樣本均數(shù)3.42,樣本含量25。1.建立假設(shè):H0,假設(shè)難產(chǎn)兒出生體重總體均數(shù)和一般嬰兒出生體重總體均數(shù)相等,即:解題步驟據(jù)題意:要檢驗的是,難產(chǎn)兒出生體重總體均數(shù)是否等于32.計算合適的統(tǒng)計量:在總體標(biāo)準(zhǔn)差已知,對樣本均數(shù)和總體均數(shù)的差別做統(tǒng)計意義檢驗,可用公式:

u值服從均數(shù)為0,標(biāo)準(zhǔn)差為1的標(biāo)準(zhǔn)正態(tài)分布。本例:2.計算合適的統(tǒng)計量:3.從正態(tài)分布表查臨界值:本例:所以:拒絕無效假設(shè),接受備擇假設(shè)。認(rèn)為難產(chǎn)和出生體重是有關(guān)的??梢詾?,難產(chǎn)兒的出生體重平均來說是比較大一些。3.從正態(tài)分布表查臨界值:如果本例總體標(biāo)準(zhǔn)差未知,只有從樣本中求得標(biāo)準(zhǔn)差0.42,則應(yīng)該用t檢驗。公式:如果本例總體標(biāo)準(zhǔn)差未知,只有從樣本中求得標(biāo)準(zhǔn)差0.42,則應(yīng)二、配對資料的比較配對設(shè)計:兩樣本中的觀察值由于存在某種聯(lián)系而一一對應(yīng)結(jié)成對子(matching)的情況.1、同一受試對象處理前后的比較:高血壓治療前后的血壓值,或每一名病人有一對數(shù)據(jù);2、同一對象身體不同部位測定值比較:如左右臂皮膚的敏感試驗,測得紅斑直徑;3、同一樣品兩種不同方法測定結(jié)果:兩種儀器,兩名化驗員,兩種條件等;4、成對設(shè)計:動物配對后隨機分到兩組后的測定結(jié)果;二、配對資料的比較這些資料的均數(shù)比較用t檢驗。目的是驗證差值的總體均數(shù)是否為零的假設(shè)。

P241例14.11計算兩組資料的差值以及差值的均數(shù),標(biāo)準(zhǔn)差,并將其差值轉(zhuǎn)化為t分布,假設(shè)差值的總體均數(shù)為0,做配對t檢驗。這些資料的均數(shù)比較用t檢驗。目的是驗證差值的總體均數(shù)是否為零三、兩樣本均數(shù)比較推斷兩樣本所代表的兩個總體均數(shù)是否相同。分兩種情況:1、大樣本。兩樣本含量均>50,用u檢驗。

三、兩樣本均數(shù)比較2、兩個小樣本均數(shù)的比較(正態(tài)總體,方差齊)由專用公式計算合并方差,均數(shù)差值的標(biāo)準(zhǔn)誤,再計算t值。用合并自由度查t界值表。確定概率,作出統(tǒng)計推斷。

p243例14-122、兩個小樣本均數(shù)的比較(正態(tài)總體,方差齊)t檢驗的條件:正態(tài)總體,兩總體方差相等。如果:兩樣本方差不齊,則應(yīng)該用t’檢驗。3、方差不齊時均數(shù)差別的統(tǒng)計學(xué)意義檢查(t’檢驗)t檢驗的條件:3、方差不齊時均數(shù)差別的統(tǒng)計學(xué)意義檢查(t’如何檢驗方差齊性?方差齊性檢驗查F界值表,若大于相應(yīng)的界值,則有統(tǒng)計學(xué)意義。方差齊性檢驗:p244例14-14,例14-15,檢驗總體變異程度如何檢驗方差齊性?方差齊性檢驗t’檢驗的過程1、計算兩個樣本均數(shù)之差的標(biāo)準(zhǔn)誤,t’值t’檢驗的過程1、計算兩個樣本均數(shù)之差的標(biāo)準(zhǔn)誤,t’值2、計算臨界值:2、計算臨界值:3、將t’分別與兩個臨界值比較,大于臨界值,則P小于臨界概率。反之,大于臨界概率。4、做出兩均數(shù)是否有區(qū)別的判斷。3、將t’分別與兩個臨界值比較,大于臨界值,則P小于臨界概率計量資料的統(tǒng)計推斷

statisticalinferenceofmeasurementdata張建軍汕大醫(yī)學(xué)院預(yù)防醫(yī)學(xué)教研室Tel/p>

zhangjj@

計量資料的統(tǒng)計推斷

statisticalinferenc統(tǒng)計推斷:參數(shù)估計,假設(shè)檢驗“世上有三種哄人的東西:謊言、該死的謊言、統(tǒng)計數(shù)據(jù)”----英國政治家迪斯雷里?!笆郎嫌腥龢蛹尤诵牡臇|西:宣傳、要命的宣傳、統(tǒng)計數(shù)據(jù)”。統(tǒng)計推斷:參數(shù)估計,假設(shè)檢驗均數(shù)的抽樣誤差和標(biāo)準(zhǔn)誤均數(shù)的抽樣誤差和標(biāo)準(zhǔn)誤均數(shù)的抽樣誤差samplingerrorofmean概念:由于總體中存在個體變異,抽樣研究中所抽取的樣本,只包含總體中一部分個體,因而樣本均數(shù)(或率)往往不等于總體均數(shù)(或率),樣本均數(shù)之間也互不相等,這種由抽樣引起的差異稱為均數(shù)的抽樣誤差。即:均數(shù)的抽樣誤差samplingerrorofmean12中心極限定理:如果隨機變量的總體均數(shù)及方差有限,當(dāng)樣本容量趨于無窮大時,樣本均數(shù)的分布趨近于均數(shù)為總體均數(shù),方差為的正態(tài)分布。1如何估計?用樣本均數(shù)的標(biāo)準(zhǔn)差來估計,稱標(biāo)準(zhǔn)誤(standarderror)。標(biāo)準(zhǔn)誤越大,均數(shù)的抽樣誤差越大,樣本均數(shù)與總體均數(shù)間的差異越大。計算公式:即:由總體標(biāo)準(zhǔn)差,樣本例數(shù)求得。但通常以樣本標(biāo)準(zhǔn)差作為總體標(biāo)準(zhǔn)差的估計值。因此:如何估計?與標(biāo)準(zhǔn)差的區(qū)別:標(biāo)準(zhǔn)差:表示一般變量值的離散程度;均數(shù)標(biāo)準(zhǔn)誤特別說明樣本均數(shù)這一變量值離散程度的指標(biāo)。標(biāo)準(zhǔn)誤的應(yīng)用:(1)用來衡量抽樣誤差的大小,標(biāo)準(zhǔn)誤越小,樣本均數(shù)與總體均數(shù)越接近,樣本均數(shù)的可信度越高;(2)結(jié)合標(biāo)準(zhǔn)正態(tài)分布與t分布曲線下的面積規(guī)律,估計總體均數(shù)的置信區(qū)間。(3)用于假設(shè)檢驗。與標(biāo)準(zhǔn)差的區(qū)別:假定2003年汕頭市15歲女學(xué)生的身高(cm)服從N(155.4,5.32)。用計算機做抽樣模擬試驗,每次抽出10個數(shù)字,組成一個樣本,求出樣本均數(shù)、樣本標(biāo)準(zhǔn)差S。再求得此100個樣本均數(shù)的均數(shù)、樣本均數(shù)的標(biāo)準(zhǔn)差(標(biāo)準(zhǔn)誤)。100個樣本均數(shù)構(gòu)成一個新的分布,也是正態(tài)分布(即使原分布為偏態(tài)分布,當(dāng)樣本含量足夠大時,新分布也近似正態(tài)分布)。新分布的集中趨勢用均數(shù)的均數(shù)來表示,離散趨勢用標(biāo)準(zhǔn)誤表示N(,)。各樣本均數(shù)的均數(shù)等于總體均數(shù)。假定2003年汕頭市15歲女學(xué)生的身高(cm)服從N(155正態(tài)總體中抽樣(樣本量5)正態(tài)總體中抽樣(樣本量10)正態(tài)總體中抽樣(樣本量30)抽樣時樣本量大小決定了樣本均數(shù)分布的形狀,當(dāng)樣本量足夠大時,均數(shù)分布趨向正態(tài)分布。正態(tài)總體中抽樣(樣本量5)正態(tài)總體中抽樣(樣本量10)正態(tài)總t分布(t-distribution)t分布(t-distribution)u分布:u轉(zhuǎn)換將正態(tài)分布轉(zhuǎn)換為標(biāo)準(zhǔn)正態(tài),N(0,1)。同理:將樣本均數(shù)的分布也可以轉(zhuǎn)換為標(biāo)準(zhǔn)正態(tài)分布即:實際工作中,總體標(biāo)準(zhǔn)差往往未知,常用S代替σ

計算標(biāo)準(zhǔn)誤,因此:就變?yōu)椋簎分布:u轉(zhuǎn)換也就是說:正態(tài)分布:標(biāo)準(zhǔn)正態(tài)分布正態(tài)變量實現(xiàn)這一轉(zhuǎn)變:也就是說:正態(tài)分布:均數(shù)的分布也是這樣如果我們采用另一個正態(tài)變量:于是,均數(shù)的分布變成了標(biāo)準(zhǔn)正態(tài)分布:均數(shù)的分布也是這樣如果我們采用另一個正態(tài)變量:但是,條件發(fā)生變化我們通常用代替

然而,

隨著樣本量的變化而變化,所以,我們稱之為

t-分布,雖然它是正態(tài)分布,但只有當(dāng)樣本量(自由度)無窮大的時候,它才是標(biāo)準(zhǔn)正態(tài)分布,此時,u=t但是,條件發(fā)生變化我們通常用代替t分布是一簇對稱于0的單峰分布曲線。自由度越?。ㄏ喈?dāng)于標(biāo)準(zhǔn)差大),曲線的中間越低,兩邊越高;隨自由度增大,t分布曲線逐漸逼近于標(biāo)準(zhǔn)正態(tài)分布曲線。當(dāng)自由度無窮大時,t分布就是標(biāo)準(zhǔn)正態(tài)分布曲線。每一條t分布曲線,都對應(yīng)于相應(yīng)的自由度。t分布是一簇對稱于0的單峰分布曲線。自由度越?。ㄏ喈?dāng)于標(biāo)準(zhǔn)差t分布曲線下的面積規(guī)律:與標(biāo)準(zhǔn)正態(tài)曲線下的面積規(guī)律相似:在某一個自由度下,兩側(cè)外部總面積為5%的界限的t值稱為t0.05/2(υ),把兩側(cè)外部總面積為1%的界限的t值稱為t0.01/2(υ)。中部占95%面積的t值范圍:t0.05/2(υ)--t0.05/2(υ),中部占99%面積的t值范圍:-t0.01/2(υ)--t0.01/2(υ)。t分布曲線下的面積規(guī)律:當(dāng)自由度確定時,占一定面積的t界限值,可以查表得出。參考附表6(p436)。例如:查當(dāng)自由度=20,兩側(cè)概率之和為0.05時,對應(yīng)的t值:t0.05/2(20)=2.086,單側(cè)概率為0.05時,對應(yīng)的t值:t0.05(20)=1.725,當(dāng)自由度確定時,占一定面積的t界限值,可以查表得出。參考附表t分布的主要應(yīng)用:(1)總體均數(shù)置信區(qū)間估計;(2)t檢驗;t分布的主要應(yīng)用:使用t值表注意:同一自由度下,P越小,t值越大;P值相同時,自由度越大,t越??;當(dāng)自由度無窮大時,t值與u值相等。這也是u分布與t分布的區(qū)別。使用t值表注意:總體均數(shù)置信區(qū)間的估計總體均數(shù)置信區(qū)間的估計參數(shù)估計:點估計(pointestimation):用樣本統(tǒng)計量作為對總體參數(shù)的估計值(μ)。比如均數(shù)的估計。區(qū)間估計(intervalestimation):根據(jù)選定的置信度估計總體均數(shù)所在的區(qū)間(a<μ<b).a,b為置信限(可信限)。參數(shù)估計:為何要進(jìn)行區(qū)間估計?點估計是用樣本均數(shù)來估計總體均數(shù),簡單易行,但未考慮抽樣誤差,而后者又是不可避免的。故常按照一定的概率估計總體均數(shù)在哪個范圍。置信度(confidencelevel):在估計總體均數(shù)的置信區(qū)間時,如果可能估計錯誤的概率為α,那么估計正確的概率為1-α,即為置信度.常用:95%,99%.置信區(qū)間(confidenceinterval,CI)根據(jù)置信度估計得到的區(qū)間,稱為置信區(qū)間。為何要進(jìn)行區(qū)間估計?如何進(jìn)行區(qū)間估計?1、總體標(biāo)準(zhǔn)差已知參照u分布,正態(tài)曲線下95%的u值在+-1.96之間,即:總體均數(shù)的95%置信區(qū)間:99%置信區(qū)間:如何進(jìn)行區(qū)間估計?1、總體標(biāo)準(zhǔn)差已知2、總體標(biāo)準(zhǔn)差未知,樣本例數(shù)(>50)足夠大也可參考u分布進(jìn)行95%置信區(qū)間:99%置信區(qū)間:2、總體標(biāo)準(zhǔn)差未知,樣本例數(shù)(>50)足夠大3、總體標(biāo)準(zhǔn)差未知,樣本例數(shù)較小按t分布原理,依據(jù)相應(yīng)的自由度,查出該自由度下某個概率相應(yīng)的界值,再按照中部占95%面積的t值范圍:-t0.05/2(υ)--t0.05/2(υ),中部占99%面積的t值范圍:-t0.01/2(υ)--t0.01/2(υ)進(jìn)行估計。因為:所以:95%置信區(qū)間:99%置信區(qū)間:3、總體標(biāo)準(zhǔn)差未知,樣本例數(shù)較小例子:p236課堂練習(xí)95%置信區(qū)間的意義:理論上,用一次抽樣所得的樣本均數(shù)估計總體均數(shù),犯錯誤的概率為5%.或進(jìn)行100次抽樣,可算得100個置信區(qū)間,平均有95個置信區(qū)間包括客觀存在的總體均數(shù),只有5個置信區(qū)間未包括總體均數(shù)。例子:p236課堂練習(xí)估計置信區(qū)間的注意事項:(1)區(qū)間是以上、下可信限為界的一個范圍。通常用表示置信限,用表示置信區(qū)間(2)置信區(qū)間與正常值范圍的意義、算法不同:95%正常值范圍一般是指同質(zhì)總體內(nèi)包括95%個體值的估計范圍,若總體為正態(tài)分布,常用:計算;95%置信區(qū)間是指按照95%置信度估計的總體參數(shù)的可能范圍,按照下式計算。

前者用標(biāo)準(zhǔn)差,后者用標(biāo)準(zhǔn)誤。估計置信區(qū)間的注意事項:假設(shè)檢驗的基本思想和步驟假設(shè)檢驗的基本思想和步驟假設(shè)檢驗(hypothesistesting):亦稱顯著性檢驗(significancetest).是統(tǒng)計推斷的另一個方面。

先對總體的參數(shù)或分布作出某種假設(shè),如假設(shè)總體均數(shù)(或總體率)為一定值,兩總體均數(shù)(或總體率)相等,總體服從正態(tài)分布或兩總體分布相同等。然后,用適當(dāng)方法根據(jù)樣本對總體提供的信息,推斷此假設(shè)應(yīng)當(dāng)拒絕或不拒絕。其結(jié)果將有助于研究者作出決策,采取措施。假設(shè)檢驗(hypothesistesting):亦稱顯著性在實際情況下:由于抽樣誤差,從某總體中隨機抽得的樣本,得到的樣本均數(shù)與該總體的均數(shù)不同;同一總體中兩次抽樣的樣本均數(shù)也不相同。這種差別的原因在于:要么總體均數(shù)不同;要么總體均數(shù)相同,差別僅由抽樣誤差所致。那么,當(dāng)我們遇到這種情況時,如何判斷?可以通過某種方法來判斷差別屬哪種情況,這種方法就是假設(shè)檢驗。在實際情況下:假設(shè)檢驗HypothesisTesting假設(shè)檢驗的反證思想

兩種說法非A即B。要證明B真,只要證明A偽即可。無效假設(shè)Nullhypothesis(H0)

意在推翻的假設(shè)(說法A)。備擇假設(shè)Alternativehypothesis(H1)

意在接受的假設(shè)(說法B)。從無效假設(shè)出發(fā),找出不支持這一假設(shè)的證據(jù),從而推翻它。假設(shè)檢驗HypothesisTesting假設(shè)檢驗的反證小概率事件

smallprobabilityevent事件A發(fā)生的概率是如此之小,以至于在一次試驗(抽樣)時,我們往往認(rèn)為它(事件A)不會發(fā)生。統(tǒng)計學(xué)中,小概率事件一般是指發(fā)生概率<0.05(檢驗水準(zhǔn))的事件。在假設(shè)檢驗中,如果在無效假設(shè)的前提下出現(xiàn)了小概率事件,我們則懷疑無效假設(shè)的真實性。小概率事件

smallprobabilityevent事例:兩種不同處理結(jié)果之間的差異效果

A處理結(jié)果A,B處理結(jié)果B

效果Effect:=結(jié)果A-結(jié)果B對于總體

如果

=0,則A處理和B處理之間沒有差別。

如果0,則A處理和B處理之間有差別。對于樣本

即使

=0,由于存在抽樣變異,往往樣本結(jié)果A–樣本結(jié)果B=0。問題在于這個差異是否僅僅是由于抽樣變異造成的?例:兩種不同處理結(jié)果之間的差異效果

A處理結(jié)果A,B處進(jìn)行假設(shè)檢驗的思路無效假設(shè):樣本結(jié)果A和B之間的差異僅僅是由于抽樣變異造成的。即H0:=0。備擇假設(shè):樣本結(jié)果A和B之間的差異不僅僅是由于抽樣變異造成的,還包含不同處理的效果。即H1:0。由無效假設(shè)出發(fā),我們可以計算出得到樣本差異或者更大差異的概率(P值)。如果P值小于檢驗水準(zhǔn),則認(rèn)為由此無效假設(shè)不太可能出現(xiàn)這樣的結(jié)果,從而推翻它,接受備擇假設(shè)(差異顯著性)。反之,接受無效假設(shè)。進(jìn)行假設(shè)檢驗的思路無效假設(shè):樣本結(jié)果A和B之間的差異僅僅是由檢驗統(tǒng)計量

statisticfortesting在無效假設(shè)的前提下,檢驗統(tǒng)計量的構(gòu)建是無效假設(shè)的關(guān)鍵。檢驗統(tǒng)計量一般服從某種分布。這樣我們就可以利用這種分布計算出由無效假設(shè)出發(fā),得到觀察到的差異或更大的差異的概率,從而作出推斷。檢驗統(tǒng)計量

statisticfortesting在無終身模塊統(tǒng)計學(xué)抽樣誤差假設(shè)檢驗課件界值criticalvalue對應(yīng)于檢驗水準(zhǔn)的分布上的某些數(shù)值。正態(tài)分布上的某些界值:單側(cè)0.05±1.645雙側(cè)0.05±1.96相同界值單側(cè)檢驗概率是雙側(cè)檢驗概率的一半界值criticalvalue對應(yīng)于檢驗水準(zhǔn)的分布上的某例題:兩個血糖均數(shù)不同,其原因可能是由于抽樣誤差;也可能是男性管理人員的總體血糖均數(shù)與一般正常成年男性的均數(shù)不同。假設(shè)檢驗過程:1、建立檢驗假設(shè)和設(shè)定檢驗水準(zhǔn)無效假設(shè)(nullhypothesis)H0,假設(shè)差異是由于抽樣誤差所致,而兩個總體參數(shù)相同。是從反證法的思想提出的。(μ=μ0)例題:兩個血糖均數(shù)不同,其原因可能是由于抽樣誤差;也可能是男備擇假設(shè)(alternativehypothesis),H1.即差別不僅是由抽樣誤差所致,而更是總體參數(shù)不同。H1是和H0相聯(lián)系的,對立的假設(shè)。(μ≠μ0,μ>μ0,μ<μ0)雙側(cè),單側(cè)檢驗:根據(jù)專業(yè)知識,μ可能大于也可能小于μ0,稱雙側(cè)檢驗;若認(rèn)為μ大于、等于μ0(或相反),為單側(cè)檢驗。若不能確定單側(cè)的情況,應(yīng)采用雙側(cè)檢驗。備擇假設(shè)(alternativehypothesis),確定檢驗水準(zhǔn)(sizeofatest),(也叫顯著性水準(zhǔn)significancelevel):用α表示。即:拒絕了實際上成立的H0的概率;一般取0.05,或0.01.本步驟一般寫成:H0:μ=μ0H1:μ≠μ0,(雙側(cè))或:H1:μ>μ0,(μ<μ0),(單側(cè))α=0.05確定檢驗水準(zhǔn)(sizeofatest),(也叫顯著性水2、計算統(tǒng)計量根據(jù)研究設(shè)計類型,資料特征,統(tǒng)計方法的適用條件,選擇和計算統(tǒng)計量。本例:計算統(tǒng)計量t值。2、計算統(tǒng)計量3、確定概率P值,作出統(tǒng)計推斷計算統(tǒng)計量后,根據(jù)事先確定的單側(cè)或雙側(cè)檢驗、自由度、檢驗水準(zhǔn)在相應(yīng)的統(tǒng)計用表中查出相應(yīng)的界值。將該界值與所計算的統(tǒng)計量比較,得出相應(yīng)的概率P。對本例t檢驗:小于界值的范圍,P大于α,是不拒絕H0的區(qū)間;大于或等于界值的范圍,P小于α,是拒絕H0的區(qū)間。3、確定概率P值,作出統(tǒng)計推斷P值是在由H0所規(guī)定的總體中作隨機抽樣,獲得等于及大于(或等于及小于)現(xiàn)有統(tǒng)計量的概率。P值是在由H0所規(guī)定的總體中作隨機抽樣,獲得等于及大于(或等若P≤α,統(tǒng)計上認(rèn)為是小概率事件,一次抽樣不可能發(fā)生。而一旦發(fā)生,即認(rèn)為:造成兩個均數(shù)差異的原因是總體不同(試驗因素所致,或相應(yīng)的因素導(dǎo)致等),無效假設(shè)是錯誤的,因此,拒絕H0,接受H1。稱差異有統(tǒng)計學(xué)意義。若P>α,則認(rèn)為是大概率事件,本次的差異僅為抽樣誤差所致,因此,接受H0,拒絕H1,認(rèn)為兩均數(shù)來自同一總體。稱差異無統(tǒng)計學(xué)意義。若P≤α,統(tǒng)計上認(rèn)為是小概率事件,一次抽樣不可能發(fā)生。而一本例t=0.844,而相應(yīng)的t界值:t0.05/2,25=2.0640.844<2.064,所以P>0.05按照α=0.05水平,不拒絕H0,不能認(rèn)為男性健康管理人員的血糖均數(shù)與一般成年男性的血糖均數(shù)不同。本例t=0.844,而相應(yīng)的t界值:t0.05/2,25=2兩均數(shù)比較時常用的判斷標(biāo)準(zhǔn)統(tǒng)計量u:單側(cè):u<1.645,雙側(cè):u<1.96,P>0.05,不拒絕H0;單側(cè):u≥1.645,雙側(cè):u≥1.96,P≤0.05,拒絕H0;統(tǒng)計量t:單側(cè);雙側(cè)P>0.05,不拒絕H0;單側(cè):雙側(cè)P≤0.05,拒絕H0;兩均數(shù)比較時常用的判斷標(biāo)準(zhǔn)統(tǒng)計量u:單側(cè):u<1.645,第一類錯誤與第二類錯誤

typeIerror&typeIIerror

假設(shè)檢驗的判斷,并非百分之百正確,有兩種可能錯誤:假陽性錯誤(falsepositiveerror),稱為第一類錯誤(typeIerror),用α表示,即檢驗水準(zhǔn)(levelofsignificance),

通常?。?.05。即:無效假設(shè)(H0:u=u0)原本是正確的,但被拒絕,誤判為有差別(棄真錯誤)。當(dāng)無效假設(shè)正確時,在100次抽樣中,可以有5次推斷是錯誤的。統(tǒng)計上有意義的界限是允許犯第一類錯誤的界限。第一類錯誤與第二類錯誤

typeIerror&typ假陰性錯誤(falsenegativeerror),稱為第二類錯誤(typeIIerror)。即,無效假設(shè)(H0:u=u0)原本是錯誤的(實際上應(yīng)是H1:u=u1),但所得統(tǒng)計量t沒有超過t0.05的水平從而接受了無效假設(shè),錯誤地得出無差別的結(jié)論(取偽錯誤)。用表示。檢驗效能(poweroftest):1-當(dāng)兩個總體存在差異時,所使用的統(tǒng)計檢驗?zāi)軌虬l(fā)現(xiàn)這種差異(拒絕H0)的能力。假陰性錯誤(falsenegativeerror),稱為盡管是小概率事件,它還是有可能發(fā)生的。I型錯誤:雖然無效假設(shè)為真,但由于抽到了較大檢驗統(tǒng)計量的樣本,使得P值小于檢驗水準(zhǔn)而導(dǎo)致被拒絕。是否為小概率事件是由檢驗水準(zhǔn)而定,所以犯錯誤的概率也由檢驗水準(zhǔn)而定。II型錯誤:雖然無效假設(shè)為假,但由于抽到了較小檢驗統(tǒng)計量的樣本,使得P值大于檢驗水準(zhǔn)而導(dǎo)致不被拒絕。盡管是小概率事件,它還是有可能發(fā)生的。選擇統(tǒng)計意義水平,應(yīng)考慮兩類錯誤對所要研究的事物的影響哪一個重要。一般來說,定0.05為有統(tǒng)計學(xué)意義的水平是比較適宜的。兩類錯誤的關(guān)系:在樣本含量固定的條件下,減少I類錯誤,會增大II類錯誤;增大I類錯誤,會減少II類錯誤。其他條件不變,增大樣本含量可使第二類錯誤的概率減小。同時正確的實驗設(shè)計能夠減少抽樣誤差,提高檢驗效能。選擇統(tǒng)計意義水平,應(yīng)考慮兩類錯誤對所要研究的事物的影響哪一個終身模塊統(tǒng)計學(xué)抽樣誤差假設(shè)檢驗課件tata實際差別與統(tǒng)計意義統(tǒng)計意義:抽到這樣大統(tǒng)計量的可能性很小,可以拒絕H0。但并不意味兩總體均數(shù)差別很大。樣本量很大時,即使均數(shù)差別不大,統(tǒng)計學(xué)意義卻顯著。樣本小時,即使均數(shù)差別很大,統(tǒng)計學(xué)意義卻不顯著。實際差別與統(tǒng)計意義理解檢驗統(tǒng)計量觀察到的量可以是一個樣本的均數(shù)、兩個樣本均數(shù)的差、一個樣本的百分構(gòu)成、兩個樣本百分構(gòu)成的差;檢驗統(tǒng)計量所服從的分布不一定是正態(tài)分布。但只要是已知的理論分布,都可以通過該分布求得P值。理解檢驗統(tǒng)計量觀察到的量可以是一個樣本的均數(shù)、兩個樣本均數(shù)的理解P值P值是指在無效假設(shè)的前提下,得到觀察到的量(或更極端的量)的概率。P值越小說明無效假設(shè)越不可靠?;蛘哒f,P值越小我們就越有理由推翻無效假設(shè)。至于P值是否屬于“小”,一般的,我們是根據(jù)事先確定的檢驗水準(zhǔn)來判斷的。當(dāng)P<時,我們就可以下諸如“差別有顯著性”的論斷。P值的大小與觀察到的量的大小之間沒有必然的聯(lián)系。理解P值P值是指在無效假設(shè)的前提下,得到觀察到的量(或更極端當(dāng)P>時非小概率事件

在無效假設(shè)的前提下,得到觀察到的量(或更極端的量)的可能性還是相當(dāng)大的,我們尚不能拒絕無效假設(shè)或者說拒絕無效假設(shè)的證據(jù)不足。具體問題,專業(yè)判斷

P=0.70與P=0.07當(dāng)P>時非小概率事件

在無效假設(shè)的前提下,得到觀察到的量(“差別有顯著性”與“差別顯著”“差別有高度顯著性”與“差別極為顯著”二者之間不存在必然的聯(lián)系?!安顒e顯著”不一定導(dǎo)致“差別有顯著性”,“差別不顯著”倒是有很大可能導(dǎo)致“

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負(fù)責(zé)。
  • 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時也不承擔(dān)用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

評論

0/150

提交評論