定性資料的統(tǒng)計(jì)分析課件_第1頁
定性資料的統(tǒng)計(jì)分析課件_第2頁
定性資料的統(tǒng)計(jì)分析課件_第3頁
定性資料的統(tǒng)計(jì)分析課件_第4頁
定性資料的統(tǒng)計(jì)分析課件_第5頁
已閱讀5頁,還剩62頁未讀 繼續(xù)免費(fèi)閱讀

下載本文檔

版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進(jìn)行舉報(bào)或認(rèn)領(lǐng)

文檔簡介

醫(yī)學(xué)統(tǒng)計(jì)學(xué)

定性資料的統(tǒng)計(jì)分析

statisticalanalysisforqualitativedata9-定性資料的統(tǒng)計(jì)分析1主要內(nèi)容二項(xiàng)分布簡介總體率的可信區(qū)間估計(jì)Poisson分布簡介總體事件數(shù)的可信區(qū)間估計(jì)樣本率與總體率的比較兩樣本率比較的u檢驗(yàn)四格表資料的

2檢驗(yàn)行列表資料的

2檢驗(yàn)確切概率法兩事件數(shù)的比較卡方檢驗(yàn)應(yīng)用的注意事項(xiàng)

9-定性資料的統(tǒng)計(jì)分析1第一節(jié)二項(xiàng)分布簡介9-定性資料的統(tǒng)計(jì)分析1二項(xiàng)分布的基本概念

在醫(yī)學(xué)研究中常常碰到一些情況,其結(jié)局只有兩種互相對立的結(jié)果。每個(gè)個(gè)體的觀察結(jié)果只能取其中之一。毒理試驗(yàn)中,動物的生存與死亡;動物誘癌試驗(yàn)中,動物的發(fā)癌與不發(fā)癌;流行病學(xué)觀察中,個(gè)體發(fā)病與不發(fā)病;在臨床治療中,病人的治愈與未愈;理化檢驗(yàn)結(jié)果的陰性與陽性等等。常用二項(xiàng)分布(binomialdistribution)來描述其概率分布。9-定性資料的統(tǒng)計(jì)分析1概率的乘法法則:幾個(gè)獨(dú)立事件同時(shí)發(fā)生的概率,等于各獨(dú)立事件的概率之積。概率的加法法則:互不相容事件和的概率等于各事件的概率之和。9-定性資料的統(tǒng)計(jì)分析1例、設(shè)小白鼠接受某種毒物一定劑量時(shí),其死亡率為

=80%,則對于每只小白鼠而言,其死亡概率為

=0.8,生存概率為1-

=0.2。若每組各用三只小白鼠(分別計(jì)為甲、乙、丙),對每只鼠獨(dú)立做實(shí)驗(yàn),故各鼠的實(shí)驗(yàn)結(jié)果(生存或死亡)是互不影響的。觀察每組小白鼠存亡情況,如果計(jì)算生與死的順序,則共有8種排列方式;如果只計(jì)生存與死亡的數(shù)目,則只有4種組合方式。9-定性資料的統(tǒng)計(jì)分析1三只小白鼠存亡的排列和組合方式及其概率的計(jì)算

所有可能結(jié)果每種結(jié)果的概率死亡數(shù)生存數(shù)不同死亡數(shù)的概率甲、乙、丙Xn

X生生生0.2

0.2

0.2=0.008030.008生生死0.2

0.2

0.8=0.032生死生0.2

0.8

0.2=0.032120.096死生生0.8

0.2

0.2=0.032生死死0.2

0.8

0.8=0.128死生死0.8

0.2

0.8=0.128210.384死死生0.8

0.8

0.2=0.128死死死0.8

0.8

0.8=0.512300.5121.0001.0009-定性資料的統(tǒng)計(jì)分析1(0.2+0.8)3=(0.2)3+3×(0.2)2×(0.8)+3×(0.2)×(0.8)2+(0.8)3

三生二生一死一生二死三死9-定性資料的統(tǒng)計(jì)分析1

為總體陽性率;n為樣本例數(shù);X為樣本陽性數(shù);CnX為從n個(gè)中抽X個(gè)的組合數(shù),其計(jì)算公式為:式中“!”為階乘符號,n!=1

2

3

4

n,并約定0!=1。9-定性資料的統(tǒng)計(jì)分析1二項(xiàng)展開式中的各項(xiàng)即對應(yīng)于各死亡數(shù)(X)的發(fā)生概率P(X),類似的分布即稱作二項(xiàng)分布。從陽性率為π的總體中隨機(jī)抽取含量為n的樣本,恰有X例陽性的發(fā)生概率可表達(dá)為:X=0,1,2,…,n

稱X服從參數(shù)為n和

的二項(xiàng)分布,記為:X~B(n,

)。其中參數(shù)n由實(shí)驗(yàn)者確定,而總體率

常常是未知的。9-定性資料的統(tǒng)計(jì)分析1例、已知n=3,

=0.8,則恰有1例陽性的概率P(1)為:9-定性資料的統(tǒng)計(jì)分析1二項(xiàng)分布的均數(shù)與標(biāo)準(zhǔn)差

若X~B(n,

),則陽性數(shù)X的總體均數(shù)

及其標(biāo)準(zhǔn)差

為:9-定性資料的統(tǒng)計(jì)分析1若均數(shù)與標(biāo)準(zhǔn)差不用絕對數(shù)X而用率p表示時(shí),即對以上兩式分別除以n:

樣本率的標(biāo)準(zhǔn)差又稱為率的標(biāo)準(zhǔn)誤。9-定性資料的統(tǒng)計(jì)分析1二項(xiàng)分布的累計(jì)概率

常用的有左側(cè)累計(jì)和右側(cè)累計(jì)兩種方法。從陽性率為

的總體中隨機(jī)抽取n個(gè)個(gè)體,則:1、最多有k例陽性的概率:2、最少有k例陽性的概率:9-定性資料的統(tǒng)計(jì)分析1例1、據(jù)以往經(jīng)驗(yàn),用某藥治療小兒上呼吸道感染、支氣管炎,有效率為85%,今有5個(gè)患者用該藥治療,問:①至少3人有效的概率為多少?②最多1人有效的概率為多少?

本例

=0.85,1-

=0.15,n=5

,依題意,①至少3人有效的概率:

P(X≥3)=P(3)+P(4)+P(5)=0.138178125+0.391504688+0.443705313=0.973388126②最多1人有效的概率為:P(X≤1)9-定性資料的統(tǒng)計(jì)分析1例2、經(jīng)統(tǒng)計(jì),某省用“中藥闌尾炎合劑”治療急性闌尾炎性腹膜炎的有效率為86%,試分別估計(jì):①治療10例中至少9例有效的概率;②治療10例中至多7例有效的概率。本例

=0.86,1-

=0.14,n=10,依題意,①治療10例中至少9例有效的概率:②治療10例中至多7例有效的概率:9-定性資料的統(tǒng)計(jì)分析1二項(xiàng)分布的圖形

9-定性資料的統(tǒng)計(jì)分析1在實(shí)際應(yīng)用中,n足夠大,且

不太大也不太小,即既不接近于0也不接近于1時(shí),??捎谜龖B(tài)近似原理處理二項(xiàng)分布的問題。一般判斷標(biāo)準(zhǔn):n

和n(1-

)均大于5。9-定性資料的統(tǒng)計(jì)分析1二項(xiàng)分布的應(yīng)用條件二分類資料,即各觀察單位只能有互相對立的兩種結(jié)果之一。兩種對立結(jié)果發(fā)生的概率合計(jì)為1。觀察結(jié)果相互獨(dú)立,如疾病無傳染性、無家族聚集性。9-定性資料的統(tǒng)計(jì)分析1第二節(jié)率的可信區(qū)間估計(jì)

9-定性資料的統(tǒng)計(jì)分析1與定量資料的均數(shù)一樣,二項(xiàng)分布資料的樣本率同樣存在抽樣誤差。樣本率的標(biāo)準(zhǔn)差又稱為率的標(biāo)準(zhǔn)誤為:9-定性資料的統(tǒng)計(jì)分析1一、總體率

的可信區(qū)間估計(jì)

(一)正態(tài)近似法

當(dāng)n較大、且p不太大也不太小時(shí)(??赏ㄟ^np與n(1-p)均大于5來判斷),樣本率p的抽樣分布近似服從正態(tài)分布。可利用正態(tài)分布原理來估計(jì)總體率的可信區(qū)間??尚哦葹?-α的可信區(qū)間為:

(p-u

Sp

,p+u

Sp),縮寫為:p±u

Sp

式中,u

為可信度為1-α?xí)r的u界值??尚哦葹?5%時(shí),u

=1.96可信度為99%時(shí),u

=2.58。

9-定性資料的統(tǒng)計(jì)分析1例1、從某地人群中隨機(jī)抽取144人,檢查乙型肝炎表面抗原攜帶狀況,陽性率為9.03%,求該地人群的乙型肝炎表面抗原陽性率的95%可信區(qū)間。本例n=144,p=9.03%,可用近似正態(tài)法計(jì)算可信區(qū)間。95%可信限為:9.03%±1.96×2.388%,即該地人群的乙型肝炎表面抗原陽性率的95%可信區(qū)間為:4.35%~13.71%。9-定性資料的統(tǒng)計(jì)分析1例2、某醫(yī)院用復(fù)方當(dāng)歸注射液靜脈滴注治療腦動脈硬化癥188例,其中顯效83例,試估計(jì)復(fù)方當(dāng)歸注射液顯效率的99%可信區(qū)間。本例n=188,p=83/188=0.4415,np與n(1-p)均大于5,可用近似正態(tài)法計(jì)算可信區(qū)間。

99%可信區(qū)間為:0.4415±2.58×0.036,即復(fù)方當(dāng)歸注射液顯效率的99%可信區(qū)間為:34.86%~53.44%。

9-定性資料的統(tǒng)計(jì)分析1(二)查表法

當(dāng)n≤50,p很接近0或1時(shí),樣本率p的抽樣分布不再近似服從正態(tài)分布。樣本資料呈二項(xiàng)分布。由于用二項(xiàng)分布法估計(jì)總體率的可信區(qū)間,計(jì)算復(fù)雜,故可使用查表法。查閱附表6,求得總體率的95%和99%可信區(qū)間。9-定性資料的統(tǒng)計(jì)分析1例、有人調(diào)查29名非吸毒婦女,出獄時(shí)有1名HIV(人免疫缺陷病毒)陽性,該研究者報(bào)導(dǎo),陽性率為3.4%,用正態(tài)近似法計(jì)算其95%可信區(qū)間為:-3.1%~10.0%。陽性率不可能小于0。查表法,其95%可信區(qū)間為:0.1%~17.8%。

9-定性資料的統(tǒng)計(jì)分析1二、兩總體率之差的可信區(qū)間估計(jì)當(dāng)樣本含量n1、n2足夠大,兩樣本率之差的可信區(qū)間可用正態(tài)分布近似法構(gòu)造。設(shè)p1=r1/n1,p2=r2/n2是兩個(gè)樣本率,p1-p2是它們的差。如果n1p1,n1(1-p1),n2p2,n2(1-p2)均大于5,則可以用正態(tài)近似的方法求總體率之差

1-

2的可信區(qū)間:9-定性資料的統(tǒng)計(jì)分析1計(jì)算公式其中,為率之差值的標(biāo)準(zhǔn)誤9-定性資料的統(tǒng)計(jì)分析1第三節(jié)Poisson分布簡介9-定性資料的統(tǒng)計(jì)分析1Poisson分布的基本概念

對單位時(shí)間、單位空間內(nèi)某獨(dú)立罕見事件發(fā)生數(shù)的研究每升水中大腸菌群數(shù)的分布粉塵在單位容積內(nèi)計(jì)數(shù)的分布放射性物質(zhì)在單位時(shí)間內(nèi)放射出質(zhì)點(diǎn)數(shù)的分布單位空間中某些野生動物或昆蟲數(shù)的分布每天交通事故發(fā)生數(shù)的分布人群中某種患病率很低的非傳染性疾病患病數(shù)或死亡數(shù)的分布用Poisson分布來描述其概率分布。

9-定性資料的統(tǒng)計(jì)分析1如某事件的發(fā)生完全隨機(jī),在單位時(shí)間或單位空間內(nèi)事件發(fā)生數(shù)的概率為:稱該事件的發(fā)生服從參數(shù)為

的Poisson分布,記為X~Poisson(

)。

是Poisson分布的總體均數(shù),X為單位時(shí)間或單位空間內(nèi)某事件的發(fā)生數(shù),P(X)為事件數(shù)為X時(shí)發(fā)生概率,e為自然對數(shù)的底≈2.7183。

9-定性資料的統(tǒng)計(jì)分析1Poisson分布實(shí)例2002年韓日世界杯64場比賽中,各隊(duì)進(jìn)球數(shù)有多有少。大部分是0,1,2個(gè)進(jìn)球,個(gè)別隊(duì)是5個(gè)以上進(jìn)球,最多的是8個(gè)進(jìn)球,平均是1.2578個(gè)/場/隊(duì)。雖然強(qiáng)隊(duì)往往都能進(jìn)球、贏球(如巴西隊(duì)),弱隊(duì)往往都不能進(jìn)球(如中國隊(duì)),但宏觀上來說,各隊(duì)進(jìn)球數(shù)服從Poisson分布!9-定性資料的統(tǒng)計(jì)分析1平均計(jì)數(shù)為1.2578的Poisson分布每場各隊(duì)進(jìn)球數(shù)場次 理論數(shù)

0 37 36.39 1 47 45.77 2 27 28.78 3 13 12.07 4 2 3.79 5 1 0.95 ≥6 1 0.25

128 128.009-定性資料的統(tǒng)計(jì)分析1Poisson分布的均數(shù)與方差Poisson分布的總體方差

2與總體均數(shù)

相等,等于

2=

=

參數(shù)

表示單位空間或單位時(shí)間內(nèi)事件平均發(fā)生的次數(shù),又稱強(qiáng)度參數(shù)。9-定性資料的統(tǒng)計(jì)分析1Poisson分布的累計(jì)概率常用的有左側(cè)累計(jì)和右側(cè)累計(jì)兩種方法。單位空間或時(shí)間內(nèi)事件發(fā)生的次數(shù)

:1、最多為k次的概率:2、最少為k次的概率:9-定性資料的統(tǒng)計(jì)分析1Poisson分布的圖形

9-定性資料的統(tǒng)計(jì)分析1Poisson分布為正偏態(tài)分布

越小,分布越偏隨著

的增大,分布逐漸趨于對稱當(dāng)

=20時(shí)已基本接近對稱分布當(dāng)

=50時(shí),Poisson分布近似正態(tài)分布在實(shí)際工作中,當(dāng)

≥50時(shí)可按正態(tài)分布原理處理相關(guān)的問題。

9-定性資料的統(tǒng)計(jì)分析1Poisson分布具有可加性

以較小的度量單位觀察某現(xiàn)象,如果發(fā)生數(shù)呈Poisson分布,那么將若干個(gè)小單位合并為一個(gè)大單位后,其總計(jì)數(shù)也呈Poisson分布。例、已知某放射性物質(zhì)每10分鐘放射脈沖數(shù)呈Poisson分布,5次測量的結(jié)果,分別為35、34、36、38、34次。將5個(gè)10分鐘的放射脈沖數(shù)合計(jì)為50分鐘放射脈沖數(shù)(總計(jì)為177次)也呈Poisson分布。對于Poisson分布資料往往可以利用其可加性的特性使

≥50,然后用正態(tài)近似法處理。9-定性資料的統(tǒng)計(jì)分析1Poisson分布是二項(xiàng)分布的極限形式

在二項(xiàng)分布中,當(dāng)

很小時(shí)(

<0.05),而n很大,此時(shí)二項(xiàng)分布則逼近Poisson分布。其中

=n

。n愈大,近似程度愈好。9-定性資料的統(tǒng)計(jì)分析1例、新生兒染色體異常率為1%,分別用二項(xiàng)分布和Poisson分布原理,求100名新生兒中發(fā)生X例(X=0,l,2…)染色體異常的概率。

9-定性資料的統(tǒng)計(jì)分析1Poisson分布的應(yīng)用條件結(jié)果二分類事件發(fā)生相互獨(dú)立事件發(fā)生概率不變9-定性資料的統(tǒng)計(jì)分析1第四節(jié)總體事件數(shù)的可信區(qū)間估計(jì)9-定性資料的統(tǒng)計(jì)分析1

為總體計(jì)數(shù),X(單位時(shí)間或單位空間內(nèi)某事件的發(fā)生數(shù))稱為樣本計(jì)數(shù)。由于抽樣誤差的客觀存在,樣本計(jì)數(shù)X一般與總體計(jì)數(shù)

不相等。總體計(jì)數(shù)往往是未知的,可利用抽樣誤差的規(guī)律,通過樣本計(jì)數(shù)來估計(jì)總體計(jì)數(shù)。9-定性資料的統(tǒng)計(jì)分析1一、正態(tài)近似法當(dāng)樣本計(jì)數(shù)X>50時(shí),可按正態(tài)近似原理求總體計(jì)數(shù)

的可信區(qū)間。為樣本事件數(shù)的標(biāo)準(zhǔn)誤即標(biāo)準(zhǔn)差。9-定性資料的統(tǒng)計(jì)分析1若有多個(gè)樣本計(jì)數(shù)X1,X2,…,Xn時(shí)A、先將多個(gè)計(jì)數(shù)求和,計(jì)算合計(jì)X的95%的可信區(qū)間,再除以n得到平均每個(gè)單位內(nèi)的計(jì)數(shù)及其95%可信區(qū)間。B、先求樣本計(jì)數(shù)X1,X2,…,Xn的平均計(jì)數(shù),再用以下計(jì)算公式求其95%可信區(qū)間:

9-定性資料的統(tǒng)計(jì)分析1例、用計(jì)數(shù)器兩次測得某放射性物質(zhì)5分鐘內(nèi)發(fā)出的脈沖數(shù)分別為42和48個(gè)。假設(shè)單位時(shí)間內(nèi)脈沖數(shù)的發(fā)放符合Poisson分布,試估計(jì)該放射性物質(zhì)每5分鐘平均脈沖數(shù)的95%可信區(qū)間。將5分鐘視為單位時(shí)間,利用Poisson分布可加性,先計(jì)算10分鐘內(nèi)平均脈沖數(shù)的95%可信區(qū)間。X=42+48=90則平均每5分鐘,該放射性物質(zhì)平均發(fā)出脈沖數(shù)為45.0個(gè)/5分鐘,其95%CI為:35.7~54.3個(gè)/5分鐘。

9-定性資料的統(tǒng)計(jì)分析1二、查表法當(dāng)樣本計(jì)數(shù)X≤50,且樣本資料呈Poisson分布時(shí),正態(tài)近似法不再適用,應(yīng)根據(jù)Poisson分布的原理確定

的可信區(qū)間。查詢附表7“Poisson分布

的可信區(qū)間”得到總體事件數(shù)

的95%或99%可信區(qū)間。9-定性資料的統(tǒng)計(jì)分析1例、從一份混合均勻的自來水中取1L水樣,檢出3個(gè)大腸菌群。試估計(jì)自來水中平均每升水中大腸桿菌數(shù)的95%可信區(qū)間。查詢附表7,可得平均每升水中大腸桿菌數(shù)的95%可信區(qū)間為0.62~8.77個(gè)。9-定性資料的統(tǒng)計(jì)分析1第五節(jié)樣本率與總體率的比較9-定性資料的統(tǒng)計(jì)分析1樣本率與總體率比較的目的是推斷該樣本是否來自某已知總體。由于抽樣誤差的存在,從總體率為

0的總體中所得樣本,樣本率p一般不會正好等于總體率。樣本率與總體率的差異究竟是本質(zhì)上的差別還是抽樣誤差,需用假設(shè)檢驗(yàn)進(jìn)行推斷。

9-定性資料的統(tǒng)計(jì)分析1當(dāng)n較大且p不太小也不太大時(shí),二項(xiàng)分布的累計(jì)概率與正態(tài)分布的累計(jì)概率相近,故可用正態(tài)近似方法。習(xí)慣上以np>5同時(shí)n(1-p)>5為界限,符合此條件者可用正態(tài)近似檢驗(yàn)。統(tǒng)計(jì)量u的計(jì)算為:當(dāng)n和p不符合上述條件時(shí),可利用二項(xiàng)分布原理直接計(jì)算其概率,根據(jù)是否小概率事件來推斷;或計(jì)算率的可信區(qū)間,是否包含已知總體率來推斷。9-定性資料的統(tǒng)計(jì)分析1一、正態(tài)近似法當(dāng)np>5同時(shí)n(1-p)>5時(shí),可用正態(tài)近似檢驗(yàn)。例、據(jù)臨床經(jīng)驗(yàn),一般的胃潰瘍病患者有20%會出現(xiàn)胃出血癥狀。某醫(yī)院觀察了304例65歲的胃潰瘍病患者,其中有96例發(fā)生胃出血,占31.58%,問老年患者是否較一般患者易出血?

9-定性資料的統(tǒng)計(jì)分析19-定性資料的統(tǒng)計(jì)分析1例2、從某地人群中隨機(jī)抽取144人,檢查乙型肝炎表面抗原攜帶狀況,陽性率為9.20%,而正常人群的乙型肝炎表面抗原陽性率為1.20%,能否認(rèn)為該地人群為高危人群?9-定性資料的統(tǒng)計(jì)分析19-定性資料的統(tǒng)計(jì)分析1二、直接計(jì)算概率法當(dāng)n和p不符合上述條件時(shí),可利用二項(xiàng)分布原理直接計(jì)算其概率。依據(jù)小概率事件原理,作出統(tǒng)計(jì)推斷。例、一種鴨通常感染某種傳染病的概率為0.2,現(xiàn)將某種藥物注射到25只鴨后發(fā)現(xiàn)有1只鴨發(fā)生感染,試判斷這種藥物對預(yù)防感染是否有效。9-定性資料的統(tǒng)計(jì)分析19-定性資料的統(tǒng)計(jì)分析1例、18世紀(jì)天花在人群中的自然感染率高達(dá)90%。1798年英國醫(yī)生琴納對23名志愿者作接種牛痘免疫實(shí)驗(yàn),發(fā)

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負(fù)責(zé)。
  • 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

評論

0/150

提交評論