分類資料統(tǒng)計(jì)推斷_第1頁
分類資料統(tǒng)計(jì)推斷_第2頁
分類資料統(tǒng)計(jì)推斷_第3頁
分類資料統(tǒng)計(jì)推斷_第4頁
分類資料統(tǒng)計(jì)推斷_第5頁
已閱讀5頁,還剩35頁未讀, 繼續(xù)免費(fèi)閱讀

下載本文檔

版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進(jìn)行舉報(bào)或認(rèn)領(lǐng)

文檔簡介

1、關(guān)于分類資料統(tǒng)計(jì)推斷第1頁,共40頁,2022年,5月20日,11點(diǎn)26分,星期四一、率的抽樣誤差與標(biāo)準(zhǔn)誤 抽樣研究所得的率同樣存在抽樣誤差,描述其大小的指標(biāo)是率的標(biāo)準(zhǔn)誤(standard error of proportion),其計(jì)算公式如下: 第2頁,共40頁,2022年,5月20日,11點(diǎn)26分,星期四二、總體率的估計(jì)和率的u檢驗(yàn) 1、總體率的估計(jì): 總體率的估計(jì)有兩種方法,一是正態(tài)分布法,二是查表法。正態(tài)分布法 適用于樣本較大,且p和/或1-p都不太小,如np和n(1-p)都大于5時(shí)。計(jì)算公式為:查表法 適用于小樣本。利用樣本含量n和陽性數(shù)x查“百分率的可信區(qū)間”表獲得。第3頁,共4

2、0頁,2022年,5月20日,11點(diǎn)26分,星期四例1 檢查居民800人糞便中蛔蟲陽性200人,陽性率為25 %,試求當(dāng)?shù)鼐用窦S便蛔蟲陽性率的95 % 可信區(qū)間和99 % 可信區(qū)間。 公式: 其中, 即: 陽性率的95 % 可信區(qū)間為: ( 0.22 , 0.28 ) 或 ( 22 % , 28 % ) 同理可得陽性率的99 % 可信區(qū)間。 第4頁,共40頁,2022年,5月20日,11點(diǎn)26分,星期四2、 率的u檢驗(yàn) (1)樣本率與總體率比較 樣本率與總體率(一般為理論值、標(biāo)準(zhǔn)值或經(jīng)大量觀察所得的穩(wěn)定值等)比較的目的,是推斷樣本所代表的未知總體率與已知總體率0是否相等。 可選方法有直接計(jì)算概

3、率法(用于偏離 0.5 較遠(yuǎn),且陽性數(shù) X 較小作單側(cè)檢驗(yàn)時(shí))和正態(tài)近似法。這里著重介紹正態(tài)近似法。 當(dāng)或 1不太小,而n 足夠大時(shí),如n和n(1)大于 5 時(shí),即可按正態(tài)近似法做假設(shè)檢驗(yàn)。檢驗(yàn)統(tǒng)計(jì)量為 u 值,計(jì)算公式如下:式中 n 為樣本例數(shù),X 為樣本陽性數(shù),樣本率 p = X/n ;0 為總體率;0.5 為連續(xù)性校正數(shù),當(dāng) n 較大時(shí)可以省去,而X n 0.5 時(shí)不宜采用校正數(shù)。 第5頁,共40頁,2022年,5月20日,11點(diǎn)26分,星期四 例2 以往經(jīng)驗(yàn)?zāi)X梗塞患者治療三周的生活能力改善率為30 % ,某醫(yī)院用新療法治療38例的三周生活能力改善率為50 % ,能否認(rèn)為新療法的改善率與

4、以往不同? 此為樣本率與總體率比較:且n p和 n(1-p) 都大于5,故用u檢驗(yàn)。 設(shè) = 0.05 計(jì)算統(tǒng)計(jì)量u值: 本例X n0.5 ,因此不宜用校正系數(shù),故 = 2.69 確定P值,作結(jié)論: 查t界值表中,= 時(shí),u 0.01 = 2.5758 , u 0.005 = 2.8070 , 因而 0.01 P 0.005 , 則 P, 拒絕H0, 接受H1, 可以認(rèn)為新療法的改善率與以往不同,新療法的改善率高于以往。 第6頁,共40頁,2022年,5月20日,11點(diǎn)26分,星期四 (2)兩個(gè)樣本率比較 式中P0為合并陽性率,P0 =(X1 + X2)/(n 1 + n 2 ) 檢 驗(yàn) 統(tǒng)

5、計(jì) 量 計(jì) 算 公 式 如 下 : 第7頁,共40頁,2022年,5月20日,11點(diǎn)26分,星期四 例3 某中藥研究所試用某種草藥預(yù)防流感,觀察用藥組和對照組(未用藥組)的流感發(fā)病率,結(jié)果如下表,問兩組的流感發(fā)病率是否不同? 表1 用藥組和對照組的流感發(fā)病率 此為兩大樣本率的比較,可用u檢驗(yàn)。 第8頁,共40頁,2022年,5月20日,11點(diǎn)26分,星期四 假設(shè)檢驗(yàn)過程: 設(shè) = 0.05 計(jì)算統(tǒng)計(jì)量u值: = 2.031 確定P值,作結(jié)論: 查t界值表中,= 時(shí),u 0.05 = 1.96 , u 0.01 = 2.5758 , 因而 0.05 P0.01 , 則P, 拒絕H0, 接受H1,

6、 可以認(rèn)為兩組發(fā)病率不同,用藥組發(fā)病率低于對照組,說明該草藥有預(yù)防流感的作用 第9頁,共40頁,2022年,5月20日,11點(diǎn)26分,星期四三、2 檢驗(yàn)2檢驗(yàn)(Chi-square test)用途極廣,這里僅介紹它在分類變量資料中用于推斷兩個(gè)或兩個(gè)以上總體率(或構(gòu)成比)之間有無差別或有無關(guān)聯(lián)的分析方法。 第10頁,共40頁,2022年,5月20日,11點(diǎn)26分,星期四1、2檢驗(yàn)的基本思想 例4:某醫(yī)生用國產(chǎn)呋喃硝胺治療十二指腸球部潰瘍,以甲氰咪胍作對照組,結(jié)果如表5,問兩種方法治療效果有無差別? 表2. 兩種藥物治療十二指腸球部潰瘍的效果 Chi-square test第11頁,共40頁,20

7、22年,5月20日,11點(diǎn)26分,星期四 設(shè) = 0.05 計(jì)算統(tǒng)計(jì)量2值: 2值的基本公式為: 式中A為實(shí)際頻數(shù),即所獲資料中的基本數(shù)據(jù);T為理論頻數(shù),是根據(jù)檢驗(yàn)假設(shè)H0推算得到的, ,其中,n R為同行合計(jì),n C為同列合計(jì),n為總例數(shù)。 2檢驗(yàn)的基本思想體現(xiàn)在2值的基本公式中,即當(dāng)H0成立時(shí),實(shí)際頻數(shù) A就與理論頻數(shù) T很接近,此時(shí)2值不會太大;反之,如若A與T相差較大,就會計(jì)算得到一個(gè)較大的2值,當(dāng)其超出一定范圍時(shí),就有理由認(rèn)為H0不成立。因此,實(shí)際上2值反映了實(shí)際頻數(shù)與理論頻數(shù)的吻合程度。 Pearson卡方值第12頁,共40頁,2022年,5月20日,11點(diǎn)26分,星期四2、四格表

8、資料的2檢驗(yàn) 四格表資料即基本數(shù)據(jù)只有四個(gè),為兩行兩列,如兩個(gè)率的比較。 檢驗(yàn)統(tǒng)計(jì)量專用計(jì)算公式為: ,=(R-1)(C-1) 式中a , b , c , d 分別代表四個(gè)實(shí)際頻數(shù),n 為總例數(shù);為自由度,R為行數(shù),C為列數(shù)。 fourfold table第13頁,共40頁,2022年,5月20日,11點(diǎn)26分,星期四 (1)四個(gè)表資料2檢驗(yàn)實(shí)例 : 例4:某醫(yī)生用國產(chǎn)呋喃硝胺治療十二指腸球部潰瘍,以甲氰咪胍作對照組,結(jié)果如表5,問兩種方法治療效果有無差別?表2. 兩種藥物治療十二指腸球部潰瘍的效果 第14頁,共40頁,2022年,5月20日,11點(diǎn)26分,星期四假設(shè)檢驗(yàn)過程: 設(shè) = 0.0

9、5 計(jì)算統(tǒng)計(jì)量2值: 確定P值,作結(jié)論: 查2界值表中,= 1 時(shí), 20.05,1 = 3.84 , 20.01,1 = 6.63 , 因而 0.05 P 0.01 , 即 P, 因而拒絕 H0 , 接受 H1 , 可以認(rèn)為兩組潰瘍愈合率差別顯著,呋喃硝胺的愈合率高于甲氰咪胍。第15頁,共40頁,2022年,5月20日,11點(diǎn)26分,星期四(2)四格表資料2檢驗(yàn)應(yīng)用注意: 當(dāng)n40,且任意T5時(shí),可 四格表專用公式。 當(dāng)n40,且任意1T5時(shí),應(yīng) ,其計(jì)算公式為: 例5. 某醫(yī)生欲比較胞磷膽堿與腦益嗪治療腦動脈硬化的療效,觀察結(jié)果如表3,問兩種藥物的療效有無差別? 表3. 兩種藥物治療腦動脈

10、硬化的療效 表3顯示有一個(gè)理論頻數(shù)T 5,因此應(yīng)用校正2檢驗(yàn)。 當(dāng)n40或任意T1時(shí),應(yīng)改用確切概率法。 直接使用計(jì)算校正2值第16頁,共40頁,2022年,5月20日,11點(diǎn)26分,星期四(3)四格表資料2檢驗(yàn)與 u 檢驗(yàn)的關(guān)系 例6 以例3資料作2檢驗(yàn),整理如表4:表4 用藥組和對照組的流感發(fā)病率的比較 即兩大樣本率比較的2檢驗(yàn)與 u 檢驗(yàn)是等價(jià)的。 = 4.125 = u 2 (2.031)2第17頁,共40頁,2022年,5月20日,11點(diǎn)26分,星期四例7 某市對醫(yī)院空氣消毒監(jiān)測,市級醫(yī)院65個(gè)抽樣點(diǎn)中52個(gè)合格,合格率80 .00% ,鄉(xiāng)鎮(zhèn)醫(yī)院53個(gè)抽樣點(diǎn)中22個(gè)合格,合格率41.

11、51 % 。問城鄉(xiāng)醫(yī)院空氣消毒合格率是否不同?表5 城鄉(xiāng)醫(yī)院空氣消毒合格率的比較 采用2檢驗(yàn) = 18.50 第18頁,共40頁,2022年,5月20日,11點(diǎn)26分,星期四 例8 某醫(yī)生用兩種療法治療某病,結(jié)果如表6 ,問可否認(rèn)為新療法優(yōu)于傳統(tǒng)療法?表6 兩種療法治療某病治愈率比較 = 7.47 第19頁,共40頁,2022年,5月20日,11點(diǎn)26分,星期四3、行列表(RC表)資料的2檢驗(yàn) 行列表資料即基本數(shù)據(jù)在四個(gè)以上,如多個(gè)率的比較,其基本數(shù)據(jù)為R行2列;兩組構(gòu)成比的比較,其基本數(shù)據(jù)為2行C列;多組構(gòu)成比的比較,其基本數(shù)據(jù)為R行C列。 檢驗(yàn)統(tǒng)計(jì)量計(jì)算公式為: ,=(R-1)(C-1)

12、其應(yīng)用條件是 T 5 的格子數(shù)不超過 1/5 和沒有任意格的 T1 。如果出現(xiàn)上述情況應(yīng)作如下處理: 根本辦法是增加觀察例數(shù),使各格基本數(shù)據(jù)增大;將T較小的行或列與性質(zhì)相近的行或列作合理的合并。 ROWCOLUMN第20頁,共40頁,2022年,5月20日,11點(diǎn)26分,星期四 例9 某地在流行性腦脊髓膜炎流行期間進(jìn)行了帶菌調(diào)查,結(jié)果如表7,問不同人群帶菌率是否不同? 表7 某地流行性腦脊髓膜炎流行期不同人群帶菌率 采用RC表資料2檢驗(yàn)。 第21頁,共40頁,2022年,5月20日,11點(diǎn)26分,星期四 設(shè) H0:四個(gè)人群帶菌率相同,即 H1:四個(gè)人群帶菌率不同或不全相同 = 0.05 計(jì)算統(tǒng)

13、計(jì)量2值 = 18.17 確定P值,作結(jié)論: 查2界值表, 按=(R-1)(C-1)求得= 3, ,因而P 0.005 。按=0.05水準(zhǔn),拒絕H0 ,可以認(rèn)為不同人群帶菌率不同或不全相同。 第22頁,共40頁,2022年,5月20日,11點(diǎn)26分,星期四 例10 兩個(gè)醫(yī)院合作進(jìn)行腦梗塞療效試驗(yàn)中,各醫(yī)院受試病例的腦梗塞部位如表8所示,問兩所醫(yī)院病例的梗塞部位的分布(構(gòu)成比)是否不同? 表8 甲乙兩醫(yī)院病例的腦梗塞部位的分布 采用RC表資料2檢驗(yàn)。 第23頁,共40頁,2022年,5月20日,11點(diǎn)26分,星期四 設(shè) H0:兩所醫(yī)院病例的梗塞部位的總體分布(構(gòu)成比)相同 H1:兩所醫(yī)院病例的梗

14、塞部位的總體分布(構(gòu)成比)不同 = 0.05計(jì)算統(tǒng)計(jì)量2值 =14.29確定P值,作結(jié)論: 查2界值表, 按=(R-1)(C-1)求得= 2, ,因而P 40 時(shí)可以略去。 對同一個(gè)(或同一對)觀察對象研究兩種分類方法(或兩種處理)結(jié)果間是否有關(guān)聯(lián)時(shí),檢驗(yàn)統(tǒng)計(jì)量公式為:需注意,此時(shí)公式應(yīng)用條件同前。上述兩種情況分析目的不同,其檢驗(yàn)假設(shè)亦不同。 How第27頁,共40頁,2022年,5月20日,11點(diǎn)26分,星期四 例12為了研究兩種培養(yǎng)基分離空腸彎曲桿菌的效果,將每份糞便標(biāo)本分別接種于甲乙兩種培養(yǎng)基共做50份培養(yǎng)結(jié)果如表10。 表10 兩種培養(yǎng)基培養(yǎng)50份標(biāo)本培養(yǎng)結(jié)果 表11 兩種培養(yǎng)基培養(yǎng)5

15、0份標(biāo)本培養(yǎng)結(jié)果 此為同一標(biāo)本用兩種方法培養(yǎng)的配對設(shè)計(jì),應(yīng)列為22雙向交叉分類表(即22列聯(lián)表),如表11 。表中每一格表示同一份標(biāo)本兩種培養(yǎng)基結(jié)果不同組合的實(shí)際對子數(shù)。 應(yīng)注意,若將表10數(shù)據(jù)歸納為下表的形式,是不能明確反映出同一標(biāo)本兩種培養(yǎng)結(jié)果的異同,而只是單獨(dú)列出了每種培養(yǎng)基的培養(yǎng)結(jié)果,這就將配對設(shè)計(jì)歸納成了每組50份標(biāo)本的兩個(gè)獨(dú)立的樣本了,這是不恰當(dāng)?shù)?。第28頁,共40頁,2022年,5月20日,11點(diǎn)26分,星期四兩種方法檢出結(jié)果差別的檢驗(yàn)設(shè) 或 b = c 或 bc = 0.05計(jì)算統(tǒng)計(jì)量:確定P值,作結(jié)論: 經(jīng)查2界值表中,= 1 時(shí), 20.05,1 = 3.84 , 因而

16、P 0.05 , 即 P, 因而不能拒絕 H0 , 還不能認(rèn)為兩種培養(yǎng)基的檢出率不同。第29頁,共40頁,2022年,5月20日,11點(diǎn)26分,星期四兩種方法檢出結(jié)果關(guān)聯(lián)性檢驗(yàn)設(shè) H0:兩種培養(yǎng)基的培養(yǎng)結(jié)果無關(guān)聯(lián) H1:兩種培養(yǎng)基的培養(yǎng)結(jié)果有關(guān)聯(lián) = 0.05計(jì)算統(tǒng)計(jì)量:確定P值,作結(jié)論: 經(jīng)查2界值表中,= 1 時(shí), 20.005,1 = 7.88 , 因而 P0.005 , 即 P, 因而拒絕 H0 , 可以認(rèn)為兩種培養(yǎng)基的檢出率有關(guān)聯(lián)。從表內(nèi)數(shù)據(jù)看檢出結(jié)果一致率為(20+21)/50 = 82% 。第30頁,共40頁,2022年,5月20日,11點(diǎn)26分,星期四例13 某研究室用甲乙兩種

17、血清學(xué)方法檢查410例確診的鼻咽癌患者,得結(jié)果如表12,問兩種檢驗(yàn)結(jié)果間有無聯(lián)系?有無差別? 表12 兩種血清學(xué)方法檢驗(yàn)結(jié)果 相關(guān)性分析:2 = 38.85, = 1,查 2界值表得P0.005,可以認(rèn)為兩種血清學(xué)方法檢驗(yàn)結(jié)果間有聯(lián)系。 差別性檢驗(yàn): 2 = 86.44, = 1,查 2界值表得P0.005,可以認(rèn)為兩種血清學(xué)方法檢出率不同,甲法陽性檢出率較高。第31頁,共40頁,2022年,5月20日,11點(diǎn)26分,星期四 例14 為了解巨細(xì)胞病毒感染情況,某醫(yī)師分別采集了302對母親與嬰兒血清,并測定其IgM抗體,結(jié)果如表13。問母嬰間血清IgM抗體檢出是否相關(guān)?母嬰間血清IgM抗體檢出率

18、有無差別? 表13 302對母嬰血清IgM抗體檢測結(jié)果 本例,Tmin=1.025,故而在分析“是否相關(guān)”時(shí)采用四格表資料校正2檢驗(yàn)得:2=142.318,=1,則P0.10,尚不能認(rèn)為母嬰間血清IgM抗體檢出率有差別。 第32頁,共40頁,2022年,5月20日,11點(diǎn)26分,星期四(2)RC列聯(lián)表資料的2檢驗(yàn) 同一觀察對象(或同一組觀察人群)分別按兩種分類變量的不同水平分組,若所分水平多于2個(gè)時(shí),就可將觀察結(jié)果歸納成 RC列聯(lián)表,如例15中表14。其形式與前述RC表資料類似,但其研究設(shè)計(jì)和分析目的是不同的。 RC列聯(lián)表資料的2檢驗(yàn)的分析目的是檢驗(yàn)兩個(gè)分類變量間有無關(guān)聯(lián),其檢驗(yàn)統(tǒng)計(jì)量的計(jì)算仍

19、用行列表專用公式,即:第33頁,共40頁,2022年,5月20日,11點(diǎn)26分,星期四 例15 某醫(yī)師為研究肥胖程度與發(fā)胖年齡間的關(guān)系,觀察了438名肥胖兒童青少年,結(jié)果如下表: 表14 438名肥胖兒童青少年肥胖程度和發(fā)胖年齡 其檢驗(yàn)假設(shè)為:Ho:肥胖程度與發(fā)胖年齡無關(guān)聯(lián) H 1:肥胖程度與發(fā)胖年齡有關(guān)聯(lián)本例, 2 = 40.95, =(4-1)(3-1)= 6,查 2界值表得2 0.005,6 = 18.55 , 則P0.005,可以認(rèn)為肥胖程度與發(fā)胖年齡間有關(guān)聯(lián)性。第34頁,共40頁,2022年,5月20日,11點(diǎn)26分,星期四例16 觀察依沙酰胺治療皮膚真菌感染效果的臨床試驗(yàn),結(jié)果如表

20、15。試分析該病的療效是否與病程有關(guān)? 表15 依沙酰胺治療皮膚真菌感染療效 當(dāng)獲得兩個(gè)變量間有關(guān)聯(lián)時(shí),若需進(jìn)一步說明相關(guān)的密切程度,可計(jì)算列聯(lián)系數(shù),其計(jì)算公式為:P值在0-1之間,P越接近于1,關(guān)聯(lián)性越強(qiáng),即關(guān)系越密切;P越接近于0,則關(guān)聯(lián)性越弱。本例 2 = 24.64 ,P0.005,Pearson列聯(lián)系數(shù)=0.232。病 程痊愈好轉(zhuǎn)無效合 計(jì)5年 29 2610 65合 計(jì)24014649435第35頁,共40頁,2022年,5月20日,11點(diǎn)26分,星期四例17 某礦職工醫(yī)院探討矽肺不同期次患者的胸片肺門密度變化,把492名患者的資料歸納如表16。問矽肺患者肺門密度的增加與矽肺的期次有無關(guān)系?表16 不同期次矽肺患者肺門密度級別分布 本例, 2 = 163.01, =(3-1)(3-1)= 4,查 2界值表得P0.005,可以認(rèn)為矽肺患者肺門密度的增加與矽肺的期次有關(guān)聯(lián)性。 為進(jìn)一步說明相關(guān)的密切程度,計(jì)算列聯(lián)系數(shù) P,結(jié)果為P = 0.499。表明二者有中度相關(guān)關(guān)系。但需注意,有相關(guān)關(guān)系

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負(fù)責(zé)。
  • 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

評論

0/150

提交評論