卡方檢驗方法_第1頁
卡方檢驗方法_第2頁
卡方檢驗方法_第3頁
卡方檢驗方法_第4頁
卡方檢驗方法_第5頁
已閱讀5頁,還剩56頁未讀 繼續(xù)免費閱讀

下載本文檔

版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進(jìn)行舉報或認(rèn)領(lǐng)

文檔簡介

卡方檢驗方法1第1頁,共61頁,2023年,2月20日,星期一掌握內(nèi)容:幾種常見設(shè)計類型資料的卡方檢驗熟悉的內(nèi)容卡方檢驗的適用范圍了解內(nèi)容1.四格表資料的Fisher精確概率法2第2頁,共61頁,2023年,2月20日,星期一用樣本信息推論總體特征的過程。包括:參數(shù)估計:

運用統(tǒng)計學(xué)原理,用從樣本計算出來的統(tǒng)計指標(biāo)量,對總體統(tǒng)計指標(biāo)量進(jìn)行估計。假設(shè)檢驗:又稱顯著性檢驗,是指由樣本間存在的差別對樣本所代表的總體間是否存在著差別做出判斷。3第3頁,共61頁,2023年,2月20日,星期一

統(tǒng)計描述統(tǒng)計推斷應(yīng)用計量資料頻數(shù)分布集中趨勢離散趨勢統(tǒng)計圖表抽樣誤差、標(biāo)準(zhǔn)誤

tuF檢驗正常值范圍區(qū)間估計計數(shù)資料相對數(shù)及其標(biāo)準(zhǔn)化統(tǒng)計圖表標(biāo)準(zhǔn)誤2檢驗率的區(qū)間估計人口統(tǒng)計疾病統(tǒng)計相關(guān)與回歸rb統(tǒng)計圖表t檢驗

4第4頁,共61頁,2023年,2月20日,星期一在總體率為π的二項分布總體中做n1和n2抽樣,樣本率p1和p2與π的差別,稱為率抽樣誤差。已知π0nP>5,n(1-P)>55第5頁,共61頁,2023年,2月20日,星期一例為了解鉛中毒病人是否有尿棕色素增加現(xiàn)象,分別對病人組和對照組的尿液作尿棕色素定性檢查,結(jié)果見下表,問鉛中毒病人與對照人群的尿棕色素陽性率差別有無統(tǒng)計學(xué)意義?表兩組人群尿棕色素陽性率比較組別陽性數(shù)陰性數(shù)合計陽性率(%)鉛中毒病人2973680.56對照組9283724.32合計38357352.056第6頁,共61頁,2023年,2月20日,星期一

2檢驗(Chi-squaretest)是現(xiàn)代統(tǒng)計學(xué)的創(chuàng)始人之一,英國人K.Pearson(1857-1936)于1900年提出的一種具有廣泛用途的統(tǒng)計方法。7第7頁,共61頁,2023年,2月20日,星期一2檢驗的用途用途較為廣泛的假設(shè)檢驗方法,本章僅介紹用于分類計數(shù)資料的假設(shè)檢驗,用于檢驗兩個(或多個)率或構(gòu)成比之間差別是否有統(tǒng)計學(xué)意義,配對2檢驗檢驗配對計數(shù)資料的差異是否有統(tǒng)計學(xué)意義。8第8頁,共61頁,2023年,2月20日,星期一2檢驗的基本思想檢驗實際頻數(shù)(A)和理論頻數(shù)(T)的差別是否由抽樣誤差所引起的。也就是由樣本率(或樣本構(gòu)成比)來推斷總體率或構(gòu)成比。9第9頁,共61頁,2023年,2月20日,星期一表7-1兩種藥物治療胃潰瘍有效率的比較目的:推斷是否π1=π2?10第10頁,共61頁,2023年,2月20日,星期一本例資料經(jīng)整理成下表形式,即有兩個處理組,每個處理組的例數(shù)由發(fā)生數(shù)和未發(fā)生數(shù)兩部分組成。表內(nèi)有四個基本數(shù)據(jù),其余數(shù)據(jù)均由此四個數(shù)據(jù)推算出來的,故稱四格表資料。11第11頁,共61頁,2023年,2月20日,星期一表7-1完全隨機設(shè)計兩樣本率比較的四格表處理組屬性合計陽性陰性1A11(T11)A12(T12)n1(固定值)2A21(T21)A22(T22)n2(固定值)合計m1m2n12第12頁,共61頁,2023年,2月20日,星期一衡量理論頻數(shù)與實際頻數(shù)的差別ARC是位于R行C列交叉處的實際頻數(shù),TRC是位于R行C列交叉處的理論頻數(shù)。(ARC-TRC)反映實際頻數(shù)與理論頻數(shù)的差距,除以TRC為的是考慮相對差距。所以,2值反映了實際頻數(shù)與理論頻數(shù)的吻合程度,2值大,說明實際頻數(shù)與理論頻數(shù)的差距大。2值的大小除了與實際頻數(shù)和理論頻數(shù)的差的大小有關(guān)外,還與它們的行、列數(shù)有關(guān)。即自由度的大小。ν=(行-1)×(列-1)13第13頁,共61頁,2023年,2月20日,星期一理論頻數(shù)的計算nR是ARC所在行的合計,nC是ARC所在列的合計,是兩個樣本例數(shù)的合計14第14頁,共61頁,2023年,2月20日,星期一

理論頻數(shù)是根據(jù)檢驗假設(shè)且用合并率

來估計而定的。

如本例,無效假設(shè)是A藥組與B藥組的總體有效率相等,均等于合計的陽性率66.67%(110/165)。那么理論上,A藥組的85例中陽性人數(shù)應(yīng)為85(110/165)=56.67,陰性人數(shù)為85(55/165)=28.33;同理,B藥組的80例中陽性人數(shù)應(yīng)為80(110/165)=53.33,陰性人數(shù)為80(55/165)=26.67。15第15頁,共61頁,2023年,2月20日,星期一χ2檢驗的基本公式

上述基本公式由Pearson提出,因此軟件上常稱這種檢驗為Peareson卡方檢驗,下面將要介紹的其他卡方檢驗公式都是在此基礎(chǔ)上發(fā)展起來的。它不僅適用于四格表資料,也適用于其它的“行×列表”。16第16頁,共61頁,2023年,2月20日,星期一分布是一種連續(xù)型分布(Continuousdistribution),v個相互獨立的標(biāo)準(zhǔn)正態(tài)變量(standardnormalvariable)的平方和稱為變量,其分布即為分布;自由度(degreeoffreedom)為v。17第17頁,共61頁,2023年,2月20日,星期一

2分布是一種連續(xù)型分布(Continuousdistribution),v個相互獨立的標(biāo)準(zhǔn)正態(tài)變量(standardnormalvariable)的平方和稱為2變量,其分布即為2分布;自由度(degreeoffreedom)為v。v=1v=4v=6v=918第18頁,共61頁,2023年,2月20日,星期一

2分布的形狀依賴于自由度ν的大小:①當(dāng)自由度ν≤2時,曲線呈“L”型;②隨著ν的增加,曲線逐漸趨于對稱;③當(dāng)自由度ν→∞時,曲線逼近于正態(tài)曲線。19第19頁,共61頁,2023年,2月20日,星期一如果假設(shè)檢驗成立,A與T不應(yīng)該相差太大。理論上可以證明

(A-T)2/T服從x2分布,計算出x2值后,查表判斷這么大的x2是否為小概率事件,以判斷建設(shè)檢驗是否成立。20第20頁,共61頁,2023年,2月20日,星期一在υ=1,21第21頁,共61頁,2023年,2月20日,星期一自由度一定時,P值越小,x2值越大,反比關(guān)系。當(dāng)P值一定時,自由度越大,x2越大。

=1時,P=0.05,x2=3.84P=0.01,x2=6.63P=0.05時,=1,x2=3.84

=2,x2=5.9922第22頁,共61頁,2023年,2月20日,星期一第一節(jié)四格表資料χ2檢驗B1B2合計A1aba+bA2cdc+d合計a+cb+dn=a+b+c+d一般四格表的基本形式23第23頁,共61頁,2023年,2月20日,星期一表7-1完全隨機設(shè)計兩樣本率比較的四格表處理組屬性合計陽性陰性1A11(T11)A12(T12)n1(固定值)2A21(T21)A22(T22)n2(固定值)合計m1m2n24第24頁,共61頁,2023年,2月20日,星期一四格表2檢驗的專用公式n≥40,T≥525第25頁,共61頁,2023年,2月20日,星期一

為了不計算理論頻數(shù)T,可由基本公式推導(dǎo)出,直接由各格子的實際頻數(shù)(a、b、c、d)計算卡方值的公式:第26頁,共61頁,2023年,2月20日,星期一1.建立檢驗假設(shè)

:,兩總體率不等:,兩總體率相等檢驗統(tǒng)計量χ2值反映了實際頻數(shù)與理論頻數(shù)的吻合程度。27第27頁,共61頁,2023年,2月20日,星期一若檢驗假設(shè)H0:π1=π2成立,四個格子的實際頻數(shù)A與理論頻數(shù)T相差不應(yīng)該很大,即統(tǒng)計量χ2不應(yīng)該很大。如果χ2值很大,即相對應(yīng)的P值很小,若P≤α,則反過來推斷A與T相差太大,超出了抽樣誤差允許的范圍,從而懷疑H0的正確性,繼而拒絕H0,接受其對立假設(shè)H1,即π1≠π2。28第28頁,共61頁,2023年,2月20日,星期一2.計算檢驗統(tǒng)計量

(1)當(dāng)總例數(shù)n≥40且所有格子的理論頻數(shù)T>5時:用檢驗的基本公式或四格表資料檢驗的專用公式;基本公式專用公式29第29頁,共61頁,2023年,2月20日,星期一(2)當(dāng)總例數(shù)n≥40且有一個格子1≤T<5時:用校正公式;或改用四格表資料的Fisher確切概率法。30第30頁,共61頁,2023年,2月20日,星期一2分布是一連續(xù)型分布,而四格表資料屬離散型分布,由此計算得的2統(tǒng)計量的抽樣分布亦呈離散性質(zhì)。為改善2統(tǒng)計量分布的連續(xù)性,則需行連續(xù)性校正(correctionforcontinuity)。2連續(xù)性校正僅用于ν

=1的四格表資料,當(dāng)ν≥2時,一般不作校正。31第31頁,共61頁,2023年,2月20日,星期一(3)當(dāng)n<40,或T<1時,不能用卡方檢驗,改用四格表資料的Fisher確切概率法。32第32頁,共61頁,2023年,2月20日,星期一3.作出統(tǒng)計結(jié)論以=1查界值表,若,按檢驗水準(zhǔn)拒絕,接受,可認(rèn)為兩總體率不同;若,按檢驗水準(zhǔn)不拒絕,尚不能認(rèn)為兩總體率不同。33第33頁,共61頁,2023年,2月20日,星期一自由度ν愈大,χ2值也會愈大;所以只有考慮了自由度ν的影響,χ2值才能正確地反映實際頻數(shù)A和理論頻數(shù)T的吻合程度。檢驗的自由度取決于可以自由取值的格子數(shù)目,而不是樣本含量n。四格表資料只有兩行兩列,ν=1,即在周邊合計數(shù)固定的情況下,4個基本數(shù)據(jù)當(dāng)中只有一個可以自由取值。

34第34頁,共61頁,2023年,2月20日,星期一

例8.5某藥品檢驗所隨機抽取574名成年人,研究抗生素的耐藥性(資料如表8-11)。問兩種人群的耐藥率是否一致?表8-11某抗生素的人群耐藥情況用藥史不敏感敏感合計耐藥率(%)曾服該57未服該藥7310617940.78合計25332157444.0835第35頁,共61頁,2023年,2月20日,星期一理論頻數(shù)的計算

18021573106174.10220.9078.90100.10

實際數(shù)

理論數(shù)

36第36頁,共61頁,2023年,2月20日,星期一2檢驗的步驟(1)建立假設(shè)并確定檢驗水準(zhǔn)H0:兩種人群對該抗生素的耐藥率相同,即1=2;(兩總體率相等)H1:兩種人群對該抗生素的耐藥率不同,即1≠2;(兩總體不相等)

=0.0537第37頁,共61頁,2023年,2月20日,星期一(2)計算檢驗統(tǒng)計量當(dāng)總例數(shù)n且所有格子的理論頻數(shù)T>5時:用檢驗的基本公式或四格表資料檢驗的專用公式:2==23.1238第38頁,共61頁,2023年,2月20日,星期一(3)查2界值表(附表7)確定P值,P>0.05,得出結(jié)論。按0.05水準(zhǔn),不拒絕H0,可以認(rèn)為兩組人群對該抗生素的耐藥率的差異無統(tǒng)計學(xué)意義。39第39頁,共61頁,2023年,2月20日,星期一例2某礦石粉廠生產(chǎn)一種礦石粉時,在數(shù)天內(nèi)即有部分工人患有職業(yè)性皮膚炎。后隨機抽取15名工人穿新防護(hù)服,其余仍穿原用的防護(hù)服,一個月后檢查兩組工人的皮膚炎患病情況,資料見下表,問兩組的患病率差別有無統(tǒng)計學(xué)意義?表穿新舊防護(hù)服工人的皮膚炎患病比較防護(hù)服種類皮膚炎癥合計陽性數(shù)陰性數(shù)新1(3.84)14(11.16)15舊10(7.16)18(20.84)28合計11324340第40頁,共61頁,2023年,2月20日,星期一本例n>40,因有一格子的理論數(shù)<5,因而要用校正2檢驗。H0:兩組工人皮膚炎總體患病率相等,即1=2H1:兩組工人皮膚炎總體患病率不等,即1≠2α=0.05校正2值為41第41頁,共61頁,2023年,2月20日,星期一以=1查界值表,,按檢驗水準(zhǔn)不拒絕,接受,尚不能認(rèn)為穿不同防護(hù)服的兩組工人的皮膚炎患病率的差別有統(tǒng)計學(xué)意義;注意:本例若不作連續(xù)性校正,則,得,可見兩者是有區(qū)別的。42第42頁,共61頁,2023年,2月20日,星期一注意:兩樣本率比較的資料,既可用檢驗也可用檢驗來推斷兩總體率是否有差別,且在不校正的條件下兩種檢驗方法是等價的,對同一份資料有。43第43頁,共61頁,2023年,2月20日,星期一小結(jié)T≥5,用四格表專用公式n≥401≤T<5,用連續(xù)性校正公式T<1,用確切概率法。n<40,用確切概率法。第44頁,共61頁,2023年,2月20日,星期一第三節(jié)配對四格表資料的2檢驗與計量資料推斷兩總體均數(shù)是否有差別有成組設(shè)計和配對設(shè)計一樣,計數(shù)資料推斷兩個總體率(構(gòu)成比)是否有差別也有成組設(shè)計和配對設(shè)計,即四格表資料和配對四格表資料。45第45頁,共61頁,2023年,2月20日,星期一

將含量為n的隨機樣本同時按照兩個二項分類的屬性進(jìn)行交叉分類,形成2行2列的交叉分類表,如表8-6,目的是檢驗兩種屬性間的陽性率是否相同變量1變量2合計陽性陰性陽性ab陰性cd合計(固定值)

表8-6配對四格表資料表46第46頁,共61頁,2023年,2月20日,星期一變量1的陽性率-變量2的陽性率=-=可見,兩個變量陽性率的比較只和b、c有關(guān),而與a、d無關(guān)。

變量1的陽性率==變量2的陽性率==47第47頁,共61頁,2023年,2月20日,星期一前面是兩個獨立樣本,行合計是事先固定的;而這里的“兩份樣本”互不獨立,樣本量都是n,是固定的,而行合計與列合計卻是事先不確定的。48第48頁,共61頁,2023年,2月20日,星期一配對四格表資料的2檢驗的專用公式

b+c>40

b+c≤4049第49頁,共61頁,2023年,2月20日,星期一兩種白喉桿菌培養(yǎng)基結(jié)果比較甲培養(yǎng)基乙培養(yǎng)基合計+-+14(a)2(b)16-9(c)3(d)12合計23528配對四格表資料的2檢驗步驟50第50頁,共61頁,2023年,2月20日,星期一配對四格表資料的2檢驗步驟1.H0:兩種培養(yǎng)基陽性率相同,總體B=C;H1:兩種培養(yǎng)基陽性率不同,總體B≠C。 =0.05。2.計算統(tǒng)計量:2=3.27<3.843.按=0.05水準(zhǔn),不拒絕H0,可以認(rèn)為甲乙兩法血清學(xué)檢出陽性率無顯著性差異51第51頁,共61頁,2023年,2月20日,星期一第四節(jié)行×列表2檢驗52第52頁,共61頁,2023年,2月20日,星期一

R×C表的χ2檢驗通用公式53第53頁,共61頁,2023年,2月20日,星期一幾種R×C表的檢驗假設(shè)H054第54頁,共61頁,2023年,2月20日,星期一1.多個樣本率的比較例某醫(yī)院用3種方案治療急性無黃疸型病毒肝炎254例,觀察結(jié)果見表,問3種療法的有效率是否不同。55第55頁,共61頁,2023年,2月20日,星期一檢驗步驟:H0:3種治療方案的有效率相等H1:

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負(fù)責(zé)。
  • 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時也不承擔(dān)用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

評論

0/150

提交評論