第十講1非參數(shù)檢驗卡方檢驗_第1頁
第十講1非參數(shù)檢驗卡方檢驗_第2頁
第十講1非參數(shù)檢驗卡方檢驗_第3頁
第十講1非參數(shù)檢驗卡方檢驗_第4頁
第十講1非參數(shù)檢驗卡方檢驗_第5頁
已閱讀5頁,還剩41頁未讀, 繼續(xù)免費閱讀

下載本文檔

版權說明:本文檔由用戶提供并上傳,收益歸屬內容提供方,若內容存在侵權,請進行舉報或認領

文檔簡介

1卡方檢驗

(chi-squaretest)

分類數(shù)據(jù)組間比較的假設檢驗計數(shù)資料組間的比較2

本講主要內容第一節(jié)卡方檢驗的基本思想第二節(jié)獨立四格表資料的χ2檢驗*第三節(jié)配對四格表資料的χ2檢驗*第四節(jié)行×列表資料的χ2檢驗*第五節(jié)多個樣本率間的多重比較第六節(jié)卡方檢驗總結3

目的:推斷兩個總體率或構成比之間有無差別多個總體率或構成比之間有無差別多個樣本率間的多重比較兩個分類變量之間有無關聯(lián)性頻數(shù)分布擬合優(yōu)度的檢驗。檢驗統(tǒng)計量:資料類型:計數(shù)資料理論基礎:卡方分布4第一節(jié)檢驗的基本思想51.χ2分布1875年F.Helmet提出χ2統(tǒng)計量,設Xi為來自正態(tài)總體的連續(xù)型變量。χ2分布是一個連續(xù)型變量的分布,分布的參數(shù)為自由度(ν)。63.847.8112.59P=0.05的臨界值χ2分布的概率密度函數(shù)曲線7χ2分布的界值在υ=1,卡方分布界值為標準正態(tài)分布界值的平方。8K.Pearson的χ2統(tǒng)計量1900年K.Pearson提出下述公式,在n≥40時下式值與χ2分布近似,在理論頻數(shù)>5,近似程度較好。A:實際頻數(shù),表中實際發(fā)生的陽性或陰性頻數(shù);T:理論頻數(shù),按某H0假設計算理論上的陽性或陰性頻數(shù)TRC,第R行第C列的理論頻數(shù);nR,相應行的合計,nC,相應列的合計,n,總例數(shù)9表7-1兩組療法降低顱內壓有效率(%)療法有效人數(shù)無效人數(shù)合計有效率試驗組99(90.48)5(13.52)10495.2對照組75(83.52)21(12.48)9678.1合計

1742620087.0注:括號內為理論頻數(shù)(T)T11=174*104/200=90.48假設:H0:1=2=c=87.00

(兩組總體有效率相等)H1:12(兩組總體有效率不等)

假定兩組有效率均為87%10Class n HypothesizedObservedExpected=T試驗組104有效概率π=0.8799 90.48

無效概率π1=0.13513.52對照組96有效概率π=0.87 75 83.52

無效概率π1=0.132112.48Χ2檢驗是考察實際頻數(shù)與假設理論頻數(shù)是否一致的統(tǒng)計量。11Pearson檢驗計算與步驟1.建立假設:H0:1=2=c(兩組總體率相等)H1:12(兩組總體率不等)2.=0.053.計算統(tǒng)計量4.確定概率(P)和自由度(ν)自由度(ν)=(行數(shù)-1)×(列數(shù)-1)本例ν=(2-1)×(2-1)=112

與比較,得到p值5.結論:在=0.05水準上,p<0.01,拒絕H0,兩樣本率差別有統(tǒng)計意義,可認為試驗組對降低顱內壓有效率高于對照組。本例13第二節(jié)獨立四格表資料檢驗

(兩組樣本率間差別檢驗)14兩組(不配對)樣本率的比較

1)四格表形式組別陽性數(shù)陰性數(shù)合計率%甲組aba+b=n1a/n1乙組cdc+d=n2c/n2合計a+cb+dn2)四格表不配對資料檢驗的專用公式二者結果等價各組樣本例數(shù)是固定的省去求理論頻數(shù)15表7-1兩組降低顱內壓有效率比較療法有效人數(shù)無效數(shù)合計試驗組99(a)5(b)104(a+b)對照組75(c)21(d)96(c+d)合計174(a+c)26(b+d)200(N)163)四格表資料檢驗的校正公式計數(shù)資料中的實際頻數(shù)是分類資料,計算的統(tǒng)計量是離散型分布,一般近似于連續(xù)型分布。在自由度大于1,各格的理論頻數(shù)均大于5時,這種近似很好;當自由度為1,有任何格子理論頻數(shù)小于5而大于1,且n>40時,這種近似較差。而分布是一連續(xù)型分布。因此需要進行連續(xù)性校正。美國統(tǒng)計學家F.Yates提出了用|A-T|-0.5計算連續(xù)性校正法。17四格表資料檢驗公式選擇條件:

,不校正的理論或專用公式;

,校正公式;,用Fisher確切概率法

連續(xù)性校正僅用于的四格表資料,當時,一般不作校正。

18表7-2兩藥物治療腦血管病有效率比較組別有效數(shù)無效數(shù)合計有效率%甲藥4665288.46乙藥1882669.23合計64147882.05校正公式不校正χ2=4.350.025<p<0.050.05<P<0.1

結果不同19SPSS輸入格式組別Freq2效果甲藥46陽性甲藥6陰性乙藥18陽性乙藥8陰性20SPSS過程DataWeightCasesWeightCasesby錄入的數(shù)據(jù)是經(jīng)過整理后的頻數(shù)表數(shù)據(jù),分析前需要告訴系統(tǒng)freq變量代表的是頻數(shù),否則得不到預期的結果。將頻數(shù)變量freq2送入FrequencyVariableok21AnalyzeCrosstabsDescriptiveStatisticsSPSS過程22Rows:group1Colums:效果列變量行變量Statistics23Chi-squareokNominal無序分類變量Ordinal有序分類變量2*2配對卡方檢驗只適合方表,吻合程度檢驗2*2表,計算相對危險度OR估計值卡方檢驗,產(chǎn)生多種結果計算相關系數(shù)24SPSS輸出結果25SPSS輸出結果不校正校正a說明對2*2表格計算了連續(xù)性校正卡方b說明1個單元格的理論頻數(shù)小于5,最小理論頻數(shù)為4.67皮爾遜卡方檢驗結果:x2=4.353,p=0.037Fisher卡方檢驗結果:p=0.058n=78,T<5選校正公式結果26練習在甲乙兩個污水排放口分別取樣檢驗COD超標情況,結果見表,排污口超標次數(shù)未超標次數(shù)合計甲4(5.22)26(24.78)30乙4(2.78)12(13.22)16合計838461)確定檢驗假設和檢驗水準2)計算理論頻數(shù),見表中括號里數(shù)字3)使用校正公式計算卡方統(tǒng)計量,為0.344)查臨界值表,得p>0.05,超標率無統(tǒng)計學意義。27練習結果28第三節(jié)配對設計兩個樣本率的χ2檢驗(McNemer檢驗)用途常用于比較兩種檢驗方法或兩種培養(yǎng)基的陽性率是否有差別。特點:對同一觀察對象分別用兩種方法處理,觀察其陽性與陰性結果。資料整理為配對四格表形式.29配對設計資料的四格表及公式例表7-3兩種方法的檢測結果

免疫乳膠法熒光法+-合計+11(a)12(b)23(a+b)-2(c)33(d)35(c+d)合計13(a+c)45(b+d)58(N)例7-3:某實驗室采用兩種方法對58名可疑紅斑狼瘡患者的血清抗體進行測定,問:兩方法測定結果陽性檢出率是否有差別?各觀察單位分別用兩種方法處理,然后觀察兩種處理方法的某兩分類變量的計數(shù)結果30例:配對計數(shù)資料的比較1.建立檢驗的假設H0:b=c

(兩法總體陽性率相等)H1:bc

(兩法總體陽性率不等)2.=0.053.計算χ2

統(tǒng)計量(McNemer檢驗

)條件:(b+c)<40條件:(b+c)≥40314.確定自由度(ν)和χ2值的概率P

ν=(行數(shù)-1)(列數(shù)-1)本例:ν=1本例χ2=5.79>3.84,P<0.055.結論:在α=0.05水準,拒絕H0,P<0.05認為兩方法的檢測率不同,乳膠法的陽性檢測率22.41%低于免疫檢測率39.66%。當n很大,a與d數(shù)值很大,統(tǒng)計意義不大32熒光法乳膠法頻數(shù)2陽性陽性11陽性陰性12陰性陽性2陰性陰性33SPSS數(shù)據(jù)要求33SPSS過程DataWeightCasesWeightCasesby將頻數(shù)2變量送入FrequencyVariableokAnalyzeDescriptiveStatisticsCrosstabsRows:熒光法Colums:乳膠法StatisticsMcMemarok34McNemar檢驗結果McNemar利用二項分布原理計算雙側精確概率,p=0.013,差異具有統(tǒng)計學意義。35第四節(jié)行×列表的χ2檢驗當比較組行或列分類數(shù)>2,稱為行×列表。其基本數(shù)據(jù)有以下三種情況:1.多組(獨立樣本)樣本率差別有無統(tǒng)計意義?2.兩組(獨立樣本)的構成比(分布)有無統(tǒng)計意義?3.兩個分類變量分布是否獨立(有關聯(lián))?36行×列表的χ2檢驗公式自由度=(行數(shù)-1)×(列數(shù)-1)等價37表7-8三組療法有效率的比較療法有效無效合計有效率%物理組199720696.6藥物組1641818290.1外用組1182614481.9合計4815153290.4一、多組樣本率的比較H0:1=2=3=90.4(三組總體有效率相等)H1:三組總體率不全等38表7-8三組療法有效率的計算A為表中的實際頻數(shù)自由度=(行數(shù)-1)(列數(shù)-1)=(3-1)(2-1)=239SPSS過程DataWeightCasesWeightCasesby將頻數(shù)變量送入FrequencyVariableokAnalyzeDescriptiveStatisticsCrosstabsRows:group1Colums:效果StatisticsChi-squareok40Group1效果頻數(shù)物理組陽性199物理組陰性7藥物組陽性164藥物組陰性18外用組陽性118外用組陰性26SPSS輸入和輸出注意weigtcases結論:在α=0.05水準,拒絕H0,P<0.01,認為三組療法有效率不等或不全等.注意:此結果不能得到各兩兩組比較的結論.41二、兩組和多組構成比的比較

表7-9兩組Ⅱ型糖尿病患者ACE基因分布比較

ACE基因類型糖尿病DDIDII合計有腎病42(37.8)48(43.3)21(18.9)111無腎病30(21.7)75(52.2)36(26.1)141合計72(28.9)123(48.2)57(22.9)252括號內為行的構成比問:兩組糖尿病人在ACE基因類型分布上有無差別?H0:兩組總體各基因構成相等,均等于合計構成比H1:兩組總體構成分布不相等42輸入格式和過程腎病有無基因類型構成比有腎病DD42有腎病ID48有腎病二21無腎病DD30無腎病ID75無腎病二36操作過程同前43SPSS輸出結果結論:在α=0.05水準,拒絕H0,P=0.015,認為兩組糖尿病病人在ACE基因類型分布上有差別,有腎病糖尿病者DD基因比例多于無腎病.

44三、R×C表數(shù)據(jù)的注意事項1.多個樣本率比較的χ2檢驗,當拒絕H0時,不能得出任何兩組間都有差別,需要進行多個樣本率的多重比較。目前尚無公認的兩兩比較的方法.2.R×C表各格的理論頻數(shù)不應小于1,且1

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內容里面會有圖紙預覽,若沒有圖紙預覽就沒有圖紙。
  • 4. 未經(jīng)權益所有人同意不得將文件中的內容挪作商業(yè)或盈利用途。
  • 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內容的表現(xiàn)方式做保護處理,對用戶上傳分享的文檔內容本身不做任何修改或編輯,并不能對任何下載內容負責。
  • 6. 下載文件中如有侵權或不適當內容,請與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

評論

0/150

提交評論