第六章卡方檢驗(yàn)_第1頁(yè)
第六章卡方檢驗(yàn)_第2頁(yè)
第六章卡方檢驗(yàn)_第3頁(yè)
第六章卡方檢驗(yàn)_第4頁(yè)
第六章卡方檢驗(yàn)_第5頁(yè)
已閱讀5頁(yè),還剩49頁(yè)未讀, 繼續(xù)免費(fèi)閱讀

下載本文檔

版權(quán)說(shuō)明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請(qǐng)進(jìn)行舉報(bào)或認(rèn)領(lǐng)

文檔簡(jiǎn)介

第六章

離散型分類計(jì)數(shù)資料的2檢驗(yàn)我們已學(xué)過(guò)連續(xù)型資料的t檢驗(yàn)和Z檢驗(yàn)方法,本章介紹離散型資料2檢驗(yàn)。理論基礎(chǔ):連續(xù)型變量的2分布,擬和優(yōu)度檢驗(yàn)。用途:

①比較兩獨(dú)立樣本頻率或多個(gè)獨(dú)立樣本頻率的假設(shè)檢驗(yàn);②配對(duì)設(shè)計(jì)分類資料的假設(shè)檢驗(yàn);③檢驗(yàn)兩個(gè)分類指標(biāo)是否有相關(guān)性;④檢驗(yàn)?zāi)硞€(gè)樣本是否服從某個(gè)分布的假設(shè)檢驗(yàn)。

第一節(jié)2分布和擬合優(yōu)度的2檢驗(yàn)一、2分布:

若互相獨(dú)立,則的分布稱為自由度為的2分布(Chi-squaredistribution),記為。性質(zhì):若互相獨(dú)立,則服從2分布,υ二、關(guān)于擬合優(yōu)度的2檢驗(yàn)(大樣本):1.建立檢驗(yàn)假設(shè):H0:樣本來(lái)自某理論分布。H1:樣本并非來(lái)自該理論分布。α=0.12.H0成立時(shí),大樣本時(shí),Pearson2統(tǒng)計(jì)量:

2值:反映了實(shí)際頻數(shù)與根據(jù)檢驗(yàn)假設(shè)算得的理論頻數(shù)的吻合程度。

*似然比統(tǒng)計(jì)量:自由度:-計(jì)算時(shí)利用樣本資料估計(jì)的參數(shù)個(gè)數(shù)

3.將觀察值代入得當(dāng)前值和相應(yīng)的P值。若P<α,則拒絕H0

,

否則,不拒絕H0。條件:★“大樣本”(都不小于5)。

第二節(jié)比較兩個(gè)獨(dú)立樣本頻率的2檢驗(yàn)表6.1反應(yīng)變量按二項(xiàng)分類的兩個(gè)獨(dú)立樣本資料(四格表類型之一)

例6.1164例用過(guò)洋地黃和51例沒(méi)用過(guò)洋地黃的肺心病人心率失常率是否不同?

表6.2肺心病患者心律失常觀察資料原始數(shù)據(jù)有四個(gè),即稱為實(shí)際頻數(shù),用f表示。其余的數(shù)據(jù)都是從這四個(gè)數(shù)據(jù)推算得來(lái)的。該資料稱四格表(fourfoldtable)資料。

1.建立檢驗(yàn)假設(shè):

α=0.05

2.計(jì)算統(tǒng)計(jì)量2值:

H0成立時(shí),,用近似地代替。一、四格表的基本思想和檢驗(yàn)步驟:

理論頻數(shù)的計(jì)算公式:

統(tǒng)計(jì)量為:(理論公式)

基本思想:式中fij和eij分別表示某一格的實(shí)際頻數(shù)和理論頻數(shù)。

2值:反映了實(shí)際頻數(shù)和根據(jù)檢驗(yàn)假設(shè)算得的理論頻數(shù)的吻合程度(差別的程度)。如H0成立,實(shí)際頻數(shù)和理論頻數(shù)的差別不會(huì)很大,出現(xiàn)大2值的概率P很小;出現(xiàn)大2值時(shí),說(shuō)明實(shí)際頻數(shù)和理論頻數(shù)相差較大,若2值時(shí),,我們就懷疑H0,因而拒絕它。反之,若,則不能拒絕它。

自由度:υ=(行數(shù)-1)(列數(shù)-1)=1對(duì)于例6.1,υ=(2–1)(2–1)=13.確定P值及決策:按,查附表7,得υ=1時(shí),臨界值,,P>0.05,故不拒絕,可認(rèn)為兩總體心率失常陽(yáng)性率相等。

二、四格表資料專用公式:注:關(guān)于統(tǒng)計(jì)量*四格表時(shí),Z檢驗(yàn)和檢驗(yàn)完全等價(jià)。

三、連續(xù)性校正的公式:

四格表卡方檢驗(yàn)的應(yīng)用條件:(1)eij≥5,且n≥40時(shí),用不校正公式計(jì)算值。(2)1≤eij<5,且n≥40時(shí),用連續(xù)性校正檢驗(yàn)。(3)eij<1或n<40,用Fisher精確概率法。

第三節(jié)2×2交叉分類資料的2檢驗(yàn)

(配對(duì)四格表)

表6.32×2交叉分類資料表(四格表類型之二)根據(jù)研究目的不同可進(jìn)行兩種不同的2檢驗(yàn):

獨(dú)立性檢驗(yàn)和兩種處理概率相等的檢驗(yàn)。一、兩種屬性分布間獨(dú)立性檢驗(yàn)

(或稱關(guān)聯(lián)性檢驗(yàn)):如果一種屬性的概率分布與另一種屬性的概率分布無(wú)關(guān),則稱這兩種屬性相互獨(dú)立;否則稱這兩種屬性之間存在關(guān)聯(lián)性。

例6.2

有260份血清樣品,每份樣品一分為二,用二種不同的免疫學(xué)檢測(cè)方法檢驗(yàn)類風(fēng)濕因子,其結(jié)果如表6.4所示。試問(wèn)這兩種免疫學(xué)檢驗(yàn)的結(jié)果是否相互獨(dú)立?表6.4兩種血清免疫學(xué)檢測(cè)結(jié)果1.建立檢驗(yàn)假設(shè):

H0:

屬性A和B互相獨(dú)立。

H1:屬性A和B互相關(guān)聯(lián)。

α=0.05

兩種屬性分布間獨(dú)立性檢驗(yàn)與兩獨(dú)立樣本資料頻率相等的假設(shè)檢驗(yàn)資料分析的計(jì)算方法相同,但設(shè)計(jì)和解釋不同。設(shè)計(jì):一份樣本;n=260;行和與列和事先是不定的;按兩種屬性交叉分類。

2.計(jì)算統(tǒng)計(jì)量2值:利用(6.8a)或(6.7a),

υ=(2-1)(2-1)=1

3.確定P值及決策:據(jù),查附表7,υ=1時(shí),=10.83,P<0.001,按=0.05,拒絕,可認(rèn)為兩種方法測(cè)定結(jié)果間有關(guān)聯(lián)。關(guān)聯(lián)程度的大小關(guān)聯(lián)系數(shù)表達(dá)。r=(取值在-1與+1之間)其中符號(hào)由關(guān)聯(lián)的方向決定,與的符號(hào)相同。上例中,故:二、兩種處理概率相等的2檢驗(yàn)

(McNemer檢驗(yàn))常用于配對(duì)設(shè)計(jì),數(shù)據(jù)結(jié)構(gòu)同上。問(wèn)題不同。

例6.2

問(wèn)兩種測(cè)定方法的陽(yáng)性概率是否相等?*這里不是問(wèn)是否關(guān)聯(lián),故不能用上面的辦法分析!*這里的兩份樣本,接受方法A的個(gè)體與接受方法B的個(gè)體有關(guān)聯(lián),故不能用前一節(jié)兩獨(dú)立樣本資料頻率比較的辦法分析!

兩樣本陽(yáng)性率之差取決于觀察值f12和f21。

問(wèn)題:f12和f21的差異是否是偶然的?1.建立檢驗(yàn)假設(shè):

α=0.052.計(jì)算統(tǒng)計(jì)量2值:

連續(xù)性校正公式:當(dāng)時(shí),3.確定P值及決策:查附表7,υ=1時(shí),,按水準(zhǔn),不拒絕,可以認(rèn)為兩種檢測(cè)方法的總體陽(yáng)性率相等。第四節(jié)

R×C列聯(lián)表資料的2檢驗(yàn)

一、問(wèn)題的提出:前面我們已經(jīng)學(xué)過(guò)用2檢驗(yàn)進(jìn)行兩個(gè)率(比率)差異的比較。在醫(yī)學(xué)研究中,常遇見(jiàn)多個(gè)率(比率)的比較。可否用同樣的思路和方法去解決這類問(wèn)題?見(jiàn)表6.6的資料:表6.6不同疾病病人的血型分布這是三個(gè)三分類構(gòu)成比的比較。表6.11某病170例不同年齡患者的療效統(tǒng)計(jì)這是三個(gè)率的比較。二、R×C表資料的2檢驗(yàn):

我們可用同樣的思路,利用2檢驗(yàn)進(jìn)行多個(gè)率(比率)差異的比較,將資料整理成一個(gè)R×C表,可用R×C表資料的2檢驗(yàn)比較多個(gè)率或構(gòu)成比的差異。基本公式:

R×C表簡(jiǎn)化公式:

例6.4

在血型與疾病關(guān)系的研究中,隨機(jī)抽取胃潰瘍病人、胃癌病人及對(duì)照人群的樣本,根據(jù)ABO血型分類(本例中因AB血型的例數(shù)較少,故省略不計(jì)),觀測(cè)結(jié)果列于表6.6。試探討不同病種是否具有不同的血型分布。表6.6不同疾病病人的血型分布

1.建立檢驗(yàn)假設(shè):H0:三種疾病的血型構(gòu)成比相等。

H1:三種疾病的血型構(gòu)成比不全相等。α=0.052.計(jì)算2統(tǒng)計(jì)量:

思想:假設(shè)三個(gè)構(gòu)成比相等,等于什么?在沒(méi)其他信息時(shí),基于樣本信息,最可靠的估計(jì)值是等于合計(jì)的構(gòu)成比。每個(gè)格子的理論頻數(shù)就等于各疾病的總?cè)藬?shù)乘以相應(yīng)的合計(jì)構(gòu)成比,如胃潰瘍組A型血的理論頻數(shù)為:

e11=17960.424=761.5,其余格子相同??捎没竟剑夯騌×C表簡(jiǎn)化公式:

3.確定P值及決策:自由度=(3-1)(3-1)=4,查附表得=18.47,故P<0.001,按=0.05,拒絕H0,即認(rèn)為三種疾病的血型構(gòu)成比不等或不全相等。三、R×C表資料的關(guān)聯(lián)度測(cè)定:

對(duì)于交叉分類資料,用2檢驗(yàn)拒絕了兩有序分類特征變量間獨(dú)立的零假設(shè)之后,可用Pearson列聯(lián)系數(shù)來(lái)定量描述兩有序分類特征變量的關(guān)聯(lián)強(qiáng)度。

Pearson列聯(lián)系數(shù)(rP):

例6.5

某病不同年齡患者的治療效果資料列于表6.11中,進(jìn)行獨(dú)立性2檢驗(yàn)得到=23.582,=4,拒絕兩種屬性分類相互獨(dú)立的零假設(shè)。例6.5:表6.11某病170例不同年齡患者與療效統(tǒng)計(jì)現(xiàn)計(jì)算Pearson列聯(lián)系數(shù)rP為:

注意:列聯(lián)系數(shù)的符號(hào),當(dāng)頻數(shù)集中在正對(duì)角線的格子時(shí),取正值,集中在負(fù)對(duì)角線的格子時(shí),取負(fù)值。(本例為負(fù)值)。四、注意事項(xiàng):

1.同四格表資料一樣,2分布是建立在大樣本的假定上的,要求不能有1/5以上的格子理論頻數(shù)小于5,且不能有一個(gè)格子的理論頻數(shù)小于1。

解決辦法:①增大樣本量;②合理地合并相鄰的組別;③刪除理論數(shù)太小的行列;④電腦進(jìn)行精確概率計(jì)算。

2.當(dāng)多個(gè)樣本率(或構(gòu)成比)作2檢驗(yàn),結(jié)論為拒絕零假設(shè)時(shí),只能認(rèn)為各總體率(或總體構(gòu)成比)之間總的有差別,不能說(shuō)明兩兩之間有差別。兩組間的比較可參考2分割的方法。第五節(jié)檢驗(yàn)頻數(shù)分布的2檢驗(yàn)

利用2檢驗(yàn)的性質(zhì),我們可以用于檢驗(yàn)任意實(shí)際分布與某個(gè)理論分布的符合程度。例如:某市成年男女的構(gòu)成比鼻咽癌在家族的分布儀器測(cè)量誤差的分布

例6.6

某地暴發(fā)流行細(xì)菌性痢疾。為了分析這次爆發(fā)流行是否存在家庭內(nèi)成員間的傳播,共調(diào)查了四口之家288戶。原始資料列于表6.12中第1及第2兩列。其步驟為:表6.12二項(xiàng)分布擬合優(yōu)度計(jì)算表1.

建立檢驗(yàn)假設(shè):H0:服從

=0.18576的二項(xiàng)分布,即不存在家庭內(nèi)傳播。H1:不服從二項(xiàng)分布,即存在家庭內(nèi)傳播。

=0.052.估計(jì),計(jì)算P(x)﹑理論家庭數(shù)ex及2分量:①發(fā)病率發(fā)病人數(shù)/調(diào)查人數(shù)本例=(0×167+1×51+…+4×3)/288×4=0.18576不發(fā)病率1-=0.81424。②發(fā)病人數(shù)為x的概率:

例如:P(x=0)=(0.18576)0(0.81424)4=0.43955③理論家庭數(shù):本例n=288為調(diào)查家庭總數(shù)。e0=288×0.43955=126.59④相應(yīng)的2分量為:=(167-126.59)2/126.59=12.90(條件:ex5)

3.計(jì)算2值:

4.確定P值及決策:自由度=4-1-1=2。查附表7,=2時(shí),

=5.99,故P<0.05,拒絕H0,可認(rèn)為本次調(diào)查的四口之家內(nèi)發(fā)病人數(shù)的分布不符合二項(xiàng)分布,此次流行可能存在家庭成員間的傳播。*第七節(jié)四格表精確概率檢驗(yàn)法前以述及,由于2分布為連續(xù)性分布,2檢驗(yàn)是基于大樣本假定,四格表時(shí),如果總例數(shù)小于40或任意一格子理論數(shù)小于1,大樣本假定不成立,則不能用2檢驗(yàn)。表6.14栓塞性脈管炎兩種治療方法的結(jié)果總例數(shù)n小于40,為小樣本資料,不能用2檢驗(yàn)。

1.建立檢驗(yàn)假設(shè):H0:1=2H1:1≠2α=0.052.計(jì)算各種可能組合的概率:用a,b,c,d代替四個(gè)格子的頻數(shù)。我們知道總的12個(gè)病人中有7人治愈,如治愈率與治療方法無(wú)關(guān)時(shí),可建立以下條件概率:

目前四格表資料的發(fā)生概率為:統(tǒng)計(jì)檢驗(yàn)的P值還

溫馨提示

  • 1. 本站所有資源如無(wú)特殊說(shuō)明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請(qǐng)下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請(qǐng)聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁(yè)內(nèi)容里面會(huì)有圖紙預(yù)覽,若沒(méi)有圖紙預(yù)覽就沒(méi)有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫(kù)網(wǎng)僅提供信息存儲(chǔ)空間,僅對(duì)用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對(duì)用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對(duì)任何下載內(nèi)容負(fù)責(zé)。
  • 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請(qǐng)與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶因使用這些下載資源對(duì)自己和他人造成任何形式的傷害或損失。

最新文檔

評(píng)論

0/150

提交評(píng)論