07分類資料的推斷130407_第1頁(yè)
07分類資料的推斷130407_第2頁(yè)
07分類資料的推斷130407_第3頁(yè)
07分類資料的推斷130407_第4頁(yè)
07分類資料的推斷130407_第5頁(yè)
已閱讀5頁(yè),還剩101頁(yè)未讀, 繼續(xù)免費(fèi)閱讀

下載本文檔

版權(quán)說(shuō)明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請(qǐng)進(jìn)行舉報(bào)或認(rèn)領(lǐng)

文檔簡(jiǎn)介

定性資料的統(tǒng)計(jì)推斷主要內(nèi)容6.1率的可信區(qū)間6.2樣本率與總體率的比較6.3兩率的比較6.4配對(duì)設(shè)計(jì)資料的兩率的比較6.5多個(gè)率的比較6.6構(gòu)成比的比較6.7兩標(biāo)準(zhǔn)化率的比較6.8高維列聯(lián)表的分析6.9趨勢(shì)性檢驗(yàn)

6.1率的區(qū)間估計(jì)陽(yáng)性率的均數(shù)μp=π

標(biāo)準(zhǔn)差σp=

(率的標(biāo)準(zhǔn)誤)總體率的區(qū)間估計(jì)1.正態(tài)近似法np>5n(1-p)>5p±uasp

例1在血吸蟲(chóng)病流行區(qū)中,某縣根據(jù)隨機(jī)原則抽查4000人, 其血吸蟲(chóng)感染率為15%,試區(qū)間估計(jì)該縣血吸蟲(chóng)感染率的99%可信區(qū)間總體率的99%可信區(qū)間即0.1354~0.1646

2.查表法n≤50例2有人調(diào)查29名非吸毒婦女,出獄時(shí)有1名HIV(人免疫缺陷病毒)陽(yáng)性,則陽(yáng)性率的95%可信區(qū)間為(0.1%,17.8%)3.精確概率法n較小,p接近于0或1(其中r為陽(yáng)性數(shù))特別地在r=0時(shí)在r=n時(shí)上例中,95%K可信區(qū)間為即(0.0009,0.1776)4.利用二項(xiàng)分布的概率公式迭代兩率差的可信區(qū)間π1-π2的可信度為1-α的可信區(qū)間為其中6.2樣本率與總體率比較比較的目的是推斷該樣本所代表的未知總體率π與已知的總體率π0是否相等。方法一:直接計(jì)算概率法

例3據(jù)以往經(jīng)驗(yàn),新生兒染色體異常率一般為1%,某醫(yī)院觀察了當(dāng)?shù)?00名新生兒,只有1例異常,問(wèn)該地新生兒染色體異常率是否低于一般?H0:π=0.01H1:π<0.01α=0.05P=p(x≤1)=p(x=0)+p(x=1)p>0.05不拒絕H0問(wèn)題:P=P(x≤1),而不是P=P(x≤2)P=P(x≤1),而不是P=P(x=1)P=P(x≤1),而不是P=P(x≥1)例4用一種新藥治療某種寄生蟲(chóng)病,受試者50人在服藥后1人發(fā)生某種嚴(yán)重反應(yīng),這種反應(yīng)在此病患者中也曾有發(fā)生,但過(guò)去普查結(jié)果約為每5000人中僅有1人出現(xiàn)。問(wèn)此新藥是否提高了這種反應(yīng)的發(fā)生率?

方法二:正態(tài)近似法(n較大)

例5根據(jù)以往經(jīng)驗(yàn),一般胃潰瘍病患者有20%發(fā)生胃出血癥狀,現(xiàn)某醫(yī)院觀察65歲以上潰瘍病人304例,有31.6%發(fā)生胃出血癥狀,問(wèn)老年胃潰瘍病患者是否較容易出血?H0:π=0.2H1:π>0.2α=0.05

p<0.05拒絕H0,認(rèn)為……

6.3兩樣本率的比較目的:推斷兩總體率是否相等當(dāng)n1,n2均較大,p1,p2,(1-p1),(1-p2)均不太小,如n1p1,n2p2,n1(1-p1),n2(1-p2)均大于5時(shí),可用u檢驗(yàn)6.3.1兩樣本率的U檢驗(yàn)例6蛙王露:n=53,有效率81.13%復(fù)方阿膠:n=56,有效率71.43%二者是否有差別?H0:π1=

π2;H1:π1≠π2;α=0.05n1=53,n1p1=43,n2=56,n2p2=40pc=(43+40)/(53+56)=0.7615查u界值表,p>0.05,不拒絕H0,尚不能認(rèn)為兩藥有效率不同6.3.2兩樣本率比較的卡方檢驗(yàn)卡方檢驗(yàn)的原理一種對(duì)理論頻數(shù)和實(shí)際頻數(shù)吻合程度的考察。Ainvestigationofthedegreeofagreementoftheoreticalfrequencyandactualfrequency.一個(gè)正常的骰子,拋出后得到六個(gè)面的概率均為1/6。因此,要判定一個(gè)骰子是否合格,可以通過(guò)拋骰子的方法來(lái)進(jìn)行;χ2檢驗(yàn)的原理理論101010101010實(shí)際121365159差值-2-345-51χ2檢驗(yàn)的原理衡量理論數(shù)與實(shí)際數(shù)的差別KarlPearson1857~1936英國(guó)統(tǒng)計(jì)學(xué)家1901年10月與Weldon、Galton一起創(chuàng)辦Biometrika理論101010101010實(shí)際121365159差值-2-345-512分布0.00.10.20.30.40.5RejectionArea四格表(fourfoldtable)例7109例患者治療后有效率比較組別有效無(wú)效合計(jì)有效率(%)試驗(yàn)組43105381.13對(duì)照組40165671.43合計(jì)832610976.15理論數(shù)的計(jì)算如果兩組率相等,則理論上有效率為76.15%。理論與實(shí)際相吻合!則觀察53人,有53×0.7615=40.36人有效,

53-40.36=12.64人無(wú)效。觀察56人,有56×0.7615=42.64人有效,

56-42.64=13.36人無(wú)效。理論頻數(shù)的計(jì)算43104016實(shí)際數(shù)理論數(shù)40.3612.6442.6413.36衡量理論數(shù)與實(shí)際數(shù)的差別自由度為1的2分布0.00.10.20.30.40.5自由度為2的2分布0.00.10.20.30.40.5自由度為1的2分布界值0.00.10.20.30.40.53.840.052檢驗(yàn)的步驟(1)H0:1=2;

H1:1≠2,

=0.05(2)2=1.41(3)P>0.05(4)

按0.05水準(zhǔn),不拒絕H0,尚不能認(rèn)為兩種方法的治療效果不同。四格表2檢驗(yàn)的專用公式abcd43104016四格表2檢驗(yàn)的專用公式四格表2的檢驗(yàn)的應(yīng)用條件:N>40,T>5,用2;N>40,但1<T≤

5,用校正2。n≤40,或T≤

1,用確切概率。當(dāng)P值接近檢驗(yàn)水準(zhǔn)時(shí),推薦使用確切概率法。6.3.3四格表的校正卡方檢驗(yàn)例8穿新舊兩種防護(hù)服工人的皮膚炎患病率比較

組別陽(yáng)性陰性合計(jì)患病率(%)新114156.7舊10182835.7合計(jì)11324325.6H0:兩組工人的皮膚炎患病率無(wú)差別,即π1=π2;H1:兩組工人的皮膚炎患病率有差別,即π1≠π2;檢驗(yàn)水準(zhǔn)=0.05。求得最小的理論頻數(shù)T11=15×11/43=3.84,1<T11<5且n=43>40,所以宜用χ2檢驗(yàn)的校正公式查χ2界值表得0.05<P<0.10,按

=0.05水準(zhǔn),不拒絕H0,差別無(wú)統(tǒng)計(jì)學(xué)意義,尚不能認(rèn)為穿不同防護(hù)服的皮膚炎患病率有差別。6.3.4四格表的確切概率

Fisher’sexactprobability例9兩種方法治療黑色素瘤療效比較

方法緩解未緩解合計(jì)緩解率(%)A1311492.9B731070.0合計(jì)2042483.3確切概率的基本思想基本思想:周邊合計(jì)應(yīng)當(dāng)是不變的在假定H0成立時(shí),四格表頻數(shù)的各種組合都有可能得到,但得到的概率大小不同;假定零假設(shè)成立,計(jì)算此時(shí)出現(xiàn)現(xiàn)有樣本及更極端樣本的概率。所謂極端,這里指不同組合下兩樣本率差別更大的情形;若零假設(shè)成立,此概率應(yīng)當(dāng)不會(huì)太小!四格表周邊合計(jì)不變xa+b-xa+ba+c-xd-a+xc+da+cb+dnx=0,1,…,min(a+c,a+d)在周邊合計(jì)一定時(shí),某個(gè)格子數(shù)字確定后所有格子中都會(huì)被確定。四格表(周邊合計(jì)不變時(shí))所有可能的排列(1)(2)(3)(4)(5)14013112211310464738291100每一種組合的概率aba+bcdc+da+cb+dn超幾何分布(hypergeometricdistribution)四格表所有可能排列的概率(1)(2)(3)(4)(5)14013112211310464738291100Pi0.01980.15810.38540.34260.0942四格表(周邊合計(jì)不變時(shí))所有可能的排列(1)(2)(3)(4)(5)14013112211310464738291100|p1-p2|:0.4000.2290.0570.1140.286P值的計(jì)算(1)(2)(3)(4)(5)14013112211310464738291100|p1-p2|:0.4000.2290.0570.1140.286Pi0.01980.15810.0942P=0.0198+0.1581+0.0942=0.2721H0:兩種方法緩解率相等;H1:兩種方法緩解率不等。=0.05。P=Pi=0.2721按=0.05水準(zhǔn),不拒絕H0,差異無(wú)統(tǒng)計(jì)學(xué)意義。故尚不能認(rèn)為兩種方法治療黑色素瘤緩解率有差別。兩個(gè)率比較的u檢驗(yàn)當(dāng)n較大時(shí),二項(xiàng)分布近似正態(tài)分布。因此兩樣本率比較的u檢驗(yàn),當(dāng)n1p1、n2p2、n1(1p1)、n2(1-p2)均大于5才適用,某醫(yī)師在用蛙王露口服液治療貧血的臨床試驗(yàn)中,將109名受試者隨機(jī)分為兩組,一組為試驗(yàn)組,接受蛙王露口服液的治療,結(jié)果為有效43人,無(wú)效10人;另一組為對(duì)照組,接受復(fù)方阿膠漿的治療,結(jié)果為有效40人,無(wú)效16人,問(wèn)兩組有效率有無(wú)差別?H0:兩組有效率無(wú)差別,即π1=π2;H1:兩組有效率有差別,即π1≠π2;

=0.05。p1=43/53=0.8113,p2=40/56=0.7143,pc=(43+40)/(53+56)=0.7615查附表1得P=0.234,按

=0.05的水準(zhǔn),不拒絕H0,差別無(wú)統(tǒng)計(jì)學(xué)意義,故尚不能認(rèn)為兩組的有效率有差別。與正態(tài)分布的關(guān)系3.840.050.0250.0251.96-1.966.4配對(duì)資料的兩率的比較

配對(duì)設(shè)計(jì)的t檢驗(yàn)配對(duì)設(shè)計(jì)的計(jì)數(shù)資料,我們可采用:(1)配對(duì)資料的χ2檢驗(yàn)(McNemar檢驗(yàn))

(2)確切概率法配對(duì)四格表資料的2檢驗(yàn)兩種檢驗(yàn)結(jié)果比較可能的結(jié)果甲法乙法頻數(shù)1++a2+-b3-+c4--d例10兩種檢驗(yàn)結(jié)果比較乙甲合計(jì)+-+36(a)24(b)60-10(c)135(d)145合計(jì)46159205配對(duì)四格表資料的實(shí)際數(shù)與理論數(shù)24(b)10(c)1717b+c<40且>20時(shí):配對(duì)四格表資料的2檢驗(yàn)步驟H0:兩法檢出陽(yáng)性率相同,總體B=C;

H1:兩法檢出陽(yáng)性率不同,總體B≠C。 =0.05。計(jì)算統(tǒng)計(jì)量:2=4.971。P<0.05按=0.05水準(zhǔn),拒絕H0

。認(rèn)為兩種方法的陽(yáng)性率不同。陽(yáng)性率相同,而非檢驗(yàn)結(jié)果完全一致?。?060-6020精確概率法樣本例數(shù)較少時(shí)還可以用精確概率法,原理同配對(duì)設(shè)計(jì)的符號(hào)檢驗(yàn)。P=p(x≤k)+p(x≥n-k)注:n=b+ck=min(b,c)p(x)=上例中p=p(0)+…+P(5)+P(26)+…+P(31)=0.00019226.5多個(gè)率比較的2檢驗(yàn)蟲(chóng)卵陰轉(zhuǎn)率的比較藥物陰轉(zhuǎn)例數(shù)未陰轉(zhuǎn)例數(shù)合計(jì)陰轉(zhuǎn)率(%)復(fù)方敵百蟲(chóng)片2893775.7純敵百蟲(chóng)片18203847.4滅蟲(chóng)靈10243429.4合計(jì)565310951.4例11理論數(shù)的計(jì)算19.0217.9819.5318.4717.4816.52實(shí)際數(shù)A理論數(shù)T

2893718203810243456(51.40%)53(48.60%)1092值的計(jì)算19.0217.9819.5318.4717.4816.52實(shí)際數(shù)A理論數(shù)T

289182010242值的計(jì)算289371820381024345653109多個(gè)率比較的2檢驗(yàn)的過(guò)程H0:π1=π2=π3H1:三種方法陰轉(zhuǎn)率不等或者不全相等

α=0.05ν=2×1=2P<0.05;按照0.05的檢驗(yàn)水準(zhǔn)拒絕H0,接受H1,差別有統(tǒng)計(jì)學(xué)意義,可認(rèn)為三種方法陰轉(zhuǎn)率不同或不全相等。自由度為2的2分布界值0.00.10.20.30.40.55.99=0.05多重比較Scheffe可信區(qū)間法兩率之差的100(1-α)%可信區(qū)間為6.6構(gòu)成比的比較例12組別ABOAB合計(jì)鼻咽癌336565100眼科病人5414525125合計(jì)872010810225鼻咽癌患者與眼科病人血型構(gòu)成比較2值的計(jì)算2值的計(jì)算3365651005414525125872010810225構(gòu)成比比較的2檢驗(yàn)步驟H0:兩組血型構(gòu)成比相同;H1:兩組血型構(gòu)成比不同。 =0.05。計(jì)算統(tǒng)計(jì)量:2=5.710,v=3

。P>0.05按=0.05水準(zhǔn),不拒絕H0

。 尚不能認(rèn)為兩組血型構(gòu)成比不同。R×C表的分析方法的條件條件:理論數(shù)不能小于1;理論數(shù)大于1小于5的格子數(shù)不超過(guò)總格子數(shù)的1/5。解決方法增加樣本含量刪除某行或某列合并部分行或列Fisher確切概率計(jì)算法定性資料假設(shè)檢驗(yàn)的正確應(yīng)用多個(gè)率或構(gòu)成比的比較拒絕H0的含義;等級(jí)資料(有序分類資料)的比較應(yīng)該考慮使用秩和檢驗(yàn)ThankU兩標(biāo)準(zhǔn)化率的比較例13試就下表資料分析比較甲、乙兩醫(yī)院乳腺癌手術(shù)后的5年生存率(%)。腋下淋巴結(jié)轉(zhuǎn)移甲醫(yī)院乙醫(yī)院病例數(shù)生存數(shù)生存率(%)

病例數(shù)生存數(shù)生存率(%)無(wú)453577.7730021571.67有71045063.38834250.60合計(jì)75548564.2438325767.10甲、乙兩醫(yī)院乳腺癌手術(shù)后的標(biāo)準(zhǔn)化率腋下淋巴結(jié)轉(zhuǎn)移標(biāo)準(zhǔn)病例數(shù)甲乙生存率預(yù)計(jì)生存數(shù)生存率預(yù)計(jì)生存數(shù)無(wú)34577.7726871.67247有79368.3854250.60401計(jì)1138-810-648標(biāo)準(zhǔn)化率為:甲P1’=810/1138=71.18%乙P2’=648/1138=56.94%

H0:兩標(biāo)準(zhǔn)化率相等

H1:兩標(biāo)準(zhǔn)化率不相等腋下淋巴結(jié)轉(zhuǎn)移(1)病例數(shù)生存數(shù)合并生存率(%)pi(8)生存率差的方差(10-4)(9)標(biāo)準(zhǔn)病例數(shù)hi(10)(10)2×(9)hi2si2×

10-4甲nAi(2)乙nBi(3)計(jì)ni(4)甲dAi(5)乙dBi(6)計(jì)di(7)無(wú)453003453521525072.4651.00345607.03有710837934504249262.0431.697931992.82計(jì)755383113848525774211382599.85生存率之差的方差

兩標(biāo)準(zhǔn)化率差別的方差s2

查表得p=0.00074,拒絕H0,認(rèn)為……6.8高維列聯(lián)表資料的統(tǒng)計(jì)分析

例14在嬰兒營(yíng)養(yǎng)和發(fā)育關(guān)系調(diào)查時(shí),分別在月齡為9月、10月、11月及12月的嬰兒中調(diào)查了發(fā)育好與發(fā)育差的兩組兒童的副食品供給情況,得下列資料,試對(duì)發(fā)育與副食品供應(yīng)的關(guān)系作分析。發(fā)育與副食品供應(yīng)的關(guān)系月齡副食品供應(yīng)好差計(jì)9月充足232043不足19315010月充足282048不足24305411月充足322254不足25305512月充足412162不足382058計(jì)充足12483207不足106111217試在排除了年齡因素影響后,分析副食品供應(yīng)對(duì)發(fā)育的影響情況。分析:各年齡組發(fā)育差的比例是不等的,直接用簡(jiǎn)單合并欄的四格表資料計(jì)算不合理。也不可將每個(gè)年齡組的數(shù)據(jù)分別進(jìn)行檢驗(yàn),然后將其結(jié)論綜合,這樣做往往會(huì)因?yàn)槊總€(gè)四格表的頻數(shù)都很小,不宜得出顯著性。要考慮發(fā)育與副食品供給之間的關(guān)系,需要對(duì)比數(shù)比(oddsratio,相對(duì)危險(xiǎn)度的一種估計(jì)值)OR=1作假設(shè)檢驗(yàn),計(jì)算公共比數(shù)比及其可信區(qū)間。公共OR:OR的可信區(qū)間:H0:OR=1H1:OR≠1檢驗(yàn)統(tǒng)計(jì)量計(jì)算χ2CMH的分子χ2CMH的分母χ2CMH=4.726df=1P<0.05說(shuō)明副食品的供給不足對(duì)嬰兒的發(fā)育有影響。OR的95%可信區(qū)間為綜合結(jié)果分層OR95%CIχ2CMHP11.8760.8204.2932.2150.13721.7500.7983.8401.9420.16331.7450.8173.7292.0620.15141.0280.4832.1860.0050.944合計(jì)1.5641.0652.2995.2050.023調(diào)整1.5401.0432.2724.7260.030本例中還可對(duì)各層的OR是否齊性作檢驗(yàn)(Breslow-Day齊性檢驗(yàn))χ2=1.534df=3p=0.675說(shuō)明不同月齡的嬰兒,副食品的供應(yīng)對(duì)其發(fā)育的影響是一致的。6.9趨勢(shì)性χ2檢驗(yàn)

當(dāng)暴露水平按多個(gè)等級(jí)分類時(shí),經(jīng)常需要檢驗(yàn)是否存在劑量-反應(yīng)關(guān)系,即隨著暴露水平的升高,陽(yáng)性率是否有增加或減少的趨勢(shì)。注:趨勢(shì)性χ2檢驗(yàn)只適合于2行或2列的資料。例15一項(xiàng)心肌梗塞發(fā)生前飲酒的病例-對(duì)照研究結(jié)果如下,試分析每日飲酒量與心肌梗塞發(fā)生之間是否存在劑量反應(yīng)關(guān)系。

心肌梗塞患者及對(duì)照者的每日飲酒量418391調(diào)查總數(shù)241130464220+2382021100+1101360200+對(duì)照數(shù)病例數(shù)飲酒量的等級(jí)每日飲酒量(ml)趨勢(shì)性χ2檢驗(yàn)的計(jì)算飲酒量200+100+0+0計(jì)病例(a)1362024211391(n1)對(duì)照1102384624418(n0)計(jì)(m)2464408835809(N)等級(jí)(z)0123az02028433319mz0440176105721mz204403523151107χ2=7.488P=0.006,說(shuō)明飲酒量的多少與心肌梗塞有關(guān)。每日飲酒量與心肌梗塞發(fā)生之間存在劑量反應(yīng)關(guān)系,飲酒量增加危險(xiǎn)性增加。

STATISTICSFORTABLEOFIBYJCochran-ArmitageTrendTest

溫馨提示

  • 1. 本站所有資源如無(wú)特殊說(shuō)明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請(qǐng)下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請(qǐng)聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁(yè)內(nèi)容里面會(huì)有圖紙預(yù)覽,若沒(méi)有圖紙預(yù)覽就沒(méi)有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫(kù)網(wǎng)僅提供信息存儲(chǔ)空間,僅對(duì)用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對(duì)用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對(duì)任何下載內(nèi)容負(fù)責(zé)。
  • 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請(qǐng)與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶因使用這些下載資源對(duì)自己和他人造成任何形式的傷害或損失。

最新文檔

評(píng)論

0/150

提交評(píng)論