




版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進(jìn)行舉報或認(rèn)領(lǐng)
文檔簡介
1、分類變量資料的統(tǒng)計分析1 率(rate):說明某現(xiàn)象或某事物發(fā)生的頻率或強度。 率=(實際發(fā)生數(shù)/可能發(fā)生總數(shù))比例基數(shù) 比例基數(shù):100%、1000、10000/萬、100000(1/10萬) 如:發(fā)病率、死亡率、發(fā)生率、陽性率、患病率等分類變量資料的統(tǒng)計描述 構(gòu)成比(proportion):說明某一事物內(nèi)部,各組成部分所占的比重。也叫百分比。 構(gòu)成比=(某部分觀察單位數(shù)/各組成部分觀察單位總數(shù))100% 如:教研室16人中高級職稱有4人,占202 相對比(relative ratio):是A、B兩個有關(guān)指標(biāo)之比,說明A是B的若干倍或百分之幾,通常用倍數(shù)或分?jǐn)?shù)表示。 如:男:女、醫(yī)生:護(hù)士、
2、教師:學(xué)生3分類變量資料的統(tǒng)計推斷4率的抽樣誤差與標(biāo)準(zhǔn)誤 樣本率(p)和總體率()的差異稱為率的抽樣誤差,用率的標(biāo)準(zhǔn)誤表示如果總體率未知,用樣本率p估計5標(biāo)準(zhǔn)誤的計算6總體率的可信區(qū)間總體率的可信區(qū)間 (confidence interval of rate):根據(jù)樣本率推算總體率可能所在的范圍1. 查表法:樣本含量較小(如n50),np或n(1-p)510卡方檢驗 檢驗(Chi-square test)是現(xiàn)代統(tǒng)計學(xué)的創(chuàng)始人之一,英國人K . Pearson(1857-1936)于1900年提出的一種具有廣泛用途的統(tǒng)計方法??捎糜趦蓚€或多個率間的比較,計數(shù)資料的關(guān)聯(lián)度分析,擬合優(yōu)度檢驗等。11
3、 檢驗的基本公式121.四格表形式 組別 陽性數(shù) 陰性數(shù) 合計 甲組 a b a+b 乙組 c d c+d 合計 a+c b+d N2.四格表專用公式四格表專用公式13 舉例14連續(xù)性校正公式 檢驗的應(yīng)用條件:當(dāng)n40,T5時,用專用公式當(dāng)n40,而1T5時,用連續(xù)性校正公式當(dāng)n40或T1時,用Fisher精確檢驗(Fisher exact test )校正公式:15配對四格表資料的 檢驗表516 計算公式17H0:b,c來自同一個實驗總體(兩種劑量的毒性無差異)H1:b,c來自不同的實驗總體(兩種劑量的毒性有差別)=0.05。 舉例18行列(RC)表資料的 檢驗 四格表是指只有2行2列的表格
4、,當(dāng)行數(shù)或列 數(shù)超過2時,統(tǒng)稱為行 列表。行列表的 檢驗是對多個樣本率(或構(gòu)成比)的檢驗。 適用條件:表中不宜有1/5以上格子的理論頻數(shù)小于5,或有一個格子的理論頻數(shù)小于1。19兩個(多個)率或構(gòu)成比的比較推斷兩個或多個分類變量是否相關(guān)聯(lián)或相互獨立兩個或多個發(fā)生率或構(gòu)成比是否相同20一致性檢驗與配對卡方檢驗配對設(shè)計包括 同一樣本接受不同處理的比較 配對的兩個受試對象分別給予兩種處理21一致性檢驗與配對卡方檢驗資料為配對資料 結(jié)果是否基本一致 * Kappa 0.75一致性好 * 0.75Kappa0.4一致性一般 * Kappa 0.4一致性較差結(jié)果有無差別:配對卡方檢驗22freq過程功能:
5、描述性統(tǒng)計以及假設(shè)檢驗的功能對分類變量計算頻數(shù)分布,產(chǎn)生頻數(shù)表和列聯(lián)表;對于列聯(lián)表資料(兩個或更多因素),對兩因素間的關(guān)系進(jìn)行統(tǒng)計學(xué)推斷;對于三維表,可作Mentel-Hanszel分層分析。23freq過程表 freq過程的功能卡方檢驗關(guān)聯(lián)性的推斷及其強度測量22表資料危險度計算以及危險度差別的檢驗22表資料OR值以及相對危險度的計算趨勢檢驗一致性檢驗Cochran-Mantel-Haenszel 統(tǒng)計量計算24freq過程的一般格式 25freq過程的一般格式 PROC FREQ; TABLES A;產(chǎn)生變量A的一維頻數(shù)表 PROC FREQ; TABLES A*B;產(chǎn)生A、B兩個變量的列
6、聯(lián)表,*前為行變量,*后為列變量TABLES語句:26freq過程的一般格式 在TABLES語句中用*號連接三個或n個變量名,可得到三維或n維列聯(lián)表,最后一個變量各水平形成表的列,倒數(shù)第二個變量各水平形成表的行,其它變量的每一級水平(或水平組合)形成一層,且每一層都形成分離的列聯(lián)表。如:PROC FREQ; TABLES A*B*C*D;列聯(lián)表的數(shù)量為A、B不同水平的組合數(shù),每個表的上部為D的各水平,左側(cè)為C的各水平。27freq過程的一般格式 表 多表格表達(dá)式示例表達(dá)式等同表達(dá)式tables a*(b c); tables a*b a*c; tables (a b)*(c d); table
7、s a*c b*c a*d b*d; tables (a b c)*d; tables a*d b*d c*d; tables a-c; tables a b c; tables (a-c)*d; tables a*d b*d c*d; 28freq過程的一般格式 TABLES語句中“/” 后面的選項:1、統(tǒng)計分析選項 CHISQ:對每層作 檢驗,包括Pearson 、似然比 和Mantel-Haenszel 。此外還給出與 檢驗有關(guān)的關(guān)聯(lián)指標(biāo)包括Phi系數(shù)、列聯(lián)系數(shù)和Cramers V。對于22表,給出Fisher精確概率。 AGREE:進(jìn)行配對 檢驗。 EXACT :對大于22的列聯(lián)表計算
8、Fisher精確概率。同時也給出CHISQ選項的全部統(tǒng)計量。 29freq過程的一般格式 TABLES語句中“/” 后面的選項: MEASURES :對每層的二維表計算一系列關(guān)聯(lián)指標(biāo)及相應(yīng)的標(biāo)準(zhǔn)誤,包括Pearson和Spearman相關(guān)系數(shù),以及Gamma和Kendall系數(shù)等。對于22表,還給出常用的危險度指標(biāo)及其標(biāo)準(zhǔn)誤。 ALPHAp :給出檢驗水準(zhǔn)。缺省為0.05。30freq過程的一般格式 TABLES語句中“/” 后面的選項: CMH: 給出Cochran-Mantel-Haenszel統(tǒng)計量,可檢驗在調(diào)整了TABLES語句中其它變量后,行變量與列變量之間的關(guān)聯(lián)程度。對于22表,F(xiàn)
9、REQ過程給出相對危險度估計及其可信區(qū)間,還給出各層關(guān)聯(lián)度指標(biāo)是否齊性的Breslow檢驗。 ALL :給出CHISQ、MEASURES、CMH所請求的全部統(tǒng)計量。31freq過程的一般格式 TABLES語句中“/” 后面的選項:2、有關(guān)表格信息選項 EXPECTED: 給出期望頻數(shù) DEVIATION :給出每格的實際頻數(shù)與期望頻數(shù)的差值 CELLCHISQ:給出每格對總c 2的貢獻(xiàn),即計算每格的(實際頻數(shù)-期望頻數(shù))2/期望頻數(shù)。 CUMCOL: 給出累積列百分?jǐn)?shù)32freq過程的一般格式 TABLES語句中“/” 后面的選項:3、禁止輸出選項 NOFREQ:不給出列聯(lián)表中的格頻數(shù) NOP
10、ERCENT:不給出列聯(lián)表中的格百分?jǐn)?shù) NOROW:不給出列聯(lián)表中各格的行百分?jǐn)?shù) NOCOL:不給出列聯(lián)表中各格的列百分?jǐn)?shù) NOCUM:不給出頻數(shù)表的累積頻數(shù)和累積百分?jǐn)?shù) NOPRINT: 不給出表格,但給出CHISQ、MEASURES 或CMH等語句所指定的統(tǒng)計量。33freq過程的一般格式 WEIGHT 語句: 通常每個觀察值提供數(shù)值1給頻數(shù)計數(shù),當(dāng)WEIGHT語句出現(xiàn)時,每個觀察值提供的是該觀察值的加權(quán)變量值。該值必須非負(fù),但可不必為整數(shù)。 只能使用一個WEIGHT語句,且該語句作用于所有的表。34例1:兩獨立樣本率的比較 在研究糖尿病的臨床試驗中,將258名患者隨機分為兩組,一組204
11、人服用鹽酸苯乙雙胍藥,死于心血管病的26人,另一組64人服安慰劑,死于心血管病2人,問兩種藥物心血管病死率有無差別?35表 兩種療法心血管病病死率比較 療法 死亡人數(shù) 生存數(shù) 合計 病死率% 苯乙雙胍 26 178 204 12.75 安慰劑 2 62 64 3.13 合計 28 240 268 10.45問:兩組病死率差別是否是抽樣誤差或是用苯乙雙胍藥物的作用?26 1782 62四格表的數(shù)字組別 + 甲乙36SAS程序Data a1; input treat outcome f; cards; 1 1 178 1 2 26 2 1 62 2 2 2;Proc freq; weight f;
12、 tables treat*outcome/chisq;Run;37SAS結(jié)果3839例2:多個獨立樣本率的比較將做了手術(shù)的761例皮膚黑色瘤患者分為4組。1組:術(shù)后不接受治療2組:術(shù)后接受化療3組:術(shù)后接受免疫療法4組:術(shù)后接受化療和免疫療法問:不同療法患者3年生存率有無差別?40表 黑色素瘤患者隨訪3年生存情況治療組 生存人數(shù) 死亡人數(shù) 合計 生存率% 77 108 185 41.6 89 103 192 46.4 99 104 203 48.8 90 91 181 50.0合計 355 406 761 46.61.假設(shè):H0; 1= 2 = 3= c=355/761=46.6 H1:四組總體生存率不等或不全等 2. =0.05(差別顯著的水準(zhǔn)) 41SAS程序Data a2; do a=1 to 4; do b=1 to 2; input f ; output; end; end;cards; 77 108 89 103 99 104 90 91 ;Proc freq; weight f; tab
溫馨提示
- 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
- 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
- 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
- 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負(fù)責(zé)。
- 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請與我們聯(lián)系,我們立即糾正。
- 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時也不承擔(dān)用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。
最新文檔
- 2025年度房地產(chǎn)項目合作居間合同
- 2025年度異地安置房購置及產(chǎn)權(quán)過戶合同
- 2025年度店鋪裝修工程工期與費用控制合同
- 2025年洗護(hù)項目投資分析及可行性報告
- 數(shù)學(xué)好玩《編碼》(教學(xué)設(shè)計)-2024-2025學(xué)年北師大版數(shù)學(xué)四年級上冊
- 42不等式的基本性質(zhì) 教學(xué)設(shè)計2024-2025學(xué)年湘教版數(shù)學(xué)八年級上冊
- 2025年度知識產(chǎn)權(quán)反擔(dān)保承諾書模板
- 2025年中國NICU呼吸機行業(yè)發(fā)展監(jiān)測及發(fā)展戰(zhàn)略規(guī)劃報告
- 2025年剛玉氮化硅項目可行性研究報告
- 2025年度股權(quán)代持及員工持股計劃合同
- SH∕T 3097-2017 石油化工靜電接地設(shè)計規(guī)范
- 基礎(chǔ)構(gòu)成設(shè)計全套教學(xué)課件
- Python程序設(shè)計基礎(chǔ)PPT(本科)完整全套教學(xué)課件
- (全國通用)三甲人民醫(yī)院診斷證明書請假條模板(廣東佛山)
- 表面工程學(xué)課件-全
- 《XX醫(yī)院安寧療護(hù)建設(shè)實施方案》
- 開學(xué)第一課我們開學(xué)啦主題班會PPT課件(帶內(nèi)容)
- 電源線檢驗報告RVV
- 體育訓(xùn)練隊隊規(guī)
- 八字命理漫畫版
- 電梯工程開工報告(直梯)(共1頁)
評論
0/150
提交評論