RXC表資料統(tǒng)計分析與錯誤辨析_第1頁
RXC表資料統(tǒng)計分析與錯誤辨析_第2頁
RXC表資料統(tǒng)計分析與錯誤辨析_第3頁
RXC表資料統(tǒng)計分析與錯誤辨析_第4頁
RXC表資料統(tǒng)計分析與錯誤辨析_第5頁
已閱讀5頁,還剩67頁未讀, 繼續(xù)免費(fèi)閱讀

下載本文檔

版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進(jìn)行舉報或認(rèn)領(lǐng)

文檔簡介

1、統(tǒng)計學(xué)培訓(xùn)班,RC表資料的統(tǒng)計分析與錯誤辨析 胡良平 軍事醫(yī)學(xué)科學(xué) 生物醫(yī)學(xué)統(tǒng)計咨詢中心,第一類:22表 ,四型,(一)橫斷面研究設(shè)計22表; (二)隊列研究設(shè)計22表; (三)病例-對照研究設(shè)計22表; (四)配對研究設(shè)計22表。,RC表的分類、分型 以及統(tǒng)計分析方法的合理選擇,第二類:RC表,四型,(一)雙向無序列聯(lián)表; (二)單向有序列聯(lián)表; (三)雙向有序且屬性不同的列聯(lián)表; (四)雙向有序且屬性相同的列聯(lián)表。,第三類:高維表,三型,(一)結(jié)果變量為“二值變量” 的高維表; (二)結(jié)果變量為“多值有序變量”的高維表; (三)結(jié)果變量為“多值名義變量”的高維表。,列聯(lián)表分類,第一部分:R

2、C表的四型,1、雙向無序列聯(lián)表; 2、結(jié)果變量為有序變量的單向 有序列聯(lián)表; 3、雙向有序且屬性不同的列聯(lián) 表; 4、雙向有序且屬性相同的列聯(lián) 表。,1型資料舉例1 (雙向無序RC表),例1計算方法 (雙向無序RC表),因表中小于5的理論頻數(shù)沒有或很少,故這樣的雙向無序列聯(lián)表資料可以用一般的卡方檢驗來處理。,1型資料舉例2 (雙向無序RC表),例2計算方法 (雙向無序RC表),因表中小于5的理論頻數(shù)超過了總格子數(shù)的1/5,故這樣的雙向無序列聯(lián)表資料應(yīng)選用Fisher的精確檢驗來處理。 理論頻數(shù)=(行合計)(列合計)/N,2型資料舉例 (單向有序RC表),例3計算方法 (結(jié)果變量為有序變量的單向

3、有序RC表),(1)秩和檢驗; (2)Ridit分析; (3)有序變量的Logistic 回歸分析。 (關(guān)鍵是對結(jié)果變量打分計算),3型資料舉例 (雙向有序且屬性不同RC表),3型資料計算方法 (雙向有序且屬性不同RC表),雙向有序且屬性不同的二維列聯(lián)表有四個分析目的: 其一、檢驗各組結(jié)果之間的差別; 其二、研究兩有序變量之間的相關(guān)性; 其三、研究兩有序變量之間是否呈直線 關(guān)系; 其四、各行(或列)頻數(shù)分布是否相同。,3型資料計算方法 (雙向有序且屬性不同RC表),其一、檢驗各組結(jié)果之間的差別; 用秩和檢驗等方法處理資料; 其二、研究兩有序變量之間的相關(guān)性; 用Spearman秩相關(guān)分析處理資

4、料; 其三、研究兩有序變量之間是否呈直線關(guān)系; 用線性趨勢檢驗處理資料; 其四、各行(或列)頻數(shù)分布是否相同; 用卡方檢驗或Fisher精確檢驗處理資料。,4型資料舉例 (雙向有序且屬性相同RC表),4型資料計算方法 (雙向有序且屬性相同RC表),雙向有序且屬性不同的二維列聯(lián)表有一個分析目的:即兩種檢測方法檢測的結(jié)果是否一致。 可選用的統(tǒng)計分析方法為: (1)Kappa檢驗(或稱為一致性檢驗); (2)特殊模型分析(復(fù)雜,少用),第二部分,RC表資料統(tǒng)計分析常見錯誤的辨析與釋疑,1、對單向有序資料未進(jìn)行 統(tǒng)計分析直接得出結(jié)論,兩種術(shù)式治療單側(cè)聲帶麻痹的比較,原作者對23例喉支架術(shù)(9例)及喉神

5、經(jīng)再支配術(shù)(14例)的患者手術(shù)前及手術(shù)后進(jìn)行了比較觀察,各術(shù)式聲音評估情況見表1:,對差錯的辨析 原作者未對資料進(jìn)行統(tǒng)計分析就直接得出結(jié)論,顯然是錯誤的,本資料應(yīng)屬于結(jié)果變量為有序變量的單向有序列聯(lián)表資料,原表設(shè)計不利于進(jìn)行相應(yīng)的統(tǒng)計分析,先把上表修改如下:,兩種手術(shù)方法術(shù)前聲音評估情況(修改表),釋疑 在保證兩組之間重要的非處理因素均衡的前提下,適當(dāng)增大樣本含量,并采用適合于分析單向有序列聯(lián)表資料的秩和檢驗或Ridit分析,作出專業(yè)結(jié)論。,釋疑 嚴(yán)格地說,若兩組患者均在各時間點被重復(fù)測量了療效(有序變量),應(yīng)按具有重復(fù)測量設(shè)計定性資料的方式整理和分析資料。,2、雙向有序且屬性相同資料未進(jìn)行統(tǒng)

6、計分析直接得出結(jié)論,240喉癌MRI分期評價,原作者目的預(yù)評價MRI在喉癌術(shù)前T分期中的價值。采用方法為:對59例喉癌的MRI資料進(jìn)行回顧性分期,并與纖維喉鏡及手術(shù)病理對照。結(jié)果見下表:,附表 各期喉癌MRI和 纖維喉鏡分期結(jié)果,總準(zhǔn)確率:MRI:92%(54/59);纖維喉鏡:73%(43/59);P0.01 結(jié)論 MRI能準(zhǔn)確判斷會厭前間隙(PES)、喉旁間隙(PGS)浸潤及軟骨破壞,因而可顯著提高喉癌術(shù)前分期的準(zhǔn)確性,對臨床治療方案選擇具有重要意義。,對差錯的辨析 采用兩種分析方法分別測定同一人群,測定結(jié)果都分為正確、未確定、錯誤,從資料類型看,應(yīng)屬于雙向有序且屬性相同的列聯(lián)表資料,原作

7、者未經(jīng)相應(yīng)的統(tǒng)計分析直接得出結(jié)論,顯然是不合適的。為便于作統(tǒng)計分析先把上表修改如下:,各期喉癌MRI和纖維喉鏡分期結(jié)果(修改表),釋疑 原作者真正的目的是想分析這兩種檢測方法的檢測結(jié)果之間是否具有一致性,因而應(yīng)選用與之相應(yīng)的一致性檢驗,即kappa 檢驗。,3、誤用卡方檢驗處理 單向有序列聯(lián)表資料,溶菌酶和乳鐵蛋白在慢性鼻竇炎鉤突粘膜中的表達(dá),采用免疫組化ABC法,檢測溶菌酶(LZ)和乳鐵蛋白(LF)在17側(cè)健康和70側(cè)慢性鼻竇炎患者(分為單純炎癥組和合并鼻息肉組)鉤突粘膜中的表達(dá)情況。分別得到以下兩表和結(jié)論:,從資料類型上看,需要進(jìn)行秩和檢驗或Ridit分析,其實再看一看每一時期兩組的樣本含

8、量,就會發(fā)現(xiàn)樣本含量太小,每組分為四個療效級別而例數(shù)只有9例和14例,即使兩組間療效真正存在差別,也可能由于樣本例數(shù)太小,無法提供充足的信息而不能得出差異具有統(tǒng)計學(xué)意義的結(jié)論來。,表1 溶菌酶在各組鉤突 粘膜中的表達(dá)狀況,表2 乳褐質(zhì)在各組鉤突 粘膜中的表達(dá)狀況,原作者的分析方法:卡方檢驗。結(jié)果 LZ在單純炎癥組鉤突粘膜杯狀細(xì)胞中表達(dá)較健康對照組加強(qiáng)(P0.05) 。,表3 上頜竇鱗癌病理分級與RAS、 P53及PCNA的表達(dá)關(guān)系,結(jié)論:RAS基因表達(dá)與上頜竇鱗癌病理分級有關(guān),多見于高分化鱗癌中(卡方檢驗P=0.02); P53基因表達(dá)與上頜竇鱗癌病理分級無關(guān)(P0.05)。,對差錯的辨析 由

9、上表可以看出:原因變量(病理分級)的三個水平之間具有一定的順序,是一個有序變量。而基因ras(或p53)的表達(dá)與否只有兩個水平,相當(dāng)于陰性(0)和陽性(1),可以看成是順序的一種特例。,因而可將其視為雙向有序的列聯(lián)表資料。原作者對其進(jìn)行一般的2檢驗,只能得出不同病理分級的上頜竇鱗癌之間的ras(或p53)基因表達(dá)率差異是否具有統(tǒng)計學(xué)意義。并不能說明原作者的實驗?zāi)康?,即上頜竇鱗癌病理分級與ras(或p53)基因表達(dá)率之間有相關(guān)關(guān)系(需要用Spearman秩相關(guān)分析)。,釋疑 應(yīng)根據(jù)作者實驗?zāi)康牟捎眠m合此資料的Spearman秩相關(guān)分析法。 變換原表如下: 表1上頜竇鱗癌病理分級與RAS、P53基

10、因表達(dá)關(guān)系,程序運(yùn)行結(jié)果: ras基因表達(dá)與否與病理分級之間的相關(guān)性分析: rs=0.41822,P=0.00720.05。 故可以認(rèn)為P53基因表達(dá)與否與上頜竇鱗癌病理分級之間的相關(guān)性無統(tǒng)計學(xué)意義。,5、列表與分析所用的資料詳略不同,誤用Ridit分析處理四格表資料 本題資料來源同錯誤一: 原作者在研究RAS蛋白在上頜竇鱗癌與內(nèi)翻性乳頭狀瘤中表達(dá)差異時得實驗結(jié)果見下表:,表1ras蛋白在上頜竇鱗癌及內(nèi)翻性乳頭狀瘤中的表達(dá),原作者得出結(jié)論:ras蛋白表達(dá)陽性率及強(qiáng)度在上頜竇鱗癌與乳頭狀瘤間差異無顯著性(Ridit檢驗,P0.05)。,對差錯的辨析 該資料的分組變量是一個名義變量,而結(jié)果變量(即

11、表達(dá)強(qiáng)度)是一個具有四個等級的有序變量,所以該資料是一個“結(jié)果變量為有序變量的單向有序的2X4列聯(lián)表資料”,用Ridit 分析適宜。但是原作者在分析兩組表達(dá)陽性率時,就不應(yīng)該使用Ridit分析了。,因為ras蛋白的表達(dá)與否是一個具有兩個水平的無序變量,這時的資料類型為一般的四格表資料。而Ridit分析是處理結(jié)果變量為有序變量的單向有序列聯(lián)表資料的統(tǒng)計分析方法,不適用于一般的四格表資料。,釋疑 要研究ras蛋白表達(dá)陽性率在上頜竇鱗癌與乳頭狀瘤間差異有無統(tǒng)計學(xué)意義,應(yīng)該采用適合一般四格表資料的統(tǒng)計分析方法。 如果總頻數(shù)n40,沒有小于5的理論頻數(shù),就可以使用一般2檢驗。,經(jīng)檢查:n=6040,最小

12、理論頻Tc=20X25/60=8.33335, 可以用一般的2檢驗: 2=0.034290.05。 重新編制表如下:,故可以得出專業(yè)結(jié)論: ras蛋白的陽性表達(dá)率在上頜竇鱗癌與內(nèi)翻性乳頭狀瘤之間的差異無統(tǒng)計學(xué)意義。,6、表格制作不規(guī)范,不便于進(jìn)行卡方檢驗 例1聲門上型喉癌頸淋巴結(jié)隱匿性轉(zhuǎn)移一 文中,有如下表格: 喉癌分化程度與頸淋巴結(jié)隱匿性轉(zhuǎn)移 分化程度 例 數(shù) 轉(zhuǎn)移例數(shù) 轉(zhuǎn)移率(%) 高分化 27 9 33.0 中分化 40 14 35.0 低分化 33 15 45.0,表1 喉癌分級與隱匿型轉(zhuǎn)移 分級 例數(shù) 轉(zhuǎn)移例數(shù) 轉(zhuǎn)移率(%) t1 6 2 33.0 t2 31 8 25.0 t3 3

13、8 18 47.0 t4 25 10 40.0,表格編制欠合理,誤用 統(tǒng)計計算方法不易及時發(fā)現(xiàn),表2 喉癌分級與隱匿型轉(zhuǎn)移 分級 未轉(zhuǎn)移例數(shù) 轉(zhuǎn)移例數(shù) 合計 t1 4 2 6 t2 23 8 31 t3 20 18 38 t4 15 10 25 合計 62 38 100,表1的修改結(jié)果,對差錯的辨析 該表中小于5的理論頻數(shù)的個數(shù)超過了總格子數(shù)的1/5,故不適合用一般的卡方檢驗處理此資料。,釋疑 由兩張表格前后對比可見:表2中38*6/1005 、62*6/1005,故此表資料不適合用一般卡方檢驗處理。原作者由于表格編制不規(guī)范而誤用計算方法還不知道,并且還將合計數(shù)誤當(dāng)作轉(zhuǎn)移例數(shù)帶入公式計算,導(dǎo)致

14、計算錯誤,此題應(yīng)進(jìn)行Fisher精確檢驗。,7、濫用生存率且以率代替假設(shè)檢驗 鼻腔鼻竇軟組織肉瘤47例分析一 文中,有如下結(jié)論:橫紋肌肉瘤3年生存率4/6(66.7%),5年生存率3/5(60.0%);纖維肉瘤3年生存率4/5 (80.0 %),5年生存率1/4(25.0%);脂肪肉瘤3年生存率2/4(50.0%),5年生存率1/3(33.3%);其他3年生存率2/5(40.0%),5年生存率0%。,對差錯的辨析與釋疑 此題中各種肉瘤例數(shù)太少,只能用絕對例數(shù)表示有關(guān)結(jié)果,不適合求生存率。原作者只憑幾例病例即得出各種肉瘤患者的生存質(zhì)量,屬于濫用相對數(shù)。,釋疑 宜用表格列出各種肉瘤患者的生存人數(shù)、

15、死亡人數(shù),不計算生存率。,8、用t檢驗處理定性資料(結(jié)果變量為有序變量的二維列聯(lián)表資料) 原文題目:分泌性中耳炎免疫球蛋白檢測和抗原變態(tài)反應(yīng),實驗選取了32例分泌性中耳炎患者,治療前對32例鼓室穿刺抽出液和治療前、治療后3個月采取外周血,測IgA、IgM、IgG,隨機(jī)將32例患者分為兩組,實驗組18人、對照組14人.,治療方法:實驗組為強(qiáng)的松+4000U的-糜蛋白酶混合液,每周注射1次共2次,每日口服酮替分1mg,連續(xù)1月,口服諾氟沙星2.0g連續(xù)1周,3%的麻黃素滴鼻;對照組為僅注射糜蛋白酶,劑量和時間同治療組,每日口服諾氟沙星2.0g連續(xù)1周,3%的麻黃素滴鼻。,原作者得出的結(jié)果之一:32

16、例患者均完成隨訪,治療3個月后,治療組有效6例,痊愈12例,對照組無效3例,有效4例,痊愈7例。經(jīng)t檢驗(t=2.367,P0.05),兩組間差異有顯著性。,對差錯的辨析 根據(jù)原文資料描述將數(shù)據(jù)列表如下: 例 數(shù) 組別 療效: 痊愈 有效 無效 合計 治療 12 6 0 18 對照 7 4 3 14,療效:“痊愈、有效、無效”是一個有序的結(jié)果變量,而且觀察結(jié)果為例數(shù)。從表中可看出,這是一個結(jié)果變量為單向有序的二維列聯(lián)表資料,原作者采用分析定量資料的t檢驗,顯然是錯誤的。,釋疑 此資料適合選用結(jié)果變量為有序變量的單向有序列聯(lián)表資料的統(tǒng)計分析方法:秩和檢驗或Ridit分析。這里用秩和檢驗,檢驗結(jié)果

17、為:H=339312,查2表,得Hc 20.05=3.84,接受H0,拒絕H1。結(jié)論:治療組與對照組療效之間的差別無統(tǒng)計學(xué)意義,與原作者的結(jié)論相反。,例11:我“會用”秩和檢驗啦!,表3 CAM-1和CD44s的表達(dá)與食管癌TNM分期的關(guān)系 - 分期 n X/n H P - a 7 3/7 b 10 8/10 6.1191 0.0134 23 21/23 -,(例11)續(xù),表3 CAM-1和CD44s的表達(dá)與食管癌TNM分期的關(guān)系 - 分期 陽性數(shù) 陰性數(shù) 合計 - a 3 4 7 b 8 2 10 21 2 23 -,正確列表格式,有1/2格內(nèi)理論頻數(shù)小于5, 故宜選用Fisher的精確檢驗。,例12:用卡方檢驗實現(xiàn) 定性資料的相關(guān)分析,年齡 例數(shù) ! (歲) X:+ + + 20 215 67 8 30 9 89 131 40 248 168 4 2=503.776,P0.0001 結(jié)論:年齡與指標(biāo)X的取值間有直線相關(guān)關(guān)系。(對嗎?),分析與釋疑,分析上面的資料前,應(yīng)先叫出列聯(lián)表的正確名稱,然后

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負(fù)責(zé)。
  • 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時也不承擔(dān)用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

評論

0/150

提交評論