常見統(tǒng)計學(xué)錯誤_第1頁
常見統(tǒng)計學(xué)錯誤_第2頁
常見統(tǒng)計學(xué)錯誤_第3頁
常見統(tǒng)計學(xué)錯誤_第4頁
常見統(tǒng)計學(xué)錯誤_第5頁
已閱讀5頁,還剩26頁未讀, 繼續(xù)免費閱讀

下載本文檔

版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進行舉報或認(rèn)領(lǐng)

文檔簡介

常見統(tǒng)計學(xué)錯誤第1頁,共31頁,2023年,2月20日,星期一1.隨機區(qū)組設(shè)計不可用成組分析方法例1有5件標(biāo)本I,II,III,IV,V,每一件均勻分成4份,隨機分配給4種處理A,B,C,D,得下表資料,試比較處理間的差別。不恰當(dāng)做法:視縱向4列為4組數(shù)據(jù),進行4組間比較。第2頁,共31頁,2023年,2月20日,星期一多次t檢驗?!

分別作兩組比較的t檢驗,得認(rèn)為:A與B,A與C,A與D差異具有統(tǒng)計學(xué)意義;

B與C,B與D,C與D差異無統(tǒng)計學(xué)意義。第3頁,共31頁,2023年,2月20日,星期一單因素方差分析?!

同時比較A,B,C,D四個處理組均數(shù)間的差異,得F=0.55,P=0.59認(rèn)為:四個處理組均數(shù)的差異無統(tǒng)計學(xué)意義。第4頁,共31頁,2023年,2月20日,星期一為什麼不對?

(1)辜負(fù)了設(shè)計的苦心——隨機區(qū)組設(shè)計!*同一件標(biāo)本為一個區(qū)組;*同一區(qū)組內(nèi)4種處理有較好的可比性。無視區(qū)組的存在,組內(nèi)個體間變異較大,識別差異的能力大大降低。(2)不能翻來覆去比較!*6次t檢驗會增大第一類錯誤!設(shè)每次t檢驗犯第一類錯誤的概率為0.05,則6次t檢驗中一次不錯的概率=(1-0.05)6

第一類錯誤的概率

=至少一次出錯的概率=1-(1-0.05)6=0.27第5頁,共31頁,2023年,2月20日,星期一正確作法:隨機區(qū)組資料的方差分析將處理間的差別與扣除區(qū)組間變異后的隨機誤差進行比較,識別差異的能力大大提高。

本例,處理組間F=8.23,P=0.003差別有統(tǒng)計學(xué)意義區(qū)組間F=1.21,P=0.36差別無統(tǒng)計學(xué)意義第6頁,共31頁,2023年,2月20日,星期一2.析因設(shè)計不能用單因素方差分析例2

收集甲狀腺術(shù)中正常甲狀腺組織做成16份標(biāo)本,按析因設(shè)計隨機分為四個處理組。將處理后的標(biāo)本分別行免疫組化染色,作單位面積HLA-Ⅱ抗原陽性細胞計數(shù)。試分析如下數(shù)據(jù):第1組(經(jīng)95%空氣和5%CO2培養(yǎng)7天):2.5,2.4,2.6,2.5第2組(經(jīng)95%空氣和5%CO2培養(yǎng)14天):1.8,1.9,1.7,1.8第3組(經(jīng)95%O2和5%CO2培養(yǎng)7天):2.2,2.3,2.1,2.2第4組(經(jīng)95%O2和5%CO2培養(yǎng)14天):1.9,1.8,1.7,1.9第7頁,共31頁,2023年,2月20日,星期一單因素方差分析?!

直接比較四組資料間的差別F=60.00,P=0.00認(rèn)為:四組間差別具有統(tǒng)計學(xué)意義表2析因設(shè)計下的實驗結(jié)果(均數(shù))第8頁,共31頁,2023年,2月20日,星期一這是典型的兩因素2水平的析因設(shè)計!i)有負(fù)初衷——分析各因素的效應(yīng)!ii)直接比較四組資料,組間變異大,不敏感!為什麼不對?第9頁,共31頁,2023年,2月20日,星期一正確作法:析因設(shè)計的方差分析i)主效應(yīng):某一因素各水平間的平均差別。A因素的主效應(yīng)=[(第三組均數(shù)+第四組均數(shù))(第一組均數(shù)+第二組均數(shù))]/2=[(2.2+1.9)(2.5+1.8)]/2=0.1ii)交互效應(yīng):若某因素的單獨效應(yīng)隨另一因素水平的變化而有較大變化,則稱這兩個因素間存在交互效應(yīng)。AB的交互效應(yīng)

=[(第四組均數(shù)第二組均數(shù))(第三組均數(shù)第一組均數(shù))]/2=[(1.9-1.8)-(2.2-2.5)]/2=0.2第10頁,共31頁,2023年,2月20日,星期一檢驗iii)A的主效應(yīng):F=1.37,P=0.26;B的主效應(yīng):F=47.13,P=0.00A與B的交互效應(yīng):F=0.03,P=0.87

結(jié)論:B因素(培養(yǎng)天數(shù))的效應(yīng)具有統(tǒng)計學(xué)意義。第11頁,共31頁,2023年,2月20日,星期一檢驗

A的主效應(yīng):F=1.37,P=0.26;B的主效應(yīng):F=47.13,P=0.00A與B的交互效應(yīng):F=0.03,P=0.87

結(jié)論:B因素(培養(yǎng)天數(shù))的效應(yīng)具有統(tǒng)計學(xué)意義。第12頁,共31頁,2023年,2月20日,星期一3.劑量-反應(yīng)關(guān)系

不能用單因素方差分析例3有人分析蛇毒因子(CVF)的劑量對血液白細胞噬菌率的影響,得表3的數(shù)據(jù),欲討論劑量-反應(yīng)關(guān)系。第13頁,共31頁,2023年,2月20日,星期一i)單因素方差分析?!F=0.701,P>0.5,

均數(shù)間差別無統(tǒng)計學(xué)意義

為什麼不對?有負(fù)初衷——探討反應(yīng)隨劑量變化的趨勢*由多個劑量組的比較只能得知均數(shù)間是否有差異*有差異不等于有劑量反應(yīng)關(guān)系第14頁,共31頁,2023年,2月20日,星期一均數(shù)關(guān)于log(劑量)的回歸分析?!

為什麼不對?均數(shù)做因變量造成假象!*回歸方程是否有統(tǒng)計學(xué)意義與反應(yīng)的變異狀況有關(guān)*以諸個體反應(yīng)值的均數(shù)作回歸計算,掩蓋變異性,造成假象回歸方程:Y=61.786-6.886log(劑量)決定系數(shù):R2=0.914。第15頁,共31頁,2023年,2月20日,星期一正確作法:用個體資料作回歸分析回歸方程:Y=61.782-6.884log(劑量)決定系數(shù):R2=0.095?;貧w方程無統(tǒng)計學(xué)意義,無劑量反應(yīng)關(guān)系!若反應(yīng)和劑量間散點圖呈曲線狀,劑量可作適當(dāng)變換。第16頁,共31頁,2023年,2月20日,星期一4.重復(fù)測量資料不能逐個時間點兩組比較例4為研究某食物對血清膽固醇濃度的影響,各取7只兔子,分別以正常食物和待研究食物喂養(yǎng),在實驗前、喂養(yǎng)5周、10周后,各取血測量其中膽固醇濃度,其自然對數(shù)轉(zhuǎn)換后的數(shù)據(jù)見表22.1,問血清膽固醇濃度隨時間變化的趨勢是否受該食物的影響。第17頁,共31頁,2023年,2月20日,星期一例5某藥物有新、舊兩種劑型。為了比較這兩種劑型的代謝情況,對16例某病患者服藥后0、4、8、12小時的血藥濃度作了測量,問該藥新舊兩種劑型的血藥濃度-時間曲線的差別是否具有統(tǒng)計學(xué)意義。

第18頁,共31頁,2023年,2月20日,星期一第19頁,共31頁,2023年,2月20日,星期一

常見的不妥

i)對每個時間點,分別計算均數(shù)、標(biāo)準(zhǔn)差;將各時間點測量值的均值用線連接,標(biāo)出“誤差”線ii)在各時間點做t檢驗或Mann-WhitneyU檢驗第20頁,共31頁,2023年,2月20日,星期一為什麼不對?(1)連接各時間點測量值均數(shù)的方法將掩蓋個體曲線位置和形狀的特點;(2)各均數(shù)所對應(yīng)的點連起來形成的曲線形狀可能與諸個體的曲線形狀毫不相干;(3)各時間點相應(yīng)的標(biāo)準(zhǔn)差是一種誤導(dǎo);(4)上述方法無法體現(xiàn)不同時間點的數(shù)據(jù)來自同一個體,而每一個體的多次重復(fù)測量值間具有相關(guān)性。(關(guān)鍵所在)第21頁,共31頁,2023年,2月20日,星期一正確做法:1)綜合指標(biāo)法(summarymeasuresapproach)或派生變量法(derivedvariableapproach)采用少數(shù)獨立的綜合指標(biāo)來概括每個個體多個時間點的測量值;用單變量方法比較各組的差異第22頁,共31頁,2023年,2月20日,星期一綜合指標(biāo)第23頁,共31頁,2023年,2月20日,星期一2)重復(fù)測量資料的方差分析

先做“球形檢驗”不同時間點上數(shù)據(jù)之間沒有相關(guān)性?任何兩個時間點之間的相關(guān)性都一樣?重復(fù)測量資料的方差分析!

例6對表4資料進行單變量方差分析。處理因素(group):F=31.69,P=0.0001

測量時間(time):F=11.93,P=0.0003

時間與處理交互效應(yīng)項(time×group):

F=10.57,P=0.0005結(jié)果:食物對家兔血清膽固醇有影響;家兔血清膽固醇濃度隨時間變化;所研究的食物對血清膽固醇濃度隨時間變化的趨勢也有影響。第24頁,共31頁,2023年,2月20日,星期一5.多維列聯(lián)表資料不可反復(fù)做檢驗例7某地區(qū)呼吸系統(tǒng)疾病的患病率較高,有人懷疑與當(dāng)?shù)厥覂?nèi)點香的習(xí)慣有關(guān),經(jīng)抽樣調(diào)查,得數(shù)據(jù)如下第25頁,共31頁,2023年,2月20日,星期一合并后作檢驗?!

第26頁,共31頁,2023年,2月20日,星期一為什麼不對?i)點香與不點香者患病率不可比!年齡組合并掩蓋了:

點香(B1)與不點香(B2)者年齡結(jié)構(gòu)不同ii)不同年齡組患病率不可比!點香與不點香者合并掩蓋了:

不同年齡組中點香與不點香者比例的不同第27頁,共31頁,2023年,2月20日,星期一正確作法:對數(shù)線性模型或logistic回歸i)對數(shù)線性模型平等地討論A,B,C三因素對各格子中頻數(shù)的影響僅當(dāng)其他變量的影響與某變量無關(guān)時,才可通過合并消除該變量ii)logistic回歸

反應(yīng)變量:患病與否,解釋變量:點香和年齡交互效應(yīng):點香×年齡第28頁,共31頁,2023年,2月20日,星期一小結(jié)設(shè)計類型和變量類別決定分析方法:1.隨機區(qū)組設(shè)計不能用成組分析方法不能用t檢驗或單因素方差分析要用隨機區(qū)組設(shè)計資料的方差分析2.析因設(shè)計不能用單因素方差分析要用析因設(shè)計資料的方差分析第29頁,共31頁,2023年,2月20日,星期一3.

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負(fù)責(zé)。
  • 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時也不承擔(dān)用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

評論

0/150

提交評論