方差分析與秩和檢驗(yàn)參考幻燈片_第1頁
方差分析與秩和檢驗(yàn)參考幻燈片_第2頁
方差分析與秩和檢驗(yàn)參考幻燈片_第3頁
方差分析與秩和檢驗(yàn)參考幻燈片_第4頁
方差分析與秩和檢驗(yàn)參考幻燈片_第5頁
已閱讀5頁,還剩70頁未讀, 繼續(xù)免費(fèi)閱讀

下載本文檔

版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請(qǐng)進(jìn)行舉報(bào)或認(rèn)領(lǐng)

文檔簡介

1、1,方差分析與秩和檢驗(yàn),第五講,2,兩兩比較次數(shù) 同類指標(biāo)數(shù)(數(shù)量越多) 亞組分析與期中分析,3,方差分析(analysis of variance) ANOVA基本思想,根據(jù)資料的設(shè)計(jì)類型,即變異的不同來源,將全部觀察值總的離均差平方和以及自由度分解為兩個(gè)或多個(gè)部分,每個(gè)部分的變異與自由度組成均方(MS),均方比值(統(tǒng)計(jì)量)服從F分布,由此做出統(tǒng)計(jì)推斷,從而了解各因素對(duì)觀察指標(biāo)影響有無統(tǒng)計(jì)學(xué)意義。,4,第一部分 方差分析Analysis Of Variance(ANOVA),R Fisher(1890-1962)在20世紀(jì)30年代發(fā)表以F分布為基礎(chǔ)的用于多組計(jì)量資料均數(shù)比較假設(shè)檢驗(yàn)-方差分析

2、,有時(shí)又被稱為變異分析或 F檢驗(yàn)等。,5,R A Fisher, the founder of statistical inference, working on a mechanical calculator,6,Within group variance is large compared to variability between means. Unclear separation of means.,x,y,-4,-3,-2,-1,0,1,2,3,4,7,F統(tǒng)計(jì)量的抽樣分布,8,方差分析的理論基礎(chǔ):F分布,F分布是方差分析的基礎(chǔ),通過F分布確定P值 F分布也是一簇連續(xù)性分布,分布類型

3、與第一、二自由度有關(guān)。 當(dāng)?shù)谝弧⒍杂啥裙潭〞r(shí),F(xiàn)值越大,其對(duì)應(yīng)的P值越??;反之亦然。,9,方差分析的概述,方差分析核心是變異的分解:將所有觀察值之間的變異分解成幾部分,每一部分均反映了特定的內(nèi)容(如某因素的作用、交互作用) 通過變異間的相互比較,并構(gòu)建統(tǒng)計(jì)量F值,基于F分布,計(jì)算P值。 方差分析的用途很廣,按照設(shè)計(jì)類型又可細(xì)為很多亞型。,10,方差分析的主要設(shè)計(jì)類型,成組設(shè)計(jì)(完全隨機(jī)設(shè)計(jì)):單因素多組 配伍設(shè)計(jì):研究因素/配伍因素多組 交叉設(shè)計(jì):多個(gè)因素 析因設(shè)計(jì):兩因素及其交互作用 拉丁方設(shè)計(jì): 正交試驗(yàn)設(shè)計(jì):多因素,多水平。 。,11,方差分析主要用途,推斷兩個(gè)及以上總體均數(shù)有無區(qū)別;

4、 分析兩個(gè)或多個(gè)因素主效應(yīng)及其交互作用 回歸方程的線性假設(shè)檢驗(yàn)。,12,一、成組設(shè)計(jì)資料的方差分析(實(shí)例分析),例1、某醫(yī)院對(duì)31名石棉礦工中的石棉肺患者、可疑患者、非患者進(jìn)行了用力肺活量測(cè)定,結(jié)果見下,問三組石棉礦工的用力肺活量有無差別?,13,表1 三組石棉礦工的用力肺活量 石棉肺患者 可疑患者 非患者 1.8 2.3 2.9 1.4 2.1 3.2 1.5 2.1 2.7 2.1 2.1 2.8 1.9 2.6 2.7 1.7 2.5 3.0 1.8 2.3 3.4 1.9 2.4 3.0 1.8 2.4 3.4 1.8 3.3 2.0 3.5 均數(shù) 1.79 2.31 3.4 2.51

5、(合) 例數(shù) 11 9 11,14,1、成組設(shè)計(jì)方差分析的變異分解,總變異 = 組間變異 + 組內(nèi)變異,(1.79-2.51) + (1.8-1.79) ,(1.8-2.51) = ,15,表1 三組石棉礦工的用力肺活量 石棉肺患者 可疑患者 非患者 1.8 2.3 2.9 1.4 2.1 3.2 1.5 2.1 2.7 2.1 2.1 2.8 1.9 2.6 2.7 1.7 2.5 3.0 1.8 2.3 3.4 1.9 2.4 3.0 1.8 2.4 3.4 1.8 3.3 2.0 3.5 均數(shù) 1.79 2.31 3.4 2.51(合) 例數(shù) 11 9 11 第一組第一例變異(1.8-1

6、.79)+(1.79-2.51),16,總變異,31名礦工的用力肺活量的測(cè)試值大小不等,這種變異稱為總變異。其大小SS總=(Xij -X )2 ,即每個(gè)觀察值與總均數(shù)X 的離均差平均和。,17,組內(nèi)變異,每個(gè)組內(nèi)的個(gè)體測(cè)量值也大小不等,這種變異稱為組內(nèi)變異(SS組內(nèi)),反映了隨機(jī)誤差的大小。 SS組內(nèi)(Xij -Xi )2 ,因SS組內(nèi)與樣本例數(shù)有關(guān),為排除其影響,用組內(nèi)均方代替:組內(nèi)SS組內(nèi)(N-K),18,組間變異,三組間的均數(shù)大小不等,稱為組間變異(SS組間),反映了干預(yù)效應(yīng)與隨機(jī)誤差 SS組間ni(Xi -X )2, 為排除組數(shù)多少的影響,用組間均方代替: 組間SS組間(K)。 變異的

7、分解:SS總SS組間SS組內(nèi) 自由度的分解:總組間組內(nèi),19,組間變異(MS組間) / 組內(nèi)變異(MS組內(nèi))=F 組數(shù)減1為第一自由度,合并例數(shù)減組數(shù)為第二自由度. 根據(jù)F統(tǒng)計(jì)量與一、二自由度確定F分布,計(jì)算P值.,20,2、方差分析過程,變異原因 變異 統(tǒng)計(jì)量,21,22,3、假設(shè)檢驗(yàn)的步驟,建立假設(shè): H0:三組礦工用力肺活量的總體均數(shù)相等, H1:三組礦工用力肺活量的總體均數(shù)不等或不全等 12=3, 1=23, 1= 3 2, 123 =0.05 構(gòu)筑統(tǒng)計(jì)量:F=組間變異/組內(nèi)變異 =組間組內(nèi),23,確定 P 值: 假設(shè)無效假設(shè)成立的情況下,干預(yù)無效應(yīng),即組間與組內(nèi)接近,則值接近于,在附

8、近出現(xiàn)的機(jī)率多,而出現(xiàn)較大值的機(jī)率小,當(dāng)值大到一定界值時(shí),根據(jù)小概率事件原則,就有理由認(rèn)為無效假設(shè)不成立,從而拒絕0,而接受H1。,24,表2 方差分析結(jié)果,變異來源 SS 總 10.8 30 組間 9.266 2 4.633 84.54 0.01 組內(nèi) 1.534 28 0.0548,按照=0.05的水準(zhǔn),拒絕H0,接受H1,可認(rèn)為三組礦工的用力肺活量不同。,25,SPSS分析結(jié)果,26,4、方差分析及兩兩比較,方差分析只能表明三組工人的用力肺活量的總體均數(shù)有差別,還不能說明任何兩組間是否有差別,還需做兩兩比較檢驗(yàn)。 ; ; 兩兩比較:任兩個(gè)均數(shù)比較以及多個(gè)實(shí)驗(yàn)組與一個(gè)對(duì)照組比較兩個(gè)類型。

9、計(jì)算組間比較的均數(shù)差值及95%可信區(qū)間。,27,5、兩兩比較與95%可信區(qū)間,效應(yīng)量及其95%可信區(qū)間,28,5、成組設(shè)計(jì)的方差分析資料特點(diǎn),本例資料為成組設(shè)計(jì)的單因素計(jì)量資料,進(jìn)行多組均數(shù)間比較。,總變異,組間變異,組內(nèi)變異,29,6、方差分析的應(yīng)用條件,各樣本來自正態(tài)總體:中等程度、大樣本 方差齊性:最好是例數(shù)相等,敏感(變量變換、修剪) 各樣本為相互獨(dú)立的隨機(jī)樣本(獨(dú)立性,代表性) 基線均衡性與效應(yīng)可加性,30,二、配伍設(shè)計(jì)多個(gè)樣本均數(shù)比較,31,1、資料特點(diǎn)分析,是配對(duì)設(shè)計(jì)的擴(kuò)展。具體做法是:先按影響試驗(yàn)結(jié)果的非處理因素(如性別、體重、年齡、職業(yè)、病情、病程等)將受試對(duì)象配成區(qū)組(bl

10、ock),再分別將各區(qū)組內(nèi)的受試對(duì)象隨機(jī)分配到各處理或?qū)φ战M。,32,1、資料特點(diǎn)分析,研究因素有兩個(gè): A:藥物因素-不同藥物組的重量是否 有差別? B:個(gè)體變異因素-不同個(gè)體間重量有否差 別? 方差分析變異的分解: SS總SS組間SS配伍 SS組內(nèi) , 總組間配伍 組內(nèi),33,2、變異的分解,總變異,組間變異,組內(nèi)變異,配伍變異,34,3、方差分析過程,建立假設(shè): 假設(shè)1:藥物因素 0:三種藥物作用后的肉瘤重量總體均數(shù)相等, H1:三種藥物作用后肉瘤重量總體均數(shù)不等或不全等 =0.05 假設(shè)2:個(gè)體變異因素 0:5個(gè)區(qū)組重量的總體均數(shù)相等 H1: 5個(gè)區(qū)組重量的均數(shù)不等或不全等 =0.05

11、,35,36,確定P值和做出結(jié)論,以1 =2,2 =8,查F界值表, 得P0.05, 按照=0.05的水準(zhǔn),拒絕0,而接受H1,可認(rèn)為不同藥物的腫瘤重量不同。 以1 =4,2 =8,查F界值表, 得P0.05, 按照=0.05的水準(zhǔn),拒絕0,而接受H1,可認(rèn)為不同區(qū)組的重量不同。,37,兩兩比較及計(jì)算效應(yīng)量的95%可信區(qū)間,藥物因素(不同藥物):兩兩比較的q檢驗(yàn)及其均數(shù)差值的95%可信區(qū)間。,38,兩兩比較及計(jì)算效應(yīng)量的95%可信區(qū)間,個(gè)體變異因素兩兩比較的q檢驗(yàn),以及計(jì)算均數(shù)差值的95%可信區(qū)間。?,39,4、設(shè)計(jì)方案與檢驗(yàn)效能的關(guān)系,成組設(shè)計(jì)與配伍設(shè)計(jì)的區(qū)別在于后者考慮了個(gè)體變異因素,使檢

12、驗(yàn)效能增加。 配伍設(shè)計(jì): 總變異=藥物變異+個(gè)體(配伍)變異+組內(nèi)變異 成組設(shè)計(jì): 總變異=藥物變異+(個(gè)體變異+組內(nèi)變異) 設(shè)計(jì)階段不能控制個(gè)體變異,可以測(cè)量后在分析階段使用協(xié)方差分析。,組內(nèi)變異,40,三、析因設(shè)計(jì)的方差分析,41,表4 家兔神經(jīng)縫合后的軸突通過率(%),比較不同縫合方法及縫合后時(shí)間對(duì)軸突通過率的影響。,42,B因素(時(shí)間2水平) 縫合后1月 縫合后2月,2因素2水平析因試驗(yàn)示意圖,A因素(縫合2水平) 外膜縫合 束膜縫合,組1:24 組2:44 組3:28 組4:52,1. A、B因素主效應(yīng),43,2.交互作用 :當(dāng)某因素的各個(gè)單獨(dú)效應(yīng)隨另一因素變化而變化時(shí),則稱這兩個(gè)因

13、素間存在交互作用(interaction)。,圖2 兩因素交互作用示意圖,44,表5 家兔神經(jīng)縫合后的軸突通過率(%),方差分析,45,表6 析因試驗(yàn)結(jié)果方差分析表,結(jié)論:尚不能認(rèn)為兩種縫合方法對(duì)神經(jīng)軸突通過率有影響;可以認(rèn)為縫合后2月與1月相比,神經(jīng)軸突通過率提高。 鑒于析因設(shè)計(jì)需要樣本量大且組間例數(shù)相等,用于臨床試驗(yàn)不宜實(shí)現(xiàn)。,46,3、變異的分解,總變異,組間變異,組內(nèi)變異,A,B,AB,47,四、交叉試驗(yàn)設(shè)計(jì)的方差分析,48,1、資料特點(diǎn),交叉設(shè)計(jì)能均衡試驗(yàn)順序的影響,同時(shí)把處理效應(yīng)和時(shí)間先后順序的效應(yīng)區(qū)分開。 前后處理間有一洗脫期;適用于慢性并需要長期維持治療的疾病。 總變異可以分成

14、四部分, 即個(gè)體間變異,階段間變異,處理間變異和誤差變異。 SS總SS處理SS階段SS個(gè)體+ SS誤差 , 總處理階段個(gè)體誤差,49,例4 假定有12名高血壓病人,要研究A B兩種治療方案的療效差別.用隨機(jī)的方法讓其6名病人先以A法治療,后用B法治療,另外6名病人先以B法治療,后用A法治療,分別記錄了如下的結(jié)果:,50,表7 12名病人用不同方法治療血壓的下降值,階段 病人的編號(hào) 階段合計(jì) 療法合計(jì) 1 2 3 9 10 11 12 B B A B B B A I 23 10 33 8 17 26 18 240 252 A A B A A A B II 21 11 28 11 14 26 13

15、 216 204 個(gè)體 合計(jì) 44 21 61 19 31 52 31 456 456,51,2、交叉試驗(yàn)變異的分解,總變異,處理間變異,階段間變異,個(gè)體間變異,組內(nèi)變異,52,表8 交叉設(shè)計(jì)方差分析結(jié)果,變異來源 SS MS FP 處理 96 1 96 4.57 0.05 階段 24 1 24 1.14 0.05 個(gè)體 1008 11 91.36 4.36 0.05 誤差 210 10 21 總變異 1338 23 從結(jié)果來看: 只有個(gè)體間的差異有統(tǒng)計(jì)學(xué)意義,不同治療方案,不同階段均無統(tǒng)計(jì)學(xué)意義。,53,六、方差分析的誤用,例5 為觀察764-3(丹參的有效成分)對(duì)低氧性肺動(dòng)脈高壓及右心室肥

16、厚等是否有保護(hù)作用進(jìn)行了如下試驗(yàn): 取180-220G雄性大鼠141只,隨機(jī)分成三組:即正常組,單純低氧組,764-3處理低氧組 每組再分成2個(gè)小組,分別于3天,21天時(shí)處死大鼠,測(cè)量相關(guān)指標(biāo)的數(shù)值。,54,表9 764-3對(duì)低氧所致右心室收縮壓變化的影響,組別 收縮壓(xSE) 3天 21天 對(duì)照 3.060.12 3.020.12 單純低氧 3.370.12* 3.850.12* 764-3+低氧 3.350.15 3.330.09* 注: 原作者采用t檢驗(yàn)分析資料,得:與對(duì)照組比, p0.05,* *P0.01,與單純低氧組比p0.05。 存在的問題?,55,七、方差分析的小結(jié),方差分析

17、的目的是推斷多個(gè)總體均數(shù)間有無差別: 不能檢驗(yàn)?zāi)切┯胁顒e、那些無差別; 不能說明差別的顯著程度;需通過兩兩比較,計(jì)算效應(yīng)量及其95%可信區(qū)間; 兩兩比較不同于多個(gè)t檢驗(yàn)比較.,56,兩兩比較的方法優(yōu)選 事先設(shè)置比較: 檢驗(yàn)水準(zhǔn)校正法 Bonferroni(或Dunns)多重比較過程(次數(shù)較少) 界值擴(kuò)大因子(與比較次數(shù)及自由度有關(guān)) ANOVA后Post hoc兩兩比較 非成對(duì)比較(Scheff過程) 任意兩對(duì)均數(shù)比較(Tukey HSD, SNK) 多組干預(yù)與對(duì)照組比較(Dunnett) 建議不要使用: LSD Duncan,57,58,59,根據(jù)設(shè)計(jì)類型選擇具體方差分析方法. 設(shè)計(jì)方案決定

18、檢驗(yàn)效能的大小 成組設(shè)計(jì); 配伍設(shè)計(jì); 交叉設(shè)計(jì); 析因設(shè)計(jì); 拉丁方設(shè)計(jì); 正交設(shè)計(jì),60,方差分析要求: 基本條件:資料的正態(tài)性、方差齊性、獨(dú)立性 其中對(duì)方差齊性要求最高,采用Levene檢驗(yàn) 若方差不齊,變量變換(四種),否則秩和檢驗(yàn) 額外條件:均衡性、效應(yīng)可加性;,61,考察各組均數(shù)與方差的關(guān)系,變量變換的參考依據(jù),62,第二部分 秩和檢驗(yàn),參數(shù)統(tǒng)計(jì):總體分布類型已知,對(duì)總體參數(shù)進(jìn)行估計(jì)或檢驗(yàn)。 非參數(shù)統(tǒng)計(jì):總體分布類型未知或已知分布類型與其應(yīng)用條件不符,并非是參數(shù)間的比較,而是用于分布間的比較。,63,一、“應(yīng)用條件”,優(yōu):非參數(shù)檢驗(yàn)不受總體分布的限定,且對(duì)等級(jí)資料、不能被準(zhǔn)確測(cè)量的

19、資料、有不確定值的資料等均可進(jìn)行。 劣:與參數(shù)檢驗(yàn)相比,檢驗(yàn)效能降低。 根據(jù)不同的資料特點(diǎn)與設(shè)計(jì)類型選用不同秩和檢驗(yàn)方法。,64,二、秩和檢驗(yàn),配對(duì)設(shè)計(jì)數(shù)值變量資料的秩和檢驗(yàn)(Wilcoxon配對(duì)法,1945) 例6 某研究者對(duì)病人治療前后的生存質(zhì)量進(jìn)行了測(cè)量,資料見下,問病人生存質(zhì)量治療前后有無變化?,65,表8 病人治療前后的生存質(zhì)量評(píng)分,病人編號(hào) 治療前 治療后 評(píng)分差值 秩次 1 7 10 3 +9 2 7 9 2 +6 3 7 7 0 4 6 7 1 +3 5 7 10 3 +9 6 7 6 -1 - 3 7 8 9 1 +3 8 2 6 4 +11 9 9 8 -1 - 3 10

20、6 9 3 +9 11 4 6 2 +7 12 6 6 0 13 6 7 1 +3,66,秩和檢驗(yàn)的基本步驟,建立假設(shè): 0:生存質(zhì)量差值的總體中位數(shù)Md =0 H1:Md 0 =0.05 計(jì)算差值并編秩:依差值的絕對(duì)值從小到大編秩,再根據(jù)差值的正負(fù)給秩次冠以正負(fù)號(hào);差值為0時(shí)不編秩;差值相等符號(hào)相同仍按順序編秩;差值相等符號(hào)不同取平均秩次。 求秩和并確定檢驗(yàn)統(tǒng)計(jì)量:分別計(jì)算正、負(fù)秩次之和,任取其一為T。 確定P值和做出推斷結(jié)論:當(dāng)n50時(shí),超出T界值表范圍,采用正態(tài)近似法。,67,成組設(shè)計(jì)兩樣本比較的秩和檢驗(yàn)(Wilcoxon兩樣本比較法),例7 某實(shí)驗(yàn)室觀察局部溫?zé)嶂委熜∈笠浦残阅[瘤的療效

21、,以生存日數(shù)作為觀察指標(biāo),實(shí)驗(yàn)結(jié)果見下表,試檢驗(yàn)兩組小鼠生存日數(shù)有無差別?,68,表9 兩組小鼠發(fā)癌后生存天數(shù),實(shí)驗(yàn)組 對(duì)照組 生存天數(shù) 秩次 生存天數(shù) 秩次 10 9.5 2 1 12 12.5 3 2 15 15 4 3 15 16 5 4 16 17 6 5 17 18 7 6 18 19 8 7 20 20 9 8 23 21 10 9.5 90以上 22 11 11 12 12.5 13 14,69,資料特點(diǎn)與基本步驟,兩組比較成組設(shè)計(jì)資料,存在截尾值。 基本步驟: 1:建立假設(shè):0:兩組小鼠生存天數(shù)總體分布相同 H1: 兩組小鼠生存天數(shù)總體分布不同 =0.05 2:編秩及計(jì)算秩和: 將兩組數(shù)據(jù)由小到大統(tǒng)一編秩。原始數(shù)據(jù)相同時(shí),若相同數(shù)據(jù)在同一組按順序編秩;若相同數(shù)據(jù)在不同組時(shí),取平均秩次。當(dāng)兩組樣本例數(shù)不等時(shí),以樣本例數(shù)較小者的秩和為T;當(dāng)例數(shù)相等時(shí),任取其中一個(gè)秩和為T。 3:確定P值和做出推斷結(jié)論: 當(dāng)n111,n2-n111時(shí),查T界值表,T分布同上;當(dāng)樣本量較大超出T界值表范圍時(shí),采用正態(tài)近似法。,70,多組比較的秩和檢驗(yàn),1、多組成組設(shè)計(jì)的秩和檢驗(yàn)及兩兩比較 Kruskal-Wallis檢驗(yàn) 兩兩比較采用Wilcoxon兩組比較秩和檢驗(yàn)+ 2、配伍設(shè)計(jì)的秩和檢驗(yàn)及兩兩比較 Friedman秩

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請(qǐng)下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請(qǐng)聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會(huì)有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫網(wǎng)僅提供信息存儲(chǔ)空間,僅對(duì)用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對(duì)用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對(duì)任何下載內(nèi)容負(fù)責(zé)。
  • 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請(qǐng)與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶因使用這些下載資源對(duì)自己和他人造成任何形式的傷害或損失。

評(píng)論

0/150

提交評(píng)論