版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請(qǐng)進(jìn)行舉報(bào)或認(rèn)領(lǐng)
文檔簡介
1、兩變量的關(guān)聯(lián)性分析第1頁,共59頁,2022年,5月20日,2點(diǎn)33分,星期日統(tǒng)計(jì)方法回顧第2頁,共59頁,2022年,5月20日,2點(diǎn)33分,星期日身高凝血酶濃度t 檢驗(yàn) 兩個(gè)總體均數(shù)相等方差分析 多個(gè)總體均數(shù)相等上網(wǎng)時(shí)間滿意度嬰兒腹瀉ABO血型研究目的:組間比較 秩和檢驗(yàn) 兩個(gè)(多個(gè))總體中位數(shù)相等 檢驗(yàn),確切概率法 兩個(gè)(多個(gè))總體概率分布相同第3頁,共59頁,2022年,5月20日,2點(diǎn)33分,星期日研究目的:兩隨機(jī)變量間的關(guān)系上網(wǎng)時(shí)間和考試分?jǐn)?shù)的關(guān)系收入和生活滿意度的關(guān)系嬰兒腹瀉和嬰兒喂養(yǎng)方式的關(guān)系A(chǔ)BO血型和MN血型的關(guān)系線性相關(guān)(雙變量正態(tài)分布資料) 秩相關(guān) (偏峰分布、分布未知
2、、等級(jí)資料)分類變量的關(guān)聯(lián)性分析(二分類和無序多分類資料)身高和體重的關(guān)系凝血酶濃度和凝血時(shí)間的關(guān)系第4頁,共59頁,2022年,5月20日,2點(diǎn)33分,星期日 線性相關(guān)(linear Correlation) 秩相關(guān)(rank correlation) 分類變量的關(guān)聯(lián)性分析 outline第5頁,共59頁,2022年,5月20日,2點(diǎn)33分,星期日 線性相關(guān) (linear Correlation)Karl Pearson 1857-1936Sir Francis Galton 1822-1911第6頁,共59頁,2022年,5月20日,2點(diǎn)33分,星期日線性相關(guān) 研究兩個(gè)隨機(jī)變量間有無直線
3、相關(guān)關(guān)系,相關(guān)的方向及密切程度。 條件:雙變量正態(tài)分布散點(diǎn)圖相關(guān)系數(shù)第7頁,共59頁,2022年,5月20日,2點(diǎn)33分,星期日XY正相關(guān)(Positive Correlation)第8頁,共59頁,2022年,5月20日,2點(diǎn)33分,星期日XY負(fù)相關(guān)(Negative Correlation) 第9頁,共59頁,2022年,5月20日,2點(diǎn)33分,星期日XY非線性相關(guān)第10頁,共59頁,2022年,5月20日,2點(diǎn)33分,星期日XY零相關(guān)(zero Correlation)第11頁,共59頁,2022年,5月20日,2點(diǎn)33分,星期日線性相關(guān)系數(shù)Pearson積差相關(guān)系數(shù) 描述兩個(gè)變量間相關(guān)
4、關(guān)系的密切程度與相關(guān)方向的指標(biāo)。 r: 樣本相關(guān)系數(shù) :總體相關(guān)系數(shù)第12頁,共59頁,2022年,5月20日,2點(diǎn)33分,星期日線性相關(guān)系數(shù)第13頁,共59頁,2022年,5月20日,2點(diǎn)33分,星期日第14頁,共59頁,2022年,5月20日,2點(diǎn)33分,星期日去單位第15頁,共59頁,2022年,5月20日,2點(diǎn)33分,星期日Y 的離均差平方和:X 的離均差平方和:X與Y 間的離均差積和:線性相關(guān)系數(shù)的計(jì)算第16頁,共59頁,2022年,5月20日,2點(diǎn)33分,星期日相關(guān)系數(shù)的性質(zhì)方向(direction) r0為正相關(guān); r0為負(fù)相關(guān); r=0為零相關(guān)。 大小(strength) r越
5、接近于,說明相關(guān)性越好; r越接近于,說明相關(guān)性越弱。第17頁,共59頁,2022年,5月20日,2點(diǎn)33分,星期日例11-1 隨機(jī)抽取1名健康成人,測(cè)定血液的凝血酶濃度(單位/毫升)及凝固時(shí)間,數(shù)據(jù)如表11-1所示。據(jù)此數(shù)據(jù)如何判斷這兩項(xiàng)指標(biāo)間有否相關(guān)? 受試者號(hào)123456789101112131415凝血酶濃度1.11.21.00.91.21.10.90.61.00.91.10.91.11.00.7凝血時(shí)間141315151314161714161516141517表11115名健康成人凝血時(shí)間與凝血酶濃度測(cè)量值記錄第18頁,共59頁,2022年,5月20日,2點(diǎn)33分,星期日0.5 0
6、.6 0.7 0.8 0.9 1.0 1.1 1.2 1.3 18 17 16 15 14 13 12凝血酶濃度(毫升)凝血時(shí)間(秒)233 圖1 15例健康成人的凝血酶濃度和凝血時(shí)間散點(diǎn)圖1.畫散點(diǎn)圖線性相關(guān)?第19頁,共59頁,2022年,5月20日,2點(diǎn)33分,星期日2.計(jì)算線性相關(guān)系數(shù)第20頁,共59頁,2022年,5月20日,2點(diǎn)33分,星期日負(fù)相關(guān)第21頁,共59頁,2022年,5月20日,2點(diǎn)33分,星期日Question : Whether =0 or not?XY3.相關(guān)系數(shù)的假設(shè)檢驗(yàn)第22頁,共59頁,2022年,5月20日,2點(diǎn)33分,星期日3.相關(guān)系數(shù)的假設(shè)檢驗(yàn)查表法:
7、r界值表(附表13)t檢驗(yàn)第23頁,共59頁,2022年,5月20日,2點(diǎn)33分,星期日 建立檢驗(yàn)假設(shè),確定檢驗(yàn)水準(zhǔn) H0:凝血酶濃度與凝血時(shí)間無直線相關(guān)關(guān)系,即0H1:凝血酶濃度與凝血時(shí)間有直線相關(guān)關(guān)系,即0 = 0.05 相關(guān)系數(shù)的假設(shè)檢驗(yàn)第24頁,共59頁,2022年,5月20日,2點(diǎn)33分,星期日 查表法 t 檢驗(yàn)法計(jì)算檢驗(yàn)統(tǒng)計(jì)量,確定p值相關(guān)系數(shù)的假設(shè)檢驗(yàn)第25頁,共59頁,2022年,5月20日,2點(diǎn)33分,星期日相關(guān)系數(shù)的假設(shè)檢驗(yàn)查表法r 界值表r =-0.926, v =15-2=13 概率,P單0.025雙0.050.0050.010.00050.001100.5760.70
8、80.823110.5530.6840.801120.5320.6610.780130.5140.6410.760140.4970.6230.742P0.05第26頁,共59頁,2022年,5月20日,2點(diǎn)33分,星期日本例相關(guān)系數(shù)的假設(shè)檢驗(yàn)t 檢驗(yàn)第27頁,共59頁,2022年,5月20日,2點(diǎn)33分,星期日00.0250.025 -2.16 2.16-8.8748.874第28頁,共59頁,2022年,5月20日,2點(diǎn)33分,星期日作出統(tǒng)計(jì)推斷結(jié)論 P0.05,按=0.05檢驗(yàn)水準(zhǔn)拒絕H0,差別有統(tǒng)計(jì)學(xué)意義,可認(rèn)為凝血酶濃度與凝血時(shí)間之間存在線性相關(guān)。 相關(guān)系數(shù)的假設(shè)檢驗(yàn)第29頁,共59頁
9、,2022年,5月20日,2點(diǎn)33分,星期日線性相關(guān)分析畫散點(diǎn)圖:判斷有無線性趨勢(shì)計(jì)算線性相關(guān)系數(shù):相關(guān)性大小和方向線性相關(guān)系數(shù)的假設(shè)檢驗(yàn):根據(jù)樣本相關(guān)系數(shù)r推斷總體相關(guān)系數(shù)第30頁,共59頁,2022年,5月20日,2點(diǎn)33分,星期日線性相關(guān)應(yīng)用中應(yīng)注意的問題1散點(diǎn)圖的重要性r =0.816第31頁,共59頁,2022年,5月20日,2點(diǎn)33分,星期日線性相關(guān)應(yīng)用中應(yīng)注意的問題2 要求兩變量都是隨機(jī)變量,且為雙變量正態(tài)分布資料。第32頁,共59頁,2022年,5月20日,2點(diǎn)33分,星期日r=0.08r=0.85XYXY線性相關(guān)應(yīng)用中應(yīng)注意的問題3 出現(xiàn)異常點(diǎn)時(shí)慎用相關(guān)第33頁,共59頁,2
10、022年,5月20日,2點(diǎn)33分,星期日線性相關(guān)應(yīng)用中應(yīng)注意的問題4 相關(guān)未必是因果關(guān)系第34頁,共59頁,2022年,5月20日,2點(diǎn)33分,星期日線性相關(guān)應(yīng)用中應(yīng)注意的問題5 分層資料盲目合并易出假象(a) (b) (c) 第35頁,共59頁,2022年,5月20日,2點(diǎn)33分,星期日 線性相關(guān)(linear Correlation) 秩相關(guān)(rank correlation) 分類變量的關(guān)聯(lián)性分析 outline第36頁,共59頁,2022年,5月20日,2點(diǎn)33分,星期日 秩相關(guān)也稱等級(jí)相關(guān),最常用的Spearman秩相關(guān)。資料類型 不服從正態(tài)分布的資料 總體分布未知的資料 等級(jí)資料原
11、理 利用兩變量的秩次作線性相關(guān)分析,對(duì)原變量的分布不作要求,屬非參數(shù)統(tǒng)計(jì)方法。第37頁,共59頁,2022年,5月20日,2點(diǎn)33分,星期日例11-4 某地研究歲急性白血病患兒的血小板數(shù)與出血癥狀程度之間的相關(guān)性, 結(jié)果見表11-2,試用秩相關(guān)進(jìn)行分析。 第38頁,共59頁,2022年,5月20日,2點(diǎn)33分,星期日秩相關(guān)分析編秩計(jì)算lpp、lqq、lpq 計(jì)算Spearman秩相關(guān)系數(shù)或等級(jí)相關(guān)系數(shù),用rs表示。負(fù)相關(guān)?第39頁,共59頁,2022年,5月20日,2點(diǎn)33分,星期日Spearman秩相關(guān)系數(shù)說明兩個(gè)變量間相關(guān)的密切程度與方向;樣本相關(guān)系數(shù):rs 總體相關(guān)系數(shù): 取值介于-11
12、之間 rs 0為正相關(guān)。第40頁,共59頁,2022年,5月20日,2點(diǎn)33分,星期日秩相關(guān)系數(shù)的假設(shè)檢驗(yàn)查表法:rs界值表(附表14) t檢驗(yàn)第41頁,共59頁,2022年,5月20日,2點(diǎn)33分,星期日秩相關(guān)系數(shù)的假設(shè)檢驗(yàn)-查表法建立假設(shè),確定檢驗(yàn)水準(zhǔn) H0:s0,出血癥狀與血小板數(shù)之間無相關(guān)關(guān)系 H1:s0 ,出血癥狀與血小板數(shù)之間有相關(guān)關(guān)系 = 0.05查rs界值表(附表14): r =-0.422,|r|=0.422 n=12,r0.05/2,12=0.587確定p值,下結(jié)論 P0.05可認(rèn)為急性白血病患兒的出血癥狀與血小板數(shù)之間無相關(guān)關(guān)系。 第42頁,共59頁,2022年,5月20
13、日,2點(diǎn)33分,星期日秩相關(guān)系數(shù)的假設(shè)檢驗(yàn)查表法rs 界值表 概率,Pn單0.10雙 0.200.050.100.0250.05110.4270.5360.618120.4060.5030.587130.3850.4840.560140.3670.4640.538150.3540.4460.521第43頁,共59頁,2022年,5月20日,2點(diǎn)33分,星期日秩相關(guān)系數(shù)的假設(shè)檢驗(yàn)t 檢驗(yàn)第44頁,共59頁,2022年,5月20日,2點(diǎn)33分,星期日 Pearson積差相關(guān) Spearman秩相關(guān)區(qū)別 雙變量正態(tài)分布 r為參數(shù)統(tǒng)計(jì)量 偏峰分布 分布未知、 等級(jí)資料 rs為非參數(shù)統(tǒng)計(jì)量 原始數(shù)據(jù) 秩
14、次聯(lián)系 都要求各個(gè)體間滿足獨(dú)立性 都用于刻畫兩變量間相關(guān)的方向與密切程度Pearson積差相關(guān)與Spearman秩相關(guān)的區(qū)別與聯(lián)系第45頁,共59頁,2022年,5月20日,2點(diǎn)33分,星期日a.計(jì)算線性相關(guān)系數(shù)r=0.930,你可以得出變量x,y相關(guān)嗎?請(qǐng)解釋b.請(qǐng)畫散點(diǎn)圖c.使用線性相關(guān)系數(shù)描述相關(guān)性合適嗎?請(qǐng)解釋思考1r=0.930 x-3-2-10123y-278101827第46頁,共59頁,2022年,5月20日,2點(diǎn)33分,星期日思考2第47頁,共59頁,2022年,5月20日,2點(diǎn)33分,星期日 線性相關(guān)(linear Correlation) 秩相關(guān)(rank correla
15、tion) 分類變量的關(guān)聯(lián)性分析 outline第48頁,共59頁,2022年,5月20日,2點(diǎn)33分,星期日分類變量的關(guān)聯(lián)性分析交叉分類22表資料的關(guān)聯(lián)分析 22配對(duì)資料的關(guān)聯(lián)性分析 RC表分類資料的關(guān)聯(lián)性分析第49頁,共59頁,2022年,5月20日,2點(diǎn)33分,星期日例11-6 為觀察嬰兒腹瀉是否與喂養(yǎng)方式有關(guān),某醫(yī)院兒科隨機(jī)收集了消化不良的嬰兒82例, 對(duì)每個(gè)個(gè)體分別觀察腹瀉與否和喂養(yǎng)方式兩種屬性,22種結(jié)果分類記數(shù)如表11-3所示。試分析兩種屬性的關(guān)聯(lián)性。一個(gè)樣本第50頁,共59頁,2022年,5月20日,2點(diǎn)33分,星期日聯(lián)合概率邊際概率兩屬性X和Y互相獨(dú)立:屬性X的概率分布與屬性
16、Y的概率分布無關(guān),在交叉分類表中每一格子中聯(lián)合概率等于相應(yīng)屬性的邊際概率的乘積:第51頁,共59頁,2022年,5月20日,2點(diǎn)33分,星期日建立假設(shè),確定檢驗(yàn)水準(zhǔn) H0:喂養(yǎng)方式與嬰兒腹瀉之間互相獨(dú)立 H1:喂養(yǎng)方式與嬰兒腹瀉之間有關(guān)聯(lián) =0.05計(jì)算檢驗(yàn)統(tǒng)計(jì)量:確定P值,下結(jié)論 p0.05,說明嬰兒腹瀉與喂養(yǎng)方式之間存在著關(guān)聯(lián)性。 計(jì)算Pearson列聯(lián)系數(shù):假設(shè)檢驗(yàn)?第52頁,共59頁,2022年,5月20日,2點(diǎn)33分,星期日例11-7 有56份咽喉涂抹標(biāo)本,把每份標(biāo)本一分為二, 依同樣的條件分別接種于甲、乙兩種白喉?xiàng)U菌培養(yǎng)基上,觀察白喉?xiàng)U菌生長的情況,結(jié)果如表11-5,問兩種培養(yǎng)基的
17、結(jié)果有無關(guān)聯(lián)?配對(duì)資料第53頁,共59頁,2022年,5月20日,2點(diǎn)33分,星期日建立假設(shè),確定檢驗(yàn)水準(zhǔn) H0:兩種培養(yǎng)基的結(jié)果之間互相獨(dú)立 H1:兩種培養(yǎng)基的結(jié)果之間互相關(guān)聯(lián) =0.05計(jì)算檢驗(yàn)統(tǒng)計(jì)量:確定P值,下結(jié)論 p0.05,可認(rèn)為甲、乙兩種培養(yǎng)基之間存在關(guān)聯(lián)性。 計(jì)算列聯(lián)系數(shù):第54頁,共59頁,2022年,5月20日,2點(diǎn)33分,星期日例11-8 某地居民主要有三種祖籍,均流行甲狀腺腫。為探討甲狀腺腫類型與祖籍是否有關(guān)聯(lián),現(xiàn)根據(jù)居民甲狀腺腫篩查結(jié)果,按甲狀腺腫類型與祖籍兩種屬性交叉分類,得表11-6的資料。問甲狀腺腫類型與祖籍間有否關(guān)聯(lián)?33表一個(gè)樣本第55頁,共59頁,2022年,5月20日,2點(diǎn)33分,星期日建立假設(shè),確定檢驗(yàn)水準(zhǔn) H0:甲狀腺腫類型與祖籍無關(guān) H1:甲狀腺腫類型與祖籍有關(guān)聯(lián) =0.05計(jì)算檢驗(yàn)統(tǒng)計(jì)量: v=(3-1)(3-1)=4 (x20.05,4=9.49) 確定P值,下結(jié)論 p0.05,可認(rèn)為甲狀腺腫類型與祖籍有關(guān)聯(lián)性。 計(jì)算列聯(lián)系數(shù):第56頁,共59頁,2022年,5月20日,2點(diǎn)33分,星期日分類變量的關(guān)聯(lián)性分析交叉分類22表資料的關(guān)聯(lián)分析 22配對(duì)資料的關(guān)聯(lián)性分析 RC表分類資料的關(guān)聯(lián)性分析第57頁,共59頁,2022年,5月20日,2點(diǎn)33分,星期日分類資料的關(guān)聯(lián)性分析與概率分布的假設(shè)檢驗(yàn)相同:檢驗(yàn)公式 理論
溫馨提示
- 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請(qǐng)下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請(qǐng)聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
- 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會(huì)有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
- 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
- 5. 人人文庫網(wǎng)僅提供信息存儲(chǔ)空間,僅對(duì)用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對(duì)用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對(duì)任何下載內(nèi)容負(fù)責(zé)。
- 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請(qǐng)與我們聯(lián)系,我們立即糾正。
- 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶因使用這些下載資源對(duì)自己和他人造成任何形式的傷害或損失。
最新文檔
- 浸水擋土墻路堤邊坡穩(wěn)定性分析-課件(-精)
- 《逆全球化粗略綜述》課件
- 《輸卵管與子宮》課件
- 2024年甲乙雙方二手機(jī)床設(shè)備買賣合同
- 拉頭生產(chǎn)合同范本(2篇)
- 《OCTAVE評(píng)估方法》課件
- 2025年煙臺(tái)貨物從業(yè)資格證考試
- 2025年寶雞貨運(yùn)從業(yè)資格證試題庫及答案
- 2025年玉溪貨運(yùn)考試題目
- 2025年丹東c1貨運(yùn)從業(yè)資格證考試題
- 北京市海淀區(qū)2023-2024學(xué)年八年級(jí)上學(xué)期期末英語試卷
- 果品類原料的烹調(diào)應(yīng)用課件
- 24節(jié)氣中的傳統(tǒng)服飾與飾品
- 地彈簧行業(yè)分析
- 如何發(fā)揮采購在公司高質(zhì)量發(fā)展中作用
- 民事糾紛及其解決機(jī)制課件
- 美術(shù)高考總結(jié)匯報(bào)
- 北宋詞之臨江仙夜歸臨皋【宋】蘇軾課件
- 監(jiān)理質(zhì)量評(píng)估報(bào)告
- 《中國封建社會(huì)》課件
- 藥物代謝動(dòng)力學(xué)-中國藥科大學(xué)中國大學(xué)mooc課后章節(jié)答案期末考試題庫2023年
評(píng)論
0/150
提交評(píng)論