




版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進(jìn)行舉報(bào)或認(rèn)領(lǐng)
文檔簡介
1、2021年11月13日11時(shí)53分1多重回歸因變量: 連續(xù)型變量 正態(tài)分布 怎么辦?因變量: 二分類 ? 疾病與健康 生與死 回復(fù)與沒有恢復(fù)Logistic 回歸的背景之一回歸的背景之一第1頁/共42頁2021年11月13日11時(shí)53分216.1 Logistic 回歸模型基本概念例例.1 (橫斷面研究橫斷面研究) 與急性心肌梗塞急診治療預(yù)后與急性心肌梗塞急診治療預(yù)后 有關(guān)的因素有關(guān)的因素 數(shù)據(jù)數(shù)據(jù): 200 急性心肌梗塞病例急性心肌梗塞病例 危險(xiǎn)因素危險(xiǎn)因素: 1X(11X, 救治前休克救治前休克; 01X , 否則否則) 2X(12X, 救治前心衰救治前心衰;02X,否則,否則) 3X(1
2、3X, 12小時(shí)內(nèi)無治療措施小時(shí)內(nèi)無治療措施;03X,否則,否則) 結(jié)局結(jié)局: 0P, 生存生存; 1P, 死亡死亡 第2頁/共42頁2021年11月13日11時(shí)53分3 Table 16.1 The outcomes and related risk factors of 200 AMI cases 0Y 1Y 1X 2X 3X N 1X 2X 3X N 0 0 0 35 0 0 0 4 0 0 1 34 0 0 1 10 0 1 0 17 0 1 0 4 0 1 1 19 0 1 1 15 1 0 0 17 1 0 0 6 1 0 1 6 1 0 1 9 1 1 0 6 1 1 0 6 1
3、 1 1 6 1 1 1 6 Purpose: Risk factors? To predict the probability 3322110XXXP However, there is no guarantee that the value of Pshould fall in the interval 0,1. 第3頁/共42頁2021年11月13日11時(shí)53分4 Logistic 函數(shù) 012345-1-2-3-4-50.10.20.30.40.50.60.70.80.91yp YppeePYY1ln1或第4頁/共42頁2021年11月13日11時(shí)53分5Logistic 回歸模型回歸
4、模型 kkXX.)P-1Pln(110 kkXX.ln(Odds)110 kkXXP.)(logit110 kkkkXXXXeeP.1101101 ).(11011kkXXeP 第5頁/共42頁2021年11月13日11時(shí)53分6回歸的參數(shù)估計(jì) 通常采用極大似然估計(jì). (1) 建立似然函數(shù) Table 16.1 The outcomes and related risk factors of 200 AMI cases 0Y 1Y 1X 2X 3X N 1X 2X 3X N 0 0 0 35 0 0 0 4 0 0 1 34 0 0 1 10 0 1 0 17 0 1 0 4 0 1 1 19
5、 0 1 1 15 1 0 0 17 1 0 0 6 1 0 1 6 1 0 1 9 1 1 0 6 1 1 0 6 1 1 1 6 1 1 1 6 11) 1( , 1) 0(332211033221103322110XXXXXXXXXeYPeeYP )exp(11)exp(1)exp()exp(11)exp(1)exp()exp(11)exp(1)exp(632106321032101030343030403500Lik 10)exp(11)exp(1)exp(3322110332211033221101iiniiiniiiiiikiXXXXXXXXX 第6頁/共42頁2021年11月13
6、日11時(shí)53分7 (2) 尋找使似然函數(shù)達(dá)到極大的參數(shù)值 Table 16Table 16.2 .2 參數(shù)參數(shù)估計(jì)估計(jì)的的結(jié)果結(jié)果 變量變量 SESE( () ) W Wald ald 2 2 P P- - value value OROR 截截距距 - -2.08582.0858 0.35130.3513 35.263235.2632 0.00010.0001 1X 1.10981.1098 0.34850.3485 10.142210.1422 0.00140.0014 3.0343.034 2X 0.70280.7028 0.32920.3292 4.55874.5587 0.03280
7、.0328 2.0192.019 3X 0.97510.9751 0.34400.3440 8.03658.0365 0.00460.0046 2.6512.651 3210,Lik 尋找適宜的 使得 達(dá)到最大第7頁/共42頁2021年11月13日11時(shí)53分83219751. 07028. 01098. 10858. 2)P-1Pln(XXX 3219751. 07028. 01098. 10858. 2ln(Odds)XXX 3219751. 07028. 01098. 10858. 2)(LogitXXXP 3213219751. 07028. 01098. 10858. 29751.
8、07028. 01098. 10858. 21XXXXXXeeP )9751. 07028. 01098. 10858. 2(32111XXXeP 第8頁/共42頁2021年11月13日11時(shí)53分9 什麼是什麼是1? 當(dāng)當(dāng) 11X, 32withshock9751. 07028. 01098. 10858. 2)ln(OddsXX 01X, 32ckwithoutsho9751. 07028. 000858. 2)ln(OddsXX 1098. 1)ln(Odds-)ln(Oddsckwithoutshowithshock 1098. 1oddsoddslnckwithoutshowiths
9、hock1 比較比較 “有休克有休克” 與與 “沒休克沒休克”, 優(yōu)勢比優(yōu)勢比 = 0338. 3)1098. 1exp()exp(1 注意注意 : 死死亡率較低時(shí)亡率較低時(shí), 優(yōu)勢比優(yōu)勢比 相對相對危險(xiǎn)度危險(xiǎn)度 若若 P是是死亡死亡, 回歸回歸系數(shù)系數(shù)是是正的正的,因而因而,該該變量變量是是危危 險(xiǎn)險(xiǎn)因素因素;否則否則,它它是是保護(hù)保護(hù)因素因素。 第9頁/共42頁2021年11月13日11時(shí)53分10logistic 模型可用于預(yù)測模型可用于預(yù)測 )9751. 07028. 01098. 10858. 2(32111XXXeP 患者患者 1: 沒有休克沒有休克, AMI 5 小時(shí)后送醫(yī)院,出
10、現(xiàn)了癥狀小時(shí)后送醫(yī)院,出現(xiàn)了癥狀 01X, 12X,03X 200. 01111)7028. 00858. 2()9751. 07028. 01098. 10858. 2(321eePXXXA 患者患者 2: 休克休克, AMI 18 小時(shí)后送醫(yī)院,出現(xiàn)了癥狀小時(shí)后送醫(yī)院,出現(xiàn)了癥狀. 11X, 12X ,13X 669. 01111)9751. 07028. 01098. 10858. 2()9751. 07028. 01098. 10858. 2(321eePXXXB 第10頁/共42頁2021年11月13日11時(shí)53分11關(guān)于 logistic 模型的檢驗(yàn)1. 檢驗(yàn)擬合優(yōu)度0H: 模型模
11、型擬合擬合此此數(shù)據(jù)數(shù)據(jù) 1H: 模型模型不不擬合擬合此此數(shù)據(jù)數(shù)據(jù) F 對于對于大樣本大樣本, 0H成立成立時(shí)時(shí), Lln2服從服從 chi-square 分分 布布,自由度自由度為為 1kN. 當(dāng)當(dāng) 2,2ln2L, 拒絕拒絕0H,模型模型不不擬合擬合觀察到觀察到的的數(shù)據(jù)數(shù)據(jù) Table16.3 例例 16.1 數(shù)據(jù)數(shù)據(jù)對對各各模型模型的的擬合擬合情形情形 模型模型 參數(shù)參數(shù) -2lnL P-值值 G 得分得分 1 0 244.346 0.02 - - 2 0, 1 236.736 0.03 7.610 7.854 3 0, 1, 2 227.200 0.06 9.536 6.898 4 0,
12、 1, 2,3 222.616 0.09 4.583 5.309 第11頁/共42頁2021年11月13日11時(shí)53分122. 似然比檢驗(yàn)似然比檢驗(yàn) 0H: 兩模型擬合優(yōu)度一樣兩模型擬合優(yōu)度一樣 1H:兩模型擬合優(yōu)度不一樣兩模型擬合優(yōu)度不一樣 LLLLGln2)ln2(ln2 模型模型 1: Lln2, 1k 個(gè)變量個(gè)變量 模型模型 2: L ln2, 2k 個(gè)變量個(gè)變量, 21kk . 對于大樣本對于大樣本, 0H 成立時(shí)成立時(shí), G服從服從 chi-square 分布,分布, 12kk . 若若 P-值值 小于小于 , 則則拒絕拒絕 0H, 取取模型模型 2; 否則否則, 不不拒絕拒絕0H
13、,取取模型模型 1 第12頁/共42頁2021年11月13日11時(shí)53分13模型模型 參數(shù)參數(shù) -2lnL P-值值 G 得分得分 1 0 244.346 0.02 - - 2 0, 1 236.736 0.03 7.610 7.854 3 0, 1, 2 227.200 0.06 9.536 6.898 4 0, 1, 2,3 222.616 0.09 4.583 5.309 比較比較 模型模型 3 和和 4 200.227ln2L 616.222ln2L 583. 4616.222200.227)ln2(ln2LLG 13412kk, 05. 0P 模型模型 4 最好最好 第13頁/共42
14、頁2021年11月13日11時(shí)53分143. Wald 檢驗(yàn)檢驗(yàn) 0H: 0i, 1H: 0i 在在1H條件下作條件下作 logistic 回歸回歸,得到得到i, 22)(iiiSE 若樣本量足夠大,若樣本量足夠大, 當(dāng)當(dāng) 0H 成立時(shí)成立時(shí), 該統(tǒng)計(jì)量近似地服從該統(tǒng)計(jì)量近似地服從 chi-square 分布,分布, 自由度為自由度為 1. 由表由表 16.2, 1X (shock) 的的 Wald 2 1422.10)3485. 01098. 1(22 這在向后選擇變量是有用這在向后選擇變量是有用. 注意注意: 對于大樣本對于大樣本 n, 似然比檢驗(yàn)的結(jié)果與似然比檢驗(yàn)的結(jié)果與 Wald 檢驗(yàn)
15、檢驗(yàn) 的結(jié)果彼此接近。的結(jié)果彼此接近。 實(shí)踐中實(shí)踐中, 人們比較喜歡似然比檢驗(yàn),其結(jié)果比較穩(wěn)健人們比較喜歡似然比檢驗(yàn),其結(jié)果比較穩(wěn)健. Wald 檢驗(yàn)容易計(jì)算,但比較保守檢驗(yàn)容易計(jì)算,但比較保守. 第14頁/共42頁2021年11月13日11時(shí)53分15更多例子例16.2 (隊(duì)列研究) 為研究冠心病 (CHD) 和兒茶酚胺(CAT)的關(guān)系, 隨訪高 CAT 和低 CAT 兩組對象7年之久. 記錄了兩組中 CHD 的發(fā)病人數(shù)。分層分層 CAT=1 (高高) CAT=0 (低低) CHD 正常正常 CHD 正常正常 AGE55,ECG=0 1 17 7 257 AGE0.05 X7 0.93772
16、9 0.405423 2.31 0.05 2 常數(shù)常數(shù) 0.800787 0.266942 2.99 0.05 X4 0.569390 0.196977 2.89 0.05 X6 -1.27328 0.355932 -3.57 0.01 結(jié)論結(jié)論: (1) 對于對于腺癌腺癌, 吸煙是重要危險(xiǎn)因素。吸煙是重要危險(xiǎn)因素。. (2) 對于對于鱗癌鱗癌, 高齡和暴露于高齡和暴露于氡增加風(fēng)險(xiǎn)增加風(fēng)險(xiǎn), 但但 “年齡年齡” 還沒有統(tǒng)計(jì)學(xué)意義。還沒有統(tǒng)計(jì)學(xué)意義。 (3) 對于肺癌,工齡長增加風(fēng)險(xiǎn)。對于肺癌,工齡長增加風(fēng)險(xiǎn)。 第32頁/共42頁2021年11月13日11時(shí)53分33 3. 隨機(jī)效應(yīng) Logis
17、tic 回歸模型不同放射性劑量的不同放射性劑量的花粉花粉致畸實(shí)驗(yàn)致畸實(shí)驗(yàn) 劑量劑量 A 劑量劑量 B 懷孕母親懷孕母親 編號編號 后代數(shù)后代數(shù) 畸形畸形數(shù)數(shù) 懷孕母親懷孕母親 編號編號 后代數(shù)后代數(shù) 畸形畸形數(shù)數(shù) 1 7 0 1 7 5 2 9 6 2 8 0 3 8 3 3 7 2 4 7 1 4 7 1 5 8 1 5 8 2 6 6 0 6 8 0 7 7 2 8 6 0 8 5 4 9 7 0 9 7 3 10 9 0 10 8 0 11 6 2 11 7 0 Total 81 12 12 7 1 13 7 7 14 7 0 15 6 1 Total 106 29 第33頁/共42頁2
18、021年11月13日11時(shí)53分34(1) Z - test H0: 1 = 2, H1: 1 2 08. 2)8111061)(2193.1 (2193.811210629z 2193.811061229cp p0.05. 拒絕拒絕 H0. (2) Logistic 回歸回歸 組組B 0 A1 logit P = -1.749+0.7727X Li 似然比檢驗(yàn)似然比檢驗(yàn) 2=4.352, p=0.037. 拒絕拒絕 H0 第34頁/共42頁2021年11月13日11時(shí)53分35隨機(jī)效應(yīng) logistic 回歸不同不同窩窩的的畸形畸形發(fā)生率發(fā)生率各不相同各不相同. 窩窩效應(yīng)效應(yīng) 畸形畸形后代后
19、代數(shù)數(shù)并不并不服從服從概率概率為為常數(shù)常數(shù) p 的的二項(xiàng)二項(xiàng)分布分布, p 是是一個(gè)一個(gè)隨機(jī)隨機(jī)變量變量 )()1ln(額外項(xiàng)xpp “額外項(xiàng)額外項(xiàng)”: 隨機(jī)隨機(jī)變量變量 or )(exp11額外項(xiàng)xp 因此因此, p 是是一個(gè)一個(gè)隨機(jī)隨機(jī)變量變量 第35頁/共42頁2021年11月13日11時(shí)53分36(1) Beta-二項(xiàng)二項(xiàng)回歸回歸模型模型 (Crowder 1978) 額外項(xiàng)額外項(xiàng) beta 分布分布 (2) Logistic-正態(tài)正態(tài)回歸回歸模型模型 (Pierce & sands 1975) uxpp )1ln( 0, ) 1 , 0( Nu (3) Logistic-二項(xiàng)
20、二項(xiàng)回歸回歸模模型型 (Mauritsen 1984) )5 . 0 , 1 ( , 0 )1ln(Bvvxpp 關(guān)于 “額外項(xiàng)”的假設(shè)第36頁/共42頁2021年11月13日11時(shí)53分37(3) 隨機(jī)效應(yīng)隨機(jī)效應(yīng) logistic 回歸回歸 隨機(jī)效應(yīng)模型的參數(shù)估計(jì)隨機(jī)效應(yīng)模型的參數(shù)估計(jì) 參數(shù)參數(shù) Beta-二項(xiàng)二項(xiàng) 模型模型 Logistic-正態(tài)正態(tài) 模型模型 Logistic-二項(xiàng)二項(xiàng) 模型模型 , (I) 85.326 85.326 85.326 , , (II) 56.605 56.393 56.550 , (III) 57.97 57.785 57.401 , , 1, 2 (IV) 56.413 56.328 56.516 (I): logit P= +X (II): logit P = +X+ (III):logit P = + (IV): logit P = +X+1+2X 第37頁/共42頁2021年11月13日11時(shí)53分38利用利用 logistic-正態(tài)模型正態(tài)模型 比較比較 2 df p-值值 II & I 28.9332 1 0.001 III & I
溫馨提示
- 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
- 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會(huì)有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
- 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
- 5. 人人文庫網(wǎng)僅提供信息存儲(chǔ)空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負(fù)責(zé)。
- 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請與我們聯(lián)系,我們立即糾正。
- 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。
最新文檔
- 2024-2025學(xué)年高中政治課時(shí)分層作業(yè)18社會(huì)主義市抄濟(jì)含解析新人教版必修1
- 2024-2025學(xué)年高中政治課時(shí)作業(yè)三政治生活:自覺參與含解析新人教版必修2
- 2024-2025學(xué)年高中生物第2單元第1章第1節(jié)種群的特征教案中圖版必修3
- 2024-2025學(xué)年高中歷史課時(shí)分層作業(yè)17蘇聯(lián)的經(jīng)濟(jì)改革含解析岳麓版必修2
- 2024-2025學(xué)年高中地理第一章區(qū)域地理環(huán)境與人類活動(dòng)第五節(jié)區(qū)域聯(lián)系第1課時(shí)資源跨區(qū)域調(diào)配課時(shí)作業(yè)湘教版必修3
- 2024-2025學(xué)年高中政治第三單元思想方法與創(chuàng)新意識第9課第2框用對立統(tǒng)一的觀點(diǎn)看問題隨堂作業(yè)含解析新人教版必修4
- 中國網(wǎng)絡(luò)氣象色譜儀市場運(yùn)營趨勢分析及投資潛力研究報(bào)告
- 叉車變速箱項(xiàng)目可行性研究報(bào)告
- 裝配式監(jiān)理評估報(bào)告
- 口碑營銷實(shí)施方案范文
- 數(shù)字化戰(zhàn)略轉(zhuǎn)型-深度研究
- 【上?!康谝淮卧驴季?1【20~21章】
- 2025年東營科技職業(yè)學(xué)院高職單招語文2018-2024歷年參考題庫頻考點(diǎn)含答案解析
- 2025年企業(yè)中高層安全第一課:安全責(zé)任意識強(qiáng)化專題培訓(xùn)
- 2025年上半年中煤科工集團(tuán)商業(yè)保理限公司招聘易考易錯(cuò)模擬試題(共500題)試卷后附參考答案
- 英語-九師聯(lián)盟2025屆高三年級上學(xué)期1月質(zhì)量檢測試題和答案
- 流行性感冒診療方案(2025年版)
- 2024CSCO免疫檢查點(diǎn)抑制劑相關(guān)的毒性管理指南
- 《影像增強(qiáng)檢查外周靜脈通路三級評價(jià)模式應(yīng)用規(guī)范》編制說明
- 2025年社區(qū)計(jì)生工作計(jì)劃(三篇)
- 2025江西上饒經(jīng)濟(jì)技術(shù)開發(fā)區(qū)招商集團(tuán)限公司招聘29人高頻重點(diǎn)提升(共500題)附帶答案詳解
評論
0/150
提交評論