版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請(qǐng)進(jìn)行舉報(bào)或認(rèn)領(lǐng)
文檔簡(jiǎn)介
Logistic回歸分析
及其應(yīng)用溫澤淮DME中心3/13/20241概述1967年TrueltJ,ConnifieldJ和KannelW在《JournalofChronicDisease》上發(fā)表了冠心病危險(xiǎn)因素的研究,較早將Logistic回歸用于醫(yī)學(xué)研究。一般概念一元直線回歸多元直線回歸3/13/20242一元直線回歸模型
y=a+bx+e多元直線回歸模型
y=a+b1x1+b2x2+…+bkxk+e3/13/20243-4.00-2.000.002.004.00X:自變量0.000.250.500.751.00F(y):因變量的logit值如果一定要進(jìn)行直線回歸也可以做出結(jié)果,但此時(shí)效果不佳。當(dāng)自變量取一定值時(shí),因變量的預(yù)測(cè)值可能為負(fù)數(shù)。3/13/20244一般直線回歸難以解決的問題醫(yī)學(xué)數(shù)據(jù)的復(fù)雜、多樣連續(xù)型和離散型數(shù)據(jù)醫(yī)學(xué)研究中疾病的復(fù)雜性一種疾病可能有多種致病因素或與多種危險(xiǎn)因素有關(guān)疾病轉(zhuǎn)歸的影響因素也可能多種多樣臨床治療結(jié)局的綜合性3/13/20245簡(jiǎn)單的解決方法固定其他因素,研究有影響的一兩個(gè)因素;分層分析:按1~2個(gè)因素組成的層進(jìn)行層內(nèi)分析和綜合。統(tǒng)計(jì)模型3/13/20246尋找適宜的模型進(jìn)行l(wèi)ogit變換logit(p)=ln(——),p為y=1所對(duì)應(yīng)的概率logit(0.1)=ln(———)=ln(0.1/0.9)p1-p0.11-0.13/13/20247logit(p)=ln(——)p=0或1時(shí),此式失效
以p=r/n代之logit(p)=ln[(r+0.5)/(n–r+0.5)]此稱經(jīng)驗(yàn)logistic變換
以Z代上式的logit(p),Z=a+b1x1+b2x2+…+bkxk稱此為logistic回歸模型p1-p3/13/20248P=ez/(1+ez)ea+b1x1+b2x2+…+bkxk
1+ea+b1x1+b2x2+…+bkxk此為非條件logistic回歸模型應(yīng)用于成組數(shù)據(jù)的分析P=3/13/20249自變量取定一些值時(shí),因變量取0、1的概率就是條件概率,對(duì)條件概率進(jìn)行l(wèi)ogistic回歸,稱為條件logistic回歸表達(dá)式:eb1x1+b2x2+…+bkxk
1-eb1x1+b2x2+…+bkxk
常用于分析配比的資料P=3/13/202410概述小結(jié)logistic回歸對(duì)因變量的比數(shù)的對(duì)數(shù)值〔logit值〕建立模型因變量的logit值的改變與多個(gè)自變量的加權(quán)和呈線性關(guān)系因變量呈二項(xiàng)分布3/13/202411分析的一般步驟變量的編碼啞變量的設(shè)置和引入各個(gè)自變量的單因素分析變量的篩選交互作用的引入建立多個(gè)模型選擇較優(yōu)的模型模型應(yīng)用條件的評(píng)價(jià)輸出結(jié)果的解釋3/13/2024121.變量的編碼變量的編碼要易于識(shí)別注意編碼的等級(jí)關(guān)系改變分類變量的編碼,其分析的意義并不改變。牢記編碼使用變量數(shù)值標(biāo)識(shí)〔valuelabels〕記錄編碼內(nèi)容3/13/202413變量的編碼變量名變量標(biāo)識(shí)變量值值標(biāo)識(shí)
SEX性別1男2女EDU教育程度0文盲1小學(xué)2初中及以上3/13/202414variablelabelsqnum'問卷序號(hào)'rnum'錄入序號(hào)'pnum'病人編號(hào)'hnum'住院號(hào)/門診號(hào)'chname'患者中文姓名'drugroup'組別'name'患者姓名'sex'患者性別'age'患者年齡'valuelabelssex1'男'2'女'/hisc1'是'0'否'9'無法判斷'/nsex1'正常'0'異常'9'未檢'/demdx1'有'0'無'/addx0'無'1'危險(xiǎn)性'2'可能'3'很可能'/edu0‘文盲’1‘小學(xué)程度’2‘初中及以上'3/13/2024152.啞變量的設(shè)置和引入啞變量,又稱指示變量或設(shè)計(jì)矩陣。有利于檢驗(yàn)等級(jí)變量各個(gè)等級(jí)間的變化是否相同。一個(gè)k分類的分類變量,可以用k-1個(gè)啞變量來表示。3/13/202416啞變量的設(shè)置教育程度X1X2X3文盲:0000小學(xué):1100初中:2010高中:3001教育程度:文盲,小學(xué),初中,高中以上3/13/202417教育程度X1X2X3文盲:0100小學(xué):1010初中:2001高中:3000以高中作為參照3/13/202418SPSS提供的方法Indicator:默認(rèn)。以第1或最后1類作對(duì)照,其他每類與對(duì)照比較;Sample:以第1或最后1類作對(duì)照,其他每類與對(duì)照比較,但反映平均效應(yīng)。Difference:除第1類外各分類與其前各類平均效應(yīng)比較;Helmert:除最后1類外各分類與其前各類平均效應(yīng)比較;Repeated:除第1類外各分類與其前一類比較;Polynomial:假設(shè)類間距相等,用于數(shù)值型變量。Deviation:以第1或最后1類作對(duì)照,其余每類與總效應(yīng)比較。3/13/2024193.自變量的單因素分析了解自變量與因變量的分布檢驗(yàn)是否符合建立模型的應(yīng)用條件偏離應(yīng)用條件時(shí),進(jìn)行數(shù)據(jù)變換各個(gè)自變量?jī)山M間的比較計(jì)數(shù)資料計(jì)量資料雙變量分析3/13/2024204.變量的篩選變量篩選的原那么專業(yè)上考慮測(cè)量上考慮共線性問題:計(jì)算相關(guān)矩陣,相關(guān)系數(shù)0.8-0.9,那么選其一。缺失數(shù)據(jù)少、測(cè)量誤差低的優(yōu)先選擇經(jīng)驗(yàn)上考慮雙變量分析中有顯著性的自變量〔P≤0.15〕選擇那些改變主效應(yīng)的自變量3/13/202421變量的篩選變量篩選的可用方法逐步logistic回歸:自動(dòng)選擇有顯著性的自變量,不僅用于自變量的剔選,也用于交互作用項(xiàng)是否顯著的判斷。前進(jìn)法:逐個(gè)引入模型外的變量后退法:放入所有變量,再逐個(gè)篩選
理論上看,前進(jìn)法選擇變量的經(jīng)驗(yàn)公式缺乏總體概念,當(dāng)用于因素分析時(shí),建議用后退法。當(dāng)變量間有完全相關(guān)性時(shí),后退法無法使用,可用前進(jìn)法。3/13/2024225.交互作用的引入交互作用的定義當(dāng)自變量和因變量的關(guān)系隨第三個(gè)變量的變化而改變時(shí),那么存在交互作用交互作用項(xiàng)的引入基于臨床實(shí)際認(rèn)為對(duì)結(jié)果有重要影響基于模型應(yīng)用條件的分析引入兩個(gè)自變量的乘積項(xiàng)交互作用的檢驗(yàn)交互作用的解釋3/13/2024236.建立多個(gè)模型飽和模型自定義的模型從飽和模型中選擇自變量再建立模型3/13/2024247.選擇較優(yōu)的模型模型擬合優(yōu)度檢驗(yàn)AIC〔Akaikeinformationcriterion〕:同一資料的多個(gè)模型的比較,此值越小,模型越適宜。SC〔Schwartzcriterion〕:同上Score統(tǒng)計(jì)量:同上,但不包括截距項(xiàng)。-2logL〔似然比檢驗(yàn),OmnibusTest〕:檢驗(yàn)全部自變量的作用是否顯著。較為可靠。適用于含連續(xù)性變量的情況。模型擬合好,x2值大,P值小。Hosmer-Lemeshow檢驗(yàn):評(píng)價(jià)估計(jì)概率和觀察概率接近的程度。適用于含連續(xù)性變量的情況。模型好,x2值小,P值大。3/13/2024258.模型應(yīng)用條件的評(píng)價(jià)殘差分析殘差是觀察值與估計(jì)值之差合理的logistic回歸模型也可能得到不理想的殘差,這在自變量是二分類變量時(shí)更易出現(xiàn)。增加交互作用項(xiàng)可能增加模型的效能3/13/2024269.輸出結(jié)果的解釋模型中各個(gè)系數(shù)的顯著性檢驗(yàn)Wald檢驗(yàn):類似于直線回歸系數(shù)的t檢驗(yàn)Waldx2檢驗(yàn):同上似然比檢驗(yàn):自變量不在模型中與在模型中的似然值比較。Score檢驗(yàn)3/13/202427輸出結(jié)果的解釋回歸系數(shù)的解釋系數(shù)的正負(fù)值:正〔負(fù)〕系數(shù)表示隨自變量的增加因變量logit值的增加〔減少〕。二分類自變量系數(shù)為比數(shù)比的對(duì)數(shù)值,由此比數(shù)比=eb多分類自變量以第i類作參照,比較相鄰或相隔的兩個(gè)類別。連續(xù)型自變量當(dāng)自變量改變一個(gè)單位時(shí),比數(shù)比為eb3/13/202428輸出結(jié)果的解釋模型擬合的優(yōu)劣自變量與結(jié)果變量〔因變量〕有無關(guān)系確認(rèn)因變量與自變量的編碼模型包含的各個(gè)自變量的臨床意義由模型回歸系數(shù)計(jì)算得到的各個(gè)自變量的比數(shù)比的臨床意義3/13/202429輸出結(jié)果的解釋模型的預(yù)測(cè)結(jié)果的評(píng)價(jià)敏感度、特異度和陽性預(yù)測(cè)值正確選擇預(yù)測(cè)概率界值,簡(jiǎn)單地以0.5為界值,但并不是最好的。C指數(shù)預(yù)測(cè)結(jié)果與觀察結(jié)果的一致性的度量。C值越大〔最大為1〕,模型預(yù)測(cè)結(jié)果的能力越強(qiáng)。3/13/202430非條件logistic回歸研究對(duì)象之間是否發(fā)生某事件是獨(dú)立的。適用于:成組的病例-對(duì)照研究無分層的隊(duì)列研究或橫斷面調(diào)查診斷性試驗(yàn)3/13/202431條件logistic回歸研究中有N個(gè)配比組,每組中n個(gè)病例配m個(gè)對(duì)照者。這時(shí),各個(gè)研究對(duì)象發(fā)生某事件的概率即為條件概率。適用于配比設(shè)計(jì)的病例-對(duì)照研究精細(xì)分層設(shè)計(jì)的隊(duì)列研究3/13/202432logistic回歸的應(yīng)用疾病影響因素的研究校正混雜因素疾病預(yù)后的估計(jì)疾病診斷3/13/202433疾病影響因素的研究病因?qū)W研究病例-對(duì)照研究隊(duì)列研究影響因素的研究橫斷面調(diào)查臨床試驗(yàn)3/13/202434校正混雜因素一般采用Mantel-Haenszel分層分析分層較細(xì)或存在格子零頻數(shù)時(shí),M-H法無法采用。logistic回歸分析可綜合校正多個(gè)混雜因素的影響3/13/202435疾病預(yù)后的估計(jì)logistic回歸模型作為一種概率模型,可用于預(yù)測(cè)某事件發(fā)生的概率。logistic回歸不要求在因變量正態(tài)假設(shè)的前提下進(jìn)行預(yù)測(cè)。3/13/202436疾病診斷疾病診斷的判別診斷性試驗(yàn)研究中,敏感度和特異度的估計(jì)logistic回歸模型綜合校正協(xié)變量的影響充分利用數(shù)據(jù)提供的信息可進(jìn)行95%可信區(qū)間的估計(jì)3/13/202437logistic回歸的其他問題多分類logistic回歸模型因變量為二分類變量因變量為多分類變量
溫馨提示
- 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請(qǐng)下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請(qǐng)聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
- 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會(huì)有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
- 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
- 5. 人人文庫網(wǎng)僅提供信息存儲(chǔ)空間,僅對(duì)用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對(duì)用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對(duì)任何下載內(nèi)容負(fù)責(zé)。
- 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請(qǐng)與我們聯(lián)系,我們立即糾正。
- 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶因使用這些下載資源對(duì)自己和他人造成任何形式的傷害或損失。
最新文檔
- 網(wǎng)絡(luò)布線合同范本
- 2024至2030年企鵝被項(xiàng)目投資價(jià)值分析報(bào)告
- 正規(guī)租房合同
- 貴陽市寫字樓租賃合同范本
- 保險(xiǎn)銷售年度工作總結(jié)(7篇)
- 2024年中國(guó)男式彩棉內(nèi)衣市場(chǎng)調(diào)查研究報(bào)告
- 運(yùn)動(dòng)鞋營(yíng)銷策劃書(合集4篇)
- 2025年度酒吧吧臺(tái)承包管理及夜生活服務(wù)合同3篇
- 家庭裝修合同樣本
- 2025版企業(yè)培訓(xùn)效果評(píng)估與績(jī)效提升合同3篇
- 口腔正畸科普課件
- 2024年廣東省普通高中學(xué)業(yè)水平合格性地理試卷(1月份)
- 住宅樓安全性檢測(cè)鑒定方案
- 配送管理招聘面試題與參考回答2024年
- 江蘇省語文小學(xué)三年級(jí)上學(xué)期期末試題及解答參考(2024年)
- 黑龍江哈爾濱市省實(shí)驗(yàn)中學(xué)2025屆數(shù)學(xué)高一上期末監(jiān)測(cè)試題含解析
- 小學(xué)一年級(jí)數(shù)學(xué)思維訓(xùn)練100題(附答案)
- 安全生產(chǎn)治本攻堅(jiān)三年行動(dòng)方案(一般工貿(mào)) 2024
- 2024年廣東省廣州市黃埔區(qū)中考一模語文試題及答案
- 飯?zhí)脪炜繀f(xié)議合同范本
- 2023-2024學(xué)年遼寧省重點(diǎn)高中沈陽市郊聯(lián)體高二上學(xué)期期末考試生物試題(解析版)
評(píng)論
0/150
提交評(píng)論