![講座logistic20140331復(fù)習過程_第1頁](http://file4.renrendoc.com/view/c58cbfdbd33d04fdf92ed8f3d90a46b0/c58cbfdbd33d04fdf92ed8f3d90a46b01.gif)
![講座logistic20140331復(fù)習過程_第2頁](http://file4.renrendoc.com/view/c58cbfdbd33d04fdf92ed8f3d90a46b0/c58cbfdbd33d04fdf92ed8f3d90a46b02.gif)
![講座logistic20140331復(fù)習過程_第3頁](http://file4.renrendoc.com/view/c58cbfdbd33d04fdf92ed8f3d90a46b0/c58cbfdbd33d04fdf92ed8f3d90a46b03.gif)
![講座logistic20140331復(fù)習過程_第4頁](http://file4.renrendoc.com/view/c58cbfdbd33d04fdf92ed8f3d90a46b0/c58cbfdbd33d04fdf92ed8f3d90a46b04.gif)
![講座logistic20140331復(fù)習過程_第5頁](http://file4.renrendoc.com/view/c58cbfdbd33d04fdf92ed8f3d90a46b0/c58cbfdbd33d04fdf92ed8f3d90a46b05.gif)
版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進行舉報或認領(lǐng)
文檔簡介
講座logistic20140331一元直線回歸模型
y=a+bx+e多元直線回歸模型
y=a+b1x1+b2x2+…+bkxk+e直線回歸分析的適用環(huán)境:線性(linear):反應(yīng)變量Y的總體平均值與自變量X呈線性關(guān)系判斷:散點圖;殘差圖獨立(independent)任意兩個觀察值互相獨立判斷:專業(yè)知識正態(tài)性(normal)假定線性模型的誤差項服從正態(tài)分布判斷:殘差直方圖等方差性(equalvariance):在X的取值范圍內(nèi),不論X取什么值,Y都具有相同的方差判斷:X與Y,殘差的散點圖Logistic回歸分析概率型非線性回歸研究二分類觀察結(jié)果與一些影響因素之間關(guān)系的一種多變量分析方法。logistic回歸的主要用途:一是尋找危險因素二是預(yù)測,根據(jù)建立的logistic回歸模型,預(yù)測在不同的自變量情況下,發(fā)生某病或某種情況的概率有多大。三是判別,實際上跟預(yù)測類似,根據(jù)logistic模型,判斷某人屬于某病或?qū)儆谀撤N情況的概率有多大,也就是看一下這個人有多大的可能性是屬于某病患者。
logistic回歸與多重線性回歸logistic回歸與多重線性回歸實際上有很多相同之處,最大的區(qū)別就在于他們的因變量不同,這兩種回歸可以歸于同一個家族,即廣義線性模型(generalizedlinearmodel)。這一家族中的模型形式基本上都差不多,不同的就是因變量不同,如果是連續(xù)的,就是多重線性回歸,如果是二項分布,就是logistic回歸,如果是poisson分布,就是poisson回歸,如果是負二項分布,就是負二項回歸logistic回歸的因變量可以是二分類的,也可以是多分類的,但是二分類的更為常用,也更加容易解釋。所以實際中最為常用的就是二分類的logistic回歸。Logistic回歸分析在流行病學(xué)研究中的應(yīng)用疾病病因和危險因素探討-病例對照研究實驗研究中藥物或毒物的劑量反應(yīng)關(guān)系臨床試驗評價疾病預(yù)后因素分析膳食因素與2型糖尿病關(guān)系的logistic回歸分析大學(xué)生高血壓相關(guān)因素的Logistic回歸分析產(chǎn)后抑郁癥影響因素的病例對照研究產(chǎn)褥期抑郁及其影響因素的Logistic回歸分析產(chǎn)褥期抑郁及其影響因素的Logistic回歸分析天津市嬰幼兒孤獨癥患病率與危險因素。。。。。孫振球主編.《醫(yī)學(xué)統(tǒng)計學(xué)》人民衛(wèi)生出版社.Logistic回歸模型影響Y的取值的m個自變量,X1,X2…Xm。P表示m個自變量的作用下陽性結(jié)果發(fā)生的概率,則Logistic回歸模型表示為稱為P的logit變換。Logistic回歸模型-參數(shù)的含義影響Y的取值的m個自變量,X1,X2…Xm。P表示m個自變量的作用下陽性結(jié)果發(fā)生的概率,則Logistic回歸模型表示為β0表示暴露劑量為0時個體發(fā)病與不發(fā)病概率之比的自然對數(shù)。流行病學(xué)中的一些基本概念:相對危險度(relativerisk):RR=P1/P2比數(shù)
Odds=P/(1-P)比數(shù)比OR=[P1/(1-P1)]/[P2/(1-P2)]在患病率較小情況下,OR≈RRLogistic回歸中的常數(shù)項(b0)表示,在不接觸任何潛在危險/保護因素條件下,效應(yīng)指標發(fā)生與不發(fā)生事件的概率之比的對數(shù)值。Logistic回歸中的回歸系數(shù)(bi
)表示,某一因素改變一個單位時,效應(yīng)指標發(fā)生與不發(fā)生事件的概率之比的對數(shù)變化值,即OR的對數(shù)值。Logistic回歸系數(shù)的意義分析因素xi為二分類變量時,存在(暴露)xi
=1,不存在(未暴露)xi
=0,則Logistic回歸中xi的系數(shù)bi就是暴露與非暴露優(yōu)勢比的對數(shù)值.即OR=exp(bi)=e(bi)醫(yī)學(xué)研究中疾病的復(fù)雜性一種疾病可能有多種致病因素或與多種危險因素有關(guān)疾病轉(zhuǎn)歸的影響因素也可能多種多樣臨床治療結(jié)局的綜合性解決辦法:固定其他因素,研究有影響的一兩個因素(配比);分層分析:按1~2個因素組成的層進行層內(nèi)分析和綜合。統(tǒng)計模型實例分析為了探討冠心病發(fā)生的有關(guān)危險因素,對26例冠心病病人和28例對照者進行病例-對照研究,各因素的說明見表1,資料見數(shù)據(jù)庫data1,試用logistic逐步回歸分析方法篩選危險因素。
Logistic回歸分析的一般步驟變量的編碼啞變量的設(shè)置和引入各個自變量的單因素分析變量的篩選交互作用的引入建立多個模型選擇較優(yōu)的模型模型應(yīng)用條件的評價輸出結(jié)果的解釋1.變量的編碼變量的編碼要易于識別注意編碼的等級關(guān)系改變分類變量的編碼,其分析的意義并不改變。牢記編碼使用變量數(shù)值標識(valuelabels)記錄編碼內(nèi)容變量的編碼變量名變量標識變量值值標識
SEX性別1男
2女
EDU教育程度0文盲
1小學(xué)
2初中及以上2.啞變量的設(shè)置和引入啞變量,又稱指示變量。有利于檢驗等級變量各個等級間的變化是否相同。一個k分類的分類變量,可以用k-1個啞變量來表示。啞變量的設(shè)置教育程度X1X2X3文盲:0000小學(xué):1100初中:2010高中:3001教育程度:文盲,小學(xué),初中,高中以上教育程度X1X2X3文盲:0100小學(xué):1010初中:2001高中:3000以高中作為參照SPSS提供的方法Indicator:
默認。以第1或最后1類作對照,其他每類與對照比較;Sample:
以第1或最后1類作對照,其他每類與對照比較,但反映平均效應(yīng)。Difference:
除第1類外各分類與其前各類平均效應(yīng)比較;Helmert:
除最后1類外各分類與其前各類平均效應(yīng)比較;Repeated:
除第1類外各分類與其前一類比較;Polynomial:
假設(shè)類間距相等,用于數(shù)值型變量。Deviation:
以第1或最后1類作對照,其余每類與總效應(yīng)比較。3.自變量的單因素分析了解自變量與因變量的分布檢驗是否符合建立模型的應(yīng)用條件偏離應(yīng)用條件時,進行數(shù)據(jù)變換各個自變量兩組間的比較計數(shù)資料計量資料雙變量分析4.變量的篩選變量篩選的原則專業(yè)上考慮測量上考慮共線性問題:計算相關(guān)矩陣,相關(guān)系數(shù)0.8-0.9,則選其一。缺失數(shù)據(jù)少、測量誤差低的優(yōu)先選擇經(jīng)驗上考慮雙變量分析中有顯著性的自變量(P≤0.15)選擇那些改變主效應(yīng)的自變量變量的篩選變量篩選的可用方法逐步logistic回歸:自動選擇有顯著性的自變量,不僅用于自變量的剔選,也用于交互作用項是否顯著的判斷。前進法:逐個引入模型外的變量后退法:放入所有變量,再逐個篩選
理論上看,前進法選擇變量的經(jīng)驗公式缺乏總體概念,當用于因素分析時,建議用后退法。當變量間有完全相關(guān)性時,后退法無法使用,可用前進法。5.交互作用的引入交互作用的定義當自變量和因變量的關(guān)系隨第三個變量的變化而改變時,則存在交互作用交互作用項的引入基于臨床實際認為對結(jié)果有重要影響基于模型應(yīng)用條件的分析引入兩個自變量的乘積項交互作用的檢驗交互作用的解釋6.建立多個模型飽和模型自定義的模型從飽和模型中選擇自變量再建立模型飽和模型(saturatedmodel)是指各觀測變量之間均容許相關(guān)的最復(fù)雜模型,自由度為0.飽和模型其實是人為設(shè)定的約束條件最少的模型,純粹按照數(shù)據(jù)的相互關(guān)系來構(gòu)建最優(yōu)的模型,所以,它是數(shù)學(xué)上最優(yōu)的模型,一種理想的狀態(tài)。
7.選擇較優(yōu)的模型模型擬合優(yōu)度檢驗AIC(Akaikeinformationcriterion):同一資料的多個模型的比較,此值越小,模型越合適。SC(Schwartzcriterion):同上Score統(tǒng)計量:同上,但不包括截距項。似然比檢驗(OmnibusTest):檢驗全部自變量的作用是否顯著。較為可靠。適用于含連續(xù)性變量的情況。模型擬合好,x2值大,P值小。Hosmer-Lemeshow檢驗:評價估計概率和觀察概率接近的程度。適用于含連續(xù)性變量的情況。模型好,x2值小,P值大。非條件logistic回歸的SPSS實現(xiàn)AnalyzeRegressionBinarylogistic應(yīng)變量自變量非條件logistic回歸的SPSS實現(xiàn)AnalyzeRegressionBinarylogistic8.模型應(yīng)用條件的評價殘差分析殘差是觀察值與估計值之差合理的logistic回歸模型也可能得到不理想的殘差,這在自變量是二分類變量時更易出現(xiàn)。增加交互作用項可能增加模型的效能非條件logistic回歸的SPSS實現(xiàn)AnalyzeRegressionBinarylogistic應(yīng)變量自變量非條件logistic回歸的SPSS實現(xiàn)AnalyzeRegressionBinarylogistic9.輸出結(jié)果的解釋模型中各個系數(shù)的顯著性檢驗Wald檢驗:類似于直線回歸系數(shù)的t檢驗Waldx2檢驗:同上似然比檢驗:自變量不在模型中與在模型中的似然值比較。Score檢驗輸出結(jié)果的解釋回歸系數(shù)的解釋系數(shù)的正負值:正(負)系數(shù)表示隨自變量的增加因變量logit值的增加(減少)。二分類自變量系數(shù)為比數(shù)比的對數(shù)值,由此比數(shù)比=eb多分類自變量
以第i類作參照,比較相鄰或相隔的兩個類別。連續(xù)型自變量當自變量改變一個單位時,比數(shù)比為eb輸出結(jié)果的解釋模型擬合的優(yōu)劣自變量與結(jié)果變量(因變量)有無關(guān)系確認因變量與自變量的編碼模型包含的各個自變量的臨床意義由模型回歸系數(shù)計算得到的各個自變量的比數(shù)比的臨床意義輸出結(jié)果的解釋模型的預(yù)測結(jié)果的評價敏感度、特異度和陽性預(yù)測值正確選擇預(yù)測概率界值,簡單地以0.5為界值,但并不是最好的。C指數(shù)預(yù)測結(jié)果與觀察結(jié)果的一致性的度量。C值越大(最大為1),模型預(yù)測結(jié)果的能力越強。非條件logistic回歸的SPSS實現(xiàn)AnalyzeRegressionBinarylogistic應(yīng)變量自變量非條件logistic回歸的SPSS實現(xiàn)AnalyzeRegressionBinarylogistic非條件logistic回歸研究對象之間是否發(fā)生某事件是獨立的。適用于:成組的病例-對照研究無分層的隊列研究或橫斷面調(diào)查診斷性試驗條件logistic回歸研究中有N個配比組,每組中n個病例配m個對照者。這時各個研究對象發(fā)生某事件的概率即為條件概率。適用于配比設(shè)計的病例-對照研究精細分層設(shè)計的隊列研究校正混雜因素一般采用Mantel-Haenszel分層分析分層較細或存在格子零頻數(shù)時,M-H法無法采用。logistic回歸分析可綜合校正多個混雜因素的影響Logistic應(yīng)用-疾病預(yù)后的估計logistic回歸模型作為一種概率模型,可用于預(yù)測某事件發(fā)生的概率。logistic回歸不要求在因變量正態(tài)假設(shè)的前提下進行預(yù)測。其預(yù)測的準確性取決于擬合數(shù)據(jù)資料的代表性Logistic應(yīng)用-疾病診斷疾病診斷的判別診斷性試驗研究中,敏感度和特異度的估計logistic回歸模型綜合校正協(xié)變量的影響充分利用數(shù)據(jù)提供的信息可進行95%可信區(qū)間的估計logistic回歸的其他問題多分類logistic回歸模型因變量為二分類變量因變量為多分類變量多分類logistic回歸其他問題研究對象例數(shù)的確定研究設(shè)計時樣本含量的估計經(jīng)驗方法:模型中的每一自變量至少需要出現(xiàn)10個結(jié)局。給定例數(shù)時自變量太多刪除變量合并變量及變量的分類其他問題logistic回歸的局限性理論上的不足:自變量對疾病的影響是獨立的,但實際情況及推導(dǎo)結(jié)果不同。模型有不合理性:“乘法模型”與一般希望的“相加模型”相矛盾。樣本含量不宜太少:例數(shù)大于200例時才可不考慮參數(shù)估計的偏性。相關(guān)閱讀-logistic回歸分析在醫(yī)院/衛(wèi)生管理工作中的應(yīng)用住院病例醫(yī)療費用分布及影響因素Logistic回歸分析醫(yī)療風險影響因素的有序多分類Logistic回歸分析10種系統(tǒng)疾病住院醫(yī)療費用的Logistic分析2009年出院病人住院日影響因素Logistic回歸分析超長住院日影響因素的Logistic回歸分析病人選擇就診醫(yī)院影響因素的lo
溫馨提示
- 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
- 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
- 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
- 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負責。
- 6. 下載文件中如有侵權(quán)或不適當內(nèi)容,請與我們聯(lián)系,我們立即糾正。
- 7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。
最新文檔
- 匯報溝通職場中的軟實力
- 未來商業(yè)發(fā)展趨勢與市場分析
- 生產(chǎn)線工藝改進的思路與實踐案例
- “比賽場次”(說課稿)-2024-2025學(xué)年六年級數(shù)學(xué)上冊北師大版
- 《7 栽小蔥》(說課稿)三年級下冊科學(xué)蘇教版
- Module 1 Unit 2 I'm Danny(說課稿)-2024-2025學(xué)年牛津上海版(試用本)英語二年級上冊
- Unit3 What would you like?(說課稿)-2024-2025學(xué)年人教PEP版英語五年級上冊001
- 16 宇宙的另一邊 說課稿-2023-2024學(xué)年語文三年級下冊統(tǒng)編版
- 7 不甘屈辱 奮勇抗爭(說課稿)-2023-2024學(xué)年統(tǒng)編版道德與法治五年級下冊
- 《6 怎么都快樂》說課稿-2024-2025學(xué)年一年級下冊語文統(tǒng)編版(2024)001
- 高考百日誓師動員大會
- 賈玲何歡《真假老師》小品臺詞
- 2024年北京東城社區(qū)工作者招聘筆試真題
- 《敏捷項目管理》課件
- 統(tǒng)編版(2024新版)七年級上學(xué)期道德與法治期末綜合測試卷(含答案)
- 黑龍江省哈爾濱市2024屆中考數(shù)學(xué)試卷(含答案)
- 前程無憂測評題庫及答案
- 高三日語一輪復(fù)習助詞「と」的用法課件
- 物業(yè)管理服務(wù)房屋及公用設(shè)施維修養(yǎng)護方案
- 醫(yī)療器械法規(guī)培訓(xùn)
- 無子女離婚協(xié)議書范文百度網(wǎng)盤
評論
0/150
提交評論