Logistic回歸(1)PPT學(xué)習(xí)教案_第1頁
Logistic回歸(1)PPT學(xué)習(xí)教案_第2頁
Logistic回歸(1)PPT學(xué)習(xí)教案_第3頁
Logistic回歸(1)PPT學(xué)習(xí)教案_第4頁
Logistic回歸(1)PPT學(xué)習(xí)教案_第5頁
已閱讀5頁,還剩31頁未讀, 繼續(xù)免費(fèi)閱讀

下載本文檔

版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進(jìn)行舉報或認(rèn)領(lǐng)

文檔簡介

1、會計學(xué)1Logistic回歸回歸(1)392講述內(nèi)容講述內(nèi)容: :第一節(jié)第一節(jié) logisticlogistic回歸回歸第二節(jié)第二節(jié) 條件條件logisticlogistic回歸回歸第三節(jié)第三節(jié) logisticlogistic回歸的應(yīng)用回歸的應(yīng)用 及其注意事項及其注意事項第1頁/共36頁393目的:目的:作出以多個自變量(危險因素)估計作出以多個自變量(危險因素)估計應(yīng)變量(應(yīng)變量(結(jié)果因素)結(jié)果因素)的的logistic回歸方程。屬于概率型非線性回歸?;貧w方程。屬于概率型非線性回歸。資料:資料:1. 應(yīng)變量為反映某現(xiàn)象發(fā)生與不發(fā)生的二值變量;應(yīng)變量為反映某現(xiàn)象發(fā)生與不發(fā)生的二值變量;2.

2、自變量宜全部或大部分為分類變量,可有少數(shù)數(shù)值變量。分類變量要數(shù)量化。自變量宜全部或大部分為分類變量,可有少數(shù)數(shù)值變量。分類變量要數(shù)量化。第2頁/共36頁394用途:用途:研究某種疾病或現(xiàn)象發(fā)生和多個危研究某種疾病或現(xiàn)象發(fā)生和多個危 險因素(或保護(hù)因子)的數(shù)量關(guān)系。險因素(或保護(hù)因子)的數(shù)量關(guān)系。 用用 檢驗(或檢驗(或u檢驗)的檢驗)的局限性局限性: 1.只能研究只能研究1個危險因素;個危險因素; 2.只能得出定性結(jié)論。只能得出定性結(jié)論。2第3頁/共36頁395 種類種類: 1. 成組(非條件)成組(非條件)logistic回歸方程?;貧w方程。 2. 配對(條件)配對(條件)logistic回

3、歸方程?;貧w方程。第4頁/共36頁396第一節(jié)第一節(jié) logistic回歸回歸 (非條件(非條件logistic回歸回歸 )第5頁/共36頁7 1.1.應(yīng)用背景應(yīng)用背景 LogisticLogistic回歸模型是一種概率模型,適合于病例對照研究、隨訪研究和橫斷面研究,且結(jié)果發(fā)生的變量取值必須是二分的或多項分類??捎糜绊懡Y(jié)果變量發(fā)生的因素為自變量與因變量,建立回歸方程。第6頁/共36頁82、LogisticLogistic回歸模型的數(shù)據(jù)結(jié)構(gòu)第7頁/共36頁9 n yn an1 an2 an3anp其中:y取值是二值或多項分類第8頁/共36頁n第9頁/共36頁11兩個,不滿足正態(tài)分布。兩個,不滿足

4、正態(tài)分布。第10頁/共36頁12l 令令: y=1 發(fā)?。栃?、死亡、治愈等)發(fā)?。栃浴⑺劳?、治愈等)l y=0 未發(fā)病(陰性、生存、未治愈等)未發(fā)?。幮浴⑸?、未治愈等)l 將發(fā)病的概率記為將發(fā)病的概率記為P,它與自變量,它與自變量x x1 1, , x x2 2, ,x,xp p之間的之間的Logistic回歸模型為:回歸模型為:l可知,不發(fā)病的概率為:可知,不發(fā)病的概率為:l )exp(1)exp(110110ppppXXXXp )exp(111110ppXXp 第11頁/共36頁經(jīng)數(shù)學(xué)變換得:定義:為Logistic變換,即: ppXXpp 110)1/(ln)1/(ln)(log

5、pppitppXXpLogit 110)(第12頁/共36頁14 4、回歸系數(shù)i的意義 流行病學(xué)的常用指標(biāo)優(yōu)勢比(odds ratio,OR)或稱比數(shù)比,定義為:暴露人群發(fā)病優(yōu)勢與非暴露人群發(fā)病優(yōu)勢之比。 即Xi的優(yōu)勢比為:)1/()1/(0011PPPPORiiiPitPitORLn)0() 1()0(log)1 (log)(00第13頁/共36頁ibi的標(biāo)準(zhǔn)差。為的標(biāo)準(zhǔn)差,為其中ySXSSSbbyiiyiii,/*影響越大。其因素對的估計值,此值越大,為Ybii)(96. 1exp(iibSEb 第14頁/共36頁二 、Logistic回歸的參數(shù)估計及意義 Logistic回歸的參數(shù)估計及

6、意義 P表示某個體發(fā)生某病的概率,自變量表示m個危險因素,式中的常數(shù)項表示在無各危險因素時的發(fā)病概率對不發(fā)病概率之比的自然對數(shù),而logistic回歸系數(shù)表示當(dāng)危險因素每變化1個單位時(其它危險因素取值的變化量。 通常用最大似然估計法求解模型中參數(shù)的估計值 似然函數(shù) niYiYiiiPPL11)1(第15頁/共36頁pii, 2 , 1 , 0, 0 0i20i0i計算統(tǒng)計量為:Wald2,自由度等于1。第16頁/共36頁182d2lndGDD 不包含此變量的模型 包含此變量的模型不含此變量的似然函數(shù)含此變量的似然函數(shù)第17頁/共36頁19Model Parameter -2lnL P-val

7、ue G Score 1 0 244.346 0.02 - - 2 0, 1 236.736 0.03 7.610 7.854 3 0, 1, 2 227.200 0.06 9.536 6.898 4 0, 1, 2,3 222.616 0.09 4.583 5.309 Comparing Model 3 and 4 200.227ln2L 616.222ln2L 583. 4616.222200.227)ln2(ln2LLG 13412kk, 05. 0P Model 4 is the best model 第18頁/共36頁20Wald 檢驗 將各參數(shù)的估計值jb與 0 比較,而用它的標(biāo)準(zhǔn)

8、誤jbS作為參照,檢驗統(tǒng)計量為 2, 1jjjjbbbbuSS2 或 221220111022120.8856 34.860.15000.5261 11.200 :0, :0, 0.05,:0, :0,.157 0 05,2.HHHH 2值均大于 3.84,說明食道癌與吸煙、飲酒有關(guān)系,結(jié)論同前。 2.第19頁/共36頁21第20頁/共36頁22第21頁/共36頁、似然比檢驗檢驗統(tǒng)計量為 )ln(ln201LLG G服從2分布, 自由度為增加變量的個數(shù)。、Wald檢驗 檢驗統(tǒng)計量為22)(SE第22頁/共36頁第23頁/共36頁25第24頁/共36頁26是危險因素;當(dāng)bi0時,對應(yīng)的優(yōu)勢比OR

9、i=exp(bi)1,說明該因素是保護(hù)因素。n第25頁/共36頁27 method method中文名稱中文名稱剔除依據(jù)剔除依據(jù)EnterEnter全部進(jìn)入全部進(jìn)入Forward:condiForward:conditionaltional向前逐步向前逐步條件參數(shù)估計似然比條件參數(shù)估計似然比Forward:LRForward:LR向前逐步向前逐步最大偏似然估計似然比最大偏似然估計似然比Forward:WaldForward:Wald向前逐步向前逐步WaldWald統(tǒng)計量統(tǒng)計量Backward:condBackward:conditionalitional向后逐步向后逐步條件參數(shù)估計似然比條件參

10、數(shù)估計似然比Backward:LRBackward:LR向后逐步向后逐步最大偏似然估計似然比最大偏似然估計似然比Backward:WaldBackward:Wald 向后逐步向后逐步WaldWald統(tǒng)計量統(tǒng)計量第26頁/共36頁28第27頁/共36頁例 題第28頁/共36頁性別年齡學(xué)歷體重指數(shù)家族史吸煙血壓總膽固醇甘油三脂hdlldl糖尿病160221114.301.501.242.300148321114.601.321.152.300263211124.601.151.152.300168322114.151.431.073.210145212113.421.22.632.30014533

11、2114.16.96.982.650159211114.321.021.053.490168331113.801.422.86.850263221113.871.552.44.810第29頁/共36頁因素變量名賦值說明性別X1男=1,女=2年齡X2學(xué)歷X3小學(xué)以下=1,小學(xué)=2,初中=3,高中=4,大專及以上=5體重指數(shù)X424=1, 2426=2, 26=3家族史X5無=1,有=2吸煙X6不吸=1,吸=2血壓X7正常=1,高=2總膽固醇X8甘油三酯X9高密度脂蛋白X10低密度脂蛋白X11糖尿病Y對照=0,病例=1第30頁/共36頁第31頁/共36頁第32頁/共36頁Variables in

12、the EquationVariables in the Equation.263.636.1711.6791.301.3744.527.085.0365.5211.0191.0891.0141.168-.699.2985.5131.019.497.277.8911.621.5528.6211.0035.0561.71414.9151.634.6825.7441.0175.1241.34719.4973.126.71419.1741.00022.7875.62392.3411.647.6706.0401.0145.1901.39619.298.606.4721.6471.1991.832.72

13、74.6212.3121.0424.9291.02610.0981.31177.767-.914.4324.4841.034.401.172.934.017.416.0021.9671.017.4502.300-20.2074.65218.8661.000.000性別年齡學(xué)歷體重指數(shù)家族史吸煙血壓總膽固醇甘油三脂hdlldlConstantStep1aBS.E.WalddfSig.Exp(B)LowerUpper95.0% C.I.for EXP(B)Variable(s) entered on step 1: 性別, 年齡, 學(xué)歷, 體重指數(shù), 家族史, 吸煙, 血壓, 總膽固醇, 甘油三脂, hdl, ldl.a. 第33頁/共36頁第34頁/共36頁

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負(fù)責(zé)。
  • 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時也不承擔(dān)用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

最新文檔

評論

0/150

提交評論