




版權(quán)說(shuō)明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請(qǐng)進(jìn)行舉報(bào)或認(rèn)領(lǐng)
文檔簡(jiǎn)介
醫(yī)用SAS統(tǒng)計(jì)分析第五(dìwǔ)講3/2/20231第一頁(yè),共七十五頁(yè)。
一、多元線性回歸
基本概念
多元線性回歸簡(jiǎn)稱多元回歸,是研究一個(gè)應(yīng)變量與多個(gè)自變量間線性依存關(guān)系數(shù)量(shùliàng)變化規(guī)律的一種方法。
多元線性回歸方程式中:b0為回歸方程常數(shù)項(xiàng),bj(j=1,2,┅,m)為偏回歸系數(shù),即在其他自變量固定的條件下,Xj改變(gǎibiàn)一個(gè)單位時(shí)應(yīng)變量的改變(gǎibiàn)量。
3/2/20232第二頁(yè),共七十五頁(yè)。多元線性回歸方程的應(yīng)用
預(yù)測(cè)應(yīng)變量的估計(jì)值
探索影響(yǐngxiǎng)應(yīng)變量y的主要因素當(dāng)X為某一定值時(shí),估計(jì)應(yīng)變量y的容許區(qū)間當(dāng)X為某一定值時(shí),估計(jì)其應(yīng)變量的總體均數(shù)的置信區(qū)間3/2/20233第三頁(yè),共七十五頁(yè)。語(yǔ)句格式
同單變量線性回歸基本相同。procreg[選項(xiàng)];model應(yīng)變量=自變量名列/[選項(xiàng)];必選語(yǔ)句,定義回歸分析模型procreg語(yǔ)句的[選項(xiàng)]data=數(shù)據(jù)集指明回歸分析(fēnxī)所用的數(shù)據(jù)集。
outset=數(shù)據(jù)集指定一個(gè)輸出數(shù)據(jù)集,用以存儲(chǔ)回歸分析所得的參數(shù)估計(jì)。
simple輸出每個(gè)變量的簡(jiǎn)單統(tǒng)計(jì)結(jié)果。3/2/20234第四頁(yè),共七十五頁(yè)。model語(yǔ)句的[選項(xiàng)]selection=method規(guī)定變量篩選方法,method可以是以下幾種選項(xiàng):
forward(或f)前進(jìn)法,按照sle規(guī)定的P值從無(wú)到有依次選一個(gè)變量進(jìn)入模型
backward(或b)后退法,按照sls規(guī)定的P值從含有全部變量的模型開始,以次剔除一個(gè)變量。
stepwise逐步(zhúbù)法,按照sle的標(biāo)準(zhǔn)依次選入變量,同時(shí)對(duì)模型中現(xiàn)有的變量按sls的標(biāo)準(zhǔn)剔除不顯著的變量。注:[選項(xiàng)]中沒(méi)有selection語(yǔ)句時(shí),模型中含有全部自變量的回歸模型。
sle=概率值入選標(biāo)準(zhǔn),規(guī)定變量入選模型的顯著性水平,前進(jìn)法默認(rèn)為0.5,逐步法默認(rèn)為0.15。
sls=概率值剔除標(biāo)準(zhǔn),指定變量保留在模型的顯著性水平,后退法默認(rèn)為0.1,逐步法默認(rèn)為0.15。3/2/20235第五頁(yè),共七十五頁(yè)。
stb
輸出各自變量的標(biāo)準(zhǔn)偏回歸系數(shù)。
cli輸出個(gè)體y值的95%容許區(qū)間上下限
clm
輸出預(yù)測(cè)值均值的95%可信區(qū)間上下限。
P輸出實(shí)際(shíjì)值Yi,預(yù)測(cè)值、殘差及其標(biāo)準(zhǔn)誤。
tol
輸出各自變量的容許值。0≤tol值≤1,越接近于0,共線性越嚴(yán)重。
vif輸出各自變量的方差膨脹因子。當(dāng)vif≥10時(shí),可認(rèn)為多元共線性嚴(yán)重存在。
collin要求詳細(xì)分析自變量之間的共線性,給出信息矩陣的特征根、條件指數(shù)和方差比,當(dāng)條件指數(shù)≥10,方差比>0.5時(shí),可認(rèn)為存在多元共線性。
collinoint
與選擇項(xiàng)collin作用相同,但不包括回歸常數(shù)。
R
進(jìn)行預(yù)測(cè)值的殘差分析(即異常值識(shí)別與強(qiáng)影響分析),輸出學(xué)生化殘差值和Cook’s距離D值。當(dāng)學(xué)生化殘差值>2時(shí),所對(duì)應(yīng)的點(diǎn)可能是異常點(diǎn),當(dāng)D值>0.5時(shí),可認(rèn)為對(duì)應(yīng)的變量值對(duì)回歸函數(shù)是強(qiáng)影響點(diǎn)。3/2/20236第六頁(yè),共七十五頁(yè)。
完全多元線性回歸
例7-710名女中學(xué)生的體重(tǐzhòng)(X1,kg),胸圍(X2,cm),胸圍的呼吸差(X3,cm)及肺活量(Y,ml)的資料如下表所示。現(xiàn)作應(yīng)變量Y對(duì)自變量X1,X2,X3的三元線性回歸方程。datamreg1;inputx1x2x3y@@;cards;35690.7160040742.5260040642.0210042743.0265037721.1240045681.5220043784.3275037662.0160044703.2275042653.02500;procreg;modely=x1x2x3/stb;run;3/2/20237第七頁(yè),共七十五頁(yè)。Model:MODEL1DependentVariable:YAnalysisofVarianceSumofMeanSourceDFSquaresSquareFValueProb>FModel31250109.0678416703.022595.6170.0355Error6445140.9322274190.15537CTotal91695250RootMSE272.37870R-square0.7374DepMean2315.00000AdjR-sq0.6061C.V.11.76582
3/2/20238第八頁(yè),共七十五頁(yè)。ParameterEstimatesParameterStandardTforH0:VariableDFEstimateErrorParameter=0Prob>|T|INTERCEP1-3035.5363542168.6738473-1.4000.2111X1160.93182336.297137981.6790.1442X2137.80833422.980808911.6450.1510X31101.379460121.974703100.8310.4377StandardizedVariableEstimateINTERCEP0.00000000X10.46445689X20.39174762X30.253994503/2/20239第九頁(yè),共七十五頁(yè)。
逐步回歸
簡(jiǎn)介
逐步回歸是篩選自變量的常用的方法之一。篩選自變量的方法還有前進(jìn)法,后退法和最優(yōu)回歸子集法。逐步回歸法是依據(jù)事先給定的兩個(gè)顯著性水平SLE和SLS,將自變量逐個(gè)引入方程,同時(shí)每引入一個(gè)新變量后,對(duì)已選入的變量要進(jìn)行逐個(gè)檢驗(yàn),將不顯著的變量剔除,這樣保證最后所得的變量都有顯著性。自變量間的多重共線性(multicollinearity)
整個(gè)回歸方程的統(tǒng)計(jì)檢驗(yàn)P<α,而各偏回歸系數(shù)的檢驗(yàn)均出現(xiàn)(chūxiàn)P>α的矛盾現(xiàn)象。偏回歸系數(shù)的估計(jì)值明顯與實(shí)際情況不符,或者是偏回歸系數(shù)的符號(hào)與專業(yè)知識(shí)的情況相反。3/2/202310第十頁(yè),共七十五頁(yè)。據(jù)專業(yè)知識(shí),該自變量與應(yīng)變量間關(guān)系密切,而偏回歸系數(shù)檢驗(yàn)結(jié)果P>α。增加(或刪除)一個(gè)變量,或者改變(或去除)一個(gè)觀察值,引起回歸系數(shù)估計(jì)值發(fā)生大的變化。多重共線性是引起上述問(wèn)題的重要原因。解決(jiějué)多重共線性的辦法
用主成分估計(jì)等有偏估計(jì)替代最小二乘估計(jì)。用逐步回歸等方法篩選自變量。如上例7-7,整個(gè)回歸模型P=0.0355,而b0,b1,b2,b3P值均大于0.05。估計(jì)變量之間存在共線性問(wèn)題。3/2/202311第十一頁(yè),共七十五頁(yè)。程序(chéngxù)7-13datastepreg1;inputx1x2x3y@@;cards;35690.7160040742.5260040642.0210042743.0265037721.1240045681.5220043784.3275037662.0160044703.2275042653.02500;procreg;modely=x1-x3/stbtolvifcollincollinointR;modely=x1-x3/selection=stepwisesle=0.25sls=0.25stb;run;3/2/202312第十二頁(yè),共七十五頁(yè)。
例(《醫(yī)學(xué)統(tǒng)計(jì)學(xué)》王潔貞主編,例15.1)
某科研協(xié)作組調(diào)查某煤礦Ⅱ期高血壓病患者40例,X1為工作面污染程度等級(jí),X2為井下工齡(年),X3為體重(kg),X4為吸煙年限(niánxiàn)(年),X5為飲酒年限(niánxiàn)(年),Y為收縮壓(kPa),試作多元線性回歸分析。datastepreg2;infile'd:\sas\sas5\wang15_1.txt';inputidx1x2x3x4x5y@@;procreg;modely=x1-x5/stbtolvifcollincollinointr;modely=x1-x5/selection=stepwisesle=0.05sls=0.05stb;run;3/2/202313第十三頁(yè),共七十五頁(yè)。
二、多元線性相關(guān)
研究多個(gè)變量間線性關(guān)系的一種統(tǒng)計(jì)分析方法。變量間相關(guān)系數(shù)有以下三類:
簡(jiǎn)單相關(guān)系數(shù)它是說(shuō)明(shuōmíng)兩個(gè)變量相關(guān)程度和方向(不考慮其他變量的影響)的統(tǒng)計(jì)指標(biāo)(ri,j)。
偏相關(guān)系數(shù)它是當(dāng)其他變量固定時(shí),說(shuō)明某兩個(gè)變量間相關(guān)程度和方向的統(tǒng)計(jì)指標(biāo)(如r12,3)。
復(fù)相關(guān)系數(shù)R亦稱為全相關(guān)系數(shù)。說(shuō)明應(yīng)變量與各自變量的線性關(guān)系的密切程度。
決定系數(shù)R2復(fù)相關(guān)系數(shù)的平方。它說(shuō)明應(yīng)變量的變異中由各自變量的改變而引起的占多少。如R2=0.8,則說(shuō)明應(yīng)變量的變異中有80%由自變量的改變而引起的。3/2/202314第十四頁(yè),共七十五頁(yè)。
程序7-12datamcorr1;infile'd:\sas\sas5\mcorr1.txt';inputx1x2x3y@@;proccorrnosimple;/*禁止一些簡(jiǎn)單統(tǒng)計(jì)量的輸出*/varx1x2x3y;/*包括(bāokuò)了所有變量,實(shí)際可以省略*/proccorrnosimple;varx1x2;partialx3;/*partial語(yǔ)句的作用是固定x3*/proccorrnosimple;varx1x2;partialx3y;/*partial語(yǔ)句的作用是固定x3和y*/run;3/2/202315第十五頁(yè),共七十五頁(yè)。
三、Logistic回歸分析
簡(jiǎn)介
Logistic回歸模型是適用(shìyòng)于應(yīng)變量(因變量)為分類變量的回歸分析。當(dāng)應(yīng)變量為分類變量時(shí),如應(yīng)變量結(jié)果為二分類變量的發(fā)病、不發(fā)病,生存、死亡等,是不能用多元線性回歸模型(Y=β0+Σβixi)來(lái)分析各種危險(xiǎn)因素與應(yīng)變量之間的關(guān)系的。因?yàn)閼?yīng)變量Y只能取值為1和0。不符合線性回歸模型中應(yīng)變量Y應(yīng)具有正態(tài)分布和方差齊性的要求,同時(shí)線性回歸模型得到的Y值會(huì)出現(xiàn)大于1或小于0的不合理結(jié)果,顯然不能用線性回歸建立預(yù)測(cè)模型。
以發(fā)病為例,發(fā)病的概率為P,不發(fā)病的概率為1-P,0≤P≤1。公式(gōngshì)等號(hào)左邊簡(jiǎn)稱為logit(P),即logit(P)=β0+Σβixi可證明(zhèngmíng),無(wú)論Y得何值,均0<P<1。上式可推導(dǎo)為:3/2/202316第十六頁(yè),共七十五頁(yè)。
Logistic回歸的應(yīng)用
logistic回歸在流行病學(xué)和臨床流行病學(xué)等方面應(yīng)用廣泛,既可用于前瞻性的隊(duì)列研究,又可用于回顧性的病例(bìnglì)對(duì)照研究。常用于:病因?qū)W分析(fēnxī);預(yù)后(yùhòu)分析;鑒別診斷;評(píng)價(jià)治療措施;毒物的半數(shù)效量和聯(lián)合作用3/2/202317第十七頁(yè),共七十五頁(yè)。Logistic回歸的分類
按應(yīng)變量的類型分類為:
兩分類的Logistic回歸
非條件logistic回歸
即研究對(duì)象未經(jīng)過(guò)配對(duì)(pèiduì)。(在SAS中調(diào)用logistic模塊進(jìn)行統(tǒng)計(jì))。
條件logistic回歸
即在配對(duì)病例對(duì)照研究中的1:1和1:M及N:M配對(duì)。(在SAS中調(diào)用Phreg模塊進(jìn)行統(tǒng)計(jì))。
多分類有序反應(yīng)變量的Logistic回歸(在SAS中調(diào)用logistic模塊進(jìn)行統(tǒng)計(jì))。多分類無(wú)序反應(yīng)變量的Logistic回歸(在SAS中調(diào)用Catmod模塊進(jìn)行統(tǒng)計(jì))。本講主要介紹兩分類Logistic回歸
3/2/202318第十八頁(yè),共七十五頁(yè)。
兩分類(fēnlèi)非條件Logistic回歸
語(yǔ)法格式
Proclogistic[data=數(shù)據(jù)集][選項(xiàng)];model應(yīng)變量名=自變量名列/[選項(xiàng)];[freq<變量名>];可選項(xiàng),指明頻數(shù)變量。output<out=數(shù)據(jù)集><pred|p=變量名>;
output語(yǔ)句創(chuàng)建一個(gè)新的SAS數(shù)據(jù)集,其含有每個(gè)個(gè)體的原始數(shù)據(jù),pred|p=變量名為在out=數(shù)據(jù)集中含有每個(gè)個(gè)體預(yù)測(cè)概率?!綪roc語(yǔ)句的[選項(xiàng)]】
order=data規(guī)定按照數(shù)據(jù)集中反應(yīng)變量水平出現(xiàn)的先后順序進(jìn)行運(yùn)算。
descending(或des)規(guī)定按照反應(yīng)變量降序水平進(jìn)行運(yùn)算。3/2/202319第十九頁(yè),共七十五頁(yè)。
注意:以上兩個(gè)選項(xiàng)非常重要,如死亡為1,存活為0,為了得到死亡對(duì)存活的概率(或者說(shuō)是死亡的危險(xiǎn)),應(yīng)選擇(xuǎnzé)此兩個(gè)選項(xiàng)之一,否則得到的是存活對(duì)死亡的概率,因?yàn)閘ogistic回歸模型是自動(dòng)按反應(yīng)變量值為小的來(lái)擬合方程的。反之,如果死亡為0,存活為1,可不選此兩項(xiàng)之一,【model語(yǔ)句的[選項(xiàng)]】
selection=forward(或f)|backward(或b)|stepwise(或s)|score規(guī)定變量的篩選方法,分別為向前、向后、逐步和最優(yōu)子集法。缺省時(shí)為none,擬合全回歸模型。
sle=概率值指定變量進(jìn)人模型的顯著水平,缺省為0.05。
sls=概率值指定變量剔除模型的顯著水平,缺省為0.05。
CL計(jì)算輸出所有回歸參數(shù)的可信區(qū)間。3/2/202320第二十頁(yè),共七十五頁(yè)。clodds=pl計(jì)算輸出OR的可信區(qū)間。
scale=noneaggregate要求對(duì)模型進(jìn)行擬合優(yōu)度檢驗(yàn)。
例9-4
40例病人的治愈情況Y(Y=0表示(biǎoshì)未愈,Y=1表示(biǎoshì)治愈,病情嚴(yán)重程度X1(X1=0表示(biǎoshì)不嚴(yán)重,X1=1表示(biǎoshì)嚴(yán)重),年齡X2為連續(xù)變量,治療方法X3(X3=0表示(biǎoshì)新方法,X3=1表示(biǎoshì)一般療法),數(shù)據(jù)如表9.6,試作logistic回歸分析。程序9-4datac;infile'd:\sas\sas5\cx9_4.txt';inputyx1-x3;proclogisticdes;/*按降序水平進(jìn)行運(yùn)算*/modely=x1-x3/scale=noneaggregate;/*對(duì)模型進(jìn)行擬合優(yōu)度檢驗(yàn)*/Outputout=bp=pr;/*在數(shù)據(jù)集b中含有每個(gè)個(gè)體的預(yù)測(cè)概率值*/
run;3/2/202321第二十一頁(yè),共七十五頁(yè)。
TheLOGISTICProcedureDataSet:WORK.C數(shù)據(jù)集名ResponseVariable:Y反應(yīng)變量YResponseLevels:2反應(yīng)變量水平數(shù)2NumberofObservations:40觀察值40LinkFunction:Logit聯(lián)系(liánxì)函數(shù)logit
ResponseProfile反應(yīng)變量的描述Ordered順序值ValueYCount計(jì)數(shù)值11172023
3/2/202322第二十二頁(yè),共七十五頁(yè)。
DevianceandPearsonGoodness-of-FitStatistics
模型(móxíng)的擬合優(yōu)度檢驗(yàn)Pr>CriterionDFValueValue/DFChi-SquareDeviance3136.32311.17170.2344Pearson3129.55830.95350.5402ModelFittingInformationandTestingGlobalNullHypothesisBETA=0
模型擬合信息和整體偏回歸系數(shù)為0的假設(shè)檢驗(yàn)InterceptInterceptandCriterionOnlyCovariatesChi-SquareforCovariates判斷的準(zhǔn)則僅有截距所有變量協(xié)變量的卡方AIC56.54855.413.SC58.23762.169.-2LOGL54.54847.4137.135with3DF(p=0.0677)Score..6.630with3DF(p=0.0847)3/2/202323第二十三頁(yè),共七十五頁(yè)。
AnalysisofMaximumLikelihoodEstimates
最大似然法估計(jì)值分析(fēnxī)ParameterStandardWaldPr>StandardizedOddsVariableDFEstimateErrorChi-SquareChi-SquareEstimateRatioINTERCPT13.70252.14422.98170.0842..X11-0.61570.71350.74460.3882-0.1718770.540X21-0.09390.06362.18120.1397-0.3093360.910X31-1.52360.73964.24300.0394-0.4248130.218
AssociationofPredictedProbabilitiesandObservedResponses
模型回代判別分析Concordant=71.9%(一致率)Somers'D=0.448Discordant=27.1%(非一致率)Gamma=0.452Tied=1.0%(結(jié)點(diǎn)率)Tau-a=0.224(391pairs)c=0.7243/2/202324第二十四頁(yè),共七十五頁(yè)。治愈(zhìyù)的概率模型為:例2
為了探討冠心病發(fā)生的有關(guān)危險(xiǎn)因素(yīnsù),對(duì)26例冠心病病人和28例對(duì)照者進(jìn)行病例對(duì)照研究,各因素的說(shuō)明見下表。試用logistic逐步回歸分析方法篩選危險(xiǎn)因素。3/2/202325第二十五頁(yè),共七十五頁(yè)。表冠心病8個(gè)可能的危險(xiǎn)因素與賦值因素變量名賦值說(shuō)明年齡(niánlíng)(歲)X1<45=1,4554=2,5564=3,65=4高血壓史X2無(wú)=0,有=1高血壓家族史X3無(wú)=0,有=1吸煙X4不吸=0,吸=1高血脂史X5無(wú)=0,有=1動(dòng)物脂肪攝入X6低=0,高=1體重指數(shù)(BMI)X7<24=1,24<26=2,26=3A型性格X8否=0,是=1冠心病Y對(duì)照=0,病例=1
3/2/202326第二十六頁(yè),共七十五頁(yè)。程序(chéngxù)dataex16_2;infile'd:\sas\sas5\log2.txt';inputx1-x8y;proclogisticdes;modely=x1-x8/selection=stepwisesle=0.1sls=0.1clodds=pl
;run;3/2/202327第二十七頁(yè),共七十五頁(yè)。條件Logistic回歸
條件Logistic回歸分析是用phreg(proportionalhazardregression,比例風(fēng)險(xiǎn)回歸)模塊完成的。Phreg模塊主要用于Cox回歸的計(jì)算)
語(yǔ)法格式
在data步先建立(jiànlì)一個(gè)時(shí)間啞變量,一般為time=1-case;(如病例case=1,對(duì)照case=0,則病例啞變量time=0,對(duì)照啞變量time=1,要求病例的time要小,對(duì)照的time要大)。如果病例case=0,對(duì)照case=1,時(shí)間啞變量為time=case。
Procphreg[選項(xiàng)];model<時(shí)間啞變量*對(duì)照指示變量名(數(shù)值)>=<自變量名列>/[選項(xiàng)];3/2/202328第二十八頁(yè),共七十五頁(yè)。Strata<配對(duì)組指示變量名>;Freq<頻數(shù)變量名>;【Procphreg[選項(xiàng)]】;nosummary不打印輸出事件和截尾數(shù)值。
simple輸出模型中變量的簡(jiǎn)單統(tǒng)計(jì)描述【model過(guò)程[選項(xiàng)]】
ties=discrete
用離散的logistic模型替代比例風(fēng)險(xiǎn)模型。此句必選!selection=forward(或f)|backward(或b)|stepwise(或s)|score規(guī)定變量的篩選方法,分別為向前(xiànɡqián)、向后、逐步和最優(yōu)子集法。缺省時(shí)為none,擬合全回歸模型。3/2/202329第二十九頁(yè),共七十五頁(yè)。
sle=概率值指定變量進(jìn)人模型的顯著水平,缺省為0.05。
sls=概率值指定變量剔除模型的顯著水平,缺省為0.05。
risklimits計(jì)算輸出(shūchū)RR的可信區(qū)間。
alpha=概率值
指定RR的(1-α)可信區(qū)間,缺省時(shí)為0.05。
1:1配對(duì)條件Logistic回歸例9-8為研究胃癌的危險(xiǎn)因素,某醫(yī)學(xué)院用103對(duì)1:1配對(duì)資料,這里選用其中10對(duì)三個(gè)因素,即X1(蛋白質(zhì)攝入量0,1,2,3),X2(不良飲食習(xí)慣0,1,2,3)及X3(精神因素0,1,2)。數(shù)據(jù)如表9.11。試作條件Logistic回歸分析。3/2/202330第三十頁(yè),共七十五頁(yè)。表9.1110對(duì)胃癌的1:1配對(duì)(pèiduì)數(shù)據(jù)對(duì)號(hào)病例對(duì)照X1X2X3X1X2X3123456789101001101132331212113201201212221101120020032020002010001000003/2/202331第三十一頁(yè),共七十五頁(yè)。程序datalog1_2;doid=1to10;docase=0to1;inputx1-x3@@;time=case;output;end;end;cards;130101032130012020120100111121
022200111000112000332220222000;procphreg;modeltime*case(1)=x1-x3/ties=discreteselection=stepwisesle=0.25sls=0.25;strataid;run;3/2/202332第三十二頁(yè),共七十五頁(yè)。ThePHREGProcedureDataSet:WORK.LOG1_2DependentVariable:TIME反應(yīng)變量timeCensoringVariable:CASE截尾變量caseCensoringValue(s):1截尾值為1TiesHandling:DISCRETE結(jié)點(diǎn)處理(chǔlǐ)方法為discreteSummaryoftheNumberofEventandCensoredValuesPercentStratumIDTotalEventCensoredCensored1121150.002221150.00┆┆┆┆┆┆101021150.00--------------------------------------------------------------Total20101050.003/2/202333第三十三頁(yè),共七十五頁(yè)。
Step1:VariableX3isentered.Themodelcontainsthefollowingexplanatoryvariables.X3TestingGlobalNullHypothesis:BETA=0WithoutWithCriterionCovariatesCovariatesModelChi-Square-2LOGL13.8637.1586.705with1DF(p=0.0096)Score..5.538with1DF(p=0.0186)Wald..3.139with1DF(p=0.0764)3/2/202334第三十四頁(yè),共七十五頁(yè)。Step2:VariableX2isentered.Themodelcontainsthefollowingexplanatoryvariables.X2X3TestingGlobalNullHypothesis:BETA=0WithoutWithCriterionCovariatesCovariatesModelChi-Square-2LOGL13.8633.72410.139with2DF(p=0.0063)Score..7.229with2DF(p=0.0269)Walt..2.467with2DF(p=0.2913)NOTE:No(additional)variablesmetthe0.25levelforentryintothemodel.3/2/202335第三十五頁(yè),共七十五頁(yè)。AnalysisofMaximumLikelihoodEstimatesParameterStandardWaldPr>RiskVariableDFEstimateErrorChi-SquareChi-SquareRatio
變量自由度參數(shù)(cānshù)估計(jì)值標(biāo)準(zhǔn)誤wald卡方值P值RR值X211.1653510.810802.065790.15063.207X312.0671571.639441.589850.20737.902SummaryofStepwiseProcedureVariableNumberScoreWaldPr>StepEnteredRemovedInChi-SquareChi-SquareChi-Square1X315.5385.0.01862X223.4594.0.0629胃癌(wèiái)患病的概率模型為:3/2/202336第三十六頁(yè),共七十五頁(yè)。
1:M或N:M的條件Logistic回歸
1:M配比是一個(gè)病例配M個(gè)對(duì)照,N:M配比是N個(gè)病例配M個(gè)對(duì)照。使用的SAS語(yǔ)句和1:1配對(duì)基本是一致的。
例題某北方(běifāng)城市研究喉癌發(fā)病的危險(xiǎn)因素,用1:2配對(duì)的病例-對(duì)照研究方法進(jìn)行了調(diào)查。先選取了6個(gè)可能的危險(xiǎn)因素并節(jié)錄25對(duì)數(shù)據(jù),各因素的賦值說(shuō)明見下表1,資料列于表2。試作條件Logistic逐步回歸。
3/2/202337第三十七頁(yè),共七十五頁(yè)。表1喉癌(hóuái)的危險(xiǎn)因素與賦值說(shuō)明
因素變量名賦值說(shuō)明咽炎X1無(wú)=1,偶爾=2,經(jīng)常=3吸煙量(支/日)X20=1,1~4=2,5~9=3,10~20=4,>20=5聲嘶史X3無(wú)=1,偶爾=2,經(jīng)常=3攝食新鮮蔬菜X4少=1,經(jīng)常=2,每天=3攝食水果X5很少=1,少量=2,經(jīng)常=3癌癥家族史X6無(wú)=0,有=1是否患喉癌Y病例=1,對(duì)照=03/2/202338第三十八頁(yè),共七十五頁(yè)。表2喉癌1:2配對(duì)病例-對(duì)照調(diào)查(diàochá)資料整理表配比組號(hào)
iYX1X2X3X4X5X6
j11351110011133001113302113113001113200121320
i
┊┊┊┊
┊┊┊
251141111011132001113303/2/202339第三十九頁(yè),共七十五頁(yè)。
程序(chéngxù)datalog1_4;infile'd:\sas\sas5\log1_4.txt';doi=1to25;doj=1to3;inputyx1-x6;time=1-y;output;end;end;procphregnosummary;modeltime*y(0)=x1-x6/ties=discreteselection=stepwisesle=0.1sls=0.1risklimits;stratai;run;3/2/202340第四十頁(yè),共七十五頁(yè)。四、生存分析簡(jiǎn)介
概念
生存分析是將事件的結(jié)果和出現(xiàn)此結(jié)果所經(jīng)歷的時(shí)間結(jié)合起來(lái)分析的統(tǒng)計(jì)分析方法。
生存分析的數(shù)據(jù)(shùjù)
完全數(shù)據(jù)
即掌握研究事件的起點(diǎn),又掌握終點(diǎn)的生存時(shí)間資料為完全數(shù)據(jù),一般用t來(lái)表示。
不完全數(shù)據(jù)①因遷移原因失去聯(lián)系;②死于其他原因;③在總結(jié)分析時(shí)仍然生存。生存分析中稱這種不完全數(shù)據(jù)為截尾數(shù)據(jù)、刪失數(shù)據(jù)、終檢數(shù)據(jù)(censoreddata)。
生存率(survivalrate)又稱累積生存概率,即個(gè)體活過(guò)時(shí)點(diǎn)t的概率,用S(t)表示。3/2/202341第四十一頁(yè),共七十五頁(yè)。
生存分析的三種變量(biànliàng)1.目標(biāo)變量
即生存時(shí)間,常記為t。2.協(xié)變量
可以是研究因素,也可以是排除其影響的因素,常記為x1,x2,┄,xp。3.截尾變量
常記為censor或d等。
生存分析的任務(wù)
估計(jì)生存率;比較生存率;尋找影響因素。
生存分析的方法
參數(shù)法已知生存時(shí)間T服從某特定的分布類型,對(duì)分布的參數(shù)作統(tǒng)計(jì)描述與推斷。常見的有:Weibull分布,指數(shù)分布,正態(tài)分布等。相應(yīng)的SAS過(guò)程為lifereg。非參數(shù)法不知生存時(shí)間T的分布類型或不符合特定的分布類型,對(duì)整個(gè)分布或某個(gè)特征作統(tǒng)計(jì)描述與推斷。常用乘積極限3/2/202342第四十二頁(yè),共七十五頁(yè)。法(productlimitmethod)和壽命表法(lifetablemethod)估計(jì)生存率和中位生存時(shí)間等;用時(shí)序檢驗(yàn)(log-ranktest),Wilcoxon檢驗(yàn)和似然比檢驗(yàn)等作分組比較。相應(yīng)的SAS過(guò)程為:lifetest
半?yún)?shù)法
不知生存時(shí)間分布確切類型,用模型(móxíng)的方法對(duì)模型(móxíng)的部分參數(shù)作統(tǒng)計(jì)描述與推斷。常用的是Cox模型(móxíng)。相應(yīng)的SAS過(guò)程為:phreg。注:半?yún)?shù)法與參數(shù)法可用來(lái)研究多個(gè)因素對(duì)生存時(shí)間的影響,非參數(shù)法難以實(shí)施多因素生存分析。
非參數(shù)法的lifetest過(guò)程語(yǔ)法格式:PROCLIFETEST[選項(xiàng)];TIME<生存時(shí)間變量*截尾指示變量(數(shù)值)>;3/2/202343第四十三頁(yè),共七十五頁(yè)。STRATA<分組變量名列>;(指定比較的分組變量,按分組變量名列分別進(jìn)行(jìnxíng)分析和比較。)TEST<協(xié)變量名列>;(指定協(xié)變量名列,檢驗(yàn)生存時(shí)間與該變量是否有關(guān))Freq<變量名>;(指定頻數(shù)變量名)PROC過(guò)程[選項(xiàng)]
1.method=方法指定估計(jì)生存率所用的方法:
PL
要求用乘積極限法(即Kaplan-Meier
法)估計(jì)生存率并計(jì)算中位生存時(shí)間等,為缺省方法。
LT
要求用壽命表法估計(jì)生存率等。2.intervals=(初值to終值by步長(zhǎng))或width=數(shù)值只能在指定方法為壽命表法時(shí)使用。用壽命表法分析時(shí),程序會(huì)自動(dòng)3/2/202344第四十四頁(yè),共七十五頁(yè)。
給定生存時(shí)間的區(qū)間。如果人為規(guī)定生存時(shí)間的分組區(qū)間,則需用該選項(xiàng)指定。3.Plots=繪圖類型要求輸出生存分析圖??晒┹敵龅膱D形有:
S
對(duì)生存函數(shù)S(t)作圖。橫、縱坐標(biāo)分別為t,S(t)。
H
對(duì)風(fēng)險(xiǎn)函數(shù)作圖。橫、縱坐標(biāo)分別為t,H(t)。小樣本資料的乘積極限法(Kaplan-Meier法)例15-1
25例某種癌癥的患者在不同的日期隨機(jī)(suíjī)分配至兩治療組,分別以A、B兩種治療方法進(jìn)行治療。治療后繼續(xù)對(duì)這些病人進(jìn)行隨訪至到2003年5月31日結(jié)束。資料如表15.1所示,數(shù)字后又+號(hào)者為刪失值。試進(jìn)行生存率分析。3/2/202345第四十五頁(yè),共七十五頁(yè)。datalife1;dogroup=1to2;inputn;doi=1ton;inputt@@;ift<0thencensor=1;elsecensor=0;t=abs(t);output;end;end;cards;12852586363220365452496-528-560-676131318237076180195210232300396-490-540;proclifetestplots=(s)formchar(1,2,7)='|-+';timet*censor(1);stratagroup;run;3/2/202346第四十六頁(yè),共七十五頁(yè)。TheLIFETESTProcedureProduct-LimitSurvivalEstimatesGROUP=1SurvivalStandardNumberNumberTSurvivalFailureErrorFailedLeft
生存時(shí)間生存率死亡概率(gàilǜ)生存率標(biāo)準(zhǔn)誤死亡例數(shù)生存例數(shù)0.0001.0000000128.0000.91670.08330.079811152.0000.83330.16670.107621058.0000.75000.25000.12503963.000...4863.0000.58330.41670.142357220.0000.50000.50000.144366365.0000.41670.58330.142375452.0000.33330.66670.136184496.0000.25000.75000.125093528.000*...92560.000*...91676.000*...90*CensoredObservation3/2/202347第四十七頁(yè),共七十五頁(yè)。SummaryStatisticsforTimeVariableTPoint95%ConfidenceIntervalQuantileEstimate[Lower,Upper)
四分位數(shù)點(diǎn)估計(jì)95%可信區(qū)間(qūjiān)75%.220.000.50%292.50063.000496.00025%60.50052.000365.000Mean272.083StandardError62.231
生存時(shí)間均數(shù)均數(shù)的標(biāo)準(zhǔn)誤NOTE:Thelastobservationwascensoredsotheestimateofthemeanisbiased.3/2/202348第四十八頁(yè),共七十五頁(yè)。
TheLIFETESTProcedureProduct-LimitSurvivalEstimatesGROUP=2SurvivalStandardNumberNumberTSurvivalFailureErrorFailedLeft0.0001.00000001313.0000.92310.07690.073911218.0000.84620.15380.100121123.0000.76920.23080.116931070.0000.69230.30770.12804976.0000.61540.38460.134958180.0000.53850.46150.138367195.0000.46150.53850.138376210.0000.38460.61540.134985232.0000.30770.69230.128094300.0000.23080.76920.1169103396.0000.15380.84620.1001112490.000*...111540.000*...110*CensoredObservation3/2/202349第四十九頁(yè),共七十五頁(yè)。SummaryStatisticsforTimeVariableTPoint95%ConfidenceIntervalQuantileEstimate[Lower,Upper)75%300.000195.000.50%195.00070.000300.00025%70.00018.000195.000Mean192.692StandardError40.963SummaryoftheNumberofCensoredandUncensoredValuesGROUPTotalFailedCensored%Censored1129325.000021311215.3846Total2520520.00003/2/202350第五十頁(yè),共七十五頁(yè)。
SDF||||||1.0+*AB|||S|||u|A*---Ar|||v|BB|i||AAv0.8+||a|B---|Bl|AA||D|*Bi|||s||B------------Bt0.6+||r|A-----------------Ai|BB|b||A-----------------Au|||t|B-B|i||A---------Ao0.4+||n|B--B|||A-----AF|B-------B|u|||n||Ac|B-----------Bt0.2+|i||o|Bn||||0.0+|||||+-----+-----+-----+-----+-----+-----+-----+-----+-----+-----+-----+-----+-----+-----+-050100150200250300350400450500550600650700T3/2/202351第五十一頁(yè),共七十五頁(yè)。
TestofEqualityoverStrata
Pr>TestChi-SquareDFChi-SquareLog-Rank時(shí)序(shíxù)檢驗(yàn)0.664010.4152Wilcoxon秩和檢驗(yàn)0.327210.5673-2Log(LR)似然比檢驗(yàn)
1.036210.30873/2/202352第五十二頁(yè),共七十五頁(yè)。例王潔貞主編《醫(yī)學(xué)統(tǒng)計(jì)學(xué)》例14.1P202手術(shù)(shǒushù)療法組:52789296105123145136*157*182*209*224*手術(shù)+化療組:7995117175203102*157*199*216*246*2693/2/202353第五十三頁(yè),共七十五頁(yè)。datalife2;dogroup=1to2;inputn;doi=1ton;inputt@@;ift<0thencensor=1;elsecensor=0;t=abs(t);output;end;end;cards;1252789296105123145-136-157-182-209-224117995117175203-102-157-199-216-246269;proclifetestplots=(s)formchar(1,2,7)='|-+';timet*censor(1);stratagroup;run;3/2/202354第五十四頁(yè),共七十五頁(yè)。
大樣本資料(zīliào)的壽命表法
例2王潔貞主編《醫(yī)學(xué)統(tǒng)計(jì)學(xué)》例14.2P2063/2/202355第五十五頁(yè),共七十五頁(yè)。
datalife3;inputtcensorfg@@;/*t:月數(shù)的下限;censor:1=死亡,0=失訪;f:人數(shù)(rénshù);g:分組變量*/cards;0181000171517011131411300119121190017142704213122130221912219032251322502231112310423710237012;proclifetestmethod=Ltwidth=6plots=(s)formchar(1,2,7)='|-+';timet*censor(0);stratag;freqf;run;3/2/202356第五十六頁(yè),共七十五頁(yè)。
TheLIFETESTProcedureLifeTableSurvivalEstimatesG=1ConditionalEffectiveConditionalProbabilityIntervalNumberNumberSampleProbabilityStandard[Lower,Upper)FailedCensoredSizeofFailureErrorSurvival
區(qū)間的上下限死亡數(shù)失訪數(shù)校正人數(shù)死亡概率(gàilǜ)死亡概率(gàilǜ)標(biāo)準(zhǔn)誤期初生存率068020.00.40000.10951.00006125111.50.43480.14620.60001218406.00.66670.19250.3391182420
溫馨提示
- 1. 本站所有資源如無(wú)特殊說(shuō)明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請(qǐng)下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請(qǐng)聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
- 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁(yè)內(nèi)容里面會(huì)有圖紙預(yù)覽,若沒(méi)有圖紙預(yù)覽就沒(méi)有圖紙。
- 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
- 5. 人人文庫(kù)網(wǎng)僅提供信息存儲(chǔ)空間,僅對(duì)用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對(duì)用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對(duì)任何下載內(nèi)容負(fù)責(zé)。
- 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請(qǐng)與我們聯(lián)系,我們立即糾正。
- 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶因使用這些下載資源對(duì)自己和他人造成任何形式的傷害或損失。
最新文檔
- 2024廣東廣州市弘盈置業(yè)有限公司招聘1人筆試參考題庫(kù)附帶答案詳解
- 2025年八氟戊醇項(xiàng)目合作計(jì)劃書
- 粵教版高中信息技術(shù)選修3教學(xué)設(shè)計(jì)-2.3.1 域名與域名系統(tǒng)
- 2025年湖北水利水電職業(yè)技術(shù)學(xué)院?jiǎn)握新殬I(yè)適應(yīng)性測(cè)試題庫(kù)及參考答案
- 第二單元《探秘物聯(lián)網(wǎng)》第7課 傳感器的應(yīng)用 教學(xué)設(shè)計(jì) 2023-2024學(xué)年浙教版(2023)初中信息技術(shù)七年級(jí)下冊(cè)
- 2025年廣西經(jīng)貿(mào)職業(yè)技術(shù)學(xué)院?jiǎn)握新殬I(yè)技能測(cè)試題庫(kù)含答案
- 2025年湖北城市建設(shè)職業(yè)技術(shù)學(xué)院?jiǎn)握新殬I(yè)適應(yīng)性測(cè)試題庫(kù)完整
- 第二單元第10課《物聯(lián)系統(tǒng)原型搭建》-教學(xué)設(shè)計(jì) 2023-2024學(xué)年浙教版(2023)初中信息技術(shù)七年級(jí)下冊(cè)
- 2025年合肥信息技術(shù)職業(yè)學(xué)院?jiǎn)握新殬I(yè)技能測(cè)試題庫(kù)必考題
- 2024年12月湖北十堰市丹江口市第二次事業(yè)單位公開招聘71人筆試歷年典型考題(歷年真題考點(diǎn))解題思路附帶答案詳解
- 2025年02月貴州省司法廳所屬事業(yè)單位公開招聘2人筆試歷年典型考題(歷年真題考點(diǎn))解題思路附帶答案詳解
- 2025年01月福建省福利彩票發(fā)行中心片區(qū)管理員招考筆試歷年典型考題(歷年真題考點(diǎn))解題思路附帶答案詳解
- 2025至2030年中國(guó)單板電磁制動(dòng)器數(shù)據(jù)監(jiān)測(cè)研究報(bào)告
- 2024年07月國(guó)新國(guó)證期貨有限責(zé)任公司(海南)2024年招考2名工作人員筆試歷年參考題庫(kù)附帶答案詳解
- 人教版數(shù)學(xué)八年級(jí)下冊(cè) 第17章 勾股定理 單元測(cè)試(含答案)
- 法規(guī)解讀丨2024新版《突發(fā)事件應(yīng)對(duì)法》及其應(yīng)用案例
- JGJ46-2024 建筑與市政工程施工現(xiàn)場(chǎng)臨時(shí)用電安全技術(shù)標(biāo)準(zhǔn)
- 2024年世界職業(yè)院校技能大賽高職組“關(guān)務(wù)實(shí)務(wù)組”賽項(xiàng)參考試題庫(kù)(含答案)
- 河北美術(shù)出版社小學(xué)六年級(jí)下冊(cè)書法練習(xí)指導(dǎo)教案
- 五下音樂(lè)《美麗的家鄉(xiāng)(簡(jiǎn)譜、五線譜)》課件
- 2024年長(zhǎng)沙職業(yè)技術(shù)學(xué)院高職單招(英語(yǔ)/數(shù)學(xué)/語(yǔ)文)筆試歷年參考題庫(kù)含答案解析
評(píng)論
0/150
提交評(píng)論