單獨二分類Logit模型在有序分類資料中的應(yīng)用.doc_第1頁
單獨二分類Logit模型在有序分類資料中的應(yīng)用.doc_第2頁
單獨二分類Logit模型在有序分類資料中的應(yīng)用.doc_第3頁
單獨二分類Logit模型在有序分類資料中的應(yīng)用.doc_第4頁
單獨二分類Logit模型在有序分類資料中的應(yīng)用.doc_第5頁
已閱讀5頁,還剩2頁未讀, 繼續(xù)免費閱讀

下載本文檔

版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進(jìn)行舉報或認(rèn)領(lǐng)

文檔簡介

單獨二分類Logit模型在有序分類資料中的應(yīng)用作者:林黨新許濤沈念春賴勝鄧政偉【摘要】目的:通過幽門螺桿菌與胃癌癌前病變關(guān)系研究的資料,探討單獨二分類Logit模型中有序分類資料中的應(yīng)用。方法:選擇293名患有輕度萎縮性胃炎的患者,對病變進(jìn)展的影響因素分析分別采用累積比數(shù)Logit模型和單獨的二分類Logit模型,并對兩種模型的分析結(jié)果進(jìn)行比較。結(jié)果:累積比數(shù)Logit模型分析結(jié)果顯示幽門螺桿菌感染對胃癌癌前病變的影響無統(tǒng)計學(xué)意義(OR=1.158,95%CI:0.9862.464),但得分檢驗發(fā)現(xiàn)幽門螺桿菌不滿足累積比數(shù)Logit模型的比例優(yōu)勢假定條件(2=24.100,P<;0.0001),故采用單獨的二分類Logit模型進(jìn)一步分析。結(jié)果表明,幽門螺桿菌陽性者比陰性者有更高的危險至少進(jìn)展到重度萎縮性胃炎(OR=2.334,95%CI:1.4023.885)。結(jié)論:幽門螺桿菌感染主要作用于胃癌癌前病變的早期階段。對于有序分類資料的分析,選用模型時應(yīng)注意其應(yīng)用條件,若條件不滿足最好換用其它更為恰當(dāng)?shù)姆椒?。【關(guān)鍵詞】胃癌癌前病變;幽門螺桿菌;累積比數(shù)Logit模型;單獨的二分類Logit模型有序分類資料最常用的分析方法是累積比數(shù)Logit模型1,對多分類有序反應(yīng)資料,如果采用一般的二分類Logit模型,而不是累積比數(shù)Logit模型,只能獲得50%70%的檢驗效能2,說明在處理有序分類數(shù)據(jù)方面,累積比數(shù)Logit模型要優(yōu)于二分類Logit模型。近幾年累積比數(shù)Logit模型在國內(nèi)應(yīng)用領(lǐng)域有所增多,但不少忽略了模型的使用條件,盲目套用,以致影響所得結(jié)論的可靠性。本研究通過累積比數(shù)Logit模型在實際數(shù)據(jù)分析中的應(yīng)用,說明了忽視模型應(yīng)用條件所產(chǎn)生的后果,并介紹了如何選擇恰當(dāng)?shù)姆治龇椒ā?資料與方法1.1資料來源資料來源于1項茂名市某醫(yī)院的隊列研究數(shù)據(jù),該研究選擇了360名輕度慢性萎縮性胃炎(CAG)患者,根據(jù)他們的幽門螺桿菌(Hp)感染情況分為陰性組和陽性組兩組人群,隨訪3年后重新進(jìn)行病理學(xué)診斷,觀察他們的病變情況。1.2胃黏膜病理診斷用胃內(nèi)窺鏡觀察胃黏膜病變,并在胃體大小彎、胃角、胃竇大小彎、前后壁各取胃黏膜活檢組織1塊。病理切片照全國胃、十二指腸活檢、病理診斷標(biāo)準(zhǔn)進(jìn)行診斷。每個受檢對象以最嚴(yán)重病變?yōu)榈谝辉\斷。1.2統(tǒng)計分析方法累積比數(shù)Logit模型的形式為3:Logit(P(Yk|X)=ln(P(Yk|x)1-P(Yk|x)=ak-pi=1ixi,k=1,2,K-1。(1)反應(yīng)變量Y為K個等級的有序變量,第k(k=1,2,K)類的概率分別為1,2,k,且Kk=1k=1。影響因素xT=(x1,x2,xP)為解釋變量,xi(i=1,2,p)可以是連續(xù)變量、無序或有序分類變量。則該模型實際上是將K個等級人為地分成1,k和k+1,K兩類,在這兩類基礎(chǔ)上定義的LogitP表示屬于前k個等級的累積概率(P(Yk|x)與后K-k個等級的累積概率(1-P(Yk|x)的比數(shù)之對數(shù)。故該模型稱為累積比數(shù)模型,其應(yīng)用有一個基本的假定條件,即比例優(yōu)勢假定(proportionaloddsassumption)。這一條件要求自變量的回歸系數(shù)應(yīng)與分割點k無關(guān),換句話說,無論從哪一點分類,對所有的累積logit,變量xk都有一個相同的k估計。單獨的二分類logit模型(separatebinarylogisticmodes)主要是把反應(yīng)變量按照不同分割點合并為不同的二類,然后分別進(jìn)行二分類的Logistic回歸分析4。本研究中的反應(yīng)變量為隨訪5年后的病變,分為輕度CAG、重度CAG、腸上皮化生(IM)、不典型增生(DYS)共4類,有3個分割點,故定義為3個二分類Logit:一是將IM、重度CAG和輕度CAG合并,即DYSVSIM,重度CAG,輕度CAG,表示至少進(jìn)展到DYS;二是將DYS和IM合并,重度CAG和輕度CAG合并,即DYS,IMVS重度CAG,輕度CAG,表示至少進(jìn)展到IM;三是將DYS、IM和重度CAG合并,即DYS,IM,重度CAGVS輕度CAG,表示至少進(jìn)展到重度CAG。然后以上述分類分別作3次二分類的logistic回歸分析。整個分析過程均由SAS8.2(SASInstitute,Cary,N.C.)來完成5。2結(jié)果經(jīng)3年隨訪后,共67人因各種原因失訪,293人具有可供分析的完整資料。其中,118人病變?nèi)詾檩p度CAG,91人進(jìn)展為重度CAG,49人進(jìn)展為IM,35人進(jìn)展為DYS。具體進(jìn)展情況見表1。累積比數(shù)Logit模型分析結(jié)果表明(表2),除性別因素外,其他因素對胃癌癌前病變的影響均無統(tǒng)計學(xué)意義。但從得分檢驗(scoretest)結(jié)果來看(表3),Hp不滿足比例優(yōu)勢假定條件(2=24.100,P<;0.0001),也就是說,在反應(yīng)變量的不同分割點上,Hp的估計值不同。由于基本假定條件違背,該資料采用累積比數(shù)Logit模型分析未必合適。表1293人隨訪5年后的病變進(jìn)展情況表2累積比數(shù)Logit模型的參數(shù)估計結(jié)果表3比例優(yōu)勢假定檢驗結(jié)果為了核實結(jié)果的正確性,并充分利用該資料有序的特點,故采用單獨的二分類Logit模型進(jìn)一步分析(表4),可以看出,年齡、性別、吸煙、飲酒這四個變量在不同分割點的OR值相差不大,而Hp的OR值則差別很大。把DYS、IM和重度CAG合并為一類(即“至少進(jìn)展為重度CAG”)時,Hp的影響有統(tǒng)計學(xué)意義(OR=2.334,95%CI:1.4023.885)。而對“至少進(jìn)展到DYS”和“至少進(jìn)展到IM”的影響則無統(tǒng)計學(xué)意義。表4單獨二分類Logit模型分析結(jié)果3討論本次研究結(jié)果顯示,年齡、性別、吸煙、飲酒對胃癌癌前病變的進(jìn)展無影響。在校正上述因素的影響后,Hp感染主要作用于胃癌癌前病變的早期階段,Hp陽性者至少進(jìn)展到重度CAG的可能性是Hp陰性者的2.334倍(OR=2.334,95%CI:1.4023.885),而對進(jìn)展到更高級的病變?nèi)鏘M、DYS,則Hp陽性與陰性并無差別。這與有學(xué)者提出的Hp主要作用于胃癌癌前病變的早期階段的結(jié)論是一致的6,7。累積比數(shù)Logit模型是分析有序分類資料最常用的方法,但其應(yīng)用需要滿足一定的條件,其中一個基本條件就是比例優(yōu)勢假定條件,即自變量的回歸系數(shù)應(yīng)與分割點k無關(guān)。對于一個自變量xk而言,不同累積比數(shù)發(fā)生比的回歸線相互平行,只是截距參數(shù)有所差別。以往有人認(rèn)為,累積比數(shù)Logit模型對這一條件并不敏感,但在實際中,這一條件不滿足往往容易導(dǎo)致錯誤的結(jié)論,本研究即證明了這一點。Ralf也曾對這一問題進(jìn)行了探討8,并指出,如果不滿足比例優(yōu)勢假定條件,最好采用單獨的二分類Logit模型進(jìn)行分析,否則做出的結(jié)論往往給人以誤導(dǎo)甚至是毫無意義的。本研究發(fā)現(xiàn)資料不滿足比例優(yōu)勢假定條件,因此采用了簡單且易于理解的單獨的二分類Logit模型進(jìn)一步分析。結(jié)果表明,盡管Hp對進(jìn)展到更高級的病變(IM、DYS)無影響,但對至少進(jìn)展到重度CAG的影響有統(tǒng)計學(xué)意義,即Hp主要作用于胃癌癌前病變的早期階段。如果忽略比例優(yōu)勢假定條件的檢驗,接受累積比數(shù)Logit模型的分析結(jié)果,便會得出相反的結(jié)論。當(dāng)有序分類資料不滿足比例優(yōu)勢假定條件時,還有其它一些方法可供選擇9,如stereotype模型、偏比例優(yōu)勢模型(partialproportionaloddsmodels)等10。這些方法都是基于累積Logits計算的,因而可與單獨的二分類Logit模型直接比較,但其計算過程繁瑣,且結(jié)果的解釋不如單獨的二分類Logit模型易于理解。多項Logit模型(polytomouslogitsmodels)是基于廣義Logits計算的,其計算過程和結(jié)果解釋均與單獨的二分類Logit模型不同,因而二者不可直接比較,一般也不作為比例優(yōu)勢假定條件不滿足時的首選方法。總之,對于有序分類資料的分析,應(yīng)先看其是否滿足模型的使用條件,如不滿足,最好換用其它更為合適的方法。本次研究一開始采用累積比數(shù)Logit模型分析,結(jié)果顯示Hp對胃癌癌前病變的影響無統(tǒng)計學(xué)意義,這實際上是由于Hp不滿足比例優(yōu)勢假定條件所致。在利用單獨的二分類Logit模型作進(jìn)一步詳細(xì)分析后,則可以發(fā)現(xiàn),Hp陽性者至少進(jìn)展到重度CAG的危險顯著高于Hp陰性者?!緟⒖嘉墨I(xiàn)】1McCullaghP.RegressionModelsforOrdinalData(withDiscussion).J.R.StatSoc,1980,42:109.2BGAmstrong,MSloan.OrdinalRegressionModelsforEpidemiologicData.AmJofEpidemiology,1989,129:191204.3LudwigFahrmeir,GerhardTutz.MultivariateStatisticalModelingBasedonGeneralizedLinearModels.Beijing:WorldPublishingCooperation,1998,7579.4RalfBender,UlrichGrouven.UsingBinaryLogisticRegressionModelsforOrdinalDatawithNon-proportionalOdds.JournalofClinicalEpidemiol,1998,51:809816.5RalfBender,AxelBender.CalculatingOrdinalRegressionModelsinSASandSPlus.BiometricalJournal,2000,42:677699.6KunioTakeuchi,YoshihiroOhno,YasushiTsuzuki,etc.HelicobacterpyloriInfectionandEarlyGastricCancer.JClinGastroenterol,2003,36:321324.7夏志偉,林三仁.幽門螺桿菌與胃癌.幽門螺桿菌感染的基礎(chǔ)與臨床(修訂版).北京:中國科學(xué)技術(shù)出版社,2002,172178.8RalfBender,UlrichGrouven.OrdinalLogisticRegressioninMedicalresearch.JournaloftheRoyalCollegeofPhysiciansofLondon,1997,31:546551.9RLall,MJCampbell.AReviewofO

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負(fù)責(zé)。
  • 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時也不承擔(dān)用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

最新文檔

評論

0/150

提交評論