




已閱讀5頁,還剩58頁未讀, 繼續(xù)免費閱讀
版權說明:本文檔由用戶提供并上傳,收益歸屬內容提供方,若內容存在侵權,請進行舉報或認領
文檔簡介
傳染病預警統(tǒng)計分析模型,北京市疾病預防控制中心 杜婧 2015年6月,基本概念,監(jiān)測:連續(xù)、系統(tǒng)地收集、分析、解讀疾病發(fā)生及相關影響因素的資料,并將其發(fā)現(xiàn)用于指導疾病控制實踐活動。預警:在傳染病暴發(fā)流行事件發(fā)生前或發(fā)生早期發(fā)出信號,以警示該事件可能發(fā)生或其發(fā)生的范圍、程度等可能擴大預測:以已有的與傳染病流行密切相關的信息為基礎,采用一定的統(tǒng)計模型進行模擬分析,對傳染病未來的疫情水平和趨勢做出判斷,傳染病預警模型,基于控制圖的預警模型基于時間序列理論的預警模型基于回歸理論的模時空掃描統(tǒng)計模型貝葉斯時空模型,基于控制圖的預警模型,控制圖法(control charts)移動平均法(moving average,MA)移動百分位數(shù)法(movable percentile method,MPM)累積和控制圖(cumulative sums,CUSUM)指數(shù)加權移動平均法(exponentially weighted moving average,EWMA),基于控制圖的預警模型,控制圖法原理:以歷史監(jiān)測數(shù)據為基礎,確定監(jiān)測指標的平均水平與標準差,按照正態(tài)分布的原理,以均數(shù)加減若干倍標準差作為控制限,監(jiān)控未來采集的監(jiān)測指標是否“失控” 優(yōu)點:簡單明了缺點:不易發(fā)現(xiàn)較小的變化 均數(shù)-標準差圖對歷史數(shù)據具有正態(tài)分布假設不易滿足,基于控制圖的預警模型,基于控制圖的預警模型,移動百分位數(shù)法原理:中位數(shù)-極差控制圖計算歷史基線數(shù)據的百分位數(shù):優(yōu)點:非參數(shù)方法,不需要數(shù)據理論的分布假定缺點:需要一定數(shù)量的歷史基線數(shù)據,北京市2015年5月猩紅熱預警示意圖(MPM),基于控制圖的預警模型,在此處鍵入公式。,基于控制圖的預警模型,根據其識別異常的靈敏度,美國CDC將Ct分為三類: C1-MILD C2-MEDIUM C3-ULTRA,模型評價的統(tǒng)計方法,意義:比較不同預警算法的差異探索模型優(yōu)化,如確定模型參數(shù),確定預警線探討可能因素對預警模型的影響,如不同基線數(shù)據特征、暴發(fā)類型、暴發(fā)強度等預警模型的評價是通過一系列指標來實現(xiàn)的,最常用的指標是對暴發(fā)事件探測的及時性、靈敏度和特異度,模型評價指標,及時性:從事件開始到檢測暴發(fā)之間的時間長度來衡量及時性指標:平均暴發(fā)探測滯后時間(天)采用模擬暴發(fā)來研究模型的及時性,事件開始無法測量,舉例:,采用人工插入暴發(fā)作為目標事件,測試MPM法預警效果探討的因素:疾病類型、暴發(fā)強度和無暴發(fā)時疾病基線水平,表:MPM模型:8種疾病不同強度暴發(fā)事件的預警平均滯后期(天),模型評價指標,靈敏度:預警模型發(fā)現(xiàn)暴發(fā)事件的能力;特異度:預測模型排除非暴發(fā)事件的能力;ROC曲線:即受試者工作特征曲線-以靈敏度為縱軸,假陽性率(1-特異度)為橫軸繪制;陽性預測值:模型發(fā)出的警報中真流行事件所占的比例;陰性預測值:模型未發(fā)出警報時非流行事件所占的比例;,定性資料的ROC分析-SPSS操作,例:,CUSUM 模型在流行性腮腺炎早期預警中的應用研究 中國衛(wèi)生統(tǒng)計計2014 年8月第31卷第4期 以2011年11月1日2012年12年31日江蘇省每日發(fā)病數(shù)為實驗數(shù)據,從2012年1月1日起以CUSUM 模型進行前瞻性試驗。 最終確定模型參數(shù)為h=3,k=0.5,基于時間序列理論的預警模型,基于時間序列理論的預警模型,時間序列定義: 時間序列是指某一個變量在相同時間間隔(年、月、周、日)上的不同測量值,按時間先后順序排列而形成的序列。常用軟件:Stata,Matlab,Eviews 和SAS 推薦軟件SAS 在SAS系統(tǒng)中有一個專門進行計量經濟與時間序列分析的模塊,編程語言簡潔,輸出功能強大,分析結果精確,時間序列分析,平穩(wěn)時間序列 : ARMA 確定性分析 非平穩(wěn)時間序列 ARIMA 隨機性分析 殘差自回歸模型 條件異方差模型,時間序列預處理,平穩(wěn)性檢驗:時序圖檢驗 自相關圖檢驗隨機性檢驗:純隨機性檢驗,平穩(wěn)時間序列的定義?,由于P值顯著大于顯著性水平0.05,所以該序列不能拒絕純隨機的原假設.如果序列平穩(wěn)白噪聲,則無可提取的有用信息如果序列平穩(wěn)非白噪聲序列,則采用平穩(wěn)非白噪聲序列的建模和預測方法,平穩(wěn)時間序列,AR(P):自回歸模型MA(Q):移動平均模型ARMA(p,q):自回歸移動平均模型,ARMA模型的定義,具有如下結構的模型稱為自回歸移動平均模型,簡記為特別當 時,稱為中心化 模型,模型識別,樣本自相關系數(shù),樣本偏自相關系數(shù),因為由于樣本的隨機性,樣本的相關系數(shù)不會呈現(xiàn)出理論截尾的完美情況,本應截尾的樣本自相關系數(shù)或偏自相關系數(shù)仍會呈現(xiàn)出小值振蕩的情況由于平穩(wěn)時間序列通常都具有短期相關性,隨著延遲階數(shù) 樣本自相關系數(shù)或偏自相關系數(shù)都會衰減至零值附近作小值波動,平穩(wěn)時間序列建模步驟,平穩(wěn)非白噪聲序列,計算樣本相關系數(shù),模型識別,參數(shù)估計,模型檢驗,模型優(yōu)化,序列預測,Y,N,非平穩(wěn)時間序列分析,非平穩(wěn)數(shù)據的分析方法可以分為確定性分析和隨機分析兩大類確定性假定序列變化可以由一條趨勢線來刻畫 適用于具有典型趨勢特征變化數(shù)據的預測 常用確定型時間序列模型有指數(shù)曲線模型、二次曲線模型等。 許多傳染病資料并不具有某種典型趨勢特征,從而影響預測效果。此時隨機時間序列模型則顯示明顯優(yōu)勢隨機性分析常用的模型是ARIMA模型,ARIMA模型,ARIMA模型適用于各種復雜的時間序列模式,是目前較通用的預測方法之一,已廣泛應用于傳染病發(fā)病率的預測,特別是具有季節(jié)性趨勢的傳染病預測。使用場合差分平穩(wěn)序列擬合模型結構,差分運算,一階差分 階差分 步差分,差分方式的選擇,序列蘊含著顯著的線性趨勢,一階差分就可以實現(xiàn)趨勢平穩(wěn) 序列蘊含著曲線趨勢,通常低階(二階或三階)差分就可以提取出曲線趨勢的影響 對于蘊含著固定周期的序列進行步長為周期長度的差分運算,通常可以較好地提取周期信息 足夠多次的差分運算可以充分地提取原序列中的非平穩(wěn)確定性信息但過度的差分會造成有用信息的浪費,差分后序列時序圖,一階差分,1階12步差分,ARIMA模型建模步驟,獲得觀察值序列,平穩(wěn)性檢驗,差分運算,Y,N,白噪聲檢驗,Y,分析結束,N,擬合ARIMA模型,乘積ARIMA(p , d , q)(P ,D ,Q)s 模型,有的季節(jié)性時間序列不僅含有季節(jié)性成分, 還混有非季節(jié)性成分, 若單一用季節(jié)性或非季節(jié)性ARIMA 模型進行分析, 其預測效果往往不理想。季節(jié)性ARIMA 與非季節(jié)性ARIMA 的混合效應通常表現(xiàn)為相乘的形式模型完整的結構如下:,例:ARIMA乘積季節(jié)模型在上海市甲肝發(fā)病預測中的應用,資料來源:上海市疾病預防控制中心歷史疫情資料,即1990年至2011年上海市按月報告甲肝病例數(shù)作為建模數(shù)據,2012年月發(fā)病數(shù)作為預測效果評估數(shù)據。,例:ARIMA乘積季節(jié)模型在上海市甲肝發(fā)病預測中的應用,例:ARIMA乘積季節(jié)模型在上海市甲肝發(fā)病預測中的應用,例:ARIMA乘積季節(jié)模型在上海市甲肝發(fā)病預測中的應用,預測顯示2012年月的發(fā)病數(shù)低于既往歷史發(fā)病水平,而2012年月實際發(fā)病數(shù)未出現(xiàn)明顯季節(jié)高峰。 ARIMA模型應用于短期預測的效果較好,利用和及時補充新的數(shù)據進行模型的再次擬合,可滿足傳染病疫情預測和預警的需要。,SAS 操作,練習數(shù)據:19902014年甲肝發(fā)病數(shù)(分月)可以使用19902008年數(shù)據作為訓練集,時空掃描統(tǒng)計模型,時空掃描統(tǒng)計模型,在監(jiān)測的區(qū)域內,有時盡管出現(xiàn)了局部傳染病暴發(fā),如果局部暴發(fā)的病例數(shù)沒有使整個區(qū)域病例數(shù)顯著增加時,時間模型將難以發(fā)現(xiàn)這種暴發(fā)疫情??臻g數(shù)據的統(tǒng)計分析是現(xiàn)代統(tǒng)計學發(fā)展迅速的一個分支領域,基于時空維度的預警模型得益于空間統(tǒng)計學的發(fā)展,用于揭示監(jiān)測指標的空間特征,特別是早期發(fā)現(xiàn)傳染病在地理空間上的聚集性,據此發(fā)出預警信號。,時空掃描統(tǒng)計模型,時空掃描統(tǒng)計模型,時空掃描統(tǒng)計模型,統(tǒng)計假設的原假設為:病例在時間和空間上的分布是完全隨機的; 備擇假設為:與掃描窗口外比,掃描窗口內的發(fā)病水平高;優(yōu)點:綜合考慮了時間和空間信息; 掃描窗口動態(tài)變化,避免了選擇偏移; 不需要人口數(shù)據; 不僅能定性判定是否存在聚集,還能定量判定聚集程度;局限:基于各子區(qū)域內人口增長速度一致的前提假設; 掃描半徑及掃描時間長度設置缺乏客觀標準; 時空掃描統(tǒng)計在探測不規(guī)則形狀的聚集,如沿河流域的集聚方面,存在局限性;,時空掃描統(tǒng)計模型,SaTScan v9.4.1/download.html,軟件主界面,例:離散泊松時空模型:在新墨西哥州腦腫瘤發(fā)病率,病例文件: nm.cas 格式: 人口文件: nm.pop 格式: 坐標文件: nm.geo 格式: 研究時間: 1973-1991集合: 32 counties病例時間精度: Years坐標系: Cartesian變量 #1, 年齡分組: 1 = 0-4 years, 2 = 5-9 years, . 18 = 85+ years變量 #2, 性別: 1 = male, 2 = female人口統(tǒng)計年: 1973, 1982, 1991數(shù)據資源: New Mexico SEER T
溫馨提示
- 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權益歸上傳用戶所有。
- 3. 本站RAR壓縮包中若帶圖紙,網頁內容里面會有圖紙預覽,若沒有圖紙預覽就沒有圖紙。
- 4. 未經權益所有人同意不得將文件中的內容挪作商業(yè)或盈利用途。
- 5. 人人文庫網僅提供信息存儲空間,僅對用戶上傳內容的表現(xiàn)方式做保護處理,對用戶上傳分享的文檔內容本身不做任何修改或編輯,并不能對任何下載內容負責。
- 6. 下載文件中如有侵權或不適當內容,請與我們聯(lián)系,我們立即糾正。
- 7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。
最新文檔
- 加盟保潔公司合同范本
- 2024年鹽城市濱??h招聘教師考試真題
- 農村房屋共建合同范例
- 2024年梧州市龍圩區(qū)招錄公益性崗位人員考試真題
- 公司之間供貨合同范本
- 動產轉讓合同范本
- 2024年普洱市墨江縣教體系統(tǒng)所屬事業(yè)單位緊缺招聘考試真題
- 2024年綿陽市投資控股有限公司招聘筆試真題
- 第12課 宋元時期的都市和文化(教學設計)七年級歷史下冊同步備課系列(部編版)
- 做代理合同范本
- 化工公司原址污染場地污染土壤治理修復方案
- 法蘭標準尺寸表(美標、日標、德標)
- 施工技術管理項總體思路、方式和方法解析
- 城市規(guī)劃與建筑學專業(yè)英語
- 《兒童心理健康課件》
- 《旅游市場營銷》課程教案(東北財經大學出版社)
- 老年人能力評估基本知識
- CATL設備電氣控制標準-V10
- 糖尿病高滲性昏迷HNDC搶救流程圖
- 風電場設備材料設備清單
- 裝載機駕駛員理論考試復習題庫(500題)
評論
0/150
提交評論