




版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進行舉報或認(rèn)領(lǐng)
文檔簡介
流行病學(xué)數(shù)據(jù)分析實習(xí)專業(yè)化培訓(xùn),掌握流行病學(xué)數(shù)據(jù)分析核心技能從理論到實踐,全面提升公共衛(wèi)生研究能力課程概述課程目標(biāo)掌握流行病學(xué)數(shù)據(jù)分析方法學(xué)習(xí)內(nèi)容統(tǒng)計方法和軟件應(yīng)用實踐考核方式案例分析和實踐報告流行病學(xué)數(shù)據(jù)分析簡介定義運用統(tǒng)計方法分析人群健康數(shù)據(jù)重要性揭示疾病分布規(guī)律和危險因素應(yīng)用領(lǐng)域疾病監(jiān)測、健康政策制定數(shù)據(jù)類型時間序列數(shù)據(jù)按時間順序收集的連續(xù)觀測值定量數(shù)據(jù)可測量的數(shù)值型變量定性數(shù)據(jù)分類或名義型變量數(shù)據(jù)收集方法問卷調(diào)查結(jié)構(gòu)化收集人群健康信息醫(yī)療記錄從醫(yī)院系統(tǒng)提取臨床數(shù)據(jù)實驗數(shù)據(jù)對照試驗產(chǎn)生的研究數(shù)據(jù)數(shù)據(jù)質(zhì)量控制數(shù)據(jù)清理檢查并糾正錯誤錄入和格式問題異常值處理識別并處理極端值和離群點缺失值處理評估缺失模式并選擇適當(dāng)填補方法描述性統(tǒng)計(一)集中趨勢測量平均值中位數(shù)眾數(shù)離散趨勢測量方差標(biāo)準(zhǔn)差四分位距描述性統(tǒng)計(二)頻數(shù)分布變量值出現(xiàn)的次數(shù)統(tǒng)計百分比占總體的相對比例比率和比值不同類別間的相對關(guān)系圖表展示(一)選擇合適圖表類型展示不同數(shù)據(jù)特征圖表展示(二)散點圖展示兩個連續(xù)變量間關(guān)系箱線圖顯示數(shù)據(jù)分布和離群值熱圖使用顏色強度表示數(shù)據(jù)變化概率分布68%正態(tài)分布連續(xù)型隨機變量常見分布15%二項分布成功/失敗事件概率17%泊松分布稀有事件發(fā)生概率假設(shè)檢驗基礎(chǔ)原假設(shè)與備擇假設(shè)檢驗起點:無差異vs有差異顯著性水平接受或拒絕假設(shè)的標(biāo)準(zhǔn)p值觀察到結(jié)果的概率測度t檢驗單樣本t檢驗樣本均值與已知值比較獨立樣本t檢驗兩獨立組均值差異比較配對樣本t檢驗同一組前后測量比較方差分析重復(fù)測量方差分析多時間點測量比較雙因素方差分析兩個因素交互作用分析3單因素方差分析三組以上均值比較卡方檢驗檢驗類型應(yīng)用場景關(guān)注重點擬合優(yōu)度檢驗觀察值與理論值比較分布特征獨立性檢驗兩分類變量關(guān)聯(lián)性相互獨立性同質(zhì)性檢驗不同樣本分布比較分布一致性相關(guān)分析Pearson相關(guān)系數(shù)兩連續(xù)變量線性關(guān)系Spearman相關(guān)系數(shù)等級變量或非線性關(guān)系偏相關(guān)分析控制第三變量影響線性回歸(一)X變量Y預(yù)測值觀察值線性回歸(二)變量選擇前向、后向、逐步回歸法共線性診斷方差膨脹因子評估殘差分析模型適合度檢驗Logistic回歸二分類Logistic回歸預(yù)測二元結(jié)局事件疾病發(fā)生與否預(yù)測多分類Logistic回歸多類別結(jié)局變量疾病分型預(yù)測OR值解釋優(yōu)勢比反映關(guān)聯(lián)強度e^β為暴露影響生存分析基礎(chǔ)生存函數(shù)存活概率隨時間變化風(fēng)險函數(shù)單位時間事件發(fā)生率生存時間數(shù)據(jù)特點截尾數(shù)據(jù)處理Kaplan-Meier方法生存曲線繪制階梯狀展示生存概率變化中位生存時間估計生存率為50%時的時間點組間生存曲線比較Log-rank檢驗差異顯著性Cox比例風(fēng)險模型模型假設(shè)比例風(fēng)險風(fēng)險比恒定協(xié)變量線性作用變量篩選單因素初篩多因素分析交互作用評估結(jié)果解釋風(fēng)險比意義可信區(qū)間臨床相關(guān)性隊列研究數(shù)據(jù)分析相對危險度計算暴露組與非暴露組發(fā)病率比值2歸因危險度計算可歸因于暴露的發(fā)病率暴露-反應(yīng)關(guān)系分析劑量反應(yīng)關(guān)系評估病例對照研究數(shù)據(jù)分析優(yōu)勢比計算病例組與對照組暴露比率比較匹配設(shè)計分析個體匹配或頻數(shù)匹配條件Logistic回歸匹配設(shè)計多因素分析3橫斷面研究數(shù)據(jù)分析患病率計算特定時間點疾病存在比例患病比計算不同人群患病率比較相關(guān)因素分析多因素回歸模型應(yīng)用診斷試驗評價評價指標(biāo)計算方法意義敏感性真陽性/(真陽性+假陰性)檢出患者能力特異性真陰性/(真陰性+假陽性)排除健康者能力預(yù)測值陽性/陰性預(yù)測值檢測結(jié)果可靠性多水平模型模型比較和選擇似然比檢驗和AIC隨機斜率模型允許變量效應(yīng)在組間變化隨機截距模型基線水平在組間變化主成分分析1原理和應(yīng)用降維并保留最大變異信息2因子提取特征值和載荷矩陣計算3結(jié)果解釋主成分解釋原始變量意義因子分析探索性因子分析發(fā)現(xiàn)潛在構(gòu)念結(jié)構(gòu)驗證性因子分析檢驗假設(shè)理論模型模型評價擬合指數(shù)評估聚類分析K-means聚類劃分樣本到預(yù)設(shè)K個類別層次聚類構(gòu)建樣本間層次關(guān)系聚類結(jié)果評價輪廓系數(shù)和類內(nèi)凝聚度判別分析1線性判別分析線性函數(shù)區(qū)分類別二次判別分析二次函數(shù)適應(yīng)復(fù)雜邊界判別函數(shù)解釋變量對分類貢獻評估元分析基礎(chǔ)異質(zhì)性檢驗I2和Q統(tǒng)計量評估研究間一致性固定效應(yīng)模型假設(shè)研究間效應(yīng)相同隨機效應(yīng)模型考慮研究間效應(yīng)變異元分析進階發(fā)表偏倚評估漏斗圖和Egger檢驗敏感性分析評估結(jié)果穩(wěn)健性亞組分析探索異質(zhì)性來源時間序列分析揭示時間模式并做出準(zhǔn)確預(yù)測空間分析基礎(chǔ)地理信息系統(tǒng)應(yīng)用空間數(shù)據(jù)可視化空間自相關(guān)Moran'sI和LISA統(tǒng)計量熱點分析疾病聚集區(qū)檢測網(wǎng)絡(luò)分析機器學(xué)習(xí)在流行病學(xué)中的應(yīng)用深度學(xué)習(xí)復(fù)雜模式識別與預(yù)測監(jiān)督學(xué)習(xí)疾病風(fēng)險預(yù)測分類非監(jiān)督學(xué)習(xí)疾病亞型識別數(shù)據(jù)可視化技巧選擇合適的圖表類型按數(shù)據(jù)特征選擇突出核心信息考慮受眾理解能力色彩使用原則對比度合理避免過多顏色考慮色盲友好信息傳達有效性突出關(guān)鍵模式減少認(rèn)知負擔(dān)保持簡潔明了R語言基礎(chǔ)數(shù)據(jù)結(jié)構(gòu)向量、矩陣、數(shù)據(jù)框基本操作數(shù)據(jù)讀取、操作、導(dǎo)出函數(shù)編寫自定義函數(shù)創(chuàng)建與應(yīng)用R語言數(shù)據(jù)處理dplyr包使用數(shù)據(jù)篩選、排序、分組聚合tidyr包使用寬表轉(zhuǎn)長表、缺失值處理數(shù)據(jù)合并和重塑不同來源數(shù)據(jù)整合分析R語言統(tǒng)計分析(一)描述性統(tǒng)計summary()和describe()函數(shù)假設(shè)檢驗t.test()和chisq.test()函數(shù)3相關(guān)與回歸cor.test()和lm()函數(shù)R語言統(tǒng)計分析(二)生存分析survival包和survminer包廣義線性模型glm()函數(shù)應(yīng)用多水平模型lme4包和nlme包R語言數(shù)據(jù)可視化ggplot2包使用分層構(gòu)建專業(yè)統(tǒng)計圖表交互式圖表制作plotly和shiny應(yīng)用地圖繪制sf包和tmap包應(yīng)用SAS軟件基礎(chǔ)宏編程入門自動化分析流程過程語句使用PROC步驟數(shù)據(jù)分析數(shù)據(jù)集創(chuàng)建和管理DATA步驟數(shù)據(jù)處理SAS統(tǒng)計分析(一)描述性統(tǒng)計PROCMEANS和PROCUNIVARIATE方差分析PROCANOVA和PROCGLM回歸分析PROCREG和PROCLOGISTICSAS統(tǒng)計分析(二)Logistic回歸PROCLOGISTIC應(yīng)用生存分析PROCLIFETEST和PHREG混合線性模型PROCMIXED多水平分析SPSS軟件操作數(shù)據(jù)錄入和管理變量定義和數(shù)據(jù)編輯基本統(tǒng)計分析描述統(tǒng)計和假設(shè)檢驗高級統(tǒng)計模型回歸、因子分析和聚類Stata軟件使用功能類別命令示例應(yīng)用場景數(shù)據(jù)導(dǎo)入和處理import,reshape,merge數(shù)據(jù)準(zhǔn)備階段統(tǒng)計分析命令regress,logit,stcox模型構(gòu)建結(jié)果輸出和圖形繪制graph,tabulate,margins結(jié)果展示和解釋流行病學(xué)軟件介紹專業(yè)軟件簡化特定流行病學(xué)計算和分析大數(shù)據(jù)分析工具100GB+Hadoop生態(tài)系統(tǒng)分布式存儲和計算框架10XSpark大規(guī)模數(shù)據(jù)內(nèi)存處理80%分布式計算基礎(chǔ)MapReduce編程模型數(shù)據(jù)安全和隱私保護數(shù)據(jù)脫敏技術(shù)個人識別信息去除K-匿名化方法差分隱私技術(shù)加密存儲端到端加密密鑰管理數(shù)據(jù)分級保護訪問控制策略最小權(quán)限原則多因素認(rèn)證審計跟蹤機制倫理考慮研究倫理審查倫理委員會審批流程知情同意參與者權(quán)益保障數(shù)據(jù)使用和共享原則合規(guī)與透明性要求結(jié)果報告和論文撰寫常見問題和注意事項避免常見統(tǒng)計陷阱統(tǒng)計結(jié)果呈現(xiàn)表格和圖形規(guī)范科研論文結(jié)構(gòu)IMRAD格式規(guī)范實踐案例(一):傳染病暴發(fā)調(diào)查數(shù)據(jù)收集標(biāo)準(zhǔn)化問卷設(shè)計2描述性分析三間分布特征分析病例定義和篩查確定和疑似病例標(biāo)準(zhǔn)實踐案例(二):慢性病危險因素分析實踐案例(三):臨床試驗數(shù)據(jù)分析隨機化檢驗基線特征平衡性評估意向性分析包含所有隨機分配對象亞組分析不同人群療效差異實踐案例(四):流行病學(xué)監(jiān)測數(shù)據(jù)分析24%時間序列分析季節(jié)性和長期趨勢識別35%空間分布分析疾病聚集區(qū)檢測41%預(yù)警模型構(gòu)建閾值設(shè)定和信號檢測實踐案例(五):系統(tǒng)綜述和元分析文獻篩選PRISMA流程圖記錄數(shù)據(jù)提取結(jié)構(gòu)化
溫馨提示
- 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
- 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
- 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
- 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負責(zé)。
- 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請與我們聯(lián)系,我們立即糾正。
- 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時也不承擔(dān)用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。
最新文檔
- 農(nóng)資公司前臺管理制度
- 小微金融公司管理制度
- 醫(yī)院新型門診管理制度
- 券商外包日常管理制度
- 學(xué)校項目落地管理制度
- 黨員練功基地管理制度
- 國企合同審核管理制度
- 寢室衛(wèi)生消毒管理制度
- 華為銷售流程管理制度
- 小組婦女組長管理制度
- 2024年湖北省武漢市高考數(shù)學(xué)一調(diào)試卷
- 銀行業(yè)金融機構(gòu)數(shù)據(jù)治理指引
- 護理質(zhì)量安全與風(fēng)險管理的信息技術(shù)支持
- 2021年高考化學(xué)試卷真題及答案(遼寧卷)(解析版)
- 血液透析充分性評估及處置課件
- 2022年幼兒識字:生字卡片-幼兒識字卡片大全
- 特種作業(yè)人員教育培訓(xùn)方案
- 標(biāo)準(zhǔn)風(fēng)機樣本參數(shù)表(多種型號)
- 光伏電站繼電保護運行規(guī)程
- 美容整形中的健康管理與風(fēng)險防控
- 班組長能力提升人際交往與矛盾處理
評論
0/150
提交評論