調查資料分析時質量控制_第1頁
調查資料分析時質量控制_第2頁
調查資料分析時質量控制_第3頁
調查資料分析時質量控制_第4頁
調查資料分析時質量控制_第5頁
已閱讀5頁,還剩62頁未讀, 繼續(xù)免費閱讀

下載本文檔

版權說明:本文檔由用戶提供并上傳,收益歸屬內容提供方,若內容存在侵權,請進行舉報或認領

文檔簡介

1、王王 輝輝 公共衛(wèi)公共衛(wèi)生學院生學院流行病與衛(wèi)生統(tǒng)計學系流行病與衛(wèi)生統(tǒng)計學系流行病學流行病學調查資料分析時的調查資料分析時的質量控制質量控制主要內容:主要內容:n數據錄入常用軟件數據錄入常用軟件n常用研究設計的統(tǒng)計學分析思路、方法常用研究設計的統(tǒng)計學分析思路、方法和指標和指標n偏倚的測量偏倚的測量決定驗證假設所需的資料決定驗證假設所需的資料為得到所需資料,設計調查表和資料整理表為得到所需資料,設計調查表和資料整理表收集資料收集資料數據錄入和整理資料數據錄入和整理資料描述性分析:病例計數、頻數分布、構成比、率描述性分析:病例計數、頻數分布、構成比、率聯系的測定:四格表、顯著性檢驗、可信區(qū)間計算聯

2、系的測定:四格表、顯著性檢驗、可信區(qū)間計算分層分析:評價混雜因素和效應修正作用分層分析:評價混雜因素和效應修正作用必要時作多因素分析必要時作多因素分析必要時進一步深入分析必要時進一步深入分析合理解釋結果合理解釋結果 , 評價因果關系評價因果關系產生假設產生假設流行病學調查資料分析步驟流行病學調查資料分析步驟流行病學資料錄入和分析常用軟件流行病學資料錄入和分析常用軟件資料的整理 n規(guī)定變量的取值方法規(guī)定變量的取值方法n如:男性如:男性1 1,女性,女性2 2,缺失,缺失9 9n錄入資料時有章可循,正確地處理不可接受數值錄入資料時有章可循,正確地處理不可接受數值n審查審查 n可與錄入同步(可與錄入

3、同步( EpidataEpidata )n質量控制質量控制 :范圍核對范圍核對 邏輯核對邏輯核對 n及時糾正數據錯誤及時糾正數據錯誤n不能因調查結果不在取值范圍而將數據隨意改動不能因調查結果不在取值范圍而將數據隨意改動n現場審查,列出病例一覽表現場審查,列出病例一覽表數據錄入和管理常見軟件數據錄入和管理常見軟件面對所收集的大量的原始資料,研究者必須對原始資料建立數據庫、錄入數據,并保證數據能真實反映資料所收集的信息,因此這些工作都需要數據管理軟件來實現。各種軟件操作方式不同,個人使用習慣不同,因人而異選擇不同的軟件。EpiDataEpiData建立數據庫數據錄入數據庫管理數據庫輸出與輸入數據統(tǒng)

4、計分析數據統(tǒng)計分析當數據錄入和管理軟件把所有收集的流行病學信息資料進行整理后,就進入流行病學研究的另外一個重要環(huán)節(jié),即對資料進行分析處理,并對分析結果做出符合專業(yè)領域的合理解釋。資料分析策略的制定 n為實際資料分析提供綱領和指南為實際資料分析提供綱領和指南n草擬資料整理表草擬資料整理表又稱預期分析表(又稱預期分析表(一系列一系列)n可按邏輯順序可按邏輯順序n可可由簡單到復雜由簡單到復雜n可可由描述由描述到到分析分析資料整理表n資料描述整理表資料描述整理表n1類:臨床特征描述類:臨床特征描述n2類:三間分布描述類:三間分布描述n分析性研究整理表分析性研究整理表n3類:類:22表表(因素和疾病之間

5、聯系的基本表因素和疾病之間聯系的基本表)n4類:分層分析表類:分層分析表(混雜因素、效應修正混雜因素、效應修正)n5類:劑量反應關系類:劑量反應關系n6類:配比病例對照研究類:配比病例對照研究整理表舉例Kawasaki綜合征調查資料整理表整理表整理表A 川崎病臨床癥狀頻數分布川崎病臨床癥狀頻數分布 整理表整理表B 川崎病嚴重并發(fā)癥病人頻數分布川崎病嚴重并發(fā)癥病人頻數分布 整理表整理表C 川崎病病例特征川崎病病例特征 整理表整理表D 川崎病病人家庭收入川崎病病人家庭收入整理表整理表E 川崎病病例地區(qū)分布川崎病病例地區(qū)分布整理表整理表F 川崎病病例發(fā)病時間分布川崎病病例發(fā)病時間分布 整理表整理表G

6、 川崎病與既往病史關系的病例對照研究川崎病與既往病史關系的病例對照研究 整理表整理表H 川崎病與地毯清潔劑關系的病例對照研究川崎病與地毯清潔劑關系的病例對照研究整理表整理表I 川崎病與家庭收入關系的病例對照研究川崎病與家庭收入關系的病例對照研究 一、描述性研究一、描述性研究描描述性研究述性研究n現況研究現況研究(橫斷面研究)(橫斷面研究)n生態(tài)學研究生態(tài)學研究n歷史常規(guī)資料的收集和分析歷史常規(guī)資料的收集和分析n隨訪監(jiān)測研究隨訪監(jiān)測研究現況研究現況研究 又稱橫斷面研究(又稱橫斷面研究(cross-sectional study),根據研究的人群范圍或調查方),根據研究的人群范圍或調查方式不同可分

7、為式不同可分為:n普查普查n抽樣調查抽樣調查n個案調查個案調查n追蹤調查追蹤調查n公共衛(wèi)生監(jiān)測公共衛(wèi)生監(jiān)測(一)普查數據統(tǒng)計分析思路和方法(一)普查數據統(tǒng)計分析思路和方法1統(tǒng)計應調查人數、實際調查人數,描述漏查率和應答率。統(tǒng)計應調查人數、實際調查人數,描述漏查率和應答率。2描述調查對象的社會人口學特征,如性別、年齡、民族等描述調查對象的社會人口學特征,如性別、年齡、民族等基本構成。計數資料采用構成比(百分比)描述,計量資料采基本構成。計數資料采用構成比(百分比)描述,計量資料采用均數用均數標準差描述。標準差描述。3統(tǒng)計調查人群的總體指標,根據數據類型,分別描述總體統(tǒng)計調查人群的總體指標,根據數

8、據類型,分別描述總體的患病率、感染率等頻率指標,或總體計量數據的集中和離散的患病率、感染率等頻率指標,或總體計量數據的集中和離散趨勢指標(均數趨勢指標(均數標準差、百分位數等)。標準差、百分位數等)。4按社會人口學特征或暴露與否分組,統(tǒng)計、描述疾病和健按社會人口學特征或暴露與否分組,統(tǒng)計、描述疾病和健康狀態(tài)相關頻率指標;或按疾病有無描述暴露的構成比;并進康狀態(tài)相關頻率指標;或按疾病有無描述暴露的構成比;并進行分層和對比分析。行分層和對比分析。(二)抽樣調查數據統(tǒng)計分析思路和方法二)抽樣調查數據統(tǒng)計分析思路和方法統(tǒng)計分析步驟:統(tǒng)計分析步驟:1. 一般描述一般描述2. 統(tǒng)計描述統(tǒng)計描述3. 關聯分

9、析關聯分析1一般描述一般描述 包括抽樣方法、設計樣本量、調查樣本量、應包括抽樣方法、設計樣本量、調查樣本量、應答率和樣本人群的社會人口學特征等。答率和樣本人群的社會人口學特征等。(二)抽樣調查數據統(tǒng)計分析思路和方法二)抽樣調查數據統(tǒng)計分析思路和方法2統(tǒng)計描述統(tǒng)計描述(1)計算有關統(tǒng)計指標,包括患病率、感染率、暴露率等)計算有關統(tǒng)計指標,包括患病率、感染率、暴露率等頻率指標及其頻率指標及其95%的可信區(qū)間,計量資料的均數、標準差的可信區(qū)間,計量資料的均數、標準差或百分位數等?;虬俜治粩档?。(2)結合頻率指標,通過圖表或文字,按時間、地區(qū)和人)結合頻率指標,通過圖表或文字,按時間、地區(qū)和人群描述疾

10、病或健康狀態(tài)的分布??上劝茨硞€因素分層描述,群描述疾病或健康狀態(tài)的分布??上劝茨硞€因素分層描述,再按多個因素綜合描述,如按時間地區(qū)、地區(qū)人群、時再按多個因素綜合描述,如按時間地區(qū)、地區(qū)人群、時間人群等不同分層方法進行描述。間人群等不同分層方法進行描述。(二)抽樣調查數據統(tǒng)計分析思路和方法二)抽樣調查數據統(tǒng)計分析思路和方法3關聯分析關聯分析 對暴露和疾病的關系可作初步的關聯分析,如對暴露和疾病的關系可作初步的關聯分析,如:n計量資料的比較采用計量資料的比較采用t檢驗或方差分析(檢驗或方差分析(ANOVA)n率的比較采用率的比較采用2檢驗或檢驗或u檢驗。檢驗。n也可選擇適當的自變量和因變量進行多因

11、素分析,也可選擇適當的自變量和因變量進行多因素分析,多重線性回歸分析多重線性回歸分析或或Logistic回歸分析?;貧w分析。(三)生態(tài)學研究數據統(tǒng)計分析思路和方法(三)生態(tài)學研究數據統(tǒng)計分析思路和方法n通常采用比較、分析等常用的統(tǒng)計學處理技術。通常采用比較、分析等常用的統(tǒng)計學處理技術。在描述研究因素與疾病或健康狀況的關系時,通在描述研究因素與疾病或健康狀況的關系時,通常以圖示法直觀表述。常以圖示法直觀表述。驅蟲藥與腦炎的因果關系驅蟲藥與腦炎的因果關系 (三)生態(tài)學研究數據統(tǒng)計分析思路和方法(三)生態(tài)學研究數據統(tǒng)計分析思路和方法多組比較資料的分析,則包括:多組比較資料的分析,則包括:1直線回歸分

12、析直線回歸分析 將各群體研究因素的平均暴露水平作為自變量,將各群體研究因素的平均暴露水平作為自變量,以疾病的頻率作為應變量,通過計算生態(tài)學相關系以疾病的頻率作為應變量,通過計算生態(tài)學相關系數和回歸系數,進行相關回歸分析。由于在生態(tài)學數和回歸系數,進行相關回歸分析。由于在生態(tài)學研究中,一般可獲得發(fā)病率,故可計算。研究中,一般可獲得發(fā)病率,故可計算。2危險度分析危險度分析 計算相對危險度、歸因危險度和人群歸因危險計算相對危險度、歸因危險度和人群歸因危險度百分比。度百分比。二、二、 分析性研究分析性研究(一)病例對照研究數據統(tǒng)計分析思路和方法(一)病例對照研究數據統(tǒng)計分析思路和方法n描述性分析描述性

13、分析n推斷性分析推斷性分析1描述性分析描述性分析(1)一般性描述)一般性描述 首先描述病例和對照的來源、樣本例數、匹配首先描述病例和對照的來源、樣本例數、匹配比例等,然后描述研究對象的一般特征,如性別、比例等,然后描述研究對象的一般特征,如性別、年齡、職業(yè)、出生地、居住地、疾病類型等。年齡、職業(yè)、出生地、居住地、疾病類型等。1描述性分析描述性分析(2)均衡性檢驗)均衡性檢驗 比較病例組與對照組研究因素以外的某些特征比較病例組與對照組研究因素以外的某些特征構成是否齊同,檢驗其可比性。構成是否齊同,檢驗其可比性。n計量指標的比較(如兩組平均年齡的比較)可采用計量指標的比較(如兩組平均年齡的比較)可

14、采用t檢檢驗、驗、ANOVA;n計數指標的比較(如兩組性別構成比較)可采用計數指標的比較(如兩組性別構成比較)可采用2檢檢驗。驗。n對有統(tǒng)計學顯著差異的因素,在分析時應考慮它對主對有統(tǒng)計學顯著差異的因素,在分析時應考慮它對主要關聯因素的影響。要關聯因素的影響。2推斷性分析推斷性分析(1)成組設計病例對照研究資料的分析)成組設計病例對照研究資料的分析 比較病例組和對照組之間研究因素暴比較病例組和對照組之間研究因素暴露比例的差異,推斷暴露和疾病之間是否露比例的差異,推斷暴露和疾病之間是否存在統(tǒng)計學關聯(存在統(tǒng)計學關聯(2檢驗),計算關聯強檢驗),計算關聯強度(度(OR)及其)及其95的可信區(qū)間。的

15、可信區(qū)間。病例對照研究的資料整理表2推斷性分析推斷性分析(2)成組設計分層資料的分析)成組設計分層資料的分析 分層分析是把研究人群(暴露與未暴露人群分層分析是把研究人群(暴露與未暴露人群或者病例與對照)根據某些特征和因素分為不同或者病例與對照)根據某些特征和因素分為不同層(如按性別分為兩層),然后分別分析各層中層(如按性別分為兩層),然后分別分析各層中暴露與疾病的關聯。暴露與疾病的關聯。2推斷性分析推斷性分析(2)成組設計分層資料的分析)成組設計分層資料的分析 如果各層如果各層OR值接近,異質性檢驗無統(tǒng)計學意值接近,異質性檢驗無統(tǒng)計學意義,則可通過義,則可通過Mantal-haenszel方法

16、計算方法計算2MH,并計算控制混雜因素(分層因素)影響后暴露和并計算控制混雜因素(分層因素)影響后暴露和疾病之間真實的關聯強度疾病之間真實的關聯強度ORMH及其及其95可信區(qū)間可信區(qū)間。表57n按年齡分層 計算OR值兩層的OR均較不分層的OR(2.20)大。進一步分析 年齡對MI的關系按OC與MI的關系列表計算 2=7.70, RR=2.20可見OC與MI有聯系2推斷性分析推斷性分析(2)成組設計分層資料的分析)成組設計分層資料的分析 如果各層如果各層OR值相差較大,異質性檢驗有統(tǒng)值相差較大,異質性檢驗有統(tǒng)計學意義,則不宜采用計學意義,則不宜采用Mantal-haenszel方法方法合并,可通

17、過計算標準化死亡比(合并,可通過計算標準化死亡比(standard mortality ratio,SMR)或標準化率比)或標準化率比(standard rate ratio,SRR),評價控制混),評價控制混雜因素影響后暴露和疾病的真實關聯強度(具體雜因素影響后暴露和疾病的真實關聯強度(具體原理和計算方法參見相關專業(yè)書籍)原理和計算方法參見相關專業(yè)書籍)2推斷性分析推斷性分析(3)成組設計分級暴露資料的分析)成組設計分級暴露資料的分析 若能獲得某暴露因素在不同暴露水平若能獲得某暴露因素在不同暴露水平的資料,計算不同暴露等級的的資料,計算不同暴露等級的OR值,并作值,并作趨勢性趨勢性2檢驗,分

18、析疾病和暴露的劑量反檢驗,分析疾病和暴露的劑量反應關系(應關系(dose-response relationship),),以增加因果關系推斷的依據。以增加因果關系推斷的依據。2推斷性分析推斷性分析(4)1:1配對和配對和1:M配比設計資配比設計資料的分析料的分析 1:1配對和配對和1:M配比設計病例對照配比設計病例對照研究資料的分析方法與成組設計資料研究資料的分析方法與成組設計資料的分析方法不同。的分析方法不同。cbcb22) 1(bcOR 2推斷性分析推斷性分析(5)多因素分析)多因素分析 在病例對照研究中往往需要同時研究多在病例對照研究中往往需要同時研究多個因素的作用,如果僅應用一般分層

19、分析方個因素的作用,如果僅應用一般分層分析方法同時對若干因素加以控制,計算復雜且受法同時對若干因素加以控制,計算復雜且受樣本量的限制。隨著多因素分析軟件的出現,樣本量的限制。隨著多因素分析軟件的出現,可比較容易地分析多個因素與疾病的聯系、可比較容易地分析多個因素與疾病的聯系、聯系程度以及各因素之間的相互關系。目前聯系程度以及各因素之間的相互關系。目前經常使用的有條件和非條件經常使用的有條件和非條件Logistic回歸模回歸模型。型。2推斷性分析推斷性分析(6)交互作用與效應修飾的分析)交互作用與效應修飾的分析 交互作用主要表現為暴露與疾病的聯系由于受交互作用主要表現為暴露與疾病的聯系由于受某個

20、因素的作用而改變,這因素稱為某個因素的作用而改變,這因素稱為效應修飾因素效應修飾因素(effect modifier),其所產生的影響為,其所產生的影響為效應修飾效應修飾(effect modification)。2推斷性分析推斷性分析(6)交互作用與效應修飾的分析)交互作用與效應修飾的分析 在病例對照研究中,評價交互作用最常用的方在病例對照研究中,評價交互作用最常用的方法是按某一因素分層后,再看各層的法是按某一因素分層后,再看各層的OR是否相同,是否相同,一般需檢驗各層一般需檢驗各層OR是否同質。是否同質。 通??梢杂枚嘣貧w分析的方法來評價交互作通??梢杂枚嘣貧w分析的方法來評價交互作用,

21、如果某個代表交互作用的回歸系數具有顯著性,用,如果某個代表交互作用的回歸系數具有顯著性,就認為該系數所代表的幾個因素之間存在交互作用。就認為該系數所代表的幾個因素之間存在交互作用。常用的有常用的有Logistic回歸回歸、Cox模型模型和和對數直線模型對數直線模型等。等。(二)隊列研究數據統(tǒng)計分析思路和(二)隊列研究數據統(tǒng)計分析思路和過程過程1. 描述性分析描述性分析2. 推斷性分析推斷性分析3. 標化比的計算標化比的計算1. 描述性分析描述性分析(1)一般性描述)一般性描述 描述研究對象的組成、社會人口學特征、隨訪描述研究對象的組成、社會人口學特征、隨訪經過、隨訪時間、結局的發(fā)生和失訪情況等

22、。經過、隨訪時間、結局的發(fā)生和失訪情況等。1. 描述性分析描述性分析(2)均衡性檢驗)均衡性檢驗 比較各組研究因素以外的某些特征構成是否齊同,檢驗其可比較各組研究因素以外的某些特征構成是否齊同,檢驗其可比性;對各組的失訪率也要進行比較。比性;對各組的失訪率也要進行比較。n計量指標的比較采用計量指標的比較采用t檢驗、檢驗、ANOVA;n計數指標的比較采用計數指標的比較采用2檢驗或檢驗或u檢驗。檢驗。n對差異有統(tǒng)計學意義的因素,在分析時應考慮它對暴露和對差異有統(tǒng)計學意義的因素,在分析時應考慮它對暴露和疾病關系的影響。疾病關系的影響。1. 描述性分析描述性分析(3)隊列發(fā)病率或死亡率的計算)隊列發(fā)病

23、率或死亡率的計算 根據研究人群的穩(wěn)定程度,隊列通常分為固定根據研究人群的穩(wěn)定程度,隊列通常分為固定隊列(隊列(fixed cohort)和開放隊列()和開放隊列(open cohort),兩種隊列人群發(fā)病率或死亡率的計算指),兩種隊列人群發(fā)病率或死亡率的計算指標不同。但通常都要計算累計發(fā)病率或發(fā)病密度。標不同。但通常都要計算累計發(fā)病率或發(fā)病密度。2. 推斷性分析推斷性分析 比較暴露組和對照組(或多組)之間比較暴露組和對照組(或多組)之間發(fā)病率或死亡率的差異,推斷暴露和疾病發(fā)病率或死亡率的差異,推斷暴露和疾病之間是否存在統(tǒng)計學關聯。之間是否存在統(tǒng)計學關聯。n符合正態(tài)分布或近似狀態(tài)分布,可進行兩符

24、合正態(tài)分布或近似狀態(tài)分布,可進行兩個率差別的個率差別的u檢驗;檢驗;n樣本較小、發(fā)病率較低時,可用直接概率樣本較小、發(fā)病率較低時,可用直接概率法、二項分布或法、二項分布或Poisson分布檢驗;分布檢驗;n樣本稍大和發(fā)病率稍大時,可用四格表樣本稍大和發(fā)病率稍大時,可用四格表2檢驗。檢驗。隊列研究的資料整理表2. 推斷性分析推斷性分析n再分組或分層計算關聯強度相對危險度再分組或分層計算關聯強度相對危險度(relative risk,RR)和)和95的可信區(qū)間,的可信區(qū)間,以及危險度指標。危險度指標包括以及危險度指標。危險度指標包括:n歸因危險度(歸因危險度(AR)n歸因危險度百分比(歸因危險度百

25、分比(ARP)n人群歸因危險度(人群歸因危險度(PAR)n人群歸因危險度百分比(人群歸因危險度百分比(PARP)3. 標化比的計算標化比的計算n當研究對象人數較少或死亡(發(fā)?。┞瘦^低時不宜計當研究對象人數較少或死亡(發(fā)?。┞瘦^低時不宜計算率,此時可以全人口的死亡(發(fā)?。┞首鳛闃藴剩懵?,此時可以全人口的死亡(發(fā)?。┞首鳛闃藴?,計算該觀察人群的預期死亡(發(fā)?。┤藬担缓笥嬎阌嬎阍撚^察人群的預期死亡(發(fā)?。┤藬?,然后計算實際死亡(發(fā)病)數與預期數之比,即為實際死亡(發(fā)?。蹬c預期數之比,即為標化死亡標化死亡(發(fā)?。┍龋òl(fā)?。┍龋╯tandardized mortality ratio,SMR)13. 17180)亡數(按全人口計算的預期死)(研究人群中觀察死亡數EOSMR3. 標化比的計算標化比的計算n當未能獲得人群歷年的人口資料,而僅有死亡當未能獲得人群歷年的人口資料,而僅有死亡人數、日期和年齡,則可計算人數、日期和年齡,則可計算標化比例死亡比標化比例死亡比(standardized proportional mortality ratio,SPMR),即以全人口中某病因死亡占,即以全人口中某病因死亡占全死因死亡的比例乘以該人群實際死亡數而獲全死因死亡的比例乘以該人群實際死亡數而獲得預期死亡數,然后計算

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯系上傳者。文件的所有權益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網頁內容里面會有圖紙預覽,若沒有圖紙預覽就沒有圖紙。
  • 4. 未經權益所有人同意不得將文件中的內容挪作商業(yè)或盈利用途。
  • 5. 人人文庫網僅提供信息存儲空間,僅對用戶上傳內容的表現方式做保護處理,對用戶上傳分享的文檔內容本身不做任何修改或編輯,并不能對任何下載內容負責。
  • 6. 下載文件中如有侵權或不適當內容,請與我們聯系,我們立即糾正。
  • 7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

評論

0/150

提交評論