




版權(quán)說(shuō)明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請(qǐng)進(jìn)行舉報(bào)或認(rèn)領(lǐng)
文檔簡(jiǎn)介
醫(yī)學(xué)研究設(shè)計(jì):調(diào)查設(shè)計(jì)研究生《高級(jí)醫(yī)學(xué)統(tǒng)計(jì)學(xué)》課程主要內(nèi)容調(diào)查研究的特點(diǎn)調(diào)查研究的分類調(diào)查研究中需要考慮的問題四種常見的調(diào)查設(shè)計(jì)多階段設(shè)計(jì)復(fù)雜抽樣的方差估計(jì)抽樣調(diào)查的技巧正確應(yīng)用實(shí)例:
江蘇省20歲以上城區(qū)居民的2型糖尿病患病情況調(diào)查總體:全省106個(gè)縣級(jí)城區(qū)20歲以上常住居民抽樣方法:多階段分層整群隨機(jī)抽樣蘇南、蘇中、蘇北3個(gè)層每層隨機(jī)抽取2個(gè)縣城每個(gè)縣城隨機(jī)抽取2個(gè)居民小區(qū)共調(diào)查了9600名居民作為樣本調(diào)查研究的特點(diǎn)被動(dòng)觀察研究因素已經(jīng)存在已經(jīng)對(duì)象居住的區(qū)域是自然形成的人口年齡構(gòu)成,地區(qū)聚集性問卷(questionnaire)調(diào)查容易產(chǎn)生偏倚抽樣調(diào)查和經(jīng)典的抽樣的區(qū)別:經(jīng)典的抽樣:已知總體分布;無(wú)限總體;抽樣調(diào)查:總體可能未知;總體可能有限;調(diào)查研究的分類從調(diào)查的范圍來(lái)分普查(census)抽樣調(diào)查(samplingsurvey)典型調(diào)查(typicalsurvey)
從調(diào)查涉及的時(shí)間來(lái)分橫斷面調(diào)查(cross-sectionalstudy)回顧性調(diào)查(retrospectivestudy)前瞻性調(diào)查(prospectivestudy)隊(duì)列研究(cohortstudy)
從抽取樣本方法來(lái)分概率抽樣(隨機(jī)抽樣)非概率抽樣(非隨機(jī)抽樣)全國(guó)人口普查1953年7月1日0時(shí): 601,938,0351964年7月1日0時(shí): 723,070,2691982年7月1日0時(shí):
1,031,882,5111990年7月1日0時(shí):
1,160,017,3812000年7月1日0時(shí):
129533(萬(wàn))2010年11月1日0時(shí):1,339,724,852我國(guó)六次人口普查結(jié)果研究設(shè)計(jì)為什么要抽樣?總體無(wú)限破壞性實(shí)驗(yàn)成本效益比(人力、物力、財(cái)力、時(shí)間)少而精我國(guó)五次人口普查和三次抽樣調(diào)查1953年7月1日0時(shí): 6019380351964年7月1日0時(shí): 7230702691982年7月1日0時(shí): 10318825111987年7月1日0時(shí): 107233(萬(wàn))1990年7月1日0時(shí): 11600173811995年10月1日0時(shí) : 120778(萬(wàn))2000年7月1日0時(shí): 129533(萬(wàn))2005年10月1日0時(shí): 130756(萬(wàn))2010年11月1日0時(shí):1,339,724,852調(diào)查研究中需要考慮的問題調(diào)查目的總體與樣本抽樣框調(diào)查項(xiàng)目與調(diào)查表組織實(shí)施數(shù)據(jù)管理計(jì)劃統(tǒng)計(jì)分析計(jì)劃設(shè)計(jì)效應(yīng)樣本的要求代表性足夠的樣本量(排除偶然性)沒有錯(cuò)誤的樣本,只有錯(cuò)誤的解釋!抽樣框(samplingframe)總體的一份完整的包含所有個(gè)體的清單根據(jù)研究目的確定的總體中所包含的具體抽樣單位(sampleunits)的目錄行政區(qū)域、地圖、郵政編碼、姓名地址錄、電話號(hào)碼抽樣框在抽樣調(diào)查中處于基礎(chǔ)地位,是抽樣調(diào)查必不可少的部分,利用抽樣框提供抽樣單位并從中抽出所需要的樣本。抽樣框的選擇對(duì)某城市所有小學(xué)兒童進(jìn)行隨機(jī)抽樣以了解其生長(zhǎng)發(fā)育情況完全隨機(jī)抽樣:抽樣框=該市所有學(xué)生名單多階段抽樣:初級(jí)抽樣框=學(xué)校名單
二級(jí)抽樣框=抽到學(xué)校的班級(jí)
三級(jí)抽樣框=抽到班級(jí)的學(xué)生整群抽樣:抽樣框=該市所有學(xué)校名單研究設(shè)計(jì)歷史上著名的抽樣調(diào)查失敗的例子1936年美國(guó)總統(tǒng)選舉。LiteraryDigest雜志進(jìn)行的民意調(diào)查??八_斯州州長(zhǎng)AlfLandon
與FranklinDelanoRoosevelt.根據(jù)電話薄和車輛登記薄發(fā)調(diào)查表1000萬(wàn)份。調(diào)查結(jié)果Landon非常受歡迎,預(yù)測(cè)Landon贏得選舉。調(diào)查表(問卷)調(diào)查表(questionnaire)基本信息(備查項(xiàng)目):只要必須的調(diào)查指標(biāo)(分析項(xiàng)目):緊扣研究目的簡(jiǎn)潔、美觀、便于計(jì)算機(jī)錄入和管理多用選擇題,盡量不用問答題研究設(shè)計(jì)
2型糖尿病患病及相關(guān)因素調(diào)查問卷編碼□□□□□□□□姓名___________________出生年月□□□□/□□/□□(年/月/日)家庭住址_____市_____縣_____鄉(xiāng)(街道)____村(路)___號(hào)電話_______________編號(hào)項(xiàng)目項(xiàng)目編碼選擇結(jié)果1性別男=1女=0□2婚姻狀況未婚=1已婚=2離異=3喪偶=4□3是否糖尿病是=1否=0□4糖尿病分型1型=12型=2不詳=3□5是否有糖尿病家族史是=1否=0□6三餐是否規(guī)律是=0有時(shí)=1否=2□7是否吸煙是=1否=0□8你的口味是偏淡=1一般=2偏咸=3偏甜=4□9是否飲酒是=1否=0□10體育鍛煉(次/周)不鍛煉=01-2次=1≥3次=2□11工作緊張是=1否=0□12鍛煉時(shí)間(分鐘)<20=020-39=1≥40=2□13身高(cm)□□□.□14體重(kg)□□□.□15脈搏(次/分)□□□16靜脈空腹血糖FBG(mmol/L)□□.□□2型糖尿病患病及相關(guān)因素調(diào)查問卷格式(節(jié)選,光電閱讀式)組織實(shí)施計(jì)劃直接觀察法直接觀察、檢查、測(cè)量本法取得的資料比較真實(shí)可靠,但所需人力、財(cái)力較多。采訪法根據(jù)受訪者或知情人的回答來(lái)搜集資料。面訪開調(diào)查會(huì)信訪網(wǎng)絡(luò)調(diào)查(e-reward)電話新興的網(wǎng)絡(luò)調(diào)查新興的網(wǎng)絡(luò)調(diào)查新興的網(wǎng)絡(luò)調(diào)查新興的網(wǎng)絡(luò)調(diào)查設(shè)計(jì)效應(yīng)(designeffect)
當(dāng)樣本量相同時(shí)復(fù)雜設(shè)計(jì)估計(jì)值的方差/簡(jiǎn)單隨機(jī)抽樣估計(jì)值方差例:估計(jì)人群中某病患病率,若利用簡(jiǎn)單隨機(jī)抽樣:方差估計(jì)值為0.00197若利用分層抽樣:方差估計(jì)值為0.00520設(shè)計(jì)效應(yīng):520/197=2.6基本抽樣方法簡(jiǎn)單隨機(jī)抽樣分層隨機(jī)抽樣系統(tǒng)抽樣整群抽樣簡(jiǎn)單隨機(jī)抽樣從N個(gè)個(gè)體中隨機(jī)抽取n個(gè),使得所有可能的個(gè)樣本中任一個(gè)均有相同的可能性被抽到。樣本均數(shù)是總體均數(shù)的無(wú)偏(unbiased)估計(jì)值。簡(jiǎn)單隨機(jī)抽樣
簡(jiǎn)單隨機(jī)抽樣的參數(shù)估計(jì):均數(shù)無(wú)限總體有限總體finitepopulationcorrection(FPC):一般認(rèn)為樣本不超過總體5%時(shí)可忽略。當(dāng)有放回抽樣時(shí),簡(jiǎn)單隨機(jī)抽樣的參數(shù)估計(jì):率樣本率是總體率的無(wú)偏(unbiased)估計(jì)值。率的方差的無(wú)偏估計(jì)簡(jiǎn)單隨機(jī)抽樣:樣本量估計(jì)均數(shù)率δ為容許誤差,即樣本統(tǒng)計(jì)量與總體參數(shù)的差別需要控制在什么范圍內(nèi),一般取可信區(qū)間寬度的一半。有限總體校正簡(jiǎn)單隨機(jī)抽樣優(yōu)點(diǎn)最基本的抽樣方法;是其他方法的基礎(chǔ)。不需要其他輔助信息,簡(jiǎn)單直觀;方法成熟。缺點(diǎn)總體大時(shí)難度高;效率有時(shí)候較低;容易有偏。分層抽樣總體先被分為若干不重疊的層,每層內(nèi)再進(jìn)行抽樣S1
S2
S3
S4
S5
S6
分層抽樣樣本均數(shù)(率)是各層樣本均數(shù)(率)的加權(quán)平均。方差分層抽樣:樣本的分配固定比例按比例分配:每層樣本量與層大小成比例最優(yōu)分配:當(dāng)有如下情況時(shí),考慮增加某層樣本比例該層個(gè)體很多該層變異較大該層抽樣成本較低分層抽樣:樣本的分配當(dāng)固定樣本量時(shí),當(dāng)每層樣本量為均數(shù)(率)估計(jì)值的方差最小當(dāng)需要考慮成本時(shí)分層抽樣優(yōu)點(diǎn)層內(nèi)同質(zhì)性高,可以使抽樣誤差盡可能?。槐阌趯?shí)施;既可層內(nèi)分析,又可層間比較。缺點(diǎn)必須有各層的有關(guān)資料;調(diào)查變量需和分層變量相關(guān);計(jì)算較復(fù)雜。系統(tǒng)抽樣
…IIIIIIIVV123456789101112131415161718192021222324252627282830系統(tǒng)抽樣方差樣本變異越大越好!二維系統(tǒng)抽樣
系統(tǒng)抽樣優(yōu)點(diǎn)方法簡(jiǎn)便抽樣誤差一般小于簡(jiǎn)單隨機(jī)抽樣缺點(diǎn)需要避免系統(tǒng)偏差誤差估計(jì)復(fù)雜整群抽樣(clustersampling)先將總體劃分為若干個(gè)群;隨機(jī)抽取k個(gè)群;行政區(qū)域機(jī)構(gòu)家庭窩別所抽取群的全部觀察單位作為樣本整群抽樣
整群抽樣優(yōu)點(diǎn)簡(jiǎn)單群內(nèi)變異大于群間時(shí),可以提高效率缺點(diǎn)誤差往往大于簡(jiǎn)單隨機(jī)抽樣誤差估計(jì)復(fù)雜多階段抽樣(multi-stagesampling)將幾種基本抽樣方法結(jié)合起來(lái)。
分層,簡(jiǎn)單隨機(jī)
分層,整群
分層,分層,整群多階段抽樣江蘇省慢性非傳染性疾病基礎(chǔ)資料調(diào)查
了解我省高血壓、冠心病、腦卒中、糖尿病、惡性腫瘤的患病率、死亡率、分布特征及其與經(jīng)濟(jì)水平、吸煙、飲酒、膳食營(yíng)養(yǎng)、體力活動(dòng)等因素的關(guān)系,為采取相應(yīng)的預(yù)防措施提供依據(jù)。抽樣地區(qū)35歲以上常住(五年及以上)居民。多階段抽樣采用多階段分層隨機(jī)整群抽樣法。第一層:蘇北城市點(diǎn)鹽城市城區(qū)=01
農(nóng)村點(diǎn)徐州市銅山縣=02
農(nóng)村點(diǎn)淮陰市金湖縣=03
第二層:蘇中城市點(diǎn)南京市鼓樓區(qū)=04
農(nóng)村點(diǎn)揚(yáng)州市高郵市=05
農(nóng)村點(diǎn)南通市海門市=06
農(nóng)村點(diǎn)泰州市泰興市=07
第三層:蘇南城市點(diǎn)蘇州市平江區(qū)=08
城市點(diǎn)常州市鐘樓區(qū)=09
農(nóng)村點(diǎn)無(wú)錫市郊區(qū)=10
農(nóng)村點(diǎn)常州市溧陽(yáng)市=11多階段抽樣誤差有多個(gè)層次的來(lái)源地區(qū)間城鄉(xiāng)間區(qū)縣間區(qū)縣內(nèi)多階段抽樣優(yōu)點(diǎn)整合各種方法的優(yōu)勢(shì)減少編制抽樣框的工作量缺點(diǎn)效率低于簡(jiǎn)單隨機(jī)抽樣復(fù)雜復(fù)雜抽樣中非線性估計(jì)值方差的估計(jì)方法Y的方差f(Y)的方差復(fù)雜的函數(shù):積?相關(guān)系數(shù)?中位數(shù)?一些方法:平衡重復(fù)復(fù)制(BBR)JACKNIFE法泰勒序列展開法泰勒序列展開式法例:抽樣調(diào)查中的技巧估計(jì)總體大?。翰东@再捕獲法敏感問題調(diào)查技術(shù)雙重抽樣捕獲-再捕獲技術(shù)(capturerecapture)估計(jì)總體大小從總體中抽取一個(gè)樣本量為n1的樣本;對(duì)每個(gè)個(gè)體標(biāo)記后放入總體;混勻后抽取樣本量為n2的樣本,若其中有m個(gè)被標(biāo)記總體大小的估計(jì)值為敏感問題的調(diào)查技術(shù)隨機(jī)應(yīng)答技術(shù)問兩個(gè)截然相反的問題,受試者只要回答是或者否例:考試作弊比例調(diào)查A:曾經(jīng)做過弊(P)B:從來(lái)沒做過弊(1-P)N個(gè)個(gè)體,m個(gè)回答“是”敏感問題的調(diào)查技術(shù)改進(jìn)的隨機(jī)應(yīng)答技術(shù)問兩個(gè)無(wú)關(guān)的問題,受試者只要回答是或者否例:考試作弊比例調(diào)查A:曾經(jīng)做過弊(P)B:是否出生在5月(1-P)N個(gè)個(gè)體,m個(gè)回答“是”雙重抽
溫馨提示
- 1. 本站所有資源如無(wú)特殊說(shuō)明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請(qǐng)下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請(qǐng)聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
- 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁(yè)內(nèi)容里面會(huì)有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
- 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
- 5. 人人文庫(kù)網(wǎng)僅提供信息存儲(chǔ)空間,僅對(duì)用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對(duì)用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對(duì)任何下載內(nèi)容負(fù)責(zé)。
- 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請(qǐng)與我們聯(lián)系,我們立即糾正。
- 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶因使用這些下載資源對(duì)自己和他人造成任何形式的傷害或損失。
最新文檔
- 冷藏合同范本
- 加工車間轉(zhuǎn)租合同范本
- 不見面簽訂租賃合同范本
- 2025年合肥貨運(yùn)車從業(yè)考試題
- 個(gè)人施工承攬合同范本
- app開發(fā)合同范本模板
- 加工訂單合同范本模板
- 農(nóng)村供熱服務(wù)合同范本
- 個(gè)人股權(quán)質(zhì)押合同范本
- 光租船合同范本
- 2024新版(外研版三起joinin)三年級(jí)英語(yǔ)上冊(cè)單詞帶音標(biāo)
- 紡織服裝面料創(chuàng)意設(shè)計(jì)
- 四川義務(wù)教育三年級(jí)生命生態(tài)與安全教案下冊(cè)
- 物業(yè)公司市場(chǎng)拓展全員營(yíng)銷激勵(lì)方案
- EPC總承包項(xiàng)目工程設(shè)計(jì)各階段的服務(wù)承諾
- 2024-2030年中國(guó)達(dá)克羅行業(yè)運(yùn)行態(tài)勢(shì)與前景展望分析報(bào)告
- 2024-2025學(xué)年初中信息技術(shù)(信息科技)七年級(jí)下冊(cè)甘教版教學(xué)設(shè)計(jì)合集
- 小學(xué)一年級(jí)綜合實(shí)踐活動(dòng)第四單元課件《書包》
- 2023屆高考英語(yǔ)全國(guó)甲卷試卷講評(píng)課件
- 2025屆高三數(shù)學(xué)一輪總復(fù)習(xí) 第二章 第一講 函數(shù)的概念及其表示
- 全國(guó)職業(yè)院校技能大賽高職組(軟件測(cè)試賽項(xiàng))備賽試題庫(kù)(含答案)
評(píng)論
0/150
提交評(píng)論