抽樣方法和樣本量估計_第1頁
抽樣方法和樣本量估計_第2頁
抽樣方法和樣本量估計_第3頁
抽樣方法和樣本量估計_第4頁
抽樣方法和樣本量估計_第5頁
已閱讀5頁,還剩20頁未讀 繼續(xù)免費閱讀

下載本文檔

版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進(jìn)行舉報或認(rèn)領(lǐng)

文檔簡介

抽樣方法和樣本量估計報告人:常捷編輯課件關(guān)于抽樣的概念研究對象(unitofanalysis)根據(jù)研究目確實定研究對象??傮w(population)在明確研究對象的根底上,確定其同質(zhì)范圍。調(diào)查對象(samplingelement)被抽中的研究對象。抽樣單位(samplingunit)(如縣、鄉(xiāng)、村、醫(yī)療機(jī)構(gòu)等等)觀察對象(observationunit)如調(diào)查戶主,戶主填寫戶中各個家庭成員情況抽樣表(samplingframe)列出所有抽樣單位的名冊抽樣方法(samplingdesign)抽樣誤差(samplingerror)只是因為抽樣個體差異產(chǎn)生的隨機(jī)誤差抽樣偏移(samplingbias)造成系統(tǒng)誤差,樣本層面的系統(tǒng)的偏差,對總體的代表性偏差編輯課件抽樣方法可分為概率抽樣法與非概率抽樣法兩類概率抽樣法〔probabilitysampling〕總體中每個個體被抽中的概率是且不為零的,可以計算抽樣誤差并在此根底上做統(tǒng)計推斷。主要包括:簡單隨機(jī)抽樣;系統(tǒng)抽樣;整群抽樣;分層抽樣非概率抽樣法〔non-probabilitysampling〕不知道總體中每個個體被抽中的概率,選擇樣本的過程往往不是隨機(jī)的。抽樣誤差無法計算,選擇偏移無法控制。主要包括:方便抽樣;配額抽樣;目的抽樣;滾雪球抽樣編輯課件單純隨機(jī)抽樣simplerandomsampling單純隨機(jī)抽樣就是在總體中以完全隨機(jī)的方法抽取一局部觀察單位組成樣本。常見的方法是先對總體中全部觀察單位編號,然后用抽簽、隨機(jī)數(shù)字表或計算機(jī)產(chǎn)生的隨機(jī)數(shù)字的方法從中抽取一局部觀察單位組成樣本。但是當(dāng)總體例數(shù)較多時,這種方法不太適用。單純隨機(jī)抽樣法是其他概率抽樣法的根底。RandomNumberGenerator://stattrek/statistics/random-number-generator.aspx編輯課件系統(tǒng)抽樣systematicsampling系統(tǒng)抽樣又稱機(jī)械抽樣或等距抽樣,先將總體的觀察單位按某一順序分成n個局部,再從第一局部隨機(jī)抽取k號觀察單位,一次用相等間隔,從每一局部各抽取一個觀察單位。系統(tǒng)抽樣常作為單純隨機(jī)抽樣的替代。編輯課件整群抽樣clustersampling整群抽樣是先將總體按照某種與主要研究指標(biāo)無關(guān)的特征劃分為K個群,每個群包含假設(shè)干觀察單位,然后再隨機(jī)抽取k個群,由抽取的各個群的全部觀察單位組成樣本。與前兩種方法不同在于抽樣單位不同,不是直接抽取個體,而是抽群。單層整群抽樣single-stageclustersampling多層整群抽樣multi-stageclustersampling群的變異越小,群越多,抽樣誤差越小樣本量一定情況下,增加群、減少每群中樣本數(shù),能提高總樣本的代表性本錢低代表性差編輯課件分層抽樣stratifiedsampling分層抽樣是先按照對研究指標(biāo)影響較大的某個特征將總體分成假設(shè)干類別〔即“層〞〕,再從每一層內(nèi)抽取觀察單位,合起來組成樣本。優(yōu)點1〕相同樣本量,抽樣誤差最小優(yōu)點2〕不同的層中,根據(jù)實際情況可以選擇不同的抽樣方法各層觀察單位數(shù)的分配:等比例分配;最優(yōu)分配1〕2〕;編輯課件非概率抽樣法〔non-probabilitysampling〕雖然在對總體的代表性上很差,在此根底上做統(tǒng)計推斷也不科學(xué),但在很多情況下,也是適用的。編輯課件方便抽樣ConvenienceSampling方便獲得的個體即選為樣本,樣本中每個個體的獲得都是偶然性的。最終,樣本不能夠代表總體。不能在此根底上做統(tǒng)計推斷??梢杂糜谘芯康某跏茧A段,目的可以是為了發(fā)現(xiàn)了解相關(guān)信息,發(fā)現(xiàn)值得研究的問題,為下一步提出假設(shè)準(zhǔn)備信息。編輯課件配額抽樣QuotaSampling配額抽樣為保證樣本的代表性,其樣本中具有某種特征的比例幾乎和母體中具有此種特征的比例相等。譬如某大學(xué)有10000名學(xué)生,我們要抽取1000名。將學(xué)生依年級分成如下四個子母體。年級學(xué)生數(shù)在母體之百分比樣本人數(shù)一320032%320二260026%260三220022%220四200020%200與分層抽樣區(qū)別在于,分層抽樣是按隨機(jī)原那么在層內(nèi)抽選樣本,而配額抽樣那么是由調(diào)查人員在配額內(nèi)主觀判斷選定樣本。編輯課件目的抽樣PurposiveSampling總體量很小時,比方總體中只有三個個體,此時,隨機(jī)抽樣并不一定能抽到具有代表性的樣本。這種情況下,還不如根據(jù)自己的專業(yè)知識或者通過咨詢專家借助他們的專業(yè)知識人為選出最有代表性的樣本。編輯課件滾雪球抽樣SnowballSampling通過總體中的一個個體提供的線索找到其他的幾個個體,再通過其他幾個個體提供的線索找到更多的個體。

適用于難以找尋、獲得的研究對象

如HIV/AIDS

其抽樣的代表性也局限于被調(diào)查者的提供的社會網(wǎng)絡(luò)。編輯課件第四次衛(wèi)生效勞總調(diào)查

家庭健康詢問調(diào)查樣本住戶的抽取方法將樣本村〔居委會〕內(nèi)全部住戶〔包括非本地戶口住戶〕按名單順序編號(SamplingFrame);根據(jù)本村〔居委會〕應(yīng)抽取的樣本戶數(shù)確定抽樣間隔。國家樣本點抽樣間隔=本村〔居委會〕內(nèi)戶數(shù)/60〔四舍五入,取整數(shù)〕西部擴(kuò)點抽樣間隔=本村〔居委會〕內(nèi)戶數(shù)/33〔四舍五入,取整數(shù)〕確定抽樣住戶:首先隨機(jī)抽一張人民幣,取其末四位數(shù),該數(shù)除以抽樣間隔后的余數(shù)確定為K值,那么K≤抽樣間隔。K值為被抽第1個住戶編號,K值加抽樣間隔為被抽中的第2個住戶編號,K值加兩個抽樣間隔為第3個被抽住戶編號,以此類推。(SystematicSampling)編輯課件第四次衛(wèi)生效勞總調(diào)查醫(yī)務(wù)人員調(diào)查樣本抽取方法一、調(diào)查對象調(diào)查對象為被抽中的臨床醫(yī)生和護(hù)理人員。被調(diào)查人員將在家庭健康詢問調(diào)查的樣本縣〔市、區(qū)〕中抽取,涉及到的機(jī)構(gòu)包括樣本縣〔市、區(qū)〕中的所有三級綜合醫(yī)院、局部二級綜合醫(yī)院及樣本鄉(xiāng)鎮(zhèn)及街道中的所有社區(qū)衛(wèi)生效勞中心和鄉(xiāng)鎮(zhèn)衛(wèi)生院。

二、調(diào)查對象的選取〔一〕綜合醫(yī)院1、開展家庭健康調(diào)查的樣本縣〔市、區(qū)〕中的所有三級綜合醫(yī)院及局部縣〔市、區(qū)〕醫(yī)院參與調(diào)查,參與調(diào)查的機(jī)構(gòu)名單見培訓(xùn)光盤;2、每所醫(yī)院選取臨床醫(yī)務(wù)人員30名,其中醫(yī)生20名,護(hù)理人員10名。

〔二〕社區(qū)衛(wèi)生效勞中心及鄉(xiāng)鎮(zhèn)衛(wèi)生院樣本街道、樣本鄉(xiāng)鎮(zhèn)中所有的社區(qū)衛(wèi)生效勞中心和鄉(xiāng)鎮(zhèn)衛(wèi)生院均參與調(diào)查;每所社區(qū)衛(wèi)生效勞中心和鄉(xiāng)鎮(zhèn)衛(wèi)生院選取臨床醫(yī)務(wù)人員10名,其中醫(yī)生7名,護(hù)理人員3名。如機(jī)構(gòu)內(nèi)人員數(shù)量不滿足樣本需求時,按實際人數(shù)進(jìn)行調(diào)查。

三、樣本個體選取原那么(QuotaSampling)1、全院所有臨床科室均要抽到;2、樣本選取要求職稱分布均勻,兼顧高、中、初級職稱。編輯課件中國健康與養(yǎng)老追蹤調(diào)查抽樣設(shè)計2021預(yù)調(diào)查抽樣介紹CHARLS預(yù)調(diào)查抽樣程序:縣級單位的選取是按區(qū)域以及城鄉(xiāng)分層,然后依照PPS〔ProbabilityProportionaltoSize〕方法隨機(jī)選取的。在每個縣級單位中,CHARLS再依照PPS方法隨機(jī)抽取3個村級單位〔或是一個城鎮(zhèn)社區(qū)〕,在每一個村或社區(qū)中,再從地圖上隨機(jī)抽取25-36處住所;然后決定每個住所中家庭戶的樣本個數(shù)。CHARLS隨機(jī)選取其中一個符合年齡條件的家庭,然后確定該家庭中符合年齡條件的家庭成員個數(shù)并隨機(jī)抽取一人作為主要受訪者?;谶@樣的隨機(jī)抽樣過程,每個村或社區(qū)會產(chǎn)生25-36個樣本家庭,每戶家庭產(chǎn)生的受訪者有1名〔單身、離婚或喪偶〕或2名〔主要受訪者及其配偶〕。編輯課件中國健康與養(yǎng)老最總調(diào)查抽樣方法2021年全國基線調(diào)查抽樣介紹CHARLS抽樣以保證樣本的無偏和代表性為宗旨,通過四個階段,分別在縣〔區(qū)〕-村〔居〕-家戶-個人層面上進(jìn)行抽樣。具體而言,在縣〔區(qū)〕-村〔居〕兩級抽樣中,CHARLS均采用按人口規(guī)模成比例的概率抽樣,簡稱為PPS抽樣〔probabilitiesproportionaltosize〕。在縣級抽樣階段,按照PPS方法,以每個區(qū)縣2021年人口數(shù)量為根底,使用地區(qū)、城鄉(xiāng)和GDP為分層指標(biāo),直接從全國30個省級行政單位〔不包括西藏自治區(qū)、臺灣省以及香港和澳門特別行政區(qū)〕范圍內(nèi)隨機(jī)抽取150個區(qū)縣;在村級抽樣階段,按照PPS方法,以每個村或社區(qū)2021年常住人口為根底,從上述150個區(qū)縣中各隨機(jī)抽取3個村或社區(qū),最后得到450個村/社區(qū)。以上抽樣過程均在STATA軟件環(huán)境中進(jìn)行,不允許換樣本。為了防止人口信息的偏差,抽樣時我們對450個村級單位的2021年常住人口數(shù)據(jù)與2007年數(shù)據(jù)進(jìn)行了比對。對于兩年人口數(shù)據(jù)差異超過一定限度的村或社區(qū),向統(tǒng)計局進(jìn)行了核實。同時,對于抽中的村或社區(qū),通過中國疾控中心發(fā)文到全國進(jìn)行核實,進(jìn)一步保證了抽樣的質(zhì)量。在村/社區(qū)抽樣完成后,為得到準(zhǔn)確的家戶樣本抽樣框,中國健康與養(yǎng)老追蹤調(diào)查工程設(shè)計并開發(fā)了專用的繪圖軟件〔簡稱CHARLS-GIS〕以進(jìn)行實地繪圖并搜集住戶信息。該軟件利用清晰的GoogleEarth影像圖或者其它途徑的圖片作為底圖。在實地工作中,繪圖員首先攜帶GPS在村的邊界外走一圈來確定樣本村/居委會的邊界;其次,根據(jù)實地情況依次在底圖上勾畫建筑物,導(dǎo)入建筑物GPS位置并進(jìn)行拍照;之后,填寫建筑物內(nèi)住戶信息列表。在繪圖和列表工作完成后,CHARLS北京總部與每個村〔居〕聯(lián)絡(luò)人聯(lián)系,并對以下三方面進(jìn)行〔1〕邊界是否準(zhǔn)確;〔2〕是否所有建筑物都包括在內(nèi);〔3〕住戶列表是否準(zhǔn)確〔通過隨機(jī)抽取住戶核對他們的地址進(jìn)行〕。通過審核后,從每個樣本村/居委會的所有住戶信息列表中隨機(jī)抽取80戶樣本家戶,并對這80戶進(jìn)行入戶詢問、核實家里最長家戶成員的年齡、戶主的姓名、聯(lián)系方式、家戶狀態(tài)〔是否空戶、無法聯(lián)系〕。之后,根據(jù)2021年CHARLS甘肅和浙江試調(diào)查的拒訪率,按照每個村〔居〕24戶有效家戶估算需要抽中的樣本戶數(shù)量并在80戶內(nèi)進(jìn)行相應(yīng)數(shù)量的樣本抽取。最終在450個村、居抽取的樣本戶為23590戶。抽樣完成后,抽中的住戶會在地圖上自動顯示,繪圖員會重新訪問這些戶,對住戶門口拍照,取GPS位置,送?致居民的一封信?。在個人層面,我們利用過濾問卷進(jìn)行調(diào)查,在每個樣本戶中隨機(jī)選擇一位年齡大于45歲的家庭成員作為主要受訪者,對他〔她〕及其配偶進(jìn)行訪問。編輯課件樣本含量〔samplesize〕為了保證研究結(jié)論的可靠性,確定的實驗研究或調(diào)查研究所需要的最低觀察對象的數(shù)量。樣本含量少,研究結(jié)論不可靠〔accuracy〕

樣本含量過多,造成人財物的不必要浪費〔efficiency〕還有可能引入不必要的混雜因素。編輯課件影響所需樣本量的因素總體特征(,thesizeofpopulation)分析方法(比較和同時分析的變量)對估計精度的要求()財力、時間和人力研究設(shè)計(如實驗研究;準(zhǔn)實驗研究)回應(yīng)率(1回應(yīng)率;2問卷合格率)編輯課件樣本量估計時考慮的因素第一類錯誤概率大小〔或置信度1-〕,越小,所需要的樣本含量越大,根據(jù)研究問題的性質(zhì)和研究目的決定I型錯誤的概率值,通常情況下,取0.05,可取單側(cè)或雙側(cè)。第二類錯誤概率大小,越小,檢驗效能1-越大,所需樣本量也越大,一般要求檢驗效能不低于0.80。一般只取單側(cè)。在參數(shù)估計的樣本量估計中不涉及,在假設(shè)檢驗的樣本量估計中涉及。編輯課件樣本量估計時考慮的因素容許誤差δ,是指研究者要求的或客觀實際存在的樣本統(tǒng)計量與總體參數(shù)間或樣本統(tǒng)計量間的差值,容許誤差值越小,所需樣本量越大??傮w標(biāo)準(zhǔn)差σ

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負(fù)責(zé)。
  • 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時也不承擔(dān)用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

評論

0/150

提交評論