版權說明:本文檔由用戶提供并上傳,收益歸屬內容提供方,若內容存在侵權,請進行舉報或認領
文檔簡介
抽樣設計的理論與方法中國科學院數學與系統(tǒng)科學研究院1?報告提綱首先簡單介紹調查的基本概念和主要組成部分,以對抽樣調查有個總體認識講述抽樣調查中的抽樣設計,包括各種抽樣設計與相應的估計方法以及輔助信息的利用,重點是簡單隨機抽樣、分層抽樣、整群抽樣、系統(tǒng)抽樣、多相抽樣參考文獻2?一、調查的主要組成部分調查概述調查設計數據的收集方法調查問卷設計抽樣方法抽樣估計樣本量的確定數據收集的實施數據處理數據發(fā)布與數據分析3?調查概述調查指使用明確的概念、方法和程序,以有組織、有條理的方式,從一個總體的部分或所有單元中收集感興趣的指標信息,并將這些信息綜合編輯成有用的簡要形式的所有活動。調查的重要性。調查是認識客觀世界的一種手段,通過調查獲取信息,了解現狀,進行管理決策和預測。調查的任務。科學地反映客觀情況,為解決問題、制定政策或策略提供依據,調查是為決策服務。調查設計調查前準備調查的實施調查的分析與報告4?調查設計調查目標的確定調查方法的選擇抽樣設計的有關問題調查中各種誤差及其控制5?1、郵寄調查:被調查者在沒有訪員協(xié)助下完成問卷。2、人員面訪:由調查人員協(xié)助完成問卷。3、電話訪問:訪員通過電話協(xié)助被調查者完成問卷。4、網絡調查:調查者利用網絡進行調查。數據的收集方法6?調查問卷設計問卷的作用與設計原則問卷結構與問題類型問卷設計的技巧問卷的度量方法7?問卷的開發(fā)程序向用戶和調查對象咨詢參考以前相同主題的問卷草擬問題審議、測試和修改問卷試點調查和問卷的定稿8?抽樣方法什么是抽樣抽樣是通過抽取總體中的部分單元,收集這些單元的信息,用來對總體進行推斷的一種手段非概率抽樣概率抽樣9?抽樣估計抽樣估計的基本原理加權總體均值、比例及總量的簡單估計輔助信息的使用調查估計量的抽樣誤差估計10?樣本量的確定影響樣本量的因素:估計值要求的精度;提供的經費能支持多大的樣本;調查的時間要求;需要和能招聘到多少調查人員等。11?數據收集的實施數據收集是調查中收集每一個被抽中的單元個體數據的過程。必要的公關工作調查前的準備數據收集過程調查過程及調查質量的控制來自12?數據處理數據處理的簡要過程1、全面核查問卷上的數據2、對問卷上的回答進行編碼3、將數據錄入計算機4、詳細審核、插補5、進行離群值的檢測6、將數據儲存在數據庫中13?數據處理數據處理的簡要過程1、全面核查問卷上的數據2、對問卷上的回答進行編碼3、將數據錄入計算機4、詳細審核、插補5、進行離群值的檢測6、將數據儲存在數據庫中14?數據發(fā)布與數據分析調查報告統(tǒng)計表和統(tǒng)計圖數據分析保密和泄密控制15?抽樣設計的理論和方法抽樣調查中的一些基本概念
總體和樣本:總體是指研究對象的全體`,它是由研究對象中的單元組成的。總體中單元的數目稱作總體容量;樣本是指抽樣時按照抽樣的規(guī)則所抽中的那部分單元所組成的集合??傮w抽取樣本推斷總體樣本16?研究的目標參數:總體總量、總體均值、總體比例的估計及其相應的方差估計入樣概率與抽樣比入樣概率是指某個總體單元被選入樣本的概率抽樣比:指樣本量n與總體的容量N的比例下面介紹主要抽樣方法與相應的估計方法:17?(一)簡單隨機抽樣定義:設總體中有N個單元,不加條件從中隨機抽取n個單元為樣本,每個單元都有同樣的概率被抽中的抽樣方法??傮w總量和總體均值(1)與(2)
18?樣本均值(3)總體均值和總量的估計(4)(5)
19?估計量的方差(6)而(7)估計量的方差估計(8)(9)20?簡單隨機抽樣的特點優(yōu)點:(1)比較容易理解和掌握;(2)抽樣框不需要其他輔助信息;(3)理論上比較成熟,有現成的方差估計公式。缺點:(1)沒有利用輔助信息;(2)樣本分散,面訪費用較高;(3)有可能抽到較差的樣本;(4)抽選大樣本比較費時21?(二)分層抽樣定義:在抽樣之前將總體分為同質的、互不重疊的若干子總體,也稱為層。然后在每一個層獨立地隨機抽取樣本。分層抽樣示意圖22?首先介紹分層抽樣的的一些符號:用下標h表示層的編號用分別表示總體和樣本中第h層第i個單元指標值;用表示h層的層權用表示h層的抽樣比分別表示h層(總體)均值與樣本均值;23?分別為h層的(層內)方差和樣本方差下面介紹分層抽樣適用的場合和優(yōu)點1)在調查中不僅需要對總體進行參數估計,也需要對層的參數進行估計。2)使樣本更具代表性。3)便于組織管理和數據匯總4)對不同層可以按照不同情況和條件,具體采用不同的抽樣方法。5)分層抽樣可以提高估計量的精度估計量及其性質24?總體均值的估計(10)對分層隨機抽樣,有如下簡單估計(11)總體總和的簡單估計為(12)無偏性:如果層的估計具有無偏性,分層的總體總量和總體均值的估計具有無偏性。對分層隨機抽樣,的一個無偏估計為25?
(13)分層抽樣的缺點:(1)對抽樣框的要求比較高,必須有分層的輔助信息;(2)收集或編制抽樣框的費用比較高;(3)若調查變量與分層的變量不相關,效率可能降低;(4)估計值的計算比簡單隨機抽樣復雜26?比估計和回歸估計-利用輔助信息比估計和回歸估計主要是利用輔助變量來提高估計精度比估計及其基本性質如果之間大致呈正比例關系,采用比估計量對簡單隨機抽樣,總體均值和總量的比估計量為(14)(15)有時候,調查的目的是要估計總體與的比值:27?(16)對它的估計為(17)基本性質對于簡單隨機抽樣,當樣本量大時28?對于實際問題的方差估計,仍用樣本估計,用
(18)估計。對分層抽樣,比估計有分別比和聯(lián)合比兩種形式?;貧w估計及其基本性質對簡單隨機抽樣,總體均值的回歸估計定義為(19)若回歸系數設定,則回歸估計為無偏估計,且其方差估計可表示為(20)如回歸系數為1,稱為差估計量。29?如回歸估計量采用樣本回歸系數(21)則總體均值的回歸估計量為(22)基本性質:當樣本量較大時,將相應的樣本估計量代入上式,得相應的樣本估計。對分層抽樣,有相應的分別回歸估計和聯(lián)合回歸估計。30?(三)與單元大小成比例的概率抽樣1、定義:根據單元的大小不同,入樣概率不同的一種不等概率抽樣。如農場的大小不同,其抽選概率可以根據面積大小成比例,也可以按人數多少成比例。用英文的字頭簡稱為PPS抽樣。2、優(yōu)缺點:優(yōu)點是當研究的變量與單元大小有關時,由于使用了輔助信息,可以提高抽樣效率。但缺點是對抽樣框需要有高質量的抽樣框,成本較高;對于單元大小不相關的變量就不適用;估計量的抽樣方差估計比較復雜。31?pps抽樣是一種特殊的不等概率抽樣,對放回地不等概率抽樣,介紹Hansen-Hurvitz估計量。若是按的入樣概率進行的多項抽樣抽取的樣本指標值,相應的值為。則總體總和的估計(Hansen-Hurvitz估計)為(23)是無偏的,且有方差估計(24)對不放回地不等概率抽樣,采用Horvitz-Thompson估計量32?(四)整群抽樣
1、定義:由若干個有聯(lián)系的基本單元組成的集合稱為群,抽樣時以群為抽樣單元的抽樣方法就稱為整群抽樣。
整群抽樣示意圖:黃色為總體紅色為群白點為基本單元33?整群抽樣的優(yōu)點:(1)能大大減低收集數據的費用;(2)當總體單元自然形成的群時,容易取得抽樣框,抽樣也更容易;(3)當群內單元差異大,而不同群之間的差異小時,可以提高效率。缺點:(1)若群內個單元有趨同性,效率將會降低;(2)通常無法預先知道總樣本量,因為不知道群內有多少單元;(3)方差估計比簡單隨機抽樣更為復雜可以綜合利用分層和整群抽樣技術,采取分層整群抽樣,比如人體尺寸調查,采用分層提高樣本代表性,采用整群抽樣,便于數據的收集。34?總體(五)多階抽樣
定義:它是由兩個或更多個連續(xù)的階段抽取樣本的方法。
多階抽樣示意圖:
第一階樣本最終樣本35?優(yōu)點:(1)當群具有同質性時,多階抽樣的效率高于整群抽樣;(2)樣本的分布比簡單隨機抽樣集中,采用面訪可以節(jié)約時間和費用;(3)不需要整個總體單元的名錄框,只要群的名錄框和抽中群的單元名錄框。缺點:(1)效率不如簡單隨機抽樣;(2)通常不能提前知道最終的樣本量;(3)調查的組織較整群抽樣復雜;(4)估計值與抽樣方差的計算較為復雜。36?定義:又稱等距抽樣,對研究的總體按一定的順序排列,每隔一定的間隔抽取一個單元的抽樣方法。抽選方法:設總體單元數為N,要抽n個單元為樣本,先計算抽樣間隔k=N/n,在1到k之間抽取一個隨機起點r,則被抽中單元的順序位置是:r,r+k,r+2k,…。當N不能被n整除時,采用圓形系統(tǒng)抽樣方法。(六)系統(tǒng)抽樣37?2、系統(tǒng)抽樣的優(yōu)點(1)沒有抽樣框時可代替簡單隨機抽樣方法簡單;(2)不需要輔助的抽樣框信息;(3)樣本的分布比較好;估計值容易計算。
3、系統(tǒng)抽樣的缺點(1)若抽樣間隔與總體的某種周期性變化一致,會得一個差的樣本;(2)不使用輔助信息使抽樣效率不高;(3)使用概念框時,不能預先知道樣本量;(4)沒有一個無偏的方差估計量;(5)當N不能被n整除時會得到樣本量不同的樣本。我們國家的國家統(tǒng)計局的調查多采用系統(tǒng)抽樣,它便于操作。38?定義:在同一個抽樣框內,先抽一個大樣本,收集基本的信息,然后在這個大樣本中再抽一個子樣本,收集調查的詳細信息。多相抽樣示意圖:(七)多相抽樣。。。。。。。。。。。。第一相樣本第二相樣本。。。。。。。。。。。。。。。。。。。。。。。。。。。。。。。。。。。39?優(yōu)點:(1)利用了第一相樣本的信息,能顯著提高估計值的精度;(2)適用于某些調查指標的數據收集費用特別高或給被調查者帶來較重負擔的情況。缺點:(1)整個調查的時間要長;(2)調查費用要比較高;(3)調查的組織比較復雜;(4)估計值和抽樣誤差的計算會相當復雜。40?主要的抽樣方法,大致就有上述幾種,在實際中采用哪種抽樣設計,要根據具體情況,靈活掌握,當然也可以組合起來使用。抽樣方案和參數估計是一體的,所以在抽樣設計時要考慮到后續(xù)的數據處理。41?參考書目馮士雍,施錫輇.抽樣調查-理論、方法與實踐.上??茖W技術出版社,1996.馮士雍,倪加勛,鄒國華.抽樣調查理論與方法,中國統(tǒng)計出版,1998.加拿大統(tǒng)計局《調查技能》項目組編,中國國家統(tǒng)計局《調查技能》項目組譯,馮士雍(審校).調查技能教程,中國統(tǒng)計出版社,2002.趙民德,謝邦昌.探索真相,中國統(tǒng)計出版,2001.胡健穎,孫山澤,抽樣調查的理論和方法,北京大學出版社,2000.
柯惠新,丁立宏,市場調查與分析,中國統(tǒng)計出版社,2000.梁小筠,祝大平.抽樣調查的方法和原理,華東師范大學出版社,1994.42?我的一些工作:一、可靠性方面1.DanYuandJunyang,Storagereliabilityevaluationofcomplexrepairablesystem,ProceedingofEastAsianSymposiumonStatistics,2002.11。2、楊軍,于丹.一種基于可用度的裝備貯存模型及其應用,系統(tǒng)工程理論與實踐,2004.7。3、楊軍,于丹.修如舊模型中貯存系統(tǒng)備件量的計算及其置信區(qū)間,中國科學院研究生院學報,2004.10。4、于丹,楊軍.復雜系統(tǒng)貯存可靠性綜合評估,中國電子學會論文集可靠性分會第十二屆學術年會論文選,2004.10。43?5、JunYang(speaker),DanYu.OnekindofCompositeRepairableModelanditsAvailabilityFiducialInference,TheJointMeetingofCSPSandIMS2005.7。6、楊軍,于丹.一種可修系統(tǒng)貯存模型及其可用度Fiducial推斷,系統(tǒng)科學與數學,2004年接受。7、楊軍,馮士雍,于丹.可修系統(tǒng)的一種復合貯存模型及其可用度估計,工程數學學報,已錄用。8、楊軍,于丹.修如新模型中貯存系統(tǒng)備件量的計算及其置信上限,應用概率統(tǒng)計,一審通過(二審中)。二、抽樣調查(缺失數據)9、楊軍,馮士雍.抽樣調查中缺失數據的插補方法,應用概率統(tǒng)計,已投。10、楊軍,姜健.隨機變量和模型及其實證研究,數理統(tǒng)計與管理,已投。44?11、JunYang.TwokindsofnoniterativecomputingmethodsforBayesposteriors,tobesubmited.12、楊軍.比例bootstrap及其方差估計的相合性,待投。13、JunYang.Regressionimputationusingresponseprobability,tobesubmited.14、楊軍.物理事理人理方法論對調查工作的應用,待投。三、統(tǒng)計質量控制15、于振凡,張玉柱,姜健,楊軍,涂玉娟等.GB/Z4887-2005《累積和控制圖─用
溫馨提示
- 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權益歸上傳用戶所有。
- 3. 本站RAR壓縮包中若帶圖紙,網頁內容里面會有圖紙預覽,若沒有圖紙預覽就沒有圖紙。
- 4. 未經權益所有人同意不得將文件中的內容挪作商業(yè)或盈利用途。
- 5. 人人文庫網僅提供信息存儲空間,僅對用戶上傳內容的表現方式做保護處理,對用戶上傳分享的文檔內容本身不做任何修改或編輯,并不能對任何下載內容負責。
- 6. 下載文件中如有侵權或不適當內容,請與我們聯(lián)系,我們立即糾正。
- 7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。
最新文檔
- 2025年度商鋪租賃與市場拓展服務協(xié)議4篇
- 科技驅動引領未來
- 專業(yè)建筑裝飾工程施工合作合同版B版
- 2025年度柴油銷售區(qū)域市場調研合作協(xié)議4篇
- 2025年度養(yǎng)老院場地租賃及養(yǎng)老服務合同8篇
- 2025年度茶葉電商平臺茶具批發(fā)銷售合同范本4篇
- 2025年度玩具產品電商銷售合作協(xié)議范本4篇
- 專業(yè)樁基砍除工程承包合同2024年
- 2025年度新型生物制藥研發(fā)合作合同范本4篇
- 2024纜車司機雇傭合同(滑雪場)
- 餐飲行業(yè)智慧餐廳管理系統(tǒng)方案
- 2025年度生物醫(yī)藥技術研發(fā)與許可協(xié)議3篇
- 電廠檢修安全培訓課件
- 殯葬改革課件
- 血壓計保養(yǎng)記錄表
- 食品的售后服務承諾書范本范文(通用3篇)
- 新外研版九年級上冊(初三)英語全冊教學課件PPT
- 初中中考英語總復習《代詞動詞連詞數詞》思維導圖
- 植物和五行關系解說
- 滬教牛津版初中英語七年級下冊全套單元測試題
- 因式分解法提公因式法公式法
評論
0/150
提交評論