




版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進行舉報或認領(lǐng)
文檔簡介
第2章數(shù)據(jù)的搜集PowerPoint統(tǒng)計學(xué)第2章統(tǒng)計數(shù)據(jù)的搜集2.1統(tǒng)計數(shù)據(jù)的來源2.2調(diào)查方案設(shè)計2.3調(diào)查問卷設(shè)計2.4抽樣調(diào)查2.5實驗數(shù)據(jù)2.6數(shù)據(jù)的誤差學(xué)習(xí)目標了解統(tǒng)計數(shù)據(jù)的來源了解數(shù)據(jù)的搜集方法掌握調(diào)查方案的設(shè)計內(nèi)容與要求掌握調(diào)查問卷及其設(shè)計技巧了解抽樣調(diào)查方法了解收集數(shù)據(jù)的實驗方法了解數(shù)據(jù)誤差及對數(shù)據(jù)的質(zhì)量要求概率抽樣和非概率抽樣抽樣方法概率抽樣
(probabilitysampling)也稱隨機抽樣特點按一定的概率以隨機原則抽取樣本抽取樣本時使每個單位都有一定的機會被抽中每個單位被抽中的概率是已知的,或是可以計算出來的當用樣本對總體目標量進行估計時,要考慮到每個樣本單位被抽中的概率分層抽樣
(stratifiedsampling)將抽樣單位按某種特征或某種規(guī)則劃分為不同的層,然后從不同的層中獨立、隨機地抽取樣本優(yōu)點保證樣本的結(jié)構(gòu)與總體的結(jié)構(gòu)比較相近,從而提高估計的精度組織實施調(diào)查方便既可以對總體參數(shù)進行估計,也可以對各層的目標量進行估計分層抽樣
StratifiedSample先按某種特征將總體分為互斥(MutuallyExclusive)且完備(CollectivelyExhaustive)的組群然后按照總體特征的比例對每一組群進行簡單隨機抽樣,從而使樣本具有同總體相似的特征結(jié)構(gòu)可提高抽樣調(diào)查有效性分層抽樣
StratifiedSample例如:對學(xué)生調(diào)查1.把學(xué)生總體分為組群互斥且完備根據(jù)某種共同特點2.在每一組中作簡單隨機抽樣。樣本中走讀生與住宿生的比例與學(xué)校學(xué)生總體相同所有學(xué)生走讀生住宿生樣本整群抽樣
ClusterSample先對總體聚類然后用簡單隨機抽樣選類最后對選中的類作普查或簡單隨機抽樣調(diào)查抽樣較為有效整群抽樣
ClusterSample例如:對制造業(yè)集團公司經(jīng)理的調(diào)查1.聚類:工廠是類而經(jīng)理是元素2.隨機選廠3.對選定的廠中的經(jīng)理作普查或簡單隨機抽樣工廠(聚類)樣本分層抽樣和整群抽樣的相同之處都是先對總體中的群體再對個體進行操作都不是完全隨機地抽取樣本,都涉及一定的規(guī)則:分層隨機抽樣涉及的規(guī)則是分層群體之間屬性的差異,而整群隨機抽樣涉及的規(guī)則是子群體之間的相似都能提高隨機抽樣的效率和改善隨機抽樣的結(jié)果系統(tǒng)抽樣
(systematicsampling)將總體中的所有單位(抽樣單位)按一定順序排列,在規(guī)定的范圍內(nèi)隨機地抽取一個單位作為初始單位,然后按事先規(guī)定好的規(guī)則確定其它樣本單位先從數(shù)字1到k之間隨機抽取一個數(shù)字r作為初始單位,以后依次取r+k,r+2k…等單位優(yōu)點:操作簡便,可提高估計的精度缺點:對估計量方差的估計比較困難系統(tǒng)(等距)抽樣
SystematicSample例如k=20,假定隨機選取的起點為2,先將總體排序。然后從總體中選取樣點的序號為第2,第22,第42,…,依此類推可得到抽樣樣本。等距抽樣的優(yōu)點等距離抽樣與簡單隨機抽樣比較,可使中選單位比較均勻的分布在全及總體中,尤其當被研究現(xiàn)象的標志值的變異程度較大,而在實際工作中又不可能抽選更多的樣本單位時,這種方法更為有效。多階段抽樣
(multi-stagesampling)先抽取群,但并不是調(diào)查群內(nèi)的所有單位,而是再進行一步抽樣,從選中的群中抽取出若干個單位進行調(diào)查群是初級抽樣單位,第二階段抽取的是最終抽樣單位。將該方法推廣,使抽樣的段數(shù)增多,就稱為多階段抽樣具有整群抽樣的優(yōu)點,保證樣本相對集中,節(jié)約調(diào)查費用需要包含所有低階段抽樣單位的抽樣框;同時由于實行了再抽樣,使調(diào)查單位在更廣泛的范圍內(nèi)展開在大規(guī)模的抽樣調(diào)查中,經(jīng)常被采用的方法
電視觀眾抽樣方案非概率抽樣
(non-probabilitysampling)相對于概率抽樣而言抽取樣本時不是依據(jù)隨機原則,而是根據(jù)研究目的對數(shù)據(jù)的要求,采用某種方式從總體中抽出部分單位對其實施調(diào)查有方便抽樣、判斷抽樣、自愿樣本、滾雪球抽樣、配額抽樣等方式方便抽樣調(diào)查過程中由調(diào)查員依據(jù)方便的原則,自行確定入抽樣本的單位調(diào)查員在街頭、公園、商店等公共場所進行攔截調(diào)查廠家在出售產(chǎn)品柜臺前對路過顧客進行的調(diào)查優(yōu)點:容易實施,調(diào)查的成本低缺點:樣本單位的確定帶有隨意性,樣本無法代表有明確定義的總體,調(diào)查結(jié)果不宜推斷總體自愿樣本被調(diào)查者自愿參加,成為樣本中的一分子,向調(diào)查人員提供有關(guān)信息例如,參與報刊上和互聯(lián)網(wǎng)上刊登的調(diào)查問卷活動,向某類節(jié)目撥打熱線電話等,都屬于自愿樣本自愿樣本與抽樣的隨機性無關(guān)樣本是有偏的不能依據(jù)樣本的信息推斷總體滾雪球抽樣先選擇一組調(diào)查單位,對其實施調(diào)查之后,再請他們提供另外一些屬于研究總體的調(diào)查對象,調(diào)查人員根據(jù)所提供的線索,進行此后的調(diào)查。這個過程持續(xù)下去,就會形成滾雪球效應(yīng)適合于對稀少群體和特定群體研究優(yōu)點:容易找到那些屬于特定群體的被調(diào)查者,調(diào)查的成本也比較低§2.5實驗數(shù)據(jù)實驗組和對照組實驗中的若干問題實驗中的統(tǒng)計實驗法案例實驗組和對照組將研究對象分為兩組:實驗組和對照組實驗組和隨機組的產(chǎn)生應(yīng)遵循隨機原則,而且應(yīng)該匹配匹配指對實驗單位的背景材料進行分析比較,將情況類似的每對單位分別隨機地分配到實驗組和對照組實驗中的若干問題人的意愿研究的對象是人的時候,在劃分實驗組和對照組時的隨機原則將面臨挑戰(zhàn)心理問題人們對被研究非常敏感,這使得他們更加注意自我,從而走到事物的另一個極端
道德問題當某種實驗涉及道德問題時,人們會處于進退兩難的尷尬境地
實驗中的統(tǒng)計實驗設(shè)計本身就是一個統(tǒng)計問題確定進行實驗所需要的單位的個數(shù),以保證實驗可以達到統(tǒng)計顯著的結(jié)果將統(tǒng)計的思想融入到實驗設(shè)計中,使實驗設(shè)計符合統(tǒng)計分析的標準對實驗數(shù)據(jù)進行分析時,統(tǒng)計可以提供最恰當?shù)姆治龇椒ā?.6數(shù)據(jù)的誤差抽樣誤差非抽樣誤差誤差的控制數(shù)據(jù)的誤差抽樣誤差
(samplingerror)由于抽樣的隨機性所帶來的誤差所有樣本可能的結(jié)果與總體真值之間的平均性差異影響抽樣誤差的大小的因素樣本量的大小總體的變異性非抽樣誤差
(non-samplingerror)相對抽樣誤差而言除抽樣誤差之外的,由于其他原因造成的樣本觀察結(jié)果與總體真值之間的差異存在于所有的調(diào)查之中概率抽樣,非概率抽樣,全面性調(diào)查有抽樣框誤差、回答誤差、無回答誤差、調(diào)查員誤差、測量誤差數(shù)據(jù)誤差示意總體(全體學(xué)生)樣本框架(電話簿中學(xué)生名單)抽樣樣本(抽樣選定的學(xué)生)實際樣本覆蓋面誤差抽樣誤差不回答和度量誤差數(shù)據(jù)的誤差抽樣誤差SamplingError樣本之間差異較大時,因為不能普查而導(dǎo)致的誤差可以通過擴大樣本容量來控制覆蓋面與選擇誤差CoverageError將某些特定組從總體中排除會產(chǎn)生誤差注意自愿填寫報刊問卷或自愿電話回復(fù)所產(chǎn)生的偏差(Write-in,Call-inbias)數(shù)據(jù)的誤差
實例分析: 1936年LiteracyDigest雜志的民意調(diào)查盡管樣本容量很大(240萬),但是樣本選擇的偏差仍導(dǎo)致預(yù)測得票(AlfLandon57%)與事實(38%)有嚴重的出入。該雜志的可信度大大降低,最終走向了破產(chǎn)。其教訓(xùn)主要是:僅以俱樂部成員地址簿、電話號碼簿、雜志訂戶以及汽車注冊人為抽樣調(diào)查的基礎(chǔ)在大蕭條期間造成了嚴重的樣本覆蓋面與選擇誤差。不回答誤差NonresponseError與中產(chǎn)階級相比,經(jīng)濟地位處于下層和上層的人群對調(diào)查的反饋率比較低。(郵寄問卷調(diào)查產(chǎn)生的回答率一般都比較低)1936年LiteracyDigest雜志的民意調(diào)查回答率僅為24%。度量誤差MeasurementError問卷中問題的表述不準確,或調(diào)查過程中調(diào)查者和被訪者的原因都會造成誤差。數(shù)據(jù)的誤差統(tǒng)計數(shù)據(jù)的質(zhì)量要求1.精度:最低的抽樣誤差或隨機誤差2.準確性:最小的非抽樣誤差或偏差3.關(guān)聯(lián)性:滿足用戶決策、管理和研究的需要4.及時性:
溫馨提示
- 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
- 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
- 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
- 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負責。
- 6. 下載文件中如有侵權(quán)或不適當內(nèi)容,請與我們聯(lián)系,我們立即糾正。
- 7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。
最新文檔
- 2025小型工程建筑合同(監(jiān)控)
- 2025租房合同原件丟失怎么辦
- 2025電競科技有限公司股權(quán)轉(zhuǎn)讓合同示例
- 趣味學(xué)習(xí)激發(fā)幼兒探索欲計劃
- 2025年紡織品交易合同模板
- 農(nóng)村橋梁建設(shè)合同標準文本
- 長形菜地規(guī)劃方案范本
- 急救培訓(xùn)中心急救知識普及工作計劃
- 義齒業(yè)務(wù)合同樣本
- 企業(yè)資產(chǎn)收購合同標準文本
- 巴金名著導(dǎo)讀《寒夜》
- 2024年建筑業(yè)10項新技術(shù)
- 《環(huán)境建設(shè)工程概算、預(yù)算編制辦法》
- 提升服務(wù)行業(yè)人員的職業(yè)道德和職業(yè)素養(yǎng)
- 按摩椅行業(yè)分析及市場前景展望報告
- 2024年上海外服招聘筆試參考題庫附帶答案詳解
- 改善患者就醫(yī)體驗培訓(xùn)課件
- 養(yǎng)殖烏龜入門知識培訓(xùn)課件
- 關(guān)于設(shè)備性能評估報告
- 【二維動畫短片發(fā)展現(xiàn)狀、創(chuàng)作過程及發(fā)展前景14000字(論文)】
- 接觸網(wǎng)工高溫施工詳細防護措施培訓(xùn)
評論
0/150
提交評論