版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進行舉報或認領(lǐng)
文檔簡介
抽樣調(diào)查基本原理第一節(jié)有關(guān)基本概念
一、總體總體也叫母體,它是所要認識對象的全體,是具有同一性質(zhì)的許多單位的集合。組成總體的每個個體叫做單位。在抽樣以前,必須根據(jù)實際情況把總體劃分成若干個互不重疊并且能組合成總體的部分,每個部分稱為一個抽樣單元,不論總體是否有限,總體中的抽樣單元數(shù)一定是有限的,而且是已知的,因此說抽樣調(diào)查的總體總是有限的。總體應(yīng)具備同質(zhì)性、大量性和差異性的特征。在抽樣調(diào)查中,通常將反映總體數(shù)量特征的綜合指標稱為總體參數(shù)。常見的總體參數(shù)主要有:總體總和Y總體均值總體比率R總體比例P
二、樣本樣本是由從總體中所抽選出來的若干個抽樣單元組成的集合體。抽樣前,樣本是一個n維隨機變量,屬樣本空間;抽樣后,樣本是一個n元數(shù)組,是樣本空間的一個點。影響樣本代表性的因素有以下幾個方面:(1)總體標志值分布的離散程度。
(2)抽樣單元數(shù)的多少(或稱樣本容量的大小)。(3)抽樣方法。一般將反映樣本數(shù)量特征的綜合指標稱之為統(tǒng)計量。統(tǒng)計量是n元樣本的一個實值函數(shù),是一個隨機變量,統(tǒng)計量的一個具體取值即為統(tǒng)計值。主要的樣本統(tǒng)計量有:樣本總和y樣本均值樣本比率r樣本比例p
三、必要樣本容量和樣本可能數(shù)目樣本中包含的抽樣單元個數(shù)稱為樣本容量,又稱樣本含量或樣本大小。樣本可能數(shù)目則是在容量為N的總體中抽取容量為n的樣本時,所有可能被抽中的不同樣本的個數(shù)。用A表示。當N和n一定時,A的多少與抽樣方法有關(guān),其計算方法列表如下:抽樣方法放回抽樣不放回抽樣考慮順序不考慮順序四、抽樣框抽樣框是在抽樣前,為便于抽樣工作的組織,在可能條件下編制的用來進行抽樣的、記錄或表明總體所有抽樣單元的框架,在抽樣框中,每個抽樣單元都被編上號碼。編制抽樣框是一個實際的、重要的問題,因此必須要認真對待。抽樣框可以是一份清單(名單抽樣框)、一張地圖(區(qū)域抽樣框)。常見的抽樣框問題可以概括為四種基本類型:(1)缺失一些元素,即抽樣框涵蓋不完全;(2)多個元素對應(yīng)一個號碼;(3)空白(一些號碼沒有與之對應(yīng)的元素)或存在異類元素;(4)重復(fù)號碼,即一個元素對應(yīng)多個號碼。返回第二節(jié)樣本統(tǒng)計量的抽樣分布一、正態(tài)分布如果總體各個體的標志值以總體平均數(shù)為中心,形成鐘型對稱分布,其分布曲線向兩側(cè)擴展,逐漸向橫軸逼近,無限延伸出去,但不接觸橫軸,則這種分布就叫做正態(tài)分布,或高斯分布、常態(tài)分布。服從正態(tài)分布的總體稱為正態(tài)總體。如果一個隨機變量X服從正態(tài)分布,則其分布的密度函數(shù)(分布曲線方程)為:
當μ=0,σ2=1時,稱該分布為標準正態(tài)分布。標準正態(tài)分布的密度函數(shù)為,
任何正態(tài)分布,它的樣本落在任意區(qū)間(a,b)內(nèi)的概率等于直線x=a,x=b,橫坐標和曲線f(x)所夾的面積(可由正態(tài)分布概率積分表查得)。經(jīng)計算,正態(tài)總體的樣本落在:
(-σ,+σ)概率是68.27%;
(-2σ,+2σ)概率是95.45%;
(-3σ,+3σ)概率是99.73%;
(-1.96σ,+1.96σ)概率是95%;二、抽樣分布抽樣分布是根據(jù)所有可能樣本計算出來的某一統(tǒng)計量的數(shù)值分布。抽樣分布有極限分布和精確分布兩類。極限分布也叫做大樣本分布,它只有正態(tài)分布一種形式;精確分布又叫做小樣本分布,其前提是總體服從正態(tài)分布,它是正態(tài)分布的導(dǎo)出分布,包括有t分布、F分布和分布等形式。χ2
一般地,可以證明如果總體服從正態(tài)分布,且總體均值和方差均為已知,即
Y~N(μ,σ2)則不論樣本量大小如何,樣本均值均圍繞總體均值而服從正態(tài)分布,并且其抽樣分布的方差等于總體方差的n分之一,即~N(μ,σ2/n)
而對于非正態(tài)總體,若均值μ和σ2有限,則根據(jù)中心極限定理,當樣本量n充分大時,樣本均值仍然圍繞著總體均值而近似地服從正態(tài)分布,即~N(μ,σ2/n)
(一)樣本統(tǒng)計量的極限分布
例:總體N=5,Y={40,50,60,70,80},則其次數(shù)分布圖為若取n=2,用放回抽樣,
可抽25個簡單隨機樣本,整理后,即可得出關(guān)于樣本均值的次數(shù)分布情況為:
404550556065707580f123454321用圖形表示,則為:如果總體容量較大,則當樣本容量逐步擴大時,樣本平均數(shù)的分布趨于正態(tài)分布的趨勢更加明顯。(二)樣本統(tǒng)計量的精確分布1、χ2分布設(shè)隨機變量Yi~N(0,1)(i=1,2,…,n),且相互獨立,則Y=∑Y2i服從自由度為n的χ2分布,記作Y~χ2(n)。χ2分布的概率密度函數(shù)為主要性質(zhì)有:①f(y)恒為正;②χ2分布呈右偏形態(tài);③χ2分布隨n的不斷增大而逐漸趨于正態(tài)分布。
χ2分布χ2(n)的數(shù)學(xué)期望和方差分別為EY=n,DY=2n.2、t分布若X~N(0,1),Y~χ2(n),且X與Y相互獨立,則稱隨機變量服從自由度為n的t分布,記作:T~t(n)。
推論:若X~N(μ,σ2),σ2未知,則
服從自由度為n-1的t分布,記作:T~t(n-1)
t分布t(n)的概率密度函數(shù)為
t分布具有如下性質(zhì):①t分布對稱于縱軸,與N(0,1)相似;②在n<30(小樣本)時,t分布的方差大于N(0,1)的方差;③在n≥30(大樣本)時,t分布隨n的增大而趨于N(0,1)。
t分布t(n)的數(shù)學(xué)期望與方差分別為ET=0,DT=n/(n-2).(n>2)
若X~χ2(n1),Y~χ2(n2),且X與Y相互獨立,則稱隨機變量
3、F分布服從第一自由度為n1,第二自由度為n2的F分布,記作:F~F(n1,n2)。其概率密度函數(shù)為F分布的主要性質(zhì)有:①F分布呈右偏態(tài);②f(x)恒為正;③在
④隨n1,n2的不斷增大,F(xiàn)分布的右偏程度逐漸減弱,但不會趨向正態(tài);⑤具有倒數(shù)性質(zhì),即若X~F(n1,n2),則1/X~F(n1,n2);⑥若t~t(n),則t2(n)~F(1,n)。
處取最大值(n1>2,f0<1);其數(shù)學(xué)期望和方差分別為返回第三節(jié)抽樣誤差一、抽樣調(diào)查中的誤差來源誤差就是調(diào)查結(jié)果與現(xiàn)象的實際結(jié)果之間的偏差,它幾乎在所有的統(tǒng)計調(diào)查中都或大或小的存在著。在抽樣調(diào)查中,按照形成原因的不同,一般可將誤差分成抽樣誤差和非抽樣誤差兩大類。抽樣誤差是用樣本統(tǒng)計量推斷總體參數(shù)時的誤差,它屬于一種代表性誤差。
在抽樣調(diào)查中抽樣誤差是不可避免的。但同非抽樣誤差不同的是,抽樣誤差可以計算,并且可以被控制在任意小的范圍內(nèi)。
影響抽樣誤差的因素
1.抽樣誤差通常會隨樣本量的大小而增減。
2.所研究現(xiàn)象總體變異程度的大小。
3.抽樣的方式方法。
非抽樣誤差不是由于抽樣引起的。它又包括:調(diào)查誤差;無回答誤差;抽樣框誤差;登記性誤差。同抽樣誤差相反,非抽樣誤差是隨著樣本量的增加而增大的。由于抽樣調(diào)查的訪問和資料整理都比普查更便于進行,因此非抽樣誤差也遠遠小于普查。有時,普查中的非抽樣誤差甚至大于抽樣調(diào)查中抽樣誤差與非抽樣誤差的總和。二、抽樣誤差的計算抽樣誤差的計算,是建立在誤差分布理論基礎(chǔ)上,從統(tǒng)計平均意義角度來考慮的。
抽樣誤差用所有可能的實際誤差的均方誤差表示
MSE()=E(-θ)2=E[
-E(
)]2+[E()-θ]2
式中第一項是估計量的方差,記作V()。
式中第二項是估計量的偏倚B()的平方。
無偏估計時,的方差就等于它的均方誤差。
說明:①上面所給出的估計量方差公式實際中當σ2未知時,一般用樣本方差s2代替以對②有偏的估計并非都是不可用的,有時有偏估計量在某些方面反而比無偏估計量更好。有研究認為,在實踐中當偏倚小于標準誤的十分之一時,偏倚對估計量準確度的影響可以忽略不計。仍然屬于一個理論公式,是依據(jù)調(diào)查變量的總體方差σ2進行計算的,估計量的方差做出估計。返回第四節(jié)抽樣估計一、抽樣估計的特點第一,抽樣估計在邏輯上運用的是歸納推理而不是演繹推理。第二,抽樣估計在方法上運用不確定的概率估計法而不是運用確定的數(shù)學(xué)分析法。第三,抽樣估計的結(jié)論存在著一定程度的抽樣誤差。二、抽樣估計的方法抽樣估計的方法多種多樣。如果以估計中所依據(jù)的資料不同來區(qū)分,一般可以有簡單估計、比估計和回歸估計等三種方法。簡單估計是單純依靠樣本調(diào)查變量的資料估計總體參數(shù),其估計結(jié)果稱為簡單估計量;比估計和回歸估計是同時依據(jù)樣本調(diào)查變量以及已知的有關(guān)輔助變量的資料來對總體參數(shù)做出估計,其結(jié)果分別稱為比估計量和回歸估計量。如果以估計結(jié)果的表示方式來區(qū)分,則抽樣估計可以有兩種形式,即定值估計和區(qū)間估計。三、置信區(qū)間一般地說,若估計量是無偏的,且呈正態(tài)分布,則參數(shù)θ的置信度當調(diào)查變量的總
溫馨提示
- 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
- 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
- 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
- 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負責(zé)。
- 6. 下載文件中如有侵權(quán)或不適當內(nèi)容,請與我們聯(lián)系,我們立即糾正。
- 7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔(dān)用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。
最新文檔
- GB/T 31126.2-2024紡織品全氟及多氟化合物的測定第2部分:氣相色譜-質(zhì)譜法
- 濰坊科技學(xué)院《平面設(shè)計競賽》2023-2024學(xué)年第一學(xué)期期末試卷
- 2025作為實施《勞動合同法》的重要舉措,昨日,全新的全日制勞動合同書
- 農(nóng)場煙葉訂購合同范例
- 工商注冊租房合同范例
- 中冶集團合同范例
- 2025安全責(zé)任協(xié)議合同
- 婚紗租賃贈送合同范例
- 家具釆購合同范例
- 拍攝設(shè)備使用合同范例
- 電梯曳引系統(tǒng)設(shè)計-畢業(yè)設(shè)計
- 瑪帕導(dǎo)條刀具課件
- 班會課件 勿以惡小而為之勿以善小而不為
- 中醫(yī)針灸治療中風(fēng)后語言障礙病例分析專題報告
- 醫(yī)院消毒供應(yīng)中心清洗、消毒、滅菌質(zhì)控評分表
- 2022年學(xué)校寒假德育特色作業(yè)實踐方案(詳細版)
- 可愛卡通插畫風(fēng)讀書分享通用PPT模板
- 小學(xué)數(shù)學(xué)西南師大四年級上冊五相交與平行《相交》課堂設(shè)計
- 光伏發(fā)電項目試驗計劃
- 圖書館工作流程(新)
- 1:青巖古鎮(zhèn)發(fā)展及規(guī)劃
評論
0/150
提交評論