抽樣與抽樣估計_第1頁
抽樣與抽樣估計_第2頁
抽樣與抽樣估計_第3頁
抽樣與抽樣估計_第4頁
抽樣與抽樣估計_第5頁
已閱讀5頁,還剩127頁未讀, 繼續(xù)免費閱讀

下載本文檔

版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進行舉報或認(rèn)領(lǐng)

文檔簡介

關(guān)于抽樣與抽樣估計第1頁,共132頁,2022年,5月20日,22點44分,星期四基本內(nèi)容1、抽樣估計的基本問題2、樣本統(tǒng)計量的分布3、參數(shù)估計的方法4、其它抽樣組織形式下的參數(shù)估計5、統(tǒng)計軟件Excel、SAS、SPSS在抽樣與參數(shù)估計中的應(yīng)用第2頁,共132頁,2022年,5月20日,22點44分,星期四學(xué)習(xí)目標(biāo)1.了解抽樣和抽樣分布的基本概念2.了解點估計的概念和估計量的優(yōu)良標(biāo)準(zhǔn)3.掌握總體均值、總體比例和總體方差的區(qū)間估計4.掌握樣本容量的確定原則和方法5.掌握運用統(tǒng)計軟件Excel、SAS、SPSS進行抽樣與參數(shù)估計方法第3頁,共132頁,2022年,5月20日,22點44分,星期四第一節(jié)抽樣估計的基本問題第4頁,共132頁,2022年,5月20日,22點44分,星期四一、抽樣估計的過程樣本總體樣本統(tǒng)計量如:樣本均值、比例、方差總體均值、比例、方差等第5頁,共132頁,2022年,5月20日,22點44分,星期四二、抽樣估計中幾個基本概念第6頁,共132頁,2022年,5月20日,22點44分,星期四(一)總體與個體1.總體(Population):調(diào)查研究的事物或現(xiàn)象的全體2.個體(Itemunit):組成總體的每個元素3.總體單位數(shù):總體中包含個體的數(shù)量,記為N4.總體的特性:當(dāng)研究目的一定時,總體具有唯一確定性第7頁,共132頁,2022年,5月20日,22點44分,星期四(二)樣本(Sample)1.樣本(Sample):從總體中所抽取的部分個體構(gòu)成的整體2.樣本容量(Samplesize):樣本中所包含個體的數(shù)量,記為n,當(dāng)

n≧30,稱為大樣本

n<30,稱為小樣本3.樣本單位選取的原則:隨機性原則4.樣本的特性:當(dāng)樣本單位數(shù)(n)一定的情況下,從總體中可以抽到很多個可能的樣本,也即樣本不是唯一確定的。第8頁,共132頁,2022年,5月20日,22點44分,星期四總體參數(shù)樣本統(tǒng)計量及其計算公式總體平均數(shù)樣本平均數(shù)總體比例P樣本比例p=n1

/n總體方差樣本方差總體標(biāo)準(zhǔn)差樣本標(biāo)準(zhǔn)差(三)參數(shù)與統(tǒng)計量第9頁,共132頁,2022年,5月20日,22點44分,星期四(四)抽樣框1、抽樣框:包括全部抽樣單位的名單框架。2、編制抽樣框的意義:它是有效實施抽樣的基礎(chǔ),直接影響到抽樣的隨機性和抽樣效果。3、抽樣框的主要形式:(1)名單抽樣框(2)區(qū)域抽樣框(3)時間表抽樣框

4、抽樣框的要求:一個理想的抽樣框應(yīng)該與目標(biāo)總體一致,即應(yīng)包括全部總體單位,既不重復(fù)也不遺漏。第10頁,共132頁,2022年,5月20日,22點44分,星期四(五)抽樣誤差

1、誤差及其構(gòu)成

在抽樣調(diào)查中,調(diào)查資料與實際情況不一致,兩者的偏離稱為誤差。第11頁,共132頁,2022年,5月20日,22點44分,星期四2、抽樣誤差的概念及種類(1)抽樣誤差是指在沒有登記誤差和系統(tǒng)性誤差的情況下,單純由于抽樣的隨機性而產(chǎn)生的誤差。(2)實際應(yīng)用中,關(guān)于抽樣誤差,有三個密切聯(lián)系而又有區(qū)別概念,即個別抽樣誤差、平均抽樣誤差、抽樣極限誤差。

①個別抽樣誤差:個別抽樣誤差是指某一具體樣本的估計值與總體參數(shù)的真實值之間的離差。實際抽樣調(diào)查中,由于總體參數(shù)是未知的,因此,每次抽樣的個別抽樣誤差是無法計算的。抽樣調(diào)查中,所謂抽樣誤差可以計算和控制,并不是指個別抽樣誤差,而是指抽樣平均誤差和抽樣極限誤差。

第12頁,共132頁,2022年,5月20日,22點44分,星期四②抽樣平均誤差

抽樣平均誤差是由于抽樣的隨機性而產(chǎn)生的所有可能樣本指標(biāo)與總體指標(biāo)之間的平均離差,也即所有可能樣本指標(biāo)的標(biāo)準(zhǔn)差。它。記為和,其定義公式為:樣本個數(shù)第13頁,共132頁,2022年,5月20日,22點44分,星期四③抽樣極限誤差

抽樣極限誤差是指一定概率下抽樣誤差的可能范圍,也稱為允許誤差。用△表示抽樣極限誤差,則這一概念可以表述為如下不等式:第14頁,共132頁,2022年,5月20日,22點44分,星期四三、抽樣方法第15頁,共132頁,2022年,5月20日,22點44分,星期四(一)重復(fù)抽樣

重復(fù)抽樣,也叫回置抽樣,是指從總體的N個單位中抽取一個容量為n的樣本,每次抽出一個單位后,再將其放回總體中參加下一次抽取,這樣連續(xù)抽n次即得到一個樣本。同一總體單位有可能被重復(fù)抽中;每次都是從N個總體單位中抽取;n次抽取就是n次相互獨立的隨機試驗。第16頁,共132頁,2022年,5月20日,22點44分,星期四(二)不重復(fù)抽樣

不重復(fù)抽樣,也叫不回置抽樣,是指抽中單位不再放回總體中,下一個樣本單位只能從余下的總體單位中抽取。同一總體單位不可能被重復(fù)抽中.

每次抽取是在不同數(shù)目的總體單位中進行的n次抽取可看作是n次互不獨立的隨機試驗。誤差小于重復(fù)抽樣第17頁,共132頁,2022年,5月20日,22點44分,星期四四、抽樣的組織形式第18頁,共132頁,2022年,5月20日,22點44分,星期四簡單隨機抽樣分層抽樣整群抽樣等距抽樣二階抽樣與多階段抽樣概率抽樣方便抽樣判斷抽樣配額抽樣非概率抽樣抽樣方式第19頁,共132頁,2022年,5月20日,22點44分,星期四(一)概率抽樣的組織形式按隨機原則選取樣本單位,樣本的代表性強。主要形式有:

1、簡單隨機抽樣(純隨機抽樣)

2、分層抽樣(類型抽樣)

3、等距抽樣(機械抽樣)

4、整群抽樣(成批抽樣)第20頁,共132頁,2022年,5月20日,22點44分,星期四1、任意抽樣法(便利抽樣)——從調(diào)查者方便出發(fā)所選取樣本單位。簡便易行,節(jié)省時間和費用,但調(diào)查所得樣本的代表性小。適用于非正式的探測性調(diào)查,或調(diào)查前的準(zhǔn)備工作。2、判斷抽樣法

——是由調(diào)查人員根據(jù)經(jīng)驗判斷選定樣本的一種非隨機抽樣技術(shù)。一般采用“平均型”或“多數(shù)型”選樣標(biāo)準(zhǔn)。在市場調(diào)查中,常用的典型調(diào)查、重點調(diào)查均屬于判斷抽樣法的具體運用。3、配額抽樣法——按照一定的標(biāo)準(zhǔn),分配樣本數(shù)額,然后在規(guī)定數(shù)額內(nèi)由調(diào)查人員任意抽選樣本單位的一種非隨機抽樣技術(shù)。具體可分為:獨立控制配額抽樣和交叉控制的配額抽樣。

(二)非隨機抽樣法

第21頁,共132頁,2022年,5月20日,22點44分,星期四獨立控制配額抽樣收入階層高:30中:44低:72合計:146年齡人數(shù)20-2930-4445-6465以上30523420合計146性別男:73女:73合計:146第22頁,共132頁,2022年,5月20日,22點44分,星期四交叉控制的配額抽樣

收入階層總計高中低性別男女男女男女年齡20-2930-4445-6465以上4632268533101295540523420合計151522223636146第23頁,共132頁,2022年,5月20日,22點44分,星期四五、抽樣方案的設(shè)計第24頁,共132頁,2022年,5月20日,22點44分,星期四

(一)抽樣方案及其設(shè)計的基本準(zhǔn)則

抽樣方案是對整個抽樣工作過程的全面安排和工作計劃??茖W(xué)可行的抽樣方案是整個抽樣推斷工作得以順利完成的保證。設(shè)計抽樣方案應(yīng)遵循以下原則:1、隨機性原則2、抽樣誤差最小3、費用最少第25頁,共132頁,2022年,5月20日,22點44分,星期四

(二)抽樣方案設(shè)計的主要內(nèi)容除了一般調(diào)查方案的內(nèi)容外,主要還包括:編制抽樣框確定抽樣方法確定抽樣組織方式確定樣本容量

第26頁,共132頁,2022年,5月20日,22點44分,星期四第二節(jié)抽樣分布第27頁,共132頁,2022年,5月20日,22點44分,星期四一、抽樣分布概述第28頁,共132頁,2022年,5月20日,22點44分,星期四(一)抽樣分布的概念

(samplingdistribution)1、抽樣分布:樣本統(tǒng)計量的概率分布,是一種理論分布。例如,樣本平均數(shù)抽樣分布,樣本方差、標(biāo)準(zhǔn)差的抽樣分布,樣本比例的分布等。2、抽樣分布反映了樣本指標(biāo)的分布特征,是抽樣推斷的重要依據(jù)。根據(jù)抽樣分布的規(guī)律a、可揭示樣本指標(biāo)與總體指標(biāo)之間的關(guān)系;b、估計抽樣平均誤差;c、說明抽樣推斷的可靠度。3、樣本統(tǒng)計量分布的主要形式:正態(tài)分布、t分布、卡方分布、F分布等。

第29頁,共132頁,2022年,5月20日,22點44分,星期四(二)抽樣分布的形成過程

(samplingdistribution)總體計算樣本統(tǒng)計量如:樣本均值、比例、方差樣本第30頁,共132頁,2022年,5月20日,22點44分,星期四二、不同樣本統(tǒng)計量的抽樣分布第31頁,共132頁,2022年,5月20日,22點44分,星期四(一)樣本均值的抽樣分布?

在選取容量為n的樣本時,由樣本均值的所有可能取值形成的相對頻數(shù)分布,稱為樣本均值的抽樣分布。?樣本均值

的抽樣與原有總體的分布和樣本容量的大小有關(guān)。

第32頁,共132頁,2022年,5月20日,22點44分,星期四

=50

=10X總體分布n=4抽樣分布xn=16(1)設(shè)總體X~N(μ,σ2),按重復(fù)抽樣方法從總體中隨機抽取容量為n的樣本,則樣本均值x~N(μ,σ2/n);不重復(fù)抽樣時,1、總體方差已知,樣本均值的分布。用圖形表示如下:第33頁,共132頁,2022年,5月20日,22點44分,星期四總體方差已知,樣本均值的分布

當(dāng)樣本容量足夠大時(n

30),樣本均值的抽樣分布逐漸趨于正態(tài)分布(2)中心極限定理:設(shè)從均值為,方差為

2的一個任意總體中抽取容量為n的樣本,當(dāng)n充分大時,樣本均值近似服從正態(tài)分布,即

~N(μ,σ2/n)。一個任意分布的總體x第34頁,共132頁,2022年,5月20日,22點44分,星期四2、總體方差未知,樣本均值的抽樣分布

設(shè)總X~N(μ,σ2),是其中的一個簡單隨機樣本,樣本均值為,樣本標(biāo)準(zhǔn)差為S,則統(tǒng)計量:

第35頁,共132頁,2022年,5月20日,22點44分,星期四t分布

t分布是類似正態(tài)分布的一種對稱分布,它通常要比正態(tài)分布平坦和分散。一個特定的分布依賴于稱之為自由度的參數(shù)。隨著自由度的增大,分布也逐漸趨于正態(tài)分布xt

分布與標(biāo)準(zhǔn)正態(tài)分布的比較t分布標(biāo)準(zhǔn)正態(tài)分布t不同自由度的t分布標(biāo)準(zhǔn)正態(tài)分布t(df=13)t(df=5)z第36頁,共132頁,2022年,5月20日,22點44分,星期四樣本均值的抽樣分布

(例題分析)【例】設(shè)一個總體,含有4個元素(個體)

,即總體單位數(shù)N=4。4

個個體分別為x1=1,x2=2,x3=3,x4=4

。總體的均值、方差及分布如下總體分布14230.1.2.3均值和方差第37頁,共132頁,2022年,5月20日,22點44分,星期四樣本均值的抽樣分布

(例題分析)

現(xiàn)從總體中抽取n=2的簡單隨機樣本,在重復(fù)抽樣條件下,共有42=16個樣本。所有樣本的結(jié)果為3,43,33,23,132,42,32,22,124,44,34,24,141,441,33211,21,11第二個觀察值第一個觀察值所有可能的n=2的樣本(共16個)第38頁,共132頁,2022年,5月20日,22點44分,星期四樣本均值的抽樣分布

(例題分析)計算出各樣本的均值,如下表。并給出樣本均值的抽樣分布3.53.02.52.033.02.52.01.524.03.53.02.542.542.03211.51.01第二個觀察值第一個觀察值16個樣本的均值(x)x樣本均值的抽樣分布1.000.10.20.3P

(x)1.53.04.03.52.02.5第39頁,共132頁,2022年,5月20日,22點44分,星期四樣本均值的分布與總體分布的比較

(例題分析)=2.5σ2=1.25總體分布14230.1.2.3抽樣分布P(x)1.00.1.2.31.53.04.03.52.02.5x第40頁,共132頁,2022年,5月20日,22點44分,星期四樣本均值的抽樣分布

(例題分析)比較及結(jié)論:1.樣本均值的均值(數(shù)學(xué)期望)等于總體均值

2.樣本均值的方差等于總體方差的1/n第41頁,共132頁,2022年,5月20日,22點44分,星期四3、抽樣分布與總體分布的關(guān)系總體分布正態(tài)分布非正態(tài)分布大樣本小樣本正態(tài)分布正態(tài)分布非正態(tài)分布樣本分布第42頁,共132頁,2022年,5月20日,22點44分,星期四(二)樣本比例的抽樣分布第43頁,共132頁,2022年,5月20日,22點44分,星期四(1)總體(或樣本)中具有某種屬性的單位與全部單位總數(shù)之比不同性別的人與全部人數(shù)之比合格品(或不合格品)與全部產(chǎn)品總數(shù)之比(2)總體比例可表示為:(3)樣本比例可表示為:

1、比例

(proportion)第44頁,共132頁,2022年,5月20日,22點44分,星期四(1)在選取容量為n的樣本時,由樣本比例的所有可能取值形成的相對頻數(shù)分布,稱為樣本比例的抽樣分布。是一種理論概率分布(2)當(dāng)樣本容量很大時,樣本比例的抽樣分布可用正態(tài)分布近似(3)樣本比例的抽樣分布是推斷總體比例P的理論基礎(chǔ) 2、樣本比例的抽樣分布

(概念要點)第45頁,共132頁,2022年,5月20日,22點44分,星期四樣本比例的抽樣分布

當(dāng)從一個總體中抽取一個容量為n的樣本時,樣本中具有某種特征的單位數(shù)n1服從二項分布,即n1~B(n,p)且有:E(n1

)=npVar(n1

)=np(1-p)=npq

可以證明樣本比例也服從二項分布,即第46頁,共132頁,2022年,5月20日,22點44分,星期四樣本比例的抽樣分布

根據(jù)中心極限定理(CentralLimittheorem),當(dāng)二項分布趨近于正態(tài)分布,所以,在大樣本下,若np和n(1-p)皆大于5,樣本比例近似服從正態(tài)分布:不重復(fù)抽樣時為:第47頁,共132頁,2022年,5月20日,22點44分,星期四(三)樣本方差、標(biāo)準(zhǔn)差的抽樣分布第48頁,共132頁,2022年,5月20日,22點44分,星期四1、小樣本下樣本方差的抽樣分布

設(shè)總體為的正態(tài)分布,為來自總體的樣本,則有:證明:標(biāo)準(zhǔn)正態(tài)變量平方和的分布第49頁,共132頁,2022年,5月20日,22點44分,星期四2、大樣本下樣本方差的抽樣分布根據(jù)的性質(zhì),則在大樣本下:趨于的正態(tài)分布。第50頁,共132頁,2022年,5月20日,22點44分,星期四

大樣本條件下,樣本標(biāo)準(zhǔn)差S的分布近似于均值為,方差為的正態(tài)分布,即:

3、大樣本條件下樣本標(biāo)準(zhǔn)差的分布第51頁,共132頁,2022年,5月20日,22點44分,星期四三、抽樣平均誤差的計算第52頁,共132頁,2022年,5月20日,22點44分,星期四

根據(jù)抽樣平均誤差的概念和樣本均值的分布,可得樣本均值的抽樣平均誤差公式為:重復(fù)抽樣:不重復(fù)抽樣:(一)樣本均值抽樣平均誤差

的計算第53頁,共132頁,2022年,5月20日,22點44分,星期四

根據(jù)抽樣平均誤差的概念和樣本比例的分布,可得樣本比例的抽樣平均誤差公式為:重復(fù)抽樣:不重復(fù)抽樣:(二)樣本比例抽樣平均誤差的計算

第54頁,共132頁,2022年,5月20日,22點44分,星期四1、總體方差(或總體標(biāo)準(zhǔn)差σ)。其它條件不變的條件下,總體單位的差異程度大,抽樣平均誤差大。2、抽樣數(shù)目。其它條件不變的條件下,抽樣數(shù)目多,抽樣平均誤差小3、抽樣方法。相同條件下,重復(fù)抽樣的抽樣平均誤差比不重復(fù)抽樣的抽樣平均誤差大。4、抽樣組織方式。由于不同抽樣組織方式有不同的抽樣誤差,所以,在誤差要求相同的情況下,不同抽樣組織方式所必需的抽樣數(shù)目也不同。

(三)影響抽樣平均誤差的因素第55頁,共132頁,2022年,5月20日,22點44分,星期四第三節(jié)參數(shù)估計第56頁,共132頁,2022年,5月20日,22點44分,星期四一、參數(shù)估計概述第57頁,共132頁,2022年,5月20日,22點44分,星期四(一)統(tǒng)計估計及其類型統(tǒng)計估計:研究由樣本估計總體的未知分布或分布中的未知參數(shù)2.非參數(shù)估計:直接對總體未知分布的估計3.參數(shù)估計:總體分布類型已知,僅需對分布的未知參數(shù)進行的估計第58頁,共132頁,2022年,5月20日,22點44分,星期四估計量:用于估計總體參數(shù)的隨機變量如樣本均值,樣本比例、樣本方差等例如:樣本均值就是總體均值的一個估計量參數(shù)用表示,估計量用表示估計值:估計參數(shù)時計算出來的統(tǒng)計量的具體值如果樣本均值x

=80,則80就是的估計值(二)估計量與估計值

(estimator&estimatedvalue)第59頁,共132頁,2022年,5月20日,22點44分,星期四(三)參數(shù)估計的方法矩估計法最大似然法估計方法點估計區(qū)間估計第60頁,共132頁,2022年,5月20日,22點44分,星期四二、總體參數(shù)的點估計

(pointestimate)

第61頁,共132頁,2022年,5月20日,22點44分,星期四(一)概念要點

●點估計,也叫定值估計,就是直接以樣本統(tǒng)計量來估計總體參數(shù)θ。當(dāng)已知一個樣本的觀察值時便可得到總體參數(shù)的一個估計值。

●點估計的方法有矩估計法和極大似然估計法

點估計的優(yōu)點是簡單、具體明確。但由于樣本的隨機性,從一個樣本得到的估計值往往不會恰好等于總體參數(shù)的真值,在很大程度上有一定的誤差。而點估計本身無法說明抽樣誤差的大小,也無法說明估計結(jié)果的把握程度。第62頁,共132頁,2022年,5月20日,22點44分,星期四

1、均值:2、方差:3、比例:(m表示樣本中具有某種特征的單位數(shù))

(二)點估計的基本公式第63頁,共132頁,2022年,5月20日,22點44分,星期四(三)點估計的優(yōu)良標(biāo)準(zhǔn)無偏性有效性一致性評價點估計的標(biāo)準(zhǔn)第64頁,共132頁,2022年,5月20日,22點44分,星期四1、無偏性

(unbiasedness)P(

)BA無偏有偏設(shè)是未知參數(shù)的一個點估計量,若滿足

則稱

是的無偏估計量,否則稱為有偏估計量第65頁,共132頁,2022年,5月20日,22點44分,星期四2、有效性

(efficiency)有效性:對同一總體參數(shù)的兩個無偏點估計量,有更小標(biāo)準(zhǔn)差的估計量更有效

AB

的抽樣分布

的抽樣分布P(

)第66頁,共132頁,2022年,5月20日,22點44分,星期四3、一致性

(consistency)一致性:隨著樣本容量的增大,估計量的值越來越接近被估計的總體參數(shù)AB較小的樣本容量較大的樣本容量P(

)第67頁,共132頁,2022年,5月20日,22點44分,星期四三、總體參數(shù)的區(qū)間估計

(intervalestimate)第68頁,共132頁,2022年,5月20日,22點44分,星期四(一)概念要點

在點估計的基礎(chǔ)上,根據(jù)樣本統(tǒng)計量的分布,以一定的概率保證程度,給出總體參數(shù)估計的一個區(qū)間范圍,該區(qū)間由樣本統(tǒng)計量加減抽樣誤差而得到的。樣本統(tǒng)計量

(點估計)置信區(qū)間置信下限置信上限第69頁,共132頁,2022年,5月20日,22點44分,星期四總體參數(shù)落在估計區(qū)間內(nèi)的概率或把握程度,稱為置信水平,表示為(1-總體參數(shù)不在估計區(qū)間內(nèi)的概率,成為顯著性水平,表示為常用的置信水平值有99%,95%,90%相應(yīng)的

為0.01,0.05,0.10置信水平與顯著性水平

LevelofConfidence

第70頁,共132頁,2022年,5月20日,22點44分,星期四095%的樣本

1.961.9699%的樣本-2.58

2.5890%的樣本-1.651.65樣本統(tǒng)計量的標(biāo)準(zhǔn)化分布第71頁,共132頁,2022年,5月20日,22點44分,星期四置信區(qū)間及其影響因素

(confidenceinterval)1、一定概率條件下,總體參數(shù)所在的區(qū)間范圍,稱為參數(shù)估計的置信區(qū)間。2、影響區(qū)間寬度的因素:

■ 總體數(shù)據(jù)的離散程度,用來測度

■樣本容量,

■置信水平(1-),影響z的大小第72頁,共132頁,2022年,5月20日,22點44分,星期四總體參數(shù)的區(qū)間估計總體參數(shù)符號表示樣本統(tǒng)計量均值比例方差第73頁,共132頁,2022年,5月20日,22點44分,星期四(一)總體均值的區(qū)間估計第74頁,共132頁,2022年,5月20日,22點44分,星期四1、總體均值的區(qū)間估計

(正態(tài)總體且2已知或非正態(tài)總體、2未知、大樣本)(1) 假定條件總體服從正態(tài)分布,且方差(2)

已知如果不是正態(tài)分布,可由正態(tài)分布來近似(n

30)(2)使用正態(tài)分布統(tǒng)計量z(3)總體均值在1-置信水平下的置信區(qū)間為第75頁,共132頁,2022年,5月20日,22點44分,星期四總體均值的區(qū)間估計

(例題分析)【例1】保險公司從投保人中隨機抽取36人,計算得36人的平均年齡歲,已知投保人平均年齡近似服從正態(tài)分布,標(biāo)準(zhǔn)差為7.2歲,試求全體投保人平均年齡的置信水平為99%的置信區(qū)間

解:已知n=36,1-=99%,z/2=2.575。根據(jù)樣本數(shù)據(jù)計算得:總體均值在1-置信水平下的置信區(qū)間為故全體投保人平均年齡的置信水平為99%的置信區(qū)間為[36.41,52.59]第76頁,共132頁,2022年,5月20日,22點44分,星期四總體均值的區(qū)間估計

(例題分析)【例2】一家食品公司,每天大約生產(chǎn)袋裝食品若干,按規(guī)定每袋的重量應(yīng)為100g。為對產(chǎn)品質(zhì)量進行檢測,該企業(yè)質(zhì)檢部門采用抽樣技術(shù),每天抽取一定數(shù)量的食品,以分析每袋重量是否符合質(zhì)量要求?,F(xiàn)從某一天生產(chǎn)的一批食品8000袋中隨機抽取了25袋(不重復(fù)抽樣),測得它們的重量如下表所示,已知產(chǎn)品重量服從正態(tài)分布,且總體方差為100g。試估計該批產(chǎn)品平均重量的置信區(qū)間,置信水平為95%。

25袋食品的重量112.5101.0103.0102.0100.5102.6107.595.0108.8115.6100.0123.5102.0101.6102.2116.695.497.8108.6105.0136.8102.8101.598.493.3第77頁,共132頁,2022年,5月20日,22點44分,星期四總體均值的區(qū)間估計

(例題分析)解:已知X~N(,102),n=25,1-=95%,z/2=1.96。根據(jù)樣本數(shù)據(jù)計算得:

總體均值在1-置信水平下的置信區(qū)間為該食品平均重量的置信區(qū)間為101.4459g~109.2741g注:在不重復(fù)抽樣條件下,置信區(qū)間取第78頁,共132頁,2022年,5月20日,22點44分,星期四總體均值的區(qū)間估計

(例題分析)【例】一家保險公司收集到由36個投保個人組成的隨機樣本,得到每個投保人的年齡(周歲)數(shù)據(jù)如下表。試建立投保人年齡90%的置信區(qū)間36個投保人年齡的數(shù)據(jù)233539273644364246433133425345544724342839364440394938344850343945484532第79頁,共132頁,2022年,5月20日,22點44分,星期四總體均值的區(qū)間估計

(例題分析)解:已知n=36,1-=90%,z/2=1.645。根據(jù)樣本數(shù)據(jù)計算得:,

總體均值在1-置信水平下的置信區(qū)間為投保人平均年齡的置信區(qū)間為37.37歲~41.63歲第80頁,共132頁,2022年,5月20日,22點44分,星期四2、總體均值的區(qū)間估計

(正態(tài)總體、方差未知、小樣本)(1)假定條件總體服從正態(tài)分布,且方差(2)

未知小樣本(n<30)(2)使用t

分布統(tǒng)計量:(3)總體均值在1-置信水平下的置信區(qū)間為:第81頁,共132頁,2022年,5月20日,22點44分,星期四總體均值的區(qū)間估計

(例題分析)【例】已知某種燈泡的壽命服從正態(tài)分布,現(xiàn)從一批燈泡中隨機抽取16只,測得其使用壽命(小時)如下。建立該批燈泡平均使用壽命95%的置信區(qū)間16燈泡使用壽命的數(shù)據(jù)1510152014801500145014801510152014801490153015101460146014701470第82頁,共132頁,2022年,5月20日,22點44分,星期四總體均值的區(qū)間估計

(例題分析)解:已知X~N(,2),n=16,1-=95%,t/2=2.131

根據(jù)樣本數(shù)據(jù)計算得:,

總體均值在1-置信水平下的置信區(qū)間為該種燈泡平均使用壽命的置信區(qū)間為1476.8小時~1503.2小時第83頁,共132頁,2022年,5月20日,22點44分,星期四(二)總體比例的區(qū)間估計第84頁,共132頁,2022年,5月20日,22點44分,星期四總體比例的區(qū)間估計假定條件:大樣本條件下,樣本比例的抽樣分布可以由正態(tài)分布來近似使用正態(tài)分布統(tǒng)計量z3.總體比例在1-置信水平下的置信區(qū)間為第85頁,共132頁,2022年,5月20日,22點44分,星期四總體比例的區(qū)間估計

(例題分析)【例】某城市想要估計下崗職工中女性所占的比例,隨機地抽取了100名下崗職工,其中65人為女性職工。試以95%的置信水平估計該城市下崗職工中女性比例的置信區(qū)間解:已知n=100,p=65%,1-=95%,z/2=1.96該城市下崗職工中女性比例的置信區(qū)間為55.65%~74.35%第86頁,共132頁,2022年,5月20日,22點44分,星期四總體比例的區(qū)間估計

(例題分析)【例】某企業(yè)共有職工1000人,企業(yè)準(zhǔn)備實行一項改革,在職工中征求意見,采用不重復(fù)抽樣方法,隨機抽取200人作為樣本,調(diào)查結(jié)果顯示,由150人表示贊成這項改革,有50人表示反對。試以95%的置信水平確定贊成改革的人數(shù)比例的置信區(qū)間解:已知n=200,z/2=1.96,p=75%。根據(jù)樣本數(shù)據(jù)計算得總體均值在1-置信水平下的置信區(qū)間為95%的置信水平下估計贊成改革的人數(shù)比例的置信區(qū)間為69.63%~80.37%

第87頁,共132頁,2022年,5月20日,22點44分,星期四(三)總體方差的區(qū)間估計第88頁,共132頁,2022年,5月20日,22點44分,星期四總體方差的區(qū)間估計

(概念要點)1. 估計一個總體的方差或標(biāo)準(zhǔn)差2. 假設(shè)總體服從正態(tài)分布總體方差2

的點估計量為S2,且4.總體方差在1-置信水平下的置信區(qū)間為第89頁,共132頁,2022年,5月20日,22點44分,星期四總體方差的區(qū)間估計

(圖示)221-2總體方差1-的置信區(qū)間自由度為n-1的2第90頁,共132頁,2022年,5月20日,22點44分,星期四總體方差的區(qū)間估計

(例題分析)【例】食品廠從生產(chǎn)的罐頭中隨機抽取15個稱量其重量,得樣本方差s2=1.652(克2),設(shè)罐頭重量服從正態(tài)分布,試求其方差的置信水平為90%的置信區(qū)間。解:已知n=15,1-=90%,s2=1.652

查卡方分布表的:故總體方差的置信水平為90%的置信區(qū)間為[1.61,5.8]

第91頁,共132頁,2022年,5月20日,22點44分,星期四(四)總體總量指標(biāo)的估計第92頁,共132頁,2022年,5月20日,22點44分,星期四1、直接推斷法點估計公式:(1)(2)區(qū)間估計:(1)(2)第93頁,共132頁,2022年,5月20日,22點44分,星期四2、修正系數(shù)法

就是用抽樣所得的調(diào)查結(jié)果同有關(guān)資料對比的系數(shù)來修正全面統(tǒng)計資料時采用的一種方法。例如,某市房地局,年報工資總額3218.1萬元?,F(xiàn)抽查14個單位:年報:415.03萬元多報:0.44萬元少報:1.47萬元抵沖后1.47-0.44=1.03(萬元)第94頁,共132頁,2022年,5月20日,22點44分,星期四四、樣本容量的確定第95頁,共132頁,2022年,5月20日,22點44分,星期四(一)確定樣本容量的基本原則

基本原則:在一定的調(diào)查費用下,做到抽樣誤差最小,或在一定的誤差要求下,近來能夠做到費用最省。

具體做法:先根據(jù)研究問題的性質(zhì)和調(diào)查費用的多少確定允許誤差和必要的概率保證程度,然后根據(jù)歷史資料或其它試點資料確定總體方差,并通過抽樣極限誤差的計算公式推導(dǎo)出必要的樣本單位數(shù)。第96頁,共132頁,2022年,5月20日,22點44分,星期四估計總體均值時樣本容量n為(二)估計總體均值時樣本

容量的確定第97頁,共132頁,2022年,5月20日,22點44分,星期四估計總體均值時樣本容量的確定

(例題分析)【例】在某企業(yè)中采用簡單隨機抽樣調(diào)查職工月平均獎金額,設(shè)職工月獎金額服從標(biāo)準(zhǔn)差為10元的正態(tài)分布,要求估計的絕對誤差為3元,可靠度為95%,試問應(yīng)抽多少職工?

第98頁,共132頁,2022年,5月20日,22點44分,星期四估計總體均值時樣本容量的確定

(例題分析)解:已知=10,d=3,1-=95%,z/2=1.96

則樣本容量為:即應(yīng)抽取43人作為樣本第99頁,共132頁,2022年,5月20日,22點44分,星期四根據(jù)比例區(qū)間估計公式可得樣本容量n為(三)估計總體比例時樣本

容量的確定第100頁,共132頁,2022年,5月20日,22點44分,星期四估計總體比例時樣本容量的確定

(例題分析)【例】根據(jù)以往的生產(chǎn)統(tǒng)計,某種產(chǎn)品的合格率約為90%,現(xiàn)要求絕對誤差為5%,在求95%的置信區(qū)間時,應(yīng)抽取多少個產(chǎn)品作為樣本?解:已知=90%,=0.05,z/2=1.96,d=5%

應(yīng)抽取的樣本容量為

應(yīng)抽取139個產(chǎn)品作為樣本第101頁,共132頁,2022年,5月20日,22點44分,星期四

(四)影響樣本容量的因素第102頁,共132頁,2022年,5月20日,22點44分,星期四

(1)在同樣條件下,不重復(fù)抽樣比重復(fù)抽樣要求的抽樣單位數(shù)目少。但不重復(fù)抽樣的抽樣單位數(shù)目計算公式比較復(fù)雜。在實際工作中,一般當(dāng)n/N的抽樣比例很小時(小于5%),為了簡化計算,雖然采用不重復(fù)抽樣,也可用重復(fù)抽樣計算公式計算抽樣單位數(shù)目。N(五)關(guān)于抽樣單位數(shù)目的幾點說明

(2)同一總體往往同時需要估計總體平均數(shù)和總體成數(shù),對二者可以分別計算出各自抽樣單位數(shù)目,為了防止抽樣單位數(shù)目的不足,在實際工作中,往往根據(jù)抽樣單位數(shù)目比較大的一個數(shù)目進行抽樣,以滿足共同要求第103頁,共132頁,2022年,5月20日,22點44分,星期四第四節(jié)不同抽樣方式下的抽樣估計第104頁,共132頁,2022年,5月20日,22點44分,星期四一、簡單隨機抽樣(simplerandomsampling)第105頁,共132頁,2022年,5月20日,22點44分,星期四1、簡單隨機抽樣

(概念要點)(1)事先不對總體做任何出處理,而是直接從總體中按隨機原則取一定數(shù)量的單位組成樣本。

(2)抽取元素的具體方法有重復(fù)抽樣和不重復(fù)抽樣(3)特點簡單、直觀,在抽樣框完整時,可直接從中抽取樣本用樣本統(tǒng)計量對目標(biāo)量進行估計比較方便(4)局限性當(dāng)N很大時,不易構(gòu)造抽樣框抽出的單位很分散,給實施調(diào)查增加了困難沒有利用其他輔助信息以提高估計的效率第106頁,共132頁,2022年,5月20日,22點44分,星期四2、簡單隨機抽樣

(抽樣方法)(1)編號(2)隨機抽取樣本單位抽簽法利用隨機數(shù)表取數(shù)法電子計算機取數(shù)法。第107頁,共132頁,2022年,5月20日,22點44分,星期四二、分層抽樣(類型抽樣(stratifiedsampling)第108頁,共132頁,2022年,5月20日,22點44分,星期四1、分層抽樣

(概念要點)(1)將抽樣單位按某種特征或某種規(guī)則劃分為不同的層(類),然后從不同的層(類)中獨立、隨機地抽取樣本。(2)優(yōu)點保證樣本的結(jié)構(gòu)與總體的結(jié)構(gòu)比較相近,從而提高估計的精度組織實施調(diào)查方便既可以對總體參數(shù)進行估計,也可以對各層的目標(biāo)量進行估計第109頁,共132頁,2022年,5月20日,22點44分,星期四

(3)分層抽樣的分組標(biāo)志,一般應(yīng)選擇與被研究現(xiàn)象有關(guān)的重要標(biāo)志。通過分組,盡量縮小組內(nèi)各單位標(biāo)志值的差異,增大組間各單位標(biāo)志值的差異,以便降低抽樣誤差。(4)分為比例分層抽樣與不等比例分層抽樣。差異程度較大的組應(yīng)該多抽幾個,而差異程度比較均勻的組可少抽幾個,以便降低抽樣誤差。(5)分層抽樣適宜于由差異較大的單位所組成的總體。它將分組法與隨機原則結(jié)合起來,減少了各組內(nèi)標(biāo)志值的差異程度,使各組都有抽取樣本單位的機會,有利于提高樣本的代表性,能得到比簡單抽樣更為準(zhǔn)確的結(jié)果,因此在實際工作中應(yīng)用較廣泛。分層抽樣(概念要點)第110頁,共132頁,2022年,5月20日,22點44分,星期四2、分層抽樣各層樣本數(shù)目確定(1)分層比例抽樣法:(2)分層最佳抽樣法:(3)最低成本抽樣法:第111頁,共132頁,2022年,5月20日,22點44分,星期四例:假定估計某種產(chǎn)品的潛在用戶的每年平均支出,用戶名單分為:多用、中等使用和少用三層,見如下表:層潛在用戶(N)樣本潛在用戶(n)樣本的平均支出()樣本標(biāo)準(zhǔn)差(S)單位調(diào)查費用1、少用2、中等3、多用2000400020005010050¥1000¥1500¥2000¥100¥150¥200¥7¥10¥12合計8000200第112頁,共132頁,2022年,5月20日,22點44分,星期四層分層比例分層最佳最低成本123501005033100673910061合計200200200經(jīng)計算,數(shù)目分配如下:第113頁,共132頁,2022年,5月20日,22點44分,星期四3、等比例分層抽樣的估計(1)總體均值的估計第一步計算各層抽樣平均數(shù):

第三步計算抽樣平均誤差

計算各組內(nèi)方差:第二步計算樣本平均數(shù)第114頁,共132頁,2022年,5月20日,22點44分,星期四

計算各組內(nèi)方差的平均數(shù):

第四步估計區(qū)間:等比例類型抽樣的估計樣本平均數(shù)的抽樣平均誤差:重復(fù)抽樣:不重復(fù)抽樣:第115頁,共132頁,2022年,5月20日,22點44分,星期四(2)總體比例估計

第二步、計

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負(fù)責(zé)。
  • 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時也不承擔(dān)用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

評論

0/150

提交評論