抽樣與參數(shù)估計_第1頁
抽樣與參數(shù)估計_第2頁
抽樣與參數(shù)估計_第3頁
抽樣與參數(shù)估計_第4頁
抽樣與參數(shù)估計_第5頁
已閱讀5頁,還剩59頁未讀, 繼續(xù)免費閱讀

下載本文檔

版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進行舉報或認領(lǐng)

文檔簡介

第4章抽樣與參數(shù)估計4.1

抽樣與抽樣分布4.2參數(shù)估計的基本方法4.3總體均值的區(qū)間估計4.4總體比例的的區(qū)間估計4.5樣本容量的確定parameterestimation學(xué)習(xí)目標抽樣方法與抽樣分布估計量與估計值的概念點估計與區(qū)間估計的區(qū)別總體均值的區(qū)間估計方法總體比例的區(qū)間估計方法樣本容量的確定方法統(tǒng)計應(yīng)用

一次失敗的民意調(diào)查在1936年的美國總統(tǒng)選舉前,一份名為LiteraryDigest

雜志進行了一次民意調(diào)查。調(diào)查的焦點是誰將成為下一屆總統(tǒng)—是挑戰(zhàn)者,堪薩斯州州長AlfLandon,還是現(xiàn)任總統(tǒng)FranklinDelanoRoosevelt為了解選民意向,民意調(diào)查專家們根據(jù)電話簿和車輛登記簿上的名單給一大批人發(fā)了簡單的調(diào)查表(電話和汽車在1936年并不像現(xiàn)在那樣普及,但是這些名單比較容易得到)。盡管發(fā)出的調(diào)查表大約有一千萬張,但收回的比例并不高。在收回的調(diào)查表中,AlfLandon非常受歡迎。于是該雜志預(yù)測Landon將贏得選舉。但事實上是FranklinRoosevelt贏得了這次選舉調(diào)查失敗的主要原因是抽樣框出現(xiàn)了問題。在經(jīng)濟大蕭條時期由于電話和汽車并不普及,只是富裕階層才會擁有,調(diào)查有電話和汽車的人們,并不能夠反映全體選民的觀點參數(shù)估計在統(tǒng)計方法中的地位參數(shù)估計假設(shè)檢驗統(tǒng)計方法描述統(tǒng)計推斷統(tǒng)計4.1抽樣與抽樣分布

4.1.1概率抽樣方法

4.1.2抽樣分布第4章抽樣與參數(shù)估計4.1.1概率抽樣方法4.1抽樣與抽樣分布概率抽樣

(probabilitysampling)也稱隨機抽樣特點按一定的概率以隨機原則抽取樣本抽取樣本時使每個單位都有一定的機會被抽中每個單位被抽中的概率是已知的,或是可以計算出來的當(dāng)用樣本對總體目標量進行估計時,要考慮到每個樣本單位被抽中的概率簡單隨機抽樣

(simplerandomsampling)從總體N個單位中隨機地抽取n個單位作為樣本,每個單位入抽樣本的概率是相等的最基本的抽樣方法,是其它抽樣方法的基礎(chǔ)特點簡單、直觀,在抽樣框完整時,可直接從中抽取樣本用樣本統(tǒng)計量對目標量進行估計比較方便局限性當(dāng)N很大時,不易構(gòu)造抽樣框抽出的單位很分散,給實施調(diào)查增加了困難沒有利用其它輔助信息以提高估計的效率分層抽樣

(stratifiedsampling)將抽樣單位按某種特征或某種規(guī)則劃分為不同的層,然后從不同的層中獨立、隨機地抽取樣本優(yōu)點保證樣本的結(jié)構(gòu)與總體的結(jié)構(gòu)比較相近,從而提高估計的精度組織實施調(diào)查方便既可以對總體參數(shù)進行估計,也可以對各層的目標量進行估計系統(tǒng)抽樣

(systematicsampling)將總體中的所有單位(抽樣單位)按一定順序排列,在規(guī)定的范圍內(nèi)隨機地抽取一個單位作為初始單位,然后按事先規(guī)定好的規(guī)則確定其它樣本單位先從數(shù)字1到k之間隨機抽取一個數(shù)字r作為初始單位,以后依次取r+k,r+2k…等單位優(yōu)點:操作簡便,可提高估計的精度缺點:對估計量方差的估計比較困難整群抽樣

(clustersampling)將總體中若干個單位合并為組(群),抽樣時直接抽取群,然后對中選群中的所有單位全部實施調(diào)查特點抽樣時只需群的抽樣框,可簡化工作量調(diào)查的地點相對集中,節(jié)省調(diào)查費用,方便調(diào)查的實施缺點是估計的精度較差4.1.2抽樣分布4.1抽樣與抽樣分布在重復(fù)選取容量為n的樣本時,由每一個樣本算出的該統(tǒng)計量數(shù)值的相對頻數(shù)分布或概率分布是一種理論分布隨機變量是樣本統(tǒng)計量樣本均值,樣本比例,樣本方差等結(jié)果來自容量相同的所有可能樣本提供了樣本統(tǒng)計量長遠我們穩(wěn)定的信息,是進行推斷的理論基礎(chǔ),也是抽樣推斷科學(xué)性的重要依據(jù) 抽樣分布

(samplingdistribution)容量相同的所有可能樣本的樣本均值的概率分布一種理論概率分布進行推斷總體總體均值的理論基礎(chǔ) 樣本均值的抽樣分布樣本均值的抽樣分布

(例題分析)【例】設(shè)一個總體,含有4個元素(個體)

,即總體單位數(shù)N=4。4

個個體分別為x1=1、x2=2、x3=3

、x4=4

??傮w的均值、方差及分布如下總體分布14230.1.2.3均值和方差樣本均值的抽樣分布

(例題分析)

現(xiàn)從總體中抽取n=2的簡單隨機樣本,在重復(fù)抽樣條件下,共有42=16個樣本。所有樣本的結(jié)果為3,43,33,23,132,42,32,22,124,44,34,24,141,441,33211,21,11第二個觀察值第一個觀察值所有可能的n=2的樣本(共16個)樣本均值的抽樣分布

(例題分析)計算出各樣本的均值,如下表。并給出樣本均值的抽樣分布3.53.02.52.033.02.52.01.524.03.53.02.542.542.03211.51.01第二個觀察值第一個觀察值16個樣本的均值(x)X樣本均值的抽樣分布1.00.1.2.3P(X)1.53.04.03.52.02.5樣本均值的分布與總體分布的比較

(例題分析)=2.5σ2=1.25總體分布樣本均值分布樣本均值的抽樣分布

與中心極限定理=50

=10X總體分布n=4抽樣分布Xn=16當(dāng)總體服從正態(tài)分布N~(μ,σ2)時,來自該總體的所有容量為n的樣本的均值X也服從正態(tài)分布,X

的數(shù)學(xué)期望為μ,方差為σ2/n。即X~N(μ,σ2/n)中心極限定理

(centrallimittheorem)當(dāng)樣本容量足夠大時(n

30),樣本均值的抽樣分布逐漸趨于正態(tài)分布中心極限定理:設(shè)從均值為,方差為

2的一個任意總體中抽取容量為n的樣本,當(dāng)n充分大時,樣本均值的抽樣分布近似服從均值為μ、方差為σ2/n的正態(tài)分布一個任意分布的總體X抽樣分布與總體分布的關(guān)系總體分布正態(tài)分布非正態(tài)分布大樣本小樣本樣本均值正態(tài)分布樣本均值正態(tài)分布樣本均值非正態(tài)分布樣本均值的數(shù)學(xué)期望樣本均值的方差重復(fù)抽樣不重復(fù)抽樣樣本均值的抽樣分布

(數(shù)學(xué)期望與方差)總體(或樣本)中具有某種屬性的單位與全部單位總數(shù)之比不同性別的人與全部人數(shù)之比合格品(或不合格品)與全部產(chǎn)品總數(shù)之比總體比例可表示為樣本比例可表示為

樣本比例的抽樣分布

(比例—proportion)容量相同的所有可能樣本的樣本比例的概率分布當(dāng)樣本容量很大時,樣本比例的抽樣分布可用正態(tài)分布近似一種理論概率分布推斷總體總體比例的理論基礎(chǔ) 樣本比例的抽樣分布樣本比例的數(shù)學(xué)期望樣本比例的方差重復(fù)抽樣樣本比例的抽樣分布

(數(shù)學(xué)期望與方差)4.2參數(shù)估計的基本原理

4.2.1估計量與估計值

4.2.2點估計與區(qū)間估計第4章抽樣與參數(shù)估計4.2.1點估計與區(qū)間估計4.2參數(shù)估計的基本原理點估計

(pointestimate)用樣本的估計量的某個取值直接作為總體參數(shù)的估計值例如:用樣本均值直接作為總體均值的估計;用兩個樣本均值之差直接作為總體均值之差的估計無法給出估計值接近總體參數(shù)程度的信息由于樣本是隨機的,抽出一個具體的樣本得到的估計值很可能不同于總體真值一個點估計量的可靠性是由它的抽樣標準誤差來衡量的,這表明一個具體的點估計值無法給出估計的可靠性的度量區(qū)間估計

(intervalestimate)在點估計的基礎(chǔ)上,給出總體參數(shù)估計的一個估計區(qū)間,該區(qū)間由樣本統(tǒng)計量加減估計誤差而得到根據(jù)樣本統(tǒng)計量的抽樣分布能夠?qū)颖窘y(tǒng)計量與總體參數(shù)的接近程度給出一個概率度量比如,某班級平均分數(shù)在75~85之間,置信水平是95%

樣本統(tǒng)計量

(點估計)置信區(qū)間置信下限置信上限區(qū)間估計的圖示x95%的樣本-1.96x+1.96x99%的樣本-2.58x+2.58x90%的樣本-1.65x+1.65x將構(gòu)造置信區(qū)間的步驟重復(fù)很多次,置信區(qū)間包含總體參數(shù)真值的次數(shù)所占的比例,也稱置信度表示為(1-為是總體參數(shù)未在區(qū)間內(nèi)的比例常用的置信水平值有99%,95%,90%相應(yīng)的為0.01,0.05,0.10置信水平

(confidencelevel)

置信區(qū)間與置信水平的關(guān)系

均值的抽樣分布(1-)%區(qū)間包含了

%的區(qū)間未包含1–aa/2a/24.3總體均值的區(qū)間估計

4.3.1正態(tài)總體、方差已知或非正態(tài)總體、大樣本

4.2.2正態(tài)總體、方差未知、小樣本第4章抽樣與參數(shù)估計4.3.1正態(tài)總體、方差已知

或非正態(tài)總體、大樣本4.3總體均值的區(qū)間估計總體均值的區(qū)間估計

(正態(tài)總體、方差已知或非正態(tài)總體大樣本)1. 假定條件總體服從正態(tài)分布,且方差(2)

已知如果不是正態(tài)分布,可由正態(tài)分布來近似(n

30)使用正態(tài)分布統(tǒng)計量z總體均值在1-置信水平下的置信區(qū)間為總體均值的區(qū)間估計

(正態(tài)總體、方差已知或非正態(tài)總體大樣本)【例4.2】一家食品生產(chǎn)企業(yè)以生產(chǎn)袋裝食品為主,為對產(chǎn)量質(zhì)量進行監(jiān)測,企業(yè)質(zhì)檢部門經(jīng)常要進行抽檢,以分析每袋重量是否符合要求。現(xiàn)從某天生產(chǎn)的一批食品中隨機抽取了25袋,測得每袋重量如下表所示。已知產(chǎn)品重量的分布服從正態(tài)分布,且總體標準差為10克。試估計該批產(chǎn)品平均重量的置信區(qū)間,置信水平為95%25袋食品的重量112.5101.0103.0102.0100.5102.6107.595.0108.8115.6100.0123.5102.0101.6102.2116.695.497.8108.6105.0136.8102.8101.598.493.3總體均值的區(qū)間估計

(正態(tài)總體、方差已知或非正態(tài)總體大樣本)解:已知X~N(,102),n=25,1-=95%,z/2=1.96。根據(jù)樣本數(shù)據(jù)計算得:。由于是正態(tài)總體,且方差已知??傮w均值在1-置信水平下的置信區(qū)間為該食品平均重量的置信區(qū)間為101.44g~109.28g總體均值的區(qū)間估計

(正態(tài)總體、方差已知或非正態(tài)總體大樣本)【例4.3】一家保險公司收集到由36個投保人組成的隨機樣本,得到每個投保人的年齡(單位:周歲)數(shù)據(jù)如下表。試建立投保人年齡90%的置信區(qū)間

36個投保人年齡的數(shù)據(jù)233539273644364246433133425345544724342839364440394938344850343945484532總體均值的區(qū)間估計

(正態(tài)總體、方差已知或非正態(tài)總體大樣本)解:已知n=36,1-=90%,z/2=1.645。根據(jù)樣本數(shù)據(jù)計算得:,

總體均值在1-置信水平下的置信區(qū)間為投保人平均年齡的置信區(qū)間為37.37歲~41.63歲4.3.2正態(tài)總體、方差未知、小樣本4.3總體均值的區(qū)間估計總體均值的區(qū)間估計

(正態(tài)總體、方差未知、小樣本)1. 假定條件總體服從正態(tài)分布,但方差(2)

未知小樣本(n<30)使用t

分布統(tǒng)計量總體均值在1-置信水平下的置信區(qū)間為總體均值的區(qū)間估計

(正態(tài)總體、方差未知、小樣本)【例5.3】已知某種燈泡的壽命服從正態(tài)分布,現(xiàn)從一批燈泡中隨機抽取16只,測得其使用壽命(單位:h)如下。建立該批燈泡平均使用壽命95%的置信區(qū)間16燈泡使用壽命的數(shù)據(jù)1510152014801500145014801510152014801490153015101460146014701470總體均值的區(qū)間估計

(正態(tài)總體、方差未知、小樣本)解:已知X~N(,2),n=16,1-=95%,t/2=2.131

根據(jù)樣本數(shù)據(jù)計算得:,

總體均值在1-置信水平下的置信區(qū)間為該種燈泡平均使用壽命的置信區(qū)間為1476.8h~1503.2h總體均值的區(qū)間估計

(小結(jié))4.4總體比例的區(qū)間估計

第4章抽樣與參數(shù)估計總體比例的區(qū)間估計

(一個總體比例)1. 假定條件總體服從二項分布可以由正態(tài)分布來近似np(成功次數(shù))和n(1-p)(失敗次數(shù))均應(yīng)該大于5使用正態(tài)分布統(tǒng)計量z3.總體比例在1-置信水平下的置信區(qū)間為總體比例的區(qū)間估計

(例題分析)【例4.5】某城市想要估計下崗職工中女性所占的比例,隨機地抽取了100名下崗職工,其中65人為女性職工。試以95%的置信水平估計該城市下崗職工中女性比例的置信區(qū)間解:已知n=100,p=65%,1-=95%,z/2=1.96該城市下崗職工中女性比例的置信區(qū)間為55.65%~74.35%

總體比例的區(qū)間估計

(例題分析)【例4.6】某區(qū)疾病預(yù)防控制中心2002年對該鄉(xiāng)鎮(zhèn)250名小學(xué)生進行貧血的檢查,結(jié)果發(fā)現(xiàn)有86名貧血者。求貧血者檢查率在95%的置信區(qū)間。解:已知n=250,p=86/250=34.4%,1-=95%,z/2=1.96該城市下崗職工中女性比例的置信區(qū)間為28.51%~40.29%

總體參數(shù)區(qū)間估計使用的分布

(小結(jié))總體參數(shù)的區(qū)間估計

(小結(jié))本章小結(jié)抽樣方法與抽樣分布點估計與區(qū)間估計的區(qū)別總體均值的區(qū)間估計方法總體比例的區(qū)間估計方法練習(xí)題1、從含有N個元素的總體中,抽取n個元素作為樣本,使得總體中每一個元素都有相同的機會被抽中,這樣的抽樣方法稱為()A簡單隨機抽樣B分層抽樣C系統(tǒng)抽樣D整群抽樣2、在抽樣之前先將總體的元素劃分為若干類,然后從各個類中抽取一定數(shù)量的元素組成一個樣本,這樣的抽樣方法稱為()A簡單隨機抽樣B分層抽樣C系統(tǒng)抽樣D整群抽樣3、先將總體各元素按某種順序排列,并按某種規(guī)則確定一個隨機起點,然后每隔一定的間隔抽取一個元素,直至抽取n個元素形成一個樣本。這樣的抽樣方法稱為()A簡單隨機抽樣B分層抽樣C系統(tǒng)抽樣D整群抽樣4、先將總體劃分為若干群,然后以群作為抽樣單位從中抽取部分群,再對抽中的各個群中所包含的所有元素進行觀察。這樣的抽樣方法稱為()A簡單隨機抽樣B分層抽樣C系統(tǒng)抽樣D整群抽樣5、飛機離開登機口到起飛的等待時間通常是右偏的,均值為10分鐘,標準差為8分鐘。假設(shè)隨機抽取100架飛機,則等待時間的均值的抽樣分布是()A右偏的,均值為10分鐘,標準差為0.8分鐘B正態(tài)分布,均值為10分鐘,標準差為0.8分鐘C右偏的,均值為10分鐘,標準差為8分鐘D正態(tài)分布,均值為10分鐘,標準差為8分鐘6、設(shè)總體的均值為500,標準差為200,從該總體中抽取一個容量為30的樣本,則樣本均值的標準差為()A、36.51

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負責(zé)。
  • 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔(dān)用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

評論

0/150

提交評論