第六章抽樣與參數(shù)估計(jì)_第1頁(yè)
第六章抽樣與參數(shù)估計(jì)_第2頁(yè)
第六章抽樣與參數(shù)估計(jì)_第3頁(yè)
第六章抽樣與參數(shù)估計(jì)_第4頁(yè)
第六章抽樣與參數(shù)估計(jì)_第5頁(yè)
已閱讀5頁(yè),還剩35頁(yè)未讀, 繼續(xù)免費(fèi)閱讀

下載本文檔

版權(quán)說(shuō)明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請(qǐng)進(jìn)行舉報(bào)或認(rèn)領(lǐng)

文檔簡(jiǎn)介

參數(shù)估計(jì)在統(tǒng)計(jì)方法中的地位統(tǒng)計(jì)方法描述統(tǒng)計(jì)推斷統(tǒng)計(jì)參數(shù)估計(jì)假設(shè)檢驗(yàn)第六章抽樣與參數(shù)估計(jì)第一節(jié)抽樣與抽樣分布第二節(jié)參數(shù)估計(jì)基本方法第三節(jié)總體均值和總體比例的區(qū)間估計(jì)一、總體、個(gè)體和樣本(概念要點(diǎn))

總體(Population):調(diào)查研究的事物或現(xiàn)象的全體

個(gè)體(Itemunit):組成總體的每個(gè)元素

樣本(Sample):從總體中所抽取的部分個(gè)體

樣本容量(Samplesize):樣本中所含個(gè)體的數(shù)量第一節(jié)抽樣與抽樣分布所有可能的樣本指標(biāo)(如均值、比例、方差等)及其所對(duì)應(yīng)的概率稱為抽樣分布樣本指標(biāo)是隨機(jī)變量樣本均值,樣本比例等結(jié)果來(lái)自容量相同的所有可能樣本

抽樣分布可能精確的服從某種已知分布,也可能是以某種已知分布為極限分布二、樣本均值的分布與中心極限定理(一)抽樣分布(二)樣本均值的抽樣分布(一個(gè)例子)【例】設(shè)一個(gè)總體,含有4個(gè)元素(個(gè)體),即總體單位數(shù)N=4。4個(gè)個(gè)體分別為X1=1、X2=2、X3=3、X4=4??傮w的均值、方差及分布如下均值和方差總體分布14230.1.2.3

現(xiàn)從總體中抽取n=2的簡(jiǎn)單隨機(jī)樣本,在重復(fù)抽樣條件下,共有42=16個(gè)樣本。所有樣本的結(jié)果如下表3,43,33,23,132,42,32,22,124,44,34,24,141,441,33211,21,11第二個(gè)觀察值第一個(gè)觀察值所有可能的n=2的樣本(共16個(gè))

計(jì)算出各樣本的均值,如下表。并給出樣本均值的抽樣分布3.53.02.52.033.02.52.01.524.03.53.02.542.542.03211.51.01第二個(gè)觀察值第一個(gè)觀察值16個(gè)樣本的均值(x)樣本均值的抽樣分布1.00.1.2.3P(x)1.53.04.03.52.02.5x所有樣本均值的均值和方差式中:M為樣本數(shù)目比較及結(jié)論:1.樣本均值的均值(數(shù)學(xué)期望)等于總體均值

2.樣本均值的方差等于總體方差的1/n樣本均值的分布與總體分布的比較抽樣分布

=2.5σ2=1.25總體分布14230.1.2.3P(x)1.00.1.2.31.53.04.03.52.02.5x(三)樣本均值的抽樣分布與中心極限定理當(dāng)樣本容量足夠大時(shí)(n

30),樣本均值的抽樣分布逐漸趨于正態(tài)分布中心極限定理:設(shè)從均值為

,方差為

2的一個(gè)任意總體中抽取容量為n的樣本,當(dāng)n≥30時(shí),樣本均值的抽樣分布近似服從均值為μ、方差為σ2/n的正態(tài)分布;當(dāng)n<30時(shí),樣本均值的抽樣分布是t分布。一個(gè)任意分布的總體X

=50

=10X總體分布n=4抽樣分布Xn=16當(dāng)總體服從正態(tài)分布N~(μ,σ2)時(shí),來(lái)自該總體的所有容量為n的樣本的均值

X也服從正態(tài)分布,

X

的數(shù)學(xué)期望為μ,方差為σ2/n。即

X~N(μ,σ2/n)

2隨機(jī)變量的典型模式:三、樣本方差的抽樣分布若

X1,X2,…,Xn相互獨(dú)立,同服從標(biāo)準(zhǔn)正態(tài)分布,則隨機(jī)變量

ξ=X12+X22+…+Xn2

服從自由度為n的

2分布

設(shè)總體服從正態(tài)分布N~(μ,σ2),X1,X2,…,Xn為來(lái)自該正態(tài)總體的樣本,則樣本方差:將

2(n–1)稱為自由度為(n-1)的卡方分布樣本方差的分布:

2分布上側(cè)分位數(shù)設(shè)

2(n)服從自由度為n的

2分布,對(duì)于給定的α(0<α<1),滿足P{

2(n)>λ}=α的λ,稱為n個(gè)自由度的

2分布α水平上側(cè)分位數(shù)。記作

α2(n)例:已知X~

2(12)

,求滿足P{X>λ2}=0.025P{X<λ1}=0.05的λ2

和λ1(1)查表,由n=12,α=0.025可得λ2=23.34;(2)對(duì)P{X<λ1}=0.05無(wú)法直接查表,可以轉(zhuǎn)換一下形式P{X<λ1}=1-P{X≥λ1}=0.05

所以P{X>λ1}=0.95,查表得λ1=5.23四、兩個(gè)樣本方差比的抽樣分布設(shè)隨機(jī)變量X和Y相互獨(dú)立,服從自由度相應(yīng)為n1和n2的

2分布,即X~

2

(n1),Y~

2(n2)則即F服從自由度為(n1,n2)的F分布F分布隨機(jī)變量的一般模式:

設(shè)X1,X2,…,Xn1是來(lái)自正態(tài)總體N~(μ1,σ12)的一個(gè)樣本,Y1,Y2,…,Yn2是來(lái)自正態(tài)總體N~(μ2,σ22)的一個(gè)樣本,且Xi(i=1,2,…,n1),Yi(i=1,2,…,n2)相互獨(dú)立,則將F(n1-1,n2-1)稱為第一自由度為(n1-1),第二自由度為(n2-1)的F分布兩個(gè)樣本方差比的抽樣分布:F分布的上側(cè)分位數(shù)設(shè)隨機(jī)變量F服從自由度為n1和n2的F分布,對(duì)于給定的α(0<α<1),由P{F>λ}=α所決定的λ,稱為自由度為n1和n2的F分布α水平上側(cè)分位數(shù)。記作Fα(n1,n2)例:已知F~F(24,15)

,求滿足P{F>λ}=0.05的λ查表中α=0.05,第一自由度24,第二自由度15,得λ=2.11;五、t

統(tǒng)計(jì)量的分布設(shè)隨機(jī)變量X服從標(biāo)準(zhǔn)正態(tài)分布N(0,1),Y服從自由度相應(yīng)為n的

2分布,且X和Y相互獨(dú)立,則即t服從自由度為n的t分布t分布隨機(jī)變量的一般模式:服從t分布的統(tǒng)計(jì)量:對(duì)于來(lái)自正態(tài)總體N(μ,σ2)的樣本均值

X當(dāng)σ未知時(shí),若用樣本標(biāo)準(zhǔn)差S代替上式中的σ,則所得結(jié)果不再服從標(biāo)準(zhǔn)正態(tài)分布,而是服從t分布。

設(shè)X1,X2,…,Xn是來(lái)自正態(tài)總體N~(μ,σ2)的一個(gè)樣本,則服從自由度為(n-1)的t分布Xt

分布與正態(tài)分布的比較正態(tài)分布t分布t不同自由度的t分布標(biāo)準(zhǔn)正態(tài)分布t(df=13)t(df=5)Zt分布的上側(cè)分位數(shù)對(duì)于給定的α(0<α<1),由P{t(n)>λ}=α所決定的λ,稱為自由度為n的t分布α水平上側(cè)分位數(shù)。記作tα(n)例:已知t~t(15)

,求:(1)P{t(15)>λ}=0.05的λ;(2)P{|t(15)|>λ}=0.01的λ(1)由P{t(15)>λ}=0.05,查表可知λ=1.753(2)P{|t(15)|>λ}=0.01

,則P{t(15)>λ}=0.005

,α=0.005,得λ=2.947。一、點(diǎn)估計(jì)二、區(qū)間估計(jì)第二節(jié)參數(shù)估計(jì)基本方法從總體中抽取一個(gè)樣本,根據(jù)該樣本的統(tǒng)計(jì)量對(duì)總體的未知參數(shù)作出一個(gè)數(shù)值點(diǎn)的估計(jì)例如:用樣本均值作為總體未知均值的估計(jì)值就是一個(gè)點(diǎn)估計(jì)一、點(diǎn)估計(jì)2. 點(diǎn)估計(jì)沒(méi)有給出估計(jì)值接近總體未知參數(shù)程度的信息(誤差范圍的大?。?、用于估計(jì)總體某一參數(shù)的隨機(jī)變量如樣本均值,樣本比例、樣本中位數(shù)等例如:樣本均值就是總體均值

的一個(gè)估計(jì)量如果樣本均值

x

=3,則3

就是

的估計(jì)估計(jì)量

(概念要點(diǎn))2、同一個(gè)參數(shù)可以用不同的估計(jì)量來(lái)估計(jì),即估計(jì)量的選擇有一定任意性,這就存在著比較好壞的問(wèn)題。估計(jì)量的優(yōu)良性準(zhǔn)則無(wú)偏性:估計(jì)量的數(shù)學(xué)期望等于被估計(jì)的總體參數(shù)。有效性:一個(gè)方差較小的無(wú)偏估計(jì)量稱為一個(gè)更有效的估計(jì)量。如,與其他估計(jì)量相比,樣本均值是一個(gè)更有效的估計(jì)量一致性:隨著樣本容量的增大,估計(jì)量越來(lái)越接近被估計(jì)的總體參數(shù)1、給出總體參數(shù)落在這一區(qū)間的概率,即這個(gè)范圍包含參數(shù)真值的可靠程度。二、區(qū)間估計(jì)2、總體參數(shù)的真值是固定的、未知的,而用樣本構(gòu)造的區(qū)間則是不固定的。若抽取不同的樣本,用該方法可以得到不同的區(qū)間,即置信區(qū)間是一個(gè)隨機(jī)區(qū)間。3、對(duì)抽取的一個(gè)樣本,構(gòu)造一定置信水平下的置信區(qū)間是一定的,但是否包含總體參數(shù)的真值不一定,只能希望是大量包含真值區(qū)間中的一個(gè)。根據(jù)一個(gè)樣本的觀察值給出總體參數(shù)的估計(jì)范圍總體未知參數(shù)落在區(qū)間內(nèi)的概率表示為(1-

為顯著性水平,是總體參數(shù)未在區(qū)間內(nèi)的概率常用的置信水平值有

99%,95%,90%相應(yīng)的

為0.01,0.05,0.10置信水平影響區(qū)間寬度的因素1. 數(shù)據(jù)的離散程度,用來(lái)測(cè)度2. 置信水平(1-

),影響

Z的大小1. 假定條件總體服從正態(tài)分布,且總體方差(

2)已知如果不是正態(tài)分布,可以由正態(tài)分布來(lái)近似

(n

30)使用正態(tài)分布統(tǒng)計(jì)量Z總體均值

在1-

置信水平下的置信區(qū)間為

(

2已知)第三節(jié)總體均值的區(qū)間估計(jì)總體均值的區(qū)間估計(jì)

(正態(tài)總體:實(shí)例)解:已知X~N(

,0.152),

x=21.4,n=9,1-=0.95,Z

/2=1.96

總體均值

的置信區(qū)間為我們可以95%的概率保證該種零件的平均長(zhǎng)度在21.302~21.498mm之間【例】某種零件長(zhǎng)度服從正態(tài)分布,從該批產(chǎn)品中隨機(jī)抽?。辜瑴y(cè)得其平均長(zhǎng)度為21.4mm。已知總體標(biāo)準(zhǔn)差

=0.15mm,試建立該種零件平均長(zhǎng)度的置信區(qū)間,給定置信水平為0.95??傮w均值的區(qū)間估計(jì)

(非正態(tài)總體:實(shí)例)解:已知

x=26,=6,n=100,1-=0.95,Z

/2=1.96我們可以95%的概率保證平均每天參加鍛煉的時(shí)間在24.824~27.176分鐘之間【例】某大學(xué)從該校學(xué)生中隨機(jī)抽取100人,調(diào)查到他們平均每天參加體育鍛煉的時(shí)間為26分鐘。試以95%的置信水平估計(jì)該大學(xué)全體學(xué)生平均每天參加體育鍛煉的時(shí)間(已知總體方差為36小時(shí))。

(

2未知)1. 假定條件總體方差(

2)未知總體必須服從正態(tài)分布使用t分布統(tǒng)計(jì)量3.總體均值

在1-

置信水平下的置信區(qū)間為總體均值的區(qū)間估計(jì)

(實(shí)例)解:已知X~N(

,

2),

X=50,s=8,n=25,1-=0.95,t/2=2.0639。我們可以95%的概率保證總體均值在46.69~53.30之間【例】從一個(gè)正態(tài)總體中抽取一個(gè)隨機(jī)樣本,n=25

,其均值`X=

50

,標(biāo)準(zhǔn)差s=8。建立總體均值m

的95%的置信區(qū)間。練習(xí)題1、一家食品廠生產(chǎn)企業(yè)以生產(chǎn)袋裝食品為主,每天的產(chǎn)量大約為8000袋左右。按規(guī)定每袋的重量應(yīng)為100g。為對(duì)產(chǎn)量質(zhì)量進(jìn)行監(jiān)測(cè),企業(yè)質(zhì)監(jiān)部門經(jīng)常要進(jìn)行抽檢,以分析每袋重量是否符合要求?,F(xiàn)從某天生產(chǎn)的一批食品中隨機(jī)抽取25袋,測(cè)得每袋重量如表所示:112.5101.0103.0102.0100.5102.6107.595.0108.8115.6100.0123.5102.0101.6102.2116.695.497.8108.6105.0136.8102.8101.598.493.3已知產(chǎn)品重量的分布服從正態(tài)分布,且總體標(biāo)準(zhǔn)差為10g。試估計(jì)該天產(chǎn)品平均重量的置信區(qū)間,置信水平95%。解:已知

=10,n=25,1-=0.95,Z

/2=1.96根據(jù)樣本數(shù)據(jù)計(jì)算的樣本均值為:該批食品平均重量95%的置信區(qū)間為101.44~109.28g。2、一家保險(xiǎn)公司收集到由36位投保人組成的隨機(jī)樣本,得

溫馨提示

  • 1. 本站所有資源如無(wú)特殊說(shuō)明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請(qǐng)下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請(qǐng)聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁(yè)內(nèi)容里面會(huì)有圖紙預(yù)覽,若沒(méi)有圖紙預(yù)覽就沒(méi)有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫(kù)網(wǎng)僅提供信息存儲(chǔ)空間,僅對(duì)用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對(duì)用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對(duì)任何下載內(nèi)容負(fù)責(zé)。
  • 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請(qǐng)與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶因使用這些下載資源對(duì)自己和他人造成任何形式的傷害或損失。

最新文檔

評(píng)論

0/150

提交評(píng)論