第6章參數(shù)估計_第1頁
第6章參數(shù)估計_第2頁
第6章參數(shù)估計_第3頁
第6章參數(shù)估計_第4頁
第6章參數(shù)估計_第5頁
已閱讀5頁,還剩123頁未讀 繼續(xù)免費(fèi)閱讀

下載本文檔

版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進(jìn)行舉報或認(rèn)領(lǐng)

文檔簡介

1、1第第6章章 參數(shù)估計參數(shù)估計2參數(shù)估計主要研究如何通過樣本提供的信息估計總體的數(shù)字特征。由于在統(tǒng)計推斷中往往稱總體分布的數(shù)字特征為總體參數(shù),所以稱這部分內(nèi)容為參數(shù)估計。參數(shù)估計是在總體分布參數(shù)值未知的情況下,利用樣本統(tǒng)計量估計總體的參數(shù)。 多數(shù)情況下,總體X的分布形式是已知的或是可以假定的,但其中某個或某些參數(shù)是未知的。如何利用樣本數(shù)據(jù)對總體參數(shù)的未知參數(shù)進(jìn)行估計,就是所謂的參數(shù)估計問題。 估估 計計 方方 法法點(diǎn)點(diǎn) 估估 計計區(qū)間估計區(qū)間估計參數(shù)估計方法包括參數(shù)的點(diǎn)估計和區(qū)間估計:5一一.點(diǎn)估計的概念點(diǎn)估計的概念 設(shè) 是總體 X 分布的未知參數(shù),)(21n,X,XX是用 X 的樣本構(gòu)造的統(tǒng)

2、計量, 用的一個觀察值)(21n,x,xx去估計未知參數(shù) 的真值,參數(shù) 的點(diǎn)估計;)(21n,X,XX為 的估計量估計量;)(21n,x,xx為 的一個估計值估計值。 由于估計量是隨機(jī)變量,抽取不同的樣本,其取值是各不相同的。 用一個特定樣本對總體未知參數(shù)所作的估計,僅是所有可能估計值中的一個點(diǎn),故稱為點(diǎn)估計。 稱為并稱統(tǒng)計量6.1 點(diǎn)估計點(diǎn)估計點(diǎn)估計的目的:點(diǎn)估計的目的:根據(jù)樣本資料求出非常接近于總體參數(shù)的估計值點(diǎn)估計的局限性:點(diǎn)估計的局限性:l無法給出估計值接近總體參數(shù)程度的信息l由于樣本是隨機(jī)的,抽出一個具體的樣本得到的估計值很可能不同于總體真值。71.無偏性(Unbiasedness)

3、雖然每個樣本產(chǎn)生的估計量的取值不一定等于參數(shù),但當(dāng)抽取大量樣本時,那些樣本產(chǎn)生的估計量的均值會接近真正要估計的假定分布的參數(shù)。二二. 點(diǎn)估計量的評價標(biāo)準(zhǔn)點(diǎn)估計量的評價標(biāo)準(zhǔn)為未知參數(shù) 的估計量,)(E,則稱為 的無偏估計量, 簡稱無偏估計(Unbiased Estimator)若點(diǎn)估計量設(shè)的抽樣分布的期望8 無偏性是對估計量的最基本要求,無偏估計將不會出現(xiàn)系統(tǒng)性的估計偏差。 對任意總體 X,其隨機(jī)樣本產(chǎn)生的X樣本 方差 S2和樣本成數(shù)分別是總體均值和總體方差的無偏估計。樣本均值 、910 有效性有效性是衡量估計量最重要最重要的標(biāo)準(zhǔn)。對給定的樣本容量,有效估計是所有無偏估計量中估計誤差最小的。21

4、設(shè) ,),()(21DD21比則稱 是參數(shù) 的兩個無偏估計,有效有效;容量,是 所有無偏估計中方差最小的,是 的最小方差無偏估計最小方差無偏估計,2. 有效性有效性若對固定的樣本若則稱也稱為 的的有效估計有效估計。樣本均值和樣本比例都是總體均值和總體比例的有效估計;而對正態(tài)總體, 樣本方差也是總體方差的有效估計??梢宰C明,對任意總體,11123. 一致性一致性13一致性是大樣本所呈現(xiàn)的性質(zhì)。若某個估計量是待估參數(shù)的一致估計量則意味著樣本容量很大時,估計量與待估參數(shù)很接近的可能性非常大。當(dāng)樣本容量不大時,無偏性是基本的要求,它保證估計量除了隨機(jī)誤差外,不會有系統(tǒng)誤差。隨機(jī)誤差是由于偶然性原因引起

5、的,不具有傾向性,估計值可能夸大,也可能縮小,但平均來看,可以相互抵消。而系統(tǒng)誤差則具有傾向性,使估計值在量上偏向某一方。1414在大多數(shù)的實(shí)際問題中,需要估計的總體未知參數(shù)主要有總體成數(shù)、總體均值和總體方差??梢宰C明,樣本成數(shù)、樣本均值和樣本方差分別是總體成數(shù)、總體均值和總體方差的優(yōu)良估計。即pP 三三. 點(diǎn)估計的方法點(diǎn)估計的方法 X22Snn11515 設(shè)某種元件的壽命 XN(, 2),其中 , 2未知,現(xiàn)隨機(jī)測得10個元件的壽命如下(小時) 1502, 1453, 1367, 1108, 1650 1213, 1208, 1480, 1550, 1700 試估計 和 2。解解:使用計算器

6、的 SD 功能可得1 .1423 x2225 .196 S【例例1 1】 產(chǎn)品壽命均值和方差的估計產(chǎn)品壽命均值和方差的估計1616點(diǎn)估計的方法有極大似然估計法、矩估計法、最小二乘估計法、貝葉斯估計法等這一章只簡要介紹兩種常用的方法:極大似然估計法和矩估計法。1717(一)極大似然估計法極大似然估計法的基本思想:假設(shè)總體的分布形式已知,只是不知總體分布的某個(或某些)參數(shù)i。抽樣后,可以得到一組樣本值,根據(jù)樣本與總體的關(guān)系,找出使樣本值出現(xiàn)的可能性最大的那個參數(shù)估計值 ,則這個估計值 就是待估參數(shù)的極大似然估計值。ii1818例例 甲企業(yè)收到某供應(yīng)商提供的一批貨物,根據(jù)以往經(jīng)驗(yàn),該供應(yīng)商的產(chǎn)品次

7、品率為10,而供應(yīng)商聲稱次品率僅有5。若從中隨機(jī)抽取10件進(jìn)行檢驗(yàn),結(jié)果有4件次品。記X為次品數(shù),顯然XB(n,p)。若p=0.05,則10件產(chǎn)品中有4件次品的概率為若p=0.1,則10件產(chǎn)品中有4件次品的概率為19202021212222232324對上式中兩個未知參數(shù)分別求偏導(dǎo),并令其為零:25(二)矩估計樣本矩在一定程度上反映了總體矩的特征,只要總體矩存在,就自然想到用樣本矩估計總體矩。28例 求總體數(shù)學(xué)期望和方差的矩估計量321,2設(shè) 為總體分布的未知參數(shù),若由樣本確定的兩個統(tǒng)計量和對給定的概率 (0 Z = 0f (x) x z1- 如圖所示, ( Z )=1- ,因此,可由正態(tài)分布

8、表得到 Z 。 如:要查 Z0.025,由正態(tài)分布表可查得: (1.96) =1-0.025 =0.975 ,故 Z0.025 =1.96 標(biāo)準(zhǔn)正態(tài)分布標(biāo)準(zhǔn)正態(tài)分布38由正態(tài)分布的性質(zhì)可得對給定的置信度1-,nXZ/2/2/ZnXZP0f (x)x z/2/2 -z/2/21- N(0,1)/2/2/nZxnZxP由此可得從而的置信度為 1- 的置信區(qū)間為 , / (2/nZx , ) ,(dxdxnZd/2/為便于記憶和理解,將 的置信區(qū)間表示為如下形式: 有11) / 2/nZx其中 d 稱為估計的允許誤差允許誤差。 總體均值的區(qū)間估計總體均值的區(qū)間估計(例題分析例題分析)【 例 】一家食

9、品生產(chǎn)企業(yè)以生產(chǎn)袋裝食品為主,為對產(chǎn)量質(zhì)量進(jìn)行監(jiān)測,企業(yè)質(zhì)檢部門經(jīng)常要進(jìn)行抽檢,以分析每袋重量是否符合要求?,F(xiàn)從某天生產(chǎn)的一批食品中隨機(jī)抽取了25袋,測得每袋重量(單位:g)如下表所示。已知產(chǎn)品重量的分布服從正態(tài)分布,且總體標(biāo)準(zhǔn)差為10g。試估計該批產(chǎn)品平均重量的置信區(qū)間,置信水平為95%25袋食品的重量袋食品的重量 112.5101.0103.0102.0100.5102.6107.5 95.0108.8115.6100.0123.5102.0101.6102.2116.6 95.4 97.8108.6105.0136.8102.8101.5 98.4 93.340總體均值的區(qū)間估計總體均值

10、的區(qū)間估計(例題分析例題分析)【例例】一家保險公司收集到由一家保險公司收集到由3636投保個人組成的隨機(jī)投保個人組成的隨機(jī)樣本,得到每個投保人的年齡樣本,得到每個投保人的年齡( (單位:周歲單位:周歲) )數(shù)據(jù)如下數(shù)據(jù)如下表。試建立投保人年齡表。試建立投保人年齡90%90%的置信區(qū)間的置信區(qū)間 36個投保人年齡的數(shù)據(jù)個投保人年齡的數(shù)據(jù) 23353927364436424643313342534554472434283936444039493834485034394548453242總體均值的區(qū)間估計總體均值的區(qū)間估計 (正態(tài)總體、正態(tài)總體、 未知、小樣本未知、小樣本)4445 t(n-1),

11、) ,(dxdxnSntd/) 1(2/nSXt/設(shè)總體 XN( , 2 ),X和 S2 分別為樣本均值和樣本方差。由此可得 的置信度為 1- 的置信區(qū)間為因此,對給定的置信度 1-,有1)1(/) 1(2/2/ntnSXntP1/) 1(/) 1(2/2/nSntXnSntXP即X1, X2, , Xn 為 X 的容量為 n 的樣本,可以證明:46Y/nXt3. t 分布分布設(shè) XN(0, 1),Y 2(n), 且 X 與 Y 相互獨(dú)立, 則隨機(jī)變量服從自由度為 n 的 t 分布分布,記為 tt(n)。 47t 分布密度函數(shù)的圖形分布密度函數(shù)的圖形標(biāo)準(zhǔn)正態(tài)分布分布是 t 分布的極限分布。當(dāng)

12、n 很大時,t 分布近似于標(biāo)準(zhǔn)正態(tài)分布。 xf (x)0n = 1n = 4n = 10n = ,N (0, 1)480 xf (x)t 分布的右側(cè)分布的右側(cè) 分位點(diǎn)分位點(diǎn) t (n) t(n)為 t 分布中滿足下式的右側(cè) 分位點(diǎn): P t t ( n ) = 由給定的概率 ,可查表得到 t(n)。 由 t 分布的對稱性,可得:t1-(n)=-t(n)。t(n)t1-(n)= - t(n) 49可用 Excel 的統(tǒng)計函數(shù) TINV 返回 t (n)。語法規(guī)則如下:格式:TINV( 2 , n )功能:返回 t (n)的值。說明:TINV(, n )返回的是 t/2(n)的值。用 Excel

13、求 t /2(n)t t 分布分布x51niiX12若對于隨機(jī)變量 X1, X2, , Xn,存在一組不全為零的常數(shù) c1, c2, , cn, 使c1 X1+ c2 X2 + + cn Xn = 0則稱變量 X1, X2, , Xn 線性相關(guān),或稱它們間存在一個線性約束條件; 若 X1, X2, , Xn 間存在 k 個獨(dú)立的線性約束條件,則它們中僅有 n-k 個獨(dú)立的變量,并稱平方和的自由度為 n-k?!白杂啥茸杂啥取钡暮x的含義自由度是指附加給獨(dú)立的觀測值的約束或限制的個數(shù)從字面涵義來看,自由度是指一組數(shù)據(jù)中可以自由取值的個數(shù)當(dāng)樣本數(shù)據(jù)的個數(shù)為n時,若樣本平均數(shù)確定后,則附加給n個觀測值

14、的約束個數(shù)就是1個,因此只有n-1個數(shù)據(jù)可以自由取值,其中必有一個數(shù)據(jù)不能自由取值按著這一邏輯,如果對n個觀測值附加的約束個數(shù)為k個,自由度則為n-k樣本有3個數(shù)值,即x1=2,x2=4,x3=9,則 x = 5。當(dāng) x = 5 確定后,x1,x2和x3有兩個數(shù)據(jù)可以自由取值,另一個則不能自由取值,比如x1=6,x2=7,那么x3則必然取2,而不能取其他值為什么樣本方差的自由度是n-1呢?因?yàn)樵谟嬎汶x差平方和時,必須先求出樣本均值x ,而x則是附加給離差平方和的一個約束,因此,計算離差平方和時只有n-1個獨(dú)立的觀測值,而不是n個 樣本方差用自由度去除,其原因可從多方面解釋,從實(shí)際應(yīng)用角度看,在

15、抽樣估計中,當(dāng)用樣本方差s2去估計總體方差2時,它是2的無偏估計量t t 分布分布( (用用ExcelExcel生成生成t t分布的臨界值表分布的臨界值表) )t t 分布分布( (用用ExcelExcel繪制繪制t t分布圖分布圖) )第第1步:步:在工作表的第1列A2:A62輸入一個等差數(shù)列,初始值為“-3”,步長為“0.1”,終值為“3”第第2步:步:在單元格C1輸入t分布的自由度(如“20”) 第第3步:步:在單元格B2輸入公式“=TDIST(-A2,$C$1,1)”,并將其復(fù)制到B3:B32區(qū)域,在B33輸入公式 “=TDIST(A33,$C$1,1)”并將其復(fù)制到B34:B62區(qū)域

16、第第4步:步:在單元格C3輸入公“=(B3-B2)*10”,并將其復(fù)制到C4:C31區(qū)域,在單元格C32輸入公式“=(B32-B33)*10”并將其復(fù)制到C33:C61區(qū)域第第5步:步:將A2:A62作為橫坐標(biāo),C2:C62作為縱坐標(biāo),根據(jù) “圖表向?qū)А崩L制折線圖5758總體比例的區(qū)間估計總體比例的區(qū)間估計1.1. 假定條件假定條件總體服從二項(xiàng)分布可以由正態(tài)分布來近似2.2.使用正態(tài)分布統(tǒng)計量使用正態(tài)分布統(tǒng)計量 z z3. 總體比例在1-置信水平下的置信區(qū)間為61用樣本比例代替總體比例用樣本比例代替總體比例,設(shè)總體比例為 P, 則當(dāng) nP 和 n (1-P) 都大于5時,樣本成數(shù) p 近似服從

17、均值為 P, 方差為 P (1-P)/n 的正態(tài)分布。從而對給定的置信度1-,由可得總體成數(shù) P 的置信度為 1- 的置信區(qū)間為近似服從N(0,1)總體比例的區(qū)間估計總體比例的區(qū)間估計( (例題分析例題分析) )【例】某城市想要估計下崗職工中女性所占的比例,隨機(jī)地抽取了100名下崗職工,其中65人為女性職工。試以95%的置信水平估計該城市下崗職工中女性比例的置信區(qū)間63【例例】某廠為了解產(chǎn)品的質(zhì)量情況,隨機(jī)抽取了300件產(chǎn)品進(jìn)行檢驗(yàn),其中有5件次品,求該廠產(chǎn)品次品率的置信度為95%的置信區(qū)間。 解解:產(chǎn)品次品率為比例, =1-0.95=0.05, /2=0.025,n=300,查表得 Z0.0

18、25=1.96, 樣本成數(shù)%67. 1300/5pnppZd/ )1 (2/300/ )0167. 01 (0167. 096. 1 該廠產(chǎn)品次品率的置信度為95%的置信區(qū)間為 ) ,(dpdp )3.12% %,22. 0(%45. 1 總體方差的區(qū)間估計總體方差的區(qū)間估計6566 設(shè)總體 XN( , 2 ),)1()1( ,)1()1(22/1222/2nSnnSn) 1(22/n/2) 1(22/1n/21-f (x)x0 從而 2 的置信度為1-的置信區(qū)間為:)1()1()1(22/2222/1nSnnP由222) 1(Sn) 1(2nX和 S2 分別為樣本均值和樣本方差。1)1()1

19、()1()1(22/12222/2nSnnSnP可得X1, X2, , Xn 為 X 的容量為n的樣本,可以證明, 1 67niiX122 2 分布分布 設(shè)總體 XN (0, 1), X1, X2, , Xn 為 X 的一個樣本,則它們的平方和為服從自由度為自由度為 n 的 2 分布,記為 2 2(n) 68 2 分布密度函數(shù)的圖形分布密度函數(shù)的圖形xf (x)on=1n=4n=10 69由給定的概率 和自由度n,可查表得到 2 分布的右側(cè)分布的右側(cè) 分分位點(diǎn)位點(diǎn)為 2分布中滿足下式的的右側(cè) 分位點(diǎn):)(2n)(2n)(2n22( ) 01Pnf (x)xo)(2n 70語法規(guī)則如下:格式:C

20、HIINV ( , n )功能:返回可用 Excel 的統(tǒng)計函數(shù) CHIINV 返回 用 Excel 求 )(2n)(2n)(2n的值??傮w方差的區(qū)間估計總體方差的區(qū)間估計( (圖示圖示) ) 2 2 2 211 2 2 2 2 2 2總體方差1 的置信區(qū)間 2 2分布的密度曲線分布的密度曲線總體方差的區(qū)間估計總體方差的區(qū)間估計( (例題分析例題分析) )【例】一家食品生產(chǎn)企業(yè)以生產(chǎn)袋裝食品為主,現(xiàn)從某天生產(chǎn)的一批食品中隨機(jī)抽取了25袋,測得每袋重量如下表所示。已知產(chǎn)品重量的分布服從正態(tài)分布。以95%的置信水平建立該種食品重量方差的置信區(qū)間 25袋食品的重量袋食品的重量 單位:單位:g112.

21、5101.0103.0102.0100.5102.6107.5 95.0108.8115.6100.0123.5102.0101.6102.2116.6 95.4 97.8108.6105.0136.8102.8101.5 98.4 93.374課堂練習(xí)課堂練習(xí)1 某車床加工的缸套外徑尺寸 X N(, 2),現(xiàn)隨機(jī)測得的 10 個加工后的某種缸套外徑尺寸(mm) 如下: 90.01,90.01,90.02,90.03,89.99 89.98,89.97,90.00,90.01,89.99( ) 求 2 的置信度為 95% 的置信區(qū)間。 2201853. 0S一個總體參數(shù)的區(qū)間估計一個總體參數(shù)的

22、區(qū)間估計( (小結(jié)小結(jié)) )均值均值比例比例方差方差大樣本大樣本小樣本小樣本大樣本大樣本 2 2分布分布 2 2已知已知 2 2已知已知Z Z分布分布 2 2未知未知Z Z分布分布Z Z分布分布Z Z分布分布 2 2未知未知t t分布分布76案例思考題案例思考題國外民意調(diào)查機(jī)構(gòu)在進(jìn)行民意調(diào)查時,通常要求在95%的置信度下將調(diào)查的允許誤差(即置信區(qū)間的 d 值)控制在3%以內(nèi)。問為滿足該調(diào)查精度要求,至少需要多大的樣本?如果要求置信度達(dá)到99%,調(diào)查誤差仍為3%,此時至少需要多大的樣本? 77nPPPp/ )1 ( ) 1 , 0( N近似服從1/ )1 (2/2/ZnPPPpZP, ) ,(d

23、pdpnppZd/ )1 (2/用樣本比例代替總體比例用樣本比例代替總體比例,設(shè)總體比例為 P, 則當(dāng) nP 和 n (1-P) 都大于5時,樣本成數(shù) p 近似服從均值為 P, 方差為 P (1-P)/n 的正態(tài)分布。從而對給定的置信度1-,由 可得總體成數(shù) P 的置信度為 1- 的置信區(qū)間為78案例思考題解答案例思考題解答(1)本案例中,可得由 / )1 ( 2/nppZd222/)1 (dppZn時,當(dāng)5 . 0 p故需要的樣本容量至少為2203. 05 . 05 . 096. 1n1 .1067(人) 1068 達(dá)到最大值, )1 (pp79案例思考題解答案例思考題解答(2)如果要求置信

24、度達(dá)到99%,則Z/2=Z0.005=2.575,2203. 05 . 05 . 0575. 2n8 .1841 (人) 1842兩個總體均值之差的區(qū)間估計兩個總體均值之差的區(qū)間估計( (獨(dú)立大樣本獨(dú)立大樣本) )兩個總體均值之差的估計兩個總體均值之差的估計( (例題分析例題分析) )【例】某地區(qū)教育管理部門想估計兩所中學(xué)的學(xué)生高考時的英語平均分?jǐn)?shù)之差,為此在兩所中學(xué)獨(dú)立抽取兩個隨機(jī)樣本,有關(guān)數(shù)據(jù)如右表所示 。建立兩所中學(xué)高考英語平均分?jǐn)?shù)之差95%的置信區(qū)間 兩個樣本的有關(guān)數(shù)據(jù)兩個樣本的有關(guān)數(shù)據(jù) 中學(xué)中學(xué)1中學(xué)中學(xué)2n1=46n1=33S1=5.8 S2=7.2861x782x兩個總體均值之差

25、的區(qū)間估計兩個總體均值之差的區(qū)間估計( (獨(dú)立小樣本獨(dú)立小樣本) )兩個總體均值之差的估計兩個總體均值之差的估計( (例題分析例題分析) )【例】為估計兩種方法組裝產(chǎn)品所需時間的差異,分別對兩種不同的組裝方法各隨機(jī)安排12名工人,每個工人組裝一件產(chǎn)品所需的時間(單位:min) 如下表。假定兩種方法組裝產(chǎn)品的時間服從正態(tài)分布,且方差相等。試以95%的置信水平建立兩種方法組裝產(chǎn)品所需平均時間差值的置信區(qū)間兩個方法組裝產(chǎn)品所需的時間兩個方法組裝產(chǎn)品所需的時間 方法方法1方法方法228.336.027.631.730.137.222.226.029.038.531.032.037.634.433.83

26、1.232.128.020.033.428.830.030.226.5兩個總體均值之差的估計兩個總體均值之差的估計( (小樣本小樣本: : 1 12 2 2 22 2 )1.1. 假定條件假定條件兩個總體都服從正態(tài)分布兩個總體方差未知且不相等:12兩個獨(dú)立的小樣本(n130和n230)2. 2. 使用統(tǒng)計量使用統(tǒng)計量兩個總體均值之差的估計兩個總體均值之差的估計( (例題分析例題分析) )【例】沿用前例。假定第一種方法隨機(jī)安排12名工人,第二種方法隨機(jī)安排8名工人,即n1=12,n2=8 ,所得的有關(guān)數(shù)據(jù)如表。假定兩種方法組裝產(chǎn)品的時間服從正態(tài)分布,且方差不相等。以95%的置信水平建立兩種方法組

27、裝產(chǎn)品所需平均時間差值的置信區(qū)間 兩個方法組裝產(chǎn)品所需的時間兩個方法組裝產(chǎn)品所需的時間 方法方法1方法方法228.336.027.631.730.137.222.226.529.038.531.037.634.433.832.128.020.028.830.030.2兩個總體均值之差的區(qū)間估計兩個總體均值之差的區(qū)間估計( (匹配樣本匹配樣本) )兩個總體均值之差的估計兩個總體均值之差的估計( (匹配大樣本匹配大樣本) )假定條件假定條件兩個匹配的大樣本(n1 30和n2 30)兩個總體各觀察值的配對差服從正態(tài)分布兩個總體均值之差兩個總體均值之差 d d = = 1 1- - 2 2在在1-1-

28、 置信水置信水平下的置信區(qū)間為平下的置信區(qū)間為假定條件假定條件兩個匹配的小樣本(n1 30和n2 30)兩個總體各觀察值的配對差服從正態(tài)分布 兩個總體均值之差兩個總體均值之差 d d= = 1 1- - 2 2在在1-1- 置信水置信水平下的置信區(qū)間為平下的置信區(qū)間為兩個總體均值之差的估計兩個總體均值之差的估計( (匹配小樣本匹配小樣本) )兩個總體均值之差的估計兩個總體均值之差的估計( (例題分析例題分析) )【例】由10名學(xué)生組成一個隨機(jī)樣本,讓他們分別采用A和B兩套試卷進(jìn)行測試,結(jié)果如右表 。試建立兩種試卷 分 數(shù) 之 差d=1-2 95%的置信區(qū)間 10名學(xué)生兩套試卷的得分名學(xué)生兩套試

29、卷的得分 學(xué)生編號學(xué)生編號試卷試卷A試卷試卷B差值差值d17871726344193726111489845691741754951-2768551387660169857781055391611101110niidddn21()6.531niiddddsn26.53(1)112.262210114.67dsdtnn兩個總體比例之差區(qū)間的估計兩個總體比例之差區(qū)間的估計1.1.假定條件假定條件兩個總體服從二項(xiàng)分布可以用正態(tài)分布來近似兩個樣本是獨(dú)立的2.2.兩個總體比例之差兩個總體比例之差 1 1- - 2 2在在1-1- 置信水平下置信水平下的置信區(qū)間為的置信區(qū)間為112212212(1)(1)

30、ppppppznn兩個總體比例之差的估計兩個總體比例之差的估計( (例題分析例題分析) )【例例】在某個電視節(jié)目的收視在某個電視節(jié)目的收視率調(diào)查中,農(nóng)村隨機(jī)調(diào)查了率調(diào)查中,農(nóng)村隨機(jī)調(diào)查了400人,有人,有32%的人收看了該節(jié)目的人收看了該節(jié)目;城市隨機(jī)調(diào)查了;城市隨機(jī)調(diào)查了500人,有人,有45%的人收看了該節(jié)目。試以的人收看了該節(jié)目。試以90%的置信水平估計城市與農(nóng)的置信水平估計城市與農(nóng)村收視率差別的置信區(qū)間村收視率差別的置信區(qū)間 45% (1 45%)32% (1 32%)45%32%1.9650040013%6.32%6.68%,19.32%兩個總體方差比的區(qū)間估計兩個總體方差比的區(qū)間估

31、計1.1. 比較兩個總體的方差比比較兩個總體的方差比用兩個樣本的方差比來判斷用兩個樣本的方差比來判斷如果S12/ S22接近于1,說明兩個總體方差很接近如果S12/ S22遠(yuǎn)離1,說明兩個總體方差之間存在差異2.2.總體方差比在總體方差比在1-1- 置信水平下的置信區(qū)間為置信水平下的置信區(qū)間為222221211222212ssssFF12122211( ,)( , )Fn nFn n1061122( ,)X / nF n nY / n 設(shè) X 2(n1) , Y 2(n2), 且 X 與 Y 相互獨(dú)立,則隨機(jī)變量n1稱為第一自由度則隨機(jī)變量,n2稱為第二自由度。107108109兩個總體方差比

32、的區(qū)間估計兩個總體方差比的區(qū)間估計( (圖示圖示) )FF1 2F 2總體方差比1的置信區(qū)間方差比置信區(qū)間示意圖方差比置信區(qū)間示意圖兩個總體方差比的區(qū)間估計兩個總體方差比的區(qū)間估計( (例題分析例題分析) )【例】為了研究男女學(xué)生在生活費(fèi)支出(單位:元)上的差異,在某大學(xué)各隨機(jī)抽取25名男學(xué)生和25名女學(xué)生,得到下面的結(jié)果 男學(xué)生: 女學(xué)生: 試以90%置信水平估計男女學(xué)生生活費(fèi)支出方差比的置信區(qū)間 兩個總體參數(shù)的區(qū)間估計兩個總體參數(shù)的區(qū)間估計( (小結(jié)小結(jié)) )均值差均值差比例差比例差方差比方差比獨(dú)立大樣本獨(dú)立大樣本獨(dú)立小樣本獨(dú)立小樣本匹配樣本匹配樣本獨(dú)立大樣本獨(dú)立大樣本 1 12 2、 2

33、 22 2已知已知 1 12 2、 2 22 2未知未知Z Z分布分布Z Z分布分布 1 12 2、 2 22 2已知已知 1 12 2、 2 22 2未知未知Z Z分布分布 1 12 2= = 2 22 2 1 12 2 2 22 2正態(tài)總體正態(tài)總體F F分布分布Z Z分布分布t t分布分布t t分布分布t分布分布1146.3 樣本容量確定樣本容量確定前面的分析都是在給定的樣本容量和樣本數(shù)據(jù)下求置信區(qū)間。但在實(shí)際應(yīng)用中,應(yīng)當(dāng)在隨機(jī)抽樣前就確定所需抽取的樣本容量。抽取的樣本容量過大,雖然可以提高統(tǒng)計推斷的精度,但將增加不必要的人力、物力、費(fèi)用和時間開支;如果抽取的樣本容量過小,則又會使統(tǒng)計推斷

34、的誤差過大,推斷結(jié)果就達(dá)不到必要的精度要求。確定樣本容量的基本原則確定樣本容量的基本原則:在滿足所需的置信度在滿足所需的置信度和允許誤差條件和允許誤差條件(置信區(qū)間的置信區(qū)間的 d 值值)下,確定所需的最下,確定所需的最低樣本容量低樣本容量 1151.總體均值區(qū)間估計時樣本容量的確定總體均值區(qū)間估計時樣本容量的確定在給定置信度和允許誤差 d 的條件下,由nSntd/) 1(2/可得22/) 1(dSntn22/dz 其中總體標(biāo)準(zhǔn)差或樣本標(biāo)準(zhǔn)差也是未知的,通??梢韵韧ㄟ^小規(guī)模抽樣作出估計。 由于使用的是近似公式,可知實(shí)際采用的最低樣本容量應(yīng)比計算結(jié)果稍大。 22/dSz116【例6】在例在例3

35、元件平均壽命的區(qū)間估計問題中,要求元件平均壽命的區(qū)間估計問題中,要求在95%的置信度下,使估計的允許誤差不超過其平均壽命的10%,并設(shè)已得到例1的先期抽樣數(shù)據(jù)。求所需的最低樣本容量。其他條件不變,在99%的置信度下求所需最低樣本容量。解解:由例1,, 1 .1423x2025. 0dSznS=196.5,d = 1423/10 =142.3 可知取 n =10 已能滿足所給精度要求。 23 .1425 .19696. 183 . 72005. 0dSzn23 .1425 .19658. 2137 .12 可知此時取 n =20 就能滿足所給精度要求。 在總體均值的區(qū)間估計中,通常在總體均值的區(qū)

36、間估計中,通常 n =30 就稱為大樣本就稱為大樣本。在大樣本時,無論總體服從什么分布,都可用前述公式進(jìn)在大樣本時,無論總體服從什么分布,都可用前述公式進(jìn)行區(qū)間估計行區(qū)間估計。 1172.總體比例區(qū)間估計時樣本容量的確定總體比例區(qū)間估計時樣本容量的確定其中樣本成數(shù) p 同樣可先通過小規(guī)模抽樣作出估計,也可根據(jù)其他信息估計,或取 0.5。 ,由 / )1 ( 2/nppZd222/)1 (dppZn可得118【例7】某企業(yè)要重新制定產(chǎn)品抽樣檢驗(yàn)的規(guī)范。已知過去檢驗(yàn)的次品率在3.6%左右,現(xiàn)要求允許誤差不超過2%,置信度為95%。問每次至少應(yīng)抽查多少產(chǎn)品?解解:由題意,要推斷的是總體成數(shù),p =0

37、.036,1-p = 0.964,d = 0.02, = 0.05,z/2 = z0.025 = 1.96故每次至少應(yīng)抽查 334 件產(chǎn)品。由此可知,由此可知,在總體比例的區(qū)間估計問題中,要達(dá)在總體比例的區(qū)間估計問題中,要達(dá)到一定的精度要求,樣本到一定的精度要求,樣本容量至少要在幾百以上容量至少要在幾百以上。 2202. 0964. 0036. 096. 1)( 3 .333件222/)1 (dppZn設(shè)設(shè)n1和和n2為來自兩個總體的樣本,并假定為來自兩個總體的樣本,并假定n1=n2根據(jù)均值之差的區(qū)間估計公式可得兩個樣本根據(jù)均值之差的區(qū)間估計公式可得兩個樣本的容量的容量n為為22122Ezn3.估計兩個總體均值之差時樣本容量的確定估計兩個總體均值之差時樣本容量的確定估計兩個總體均值之差時樣本容量的確定估計兩個總體均值之差時樣本容量的確定(例題分析例題分析)【例】一所中學(xué)的教務(wù)處想要估計試驗(yàn)班和普通班考試成績平均分?jǐn)?shù)差值的置信區(qū)間。要求置信水平為95%,預(yù)先估計兩個班考試分?jǐn)?shù)的方差分別為:試驗(yàn)班12=90

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負(fù)責(zé)。
  • 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時也不承擔(dān)用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

評論

0/150

提交評論