第5章抽樣與參數(shù)估計-課件_第1頁
第5章抽樣與參數(shù)估計-課件_第2頁
第5章抽樣與參數(shù)估計-課件_第3頁
第5章抽樣與參數(shù)估計-課件_第4頁
第5章抽樣與參數(shù)估計-課件_第5頁
已閱讀5頁,還剩111頁未讀, 繼續(xù)免費閱讀

下載本文檔

版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進行舉報或認(rèn)領(lǐng)

文檔簡介

1、第 5 章 抽樣與參數(shù)估計統(tǒng)計學(xué)Statistics第 5 章 抽樣與參數(shù)估計5.1 抽樣及其分布5.2 點估計5.3 單個總體參數(shù)的區(qū)間估計5.4 兩個總體參數(shù)的區(qū)間估計附錄: Excel的應(yīng)用學(xué)習(xí)目標(biāo)1 了解抽樣和抽樣分布的基本概念2 了解點估計的概念和估計量的優(yōu)良標(biāo)準(zhǔn)3 掌握總體均值、總體比例和總體方差的區(qū)間估計掌握樣本容量的確定掌握Excel的應(yīng)用5.1 抽樣及其分布1. 抽樣推斷2幾個基本概念 總體個體 樣本 統(tǒng)計量 抽樣單元與抽樣框3. 抽樣組織方式4 抽樣分布抽樣推斷的概念抽樣推斷是指根據(jù)隨機原則,從總體中抽取一部分單位進行觀察,并依據(jù)所獲得數(shù)據(jù)的處理結(jié)果,對總體的數(shù)量特征做出具

2、有一定可靠程度的估計和判斷,從而達到對總體的分布狀況及其數(shù)量特征認(rèn)識的目的。抽樣推斷的類型參數(shù)估計:根據(jù)從總體中抽取的樣本估計總體分布中包含的未知參數(shù)的方法。 假設(shè)檢驗:根據(jù)樣本信息對研究總體的數(shù)量規(guī)律是否具有某種指定特征進行檢驗。抽樣推斷的應(yīng)用場合(1)用于無法采用或不必采用全面調(diào)查的 現(xiàn)象;(2)對全面調(diào)查的結(jié)果進行復(fù)核;(3)生產(chǎn)過程的質(zhì)量控制;(4)對總體的假設(shè)進行檢驗。總體和個體(概念要點)1具體含義 總體(Population):調(diào)查研究的事物或現(xiàn)象的全體。例如:全部居民、所有產(chǎn)品 個體(Item unit): 組成總體的每個元素2抽象含義 總體(Population):調(diào)查研究中

3、所關(guān)心的作為隨機變量的統(tǒng)計指標(biāo)。例如居民收入、產(chǎn)品壽命 個體(Item unit): 統(tǒng)計指標(biāo)所取得每個可能值樣本(Sample)1樣本(Sample):從總體中所抽取的部分個體2樣本容量(Sample size):樣本中所含個體的數(shù)量3樣本選取的基本原則: 代表性:樣本的每個分量都與總體有相同的分布 獨立性:樣本的每個分量都是相互獨立的。即要求觀察結(jié)果之間互不影響。 4簡單隨機樣本:滿足代表性和獨立性的樣本5簡單隨機抽樣:獲得簡單隨機樣本的方法一次失敗的統(tǒng)計調(diào)查在1936年的美國總統(tǒng)選舉前,一份名為 Literary Digest 的雜志進行了一次民意調(diào)查。調(diào)查的焦點是誰將成為下一屆總統(tǒng)的挑

4、戰(zhàn)者,是堪薩斯州州長Alf Landon,還是現(xiàn)任總統(tǒng) Franklin Delano Roosevelt。為了解選民意向,民意調(diào)查專家們根據(jù)電話簿和車輛登記簿上的名單給一大批人發(fā)了簡單的調(diào)查表(電話和汽車在1936年并不像現(xiàn)在那樣普及,但是這些名單比較容易得到)。盡管發(fā)出的調(diào)查表大約有一千萬張,但收回的比例并不高。在收回的調(diào)查表中,Alf Landon非常受歡迎。于是該雜志預(yù)測 Landon 將贏得選舉。但事實上是Franklin Roosevelt贏得了這次選舉失敗的原因在經(jīng)濟大蕭條時期調(diào)查有電話和汽車的人們,并不能夠反映全體選民的觀點。此外,只有少數(shù)的問卷被收回。這些都是值得懷疑的抽樣單

5、元與抽樣框抽樣單元(Sampling unit):將總體劃分成互不重迭且又窮盡的若干部分,每個部分稱為一個抽樣單元每個抽樣單元都是由若干個體組成的集合只由一個個體組成就稱為最小抽樣單元 抽樣單元可以是自然形成的,也可以是人為劃定的 抽樣框(Sampling frame):關(guān)于抽樣單元的名冊或清單上一級別的某個抽樣單元被抽中,必須在下一級別抽樣框中連續(xù)抽樣有效的抽樣框所包含的抽樣單元應(yīng)既無遺漏又無重復(fù)參數(shù)與統(tǒng)計量例:設(shè) 是總體 容量為n的樣本,則樣本均值(Sample mean):樣本方差(Sample variance):階原點矩(Moment of order ):都是統(tǒng)計量統(tǒng)計量是不含任何

6、未知參數(shù)的樣本函數(shù)。由樣本構(gòu)造統(tǒng)計量,實際上是對樣本所含總體的信息提煉加工;根據(jù)不同的推斷要求,可以構(gòu)造不同的統(tǒng)計量。 抽樣組織方式 抽樣組織方式概率抽樣(probability sampling)也稱隨機抽樣特點:按一定的概率以隨機原則抽取樣本抽取樣本時使每個單位都有一定的機會被抽中每個單位被抽中的概率是已知的,或是可以計算出來的 當(dāng)用樣本對總體目標(biāo)量進行估計時,要考慮到每個樣本單位被抽中的概率簡單隨機抽樣(simple random sampling)從總體N個單位中隨機地抽取n個單位作為樣本,使得每一個容量為樣本都有相同的機會(概率)被抽中. 特點簡單、直觀,在抽樣框完整時,可直接從中抽

7、取樣本用樣本統(tǒng)計量對目標(biāo)量進行估計比較方便 是最基本的抽樣方法,并且是其它抽樣方法的基礎(chǔ)3. 局限性當(dāng)N很大時,不易構(gòu)造抽樣框抽出的單位很分散,給實施調(diào)查增加了困難沒有利用其他輔助信息以提高估計的效率抽樣方法抽取元素的具體方法有重復(fù)抽樣和不重復(fù)抽樣(1)重復(fù)抽樣(有放回的抽樣)是從N個總體單位中抽取一個單位進行觀察、紀(jì)錄后,再放回總體中,然后再抽取下一個單位,這樣連續(xù)抽取n個單位組成樣本的方法。 (2)不重復(fù)抽樣(無放回抽樣)是從N個總體單位中抽取一個單位進行觀察、紀(jì)錄后,不放回總體中,在余下的總體中抽取下一個單位,這樣連續(xù)抽取n個單位組成樣本的方法。 根據(jù)對樣本的要求不同,又分考慮順序的抽樣

8、和不考慮順序的抽樣抽樣方法的不同,獲得樣本的可能數(shù)目也不同.樣本的可能數(shù)目(1)考慮順序的不重復(fù)抽樣,樣本的可能數(shù)目為:(2)考慮順序的重復(fù)抽樣,樣本的可能數(shù)目為:(3)不考慮順序的不重復(fù)抽樣,樣本的可能數(shù)目為:(4)不考慮順序的重復(fù)抽樣,樣本的可能數(shù)目為:分層抽樣(分類抽樣、類型抽樣)(stratified sampling)將抽樣單位按某種特征或某種規(guī)則劃分為不同的層,然后從不同的層中獨立、隨機地抽取樣本.優(yōu)點:保證樣本的結(jié)構(gòu)與總體的結(jié)構(gòu)比較相近,從而提高估計的精度組織實施調(diào)查方便既可以對總體參數(shù)進行估計,也可以對各層的目標(biāo)量進行估計系統(tǒng)抽樣(機械抽樣、等距抽樣)(systematic s

9、ampling)將總體中的所有單位(抽樣單位)按一定順序排列,在規(guī)定的范圍內(nèi)隨機地抽取一個單位作為初始單位,然后按事先規(guī)定好的規(guī)則確定其他樣本單位.先從數(shù)字1到k之間隨機抽取一個數(shù)字r作為初始單位,以后依次取r+k,r+2k等單位優(yōu)點:操作簡便,可提高估計的精度缺點:對估計量方差的估計比較困難整群抽樣(cluster sampling)將總體中若干個單位合并為組(群),抽樣時直接抽取群,然后對中選群中的所有單位全部實施調(diào)查.特點:抽樣時只需群的抽樣框,可簡化工作量調(diào)查的地點相對集中,節(jié)省調(diào)查費用,方便調(diào)查的實施.缺點是估計的精度較差.二階抽樣與多階段抽樣(two&multi-stage sam

10、pling)先抽取群,但并不是調(diào)查群內(nèi)的所有單位,而是再進行一步抽樣,從選中的群中抽取出若干個單位進行調(diào)查群是初級抽樣單位,第二階段抽取的是最終抽樣單位。將該方法推廣,使抽樣的段數(shù)增多,就稱為多階段抽樣不需要對每個高級別的抽樣單元建立關(guān)于低級別抽樣單元的抽樣框,節(jié)約調(diào)查費用需要包含所有低階段抽樣單位的抽樣框;同時由于實行了再抽樣,使調(diào)查單位在更廣泛的范圍內(nèi)展開在大規(guī)模的抽樣調(diào)查中,經(jīng)常被采用的方法 抽樣分布抽樣分布 (sampling distribution)樣本統(tǒng)計量的概率分布,是一種理論分布在重復(fù)選取容量為n的樣本時,由該統(tǒng)計量的所有可能取值形成的相對頻數(shù)分布 樣本統(tǒng)計量是隨機變量樣本均

11、值, 樣本比例,樣本方差等結(jié)果來自容量相同的所有可能樣本提供了樣本統(tǒng)計量長遠(yuǎn)而穩(wěn)定的信息,是進行推斷的理論基礎(chǔ),也是抽樣推斷科學(xué)性的重要依據(jù) 抽樣分布的形成過程 (sampling distribution)總體計算樣本統(tǒng)計量如:樣本均值、比例、方差樣本樣本均值的抽樣分布樣本均值的抽樣分布在重復(fù)選取容量為n的樣本時,由樣本均值的所有可能取值形成的相對頻數(shù)分布一種理論概率分布推斷總體均值的理論基礎(chǔ)樣本均值的抽樣分布 (例題分析)【例】設(shè)一個總體,含有4個元素(個體) ,即總體單位數(shù)N=4。4 個個體分別為x1=1,x2=2,x3=3,x4=4 。總體的均值、方差及分布如下總體分布14230.1.

12、2.3均值和方差樣本均值的抽樣分布 (例題分析) 現(xiàn)從總體中抽取n2的簡單隨機樣本,在重復(fù)抽樣條件下,共有42=16個樣本。所有樣本的結(jié)果為3,43,33,23,132,42,32,22,124,44,34,24,141,441,33211,21,11第二個觀察值第一個觀察值所有可能的n = 2 的樣本(共16個)樣本均值的抽樣分布 (例題分析) 計算出各樣本的均值,如下表。并給出樣本均值的抽樣分布3.53.02.52.033.02.52.01.524.03.53.02.542.542.03211.51.01第二個觀察值第一個觀察值16個樣本的均值(x)x樣本均值的抽樣分布1.000.10.2

13、0.3P ( x )1.53.04.03.52.02.5樣本均值的分布與總體分布的比較 (例題分析) = 2.5 2 =1.25總體分布14230.1.2.3抽樣分布P ( x )1.00.1.2.31.53.04.03.52.02.5x樣本均值的抽樣分布與中心極限定理 = 50 =10X總體分布n = 4抽樣分布xn =16當(dāng)總體服從正態(tài)分布N(,2)時,來自該總體的所有容量為n的樣本的均值x也服從正態(tài)分布,x 的數(shù)學(xué)期望為,方差為2/n。即xN(,2/n)中心極限定理(central limit theorem)當(dāng)樣本容量足夠大時(n 30) ,樣本均值的抽樣分布逐漸趨于正態(tài)分布中心極限定

14、理:設(shè)從均值為,方差為 2的一個任意總體中抽取容量為n的樣本,當(dāng)n充分大時,樣本均值的抽樣分布近似服從均值為、方差為2/n的正態(tài)分布一個任意分布的總體x中心極限定理 (central limit theorem)x 的分布趨于正態(tài)分布的過程抽樣分布與總體分布的關(guān)系總體分布正態(tài)分布非正態(tài)分布大樣本小樣本正態(tài)分布正態(tài)分布非正態(tài)分布樣本均值的數(shù)學(xué)期望樣本均值的方差重復(fù)抽樣不重復(fù)抽樣樣本均值的抽樣分布(數(shù)學(xué)期望與方差)樣本均值的抽樣分布(數(shù)學(xué)期望與方差)比較及結(jié)論:1. 樣本均值的均值(數(shù)學(xué)期望) 等于總體均值 2. 樣本均值的方差等于總體方差的1/n樣本比例的抽樣分布總體(或樣本)中具有某種屬性的單

15、位與全部單位總數(shù)之比不同性別的人與全部人數(shù)之比合格品(或不合格品) 與全部產(chǎn)品總數(shù)之比總體比例可表示為樣本比例可表示為比例(proportion)在重復(fù)選取容量為n的樣本時,由樣本比例的所有可能取值形成的相對頻數(shù)分布一種理論概率分布當(dāng)樣本容量很大時,樣本比例的抽樣分布可用正態(tài)分布近似 推斷總體比例的理論基礎(chǔ)樣本比例的抽樣分布樣本比例的數(shù)學(xué)期望樣本比例的方差重復(fù)抽樣不重復(fù)抽樣樣本比例的抽樣分布(數(shù)學(xué)期望與方差)5.2 點估計點估計的常用方法衡量估計量的標(biāo)準(zhǔn)參數(shù)估計概述參數(shù)估計概述統(tǒng)計估計: 研究由樣本估計總體的未知分布或 分布中的未知參數(shù)2. 非參數(shù)估計:直接對總體未知分布的估計3. 參數(shù)估計:

16、 總體分布類型已知,僅需對分布的 未知參數(shù)進行的估計參數(shù)估計的基本方法參數(shù)估計的方法矩估計法最小二乘法最大似然法順序統(tǒng)計量法估 計 方 法點 估 計區(qū)間估計估計量:用于估計總體參數(shù)的隨機變量如樣本均值,樣本比例、樣本方差等例如: 樣本均值就是總體均值 的一個估計量參數(shù)用 表示,估計量用 表示估計值:估計參數(shù)時計算出來的統(tǒng)計量的具體值如果樣本均值 x =80,則80就是的估計值估計量與估計值 (estimator & estimated value)點估計 (point estimate)1. 點估計量:設(shè)總體 的分布類型已知,但包含未知參數(shù),從總體中抽取一個簡單隨機樣本 ,構(gòu)造一個適當(dāng)?shù)慕y(tǒng)計量

17、 作為的估計,稱 為未知參數(shù)的點估計量 2. 用樣本的估計量直接作為總體參數(shù)的估計值例如:用樣本均值直接作為總體均值的估例如:用兩個樣本均值之差直接作為總體均值之差的估計3. 沒有給出估計值接近總體未知參數(shù)程度的信息點估計的常用方法(一)矩法估計 用總體矩對應(yīng)的樣本矩作為其點估計量。(二)極大似然估計 評價估計量的標(biāo)準(zhǔn)無偏性(unbiasedness)P( )BA無偏有偏設(shè)是未知參數(shù)的一個點估計量,若滿足則稱是的無偏估計量,否則稱為有偏估計量有效性(efficiency)有效性:對同一總體參數(shù)的兩個無偏點估計 量,有更小標(biāo)準(zhǔn)差的估計量更有效 AB 的抽樣分布 的抽樣分布P( )一致性(cons

18、istency)一致性:隨著樣本容量的增大,估計量的 值越來越接近被估計的總體參數(shù)AB較小的樣本容量較大的樣本容量P( )均方誤差準(zhǔn)則(Mean square error)是參數(shù)的兩個估計量,若對的一切可能值,設(shè)且嚴(yán)格不等式至少對參數(shù)的某個可能值成立,則稱在均方誤優(yōu)于,差意義下注:均方誤差準(zhǔn)則計量取值“集中”于參數(shù)真值得的程度5.3 單個總體參數(shù)的區(qū)間估計1. 總體均值的區(qū)間估計2. 總體比例的區(qū)間估計3. 總體方差的區(qū)間估計區(qū)間估計 (interval estimate)在點估計的基礎(chǔ)上,給出總體參數(shù)估計的一個區(qū)間范圍,該區(qū)間由樣本統(tǒng)計量加減抽樣誤差而得到的根據(jù)樣本統(tǒng)計量的抽樣分布能夠?qū)颖?/p>

19、統(tǒng)計量與總體參數(shù)的接近程度給出一個概率度量比如,某班級平均分?jǐn)?shù)在7585之間,置信水平是95% 樣本統(tǒng)計量 (點估計)置信區(qū)間置信下限置信上限置信區(qū)間 (confidence interval)設(shè)是未知參數(shù), 是來自總體的樣本,構(gòu)造兩個統(tǒng)計量 , ,對于給定的(0 1),若 、 滿足: 則稱隨機區(qū)間是參數(shù)置信水平為(1 - 的置信區(qū)間,(1 - 稱為的置信系數(shù),、稱為置信限。將構(gòu)造置信區(qū)間的步驟重復(fù)很多次,置信區(qū)間包含總體參數(shù)真值的次數(shù)所占的比例稱為置信水平.(樣本的估計值接近于總體參數(shù)的概率) 表示為 (1 - 為是總體參數(shù)未在區(qū)間內(nèi)的比例常用的置信水平值有 99%, 95%, 90%相應(yīng)的

20、 為0.01,0.05,0.10置信水平 2. 區(qū)間寬度為隨機變量,置信區(qū)間為隨機區(qū)間置信水平描述了估計的可靠度,區(qū)間寬度描述 了估計的精度 4. 用一個具體的樣本所構(gòu)造的區(qū)間是一個特定的區(qū)間,我們無法知道這個樣本所產(chǎn)生的區(qū)間是否包含總體參數(shù)的真值我們只能是希望這個區(qū)間是大量包含總體參數(shù)真值的區(qū)間中的一個,但它也可能是少數(shù)幾個不包含參數(shù)真值的區(qū)間中的一個置信區(qū)間與置信水平 置信區(qū)間與置信水平 均值的抽樣分布(1 - ) % 區(qū)間包含了 % 的區(qū)間未包含1 a a /2a /2影響區(qū)間寬度的因素1.總體數(shù)據(jù)的離散程度,用 來測度樣本容量,3.置信水平 (1 - ),影響 z 的大小總體均值區(qū)間估

21、計的圖示x95% 的樣本 -1.96 x +1.96x99% 的樣本 - 2.58x + 2.58x90%的樣本 -1.65 x +1.65x總體均值的區(qū)間估計總體均值的區(qū)間估計(正態(tài)總體且 已知或非正態(tài)總體、 未知、大樣本)1.假定條件總體服從正態(tài)分布,且方差() 已知如果不是正態(tài)分布,可由正態(tài)分布來近似 (n 30)使用正態(tài)分布統(tǒng)計量 z總體均值 在1- 置信水平下的置信區(qū)間為總體均值的區(qū)間估計(例題分析)【 例 5.3.1】保險公司從投保人中隨機抽取36人,計算得36人的平均年齡 歲,已知投保人平均年齡近似服從正態(tài)分布,標(biāo)準(zhǔn)差為7.2歲,試求全體投保人平均年齡的置信水平為99%的置信區(qū)間

22、 解:已知n=36, 1- = 99%,z/2=2.575。根據(jù)樣本數(shù)據(jù)計算得:總體均值在1-置信水平下的置信區(qū)間為故全體投保人平均年齡的置信水平為99%的置信區(qū)間為36.41,52.59總體均值的區(qū)間估計(例題分析)【 例5.3.2 】一家食品公司,每天大約生產(chǎn)袋裝食品若干,按規(guī)定每袋的重量應(yīng)為100g。為對產(chǎn)品質(zhì)量進行檢測,該企業(yè)質(zhì)檢部門采用抽樣技術(shù),每天抽取一定數(shù)量的食品,以分析每袋重量是否符合質(zhì)量要求?,F(xiàn)從某一天生產(chǎn)的一批食品8000袋中隨機抽取了25袋(不重復(fù)抽樣),測得它們的重量如下表所示,已知產(chǎn)品重量服從正態(tài)分布,且總體方差為100g。試估計該批產(chǎn)品平均重量的置信區(qū)間,置信水平為

23、95。 25袋食品的重量 112.5101.0103.0102.0100.5102.6107.5 95.0108.8115.6100.0123.5102.0101.6102.2116.6 95.4 97.8108.6105.0136.8102.8101.5 98.4 93.3總體均值的區(qū)間估計(例題分析)解:已知N(,102),n=25, 1- = 95%,z/2=1.96。根據(jù)樣本數(shù)據(jù)計算得: 總體均值在1-置信水平下的置信區(qū)間為該食品平均重量的置信區(qū)間為101.4459g109.2741g注:在不重復(fù)抽樣條件下,置信區(qū)間取總體均值的區(qū)間估計(例題分析)【例5.3.3】一家保險公司收集到由3

24、6投保個人組成的隨機樣本,得到每個投保人的年齡(周歲)數(shù)據(jù)如下表。試建立投保人年齡90%的置信區(qū)間 36個投保人年齡的數(shù)據(jù) 233539273644364246433133425345544724342839364440394938344850343945484532總體均值的區(qū)間估計(例題分析)解:已知n=36, 1- = 90%,z/2=1.645。根據(jù)樣本數(shù)據(jù)計算得: , 總體均值在1- 置信水平下的置信區(qū)間為投保人平均年齡的置信區(qū)間為37.37歲41.63歲總體均值的區(qū)間估計 (正態(tài)總體、方差未知、小樣本)1.假定條件總體服從正態(tài)分布,且方差() 未知小樣本 (n 30)使用 t 分布

25、統(tǒng)計量總體均值 在1-置信水平下的置信區(qū)間為t 分布 t 分布是類似正態(tài)分布的一種對稱分布,它通常要比正態(tài)分布平坦和分散。一個特定的分布依賴于稱之為自由度的參數(shù)。隨著自由度的增大,分布也逐漸趨于正態(tài)分布 xt 分布與標(biāo)準(zhǔn)正態(tài)分布的比較t 分布標(biāo)準(zhǔn)正態(tài)分布t不同自由度的t分布標(biāo)準(zhǔn)正態(tài)分布t (df = 13)t (df = 5)z總體均值的區(qū)間估計(例題分析)【例5.3.4】已知某種燈泡的壽命服從正態(tài)分布,現(xiàn)從一批燈泡中隨機抽取16只,測得其使用壽命(小時)如下。建立該批燈泡平均使用壽命95%的置信區(qū)間16燈泡使用壽命的數(shù)據(jù) 15101520148015001450148015101520148

26、01490153015101460146014701470總體均值的區(qū)間估計(例題分析)解:已知N(,2),n=16, 1- = 95%,t/2=2.131 根據(jù)樣本數(shù)據(jù)計算得: , 總體均值在1-置信水平下的置信區(qū)間為該種燈泡平均使用壽命的置信區(qū)間為1476.8小時1503.2小時總體比例的區(qū)間估計總體比例的區(qū)間估計假定條件:大樣本條件下,樣本比例的抽樣分布可以由正態(tài)分 布來近似使用正態(tài)分布統(tǒng)計量 z3. 總體比例在1-置信水平下的置信區(qū)間為總體比例的區(qū)間估計(例題分析)【例5.3.5】某城市想要估計下崗職工中女性所占的比例,隨機地抽取了100名下崗職工,其中65人為女性職工。試以95%的置

27、信水平估計該城市下崗職工中女性比例的置信區(qū)間解:已知 n=100,p65% , 1- = 95%,z/2=1.96該城市下崗職工中女性比例的置信區(qū)間為55.65%74.35% 總體比例的區(qū)間估計(例題分析)【 例 5.3.6】某企業(yè)共有職工1000人,企業(yè)準(zhǔn)備實行一項改革,在職工中征求意見,采用不重復(fù)抽樣方法,隨機抽取200人作為樣本,調(diào)查結(jié)果顯示,由150人表示贊成這項改革,有50人表示反對。試以95的置信水平確定贊成改革的人數(shù)比例的置信區(qū)間 解:已知n=200,z/2=1.96,p75% 。根據(jù)樣本數(shù)據(jù)計算得總體均值在1-置信水平下的置信區(qū)間為95的置信水平下估計贊成改革的人數(shù)比例的置信區(qū)

28、間為69.63%80.37% 總體方差的區(qū)間估計總體方差的區(qū)間估計1.估計一個總體的方差或標(biāo)準(zhǔn)差2.假設(shè)總體服從正態(tài)分布總體方差 2 的點估計量為S2,且4. 總體方差在1- 置信水平下的置信區(qū)間為總體方差的區(qū)間估計(圖示) 2 21- 2 總體方差1- 的置信區(qū)間自由度為n-1的2總體方差的區(qū)間估計(例題分析)【例5.3.7】 食品廠從生產(chǎn)的罐頭中隨機抽取15個稱量其重量,得樣本方差s2 =1.652(克2 ),設(shè)罐頭重量服從正態(tài)分布,試求其方差的置信水平為90%的置信區(qū)間。解:已知n15,1-90% ,s2 =1.652 查卡方分布表的:故總體方差的置信水平為90%的置信區(qū)間為1.61,5

29、.8 5.4 兩個總體參數(shù)的區(qū)間估計1. 總體均值之差的區(qū)間估計2. 總體比例之差的區(qū)間估計3. 總體方差之比的區(qū)間估計兩個總體參數(shù)的區(qū)間估計總體參數(shù)符號表示樣本統(tǒng)計量均值之差比率之差方差比兩個總體均值之差的區(qū)間估計 (獨立大樣本)兩個總體均值之差的估計(大樣本)1.假定條件兩個總體都服從正態(tài)分布,1、 2已知若不是正態(tài)分布, 可以用正態(tài)分布來近似(n130和n230)兩個樣本是獨立的隨機樣本使用正態(tài)分布統(tǒng)計量 z兩個總體均值之差的估計 (大樣本)1.1, 2已知時,兩個總體均值之差1-2在1- 置信水平下的置信區(qū)間為1、 2未知時,兩個總體均值之差1-2在1- 置信水平下的置信區(qū)間為兩個總體

30、均值之差的估計(例題分析)【例】某地區(qū)教育委員會想估計兩所中學(xué)的學(xué)生高考時的英語平均分?jǐn)?shù)之差,為此在兩所中學(xué)獨立抽取兩個隨機樣本,有關(guān)數(shù)據(jù)如右表 。建立兩所中學(xué)高考英語平均分?jǐn)?shù)之差95%的置信區(qū)間 兩個樣本的有關(guān)數(shù)據(jù) 中學(xué)1中學(xué)2n1=46n1=33S1=5.8 S2=7.2兩個總體均值之差的估計(例題分析)解: 兩個總體均值之差在1-置信水平下的置信區(qū)間為兩所中學(xué)高考英語平均分?jǐn)?shù)之差的置信區(qū)間為5.03分10.97分兩個總體均值之差的區(qū)間估計 (獨立小樣本)兩個總體均值之差的估計(小樣本: 12= 22 )1.假定條件兩個總體都服從正態(tài)分布兩個總體方差未知但相等:1=2兩個獨立的小樣本(n1

31、30和n230)總體方差的合并估計量估計量x1-x2的抽樣標(biāo)準(zhǔn)差兩個總體均值之差的估計(小樣本: 12=22 )1.兩個樣本均值之差的標(biāo)準(zhǔn)化2.兩個總體均值之差1-2在1- 置信水平下的置信區(qū)間為兩個總體均值之差的估計(例題分析)【例】為估計兩種方法組裝產(chǎn)品所需時間的差異,分別對兩種不同的組裝方法各隨機安排12名工人,每個工人組裝一件產(chǎn)品所需的時間(分鐘)下如表。假定兩種方法組裝產(chǎn)品的時間服從正態(tài)分布,且方差相等。試以95%的置信水平建立兩種方法組裝產(chǎn)品所需平均時間差值的置信區(qū)間兩個方法組裝產(chǎn)品所需的時間 方法1方法228.336.027.631.730.137.222.226.029.038

32、.531.032.037.634.433.831.232.128.020.033.428.830.030.226.521兩個總體均值之差的估計(例題分析)解: 根據(jù)樣本數(shù)據(jù)計算得 合并估計量為:兩種方法組裝產(chǎn)品所需平均時間之差的置信區(qū)間為0.14分鐘7.26分鐘兩個總體均值之差的估計(小樣本: 12 22 )1.假定條件兩個總體都服從正態(tài)分布兩個總體方差未知且不相等:12兩個獨立的小樣本(n130和n230)2. 使用統(tǒng)計量兩個總體均值之差的估計(小樣本: 1222 )兩個總體均值之差1-2在1- 置信水平下的置信區(qū)間為自由度兩個總體均值之差的估計(例題分析)【例】沿用前例。假定第一種方法隨機

33、安排12名工人,第二種方法隨機安排名工人,即n1=12,n2=8 ,所得的有關(guān)數(shù)據(jù)如表。假定兩種方法組裝產(chǎn)品的時間服從正態(tài)分布,且方差不相等。以95%的置信水平建立兩種方法組裝產(chǎn)品所需平均時間差值的置信區(qū)間 兩個方法組裝產(chǎn)品所需的時間 方法1方法228.336.027.631.730.137.222.226.529.038.531.037.634.433.832.128.020.028.830.030.221兩個總體均值之差的估計(例題分析)解: 根據(jù)樣本數(shù)據(jù)計算得 自由度為:兩種方法組裝產(chǎn)品所需平均時間之差的置信區(qū)間為0.192分鐘9.058分鐘兩個總體比率之差的區(qū)間估計1.假定條件兩個總體服從二項分布可以用正態(tài)分布來近似兩個樣本是獨立的2.兩個總體比率之差1- 2在1- 置信水平下的置信區(qū)間為兩個總體比率之差的區(qū)間估計兩個總體比率之差的估計(例題分析)【例】在某個電視節(jié)目的收視率調(diào)查中,農(nóng)村

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負(fù)責(zé)。
  • 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時也不承擔(dān)用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

最新文檔

評論

0/150

提交評論