抽樣分布與參數(shù)估計(jì)概述_第1頁
抽樣分布與參數(shù)估計(jì)概述_第2頁
抽樣分布與參數(shù)估計(jì)概述_第3頁
抽樣分布與參數(shù)估計(jì)概述_第4頁
抽樣分布與參數(shù)估計(jì)概述_第5頁
已閱讀5頁,還剩96頁未讀, 繼續(xù)免費(fèi)閱讀

下載本文檔

版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請(qǐng)進(jìn)行舉報(bào)或認(rèn)領(lǐng)

文檔簡(jiǎn)介

1、統(tǒng)計(jì)學(xué)導(dǎo)論曾五一 肖紅葉 主編3-1第五章抽抽樣分布布與參數(shù)數(shù)估計(jì)第一節(jié)抽抽樣樣的基本本概念與與數(shù)學(xué)原原理第二節(jié)抽抽樣樣分布第三節(jié)參參數(shù)數(shù)估計(jì)第四節(jié)樣樣本本容量的的確定第五節(jié)EXCEL在參數(shù)數(shù)估計(jì)中中的應(yīng)用用 2第一節(jié)抽抽樣樣的基本本概念與與數(shù)學(xué)原原理一、有關(guān)關(guān)抽樣的的基本概概念二、大數(shù)數(shù)定理與與中心極極限定理理3一、有關(guān)關(guān)抽樣的的基本概概念(一)樣樣本容量量與樣本本個(gè)數(shù)1.樣本本容量。樣本是是從總體體中抽出出的部分分單位的的集合,這個(gè)集集合的大大小稱為為樣本容容量,一一般用n表示,它它表明一一個(gè)樣本本中所包包含的單單位數(shù)。一般地,樣本單單位數(shù)大大于30個(gè)的樣樣本稱為為大樣本本,不超超過30個(gè)

2、的樣樣本稱為為小樣本本。2.樣本本個(gè)數(shù)。樣本個(gè)個(gè)數(shù)又稱稱樣本可可能數(shù)目目,它是是指從一一個(gè)總體體中可能能抽取多多少個(gè)樣樣本。4(二)總總體參數(shù)數(shù)與樣本本統(tǒng)計(jì)量量1.總體體參數(shù)??傮w分分布的數(shù)數(shù)量特征征就是總總體的參參數(shù),也也是抽樣樣統(tǒng)計(jì)推推斷的對(duì)對(duì)象。常見的總總體參數(shù)數(shù)有:總總體的平平均數(shù)指指標(biāo),總總體成數(shù)數(shù)(比例例)指標(biāo)標(biāo),總體體分布的的方差、標(biāo)準(zhǔn)差差等等。它們都都是反映映總體分分布特征征的重要要指標(biāo)。52.樣本本統(tǒng)計(jì)量量。樣本本統(tǒng)計(jì)量量是樣本本的一個(gè)個(gè)函數(shù)。它們是是隨機(jī)變變量。我我們利用用統(tǒng)計(jì)量量來估計(jì)計(jì)和推斷斷總體的的有關(guān)參參數(shù)。常見的樣樣本統(tǒng)計(jì)計(jì)量有:樣本平平均數(shù),樣本比比例,樣樣本的

3、方方差、標(biāo)標(biāo)準(zhǔn)差。6(三)概概率抽樣樣及其組組織形式式所謂概率率抽樣,就是要要求對(duì)總總體的每每一次觀觀察(每每一次抽抽?。┒级际且淮未坞S機(jī)試試驗(yàn),并并且有和和總體相相同的分分布。按按這樣的的要求對(duì)對(duì)總體觀觀測(cè)(抽抽?。﹏次,可得得到容量量為n的樣本。789(四)放放回抽樣樣與不放放回抽樣樣1011(五)抽抽樣分布布從總體中中可以隨隨機(jī)地抽抽取許多多樣本,由每一一個(gè)樣本本都可以以計(jì)算樣樣本統(tǒng)計(jì)計(jì)量的觀觀測(cè)值,所有可可能的樣樣本觀測(cè)測(cè)值及其其所對(duì)應(yīng)應(yīng)的概率率便是所所謂的抽抽樣分布布。因此此,抽樣樣分布也也可以稱稱為樣本本統(tǒng)計(jì)量量的概率率分布。抽樣分布布可能是是精確地地服從某某種已知知分布(所謂已已

4、知分布布,例如如我們?cè)谠诘谒恼抡陆榻B過過的各種種常見分分布),也可能能是以某某種已知知分布為為極限分分布。在在實(shí)際應(yīng)應(yīng)用中,后者更更為多見見。121314第 二 次 抽 取 可 能 被 抽 中 的 人 員12345678910第 一 次 抽 取 可 能 被 抽 中 的 人 員 11,1(1)1,2(1.5)1,3(2)1,4(2.5)1,5(3)1,6(3.5)1,7(4)1,8(4.5)1,9(5)1,10(5.5)22,1(1.5)2,2(2)2,3(2.5)2,4(3)2,5(3.5)2,6(4)2,7(4.5)2,8(5)2,9(5.5)2,10(6)33,1(2)3,2(2.5)3,

5、3(3)3,4(3.5)3,5(4)3,6(4.5)3,7(5)3,8(5.5)3,9(6)3,10(6.5)44,1(2.5)4,2(3)4,3(3.5)4,4(4)4,5(4.5)4,6(5)4,7(5.5)4,8(6)4,9(6.5)4,10(7)55,1(3)5,2(3.5)5,3(4)5,4(4.5)5,5(5)5,6(5.5)5,7(6)5,8(6.5)5,9(7)5,10(7.5)66,1(3.5)6,2(4)6,3(4.5)6,4(5)6,5(5.5)6,6(6)6,7(6.5)6,8(7)6,9(7.5)6,10(8)77,1(4)7,2(4.5)7,3(5)7,4(5.5)

6、7,5(6)7,6(6.5)7,7(7)7,8(7.5)7,9(8)7,10(8.5)88,1(4.5)8,2(5)8,3(5.5)8,4(6)8,5(6.5)8,6(7)8,7(7.5)8,8(8)8,9(8.5)8,10(9)99,1(5)9,2(5.5)9,3(6)9,4(6.5)9,5(7)9,6(7.5)9,7(8)9,8(8.5)9,9(9)9,10(9.5)1010,1(5.5)10,2(6)10,3(6.5)10,4(7)10,5(7.5)10,6(8)10,7(8.5)10,8(9)10,9(9.5)10,10(10)表5-310人中有放放回抽二二人的全全部可能能樣本15表5

7、-4任職職年限樣樣本均值值分布數(shù)數(shù)列1617二、大數(shù)數(shù)定理與與中心極極限定理理18大數(shù)定理理表明:盡管個(gè)個(gè)別現(xiàn)象象受偶然然因素影影響,有有各自不不同的表表現(xiàn)。但但是,對(duì)對(duì)總體的的大量觀觀察后進(jìn)進(jìn)行平均均,就能能使偶然然因素的的影響相相互抵消消,消除除由個(gè)別別偶然因因素引起起的極端端性影響響,從而而使總體體平均數(shù)數(shù)穩(wěn)定下下來,反反映出事事物變化化的一般般規(guī)律。1920從正態(tài)分分布的再再生定理理可以看看出,只只要總體體變量服服從正態(tài)態(tài)分布,則從中中抽取的的樣本,不管n是多少,樣本平平均數(shù)都都服從正正態(tài)分布布。但是是在客觀觀實(shí)際中中,總體體并非都都是正態(tài)態(tài)分布。對(duì)于從從非正態(tài)態(tài)分布的的總體中中抽取的

8、的樣本平平均數(shù)的的分布問問題,需需要由中中心極限限定理來來解決。212223第二節(jié)抽抽樣分分布一、樣本本平均數(shù)數(shù)的抽樣樣分布二、樣本本比例的的抽樣分分布24一、樣本本平均數(shù)數(shù)的抽樣樣分布(一)樣樣本平均均數(shù)的期期望值與與方差25262728(二)樣樣本平均均數(shù)的分分布規(guī)律律293031例題題1、某地地區(qū)職工工家庭的的人均年年收入平平均為60000元,標(biāo)準(zhǔn)差差為8000元元。若知知該地區(qū)區(qū)家庭的的人人均均年收入入服從正正態(tài)分布布,現(xiàn)采采用重復(fù)復(fù)抽樣從從總體中中隨機(jī)抽抽取25戶進(jìn)行行調(diào)查,求:(1)樣樣本平均均數(shù)的數(shù)數(shù)學(xué)期望望、樣本本平均數(shù)數(shù)的標(biāo)準(zhǔn)準(zhǔn)差。(2)樣樣本平均均數(shù)等于于或超過過62000

9、元元的可能能性有多多大?32例題題2、某公公司1000名名職工的的人均年年獎(jiǎng)金為為20000元元,標(biāo)準(zhǔn)準(zhǔn)差5000元元,從中中不放回回隨機(jī)抽抽取36人作為為樣本進(jìn)進(jìn)行調(diào)查查,求:(1)樣樣本平均均數(shù)的數(shù)數(shù)學(xué)期望望和標(biāo)準(zhǔn)準(zhǔn)差(2)樣樣本的人人均年獎(jiǎng)獎(jiǎng)金在1900022000元的的概率有有多大?33二、樣本本比例的的抽樣分分布(一)樣樣本比例例的期望望值與方方差34353637(二)樣樣本比例例的分布布規(guī)律38表5-5用正態(tài)分分布來近近似時(shí)對(duì)對(duì)樣本量量的要求求總 體參 數(shù)0.500.450.400.350.300.250.200.150.1010.500.550.600.650.700.750.8

10、00.850.90樣本量至少為n363738404348577110039例:某企企業(yè)生產(chǎn)產(chǎn)的一種種產(chǎn)品,根據(jù)以以往的經(jīng)經(jīng)驗(yàn),合合格率為為95%?,F(xiàn)從從生產(chǎn)線線上隨機(jī)機(jī)抽取100件件產(chǎn)品進(jìn)進(jìn)行檢驗(yàn)驗(yàn),問樣樣本合格格率大于于等于90%的的概率是是多少?40例:一種種電子元元件的合合格率是是98%。隨機(jī)機(jī)抽取800個(gè)個(gè)元件,其合格格率超過過96%的概率率是多少少?如果果在這次次抽樣中中發(fā)現(xiàn)樣樣本合格格率低于于96%,你對(duì)對(duì)這種元元件的生生產(chǎn)會(huì)做做出怎樣樣的判斷斷?41練習(xí)題1:某商場(chǎng)推推銷一種種洗發(fā)水水。據(jù)統(tǒng)統(tǒng)計(jì),本本年度購購買此種種洗發(fā)水水的有10萬人人,其中中6萬是是女性。如果按按不重復(fù)復(fù)隨機(jī)

11、抽抽樣方法法,從購購買者中中抽出100人人進(jìn)行調(diào)調(diào)查,問問樣本中中女性比比例超過過50%的可能能性有多多大?42(三)樣樣本方差差的抽樣樣分布4344第三節(jié)參參數(shù)數(shù)估計(jì)一、參數(shù)數(shù)估計(jì)概概述二、總體體均值的的估計(jì)三、總體體比例的的估計(jì)四、總體體方差的的估計(jì)45一、參數(shù)數(shù)估計(jì)概概述(一)參參數(shù)估計(jì)計(jì)的定義義與種類類所謂參數(shù)數(shù)估計(jì),就是用用樣本統(tǒng)統(tǒng)計(jì)量去去估計(jì)總總體的未未知參數(shù)數(shù)(或參參數(shù)的函函數(shù))。例如,估計(jì)總總體均值值,估計(jì)計(jì)總體比比例和總總體方差差等等。參數(shù)估計(jì)計(jì)有兩種種基本形形式:點(diǎn)點(diǎn)估計(jì)和和區(qū)間估估計(jì)。前前者是用用一個(gè)數(shù)數(shù)值作為為未知參參數(shù)的的估計(jì)值值,后者者則是給給出具體體的上限限和下限

12、限,把包括括在這個(gè)個(gè)區(qū)間內(nèi)內(nèi)。下面面分別介介紹點(diǎn)估估計(jì)與區(qū)區(qū)間估計(jì)計(jì)的有關(guān)關(guān)概念。46(二)點(diǎn)點(diǎn)估計(jì)點(diǎn)估計(jì)就就是根據(jù)據(jù)總體參參數(shù)與樣樣本統(tǒng)計(jì)計(jì)量之間間的內(nèi)在在聯(lián)系,直接以以樣本統(tǒng)統(tǒng)計(jì)量作作為相應(yīng)應(yīng)總體參參數(shù)的估估計(jì)量,點(diǎn)估計(jì)計(jì)又稱為為定值估估計(jì).47(三)估估計(jì)量的的優(yōu)良標(biāo)標(biāo)準(zhǔn)2.有效性。又稱最最小方差差性。48估計(jì)值偏倚 概 率 密 度49 概 率 密 度 估計(jì)值504.充分性。估計(jì)量量包含了了樣本中中關(guān)于的全部信信息。51(四)區(qū)區(qū)間估計(jì)計(jì)與估計(jì)計(jì)的精度度和可靠靠性525354二、總體體均值的的估計(jì)5556575859606162例:為為了研究究居民用用于報(bào)刊刊消費(fèi)的的支出,某城市市的統(tǒng)計(jì)

13、計(jì)部門抽抽取了64戶居居民進(jìn)行行調(diào)查,得到平平均用于于報(bào)刊的的消費(fèi)支支出為290元元/年,假設(shè)總總體服從從正態(tài)分分布,且且總體的的標(biāo)準(zhǔn)差差為100元/年.。對(duì)該城城市居民民戶均用用于報(bào)刊刊的消費(fèi)費(fèi)支出做做區(qū)間估估計(jì)(置置信水平平為95%)。63例:某大大學(xué)為了了估計(jì)學(xué)學(xué)校在校校學(xué)生的的平均體體重,隨隨機(jī)抽取取了64名學(xué)生生,測(cè)得得平均體體重為69千克克,假設(shè)設(shè)總體服服從正態(tài)態(tài)分布,且標(biāo)準(zhǔn)準(zhǔn)差為12千克克。以95%的的置信水水平求該該學(xué)校在在校學(xué)生生的平均均體重的的置信區(qū)區(qū)間。64(二)總總體方差差2未知的情情形652.區(qū)間估計(jì)計(jì)666768【例5-4】在在例5-3中,若總體體方差未未知,但但通

14、過抽抽取的6個(gè)樣本本測(cè)得的的樣本方方差為0.0025,試在0.95的置信信度下,求該產(chǎn)產(chǎn)品直徑徑的均值值置信區(qū)區(qū)間。69例:某大大學(xué)為了了估計(jì)學(xué)學(xué)校在校校學(xué)生的的平均體體重,隨隨機(jī)抽取取了64名學(xué)生生,測(cè)得得平均體體重為69千克克,假設(shè)設(shè)總體總總體服從從正態(tài)分分布,且且樣本標(biāo)標(biāo)準(zhǔn)差為為8千克克。以95%的的置信水水平求該該學(xué)校在在校學(xué)生生的平均均體重的的置信區(qū)區(qū)間。70三、總體體比例的的估計(jì)717273某工廠要要估計(jì)一一批總數(shù)數(shù)5000件的的產(chǎn)品的的廢品率率,于是是隨機(jī)抽抽出400件產(chǎn)產(chǎn)品進(jìn)行行檢測(cè),發(fā)現(xiàn)有有32件件廢品。試給出出該批產(chǎn)產(chǎn)品的廢廢品率的的區(qū)間估估計(jì)(置置信度90%)。74三、總

15、體體方差的的估計(jì)75(二)區(qū)區(qū)間估計(jì)計(jì)7677第四節(jié)樣樣本本容量的的確定一、問題題的提出出二、估計(jì)計(jì)總體均均值時(shí)樣樣本容量量的確定定三、估計(jì)計(jì)總體比比例時(shí)樣樣本容量量的確定定四、使用用上述公公式應(yīng)注注意的問問題78由前面的的論述,我們已已知參數(shù)數(shù)估計(jì)中中的精度度要求與與可靠性性要求常常常是一一對(duì)矛盾盾,但是是,通過過增加樣樣本容量量n有可能降降低樣本本平均數(shù)數(shù)的標(biāo)準(zhǔn)準(zhǔn)差,從從而實(shí)現(xiàn)現(xiàn)既保證證一定的的估計(jì)精精度,又又具有較較高的置置信度的的目的。這時(shí),需要考考慮在給給定的置置信度與與極限誤誤差的前前提下,樣本容容量n究竟取多多大合適適?這就就是所謂謂樣本容容量的確確定問題題。一、問題題的提出出7

16、9二、估計(jì)計(jì)總體均均值時(shí)樣樣本容量量的確定定808182三、估計(jì)計(jì)總體比比率時(shí)樣樣本容量量的確定定83四、使用用上述公公式應(yīng)注注意的問問題1計(jì)算算樣本容容量時(shí),總體的的方差與與成數(shù)常常常是未未知的,這時(shí)可可用有關(guān)關(guān)資料替替代:一一是用歷歷史資料料已有的的方差與與成數(shù)代代替;二二是在進(jìn)進(jìn)行正式式抽樣調(diào)調(diào)查前進(jìn)進(jìn)行幾次次試驗(yàn)性性調(diào)查,用試驗(yàn)驗(yàn)中方差差的最大大值代替替總體方方差;三三是比率率方差在在完全缺缺乏資料料的情況況下,就就用比例例方差的的最大可可能值0.25代替。842.如果果進(jìn)行一一次抽樣樣調(diào)查,需要同同時(shí)估計(jì)計(jì)總體均均值與比比率,可可用上面面的公式式同時(shí)計(jì)計(jì)算出兩兩個(gè)樣本本容量,取其中中

17、較大的的結(jié)果,同時(shí)滿滿足兩方方面的需需要。853.上面面的公式式計(jì)算結(jié)結(jié)果如果果帶小數(shù)數(shù),這時(shí)時(shí)樣本容容量不按按四舍五五入法則則取整數(shù)數(shù),取比比這個(gè)數(shù)數(shù)大的最最小整數(shù)數(shù)代替。例如計(jì)計(jì)算得到到:n=56.03,那么,樣本容容量取57,而而不是56。8687888990第五節(jié)Excel在參數(shù)數(shù)估計(jì)中中的應(yīng)用用【例5-9】用用Excel完完成本章章思考與與練習(xí)計(jì)計(jì)算題的的第1題題。解:操作作步驟如如下。1構(gòu)造造工作表表。如圖圖5-3所示,A、B列為原原始輸入入數(shù)據(jù),A2:A16存放的的是關(guān)于于最大飛飛行速度度的數(shù)據(jù)據(jù),圖中中未完全全顯示出出來。C、D列列為計(jì)算算結(jié)果,分別在在C2、D2單單元格存存放

18、置信信下限和和上限。912定義義變量名名。將A列命名名為“x”,將將B2單單元格命命名為“置信水水平”。3計(jì)算算置信上上、下限限。分別在C2、D2中輸輸入如下下的公式式:=AVERAGE(x)-TINV(1-置信水水平,COUNT(x)-1)*STDEV(x)/SQRT(COUNT(x)=AVERAGE(x)+TINV(1-置信水水平,COUNT(x)-1)*STDEV(x)/SQRT(COUNT(x)92本章小結(jié)結(jié)93945所謂估估計(jì)就是是構(gòu)造適適當(dāng)?shù)臉訕颖窘y(tǒng)計(jì)計(jì)量,來來充當(dāng)總總體參數(shù)數(shù)的估計(jì)計(jì)量。好好的統(tǒng)計(jì)計(jì)量的理理想性質(zhì)質(zhì)包括:無偏性性、有效效性、一一致性和和充分性性。6估計(jì)包包括點(diǎn)估估計(jì)與區(qū)區(qū)間估計(jì)計(jì)。7在給定定的置信信度與極極限誤差差的前提提下,樣樣本容量量n可利用極極限誤差差、臨界界值與抽抽樣標(biāo)準(zhǔn)準(zhǔn)差三者者間的數(shù)數(shù)量關(guān)系系去計(jì)算算。8在Excel中可使用用各種函函數(shù)按照照有關(guān)公公式實(shí)現(xiàn)現(xiàn)區(qū)間估估計(jì)的運(yùn)運(yùn)算。951、某地地區(qū)職工工家庭的的人均年年收入平平均為60000元,標(biāo)準(zhǔn)差差為8000元元。若知知該地區(qū)區(qū)家庭的的人人均均年收入入服從正正態(tài)分布布,現(xiàn)采采用重復(fù)復(fù)抽樣從從總體中中隨機(jī)抽抽取25戶進(jìn)行行調(diào)查,求:(1)樣樣本平均均數(shù)的數(shù)數(shù)學(xué)期望望、樣本本平均數(shù)數(shù)的標(biāo)準(zhǔn)準(zhǔn)差。(2)樣樣本平均均數(shù)等于于或超過過62000元元

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請(qǐng)下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請(qǐng)聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會(huì)有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫網(wǎng)僅提供信息存儲(chǔ)空間,僅對(duì)用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對(duì)用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對(duì)任何下載內(nèi)容負(fù)責(zé)。
  • 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請(qǐng)與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶因使用這些下載資源對(duì)自己和他人造成任何形式的傷害或損失。

評(píng)論

0/150

提交評(píng)論