第5章抽樣和參數(shù)估計(jì)_第1頁(yè)
第5章抽樣和參數(shù)估計(jì)_第2頁(yè)
第5章抽樣和參數(shù)估計(jì)_第3頁(yè)
第5章抽樣和參數(shù)估計(jì)_第4頁(yè)
第5章抽樣和參數(shù)估計(jì)_第5頁(yè)
已閱讀5頁(yè),還剩86頁(yè)未讀, 繼續(xù)免費(fèi)閱讀

下載本文檔

版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請(qǐng)進(jìn)行舉報(bào)或認(rèn)領(lǐng)

文檔簡(jiǎn)介

1、1第五章第五章 抽樣推斷抽樣推斷 和參數(shù)估計(jì)和參數(shù)估計(jì)全及總量指標(biāo)的推算兩總體參數(shù)的估計(jì)一個(gè)總體參數(shù)的估計(jì)一般問題參數(shù)估計(jì)樣本容量的確定抽樣極限誤差抽樣平均誤差抽樣和抽樣分布抽樣推斷2 . 51 . 52學(xué)習(xí)目標(biāo)學(xué)習(xí)目標(biāo)l區(qū)分總體分布、樣本分布、抽樣分布,理解抽樣分布與總體分布的關(guān)系,掌握單總體參數(shù)推斷時(shí)樣本統(tǒng)計(jì)量的分布,掌握雙總體參數(shù)推斷時(shí)樣本統(tǒng)計(jì)量的分布l抽樣誤差的含義及計(jì)算l樣本容量的確定方法(純隨機(jī)抽樣)l估計(jì)量與估計(jì)值的概念l點(diǎn)估計(jì)與區(qū)間估計(jì)的區(qū)別l評(píng)價(jià)估計(jì)量?jī)?yōu)良性的標(biāo)準(zhǔn)l抽樣平均數(shù)和抽樣成數(shù)的區(qū)間估計(jì)方法(純隨機(jī)抽樣)l一個(gè)總體參數(shù)的區(qū)間估計(jì)方法;兩個(gè)總體參數(shù)的區(qū)間估計(jì)方法35.1

2、 抽樣推斷抽樣推斷l(xiāng)5.1.1 抽樣和抽樣分布l5.1.2 抽樣平均誤差l5.1.3 抽樣極限誤差l5.1.4 樣本容量的確定45.1.1 5.1.1 抽樣和抽樣分布抽樣和抽樣分布l抽樣:從總體中抽取部分單位,并進(jìn)行實(shí)際調(diào)查,以推斷總體。由概率抽樣和非概率抽樣l抽樣推斷就是按照隨機(jī)抽樣的原則,從總體中抽出一部分單位作為樣本,并利用樣本的實(shí)際資料計(jì)算樣本指標(biāo)值,然后根據(jù)樣本指標(biāo)對(duì)總體的數(shù)量特征(總體指標(biāo))做出具有一定可靠程度的估計(jì)和判斷的一種統(tǒng)計(jì)分析方法。l總體和樣本;樣本容量和樣本個(gè)數(shù)l參數(shù)和統(tǒng)計(jì)量l估計(jì)量和估計(jì)值51、抽樣推斷的過程、抽樣推斷的過程總體算術(shù)平均數(shù)算術(shù)平均數(shù)x統(tǒng)計(jì)量統(tǒng)計(jì)量用來(lái)推

3、斷總體參數(shù)的統(tǒng)計(jì)量稱為用來(lái)推斷總體參數(shù)的統(tǒng)計(jì)量稱為估計(jì)量估計(jì)量(estimator), 其取值稱其取值稱為為估計(jì)值估計(jì)值(estimate) 。 同一個(gè)參數(shù)可以有多個(gè)不同的估計(jì)量。同一個(gè)參數(shù)可以有多個(gè)不同的估計(jì)量。參數(shù)是唯一的,但參數(shù)是唯一的,但估計(jì)量(統(tǒng)計(jì)量)是隨機(jī)變量估計(jì)量(統(tǒng)計(jì)量)是隨機(jī)變量,取值是不確,取值是不確定的。定的。 ?參數(shù)參數(shù)6. . 2 2、抽樣推斷的理論基礎(chǔ)、抽樣推斷的理論基礎(chǔ) 建立在概率論的大數(shù)定律和中心極限定理的基礎(chǔ)上。建立在概率論的大數(shù)定律和中心極限定理的基礎(chǔ)上。 大數(shù)定律大數(shù)定律:當(dāng)樣本容量足夠大時(shí):當(dāng)樣本容量足夠大時(shí),樣本平均數(shù)與總體平均樣本平均數(shù)與總體平均數(shù)的

4、偏差小于任意正數(shù)的可能性趨近與數(shù)的偏差小于任意正數(shù)的可能性趨近與1的概率。是抽樣的概率。是抽樣推斷的推斷的前提前提。 中心極限定理中心極限定理:只要在樣本容量充分大的條件下:只要在樣本容量充分大的條件下,無(wú)論無(wú)論全及總體的變量分布是否屬于正態(tài)分布全及總體的變量分布是否屬于正態(tài)分布,其抽樣平均數(shù)也其抽樣平均數(shù)也趨近于正態(tài)分布。幫我們正確測(cè)算樣本平均數(shù)與總體平趨近于正態(tài)分布。幫我們正確測(cè)算樣本平均數(shù)與總體平均數(shù)間的誤差,樣本平均數(shù)推斷總體平均數(shù)的可靠程度均數(shù)間的誤差,樣本平均數(shù)推斷總體平均數(shù)的可靠程度是我們推斷的主要是我們推斷的主要依據(jù)依據(jù)。73、3種不同性質(zhì)的分布種不同性質(zhì)的分布l總體分布:總體

5、中各元素的觀測(cè)值所形成的相對(duì)頻數(shù)分布,常常是未知的,假定它服從某種分布l樣本分布:從總體中抽取一個(gè)容量為n的樣本,由這n個(gè)觀測(cè)值形成的相對(duì)頻數(shù)分布,又稱經(jīng)驗(yàn)分布。當(dāng)樣本容量逐漸n增大時(shí),樣本分布逐漸接近于總體分布l抽樣分布:某個(gè)樣本統(tǒng)計(jì)量的概率分布,從理論上說就是在重復(fù)選取容量為n的樣本時(shí),由該統(tǒng)計(jì)量的所有可能取值形成的相對(duì)頻數(shù)分布。提供了樣本統(tǒng)計(jì)量長(zhǎng)遠(yuǎn)而穩(wěn)定的信息,是進(jìn)行推斷的理論基礎(chǔ),也是抽樣推斷科學(xué)性的重要依據(jù)。84、抽樣分布的幾個(gè)要點(diǎn)l抽樣分布是樣本統(tǒng)計(jì)量的分布,統(tǒng)計(jì)量是樣本的函數(shù),由于不同的樣本計(jì)算出來(lái)的統(tǒng)計(jì)量的值不同,因此統(tǒng)計(jì)量是一個(gè)隨機(jī)變量l樣本數(shù)據(jù)的統(tǒng)計(jì)分布是可以直接觀測(cè)的,最

6、直觀的方式是直方圖,可以用來(lái)對(duì)總體分布進(jìn)行檢驗(yàn)。l現(xiàn)實(shí)中不可能將所有樣本都抽出來(lái),抽樣分布一般利用概率統(tǒng)計(jì)的理論推導(dǎo)得出,即抽樣分布實(shí)際上是一種理論分布。l在統(tǒng)計(jì)推斷中總體的分布一般是未知的,不可觀測(cè)的(常常被假設(shè)為正態(tài)分布)。l在參數(shù)估計(jì)中,所關(guān)心的總體參數(shù)主要有均值、比例、方差。因此一般用樣本的均值、比例、方差來(lái)推斷總體的均值、比例和方差95 5、一個(gè)總體參數(shù)推斷時(shí)樣本統(tǒng)計(jì)量、一個(gè)總體參數(shù)推斷時(shí)樣本統(tǒng)計(jì)量的抽樣分布:的抽樣分布:以均值為例以均值為例 設(shè)一個(gè)總體含有4 個(gè)個(gè)體,標(biāo)志值分別為X1=1、X2=2、X3=3 、X4=4 。5 . 2x625. 02x10所有樣本均值的均值和方差所有

7、樣本均值的均值和方差l樣本均值的均值(數(shù)學(xué)期望)等于總體均值樣本均值的均值(數(shù)學(xué)期望)等于總體均值l樣本均值的方差:反映樣本平均數(shù)與總體平均數(shù)的樣本均值的方差:反映樣本平均數(shù)與總體平均數(shù)的平均誤差程度平均誤差程度, ,樣本均值的方差等于總體方差的樣本均值的方差等于總體方差的1/1/n n。5 . 2160 . 45 . 10 . 11MxniixnMxnixix222122625. 016) 5 . 20 . 4() 5 . 20 . 1 ()((M為樣本數(shù)目)為樣本數(shù)目)11樣本均值的抽樣分布與中心極限定理樣本均值的抽樣分布與中心極限定理x5x50 x5 . 2x12中心極限定理中心極限定理

8、(central limit theorem)xnx13單一總體樣本統(tǒng)計(jì)量的抽樣分布單一總體樣本統(tǒng)計(jì)量的抽樣分布樣本均值樣本均值樣本比例樣本比例樣本方差樣本方差正態(tài)分布正態(tài)分布非正態(tài)分布非正態(tài)分布正態(tài)分布正態(tài)分布分布分布p2x2s14樣本的抽樣分布樣本的抽樣分布(8)l單一總體l樣本均值l樣本比例l樣本方差l兩個(gè)總體l兩樣本均值差l兩樣本比例差l兩樣本方差比) 1() 1()1 ()1 (,()1 (,(22222nsnNnnNpNnnNx) 1, 1()1 ()1 (,()(),()(21222122211121212221212121nnFssnnNppnnNxx155.1.2 抽樣平均誤

9、差:抽樣平均誤差:統(tǒng)計(jì)量的標(biāo)統(tǒng)計(jì)量的標(biāo) 準(zhǔn)誤(準(zhǔn)誤(Standard Error)l又叫標(biāo)準(zhǔn)誤差,樣本統(tǒng)計(jì)量的抽樣分布的標(biāo)準(zhǔn)差,是根據(jù)樣本統(tǒng)計(jì)量計(jì)算的,反映統(tǒng)計(jì)量的離散程度。測(cè)度了用樣本統(tǒng)計(jì)量估計(jì)總體參數(shù)的精確程度l描述統(tǒng)計(jì)分析時(shí)軟件一般會(huì)輸出這一結(jié)果。l當(dāng)計(jì)算標(biāo)準(zhǔn)誤時(shí)涉及的總體參數(shù)未知時(shí),用樣本統(tǒng)計(jì)量代替計(jì)算的標(biāo)準(zhǔn)誤,稱為估計(jì)的標(biāo)準(zhǔn)誤l影響抽樣品均誤差的因素不重復(fù)抽樣重復(fù)抽樣122,22,NnNnnpxpxnsx各種方式下的抽樣平均誤差16l抽樣極限誤差:抽樣極限誤差:又叫又叫最大允許誤差(allowable error)是指抽樣指標(biāo)與總體指標(biāo)之間抽樣誤差允許的可能范圍。 置信區(qū)間=l抽樣極

10、限誤差:是人為確定的,是調(diào)查者在相應(yīng)的置信度下可以容忍的誤差水平。l基于概率估計(jì)要求,抽樣極限誤差x或 p通常需要以抽樣平均誤差x或p為標(biāo)準(zhǔn)單位來(lái)衡量。l抽樣誤差的概率度:把抽樣極限誤差x或p 分別除以x或p得相對(duì)數(shù)z,表示誤差范圍為抽樣平均誤差的z倍。 z是測(cè)量抽樣估計(jì)可靠程度的一個(gè)參數(shù)。5.1.3 抽樣極限誤差(抽樣極限誤差( )pxxx;pppxxpxxzzzz;17已知 由概率論可知 服從標(biāo)準(zhǔn)正態(tài)分布,即:有以下關(guān)系式成立:一般稱, 為置信度,可靠程度等,反映估計(jì)結(jié)果的可信程度。若事先給定一個(gè)置信度,則可根據(jù)標(biāo)準(zhǔn)正態(tài)分布找到其對(duì)應(yīng)的臨界值 。進(jìn)而計(jì)算抽樣誤差抽樣誤差的概率表述),(2N

11、xxxZ) 1 , 0( NZ1)(2ZxPx2ZxxZx2118抽樣估計(jì)的置信度抽樣估計(jì)的置信度l 抽樣估計(jì)的置信度抽樣估計(jì)的置信度:又稱抽樣估計(jì)的概率保證程度又稱抽樣估計(jì)的概率保證程度,是表明樣本指標(biāo)與總體指標(biāo)的誤差不超過是表明樣本指標(biāo)與總體指標(biāo)的誤差不超過一定范圍一定范圍的概率保證程度,它一般用的概率保證程度,它一般用 F(z)表示表示 。( )( )( )( )()()()()xxxppppxxXzF zxzXxzF zpzF zpzpzF zPPPPPP19關(guān)于置信度含義的說明樣本均值的抽樣分布樣本均值的抽樣分布1、在所有的置信區(qū)間中,有(1-)*100% 的區(qū)間包含總體真實(shí)值。2、

12、對(duì)于計(jì)算得到的一個(gè)具體區(qū)間,“這個(gè)區(qū)間包含總體真實(shí)值”這一結(jié)論有(1-) *100%的可能是正確的。3、說“總體均值有95%的概率落入某一區(qū)間”是不嚴(yán)格的,因?yàn)榭傮w均值是非隨機(jī)的 。 = 1 - /2 /2X_x_x205.2 參數(shù)估計(jì)參數(shù)估計(jì)5.2.1 參數(shù)估計(jì)的一般問題參數(shù)估計(jì)的一般問題5.2.2 一個(gè)總體參數(shù)的區(qū)間估計(jì)一個(gè)總體參數(shù)的區(qū)間估計(jì)5.2.3 兩個(gè)總體參數(shù)的區(qū)間估計(jì)兩個(gè)總體參數(shù)的區(qū)間估計(jì)5.2.4 全及總量指標(biāo)的推算全及總量指標(biāo)的推算215.2.1 參數(shù)估計(jì)的一般問題參數(shù)估計(jì)的一般問題(一)科學(xué)的估計(jì)方法具備的條件(一)科學(xué)的估計(jì)方法具備的條件(二)點(diǎn)估計(jì)(二)點(diǎn)估計(jì)(三)評(píng)價(jià)估

13、計(jì)量的標(biāo)準(zhǔn)(三)評(píng)價(jià)估計(jì)量的標(biāo)準(zhǔn)(四)區(qū)間估計(jì)(四)區(qū)間估計(jì)22(一)科學(xué)的估計(jì)方法具備的條件(一)科學(xué)的估計(jì)方法具備的條件l要有合適的統(tǒng)計(jì)量作為估計(jì)量l要有合理的允許誤差范圍l要有一個(gè)可接受的置信度,即概率保證程度23(二)點(diǎn)估計(jì)(二)點(diǎn)估計(jì)(point estimate)l用樣本的估計(jì)量的某個(gè)取值直接作為總體參數(shù)的估計(jì)值l例如:用樣本均值直接作為總體均值的估計(jì);用兩個(gè)樣本均值之差直接作為總體均值之差的估計(jì)l缺陷:無(wú)法給出估計(jì)值接近總體參數(shù)程度的信息,不能反映估計(jì)的誤差和精確程度l雖然在重復(fù)抽樣條件下,點(diǎn)估計(jì)的均值可望等于總體真值,但由于樣本是隨機(jī)的,抽出一個(gè)具體的樣本得到的估計(jì)值很可能不同

14、于總體真值l一個(gè)點(diǎn)估計(jì)量的可靠性是由它的抽樣標(biāo)準(zhǔn)誤差來(lái)衡量的,這表明一個(gè)具體的點(diǎn)估計(jì)值無(wú)法給出估計(jì)的可靠性的度量 24l無(wú)偏性無(wú)偏性(unbiasedness) :估計(jì)量抽樣分布的數(shù)學(xué)期望等于被估計(jì)的總體參數(shù)。即(三)評(píng)價(jià)估計(jì)量的標(biāo)準(zhǔn)(三)評(píng)價(jià)估計(jì)量的標(biāo)準(zhǔn)Xx )(25l一致性一致性(consistency) :隨著樣本容量的增大,估計(jì)量的值越來(lái)越接近被估計(jì)的總體參數(shù)。即1)(limXxpn評(píng)價(jià)估計(jì)量的標(biāo)準(zhǔn)評(píng)價(jià)估計(jì)量的標(biāo)準(zhǔn)2612(efficiency) 評(píng)價(jià)估計(jì)量的標(biāo)準(zhǔn)評(píng)價(jià)估計(jì)量的標(biāo)準(zhǔn))()(221227(四)區(qū)間估計(jì)(四)區(qū)間估計(jì)(interval estimate)l利用樣本統(tǒng)計(jì)量和抽樣

15、分布估計(jì)總體參數(shù)的可能區(qū)間。在點(diǎn)估計(jì)的基礎(chǔ)上,給出總體參數(shù)估計(jì)的一個(gè)區(qū)間(樣本統(tǒng)計(jì)量加減抽樣誤差)范圍。關(guān)鍵是將抽樣誤差 求解。若 已知,則區(qū)間可表示為:l根據(jù)樣本統(tǒng)計(jì)量的抽樣分布能夠?qū)颖窘y(tǒng)計(jì)量與總體參數(shù)的接近程度給出一個(gè)概率度量。比如,某班級(jí)平均分?jǐn)?shù)在7585之間,置信水平是95%x置信水平=1x),(xxxx28區(qū)間估計(jì)的圖示區(qū)間估計(jì)的圖示置信區(qū)間與置信水平置信區(qū)間與置信水平 29置信水平置信水平l或置信系數(shù):將構(gòu)造置信區(qū)間的步驟重復(fù)很多次,置信區(qū)間包含總體參數(shù)真值的次數(shù)所占的比例稱為置信水平 l表示為 (1 - 。 是總體參數(shù)未在區(qū)間內(nèi)的比例。l如用95%的置信水平得到某班學(xué)生考試成績(jī)

16、的置信區(qū)間為7585。不能表述為7585這個(gè)區(qū)間以95%的概率包含全班學(xué)生平均考試成績(jī)的真值,或全班學(xué)生的平均考試成績(jī)以95%的概率落在7585之間l常用的置信水平值有 99%, 95%, 90%l相應(yīng)的相應(yīng)的 為0.01,0.05,0.10l相應(yīng)的相應(yīng)的 為1.65,1.96,2.5830置信區(qū)間置信區(qū)間 (confidence interval)l置信水平為95%的置信區(qū)間:用某種方法構(gòu)造的所有區(qū)間中有95%的區(qū)間包含總體參數(shù)的真值。l總體參數(shù)的真值是固定且未知,用樣本構(gòu)造的區(qū)間則是不固定的,即置信區(qū)間是一個(gè)隨機(jī)區(qū)間。一個(gè)置信區(qū)間就像是為捕獲未知參數(shù)而撒出去的網(wǎng),不是所有撒網(wǎng)的地點(diǎn)都能捕獲

17、到參數(shù)。只能用概率表示在多次抽樣得到的區(qū)間中大概有多少個(gè)區(qū)間包含了參數(shù)的真值。l實(shí)際估計(jì)時(shí)只抽一個(gè)樣本,此時(shí)所構(gòu)造的是與該樣本相聯(lián)系的一定置信水平下的置信區(qū)間,是一特定區(qū)間,因此無(wú)法知道它是否包含總體參數(shù)的真值。所以只能希望該區(qū)間是大量包含總體參數(shù)真值的區(qū)間中的一個(gè)。31置信區(qū)間置信區(qū)間 ( (95%95%的置信區(qū)間的置信區(qū)間) )32例例1 1:l從某廠生產(chǎn)的5000只燈泡中,隨機(jī)不重復(fù)抽取100只,對(duì)其使用壽命進(jìn)行調(diào)查,調(diào)查結(jié)果如表又該廠質(zhì)量規(guī)定使用壽命在3000小時(shí)以下為不合格品。使用壽命(小時(shí))使用壽命(小時(shí)) 產(chǎn)品數(shù)量(只)產(chǎn)品數(shù)量(只) 3000 3000以下以下3000 4000

18、3000 40004000 50004000 5000 5000 5000以上以上2 2303050501818合合 計(jì)計(jì)100100要求:要求:(1)按不重復(fù)抽樣方法,以95.45%的概率保證程度估計(jì)該批燈泡的平均使用壽命; (2)按不重復(fù)抽樣方法,以68.27%的置信度估計(jì)該批燈泡的合格率。33(1 1)N = 5000 = 5000 n = 100 100 F(z) = 95.45 = 95.45% z = 2 2. . 解:解:樣本平均數(shù):樣本平均數(shù):xfxf時(shí)4 43 34 40 00 00 04 43 34 40 0( (小小) )1 10 00 0樣本標(biāo)準(zhǔn)差:樣本標(biāo)準(zhǔn)差:xxff

19、s2() 5 53 34 44 40 00 00 00 07 73 31 1. .0 02 26 67 71 10 00 0分析分析34. . 總體平均壽命所在的置信區(qū)間為總體平均壽命所在的置信區(qū)間為: :xXxz時(shí)4 43 34 40 01 14 44 4. .7 74 4( (小小) )= =11xxxnnNNnnzs時(shí)7 73 31 1. .0 02 27 76 61 10 00 01 17 72 2. .3 37 75 50 00 00 01 10 00 02 27 72 2. .3 37 71 14 44 4. .7 74 4( (小小) )樣本平均壽樣本平均壽命的抽樣平命的抽樣平均

20、誤差:均誤差: 即可以即可以95.4595.45%的概率保證程度估計(jì)該批燈泡的平均的概率保證程度估計(jì)該批燈泡的平均使用壽命在使用壽命在4484.744484.744195.264195.26小時(shí)之間。小時(shí)之間。分析分析35. . 樣本合格率:樣本合格率: (2 2) n1 = 98 98 n = 100 100 F(z) = 68.27 = 68.27 z = 1 11npn9 98 80 0. .9 98 81 10 00 0樣本合格率的抽樣平均誤差:樣本合格率的抽樣平均誤差:(1)1()pppPPnnNz 0 0. .9 98 80 0. .0 02 21 10 00 01 10 0. .

21、0 01 14 41 10 00 05 50 00 00 01 10 0. .0 01 14 40 0. .0 01 14 4 ( () )總體合格率所在的置信區(qū)間為總體合格率所在的置信區(qū)間為: :pPpz0 0. .9 98 80 0. .0 01 14 4 即可以即可以68.2768.27%的概率保證程度估計(jì)該批燈泡的合格的概率保證程度估計(jì)該批燈泡的合格率率96.696.6 99.499.4之間。之間。分析分析36例例2 l 對(duì)某批成品按不重復(fù)抽樣方法抽選對(duì)某批成品按不重復(fù)抽樣方法抽選200200件檢查,其中廢品件檢查,其中廢品8 8件,又知樣本容量為成品總量的件,又知樣本容量為成品總量的

22、(1(120)20)。以。以9595的把握程度估的把握程度估計(jì)該批成品的廢品率范圍。計(jì)該批成品的廢品率范圍。l解:解:N = 4000 = 4000 n = = 200 200 n1 = = 8 8 F(z) = 95 = 95 z = 1.96= 1.961(1)1()ppppnpnPPnnNzpz廢品率 品率 42.6542.658 80.040.042002000.040.9610.040.961(1)0.0135(1)0.013520020200201.960.01350.026561.960.01350.02656P =P =37影響區(qū)間寬度的因素影響區(qū)間寬度的因素l總體數(shù)據(jù)的離散程

23、度,用來(lái)測(cè)度l樣本容量l置信水平 (1 - ),影響 z 的大小nx385.2.2 5.2.2 一個(gè)總體參數(shù)的區(qū)間估計(jì)一個(gè)總體參數(shù)的區(qū)間估計(jì)) 1() 1()1 ()1 (,()1 (,(22222nsnNnnNpNnnNx單一總體參數(shù)推斷時(shí)單一總體參數(shù)推斷時(shí)樣本統(tǒng)計(jì)量的抽樣分布樣本統(tǒng)計(jì)量的抽樣分布391 1、樣本近似服從正態(tài)分布的情形、樣本近似服從正態(tài)分布的情形2 2、樣本近似服從、樣本近似服從t分布的情形分布的情形(一)總體均值的區(qū)間估計(jì)(一)總體均值的區(qū)間估計(jì)401 1、樣本為正態(tài)分布的情形、樣本為正態(tài)分布的情形l假定條件(具備其中之一)l總體服從正態(tài)分布,方差已知(無(wú)論大樣本還是小樣本

24、)l如果不是正態(tài)分布,大樣本時(shí)可由正態(tài)分布來(lái)近似 (n 30)l使用正態(tài)分布統(tǒng)計(jì)量 z) 1 , 0( Nnxz代替)未知用若snZx(241例例125袋食品的重量袋食品的重量 112.5101.0103.0102.0100.5102.6107.5 95.0108.8115.6100.0123.5102.0101.6102.2116.6 95.4 97.8108.6105.0136.8102.8101.5 98.4 93.342分析分析28.109,44.10192.336.105251096.136.1052nzx36.105x43例例236個(gè)投保人年齡的數(shù)據(jù)個(gè)投保人年齡的數(shù)據(jù) 233539

25、27364436424643313342534554472434283936444039493834485034394548453244分析分析63.41,37.3713.25.393677.7645.15.392nszx5 .39x77. 7s45例例3:用:用SPSS進(jìn)行區(qū)間估計(jì)進(jìn)行區(qū)間估計(jì) 兒童電視節(jié)目的贊助商希望了解兒童每周看電視的時(shí)間。下面是對(duì)100名兒童進(jìn)行隨機(jī)調(diào)查的結(jié)果(小時(shí))。計(jì)算平均看電視時(shí)間95%的置信區(qū)間。39.719.534.727.0 41.315.120.531.318.317.021.529.915.016.4 36.823.424.128.923.424.440

26、.646.423.639.4 35.519.529.331.220.634.915.531.638.938.7 27.226.514.715.628.424.043.920.629.19.5 21.042.413.932.829.832.933.038.028.720.6 19.738.637.117.015.123.421.021.829.321.3 22.823.432.511.343.830.815.823.220.333.5 30.037.824.426.929.027.727.122.036.123.0 22.126.522.926.930.225.223.835.321.635.7

27、 30.822.724.521.926.550.346SPSS輸出結(jié)果(數(shù)據(jù):輸出結(jié)果(數(shù)據(jù):tv.xls)操作:分析操作:分析-描述統(tǒng)計(jì)描述統(tǒng)計(jì)-探索探索統(tǒng)計(jì)量標(biāo)準(zhǔn)誤均值27.191.8373均值的 95% 置信區(qū)間下限25.530上限28.8525% 修整均值26.977中值26.500方差70.104標(biāo)準(zhǔn)差8.3728極小值9.5極大值50.3472 2、樣本服從、樣本服從t分布的情形分布的情形l假定條件:總體為正態(tài)分布,且方差未知是小樣本 (n 5)l使用正態(tài)分布統(tǒng)計(jì)量 z) 1 , 0()1 (Nnpznppzp)-1 (251例例1 1%35.74%,65.55%35. 9%651

28、00%)651%(6596. 1%65)1 (2nppzp52例例2解:顯然有解:顯然有 因此因此可以用正態(tài)分布進(jìn)行估計(jì)??梢杂谜龖B(tài)分布進(jìn)行估計(jì)。 /2=1.6450215. 0217. 0995)217. 01(217. 0645. 1217. 0)1(2 nppZp 結(jié)論:我們有90的把握認(rèn)為悉尼青少年中每天都抽煙的青少年比例在19.55%23.85%之間。5)1(, 5 pnpn 2006年對(duì)悉尼995名青少年的隨機(jī)調(diào)查發(fā)現(xiàn),有216人每天都抽煙。試估計(jì)悉尼青少年中每天都抽煙的青少年比例的90%的置信區(qū)間。53SPSS的計(jì)算結(jié)果的計(jì)算結(jié)果在SPSS中將“是否吸煙”輸入為取值為1和0的屬性

29、變量,權(quán)數(shù)分別為216和779。計(jì)算這一變量均值的置信區(qū)間即為比例的置信區(qū)間。統(tǒng)計(jì)量標(biāo)準(zhǔn)誤均值.2171.01308均值的 90% 置信區(qū)間 下限 .1956上限.23865% 修整均值.1857中值.0000方差.1700標(biāo)準(zhǔn)差.4123極小值.0000極大值1.000054(三)總體方差的區(qū)間估計(jì)(三)總體方差的區(qū)間估計(jì)l假設(shè)總體服從正態(tài)分布。l總體方差 的點(diǎn)估計(jì)量為s2,樣本方差服從自由度為(n-1)的 分布,且211222nsn2222212) 1(sn111122122222nsnnsn化簡(jiǎn):2x55例例 25袋食品的重量袋食品的重量 單位:?jiǎn)挝唬篻112.5101.0103.010

30、2.0100.5102.6107.5 95.0108.8115.6100.0123.5102.0101.6102.2116.6 95.4 97.8108.6105.0136.8102.8101.5 98.4 93.356分析分析4011.12)24() 1(2975. 0212n3641.39)24() 1(2025. 022n39.18083.564011.1221.931253641.3921.931252257一個(gè)總體參數(shù)的區(qū)間估計(jì)一個(gè)總體參數(shù)的區(qū)間估計(jì)(小小結(jié)結(jié))均值均值比例比例方差方差大樣本大樣本小樣本小樣本大樣本大樣本 2 2分布分布Z Z分布分布Z Z分布分布t t分布分布Z Z

31、分布分布已知2未知258一個(gè)總體參數(shù)的區(qū)間估計(jì)一個(gè)總體參數(shù)的區(qū)間估計(jì)(小結(jié)小結(jié))59(四)未來(lái)觀察值的預(yù)測(cè)區(qū)間估計(jì)(四)未來(lái)觀察值的預(yù)測(cè)區(qū)間估計(jì)16只只燈泡使用壽命的數(shù)據(jù)燈泡使用壽命的數(shù)據(jù) 15101520148015001450148015101520148014901530151014601460147014701nx60(四)未來(lái)觀察值的預(yù)測(cè)區(qū)間估計(jì)(四)未來(lái)觀察值的預(yù)測(cè)區(qū)間估計(jì)0)(1xxEnnnxxDn112221nstx112) 1(11) 1 , 0(1111ntnsxxtNnxxznn61例題分析例題分析161177.24131. 21490625.2.3 5.2.3 兩個(gè)總體

32、參數(shù)的兩個(gè)總體參數(shù)的 區(qū)間估計(jì)區(qū)間估計(jì))1,1()1()1(,()(),()(21222122211121212221212121nnFssnnNppnnNxx(一)兩總體均值之差的區(qū)間估計(jì)(一)兩總體均值之差的區(qū)間估計(jì)(二)兩總體比例之差的區(qū)間估計(jì)(二)兩總體比例之差的區(qū)間估計(jì)(三)兩總體方差之比的區(qū)間估計(jì)(三)兩總體方差之比的區(qū)間估計(jì)63(一)兩總體均值之差的區(qū)間估計(jì)(一)兩總體均值之差的區(qū)間估計(jì)獨(dú)立樣本獨(dú)立樣本配對(duì)樣本配對(duì)樣本641 1、獨(dú)立大樣本、獨(dú)立大樣本l假定條件(具備其中之一)兩個(gè)總體都服從正態(tài)分布若不是正態(tài)分布, 當(dāng)n130和n230時(shí)可以用正態(tài)分布近似l使用正態(tài)分布統(tǒng)計(jì)量 z

33、l1,2已知時(shí),兩個(gè)總體均值之差1-2在1- 置信水平下的置信區(qū)間為) 1 , 0()()(2221212121Nnnxxz222121221)(nnzxx2221,ss65例例 兩個(gè)樣本的有關(guān)數(shù)據(jù)兩個(gè)樣本的有關(guān)數(shù)據(jù) 中學(xué)中學(xué)1中學(xué)中學(xué)2n1=46n1=33S1=5.8 S2=7.2861x782x66分析分析)97.10,03. 5(97. 28332 . 7468 . 596. 1)7886()(22222121221nsnszxx672、獨(dú)立小樣本,、獨(dú)立小樣本,方差未知但相等方差未知但相等l假定條件兩個(gè)總體都服從正態(tài)分布兩個(gè)獨(dú)立的小樣本(n130和n230)兩總體方差未知且相等1=2l

34、總體方差的合并估計(jì)量2) 1() 1(212222112nnsnsnspl兩個(gè)樣本均值之差的標(biāo)準(zhǔn)化后服從)2(11)()(21212121nntnnsxxtp21221221112nnsnntxxp68例例兩個(gè)方法組裝產(chǎn)品所需的時(shí)間兩個(gè)方法組裝產(chǎn)品所需的時(shí)間 方法方法1方法方法228.336.027.631.730.137.222.226.029.038.531.032.037.634.433.831.232.128.020.033.428.830.030.226.569分析分析5 .321x996.1521s8 .282x358.1922s677.1721212358.19) 112(996

35、.15) 112(2ps56. 37 . 3121121677.170739. 2) 8 .285 .32(703、獨(dú)立小樣本,、獨(dú)立小樣本,方差未知且不等(方差未知且不等(1 1) l假定條件兩個(gè)總體都服從正態(tài)分布,且是小樣本(n130和n230)兩個(gè)總體方差未知且不相等:12n1=n2=n222121212212nsnsnntxx713、獨(dú)立小樣本,、獨(dú)立小樣本,方差未知且不等(方差未知且不等(2 2) l假定條件兩個(gè)總體都服從正態(tài)分 布 , 且 是 小 樣 本(n130和n230)兩個(gè)總體方差未知且不相等:12n1n2l使用統(tǒng)計(jì)量)()()(2221212121vtnsnsxxt2221

36、21221)(nsnsvtxx1222221121212222121nnsnnsnsnsvl兩個(gè)總體均值之差1-2在1- 置信水平下的置信區(qū)間為72例例兩個(gè)方法組裝產(chǎn)品所需的時(shí)間兩個(gè)方法組裝產(chǎn)品所需的時(shí)間 方法方法1方法方法228.336.027.631.730.137.222.226.529.038.531.037.634.433.832.128.020.028.830.030.273例題分析例題分析5 .321x996.1521s875.272x014.2322s13188.13188014.2311212996.158014.2312996.15222v433. 4625. 48014.

37、2312996.151604. 2)875.275 .32(744、匹配樣本、匹配樣本l假定條件:兩個(gè)總體各觀察值的配對(duì)差服從正態(tài)分布l兩個(gè)總體均值之差d =1-2在1- 置信水平下的置信區(qū)間為l兩個(gè)匹配的大樣本(n1 30和n2 30)l兩個(gè)匹配的小樣本(n1 30和n2 30)nzdd2nsntdd) 1(275例例 10名學(xué)生兩套試卷的得分名學(xué)生兩套試卷的得分 學(xué)生編號(hào)學(xué)生編號(hào)試卷試卷A試卷試卷B差值差值d17871726344193726111489845691741754951-2768551387660169857781055391676分析分析11101101dniindd53.

38、 61)(12dniidndds67. 4111053. 62622. 211) 1(2nsntdd77(二)兩個(gè)總體比例之差的區(qū)間估計(jì)(二)兩個(gè)總體比例之差的區(qū)間估計(jì)l假定條件兩個(gè)總體服從二項(xiàng)分布可以用正態(tài)分布來(lái)近似兩個(gè)樣本是獨(dú)立的l兩個(gè)總體比例之差1- 2在1- 置信水平下的置信區(qū)間為222111221)1 ()1 (nppnppzpp78例例79分析分析%32.19,%68. 6%32. 6%13400%)321 (%32500%)451 (%4596. 1%32%4580(三)兩個(gè)總體方差比的區(qū)間估計(jì)(三)兩個(gè)總體方差比的區(qū)間估計(jì)l用兩個(gè)樣本的方差比來(lái)判斷如果S12/ S22接近于1,

39、1,說明兩個(gè)總體方差很接近如果S12/ S22遠(yuǎn)離1 1, ,說明兩個(gè)總體方差之間存在差異l總體方差比在1-置信水平下的置信區(qū)間為22222212121FssFF212221222122221FssFss),(1),(2122121nnFnnF81例題分析例題分析5201x26021s4802x28022s82分析分析505.028026098.1280260222183兩個(gè)總體參數(shù)的區(qū)間估計(jì)兩個(gè)總體參數(shù)的區(qū)間估計(jì)(小小結(jié)結(jié))均值差均值差比例差比例差方差比方差比獨(dú)立大樣本獨(dú)立大樣本獨(dú)立小樣本獨(dú)立小樣本匹配樣本匹配樣本獨(dú)立大樣本獨(dú)立大樣本 1 12 2、 2 22 2已知已知 1 12 2、 2

40、 22 2未知未知Z Z分布分布 1 12 2= = 2 22 2 1 12 2 2 22 2正態(tài)總體正態(tài)總體F F分布分布Z Z分布分布t t分布分布t t分布分布t分布分布Z分布分布845.2.4 樣本容量樣本容量n n的確定的確定l重復(fù)純隨機(jī)抽樣l不重復(fù)純隨機(jī)抽樣需要考慮問題:需要考慮問題: (1)(1)要求什么樣的精度?即我們想構(gòu)造多寬的區(qū)間?要求什么樣的精度?即我們想構(gòu)造多寬的區(qū)間? (2)(2)對(duì)于構(gòu)造的置信區(qū)間來(lái)說,想要多大的置信度?對(duì)于構(gòu)造的置信區(qū)間來(lái)說,想要多大的置信度?即我們想要多大的可靠度?即我們想要多大的可靠度?852(1)(1)pppxxxzzznnPPz PPzznn 22222樣本容量樣本容量n n的確定的確定l重復(fù)隨機(jī)抽樣重復(fù)隨機(jī)抽樣l不重復(fù)抽樣不重復(fù)抽樣(1)(1)(1)(1)(1)ppxxnNzznnNNzPPnNz PPznnNNz PP 22

溫馨提示

  • 1. 本站所有資源如無(wú)特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請(qǐng)下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請(qǐng)聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁(yè)內(nèi)容里面會(huì)有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫(kù)網(wǎng)僅提供信息存儲(chǔ)空間,僅對(duì)用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對(duì)用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對(duì)任何下載內(nèi)容負(fù)責(zé)。
  • 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請(qǐng)與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶因使用這些下載資源對(duì)自己和他人造成任何形式的傷害或損失。

評(píng)論

0/150

提交評(píng)論