第7章-參數(shù)估計(jì)課件_第1頁
第7章-參數(shù)估計(jì)課件_第2頁
第7章-參數(shù)估計(jì)課件_第3頁
第7章-參數(shù)估計(jì)課件_第4頁
第7章-參數(shù)估計(jì)課件_第5頁
已閱讀5頁,還剩133頁未讀 繼續(xù)免費(fèi)閱讀

下載本文檔

版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請(qǐng)進(jìn)行舉報(bào)或認(rèn)領(lǐng)

文檔簡介

第七章參數(shù)估計(jì)1第七章參數(shù)估計(jì)1大學(xué)生每周上網(wǎng)花多少時(shí)間?回答類別人數(shù)(人)頻率(%)3小時(shí)以下32163~6小時(shí)3517.56~9小時(shí)3316.59~12小時(shí)2914.512小時(shí)以上7135.5合計(jì)200100

平均上網(wǎng)時(shí)間為8.58小時(shí),標(biāo)準(zhǔn)差為0.69小時(shí)。全校學(xué)生每周的平均上網(wǎng)時(shí)間是多少?每周上網(wǎng)時(shí)間在12小時(shí)以上的學(xué)生比例是多少?你做出估計(jì)的理論依據(jù)是什么?2大學(xué)生每周上網(wǎng)花多少時(shí)間?回答類別人數(shù)(人)頻率(%)3小時(shí)學(xué)習(xí)目標(biāo)1、掌握參數(shù)估計(jì)的基本方法和原理。2、理解并掌握置信區(qū)間和置信水平的含義。3、理解并掌握評(píng)價(jià)估計(jì)量的標(biāo)準(zhǔn)。4、掌握一個(gè)總體參數(shù)的區(qū)間估計(jì)方法,了解兩個(gè)總體參數(shù)區(qū)間估計(jì)的基本方法。5、掌握估計(jì)一個(gè)總體均值和總體比例時(shí)樣本量的確定方法。3學(xué)習(xí)目標(biāo)1、掌握參數(shù)估計(jì)的基本方法和原理。31.參數(shù)估計(jì):總體分布類型已知,僅需對(duì)分布 的未知參數(shù)進(jìn)行的估計(jì)2.估計(jì)量:用于估計(jì)總體參數(shù)的隨機(jī)變量如樣本均值,樣本比例、樣本方差等例如:樣本均值就是總體均值的一個(gè)估計(jì)量3.估計(jì)值:估計(jì)參數(shù)時(shí)計(jì)算出來的統(tǒng)計(jì)量的具體值如果樣本均值x

=80,則80就是的估計(jì)值4.參數(shù)用表示,估計(jì)量用表示一、參數(shù)估計(jì)的一般問題41.參數(shù)估計(jì):總體分布類型已知,僅需對(duì)分布 平均數(shù)標(biāo)準(zhǔn)差比例參數(shù)統(tǒng)計(jì)量xsp總體樣本5參數(shù)統(tǒng)計(jì)量總體樣本5參數(shù)估計(jì)的方法矩估計(jì)法最小二乘法最大似然法順序統(tǒng)計(jì)量法估計(jì)方法點(diǎn)估計(jì)區(qū)間估計(jì)6參數(shù)估計(jì)的方法矩估計(jì)法最小二乘法最大似然法順序統(tǒng)計(jì)量法估計(jì)點(diǎn)估計(jì)(pointestimate)用樣本的估計(jì)量的某個(gè)取值直接作為總體參數(shù)的估計(jì)值例如:用樣本均值直接作為總體均值的估計(jì);用兩個(gè)樣本均值之差直接作為總體均值之差的估計(jì)無法給出估計(jì)值接近總體參數(shù)程度的信息雖然在重復(fù)抽樣條件下,點(diǎn)估計(jì)的均值可望等于總體真值,但由于樣本是隨機(jī)的,抽出一個(gè)具體的樣本得到的估計(jì)值很可能不同于總體真值一個(gè)點(diǎn)估計(jì)量的可靠性是由它的抽樣標(biāo)準(zhǔn)誤差來衡量的,這表明一個(gè)具體的點(diǎn)估計(jì)值無法給出估計(jì)的可靠性的度量

二戰(zhàn)中的點(diǎn)估計(jì)7點(diǎn)估計(jì)(pointestimate)用樣本的估計(jì)量的某個(gè)二戰(zhàn)中的點(diǎn)估計(jì)—

德軍有多少輛坦克?二戰(zhàn)期間,盟軍非常想知道德軍總共制造了多少輛坦克。德國人在制造坦克時(shí)是墨守成規(guī)的,他們把坦克從1開始進(jìn)行了連續(xù)編號(hào)。在戰(zhàn)爭過程中,盟軍繳獲了一些敵軍坦克,并記錄了它們的生產(chǎn)編號(hào)。那么怎樣利用這些號(hào)碼來估計(jì)坦克總數(shù)呢?在這個(gè)問題中,總體參數(shù)是未知的坦克總數(shù)N,而繳獲坦克的編號(hào)則是樣本。制造出來的坦克總數(shù)肯定大于等于記錄的最大編號(hào)。為了找到它比最大編號(hào)大多少,我們先找到被繳獲坦克編號(hào)的平均值,并認(rèn)為這個(gè)值是全部編號(hào)的中點(diǎn)。因此樣本均值乘以2就是總數(shù)的一個(gè)估計(jì);當(dāng)然要特別假設(shè)繳獲的坦克代表了所有坦克的一個(gè)隨機(jī)樣本。這種估計(jì)N的公式的缺點(diǎn)是:不能保證均值的2倍一定大于記錄中的最大編號(hào)。8二戰(zhàn)中的點(diǎn)估計(jì)—

德軍有多少輛坦N的另一個(gè)點(diǎn)估計(jì)公式是:用觀測到的最大編號(hào)乘以因子1+1/n,其中n是被俘虜坦克個(gè)數(shù)。假如你俘虜了10輛坦克,其中最大編號(hào)是50,那么坦克總數(shù)的一個(gè)估計(jì)是(1+1/10)50=55。此處我們認(rèn)為坦克的實(shí)際數(shù)略大于最大編號(hào)。從戰(zhàn)后發(fā)現(xiàn)的德軍記錄來看,盟軍的估計(jì)值非常接近所生產(chǎn)的坦克的真實(shí)值。記錄仍然表明統(tǒng)計(jì)估計(jì)比通常通過其他情報(bào)方式作出估計(jì)要大大接近于真實(shí)數(shù)目。統(tǒng)計(jì)學(xué)家們做得比間諜們更漂亮!資料來源:GUDMUNDR.IVERSEN和MARYGERGRN著,吳喜之等譯:《統(tǒng)計(jì)學(xué)—基本概念和方法》,高等教育出版社,施普林格出版社,2000。9N的另一個(gè)點(diǎn)估計(jì)公式是:用觀測到的最大編號(hào)乘以因子1+1/n點(diǎn)估計(jì)量的常用評(píng)價(jià)準(zhǔn)則:無偏性無偏性:估計(jì)量的數(shù)學(xué)期望與總體待估參數(shù)的真值相等:P(

)BA無偏有偏10點(diǎn)估計(jì)量的常用評(píng)價(jià)準(zhǔn)則:無偏性無偏性:估計(jì)量的數(shù)學(xué)期望與總體點(diǎn)估計(jì)量的常用評(píng)價(jià)準(zhǔn)則:有效性在兩個(gè)無偏估計(jì)量中方差較小的估計(jì)量較為有效。AB的抽樣分布的抽樣分布P(

)11點(diǎn)估計(jì)量的常用評(píng)價(jià)準(zhǔn)則:有效性在兩個(gè)無偏估計(jì)量中估計(jì)量的常用評(píng)價(jià)準(zhǔn)則:一致性指隨著樣本容量的增大,估計(jì)量越來越接近被估計(jì)的總體參數(shù)。AB較小的樣本容量較大的樣本容量P(X)X12估計(jì)量的常用評(píng)價(jià)準(zhǔn)則:一致性指隨著樣本容量的增大,估計(jì)量越來區(qū)間估計(jì)根據(jù)事先確定的置信度1-給出總體參數(shù)的一個(gè)估計(jì)范圍。置信度1-的含義是:在同樣的方法得到的所有置信區(qū)間中,有100(1-)%的區(qū)間包含總體參數(shù)。

抽樣分布是區(qū)間估計(jì)的理論基礎(chǔ)。估計(jì)值(點(diǎn)估計(jì))置信下限置信上限置信區(qū)間13區(qū)間估計(jì)根據(jù)事先確定的置信度1-給出總體參數(shù)的一個(gè)估計(jì)置信區(qū)間的表述

(95%的置信區(qū)間)從均值為185的總體中抽出n=10的20個(gè)樣本構(gòu)造出的20個(gè)置信區(qū)間我沒有抓住參數(shù)!點(diǎn)估計(jì)值14置信區(qū)間的表述

(95%的置信區(qū)間)從均值為185的總體中二、一個(gè)總體參數(shù)的區(qū)間估計(jì)總體參數(shù)符號(hào)表示樣本統(tǒng)計(jì)量均值比例方差15二、一個(gè)總體參數(shù)的區(qū)間估計(jì)總體參數(shù)符號(hào)表示樣本統(tǒng)計(jì)量均值比例(一)總體均值的區(qū)間估計(jì)總體均值區(qū)間的一般表達(dá)式:總體均值的置信區(qū)間是由樣本均值加減估計(jì)誤差得到的估計(jì)誤差由兩部分組成:一是點(diǎn)估計(jì)量的標(biāo)準(zhǔn)誤差,它取決于樣本統(tǒng)計(jì)量的抽樣分布。二是估計(jì)時(shí)所要的求置信水平為時(shí),統(tǒng)計(jì)量分布兩側(cè)面積為的分位數(shù)值,它取決于事先所要求的可靠程度總體均值在置信水平下的置信區(qū)間可一般性地表達(dá)為樣本均值±分位數(shù)值×樣本均值的標(biāo)準(zhǔn)誤差16(一)總體均值的區(qū)間估計(jì)總體均值區(qū)間的一般表達(dá)式:樣本均值±相關(guān)理論總體正態(tài)?n≥30?σ2已知?否是是否否是實(shí)際中總體方差總是未知的,因而這是應(yīng)用最多的公式。在大樣本時(shí)t值可以用z值來近似。根據(jù)中心極限定理得到的近似結(jié)果。

σ未知時(shí)用s來估計(jì)。增大n?數(shù)學(xué)變換?17相關(guān)理論總體正態(tài)?n≥30?σ2已知?否是是否否是實(shí)際中總體Example:用SPSS進(jìn)行總體均值區(qū)間估計(jì)例:兒童電視節(jié)目的贊助商希望了解兒童每周看電視的時(shí)間。下面是對(duì)100名兒童進(jìn)行隨機(jī)調(diào)查的結(jié)果(小時(shí))。計(jì)算平均看電視時(shí)間95%的置信區(qū)間。39.719.534.727.041.315.120.531.318.317.021.529.915.016.436.823.424.128.923.424.440.646.423.639.435.519.529.331.220.634.915.531.638.938.727.226.514.715.628.424.043.920.629.19.521.042.413.932.829.832.933.038.028.720.619.738.637.117.015.123.421.021.829.321.322.823.432.511.343.830.815.823.220.333.530.037.824.426.929.027.727.122.036.123.022.126.522.926.930.225.223.835.321.635.730.822.724.521.926.550.318Example:用SPSS進(jìn)行總體均值區(qū)間估計(jì)例:兒童電視節(jié)總體均值的區(qū)間估計(jì)(例題分析)總體均值在1-置信水平下的置信區(qū)間為

兒童每周看電視的平均時(shí)間的95%置信區(qū)間為25.53分鐘~28.85分鐘。19總體均值的區(qū)間估計(jì)(例題分析)總體均值在1-置信水平下SPSS輸出結(jié)果(數(shù)據(jù):tv.xls)

操作:分析->描述統(tǒng)計(jì)->探索

統(tǒng)計(jì)量標(biāo)準(zhǔn)誤均值27.191.8373均值的95%置信區(qū)間下限25.530

上限28.852

5%修整均值26.977

中值26.500

方差70.104

標(biāo)準(zhǔn)差8.3728

極小值9.5

極大值50.3

20SPSS輸出結(jié)果(數(shù)據(jù):tv.xls)

操作:分析->描述統(tǒng)(二)總體比例的區(qū)間估計(jì)1. 假定條件總體服從二項(xiàng)分布可以由正態(tài)分布來近似np(成功次數(shù))和n(1-p)(失敗次數(shù))均應(yīng)該大于52.使用正態(tài)分布統(tǒng)計(jì)量z3.總體比例在1-置信水平下的置信區(qū)間為樣本比例±分位數(shù)值×樣本比例的標(biāo)準(zhǔn)誤差21(二)總體比例的區(qū)間估計(jì)1. 假定條件3.總體比例在總體比例的置信區(qū)間:例子解:顯然有因此可以用正態(tài)分布進(jìn)行估計(jì)。Z/2=1.645結(jié)論:我們有90%的把握認(rèn)為悉尼青少年中每天都抽煙的青少年比例在19.55%~23.85%之間。1986年對(duì)悉尼995名青少年的隨機(jī)調(diào)查發(fā)現(xiàn),有216人每天都抽煙。試估計(jì)悉尼青少年中每天都抽煙的青少年比例的90%的置信區(qū)間。

22總體比例的置信區(qū)間:例子解:顯然有結(jié)論:我們有90%的把握認(rèn)SPSS的計(jì)算結(jié)果在SPSS中將“是否吸煙”輸入為取值為1和0的屬性變量,權(quán)數(shù)分別為216和779。計(jì)算這一變量均值的置信區(qū)間即為比例的置信區(qū)間。

統(tǒng)計(jì)量標(biāo)準(zhǔn)誤均值.2171.01308均值的90%置信區(qū)間下限.1956

上限.2386

5%修整均值.1857

中值.0000

方差.170

標(biāo)準(zhǔn)差.41247

極小值.00

極大值1.00

范圍1.00

四分位距.00

23SPSS的計(jì)算結(jié)果在SPSS中將“是否吸煙”輸入為取值為1和(三)總體方差的區(qū)間估計(jì)1. 估計(jì)一個(gè)總體的方差或標(biāo)準(zhǔn)差2. 假設(shè)總體服從正態(tài)分布3.總體方差2的點(diǎn)估計(jì)量為s2,且4.總體方差在1-置信水平下的置信區(qū)間為24(三)總體方差的區(qū)間估計(jì)1. 估計(jì)一個(gè)總體的方差或標(biāo)準(zhǔn)差4.總體方差的區(qū)間估計(jì)

(圖示)221-2總體方差的1-的置信區(qū)間自由度為n-1的225總體方差的區(qū)間估計(jì)

(圖示)221-2總體方差的區(qū)間估計(jì)

(例題分析)【例】一家食品生產(chǎn)企業(yè)以生產(chǎn)袋裝食品為主,現(xiàn)從某天生產(chǎn)的一批食品中隨機(jī)抽取了25袋,測得每袋重量如下表所示。已知產(chǎn)品重量的分布服從正態(tài)分布。以95%的置信水平建立該種食品重量方差的置信區(qū)間25袋食品的重量112.5101.0103.0102.0100.5102.6107.595.0108.8115.6100.0123.5102.0101.6102.2116.695.497.8108.6105.0136.8102.8101.598.493.326總體方差的區(qū)間估計(jì)

(例題分析)【例】一家食品生產(chǎn)企業(yè)以生產(chǎn)總體方差的區(qū)間估計(jì)

(例題分析)解:已知n=25,1-=95%,根據(jù)樣本數(shù)據(jù)計(jì)算得

s2=93.21

2置信度為95%的置信區(qū)間為該企業(yè)生產(chǎn)的食品總體重量標(biāo)準(zhǔn)差的95%置信區(qū)間為7.54g~13.43g27總體方差的區(qū)間估計(jì)

(例題分析)解:已知n=25,1-=9待估參數(shù)均值比例方差大樣本小樣本大樣本2分布2已知2已知Z分布2未知Z分布Z分布Z分布2未知t分布一個(gè)總體參數(shù)的區(qū)間估計(jì)

(小結(jié))28待估參數(shù)均值比例方差大樣本小樣本大樣本2分布2已知2已三、兩個(gè)總體參數(shù)的區(qū)間估計(jì)總體參數(shù)符號(hào)表示樣本統(tǒng)計(jì)量均值差比例差方差比29三、兩個(gè)總體參數(shù)的區(qū)間估計(jì)總體參數(shù)符號(hào)表示樣本統(tǒng)計(jì)量均值差比(一)均值之差區(qū)間的一般表達(dá)式兩個(gè)總體均值的置信區(qū)間是由兩個(gè)樣本均值之差加減估計(jì)誤差得到的估計(jì)誤差由兩部分組成:一是點(diǎn)估計(jì)量的標(biāo)準(zhǔn)誤差,它取決于樣本統(tǒng)計(jì)量的抽樣分布。二是估計(jì)時(shí)所要的求置信水平為時(shí),統(tǒng)計(jì)量分布兩側(cè)面積為的分位數(shù)值,它取決于事先所要求的可靠程度兩個(gè)總體均值之差(1-2)在置信水平下的置信區(qū)間可一般性地表達(dá)為(x1-x2)±分位數(shù)值×(x1-x2)±的標(biāo)準(zhǔn)誤差30(一)均值之差區(qū)間的一般表達(dá)式兩個(gè)總體均值的置信區(qū)間是由兩個(gè)兩個(gè)總體均值之差的估計(jì)

(獨(dú)立大樣本)1. 假定條件兩個(gè)總體都服從正態(tài)分布,12、22已知若不是正態(tài)分布,可以用正態(tài)分布來近似(n130和n230)兩個(gè)樣本是獨(dú)立的隨機(jī)樣本2.使用正態(tài)分布統(tǒng)計(jì)量z31兩個(gè)總體均值之差的估計(jì)

(獨(dú)立大樣本)1. 假定條件31兩個(gè)總體均值之差的估計(jì)

(大樣本)1. 12,22已知時(shí),兩個(gè)總體均值之差1-2在1-置信水平下的置信區(qū)間為12、22未知時(shí),兩個(gè)總體均值之差1-2在1-置信水平下的置信區(qū)間為32兩個(gè)總體均值之差的估計(jì)

(大樣本)1. 12,22已兩個(gè)總體均值之差的估計(jì)

(例題分析)【例】某地區(qū)教育管理部門想估計(jì)兩所中學(xué)的學(xué)生高考時(shí)的英語平均分?jǐn)?shù)之差,為此在兩所中學(xué)獨(dú)立抽取兩個(gè)隨機(jī)樣本,有關(guān)數(shù)據(jù)如右表。建立兩所中學(xué)高考英語平均分?jǐn)?shù)之差95%的置信區(qū)間兩個(gè)樣本的有關(guān)數(shù)據(jù)

中學(xué)1中學(xué)2n1=46n2=33S1=5.8

S2=7.2English33兩個(gè)總體均值之差的估計(jì)

(例題分析)【例】某地區(qū)教育管理部門兩個(gè)總體均值之差的估計(jì)

(例題分析)解:

兩個(gè)總體均值之差在1-置信水平下的置信區(qū)間為兩所中學(xué)高考英語平均分?jǐn)?shù)之差95%的置信區(qū)間為5.03分~10.97分34兩個(gè)總體均值之差的估計(jì)

(例題分析)解:兩個(gè)總體均值之差在兩個(gè)總體均值之差的區(qū)間估計(jì)

(獨(dú)立小樣本)35兩個(gè)總體均值之差的區(qū)間估計(jì)

(獨(dú)立小樣本)35兩個(gè)總體均值之差的估計(jì)

(獨(dú)立小樣本:

12=22)1. 假定條件兩個(gè)總體都服從正態(tài)分布兩個(gè)總體方差未知但相等:12=22兩個(gè)獨(dú)立的小樣本(n1<30和n2<30)2.總體方差的合并估計(jì)量估計(jì)量x1-x2的抽樣標(biāo)準(zhǔn)差36兩個(gè)總體均值之差的估計(jì)

(獨(dú)立小樣本:12=22兩個(gè)總體均值之差的估計(jì)

(獨(dú)立小樣本:12=22)4.兩個(gè)樣本均值之差的標(biāo)準(zhǔn)化5.兩個(gè)總體均值之差1-2在1-置信水平下的置信區(qū)間為37兩個(gè)總體均值之差的估計(jì)

(獨(dú)立小樣本:12=22)兩個(gè)總體均值之差的估計(jì)

(例題分析)【例】為估計(jì)兩種方法組裝產(chǎn)品所需時(shí)間的差異,分別對(duì)兩種不同的組裝方法各隨機(jī)安排12名工人,每個(gè)工人組裝一件產(chǎn)品所需的時(shí)間(單位:min)下如表。假定兩種方法組裝產(chǎn)品的時(shí)間服從正態(tài)分布,且方差相等。試以95%的置信水平建立兩種方法組裝產(chǎn)品所需平均時(shí)間差值的置信區(qū)間兩個(gè)方法組裝產(chǎn)品所需的時(shí)間方法1方法228.336.027.631.730.137.222.226.029.038.531.032.037.634.433.831.232.128.020.033.428.830.030.226.52138兩個(gè)總體均值之差的估計(jì)

(例題分析)【例】為估計(jì)兩種方法組裝兩個(gè)總體均值之差的估計(jì)

(例題分析)解:

根據(jù)樣本數(shù)據(jù)計(jì)算得

合并估計(jì)量為兩種方法組裝產(chǎn)品所需平均時(shí)間之差的置信區(qū)間為0.14min~7.26min39兩個(gè)總體均值之差的估計(jì)

(例題分析)解:根據(jù)樣本數(shù)據(jù)計(jì)算得某公司為了解男女推銷員的推銷能力是否有差別,隨機(jī)抽取16名男推銷員和25名女推銷員進(jìn)行測試。男推銷員的平均銷售額為30250元,標(biāo)準(zhǔn)差為18400元,女推銷員的平均銷售額為33750元,標(biāo)準(zhǔn)差為13500元。假設(shè)男女推銷員的銷售額服從正態(tài)分布,且方差相等。試建立男女推銷員銷售額之差的95%的置信區(qū)間。40某公司為了解男女推銷員的推銷能力是否有差別,隨機(jī)抽取16名男解

假設(shè)用隨機(jī)變量

,

分別表示男女推銷員的銷售額,則由已知條件有

又因兩總體方差相等,可以估計(jì)出它們的共同方差:

我們有95%的把握認(rèn)為:男推銷員的銷售額既有可能比女推銷員多6568元,也有可能比女推銷員少13568元,所以男女推銷員的推銷能力沒有顯著差別。41解假設(shè)用隨機(jī)變量,分別表示男兩個(gè)總體均值之差的估計(jì)

(小樣本:1222

)1. 假定條件兩個(gè)總體都服從正態(tài)分布兩個(gè)總體方差未知且不相等:1222兩個(gè)獨(dú)立的小樣本(n1<30和n2<30,n1n2)2.使用統(tǒng)計(jì)量42兩個(gè)總體均值之差的估計(jì)

(小樣本:1222)1兩個(gè)總體均值之差的估計(jì)

(獨(dú)立小樣本:1222

)兩個(gè)總體均值之差1-2在1-置信水平下的置信區(qū)間為自由度43兩個(gè)總體均值之差的估計(jì)

(獨(dú)立小樣本:1222)兩個(gè)總體均值之差的估計(jì)

(例題分析)【例】沿用前例。假定第一種方法隨機(jī)安排12名工人,第二種方法隨機(jī)安排8名工人,即n1=12,n2=8,所得的有關(guān)數(shù)據(jù)如表。假定兩種方法組裝產(chǎn)品的時(shí)間服從正態(tài)分布,且方差不相等。以95%的置信水平建立兩種方法組裝產(chǎn)品所需平均時(shí)間差值的置信區(qū)間兩個(gè)方法組裝產(chǎn)品所需的時(shí)間方法1方法228.336.027.631.730.137.222.226.529.038.531.037.634.433.832.128.020.028.830.030.22144兩個(gè)總體均值之差的估計(jì)

(例題分析)【例】沿用前例。假定第一兩個(gè)總體均值之差的估計(jì)

(例題分析)解:

根據(jù)樣本數(shù)據(jù)計(jì)算得

自由度為

兩種方法組裝產(chǎn)品所需平均時(shí)間之差的置信區(qū)間為0.192min~9.058mni45兩個(gè)總體均值之差的估計(jì)

(例題分析)解:根據(jù)樣本數(shù)據(jù)計(jì)算得兩個(gè)總體均值之差的估計(jì)

(匹配大樣本)假定條件兩個(gè)匹配的大樣本(n130和n230)兩個(gè)總體各觀察值的配對(duì)差服從正態(tài)分布兩個(gè)總體均值之差d=1-2在1-置信水平下的置信區(qū)間為對(duì)應(yīng)差值的均值對(duì)應(yīng)差值的標(biāo)準(zhǔn)差46兩個(gè)總體均值之差的估計(jì)

(匹配大樣本)假定條件對(duì)應(yīng)差值的均值兩個(gè)總體均值之差的估計(jì)

(匹配小樣本)假定條件兩個(gè)匹配的小樣本(n1<30和n2<30)兩個(gè)總體各觀察值的配對(duì)差服從正態(tài)分布

兩個(gè)總體均值之差d=1-2在1-置信水平下的置信區(qū)間為47兩個(gè)總體均值之差的估計(jì)

(匹配小樣本)假定條件47兩個(gè)總體均值之差的估計(jì)

(例題分析)【例】患有高血壓的10名男患者正在進(jìn)行一種鍛煉與飲食的系統(tǒng)調(diào)養(yǎng),以期降低血壓。表中給出每個(gè)病人訓(xùn)練開始時(shí)和六個(gè)月后的舒張壓(單位:mmHg)。由此數(shù)據(jù)集,試確定(開始時(shí)與六個(gè)月后的差的均值)的99%置信區(qū)間,假定差值總體服從正態(tài)分布。病人起始六個(gè)后差值1141142-1216916543158150841801764514714346160157371751705816315769148143510163162148兩個(gè)總體均值之差的估計(jì)

(例題分析)【例】患有高血壓的10名兩個(gè)總體均值之差的估計(jì)

(例題分析)解:

根據(jù)樣本數(shù)據(jù)計(jì)算得高血壓患者開始時(shí)與六個(gè)月后的差的均值的99%置信區(qū)間為1.32

mmHg~6.48mmHg49兩個(gè)總體均值之差的估計(jì)

(例題分析)解:根據(jù)樣本數(shù)據(jù)計(jì)算得1. 假定條件兩個(gè)總體服從二項(xiàng)分布大樣本兩個(gè)樣本是獨(dú)立的2. 兩個(gè)總體比例之差1-2在1-置信水平下的置信區(qū)間為(二)兩個(gè)總體比例之差的區(qū)間估計(jì)501. 假定條件(二)兩個(gè)總體比例之差的區(qū)間估計(jì)50兩個(gè)總體比例之差的估計(jì)

(例題分析)【例】在某個(gè)電視節(jié)目的收視率調(diào)查中,從農(nóng)村隨機(jī)調(diào)查了400人,有32%的人收看了該節(jié)目;城市隨機(jī)調(diào)查了500人,有45%的人收看了該節(jié)目。試以95%的置信水平估計(jì)城市與農(nóng)村收視率差別的置信區(qū)間1251兩個(gè)總體比例之差的估計(jì)

(例題分析)【例】在某個(gè)電視節(jié)目的收兩個(gè)總體比例之差的估計(jì)

(例題分析)解:假設(shè)用p1,p2分別表示某電視節(jié)目城市和農(nóng)村的收視率,則由已知條件可知,n1=500,n2=400,p1=45%,p2=32%,1-=95%,z/2=1.96,

1-2置信度為95%的置信區(qū)間為城市與農(nóng)村收視率差值95%的置信區(qū)間為6.68%~19.32%52兩個(gè)總體比例之差的估計(jì)

(例題分析)解:假設(shè)用p1,p(三)兩個(gè)總體方差比的區(qū)間估計(jì)比較兩個(gè)總體的方差比用兩個(gè)樣本的方差比來判斷如果S12/S22接近于1,說明兩個(gè)總體方差很接近如果S12/S22遠(yuǎn)離1,說明兩個(gè)總體方差之間存在差異3.總體方差比在1-置信水平下的置信區(qū)間為53(三)兩個(gè)總體方差比的區(qū)間估計(jì)比較兩個(gè)總體的方差比53兩個(gè)總體方差比的區(qū)間估計(jì)

(圖示)FF1-F總體方差比的1-的置信區(qū)間方差比置信區(qū)間示意圖54兩個(gè)總體方差比的區(qū)間估計(jì)

(圖示)FF1-F兩個(gè)總體方差比的區(qū)間估計(jì)

(例題分析)【例】為了研究男女學(xué)生在生活費(fèi)支出(單位:元)上的差異,在某大學(xué)各隨機(jī)抽取25名男學(xué)生和25名女學(xué)生,得到下面的結(jié)果男學(xué)生:女學(xué)生:試以90%置信水平估計(jì)男女學(xué)生生活費(fèi)支出方差比的置信區(qū)間55兩個(gè)總體方差比的區(qū)間估計(jì)

(例題分析)【例】為了研究男女學(xué)生兩個(gè)總體方差比的區(qū)間估計(jì)

(例題分析)解:根據(jù)自由度n1=25-1=24,n2=25-1=24,查得F/2(24,24)=1.98,F(xiàn)1-/2(24,24)=1/1.98=0.505

12/22置信度為90%的置信區(qū)間為男女學(xué)生生活費(fèi)支出方差比的置信區(qū)間為0.47~1.84

56兩個(gè)總體方差比的區(qū)間估計(jì)

(例題分析)解:根據(jù)自由度n1兩個(gè)總體參數(shù)的區(qū)間估計(jì)

(小結(jié))待估參數(shù)均值差比例差方差比獨(dú)立大樣本獨(dú)立小樣本匹配樣本獨(dú)立大樣本12、22已12、22未Z分布Z分布12、22已知12、22未知Z分布12=2212≠22正態(tài)總體F分布Z分布t分布t分布Z分布t分布57兩個(gè)總體參數(shù)的區(qū)間估計(jì)

(小結(jié))待估參數(shù)均值差比例差方差比獨(dú)四、必要樣本量的計(jì)算樣本量越大抽樣誤差越小。由于調(diào)查成本方面的原因,在調(diào)查中我們總是希望抽取滿足誤差要求的最小的樣本量。實(shí)際抽樣誤差抽樣平均誤差最大允許誤差58四、必要樣本量的計(jì)算樣本量越大抽樣誤差越小實(shí)際抽樣誤差樣本估計(jì)值與總體真實(shí)值之間的絕對(duì)離差稱為實(shí)際抽樣誤差。由于在實(shí)踐中總體參數(shù)的真實(shí)值是未知的,因此實(shí)際抽樣誤差是不可知的;由于樣本估計(jì)值隨樣本而變化,因此實(shí)際抽樣誤差是一個(gè)隨機(jī)變量。59實(shí)際抽樣誤差樣本估計(jì)值與總體真實(shí)值之間的絕對(duì)離差稱為實(shí)際抽樣抽樣平均誤差抽樣平均誤差:樣本均值的標(biāo)準(zhǔn)差,也就是前面說的標(biāo)準(zhǔn)誤。它反映樣本均值(或比例)與總體均值(比例)的平均差異程度。例如對(duì)簡單隨機(jī)抽樣中的樣本均值有:

或(不重復(fù)抽樣)我們通常說“抽樣調(diào)查中可以對(duì)抽樣誤差進(jìn)行控制”,就是指的抽樣平均誤差。由上面的公式可知影響抽樣誤差的因素包括:總體內(nèi)部的差異程度;樣本容量的大?。怀闃拥姆绞椒椒?。60抽樣平均誤差抽樣平均誤差:樣本均值的標(biāo)準(zhǔn)差,也就是前面說的標(biāo)最大允許誤差最大允許誤差(allowableerror):在確定置信區(qū)間時(shí)樣本均值(或樣本比例)加減的量,一般用E來表示,等于置信區(qū)間長度的一半。在英文文獻(xiàn)中也稱為marginoferror。置信區(qū)間=最大允許誤差是人為確定的,是調(diào)查者在相應(yīng)的置信度下可以容忍的誤差水平。61最大允許誤差最大允許誤差(allowableerror):如何確定必要樣本量?必要樣本量受以下幾個(gè)因素的影響:1、總體標(biāo)準(zhǔn)差。總體的變異程度越大,必要樣本量也就越大。2、最大允許誤差。最大允許誤差越大,需要的樣本量越小。3、置信度1-

。要求的置信度越高,需要的樣本量越大。4、抽樣方式

。其它條件相同,在重復(fù)抽樣、不重復(fù)抽樣;簡單隨機(jī)抽樣與分層抽樣等不同抽樣方式下要求的必要樣本容量也不同。62如何確定必要樣本量?必要樣本量受以下幾個(gè)因素的影響:62簡單隨機(jī)抽樣下估計(jì)總體均值時(shí)

樣本容量的確定式中的總體方差可以通過以下方式估計(jì):根據(jù)歷史資料確定通過試驗(yàn)性調(diào)查估計(jì)63簡單隨機(jī)抽樣下估計(jì)總體均值時(shí)

樣本容量的確定式中的總體方差可簡單隨機(jī)抽樣下估計(jì)總體比例時(shí)

樣本容量的確定式中的總體比例π可以通過以下方式估計(jì):根據(jù)歷史資料確定通過試驗(yàn)性調(diào)查估計(jì)取為0.564簡單隨機(jī)抽樣下估計(jì)總體比例時(shí)

樣本容量的確定64樣本量的確定(實(shí)例1)需要多大規(guī)模的樣本才能在90%的置信水平上保證均值的誤差在±5

之內(nèi)?前期研究表明總體標(biāo)準(zhǔn)差為45.nZE===≈222222(1645)(45)(5)219.2220.向上取整65樣本量的確定(實(shí)例1)需要多大規(guī)模的樣本才能在90%的置樣本量的確定(實(shí)例2)一家市場調(diào)研公司想估計(jì)某地區(qū)有電腦的家庭所占的比例。該公司希望對(duì)比例p的估計(jì)誤差不超過0.05,要求的可靠程度為95%,應(yīng)抽多大容量的樣本(沒有可利用的p估計(jì)值)?解:已知E=0.05,=0.05,Z/2=1.96,當(dāng)π未知時(shí)取為0.5。66樣本量的確定(實(shí)例2)一家市場調(diào)研公司想估計(jì)某地區(qū)有電腦的家實(shí)例3 你在美林證券公司的人力資源部工作。你計(jì)劃在員工中進(jìn)行調(diào)查以求出他們的平均醫(yī)療支出。你希望有95%置信度使得樣本均值的誤差在$50以內(nèi)。過去的研究表明約為$400。需要多大的樣本容量?nZE===≈222222(196)(400)(50)24586246..67實(shí)例3 你在美林證券公司的人力資源部工作。你計(jì)劃在員工中進(jìn)行經(jīng)常不斷地學(xué)習(xí),你就什么都知道。你知道得越多,你就越有力量StudyConstantly,AndYouWillKnowEverything.TheMoreYouKnow,TheMorePowerfulYouWillBe寫在最后經(jīng)常不斷地學(xué)習(xí),你就什么都知道。你知道得越多,你就越有力量寫謝謝你的到來學(xué)習(xí)并沒有結(jié)束,希望大家繼續(xù)努力LearningIsNotOver.IHopeYouWillContinueToWorkHard演講人:XXXXXX時(shí)間:XX年XX月XX日

謝謝你的到來演講人:XXXXXX第七章參數(shù)估計(jì)70第七章參數(shù)估計(jì)1大學(xué)生每周上網(wǎng)花多少時(shí)間?回答類別人數(shù)(人)頻率(%)3小時(shí)以下32163~6小時(shí)3517.56~9小時(shí)3316.59~12小時(shí)2914.512小時(shí)以上7135.5合計(jì)200100

平均上網(wǎng)時(shí)間為8.58小時(shí),標(biāo)準(zhǔn)差為0.69小時(shí)。全校學(xué)生每周的平均上網(wǎng)時(shí)間是多少?每周上網(wǎng)時(shí)間在12小時(shí)以上的學(xué)生比例是多少?你做出估計(jì)的理論依據(jù)是什么?71大學(xué)生每周上網(wǎng)花多少時(shí)間?回答類別人數(shù)(人)頻率(%)3小時(shí)學(xué)習(xí)目標(biāo)1、掌握參數(shù)估計(jì)的基本方法和原理。2、理解并掌握置信區(qū)間和置信水平的含義。3、理解并掌握評(píng)價(jià)估計(jì)量的標(biāo)準(zhǔn)。4、掌握一個(gè)總體參數(shù)的區(qū)間估計(jì)方法,了解兩個(gè)總體參數(shù)區(qū)間估計(jì)的基本方法。5、掌握估計(jì)一個(gè)總體均值和總體比例時(shí)樣本量的確定方法。72學(xué)習(xí)目標(biāo)1、掌握參數(shù)估計(jì)的基本方法和原理。31.參數(shù)估計(jì):總體分布類型已知,僅需對(duì)分布 的未知參數(shù)進(jìn)行的估計(jì)2.估計(jì)量:用于估計(jì)總體參數(shù)的隨機(jī)變量如樣本均值,樣本比例、樣本方差等例如:樣本均值就是總體均值的一個(gè)估計(jì)量3.估計(jì)值:估計(jì)參數(shù)時(shí)計(jì)算出來的統(tǒng)計(jì)量的具體值如果樣本均值x

=80,則80就是的估計(jì)值4.參數(shù)用表示,估計(jì)量用表示一、參數(shù)估計(jì)的一般問題731.參數(shù)估計(jì):總體分布類型已知,僅需對(duì)分布 平均數(shù)標(biāo)準(zhǔn)差比例參數(shù)統(tǒng)計(jì)量xsp總體樣本74參數(shù)統(tǒng)計(jì)量總體樣本5參數(shù)估計(jì)的方法矩估計(jì)法最小二乘法最大似然法順序統(tǒng)計(jì)量法估計(jì)方法點(diǎn)估計(jì)區(qū)間估計(jì)75參數(shù)估計(jì)的方法矩估計(jì)法最小二乘法最大似然法順序統(tǒng)計(jì)量法估計(jì)點(diǎn)估計(jì)(pointestimate)用樣本的估計(jì)量的某個(gè)取值直接作為總體參數(shù)的估計(jì)值例如:用樣本均值直接作為總體均值的估計(jì);用兩個(gè)樣本均值之差直接作為總體均值之差的估計(jì)無法給出估計(jì)值接近總體參數(shù)程度的信息雖然在重復(fù)抽樣條件下,點(diǎn)估計(jì)的均值可望等于總體真值,但由于樣本是隨機(jī)的,抽出一個(gè)具體的樣本得到的估計(jì)值很可能不同于總體真值一個(gè)點(diǎn)估計(jì)量的可靠性是由它的抽樣標(biāo)準(zhǔn)誤差來衡量的,這表明一個(gè)具體的點(diǎn)估計(jì)值無法給出估計(jì)的可靠性的度量

二戰(zhàn)中的點(diǎn)估計(jì)76點(diǎn)估計(jì)(pointestimate)用樣本的估計(jì)量的某個(gè)二戰(zhàn)中的點(diǎn)估計(jì)—

德軍有多少輛坦克?二戰(zhàn)期間,盟軍非常想知道德軍總共制造了多少輛坦克。德國人在制造坦克時(shí)是墨守成規(guī)的,他們把坦克從1開始進(jìn)行了連續(xù)編號(hào)。在戰(zhàn)爭過程中,盟軍繳獲了一些敵軍坦克,并記錄了它們的生產(chǎn)編號(hào)。那么怎樣利用這些號(hào)碼來估計(jì)坦克總數(shù)呢?在這個(gè)問題中,總體參數(shù)是未知的坦克總數(shù)N,而繳獲坦克的編號(hào)則是樣本。制造出來的坦克總數(shù)肯定大于等于記錄的最大編號(hào)。為了找到它比最大編號(hào)大多少,我們先找到被繳獲坦克編號(hào)的平均值,并認(rèn)為這個(gè)值是全部編號(hào)的中點(diǎn)。因此樣本均值乘以2就是總數(shù)的一個(gè)估計(jì);當(dāng)然要特別假設(shè)繳獲的坦克代表了所有坦克的一個(gè)隨機(jī)樣本。這種估計(jì)N的公式的缺點(diǎn)是:不能保證均值的2倍一定大于記錄中的最大編號(hào)。77二戰(zhàn)中的點(diǎn)估計(jì)—

德軍有多少輛坦N的另一個(gè)點(diǎn)估計(jì)公式是:用觀測到的最大編號(hào)乘以因子1+1/n,其中n是被俘虜坦克個(gè)數(shù)。假如你俘虜了10輛坦克,其中最大編號(hào)是50,那么坦克總數(shù)的一個(gè)估計(jì)是(1+1/10)50=55。此處我們認(rèn)為坦克的實(shí)際數(shù)略大于最大編號(hào)。從戰(zhàn)后發(fā)現(xiàn)的德軍記錄來看,盟軍的估計(jì)值非常接近所生產(chǎn)的坦克的真實(shí)值。記錄仍然表明統(tǒng)計(jì)估計(jì)比通常通過其他情報(bào)方式作出估計(jì)要大大接近于真實(shí)數(shù)目。統(tǒng)計(jì)學(xué)家們做得比間諜們更漂亮!資料來源:GUDMUNDR.IVERSEN和MARYGERGRN著,吳喜之等譯:《統(tǒng)計(jì)學(xué)—基本概念和方法》,高等教育出版社,施普林格出版社,2000。78N的另一個(gè)點(diǎn)估計(jì)公式是:用觀測到的最大編號(hào)乘以因子1+1/n點(diǎn)估計(jì)量的常用評(píng)價(jià)準(zhǔn)則:無偏性無偏性:估計(jì)量的數(shù)學(xué)期望與總體待估參數(shù)的真值相等:P(

)BA無偏有偏79點(diǎn)估計(jì)量的常用評(píng)價(jià)準(zhǔn)則:無偏性無偏性:估計(jì)量的數(shù)學(xué)期望與總體點(diǎn)估計(jì)量的常用評(píng)價(jià)準(zhǔn)則:有效性在兩個(gè)無偏估計(jì)量中方差較小的估計(jì)量較為有效。AB的抽樣分布的抽樣分布P(

)80點(diǎn)估計(jì)量的常用評(píng)價(jià)準(zhǔn)則:有效性在兩個(gè)無偏估計(jì)量中估計(jì)量的常用評(píng)價(jià)準(zhǔn)則:一致性指隨著樣本容量的增大,估計(jì)量越來越接近被估計(jì)的總體參數(shù)。AB較小的樣本容量較大的樣本容量P(X)X81估計(jì)量的常用評(píng)價(jià)準(zhǔn)則:一致性指隨著樣本容量的增大,估計(jì)量越來區(qū)間估計(jì)根據(jù)事先確定的置信度1-給出總體參數(shù)的一個(gè)估計(jì)范圍。置信度1-的含義是:在同樣的方法得到的所有置信區(qū)間中,有100(1-)%的區(qū)間包含總體參數(shù)。

抽樣分布是區(qū)間估計(jì)的理論基礎(chǔ)。估計(jì)值(點(diǎn)估計(jì))置信下限置信上限置信區(qū)間82區(qū)間估計(jì)根據(jù)事先確定的置信度1-給出總體參數(shù)的一個(gè)估計(jì)置信區(qū)間的表述

(95%的置信區(qū)間)從均值為185的總體中抽出n=10的20個(gè)樣本構(gòu)造出的20個(gè)置信區(qū)間我沒有抓住參數(shù)!點(diǎn)估計(jì)值83置信區(qū)間的表述

(95%的置信區(qū)間)從均值為185的總體中二、一個(gè)總體參數(shù)的區(qū)間估計(jì)總體參數(shù)符號(hào)表示樣本統(tǒng)計(jì)量均值比例方差84二、一個(gè)總體參數(shù)的區(qū)間估計(jì)總體參數(shù)符號(hào)表示樣本統(tǒng)計(jì)量均值比例(一)總體均值的區(qū)間估計(jì)總體均值區(qū)間的一般表達(dá)式:總體均值的置信區(qū)間是由樣本均值加減估計(jì)誤差得到的估計(jì)誤差由兩部分組成:一是點(diǎn)估計(jì)量的標(biāo)準(zhǔn)誤差,它取決于樣本統(tǒng)計(jì)量的抽樣分布。二是估計(jì)時(shí)所要的求置信水平為時(shí),統(tǒng)計(jì)量分布兩側(cè)面積為的分位數(shù)值,它取決于事先所要求的可靠程度總體均值在置信水平下的置信區(qū)間可一般性地表達(dá)為樣本均值±分位數(shù)值×樣本均值的標(biāo)準(zhǔn)誤差85(一)總體均值的區(qū)間估計(jì)總體均值區(qū)間的一般表達(dá)式:樣本均值±相關(guān)理論總體正態(tài)?n≥30?σ2已知?否是是否否是實(shí)際中總體方差總是未知的,因而這是應(yīng)用最多的公式。在大樣本時(shí)t值可以用z值來近似。根據(jù)中心極限定理得到的近似結(jié)果。

σ未知時(shí)用s來估計(jì)。增大n?數(shù)學(xué)變換?86相關(guān)理論總體正態(tài)?n≥30?σ2已知?否是是否否是實(shí)際中總體Example:用SPSS進(jìn)行總體均值區(qū)間估計(jì)例:兒童電視節(jié)目的贊助商希望了解兒童每周看電視的時(shí)間。下面是對(duì)100名兒童進(jìn)行隨機(jī)調(diào)查的結(jié)果(小時(shí))。計(jì)算平均看電視時(shí)間95%的置信區(qū)間。39.719.534.727.041.315.120.531.318.317.021.529.915.016.436.823.424.128.923.424.440.646.423.639.435.519.529.331.220.634.915.531.638.938.727.226.514.715.628.424.043.920.629.19.521.042.413.932.829.832.933.038.028.720.619.738.637.117.015.123.421.021.829.321.322.823.432.511.343.830.815.823.220.333.530.037.824.426.929.027.727.122.036.123.022.126.522.926.930.225.223.835.321.635.730.822.724.521.926.550.387Example:用SPSS進(jìn)行總體均值區(qū)間估計(jì)例:兒童電視節(jié)總體均值的區(qū)間估計(jì)(例題分析)總體均值在1-置信水平下的置信區(qū)間為

兒童每周看電視的平均時(shí)間的95%置信區(qū)間為25.53分鐘~28.85分鐘。88總體均值的區(qū)間估計(jì)(例題分析)總體均值在1-置信水平下SPSS輸出結(jié)果(數(shù)據(jù):tv.xls)

操作:分析->描述統(tǒng)計(jì)->探索

統(tǒng)計(jì)量標(biāo)準(zhǔn)誤均值27.191.8373均值的95%置信區(qū)間下限25.530

上限28.852

5%修整均值26.977

中值26.500

方差70.104

標(biāo)準(zhǔn)差8.3728

極小值9.5

極大值50.3

89SPSS輸出結(jié)果(數(shù)據(jù):tv.xls)

操作:分析->描述統(tǒng)(二)總體比例的區(qū)間估計(jì)1. 假定條件總體服從二項(xiàng)分布可以由正態(tài)分布來近似np(成功次數(shù))和n(1-p)(失敗次數(shù))均應(yīng)該大于52.使用正態(tài)分布統(tǒng)計(jì)量z3.總體比例在1-置信水平下的置信區(qū)間為樣本比例±分位數(shù)值×樣本比例的標(biāo)準(zhǔn)誤差90(二)總體比例的區(qū)間估計(jì)1. 假定條件3.總體比例在總體比例的置信區(qū)間:例子解:顯然有因此可以用正態(tài)分布進(jìn)行估計(jì)。Z/2=1.645結(jié)論:我們有90%的把握認(rèn)為悉尼青少年中每天都抽煙的青少年比例在19.55%~23.85%之間。1986年對(duì)悉尼995名青少年的隨機(jī)調(diào)查發(fā)現(xiàn),有216人每天都抽煙。試估計(jì)悉尼青少年中每天都抽煙的青少年比例的90%的置信區(qū)間。

91總體比例的置信區(qū)間:例子解:顯然有結(jié)論:我們有90%的把握認(rèn)SPSS的計(jì)算結(jié)果在SPSS中將“是否吸煙”輸入為取值為1和0的屬性變量,權(quán)數(shù)分別為216和779。計(jì)算這一變量均值的置信區(qū)間即為比例的置信區(qū)間。

統(tǒng)計(jì)量標(biāo)準(zhǔn)誤均值.2171.01308均值的90%置信區(qū)間下限.1956

上限.2386

5%修整均值.1857

中值.0000

方差.170

標(biāo)準(zhǔn)差.41247

極小值.00

極大值1.00

范圍1.00

四分位距.00

92SPSS的計(jì)算結(jié)果在SPSS中將“是否吸煙”輸入為取值為1和(三)總體方差的區(qū)間估計(jì)1. 估計(jì)一個(gè)總體的方差或標(biāo)準(zhǔn)差2. 假設(shè)總體服從正態(tài)分布3.總體方差2的點(diǎn)估計(jì)量為s2,且4.總體方差在1-置信水平下的置信區(qū)間為93(三)總體方差的區(qū)間估計(jì)1. 估計(jì)一個(gè)總體的方差或標(biāo)準(zhǔn)差4.總體方差的區(qū)間估計(jì)

(圖示)221-2總體方差的1-的置信區(qū)間自由度為n-1的294總體方差的區(qū)間估計(jì)

(圖示)221-2總體方差的區(qū)間估計(jì)

(例題分析)【例】一家食品生產(chǎn)企業(yè)以生產(chǎn)袋裝食品為主,現(xiàn)從某天生產(chǎn)的一批食品中隨機(jī)抽取了25袋,測得每袋重量如下表所示。已知產(chǎn)品重量的分布服從正態(tài)分布。以95%的置信水平建立該種食品重量方差的置信區(qū)間25袋食品的重量112.5101.0103.0102.0100.5102.6107.595.0108.8115.6100.0123.5102.0101.6102.2116.695.497.8108.6105.0136.8102.8101.598.493.395總體方差的區(qū)間估計(jì)

(例題分析)【例】一家食品生產(chǎn)企業(yè)以生產(chǎn)總體方差的區(qū)間估計(jì)

(例題分析)解:已知n=25,1-=95%,根據(jù)樣本數(shù)據(jù)計(jì)算得

s2=93.21

2置信度為95%的置信區(qū)間為該企業(yè)生產(chǎn)的食品總體重量標(biāo)準(zhǔn)差的95%置信區(qū)間為7.54g~13.43g96總體方差的區(qū)間估計(jì)

(例題分析)解:已知n=25,1-=9待估參數(shù)均值比例方差大樣本小樣本大樣本2分布2已知2已知Z分布2未知Z分布Z分布Z分布2未知t分布一個(gè)總體參數(shù)的區(qū)間估計(jì)

(小結(jié))97待估參數(shù)均值比例方差大樣本小樣本大樣本2分布2已知2已三、兩個(gè)總體參數(shù)的區(qū)間估計(jì)總體參數(shù)符號(hào)表示樣本統(tǒng)計(jì)量均值差比例差方差比98三、兩個(gè)總體參數(shù)的區(qū)間估計(jì)總體參數(shù)符號(hào)表示樣本統(tǒng)計(jì)量均值差比(一)均值之差區(qū)間的一般表達(dá)式兩個(gè)總體均值的置信區(qū)間是由兩個(gè)樣本均值之差加減估計(jì)誤差得到的估計(jì)誤差由兩部分組成:一是點(diǎn)估計(jì)量的標(biāo)準(zhǔn)誤差,它取決于樣本統(tǒng)計(jì)量的抽樣分布。二是估計(jì)時(shí)所要的求置信水平為時(shí),統(tǒng)計(jì)量分布兩側(cè)面積為的分位數(shù)值,它取決于事先所要求的可靠程度兩個(gè)總體均值之差(1-2)在置信水平下的置信區(qū)間可一般性地表達(dá)為(x1-x2)±分位數(shù)值×(x1-x2)±的標(biāo)準(zhǔn)誤差99(一)均值之差區(qū)間的一般表達(dá)式兩個(gè)總體均值的置信區(qū)間是由兩個(gè)兩個(gè)總體均值之差的估計(jì)

(獨(dú)立大樣本)1. 假定條件兩個(gè)總體都服從正態(tài)分布,12、22已知若不是正態(tài)分布,可以用正態(tài)分布來近似(n130和n230)兩個(gè)樣本是獨(dú)立的隨機(jī)樣本2.使用正態(tài)分布統(tǒng)計(jì)量z100兩個(gè)總體均值之差的估計(jì)

(獨(dú)立大樣本)1. 假定條件31兩個(gè)總體均值之差的估計(jì)

(大樣本)1. 12,22已知時(shí),兩個(gè)總體均值之差1-2在1-置信水平下的置信區(qū)間為12、22未知時(shí),兩個(gè)總體均值之差1-2在1-置信水平下的置信區(qū)間為101兩個(gè)總體均值之差的估計(jì)

(大樣本)1. 12,22已兩個(gè)總體均值之差的估計(jì)

(例題分析)【例】某地區(qū)教育管理部門想估計(jì)兩所中學(xué)的學(xué)生高考時(shí)的英語平均分?jǐn)?shù)之差,為此在兩所中學(xué)獨(dú)立抽取兩個(gè)隨機(jī)樣本,有關(guān)數(shù)據(jù)如右表。建立兩所中學(xué)高考英語平均分?jǐn)?shù)之差95%的置信區(qū)間兩個(gè)樣本的有關(guān)數(shù)據(jù)

中學(xué)1中學(xué)2n1=46n2=33S1=5.8

S2=7.2English102兩個(gè)總體均值之差的估計(jì)

(例題分析)【例】某地區(qū)教育管理部門兩個(gè)總體均值之差的估計(jì)

(例題分析)解:

兩個(gè)總體均值之差在1-置信水平下的置信區(qū)間為兩所中學(xué)高考英語平均分?jǐn)?shù)之差95%的置信區(qū)間為5.03分~10.97分103兩個(gè)總體均值之差的估計(jì)

(例題分析)解:兩個(gè)總體均值之差在兩個(gè)總體均值之差的區(qū)間估計(jì)

(獨(dú)立小樣本)104兩個(gè)總體均值之差的區(qū)間估計(jì)

(獨(dú)立小樣本)35兩個(gè)總體均值之差的估計(jì)

(獨(dú)立小樣本:

12=22)1. 假定條件兩個(gè)總體都服從正態(tài)分布兩個(gè)總體方差未知但相等:12=22兩個(gè)獨(dú)立的小樣本(n1<30和n2<30)2.總體方差的合并估計(jì)量估計(jì)量x1-x2的抽樣標(biāo)準(zhǔn)差105兩個(gè)總體均值之差的估計(jì)

(獨(dú)立小樣本:12=22兩個(gè)總體均值之差的估計(jì)

(獨(dú)立小樣本:12=22)4.兩個(gè)樣本均值之差的標(biāo)準(zhǔn)化5.兩個(gè)總體均值之差1-2在1-置信水平下的置信區(qū)間為106兩個(gè)總體均值之差的估計(jì)

(獨(dú)立小樣本:12=22)兩個(gè)總體均值之差的估計(jì)

(例題分析)【例】為估計(jì)兩種方法組裝產(chǎn)品所需時(shí)間的差異,分別對(duì)兩種不同的組裝方法各隨機(jī)安排12名工人,每個(gè)工人組裝一件產(chǎn)品所需的時(shí)間(單位:min)下如表。假定兩種方法組裝產(chǎn)品的時(shí)間服從正態(tài)分布,且方差相等。試以95%的置信水平建立兩種方法組裝產(chǎn)品所需平均時(shí)間差值的置信區(qū)間兩個(gè)方法組裝產(chǎn)品所需的時(shí)間方法1方法228.336.027.631.730.137.222.226.029.038.531.032.037.634.433.831.232.128.020.033.428.830.030.226.521107兩個(gè)總體均值之差的估計(jì)

(例題分析)【例】為估計(jì)兩種方法組裝兩個(gè)總體均值之差的估計(jì)

(例題分析)解:

根據(jù)樣本數(shù)據(jù)計(jì)算得

合并估計(jì)量為兩種方法組裝產(chǎn)品所需平均時(shí)間之差的置信區(qū)間為0.14min~7.26min108兩個(gè)總體均值之差的估計(jì)

(例題分析)解:根據(jù)樣本數(shù)據(jù)計(jì)算得某公司為了解男女推銷員的推銷能力是否有差別,隨機(jī)抽取16名男推銷員和25名女推銷員進(jìn)行測試。男推銷員的平均銷售額為30250元,標(biāo)準(zhǔn)差為18400元,女推銷員的平均銷售額為33750元,標(biāo)準(zhǔn)差為13500元。假設(shè)男女推銷員的銷售額服從正態(tài)分布,且方差相等。試建立男女推銷員銷售額之差的95%的置信區(qū)間。109某公司為了解男女推銷員的推銷能力是否有差別,隨機(jī)抽取16名男解

假設(shè)用隨機(jī)變量

分別表示男女推銷員的銷售額,則由已知條件有

又因兩總體方差相等,可以估計(jì)出它們的共同方差:

我們有95%的把握認(rèn)為:男推銷員的銷售額既有可能比女推銷員多6568元,也有可能比女推銷員少13568元,所以男女推銷員的推銷能力沒有顯著差別。110解假設(shè)用隨機(jī)變量,分別表示男兩個(gè)總體均值之差的估計(jì)

(小樣本:1222

)1. 假定條件兩個(gè)總體都服從正態(tài)分布兩個(gè)總體方差未知且不相等:1222兩個(gè)獨(dú)立的小樣本(n1<30和n2<30,n1n2)2.使用統(tǒng)計(jì)量111兩個(gè)總體均值之差的估計(jì)

(小樣本:1222)1兩個(gè)總體均值之差的估計(jì)

(獨(dú)立小樣本:1222

)兩個(gè)總體均值之差1-2在1-置信水平下的置信區(qū)間為自由度112兩個(gè)總體均值之差的估計(jì)

(獨(dú)立小樣本:1222)兩個(gè)總體均值之差的估計(jì)

(例題分析)【例】沿用前例。假定第一種方法隨機(jī)安排12名工人,第二種方法隨機(jī)安排8名工人,即n1=12,n2=8,所得的有關(guān)數(shù)據(jù)如表。假定兩種方法組裝產(chǎn)品的時(shí)間服從正態(tài)分布,且方差不相等。以95%的置信水平建立兩種方法組裝產(chǎn)品所需平均時(shí)間差值的置信區(qū)間兩個(gè)方法組裝產(chǎn)品所需的時(shí)間方法1方法228.336.027.631.730.137.222.226.529.038.531.037.634.433.832.128.020.028.830.030.221113兩個(gè)總體均值之差的估計(jì)

(例題分析)【例】沿用前例。假定第一兩個(gè)總體均值之差的估計(jì)

(例題分析)解:

根據(jù)樣本數(shù)據(jù)計(jì)算得

自由度為

兩種方法組裝產(chǎn)品所需平均時(shí)間之差的置信區(qū)間為0.192min~9.058mni114兩個(gè)總體均值之差的估計(jì)

(例題分析)解:根據(jù)樣本數(shù)據(jù)計(jì)算得兩個(gè)總體均值之差的估計(jì)

(匹配大樣本)假定條件兩個(gè)匹配的大樣本(n130和n230)兩個(gè)總體各觀察值的配對(duì)差服從正態(tài)分布兩個(gè)總體均值之差d=1-2在1-置信水平下的置信區(qū)間為對(duì)應(yīng)差值的均值對(duì)應(yīng)差值的標(biāo)準(zhǔn)差115兩個(gè)總體均值之差的估計(jì)

(匹配大樣本)假定條件對(duì)應(yīng)差值的均值兩個(gè)總體均值之差的估計(jì)

(匹配小樣本)假定條件兩個(gè)匹配的小樣本(n1<30和n2<30)兩個(gè)總體各觀察值的配對(duì)差服從正態(tài)分布

兩個(gè)總體均值之差d=1-2在1-置信水平下的置信區(qū)間為116兩個(gè)總體均值之差的估計(jì)

(匹配小樣本)假定條件47兩個(gè)總體均值之差的估計(jì)

(例題分析)【例】患有高血壓的10名男患者正在進(jìn)行一種鍛煉與飲食的系統(tǒng)調(diào)養(yǎng),以期降低血壓。表中給出每個(gè)病人訓(xùn)練開始時(shí)和六個(gè)月后的舒張壓(單位:mmHg)。由此數(shù)據(jù)集,試確定(開始時(shí)與六個(gè)月后的差的均值)的99%置信區(qū)間,假定差值總體服從正態(tài)分布。病人起始六個(gè)后差值1141142-12169165431581508418017645147143461601573717517058163157691481435101631621117兩個(gè)總體均值之差的估計(jì)

(例題分析)【例】患有高血壓的10名兩個(gè)總體均值之差的估計(jì)

(例題分析)解:

根據(jù)樣本數(shù)據(jù)計(jì)算得高血壓患者開始時(shí)與六個(gè)月后的差的均值的99%置信區(qū)間為1.32

mmHg~6.48mmHg118兩個(gè)總體均值之差的估計(jì)

(例題分析)解:根據(jù)樣本數(shù)據(jù)計(jì)算得1. 假定條件兩個(gè)總體服從二項(xiàng)分布大樣本兩個(gè)樣本是獨(dú)立的2. 兩個(gè)總體比例之差1-2在1-置信水平下的置信區(qū)間為(二)兩個(gè)總體比例之差的區(qū)間估計(jì)1191. 假定條件(二)兩個(gè)總體比例之差的區(qū)間估計(jì)50兩個(gè)總體比例之差的估計(jì)

(例題分析)【例】在某個(gè)電視節(jié)目的收視率調(diào)查中,從農(nóng)村隨機(jī)調(diào)查了400人,有32%的人收看了該節(jié)目;城市隨機(jī)調(diào)查了500人,有45%的人收看了該節(jié)目。試以95%的置信水平估計(jì)城市與農(nóng)村收視率差別的置信區(qū)間12120兩個(gè)總體比例之差的估計(jì)

(例題分析)【例】在某個(gè)電視節(jié)目的收兩個(gè)總體比例之差的估計(jì)

(例題分析)解:假設(shè)用p1,p2分別表示某電視節(jié)目城市和農(nóng)村的收視率,則由已知條件可知,n1=500,n2=400,p1=45%,p2=32%,1-=95%,z/2=1.96,

1-2置信度為95%的置信區(qū)間為城市與農(nóng)村收視率差值95%的置信區(qū)間為6.68%~19.32%121兩個(gè)總體比例之差的估計(jì)

(例題分析)解:假設(shè)用p1,p(三)兩個(gè)總體方差比的區(qū)間估計(jì)比較兩個(gè)總體的方差比用兩個(gè)樣本的方差比來判斷如果S12/S22接近于1,說明兩個(gè)總體方差很接近如果S12/S22遠(yuǎn)離1,說明兩個(gè)總體方差之間存在差異3.總體方差比在1-置信水平下的置信區(qū)間為122(三)兩個(gè)總體方差比的區(qū)間估計(jì)比較兩個(gè)總體的方差比53兩個(gè)總體方差比的區(qū)間估計(jì)

(圖示)FF1-F總體方差比的1-的置信區(qū)間方差比置信區(qū)間示意圖123兩個(gè)總體方差比的區(qū)間估計(jì)

(圖示)FF1-F兩個(gè)總體方差比的區(qū)間估計(jì)

(例題分析)【例】為了研究男女學(xué)生在生活費(fèi)支出(單位:元)上的差異,在某大學(xué)各隨機(jī)抽取25名男學(xué)生和25名女學(xué)生,得到下面的結(jié)果男學(xué)生:女學(xué)生:試以90%置信水平估計(jì)男女學(xué)生生活費(fèi)支出方差比的

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請(qǐng)下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請(qǐng)聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會(huì)有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫網(wǎng)僅提供信息存儲(chǔ)空間,僅對(duì)用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對(duì)用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對(duì)任何下載內(nèi)容負(fù)責(zé)。
  • 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請(qǐng)與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶因使用這些下載資源對(duì)自己和他人造成任何形式的傷害或損失。

評(píng)論

0/150

提交評(píng)論