抽樣分布與參數(shù)估計(jì)_第1頁
抽樣分布與參數(shù)估計(jì)_第2頁
抽樣分布與參數(shù)估計(jì)_第3頁
抽樣分布與參數(shù)估計(jì)_第4頁
抽樣分布與參數(shù)估計(jì)_第5頁
已閱讀5頁,還剩103頁未讀, 繼續(xù)免費(fèi)閱讀

下載本文檔

版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請(qǐng)進(jìn)行舉報(bào)或認(rèn)領(lǐng)

文檔簡介

抽樣分布與參數(shù)估計(jì)第一頁,共108頁。第4章

抽樣分布與參數(shù)估計(jì)4.1一個(gè)總體抽樣分布4.2參數(shù)估計(jì)的一般問題4.3一個(gè)總體的參數(shù)估計(jì)4.4兩個(gè)總體抽樣分布4.5兩個(gè)總體的參數(shù)估計(jì)第二頁,共108頁。學(xué)習(xí)目標(biāo)理解抽樣分布的意義了解抽樣分布的形成過程理解抽樣分布的性質(zhì)了解評(píng)價(jià)估計(jì)量優(yōu)良性的標(biāo)準(zhǔn)掌握一個(gè)總體參數(shù)的區(qū)間估計(jì)方法掌握兩個(gè)總體參數(shù)的區(qū)間估計(jì)方法掌握抽樣樣本容量的確定方法第三頁,共108頁。4.1一個(gè)總體的抽樣分布一、抽樣分布的概念二、樣本均值的抽樣分布三、樣本比率的抽樣分布四、樣本方差的抽樣分布2023/4/164第四頁,共108頁。案例1:風(fēng)險(xiǎn)分析案例祝賀你!你剛才在一個(gè)有獎(jiǎng)問答比賽中獲勝了,現(xiàn)在你將有機(jī)會(huì)來抽取一個(gè)大獎(jiǎng)。一個(gè)旋轉(zhuǎn)的圓桶里有6個(gè)一模一樣的信封混雜在一起,每個(gè)信封有一張支票,分別是10,20,30,40,50,60(單位:千美元)的大獎(jiǎng)你有三種選擇機(jī)會(huì)抽取一個(gè)信封獲得里面的獎(jiǎng)金依次有放回抽取兩個(gè)信封獲得其平均數(shù)的獎(jiǎng)金無放回抽取兩個(gè)信封獲得其平均數(shù)的獎(jiǎng)金你該怎么做?2023/4/165第五頁,共108頁。重復(fù)抽樣的所有可能樣本組合的樣本均值2023/4/166第六頁,共108頁。所有可能樣本均值的概率分布表2023/4/167第七頁,共108頁。所有可能樣本均值的概率分布圖均值獎(jiǎng)金的均值(期望值):35均值獎(jiǎng)金的方差:145+5/6獲得獎(jiǎng)金至少有5萬美金的概率:1/62023/4/168第八頁,共108頁。不重復(fù)抽樣的樣本均值的概率分布均值獎(jiǎng)金的均值(期望值):35均值獎(jiǎng)金的方差:116+2/3獲得獎(jiǎng)金至少有5萬美金的概率:2/152023/4/169第九頁,共108頁。獎(jiǎng)金總體的概率分布獎(jiǎng)金的均值(期望值):35獎(jiǎng)金的方差:291+2/3獲得獎(jiǎng)金至少有5萬美金的概率:2/62023/4/1610第十頁,共108頁。三種選擇所獲獎(jiǎng)金的均值都是35方差從小到大依次是不重復(fù)選擇、重復(fù)選擇、一次選擇對(duì)于風(fēng)險(xiǎn)規(guī)避者而言,選擇不重復(fù)抽取信封,較為穩(wěn)妥對(duì)于風(fēng)險(xiǎn)愛好者而言,選擇一次抽取信封2023/4/1611第十一頁,共108頁。樣本統(tǒng)計(jì)量的概率分布,是一種理論分布在重復(fù)選取容量為n的樣本時(shí),由該統(tǒng)計(jì)量的所有可能取值形成的相對(duì)頻數(shù)分布。樣本統(tǒng)計(jì)量是隨機(jī)變量樣本均值,樣本比例,樣本方差等結(jié)果來自樣本容量相同的所有可能樣本提供了樣本統(tǒng)計(jì)量長遠(yuǎn)而穩(wěn)定的信息,是進(jìn)行推斷的理論基礎(chǔ),也是抽樣推斷科學(xué)性的重要依據(jù) 一、抽樣分布的概念

(samplingdistribution)第十二頁,共108頁。在重復(fù)選取容量為n的樣本時(shí),由樣本均值的所有可能取值形成的相對(duì)頻數(shù)分布一種理論概率分布推斷總體均值的理論基礎(chǔ) 二、樣本均值的抽樣分布第十三頁,共108頁。設(shè)總體有N個(gè)單位,其均值為的,方差為,從中抽取樣本容量為n的樣本樣本均值的數(shù)學(xué)期望樣本均值的方差重復(fù)抽樣不重復(fù)抽樣1、樣本均值抽樣分布的數(shù)學(xué)特征

(數(shù)學(xué)期望與方差)N/n>20時(shí),兩者近似相等第十四頁,共108頁。

2、樣本均值的抽樣分布與中心極限定理當(dāng)總體服從正態(tài)分布N(μ,σ2)時(shí),來自該總體的所有容量為n的樣本的均值x也服從正態(tài)分布,x

的數(shù)學(xué)期望為μ,方差為σ2/n。即x~N(μ,σ2/n)第十五頁,共108頁。中心極限定理

(centrallimittheorem)當(dāng)樣本容量足夠大時(shí)(n

30),樣本均值的抽樣分布逐漸趨于正態(tài)分布中心極限定理:設(shè)從均值為,方差為

2的一個(gè)任意總體中抽取容量為n的樣本,當(dāng)n充分大時(shí),樣本均值的抽樣分布近似服從均值為μ、方差為σ2/n的正態(tài)分布一個(gè)任意分布的總體x第十六頁,共108頁。中心極限定理

(centrallimittheorem)x的分布趨于正態(tài)分布的過程第十七頁,共108頁。

案例1抽樣分布的數(shù)字特征第十八頁,共108頁。3、標(biāo)準(zhǔn)誤(standarderror)

樣本統(tǒng)計(jì)量的抽樣分布的標(biāo)準(zhǔn)差,稱為統(tǒng)計(jì)量的標(biāo)準(zhǔn)誤,也稱為標(biāo)準(zhǔn)誤差,也稱抽樣標(biāo)準(zhǔn)差。標(biāo)準(zhǔn)誤衡量的是統(tǒng)計(jì)量的離散程度,它測(cè)度了用樣本統(tǒng)計(jì)量估計(jì)總體參數(shù)的精確程度以樣本均值的抽樣分布為例,在重復(fù)抽樣條件下,樣本均值的標(biāo)準(zhǔn)誤為第十九頁,共108頁。估計(jì)的標(biāo)準(zhǔn)誤

(standarderrorofestimation)當(dāng)計(jì)算標(biāo)準(zhǔn)誤時(shí)涉及的總體參數(shù)未知時(shí),用樣本統(tǒng)計(jì)量代替計(jì)算的標(biāo)準(zhǔn)誤,稱為估計(jì)的標(biāo)準(zhǔn)誤以樣本均值的抽樣分布為例,當(dāng)總體標(biāo)準(zhǔn)差未知時(shí),可用樣本標(biāo)準(zhǔn)差s代替,則在重復(fù)抽樣條件下,樣本均值的估計(jì)標(biāo)準(zhǔn)誤為第二十頁,共108頁。三、樣本比率的抽樣分布比率是指總體(或樣本)中具有某種屬性的單位與全部單位總數(shù)之比不同性別的人與全部人數(shù)之比合格品(或不合格品)與全部產(chǎn)品總數(shù)之比總體比例可表示為樣本比例可表示為

第二十一頁,共108頁。在重復(fù)選取容量為n的樣本時(shí),由樣本比例的所有可能取值形成的相對(duì)頻數(shù)分布一種理論概率分布當(dāng)樣本容量很大時(shí),樣本比例的抽樣分布可用正態(tài)分布近似推斷總體比例的理論基礎(chǔ) 樣本比例的抽樣分布第二十二頁,共108頁。樣本比例的數(shù)學(xué)期望樣本比例的方差重復(fù)抽樣不重復(fù)抽樣樣本比例的抽樣分布

(數(shù)學(xué)期望與方差)第二十三頁,共108頁。四、樣本方差的抽樣分布在重復(fù)選取容量為n的樣本時(shí),由樣本方差的所有可能取值形成的相對(duì)頻數(shù)分布對(duì)于來自正態(tài)總體的簡單隨機(jī)樣本,則比值的抽樣分布服從自由度為(n-1)的2分布,即第二十四頁,共108頁。由阿貝(Abbe)于1863年首先給出,后來由海爾墨特(Hermert)和卡·皮爾遜(K·Pearson)分別于1875年和1900年推導(dǎo)出來設(shè),則令,則Y服從自由度為1的2分布,即

當(dāng)總體,從中抽取容量為n的樣本,則2分布

(Chi-squareddistribution)第二十五頁,共108頁。分布的變量值始終為正分布的形狀取決于其自由度n的大小,通常為不對(duì)稱的正偏分布,但隨著自由度的增大逐漸趨于對(duì)稱期望為E(2)=n,方差為D(2)=2n(n為自由度)可加性:若U和V為兩個(gè)獨(dú)立的服從2分布的隨機(jī)變量,U~2(n1),V~2(n2),則U+V這一隨機(jī)變量服從自由度為n1+n2的2分布2分布

(性質(zhì)和特點(diǎn))第二十六頁,共108頁。4.3參數(shù)估計(jì)的一般問題一、估計(jì)量與估計(jì)值二、點(diǎn)估計(jì)與區(qū)間估計(jì)三、評(píng)價(jià)估計(jì)量的標(biāo)準(zhǔn)2023/4/1627第二十七頁,共108頁。估計(jì)量:用于估計(jì)總體參數(shù)的隨機(jī)變量如樣本均值,樣本比率、樣本方差等例如:樣本均值就是總體均值的一個(gè)估計(jì)量參數(shù)用表示,估計(jì)量用表示估計(jì)值:估計(jì)參數(shù)時(shí)計(jì)算出來的統(tǒng)計(jì)量的具體值如果樣本均值x

=80,則80就是的估計(jì)值一、估計(jì)量與估計(jì)值

(estimator&estimatedvalue)第二十八頁,共108頁。二、點(diǎn)估計(jì)和區(qū)間估計(jì)

1、點(diǎn)估計(jì)(pointestimate)用樣本的估計(jì)量直接作為總體參數(shù)的估計(jì)值例如:用樣本均值直接作為總體均值的估計(jì)例如:用兩個(gè)樣本均值之差直接作為總體均值之差的估計(jì)沒有給出估計(jì)值接近總體參數(shù)程度的信息點(diǎn)估計(jì)的方法有矩估計(jì)法、順序統(tǒng)計(jì)量法、最大似然法、最小二乘法等第二十九頁,共108頁。2、區(qū)間估計(jì)

(intervalestimate)在點(diǎn)估計(jì)的基礎(chǔ)上,給出總體參數(shù)估計(jì)的一個(gè)區(qū)間范圍,該區(qū)間由樣本統(tǒng)計(jì)量加減抽樣誤差而得到的根據(jù)樣本統(tǒng)計(jì)量的抽樣分布能夠?qū)颖窘y(tǒng)計(jì)量與總體參數(shù)的接近程度給出一個(gè)概率度量比如,某班級(jí)平均分?jǐn)?shù)在75~85之間,置信水平是95%樣本統(tǒng)計(jì)量

(點(diǎn)估計(jì))置信區(qū)間置信下限置信上限第三十頁,共108頁。

三、評(píng)價(jià)估計(jì)量的標(biāo)準(zhǔn)無偏性有效性一致性第三十一頁,共108頁。無偏性

(unbiasedness)無偏性:估計(jì)量抽樣分布的數(shù)學(xué)期望等于被估計(jì)的總體參數(shù)P(

)BA無偏有偏第三十二頁,共108頁。有效性

(efficiency)有效性:對(duì)同一總體參數(shù)的兩個(gè)無偏點(diǎn)估計(jì)量,有更小標(biāo)準(zhǔn)差的估計(jì)量更有效

AB

的抽樣分布

的抽樣分布P(

)第三十三頁,共108頁。一致性

(consistency)一致性:隨著樣本容量的增大,估計(jì)量的值越來越接近被估計(jì)的總體參數(shù)AB較小的樣本容量較大的樣本容量P(

)第三十四頁,共108頁。一個(gè)總體參數(shù)的區(qū)間估計(jì)總體參數(shù)符號(hào)表示樣本統(tǒng)計(jì)量均值比率方差第三十五頁,共108頁。4.4一個(gè)總體參數(shù)的區(qū)間估計(jì)一、總體均值的區(qū)間估計(jì)二、總體比率的區(qū)間估計(jì)三、總體方差的區(qū)間估計(jì)第三十六頁,共108頁。為什么要進(jìn)行區(qū)間估計(jì)?我從家到良鄉(xiāng)校區(qū)的可能路徑:家公交車站六里橋東地鐵站9號(hào)線房山線良鄉(xiāng)大學(xué)城出租車家公交車站六里橋東公交站832公交步行至上課地家出租車中關(guān)村校區(qū)校車至良鄉(xiāng)哪一條是我的最佳路徑?2023/4/1637第三十七頁,共108頁。有多少比例的成年女性是染發(fā)的?誰會(huì)關(guān)心這個(gè)比例?染發(fā)劑制造銷售商美發(fā)店社會(huì)學(xué)者流行病學(xué)家2023/4/1638第三十八頁,共108頁。區(qū)間估計(jì)可以彌補(bǔ)點(diǎn)估計(jì)的不足告訴我們估計(jì)的誤差范圍提醒我們所做的估計(jì)并不完全有把握告訴你這個(gè)估計(jì)的可靠程度2023/4/1639第三十九頁,共108頁。如何構(gòu)造一個(gè)區(qū)間?第四十頁,共108頁。置信水平在抽樣估計(jì)中,這個(gè)概率1-α叫置信度或置信水平,表明抽樣估計(jì)的有把握程直觀含義:將構(gòu)造置信區(qū)間的步驟重復(fù)很多次,置信區(qū)間包含總體參數(shù)真值的次數(shù)所占的比率是1-α為是區(qū)間未包含總體參數(shù)的比率常用的置信水平值有99%,95%,90%相應(yīng)的為0.01,0.05,0.102023/4/1641第四十一頁,共108頁。由樣本統(tǒng)計(jì)量所構(gòu)造的總體參數(shù)的估計(jì)區(qū)間稱為置信區(qū)間統(tǒng)計(jì)學(xué)家在某種概率程度上確信這個(gè)區(qū)間會(huì)包含真正的總體參數(shù),所以給它取名為置信區(qū)間用一個(gè)具體的樣本所構(gòu)造的區(qū)間是一個(gè)特定的區(qū)間,我們無法知道這個(gè)樣本所產(chǎn)生的區(qū)間是否包含總體參數(shù)的真值我們只能是希望這個(gè)區(qū)間是大量包含總體參數(shù)真值的區(qū)間中的一個(gè),但它也可能是少數(shù)幾個(gè)不包含參數(shù)真值的區(qū)間中的一個(gè)置信區(qū)間

(confidenceinterval)第四十二頁,共108頁。以均值的區(qū)間估計(jì)為例2023/4/1643第四十三頁,共108頁。標(biāo)準(zhǔn)正態(tài)分布1–a

a/2a/202023/4/1644第四十四頁,共108頁。標(biāo)準(zhǔn)正態(tài)分布分位數(shù)1–a

a/2a/20za=0.01,za/2=2.58;

a=0.05,za/2=1.96;a=0.10,za/2=1.65第四十五頁,共108頁。區(qū)間估計(jì)的圖示x95%的樣本-1.96x+1.96x99%的樣本-2.58x+2.58x90%的樣本-1.65x+1.65x第四十六頁,共108頁。影響區(qū)間寬度的因素總體數(shù)據(jù)的離散程度,用來測(cè)度樣本容量,置信水平(1-),影響za/2

的大小有精度還是要可信度?在其它條件不變情況下,區(qū)間估計(jì)可靠性越大,則區(qū)間越寬,所允許的極限誤差越大,精度越低第四十七頁,共108頁。一、總體均值的區(qū)間估計(jì)

(大樣本)

假定條件總體服從正態(tài)分布如果不是正態(tài)分布,可由正態(tài)分布來近似(n

30)使用正態(tài)分布統(tǒng)計(jì)量z總體均值在1-置信水平下的置信區(qū)間為第四十八頁,共108頁??傮w均值的區(qū)間估計(jì)

(案例分析)在JournalofMarketing的一篇文章里,作者Bayus研究了在耐用品更換購買時(shí)“早期更換購買者”與“晚期更換購買者”的區(qū)別。早期更換購買者:在產(chǎn)品使用壽命的早期就進(jìn)行更換購買晚期更換購買者:在產(chǎn)品使用壽命的晚期才進(jìn)行更換購買他研究了汽車的更換購買,當(dāng)汽車車齡小于3年且里程不高于35000英里時(shí),就更換汽車,則該消費(fèi)者屬于“早期更換購買者”;超過7年且里程高于73000英里的消費(fèi)者屬于“晚期更換購買者”(1)從一個(gè)隨機(jī)抽取的800位早期更換購買者的樣本里,得到走訪車行的平均個(gè)數(shù)是3.3,假定標(biāo)準(zhǔn)差=0.71.計(jì)算早期更換購買者走訪車行個(gè)數(shù)總體均值的99%置信區(qū)間;(2)從一個(gè)隨機(jī)抽取的500位晚期更換購買者的樣本里,得到的走訪車行的平均個(gè)數(shù)是4.3,樣本標(biāo)準(zhǔn)差是0.66,計(jì)算走訪車行個(gè)數(shù)總體均值95%的置信區(qū)間。第四十九頁,共108頁。(1)已知X~N(,0.712),n=800,1-=99%,z/2=2.58。根據(jù)樣本數(shù)據(jù)計(jì)算得總體均值在1-置信水平下的置信區(qū)間為:早期更換購買者走訪車行個(gè)數(shù)總體均值的99%置信區(qū)間:3.235~3.365(2)第五十頁,共108頁。在MarketingScience上的一篇文章中,作者Silk和Berndt調(diào)查了廣告公司的產(chǎn)量。他們將廣告公司的產(chǎn)量描述成是來自各種媒體類型(如:電視網(wǎng),電視宣傳專欄,報(bào)紙,廣播電臺(tái),等等)的營業(yè)額的市場(chǎng)份額。(1)他們隨機(jī)抽取了400家美國廣告公司作為樣本,來自電視網(wǎng)營業(yè)額的平均市場(chǎng)份額為7.46%,樣本標(biāo)準(zhǔn)差是1.42%;來自電視宣傳專欄的營業(yè)額的平均市場(chǎng)份額是12.44%,標(biāo)準(zhǔn)差是1.55%。用此樣本的數(shù)據(jù)估計(jì)全美廣告公司中來自電視網(wǎng)營業(yè)額及電視宣傳專欄營業(yè)額的平均市場(chǎng)份額,構(gòu)造95%的置信區(qū)間;(2)美國廣告公司中來自電視宣傳營業(yè)額的市場(chǎng)份額要高于來自電視網(wǎng)營業(yè)額的市場(chǎng)份額嗎?為什么?總體均值的區(qū)間估計(jì)

(案例分析)2023/4/1651第五十一頁,共108頁。2023/4/1652第五十二頁,共108頁。某校的學(xué)生們做過一次調(diào)查,他們想了解該校學(xué)生談戀愛持續(xù)的最長時(shí)間及其影響因素,并試圖比較理工科學(xué)生與經(jīng)管文史類學(xué)生在戀愛持續(xù)時(shí)間上的差異。他們隨機(jī)抽取了該校124位理工科學(xué)生及96位經(jīng)管文史類學(xué)生作為樣本,調(diào)查結(jié)果顯示:理工科學(xué)生戀愛持續(xù)最長時(shí)間平均為5.6個(gè)月,標(biāo)準(zhǔn)差為5個(gè)月;經(jīng)管文史類學(xué)生戀愛持續(xù)最長時(shí)間平均為5.8個(gè)月,標(biāo)準(zhǔn)差為5.2個(gè)月。他們構(gòu)造了95%的置信區(qū)間用以估計(jì)全校理工類學(xué)生與經(jīng)管文史類學(xué)生的戀愛平均時(shí)間。2023/4/1653第五十三頁,共108頁。二、總體均值的區(qū)間估計(jì)

(小樣本)1. 假定條件總體服從正態(tài)分布,且方差(2)

未知小樣本(n<30)使用t

分布統(tǒng)計(jì)量總體均值在1-置信水平下的置信區(qū)間為第五十四頁,共108頁。t分布

t分布是類似正態(tài)分布的一種對(duì)稱分布,它通常要比正態(tài)分布平坦和分散。一個(gè)特定的分布依賴于稱之為自由度的參數(shù)。隨著自由度的增大,分布也逐漸趨于正態(tài)分布xt

分布與標(biāo)準(zhǔn)正態(tài)分布的比較t分布標(biāo)準(zhǔn)正態(tài)分布t不同自由度的t分布標(biāo)準(zhǔn)正態(tài)分布t(df=13)t(df=5)z第五十五頁,共108頁。航空交通控制案例航空交通控制人員的中心任務(wù)是確保飛機(jī)不會(huì)相撞。為了做到這一點(diǎn),當(dāng)兩架飛機(jī)在同一時(shí)間要進(jìn)入同樣的空間時(shí),他們必須迅速地辨明情況。有跟蹤飛機(jī)位置的電視屏幕幫助他們,當(dāng)兩架飛機(jī)的飛行路線要重合時(shí),立刻會(huì)對(duì)控制人員發(fā)出警告?,F(xiàn)在使用的電視屏幕平均警告時(shí)間是15秒(即兩架飛機(jī)開始進(jìn)入碰撞路線的一瞬間與控制人員開始要求飛機(jī)改道時(shí)之間的時(shí)間長度)。目前,一種新的人工智能電視屏幕已經(jīng)研發(fā)出來,它能給空管人員提供更早的警告,研發(fā)人員希望能將平均警告時(shí)間縮短至小于8秒。為了測(cè)試這種新的屏幕,隨機(jī)抽取了15位空管人員,記錄下他們?cè)谀M碰撞課程里的警告時(shí)間(秒),分別是:7.2,7.5,8.0,6.8,7.2,8.4,5.3,7.3,7.6,7.1,9.4,6.4,7.9,6.2,8.7。(1)樣本均值為7.4,s=1.026,求出平均警告時(shí)間μ的95%置信區(qū)間(2)我們能夠有95%的把握確信μ短于8秒嗎?第五十六頁,共108頁。置信區(qū)間小于8,我們有理由相信新屏幕縮短了警告時(shí)間2023/4/1657第五十七頁,共108頁??傮w分布樣本容量σ已知σ未知正態(tài)分布大樣本小樣本非正態(tài)分布大樣本第五十八頁,共108頁。三、總體比率的區(qū)間估計(jì)1. 假定條件總體服從二項(xiàng)分布可以由正態(tài)分布來近似使用正態(tài)分布統(tǒng)計(jì)量z總體比率在1-置信水平下的置信區(qū)間為第五十九頁,共108頁。總體比率的區(qū)間估計(jì)

(例題分析)【例】優(yōu)信咨詢公司(Universum)隨機(jī)對(duì)美國2221個(gè)MBA學(xué)生進(jìn)行的調(diào)查結(jié)果顯示:只有20%的學(xué)生預(yù)期會(huì)在他的第一份工作里呆5年或5年以上。求出這個(gè)比例的95%的置信區(qū)間。根據(jù)這個(gè)區(qū)間是否有很強(qiáng)的證據(jù)表明所有的美國MBA學(xué)生中預(yù)期不會(huì)跳槽的比例不到1/4?解:已知n=2221,p=20%,1-=95%,z/2=1.96沒錯(cuò),這個(gè)比例區(qū)間低于25%第六十頁,共108頁。四、總體方差的區(qū)間估計(jì)1、 估計(jì)一個(gè)總體的方差或標(biāo)準(zhǔn)差2、 假設(shè)總體服從正態(tài)分布3、總體方差2

的點(diǎn)估計(jì)量為s2,且4、總體方差在1-置信水平下的置信區(qū)間為第六十一頁,共108頁??傮w方差的區(qū)間估計(jì)

(圖示)221-2總體方差1-的置信區(qū)間自由度為n-1的2分布第六十二頁,共108頁。總體方差的區(qū)間估計(jì)

(例題分析)【例】一家食品生產(chǎn)企業(yè)以生產(chǎn)袋裝食品為主,現(xiàn)從某天生產(chǎn)的一批食品中隨機(jī)抽取了25袋,測(cè)得每袋重量如下表所示。已知產(chǎn)品重量的分布服從正態(tài)分布。以95%的置信水平建立該種食品重量方差的置信區(qū)間25袋食品的重量112.5101.0103.0102.0100.5102.6107.595.0108.8115.6100.0123.5102.0101.6102.2116.695.497.8108.6105.0136.8102.8101.598.493.3第六十三頁,共108頁??傮w方差的區(qū)間估計(jì)

(例題分析)解:已知n=25,1-=95%,根據(jù)樣本數(shù)據(jù)計(jì)算得

s2=93.21

2置信度為95%的置信區(qū)間為

該企業(yè)生產(chǎn)的食品總體重量標(biāo)準(zhǔn)差的的置信區(qū)間為7.54g~13.43g第六十四頁,共108頁。4.5兩個(gè)總體的抽樣分布一、兩個(gè)樣本均值之差的抽樣分布二、兩個(gè)樣本比例之差的抽樣分布三、兩個(gè)樣本方差比的抽樣分布第六十五頁,共108頁。1、兩個(gè)總體都為正態(tài)分布,即,,獨(dú)立從兩個(gè)總體中分別抽樣2、兩個(gè)樣本均值之差的抽樣分布服從正態(tài)分布,其分布的數(shù)學(xué)期望為兩個(gè)總體均值之差3、方差為各自的方差之和 一、兩個(gè)樣本均值之差的抽樣分布第六十六頁,共108頁。兩個(gè)總體都服從二項(xiàng)分布分別從兩個(gè)總體中抽取容量為n1和n2的獨(dú)立樣本,當(dāng)兩個(gè)樣本都為大樣本時(shí),兩個(gè)樣本比例之差的抽樣分布可用正態(tài)分布來近似分布的數(shù)學(xué)期望為方差為各自的方差之和 二、兩個(gè)樣本比例之差的抽樣分布第六十七頁,共108頁。三、兩個(gè)樣本方差比的抽樣分布

兩個(gè)總體都為正態(tài)分布,即X1~N(μ1,σ12),X2~N(μ2,σ22)從兩個(gè)總體中分別抽取容量為n1和n2的獨(dú)立樣本兩個(gè)樣本方差比的抽樣分布,服從分子自由度為(n1-1),分母自由度為(n2-1)的F分布,即第六十八頁,共108頁。由統(tǒng)計(jì)學(xué)家費(fèi)希爾(R.A.Fisher)提出的,以其姓氏的第一個(gè)字母來命名設(shè)若U為服從自由度為n1的2分布,即U~2(n1),V為服從自由度為n2的2分布,即V~2(n2),且U和V相互獨(dú)立,則稱F為服從自由度n1和n2的F分布,記為F分布

(Fdistribution)第六十九頁,共108頁。F分布

(圖示)

不同自由度的F分布F(1,10)(5,10)(10,10)第七十頁,共108頁。4.6兩個(gè)總體參數(shù)的區(qū)間估計(jì)一、兩個(gè)總體均值之差的區(qū)間估計(jì)二、兩個(gè)總體比率之差的區(qū)間估計(jì)三、兩個(gè)總體方差比的區(qū)間估計(jì)第七十一頁,共108頁。一、兩個(gè)總體參數(shù)的區(qū)間估計(jì)總體參數(shù)符號(hào)表示樣本統(tǒng)計(jì)量均值之差比率之差方差比第七十二頁,共108頁。(一)兩個(gè)總體均值之差的估計(jì)

(獨(dú)立大樣本)1、假定條件兩個(gè)總體都服從正態(tài)分布,12、22已知若不是正態(tài)分布,可以用正態(tài)分布來近似(n130和n230)兩個(gè)樣本是獨(dú)立的隨機(jī)樣本2、使用正態(tài)分布統(tǒng)計(jì)量z第七十三頁,共108頁。兩個(gè)總體均值之差的估計(jì)

(大樣本)3、12,22已知時(shí),兩個(gè)總體均值之差1-2在1-置信水平下的置信區(qū)間為4、12、22未知時(shí),兩個(gè)總體均值之差1-2在1-置信水平下的置信區(qū)間為第七十四頁,共108頁。兩個(gè)總體均值之差的估計(jì)

(例題分析)【例】一所大學(xué)試圖證明學(xué)生擁有汽車不利于學(xué)習(xí)。隨機(jī)抽取了100個(gè)沒有汽車的學(xué)生,其平均GPA是2.68,另外100名擁有汽車的學(xué)生,他們的平均GPA是2.55.假定獨(dú)立性的假設(shè)成立,1表示沒有汽車學(xué)生的平均GPA,2表示沒有汽車學(xué)生的平均GPA(1)使用這些數(shù)據(jù)計(jì)算95%的置信區(qū)間,(2)能否證明1大于2

兩個(gè)樣本的有關(guān)數(shù)據(jù)

沒汽車有汽車n1=100n2=100S1=0.7S2=0.6第七十五頁,共108頁。兩個(gè)總體均值之差的估計(jì)

(例題分析)解:

兩個(gè)總體均值之差在1-置信水平下的置信區(qū)間為這個(gè)區(qū)間中含有0,所以有車學(xué)生的GPA與無車學(xué)生的GPA并無顯著差異第七十六頁,共108頁。某校的學(xué)生們做過一次調(diào)查,他們想了解該校學(xué)生談戀愛持續(xù)的最長時(shí)間及其影響因素,并試圖比較理工科學(xué)生與經(jīng)管文史類學(xué)生在戀愛持續(xù)時(shí)間上的差異。他們隨機(jī)抽取了該校124位理工科學(xué)生及96位經(jīng)管文史類學(xué)生作為樣本,調(diào)查結(jié)果顯示:理工科學(xué)生戀愛持續(xù)最長時(shí)間平均為5.6個(gè)月,標(biāo)準(zhǔn)差為5個(gè)月;經(jīng)管文史類學(xué)生戀愛持續(xù)最長時(shí)間平均為5.8個(gè)月,標(biāo)準(zhǔn)差為5.2個(gè)月。他們構(gòu)造了95%的置信區(qū)間用以分析全校理工類學(xué)生與經(jīng)管文史類學(xué)生的平均最長戀愛時(shí)間是否存在顯著差異。2023/4/1677第七十七頁,共108頁。此區(qū)間含有0,我們可以認(rèn)為該校理工類學(xué)生與經(jīng)管文史類學(xué)生的戀愛持續(xù)時(shí)間不存在顯著差異2023/4/1678第七十八頁,共108頁。(二)兩個(gè)總體均值之差的估計(jì)1

(小樣本:

12=22)1. 假定條件兩個(gè)總體都服從正態(tài)分布兩個(gè)總體方差未知但相等:12=22兩個(gè)獨(dú)立的小樣本(n1<30和n2<30)2、總體方差的合并估計(jì)量估計(jì)量x1-x2的抽樣標(biāo)準(zhǔn)差第七十九頁,共108頁。兩個(gè)總體均值之差的估計(jì)

(小樣本:12=22

)1、兩個(gè)樣本均值之差的標(biāo)準(zhǔn)化兩個(gè)總體均值之差1-2在1-置信水平下的置信區(qū)間為第八十頁,共108頁。兩個(gè)總體均值之差的估計(jì)

(例題分析)【例】為了促進(jìn)學(xué)生節(jié)約用水,學(xué)校更換了新的洗澡系統(tǒng),采用刷卡付費(fèi)形式,每分鐘0.2元。新的系統(tǒng)在很大程度上改變了學(xué)生們的洗澡習(xí)慣,為了了解學(xué)生在春季的洗澡時(shí)間及其影響因素,某校的學(xué)生們做了一項(xiàng)調(diào)查,隨機(jī)抽取47名同學(xué)作為樣本,其中男生22人,女生25人。樣本結(jié)果顯示:男生洗澡平均時(shí)間為8分鐘,標(biāo)準(zhǔn)差為5.3分鐘;女生平均洗澡時(shí)間為11分鐘,標(biāo)準(zhǔn)差為3.5分鐘,據(jù)此推斷全校男生與女生的平均洗澡時(shí)間,并構(gòu)造兩者之差的95%的置信區(qū)間,分析兩者是否有顯著差異。第八十一頁,共108頁。假設(shè)男生洗澡時(shí)間的方差等于女生洗澡時(shí)間的方差該區(qū)間不包含0,表明兩者差異顯著2023/4/1682第八十二頁,共108頁。兩個(gè)總體均值之差的估計(jì)2

(小樣本:1222

)1. 假定條件兩個(gè)總體都服從正態(tài)分布兩個(gè)總體方差未知且不相等:1222兩個(gè)獨(dú)立的小樣本(n1<30和n2<30)使用統(tǒng)計(jì)量第八十三頁,共108頁。兩個(gè)總體均值之差的估計(jì)

(小樣本:1222

)兩個(gè)總體均值之差1-2在1-置信水平下的置信區(qū)間為自由度第八十四頁,共108頁。兩個(gè)總體均值之差的估計(jì)

(例題分析)【例】為了促進(jìn)學(xué)生節(jié)約用水,學(xué)校更換了新的洗澡系統(tǒng),采用刷卡付費(fèi)形式,每分鐘0.2元。新的系統(tǒng)在很大程度上改變了學(xué)生們的洗澡習(xí)慣,為了了解學(xué)生在春季的洗澡時(shí)間及其影響因素,某校的學(xué)生們做了一項(xiàng)調(diào)查,隨機(jī)抽取47名同學(xué)作為樣本,其中男生22人,女生25人。樣本結(jié)果顯示:男生洗澡平均時(shí)間為8分鐘,標(biāo)準(zhǔn)差為5.3分鐘;女生平均洗澡時(shí)間為11分鐘,標(biāo)準(zhǔn)差為3.5分鐘,據(jù)此推斷全校男生與女生的平均洗澡時(shí)間,并構(gòu)造兩者之差的95%的置信區(qū)間,分析兩者是否有顯著差異。第八十五頁,共108頁。假設(shè)男生洗澡時(shí)間的方差不等于女生洗澡時(shí)間的方差該區(qū)間不包含0,表明兩者差異顯著2023/4/1686第八十六頁,共108頁。(三)兩個(gè)總體均值之差的估計(jì)

(匹配大樣本)假定條件兩個(gè)匹配的大樣本(n130和n230)兩個(gè)總體各觀察值的配對(duì)差服從正態(tài)分布兩個(gè)總體均值之差d=1-2在1-置信水平下的置信區(qū)間為對(duì)應(yīng)差值的均值對(duì)應(yīng)差值的標(biāo)準(zhǔn)差第八十七頁,共108頁。兩個(gè)總體均值之差的估計(jì)

(匹配小樣本)假定條件兩個(gè)匹配的大樣本(n1<30和n2<30)兩個(gè)總體各觀察值的配對(duì)差服從正態(tài)分布兩個(gè)總體均值之差d=1-2在1-置信水平下的置信區(qū)間為第八十八頁,共108頁。兩個(gè)總體均值之差的估計(jì)

(例題分析)【例】由10名學(xué)生組成一個(gè)隨機(jī)樣本,讓他們分別采用A和B兩套試卷進(jìn)行測(cè)試,結(jié)果如下表。試建立兩種試卷分?jǐn)?shù)之差d=1-295%的置信區(qū)間

10名學(xué)生兩套試卷的得分學(xué)生編號(hào)試卷A試卷B差值d17871726344193726111489845691741754951-27685513876601698577810553916第八十九頁,共108頁。兩個(gè)總體均值之差的估計(jì)

(例題分析)解:根據(jù)樣本數(shù)據(jù)計(jì)算得兩種試卷所產(chǎn)生的分?jǐn)?shù)之差的置信區(qū)間為6.33分~15.67分第九十頁,共108頁。假定條件兩個(gè)總體服從二項(xiàng)分布可以用正態(tài)分布來近似兩個(gè)樣本是獨(dú)立的兩個(gè)總體比率之差1-2在1-置信水平下的置信區(qū)間為二、兩個(gè)總體比率之差的區(qū)間估計(jì)第九十一頁,共108頁。兩個(gè)總體比率之差的估計(jì)

(例題分析)【例】在Journalofadvertising的一篇文章里Weinberger比較了美國和英國電視廣告使用的幽默情況。英國的400個(gè)隨機(jī)電視廣告里有142個(gè)使用了幽默,而美國的500個(gè)隨機(jī)廣告里有122個(gè)使用了幽默。計(jì)算英國廣告使用幽默比例與美國廣告使用幽默比例的差異的95%的置信區(qū)間。并說明,兩者之間的差異是否顯著?英國的廣告使用幽默比例更高第九十二頁,共108頁。三、兩個(gè)總體方差比的區(qū)間估計(jì)1、比較兩個(gè)總體的方差比用兩個(gè)樣本的方差比來判斷如果S12/S22接近于1,說明兩個(gè)總體方差很接近如果S12/S22遠(yuǎn)離1,說明兩個(gè)總體方差之間存在差異2、總體方差比在1-置信水平下的置信區(qū)間為第九十三頁,共108頁。兩個(gè)總體方差比的區(qū)間估計(jì)

(圖示)FF1-F總體方差比1-的置信區(qū)間方差比置信區(qū)間示意圖第九十四頁,共108頁。【例】為了促進(jìn)學(xué)生節(jié)約用水,學(xué)校更換了新的洗澡系統(tǒng),采用刷卡付費(fèi)形式,每分鐘0.2元。新的系統(tǒng)在很大程度上改變了學(xué)生們的洗澡習(xí)慣,為了了解學(xué)生在春季的洗澡時(shí)間及其影響因素,某校的學(xué)生們做了一項(xiàng)調(diào)查,隨機(jī)抽取47名同學(xué)作為樣本,其中男生22人,女生25人。樣本結(jié)果顯示:男生洗澡平均時(shí)間為8分鐘,標(biāo)準(zhǔn)差為5.3分鐘;女生平均洗澡時(shí)間為11分鐘,標(biāo)準(zhǔn)差為3.5分鐘,據(jù)此構(gòu)造全校男生洗澡時(shí)間的方差與女生洗澡時(shí)間的方差之比的95%置信區(qū)間,并重新分析兩者平均洗澡時(shí)間之差是否顯著。2023/4/1695第九十五頁,共108頁。該區(qū)間不含有1,表明兩者方差由顯著差異2023/4/1696第九十六頁,共108頁。4.7抽樣的必要樣本容量的確定一、估計(jì)總體均值

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請(qǐng)下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請(qǐng)聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會(huì)有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫網(wǎng)僅提供信息存儲(chǔ)空間,僅對(duì)用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對(duì)用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對(duì)任何下載內(nèi)容負(fù)責(zé)。
  • 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請(qǐng)與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶因使用這些下載資源對(duì)自己和他人造成任何形式的傷害或損失。

評(píng)論

0/150

提交評(píng)論