




版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請(qǐng)進(jìn)行舉報(bào)或認(rèn)領(lǐng)
文檔簡(jiǎn)介
1、第四節(jié) 區(qū)間估計(jì)的計(jì)算與原理,一、兩種主要的估計(jì)方法 點(diǎn)估計(jì)是指根據(jù)抽取到的具體樣本數(shù)據(jù),代入估計(jì)量得到的一個(gè)估計(jì)值。 區(qū)間估計(jì)是在點(diǎn)估計(jì)的基礎(chǔ)上估計(jì)出總體參數(shù)一個(gè)可能的范圍,同時(shí)還給出總體參數(shù)以多大的概率落在這個(gè)范圍之內(nèi)。,二、為什么要區(qū)間估計(jì)呢? 在上述警察逮捕人數(shù)的例子中,你計(jì)算得出均值為15.6人,你的上司可能會(huì)問,這一均值的確是15.6嗎? 你的回答將是不知道。但是,你的計(jì)算告訴你,這一均值的最優(yōu)估計(jì)值是15.6。 你的上司可能又會(huì)問了,15.6這一估計(jì)值到底有多好? 也就是說,這一均值估計(jì)量包含多大的誤差?,回答上述問題的一個(gè)辦法是抽取很多的樣本,計(jì)算每一個(gè)樣本的均值,然后向上司展
2、示均值估計(jì)量的變化范圍。不過,這種辦法顯得有些笨。 如果你想把這一問題處理得更加高明些,你就應(yīng)該計(jì)算所有樣本均值的平均誤差。均值的標(biāo)準(zhǔn)差有一個(gè)專門的名稱:均值標(biāo)準(zhǔn)誤差。,關(guān)于區(qū)間估計(jì) 設(shè) 為總體x 的未知參數(shù), 為來自總體的容量為n的簡(jiǎn)單隨機(jī)樣本,對(duì)于預(yù)先給定的一個(gè)充分小的正數(shù) ,我們構(gòu)造兩個(gè)統(tǒng)計(jì)量:,使得,則稱區(qū)間 為總體參數(shù) 的區(qū)間估計(jì)或置信區(qū)間。 稱為置信區(qū)間的置信度,也稱置信概率、置信系數(shù)或置信水平, 稱為置信下限, 稱為置信上限。,三、置信區(qū)間的含義 若獨(dú)立地反復(fù)多次抽取容量相同的簡(jiǎn)單隨機(jī)樣本,每一個(gè)樣本都確定一個(gè)隨機(jī)區(qū)間 ,在這些區(qū)間中,包含總體參數(shù) 真值的約占 ,或者說有 的隨機(jī)
3、區(qū)間 會(huì)包含總體參數(shù) 的真值。例如,若 ,獨(dú)立地反復(fù)抽取容量相同的簡(jiǎn)單隨機(jī)樣本1000次,在得到的1000個(gè)隨機(jī)區(qū)間中,不包含總體參數(shù) 真值的大約有50個(gè)。,四、簡(jiǎn)單隨機(jī)抽樣和等距抽樣的參數(shù)估計(jì),(一)總體均值的置信區(qū)間和參數(shù)估計(jì) 總體均值的區(qū)間估計(jì)根據(jù)已知條件不同,有不同的計(jì)算方法。 1.從正態(tài)總體中抽取樣本,且總體方差已知,均值的區(qū)間估計(jì),1.從正態(tài)總體中抽取樣本,且總體方差已知,均值的區(qū)間估計(jì) (1)重復(fù)抽樣的條件下 設(shè) , 已知, 為來自總體的容量為n的簡(jiǎn)單隨機(jī)樣本,則 的抽樣分布為,在重復(fù)抽樣的方式下,總體均值的置信度為1-的置信區(qū)間為,其中, 是標(biāo)準(zhǔn)正態(tài)分布水平的雙側(cè)分位數(shù)。,例一
4、: 假設(shè)參加某種壽險(xiǎn)投保人的年齡服從正態(tài)分布,標(biāo)準(zhǔn)差為=7.77歲。從中抽取36人組成一個(gè)簡(jiǎn)單隨機(jī)樣本(重復(fù)抽樣),其平均年齡為39.5歲,試建立投保人平均年齡的90 %的置信區(qū)間。,解 假設(shè)用隨機(jī)變量X表示某種壽險(xiǎn)投保人的年齡,則由已知條件有 , ,n=36。與置信度90%相對(duì)應(yīng)的=0.10,查表,得到,由公式, 得,總體均值的置信度為90%的置信區(qū)間為 于是可以說,我們有90%的把握確信,壽險(xiǎn)投保人總體的平均年齡介于37.37到 41.63歲之間。,1.從正態(tài)總體中抽取樣本,且總體方差已知,均值的區(qū)間估計(jì) (2)在不重復(fù)抽樣的條件下,置信區(qū)間為,例2 一家食品公司,每天大約生產(chǎn)袋裝食品若干
5、,總體方差為100。為對(duì)產(chǎn)品質(zhì)量進(jìn)行檢測(cè),該企業(yè)質(zhì)檢部門采用抽樣技術(shù),每天抽取一定數(shù)量的食品,以分析每袋重量是否符合質(zhì)量要求。現(xiàn)從某一天生產(chǎn)的一批食品8000袋中隨機(jī)抽取了25袋(不重復(fù)抽樣),測(cè)得它們的重量如下表所示:,已知產(chǎn)品重量服從正態(tài)分布,且總體方差為100。試估計(jì)該批產(chǎn)品平均重量的置信區(qū)間,置信水平為95。,解 已知=10;n=25;1-=59%; =1.96 根據(jù)樣本資料,計(jì)算的樣本均值為: 根據(jù)公式得 =105.361.96 ,即105.363.914115=(101.4459, 109.2741),該批產(chǎn)品平均重量在95置信水平下的置信區(qū)間為:101.4459109.2741。
6、,2. 正態(tài)總體,大樣本,若總體方差 未知,可用樣本標(biāo)準(zhǔn)差S代替。 能夠把公式寫出來嗎? 重復(fù)抽樣:? 不重復(fù)抽樣: ?,例三: 假設(shè)參加某種壽險(xiǎn)投保人的年齡服從正態(tài)分布。從中抽取36人組成一個(gè)簡(jiǎn)單隨機(jī)樣本(重復(fù)抽樣,年齡數(shù)據(jù)見下頁(yè)表),試建立投保人平均年齡的90 %的置信區(qū)間。,解:已知n=36, 1-=90%; 1.645,由于總體方差未知,但為大樣本,故可用樣本方差代替。 根據(jù)樣本資料計(jì)算的樣本均值和樣本標(biāo)準(zhǔn)差為:,則置信區(qū)間為: 即39.52.13=(37.37,41.63),投保人平均年齡在90的置信水平下的置信區(qū)間為37.37歲41.63歲。,3.正態(tài)總體、小樣本情況下,總體方差未
7、知,總體均值的估計(jì) (重復(fù)抽樣條件下) (不重復(fù)抽樣條件下),如果總體服從正態(tài)分布, 只要總體方差已知,即使在小樣本情況下,也可以計(jì)算總體均值的置信區(qū)間。如果總體方差未知,需用樣本方差代替,在小樣本情況下,應(yīng)用t分布來建立總體均值的置信區(qū)間。 t分布是類似正態(tài)分布的一種對(duì)稱分布,通常要比正態(tài)分布平坦和分散。隨著自由度的增大,t分布逐漸趨于正態(tài)分布。,4.非正態(tài)總體且大樣本時(shí),均值的區(qū)間估計(jì) 首先,當(dāng)總體為非正態(tài)分布時(shí),只要樣本容量充分大(一般習(xí)慣上要求n=30), 的抽樣分布近似服從正態(tài)分布。 當(dāng) 已知時(shí),仍可用上述公式,根據(jù)重復(fù)抽樣與否,近似求出總體均值的置信區(qū)間;,其次,當(dāng)未知時(shí),只要將上
8、述公式中的總體標(biāo)準(zhǔn)差用樣本標(biāo)準(zhǔn)差S代替,就可近似得到總體均值的置信區(qū)間: (重復(fù)抽樣條件下) (不重復(fù)抽樣條件下),例 為了解居民用于服裝消費(fèi)的支出情況(非正態(tài)分布),隨機(jī)抽取90戶居民組成一個(gè)簡(jiǎn)單隨機(jī)樣本(重復(fù)抽樣),計(jì)算得樣本均值為810元,樣本標(biāo)準(zhǔn)差為85元,試建立該地區(qū)每戶居民平均用于服裝消費(fèi)支出的95%的置信區(qū)間。,解 假設(shè)用隨機(jī)變量X表示居民的服裝消費(fèi)支出,本題雖然總體分布未知,但由于n=90,是大樣本且未知,所以可利用公式近似得到總體均值的置信區(qū)間。根據(jù)題意, 元, 元,n=90,與置信度95%相對(duì)應(yīng)的=0.05,查表得到:,將這些數(shù)據(jù)代入公式,便可得到總體均值的置信度為95%的
9、置信區(qū)間為,于是,我們有95%的把握認(rèn)為,該地區(qū)每戶居民平均用于服裝消費(fèi)的支出大約介于792.44元到827.56元之間。,總體均值的區(qū)間估計(jì)(置信度為1-) 簡(jiǎn)單隨機(jī)抽樣和等距抽樣,總體均值的區(qū)間估計(jì)(置信度為1-) 簡(jiǎn)單隨機(jī)抽樣和等距抽樣,四、簡(jiǎn)單隨機(jī)抽樣和等距抽樣的參數(shù)估計(jì),(二)兩個(gè)總體均值之差的區(qū)間估計(jì)間 1兩正態(tài)總體方差已知時(shí),且大樣本, 的區(qū)間估計(jì) 因此,兩個(gè)總體均值差 的置信度為 1-的置信區(qū)間為:,如果兩個(gè)總體方差 , 未知,則可利用 , 代替兩個(gè)總體方差即可。 下述公式可近似求出兩個(gè)總體均值差 的置信度為1-的置信區(qū)間。,四、簡(jiǎn)單隨機(jī)抽樣和等距抽樣的參數(shù)估計(jì),(二)兩個(gè)總體
10、均值之差的區(qū)間估計(jì)間 2兩正態(tài)總體方差未知但相等時(shí), 的區(qū)間估計(jì)(小樣本),當(dāng)兩個(gè)正態(tài)總體方差未知但相等,即 ,且 未知時(shí), 這時(shí)兩個(gè)樣本均值之差( )的抽樣分布為,所以 因?yàn)?未知,則用共同方差 的合并估計(jì)量,兩個(gè)總體均值差 的置信度為1-的置信區(qū)間為 其中, 是水平的自由度為 的t分布雙側(cè)分位數(shù)。,例題:,某公司為了解男女推銷員的推銷能力是否有差別,隨機(jī)抽取16名男推銷員和25名女推銷員進(jìn)行測(cè)試。男推銷員的平均銷售額為30250元,標(biāo)準(zhǔn)差為18400元,女推銷員的平均銷售額為33750元,標(biāo)準(zhǔn)差為13500元。假設(shè)男女推銷員的銷售額服從正態(tài)分布,且方差相等。試建立男女推銷員銷售額之差的95
11、%的置信區(qū)間。,解 假設(shè)用隨機(jī)變量 , 分別表示男女推銷員的銷售額,則由已知條件有 元, 元, 元, 元, , 。又因兩總體方差相等,可以估計(jì)出它們的共同方差:,與置信度95%相對(duì)應(yīng)的=0.05,查t 分布表,得到 ,由公式得男女推銷員銷售額之差的置信度為95%的置信區(qū)間為,于是,我們有95%的把握認(rèn)為:男推銷員的銷售額既有可能比女推銷員多6568元,也有可能比女推銷員少13568元,所以男女推銷員的推銷能力沒有顯著差別。,四、簡(jiǎn)單隨機(jī)抽樣和等距抽樣的參數(shù)估計(jì),(二)兩個(gè)總體均值之差的區(qū)間估計(jì)間 3兩正態(tài)總體方差未知但不等時(shí), 的區(qū)間估計(jì)(小樣本),當(dāng)兩正態(tài)總體方差未知但不等時(shí),即 , 未知,
12、且兩者不相等時(shí),統(tǒng)計(jì)量 近似服從于自由度為v的t分布,其中v的計(jì)算公式如下,于是,兩個(gè)總體均值差 的置信度為1-的置信區(qū)間為,例題:,某公司為了解男女推銷員的推銷能力是否有差別,隨機(jī)抽取16名男推銷員和25名女推銷員進(jìn)行測(cè)試。男推銷員的平均銷售額為30250元,標(biāo)準(zhǔn)差為18400元,女推銷員的平均銷售額為33750元,標(biāo)準(zhǔn)差為13500元。假設(shè)男女推銷員的銷售額服從正態(tài)分布,且方差不相等。試建立男女推銷員銷售額之差的95%的置信區(qū)間。,解 首先根據(jù)公式計(jì)算自由度v,,查t分布表,得到 ,由公式得男女推銷員銷售額之差的置信度為95%的置信區(qū)間為,于是,我們有95%的把握認(rèn)為:男推銷員的銷售額既有
13、可能比女推銷員多7434元,也有可能比女推銷員少14434元,所以男女推銷員的推銷能力沒有顯著差別。,四、簡(jiǎn)單隨機(jī)抽樣和等距抽樣的參數(shù)估計(jì),(二)兩個(gè)總體均值之差的區(qū)間估計(jì)間 4兩非正態(tài)總體且大樣本時(shí), 的區(qū)間估計(jì),如果兩個(gè)總體方差 , 已知,則可利用公式下述公式近似求出兩個(gè)總體均值差 的置信度為1-的置信區(qū)間。,如果兩個(gè)總體方差 , 未知,則可利用 , 代替兩個(gè)總體方差即可。 下述公式可近似求出兩個(gè)總體均值差 的置信度為1-的置信區(qū)間。,四、簡(jiǎn)單隨機(jī)抽樣和等距抽樣的參數(shù)估計(jì),(三)一個(gè)總體比例的區(qū)間估計(jì),在許多實(shí)際應(yīng)用中,經(jīng)常會(huì)遇到總體比例的估計(jì)問題。例如:企業(yè)的管理人員想了解一批產(chǎn)品中次品
14、的比例;職工收入中工資外收入所占的比例;某高校學(xué)生參加英語(yǔ)四級(jí)考試的通過率;某地區(qū)綠化荒山新栽樹木的成活率等。,在總體中具有某種特征的單位數(shù)占總體全部單位的比例稱為總體比例,記為p;在樣本中具有某種特征的單位數(shù)占樣本全部單位的比例稱為樣本比例,記為 。在大樣本條件下,樣本比例 的抽樣分布近似服從正態(tài)分布,其數(shù)學(xué)期望為,方差為 即,1.在大樣本情況下,且總體比例已知,重復(fù)抽樣。則總體比例P的置信度為1-的置信區(qū)間為,需要說明:在實(shí)際應(yīng)用中,除了要求 N=30以外,還要求 和 ,且 ,這時(shí)近似效果較好。,2.在大樣本情況下,且總體比例未知,重復(fù)抽樣。則總體比例P的置信度為1-的置信區(qū)間為,例題:,
15、在對(duì)某地區(qū)1000名下崗工人的調(diào)查中發(fā)現(xiàn),女工所占的比例為65%。試建立在下崗工人中,女工所占比例的95%的置信區(qū)間。能否作出下崗工人中女性所占比例超過男性的結(jié)論?,解 假設(shè)用p表示下崗工人中女工所占的比例,則由已知條件可知,樣本比例 。因?yàn)?, , ,所以 的抽樣分布近似服從正態(tài)分布。,對(duì)于=0.05,查表得 。應(yīng)用公式得到在下崗工人中,女工所占比例的置信度為95%的置信區(qū)間為,于是,我們有95%的把握認(rèn)為,下崗工人中女工所占比例大約在0.62到0.68之間,超過了0.5,所以可以得出女性所占比例超過男性的結(jié)論。,3. 如果總體為有限總體,采用不重復(fù)抽樣,且抽樣比 時(shí), 的抽樣分布的方差要用
16、修正系數(shù) 加以修正,這時(shí)總體比例p(未知時(shí))的置信度為1-的置信區(qū)間為,例 某地區(qū)有20所高等院校,有副教授以上職稱的教師7800名。高校的管理部門想了解具有高級(jí)職稱的教師中有基礎(chǔ)研究課題的教師占多大的比例,于是抽取400人組成一個(gè)隨機(jī)樣本(不重復(fù)抽樣)。經(jīng)調(diào)查,其中80人有基礎(chǔ)研究課題。試建立在具有副教授以上職稱的教師中,有基礎(chǔ)研究課題的教師所占比例的95%的置信區(qū)間。,解 假設(shè)用p表示在具有副教授以上職稱的教師中,有基礎(chǔ)研究課題的教師所占的比例,則由已知條件可知N=7800,n=400, 樣本比例 =80/400=0.2 ,=0.05, 。 因?yàn)?,所以 的抽樣分布近似服從正態(tài)分布。,所以
17、 的抽樣分布近似服從正態(tài)分布。又因?yàn)槌闃颖却笥?%,所以要對(duì) 的抽樣分布的方差加以修正。應(yīng)用公式得到在具有副教授以上職稱的教師中,有基礎(chǔ)研究課題的教師所占比例的95%的置信區(qū)間為,于是我們有95%的把握認(rèn)為,該地區(qū)20所高校具有副教授以上職稱的教師中,有( ) 到( )的教師有基礎(chǔ)研究課題。,四、簡(jiǎn)單隨機(jī)抽樣和等距抽樣的參數(shù)估計(jì),(四)一個(gè)正態(tài)總體方差的區(qū)間估計(jì) 為來自總體的容量為n的簡(jiǎn)單隨機(jī)樣本,未知,s為樣本標(biāo)準(zhǔn)差。,總體標(biāo)準(zhǔn)差的置信度為1-的置信區(qū)間為,因此,總體方差 的置信度為1-的置信區(qū)間為,例 假設(shè)公司預(yù)計(jì)的每股收益率服從正態(tài)分布,現(xiàn)有8個(gè)公司組成一個(gè)簡(jiǎn)單隨機(jī)樣本,樣本方差為2.6
18、19,試建立總體方差、總體標(biāo)準(zhǔn)差的95 %的置信區(qū)間。,五、分層抽樣和整群抽樣的參數(shù)估計(jì)嚴(yán)格地講,分層抽樣與整群抽樣的參數(shù)估計(jì)與簡(jiǎn)單隨機(jī)抽樣沒有本質(zhì)區(qū)別。只不過在計(jì)算方差時(shí)存在著不同。,第五節(jié) 樣本容量的確定,我們應(yīng)該一直有這樣的疑問:我們學(xué)習(xí)了問卷的設(shè)計(jì)、調(diào)查方法的選擇、數(shù)據(jù)的描述、數(shù)據(jù)的整理以及參數(shù)估計(jì)的有關(guān)問題。但是,如何進(jìn)行調(diào)查呢?或者說選擇多少樣本呢?或者說需要選擇多少個(gè)被調(diào)查者呢?,第五節(jié) 樣本容量的確定,這就涉及到我們今天要學(xué)的內(nèi)容: 樣本容量的確定。,第五節(jié) 樣本容量的確定,這就涉及到我們今天要學(xué)的內(nèi)容: 樣本容量的確定。,一、影響樣本容量的因素 (一)置信度,也即總體參數(shù)真值
19、落在置信區(qū)間內(nèi)的可靠程度。要求較高的置信度,就需要較大的樣本容量,置信度越高,樣本容量就越大。,一、影響樣本容量的因素 (二)估計(jì)的精度,也即置信區(qū)間的寬度。要求較高的置信度,就會(huì)擴(kuò)大置信區(qū)間的寬度,也就是說降低了估計(jì)的精度。因此,要想既提高估計(jì)的精度,又不降低估計(jì)的可靠性程度,必須增加樣本容量。,一、影響樣本容量的因素 (三)建立置信區(qū)間的費(fèi)用。雖然增加樣本容量可以提高置信區(qū)間的可靠性程度和估計(jì)的精度,但也不是樣本容量愈大愈好。因?yàn)樵黾訕颖救萘?,就?huì)延長(zhǎng)調(diào)查時(shí)間,增大工作量和成本費(fèi)用,同時(shí)還可能增大調(diào)查誤差。,二、估計(jì)總體均值時(shí),樣本容量的確定 對(duì)于正態(tài)總體,在重復(fù)抽樣或抽樣比n/N5%時(shí),總體均值的置信度為1-的置信區(qū)間為,二、估計(jì)總體均值時(shí),樣本容量的確定 記 ,稱為允許誤差,它表示總體均值與樣本均值 的絕對(duì)誤差不超過。于是,可以推出樣本容量的計(jì)算公式為,1樣本容量n與置信度所對(duì)應(yīng)的標(biāo)準(zhǔn)正態(tài)分布的
溫馨提示
- 1. 本站所有資源如無(wú)特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請(qǐng)下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請(qǐng)聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
- 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁(yè)內(nèi)容里面會(huì)有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
- 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
- 5. 人人文庫(kù)網(wǎng)僅提供信息存儲(chǔ)空間,僅對(duì)用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對(duì)用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對(duì)任何下載內(nèi)容負(fù)責(zé)。
- 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請(qǐng)與我們聯(lián)系,我們立即糾正。
- 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶因使用這些下載資源對(duì)自己和他人造成任何形式的傷害或損失。
最新文檔
- 電器安全大班教育
- 小學(xué)健康課:正確洗手
- 健康養(yǎng)老服務(wù)體系構(gòu)建與實(shí)踐
- 小兒重癥肺炎發(fā)病護(hù)理
- 心衰病的中醫(yī)護(hù)理常規(guī)
- 胃內(nèi)鏡手術(shù)護(hù)理
- 腦卒中患者的飲食護(hù)理
- 一堂安全教育課
- 吃水果的健康注意事項(xiàng)
- 2025年冷拉鋼項(xiàng)目規(guī)劃申請(qǐng)報(bào)告模范
- 營(yíng)銷人員財(cái)務(wù)必備之財(cái)務(wù)與營(yíng)銷結(jié)合
- 公安出入境培訓(xùn)課件
- 領(lǐng)袖涅盤培訓(xùn)
- 瑞安市工業(yè)固廢與污泥無(wú)害化處置及資源化利用項(xiàng)目階段性竣工環(huán)境保護(hù)驗(yàn)收?qǐng)?bào)告
- 中草藥的種植技術(shù)
- 寺院裝修施工方案
- DB15T+2819-2022敖漢沙棘栽培技術(shù)規(guī)程
- 門店?duì)I銷課件 完整版
- 高效執(zhí)行四原則(課堂PPT)
- HEP-15,HEP-16,HEP-17系列電氣閥門定位器
- DDST(丹佛發(fā)展篩選試驗(yàn))相關(guān)知識(shí)考核試題及答案
評(píng)論
0/150
提交評(píng)論