




版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進行舉報或認領(lǐng)
文檔簡介
1、是是以概率抽樣的樣本觀測結(jié)果去估以概率抽樣的樣本觀測結(jié)果去估計未知的總體數(shù)量特征計未知的總體數(shù)量特征(一)總體分布及其特征(一)總體分布及其特征 總體分布總體分布: 是指總體中所有個體關(guān)于某個變量(標志)的取是指總體中所有個體關(guān)于某個變量(標志)的取值所形成的分布。值所形成的分布。 總體參數(shù):總體參數(shù):反映總體分布特征的指標反映總體分布特征的指標 一、抽樣分布的基本問題一、抽樣分布的基本問題總體總體: 836: 836家上市公司家上市公司總體分布總體分布: 836: 836家上市公司當(dāng)天的漲幅家上市公司當(dāng)天的漲幅 x xi i i=1i=1.836.836總體參數(shù):總體參數(shù):4.36%X 總體
2、參數(shù)的值應(yīng)由總體全部單位的標志值計算而來:總體參數(shù)的值應(yīng)由總體全部單位的標志值計算而來:n對于特定的總體,總體參數(shù)值是對于特定的總體,總體參數(shù)值是唯一唯一的。的。n對于無限總體和非全面調(diào)查的有限總體,總體參數(shù)的值通對于無限總體和非全面調(diào)查的有限總體,總體參數(shù)的值通常常未知未知,只能通過樣本來估計。,只能通過樣本來估計。常用的總體參數(shù)有兩個:常用的總體參數(shù)有兩個:總體均值總體均值(包括是非變量的均值);(包括是非變量的均值);總體方差或標準差總體方差或標準差(包括是非變量的方差或標準差)。(包括是非變量的方差或標準差)。NXXX,210N1N miimiiiNiiffXXNXX111或或 mii
3、imiiNiifXXfSXXNS121212211或或PNNQNNP1,01PQSP 2PXP(二)樣本分布及其特征(二)樣本分布及其特征當(dāng)樣本容量很大,或者是當(dāng)逐漸增大時,樣本分布會接近當(dāng)樣本容量很大,或者是當(dāng)逐漸增大時,樣本分布會接近總體分布。總體分布。如果樣本容量很小,樣本分布就有可能與總體分布相差很如果樣本容量很小,樣本分布就有可能與總體分布相差很大,抽樣估計的結(jié)果就會很差。大,抽樣估計的結(jié)果就會很差。樣本統(tǒng)計量:樣本統(tǒng)計量:反映樣本分布特征的指標,反映樣本分布特征的指標, T T樣本統(tǒng)計量是隨機變量,它的取值隨樣本的不同而發(fā)生樣本統(tǒng)計量是隨機變量,它的取值隨樣本的不同而發(fā)生變化。變化
4、。樣本統(tǒng)計值:樣本統(tǒng)計值:是樣本統(tǒng)計量的值,由樣本單位是樣本統(tǒng)計量的值,由樣本單位的標志值計算而來,用來估計總體參數(shù)。的標志值計算而來,用來估計總體參數(shù)。 xi i=1604.86%x 樣本是隨機產(chǎn)生的,為樣本是隨機產(chǎn)生的,為了提高樣本的代表性,了提高樣本的代表性,可以選擇合適的抽樣組可以選擇合適的抽樣組織方式來產(chǎn)生樣本織方式來產(chǎn)生樣本抽樣估計就是以可知但非唯一的樣本統(tǒng)計量的值抽樣估計就是以可知但非唯一的樣本統(tǒng)計量的值 來估計未知但唯一的總體參數(shù)的值。來估計未知但唯一的總體參數(shù)的值。與總體參數(shù)相對應(yīng),常用的樣本統(tǒng)計量有與總體參數(shù)相對應(yīng),常用的樣本統(tǒng)計量有 樣本均值(或樣本成數(shù))、樣本均值(或樣
5、本成數(shù))、 樣本方差(或樣本標準差樣本方差(或樣本標準差 )。)。miimiiiniiffxxnxx111或nxxx,210n1nmiiimiiniifxxfsxxns12121221111或pnnqnnp1,01pxppqnnsp12假設(shè)從容量為假設(shè)從容量為N N的總體中抽取容量為的總體中抽取容量為n n的樣本最多可抽取的樣本最多可抽取m m套不套不同的樣本,則同的樣本,則m m個樣本統(tǒng)計值的頻率分布,即為抽樣分布。個樣本統(tǒng)計值的頻率分布,即為抽樣分布。實際的抽樣分布形成取決于以下五個因素:實際的抽樣分布形成取決于以下五個因素:總體分布總體分布(越集中,抽樣分布越集中)(越集中,抽樣分布越集
6、中)樣本容量樣本容量(最關(guān)鍵因素,容量越大抽樣分布越集中)(最關(guān)鍵因素,容量越大抽樣分布越集中)抽樣方法抽樣方法(采用重復(fù)或不重復(fù)方法,抽樣分布不同)(采用重復(fù)或不重復(fù)方法,抽樣分布不同)抽樣組織形式抽樣組織形式(不同形式下的樣本個數(shù)及結(jié)構(gòu)不同,抽樣(不同形式下的樣本個數(shù)及結(jié)構(gòu)不同,抽樣分布也不同)分布也不同)估計量構(gòu)造估計量構(gòu)造(樣本估計量不同,抽樣分布不同)(樣本估計量不同,抽樣分布不同)1x1x2x2xxX大樣本大樣本小樣本小樣本Xx返回2、抽樣分布形式、抽樣分布形式設(shè)從容量為設(shè)從容量為N的有限總體中抽取容量為的有限總體中抽取容量為n的樣本,最多可的樣本,最多可抽取抽取m套不同樣本,計算
7、得套不同樣本,計算得m個樣本統(tǒng)計值個樣本統(tǒng)計值n設(shè)設(shè)m個樣本統(tǒng)計值經(jīng)單項式分組可分為個樣本統(tǒng)計值經(jīng)單項式分組可分為k組,則抽樣分布的組,則抽樣分布的表現(xiàn)形式為:表現(xiàn)形式為:ix1x3xkx2x樣本均值的抽樣分布形式樣本均值的抽樣分布形式i123ki123k樣本成數(shù)的抽樣分布形式樣本成數(shù)的抽樣分布形式ip1p2p3pkpmki, 1元)(42550464238341NXXNii 32584)0()4()8(122222122 NiiXXNS不同抽樣方法下樣本平均數(shù)的抽樣分布不同抽樣方法下樣本平均數(shù)的抽樣分布第一第一單位單位第二第二單位單位樣本樣本均值均值整理出樣本平均數(shù)的頻率分布如下整理出樣本平
8、均數(shù)的頻率分布如下:x樣本均值的抽樣本均值的抽樣分布樣分布0%5%10%15%20%25%343638404244464850樣本均值的抽樣分布圖樣本均值的抽樣分布圖(2)用不重復(fù)抽樣方法)用不重復(fù)抽樣方法 從從5個工人(日工資為個工人(日工資為34,38,42,46,50元)中元)中隨機抽取隨機抽取2人構(gòu)成樣本(考慮順序),共人構(gòu)成樣本(考慮順序),共5420個樣本。所有可能個樣本。所有可能樣本及其平均數(shù)樣本及其平均數(shù):第一第一單位單位第二第二單位單位樣本樣本均值均值整理出樣本平均數(shù)的頻率分布如下整理出樣本平均數(shù)的頻率分布如下:x0%5%10%15%20%25%36384042444648樣
9、本均值的抽樣分布圖樣本均值的抽樣分布圖樣本均值的抽樣分樣本均值的抽樣分布布設(shè)某總體由設(shè)某總體由1010個球組成,其中紅球個球組成,其中紅球6 6個,現(xiàn)從總體個,現(xiàn)從總體中隨機抽取中隨機抽取4 4個球,那么在重復(fù)抽樣和不重復(fù)抽樣個球,那么在重復(fù)抽樣和不重復(fù)抽樣下紅球比重(樣本成數(shù))的抽樣分布分別如何?下紅球比重(樣本成數(shù))的抽樣分布分別如何?ipi重復(fù)抽樣下紅球比重的抽樣分布重復(fù)抽樣下紅球比重的抽樣分布0.6P 總體成數(shù)為總體成數(shù)為(1)0.26671NPPN總體方差為總體方差為在重復(fù)抽樣下,樣本中紅球的比重服從二項分布在重復(fù)抽樣下,樣本中紅球的比重服從二項分布1111()nnn nnnC P
10、Q01101010( ,)nnNNnNC Cn n N NCipi121024210902108021015210 不重復(fù)抽樣下紅球比重的抽樣分布不重復(fù)抽樣下紅球比重的抽樣分布樣本統(tǒng)計量的樣本統(tǒng)計量的數(shù)學(xué)期望數(shù)學(xué)期望:即所有樣本統(tǒng)計值的平均數(shù)即所有樣本統(tǒng)計值的平均數(shù)樣本統(tǒng)計量的樣本統(tǒng)計量的方差方差:即所有樣本統(tǒng)計值關(guān)于數(shù)學(xué)期望的方差即所有樣本統(tǒng)計值關(guān)于數(shù)學(xué)期望的方差iiEV2)()(iiE)(在前面的例題中,在前面的例題中,重復(fù)抽樣重復(fù)抽樣的抽樣分布如下的抽樣分布如下:x樣本平均數(shù)樣本平均數(shù)的期望與方差:的期望與方差:XxxEi(元)42%450%836%434)(16%4)4250(%8)4
11、236(%4)4234()()(2222ixExxVi不重復(fù)抽樣的抽樣分布如下不重復(fù)抽樣的抽樣分布如下: x樣本平均數(shù)樣本平均數(shù)的期望與方差:的期望與方差:XxxEi42)(12)()(2ixExxVi 樣本成數(shù)的抽樣分布:樣本成數(shù)的抽樣分布:(1)樣本成數(shù)的期望值:)樣本成數(shù)的期望值: 在重復(fù)或不重復(fù)抽樣下,樣本成數(shù)的均值都等于總體成數(shù)在重復(fù)或不重復(fù)抽樣下,樣本成數(shù)的均值都等于總體成數(shù)(2)樣本成數(shù)抽樣分布的方差:)樣本成數(shù)抽樣分布的方差: 重復(fù)抽樣方差大于不重復(fù)抽樣,重復(fù)抽樣方差大于不重復(fù)抽樣,顯然不重復(fù)抽樣下樣本成數(shù)顯然不重復(fù)抽樣下樣本成數(shù)的抽樣分布較為集中的抽樣分布較為集中結(jié)論:結(jié)論:
12、),(2SXNXxXxE)()()(2重復(fù)抽樣nSxV)()1 ()(2有限總體且不重復(fù)抽樣NnnSxV50X10s50)(xE5)(xVn=45 . 2)(xVn=16x抽樣分布抽樣分布(重復(fù)抽樣)(重復(fù)抽樣)任一總體(不要求正態(tài)),期望值任一總體(不要求正態(tài)),期望值 ,方差,方差 ,當(dāng)當(dāng)n足夠大(當(dāng)足夠大(當(dāng)n30,大樣本,大樣本), 趨于正態(tài)分布趨于正態(tài)分布X2SxXxE)()()(2重復(fù)抽樣nSxV2、中心極限定理、中心極限定理)()1 ()(2有限總體且不重復(fù)抽樣NnnSxV當(dāng)樣本容量足夠大時(大樣本)當(dāng)樣本容量足夠大時(大樣本) ,抽樣分布,抽樣分布趨于正態(tài)分布趨于正態(tài)分布小樣小
13、樣本本xXxE)()()(2重復(fù)抽樣nSxV從任意分從任意分布的總體布的總體中抽樣中抽樣大樣大樣本本若正態(tài)總體方差未知且若正態(tài)總體方差未知且n較小,則較小,則 服從于自由度為服從于自由度為n-1的的 t分布分布任一方差已知總體但任一方差已知總體但n較小,較小, 服從于自由度為服從于自由度為n-1的的 t分布分布xx3、t分布定理分布定理(二)樣本成數(shù)的抽樣分布定理(二)樣本成數(shù)的抽樣分布定理1、二項分布定理、二項分布定理從一個數(shù)學(xué)期望為從一個數(shù)學(xué)期望為p p、方差為、方差為 的是非變的是非變量(量(0-10-1分布)總體中隨機重復(fù)地抽取容量為分布)總體中隨機重復(fù)地抽取容量為n n的樣本,的樣本
14、,那么樣本中含有那么樣本中含有 個某類變量值的概率為:個某類變量值的概率為: 1111()nnn nnnC P Q1nPQ2.2.超幾何分布定理超幾何分布定理 從一個數(shù)學(xué)期望為從一個數(shù)學(xué)期望為p p、方差為、方差為 的是非變量的是非變量(0-10-1分布)總體中隨機不重復(fù)地抽取容量為分布)總體中隨機不重復(fù)地抽取容量為n n的樣本,的樣本,那么當(dāng)那么當(dāng) 同時同時 時,樣本中含有時,樣本中含有 個某類變量值的概率為:個某類變量值的概率為:01101010(,)nnNNnNCCnnNNC1nnN 0nN 1PQ從一個數(shù)學(xué)期望為從一個數(shù)學(xué)期望為p p、方差為、方差為 的是非變量(的是非變量(0-10-
15、1分布)總體分布)總體中隨機抽取容量為中隨機抽取容量為n n的樣本,的樣本,當(dāng)當(dāng)n足夠大足夠大 ( nP5, n (1-P)5 ),樣本成數(shù)),樣本成數(shù)p趨于正態(tài)分布趨于正態(tài)分布 或nNNPQpV) 1()(1NnNnPQE(p)=P 3.3.中心極限定理中心極限定理PQ 正態(tài)分布是最重要、最常用的抽樣分布,由于正態(tài)分布是最重要、最常用的抽樣分布,由于抽樣一般都是大樣本,因此抽樣一般都是大樣本,因此可以根據(jù)正態(tài)分布可以根據(jù)正態(tài)分布理論,根據(jù)樣本統(tǒng)計值來推斷總體參數(shù)。理論,根據(jù)樣本統(tǒng)計值來推斷總體參數(shù)。抽樣誤差抽樣誤差 偶然性代表性誤差偶然性代表性誤差非抽樣誤差非抽樣誤差 系統(tǒng)性代表性誤差系統(tǒng)性
16、代表性誤差 觀測性誤差觀測性誤差抽樣誤差:抽樣誤差:是由于抽樣的非全面性和隨機性所引起的偶然性誤差,是由于抽樣的非全面性和隨機性所引起的偶然性誤差,即因抽樣估計值隨樣本不同所造成的誤差。即因抽樣估計值隨樣本不同所造成的誤差。特點:隨著樣本容量的增大而趨向于特點:隨著樣本容量的增大而趨向于0,不可避免但可以,不可避免但可以加以控制加以控制由隨機抽樣的偶然性因素以外的原因所引起的誤差。由隨機抽樣的偶然性因素以外的原因所引起的誤差。超過一定程度就會使抽樣估計失去意義,減少和控制超過一定程度就會使抽樣估計失去意義,減少和控制它十分重要。它十分重要。非抽樣誤差:非抽樣誤差:222非抽樣誤差抽樣誤差總誤差
17、總誤差總誤差抽樣誤差抽樣誤差非抽樣誤差非抽樣誤差由于由于隨機抽樣的偶然性因素使樣本不足以代表總體而引起樣本指標隨機抽樣的偶然性因素使樣本不足以代表總體而引起樣本指標與總體指標間的差異(即偶然性誤差)與總體指標間的差異(即偶然性誤差)(一)抽樣實際誤差(一)抽樣實際誤差n是抽樣估計值與總體參數(shù)真值之間的絕對離是抽樣估計值與總體參數(shù)真值之間的絕對離差,表示為差,表示為n由于隨機抽樣的偶然性,使樣本結(jié)構(gòu)不能與總體結(jié)構(gòu)由于隨機抽樣的偶然性,使樣本結(jié)構(gòu)不能與總體結(jié)構(gòu)完全一致,從而產(chǎn)生估計誤差完全一致,從而產(chǎn)生估計誤差 成數(shù)估計的實際抽樣誤差成數(shù)估計的實際抽樣誤差是隨機變量,不同的樣本有不同的抽樣實際誤差
18、;是隨機變量,不同的樣本有不同的抽樣實際誤差;均值估計的實際抽樣誤差均值估計的實際抽樣誤差Xx Pp (二)抽樣標準誤差(二)抽樣標準誤差(抽樣平均誤差)(抽樣平均誤差) 是反映抽樣誤差是反映抽樣誤差一般水平一般水平的指標,實質(zhì)含義是的指標,實質(zhì)含義是 指樣本統(tǒng)計量抽樣分布的標準差指樣本統(tǒng)計量抽樣分布的標準差n它能夠反映樣本指標與總體指標的它能夠反映樣本指標與總體指標的平均離散程度平均離散程度,也能夠,也能夠說明說明樣本指標代表性樣本指標代表性的大小。的大小。抽樣標準誤越大(?。?,抽樣分布越離散(集中),抽樣標準誤越大(?。?,抽樣分布越離散(集中),樣本指標對總體指標的代表性越差(好),抽樣估
19、計的誤樣本指標對總體指標的代表性越差(好),抽樣估計的誤差平均來講就越大。差平均來講就越大。()SE()V( )SE16)(16)()(2xSExExxVi12)(12)()(2xSExExxVi前例中,重復(fù)抽樣下前例中,重復(fù)抽樣下前例中,不重復(fù)抽樣下前例中,不重復(fù)抽樣下說明不重復(fù)抽樣的樣本均值分布比重復(fù)抽樣更為集中,其說明不重復(fù)抽樣的樣本均值分布比重復(fù)抽樣更為集中,其樣本均值的代表性更好,樣本均值的代表性更好,不重復(fù)抽樣的抽樣誤差小于重復(fù)不重復(fù)抽樣的抽樣誤差小于重復(fù)抽樣抽樣。所以實踐中常用不重復(fù)抽樣方法。所以實踐中常用不重復(fù)抽樣方法。n上述公式在實際應(yīng)用時有兩個困難:上述公式在實際應(yīng)用時有兩
20、個困難:實際中無法根據(jù)該公式計算出標準誤,只能根實際中無法根據(jù)該公式計算出標準誤,只能根據(jù)一套樣本來計算其估計值據(jù)一套樣本來計算其估計值 ,因此抽樣標準誤因此抽樣標準誤 是隨機變量是隨機變量n需計算所有可能樣本統(tǒng)計量的值;需計算所有可能樣本統(tǒng)計量的值;n需要知道總體參數(shù)需要知道總體參數(shù))(xse)(xse(三)抽樣極限誤差(三)抽樣極限誤差n是指以樣本估計量估計總體參數(shù)時是指以樣本估計量估計總體參數(shù)時所允許的最大所允許的最大誤差范圍誤差范圍 通常用通常用 表示表示n抽樣極限誤差的實際意義:抽樣極限誤差的實際意義: 實際上就是對總體參數(shù)可允許取的最高值或最低值進實際上就是對總體參數(shù)可允許取的最高
21、值或最低值進行了限制。即希望總體參數(shù)落在樣本估計量的行了限制。即希望總體參數(shù)落在樣本估計量的 范圍范圍內(nèi)內(nèi)n抽樣極限誤差越大,抽樣估計的精確度越低抽樣極限誤差越大,抽樣估計的精確度越低2、抽樣估計的概率保證程度(置信水平)、抽樣估計的概率保證程度(置信水平) 是指抽樣估計結(jié)果的是指抽樣估計結(jié)果的可靠程度可靠程度,即抽樣估計結(jié)果是準確,即抽樣估計結(jié)果是準確的概率(可靠程度)有多大。通常表示為的概率(可靠程度)有多大。通常表示為 ,其,其中中 稱為稱為顯著性水平顯著性水平 。 11 指的是總體參數(shù)處于區(qū)間指的是總體參數(shù)處于區(qū)間 內(nèi)的概率。內(nèi)的概率。 即總體參數(shù)不在區(qū)間內(nèi)的概率。即總體參數(shù)不在區(qū)間內(nèi)
22、的概率。要求估計結(jié)果的可靠程度越高,則要求估計結(jié)果的可靠程度越高,則 越大。越大。)(2/SEZ)(/2/SEZ 其中,其中, 稱為稱為抽樣概率度抽樣概率度??梢?,抽樣極限誤差分別與概率度和抽樣標準誤差成正比??梢姡闃訕O限誤差分別與概率度和抽樣標準誤差成正比。 越高,抽樣估計的可靠程度越高,但越高,抽樣估計的可靠程度越高,但 也越大也越大 ,估計的,估計的精確度降低。精確度降低。12/Z2Z2Z221 正是當(dāng)顯著性水平為正是當(dāng)顯著性水平為 時的標準正態(tài)分布的時的標準正態(tài)分布的雙側(cè)臨界值,概率保證程度雙側(cè)臨界值,概率保證程度 與與 的值是一一的值是一一對應(yīng)的對應(yīng)的12/Z2/Z68.27%95
23、.45%99.73%)1 ,0( NZ01232131常用的:常用的:1 = 68.27%, 90%, 95% ,95.45%, 99.73% = 1, 1.64 , 1.96, 2, 3 2z第三節(jié)第三節(jié) 參數(shù)估計方法參數(shù)估計方法一、估計量的評價標準一、估計量的評價標準 所謂所謂估計量估計量,就是用以估計總體參數(shù)的量,或者,就是用以估計總體參數(shù)的量,或者說是根據(jù)樣本結(jié)果來估計總體參數(shù)的規(guī)則或形式。說是根據(jù)樣本結(jié)果來估計總體參數(shù)的規(guī)則或形式。估計量一般情況下就是估計量一般情況下就是樣本統(tǒng)計量樣本統(tǒng)計量。估計量的某一具體的值,就稱為估計量的某一具體的值,就稱為估計值估計值。評價估計量好壞的標準有
24、四個:評價估計量好壞的標準有四個:無偏性、有效性、一致性和充分性無偏性、有效性、一致性和充分性符合標準的稱為符合標準的稱為優(yōu)良估計量優(yōu)良估計量oemmxX當(dāng)有兩個以上個統(tǒng)計量可以估計某個總體參數(shù)時,當(dāng)有兩個以上個統(tǒng)計量可以估計某個總體參數(shù)時,應(yīng)該如何選擇?應(yīng)該如何選擇?若若 ,則稱為的無偏估計量。,則稱為的無偏估計量。)(E12 若若 則稱則稱 為比更有效的估計量為比更有效的估計量12)()(21VVX12xemXnxxnii1q 為為 、 s2n-1為為S2 、p 為為P的無偏、的無偏、有效、一致、充分估計量。有效、一致、充分估計量。xX同時滿足上述四個標準,則為同時滿足上述四個標準,則為優(yōu)
25、良估計量優(yōu)良估計量二、參數(shù)估計方法二、參數(shù)估計方法 點估計:也稱定值估計點估計:也稱定值估計pPsSxX,n關(guān)鍵問題是估計量的選擇關(guān)鍵問題是估計量的選擇點估計的優(yōu)缺點點估計的優(yōu)缺點n 若已知抽樣極限誤差若已知抽樣極限誤差 ,則總體參數(shù)處在樣本估計量,則總體參數(shù)處在樣本估計量的的 范圍內(nèi),范圍內(nèi),那么總體參數(shù)的區(qū)間范圍為那么總體參數(shù)的區(qū)間范圍為:,在一定的概率保證程度在一定的概率保證程度 下,找到相應(yīng)的抽樣極限誤下,找到相應(yīng)的抽樣極限誤差差 的值,則可以確定估計區(qū)間的上下限的值,則可以確定估計區(qū)間的上下限1)(2/SEZn估計估計區(qū)間區(qū)間可表示為:可表示為:n )(),(2/2/xseZxxse
26、Zx)(),(2/2/pseZppseZp )(),(,2/2/seZseZX 的估計區(qū)間:的估計區(qū)間:P 的估計區(qū)間:的估計區(qū)間:一般在給定的概率保證程度下,盡可能提高估計的精一般在給定的概率保證程度下,盡可能提高估計的精度度 (通過降低抽樣標準誤)。通過降低抽樣標準誤)。置信度置信度1越大,越大, 越大,估計的精確程度越低。反之,越大,估計的精確程度越低。反之,置信度置信度1 越小,越小, 越小,估計的精確度越高。越小,估計的精確度越高。 )(2/SEZ希望置信度盡可能大(可靠程度高),同時精確度盡可能希望置信度盡可能大(可靠程度高),同時精確度盡可能高(估計區(qū)間的長度短)。高(估計區(qū)間的
27、長度短)。但在樣本容量但在樣本容量n一定時,兩者矛一定時,兩者矛盾。盾。n抽樣組織形式:抽樣組織形式: 簡單隨機抽樣簡單隨機抽樣 等距抽樣等距抽樣 分層抽樣分層抽樣 整群抽樣整群抽樣 多階段抽樣多階段抽樣1、計算估計量、計算估計量 2、抽樣標準誤、抽樣標準誤(1)當(dāng)總體方差已知)當(dāng)總體方差已知Xixnx1)()(2重復(fù)抽樣nSxSE(一)總體均值(一)總體均值 的估計的估計 f=n/N, 稱為稱為抽樣比抽樣比當(dāng)當(dāng)f5%,有限總體校正系數(shù),有限總體校正系數(shù)1-f可以忽略不計可以忽略不計)( )1 ()(2不重復(fù)抽樣fnSxSE支)(小時/4330X)(小時222531100)(ffXXS(2)當(dāng)
28、總體方差未知時,用樣本方差)當(dāng)總體方差未知時,用樣本方差s2代替代替)()(2重復(fù)抽樣nsxse)( )1 ()(2不重復(fù)抽樣fnsxse支)(小時/4340 x)(小時2225344001)(ffxxs)(xseXxx,2z(二)總體成數(shù)(二)總體成數(shù)P的估計的估計 1、計算估計量、計算估計量 2、抽樣標準誤、抽樣標準誤(1)當(dāng))當(dāng) 總體成數(shù)已知(總體方差總體成數(shù)已知(總體方差 已知)已知)nnp1)()(2重復(fù)抽樣重復(fù)抽樣nPQnSpSEP )( )1()(不重復(fù)抽樣不重復(fù)抽樣fnPQpSE PQSP 2)(1) 1()(2重復(fù)抽樣npqnnnpqnspsep)( )1 (1)(不重復(fù)抽樣
29、fnpqpse12nnpqsp【例例3.5】 對某天生產(chǎn)的對某天生產(chǎn)的2000件電子元件抽取件電子元件抽取5進行耐用進行耐用時間檢測,耐用時間在時間檢測,耐用時間在3000小時以下為不合格,求合格率小時以下為不合格,求合格率的抽樣標準誤。(重復(fù)和不重復(fù))的抽樣標準誤。(重復(fù)和不重復(fù))(1)給定)給定 1 1 ,查表得,查表得2z)(/2pseZpppppppPpPp,或,【例例3.6】對某高校學(xué)生消費現(xiàn)狀和消費觀念進行調(diào)查,隨對某高校學(xué)生消費現(xiàn)狀和消費觀念進行調(diào)查,隨機調(diào)查了機調(diào)查了100名學(xué)生,其中有名學(xué)生,其中有98名認為名認為“大學(xué)生在食堂就大學(xué)生在食堂就餐時浪費情況比較嚴重餐時浪費情況
30、比較嚴重”。現(xiàn)要求在?,F(xiàn)要求在95的概率保證程的概率保證程度下,估計全校學(xué)生中持有相同觀點的學(xué)生所占比重。度下,估計全校學(xué)生中持有相同觀點的學(xué)生所占比重。2、不考慮調(diào)查經(jīng)費時樣本容量的確定:、不考慮調(diào)查經(jīng)費時樣本容量的確定: nSZx2/2222/2SZn重,)(/2/2nPQZpSEZp 22/2pPQZn 重重 ,1)(2 NnnSZxSEZx22222SZNSNZnx不重NnnNSZSZNSZNNNSNZn重重不重11/22222222222222Nnnn重重不重1不重重nn不重復(fù)抽樣下估計均值和成數(shù)都可以直接采用不重復(fù)抽樣下估計均值和成數(shù)都可以直接采用總體方差通常未知,一般按以下方法確
31、定其估計值:總體方差通常未知,一般按以下方法確定其估計值: 過去的數(shù)據(jù)或經(jīng)驗判斷;過去的數(shù)據(jù)或經(jīng)驗判斷; 小規(guī)模試抽樣的樣本方差。小規(guī)模試抽樣的樣本方差。(統(tǒng)計分組在抽樣估計中的應(yīng)用統(tǒng)計分組在抽樣估計中的應(yīng)用) 設(shè)總體的設(shè)總體的N個個體分為個個體分為H 層,層, 為第為第i層個體數(shù),層個體數(shù), 為第為第i層的層權(quán),層的層權(quán), 為第為第i層抽取的個體數(shù),層抽取的個體數(shù), 為第為第i層的抽樣比,層的抽樣比, 為第為第i層第層第j個個體的變個個體的變量值量值 第第i層的層均值層的層均值 的估計量為:的估計量為: iNiiWNNiniiifnNijxiX1HijiiiixXxnn(一)總體平均數(shù)的估計
32、(一)總體平均數(shù)的估計1N1n1x2N2n2xkNknkx1X2XkXX)(xSE)(1xse)(2xse)(kxseNNWii權(quán)數(shù)其中其中 為第為第i層的方差,未知時要用層內(nèi)樣本層的方差,未知時要用層內(nèi)樣本 方差方差 來估計。來估計。 1HstiiiXxW x221()HiistiiW SSE xn2211()HistiiiifSE xW Sn2121iNijijiixXSN()2is總體均值的估計量為:總體均值的估計量為:與該估計量相對應(yīng)的抽樣標準誤為:與該估計量相對應(yīng)的抽樣標準誤為:(重復(fù)抽樣時)(重復(fù)抽樣時)(不重復(fù)抽樣時)(不重復(fù)抽樣時)95.45%的可靠性的可靠性 設(shè)設(shè) 為第為第
33、層的某類變量值的個數(shù),層的某類變量值的個數(shù), 為第為第i i層層樣本中某類變量值的個數(shù),那么第樣本中某類變量值的個數(shù),那么第i i層成數(shù)層成數(shù) 的的估計量為:估計量為: (二二)總體成數(shù)總體成數(shù)p的估計的估計1iiiinPpn1HstiiiPpW piP1 iNi1 in總體成數(shù)的估計量為:總體成數(shù)的估計量為:與該估計量相對應(yīng)的抽樣標準誤為:與該估計量相對應(yīng)的抽樣標準誤為: 層方差層方差 未知時要以層內(nèi)樣本方差未知時要以層內(nèi)樣本方差 來估計。來估計。 21()1HiistiiiiiWNSE pPQnN211()1HiiistiiiiifWNSE pPQnN()1iiiinp qn (重復(fù)抽樣)
34、(重復(fù)抽樣)(不重復(fù)抽樣)(不重復(fù)抽樣)iiQP 1.1.比例分配法比例分配法 這是分層抽樣最常用的分配法,即根據(jù)這是分層抽樣最常用的分配法,即根據(jù) 的關(guān)系的關(guān)系來確定來確定 ,也即:,也即: 分層抽樣的抽樣標準誤公式可簡化為分層抽樣的抽樣標準誤公式可簡化為(以總體均值估計為例):(以總體均值估計為例): 其中其中 iniinNnNiniinWn21()stiifSE xW Sn22iiiiW SW SnNiiinnffNN=(三)各層樣本容量(三)各層樣本容量 的確定的確定估計。估計。做出做出成數(shù)成數(shù)的概率保證程度對總體的概率保證程度對總體,要求以,要求以,變量值的個數(shù)分別為變量值的個數(shù)分別
35、為樣本,各層樣本中某類樣本,各層樣本中某類的的,別抽取容量為別抽取容量為不重復(fù)抽樣方法各層分不重復(fù)抽樣方法各層分,用,用,個個體分為兩層,個個體分為兩層,某總體的某總體的PnnnnNNii%95186045853007001000212121 2.2.最優(yōu)分配法(最優(yōu)分配法(NeymanNeyman分配法)分配法) 該法除了考慮各層容量該法除了考慮各層容量 大小這一因素外,還考慮各大小這一因素外,還考慮各層內(nèi)在差異程度層內(nèi)在差異程度 不同這一因素,即不同這一因素,即 分層抽樣的抽樣標準誤公式可改為分層抽樣的抽樣標準誤公式可改為: iNiSiiiiiN SnnN S22()()iiiistW S
36、W SSE xnN 該法除了考慮該法除了考慮 和和 這兩個因素外,還考慮各層個這兩個因素外,還考慮各層個 體調(diào)查費用高低體調(diào)查費用高低 這一因素,即:這一因素,即: 這時,分層抽樣的抽樣標準誤公式可改為:這時,分層抽樣的抽樣標準誤公式可改為: iNiSiCiiiiiiiW SCnnW SC2()iiiiiiiistW SW SCW SCSE xnN3.3.經(jīng)濟分配法經(jīng)濟分配法總體參數(shù)估計可按如下方法近似估算:總體參數(shù)估計可按如下方法近似估算:設(shè)總體的設(shè)總體的N個個體形成個個體形成R群,每群群,每群M個個體。從個個體。從R群中群中隨機抽取隨機抽取r群(一般采用不重復(fù)抽樣方法),共群(一般采用不重
37、復(fù)抽樣方法),共rM=n個個體構(gòu)成樣本。若以個個體構(gòu)成樣本。若以 表示第表示第i群第群第j個體的變量值,個體的變量值,那么群均值那么群均值 為:為: (一)總體均值的估計(一)總體均值的估計ijxiX1riicsXXxr1MijjixXM總體均值的估計量為:總體均值的估計量為: 抽樣標準誤為:抽樣標準誤為: 時要以樣本群間方差時要以樣本群間方差 來估計。來估計。21()csBfSE xSr221()1RiiBXXSB2BS221()1ricsibXxsr為總體群間方差。為總體群間方差。 未知未知f=r/R為群抽樣比為群抽樣比 設(shè)設(shè) 為第為第i群某類變量值的個數(shù),那么群成數(shù)群某類變量值的個數(shù),那
38、么群成數(shù) 為:為: 總體成數(shù)的估計量為總體成數(shù)的估計量為: 抽樣標準誤抽樣標準誤為:為: 其中其中f=r/R為群抽樣比,為群抽樣比, 為總體群間方差。為總體群間方差。 未知未知 時要以樣本群間方差時要以樣本群間方差 來估計。來估計。 1 iMiP1 iiMPM1riicsPPpr2(1)()PBcsf SSE pr221()1RiiPBPPSB2PBS221()1ricsipbPpsr (二)總體成數(shù)(二)總體成數(shù)p的估計的估計設(shè)總體的設(shè)總體的N個個體形成個個體形成R個群,每群個群,每群M個個體。從個個體。從R群中群中隨機不重復(fù)抽取隨機不重復(fù)抽取r群,抽中的群再從群,抽中的群再從M個個體中隨機不重個個體中隨機不重復(fù)抽取復(fù)抽取m個個體。若以個個體。
溫馨提示
- 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
- 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
- 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
- 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負責(zé)。
- 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請與我們聯(lián)系,我們立即糾正。
- 7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔(dān)用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。
最新文檔
- 洗浴行業(yè)品牌競爭力提升策略研究考核試卷
- 電力工程監(jiān)理專業(yè)知識測驗考核試卷
- 耐火土石礦山開采過程中的環(huán)境糾紛處理考核試卷
- 電玩具結(jié)構(gòu)與裝配考核試卷
- 2025農(nóng)藥采購合同范本
- 2025年版船舶租賃合同示范文本
- DB3309T 115-2024海島零工市場管理與服務(wù)規(guī)范
- 2025標準施工合同范本
- 流轉(zhuǎn)稅法律制度
- 年度民生銀行年會活動創(chuàng)意方案
- (2024年)肺栓塞課件
- 2024吉林省民航機場集團有限公司招聘筆試參考題庫附帶答案詳解
- 電磁現(xiàn)象及其應(yīng)用-理解電磁現(xiàn)象及其在日常生活中的應(yīng)用
- 車輛行駛安全培訓(xùn)模板
- 開展中醫(yī)藥健康文化宣傳活動方案(樣式)
- 油漆涂料行業(yè)市場分析
- 呼吸道合胞病毒知識科普
- 跨境數(shù)據(jù)流動與治理
- 輸血治療知情同意書
- 幼兒園副園長聘任園長合同(36篇)
- 30道中國石油天然氣地球物理勘探工程師崗位常見面試問題含HR常問問題考察點及參考回答
評論
0/150
提交評論