




版權(quán)說(shuō)明:本文檔由用戶(hù)提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請(qǐng)進(jìn)行舉報(bào)或認(rèn)領(lǐng)
文檔簡(jiǎn)介
1、 統(tǒng)計(jì)抽樣法本章重點(diǎn):1、抽樣誤差的計(jì)算及控制2、總體平均數(shù)的區(qū)間估計(jì)3、總體成數(shù)的區(qū)間估計(jì)4、必要樣本容量的確定5、不同抽樣組織方式之間的區(qū)別統(tǒng)計(jì)抽樣法理論u一、統(tǒng)計(jì)抽樣法的構(gòu)成u(一)抽樣調(diào)查:科學(xué)獲取樣本數(shù)據(jù)的方法抽樣調(diào)查抽樣調(diào)查是非全面調(diào)查,它是按照隨機(jī)原則從調(diào)查對(duì)(總體)中抽取一部分單位進(jìn)行調(diào)查,用調(diào)查所得指標(biāo)數(shù)值對(duì)調(diào)查對(duì)象相應(yīng)指標(biāo)數(shù)值作出具有一定可靠性的的估計(jì)和推斷的一種統(tǒng)計(jì)調(diào)查方法。u(二)抽樣推斷:根據(jù)樣本的實(shí)際資料計(jì)算樣本指標(biāo),在一定的概率保證程度下,推斷總體相應(yīng)數(shù)量特征的一種統(tǒng)計(jì)方法。是根據(jù)樣本數(shù)據(jù)對(duì)總體數(shù)據(jù)進(jìn)行估計(jì)或?qū)傮w假設(shè)進(jìn)行驗(yàn)證的方法。u包括:1、參數(shù)估計(jì)2、假設(shè)檢
2、驗(yàn)u二、抽樣推斷的特點(diǎn)u1、由部分推斷總體u2、建立在隨機(jī)原則的基礎(chǔ)上,使樣本具有代表性u(píng)3、運(yùn)用概率估計(jì)法u4、抽樣誤差可以事先計(jì)算并加以控制三、抽樣推斷的運(yùn)用u1、無(wú)法進(jìn)行或沒(méi)必要進(jìn)行全面調(diào)查時(shí),使用抽樣法可以對(duì)總體有較好的認(rèn)識(shí)。u2、使用抽樣法對(duì)全面調(diào)查的結(jié)果加以補(bǔ)充或修正。u3、抽樣法可用于對(duì)產(chǎn)品質(zhì)量進(jìn)行實(shí)時(shí)控制。u4、抽樣法可以對(duì)假設(shè)進(jìn)行檢驗(yàn),降低實(shí)驗(yàn)成本可靠程度u四、抽樣涉及的基本概念有:u(一)總體與樣本u(二)總體指標(biāo)和樣本指標(biāo)u(三)抽樣方法(一) 總體和樣本u1.總體:指所要研究對(duì)象的全體,由許多客觀(guān)存在的具有某種共同性質(zhì)的單位構(gòu)成??傮w單位數(shù)用 N 表示。u2.樣本:是從
3、總體中按隨機(jī)原則抽選出來(lái)的部分,由抽選的單位構(gòu)成。樣本單位數(shù)用 n 表示。u3.總體是唯一確定的,樣本是不確定的、可變的、隨機(jī)的 一般n大于30為大樣本,小于30為小樣本。 樣本個(gè)數(shù)M:又稱(chēng)樣本可能數(shù)目,指從一個(gè)總體中所可能抽取的樣本的個(gè)數(shù)。u(二)總體指標(biāo)與樣本指標(biāo)1.總體指標(biāo)總體指標(biāo)(總體參數(shù)),是反映總體數(shù)量特征的統(tǒng)計(jì)指標(biāo),確定且唯一。包括:總體平均數(shù)、總體成數(shù)、總體方差和總體標(biāo)準(zhǔn)差2、樣本指標(biāo)樣本指標(biāo)(統(tǒng)計(jì)量),是根據(jù)樣本數(shù)據(jù)計(jì)算的樣本指標(biāo)。數(shù)值決定于樣本各單位的標(biāo)志值,不是唯一的,是個(gè)隨機(jī)變量。包括:樣本平均數(shù)、樣本成數(shù)、樣本方差和樣本標(biāo)準(zhǔn)差。u 。平均數(shù)平均數(shù)標(biāo)準(zhǔn)差、方差標(biāo)準(zhǔn)差、方
4、差成數(shù)成數(shù)總體總體樣本樣本參數(shù)參數(shù)統(tǒng)計(jì)量統(tǒng)計(jì)量推斷推斷抽取抽取pssx2、PX2、122nxxs122ffxxsfxfxnxx、101nnnp(三)抽樣方法 1、重復(fù)抽樣 含義:每次從總體中抽取的樣本單位,經(jīng)檢驗(yàn)之后又重新放回總體,參加下次抽樣特點(diǎn)是總體中每個(gè)樣本單位被抽中的概率是相等的。 2、不重復(fù)抽樣 含義:也叫做“無(wú)放回抽樣”、“不回置抽樣”,是從全及總體中抽取第一個(gè)樣本單位,記錄該單位有關(guān)標(biāo)志表現(xiàn)后,這個(gè)樣本單位,不再放回全及總體中參加下一次抽選的方法。 特點(diǎn): (1)、每個(gè)單位最多只有一次被抽中的機(jī)會(huì)。 (2)、隨著抽中單位的不斷增多,剩下的單位被抽中的機(jī)會(huì)不斷增大。 (3)、不重復(fù)
5、抽樣的誤差小于重復(fù)抽樣的誤差。考慮順序時(shí):樣本個(gè)數(shù)MABACDEBBCDAECBCDAEDBCDAEEBCDAE重復(fù)抽樣(放回)重復(fù)抽樣(放回)例如從例如從A、B、C、D、E五個(gè)字母中隨機(jī)抽取兩個(gè)作為樣本。五個(gè)字母中隨機(jī)抽取兩個(gè)作為樣本。N=5,n=2不考慮順序時(shí):樣本個(gè)數(shù)不考慮順序時(shí):樣本個(gè)數(shù)MnN!1!11nNnNCnnNABACDEBBCDECCDEDDEEE255215! 2! 4! 6ABCDEBCDAECBDAEDBCAEEBCDAn)!-(N!NPnNABCDEBCDECDEDEEn)!n!-(N!NCnN不重復(fù)抽樣:例如從A、B、C、D、E五個(gè)字母中隨機(jī)抽取兩個(gè)作為樣本。N=5
6、,n=2考慮順序時(shí)考慮順序時(shí):樣本個(gè)數(shù):樣本個(gè)數(shù)M不考慮順序時(shí)不考慮順序時(shí):樣本個(gè)數(shù):樣本個(gè)數(shù)M20! 3! 5102!3! 5第二節(jié) 抽樣誤差統(tǒng)計(jì)誤差按產(chǎn)生的來(lái)源分類(lèi),有系統(tǒng)性誤差和代表性誤差。一、抽樣誤差的概念u抽樣誤差是指由于抽樣的隨機(jī)性引起的樣本指標(biāo)值與被推斷的總體指標(biāo)值之間的誤差。u抽樣誤差是指在遵循了隨機(jī)原則的條件下,不包括登記誤差和系統(tǒng)性誤差在內(nèi)的,用樣本指標(biāo)代表總體指標(biāo)而產(chǎn)生的不可避免的誤差系統(tǒng)性誤差:可避免,難以計(jì)算難以控制。抽樣誤差:不可避免但可控制u二、影響抽樣誤差的因素u抽樣單位的數(shù)目u總體被研究標(biāo)志的變異程度u抽樣方法的選擇u抽樣組織方式不同分層抽樣小于純隨機(jī)抽樣純隨
7、機(jī)抽樣小于整群抽樣。抽樣誤差的種類(lèi)u1、抽樣實(shí)際誤差u2、抽樣平均誤差u3、抽樣極限誤差抽樣實(shí)際誤差:是指根據(jù)一個(gè)實(shí)際抽取出來(lái)的樣本所計(jì)算出來(lái)的樣本統(tǒng)計(jì)量與總體參數(shù)之間存在的實(shí)際偏差 為什么說(shuō):抽樣實(shí)際誤差只是存在于理論上,在實(shí)際工作中是不可能知道的?XxPp抽樣實(shí)際誤差u抽樣平均誤差是反映抽樣誤差一般水平的統(tǒng)計(jì)指標(biāo),是最有可能出現(xiàn)的樣本指標(biāo)(樣本平均數(shù)或樣本成數(shù))的標(biāo)準(zhǔn)差,是所有樣本指標(biāo)和總體指標(biāo)間抽樣實(shí)際誤差的平均數(shù)。u 抽樣平均數(shù)的平均誤差: u 理論上的計(jì)算公式:xp實(shí)際運(yùn)用的計(jì)算公式實(shí)際運(yùn)用的計(jì)算公式:(重復(fù)抽樣)(重復(fù)抽樣)MXxMiix12nsnnx2三、抽樣平均誤差抽樣成數(shù)的平
8、均誤差抽樣成數(shù)的平均誤差:u 現(xiàn)用重復(fù)抽樣的方法從5人中隨機(jī)抽2個(gè)構(gòu)成樣本。u 共有25個(gè)樣本。如右圖。42X例例1:某班組:某班組5個(gè)工人的日工個(gè)工人的日工資為資為34、38、42、46、50元。元。322nsnnx2 XffxxxE4242ffXxx42322nx抽樣平均誤差總結(jié) xp重復(fù)抽樣不重復(fù)抽樣nnx212NnNnxnppnp1211NnNnppp注:現(xiàn)實(shí)中,平均數(shù)的標(biāo)準(zhǔn)差和成數(shù)的標(biāo)準(zhǔn)差都是針對(duì)總體而言的,都是未知的。常用樣本平均數(shù)代替總體平均數(shù),用樣本成數(shù)代替總體成數(shù)。使用時(shí)間( 小時(shí))抽查燈泡個(gè)數(shù)(個(gè))組中值900以下287590095049259501000119751000
9、1050711025105011008410751100115018112511501200711751200以上31225合計(jì)200燈泡使用壽命資料求樣本平均數(shù)和樣本成數(shù)的抽樣平均誤差。例例:求燈泡平均使用時(shí)間、標(biāo)準(zhǔn)差和燈泡合格率(樣本)63.532nxx1057fxfx%5 .91200183p求燈泡使用時(shí)間抽樣平均誤差:在重復(fù)抽樣下,抽樣平均誤差:小時(shí)79. 320063.53nx在不重復(fù)抽樣下,抽樣平均誤在不重復(fù)抽樣下,抽樣平均誤差差小時(shí)75. 311000020010000200163.5322NnNnx求燈泡合格率的抽樣平均誤差:在重復(fù)抽樣下,抽樣平均誤差:上一頁(yè)下一頁(yè)返回本節(jié)首頁(yè)
10、%97. 1200085. 0915. 01nppp在重復(fù)抽樣下,抽樣平均誤差在重復(fù)抽樣下,抽樣平均誤差%95. 111000020010000200085. 0915. 011NnNnppx 抽樣極限誤差的由來(lái): 抽樣平均誤差是對(duì)所有抽樣實(shí)際誤差的平均,只代表平均水平 而在實(shí)際過(guò)程中,為了控制抽樣推斷的效果,通常會(huì)設(shè)定一個(gè)可接受的誤差水平。該誤差水平即為抽樣極限誤差(可容忍的抽樣誤差-對(duì)其實(shí)際誤差水平進(jìn)行控制)。 含義:抽樣極限誤差是指用絕對(duì)值形式表示的樣本指標(biāo)與總體指標(biāo)之間離差的可能范圍。抽樣極限誤差就是在一定的概率保證下,用統(tǒng)計(jì)量去估計(jì)總體參數(shù)時(shí)的最大允許誤差.xp抽樣平均誤差是反映抽樣
11、誤差一般水平的指標(biāo);抽樣極限誤差是反映抽樣誤差的最大范圍的指標(biāo).四、抽樣極限誤差xXxpPp抽樣極限誤差的大小抽樣極限誤差的大小決定決定抽樣推斷的置信度(置信概率)抽樣推斷的置信度(置信概率)xxtppt tFtttu 抽樣極限誤差是t倍的抽樣平均誤差t-概率度樣本指標(biāo)和總體指標(biāo)的誤差不超過(guò)一定范圍的概率保證程度常用的置信度與置信概率tF(t)168.27%1.9695%295.45%399.73%499.99%例題: 某燈泡廠(chǎng)生產(chǎn)大量某種型號(hào)的燈泡,現(xiàn)采用抽樣調(diào)查方法抽取500只燈泡,對(duì)其進(jìn)行質(zhì)量檢驗(yàn)。檢查結(jié)果如表所示。 試計(jì)算平均耐用時(shí)間的抽樣平均誤差 耐用時(shí)間(小時(shí))組中值x (小時(shí))燈
12、泡數(shù)量 f(只)850以下82535850-900875127900-950925185950-10009751031000-10501025421050以上10758合計(jì)-500試求:抽樣極限誤差(概率保證程度試求:抽樣極限誤差(概率保證程度0.9973) 檢查檢查500個(gè)燈泡中不合格產(chǎn)品占個(gè)燈泡中不合格產(chǎn)品占0.4%,試在,試在0.6827概率保證下,計(jì)算概率保證下,計(jì)算 抽樣極限誤差抽樣極限誤差由概率保證程度0.9973,查表得概率度t=3計(jì)算抽樣極限誤差 2.55,4.926fxfx47. 25002 .55nx樣本標(biāo)準(zhǔn)差4 . 747. 23xxt p=0.4%28. 01pp%28
13、. 0500996. 0004. 01nppp概率保證程度為概率保證程度為0.6827時(shí),時(shí),t=1第三節(jié) 抽樣估計(jì)一、抽樣估計(jì)的概念和特點(diǎn)1、抽樣估計(jì)的概念 抽樣估計(jì)(Sampling estimation)又稱(chēng)參數(shù)估計(jì)。它是在抽樣調(diào)查的基礎(chǔ)上所進(jìn)行的數(shù)據(jù)推測(cè),即用抽樣調(diào)查所得到的一部分單位的數(shù)量特征來(lái)估計(jì)和推算總體的數(shù)量特征。抽樣估計(jì)的方法:點(diǎn)估計(jì)和區(qū)間估計(jì) 2、抽樣估計(jì)的特點(diǎn)(1)邏輯上運(yùn)用歸納推理,而不是演繹推理。(2)方法上運(yùn)用不確定的概率估計(jì)法,不是運(yùn)用確定的數(shù)學(xué)分析法。(3)抽樣估計(jì)存在抽樣誤差,允許的誤差范圍越大,則概率保證程度也越大。二、參數(shù)估計(jì)的方法:(一)點(diǎn)估計(jì)u點(diǎn)估計(jì)的
14、含義:直接以樣本統(tǒng)計(jì)量作為相應(yīng)總體參數(shù)的估計(jì)量(即令抽樣極限誤差等于零)。1222nXXspPxX點(diǎn)估計(jì)完全正確的概率幾乎為點(diǎn)估計(jì)完全正確的概率幾乎為0。因此,我們更多的是考慮用樣本統(tǒng)計(jì)量去估計(jì)總體因此,我們更多的是考慮用樣本統(tǒng)計(jì)量去估計(jì)總體參數(shù)的參數(shù)的范圍范圍 區(qū)間估計(jì)。區(qū)間估計(jì)。 總體參數(shù)估計(jì)-點(diǎn)估計(jì)例如,設(shè)一批產(chǎn)品的廢品率為,為估計(jì),從這批產(chǎn)品中隨機(jī)地抽出n個(gè)作檢查,以X記其中的廢品個(gè)數(shù),用X/n估計(jì),就是一個(gè)點(diǎn)估計(jì)。又如用樣本方差(見(jiàn)統(tǒng)計(jì)量)估計(jì)總體分布的方差,或用樣本相關(guān)系數(shù)估計(jì)總體分布的相關(guān)系數(shù),都是常見(jiàn)的點(diǎn)估計(jì)。 優(yōu)點(diǎn):點(diǎn)估計(jì)的方法簡(jiǎn)單,一般不考慮抽樣誤差和可靠程度它適用于對(duì)推斷
15、準(zhǔn)確程度與可靠程度要求不高的情況。優(yōu)良標(biāo)準(zhǔn):1、無(wú)偏性:如果樣本統(tǒng)計(jì)量的數(shù)學(xué)期望等于所估計(jì)的總體參數(shù)的值,該樣本統(tǒng)計(jì)量稱(chēng)作總體參數(shù)的無(wú)偏估計(jì)量。無(wú)偏性的定義如下:如果則稱(chēng)樣本統(tǒng)計(jì)量是總體參數(shù)的無(wú)偏估計(jì)。2、一致性:如果當(dāng)樣本容量更大時(shí),點(diǎn)估計(jì)量的值更接近于總體參數(shù),該點(diǎn)估計(jì)量是一致的。換言之,大樣本比小樣本趨于接進(jìn)一個(gè)更好的點(diǎn)估計(jì)。3、有效性:假定含n個(gè)元素的一個(gè)簡(jiǎn)單隨機(jī)樣本用于給出同一總體參數(shù)的兩個(gè)不同的無(wú)偏點(diǎn)估計(jì)量。這時(shí),我們偏好于用標(biāo)準(zhǔn)差較小的點(diǎn)估計(jì)量,因?yàn)樗o出的估計(jì)值與總體參數(shù)更接近。總體參數(shù)估計(jì)-(二)區(qū)間估計(jì)u 參數(shù)估計(jì)的兩個(gè)要求:n精度:估計(jì)誤差的最大范圍,通過(guò)極限誤差來(lái)反映。
16、n越小,估計(jì)的精度要求越高,n越大,估計(jì)的精度要求越低。n可靠程度:估計(jì)正確性的一個(gè)概率保證,通過(guò)置信概率來(lái)反映n F(t)越小,估計(jì)的可靠程度越低;n F(t)越大,估計(jì)的可靠程度越高。n精度與可靠程度是一對(duì)矛盾的要求。 t = /n唯一的途徑是改變抽樣平均誤差的大小來(lái)實(shí)現(xiàn)即提高精度又提高可靠程度。,則差為抽樣估計(jì)的抽樣極限誤,計(jì)量是,用以估計(jì)該參數(shù)的統(tǒng)設(shè)待估計(jì)的總體參數(shù)是總體參數(shù)的區(qū)間估計(jì)u區(qū)間估計(jì)的含義:通過(guò)從總體中抽取的樣本,根據(jù)一定的正確度與精確度的要求,構(gòu)造出適當(dāng)?shù)膮^(qū)間,以作為總體的分布參數(shù)(或參數(shù)的函數(shù))的真值所在范圍的估計(jì)u估計(jì)總體參數(shù)的區(qū)間范圍,并給出區(qū)間估計(jì)成立的概率值 t
17、FP21:置信上限:置信下限2121u區(qū)間估計(jì)的基本要素:u1、樣本統(tǒng)計(jì)量u2、抽樣極限誤差u3、抽樣估計(jì)的置信概率根據(jù)樣本資料計(jì)算從而計(jì)算出另外一個(gè)事先確定其中一個(gè)u區(qū)間估計(jì)的兩種模式 從而確定估計(jì)的區(qū)間,差,通過(guò)計(jì)算抽樣極限誤、已知置信概率tF1 tF但需要求出置信概率間,可直接確定估計(jì)的區(qū)、已知抽樣極限誤差2可信程度 可信程度是表示估計(jì)的可靠程度 如果估計(jì)區(qū)間越大,則可靠程度越大; 估計(jì)區(qū)間越小,則可靠程度越小。 而估計(jì)區(qū)間又與抽樣極限誤差有關(guān),在一定的抽樣方式下,抽樣極限誤差又是由概率度t決定的。 因而可靠程度與t之間有一定正比關(guān)系。 概率度t與概率保證程度(可靠程度)之間的關(guān)系見(jiàn) 概
18、率度t誤差范圍()概率F(t)概率度t誤差范圍()概率F(t)0.50.50.38291.961.960.95001.001.000.68272.002.000.95451.501.500.86643.003.000.9973總體平均數(shù)區(qū)間估計(jì)的步驟(模式一)222代替總體方差方差未知的情況下,用樣本在總體方差s;和本統(tǒng)計(jì)量、根據(jù)樣本資料計(jì)算樣21sx;計(jì)算抽樣平均誤差以及抽樣方法的不同,和樣本容量、根據(jù)樣本方差xns22 態(tài)分布概率表)較大時(shí),也可以利用正(當(dāng)樣本容量;分布概率表查找以及、根據(jù)已知的置信概率ntttF3xxt、計(jì)算抽樣極限誤差:4xxxx;上限:下限:區(qū)間、求出總體參數(shù)的估計(jì)
19、5總體平均數(shù)區(qū)間估計(jì)的步驟(模式二)222代替總體方差方差未知的情況下,用樣本在總體方差s;和本統(tǒng)計(jì)量、根據(jù)樣本資料計(jì)算樣21sx;計(jì)算抽樣平均誤差以及抽樣方法的不同,和樣本容量、根據(jù)樣本方差xns22xxtt;誤差計(jì)算、根據(jù)已知的抽樣極限3 tFtt分布概率表查找值和、利用計(jì)算的4xxxx;上限:下限:區(qū)間、求出總體參數(shù)的估計(jì)5u例2:對(duì)某型號(hào)的電子元件進(jìn)行耐用性能檢查,抽查資料分組如下表,要求估計(jì)該批電子元件的平均耐用時(shí)數(shù)的置信區(qū)間(置信概率95%)。(小時(shí))5 .1055fxfx(小時(shí))17.5212ffxxsx(小時(shí))217. 510017.52nsxx 96. 195. 0ttF(小
20、時(shí))23.10217. 596. 1xxt(小時(shí))置信區(qū)間上限:(小時(shí))置信區(qū)間下限:73.106523.105 .105527.104523.105 .1055xxxx小時(shí)之間平均耐用時(shí)數(shù)在子元件的的置信概率估計(jì)該批電以73.106527.1045%95區(qū)間估計(jì)。田的平均畝產(chǎn)情況進(jìn)行根據(jù)樣本數(shù)據(jù)對(duì)全鄉(xiāng)農(nóng)千克,不得超過(guò)誤差千克,現(xiàn)設(shè)定抽樣極限為抽樣平均誤差千克,為查計(jì)算的樣本畝產(chǎn):某鄉(xiāng)的農(nóng)田經(jīng)抽樣調(diào)例636003xxx63600 xxx,根據(jù)題意:236xxt %45.95, 2tFt根據(jù)正態(tài)分布概率表,(千克)置信區(qū)間上限(千克)置信區(qū)間下限60666005946600 xxxx千克之間平均
21、畝產(chǎn)數(shù)在田的的置信概率估計(jì)該鄉(xiāng)農(nóng)以606594%45.95成數(shù)的區(qū)間估計(jì)u總體成數(shù)是一種特殊的平均數(shù),對(duì)總體成數(shù)區(qū)間估計(jì)類(lèi)似于總體平均數(shù)的區(qū)間估計(jì);和本統(tǒng)計(jì)量、根據(jù)樣本資料計(jì)算樣21psp;計(jì)算抽樣平均誤差以及抽樣方法的不同,和樣本容量、根據(jù)樣本方差ppns22pppp;上限:下限:區(qū)間、求出總體成數(shù)的估計(jì)5 ;分布概率表查找以及、根據(jù)已知的置信概率tttF3ppt、計(jì)算抽樣極限誤差:4u例4:對(duì)某型號(hào)的電子元件進(jìn)行耐用性能檢查,抽查資料分組如下表, 設(shè)該廠(chǎng)的產(chǎn)品質(zhì)量檢驗(yàn)標(biāo)準(zhǔn)規(guī)定,元件耐用時(shí)數(shù)達(dá)到1000小時(shí)以上為合格品。要求估計(jì)該批電子元件的合格率(置信概率95%)%91100911nnp%
22、62.28%9%911ppsp%862. 2100%62.28nspp 96. 195. 0ttF%61. 5%862. 296. 1ppt%61.96%61. 5%91%39.85%61. 5%91pppp置信區(qū)間上限:置信區(qū)間下限:之間合格率在子元件的的置信概率估計(jì)該批電以%61.96%39.85%95第四節(jié) 抽樣組織形式與抽樣方案設(shè)計(jì)u抽樣的原則:u保證實(shí)現(xiàn)抽樣隨機(jī)性的原則u保證實(shí)現(xiàn)最大的抽樣效果原則u一、抽樣組織形式u(一)簡(jiǎn)單隨機(jī)抽樣u簡(jiǎn)單隨機(jī)抽樣又稱(chēng)純隨機(jī)抽樣,是按照隨機(jī)的原則直接從N個(gè)總體單位中抽取n個(gè)單位作為樣本。u簡(jiǎn)單隨機(jī)抽樣最符合隨機(jī)原則。u1.直接抽選法u直接抽選法,即從
23、總體中直接隨機(jī)抽選樣本。如從貨架商品中隨機(jī)抽取若干商品進(jìn)行檢驗(yàn);從農(nóng)貿(mào)市場(chǎng)攤位中隨意選擇若干攤位進(jìn)行調(diào)查或訪(fǎng)問(wèn)等u2.抽簽法u先將總體中的所有個(gè)體編號(hào)(號(hào)碼可以從1到N),并把號(hào)碼寫(xiě)在形狀、大小相同的號(hào)簽上,號(hào)簽可以用小球、卡片、紙條等制作,然后將這些號(hào)簽放在同一個(gè)箱子里,進(jìn)行均勻攪拌。抽簽時(shí),每次從中抽出1個(gè)號(hào)簽,連續(xù)抽取 次,就得到一個(gè)容量為 的樣本,對(duì)個(gè)體編號(hào)時(shí),也可以利用已有的編號(hào)u例如從全班學(xué)生中抽取樣本時(shí),可以利用學(xué)生的學(xué)號(hào)、座位號(hào)等。抽簽法簡(jiǎn)便易行,當(dāng)總體的個(gè)體數(shù)不多時(shí),適宜采用這種方法。u隨機(jī)數(shù)表法u隨機(jī)數(shù)表法,即利用隨機(jī)數(shù)表作為工具進(jìn)行抽樣。隨機(jī)數(shù)表(見(jiàn)樣例)又稱(chēng)亂數(shù)表,是將
24、0至9的10個(gè)數(shù)字隨機(jī)排列成表,以備查用。其特點(diǎn)是,無(wú)論橫行、豎行或隔行讀均無(wú)規(guī)律。因此,利用此表進(jìn)行抽樣,可保證隨機(jī)原則的實(shí)現(xiàn),并簡(jiǎn)化抽樣工作。u其步驟是:u 確定總體范圍,并編排單位號(hào)碼;u 確定樣本容量;u 抽選樣本單位,即從隨機(jī)數(shù)表中任一數(shù)碼始,按一定的順序(上下左右均可)或間隔讀數(shù),選取編號(hào)范圍內(nèi)的數(shù)碼,超出范圍的數(shù)碼不選,重復(fù)的數(shù)碼不再選,直至達(dá)到預(yù)定的樣本容量為止;u 排列中選數(shù)碼,并列出相應(yīng)單位名稱(chēng)。簡(jiǎn)單隨機(jī)抽樣nsxNnnsNnNnsx1)1(2nN (二)類(lèi)型抽樣(分層抽樣)u u定義:類(lèi)型抽樣又稱(chēng)分類(lèi)抽樣,是先對(duì)總體各單位按一定標(biāo)志加以分類(lèi),然后再?gòu)母黝?lèi)中按隨機(jī)原則抽取樣
25、本,由各類(lèi)內(nèi)的樣本組成一個(gè)總樣本。u方法:將總體N分成N1、N2、Nm,從N1中抽取n1 個(gè)單位、N2中抽取n2 個(gè)單位、Nm中抽取nm 個(gè)單位組成樣本。u總體單位數(shù)N= N1+N2+Nmu樣本單位數(shù)n= n1+n2+nmu 類(lèi)型抽樣是對(duì)總體各單位按一定標(biāo)志加以分組后,從每一組中按隨機(jī)原則抽取一定數(shù)量單位構(gòu)成樣本。組,則設(shè)總體分為kNNNNk211n2nknn得到這樣的樣本111211nxxx,222221nxxx,kknkkxxx,21nsXni2是組內(nèi)方差平均數(shù))(注:2i類(lèi)型抽樣的結(jié)論u因此有如下結(jié)論:u抽樣效果一般來(lái)說(shuō)好于簡(jiǎn)單隨機(jī)抽樣。u因此在分組時(shí)應(yīng)盡量擴(kuò)大組間方差(組間差異),縮小
26、組內(nèi)方差(組內(nèi)差異),從而減少抽樣誤差,提高抽樣效果。u例如:在對(duì)學(xué)生成績(jī)進(jìn)行抽樣時(shí),可按成績(jī)分組,分為優(yōu)、良、中、及格、不及格等幾組,然后在從各組分別抽取總體單位。222i類(lèi)型抽樣的抽樣平均誤差類(lèi)型抽樣的抽樣平均誤差與組間方差無(wú)關(guān)與組間方差無(wú)關(guān),它決定于,它決定于組內(nèi)方差的平均水平。根據(jù)方差的加法定理組內(nèi)方差的平均水平。根據(jù)方差的加法定理(三)等距抽樣u機(jī)械抽樣又稱(chēng)等距抽樣,它是對(duì)總體按一定的順序排列,每隔一定的間隔抽取一個(gè)或若干個(gè)單位,并把這些單位組成樣本的一種抽樣方法。u機(jī)械抽樣按排隊(duì)的標(biāo)志不同,分為無(wú)關(guān)標(biāo)志排隊(duì)和有關(guān)標(biāo)志排隊(duì)。等距抽樣u含義:又稱(chēng)機(jī)械抽樣或系統(tǒng)抽樣。先按某個(gè)標(biāo)志對(duì)總體單
27、位進(jìn)行排序,然后依固定的間隔來(lái)抽取樣本單位。這樣可以保證樣本單位均勻地分布在總體的各個(gè)部分,有較高的代表性。u總體的單位數(shù)N,需要抽取的樣本單位數(shù)n,則等距抽樣的間隔大?。簁=N/nnkiknknknkikkkki) 1(2)(1) 1(22121樣本樣本可按有關(guān)標(biāo)志排序可按有關(guān)標(biāo)志排序也可按無(wú)關(guān)標(biāo)志排序也可按無(wú)關(guān)標(biāo)志排序有關(guān)標(biāo)志排序效果好有關(guān)標(biāo)志排序效果好等距抽樣抽樣平均誤差的計(jì)算u如果是按無(wú)關(guān)標(biāo)志排隊(duì),則其抽樣平均誤差的計(jì)算公式就是簡(jiǎn)單隨機(jī)抽樣的抽樣平均誤差計(jì)算公式:如果是按如果是按有關(guān)標(biāo)志排隊(duì)有關(guān)標(biāo)志排隊(duì),則其抽樣平均誤差,則其抽樣平均誤差的計(jì)算公式按照的計(jì)算公式按照分層抽樣分層抽樣的抽
28、樣平均誤差計(jì)的抽樣平均誤差計(jì)算公式計(jì)算。(分層更細(xì),每層抽樣一個(gè))算公式計(jì)算。(分層更細(xì),每層抽樣一個(gè))ni2Nnn12等距抽樣方法u1、隨機(jī)起點(diǎn)等距抽樣(抽樣誤差大)u從X1到X35里面抽樣5個(gè),則樣本為u(X6,X13,X20,X27,X34)或(X1,X8,X15,X22,X29)u2、中點(diǎn)等距抽樣(抽樣誤差小,但樣本唯一,不滿(mǎn)足隨機(jī)原則)u從X1到X35里面抽樣5個(gè),則樣本為u(X4,X11,X18,X25,X32)u3、對(duì)稱(chēng)等距抽樣(抽樣誤差小,樣本不唯一,滿(mǎn)足隨機(jī)原則)u從X1到X35里面抽樣5個(gè),則樣本為u(X1,X14,X15,X28,X29)或( X2,X13,X16,X27
29、,X30 )u當(dāng)n為奇數(shù)時(shí)uU1=ruU2=2kuU3=2k+ruU4=4kuU5=4k+ruU6=6kuU7=6k+1當(dāng)n為偶數(shù)時(shí)U1=rU2=2k-rU3=2k+rU4=4k-rU5=4k+rU6=6k-rU7=6k+r(四)整群抽樣u整群抽樣是將總體劃分為由總體單位的組成的若干群,然后以群為抽樣單位,抽取若干群作為樣本,對(duì)群內(nèi)所有單位進(jìn)行抽樣的方法。整群抽樣。個(gè)單位,即群,每群包含個(gè)單位分為設(shè)總體RMNMRN群rMrMn有12RrRr整群抽樣抽樣效果評(píng)價(jià)u好處是操作方便、省時(shí)、省力。確定一群便可以調(diào)查許多單位u但由于抽樣單位比較集中,限制了樣本單位在總體中分配的均勻性,所以有時(shí)代表性較代
30、,抽樣誤差較大??梢栽黾訕颖締挝粊?lái)減少誤差 。u抽樣平均誤差只取決于群間方差(與類(lèi)型抽樣相反),因此分群時(shí),應(yīng)盡量擴(kuò)大群內(nèi)方差(群內(nèi)差異),縮小群間方差(群間差異)來(lái)提高抽樣效果。多階段抽樣u含義:所謂多階段抽樣,就是先從總體中抽出較大的范圍的單位,再?gòu)闹羞x的大單位中抽較小范圍的單位,依次類(lèi)推,最后從更小的范圍抽出樣本基本單位。每次抽樣方式可以不一樣。u一般應(yīng)用于總體范圍很大的情況。如在我國(guó)的農(nóng)產(chǎn)量調(diào)查、職工家計(jì)調(diào)查中都很適用:先從全國(guó)抽出各個(gè)省,再?gòu)某橹械氖≈谐槌隹h、市,最后抽出樣本的基本單位等等。u多階段抽樣的抽樣平均誤差等于各個(gè)階段抽樣誤差之和。故其抽樣誤差較大。 二、必要樣本容量的確定t程度之間存在矛盾。區(qū)間估計(jì)的精度和可靠抽樣兩者同向變化。因此,(體現(xiàn)估計(jì)可靠程度)與概率度(體現(xiàn)估計(jì)精度)誤差保持不變時(shí),抽樣極限當(dāng)抽樣平均誤差tn抽樣等。將重復(fù)抽樣改為非重復(fù)、選擇適當(dāng)?shù)某闃臃绞?,可以增加樣本容量而要降低?lái)實(shí)現(xiàn)。差以適當(dāng)降低抽樣平均誤為了調(diào)和這一矛盾,可n確定問(wèn)題。必要樣本容量到多少合適的問(wèn)題就是其中增加樣本容量擴(kuò)大樣本容量的計(jì)算u在設(shè)計(jì)抽樣時(shí),先確定允許的抽樣極限誤差和必要的概率保證程度F(t),然后根據(jù)歷史資料或試點(diǎn)資料確定總體的標(biāo)準(zhǔn)差或樣
溫馨提示
- 1. 本站所有資源如無(wú)特殊說(shuō)明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請(qǐng)下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請(qǐng)聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶(hù)所有。
- 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁(yè)內(nèi)容里面會(huì)有圖紙預(yù)覽,若沒(méi)有圖紙預(yù)覽就沒(méi)有圖紙。
- 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
- 5. 人人文庫(kù)網(wǎng)僅提供信息存儲(chǔ)空間,僅對(duì)用戶(hù)上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對(duì)用戶(hù)上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對(duì)任何下載內(nèi)容負(fù)責(zé)。
- 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請(qǐng)與我們聯(lián)系,我們立即糾正。
- 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶(hù)因使用這些下載資源對(duì)自己和他人造成任何形式的傷害或損失。
最新文檔
- 關(guān)于酒店轉(zhuǎn)讓合同范本
- 2025年GPPS項(xiàng)目建議書(shū)
- 買(mǎi)車(chē)預(yù)售合同范本
- 合同范例專(zhuān)用條款
- 個(gè)人演出勞務(wù)合同范例
- 攤位出兌合同范本
- 賣(mài)家解除合同范本
- 取送車(chē)合同范本
- 2025年特種用途鋼絲及鋼絲繩項(xiàng)目合作計(jì)劃書(shū)
- 籃球場(chǎng)地租賃合同范本
- 物業(yè)公司市場(chǎng)拓展全員營(yíng)銷(xiāo)激勵(lì)方案
- 2024-2025學(xué)年小學(xué)美術(shù)一年級(jí)下冊(cè)(2024)嶺南版(2024)教學(xué)設(shè)計(jì)合集
- 2024-2025學(xué)年初中信息技術(shù)(信息科技)七年級(jí)下冊(cè)甘教版教學(xué)設(shè)計(jì)合集
- 2024年安徽省文化和旅游行業(yè)職業(yè)技能大賽(導(dǎo)游賽項(xiàng))考試題庫(kù)(含答案)
- SOAP病例書(shū)寫(xiě)規(guī)范
- 小學(xué)一年級(jí)綜合實(shí)踐活動(dòng)第四單元課件《書(shū)包》
- DB13-T 6002-2024 應(yīng)急科普教育場(chǎng)館建設(shè)規(guī)范
- 2025屆高三數(shù)學(xué)一輪總復(fù)習(xí) 第二章 第一講 函數(shù)的概念及其表示
- 全國(guó)職業(yè)院校技能大賽高職組(軟件測(cè)試賽項(xiàng))備賽試題庫(kù)(含答案)
- 四川甘孜州招聘康定市投資發(fā)展集團(tuán)有限公司招聘筆試題庫(kù)2024
- 2024年甘肅省中考物理試題卷(含答案解析)
評(píng)論
0/150
提交評(píng)論