統(tǒng)計(jì)抽樣培訓(xùn)課件_第1頁(yè)
統(tǒng)計(jì)抽樣培訓(xùn)課件_第2頁(yè)
統(tǒng)計(jì)抽樣培訓(xùn)課件_第3頁(yè)
統(tǒng)計(jì)抽樣培訓(xùn)課件_第4頁(yè)
統(tǒng)計(jì)抽樣培訓(xùn)課件_第5頁(yè)
已閱讀5頁(yè),還剩109頁(yè)未讀 繼續(xù)免費(fèi)閱讀

下載本文檔

版權(quán)說(shuō)明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請(qǐng)進(jìn)行舉報(bào)或認(rèn)領(lǐng)

文檔簡(jiǎn)介

統(tǒng)計(jì)抽樣主要研究什么內(nèi)容,解決什么問(wèn)題?抽樣方法主要有哪幾種方法?如何確定樣本容量?1/52統(tǒng)計(jì)抽樣主要研究什么內(nèi)容,解決什么問(wèn)題?1/527.1統(tǒng)計(jì)抽樣基本概念總體由研究對(duì)象的全體所組成。樣本是總體中的部分元素所組成的集合。目標(biāo)總體是我們要推斷的總體抽樣總體是實(shí)際抽取樣本的總體27.1統(tǒng)計(jì)抽樣基本概念2 在抽樣之前,應(yīng)將總體劃分為抽樣單位。抽樣單位既可以是一個(gè)簡(jiǎn)單的個(gè)體,也可以是一組個(gè)體。 對(duì)某一個(gè)特殊研究,抽樣單位的名冊(cè)稱為抽樣框。7.1統(tǒng)計(jì)抽樣基本概念3 在抽樣之前,應(yīng)將總體劃分為抽樣單位。抽樣單位既可以是一個(gè)調(diào)查方法郵寄調(diào)查電話調(diào)查個(gè)人采訪調(diào)查7.2抽樣調(diào)查種類和抽樣方法4調(diào)郵寄調(diào)查電話調(diào)查個(gè)人采訪調(diào)查7.2抽樣調(diào)查種類和抽樣方調(diào)查誤差非抽樣誤差抽樣誤差由于沒(méi)有對(duì)總體的所有單位進(jìn)行調(diào)查而產(chǎn)生的誤差進(jìn)行一次抽樣調(diào)查可能出現(xiàn)的如測(cè)量誤差、采訪者誤差及數(shù)據(jù)處理誤差等。

7.3調(diào)查誤差5調(diào)非抽樣誤差抽樣誤差由于沒(méi)有對(duì)總體的所有單位進(jìn)行調(diào)查而產(chǎn) 從一個(gè)容量為N的有限總體中抽取得到一個(gè)容量為n的簡(jiǎn)單隨機(jī)樣本,使每一個(gè)容量為n的可能樣本,都有相同的概率被抽中。建立抽樣框根據(jù)隨機(jī)數(shù)表進(jìn)行抽樣抽樣總體中所有個(gè)體的名冊(cè)使用隨機(jī)數(shù)表,可以保證抽樣總體中的每個(gè)個(gè)體都有相同的概率被抽中

7.4簡(jiǎn)單隨機(jī)抽樣6 從一個(gè)容量為N的有限總體中抽取得到一個(gè)容量為n的簡(jiǎn)單隨機(jī)總體均值總體比率樣本容量的確定7.4簡(jiǎn)單隨機(jī)抽樣7總體均值7.4簡(jiǎn)單隨機(jī)抽樣7

如果選擇大樣本(n≥30),則中心極限定理可以保證的抽樣分布近似服從正態(tài)概率分布,μ的區(qū)間估計(jì)為

式中,為均值的標(biāo)準(zhǔn)差。1-α稱為置信度,為與之對(duì)應(yīng)的臨界值。例如,若置信度為95%,則。7.4.1總體均值8 7.4.1總體均值8 當(dāng)從一個(gè)容量為N的有限總體中,抽取一個(gè)容量為n的簡(jiǎn)單隨機(jī)樣本時(shí),均值的標(biāo)準(zhǔn)差的估計(jì)值為

此時(shí)總體均值的區(qū)間估計(jì)為 在抽樣調(diào)查中,當(dāng)構(gòu)造置信區(qū)間時(shí),通常取μ=2。因此,在使用簡(jiǎn)單隨機(jī)樣本時(shí),總體均值的近似95%的置信區(qū)間的表達(dá)式為:7.4.1總體均值9 當(dāng)從一個(gè)容量為N的有限總體中,抽取一個(gè)容量為n的簡(jiǎn)單隨機(jī)[例7.1]《攝影》是一本推介攝影作品、報(bào)道攝影發(fā)展?fàn)顩r、介紹攝影器材的雜志,它目前擁有8000個(gè)訂戶。根據(jù)一個(gè)484個(gè)訂戶的簡(jiǎn)單隨機(jī)樣本,得出訂戶的年平均收入為30500元,標(biāo)準(zhǔn)差為7040元。因此,所有訂戶的年平均收入的無(wú)偏估計(jì)為元。 因此,這本雜志訂戶的年平均收入的近似95%的置信區(qū)間為 即(29880,31120)。7.4.1總體均值10[例7.1]《攝影》是一本推介攝影作品、報(bào)道攝影發(fā)展?fàn)顩r、介 上述過(guò)程也可用于對(duì)諸如總體總量或總體比率等其他總體參數(shù)的區(qū)間估計(jì)。對(duì)點(diǎn)估計(jì)的抽樣分布近似服從正態(tài)概率分布的所有情形,其近似95%的置信區(qū)間為 例如,在《攝影》的抽樣調(diào)查中,點(diǎn)估計(jì)量的標(biāo)準(zhǔn)誤差的估計(jì)值為,允許誤差為2×310元=620元。7.4.1總體均值117.4.1總體均值11

總體比率p是總體中具有某些感興趣特征的個(gè)體的比重。[例7.2]在市場(chǎng)調(diào)查研究中,人們想了解喜歡某一品牌的消費(fèi)者比重。樣本比率是總體比率的無(wú)偏點(diǎn)估計(jì)。總體比率的標(biāo)準(zhǔn)差的估計(jì)值為 因此, 總體比率的近似95%的置信區(qū)間的表達(dá)式如下:

7.4.2總體比率12 總體比率p是總體中具有某些感興趣特征的個(gè)體的比重。7.4. 例如,在大宇國(guó)際咨詢公司的抽樣調(diào)查中,大宇國(guó)際咨詢公司也想估計(jì)在它服務(wù)范圍內(nèi)的500所學(xué)校中,使用天然氣作為取暖燃料的學(xué)校比率。如果在抽出的50所學(xué)校中,有35所學(xué)校使用天然氣作為取暖燃料,則總體500所學(xué)校中使用天然氣比率的點(diǎn)估計(jì)值。比率的標(biāo)準(zhǔn)差的估計(jì)值為 因此, 總體比率的近似95%置信區(qū)間為 即(0.5758,0.8242)。7.4.2總體比率13 例如,在大宇國(guó)際咨詢公司的抽樣調(diào)查中,大宇國(guó)際咨詢公司也想回憶前面提到的允許誤差為“點(diǎn)估計(jì)的標(biāo)準(zhǔn)差估計(jì)值的2倍”,因此:均值的標(biāo)準(zhǔn)差的估計(jì)值:7.4.3樣本容量的確定14回憶前面提到的允許誤差為“點(diǎn)估計(jì)的標(biāo)準(zhǔn)差估計(jì)值兩步抽樣用試點(diǎn)調(diào)查或事先檢驗(yàn)的結(jié)果估計(jì)s2

估計(jì)s2的方法根據(jù)以往的資料估計(jì)s2

由第一步抽取的部分單位,得到的s2的估計(jì)值,將此值代入上式,確定出全部樣本容量n;然后對(duì)第一步確定的全部樣本容量,再抽取第二步所需要的其余單位數(shù)。

7.4.3樣本容量的確定15兩步抽樣用試點(diǎn)調(diào)查或事先估計(jì)s2的方法根據(jù)以往的資料估計(jì)s2[例7.3]某大學(xué)有5000名畢業(yè)生,我們想構(gòu)造寬度在1000元之內(nèi)的近似95%的置信區(qū)間。 對(duì)這樣規(guī)定的置信區(qū)間,B=500。在確定n之前,需要估計(jì)。 假設(shè)根據(jù)去年所做的同樣研究,得知s=3000元。我們可以用這個(gè)值來(lái)估計(jì)。根據(jù)B=500、s=3000及N=5000,則樣本容量為7.4.3樣本容量的確定16[例7.3]某大學(xué)有5000名畢業(yè)生,我們想構(gòu)造寬度在100

在估計(jì)總體比率時(shí),選擇樣本容量的公式,與估計(jì)總體均值的公式類似。我們只需要將估計(jì)總體均值的公式中替換為,即

使用上式時(shí),我們必須規(guī)定允許誤差B和給出的一個(gè)估計(jì)值。如果沒(méi)有合適的估計(jì)值,我們可以使用代替,這樣將保證近似置信區(qū)間的允許誤差比希望的要小的多。7.4.3樣本容量的確定17 在估計(jì)總體比率時(shí),選擇樣本容量的公式,與估計(jì)總體均值的公將總體劃分H組從第h層中抽取一個(gè)容量為nh的簡(jiǎn)單隨機(jī)樣本由這H個(gè)簡(jiǎn)單隨機(jī)樣本的聯(lián)合資料,可得出諸如總體均值、總體總量及總體比率等各種總體參數(shù)的估計(jì)。

分層簡(jiǎn)單隨機(jī)抽樣的步驟:也稱為層7.5分層簡(jiǎn)單隨機(jī)抽樣18將總體劃分H組從第h層中抽取一個(gè)容量由這H個(gè)簡(jiǎn)單隨機(jī)樣本的聯(lián)

如果各層內(nèi)的差異比層間的差異小,則分層簡(jiǎn)單隨機(jī)樣本可得到更大的精度(總體參數(shù)的區(qū)間估計(jì)將更窄)。 各層的劃分應(yīng)依據(jù)樣本設(shè)計(jì)者的判斷。 總體可按部門、地區(qū)、年齡、產(chǎn)品類型、銷售水平等分層。7.5分層簡(jiǎn)單隨機(jī)抽樣19 如果各層內(nèi)的差異比層間的差異小,則分層簡(jiǎn)單隨機(jī)樣本可得到[例7.4]某大學(xué)管理學(xué)院想對(duì)今年的畢業(yè)生進(jìn)行一次調(diào)查,以便了解他們開(kāi)始工作時(shí)的年薪。7.5分層簡(jiǎn)單隨機(jī)抽樣20[例7.4]某大學(xué)管理學(xué)院想對(duì)今年的畢業(yè)生進(jìn)行一次調(diào)查,以便 在分層抽樣中,總體均值的無(wú)偏估計(jì)是各層樣本均值的加權(quán)平均數(shù),所用權(quán)數(shù)為總體在各層的比重。用

表示總體均值的點(diǎn)估計(jì),其定義如下: 式中:H--層數(shù);--第h層的樣本均值; Nh--第h層的單位數(shù);N--總體單位數(shù); 對(duì)分層簡(jiǎn)單隨機(jī)樣本,計(jì)算平均值的標(biāo)準(zhǔn)差的估計(jì)公式為7.5.1總體均值21 在分層抽樣中,總體均值的無(wú)偏估計(jì)是各層樣本均值的加權(quán)平均某大學(xué)管理學(xué)院的180名畢業(yè)生的樣本調(diào)查結(jié)果

7.5.1總體均值227.5.1總體均值22 各專業(yè)(層)的樣本均值分別為:

因此,總體均值的點(diǎn)估計(jì)為7.5.1總體均值237.5.1總體均值23抽樣調(diào)查中估計(jì)均值的標(biāo)準(zhǔn)差所需要的部分計(jì)算結(jié)果7.5.1總體均值247.5.1總體均值24 上表中 因此,總體的近似95%的置信區(qū)間為 即(29074,29626)。

7.5.1總體均值257.5.1總體均值25 對(duì)分層簡(jiǎn)單隨機(jī)抽樣,總體比率p的無(wú)偏估計(jì)是各層比率的加權(quán)平均數(shù),所用權(quán)數(shù)為總體在各層的比重??傮w比率的點(diǎn)估計(jì)定義如下: 式中:H--層數(shù);--第h層的樣本比率;Nh―第h層的單位數(shù);N―總體單位數(shù);7.5.2總體比率26 對(duì)分層簡(jiǎn)單隨機(jī)抽樣,總體比率p的無(wú)偏估計(jì)是各層比率的加權(quán) 的標(biāo)準(zhǔn)差的估計(jì)值為 總體比率的近似95%的置信區(qū)間的表達(dá)式為7.5.2總體比率277.5.2總體比率27

[例7.5]在某大學(xué)的調(diào)查中,大學(xué)想了解畢業(yè)生開(kāi)始工作時(shí)的年薪不低于36000元的比率。180名畢業(yè)生的抽樣調(diào)查結(jié)果顯示,有20名畢業(yè)生開(kāi)始工作時(shí)的年薪不低于36000元,其中會(huì)計(jì)專業(yè)4名,金融專業(yè)2名,信息系統(tǒng)專業(yè)7名,市場(chǎng)營(yíng)銷專業(yè)1名,經(jīng)營(yíng)管理專業(yè)6名。

7.5.2總體比率28 7.5.2總體比率28 根據(jù)總體比率的近似95%的置信區(qū)間的公式,開(kāi)始工作時(shí)的年薪不低于36000元的比率的點(diǎn)估計(jì)為:

故畢業(yè)生開(kāi)始時(shí)的年薪不低于36000元的比率近似95%置信區(qū)間為(0.0575,0.1387)7.5.2總體比率29 根據(jù)總體比率的近似95%的置信區(qū)間的公式,開(kāi)始工作時(shí)的年

對(duì)分層簡(jiǎn)單隨機(jī)抽樣,我們可用兩階段過(guò)程來(lái)選擇樣本容量。

既然人們想估計(jì)各層的均值、總量及比率,這兩種組合方法都經(jīng)常使用。確定總樣本容量n決定各層應(yīng)分配的樣本單位數(shù)決定每層應(yīng)選擇的樣本單位數(shù)加總得到總樣本容量

或者7.5.3樣本容量的確定30 對(duì)分層簡(jiǎn)單隨機(jī)抽樣,我們可用兩階段過(guò)程來(lái)選擇樣本容量。

確定總樣本容量n及其分配,可對(duì)所有要研究的總體參數(shù)提供必要的精度。

分配工作就是決定總樣本被分配到各層的部分,這些部分將確定各層的簡(jiǎn)單隨機(jī)樣本的容量。

各層的單位數(shù)各層內(nèi)的方差考慮的因素各層選擇單位的費(fèi)用

7.5.3樣本容量的確定31 確定總樣本容量n及其分配,可對(duì)所有要研究的總體參數(shù)提供必 一般地,單位數(shù)較多的層和方差較大的層應(yīng)分配較多的樣本數(shù)目。 相反地,對(duì)于給定的費(fèi)用,為了獲得更多的信息,則抽樣單位成本較大的層應(yīng)分配較少的樣本數(shù)目。7.5.3樣本容量的確定327.5.3樣本容量的確定32整群抽樣需要將總體各個(gè)個(gè)體分為N組(也稱作群),使總體中每個(gè)個(gè)體只屬于一群??傮w組1組2個(gè)體4個(gè)體5個(gè)體1個(gè)體6個(gè)體2個(gè)體37.6整群抽樣33整群抽樣需要將總體各個(gè)個(gè)體分為N組(也稱作群),使總體中例如,我們想調(diào)查某省的登記選民。則有兩種方法:調(diào)查某省的登記選民。有兩種方法:第一種方法是建立包含該省所有登記選民的抽樣框,然后根據(jù)抽樣框,選擇選民的一個(gè)簡(jiǎn)單隨機(jī)樣本。第二種方法是整群抽樣,我們選擇用該省各縣的清單作抽樣框。在這個(gè)方法中,每個(gè)縣(或群)包含一組登記選民,而該省的每個(gè)登記選民只屬于一群。7.6整群抽樣34例如,我們想調(diào)查某省的登記選民。則有兩種方法:調(diào)查某省的分層抽樣和整群抽樣都將總體劃分為組,因此這兩種抽樣過(guò)程感覺(jué)上是相似的。選擇整群抽樣與分層抽樣的原因是不同的。當(dāng)群內(nèi)的個(gè)體存在差異時(shí),整群抽樣可提供較好的結(jié)果。理想情形是每一群是整個(gè)總體的一個(gè)縮影,這時(shí),抽取很少的群就可以提供關(guān)于整個(gè)總體特征的信息。整群抽樣與分層抽樣的比較7.6整群抽樣35分層抽樣和整群抽樣都將總體劃分為組,因此這兩種抽樣過(guò)程感覺(jué)上整群抽樣的優(yōu)缺點(diǎn)

整群抽樣的優(yōu)點(diǎn)是實(shí)施方便、節(jié)省經(jīng)費(fèi);整群抽樣的缺點(diǎn)是往往由于不同群之間的差異較大,由此而引起的抽樣誤差往往大于簡(jiǎn)單隨機(jī)抽樣。整群抽樣與分層抽樣的匹別

整群抽樣與分層抽樣在形式上有相似之處,但實(shí)際上差別很大。分層抽樣要求各層之間的差異很大,層內(nèi)個(gè)體或單元差異小,而整群抽樣要求群與群之間的差異比較小,群內(nèi)個(gè)體或單元差異大36整群抽樣的優(yōu)缺點(diǎn)36[例7.6]某省擁有12000名執(zhí)業(yè)注冊(cè)會(huì)計(jì)師的注冊(cè)會(huì)計(jì)師協(xié)會(huì)進(jìn)行了一項(xiàng)調(diào)查。作為調(diào)查的一部分,注冊(cè)會(huì)計(jì)師協(xié)會(huì)收集與收入、性別和與注冊(cè)會(huì)計(jì)師生活方式有關(guān)的因素的信息。因?yàn)橛脗€(gè)人采訪法去搜集所需要的信息,因此注冊(cè)會(huì)計(jì)師協(xié)會(huì)采用整群抽樣,以使總的差旅費(fèi)和采訪費(fèi)用達(dá)到最小。抽樣框中包含所有在該省登記注冊(cè)的執(zhí)業(yè)會(huì)計(jì)師事務(wù)所。7.6整群抽樣37[例7.6]7.6整群抽樣37假設(shè)有1000群,即在該省登記注冊(cè)的從事會(huì)計(jì)活動(dòng)的會(huì)計(jì)師事務(wù)所有1000個(gè),選擇10個(gè)會(huì)計(jì)師事務(wù)所為一個(gè)簡(jiǎn)單隨機(jī)樣本。[例7.6](續(xù))7.6整群抽樣38假設(shè)有1000群,即在該省登記注冊(cè)的從事會(huì)計(jì)活動(dòng)的會(huì)計(jì)師為了介紹在整群抽樣中,構(gòu)造總體均值、總體總量和總體比率的近似95%置信區(qū)間需要的公式,我們使用如下的記號(hào):N—總體的群數(shù);n—樣本中選出的群數(shù);Mi—i群的單位數(shù);M—總體單位數(shù);M=M1+M2+…十MN;—每一群的平均單位數(shù)。Xi——第i群所有觀察值的總量;ai——第i群具有某特征的觀察值的數(shù)量;7.6整群抽樣39為了介紹在整群抽樣中,構(gòu)造總體均值、總體總量和總體比對(duì)注冊(cè)會(huì)計(jì)師協(xié)會(huì)的抽樣調(diào)查,我們有如下資料:N=1000n=10M=12000

下表7-4為每個(gè)中選群的Mi和xi的值,以及中選事務(wù)所中女注冊(cè)會(huì)計(jì)師的數(shù)量(ai)的資料。[例7.6](續(xù))7.6整群抽樣40對(duì)注冊(cè)會(huì)計(jì)師協(xié)會(huì)的抽樣調(diào)查,我們有如下資料:N=10007.6整群抽樣417.6整群抽樣41由整群抽樣得到的總體均值的點(diǎn)估計(jì)的公式如下:(7-25)7.6.1總體均值42由整群抽樣得到的總體均值的點(diǎn)估計(jì)的公式如下:(7-該點(diǎn)估計(jì)量的標(biāo)準(zhǔn)差的估計(jì)為:(7-26)總體均值的近似95%的置信區(qū)間為:7.6.1總體均值43該點(diǎn)估計(jì)量的標(biāo)準(zhǔn)差的估計(jì)為:(7-26)總體均值的根據(jù)表7-4的資料,我們可以得到執(zhí)業(yè)注冊(cè)會(huì)計(jì)師平均年薪的點(diǎn)估計(jì)為[例7.6](續(xù))7.6.1總體均值44根據(jù)表7-4的資料,我們可以得到執(zhí)業(yè)注冊(cè)會(huì)計(jì)師平均年由于表7-4中的年薪資料是以千元計(jì)量的,因此,執(zhí)業(yè)注冊(cè)會(huì)計(jì)師的平均年薪的估計(jì)值為42531元。而:因此:[例7.6](續(xù))7.6.1總體均值45由于表7-4中的年薪資料是以千元計(jì)量的,因此,執(zhí)業(yè)注因此標(biāo)準(zhǔn)差為1.730。我們得到平均年薪的近似95%置信區(qū)間:即(39.071,45.991)。[例7.6](續(xù))7.6.1總體均值46因此標(biāo)準(zhǔn)差為1.730。我們得到平均年薪的近似95%整群抽樣的總體比率的點(diǎn)估計(jì)如下:(7-30)式中ai——第i群中具有某種感興趣特征的個(gè)體的數(shù)量。7.6.2總體比率47整群抽樣的總體比率的點(diǎn)估計(jì)如下:(7-30)式中ai該點(diǎn)估計(jì)量的標(biāo)準(zhǔn)誤差的估計(jì)為:(7-31)總體比率的近似95%的置信區(qū)間(7-32)7.6.2總體比率48該點(diǎn)估計(jì)量的標(biāo)準(zhǔn)誤差的估計(jì)為:(7-31)總體比率的近似9對(duì)注冊(cè)會(huì)計(jì)師抽樣調(diào)查,可以得到女性執(zhí)業(yè)注冊(cè)會(huì)計(jì)師的比率的估計(jì)為:[例7.6](續(xù))7.6.2總體比率49對(duì)注冊(cè)會(huì)計(jì)師抽樣調(diào)查,可以得到女性執(zhí)業(yè)注冊(cè)會(huì)計(jì)師的比并且:因此:[例7.6](續(xù))7.6.2總體比率50并且:因此:[例7.6](續(xù))7.6.2總體比率50因此,女性執(zhí)業(yè)注冊(cè)會(huì)計(jì)師比率的近似95%置信區(qū)間為即(0.2052,0.3416)。[例7.6](續(xù))7.6.2總體比率51因此,女性執(zhí)業(yè)注冊(cè)會(huì)計(jì)師比率的近似95%置信區(qū)間為先通過(guò)選擇β(即允許誤差)的值,規(guī)定可接受的精度水平建立滿足所需要的精度的n值的計(jì)算公式每群平均個(gè)體的數(shù)量和群間方差是決定樣本中包含群數(shù)多少的關(guān)鍵因素。如果各群相似,則群間方差小,因此中選群數(shù)就比較少。如果每群平均個(gè)體數(shù)量較大,則中選群數(shù)也會(huì)比較少。整群抽樣的過(guò)程同其他抽樣方法整體上是類似的7.6.3樣本容量的確定52先通過(guò)選擇β(即允許誤差)的值,規(guī)定可接受的精度水平建立滿足7.7系統(tǒng)抽樣系統(tǒng)抽樣法:又叫做等距抽樣法或機(jī)械抽樣法,即依據(jù)一定的抽樣距離,從母體中抽取樣本。

定義:要從容量為N的總體中抽取容量為n的樣本,可將總體分成均衡的若干部分,然后按照預(yù)先規(guī)定的規(guī)則,從每一部分抽取一個(gè)個(gè)體,得到所需要的樣本的抽樣方法。

由于系統(tǒng)抽樣法操作簡(jiǎn)便,實(shí)施起來(lái)不易出錯(cuò),因而在生產(chǎn)現(xiàn)場(chǎng)人們樂(lè)于使用它。如在某道工序上定時(shí)去抽一件產(chǎn)品進(jìn)行檢驗(yàn),就可以看做是系統(tǒng)抽樣法的一個(gè)例子.

537.7系統(tǒng)抽樣53系統(tǒng)抽樣步驟:

①編號(hào):先將總體的N個(gè)個(gè)體編號(hào),有時(shí)可直接利用自身個(gè)體所帶的號(hào)碼,如學(xué)號(hào)、門牌號(hào)等。

②分段:確定分段間隔k,對(duì)編號(hào)進(jìn)行分段,當(dāng)N/n(n是樣本容量)是整數(shù)時(shí),取k=N/n。

③確定第一個(gè)個(gè)體編號(hào):在第一段用簡(jiǎn)單隨機(jī)抽樣確定第一個(gè)個(gè)體編號(hào)l(l≤k)。

④成樣:按照一定的規(guī)則抽取樣本,通常是將l加上間隔k得到第二個(gè)個(gè)體編號(hào)(l+k),再加上k得到第三個(gè)個(gè)體編號(hào)(l+2k),依次進(jìn)行下去,直到獲取整個(gè)樣本。54系統(tǒng)抽樣步驟:54例如,需要從容量為5000的總體中抽取一個(gè)容量為50的樣本,我們可以從總體中隨機(jī)選擇一個(gè),然后在其后面的抽樣框中,每隔100個(gè)個(gè)體選擇一個(gè),可得到樣本中其余的個(gè)體。7.7系統(tǒng)抽樣因?yàn)榈谝粋€(gè)個(gè)體的選擇是隨機(jī)的,因此系統(tǒng)樣本常常假定具有簡(jiǎn)單隨機(jī)樣本的性質(zhì)。當(dāng)抽樣框是由總體中的個(gè)體隨機(jī)排列而形成時(shí),這種假定通常是合適的。55例如,需要從容量為5000的總體中抽取一個(gè)容量為50分層抽樣與系統(tǒng)抽樣的區(qū)別:分層抽樣是按比例抽樣,系統(tǒng)抽樣屬于分組抽樣(比較常見(jiàn)的等距抽樣)(1)分層抽樣是要先把所有元素按某種特征或標(biāo)志(比如年齡、性別、職業(yè)或地域等)劃分成幾個(gè)類型或?qū)哟?,在在其中采用前兩種方法抽取一個(gè)子樣本,所有子樣本構(gòu)成了總的樣本。(2)系統(tǒng)抽樣就是把總體的元素編號(hào)排序后,再計(jì)算出某種間隔,然后按一固定抽取元素來(lái)組成樣本的方法。適合用于總體及樣本規(guī)模都較大的情況。它與簡(jiǎn)單隨機(jī)抽樣一樣都要有完整的抽樣框。56分層抽樣與系統(tǒng)抽樣的區(qū)別:56演講完畢,謝謝觀看!演講完畢,謝謝觀看!統(tǒng)計(jì)抽樣主要研究什么內(nèi)容,解決什么問(wèn)題?抽樣方法主要有哪幾種方法?如何確定樣本容量?58/52統(tǒng)計(jì)抽樣主要研究什么內(nèi)容,解決什么問(wèn)題?1/527.1統(tǒng)計(jì)抽樣基本概念總體由研究對(duì)象的全體所組成。樣本是總體中的部分元素所組成的集合。目標(biāo)總體是我們要推斷的總體抽樣總體是實(shí)際抽取樣本的總體597.1統(tǒng)計(jì)抽樣基本概念2 在抽樣之前,應(yīng)將總體劃分為抽樣單位。抽樣單位既可以是一個(gè)簡(jiǎn)單的個(gè)體,也可以是一組個(gè)體。 對(duì)某一個(gè)特殊研究,抽樣單位的名冊(cè)稱為抽樣框。7.1統(tǒng)計(jì)抽樣基本概念60 在抽樣之前,應(yīng)將總體劃分為抽樣單位。抽樣單位既可以是一個(gè)調(diào)查方法郵寄調(diào)查電話調(diào)查個(gè)人采訪調(diào)查7.2抽樣調(diào)查種類和抽樣方法61調(diào)郵寄調(diào)查電話調(diào)查個(gè)人采訪調(diào)查7.2抽樣調(diào)查種類和抽樣方調(diào)查誤差非抽樣誤差抽樣誤差由于沒(méi)有對(duì)總體的所有單位進(jìn)行調(diào)查而產(chǎn)生的誤差進(jìn)行一次抽樣調(diào)查可能出現(xiàn)的如測(cè)量誤差、采訪者誤差及數(shù)據(jù)處理誤差等。

7.3調(diào)查誤差62調(diào)非抽樣誤差抽樣誤差由于沒(méi)有對(duì)總體的所有單位進(jìn)行調(diào)查而產(chǎn) 從一個(gè)容量為N的有限總體中抽取得到一個(gè)容量為n的簡(jiǎn)單隨機(jī)樣本,使每一個(gè)容量為n的可能樣本,都有相同的概率被抽中。建立抽樣框根據(jù)隨機(jī)數(shù)表進(jìn)行抽樣抽樣總體中所有個(gè)體的名冊(cè)使用隨機(jī)數(shù)表,可以保證抽樣總體中的每個(gè)個(gè)體都有相同的概率被抽中

7.4簡(jiǎn)單隨機(jī)抽樣63 從一個(gè)容量為N的有限總體中抽取得到一個(gè)容量為n的簡(jiǎn)單隨機(jī)總體均值總體比率樣本容量的確定7.4簡(jiǎn)單隨機(jī)抽樣64總體均值7.4簡(jiǎn)單隨機(jī)抽樣7

如果選擇大樣本(n≥30),則中心極限定理可以保證的抽樣分布近似服從正態(tài)概率分布,μ的區(qū)間估計(jì)為

式中,為均值的標(biāo)準(zhǔn)差。1-α稱為置信度,為與之對(duì)應(yīng)的臨界值。例如,若置信度為95%,則。7.4.1總體均值65 7.4.1總體均值8 當(dāng)從一個(gè)容量為N的有限總體中,抽取一個(gè)容量為n的簡(jiǎn)單隨機(jī)樣本時(shí),均值的標(biāo)準(zhǔn)差的估計(jì)值為

此時(shí)總體均值的區(qū)間估計(jì)為 在抽樣調(diào)查中,當(dāng)構(gòu)造置信區(qū)間時(shí),通常取μ=2。因此,在使用簡(jiǎn)單隨機(jī)樣本時(shí),總體均值的近似95%的置信區(qū)間的表達(dá)式為:7.4.1總體均值66 當(dāng)從一個(gè)容量為N的有限總體中,抽取一個(gè)容量為n的簡(jiǎn)單隨機(jī)[例7.1]《攝影》是一本推介攝影作品、報(bào)道攝影發(fā)展?fàn)顩r、介紹攝影器材的雜志,它目前擁有8000個(gè)訂戶。根據(jù)一個(gè)484個(gè)訂戶的簡(jiǎn)單隨機(jī)樣本,得出訂戶的年平均收入為30500元,標(biāo)準(zhǔn)差為7040元。因此,所有訂戶的年平均收入的無(wú)偏估計(jì)為元。 因此,這本雜志訂戶的年平均收入的近似95%的置信區(qū)間為 即(29880,31120)。7.4.1總體均值67[例7.1]《攝影》是一本推介攝影作品、報(bào)道攝影發(fā)展?fàn)顩r、介 上述過(guò)程也可用于對(duì)諸如總體總量或總體比率等其他總體參數(shù)的區(qū)間估計(jì)。對(duì)點(diǎn)估計(jì)的抽樣分布近似服從正態(tài)概率分布的所有情形,其近似95%的置信區(qū)間為 例如,在《攝影》的抽樣調(diào)查中,點(diǎn)估計(jì)量的標(biāo)準(zhǔn)誤差的估計(jì)值為,允許誤差為2×310元=620元。7.4.1總體均值687.4.1總體均值11

總體比率p是總體中具有某些感興趣特征的個(gè)體的比重。[例7.2]在市場(chǎng)調(diào)查研究中,人們想了解喜歡某一品牌的消費(fèi)者比重。樣本比率是總體比率的無(wú)偏點(diǎn)估計(jì)。總體比率的標(biāo)準(zhǔn)差的估計(jì)值為 因此, 總體比率的近似95%的置信區(qū)間的表達(dá)式如下:

7.4.2總體比率69 總體比率p是總體中具有某些感興趣特征的個(gè)體的比重。7.4. 例如,在大宇國(guó)際咨詢公司的抽樣調(diào)查中,大宇國(guó)際咨詢公司也想估計(jì)在它服務(wù)范圍內(nèi)的500所學(xué)校中,使用天然氣作為取暖燃料的學(xué)校比率。如果在抽出的50所學(xué)校中,有35所學(xué)校使用天然氣作為取暖燃料,則總體500所學(xué)校中使用天然氣比率的點(diǎn)估計(jì)值。比率的標(biāo)準(zhǔn)差的估計(jì)值為 因此, 總體比率的近似95%置信區(qū)間為 即(0.5758,0.8242)。7.4.2總體比率70 例如,在大宇國(guó)際咨詢公司的抽樣調(diào)查中,大宇國(guó)際咨詢公司也想回憶前面提到的允許誤差為“點(diǎn)估計(jì)的標(biāo)準(zhǔn)差估計(jì)值的2倍”,因此:均值的標(biāo)準(zhǔn)差的估計(jì)值:7.4.3樣本容量的確定71回憶前面提到的允許誤差為“點(diǎn)估計(jì)的標(biāo)準(zhǔn)差估計(jì)值兩步抽樣用試點(diǎn)調(diào)查或事先檢驗(yàn)的結(jié)果估計(jì)s2

估計(jì)s2的方法根據(jù)以往的資料估計(jì)s2

由第一步抽取的部分單位,得到的s2的估計(jì)值,將此值代入上式,確定出全部樣本容量n;然后對(duì)第一步確定的全部樣本容量,再抽取第二步所需要的其余單位數(shù)。

7.4.3樣本容量的確定72兩步抽樣用試點(diǎn)調(diào)查或事先估計(jì)s2的方法根據(jù)以往的資料估計(jì)s2[例7.3]某大學(xué)有5000名畢業(yè)生,我們想構(gòu)造寬度在1000元之內(nèi)的近似95%的置信區(qū)間。 對(duì)這樣規(guī)定的置信區(qū)間,B=500。在確定n之前,需要估計(jì)。 假設(shè)根據(jù)去年所做的同樣研究,得知s=3000元。我們可以用這個(gè)值來(lái)估計(jì)。根據(jù)B=500、s=3000及N=5000,則樣本容量為7.4.3樣本容量的確定73[例7.3]某大學(xué)有5000名畢業(yè)生,我們想構(gòu)造寬度在100

在估計(jì)總體比率時(shí),選擇樣本容量的公式,與估計(jì)總體均值的公式類似。我們只需要將估計(jì)總體均值的公式中替換為,即

使用上式時(shí),我們必須規(guī)定允許誤差B和給出的一個(gè)估計(jì)值。如果沒(méi)有合適的估計(jì)值,我們可以使用代替,這樣將保證近似置信區(qū)間的允許誤差比希望的要小的多。7.4.3樣本容量的確定74 在估計(jì)總體比率時(shí),選擇樣本容量的公式,與估計(jì)總體均值的公將總體劃分H組從第h層中抽取一個(gè)容量為nh的簡(jiǎn)單隨機(jī)樣本由這H個(gè)簡(jiǎn)單隨機(jī)樣本的聯(lián)合資料,可得出諸如總體均值、總體總量及總體比率等各種總體參數(shù)的估計(jì)。

分層簡(jiǎn)單隨機(jī)抽樣的步驟:也稱為層7.5分層簡(jiǎn)單隨機(jī)抽樣75將總體劃分H組從第h層中抽取一個(gè)容量由這H個(gè)簡(jiǎn)單隨機(jī)樣本的聯(lián)

如果各層內(nèi)的差異比層間的差異小,則分層簡(jiǎn)單隨機(jī)樣本可得到更大的精度(總體參數(shù)的區(qū)間估計(jì)將更窄)。 各層的劃分應(yīng)依據(jù)樣本設(shè)計(jì)者的判斷。 總體可按部門、地區(qū)、年齡、產(chǎn)品類型、銷售水平等分層。7.5分層簡(jiǎn)單隨機(jī)抽樣76 如果各層內(nèi)的差異比層間的差異小,則分層簡(jiǎn)單隨機(jī)樣本可得到[例7.4]某大學(xué)管理學(xué)院想對(duì)今年的畢業(yè)生進(jìn)行一次調(diào)查,以便了解他們開(kāi)始工作時(shí)的年薪。7.5分層簡(jiǎn)單隨機(jī)抽樣77[例7.4]某大學(xué)管理學(xué)院想對(duì)今年的畢業(yè)生進(jìn)行一次調(diào)查,以便 在分層抽樣中,總體均值的無(wú)偏估計(jì)是各層樣本均值的加權(quán)平均數(shù),所用權(quán)數(shù)為總體在各層的比重。用

表示總體均值的點(diǎn)估計(jì),其定義如下: 式中:H--層數(shù);--第h層的樣本均值; Nh--第h層的單位數(shù);N--總體單位數(shù); 對(duì)分層簡(jiǎn)單隨機(jī)樣本,計(jì)算平均值的標(biāo)準(zhǔn)差的估計(jì)公式為7.5.1總體均值78 在分層抽樣中,總體均值的無(wú)偏估計(jì)是各層樣本均值的加權(quán)平均某大學(xué)管理學(xué)院的180名畢業(yè)生的樣本調(diào)查結(jié)果

7.5.1總體均值797.5.1總體均值22 各專業(yè)(層)的樣本均值分別為:

因此,總體均值的點(diǎn)估計(jì)為7.5.1總體均值807.5.1總體均值23抽樣調(diào)查中估計(jì)均值的標(biāo)準(zhǔn)差所需要的部分計(jì)算結(jié)果7.5.1總體均值817.5.1總體均值24 上表中 因此,總體的近似95%的置信區(qū)間為 即(29074,29626)。

7.5.1總體均值827.5.1總體均值25 對(duì)分層簡(jiǎn)單隨機(jī)抽樣,總體比率p的無(wú)偏估計(jì)是各層比率的加權(quán)平均數(shù),所用權(quán)數(shù)為總體在各層的比重??傮w比率的點(diǎn)估計(jì)定義如下: 式中:H--層數(shù);--第h層的樣本比率;Nh―第h層的單位數(shù);N―總體單位數(shù);7.5.2總體比率83 對(duì)分層簡(jiǎn)單隨機(jī)抽樣,總體比率p的無(wú)偏估計(jì)是各層比率的加權(quán) 的標(biāo)準(zhǔn)差的估計(jì)值為 總體比率的近似95%的置信區(qū)間的表達(dá)式為7.5.2總體比率847.5.2總體比率27

[例7.5]在某大學(xué)的調(diào)查中,大學(xué)想了解畢業(yè)生開(kāi)始工作時(shí)的年薪不低于36000元的比率。180名畢業(yè)生的抽樣調(diào)查結(jié)果顯示,有20名畢業(yè)生開(kāi)始工作時(shí)的年薪不低于36000元,其中會(huì)計(jì)專業(yè)4名,金融專業(yè)2名,信息系統(tǒng)專業(yè)7名,市場(chǎng)營(yíng)銷專業(yè)1名,經(jīng)營(yíng)管理專業(yè)6名。

7.5.2總體比率85 7.5.2總體比率28 根據(jù)總體比率的近似95%的置信區(qū)間的公式,開(kāi)始工作時(shí)的年薪不低于36000元的比率的點(diǎn)估計(jì)為:

故畢業(yè)生開(kāi)始時(shí)的年薪不低于36000元的比率近似95%置信區(qū)間為(0.0575,0.1387)7.5.2總體比率86 根據(jù)總體比率的近似95%的置信區(qū)間的公式,開(kāi)始工作時(shí)的年

對(duì)分層簡(jiǎn)單隨機(jī)抽樣,我們可用兩階段過(guò)程來(lái)選擇樣本容量。

既然人們想估計(jì)各層的均值、總量及比率,這兩種組合方法都經(jīng)常使用。確定總樣本容量n決定各層應(yīng)分配的樣本單位數(shù)決定每層應(yīng)選擇的樣本單位數(shù)加總得到總樣本容量

或者7.5.3樣本容量的確定87 對(duì)分層簡(jiǎn)單隨機(jī)抽樣,我們可用兩階段過(guò)程來(lái)選擇樣本容量。

確定總樣本容量n及其分配,可對(duì)所有要研究的總體參數(shù)提供必要的精度。

分配工作就是決定總樣本被分配到各層的部分,這些部分將確定各層的簡(jiǎn)單隨機(jī)樣本的容量。

各層的單位數(shù)各層內(nèi)的方差考慮的因素各層選擇單位的費(fèi)用

7.5.3樣本容量的確定88 確定總樣本容量n及其分配,可對(duì)所有要研究的總體參數(shù)提供必 一般地,單位數(shù)較多的層和方差較大的層應(yīng)分配較多的樣本數(shù)目。 相反地,對(duì)于給定的費(fèi)用,為了獲得更多的信息,則抽樣單位成本較大的層應(yīng)分配較少的樣本數(shù)目。7.5.3樣本容量的確定897.5.3樣本容量的確定32整群抽樣需要將總體各個(gè)個(gè)體分為N組(也稱作群),使總體中每個(gè)個(gè)體只屬于一群??傮w組1組2個(gè)體4個(gè)體5個(gè)體1個(gè)體6個(gè)體2個(gè)體37.6整群抽樣90整群抽樣需要將總體各個(gè)個(gè)體分為N組(也稱作群),使總體中例如,我們想調(diào)查某省的登記選民。則有兩種方法:調(diào)查某省的登記選民。有兩種方法:第一種方法是建立包含該省所有登記選民的抽樣框,然后根據(jù)抽樣框,選擇選民的一個(gè)簡(jiǎn)單隨機(jī)樣本。第二種方法是整群抽樣,我們選擇用該省各縣的清單作抽樣框。在這個(gè)方法中,每個(gè)縣(或群)包含一組登記選民,而該省的每個(gè)登記選民只屬于一群。7.6整群抽樣91例如,我們想調(diào)查某省的登記選民。則有兩種方法:調(diào)查某省的分層抽樣和整群抽樣都將總體劃分為組,因此這兩種抽樣過(guò)程感覺(jué)上是相似的。選擇整群抽樣與分層抽樣的原因是不同的。當(dāng)群內(nèi)的個(gè)體存在差異時(shí),整群抽樣可提供較好的結(jié)果。理想情形是每一群是整個(gè)總體的一個(gè)縮影,這時(shí),抽取很少的群就可以提供關(guān)于整個(gè)總體特征的信息。整群抽樣與分層抽樣的比較7.6整群抽樣92分層抽樣和整群抽樣都將總體劃分為組,因此這兩種抽樣過(guò)程感覺(jué)上整群抽樣的優(yōu)缺點(diǎn)

整群抽樣的優(yōu)點(diǎn)是實(shí)施方便、節(jié)省經(jīng)費(fèi);整群抽樣的缺點(diǎn)是往往由于不同群之間的差異較大,由此而引起的抽樣誤差往往大于簡(jiǎn)單隨機(jī)抽樣。整群抽樣與分層抽樣的匹別

整群抽樣與分層抽樣在形式上有相似之處,但實(shí)際上差別很大。分層抽樣要求各層之間的差異很大,層內(nèi)個(gè)體或單元差異小,而整群抽樣要求群與群之間的差異比較小,群內(nèi)個(gè)體或單元差異大93整群抽樣的優(yōu)缺點(diǎn)36[例7.6]某省擁有12000名執(zhí)業(yè)注冊(cè)會(huì)計(jì)師的注冊(cè)會(huì)計(jì)師協(xié)會(huì)進(jìn)行了一項(xiàng)調(diào)查。作為調(diào)查的一部分,注冊(cè)會(huì)計(jì)師協(xié)會(huì)收集與收入、性別和與注冊(cè)會(huì)計(jì)師生活方式有關(guān)的因素的信息。因?yàn)橛脗€(gè)人采訪法去搜集所需要的信息,因此注冊(cè)會(huì)計(jì)師協(xié)會(huì)采用整群抽樣,以使總的差旅費(fèi)和采訪費(fèi)用達(dá)到最小。抽樣框中包含所有在該省登記注冊(cè)的執(zhí)業(yè)會(huì)計(jì)師事務(wù)所。7.6整群抽樣94[例7.6]7.6整群抽樣37假設(shè)有1000群,即在該省登記注冊(cè)的從事會(huì)計(jì)活動(dòng)的會(huì)計(jì)師事務(wù)所有1000個(gè),選擇10個(gè)會(huì)計(jì)師事務(wù)所為一個(gè)簡(jiǎn)單隨機(jī)樣本。[例7.6](續(xù))7.6整群抽樣95假設(shè)有1000群,即在該省登記注冊(cè)的從事會(huì)計(jì)活動(dòng)的會(huì)計(jì)師為了介紹在整群抽樣中,構(gòu)造總體均值、總體總量和總體比率的近似95%置信區(qū)間需要的公式,我們使用如下的記號(hào):N—總體的群數(shù);n—樣本中選出的群數(shù);Mi—i群的單位數(shù);M—總體單位數(shù);M=M1+M2+…十MN;—每一群的平均單位數(shù)。Xi——第i群所有觀察值的總量;ai——第i群具有某特征的觀察值的數(shù)量;7.6整群抽樣96為了介紹在整群抽樣中,構(gòu)造總體均值、總體總量和總體比對(duì)注冊(cè)會(huì)計(jì)師協(xié)會(huì)的抽樣調(diào)查,我們有如下資料:N=1000n=10M=12000

下表7-4為每個(gè)中選群的Mi和xi的值,以及中選事務(wù)所中女注冊(cè)會(huì)計(jì)師的數(shù)量(ai)的資料。[例7.6](續(xù))7.6整群抽樣97對(duì)注冊(cè)會(huì)計(jì)師協(xié)會(huì)的抽樣調(diào)查,我們有如下資料:N=10007.6整群抽樣987.6整群抽樣41由整群抽樣得到的總體均值的點(diǎn)估計(jì)的公式如下:(7-25)7.6.1總體均值99由整群抽樣得到的總體均值的點(diǎn)估計(jì)的公式如下:(7-該點(diǎn)估計(jì)量的標(biāo)準(zhǔn)差的估計(jì)為:(7-26)總體均值的近似95%的置信區(qū)間為:7.6.1總體均值100該點(diǎn)估計(jì)量的標(biāo)準(zhǔn)差的估計(jì)為:(7-26)總體均值的根據(jù)表7-4的資料,我們可以得到執(zhí)業(yè)注冊(cè)會(huì)計(jì)師平均年薪的點(diǎn)估計(jì)為[例7.6](續(xù))7.6.1總體均值101根據(jù)表7-4的資料,我們可以得到執(zhí)業(yè)注冊(cè)會(huì)計(jì)師平均年由于表7-4中的年薪資料是以千元計(jì)量的,因此,執(zhí)業(yè)注冊(cè)會(huì)計(jì)師的平均年薪的估計(jì)值為42531元。而:因此:[例7.6](續(xù))7.6.1總體均值102由于表7-4中的年薪資料是以千元計(jì)量的,因此,執(zhí)業(yè)注因此標(biāo)準(zhǔn)差為1.730。我們得到平均年薪的近似95%置信區(qū)間:即(39.071,45.991)。[例7.6](續(xù))7.6.1總體均值103因此標(biāo)準(zhǔn)差為1.730。我們得到平均年薪的近似95%整群抽樣的總體比率

溫馨提示

  • 1. 本站所有資源如無(wú)特殊說(shuō)明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請(qǐng)下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請(qǐng)聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁(yè)內(nèi)容里面會(huì)有圖紙預(yù)覽,若沒(méi)有圖紙預(yù)覽就沒(méi)有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫(kù)網(wǎng)僅提供信息存儲(chǔ)空間,僅對(duì)用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對(duì)用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對(duì)任何下載內(nèi)容負(fù)責(zé)。
  • 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請(qǐng)與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶因使用這些下載資源對(duì)自己和他人造成任何形式的傷害或損失。

最新文檔

評(píng)論

0/150

提交評(píng)論