抽樣調(diào)查課件_第1頁(yè)
抽樣調(diào)查課件_第2頁(yè)
抽樣調(diào)查課件_第3頁(yè)
抽樣調(diào)查課件_第4頁(yè)
抽樣調(diào)查課件_第5頁(yè)
已閱讀5頁(yè),還剩46頁(yè)未讀, 繼續(xù)免費(fèi)閱讀

下載本文檔

版權(quán)說(shuō)明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請(qǐng)進(jìn)行舉報(bào)或認(rèn)領(lǐng)

文檔簡(jiǎn)介

抽樣調(diào)查課件1第一頁(yè),共五十一頁(yè),2022年,8月28日本章主要內(nèi)容2.1概述2.2簡(jiǎn)單估計(jì)量及其性質(zhì)2.3比率估計(jì)量及其性質(zhì)2.4回歸估計(jì)量及其性質(zhì)2.5簡(jiǎn)單隨機(jī)抽樣的實(shí)施第二頁(yè),共五十一頁(yè),2022年,8月28日2.1概述2.1.1隨機(jī)抽樣的幾點(diǎn)約定2.1.2簡(jiǎn)單隨機(jī)抽樣的意義和原則2.1.3簡(jiǎn)單隨機(jī)抽樣的定義2.1.4簡(jiǎn)單隨機(jī)抽樣的符號(hào)2.1.5對(duì)總體特征估計(jì)的思路和方法2.1.6簡(jiǎn)單估計(jì)的主要參數(shù)和統(tǒng)計(jì)量第三頁(yè),共五十一頁(yè),2022年,8月28日2.1.1隨機(jī)抽樣的幾點(diǎn)約定隨機(jī)抽樣具體分為4種情形:放回有序放回?zé)o序不放回有序不放回?zé)o序本書的內(nèi)容是圍繞不放回簡(jiǎn)單隨機(jī)抽樣展開(kāi)的。所有可能樣本數(shù)最多,但理論結(jié)果最簡(jiǎn)單。所有可能樣本數(shù)最少,實(shí)際操作最簡(jiǎn)單。除非特別說(shuō)明,簡(jiǎn)單隨機(jī)抽樣是指不放回簡(jiǎn)單隨機(jī)抽樣(Simplerandomsamplingwithoutreplacement記為SRSWOR)。第四頁(yè),共五十一頁(yè),2022年,8月28日放回簡(jiǎn)單隨機(jī)抽樣(SRSwithreplacement)放回簡(jiǎn)單隨機(jī)抽樣在每次抽取樣本單元時(shí),都將前一次抽取的樣本單元放回總體,因此,總體的結(jié)構(gòu)不變,抽樣是相互獨(dú)立進(jìn)行的,這一點(diǎn)是它與不放回簡(jiǎn)單隨機(jī)抽樣的主要不同之處。放回簡(jiǎn)單隨機(jī)抽樣的樣本量不受總體大小的限制,可以是任意的。第五頁(yè),共五十一頁(yè),2022年,8月28日【例2.1】設(shè)總體有5個(gè)單元(1、2、3、4、5),按放回簡(jiǎn)單隨機(jī)抽樣的方式抽取2個(gè)單元,則所有可能的樣本為25個(gè)(考慮樣本單元的順序):1,12,13,14,15,11,22,23,24,25,21,32,33,34,35,31,42,43,44,45,41,52,53,54,55,5第六頁(yè),共五十一頁(yè),2022年,8月28日不放回簡(jiǎn)單隨機(jī)抽樣(SRSwithoutreplacement)當(dāng)從總體N個(gè)抽樣單元中依次抽取n個(gè)抽樣單元時(shí),每個(gè)被抽中的單元不再放回總體,而是從總體剩下的單元中進(jìn)行抽樣。不放回簡(jiǎn)單隨機(jī)抽樣的樣本量要受總體大小的限制。在實(shí)際工作中,更多的采用不放回簡(jiǎn)單隨機(jī)抽樣。第七頁(yè),共五十一頁(yè),2022年,8月28日

【例2.2】設(shè)總體有5個(gè)單元(1、2、3、4、5),按不放回(無(wú)序)簡(jiǎn)單隨機(jī)抽樣的方式抽取2個(gè)單元,則所有可能的樣本為10個(gè):1,22,33,44,51,32,43,5

1,42,5

1,5

第八頁(yè),共五十一頁(yè),2022年,8月28日除非特別說(shuō)明,本書此后所討論的總體是:(1)具體總體;(2)有限總體;(3)與抽樣框存在一一對(duì)應(yīng)的實(shí)查總體,或被稱為抽樣總體的抽樣框本身。本書所討論的單元總是指構(gòu)成抽樣總體的抽樣單元(或稱樣品、樣本點(diǎn)),抽樣單元并不總是等同于個(gè)體,有時(shí)抽樣單元甚至可能包含幾個(gè)或很多個(gè)個(gè)體,這意味著個(gè)體是最小的不可再分的單元。在簡(jiǎn)單隨機(jī)抽樣中,每個(gè)抽樣單元就是個(gè)體。第九頁(yè),共五十一頁(yè),2022年,8月28日設(shè)抽樣總體由N個(gè)抽樣單元組成,N是一個(gè)已知的正整數(shù),表示總體規(guī)模;設(shè)n是樣本容量,它是一個(gè)不大于N、不小于1的正整數(shù)(1≤n≤N,但通常情況下是1<n<N),表示樣本中所包含的單元數(shù),簡(jiǎn)稱樣本量或樣品數(shù),表示樣本規(guī)模。從N個(gè)單元里抽取n個(gè)單元進(jìn)行調(diào)查,并根據(jù)調(diào)查結(jié)果得到的統(tǒng)計(jì)量去估計(jì)總體的數(shù)量特征,就是抽樣調(diào)查。樣本容量相對(duì)于總體規(guī)模的比例記為f;通常情況下,0<f<1。稱為抽樣比,第十頁(yè),共五十一頁(yè),2022年,8月28日2.1.2簡(jiǎn)單隨機(jī)抽樣的意義和原則簡(jiǎn)單隨機(jī)抽樣的意義:簡(jiǎn)單隨機(jī)抽樣是直接用樣本均值估計(jì)總體均值,待估參數(shù)與用于估計(jì)的統(tǒng)計(jì)量?jī)烧摺巴瓮瑯?gòu)”,通常視為簡(jiǎn)單估計(jì)。簡(jiǎn)單隨機(jī)抽樣也稱為純隨機(jī)抽樣,是直接從總體中(而不是層之類的子總體)抽取個(gè)體(而不是群之類的大單元),是最基本的抽樣方法,從理論上講最符合隨機(jī)原則,是其他各種抽樣方法的基礎(chǔ)和核心內(nèi)容。簡(jiǎn)單隨機(jī)抽樣操作簡(jiǎn)單,應(yīng)用廣泛。第十一頁(yè),共五十一頁(yè),2022年,8月28日簡(jiǎn)單隨機(jī)抽樣的缺點(diǎn):N很大時(shí)難以獲得抽樣框樣本分散不易實(shí)施,調(diào)查費(fèi)用高總體內(nèi)部個(gè)體之間變量值差異懸殊時(shí)誤差會(huì)增大簡(jiǎn)單隨機(jī)抽樣的適用場(chǎng)合:N不很大的均勻總體很少單獨(dú)使用,一般結(jié)合其他方法使用沒(méi)有其他信息時(shí)使用多變量復(fù)雜數(shù)據(jù)分析第十二頁(yè),共五十一頁(yè),2022年,8月28日簡(jiǎn)單隨機(jī)抽樣的抽取原則:(1)按隨機(jī)原則取樣,排除任何主觀因素的影響,防止出現(xiàn)系統(tǒng)誤差;(2)每個(gè)抽樣單元被抽中的概率都是已知的或事先確定的;(3)每個(gè)抽樣單元被抽中的概率都是相等的,即簡(jiǎn)單隨機(jī)抽樣屬于等概率抽樣。每個(gè)單元被抽中的概率相同所有可能樣本每個(gè)樣本被抽中的概率相同第十三頁(yè),共五十一頁(yè),2022年,8月28日定義2.1從總體的N個(gè)單元中,一次整批抽取n個(gè)單元,使得任何一個(gè)單元被抽中的概率都相等,任何n個(gè)不同單元組成的組合被抽中的概率也都相等,這種抽樣稱為簡(jiǎn)單隨機(jī)抽樣。定義2.2從總體的N個(gè)單元中,逐個(gè)不放回地抽取單元,每次抽取到尚未入樣的任何一個(gè)單元的概率都相等,直到抽足n個(gè)單元為止,這樣所得的n個(gè)單元組成一個(gè)簡(jiǎn)單隨機(jī)樣本,這種抽樣方法就是簡(jiǎn)單隨機(jī)抽樣。2.1.3簡(jiǎn)單隨機(jī)抽樣的定義第十四頁(yè),共五十一頁(yè),2022年,8月28日定義2.3從總體的N

個(gè)單元中抽取n個(gè)單元的所有可能不同的組合構(gòu)造所有可能的個(gè)樣本,從有限事實(shí)上,當(dāng)N和n都較大時(shí),依照定義2.3進(jìn)行抽樣是很不方便的,因?yàn)榇藭r(shí)個(gè)樣本隨機(jī)抽取1個(gè)樣本,使每個(gè)樣本被抽中的概率都等于,這種抽樣稱為簡(jiǎn)單隨機(jī)抽樣。很大,要列出全部可能的樣本是不現(xiàn)實(shí)的。(例如,N=10000,n=400的抽樣只能算是中等規(guī)模的抽樣,但所有可能的樣本有3.29×101438多個(gè),已屬天文數(shù)字。)實(shí)際中,簡(jiǎn)單隨機(jī)抽樣是按照定義2.1和2.2設(shè)計(jì)的。第十五頁(yè),共五十一頁(yè),2022年,8月28日2.1.4簡(jiǎn)單隨機(jī)抽樣中的符號(hào)大寫符號(hào)表示總體的有關(guān)變量用小寫符號(hào)表示樣本的有關(guān)變量

第十六頁(yè),共五十一頁(yè),2022年,8月28日總體樣本

第十七頁(yè),共五十一頁(yè),2022年,8月28日總體指標(biāo)值上面帶符號(hào)“^”的表示由樣本得到的總體指標(biāo)的估計(jì)。估計(jì)量的方差用大寫的V表示,對(duì)的樣本估計(jì),不用而用表示。第十八頁(yè),共五十一頁(yè),2022年,8月28日2.1.5對(duì)總體特征估計(jì)的思路和方法兩種思路和方法:直接估計(jì):不借助任何輔助變量,僅僅通過(guò)變量的樣本觀察值對(duì)其總體特征進(jìn)行直接估計(jì),即樣本特征的線性組合表示總體特征,故統(tǒng)稱線性估計(jì)。間接估計(jì):借助相關(guān)輔助變量,對(duì)我們所感興趣的變量的總體特征進(jìn)行間接估計(jì),用樣本特征的非線性組合表示總體特征,故統(tǒng)稱為非線性估計(jì)。對(duì)簡(jiǎn)單隨機(jī)抽樣進(jìn)行直接估計(jì),稱為簡(jiǎn)單線性估計(jì),簡(jiǎn)稱簡(jiǎn)單估計(jì)。第十九頁(yè),共五十一頁(yè),2022年,8月28日2.1.6簡(jiǎn)單估計(jì)的主要參數(shù)和統(tǒng)計(jì)量(1)均值估計(jì):(2)總值估計(jì):(3)比例估計(jì):(4)比率估計(jì):第二十頁(yè),共五十一頁(yè),2022年,8月28日2.2簡(jiǎn)單估計(jì)量及其性質(zhì)2.2.1對(duì)總體均值的簡(jiǎn)單估計(jì)2.2.3對(duì)總體總量的簡(jiǎn)單估計(jì)2.2.2對(duì)總體比例的簡(jiǎn)單估計(jì)第二十一頁(yè),共五十一頁(yè),2022年,8月28日2.2.1對(duì)總體均值的估計(jì)一、簡(jiǎn)單估計(jì)及其無(wú)偏性在沒(méi)有其它信息的條件下,對(duì)總體均值的簡(jiǎn)單估計(jì)為:抽樣理論證明樣本平均數(shù)是總體均值的有效、無(wú)偏估計(jì)量??梢宰C明:教科書p32-34。第二十二頁(yè),共五十一頁(yè),2022年,8月28日二、簡(jiǎn)單估計(jì)量的方差數(shù)理統(tǒng)計(jì)中定義有限總體的方差為:抽樣理論中所使用的方差為:第二十三頁(yè),共五十一頁(yè),2022年,8月28日簡(jiǎn)單隨機(jī)抽樣中的方差所有的統(tǒng)計(jì)量都是隨機(jī)變量,可能的樣本有很多個(gè),樣本不同,統(tǒng)計(jì)量就不同,但總體參數(shù)是唯一的確定的。由于樣本出現(xiàn)的偶然性,樣本均值與總體均值之間必然有誤差,的方差即是所有可能的樣本均值與總體均值的誤差的方差。是一個(gè)表達(dá)抽樣誤差的確定型變量,是抽樣精度的理論表達(dá)。第二十四頁(yè),共五十一頁(yè),2022年,8月28日說(shuō)明:在不考慮1-f的情況下,估計(jì)量的方差與樣本容量n成反比;當(dāng)其他條件不變時(shí),估計(jì)量的方差與總體未入樣率(1-f)成正比。

樣本均值的方差與總體方差成正比。第二十五頁(yè),共五十一頁(yè),2022年,8月28日三、估計(jì)量的方差估計(jì)用s2代替S2第二十六頁(yè),共五十一頁(yè),2022年,8月28日

四、總體均值估計(jì)的置信區(qū)間1-a稱為置信水平或置信度,在1-a的置信度下,總體均值,落在近似置信區(qū)間:置信度與置信區(qū)間共同反映抽樣調(diào)查的信度,其含義是總體均值落在上述置信區(qū)間的概率不低于1-a。第二十七頁(yè),共五十一頁(yè),2022年,8月28日置信度1-a

與概率度,兩者是一一對(duì)應(yīng)的正比例關(guān)系。兩者常用的數(shù)值主要有(可查正態(tài)分布概率表):令

1-a

=68.27%t=11-a

=95%t=1.961-a

=95.45%t=21-a

=99.73%t=3第二十八頁(yè),共五十一頁(yè),2022年,8月28日1)計(jì)算樣本均值2)計(jì)算樣本方差3)計(jì)算樣本均值的方差4)給定置信度1-a

五、總體均值估計(jì)的步驟5)計(jì)算置信區(qū)間第二十九頁(yè),共五十一頁(yè),2022年,8月28日【例2.3】某學(xué)院有100名學(xué)生,我們從中隨機(jī)抽出10名學(xué)生調(diào)查他們每天學(xué)習(xí)英語(yǔ)的時(shí)間(小時(shí)),調(diào)查資料如下表,根據(jù)對(duì)這10名學(xué)生的調(diào)查結(jié)果,在95%的置信度下估計(jì)全學(xué)院學(xué)生每天學(xué)習(xí)英語(yǔ)的平均時(shí)間。序號(hào)1234567891045204661508第三十頁(yè),共五十一頁(yè),2022年,8月28日解:第三十一頁(yè),共五十一頁(yè),2022年,8月28日

因此,可以以95%的概率保證程度估計(jì)全學(xué)院100名學(xué)生平均每天學(xué)習(xí)英語(yǔ)的時(shí)間:即:以95%的概率保證程度,估計(jì)全學(xué)院100名學(xué)生平均每天學(xué)習(xí)英語(yǔ)的時(shí)間在2.43~7.57小時(shí)之間。當(dāng)置信度為95%時(shí),對(duì)應(yīng)的概率度第三十二頁(yè),共五十一頁(yè),2022年,8月28日思考題為調(diào)查某地區(qū)1960個(gè)村新棉收購(gòu)情況,以簡(jiǎn)單不重復(fù)抽樣方式隨機(jī)抽取49個(gè)村進(jìn)行調(diào)查,求得樣本均值為7000公斤,樣本方差為180公斤。試以99.73%的可靠程度估計(jì)該地區(qū)平均每村收購(gòu)棉花多少公斤?第三十三頁(yè),共五十一頁(yè),2022年,8月28日已知:解:當(dāng)置信度為99.73%時(shí),對(duì)應(yīng)的概率度以99.73%的可靠程度估計(jì)該地區(qū)平均每村收購(gòu)棉花在6994.33~7005.67公斤之間。第三十四頁(yè),共五十一頁(yè),2022年,8月28日2.2.2對(duì)總體比例的估計(jì)一、對(duì)總體的描述總體按所研究標(biāo)志不同變量總體(研究數(shù)量標(biāo)志)屬性總體(研究品質(zhì)標(biāo)志)在屬性總體中,當(dāng)所研究的標(biāo)志,其表現(xiàn)只有兩種屬性,即“是”或“非”時(shí),將該屬性總體稱為是非標(biāo)志總體。例如:產(chǎn)品按質(zhì)量分組合格品不合格品(是)(非)學(xué)生按成績(jī)分組及格不及格(非)(是)注意:“是”與“非”是根據(jù)研究目的確定的,研究的標(biāo)志是“是”。第三十五頁(yè),共五十一頁(yè),2022年,8月28日1、成數(shù)

在是非標(biāo)志總體中,設(shè)總體有N個(gè)單位,其中,有A個(gè)單位具有某種性質(zhì)或?qū)傩裕ā笆恰钡膶傩裕?,有B個(gè)單位不具有某種性質(zhì)或?qū)傩裕ā胺恰钡膶傩裕?,而A+B=N

則有:即總體中具有研究標(biāo)志的單位數(shù)在總體中所占的比重即總體中不具有研究標(biāo)志的單位數(shù)在總體中所占的比重第三十六頁(yè),共五十一頁(yè),2022年,8月28日2、總體比例(是非標(biāo)志的均值)由于是非標(biāo)志的表現(xiàn)不能用數(shù)值表示,為了研究問(wèn)題方便,我們可以將是非標(biāo)志數(shù)量化。即用1表示單位標(biāo)志為“是”的標(biāo)志值(即具有研究標(biāo)志的單位的標(biāo)志值);用0表示單位標(biāo)志為“非”的標(biāo)志值(即不具有研究標(biāo)志的單位的標(biāo)志值)。產(chǎn)品標(biāo)志值

Yi

單位數(shù)

Ni合格(是)不合格(非)10

AB

合計(jì)

N第三十七頁(yè),共五十一頁(yè),2022年,8月28日

所以,總體比例為:總體比例的方差:第三十八頁(yè),共五十一頁(yè),2022年,8月28日二、估計(jì)量及其性質(zhì)估計(jì)量p的方差:(所有可能的樣本比例與總體比例的誤差的方差)樣本比例:樣本比例的方差:第三十九頁(yè),共五十一頁(yè),2022年,8月28日

三、總體比例估計(jì)的置信區(qū)間在1-a的置信度下,總體比例P落在近似置信區(qū)間:第四十頁(yè),共五十一頁(yè),2022年,8月28日1)計(jì)算樣本比例

2)計(jì)算樣本均值的方差3)給定置信度1-a

四、總體比例估計(jì)的步驟4)計(jì)算置信區(qū)間第四十一頁(yè),共五十一頁(yè),2022年,8月28日

例,某高校有10000名在校生,現(xiàn)隨機(jī)從中抽取400名,結(jié)果有320名學(xué)生近視,在置信水平95.45%的條件下,試估計(jì)該高校全體在校生近視率的置信區(qū)間。解:第四十二頁(yè),共五十一頁(yè),2022年,8月28日置信水平95.45%時(shí),概率度第四十三頁(yè),共五十一頁(yè),2022年,8月28日即:以95.45%的概率保證程度估計(jì)該校在校學(xué)生近視率在76.08%~83.92%之間。該高校全體在校生近視率的置信區(qū)間為:P{76.08%≤P≤83.92%}=95.45%第四十四頁(yè),共五十一頁(yè),2022年,8月28日

【例2.5】

某超市新開(kāi)張一段時(shí)間之后,為改進(jìn)銷售服務(wù)環(huán)境,欲調(diào)查附近幾個(gè)小區(qū)居民到該超市購(gòu)物的滿意度,該超市與附近幾個(gè)小區(qū)的居委會(huì)取得聯(lián)系,在總體中按簡(jiǎn)單隨機(jī)抽樣

溫馨提示

  • 1. 本站所有資源如無(wú)特殊說(shuō)明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請(qǐng)下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請(qǐng)聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁(yè)內(nèi)容里面會(huì)有圖紙預(yù)覽,若沒(méi)有圖紙預(yù)覽就沒(méi)有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫(kù)網(wǎng)僅提供信息存儲(chǔ)空間,僅對(duì)用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對(duì)用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對(duì)任何下載內(nèi)容負(fù)責(zé)。
  • 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請(qǐng)與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶因使用這些下載資源對(duì)自己和他人造成任何形式的傷害或損失。

評(píng)論

0/150

提交評(píng)論