第七章抽樣調(diào)查_(kāi)第1頁(yè)
第七章抽樣調(diào)查_(kāi)第2頁(yè)
第七章抽樣調(diào)查_(kāi)第3頁(yè)
第七章抽樣調(diào)查_(kāi)第4頁(yè)
第七章抽樣調(diào)查_(kāi)第5頁(yè)
已閱讀5頁(yè),還剩83頁(yè)未讀 繼續(xù)免費(fèi)閱讀

下載本文檔

版權(quán)說(shuō)明:本文檔由用戶(hù)提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請(qǐng)進(jìn)行舉報(bào)或認(rèn)領(lǐng)

文檔簡(jiǎn)介

1、第七章 抽樣調(diào)查第一節(jié) 抽樣調(diào)查的一般問(wèn)題第二節(jié) 抽樣誤差(樣本分布)第三節(jié) 總體指標(biāo)的推算第四節(jié) 必要抽樣數(shù)目的確定第五節(jié) 總體參數(shù)假設(shè)檢驗(yàn) 第七章 抽樣調(diào)查 第一節(jié) 抽樣調(diào)查的一般問(wèn)題 一、抽樣調(diào)查的概念和作用 (一)抽樣調(diào)查的概念 抽樣調(diào)查是指從所要研究的總體中,按照隨機(jī)原則,抽取部分單位進(jìn)行調(diào)查,并將調(diào)查整理得出的數(shù)量特征,用以推斷總體綜合數(shù)量特征的一種調(diào)查組織形式。 抽樣調(diào)查 全及總體按隨機(jī)原則抽取調(diào)查單位(樣本)根據(jù)樣本調(diào)查的結(jié)果(樣本指標(biāo))推算總體參數(shù)例如,要了解某燈泡廠生產(chǎn)的某種規(guī)格燈泡的質(zhì)量情況,不能用全面調(diào)查,只能用抽樣調(diào)查方式進(jìn)行。如從1萬(wàn)只燈泡中抽1%即100只進(jìn)行實(shí)際

2、檢驗(yàn)現(xiàn)察,然后以這100只燈泡的平均耐用時(shí)間或合格率來(lái)推斷1萬(wàn)只燈泡的平均耐用時(shí)間或合格率。這種產(chǎn)品質(zhì)量的抽樣檢查。就是抽樣調(diào)查的一個(gè)例子。(二)抽樣調(diào)查的特點(diǎn) 抽樣調(diào)查是一種非全面調(diào)查,它有以下兩個(gè)主要特點(diǎn): 1按隨機(jī)原則抽取調(diào)查單位。所謂隨機(jī)原則,就是排除人的主觀有意識(shí)地選擇,使被研究總體中的每一個(gè)單位,都有被抽取的同等機(jī)會(huì),被抽中或不被抽中完全是出于偶然的機(jī)遇這就區(qū)別于重點(diǎn)調(diào)查(必須選取重點(diǎn)單位),也區(qū)別于典型調(diào)查(是對(duì)總體作粗略全面分析的基礎(chǔ)上,有意識(shí)地從中選擇典型單位)。之所以要按隨機(jī)原則抽取,是因?yàn)橹挥羞@樣,所抽得樣本單位的分布才可能接近總體單位的分布,具有較大的代表性,抽樣調(diào)查是

3、一種非全面調(diào)查。 2、根據(jù)部分推斷全體。抽樣調(diào)查雖然僅是直接調(diào)查被抽取的那一部分單位,但其目的是著跟于研究總體的如上例,實(shí)際檢驗(yàn)(調(diào)查)是100只燈泡的質(zhì)量,但著眼于研究那1萬(wàn)只燈泡的質(zhì)量,即通過(guò)對(duì)那一部分單位的觀察值,運(yùn)用數(shù)理統(tǒng)計(jì)的原理,對(duì)所研究總體作出數(shù)量上的推斷,達(dá)到對(duì)總體數(shù)量特征認(rèn)識(shí)的目的。 (三)抽樣調(diào)查的作用由于抽樣調(diào)查只實(shí)際觀察總體的一部分單位,所以抽樣調(diào)查有以下作用: 1、與全面調(diào)查相比,抽樣調(diào)查既能節(jié)省人力、物力和財(cái)力,又能在較短期限內(nèi)提出所需的資料。例如,糧食作物已經(jīng)成熟,但還未收割,為掌握當(dāng)年糧食產(chǎn)量,安排收購(gòu)計(jì)劃及其他有關(guān)工作,需作農(nóng)產(chǎn)量抽樣調(diào)查取得資料椎斷。 2對(duì)不可

4、能或不必要進(jìn)行全面調(diào)查的現(xiàn)象,要采用抽樣調(diào)查方法。比如對(duì)具有破壞性的工業(yè)產(chǎn)品質(zhì)量檢驗(yàn),諸如,對(duì)燈泡、食品罐頭,電池、輪胎等進(jìn)行質(zhì)量檢驗(yàn),都具有破壞性的,均不能作全面檢驗(yàn)。要了解我國(guó)城鄉(xiāng)居民家庭收支或生活的一般水平,不必搞全面調(diào)查,適合采用抽樣調(diào)查來(lái)推斷。3利用抽樣調(diào)查資料,可檢驗(yàn)全面調(diào)查資料的質(zhì)量和修正全面統(tǒng)計(jì)的資料。如人口普查的同時(shí)又搞人口抽樣調(diào)查,以驗(yàn)證普查資料的質(zhì)量。普查涉及面廣,參加調(diào)查的人員多,水平不齊,易產(chǎn)生登記性的誤差,抽樣調(diào)查面小,用人也少,可以精選調(diào)查人員或加強(qiáng)培訓(xùn),提高調(diào)查人員的工作質(zhì)量,從面保證調(diào)查資料的準(zhǔn)確性,所以,可以用抽樣資料檢驗(yàn)和修正全面調(diào)查資料。 4對(duì)工業(yè)生產(chǎn)也

5、需要進(jìn)行抽樣調(diào)查,進(jìn)行質(zhì)量控制,實(shí)行科學(xué)管理。 二、抽樣調(diào)查中的幾個(gè)基本概念 在抽樣調(diào)查和推斷的過(guò)程中,涉及到全及總體,抽樣總體、總體指標(biāo)和樣本指標(biāo)等這些名詞,為便于后面學(xué)習(xí),先介紹它們的概念。 (一)全及總體 (二)抽樣總體 (三)總體指標(biāo)(參數(shù)) (四)樣本指標(biāo) (統(tǒng)計(jì)量) (一)全及總體 是指所要研究的那個(gè)對(duì)象的全部單位。比如要研究1萬(wàn)只燈泡的質(zhì)量,這1萬(wàn)只燈泡就叫全及總體,簡(jiǎn)稱(chēng)總體。一般用N代表總體的單位數(shù)目。 (二)抽樣總體(樣本) 是指從所要研究的總體中,按隨機(jī)原則被抽取出來(lái)作實(shí)際調(diào)查的那一部分單位。如上例,從1萬(wàn)只燈泡中抽出來(lái)作實(shí)際檢驗(yàn)的100只燈泡,就叫抽樣總體,簡(jiǎn)稱(chēng)樣本。 全

6、及總體的單位數(shù)以N表示,抽樣總體的單位數(shù)以n表示,于是上例N=10000只,n=l00只 (三)總體指標(biāo)它是指根據(jù)全及總體各單位所計(jì)算得到的綜合指標(biāo),主要指全及總體的平均數(shù)和成數(shù)。如上面所舉1萬(wàn)只燈泡平均每只耐用小時(shí)數(shù)和全都燈泡合格率。(四)樣本指標(biāo) 它是指根據(jù)抽樣總體各單位的調(diào)查資料計(jì)算得到的平均數(shù)和成數(shù)。如根據(jù)上例100只燈泡的檢驗(yàn)資料計(jì)算得到平均每只燈泡耐用小時(shí)數(shù)和它們的合格率。總體平均數(shù)用 表示,樣本平均數(shù)用 表示,總體成數(shù)用P表示,樣本成數(shù)p表示此外,總體標(biāo)準(zhǔn)差用 表示,樣本標(biāo)準(zhǔn)差用s表示。Xx總體指標(biāo)、樣本指標(biāo)fXfXNXX或總體平均指標(biāo)ffXXNXXNNP221)(或)(總體標(biāo)準(zhǔn)

7、差總體成數(shù)fxfxnxx或樣本平均指標(biāo)ffxxsnxxsnnp221)(或)(樣本標(biāo)準(zhǔn)差樣本成數(shù) 三、抽樣調(diào)查的組織方式 抽樣調(diào)查按組織方式不同可分為;純隨機(jī)抽樣、機(jī)械抽樣、類(lèi)型抽樣。整群抽樣和階段抽樣五種,前四種是基本的,這里講前四種。(一)純隨機(jī)抽樣 純隨機(jī)抽樣也叫簡(jiǎn)單隨機(jī)抽樣,它對(duì)總體單位純隨機(jī)抽樣也叫簡(jiǎn)單隨機(jī)抽樣,它對(duì)總體單位不作任何分類(lèi)排隊(duì),而是直接從總體中隨機(jī)抽不作任何分類(lèi)排隊(duì),而是直接從總體中隨機(jī)抽取一部分單位來(lái)組成樣本的抽樣組織方式。抽取一部分單位來(lái)組成樣本的抽樣組織方式。抽樣的數(shù)學(xué)原理是以純隨機(jī)抽樣為基礎(chǔ)闡述的,樣的數(shù)學(xué)原理是以純隨機(jī)抽樣為基礎(chǔ)闡述的,所以,純隨機(jī)抽樣的理淪和

8、方式,是本章闡述所以,純隨機(jī)抽樣的理淪和方式,是本章闡述的主要內(nèi)容。純隨機(jī)抽樣在抽取調(diào)查單位時(shí),的主要內(nèi)容。純隨機(jī)抽樣在抽取調(diào)查單位時(shí),有兩種不同的方法:一種叫重復(fù)抽樣,另一種有兩種不同的方法:一種叫重復(fù)抽樣,另一種叫不重復(fù)抽樣,在這兩種抽樣方法下,又都有叫不重復(fù)抽樣,在這兩種抽樣方法下,又都有不同的具體做法,如抽簽法和隨機(jī)數(shù)字表法等。不同的具體做法,如抽簽法和隨機(jī)數(shù)字表法等。 重復(fù)抽樣和不重抽樣的概念 重復(fù)抽樣:是指從全及總體中,已被抽取的總體單位重復(fù)抽樣:是指從全及總體中,已被抽取的總體單位經(jīng)登記后,可再把它放回總體中,再進(jìn)行下一次的抽經(jīng)登記后,可再把它放回總體中,再進(jìn)行下一次的抽取,因而

9、它有可能再次被抽中,這樣組成的樣本會(huì)出取,因而它有可能再次被抽中,這樣組成的樣本會(huì)出現(xiàn)重復(fù)現(xiàn)象。另外,這種抽法使每個(gè)中選單位的抽中現(xiàn)重復(fù)現(xiàn)象。另外,這種抽法使每個(gè)中選單位的抽中概率都是相同的概率都是相同的tN。舉個(gè)最簡(jiǎn)單的例子;假定總體。舉個(gè)最簡(jiǎn)單的例子;假定總體由五個(gè)職工組成,他們分別為:由五個(gè)職工組成,他們分別為:ABCDE,N=5,確定,確定從中抽兩個(gè)組成樣本,從中抽兩個(gè)組成樣本,n=2用抽簽法,假定第一次用抽簽法,假定第一次抽中抽中A,登記后將它放回和勻,第二次還有可能抽,登記后將它放回和勻,第二次還有可能抽到到A,于是,樣本由,于是,樣本由AA組成當(dāng)然也可能是組成當(dāng)然也可能是BB、C

10、C或可能是或可能是AB、BA,根據(jù)計(jì)算,一切可能,根據(jù)計(jì)算,一切可能的樣本共有的樣本共有N2個(gè),本例個(gè),本例52=25個(gè),但許多都是重復(fù)的。個(gè),但許多都是重復(fù)的。 不重復(fù)抽樣是指已被抽取的總體單位經(jīng)登記后,不再放回總體中參加下一次的抽取,因而,樣本的總體單位就不會(huì)出現(xiàn)重復(fù),而且被抽中單位的中選概率是不同的,就上例論,第一個(gè)的中選概率為15、第二個(gè)則為14。若第一個(gè)抽中A、它不再放回總體中,第二個(gè)只能在四個(gè)中抽一個(gè),假定抽中B,就是AB組成樣本。當(dāng)然,也可能是AC、BA、CA等等根據(jù)計(jì)算一切可能的樣本共有AnN個(gè),本例為A=5X4=20個(gè)雖然在一個(gè)樣本內(nèi)的單位不重復(fù),但這20個(gè)樣本之間是有重復(fù)的

11、,如果再除掉重復(fù)的樣本,就只有 個(gè)不同的組合,在上例就只有 10個(gè)樣本。(個(gè))10214525C25C(二)機(jī)械抽樣 機(jī)械抽樣也叫等距抽樣,它是先將總體單位按某個(gè)標(biāo)志排隊(duì),并以Nn計(jì)算一個(gè)距離,然后,均按此距離在總體中抽取調(diào)查單位的抽樣組織方式。排隊(duì)的標(biāo)志有兩類(lèi):一類(lèi)與調(diào)查項(xiàng)目無(wú)關(guān)的稱(chēng)無(wú)關(guān)標(biāo)志,另一類(lèi)與調(diào)查項(xiàng)目有關(guān)的稱(chēng)有關(guān)標(biāo)志,按這兩類(lèi)標(biāo)志排隊(duì)的抽法不同。 例如,某廠有職工家庭2000戶(hù),即N2000戶(hù),確定從中抽10來(lái)組成樣本,即n=200戶(hù),用機(jī)械抽樣以了解該廠職工家庭的生活水平。 若按無(wú)關(guān)標(biāo)志排隊(duì),可將這2000戶(hù)按戶(hù)主姓名筆劃排隊(duì),并把他們分為200段,每段10戶(hù)(2000200)亦稱(chēng)

12、為抽樣距離,先在第一段的10戶(hù)中按純隨機(jī)抽樣方式抽取1戶(hù),假定抽中第8戶(hù),則以后各段逢8的戶(hù)均為被抽中,就由這200段逢8的戶(hù)組成樣本。 若按有關(guān)標(biāo)志排隊(duì),可按家庭有工資收入的主要成員工資額的高低排隊(duì),然后分為200段,在這樣的情況下有兩種抽法:一種是抽各段處于適中的那一戶(hù)組成樣本,這樣,可能的樣本只有一兩個(gè),另一種是對(duì)稱(chēng)等距抽樣(也是先在第一段按純隨機(jī)抽樣抽一戶(hù),假定抽中第2戶(hù),在第二段與之對(duì)稱(chēng)的是第9戶(hù)或第二段倒數(shù)的第2戶(hù),故凡是單數(shù)段均抽它的第2戶(hù),凡是雙數(shù)段均抽它的第。9戶(hù),這就形成對(duì)稱(chēng)等距抽樣),這樣組成的可能樣本就比較多。 (三)類(lèi)型抽樣 類(lèi)型抽樣是先將總體單位按有關(guān)主要標(biāo)志分組,

13、然后在各組中,采用純隨機(jī)抽樣或機(jī)械抽樣來(lái)抽取調(diào)查單位的抽樣組織方式。類(lèi)型抽樣,通常是在總體被研究標(biāo)志變動(dòng)較大的情況下采用,它實(shí)質(zhì)上是科學(xué)分組法與抽樣原理的結(jié)合運(yùn)用。通過(guò)分組借以縮小各組內(nèi)標(biāo)志變動(dòng)程度。 例如研究某地區(qū)某種糧食作物的情況時(shí),將該種作物播種面積按地勢(shì)類(lèi)型分為,山區(qū)、丘陵和干原,或分為水澆地、旱地等,因?yàn)轭?lèi)型不同、單產(chǎn)差別大,分組后,同在一組內(nèi)務(wù)單位標(biāo)志的變動(dòng)程度大為縮小,固而可使樣本的代表性提高。 (四)整群抽樣 整群抽樣是先將全及總體單位按時(shí)間或空間形式劃分為許多群。然后按隨機(jī)抽樣或機(jī)械抽樣方式,從中抽若干群來(lái)組成樣本。凡被抽中群的總體單位,均一一加以調(diào)查。例如,一批某種水果共有

14、1000筐,每筐就是一群,若確定抽1%的來(lái)檢查,就是抽10筐來(lái)進(jìn)行檢查。 整群抽樣的優(yōu)點(diǎn)是易于組織和較節(jié)省調(diào)查費(fèi)用。缺點(diǎn)是調(diào)查的總體單位過(guò)于集中在少數(shù)樣本群中,因此,在條件相同的悄況下,整群抽樣的樣本代表性較低,通常要用擴(kuò)大樣本群的數(shù)目來(lái)彌補(bǔ)這個(gè)缺點(diǎn)。第二節(jié) 抽樣誤差統(tǒng)計(jì)誤差登記誤差(調(diào)查誤差、工作誤差)是指在調(diào) 查過(guò)程中,由于觀察、測(cè)量、登記、計(jì)算 上 的差錯(cuò)所引起的誤差代表誤差偏差 是指破壞了抽樣的隨機(jī)原則而產(chǎn)生的誤差 (系統(tǒng)誤差) 隨機(jī)誤差 即遵守了隨機(jī)原則,但由于抽到各種不同樣本而產(chǎn)生的誤差(偶然誤差)第二節(jié) 抽樣誤差 產(chǎn)生抽樣誤差的原因很多,但歸納起來(lái)可分為兩類(lèi):一類(lèi)屬登記性誤差。另

15、一類(lèi)屬代表性誤差。即由于樣本對(duì)總體的代表性而造成的誤差,這里也有兩種情況:一種是違犯隨機(jī)原則抽取樣本單位面造成的系統(tǒng)性誤差。另一種則是由于抽樣調(diào)查所抽得樣本單位的構(gòu)成與總體的構(gòu)成極少完全相同,只要有一點(diǎn)點(diǎn)不同,樣本指標(biāo)都不可能等于總體指標(biāo),這種誤差是抽樣調(diào)查本身所固有的,屬于偶然性誤差。但抽樣調(diào)查所固有的偶然性誤差是難以消除的,我們?cè)诖怂v的抽樣誤差,就是專(zhuān)指這種原因造成的誤差。 第二節(jié) 抽樣誤差抽樣誤差有兩種概念:一種是個(gè)別樣本的抽樣誤差:另一種是全部可能樣本的抽樣平均誤差。 一、個(gè)別樣本的抽樣誤差 (一)個(gè)別樣本抽樣誤差的慨念抽樣調(diào)查的目的,是要根據(jù)樣本指標(biāo)去推斷總體指標(biāo),即根據(jù) 、p去推

16、斷 、P; 通常它們是不相等的,這就叫做個(gè)別樣本的抽樣誤差。個(gè)別樣本誤差= 或(p-P)xX)(Xx (二)影響抽樣誤差大小的因素1、抽樣單位數(shù)目(n)的多少在其他條件相同的情況下,抽樣單位數(shù)目愈多,抽樣誤差就意小,反之,就越大。 2總體被研究標(biāo)志變異程度的大小。總體被研究標(biāo)志變異程度大抽樣誤差也大,相反,就小。 3抽樣調(diào)查的組織方式和抽樣方法。在其他條件相同的況下,機(jī)械抽樣和類(lèi)型抽樣的樣本代表性較高,其抽樣誤差就相應(yīng)較小。重復(fù)抽樣和不重復(fù)抽樣方法,也會(huì)影響抽樣誤差的大小,一般來(lái)說(shuō),重復(fù)抽樣的樣本不如不重復(fù)抽樣樣本的代表性高。 二、抽樣平均誤差 (一)抽樣平均誤差的概念 從全及總體N個(gè)單位中,

17、隨機(jī)抽取n個(gè)單位來(lái)組成樣本,在理論上說(shuō),可以有很多個(gè)樣本。每個(gè)樣本都有自己的樣本指標(biāo)( 或p),而總體指標(biāo)( 或P)只有一個(gè),并且是一個(gè)確定的值,只是我們不知道,抽樣調(diào)查的目的正是為了推斷它。各樣本指標(biāo)是隨機(jī)變量,它們與總體指標(biāo)一般都是有誤差的, 若以全部可能樣本指標(biāo)為變量,以總體指標(biāo)為平均數(shù)計(jì)算得到的標(biāo)準(zhǔn)差。即為抽樣平均誤差,用表示 為了區(qū)別, 代表平均數(shù)的抽樣子均誤差, 代表成效的抽樣子均誤差。xXxp (二)抽樣平均誤差的計(jì)算原理 這里所講的就是純隨機(jī)抽樣平均誤差的計(jì)算原理,以 來(lái)說(shuō),其理論計(jì)算式為: 式中,k代表全部可能的樣本數(shù)。x21)(1kiixXxk 為說(shuō)明這個(gè)問(wèn)題以五名職工為例

18、 : 職工名: A B C D E月工資額(元) 900 1060 1140 1220 1400他們的月平均工資,即總體平均數(shù)為: (900+1060+1140+1220+1400)/5=1144.00元若按不重復(fù)抽樣從中隨機(jī)抽2人作樣本,則全部可能不復(fù)的樣本共有10個(gè)如下;AB AC AD AE BC BD BE CD CE DE X序號(hào)樣本12345678910ABACADAEBCBDBECDCEDE (900+1060)/2=980 (900+1140)/2=1020 (900+1220)/2=1060 (900+1400)/2=1150(1060+1140)/2=1100(1060+1

19、220)/2=1140(1060+1400)/2=1230(1140+1220)/2=1180(1140+1400)/2=1270(1220+1400)/2=1310-164-124 -84 6 -44 -4 86 36 126 1662689615376 7056 36 1936 16 7396 1296 15876 27556合計(jì)- 11440-103440 xXx2)(Xx元)(70.1011034410103440)(121kiixXxk 根據(jù)以上公式可的出抽樣平均誤差 的概念: 抽樣平均誤差是指樣本指標(biāo)的標(biāo)準(zhǔn)差。 注意:上述公式只是給出抽樣平均誤差的概念,實(shí)際工作中它并沒(méi)有實(shí)際應(yīng)用價(jià)

20、值。元)(11441011440Xmxx2121)(1)(1kiikiixxxkXxk二、抽樣誤差的計(jì)算公式在重復(fù)抽樣條件下:)(比較大時(shí)則簡(jiǎn)化為當(dāng))()(在不重復(fù)抽樣條件下NnnnNnnNnnxxx11222)()()(NnnPPnPPnPPP1112二、抽樣誤差的計(jì)算公式從理論上講上列計(jì)算公式中所用的方差資料,均應(yīng)為總體的方差,在實(shí)際中該資料是難以取得的,通常用樣本的方差資料代替,如下公式:)(比較大時(shí)則簡(jiǎn)化為當(dāng))()(在不重復(fù)抽樣條件下NnnsnNnnNsnsnsxxx11222)()()(NnnppnppnsPPP1112在重復(fù)抽樣條件下抽樣誤差的計(jì)算的舉例以1萬(wàn)只燈泡的質(zhì)量檢驗(yàn)為例,

21、隨機(jī)抽取100只作實(shí)際檢驗(yàn),所得資料整理如下:耐用小時(shí)(小時(shí))燈泡支數(shù)(只)f組中值(小時(shí))xxf900以下90010001000110011001200120013001300以上3728322010850950105011501250135025506650294003680025000135008352135721792112112321445212505632500472217883872246420445210合計(jì)1001139002)(xxfxx2)( 根據(jù)以上資料可得141791001417900%909 .010010203228113910011390022ffxxspfxf

22、x)(,即(小時(shí))%98. 2298. 099. 01009 . 01000010011009 . 019 . 01185.1109979.1411000010011001417912即)()()()(小時(shí))()(NnnPPNnnsPx第三節(jié) 總體指標(biāo)的推斷 總體指標(biāo)的推斷,是指對(duì)總體平均數(shù) 和總體成數(shù)P推斷估計(jì)的問(wèn)題。搞抽樣調(diào)查的直接目的,主要是為了推算總體,然后,再結(jié)合總體單位數(shù)N去推算總體的有關(guān)標(biāo)志值;總體指標(biāo)的推斷有點(diǎn)估計(jì)和區(qū)間估計(jì)兩種方法。X 一、點(diǎn)估計(jì) 點(diǎn)估計(jì)的方法很簡(jiǎn)單,就是以樣本指標(biāo)(x、p)直接代表總體指標(biāo)(X、P) 。例如,某月某地區(qū)抽選出來(lái)100個(gè)個(gè)體商販,經(jīng)調(diào)查有4戶(hù)偷

23、稅漏稅,平均每戶(hù)偷稅漏稅2100元,就推斷該地區(qū)個(gè)體商販有4的戶(hù)偷稅漏稅,平均每戶(hù)偷稅漏稅2100元。點(diǎn)估計(jì)既沒(méi)有講清它的準(zhǔn)確程度,也無(wú)法表明其可靠程度;它只是一種粗略的估計(jì)或推斷。但是,它又不同于拍腦袋的瞎估亂猜,它是有科學(xué)根據(jù)的。對(duì)那些要求不太高的判斷和分析,此法還是可以采用的。二、區(qū)間估計(jì) (一)區(qū)間估計(jì)的概念 區(qū)間估計(jì)是根據(jù)樣本指標(biāo)和抽樣平均誤差,去推斷總體指標(biāo)的可能范圍。例如,估計(jì)總體指標(biāo)是在樣本指標(biāo)減1個(gè)抽樣平均誤差到樣本指標(biāo)加1個(gè)抽樣平均誤差范圍內(nèi),用式子表示即為: 所以,這種估計(jì)叫區(qū)間估計(jì)。區(qū)間估計(jì)既說(shuō)清估計(jì)結(jié)果的準(zhǔn)確程度,又同時(shí)表明這個(gè)估計(jì)結(jié)果的可靠程度。所以,區(qū)間估計(jì)是比較

24、科學(xué)的。xxxxxXx或簡(jiǎn)寫(xiě)為pppppPp或簡(jiǎn)寫(xiě)為 (二),區(qū)間估計(jì)的理論和方法 總體指標(biāo)是否肯定在樣本指標(biāo)加減1個(gè)抽樣平均誤差的區(qū)間內(nèi)?根據(jù)概率論和數(shù)理統(tǒng)計(jì)的證明,只能說(shuō)有6827在此區(qū)間內(nèi),即有3173不在此區(qū)間內(nèi)。在此不作數(shù)學(xué)證明,只舉例講清它的道理。如前面曾舉那個(gè)燈泡的例子,N10000個(gè),隨機(jī)從中抽100個(gè)來(lái)組成樣本,則全部不重復(fù)的可能樣本共有C。個(gè),如果包括重復(fù)的樣本那就更多。把這全部可能 的樣本平均數(shù)編制一個(gè)變量數(shù)列,然后再將它們圖示出來(lái),就會(huì)得到一個(gè)鐘形的圓滑曲線(xiàn)如下圖:二、區(qū)間估計(jì)符合正態(tài)分布曲線(xiàn)xxxx二、區(qū)間估計(jì)注意以下概念:1、抽樣極限誤差(允許誤差)是指樣本指標(biāo)和總

25、體指標(biāo)之間的誤差的可允許的最大范圍。抽樣極限誤差的實(shí)際意義是希望總體平均指標(biāo) 在樣本指標(biāo) 的范圍內(nèi)pPxXpxPXpxpx2、抽樣誤差的概率度(t)基于需要,抽樣極限誤差需要用抽樣平均誤差為標(biāo)準(zhǔn)來(lái)衡量,即把極限誤差除以抽樣平均誤差表示誤差范圍為抽樣誤差的t倍(理論上就是把正態(tài)分布化成標(biāo)準(zhǔn)正態(tài)分布,變量轉(zhuǎn)換Z)ppxxppxxtttt或或3、抽樣估計(jì)置信度 表明抽樣指標(biāo)和總體指標(biāo)的誤差不超過(guò)一定范圍的概率有多大。數(shù)理統(tǒng)計(jì)已經(jīng)證明,抽樣估計(jì)的概率保證程度和抽樣誤差的概率度(t)是密切相關(guān)的它是t的函數(shù),可表示為F(t)概率度t保證程度(概率)11.96230.68270.95000.95450.9

26、973例:現(xiàn)在對(duì)1萬(wàn)只燈泡的平均耐用小時(shí)進(jìn)行區(qū)間估計(jì)。當(dāng)t=2時(shí):故總體指標(biāo)在這表明那1萬(wàn)只燈泡的平均耐用時(shí)間,是在1115.3小時(shí)至1162.7小時(shí)之間,這個(gè)估計(jì)有95.45%的保證程度。小時(shí))(7 .2385.112xxt7 .11623 .11157 .2311397 .231139XX既第四節(jié) 必要抽樣數(shù)目的確定一、確定必要抽樣數(shù)目的意義 抽樣數(shù)目既樣本的大小的確定樣本過(guò)大不但浪費(fèi)人力、物力和財(cái)禮,而且會(huì)影響資料提供的及時(shí)性:樣本過(guò)小又不能保證資料的精度和可靠性,滿(mǎn)足不了研究問(wèn)題或分析問(wèn)題的需要。二、影響必要抽樣數(shù)目的因素1、總體各單位被研究標(biāo)志方差或標(biāo)準(zhǔn)差2、允許誤差()的大小3、保

27、證程度,即概率度(t)4、抽樣調(diào)查的組織方式三、必要抽樣樹(shù)木的計(jì)算公式1、重復(fù)抽樣的計(jì)算公式2、不重復(fù)抽樣的計(jì)算公式pppxxxpptnnpptttnntt222222)1 ()1 (可得由可得由)1()1(22222222pptNNpptntNNtnpx第五節(jié)總體參數(shù)假設(shè)檢驗(yàn) 假設(shè)檢驗(yàn),就是事先對(duì)總體參數(shù)或總體分布形式作出一個(gè)假設(shè),然后利用樣本信息來(lái)判斷原假設(shè)是否合理,即判斷樣本信息與原假設(shè)是否有顯著差異,從而決定應(yīng)接受或否定原假設(shè)。 所以,假設(shè)檢驗(yàn)也稱(chēng)為顯著性檢驗(yàn) 假設(shè)檢驗(yàn) 假設(shè)檢驗(yàn)可分為兩類(lèi):一是參數(shù)假設(shè)檢驗(yàn),簡(jiǎn)稱(chēng)參數(shù)檢驗(yàn);二是非參數(shù)檢驗(yàn)或自由分布檢驗(yàn),主要有總體分布形式的假設(shè)檢驗(yàn)、隨機(jī)

28、變量獨(dú)立性的假設(shè)檢驗(yàn)等。一、假設(shè)檢驗(yàn)的一般問(wèn)題 (一)、假設(shè)檢驗(yàn)的基本思想 例:某企業(yè)生產(chǎn)一種零件,過(guò)去的大量資料表明,零件的平均長(zhǎng)度為4厘米,標(biāo)準(zhǔn)差為0.1厘米。改革工藝后,抽查了100個(gè)零件,測(cè)得樣本平均長(zhǎng)度為3.94厘米。現(xiàn)問(wèn):工藝改革前后零件的長(zhǎng)度是否發(fā)生了顯著的變化? 改變了嗎? 可以這樣推斷:如果樣本平均數(shù)與總體平均數(shù)之間的差異不大,未超出抽樣誤差范圍,則認(rèn)為總體平均數(shù)不變;反之,如果樣本平均數(shù)與總體平均數(shù)之間的差異超出了抽樣誤差范圍,則認(rèn)為總體平均數(shù)發(fā)生了顯著的變化。 這是關(guān)于工藝改革前后零件的平均長(zhǎng)度(總體平均數(shù))是否等于4的假設(shè)檢驗(yàn)問(wèn)題。 我們知道,樣本平均長(zhǎng)度與原平均長(zhǎng)度出

29、現(xiàn)差異不外乎兩種可能:一是改革后的總體平均長(zhǎng)度不變,但由于抽樣的隨機(jī)性使樣本平均數(shù)與總體平均數(shù)之間存在抽樣誤差:二是由于工藝條件的變化,使總體平均數(shù)發(fā)生了顯著的變化。(二)、假設(shè)檢驗(yàn)主要特點(diǎn) 第一,假設(shè)檢驗(yàn)所采用的邏輯推理方法是反證法。為了檢驗(yàn)?zāi)硞€(gè)設(shè)是否成立,先假定它是正確的,然后根據(jù)抽樣理論和樣本信息,觀察由此假設(shè)而導(dǎo)致的結(jié)果是否合理,從而判斷是否接受原假設(shè)。 第二,這里的合理與否,所依據(jù)的是“小概率事件實(shí)際不可能發(fā)生的原理”。即在一次觀察中小概率事件發(fā)生了,則認(rèn)為原假設(shè)是不合理的;反之,小概率事件沒(méi)有出現(xiàn),則認(rèn)為原假設(shè)是合理的。 假設(shè)檢驗(yàn)的反證法是帶有概率性質(zhì)的反證法,并非嚴(yán)格的邏輯證明。

30、因?yàn)榧僭O(shè)檢驗(yàn)是基于樣本資料來(lái)推斷總體特征的,而這種推斷是在一定的置信概率下進(jìn)行的。 (三)、假設(shè)檢驗(yàn)的步驟 假設(shè)檢驗(yàn)一般有以下幾個(gè)步驟: 1、提出原假設(shè)和備擇假設(shè) 2、選擇適當(dāng)?shù)慕y(tǒng)計(jì)量,并確定其分布形式 3、選擇顯著性水平,確定臨界值 4、作出結(jié)論1、提出原假設(shè)和備擇假設(shè) 對(duì)每個(gè)假設(shè)檢驗(yàn)問(wèn)題,一般可同時(shí)提出兩個(gè)相反的假設(shè):原假設(shè)又稱(chēng)零假設(shè),是正待檢驗(yàn)的假設(shè),記為H0;備擇假設(shè)是拒絕原假設(shè)后可供選擇的假設(shè),記為H1。原假設(shè)和備擇假設(shè)是相互對(duì)立的,檢驗(yàn)結(jié)果二者必取其一。 原假設(shè)和備擇假設(shè)不是隨意提出的,應(yīng)根據(jù)所檢驗(yàn)問(wèn)題的具體背景而定。常常是采取“不輕易拒絕原假設(shè)”的原則,即把沒(méi)有充分理由不能輕易否

31、定的命題作為原假設(shè),而相應(yīng)地把沒(méi)有足夠把握就不能輕易肯定的命題作為備擇假設(shè)。 (1) H0 :=0; H1 : 0 。這種形式的假設(shè)檢驗(yàn)稱(chēng)為雙側(cè)檢驗(yàn)。 (2) H0 :=0; H1 :l 020 檢驗(yàn)統(tǒng)計(jì)量 由 = = 0 0 5 , 查 表 得 臨 界 值 Z= Z0.05=1.645 由于Z=2.4 Z=1.645 所以應(yīng)拒絕Ho而接受H1,即這批產(chǎn)品的使用壽命確有顯著提高。4.216/10010201080/0nxZ(二)、總體方差未知時(shí)對(duì)正態(tài)總體均值的假設(shè)檢驗(yàn) 設(shè)總體XN(,2),但總體方差2未知 ,此時(shí)對(duì)總體均值的檢驗(yàn)不能用上述方法,為了得到一個(gè)不含未知參數(shù)的檢驗(yàn)統(tǒng)計(jì)量,很自然會(huì)用總體方差的無(wú)偏估計(jì)量樣本方差S2來(lái)代替。在H0成立時(shí),檢驗(yàn)統(tǒng)計(jì)量,及其分布為:nsXxt/(三)、總體比例的假設(shè)檢驗(yàn)由比例的抽樣分布定理可知,樣本比例服從二項(xiàng)分布,因此可由二項(xiàng)分布來(lái)確定對(duì)總體比例進(jìn)行假設(shè)檢驗(yàn)的臨界值,但其計(jì)算往往十分繁瑣。大樣本情況下,二項(xiàng)分布近似服從正態(tài)分布。因此,對(duì)總體比例的檢驗(yàn)通常是在大樣本條件下進(jìn)行的,根據(jù)正態(tài)分布來(lái)近似確定臨界值,即采用Z檢驗(yàn)法。其檢驗(yàn)步驟與均值檢驗(yàn)時(shí)的步驟相同,只是檢驗(yàn)統(tǒng)計(jì)量不同。 首先提出待檢驗(yàn)的假設(shè):

溫馨提示

  • 1. 本站所有資源如無(wú)特殊說(shuō)明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請(qǐng)下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請(qǐng)聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶(hù)所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁(yè)內(nèi)容里面會(huì)有圖紙預(yù)覽,若沒(méi)有圖紙預(yù)覽就沒(méi)有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫(kù)網(wǎng)僅提供信息存儲(chǔ)空間,僅對(duì)用戶(hù)上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對(duì)用戶(hù)上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對(duì)任何下載內(nèi)容負(fù)責(zé)。
  • 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請(qǐng)與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶(hù)因使用這些下載資源對(duì)自己和他人造成任何形式的傷害或損失。

最新文檔

評(píng)論

0/150

提交評(píng)論