抽樣推斷培訓(xùn)(-)課件_第1頁(yè)
抽樣推斷培訓(xùn)(-)課件_第2頁(yè)
抽樣推斷培訓(xùn)(-)課件_第3頁(yè)
抽樣推斷培訓(xùn)(-)課件_第4頁(yè)
抽樣推斷培訓(xùn)(-)課件_第5頁(yè)
已閱讀5頁(yè),還剩123頁(yè)未讀 繼續(xù)免費(fèi)閱讀

下載本文檔

版權(quán)說(shuō)明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請(qǐng)進(jìn)行舉報(bào)或認(rèn)領(lǐng)

文檔簡(jiǎn)介

第六章抽樣推斷

一家食品生產(chǎn)企業(yè)以生產(chǎn)袋裝食品為主,每天的產(chǎn)量約為8000袋左右。按規(guī)定每袋的重量應(yīng)不低于100克,否則即為不合格。為對(duì)產(chǎn)量質(zhì)量進(jìn)行檢測(cè),企業(yè)設(shè)有質(zhì)量檢查科專門負(fù)責(zé)質(zhì)量檢驗(yàn),并經(jīng)常向企業(yè)高層領(lǐng)導(dǎo)提交質(zhì)檢報(bào)告。質(zhì)檢的內(nèi)容之一就是每袋重量是否符合要求。由于產(chǎn)品的數(shù)量大,進(jìn)行全面的檢驗(yàn)是不可能的,可行的辦法是抽樣,然后用樣本數(shù)據(jù)估計(jì)平均每袋的重量。質(zhì)檢科從某天生產(chǎn)的一批食品中隨機(jī)抽取了25袋,下表是對(duì)每袋食品重量的檢驗(yàn)結(jié)果。(假定該種袋裝食品重量服從正態(tài)分布。)案例導(dǎo)入

根據(jù)以上數(shù)據(jù),質(zhì)檢科估計(jì)出該天生產(chǎn)的食品每袋的平均重量在101.57~109.14克之間,其中,估計(jì)的可信程度為95%,估計(jì)誤差不超過4克。產(chǎn)品的合格率在95.68%~64.32%之間,其中,估計(jì)的可信程度為95%,估計(jì)誤差不超過15.68%。112.5102.6100.0116.6136.8101.0107.5123.595.4102.8103.095.0102.097.8101.5102.0108.8101.6108.498.4100.5115.6102.2105.093.3

質(zhì)檢報(bào)告提交后,企業(yè)高層領(lǐng)導(dǎo)人提出幾點(diǎn)意見:一是抽取的樣本大小是否合適?能不能用一個(gè)更大的樣本進(jìn)行估計(jì)?二是能否將估計(jì)的誤差在縮小一點(diǎn)?比如,估計(jì)平均重量時(shí)估計(jì)誤差不超過3克,估計(jì)合格率時(shí)誤差不超過10%。三是總體平均重量的方差是多少?因?yàn)榉讲畹拇笮≌f(shuō)明了生產(chǎn)過程的穩(wěn)定性,過大或過小的方差都意味著應(yīng)對(duì)生產(chǎn)過程進(jìn)行調(diào)整。參數(shù)估計(jì)、假設(shè)檢驗(yàn)

在統(tǒng)計(jì)方法中的地位統(tǒng)計(jì)方法描述統(tǒng)計(jì)推斷統(tǒng)計(jì)參數(shù)估計(jì)假設(shè)檢驗(yàn)統(tǒng)計(jì)推斷的過程樣本總體樣本統(tǒng)計(jì)量例如:樣本均值、成數(shù)、方差參數(shù)例如:總體均值、成數(shù)、方差第一節(jié)抽樣調(diào)查

一、抽樣調(diào)查的概念與作用1.抽樣調(diào)查的概念抽樣調(diào)查是一種科學(xué)的非全面調(diào)查,是按照隨機(jī)原則從總體中抽取一部分單位組成樣本進(jìn)行調(diào)查,根據(jù)調(diào)查的樣本數(shù)據(jù)推斷總體的某一數(shù)量特征的統(tǒng)計(jì)方法。2.抽樣調(diào)查的特點(diǎn)抽樣調(diào)查具有以下特點(diǎn):(1)遵循隨機(jī)原則選擇調(diào)查單位(2)抽樣調(diào)查節(jié)省人力、費(fèi)用和時(shí)間,比較靈活(3)抽樣誤差可以計(jì)算并且可以加以控制3.抽樣調(diào)查的適用范圍(1)某些不可能進(jìn)行全面調(diào)查又需要了解其全面情況的社會(huì)經(jīng)濟(jì)現(xiàn)象(2)某些不必要進(jìn)行全面調(diào)查又需要了解其全面情況的社會(huì)經(jīng)濟(jì)現(xiàn)象(3)抽樣調(diào)查可以用來(lái)檢驗(yàn)和修正全面調(diào)查資料(4)抽樣調(diào)查可以用于工業(yè)生產(chǎn)過程中的質(zhì)量控制(5)利用抽樣調(diào)查,可以對(duì)于假設(shè)進(jìn)行檢驗(yàn)

二、抽樣調(diào)查中的幾個(gè)基本概念1.全及總體和抽樣總體(1)全及總體簡(jiǎn)稱總體,是指所要認(rèn)識(shí)對(duì)象的全體,全及總體的單位數(shù)通常用大寫的英文字母“N”來(lái)表示。(2)抽樣總體也稱樣本,是指從全及總體中隨機(jī)抽取出來(lái),代表全及總體部分單位的集合體,抽樣總體的單位數(shù)通常用小寫英文字母“n”表示。一般說(shuō)來(lái),n≥30稱為大樣本,n<30稱為小樣本,n/N稱為抽樣比例,社會(huì)經(jīng)濟(jì)現(xiàn)象的抽樣調(diào)查多取大樣本。

全及總體是惟一確定的,抽樣總體則是隨機(jī)的一個(gè)全及總體可能抽取很多個(gè)樣本,全部樣本的可能數(shù)目和每一樣本的容量有關(guān),也和隨機(jī)抽樣的方法有關(guān),不同的樣本容量和取樣方法,樣本的可能數(shù)目也有很大的差別??赡軜颖緮?shù)目的計(jì)算公式考慮順序不考慮順序不重復(fù)抽樣重復(fù)抽樣2.全及指標(biāo)和抽樣指標(biāo)(1)全及指標(biāo)反映總體數(shù)量特征的綜合指標(biāo),稱為全及指標(biāo)、參數(shù)。由于全及總體是惟一確定的,所以全及指標(biāo)也是惟一確定的。對(duì)于變量總體,由于各單位的標(biāo)志可以用數(shù)值來(lái)表示,所以可以計(jì)算總體平均數(shù),用表示;對(duì)于屬性總體,可以計(jì)算總體成數(shù),用大寫英文字母表示,變量總體也可以計(jì)算成數(shù)。全及指標(biāo)還有總體方差和總體標(biāo)準(zhǔn)差。

參數(shù)研究總體中的數(shù)量標(biāo)志總體平均數(shù)總體方差X=∑XNX=∑XF∑FΣ(X-X)N2σ=2Σ(X-X)FΣF2σ=2研究總體中的品質(zhì)標(biāo)志總體成數(shù)成數(shù)方差σ2=P(1-P)P=

N1N(只有兩種表現(xiàn))(2)抽樣指標(biāo)

由抽樣總體各個(gè)標(biāo)志值或標(biāo)志特征計(jì)算的綜合指標(biāo)稱為抽樣指標(biāo)、統(tǒng)計(jì)量。變量樣本的抽樣指標(biāo)有抽樣平均數(shù)、樣本平均數(shù)方差和樣本平均數(shù)標(biāo)準(zhǔn)差;屬性樣本的抽樣指標(biāo)有抽樣成數(shù)、樣本成數(shù)方差

和樣本成數(shù)標(biāo)準(zhǔn)差。抽樣指標(biāo)的數(shù)值不是惟一確定的,是隨機(jī)變量。統(tǒng)計(jì)量研究數(shù)量標(biāo)志樣本平均數(shù)x=∑xnx=∑xf∑f樣本標(biāo)準(zhǔn)差研究品質(zhì)標(biāo)志樣本成數(shù)成數(shù)標(biāo)準(zhǔn)差np=n3.重復(fù)抽樣與不重復(fù)抽樣(1)重復(fù)抽樣重復(fù)抽樣,又稱有放回抽樣,是指從全及總體N個(gè)單位中隨機(jī)抽取一個(gè)容量為n的樣本,每次抽中的單位經(jīng)登錄其有關(guān)標(biāo)志表現(xiàn)后又放回總體中重新參加下一次的抽選。每次抽取均是在相同的條件下完全按照隨機(jī)原則進(jìn)行的。(2)不重復(fù)抽樣不重復(fù)抽樣又稱無(wú)放回抽樣,是指從全及總體N個(gè)單位中隨機(jī)抽取一個(gè)容量為n的樣本,每次抽中的單位登錄其有關(guān)標(biāo)志表現(xiàn)后不再放回總體中參加下一次的抽選,上一次的抽取結(jié)果會(huì)直接影響到下一次抽選。4.抽樣框全及總體也叫目標(biāo)總體。目標(biāo)總體規(guī)定了理論上的抽樣范圍。但實(shí)際進(jìn)行抽樣的總體范圍與目標(biāo)總體有時(shí)是不一致的。因而,在抽樣前還必須明確實(shí)際進(jìn)行抽樣的總體范圍和抽樣單位。抽樣框又稱“抽樣框架”、“抽樣結(jié)構(gòu)”,是指對(duì)可以選擇作為樣本的總體單位列出名冊(cè)或排序編號(hào),以確定總體的抽樣范圍和結(jié)構(gòu)。設(shè)計(jì)出了抽樣框后,便可采用抽簽的方式或按照隨機(jī)數(shù)表來(lái)抽選必要的單位數(shù)。好的抽樣框的標(biāo)準(zhǔn)是:完整而不重復(fù)。常見的抽樣框如大學(xué)學(xué)生花名冊(cè)、工商企業(yè)名錄、街道派出所里居民戶籍冊(cè)、意向購(gòu)房人信息冊(cè)等。在沒有現(xiàn)成的名單的情況下,可由調(diào)查人員自己編制。在利用現(xiàn)有的名單作為抽樣框時(shí),要先對(duì)該名錄進(jìn)行檢查,避免有重復(fù)、遺漏的情況發(fā)生。以提高樣本對(duì)總體的代表性。例如:要從10000名職工中抽出200名組成一個(gè)樣本,則10000名職工的名冊(cè),就是抽樣框。抽樣框也可能存在一些誤差,主要有:(1)丟失目標(biāo)總體單位,也被稱為“涵蓋不足”,或丟失目標(biāo)單位。對(duì)丟失的總體單位不能發(fā)現(xiàn)并糾正會(huì)造成調(diào)查中對(duì)總量的估計(jì)偏低。(2)包含非目標(biāo)單位,也被稱為“過涵蓋”,是指抽樣框中包含了一些不屬于研究對(duì)象的非目標(biāo)總體單位。由于抽樣框中存在非目標(biāo)總體單位,容易造成估計(jì)量的高估。(3)丟失目標(biāo)單位和包含非目標(biāo)單位共存,是指在抽樣框中既有丟失目標(biāo)單位,也有包含非目標(biāo)單位。在實(shí)際調(diào)查中,丟失目標(biāo)單位不易被查覺和發(fā)現(xiàn),具有較大的隱蔽性,相比之下,包含非目標(biāo)單位的抽樣框誤差的威脅性要小些。因?yàn)樵谡{(diào)查過程中,非目標(biāo)單位容易被發(fā)現(xiàn),并予以剔除。(4)復(fù)合連接,是指抽樣框單元與目標(biāo)總體單元不完全一一對(duì)應(yīng),而是存在一對(duì)多、多對(duì)一或是多對(duì)多模式的現(xiàn)象。例如:若某銀行想了解其客戶的情況進(jìn)行一次抽樣調(diào)查,則該行所有客戶構(gòu)成目的總體。選擇的抽樣框是銀行的來(lái)往帳目,這就構(gòu)成了多對(duì)一模式。若在這個(gè)框中進(jìn)行抽樣,則來(lái)往帳目多的客戶被抽中的可能性則較大,反之來(lái)往帳目少的客戶被抽中的可能性很小,而兩種客戶通常會(huì)有較大差異,從而造成樣本的偏斜,使估計(jì)量產(chǎn)生偏差。(5)抽樣框老化,是指隨著時(shí)間的推移,抽樣總體與目標(biāo)總體產(chǎn)生極大的偏差,即原來(lái)的抽樣框不符合實(shí)際情況,必須進(jìn)行更新。最典型的例子,就是隨著城市建設(shè)的大規(guī)模展開,許多地區(qū)已被改造,地址發(fā)生了變化,如果仍按以前的抽樣框去抽樣,那么精度就會(huì)難以控制。三、抽樣調(diào)查的基本原理1.大數(shù)定律大數(shù)定律,又稱為大數(shù)法則,是指在隨機(jī)試驗(yàn)中,每次出現(xiàn)的結(jié)果可能不同,但是大量重復(fù)試驗(yàn)出現(xiàn)的結(jié)果的平均值卻幾乎總是接近于某個(gè)確定的值。在大量的觀察試驗(yàn)中,個(gè)別的、偶然的因素影響而產(chǎn)生的差異將會(huì)相互抵消,從而使現(xiàn)象的必然規(guī)律性顯示出來(lái)。例如,觀察個(gè)別或少數(shù)家庭的嬰兒出生情況,發(fā)現(xiàn)有的生男,有的生女,沒有一定的規(guī)律性,但是通過大量的觀察就會(huì)發(fā)現(xiàn),男嬰和女嬰的比例會(huì)趨于107:100。切貝雪夫大數(shù)定理設(shè)是一列兩兩相互獨(dú)立的隨機(jī)變量,服從同一分布,且具有相同的數(shù)學(xué)期望和方差

,則對(duì)任意小的正數(shù)ε,有:當(dāng)n很大時(shí),服從同一分布的隨機(jī)變量的算術(shù)平均數(shù)將依概率接近于這些隨機(jī)變量的數(shù)學(xué)期望。隨著樣本容量n的增加,樣本平均數(shù)將接近于總體平均數(shù),從而為統(tǒng)計(jì)推斷中依據(jù)樣本平均數(shù)估計(jì)總體平均數(shù)提供了理論依據(jù)。(1)現(xiàn)象的某種總體規(guī)律性,只有當(dāng)具有這種現(xiàn)象的足夠多的單位綜合匯總在一起的時(shí)候,才能顯現(xiàn)出來(lái);(2)現(xiàn)象的總體性規(guī)律或傾向通常以平均數(shù)(或比率)的形式表現(xiàn)出來(lái);(3)當(dāng)所研究的現(xiàn)象總體包含的單位越多,平均數(shù)(或比率)也就越能正確反映出這些現(xiàn)象的規(guī)律性;(4)各單位的共同傾向決定著平均數(shù)(或比率)的水平,而各單位對(duì)平均數(shù)(或比率)的離差則會(huì)由于足夠多數(shù)單位的綜合匯總的結(jié)果,而相互抵消,趨于消失。根據(jù)大數(shù)定律的內(nèi)容特點(diǎn)運(yùn)用抽樣調(diào)查時(shí),必須注意以下兩個(gè)問題:(1)抽樣必須遵循隨機(jī)原則,這樣樣本指標(biāo)才能成為隨機(jī)變量,大數(shù)定律才能應(yīng)用;(2)抽樣必須遵循大量原則,只有觀察到足夠多的單位,才能在綜合后使個(gè)別單位表現(xiàn)出來(lái)的偶然性得以消除。2.中心極限定理在一定條件下,大量獨(dú)立隨機(jī)變量的平均數(shù)以正態(tài)分布為極限。設(shè)隨機(jī)變量相互獨(dú)立;其數(shù)學(xué)期望值為;其標(biāo)準(zhǔn)差為;,,滿足下述條件:

對(duì)任一實(shí)數(shù),有即:只要在樣本容量充分大的條件下,不論全及總體的變量分布是否屬于正態(tài)分布,其抽樣平均數(shù)也服從或近似服從正態(tài)分布,這就為抽樣調(diào)查進(jìn)行估計(jì)提供了重要的理論根據(jù)。(1)如果總體服從正態(tài)分布,樣本平均數(shù)也服從正態(tài)分布;(2)如果總體很大,但不服從正態(tài)分布,只要樣本足夠大,樣本的平均數(shù)也趨近于正態(tài)分布;(3)樣本平均數(shù)的數(shù)學(xué)期望等于總體均值。意義:當(dāng)我們的認(rèn)識(shí)對(duì)象分布未知時(shí),只要堅(jiān)持隨機(jī)抽取足夠多的樣本單位,就可以使樣本統(tǒng)計(jì)量服從(或近似服從)正態(tài)分布,繼而便可運(yùn)用正態(tài)分布理論,根據(jù)樣本信息來(lái)推斷認(rèn)識(shí)對(duì)象總體的數(shù)量特征。第二節(jié)抽樣誤差一、抽樣誤差1.抽樣誤差的概念抽樣指標(biāo)與所要估計(jì)的全及指標(biāo)之間的差值稱為抽樣誤差。抽樣誤差既是一種隨機(jī)性誤差,也是一種代表性誤差。抽樣誤差中的代表性誤差是抽樣調(diào)查本身所固有的、無(wú)法避免的誤差,但隨機(jī)性誤差則可利用大數(shù)定律精確地計(jì)算并能夠通過抽樣設(shè)計(jì)程序加以控制。2.影響抽樣誤差的因素(1)樣本容量(2)總體各單位標(biāo)志值的差異程度(3)抽樣方法(4)抽樣的組織形式二、抽樣平均誤差1.樣本平均數(shù)的抽樣平均誤差(1)當(dāng)抽樣方法為重復(fù)抽樣時(shí),樣本標(biāo)志值是相互獨(dú)立的,樣本變量與總體變量同分布。其計(jì)算公式如下:

它說(shuō)明在重復(fù)抽樣的條件下,抽樣平均誤差與總體標(biāo)準(zhǔn)差成正比,與樣本容量的平方根成反比。在計(jì)算抽樣平均數(shù)的抽樣平均誤差時(shí),通常并不知道總體方差的數(shù)值,可用樣本方差來(lái)代替總體方差。(2)不重復(fù)抽樣:

當(dāng)總體單位數(shù)很大時(shí),這個(gè)計(jì)算公式可近似表示如下:

總是小于1,所以不重復(fù)抽樣的抽樣平均誤差總是小于重復(fù)抽樣的抽樣平均誤差。當(dāng)抽樣比例很小時(shí),即使是采用不重復(fù)抽樣的方法來(lái)抽取調(diào)查單位,也可使用重復(fù)抽樣的誤差公式來(lái)計(jì)算抽樣平均誤差。2.抽樣成數(shù)的平均誤差總體成數(shù)可表現(xiàn)為總體是非標(biāo)志的平均數(shù),它的標(biāo)準(zhǔn)差為。(1)在重復(fù)抽樣下,其計(jì)算公式如下:

當(dāng)總體單位數(shù)很大時(shí),這個(gè)公式可近似表示如下:

在計(jì)算抽樣成數(shù)平均誤差時(shí),通常得不到總體方差的數(shù)值,一般可以用樣本方差來(lái)代替總體方差。(2)在不重復(fù)抽樣下,其計(jì)算公式如下:

三、抽樣極限誤差允許的誤差范圍,即抽樣極限誤差。抽樣極限誤差是指在一定的置信度下抽樣指標(biāo)與總體指標(biāo)之間的抽樣誤差不超過某一給定的最大可能范圍,記作Δ。由上述兩個(gè)絕對(duì)值不等式可得:

四、抽樣估計(jì)的概率度、置信度

1.抽樣估計(jì)的概率度

抽樣極限誤差與抽樣平均誤差相比,從而使由單一樣本值得到的抽樣極限誤差標(biāo)準(zhǔn)化,稱為概率度或相對(duì)誤差范圍。在正態(tài)分布下,概率度用

表示,其計(jì)算公式如下:

抽樣極限誤差取決于兩個(gè)因素:一是抽樣平均誤差,在其他條件既定時(shí),抽樣平均誤差越小,抽樣極限誤差也越??;二是抽樣估計(jì)的概率度,在其他條件既定時(shí),抽樣估計(jì)的概率度越小,抽樣極限誤差也越小。2.抽樣估計(jì)的置信度置信度就是總體指標(biāo)落在某個(gè)區(qū)間(稱為置信區(qū)間)的概率把握程度,又稱抽樣估計(jì)可靠程度、概率保證程度。置信區(qū)間是以一定的概率把握程度確定總體指標(biāo)所在的區(qū)間。

為置信度,表示區(qū)間估計(jì)的可靠程度。例如=0.95,說(shuō)明有95%的可能總體參數(shù)包括在估計(jì)區(qū)間內(nèi),而不包括在這個(gè)區(qū)間的概率為=5%,

叫顯著性水平。應(yīng)用標(biāo)準(zhǔn)正態(tài)分布概率表,可以得抽樣指標(biāo)落在置信區(qū)間內(nèi)的置信度。抽樣估計(jì)的精確度與置信度是一對(duì)反方向運(yùn)動(dòng)的矛盾,實(shí)際調(diào)查中應(yīng)注意協(xié)調(diào)它們的矛盾。第三節(jié)參數(shù)估計(jì)包括對(duì)總體平均數(shù)和總體成數(shù)進(jìn)行估計(jì),有點(diǎn)估計(jì)和區(qū)間估計(jì)兩種方法。一、參數(shù)估計(jì)的基本要求1.無(wú)偏性估計(jì)中,要求各個(gè)抽樣指標(biāo)的平均數(shù)應(yīng)該等于全及指標(biāo),即從平均數(shù)意義上,抽樣指標(biāo)的估計(jì)是沒有偏誤的,這一要求稱為無(wú)偏性。如果樣本統(tǒng)計(jì)量的數(shù)學(xué)期望值等于所估計(jì)的總體參數(shù)的值,該樣本統(tǒng)計(jì)量稱作總體參數(shù)的無(wú)偏估計(jì)量。樣本無(wú)偏統(tǒng)計(jì)量的所有可能值的期望值或均值等于被估計(jì)的總體參數(shù)。

2.一致性當(dāng)樣本的單位數(shù)無(wú)限增大時(shí),抽樣指標(biāo)就充分靠近全及指標(biāo),抽樣指標(biāo)和未知的全及總體指標(biāo)之間的絕對(duì)離差為任意小的可能性也趨于必然。符合這一要求的估計(jì)量就是一致性估計(jì)量。例如,樣本均值、樣本成數(shù)、樣本方差分別是總體均值、總體成數(shù)、總體方差的一致性估計(jì)量。3.有效性以樣本估計(jì)總體,要求優(yōu)良估計(jì)量的抽樣分布方差小于其他估計(jì)量的抽樣分布方差,即從平均的角度來(lái)看,優(yōu)良估計(jì)量的估計(jì)誤差應(yīng)小于其他估計(jì)量的估計(jì)誤差。例如,對(duì)于正態(tài)分布總體來(lái)說(shuō),樣本均值和樣本中位數(shù)都是總體均值的無(wú)偏估計(jì)量,但兩者的方差不同,樣本中位數(shù)的方差比樣本均值的方差大,因此,樣本均值比樣本中位數(shù)更有效。同樣樣本成數(shù)、樣本方差分別是總體成數(shù)、總體方差的有效性估計(jì)量。不是所有估計(jì)量都符合以上標(biāo)準(zhǔn),可以說(shuō)完全符合以上標(biāo)準(zhǔn)的估計(jì)量要比不符合或不完全符合以上標(biāo)準(zhǔn)的估計(jì)量更為優(yōu)良。例如在正態(tài)分布的情況下,總體平均數(shù)和中位數(shù)是重合在一起的,樣本平均數(shù)是總體中位數(shù)的無(wú)偏估計(jì)量和一致估計(jì)量,而且樣本平均數(shù)比樣本中位數(shù)作為總體中位數(shù)的估計(jì)量也是更有效的,因?yàn)闃颖酒骄鶖?shù)的方差比樣本中位數(shù)的方差更小。當(dāng)估計(jì)量的選擇在無(wú)偏性和有效性之間產(chǎn)生矛盾時(shí),這時(shí)的基本原則是如果有偏估計(jì)量的偏差不是很大,應(yīng)該優(yōu)先選擇有偏但更有效地估計(jì)量。二、點(diǎn)估計(jì)點(diǎn)估計(jì)又稱定值估計(jì),它是以抽樣指標(biāo)作為總體指標(biāo)的估計(jì)量,并以抽樣指標(biāo)的實(shí)際觀測(cè)值直接作為總體未知參數(shù)估計(jì)值的一種推斷方法。例如以某一樣本的均值來(lái)估計(jì)總體的均值,以某一樣本的成數(shù)來(lái)估計(jì)總體的成數(shù)等。點(diǎn)估計(jì)的方法有矩估計(jì)法、順序統(tǒng)計(jì)量法、最大自然法、最小二乘法等。矩估計(jì)法是英國(guó)統(tǒng)計(jì)學(xué)家K·Pearson提出的。其基本思想是:由于樣本來(lái)源于總體,樣本矩在一定程度上反映了總體矩,而且由大數(shù)定律可知,樣本矩依概率收斂于總體矩。因此,只要總體的k階原點(diǎn)矩存在,就可以用樣本矩作為相應(yīng)總體矩的估計(jì)量,用樣本矩的函數(shù)作為總體矩的函數(shù)的估計(jì)量。例如,用樣本均值來(lái)估計(jì)總體均值,用樣本方差來(lái)估計(jì)總體方差。矩估計(jì)法簡(jiǎn)單、直觀,而且不必知道總體的分布類型,所以矩估計(jì)法得到了廣泛應(yīng)用。但矩估計(jì)法也有局限性,它要求總體以k階原點(diǎn)矩存在,否則無(wú)法估計(jì),它不考慮總體分布類型,因此也就沒有充分利用總體分布函數(shù)提供的信息。極大似然估計(jì)法是由Fisher,提出的一種參數(shù)估計(jì)方法。其基本思想是:設(shè)總體分布的函數(shù)形式已知,但有未知參數(shù),可以取很多值,在的一切可能取值中選一個(gè)使樣本觀察值出現(xiàn)的概率為最大的值作為的估計(jì)值,記作,稱為的極大似然估計(jì)值,這種求估計(jì)量的方法稱為極大似然估計(jì)法。確定一個(gè)好的點(diǎn)估計(jì)是很重要的。點(diǎn)估計(jì)的優(yōu)點(diǎn)是能給出一個(gè)明確的值,缺點(diǎn)是沒有指出這種估計(jì)的允許波動(dòng)范圍和把握程度有多大。因此,在實(shí)際中,點(diǎn)估計(jì)往往是與區(qū)間估計(jì)同時(shí)進(jìn)行的。三、區(qū)間估計(jì)區(qū)間估計(jì)就是以一個(gè)具有一定可靠程度的區(qū)間范圍來(lái)估計(jì)總體參數(shù),即根據(jù)抽樣指標(biāo)和抽樣平均誤差推斷全及指標(biāo)的可能范圍。用抽樣指標(biāo)來(lái)估計(jì)全及指標(biāo),要達(dá)到100%的準(zhǔn)確幾乎是不可能的,所以在估計(jì)全及指標(biāo)時(shí)就必須同時(shí)考慮估計(jì)誤差的大小??茖W(xué)地確定允許的誤差范圍:一是這一可能范圍的大小,即置信區(qū)間;二是總體指標(biāo)落在這個(gè)可能范圍內(nèi)的概率,即置信度。區(qū)間估計(jì)必須同時(shí)具備三個(gè)要素,即具備估計(jì)值、抽樣極限誤差和置信度三個(gè)基本要素。抽樣極限誤差決定抽樣估計(jì)的精確度,置信度決定抽樣估計(jì)的可靠性,兩者密切聯(lián)系,但同時(shí)又是一對(duì)矛盾,所以對(duì)估計(jì)的精確度和可靠性的要求應(yīng)慎重考慮。

稱為置信區(qū)間??茖W(xué)的區(qū)間估計(jì)要具備三個(gè)基本要素:第一,要有合適的統(tǒng)計(jì)量作為估計(jì)量;第二,要有合理的允許誤差范圍;第三,要有可靠的概率保證程度。由于參數(shù)的允許范圍涉及估計(jì)的準(zhǔn)確性問題,而相應(yīng)的置信度涉及估計(jì)的可靠性問題。出于本能,在做估計(jì)時(shí)常常希望準(zhǔn)確性盡可能提高,而且可靠性也不能小,但是這兩個(gè)要求是矛盾的。在樣本單位數(shù)不變的條件下,要想縮小估計(jì)區(qū)間,提高估計(jì)的準(zhǔn)確性,勢(shì)必要減小置信度,降低估計(jì)的可靠性。同樣,提高了估計(jì)的可靠性,也必然要降低估計(jì)的準(zhǔn)確性。因此,在抽樣估計(jì)的時(shí)候,只能對(duì)其中的一個(gè)要素提出要求,而推斷另一個(gè)要素的變動(dòng)情況。如對(duì)估計(jì)的準(zhǔn)確性提出要求,即要求誤差范圍不超過給定的標(biāo)準(zhǔn),來(lái)推算估計(jì)的可靠性,即置信度;或?qū)烙?jì)的可靠性提出要求,即要求給定的置信度,來(lái)推算抽樣的誤差范圍。若所推算的另一要素(抽樣誤差范圍或概率保證程度)不能滿足實(shí)際工作的需要,就應(yīng)該增加樣本單位改善抽樣組織方式,重新進(jìn)行抽樣,直到符合要求為止。根據(jù)置信度的要求,估計(jì)總體指標(biāo)出現(xiàn)的可能范圍的具體步驟是:(1)抽取樣本,計(jì)算樣本指標(biāo),如計(jì)算樣本平均數(shù)或樣本成數(shù),作為總體指標(biāo)的相應(yīng)估計(jì)值。并計(jì)算樣本標(biāo)準(zhǔn)差用以推算抽樣平均誤差。(2)根據(jù)給定的置信度的要求,查《正態(tài)分布概率表》,求得概率度值。(3)根據(jù)概率度和抽樣平均誤差來(lái)推算抽樣極限誤差的可能范圍,并據(jù)以計(jì)算被估計(jì)總體指標(biāo)的上下限,對(duì)總體參數(shù)作區(qū)間估計(jì)。1.總體平均數(shù)的估計(jì)某外貿(mào)公司出口一種茶葉,規(guī)定每包規(guī)格不低于150克,現(xiàn)在用不重復(fù)抽樣的方法抽取其中1%進(jìn)行檢驗(yàn)。測(cè)得結(jié)果如表所示,要求以95.45%的概率估計(jì)這批茶葉平均每包的重量范圍,以便確定平均重量是否達(dá)到規(guī)格要求。每包重量(克)組中值包

數(shù)148-149148.510149-150149.520150-151150.550151-152151.520合

計(jì)—100第一步,根據(jù)樣本資料計(jì)算樣本平均數(shù)和標(biāo)準(zhǔn)差,并推算抽樣平均誤差。第二步,根據(jù)給定的置信度95.45%,查表得概率度=2。第三步,根據(jù)概率度和抽樣平均誤差計(jì)算抽樣極限誤差,并估計(jì)總體平均數(shù)的上下限,判斷其是否達(dá)到規(guī)格要求??梢杂?5.45%的概率保證該批茶葉平均每包重量在150.13-150.47克之間,表明這批茶葉平均每包重量達(dá)到了規(guī)格要求。對(duì)某型號(hào)的電子元件進(jìn)行耐用性能檢查,抽查的資料分組列表如下,要求耐用時(shí)數(shù)的允許誤差范圍=10.5小時(shí),試估計(jì)該批電子元件的平均耐用時(shí)數(shù)。練習(xí)耐用時(shí)數(shù)組中值元件數(shù)900以下900-950950-10001000-10501050-11001100-11501150-12001200以上875925975102510751125117512251263543931合計(jì)100—1、計(jì)算抽樣平均數(shù)和標(biāo)準(zhǔn)差2、根據(jù)給定的Δχ=10.5小時(shí),計(jì)算總體平均數(shù)的上下限,下限=上限=3、根據(jù)=10.5/5.191=2,查概率表得置信度1-=0.9545我們可以作如下估計(jì),即可以概率95.45%的保證程度,估計(jì)該批電子元件的耐用時(shí)數(shù)在1045-1066小時(shí)之間。2.總體成數(shù)的估計(jì)仍用前例資料,要求用同樣的概率保證這批茶葉包裝合格率范圍。第一步,根據(jù)樣本資料計(jì)算樣本合格率和標(biāo)準(zhǔn)差,并推算抽樣平均誤差。第二步,根據(jù)給定的置信度95.45%,查表得概率度=2。第三步,根據(jù)概率度和抽樣平均誤差計(jì)算抽樣極限誤差,并估計(jì)總體合格率的上下限??梢杂?5.45%的概率,保證該批茶葉包裝的合格率在60.88%-79.12%之間。練習(xí):某紗廠某時(shí)期內(nèi)生產(chǎn)了10萬(wàn)個(gè)單位的紗,按純隨機(jī)抽樣方式抽取2000個(gè)單位檢驗(yàn),檢驗(yàn)結(jié)果合格率為95%,廢品率為5%,試以95%的把握程度,估計(jì)全部紗合格品率的區(qū)間范圍及合格品數(shù)量的區(qū)間范圍?區(qū)間下限:區(qū)間上限:第四節(jié)抽樣組織形式不同的抽樣組織形式,會(huì)有不同的抽樣誤差,因而抽樣的效果也是不同的。一種科學(xué)的組織形式往往有可能以較少的樣本單位數(shù)取得更好的抽樣效果。因此抽樣調(diào)查必須選擇合適的組織形式,并對(duì)所用方法的抽樣做出正確的估計(jì),進(jìn)一步和其他組織形式的抽樣誤差進(jìn)行對(duì)比分析。例如糧食產(chǎn)量按地理?xiàng)l件分類,分類取樣;或按歷史單產(chǎn)資料、當(dāng)年估產(chǎn)資料,將各單位順序排隊(duì),并等距取樣等等。即使是同一種抽樣組織形式,由于采用的分類標(biāo)準(zhǔn)不同,群體的劃分不同等等原因,仍然會(huì)產(chǎn)生不同的效果。進(jìn)行對(duì)比分析,從中選擇有效和切實(shí)可行的抽樣方案。常用的抽樣組織方式有簡(jiǎn)單隨機(jī)抽樣、類型抽樣、等距抽樣、整群抽樣、多階段抽樣等等。一、簡(jiǎn)單隨機(jī)抽樣簡(jiǎn)單隨機(jī)抽樣,是按照隨機(jī)原則直接從個(gè)總體單位中抽取個(gè)單位作為樣本。不論是重復(fù)還是不重復(fù)抽樣,都要保證每個(gè)單位在抽選中都有相等的中選機(jī)會(huì)。優(yōu)點(diǎn):簡(jiǎn)單易行適用:總體單位數(shù)不是太多的均勻總體。采用簡(jiǎn)單隨機(jī)抽樣,在進(jìn)行抽樣調(diào)查之前應(yīng)該先確定總體范圍,并對(duì)總體進(jìn)行編號(hào),然后隨機(jī)抽選必要的單位數(shù),簡(jiǎn)單隨機(jī)抽樣最符合隨機(jī)原則。抽選樣本單位的具體做法(1)抽簽法:做標(biāo)簽,充分地拌勻后逐個(gè)地抽出個(gè)標(biāo)簽,根據(jù)抽樣框找到相應(yīng)的抽樣單位進(jìn)行現(xiàn)場(chǎng)調(diào)查,從而得到一個(gè)簡(jiǎn)單隨機(jī)樣本。如果總體比較大,抽簽法就顯得比較笨重,實(shí)施起來(lái)不太方便,甚至于根本無(wú)法實(shí)施,此時(shí)可利用隨機(jī)數(shù)字表法。(2)隨機(jī)數(shù)字表法:隨機(jī)數(shù)字表,是供抽樣使用的,由0到9這十個(gè)數(shù)碼隨機(jī)排列組成的多位數(shù)字表。在使用前,先將總體的全部單位編號(hào),并根據(jù)編號(hào)的位數(shù)確定使用表中數(shù)字的列數(shù);然后,從任意一行、任意一列、任意方向開始數(shù),遇到編號(hào)范圍內(nèi)的數(shù)字就作為樣本單位,超過編號(hào)范圍內(nèi)的數(shù)字就跳過去,直到抽夠樣本單位數(shù)目為止。(3)利用計(jì)算機(jī)軟件中的隨機(jī)函數(shù)產(chǎn)生隨機(jī)數(shù)的功能隨機(jī)抽選樣本單位數(shù)。組織抽樣調(diào)查的一項(xiàng)重要工作就是確定合適的樣本容量。因?yàn)闃颖救萘吭酱?,抽樣誤差可能越小,但花費(fèi)的時(shí)間和費(fèi)用也越高,也就失去了抽樣調(diào)查的意義;反之,樣本容量越小,花費(fèi)的時(shí)間和費(fèi)用也越少,但在估計(jì)的精確度上常不能滿足要求。所以在設(shè)計(jì)的時(shí)候,通常是先根據(jù)研究問題的性質(zhì)確定允許的誤差范圍和必要的概率保證程度或概率度,并根據(jù)總體的標(biāo)準(zhǔn)差通過抽樣平均誤差的公式來(lái)確定必要的樣本單位數(shù)。根據(jù)各種條件下的抽樣平均誤差以及極限誤差很容易推算出必要的抽樣數(shù)目。在重復(fù)抽樣下,樣本平均數(shù)的極限抽樣誤差公式為:則必要的樣本單位數(shù)為:在不重復(fù)抽樣下,則必要的樣本單位數(shù)為:同樣,重復(fù)抽樣和不重復(fù)抽樣的成數(shù)樣本必要單位數(shù)分別為:確定抽樣單位數(shù)時(shí)的注意事項(xiàng):1.樣本容量受允許誤差范圍大小的影響。誤差范圍要求越小則樣本單位數(shù)就需要越愈多,所以在抽樣設(shè)計(jì)中確定抽樣誤差可允許范圍要十分慎重考慮。2.樣本容量受總體標(biāo)準(zhǔn)差大小的影響。在確定一個(gè)樣本進(jìn)行多指標(biāo)的調(diào)查中,為保證所有的抽樣誤差都控制在允許的范圍內(nèi),應(yīng)選擇樣本容量大的。3.當(dāng)總體單位數(shù)較大時(shí),不重復(fù)抽樣的樣本容量的確定,也可以用重復(fù)抽樣情況下必要單位的計(jì)算公式。某市進(jìn)行居民家計(jì)調(diào)查,根據(jù)歷史資料該市居民家庭平均每人年收入的標(biāo)準(zhǔn)差為3000元,而家庭消費(fèi)的恩格爾系數(shù)為43%?,F(xiàn)在用重復(fù)抽樣的方法,要求在95%的概率保證下,平均收入的極限誤差不超過250元,恩格爾系數(shù)的極限誤差不超過4%。問必要的抽樣單位數(shù)應(yīng)該為多少?根據(jù)重復(fù)抽樣條件下必要樣本單位數(shù)的公式計(jì)算為:樣本平均數(shù)的必要單位數(shù)

==554(人)樣本成數(shù)的必要單位數(shù)==589(人)兩個(gè)抽樣指標(biāo)所要求的必要抽樣數(shù)目不同,應(yīng)該取其中較大的單位數(shù),即抽取589人作為樣本,以滿足共同的要求。簡(jiǎn)單隨機(jī)抽樣在實(shí)踐上受到許多限制。例如當(dāng)總體很大時(shí),要首先對(duì)每一個(gè)單位加以編號(hào)就有很大困難,對(duì)于無(wú)限總體,對(duì)其進(jìn)行編號(hào)甚至是不可能的。但這種抽樣方式從理論上說(shuō)最符合隨機(jī)原則,它的抽樣誤差容易得到理論上的論證。因此可以作為發(fā)展其他更復(fù)雜的抽樣設(shè)計(jì)的基礎(chǔ),同時(shí)也是衡量其他抽樣方式抽樣效果的比較標(biāo)準(zhǔn)。1:某市進(jìn)行職工家庭生活費(fèi)抽樣調(diào)查,已知職工家庭平均每人每月生活費(fèi)收入的標(biāo)準(zhǔn)差為110元,允許誤差范圍10元,概率把握程度95%,試確定應(yīng)抽選的戶數(shù)。

解:

2:某企業(yè)要調(diào)查產(chǎn)品合格率,已知以往的合格率曾有90%、98%、99%?,F(xiàn)要求誤差不超過1%,把握程度為95%,問需要抽選多少件產(chǎn)品?

解:

3:要調(diào)查某校大學(xué)生英語(yǔ)四級(jí)考試成績(jī),假設(shè)根據(jù)歷史資料該校學(xué)生平均成績(jī)的標(biāo)準(zhǔn)差為20分,及格率為65%?,F(xiàn)用重復(fù)抽樣方法,要求在95%的置信度下,平均分?jǐn)?shù)的誤差不超過2分,及格率的誤差不超過4%,求必要抽樣數(shù)目。二、類型抽樣類型抽樣又稱分層抽樣、分類抽樣,它是先對(duì)總體各單位按某一主要標(biāo)志進(jìn)行分組,然后再?gòu)母鹘M中按隨機(jī)的原則抽選一定單位構(gòu)成樣本。類型抽樣是將統(tǒng)計(jì)分組和簡(jiǎn)單隨機(jī)抽樣相結(jié)合的一種抽樣方式。通過分組,可以把總體分成幾個(gè)在組內(nèi)性質(zhì)比較接近的類型,使得各組內(nèi)標(biāo)志差異縮小,各組間有較大差異,保證了樣本單位能夠均勻地分布在總體各部分,從而提高了樣本的代表性。對(duì)于給定的總體,總方差是一定的,根據(jù)方差定理,在分組的情況下,總方差=組間方差+組內(nèi)方差的平均數(shù)。所以,劃分類別時(shí)應(yīng)盡量增大組(或類)間差異,縮小組(或類)內(nèi)差異。因?yàn)榻M(或類)內(nèi)方差越小,類型抽樣的抽樣平均誤差就會(huì)隨之縮小,抽樣估計(jì)的效率便會(huì)隨之升高。將總體分成若干組后,樣本單位數(shù)在各組之間的分配主要有兩種方法:一是按統(tǒng)一的比例確定各組應(yīng)抽選的單位數(shù),這種分配方法稱為比例分配。二是按各組的標(biāo)志變異程度來(lái)確定各組應(yīng)抽的單位數(shù)。對(duì)于標(biāo)志變異大的組宜多抽一些單位進(jìn)行調(diào)查,而標(biāo)志變異小的組宜少抽一些單位進(jìn)行調(diào)查。各組的抽選比例與對(duì)應(yīng)的總體中各組單位數(shù)所占的比例是不相等的,這種分配方法稱為最佳分配。各組的樣本單位數(shù)確定后,再按簡(jiǎn)單隨機(jī)抽樣等方式在各組內(nèi)隨機(jī)地抽取樣本單位。比例分配樣本單位數(shù)一般是按照各組總體單位數(shù)與全部總體單位數(shù)之比例來(lái)分配樣本單位數(shù),以保持各組樣本單位數(shù)與樣本容量之比等于各組總體單位數(shù)與全部總體單位數(shù)之比,即:

所以各組的樣本單位數(shù)應(yīng)為:

類型抽樣的樣本平均數(shù)計(jì)算步驟為:第一步,在各組分別取樣,可以計(jì)算各組抽樣平均數(shù)。

第二步,將各組樣本平均數(shù)以各組樣本單位數(shù)或總體單位數(shù)為權(quán)數(shù)進(jìn)行加權(quán)平均,即為所求的樣本平均數(shù)。

類型抽樣的抽樣平均誤差的計(jì)算步驟為:第一步,計(jì)算各組內(nèi)方差。

第二步,以各組樣本單位數(shù)為權(quán)數(shù),計(jì)算各組內(nèi)方差的平均數(shù)

由于類型抽樣是對(duì)每一組均進(jìn)行隨機(jī)抽樣,不存在組間誤差,所以抽樣平均誤差取決于各組內(nèi)方差的平均水平。第三步,計(jì)算抽樣平均誤差。重復(fù)抽樣:

不重復(fù)抽樣

對(duì)某鄉(xiāng)全部4000公頃土地按類型抽樣,了解該鄉(xiāng)平均每公頃產(chǎn)量和全鄉(xiāng)小麥總產(chǎn)量。其中,有平原地3000公頃,丘陵地1000公頃。采用不重復(fù)抽樣方法,按3‰的比例抽取樣本單位,調(diào)查結(jié)果如表。要求在95%的概率保證下,對(duì)全鄉(xiāng)小麥平均每公頃產(chǎn)量和總產(chǎn)量進(jìn)行估計(jì)。樣本平均數(shù)和組內(nèi)方差的平均數(shù)為:抽樣平均誤差為:全鄉(xiāng)平均每公頃產(chǎn)量區(qū)間為:即,6187.0<<6650.93(千克)全村總產(chǎn)量區(qū)間為:即,<<24748280(千克)<<26603720(千克)有95%的概率保證,該鄉(xiāng)小麥平均每公頃產(chǎn)量在6187.07千克與6650.93千克之間;總產(chǎn)量在24748280千克與26603720千克之間。從以上計(jì)算過程可以看出,類型抽樣的抽樣平均誤差與組間的方差無(wú)關(guān),僅取決于組內(nèi)方差的平均水平。由于簡(jiǎn)單隨機(jī)抽樣采用的是總方差,它等于組間方差與組內(nèi)平均方差之和,所以類型抽樣的平均誤差一般小于簡(jiǎn)單隨機(jī)抽樣的平均誤差。同時(shí)由于總體方差是唯一確定的數(shù)值,因此在類型抽樣分組時(shí)應(yīng)該盡可能擴(kuò)大組間方差,縮小組內(nèi)方差,即各組間的差異可以大,而各組內(nèi)的差異必須小,這樣就可以減少抽樣誤差,提高抽樣效果。三、等距抽樣等距抽樣也稱系統(tǒng)抽樣、機(jī)械抽樣,它是先將總體各單位按某一標(biāo)志排隊(duì),然后按固定的距離或間隔來(lái)抽取樣本單位。需要事先對(duì)總體結(jié)構(gòu)有一定的了解,有較高的代表性。由于排隊(duì)所依據(jù)的標(biāo)志不同,有兩種等距抽樣方法。第一無(wú)關(guān)標(biāo)志排隊(duì)法,即是指排列的標(biāo)志和所研究的單位標(biāo)志值大小無(wú)關(guān)或不起主要的影響作用。第二有關(guān)標(biāo)志排隊(duì)法,所謂有關(guān)標(biāo)志是指作為排列順序的標(biāo)志和所研究的單位標(biāo)志值大小有密切的關(guān)系。排隊(duì)后,需計(jì)算出抽樣距離,公式為:

也可采用半距中點(diǎn)取樣,也可采用對(duì)稱等距取樣。注意:無(wú)論何種取樣,都不要把抽樣的間隔和現(xiàn)象本身的周期性變化相重合,以免出現(xiàn)系統(tǒng)性偏差。半距中點(diǎn)取樣:即在每部分的中間(抽樣距離的一半)抽取一個(gè)單位組成樣本。如,第一部分取第k/2單位,第二部分取第3k/2單位,…,第n部分取第(2n-1)k/2單位。這種取樣方法,使所抽取的各單位最能代表每部分的一般水平,從而提高樣本的代表性,其不足之處是只能取一個(gè)樣本。對(duì)稱等距取樣。即第一部分隨機(jī)抽取一個(gè)單位,然后據(jù)此在各部分中抽取兩兩對(duì)稱的樣本單位組成樣本。如,第一部分取第i單位,第二部分取第2k-i單位,第三部分取第2k+i單位,第四部分取第4k-i單位,…,第(n-1)部分取第(n-2)k+i單位,第n部分取第nk-i單位。這種取樣方法,既遵循隨機(jī)原則,又能取到較有代表性的樣本,并且可以抽取k個(gè)樣本。樣本容量確定的方法與不重復(fù)分層抽樣相同。用等距抽樣的方式抽取單位組成樣本,可直接用簡(jiǎn)單法計(jì)算樣本平均數(shù)。但等距抽樣的平均誤差情況比較復(fù)雜,它和標(biāo)志排列的順序有關(guān)。等距抽樣一定是不重復(fù)抽樣,一般地,按無(wú)關(guān)標(biāo)志排隊(duì)等距抽樣,由于排隊(duì)所用標(biāo)志與研究目的無(wú)關(guān),而且是隨機(jī)起點(diǎn),其性質(zhì)近似簡(jiǎn)單隨機(jī)抽樣,可按不重復(fù)條件下簡(jiǎn)單隨機(jī)抽樣的抽樣平均誤差公式來(lái)近似計(jì)算。按有關(guān)標(biāo)志排隊(duì)的等距抽樣,其性質(zhì)又近似類型抽樣,只是分類更細(xì),相當(dāng)于每一類中抽取一個(gè)單位,因此其抽樣誤差可借助類型抽樣平均誤差的公式計(jì)算。四、整群抽樣整群抽樣也稱集團(tuán)抽樣,是將總體各單位劃分成若干群,然后以群為單位從中隨機(jī)抽取一些群,對(duì)中選群的所有單位進(jìn)行全面調(diào)查的抽樣組織形式。優(yōu)點(diǎn):抽取的單位一般比較集中,組織工作簡(jiǎn)單,搜集資料方便容易,節(jié)省人力、物力,調(diào)查費(fèi)用較少。因?yàn)橐匀簽閱挝贿M(jìn)行抽選,抽選單位比較集中,顯著地影響了在總體中各單位分布的均勻性,與其他抽樣方式比較,抽樣誤差比較大,即使要得到同簡(jiǎn)單隨機(jī)抽樣相同的精確度,整群抽樣都要調(diào)查相對(duì)較多的樣本單位。設(shè)將總體的全部單位劃分為群,現(xiàn)從總體群中隨機(jī)抽取群組成樣本,并對(duì)中選群的所有單位進(jìn)行全面調(diào)查。樣本平均數(shù)的抽樣平均誤差可以按這一方法來(lái)計(jì)算。

其中,為群間方差,用公式表示為:

設(shè)某化肥廠日夜連續(xù)生產(chǎn),每分鐘產(chǎn)量為100袋?,F(xiàn)在采用整群抽樣來(lái)檢驗(yàn)一晝夜生產(chǎn)的化肥每袋的重量和包裝的一等品率。以144分鐘為一個(gè)間隔,每次抽取一分鐘的產(chǎn)量,共抽取10分鐘的產(chǎn)量進(jìn)行分批檢驗(yàn),其平均每袋重量為49.5千克,其群間方差為2.65千克。一等品包裝的比重為85%,其群間方差為0.5%。要求用95.45%的概率估計(jì)該廠24小時(shí)化肥產(chǎn)量每袋平均重量和一等品率的范圍。第一步,根據(jù)已知條件,確定和。第二步,進(jìn)行抽樣平均數(shù)的推斷。即(48.47-50.53),也就是說(shuō),以95.45%的概率保證程度估計(jì),該廠化肥的平均每袋重量在48.47千克到50.53千克之間??芍赫撼闃雍皖愋统闃与m然都要對(duì)總體各單位進(jìn)行分組,但對(duì)分組所起的作用則是完全不同的。類型抽樣分組的作用在于盡量擴(kuò)大組間的差異程度,達(dá)到縮小組內(nèi)方差提高抽樣效果的目的。而整群抽樣分組的作用在于盡量擴(kuò)大群內(nèi)的差異程度,從而達(dá)到縮小群間方差提高抽樣效果的目的第三步,進(jìn)行抽樣成數(shù)的推斷。即以95.45%的概率保證程度估計(jì),一等品率在80.49%-89.51%范圍內(nèi)。五、多階段抽樣當(dāng)總體單位很多、分布廣泛,又幾乎不可能從總體中直接抽取總體單位時(shí),常采用多階段抽樣。如果將總體進(jìn)行多層次分組,然后依次在各層中隨機(jī)抽組,直到抽取總體單位,稱為多階段抽樣。如我國(guó)農(nóng)產(chǎn)品產(chǎn)量調(diào)查就是采用多階段抽樣調(diào)查,第一階段從省抽縣,第二階段從中選縣抽鄉(xiāng),第三階段從中選鄉(xiāng)抽村,再?gòu)闹羞x的村中抽地塊,最后從中選的地塊中抽具體的樣本單位,并以樣本單位測(cè)得的實(shí)際資料來(lái)推算平均畝產(chǎn)和總產(chǎn)。優(yōu)點(diǎn):第一,便于組織抽樣,它可以按現(xiàn)有的行政區(qū)劃或地理區(qū)域分各階段的抽樣單元,從而簡(jiǎn)化抽樣框的編制。第二,可以獲得各階段單元的調(diào)查資料,根據(jù)最初級(jí)資料可進(jìn)行逐級(jí)抽樣推斷,得到各級(jí)的調(diào)查資料。第三,多階段抽樣的方式比較靈活,各階段抽樣的組織方式應(yīng)以前述四種為依據(jù)進(jìn)行選擇。在多階段抽樣中,每個(gè)階段都存在抽樣誤差。為提高樣本的代表性,還應(yīng)根據(jù)各階段的不同特點(diǎn),注意樣本單位的均勻分布,采用不同的抽樣比。如方差大的階段,抽樣比大一些,方差小的階段,抽樣比小一些。而且多階段抽樣在簡(jiǎn)化抽樣工作的同時(shí),又因抽樣單位的分布較廣,而具有較強(qiáng)的代表性。案例導(dǎo)入案例一:時(shí)下不少大學(xué)生在一邊學(xué)習(xí)的同時(shí)也不斷尋找一些機(jī)會(huì)打些零工以賺點(diǎn)錢彌補(bǔ)學(xué)習(xí)和生活之需,這已經(jīng)是學(xué)生們之間人所共知的事情。這沒有絲毫的讓人好奇之處,讓人好奇的是這些打工的學(xué)生究竟一個(gè)月平均能賺多少錢?假設(shè)有人說(shuō):這個(gè)數(shù)據(jù)是500元,你覺得信不信它呢?當(dāng)然,你首先需要收集證據(jù),沒有證據(jù)是肯定說(shuō)明不了任何問題的。又假設(shè)有人通過組織調(diào)查取得過如下數(shù)據(jù)(調(diào)查到一共30人,單位:元):假設(shè)檢驗(yàn)350500900100100200240300100320450260650380290400800400250400290870540320140160300400500340

這時(shí)你該做何結(jié)論?就算是你得到以上數(shù)據(jù)的平均數(shù)等于423元,你是否就可以作出“是”或“不是”的回答?因?yàn)槟阋鞒龅幕卮鹗轻槍?duì)整個(gè)總體的,根據(jù)卻又只是來(lái)自部分總體——即樣本,所以事實(shí)上不論你最終作出的是“是”還是“不是”的回答其實(shí)都存在犯錯(cuò)誤的可能。

那么,如何以樣本數(shù)據(jù)去對(duì)總體參數(shù)下結(jié)論才最科學(xué)最不容易犯錯(cuò)誤呢?這就是一個(gè)屬于單個(gè)總體參數(shù)假設(shè)檢驗(yàn)的問題了。案例二:你可能認(rèn)為每一個(gè)美國(guó)人都知道像這樣一些簡(jiǎn)單歷史問題的答案“在美國(guó)國(guó)旗上有多少顆星?有多少條條紋?星代表什么?條紋又代表什么?”。非常有意思的是,并非每一個(gè)人都知道問題的答案,而且當(dāng)你知道問題的答案時(shí),你也許會(huì)大吃一驚的。

1998年美國(guó)雜志《Today’sAmerica》就確實(shí)做過這么一個(gè)調(diào)查,所得到的數(shù)據(jù)肯定多多少少會(huì)出乎很多人的意料之外。下面就是按性別和美國(guó)地區(qū)列出的知道星的數(shù)目的成年人的百分比:

男士女士大城市小城鎮(zhèn)農(nóng)村

知道7272575631不知道2234251615

在紐約的伊利縣里200個(gè)成人被問及在美國(guó)國(guó)旗上有多少顆星。上面的表現(xiàn)是屬于每一類的成人的數(shù)目。樣本的結(jié)果被計(jì)算兩次,一次按性別算,另一次按回答問題的成人的住所算。正確地回答問題的男士的百分比與女士的百分比之間有顯著差別嗎?大城市的成年人的百分比與小城鎮(zhèn)的成年人的百分比之間有顯著差別嗎?小城鎮(zhèn)的百分比與農(nóng)村的百分比之間有顯著差別嗎?這樣的問題屬于兩個(gè)總體參數(shù)假設(shè)檢驗(yàn)問題。假設(shè)檢驗(yàn)的過程

提出假設(shè)→抽取樣本→作出決策總體抽取隨機(jī)樣本均值

為78我認(rèn)為人口的平均年齡是80歲提出假設(shè)

拒絕假設(shè)!

別無(wú)選擇.作出決策第五節(jié)假設(shè)檢驗(yàn)假設(shè)檢驗(yàn),就是事先對(duì)總體參數(shù)或總體分布做出一個(gè)假設(shè),然后利用樣本信息來(lái)判斷假設(shè)是否成立,即判斷樣本信息與假設(shè)是否有顯著差異,從而決定應(yīng)接受或拒絕原假設(shè)。假設(shè)檢驗(yàn)可分為兩類,一是參數(shù)假設(shè)檢驗(yàn);二是非參數(shù)檢驗(yàn)或自由分布檢驗(yàn),主要是總體分布形式的假設(shè)檢驗(yàn)。一、假設(shè)檢驗(yàn)一般問題1.假設(shè)檢驗(yàn)的基本思想假設(shè)檢驗(yàn)是對(duì)總體參數(shù)先做出假設(shè),然后抽取樣本,利用樣本提供的信息對(duì)假設(shè)的正確性進(jìn)行判斷的過程。假設(shè)檢驗(yàn)的思想頗為似類于司法程序中的“憑證定罪、疑罪從無(wú)”的做法,需要檢驗(yàn)的假設(shè)往往是那些檢驗(yàn)前被默認(rèn)為正確的、除非具有充分證據(jù)否則不希望甚至不允許隨便推翻的結(jié)論性語(yǔ)言。顯著性水平之所以設(shè)得比較小,是為了一旦能夠推翻就肯定有足夠證據(jù);但不能推翻卻未必說(shuō)明原假設(shè)(零假設(shè))成立。

正因?yàn)榇?,我們說(shuō):假設(shè)檢驗(yàn)有個(gè)顯著特點(diǎn),即“信心滿懷地拒絕,含含糊糊地接受”。參數(shù)估計(jì)與假設(shè)檢驗(yàn)兩種方法間雖有一定相似性,但本質(zhì)性區(qū)別是:前者對(duì)總體一無(wú)所知,是求知一事物;后者則有所了解,是求證一事物。2.假設(shè)檢驗(yàn)的步驟(1)提出原假設(shè)和備擇假設(shè)每個(gè)假設(shè)檢驗(yàn)問題,一般可同時(shí)提出兩個(gè)完全相反的假設(shè):原假設(shè)和備擇假設(shè)。原假設(shè)又稱零假設(shè),是待檢驗(yàn)的假設(shè),記為;備擇假設(shè)是拒絕原假設(shè)后可供選擇的假設(shè),記為。原假設(shè)和備擇假設(shè)是相互對(duì)立的,檢驗(yàn)結(jié)果二者必取其一。原假設(shè)和備擇假設(shè)應(yīng)根據(jù)所檢驗(yàn)問題的具體背景而定。常常是采取“不輕易拒絕原假設(shè)”的原則,即把沒有充分理由不能輕易否定的命題作為原假設(shè),而相應(yīng)地把沒有足夠把握就不能輕易肯定的命題作為備擇假設(shè)。一般地,假設(shè)有三種形式::;:,這種形式的假設(shè)檢驗(yàn)稱為雙側(cè)檢驗(yàn)采用哪種假設(shè),要根據(jù)所研究的實(shí)際問題而定。如果對(duì)所研究問題只需判斷有無(wú)顯著差異或要求同時(shí)注意總體參數(shù)偏大或偏小的情況,則采用雙側(cè)檢驗(yàn);如果所關(guān)心的是總體參數(shù)是否比某個(gè)值偏大(或偏?。?,則宜采用單側(cè)檢驗(yàn)。(2)選擇適當(dāng)?shù)慕y(tǒng)計(jì)量,并確定其分布形式在參數(shù)的假設(shè)檢驗(yàn)中,如同在參數(shù)估計(jì)中一樣,要借助于樣本統(tǒng)計(jì)量進(jìn)行統(tǒng)計(jì)推斷。用于假設(shè)檢驗(yàn)問題的統(tǒng)計(jì)量稱為檢驗(yàn)統(tǒng)計(jì)量。在具體問題里,選擇什么統(tǒng)計(jì)量作為檢驗(yàn)統(tǒng)計(jì)量,需要考慮的因素與參數(shù)估計(jì)相同。例如,用于進(jìn)行檢驗(yàn)的樣本是大樣本還是小樣本,總體方差已知還是未知等,在不同的條件下應(yīng)選擇不同的檢驗(yàn)統(tǒng)計(jì)量。(3)選擇顯著性水平,確定臨界值顯著性水平表示為真時(shí)拒絕的概率。把否定真實(shí)的原假設(shè)的行動(dòng)稱為第Ⅰ類錯(cuò)誤或棄真錯(cuò)誤;把接受不真實(shí)的原假設(shè)的行動(dòng)稱為第Ⅱ類錯(cuò)誤或納偽錯(cuò)誤(或取偽錯(cuò)誤)。在假設(shè)檢驗(yàn)中,把犯第Ⅰ類錯(cuò)誤的概率記為α,把犯第Ⅱ類錯(cuò)誤的概率記為β。α越大,就越有可能犯第Ⅰ類錯(cuò)誤,即越有可能否定真實(shí)的原假設(shè)。β越大,就越有可能犯第Ⅱ類錯(cuò)誤,即越有可能接受不真實(shí)的原假設(shè)。兩類錯(cuò)誤不可避免,是此銷彼長(zhǎng)的關(guān)系,要同時(shí)減少犯兩類錯(cuò)誤的概率,只能增加樣本容量。和的關(guān)系你不能同時(shí)減少兩類錯(cuò)誤!和的關(guān)系就像翹翹板,小就大,大就小H0:無(wú)罪假設(shè)檢驗(yàn)中的兩類錯(cuò)誤(決策結(jié)果)陪審團(tuán)審判裁決實(shí)際情況無(wú)罪有罪無(wú)罪正確錯(cuò)誤有罪錯(cuò)誤正確H0檢驗(yàn)決策實(shí)際情況H0為真H0為假接受H01-a第二類錯(cuò)誤(b)拒絕H0第一類錯(cuò)誤(a)功效(1-b)假設(shè)檢驗(yàn)就好像一場(chǎng)審判過程假設(shè)檢驗(yàn)過程顯著性水平,也就是決策中所面臨的風(fēng)險(xiǎn)。顯著性水平是指當(dāng)原假設(shè)為正確時(shí)人們卻把它拒絕了的概率或風(fēng)險(xiǎn)。這個(gè)概率是由人們確定的,通常取=0.05或=0.01,這表明當(dāng)做出接受原假設(shè)的決定時(shí),其正確的可能性(概率)為95%或99%。假設(shè)檢驗(yàn)應(yīng)用小概率事件實(shí)際極少發(fā)生的原理,這里的小概率就是指顯著性水平。給定了顯著性水平,就可由有關(guān)的概率分布表查得臨界值,從而確定的接受區(qū)域和拒絕區(qū)域,臨界值就是接受區(qū)域和拒絕區(qū)域的分界點(diǎn)。對(duì)于不同形式的假設(shè),的接受區(qū)域和拒絕區(qū)域也有所不同。雙側(cè)檢驗(yàn)的拒絕區(qū)域位于統(tǒng)計(jì)量分布曲線的兩側(cè)。(4)做出結(jié)論根據(jù)樣本資料計(jì)算出檢驗(yàn)統(tǒng)計(jì)量的具體值,并用以與臨界值比較,做出接受或拒絕原假設(shè)的結(jié)論。如果檢驗(yàn)統(tǒng)計(jì)量的值落在拒絕區(qū)域內(nèi),說(shuō)明樣本所描述的情況與原假設(shè)有顯著性差異,應(yīng)拒絕原假設(shè);反之,則接受原假設(shè)。假設(shè)檢驗(yàn)中的小概率原理什么是小概率?1.在一次試驗(yàn)中,一個(gè)幾乎不可能發(fā)生的事件發(fā)生的概率2.在一次試驗(yàn)中小概率事件一旦發(fā)生,我們就有理由拒絕原假設(shè)3.小概率由研究者事先確定雙側(cè)檢驗(yàn)與單側(cè)檢驗(yàn)

(假設(shè)的形式)假設(shè)研究的問題雙側(cè)檢驗(yàn)左側(cè)檢驗(yàn)右側(cè)檢驗(yàn)H0m=m0m

m0m

m0H1m≠m0m<m0m>m0假設(shè)檢驗(yàn)的流程提出假設(shè)確定適當(dāng)?shù)臋z驗(yàn)統(tǒng)計(jì)量規(guī)定顯著性水平計(jì)算檢驗(yàn)統(tǒng)計(jì)量的值作出統(tǒng)計(jì)決策什么是檢驗(yàn)統(tǒng)計(jì)量?1.用于假設(shè)檢驗(yàn)決策的統(tǒng)計(jì)量2.選擇統(tǒng)計(jì)量的方法與參數(shù)估計(jì)相同,需考慮是大樣本還是小樣本總體方差已知還是未知3.檢驗(yàn)統(tǒng)計(jì)量的基本形式為確定適當(dāng)?shù)臋z驗(yàn)統(tǒng)計(jì)量作出統(tǒng)計(jì)決策計(jì)算檢驗(yàn)的統(tǒng)計(jì)量根據(jù)給定的顯著性水平,查表得出相應(yīng)的臨界值,如:z/2將檢驗(yàn)統(tǒng)計(jì)量的值與臨界值進(jìn)行比較得出拒絕或不拒絕原假設(shè)的結(jié)論雙側(cè)檢驗(yàn)

(原假設(shè)與備擇假設(shè)的確定)例如,某種零件的尺寸,要求其平均長(zhǎng)度為10cm,大于或小于10cm均屬于不合格我們想要證明(檢驗(yàn))大于或小于這兩種可能性中的任何一種是否成立建立的原假設(shè)與備擇假設(shè)應(yīng)為

H0:

=10H1:

10雙側(cè)檢驗(yàn)

(顯著性水平與拒絕域)抽樣分布H0值臨界值臨界值a/2a/2

樣本統(tǒng)計(jì)量拒絕域拒絕域1-置信度一個(gè)總體參數(shù)的檢驗(yàn)Z檢驗(yàn)(單尾和雙尾)

t檢驗(yàn)(單尾和雙尾)Z檢驗(yàn)(單尾和雙尾)

2檢驗(yàn)(單尾和雙尾)均值一個(gè)總體成數(shù)方差總體均值的檢驗(yàn)

(2

已知或2未知大樣本)1. 假定條件總體服從正態(tài)分布若不服從正態(tài)分布,可用正態(tài)分布來(lái)近似(n30)使用Z-統(tǒng)計(jì)量2

已知:2

未知:2

已知均值的檢驗(yàn)?zāi)硻C(jī)床廠加工一種零件,根據(jù)經(jīng)驗(yàn)知道,該廠加工零件的橢圓度近似服從正態(tài)分布,其總體均值為0=0.081mm,總體標(biāo)準(zhǔn)差為=0.025。今換一種新機(jī)床進(jìn)行加工,抽取n=200個(gè)零件進(jìn)行檢驗(yàn),得到的橢圓度為0.076mm。試問新機(jī)床加工零件的橢圓度的均值與以前有無(wú)顯著差異?(=0.05)雙側(cè)檢驗(yàn)2

已知均值的檢驗(yàn)H0:=0.081H1:

0.081=0.05n=200臨界值(s):檢驗(yàn)統(tǒng)計(jì)量:Z01.96-1.96.025拒絕H0拒絕H0.025決策:結(jié)論:

=0.05的水平上拒絕H0有證據(jù)表明新機(jī)床加工的零件的橢圓度與以前有顯著差異一個(gè)總體成數(shù)檢驗(yàn)假定條件有兩類結(jié)果總體服從二項(xiàng)分布可用正態(tài)分布來(lái)近似成數(shù)檢驗(yàn)的Z統(tǒng)計(jì)量p0為假設(shè)的總體成數(shù)一個(gè)總體成數(shù)的檢驗(yàn)一項(xiàng)統(tǒng)計(jì)結(jié)果聲稱,某市老年人口(年齡在65歲以上)的比重為14.7%,該市老年人口研究會(huì)為了檢驗(yàn)該項(xiàng)統(tǒng)計(jì)是否可靠,隨機(jī)抽選了400名居民,發(fā)現(xiàn)其中有57人年齡在65歲以上。調(diào)查結(jié)果是否支持該市老年人口比重為14.7%的看法?(=0.05)雙側(cè)檢驗(yàn)一個(gè)總體成數(shù)的檢驗(yàn)H0:p=14.7%H1:p

14.7%=0.05n=400臨界值(s):檢驗(yàn)統(tǒng)計(jì)量:在

=0.05的水平上接受H0該市老年人口比重為14.7%決策:結(jié)論:Z01.96-1.96.025拒絕H0拒絕H0.025假設(shè)檢驗(yàn)中的其他問題用置信區(qū)間進(jìn)行檢驗(yàn)利用P-值進(jìn)行檢驗(yàn)(第14講)考場(chǎng)作文開拓文路能力?分解層次(網(wǎng)友來(lái)稿)江蘇省鎮(zhèn)江中學(xué)陳乃香說(shuō)明:本系列稿共24講,20XX年1月6日開始在資源上連載【要義解說(shuō)】文章主旨確立以后,就應(yīng)該恰當(dāng)?shù)胤纸鈱哟?,使幾個(gè)層次構(gòu)成一個(gè)有機(jī)的整體,形成一篇完整的文章。如何分解層次主要取決于表現(xiàn)主旨的需要?!静呗越庾x】一般說(shuō)來(lái),記人敘事的文章常按時(shí)間順序分解層次,寫景狀物的文章常按時(shí)間順序、空間順序分解層次;說(shuō)明文根據(jù)說(shuō)明對(duì)象的特點(diǎn),可按時(shí)間順序、空間順序或邏輯順序分解層次;議論文主要根據(jù)“提出問題-—分析問題——解決問題”順序來(lái)分解層次。當(dāng)然,分解層次不是一層不變的固定模式,而應(yīng)該富于變化。文章的層次,也常常有些外在的形式:1.小標(biāo)題式。即圍繞話題把一篇文章劃分為幾個(gè)相對(duì)獨(dú)立的部分,再給它們加上一個(gè)簡(jiǎn)潔、恰當(dāng)?shù)男?biāo)題。如《世界改變了模樣》四個(gè)小標(biāo)題:壽命

溫馨提示

  • 1. 本站所有資源如無(wú)特殊說(shuō)明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請(qǐng)下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請(qǐng)聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁(yè)內(nèi)容里面會(huì)有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫(kù)網(wǎng)僅提供信息存儲(chǔ)空間,僅對(duì)用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對(duì)用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對(duì)任何下載內(nèi)容負(fù)責(zé)。
  • 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請(qǐng)與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶因使用這些下載資源對(duì)自己和他人造成任何形式的傷害或損失。

最新文檔

評(píng)論

0/150

提交評(píng)論