統(tǒng)計技術(shù)應用課件第七章 抽樣調(diào)查_第1頁
統(tǒng)計技術(shù)應用課件第七章 抽樣調(diào)查_第2頁
統(tǒng)計技術(shù)應用課件第七章 抽樣調(diào)查_第3頁
統(tǒng)計技術(shù)應用課件第七章 抽樣調(diào)查_第4頁
統(tǒng)計技術(shù)應用課件第七章 抽樣調(diào)查_第5頁
已閱讀5頁,還剩199頁未讀, 繼續(xù)免費閱讀

下載本文檔

版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進行舉報或認領

文檔簡介

第七章抽樣調(diào)查學習目標(一)知識目標1.了解抽樣調(diào)查的特點與應用范圍;2.了解抽樣調(diào)查的基本概念;3.了解抽樣誤差的概念;4.了解抽樣推斷的理論基礎;5.了解抽樣誤差的概念;6.了解抽樣平均誤差的意義及其影響因素;7.了解抽樣極限誤差、可信度和概率度;8.了解總體參數(shù)的點估計和區(qū)間估計;9.了解抽樣組織方式。(二)技能目標1.能夠計算抽樣平均誤差;2.能夠掌握區(qū)間估計的總體平均數(shù)的估計和總體成數(shù)的估計方法;3.能夠根據(jù)置信度的要求,估計總體指標出現(xiàn)的可能范圍。引導案例2012年2月,針對以螺旋藻為原料的保健食品存在重金屬超標隱患,國家食品藥品監(jiān)督管理局組織中國食品藥品檢定研究院、北京市藥品檢驗所等7家檢驗機構(gòu)對市場上部分以螺旋藻為原料保健食品開展了鉛、砷、汞重金屬專項監(jiān)測。根據(jù)市場產(chǎn)品抽樣和媒體報道情況,國家食品藥品監(jiān)督管理局于2月29日布置對可疑產(chǎn)品開展專項監(jiān)督檢查。2012年3月30日,國家食品藥品監(jiān)督管理局公布以螺旋藻為原料保健食品重金屬專項監(jiān)督檢查結(jié)果。結(jié)果顯示,3個產(chǎn)品為假冒保健食品;1個產(chǎn)品的某批次產(chǎn)品鉛、砷超過限量標準;其他9個產(chǎn)品鉛含量在本次監(jiān)督檢查中結(jié)果均未超過國家限量標準。對于假冒和超過限量標準的產(chǎn)品,國家食品藥品監(jiān)督管理局責成相關食品藥品監(jiān)督管理部門依法嚴肅處理,要求加強螺旋藻為原料的保健食品監(jiān)督檢查,保障消費者食用安全。問題:從抽樣調(diào)查的結(jié)果來看,可以估計以螺旋藻為原料的保健食品的合格率是多少?第一節(jié)抽樣調(diào)查的一般問題統(tǒng)計工作的目的是獲得和研究關于總體的數(shù)量特征,采用的基本方法是大量觀察法,對總體的精確數(shù)量認識需要對總體進行全面調(diào)查,當總體較大或總體的外延不是很明確時,采用全面調(diào)查的方法既不靈活也造成很大浪費,例如在對玻璃器皿做耐溫檢測時常常會把產(chǎn)品破壞,為了進行全面的統(tǒng)計而把產(chǎn)品全部破壞顯然是不可取的。因此,人們更多的是采用抽樣調(diào)查的方法,根據(jù)部分總體單位構(gòu)成的小總體的統(tǒng)計指標推測全及總體(即大總體)的統(tǒng)計指標。如要判斷一張照片是1200萬像素還是200萬像素,用肉眼是不容易看出來的。放到電腦上來將照片的某部分放大,當放大到一定倍數(shù)時,若很快出現(xiàn)馬賽克可以判斷是200萬像素,若還是很精細可以判斷是1200萬像素的。抽樣調(diào)查的思想方法與此相同,在總體中按隨機的原則抽取一部分(拿來放大的那部分照片)作為樣本,樣本的數(shù)量特征(照片的像素)與總體的數(shù)量特征(照片的像素)就有相近之處,可以用樣本的數(shù)量特征來說明總體的數(shù)量特征。一、抽樣調(diào)查的特點與應用范圍抽樣調(diào)查又稱抽樣推斷或抽樣估計,是根據(jù)隨機的原則在總體中抽取一部分總體單位進行調(diào)查登記,進而利用這部分總體單位的數(shù)據(jù)(小總體的指標)對總體的有關數(shù)量特征在一定概率保證下作出推斷的一種統(tǒng)計方法。(一)抽樣調(diào)查的特點1.只抽取總體中一部分單位進行調(diào)查,是專門組織的一次性非全面調(diào)查。2.抽取部分單位要遵循隨機原則,使樣本單位均有被抽中的機會。這個特點是與其它非全面調(diào)查如重點調(diào)查、典型調(diào)查的主要區(qū)別之一。重點調(diào)查和典型調(diào)查的調(diào)查單位的選取受到調(diào)查者主觀意識的影響,抽樣調(diào)查的調(diào)查單位選取不受調(diào)查者主觀意志的影響。當抽取足夠多的單位時,樣本就能夠反映出總體的數(shù)量特征。遵守隨機原則還能計算抽樣誤差,并把它控制在一定范圍之內(nèi)。3.以樣本指標的數(shù)值去推斷和估計總體指標的數(shù)值。因此,抽樣調(diào)查又叫抽樣推斷。例如對幾只燈泡進行壽命試驗來判斷整批燈泡的壽命。這個特點是抽樣調(diào)查與其他非全面調(diào)查的又一區(qū)別。重點調(diào)查和典型調(diào)查都是非全面調(diào)查,但是其結(jié)果不能作為總體指標的代表;抽樣調(diào)查之所以能夠去推斷和估計總體指標的數(shù)值,隨機原則起到了關鍵的作用。抽樣調(diào)查和全面調(diào)查的目的一致,都是為了達到對總體數(shù)量的認識,但是達到目的的手段和途徑完全不同。抽樣調(diào)查是通過科學的推斷達到目的,可以節(jié)省時間、人力、物力和財力。4.抽樣調(diào)查產(chǎn)生的誤差,可以計算并可采取措施控制在一定范圍之內(nèi),從而使抽樣調(diào)查具有一定的可靠性。典型調(diào)查和重點調(diào)查也能用部分調(diào)查單位的指標數(shù)值去估計總體指標數(shù)值,但是這種估計不能計算誤差,也不能說明估計的準確程度和可靠程度。(二)抽樣調(diào)查的應用范圍抽樣調(diào)查適用的范圍很廣泛,在許多場合都可以運用抽樣調(diào)查方法取得大量社會經(jīng)濟現(xiàn)象的數(shù)量方面的統(tǒng)計資料,特別是在某些特殊場合不可能用全面調(diào)查時必須采用抽樣調(diào)查。1.用于單位數(shù)特別多或無限多的總體。如工農(nóng)業(yè)產(chǎn)品連續(xù)性生產(chǎn)過程中的成品率調(diào)查,大氣中某些污染情況調(diào)查等。2.對于產(chǎn)品造成破壞或損傷的檢驗調(diào)查方法。如電燈泡、茶葉、煙草等產(chǎn)品進行質(zhì)量檢驗都是有破壞性的,不可能進行全面調(diào)查,只能使用抽樣調(diào)查。3.用于不必要進行全面調(diào)查的現(xiàn)象。如水庫中的魚數(shù)、森林中的木材積蓄量、居民購買力調(diào)查等。如果進行全面調(diào)查,要消耗很大的人力物力,成本太高。4.時間緊迫、經(jīng)費有限時可采用抽樣調(diào)查。抽樣調(diào)查的調(diào)查單位比全面調(diào)查要少得多,因而既能節(jié)約人力、費用和時間,又能比較快地得到調(diào)查結(jié)果。例如,農(nóng)產(chǎn)品產(chǎn)量全面調(diào)查的統(tǒng)計數(shù)字要等收割完畢以后一段時間才能得到,而抽樣調(diào)查的統(tǒng)計數(shù)字在收獲的同時就可以得到,一般能比全面調(diào)查早得到兩個月左右,這對于農(nóng)產(chǎn)品的生產(chǎn)經(jīng)營是很有利的。5.對普查數(shù)據(jù)校驗時可采用抽樣調(diào)查。在全面調(diào)查后,對某些數(shù)據(jù)進行修正,可采用抽樣復查。人口普查之后,每年組織1%的人口抽樣復查,對人口普查資料進行核查和修正。如我國第五次人口普查時使用長表和短表兩種調(diào)查表,短表調(diào)查項目少,人人都要登記,長表在短表的基礎上增加了很多項目,只供全國一小部分人口登記。這實際上就是在普查的同時進行抽樣調(diào)查。6.檢驗新產(chǎn)品或新技術(shù)的使用效果時可采用抽樣調(diào)查。利用抽樣推斷的方法,可以對于某種總體的假設進行檢驗和比對判斷,來判斷這種假設的真?zhèn)危詻Q定取舍。例如,新教學法的采用、新技術(shù)的利用、新醫(yī)療方法的使用等是否收到明顯效果,須對未知的或不完全知道的總體作出一些假設,然后利用抽樣調(diào)查的方法,根據(jù)實驗材料對所作的假設進行檢驗,從而作出判斷。二、抽樣調(diào)查的基本概念(一)全及總體和抽樣總體1.總體總體也稱全及(統(tǒng)計)總體,指所要研究對象的全體,它是由所研究范圍內(nèi)具有某種共同性質(zhì)的全體單位所組成的集合體。總體按各單位標志性質(zhì)不同,可分為變量總體和屬性總體兩類。若被研究的標志是數(shù)量標志,則稱這個總體為變量總體。抽樣調(diào)查可以研究變量總體的各種指標,如均值和標準差。屬性總體又稱品質(zhì)標志總體,抽樣推斷中僅研究品質(zhì)標志中的特例交替標志,交替標志作為總體的指標,表現(xiàn)為成數(shù),如合格率、滿意度等。全及總體的單位數(shù)一般用來表示,總體的單位數(shù)通常都是很大的。弄清楚了全及總體,不僅可以明確抽樣推斷所要研究對象的范圍,而且也便于確定抽樣框(樣本框)。對于某一具體問題來說,作為抽樣推斷對象的總體是唯一確定的。2.樣本樣本又稱樣本總體,是全及總體中部分總體單位構(gòu)成的小總體,它是從全及總體中抽取出來的一部分單位所組成的集合體。(1)樣本的容量樣本的容量一般用表示,是指一個樣本中所包含的單位數(shù)。一般來說,樣本單位數(shù)超過30的樣本稱為大樣本,不超過30的稱為小樣本。社會經(jīng)濟現(xiàn)象的抽樣調(diào)查多取大樣本,而自然實驗觀察多取小樣本。(2)樣本個數(shù)樣本個數(shù)又稱為樣本可能數(shù)目,用來表示,它是指從一個總體中可能抽取的樣本的總數(shù)量。如果樣本個數(shù)是1,那么樣本總體就是全及總體;當樣本個數(shù)大于1時,抽取的樣本有多種組合。但在實際工作中,只能抽取一個樣本進行統(tǒng)計推斷,而不可能獲得全部可能的樣本,所以并不常用。(二)全及指標和抽樣指標1.全及指標全及指標也叫總體指標或總體參數(shù),它是根據(jù)全及總體各單位標志值或標志屬性計算的、反映總體某種屬性的綜合指標。由于全及總體是唯一確定的,根據(jù)全及總體計算的全及指標也是唯一確定的,所以稱為參數(shù)。不同性質(zhì)的總體需要計算不同的全及指標。對于總體中的數(shù)量標志,常用的總體參數(shù)有總體平均數(shù)、總體標準差和總體方差,有以下公式:總體平均數(shù):總體方差:總體標準差:對于交替標志屬性總體,由于各單位標志不能用數(shù)量來表示,只能用兩種標志表現(xiàn)文字來加以描述,所以應計算結(jié)構(gòu)相對指標,稱為總體成數(shù)??傮w成數(shù)常以大寫英文字母來表示總體中具有某種性質(zhì)的單位數(shù)在總體全部單位數(shù)中所占的比重,以表示總體中不具有某種性質(zhì)的單位數(shù)在總體中所占的比重。設總體個單位中,有個單位具有某種性質(zhì),個單位不具有某種性質(zhì),,則總體成數(shù)為:交替標志在總體中的方差為:成數(shù)是交替標志作為總體中的變量的平均數(shù)。2.樣本統(tǒng)計量(抽樣樣本指標)根據(jù)樣本各單位標志值計算的、反映樣本屬性的指標稱為樣本統(tǒng)計量。和全及指標相對應的有樣本均值、抽樣成數(shù)統(tǒng)計量、樣本標準差統(tǒng)計量和樣本方差統(tǒng)計量等。和用小寫英文字母表示,以便和全及指標相區(qū)別。假設有一樣本,其各單位的取值分別為,,…,,則有以下公式:樣本均值統(tǒng)計量:樣本方差統(tǒng)計量:修正樣本方差統(tǒng)計量:樣本的指標稱為統(tǒng)計量,是由于樣本的個數(shù)不唯一,取到不同的樣本,樣本統(tǒng)計量的數(shù)值會不同,可以把統(tǒng)計量看作是隨機抽取樣本構(gòu)成的總體上的一個隨機變量,作為隨機變量的統(tǒng)計量是參數(shù)估計的基礎,可用統(tǒng)計量的數(shù)值作為總體參數(shù)的估計值,基于此這里給出了修正的樣本方差統(tǒng)計量。在屬性總體中,一個樣本容量為的一個樣本,設個單位中有單位具有某種屬性,個單位不具有某種屬性,,為樣本中具有某種屬性的單位數(shù)所占的比重,表示不具有某種屬性的單位數(shù)所占的比重,則抽樣(樣本)成數(shù)統(tǒng)計量為:樣本交替標志標準差統(tǒng)計量為:統(tǒng)計量是所有樣本構(gòu)成的總體上的(隨機)變量。(三)抽樣方法在總體中取出總體單位的順序不同,構(gòu)成了不同的抽樣方法。抽樣方法可分為重復抽樣和不重復抽樣。抽樣方法的不同會影響所有樣本所構(gòu)成的總體的總體單位數(shù)(即會影響統(tǒng)計量的定義域),進而會影響抽樣誤差。1.重復抽樣重復抽樣也稱為回置抽樣,與抽取總體單位的順序無關。是從總體個單位中隨機抽取一個容量為的樣本,每次隨機抽取一個總體單位,記錄該單位有關標志表現(xiàn)后,把它放回到全及總體中參加下一次抽選,照此下去直到抽選第個樣本單位。每次抽取總體單位是在完全相同的條件下進行的,每個總體單位被選中的機會完全相等。從總體個單位中,用重復抽樣的方法,隨機抽取個單位構(gòu)成一個樣本,則共可抽取個樣本,即樣本所構(gòu)成的總體單位數(shù)為?!纠?-1】總體有A、B、C、D四個單位,要從中以重復抽樣的方法抽取2個單位構(gòu)成樣本。先從4個單位中抽取1個,共有4種抽取方法,結(jié)果登記后再放回。然后再從相同的4個單位中抽取1個,也有4種抽取方法。這樣取2個單位構(gòu)成一個樣本,其全部可能抽取的樣本數(shù)目為個,它們是:AA,AB,AC,AD,BA,BB,BC,BD,CA,CB,CC,CD,DA,DB,DC,DD。因此重復抽樣具有以下特點:每取一個樣本可以看作是一次隨機試驗,每次的試驗結(jié)果是獨立的,每次試驗是在相同條件下進行的,每個單位在每次試驗中被選中的概率是相同的。2.不重復抽樣不重復抽樣又稱為無回置抽樣。抽取的總體單位跟順序有關,是指從全及總體抽取樣本時,隨機抽取一個樣本單位,記錄該單位有關標志表現(xiàn)后,這個樣本單位不再放回全及總體參加下一次抽選。然后從總體剩下的個單位中隨機抽取第二個樣本單位,記錄它的有關標志表現(xiàn)后,該單位也不放回全及總體中去,再從總體剩下的個單位中抽取第三個樣本單位,照此下去直到抽選出第個樣本單位。在不重復抽樣中,其樣本可能的數(shù)目為即樣本構(gòu)成的總體中的總體單位數(shù)為【例7-2】從A、B、C、D這4個球中抽2個球,采用不重復抽樣的方法,共有12種可能:AB,AC,AD,BA,BC,BD,CA,CB,CD,DA,DB,DC。概率理論已經(jīng)證明在不重復抽樣中,每次抽取一個樣本,每個總體單位被抽中的概率是一致的。三、抽樣推斷的理論基礎社會現(xiàn)象和自然現(xiàn)象可以分為兩大類,一類現(xiàn)象是發(fā)生的結(jié)果可以確定,稱之為必然現(xiàn)象。如在標準大氣壓下將水加熱到100℃水就會沸騰,企業(yè)的成本會隨著產(chǎn)出的增加在不斷地增加。另一類現(xiàn)象是發(fā)生的結(jié)果無法確定,稱之為隨機現(xiàn)象。如明天的天氣情況,擲一枚均勻硬幣出現(xiàn)的結(jié)果具有不確定性等。社會經(jīng)濟現(xiàn)象大多具有這種不確定性,概率論就是描述這種隨機現(xiàn)象數(shù)量特征的數(shù)學學科;在概率論中,將變量稱為隨機變量,與其他數(shù)學學科不同的是,概率統(tǒng)計中關注的是隨機變量取一定數(shù)值(范圍)的可能性(概率),稱之為隨機變量的分布。(一)隨機變量及其分布規(guī)律抽樣推斷是在概率論的基礎上進行的,概率論是研究隨機現(xiàn)象數(shù)量規(guī)律的的數(shù)學方法。描述隨機現(xiàn)象的函數(shù)稱為隨機變量,隨機變量取值在一定范圍內(nèi)的概率,即隨機變量的概率分布具有重要的意義。統(tǒng)計實踐表明,大多數(shù)的變量分布服從鐘形分布,規(guī)則的鐘形分布在概率中稱為正態(tài)分布,正態(tài)分布的分布函數(shù)具有很規(guī)則的特征。隨機變量具有兩個重要參數(shù)(即統(tǒng)計總體的指標):一個叫數(shù)學期望,記為,即的平均數(shù)(總體的平均指標);另一個是方差,記為,即變量的方差(總體標準差的平方)。對于服從正態(tài)分布的隨機變量,也記為。正態(tài)分布的數(shù)學規(guī)律如下:分布函數(shù):數(shù)學期望:方差:標準正態(tài)分布是數(shù)學期望為零,方差為1()的正態(tài)分布。一個服從正態(tài)分布的隨機變量,可以經(jīng)過變換轉(zhuǎn)化為服從標準正態(tài)分布的隨機變量,即標準正態(tài)分布具有很好的概率特征,如果已知一個變量服從標準的正態(tài)分布,那么這個變量取值在一定范圍內(nèi)的概率就是已知的,即:(二)大數(shù)定理與中心極限定理1.大數(shù)定理大數(shù)定理又稱大數(shù)法則。大數(shù)定理:獨立同分布的隨機變量,,…,,…設它們的平均數(shù)為,方差為。則對任意的正數(shù),有:,,…

該定理說明,當n充分大時,獨立同分布的一系列隨機變量,其平均數(shù)與它們共同的期望值之間的偏差,可以有很大的把握被控制在任意給定的范圍之內(nèi)。由于從總體中抽出的樣本是獨立且與總體同分布的,因此,當樣本容量n

充分大時,樣本平均值與總體平均值之間的誤差可以有很大的把握被控制在任意給定的要求之內(nèi),這就是人們用樣本平均估計總體平均的理論根據(jù)。由于成數(shù)指標是一個特殊的平均數(shù),大數(shù)定理對成數(shù)指標自然也成立:設m是n次試驗中事件A發(fā)生的次數(shù),p是事件A發(fā)生的概率,則對于任意小的正數(shù),有即當n充分大時,事件A發(fā)生的頻率接近(依概率收斂于)事件A發(fā)生的概率,反映了頻率在大量重復試驗過程中的穩(wěn)定性。該定理稱為貝努里大數(shù)定理,它提供了用頻率代替概率的理論根據(jù)。2.中心極限定理在客觀實際中,總體的分布各種各樣,不一定會服從正態(tài)分布。但由中心極限定理可知,只要總體滿足一定的條件,隨機變量的平均數(shù)(是總體的均值統(tǒng)計量)會近似于服從正態(tài)分布。(1)中心極限定理隨機變量,,…,相互獨立,且服從同一分布,該分布存在有限的期望和方差:,,(i=1,2,…)。當趨于無窮大時,個隨機變量的算術(shù)平均數(shù)近似服從正態(tài)分布,即:中心極限定理的含義是許多微小的隨機因素作用的結(jié)果,會以一種正態(tài)分布的形式反映出來。從上述定理可以得出結(jié)論,無論總體服從何種分布,只要它的期望值和方差存在,就可以通過增大樣本容量的方式,保證樣本平均數(shù)近似正態(tài)分布。也就是說,大樣本的平均數(shù)近似服從正態(tài)分布。(2)迪摩佛—拉普拉斯定理交替標志的分布稱為兩點分布,可以用投擲硬幣來模擬。在次投擲硬幣的實驗中,正面出現(xiàn)的次數(shù)的分布稱為二項分布,記為,總體中交替標志的均值即為總體的成數(shù)。迪摩佛—拉普拉斯定理是中心極限定理的特例,當總體較大時,樣本成數(shù)p近似服從正態(tài)分布

為總體的成數(shù)。迪摩佛—拉普拉斯定理為總體成數(shù)的抽樣推斷提供了理論依據(jù)。第二節(jié)抽樣誤差一、抽樣誤差的概念用抽樣樣本指標來估計全及指標是否可行,關鍵問題在于抽樣誤差。抽樣誤差是指由于隨機抽樣的偶然因素使樣本各單位的結(jié)構(gòu)不足以代表總體各單位的結(jié)構(gòu),而引起抽樣樣本指標和全及指標之間的絕對離差。如抽樣平均數(shù)與總體平均數(shù)的絕對離差、抽樣成數(shù)與總體成數(shù)的離差等。如某班50位同學中有30位男同學和20位女同學,現(xiàn)隨機抽取5個同學為樣本,由于隨機的原因未必都能抽到3個男同學和2個女同學,使得利用樣本計算的性別比例指標不能代表該班同學的性別比例指標,原因是樣本指標和總體指標之間存在絕對離差。二、統(tǒng)計調(diào)查誤差種類按產(chǎn)生的原因分,統(tǒng)計調(diào)查誤差可分為登記性誤差和代表性誤差。1.登記性誤差登記性誤差是指統(tǒng)計調(diào)查時,由于主觀原因在登記、匯總、計算、過錄中所產(chǎn)生的誤差。登記性誤差不論全面調(diào)查或非全面調(diào)查都可能產(chǎn)生。2.代表性誤差代表性誤差是由于樣本結(jié)構(gòu)與總體結(jié)構(gòu)不同,樣本不能完全代表總體而產(chǎn)生的樣本指標與總體指標之間的誤差。代表性誤差又可分為系統(tǒng)性誤差和隨機誤差兩種。系統(tǒng)性誤差又稱偏差,它是由于抽樣調(diào)查沒有遵循隨機原則而產(chǎn)生的誤差,即違反抽樣調(diào)查的隨機原則,有意地抽取較好或較差的單位進行調(diào)查,這種系統(tǒng)性原因造成的樣本不足所產(chǎn)生的誤差稱為系統(tǒng)性誤差,不能控制。隨機誤差又稱偶然的代表性誤差,它是指沒有登記性誤差的前提下,又遵循了隨機原則所產(chǎn)生的誤差。因為即使遵守了隨機原則,但由于偶然抽取的樣本結(jié)構(gòu)與總體的結(jié)構(gòu)發(fā)生偏差,就會出現(xiàn)或大或小的偶然的代表性誤差。隨機誤差是抽樣調(diào)查固有的誤差,可以控制。通常所說的抽樣誤差指的是隨機誤差。抽樣誤差包括抽樣實際誤差和抽樣平均誤差兩種。抽樣實際誤差是指某一樣本指標與被它估計的總體指標之間數(shù)值的差異,如、。對于確定的全及總體來說,總體指標數(shù)值是確定的值,由于樣本是按隨機原則抽選的,從同一總體抽取樣本容量相同的樣本可以有多種不同的抽取放法,每個樣本都有自己的樣本指標,因此抽樣實際誤差是一個隨機變量。作為抽樣實際誤差的隨機變量在總體(樣本構(gòu)成的)中的標準差稱為抽樣平均誤差,其統(tǒng)計意義是所有樣本的抽樣實際誤差的平均值。三、抽樣平均誤差的意義上面已經(jīng)講過,抽樣誤差是一個隨機變量,它的數(shù)值隨著可能抽取的樣本的不同而或大或小,為了總體衡量樣本代表性的高低,就需要計算抽樣誤差的一般水平。抽樣平均誤差就是反映抽樣誤差一般水平的指標。抽樣平均誤差是所有樣本與總體參數(shù)離差的平均數(shù),即指樣本統(tǒng)計量在由樣本所構(gòu)成的總體上的標準差。具體一個樣本抽樣的實際抽樣誤差是無法知道的(總體的參數(shù)未知),而抽樣平均誤差是可以計算的,這要借助概率的理論。設用表示抽樣平均數(shù)的平均誤差,表示抽樣成數(shù)的平均誤差,表示樣本可能數(shù)目,則:

注意以上公式中求和是對所有樣本求和的?!纠?-3】總體為2、3、4,從總體中按重復抽樣抽出兩個單位組成樣本。求抽樣平均誤差就是求所有可能樣本平均數(shù)的標準差。在此;即為抽樣平均誤差。四、影響抽樣平均誤差的因素按照上面抽樣平均誤差的公式,也是不可算的,因為總體的參數(shù)未知;為了計算和控制抽樣平均誤差,需要分析影響抽樣平均誤差的因素。1.全及總體標志的變動程度()在其他條件不變的情況下,全及總體標志變異程度越大(即變量在總體內(nèi)的起伏程度越大),抽樣平均誤差越大;反之,全及總體標志變異程度越小,抽樣平均誤差越小。2.樣本容量()多少在其他條件不變的情況下,樣本容量越大,抽樣平均誤差越??;反之,樣本容量越小,抽樣平均誤差越小。因為樣本容量越大越能反映總體、接近總體,誤差就越??;反之,誤差就越大。當樣本容量與總體單位數(shù)相等時,就不存在抽樣誤差了。3.抽樣組織方式不同的調(diào)查組織方式,如簡單隨機抽樣、類型抽樣、多階段抽樣等,所產(chǎn)生的抽樣誤差一般是不同的。因為不同的抽樣方式抽出的樣本對于總體的代表性高低也不相同,因而抽樣誤差也就不一樣。一般來說,簡單隨機抽樣的抽樣誤差最大,類型抽樣、多階段抽樣的抽樣誤差就要明顯地小一些。在統(tǒng)計實踐中,為了有效降低抽樣誤差、提高抽樣推斷的可靠性,一方面應該根據(jù)被研究總體的性質(zhì)和特點,選擇不同抽樣方式進行抽樣;另一方面,還要努力尋求多種抽樣方式相結(jié)合的復合型抽樣組織方式。⒋抽樣方法無論是隨機抽樣還是非隨機抽樣,都有重復抽樣和不重復抽樣兩種方法。在其他條件相同時,不重復抽樣的抽樣誤差一般小于重復抽樣的誤差,這是因為不重復抽樣避免了從總體單位中的重復選擇,因而更能反映總體結(jié)構(gòu),故抽樣誤差會較小些。五、抽樣平均誤差的計算1.樣本平均數(shù)的抽樣平均誤差上述的抽樣平均誤差公式是不可算的,原因不知道總體的參數(shù);但是抽樣平均誤差作為所有樣本所構(gòu)成的總體上的一個變量,抽樣平均誤差成為總體上的隨機變量的標準差;利用相關的概率與數(shù)理統(tǒng)計知識,可以得到下面的公式。(1)重復抽樣下抽樣平均誤差的計算如果全及總體變量的均值為標準差為;在重復抽樣條件下,樣本的均值統(tǒng)計量的均值為標準差為;從而可以得出一個計算抽樣平均誤差的轉(zhuǎn)化公式。即:為樣本單位數(shù);在總體標準差未知,且樣本單位數(shù)較大時,可以用樣本修正標準差代替【例7-4】設有4個工人,其每月產(chǎn)量分別為70、90、130、150。這一總體的平均工資和工資標準差為:現(xiàn)在用重復抽樣的方法,從4人產(chǎn)量中抽取2人構(gòu)成樣本,并求樣本的平均產(chǎn)量,用以代表4人總體的平均產(chǎn)量水平。所有可能的樣本以及各樣本的平均產(chǎn)量列表如下:樣本平均數(shù)的平均數(shù)(件)抽樣平均誤差(件)現(xiàn)在直接按重復抽樣誤差公式計算抽樣平均誤差。(件)所得結(jié)果與由定義計算的抽樣平均誤差完全相同。以上計算過程中可以呈現(xiàn)出幾個基本關系:①樣本平均數(shù)的平均數(shù)等于總體平均數(shù)。因而抽樣平均誤差的實質(zhì)就是抽樣平均數(shù)的標準差,所以也稱為抽樣標準誤差。②抽樣平均數(shù)的標準差(即抽樣平均誤差)比總體標準差小得多,僅為總體標準差的。③可以通過選擇樣本單位數(shù)來控制抽樣平均誤差。例如將樣本單位數(shù)擴大為原來的4倍,則平均誤差就縮小一半;如果抽樣平均誤差允許增加一倍,則樣本單位數(shù)只需要原來的四分之一。(2)不重復抽樣下抽樣平均誤差的計算在不重復抽樣的條件下,抽樣平均數(shù)的平均誤差不但和總體變異程度、樣本容量有關,而且還要考慮總體單位數(shù)多少:在一般情況下,總體單位數(shù)很大,抽樣比例很小,則接近于1,因此,與的數(shù)值接近。在實際工作中,在沒有掌握總體單位數(shù)的情況下或者總體單位數(shù)很大時,一般均用重復抽樣平均誤差公式來計算不重復抽樣的平均誤差?!纠?-5】仍以4個工人為例,月產(chǎn)量分別為70、90、130、150件。現(xiàn)用不重復抽樣方法,隨機抽取2個工人,并求其平均產(chǎn)量,所有可能的樣本以及各樣本的平均產(chǎn)量列表如下:樣本平均數(shù)的平均數(shù)(件)抽樣平均誤差根據(jù)已經(jīng)計算的總體平均數(shù)=110,總體標準差件,也可以按不重復抽樣誤差公式計算。

(件)兩者計算結(jié)果完全相同。由此可見,在不重復抽樣的條件下,抽樣平均數(shù)的平均數(shù)仍然等于總體平均數(shù),而它的抽樣平均誤差18.26件比重復抽樣的平均誤差22.36件小。在計算抽樣平均誤差時,通常得不到總體標準差的數(shù)值,要用樣本標準差s來代替總體標準差?!纠?-6】隨機抽選某校學生100人,調(diào)查他們的體重。得到他們的平均體重為58公斤,標準差為10公斤。問抽樣推斷的平均誤差是多少?解:已知:,,,則

即:當根據(jù)樣本學生的平均體重估計全部學生的平均體重時,抽樣平均誤差為1公斤?!纠?-7】某廠生產(chǎn)一種新型燈泡共2000只,隨機抽出400只作耐用時間試驗,測試結(jié)果平均使用壽命為4800小時,樣本標準差為300小時,求抽樣推斷的平均誤差?解:已知:,,,(小時)(小時)

計算結(jié)果表明:根據(jù)部分產(chǎn)品推斷全部產(chǎn)品的平均使用壽命時,采用不重復抽樣比重復抽樣的平均誤差要小。2.抽樣成數(shù)的抽樣平均誤差成數(shù)作為交替標志的均值,抽樣成數(shù)的抽樣平均誤差是樣本均值抽樣平均誤差的特例;只需要將全及成數(shù)的標準差平方代替公式中的全及平均數(shù)的標準差的平方,就可以得到抽樣成數(shù)的平均誤差公式。交替標志的標準差總體標準差樣本標準差抽樣成數(shù)的平均誤差重復抽樣:不重復抽樣:【例7-8】某燈泡廠對10000個產(chǎn)品進行使用壽命檢驗,隨機抽取2%樣本進行測試,得資料如下:按照質(zhì)量規(guī)定,電燈泡使用壽命在1000小時以上者為合格品,按以上資料計算抽樣平均誤差。電燈泡的平均使用時間(小時)電燈泡合格率電燈泡平均使用時間標準差

(小時)燈泡使用時間抽樣平均誤差:重復抽樣的平均誤差(小時)在不重復抽樣下抽樣平均誤差(小時)燈泡合格率的抽樣平均誤差:重復抽樣下抽樣平均誤差不重復抽樣下抽樣平均誤差抽樣平均誤差計算公式顯示可以通過調(diào)整樣本容量來控制抽樣平均誤差。【例7-9】假定抽樣單位數(shù)增加2倍、0.5倍時,抽樣平均誤差怎樣變化?抽樣單位數(shù)增加2倍,即為原來的3倍即:當樣本單位數(shù)增加2倍時,抽樣平均誤差為原來的0.577倍。抽樣單位數(shù)增加0.5倍,即為原來的1.5倍。即:當樣本單位數(shù)增加0.5倍時,抽樣平均誤差為原來的0.8165倍。六、抽樣極限誤差1.抽樣極限誤差的概念用抽樣指標來估計總體指標,要達到毫無誤差一般來說是不可能的,所以在估計總體指標的同時,必須考慮估計誤差的大小,給出最大允許誤差。最大允許誤差盡量要小一些,誤差超過了一定的限度,樣本資料就毫無價值了。如對糧食單位面積產(chǎn)量進行抽樣調(diào)查,如果所抽的糧食每公頃產(chǎn)量的誤差超過500千克,可以斷定這種樣本資料的價值是不大的。因為一般糧食平均每公頃產(chǎn)量為7500千克,而誤差達到500千克,則誤差為6.7%。通常糧食增產(chǎn)達到5%的幅度就是好收成,現(xiàn)在抽樣誤差已經(jīng)超過了這個數(shù)目,這種統(tǒng)計數(shù)字就失去意義了。在進行抽樣估計時,應該根據(jù)所研究對象的差異程度和分析的需要確定可允許的誤差范圍,在這個范圍內(nèi)的估計數(shù)字都是有效的。把這種可允許的最大誤差范圍稱為極限誤差,它等于樣本指標可允許變動的上限或下限與總體指標之差的絕對值。根據(jù)概率理論,在已知誤差(是個隨機變量)的概率分布的前提下,可以計算出以一定的可靠程度保證抽樣誤差不超過某一給定的范圍。故統(tǒng)計上又把抽樣極限誤差范圍稱為置信區(qū)間。設與分別表示抽樣平均數(shù)與抽樣成數(shù)的抽樣極限誤差,則有:2.總體范圍的估計若有了抽樣極限誤差,則總體平均數(shù)和總體成數(shù)的可能范圍可以用下式估計:抽樣平均數(shù)的范圍:≤≤抽樣成數(shù)的極限誤差:≤≤

如要估計某鎮(zhèn)糧食畝產(chǎn)量和總產(chǎn)量水平,從8000畝糧食作物中,用不重復抽樣抽取400畝,求得平均畝產(chǎn)為700公斤。如果確定抽樣誤差為5公斤,這就要求某鎮(zhèn)糧食畝產(chǎn)在7005公斤,即在695至705公斤之間,而糧食總產(chǎn)量在8000(7005)公斤,即556萬公斤至564萬公斤之間。【例7-10】要估計一批產(chǎn)品的合格率,從1000件產(chǎn)品中抽取200件,其中有10件不合格品,如果確定抽樣極限誤差的范圍為2%,試估計產(chǎn)品合格率的范圍。樣本成數(shù):p=190/200=95%總體成數(shù)下限=95%-2%=93%總體成數(shù)上限=95+2%=97%即該產(chǎn)品合格率在93%-97%之間。七、可信度和概率度抽樣估計不是百分百的確定性估計,而是在一定概率保證度下的判斷和估計;抽樣平均誤差是表明抽樣估計的準確度;而抽樣最大允許誤差范圍即抽樣極限誤差是表明抽樣估計準確度的允許范圍,這個允許范圍是在一定的可靠(概率)范圍內(nèi)的,在允許范圍內(nèi),還要求確定其估計的可靠(概率)程度,即可信度。抽樣估計的可信度就是表明抽樣指標和總體指標的誤差不超過一定范圍的概率保證程度。基于可信度的概率估計要求,抽樣極限誤差通常需要以抽樣平均誤差或為標準單位來衡量。把極限誤差或分別除以或得相對數(shù),表示誤差范圍為抽樣平均誤差的倍。是測量估計可靠程度的一個參數(shù),稱為概率度。

對于抽樣平均數(shù):因此,抽樣平均數(shù)的抽樣極限誤差為:

對于抽樣成數(shù):因此,抽樣成數(shù)的抽樣極限誤差為:這個公式的意義在于,在一定條件下,概率度越大,則抽樣誤差范圍越大,樣本可能落在誤差范圍內(nèi)的概率越大,從而抽樣估計的可信度也就越高;反之,越小,則越小,可能樣本落在誤差范圍內(nèi)的概率越小,從而抽樣估計的可信度也就越低。而估計區(qū)間又與抽樣極限誤差有關,在一定的抽樣方式下,抽樣極限誤差又是由概率度決定的。因而可靠程度與之間有正比關系。從理論上已經(jīng)證明,在樣本單位數(shù)足夠多≥的條件下,抽樣平均數(shù)是服從正態(tài)分布的,它以總體的均值為中心,以抽樣平均誤差為標準差;而標準化了的樣本均值統(tǒng)計量服從標準的正態(tài)分布;這個統(tǒng)計量的最大取值范圍即為樣本均值統(tǒng)計量的概率度,而其取值的概率可以完全由標準正態(tài)分布的分布表來決定。在統(tǒng)計實踐中,總體的方差往往是未知的,用方差統(tǒng)計量(公式7-9)的值替代總體的方差,此時標準化了的樣本均值統(tǒng)計量服從分布。在統(tǒng)計實踐中,總體的方差往往是未知的,用方差統(tǒng)計量(公式7-9)的值替代總體的方差,此時標準化了的樣本均值統(tǒng)計量服從分布。第三節(jié)總體指標的推斷一、總體參數(shù)估計總體參數(shù)估計就是指通過對樣本各單位的實際觀察取得樣本數(shù)據(jù),計算樣本統(tǒng)計量的取值作為被估計參數(shù)的估計值。總體參數(shù)估計有點估計和區(qū)間估計兩種。(一)總體參數(shù)的點估計1.點估計的概念點估計又稱定值估計,它是利用樣本計算出的統(tǒng)計量直接作為總體參數(shù)的估計量。如用樣本平均數(shù)的實際值作為總體平均數(shù)的估計量;用樣本成數(shù)的實際值作為總體成數(shù)的估計值。例如,根據(jù)某地區(qū)樣本資料計算糧食平均每公頃產(chǎn)量9000千克,優(yōu)質(zhì)糧食作物的比重為80%,則可以用這些數(shù)值作為全地區(qū)糧食單位面積(每公頃)產(chǎn)量水平和優(yōu)質(zhì)品率的估計值。如用樣本均值統(tǒng)計量作為總體參數(shù)的估計(樣本的一階原點矩),用修正的樣本方差統(tǒng)計量作為總體參數(shù)的估計(樣本的二階中心矩)等。參數(shù)點估計中關鍵是如何構(gòu)造點估計(統(tǒng)計)量,構(gòu)造點估計量的方法有多種,如矩估計法、最大似然估計法和貝葉斯法等。2.估計量的評選標準估計總體參數(shù),不一定只能用一個統(tǒng)計量,也可以用其他統(tǒng)計量。如估計總體平均數(shù),可以用樣本平均數(shù),也可以用樣本中位數(shù)、眾數(shù)等等。應當以哪一種統(tǒng)計量作為總體參數(shù)的估計量才是最優(yōu)的,這就有了評價統(tǒng)計量的優(yōu)良估計標準問題。作為優(yōu)良估計應該符合以下三個標準:(1)無偏性無偏性是指樣本統(tǒng)計量的期望值(平均數(shù))等于被估計的總體參數(shù)。也就是說,雖然每一次抽樣,所計算的統(tǒng)計量和總體參數(shù)的真值可能有誤差,誤差可正可負、可大可小;但在多次反復的估計中,所有樣本統(tǒng)計量取值的平均數(shù)應該等于總體參數(shù)本身。即樣本統(tǒng)計量的估計,平均來說是沒有偏差的。樣本平均數(shù)的期望值等于總體平均數(shù),樣本成數(shù)的期望值等于總體成數(shù)。這說明以樣本平均數(shù)作為總體平均數(shù)的估計量,以樣本成數(shù)作為總體成數(shù)的估計量,是符合無偏性原則的。但是樣本的標準差統(tǒng)計量就不符合這一標準,修正后的方差統(tǒng)計量才是一個無偏統(tǒng)計量了。(2)一致性一致性是指當樣本的單位數(shù)充分大時,樣本統(tǒng)計量也充分靠近總體參數(shù)。就是說隨著樣本單位數(shù)的無限增加,樣本統(tǒng)計量和被估計的總體參數(shù)之差的絕對值小于任意小的數(shù),(總體均值的一致性可由大數(shù)定理提供理論保證)實際上是幾乎肯定的。從抽樣誤差的影響中可以看出,在其他因素不變的情況下,樣本均值的抽樣誤差與樣本單位數(shù)的平方根成反比變化,樣本單位數(shù)愈多則誤差就愈小,當樣本單位數(shù)接近于總體單位數(shù)時,抽樣誤差也就接近于零。也就是說樣本均值統(tǒng)計量作為總體參數(shù)的估計量是符合一致性原則的。(3)有效性有效性是指作為優(yōu)良估計量的方差應該比其他估計量的方差小。例如用樣本平均數(shù)或用總體某一變量值來估計總體平均數(shù),雖然兩者都是無偏的,而且在每一次估計中,兩種估計量和總體平均數(shù)都可能有離差,但是樣本平均數(shù)更靠近于總體平均數(shù)的周圍,平均來說其離差比較小。所以對比說來,樣本平均數(shù)是更為有效的估計量。不是所有估計量都符合以上標準??梢哉f完全符合以上標準的估計量要比不符合或不完全符合以上標準的估計量更為優(yōu)良。例如在正態(tài)分布的情況下,總體平均數(shù)和中位數(shù)是重合在一起的,樣本平均數(shù)是總體中位數(shù)的無偏估計量和一致估計量,而且樣本平均數(shù)比樣本中位數(shù)作為總體中位數(shù)的估計量也是更有效的,因為樣本平均數(shù)的方差比樣本中位數(shù)的方差更小。在正態(tài)分布的情況下,樣本中位數(shù)是總體平均數(shù)的無偏估計量和一致估計量。但對比樣本平均數(shù)卻不是更有效和充分的估計量,因為它的方差比樣本平均數(shù)的方差大,當然樣本中位數(shù)也不是總體中位數(shù)的有效估計量。總體參數(shù)點估計的方法簡便、易行。但這種估計沒有表明抽樣估計的誤差,也沒有指出誤差在一定范圍內(nèi)的概率保證程度有多大。要研究這些問題,就需要采用區(qū)間估計的方法。(二)總體參數(shù)的區(qū)間估計總體參數(shù)的區(qū)間估計不是直接給出總體參數(shù)的估計值,而是利用實際樣本資料,構(gòu)造出一個置信區(qū)間,用這個區(qū)間來表明總體參數(shù)可能存在的范圍,同時給出這個估計相應的概率保證程度(置信度)。用公式表示為:≤≤≤≤式中,和分別是總體平均數(shù)區(qū)間的上限與下限;和分別為總體成數(shù)的上限與下限。

,分別表示被估計總體參數(shù)在區(qū)間和內(nèi)的概率為,即:≤≤≤≤稱和為置信區(qū)間。置信區(qū)間就是聯(lián)系一定概率保證程度確定的區(qū)間,表達了區(qū)間估計的精確性。為置信度或概率,表示區(qū)間估計的可靠程度。例如=0.95,說明有95%的可能總體參數(shù)包括在估計區(qū)間內(nèi)。而不包括在這個區(qū)間的概率為

=5%,叫顯著性水平。由上可見,科學的區(qū)間估計方法要具備三個基本要素:第一,要有合適的統(tǒng)計量作為估計量。第二,要有合理的允許誤差范圍,即抽樣極限誤差,指樣本統(tǒng)計量與被估計總體參數(shù)離差的絕對值可允許變動的上限和下限。第三,要有可靠的概率保證程度,即估計的置信度,它涉及估計的可靠性問題;置信度與概率度是對應關系。對于總體的的均值,根據(jù)大數(shù)定理和中心極限定理,在大樣本的情況下,樣本均值服從正態(tài)分布,中心化后為標準正態(tài)分布;當總體方差未知時,用修正的方差統(tǒng)計量替代總體方差;隨機變量服從自由度為的分布。(三)區(qū)間估計的兩種方法1.給定抽樣誤差范圍,估計概率保證程度根據(jù)給定的抽樣誤差范圍

,估計其概率保證程度()的具體步驟是:第一步,抽取樣本,根據(jù)樣本單位標志值計算樣本指標,如計算樣本平均數(shù)或樣本成數(shù),作為總體指標的相應估計值。并計算樣本標準差以推算抽樣平均誤差。第二步,根據(jù)給定的抽樣極限誤差范圍,估計出總體指標(平均數(shù)或成數(shù))的下限和上限。第三步,根據(jù)給定的抽樣極限誤差除以抽樣平均誤差,求出概率度值,再根據(jù)值和大小樣本數(shù)查概率分布表,求出相應的概率保證程度();對大樣本,查《正態(tài)分布概率表》;在方差未知的前提下,樣本容量不大時查《分布臨界值表》。并對總體參數(shù)作區(qū)間估計。這種估計方法分為總體平均數(shù)的估計和總體成數(shù)的估計兩種形式。(1)總體平均數(shù)的估計【例7-11】某城市進行居民家計調(diào)查,隨機抽取400個居民戶,調(diào)查得年平均每戶文化用品消費支出為900元,標準差為200元。要求抽樣極限誤差不超過20元,試對該市居民年平均每戶文化用品消費支出情況做出估計。第一步,抽取樣本,計算樣本平均數(shù)和標準差,并計算抽樣平均誤差。元,元(元)在這里,樣本是容量為400,是個大樣本;總體標準差是用樣本標準差來代替的;以下例子相同。第二步,根據(jù)給定的誤差范圍,計算該市居民戶年均文化用品消費的范圍。下限==900-20=880(元)上限==900+20=920(元)第三步,計算概率度,并查《正態(tài)分布概率表》表,查出置信度??梢杂?5.45%的概率保證程度,估計該市居民戶年均文化用品消費支出在880-920元之間。(2)總體成數(shù)的估計【例7-12】對某市居民戶獨立擁有廚衛(wèi)設施情況進行調(diào)查,隨機抽取900居民戶,其中有675戶居民擁有獨立的廚衛(wèi)設施。要求抽樣極限誤差范圍不超過2.73%,試對該市居民戶獨立擁有廚衛(wèi)設施的比重進行估計。第一步,抽取樣本,n=900是個大樣本,計算樣本成數(shù)和標準差,并推算抽樣平均誤差。第二步,根據(jù)給定的誤差范圍,計算總體成數(shù)的上下限。下限==75%-2.73%=72.27%上限==75%+2.73%=77.73%第三步,計算概率度,并查《正態(tài)分布概率表》表,查出置信度。可以有95%的概率保證程度,估計該市居民戶擁有獨立廚衛(wèi)設施的比重在72.27%-77.73%之間。2.根據(jù)置信度的要求,估計總體指標出現(xiàn)的可能范圍根據(jù)置信度的要求,估計總體指標出現(xiàn)的可能范圍的具體步驟是:第一步,抽取樣本,根據(jù)樣本單位標志值計算樣本指標,如計算樣本平均數(shù)或樣本成數(shù),作為總體指標的相應估計值。并計算樣本標準差用以推算抽樣平均誤差。第二步,根據(jù)給定的置信度的要求,大樣本查《正態(tài)分布概率表》,求得概率度值;小樣本查《分布臨界值表》,求出概率度值。第三步,根據(jù)概率度和抽樣平均誤差來推算抽樣極限誤差的可能范圍,并據(jù)以計算被估計總體指標的上下限,對總體參數(shù)作區(qū)間估計。(1)總體平均數(shù)的估計【例7-13】某外貿(mào)公司出口一種茶葉,規(guī)定每包規(guī)格不低于150克,現(xiàn)在用不重復抽樣的方法抽取其中1%進行檢驗。測得結(jié)果如表7-5所示,要求以99.73%的概率估計這批茶葉平均每包的重量范圍。以便確定平均重量是否達到規(guī)格要求。表7-5某外貿(mào)公司出口茶葉抽樣資料每包重量(克)組中值包數(shù)148-149148.510149-150149.520150-151150.550151-152151.520合計——100第一步,根據(jù)樣本資料計算樣本平均數(shù)和標準差,并推算抽樣平均誤差。(克)(克)

(克)第二步,根據(jù)給定的置信度=0.9973,查表得概率度=3。第三步,根據(jù)概率度和抽樣平均誤差計算抽樣極限誤差,并估計總體平均數(shù)的上下限,判斷其是否達到規(guī)格要求。(克)下限==150.3-0.26=150.04(克)上限==150.3+0.26=150.56(克)可以用99.73%的概率保證該批茶葉平均每包重量在150.4-150.56克之間,表明這批茶葉平均每包重量達到了規(guī)格要求?!纠?-14】為研究堅持長跑對體重的影響,采集到10名堅持長跑者前后體重變化的數(shù)據(jù):5,0,0,0,8,1,1,4,0,1(單位千克);若以90%的概率保證度,則堅持長跑前后體重變化的置信區(qū)間是多少?根據(jù)統(tǒng)計資料,知人群體重變化服從正態(tài)分布;第一步,根據(jù)樣本資料計算樣本平均數(shù)和標準差,并推算抽樣平均誤差。

(千克)(千克)(千克)第二步,根據(jù)給定的置信度=0.90,查《分布臨界值表》得概率度=1.833。第三步,根據(jù)概率度和抽樣平均誤差計算抽樣極限誤差,并估計總體平均數(shù)的上下限,判斷其是否達到規(guī)格要求。(千克)下限==2-1.59=0.41(千克)上限==2+1.59=3.59(千克)可以用90%的概率保證長期堅持鍛煉人群重量變化在0.41-3.59千克之間。(2)總體成數(shù)的估計表7-5某外貿(mào)公司出口茶葉抽樣資料每包重量(克)組中值包數(shù)148-149148.510149-150149.520150-151150.550151-152151.520合計——100要求用同樣的概率,保證這批茶葉包裝合格率范圍。第一步,根據(jù)樣本資料計算樣本合格率和標準差,并推算抽樣平均誤差。第二步,根據(jù)給定的置信度=0.9973,查表得概率度=3。第三步,根據(jù)概率度和抽樣平均誤差計算抽樣極限誤差,并估計總體合格率的上下限。下限==0.7-0.137=0.563上限==0.7+0.137=0.837可以用99.73%的概率,保證該批茶葉包裝的合格率在56.3%-83.7%之間。(四)總體總量指標的估計在對總體平均數(shù)和總體比例進行區(qū)間估計的基礎上,還可以進一步對相應的總量指標,即總體標志總量和具有某一特征的總體單位數(shù)的區(qū)間做出估計。其方法是用總體單位數(shù)N分別乘以置信區(qū)間的上限和下限,得出要估計的總量指標的區(qū)間。

【例7-15】某企業(yè)生產(chǎn)某種產(chǎn)品的工人有1000人,某日采用不重復抽樣從中隨機抽取100人調(diào)查他們的當日產(chǎn)量。樣本人均產(chǎn)量為35件,產(chǎn)量的樣本標準差為4.5件,試以95.45%的置信度估計平均日產(chǎn)量的抽樣極限誤差、置信區(qū)間和當日該企業(yè)總產(chǎn)量的置信區(qū)間。

解:件,=4.5件,=100人,屬于大樣本。故(件)又知,則,該企業(yè)總體人均日產(chǎn)量在95.45%置信度下的置信區(qū)間為:

35-0.86≤≤35+0.86,即在34.14至35.86件之間。

該企業(yè)日總產(chǎn)量在95.45%置信度下的置信區(qū)間為:

,即在34140至35860件之間。

【例7-16】某廠對7月份生產(chǎn)的2000只產(chǎn)品質(zhì)量進行抽樣檢驗,采取重復抽樣抽取樣品200只,樣品優(yōu)質(zhì)品率為85%,試計算當把握程度為90%時優(yōu)質(zhì)品率的區(qū)間范圍以及優(yōu)質(zhì)品的總產(chǎn)量區(qū)間范圍。

解:已知=2000只,=200只,=0.85,=0.90,

總體優(yōu)質(zhì)品率在置信度90%下的置信區(qū)間為

85%-4.15%≤≤85%+4.15%

即總體優(yōu)質(zhì)品率的置信區(qū)間在[80.85%,89.15%]之間??傮w優(yōu)質(zhì)品總產(chǎn)量在90%置信度下的置信區(qū)間為,即總體優(yōu)質(zhì)品總產(chǎn)量的置信區(qū)間之間。二、抽樣組織方式(一)簡單隨機抽樣的組織方式1簡單隨機抽樣的組織方式簡單隨機抽樣的組織形式除了抽樣框的名單外,不需要利用任何其他信息,所以也稱為稱純隨機抽樣。這種方法的優(yōu)點是使用起來簡單易行,它適用于總體單位數(shù)不是太多的總體。采用簡單隨機抽樣,在進行抽樣調(diào)查之前應該先確定總體范圍,并對總體進行編號,然后用抽簽的方式或根據(jù)《隨機數(shù)字表》來抽選必要的單位數(shù)。簡單隨機抽樣最符合隨機原則。簡單抽樣有幾種不同的抽樣方法。(1)抽簽法。先給每個單位編上序號,將號碼寫在紙片上,摻和均勻后從中抽選,抽到哪個單位就是哪個單位,直到抽夠預先規(guī)定的數(shù)量為止。這種方法看起來簡單易行,總體單位數(shù)目不多時也可以使用。(2)隨機數(shù)字法。首先要將全及總體中所有的單位加以編號,根據(jù)編號的位數(shù)確定選用隨機數(shù)碼表中若干欄數(shù)字。然后從任意一欄、任意一行的數(shù)字開始數(shù),可以向任何方向數(shù)過去,碰上屬于編號范圍內(nèi)的數(shù)字號碼就定下來作為樣本單位。如果是不重復抽樣,則碰上重復的數(shù)字時不要它,直到抽夠預定的數(shù)量為止。2.樣本容量的確定組織抽樣調(diào)查的一項重要工作就是確定合適的樣本容量。在設計的時候,通常是先根據(jù)研究問題的性質(zhì)確定允許的誤差范圍和必要的概率保證程度(或概率度),并根據(jù)總體的標準差通過抽樣平均誤差的公式來計算必要的樣本單位數(shù)n。簡單隨機抽樣在實踐上受到許多限制。例如當總體很大時,要首先對每一個單位加以編號就有很大困難,對于無限總體,對其進行編號甚至是不可能的。但這種抽樣方式從理論上說最符合隨機原則,它的抽樣誤差容易得到理論上的論證。因此可以作為發(fā)展其他更復雜的抽樣設計的基礎,同時也是衡量其他抽樣方式抽樣效果的比較標準。(二)類型抽樣的組織方式類型抽樣是將統(tǒng)計分組法和簡單隨機抽樣結(jié)合起來的一種抽樣方式。通過分組,可以把總體分成幾個在組內(nèi)性質(zhì)比較接近的類型,使得各組內(nèi)標志差異縮小,各組間有較大差異,保證了樣本單位能夠均勻地分布在總體各部分,從而提高了樣本的代表性。實踐和數(shù)理統(tǒng)計都已證明,類型抽樣能比簡單隨機抽樣取得更好的效果。例如,對居民的家計調(diào)查,可以按國民經(jīng)濟部門分組來抽選樣本單位;對農(nóng)作物的單位面積產(chǎn)量調(diào)查,可以按不同的地理條件分組來抽選樣本單位;對某種產(chǎn)品質(zhì)量進行調(diào)查,可以按企業(yè)規(guī)模分組來抽選樣本單位等等。這樣都能保證樣本有較充分的代表性。將總體分成若干組后,樣本單位數(shù)在各組之間的分配主要有三種方法:一是按調(diào)查者主觀意志任意確定各組應抽選單位數(shù),這種分配方法稱為隨意分配。二是按各組的標志變異程度來確定各組應抽的單位數(shù)。對于標志變異大的組宜多抽一些單位進行調(diào)查,而標志變異小的組宜少抽一些單位進行調(diào)查。各組的抽選比例與對應的總體中各組單位數(shù)所占的比例是不相等的,這種分配方法稱為最佳分配。三是按統(tǒng)一的比例確定各組應抽選的單位數(shù),這種分配方法稱為比例分配。(三)等距抽樣的組織方式由于排隊所依據(jù)的標志不同,有兩種等距抽樣方法。第一,無關標志排隊法。即是指排列的標志和單位標志值的大小無關或不起主要的影響作用。例如,調(diào)查職工收入水平時,按職工姓氏筆劃排隊進行抽樣。顯然職工收入水平與姓氏筆劃之間沒有必然的聯(lián)系。第二,有關標志排隊法。所謂有關標志是指作為排列順序的標志和單位標志值的大小有密切的關系。例如,職工家計調(diào)查,按職工平均工資排隊抽取調(diào)查戶等。按有關標志排隊實質(zhì)上是運用類型抽樣的一些特點,有利于提高樣本的代表性。(四)整群抽樣的組織方式整群抽樣的優(yōu)點在于組織工作簡單,搜集資料方便容易,調(diào)查費用較少。例如,對某工業(yè)產(chǎn)品的質(zhì)量檢驗,不便于在流水作業(yè)線上一件一件地抽選檢查,則可以每隔若干小時抽取一批產(chǎn)品進行檢驗,這樣就方便多了。但是,正因為以群為單位進行抽選,抽選單位比較集中,顯著地影響了在總體中各單位分布的均勻性,與其他抽樣方式比較,抽樣誤差比較大,即使要得到同簡單隨機抽樣相同的精確度,整群抽樣都要調(diào)查相對較多的樣本單位。一般地,在缺乏總體抽樣框的情況下,宜采用整群抽樣方式。(五)多階段抽樣的組織方式如我國農(nóng)產(chǎn)品產(chǎn)量調(diào)查就是采用多階段抽樣調(diào)查,第一階段從省抽縣,第二階段從中選縣抽鄉(xiāng),第三階段從中選鄉(xiāng)抽村,再從中選的村中抽地塊,最后從中選的地塊中抽具體的樣本單位,并以樣本單位測得的實際資料來推算平均畝產(chǎn)和總產(chǎn)。又如我國職工家計調(diào)查,第一階段先抽調(diào)查城市,第二階段從中選城市的各部分中抽選調(diào)查單位,第三階段再從單位中抽選職工,確定具體的調(diào)查戶,調(diào)查各戶每月實際的生活費收支情況。在實際工作中,當總體單位很多、分布廣泛,又幾乎不可能從總體中直接抽取總體單位時,常采用多階段抽樣。其優(yōu)點是:第一,便于組織抽樣。它可以按現(xiàn)有的行政區(qū)劃或地理區(qū)域分各階段的抽樣單元,從而簡化抽樣框的編制。第二,可以獲得各階段單元的調(diào)查資料,根據(jù)最初級資料可進行逐級抽樣推斷,得到各級的調(diào)查資料。如農(nóng)產(chǎn)品產(chǎn)量調(diào)查,可根據(jù)樣本推斷地塊資料,根據(jù)地塊資料可推斷村的資料,然后依次推斷鄉(xiāng)、鄉(xiāng)推縣等。第三,多階段抽樣的方式比較靈活,各階段抽樣的組織方式應以前述四種為依據(jù)進行選擇。一般在初級階段抽樣時多用分層抽樣和等距抽樣,在次級階段抽樣時多用等距抽樣和簡單隨機抽樣。同時,還可以根據(jù)各階段的不同特點,采用不同的抽樣比。如方差大的階段,抽樣比大一些,方差小的階段,抽樣比小一些。而且多階段抽樣在簡化抽樣工作的同時,又因抽樣單位的分布較廣,而具有較強的代表性。本章小結(jié)抽樣調(diào)查又稱抽樣推斷或抽樣估計,是根據(jù)隨機的原則在總體中抽取一部分總體單位進行調(diào)查登記,進而利用這部分總體單位的數(shù)據(jù)對總體的有關數(shù)量特征在一定概率保證下作出推斷的一種統(tǒng)計方法。抽樣調(diào)查適用的范圍很廣泛。抽樣方法有:重復抽樣和不重復抽樣。抽樣推斷的理論基礎有:隨機變量及其分布規(guī)律和大數(shù)定理與中心極限定理。用抽樣樣本指標來估計全及指標是否可行,關鍵問題在于抽樣誤差。影響抽樣平均誤差的因素主要有:全及總體標志的變動程度、樣本容量多少、抽樣組織方式、抽樣方法。在進行抽樣估計時,應該根據(jù)所研究對象的差異程度和分析的需要確定可允許的誤差范圍,在這個范圍內(nèi)的估計數(shù)字都是有效的,這種可允許的最大誤差范圍稱為極限誤差。抽樣估計的可信度就是表明抽樣指標和總體指標的誤差不超過一定范圍的概率保證程度??傮w參數(shù)估計就是指通過對樣本各單位的實際觀察取得樣本數(shù)據(jù),計算樣本統(tǒng)計量的取值作為被估計參數(shù)的估計值??傮w參數(shù)估計有點估計和區(qū)間估計兩種。抽樣的組織方式有:簡單隨機抽樣、類型抽樣、等距抽樣、整群抽樣和多階段抽樣。本章實訓模塊一:知識理解一、簡答題1、抽樣調(diào)查的特點是什么?2、什么是抽樣誤差,什么是抽樣平均誤差?3、什么叫抽樣分布,它和總體分布的關系是怎樣的?4、什么是簡單隨機抽樣?有什么特點?5、什么是分層抽樣?什么是整群抽樣?二、判斷題(正確的畫“√”,錯誤的畫“×”)1.連續(xù)生產(chǎn)的電子管廠,每隔一小時抽取5分鐘的產(chǎn)品進行產(chǎn)品質(zhì)量檢驗,這是運用類型抽樣方式。()

2.在進行農(nóng)產(chǎn)量調(diào)查時,如果有意識地都從田邊地頭抽取樣本,有可能使推算的農(nóng)產(chǎn)量產(chǎn)生系統(tǒng)誤差。()

3.分層抽樣是將總體先分為若干群,然后成群地隨機抽取樣本單位。()

二、判斷題(正確的畫“√”,錯誤的畫“×”)4.抽樣極限誤差是指樣本指標與總體指標之間離差的可能范圍。()

5.在重復抽樣條件下,推斷總體成數(shù)的必要抽樣單位數(shù)目的公式為。()6.在一定抽樣平均誤差的條件下,要提高推斷的可靠性,必須縮小極限誤差。()二、判斷題(正確的畫“√”,錯誤的畫“×”)7.在其他條件不變的情況下,提高抽樣估計的可靠程度,其精確程度也將隨之提高。()8.在抽樣推斷中,抽樣誤差雖然不可避免但可以控制。()9.對10000只燈泡進行耐用性能測試,根據(jù)以往資料,耐用時間標準差為51.91小時,若采用重復抽樣方法,概率保證68.27%,平均耐用時數(shù)的誤差范圍不超過9小時。在這種條件下應抽取34只燈泡進行耐用性能測試。()二、判斷題(正確的畫“√”,錯誤的畫“×”)10.點估計可以給出估計的可靠程度。()11.從100個住戶中隨機抽取了10戶,調(diào)查其月消費支出額。經(jīng)計算得到10戶的平均月消費支出額為3500元,標準差為300元。假定總體服從正態(tài)分布,則總體平均月消費支出額95%的置信區(qū)間為:。()二、判斷題(正確的畫“√”,錯誤的畫“×”)12.樣本容量過大,統(tǒng)計量的標準誤差也會增大,對總體參數(shù)的估計會不準確。()13.在參數(shù)估計中,無偏性是衡量一個估計量是否理想的唯一準則。()14.在對總體均值作區(qū)間估計時,若給定的顯著性水平較小,則估計的結(jié)果將有較低的精確度和較高的可信程度。()15.在抽樣推斷中,作為推斷對象的總體和作為觀察對象的樣本都是確定的、唯一的。()三、單項選擇題(只有一個正確答案)1.為了了解某工廠職工家庭收支情況,按該廠職工名冊依次每50人抽取1人,對其家庭進行調(diào)查屬于()。A.簡單隨機抽樣B.等距抽樣C.類型抽樣D.整群抽樣2.抽樣平均誤差反映了樣本指標與總體指標之間的()。A.實際誤差B.調(diào)查誤差C.可能誤差范圍D.平均誤差三、單項選擇題(只有一個正確答案)3.某地區(qū)職工樣本的平均工資450元,抽樣平均誤差5元,該地區(qū)全部職工平均工資落在440~460元之間的估計置信度為()。A.2B.0.9545C.3D.0.99734.根據(jù)城市電話網(wǎng)100次通話情況調(diào)查,得知每次通話平均持續(xù)時間為4分鐘,標準差為2分鐘,在概率保證為95.45%的要求下,估計該市每次通話時間為()。A.3.9~4.1分鐘之間B.3.8~4.2分鐘之間

C.3.7~4.3分鐘之間D.3.6~4.4分鐘之間三、單項選擇題(只有一個正確答案)5.進行重復隨機抽樣,為使抽樣誤差減少75%,抽樣單位數(shù)必須是原來的()。A.倍B.倍

C.4倍D.16倍6.將總體各單位按某一標志排隊,然后按相等的間隔來抽取樣本單位的方法為()。

A.簡單隨機抽樣

B.類型抽樣C.等距抽樣

D.整群抽樣三、單項選擇題(只有一個正確答案)7.在同樣隋況下,不重復抽樣的抽樣平均誤差與重復抽樣的抽樣平均誤差相比,()。

A.后者小于前者

B.前者小于后者

C.兩者相等

D.兩者有時相等,有時不等8.將統(tǒng)計分組與隨機抽樣相結(jié)合,借以降低總體方差對抽樣誤差的影響,從而提高樣本代表性,這種抽樣組織方式屬于()。

A.簡單隨機抽樣

B.分層抽樣C.等距抽樣

D.整群抽樣三、單項選擇題(只有一個正確答案)9.聯(lián)系一定的概率作參數(shù)區(qū)間估計時,概率表明的是要求估計的()。

A.精確度

B.可靠程度C.準確性

D.有效性10.根據(jù)抽樣調(diào)查資料,某企業(yè)工人生產(chǎn)定額平均完成105%,抽樣平均誤差為1%,概率為0.9545時(t=2),可以確定生產(chǎn)定額平均完成百分比為()。

A.大于107%

B.不大于103%和不小于107%

C.在103%和107%之間

D.小于103%三、單項選擇題(只有一個正確答案)13.有一批燈泡共1000箱,每箱200個,現(xiàn)隨機抽取20箱并檢查這些箱中的全部燈泡,這種抽樣方式屬于()。

A.純隨機抽樣B.類型抽樣C.整群抽樣D.等距抽樣14.某地有2萬畝稻田,根據(jù)上年資料得知其中畝產(chǎn)的標準差為50公斤,若以95.45%的概率推斷平均畝產(chǎn)量,要求極限誤差不超過10公斤,應抽選()畝地作為樣本進行抽樣調(diào)查。

A.100B.250C.500D.1000三、單項選擇題(只有一個正確答案)15.對甲乙兩個工廠工人平均工資進行純隨機不重復抽樣調(diào)查,調(diào)查的工人數(shù)一樣,兩工廠工資方差相同,但甲廠工人總數(shù)比乙廠工人總數(shù)多一倍,則抽樣平均誤差()。

A.甲廠比乙廠大B.乙廠比甲廠大C.兩個工廠一樣大D.無法確定16.當可靠度大于0.6827時,抽樣極限誤差()。

A.大于抽樣平均誤差B.小于抽樣平均誤差

C.等于抽樣平均誤差D.與抽樣平均誤差的大小關系依樣本容量而定三、單項選擇題(只有一個正確答案)17.對某行業(yè)職工收入情況進行抽樣調(diào)查,得知其中80%的職工收入在800元以下,抽樣平均誤差為2%,當概率為95.45%時,該行業(yè)職工收入在800元以下所占比重是()。

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預覽,若沒有圖紙預覽就沒有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負責。
  • 6. 下載文件中如有侵權(quán)或不適當內(nèi)容,請與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

最新文檔

評論

0/150

提交評論