抽樣009.12.2(0).ppt_第1頁
抽樣009.12.2(0).ppt_第2頁
抽樣009.12.2(0).ppt_第3頁
抽樣009.12.2(0).ppt_第4頁
抽樣009.12.2(0).ppt_第5頁
已閱讀5頁,還剩91頁未讀 繼續(xù)免費(fèi)閱讀

下載本文檔

版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請(qǐng)進(jìn)行舉報(bào)或認(rèn)領(lǐng)

文檔簡介

1、第七章 抽樣推斷,第一節(jié) 抽樣調(diào)查的基本概念 第二節(jié) 抽樣誤差 第三節(jié) 參數(shù)估計(jì)基本方法 第四節(jié) 抽樣調(diào)查的組織形式及抽樣估計(jì) 第五節(jié) 假設(shè)檢驗(yàn),一家食品生產(chǎn)企業(yè)以生產(chǎn)袋裝食品為主,每天的產(chǎn)量約為8000袋左右。按規(guī)定每袋的重量應(yīng)不低于100克,否則即為不合格。為對(duì)產(chǎn)量質(zhì)量進(jìn)行檢測,企業(yè)設(shè)有質(zhì)量檢查科專門負(fù)責(zé)質(zhì)量檢驗(yàn),并經(jīng)常向企業(yè)高層領(lǐng)導(dǎo)提交質(zhì)檢報(bào)告。質(zhì)檢的內(nèi)容之一就是每袋重量是否符合要求。 由于產(chǎn)品的數(shù)量大,進(jìn)行全面的檢驗(yàn)是不可能的,可行的辦法是抽樣,然后用樣本數(shù)據(jù)估計(jì)平均每袋的重量。質(zhì)檢科從某天生產(chǎn)的一批食品中隨機(jī)抽取了25袋,下表是對(duì)每袋食品重量的檢驗(yàn)結(jié)果。(假定該種袋裝食品重量服從正態(tài)

2、分布。),案例導(dǎo)入,根據(jù)表1的數(shù)據(jù),質(zhì)檢科估計(jì)出該天生產(chǎn)的食品每袋的平均重量在101.57109.14克之間,其中,估計(jì)的可信程度為95%,估計(jì)誤差不超過4克。產(chǎn)品的合格率在95.68%64.32%之間,其中,估計(jì)的可信程度為95%,估計(jì)誤差不超過15.68%。,質(zhì)檢報(bào)告提交后,企業(yè)高層領(lǐng)導(dǎo)人提出幾點(diǎn)意見:一是抽取的樣本大小是否合適?能不能用一個(gè)更大的樣本進(jìn)行估計(jì)?二是能否將估計(jì)的誤差在縮小一點(diǎn)?比如,估計(jì)平均重量時(shí)估計(jì)誤差不超過3克,估計(jì)合格率時(shí)誤差不超過10%。三是總體平均重量的方差是多少?因?yàn)榉讲畹拇笮≌f明了生產(chǎn)過程的穩(wěn)定性,過大或過小的方差都意味著應(yīng)對(duì)生產(chǎn)過程進(jìn)行調(diào)整。,參數(shù)估計(jì)、假設(shè)

3、檢驗(yàn)在統(tǒng)計(jì)方法中的地位,統(tǒng)計(jì)方法,描述統(tǒng)計(jì),推斷統(tǒng)計(jì),假設(shè)檢驗(yàn),統(tǒng)計(jì)推斷的過程,抽樣推斷是按隨機(jī)原則從全部研究對(duì)象中抽取部分單位進(jìn)行觀察,并根據(jù)樣本的實(shí)際數(shù)據(jù)對(duì)總體的數(shù)量特征作出具有一定可靠程度的估計(jì)和判斷。 抽樣推斷的特點(diǎn): 它是由部分推斷整體的一種認(rèn)識(shí)方法 抽樣推斷建立在隨機(jī)取樣的基礎(chǔ)上 抽樣推斷運(yùn)用概率估計(jì)的方法。 抽樣推斷的誤差可以事先計(jì)算并加以控制,參數(shù)估計(jì) 參數(shù)估計(jì)是依據(jù)所獲得的樣本觀察資料,對(duì)所研究現(xiàn)象總體的水平、結(jié)構(gòu)、規(guī)模等數(shù)量特征進(jìn)行估計(jì)。 假設(shè)檢驗(yàn) 假設(shè)檢驗(yàn)是利用樣本的實(shí)際資料來檢驗(yàn)事先對(duì)總體某些數(shù)量特征所作的假設(shè)是否可信的一種統(tǒng)計(jì)分析方法。,抽樣推斷的內(nèi)容,第一節(jié) 抽樣調(diào)

4、查的基本概念,一、抽樣調(diào)查的適用范圍 二、樣本 三、參數(shù)和估計(jì)量 四、樣本可能數(shù)目,抽樣調(diào)查的適用范圍,1 不可能進(jìn)行全面調(diào)查時(shí); 2 不必要進(jìn)行全面調(diào)查時(shí); 3 對(duì)全面調(diào)查資料進(jìn)行驗(yàn)證; 4 適用對(duì)信息資料及時(shí)性很強(qiáng)的現(xiàn)象進(jìn)行調(diào)查時(shí); 5 可對(duì)某些總體的假設(shè)進(jìn)行檢驗(yàn)以判斷真?zhèn)螘r(shí).,樣本(概念要點(diǎn)),樣本(sample):又稱樣本總體或子樣,就是從總體中隨機(jī)抽取出來并用來代表總體的那部分單位所構(gòu)成的新的小總體或集合體。對(duì)于一個(gè)具體的抽樣問題,總體是唯一確定的,而樣本則不是唯一的。,參數(shù)與統(tǒng)計(jì)量,參數(shù) 在統(tǒng)計(jì)學(xué)中約定俗成,將用來描述總體的特征的綜合指標(biāo)稱為總體的參數(shù); 統(tǒng)計(jì)量 將用來描述樣本特征

5、的指標(biāo)稱為樣本統(tǒng)計(jì)量。,參數(shù),統(tǒng)計(jì)量,樣本可能數(shù)目:又稱樣本個(gè)數(shù),是指從一個(gè)有N個(gè)單位的總體中抽取容量為n的樣本時(shí),有可能出現(xiàn)的所有樣本的個(gè)數(shù),是一種理論概率分布。 樣本容量:一個(gè)樣本包含的單位數(shù)。用 “n”表示。一般要求 n 30,大樣本. 在總體單位數(shù)N和樣本容量n一定的條件下,樣本可能數(shù)目與抽樣方法有關(guān)。而在同一抽樣方法下,又由于對(duì)被抽中的幾個(gè)單位考慮順序與否,從而有不等的樣本可能數(shù)目。,樣本可能數(shù)目,可能樣本數(shù)目的計(jì)算公式,第二節(jié) 抽樣誤差,一、抽樣誤差的概念 二、抽樣平均誤差 三、抽樣極限誤差 四、抽樣誤差的概率度,一、抽樣誤差的概念,抽樣誤差:是指由于隨機(jī)抽樣的偶然因素使樣本各單位

6、的結(jié)構(gòu)不足以代表總體各單位的結(jié)構(gòu),而引起抽樣指標(biāo)與總體指標(biāo)之間的絕對(duì)離差。 影響抽樣誤差大小的因素: 1)總體各單位標(biāo)志值的差異程度。 2)樣本容量 3)抽樣方法及抽樣調(diào)查的組織形式。不同的抽樣組織形式就有不同的抽樣誤差。而且同一種組織形式的合理程度也影響抽樣誤差。,二、抽樣平均誤差,多數(shù)樣本指標(biāo)與總體指標(biāo)都有誤差,誤差有大、有小,有正、有負(fù),抽樣平均誤差就是將所有的誤差綜合起來,再求其平均數(shù)。 抽樣平均誤差:是反映抽樣誤差一般水平的指標(biāo)。,設(shè)以 表示抽樣平均數(shù)的平均誤差, 表示抽樣成數(shù)的平均誤差,M表示全部可能的樣本數(shù)目,則:,抽樣平均誤差(公式),注:以上公式中的關(guān)鍵是無法得到總體平均數(shù)和

7、總體成數(shù),所以按上述公式來計(jì)算抽樣平均誤差實(shí)際上是不可能的。,抽樣平均數(shù)的平均誤差,1、在重復(fù)抽樣的條件下,抽樣平均數(shù)的平均誤差與總體的變異程度以及樣本容量大小兩個(gè)因素有關(guān):,2、在不重復(fù)抽樣的條件下,抽樣平均數(shù)的平均誤差不但和總體變異程度、樣本容量有關(guān),而且還與總體單位數(shù)有關(guān):其中, 為修正因子。,抽樣成數(shù)的平均誤差:表明各樣本成數(shù)和總體成數(shù)絕對(duì)離差的一般水平。 1、在重復(fù)抽樣的條件下:,抽樣成數(shù)的平均誤差,2、在不重復(fù)抽樣的條件下:, 樣本平均數(shù)的平均數(shù)等于總體平均數(shù)。 抽樣平均數(shù)的標(biāo)準(zhǔn)差僅為總體標(biāo)準(zhǔn)差的 可通過調(diào)整樣本單位數(shù)來控制抽樣平均誤差。,抽樣平均誤差所反映的內(nèi)容,三、抽樣極限誤差

8、,在抽樣估計(jì)時(shí),應(yīng)根據(jù)所研究對(duì)象的變異程度和分析目的要求確定可允許的誤差范圍,我們把這種可允許的最大誤差范圍稱為抽樣極限誤差。 設(shè)x、p分別表示抽樣平均數(shù)極限誤差和抽樣成數(shù)極限誤差。則有:,區(qū)間 稱為平均數(shù)的估計(jì)區(qū)間或稱平均數(shù)的置信區(qū)間。區(qū)間 稱為成數(shù)的估計(jì)區(qū)間或稱成數(shù)的置信區(qū)間。,四、抽樣極限誤差的概率度,基于概率估計(jì)的要求,抽樣極限誤差通常需要以抽樣平均誤差 或 為標(biāo)準(zhǔn)單位來衡量。把極限誤差 或 分別除以 或 的得相對(duì)數(shù)t,表示誤差范圍為抽樣平均誤差的t倍。t是測量估計(jì)可靠程度的一個(gè)參數(shù)稱為抽樣誤差的概率度。,第三節(jié) 參數(shù)估計(jì)的方法,一、總體參數(shù)的點(diǎn)估計(jì) 二、總體參數(shù)的區(qū)間估計(jì),點(diǎn)估計(jì)(概

9、念要點(diǎn)),從總體中抽取一個(gè)樣本,根據(jù)該樣本的統(tǒng)計(jì)量對(duì)總體的未知參數(shù)作出一個(gè)數(shù)值點(diǎn)的估計(jì) 例如: 用樣本均值作為總體未知均值的估計(jì)值就是一個(gè)點(diǎn)估計(jì) 點(diǎn)估計(jì)沒有給出估計(jì)值接近總體未知參數(shù)程度的信息 點(diǎn)估計(jì)的方法有矩估計(jì)法、順序統(tǒng)計(jì)量法、最大似然法、最小二乘法等,參數(shù)估計(jì)的理論基礎(chǔ),大數(shù)定律 說明由大量相互獨(dú)立的隨機(jī)變量構(gòu)成的總體,對(duì)這些大量的變量加以平均,從而使總體單位的某一標(biāo)志的規(guī)律性及其共同特征能在一定的數(shù)量和質(zhì)量上表現(xiàn)出來.,參數(shù)估計(jì)的理論基礎(chǔ),中心極限定理 不論總體是什么分布,只要數(shù)學(xué)期望和方差存在,從這個(gè)總體中隨機(jī)互相獨(dú)立地抽取容量為n的樣本,那么當(dāng)n足夠大時(shí),樣本平均數(shù)近似服從數(shù)學(xué)期望

10、為 ,方差為 的正態(tài)分布.,估計(jì)量的優(yōu)良性準(zhǔn)則(無偏性),無偏性:估計(jì)量的數(shù)學(xué)期望等于被估計(jì)的總體 參數(shù),估計(jì)量的優(yōu)良性準(zhǔn)則(有效性),有效性:一個(gè)方差較小的無偏估計(jì)量稱為一個(gè)更 有效的估計(jì)量。如,與其他估計(jì)量相比 ,樣本均值是一個(gè)更有效的估計(jì)量,估計(jì)量的優(yōu)良性準(zhǔn)則(一致性),一致性:隨著樣本容量的增大,估計(jì)量越來越接近被估計(jì)的總體參數(shù),總體參數(shù)的區(qū)間估計(jì)(抽樣誤差范圍的概率保證度),在確定允許的抽樣誤差范圍后,從主觀愿望說,希望抽樣調(diào)查的結(jié)果,樣本指標(biāo)的估計(jì)值都能夠落在允許的誤差范圍內(nèi),但這并非都能實(shí)現(xiàn)的事情。 抽樣估計(jì)置信度(概率保證程度)就是表明抽樣指標(biāo)和總體指標(biāo)的誤差不超過一定范圍的概

11、率保證程度。,總體參數(shù)的區(qū)間估計(jì)(概念),總體參數(shù)區(qū)間的基本特點(diǎn):是根據(jù)給定的概率保證程度的要求,利用實(shí)際抽樣資料,指出總體被估計(jì)值的上限和下限,即指出總體參數(shù)可能存在的區(qū)間范圍。 換句話說,對(duì)于總體的被估計(jì)指標(biāo)X,找出樣本的兩個(gè)估計(jì)量x1和x2,使被估計(jì)指標(biāo)X落在區(qū)間(x1,x2)內(nèi)的概率1-,(01),為已知的。即P(x1Xx2)=1一是給定的。我們稱區(qū)間( x1,x2 )為總體指標(biāo)X的置信區(qū)間,其估計(jì)置信度為1一,稱為顯著性水平,x1是置信下限,x2是置信上限。,已知抽樣誤差范圍,求概率保證度(置信度),計(jì)算步驟是: 首先抽取樣本,計(jì)算抽樣指標(biāo)(如計(jì)算抽樣平均數(shù)或抽樣成數(shù)),作為相應(yīng)總體

12、指標(biāo)的估計(jì)值,并計(jì)算樣本標(biāo)準(zhǔn)差以推算抽樣平均誤差。 其次,根據(jù)給定的抽樣極限誤差范圍,估計(jì)總體指標(biāo)的下限和上限。 最后,將抽樣極限誤差除以抽樣平均誤差求出概率度t值,再根據(jù)t值查正態(tài)分布概率表求出相應(yīng)的置信度F(t),并對(duì)總體參數(shù)作區(qū)間估計(jì)。, 例1 對(duì)某型號(hào)的電子元件進(jìn)行耐用性能檢查,抽查的資料分組列表如下,要求耐用時(shí)數(shù)的允許誤差范圍x=10.5小時(shí),試估計(jì)該批電子元件的平均耐用時(shí)數(shù)。,已知抽樣誤差范圍, 求概率保證度(應(yīng)用),耐用時(shí)數(shù),組中值,元件數(shù),900以下 900-950 950-1000 1000-1050 1050-1100 1100-1150 1150-1200 1200以上,

13、875 925 975 1025 1075 1125 1175 1225,1 2 6 35 43 9 3 1,合計(jì),100,1、計(jì)算抽樣平均數(shù)和標(biāo)準(zhǔn)差 2、根據(jù)給定的=10.5小時(shí),計(jì)算總體平均數(shù)的上下限, 下限= 上限= 3、根據(jù)t=10.5/ 5.191=2,查概率表得置信度F(t)=0.9545 我們可以作如下估計(jì),即可以概率95.45%的保證程度,估計(jì)該批電子元件的耐用時(shí)數(shù)在1045-1066小時(shí)之間。,已知給定的置信度要求,推算極限誤差的可能范圍,計(jì)算步驟是: 首先抽取樣本,計(jì)算抽樣指標(biāo),作為相應(yīng)總體指標(biāo)的估計(jì)值,并計(jì)算樣本標(biāo)準(zhǔn)差以推算抽樣平均誤差。 其次,根據(jù)給定的置信度F(t)要

14、求,查表求得概率度t值。 最后,根據(jù)概率度t和抽樣平均誤差來推算抽樣極限誤差的可能范圍,再根據(jù)抽樣極差求出被估計(jì)總體措標(biāo)的上下限,對(duì)總體參數(shù)作區(qū)間估計(jì)。,樣本容量的確定,在重置抽樣下, 所以,必要抽樣單位數(shù),在不重置抽樣下,必要抽樣單位數(shù),例:某市進(jìn)行職工家庭生活費(fèi)抽樣調(diào)查,已知職工家庭平均每人每月生活費(fèi)收入的標(biāo)準(zhǔn)差為110元,允許誤差范圍10元,概率把握程度95%,試確定應(yīng)抽選的戶數(shù)。 解: 例:某企業(yè)要調(diào)查產(chǎn)品合格率,已知以往的合格率曾有90%、98%、99%?,F(xiàn)要求誤差不超過1%,把握程度為95%,問需要抽選多少件產(chǎn)品? 解:,例:要調(diào)查某校大學(xué)生英語四級(jí)考試成績,假設(shè)根據(jù)歷史資料該校學(xué)

15、生平均成績的標(biāo)準(zhǔn)差為20分,及格率為65%?,F(xiàn)用重復(fù)抽樣方法,要求在95%的置信度下,平均分?jǐn)?shù)的誤差不超過2分,及格率的誤差不超過4%,求必要抽樣數(shù)目。,影響必要抽樣數(shù)目的因素,(1)允許誤差范圍。當(dāng)其它條件不變時(shí),允許誤差愈小,必要的抽樣單位數(shù)就需要愈多;反之,允許誤差愈大,抽樣單位數(shù)就可以愈少。 (2)總體方差2。其他條件不變的情況下,總體方差2愈大,總體單位的差異程度愈大,則樣本單位數(shù)應(yīng)愈多;反之,樣本單位數(shù)可愈少。,(3)抽樣估計(jì)的可靠程度。當(dāng)其他條件不變時(shí),抽樣估計(jì)的可靠程度愈高,t數(shù)值愈大,抽樣數(shù)目就必須愈多;反之,抽樣估計(jì)的可靠程度愈低,抽樣數(shù)目就可以愈少。 (4)抽樣方法。相同

16、條件下,由于采用重復(fù)抽樣比不重復(fù)抽樣的誤差大,所以,前者應(yīng)比后者多抽一些樣本單位。 除上述因素之外,抽樣組織方式也是影響抽樣單位數(shù)的一個(gè)原因 。,第四節(jié) 抽樣調(diào)查的組織形式及抽樣估計(jì),一、簡單隨機(jī)抽樣 二、分層抽樣 三、整群抽樣 四、等距抽樣 五、多階段抽樣,簡單隨機(jī)抽樣(純隨機(jī)抽樣),按隨機(jī)原則直接從總體N個(gè)單位中抽取n個(gè)單位作為樣本,不論重復(fù)抽樣或不重復(fù)抽樣,都要保證每個(gè)單位都有相等的中選機(jī)會(huì). 簡單隨機(jī)抽樣在實(shí)踐上受到很多限制,但這種抽樣方式最符合隨機(jī)原則,它的抽樣誤差容易得到數(shù)學(xué)上的論證,所以可以作為設(shè)計(jì)其他更復(fù)雜的抽樣組織的基礎(chǔ),同時(shí)也是衡量其他抽樣組織形式抽樣效果的比較標(biāo)準(zhǔn).,其他

17、抽樣組織方式,抽樣組織方式有簡單隨機(jī)抽樣、分層抽樣、等距抽樣和整群抽樣、多階段抽樣等。(前面做所講的抽樣均屬簡單隨機(jī)抽樣) 一、類型抽樣 二、等距抽樣 三、整群抽樣,一、類型抽樣,(一)概念 又稱分類抽樣或分層抽樣。它是按與調(diào)查目的有關(guān)的某個(gè)主要標(biāo)志將總體單位劃分為若干層(也稱類、組或子總體),然后從每層中按隨機(jī)原則分別抽取一定數(shù)目的單位構(gòu)成樣本。 (二)誤差的計(jì)算 誤差與組內(nèi)方差有關(guān),從每層中抽取樣本單位時(shí),為了保持樣本結(jié)構(gòu)與總體結(jié)構(gòu)相同,通常采用按(等)比例取樣,即按各層單位數(shù)占總體單位數(shù)的比例從中抽取樣本,使各層樣本單位數(shù)與各層總體單位數(shù)之比等于樣本容量與總體容量之比。即,(三)例題,例

18、:某地區(qū)對(duì)居民一年內(nèi)用于某類消費(fèi)的支出進(jìn)行了等比例抽樣,城鎮(zhèn)調(diào)查了40戶,平均支出為350元,方差為2209;農(nóng)村調(diào)查了80戶,平均支出為260元,方差為2916. 要求:以95.45%的置信度估計(jì)該地區(qū)平均每戶支出的區(qū)間.,二、等距抽樣,(一)概念 也稱系統(tǒng)抽樣或機(jī)械抽樣。它是先將總體單位按某一個(gè)抽樣起點(diǎn),再按固定的順序和間隔來抽取樣本單位。 (二)種類 無關(guān)標(biāo)志排隊(duì)機(jī)械抽樣,類似簡單隨機(jī)抽樣 有關(guān)標(biāo)志排隊(duì)機(jī)械抽樣,類似類型抽樣 (三)誤差的計(jì)算,按有關(guān)標(biāo)志排隊(duì)并將總體單位n等分后,取樣方法有以下兩種:,1、半距中點(diǎn)取樣。即在每部分的中間(抽樣距離的一半)抽取一個(gè)單位組成樣本。如,第一部分取

19、第k/2單位,第二部分取第3k/2單位,第n部分取第(2n-1)k/2單位。這種取樣方法,使所抽取的各單位最能代表每部分的一般水平,從而提高樣本的代表性,其不足之處是只能取一個(gè)樣本。,2、對(duì)稱等距取樣。即第一部分隨機(jī)抽取一個(gè)單位,然后據(jù)此在各部分中抽取兩兩對(duì)稱的樣本單位組成樣本。如,第一部分取第i單位,第二部分取第2k-i單位,第三部分取第2k+i單位,第四部分取第4k-i單位,第(n-1)部分取第(n-2)k+i單位,第n部分取第nk-i單位。這種取樣方法,既遵循隨機(jī)原則,又能取到較有代表性的樣本,并且可以抽取k個(gè)樣本。 樣本容量確定的方法與不重復(fù)分層抽樣相同 。,三、整群抽樣,(一)概念

20、也稱集團(tuán)抽樣。它是將總體全部單位分為若干部分(每一部分稱為一個(gè)群體,簡稱群),然后按隨機(jī)原則從中抽取一部分群體,抽中群的所有單位構(gòu)成樣本。整群抽樣對(duì)抽中群體內(nèi)的所有單位進(jìn)行全面調(diào)查,而未抽中群的單位一概不調(diào)查。 例: 1%人口抽樣調(diào)查,例:某工廠連續(xù)生產(chǎn)某種產(chǎn)品,為了了解一級(jí)品率,采用整群抽樣方法,調(diào)查一個(gè)月的全部產(chǎn)品質(zhì)量。每隔20小時(shí)抽取1小時(shí)的產(chǎn)品進(jìn)行檢驗(yàn),結(jié)果一級(jí)品率為80%,群間方差為6%,若置信度為95.45%計(jì)算抽樣誤差。,解:已知R=2430=720,r=720/20=36,p=80%, 若置信度為95.45%,則 =23.982%=7.964% 所以置信區(qū)間為(72.036%,

21、87.982%)。,某化肥廠連續(xù)生產(chǎn),平均每分鐘加工100袋大米?,F(xiàn)采用整群抽樣法,檢查一晝夜加工的每袋大米質(zhì)量及包裝情況,每隔144分鐘抽1分鐘的袋裝大米進(jìn)行檢查,共抽取10分鐘的袋裝大米,結(jié)果如下。要求以95%的置信度估計(jì):(1)該廠一晝夜加工袋裝大米平均重量的置信區(qū)間。(2)包裝一等品率的估計(jì)區(qū)間。,抽樣方式的選擇,以上幾種常用的抽樣組織方式,各有不同的特點(diǎn),適用于不同的場合。在實(shí)際工作中,應(yīng)根據(jù)調(diào)查對(duì)象的性質(zhì),滿足抽樣誤差的要求,并考慮經(jīng)費(fèi)條件,選擇適當(dāng)?shù)某闃臃椒ā?一般來講,比較復(fù)雜的抽樣方式(如分層抽樣、按有關(guān)標(biāo)志排隊(duì)等距抽樣)抽樣誤差較小,但需要花費(fèi)較多的人力、物力和財(cái)力,而且必

22、須事先掌握總體的有關(guān)信息以便適當(dāng)?shù)胤纸M或排隊(duì);相反,較為簡單的抽樣方式,抽樣誤差較大,但經(jīng)費(fèi)較少,事先不需要了解總體的很多信息。,案例導(dǎo)入 案例一:時(shí)下不少大學(xué)生在一邊學(xué)習(xí)的同時(shí)也不斷尋找一些機(jī)會(huì)打些零工以賺點(diǎn)錢彌補(bǔ)學(xué)習(xí)和生活之需,這已經(jīng)是學(xué)生們之間人所共知的事情。這沒有絲毫的讓人好奇之處,讓人好奇的是這些打工的學(xué)生究竟一個(gè)月平均能賺多少錢?假設(shè)有人說:這個(gè)數(shù)據(jù)是500元,你覺得信不信它呢?當(dāng)然,你首先需要收集證據(jù),沒有證據(jù)是肯定說明不了任何問題的。又假設(shè)有人通過組織調(diào)查取得過如下數(shù)據(jù)(調(diào)查到一共30人,單位:元):,假設(shè)檢驗(yàn),350 500 900 100 100 200 240 300 1

23、00 320 450 260 650 380 290 400 800 400 250 400 290 870 540 320 140 160 300 400 500 340 這時(shí)你該做何結(jié)論?就算是你得到以上數(shù)據(jù)的平均數(shù)等于423元,你是否就可以作出“是”或“不是”的回答?因?yàn)槟阋鞒龅幕卮鹗轻槍?duì)整個(gè)總體的,根據(jù)卻又只是來自部分總體即樣本,所以事實(shí)上不論你最終作出的是“是”還是“不是”的回答其實(shí)都存在犯錯(cuò)誤的可能。,那么,如何以樣本數(shù)據(jù)去對(duì)總體參數(shù)下結(jié)論才最科學(xué)最不容易犯錯(cuò)誤呢?這就是一個(gè)屬于單個(gè)總體參數(shù)假設(shè)檢驗(yàn)的問題了。 案例二:你可能認(rèn)為每一個(gè)美國人都知道像這樣一些簡單歷史問題的答案“在美

24、國國旗上有多少顆星?有多少條條紋?星代表什么?條紋又代表什么?”。非常有意思的是,并非每一個(gè)人都知道問題的答案,而且當(dāng)你知道問題的答案時(shí),你也許會(huì)大吃一驚的。,1998年美國雜志Todays America就確實(shí)做過這么一個(gè)調(diào)查,所得到的數(shù)據(jù)肯定多多少少會(huì)出乎很多人的意料之外。下面就是按性別和美國地區(qū)列出的知道星的數(shù)目的成年人的百分比: 男士 女士 大城市 小城鎮(zhèn) 農(nóng)村 知道 72 72 57 56 31 不知道 22 34 25 16 15,在紐約的伊利縣里200個(gè)成人被問及在美國國旗上有多少顆星。上面的表現(xiàn)是屬于每一類的成人的數(shù)目。樣本的結(jié)果被計(jì)算兩次,一次按性別算,另一次按回答問題的成人

25、的住所算。 正確地回答問題的男士的百分比與女士的百分比之間有顯著差別嗎?大城市的成年人的百分比與小城鎮(zhèn)的成年人的百分比之間有顯著差別嗎?小城鎮(zhèn)的百分比與農(nóng)村的百分比之間有顯著差別嗎?這樣的問題屬于兩個(gè)總體參數(shù)假設(shè)檢驗(yàn)問題。,假設(shè)檢驗(yàn)重點(diǎn) 1、假設(shè)檢驗(yàn)的基本原理; 2、假設(shè)檢驗(yàn)的形式與種類; 3、第一類錯(cuò)誤與第二類錯(cuò)誤; 4、假設(shè)檢驗(yàn)的方法。 假設(shè)檢驗(yàn)難點(diǎn) 1、假設(shè)檢驗(yàn)的基本原理; 2、第一類錯(cuò)誤與第二類錯(cuò)誤。,假設(shè)檢驗(yàn),假設(shè)檢驗(yàn)的過程(提出假設(shè)抽取樣本作出決策),所謂假設(shè)檢驗(yàn)(也稱顯著性檢驗(yàn)),就是根據(jù)對(duì)隨機(jī)變量進(jìn)行實(shí)際觀察的結(jié)果(即樣本取值)來判定事先給定的統(tǒng)計(jì)假設(shè)H是否成立的一種推斷過程。

26、 假設(shè)檢驗(yàn)的思想頗為似類于司法程序中的“憑證定罪、疑罪從無”的做法,需要檢驗(yàn)的假設(shè)往往是那些檢驗(yàn)前被默認(rèn)為正確的、除非具有充分證據(jù)否則不希望甚至不允許隨便推翻的結(jié)論性語言。顯著性水平之所以設(shè)得比較小,是為了一旦能夠推翻就肯定有足夠證據(jù);但不能推翻卻未必說明原假設(shè)(零假設(shè))成立。,假設(shè)檢驗(yàn),正因?yàn)榇?,我們說:假設(shè)檢驗(yàn)有個(gè)顯著特點(diǎn),即“信心滿懷地拒絕,含含糊糊地接受”。 參數(shù)估計(jì)與假設(shè)檢驗(yàn)兩種方法間雖有一定相似性,但本質(zhì)性區(qū)別是:前者對(duì)總體一無所知,是求知一事物;后者則有所了解,是求證一事物。,假設(shè)(hypothesis), 對(duì)總體參數(shù)的的數(shù)值所作的一種陳述 總體參數(shù)包括總體均值、比例、方差等 分

27、析之前必需陳述,我認(rèn)為該地區(qū)新生嬰兒的平均體重為3190克!,假設(shè)檢驗(yàn) (hypothesis testing),事先對(duì)總體參數(shù)或分布形式作出某種假設(shè),然后利用樣本信息來判斷原假設(shè)是否成立 有參數(shù)假設(shè)檢驗(yàn)和非參數(shù)假設(shè)檢驗(yàn) 采用邏輯上的反證法,依據(jù)統(tǒng)計(jì)上的小概率原理,假設(shè)檢驗(yàn)中的小概率原理,什么是小概率? 1. 在一次試驗(yàn)中,一個(gè)幾乎不可能發(fā)生的事件發(fā)生的概率 2. 在一次試驗(yàn)中小概率事件一旦發(fā)生,我們就有理由拒絕原假設(shè) 3. 小概率由研究者事先確定,提出原假設(shè)和備擇假設(shè), 什么是原假設(shè)?(null hypothesis) 待檢驗(yàn)的假設(shè),又稱“0假設(shè)” 研究者想收集證據(jù)予以反對(duì)的假設(shè) 3.總是有

28、等號(hào) , 或 4.表示為 H0 H0: 某一數(shù)值 指定為 = 號(hào),即 或 例如, H0: 3190(克), 什么是備擇假設(shè)?(alternative hypothesis) 與原假設(shè)對(duì)立的假設(shè),也稱“研究假設(shè)” 研究者想收集證據(jù)予以支持的假設(shè),總是有不等號(hào): , 或 表示為 H1 H1: 某一數(shù)值 例如, H1: 3910(克),提出原假設(shè)和備擇假設(shè),假設(shè)檢驗(yàn)中的兩類錯(cuò)誤,1.第一類錯(cuò)誤(棄真錯(cuò)誤) 原假設(shè)為真時(shí)拒絕原假設(shè) 會(huì)產(chǎn)生一系列后果 第一類錯(cuò)誤的概率為 被稱為顯著性水平 2.第二類錯(cuò)誤(取偽錯(cuò)誤) 原假設(shè)為假時(shí)接受原假設(shè) 第二類錯(cuò)誤的概率為(Beta), 錯(cuò)誤和 錯(cuò)誤的關(guān)系,H0: 無

29、罪,假設(shè)檢驗(yàn)中的兩類錯(cuò)誤 (決策結(jié)果),假設(shè)檢驗(yàn)就好像一場審判過程,假設(shè)檢驗(yàn)過程,雙側(cè)檢驗(yàn)與單側(cè)檢驗(yàn) (假設(shè)的形式),假設(shè)檢驗(yàn)的流程 提出假設(shè) 確定適當(dāng)?shù)臋z驗(yàn)統(tǒng)計(jì)量 規(guī)定顯著性水平 計(jì)算檢驗(yàn)統(tǒng)計(jì)量的值 作出統(tǒng)計(jì)決策, 什么是檢驗(yàn)統(tǒng)計(jì)量? 1.用于假設(shè)檢驗(yàn)決策的統(tǒng)計(jì)量 2.選擇統(tǒng)計(jì)量的方法與參數(shù)估計(jì)相同,需考慮 是大樣本還是小樣本 總體方差已知還是未知 3. 檢驗(yàn)統(tǒng)計(jì)量的基本形式為,確定適當(dāng)?shù)臋z驗(yàn)統(tǒng)計(jì)量,規(guī)定顯著性水平(significant level), 什么是顯著性水平? 1.是一個(gè)概率值 2.原假設(shè)為真時(shí),拒絕原假設(shè)的概率 被稱為抽樣分布的拒絕域 3.表示為 (alpha) 常用的 值有

30、0.01, 0.05, 0.10 4.由研究者事先確定,作出統(tǒng)計(jì)決策,計(jì)算檢驗(yàn)的統(tǒng)計(jì)量 根據(jù)給定的顯著性水平,查表得出相應(yīng)的臨界值,如:z/2 將檢驗(yàn)統(tǒng)計(jì)量的值與 水平的臨界值進(jìn)行比較 得出拒絕或不拒絕原假設(shè)的結(jié)論,雙側(cè)檢驗(yàn)(原假設(shè)與備擇假設(shè)的確定),例如,某種零件的尺寸,要求其平均長度為10cm,大于或小于10cm均屬于不合格 我們想要證明(檢驗(yàn))大于或小于這兩種可能性中的任何一種是否成立 建立的原假設(shè)與備擇假設(shè)應(yīng)為 H0: = 10 H1: 10,雙側(cè)檢驗(yàn)(顯著性水平與拒絕域 ),一個(gè)總體參數(shù)的檢驗(yàn),總體均值的檢驗(yàn) (2 已知或2未知大樣本),1.假定條件 總體服從正態(tài)分布 若不服從正態(tài)分布, 可用正態(tài)分布來近似(n30) 使用Z-統(tǒng)計(jì)量 2 已知: 2 未知:,2 已知均值的檢驗(yàn)(例題分析),【例】某機(jī)床廠加工一種零件,根據(jù)經(jīng)驗(yàn)知道,該廠加工零件的橢圓度近似服從正態(tài)分布,其總體均值為0=0.081mm,總體標(biāo)準(zhǔn)差為= 0.025 。今換一種新機(jī)床進(jìn)行加工,抽取n=200個(gè)零件進(jìn)行檢驗(yàn),得到的橢圓度為0.076mm。試問新機(jī)床加工零件的橢圓度的均值與以前有無顯著差異

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請(qǐng)下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請(qǐng)聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會(huì)有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫網(wǎng)僅提供信息存儲(chǔ)空間,僅對(duì)用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對(duì)用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對(duì)任何下載內(nèi)容負(fù)責(zé)。
  • 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請(qǐng)與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶因使用這些下載資源對(duì)自己和他人造成任何形式的傷害或損失。

評(píng)論

0/150

提交評(píng)論