




版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請(qǐng)進(jìn)行舉報(bào)或認(rèn)領(lǐng)
文檔簡介
1、4-1,第四章 抽樣分布與參數(shù)估計(jì),第一節(jié) 頻率、概率與概率分布 第二節(jié) 抽樣分布 第三節(jié) 總體參數(shù)估計(jì) 第四節(jié) 抽樣設(shè)計(jì),4-2,第一節(jié) 頻率、概率與概率分布,一、隨機(jī)事件與概率 (一)隨機(jī)試驗(yàn)與事件 隨機(jī)現(xiàn)象的特點(diǎn)是:在條件不變的情況下,一系列的試驗(yàn)或觀測會(huì)得到不同的結(jié)果,并且在試驗(yàn)或觀測前不能預(yù)見何種結(jié)果將出現(xiàn)。對(duì)隨機(jī)現(xiàn)象的試驗(yàn)或觀測稱為隨機(jī)試驗(yàn),它必須滿足以下的性質(zhì): (1)每次試驗(yàn)的可能結(jié)果不是唯一的; (2)每次試驗(yàn)之前不能確定何種結(jié)果會(huì)出現(xiàn); (3)試驗(yàn)可在相同條件下重復(fù)進(jìn)行。,4-3,在隨機(jī)試驗(yàn)中,可能出現(xiàn)也可能不出現(xiàn)的結(jié)果,稱之為隨機(jī)事件,簡稱事件。試驗(yàn)的結(jié)果可能是一個(gè)簡單事
2、件,也可能是一個(gè)復(fù)雜事件。簡單事件就是不可以再分解的事件,又稱為基本事件。復(fù)雜事件是由簡單事件組合而成的事件?;臼录€可稱為樣本點(diǎn),設(shè)試驗(yàn)有n個(gè)基本事件,分別記為 (i=1,2,,n)。集合=1 ,2 , ,n稱為樣本空間,中的元素就是樣本點(diǎn)。,4-4,例:投擲一粒均勻的六面體骰子,出現(xiàn)的點(diǎn)數(shù)有可能是1、2、3、4、5、6共六種。這六種結(jié)果是基本結(jié)果,不可以再分解成更簡單的結(jié)果了,所以=1,2,3,4,5,6為該試驗(yàn)的樣本空間。“出現(xiàn)點(diǎn)數(shù)是奇數(shù)”這一事件就不是簡單事件,它是由基本事件1,3和5組合而成的。我們通常用大寫字母A,B,C,來表示隨機(jī)事件,例如,設(shè)A表示“出現(xiàn)點(diǎn)數(shù)是奇數(shù)”,則A=1
3、,3,5;設(shè)B表示“出現(xiàn)點(diǎn)數(shù)是偶數(shù)”,則B=2,4,6。,4-5,(二)概率 1. 概率的定義 概率就是指隨機(jī)事件發(fā)生的可能性,或稱為機(jī)率,是對(duì)隨機(jī)事件發(fā)生可能性的度量。 進(jìn)行n次重復(fù)試驗(yàn),隨機(jī)事件A發(fā)生的次數(shù)是m次,發(fā)生的頻率是m/n,當(dāng)試驗(yàn)的次數(shù)n很大時(shí),如果頻率在某一數(shù)值p附近擺動(dòng),而且隨著試驗(yàn)次數(shù)n的不斷增加,頻率的擺動(dòng)幅度越來越小,則稱p為事件A發(fā)生的概率,記為:P(A)=p。在古典概型場合, 即基本事件發(fā)生的概率都一樣的場合:,4-6,例:設(shè)一個(gè)袋子中裝有白球2個(gè),黑球3個(gè)。(1) 從中隨機(jī)摸出1只球,問剛好是白球的概率有多大? (2) 從中隨機(jī)摸出2只球,一問2只球都是白球的概率
4、有多大? 二問2只球一白一黑的概率有多大? 三問2只球都是黑球的概率有多大? 解:(1) 由于摸出的任何1只球都形成一個(gè)基本事件,所以樣本點(diǎn)總數(shù)為n=5。用A表示摸出的是白球事件,則A由兩個(gè)基本點(diǎn)組成,即A=白球,白球,有利場合數(shù)m=2。因此,剛好摸出白球的概率為P(A)=m/n=2/5=0.4,4-7,(2) 由于摸出2只球才成一個(gè)基本事件,所以樣本點(diǎn)總數(shù)為 故 P(A)=P(2只球都是白球)=1/ =1/10 P(B)=P(2只球一白一黑)=23/10=6/10 P(C)=P(2只球都是黑球)=3/10 NOTE: P(A+B+C)=1,4-8,2. 概率的基本性質(zhì) 性質(zhì)1 1P(A)0。
5、 性質(zhì)2 P()=1。 性質(zhì)3 若事件A與事件B互不相容,即AB=,則P(AB)=P(A)+P(B)。 推論1 不可能事件的概率為0,即:P()=0。 推論2 P( )=1-P(A), 表示A的對(duì)立事件,即它們二者必有一事件發(fā)生但又不能同時(shí)發(fā)生。,4-9,例:袋中裝有4只黑球和1只白球,每次從袋中隨機(jī)地摸出1只球,并換入1只黑球。連續(xù)進(jìn)行,問第三次摸到黑球的概率是多少? 解: 記A為“第三次摸到黑球”,則 為“第三次摸到白球”。先計(jì)算P( )。 由于袋中只有1只白球,如果某一次摸到了白球,換入了黑球,則袋中只有黑球了。所以相當(dāng)于第一、第二次都是摸到黑球,第三次摸到白球。注意這是一種有放回的摸球
6、,樣本點(diǎn)總數(shù)為53,有利場合數(shù)是421。故: P( )= , 所以,4-10,3. 事件的獨(dú)立性 定義 對(duì)事件A與B,若p(AB)=p(B)p(A),則稱它們是統(tǒng)計(jì)獨(dú)立的,簡稱相互獨(dú)立。 例:已知袋中有6只紅球, 4只白球。從袋中有放回地取兩次球,每次都取1球。設(shè) 表示第i次取到紅球。那么, 因此, ,也就是說,B1,B2相互獨(dú)立。從題目條件看,這一結(jié)論是顯然的。,4-11,二、隨機(jī)變量,隨機(jī)變量X是定義在樣本空間 =1,2,n上的一個(gè)函數(shù),這個(gè)函數(shù)的取值隨試驗(yàn)的結(jié)果不同而變化。這個(gè)函數(shù)還要求滿足條件:對(duì)任意的實(shí)數(shù)x,Xx是隨機(jī)事件。如果隨機(jī)變量所有可能的取值是有限的,或可排成一列的,這種隨機(jī)
7、變量稱為離散型隨機(jī)變量;另一種情況是隨機(jī)變量的取值范圍是一個(gè)區(qū)間或整個(gè)數(shù)軸,這種隨機(jī)變量稱為連續(xù)型隨機(jī)變量。 1. 離散型隨機(jī)變量的概率分布 設(shè)離散型隨機(jī)變量X的所有可能取值為x1, x2,, xn, ,相應(yīng)的概率為p(x1),p(x2),p(xn),。用表格統(tǒng)一表示出來是:,4-12,X x1 x2 xn P p(x1) p(x2) p(xn) 這稱為離散型隨機(jī)變量X的概率分布。 性質(zhì):(1) 0p(xi)1 (i=1,2, ); (2) 定義: 離散型隨機(jī)變量X的期望值為 性質(zhì): 其中X1,X2都是隨機(jī)變量,是任意常數(shù)。,4-13,定義: 離散型隨機(jī)變量X的方差為 方差的平方根稱為標(biāo)準(zhǔn)差。
8、 方差2或標(biāo)準(zhǔn)差反映隨機(jī)變量X相對(duì)其期望值的 離散程度,2或越小, 說明期望值的代表性越好;2或越大,說明期望值的代表性越差。 性質(zhì):對(duì)于任意的,D(X)=2 D(X) 成立,4-14,貝努里試驗(yàn) 與二項(xiàng)分布 有時(shí)我們只對(duì)試驗(yàn)中某事件A是否出現(xiàn)感興趣,如果A發(fā)生,我們稱“成功”,否則稱“失敗”。像這樣只有兩種結(jié)果的試驗(yàn)稱為貝努里試驗(yàn)。設(shè)A出現(xiàn)的概率為p,我們獨(dú)立地重復(fù)進(jìn)行n次貝努里試驗(yàn),稱為n重貝努里試驗(yàn).以Bk表示n重貝努里試驗(yàn)中事件A正好出現(xiàn)k次這一事件,則 (k=0,1,2,,n) 該分布稱為二項(xiàng)分布( q= 1- p ). NOTE:,4-15,2. 連續(xù)型隨機(jī)變量的概率分布 設(shè)X是R
9、.V., x 是一實(shí)數(shù). 記 F(x)=P(Xx)。該函數(shù)就是隨機(jī)變量X的分布函數(shù)。分布函數(shù)的導(dǎo)數(shù)稱為密度函數(shù),記作p(x )。 性質(zhì) (1) p(x)0 (2) (3),4-16,定義: 連續(xù)型隨機(jī)變量X的期望值為 方差為 性質(zhì): D(X)=2 D(X),4-17,正態(tài)分布 如果連續(xù)型隨機(jī)變量X的密度函數(shù)為 則稱隨機(jī)變量X服從均值為,方差為2的正態(tài)分布,記為XN(,2)。 如果一個(gè)正態(tài)分布的=0,=1,則稱該正態(tài)布為標(biāo)準(zhǔn)正態(tài)分布,相應(yīng)的隨機(jī)變量稱為標(biāo)準(zhǔn)正態(tài)隨機(jī)變量,用Z表示,即ZN(0,1),相應(yīng)的分布密度函數(shù)為,4-18,一般正態(tài)分布 與標(biāo)準(zhǔn)正態(tài)分布 的關(guān)系: 若隨機(jī)變量X服從正態(tài)分布N
10、(,2),則隨機(jī) 變量 Z = 服從標(biāo)準(zhǔn)正態(tài)分布,即ZN(0,1)。,4-19,例:某大學(xué)英語考試成績服從正態(tài)分布,已知平均成績?yōu)?0分,標(biāo)準(zhǔn)差為10分。求該大學(xué)英語成績?cè)?075分的概率。,4-20,第二節(jié) 抽樣分布,一、抽樣的基本概念 二、抽樣分布 (一)重復(fù)抽樣分布 (二)不重復(fù)抽樣分布 三、大數(shù)定理與中心極限定理,4-21,一、抽樣的基本概念,抽樣涉及的基本概念有: 總體與樣本(見第一章) 樣本容量與樣本個(gè)數(shù) 總體參數(shù)與樣本統(tǒng)計(jì)量 重復(fù)抽樣與不重復(fù)抽樣 這些概念是統(tǒng)計(jì)學(xué)特有的,體現(xiàn)了統(tǒng)計(jì)學(xué)的基本思想與方法。,4-22,總體和樣本(參見第1章),1.總體:又稱全及總體、母體,指所要研究對(duì)
11、象的全體,由許多客觀存在的具有某種共同性質(zhì)的單位構(gòu)成。總體單位數(shù)用 N 表示。 2.樣本:又稱子樣,來自總體,是從總體中按隨機(jī)原則抽選出來的部分,由抽選的單位構(gòu)成。樣本單位數(shù)用 n 表示。 3.總體是唯一的、確定的,而樣本是不確定的、可變的、隨機(jī)的。,4-23,樣本容量與樣本個(gè)數(shù),樣本容量:一個(gè)樣本中所包含的單位數(shù),用n表示。 樣本個(gè)數(shù):又稱樣本可能數(shù)目,指從一個(gè)總體中所可能抽取的樣本的個(gè)數(shù)。對(duì)于有限總體,樣本個(gè)數(shù)可以計(jì)算出來。樣本個(gè)數(shù)的多少與抽樣方法有關(guān)。(這個(gè)概念只是對(duì)有限總體有意義,對(duì)無限總體沒有意義!),4-24,總體參數(shù)和樣本統(tǒng)計(jì)量,總體參數(shù):反映總體數(shù)量特征的指標(biāo)。其數(shù)值是唯一的、
12、確定的。 樣本統(tǒng)計(jì)量:根據(jù)樣本分布計(jì)算的指標(biāo)。是隨機(jī)變量。,4-25,重復(fù)(置)抽樣與不重復(fù)(置)抽樣,重置抽樣與不重置抽樣(各有3個(gè)特點(diǎn)P90) 重復(fù)抽樣:例如從A、B、C、D、E五個(gè)字母中隨機(jī)抽取兩個(gè)作為樣本。N=5,n=2 考慮順序時(shí):樣本個(gè)數(shù)=Nn=52=25 不考慮順序時(shí):樣本個(gè)數(shù)=,4-26,重復(fù)(置)抽樣與不重復(fù)(置)抽樣,不重復(fù)抽樣: 例如從A、B、C、D、E五個(gè)字母中隨機(jī)抽取兩個(gè)作為樣本。N=5,n=2 考慮順序時(shí):樣本個(gè)數(shù) 不考慮順序時(shí):樣本個(gè)數(shù),4-27,二、抽樣分布,抽樣分布的概念:由樣本統(tǒng)計(jì)量的全部可能取值和與之相應(yīng)的概率(頻率)組成的分配數(shù)列。(主要求出樣本平均數(shù)的
13、期望與方差) 包括以下內(nèi)容 重置抽樣分布 樣本平均數(shù)的分布 樣本成數(shù)的分布 不重置抽樣分布 樣本平均數(shù)的分布 樣本成數(shù)的分布,4-28,重置抽樣分布-樣本平均數(shù)的分布,某班組5個(gè)工人的日工資為34、38、42、46、50元。 = 42 2 = 32 現(xiàn)用重置抽樣的方法從5人中隨機(jī)抽2個(gè)構(gòu)成樣本。共有52=25個(gè)樣本。如右圖。,4-29,驗(yàn)證了以下兩個(gè)結(jié)論: 抽樣平均數(shù)的標(biāo)準(zhǔn)差反映所有的樣本平均數(shù)與總體平均數(shù)的平均誤差,稱為抽樣平均誤差,用 表示。,重置抽樣分布-樣本平均數(shù)的分布,4-30,重置抽樣分布-樣本平均數(shù)的分布,由概率論知,如果總體是正態(tài)分布的,則樣本平均數(shù)的抽樣分布是如下正態(tài)分布 這
14、是一個(gè)非常重要的結(jié)論,有廣泛的應(yīng)用。(請(qǐng)參見中心極限定理。),4-31,重置抽樣分布-樣本成數(shù)的分布,總體成數(shù)p是指具有某種特征的單位在總體中的比重。成數(shù)是一個(gè)特殊平均數(shù),設(shè)總體單位總數(shù)目是N,總體中有該特征的單位數(shù)是N1。設(shè)x是0、1變量(總體單位有該特征,則x取1,否則取0),則有: 現(xiàn)從總體中抽出n個(gè)單位,如果其中有相應(yīng)特征的單位數(shù)是n1,則樣本成數(shù)是: P也是一個(gè)隨機(jī)變量,利用樣本平均數(shù)的分布性質(zhì)結(jié)論,即有:,4-32,不重置抽樣分布,樣本均值的分布性質(zhì): 樣本成數(shù)的分布性質(zhì),4-33,抽樣分布總結(jié),4-34,三、大數(shù)定理與中心極限定理,大數(shù)定理,當(dāng)樣本容量n 充分大時(shí),可以用樣本平均
15、估計(jì)總體平均。,當(dāng)試驗(yàn)次數(shù)n充分大時(shí),可以用頻率代替概率。,大數(shù)定理的意義:個(gè)別現(xiàn)象受偶然因素影響,但是,對(duì)總體的大量觀察后進(jìn)行平均,就能使偶然因素的影響相互抵消,從而使總體平均數(shù)穩(wěn)定下來,反映出事物變化的一般規(guī)律,這就是大數(shù)定理的意義。,4-35,中心極限定理,正態(tài)分布的再生定理 :相互獨(dú)立的兩個(gè)正態(tài)隨機(jī)變量相加之和仍服從正態(tài)分布。 中心極限定理: 大樣本的平均數(shù)近似服從正態(tài)分布。,4-36,例1:求樣本平均數(shù)的概率分布,設(shè)某公司1000名職工的人均年獎(jiǎng)金為2000元,標(biāo)準(zhǔn)差500元,隨機(jī)抽取36人作為樣本進(jìn)行調(diào)查,問樣本的人均年獎(jiǎng)金在19002200元之間的概率有多大?,4-37,例2,某
16、地區(qū)職工家庭的人均年收入平均為12000元,標(biāo)準(zhǔn)差為2000元。若知該地區(qū)家庭的人均年收入服從正態(tài)分布,現(xiàn)采用重復(fù)抽樣從總體中隨機(jī)抽取25戶進(jìn)行調(diào)查,問出現(xiàn)樣本平均數(shù)等于或超過12500元的可能性有多大?,4-38,例3,某商場推銷一種洗發(fā)水。據(jù)統(tǒng)計(jì),本年度購買此種洗發(fā)水的有10萬人,其中6萬是女性。如果按不重復(fù)隨機(jī)抽樣方法,從購買者中抽出100人進(jìn)行調(diào)查,問樣本中女性比例超過50%的可能性有多大?,4-39,第三節(jié) 總體參數(shù)估計(jì),本節(jié)主要內(nèi)容: 總體參數(shù)估計(jì)概述 總體參數(shù)的點(diǎn)估計(jì) 參數(shù)區(qū)間估計(jì) 樣本容量的確定,4-40,一、總體參數(shù)估計(jì)概述,設(shè)待估計(jì)的總體參數(shù)是,用以估計(jì)該參數(shù)的統(tǒng)計(jì)量是 ,
17、抽樣估計(jì)的極限誤差是,即: 極限誤差是根據(jù)研究對(duì)象的變異程度和分析任務(wù)的性質(zhì)來確定的在一定概率下的允許誤差范圍。 參數(shù)估計(jì)的兩個(gè)要求: 精度:估計(jì)誤差的最大范圍,通過極限誤差來反映。顯然,越小,估計(jì)的精度要求越高,越大,估計(jì)的精度要求越低。極限誤差的確定要以實(shí)際需要為基本標(biāo)準(zhǔn)。 可靠性:估計(jì)正確性的一個(gè)概率保證,通常稱為估計(jì)的置信度。,4-41,二、總體參數(shù)的點(diǎn)估計(jì),點(diǎn)估計(jì)的含義:直接以樣本統(tǒng)計(jì)量作為相應(yīng)總體參數(shù)的估計(jì)量。,4-42,優(yōu)良估計(jì)量標(biāo)準(zhǔn),優(yōu)良估計(jì)標(biāo)準(zhǔn): 無偏性:要求樣本統(tǒng)計(jì)量的平均數(shù)等于被估計(jì)的總體參數(shù)本身。 一致性:當(dāng)樣本容量充分大時(shí),樣本統(tǒng)計(jì)量充分靠近總體參數(shù)本身。 有效性:,
18、總體方差的無偏估計(jì)量為樣本方差,點(diǎn)估計(jì)完全正確的概率通常為0。因此,我們更多的是考慮用樣本統(tǒng)計(jì)量去估計(jì)總體參數(shù)的范圍 區(qū)間估計(jì)。,4-43,三、參數(shù)區(qū)間估計(jì),參數(shù)區(qū)間估計(jì)的含義:估計(jì)總體參數(shù)的區(qū)間范圍,并給出區(qū)間估計(jì)成立的概率值。 其中: 1-(01)稱為置信度;是區(qū)間估計(jì)的顯著性水平,其取值大小由實(shí)際問題確定,經(jīng)常取1%、5%和10%。,注間對(duì)上式的理解: 例如抽取了1000個(gè)樣本,根據(jù)每一個(gè)樣本均構(gòu)造了一個(gè)置信區(qū)間,這樣,由1000個(gè)樣本構(gòu)造的總體參數(shù)的1000個(gè)置信區(qū)間中,有95%的區(qū)間包含了總體參數(shù)的真值,而5%的置信區(qū)間則沒有包含。這里,95%這個(gè)值被稱為置信水平(或置信度)。 一般
19、地,將構(gòu)造置區(qū)間的步驟重復(fù)很多次,置信區(qū)間包含總體參數(shù)真值的次數(shù)所占的比例稱為置信水平。,4-44,我們用95%的置信水平得到某班學(xué)生考試成績的置信區(qū)間為60-80分,如何理解? 錯(cuò)誤的理解:60-80區(qū)間以95%的概率包含全班同學(xué)平均成績的真值;或以95%的概率保證全班同學(xué)平均成績的真值落在60-80分之間。 正確的理解:如果做了多次抽樣(如100次),大概有95次找到的區(qū)間包含真值,有5次找到的區(qū)間不包括真值。 真值只有一個(gè),一個(gè)特定的區(qū)間“總是包含”或“絕對(duì)不包含”該真值。但是,用概率可以知道在多次抽樣得到的區(qū)間中大概有多少個(gè)區(qū)間包含了參數(shù)的真值。 如果大家還是不能理解,那你們最好這樣回
20、答有關(guān)區(qū)間估計(jì)的結(jié)果: 該班同學(xué)平均成績的置信區(qū)間是60-80分,置信度為95%。,4-45,區(qū)間估計(jì)的基本要素,包括:樣本點(diǎn)估計(jì)值、抽樣極限誤差、估計(jì)的可靠程度 樣本點(diǎn)估計(jì)值 抽樣極限誤差:可允許的誤差范圍。 抽樣估計(jì)的可靠程度(置信度、概率保證程度)及概率度 注意:本教材所進(jìn)行的區(qū)間估計(jì)僅指對(duì)總體平均數(shù)或成數(shù)的區(qū)間估計(jì),并且在際計(jì)算過程中使用下面的式子。式中是極限誤差。,4-46,區(qū)間估計(jì)的內(nèi)容,4-47,平均數(shù)的區(qū)間估計(jì),對(duì)總體平均數(shù)或成數(shù)的區(qū)間估計(jì)時(shí),使用下面的式子 (式中是極限誤差) 有兩種模式: 1、根據(jù)置信度1-,求出極限誤差,并指出總體平均數(shù)的估計(jì)區(qū)間。 2、給定極限誤差,求置
21、信度。,4-48,當(dāng)已知時(shí),根據(jù)相關(guān)的抽樣分布定理, 服從標(biāo)準(zhǔn)正態(tài)分布N(0,1)。查正態(tài)分布概率表,可得 (一般記為 ),則 ,根據(jù)重復(fù)抽樣與不重復(fù)抽樣的 求法的不同,進(jìn)一步可得總體平均數(shù)的估計(jì)區(qū)間: 重復(fù)抽樣時(shí),區(qū)間的上下限為: 不重復(fù)抽樣時(shí),區(qū)間的上下限為:,平均數(shù)區(qū)間估計(jì)第1種模式(求置信區(qū)間),4-49,4-50,平均數(shù)區(qū)間估計(jì)第1種模式(求置信區(qū)間),若總體方差未知,則在計(jì)算 時(shí),使用樣本方差代替總體方差,此時(shí) 服從自由度為n-1的t分布。查t分布表可得 ,并記為 于是: 重復(fù)抽樣時(shí),區(qū)間的上下限為: 不重復(fù)抽樣時(shí),區(qū)間的上下限為:,大樣本時(shí),t分布與標(biāo)準(zhǔn)正態(tài)分布非常接近,可直接從
22、標(biāo)準(zhǔn)正態(tài)分布表查臨界值,4-51,例:總體平均數(shù)的區(qū)間估計(jì)1,對(duì)某型號(hào)的電子元件進(jìn)行耐用性能檢查,抽查資料分組如下表,要求估計(jì)該批電子元件的平均耐用時(shí)數(shù)的置信區(qū)間(置信度95%)。,4-52,68.27%的樣本,表示樣本均值落在區(qū)間的概率是1-,例,對(duì)總體均值區(qū)間估計(jì)的進(jìn)一步理解,4-53,平均數(shù)區(qū)間估計(jì)第2種模式(求置信度),給定極限誤差,求置信度,4-54,例:總體平均數(shù)的區(qū)間估計(jì)2,例:經(jīng)抽樣調(diào)查計(jì)算樣本畝產(chǎn)糧食600公斤,并求得抽樣平均誤差為3公斤,現(xiàn)給定允許極限誤差為6公斤,求置信區(qū)間包含總體平均畝產(chǎn)的概率,即求置信水平。,結(jié)果表明,如果多次反復(fù)抽樣,每次都可以由樣本值確定一個(gè)估計(jì)區(qū)
23、間,每個(gè)區(qū)間或者包含總體參數(shù)的真值,或者不包含總體參數(shù)的真值,包含真值的區(qū)間占F(z),即每一萬次抽樣,就有9545個(gè)樣本區(qū)間包括總體畝產(chǎn),其余455個(gè)樣本區(qū)間不包括總體平均數(shù),即若接受估計(jì)區(qū)間的判斷要冒4.55%的機(jī)會(huì)犯錯(cuò)誤的風(fēng)險(xiǎn)。,4-55,成數(shù)的區(qū)間估計(jì),由于總體的分布是(0,1)分布,只有在大樣本的情況下,才服從正態(tài)分布。總體成數(shù)可以看成是一種特殊的平均數(shù),類似于總體平均數(shù)的區(qū)間估計(jì),總體成數(shù)的區(qū)間估計(jì)的上下限是: 注意:在實(shí)踐中,由于總體成數(shù)常常未知,這時(shí),抽樣平均誤差公式中的總體成數(shù)用樣本成數(shù)代替。 大樣本的條件:np5且n(1-p) 5,由于總體成數(shù)p通常未知,可以用樣本成數(shù)來近
24、似判斷。,4-56,例:總體平均數(shù)的區(qū)間估計(jì)3,對(duì)某型號(hào)的電子元件進(jìn)行耐用性能檢查,抽查資料分組如下表, 設(shè)該廠的產(chǎn)品質(zhì)量檢驗(yàn)標(biāo)準(zhǔn)規(guī)定,元件耐用時(shí)數(shù)達(dá)到1000小時(shí)以上為合格品。要求估計(jì)該批電子元件的合格率,置信水平95%。,4-57,總體均值區(qū)間估計(jì)總結(jié),如果是正態(tài)總體,4-58,如果不是正態(tài)總體,或分布未知,此時(shí)不考慮小樣本情況,因此,大樣本情況下,直接用標(biāo)準(zhǔn)正態(tài)分布求置信區(qū)間即可。,4-59,總體成數(shù)估計(jì)區(qū)間估計(jì)總結(jié),總體成數(shù)估計(jì)區(qū)間的上下限 只考慮大樣本情況(請(qǐng)記住大樣本條件),4-60,對(duì)總量指標(biāo)的區(qū)間估計(jì),在對(duì)總體平均數(shù)進(jìn)行區(qū)間估計(jì)的基礎(chǔ)上,可進(jìn)一步推斷相應(yīng)的總量指標(biāo),即用總體單位
25、總數(shù)N分別乘以總體平均數(shù)的區(qū)間下限和區(qū)間上限,便得到相應(yīng)總量(N)的區(qū)間范圍。,4-61,例1,某廠對(duì)一批產(chǎn)品的質(zhì)量進(jìn)行抽樣檢驗(yàn),采用重復(fù)抽樣抽取樣品200只,樣本優(yōu)質(zhì)率為85%,試計(jì)算當(dāng)把握程度為90%時(shí)優(yōu)質(zhì)品率的區(qū)間范圍。,4-62,例2,某商場從一批食品(共800袋)中隨機(jī)抽取40袋(假設(shè)用重復(fù)抽樣),測得每袋平均重量為791.1克,標(biāo)準(zhǔn)差為17.136克,要求以95%的把握程度,估計(jì)這批食品的平均每袋重量以及這批食品總重量的區(qū)間范圍。,800*778.84,800*803.36,即623072,642688,4-63,三、樣本容量確定,什么是樣本容量確定問題?,4-64,確定樣本容量,
26、在設(shè)計(jì)抽樣時(shí),先確定允許的誤差范圍和必要的概率保證程度,然后根據(jù)歷史資料或試點(diǎn)資料確定總體的標(biāo)準(zhǔn)差,最后來確定樣本容量。,4-65,確定樣本容量應(yīng)注意的問題,計(jì)算樣本容量時(shí),一般總體的方差與成數(shù)都是未知的,可用有關(guān)資料替代: 一是用歷史資料已有的方差與成數(shù)代替; 二是在進(jìn)行正式抽樣調(diào)查前進(jìn)行幾次試驗(yàn)性調(diào)查,用試驗(yàn)中方差的最大值代替總體方差; 三是成數(shù)方差在完全缺乏資料的情況下,就用成數(shù)方差的最大值0.25代替。 如果進(jìn)行一次抽樣調(diào)查,同時(shí)估計(jì)總體均值與成數(shù),用上面的公式同時(shí)計(jì)算出兩個(gè)樣本容量,可取一個(gè)最大的結(jié)果,同時(shí)滿足兩方面的需要。 上面的公式計(jì)算結(jié)果如果帶小數(shù),這時(shí)樣本容量不按四舍五入法則
27、取整數(shù),取比這個(gè)數(shù)大的最小整數(shù)代替。例如計(jì)算得到:n=56.03,那么,樣本容量取57,而不是56。,4-66,例:確定樣本容量1,對(duì)某批木材進(jìn)行檢驗(yàn),根據(jù)以往經(jīng)驗(yàn),木材長度的標(biāo)準(zhǔn)差為0.4米,而合格率為90%。現(xiàn)采用重復(fù)抽樣方式,要求在95.45%的概率保證程度下,木材平均長度的極限誤差不超過0.08米,抽樣合格率的極限誤差不超過5%,問必要的樣本單位數(shù)應(yīng)該是多少?,4-67,例:確定樣本容量2,對(duì)某批木材進(jìn)行檢驗(yàn),根據(jù)以往經(jīng)驗(yàn),木材的合格率為90%、92%、95%。現(xiàn)采用重復(fù)抽樣方式,要求在95.45%的概率保證程度下,抽樣合格率的極限誤差不超過5%,問必要的樣本單位數(shù)應(yīng)該是多少?,4-6
28、8,第四節(jié) 抽樣的組織形式,本節(jié)主要內(nèi)容: 抽樣估計(jì)效果的衡量與抽樣組織形式 簡單隨機(jī)抽樣 類型抽樣 整群抽樣 等距抽樣 階段抽樣 不同抽樣組織設(shè)計(jì)的比較,4-69,一、抽樣估計(jì)效果的衡量與抽樣組織形式,抽樣估計(jì)效果好壞,關(guān)鍵是抽樣平均誤差的控制。抽樣平均誤差小,抽樣效果從整體上看就是好的;否則,抽樣效果就不理想。 抽樣平均誤差受以下幾方面的因素影響: 一是總體的變異性,即與總體的標(biāo)準(zhǔn)差大小有關(guān) 二是樣本容量 三是抽樣方法。 四是抽樣的組織形式 抽樣的組織形式有如下幾種:簡單隨機(jī)抽樣、類型抽樣、等距抽樣、整群抽樣、階段抽樣,4-70,二、簡單隨機(jī)抽樣,4-71,三、類型抽樣,含義:又稱分層抽樣
29、。對(duì)總體各單位按一定標(biāo)志加以分組,然后從每一組中按隨機(jī)原則抽取一定單位構(gòu)成樣本。,得到樣本如下:,4-72,類型抽樣求樣本平均數(shù),4-73,類型抽樣求抽樣平均誤差,4-74,類型抽樣求抽樣平均誤差,4-75,類型抽樣兩點(diǎn)結(jié)論,從類型抽樣的抽樣平均誤差公式來看,類型抽樣的抽樣平均誤差與組間方差無關(guān),它決定于組內(nèi)方差的平均水平。而方差的加法定理: ,因此有如下結(jié)論: 抽樣效果一般來說好于簡單隨機(jī)抽樣。 因此在分組時(shí)應(yīng)盡量擴(kuò)大組間方差(組間差異),縮小組內(nèi)方差(組內(nèi)差異),從而減少抽樣誤差,提高抽樣效果。,4-76,類型抽樣例,假設(shè)某農(nóng)場種植小麥1 200畝,根據(jù)其地理?xiàng)l件劃分為甲、乙、丙三類,按5
30、%的比例總共抽取60畝進(jìn)行調(diào)查,結(jié)果如下表所示。試以95%的概率估計(jì)農(nóng)場平均畝產(chǎn)量的區(qū)間范圍。,4-77,四、整群抽樣,定義:又稱集團(tuán)抽樣。將總體各單位分為若干群,然后從中抽取部分群,對(duì)中選群的所有單位進(jìn)行全面調(diào)查。,4-78,整群抽樣抽樣平均誤差的計(jì)算,在計(jì)算抽樣平均誤差時(shí)假定每群單位數(shù)是相同的,但實(shí)際工作中,通常是“自然群”,其單位數(shù)一般是不等的。,4-79,整群抽樣抽樣效果評(píng)價(jià),好處是操作方便、省時(shí)、省力。確定一群便可以調(diào)查許多單位,但正是由于抽樣單位比較集中,限制了樣本單位在總體中分配的均勻性,所以有時(shí)代表性較代,抽樣誤差較大??梢栽黾訕颖締挝粊頊p少誤差 。 抽樣平均誤差只取決于群間方
31、差(與類型抽樣相反),因此分群時(shí),應(yīng)盡量擴(kuò)大群內(nèi)方差(群內(nèi)差異),縮小群間方差(群間差異)來提高抽樣效果。,4-80,整群抽樣例1,從某縣的100個(gè)村莊中抽出10村,進(jìn)行調(diào)查得平均每戶飼養(yǎng)家禽35頭,各村的平均數(shù)的方差為16頭,請(qǐng)計(jì)算平均抽樣誤差。,4-81,整群抽樣例2,假設(shè)某水泥廠大量連續(xù)生產(chǎn)100公斤裝水泥,一晝夜產(chǎn)量為14 400袋,平均每分鐘產(chǎn)量10袋?,F(xiàn)每隔144分鐘抽取一分鐘的產(chǎn)量(10袋為一群),一晝夜共抽取100袋水泥,觀察結(jié)果如下表,試計(jì)算樣本平均數(shù)的抽樣平均誤差,并以95%的概率估計(jì)每包水泥重量的區(qū)間范圍。,4-82,五、等距抽樣,含義:又稱機(jī)械抽樣或系統(tǒng)抽樣。先按某個(gè)標(biāo)
32、志對(duì)總體單位進(jìn)行排序,然后依固定的間隔來抽取樣本單位。這樣可以保證樣本單位均勻地分布在總體的各個(gè)部分,有較高的代表性。 總體的單位數(shù)N,需要抽取的樣本單位數(shù)n,則等距抽樣的間隔大?。簁=N/n,總體排序標(biāo)志是由總體的有關(guān)輔助信息確定的,與調(diào)查標(biāo)志兩者間可以有關(guān)也可以無關(guān)。 1、無關(guān)標(biāo)志排隊(duì):如家計(jì)調(diào)查,按門牌號(hào)碼排序。 2、有關(guān)標(biāo)志排隊(duì):如農(nóng)產(chǎn)量調(diào)查按平均畝產(chǎn)量高低排序。 一般來講,有關(guān)標(biāo)志排序要比無關(guān)標(biāo)志排序的機(jī)械抽樣更為優(yōu)越。,在排隊(duì)時(shí),要注意避免抽樣間隔與現(xiàn)象本身的周期性節(jié)奏相重合。以減少系統(tǒng)偏差的影響,提高樣本的代表性。,4-83,等距抽樣抽樣平均誤差的計(jì)算,無關(guān)標(biāo)志排隊(duì)時(shí),為了方便起
33、見,可以采用簡單隨機(jī)抽樣的平均誤差代替等距抽樣平均誤差 :,4-84,六、階段抽樣,含義:所謂階段抽樣,就是先從總體中抽出較大的范圍的單位,再從中選的大單位中抽較小范圍的單位,依次類推,最后從更小的范圍抽出樣本基本單位。 階段抽樣一般應(yīng)用于總體范圍很大的情況。如在我國的農(nóng)產(chǎn)量調(diào)查、職工家計(jì)調(diào)查中都很適用:先從全國抽出各個(gè)省,再從抽中的省中抽出縣、市,最后抽出樣本的基本單位等等。,4-85,階段抽樣兩階段抽樣,兩階段抽樣較為簡單。本書主要分析兩階段抽樣平均誤差的控制問題。 兩階段抽樣在組織技術(shù)上可以看成是整群抽樣和類型抽樣的結(jié)合。 設(shè)總體分成R組,每組M個(gè)單位。兩階段抽樣就是:第一階段用整群抽樣
34、方式從總體的全部R組(群)中,隨機(jī)抽取r組(群);第二階段用類型抽樣方式從每個(gè)中選組中抽出m樣本單位。,4-86,兩階段抽樣樣本平均數(shù),4-87,兩階段抽樣抽樣平均誤碼,兩階段抽樣的平均誤差是由兩部分構(gòu)成的,第一部分是第一階段從總體全部組抽部分組所引起的組間誤差,第二部分是由第二階段在中選組中抽部分單位所引起的組內(nèi)平均誤差。,4-88,七、不同抽樣組織設(shè)計(jì)的比較,進(jìn)行抽樣設(shè)計(jì)時(shí)需要考慮的兩個(gè)問題: 提高樣本的代表性,增加抽樣的效果。抽樣要滿足隨機(jī)性要求。 抽樣設(shè)計(jì)時(shí),要充分考慮如何降低抽樣的成本費(fèi)用。,4-89,簡單隨機(jī)抽樣是基本抽樣組織方式,抽樣推斷效果如何,依賴于所抽出樣本的質(zhì)量;樣本的質(zhì)
35、量好壞,就看樣本對(duì)總體的代表性如何,而這又依賴于抽取樣本時(shí)的 “隨機(jī)性”。 如果不滿足隨機(jī)性,則樣本的代表性就值得懷疑,抽樣推斷就無從進(jìn)行。,4-90,類型抽樣與整群抽樣比較,1、抽樣平均誤差的決定因素不同。 類型抽樣的平均誤差與組間方差無關(guān),決定于組內(nèi)方差的平均水平 整群抽樣的平均誤差與組內(nèi)方差無關(guān),決定于組間方差大小 2、減小類型抽樣與整群抽樣平均誤差的方法不同。 因?yàn)榭傮w方差等于組間方差加上組內(nèi)方差平均數(shù)。所以提高組間方差,降低組內(nèi)方差可減小類型抽樣平均誤差 對(duì)于整群抽樣則相反 3、適應(yīng)范圍不同。 類型抽樣充分利用總體的已有信息,其前提就是對(duì)總體的結(jié)構(gòu)事先有一定的認(rèn)識(shí),然后通過分類把總體中調(diào)查標(biāo)志差異比較接近的單位歸為一組,減少組內(nèi)差異,再從各組中抽出樣本,這樣的樣本就對(duì)總體有更大的代表性。 整群抽樣適用于無原始資料可利用的總體單位。是一種較為方便有效的抽樣組織方式,有利于提高抽樣的效率。但要注意整群抽樣有時(shí)代表性不是很理想,抽樣誤差較大。在實(shí)際抽樣中,通常要適當(dāng)增加一些樣本單位,以利于縮小抽樣誤差,提高抽樣推斷的準(zhǔn)確度。,4-91,階段抽樣平均誤差的控制,階段抽樣誤差的控制必須落實(shí)到抽樣的各個(gè)階段。兩階段抽樣誤差控制,要落實(shí)為第一階段的整群抽樣的誤差控制與第二階段的類型抽樣的誤差控制兩方面。 兩階段抽樣平均
溫馨提示
- 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請(qǐng)下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請(qǐng)聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
- 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會(huì)有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
- 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
- 5. 人人文庫網(wǎng)僅提供信息存儲(chǔ)空間,僅對(duì)用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對(duì)用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對(duì)任何下載內(nèi)容負(fù)責(zé)。
- 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請(qǐng)與我們聯(lián)系,我們立即糾正。
- 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶因使用這些下載資源對(duì)自己和他人造成任何形式的傷害或損失。
最新文檔
- 碳灰磚項(xiàng)目可行性研究報(bào)告
- 2025-2030全球及中國液化石油氣車輛行業(yè)市場現(xiàn)狀供需分析及市場深度研究發(fā)展前景及規(guī)劃可行性分析研究報(bào)告
- 2025-2030全球及中國汽車晶體管行業(yè)市場現(xiàn)狀供需分析及市場深度研究發(fā)展前景及規(guī)劃可行性分析研究報(bào)告
- 2025-2030全球及中國機(jī)器學(xué)習(xí)基礎(chǔ)架構(gòu)即服務(wù)行業(yè)市場現(xiàn)狀供需分析及市場深度研究發(fā)展前景及規(guī)劃可行性分析研究報(bào)告
- 2025-2030全球及中國收入保證行業(yè)市場現(xiàn)狀供需分析及市場深度研究發(fā)展前景及規(guī)劃可行性分析研究報(bào)告
- 瀝青混凝土攪拌站項(xiàng)目可行性研究報(bào)告
- 玻璃熔化窯爐節(jié)能技術(shù)改造項(xiàng)目可行性研究報(bào)告
- 影視制作過程質(zhì)量目標(biāo)及質(zhì)量保證措施
- 新基建資源保障措施建設(shè)
- 醫(yī)院醫(yī)療質(zhì)量安全事件報(bào)告制度與流程
- 青藍(lán)工程師傅心得體會(huì)
- 風(fēng)機(jī)基礎(chǔ)錨栓安裝技術(shù)交底
- 2022更新國家開放大學(xué)電大《調(diào)劑學(xué)》網(wǎng)絡(luò)核心課形考網(wǎng)考作業(yè)及答案
- 廣西鼎固經(jīng)緯新材料科技有限公司年加工50萬噸礦粉生產(chǎn)項(xiàng)目環(huán)評(píng)報(bào)告表
- 外研版六年級(jí)英語下冊(cè) Module2 unit1 教學(xué)課件PPT小學(xué)公開課
- 2021-2022學(xué)年人教版數(shù)學(xué)六年級(jí)上冊(cè)第一單元測試卷【含答案】
- 《別墅設(shè)計(jì)任務(wù)書》word版
- EN 4644-001-2017(高清正版)
- 預(yù)應(yīng)力混凝土簡支T形梁橋畢業(yè)論文
- 變頻器變頻altivar71說明書
- 第三章_同步發(fā)電機(jī)勵(lì)磁自動(dòng)調(diào)節(jié)
評(píng)論
0/150
提交評(píng)論