統(tǒng)計學(xué)抽樣與抽樣分布_第1頁
統(tǒng)計學(xué)抽樣與抽樣分布_第2頁
統(tǒng)計學(xué)抽樣與抽樣分布_第3頁
統(tǒng)計學(xué)抽樣與抽樣分布_第4頁
統(tǒng)計學(xué)抽樣與抽樣分布_第5頁
已閱讀5頁,還剩62頁未讀, 繼續(xù)免費閱讀

下載本文檔

版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進(jìn)行舉報或認(rèn)領(lǐng)

文檔簡介

關(guān)于統(tǒng)計學(xué)抽樣與抽樣分布第1頁,共67頁,2023年,2月20日,星期五24.1抽樣的基礎(chǔ)知識一、幾個概念二、抽樣誤差三、常用的抽樣方法第2頁,共67頁,2023年,2月20日,星期五3一、幾個概念(一)全及總體與總體指標(biāo)全及總體。簡稱總體(Population),是指所要研究的對象的全體,它是由所研究范圍內(nèi)具有某種共同性質(zhì)的全部單位所組成的集合體。總體單位總數(shù)用N表示。(舉例)總體指標(biāo)(參數(shù))。在抽樣估計中,用來反映總體數(shù)量特征的指標(biāo)稱為總體指標(biāo),也叫總體參數(shù)。研究目的一經(jīng)確定,總體也唯一地確定了,所以總體指標(biāo)的數(shù)值是客觀存在的、確定的,但又是未知的,需要用樣本資料去估計。第3頁,共67頁,2023年,2月20日,星期五總體和參數(shù)(續(xù))通常所要估計的總體指標(biāo)有變量總體屬性總體總體平均數(shù)(或記為μ)總體比例(成數(shù))π總體標(biāo)準(zhǔn)差σ或方差σ2總體比例標(biāo)準(zhǔn)差σP或方差σP2總體標(biāo)志總量()總體中具有某一屬性的單位總數(shù)(NP)等。第4頁,共67頁,2023年,2月20日,星期五5一、幾個概念(二)樣本總體與樣本指標(biāo)樣本總體。簡稱樣本(Sample),它是按照隨機(jī)原則,從總體中抽取的部分總體單位的集合體。樣本容量:樣本中所包含的個體的數(shù)量,一般用n表示。在實際工作中,人們通常把n≥30的樣本稱為大樣本,而把n<30的樣本稱為小樣本。樣本分量:其中每一個Xi是一個隨機(jī)變量,稱為樣本分量。樣本觀察值:一次抽樣中所觀察到的樣本數(shù)據(jù)x1、x2、x3稱為樣本觀察值。對于某一既定的總體,由于抽樣的方式方法不同,樣本容量也可大可小,因而,樣本是不確定的、而是可變的。第5頁,共67頁,2023年,2月20日,星期五6一、幾個概念(二)樣本總體與樣本指標(biāo)樣本指標(biāo)(統(tǒng)計量)。在抽樣估計中,用來反映樣本總體數(shù)量特征的指標(biāo)稱為樣本指標(biāo),也稱為樣本統(tǒng)計量或估計量,是根據(jù)樣本資料計算的、用以估計或推斷相應(yīng)總體指標(biāo)的綜合指標(biāo)。第6頁,共67頁,2023年,2月20日,星期五樣本和統(tǒng)計量統(tǒng)計量(statistic)。在抽樣估計中,用來反映樣本總體數(shù)量特征的指標(biāo)稱為樣本指標(biāo),也稱為樣本統(tǒng)計量或估計量,是根據(jù)樣本資料計算的、用以估計或推斷相應(yīng)總體指標(biāo)的綜合指標(biāo)。常見的樣本統(tǒng)計量有:

樣本統(tǒng)計量不含未知參數(shù),它是隨樣本不同而不同的隨機(jī)變量。變量總體屬性總體樣本平均數(shù)樣本比例(樣本成數(shù))p樣本標(biāo)準(zhǔn)差s或方差s2樣本比例標(biāo)準(zhǔn)差sP或方差sP2第7頁,共67頁,2023年,2月20日,星期五8二、抽樣誤差(一)抽樣誤差的概念抽樣誤差是統(tǒng)計調(diào)查誤差的一種形式。統(tǒng)計調(diào)查誤差,是指調(diào)查所得結(jié)果與總體真實數(shù)值之間的差異。在抽樣調(diào)查中,誤差的來源有兩大類:登記性誤差。是任何一種統(tǒng)計調(diào)查都可能產(chǎn)生.

代表性誤差系統(tǒng)性誤差隨機(jī)誤差第8頁,共67頁,2023年,2月20日,星期五樣本統(tǒng)計量一、統(tǒng)計量隨機(jī)抽樣每次抽取的結(jié)果Xi,可能是總體中任何一個個體。因此可以看成是一個隨機(jī)變量。n次抽取形成的樣本X1,X2,…,Xn可以看成是一組隨機(jī)變量。設(shè)X1,X2,…,Xn是來自總體X的一個樣本,g(X1,X2,…,Xn)是X1,X2,…,Xn的一個函數(shù)。若g是連續(xù)函數(shù),且g中不含任何未知參數(shù),則稱g(X1,X2,…,Xn)是一個統(tǒng)計量。統(tǒng)計量也是一個隨機(jī)變量。設(shè)x1,x2,…,xn是相應(yīng)于樣本X1,X2,…,Xn的一個樣本值,則稱g(x1,x2,…,xn)是統(tǒng)計量g(X1,X2,…,Xn)的一個觀測值。統(tǒng)計量作為一個隨機(jī)變量,它的分布稱為抽樣分布。第9頁,共67頁,2023年,2月20日,星期五第10頁,共67頁,2023年,2月20日,星期五設(shè)X1,X2,…,Xn是來自總體X的一個樣本。x1,x2,…,xn是這個樣本的一個樣本值。則(4)樣本比例:Ps=k/n,其中k為樣本中某屬性出現(xiàn)次數(shù)第11頁,共67頁,2023年,2月20日,星期五概率抽樣

(probabilitysampling)概率抽樣也叫隨機(jī)抽樣,是指按隨機(jī)原則抽取樣本。隨機(jī)原則,就是排除主觀意識的干擾,使總體每一個單位都有一定的概率被抽選為樣本單位,每個單位能否入選是隨機(jī)的。

特點能有效地避免主觀選樣帶來的傾向性誤差(系統(tǒng)偏差),使樣本資料能夠用于估計和推斷總體的數(shù)量特征,而且這種估計和推斷得以建立在概率論和數(shù)理統(tǒng)計的科學(xué)理論之上可以計算和控制抽樣誤差,說明估計的可靠程度。作用:在不可能或不必要進(jìn)行全面調(diào)查時,利用概率抽樣來推斷總體;利用概率抽樣修正或補(bǔ)充全面調(diào)查的不足。第12頁,共67頁,2023年,2月20日,星期五概率抽樣(probabilitysampling)統(tǒng)計上所指的抽樣一般都是指概率抽樣概率抽樣最基本的組織形式有:簡單隨機(jī)抽樣、分層抽樣、等距抽樣和整群抽樣。第13頁,共67頁,2023年,2月20日,星期五簡單隨機(jī)抽樣

(simplerandomsampling)從總體N個單位(元素)中隨機(jī)地抽取n個單位作為樣本,使得總體中每一個元素都有相同的機(jī)會(概率)被抽中抽取元素的具體方法有重復(fù)抽樣和不重復(fù)抽樣特點簡單、直觀,在抽樣框完整時,可直接從中抽取樣本用樣本統(tǒng)計量對目標(biāo)量進(jìn)行估計比較方便局限性當(dāng)N很大時,不易構(gòu)造抽樣框抽出的單位很分散,給實施調(diào)查增加了困難沒有利用其他輔助信息以提高估計的效率第14頁,共67頁,2023年,2月20日,星期五簡單隨機(jī)樣本

(simplerandomsample)由簡單隨機(jī)抽樣形成的樣本從總體N個單位中隨機(jī)地抽取n個單位作為樣本,使得每一個容量為n樣本都有相同的機(jī)會(概率)被抽中參數(shù)估計和假設(shè)檢驗所依據(jù)的主要是簡單隨機(jī)樣本第15頁,共67頁,2023年,2月20日,星期五分層抽樣

(stratifiedsampling)又稱類型抽樣或分類抽樣。先對總體各單位按主要標(biāo)志加以分組(層),然后再從各組(層)中按隨機(jī)原則獨立抽選一定單位構(gòu)成樣本。分層抽樣通過分類(組),把總體中標(biāo)志值比較接近的單位歸為一組,減少各組內(nèi)的差異程度,這樣再從各組抽取樣本單位就更具有代表性,因而抽樣誤差也就相對縮小。特別是在標(biāo)志值相差懸殊時,由于劃分了類型,一方面縮小了組內(nèi)方差,另一方面也保證各組都能抽取一定的樣本單位,所以,分層抽樣較之純隨機(jī)抽樣可以提高樣本的代表性,能獲得更為滿意的效果第16頁,共67頁,2023年,2月20日,星期五分層抽樣

(stratifiedsampling)續(xù)優(yōu)點:除了可以對總體進(jìn)行估計外,還可以對各層的子總體進(jìn)行估計可以按自然區(qū)域或行政區(qū)域進(jìn)行分層,使抽樣的組織和實施都比較方便分層抽樣的樣本分布在各個層內(nèi),從而使樣本在總體中的分布比較均勻如果分層抽樣做得好,便可以提高估計的精度第17頁,共67頁,2023年,2月20日,星期五系統(tǒng)抽樣

(systematicsampling)將總體中的所有單位(抽樣單位)按一定順序排列,在規(guī)定的范圍內(nèi)隨機(jī)地抽取一個單位作為初始單位,然后按事先規(guī)定好的規(guī)則確定其他樣本單位先從數(shù)字1到k之間隨機(jī)抽取一個數(shù)字r作為初始單位,以后依次取r+k,r+2k等單位優(yōu)點:簡便易行??商岣吖烙嫷木热秉c:對估計量方差的估計比較困難第18頁,共67頁,2023年,2月20日,星期五19它是先將總體所有單位按某一標(biāo)志順序排列,然后按相等的距離抽取樣本單位。

排列的標(biāo)志可以是無關(guān)標(biāo)志也可以是有關(guān)標(biāo)志。(1)無關(guān)標(biāo)志,指和單位標(biāo)志值的大小無關(guān)或不起主要的影響作用。(2)有關(guān)標(biāo)志,指作為排隊順序的標(biāo)志和單位標(biāo)志值的大小有密切的關(guān)系。其中,按有關(guān)標(biāo)志順序排隊,并將樣本單位加以n等份后,對每一部分抽取一個樣本單位有兩種方法半距中點取樣對稱等距取樣

應(yīng)該指出的是,等距取樣間隔的確定,要避免與想象中的周期性節(jié)奏重合,引起系統(tǒng)誤差的影響。第19頁,共67頁,2023年,2月20日,星期五整群抽樣

(clustersampling)將總體中若干個單位合并為組(群),抽樣時直接抽取群,然后對中選群中的所有單位全部實施調(diào)查特點抽樣時只需群的抽樣框,可簡化工作量調(diào)查的地點相對集中,節(jié)省調(diào)查費用,方便調(diào)查的實施缺點是估計的精度較差第20頁,共67頁,2023年,2月20日,星期五多階段抽樣

(multi-stagesampling)先抽取群,但并不是調(diào)查群內(nèi)的所有單位,而是再進(jìn)行一步抽樣,從選中的群中抽取出若干個單位進(jìn)行調(diào)查群是初級抽樣單位,第二階段抽取的是最終抽樣單位。將該方法推廣,使抽樣的段數(shù)增多,就稱為多階段抽樣具有整群抽樣的優(yōu)點,保證樣本相對集中,節(jié)約調(diào)查費用需要包含所有低階段抽樣單位的抽樣框;同時由于實行了再抽樣,使調(diào)查單位在更廣泛的范圍內(nèi)展開在大規(guī)模的抽樣調(diào)查中,經(jīng)常被采用的方法第21頁,共67頁,2023年,2月20日,星期五概率抽樣(小結(jié))抽樣方法特點簡單隨機(jī)抽樣按照等概率的原則,直接從含有N個元素的總體中抽取n個元素組成的樣本(N>n)

分層抽樣把異質(zhì)性較強(qiáng)的總體分成一個個同質(zhì)性較強(qiáng)的子總體,再抽取不同的子總體中的樣本分別代表該子總體,所有的樣本進(jìn)而代表總體。等距抽樣把總體的單位進(jìn)行排序,然后按照固定的抽樣距離抽取樣本。第一個樣本采用簡單隨機(jī)抽樣的辦法抽取。整群抽樣抽樣的單位不是單個的個體,而是成群的個體。多階段抽樣把抽樣過程分為幾個階段進(jìn)行。適用于總體規(guī)模特別大,或者總體分布的范圍特別廣時第22頁,共67頁,2023年,2月20日,星期五非概率抽樣也叫非隨機(jī)抽樣,是指從研究目的出發(fā),根據(jù)調(diào)查者的經(jīng)驗或判斷,從總體中有意識地抽取若干單位構(gòu)成樣本。重點調(diào)查、典型調(diào)查、配額抽樣(是按照一定標(biāo)準(zhǔn)或一定條件分配樣本單位數(shù)量,然后由調(diào)查者在規(guī)定的數(shù)額內(nèi)主觀地抽取樣本)、方便抽樣(指調(diào)查者按其方便任意選取樣本。如商場柜臺售貨員拿著廠家的調(diào)查表對顧客的調(diào)查)等就屬于非隨機(jī)抽樣。優(yōu)點:及時了解總體大致情況,總結(jié)經(jīng)驗教訓(xùn),在進(jìn)行大規(guī)模抽樣調(diào)查之前的試點。缺點:非隨機(jī)抽樣容易產(chǎn)生傾向性誤差,并且誤差不能計算和控制,也就無法說明調(diào)查結(jié)果的可靠程度。第23頁,共67頁,2023年,2月20日,星期五概率抽樣與非概率抽樣抽樣類型概率抽樣非概率抽樣簡單隨機(jī)抽樣分層隨機(jī)抽樣整群抽樣系統(tǒng)抽樣方便抽樣判斷抽樣其他非概率抽樣多階段抽樣第24頁,共67頁,2023年,2月20日,星期五重復(fù)抽樣與非重復(fù)抽樣重復(fù)抽樣,又稱回置抽樣,是指從總體的N個單位中,每次抽取一個單位后,再將其放回總體中參加下一次抽選,連續(xù)抽n次,即得到一個樣本。特點:樣本是由n次相互獨立的連續(xù)試驗構(gòu)成的,每次試驗是在完全相同的條件下進(jìn)行,每個單位中選的機(jī)會在各次都完全相等?!爸爻椤保紤]順序)可能的樣本數(shù)目(從總體中可能抽取的樣本個數(shù),用M表示)為:Nn個。第25頁,共67頁,2023年,2月20日,星期五重復(fù)抽樣與非重復(fù)抽樣不重復(fù)抽樣,也叫不回置抽樣,是指抽中的單位不再放回總體中,下一個樣本單位只能從余下的總體單位中抽取。特點:樣本由n次連續(xù)抽取的結(jié)果構(gòu)成,實際上等于一次同時從總體中抽取n個樣本單位。n次抽取結(jié)果不是獨立的可能的樣本數(shù)目(考慮順序):N(N-1)(N-2)…(N-n+1)個。第26頁,共67頁,2023年,2月20日,星期五重復(fù)抽樣與非重復(fù)抽樣設(shè)有4名學(xué)生的月消費支出分別為:240,280,360,400元。我們分別用A、B、C、D替代。若從中抽取兩個單位構(gòu)成樣本,則全部可能的樣本數(shù)目為:重復(fù):42=16個。它們是

AAABACAD;BABBBCBDCACBCCCD;DADBDCDD不重復(fù):4×3=12。它們是

ABACAD;BABCBDCACBCD;DADBDC第27頁,共67頁,2023年,2月20日,星期五抽樣誤差統(tǒng)計調(diào)查誤差,是指調(diào)查所得結(jié)果與總體真實數(shù)值之間的差異。

登記性誤差。是任何一種統(tǒng)計調(diào)查都可能產(chǎn)生。

代表性誤差系統(tǒng)性誤差:是由于非隨機(jī)因素引起的樣本代表性不足而產(chǎn)生的誤差,表現(xiàn)為樣本估計量的值系統(tǒng)性偏高或偏低,故也稱偏差;隨機(jī)誤差:又稱偶然性誤差,是指遵循隨機(jī)原則抽樣,但由于樣本各單位的結(jié)構(gòu)不足以代表總體各單位的結(jié)構(gòu)而引起的樣本估計量與總體參數(shù)之間的誤差。這就是抽樣估計中所謂的抽樣誤差。第28頁,共67頁,2023年,2月20日,星期五29二、抽樣誤差實際應(yīng)用中,有三個密切聯(lián)系而又相互區(qū)別的抽樣誤差的概念實際抽樣誤差抽樣平均誤差抽樣極限誤差第29頁,共67頁,2023年,2月20日,星期五30二、抽樣誤差(二)抽樣平均誤差(抽樣標(biāo)準(zhǔn)誤)抽樣平均誤差是反映抽樣誤差一般水平的指標(biāo)(因為抽樣誤差是一個隨機(jī)變量,它的數(shù)值隨著可能抽取的樣本不同而或大或小,為了總的衡量樣本代表性的高低,就需要計算抽樣誤差的一般水平)。通常用樣本估計量的標(biāo)準(zhǔn)差來反映所有可能樣本估計值與其中心值的平均離散程度。

第30頁,共67頁,2023年,2月20日,星期五31二、抽樣誤差(二)抽樣平均誤差抽樣平均誤差可衡量樣本對總體的代表性大小。即:抽樣平均誤越小,則樣本估計量的分布就越集中在總體參數(shù)的附近,平均來說,樣本估計值與總體參數(shù)之間的抽樣誤差越小,樣本對總體的代表性越大。第31頁,共67頁,2023年,2月20日,星期五32抽樣平均誤的計算公式在總體方差已知,總體單位總數(shù)為N,樣本容量為n,簡單隨機(jī)抽樣條件下,抽樣平均誤的計算公式為:

重復(fù)抽樣不重復(fù)抽樣估計均值估計成數(shù)總結(jié)影響抽樣誤差大小的四因素。第32頁,共67頁,2023年,2月20日,星期五33二、抽樣誤差(三)抽樣極限誤差抽樣極限誤差是指一定概率下抽樣誤差的可能范圍,也稱為允許誤差。用Δ表示,由定義知其表達(dá)式:在一定概率下,

上式表示,在一定概率下可認(rèn)為樣本估計量與相應(yīng)的總體參數(shù)的誤差的絕對值不超過。第33頁,共67頁,2023年,2月20日,星期五34抽樣極限誤差用、分別表示平均數(shù)和比率(成數(shù))的抽樣極限誤差,則在一定概率下有:估計均值的置信區(qū)間:估計成數(shù)(比例)的置信區(qū)間:

第34頁,共67頁,2023年,2月20日,星期五35對抽樣極限誤差的解釋:抽樣極限誤差是抽樣誤差的可能范圍,而不是完全肯定的范圍。所以,這一可能范圍的大小是與其估計的可靠程度的大?。锤怕剩┚o密聯(lián)系的。在抽樣估計中,這個概率叫置信度,習(xí)慣上也稱為可靠程度、把握程度或概率保證程度等,用1-α表示。顯然在其他條件不變的情況下,抽樣極限誤差越大,相應(yīng)的置信度也就越大。第35頁,共67頁,2023年,2月20日,星期五36抽樣誤差率:與抽樣極限誤差相關(guān)的兩個概念是:抽樣誤差率和抽樣估計精度抽樣誤差率=(抽樣極限誤差/估計量)×100%抽樣估計精度=100%-抽樣誤差率第36頁,共67頁,2023年,2月20日,星期五37估計精度(準(zhǔn)確性)與可靠程度的關(guān)系:估計精度與估計的可靠程度是矛盾的。也就是說,如果精度很高,則會由于估計區(qū)間太窄而使錯誤估計的可能性大增,從而大大降低估計的可靠程度,使估計結(jié)果沒有多大的作用;如果置信度很高,則意味著允許誤差范圍較大,而使估計精度太低,這時盡管估計的可靠程度接近或等于100%,但抽樣估計本身也會失去意義。實際中,只能依據(jù)具體情況,先滿足一方面,然后確定另一方面。第37頁,共67頁,2023年,2月20日,星期五38

抽樣分布的概念樣本指標(biāo)是一種隨機(jī)變量,它有若干可能取值,每個可能取值都有一定的可能性(即概率),從而形成它的概率分布,即統(tǒng)計上所謂的抽樣分布。簡言之,抽樣分布就是指樣本統(tǒng)計量的概率分布。樣本統(tǒng)計量是由n個隨機(jī)變量構(gòu)成的函數(shù),故抽樣分布屬于隨機(jī)變量函數(shù)的分布。第38頁,共67頁,2023年,2月20日,星期五39一、抽樣分布的概念舉例:四名學(xué)生的月生活費支出(480,560,720,800元)?,F(xiàn)按不重復(fù)取樣的方法,隨機(jī)抽取兩位構(gòu)成一個樣本,則全部可能的樣本及其各樣本的均值如下表所示:第39頁,共67頁,2023年,2月20日,星期五40序樣本變量樣本平均數(shù)平均數(shù)離差離差平方

x-E()[-E()]2

1480,560520-12014400

2480,720600-401600

3480,80064000

4560,480520-12014400

5560,72064000

6560,800680401600

7720,480600-401600

8720,56064000

9720,80076012014400

10800,48064000

11800,560680401600

12800,72076012014400

合計——7680064000

第40頁,共67頁,2023年,2月20日,星期五41一、抽樣分布的概念(續(xù))樣本平均數(shù)的概率分布

520600640680760f22422f/∑f

2/122/124/122/122/12第41頁,共67頁,2023年,2月20日,星期五42一、抽樣分布的概念(續(xù))例中總體分布和樣本均值分布的比較:

P()P(x)000.10.10.20.20.30.3480560720800X520600640680760圖4.1總體的分布圖4.2樣本均值的抽樣分布第42頁,共67頁,2023年,2月20日,星期五43一、抽樣分布的概念(續(xù))通過圖4.1總體分布和圖4.2樣本均值的抽樣分布的比較,不難看出:盡管總體為均勻分布,但樣本均值的抽樣分布在形狀上卻是對稱的。第43頁,共67頁,2023年,2月20日,星期五44一、抽樣分布的概念(續(xù))

抽樣分布的形成過程可概括為圖4.3:總體N樣本容量為n的所有樣本計算出每一個均值并形成分布f()的抽樣分布0圖4.3抽樣分布的形成過程第44頁,共67頁,2023年,2月20日,星期五45抽樣分布反映了樣本指標(biāo)的分布特征,是抽樣推斷的重要依據(jù)。根據(jù)樣本分布的規(guī)律,可揭示樣本指標(biāo)與總體指標(biāo)之間的關(guān)系,估計抽樣誤差,并說明抽樣推斷的可靠程度。第45頁,共67頁,2023年,2月20日,星期五46

2.常用抽樣分布

1)設(shè)總體X~N(,σ2),則(1)

(2)~N(0,1)

也即樣本均值

的均值等于總體均值,而其方差僅為總體方差的

。這說明,樣本容量越大,

就越向總體均值

集中,用

估計

的誤差就越小。第46頁,共67頁,2023年,2月20日,星期五樣本均值的抽樣分布在重復(fù)選取容量為n的樣本時,由樣本均值的所有可能取值形成的相對頻數(shù)分布一種理論概率分布推斷總體均值的理論基礎(chǔ) 第47頁,共67頁,2023年,2月20日,星期五樣本均值的抽樣分布

(例題分析)【例】設(shè)一個總體,含有4個元素(個體),即總體單位數(shù)N=4。4個個體分別為x1=1,x2=2,x3=3,x4=4??傮w的均值、方差及分布如下總體分布14230.1.2.3均值和方差第48頁,共67頁,2023年,2月20日,星期五樣本均值的抽樣分布

(例題分析)

現(xiàn)從總體中抽取n=2的簡單隨機(jī)樣本,在重復(fù)抽樣條件下,共有42=16個樣本。所有樣本的結(jié)果為3,43,33,23,132,42,32,22,124,44,34,24,141,441,33211,21,11第二個觀察值第一個觀察值所有可能的n=2的樣本(共16個)第49頁,共67頁,2023年,2月20日,星期五樣本均值的抽樣分布

(例題分析)計算出各樣本的均值,如下表。并給出樣本均值的抽樣分布3.53.02.52.033.02.52.01.524.03.53.02.542.542.03211.51.01第二個觀察值第一個觀察值16個樣本的均值(x)x樣本均值的抽樣分布1.000.10.20.3P(x)1.53.04.03.52.02.5第50頁,共67頁,2023年,2月20日,星期五樣本均值的分布與總體分布的比較

(例題分析)=2.5σ2=1.25總體分布14230.1.2.3抽樣分布P(x)1.00.1.2.31.53.04.03.52.02.5x第51頁,共67頁,2023年,2月20日,星期五樣本均值的抽樣分布

與中心極限定理=50

=10X總體分布n=4抽樣分布xn=16當(dāng)總體服從正態(tài)分布N(μ,σ2)時,來自該總體的所有容量為n的樣本的均值x也服從正態(tài)分布,x

的數(shù)學(xué)期望為μ,方差為σ2/n。即x~N(μ,σ2/n)第52頁,共67頁,2023年,2月20日,星期五中心極限定理

(centrallimittheorem)當(dāng)樣本容量足夠大時(n

30),樣本均值的抽樣分布逐漸趨于正態(tài)分布中心極限定理:設(shè)從均值為,方差為2的一個任意總體中抽取容量為n的樣本,當(dāng)n充分大時,樣本均值的抽樣分布近似服從均值為μ、方差為σ2/n的正態(tài)分布一個任意分布的總體x第53頁,共67頁,2023年,2月20日,星期五542)2分布

(1)設(shè)總體X~N(0,1),X1,X2,…,Xn

為X的一個樣本,稱它們的平方和

為服從自由度為n的2分布(Chisquaredistribution),記為第54頁,共67頁,2023年,2月20日,星期五55

關(guān)于“自由度”的概念:

若對隨機(jī)變量X1,X2,…,Xn,存在一組不全為零的常數(shù)c1,c2,…,cn,使c1

X1+c2

X2+…+cnXn

=0

則稱X1,X2,…,Xn線性相關(guān),或稱X1,X2,…,Xn間存在一個線性約束條件;若X1,X2,…,Xn間存在k個獨立的線性約束條件,則它們中僅有n-

k個獨立的變量,此時稱平方和

的自由度為n-k。

由此可知,自由度表示了平方和中獨立隨機(jī)變量的個數(shù)。第55頁,共67頁,2023年,2月20日,星期五56

2分布概率密度函數(shù)的圖形與正態(tài)分布不同,2分布僅有一個參數(shù),即自由度。2分布在單個正態(tài)總體方差的區(qū)間估計與假設(shè)檢驗,以及在非參數(shù)統(tǒng)計推斷中都有重要應(yīng)用。第56頁,共67頁,2023年,2月20日,星期五57(2)2分布表。

由于2分布主要應(yīng)用于統(tǒng)計推斷,因此與正態(tài)分布表不同,2分布表中給出的不是該分布的分布函數(shù)值,而是所謂的“右側(cè)分位點

”的值,其中

為滿足

的x軸上的某一點的值,如下圖所示,由給定的概率

及自由度,可查表得到

的值。第57頁,共67頁,2023年,2月20日,星期五583)t分布

(1)設(shè)X~N(0,1),Y~2(n),且X與Y相互獨立,則稱隨機(jī)變量

服從自由度為n的t分布,記為t~t(n)。

t分布與標(biāo)準(zhǔn)正態(tài)分布是非常類似的,且t分布的極限分布就是標(biāo)準(zhǔn)正態(tài)分布,當(dāng)n很大時,t分布就近似于標(biāo)準(zhǔn)正態(tài)分布。第58頁,共67頁,2023年,2月20日,星期五594)F分布(1)設(shè)X~2(n1),Y~2(n2),且X和Y相互獨立,則稱隨機(jī)變量

服從自由度為(n1,n2)的F分布,記為

。并稱n1為第一(分子的)自由度,n2為第二(分母的)自由度。

F分布密度函數(shù)的圖形第59頁,共67頁,2023年,2月20日,星期五60(2)F分布表

由于F分布有兩個自由度,因此對每一個,就有一張F(tuán)分布表

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負(fù)責(zé)。
  • 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時也不承擔(dān)用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

評論

0/150

提交評論