數(shù)理統(tǒng)計(jì)第六章_第1頁
數(shù)理統(tǒng)計(jì)第六章_第2頁
數(shù)理統(tǒng)計(jì)第六章_第3頁
數(shù)理統(tǒng)計(jì)第六章_第4頁
數(shù)理統(tǒng)計(jì)第六章_第5頁
已閱讀5頁,還剩66頁未讀, 繼續(xù)免費(fèi)閱讀

下載本文檔

版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請(qǐng)進(jìn)行舉報(bào)或認(rèn)領(lǐng)

文檔簡(jiǎn)介

1、 對(duì)隨機(jī)現(xiàn)象進(jìn)行觀測(cè)、試驗(yàn),以取得對(duì)隨機(jī)現(xiàn)象進(jìn)行觀測(cè)、試驗(yàn),以取得有代表性的觀測(cè)值有代表性的觀測(cè)值 對(duì)已取得的觀測(cè)值進(jìn)行整理、分析對(duì)已取得的觀測(cè)值進(jìn)行整理、分析, ,作出推斷、決策作出推斷、決策, ,從而找出所研究的對(duì)象從而找出所研究的對(duì)象的規(guī)律性的規(guī)律性數(shù)數(shù)理理統(tǒng)統(tǒng)計(jì)計(jì)的的分分類類描述統(tǒng)計(jì)學(xué)描述統(tǒng)計(jì)學(xué)推斷統(tǒng)計(jì)學(xué)推斷統(tǒng)計(jì)學(xué)第一節(jié)第一節(jié) 基本概念基本概念一、總體和個(gè)體一、總體和個(gè)體二、樣本二、樣本 簡(jiǎn)單隨機(jī)樣本簡(jiǎn)單隨機(jī)樣本二、統(tǒng)計(jì)量二、統(tǒng)計(jì)量一、總體和個(gè)體一、總體和個(gè)體 一個(gè)統(tǒng)計(jì)問題總有它明確的研究對(duì)象一個(gè)統(tǒng)計(jì)問題總有它明確的研究對(duì)象. .研究某批燈泡的質(zhì)量研究某批燈泡的質(zhì)量研究對(duì)象的全體稱為研

2、究對(duì)象的全體稱為總體總體( (母體母體) ),組成總體的每個(gè)元素稱為組成總體的每個(gè)元素稱為個(gè)體個(gè)體. .總體總體 然而在統(tǒng)計(jì)研究中,人們關(guān)心總體僅僅是關(guān)心然而在統(tǒng)計(jì)研究中,人們關(guān)心總體僅僅是關(guān)心其每個(gè)個(gè)體的一項(xiàng)其每個(gè)個(gè)體的一項(xiàng)( (或幾項(xiàng)或幾項(xiàng)) )數(shù)量指標(biāo)和該數(shù)量指標(biāo)數(shù)量指標(biāo)和該數(shù)量指標(biāo)在總體中的分布情況在總體中的分布情況. . 這時(shí),每個(gè)個(gè)體具有的數(shù)這時(shí),每個(gè)個(gè)體具有的數(shù)量指標(biāo)的全體就是總體量指標(biāo)的全體就是總體. .某批某批燈泡的壽命燈泡的壽命該批燈泡壽命的該批燈泡壽命的全體就是總體全體就是總體國產(chǎn)轎車每公里國產(chǎn)轎車每公里的耗油量的耗油量國產(chǎn)轎車每公里耗油量國產(chǎn)轎車每公里耗油量的全體就是總

3、體的全體就是總體所研究的對(duì)象的某個(gè)所研究的對(duì)象的某個(gè)( (或某些或某些) )數(shù)量指標(biāo)的全體稱為數(shù)量指標(biāo)的全體稱為總體總體, ,它是一個(gè)隨機(jī)變量它是一個(gè)隨機(jī)變量( (或多維隨機(jī)變量或多維隨機(jī)變量) ),記為,記為X . . X 的分布函數(shù)和數(shù)字特征稱為總體分布函數(shù)的分布函數(shù)和數(shù)字特征稱為總體分布函數(shù)和總體數(shù)字特征和總體數(shù)字特征. 例如例如: :研究某批燈泡的壽命時(shí),總體研究某批燈泡的壽命時(shí),總體X是這批是這批燈泡的壽命,而其中每個(gè)燈泡的壽命就是個(gè)體。燈泡的壽命,而其中每個(gè)燈泡的壽命就是個(gè)體。每個(gè)每個(gè)燈泡的壽命燈泡的壽命個(gè)體個(gè)體總體總體國產(chǎn)轎車每公里國產(chǎn)轎車每公里的耗油量的耗油量國產(chǎn)轎車每公里耗油

4、國產(chǎn)轎車每公里耗油量的全體就是總體量的全體就是總體 又如又如:研究某批國產(chǎn)轎車每公里的耗油量時(shí),總研究某批國產(chǎn)轎車每公里的耗油量時(shí),總體體X是這批轎車每公里的耗油量,而其中每輛轎車是這批轎車每公里的耗油量,而其中每輛轎車的耗油量就是個(gè)體。的耗油量就是個(gè)體。 類似地,在研究某地區(qū)中學(xué)生的營養(yǎng)狀況時(shí),類似地,在研究某地區(qū)中學(xué)生的營養(yǎng)狀況時(shí),若關(guān)心的數(shù)量指標(biāo)是身高和體重,我們用若關(guān)心的數(shù)量指標(biāo)是身高和體重,我們用X和和Y分分別表示身高和體重,那么此總體就可用二維隨機(jī)變別表示身高和體重,那么此總體就可用二維隨機(jī)變量量(X,Y) 來表示,而每個(gè)學(xué)生的身高和體重就是個(gè)來表示,而每個(gè)學(xué)生的身高和體重就是個(gè)體

5、體. 為推斷總體分布及各種特征,按一定規(guī)則從總為推斷總體分布及各種特征,按一定規(guī)則從總體中抽取若干個(gè)體進(jìn)行觀察試驗(yàn),以獲得有關(guān)總體體中抽取若干個(gè)體進(jìn)行觀察試驗(yàn),以獲得有關(guān)總體的信息,這一抽取過程稱為的信息,這一抽取過程稱為 “抽樣抽樣”,所抽取的部,所抽取的部分個(gè)體稱為分個(gè)體稱為樣本樣本. . 樣本中所包含的個(gè)體數(shù)目稱為樣本中所包含的個(gè)體數(shù)目稱為樣本容量樣本容量. .二、樣本二、樣本 簡(jiǎn)單隨機(jī)樣本簡(jiǎn)單隨機(jī)樣本1 1)抽樣和樣本)抽樣和樣本 樣本的抽取是隨機(jī)的,每個(gè)個(gè)體是一個(gè)隨機(jī)樣本的抽取是隨機(jī)的,每個(gè)個(gè)體是一個(gè)隨機(jī)變量變量.容量為容量為n的樣本可以看作的樣本可以看作n維隨機(jī)變量,用維隨機(jī)變量,

6、用X1,X2,Xn表示表示. 而一旦取定一組樣本,得到的是而一旦取定一組樣本,得到的是n個(gè)具體的個(gè)具體的數(shù)數(shù) (x1,x2,xn),稱其為樣本的一個(gè)觀察值,簡(jiǎn),稱其為樣本的一個(gè)觀察值,簡(jiǎn)稱稱樣本值樣本值 .2.X1,X2,Xn相互獨(dú)立相互獨(dú)立. 由于抽樣的目的是為了對(duì)總體進(jìn)行統(tǒng)計(jì)推斷,由于抽樣的目的是為了對(duì)總體進(jìn)行統(tǒng)計(jì)推斷,為了使抽取的樣本能很好地反映總體的信息,必須為了使抽取的樣本能很好地反映總體的信息,必須考慮抽樣方法考慮抽樣方法. .最常用的一種抽樣方法叫作最常用的一種抽樣方法叫作“簡(jiǎn)單簡(jiǎn)單隨機(jī)抽樣隨機(jī)抽樣”,它要求抽取的樣本滿足下面兩點(diǎn),它要求抽取的樣本滿足下面兩點(diǎn):1. 樣本樣本X1

7、,X2,Xn中每一個(gè)中每一個(gè)Xi與所考察的總體與所考察的總體X有相同的分布有相同的分布.2 2)簡(jiǎn)單隨機(jī)樣本)簡(jiǎn)單隨機(jī)樣本 由簡(jiǎn)單隨機(jī)抽樣得到的樣本稱為由簡(jiǎn)單隨機(jī)抽樣得到的樣本稱為簡(jiǎn)單隨機(jī)樣簡(jiǎn)單隨機(jī)樣本本,它可以用與總體獨(dú)立同分布的,它可以用與總體獨(dú)立同分布的n個(gè)相互獨(dú)立個(gè)相互獨(dú)立的隨機(jī)變量的隨機(jī)變量X1,X2,Xn表示表示. 簡(jiǎn)單隨機(jī)樣本是應(yīng)用中最常見的情形,今后,簡(jiǎn)單隨機(jī)樣本是應(yīng)用中最常見的情形,今后,當(dāng)說到當(dāng)說到“X1,X2,Xn是取自某總體的樣本是取自某總體的樣本”時(shí),時(shí),若不特別說明,就指簡(jiǎn)單隨機(jī)樣本若不特別說明,就指簡(jiǎn)單隨機(jī)樣本. 設(shè)設(shè)X1,X2,Xn 是總體是總體X的一個(gè)簡(jiǎn)單隨機(jī)

8、樣本,的一個(gè)簡(jiǎn)單隨機(jī)樣本,1)若若X為離散型總體,其分布律是為離散型總體,其分布律是p(x),則,則X1,X2,Xn的的聯(lián)合分布律為聯(lián)合分布律為p(x1) p (x2) p (xn) 2)若若X為連續(xù)型總體,其概率密度是為連續(xù)型總體,其概率密度是f(x),則,則X1,X2,Xn的聯(lián)合分布律為的聯(lián)合分布律為f (x1) f (x2) f (xn) 事實(shí)上我們抽樣后得到的資料都是具體的、事實(shí)上我們抽樣后得到的資料都是具體的、確定的值確定的值. 如我們從某班大學(xué)生中抽取如我們從某班大學(xué)生中抽取10人測(cè)量人測(cè)量身高,得到身高,得到10個(gè)數(shù),它們是樣本取到的值而不是個(gè)數(shù),它們是樣本取到的值而不是樣本樣本

9、. 我們只能觀察到隨機(jī)變量取的值而見不到我們只能觀察到隨機(jī)變量取的值而見不到隨機(jī)變量隨機(jī)變量.3)總體、樣本、樣本值的關(guān)系)總體、樣本、樣本值的關(guān)系 統(tǒng)計(jì)是從手中已有的資料統(tǒng)計(jì)是從手中已有的資料 樣本值,去推斷樣本值,去推斷總體的情況總體的情況 總體分布總體分布F(x)的性質(zhì)的性質(zhì). 總體分布決定了樣本取值的概率規(guī)律,也就是總體分布決定了樣本取值的概率規(guī)律,也就是樣本取到樣本值的規(guī)律,因而可以由樣本值去推斷樣本取到樣本值的規(guī)律,因而可以由樣本值去推斷總體總體. 由樣本值去推斷總體情況,需要對(duì)樣本由樣本值去推斷總體情況,需要對(duì)樣本值進(jìn)行值進(jìn)行“加工加工”,這就要構(gòu)造一些樣本的函,這就要構(gòu)造一些樣

10、本的函數(shù),它把樣本中所含的(某一方面)信息集數(shù),它把樣本中所含的(某一方面)信息集中起來中起來. .中不含有任何的未知參數(shù),則稱函數(shù)中不含有任何的未知參數(shù),則稱函數(shù)g(X1,X2,,Xn)如果樣本如果樣本X1,X2,,Xn的函數(shù)的函數(shù)g(X1,X2,,Xn)為統(tǒng)計(jì)量為統(tǒng)計(jì)量. .g(x1,x2,,xn)為統(tǒng)計(jì)量為統(tǒng)計(jì)量g(X1,X2,,Xn)的一個(gè)的一個(gè)若若x1,x2,,xn是相應(yīng)的樣本值,則稱函數(shù)值是相應(yīng)的樣本值,則稱函數(shù)值觀察值觀察值.若若 a , 2 已知已知, 則則n2ii=1X ,是統(tǒng)計(jì)量,是統(tǒng)計(jì)量,而而是是X 的一個(gè)樣本的一個(gè)樣本,nXXX,21則則n2i2i=11X -a不是統(tǒng)計(jì)

11、量不是統(tǒng)計(jì)量. .35543XX也是統(tǒng)計(jì)量也是統(tǒng)計(jì)量.n2i2i=11X -a,X N(a,)a,是未知參數(shù)是未知參數(shù), niiXnX112211()niiSXXn它反映了總體均值它反映了總體均值的信息的信息它反映了總體方差它反映了總體方差的信息的信息nikikXnA11nikikXXnB1)(1 k=1,2,它反映了總體它反映了總體 k 階矩階矩的信息的信息它反映了總體它反映了總體 k 階階中心矩的信息中心矩的信息它們的觀察值分別為:它們的觀察值分別為: niixnx112211()niisxxn nikikxna11 nikikxxnb1)(1由大數(shù)定律可知:由大數(shù)定律可知: nikikX

12、nA11)(kXE依概率收斂于依概率收斂于例例1. 從一批相同的電子元件中隨機(jī)地抽出從一批相同的電子元件中隨機(jī)地抽出8個(gè),測(cè)得使用個(gè),測(cè)得使用壽命(單位:小時(shí))分別為:壽命(單位:小時(shí))分別為:2300,2430,2580,2400,2280,1960,2460,2000,試計(jì)算樣本均值、樣本方差及,試計(jì)算樣本均值、樣本方差及樣本二階矩樣本二階矩.解:解: niixnx11(小時(shí))(小時(shí))25.2301 1n22ii=1s =(x - x )n242110.9375(小時(shí)) niixna1221)(小小時(shí)時(shí)25 .5337862 順序統(tǒng)計(jì)量順序統(tǒng)計(jì)量 設(shè)設(shè)X1, X2 ,, Xn為總體為總體X

13、的樣本的樣本,由樣本由樣本可建立可建立n個(gè)函數(shù)個(gè)函數(shù): *kx*12,1,2kknXXXXXkn其中其中 為這樣的統(tǒng)計(jì)量,它的觀察值為為這樣的統(tǒng)計(jì)量,它的觀察值為 , *kX為樣本為樣本X1, X2 , Xn的觀察值的觀察值x1, x2, xn中中*kx由小至大排列由小至大排列(即即*1knxxx) )后的后的第第k位數(shù)值位數(shù)值, ,則稱則稱*12,nXXX為為順序統(tǒng)計(jì)量順序統(tǒng)計(jì)量協(xié)方差與相關(guān)系數(shù)協(xié)方差與相關(guān)系數(shù)記記樣本的協(xié)方差樣本的協(xié)方差1211niiiSXXYYn樣本的相關(guān)系數(shù)樣本的相關(guān)系數(shù)1212SRSS一、經(jīng)驗(yàn)分布函數(shù)一、經(jīng)驗(yàn)分布函數(shù) 設(shè)設(shè)X1,X2,Xn為取自總體為取自總體X的樣本,

14、的樣本, x1,x2,xn為其觀察值為其觀察值.對(duì)于每個(gè)固定的對(duì)于每個(gè)固定的x,設(shè)事件,設(shè)事件Xx在在n次觀察中出現(xiàn)的次數(shù)為次觀察中出現(xiàn)的次數(shù)為vn(x),于是事,于是事件件Xx發(fā)生的頻率為:發(fā)生的頻率為:( )( )nnvxFxxn 稱稱 Fn(x) 為樣本分布函數(shù)或經(jīng)驗(yàn)分布函數(shù)為樣本分布函數(shù)或經(jīng)驗(yàn)分布函數(shù).定理(格列汶科)當(dāng)定理(格列汶科)當(dāng)n時(shí),經(jīng)驗(yàn)分布函數(shù)時(shí),經(jīng)驗(yàn)分布函數(shù) Fn(x) 依概率依概率1關(guān)于關(guān)于x一致收斂與總體分布函數(shù),即一致收斂與總體分布函數(shù),即lim sup |( )( )| 01nnxPFxF x 定理表明:定理表明:當(dāng)樣本容量當(dāng)樣本容量n充分大時(shí),經(jīng)驗(yàn)分布函數(shù)充分大

15、時(shí),經(jīng)驗(yàn)分布函數(shù) Fn(x) 幾乎一定會(huì)充分趨近總體分布函數(shù)幾乎一定會(huì)充分趨近總體分布函數(shù)F(x),這是這是用樣本來推斷總體的理論依據(jù)用樣本來推斷總體的理論依據(jù).二、樣本均值和方差的性質(zhì)二、樣本均值和方差的性質(zhì)1 1 樣本均值的性質(zhì)樣本均值的性質(zhì)(1 1)(2 2)若總體若總體X的均值和方差存在的均值和方差存在, ,且且則則21,EXa DXn10niiXX2 2 樣本方差的性質(zhì)樣本方差的性質(zhì)(1 1)(2 2)則則2221111nniiiiXXXXnn記記221111nniiSXXn2211nnSSn若總體若總體X的方差存在的方差存在, ,則則(3 3)21nE SDXn21nE SDX三、

16、極值的分布三、極值的分布設(shè)總體設(shè)總體X的分布函數(shù)為的分布函數(shù)為F(x),12,nXXX為其樣本為其樣本(1 1)最大項(xiàng)統(tǒng)計(jì)量)最大項(xiàng)統(tǒng)計(jì)量*nX的分布函數(shù)記為的分布函數(shù)記為 nF u,則,則 *nnFuP Xu12,nP Xu XuXu nF u (2 2)最小項(xiàng)統(tǒng)計(jì)量)最小項(xiàng)統(tǒng)計(jì)量*1X的分布函數(shù)記為的分布函數(shù)記為 1F v,則,則 *1111F vP XvP Xv 121,nP Xv XvXv 1nP Xv 11nF v 特別地特別地, ,若若X 有密度函數(shù)有密度函數(shù)f(x) , ,則則 和和*nX*1X的密度函數(shù)分別為的密度函數(shù)分別為 1nnfunf uF u 111nfvnf vF v

17、 統(tǒng)計(jì)量是樣本的函數(shù),而樣本是隨機(jī)統(tǒng)計(jì)量是樣本的函數(shù),而樣本是隨機(jī)變量,故統(tǒng)計(jì)量也是隨機(jī)變量,因而就有變量,故統(tǒng)計(jì)量也是隨機(jī)變量,因而就有一定的分布,它的分布稱為一定的分布,它的分布稱為“抽樣分抽樣分布布” ” . . 下面介紹三個(gè)來自正態(tài)總體的抽樣分布下面介紹三個(gè)來自正態(tài)總體的抽樣分布. .)n(222分布分布1、 設(shè)設(shè) 相互獨(dú)立相互獨(dú)立, ,都服從標(biāo)準(zhǔn)正態(tài)分布都服從標(biāo)準(zhǔn)正態(tài)分布nX,X,X21222212nXXX N(0,1), 則稱隨機(jī)變量:則稱隨機(jī)變量: 所服從的分布為自由度為所服從的分布為自由度為 n 的的 分布,記為分布,記為22分布的概率密度為分布的概率密度為 其其它它00)2(

18、21)(2122yeynyfynn其中,其中,01)(dtetxtx稱為稱為 函數(shù),具有性質(zhì)函數(shù),具有性質(zhì)(1)( ),(1)1,(1/2)(1)! ()xxxnnnN n=1n=4n=10f(y)0 1 3 5 7 9 11 13 15 17 x0.50.40.30.20.1有所改變有所改變. .2分布的概率密度圖形如下:分布的概率密度圖形如下:2顯然顯然分布的概率密度圖形隨自由度的不同而分布的概率密度圖形隨自由度的不同而性質(zhì)性質(zhì)1.1.),(22n設(shè)設(shè)nDnE2)(,)(22 則則2性質(zhì)性質(zhì)2.2. 設(shè)設(shè)),(1221n),(2222n且且21與與22相互獨(dú)立,則相互獨(dú)立,則)(21222

19、21nn 這個(gè)性質(zhì)稱為這個(gè)性質(zhì)稱為 分布的可加性分布的可加性. .2t 的概率密度為的概率密度為:2121221 n)nt(n)n()n()t (h 設(shè)設(shè)XN( 0 , 1 ) , , Y YnYXt 所服從的分布為自由度為所服從的分布為自由度為 n 的的 t 分布分布. .記為記為tt (n).)(2n2、t 分布分布,且,且 X 與與 Y 相互相互獨(dú)立,則稱變量獨(dú)立,則稱變量n=4n=10n=1xt(x;n)o t分布的概率密度函數(shù)關(guān)于分布的概率密度函數(shù)關(guān)于t=0對(duì)稱,且對(duì)稱,且當(dāng)當(dāng)n充分大時(shí)充分大時(shí)(n30),其圖形與標(biāo)準(zhǔn)正態(tài)分布的,其圖形與標(biāo)準(zhǔn)正態(tài)分布的概率密度函數(shù)的圖形非常接近概率密

20、度函數(shù)的圖形非常接近.但對(duì)于較小的但對(duì)于較小的n,t 分布與分布與N (0,1)分布相差很大分布相差很大.由定義可見,由定義可見,3、F分布分布則稱統(tǒng)計(jì)量則稱統(tǒng)計(jì)量服從自由度為服從自由度為n1及及 n2 的的F分布,分布,n1稱為第一自由度,稱為第一自由度,21nYnXF 121nXnYF F(n2,n1),n(Y),n(X2212 設(shè)設(shè)X 與與 Y 相互獨(dú)立,相互獨(dú)立,n2稱為第二自由度,記作稱為第二自由度,記作 FF(n1,n2) .xo)n,n;x(f21 2n201 n252 n102 n二、上二、上分位點(diǎn)分位點(diǎn) dxxfxXPx )(設(shè)隨機(jī)變量設(shè)隨機(jī)變量X的概率密度為的概率密度為 f(x),對(duì)于對(duì)于任意給定的任意給定的(01),若存在實(shí)數(shù)若存在實(shí)數(shù)x,使得使得:則稱點(diǎn)則稱點(diǎn)x為該概率分布的上為該概率分布的上分位點(diǎn)分位點(diǎn) 對(duì)標(biāo)準(zhǔn)正態(tài)分布變量對(duì)標(biāo)準(zhǔn)正態(tài)分布變量ZN(0, 1)和給定的和給定的 ,上,上 分分位數(shù)是由位數(shù)是由: PZz =2212tzdte 即即 PZ 1.059 = 0.15.P X 12.5 = 0.15.的概率不小于的概率不小于90%,90%,則樣本容量至少取多少則樣本容量至少取多少? ?例例6.設(shè)設(shè)(72 ,10)XN, ,為使樣本均值大于為使樣本均值大于7070

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請(qǐng)下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請(qǐng)聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會(huì)有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫網(wǎng)僅提供信息存儲(chǔ)空間,僅對(duì)用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對(duì)用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對(duì)任何下載內(nèi)容負(fù)責(zé)。
  • 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請(qǐng)與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶因使用這些下載資源對(duì)自己和他人造成任何形式的傷害或損失。

最新文檔

評(píng)論

0/150

提交評(píng)論