第六章 樣本與抽樣分布_第1頁
第六章 樣本與抽樣分布_第2頁
第六章 樣本與抽樣分布_第3頁
第六章 樣本與抽樣分布_第4頁
第六章 樣本與抽樣分布_第5頁
已閱讀5頁,還剩48頁未讀, 繼續(xù)免費(fèi)閱讀

下載本文檔

版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進(jìn)行舉報或認(rèn)領(lǐng)

文檔簡介

第六章 樣本及抽樣分布本章轉(zhuǎn)入課程的第二部分———數(shù)理統(tǒng)計(jì)數(shù)理統(tǒng)計(jì)的特點(diǎn)是應(yīng)用面廣,分支較多。社會的發(fā)展不斷向統(tǒng)計(jì)提出新的問題。從歷史的典籍中,人們不難發(fā)現(xiàn)許多關(guān)于錢糧、戶口、地震、水災(zāi)等等的記載,

說明人們很早就開始了統(tǒng)計(jì)的工作。但是當(dāng)時的統(tǒng)計(jì),只是對有關(guān)事實(shí)的簡單記錄和整理,而沒有在一定理論的指導(dǎo)下,作出超越這些數(shù)據(jù)范圍之外的推斷。到了十九世紀(jì)末二十世紀(jì)初,隨著近代

數(shù)學(xué)和概率論的發(fā)展,才真正誕生了數(shù)理統(tǒng)計(jì)計(jì)學(xué)這門學(xué)科。數(shù)理統(tǒng)計(jì)學(xué)是一門應(yīng)用性很強(qiáng)的學(xué)

科。 它是研究怎樣以有效的方式收集、整理和分析受隨機(jī)影響的數(shù)據(jù),并對所考察的問題作出推斷和預(yù)測,直至為采取決策和行動提供依據(jù)和建議。數(shù)理統(tǒng)計(jì)不同于一般的資料統(tǒng)計(jì),它更側(cè)重于應(yīng)用隨機(jī)現(xiàn)象本身的規(guī)律性進(jìn)行資料的收集、整理和分析。數(shù)理統(tǒng)計(jì)的任務(wù)就是研究怎樣有效地收集、整理、分析所獲得的有限的、局部的資料,對所研究問題的整體,盡可能地作出精確而可靠的結(jié)論。在數(shù)理統(tǒng)計(jì)中,不是對所研究的對象全體(稱為總體)進(jìn)行觀察,而是抽取其中的部分(稱為樣本)進(jìn)行觀察獲得數(shù)據(jù)(抽樣),并通過這些數(shù)據(jù)對總體進(jìn)行推斷。由于推斷是基于抽樣數(shù)據(jù),抽樣數(shù)據(jù)又

不能包括研究對象的全部信息。因而由此獲

得的結(jié)論必然包含不肯定性。所以,在數(shù)理統(tǒng)統(tǒng)計(jì)中必然要用到概率論的理論和方法。由此也可以說:概率論是數(shù)理統(tǒng)計(jì)的基礎(chǔ),而數(shù)理統(tǒng)計(jì)是概率論的重要應(yīng)用。但它們是并列的兩個學(xué)科,并無從屬關(guān)系。需要強(qiáng)調(diào)說明一點(diǎn):統(tǒng)計(jì)方法具有“部分推斷整體”的特征。因?yàn)槲覀兪菑囊恍〔糠謽颖居^察值去推斷該全體對象(總體)情況,即由部分推斷全體。這里使用的推理方法是“歸納推理”。這種歸納推理不同于數(shù)學(xué)中的“演繹推理”。它在作出結(jié)論時,是根據(jù)所觀察到的大量個別情況

“歸納”起來所得,而不是從一些假設(shè)、命題、已知的事實(shí)等出發(fā),按一定的邏輯推理去得出來的。但此時還應(yīng)記住畢竟是由“局部”推斷“整體”,因而仍可能犯錯誤,結(jié)論往往又是在某個“可靠性水平”之下得出的?!?.1隨機(jī)樣本1.總體與個體一個統(tǒng)計(jì)問題總有它明確的研究對象。研究對象的全體稱為總體(母體),總體中每個成員稱為個體。該批燈泡壽命的全全體就是總體某品牌轎車百公里耗油量的全體就是總體某批燈泡的壽命然而在統(tǒng)計(jì)研究中,人們關(guān)心總體僅僅是關(guān)心其每個個體的一項(xiàng)(或幾項(xiàng))數(shù)量指標(biāo)和該數(shù)量指標(biāo)在總體中的分布情況。這時,每個個體具有的數(shù)量指標(biāo)的全體就是總體。某品牌轎車百公里耗油量由于每個個體的出現(xiàn)是隨機(jī)的,所以相應(yīng)的

數(shù)量指標(biāo)的出現(xiàn)也帶有隨機(jī)性。從而可以把

這種數(shù)量指標(biāo)看作一個隨機(jī)變量,因此隨機(jī)

變量的分布就是該數(shù)量指標(biāo)在總體中的分布。這樣,總體就可以用一個隨機(jī)變量及其分分布來描述。統(tǒng)計(jì)的任務(wù),是根據(jù)從總體中抽取的樣本,去推斷總體的性質(zhì)。由于我們關(guān)心的是總體中的個體的某項(xiàng)指標(biāo)(如人的身高、體重,燈泡的壽命,汽車的耗油量…),所謂總體的性質(zhì),無非就是這些指標(biāo)值的集體的性質(zhì)。而概率分布正是刻劃這種集體性質(zhì)的適當(dāng)工具具。因此在理論上可以把總體與概率分布等

同起來。在數(shù)理統(tǒng)計(jì)中,總體這個概念的要旨是:———總體就是一個概率分布。-500050010001500200005101520252.樣本為推斷總體分布及各種特征,按一定規(guī)則從

總體中抽取若干個體進(jìn)行觀察試驗(yàn),以獲得

有關(guān)總體的信息,這一抽取過程稱為“抽樣”,所抽取的部分個體稱為樣本。樣本中所包含的的個體數(shù)目稱為樣本容量。從某品牌轎車中抽5輛進(jìn)行耗油量試驗(yàn)樣本容量為5容量為n的樣本(也稱為子樣)可以看作n維隨機(jī)變量:

(

X1,X2,…,Xn)但是,一旦取定一組樣本,得到的是n個具體的數(shù)(x1,x2,…,xn),稱為樣本的一次觀察值,簡稱樣本觀察值。由于抽樣的目的是為了對總體進(jìn)行統(tǒng)計(jì)推斷,為了了使抽取的樣本能很好地反映總體的信息,必須考慮抽樣方法。最常用的一種抽樣方法叫作“簡單隨機(jī)抽樣””,它要求抽取的樣本滿足下面兩點(diǎn):代表性:X1,X2,…,Xn中每一個與所考察的總體有相同的分布。獨(dú)立性:X1,X2,…,Xn是相互獨(dú)立的隨機(jī)變量。由簡單隨機(jī)抽樣得到的樣本(子樣)稱為簡單隨機(jī)樣本(子樣)。用(X1,X2,…,Xn)表示。簡單隨機(jī)樣本是應(yīng)用中最常見的情形,今后,當(dāng)說到(X1,X2,…,Xn)是取自某總體的樣本時,若不特別說明,就指簡單隨機(jī)樣本。3.總體、樣本、樣本值的關(guān)系總體(理論分布)樣本樣本值總體分布決定了樣本取值的概率規(guī)律,也就是樣本取到樣本值的規(guī)律,因而可以由樣本值去推斷總體?!?.2抽樣分布一、樣本數(shù)據(jù)的處理辦法

1、頻數(shù)頻率分布表;2、圖形顯示:直方圖(頻率)、箱線圖3、計(jì)算經(jīng)驗(yàn)分布函數(shù)來近似總體的分布函數(shù)4、構(gòu)造統(tǒng)計(jì)量獲得對總體各種參數(shù)的認(rèn)識3、經(jīng)驗(yàn)分布函數(shù)設(shè)為取自總體X的一個樣本,分布函數(shù)F(x)未知則若將樣本觀測值由小到大進(jìn)行排列為稱為有序樣本用有序樣本定義如下函數(shù):則是一非負(fù)又連續(xù)函數(shù),且滿足稱為經(jīng)驗(yàn)分布函數(shù)。說明:對每一個x,當(dāng)n固定時,是樣本中事件 發(fā)生的頻率樣本的函數(shù),它是一個隨機(jī)變量*由伯努利達(dá)數(shù)定理:只要n相當(dāng)大, 以概率收斂于F(x)Glivenko定理:設(shè)是取自總體X分布函數(shù)為F(x)的樣本,是其經(jīng)驗(yàn)分布函數(shù)表明:當(dāng)n相當(dāng)大時,來自樣本的經(jīng)驗(yàn)分布函數(shù)是總體分布函數(shù)F(x)的一個良好近似,故經(jīng)典統(tǒng)計(jì)學(xué)中一切統(tǒng)計(jì)推斷都已樣本為依據(jù)。例某食品廠生產(chǎn)聽裝飲料,現(xiàn)從生產(chǎn)線上隨機(jī)抽取5聽飲料,稱得凈重為(單位g)351、347、355、344、351,經(jīng)排序得容量為5的有序樣本:344、347、351、351、355,其經(jīng)驗(yàn)分布函數(shù)為4、統(tǒng)計(jì)量由樣本值去推斷總體情況,需要對樣本值進(jìn)行“加工”,這就要構(gòu)造一些樣本的函數(shù),它把樣本中所含的(某一方面)的信息集中起來。這種不含任何未知參數(shù)的樣本的函數(shù)稱為統(tǒng)計(jì)量。它是完全由樣本決定的量。統(tǒng)計(jì)量的分布稱為抽樣樣分布。例如是統(tǒng)計(jì)量當(dāng)未知時,等均不是統(tǒng)計(jì)量二、常見統(tǒng)計(jì)量極其抽樣分布1.

樣本均值反映了總體均值的信息相應(yīng)觀察值為樣本中數(shù)據(jù)與樣本均值的偏差之和為0定理:

設(shè)是來自某總體的樣本,的精確分為 樣本均值。(1)若總體分布為N(μ,σ2),則布為N(μ,σ2/n);(2)若總體分布未知或不是正態(tài)分布,則 的極限分布為

N(μ,

σ2/n

)

;2.

樣本方差與樣本標(biāo)準(zhǔn)差定理設(shè)總體X具有二階矩,EX=μ,DX=σ2<+∞,設(shè)X1,X2,…,Xn是從該總體得到的樣本,則:3.

樣本k階原點(diǎn)矩它反映了總體k階矩的信息4.

樣本k階中心矩k=1,2,…它反映了總體k階中心矩的信息統(tǒng)計(jì)量既然是依賴于樣本的,而后者又是隨機(jī)變量,故統(tǒng)計(jì)量也是隨機(jī)變量,因而就有一定的分布,這個分布叫做統(tǒng)計(jì)量的““抽樣分布”.三大抽樣分布分布1、Person定義:設(shè) 相互獨(dú)立,

都服從正態(tài)分布N(0,1),

則稱隨機(jī)變量:所服從的分布為自由度為n的 分布.記為:分布的密度函數(shù)為:來定義.其中伽瑪函數(shù)通過積分由 分布的定義,不難得到:1.

設(shè)相互獨(dú)立,都服從正態(tài)分布則2.設(shè)且X1,X2相互獨(dú)立,則這個性質(zhì)叫分布的可加性.若則可以求得,EX=n,DX=2n應(yīng)用中心極限定理可得,若,則當(dāng)n充分大時,的分布近似正態(tài)分布N(0,1).2、t分布定義:

設(shè)X~N(0,1)

,

Y~,

且X與Y相互獨(dú)立,則稱變量所服從的分布為自由度為n的t分布。記為:T~t(n).StudentT的密度函數(shù)為:具有自由度為n的t分布的隨機(jī)變量T的數(shù)學(xué)期望和方差為:E(T)=0;D(T)=n/(n-2),對n>2不難看到,當(dāng)n充分大時,t分布近似N(0,1)分布。 但對于較小的n,t分布與N(0,1)分布相差很大。X與Y相互3、F分布定義:

設(shè)獨(dú)立,則稱統(tǒng)計(jì)量服從自由度為n1及n2

的F分布,n1稱為第一自由度,n2稱為第二自由度,記作:

F~F(n1,n2

).由定義可見,~F(n2,n1)若X~F(n1,n2),X的概率密度為X的數(shù)學(xué)期望為:若n2>2即它的數(shù)學(xué)期望并不依賴于第一自由度n1.分位點(diǎn)1.6452.326-2.3262.4469-2.446914.4401.2379.20一般地,=0.1605四、幾個重要的抽樣分布定理定理1(樣本均值的分布)設(shè)X1,X2,…,Xn

是取自正態(tài)總體的樣本,則有:n取不同值時樣本均值 的分布定理2(樣本方差的分布)設(shè)X1,X2,…,Xn是取自正態(tài)總體的樣本,分別為樣本均值和樣本方差,則有:說明:n取不同值時的分布定理3設(shè)X1,X2,…,Xn是取自正態(tài)總體的樣本,分別為樣本均值和樣本方差,則有:證明:獨(dú)立定理4(兩總體樣本均值差的分布)且X與Y獨(dú)立,X1

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負(fù)責(zé)。
  • 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時也不承擔(dān)用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

評論

0/150

提交評論