第6章樣本分布_第1頁
第6章樣本分布_第2頁
第6章樣本分布_第3頁
第6章樣本分布_第4頁
第6章樣本分布_第5頁
已閱讀5頁,還剩31頁未讀, 繼續(xù)免費(fèi)閱讀

下載本文檔

版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進(jìn)行舉報或認(rèn)領(lǐng)

文檔簡介

1

第七章樣本分布

數(shù)理統(tǒng)計是研究如何有效地收集、整理和分析帶有隨機(jī)影響的數(shù)據(jù),從而對所觀察的現(xiàn)象做出推斷或預(yù)測,為決策提供依據(jù)的一門學(xué)科。在近一個多世紀(jì)的發(fā)展中,數(shù)理統(tǒng)計不同程度地滲透到人類活動的許多領(lǐng)域。人口調(diào)查、稅收預(yù)算、測量誤差、出生與死亡統(tǒng)計、保險業(yè)中賠款額和保險金的確定等,這些數(shù)理統(tǒng)計早期主要研究的問題,直到現(xiàn)在仍然值得認(rèn)真研究。在近半個世紀(jì)以來,數(shù)理統(tǒng)計在理論、方法、應(yīng)用上都有較大的發(fā)展。抽樣調(diào)查、試驗設(shè)計、回歸分析與回歸診斷、多元分析、時間序列分析、非參數(shù)統(tǒng)計、統(tǒng)計決策函數(shù)、統(tǒng)計計算、隨機(jī)模擬、探索性數(shù)據(jù)分析等統(tǒng)計方法相繼產(chǎn)生并在實(shí)踐中普遍使用,把以描述為主的統(tǒng)計發(fā)展到以推斷為主的統(tǒng)計。數(shù)理統(tǒng)計的內(nèi)容已異常豐富,應(yīng)用廣泛,成為當(dāng)前最活躍的學(xué)科之一。2§7.1總體與樣本一、

總體與個體總體指研究對象的某項數(shù)量指標(biāo)值的全體。組成總體的每個元素稱為個體。由于每個個體的出現(xiàn)帶有隨機(jī)性,即相應(yīng)的數(shù)量指標(biāo)值的出現(xiàn)帶有隨機(jī)性。從而可把此種數(shù)量指標(biāo)看作隨機(jī)變量,我們用一個隨機(jī)變量及其分布來描述總體。為此常用隨機(jī)變量的符號或分布的符號X,Y,Z…,F(x)…來表示總體。例7.1研究某燈泡的使用壽命時,總體可用隨機(jī)變量X來表示,或用其分布函數(shù)F(x)表示。3二、樣本為了推斷總體分布及其各種特征,就必須從總體中按一定法則抽取若干個體進(jìn)行觀測或試驗,以獲得有關(guān)總體的信息.這一抽取過程稱為抽樣.所抽取的部分個體稱為樣本,樣本中個體的數(shù)目稱為樣本容量.例如容量為n的樣本可以看作是n維隨機(jī)變量(

),其觀察值為(

).例7.2研究某地區(qū)學(xué)齡前兒童發(fā)育情況,人們關(guān)心的是其體重X和身高Y這兩個數(shù)量指標(biāo),則此總體就可用二維隨機(jī)變量(X,Y)或其聯(lián)合分布函數(shù)F(x,y)表示.4簡單隨機(jī)抽樣它要求滿足兩點(diǎn):(1)代表性.樣本中每個個體與所考慮的總體有相同的分布.即樣本中每個個體與總體X具有相同的分布.(2)獨(dú)立性.樣本中每個個體取什么值并不影響其它個體取什么值.即必須是相互獨(dú)立的隨機(jī)變量.由簡單隨機(jī)抽樣所得到的樣本稱為簡單隨機(jī)樣本.假如總體的分布函數(shù)為F(x),則其簡單隨機(jī)樣本的聯(lián)合分布函數(shù)為5三、分布族在概率論研究中,隨機(jī)變量的分布總是假設(shè)給定的,但在數(shù)理統(tǒng)計的研究中,總體的分布是未知的,但總可以假定總體的分布是某一個分布族的成員.例7.3在研究某批燈泡的質(zhì)量時,若關(guān)心的是其質(zhì)量是否合格,若合格記為0,不合格記為1,因此該總體就可用僅取0和1的隨機(jī)變量X來表示.顯然,這個總體的分布就是一個參數(shù)為p的二點(diǎn)分布b(1,p),由于p未知,故這個總體分布也是未知的,但可以假定該總體分布是二點(diǎn)分布族

F={b(1,p);0<p<1}6若人們關(guān)心的是燈泡的壽命。這是一個無限總體。假如人們根據(jù)過去的資料知道燈泡的壽命X服從指數(shù)分布,其密度函數(shù)為

所需確定的參數(shù)是λ>0.7四、從樣本去認(rèn)識總體

頻數(shù)頻率分布表及其圖示例7.4我們通常飲用的礦泉水有19個指標(biāo).某市技術(shù)監(jiān)督局一次抽查了58批礦泉水,記錄每一批礦泉水的每個指標(biāo)是否合格,從中可統(tǒng)計出每批礦泉水不合格指標(biāo)的個數(shù)X.這里X是一個離散型隨機(jī)變量,其一切可能取值為0,1,…19。58批礦泉水的指標(biāo)不合格數(shù)構(gòu)成了一個容量為58的樣本的觀察值,每個可取0,1,…,19中某個值,將它們整理后列成表1.1.18表158批礦泉水不合格指標(biāo)數(shù)的頻率、頻數(shù)分布表910(2)

經(jīng)驗分布函數(shù)樣本直方圖可以形象地去描述總體概率密度函數(shù)大致形狀,經(jīng)驗分布函數(shù)將可以用來描述總體分布函數(shù)的大致形狀.定義1.1.1設(shè)總體X的分布函數(shù)為F(x),從中獲得的樣本觀察值為,將它們從小到大排列成,令

稱為該樣本的經(jīng)驗分布函數(shù).11例7.5寫出經(jīng)驗分布函數(shù)某食品廠用自動裝罐機(jī)生產(chǎn)凈重量為345克的午餐肉罐頭,由于隨機(jī)性,每個罐頭的凈重有差別,現(xiàn)從中隨機(jī)取10個罐頭,其凈重如下:344,336,345,342,340,338,344,343,344,343,求經(jīng)驗分布函數(shù).12

統(tǒng)計量及其分布

1.定義1.2.1設(shè)是取自某總體的一個容量為n的樣本,假如樣本函數(shù)

中不含任何未知參數(shù),則稱T為統(tǒng)計量.統(tǒng)計量的分布稱為抽樣分布.2.常用的幾個統(tǒng)計量設(shè)是來自總體X的樣本⑴樣本均值

樣本均值是反映總體數(shù)學(xué)期望所在位置信息的一個統(tǒng)計量,是總體數(shù)學(xué)期望的一個很好的估計.13⑵樣本方差

樣本標(biāo)準(zhǔn)差

樣本方差與樣本標(biāo)準(zhǔn)差反映了數(shù)據(jù)取值分散與集中的程度,即反映了總體方差與標(biāo)準(zhǔn)差的信息.⑶樣本k階(原點(diǎn))矩樣本k階中心矩

它們分別反映了總體k階(原點(diǎn))矩與k階中心矩的信息.14⑷樣本偏度

SK反映了總體分布密度曲線的對稱性信息.當(dāng)SK>0時,分布的形狀是右尾長,稱為正偏的;當(dāng)SK<0時,分布的形狀是左尾長,稱為負(fù)偏的.⑸樣本峰度KU反映了總體分布密度曲線在其峰值附近的陡峭程度的信息,當(dāng)KU>0時,分布密度曲線在其峰比正態(tài)分布來得陡;當(dāng)KU<0時,比正態(tài)分布來得平坦.15⑹次序統(tǒng)計量

被稱為樣本的第i個次序統(tǒng)計量,它是樣本

的滿足如下條件的函數(shù):每當(dāng)樣本得到一組觀察值()時,將它們從小到大排列為

,第i個值便是

的觀察值,稱為該樣本的次序統(tǒng)計量.又稱為該樣本的最小次序統(tǒng)計量,稱為該樣本的最大次序統(tǒng)計量.16⑺樣本極差

若樣本容量為n,則樣本極差它反映了樣本取值范圍的大小,也反映了總體取值分散與集中的程度.極差常在小樣本(n≤30)場合使用,而在大樣本場合很少在實(shí)際中使用.這是因為極差僅使用了樣本中兩個極端點(diǎn)的信息,而把中間的信息都丟棄了,當(dāng)樣本容量越大時,丟棄的信息也就越多,從而留下的信息過少,其使用價值就不大了.17(8)樣本p分位數(shù)和中位數(shù)

定義

設(shè)是來自總體

F(x)

樣本,為該樣本的次序統(tǒng)計量.為該樣本的p分位數(shù)(或p分位點(diǎn)).

稱為樣本中位數(shù),

顯然有對于,稱18第一四分位數(shù)第三四分位數(shù)19例2設(shè)是F(x)

的樣本,此種統(tǒng)計量有個,加起來平均得:令有從中任選兩個分量和

分別為總體均值與方差,2021幾種常用的分布族⑴分布Ⅰ定義:1.2.2設(shè)為相互獨(dú)立的隨機(jī)變量,且均服從標(biāo)準(zhǔn)正態(tài)分布N(0,1),則稱隨機(jī)變量

服從自由度為n的分布,記作自由度可理解為平方和中獨(dú)立變量的個數(shù).Ⅱ分布性質(zhì)

(1)設(shè)

,則E(X)=n,D(X)=2n.(2)

可加性:設(shè)

,

,且X與Y獨(dú)立,則22下圖描繪了分布密度函數(shù)在n=5,10,20時的圖形.23(2)t分布①定義1.2.3:設(shè)X~N(0,1),,且X與Y獨(dú)立,則稱隨機(jī)變量

所服從的分布為t分布,記為T~t(n),稱n為自由度.24(3)F分布①定義1.2.4:設(shè)

,

,

且X與Y獨(dú)立,則稱隨機(jī)變量

服從自由度為(n,m)的F分布,記作.圖1.2.4描繪了的密度函數(shù)曲線25(4)Γ分布族定義1.2.5:定義在正實(shí)數(shù)上,且用密度函數(shù)表示的概率分布稱為Γ分布,記為Γ(α,λ).其中α>0是形狀參數(shù),λ>0是尺度參數(shù).而{Γ(α,λ);α>0,λ>0}就是Γ分布族當(dāng)α=1時的Γ分布為指數(shù)分布其密度曲線如下:2627Γ分布族性質(zhì)28(5)β分布族定義1.2.6:定義在[0,1]上,且密度函數(shù)表示的概率分布稱為β分布記為β(a,b),其中a>0,b>0.而{β(a,b):a>0,b>0}為β分布族. β分布有幾個重要的特例.當(dāng)a=1,b=1時,β分布就是U(0,1)29隨機(jī)變量的分布的分位點(diǎn)1、設(shè)隨機(jī)變量X~F(x),給定常數(shù):0<<1,若存在,滿足,則稱為分布F(x)的上(側(cè))分位點(diǎn).2、設(shè)隨機(jī)變量X~N(0,1),給定常數(shù):0<<1,若存在,滿足,則稱為標(biāo)準(zhǔn)正態(tài)分布的上側(cè)分位點(diǎn).30標(biāo)準(zhǔn)正態(tài)分布的分位點(diǎn)0.0010.0050.010.0250.050.10

3.0902.5762.3271.961.6451.28231設(shè)X

~2(n),若對于:0<<1,滿足則稱為分布的上分位點(diǎn)。分布分位點(diǎn)32t分布分位點(diǎn)設(shè)T~t(n),若對:0<<1,存在t(n),滿足P{T>t(n)}=,則稱t(n)為t(n)的上側(cè)分位點(diǎn).33F—分布的分位點(diǎn)設(shè)F~F(n1,n2)對于:0<<1,

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負(fù)責(zé)。
  • 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時也不承擔(dān)用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

評論

0/150

提交評論