版權說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權,請進行舉報或認領
文檔簡介
統(tǒng)計問題-統(tǒng)計量及其抽樣散布6.1整體與樣本整體與個體在一個統(tǒng)計問題中,我們把研究對象的全體稱為整體,構成整體的每個成員稱為個體。對多半實質(zhì)問題。整體中的個體是一些實在的人或物。比方,我們要研究某大學的學生身高狀況,則該大學的全體學生構成問題的整體,而每一個學生即是一個個體。事實上,每個學生有很多特點:性別、年紀、身高、體重、民族、籍貫等。而在該問題中,我們關懷的不過該校學生的身高怎樣,對其余的特點暫不予以考慮。這樣,每個學生(個體)所擁有的數(shù)目指標值——身高就是個體,而將所有身高全體當作整體。這樣一來,若拋開實質(zhì)背景,整體就是一堆數(shù),這堆數(shù)中有大有小,有的出現(xiàn)的時機多,有的出現(xiàn)的時機少,所以用一個概率散布去描繪和概括整體是合適的。從這個意義上看,整體就是一個散布,而其數(shù)目指標就是聽從這個散布的隨機變量。此后說“從整體中抽樣”與“從某散布中抽樣”是同一個意思。[例6-1]觀察某廠的產(chǎn)質(zhì)量量,將其產(chǎn)品只分為合格品與不合格品,并以0記合格品,以1記不合格品,則整體={該廠生產(chǎn)的所有合格品與不合格品}={由0或1構成的一堆數(shù)}。若以p表示這堆數(shù)中1的比率(不合格品率),則該整體可由一個二點散布表示:不一樣的p反應了整體間的差別。比如,兩個生產(chǎn)同類產(chǎn)品的工廠的產(chǎn)品整體散布為:我們能夠看到,第一個工廠的產(chǎn)質(zhì)量量優(yōu)于第二個工廠。實質(zhì)中,散布中的不合格品率是未知的,怎樣對之進行預計是統(tǒng)計學要研究的問題。樣本為了認識整體的散布,我們從整體中隨機地抽取n個個體,記其指標值為x1,x2,,xn,則x1,x2,,xn稱為整體的一個樣本,n稱為樣本容量,或簡稱樣本量,樣本中的個體稱為樣品。我們第一指出,樣本擁有所謂的二重性:一方面,因為樣本是從整體中隨機抽取的,抽取前沒法預知它們的數(shù)值,所以,樣本是隨機變量,用大寫字母X1,X2,,Xn表示;另一方面,樣本在抽取此后經(jīng)觀察就有確立的觀察值,所以,樣本又是一組數(shù)值。此時用小寫字母x1,x2,,xn表示是合適的。簡單起見,不論是樣本仍是其觀察值,本書中樣本一般均用x1,x2,,xn表示,讀者應能從上下文中加以差別。[例6-2]啤酒廠生產(chǎn)的瓶裝啤酒規(guī)定凈含量為640g,,因為隨機性,事實上不行能使得所有的啤酒凈含量均為640g,現(xiàn)從某廠生產(chǎn)的啤酒中隨機抽取10瓶測定其凈含量,獲得以下結果:641635640637642638645643639640這是一個容量為10的樣本的觀察值。對應的整體為該廠生產(chǎn)的瓶裝啤酒的凈含量?!敬鹨删幪枺?0060101針對該題發(fā)問】從整體中抽取樣本時,為使樣本擁有代表性,抽樣一定是隨機抽樣。往常能夠用隨機數(shù)表來實現(xiàn)隨機抽樣。還要求抽樣一定是獨立的,即每次的結果互不影響。在概率論中,在有限整體(只有有限個個體的整體)中進行有放回抽樣,是獨立的隨機抽樣;但是,若為不放回抽樣,則是不獨立的抽樣。但當整體容量N很大但樣本容量n較小時,不放回抽樣能夠近似地看做放回抽樣,即可近似看做獨立隨機抽樣。下邊,我們假定抽樣方式總知足獨立隨機抽樣的條件。從整體中抽取樣本能夠有不一樣的抽法,為了能由樣本對整體做出較靠譜的推測,就希望樣本能很好地代表整體。這就需要對抽樣方法提出一些要求,最常用的“簡單隨機抽樣”有以下兩個要求:1)樣本擁有隨機性,即要求整體中每一個個體都有同樣時機被選入樣本,這便意味著每同樣品xi與整體X有同樣的散布。2)樣本要有獨立性,即要求樣本中每同樣品的取值不影響其余樣品的取值,這意味著x1,x2,,xn互相獨立。用簡單隨機抽樣方法獲得的樣本稱為簡單隨機樣本,也簡稱樣本。除非特別指明,本書中的樣本皆為簡單隨機樣本。于是,樣本x1,x2,,xn能夠當作是互相獨立的擁有同一散布的隨機變量,其共同分布即為整體散布。設整體X擁有散布函數(shù)F(x),x1,x2,,xn為取自該整體的容量為n的樣本,則樣本聯(lián)合散布函數(shù)為:若整體擁有密度函數(shù)f(x),則樣本的聯(lián)合密度函數(shù)為若整體X為失散型隨機變量,則樣本的(聯(lián)合)概率函數(shù)為明顯,往常說的樣本散布是指多維隨機變量(x1,x2,,xn)的聯(lián)合散布。[例6-3]為預計一物品的重量μ,用一架天平重復丈量n次,得樣本x1,x2,,xn,由于是獨立重復丈量,x1,x2,,xn是簡單隨機樣本。整體的散布即x1的散布(x1,x2,,xn散布同樣)。因為稱量偏差是均值(希望)為零的正態(tài)變量,所以x1可以為聽從正態(tài)散布2x1的概率密度為N(μ,σ)(X1等于物品重量μ)加上稱量偏差,即這樣,樣本散布密度為?!敬鹨删幪枺?0060102針對該題發(fā)問】[例6-4]設某種電燈泡的壽命X聽從指數(shù)散布E(λ),其概率密度為:則來自這一整體的簡單隨機樣本x1,x2,,xn的樣本散布密度為【答疑編號:10060103針對該題發(fā)問】[例6-5]考慮電話互換臺一小時內(nèi)的呼喊次數(shù)X。求來自這一整體的簡單隨機樣本x1,x2,,xn的樣本散布?!敬鹨删幪枺?0060104針對該題發(fā)問】解由概率論知識,X聽從泊松散布P(λ),其概率函數(shù),(此中x是非負整數(shù){0,1,2,,k,}中的一個)。進而,簡單隨機樣本x1,x2,,xn的樣本散布為:6.2統(tǒng)計量及其散布統(tǒng)計量與抽樣散布樣原來自整體,樣本的觀察值中含有整體各方面的信息,但這些信息較為分別,有時顯得凌亂無章。為將這些分別在樣本中相關整體的信息集中起來以反應整體的各樣特點,需要對樣本進行加工。最常用的加工方法是結構樣本的函數(shù),不一樣的函數(shù)反應整體的不一樣特點。定義6-1設x1,x2,,xn為取自某整體的樣本,若樣本函數(shù)T=T(x1,x2,,xn)中不含有任何未知參數(shù),則稱T為統(tǒng)計量。統(tǒng)計量的散布稱為抽樣散布。依據(jù)這必定義,若x12n為樣本,則,2未知,x,,x都是統(tǒng)計量,而當μ,σ時,,等均不是統(tǒng)計量。樣本均值及其抽樣散布定義6-2設x1,x2,,xn為取自某整體的樣本,其算術均勻值稱為樣本均值,一般用表示,即。[例6-6]某單位采集到20名青年人某月的娛樂支出花費數(shù)據(jù):79848488929394979899125則該月這20名青年的均勻娛樂支出為【答疑編號:10060105針對該題發(fā)問】對于樣本均值的抽樣散布,我們有下邊的定理。定理6-1設x1,x2,,xn是來自某個整體X的樣本,為樣本均值。2;(1)若整體散布為N(μσ),則的精準散布為(2)若整體X散布未知(或不是正態(tài)散布),且E(X)=μ,D(X)=σ2,則當樣本容量n較大時,的漸近散布為,這里的漸近散布是指n較大時的近似散布。證明(1)因為為獨立正態(tài)變量線性組合,故仍聽從正態(tài)散布。此外,故(2)易知為獨立、同散布的隨機變量之和,且。由中心極限制理,,此中Φ(x)為標準正態(tài)散布。這表示n較大時的漸近散布為。樣本方差與樣本標準差定義6-3設x1,x2,,xn為取自某整體的樣本,則它對于樣本均值的均勻偏差平方和稱為樣本方差,其算術根稱為樣本標準差。相對樣本方差而言,樣本標準差往常更有實質(zhì)意義,因為它與樣本均值擁有同樣的胸懷單位。在上邊定義中,n為樣本容量,稱為偏差平方和,它有3個不一樣的表達式:事實上,,偏差平方和的這[例6-7]在例
3個表達式都可用來計算樣本方差。6-6中,我們已經(jīng)算得,其樣本方差與樣本標準差為,。方法二s=11.5731【答疑編號:10060201針對該題發(fā)問】往常用第二種方法計算s2方便很多。下邊的定理給出樣本均值的數(shù)學希望和方差以及樣本方差的數(shù)學希望,它不依靠于整體的散布形式。這些結果在后邊的議論中是實用的。定理6-2設整體X擁有二階矩,即2E(x)=μ,D(X)=σ<+∞x1,x2,,xn為從該整體獲得的樣本,和s2分別是樣本均值和樣本方差,則此定理表示,樣本均值的均值與整體均值同樣,而樣本均值的方差是整體方差的。證明因為1)2)故()式建立。下證(),注意到,而,于是,兩邊各除以n-1,即得()式。值得讀者注意的是:本定理的結論與整體聽從什么散布沒關。樣本矩及其函數(shù)樣本均值和樣本方差的更一般的推行是樣本矩,這是一類常有的統(tǒng)計量。定義6-4設x1,x2,,xn是樣本,則統(tǒng)計量()稱為樣本k階原點矩,特別地,樣本一階原點矩就是樣本均值。統(tǒng)計量()稱為樣本k階中心矩。常有的是k=2的場合,此時稱為二階樣本中心矩。本書中我們將其記為sn2,以差別樣本方差S2。極大次序統(tǒng)計量和極小次序統(tǒng)計量定義6-5設整體X擁有散布函數(shù)F(x),散布密度f(x),x1,x2,,xn為其樣本,我們分別稱X(1)=min{x12n(n)=max{x12n,x,x},x,x,x}為極小次序統(tǒng)計量和極大次序統(tǒng)計量。定理6-3若x(1),x(n)分別為極小、極大次序統(tǒng)計量,則(1)x(1)的散布函數(shù)F1(x)=1-(1-F(x))n,x(1)的散布密度f1(x)=n-(1-F(x))n-1f(x)(2)x(n)的散布函數(shù)Fn(x)=[F(x)]n,x(n)的散布密度fn(x)=n[F(x)]n-1f(x)證明先求出x(1)及x(n)的散布函數(shù)F1(x)及Fn(x):,,分別對F1(x),F(xiàn)n(x)求導即得正態(tài)整體的抽樣散布有好多統(tǒng)計推測是鑒于正態(tài)整體的假定的,以標準正態(tài)變量為基石而結構的三個有名統(tǒng)計量(其抽樣散布分別為x2散布,t散布和F散布)在實踐中有著寬泛的應用。這是因為這三個統(tǒng)計量不單有明確背景,并且其抽樣散布的密度函數(shù)有“明確的表達式”,它們被稱為統(tǒng)計中的“三大抽樣散布”。x2散布(卡方散布)定義
6-6
設X1,X2,,Xn獨立同散布于標準正態(tài)散布
N(0,1),則x2=x12+xn2的散布稱為自由度為
n的
x2散布,記為
x2~
x2(n)。x2(n)散布的密度函數(shù)見圖6-4當隨機變量22222x~x(n)時,對給定的α(0<α<1),稱知足p{x>xα(n)}=α的xα(n)}是自由度為n的開方散布的α分位數(shù)。分位數(shù)xα2(n)}能夠從附表4中查到。比如n=10,=0.05,那么從附表4中查得x2(10)=18.307p(x)2>x20.05(10)=p{x2>18.307=0.05注:請讀者注意x2~x2(n)時,n是自由度,不是容量。2.F散布定義6-7設x1~x2(m),x2~x2(n)X1與X2獨立,則稱的散布是自由度為m與n的F散布,記為F~F(m,n),此中m稱為分子自由度,n稱為分母自由度。自由度為m與n的F散布的密度函數(shù)的圖像是一個只取非負值的偏態(tài)散布(見圖6-5)。當隨機變量F~F(m,n)時,對給定的α(0<α<1),稱知足P{F>Fα}(m,n)=α的數(shù)Fαm,n)是自由度為m與n的F散布的α分位數(shù)。當F~F(m,n)時,有下邊性質(zhì)(不證),這說明()對小的α,分位為Fα(m,n)能夠從附表5中查到,而分位數(shù)F1-α(m,n)則可經(jīng)過()式獲得?!纠?-8】若取m=10,則n=5,α=0.05,那么從附表5上(m=n1,n=n2)查得F0.05(10,5)=4.74利用()式可獲得【答疑編號:10060202針對該題發(fā)問】3.t散布定義6-8設隨機變量與X1與X2獨立且X1~N(0,1),X2~X2(n),則稱的散布為自由度為n的t的散布,記為t~t(n).t散布密度函數(shù)的圖像是一個對于縱軸對稱的散布(圖6-6),與標準正態(tài)散布的密度函數(shù)形態(tài)近似,不過峰比標準正態(tài)散布低一些,尾部的概率比標準正態(tài)散布的大一些。圖6-6t散布與N(0,1)的密度函數(shù)當隨機變量t~t(n)時,稱知足P{t>tαα的t散布的α(n)}=α的t(n)是自由度為n分位數(shù),分位數(shù)tαn=10,α=0.05時,從附表3上查得(n)能夠從附表3中查到,比如當(10)=1.8125t0.05因為t散布的密度函數(shù)對于0對稱,故其分位數(shù)有以下關系:(n)=-t(n)t1-αα比如,t0.95(10)=-t0.05(10)=-1.8125當n很大時,(n≥30),t散布能夠用N(0,1)近似P(t>-tα)=1-α,p(t>t1-α)=1-α,∴t1-α=-tα4.一些重要結論來自一般正態(tài)整體的樣本均值和樣本方差S2的抽樣散布是應用最廣的抽樣散布,下邊我們加以介紹。定理6-4設X1,X2,Xn是來自正態(tài)整體2)的樣本,N(μ,σ其樣本均值和樣本方差分別為:則有1)與s2互相獨立;2)特別,若(不證)222推論:設,σ1=σ2=σ并記則(不證)本章小結本章的基本要求是(一)知道整體、樣本、簡單樣本和統(tǒng)計量的觀點(二)知道統(tǒng)計量和s2的以下性質(zhì)。22E(s)=σ(三)若x的散布函數(shù)為F(x),散布函數(shù)為f(x),則樣本(x1,x2,xn)的聯(lián)合散布函數(shù)為F(x1)F(x2)F(xn)樣本(x1,x2,xn)的聯(lián)合散布密度為f(x1)f(x2)fxn),樣本(x1,x2,xn)的概率函數(shù),
溫馨提示
- 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權益歸上傳用戶所有。
- 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預覽,若沒有圖紙預覽就沒有圖紙。
- 4. 未經(jīng)權益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
- 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負責。
- 6. 下載文件中如有侵權或不適當內(nèi)容,請與我們聯(lián)系,我們立即糾正。
- 7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。
最新文檔
- 2023年浮標式氧氣吸入器項目融資計劃書
- 生命科學試題庫
- 養(yǎng)老院老人生日慶祝制度
- 養(yǎng)老院老人緊急救援服務質(zhì)量管理制度
- 質(zhì)量管理體系國家審核員培訓考試題
- 房建木工合同范本(2篇)
- 2025年鎮(zhèn)江c1貨運從業(yè)資格證模擬考試題
- 2025年合作下載貨運從業(yè)資格證模擬考試
- 2025年南寧貨運從業(yè)資格證實操考試題
- 2025年舟山駕??荚囏涍\從業(yè)資格證考試
- FZ∕T 97040-2021 分絲整經(jīng)機
- 應聘人員面試登記表(應聘者填寫)
- T∕CAAA 005-2018 青貯飼料 全株玉米
- s鐵路預應力混凝土連續(xù)梁(鋼構)懸臂澆筑施工技術指南
- 撥叉831006設計說明書
- 程序語言課程設計任意兩個高次多項式的加法和乘法運算
- 10KV高壓線防護施工方案——杉木桿
- 石油鉆井八大系統(tǒng)ppt課件
- 北師大版二年級數(shù)學上冊期末考試復習計劃
- 對標管理辦法(共7頁)
- R語言入門教程(超經(jīng)典)
評論
0/150
提交評論