2章 理論分布與抽樣分布_第1頁
2章 理論分布與抽樣分布_第2頁
2章 理論分布與抽樣分布_第3頁
2章 理論分布與抽樣分布_第4頁
2章 理論分布與抽樣分布_第5頁
已閱讀5頁,還剩65頁未讀, 繼續(xù)免費(fèi)閱讀

下載本文檔

版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進(jìn)行舉報或認(rèn)領(lǐng)

文檔簡介

第二章理論分布與抽樣分布第一節(jié)理論分布一、正態(tài)分布的定義

正態(tài)分布或稱高斯(Gauss)分布,是一種常見的連續(xù)型隨機(jī)變量的概率分布。食品科學(xué)中所涉及的許多變量都是服從或接近正態(tài)分布的。正態(tài)分布布概率密度度函數(shù)::x:所研研究的變變數(shù);:x的函函數(shù)值,,稱為概概率密度度函數(shù);;:總體平平均數(shù);;:總體標(biāo)標(biāo)準(zhǔn)差其中μ,σ2是兩個常常數(shù),正正態(tài)分布布記為N(,,)),表示具有有平均數(shù)數(shù)為μ,方差為為的的正正態(tài)分布布。2、f(x))在μ處達(dá)到最最大值,,且3、f(x))是非負(fù)函函數(shù),以以橫軸為為漸進(jìn)線線,分布布從-∞到+∞,且曲線線在μ±σ處各有一一個拐點點。二、正態(tài)態(tài)分布曲曲線的特特征:1、正態(tài)分布布曲線是是以平均均數(shù)μ為中心左左右對稱稱分布的的單峰懸懸鐘形曲曲線,在在平均數(shù)數(shù)的左右右兩側(cè),,只要((x-μ)的絕對對值相等等,f(x))值就相等等。4、正態(tài)態(tài)分布曲曲線是以以參數(shù)μ和σ2的不同而而表現(xiàn)的的一系列列曲線,,所以正正態(tài)分布布曲線是是一個曲曲線族,,不是一一條曲線線。5、正態(tài)態(tài)分布的的次數(shù)多多數(shù)集中中于算術(shù)術(shù)平均數(shù)數(shù)的附近,,離平均均數(shù)愈遠(yuǎn)遠(yuǎn),相應(yīng)應(yīng)的次數(shù)數(shù)愈少,,在-≥3以外次數(shù)數(shù)極少。。6、曲線線f(x))與橫軸之之間所圍圍成的面面積等于于1,,即正態(tài)分布布的分布布函數(shù)F(x))為:二、標(biāo)準(zhǔn)準(zhǔn)正態(tài)分分布由于正態(tài)態(tài)分布是是依賴于于參數(shù)μ和σ2的一簇分分布,正正態(tài)曲線線的位置置由于上上述參數(shù)數(shù)的變化化而不同同。因此此,在研研究具體體的正態(tài)態(tài)分布時時,需要要將一般般的正態(tài)態(tài)分布標(biāo)標(biāo)準(zhǔn)化,,轉(zhuǎn)換成成為μ=0,σ2=1的正正態(tài)分布布,我們們稱μ=0,σ2=1的正正態(tài)分布布為標(biāo)準(zhǔn)正態(tài)態(tài)分布((standardnormaldistribution),記作::N(0,1)。標(biāo)準(zhǔn)正態(tài)態(tài)分布的的概率率密度函函數(shù)記為為(u):標(biāo)準(zhǔn)正態(tài)態(tài)分布的概率分分布函數(shù)數(shù)記為φ(u):對稱隨機(jī)機(jī)變量u服從標(biāo)準(zhǔn)準(zhǔn)正態(tài)分分布,記記作u~N(0,1),其密度曲曲線如圖圖。任何一個個服從正正態(tài)分布布N(μ,σ2)的隨機(jī)機(jī)變量x都可以以通過標(biāo)標(biāo)準(zhǔn)化變變換,將將其轉(zhuǎn)化化為服從從標(biāo)準(zhǔn)正正態(tài)分布布的隨機(jī)機(jī)變量u,u稱稱為標(biāo)準(zhǔn)準(zhǔn)正態(tài)離離差或標(biāo)標(biāo)準(zhǔn)正態(tài)態(tài)變量((standardnormaldeviate))。按標(biāo)準(zhǔn)正正態(tài)分布布的分布布函數(shù)公公式計算算,對不不同的u值編成成函數(shù)表表,稱為為標(biāo)準(zhǔn)正正態(tài)分布布表(附附表1)),從中中可以查查到任意意一個區(qū)區(qū)間內(nèi)曲曲線下的的面積概概率值。。三、正態(tài)態(tài)分布的的概率計計算根據(jù)正態(tài)態(tài)分布的的性質(zhì),,變量在在兩個定定值間取取值的概概率等于于曲線與與其x軸軸在該區(qū)區(qū)間圍成成的面積積。因此概率率的計算算即正態(tài)態(tài)分布概概率密度度函數(shù)的的定積分分計算。。是一個曲曲線系統(tǒng)統(tǒng)。為了了一般化化的應(yīng)用用,需將將正態(tài)分分布標(biāo)準(zhǔn)準(zhǔn)化。1.標(biāo)準(zhǔn)準(zhǔn)正態(tài)分分布的概概率計算算設(shè)u服從從標(biāo)準(zhǔn)正正態(tài)分布布,則[[u1,u2)內(nèi)取值值的概率率為:Φ(u1)和Φ(u2)可由附表表1查得得。由上述公公式及正正態(tài)分布布的對稱稱性可推推出下列列關(guān)系式式,再借借助附表表1便能能方便地地計算有有關(guān)概率率:例1,已已知u~N(0,1),試試求:P(u<-1.64)=??,P((u≥2.58)=??,P(︱u︱≥2.56)=??,P((0.34≤U<1..53))=?利用公式式,查附附表1得得:P(u<<-1..64))=0..5050P(u≥2.58)=Φ(-2..58))=0..004940P(︱u︱≥≥2.56)=2Φ(-2..56))=2×0.005234=0.010468P(0..34≤u<1..53))==Φ(1.53)--Φ(0.34)=0.93699-0.6331==0.30389關(guān)于標(biāo)準(zhǔn)準(zhǔn)正態(tài)分分布,以以下幾種種概率應(yīng)應(yīng)當(dāng)熟記記:P(-1≤u<1))=0..6826P(-2≤u<2))=0..9545P(-3≤u<3))=0..9973P(-1.96≤u<1..96))=0..95P(-2.58≤u<2..58))=0..99U變量在在上述區(qū)區(qū)間以外外取值的的概率分分別為::P(︱u︱≥≥1)==1-P(-1≤u<<1)==1-0.6826==0.3174P(︱u︱≥2)=1-P((-2≤≤u<2)=1-0..9545=0.0455P(︱u︱≥3)=1-P(-3≤u<<3)==1-0.9973==0.0027P(︱u︱≥1.96)=1-P(-1.96≤u<<1.96)=1-0.95=0..05P(︱u︱≥2.58)=1-P(--2.58≤u<2..58))=1-0.99=0..012.一般般正態(tài)分分布的概概率計算算正態(tài)分布布曲線和和橫軸圍圍成的區(qū)區(qū)域面積積為1,,表明了了隨機(jī)變變量x在在(-∞,+∞)之間取取值,是是一個必必然事件件,其概概率為1。若隨機(jī)變變量x服服從正態(tài)態(tài)分布N(μ,σ),則x的取值值落在任任意區(qū)間間[x1,x2)的概率率,記作作P(x1≤x<x2)。即:對上式作作變換u=(x-μ)/σ,得dx=σdu,故故有:由上述證證明,服服從正態(tài)態(tài)分布的的變量x落在[[x1,x2)內(nèi)的概概率,等等于服從從正態(tài)分分布隨機(jī)機(jī)變量u落在[[(x1–μ)/σ,(x2-μ)/σ)即[u1,u2)的概率率。故,計算算一般的的正態(tài)分分布的概概率時,,只要將將區(qū)間的的上、下下限標(biāo)準(zhǔn)準(zhǔn)化,就就可用查查標(biāo)準(zhǔn)正正態(tài)分布布表的方方法求概概率值。。例:已知知x~N(100,22),求P(100≤x<102)==?由上述證證明方法法可得::P(100≤x<102)=P[(100--100)/2≤(x--100)/2<(102--100)/2]=P(0≤u<1))=Ф(1)--Ф(0)=0.8413-0..5000=0.3413關(guān)于一般般正態(tài)分分布,以以下幾個個概念計計算是經(jīng)經(jīng)常用到到的:P(μ-σ≤x<μ+σ)=0..6826P(μ-2σ≤x<μ+2σ)=0..9545P(μ-3σ≤x<μ+3σ)=0..9973P(μ-1.96σ≤x<μ+1.96σ)=0..95P(μ-2.58σ≤x<μ+2.58σ)=0..99x小于26:=(26-30)/5=--0.8查附表1,【例如】有一隨機(jī)機(jī)變數(shù)X服從正態(tài)態(tài)分布,,平均數(shù)數(shù)=30,標(biāo)準(zhǔn)差差=5,試計算算X小于26,大于40,介于26-40區(qū)間的概概率。大于40:=(40-30)/5=2查表1,,由正態(tài)分分布左右右對稱性性,則x介于26與40之間間:【例如】】已知某某正態(tài)分分布=30,,=5,,試計算算x偏離離平均數(shù)數(shù)達(dá)9.8和和14..9以上的概概率?計算標(biāo)準(zhǔn)化查附表1,得知知它們對對應(yīng)的概概率分別別為0..05和和0.01,即即P(|x-μ||≥9..80))=P((|x--μ|≥≥1.96σ))=P[(x-)≥1..96σσ]+P[(x-)≤-1.96σ]=0.05P(|x-μ||≥14.90)=P(|x-μ||≥2..58σσ)=P[(x-)≥2..58σσ]+P[(x-)≤-2.58σ]=0.01以上兩式式等號右右側(cè)的前前一項為為右尾概概率,后后一項為為左尾概概率,其其和概率率為兩尾尾概率。。統(tǒng)計學(xué)::1、總總體樣樣本抽抽樣分分布2、樣本本總總體統(tǒng)統(tǒng)計推斷斷一、樣本本平均數(shù)數(shù)的抽樣樣分布復(fù)置抽樣樣(返置置抽樣))不復(fù)置抽抽樣(不不返置抽抽樣)抽樣誤差差第二節(jié)抽抽樣分分布總體體(μ,σ2)…….樣本1樣本2樣本n抽樣誤差差:由同同一總體體進(jìn)行抽抽樣獲得得的多個個樣本平平均數(shù),,與原總總體平均均數(shù)相比比具有不不同程度度的差異異,這種種差異是是由于隨隨機(jī)抽樣樣造成的的,稱為為抽樣誤誤差(samplingerror)。樣本平均均數(shù)也是是隨機(jī)變變量,其其概率分分布叫作作樣本平均均數(shù)的抽抽樣分布布。有樣本本平均數(shù)數(shù)構(gòu)成的的總體稱稱為樣本平均均數(shù)的抽抽樣總體體,其平均均數(shù)和標(biāo)標(biāo)準(zhǔn)差分分別計為為:是樣本平平均數(shù)的的抽樣總總體的標(biāo)標(biāo)準(zhǔn)差,,簡稱標(biāo)標(biāo)準(zhǔn)誤差差(standarderror)統(tǒng)計學(xué)上上已證明明:樣本本平均數(shù)數(shù)())總總體的參參數(shù),,與與x變量量總體的的兩個參參數(shù)有有如如下關(guān)系系:例如,設(shè)有一一個N==4的有有限總體體,其變變量值為為2、3、3、、4??傮w的平平均數(shù)、、方差和和標(biāo)準(zhǔn)差差為證明這這一結(jié)論論,進(jìn)行行模擬抽抽樣試驗驗當(dāng)以樣本本容量n=2進(jìn)進(jìn)行獨(dú)立立抽樣,,抽取的的所有可可能樣本本數(shù),,其平均均數(shù)、方方差和標(biāo)標(biāo)準(zhǔn)差如如下表。。樣本觀察察值x2222333333334444234323342334∑x455656675667677823342.02.52.53.02.53.03.03.52.53.03.03.53.03.53.54.00.00.50.52.00.50.00.00.50.50.00.00.52.00.50.50.00.000.250.251.000.250.000.000.250.250.000.000.251.000.250.250.00s0.0000.7070.7071.4140.7070.0000.0000.7070.7070.0000.0000.7071.4140.7070.7070.00096488..04.08..484以自由度度(n--1)作作分母計計算的樣樣本方差差之之均數(shù)::以樣本容容量n作作分母計計算的樣樣本方差差之之均數(shù)::樣本標(biāo)準(zhǔn)準(zhǔn)差S之之均數(shù):各樣本均均數(shù)總和和之均數(shù):如果所有有可能樣樣本的某某一統(tǒng)計計數(shù)的平平均數(shù)等等于該總總體的相相應(yīng)參數(shù)數(shù),則稱該統(tǒng)統(tǒng)計數(shù)為為總體參參數(shù)的無偏估計計值(unbiasedestimate)。是的的無無偏估計計值;是的的無偏估估計值;;以n為分母得得到的樣樣本方差差不不是是的的無偏估計計值;S不是的的無無偏估計計值;因此,為為了得到到的的無偏估估計值,,估算樣樣本方差差時,必必須以自自由度df=n-1而不用n做分母。。抽樣結(jié)論論按上述抽抽樣方法法,再以以n=4,從上上述有限限總體2,3,,3,4中抽出出全部所所有樣本本,同樣樣可以計計算出所所有樣本本的平均均數(shù)、方方差和標(biāo)標(biāo)準(zhǔn)差。。各種不同同樣本容容量的樣樣本平均均數(shù)的的抽抽樣分布布n=1234f121n=2f2.02.53.03.54.014641n=4f2.002.252.502.753.003.253.503.754.0018285670562881各種不同同樣本容容量的的分布布圖f234210ff2346543210234706050403020100n=1;;2=1/2n=2;;2=1/4n=4;;2=1/8從上述的的表和圖圖來看,,從總體體抽出的的全部所所有樣本本的平均均數(shù),當(dāng)當(dāng)n增大大時,其其方柱形形圖逐漸漸趨向于于正態(tài)分分布曲線線形狀,,說明樣樣本平均均數(shù)是做做正態(tài)分分布的。。樣本平均均數(shù)分布布的平均均數(shù)、、標(biāo)準(zhǔn)差差與與其原原總體平平均數(shù)、標(biāo)準(zhǔn)差差的關(guān)系為為:根據(jù)次數(shù)數(shù)表,n=2抽抽樣的樣樣本平均均數(shù)為::

樣本平均均數(shù)的方方差為::當(dāng)n=4時,同同理可得得:由此可獲獲得下列列兩個定定理:從正態(tài)總總體抽出出的樣本本,無論論樣本容容量的大大小,其其樣本平平均數(shù)的的抽樣樣分布必必然呈正正態(tài)分布布,具有有平均數(shù)數(shù)和和方差差,,而且且方差隨隨樣本容容量的增增大而降降低。平平均數(shù)的的分布一一般記為為:。。如果總體體不是正正態(tài)分布布,但如如具有一一定量的的方差差2和平均數(shù)數(shù),那那么,當(dāng)樣本容容量足夠夠大時,,從這這一總體體抽出的的樣本平平均數(shù)的的抽樣樣分布也也必趨近近于正態(tài)態(tài)分布,,具有平平均數(shù)和和方差,,這稱為為中心極限限定理。二、均數(shù)數(shù)標(biāo)準(zhǔn)誤誤均數(shù)標(biāo)準(zhǔn)準(zhǔn)誤(平平均數(shù)抽抽樣總體體的標(biāo)準(zhǔn)準(zhǔn)差)的大小反反映樣本本數(shù)的抽抽樣誤差差的大小小,即精精確性的的高低。。標(biāo)準(zhǔn)誤(())大,,說明各各樣本數(shù)數(shù)())間間差異程程度大,,樣本平平均數(shù)的的精確性性低;反反之,小小,,說明間間的差差異程度度小,樣樣本平均均數(shù)的精精確性高高。在實際工工作中,,總體標(biāo)標(biāo)準(zhǔn)差往往往是未未知的,,因而無無法求得得。此時時,可用用樣本標(biāo)標(biāo)準(zhǔn)差S估計總總體σ。若樣本中中各觀察察值為x1,x2,x3……xn,則樣本本標(biāo)準(zhǔn)誤誤或均數(shù)數(shù)標(biāo)準(zhǔn)誤誤為注意:樣樣本標(biāo)準(zhǔn)準(zhǔn)差與樣樣本標(biāo)準(zhǔn)準(zhǔn)誤兩個個統(tǒng)計量量之間的的區(qū)別::1.樣本本標(biāo)準(zhǔn)差差(S)是是反映樣樣本中各各變數(shù)x1,x2,x3……xn之間變異異程度大大小的一一個指標(biāo)標(biāo),它的的大小說說明了對對該樣樣本代表表性的強(qiáng)強(qiáng)弱。2.樣本本標(biāo)準(zhǔn)誤誤是樣本本平均數(shù)數(shù)的標(biāo)準(zhǔn)差差,它是是抽抽樣誤差差的估計計值,其其大小說說明了樣樣本間變變異程度度的大小小及精確性的的高低。。設(shè)有兩個個總體::抽k個樣樣本容量量為n1抽m個樣樣本容量量為n2三、兩樣樣本均數(shù)數(shù)差數(shù)的的抽樣分分布N1(μ1,σ12)N2(μ2,σ22)樣本平均均數(shù)差數(shù)數(shù)分布表3.6抽樣平均均數(shù)次數(shù)數(shù)分布表表f1f22.011..012.541..523.062..033.542..524.013..01∑169表3.7樣本平均均數(shù)差數(shù)數(shù)(d)的分布及及其平均均數(shù)與方方差計算算ff-1.01--1.04.004.0-0.56--3.02..2513.50.0170..01.0017.00.530150.257.51.036360.000.01.530450.257.52.017341.0017.02.56152..2513.53.013.04..004..0∑14414415.0084..0樣本平均均數(shù)差數(shù)數(shù)的平均均數(shù)必等等于兩個個總體平平均數(shù)的的差數(shù)::若x1和x2所在總體體呈正態(tài)態(tài)分布,,其平均均數(shù)分別別為1和2,方差分分別為12和22,不論樣樣本容量量大小,,則兩樣樣本平均均數(shù)的差差數(shù)呈正正態(tài)分布布,具有有平均數(shù)數(shù)d和方差d2。樣本平均均數(shù)差數(shù)數(shù)的方差差必等于于兩個總總體平均均數(shù)方差差的總和和:四、樣本本均數(shù)差差數(shù)標(biāo)準(zhǔn)準(zhǔn)誤實際中,,總體方方差常是是未知的的,通常常的作法法是用樣樣本的方方差分別別來估計計總體的的方差。。所以:常常用估估計,記記為:簡稱為均均數(shù)差數(shù)數(shù)標(biāo)準(zhǔn)誤誤(也稱稱均數(shù)差差數(shù)標(biāo)準(zhǔn)準(zhǔn)差)上式中,,S12與S22分別是樣樣本含量量為n1及n2的兩個樣樣本方差差。如果它們們估計的的各自總總體方差差σ12與σ22相等,即即σ12=σ22=σ2,那么S12與S22都是σ2的估計值值,這時時應(yīng)將S12與S22的加權(quán)平平均值S02作為σ2的估計值值較為合合理。所以:五、t-分布對于未知知總體進(jìn)進(jìn)行抽樣樣,由于于人力、、物力、、材料的的限制,,只能用用樣本統(tǒng)統(tǒng)計數(shù)s2作總體2的估計值值,則其其標(biāo)準(zhǔn)化化離差的的分布不不呈正態(tài)態(tài)分布,,而作具具有df=n-1的t--分布((t-distribution))t-分布的概概率密度

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負(fù)責(zé)。
  • 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時也不承擔(dān)用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

評論

0/150

提交評論