數(shù)理統(tǒng)計(jì)2015 第3章 常見的概率分布律2016_第1頁
數(shù)理統(tǒng)計(jì)2015 第3章 常見的概率分布律2016_第2頁
數(shù)理統(tǒng)計(jì)2015 第3章 常見的概率分布律2016_第3頁
數(shù)理統(tǒng)計(jì)2015 第3章 常見的概率分布律2016_第4頁
數(shù)理統(tǒng)計(jì)2015 第3章 常見的概率分布律2016_第5頁
已閱讀5頁,還剩101頁未讀, 繼續(xù)免費(fèi)閱讀

下載本文檔

版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進(jìn)行舉報(bào)或認(rèn)領(lǐng)

文檔簡介

第3章常見概率分布律13.1二項(xiàng)分布3.2泊松分布3.3另外幾種離散型分布3.4正態(tài)分布3.5另外幾種連續(xù)型分布3.6中心極限定理23.1二項(xiàng)分布常見的離散型概率分布律,以二項(xiàng)分布和泊松分布在環(huán)境與生態(tài)學(xué)中尤為重要。33.1.1二項(xiàng)分布的概率函數(shù)3.1.2服從二項(xiàng)分布的隨機(jī)變量的特征數(shù)3.1.3二項(xiàng)分布應(yīng)用實(shí)例45例3.1從雌雄各半的100只動(dòng)物中做抽樣試驗(yàn)。第一次隨機(jī)抽取一只,記下性別后放回,再做第二次抽取。這時(shí),不論第一次抽樣抽到的是雄性動(dòng)物,還是雌性動(dòng)物,在第二次抽樣時(shí),抽到雄性或雌性的概率仍然各為。第一次試驗(yàn)的結(jié)果,并不影響第二次試驗(yàn)中各事件發(fā)生的概率,這兩次試驗(yàn)是獨(dú)立的。如果第一次抽樣后不放回,情況就不一樣了。假定第一次抽到的是雄性動(dòng)物,那么第二次抽樣抽到雄性的概率是,而抽到雌性的概率為;反之,若第一次抽到的是雌性動(dòng)物,那么第二次抽到雄性動(dòng)物的概率為,而抽到雌性的概率是。也就是說,第一次試驗(yàn)的結(jié)果,影響了第二次試驗(yàn)中各事件發(fā)生的概率。這樣的兩次試驗(yàn)之間是非獨(dú)立的。6第一種抽樣方法,稱為放回式抽樣,適合于二項(xiàng)分布。第二種抽樣方法,稱為非放回式抽樣,適合于超幾何分布。第一種抽樣中,若抽樣試驗(yàn)共進(jìn)行10次,問其中包括3只雄性動(dòng)物的概率是多少?包括3只及3只以下雄性動(dòng)物的概率是多少?在10次試驗(yàn)中,抽到雄性動(dòng)物的只數(shù)是一個(gè)隨機(jī)變量,記為Y,Y的可能值是0,1,…,10。這兩個(gè)問題即求Y=3和Y3的概率。為了解決這個(gè)問題,先規(guī)定以下一組符號(hào):7n=試驗(yàn)次數(shù)(或樣本含量)y=在n次試驗(yàn)中事件A出現(xiàn)的次數(shù)=事件A發(fā)生的概率(每次試驗(yàn)都是恒定的)1-=事件發(fā)生的概率p(y)=Y的概率函數(shù)=P(Y=y)Y的概率分布即為二項(xiàng)分布,表示為Y~B(n,)8例3.1共做了10次抽樣,n=10,在10次抽樣中,雄性動(dòng)物出現(xiàn)3次,y=3,每次抽樣抽到雄性動(dòng)物的概率,p(3)為10次抽樣中抽中3只雄性動(dòng)物的概率,F(xiàn)(3)為10次抽樣中抽中3只和3只以下雄性動(dòng)物的概率。根據(jù)以上給出的n,y和求出p(3)和F(3)。9用m表示雄性動(dòng)物,f表示雌性動(dòng)物。假設(shè)在10次抽樣中,前3次抽中的都是雄性動(dòng)物,表示是mmmfffffff。由于各次抽樣間都是獨(dú)立的,每次抽到雄性動(dòng)物的概率均為,抽到雌性動(dòng)物的概率均為1-。因此10顯然,這不是在10次抽樣中抽到3只雄性7只雌性動(dòng)物的唯一方式,也可能是mffmffmfff或其他方式。在10次抽樣中,抽到3只雄性動(dòng)物的所有方式數(shù),相當(dāng)于從10個(gè)元素中取3個(gè)元素的組合數(shù)。不論是哪一種方式,它們的概率均為,因此抽到3只雄性動(dòng)物的概率11對于任意n和y有通式是從n個(gè)不同的數(shù)中取y個(gè)數(shù)的組合數(shù)。(3.1)式為二項(xiàng)式展開式的第y+1項(xiàng),因此產(chǎn)生理論分布中“二項(xiàng)分布”這一名稱。二項(xiàng)展開式,12+(1-)=1,所以(3.1)式稱為二項(xiàng)分布的概率函數(shù)。根據(jù)(3.1)式,可以求出雄性動(dòng)物出現(xiàn)各種只數(shù)的概率。例如,y=0,1,2,3只的概率分別為:13抽到3只和3只以下雄性動(dòng)物的概率二項(xiàng)展開式中,各項(xiàng)的是從0到n升冪排列,而1-則從n到0降冪排列。各項(xiàng)系數(shù)可從楊輝三角(Pascaltriangle)得到。14這個(gè)三角中各項(xiàng)的值,等于它上一行左右兩個(gè)最近項(xiàng)的和。例如,n=5行中間的兩個(gè)10,是由上一行左右相鄰的兩個(gè)數(shù)4和6以及6和4相加而來。有了這個(gè)三角,便能很容易寫出二項(xiàng)式的展開式。例如[+(1-)]5的展開式系數(shù)[+(1-)]5=5+54(1-)+103(1-)2+102(1-)3+5(1-)4+(1-)5n系數(shù)01111212131331414641515101051……15用Excel計(jì)算二項(xiàng)分布概率的函數(shù):binomdist(number,trials,probobility,cumulative)其中number,trials,probobility,cumulative分別為試驗(yàn)成功次數(shù)、獨(dú)立試驗(yàn)次數(shù)、一次試驗(yàn)成功的概率、邏輯值(累積分布函數(shù)使用true,概率函數(shù)使用false)如輸入“=BINOMDIST(2,5,0.2,TRUE)”出結(jié)果為0.94208如輸入“=BINOMDIST(2,5,0.2,false)”出結(jié)果為0.2048163.1.2服從二項(xiàng)分布的隨機(jī)變量的特征數(shù)平均數(shù)以頻數(shù)表示時(shí),

=n……(3.4)平均數(shù)以比率表示時(shí),

=………(3.5)(3.4)式證明如下:

17方差當(dāng)以比率表示時(shí),(3.6)式證明如下:

18其中二階原點(diǎn)矩19另外,因此,偏斜度峭度20偏斜度和峭度與n和的大小有關(guān):相同時(shí),隨樣本含量n的增加,1和2逐漸接近于0。n相同時(shí),越接近于0.5,1和2越接近于0。以后我們會(huì)講到,正態(tài)分布的1=0,和2=0。所以,隨著樣本含量的增加,二項(xiàng)分布逐漸接近于正態(tài)分布(見3.4),特別是當(dāng)在0.5附近時(shí),這種接近來得更快。表3-1不同n,的

1和

2n=0.001=0.10=0.50500

1=0.44

2=0.19

1=0.12

2=0.01

1=0

2=0100

1=0.98

2=0.95

1=0.27

2=0.05

1=0

2=-0.0210

1=3.11

2=9.50

1=0.84

2=0.51

1=0

2=-0.20213.1.3二項(xiàng)分布應(yīng)用實(shí)例例3.2一頭母豬一窩產(chǎn)了10頭仔豬,分別求其中有2頭公豬和6頭公豬的概率,并求10頭仔豬中公豬頭數(shù)的期望和方差。(設(shè)任何一頭仔豬為公豬的概率為0.5)解:我們將每產(chǎn)一頭仔豬看成是一次試驗(yàn),每次試驗(yàn)只有兩種結(jié)果:公豬或母豬,每次試驗(yàn)彼此間是獨(dú)立的(每頭仔豬的性別與其他仔豬的性別無關(guān)),于是10頭仔豬中公豬的頭數(shù)Y服從二項(xiàng)分布B(10,0.5),由3.1式可得有2頭公豬和6頭公豬的概率分別為:10頭仔豬中公豬頭數(shù)的期望和方差分別為:=n=100.5=52=n(1-)=100.50.5=2.522例3.3以雜合基因型Wvwv的小鼠為父本,與純合基因型wvwv的小鼠為母本雜交(wv:波浪毛,Wv正常直毛)。其后代得到wvwv基因型的數(shù)目與Wvwv基因型型的數(shù)目應(yīng)各占一半(概率=1-=0.5)。實(shí)驗(yàn)只選每窩8只的,多于8只和少于8只的都被淘汰,因此n=8,實(shí)際調(diào)查32窩(表3-2)。比較觀測數(shù)據(jù)是否屬于二項(xiàng)分布。第一列為每窩8只中正常直毛小鼠的只數(shù)(y);從8只中一只都沒有(y=0)到8只全都是正常直毛的(y=8)。第二列為總共觀察的32窩小鼠中,各類別的頻數(shù),第五列為各類別的概率(理論概率),第六列為理論頻數(shù)。比較第二列和第六列,可以看出,實(shí)際調(diào)查的結(jié)果與理論推導(dǎo)的結(jié)果有相同的變化趨勢。23下面比較和及s2和2也可看出它們是很接近的。表3-2例3.3的調(diào)查結(jié)果正常直毛后代數(shù)(y)觀察頻數(shù)(f)fyfy2p(y)Np(y)00000.0039060.12499211110.0312501.00000022480.1093753.5000003412360.2187507.000000412481920.2734378.74998456301500.2187507.00000065301800.1093753.5000007214980.0312501.00000080000.0039060.124992總數(shù)N=321396650.99999931.99996824上述觀測數(shù)據(jù)是否屬于二項(xiàng)分布的嚴(yán)格證明,需用擬合優(yōu)度檢驗(yàn)法(7.2.2)作進(jìn)一步判斷。25例3.4遺傳學(xué)中,若兩個(gè)純合親本雜交(RR×rr),F(xiàn)1代自交,其F2的基因型分離比(1RR2Rr1rr)是一個(gè)二項(xiàng)分布的問題。在F2代中R基因出現(xiàn)的概率=0.5,r基因出現(xiàn)的概率1-=0.5,對于一對等位基因n=2。展開二項(xiàng)式,26如果考慮兩對相互獨(dú)立的等位基因,如黃圓豌豆YYRR和綠皺豌豆yyrr雜交,F(xiàn)1為YyRr,在F2中基因是自由組合的。其中顯性基因Y和R在F2代中出現(xiàn)的概率均為

,隱性基因y和r出現(xiàn)的概率均為(1-),=1-=0.5,對于兩對基因n=4。展開二項(xiàng)式,因?yàn)榇盹@性基因出現(xiàn)的概率,所以4表示4個(gè)都是顯性基因的概率,即YYRR的概率,其值為27

3(1-)表示有三個(gè)顯性基因和一個(gè)隱性基因組合出現(xiàn)的概率。其中,的指數(shù)表示顯性基因共有三個(gè),1-的指數(shù)表示隱性基因只有一個(gè),該項(xiàng)的系數(shù)表示這樣的組合共有四種。它們是RRYy,RRyY,RrYY及rRYY。這四種基因組合中的每一種組合的概率均為而三顯一隱這種情況總的概率為4/16。28

2(1-)2表示兩顯兩隱基因組合的概率,這種情況共有六種:RRyy,RryY,RrYy,rRyY,rRYy,rrYY,每一種組合的概率均為六種組合總的概率為6/16。

4(1-)3和(1-)4的情況與上述情況類似,不贅述。29例3.5用棕色正常毛(bbRR)的家兔和黑色短毛(BBrr)兔雜交。雜種F1為黑色正常毛的家兔(BbRr),F(xiàn)1雌兔與F1雄兔近親交配,F(xiàn)2期望產(chǎn)生9/16黑色正常毛,3/16黑色短毛,3/16棕色正常毛,1/16棕色短毛的家兔。即問最少需要多少F2代的家兔,才能以99%概率得到一只棕色短毛兔?30解:在含有n只家兔的后代群體中,bbrr家兔出現(xiàn)y只的概率可由[+(1-)]n求出,其中為非bbrr家兔的概率為15/16,1-為bbrr家兔的概率為1/16。在[+(1-)]n的展開式中,所有含1-的項(xiàng),都相應(yīng)地含有一只或多只bbrr的家兔,只有n項(xiàng)不含bbrr的家兔。因此,n值可由n=1-0.99求出。由因此,在72個(gè)后代中,能夠以99%的概率至少獲得一只棕色短毛兔。31另一種類似的情況時(shí),以一定的風(fēng)險(xiǎn),如冒0.1%的風(fēng)險(xiǎn),至少得到一只黑色長毛(B_R_)兔,所需的F2代的數(shù)目,可以由求出。因?yàn)镕2代分離比是

。補(bǔ)充例某樹種幼苗成材率為70%,現(xiàn)種植2000株,求成材幼苗數(shù)的平均值和標(biāo)準(zhǔn)差。解:設(shè)2000株幼苗的成材數(shù)Y,則Y~B(2000,0.7)=n=2000*0.7=14002=n(1-)=2000*0.7*0.3=420=20.49323.2泊松分布泊松分布(Poissondistribution),有的譯為普松分布或普哇松分布,也是離散型隨機(jī)變量的一種常見的理論分布,它是二項(xiàng)分布的一種極端形式。3.2.1泊松分布的概率函數(shù)3.2.2服從泊松分布的隨機(jī)變量的特征數(shù)3.2.3泊松分布應(yīng)用實(shí)例333.2.1泊松分布的概率函數(shù)在二項(xiàng)分布y

~B(n,)中,當(dāng)某事件出現(xiàn)的概率特別小(→0),而樣本含量又很大(n→)且n

=時(shí),二項(xiàng)分布就變成泊松分布,表示為Y

~P()

。因此,泊松分布主要用來描述稀有事件(小概率事件)在一定時(shí)間或空間(長度、面積和體積)范圍內(nèi)發(fā)生次數(shù)的概率分布,其概率函數(shù)可由二項(xiàng)分布的概率函數(shù)推導(dǎo)出來。34353.2.2服從泊松分布的隨機(jī)變量的特征數(shù)因此,泊松分布概率函數(shù)中的就是泊松分布的平均數(shù)。泊松分布的方差,可以由下式推導(dǎo)出:36其中因此泊松分布的方差由此可見,泊松分布的一個(gè)特點(diǎn)是,在概率函數(shù)內(nèi)的,不但是它的平均數(shù),而且是它的方差,也就是說泊松分布只有一個(gè)參數(shù),泊松分布可表示為Y~P()

。37偏斜度峭度當(dāng)很大時(shí),γ1和γ2則接近于0,這時(shí)的泊松分布近似于正態(tài)分布。383.2.3泊松分布應(yīng)用實(shí)例例3.6麥田內(nèi),平均每10m2有1株雜草,現(xiàn)在要問每100m2麥田中有0株雜草,1株雜草,2株雜草……的概率是多少?解:先求出每100m2麥田中,平均雜草數(shù)。由此可以得出,每100m2麥田中有y株雜草的概率代入y=0,1,2,…即可得出相應(yīng)的概率p(0),p(1),p(2),…,將計(jì)算結(jié)果列在表3-3中。39表3-3每100m2麥田中雜草株數(shù)的概率雜草數(shù)(y)≤5678910概率[p(y)]0.06710.06310.09010.11260.12510.1251

雜草數(shù)(y)1112131415概率[p(y)]0.11370.09480.07290.05210.0835

40用Excel計(jì)算泊松分布概率的函數(shù):poisson(X,mean,cumulative)其中X,mean,cumulative分別為事件出現(xiàn)的次數(shù)、期望值、邏輯值(累積分布函數(shù)使用true,概率函數(shù)使用false)如輸入“=POISSON(5,10,TRUE)”出結(jié)果為0.067086輸入“=POISSON(5,10,FALSE)”出結(jié)果為0.03783341例

考慮在瓊脂培養(yǎng)皿上的細(xì)菌菌落數(shù)目,培養(yǎng)皿的面積為100cm2,將它劃分為100個(gè)1cm2的小區(qū)域,在每個(gè)小區(qū)域內(nèi)發(fā)現(xiàn)細(xì)菌菌落的概率很小,且不同的小區(qū)域彼此是獨(dú)立的,因而在培養(yǎng)皿上的細(xì)菌菌落數(shù)目服從泊松分布。假設(shè)在一個(gè)小區(qū)域內(nèi)出現(xiàn)的概率為0.02,求在一個(gè)培養(yǎng)皿上的細(xì)菌菌落數(shù)為5或更多的概率。解:因?yàn)樵谝粋€(gè)小區(qū)域內(nèi)出現(xiàn)細(xì)菌菌落的概率為0.02,所以在一個(gè)培養(yǎng)皿上細(xì)菌菌落的期望值為0.02100=2423.3另外幾種離散型分布在環(huán)境科學(xué)與生態(tài)學(xué)研究中,還經(jīng)常會(huì)遇到其它離散型概率分布,如超幾何分布和負(fù)二項(xiàng)分布等。433.3.1超幾何分布3.3.2負(fù)二項(xiàng)分布443.3.1超幾何分布從一個(gè)包含兩種不同類型個(gè)體的有限總體中做非放回式抽樣。在n次抽樣中,抽中某種類型的個(gè)體數(shù)即為服從超幾何分布(hypergeometricdistribution)的隨機(jī)變量。它描述了由有限個(gè)(N)個(gè)體中抽出n個(gè)個(gè)體,成功抽出指定種類的個(gè)體(K)的次數(shù)(y)(不歸還)。概率函數(shù)為:N:總體中的個(gè)體數(shù)K:兩種類型中某一種類型的個(gè)體數(shù)n:非放回式抽樣的次數(shù)y:在n次抽樣中抽中某一種類型的個(gè)體數(shù)45例某保護(hù)區(qū)共有100只野生大熊貓,其中10只作了標(biāo)記。某小組去調(diào)查野生大熊貓生活習(xí)性,隨機(jī)觀察了15只,問這15只大熊貓中有5只作了標(biāo)記的概率是多少?解:觀察的作了標(biāo)記的大熊貓數(shù)Y服從超幾何分布,N=100,n=15,K=10,y=5超幾何分布的平均數(shù)方差為46在野生動(dòng)物考察時(shí),常常需要了解野生動(dòng)物群體的大小。一種辦法是,先捕捉一定數(shù)目的動(dòng)物,做上標(biāo)記,把它們放回到群體中,然后再捕捉第二個(gè)樣本計(jì)數(shù)其中有標(biāo)記的動(dòng)物數(shù),根據(jù)以上資料估計(jì)群體的大小。在捕捉第二個(gè)樣本時(shí),捉到有標(biāo)記的動(dòng)物數(shù),是一個(gè)服從超幾何分布的隨機(jī)變量。根據(jù)超幾何分布的平均數(shù),可以估計(jì)出群體的大小。47這里只給出一個(gè)公式::群體大小的估計(jì)K:加有標(biāo)記的個(gè)體數(shù)n:第二次抽樣抽中的個(gè)體數(shù)y:在含量為n的樣本中加有標(biāo)記的個(gè)體數(shù)483.3.2負(fù)二項(xiàng)分布負(fù)二項(xiàng)分布(negativebinomialdistribution)要求的條件同二項(xiàng)分布。負(fù)二項(xiàng)分布需要求出在第y次試驗(yàn)時(shí),發(fā)生第k次事件A的概率?;蛘哒f,在y次試驗(yàn)中,共發(fā)生k次事件A,而且事件A的第k次,恰恰是在第y次試驗(yàn)時(shí)發(fā)生的。如果除去第y次試驗(yàn),則在y-1次試驗(yàn)中,共發(fā)生k-1次事件A,而第y次試驗(yàn)時(shí),剛好發(fā)生第k次事件A。由于試驗(yàn)間是獨(dú)立的,根據(jù)(2.14)式P(在第y次試驗(yàn)時(shí),事件A發(fā)生第k次)=P(y-1次試驗(yàn)中發(fā)生k-1次事件A)?其中=P(A),等號(hào)右邊的第一部分恰好是一個(gè)二項(xiàng)分布49由以上兩式可以得到負(fù)二項(xiàng)分布常用于描述生物的群聚性,如釘螺在土壤的分布、昆蟲的空間分布等。除以上幾種離散型概率分布之外,可能還會(huì)遇到其他的一些分布,如幾何分布(geometricdistribution,在n次伯努利試驗(yàn)中,試驗(yàn)y次才得到第一次成功的機(jī)率:前y-1次皆失敗,第y次成功的概率P(Y=y)=(1-)y-1,即k=1時(shí)的負(fù)二項(xiàng)分布,數(shù)學(xué)期望為1/方差為(1-)/2)等。503.4正態(tài)分布正態(tài)分布(normaldistribution)是最重要的連續(xù)型隨機(jī)變量的概率分布:很多變量服從正態(tài)分布,如水稻產(chǎn)量、小麥株高、玉米粒重等;很多統(tǒng)計(jì)分析方法以正態(tài)分布為基礎(chǔ);不少隨機(jī)變量的分布在樣本容量增大時(shí)趨于正態(tài)分布。513.4.1正態(tài)分布的概率密度函數(shù)和分布函數(shù)3.4.2標(biāo)準(zhǔn)正態(tài)分布3.4.3正態(tài)分布表的查法3.4.4正態(tài)分布的單側(cè)臨界值523.4.1正態(tài)分布的概率密度函數(shù)和分布函數(shù)在環(huán)境科學(xué)與生態(tài)學(xué)的統(tǒng)計(jì)學(xué)中,正態(tài)分布有極其重要的地位。許多生物學(xué)現(xiàn)象產(chǎn)生的數(shù)據(jù)都服從正態(tài)分布。例如,測量某品種小麥的株高,盡管將各種條件盡量做到完全一致,但由于隨機(jī)因素造成的誤差,使得數(shù)據(jù)仍有一定程度的變異。但株高很高和很矮的植株少,大部分植株具有中等高度。該品種小麥的高度是個(gè)隨機(jī)變量,它有一個(gè)平均數(shù),數(shù)據(jù)大部分集中在平均數(shù)附近,并且和平均數(shù)的兩側(cè)呈對稱分布。用一句話來概括這種現(xiàn)象,即兩頭少,中間多,兩側(cè)對稱。數(shù)據(jù)的這種分布規(guī)律稱為正態(tài)分布(normaldistribution)。由于許多隨機(jī)變量都服從正態(tài)分布或通過某種轉(zhuǎn)換后服從正態(tài)分布,許多其他分布都與正態(tài)分布有關(guān),所以正態(tài)分布就成為統(tǒng)計(jì)學(xué)的重要基礎(chǔ)。53正態(tài)分布密度函數(shù)的圖像稱為正態(tài)曲線(normalcurve),如圖3-1所示。曲線有個(gè)最高點(diǎn),以此點(diǎn)的橫坐標(biāo)為中心,向兩邊單調(diào)下降。圖3-1正態(tài)曲線54對于平均數(shù)是,標(biāo)準(zhǔn)差是的正態(tài)分布,其概率密度函數(shù)為:是總體平均數(shù),是曲線最高值的橫坐標(biāo),曲線以直線y=為對稱軸,因而平均數(shù)=中位數(shù)=眾數(shù)。為總體標(biāo)準(zhǔn)差,表示曲線展開程度,越大曲線展開度越大,數(shù)據(jù)越分散;越小曲線展開度越小,數(shù)據(jù)越集中。曲線以橫軸為漸近線向左右無限延伸。曲線在y=1處各有一個(gè)拐點(diǎn)。曲線由參數(shù)和完全決定,決定曲線在橫軸上的位置,決定曲線的形狀,所以一個(gè)正態(tài)分布可表示為Y~N(,2)。正態(tài)分布的偏斜度1=0,峭度2=0。1>0為正偏,1<0為負(fù)偏,偏斜度無邊界。峭度-2~+。55對于任何正態(tài)分布,隨機(jī)變量Y的值落入任意區(qū)間(a,b)的概率累積分布函數(shù)在§3.1.2中已經(jīng)講過,隨著n的增加二項(xiàng)分布逐漸接近于正態(tài)分布,特別是當(dāng)在0.5附近時(shí),這種接近來得更快。563.4.2標(biāo)準(zhǔn)正態(tài)分布=0,=1的正態(tài)分布稱為標(biāo)準(zhǔn)正態(tài)分布(standardnormaldistribution),以N(0,1)表示。標(biāo)準(zhǔn)正態(tài)分布的密度函數(shù)為:

5758累積分布函數(shù)圖3-3為標(biāo)準(zhǔn)正態(tài)分布的累積分布曲線。59標(biāo)準(zhǔn)正態(tài)分布的密度曲線的特性:①u=0時(shí),(u)達(dá)到最大值;②當(dāng)u不論向哪個(gè)方向遠(yuǎn)離0時(shí),e的指數(shù)都變成一個(gè)絕對值越來越大的負(fù)數(shù),(u)的值都減??;③曲線兩側(cè)對稱,即(u)=(-u);④曲線在u=-1和u=1處有兩個(gè)拐點(diǎn);⑤曲線下的面積等于1;⑥對于標(biāo)準(zhǔn)正態(tài)分布的累積分布函數(shù)(u)的值,有編制好的數(shù)值表(附表2),可以查(u)的值,其值等于標(biāo)準(zhǔn)正態(tài)曲線從-到u的一段曲線下的面積,表示隨機(jī)變量U落入?yún)^(qū)間(-,u)的概率;⑦累積分布函數(shù)圖形的特點(diǎn)是:曲線在-處從0平穩(wěn)上升,它關(guān)于點(diǎn)(0,0.5)中心對稱,即將(u)繞此點(diǎn)旋轉(zhuǎn)180o,曲線的形狀不改變。對于任意分布函數(shù)F(y)來說,如果它的密度函數(shù)f(y)是軸對稱的話,則上述情況亦成立。⑧下列一些值很重要:u=-1~1,面積0.6827;u=-2~2,面積0.9543;u=-3~3,面積0.9973;u=-1.960~1.960,面積0.9500;u=-2.576~2.576,面積0.9900。603.4.3正態(tài)分布表的查法隨機(jī)變量的值落在某區(qū)間(a,b)內(nèi)的概率[見(3.20)式],可以從標(biāo)準(zhǔn)正態(tài)分布累積分布函數(shù)的數(shù)值表(e附表2)中查出,對于一般的正態(tài)分布,只要先將它們化為標(biāo)準(zhǔn)正態(tài)分布再查表,就能很容易得出隨機(jī)變量的值落在某一區(qū)間內(nèi)的概率。附表2列出了對于-2.99u2.99的

(u)的值。u值列在第一列和第一行,第一列表示u的整數(shù)部分及第一位小數(shù),第一行為第二位小數(shù)。例如,要查出u=-1.32時(shí)的

(u)的值,可從表中的第一列查出-1.3,從第一行查出0.02,兩者的交點(diǎn)0.09342即為

(-1.32)的值。6162在概率計(jì)算中可利用下列關(guān)系式:P(0<U<u)=(u)-0.5P(U>u)=

(-u)(-u)=1-(u)P(|U|>u)=

2(-u)P(|U|<u)=

1-2(-u)P(u1<U<u2)=

(u2)-(u1)63例3.7查u=-0.82及u=1.15時(shí)的(u)的值。

解:如圖3-4所示,u=-0.82時(shí),(u)=0.20611

u=1.15時(shí),(u)=0.8749364例3.8隨機(jī)變量U服從正態(tài)分布N(0,1),問隨機(jī)變量U的值落在0,1.21間的概率?解:如圖3-5所示,利用上述第一個(gè)關(guān)系式,得P(0<U<u)=(u)-0.5=0.88686-0.5000=0.3868665例3.9已知隨機(jī)變量U服從正態(tài)分布N(0,1),問隨機(jī)變量U的值落在-1.96和1.96之間的概率是多少?解:參考圖3-6,因|u|=1.96,所以P(|U|<u)=

1-2(-u)=1-2(-1.96)=1-0.05000=0.9500066實(shí)際上,一般情況是隨機(jī)變量Y服從平均數(shù)為,標(biāo)準(zhǔn)差為的正態(tài)分布,即服從N(,2)。為了能夠使用附表2求其分布函數(shù)值,必須經(jīng)過標(biāo)準(zhǔn)化(standardization),使其變?yōu)闃?biāo)準(zhǔn)正態(tài)分布,再按上述方法從附表2中查出,令該式的分子經(jīng)y-變換后,變成y與的相對距離,相當(dāng)于=0。再除以,即變?yōu)閥-所包含的標(biāo)準(zhǔn)差的個(gè)數(shù),相當(dāng)于=1。這樣變換后,Y的分布函數(shù)在給定和后,先計(jì)算

的值,再從附表2中查出

,即可得到所要查的值。67例3.10假定例1.2黑蓮子粒重Y~N(1.001,0.1642)。求(1)Y<0.88g的概率;(2)Y>1.33g的概率;(3)Y在0.97和1.04g之間的概率。解:(1)根據(jù)(3.25)式結(jié)果是,黑蓮子粒重低于0.88g的概率為0.22965。(2)由題意得68(3)據(jù)題意693.4.4正態(tài)分布的單側(cè)臨界值(分位數(shù))附表2給出了標(biāo)準(zhǔn)正態(tài)分布累積分布函數(shù)的數(shù)值。即對于給定的u,列出了U<u的曲線下面積。反過來,若要求曲線右側(cè)尾區(qū)一定面積()下,所對應(yīng)的u值u,則可由附表3查出。例如,查右側(cè)尾區(qū)曲線下面積=0.01時(shí)的u值,可以得到u0.01=2.326。附表3給出了滿足

P(U>u)=時(shí)的u值。u稱為的上側(cè)(或右側(cè))臨界值(criticalvalue),也可以稱為的上側(cè)(或右側(cè))分位數(shù)(fractile)。對于左側(cè)尾區(qū),滿足

P(U<-u)=時(shí)的-u

,稱為的下側(cè)臨界值,或下側(cè)分位數(shù)。7071若將一定的曲線下面積,平分到兩側(cè)尾區(qū),則每一尾區(qū)的曲線下面積只有/2。滿足時(shí)的,稱為的雙側(cè)臨界值。附表3沒有給出雙側(cè)臨界值,這時(shí)只要從附表3中,查出曲線下面積為/2時(shí)的即可。如查=0.05的雙側(cè)臨界值,可以從附表3中,查出/2=0.025時(shí)的u值,u0.025=1.960。以后,我們一律用“u”表示的上側(cè)臨界值;“-u”表示的下側(cè)臨界值,用“”或“”表示的雙側(cè)臨界值。圖3-7表明=0.05時(shí),單側(cè)和雙側(cè)臨界值的含義。72在查附表3時(shí),還有一個(gè)問題,即表中給出的概率值只有3位小數(shù),若現(xiàn)在要查的概率有4位小數(shù)如0.3774,這可用插值法來解決。因?yàn)?.3774介于0.375與0.380之間,當(dāng)=0.375和=0.380時(shí),查得u0.375=0.319和u0.380=0.305,然后用以下比例式求解:例求標(biāo)準(zhǔn)正態(tài)分布=0.01的上側(cè)臨界值、下側(cè)臨界值和雙側(cè)臨界值。解:=0.01,上側(cè)臨界值為u0.01=2.326,下側(cè)臨界值為-u0.01=-2.326,雙側(cè)臨界值為u0.01(雙側(cè))=u0.005=2.57673用Excel計(jì)算正態(tài)分布函數(shù)值:normdist(X,mean,standard

dev,cumulative)其中X,mean,standard

dev,cumulative分別為用于計(jì)算正態(tài)分布函數(shù)的區(qū)間點(diǎn)、分布的算術(shù)平均、分布的標(biāo)準(zhǔn)方差、邏輯值(累積分布函數(shù)使用true,概率密度函數(shù)使用false)如輸入“=NORMDIST(5,10,2,TRUE)”出結(jié)果為0.00621如輸入“=NORMDIST(5,10,2,false)”出結(jié)果為0.008764標(biāo)準(zhǔn)正態(tài)分布normsdist(Z),其中Z為用于計(jì)算標(biāo)準(zhǔn)正態(tài)分布函數(shù)的區(qū)間點(diǎn)。74用Excel計(jì)算給定概率正態(tài)分布的區(qū)間點(diǎn):norminv(probability,mean,standarddev)其中probability,mean,standarddev分別為用于計(jì)算正態(tài)分布的概率(介于0-1)、分布的算術(shù)平均、分布的標(biāo)準(zhǔn)方差)如輸入“=NORMINV(0.2,10,2)”出結(jié)果為8.316758標(biāo)準(zhǔn)正態(tài)分布normsinv(probability),其中probability為用于計(jì)算標(biāo)準(zhǔn)正態(tài)分布的概率(介于0-1)。753.5另外幾種連續(xù)型分布3.5.1指數(shù)分布3.5.2分布763.5.1指數(shù)分布經(jīng)常用指數(shù)分布(exponentialdistribution)描述生物的生長過程。因此,指數(shù)分布也是一種用途很廣的分布,指數(shù)分布的密度函數(shù)為:分布函數(shù)為:圖3-8為指數(shù)分布的圖形。7778指數(shù)分布的特征數(shù)為:可以看出,平均數(shù)與標(biāo)準(zhǔn)差相等。偏斜度1=2,峭度2=6。表明圖形相當(dāng)不對稱。在y較高值的一側(cè)拖了一個(gè)很長的尾。1和2的值與無關(guān),不論是何值,曲線的基本形狀不變(圖3-8)。793.5.2分布分布(gammadistribution)是一種很有用的分布模型,又稱皮爾遜Ⅲ型分布(PearsontypeⅢdistribution)。如果把正態(tài)分布配合數(shù)據(jù)稱為一級(jí)近似(firstapproximation),那么分布則可稱為二級(jí)近似(secondapproximation),因?yàn)橛梅植寂浜蠑?shù)據(jù)時(shí),不僅可以配合平均數(shù)和標(biāo)準(zhǔn)差,而且還可以配合偏斜度,因此它包含三個(gè)參數(shù)。80形式最簡單的分布的密度函數(shù)如下:上式中的函數(shù)(p)是一個(gè)依p常數(shù),(p)的定義是因?yàn)榉e分的值由p決定,所以它是p的函數(shù),稱為(p)。由于這個(gè)原因便得到分布這一名稱。81以下是函數(shù)的幾個(gè)簡單特性:82圖3-9是p分別為1,2,3時(shí)的分布曲線。很明顯它們是不對稱的,曲線一端有限,一端無限。分布的特征數(shù)如下:8384從1和2可以看出,隨著p的增加,分布愈來愈接近于正態(tài)分布。另外一些連續(xù)型分布,如分布(betadistribution)、威布爾分布(Weibulldistribution)和均勻分布(uniformdistribution)等,在這里就不再做介紹了。853.6中心極限定理3.6.1中心極限定理的基本內(nèi)容3.6.2中心極限定理的兩個(gè)例子3.6.3中心極限定理的抽樣實(shí)驗(yàn)863.6.1中心極限定理的基本內(nèi)容我們講過,即使在完全相同的試驗(yàn)條件下測量小麥的高度,其株高仍然不一樣,這是由于許多不可避免的隨機(jī)因素所造成的。雖然個(gè)別的隨機(jī)因素對株高的影響不大,但是這些因素的總和,對株高則產(chǎn)生很大的影響。株高是一個(gè)隨機(jī)變量,可以把它看成許多數(shù)值很小、而又相互獨(dú)立的隨機(jī)變量之和。在環(huán)境與生態(tài)學(xué)研究中,很多隨機(jī)變量都可看作許多影響微小而又相互獨(dú)立的隨機(jī)變量之和。當(dāng)這些獨(dú)立的隨機(jī)變量數(shù)量很大時(shí),每一隨機(jī)變量對總和的影響則相對變小。87研究數(shù)量很大的獨(dú)立隨機(jī)變量及其所具有的規(guī)律性,應(yīng)使用極限的原理和方法。已經(jīng)證明,在上述情況下,隨機(jī)變量和的分布趨于正態(tài)分布。研究隨機(jī)變量和的極限分布是正態(tài)分布的一類定理,稱為中心極限定理(centrallimittheorem)。中心極限定理的簡單敘述:假設(shè)被研究的隨機(jī)變量Y可以表示為許多相互獨(dú)立的隨機(jī)變量Yi的和,如果Yi的數(shù)量很大,而且每一個(gè)別的Yi對于Y所起的作用又很小,則Y可以被認(rèn)為服從或近似服從正態(tài)分布。自然界中,許多隨機(jī)變量都可以被認(rèn)為是由許多作用微小且相互獨(dú)立的隨機(jī)變量所組成的。因此,這類隨機(jī)變量都服從正態(tài)分布。這正說明正態(tài)分布是最常見的一種分布,同時(shí),也說明了中心極限定理的重要性,因?yàn)楹芏嘟y(tǒng)計(jì)推斷的方法都是以正態(tài)分布為基礎(chǔ)的,這個(gè)定理保證了這些統(tǒng)計(jì)推斷的方法的廣泛適用性。88設(shè)隨機(jī)變量Y由相互獨(dú)立的隨機(jī)變量Y1,Y2,…,Yn組成,即則i是(3.36)式中各Yi的總體平均數(shù)。如果Yi(i=1,2,…,n)是相互獨(dú)立的,而且全都是具有有限方差(finitevariance)

i2(i=1,2,…,n),則89依據(jù)中心極限定理,當(dāng)n→時(shí),標(biāo)準(zhǔn)化變量漸近服從N(0,1)分布,于是或90(3.39)式中的Yi可能具有相同的分布,也可能具有不同的分布。當(dāng)Yi具有相同的分布時(shí),會(huì)出現(xiàn)一種特別重要的情況,這時(shí)i=,i2=2,i=1,2,…,n,于是(3.39)式就變?yōu)?1在Yi具同一分布時(shí),上式中的可以看作從平均數(shù)為、標(biāo)準(zhǔn)差為的總體中所抽取的含量為n的樣本的平均數(shù)。因此,可以得到以下重要推理:若已知總體平均數(shù)為,標(biāo)準(zhǔn)差為,那么不論該總體是否正態(tài)分布,對于從該總體所抽取的含量為n的樣本,當(dāng)n充分大時(shí).其平均數(shù)漸近服從正態(tài)分布。92因而(3.40)式中標(biāo)準(zhǔn)化變量落在任意區(qū)間(u1,u2)內(nèi)的概率漸近于由標(biāo)準(zhǔn)正態(tài)分布N(0,1)所給出的值。中心極限定理在統(tǒng)計(jì)學(xué)中占有極其重要的地位。有了這個(gè)定理,才能從單個(gè)樣本的n個(gè)數(shù)據(jù)所得到的統(tǒng)計(jì)量對總體進(jìn)行估計(jì)。933.6.2中心極限定理的兩個(gè)例子下面用兩個(gè)例子說明上述中心極限定理的重要推理:若已知總體平均數(shù)為,標(biāo)準(zhǔn)差為,不論該總體是否服從正態(tài)分布,對于從該總體所抽取的含量為n的樣本,當(dāng)n充分大時(shí),其平均數(shù)漸近服從正態(tài)分布。另外,從橫軸上的尺度也可以看出,隨著n的增加,樣本平均數(shù)的標(biāo)準(zhǔn)差越來越小。94例3.11果蠅的復(fù)眼由許多小眼組成。在一個(gè)果蠅群體中,果蠅小眼數(shù)的分布如圖3-10所示。顯然,小眼數(shù)的分布不是正態(tài)分布,而是有些正偏的偏態(tài)分布。該總體的=64,=22,從這個(gè)總體中大量抽取樣本含量分別為n=2,4,8,16和32的樣本,計(jì)算樣本平均數(shù),以隨機(jī)變量分別作出樣本平均數(shù)的分布曲線。95如圖3-11a,b,,c,d,,e,當(dāng)樣本含量n=2時(shí),圖形變化不大,但隨著n的不斷加大,曲線偏斜的程度逐漸變小。當(dāng)n=32時(shí),曲線的正態(tài)性已經(jīng)很好了。另外,從坐標(biāo)的尺度上也可以看出,隨著n的加大,曲線所占有的坐標(biāo)尺度越來越少。說明樣本平均數(shù)的標(biāo)準(zhǔn)差越來越小,這是由中心極限定理所給出的

服從所造成的。96下面再舉一個(gè)更為極端的例子。例3.12一位生理學(xué)家度量了受試者,從一個(gè)固定位置向上用食指夠到一個(gè)按鈕并按下按鈕所需時(shí)間。對于一名受試者,所需時(shí)間(ms,毫秒)的分布用圖3-12的密度曲線表示,大約有占總次數(shù)的10%,受試

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會(huì)有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫網(wǎng)僅提供信息存儲(chǔ)空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負(fù)責(zé)。
  • 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

最新文檔

評(píng)論

0/150

提交評(píng)論