常用概率分布_第1頁
常用概率分布_第2頁
常用概率分布_第3頁
常用概率分布_第4頁
常用概率分布_第5頁
已閱讀5頁,還剩121頁未讀, 繼續(xù)免費閱讀

下載本文檔

版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進行舉報或認領(lǐng)

文檔簡介

常用概率分布第一頁,共一百二十六頁,2022年,8月28日第一節(jié)事件與概率事件概率小概率事件實際不可能性原理第二頁,共一百二十六頁,2022年,8月28日一、事件(一)必然現(xiàn)象與隨機現(xiàn)象

在自然界與生產(chǎn)實踐和科學(xué)試驗中,人們會觀察到各種各樣的現(xiàn)象,把它們歸納起來,大體上分為兩大類:第三頁,共一百二十六頁,2022年,8月28日

一類是可預(yù)言其結(jié)果的,即在保持條件不變的情況下,重復(fù)進行觀察,其結(jié)果總是確定的,必然發(fā)生(或必然不發(fā)生)。這類現(xiàn)象稱為必然現(xiàn)象或確定性現(xiàn)象。另一類是事前不可預(yù)言其結(jié)果的,即在保持條件不變的情況下,重復(fù)進行觀察,其結(jié)果未必相同。這種在個別試驗中其結(jié)果呈現(xiàn)偶然性、不確定性現(xiàn)象,稱為隨機現(xiàn)象或不確定性現(xiàn)象。第四頁,共一百二十六頁,2022年,8月28日

隨機現(xiàn)象或不確定性現(xiàn)象,有如下特點:在一定的條件實現(xiàn)時,有多種可能的結(jié)果發(fā)生,事前人們不能預(yù)言將出現(xiàn)哪種結(jié)果;對一次或少數(shù)幾次觀察或試驗而言,其結(jié)果呈現(xiàn)偶然性、不確定性;但在相同條件下進行大量重復(fù)試驗時,其試驗結(jié)果卻呈現(xiàn)出某種固有的特定的規(guī)律性——頻率的穩(wěn)定性,通常稱之為隨機現(xiàn)象的統(tǒng)計規(guī)律性。第五頁,共一百二十六頁,2022年,8月28日

(二)隨機試驗與隨機事件

1、隨機試驗通常我們把根據(jù)某一研究目的,在一定條件下對自然現(xiàn)象所進行的觀察或試驗統(tǒng)稱為試驗。一個試驗如果滿足下述三個特性,則稱其為一個隨機試驗,簡稱試驗:第六頁,共一百二十六頁,2022年,8月28日

(1)試驗可以在相同條件下多次重復(fù)進行;(2)每次試驗的可能結(jié)果不止一個,并且事先知道會有哪些可能的結(jié)果;(3)每次試驗總是恰好出現(xiàn)這些可能結(jié)果中的一個,但在一次試驗之前卻不能肯定這次試驗會出現(xiàn)哪一個結(jié)果。第七頁,共一百二十六頁,2022年,8月28日

2、隨機事件

隨機試驗的每一種可能結(jié)果,稱為隨機事件,簡稱事件,通常用A、B、C等來表示。隨機事件在一定條件下可能發(fā)生,也可能不發(fā)生。

第八頁,共一百二十六頁,2022年,8月28日

(1)基本事件

我們把不能再分的事件稱為基本事件。由若干個基本事件組合而成的事件稱為復(fù)合事件。

(2)必然事件

我們把在一定條件下必然會發(fā)生的事件稱為必然事件,用Ω表示。第九頁,共一百二十六頁,2022年,8月28日

(3)不可能事件

我們把在一定條件下不可能發(fā)生的事件稱為不可能事件,用ф表示。必然事件與不可能事件實際上是確定性現(xiàn)象,即它們不是隨機事件,但是為了方便起見,我們把它們看作為兩個特殊的隨機事件。第十頁,共一百二十六頁,2022年,8月28日二、概率

刻劃事件發(fā)生可能性大小的數(shù)量指標(biāo),稱為概率。事件A的概率記為P(A)。

(一)概率的統(tǒng)計定義第十一頁,共一百二十六頁,2022年,8月28日

在相同條件下進行n次重復(fù)試驗,如果隨機事件A發(fā)生的次數(shù)為m,那么m/n稱為隨機事件A的頻率;當(dāng)試驗重復(fù)數(shù)n逐漸增大時,隨機事件A的頻率越來越穩(wěn)定地接近某一數(shù)值p,那么就把p稱為隨機事件A的概率。這樣定義的概率稱為統(tǒng)計概率。第十二頁,共一百二十六頁,2022年,8月28日

例如,為了確定1粒小麥種子發(fā)芽這個事件的概率,在表3—1中列出了小麥種子發(fā)芽試驗記錄。

第十三頁,共一百二十六頁,2022年,8月28日

表3—1小麥種子發(fā)芽試驗記錄試驗種子粒數(shù)n100200300400500600700發(fā)芽種子粒數(shù)m65155204274349419489頻率m/n

0.6500.6750.6800.6850.6980.69830.6986第十四頁,共一百二十六頁,2022年,8月28日

從表3-1可看出,隨著實驗次數(shù)的增多,1粒小麥種子發(fā)芽這個事件的概率越來越穩(wěn)定地接近0.7,我們就把0.7作為這個事件的概率。在一般情況下,隨機事件的概率p是不可能準(zhǔn)確得到的。通常以試驗次數(shù)n充分大時隨機事件A的頻率作為該隨機事件概率的近似值。即P(A)=p≈m/n

(n充分大)

第十五頁,共一百二十六頁,2022年,8月28日

(二)概率的古典定義有很多隨機試驗具有以下特征:

1、試驗的所有可能結(jié)果只有有限個,即樣本空間中的基本事件只有有限個;

2、各個試驗的可能結(jié)果出現(xiàn)的可能性相等,即所有基本事件的發(fā)生是等可能的;

3、試驗的所有可能結(jié)果兩兩互不相容。第十六頁,共一百二十六頁,2022年,8月28日

具有上述特征的隨機試驗,稱為古典概型。對于古典概型,概率的定義如下:設(shè)樣本空間由n個等可能的基本事件所構(gòu)成,其中事件A包含有m個基本事件,則事件A的概率為m/n,即

P(A)=m/n

這樣定義的概率稱為古典概率。第十七頁,共一百二十六頁,2022年,8月28日

【例3·1】在1、2、3、…、20這20個數(shù)字中隨機抽取1個,求下列隨機事件的概率。(1)A=“抽得1個數(shù)字≤4”;(2)B=“抽得1個數(shù)字是2的倍數(shù)”。第十八頁,共一百二十六頁,2022年,8月28日

因為該試驗樣本空間由20個等可能的基本事件構(gòu)成,即n=20,而事件A所包含的基本事件有4個,既抽得編號為1,2,3,4中的任何1個,事件A便發(fā)生,即mA=4,所以

第十九頁,共一百二十六頁,2022年,8月28日

同理,事件B所包含的基本事件數(shù)mB=10,即抽得數(shù)字為2,4,6,8,10,12,14,16,18,20中的任何1個,事件B便發(fā)生,故第二十頁,共一百二十六頁,2022年,8月28日

(三)概率的性質(zhì)

1、對于任何事件A,有0≤P(A)≤1;

2、必然事件的概率為1,即P(Ω)=1;

3、不可能事件的概率為0,即P(ф)=0。第二十一頁,共一百二十六頁,2022年,8月28日三、小概率事件實際不可能性原理

隨機事件的概率表示了隨機事件在一次試驗中出現(xiàn)的可能性大小。若隨機事件的概率很小,例如小于0.05、0.01、0.001,稱之為小概率事件。第二十二頁,共一百二十六頁,2022年,8月28日

小概率事件雖然不是不可能事件,但在一次試驗中出現(xiàn)的可能性很小,不出現(xiàn)的可能性很大,以至于實際上可以看成是不可能發(fā)生的。在統(tǒng)計學(xué)上,把小概率事件在一次試驗中看成是實際不可能發(fā)生的事件稱為小概率事件實際不可能性原理,亦稱為小概率原理。小概率事件實際不可能性原理是統(tǒng)計學(xué)上進行假設(shè)檢驗(顯著性檢驗)的基本依據(jù)。第二十三頁,共一百二十六頁,2022年,8月28日第二節(jié)概率分布

事件的概率表示了一次試驗?zāi)骋粋€結(jié)果發(fā)生的可能性大小。若要全面了解試驗,則必須知道試驗的全部可能結(jié)果及各種可能結(jié)果發(fā)生的概率,即必須知道隨機試驗的概率分布。為了深入研究隨機試驗,我們先引入隨機變量的概念。第二十四頁,共一百二十六頁,2022年,8月28日一、隨機變量作一次試驗,其結(jié)果有多種可能。每一種可能結(jié)果都可用一個數(shù)來表示,把這些數(shù)作為變量x的取值范圍,則試驗結(jié)果可用變量x來表示。

【例3·2】對100株樹苗進行嫁接,觀察其成活株數(shù),其可能結(jié)果是“0株成活”,“1株成活”,……

,“100株成活”。用x表示成活株數(shù),則x的取值為0、1、2、……、100。第二十五頁,共一百二十六頁,2022年,8月28日【例3·3】拋擲一枚硬幣,其可能結(jié)果是“幣值一面朝上”、“幣值一面朝下”?!皫胖狄幻娉稀庇?表示,“幣值一面朝下”用0表示,用x表示試驗結(jié)果,則x的取值為0、1。第二十六頁,共一百二十六頁,2022年,8月28日

【例3·4】測定某品種小麥產(chǎn)量(㎏/667.7㎡),表示測定結(jié)果的變量x所取的值為一個特定范圍(a,b),例如200―300(㎏/667.7㎡),x值可以取這個范圍內(nèi)的任何數(shù)值。

第二十七頁,共一百二十六頁,2022年,8月28日

如果表示試驗結(jié)果的變量x,其可能取值至多為可列個,且以各種確定的概率取這些不同的值,則稱x為離散型隨機變量;如果表示試驗結(jié)果的變量x,其可能取值為某范圍內(nèi)的任何數(shù)值,且x在其取值范圍內(nèi)的任一區(qū)間中取值時,其概率是確定的,則稱x為連續(xù)型隨機變量。第二十八頁,共一百二十六頁,2022年,8月28日二、離散型隨機變量的概率分布

要了解離散型隨機變量x的統(tǒng)計規(guī)律,就必須知道它的一切可能值xi及取每種可能值的概率pi。如果我們將離散型隨機變量x的一切可能取值xi

(i=1,2,…),及其對應(yīng)的概率pi,記作

P(x=xi)=pi

i=1,2,…(3—3)

則稱(3—3)式為離散型隨機變量x的概率分布或分布。第二十九頁,共一百二十六頁,2022年,8月28日

常用列表法表示離散型隨機變量的概率分布:

xx1x2…xn…pp1p2…pn…

顯然離散型隨機變量的概率分布具有pi≥0和Σpi=1這兩個基本性質(zhì)。第三十頁,共一百二十六頁,2022年,8月28日三、連續(xù)型隨機變量的概率分布

連續(xù)型隨機變量的概率分布不能用分布列來表示,因為其可能取的值是不可數(shù)的。對于連續(xù)型隨機變量x,要了解的是它在某個區(qū)間[a,b)上取值的概率,即(a≤x<b)=?下面通過頻率分布密度曲線予以說明。第三十一頁,共一百二十六頁,2022年,8月28日

由表2-6作140行水稻產(chǎn)量資料的頻率分布直方圖,見圖3-1,圖中縱座標(biāo)取頻率與組距的比值。可以設(shè)想,如果樣本取得越來越大(n→+∞),組分得越來越細(i→0),某一范圍內(nèi)的頻率將趨近于一個穩(wěn)定值──概率。這時,頻率分布直方圖各個直方上端中點的聯(lián)線──頻率分布折線將逐漸趨向于一條曲線,換句話說,當(dāng)n→+∞、i→0時,頻率分布折線的極限是一條穩(wěn)定的函數(shù)曲線。第三十二頁,共一百二十六頁,2022年,8月28日

對于樣本是取自連續(xù)型隨機變量的情況,這條函數(shù)曲線將是光滑的。這條曲線排除了抽樣和測量的誤差,完全反映了基礎(chǔ)母羊體重的變動規(guī)律。這條曲線叫概率分布密度曲線,相應(yīng)的函數(shù)叫概率分布密度函數(shù)

。第三十三頁,共一百二十六頁,2022年,8月28日

(3—4)式為連續(xù)型隨機變量x在區(qū)間[a,b)上取值概率的表達式。可見,連續(xù)型隨機變量的概率由概率分布密度函數(shù)確定。

若記體重概率分布密度函數(shù)為f(x),則x取值于區(qū)間[a,b)的概率為圖中陰影部分的面積,即

(3-4)第三十四頁,共一百二十六頁,2022年,8月28日

連續(xù)型隨機變量概率分布的性質(zhì):1、f(x)≥0;2、(c為任意實數(shù))3、第三十五頁,共一百二十六頁,2022年,8月28日第三節(jié)二項分布

一、貝努利試驗及其概率公式將某隨機試驗重復(fù)進行n次,若各次試驗結(jié)果互不影響,即每次試驗結(jié)果出現(xiàn)的概率都不依賴于其它各次試驗的結(jié)果,則稱這n次試驗是獨立的。第三十六頁,共一百二十六頁,2022年,8月28日

對于n次獨立的試驗,如果每次試驗結(jié)果出現(xiàn)且只出現(xiàn)對立事件A與之一,在每次試驗中出現(xiàn)A的概率是常數(shù)p(0<p<1),因而出現(xiàn)對立事件的概率是1-p=q,則稱這一串重復(fù)的獨立試驗為n重貝努利試驗,簡稱貝努利試驗。

第三十七頁,共一百二十六頁,2022年,8月28日

在n重貝努利試驗中,事件A恰好發(fā)生k(0≤k≤n)次的概率為

k=0,1,2…,n(3-6)第三十八頁,共一百二十六頁,2022年,8月28日

若把(3-6)式與二項展開式相比較就可以發(fā)現(xiàn),在n重貝努利試驗中,事件A發(fā)生k次的概率恰好等于展開式中的第k+1項,所以也把(3-6)式稱作二項概率公式。第三十九頁,共一百二十六頁,2022年,8月28日二、二項分布的意義及性質(zhì)

二項分布定義:設(shè)隨機變量x所有可能的取值為零和正整數(shù):0,1,2,…,n,且有

(k=0,1,2,…,n)

其中p>0,q>0,p+q=1,則稱隨機變量x服從參數(shù)為n和p的二項分布,記為

x~B(n,p)。第四十頁,共一百二十六頁,2022年,8月28日

二項分布是一種離散型隨機變量的概率分布。容易驗證,二項分布具有概率分布的一切性質(zhì),即:

1、P(x=k)=Pn(k)(k=0,1,…,n)2、二項分布的概率之和等于1,即第四十一頁,共一百二十六頁,2022年,8月28日3、

4、

5、

(m1<m2)

第四十二頁,共一百二十六頁,2022年,8月28日

二項分布由n和p兩個參數(shù)決定。參數(shù)n只能取正整數(shù),參數(shù)p能取0與1之間的任何數(shù)值(q由p確定,故不是另一個獨立參數(shù))。

1、當(dāng)p值較小且n不大時,分布是偏倚的。但隨著n的增大,分布逐漸趨于對稱,如圖3—2所示;

第四十三頁,共一百二十六頁,2022年,8月28日

2、當(dāng)p值趨于0.5時,分布趨于對稱,如圖3—3所示;

3、對于固定的n及p,當(dāng)k增加時,Pn(k)先隨之增加并達到其極大值,以后又下降。

第四十四頁,共一百二十六頁,2022年,8月28日三、二項分布的概率計算及應(yīng)用條件

【例3·5】有一批玉米種子,出苗率為0.67,現(xiàn)任取6粒種子種1穴中,問這穴至少有1粒種子出苗的概率是多少?

根據(jù)題意,n=6,p=0.67,q=(1-0.67)=0.33。設(shè)6粒種子出苗為x粒,則x為服從二項分布B(6,0.67)的隨機變量。于是6粒種子種1穴中,這穴至少有1粒種子出苗的概率為:第四十五頁,共一百二十六頁,2022年,8月28日

P(“至少1粒種子出苗”)

=P(x=1)+P(x=2)+…+P(x=6)==0.0157+0.0799+0.2162

+0.3292+0.2672+0.0905=0.9987第四十六頁,共一百二十六頁,2022年,8月28日

【例3·6】大豆紫花與白花這一相對性狀在F2的分離比例符合一對等位基因的遺傳規(guī)律,即F2的紫花植株與白花植株之比為3:1。求F210株有7株是紫花的概率。根據(jù)題意,n=10,p=3/4=0.75,q=1/4=0.25。設(shè)F210株中紫花植株為x株,則x為服從二項分布B(10,0.75)的隨機變量。于是F210株有7株是紫花的概率為:

第四十七頁,共一百二十六頁,2022年,8月28日

第四十八頁,共一百二十六頁,2022年,8月28日

二項分布的應(yīng)用條件:(1)各觀察單位只具有互相對立的一種結(jié)果,如陽性或陰性,生存或死亡等,屬于二項分類資料;(2)已知發(fā)生某一結(jié)果(如出苗)的概率為p,其對立結(jié)果的概率則為1-p=q,實際中要求p

是從大量觀察中獲得的比較穩(wěn)定的數(shù)值;(3)n個觀察單位的觀察結(jié)果互相獨立,即每個觀察單位的觀察結(jié)果不會影響到其它觀察單位的觀察結(jié)果。第四十九頁,共一百二十六頁,2022年,8月28日四、二項分布的平均數(shù)與標(biāo)準(zhǔn)差

統(tǒng)計學(xué)證明,服從二項分布B(n,p)的隨機變量之平均數(shù)μ、標(biāo)準(zhǔn)差σ與參數(shù)n、p有如下關(guān)系:當(dāng)試驗結(jié)果以事件A發(fā)生次數(shù)k表示時第五十頁,共一百二十六頁,2022年,8月28日

也稱為總體百分數(shù)標(biāo)準(zhǔn)誤,當(dāng)p未知時,常以樣本百分數(shù)來估計。此時(3-13)式改寫為:

當(dāng)試驗結(jié)果以事件A發(fā)生的頻率k/n表示時

(3-13)

稱為樣本百分數(shù)標(biāo)準(zhǔn)誤。第五十一頁,共一百二十六頁,2022年,8月28日

【例3·7】某樹種幼苗成材率為70%,現(xiàn)種植2000株,問成材幼苗株數(shù)的平均數(shù)、標(biāo)準(zhǔn)差是多少?

根據(jù)題意,n=2000,p=0.70,q=0.30。設(shè)2000株幼苗成材為x株,則x為服從二項分布B(2000,0.70)的隨機變量。第五十二頁,共一百二十六頁,2022年,8月28日成材幼苗株數(shù)的平均數(shù)

成材幼苗株數(shù)的標(biāo)準(zhǔn)差

=2000×0.7=1400(株)第五十三頁,共一百二十六頁,2022年,8月28日第四節(jié)正態(tài)分布

正態(tài)分布是一種很重要的連續(xù)型隨機變量的概率分布。生物現(xiàn)象中有許多變量是服從或近似服從正態(tài)分布的。許多統(tǒng)計分析方法都是以正態(tài)分布為基礎(chǔ)的。此外,還有不少隨機變量的概率分布在一定條件下以正態(tài)分布為其極限分布。因此在統(tǒng)計學(xué)中,正態(tài)分布無論在理論研究上還是實際應(yīng)用中,均占有重要的地位。第五十四頁,共一百二十六頁,2022年,8月28日一、正態(tài)分布的定義及其特征

(一)正態(tài)分布的定義若連續(xù)型隨機變量x的概率分布密度函數(shù)為

其中μ為平均數(shù),σ2為方差,則稱隨機變量x服從正態(tài)分布,記為x~N(μ,σ2)。第五十五頁,共一百二十六頁,2022年,8月28日相應(yīng)的概率分布函數(shù)為分布密度曲線如圖3—4所示。第五十六頁,共一百二十六頁,2022年,8月28日

2、f(x)在x=μ處達到極大,極大值;(二)正態(tài)分布的特征

3、f(x)是非負函數(shù),以x軸為漸近線,分布從-∞至+∞;

1、正態(tài)分布密度曲線是單峰、對稱的“懸鐘”形曲線,對稱軸為x=μ;第五十七頁,共一百二十六頁,2022年,8月28日

4、曲線在x=μ±σ處各有一個拐點,即曲線在(-∞,μ-σ)和(μ+σ,+∞)區(qū)間上是下凸的,在[μ-σ,μ+σ]區(qū)間內(nèi)是上凸的;

5、正態(tài)分布有兩個參數(shù),即平均數(shù)μ和標(biāo)準(zhǔn)差σ。第五十八頁,共一百二十六頁,2022年,8月28日

μ是位置參數(shù),如圖3—5所示。當(dāng)σ恒定時,μ愈大,則曲線沿x軸愈向右移動;反之,μ愈小,曲線沿x軸愈向左移動。

σ是變異度參數(shù),如圖3—6所示。當(dāng)μ恒定時,σ愈大,表示x的取值愈分散,曲線愈“胖”;σ愈小,x的取值愈集中在μ附近,曲線愈“瘦”。第五十九頁,共一百二十六頁,2022年,8月28日6、分布密度曲線與橫軸所夾的面積為1,即:

第六十頁,共一百二十六頁,2022年,8月28日二、標(biāo)準(zhǔn)正態(tài)分布

μ=0,σ2=1的正態(tài)分布為標(biāo)準(zhǔn)正態(tài)分布。標(biāo)準(zhǔn)正態(tài)分布的概率密度函數(shù)及分布函數(shù)分別記作ψ(u)和Φ(u),由(3-15)及(3-16)式得:第六十一頁,共一百二十六頁,2022年,8月28日

隨機變量u服從標(biāo)準(zhǔn)正態(tài)分布,記作u~N(0,1),分布密度曲線如圖3—7所示。第六十二頁,共一百二十六頁,2022年,8月28日

對于任何一個服從正態(tài)分布N(μ,σ2)的隨機變量x,都可以通過標(biāo)準(zhǔn)化變換:

將其變換為服從標(biāo)準(zhǔn)正態(tài)分布的隨機變量u。

u稱為標(biāo)準(zhǔn)正態(tài)變量或標(biāo)準(zhǔn)正態(tài)離差。第六十三頁,共一百二十六頁,2022年,8月28日三、正態(tài)分布的概率計算

(一)標(biāo)準(zhǔn)正態(tài)分布的概率計算

設(shè)u服從標(biāo)準(zhǔn)正態(tài)分布,則u在[u1,u2

)內(nèi)取值的概率為:第六十四頁,共一百二十六頁,2022年,8月28日

由(3-20)式及正態(tài)分布的對稱性可推出下列關(guān)系式:

P(0≤u<u1)=Φ(u1)-0.5

P(u≥u1)=Φ(-u1)

P(|u|≥u1)=2Φ(-u1)

P(|u|<u1==1-2Φ(-u1)

P(u1≤u<u2)=Φ(u2)-Φ(u1)第六十五頁,共一百二十六頁,2022年,8月28日

例如,u=1.75Φ(1.75)=0.95994

有時會遇到給定Φ(u)值,例如Φ(u)=0.284,反過來查u值。這只要在附表1中找到與0.284最接近的值0.2843,對應(yīng)行的第一列數(shù)-0.5,對應(yīng)列的第一行數(shù)值0.07,即相應(yīng)的u值為u=-0.57,即

Φ(-0.57)=0.284

如果要求更精確的u值,可用線性插值法計算。第六十六頁,共一百二十六頁,2022年,8月28日【例3·8】

已知u~N(0,1),試求(1)P

(u≤-1.64);(2)P(u≥2.58);(3)P

(∣u∣≥2.56);(4)P

(0.34≤u≤1.53)。第六十七頁,共一百二十六頁,2022年,8月28日

利用(3-21)式,查附表1得:(1)P

u<-1.64)=Φ(-1.64)=0.0505(2)P

(u≥2.58)=Φ(-2.58)=0.02494(3)P

(∣u∣≥2.56)=2Φ(-2.56)=2×0.005234=0.010468(4)P

(0.34≤u<1.53)

=Φ(1.53)-Φ(0.34)=0.93669-0.6331=0.30389第六十八頁,共一百二十六頁,2022年,8月28日

關(guān)于標(biāo)準(zhǔn)正態(tài)分布,以下幾種概率應(yīng)當(dāng)熟記:

P(-1≤u<1)=0.6826P(-2≤u<2)=0.9545

P(-3≤u<3)=0.9973P(-1.96≤u<1.96)=0.95P(-2.58≤u<2.58)=0.99圖3—8標(biāo)準(zhǔn)正態(tài)分布的三個常用概率。第六十九頁,共一百二十六頁,2022年,8月28日隨機變量u在上述區(qū)間以外取值的概率分別為:

P(|u|≥1)=2Φ(-1)=1-P(-1≤u<1)=1-0.6826=0.3174P(|u|≥2)=2Φ(-2)=1-P(-2≤u<2)

=1-0.9545=0.0455P(|u|≥3)=1-0.9973=0.0027P(|u|≥1.96)=1-0.95=0.05P(|u|≥2.58)=1-0.99=0.01第七十頁,共一百二十六頁,2022年,8月28日(二)一般正態(tài)分布的概率計算

若隨機變量x服從正態(tài)分布N(μ,σ2),則x的取值落在任意區(qū)間[x1,x2)的概率,記作P(x1≤x<x2),等于圖3—9中陰影部分曲邊梯形面積。即:第七十一頁,共一百二十六頁,2022年,8月28日作變換u=(x-μ)/σ,得dx=σdu,故有其中,第七十二頁,共一百二十六頁,2022年,8月28日

表明服從正態(tài)分布N(μ,σ2)的隨機變量x在[x1

,x2

)內(nèi)取值的概率,等于服從標(biāo)準(zhǔn)正態(tài)分布的隨機變量u在[(x1-μ)/σ,(x2-μ)/σ)內(nèi)取值的概率。因此,計算一般正態(tài)分布的概率時,只要將區(qū)間的上下限作適當(dāng)變換(標(biāo)準(zhǔn)化),就可用查標(biāo)準(zhǔn)正態(tài)分布的概率表的方法求得概率。第七十三頁,共一百二十六頁,2022年,8月28日

【例3·9】設(shè)x服從μ=30.26,σ2=5.102的正態(tài)分布,試求P(21.64≤x<32.98)。

,則u服從標(biāo)準(zhǔn)正態(tài)分布N(0,1),=P(-1.69≤u<0.53)=Φ(0.53)-Φ(-1.69)=0.7019-0.04551=0.6564故第七十四頁,共一百二十六頁,2022年,8月28日關(guān)于一般正態(tài)分布

P(μ-σ≤x<μ+σ)=0.6826P(μ-2σ≤x<μ+2σ)=0.9545P(μ-3σ≤x<μ+3σ)=0.9973P(μ-1.96σ≤x<μ+1.96σ)=0.95P(μ-2.58σ≤x<μ+2.58σ)=0.99第七十五頁,共一百二十六頁,2022年,8月28日

生物統(tǒng)計中,不僅注意隨機變量x落在平均數(shù)加減不同倍數(shù)標(biāo)準(zhǔn)差區(qū)間(μ-kσ,μ+kσ)之內(nèi)的概率而且也很關(guān)心x落在此區(qū)間之外的概率。我們把隨機變量x落在平均數(shù)μ加減不同倍數(shù)標(biāo)準(zhǔn)差σ區(qū)間之外的概率稱為兩尾概率記作α。第七十六頁,共一百二十六頁,2022年,8月28日

用兩尾概率可以求得隨機變量x小于μ-kσ或大于μ+kσ的概率,稱為一尾概率,記作α/2。

x落在(μ-1.96σ,μ+1.96σ)之外的兩尾概率為0.05,而一尾概率為0.025。即

P(x<μ-1.96σ)=P(x>μ+1.96σ)=0.025x落在(μ-2.58σ,μ+2.58σ)之外的兩尾概率為0.01,而一尾概率為0.005。即

P(x<μ-2.58σ)=P(x>μ+2.58σ)=0.005第七十七頁,共一百二十六頁,2022年,8月28日

兩尾概率如圖3—10所示,一尾概率如圖3—11所示。第七十八頁,共一百二十六頁,2022年,8月28日【例3·10】已知

x~N(30.26,5.12),求

(1)P(x<15);

(2)P(x≥40);

(3)P(∣

x-30.26∣<5.1);

(4)P(20.06≤x<40.46)。第七十九頁,共一百二十六頁,2022年,8月28日,則u服從標(biāo)準(zhǔn)正態(tài)分布N(0,1),故

(1)P(x<15)

=P(<)

=P(u<-2.9922)

=Φ(-2.9922)=0.001395第八十頁,共一百二十六頁,2022年,8月28日(2)P(x≥40)=P(≥)=P(u≥1.9098)=Φ(-1.9098)=0.0281

第八十一頁,共一百二十六頁,2022年,8月28日第八十二頁,共一百二十六頁,2022年,8月28日第八十三頁,共一百二十六頁,2022年,8月28日

附表2給出了滿足P(|u|>)=α的雙側(cè)分位的數(shù)值。因此,只要已知雙側(cè)概率α的值,由附表2就可直接查出對應(yīng)的雙側(cè)分位數(shù),查法與附表1相同。第八十四頁,共一百二十六頁,2022年,8月28日例如,已知u~N(0,1)試求:(1)的(2)的第八十五頁,共一百二十六頁,2022年,8月28日因為附表2中的α值是:第八十六頁,共一百二十六頁,2022年,8月28日查附表2查附表2第八十七頁,共一百二十六頁,2022年,8月28日

對于x~N(μ,σ2),只要將其轉(zhuǎn)換為u~N(0,1),即可求得相應(yīng)的雙側(cè)分位數(shù)。

第八十八頁,共一百二十六頁,2022年,8月28日

【例3.11】已知x服從正態(tài)分布N(12.86,1.332),若P(x<l1)=0.03,P(x≥l2)=0.03,求l1,l2。第八十九頁,共一百二十六頁,2022年,8月28日由題意可知,α/2=0.03,α=0.06又因為故第九十頁,共一百二十六頁,2022年,8月28日

由附表2查得所以第九十一頁,共一百二十六頁,2022年,8月28日第五節(jié)樣本平均數(shù)的抽樣分布

研究總體與從中抽取的樣本之間的關(guān)系是統(tǒng)計學(xué)的中心內(nèi)容。對這種關(guān)系的研究可從兩方面著手,一是從總體到樣本,這就是研究抽樣分布的問題;二是從樣本到總體,這就是統(tǒng)計推斷問題。第九十二頁,共一百二十六頁,2022年,8月28日

由總體中隨機地抽取若干個體組成樣本,即使每次抽取的樣本含量相等,其統(tǒng)計量(如,S)也將隨樣本的不同而有所不同,因而樣本統(tǒng)計量也是隨機變量,也有其概率分布。我們把統(tǒng)計量的概率分布稱為抽樣分布。第九十三頁,共一百二十六頁,2022年,8月28日一、樣本平均數(shù)抽樣分布

由總體隨機抽樣的方法可分為有返置抽樣和不返置抽樣兩種。前者指每次抽出一個個體后,這個個體應(yīng)返置回原總體;后者指每次抽出的個體不返置回原總體。對于無限總體,返置與否都可保證各個體被抽到的機會相等。對于有限總體,就應(yīng)該采取返置抽樣,否則各個體被抽到的機會就不相等。第九十四頁,共一百二十六頁,2022年,8月28日

設(shè)有一個總體,總體平均數(shù)為μ,方差為σ2,總體中各變數(shù)為x,將此總體稱為原總體?,F(xiàn)從這個總體中隨機抽取含量為n的樣本,樣本平均數(shù)記為??梢栽O(shè)想,從原總體中可抽出很多甚至無窮多個含量為n的樣本。由這些樣本算得的平均數(shù)有大有小,不盡相同,與原總體平均數(shù)μ相比往往表現(xiàn)出不同程度的差異。這種差異是由隨機抽樣造成的,稱為抽樣誤差。第九十五頁,共一百二十六頁,2022年,8月28日

顯然,樣本平均數(shù)也是一個隨機變量,其概率分布叫做樣本平均數(shù)的抽樣分布。由樣本平均數(shù)構(gòu)成的總體稱為樣本平均數(shù)的抽樣總體。其平均數(shù)和標(biāo)準(zhǔn)差分別記為和。第九十六頁,共一百二十六頁,2022年,8月28日

是樣本平均數(shù)抽樣總體的標(biāo)準(zhǔn)差,簡稱標(biāo)準(zhǔn)誤,它表示平均數(shù)抽樣誤差的大小。統(tǒng)計學(xué)上已證明總體的兩個參數(shù)與x

總體的兩個參數(shù)有如下關(guān)系:第九十七頁,共一百二十六頁,2022年,8月28日

設(shè)有一個包含4個個體的有限總體(N=4)

,變數(shù)為2、3、3、4。根據(jù)μ=Σx/N和σ2=Σ(x-μ)2/N求得該總體的μ、σ2、σ為:

μ=3,σ2=1/2,σ==0.707第九十八頁,共一百二十六頁,2022年,8月28日

從有限總體作返置隨機抽樣,所有可能的樣本數(shù)為Nn,其中n為樣本含量。

以上述總體而論,如果從中抽取n=2的樣本,共可得42=16個樣本;如果樣本含量n為4,則一共可抽得44=256個樣本。

分別求這些樣本的平均數(shù),其次數(shù)分布如表3-2

所示。

在n=2的試驗中,樣本平均數(shù)抽樣總體的平均數(shù)、方差與標(biāo)準(zhǔn)差分別為:第九十九頁,共一百二十六頁,2022年,8月28日

=4/16=1/4=(1/2)/2=第一百頁,共一百二十六頁,2022年,8月28日表3—2N=4,n=2和n=4時的次數(shù)分布第一百零一頁,共一百二十六頁,2022年,8月28日

n=4時:這就驗證了=μ,的正確性。

若將表3—2中兩個樣本平均數(shù)的抽樣總體作次數(shù)分布圖,則如圖3-12所示。第一百零二頁,共一百二十六頁,2022年,8月28日

由以上模擬抽樣試驗可以看出,雖然原總體并非正態(tài)分布,但從中隨機抽取樣本,即使樣本含量很小(n=2,n=4),樣本平均數(shù)的分布卻趨向于正態(tài)分布形式。隨著樣本含量n的增大,樣本平均數(shù)的分布愈來愈從不連續(xù)趨向于連續(xù)的正態(tài)分布。比較圖3—12兩個分布,在n由2增到4時,這種趨勢表現(xiàn)得相當(dāng)明顯。當(dāng)n>30時,的分布就近似正態(tài)分布了。

x變量與變量概率分布間的關(guān)系可由下列兩個定理說明:

第一百零三頁,共一百二十六頁,2022年,8月28日

2、若隨機變量x服從平均數(shù)是μ,方差是σ2的分布(不是正態(tài)分布);則統(tǒng)計量的概率分布,當(dāng)n相當(dāng)大時逼近正態(tài)分布N(μ,σ2/n)。這就是中心極限定理。1、若,則第一百零四頁,共一百二十六頁,2022年,8月28日

中心極限定理告訴我們:不論x變量是連續(xù)型還是離散型,也無論x服從何種分布,一般只要n>30,就可認為的分布是正態(tài)的。若x的分布不很偏倚,在n>20時,的分布就近似于正態(tài)分布了。第一百零五頁,共一百二十六頁,2022年,8月28日

的大小與原總體的標(biāo)準(zhǔn)差σ成正比,與樣本含量n的平方根成反比。從某特定總體抽樣,因為σ是一常數(shù),所以只有增大樣本含量才能降低樣本平均數(shù)的抽樣誤差。二、標(biāo)準(zhǔn)誤標(biāo)準(zhǔn)誤(平均數(shù)抽樣總體的標(biāo)準(zhǔn)差)的大小反映樣本平均數(shù)的抽樣誤差的大小,即精確性的高低。第一百零六頁,共一百二十六頁,2022年,8月28日

在實際工作中,總體標(biāo)準(zhǔn)差σ往往是未知的,因而無法求得。此時,可用樣本標(biāo)準(zhǔn)差S估計σ。于是,以估計。記為,稱作樣本標(biāo)準(zhǔn)誤或均數(shù)標(biāo)準(zhǔn)誤。樣本標(biāo)準(zhǔn)誤是平均數(shù)抽樣誤差的估計值。若樣本中各觀測值為,,…,,則第一百零七頁,共一百二十六頁,2022年,8月28日

樣本標(biāo)準(zhǔn)誤是樣本平均數(shù)的標(biāo)準(zhǔn)差,它是抽樣誤差的估計值,其大小說明了樣本間變異程度的大小及精確性的高低。

樣本標(biāo)準(zhǔn)差S是反映樣本中各觀測值,,…,變異程度大小的一個指標(biāo),它的大小說明了對該樣本代表性的強弱。

注意,樣本標(biāo)準(zhǔn)差與樣本標(biāo)準(zhǔn)誤是既有聯(lián)系又有區(qū)別的兩個統(tǒng)計量,(3—24)式已表明了二者的聯(lián)系。二者的區(qū)別在于:第一百零八頁,共一百二十六頁,2022年,8月28日

對于小樣本資料,常將樣本標(biāo)準(zhǔn)誤與樣本平均數(shù)配合使用,記為±,用以表示所考察性狀或指標(biāo)的優(yōu)良性與抽樣誤差的大小。

對于大樣本資料,常將樣本標(biāo)準(zhǔn)差S與樣本平均數(shù)配合使用,記為±S,用以說明所考察性狀或指標(biāo)的優(yōu)良性與穩(wěn)定性。第一百零九頁,共一百二十六頁,2022年,8月28日第六節(jié)

t分布、分布與F分布第一百一十頁,共一百二十六頁,2022年,8月28日

當(dāng)總體標(biāo)準(zhǔn)差σ未知時,以樣本標(biāo)準(zhǔn)差S代替σ所得到的統(tǒng)計量記為t。即一、

t

分布

若x~N(μ,σ2),則。將隨機變量標(biāo)準(zhǔn)化:,則u~N(0,1)。第一百一十一頁,共一百二十六頁,2022年,8月28日

在計算時,由于采用S來代替σ,使得t

變量不再服從標(biāo)準(zhǔn)正態(tài)分布,而是服從自由度df=n-1

的t分布。t的取值范圍是(-∞,+∞);t分布密度曲線如圖3-13所示。第一百一十二頁,共一百二十六頁,2022年,8月28日t分布的特點1、t分布受自由度的制約,每一個自由度都有一條t分布密度曲線。

2、t分布密度曲線以縱軸為對稱軸,左右對稱,且在t=0時,分布密度函數(shù)取得最大值。第一百一十三頁,共一百二十六頁,2022年,8月28日

3、與標(biāo)準(zhǔn)正態(tài)分布曲線相比,t分布曲線頂部略低,兩尾部稍高而平。df越小這種趨勢越明顯。df越大,t分布越趨近于標(biāo)準(zhǔn)正態(tài)分布。當(dāng)n>30時,t分布與標(biāo)準(zhǔn)正態(tài)分布的區(qū)別很??;n>100時,t分布基本與標(biāo)準(zhǔn)正態(tài)分布相同;n→∞時,t

分布與標(biāo)準(zhǔn)正態(tài)分布完全一致。第一百一十四頁,共一百二十六頁,2022年,8月28日

用表示t分布的概率密度函數(shù),則

t分布的概率分布函數(shù)為:

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負責(zé)。
  • 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時也不承擔(dān)用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

最新文檔

評論

0/150

提交評論