第二章隨機變量的概率分布與數(shù)字特征_第1頁
第二章隨機變量的概率分布與數(shù)字特征_第2頁
第二章隨機變量的概率分布與數(shù)字特征_第3頁
第二章隨機變量的概率分布與數(shù)字特征_第4頁
第二章隨機變量的概率分布與數(shù)字特征_第5頁
已閱讀5頁,還剩29頁未讀 繼續(xù)免費閱讀

下載本文檔

版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進行舉報或認領(lǐng)

文檔簡介

1、第二章 隨機變量的概率分布與數(shù)字特征在第一章中,我們介紹了隨機事件及其概率,可以看到很多事件都可以采取數(shù)值標識。如一個人的身高、體重、血壓、脈搏;抽檢產(chǎn)品時出現(xiàn)的廢品個數(shù);擲骰子出現(xiàn)的點數(shù)等對于那些表現(xiàn)為某種屬性的非數(shù)值標識的隨機事件,實際上也可以給它們以數(shù)值標識。例如,對新生兒的性別,可以0表示女,1表示男;對生化檢驗的結(jié)果,可以0表示為陰性,1表示為陽性;對生產(chǎn)的產(chǎn)品,可以2表示為優(yōu)質(zhì)品,1表示為次品,0表示為廢品等。這樣一來,隨機事件就都可以用數(shù)量來描述,從而,隨機試驗的結(jié)果可用一個變量來表示,隨機試驗的不同結(jié)果(隨機事件)表現(xiàn)為變量取不同的值。因此,本章先引入隨機變量的概念,把對隨機事

2、件及其概率的研究轉(zhuǎn)變成為對隨機變量及其概率分布的研究,本章主要討論兩類常用的隨機變量的概率分布及幾個常用的數(shù)字特征。§2-1離散型隨機變量及其概率分布2-1.1隨機變量例如一位隱性遺傳疾病的攜帶者有三個女兒,則每個女兒都有1/2的可能性從母親那里得到一個致病的X染色體而成為攜帶者(假設(shè)父親正常),以A,B,C分別表示大女兒、二女兒和小女兒是攜帶者。若用X表示她們中的攜帶者人數(shù),那么X=0,1,2,3是變量。但X等于多少要與試驗結(jié)果聯(lián)系在一起。如“X=0”=“X=3”=ABC“X1”=A+B+C等等,X取特定的值或特定范圍里的值是一個隨機事件,隨機事件的出現(xiàn)總是有一定的概率的,因而,變

3、量取特定值或某些值也有確定的概率。如:P(X=0)=P()=P()P()P()=()3=0.125P(X=3)=P(ABC)=P(A)P(B)P(C)= ()3=0.125P(X<)=P(X=0)+P(X=1)+P(X=2)+P(X=3)=P()=1通過該例,我們可對表示隨機試驗結(jié)果的變量下一個定義。定義1若對隨機試驗E的每一個可能的結(jié)果e,··都有惟一的實數(shù)x(e)與之對應(yīng),則稱x(e)是隨機變量,記為X。亦可用Y,Z等表示。隨機變量通過隨機事件與概率聯(lián)系起來,對任何形式的隨機變量都有性質(zhì)1隨機變量取任何值的概率均為非負。性質(zhì)2隨機變量取所有可能取的值的概率為1。按

4、隨機變量的取值情況通常將其分為兩種基本類型,即離散型隨機變量和非離散型隨機變量,而非離散型隨機變量中最重要的也是實際工作中經(jīng)常遇到的是連續(xù)型隨機變量。本書只簡單介紹離散型及連續(xù)型這兩種隨機變量。(1) 離散型隨機變量其可取值是有限個或可列個。(2) 連續(xù)型隨機變量可以取得某一區(qū)間內(nèi)的任何數(shù)值或在整個數(shù)軸上取值。2-1.2離散型隨機變量的概率分布對一個隨機變量進行研究,首先要判斷它的取值范圍以及可能取哪些值,其次還要知道它取這些值的概率,也就是要知道它的取值規(guī)律。隨機變量X的取值規(guī)律稱為X的概率分布,簡稱分布。通常用隨機變量的概率函數(shù)(或概率密度函數(shù))、分布函數(shù)來描述隨機變量的分布。定義2設(shè)離散

5、型隨機變量X的所有可能取值為xi(i=1,2,n),X取各個值的對應(yīng)概率為pi(i=1,2,,n),則稱P(X=xi)=pi(i=1,2,n)(2-1)為離散型隨機變量X的概率函數(shù)(又稱分布律)。概率函數(shù)也可用列表的方式來表示(表2-1):表2-1Xx1x2xixnP(X=xi)p1P2pipn這張表稱為X的概率分布表(又稱分布列)。概率函數(shù)具有下列基本性質(zhì):(1)Pi0(i=1,2,n)(2)(2-2)從概率函數(shù)中能夠得到所有像“X=xi”這樣事件的概率,但有時,我們更關(guān)心如“Xxi”或“Xxi”這類事件的概率,如病人的身體狀況至多能承受多大劑量的放射治療;從失效率為1%的針劑中任取10支,

6、取到2支以上失效的概率是多少等,就需要計算事件Xxi或Xxi的概率,即P(Xxi)或P(Xxi)。定義3設(shè)X是隨機變量(可以是離散型的,也可以是非離散型的),對任何實數(shù)x,令F(x)=P(Xx)(-<x<+)(2-3)稱F(x)是隨機變量X的分布函數(shù)。對于任意實數(shù)x1<x2,有P(x1<Xx2)=P(Xx2)-P(Xx1)故P(x1<Xx2)=F(x2)-F(x1)因此,若已知X的分布函數(shù)F(x),就能知道X在任何一個區(qū)間上取值的概率。從這個意義上來說,分布函數(shù)完整地描述了隨機變量的變化情況,它具有下列性質(zhì):(1) 0F(x)1(-<x<+);(2)

7、F(x)是x的不減函數(shù);(3) F(-)=F(x)=0,F(+)=F(x)=1;(4) F(x)至多有可列個間斷點,且在間斷點右連續(xù)。對于離散型隨機變量有F(xi)=P(Xxi)=P(X=x1)+P(X=x2)+P(X=xi)(2-4)即F(xi)=p1+p2+pi而pi=P(X=xi)=P(Xxi)-P(Xxi-1)=F(xi)-F(xi-1)(2-5)例1設(shè)某藥檢所從送檢的藥品中先后抽檢3件,如果送檢的10件中有2件失效,試列出檢得次品數(shù)的概率分布表,求出分布函數(shù)。解檢得次品數(shù)為隨機變量,設(shè)為X,則X的可取值為0,1,2,由第一章中古典概率的定義可計算得P(X=0)=0.4667P(X=1

8、)=0.4667P(X=2)=0.0666所以,其概率分布表為(如表2-2)表2-2X012Pi0.46670.46670.0666X的分布函數(shù)為:當x<0時,F(xiàn)(x)=P(Xx)=0;當0x<1時,F(xiàn)(x)=P(Xx)=p1=0.4667;當1x2時,F(xiàn)(x)=P(Xx)=p1+p2=0.9334;當x2時,F(xiàn)(x)=P(Xx)=p1+p2+p3=1于是,X的分布函數(shù)為如果取X的值于橫軸,pi的值于縱軸,便得到X的概率函數(shù)圖,它由幾條函數(shù)線組成,每條線長的值等于該點上的概率;如果仍取X的值于橫軸,而取F(x)的值于縱軸,便得到X的概率分布函數(shù)圖,它的圖形呈遞增臺階形,在分段點右連

9、續(xù)。本例X的概率函數(shù)圖如圖2-1,分布函數(shù)圖如圖2-2。圖2-1圖2-22-1.3二項分布、泊松分布及其他常見的離散型變量的分布一、 伯努利模型為了說明二項分布,先介紹伯努利模型。在醫(yī)藥領(lǐng)域內(nèi),許多試驗只有兩種互斥的結(jié)果,如對病人治療的結(jié)果,有效或無效;生化檢驗的結(jié)果,陰性或陽性;毒性試驗的結(jié)果,存活或死亡;射擊試驗的結(jié)果,擊中與未擊中等。為了找到這些試驗結(jié)果的規(guī)律性,往往需要在相同條件下做n次獨立重復(fù)試驗,我們把這種試驗結(jié)果具有對立性的n重獨立重復(fù)試驗稱為n重伯努利試驗,簡稱伯努利試驗。伯努利試驗的共同特點是:(1) 對立性,每次試驗的結(jié)果只能是對立事件中的一個,要么出現(xiàn)A,要么出現(xiàn)。(2)

10、 獨立重復(fù)性,每次試驗的結(jié)果互不影響,且各次試驗中事件A出現(xiàn)的概率都相等,設(shè)為p,當然事件出現(xiàn)的概率亦相等,設(shè)為q,則q=1-p。例2某藥治某病的治愈率為p,今用此藥試治該病5例,問治愈3例的概率是多少?解設(shè)Ai=第i例治愈,則=第i例未愈(i=1,2,,5),B=治愈3例,在5例治療中各例的治愈率都相等,即P(Ai)=p(i=1,2,,5),且各例間的治療結(jié)果是獨立的,故治療5例就是做5次伯努利試驗。治療5例治愈3例的情況有種:A1A2A3,,于是+由于各例治療是相互獨立的,因此有=又由于種事件是互斥的,因此即治療5例治愈3例的概率為。這類問題的一般情形如下面的定理所述。定理1(伯努利公式)

11、在伯努利試驗中,若事件A在一次試驗中出現(xiàn)的概率為p,則在n次試驗中事件A恰好出現(xiàn)k次的概率為(2-6)如果上例的治愈率為0.7,那么治療5例治愈3例的概率是例3作抽球試驗,每次抽球一個:(1) 袋中裝有白球20個和黑球10個,作有放回抽取5次,求抽到白球3次的概率;(2) 袋中裝有白球2個和黑球1個,作有放回抽取5次,求抽到白球3次的概率;(3) 袋中裝有白球20個和黑球10個,作無放回抽取5次,求抽到白球3次的概率。解(1) 有放回抽球?qū)俨囼?,令A(yù)=抽到白球,有,所以(2) 屬伯努利試驗,。(3) 無放回抽球不屬伯努利試驗,無放回抽球5次,可轉(zhuǎn)換成一次抽5個球,此時抽球的概率,參照1-

12、2.2古典概率例2的算法,有P(抽白球3次)對于伯努利模型應(yīng)當注意的是要區(qū)別P(A)和Pn(k)的含義。前者體現(xiàn)一般性(每次試驗中A 發(fā)生的概率),后者體現(xiàn)特殊性(n次試驗中A恰好發(fā)生k次的概率)。兩者的關(guān)系是P(A)=P1(1)。二、 二項分布定義4若隨機變量X的概率函數(shù)為(k=0,1,n)其中0<p<1,則稱X服從參數(shù)為n,p的二項分布,記為XB(k;n,p)或XB(n,p)由于諸概率函數(shù)值(k=0,1,n),正好是二項式p+(1-p)n展開式中按p的升冪排列的對應(yīng)各項,故名二項分布。顯然二項分布對應(yīng)于n重伯努利試驗,其概率函數(shù)具有離散型隨機變量概率函數(shù)的兩個基本性質(zhì),即(1)

13、(2-7)(2)(2-8)它的分布函數(shù)為(k=0,1,2,n)(2-9)對于二項分布的有關(guān)計算,可直接用概率函數(shù)、分布函數(shù)的公式進行計算,但通常n較大計算較煩,這時可利用書后附表1即二項分布累積概率P(Xk)(n30時)表進行查表計算。例4設(shè)XB(k;20,0.20),求P(X=4),F(xiàn)(4),P(26)的值。解用公式計算用查表法計算較簡便,P(X=4)=P(X4)-P(X5)=0.58855-0.37035=0.2182F(4)=P(X4)=1-P(X5)=1-0.37035=0.62965P(2<X<6)=P(3X5)=P(X3)-P(X6)=0.79392-0.19579=0

14、.59813對于二項分布中概率p較大(p>0.5)時,就不能直接查表計算,但可以轉(zhuǎn)化為其對立事件(p<0.5,且亦服從二項分布)的概率計算。因為二項分布對應(yīng)于n重伯努利試驗,若事件A出現(xiàn)的次數(shù)XB(k;n,p),則其對立事件出現(xiàn)的次數(shù)YB(k;n,1-p)(k=0,1,2,n),兩變量取值間受如下關(guān)系的限制k+k=n,因此通過上述轉(zhuǎn)換式可將對X的有關(guān)概率的計算轉(zhuǎn)化為對Y的有關(guān)概率的計算。例5設(shè)XB(k;10,0.7),求P(X7)。解 設(shè)Y為X所代表的事件的對立事件,則YB(k;10,0.3), k+k=10,所以P(X7)=P(Y3)=1-P(Y4)=1-0.35039=0.64

15、961在二項分布中,X取不同值k(k=0,1,2,n)的概率是不同的,使P(X=k)取最大值的k(記為k0)稱為二項分布的最可能值,即n次獨立重復(fù)試驗中事件A最可能出現(xiàn)次數(shù)。因為顯然,當k<(n+1)p時,有單調(diào)增加,k>(n+1)p時,有單調(diào)下降,因此,當k在(n+1)p附近時,P(X=k)達最大值。若(n+1)p為整數(shù),則,故最可能值k0為(n+1)p和(n+1)p-1;若(n+1)p為非整數(shù)時,則最可能值k0為(n+1)p取整數(shù)。例如:最可能值為4;最可能值為3和2;最可能值為2;最可能值為0。例6據(jù)報道,有10%的人對某藥有腸道反應(yīng)。為考察此藥的質(zhì)量,現(xiàn)隨機選5人服用此藥,

16、試求:(1)其中k個人(k=0,1,2,3,4,5)有反應(yīng)的概率;(2) 不多于2人有反應(yīng)的概率;(3) 有人有反應(yīng)的概率。解隨機選5人服藥,各人間對藥物的反應(yīng)具有獨立性,且每人服藥后有反應(yīng)的概率均可視為0.10,這相當于做5次獨立重復(fù)試驗,即p=0.10,n=5的伯努利試驗。因而反應(yīng)的人數(shù)X服從二項分布B(k;5,0.10)。按二項分布公式計算得概率分布表如下(1) k個人(k=0,1,2,3,4,5)有反應(yīng)的概率如表2-3。表2-3X=k012345P(X=k)0.590490.328050.072900.008100.000450.00001(2) 不多于2人有反應(yīng)的概率為這就是說,服藥

17、的人中不多于2人有反應(yīng)幾乎是肯定的,而多于2人有反應(yīng)幾乎不可能。因此,如果試驗結(jié)果超過2人有反應(yīng),則可認為10%的人有反應(yīng)的報道是值得懷疑的。(3) 有人有反應(yīng)的概率P(X1)=1-P(X=0)=1-0.59049=0.40951例7某批產(chǎn)品有80%的一等品,若進行重復(fù)抽樣試驗,共取出4個樣品,求其中一等品數(shù)X的最可能值k0,并用二項分布公式驗證這一結(jié)果。若4個樣品中沒有或只有1個一等品,試說明此產(chǎn)品的質(zhì)量。解依題意,抽檢4個樣品,相當于做4重伯努利試驗,其中一等品的個數(shù)X應(yīng)服從二項分布B(k;4,0.8),因為(n+1)P=5×0.8=4為整數(shù),所以X的最可能值為4和3,即k取k0

18、=3和k0=4時,概率為最大。若用二項分布公式計算X取各值的概率列表2-4:表2-4X=k01234P(X=k)0.00160.02560.15360.40960.4096由上表可以看出,當X=3和X=4時概率最大,與前面所推測結(jié)果一致。另從上表中可知,4個樣品中沒有或只有一個一等品的概率為P(X1)=0.0016+0.0256=0.0272通常約定,概率不超過0.05的事件算作小概率事件。因為概率小,可以認為這種事件在一次試驗中幾乎不會出現(xiàn),此謂“小概率原理”。如果它一旦出現(xiàn),便被視為反常,從而有理由懷疑以至否定導(dǎo)致它出現(xiàn)的原因。例7中事件發(fā)生的概率為0.0272,屬于少概率事件??梢姵霈F(xiàn)這

19、種情況的可能性很小,如果在一次抽檢中出現(xiàn),說明80%的一等品的說法是可疑的。三、 泊松分布(稀有事件模型)在很多實際問題中,n次獨立重復(fù)試驗中的n往往很大,p往往很小。例如某人獨立射擊,每次射擊的命中率為0.02,射擊400次,若按二項分布來計算擊中次數(shù)X的概率分布是很麻煩的,如果np=又是個較小的常數(shù)時,便可根據(jù)下面的泊松分布公式進行近似計算。定義5如果隨機變量X的概率函數(shù)為(2-10)其中>0,則稱X服從參數(shù)為的泊松分布。記為XP(k;)。對于泊松分布同樣有性質(zhì):(1)(2-11)(2)(2-12)它的分布函數(shù)為(2-13)此外,它還有一個規(guī)律(2-14)當需要計算一連串概率函數(shù)值時

20、,可利用此規(guī)律進行遞推計算。服從泊松分布的隨機變量在實際中是很多的,例如三胞胎出生次數(shù),癌癥發(fā)病人數(shù),放射的粒子個數(shù),特大洪水發(fā)生的年數(shù),抽檢大量產(chǎn)品中出現(xiàn)次品的件數(shù),同類型的設(shè)備在工作中出現(xiàn)故障的臺數(shù)等等。例8已知某廠生產(chǎn)的針劑的廢品率為0.01,400支針劑中,廢品有5支以上的概率是多少? 解由題意知針劑中出現(xiàn)廢品的支數(shù)X應(yīng)服從二項分布,即XB(k;400,0.01),有由于n=400較大,P=0.01較小,且np=400×0.01=4<5。故X可認為近似地服從泊松分布,=np=4,可按泊松分布來計算概率。按公式計算查表計算,按=4,k=5,查附表2得P(X5)=0.371

21、163例9某人在一次試驗中遇到危險的概率是1%,如果他在一年里每天都要獨立重復(fù)做一次這樣的試驗,那么他在一年中至少遇到一次危險的概率是多少?解因為他要獨立重復(fù)做365次試驗,所以n=365,p=0.01,=np=365×0.01=3.65。P365次試驗中至少遇到一次危險=1-P365次試驗都未遇到危險此結(jié)果表明,即使在一次試驗中很難碰到危險,當試驗經(jīng)常重復(fù)時,至少遇到一次危險的概率仍然可以達到很大。四、 其他離散型變量的分布(1) 二點分布定義6設(shè)隨機變量X的概率函數(shù)為P(X=k)=pkq1-k(k=0,1)(2-15)即其中0<p<1,則稱X服從二點分布。例10一批產(chǎn)

22、品共100件,其中有95件正品,5件廢品,從中任取一件,其結(jié)果用隨機變量X來描述,試求X的概率分布。解設(shè)X=0表示“抽到正品”,X=1表示“抽到廢品”,由古典概型可知即X服從二點分布二點分布是特殊的伯努利模型,即為n=1時的二項分布。(2) 幾何分布定義7設(shè)隨機變量X的概率函數(shù)為(k=1,2,) (2-16)其中0<p<1,q=1-p,則稱X服從幾何分布。在伯努利試驗中,若事件A的概率為p,那么首次出現(xiàn)A時所做過的試驗次數(shù)X(包括A出現(xiàn)的那一次)服從幾何分布。pqk-1就是等待A出現(xiàn)共等了k-1次的概率。如袋中裝有白球3個,黑球2個,今有放回地多次抽球,每次抽一個球。有p=P(白)

23、=0.6,那么到第6次才首次抽到白球的概率是P(X=6)=0.6×0.45=0.006144(3) 超幾何分布定義8設(shè)隨機變量X的概率函數(shù)為(k=0,1,2,,l)(2-17)其中nN-M,l=min(M,n),則稱X服從超幾何分布。設(shè)N個產(chǎn)品中有M個正品,現(xiàn)在無放回地抽取n次,每次抽一個,那么所抽n個中的正品個數(shù)X服從超幾何分布。因為它是無放回抽取,各次抽取試驗非獨立,所以不屬于伯努利試驗。而當N時,有,能證明這就是說,如果產(chǎn)品總數(shù)很多,無放回地抽取可以當作有放回抽取來看待,即可按二項分布計算,這時。§2-2連續(xù)型隨機變量及其概率分布由于連續(xù)型隨機變量能夠取某區(qū)間中的所有

24、值,它不能像離散型變量那樣將其可取值與對應(yīng)概率一一列出,因而不能用概率函數(shù)來描述,另外,從實際出發(fā),沒有必要確認連續(xù)型變量X取某一值的概率,如追究人的體溫恰好等于37001度的概率未必有現(xiàn)實意義,人們關(guān)心的是體溫屬于正常值范圍的概率,故也沒必要用概率函數(shù)來描述。在這一節(jié)中我們引入概率密度函數(shù)來描述連續(xù)型隨機變量的概率分布,并介紹一些常見的連續(xù)型變量的概率分布。2-2.1連續(xù)型變量的概率分布定義1對于隨機變量X,如果存在一個非負的可積函數(shù)f(x)(-<x<+),使對任意a,b(a<b),都有P(a<x<b)=(2-18)則稱X為連續(xù)型隨機變量,稱f(x)為X的概率密

25、度函數(shù),有時簡稱為概率密度或密度函數(shù)。概率密度函數(shù)具有以下性質(zhì):(1)f(x)0;(2)。對于連續(xù)型隨機變量X來說,它取任意一指定的實數(shù)值x0的概率為零,即P(X=x0)=0。事實上由定義式有0P(X=x0)P(x0-x<Xx0)=令x0,則上式右端0,故P(X=x0)=0。據(jù)此,對于連續(xù)型隨機變量X有P(x1<X<x2)=P(x1Xx2)=P(x1Xx2)=P(x1Xx2)(x1<x2)即在計算X落在某區(qū)間里的概率時,可以不考慮區(qū)間是開的、閉的或半開半閉的情況。這里要說明一點,P(X=x0)=0并不意味著X=x0為不可能事件,它是可能會發(fā)生的。也就是說零概率事件也是有

26、可能發(fā)生的。如X為被測試某地大學生的身高,若大學生的身高都在1.60m以上,則P(X=1.60)=0,但事件X=1.60是可能發(fā)生的??梢?,不可能事件的概率為零,但概率為零的事件不一定是不可能事件。同理,必然事件的概率為1,但概率為1的事件不一定是必然事件。由定義和上述性質(zhì)可以看出(2-19) 即f(x)表示了隨機變量X在區(qū)間 (x,x+x)上的平均概率,它與物理學中線密度的定義類似,故稱為密度函數(shù)。它是連續(xù)函數(shù)。若不計高階無窮小,則當x很小時,由上式可得P(x<Xx+x)f(x)x從幾何上看,介于概率密度函數(shù)曲線y=f(x)與x軸間平面圖形的面積為1(圖2-3),而X落在區(qū)間(x,x+

27、x)里的概率等于圖2-4中陰影部分的面積。圖2-3圖2-4定義2設(shè)X為連續(xù)型隨機變量,稱(2-20)為隨機變量X的分布函數(shù)。它具有以下性質(zhì):(1) 0F(x)1;(2) F(x)是不減的函數(shù);(3)另由定義有P(x1<X<x2)=(x1<x2)(2-21)P(X>x)=1-P(Xx)=1-F(x)從幾何上看F(x)等于曲線y=f(x)與x軸間平面圖形在點x處左邊部分的面積。分布函數(shù)F(x)與概率密度函數(shù)互為逆運算關(guān)系,即(x)連續(xù)型隨機變量的概率分布就是指概率密度函數(shù)和分布函數(shù)。2-2.2正態(tài)分布及其他常見的連續(xù)型變量的分布一、 正態(tài)分布(1) 正態(tài)分布的定義定義3若隨

28、機變量X的概率密度函數(shù)為(-<x<+)(2-22)其中和>0是常數(shù),則稱隨機變量X服從參數(shù)為和的正態(tài)分布(或高斯分布),記為XN(,)。其分布函數(shù)為(2-23)(2) 正態(tài)分布的圖形與性質(zhì)。正態(tài)分布的概率密度函數(shù)f(x)和分布函數(shù)F(x)的圖形見圖2-5,2-6。圖2-5圖2-6從正態(tài)分布的概率密度曲線可以看出正態(tài)分布的以下性質(zhì):1) 概率密度函數(shù)f(x)>0,曲線y=f(x)以x=為對稱軸,以x軸為水平漸近線,在x=±處有拐點,當x=時取得取大值的單峰鐘形曲線。2),即曲線與x軸間平面圖形的面積恒為1。當固定時,改變的值,y=f(x)的圖形沿x軸平行移動而不

29、改變形狀,故又稱為位置參數(shù)。若固定,改變的值,則y=f(x)的圖形的形狀隨的增大而變得平坦,隨的減小而變得陡峭,故稱為形狀參數(shù)。(3) 標準正態(tài)分布定義4稱參數(shù)=0,的正態(tài)分布為標準正態(tài)分布,記為XN(0,1)。其概率密度函數(shù)記為(2-24)其分布函數(shù)記為(2-25)標準正態(tài)分布具有正態(tài)分布的一切性質(zhì),只是因為=0,y=(x)的圖形關(guān)于x=0對稱,因而具有更特殊的性質(zhì):(-x)=(x)和(-x)=1-(x),如圖2-7所示。標準正態(tài)分布非常重要,它是我們解決一般正態(tài)分布和許多其他統(tǒng)計分布的工具和橋梁。為了使用方便,前人已編制了標準正態(tài)分布概率密度函數(shù)(x)值表(附表3)和標準正態(tài)分布分布函數(shù)(

30、x)值表(附表4),以供查用。(4) 正態(tài)分布的有關(guān)計算1) 對標準正態(tài)分布,(x)和(x)的值可借助于圖2-7附表3、附表4進行查表計算。如查表得(0)=0.3989,(-1.45)=(1.45)=0.1394(-2.42)=0.007760或(-2.42)=1-(2.42)=1-0.992240=0.0077602) 對于一般正態(tài)分布,可先將其標準化。設(shè)XN(,),則即得(2-26)(2-27)通過上兩式可將一般正態(tài)分布轉(zhuǎn)化成標準正態(tài)分布再利用(x)和(x)值表進行計算。例1設(shè)XN(0,1),求:(1) P(X<-4.64);(2) P(X>2.58);(3) P(X<1

31、.96)。解(1) P(X<-4.64)=(-4.64)=0.000001742(2) P(X>2.58)=1-P(X<2.58)=1-(2.58)=1-0.995060=0.00494(3)P(X<1.96)=P(-1.96<X<1.96)=(1.96)-(-1.96)=0.97500-0.02500=0.9500例2設(shè)XN(1.5,4),計算:(1) f(5.5);(2) P(-4<X<2)。解(1)(2) P(-4<X<2)=F(2)-F(-4)=例3設(shè)XN(,),求:(1) P(X-<1.96);(2) P(X-<

32、2.58)。解(1) P(X-<1.96)=P(-1.96<X-<1.96)=P(-1.96<X<+1.96)=F(+1.96)-F(-1.96)=(1.96)-(-1.96)=0.975-0.025=0.95(2) 同理可得P(X-<2.58)=0.99該例說明,若XN,則在試驗中X的取值落在區(qū)間(-1.96,+1.96)的概率為95%,落在區(qū)間(-2.58,+2.58)的概率為99%。用上例中同樣的方法還可求得P(X-<3)=0.9974說明在一次試驗中,X落在區(qū)間(-3,+3)內(nèi)的概率相當大,即X幾乎必然落在上述區(qū)間內(nèi)。或者說,在一般情形下,X在

33、一次試驗中落在區(qū)間(-3,+3)以外的概率可以忽略不計,這就是通常所說的3原理。例4設(shè)XN(,2),求X以95%的概率所落入的區(qū)間(關(guān)于的對稱區(qū)間)。解設(shè)X落入的區(qū)間是(-m,+m),由題意知反查值表得m=1.96故X以95%的概率落入的區(qū)間是用同樣的方法可求出X以99%的概率落入的區(qū)間是醫(yī)學上,常把正態(tài)變量的95%或99%的概率的落入?yún)^(qū)間即(±1.96)或(±2.58)稱為正常值范圍。對于標準正態(tài)分布而言,正常值范圍為(-1.96,1.96)或(-2.58,2.58)。在自然現(xiàn)象和社會現(xiàn)象中,存在許多服從正態(tài)分布的隨機變量。如測定正常人的各項生理指標,一臺機器所生產(chǎn)藥丸的

34、丸重,對一個物理量在相同的條件下進行多次重復(fù)測試的結(jié)果,一種農(nóng)作物的產(chǎn)量等等都服從正態(tài)分布,它們都可以看做由許多微小的、獨立的隨機因素作用的結(jié)果,且每種因素都不起壓倒其他因素的主導(dǎo)作用。凡具有這種特點的隨機變量,都可認為近似地服從正態(tài)分布,故正態(tài)分布又稱為隨機誤差模型。另外,許多其他分布在一定條件下也常用正態(tài)分布作為近似分布,因此正態(tài)分布在概率論與數(shù)理統(tǒng)計中特別重要。二、 其他連續(xù)型變量的分布(1) 均勻分布定義5若隨機變量X的概率密度函數(shù)為(2-28)則稱X在區(qū)間a,b上服從均勻分布。由定義式顯然有f(x)0,f(x)的圖形如圖2-8所示。顯然,X落在區(qū)間(a,b)以外的概率為零??紤]X落在

35、區(qū)間(c,c+l)(ac<c+lb)上的概率這表明X落在區(qū)間(a,b)中任意長度相同的子區(qū)間的概率是相同的,或者說X落在子區(qū)間的概率只與子區(qū)間的長度有關(guān)而與子區(qū)間的位置無關(guān)。在a,b上服從均勻分布的隨機變量X的分布函數(shù)為(2-29)分布函數(shù)F(x)的圖形如圖2-9所示。圖2-8圖2-9(2) 對數(shù)正態(tài)分布定義6若隨機變量X的概率密度函數(shù)為(2-30)其中>0,為常數(shù),則稱X服從對數(shù)正態(tài)分布。因變量X的對數(shù)lgXN(,2)而得名。顯然有f(x)0,且在實際中,當驗證某一隨機變量服從正態(tài)分布失敗時,接著考慮的常常是對數(shù)正態(tài)分布。(3) 韋布爾分布定義7若隨機變量X的概率密度函數(shù)為(2-

36、31)則稱X服從韋布爾分布。其中m>0稱為形狀參數(shù),稱為位置參數(shù),>0稱為尺度參數(shù)。顯然有f(x)0,且=1韋布爾分布的概率密度函數(shù)和分布函數(shù)的圖形分別如圖2-10(a),2-10(b)所示。圖2-10韋布爾分布最有用的特殊情況之一是指數(shù)分布,它的密度函數(shù)為(2-32)它是在式2-31中取參數(shù)的結(jié)果。指數(shù)分布在實際中亦有重要意義,許多元件或設(shè)備的壽命、一些動物的壽命等都服從指數(shù)分布。憑借形狀參數(shù)m的調(diào)節(jié),使得韋布爾分布可以概括許多不同類型的情況。近年來,它在藥學領(lǐng)域中獲得了廣泛的應(yīng)用。(4) 分布定義8若隨機變量X的概率密度函數(shù)為(2-33)其中>-1,>0,則稱X服從

37、分布。記為X()。這里是微積分中所熟知的函數(shù)。順便指出,當=0時,我們再次由分布密度函數(shù)得出了指數(shù)分布的密度函數(shù)。分布在推導(dǎo)統(tǒng)計學中有重要地位的2分布,t分布,F(xiàn)分布中很有用,它是一種非常重要的非正態(tài)分布。§2-3隨機變量的數(shù)字特征前面介紹的概率分布能完整地描述隨機變量的統(tǒng)計規(guī)律,然而在一些實際問題中要確定一個隨機變量的概率分布卻并非容易,且有些實際問題并不需要知道它的完整的分布,而只需知道它的某些特征,對隨機變量的全貌有個概括的了解就可以了。這些特征的數(shù)字表示就稱為隨機變量的數(shù)字特征。這節(jié)中我們將介紹其中最重要也是最常用的兩種數(shù)字特征,均數(shù)和方差。2-3.1均數(shù)(數(shù)學期望)例1設(shè)有

38、一批藥材是由1等、2等、3等這三個等級的藥材組成,今任取一件藥材觀察它的等級X。顯然X是隨機變量,且它所有可能的取值為1,2,3。如果有放回地抽取10件,在取得的10件中有5件1等,3件2等,2件3等,那么所取的10件產(chǎn)品的平均等級是多少?解如果用(1+2+3)/3=2作為平均等級顯然不合理,因為1,2,3三個等級在所取10件藥材中的地位不平等,如1等品的件數(shù)比3等品的件數(shù)的兩倍還多。那么自然會想到按算術(shù)平均的方法去計算:把上式換個寫法這種把每個等級與相應(yīng)的頻率乘積的和,稱為1,2,3等分別以為權(quán)的加權(quán)平均。我們知道,如果再抽取10件,1,2,3等品出現(xiàn)的件數(shù)就不一定是5,3,2了,也就是它的

39、頻率不一定是了,因此平均等級就不一定是1.7(等)了。可見由于抽樣不同,抽樣的平均等級亦不同,它也是一個隨機變量。但是,隨著試驗(抽取藥材)的次數(shù)增大,出現(xiàn)1,2,3等品的頻率就會逐漸穩(wěn)定在各自的概率附近,設(shè)pi表示第i(i=1,2,3)等藥材出現(xiàn)的概率,在求藥材平均等級時,用概率代替頻率,所得平均等級數(shù)1×p1+2×p2+3×p3就是一個確定的數(shù),它表示該批藥材的平均等級。我們稱這種加權(quán)平均值為均數(shù)(數(shù)學期望)。下面分別對離散型隨機變量和連續(xù)型隨機變量的均數(shù)給出定義。定義1設(shè)離散型隨機變量X的概率分布表如表(2-5)表2-5Xx1x2xiP(X=xi)p1p2p

40、i則規(guī)定X的均數(shù)(2-34)這里,當X的可取值為無窮可數(shù)多個時,等式右端是一個無窮級數(shù)。由于平均值應(yīng)該與x1,x2,,xi的排列次序無關(guān),因此要求這級數(shù)絕對收斂。所以,只有當級數(shù)收斂時才說X的均數(shù)存在。均數(shù)是反映隨機變量取值的集中趨勢的一個數(shù)字特征。例2甲乙二射手在同樣條件下進行射擊,它們命中的環(huán)數(shù)X、Y的概率分布表分別如表2-6,表2-7:表2-6X678910P(X=xi)0.100.200.300.300.10表2-7Y678910P(Y=yi)0.150.150.250.250.20試問誰的射擊水平較高?解由定義得甲平均命中環(huán)數(shù)為EX=6×0.10+7×0.20+8

41、×0.30+9×0.30+10×0.10=8.10(環(huán))乙的平均命中環(huán)數(shù)為EY=6×0.15+7×0.15+8×0.25+9×0.25+10×0.20=8.2(環(huán))可見乙的平均射擊水平較高。對于連續(xù)型隨機變量,由于它沒有像離散型變量那樣的分布律,因此不能以級數(shù)去定義它的均數(shù)。但是可設(shè)想把連續(xù)型變量X的取值區(qū)間分成無窮多個小區(qū)間(xk,xk+xk),然后求出它在每個小區(qū)間上取值的概率。設(shè)f(x)為連續(xù)型隨機變量X的分布密度,當xk很小時有Pxk<X<xk+xkf(xk)xk仿定義1得這樣自然會想到利用此式

42、右端的極限(若存在),即去定義X的均數(shù)。定義2設(shè)連續(xù)型隨機變量X的概率密度函數(shù)為f(x),則規(guī)定X的均數(shù)為(2-35)與離散型變量類似,這里只有在右端的廣義積分收斂時,才說EX存在。例3求在區(qū)間a,b上服從均勻分布的隨機變量X的均數(shù)。解依題意有由式(2-35)得X的均數(shù)為下面我們再求常見的二項分布、泊松分布和正態(tài)分布的均數(shù)。例4若XB(k;n,p),求EX。解例5若XP(k;),求EX。解例6若XN(,求EX。解令,有,則均數(shù)有如下一些基本性質(zhì):(1) E(c)=c(c為常數(shù));(2) E(kX)=kEX(k為常數(shù));(3) E(kX+b)=kEX+b(k,b為常數(shù));(4) E(X±

43、;Y)=EX±EY(可推廣到有限個變量的情形);(5) E(XY)=EX·EY(X與Y獨立)。2-3.2方差和標準差均數(shù)反映了隨機變量取值的平均情況,它是隨機變量的一個重要數(shù)字特征。但只看均數(shù)是不夠的,還應(yīng)該知道隨機變量的取值對均數(shù)的偏離程度。例如,設(shè)有甲、乙兩臺制丸機生產(chǎn)同一種藥丸的直徑(單位:mm)的概率分布表分別如下表2-8,表2-9:表2-8X56789P(X=xi)0.050.10.70.10.05表2-9Y45678910P(Y=yi)0.050.10.20.30.20.10.05如果藥丸的標準直徑為7,問哪臺機器的性能更好?容易算出EX=EY=7,可見兩臺機器

44、都是按標準生產(chǎn)的。但是從分布表可見,甲機器生產(chǎn)的丸徑比乙穩(wěn)定,也就是甲機器生產(chǎn)的丸徑與標準丸徑的總離差要小。因此,甲機器的生產(chǎn)性能比乙更好。為了用一個數(shù)字來刻畫隨機變量X取值對其均數(shù)EX的偏離程度,容易想到取(X-EX)的均數(shù)E(X-EX),但這樣常常會造成正、負抵消,從而掩蓋實際偏差的大小,如果用E(X-EX)則可以反映全部偏差的大小,但絕對值運算起來不方便。因此常用E(X-EX)2來刻畫隨機變量X的取值對其均數(shù)EX的偏離程度,或刻畫X取值對其均數(shù)的波動程度。定義3 設(shè)X是一個隨機變量,則稱E(X-EX)2為X的方差,記作DX。即DX=E(X-EX)2(2-36)而DX稱為X的標準差。離散型

45、隨機變量X的方差為(2-37)其中pi=P(X=xi)(i=1,2,)連續(xù)型隨機變量X的方差為(2-38)其中f(x)是X的概率密度函數(shù)為了便于計算方差,可以由DX=E(X-EX)2推導(dǎo)出實用計算公式為DX=EX2-(EX)2(2-39)因為根據(jù)均數(shù)的性質(zhì)有DX=E(X-EX)2=EX2-2XEX+(EX)2=EX2-2(EX)·(EX)+(EX)2=EX2-(EX)2例7設(shè)X的概率分布表如表2-10:表2-10X01Pi1-pp求DX。解EX=0·(1-p)+1·p=p,EX2=p若記1-p=q,則DX=E(X-EX)2=(0-p)2(1-p)+(1-p)2&#

46、183;p=p2(1-p)+(1-p)2p=p(1-p)=pq或DX=E(X2)-(EX)2=p-p2=p(1-p)=pq例8設(shè)X的概率密度為求DX。解由本節(jié)例3已知又于是下面再計算常用的二項分布、泊松分布和正態(tài)分布的方差及標準差。例9若XB(k;n,p),求DX和。解由本節(jié)例4知EX=np,又所以例10若XP(k;),求DX和。解由本節(jié)例5知EX=,又所以例11若XN(,2),求DX和。解由本節(jié)例6知EX=,又令u=,x=u+,dx=du,得從以上例題可以看出,上述三種重要分布完全可由它們的均數(shù)和方差所確定。方差有如下一些基本性質(zhì):(1) D(C)=0(C為常數(shù));(2) D(kX)=k2D

47、X(k為常數(shù));(3) D(X±Y)=DX+DY(X與Y相互獨立)(可推廣到任意有限個相互獨立隨機變量的情況)。2-3.3變異系數(shù)用方差或標準差來描述一個隨機變量取值的離散程度固然滿意,但在比較兩個變量取值的離散程度時,如果兩個變量的均數(shù)相差懸殊或者取值單位不同,這時用方差或標準差就不行了。為此,引入又一數(shù)字特征,稱隨機變量X的標準差與均值之比為X的變異系數(shù),記為CVX。即(2-40)變異系數(shù)是標準差相對于均數(shù)的變化率,它同樣是描述隨機變量的離散程度,因其無量綱,更便于對不同隨機變量之間波動程度的比較。例12據(jù)調(diào)查,某地18歲男子身高均數(shù)為165.08cm,標準差為4.98cm,體重

48、均數(shù)為51.60kg,標準差為5.01kg,試比較該地男子的身高和體重波動程度哪個大。解因為身高和體重單位不同,直接用標準差比較波動程度不合適,應(yīng)該用變異系數(shù)來比較。×100%=3.02%×100%=9.71%可見,體重的相對波動程度大于身高的相對波動程度。§2-4三種重要分布的漸近關(guān)系離散型變量的二項分布、泊松分布和連續(xù)型變量的正態(tài)分布,是三種最基本也是最重要的概率分布,它們之間有著密切的漸近關(guān)系,也即:當n時,二項分布B(k;n,p)以泊松分布P(k;np)為極限分布。當n時,二項分布B(k;n,p)以正態(tài)分布N(np,npq)為極限分布。當n增大時,泊松分布

49、P(k;)以正態(tài)分布N(,)為極限分布。2-4.1二項分布的泊松近似定理1對于二項分布B(k;n,p),若,則(2-41)證明從略。由此可得,當n充分大時,二項分布的概率函數(shù)可用泊松近似表示。例1某車間送檢一批針劑,其中次品的概率是0.01,問抽檢500支針劑,有5支次品的概率是多少?解抽檢500支針劑中,檢出次品的支數(shù)為XB(k;500,0.01),有5支次品的概率為(2-42)由于用二項分布公式直接計算難度很大,又n=500,因此可以近似化為泊松分布來計算,即是(2-43)有5支次品的概率是0.1755。2-4.2二項分布的正態(tài)近似定理2如果X表示在n次獨立試驗中的成功次數(shù),p為每單一試驗

50、成功的概率,則當試驗次數(shù)無限增大時,變量X的分布趨于具有均數(shù)為np,標準差為的正態(tài)分布。這個定理表明,當n為大數(shù)時,某事件成功的概率的近似值,可用正態(tài)分布求得。二項分布的正態(tài)近似的幾何意義如圖2-11。當n大時,二項分布概率函數(shù)的包絡(luò)近似于正態(tài)概率密度曲線f(x)。從數(shù)值上看,二項分布概率函數(shù)值P(X=k)近似于正態(tài)分布概率密度f(k)值。即(2-44)接著討論二項分布累積概率的正態(tài)近似。設(shè)二項分布B(k;n,p)的概率函數(shù)如圖2-12所示,則其累積概率P(k1Xk2)等于從k1到k2共k2-k1+1條概率函數(shù)線之和,注意到小區(qū)間k-0.5,k+0.5的長度為1,因而概率函數(shù)P(X=k),在數(shù)

51、值上正好等于該小區(qū)間上,高為P(X=k)的矩形面積,又因為X每相鄰兩個取值點的間隔為1。因此,二項分布累積概率P(k1Xk2)在數(shù)值上應(yīng)等于區(qū)間k1-0.5,k2+0.5上的k2-k1+1個矩形所組成的階梯形的面積,而這面積可以近似等于該區(qū)間上那條近似正態(tài)曲線所圍成的曲邊梯形的面積。因此,可得二項分布累積概率的正態(tài)近似圖2-11 圖2-12(2-45)若化成標準正態(tài)近似,可得(2-46)其中np,。有了二項分布的兩個近似計算,可以總結(jié)一下二項分布問題中的計算方法的選擇:(1) 當n為一個小的數(shù)時,可直接應(yīng)用二項分布公式計算;(2) 當n是一個大的數(shù),而且p值很小或接近于1,np不很大,則應(yīng)用泊

52、松分布近似計算;(3) 當n是一個大的數(shù),p不是很小或不是接近于1時,可應(yīng)用正態(tài)分布近似計算。例2對于某一癌癥高發(fā)病地區(qū)進行普查結(jié)果,其患癌癥的概率是0.005,現(xiàn)有這地區(qū)一萬人的鄉(xiāng)村,試推測:(1) 這個鄉(xiāng)有70人患癌癥的概率;(2) 有30至50人患癌癥的概率;(3) 有不少于50人患癌癥的概率。解全鄉(xiāng)1萬人中患癌癥人數(shù)X服從二項分布。因為n=104,p=0.005,np=104×0.005=50,可用正態(tài)近似計算。(1)(2)(3)有70人患癌癥的概率為0.001;有30至50人患癌癥的概率為0.4977;全鄉(xiāng)不少于50人患癌癥的概率為0.5557。2-4.3泊松分布的正態(tài)近似

53、上面已討論過,當n大時,二項分布B(k;n,p)近似于泊松分布P(k;np),同時它又近似于正態(tài)分布N(np,npq),由此可推出當n大時,泊松分布也會近似于正態(tài)分布,一般說,當變量X服從泊松分布時,p的值較小,因此q的值可以近似看為1,則從二項分布的參數(shù)推算可得,,所以,對于P(k;)向N(,2)逼近的參數(shù)替換為。 經(jīng)標準化,可得到泊松分布的標準正態(tài)近似。(2-47)(2-48)其中例3某藥廠大批量生產(chǎn)外用藥,平均每個月的廢品數(shù)為35件,試估計該廠:(1) 下個月內(nèi)出現(xiàn)廢品件數(shù)為65件的概率;(2) 下個月內(nèi)出現(xiàn)廢品少于40件的概率。解此廠出現(xiàn)廢品屬于伯努利試驗之稀有事件,可認為其每月出現(xiàn)廢

54、品的件數(shù)X服從參數(shù)=35的泊松分布,泊松分布可用正態(tài)近似:,。(1)(2)該廠下個月內(nèi)出現(xiàn)廢品為65件的概率為0;出現(xiàn)廢品少于40件的概率為0.7517。§2-5大數(shù)定律及中心極限定理所謂極限定理,就是采用極限的方法得出隨機變量分布的一系列定理,也就是說,極限定理是研究隨機變量的極限分布的。一般可以分為兩類,第一類極限定理,是闡述若干個隨機變量的均數(shù)的極限定理,統(tǒng)稱為大數(shù)定律。第二類極限定理是闡述在怎樣的條件下,當n時,獨立隨機變量之和的極限分布為正態(tài)分布,有關(guān)第二類極限定理的命題統(tǒng)稱為中心極限定理。下面我們簡單地不加證明地給出有關(guān)的一些定理。2-5.1切比雪夫不等式我們知道,一個隨

55、機變量離均差平方的數(shù)學期望就是它的方差,而方差又是用來描述隨機變量取值的分散程度。切比雪夫不等式就是研究隨機變量的離差與方差之間關(guān)系的工具。定理1(切比雪夫不等式)設(shè)隨機變量X有均值EZ及方差DZ,則對任給的0,有(2-49)或(2-50)切比雪夫不等式只利用均值及方差就描述了隨機變量的變化情況,如(2-50)斷言不管X的分布是什么,X落在(EZ-,EZ+)中的概率不小于。 因此它在理論研究及實際應(yīng)用中很有價值。例1某地區(qū)調(diào)查10000名某疾病的患者,該病需住院治療的概率是07,估計10000名患者中同時需住院治療的人數(shù)在6800與7200之間的概率。解令Z表示同時住院的患者數(shù),它服從二項分布,P=

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負責。
  • 6. 下載文件中如有侵權(quán)或不適當內(nèi)容,請與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

評論

0/150

提交評論