第五章隨機變量的數(shù)字特征及極限定理【哈工大版】_第1頁
第五章隨機變量的數(shù)字特征及極限定理【哈工大版】_第2頁
第五章隨機變量的數(shù)字特征及極限定理【哈工大版】_第3頁
第五章隨機變量的數(shù)字特征及極限定理【哈工大版】_第4頁
第五章隨機變量的數(shù)字特征及極限定理【哈工大版】_第5頁
已閱讀5頁,還剩275頁未讀, 繼續(xù)免費閱讀

下載本文檔

版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進行舉報或認領(lǐng)

文檔簡介

第五章隨機變量的數(shù)字特征與極限定理

在前面的課程中,我們討論了隨機變量及其分布,如果知道了隨機變量X的概率分布,那么X的全部概率特征也就知道了.

然而,在實際問題中,概率分布一般是較難確定的.而在一些實際應(yīng)用中,人們并不需要知道隨機變量的一切概率性質(zhì),只要知道它的某些數(shù)字特征就夠了.

因此,在對隨機變量的研究中,確定某些數(shù)字特征是非常重要的.在這些數(shù)字特征中,最常用的是數(shù)學期望和方差4例如,考察某種大批生產(chǎn)的元件的壽命,道壽命在任一指定的界限內(nèi)的元件的百分率有多如果知道了它的概率分布,就可以知少,這對該種元件的壽命狀況提供了一幅完整的圖景.下面我們將看到,根據(jù)這一分布我們可以算出元件的平均壽命值m,且往往是人們最為關(guān)心的一個方面,在應(yīng)用上有極重要的意義.類似的情況很多,比如我們在了解某一個行業(yè)的經(jīng)濟狀況時,我們首先關(guān)心的是其平均收入,這給了我們一個總的印象5另一類重要的數(shù)字特征方差,是衡量一個隨機變量(或其分布)取值的散布程度.例如,兩個行業(yè)工人的平均收入大體相近,但一個行業(yè)中工人收入的分配較平均,即大多數(shù)工人的收入都在平均值上下不遠處,其“散布”?。涣硪粋€行業(yè)則相反,其收入遠離平均值者很多,“散布”較大,這二者的實際意義當然很不同.又如生產(chǎn)同一種產(chǎn)品的兩個工廠,各自的產(chǎn)品平均說來都能達到規(guī)格要求,但一個工廠的波動小,較為穩(wěn)定,另一個工廠則波動大,有時質(zhì)量超標準,有時則低于標準不少,這二者的實際后果當然也不同.6考試的平均成績問題假設(shè)有n名同學參加了某種考試,考試后的成績是:第一個同學得了a1分,第二個同學得了a2分,…,第n個同學得了an分,那么他們這種考試的平均成績7考試的平均成績問題假設(shè)有n名同學參加了某種考試,考試后的成績是:第一個同學得了a1分,第二個同學得了a2分,…,第n個同學得了an分.將他們的成績進行了匯總,發(fā)覺得x1分的人有n1個,得x2分的人有n2個,…,得xk分的人有nk個,其中n1+n2+…+nk=n,那么他們這種考試的平均成績8

例設(shè)某班40名學生的概率統(tǒng)計成績及得分人數(shù)如下表所示:分數(shù)4060708090100

人數(shù)1691572則學生的平均成績是總分÷總?cè)藬?shù)(分)。即105.1.1離散型隨機變量的數(shù)學期望5.1.2連續(xù)型隨機變量的數(shù)學期望5.1.3隨機變量函數(shù)的數(shù)學期望5.1.4數(shù)學期望的性質(zhì)5.1隨機變量的數(shù)學期望

1、概念的引入:

某車間對工人的生產(chǎn)情況進行考察.車工小張每天生產(chǎn)的廢品數(shù)X是一個隨機變量.如何定義X的平均值呢?

某電話交換臺每天8:00-9:00收到的呼叫數(shù)X是一個隨機變量.如何定義X的平均值即該交換臺每天8:00-9:00收到的平均呼叫數(shù)呢?我們來看第一個問題.若統(tǒng)計100天,例1

某車間對工人的生產(chǎn)情況進行考察.車工小張每天生產(chǎn)的廢品數(shù)X是一個隨機變量.如何定義X的平均值呢?32天沒有出廢品;30天每天出一件廢品;17天每天出兩件廢品;21天每天出三件廢品;可以得到這100天中每天的平均廢品數(shù)為這個數(shù)能否作為X的平均值呢?可以想象,若另外統(tǒng)計100天,車工小張不出廢品,出一件、二件、三件廢品的天數(shù)與前面的100天一般不會完全相同,這另外100天每天的平均廢品數(shù)也不一定是1.27.n0天沒有出廢品;n1天每天出一件廢品;n2天每天出兩件廢品;n3天每天出三件廢品.可以得到n天中每天的平均廢品數(shù)為(假定小張每天至多出三件廢品)一般來說,若統(tǒng)計n天,這是以頻率為權(quán)的加權(quán)平均由頻率和概率的關(guān)系

不難想到,在求廢品數(shù)X的平均值時,用概率代替頻率,得平均值為這是以概率為權(quán)的加權(quán)平均這樣得到一個確定的數(shù).我們就用這個數(shù)作為隨機變量X的平均值.這樣做是否合理呢?我們采用計算機模擬.

不妨把小張生產(chǎn)中出廢品的情形用一個球箱模型來描述:22300031112200033111

有一個箱子,里面裝有10個大小,形狀完全相同的球,號碼如圖.

規(guī)定從箱中任意取出一個球,記下球上的號碼,然后把球放回箱中為一次試驗.

記X為所取出的球的號碼(對應(yīng)廢品數(shù)).X為隨機變量,X的概率分布列為

下面我們用計算機進行模擬試驗.2230003111X0123P0.30.30.20.2輸入試驗次數(shù)(即天數(shù))n,計算機對小張的生產(chǎn)情況進行模擬,統(tǒng)計他不出廢品,出一件、二件、三件廢品的天數(shù)n0,n1,n2,n3,并計算與進行比較.下面我們一起來看計算機模擬的結(jié)果.2230003111則對X作一系列觀察(試驗),所得X的試驗值的平均值也是隨機的.由此引入X的數(shù)學期望的定義如下:

對于一個隨機變量,若它可能取的值是X1,X2,…,相應(yīng)的概率為p1,p2,

…,

但是,如果試驗次數(shù)很大,出現(xiàn)Xk的頻率會接近于pk,于是可期望試驗值的平均值接近19定義5.1設(shè)離散型隨機變量X的分布列為P(X=xk)=pk,k=1,2,…

若級數(shù)絕對收斂,即

則稱該級數(shù)為離散型隨機變量X的數(shù)學期望或均值,記為EX或E(X),即20當發(fā)散時,則稱X的數(shù)學期望不存在.定義中的絕對收斂條件是為了保證式不受求和的次序的改變而影響其和的值.21如果把x1,x2,…,xk,…看成是x軸上質(zhì)點的坐標,而把p1,p2,…,pk,…看成是相應(yīng)質(zhì)點的質(zhì)量,質(zhì)量總和為則式

表示質(zhì)點系的重心坐標.

例甲乙兩射手在相同條件下進行射擊,其中命中環(huán)數(shù)為X,Y,其分布列為:X8910Y8910Pk0.30.10.6Pk0.20.40.4試問如何評價甲乙兩射手射擊水平優(yōu)劣。解:甲乙的平均環(huán)數(shù)分別為例

某人的一串鑰匙上有n把鑰匙,其中只有一把能打開自己的家門,他隨意地試用這串鑰匙中的某一把去開門.若每把鑰匙試開一次后除去,求打開門時試開次數(shù)的數(shù)學期望.解:

設(shè)試開次數(shù)為X,P(X=k)=1/n,k=1,2,…,nE(X)于是24常用的離散型隨機變量的數(shù)學期望

例1(0—1分布)設(shè)隨機變量X的分布列為X01P1?pp求EX.解

EX=0×(1?p)+1×p=p.25由前面可知,事件A的示性函數(shù)IA服從0—1分布:

IA01P1?P(A)P(A)故EIA=P(A),即任意事件的概率等于它的示性函數(shù)的數(shù)學期望.26例2(二項分布)設(shè)隨機變量X的分布列為

求EX.2728方法二解:設(shè)第i次試驗事件A發(fā)生第i次試驗事件A不發(fā)生則30例3(泊松分布)設(shè)隨機變量X的分布列為

求EX.解31由此看出,泊松分布的參數(shù)λ就是相應(yīng)隨機變量X的數(shù)學期望.

5.1.2連續(xù)型隨機變量的數(shù)學期望

設(shè)X是連續(xù)型隨機變量,其密度函數(shù)為f(x),在數(shù)軸上取很密的分點x0<x1<x2<…,則X落在小區(qū)間[xi,xi+1)的概率是小區(qū)間[xi,xi+1)陰影面積近似為小區(qū)間[Xi,Xi+1)

由于xi與xi+1很接近,所以區(qū)間[xi,xi+1)中的值可以用xi來近似代替.這正是的漸近和式.陰影面積近似為近似,該離散型隨機變量的數(shù)學期望是因此X與以概率取值xi的離散型隨機變量由此啟發(fā)我們引進如下定義.定義2

設(shè)X是連續(xù)型隨機變量,其密度函數(shù)為f(x),如果有限,定義X的數(shù)學期望為也就是說,連續(xù)型隨機變量的數(shù)學期望是一個絕對收斂的積分.EX物理意義:以f(x)為密度的一維連續(xù)質(zhì)點系的重心坐標。35可以看出,對以f(x)為概率密度的連續(xù)型隨機變量X而言,值x和f(x)dx分別相當于離散型隨機變量情況下的“xk”和“pk”,故由離散型隨機變量的數(shù)學期望的定義可知,連續(xù)型隨機變量的數(shù)學期望可定義如下:36常用的連續(xù)型隨機變量的數(shù)學期望

例4(均勻分布)設(shè)連續(xù)型隨機變量X的概率密度為求EX.37解這個結(jié)果是可以預料的,因為X在[a,b]上服從均勻分布,它取值的平均值當然應(yīng)該是[a,b]的中點.

例5(指數(shù)分布)

設(shè)連續(xù)型隨機變量X的概率密度為其中λ是正常數(shù),求EX.解40例6(正態(tài)分布)設(shè)連續(xù)型隨機變量X~N(μ,σ2),求EX.4243例7(柯西分布)設(shè)連續(xù)型隨機變量X的概率密度為求EX.解由于

故X的數(shù)學期望不存在.

若X~U[a,b],即X服從[a,b]上的均勻分布,則若X服從若X服從參數(shù)為常見隨機變量分布的期望:若X~B(1,P)則

EX=P

若X~E(λ)則若X服從幾何分布,則

這意味著,若從該地區(qū)抽查很多個成年男子,分別測量他們的身高,那么,這些身高的平均值近似是1.68.

已知某地區(qū)成年男子身高X~5.1.3隨機變量函數(shù)的數(shù)學期望

1.問題的提出:

設(shè)已知隨機變量X的分布,我們需要計算的不是X的期望,而是X的某個函數(shù)的期望,比如說g(X)的期望.那么應(yīng)該如何計算呢?如何計算隨機變量函數(shù)的數(shù)學期望?

一種方法是,因為g(X)也是隨機變量,故應(yīng)有概率分布,它的分布可以由已知的X的分布求出來.一旦我們知道了g(X)的分布,就可以按照期望的定義把E[g(X)]計算出來.

使用這種方法必須先求出隨機變量函數(shù)g(X)的分布,一般是比較復雜的.

那么是否可以不先求g(X)的分布而只根據(jù)X的分布求得[g(X)]呢?下面的定理指出,答案是肯定的.495.1.3

隨機變量函數(shù)的數(shù)學期望定理

設(shè)Y=g(X),g(x)是連續(xù)函數(shù).

(ⅰ)若X是離散型隨機變量,分布列為P(X=xk)=pk,k=1,2,…,且

則有50(ⅱ)若X是連續(xù)型的隨機變量,概率密度為fX(x),且

則有

該公式的重要性在于:當我們求E[g(X)]時,不必知道g(X)的分布,而只需知道X的分布就可以了.這給求隨機變量函數(shù)的期望帶來很大方便.例1.設(shè)X的分布列為X0123P求解:例2.設(shè)公共汽車起點站在每小時的10分,30分,50分發(fā)車,一位不知發(fā)車時間的乘客,每小時內(nèi)到達車站的時間是隨機的,求該乘客在車站等車的數(shù)學期望。解:設(shè)每小時內(nèi)乘客到達車站的時間為X,等車時間為Y.X~U[0,60]

則例3:設(shè)隨機變量X的分布律為解:求隨機變量Y=X2的數(shù)學期望XPk-10156例4設(shè)隨機變量X的概率密度為

求E(sinX).

57解

58例5設(shè)在國際市場上每年對我國某種出口商品的需求量是隨機變量X(單位為噸),它在[2000,4000]上服從均勻分布的,又設(shè)每售出這種商品一噸,可為國家掙得外匯3萬元,但假如銷售不出去而囤積于倉庫,則每噸需要浪費保養(yǎng)費1萬元,問需要組織多少貨源,才能使國家的收益最大.用Z表示國家的收益(單位為萬元),則由題設(shè)可得

解設(shè)y為預備出口的該種商品的數(shù)量,由已知條件X在[2000,4000]上服從均勻分布可知,這個數(shù)量y可以只考慮介于2000與4000之間的情況.60下面求EZ,并求使EZ達到最大的y值.

61故當y=3500時,EZ達到最大值8250.因此,組織3500噸這種商品是最佳的決策.62定理5.2設(shè)Z=g(X,Y),g(x,y)是連續(xù)函數(shù)

(ⅰ)若(X,Y)是二維離散型隨機變量分布列為pij=P(X=xi

,Y=yj),i,j=1,2,…且則有

63(ⅱ)若(X,Y)是二維連續(xù)型隨機變量,概率密度為f(x,y),且則有

從式可以得到由(X,Y)的概率密度f(x,y)求X與Y的數(shù)學期望的公式:65例10設(shè)隨機變量X、Y相互獨立,且都服從N(0,σ2)分布,求解由二維隨機變量函數(shù)的數(shù)學期望的公式,有6667686970例1設(shè)(X,Y)在區(qū)域A上服從均勻分布,其中A為x軸、y軸和直線x+y+1=0所圍的區(qū)域,求EX,E(?3X+2Y),E(XY).

xyOx+y+1=0A圖5.171解(X,Y)的概率密度為于是

72731.E(c)=c,c為常數(shù);2。E(cX)=cE(X),c為常數(shù);5.1.4.數(shù)學期望的性質(zhì)證明:設(shè)X~f(x),則3.E(X+Y)=E(X)+E(Y);證明:設(shè)(X,Y)~f(x,y)4.若X與Y獨立,則E(XY)=E(X)E(Y).證明:設(shè)(X,Y)~f(x,y)注意:由E(XY)=E(X)E(Y)不一定能推出X,Y獨立77例1設(shè)X~B(n,p),求EX.解在前面的例2中,我們已經(jīng)直接用數(shù)學期望的定義求得了EX=np.現(xiàn)在利用數(shù)學期望的的性質(zhì)(ⅲ)來作.設(shè)在n重伯努利試驗中,成功的次數(shù)為Y,而在每次試驗成功的概率為p,則Y與X有相同的分布,從而有相同的數(shù)學期望.若設(shè)Xi表示在第i次試驗成功的次數(shù),i=1,2,…,n,則Xi的分布列為

Xi01P1?pp78且

由Xi的分布列得,EXi=p,于是由數(shù)學期望的的性質(zhì)(ⅲ)得到

與例2的作法比較可見,本例的作法要簡單得多.例2

把數(shù)字1,2,…,n任意地排成一列,如果數(shù)字k恰好出現(xiàn)在第k個位置上,則稱為一個巧合,求巧合個數(shù)的數(shù)學期望.由于E(Xk)=P(Xk=1)解:

設(shè)巧合個數(shù)為X,

k=1,2,…,n則故引入80例3設(shè)r個人在樓的底層進入電梯,樓上有n層,每個乘客在樓的任一層下電梯的概率是相同的.如果到樓的某一層無乘客下電梯,電梯就不停,求直到乘客都下完時電梯停的次數(shù)X的數(shù)學期望.解設(shè)Xi表示在第i層電梯停的次數(shù),i=1,2,…,n,則

易見81下面求Xi的分布列(i=1,2,…,n)由于每個人在樓的任一層下電梯的概率均為1/n,故他不在樓的某一層下電梯的概率均為故r個人同時不在第i層下電梯的概率為即82從而于是83因此

在這個例子中,若r=10,n=10,則EX=6.5,即電梯平均停6.5次.在上面的例子中,把一個比較復雜的隨機變量X拆成n個比較簡單的隨機變量Xi的和,然后通過這些比較簡單的隨機變量的數(shù)學期望,根據(jù)數(shù)學期望的性質(zhì)(ⅲ)求得了X的數(shù)學期望,這樣的方法是概率論中常采用的方法.

84例同時擲四顆勻質(zhì)的骰子,求所得點數(shù)之和的數(shù)學期望?解設(shè)X表示四顆骰子的點數(shù)之和,則X是一個離散型的隨機變量,它的取值是4,5,…,24.設(shè)Xi表示第i顆骰子的點數(shù),i=1,2,3,4,,則

85例13設(shè)N個人進行驗血,有兩種方案:(1)對每個人的血液逐個化驗,共需進行N次化驗;(2)將采集的每個人的血液分成兩份,按k個人一組混合后進行化驗(設(shè)N為k的倍數(shù)),若呈陰性反應(yīng),則認為k個人的血都是陰性反應(yīng);如果混合后血液呈陽性反應(yīng),則需要對k個人的另一份血液逐個進行化驗,這時k個人的血總共要化驗k+1次.假設(shè)所有人的血液呈陽性反應(yīng)的概率都是p,且各次的化驗結(jié)果是相互獨立的,試說明適當選取k可使第二個方案減少化驗次數(shù).解設(shè)X表示第二個方案下的總化驗次數(shù)86解設(shè)X表示第二個方案下的總化驗次數(shù),Xi為第i個分組的化驗次數(shù)(i=1,2,…,N/k),則EX表示第二個方案下的總的平均化驗次數(shù),EXi表示第i個分組的平均化驗次數(shù)(i=1,2,…,N/k).下面先求EXi.按照第二個方案的規(guī)定,Xi可能取兩個值:混合血液呈陰性時,Xi=1;血液呈陽性,Xi=k+1.87因為“Xi=1”表示“組內(nèi)k個人的血都是陰性”這個事件,又由于各次的化驗結(jié)果是相互獨立的,所以于是

88因此

這就是第二個方案下的總的平均化驗次數(shù),由此可知,只要選k使即

89就可以使第二個方案減少化驗次數(shù).當q已知時,若選k使取最小值,就可以使化驗次數(shù)最少.例如,當q=0.9時,可以證明,選k=4可以使f(k)最小,這時故當q=0.9,k=4時,第二個方案的化驗次數(shù)比第一個方案平均減少40%.90例6

設(shè)X~N(4,9),Y~U[0,4],Z=2XY?5,求EZ?解EZ=E(2XY?5)=2EXY?5.若X,Y相互獨立,則EZ=E(2XY?5)=2EXY?5=2EXEY?5.由于X~N(4,9),Y~U[0,4],故EZ=E(2XY?5)=2EXY?5=2EXEY?5=11.91引例考試的平均成績問題yOEXEYx

這一講,我們介紹了隨機變量的數(shù)學期望,它反映了隨機變量取值的平均水平,是隨機變量的一個重要的數(shù)字特征.

接下來的一講中,我們將向大家介紹隨機變量另一個重要的數(shù)字特征:方差

上一講我們介紹了隨機變量的數(shù)學期望,它體現(xiàn)了隨機變量取值的平均水平,是隨機變量的一個重要的數(shù)字特征.

但是在一些場合,僅僅知道平均值是不夠的.5.2方差

例如,某零件的真實長度為a,現(xiàn)用甲、乙兩臺儀器各測量10次,將測量結(jié)果X用坐標上的點表示如圖:

若讓你就上述結(jié)果評價一下兩臺儀器的優(yōu)劣,你認為哪臺儀器好一些呢?

甲儀器測量結(jié)果乙儀器測量結(jié)果較好測量結(jié)果的均值都是a因為乙儀器的測量結(jié)果集中在均值附近又如,甲、乙兩門炮同時向一目標射擊10發(fā)炮彈,其落點距目標的位置如圖:你認為哪門炮射擊效果好一些呢?甲炮射擊結(jié)果乙炮射擊結(jié)果乙炮因為乙炮的彈著點較集中在中心附近.

中心中心96研究燈泡的質(zhì)量時,人們不僅要知道燈泡壽命X的平均值EX的大小,而且還要知道這些燈泡的壽命X離開EX的平均偏離程度如何.如果平均偏離較小,那么說明這批燈泡的壽命大部分接近它的均值,這也說明燈泡廠的生產(chǎn)是穩(wěn)定的;這時,如果EX比較大,那么燈泡的質(zhì)量就是比較好的.相反,如果X離開EX的平均偏離較大,那么即使均值較大,生產(chǎn)質(zhì)量也是有問題的.97在打靶比賽中,不但要求射擊準確,而且還要求穩(wěn)定.如果某射手射擊10次,雖然有7次正中靶心,但是另外3次卻打歪了,彈孔離靶心很遠,甚至子彈射到了靶外打傷了人,這也說明此人的射擊技術(shù)是成問題的.98那么,用什么量來衡量這種平均偏離程度呢?人們自然會想到采用|X?EX|的平均值E|X?EX|.但是式E|X?EX|帶有絕對值號,運算不便,故采用(X?EX)2的平均值E(X?EX)2來代替E|X?EX|.顯然,E(X?EX)2的大小完全能夠反映X離開EX的平均偏離大小的,這個值就稱為X的方差.定義如下:99根據(jù)一維隨機變量函數(shù)的數(shù)學期望公式,對于離散型和連續(xù)型隨機變量的方差可以分別得到如下的表達式:

(ⅰ)離散型隨機變量的情況其中P(X=xk)=pk,k=1,2,….

(ⅱ)連續(xù)型隨機變量的情況

其中fX(x)為隨機變量X的概率密度.一、方差的定義采用平方是為了保證一切差值X-E(X)都起正面的作用

由于它與X具有相同的度量單位,在實際問題中經(jīng)常使用.

方差的算術(shù)平方根

稱為標準差設(shè)X是一個隨機變量,若E[X-E(X)]2<∞,則稱D(X)=E[X-E(X)]2

(1)為X的方差.若X的取值比較分散,則方差較大.若方差D(X)=0,則

X

以概率1取常數(shù)值.

方差刻劃了隨機變量的取值對于其數(shù)學期望的離散程度.若X的取值比較集中,則方差較?。籇(X)=E[X-E(X)]2X為離散型,P(X=xk)=pk

由定義知,方差是隨機變量X的函數(shù)g(X)=[X-E(X)]2的數(shù)學期望.X為連續(xù)型,X~f(x)103關(guān)于方差的計算,常利用如下的公式

DX=EX2?(EX)2.證

104例1(0—1分布)設(shè)隨機變量X的分布列為(q=1?p)X01P1?pp求DX.解

EX=0×(1?p)+1×p=pEX2=02×(1?p)+12×p=pDX=p2?p=p(1?p)=pq.105例2(二項分布)設(shè)隨機變量X的分布列為

求DX.解106解

107108109例3(泊松分布)設(shè)隨機變量的分布列為

求DX.解110111112由此看出,泊松分布的參數(shù)λ既是相應(yīng)隨機變量X的數(shù)學期望又是它的方差.

例4設(shè)

X服從幾何分布,概率函數(shù)為P(X=k)=p(1-p)k-1,k=1,2,…,n其中0<p<1,求D(X)解:記q=1-p求和與求導交換次序無窮遞縮等比級數(shù)求和公式

故D(X)=E(X2)-[E(X)]2

+E(X)例5:設(shè)隨機變量X的概率密度為1)求E(X),2)求117例4(均勻分布)設(shè)X~U[a,b],求DX.解

EX=(a+b)/2

,而

118故由此看出,在[a,b]上服從均勻分布的隨機變量的方差與區(qū)間長度的平方成正比.119例5(指數(shù)分布)設(shè)X~E(λ),即連續(xù)型隨機變量X的概率密度為其中λ是正常數(shù),求DX.解EX=1/λ,而120121122例6(正態(tài)分布)設(shè)連續(xù)型隨機變量X~N(μ,σ2),求EX.解EX=μ,DX=σ2.正態(tài)分布N(μ,σ2)中的參數(shù)μ和σ2分別表示相應(yīng)隨機變量X的數(shù)學期望和方差.123若X~B(1,P)則DX=pq若X~P(λ)則DX=λ若X~U[a,b]則若X~N(μ,σ2)則DX=σ2若X~E(λ)則1255.2.2

隨機變量的方差的性質(zhì)(ⅰ)DC=0,C為常數(shù);(ⅱ)D(CX)=C2DX,C為常數(shù);(ⅲ)若X1,X2,…,Xn相互獨立,則D(X1+X2…+Xn)=DX1+DX2+…+DXn;(ⅳ)DX=0的充要條件是X取某一常數(shù)值a的概率為1,即

P(X=a)=1,a=EX.在上面的性質(zhì)中,均假設(shè)方差是存在的.126證

(ⅰ)DC=E(C?EC)2=E(C?C)2.(ⅱ)D(CX)=E(CX)2?[E(CX)]2

=C2EX2?C2(EX)2

=C2[EX2?C2(EX)2]=C2DX127又

(ⅲ)對n=2的情況給出證明,一般的情況,證法相同

128因為X與Y相互獨立,故于是

從而

129應(yīng)用方差的性質(zhì)計算方差,常常能使運算簡化,見下例例6設(shè)

X~B(n,p),求DX.解

設(shè)在n重伯努利試驗中,成功的次數(shù)為Y,而在每次試驗成功的概率為p,則Y與X有相同的分布,從而有相同的方差(0<p<1,q=1?p).設(shè)Xi表示在第i次試驗成功的次數(shù),i=1,2,…,n,則Xi的分布列為

Xi01P1?pp130顯然,Y可以用Xi(i=1,2,…,n)表示為:由Xi的分布列可知,DXi=pq,i=1,2,…,n.由于

X1,X2,…,Xn相互獨立,故由方差的性質(zhì)(ⅲ)得到

與前面的作法比較可見,本例的作法要簡單得多.XXX132例設(shè)隨機變量X1,X2,X3,X4相互獨立,均服從(0,1)上的均勻分布,而求DY?解133這一講,我們介紹了隨機變量的方差.

它是刻劃隨機變量取值在其中心附近離散程度的一個數(shù)字特征.下一講,我們將介紹刻劃兩r.v間線性相關(guān)程度的一個重要的數(shù)字特征:相關(guān)系數(shù)1355.3

協(xié)方差和相關(guān)系數(shù)、矩對二維隨機變量(X,Y)來說,數(shù)字特征EX、EY只反映了X與Y各自的平均值,而DX、DY只反映了X與Y各自離開平均值的偏離程度,它們對X與Y之間的相互聯(lián)系沒有提供任何信息.自然,我們也希望有一個數(shù)字特征能夠在一定程度上反映這種相互聯(lián)系.136又

137在證明方差的性質(zhì)(ⅲ)若X與Y相互獨立,則D(X+Y)=DX+DY,D(X?Y)=DX+DY時,我們曾得到E(X?EX)(Y?EY)=0.這說明當E(X?EX)(Y?EY)≠0時,X與Y肯定不獨立.進一步的研究表明E(X?EX)(Y?EY)的數(shù)值,在一定程度上反映了X與Y之間的相互聯(lián)系,因而引入如下的定義.138定義5.4設(shè)(X,Y)是一個二維隨機變量,如果E(X?EX)(Y?EY)存在,則稱它為X與Y的協(xié)方差,記作Cov(X,Y)Cov(X,Y)=E(X?EX)(Y?EY).139由協(xié)方差的定義5.4及上節(jié)的兩個等式D(X+Y)=E(X?EX)2+E(Y?EY)2+2E(X?EX)(Y?EY)與E(X?EX)(Y?EY)=E(XY)?EXEY可知,對任意的兩個隨機變量X與Y,下面的兩個式子成立D(X±Y)=DX+DY±2Cov(X,Y)Cov(X,Y)=E(XY)?EXEY.協(xié)方差性質(zhì)

(1)COV(X,Y)=COV(Y,X);(2)COV(X,X)=D(X);COV(X,c)=0(3)COV(aX,bY)=abCOV(X,Y),a,b常數(shù);

(4)COV(X+Y,Z)=COV(X,Z)+COV(Y,Z);(5)D(XY)=D(X)+D(Y)2COV(X,Y).141兩個缺點:(1)從性質(zhì)Cov(aX,bY)=abCov(X,Y)可見,它的大小依賴于計量單位;(2)從定義Cov(X,Y)=E(X?EX)(Y?EY)

可見,它的數(shù)值不僅與X、Y本身的取值有關(guān),而且還與各隨機變量關(guān)于它們的偏差有關(guān).如果隨機變量X或Y中的任何一個與其數(shù)學期望的偏差很小,那么無論X與Y之間的聯(lián)系如何密切,它們的協(xié)方差也會很小.142為了克服以上兩個缺點,引入以下的定義.定義5.5設(shè)(X,Y)是一個二維隨機變量,如果X與Y的協(xié)方差Cov(X,Y)存在,且DX>0、DY>0

,則稱為X與Y的相關(guān)系數(shù),記作ρXY,即143下面研究相關(guān)系數(shù)ρXY到底表示X與Y之間的什么聯(lián)系?定理5.3設(shè)ρ是X與Y的相關(guān)系數(shù),則(ⅰ)|ρ|≤1;(ⅱ)|ρ|=1的充分必要條件是P(Y=a+bX)=1,其中a、b為常數(shù).證:

由方差的性質(zhì)和協(xié)方差的定義知,對任意實數(shù)b,有0≤D(Y-bX)=b2D(X)+D(Y)-2b

Cov(X,Y)令,則上式為

D(Y-bX)=

由于方差D(Y)是正的,故必有1-≥0,所以||≤1。2.X和Y獨立時,

=0,但其逆不真.由于當X和Y獨立時,Cov(X,Y)=0.故=0但由并不一定能推出X和Y獨立.請看下例.例1

設(shè)X服從(-1/2,1/2)內(nèi)的均勻分布,而Y=cosX,(請課下自行驗證)因而=0,即X和Y不相關(guān).但Y與X有嚴格的函數(shù)關(guān)系,即X和Y不獨立.不難求得,Cov(X,Y)=0,例2.設(shè)隨機變量X的概率密度為試證

X與不相關(guān),但不獨立.證明:對任意常數(shù)a有:

從而X與不獨立.存在常數(shù)a,b(b≠0),使P{Y=a+bX}=1,(詳細證明自看,見教材.)即X和Y以概率1線性相關(guān).考慮以X的線性函數(shù)a+bX來近似表示Y,以均方誤差e=E{[Y-(a+bX)]2}來衡量以a+bX近似表示Y的好壞程度,e值越小表示a+bX與Y的近似程度越好.

用微積分中求極值的方法,求出使e

達到最小時的a,b.相關(guān)系數(shù)刻劃了X和Y間“線性相關(guān)”的程度.=E(Y2)+b2E(X2)+a2-2bE(XY)+2abE(X)-2aE(Y)e=E{[Y-(a+bX)]2}解得這樣求出的最佳逼近為L(X)=a0+b0X

這樣求出的最佳逼近為L(X)=a0+b0X這一逼近的剩余是若

=0,Y與X無線性關(guān)系;Y與X有嚴格線性關(guān)系;若可見,若0<|

|<1,|

|的值越接近于1,Y與X的線性相關(guān)程度越高;|

|的值越接近于0,Y與X的線性相關(guān)程度越弱.E[(Y-L(X))2]=D(Y)(1-

)下面四個是等價的:但對下述情形,獨立與不相關(guān)等價若(X,Y)服從二維正態(tài)分布,則X與Y獨立X與Y不相關(guān)前面,我們已經(jīng)看到:若X與Y獨立,則X與Y不相關(guān),但由X與Y不相關(guān),不一定能推出X與Y獨立.例2

設(shè)隨機變量X和Y相互獨立且X~N(1,2),Y~N(0,1).試求Z=2X-Y+3的概率密度.

故X和Y的聯(lián)合分布為正態(tài)分布,X和Y的任意線性組合是正態(tài)分布.解:

X~N(1,2),Y~N(0,1),且X與Y獨立,D(Z)=4D(X)+D(Y)=8+1=9E(Z)=2E(X)-E(Y)+3=2+3=5即Z~N(E(Z),D(Z))Z~N(5,32)故Z的概率密度是Z~N(5,32)這一講我們介紹了協(xié)方差和相關(guān)系數(shù)相關(guān)系數(shù)是刻劃兩個變量間線性相關(guān)程度的一個重要的數(shù)字特征.注意獨立與不相關(guān)并不是等價的.當(X,Y)服從二維正態(tài)分布時,有X與Y獨立X與Y不相關(guān)15835.設(shè)X與Y為具有二階矩的隨機變量,且設(shè)求a,b使Q(a,b)達到最小值Qmin,并證明159解160解方程組得此時161162下面研究相關(guān)系數(shù)ρXY到底表示X與Y之間的什么聯(lián)系?定理5.3設(shè)ρ是X與Y的相關(guān)系數(shù),則(ⅰ)|ρ|≤1;(ⅱ)|ρ|=1的充分必要條件是P(Y=a+bX)=1,其中a、b為常數(shù).163證

(ⅰ)為了證明|ρ|≤1,只需證明[2Cov(X,Y)]2≤4DXDY.利用初等代數(shù)中的典型方法,只要說明以DX、2Cov(X,Y)、DY為系數(shù)的二次三項式非負即可.

事實上,對任意的實數(shù)t,有t2DX?2Cov(X,Y)t+DY=D(tX?Y)≥0.可見,上式左端的二次三項式?jīng)]有兩個相異的實數(shù)根,故判別式非正,即

[2Cov(X,Y)]2≤4DXDY[Cov(X,Y)]2≤DXDY從而(ⅰ)得證.

164(ⅱ)|ρ|=1,即式[2Cov(X,Y)]2≤4DXDY

中等號成立的充分必要條件是式t2DX?2Cov(X,Y)t+DY=D(tX?Y)≥0左端的二次三項式有重根t=b,即存在實數(shù)b,使D(bX?Y)=0.由方差的性質(zhì)(ⅳ)知式D(bX?Y)=0成立的充分必要條件是P(Y?bX=a)=1,其中a為常數(shù).從而(ⅱ)得證.

165由定理5.3可知,當|ρ|=1時,Y與X之間存在著線性關(guān)系,這個事件的概率為1.ρ的絕對值越接近于1,Y與X之間越近似的有線性關(guān)系.Y與X之間的相關(guān)系數(shù)ρ是刻畫X與Y之間線性相關(guān)程度的一個數(shù)字特征.定義5.6若X與Y的相關(guān)系數(shù)ρ=0,則稱X與Y不相關(guān).定理5.4

隨機變量X與Y不相關(guān)與下面的每一個結(jié)論都是等價的.(ⅰ)Cov(X,Y)=0;(ⅱ)D(X±Y)=DX+DY;(ⅲ)E(XY)=EXEY.證明

(ⅰ)因為

故ρ=0與Cov(X,Y)=0等價.167(ⅱ)由D(X±Y)=DX+DY±2Cov(X,Y)可知Cov(X,Y)=0與D(X±Y)=DX+DY

是等價的.(ⅲ)由Cov(X,Y)=E(XY)?EXEY可知Cov(X,Y)=0與E(XY)=EXEY

是等價的.168注意,隨機變量X與Y的不相關(guān)和X與Y相互獨立是兩個不相同的概念.X與Y的不相關(guān)是指X與Y之間不存在線性關(guān)系,不是說它們之間不存在其它關(guān)系.即由X與Y的不相關(guān),推不出X與Y相互獨立.但是反過來,若X與Y相互獨立,則X與Y一定不相關(guān),這是因為由Cov(X,Y)=E(XY)?EXEY

可以看出,若X與Y相互獨立,則Cov(X,Y)=0

必然成立.169例1設(shè)連續(xù)型隨機變量X~N(0,1),Y=X2,求X與Y的相關(guān)系數(shù)ρXY.

解因X~N(0,1),故EX=0,于是由Cov(X,Y)=E(XY)?EXEY得Cov(X,Y)=E(XY)=EX3而EX3=0.故Cov(X,Y)=0即ρXY=0.170171172173在例1中,雖然X與Y是不相關(guān)的,但是X與Y并不獨立.事實上,因{X2≤1}∩{X≤?2}=Φ且0<P(X2≤1)<10<P(X≤?2)<1故

P(X≤?2,Y≤1)≠P(X≤?2)P(Y≤1)可見,X與Y不相互獨立.

1.K階原點矩

ak=E(Xk),k=1,2,…

而E(|X|k)稱為X的K階絕對原點矩;2.K階中心矩

uk=E[X-E(X)]k,k=1,2,…

而E|X-E(X)|k稱為X的K階絕對中心矩;本節(jié)的最后介紹一下矩的概念,它將在數(shù)理統(tǒng)計的矩估計法中得到應(yīng)用.將g(X)特殊化,可得到各種數(shù)字特征:其中

k是正整數(shù).176由矩的定義可知,數(shù)學期望為一階原點矩,方差是二階中心矩.一階中心矩恒為0.矩的計算可以利用隨機變量函數(shù)的數(shù)學期望公式進行.

例設(shè)(X,Y)服從區(qū)域D:0<x<1,0<y<x上的均勻分布,求X與Y的相關(guān)系數(shù)D1x=y解例1設(shè)二維隨機變量(X,Y)的概率密度為試驗證X和Y不相關(guān),但X和Y不是相互獨立的。證如圖單位圓上同理E(Y)=0所以COV(X,Y)=E(XY)-E(X)E(Y)=0即六種常用隨機變量的期望與方差小結(jié)185第五章

隨機變量的數(shù)字特征與極限定理

5.4

大數(shù)定律在前面概率的統(tǒng)計定義中曾經(jīng)講過,一個事件A發(fā)生的頻率具有穩(wěn)定性,即當試驗次數(shù)n增大時,頻率接近于某個常數(shù)(A的概率).在5.1節(jié)隨機變量的數(shù)學期望中又講過,隨機變量X在n次試驗中所取的n個值的平均值也具有穩(wěn)定性,且被穩(wěn)定的那個值就是X的數(shù)學期望.186這里所謂的“穩(wěn)定性”,或當n很大時“接近一個常數(shù)”等等,都是不確切的說法,只是一種直觀的描述而已.初學者常常把它理解為微積分中的變量與極限的關(guān)系,這是錯誤的.因為事件的頻率以及隨機變量取的n個值的平均值是隨著試驗的結(jié)果而變的,是隨機變量,不是微積分中所描述的變量.那么究竟如何用確切的數(shù)學語言來描述頻率與概率、平均值與數(shù)學期望之間的關(guān)系呢?大數(shù)定律回答了這個問題.為了講述大數(shù)定律,下面先講一個重要的不等式,它在實際上和理論上都有重要的應(yīng)用.187切比雪夫(Tchebysheff)不等式定理

對任意隨機變量X,若它的方差DX存在,則對任意的ε>0有成立.188證設(shè)X是一個連續(xù)型隨機變量,概率密度為f(x),則189當X是離散型隨機變量時,只需在上述的證明中把概率密度換成分布列,把積分好換成求和號即可.由于

等價.190式

和式

都稱為切比雪夫不等式.切比雪夫不等式給出了在隨機變量X的分布未知的情況下,利用EX、DX對X的概率分布進行估計的一種方法.191例如,由式

可以斷言,不管X的分布是什么,對于任意的正整數(shù)k都有

當k=3時,有192比較上面的兩個式子可知,切比雪夫不等式給出的估計比較粗糙;但要注意,切比雪夫不等式只利用了數(shù)學期望和方差.

193例1設(shè)EX=2,DX=0.4,試用切比雪夫不等式估計P(1<X<3)?解194例2設(shè)隨機變量X、Y的數(shù)學期望都是2,方差分別為1和4,而相關(guān)系數(shù)為0.5,則根據(jù)切比雪夫不等式估計解195196大數(shù)定律定理(伯努利大數(shù)定律)

設(shè)在n重伯努利試驗中,成功的次數(shù)為Yn,而在每次試驗中成功的概率為p(0<p<1),則對任意的ε>0有證由于Yn~B(n,p)

故EYn=np,DYn=npq(q=1?p)由此得

197代入切比雪夫不等式

198故利用式

顯然可得式

的等價形式

199在式中,Yn/n是在n重伯努利試驗中成功的頻率,而p是成功的概率.因此伯努利大數(shù)定律告訴我們:當試驗次數(shù)n足夠大時,成功的頻率與成功的概率之差的絕對值不小于任一指定的正數(shù)ε的概率可以小于任何預先指定的正數(shù),這就是頻率穩(wěn)定性的一種較確切的解釋.

利用式

可以得到相應(yīng)的等價解釋.200根據(jù)伯努利大數(shù)定律,在實際應(yīng)用中,當試驗次數(shù)n很大時,可以用事件的頻率來近似代替事件的概率.定義5.8

稱隨機變量序列X1,X2,…,Xn,…(或簡記為{Xn})是相互獨立的,如果對任意的n≥2,X1,X2,…,Xn是相互獨立的.此時,若所有Xi又有相同的分布函數(shù),則稱X1,X2,…,Xn,…是獨立同分布的隨機變量序列.201定理5.7(切比雪夫大數(shù)定律)設(shè)X1,X2,…,Xn,…是相互獨立的隨機變量序列,若有常數(shù)C,使DXi≤C,i=1,2,…,則對任意的ε>0有或

202證因為

由切比雪夫不等式

203令n∞,則得若利用式

則可以推得式

204在概率論中我們稱滿足式或式

的隨機變量序列X1,X2,…,Xn,…服從大數(shù)定律.205推論設(shè)X1,X2,…,Xn,…是獨立同分布的隨機變量序列,具有有限的數(shù)學期望和方差,EXi=μ,DXi=σ2,i=1,2,…,則對任意的ε>0有或

這是因為故由切比雪夫大數(shù)定律立即可得上面的兩個式子.206容易驗證伯努利大數(shù)定律的結(jié)論可以由此推論得出.在上述的推論中,假設(shè)所討論的隨機變量的方差是存在的,但實際上,方差存在這個條件并不是必要的,現(xiàn)不加證明地介紹下面的定理.定理5.8(辛欽Khintchine大數(shù)定律)設(shè)X1,X2,…,Xn,…是獨立同分布的隨機變量序列,具有有限的數(shù)學期望,EXi=μ,i=1,2,…,則對任意的ε>0有或

207在式

中可以被看作隨機變量X在n次重復獨立試驗中n個觀察值的算術(shù)平均值,而μ=EX.因此,辛欽大數(shù)定律告訴我們:當試驗次數(shù)n足夠大時,

208因此,辛欽大數(shù)定律告訴我們:當試驗次數(shù)n足夠大時,平均值與數(shù)學期望μ之差的絕對值不小于任一指定的正數(shù)ε的概率可以小于任何預先指定的正數(shù),這就是算術(shù)平均值穩(wěn)定性的一種較確切的解釋.所以,在測量中常用多次重復測得的值的算術(shù)平均值來作為被測量的近似值.209一般地,設(shè)Z1,Z2,…,Zn,…是一個隨機變量序列,a是一個常數(shù),若對任意的ε>0有則稱隨機變量序列Z1,Z2,…,Zn,…依概率收斂于a.記為210按照依概率收斂的定義,伯努利大數(shù)定律表明了頻率Yn/n依概率收斂于p,即

式所表示的關(guān)系為

211式所表示的關(guān)系為

212第五章

隨機變量的數(shù)字特征與極限定理

5.5

中心極限定理大數(shù)定律中,我們討論了獨立隨機變量的平均值序列的依概率收斂問題,現(xiàn)在我們來討論獨立隨機變量和

213在隨機變量的各種分布中,正態(tài)分布占有特殊重要的地位.早在19世紀,德國數(shù)學家高斯(Gauss)在研究測量誤差時,就引進了正態(tài)分布.其后,人們又發(fā)現(xiàn)在實際問題中,許多隨機變量都近似服從正態(tài)分布.為什么正態(tài)分布如此廣泛地存在,從而在概率論中占有如此重要的地位?數(shù)學家從關(guān)于獨立隨機變量和的極限分布的研究中找到了答案.21420世紀前半期,概率論研究的中心課題之一,就是尋求獨立隨機變量和的極限分布是正態(tài)分布的條件.因此,把這一方面的定理統(tǒng)稱為中心極限定理.較一般的中心極限定理表明:如果被研究的隨機變量是大量的獨立隨機變量的和,其中每一個別隨機變量對于總和只起微小作用,則可以認為這個隨機變量近似服從正態(tài)分布.這就揭示了正態(tài)分布的重要性.因為現(xiàn)實中許多隨機變量都具有上述的性質(zhì),例如測量誤差、射擊彈著點的橫坐標或縱坐標、人的身高或體重等都是由大量的隨機因素綜合影響的結(jié)果,因而是近似服從正態(tài)分布的.215以下敘述一個常用的中心極限定理定理(獨立同分布的中心極限定理)

如果隨機變量序列X1,X2,…,Xn,…獨立同分布,并且具有有限的數(shù)學期望和方差,EXi=μ,DXi=σ2>0,i=1,2,…,則對一切x,有證明需要用到隨機變量的特征函數(shù),略.216從式可以看出,不管Xi(i=1,2,…)服從什么分布,只要n充分大,隨機變量

就近似地服從N(0,1),而217隨機變量近似地服從N(nμ,nσ2).此時,我們稱漸近地服從N(0,1).定理5.9又被稱為列維—林德伯格(Levy—Lindeberg)中心極限定理.

218例1

計算機在進行加法時,對每個被加數(shù)取整(取為最接近于它的整數(shù)),設(shè)所有的取整誤差是相互獨立的,且它們均在(?0.5,0.5)上服從均勻分布.若將1500個數(shù)相加,問誤差總和的絕對值不超過15的概率是多少?解

設(shè)Xi表示第i個被加數(shù)的取整誤差,i=1,2,…,1500,則Xi~U(?0.5,0.5)且X1,X2,…,X1500相互獨立,故μ=

EXi=0

σ2

=

DXi=1/12.219令Z=X1+X2…+X1500,由列維—林德伯格中心極限定理得

220于是,所求的概率為221222定理[德莫弗—拉普拉斯(DeMoivre?Laplace)定理]設(shè)在n重伯努利試驗中,成功的次數(shù)為Yn,而在每次試驗中成功的概率為p(0<p<1),q=1?p,則對一切x,有223證明

設(shè)Xi表示在第i次試驗成功的次數(shù),i=1,2,…,n,則Xi的分布列為Xi01Pqp且由于X1,X2,…,Xn是獨立同分布的隨機變量序列分布列,且EXi=p,DXi=pq(i=1,2,…,n)有限,故滿足定理5.9(獨立同分布的中心極限定理)的條件,224于是由式得225定理5.10表明二項分布以正態(tài)分布為極限分布

推論對定理5.10中的n重伯努利試驗,n充分大時,有證從

由定理5.10(德莫弗—拉普拉斯定理)即得結(jié)論.226由推論可知,當n很大時,二項分布的概率計算問題,可以轉(zhuǎn)化為正態(tài)分布來計算,這將使計算量大大減小.例如,當n很大時,若要計算工作量是驚人的.但是,用式

只要查一下正態(tài)分布函數(shù)表就可以輕松地求出它的相當精確的近似值.227例2重復投擲硬幣100次,設(shè)每次出現(xiàn)正面的概率均為0.5,問“出現(xiàn)正面次數(shù)大于50,小于61”的概率是多少?解設(shè)出現(xiàn)正面的次數(shù)為Yn,現(xiàn)在由式

228229應(yīng)該指出:定理5.10及其推論中的Yn是僅取非負整數(shù)值0,1,2,…,n的隨機變量,注意到正態(tài)分布是連續(xù)型的分布,所以在求概率P(Yn≤m)(m為正整數(shù))時,為了得到較好的近似值,可以用下面的近似公式230例3

以X表示將一枚勻稱的硬幣重復投擲40次中出現(xiàn)正面次數(shù),試用正態(tài)分布求P(X=20)的近似值,再與精確值比較.解這里n=40,p=1/2,q=1/2,故231而精確解為當然,求例3這樣的概率還有德莫弗—拉普拉斯局部極限定理可用,這里就不予以論述了.232由前面的討論可見,對二項分布,當n充分大,以致npq較大時,正態(tài)近似是相當好的近似.進一步的分析表明,當接近于0或1時,用正態(tài)近似效果不好,這時就要用到泊松近似了.由定理2.10(二項概率的泊松逼近定理),當p(或q)很小,而np(或nq)大小適中時,泊松近似是較好的.在實際中,一般當0.1<p<0.9且npq>9時,用正態(tài)近似;當p≤0.1(或p≥0.9)且n≥10時,用泊松近似.233例1

一生產(chǎn)線生產(chǎn)的產(chǎn)品成箱包裝,每箱的重量是隨機的.假設(shè)每箱的平均重量為50千克,標準差為5千克.若用最大載重量為5噸的汽車承運,試利用中心極限定理說明,每輛車最多可以裝多少箱,才能保證不超載的概率大于0.977.(Φ(2)=0.977,其中Φ(x)是標準正態(tài)分布函數(shù).)解

設(shè)Xi(i=1,2,…,n)是裝運的第i箱的重量(單位:千克),n是所求的箱數(shù).由條件可以把X1,X2,…,Xn視為獨立同分布的隨機變量,而n箱的總重量Tn=X1+X2…+Xn是獨立同分布隨機變量之和.234由條件知根據(jù)列維—林德伯格(獨立同分布的)中心極限定理,Tn近似服從正態(tài)分布N(50n,25n).箱數(shù)n決定于條件235由此可見236從而n<98.02,即每輛車最多可以裝98箱,才能保證不超載的概率大于0.977.23748.某保險公司多年的資料表明,在索賠戶中,被盜索賠戶占20%,以表示在隨機抽查100個索賠戶中因被盜而向保險公司索賠的戶數(shù),求解

23848.某保險公司多年的資料表明,在索賠戶中,被盜索賠戶占20%,以表示在隨機抽查100個索賠戶中因被盜而向保險公司索賠的戶數(shù),求解

概率論與數(shù)理統(tǒng)計是研究隨機現(xiàn)象統(tǒng)計規(guī)律性的學科.隨機現(xiàn)象的規(guī)律性只有在相同的條件下進行大量重復試驗時才會呈現(xiàn)出來.也就是說,要從隨機現(xiàn)象中去尋求必然的法則,應(yīng)該研究大量隨機現(xiàn)象.第五講大數(shù)定律

研究大量的隨機現(xiàn)象,常常采用極限形式,由此導致對極限定理進行研究.極限定理的內(nèi)容很廣泛,其中最重要的有兩種:

與大數(shù)定律中心極限定理下面我們先介紹大數(shù)定律切比雪夫不等式

設(shè)隨機變量X有期望E(X)和方差D(X),則對于任給>0,有或

由切比雪夫不等式可以看出,若D(X)越小,則事件{|X-E(X)|<}的概率越大,即隨機變量X集中在期望附近的可能性越大.由此可體會方差的概率意義:它刻劃了隨機變量取值的離散程度.當方差已知時,切比雪夫不等式給出了r.v

X與它的期望的偏差不小于的概率的估計式.如取

可見,對任給的分布,只要期望和方差存在,則r.vX取值偏離E(X)超過3的概率小于0.111.例1.

已知正常男性成人血液中,每一毫升白細胞數(shù)平均是7300,均方差是700.利用切比雪夫不等式估計每毫升白細胞數(shù)在5200~9400之間的概率.解:設(shè)每毫升白細胞數(shù)為X依題意,E(X)=7300,D(X)=7002所求為

P(5200X9400)P(5200X9400)=P(5200-7300

X-7300

9400-7300)=P(-2100X-E(X)2100)=P{|X-E(X)|2100}由切比雪夫不等式

P{|X-E(X)|2100}即估計每毫升白細胞數(shù)在5200~9400之間的概率不小于8/9.

例2.

在每次試驗中,事件A發(fā)生的概率為0.75,利用切比雪夫不等式求:n需要多么大時,才能使得在n次獨立重復試驗中,事件A出現(xiàn)的頻率在0.74~0.76之間的概率至少為0.90?解:設(shè)X為n

次試驗中,事件A出現(xiàn)的次數(shù),E(X)=0.75n,的最小的n.則X~B(n,0.75)所求為滿足D(X)=0.75*0.25n=0.1875n=P(-0.01n<X-0.75n<0.01n)=P{|X-E(X)|<0.01n}

P(0.74n<X<0.76n)可改寫為在切比雪夫不等式中取n,則=P{|X-E(X)|<0.01n}解得依題意,取

即n取18750時,可以使得在n次獨立重復試驗中,事件A出現(xiàn)的頻率在0.74~0.76之間的概率至少為0.90.

大量的隨機現(xiàn)象中平均結(jié)果的穩(wěn)定性

大數(shù)定律的客觀背景大量拋擲硬幣正面出現(xiàn)頻率字母使用頻率生產(chǎn)過程中的廢品率……幾個常見的大數(shù)定律定理1(切比雪夫大數(shù)定律)

設(shè)X1,X2,…是相互獨立的隨機變量序列,它們都有有限的方差,并且方差有共同的上界,即D(Xi)≤C,i=1,2,…,切比雪夫則對任意的ε>0,

證明切比雪夫大數(shù)定律主要的數(shù)學工具是切比雪夫不等式.

設(shè)隨機變量X有期望E(X)和方差D(X),則對于任給>0,

切比雪夫大數(shù)定律表明,獨立隨機變量序列{Xn},如果方差有共同的上界,則與其數(shù)學期望

偏差很小的

概率接近于1.隨機的了,取值接近于其數(shù)學期望的概率接近于1.即當n充分大時,差不多不再是切比雪夫大數(shù)定律給出了平均值穩(wěn)定性的科學描述

作為切比雪夫大數(shù)定律的特殊情況,有下面的定理.定理2(獨立同分布下的大數(shù)定律)

設(shè)X1,X2,…是獨立同分布的隨機變量序列,且E(Xi)=,D(Xi)=,i=1,2,…,則對任給

>0,

下面給出的貝努里大數(shù)定律,是定理2的一種特例.貝努里

設(shè)Yn是n重貝努里試驗中事件A發(fā)生的次數(shù),p是事件A發(fā)生的概率,引入i=1,2,…,n則是事件A發(fā)生的頻率

于是有下面的定理:

設(shè)Yn是n重貝努里試驗中事件A發(fā)生的次數(shù),p是事件A發(fā)生的概率,則對任給的ε>0,定理3(貝努里大數(shù)定律)或貝努里

貝努里大數(shù)定律表明,當重復試驗次數(shù)n充分大時,事件A發(fā)生的頻率Yn/n與事件A的概率p有較大偏差的概率很小.

貝努里大數(shù)定律提供了通過試驗來確定事件概率的方法.任給ε>0,蒲豐投針問題中解法的理論依據(jù)就是大數(shù)定律

當投針次數(shù)n很大時,用針與線相交的頻率m/n近似針與線相交的概率p,從而求得π的

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預覽,若沒有圖紙預覽就沒有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負責。
  • 6. 下載文件中如有侵權(quán)或不適當內(nèi)容,請與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

最新文檔

評論

0/150

提交評論