中科大概率論與數(shù)理統(tǒng)計(jì)講義02隨機(jī)變量及其概率分布_第1頁
中科大概率論與數(shù)理統(tǒng)計(jì)講義02隨機(jī)變量及其概率分布_第2頁
中科大概率論與數(shù)理統(tǒng)計(jì)講義02隨機(jī)變量及其概率分布_第3頁
中科大概率論與數(shù)理統(tǒng)計(jì)講義02隨機(jī)變量及其概率分布_第4頁
中科大概率論與數(shù)理統(tǒng)計(jì)講義02隨機(jī)變量及其概率分布_第5頁
已閱讀5頁,還剩51頁未讀, 繼續(xù)免費(fèi)閱讀

下載本文檔

版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進(jìn)行舉報(bào)或認(rèn)領(lǐng)

文檔簡介

第二章隨機(jī)變量及其分布教學(xué)目的:1)掌握隨機(jī)變量的概念。掌握離散型隨機(jī)變量的概率函數(shù),連續(xù)型隨機(jī)變量的概率密度,及任意的隨機(jī)變量的分布函數(shù)的概念.2)掌握二項(xiàng)分布、Poisson分布,以及相應(yīng)的概率計(jì)算.3)掌握正態(tài)分布,指數(shù)分布和均勻分布,會進(jìn)行相應(yīng)的概率計(jì)算.4)掌握多維隨機(jī)變量的概念。了解n維隨機(jī)變量的聯(lián)合分布函數(shù)的概念和性質(zhì).5)掌握二維離散型和連續(xù)型隨機(jī)變量的邊緣分布與聯(lián)合分布之間的關(guān)系,會用這些關(guān)系式求邊緣分布.?2.1隨機(jī)變量的概念隨機(jī)變量是其值隨機(jī)會而定的變量。例2.1.1.以X表示擲一次骰子得到的點(diǎn)數(shù),X是一個(gè)隨機(jī)變量.它可以取{1,2,3,4,5,6}中的一個(gè)值,但到底取那個(gè)值,要等擲了骰子才知道.例2.1.2.一張獎(jiǎng)券的中獎(jiǎng)金額是一個(gè)隨機(jī)變量.它的值要等開獎(jiǎng)以后才知道.例2.1.3.在一批產(chǎn)品中隨機(jī)地抽出100個(gè)產(chǎn)品,其中所含的廢品數(shù)是一個(gè)隨機(jī)變量.它的值要等檢查了所有抽出的產(chǎn)品后才知道.在另外的例子中,隨機(jī)試驗(yàn)的結(jié)果雖然不是一個(gè)數(shù),但仍可用數(shù)來描述.例2.1.4.擲一枚硬幣出現(xiàn)正面或反面.例2.1.5.產(chǎn)品被分為正品或廢品.上面兩例中的結(jié)果均可用一個(gè)取值0,1的隨機(jī)變量來描述,其中可以1代表正面或正品,以0代表反面或廢品.事實(shí)上,對任意一個(gè)事件A,定義IA(ω)=,ωeA,反之,則事件A由隨機(jī)變量IA表示出來.IA稱為事件A的示性函數(shù).隨機(jī)變量是把隨機(jī)試驗(yàn)的結(jié)果,也就是樣本空間,與一組實(shí)數(shù)聯(lián)系起來.這樣的處理簡化了原來的概率結(jié)構(gòu).例如某機(jī)構(gòu)調(diào)查民眾對一提案的態(tài)度是支持(1)還是反對(0).如果隨機(jī)訪問50人,按照古典概型,所有可能的結(jié)果有250個(gè).但是如果我們用X記1的個(gè)數(shù)來表示贊成者的人數(shù),則X為一個(gè)隨機(jī)變量.它的取值范圍只在{0,1,...,50}.所以隨機(jī)變量的引進(jìn)有利于我們對所研究的問題進(jìn)行準(zhǔn)確,簡練的描述.又由于隨機(jī)變量取實(shí)值,隨機(jī)變量之間的運(yùn)算就變得容易了.對于隨機(jī)變量的研究,是概率論的中心內(nèi)容.因?yàn)閷τ谝粋€(gè)隨機(jī)試驗(yàn),我們關(guān)心的通常是與所研究的問題有關(guān)的某個(gè)量或某些量.而這些量就是隨機(jī)變量.定義2.1.1.令?為一個(gè)樣本空間.令X是定義在?上的一個(gè)實(shí)函數(shù),則稱X為一個(gè)(一維)隨機(jī)變量.常見的隨機(jī)變量可以分為兩大類.只取有限個(gè)或可數(shù)個(gè)值的隨機(jī)變量稱為離散型隨機(jī)變量:取連續(xù)的值且密度存在的隨機(jī)變量稱為連續(xù)型隨機(jī)變量.當(dāng)然,存在既非離散型也非連續(xù)型的隨機(jī)變量.但它們在實(shí)際中并不常見,也不是我們這里研究的對象.?2.2離散型隨機(jī)變量定義2.2.1.設(shè)X為一隨機(jī)變量.如果X只取有限個(gè)或可數(shù)個(gè)值,則稱X為一個(gè)(一維)離散型隨機(jī)變量.由于一個(gè)隨機(jī)變量的值是由試驗(yàn)結(jié)果決定的,因而是以一定的概率取值.這個(gè)概率分布稱為離散型隨機(jī)變量的概率函數(shù).定義2.2.2.設(shè)X為一離散型隨機(jī)變量,其全部可能值為{a1,a2,...}.則pi=P(X=ai),i=1,2,...(2.2.1)稱為X的概率函數(shù).概率函數(shù){pi,i=1,2,..}必須滿足下列條件:pi>0,i=1,2,....{pi=1.i概率函數(shù)(2.2.1)指出了全部概率1是如何在X的所有可能值之間分配的.它可以列表的形式給出:可能值a1aa2aai概率p1pp2ppi有時(shí)也把(2.2.2)稱為隨機(jī)變量X的分布表.設(shè)?為一樣本空間.X為定義于其上的一個(gè)離散型隨機(jī)變量,其取值為x1,x2,.....令A(yù)為{x1,x2,...}的任意一個(gè)子集.事件{X取值于A中}的概率可根據(jù)概率的可加性來計(jì)算:P(A)={P(X=x).xeA這樣知道了離散型隨機(jī)變量X的概率函數(shù),我們就能給出關(guān)于X的任何概率問題的回答.下面我們給出常見的離散型分布.在描述離散概率模型時(shí),Bernoulli試驗(yàn)是最早被研究且應(yīng)用及其廣泛的概率模型.定義2.2.3.設(shè)一個(gè)隨機(jī)試驗(yàn)只有兩個(gè)可能結(jié)果A和,則稱此試驗(yàn)為一Bernoulli試驗(yàn).定義2.2.4.設(shè)將一個(gè)可能結(jié)果為A和的Bernoulli試驗(yàn)獨(dú)立地重復(fù)n次,使得事件A每次出現(xiàn)的概率相同,則稱此試驗(yàn)為n重Bernoulli試驗(yàn).下面的0-1分布和二項(xiàng)分布都是以Bernoulli試驗(yàn)為基礎(chǔ)的.?2.2.10-1分布設(shè)隨機(jī)變量X只取0,1兩值,P(X=1)=p,P(X=0)=1_p,則稱X服從0-1分布或Bernoulli分布.0-1分布是很多古典概率模型的基礎(chǔ).?2.2.2二項(xiàng)分布設(shè)某事件A在一次試驗(yàn)中發(fā)生的概率為p.現(xiàn)把試驗(yàn)獨(dú)立地重復(fù)n次.以X記A在這n次試驗(yàn)中發(fā)生的次數(shù),則X取值0,1,...,n,且有P(X=k)=╱、pk(1_p)n.k,k=0,1,...,n.(2.2.3)稱X服從二項(xiàng)分布,記為X~B(n,p).從╱、pk(1_p)n.k=(p+1_p)n=1,我們知道(2.2.3)確實(shí)是一個(gè)概率函數(shù).為了考察這個(gè)分布是如何產(chǎn)生的,考慮事件{X=i}.要使這個(gè)事件發(fā)生,必須在這n次試驗(yàn)的原始記錄AAA...A中,有i個(gè)A,n_i個(gè),每個(gè)A有概率p而每個(gè)有概率1_p.又由于每次試驗(yàn)獨(dú)立,所以每次出現(xiàn)A與否與其它次試驗(yàn)的結(jié)果獨(dú)立.因此由概率乘法定理得出每個(gè)這樣的原始結(jié)果序列發(fā)生的概率為pi(1_p)n.i.但是i個(gè)A和n_i個(gè)的排列總數(shù)是╱、,所以有i個(gè)A的概率是:╱、pi(1_p)n.i,i=0,1,...,n.一個(gè)變量服從二項(xiàng)分布有兩個(gè)條件:一是各次試驗(yàn)的條件是穩(wěn)定的,這保證了事件A的概率p在各次試驗(yàn)中保持不變:二是各次試驗(yàn)的獨(dú)立性.現(xiàn)實(shí)生活中有許多現(xiàn)象不同程度地滿足這些條件.例如工廠每天生產(chǎn)的產(chǎn)品.假設(shè)每日生產(chǎn)n個(gè)產(chǎn)品.若原材料質(zhì)量,機(jī)器設(shè)備,工人操作水平等在一段時(shí)間內(nèi)保持穩(wěn)定,且每件產(chǎn)品是否合格與其它產(chǎn)品合格與否并無顯著性關(guān)聯(lián),則每日的廢品數(shù)服從二項(xiàng)分布.?2.2.3Poisson分布設(shè)隨機(jī)變量X的概率分布為P(X=k)=e.λ,k=0,1,2,...,λ>0,(2.2.4)則稱X服從參數(shù)為λ的Poisson分布,并記X~P(λ).由于eλ有級數(shù)展開式eλ=1+λ++...++...所以o{P(X=k)=1.k=0穆德和格雷比爾著的《統(tǒng)計(jì)學(xué)導(dǎo)論》給出了Poisson分布的如下推導(dǎo).假定體積為V的液體包含有一個(gè)大數(shù)目N的微生物.再假定微生物沒有群居的本能,它們能夠在液體的任何部分出現(xiàn),且在體積相等的部分出現(xiàn)的機(jī)會相同.現(xiàn)在我們?nèi)◇w積為D的微量液體在顯微鏡下觀察,問在這微量液體中將發(fā)現(xiàn)x個(gè)微生物的概率是什么?我們假定V遠(yuǎn)遠(yuǎn)大于D.由于假定了這些微生物是以一致的概率在液體中到處散布,因此任何一個(gè)微生物在D中出現(xiàn)的概率都是D/V.再由于假定了微生物沒有群居的本能,所以一個(gè)微生物在D中的出現(xiàn),不會影響另一個(gè)微生物在D中的出現(xiàn)與否.因此微生物中有x個(gè)在D中出現(xiàn)的概率就是xNx(2.2.5)在這里我們還假定微生物是如此之小,擁擠的問題可以忽略不考慮,即N個(gè)微生物所占據(jù)的部分對于體積D來說是微不足道.在(2.2.5)中令V和N趨向于無窮,且微生物的密度N/V=d保持常數(shù).將(2.2.5)式改寫成如下形式:╱、x╱1_、N.x=x!.當(dāng)N變成無限時(shí)其極限為e.Dd(Dd)x/x!(2.2.6)令Dd=λ,則(2.2.6)和(2.2.4)的形式相同.這一推導(dǎo)過程還證明了λ是x的平均數(shù),因?yàn)樗疾斓囊徊糠煮w積D乘以整個(gè)的密度d就給出了在D中所預(yù)計(jì)的平均數(shù)目.當(dāng)N很大,p很小且Np趨于一個(gè)極限時(shí),Poisson分布是二項(xiàng)分布的一個(gè)很好的近似.而在N未知時(shí),Poisson分布更顯得有用.我們有下面的定理.定理2.2.1.在n重Bernoulli試驗(yàn)中,以pn代表事件A在試驗(yàn)中出現(xiàn)的概率,它與試驗(yàn)總數(shù)n有關(guān).如果npn二λ,則當(dāng)n二o時(shí),╱、p(1_pn)n.k二e.λ.例2.2.1.現(xiàn)在需要100個(gè)符合規(guī)格的元件.從市場上買的該元件有廢品率0.01.考慮到有廢品存在,我們準(zhǔn)備買100+a個(gè)元件使得從中可以挑出100個(gè)符合規(guī)格的元件.我們要求在這100+a個(gè)元件中至少有100個(gè)符合規(guī)格的元件的概率不小于0.95.問a至少要多大?解:令A(yù)={在100+a個(gè)元件中至少有100個(gè)符合規(guī)格的元件}.假定各元件是否合格是獨(dú)立的.以X記在100+a個(gè)元件中的廢品數(shù).則X服從n=100+a和p=0.01的二項(xiàng)分布,且P(A)=╱100i+a、(0.01)i(0.99)100+a.i.上式中的概率很難計(jì)算.由于100+a較大而0.01較小,且(100+a)(0.01)=1+0.01as1,我們以λ=1的Poisson分布來近似上述概率.因而aP(A)={e.1/i!.i=1當(dāng)a=0,1,2,3時(shí),上式右邊分別為0.368,0.736,0.920和0.981.故取a=3已夠了.?2.2.4離散的均勻分布設(shè)隨機(jī)變量X取值a1,a2,...,an,且有P(X=ak)=,k=1,...,n.則稱X服從離散的均勻分布.可以看出,離散的均勻分布正是古典概型的抽象.?2.3連續(xù)型隨機(jī)變量離散隨機(jī)變量只取有限個(gè)或可數(shù)無限個(gè)值,而連續(xù)型隨機(jī)變量取不可數(shù)個(gè)值.這就決定了不能用描述離散型隨機(jī)變量的辦法來刻劃連續(xù)型隨機(jī)變量.考慮一個(gè)例子.假定步槍射手瞄準(zhǔn)靶子在固定的位置進(jìn)行一系列的射擊.令X是命中點(diǎn)與過靶心垂線的水平偏離值,設(shè)X取值[_5cm,5cm].X是一個(gè)連續(xù)隨機(jī)變量.為了計(jì)算X落在某區(qū)間的概率,將[_5,5]分為長為1厘米的小區(qū)間.對于每個(gè)小區(qū)間,以落在這個(gè)小區(qū)間的彈孔數(shù)除以彈孔總數(shù)得到落在這個(gè)區(qū)間的彈孔的相對頻數(shù).設(shè)總彈孔數(shù)為100.我們得到下表:ityity.000.050.100.150.200.25彈孔數(shù)相對頻數(shù)[_5,_4]1[_4,_3]1[_3,_2]6[_2,_1][_1,0]732上表可以用下圖來表示:圖2.3.1彈孔位點(diǎn)分布圖012345?5012345X我們注意每個(gè)矩形的底等于1,高為該矩形的區(qū)間所對應(yīng)的相對頻數(shù),所以面積為相對頻數(shù).全部矩形的面積是1.對于[_5,5]的任一子區(qū)間,我們可以根據(jù)上圖估計(jì)彈孔落在該子區(qū)間的概率.例如要估計(jì)0<X<2的概率,只要把區(qū)間中的兩個(gè)矩形面積加起來,結(jié)果得到0.43.再譬如說要估計(jì)_0.25<X<1.5中的概率,我們應(yīng)當(dāng)計(jì)算該區(qū)間上的面積,結(jié)果得到:0.06+0.27+0.08=0.41.如果第二批的100顆子彈射在靶子上,我們就將獲得另一個(gè)經(jīng)驗(yàn)分布.它與第一個(gè)經(jīng)驗(yàn)分布多半是不同的,盡管它們的外表可能相似.如果把觀察到的相對頻數(shù)看作為某一“真”概率的估計(jì),則我們假定有一個(gè)函數(shù),它將給出任何區(qū)間中的精確概率.這些概率由曲線下的面積給出.由此我們得到如下定義:定義2.3.1.X稱為連續(xù)型隨機(jī)變量,如果存在一個(gè)函數(shù)f,叫做X的概率密度函數(shù),它滿足下面的條件∶1.對所有的_o<x<+o,有f(x)>0;2.│f(x)dx=1;3.對于任意的_o<a<b<+o,有P(a<X<b)=│f(x)dx.注2.3.1.對于任意的_o<x<+o,有P(X=x)=│f(u)du=0.注2.3.2.如果f只取某有限區(qū)間[a,b]的值,令f?(x)=,f)xe[a,b],其它.則f?是定義在(_o,+o)上的密度函數(shù),且f(x)和f?(x)給出相同的概率分布.注2.3.3.假設(shè)有總共一個(gè)單位的質(zhì)量連續(xù)地分布在a<x<b上.那么f(x)表示在點(diǎn)x的質(zhì)量密度且│cdf(x)dx表示在區(qū)間[c,d]上的全部質(zhì)量.由于連續(xù)隨機(jī)變量的概率是用積分給出的,我們可以直接處理密度的積分而不是密度本身.定義2.3.2.設(shè)X為一連續(xù)型隨機(jī)變量.則F(x)=\f(u)du,_o<x<+o(2.3.1)稱為X的(累積)分布函數(shù).注2.3.4.F(x)表示的是隨機(jī)變量的數(shù)值小于或等于x的概率,即F(x)=P(X<x)_o<x<+o.(2.3.2)由式(2.3.2)定義的F為X的(累積)分布函數(shù)的一般定義.它適用于任意的隨機(jī)變量.設(shè)X為F(x)={pi.ai二北分布函數(shù)F具有下列性質(zhì):(1)F是非減的函數(shù);(2)lim北/.oF(x)=0;(3)lim北/+oF(x)=1.對于連續(xù)隨機(jī)變量,如果F(x)在點(diǎn)x的導(dǎo)數(shù)存在,則f(x)=Fo(x).連續(xù)隨機(jī)變量的分布函數(shù)的圖象如下圖所示.下面我們介紹常見的連續(xù)型分布.它們包括正態(tài)分布,指數(shù)分布和均勻分布.?2.3.1正態(tài)分布如果一個(gè)隨機(jī)變量X具有概率密度函數(shù)f(x)=exp{_},_o<x<+o,(2.3.3)其中_o<μ<+o,σ2>0,則稱X為一正態(tài)隨機(jī)變量,記為X~N(μ,σ2).以(2.3.3)為密度的分布稱為參數(shù)為μ和σ2的正態(tài)分布.具有參數(shù)μ=0,σ=1的正態(tài)分布稱為標(biāo)準(zhǔn)正態(tài)分布.用Φ(x)和φ(x)表示標(biāo)準(zhǔn)正態(tài)分布N(0,1)的分布函數(shù)和密度函數(shù).從圖(2.3.3)可以看出,正態(tài)分布的密度函數(shù)是以x=μ為對稱軸的對稱函數(shù).μ稱為位置參數(shù).密度函數(shù)在x=μ處達(dá)到最大值,在(_o,μ)和(μ,+o)內(nèi)嚴(yán)格單調(diào).同時(shí)我們看到,σ的大小決定了密度函數(shù)的陡峭程度.通常稱σ為正態(tài)分布的形狀參數(shù).以F(x)記正態(tài)分布N(μ,σ2)的概率分布函數(shù),則恒有F(x)=Φ(北.σμ).所以任一正態(tài)分布的概率分布函數(shù)都可通過標(biāo)準(zhǔn)正態(tài)分布的分布函數(shù)計(jì)算出來.圖2.3.2(累積)分布函數(shù)0x0例2.3.1.求數(shù)k使得對于正態(tài)分布的變量有P(μ_kσ<x<μ+kσ)=0.95.解:令F為正態(tài)分布N(μ,σ2)的分布函數(shù),則有P(μ_kσ<x<μ+kσ)=F(μ+kσ)_F(μ_kσ)=Φ(k)_Φ(_k)=0.95.(2.3.4)從關(guān)系式Φ(_k)=1_Φ(k),我們得2Φ(k)_1=0.95.所以Φ(k)=0.975.查正態(tài)分布表,得k=1.96.?2.3.2指數(shù)分布若隨機(jī)變量X具有概率密度函數(shù)f(x)=其中λ>0為常數(shù),則稱X服從參數(shù)為λ的指數(shù)分布.指數(shù)分布的分布函數(shù)為F(x)=0.30.40.30.4f(x)20.00.1圖2.3.3正態(tài)分布的密度函數(shù)mu=1,sigma=1mu=4,sigma=1.5mu=?2,sigma=255x從圖(2.3.5)可以看出,參數(shù)λ愈大,密度函數(shù)下降得愈快.指數(shù)分布經(jīng)常用于作為各種”壽命”的分布的近似.令X表示某元件的壽命.我們引進(jìn)X的失效率函數(shù)如下:h(x)=limP(x<X<x+?xh(x)=lim?x/0?x.失效率表示了元件在時(shí)刻x尚能正常工作,在時(shí)刻x以后,單位時(shí)間內(nèi)發(fā)生失效的概率.則如果h(x)=λ(常數(shù)),0<x<+o,X服從指數(shù)分布.即指數(shù)分布描述了無老化時(shí)的壽命分布.指數(shù)分布的最重要的特點(diǎn)是“無記憶性”.即若X服從指數(shù)分布,則對任意的s,t>P(X>s+t|X>s)=P(X>t).(2.3.7)即壽命是無老化的.可以證明,指數(shù)分布是唯一具有性質(zhì)(2.3.7)的連續(xù)型分布.f(f(x)0.00.10.20.30.40.5圖2.3.4指數(shù)分布的密度函數(shù)lambda=1lambda=1lambda=0.5lambda=30268402684x?2.3.3均勻分布設(shè)a<b,如果分布F(x)具有密度函數(shù)f(x)=,1b.a0a<x<b,其它,則稱該分布為區(qū)間[a,b]上的均勻分布,記作U[a,b].如此定義的f(x)顯然是一個(gè)概率密度函數(shù).容易算出其相應(yīng)的分布函數(shù)為,x<a,F(x)=(,a<x<b,ìì‘1,x>b.在計(jì)算時(shí)因四舍五入而產(chǎn)生的誤差可以用均勻分布來描述.?2.4多維分布在實(shí)際應(yīng)用中,經(jīng)常需要對所考慮的問題用多個(gè)變量來描述.我們把多個(gè)隨機(jī)變量放在一起組成向量,稱為多維隨機(jī)變量或者隨機(jī)向量.例2.4.1.從一付撲克牌中抽牌時(shí),可以用紙牌的花色和數(shù)字來說明其特征.例2.4.2.考慮一個(gè)打靶的試驗(yàn).在靶面上取定一個(gè)直角坐標(biāo)系.則命中的位置可由其坐標(biāo)(X,Y)來刻劃.X,Y都是隨機(jī)變量.定義2.4.1.設(shè)X=(X1,...,Xn).如果每個(gè)Xi都是一個(gè)隨機(jī)變量,i=1,...,n,則稱X為n維隨機(jī)變量或者隨機(jī)向量.我們可以按照對常用一維隨機(jī)變量的分類把常用的隨機(jī)向量分為離散型和連續(xù)型的.定義2.4.2.如果每一個(gè)Xi都是一個(gè)離散型隨機(jī)變量,i=1,...,n,則稱X=(X1,...,Xn)為一n維離散隨機(jī)變量.設(shè)Xi的所有可能取值為{ai1,ai2,...},i=1,...,n,則稱p(j1,...,jn)=P(X1=a1j1,...,Xn=anjn),j1,...,jn=1,2,...(2.4.1)為n維隨機(jī)變量X的概率函數(shù).容易證明概率函數(shù)具有下列性質(zhì):(1)p(j1,...,jn)>0,ji=1,2,...,i=1,2,...,n;(2)Lp(j1,...,jn)=1.我們具體來看一下二維離散分布.設(shè)二維離散型隨機(jī)變量(X,Y)的所有可能取值為{(xi,yj):i=1,...,n,j=1,2,...,m}.我們經(jīng)常以列聯(lián)表的形式來表示二維離散型隨機(jī)變量的概率分布.記pij=P(X=xi,Y=yj),i=1,...,n,j=1,...,m.則(X,Y)的概率函數(shù)可以下表表示:↘↘↘x1x2...xn行和y1ymp11p12p1mp21p22p2mpn1pn2pnmp<m列和p1<p2<...pn<1例2.4.3.從一個(gè)包含五個(gè)黑球,六個(gè)白球和七個(gè)紅球的罐子里抽取四個(gè)球.令X是抽到白球的數(shù)目,Y是抽到紅球的數(shù)目.則二維隨機(jī)變量(X,Y)的概率函數(shù)為p(x,y)=╱、╱、╱4..y、0<x+y<4.(2.4.2)以列聯(lián)表表示,即為↘↘↘01234行和01234 1155151102153204 7735751204153 777468 35712102 992211415134512041類似于一維連續(xù)型隨機(jī)變量,連續(xù)型隨機(jī)向量的也是由密度函數(shù)來刻畫的.定義2.4.3.稱X=(X1,...,Xn)為n維連續(xù)型隨機(jī)變量,如果存在Rn上的非負(fù)函數(shù)f(x1,...,xn),使得對任意的_o<a1<b1<+o,...,_o<an<bn<+o,有P(a1<X1<b1,...,an<Xn<bn)=\\f(x1,...,xn)dx1...dxn,則稱f為X的概率密度函數(shù).對n維隨機(jī)變量我們也有分布函數(shù)的概念.定義2.4.4.設(shè)X=(X1,...,Xn)為n維隨機(jī)變量.對任意的(x1,...,xn)eRn,稱F(x1,...,xn)=P(X1<x1,...,Xn<xn)(2.4.4)為n維隨機(jī)變量X的(聯(lián)合)分布函數(shù).可以驗(yàn)證分布函數(shù)F(x1,...,xn)具有下述性質(zhì):(1)F(x1,...,xn)對每個(gè)變元單調(diào)非降;xj/.o(2)對任意的1<j<n有,limF(x1,...,xn)xj/.o(3)limF(x1,...,xn)=1.x1/o,<<<,xn/o對n維連續(xù)型隨機(jī)變量,從密度的定義我們有,F(x1,...,xn)=\xn.o...\x1.of(x1,...,xn)dx1...dxn.對高維離散型隨機(jī)變量,一般我們不使用分布函數(shù).例2.4.4.考慮二維隨機(jī)變量X=(X1,X2),其概率密度函數(shù)為f(x1,x2)=,1/[(b_)(d_c)]當(dāng)a<x1c<x2<d,稱此概率密度為[a,b]×[c,d]上的均勻分布.例2.4.5.設(shè)(X,Y)的概率密度函數(shù)有形式f(x,y)=2πσ1σ21_ρ2exp{_┌_2ρ+┐}其中_o<a,b<o,0<σ1,σ2<o,_1<ρ<1.稱(X,Y)服從參數(shù)為a,b,σ1,σ2,ρ的二元正態(tài)分布,記為N(a,b,σ,σ,ρ).?2.5邊緣分布設(shè)(X1,...,Xn)為n維隨機(jī)變量,其概率分布F已知.令Xi1,...,Xim為X1,...,Xn的任一子集,則Xi1,...,Xim的分布稱為X1,...,Xn或F的一個(gè)m維邊緣分布.我們先考慮離散型隨機(jī)向量.設(shè)二維離散隨機(jī)變量(X,Y)的所有可能取值為{(xi,yj):i,j=1,2,...},則(X,Y)的聯(lián)合分布律為P(X=xi,Y=yj)=piji=1,...,n,j=1,2,...,m.以列聯(lián)表的形式表示就是↘↘↘x1x2...xn行和y1ymp11p12p1mp21p22p2mpn1pn2pnmp<m列和p1<p2<...pn<1從上述列聯(lián)表我們可以計(jì)算隨機(jī)變量X和Y的分布.固定某個(gè)xi.因?yàn)閅在使得X=xi的那些樣本點(diǎn)上必取值為y1,...,ym中之一,故有mmpX(xi)=P(X=xi)={P(X=xi,Y=yj)={pij=pi<,i=1,2,...n.(2.5.1)jj所以上述列聯(lián)表的行和所表示的正是X的分布.因?yàn)檫@個(gè)分布是從X和Y的聯(lián)合分布推導(dǎo)出來的,我們稱(2.5.1)為X的邊緣分布.類似可以得到Y(jié)的邊緣分布律npY(yj)=P(Y=yj)={pij=p<j,j=1,2,...m.i它是上述列聯(lián)表的列和.所以從列聯(lián)表中,我們不僅得到兩個(gè)隨機(jī)變量的聯(lián)合分布,同時(shí)通過將每行和每列相加,得到兩個(gè)變量的邊緣分布.類似地,可對n(n>2)維的隨機(jī)變量定義邊緣分布.設(shè)X1,...,Xn為n維隨機(jī)變量,其概率分布F已知.令Xi1,...,Xim為X1,...,Xn的任一子集,則Xi1,...,Xim的概率函數(shù)為pi1...im(ji1,...,jim)=P(Xi1=ai1ji1,...,Xim=aimjim)={p(j1,...,jn).其中和是對除Xi1,...,Xim之外的所有變量來求和.現(xiàn)考慮連續(xù)型隨機(jī)向量的邊緣分布.先考慮二維的情形.設(shè)(X,Y)有概率密度函數(shù)f(x,y).則P(x1<X<x2)=P(x1<X<x2,_o<Y<+o)=\.\f(u,v)dudv=\fX(u)du,其中fX(u)=\.f(u,v)dv.(2.5.3)從(2.5.2)我們可以看出,X的邊緣密度函數(shù)即為(2.5.3).類似地,Y的邊緣密度函數(shù)為fY(u)=\.f(u,v)du.(2.5.4)當(dāng)n>2時(shí),令f(x1,...,xn)為n維連續(xù)型隨機(jī)變量(X1,...,Xn)的概率密度函數(shù).設(shè)(i1,...,im)為(1,2,...,n)的一個(gè)子集.則同上可證,Xi1,...,Xim的概率密度函數(shù)為f(xi1,...,xim)=\...\f(x1,...,xn)dx1...dxn.其中積分是對除Xi1,...,Xim之外的所有變量來求積.例2.5.1.設(shè)(X1,X2)服從N(a,b,σ,σ,ρ).則可證明X1的邊緣分布為N(a,σ),X2的邊緣分布為N(b,σ).例2.5.1說明了雖然n維隨機(jī)變量X=(X1,...,Xn)的分布可以唯一決定其所有的邊緣分布,但邊緣分布不足以決定X的聯(lián)合分布.?2.6條件分布和隨機(jī)變量的獨(dú)立性?2.6.1條件分布一個(gè)隨機(jī)變量(或向量)的條件概率分布,就是在給定(或已知)某種條件(某種信息)下該隨機(jī)變量(向量)的概率分布。1.離散型隨機(jī)變量的條件分布設(shè)(X,Y)為二維離散型隨機(jī)變量,其全部的可能取值為{(xi,yj):i,j=1,2,...}。記其聯(lián)合分布律為pij=P(X=xi,Y=yj),i,j=1,2,...若對給定的事件{Y=yj},其概率P(Y=yj)>0,則稱P(X=xi|Y=yj)==,i=1,2,...為在給定Y=yj的條件下X的條件分布律(概率函數(shù))。類似的,若P(X=xi)>0,則稱P(Y=yj|X=xi)==,j=1,2,...為在給定條件X=xi下Y的條件分布律。例2.6.1.設(shè)二維隨機(jī)向量(X1,X2)的聯(lián)合分布律如下所示∶↘↘_105行和pi<13列和pj試求當(dāng)X2=0時(shí),X1的條件分布律o解:由聯(lián)合分布律先算出兩個(gè)邊緣分布律pi<與p<j并填入表中,由此進(jìn)一步算出條件分布律為:P{X1=1|X2=0}==而P{X1=3|X2=0}=2.連續(xù)型隨機(jī)變量的條件分布設(shè)(X,Y)有概率密度f(x,y),我們考慮在給定y<Y<y+c的條件下X的條件分布函數(shù)(設(shè)P{y<Y<y+c}>0)P(X<x|y<Y<y+c)==\x.o\yy+ef(u,v)dvdu\\yy+efY(y)dy=\x.odu對上式兩端關(guān)于x求導(dǎo)并令c二0,可求得X在給定條件Y=y下的條件概率密度為fXIY(x|y)=,fY(y)>0.記為X|y~fXIY(x|y).類似地有Y在給定X=x的條件下的條件概率密度:fYIX(y|x)=,fX(x)>0.記為Y|x~fYIX(y|x).例2.6.2.設(shè)(X,Y)服從二元正態(tài)分布N(a,b,σ,σ,ρ),試求X|Y=y的條件概率密度o解:fXIY(x|y)=f(x,y)fY(y)1^2πσ1^1_ρ2exp{_}即X|Y=y~N(a+ρσ1σ1(y_b),σ(1_ρ2))。同理有:Y|X=x~N(b+ρσ1σ2(x_a),σ(1_ρ2))。例2.6.3.設(shè)X,Y服從單位圓上的均勻分布,試求fXIY(x|y)和fYIX(y|x)o解:由題設(shè)知(X,Y)的聯(lián)合概率密度為f(x,y)=,,,x2<1易知fX(x)=<1所以!fXIY(x|y)=((12^1.y2,0,_^1_y2<x<^1_y2其它只需要把x,y互換,就可以得到fYIX(y|x)。3.更+般情形無論離散型還是連續(xù)型條件分布,上述(X,Y)中的X和Y皆可推廣到高維。例如:設(shè)(X1,X2,...,Xn)~f(x1,x2,...,xn),且(X1,...,Xk)~g(x1,...,xk),則可定義在(X1,...,Xk)=(x1,...,xk)的條件下,(Xk+1,...,Xn)的條件密度為:h(xk+1,...,xn|x1,...,xk)=,其中g(shù)(x1,...,xk)>0.注:若記(X1,...,Xk)=x,(Xk+1,...,Xn)=Y,(x1,...,xk)=m,(xk+1,...,xn)=y,則上式還可表示為:h(y|m)=,g(m)>0?2.6.2隨機(jī)變量的獨(dú)立性若條件分布等于無條件分布,或者說條件分布與“條件”無關(guān),例如,設(shè)fXIY(x|y)=g(x),則可推出g(x)=f1(x),從而得到:f(x,y)=f1(x)f2(y),(x,y)eR2此時(shí)我們稱X與Y是(相互)獨(dú)立的。更一般的定義如下:定義2.6.1.稱離散型隨機(jī)變量X1,...,Xn相互獨(dú)立,若它們的聯(lián)合分布律等于各自的邊緣分布律的乘積,即P(X1=x1,...,Xn=xn)=P(X1=x1)...P(Xn=xn),其中(x1,...,xn)為(X1,X2,...,Xn)的值域中的任意一點(diǎn).定義2.6.2.稱連續(xù)型隨機(jī)變量X1,...,Xn相互獨(dú)立,若它們的聯(lián)合密度等于各自的邊緣密度的乘積,即f(x1,...,xn)=f1(x1)...fn(xn),A(x1,...,xn)eRn注:更一般地,有下面的的定義:定義2.6.3.設(shè)X1,...,Xn為n個(gè)隨機(jī)變量,如果它們的聯(lián)合分布函數(shù)等于各自邊緣分布函數(shù)的乘積,即F(x1,...,xn)=F1(x1)...Fn(xn),A(x1,x2,...,xn)eRn則稱隨機(jī)變量X1,...,Xn相互獨(dú)立.在離散型和連續(xù)型兩種情況下,可以證明本定義分別與定義2.6.1和定義2.6.2等價(jià).例2.6.4.如果隨機(jī)變量X1,...,Xn相互獨(dú)立,則容易證明其中任何一部分隨機(jī)變量也相互獨(dú)立.然而一般來說,僅由某一部分獨(dú)立卻無法推出X1,...,Xn相互獨(dú)立.如見下例:例2.6.5.若ξ,η相互獨(dú)立,都服從-1和1這兩點(diǎn)上的等可能分布,而ζ=ξηo則ζ,ξ,η兩兩獨(dú)立但不相互獨(dú)立o例2.6.6.設(shè)(X,Y)~N(a,b,σ,σ,ρ),則X與Y相互獨(dú)立的充要條件是ρ=0o例2.6.7.設(shè)(X,Y)服從矩形D=[a,b]×[c,d]上的均勻分布,則X與Y相互獨(dú)立o例2.6.8.設(shè)(X,Y)服從單位圓上的均勻分布,則X與Y不獨(dú)立o例2.6.9.設(shè)有n個(gè)事件∶A1,A2,...,An,對于每個(gè)事件Ai,定義∶Xi=IAi(Ai的示性函數(shù)),i=1,2,...,n,則可證明∶A1,A2,...,An獨(dú)立年÷X1,X2,...,Xn獨(dú)立o?2.7隨機(jī)變量的函數(shù)的概率分布最簡單的情形,是由一維隨機(jī)變量X的概率分布去求其一給定函數(shù)Y=g(X)的分布。較常見的,是由(X1,X2,...,Xn)的分布去求Y=g(X1,X2,...,Xn)的分布。更一般地,由(X1,X2,...,Xn)的分布去求(Y1,Y2,...,Ym)的分布,其中Yi=gi(X1,X2,...,Xn),i=這一部分內(nèi)容,與數(shù)理統(tǒng)計(jì)中求統(tǒng)計(jì)量的分布有密切的聯(lián)系。1.離散型隨機(jī)變量的情形設(shè)X的分布律為P(X=xi)=pi,i=1,2,...g:R二R,令Y=g(X),則Y的分布律為P(Y=yj)=P(g(X)=yj)={P(X=xi)={pixi:g(xi)=yji:g(xi)=yj例2.7.1.設(shè)X的概率函數(shù)為X012P1/41/21/81/8試求Y=X2,Z=X3+1的分布律o解:容易求得Y的分布律為:Y014P1/23/81/8Z的分布律Z0129P1/41/21/81/8上述結(jié)論可以推廣到多維隨機(jī)變量的情形:設(shè)隨機(jī)向量X的分布律為P(X=x),則X的函數(shù)Y=g(X)的分布律為P(Y=y)=P(g(X)=y)={P(X=x)x:g(x)=y特別當(dāng)ξ,η是相互獨(dú)立的非負(fù)整值隨機(jī)變量,各有分布律{ak}與{bk}.那么ξ+η有分布律nP(ξ+η=n)={akbn.kk=0稱此公式為離散卷積公式例2.7.2.設(shè)X~B(n,p),Y~B(m,p)且X和Y相互獨(dú)立,則X+Y~B(n+m,p)o這種性質(zhì)稱為再生性o可推廣至多項(xiàng)和∶設(shè)Xi~B(ni,p),(i=1,2,...,m),且X1,X2,...,Xm獨(dú)mm立,則有:LXi~B(Lni,p)o特別,若X1,X2,...,Xn為獨(dú)立同分布,且Xi~B(1,p),i=i=1i=1n1,...,n.則有:LXi~B(n,p)o此結(jié)論揭示了二項(xiàng)分布與0_1分布之間的密切關(guān)系oi=1例2.7.3.設(shè)X~P(λ),Y~P(μ),且X和Y獨(dú)立,則有X+Y~P(λ+μ)o即Poisson分布亦具有再生性,且可推廣o2.連續(xù)型隨機(jī)變量的情形定理2.7.1.[密度變換公式]設(shè)隨機(jī)變量X有概率密度函數(shù)f(x),xe(a,b)(a,b可以為o),而y=g(x)在xe(a,b)上是嚴(yán)格單調(diào)的連續(xù)函數(shù),存在唯一的反函數(shù)x=h(y),ye(α,β)并且h\(y)存在且連續(xù),那么Y=g(X)也是連續(xù)型隨機(jī)變量且有概率密度函數(shù)p(y)=f(h(y))|h\(y)|,ye(α,β).例2.7.4.設(shè)隨機(jī)變量X~U(_,),求Y=tgX的概率密度函數(shù)o由密度變換公式知Y的概率密度函數(shù)為f(y)=arctg\(y)=,_o<y<o此分布稱為Cauchy分布。本題我們也可以用一般的方法求解,即先求出分布函數(shù),然后對分布函數(shù)求導(dǎo)數(shù)得到。F(y)=P(Y<y)=P(tg(X)<y)=P(X<arctg(y))=\arπ.ctg(y)dy=arctg(y)+.2所以Y的概率密度為f(y)=F\(y)=這種方法更具有一般性。1y2).注:當(dāng)g不是在全區(qū)間上單調(diào)而是逐段單調(diào)時(shí),密度變換公式為下面的形式:設(shè)隨機(jī)變量ξ的密度函數(shù)為pξ(x),a<x<b.如果可以把(a,b)分割為一些(有限個(gè)或可列個(gè))互不重疊的子區(qū)間的和(a,b)=njIj,使得函數(shù)u=g(t),te(a,b)在每個(gè)子區(qū)間上有唯一的反函數(shù)hj(u),并且h(u)存在連續(xù),則η=g(ξ)是連續(xù)型隨機(jī)變量,其密度函數(shù)為:pη(x)={pξ(hj(x))|h(x)|.(2.7.1)j例2.7.5.設(shè)X~N(0,1),求Y=X2的概率密度。解:由于函數(shù)y=x2在(_o,0)和[0,o)上嚴(yán)格單調(diào),因此由上述定理知Y的概率密度為f(y)=φ(_^y)|_^y\|I(y>0}+φ(^y)|^y\|I(y>0}11y=^2πy.2e.2I(y>0}定理2.7.2.設(shè)(ξ1,ξ2)是2維連續(xù)型隨機(jī)向量,具有聯(lián)合密度函數(shù)p(x1,x2),設(shè)ζj=fj(ξ1,ξ2),j=1,2.若(ξ1,ξ2)與(ζ1,ζ2)一一對應(yīng),逆映射ξj=hj(ζ1,ζ2),j=1,2.假定每個(gè)hj(y1,y2)都有一階連續(xù)偏導(dǎo)數(shù).則(ζ1,ζ2)亦為連續(xù)型隨機(jī)向量,且其聯(lián)合概率密度為q(y1,y2)=其中D是隨機(jī)向量(ζ1,ζ2)的所有可能值的集合,J是變換的Jaccobi行列式,即J=?h1?y1?h2?y1?h1?y2?h2?y2在多元隨機(jī)變量場合,更一般地有定理2.7.3.如果(ξ1,...,ξn)是n維連續(xù)型隨機(jī)向量,具有聯(lián)合密度函數(shù)p(x1,...,xn).假設(shè)存在n個(gè)n元函數(shù)yj=fj(x1,...,xn),j=1,...,n,使得ζj=fj(ξ1,...,ξn),j=1,...,n,若(ξ1,...,ξn)與(ζ1,...,ζn)之間一一對應(yīng),逆映射為ξj=hj(ζ1,...,ζn),j=1,...,n.其中每個(gè)hj(y1,...,yn)都有一階連續(xù)偏導(dǎo)數(shù),那么隨機(jī)向量(ζ1,...,ζn)是連續(xù)型的,且具有聯(lián)合密度函數(shù)q(y1,...,yn)=(2.7.3)其中D是隨機(jī)向量(ζ1,...,ζn)的所有可能值的集合,J是變換的Jaccobi行列式,即J=?h1?y1?hn?y1?h1?yn?hn?yn例2.7.6.在直角坐標(biāo)平面上隨機(jī)選取一點(diǎn),分別以隨機(jī)變量ξ與η表示其橫坐標(biāo)和縱坐標(biāo),可以認(rèn)為ξ與η相互獨(dú)立.如果ξ與η都服從正態(tài)分布N(0,1),試求其極坐標(biāo)(ρ,θ)的分布.解:易知是(0,o)×[0,2π)與R2(原點(diǎn)除外)之間的一一變換,變換的Jaccobi行列式J=││=│=r.由于(ξ,η)的聯(lián)合密度為p(x,y)=exp{-},所以由(2.7.3)式得知,(ρ,θ)的聯(lián)合密度為q(r,t)=rexp{-}=q1(r)q2(t),r>0,te[0,2π).(2.7.4)其中q1(r)=rexp{-},r>0;q2(t)=,te[0,2π).這一結(jié)果表明:θ與ρ相互獨(dú)立,其中θ服從[0,2π)上的均勻分布;而ρ則服從Weibull分布(參數(shù)λ=1/2,α=2).在計(jì)算兩個(gè)隨機(jī)變量之和時(shí),我們還經(jīng)常用到如下定理定理2.7.4.設(shè)X,Y的聯(lián)合概率密度為f(x,y),則X+Y的概率密度p(z)為p(z)=\一f(x,z-x)dx=\一f(z-y,y)dy證一:先求X+Y的分布函數(shù)F(z).我們有F(z)=P(X+Y<z)=\\x+y<zf(x,y)dxdy=\一dx\z一一oxf(x,y)dy=\一du\z一of(x,t-x)dt=\z一o{\一f(x,t-x)dx}dt.這就說明,X+Y的分布函數(shù)F(z)是其中的花括弧中的函數(shù)在區(qū)間(-o,z)上的積分,所以X+Y是連續(xù)型隨機(jī)變量,其密度函數(shù)如定理所述O證二:令X=Z1,X+Y=Z2,利用單調(diào)映射的密度變換公式(2.7.2)可求得(Z1,Z2)的聯(lián)合概率密度函數(shù)為g(z1,z2)=f(z1,z2-z1).再對g(z1,z2)關(guān)于z1在R上積分,便求得Z2=X+Y的密度為\一g(z1,z2)dz1=\一f(z1,z2-z1)dz1,故得所證.特別,當(dāng)X與Y獨(dú)立時(shí),分別記X和Y的概率密度為f1(x)和f2(y),則X+Y的概率密度為p(z)=\一f1(x)f2(z-x)dx=\一f1(z-y)f2(y)dy全f1*f2(z)=f2*f1(z)稱此公式為卷積公式O例2.7.7.設(shè)X服從期望為2的指數(shù)分布,Y~U(0,1),且X和Y相互獨(dú)立o求X-Y的概率密度和P(X<Y)o解一:由題設(shè)知-Y~U(-1,0),并記X和-Y的密度分別為f1和f2,從而由卷積公式有fX一Y(z)=\一f1(x)f2(z-x)dx

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負(fù)責(zé)。
  • 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

最新文檔

評論

0/150

提交評論