第四章 概率分布 《試驗設(shè)計與統(tǒng)計分析》課件_第1頁
第四章 概率分布 《試驗設(shè)計與統(tǒng)計分析》課件_第2頁
第四章 概率分布 《試驗設(shè)計與統(tǒng)計分析》課件_第3頁
第四章 概率分布 《試驗設(shè)計與統(tǒng)計分析》課件_第4頁
第四章 概率分布 《試驗設(shè)計與統(tǒng)計分析》課件_第5頁
已閱讀5頁,還剩97頁未讀, 繼續(xù)免費閱讀

下載本文檔

版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進行舉報或認領(lǐng)

文檔簡介

第四章概率分布第四章概率分布1在自然界或人類社會中發(fā)生的各種現(xiàn)象通??蓜澐譃閮深悾捍_定性現(xiàn)象(definitephenomena)——一定條件下必然發(fā)生的現(xiàn)象;隨機現(xiàn)象(randomphenomena)——一定條件下可能發(fā)生、但結(jié)果不止一個、哪個結(jié)果發(fā)生預(yù)先并不知道的。比如,拋擲一枚硬幣.隨機現(xiàn)象的統(tǒng)計規(guī)律——隨機現(xiàn)象雖然表現(xiàn)為不確定性,但在大量重復(fù)試驗觀測下,其結(jié)果會呈現(xiàn)出某種特定的規(guī)律,稱作隨機現(xiàn)象的統(tǒng)計規(guī)律。如:擲一枚硬幣,{正面朝上}的頻率接近0.5。概率分布就是描述隨機現(xiàn)象的統(tǒng)計規(guī)律。

在自然界或人類社會中發(fā)生的各種現(xiàn)象通??蓜澐譃閮深悾?本章主要介紹:①事件和概率②二項分布和泊松分布③正態(tài)分布④抽樣分布第一節(jié)事件和概率一、事件1、隨機試驗滿足下述三個條件的試驗稱為隨機試驗(randomexperiment):①試驗可在相同條件下重復(fù)進行;②試驗的所有可能結(jié)果是明確可知的,并且不止一個;③每次試驗總是恰好出現(xiàn)這些可能結(jié)果中的一個,但在試驗之前卻不能肯定會出現(xiàn)哪一個結(jié)果。在統(tǒng)計學(xué)里隨機試驗可簡稱為試驗。本章主要介紹:①事件和概率②二項分布和泊松分布③正態(tài)分32、事件(event)——試驗中所觀察到的結(jié)果。3、基本事件隨機試驗的每一個可能結(jié)果,稱為基本事件(elementaryevent)或簡單事件(simpleevent),不可再分。

4、復(fù)合事件由若干個基本事件組合而成的事件,稱復(fù)合事件(compoundevent),也稱作復(fù)雜事件5、必然事件——每次試驗中一定發(fā)生的結(jié)果稱作必然事件(certainevent),用Ω表示。6、不可能性事件——在任何一次試驗中都不可能發(fā)生的結(jié)果稱作不可能事件(impossibleevent)。用Φ表示。7、隨機事件——每次試驗中可能發(fā)生也可能不發(fā)生的結(jié)果稱作隨機事件(randomevent)。用A、B、C等表示。根據(jù)復(fù)雜性分根據(jù)發(fā)生的可能性分2、事件(event)——試驗中所觀察到的結(jié)果。根據(jù)復(fù)雜性4二、事件之間的關(guān)系和運算1、包含若事件A的發(fā)生必導(dǎo)致事件B發(fā)生,則稱事件B包含事件A,

。2、相等則稱事件A等于事件B,記作A=B。3、和若事件A與事件B至少一個發(fā)生某事件就發(fā)生,則某事件稱作A與B的和事件,簡稱為和,記作(讀作A并B),或A+B(讀作A加B)。二、事件之間的關(guān)系和運算1、包含5推廣到n個事件的和:4、積若事件A與事件B同時發(fā)生某事件才發(fā)生,則稱某事件為A與B的積事件,簡稱為積,記作,讀作A交B)或AB(讀作A乘B)。推廣到個n個事件的積:推廣到n個事件的和:65、差稱事件A發(fā)生但事件B不發(fā)生的事件為A減B的差事件,簡稱為差,記為A-B。6、互斥若事件A與事件B不能同時發(fā)生,則稱A與B互斥或互不相容?;コ獍ǚ谴思幢说那樾?,但互斥不一定是非此即彼,事件關(guān)系滿足。7、對立稱事件A不發(fā)生就發(fā)生的事件為A的對立事件,記為。事件的發(fā)生非此即彼,顯然5、差78、獨立若事件A發(fā)生的概率不影響事件B發(fā)生的概率,則稱事件A與事件B相互獨立,反之亦然,A與B是一對彼此獨立的事件。

注意獨立與互斥、對立的區(qū)別,互斥指兩事件不能同時發(fā)生,滿足;獨立指一事件發(fā)生的概率與另一事件發(fā)生的概率無關(guān),對立事件互斥但不獨立,因為它們滿足9、完備事件系若n個A1、A2、…An事件兩兩互斥,且滿足下式:8、獨立8則稱該個事件為一個完備事件系。注意,概率之和等于1并且兩兩互斥的事件系才是完備事件系,兩個條件缺一不可?!怖?.1〕用“集合圖”描述事件之間的關(guān)系和運算,并理解和掌握它們的實際意義。圖4.1事件之間的關(guān)系和運算則稱該個事件為一個完備事件系。注意,概率之和等于1并且兩兩互9三、概率用于度量事件發(fā)生可能性大小的數(shù)值稱作事件的概率(probability)。通常用P(A)、P(B)等表示。事件的概率具有下述性質(zhì):①設(shè)A為任一事件,則0≤P(A)≤1;②必然事件的概率為1,P(

)=1;③不可能事件的概率為0,P(

)=0。三、概率用于度量事件發(fā)生可能性大小的數(shù)值稱作事件的概率(p102、概率的統(tǒng)計定義若在相同條件下將試驗重復(fù)n次,且事件A出現(xiàn)了nA次,則事件的頻率(frequency)定義為如果隨著試驗重復(fù)次數(shù)n的增大,事件A的頻率越來越穩(wěn)定地在某一常數(shù)附近擺動,則稱常數(shù)為事件A的概率(probability),即這就是統(tǒng)計意義上的概率定義(statisticalprobability)。歷史上曾有幾個著名的拋一枚均質(zhì)硬幣試驗(見教材)許多情況下p很難準確獲得。通常以n充分大時事件A出現(xiàn)的頻率作為它的概率的估計值,即:2、概率的統(tǒng)計定義11四、概率計算法則1、對立事件和互斥事件的加法公式若A和為對立事件:

若A和B為互斥事件:P(A+B)=P(A)+P(B)2、獨立事件的乘法若A、B為相互獨立事件:

P(AB)=P(B)P(A)若A1、A2、…An為獨立事件系:P(A1、A2、…An)=P(A1)(A2)…P(An)四、概率計算法則12第二節(jié)隨機變量及其分布一、隨機變量在隨機試驗中,被測定的量是可取不同值的變量,且其取值具有隨機性,這樣的變量稱為隨機變量,用X表示。

X的某次取值記作小寫的x,此時就稱X作隨機變量(randomvariable),就稱x作隨機變量的一個觀察值(observedvalue)或簡稱觀測(observation)。

第二節(jié)隨機變量及其分布一、隨機變量13間斷性(internalvariable)或稱為離散(discretevariable)隨機變量——如果隨機變數(shù)只有有限個可能的取值,并在試驗中以確定的概率來取這些數(shù)值,就稱它為間斷性(或離散)隨機變量。質(zhì)量性狀和計數(shù)的數(shù)量性狀的試驗結(jié)果常常是間斷性隨機變量。連續(xù)性隨機變量(continuousvariable)——如果隨機變數(shù)可能的取值充滿一個區(qū)間,并且試驗結(jié)果落在任意區(qū)間內(nèi)的概率是確定的,就稱它為連續(xù)性隨機變量。計量性狀的試驗結(jié)果通常是連續(xù)性隨機變量。間斷性(internalvariable)或稱為離散(14二、隨機變量的概率分布隨機變數(shù)可能的取值或取值區(qū)間的概率反映了隨機變數(shù)的統(tǒng)計規(guī)律性,稱為概率分布。1、離散(間斷性)隨機變量的概率分布所謂離散隨機變量的概率分布,就是指概率函數(shù)f(x)和分布函數(shù)F(x)兩個基本函數(shù),它們提供了概率分布規(guī)律的完整信息。①概率函數(shù)(probabilityfunction)f(x)設(shè)隨機變數(shù)X可能的取值為x1,x2,……,xk,每個取值對應(yīng)的概率P(X=xi)為p1,p2,……,pk,為離散(間斷性)隨機變量的概率函數(shù)二、隨機變量的概率分布15表4.1間斷性隨機變量的概率分布列Xix1x2……xkf(x)=P(X=xi)p1p2……pkF(xi)p1p1+p2……1②分布函數(shù)(cumulativedistributionfunction)F(x)

為分布函數(shù)亦稱作概率累積函數(shù)間斷性隨機變量一般用概率分布列來表示這種規(guī)律性。其概率分布列見表4.1。表4.1間斷性隨機變量的概率分布列Xix1x2……xkf16〔例4.2〕轉(zhuǎn)基因桑樹植株抗病性檢驗(邱健德,2006),參試植株分兩組,即轉(zhuǎn)基因組和一般桑樹組,將病級分為0,1,2,3,4,5級,觀測發(fā)病的植株數(shù)。由于觀測數(shù)量足夠多,故發(fā)病的概率近似等于頻率,試以此概率為基礎(chǔ)求解隨機變量的概率函數(shù)和分布函數(shù)。〔例4.2〕轉(zhuǎn)基因桑樹植株抗病性檢驗(邱健德,2006),參17表4.2桑樹植株發(fā)病級的概率函數(shù)和分布函數(shù)病級觀察值x

012345合計f1(x)10/2320/6910/695/691/2301/691F1(x)10/2350/6920/2365/6968/691─f2(x)25/321/83/641/321/6401F2(x)25/3229/3261/6463/6411─表4.2桑樹植株發(fā)病級的概率函數(shù)和分布函數(shù)病級觀察值x182、連續(xù)隨機變量的分布連續(xù)性隨機變量一般用分布函數(shù)F(x)和概率密度函數(shù)f(x)來表示其概率分布規(guī)律

①分布函數(shù)(概率累積函數(shù))F(X)若X為一連續(xù)隨機變量,x(-∞,+∞)為任意實數(shù),則X的分布函數(shù)或概率累積函數(shù)為:F(X)=P(X≤x)分布函數(shù)F(x)的直觀意義就是隨機點X落在區(qū)間(-∞,x]上的概率。②概率密度函數(shù)f(x)

如果存在非負函數(shù)f(x),使則稱f(x)為連續(xù)隨機變量的概率密度函數(shù),簡稱概率密度(probabilitydensity),亦稱密度函數(shù)(densityfunction)或分布密度(distributiondensity)。2、連續(xù)隨機變量的分布連續(xù)性隨機變量一般19圖4.2連續(xù)隨機變量的概率密度曲線圖4.3連續(xù)隨機變量的分布函數(shù)曲線圖4.2連續(xù)隨機變量的圖4.3連續(xù)隨機變量的20③連續(xù)隨機變量在給定區(qū)間取值的概率對于連續(xù)隨機變量x,若已知它的分布函數(shù)F(X),則x的觀察值屬于任一區(qū)間(x1,x2]的概率可由下式求得:③連續(xù)隨機變量在給定區(qū)間取值的概率211、大數(shù)定律相同條件下大量重復(fù)的試驗,事件發(fā)生的頻率隨試驗次數(shù)的無限增大而趨于事件的概率,這是最早的一個大數(shù)定律(lawoflargenumber)。一般的大數(shù)定律,研究隨機變量n次觀測的平均數(shù)隨n無限增大是否趨向某定值的問題,稱作平均數(shù)的穩(wěn)定性。如果“n無限增大平均數(shù)就趨于一個定值”,此時稱平均數(shù)具有穩(wěn)定性。

三、大數(shù)定律及小概率事件原理1、大數(shù)定律三、大數(shù)定律及小概率事件原理22大數(shù)定律是許多統(tǒng)計方法賴以成立的理論依據(jù)。稱其為統(tǒng)計估計。“大數(shù)”就是所謂的“足夠多”。

頻率樣本平均數(shù)樣本均方足夠多的獨立重復(fù)試驗大數(shù)定律概率期望方差大數(shù)定律是許多統(tǒng)計方法賴以成立的理論依據(jù)。頻率樣本平均數(shù)樣232、小概率事件原理依據(jù)大數(shù)定律,概率很小的事件其頻率也很小,若只做一次試驗,該事件實際上應(yīng)當(dāng)不會發(fā)生。因此,人們常常認為那些概率很小的事件實際上是不可能發(fā)生的,此原理稱之為“小概率事件的實際不可能原理”,簡稱作“小概率事件原理”.一般認為概率小于0.05或小于0.01的事件為小概率事件,0.05和0.01稱為小概率事件的臨界概率。對于其它特殊場合,規(guī)定的臨界概率值可根據(jù)事件的性質(zhì)合理確定。

2、小概率事件原理依據(jù)大數(shù)定律,概率很小的24第三節(jié)二項分布和泊松分布一、0-1分布(二項總體分布)有些總體的各個個體的某種性狀,只能發(fā)生非此即彼兩種結(jié)果,“此”和“彼”是對立事件,如,種子的發(fā)芽和不發(fā)芽等,這種由非此即彼事件構(gòu)成的總體,叫做二項總體。為便于研究,將這類的試驗結(jié)果數(shù)量化,“此”事件設(shè)為1,具概率p,“彼”事件設(shè)為0,具概率q,因而,二項總體又稱為0-1總體,其概率關(guān)系顯然為:p+q=1q=1–p第三節(jié)二項分布和泊松分布一、0-1分布(二項總體分25表4.3二項總體的概率分布列(0-1分布)xP(X=x)P(X≤x)01q=1-ppqp+q=1m

=p,

s2

=pq表4.3二項總體的概率分布列(0-1分布)xP(X26圖4.40-1分布的概率函數(shù)觀察值(x)概率函數(shù)f(x)圖4.40-1分布的概率函數(shù)觀察值(x)概率函數(shù)f(x)27[例4.3]以某試驗地的5株蔬菜為總體調(diào)查蚜蟲為害情況。令x=1代表受害,x=0代表未受害,5株的觀察結(jié)果為0,1,0,1,0。試求危害率的數(shù)學(xué)期望m和方差s2。說明該試驗地蚜蟲的平均危害率為0.4,危害率變異的方差為0.24。此例也說明了二項總體的平均數(shù)為m

=p,方差為s2=pq[例4.3]以某試驗地的5株蔬菜為總體調(diào)查蚜蟲為害情況。令x28二、二項分布從二項總體中,每次以樣本容量n抽樣,將會有n+1種可能的結(jié)果,這n+1種可能的結(jié)果有它各自的概率而組成一種分布,就叫二項概率分布,簡稱二項分布(binomialdistribution)。又稱貝努利分布。二、二項分布29x01011100101010100010101001011001101000010110101110100000000011000000011110000011111100011111111011111以n=5抽樣,有6種可能的結(jié)果(即:變量X有6種可能的取值)二項總體(0-1)總體這6種可能的結(jié)果有它各自的概率而組成一種分布就叫二項概率分布,簡稱二項分布(binomialdistribution)

。又稱貝努利分布。012345x0101000000000110000000130二項展開式二項展開式31三、計算二項分布概率的方法[例4.4]在一批發(fā)芽率為0.9的種子里取5粒進行發(fā)芽試驗。以x為發(fā)芽粒數(shù),試做出試驗結(jié)果X的概率分布列。表4.4種子發(fā)芽試驗的概率分布列xP(x=x)P(x≤x)0123451×0.90×0.155×0.91×0.1410×0.92×0.1310×0.93×0.125×0.94×0.111×0.95×0.110.000010.000450.008100.072900.328050.590490.000010.000460.008560.081460.409511.0000三、計算二項分布概率的方法[例4.4]在一批發(fā)芽率為32四、二項分布的形狀和參數(shù)圖4.5表示表4.4的概率分布列。這是一個偏態(tài)的概率分布,因為其p≠q且n較小。如果p=q則二項分布是對稱的,見圖4.6。理論分析和實踐結(jié)果都表明當(dāng)n很大時,即使p≠q的二項分布其圖形也接近對稱,見圖4.7。四、二項分布的形狀和參數(shù)33圖4.5表4.4的概率分布圖圖4.6p=q=0.5,n=5的二項分布圖示圖4.7p=0.4,q=0.6,n=20的二項分布圖示圖4.5表4.4的概率分布圖圖4.6p=q=0.5,34[例4.5]某玉米種子發(fā)芽率為0.6,今按設(shè)計株距穴播,若每穴播4粒,預(yù)計田間保苗率是多少?首先考慮,這里的田間保苗率實際上是每穴有種子發(fā)芽的概率,這是一個和事件,可計算為可知此時,田間預(yù)計保苗率為97.44%[例4.5]某玉米種子發(fā)芽率為0.6,今按設(shè)計株距穴播,若35〔例4.6〕在已往大規(guī)模田間播種作業(yè)中,已觀測到種子的出苗概率為0.6。①若每穴播10粒,試確定播種作業(yè)的穴粒數(shù)分布,②求出在此出苗概率(0.6)下,田間保苗率>95%的最少穴粒數(shù)。解:設(shè)出苗種子數(shù)X為隨機變量,服從二項分布。其概率函數(shù)為〔例4.6〕在已往大規(guī)模田間播種作業(yè)中,已觀測到種子的出苗概36表4.5田間播種作業(yè)穴粒數(shù)的概率函數(shù)和分布函數(shù)(×10-3)x012345f(x)0.10491.572910.61742.467111.48200.66F(x)0.10491.677812.29554.762166.24366.90x678910f(x)250.82214.99120.9340.3116.0466F(x)617.72832.71953.64993.951000表4.5田間播種作業(yè)穴粒數(shù)的概率函數(shù)和分布函數(shù)(×10-37圖4.8每穴出苗種子數(shù)的概率函數(shù)(二項分布)概率函數(shù)觀察值(x)圖4.8每穴出苗種子數(shù)的概率函數(shù)(二項分布)概率函數(shù)觀察38設(shè):田間保苗率大于95%時,最少穴粒數(shù)為每穴n粒。與上題相同,田間保苗率實際上是每穴有種子發(fā)芽的概率,因此:至少一粒種子出苗的概率如下:由此可見,穴粒數(shù)達4粒以上就可基本保證每穴必出苗,最佳穴粒數(shù)定為4。設(shè):田間保苗率大于95%時,最少穴粒數(shù)為每穴n粒。39五、泊松分布

當(dāng)n較大,p或q較小,np或nq≤5時,二項分布將為泊松分布(Poissondistribution)所接近。令

=np,則泊松分布的概率分布為記作X~p(

)。泊松分布的概率函數(shù)僅含一個參數(shù),意味著只要獲知

,概率函數(shù)就被完全確定。泊松分布的期望和方差相等且均為

,這是泊松分布所特有的性質(zhì)。如果試驗次數(shù)很大,某事件出現(xiàn)的次數(shù)很小,那么此事件的出現(xiàn)次數(shù)將服從泊松分布。

五、泊松分布當(dāng)n較大,p或q較小,np或nq≤5時,二項分40泊松分布的概率函數(shù)圖形見圖4.11。圖4.9泊松分布的概率函數(shù)l=0.5l=1.5l=2.5l=3.5泊松分布的概率函數(shù)圖形見圖4.11。l=0.5l=1.5l=41〔例4.11〕為考察果樹品種A和B的幼苗在某栽植地區(qū)的抗寒力及分布,設(shè)置200個面積相等且足夠大的抽樣小區(qū),觀測小區(qū)寒害株數(shù)(小區(qū)內(nèi)遭受寒害的株數(shù)),觀測結(jié)果為0,1,2,3,4和5。統(tǒng)計寒害株數(shù)相同的小區(qū)數(shù)(小區(qū)寒害次數(shù)),計算小區(qū)寒害率(小區(qū)寒害次數(shù)與觀測小區(qū)總數(shù)之比),結(jié)果見表4.6。試用泊松分布預(yù)測小區(qū)寒害率并與觀測結(jié)果比較,同時考察兩品種抗寒力的差異?!怖?.11〕為考察果樹品種A和B的幼苗在某栽植地區(qū)的抗寒力42表4.6兩果樹品種的小區(qū)寒害株數(shù)、次數(shù)和寒害率的觀測結(jié)果小區(qū)寒害株數(shù)觀察值x01234≥5品種A的小區(qū)寒害次數(shù)nA(x)285852341810品種A的小區(qū)寒害率fA(x)0.140.290.260.170.090.05品種B的小區(qū)寒害次數(shù)nB(x)42665026106品種B的小區(qū)寒害率fB(x)0.210.330.250.130.050.03表4.6兩果樹品種的小區(qū)寒害株數(shù)、次數(shù)和寒害率的觀測結(jié)果43品種A:品種B:

品種A的泊松分布概率函數(shù)品種B的泊松分布概率函數(shù)品種A:44圖4.10品種A小區(qū)寒害率的觀察值與泊松預(yù)測值圖4.10品種A小區(qū)寒害率的觀察值與泊松預(yù)測值45圖4.11品種B小區(qū)寒害率的觀察值與泊松預(yù)測值圖4.11品種B小區(qū)寒害率的觀察值與泊松預(yù)測值46一批種子中不合格種子占0.005,從中抽取800粒,試求其中不合格種子恰有10粒和不多于5粒的概率。因為n=800,p=0.005,np=4<5,所以可按泊松分布來計算。后者也可以在泊松分布累積函數(shù)表中查出。一批種子中不合格種子占0.005,從中抽取800粒,試求其中47第四節(jié)正態(tài)分布正態(tài)分布是田間試驗與統(tǒng)計分析中最重要的一種分布:①生物科學(xué)的許多隨機變量均服從正態(tài)分布,比如產(chǎn)量、株高、生物量等;②n趨于無窮大,任意分布平均數(shù)的分布均趨于正態(tài)分布,這意味著n足夠大時可用正態(tài)分布近似平均數(shù)的分布;③n趨于無窮大,二項分布、泊松分布等許多分布都趨于正態(tài)分布,這意味著n足夠大時可用正態(tài)分布近似這些分布;④三大抽樣分布t、c2和F均源于正態(tài)分布總體的抽樣,而它們又是形成統(tǒng)計方法的基礎(chǔ)。第四節(jié)正態(tài)分布正態(tài)分布是田間試驗與統(tǒng)計分析中最重要的一種48一、正態(tài)總體分布隨機變數(shù)X服從正態(tài)分布記為X~N(m,s2)s2)正態(tài)分布的概率密度函數(shù)為正態(tài)分布的概率累積函數(shù)為

一、正態(tài)總體分布隨機變數(shù)X服從正態(tài)分布記為X~N(m,s2)49二、正態(tài)分布曲線的性質(zhì)1、正態(tài)分布曲線以總體平均數(shù)

為中心,向左右兩側(cè)對稱分布。2、正態(tài)分布曲線是一單峰曲線,總體平均

對應(yīng)的概率密度最大,左右兩側(cè)離

越遠對應(yīng)的概率密度越小。3、總體平均數(shù)

決定曲線的中心位置,標準差

決定曲線的變化率。

不同的總體其正態(tài)分布曲線的位置和形狀各異,因此正態(tài)分布曲線是以參數(shù)

的不同而變化的曲線系統(tǒng)。4、正態(tài)分布曲線在

±1

處有拐點,兩尾向左右無限延伸,以橫軸為漸近線,全距為-∞至∞。5、無論

為多少,正態(tài)分布曲線與橫軸間的總面積都等于1,意為隨機變數(shù)X的取值位于-∞至∞之間的概率為1,即圖二、正態(tài)分布曲線的性質(zhì)1、正態(tài)分布曲線以總體平均數(shù)為中心,506、無論

為多少,隨機變數(shù)的取值落在任意區(qū)間(a,b)的概率為直線x=a和x=b與正態(tài)分布曲線和橫軸間的面積,即:表4.7幾個常見區(qū)間所對應(yīng)的概率x區(qū)間x-

u面積或概率

±1

±2

±3

±1.96

±2.58

±1

±2

±3

±1.96

±2.58

±1±2±3±1.96±2.580.68260.95450.99730.950.996、無論和為多少,隨機變數(shù)的取值落在任意區(qū)間(a,b)的51圖4.12正態(tài)概率密度曲線及隨的變化(固定)圖4.12正態(tài)概率密度曲線及隨的變化(固定)52圖4.13正態(tài)概率密度曲線及隨的變化(固定)返回性質(zhì)圖4.13正態(tài)概率密度曲線及隨的變化(固定)返回性質(zhì)53圖4.14正態(tài)分布曲線0.68260.95450.9973

-3

-2

-1

+1

+2

+3

Xf(x)0.40.30.20.1圖4.14正態(tài)分布曲線0.68260.95450.954正態(tài)分布的概率計算隨機變數(shù)X在(a,b)范圍內(nèi)的概率等于X在(a,b)范圍內(nèi)的定積分:計算曲線下從-∞到x的面積其式如下:FN(x)稱為正態(tài)分布的累積函數(shù)或分布函數(shù),具平均數(shù)

和標準差

,f(x)為概率密度函數(shù)。正態(tài)分布的概率計算隨機變數(shù)X在(a,b)范圍內(nèi)的概率等于X55P(X<a)=FN(a)P(a<X<b)=FN(b)-FN(a)P(a<X<b)=FN(b)-FN(a)abaP(x<a)=FN(a)P(X>a)=1-P(x<a)=1–FN(a)P(X<a)=FN(a)P(a<X<b)=FN(b)-56服從正態(tài)分布的隨機變數(shù)X都可通過標準化變換為正態(tài)離差u來計算其落于任意區(qū)間的概率??傮w平均數(shù)

=0,方差

=1的正態(tài)分布稱標準正態(tài)分布?!皹藴驶笔且砸粋€新變數(shù)U代替X。將X離其平均數(shù)

的差數(shù)以

為單位進行標準化。即U稱為正態(tài)離差,是一個服從標準正態(tài)分布的隨機變數(shù)。服從正態(tài)分布的隨機變數(shù)X都可通過標準化變換為正態(tài)離差u來計算57其概率密度函數(shù)為:具平均數(shù)

=0,方差

=1。記為U~N(0,1)附表1給出的正是標準正態(tài)分布的累積函數(shù)值從N(

2)到N(0,1),從幾何意義上說,僅是作了坐標軸平移和尺度單位的變換。它帶來的相應(yīng)改變是:分布中心從

處移到0處;尺度單位從x的單位變?yōu)闃藴什畹膯挝弧F涓怕拭芏群瘮?shù)為:58圖4.15a正態(tài)分布曲線圖μ+3σμ+2σμ+1σμμ+1σμ+2σμ+3σxu

3

2

1

0

123圖4.15b標準正態(tài)分布曲線圖圖4.15a正態(tài)分布曲線圖μ+3σμ+2σμ+159由對立事件概率之和P(X>x)+P(X≤x)=1得由對立事件概率之和P(X>x)+P(X≤x)=1得60得變量在任意區(qū)間(x1,x2)內(nèi)取值的概率如下〔例4.13〕設(shè)

U~N(0,1),試計算

P(U<–2.1)、P(U>1.38)、P(|U|<1)、P(|U|<2)、P(|U|<3)得變量在任意區(qū)間(x1,x2)內(nèi)取值的概率如下61由正態(tài)分布函數(shù)表(附表1)查得:

Φ(–2.1)=0.0179、Φ(1.38)=0.9162、Φ(1)=0.8413、Φ(-1)=0.1587、Φ(2)=0.9772、Φ(-2)=0.0228、Φ(3)=0.9987、Φ(-3)=0.0013P(U<–2.1)=Φ(–2.1)=0.0179P(U>1.38)=1–P(U≤1.38)=1–0.9162=0.0838

P(|U|<1)=P(-1<U≤

1)=Φ(1)–Φ(-1)=0.8413–0.1587=0.6826

P(|U|<2)=0.9545

P(|U|<3)=0.9973由正態(tài)分布函數(shù)表(附表1)查得:62圖4.16正態(tài)累積函數(shù)的圖示ui

Uf(u)f(u)0.4-3-2-10123

U圖4.17區(qū)間(-1,1)、(-2,2)和(-3,3)的概率圖示0.68260.95450.9973圖4.16正態(tài)累積函數(shù)的圖示uiUf63圖4.18標準正態(tài)分布的概率計算圖4.18標準正態(tài)分布的概率計算64〔例4.14〕設(shè)X~N(3,9),試計算P(X<–1.2)、P(X>7.53)、P(|X|<3.9)、P(|X|>3.9)由附表1查得:

Φ(–1.4)=0.0808、Φ(1.51)=0.9345、Φ(0.3)=0.6179、Φ(-2.3)=0.0107、〔例4.14〕設(shè)X~N(3,9),試計算P(X<–1.2)65圖4.19任意正態(tài)分布的概率計算圖4.19任意正態(tài)分布的概率計算66假定X是一個隨機變量,服從

=30,

=5的正態(tài)分布,即:X~N(30,25)。試求其取值小于26,大于40和介于26和40之間的概率。本例不是標準正態(tài)分布,須經(jīng)標準化后才能可求出落于各區(qū)間的概率。

查附表2:Φ(-0.8)=0.2119

假定X是一個隨機變量,服從=30,=5的正態(tài)分布,即:670.2119x2630u0.2119-0.800.2119x2630u0.2119-0.80680.022740x300.02272u00.022740x300.02272690.7654263040x0.7654-0.802u0.765426304070[例4.9]試求正態(tài)分布曲線對應(yīng)中間概率為0.95和兩尾概率為0.01時隨機變數(shù)X的取值區(qū)間。設(shè)對應(yīng)中間概率為0.95的取值區(qū)間為(x1,x2),即P(x1<X<x2)=0.95。經(jīng)標準化變換后[例4.9]試求正態(tài)分布曲線對應(yīng)中間概率為0.95和兩尾概率71查附表2,Φ(-1.96)=0.025,

Φ(1.96)=0.975,于是有u1=-1.96,u2=1.96,即P(-1.96<U<1.96)=0.95,或P(|U|<1.96)=0.95。也即P(

-1.96

<X<

+1.96

)=0.95,或P(|X-

|<1.96

)=0.95。查附表2,Φ(-1.96)=0.025,72附表1正態(tài)分布函數(shù)表ui-0.09-0.08-0.07-0.06-0.05-0.04-0.03-0.02-0.010.00-3.00.0013-2.90.00140.00140.00150.00150.00160.00160.00170.00180.00180.0019-2.50.00480.0049

0.00510.00520.00540.00550.00570.00590.00600.0062-1.90.02330.02390.02440.0250

0.02560.02620.02680.02740.02810.0287ui0.000.010.020.030.040.050.060.070.080.091.90.97130.97190.97260.97320.97380.97440.9750

0.97560.97610.97672.50.99380.99400.99410.99430.99450.99460.99480.99490.9951

0.9952附表1正態(tài)分布函數(shù)表ui-0.09-0.08-073同理可得Φ(-2.58)=0.005,

Φ(2.58)=0.995,于是有u1=-2.58,u2=2.58,即P(U<-2.58)+P(U>2.58)=0.01,或P(|U|>2.58)=0.01。也即P(X<

m-2.58s)+P(X>m+2.58s)=0.01,或P(|X-m|>2.58s)=0.01。同理可得Φ(-2.58)=0.005,74圖4.20中間概率和兩尾概率的圖示

中間概率P(-1.96<u<1.96)=0.95兩尾概率P(|u|>2.58)=0.01-1.9601.96-2.5802.58否定區(qū)接受區(qū)否定區(qū)否定區(qū)接受區(qū)否定區(qū)0.0250.0250.950.0050.0050.99uu圖4.20中間概率和兩尾概率的圖示

中間概率P75中間概率對應(yīng)的隨機變數(shù)的取值區(qū)間一般稱為接受區(qū),兩尾或一尾概率對應(yīng)的取值區(qū)間一般稱為否定區(qū),接受區(qū)與否定區(qū)的界限稱為臨界值。上述問題的實質(zhì)在于計算中間概率P(|U|<uα)為1-a或兩尾概率P(|U|>uα)為a時的臨界值,也可利用正態(tài)離差表(附表2)很方便地查到。例如,查附表2中當(dāng)a為0.05時,u0.05=1.959964,即表示P(|U|<1.959964)=0.95P(|U|>1.959964)=0.05;當(dāng)

為0.01時,u0.01=2.575829,表示P(|U|<2.575829)=0.99P(|U|>2.575829)=0.01。中間概率對應(yīng)的隨機變數(shù)的取值區(qū)間一般稱為接受區(qū),兩尾或一尾概76α0.010.020.030.040.050.060.070.080.090.100.002.5758292.3263482.1700902.0537491.9599641.8807941.8119111.7506861.6953981.6448540.101.5981931.5547741.5141021.4757911.4395311.4050721.3722041.3407551.3105791.2815520.201.2535651.2265281.2003591.1749871.1503491.1263911.1030631.0803191.0581221.0364330.301.0152220.9944580.9741140.9541650.9345890.9153650.8964730.8778960.8596170.8416210.400.8238940.8064210.7891920.7721930.7554150.7388470.7224790.7063030.6903090.6744900.500.6588380.6433450.6280060.6128130.5977600.5828420.5680510.5533850.5388360.5244010.600.5100730.4958500.4817270.4676990.4537620.4399130.4261480.4124630.3988550.3853200.700.3718560.3584590.3451260.3318530.3186390.3054810.2923750.2793190.2663110.2533470.800.2404260.2275450.2147020.2018930.1891180.1763740.1636580.1509690.1383040.1256610.900.1130390.1004340.0878450.0752700.0627070.0501540.0376080.0250690.0125330.000000附表2正態(tài)分布兩尾臨界值表α0.010.020.030.040.050.060.07077一尾的u

值等于附表3中兩尾u2

的值。一尾的u

=兩尾的u2

例如,一尾概率為0.05時,u0.05等于附表2中兩尾的u0.10=1.644854;一尾概率為0.01時,u0.01等于附表2中兩尾的u0.02=2.326348。一尾的u值等于附表3中兩尾u2的值。78第五節(jié)抽樣分布一、總體與樣本的關(guān)系:第一個方向是從總體到樣本––從一般到特殊其目的是研究從總體中抽出的所有可能樣本統(tǒng)計量的分布及其與原總體的關(guān)系。

第二個方向是從樣本到總體––從特殊到一般

用樣本對總體參數(shù)作出推斷。

第五節(jié)抽樣分布一、總體與樣本的關(guān)系:791、樣本平均數(shù)分布的平均數(shù)等于總體平均數(shù)二、2、樣本平均數(shù)分布的方差等于總體方差除以樣本容量。進而有:1、樣本平均數(shù)分布的平均數(shù)等于總體平均數(shù)二、2、樣本平均數(shù)分803、從具有總體平均數(shù)

,總體方差σ2的正態(tài)分布總體抽樣,無論樣本容量大或小,其樣本平均數(shù)的抽樣分布必做正態(tài)分布,具有4、從具有總體平均數(shù)

,總體方差σ2的任一總體抽樣,不管其是否服從正態(tài)分布,樣本容量增大時,樣本統(tǒng)計數(shù)的分布將趨近于正態(tài)分布––中心極限定理

3、從具有總體平均數(shù),總體方差σ2的正態(tài)分布總體抽樣,81第四章概率分布《試驗設(shè)計與統(tǒng)計分析》課件822,4,62,4,683s02是直接用n計算的方差,s2是用自由度計算的方差樣本號觀察值s02s2s12242000.000022463121.414232684482.828444263121.414254484000.0000646105121.414276284482.8284864105121.4142966126000.0000總和7236122411.3136s02是直接用n計算的方差,s2是用自由度計算的方差樣本號842,4,62266242642444264662,4,6226624264244426466850.000.050.100.150.200.250.30-3-2-1-01234567891011例如:X~N(4,4),若以n=2進行抽樣,則0.000.050.100.150.200.250.30-3-2101234567891011μ=4

X

0.000.050.100.150.200.250.30-386[例]從N(3,0.7072)總體中,以n=4抽樣,試求:[例]從N(3,0.7072)總體中,以n=4抽樣,試求:87三1、樣本總和數(shù)分布的平均數(shù)等于總體平均數(shù)的n倍2、樣本總和數(shù)分布的方差等于總體方差的n倍三1、樣本總和數(shù)分布的平均數(shù)等于總體平均數(shù)的n倍88第四章概率分布《試驗設(shè)計與統(tǒng)計分析》課件890.000.050.100.150.200.250.300.000.050.100.150.200.250.30-4

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負責(zé)。
  • 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔(dān)用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

最新文檔

評論

0/150

提交評論