統(tǒng)計學(xué)概率和分布_第1頁
統(tǒng)計學(xué)概率和分布_第2頁
統(tǒng)計學(xué)概率和分布_第3頁
統(tǒng)計學(xué)概率和分布_第4頁
統(tǒng)計學(xué)概率和分布_第5頁
已閱讀5頁,還剩83頁未讀, 繼續(xù)免費閱讀

下載本文檔

版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進(jìn)行舉報或認(rèn)領(lǐng)

文檔簡介

統(tǒng)計學(xué)概率和分布第1頁,共88頁,2023年,2月20日,星期六概率是0和1之間的一個數(shù)目,表示某個事件發(fā)生的可能性或經(jīng)常程度。你買彩票中大獎的機(jī)會很小(接近0)但有人中大獎的概率幾乎為1你被流星擊中的概率很小(接近0)但每分鐘有流星擊中地球的概率為1你今天被汽車撞上的概率幾乎是0但在北京每天發(fā)生車禍的概率是1。第2頁,共88頁,2023年,2月20日,星期六發(fā)生概率很小的事件稱為小概率事件(smallprobabilityevent);小概率事件不那么可能發(fā)生,但它往往比很可能發(fā)生的事件更值得研究。在某種意義上,新聞媒體的主要注意力大都集中在小概率事件上。第3頁,共88頁,2023年,2月20日,星期六§4.1得到概率的幾種途徑1.利用等可能事件如果一個骰子是公平的,那么擲一次骰子會以等可能(概率1/6,6種可能之一)得到1至6點的中的每一個點。拋一個公平的硬幣,則以等可能(概率1/2)出現(xiàn)正面或反面。第4頁,共88頁,2023年,2月20日,星期六§4.1得到概率的幾種途徑再如從52張牌中隨機(jī)抽取一張,那么它是黑桃的概率為抽取黑桃的可能(k=13)和總可能性(n=52)之比,即k/n=13/52=1/4;類似地抽到的牌是J、Q、K、A四種(共有16種可能)的概率是16/52=4/13。第5頁,共88頁,2023年,2月20日,星期六§4.1得到概率的幾種途徑其實即使沒有學(xué)過概率,讀者也多半能夠算出這些概率。計算這些概率的基礎(chǔ)就是事先知道(或者假設(shè))某些事件是等可能的。這種事件為等可能事件(equallylikelyevent)。第6頁,共88頁,2023年,2月20日,星期六§4.1得到概率的幾種途徑2.根據(jù)長期相對頻數(shù)事件并不一定是等可能的,或者人們對于其出現(xiàn)的可能性一無所知。這時就要靠觀察它在大量重復(fù)試驗中出現(xiàn)的頻率來估計它出現(xiàn)的概率。它約等于事件出現(xiàn)的頻數(shù)k除以重復(fù)試驗的次數(shù)n,該比值k/n稱為相對頻數(shù)(relativefrequency)或頻率。第7頁,共88頁,2023年,2月20日,星期六§4.1得到概率的幾種途徑例如,刮發(fā)票的中獎密封時,大多得到“謝謝”。如果你刮了150張發(fā)票,只有3張中獎,你會認(rèn)為,你的中獎概率大約是3/150=0.02如果一個學(xué)生在200次上課時,無故曠課10次,那么其曠課的概率可能被認(rèn)為接近10/200=0.05第8頁,共88頁,2023年,2月20日,星期六§4.1得到概率的幾種途徑試驗次數(shù)n越大則該值越接近于想得到的概率。很多事件無法進(jìn)行長期重復(fù)試驗。因此這種通過相對頻數(shù)獲得概率的方法也并不是萬能的。雖然如此,用相對頻數(shù)來確定概率的方法是很常用的。你們可以舉出無數(shù)類似的例子第9頁,共88頁,2023年,2月20日,星期六§4.1得到概率的幾種途徑3.主觀概率一些概率既不能由等可能性來計算,也不可能從試驗得出。比如,你今年想學(xué)開車概率、你五年內(nèi)去歐洲旅游的概率等這種概率稱為主觀概率(subjectiveprobability)。可以說,主觀概率是一次事件的概率?;驗榛谒莆盏男畔?,某人對某事件發(fā)生的自信程度。第10頁,共88頁,2023年,2月20日,星期六§4.2概率的運算

在擲骰子中,得到6點的概率是1/6,而得到5點的概率也是1/6。那么擲一次骰子得到5或者6的概率是多少呢?在擲10次骰子中有一半或以上的次數(shù)得到5或6的概率又是多少呢?讀者很快就可能很快會得到答案。但再復(fù)雜一些,也許就不簡單了。第11頁,共88頁,2023年,2月20日,星期六§4.2概率的運算

我們需要了解怎樣從簡單的情況計算稍微復(fù)雜情況時的概率。需要讀者回憶一下上中學(xué)時學(xué)過的集合概念,比如兩個集合的交和并,互余(互補(bǔ))等概念。在概率論中所說的事件(event)相當(dāng)于集合論中的集合(set)。而概率則是事件的某種函數(shù)。為什么會這么說呢,讓我們看擲兩個骰子的試驗。第12頁,共88頁,2023年,2月20日,星期六§4.2概率的運算

如所關(guān)心的是兩骰子點數(shù)之和,則下表包含了所有36種可能試驗結(jié)果的搭配和相應(yīng)的點數(shù)和。第13頁,共88頁,2023年,2月20日,星期六可以看出,如果我們考慮點數(shù)和等于2的事件,則僅有一種可能的試驗結(jié)果(兩個骰子均為一點);而如果我們考慮點數(shù)和等于7的事件,則有六種可能的試驗結(jié)果。兩個骰子點數(shù)之和總共有2至12等11種可能,即有11種可能的事件,而這11種事件相應(yīng)于上面所說的36種可能的試驗結(jié)果的一些集合。這些事件和試驗結(jié)果的集合歸納在下面表中:第14頁,共88頁,2023年,2月20日,星期六§4.2概率的運算:1.互補(bǔ)事件的概率如果今天下雨的概率是10%,則今天不下雨的概率就是90%。如果你中獎的概率是0.0001,那么不中獎的概率就是1-0.0001=0.9999。這種如果一個不出現(xiàn),則另一個肯定出現(xiàn)的兩個事件稱為互補(bǔ)事件(complementaryevents,或者互余事件或?qū)α⑹录?。?5頁,共88頁,2023年,2月20日,星期六§4.2概率的運算:1.互補(bǔ)事件的概率按照集合的記號,如果一個事件記為A,那么另一個記為AC(稱為A的余集或補(bǔ)集)。顯然互補(bǔ)事件的概率之和為1,即P(A)+P(AC)=1,或者P(AC)=1-P(A)。在西方賭博時常常愛用優(yōu)勢或賠率(odds)來形容輸贏的可能。它是互補(bǔ)事件概率之比,即P(A)/P(AC)=P(A)/[1-P(A)]來表示。第16頁,共88頁,2023年,2月20日,星期六§4.2概率的運算:2.概率的加法如果兩個事件不可能同時發(fā)生,那么至少其中之一發(fā)生的概率為這兩個概率的和。比如“擲一次骰子得到3或者6點”的概率是“得到3點”的概率與“得到6點”的概率之和,即1/6+1/6=1/3。但是如果兩個事件可能同時發(fā)生時這樣做就不對了。第17頁,共88頁,2023年,2月20日,星期六§4.2概率的運算:2.概率的加法假定擲骰子時,一個事件A為“得到偶數(shù)點”(有3種可能:2、4、6點),另一個事件B為“得到大于或等于3點”(有4種可能:3、4、5、6點);這樣,事件A的概率顯然等于3/6=1/2,即P(A)=1/2。而事件B的概率為P(B)=4/6=2/3。但是,“得到大于或等于3點或者偶數(shù)點”的事件的概率就不是P(A)+P(B)=1/2+2/3=7/6了;第18頁,共88頁,2023年,2月20日,星期六§4.2概率的運算:2.概率的加法這顯然多出來了。概率怎么能夠大于1呢?按照中學(xué)時關(guān)于集合的記號,該事件稱為A和B的并,記為A∪B。剛才多出來的部分就是A和B的共同部分A∩B(稱為A和B的交)的概率(這個概率算了兩遍);它為“得到既是偶數(shù),又大于等于3”的部分,即4和6兩點。出現(xiàn)事件4或者6的概率為1/6+1/6=1/3。第19頁,共88頁,2023年,2月20日,星期六§4.2概率的運算:2.概率的加法于是應(yīng)該把算重了的概率減去。這樣“得到大于或等于3點或者偶數(shù)點”的事件A∪B的概率就是P(A∪B)=P(A)+P(B)-P(A∩B)=1/2+2/3-1/3=5/6。這種P(A∪B)=P(A)+P(B)-P(A∩B)的公式也適用于兩個不可能同時發(fā)生的事件;但因為那時P(A∩B)=0,所以只剩下P(A∪B)=P(A)+P(B)了。第20頁,共88頁,2023年,2月20日,星期六§4.2概率的運算:2.概率的加法這種交等于空集(A∩B=F,這里F表示空集或空事件)的事件為兩個不可能同時發(fā)生的事件,稱為互不相容事件(mutuallyexclusiveevents)。第21頁,共88頁,2023年,2月20日,星期六§4.2概率的運算:3.概率的乘法如果你有一個固定電話和一個手機(jī),假定固定電話出毛病的概率為0.01,而手機(jī)出問題的概率為0.05,那么,兩個電話同時出毛病的概率是多少呢?聰明的讀者馬上會猜出,是0.01×0.05=0.0005。但是這種乘法法則,即P(A∩B)=P(A)P(B),僅僅在兩個事件獨立(independent)時才成立。第22頁,共88頁,2023年,2月20日,星期六§4.2概率的運算:3.概率的乘法如果事件不獨立則需要引進(jìn)條件概率(conditionalprobability)。比如三個人抽簽,而只有一個人能夠抽中,因此每個人抽中的機(jī)會是1/3。假定用A1、A2和A3分別代表這三個人抽中的事件,那么,P(A1)=P(A2)=P(A3)=1/3。第23頁,共88頁,2023年,2月20日,星期六§4.2概率的運算:3.概率的乘法但是由于一個人抽中,其他人就不可能抽中,所以,這三個事件不獨立。剛才的乘法規(guī)則不成立;這時,P(A1∩A3)=P(A1∩A2)=P(A2∩A3)=0;如錯誤照搬乘法規(guī)則會得到錯誤的(1/3)2=1/9。第24頁,共88頁,2023年,2月20日,星期六§4.2概率的運算:3.概率的乘法但是可以計算條件概率,比如第一個人抽到(事件A1),則在這個條件下其他兩個人抽到的概率都為0;記為P(A2|A1)=P(A3|A1)=0。如第一個人沒有抽到(事件A1C),那么其他兩人抽到的概率均為1/2,記為P(A2|A1C)=P(A3|A1C)=1/2。第25頁,共88頁,2023年,2月20日,星期六§4.2概率的運算:3.概率的乘法一般地,在一個事件B已經(jīng)發(fā)生的情況下,事件A發(fā)生的條件概率定義為(貝葉斯公式)第26頁,共88頁,2023年,2月20日,星期六離散型隨機(jī)變量與連續(xù)型隨機(jī)變量第四章概率與概率分布試驗隨機(jī)變量可能的取值抽查100個產(chǎn)品取到次品的個數(shù)0,1,2,…,100一家餐館營業(yè)一天顧客數(shù)0,1,2,…抽查一批電子原件使用壽命X0新建一座住宅樓半年完成工程的百分比0X100第27頁,共88頁,2023年,2月20日,星期六分布隨機(jī)變量取一切可能值或范圍的概率或概率的規(guī)律稱為概率分布(probabilitydistribution,簡稱分布)。概率分布可以用各種圖或表來表示;一些可以用公式來表示。概率分布是關(guān)于總體的概念。有了概率分布就等于知道了總體。第28頁,共88頁,2023年,2月20日,星期六分布前面介紹過的樣本均值、樣本標(biāo)準(zhǔn)差和樣本方差等樣本特征的概念是相應(yīng)的總體特征的反映。我們也有描述變量“位置”的總體均值、總體中位數(shù)、總體百分位數(shù)以及描述變量分散(集中)程度的總體標(biāo)準(zhǔn)差和總體方差等概念。第29頁,共88頁,2023年,2月20日,星期六§4.3離散變量的分布離散變量只取離散的值,比如骰子的點數(shù)、網(wǎng)站點擊數(shù)、顧客人數(shù)等等。每一種取值都有某種概率。各種取值點的概率總和應(yīng)該是1。當(dāng)然離散變量不不僅僅限于取非負(fù)整數(shù)值。一般來說,某離散隨機(jī)變量的每一個可能取值xi都相應(yīng)于取該值的概率p(xi),這些概率應(yīng)該滿足關(guān)系第30頁,共88頁,2023年,2月20日,星期六§4.3.1二項分布最簡單的離散分布應(yīng)該是基于可重復(fù)的有兩結(jié)果(比如成功和失?。┑南嗤毩⒃囼灒看卧囼灣晒Ω怕氏嗤┑姆植迹鐠佊矌?。比如用p代表得到硬幣正面的概率,那么1-p則是得到反面的概率。如果知道p,這個拋硬幣的試驗的概率分布也就都知道了。第31頁,共88頁,2023年,2月20日,星期六§4.3.1二項分布這種有兩個可能結(jié)果的試驗有兩個特點:一是各次試驗互相獨立,二是每次試驗得到一種結(jié)果的概率不變(這里是得到正面的概率總是p)。類似于拋硬幣的僅有兩種結(jié)果的重復(fù)獨立試驗被稱為Bernoulli試驗(Bernoullitrials)。第32頁,共88頁,2023年,2月20日,星期六§4.3.1二項分布下面試驗可看成為Bernoulli試驗:每一個進(jìn)入某商場的顧客是否購買某商品每個被調(diào)查者是否認(rèn)可某種產(chǎn)品每一個新出嬰兒的性別。根據(jù)這種簡單試驗的分布,可以得到基于這個試驗的更加復(fù)雜事件的概率。第33頁,共88頁,2023年,2月20日,星期六§4.3.1二項分布為了方便,人們通常稱Bernoulli試驗的兩種結(jié)果為“成功”和“失敗”。和Bernoulli試驗相關(guān)的最常見的問題是:如果進(jìn)行n次Bernoulli試驗,每次成功的概率為p,那么成功k次的概率是多少?這個概率的分布就是所謂的二項分布(binomialdistribution)。第34頁,共88頁,2023年,2月20日,星期六§4.3.1二項分布這個分布有兩個參數(shù),一個是試驗次數(shù)n,另一個是每次試驗成功的概率p。基于此,二項分布用符號B(n,p)或Bin(n,p)表示。由于n和p可以根據(jù)實際情況取各種不同的值,因此二項分布是一族分布,族內(nèi)的分布以這兩個參數(shù)來區(qū)分。第35頁,共88頁,2023年,2月20日,星期六§4.3.1二項分布二項分布的概率通常用二項分布表來查出。但一般統(tǒng)計軟件可以很容易得到這個概率。在目前統(tǒng)計軟件發(fā)達(dá)的情況下,涉及的二項分布一般都自動處理了;在處理實際問題中很少會遇到直接計算二項分布概率的情況。第36頁,共88頁,2023年,2月20日,星期六§4.3.1二項分布但這里還是給出其一般公式。下面p(k)代表在n次Bernoulli試驗中成功的次數(shù)的概率,p為每次試驗成功的概率。有這里為二項式系數(shù),或記為第37頁,共88頁,2023年,2月20日,星期六圖4.1九個二項分布B(5,p)(p=0.1到0.9)的概率分布圖第38頁,共88頁,2023年,2月20日,星期六§4.3.3Poisson分布另一個常用離散分布是Poisson分布(翻譯成“泊松分布”或“普阿松分布”)。它可以認(rèn)為是衡量某種事件在一定期間出現(xiàn)的數(shù)目的概率。比如說在一定時間內(nèi)顧客的人數(shù)、打入電話總機(jī)電話的個數(shù)、放射性物質(zhì)放射出來并到達(dá)某區(qū)域的粒子數(shù)等等。第39頁,共88頁,2023年,2月20日,星期六§4.3.3Poisson分布在不同條件下,同樣事件在單位時間中出現(xiàn)同等數(shù)目的概率不盡相同。比如中午和晚上某商店在10分鐘內(nèi)出現(xiàn)5個顧客的概率就不一定相同。因此,Poisson分布也是一個分布族。族中不同成員的區(qū)別在于事件出現(xiàn)數(shù)目的均值l不一樣。第40頁,共88頁,2023年,2月20日,星期六§4.3.3Poisson分布參數(shù)為l的Poisson分布變量的概率分布為(p(k)表示Poisson變量等于k的概率)第41頁,共88頁,2023年,2月20日,星期六參數(shù)為3、6、10的Poisson分布(只標(biāo)出了20之內(nèi)的部分)

這里點間的連線沒有意義,僅僅為讀者容易識別而畫,因為Poisson變量僅取非負(fù)整數(shù)值第42頁,共88頁,2023年,2月20日,星期六§4.3.4超幾何分布假定有一批500個產(chǎn)品,而其中有5個次品。假定該產(chǎn)品的質(zhì)量檢查采取隨機(jī)抽取20個產(chǎn)品進(jìn)行檢查。如果抽到的20個產(chǎn)品中含有2個或更多不合格產(chǎn)品,則整個500個產(chǎn)品將會被退回。這時,人們想知道,該批產(chǎn)品被退回的概率是多少?這種概率就滿足超幾何分布(hypergeometricdistribution)。第43頁,共88頁,2023年,2月20日,星期六§4.3.4超幾何分布這是一種所謂的“不放回抽樣”,也就是說,一次抽取若干物品,每檢查一個之后并不放回;超幾何分布族的成員被三個參數(shù)決定,這里相應(yīng)于產(chǎn)品總個數(shù)n,其中不合格產(chǎn)品數(shù)目m,不放回抽樣的數(shù)目t;而樣本中有x個不合格產(chǎn)品的概率為第44頁,共88頁,2023年,2月20日,星期六離散型隨機(jī)變量的數(shù)學(xué)期望和方差第45頁,共88頁,2023年,2月20日,星期六離散型隨機(jī)變量的數(shù)學(xué)期望

(expectedvalue)離散型隨機(jī)變量X的所有可能取值xi與其取相對應(yīng)的概率pi乘積之和描述離散型隨機(jī)變量取值的集中程度記為或E(X)計算公式為第46頁,共88頁,2023年,2月20日,星期六離散型隨機(jī)變量的方差

(variance)隨機(jī)變量X的每一個取值與期望值的離差平方和的數(shù)學(xué)期望,記為2

或D(X)描述離散型隨機(jī)變量取值的分散程度計算公式為方差的平方根稱為標(biāo)準(zhǔn)差,記為或第47頁,共88頁,2023年,2月20日,星期六離散型數(shù)學(xué)期望和方差

(例題分析)【例】一家電腦配件供應(yīng)商聲稱,他所提供的配件100個中擁有次品的個數(shù)及概率如下表次品數(shù)X=xi0123概率P(X=xi)pi0.750.120.080.05每100個配件中的次品數(shù)及概率分布求該供應(yīng)商次品數(shù)的數(shù)學(xué)期望和標(biāo)準(zhǔn)差

第48頁,共88頁,2023年,2月20日,星期六§4.4連續(xù)變量的分布取連續(xù)值的變量,如高度、長度、重量、時間、距離等等;它們被稱為連續(xù)變量(continuousvariable)。換言之,一個隨機(jī)變量如果能夠在一區(qū)間(無論這個區(qū)間多么?。﹥?nèi)取任何值,則該變量稱為在此區(qū)間內(nèi)是連續(xù)的,其分布稱為連續(xù)型概率分布。它們的概率分布很難準(zhǔn)確地用離散變量概率的條形圖表示。第49頁,共88頁,2023年,2月20日,星期六§4.4連續(xù)變量的分布想象連續(xù)變量觀測值的直方圖;如果其縱坐標(biāo)為相對頻數(shù),那么所有這些矩形條的高度和為1;完全可以重新設(shè)置量綱,使得這些矩形條的面積和為1。不斷增加觀測值及直方圖的矩形條的數(shù)目,直方圖就會越來越像一條光滑曲線,其下面的面積和為1。該曲線即所謂概率密度函數(shù)(probabilitydensityfunction,pdf),簡稱密度函數(shù)或密度。下圖為這樣形成的密度曲線。第50頁,共88頁,2023年,2月20日,星期六逐漸增加矩形條數(shù)目的直方圖和一個形狀類似的密度曲線。

第51頁,共88頁,2023年,2月20日,星期六§4.4連續(xù)變量的分布連續(xù)變量落入某個區(qū)間的概率就是概率密度函數(shù)的曲線在這個區(qū)間上所覆蓋的面積;因此,理論上,這個概率就是密度函數(shù)在這個區(qū)間上的積分。對于連續(xù)變量,取某個特定值的概率都是零,而只有變量取值于某個(或若干個)區(qū)間的概率才可能大于0。連續(xù)變量密度函數(shù)曲線(這里用f表示)下面覆蓋的總面積為1,即第52頁,共88頁,2023年,2月20日,星期六§4.4.1正態(tài)分布在北京市場上的精制鹽很多是一公斤袋裝,上面標(biāo)有“凈含量1kg”的字樣。但當(dāng)你用稍微精確一些的天平稱那些袋裝鹽的重量時,會發(fā)現(xiàn)有些可能會重些,有些可能會輕些;但都是在1kg左右。多數(shù)離1kg不遠(yuǎn),離1kg越近就越可能出現(xiàn),離1kg越遠(yuǎn)就越不可能。一般認(rèn)為這種重量分布近似地服從最常用的正態(tài)分布(normaldistribution,又叫高斯分布,Gaussiandistribution)。第53頁,共88頁,2023年,2月20日,星期六§4.4.1正態(tài)分布近似地服從正態(tài)分布的變量很常見,象測量誤差、商品的重量或尺寸、某年齡人群的身高和體重等等。在一定條件下,許多不是正態(tài)分布的樣本均值在樣本量很大時,也可用正態(tài)分布來近似。第54頁,共88頁,2023年,2月20日,星期六§4.4.1正態(tài)分布正態(tài)分布的密度曲線是一個對稱的鐘型曲線(最高點在均值處)。正態(tài)分布也是一族分布,各種正態(tài)分布根據(jù)它們的均值和標(biāo)準(zhǔn)差不同而有區(qū)別。一個正態(tài)分布用N(m,s)表示;其中m為均值,而s為標(biāo)準(zhǔn)差。也常用N(m,s2)來表示,這里s2為方差(標(biāo)準(zhǔn)差的平方)。第55頁,共88頁,2023年,2月20日,星期六§4.4.1正態(tài)分布標(biāo)準(zhǔn)差為1的正態(tài)分布N(0,1)稱為標(biāo)準(zhǔn)正態(tài)分布(standardnormaldistribution)。標(biāo)準(zhǔn)正態(tài)分布的密度函數(shù)用f(x)表示。任何具有正態(tài)分布N(m,s)的隨機(jī)變量X都可以用簡單的變換(減去其均值m,再除以標(biāo)準(zhǔn)差s):Z=(X-m)/s,而成為標(biāo)準(zhǔn)正態(tài)隨機(jī)變量。這種變換和標(biāo)準(zhǔn)得分的意義類似。第56頁,共88頁,2023年,2月20日,星期六兩條正態(tài)分布的密度曲線。左邊是N(-2,0.5)分布,右邊是N(0,1)分布

第57頁,共88頁,2023年,2月20日,星期六§4.4.1正態(tài)分布當(dāng)然,和所有連續(xù)變量一樣,正態(tài)變量落在某個區(qū)間的概率就等于在這個區(qū)間上,密度曲線下面的面積。比如,標(biāo)準(zhǔn)正態(tài)分布變量落在區(qū)間(0.51,1.57)中的概率,就是在標(biāo)準(zhǔn)正態(tài)密度曲線下面在0.51和1.57之間的面積。很容易得到這個面積等于0.24682;也就是說,標(biāo)準(zhǔn)正態(tài)變量在區(qū)間(0.51,1.57)中的概率等于0.24682。如果密度函數(shù)為f(x),那么這個面積為積分第58頁,共88頁,2023年,2月20日,星期六標(biāo)準(zhǔn)正態(tài)變量在區(qū)間(0.51,1.57)中的概率第59頁,共88頁,2023年,2月20日,星期六§4.4.1正態(tài)分布我們有必要引進(jìn)總體的下側(cè)分位數(shù)、上側(cè)分位數(shù)以及相應(yīng)的尾概率的概念。對于連續(xù)型隨機(jī)變量X,a下側(cè)分位數(shù)(又稱為a分位數(shù),a-quantile)定義為數(shù)xa,它滿足關(guān)系這里的a又稱為下(左)側(cè)尾概率(lower/lefttailprobability)第60頁,共88頁,2023年,2月20日,星期六§4.4.1正態(tài)分布而a上側(cè)分位數(shù)(又稱a上分位數(shù),a-upperquantile)定義為數(shù)xa,它滿足關(guān)系這里的a也稱為上(右)側(cè)尾概率(upper/righttailprobability)。第61頁,共88頁,2023年,2月20日,星期六§4.4.1正態(tài)分布對于非連續(xù)型的分布,分位數(shù)的定義稍微復(fù)雜一些;顯然,對于連續(xù)分布,a上側(cè)分位數(shù)等于(1-a)下側(cè)分位數(shù),而(1-a)下側(cè)分位數(shù)等于a上側(cè)分位數(shù)。第62頁,共88頁,2023年,2月20日,星期六§4.4.1正態(tài)分布通常用za表示標(biāo)準(zhǔn)正態(tài)分布的a上側(cè)分位數(shù),即對于標(biāo)準(zhǔn)正態(tài)分布變量Z,有P(Z>za)=a。圖4.6表示了0.05上側(cè)分位數(shù)za=z0.05及相應(yīng)的尾概率(a=0.05)。有些書用符號z1-a而不是za;因此在看參考文獻(xiàn)時要注意符號的定義。第63頁,共88頁,2023年,2月20日,星期六N(0,1)分布右側(cè)尾概率P(z>za)=a的示意圖第64頁,共88頁,2023年,2月20日,星期六§4.4.2c2-分布一個由正態(tài)變量導(dǎo)出的分布是c2-分布(chi-squaredistribution,也翻譯為卡方分布)。該分布在一些檢驗中會用到。n個獨立正態(tài)變量平方和稱為有n個自由度的c2-分布,記為c2(n)。c2-分布為一族分布,成員由自由度區(qū)分。由于c2-分布變量為正態(tài)變量的平方和,它不會取負(fù)值。第65頁,共88頁,2023年,2月20日,星期六自由度為2、3、5的c2-分布密度曲線圖第66頁,共88頁,2023年,2月20日,星期六§4.4.3t-分布正態(tài)變量的樣本均值也是正態(tài)變量,能利用減去其均值再除以其(總體)標(biāo)準(zhǔn)差來得到標(biāo)準(zhǔn)正態(tài)變量。但用樣本標(biāo)準(zhǔn)差來代替未知的總體標(biāo)準(zhǔn)差時,得到的結(jié)果分布就不再是標(biāo)準(zhǔn)正態(tài)分布了。它的密度曲線看上去有些象標(biāo)準(zhǔn)正態(tài)分布,但是中間瘦一些,而且尾巴長一些。這種分布稱為t-分布(t-distribution,或?qū)W生分布,Student’st)。第67頁,共88頁,2023年,2月20日,星期六§4.4.3t-分布不同的樣本量通過標(biāo)準(zhǔn)化所產(chǎn)生的t分布也不同,這樣就形成一族分布。t分布族中的成員是以自由度來區(qū)分的。這里的自由度等于樣本量減去1(如果樣本量為n,剛才定義的t分布的自由度為n-1)。由于產(chǎn)生t分布的方式很多,簡單說自由度就是樣本量減1是不準(zhǔn)確的。自由度甚至不一定是整數(shù)。第68頁,共88頁,2023年,2月20日,星期六標(biāo)準(zhǔn)正態(tài)分布和t(1)分布的密度圖

第69頁,共88頁,2023年,2月20日,星期六§4.4.3t-分布通常用ta表示t分布相應(yīng)于右側(cè)尾概率a的t變量的a上側(cè)分位數(shù),即對于t分布變量T,有P(T>ta)=a。在突出自由度時,也用tn,a,也有用t1-a或tn,1-a表示的。圖4.9表示了自由度為2的t(2)分布右邊的尾概率(a=0.05)。第70頁,共88頁,2023年,2月20日,星期六t(2)分布右側(cè)尾概率P(t>ta)=a的示意圖第71頁,共88頁,2023年,2月20日,星期六§4.4.4F-分布F-分布變量為兩個c2-分布變量(在除以它們各自自由度之后)的比;而兩個c2-分布的自由度則為F-分布的自由度,因此,F(xiàn)-分布有兩個自由度;第一個自由度等于在分子上的c2-分布的自由度,第二個自由度等于在分母的c2-分布的自由度。第72頁,共88頁,2023年,2月20日,星期六自由度為(3,20)和(50,20)的F-分布密度曲線圖

第73頁,共88頁,2023年,2月20日,星期六§4.5累積分布函數(shù)在前面離散分布的情況可以用p(x)表示該變量取值x的概率,如果用大寫英文字母X表示相應(yīng)的隨機(jī)變量,那么概率P(X=x)=p(x)。而第74頁,共88頁,2023年,2月20日,星期六§4.5累積分布函數(shù)在連續(xù)分布的情況,可以用f(x)表示密度函數(shù),則概率(注意在連續(xù)分布中,某單獨點的概率為0,因此下式中的不等式中的等式可以去掉)第75頁,共88頁,2023年,2月20日,星期六§4.5累積分布函數(shù)為了計算概率,只知道密度函數(shù)對于查表或應(yīng)用軟件來得到已知分布的概率是不方便的,最好能夠知道隨機(jī)變量小于或等于某值的概率。在上面公式中,如果知道了下面的值就可以計算所需的概率了(統(tǒng)計書中的多數(shù)分布表的概率是以下面累積分布函數(shù)的形式給出的):第76頁,共88頁,2023年,2月20日,星期六§4.5累積分布函數(shù)隨機(jī)變量小于或等于某個數(shù)值的概率就稱為累積分布函數(shù)(cumulativedistributionfunction,簡稱cdf)或分布函數(shù)。累積分布函數(shù)概念的引進(jìn),對于查表或使用軟件得到概率(根據(jù)上面兩個公式)是很方便的。多數(shù)概率分布表都是以累積分布函數(shù)的形式出現(xiàn)的。在后面介紹軟件時,還要舉例說明如何利用累積分布函數(shù)。第77頁,共88頁,2023年,2月20日,星期六§4.6用小概率事件進(jìn)行判斷判明一個事情的真?zhèn)危枰檬聦嵳f話。在統(tǒng)計中事實總是來源于數(shù)據(jù)。假定某藥廠聲稱該廠生產(chǎn)的某種藥品有60%的療效。但是當(dāng)實際調(diào)查了100名使用該藥物的患者之后,發(fā)現(xiàn)有40名患者服后有效。這個數(shù)據(jù)是否支持藥廠的說法呢?

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負(fù)責(zé)。
  • 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時也不承擔(dān)用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

評論

0/150

提交評論