5.概率與概率分布_第1頁
5.概率與概率分布_第2頁
5.概率與概率分布_第3頁
5.概率與概率分布_第4頁
5.概率與概率分布_第5頁
已閱讀5頁,還剩57頁未讀, 繼續(xù)免費閱讀

下載本文檔

版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進(jìn)行舉報或認(rèn)領(lǐng)

文檔簡介

1、掌握概率的概念、性質(zhì)和法則 明確概率分布的含義,了解二項試驗和分布的基礎(chǔ)知識。,第五章 概率及概率分布,概率論起源于17世紀(jì),當(dāng)時在人口統(tǒng)計、人壽保險等工作中,要整理和研究大量的隨機(jī)數(shù)據(jù)資料,這就需要一種專門研究大量隨機(jī)現(xiàn)象的規(guī)律性的數(shù)學(xué)。 參賭者就想:如果同時擲兩顆骰子 ,則點數(shù)之和為9 和點數(shù)之和為10 ,哪種情況出現(xiàn)的可能性較大? 例如17世紀(jì)中葉,貴族德梅爾發(fā)現(xiàn):將一枚骰子連擲四次,只出現(xiàn)一個6 點的機(jī)會比較多,而同時將兩枚擲24次,只出現(xiàn)一次雙6 的機(jī)會卻很少。,第一節(jié) 概率的一般概念,概率論的創(chuàng)始人是法國的帕斯卡(16231662)和費爾馬(16011665),他們在以通信的方式討

2、論賭博的機(jī)率問題時,發(fā)表了骰子賭博理論一書。棣莫弗(16671754)發(fā)現(xiàn)了正態(tài)方程式。同一時期瑞士的伯努利(1654一1705)提出了二項分布理論。1814年,法國的拉普拉斯(17491827)發(fā)表了概率分析論,該書奠定了古典概率理論的基礎(chǔ),并將概率理論應(yīng)用于自然和社會的研究。此后,法國的泊松(17811840)提出了泊松分布,德國的高斯(17771855)提出了最小平方法。,一、頻率和概率的定義,1. 頻率 對隨機(jī)現(xiàn)象進(jìn)行觀測時,若事件在次觀測中出現(xiàn)了次,則與的比值,就是事件出現(xiàn)的頻率(也稱為相對頻數(shù))。用 ()表示事件的頻率。 公式為:()=/,2. 概率,概率是對隨機(jī)事件出現(xiàn)可能性大小

3、的客觀量度。事件發(fā)生的概率記為P()。 在相同的條件下,某個事件A發(fā)生的概率是一個常數(shù)。 根據(jù)概率的計算方法,概率可分為后驗概率和先驗概率。, 后驗概率(統(tǒng)計概率),以隨機(jī)事件A在大量重復(fù)試驗中出現(xiàn)的穩(wěn)定頻率作為隨機(jī)事件A概率的估計值。 事件A的頻率不是常數(shù),它隨試驗次數(shù)的變化而變化,但是隨著試驗次數(shù)的無限增大,事件A的頻率會逐漸趨近于一個常數(shù)P,P就是隨機(jī)事件A出現(xiàn)概率的近似值。, 先驗概率(古典概率),如果某個隨機(jī)現(xiàn)象所有可能結(jié)果是有限的,其總數(shù)為n,每一種可能結(jié)果出現(xiàn)的可能性相等,這個現(xiàn)象中的隨機(jī)事件A包括m個可能結(jié)果,則事件A的概率為與的比值,即 P(A)=/。 例:某班有20名男生,

4、25名女生,現(xiàn)隨機(jī)從全班同學(xué)中抽取一名同學(xué),抽到男生的概率為20/45=4/9,抽到女生的概率為25/45=5/9。,二、概率的性質(zhì),1. 對于任何事件,均有0()1 2. 不可能事件的概率為零,P(V)=0 3. 必然事件的概率為1,P(U)=1,1. 概率的加法,互不相容事件:在一次試驗中不可能同時出現(xiàn)的事件。 事件之和:有限個互不相容事件中任意一個發(fā)生。如:A+B=A或B發(fā)生。 概率的加法法則:有限個互不相容事件之和的概率等于這些事件概率的和。 例:某學(xué)生從5個試題中任意抽取一題,則抽到試題2或試題3的概率為2/5。,三、概率的加法和乘法,例:根據(jù)上海市職業(yè)代際流動的統(tǒng)計,向下流動的概率

5、是0.07,靜止不動的概率是0.6,求向上流動的概率是多少? 例:為了研究父代文化程度對子代文化程度的影響,某大學(xué)統(tǒng)計出學(xué)生中只有父親具有大學(xué)文化程度的占30,只有母親具有大學(xué)文化程度的占20,而雙方都具有大學(xué)文化程度的占有10,問從學(xué)生中任抽一名,父代至少有一名具有大學(xué)文化程度的概率是多少?,2. 概率的乘法,獨立事件:出現(xiàn)概率相互不影響的事件。 事件之積:有限個互相獨立事件同時發(fā)生。如: AB=A和B同時發(fā)生。 概率的乘法法則:有限個獨立事件乘積的概率等于這 些事件概率的乘積。 例:兩個學(xué)生從5個試題中任意抽取一題,第一個學(xué)生 把抽出的題還回去后,第二個學(xué)生再抽,則兩個學(xué)生 都抽到試題2的

6、概率為1/25。,例:根據(jù)統(tǒng)計結(jié)果,男嬰出生的概率是22/43,女嬰出生的概率是21/43,某單位有兩名孕婦,問兩名孕婦都生男嬰的概率是多少?都生女嬰的概率是多少?其中一男一女的概率是多少?,隨機(jī)事件及其概率回答的是隨機(jī)現(xiàn)象某一局部結(jié)果,例如對給定的復(fù)合事件求先驗概率。而概率分布則要在滿足完備性(窮舉)和互不相容性(互斥)的前提下,回答隨機(jī)現(xiàn)象一共會出現(xiàn)多少種結(jié)果,以及每種結(jié)果所伴隨的概率是多少。 應(yīng)該指出,在統(tǒng)計中,概率分布是就隨機(jī)現(xiàn)象呈現(xiàn)的宏觀結(jié)果而言的。它可以在宏觀層次加以識別而與特定排列次序無關(guān)。,四、概率分布,例如擲兩顆骰子的試驗,點數(shù)就是隨機(jī)現(xiàn)象,它一共有11種宏觀結(jié)果。我們用古典

7、法對每種宏觀結(jié)果計算P,便得到了如下表所示的概率分布。,頻率分布與概率分布的區(qū)別,經(jīng)驗分布: 頻率分布是經(jīng)資料整理而來;頻率分布隨樣本不同而不同;頻率分布有對應(yīng)的頻數(shù)分布。,理論分布: 概率分布是先驗的;概率分布是唯一的;概率分布無頻率分布所對應(yīng)的頻數(shù)分布。,概率分布是理論性的或理念性的,它描繪了在一個完美的世界中百分比應(yīng)該是多少。不幸的是,根據(jù)現(xiàn)實的(實際得到的)數(shù)據(jù)得到的百分比和理論上的總是不完全一致。 假設(shè)把兩枚硬幣投1000次,得到的結(jié)果為下表:,概率分布實質(zhì)上是無限次拋擲的頻數(shù)分布。盡管我們永遠(yuǎn)不能觀察到這個無限次拋擲的頻數(shù)分布,但我們知道這是的頻數(shù)分布會無限接近概率分布。,四、概率

8、分布,概率分布:對隨機(jī)變量取值的概率分布情況用數(shù)學(xué) 方法進(jìn)行描述。 根據(jù)隨機(jī)變量取值情況可分為:離散變量概率分布 連續(xù)變量概率分布,離散變量概率分布,離散型隨機(jī)變量的取值是可數(shù)的,如果對X的每個可能取值xi計算其實現(xiàn)的概率Pi ,我們便得到了離散型隨機(jī)變量的概率分布,即,離散型隨機(jī)變量的概 率分布也可以用表格 和圖形兩種形式來表 示。由于離散型隨機(jī) 變量的特點,表示離 散型隨機(jī)變量概率分 布多為折線圖。,離散變量概率分布,連續(xù)型隨機(jī)變量的取值充滿某一區(qū)間,因而取某一數(shù)值討論其概率是無意義的。為此,我們引進(jìn)概率密度 的概念來表達(dá)連續(xù)型隨機(jī)變量的概率分布。,前面曾提到過頻率密度的概念,頻率密度等于

9、頻率除以組距。以頻率密度為縱坐標(biāo),可以作出頻率分布直方圖。類似地,以概率密度為縱坐標(biāo),可以作出概率密度曲線。所不同的是,概率密度由于對組距求了x0的極限,其圖形乃平滑曲線。,2. 連續(xù)型變量概率分布,這樣,隨機(jī)變量X取值在區(qū)間x1 ,x2上的概率等于概率密度曲線 下面x1與x2兩點之間面積,即,所以有概率密 度的性質(zhì),因為概率不可能是負(fù)的,且,和 (離散變量)或 (連續(xù)變量)的關(guān)系,就像向上累計頻率和頻率的關(guān)系一樣。不同之處在于, 累計的是概率。但使用分布函數(shù)的好處是很明顯的,它不僅在數(shù)學(xué)上統(tǒng)一了對離散型隨機(jī)變量和連續(xù)型隨機(jī)變量概率的研究,而且由于它計算概率的起點都固定為,因而可以把概率值換算

10、成表,以易于求得任何區(qū)間的概率,從而達(dá)到計算快捷和應(yīng)用廣泛之目的。,例:求兩顆骰子點數(shù)的分布函數(shù)。,一、二項試驗,二項試驗:滿足以下條件的試驗。 1. 一次試驗只有兩種可能結(jié)果,可記為成功和失??; 2. 各次試驗之間相互不影響,即相互獨立; 3. 各次試驗中兩種結(jié)果的概率保持不變。,第二節(jié) 二項分布,從擲硬幣的試驗入手。假定二項試驗由重復(fù)拋擲n次硬幣組成,已知硬幣面朝上(成功)的概率是p,面朝下(失敗)的概率是q (顯然有 q1p)。這樣,對試驗結(jié)果而言,成功的次數(shù)(即硬幣面朝上的次數(shù))X是一個離散型隨機(jī)變量,它的可能取值是0,1,2,3,n。而對X的一個具體取值x而言,根據(jù)乘法規(guī)則,我們立刻

11、可以就試驗結(jié)果計算出一種特定排列方式(先x次面朝上,而后nx次面朝下)實現(xiàn)的概率,即 ppppqqqqpxqn-x,二、二項分布函數(shù),光考慮乘法規(guī)則是不夠的,還要考慮加法規(guī)則,于是 就x次成功和(nx)次失敗這個宏觀結(jié)果而言所包含 的所有排列的方式數(shù),用符號表示 這樣,我們就得到了二項試驗中隨機(jī)變量X的概率分 布,即,譬如,二項試驗是將一枚硬幣重復(fù)做8次拋擲,假設(shè)這枚硬幣是無偏的,即 pq0.5,那么恰好得到5次面朝上的概率是,同理,我們也可以求出 這個二項試驗中硬幣剛好為0,1,2,8次面朝上的各種宏觀結(jié)果的概率。,例:從男生占2/5的學(xué)校中隨機(jī)抽取6個學(xué)生,正好抽到4個男生的概率是多少?

12、解:這是一個二項試驗,試驗次數(shù)n=6,每次抽取中抽到男生的概率p=2/5=0.4,抽不到男生的概率q=3/5=0.6,此題要求抽到4個男生,即X=4,根據(jù)二項分布函數(shù)可得:,三、二項分布的平均數(shù)和標(biāo)準(zhǔn)差,當(dāng)二項試驗的次數(shù)n比較大時,二項分布接近正態(tài)分布,此時在n次二項試驗中成功事件出現(xiàn)次數(shù)的平均數(shù)和標(biāo)準(zhǔn)差分別為:,例:從男女各占1/2的學(xué)校中隨機(jī)抽10名學(xué)生,從理論上說,平均應(yīng)抽到男生5人,標(biāo)準(zhǔn)差為1.58,九個二項分布B(5,p) (p0.1到0.9)的概率分布圖,四、二項分布圖,當(dāng)n趨近于無限大時,二項分布接近于正態(tài)分布; 當(dāng)p=q,不管n多大,二項分布呈對稱形; 當(dāng)pq,且n相當(dāng)小時,圖

13、形呈偏態(tài),pq與pq偏斜方向相反; 當(dāng)pq且np5,或者pq且nq5時,二項分布近似正態(tài)分布。,五、二項分布的應(yīng)用,1. 求二項試驗中成功事件出現(xiàn)X次的概率; 2. 判斷二項試驗結(jié)果的機(jī)遇性和真實性; 3. 用于推斷統(tǒng)計。,練習(xí),一名參加古代史期中考試的學(xué)生遇到了兩個在他缺席的一堂課中講述的問題,所以他決定采用隨機(jī)猜測的方法給出答案。下面的概率格式多少? 對錯題的答案正確; 單選題的答案正確; 對錯題和單選題的答案都正確; 對錯題和單選題的答案都不正確; 對錯題的答案正確,單選題的答案不正確; 對錯題的答案不正確,單選題的答案正確。,練習(xí),一名參加古代史期中考試的學(xué)生遇到了兩個在他缺席的一堂課

14、中講述的問題,所以他決定采用隨機(jī)猜測的方法給出答案。下面的概率各是多少? 對錯題的答案正確; 單選題的答案正確; 對錯題和單選題的答案都正確; 對錯題和單選題的答案都不正確; 對錯題的答案正確,單選題的答案不正確; 對錯題的答案不正確,單選題的答案正確。,第三節(jié) 正態(tài)分布,理解正態(tài)分布的意義和特征。 理解標(biāo)準(zhǔn)分?jǐn)?shù)的意義,掌握標(biāo)準(zhǔn)分?jǐn)?shù)的轉(zhuǎn)化方法并能應(yīng)用。 理解標(biāo)準(zhǔn)正態(tài)分布的意義和特征,能熟練使用標(biāo)準(zhǔn)正態(tài)分布表。 了解正態(tài)分布的應(yīng)用。,學(xué)習(xí)目標(biāo),一、正態(tài)分布,1. 正態(tài)分布的數(shù)學(xué)形式 正態(tài)分布又稱為常態(tài)分布,是一種連續(xù)型隨機(jī)變量的概率分布。正態(tài)曲線函數(shù)為:,2. 正態(tài)分布性質(zhì),(1)正態(tài)曲線以x=

15、呈鐘型對稱,均值=中位數(shù)=眾數(shù) (2)在x=處,概率密度最大;當(dāng)區(qū)間離越遠(yuǎn),x落在這個區(qū)間的概率越小。 (3)正態(tài)曲線的外形由值確定。對于固定的值,不同均值的正態(tài)曲線的外形完全相同,差別只在于曲線在橫軸方向上整體平移了一個位置 。 (4)對于固定的值,改變值,值越小,正態(tài)曲線越陡峭;值越大,正態(tài)曲線越低平。,固定,變動,固定,變動,3. 正態(tài)曲線的特點,曲線不止一條,而是有一個正態(tài)曲線族。 曲線隨著分布的、N的變化而變化。 曲線在平均數(shù)處為最高點。 以平均數(shù)為中心,形成中間高,兩側(cè)逐漸降低的對稱分布。 以橫軸為漸進(jìn)線。,三、標(biāo)準(zhǔn)正態(tài)分布,1. 標(biāo)準(zhǔn)正態(tài)分布:平均數(shù)為0,標(biāo)準(zhǔn)差為1的正態(tài)分布。分

16、布函數(shù)為:,標(biāo)準(zhǔn)正態(tài)曲線是一個以Z=0(平均數(shù))為中心的雙側(cè)對稱曲線,曲線在Z=0處為最高點,兩側(cè)逐漸降低,并無限延伸,但永不與基線相交。,由于把一組原始數(shù)據(jù)轉(zhuǎn)化成Z分?jǐn)?shù)之后,這組Z分?jǐn)?shù)的平均數(shù)為0,標(biāo)準(zhǔn)差為1,因此,只要將自變量X轉(zhuǎn)化成標(biāo)準(zhǔn)分?jǐn)?shù)Z,就可以將任何一個正態(tài)分布轉(zhuǎn)化為標(biāo)準(zhǔn)正態(tài)分布。,2. 標(biāo)準(zhǔn)正態(tài)分布表,結(jié)構(gòu):(教材323頁附表1) (1)Z值(Z0) (2)Y值:Z值的縱線高度(概率) (3)P值:某個Z值到Z=0之間的概率 用途: (1)已知Z值查Y值、P值 (2)已知P值查Z值、Y值,查表方法 (1)已知Z值查Y值 Z為正數(shù)時直接查表;Z為負(fù)數(shù)時以Z的絕對值查表。 例:Z=1

17、時,以Z=1查表,對應(yīng)的Y=0.24179。 (2)已知Z值查P值:Z=0到某個Z值之間的P Z為正數(shù)時直接查表,Z為負(fù)數(shù)時以Z的絕對值查表。 例:Z= 1時,以Z=1查表,P=0.34134,即Z=0于Z= 1之間的概率為0.34134。,(2)已知Z值查P值:兩個Z值之間的P 兩個Z值符號相同,它們之間的P等于兩個Z值與Z=0之間的概率之差。 例:Z=2與Z=1之間的概率為: P=0.47725 0.34134=0.13591 兩個Z值符號相反,它們之間的P等于兩個Z值與Z=0之間的概率之和。 例:Z= 2與Z=1之間的概率為: P=0.47725+0.34134=0.81859,(2)已

18、知Z值查P值:一個Z值以上或以下區(qū)間的P 第一步:查出Z與Z=0之間的P 第二步:計算0.5 P或0.5+P 例:Z=1以上區(qū)間的概率 P=0.50.34134=0.15866 Z=1以下區(qū)間的概率 P=0.5+0.34134=0.84134,(3)已知P值查Z值、Y值 P為Z=0以上或以下某個區(qū)間的概率時,直接以P值查表。 例: Z=0以上一個區(qū)間的概率為0.25,在表P列找到和0.25最接近的0.24857,查得Z=0.67,Y=0.31874。 如果區(qū)間是Z=0以下,則把查出的Z值加上負(fù)號即可,Y值不變。,P為正態(tài)曲線上端或下端某個區(qū)間的概率,且P0.5時,用0.05P的值查表。 例:正

19、態(tài)曲線上端一個區(qū)間的P=0.05,求得0.50.05=0.45,在表P列找到和0.45最接近的0.45053,對應(yīng)的Z=1.65,Y=0.10226 如果區(qū)間在曲線下端,則把查出的Z值加上負(fù)號即可,Y值不變。,P為正態(tài)曲線右端或左端某個區(qū)間的概率,且P0.5時,用P-0.05的值查表。 例:正態(tài)曲線右端某個區(qū)間的P=0.7,則0.70.5=0.2,在表P列找到和0.2最接近的0.19847,其對應(yīng)的Z=0.52,Y=0.34849,此區(qū)間的端點小于0,故Z=0.52。 如果區(qū)間在曲線左端,Z為正值。,P為正態(tài)曲線以Z=0為中心的某個對稱區(qū)間的概率時,用P2的值查表。 例:已知正態(tài)曲線以Z=0為

20、中心的某個對稱區(qū)間的概率為0.99,則0.99 2=0.495,在表中P列找到和0.495最接近的0.49506,對應(yīng)的Z=2.58, Y=0.01431,下端的Z= 2.58 。,四、正態(tài)分布的應(yīng)用,1. 推斷統(tǒng)計中的應(yīng)用 2. 教育測驗、評價方面的應(yīng)用,原始分?jǐn)?shù)轉(zhuǎn)化為標(biāo)準(zhǔn)分?jǐn)?shù) 確定錄取分?jǐn)?shù)線 確定等級評定人數(shù) 品質(zhì)評定數(shù)量化,例:在任意正態(tài)分布中,總面積的百分比之多少落在以下各區(qū)間內(nèi)? 位于均值和均值之上一個標(biāo)準(zhǔn)差的數(shù)值之間; 位于均值之上的一個標(biāo)準(zhǔn)差的數(shù)值和一個均值之下一個標(biāo)準(zhǔn)差的數(shù)值之間; 位于均值和均值之上2的數(shù)值之間; 位于均值之上+2和-2的數(shù)值之間。,例:學(xué)力評估測試(SAT)

21、按正態(tài)分布進(jìn)行了標(biāo)準(zhǔn)化,其均值=500。標(biāo)準(zhǔn)差=100.SAT分?jǐn)?shù)的多少百分比落在以下各區(qū)間內(nèi)? 500和600之間; 400和600之間; 500和700之間; 300和700之間; 高于600; 低于300。,例:在某所大學(xué)的學(xué)生中,平均缺課天數(shù)=3.5,標(biāo)準(zhǔn)差=1.2.假設(shè)這所大學(xué)的缺課情況符合正態(tài)分布,請確定: 一名學(xué)生缺課3.5到5天的概率; 一名學(xué)生缺課5天或以上的概率; 三名學(xué)生都缺課5天或以上的概率。,例:兒科數(shù)據(jù)顯示兒童平均在26個月時學(xué)會控制便溺,但是這個正態(tài)分布中有2個月的標(biāo)準(zhǔn)差。請問: 在23個月以前學(xué)會控制便溺的兒童的百分比是多少? 一位母親為她的兒子是在第30個月學(xué)會控制便溺而焦慮。她兒子的百分等級是多少?兒童有多大可能在這個時間及以前學(xué)會控制便溺? 一位母親發(fā)現(xiàn)她的兒子是在18個月學(xué)會控制便溺的。她兒子的百分等級是多少?兒童有多大可能在這個時間及以前學(xué)會控制便溺?,例:智商分?jǐn)?shù)符合均值=100,標(biāo)準(zhǔn)差=15的正態(tài)分布?;谶@個分布,確定: 智商分?jǐn)?shù)在100到120的百分

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負(fù)責(zé)。
  • 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時也不承擔(dān)用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

評論

0/150

提交評論