




版權(quán)說(shuō)明:本文檔由用戶(hù)提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請(qǐng)進(jìn)行舉報(bào)或認(rèn)領(lǐng)
文檔簡(jiǎn)介
1、概率數(shù)理統(tǒng)計(jì)第1頁(yè),共37頁(yè),2022年,5月20日,6點(diǎn)4分,星期四第一章 概率統(tǒng)計(jì)基礎(chǔ)1.1 基本原理1.2 高斯分布1.3 統(tǒng)計(jì)基礎(chǔ)第2頁(yè),共37頁(yè),2022年,5月20日,6點(diǎn)4分,星期四高斯分布(Gaussian)Normal 正態(tài)分布:均值(mean)2 :方差(variance), :標(biāo)準(zhǔn)方差 = 1/2 :精確度(Precision)第3頁(yè),共37頁(yè),2022年,5月20日,6點(diǎn)4分,星期四Gaussian分布期望與方差期望方差第4頁(yè),共37頁(yè),2022年,5月20日,6點(diǎn)4分,星期四Gaussian分布的再生性若獨(dú)立隨機(jī)變量 為分別服從均值為 ,方差為 的正態(tài)分布,則 隨機(jī)變
2、量的線(xiàn)性組合仍然服從相同的分布 第5頁(yè),共37頁(yè),2022年,5月20日,6點(diǎn)4分,星期四第一章 概率統(tǒng)計(jì)基礎(chǔ)1.1 基本原理1.2 高斯分布1.3 統(tǒng)計(jì)基礎(chǔ)數(shù)據(jù)顯示與圖形法常用統(tǒng)計(jì)量常用統(tǒng)計(jì)分布第6頁(yè),共37頁(yè),2022年,5月20日,6點(diǎn)4分,星期四總體和統(tǒng)計(jì)推斷全體被研究對(duì)象稱(chēng)為總體,每個(gè)研究對(duì)象稱(chēng)為個(gè)體可以是有限的,如學(xué)校學(xué)生身高、視力有限總體很大時(shí),可以認(rèn)為是無(wú)限的,如全國(guó)干電池壽命可以是無(wú)限的,如每天的測(cè)量氣壓統(tǒng)計(jì)推斷當(dāng)無(wú)法獲取總體全部個(gè)體的觀(guān)測(cè)值時(shí),只能依賴(lài)從總體中獲得的某個(gè)觀(guān)測(cè)子集來(lái)對(duì)總體做出推斷。第7頁(yè),共37頁(yè),2022年,5月20日,6點(diǎn)4分,星期四抽樣樣本是總體的一個(gè)子
3、集保證從樣本到總體推斷的正確性,選擇隨機(jī)抽樣,表示得到的觀(guān)測(cè)值是獨(dú)立且隨機(jī)隨機(jī)變量X總體上服從概率分布p(x), 那么隨機(jī)抽樣的n個(gè)樣本值x1,x2,xn獨(dú)立且具有相同概率p(x), 其聯(lián)合概率:第8頁(yè),共37頁(yè),2022年,5月20日,6點(diǎn)4分,星期四統(tǒng)計(jì)推斷步驟隨機(jī)抽樣數(shù)據(jù)分析(圖形法)分布假設(shè)參數(shù)估計(jì)假設(shè)檢驗(yàn)假設(shè)修正預(yù)測(cè)總體模型第9頁(yè),共37頁(yè),2022年,5月20日,6點(diǎn)4分,星期四數(shù)據(jù)顯示和圖形法利用有啟發(fā)性的圖形來(lái)提取關(guān)于數(shù)據(jù)特性的信息,對(duì)數(shù)據(jù)分布進(jìn)行假設(shè)莖葉圖(Stem and leaf )直方圖(histogram)箱須圖(Box-Whisker)經(jīng)驗(yàn)分布函數(shù)圖( empiri
4、cal cumulative distribution )正態(tài)概率分布圖(Normal Probability)第10頁(yè),共37頁(yè),2022年,5月20日,6點(diǎn)4分,星期四莖葉圖將數(shù)組中的數(shù)按位數(shù)進(jìn)行比較,將數(shù)的大小基本不變或變化不大的位作為一個(gè)主干(莖),將變化大的位的數(shù)作為分枝(葉),列在主干的后面,這樣就可以清楚地看到每個(gè)主干后面的幾個(gè)數(shù),每個(gè)數(shù)具體是多少。通常 選取520根莖汽車(chē)電池壽命2.2 4.1 3.5 4.5 3.2 3.7 3.0 2.6 3.4 1.6 3.1 3.3 3.8 3.1 4.7 3.7 2.5 4.3 3.4 3.6 2.9 3.3 3.9 3.1 3.3 3
5、.1 3.7 4.4 3.2 4.1 1.9 3.4 4.7 3.8 3.2 2.6 3.9 3.0 4.2 4.5 汽車(chē)電池壽命莖葉圖莖葉頻率1 692 2 256695 3 0001111222333444556777889925 4 11234577 8 第11頁(yè),共37頁(yè),2022年,5月20日,6點(diǎn)4分,星期四頻率直方圖將樣本取值分為r個(gè)區(qū)間,n個(gè)樣本,落在某個(gè)區(qū)間(ak-1,ak的個(gè)數(shù) nk稱(chēng)為頻數(shù) nk /n稱(chēng)為頻率目標(biāo):利用頻率直方圖估計(jì)總體的概率密度在(ak-1,ak區(qū)間用頻率為縱坐標(biāo),制作相應(yīng)的頻率直方圖第12頁(yè),共37頁(yè),2022年,5月20日,6點(diǎn)4分,星期四相對(duì)頻率直
6、方圖每個(gè)頻數(shù)除以數(shù)據(jù)總量,得到相對(duì)頻率汽車(chē)電池壽命相對(duì)頻率分布區(qū)間組組中點(diǎn)頻率相對(duì)頻率1.5-1.91.720.050 2.0-2.42.210.025 2.5-2.92.740.100 3.0-3.43.2150.375 3.5-3.93.7100.250 4.0-4.44.250.125 4.5-4.94.730.075 第13頁(yè),共37頁(yè),2022年,5月20日,6點(diǎn)4分,星期四相對(duì)頻率折線(xiàn)圖汽車(chē)電池壽命相對(duì)頻率分布區(qū)間組組中點(diǎn)頻率相對(duì)頻率1.5-1.91.720.050 2.0-2.42.210.025 2.5-2.92.740.100 3.0-3.43.2150.375 3.5-3.
7、93.7100.250 4.0-4.44.250.125 4.5-4.94.730.075 根據(jù)每個(gè)分區(qū)的相對(duì)頻率,畫(huà)出折線(xiàn)圖估計(jì)頻率分布第14頁(yè),共37頁(yè),2022年,5月20日,6點(diǎn)4分,星期四莖葉圖與直方圖莖葉圖特優(yōu)點(diǎn)沒(méi)有原始數(shù)據(jù)信息的損失,所有數(shù)據(jù)信息都可以從莖葉圖中得到圖中的數(shù)據(jù)可以隨時(shí)記錄,隨時(shí)添加,方便記錄與表示。只便于表示兩位有效數(shù)字的數(shù)據(jù),且只方便記錄兩組的數(shù)據(jù)莖葉圖與直方圖類(lèi)似莖葉圖保留原始資料的資訊,直方圖則失去原始資料的訊息將莖和葉逆時(shí)針?lè)较蛐D(zhuǎn)90,實(shí)際上就是一個(gè)直方圖,可以從中統(tǒng)計(jì)出次數(shù),計(jì)算出各數(shù)據(jù)段的頻率或百分比??梢钥闯龇植际欠衽c正態(tài)分布或單峰偏態(tài)分布逼近。第
8、15頁(yè),共37頁(yè),2022年,5月20日,6點(diǎn)4分,星期四Box-Whisker圖(箱須圖)中位數(shù): 將x1,x2, Xn按升序排列,四分位數(shù):25%(上Q1 ),75%(下Q3)四分位數(shù)差(IQR)上四分位數(shù)與下分位數(shù)之間的差值第16頁(yè),共37頁(yè),2022年,5月20日,6點(diǎn)4分,星期四BOX圖(2)上邊緣 大于Q1+1.5IQR的點(diǎn)或最大值下邊緣 小于Q3-1.5IQR的點(diǎn)或最小值上下邊緣以外的點(diǎn)為異常點(diǎn)(Outliers)例:班級(jí)學(xué)生成績(jī)統(tǒng)計(jì)第17頁(yè),共37頁(yè),2022年,5月20日,6點(diǎn)4分,星期四(1) (2) (3) (4) (5) (6) (7) (8) (9) (10)5333
9、535364344454748(11) (12) (13) (14) (15) (16) (17) (18) (19) (20)52555864646568697074(21) (22) (23) (24) (25) (26) (27) (28) (29) (30)78808080828384848589最小數(shù)(90%)下四分位數(shù) (75%)中位數(shù) (50%)上四分位數(shù) (25%)最大數(shù)班級(jí)成績(jī)分析第18頁(yè),共37頁(yè),2022年,5月20日,6點(diǎn)4分,星期四Box圖(3)反映數(shù)據(jù)的中心位置、波動(dòng)和非對(duì)稱(chēng)程度中位數(shù):中心四分位數(shù)差(IQR):波動(dòng)程度上下邊緣:異常點(diǎn)作用觀(guān)察異常點(diǎn)比較幾批數(shù)據(jù)形狀
10、成績(jī)甲班乙班丙班第19頁(yè),共37頁(yè),2022年,5月20日,6點(diǎn)4分,星期四經(jīng)驗(yàn)分布函數(shù)F(x) 為總體的分布函數(shù),稱(chēng)為經(jīng)驗(yàn)分布函數(shù)或樣本分布函數(shù)目標(biāo):利用經(jīng)驗(yàn)分布估計(jì)總體的分布第20頁(yè),共37頁(yè),2022年,5月20日,6點(diǎn)4分,星期四經(jīng)驗(yàn)累積分布圖(empirical cumulative distribution)總體的分布函數(shù)稱(chēng)為理論也分布函數(shù)經(jīng)驗(yàn)分布函數(shù)利用樣本估計(jì)和推斷總體的分布函數(shù)F(x).高數(shù)成績(jī)5 33 35 35 36 4344 45 47 48 52 55 58 64 65 68 69 69 7074 78 80 80 808283 84 84 85 89 第21頁(yè),共3
11、7頁(yè),2022年,5月20日,6點(diǎn)4分,星期四正態(tài)概率分布圖藍(lán)色+表示樣本數(shù)據(jù)疊加紅線(xiàn)是連接上四分位數(shù)和下四分位數(shù)的直線(xiàn)如果數(shù)據(jù)服從正態(tài)分布,樣本數(shù)據(jù)畫(huà)出的圖成線(xiàn)性第22頁(yè),共37頁(yè),2022年,5月20日,6點(diǎn)4分,星期四重要統(tǒng)計(jì)量統(tǒng)計(jì)量:由隨機(jī)變量組成的一隨機(jī)樣本的函數(shù),不含任何未知參數(shù)樣本均值,描述樣本中心趨勢(shì)樣本方差,描述樣本的波動(dòng)性樣本標(biāo)準(zhǔn)差S,樣本方差的平方根第23頁(yè),共37頁(yè),2022年,5月20日,6點(diǎn)4分,星期四抽樣分布統(tǒng)計(jì)推斷從樣本中推斷總體主要目標(biāo):歸納和預(yù)測(cè)統(tǒng)計(jì)量的概率分布稱(chēng)為抽樣分布總體大小樣本容量選擇樣本的方法例:依據(jù) 的抽樣分布對(duì)參數(shù) 做出推斷第24頁(yè),共37頁(yè),
12、2022年,5月20日,6點(diǎn)4分,星期四均值的抽樣分布樣本容量為n的 的抽樣分布實(shí)驗(yàn)不斷重復(fù)(樣本容量為n),產(chǎn)生多次的值時(shí)的一個(gè)分布描述樣本在總體均值附近的平均變化n個(gè)隨機(jī)樣本來(lái)自N(,2)總體,均值 N(,2/n)第25頁(yè),共37頁(yè),2022年,5月20日,6點(diǎn)4分,星期四定義:設(shè)Xk為相互獨(dú)立的隨機(jī)變量序列,有有限的數(shù)學(xué)期望 E(Xk)=k 和方差 D(Xk)=k2,令若對(duì)于一切實(shí)數(shù)x,有則稱(chēng)隨機(jī)變量序列Xk服從中心極限定理( Central Limit Theorem )標(biāo)準(zhǔn)正態(tài)分布第26頁(yè),共37頁(yè),2022年,5月20日,6點(diǎn)4分,星期四 定理(林德貝爾格-勒維,Lindeberg
13、-Levy)設(shè)Xk為相互獨(dú)立的隨機(jī)變量序列,服從同一分布,且具有數(shù)學(xué)期望 E(Xk)= 和方差 D(Xk)=2 ,則隨機(jī)變量的分布函數(shù)Fn(x),對(duì)于任意x,滿(mǎn)足第27頁(yè),共37頁(yè),2022年,5月20日,6點(diǎn)4分,星期四如果從一個(gè)未知分布的總體抽樣,不管它是有限還是無(wú)限的,假設(shè)樣本容量足夠大時(shí),樣本均值的抽樣分布會(huì)近似于 N(,2/n) 的正態(tài)分布。第28頁(yè),共37頁(yè),2022年,5月20日,6點(diǎn)4分,星期四中心極限定理應(yīng)用 n30, 的正態(tài)分布逼近較好 n30,總體近似正態(tài)分布時(shí),逼近效果較好 如果總體 正態(tài)分布,無(wú)論n大小, 的抽樣分布精確服從正態(tài)分布第29頁(yè),共37頁(yè),2022年,5月
14、20日,6點(diǎn)4分,星期四 若一個(gè)隨機(jī)變量 X 可以看做許多微小而獨(dú)立的隨機(jī)因素作用的總和,每一種因素的影響很小,不產(chǎn)生決定作用,則 X 一般可以認(rèn)為近似地服從正態(tài)分布 例:測(cè)量誤差X影響因素:溫度X1、濕度X2 、觀(guān)察視線(xiàn)X3 、心情X4等微小的、隨機(jī)的,而且相互沒(méi)有影響測(cè)量的總誤差是上述各個(gè)因素產(chǎn)生的誤差之和:Xi某樣本的線(xiàn)性擬合模型可以描述為:第30頁(yè),共37頁(yè),2022年,5月20日,6點(diǎn)4分,星期四例: 將一顆骰子連擲100次,則點(diǎn)數(shù)之和不少于500的概率是多少?解: 設(shè)Xk為第k 次擲出的點(diǎn)數(shù),k=1,2,100,則X1,X100獨(dú)立同分布.由中心極限定理:第31頁(yè),共37頁(yè),202
15、2年,5月20日,6點(diǎn)4分,星期四定理 (De Moivre-Laplace中心極限定理) 設(shè)隨機(jī)變量Yn服從二項(xiàng)分布Yn B(n,p), (op1),則對(duì)于任意x,恒有證明 設(shè)X1,X2,Xn是n個(gè)相互獨(dú)立的服從(0-1)分布(PXi=0=1-p, PXi=1=p)的隨機(jī)變量,則Yn= X1+X2+Xn由于E(Xi)=p, D(Xi)=p(1-p) (i=1,2,n),由此得第32頁(yè),共37頁(yè),2022年,5月20日,6點(diǎn)4分,星期四例:在一家保險(xiǎn)公司里有10000個(gè)人參加壽命保險(xiǎn),每人每年付12元保險(xiǎn)費(fèi)。在一年內(nèi)一個(gè)人死亡的概率為0.6%,死亡時(shí)其家屬可向保險(xiǎn)公司領(lǐng)得1000元,問(wèn): (1
16、)保險(xiǎn)公司虧本的概率有多大? (2)其他條件不變,為使保險(xiǎn)公司一年的利潤(rùn)不少于60000元的概率大于0.9,則賠償金至多可設(shè)為多少?第33頁(yè),共37頁(yè),2022年,5月20日,6點(diǎn)4分,星期四解:設(shè)X表示一年內(nèi)死亡的人數(shù),則X B(n, p)其中 n= 10000,p=0.6% 設(shè)Y表示保險(xiǎn)公司一年的利潤(rùn), Y = 1000012-1000X(1) PY0=P1000012-1000X60000 = P1000012-aX60000 =PX60000/a0.9;(2)設(shè)賠償金為a元,則令由中心極限定理,上式等價(jià)于第35頁(yè),共37頁(yè),2022年,5月20日,6點(diǎn)4分,星期四作業(yè)1. 推導(dǎo)Gaussian分布的方差2. 食品店有三種蛋糕出售,價(jià)格為1元、1.2元、1.5 元,售出概率分別為0.3、0.2、0.5某天該食品店出售了300 只蛋糕試用中心極限定理計(jì)算,這天的收入至少為395元的概率。3. 學(xué)習(xí)使用Matlab,熟悉樣本的圖形顯示以及正態(tài)分布的繪制函數(shù)機(jī)房版本:Matlab7請(qǐng)自行收集樣本集(注意樣本數(shù)據(jù)盡可能充分)撰寫(xiě)報(bào)告,論述樣本數(shù)據(jù)的來(lái)源
溫馨提示
- 1. 本站所有資源如無(wú)特殊說(shuō)明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請(qǐng)下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請(qǐng)聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶(hù)所有。
- 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁(yè)內(nèi)容里面會(huì)有圖紙預(yù)覽,若沒(méi)有圖紙預(yù)覽就沒(méi)有圖紙。
- 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
- 5. 人人文庫(kù)網(wǎng)僅提供信息存儲(chǔ)空間,僅對(duì)用戶(hù)上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對(duì)用戶(hù)上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對(duì)任何下載內(nèi)容負(fù)責(zé)。
- 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請(qǐng)與我們聯(lián)系,我們立即糾正。
- 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶(hù)因使用這些下載資源對(duì)自己和他人造成任何形式的傷害或損失。
最新文檔
- 產(chǎn)科急救培訓(xùn)課件
- 木材加工企業(yè)的信息化建設(shè)與管理考核試卷
- 化工產(chǎn)品批發(fā)商銷(xiāo)售團(tuán)隊(duì)激勵(lì)與培訓(xùn)實(shí)踐考核試卷
- 冷凍飲品行業(yè)企業(yè)發(fā)展戰(zhàn)略與實(shí)施路徑考核試卷
- 半導(dǎo)體照明器件的振動(dòng)測(cè)試考核試卷
- 家具品牌形象塑造考核試卷
- 機(jī)床附件的行業(yè)競(jìng)爭(zhēng)格局與市場(chǎng)定位考核試卷
- 國(guó)際貿(mào)易中的社會(huì)責(zé)任與合規(guī)性考核試卷
- 成人高考物理電磁學(xué)綜合應(yīng)用考核試卷
- 小學(xué)生師生互動(dòng)課件
- 魚(yú)骨圖培訓(xùn)課件
- 護(hù)理禮儀與人文關(guān)懷
- 運(yùn)維服務(wù)體系建立實(shí)施方案(5篇)
- 路面基層(級(jí)配碎石)施工方案
- 2025年日歷(日程安排-可直接打印)
- 四川政采評(píng)審專(zhuān)家入庫(kù)考試基礎(chǔ)題復(fù)習(xí)試題及答案(一)
- 患者手術(shù)風(fēng)險(xiǎn)評(píng)估與術(shù)前準(zhǔn)備制度
- 口腔執(zhí)業(yè)醫(yī)師定期考核試題(資料)帶答案
- 2024年三八婦女節(jié)婦女權(quán)益保障法律知識(shí)競(jìng)賽題庫(kù)及答案(共260題)
- 2023年7月浙江省普通高中學(xué)業(yè)水平考試(學(xué)考)語(yǔ)文試題答案
- 2024年計(jì)算機(jī)軟件水平考試-初級(jí)信息處理技術(shù)員考試近5年真題集錦(頻考類(lèi)試題)帶答案
評(píng)論
0/150
提交評(píng)論