版權(quán)說(shuō)明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請(qǐng)進(jìn)行舉報(bào)或認(rèn)領(lǐng)
文檔簡(jiǎn)介
1、數(shù)理統(tǒng)計(jì)與隨機(jī)過(guò)程第六章主講教師:陳立萍北京工業(yè)大學(xué)應(yīng)用數(shù)理學(xué)院 數(shù)理統(tǒng)計(jì)學(xué)是一門(mén)應(yīng)用性很強(qiáng)的學(xué)科。它研究如何以有效的方式收集、整理和分析帶有隨機(jī)性的數(shù)據(jù),以便對(duì)所考察的問(wèn)題作出正確的推斷和預(yù)測(cè),為采取正確的決策和行動(dòng)提供依據(jù)和建議。 數(shù)理統(tǒng)計(jì)不同于一般的資料統(tǒng)計(jì),它更側(cè)重于應(yīng)用隨機(jī)現(xiàn)象本身的規(guī)律性進(jìn)行資料的收集、整理和分析。第六章 樣本及抽樣分布6.1 引言 由于大量隨機(jī)現(xiàn)象必然呈現(xiàn)出其規(guī)律性,因而從理論上講,只要對(duì)隨機(jī)現(xiàn)象進(jìn)行足夠多次的觀察,隨機(jī)現(xiàn)象的規(guī)律性就一定能夠清楚地呈現(xiàn)出來(lái)。 但是,客觀上只允許我們對(duì)隨機(jī)現(xiàn)象進(jìn)行次數(shù)不多的觀察或試驗(yàn),也就是說(shuō):我們獲得的只能是局部的或有限的觀察資料
2、。 數(shù)理統(tǒng)計(jì)的任務(wù)就是研究 “如何有效地收集、整理和分析所獲得的有限資料,并對(duì)所研究的問(wèn)題盡可能地給出精確而可靠的推斷”。 現(xiàn)實(shí)世界中存在著形形色色的數(shù)據(jù),分析這些數(shù)據(jù)需要多種多樣的方法。 因此,數(shù)理統(tǒng)計(jì)中的方法和支持這些方法的相應(yīng)理論是相當(dāng)豐富的。概括起來(lái)可以歸納成兩大類。 參數(shù)估計(jì): 根據(jù)數(shù)據(jù),對(duì)分布中的未知參數(shù) 進(jìn)行估計(jì); 假設(shè)檢驗(yàn): 根據(jù)數(shù)據(jù),對(duì)分布的未知參數(shù)的 某種假設(shè)進(jìn)行檢驗(yàn)。 參數(shù)估計(jì)與假設(shè)檢驗(yàn)構(gòu)成了統(tǒng)計(jì)推斷的兩種基本形式,這兩種推斷滲透到了數(shù)理統(tǒng)計(jì)的每個(gè)分支。6.2 總體與樣本 在數(shù)理統(tǒng)計(jì)中,稱研究問(wèn)題所涉及對(duì)象的全體為總體,總體中的每個(gè)成員為個(gè)體。 例如: 研究某工廠生產(chǎn)的某
3、種產(chǎn)品的廢品率,則這種產(chǎn)品的全體就是總體,而每件產(chǎn)品都是一個(gè)個(gè)體。6.2.1 總體、個(gè)體與樣本 實(shí)際上,我們真正關(guān)心的并不一定是總體或個(gè)體本身,而真正關(guān)心的是總體或個(gè)體的某項(xiàng)數(shù)量指標(biāo)。 如:某電子產(chǎn)品的使用壽命,某天的最高氣溫,加工出來(lái)的某零件的長(zhǎng)度等數(shù)量指標(biāo)。因此,有時(shí)也將總體理解為那些研究對(duì)象的某項(xiàng)數(shù)量指標(biāo)的全體。 為評(píng)價(jià)某種產(chǎn)品質(zhì)量的好壞,通常的做法是:從全部產(chǎn)品中隨機(jī)(任意)地抽取一些樣品進(jìn)行觀測(cè)(檢測(cè)),統(tǒng)計(jì)學(xué)上稱這些樣品為一個(gè)樣本。 同樣,我們也將樣本的數(shù)量指標(biāo)稱為樣本。因此,今后當(dāng)我們說(shuō)到總體及樣本時(shí),既指研究對(duì)象又指它們的某項(xiàng)數(shù)量指標(biāo)。例1:研究某地區(qū) N 個(gè)農(nóng)戶的年收人。 在
4、這里,總體既指這 N 個(gè)農(nóng)戶,又指我們所關(guān)心的 N個(gè)農(nóng)戶的數(shù)量指標(biāo)他們的年收入( N 個(gè)數(shù)字)。 如果從這 N 個(gè)農(nóng)戶中隨機(jī)地抽出 n 個(gè)農(nóng)戶作為調(diào)查對(duì)象,那么,這 n 個(gè)農(nóng)戶以及他們的數(shù)量指標(biāo)年收入( n個(gè)數(shù)字)就是樣本。 注意:上例中的總體是直觀的,看得見(jiàn)、摸得著的。但是,客觀情況并非總是這樣。例2:用一把尺子測(cè)量一件物體的長(zhǎng)度。 假定 n 次測(cè)量值分別為X1,X2 ,Xn。顯然,在該問(wèn)題中,我們把測(cè)量值X1,X2 ,Xn看成樣本。但總體是什么呢? 事實(shí)上,這里沒(méi)有一個(gè)現(xiàn)實(shí)存在的個(gè)體的集合可以作為上述問(wèn)題的總體??墒?,我們可以這樣考慮,既然 n 個(gè)測(cè)量值 X1,X2,Xn 是樣本,那么,總
5、體就應(yīng)該理解為一切所有可能的測(cè)量值的全體。又如:為研究某種安眠藥的藥效,讓 n 個(gè)病人同時(shí)服用這種藥,記錄服藥者各自服藥后的睡眠時(shí)間比未服藥時(shí)增加睡眠的小時(shí)數(shù) X1,X2,Xn,則這些數(shù)字就是樣本。 那么,什么是總體呢? 設(shè)想讓某個(gè)地區(qū)(或某國(guó)家,甚至全世界)所有患失眠癥的病人都服用此藥,則他們所增加睡眠的小時(shí)數(shù)之全體就是研究問(wèn)題的總體。 對(duì)一個(gè)總體,如果用X表示其數(shù)量指標(biāo),那么,X的值對(duì)不同的個(gè)體就取不同的值。因此,如果我們隨機(jī)地抽取個(gè)體,則X的值也就隨著抽取個(gè)體的不同而不同。 所以,X是一個(gè)隨機(jī)變量! 既然總體是隨機(jī)變量X,自然就有其概率分布。我們把X的分布稱為總體分布。 總體的特性是由總
6、體分布來(lái)刻畫(huà)的。因此,常把總體和總體分布視為同義語(yǔ)。.6.2.2 總體分布例 3 (例 l 續(xù)):在例 l中,若農(nóng)戶年收入以萬(wàn)元計(jì),假定 N戶的收入X只取以下各值: 0.5, 0.8, l.0, 1.2和1.5。取上述值的戶數(shù)分別n1, n2, n3, n4和n5 (n1+n2+n3+n4+n5=N)。則X為離散型分布,分布律為:例4 ( 例2續(xù) ):在例2中,假定物體真實(shí)長(zhǎng)度為(未知)。一般說(shuō)來(lái),測(cè)量值X就是總體,取 附近值的概率要大一些,而離 越遠(yuǎn)的值被取到的概率就越小。 如果測(cè)量過(guò)程沒(méi)有系統(tǒng)性誤差,則X取大于 和小于 的概率也會(huì)相等。 在這種情況下,人們往往認(rèn)為X 服從均值為,方差為2
7、的正態(tài)分布。2反映了測(cè)量的精度。于是,總體X的分布為 N(,2)。 說(shuō)明:這里有一個(gè)問(wèn)題,即物體長(zhǎng)度的測(cè)量值總是在其真值 的附近,它不可能取負(fù)值。 而正態(tài)分布取值在(-,)上。那么,怎么可以認(rèn)為測(cè)量值X服從正態(tài)分布呢? 回答這個(gè)問(wèn)題,有如下兩方面的理由。(1).在前面講過(guò),對(duì)于XN(,2), P-3X0,當(dāng)樣本大小 n 增大時(shí),上面的概率也隨之增大;n 趨于無(wú)窮時(shí),上式趨近于 1。任給c 0,總有例1:用機(jī)器向瓶子里灌裝液體洗滌劑,規(guī)定每瓶裝 毫升。但實(shí)際灌裝量總有一定波動(dòng)。假定灌裝量的方差 2=1,如果每箱裝這樣的洗滌劑 25 瓶。求這 25 瓶洗凈劑的平均灌裝量與標(biāo)定值 相差不超過(guò)0.3毫
8、升的概率;又如果每箱裝50瓶時(shí)呢?解:記一箱中 25 瓶洗凈劑灌裝量為 X1,X2, X25 是來(lái)自均值為 , 方差為1的總體的隨機(jī)樣本。根據(jù)抽樣分布定理1,近似地有 當(dāng) n=50時(shí),同樣可算出:6.4 正態(tài)總體6.4.1 2 分布它是由正態(tài)分布派生出來(lái)的一種分布。 定義1: 設(shè) X1, X2, , Xn 相互獨(dú)立,且均服從正態(tài)分布 N(0, 1), 則稱隨機(jī)變量服從自由度為 n 的卡方分布,記成 。 分布的密度函數(shù)為由 分布的定義,不難得到其如下性質(zhì): 進(jìn)一步,由中心極限定理可以推出, n 充分大時(shí),近似于標(biāo)準(zhǔn)正態(tài)分布 N(0,1)。分布密度函數(shù)圖形n2 分布上 分位點(diǎn)有表可查,見(jiàn)附表4。對(duì)
9、于給定的 (0,1), 稱滿足條件的點(diǎn) n2()為 n2分布的上(右) 分位點(diǎn)。分布分位點(diǎn)t 分布的概率密度為為服從自由度 n 的 t 分布,記為 T tn。6.4.2 t 分布 定義2: 設(shè) X N(0, 1) , Y n2 , 且 X與Y 相互獨(dú)立,則稱隨機(jī)變量t 分布的概率密度圖形當(dāng) n 充分大時(shí),f (x; n) 趨近于標(biāo)準(zhǔn)正態(tài)分布的概率密度。 數(shù)學(xué)期望與方差若 T tn , 對(duì)給定的 (0,1),稱滿足條件t 分布的分位點(diǎn)的點(diǎn) tn()為 tn 分布上 分位點(diǎn)。t 分布的上 分位點(diǎn)有表可查,見(jiàn)附表3。 tn 分布上 分位點(diǎn)示意圖6.4.3 F 分布 則稱 F =(X/m)/(Y/n)
10、服從第一自由度為m,第二自由度為n 的 F 分布。記成 F Fm ,n 。定義3:F 分布的概率密度為 若 FFm, n,對(duì)給定的 (0,1), 稱滿足條件F 分布的分位點(diǎn)的點(diǎn) Fm,n()為F分布的上 分位點(diǎn)。.F 分布上 分位點(diǎn)有表可查,見(jiàn)附表5。 F 分布上 分位點(diǎn)示意圖 一個(gè)需要注意的問(wèn)題:這個(gè)關(guān)系式的證明如下:證明:若 X Fm,n,則 Y = X -1 Fn,m。依分位點(diǎn)定義,上式等價(jià)于再根據(jù) Y ( Fn,m ) 的上 分位點(diǎn)定義,有這就證明了(1)式。 在通常 F 分布表中,只對(duì) 比較小的值,如 = 0.01, 0.05, 0.025及0.1等列出了分位點(diǎn)。但有時(shí)我們也需要知道
11、 比較大的分位點(diǎn),它們?cè)?F 分布表中查不到。這時(shí)我們就可利用分位點(diǎn)的關(guān)系式(1)把它們計(jì)算出來(lái)。 例如:對(duì)m=12, n=9, =0.95, 我們?cè)?F 分布表中查不到 F12,9(0.95),但由(1)式,知可從F 分布 表中查到 還有一個(gè)重要結(jié)果: 若X tn , 則X2 F1,n。 請(qǐng)同學(xué)們自己證明。定理 1:6.4.4 正態(tài)總體樣本均值與樣本方差的分布 定理的證明超出了教學(xué)范圍,在此,我們不作證明。 定理的內(nèi)容在后面幾章的討論中將多次用到,希望大家牢記。例1:設(shè)某物體的實(shí)際重量為(未知),現(xiàn)在用一臺(tái)天平稱量它,共稱 n 次,得到X1,X2,Xn。假設(shè)每次稱量過(guò)程彼此獨(dú)立,且無(wú)系統(tǒng)誤差, 則可認(rèn)為這些測(cè)量值獨(dú)立同分布, 均服從正態(tài)分布N(,2),方差2反映了天平及測(cè)量過(guò)程的總精度。我們通常用樣本均值根據(jù)定理1(基本定理),有再根據(jù)正態(tài)分布的性質(zhì)(見(jiàn)p110,例4.2.6),知例如:當(dāng) = 0.1 時(shí),也就是說(shuō):我們的估計(jì)值 與真值 的偏差不超過(guò) 的概率約為 99.74%, 并且隨稱量次數(shù) n 的增加,偏差界限 將越來(lái)越小。若取 n
溫馨提示
- 1. 本站所有資源如無(wú)特殊說(shuō)明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請(qǐng)下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請(qǐng)聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
- 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁(yè)內(nèi)容里面會(huì)有圖紙預(yù)覽,若沒(méi)有圖紙預(yù)覽就沒(méi)有圖紙。
- 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
- 5. 人人文庫(kù)網(wǎng)僅提供信息存儲(chǔ)空間,僅對(duì)用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對(duì)用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對(duì)任何下載內(nèi)容負(fù)責(zé)。
- 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請(qǐng)與我們聯(lián)系,我們立即糾正。
- 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶因使用這些下載資源對(duì)自己和他人造成任何形式的傷害或損失。
最新文檔
- 柒牌男裝的綜合調(diào)查
- 網(wǎng)絡(luò)工程師工作計(jì)劃(一)
- 快艇操作知識(shí)培訓(xùn)班課件
- 河北省秦皇島市部分示范高中2024屆高三下學(xué)期三模英語(yǔ)試題
- 中國(guó)婦科炎癥外用藥行業(yè)市場(chǎng)發(fā)展監(jiān)測(cè)及投資戰(zhàn)略咨詢報(bào)告
- 云南省文山州文山市第二學(xué)區(qū)2023-2024學(xué)年九年級(jí)上學(xué)期期末練習(xí)化學(xué)試卷(三)
- 奔馳車維修知識(shí)培訓(xùn)課件
- 四年級(jí)數(shù)學(xué)(簡(jiǎn)便運(yùn)算)計(jì)算題專項(xiàng)練習(xí)與答案
- 年涂裝8000萬(wàn)只化妝品容器生產(chǎn)線項(xiàng)目可行性研究報(bào)告寫(xiě)作模板-備案審批
- 員工執(zhí)行力企業(yè)培訓(xùn)
- 2024年期貨居間業(yè)務(wù)代理合同范本2篇
- 2024-2025學(xué)年上學(xué)期杭州初中英語(yǔ)九年級(jí)期末試卷
- 網(wǎng)絡(luò)與信息安全管理組織機(jī)構(gòu)設(shè)置及工作職責(zé)
- 醫(yī)院后勤節(jié)能降耗工作計(jì)劃
- 2024國(guó)家級(jí)天然氣購(gòu)銷合作協(xié)議模板
- 中國(guó)大模型行業(yè)發(fā)展現(xiàn)狀調(diào)查、競(jìng)爭(zhēng)格局分析及未來(lái)前景預(yù)測(cè)報(bào)告
- GB/T 19228.1-2024不銹鋼卡壓式管件組件第1部分:卡壓式管件
- 朗文2B課本詞匯表
- 貴州省貴陽(yáng)市英語(yǔ)小學(xué)六年級(jí)上學(xué)期試卷及答案指導(dǎo)(2024年)
- 2024年全國(guó)職業(yè)院校技能大賽高職組(智能飛行器應(yīng)用技術(shù)賽項(xiàng))備賽試題庫(kù)(含答案)
- 人教版四年級(jí)上冊(cè)數(shù)學(xué)【選擇題】專項(xiàng)練習(xí)100題附答案
評(píng)論
0/150
提交評(píng)論