隨機樣本和統(tǒng)計量.ppt_第1頁
隨機樣本和統(tǒng)計量.ppt_第2頁
隨機樣本和統(tǒng)計量.ppt_第3頁
隨機樣本和統(tǒng)計量.ppt_第4頁
隨機樣本和統(tǒng)計量.ppt_第5頁
已閱讀5頁,還剩54頁未讀, 繼續(xù)免費閱讀

下載本文檔

版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進行舉報或認領(lǐng)

文檔簡介

1 它們都以隨機現(xiàn)象的統(tǒng)計規(guī)律為研究對象 數(shù)理統(tǒng)計與概率論是兩個有密切聯(lián)系的學(xué)科 但在研究問題的方法上有很大區(qū)別 概率論 已知隨機變量服從某分布 尋求分布的性質(zhì) 數(shù)字特征 及其應(yīng)用 數(shù)理統(tǒng)計 通過對實驗數(shù)據(jù)的統(tǒng)計分析 尋找所服從的分布和數(shù)字特征 從而推斷整體的規(guī)律性 數(shù)理統(tǒng)計的核心問題 由樣本推斷總體 第六章樣本及抽樣分布 2 也就是說 我們獲得的只是局部觀察資料 因而從理論上講 只要對隨機現(xiàn)象進行足夠多次觀察 但客觀上只允許我們對隨機現(xiàn)象進行次數(shù)不多的觀察試驗 被研究的隨機現(xiàn)象的規(guī)律性一定能清楚地呈現(xiàn)出來 數(shù)理統(tǒng)計就是在概率論的基礎(chǔ)上研究怎樣以有效的方式收集 整理和分析可獲的有限的 帶有隨機性的數(shù)據(jù)資料 由于大量隨機現(xiàn)象必然呈現(xiàn)出它的規(guī)律性 對所考察問題的統(tǒng)計性規(guī)律盡可能地作出精確而可靠的推斷或預(yù)測 為采取一定的決策和行動提供依據(jù)和建議 3 這部分內(nèi)容的重點在于介紹數(shù)理統(tǒng)計的一些重要概念和典型的統(tǒng)計方法 它們是實際中最常用的知識 學(xué)習(xí)統(tǒng)計無須把過多時間化在計算上 應(yīng)更有效地把時間用在基本概念 方法原理的正確理解上 在數(shù)理統(tǒng)計中 不是對所研究的對象全體 稱為總體 進行觀察 而是抽取其中的部分 稱為樣本 進行觀察獲得數(shù)據(jù) 抽樣 并通過這些數(shù)據(jù)對總體進行推斷 數(shù)理統(tǒng)計方法具有 部分推斷整體 的特征 總體中的每個元素 例如 某工廠生產(chǎn)的燈泡壽命是一個總體 每個燈泡的壽命是一個個體 某學(xué)校男生的身高的全體是一個總體 每個男生的身高是一個個體 一 總體 個體 隨機樣本 總體 研究對象全體元素組成的集合所研究的對象的某個 或某些 數(shù)量指標的全體 它是一個隨機變量 記為X X的分布函數(shù)和數(shù)字特征稱為總體的分布函數(shù)和數(shù)字特征 個體 6 1隨機樣本和統(tǒng)計量 從總體中抽取一部分個體來進行觀察或試驗 稱為抽樣 被抽出的部分個體稱為總體的一個樣本 抽取樣本的目的在于對總體的統(tǒng)計規(guī)律進行推斷或估計 故要求所抽取的樣本能很好的反映總體的特性 最常用的是簡單隨機樣本 總體容量有限的稱為有限總體 稱總體中所含個體的數(shù)目為總體容量 總體容量無限的稱為無限總體 定義 設(shè)X1 X2 Xn為來自總體X的樣本 如果X1 X2 Xn相互獨立 且每一個都是與總體X有相同分布的隨機變量 則稱X1 X2 Xn為總體X的容量為n的簡單隨機樣本 簡稱為隨機樣本或樣本 其觀察值x1 x2 xn稱為樣本值 7 它要求抽取的樣本X1 X2 Xn滿足下面兩點 2 代表性 Xi i 1 2 n 與所考察的總體X同分布 1 獨立性 X1 X2 Xn是相互獨立的隨機變量 今后 說到 X1 Xn是取自某總體的樣本 時 若不特別說明 就指簡單隨機樣本 簡單隨機樣本是應(yīng)用中最常見的情形 由定義知 若X1 X2 Xn為X的一個樣本 X的分布函數(shù)為F x 則X1 X2 Xn的聯(lián)合分布函數(shù)為 若X的概率密度為f x 則X1 X2 Xn的聯(lián)合概率密度為 9 求樣本 X1 X2 X3 的概率分布 例1設(shè)總體X B 1 p 即P X x px 1 p 1 x X 0 1 設(shè)X1 X2 X3為X的一個樣本 解 xi 0 1 i 1 2 3 X1 X2 X3 的分布列 P X1 x1 X2 x2 X3 x3 又 x1 x2 x3 0 1 2 3 P X1 x1 X2 x2 X3 x3 k 0 1 2 3 10 例2 解 11 12 二 頻率直方圖 這是一種根據(jù)樣本觀察值來近似地求總體的概率密度的圖解法 設(shè)總體X是一個連續(xù)型隨機變量 樣本觀察值x1 x2 xn 找個區(qū)間包括這些觀察值 再把區(qū)間分成若干部分 13 三 經(jīng)驗分布函數(shù) 14 例如 估計一個物體的重量 重復(fù)n次稱重 其結(jié)果依次記為X1 X2 Xn 通常用樣本的算術(shù)平均值 或其 它某個由樣本計算出來的且看上去合理的量來估計重量 在獲得了樣本之后 下一步對樣本進行統(tǒng)計分析 即對樣本進行加工 整理 從中提取有用信息 一個有效的方法就是構(gòu)造一些樣本的函數(shù) 通過樣本函數(shù)把樣本中所含的 某一方面 的信息集中起來 四 統(tǒng)計量 定義 設(shè)X1 X2 Xn是總體X的一個樣本 隨機變量g X1 X2 Xn 是X1 X2 Xn的一個連續(xù)函數(shù) 且g中不包含任何未知參數(shù) 則稱g X1 X2 Xn 為一個統(tǒng)計量 統(tǒng)計量是樣本的函數(shù) 它是一個隨機變量 統(tǒng)計量的分布稱為抽樣分布 設(shè) x1 x2 xn 是樣本 X1 X2 Xn 的樣本值 則稱g x1 x2 xn 是g X1 X2 Xn 的一個觀察值 這種不含任何未知參數(shù) 完全由樣本決定的量稱為統(tǒng)計量 17 例是未知參數(shù) 若 已知 則為統(tǒng)計量 是一樣本 是統(tǒng)計量 其中 則 C 例3設(shè)總體X B 2 p 其中p為未知參數(shù) X1 X2 X3 是取自總體X的樣本 則 不是統(tǒng)計量 A X1 X2 B max X1 X2 X3 C X3 2p D X2 X1 2 設(shè)X1 X2 Xn是總體X的一個樣本 樣本平均值 樣本方差 樣本標準差 常用統(tǒng)計量 樣本k階 原點 矩 k 1 2 樣本k階中心矩 k 1 2 例如 樣本平均值 樣本方差 樣本k階中心矩 樣本k階 原點 矩 k 1 2 它們的觀察值分別為 由樣本平均值和樣本方差的表達式可得 23 注樣本方差與樣本二階中心矩的不同 故 推導(dǎo) 24 例4從一批機器零件毛坯中隨機地抽取10件 測得其重量為 單位 公斤 210 243 185 240 215 228 196 235 200 199求這組樣本值的均值 方差 二階原點矩與二階中心矩 解 令 25 則 26 例5在總體中 隨機抽取一個容量為36的樣本 求樣本均值落在50 8到53 8之間的概率 解 故 27 1 標準正態(tài)分布2 2分布3 t分布4 F分布 6 2數(shù)理統(tǒng)計中常用的分布 正態(tài)總體是最常見的總體 本節(jié)介紹的幾個抽樣分布均對正態(tài)總體而言 28 設(shè)X N 0 1 對任給的 0 1 稱滿足條件 1 標準正態(tài)分布 的點z 為標準正態(tài)分布的上 分位點 z 定義 29 例1求z0 05 解 P X z0 05 1 P X z0 05 1 0 05 0 95 P X 1 64 0 9495P X 1 65 0 9505 z0 05 1 64 1 65 2 1 645 公式 z 1 常用數(shù)字 30 設(shè)Xi N 0 1 i 1 2 n 且它們相互獨立 則稱隨機變量 2 2分布 定義 服從自由度為n的 2分布 記為 2 2 n 2分布最常用的是擬合優(yōu)度檢驗 31 一般 其中 在x 0時收斂 稱為 函數(shù) 具有性質(zhì) 32 10設(shè)Y1 2 m Y2 2 n 且Y1 Y2相互獨立 2分布的基本性質(zhì) 則 2分布的可加性 Y1 Y2 20若Y 2 n 則 n 2n EYDY 1 3 30設(shè)X1 Xn相互獨立 且都服從正態(tài)分布N 2 40若Y 2分布 近似服從N 0 1 應(yīng)用中心極限定理可得 則 則當(dāng)n充分大時 33 設(shè) 2 2 n 其密度函數(shù)為f x 對于給定的正數(shù) 0 1 稱滿足條件 的點 2 n 為 2 n 分布的上 分位點 2分布的上 分位點 當(dāng)n充分大時 34 例2 練習(xí)九 五 設(shè)X N 2 X1 X2 X16 是取自總體X的樣本 求概率 解 X1 X2 X16相互獨立 且 35 0 95 0 01 0 94 36 例3設(shè)總體 的樣本 為總體X 解 故 因此 37 設(shè)X N 0 1 Y 2 n 且X與Y相互獨立 則稱隨機變量 3t分布 定義 服從自由度為n的t分布 記為T t n T的密度函數(shù)為 38 t分布的上 分位點 設(shè)T t n 其密度函數(shù)為f t 對于給定的正數(shù) 0 1 稱滿足條件 的點t n 為t分布的上 分位點 t n 39 t分布的性質(zhì) 1 其密度函數(shù)f t 是偶函數(shù) 3 f t 的極限為N 0 1 的密度函數(shù) 即 2 t1 n t n 當(dāng)n 45時 t n z 40 且X N 2 1 Yi N 0 4 i 1 2 3 4 設(shè)X Y1 Y2 Y3 Y4相互獨立 例4 令 解 X 2 N 0 1 i 1 2 3 4 t 4 即Z服從自由度為4的t分布 求Z的分布 由t分布的定義 Yi 2 N 0 1 41 題設(shè)隨機變量X與Y相互獨立 X N 0 16 Y N 0 9 X1 X2 X9與Y1 Y2 Y16分別是取自X與Y的簡單隨機樣本 求統(tǒng)計量 所服從的分布 解 42 從而 43 t分布用于在小樣本場合下的正態(tài)分布 大樣本場合下可以用正態(tài)分布來近似 有時候在信息不足的情況下 只能用t分布 比如在整體方差不知的情況下 對總體均值的估計和檢驗通常要用t統(tǒng)計量 44 記作F F m n 由F分布的定義可見 若F F m n 定義 設(shè)隨機變量X與Y獨立 所服從的分布為第一自由度為m 第二自由度為n的F分布 4 F分布 則F的概率密度為 則稱統(tǒng)計量 其圖形參見172 F分布多用于比例的估計和檢驗 45 F分布的上 分位點 設(shè)F F m n 其密度函數(shù)為f x 對于給定的正數(shù) 0 1 稱滿足條件 的點F m n 為F分布的上 分位點 F m n 46 F分布的性質(zhì) 1 若F F m n 則 2 1 P F F1 m n 3 若X t n 則X2 F 1 n 47 例5設(shè)F F 24 15 求F1 F2 F3 使其分別滿足 解 1 由m 24 n 15 0 025 查P342附表7知 2 無法直接查表獲得 但 由F分布性質(zhì)知 3 F3 F0 95 24 15 查表可知 F1 F0 025 24 15 2 70 F2 1 2 44 0 41 由 式知 P F F1 0 025 P FF3 0 95 1 F F 15 24 查附表7知 統(tǒng)計三大分布的定義和基本性質(zhì)在后面的學(xué)習(xí)中常用到 要牢記 48 1 單個正態(tài)總體的抽樣分布2 兩個正態(tài)總體的抽樣分布 6 3抽樣分布定理 49 設(shè)X1 X2 Xn是來自正態(tài)總體N 2 的樣本 則 1 單個正態(tài)總體的抽樣分布 定理 1 3 4 50 1 為n個相互獨立的正態(tài) 服從正態(tài)分布 隨機變量的線性組合 51 4 且它們相互獨立 由t分布的定義 即 2 n 1 52 例1 練習(xí)九 二 1 設(shè) X1 X2 Xn 是取自總體X的樣本 是樣本均值 如果總體X N 4 則樣本容量n應(yīng)取多大 才能使 解 53 0 95 n 1536 64 n 1537 54 55 設(shè)總體X N 1 12 總體Y N 2 22 X1 X2 是總體X的

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負責(zé)。
  • 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔(dān)用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

評論

0/150

提交評論