版權說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權,請進行舉報或認領
文檔簡介
1、抽樣分布抽樣分布參數(shù)估計簡介參數(shù)估計簡介假設檢驗的基本原理假設檢驗的基本原理統(tǒng)計推斷概述統(tǒng)計推斷概述X2S 將樣本中分散的信息濃縮集中起來成為樣本將樣本中分散的信息濃縮集中起來成為樣本的一個函數(shù),它不含未知參數(shù),這樣的樣本函的一個函數(shù),它不含未知參數(shù),這樣的樣本函數(shù)稱為數(shù)稱為統(tǒng)計量統(tǒng)計量,如,如描述總體特征的統(tǒng)稱為描述總體特征的統(tǒng)稱為參數(shù)參數(shù)抽樣分布的概念n樣本統(tǒng)計量的概率分布稱為抽樣分布(sampling distribution)q 樣本是通過對總體的隨機抽樣獲得的q 樣本統(tǒng)計量是隨機變量,有一定的概率分布簡單隨機樣本簡單隨機樣本抽樣是完全隨機的抽樣是完全隨機的 - 總體中的每個個體都總體
2、中的每個個體都有相同的機會被抽中有相同的機會被抽中抽樣是彼此對立的抽樣是彼此對立的 - 每次抽樣的結(jié)果都不每次抽樣的結(jié)果都不會影響到其他抽樣的結(jié)果會影響到其他抽樣的結(jié)果4抽樣分布n樣本統(tǒng)計量的概率分布稱為抽樣分布(sampling distribution)q 樣本是通過對總體的隨機抽樣獲得的q 樣本統(tǒng)計量是隨機變量,有一定的概率分布原總體原總體樣本樣本1樣本樣本2樣本樣本n1x2x2x新總體新總體n 統(tǒng)計量統(tǒng)計量54.1 常用的三種抽樣分布常用的三種抽樣分布n一、 分布 n二、t分布n三、F 分布2 均為連續(xù)型隨機均為連續(xù)型隨機變量分布,分布只與變量分布,分布只與自由度,即樣本含量自由度,即
3、樣本含量有關有關62 (chi-square)分布n定義q設隨機變量X1, X2, , Xn彼此獨立且都服從標準正態(tài)分布 N(0, 1),則隨機變量2iXY服從自由度為服從自由度為n的的 2分布,記為分布,記為)(2nY72 分布2f(2)2/) 12/(2222)2/(21)(ef82 分布n性質(zhì)q2 分布隨機變量的取值范圍為(0,)q若Y1 2 (n),Y2 2 (m),且相互獨立,則nY1 Y2 2 (n m)q2 分布為非對稱分布,其分布曲線的形狀由自由度決定,自由度越大,分布越趨于對稱q q當 n , 2 (n) N(n, 2n) nnE)(2nnV2)(22魏澤輝講稿92 分布n2
4、 分布上側(cè)分位數(shù)表:附表4(p.338))(2XP下尾概率查1-10t 分布 n定義q設u N(0, 1),Y 2 (n),且相互獨立,則 nYut 服從自由度為服從自由度為n的的 t 分布,記為分布,記為)( tntxxu11t 分布tf(t)2)1(2)/1 ()2(2) 1()(ttf 廣義積分 是參變量的函數(shù)稱為函數(shù)(其中0)01)(dxexx12t 分布n性質(zhì)q與標準正態(tài)分布相似n關于 t = 0對稱n只有一個峰,峰值在t = 0q分布曲線受自由度影響,自由度越小,離散程度越大q q當 n ,t(n) N(0, 1) 0)(tE)2/()(2nntV 13t 分布o t 分布與正態(tài)分
5、布的比較魏澤輝講稿14t 分布nt分布雙側(cè)分位數(shù)表:附表5(p. 339))(1tttP15F 分布 n定義q若 X 2 (m),Y 2 (n),且相互獨立,則nYmXF 服從自由度為服從自由度為m(第一自由度)(第一自由度)和和n(第(第二自由度)的二自由度)的 F 分布,記為分布,記為),(FnmF16F 分布f(F)F22121122/22/12121121)(222)(FFFf17F 分布n性質(zhì)qF分布隨機變量的取值范圍為(0,)qF分布的分布曲線受兩個自由度的影響q若F F(m, n),則 1/F F(n, m)q q若X t(n),則 X2 F(1, n)22( )2nE Fn2(
6、2)n 222122112(224)( )(2) (4)nnnV Fn nn2(4)n 魏澤輝講稿18F 分布nF分布的上側(cè)分位數(shù)表:附表6(p.340))(FFP下尾概率查1-假設男人的血壓資料服從正態(tài)分布假設男人的血壓資料服從正態(tài)分布 從從113個男人中以簡單隨機抽樣的方式,以樣本量為個男人中以簡單隨機抽樣的方式,以樣本量為20,進行,進行500次抽樣,每次抽的樣本繪制直方圖次抽樣,每次抽的樣本繪制直方圖樣本樣本1:n20樣本樣本2:n20匯總:樣本量樣本量500500個樣本平個樣本平均數(shù)的平均數(shù)均數(shù)的平均數(shù)500500個樣本平個樣本平均數(shù)的標準差均數(shù)的標準差500500個樣本平個樣本平均
7、數(shù)的分布均數(shù)的分布2020125mmHg125mmHg3.3mmHg3.3mmHg接近正態(tài)接近正態(tài)5050125mmHg125mmHg3.3mmHg3.3mmHg接近正態(tài)接近正態(tài)100100125mmHg125mmHg3.3mmHg3.3mmHg接近正態(tài)接近正態(tài)假設假設2014年全國患者的住院時間資料如下年全國患者的住院時間資料如下:樣本量樣本量500500個樣本平個樣本平均數(shù)的平均數(shù)均數(shù)的平均數(shù)500500個樣本平個樣本平均數(shù)的標準差均數(shù)的標準差500500個樣本平個樣本平均數(shù)的分布均數(shù)的分布20205.055.05天天1.491.49天天接近正態(tài)接近正態(tài)50505.045.04天天1.00
8、1.00天天接近正態(tài)接近正態(tài)1001005.085.08天天0.700.70天天接近正態(tài)接近正態(tài)匯總:匯總:中心極限定理 無論樣本所來自的總體是否服從正態(tài)分布,無論樣本所來自的總體是否服從正態(tài)分布, 只要樣本足夠大,樣本平均數(shù)就近似服從正只要樣本足夠大,樣本平均數(shù)就近似服從正態(tài)分布,樣本越大,近似程度越好。態(tài)分布,樣本越大,近似程度越好。所需的樣本含量隨原總體的分布而異,但只所需的樣本含量隨原總體的分布而異,但只要樣本含量要樣本含量 30,無論原總體是何分布,都,無論原總體是何分布,都足以滿足近似的要求。足以滿足近似的要求。設原總體的期望為設原總體的期望為 ,方差為,方差為 2,則樣本平,則樣
9、本平均數(shù)的期望為均數(shù)的期望為 ,方差為,方差為 2 /n。正態(tài)總體樣本平均數(shù)的分布正態(tài)總體樣本平均數(shù)的分布樣本平均數(shù)的期望和方差樣本平均數(shù)的期望和方差設樣本來自均數(shù)為設樣本來自均數(shù)為 ,方差為,方差為 2的總體的總體設樣本為簡單隨機樣本設樣本為簡單隨機樣本ixnx1正態(tài)總體樣本平均數(shù)的分布n期望nnnxxxEnxnExEnix1)(1)(1)1()(21正態(tài)總體樣本平均數(shù)的分布nnnnxxxVarnxnVarxVarnix222222221221)(1)(1)1()(方差方差標準差標準差nx(平均數(shù)的標準誤)(平均數(shù)的標準誤)4.6.2 標 準 誤n 標準誤標準誤(平均數(shù)抽樣總體的標準差平均數(shù)
10、抽樣總體的標準差) 的大小反映樣本平均數(shù)的抽樣誤差的大小,即的大小反映樣本平均數(shù)的抽樣誤差的大小,即精確性的高低。精確性的高低。n 的大小與原總體的標準差的大小與原總體的標準差成正比,與樣本成正比,與樣本含量含量n的平方根成反比。從某特定總體抽樣,的平方根成反比。從某特定總體抽樣,因為因為是一常數(shù),所以只有增大樣本含量才能是一常數(shù),所以只有增大樣本含量才能降低樣本平均數(shù)的抽樣誤差。降低樣本平均數(shù)的抽樣誤差。nx/xn在實際工作中,總體標準差在實際工作中,總體標準差往往是未知的,因而往往是未知的,因而無法求得無法求得 。此時,可用樣本標準差。此時,可用樣本標準差S估計估計。于。于是,以是,以 估
11、計估計 。記。記 為為 ,稱作樣本標,稱作樣本標準誤或均數(shù)標準誤。樣本標準誤是平均數(shù)抽樣誤準誤或均數(shù)標準誤。樣本標準誤是平均數(shù)抽樣誤差的估計值。若樣本中各觀測值為差的估計值。若樣本中各觀測值為, x1 , x2 ,xn ,則,則x) 1(/)() 1()(222nnnxxnnxxnSSxxxSnSnS 標 準 誤 標 準 誤樣本標準差與樣本標準誤的區(qū)別在于:樣本標準差與樣本標準誤的區(qū)別在于:n樣本標準差樣本標準差S是反映樣本中各觀測值是反映樣本中各觀測值x1,x2,xn 變異變異程度大小的一個指標,它的大小說明了程度大小的一個指標,它的大小說明了 對該樣本代對該樣本代表性的強弱。表性的強弱。
12、樣本標準誤是樣本平均數(shù)的標準差,它是樣本標準誤是樣本平均數(shù)的標準差,它是 抽樣抽樣誤差的估計值,其大小說明了樣本間變異程度的大誤差的估計值,其大小說明了樣本間變異程度的大小及小及 精確性的高低。精確性的高低。n 對于大樣本資料,常將樣本標準差對于大樣本資料,常將樣本標準差S與樣本平均數(shù)與樣本平均數(shù) 配合使用,記為配合使用,記為 S,用以說明所考察性狀或指標,用以說明所考察性狀或指標的優(yōu)良性與穩(wěn)定性。的優(yōu)良性與穩(wěn)定性。n對于小樣本資料,常將樣本標準誤對于小樣本資料,常將樣本標準誤 與樣本平均數(shù)與樣本平均數(shù)配合使用,記為配合使用,記為 ,用以表示所考察性狀或指,用以表示所考察性狀或指標的優(yōu)良性與抽
13、樣誤差的大小。標的優(yōu)良性與抽樣誤差的大小。xxxxxxSxSx正態(tài)總體樣本平均數(shù)的分布n正態(tài)總體樣本平均數(shù)的分布q設樣本來自正態(tài)總體 N( , 2),則樣本平均數(shù)也服從正態(tài)分布,其總體均數(shù)為 ,方差為 2/n。),(N2X),(N2nx2 N(0,1)xn正態(tài)總體樣本方差的 分布樣本方差的期望和方差樣本方差的期望和方差設樣本來自均數(shù)為設樣本來自均數(shù)為 ,方差為,方差為 2的總體的總體設樣本為簡單隨機樣本設樣本為簡單隨機樣本1)(22nxxsi) 1()()()(22222222nnxxxnxxxiii) 1() 1(222nsn)(221nXniinSXnSnnXt22) 1() 1(/) 1
14、 , 0(/NnX) 1() 1(222nSn2112221112122222221222(1)(1)(1,1)(1)(1)nSnSFF nnnSSn) 1, 1(212221nnFSSF) 1() 1(1221211nSn) 1() 1(2222222nSn2221當 時:121222121212221122221212()() (2)(1)(1)2XXnntt nnnSnSnn2212121212,XXNnn)2() 1() 1(2122222221211nnSnSn1212122211221212()() (2)(1)(1)112XXtt nnnSnSnnnn時:當22221參數(shù)估計n參
15、數(shù)估計的定義q以樣本統(tǒng)計量對總體參數(shù)進行估計n基本形式q點估計(point estimation)q區(qū)間估計(interval estimation)參數(shù)估計 - 點估計)(xg例:例:xxni1222)(11sxxni樣本觀測值樣本觀測值參數(shù)估計參數(shù)估計 - 點估計點估計 基本方法基本方法 - 構(gòu)造函數(shù)構(gòu)造函數(shù)g(x)的方法的方法 矩法:用與總體參數(shù)相應的樣本統(tǒng)計量作矩法:用與總體參數(shù)相應的樣本統(tǒng)計量作為估計值,必要時可對統(tǒng)計量作適當調(diào)整為估計值,必要時可對統(tǒng)計量作適當調(diào)整 最大似然法:用使樣本觀測值的似然函數(shù)最大似然法:用使樣本觀測值的似然函數(shù)達到最大的統(tǒng)計量作為估計值達到最大的統(tǒng)計量作為
16、估計值 最小二乘法:用使估計誤差平方和的統(tǒng)計最小二乘法:用使估計誤差平方和的統(tǒng)計量作為估計值量作為估計值 貝葉斯法:根據(jù)貝葉斯理論構(gòu)造估計量貝葉斯法:根據(jù)貝葉斯理論構(gòu)造估計量參數(shù)估計 - 點估計衡量估計值優(yōu)劣的指標衡量估計值優(yōu)劣的指標無偏性無偏性:)(E無偏估計:無偏估計:0)(E有偏估計:有偏估計:0)(E)(xE的無偏估計量是x參數(shù)估計 - 點估計n樣本方差的期望22222222222) 1()()()()()()()()(2)()()()(nnnnxnExExnxExnxxxExxExxEi222)(11)(xxEnsEis2是是 2的無的無偏估計量偏估計量參數(shù)估計 - 點估計抽樣方差抽
17、樣方差/標準誤:標準誤:估計值的方差估計值的方差/標準差標準差樣本平均數(shù)的抽樣方差:樣本平均數(shù)的抽樣方差:樣本方差的抽樣方差樣本方差的抽樣方差:nxVar2)(4212)(nsVar參數(shù)估計 - 點估計均方誤差均方誤差:22)()()(EVarE一致性:估計值隨著樣本的增大而更加接近一致性:估計值隨著樣本的增大而更加接近 真值真值有效性有效性: 抽樣方差達到最小的無偏估計抽樣方差達到最小的無偏估計充分性充分性: 估計函數(shù)包含了關于被估參數(shù)的全估計函數(shù)包含了關于被估參數(shù)的全 部信息部信息56參數(shù)估計 - 區(qū)間估計n由于估計量是隨機變量,所以一般都帶有一定由于估計量是隨機變量,所以一般都帶有一定的
18、隨機誤差,點估計僅僅給出了參數(shù)的一個估的隨機誤差,點估計僅僅給出了參數(shù)的一個估計值,有時候還需要了解這種估計結(jié)果的可靠計值,有時候還需要了解這種估計結(jié)果的可靠程度。程度。n用區(qū)間的的形式給出未知參數(shù)的變化范圍,并用區(qū)間的的形式給出未知參數(shù)的變化范圍,并賦予一定的概率保證,這便構(gòu)成了區(qū)間估計的賦予一定的概率保證,這便構(gòu)成了區(qū)間估計的基本思想。基本思想。n以一定的置信度對參數(shù)可能取值范圍的估計。以一定的置信度對參數(shù)可能取值范圍的估計。57參數(shù)估計 - 區(qū)間估計確定置信區(qū)間的步驟確定置信區(qū)間的步驟n計算樣本平均數(shù)計算樣本平均數(shù) ;n確定置信水平,一般用確定置信水平,一般用 1-=0.95或或0.99
19、,通過查表可確定分位數(shù);通過查表可確定分位數(shù);n求出標準誤求出標準誤 ,(總體標準差,總體標準差,n n樣樣本數(shù)本數(shù)) )。xnx參數(shù)估計 - 區(qū)間估計1)(21ttP1 - :置信度(置信水平)t1, t2:置信區(qū)間t1、t2:置信限(置信下限、置信上限)求統(tǒng)計量求統(tǒng)計量 t1和和 t2 ,使得對于給定的,使得對于給定的 (0 1,常用常用 =0.05和和 =0.01),有,有例如:參數(shù)估計 - 區(qū)間估計n正態(tài)總體平均數(shù)的區(qū)間估計(方差已知)),(2nNx1)(uxuPx1)(xxuxuxP當當 2已知已知標準正態(tài)分標準正態(tài)分布兩尾概率布兩尾概率分位點分位點) 1 , 0(Nxx參數(shù)估計 - 區(qū)間估計n正態(tài)總體平均數(shù)的區(qū)間估計(方差未知)當當 2未知未知) 1 , 0(Nxx) 1() 1(222nsn) 1( t) 1() 1(22nsxnsxnsnxxx參數(shù)估計 - 區(qū)間估計1)(tsxtPxt分布兩尾分布兩尾概率分位點概率分位點1)(xx
溫馨提示
- 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權益歸上傳用戶所有。
- 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預覽,若沒有圖紙預覽就沒有圖紙。
- 4. 未經(jīng)權益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
- 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負責。
- 6. 下載文件中如有侵權或不適當內(nèi)容,請與我們聯(lián)系,我們立即糾正。
- 7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。
最新文檔
- 2025年勞務派遣協(xié)議履行義務
- 2025年文化產(chǎn)業(yè)發(fā)展項目物資采購與運營合同3篇
- 2025年投資咨詢顧問綜合解決方案合作協(xié)議3篇
- 2025年加盟連鎖合作合同
- 2025年地基勘察協(xié)議
- 二零二五版智能自動化生產(chǎn)線合作建設合同3篇
- 2025年度爐渣環(huán)保處理與采購質(zhì)量保障合同4篇
- 2025年綠色環(huán)保型水泥沙石供應商合作合同范本3篇
- 2025年物流倉儲行車維修承包合同協(xié)議3篇
- 二零二五版第3章電子合同電子檔案存儲標準3篇
- 環(huán)境保護應急管理制度執(zhí)行細則
- 2024-2030年中國通航飛行服務站(FSS)行業(yè)發(fā)展模式規(guī)劃分析報告
- 機械制造企業(yè)風險分級管控手冊
- 地系梁工程施工方案
- 藏文基礎-教你輕輕松松學藏語(西藏大學)知到智慧樹章節(jié)答案
- 2024電子商務平臺用戶隱私保護協(xié)議3篇
- 安徽省蕪湖市2023-2024學年高一上學期期末考試 英語 含答案
- 電力工程施工安全風險評估與防控
- 醫(yī)學教程 常見體表腫瘤與腫塊課件
- 內(nèi)分泌系統(tǒng)異常與虛勞病關系
- 智聯(lián)招聘在線測評題
評論
0/150
提交評論