版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進(jìn)行舉報或認(rèn)領(lǐng)
文檔簡介
1、樣本隨機(jī)抽取部分觀察單位 ? 推斷推斷(tudun)inferen(tudun)inferenceceX參數(shù)估計參數(shù)估計第1頁/共46頁第一頁,共47頁。一、抽樣誤差與標(biāo)準(zhǔn)(biozhn)誤第2頁/共46頁第二頁,共47頁。 jjXS 167.41, 2.74 165.56, 6.57 168.20, 5.36 165.69, 5.09 nj=10 100 個 =167.7cm =5.3cm X1,X2,X3,Xi, 2009年某市18歲男生(nnshng)身高N(167.7, 5.32)的抽樣示意圖 第3頁/共46頁第三頁,共47頁。 將此100個樣本均數(shù)看成新變量值,則這100個樣本均數(shù)構(gòu)
2、成(guchng)一新分布,繪制頻數(shù)圖從正態(tài)分布總體N(167.7, 5.32)隨機(jī)抽樣所得樣本(yngbn)均數(shù)分布第4頁/共46頁第四頁,共47頁。 ,各樣本均數(shù) 未必等于總體均數(shù); 各樣本均數(shù)間存在差異; 樣本均數(shù)的分布為中間多,兩邊(lingbin)少,左右基本對稱。 樣本均數(shù)的變異范圍較之原變量的變異范圍大大縮小??伤愕眠@100個樣本均數(shù)的均數(shù)為167.69cm、標(biāo)準(zhǔn)差為1.69cm。XX 樣本均數(shù)分布(fnb)具有如下特點(diǎn):第5頁/共46頁第五頁,共47頁。1、抽樣誤差:、抽樣誤差: 由個體變異(biny)產(chǎn)生的、抽樣造成的樣本統(tǒng)計量與總體參數(shù)的差別 原因:1)抽樣 2)個體差異第
3、6頁/共46頁第六頁,共47頁。表示樣本統(tǒng)計量抽樣誤差大小(dxio)的統(tǒng)計指標(biāo)。標(biāo)準(zhǔn)誤:說明抽樣誤差的大小(dxio),總體計算公式(7-27)Xn2、標(biāo)準(zhǔn)、標(biāo)準(zhǔn)(biozhn)誤誤(standard error, SE)實(shí)質(zhì)(shzh):樣本均數(shù)的標(biāo)準(zhǔn)差第7頁/共46頁第七頁,共47頁。若用樣本(yngbn)標(biāo)準(zhǔn)差s 來估計 , (7-28)XSSn當(dāng)樣本例數(shù)n一定(ydng)時,標(biāo)準(zhǔn)誤與標(biāo)準(zhǔn)差呈正比當(dāng)標(biāo)準(zhǔn)差一定(ydng)時,標(biāo)準(zhǔn)誤與樣本含量n的平方根呈反比。通過增加(zngji)樣本含量n來降低抽樣誤差。第8頁/共46頁第八頁,共47頁。隨機(jī)抽樣調(diào)查7歲男孩(nn hi)120名,的身
4、高均數(shù)為120.88,標(biāo)準(zhǔn)差為5.23,則其標(biāo)準(zhǔn)誤是多少?例子(l zi):48. 0nsxs第9頁/共46頁第九頁,共47頁。指標(biāo)指標(biāo)意義意義應(yīng)用應(yīng)用標(biāo)準(zhǔn)差標(biāo)準(zhǔn)差(s s)衡量變量值變異程度,衡量變量值變異程度,s s越大表示變量值變異程度越大表示變量值變異程度越大,越大,s s越小表示變量值越小表示變量值變異程度越小變異程度越小描述正態(tài)分布(近似正描述正態(tài)分布(近似正態(tài)分布)資料的頻數(shù)分態(tài)分布)資料的頻數(shù)分布;醫(yī)學(xué)參考值范圍的布;醫(yī)學(xué)參考值范圍的估計估計標(biāo)準(zhǔn)誤標(biāo)準(zhǔn)誤( )樣本均數(shù)的變異程度,表樣本均數(shù)的變異程度,表示抽樣誤差的大小。示抽樣誤差的大小。標(biāo)準(zhǔn)標(biāo)準(zhǔn)誤越大表示抽樣誤差越大,誤越大表
5、示抽樣誤差越大,樣本均數(shù)的可靠性越??;標(biāo)樣本均數(shù)的可靠性越小;標(biāo)準(zhǔn)誤越小表示抽樣誤差越小,準(zhǔn)誤越小表示抽樣誤差越小,樣本均數(shù)的可靠性越大樣本均數(shù)的可靠性越大總體均數(shù)區(qū)間估計;兩總體均數(shù)區(qū)間估計;兩個或多個總體均數(shù)間比個或多個總體均數(shù)間比較較XS標(biāo)準(zhǔn)標(biāo)準(zhǔn)(biozhn)差和標(biāo)準(zhǔn)差和標(biāo)準(zhǔn)(biozhn)誤的區(qū)別誤的區(qū)別第10頁/共46頁第十頁,共47頁。二、t 分布(fnb)(一)(一)t分布分布(fnb)概念概念 第11頁/共46頁第十一頁,共47頁。隨機(jī)變量隨機(jī)變量(su j (su j bin bin lin)Xlin)XN N(m m,s2s2)標(biāo)準(zhǔn)標(biāo)準(zhǔn)(biozhn)(biozhn)正態(tài)
6、分布正態(tài)分布N N(0 0,1212)z變換(binhun)Xz第12頁/共46頁第十二頁,共47頁。第13頁/共46頁第十三頁,共47頁。, 1XXXtnSSn 式中 為自由度(degree of freedom, df) 3實(shí)際工作中,由于 未知,用 代替,則 不再服從(fcng)標(biāo)準(zhǔn)正態(tài)分布,而服從(fcng)t 分布。 XXS() /XXS第14頁/共46頁第十四頁,共47頁。均數(shù)標(biāo)準(zhǔn)(biozhn)正態(tài)分布N(0,12)),(2nN1,nvSXnSXtXStudent t分布(fnb)自由度:n-1XnXz/第15頁/共46頁第十五頁,共47頁。(二)t 分布的圖形(txng)與特征
7、 分布只有一個參數(shù),即自由度t第16頁/共46頁第十六頁,共47頁。 t-5.0-4.0-3.0-2.0-1.00.01.02.03.04.05.0(標(biāo)準(zhǔn)正態(tài)曲線)=5=1f(t)圖 不同(b tn)自由度下的t 分布圖第17頁/共46頁第十七頁,共47頁。 單峰分布,以單峰分布,以 0 為中心,左右對稱;為中心,左右對稱; 自由度自由度越小,則越小,則 t 值越分散,值越分散,t 分布的峰部分布的峰部越矮而尾部翹得越高;越矮而尾部翹得越高; 當(dāng)當(dāng)逼近逼近 , 逼近逼近 , t 分布逼近分布逼近 z 分布,分布,故標(biāo)準(zhǔn)正態(tài)分布是故標(biāo)準(zhǔn)正態(tài)分布是 t 分布的特例。分布的特例。 XXS1特征(tz
8、hng): 第18頁/共46頁第十八頁,共47頁。 3t 界界值表:詳見附表值表:詳見附表 2,可反映,可反映 t 分布曲下的面積。分布曲下的面積。 單側(cè)概率或單尾概率:用單側(cè)概率或單尾概率:用,t 表示;表示; 雙側(cè)概率或雙尾概率:用雙側(cè)概率或雙尾概率:用2、 t界值表:界值表:詳見附表詳見附表2,可反映,可反映t分布曲線下的面積。分布曲線下的面積。單側(cè)概率或單尾概率:用單側(cè)概率或單尾概率:用 表示;表示;雙側(cè)概率或雙尾概率:用雙側(cè)概率或雙尾概率:用 表示。表示。 表示;表示; 雙側(cè)概率或雙尾概率:用雙側(cè)概率或雙尾概率:用/2,t表示。表示。 第19頁/共46頁第十九頁,共47頁。-tt0第
9、20頁/共46頁第二十頁,共47頁。0.05,10101.812t,單 =0.05,則有 (1.812)0.05 (1.812)0.05P tP t 或 0.05/2,10102.228t,雙 =0.05,則有 (2.228)(2.228)0.05P tP t 舉例舉例(j l): 第21頁/共46頁第二十一頁,共47頁。三、參數(shù)估計用樣本統(tǒng)計量推斷總體(zngt)參數(shù)??傮w(zngt)均數(shù)估計:用樣本均數(shù)(和標(biāo)準(zhǔn)差)推斷總體(zngt)均數(shù)。第22頁/共46頁第二十二頁,共47頁。1.點(diǎn)估計(point estimation):用相應(yīng)樣本(yngbn)統(tǒng)計量直接作為其總體參數(shù)的估計值。如用
10、估計、s估計 等。其方法雖簡單,但未考慮抽樣誤差的大小。X第23頁/共46頁第二十三頁,共47頁。 按預(yù)先(yxin)給定的概率(1)所確定的包含未知總體參數(shù)的一個范圍。 總體均數(shù)的區(qū)間估計:按預(yù)先(yxin)給定的概率(1)所確定的包含未知總體均數(shù)的一個范圍。 如給定=0.05,該范圍稱為參數(shù)的95%可信區(qū)間或置信區(qū)間; 如給定=0.01,該范圍稱為參數(shù)的99%可信區(qū)間或置信區(qū)間。2區(qū)間(q jin)估計(interval estimation):第24頁/共46頁第二十四頁,共47頁。計算總體均數(shù)可信區(qū)間需考慮: (1)總體標(biāo)準(zhǔn)差是否已知, (2)樣本含量n的大小通常有兩類方法(fngf)
11、: (1)t分布法 (2)z分布法第25頁/共46頁第二十五頁,共47頁。2,2, 50,故可采用正態(tài)近似的方法計算可信區(qū)間。 今 =3.64、s=1.20、n=200、xs=0.0849, 取雙尾 0.05 得0.05/21.96u。 3.641.96 0.0849(3.47, 3.81)(mmol/L) X第31頁/共46頁第三十一頁,共47頁。四、四、 假設(shè)檢驗的基本概念和步驟假設(shè)檢驗的基本概念和步驟(bzhu)(bzhu)第32頁/共46頁第三十二頁,共47頁。例 大規(guī)模調(diào)查表明,健康成年男子血紅蛋白的均數(shù)為136.0g/L,今隨機(jī)調(diào)查某單位食堂成年男性炊事員25名,測得其血紅蛋白均數(shù)
12、121g/L,標(biāo)準(zhǔn)差48.8g/L。 問題:根據(jù)資料推論食堂炊事員血紅蛋白均數(shù)是否與健康成年男子血紅蛋白均數(shù)有無(yu w)差別(一) 假設(shè)檢驗的基本(jbn)思想第33頁/共46頁第三十三頁,共47頁。假設(shè)檢驗?zāi)康呐袛?pndun)差別是由哪種原因造成的。 抽樣誤差造成的; 本質(zhì)(bnzh)差異造成的。;/8 .48,/121,25,/0 .1360LgSLgXnLg0X造成(zo chn) 的可能原因有二:案例第34頁/共46頁第三十四頁,共47頁。炊事員血紅蛋白(xuhng dnbi)總體均數(shù) 136.0g/L 121g/L炊事員血紅蛋白(xuhng dnbi)總體均數(shù) 138.0g/L
13、X 一種一種(y (y zhn)zhn)假設(shè)假設(shè)H0H0另一種假設(shè)另一種假設(shè)H1抽樣誤差抽樣誤差總體不同總體不同第35頁/共46頁第三十五頁,共47頁。 假定假如炊事員均數(shù)為136.0g/L,即 則 ,服從t 分布,絕大多數(shù)t應(yīng)該分布在主要區(qū)域 根據(jù) t 分布能夠計算出有如此(rc)大差異的概率P ,如果P 值很小,即計算出的t 值超出了給定的界限,則傾向于拒絕H0,認(rèn)為山區(qū)血紅蛋白均數(shù)不是136.0g/L0 .136:0dHnSXt/0 第36頁/共46頁第三十六頁,共47頁。假設(shè)檢驗的基本思想假設(shè)檢驗的基本思想利用利用(lyng)小概率反證法的思小概率反證法的思想想利用小概率反證法思想,從
14、問題的對立面(H0)出發(fā)間接判斷要解決的問題(H1)是否成立。然后在H0成立的條件下計算檢驗統(tǒng)計量,最后獲得P值來判斷。當(dāng)P小于或等于預(yù)先規(guī)定的概率值,就是小概率事件。根據(jù)小概率事件的原理:小概率事件在一次抽樣中發(fā)生的可能性很小,如果他發(fā)生了,則有理由(lyu)懷疑原假設(shè)H0,認(rèn)為其對立面H1成立第37頁/共46頁第三十七頁,共47頁。1.建立檢驗假設(shè),確定檢驗水準(zhǔn)(選用單側(cè)或雙側(cè)檢驗)(1)無效假設(shè),記為H0;(2)備擇假設(shè),記為H1。對于(duy)檢驗假設(shè),須注意:1)檢驗假設(shè)是針對總體而言,而不是針對樣本;2)H0和H1是相互聯(lián)系,對立的假設(shè),后面的結(jié)論是根據(jù)H0和H1作出的,因此兩者不
15、是可有可無,而是缺一不可二、假設(shè)檢驗的基本(jbn)步驟第38頁/共46頁第三十八頁,共47頁。3)H1的內(nèi)容直接反映(fnyng)了檢驗單雙側(cè)。若H1中只是 0 或只是 0,則此檢驗為單側(cè)檢驗。它不僅考慮有無差異,而且還考慮差異的方向。 4)單雙側(cè)檢驗的確定,首先根據(jù)專業(yè)知識,其次根據(jù)所要解決的問題來確定。若從專業(yè)上看一種方法結(jié)果不可能低于或高于另一種方法結(jié)果,此時應(yīng)該用單側(cè)檢驗。一般認(rèn)為雙側(cè)檢驗較保守和穩(wěn)妥。第39頁/共46頁第三十九頁,共47頁。 (3) 檢驗水準(zhǔn),是預(yù)先規(guī)定的概率(gil)值,它確定了小概率(gil)事件的標(biāo)準(zhǔn)。在實(shí)際工作中常取 = 0.05。可根據(jù)不同研究目的給予不同
16、設(shè)置。例如本題:0 .136:00H01:H = 0.05第40頁/共46頁第四十頁,共47頁。2. 計算檢驗統(tǒng)計(tngj)量根據(jù)變量和資料類型、設(shè)計方案、統(tǒng)計(tngj)推斷的目的、是否滿足特定條件等(如數(shù)據(jù)的分布類型)選擇相應(yīng)的檢驗統(tǒng)計(tngj)量。 如 t 檢驗、z檢驗、F檢驗和 檢驗等。2第41頁/共46頁第四十一頁,共47頁。本例采用(ciyng)t檢驗方法本例t值為1.540, 1XXXXtnSSnSn第42頁/共46頁第四十二頁,共47頁。 是指根據(jù)所計算的檢驗統(tǒng)計量確定H0成立的可能性大小,即確定在檢驗假設(shè)條件下由抽樣誤差引起差別的概率。 3. 確定P值,做出推斷結(jié)論 查表得到檢驗(jinyn)用的臨界值,然后將算得的統(tǒng)計量與拒絕域的臨界值作比較,確 定 P 值 。 如 對 雙 側(cè) t 檢 驗(jinyn) ,則 ,按檢驗(jinyn)水準(zhǔn) 拒絕H0。 /2()t| t |P 第43頁/共46頁第四十三頁,共47頁。本例查t界值表自由度v=24,t=1.54按照a=0.05的水準(zhǔn)(shuzhn),不拒絕H0,差異沒有統(tǒng)計學(xué)意義,還不能認(rèn)為炊事員血紅蛋白和健康成年男子有差別。
溫馨提示
- 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
- 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
- 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
- 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負(fù)責(zé)。
- 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請與我們聯(lián)系,我們立即糾正。
- 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時也不承擔(dān)用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。
最新文檔
- 2025年西藏電子勞動合同推廣與應(yīng)用信息反饋合同3篇
- 2025年滕秋離婚協(xié)議書保障婚姻解除權(quán)益6篇
- 2025年度高校與企業(yè)實(shí)踐技能培訓(xùn)協(xié)議范本2篇
- 2025房屋借住合同范本
- 個人抵押借款合同協(xié)議范文
- 2025電腦網(wǎng)絡(luò)維護(hù)合同范
- 年度專業(yè)設(shè)計服務(wù)產(chǎn)業(yè)分析報告
- 場地租賃合同書范文
- 2025煤炭儲運(yùn)承包合同
- 專家聘用協(xié)議書范文
- 2024年黑河嫩江市招聘社區(qū)工作者考試真題
- 第22單元(二次函數(shù))-單元測試卷(2)-2024-2025學(xué)年數(shù)學(xué)人教版九年級上冊(含答案解析)
- 藍(lán)色3D風(fēng)工作總結(jié)匯報模板
- 安全常識課件
- 河北省石家莊市2023-2024學(xué)年高一上學(xué)期期末聯(lián)考化學(xué)試題(含答案)
- 2024年江蘇省導(dǎo)游服務(wù)技能大賽理論考試題庫(含答案)
- 2024年中考英語閱讀理解表格型解題技巧講解(含練習(xí)題及答案)
- 新版中國食物成分表
- 浙江省溫州市溫州中學(xué)2025屆數(shù)學(xué)高二上期末綜合測試試題含解析
- 2024年山東省青島市中考生物試題(含答案)
- 保安公司市場拓展方案-保安拓展工作方案
評論
0/150
提交評論