版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進行舉報或認(rèn)領(lǐng)
文檔簡介
關(guān)于總體均數(shù)和總體率第1頁,講稿共62頁,2023年5月2日,星期三第一節(jié)均數(shù)抽樣誤差與t分布欲了解總體的特征,最直接的方法是對總體中的每個觀察單位進行測量,通過整理分析得到總體參數(shù),但這在醫(yī)學(xué)研究實際中往往是不可能實現(xiàn)的。通常應(yīng)用抽樣研究,通過樣本指標(biāo)來了解總體特征。第2頁,講稿共62頁,2023年5月2日,星期三抽樣研究所得樣本均數(shù)會不會恰好等于未知的總體均數(shù)呢?如果固定樣本含量n從同一總體中進行多次抽樣,所得樣本均數(shù)又會如何呢?第3頁,講稿共62頁,2023年5月2日,星期三假設(shè)已知某地30歲-40歲正常男性血清總膽固醇的均值為5.0mmol/L,標(biāo)準(zhǔn)差為0.6mmol/L?,F(xiàn)從該總體中進行隨機抽樣,每次抽取30名正常男子,并測得他們的血清總膽固醇水平,最終共抽取100份樣本,并計算出每份樣本的均數(shù)。第4頁,講稿共62頁,2023年5月2日,星期三第5頁,講稿共62頁,2023年5月2日,星期三由個體變異產(chǎn)生的,隨機抽樣引起的樣本統(tǒng)計量與總體參數(shù)之間的差異稱為抽樣誤差(samplingerror)。抽樣造成的樣本均數(shù)與總體均數(shù)間的差異就稱為均數(shù)的抽樣誤差。在抽樣研究中,抽樣誤差是不可避免的,但抽樣誤差分布具有一定的規(guī)律性。第6頁,講稿共62頁,2023年5月2日,星期三圖3-1從正態(tài)分布總體N(5.0,0.62)中隨機抽樣所得樣本均數(shù)的分布第7頁,講稿共62頁,2023年5月2日,星期三樣本均數(shù)大部分分布在總體均數(shù)5.0的左右,中間多、兩邊少,左右基本對稱,服從正態(tài)分布,并且樣本均數(shù)的變異范圍比原變量的變異范圍要小很多。第8頁,講稿共62頁,2023年5月2日,星期三樣本均數(shù)的標(biāo)準(zhǔn)差稱為均數(shù)的標(biāo)準(zhǔn)誤,簡稱標(biāo)準(zhǔn)誤,用符號表示。均數(shù)的標(biāo)準(zhǔn)誤說明各樣本均數(shù)圍繞總體均數(shù)的離散程度,可用來反映樣本均數(shù)的抽樣誤差大小。第9頁,講稿共62頁,2023年5月2日,星期三中心極限定理從正態(tài)總體N(,2)中,隨機抽取例數(shù)為n的樣本,樣本均數(shù)也服從正態(tài)分布;即使從偏態(tài)總體隨機抽樣,當(dāng)n足夠大時(n≥50),樣本均數(shù)近似正態(tài)分布。第10頁,講稿共62頁,2023年5月2日,星期三從均數(shù)為,標(biāo)準(zhǔn)差為的正態(tài)或偏態(tài)總體中,抽取例數(shù)為n的樣本,樣本均數(shù)的總體均數(shù)也為,標(biāo)準(zhǔn)差與原標(biāo)準(zhǔn)差成正比,與樣本例數(shù)的平方根成反比。第11頁,講稿共62頁,2023年5月2日,星期三第12頁,講稿共62頁,2023年5月2日,星期三越大,樣本均數(shù)的分布越分散,樣本均數(shù)與總體均數(shù)的差別越大,抽樣誤差越大,由樣本均數(shù)估計總體均數(shù)的可靠性越小。反之,越小,樣本均數(shù)的分布越集中,樣本均數(shù)與總體均數(shù)的差別越小,抽樣誤差越小,由樣本均數(shù)估計總體均數(shù)的可靠性越大。第13頁,講稿共62頁,2023年5月2日,星期三的大小與成正比,與成反比。當(dāng)固定不變時,樣本含量n增大,減小。因此,在實際工作中,可通過適當(dāng)增加樣本含量來減小抽樣誤差。第14頁,講稿共62頁,2023年5月2日,星期三常未知,用S估計,因此均數(shù)標(biāo)準(zhǔn)誤的估計值為第15頁,講稿共62頁,2023年5月2日,星期三t分布的演化第16頁,講稿共62頁,2023年5月2日,星期三常未知,若用,這時對樣本均數(shù)進行的不是Z變換而是t變換統(tǒng)計量t不再服從N(0,1)標(biāo)準(zhǔn)正態(tài)分布第17頁,講稿共62頁,2023年5月2日,星期三英國統(tǒng)計學(xué)家W.S.Gosset于1908年以“Student”筆名發(fā)表論文,證明統(tǒng)計量t服從v=n-1的t分布第18頁,講稿共62頁,2023年5月2日,星期三又稱為Studentt分布(Student’st-distribution)第19頁,講稿共62頁,2023年5月2日,星期三t分布的圖形及特征第20頁,講稿共62頁,2023年5月2日,星期三t分布的特征為:①以0為中心,左右對稱的單峰分布②越小,t值越分散,峰越矮,尾越高增大,t分布逐漸逼近Z分布,時,t分布即為Z分布第21頁,講稿共62頁,2023年5月2日,星期三t
界值表橫標(biāo)目:自由度縱標(biāo)目:概率P(曲線下面積)表中數(shù)字:自由度為,概率P為時,所對應(yīng)的t界值,記為t,
第22頁,講稿共62頁,2023年5月2日,星期三單側(cè):或雙側(cè):即第23頁,講稿共62頁,2023年5月2日,星期三在相同自由度時,t的絕對值越大,P越小在相同P值時,自由度越大所對應(yīng)的t界值越小在相同t值時,雙側(cè)概率P為單側(cè)概率P的兩倍時,t界值即為Z界值第24頁,講稿共62頁,2023年5月2日,星期三第二節(jié)總體均數(shù)的點估計與區(qū)間估計點估計(pointestimation):將樣本統(tǒng)計量直接作為總體參數(shù)的估計值區(qū)間估計(intervalestimation):按事先給定的概率,估計包含未知總體參數(shù)的一個可能范圍第25頁,講稿共62頁,2023年5月2日,星期三區(qū)間估計的實質(zhì)假設(shè)某個總體的均數(shù)為,需要找到兩個量A和B,使得在一個比較高的可信度下(如95%),區(qū)間(A,B)能包含
。即P(A<<B)=0.95第26頁,講稿共62頁,2023年5月2日,星期三可信區(qū)間的定義按一定的概率或可信度(1-α)估計包含未知總體參數(shù)的可能范圍,該范圍通常稱為參數(shù)的可信區(qū)間或者置信區(qū)間(confidenceinterval,CI),預(yù)先給定的概率(1-α)稱為可信度或者置信度(confidencelevel),常取95%或99%可信區(qū)間(CL,CU)為開區(qū)間,CL、CU稱可信限第27頁,講稿共62頁,2023年5月2日,星期三總體均數(shù)可信區(qū)間的計算當(dāng)σ已知在總體中抽樣,樣本均數(shù)的Z變換值有95%可能性落在(-1.96,1.96)之間在總體中抽樣,樣本均數(shù)所計算的區(qū)間有95%可能包括總體均數(shù)第28頁,講稿共62頁,2023年5月2日,星期三2.5%2.5%95%第29頁,講稿共62頁,2023年5月2日,星期三
未知但n足夠大(n>50)第30頁,講稿共62頁,2023年5月2日,星期三例6-3中,因n=120,,,試求該地正常成年男性血清膽固醇平均水平的95%可信區(qū)間。即(3.55,4.17)mmol/L第31頁,講稿共62頁,2023年5月2日,星期三例6-1從某地隨機抽取120名30歲-40歲正常男性,得其血清總膽固醇水平的均數(shù)為4.95mmol/L,標(biāo)準(zhǔn)差為0.64mmol/L,試估計該地30歲-40歲正常男性血清總膽固醇平均水平的95%可信區(qū)間。第32頁,講稿共62頁,2023年5月2日,星期三因n=120,屬于未知但n足夠大,又均數(shù)為4.95mmol/L,標(biāo)準(zhǔn)差為0.64mmol/L,故該地30歲-40歲正常男性血清總膽固醇平均水平的95%可信區(qū)間為即(4.84,5.06)mmol/L第33頁,講稿共62頁,2023年5月2日,星期三當(dāng)σ未知n較小-t/2,v0t/2,v
第34頁,講稿共62頁,2023年5月2日,星期三可信區(qū)間的涵義從總體中作隨機抽樣,每個樣本可以算得一個可信區(qū)間。如95%可信區(qū)間意味著做100次抽樣,算得100個可信區(qū)間,平均有95個估計正確。在實際研究中,一般只進行一次抽樣,算得一個可信區(qū)間,對于這個可信區(qū)間來說,我們就認(rèn)為該區(qū)間包含了總體均數(shù),把握度為95%。第35頁,講稿共62頁,2023年5月2日,星期三圖6-5從N(0,1)中隨機抽樣算得的100個95%可信區(qū)間(n=10)第36頁,講稿共62頁,2023年5月2日,星期三可信區(qū)間的兩個要素可信度:可靠性,即1-α。一般取90%、95%,可人為控制區(qū)間的寬度:區(qū)間的大?。▍^(qū)間的長度),越小越好必須二者兼顧第37頁,講稿共62頁,2023年5月2日,星期三均數(shù)的可信區(qū)間與參考值范圍的區(qū)別第38頁,講稿共62頁,2023年5月2日,星期三第三節(jié)總體率的點估計與區(qū)間估計第39頁,講稿共62頁,2023年5月2日,星期三一、二項分布如某實驗中小白鼠染毒后死亡概率P為0.8,則生存概率為=1-P=0.2,1、對一只小白鼠進行實驗的結(jié)果為:死(概率為P)或生(概率為1-P)2、對二只小白鼠(甲乙)進行實驗的結(jié)果為:甲乙均死(概率為P2)、甲死乙生[概率為P(1-P)]、乙死甲生[概率為(1-P)P]或甲乙均生[概率為(1-P)2],概率相加得P2+P(1-P)+(1-P)P+(1-P)2=[P+(1-P)]23、依此類推,對n只小白鼠進行實驗,所有可能結(jié)果的概率相加得Pn+cn1P(1-P)n-1+...+cnxPx(1-P)n-x+...+(1-P)x=[P+(1-P)]n其中n為樣本含量,即事件發(fā)生總數(shù),x為某事件出現(xiàn)次數(shù),cnxPx(1-P)n-x為二項式通式,cnx=n!/x!(n-x)!,P為總體率。因此,二項分布是說明結(jié)果只有兩種情況的n次實驗中發(fā)生某種結(jié)果為x次的概率分布。其概率密度為:
P(x)=cnxPx(1-P)n-x,x=0,1,...n。:第40頁,講稿共62頁,2023年5月2日,星期三二項分布的圖形第41頁,講稿共62頁,2023年5月2日,星期三當(dāng)=0.5時,分布對稱;當(dāng)
0.5,分布呈偏態(tài);當(dāng)<0.5時分布呈正偏態(tài);當(dāng)>0.5時分布呈負(fù)偏態(tài);特別是當(dāng)n值不是很大時,偏離0.5愈遠(yuǎn),分布愈偏第42頁,講稿共62頁,2023年5月2日,星期三隨著n的增大,二項分布逐漸逼近正態(tài)分布。如
=0.30,n=5和n=10時,圖形呈偏態(tài),當(dāng)n=30時,圖形已接近正態(tài)分布。一般地說,如果n或n(1-)大于5時,??捎谜龖B(tài)近似原理處理二項分布問題第43頁,講稿共62頁,2023年5月2日,星期三二項分布的性質(zhì):累積概率(1)二項分布的概率之和等于1第44頁,講稿共62頁,2023年5月2日,星期三(2)單側(cè)累積概率至多有m例陽性的概率(下側(cè)累積概率)至少有m例陽性的概率(上側(cè)累積概率)第45頁,講稿共62頁,2023年5月2日,星期三二項分布的性質(zhì):均數(shù)和方差陽性結(jié)果發(fā)生數(shù)X的總體均數(shù)總體方差總體標(biāo)準(zhǔn)差第46頁,講稿共62頁,2023年5月2日,星期三二項分布的抽樣分布及其性質(zhì)二項分布的隨機抽樣性質(zhì)仍然被中心極限定理所反映在n足夠大時,樣本率近似服從正態(tài)分布樣本率p的均數(shù)等于π樣本率p的標(biāo)準(zhǔn)差(率的標(biāo)準(zhǔn)誤)第47頁,講稿共62頁,2023年5月2日,星期三二、Poisson分布當(dāng)二項分布中n很大,p很小時,二項分布就變?yōu)镻oisson分布,Poisson分布實際上是二項分布的極限分布法國數(shù)學(xué)家SimeonDenisPoisson(1781-1840)1837年在《關(guān)于判斷的概率之研究》一文中提出的描述隨機現(xiàn)象的一種常用分布第48頁,講稿共62頁,2023年5月2日,星期三Poisson分布也是一種重要的離散型概率分布,用于研究單位時間、單位人群、單位空間內(nèi),某稀有事件發(fā)生次數(shù)的分布單位體積水中細(xì)菌數(shù)單位體積空氣中粉塵數(shù)單位時間內(nèi)放射性物質(zhì)放射出的質(zhì)點數(shù)單位空間中某些昆蟲數(shù)一定人群中惡性腫瘤或罕見非傳染性疾病患病數(shù)或死亡數(shù)第49頁,講稿共62頁,2023年5月2日,星期三可以認(rèn)為滿足以下三個條件的隨機變量服從Poisson分布:平穩(wěn)性:X的取值與觀察單位的位置無關(guān),只與觀察單位的大小有關(guān)獨立性:在某個觀察單位上X的取值與前面各觀察單位上X的取值獨立(無關(guān))普通性:在充分小的觀察單位上X的取值最多為1第50頁,講稿共62頁,2023年5月2日,星期三Poisson分布的概率函數(shù)若隨機變量的概率函數(shù)為:則稱此變量服從Poisson分布,記為第51頁,講稿共62頁,2023年5月2日,星期三Poisson分布的累計概率第52頁,講稿共62頁,2023年5月2日,星期三Poisson分布的圖形第53頁,講稿共62頁,2023年5月2日,星期三Poisson分布的性質(zhì)均數(shù)和方差Poisson分布的均數(shù)和方差相等,均為λ
;即第54頁,講稿共62頁,2023年5月2日,星期三Poisson分布中均數(shù)的抽樣分布及其性質(zhì)在λ足夠大時,Poisson分布的平均計數(shù)近似正態(tài)分布平均計數(shù)的標(biāo)準(zhǔn)誤n=1時(1個單位),第55頁,講稿共62頁,2023年5月2日,星期三三、總體率的估計根據(jù)樣本率,也可以對總體率做出點估計和區(qū)間估計。我們用樣本率p作為總體率π的點估計值??傮w率的點估計亦未考慮其抽樣誤差大小,而總體率的區(qū)間估計克服了點估計的缺陷。第56頁,講稿共62頁,2023年5月2日,星期三利用樣本資料可估計二項分布總體率的1-α可信區(qū)間,α取0.05或0.01。對于,且接近于0或1
溫馨提示
- 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
- 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
- 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
- 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負(fù)責(zé)。
- 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請與我們聯(lián)系,我們立即糾正。
- 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時也不承擔(dān)用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。
最新文檔
- 住宅建筑中的家庭健身房設(shè)計考核試卷
- 2025年房產(chǎn)再次抵押借款協(xié)議3篇
- 《尤為聰穎的生物》(節(jié)選)翻譯實踐報告
- 基于BOPPPS教學(xué)模式的泰國中級漢語綜合課《他們是練太極劍的》教學(xué)設(shè)計
- 2025年度貨物采購合同標(biāo)的質(zhì)量標(biāo)準(zhǔn)協(xié)議3篇
- 專用鋼結(jié)構(gòu)施工2024分包協(xié)議樣本版A版
- 個體加工承攬合同書2024版版B版
- 臨時雇傭協(xié)議范本2024年標(biāo)準(zhǔn)版版
- 2025年全球及中國科研用移液器吸頭行業(yè)頭部企業(yè)市場占有率及排名調(diào)研報告
- 2025年度大型橋梁工程鋼筋供應(yīng)合同范本3篇
- 2025南方財經(jīng)全媒體集團校園招聘63人高頻重點提升(共500題)附帶答案詳解
- 《A機場公司人力資源管理工作實踐調(diào)研報告》2600字(論文)
- 社工人才培訓(xùn)計劃實施方案
- 6、水平四+田徑18課時大單元計劃-《雙手頭上前擲實心球》
- 青島版科學(xué)四年級下冊課程綱要
- 《無人機法律法規(guī)知識》課件-第1章 民用航空法概述
- 部編人教版六年級下冊語文1-6單元作文課件
- NB/T 11434.5-2023煤礦膏體充填第5部分:膠凝材料技術(shù)要求
- 2020-2024年安徽省初中學(xué)業(yè)水平考試中考物理試卷(5年真題+答案解析)
- 手術(shù)器械與敷料的傳遞
- 提高護士手衛(wèi)生執(zhí)行率PDCA案例匯報課件(32張)
評論
0/150
提交評論