




版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進行舉報或認領(lǐng)
文檔簡介
參數(shù)估計基礎(chǔ)---抽樣分布1參數(shù)估計基礎(chǔ)---抽樣分布1抽樣誤差從總體均數(shù)為155.4cm,標準差為5.3cm的正態(tài)分布總體中隨機抽樣。樣本大小為30n=30…….2抽樣誤差從總體均數(shù)為155.4cm,標準差為5.從正態(tài)總體抽樣得到的1000個樣本均數(shù)的頻數(shù)分布(ni=30)3從正態(tài)總體抽樣得到的10Mean=155.426Std=0.9664Mean=155.426Std=0.9664抽樣誤差結(jié)果:各樣本均數(shù)不一定等于總體均數(shù)樣本均數(shù)間存在差異樣本均數(shù)的分布規(guī)律:圍繞總體均數(shù)上下波動樣本均數(shù)的變異:由樣本均數(shù)的標準差描述。5抽樣誤差結(jié)果:5抽樣誤差抽樣誤差Samplingerror由抽樣引起的樣本統(tǒng)計量與總體參數(shù)間的差異來源:個體變異抽樣表現(xiàn)樣本統(tǒng)計量與總體參數(shù)間的差異樣本統(tǒng)計量間的差異6抽樣誤差抽樣誤差Samplingerror6樣本均數(shù)的規(guī)律性隨機的在概率意義下是有規(guī)律的---抽樣分布通過大量重復(fù)抽樣,借助頻數(shù)表描述樣本均數(shù)的變異規(guī)律(抽樣分布)與個體觀察值變異規(guī)律有關(guān)即使只有一個樣本資料,也可由樣本資料的個體觀察值的變異規(guī)律間接得到樣本均數(shù)的變異規(guī)律抽樣分布7樣本均數(shù)的規(guī)律性抽樣分布7正態(tài)總體樣本均數(shù)的分布已知某地高三男生的平均身高為,標準差為,將其視為一個總體。從該總體中隨機抽樣樣本含量為n每次抽取10000個樣本并計算各自的樣本均數(shù)以10000個樣本均數(shù)作為一個新的樣本制作頻數(shù)圖8正態(tài)總體樣本均數(shù)的分布已知某地高三男生的平均身高為抽樣1樣本含量n=4的平均數(shù)=168.19的標準差=2.96709抽樣1樣本含量n=49抽樣2樣本含量n=16的平均數(shù)=168.158的標準差=1.488410抽樣2樣本含量n=1610抽樣3樣本含量n=36的平均數(shù)=168.1493的標準差=0.999711抽樣3樣本含量n=3611從正態(tài)分布的總體中隨機抽取樣本含量為n的樣本X1,X2,…,Xn,其樣本均數(shù)服從正態(tài)分布,總體均數(shù)為;樣本均數(shù)的總體標準差若,則其中任意一個隨機樣本Xn的均數(shù)正態(tài)總體樣本均數(shù)的分布12從正態(tài)分布的總體中隨機抽取樣本含量樣本均數(shù)的標準差,稱為樣本均數(shù)的標準誤(standarderrorofmean,SE),簡稱均數(shù)標準誤它反映樣本均數(shù)之間的離散程度,也反映樣本均數(shù)抽樣誤差的大小。誤差大小,實質(zhì)是要估計的分布特征正態(tài)總體樣本均數(shù)的分布13樣本均數(shù)的標準差,稱為樣本均數(shù)的標準誤(stand由于實際往往未知,需要用樣本來估計,樣本均數(shù)標準誤的估計式為注意區(qū)別:證明:正態(tài)總體樣本均數(shù)的分布14由于實際往往未知,需要用樣本來估計非正態(tài)總體樣本均數(shù)的分布從總體均數(shù)為1的指數(shù)分布中抽樣,樣本大小分別為4,9,100。每次抽10000個樣本制作頻數(shù)分布圖15非正態(tài)總體樣本均數(shù)的分布從總體均數(shù)為1的指數(shù)分布中抽樣,樣本16161717抽樣1樣本含量n=4的平均數(shù)=1.0133的標準差=0.5031的中位數(shù)=0.929818抽樣1樣本含量n=418抽樣2樣本含量n=9的平均數(shù)=0.9959的標準差=0.3332
的中位數(shù)=0.957419抽樣2樣本含量n=919抽樣3樣本含量n=100的平均數(shù)=0.9993的標準差=0.1001
的中位數(shù)=0.995820抽樣3樣本含量n=10020從非正態(tài)指數(shù)分布總體中隨機抽樣所得樣本均數(shù):在樣本含量較小時呈偏態(tài)(非指數(shù)型)樣本含量較大時接近正態(tài)分布均數(shù)始終在總體均數(shù)附近均數(shù)的標準差非正態(tài)總體樣本均數(shù)的分布21從非正態(tài)指數(shù)分布總體中隨機抽樣所得樣本均數(shù):非正態(tài)總中心極限定理及其應(yīng)用樣本均數(shù)總體標準差是個體資料X的總體標準差的;即理論標準誤理論標準誤的樣本估計值為樣本均數(shù)與個體資料X的集中位置相同,即樣本均數(shù)的總體均數(shù)與個體資料X的總體均數(shù)相同22中心極限定理及其應(yīng)用樣本均數(shù)總體標準差是個體資料X中心極限定理及其應(yīng)用若個體資料X服從正態(tài)總體,則樣本均數(shù)也服從正態(tài)分布;個體資料X服從偏態(tài)分布,當樣本量n較大時,樣本均數(shù)近似服從正態(tài)分布23中心極限定理及其應(yīng)用若個體資料X服從正態(tài)總體例3.3已知在某地7歲正常發(fā)育男孩的身高服從正態(tài)分布N(121,52)正常發(fā)育7歲男孩身高的95%范圍為=(111.2,130.8)若在該地正常7歲男孩中隨機抽一個樣本,樣本含量為100,則樣本均數(shù)的95%范圍為=(120.2,121.98),24例3.3已知在某地7歲正常發(fā)育男孩的身高服從正態(tài)分布N(1t分布,標準正態(tài)分布與t統(tǒng)計量實際研究中
未知,用樣本的標準差S作為
的一個近似值(估計值)代替
,得到變換后的統(tǒng)計量并記為25t分布,如在正態(tài)總體N(168.18,62)中隨機抽樣,樣本量分別取n=5,n=100,均抽10000個樣本,分別計算t值和U值并作相應(yīng)t的頻數(shù)圖t分布26如在正態(tài)總體N(168.18,62)中隨機抽樣,樣本量分別取t分布樣本含量n=5樣本含量n=100t統(tǒng)計量的頻數(shù)圖
27t分布樣本含量n=5樣本含量n=100t統(tǒng)計量的頻數(shù)結(jié)果小樣本時,t統(tǒng)計量和U統(tǒng)計量的分布有明顯差別大樣本時,t統(tǒng)計量和U統(tǒng)計量的分布非常接近。頻數(shù)圖當樣本量較大時,統(tǒng)計量t的頻數(shù)圖與標準正態(tài)分布曲線非常接近樣本含量較小時,t統(tǒng)計量的峰值比標準正態(tài)分布的峰值略小,雙側(cè)尾部的值則較標準正態(tài)分布略大t分布28結(jié)果t分布28英國統(tǒng)計學家W.S.Gosset(1908)設(shè)并給出了統(tǒng)計量t的分布規(guī)律,并稱統(tǒng)計量t的分布規(guī)律為t分布,自由度為v,記為t(v)分布。每個自由度v對應(yīng)一個分布,因此t分布是一簇分布t分布僅與總體均數(shù)有關(guān),與總體標準差無關(guān)t分布29英國統(tǒng)計學家W.S.Gosset(1908)設(shè)三條t分布密度曲線t分布v=1v=5v=∞30三條t分布密度曲線t分布v=1v=5v=∞30t分布的圖形特征分布特征t分布曲線是單峰的關(guān)于t=0對稱自由度越大,t值越小t分布與正態(tài)分布的關(guān)系自由度v較小時,t分布與標準正態(tài)分布相差較大,并且t分布曲線的尾部面積大于標準正態(tài)分布曲線的尾部面積當自由度時,t分布逼近于標準正態(tài)分布。31t分布的圖形特征分布特征31t分布的界值給定自由度v,t分布曲線的雙側(cè)尾部面積為
時對應(yīng)的t值,記為并稱為t的雙側(cè)界值單側(cè)界值:一側(cè)尾部面積為
時對應(yīng)的t值對稱性得:單側(cè)曲線下面積=2雙側(cè)曲線下面積同樣的尾部面積,t分布的界值要大于標準正態(tài)分布的界值32t分布的界值給定自由度v,t分布曲線的雙側(cè)尾部面積為時對
t分布界值示意圖,
表示陰影的面積
33t分布界值示意圖,表示陰影的面積33樣本率的分布總體率由樣本率估計例如,設(shè)樣本的個體數(shù)(即樣本含量)為n,若x為樣本的某指標陽性個體數(shù),則可用樣本陽性率估計研究人群的陽性率(總體陽性率);由于個體差異和偶然性的影響,樣本率也存在抽樣誤差---由抽樣造成樣本率與總體率(研究人群的率)的差異樣本率是隨機的,但在概率意義下也是有規(guī)律的---樣本率的分布。34樣本率的分布總體率由樣本率估計34隨機抽樣試驗,分別在總體率
=0.4,0.5,0.01的總體中隨機抽樣,其總體率
和樣本含量n每種情況分別隨機抽10000個樣本,每個樣本計算其樣本率,把同一種情況的10000個樣本率視為一個新的樣本資料作頻數(shù)圖樣本率的分布35隨機抽樣試驗,分別在總體率=0.4,0.5,0.01的總體抽樣136抽樣136抽樣137抽樣137抽樣338抽樣338抽樣439抽樣439結(jié)果總體率
相同時,樣本含量越大,樣本率的分布越趨向?qū)ΨQ。樣本含量n相同時,
越偏離0.5,樣本率的分布越偏態(tài)分布??傮w率
=0.5時,任意樣本含量的樣本率都呈對稱分布。樣本率p的樣本標準差。樣本率的分布40結(jié)果樣本率的分布40中心極限定理及其推論若樣本中的個體個數(shù)(即樣本含量)為n,總體率為
,樣本率為p,則樣本率的總體均數(shù)等于總體率樣本率的總體標準差(即率的標準誤)
由于總體率通常是未知的,因而用樣本率p來估計,故率的標準誤的估計值常表示為41中心極限定理及其推論若樣本中的個體個數(shù)(即樣本含量)為n,總對于大量重復(fù)隨機抽樣而言,樣本率p圍繞著總體率波動樣本含量n越大,這種波動越小。當n的值充分大時,p的分布就近似于均數(shù)為,標準差為的正態(tài)分布。這里樣本含量n“充分大”指、且n>40。當總體率
=0.5時,則樣本率p的分布為對稱分布當樣本含量n為定值時,總體率
越接近0.5,樣本率p近似正態(tài)分布的程度就越好中心極限定理及其推論42對于大量重復(fù)隨機抽樣而言,樣本率p圍繞著總體率波動中心極限定STATA命令模擬各種分布模擬正態(tài)分布的樣本
溫馨提示
- 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
- 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
- 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
- 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負責。
- 6. 下載文件中如有侵權(quán)或不適當內(nèi)容,請與我們聯(lián)系,我們立即糾正。
- 7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。
最新文檔
- 2023年河南單招英語模擬試題及答案
- 水利水電建筑工程專業(yè)2019年單招大綱及樣題參考答案
- 靜脈輸液血栓栓塞的預(yù)防及處理
- 北京印刷學院《名著導(dǎo)讀》2023-2024學年第一學期期末試卷
- 面部護膚知識普及課件
- 溫州醫(yī)科大學仁濟學院《GMP法規(guī)及實務(wù)》2023-2024學年第二學期期末試卷
- 2025年高考語文寫作滿分作文范文9篇
- 毛澤東思想的形成和發(fā)展
- 湖南省株洲市醴陵第二中學2024-2025學年高三4月一模試卷語文試題含解析
- 湖北醫(yī)藥學院《普通生物學》2023-2024學年第二學期期末試卷
- GB/T 5972-2016起重機鋼絲繩保養(yǎng)、維護、檢驗和報廢
- GB/T 4802.1-2008紡織品織物起毛起球性能的測定第1部分:圓軌跡法
- GB/T 15098-1994危險貨物運輸包裝類別劃分原則
- 單組份室溫固化硅橡膠物質(zhì)安全數(shù)據(jù)表MSDS模板
- 2022年北京事業(yè)單位招聘考試真題及答案解析
- 機動車檢測站突發(fā)環(huán)境污染事件應(yīng)急預(yù)案
- 關(guān)于赴XXX醫(yī)院參觀學習聯(lián)系函
- 【匯總】高二政治選擇性必修三(統(tǒng)編版) 重點知識點匯總
- T∕CIS 71001-2021 化工安全儀表系統(tǒng)安全要求規(guī)格書編制導(dǎo)則
- 體醫(yī)融合與健康中國課件
- 福利院裝修改造工程施工組織設(shè)計(225頁)
評論
0/150
提交評論