第四講用樣本推斷總體_第1頁
第四講用樣本推斷總體_第2頁
第四講用樣本推斷總體_第3頁
第四講用樣本推斷總體_第4頁
第四講用樣本推斷總體_第5頁
已閱讀5頁,還剩56頁未讀, 繼續(xù)免費閱讀

下載本文檔

版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進行舉報或認領(lǐng)

文檔簡介

第四講用樣本推斷總體第一頁,共六十一頁,編輯于2023年,星期五問題一:二戰(zhàn)中的點估計—德軍有多少輛坦克?二戰(zhàn)期間,盟軍非常想知道德軍總共制造了多少輛坦克。德國人在制造坦克時是墨守成規(guī)的,他們把坦克從1開始進行了連續(xù)編號。在戰(zhàn)爭過程中,盟軍繳獲了一些敵軍坦克,并記錄了它們的生產(chǎn)編號。那么怎樣利用這些號碼來估計坦克總數(shù)呢?我們可以通過本章點估計的方法解決這個問題。第二頁,共六十一頁,編輯于2023年,星期五問題二某人想知道自己所承包的池塘的魚的總數(shù)N,第一次隨機撈出50條,將這50條魚作標記后又放回池塘,等它們完全融入其他魚后又隨機捕撈100條,發(fā)帶有標記的魚有2條,你能幫他估計出魚塘里現(xiàn)魚的數(shù)量N嗎?解:已作記號的魚的樣本比例為那么總體(池塘里的所有魚)中作記號的魚的比例為既有:50/N=0.02故:N=50/0.02=2500這是一個典型的用樣本比例來估計總體比例從而再推斷總體單位總量的實例。第三頁,共六十一頁,編輯于2023年,星期五問題三政府部門想知道到底有多大比例的上海人同意上海大力發(fā)展軌道交通;由于不大可能詢問所有的近兩千萬上海市民,人們只好進行抽樣調(diào)查以得到樣本,并用樣本中同意發(fā)展軌道交通的比例來估計真實的比例。盡管會存在如下問題:①從不同的樣本得到的結(jié)論也不會完全一樣。②真實的比例在這種抽樣過程中永遠也不知道;但是我們可以通過參數(shù)估計的方法得到這個比例的范圍和落入這個范圍的概率??梢灾拦烙嫵鰜淼谋壤驼鎸嵉谋壤笾虏疃嗌?。第四頁,共六十一頁,編輯于2023年,星期五問題四:每次民調(diào)中所需調(diào)查人數(shù)為了調(diào)查對總統(tǒng)候選人的支持率,臨近11月份大選前夕,希望得到更高的精確度即更小的極限誤差,求每次調(diào)查中所需的樣本容量(置信度95%)。調(diào)查時間極限誤差9月0.0410月0.0311月初0.02大選前一天0.01第五頁,共六十一頁,編輯于2023年,星期五統(tǒng)計推斷的過程樣本總體樣本統(tǒng)計量例如:樣本均值、比例、方差總體均值、比例、方差第六頁,共六十一頁,編輯于2023年,星期五樣本統(tǒng)計量的抽樣分布樣本均值的分布樣本比例的分布樣本方差的分布抽樣分布正態(tài)或t分布Χ2分布正態(tài)或t分布第七頁,共六十一頁,編輯于2023年,星期五參數(shù)估計的方法估計方法點估計區(qū)間估計假設(shè)檢驗第八頁,共六十一頁,編輯于2023年,星期五點估計從總體中抽取一個樣本,根據(jù)該樣本的統(tǒng)計量對總體的未知參數(shù)作出一個數(shù)值點的估計例如:用樣本均值作為總體未知均值的估計值就是一個點估計2. 點估計沒有給出估計值接近總體未知參數(shù)程度的信息點估計的方法有矩估計法、順序統(tǒng)計量法、最大似然法、最小二乘法等第九頁,共六十一頁,編輯于2023年,星期五被估計的總體參數(shù)總體參數(shù)符號表示用于估計的樣本統(tǒng)計量一個總體均值比例方差第十頁,共六十一頁,編輯于2023年,星期五1.用于估計總體某一參數(shù)的隨機變量如樣本均值,樣本比例、樣本中位數(shù)等例如:樣本均值就是總體均值的一個估計量如果樣本均值x

=3,則3就是的估計值理論基礎(chǔ)是抽樣分布估計量第十一頁,共六十一頁,編輯于2023年,星期五估計量的優(yōu)良性準則無偏性:估計量的數(shù)學(xué)期望等于被估計的總體參數(shù)P(X)XCA無偏有偏第十二頁,共六十一頁,編輯于2023年,星期五估計量的優(yōu)良性準則(有效性)AB中位數(shù)的抽樣分布均值的抽樣分布XP(X)有效性:一個方差較小的無偏估計量稱為一個更有效的估計量。如,與其他估計量相比,樣本均值是一個更有效的估計量第十三頁,共六十一頁,編輯于2023年,星期五估計量的優(yōu)良性準則(一致性)一致性:隨著樣本容量的增大,估計量越來越接近被估計的總體參數(shù)AB較小的樣本容量較大的樣本容量P(X)X第十四頁,共六十一頁,編輯于2023年,星期五區(qū)間估計1. 根據(jù)一個樣本的觀察值給出總體參數(shù)的估計范圍給出總體參數(shù)落在這一區(qū)間的概率例如:總體均值落在50~70之間,置信度為95%樣本統(tǒng)計量

(點估計)置信區(qū)間置信下限置信上限第十五頁,共六十一頁,編輯于2023年,星期五置信區(qū)間估計(內(nèi)容)2

已知2未知均值方差比例置信區(qū)間第十六頁,共六十一頁,編輯于2023年,星期五落在總體均值某一區(qū)間內(nèi)的樣本x_XX=Zx95%的樣本-1.96x+1.96x99%的樣本-2.58x+2.58x90%的樣本-1.65x+1.65x第十七頁,共六十一頁,編輯于2023年,星期五總體未知參數(shù)落在區(qū)間內(nèi)的概率表示為(1-為顯著性水平,是總體參數(shù)未在區(qū)間內(nèi)的概率常用的顯著性水平值有99%,95%,90%相應(yīng)的為0.01,0.05,0.10置信水平第十八頁,共六十一頁,編輯于2023年,星期五置信區(qū)間與置信水平均值的抽樣分布(1-)%區(qū)間包含了

%的區(qū)間未包含1-aa/2a/2第十九頁,共六十一頁,編輯于2023年,星期五影響區(qū)間寬度的因素數(shù)據(jù)的離散程度,用來測度樣本容量置信水平(1-),影響Z的大小第二十頁,共六十一頁,編輯于2023年,星期五總體均值的置信區(qū)間(2已知)1. 假定條件總體服從正態(tài)分布,且總體方差(2)已知如果不是正態(tài)分布,可以由正態(tài)分布來近似(n

30)2.使用正態(tài)分布統(tǒng)計量Z總體均值在1-置信水平下的置信區(qū)間為第二十一頁,共六十一頁,編輯于2023年,星期五總體均值的區(qū)間估計(正態(tài)總體)解:已知X~N(,0.152),x=2.14,n=9,1-=0.95,Z/2=1.96

總體均值的置信區(qū)間為我們可以95%的概率保證該種零件的平均長度在21.302~21.498mm之間【例】某種零件長度服從正態(tài)分布,從該批產(chǎn)品中隨機抽?。辜?,測得其平均長度為21.4mm。已知總體標準差

=0.15mm,試建立該種零件平均長度的置信區(qū)間,給定置信水平為0.95。第二十二頁,共六十一頁,編輯于2023年,星期五總體均值的區(qū)間估計(非正態(tài)總體)解:已知x=26,=6,n=100,1-=0.95,Z/2=1.96我們可以95%的概率保證平均每天參加鍛煉的時間在24.824~27.176分鐘之間【例】某大學(xué)從該校學(xué)生中隨機抽取100人,調(diào)查到他們平均每天參加體育鍛煉的時間為26分鐘。試以95%的置信水平估計該大學(xué)全體學(xué)生平均每天參加體育鍛煉的時間(已知總體方差為36小時)。第二十三頁,共六十一頁,編輯于2023年,星期五總體均值的置信區(qū)間

(2未知)1. 假定條件總體方差(2)未知總體必須服從正態(tài)分布使用t分布統(tǒng)計量3.總體均值在1-置信水平下的置信區(qū)間為第二十四頁,共六十一頁,編輯于2023年,星期五總體均值的區(qū)間估計解:已知X~N(,2),x=50,s=8,n=25,1-=0.95,t/2=2.0639。我們可以95%的概率保證總體均值在46.69~53.30之間【例】從一個正態(tài)總體中抽取一個隨機樣本,n=25

,其均值`x=

50

,標準差s=8。建立總體均值m

的95%的置信區(qū)間。第二十五頁,共六十一頁,編輯于2023年,星期五總體比例的置信區(qū)間1. 假定條件兩類結(jié)果總體服從二項分布可以由正態(tài)分布來近似使用正態(tài)分布統(tǒng)計量Z3.總體比例P

的置信區(qū)間為第二十六頁,共六十一頁,編輯于2023年,星期五總體比例的置信區(qū)間實例解:已知n=200,=0.7,n=140>5,n(1-)=60>5,=0.95,Z/2=1.96p

p

p

我們可以95%的概率保證該企業(yè)職工由于同管理人員不能融洽相處而離開的比例在63.6%~76.4%之間【例】某企業(yè)在一項關(guān)于職工流動原因的研究中,從該企業(yè)前職工的總體中隨機選取了200人組成一個樣本。在對其進行訪問時,有140人說他們離開該企業(yè)是由于同管理人員不能融洽相處。試對由于這種原因而離開該企業(yè)的人員的真正比例構(gòu)造95%的置信區(qū)間。第二十七頁,共六十一頁,編輯于2023年,星期五根據(jù)均值區(qū)間估計公式可得樣本容量n為估計總體均值時樣本容量的確定樣本容量n與總體方差2、允許誤差、可靠性系數(shù)Z之間的關(guān)系為與總體方差成正比與允許誤差成反比與可靠性系數(shù)成正比其中:第二十八頁,共六十一頁,編輯于2023年,星期五樣本容量的確定實例解:已知2=1800000,=0.05,Z/2=1.96,=500

應(yīng)抽取的樣本容量為【例】一家廣告公想估計某類商店去年所花的平均廣告費用有多少。經(jīng)驗表明,總體方差約為1800000元。如置信度取95%,并要使估計處在總體平均值附近500元的范圍內(nèi),這家廣告公司應(yīng)抽多大的樣本?第二十九頁,共六十一頁,編輯于2023年,星期五根據(jù)比例區(qū)間估計公式可得樣本容量n為估計總體比例時樣本容量的確定若總體比例π未知時,可用樣本比例來代替

p其中:第三十頁,共六十一頁,編輯于2023年,星期五樣本容量的確定實例【例】一家市場調(diào)研公司想估計某地區(qū)有彩色電視機的家庭所占的比例。該公司希望對比例p的估計誤差不超過0.05,要求的可靠程度為95%,應(yīng)抽多大容量的樣本(沒有可利用的p估計值)。解:

已知=0.05,=0.05,Z/2=1.96,當(dāng)p未知時用最大方差0.25代替^應(yīng)抽取的樣本容量為第三十一頁,共六十一頁,編輯于2023年,星期五正態(tài)總體方差的區(qū)間估計1.估計一個總體的方差或標準差2.假設(shè)總體服從正態(tài)分布3.總體方差2

的點估計量為S2,且4.總體方差在1-置信水平下的置信區(qū)間為第三十二頁,共六十一頁,編輯于2023年,星期五正態(tài)總體方差的區(qū)間估計實例【例】對某種金屬的10個樣品組成的一個隨機樣本作抗拉強度試驗。從實驗數(shù)據(jù)算出的方差為4。試求2的95%的置信區(qū)間。第三十三頁,共六十一頁,編輯于2023年,星期五正態(tài)總體方差的區(qū)間估計計算結(jié)果解:已知n=10,s2=4,1-=95%

2置信度為95%的置信區(qū)間為第三十四頁,共六十一頁,編輯于2023年,星期五從某學(xué)院男生中隨機抽取30名學(xué)生,測得身高(cm)分別為170、175、172、168、165、178、180、176、177、164、......,數(shù)據(jù)如下表,以95%的置信度估計該學(xué)院男生的平均身高。利用Excel計算置信區(qū)間第三十五頁,共六十一頁,編輯于2023年,星期五第三十六頁,共六十一頁,編輯于2023年,星期五利用Excel計算必要樣本數(shù)例:某縣進行農(nóng)村經(jīng)濟情況調(diào)查,已知農(nóng)戶平均年收入標準差為30元,要求把握程度(置信度)為95.45%,抽樣極限誤差為5元,計算應(yīng)抽取的樣本戶數(shù)?如下圖所示。第三十七頁,共六十一頁,編輯于2023年,星期五“樣本容量計算”工作表必要樣本容量計算計算公式第三十八頁,共六十一頁,編輯于2023年,星期五建立工作表樣本比例為p,樣本容量為n計算公式第三十九頁,共六十一頁,編輯于2023年,星期五區(qū)間估計總結(jié)總體與樣本總體均值總體比例P正態(tài)總體或近似正態(tài)總體非正態(tài)小樣本第四十頁,共六十一頁,編輯于2023年,星期五注:第四十一頁,共六十一頁,編輯于2023年,星期五區(qū)間估計必要樣本容量n的確定估計總體均值時(重復(fù)抽樣)估計總體比例時(重復(fù)抽樣)其中:其中:第四十二頁,共六十一頁,編輯于2023年,星期五幫想節(jié)約調(diào)查費用的廣告公司拿主意某廣告公司為了估計某地區(qū)收看某一新電視機目的居民人數(shù)所占比例,要設(shè)計一個簡單隨機樣本的抽樣方案。該公司希望有90%的信心使所估計的比例只有2個百分點左右的誤差。為了節(jié)約調(diào)查費用,樣本將盡可能小,在這種情況下應(yīng)該抽取多少樣本?案例一第四十三頁,共六十一頁,編輯于2023年,星期五總統(tǒng)選舉的民意調(diào)查(背景)據(jù)美國競選業(yè)專業(yè)雜志CampaigningReports統(tǒng)計歷次美國總統(tǒng)競選的花費:2004年為6.93億美元;2008年高達13億美元。整個總統(tǒng)競選過程中,候選人一般會花費10-15%的競選經(jīng)費在民意調(diào)查上。如何確定被調(diào)查的人數(shù)是首先要考慮的問題。案例二第四十四頁,共六十一頁,編輯于2023年,星期五學(xué)生每天上網(wǎng)的時間的區(qū)間一、某大學(xué)為了解學(xué)生每天上網(wǎng)的時間,在全校7500名學(xué)生中采取不重復(fù)抽樣方法隨機抽取36人,調(diào)查他們每天上網(wǎng)的時間(單位:小時),得到下面數(shù)據(jù)。要求:該校大學(xué)生平均上網(wǎng)時間的置信區(qū)間,置信概率為90%上網(wǎng)時間3.3,4.4,2.1,4.7,3.1,2,1.9,1.4,6.2,5.4,1.2,1.2,5.8,2.6,5.1,2.9,2.3,6.4,4.3,3.5,4.1,1.8,4.2,2.4,5.4,3.5,3.6,0.5,4.5,5.7,0.8,3.63.2,2.3,1.5,2.5案例三第四十五頁,共六十一頁,編輯于2023年,星期五汽車性能調(diào)查調(diào)查消費者對上海地區(qū)某一個主要制造商所生產(chǎn)的汽車的性能的滿意程度。許多人抱怨該車剛開始傳動系統(tǒng)不佳為了更好地了解傳動系統(tǒng)的問題,采用由上海一個修理企業(yè)所提供的實際傳動系統(tǒng)的維修記錄為樣本。以下數(shù)據(jù)為50輛汽車傳動系統(tǒng)出現(xiàn)故障時所行駛的實際里程的數(shù)據(jù)。求95%的置信區(qū)間案例四850923260959465774373253464090324645990239323896419421911680392857634366560585861643426197867998598171017699577412135269568742766699840001720692506677098l6992235662744256720211844453500792946454486813116269378318934173341852881381145340285586822567753988798第四十六頁,共六十一頁,編輯于2023年,星期五兩個總體均值之差的估計第四十七頁,共六十一頁,編輯于2023年,星期五兩個樣本均值之差的抽樣分布

m1s1總體1s2

m2總體2抽取簡單隨機樣樣本容量n1計算X1抽取簡單隨機樣樣本容量n2計算X2計算每一對樣本的X1-X2所有可能樣本的X1-X2m1-m2抽樣分布第四十八頁,共六十一頁,編輯于2023年,星期五兩個總體均值之差的估計

(12、22

已知)1. 假定條件兩個樣本是獨立的隨機樣本兩個總體都服從正態(tài)分布若不是正態(tài)分布,可以用正態(tài)分布來近似(n130和n230)兩個獨立樣本均值之差的抽樣分布服從正態(tài)分布,其期望值為其標準誤差為第四十九頁,共六十一頁,編輯于2023年,星期五兩個總體均值之差的估計

(12、22

已知)兩個總體均值之差1-2在1-置信水平下的置信區(qū)間為使用正態(tài)分布統(tǒng)計量Z第五十頁,共六十一頁,編輯于2023年,星期五兩個總體均值之差的估計

(實例)【例】一個銀行負責(zé)人想知道儲戶存入兩家銀行的錢數(shù)。他從兩家銀行各抽取了一個由25個儲戶組成的隨機樣本,樣本均值如下:銀行A:4500元;銀行B:3250元。設(shè)已知兩個總體服從方差分別為A2=2500和B2=3600的正態(tài)分布。試求A-B的區(qū)間估計(1)置信度為95%(2)置信度為99%BA第五十一頁,共六十一頁,編輯于2023年,星期五兩個總體均值之差的估計

(計算結(jié)果)解:已知

XA~N(A,2500)

XB~N(B,3600)xA=4500,xB=3250,

A2=2500

B2=3600

nA=nB=25(1)

A-B置信度為95%的置信區(qū)間為(2)

A-B置信度為99%的置信區(qū)間為第五十二頁,共六十一頁,編輯于2023年,星期五兩個總體均值之差的估計

(12、22未知,但相等)假定條件兩個總體都服從正態(tài)分布12、12未知,但12=12總體方差2的聯(lián)合估計量為估計量x1-x2的標準差為第五十三頁,共六十一頁,編輯于2023年,星期五兩個總體均值之差的估計

(12、22未知,但相等)使用t

分布統(tǒng)計量兩個總體均值之差1-2在1-置信水平下的置信區(qū)間為第五十四頁,共六十一頁,編輯于2023年,星期五兩個總體均值之差的估計

(實例)【例】為比較兩位銀行職員為新顧客辦理個人結(jié)算賬目的平均時間長度,分別給兩位職員隨機安排了10位顧客,并記錄下為每位顧客辦理賬單所需的時間(單位:分鐘),相應(yīng)的樣本均值和方差分別為:x1=22.2,s12=16.63,x2=28.5,s22=18.92。假定每位職員辦理賬單所需時間均服從正態(tài)分布,且方差相等。試求兩位職員辦理賬單的服務(wù)時間之差的95%的區(qū)間估計。21第五十五頁,共六十一頁,編輯于2023年,星期五兩個總體均值之差的估計

(計算結(jié)果)解:已知

X1~N(1,2)

X2~N(2,2)x1=22.2,x2=28.5,

s12=16.63s22=

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負責(zé)。
  • 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔(dān)用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

評論

0/150

提交評論