第五章 抽樣推斷.ppt_第1頁(yè)
第五章 抽樣推斷.ppt_第2頁(yè)
第五章 抽樣推斷.ppt_第3頁(yè)
第五章 抽樣推斷.ppt_第4頁(yè)
第五章 抽樣推斷.ppt_第5頁(yè)
已閱讀5頁(yè),還剩88頁(yè)未讀 繼續(xù)免費(fèi)閱讀

下載本文檔

版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請(qǐng)進(jìn)行舉報(bào)或認(rèn)領(lǐng)

文檔簡(jiǎn)介

1、第五章 抽樣推斷,第一節(jié) 概述 第二節(jié) 抽樣分布與抽樣誤差 第三節(jié) 抽樣估計(jì) 第四節(jié) 抽樣方案的設(shè)計(jì),統(tǒng)計(jì)推斷: 從樣本含有的信息中提取總體的信息,一個(gè)輪胎制造商發(fā)明了一種新輪胎,這種輪胎的里程數(shù)超過了企業(yè)現(xiàn)有生產(chǎn)線上輪胎的里程數(shù)。為了對(duì)這種新型輪胎作出評(píng)估,管理人員需要對(duì)新型輪胎的平均里程作出估計(jì)。制造商選擇了120個(gè)這種新型輪胎作為樣本進(jìn)行檢驗(yàn),檢驗(yàn)結(jié)果的樣本均值為36500英里。于是,該種新型輪胎平均里程的估計(jì)值為36500。,某個(gè)政治團(tuán)體的成員正考慮支持某一候選人競(jìng)選國(guó)會(huì)議員。為了決定是否參加即將到來的普選,政團(tuán)領(lǐng)導(dǎo)者需要對(duì)登記選民中支持這一候選人的比率做一個(gè)估計(jì)。受時(shí)間和成本的限制,

2、不可能與登記選民總體中的每一個(gè)都取得聯(lián)系。于是,選取400個(gè)登記選民為樣本。如果400個(gè)選民中有160個(gè)對(duì)該候選人表示支持,則登記選民中支持該候選人的比率的估計(jì)值為160/400=0.4,參數(shù)估計(jì)在統(tǒng)計(jì)方法中的地位,抽樣估計(jì):通過樣本的觀察結(jié)果來推斷總體參數(shù)的取值范圍以及得到此結(jié)論的可靠程度。 假設(shè)檢驗(yàn):根據(jù)樣本所提供的信息,對(duì)總體的某些方面,如總體的分布類型、總體參數(shù)的性質(zhì)等作出結(jié)論性的判斷。 基本做法:預(yù)先對(duì)總體參數(shù)的取值或總體分布形式作出假定,然后用樣本數(shù)據(jù)來驗(yàn)證,從而作出是接受還是拒絕該假設(shè)的結(jié)論。,例:某大學(xué)從該校學(xué)生中隨機(jī)抽取100人,調(diào)查到他們平均每天參加體育鍛煉的時(shí)間為26分鐘

3、。試以95的置信水平估計(jì)該大學(xué)全體學(xué)生平均每天參加體育鍛煉的時(shí)間(已知總體方差為36分鐘)。,例:某地區(qū)水土中缺乏一種微量元素,根據(jù)醫(yī)學(xué)研究結(jié)果可知,人們?nèi)绻麛z取這種元素過少,腦功能可能受影響,因此可推測(cè)該地區(qū)兒童的智力水平可能低于一般水平。心理學(xué)家使用某一標(biāo)準(zhǔn)化智力檢驗(yàn)方法,對(duì)該地區(qū)隨機(jī)選取36名兒童進(jìn)行智力測(cè)驗(yàn),得到智力分?jǐn)?shù)的平均值是94分,已知總體標(biāo)準(zhǔn)差為15分,問該地區(qū)兒童的智力水平是否和一般水平(100分)有明顯差異?,統(tǒng)計(jì)推斷的過程,總體(參數(shù)待推斷),抽樣,計(jì)算,推斷,抽樣分布: 樣本統(tǒng)計(jì)量(樣本平均數(shù)或樣本比率)的概率分布,1、樣本統(tǒng)計(jì)量服從什么理論分布? 2、統(tǒng)計(jì)量抽樣分布的

4、參數(shù)與總體的參數(shù)有什么關(guān)系?,核心概念,兩個(gè)基本點(diǎn),如果將抽取簡(jiǎn)單隨機(jī)樣本的過程看作一次試驗(yàn),樣本均值或比率就是試驗(yàn)結(jié)果的一個(gè)數(shù)值描述,即樣本均值或樣本比率就是一個(gè)隨機(jī)變量。因此,也就有數(shù)學(xué)期望、方差和概率分布。,第一節(jié) 抽樣推斷概述,抽樣推斷的意義 抽樣推斷中常用的幾個(gè)基本概念 抽樣方法 抽樣推斷的理論依據(jù) 抽樣的類型,一次失敗的統(tǒng)計(jì)調(diào)查,在1936年的美國(guó)總統(tǒng)選舉前,Literary Digest 的雜志進(jìn)行了一次民意調(diào)查??偨y(tǒng)候選人是堪薩斯州州長(zhǎng)Alf Landon和現(xiàn)任總統(tǒng) Franklin Roosevelt。為了解民意,民意調(diào)查專家們根據(jù)電話簿和車輛登記簿上的名單發(fā)了一千萬張調(diào)查表

5、。但收回的比例并不高。在收回的調(diào)查表中,Alf Landon非常受歡迎。于是該雜志預(yù)測(cè) Landon 將贏得選舉。但結(jié)果是Franklin Roosevelt贏得了這次選舉。 在經(jīng)濟(jì)大蕭條時(shí)期調(diào)查有電話和汽車的人們,并不能夠反映全體選民的觀點(diǎn)。此外,只有少數(shù)的問卷被收回。這些都是值得懷疑的。,一、抽樣推斷的意義(課本p172),概念,遵循隨機(jī)原則,從總體中抽取部分單位進(jìn)行調(diào)查,根據(jù)樣本資料計(jì)算樣本值,然后用樣本值對(duì)總體參數(shù)作出具有一定可靠程度的估計(jì)和判斷,從而反映總體的數(shù)量特征。,特點(diǎn),按照隨機(jī)的原則從全及總體中抽選樣本單位,每個(gè)單位被抽取的機(jī)會(huì)均等。 它是根據(jù)取得的樣本資料計(jì)算出樣本指標(biāo),從

6、而對(duì)全及總體數(shù)量特征作出估計(jì)。 抽樣調(diào)查的抽樣誤差可以事先計(jì)算并加以控制,從而保證抽樣推斷的結(jié)果達(dá)到一定的可靠程度。 用抽樣來推斷總體指標(biāo)具有一定的局限性。,抽樣推斷的作用(課本p173),可反映不可能進(jìn)行全面調(diào)查,而又要了解全面情況的社會(huì)經(jīng)濟(jì)現(xiàn)象總體的數(shù)量特征。(產(chǎn)品質(zhì)量檢驗(yàn)、商品市場(chǎng)占有率調(diào)查) 對(duì)可進(jìn)行全面調(diào)查的現(xiàn)象,抽樣調(diào)查可取得事半功倍的效果,并有其獨(dú)到的作用。(居民生活狀況調(diào)查) 可以對(duì)全面調(diào)查資料進(jìn)行補(bǔ)充和訂正。(人口的抽樣推斷檢查) 可以用于工業(yè)生產(chǎn)過程的質(zhì)量控制。 可以對(duì)某種總體指標(biāo)的假設(shè)進(jìn)行檢驗(yàn),來判斷這種假設(shè)的真?zhèn)?,以決定取舍。,二、抽樣推斷中常用的幾個(gè)基本概念,(一)

7、總體、個(gè)體、樣本、樣本容量 總體(Population):調(diào)查研究的事物或現(xiàn)象的全體 個(gè)體(Item unit):組成總體的每個(gè)元素 樣本(Sample):從總體中所抽取的部分個(gè)體 樣本容量(Sample size):樣本中所含個(gè)體的數(shù)量 (二)全及指標(biāo)和抽樣指標(biāo) 1、全及指標(biāo)是根據(jù)總體單位的標(biāo)志值或標(biāo)志特征計(jì)算得到的。通常包括平均數(shù)、成數(shù)、方差、標(biāo)準(zhǔn)差和總體單位數(shù)等。一般用大寫的英文字母來表示。 2、抽樣指標(biāo)是根據(jù)樣本單位的某一標(biāo)志值或標(biāo)志特征計(jì)算得到的。通常包括抽樣平均數(shù)、抽樣成數(shù)、樣本方差、樣本標(biāo)準(zhǔn)差和樣本容量等。一般用小寫的英文字母表示。,三、抽樣方法(重復(fù)抽樣、不重復(fù)抽樣),1、重復(fù)

8、抽樣:把總體中已抽取的樣本單位再放回總體中去,參加以下各次的抽取。 同一單位有重復(fù)抽中的可能; 總體單位數(shù)在每一次抽取時(shí)都相同; 在不同次抽取時(shí),每個(gè)單位中選或不中選的機(jī)率完全一樣。 實(shí)驗(yàn)結(jié)果相互獨(dú)立 2、不重復(fù)抽樣:某一單位在被抽中之后,就不再放回總體中參加以后各次的抽樣。 同一單位不可能被多次抽中; 總體單位數(shù)在每次抽取上都不同,越往后越少; 在不同次抽取時(shí),每個(gè)單位中選或不中選的機(jī)率是不同的。 實(shí)驗(yàn)結(jié)果不是相互獨(dú)立,四、抽樣調(diào)查的理論依據(jù),(1)大數(shù)定律(大量測(cè)量值的算術(shù)平均值具有穩(wěn)定性) 基本內(nèi)容:假設(shè)n個(gè)隨機(jī)變量相互獨(dú)立并具有相同的期望值和方差,當(dāng)n無限增加時(shí),這n個(gè)隨機(jī)變量的算術(shù)平

9、均將幾乎變成一個(gè)常數(shù)。 從統(tǒng)計(jì)角度來說,如果總體由大量相互獨(dú)立的隨機(jī)因素所組成,而且每個(gè)因素對(duì)總體的影響相對(duì)較小,對(duì)大量因素加以綜合平均,將表現(xiàn)出共同趨向。,(2)中心極限定理 基本內(nèi)容:假設(shè)n個(gè)隨機(jī)變量相互獨(dú)立并具有相同的期望值和方差,則這n個(gè)隨機(jī)變量的算術(shù)平均當(dāng)n很大時(shí)往往接近于正態(tài)分布。 從統(tǒng)計(jì)角度來說,如果總體變量存在有限的平均數(shù)和方差,不論總體是否屬于正態(tài)分布,只要抽樣單位數(shù)不斷增加,則抽樣平均數(shù)的分布就近似地接近正態(tài)分布。這個(gè)結(jié)論十分重要,它為抽樣誤差范圍的估計(jì)提供了理論依據(jù)。,五、抽樣的類型,最基本的隨機(jī)抽樣方法。它是對(duì)全及總體的所有單位不作任何分類或排隊(duì),完全按隨機(jī)原則逐個(gè)地抽

10、取樣本單位。,(1)抽簽法(抓鬮) 先給每個(gè)單位編上序號(hào),將號(hào)碼寫在紙片上,摻和均勻后從中抽選,抽到哪一個(gè)單位就調(diào)查哪個(gè)單位,直到抽夠預(yù)先規(guī)定的數(shù)量為止。這種方法看起來簡(jiǎn)單易行,總體單位數(shù)目不多時(shí)也可以使用。 (2)隨機(jī)數(shù)碼表法 首先要將全及總體中所有的單位加以編號(hào),根據(jù)編號(hào)的位數(shù),在隨機(jī)數(shù)表上任意選擇一個(gè)相應(yīng)位數(shù)的隨機(jī)起點(diǎn),按預(yù)先規(guī)定好的方向逐個(gè)推移,碰上屬于編號(hào)范圍內(nèi)的數(shù)字便作為抽中單元,直到抽夠預(yù)定的數(shù)量為止。,簡(jiǎn)單隨機(jī)抽樣,隨機(jī)數(shù)表的應(yīng)用,63271 59986 71744 51102 15141 80714 58683 93108 13554 79945 88547 09896 95

11、436 79115 08303 01041 20030 63754 08459 28364 55957,例1:一個(gè)學(xué)生組織就學(xué)生當(dāng)中對(duì)選修課中實(shí)行強(qiáng)制“及格/不及格”記分制度持贊成態(tài)度的比率感興趣。從注冊(cè)辦公室獲得注冊(cè)的645名學(xué)生的名單。隨機(jī)選出10名學(xué)生。,例2:從某公司2500名員工中選出30人,研究公司員工的平均薪金。,分層隨機(jī)抽樣,是把總體各單位按某一主要標(biāo)志進(jìn)行分組,然后按比例或不按比例從各組中抽樣。在分層抽樣中,樣本與總體的相似性大于簡(jiǎn)單隨機(jī)抽樣中二者的關(guān)系。可減少抽樣誤差。,調(diào)頻廣播市場(chǎng)聽眾的分層,比例和非比例分層抽樣,系統(tǒng)抽樣,又稱機(jī)械抽樣、等距抽樣,是先將全及總體所有單位按

12、某一標(biāo)志值的順序排隊(duì),然后按相等的距離(N/n)抽取n個(gè)樣本單位。注意抽樣間隔(或稱抽樣距離)避免和現(xiàn)象本身的節(jié)奏性(或循環(huán)周期)相重合。非常方便,但不能減少抽樣誤差。,無關(guān)標(biāo)志排隊(duì):如果排隊(duì)的標(biāo)志與抽樣調(diào)查所研究的標(biāo)志無關(guān),則稱無關(guān)標(biāo)志排隊(duì)。 簡(jiǎn)單隨機(jī)抽樣,有關(guān)標(biāo)志排隊(duì):如果選擇排隊(duì)的標(biāo)志與抽樣調(diào)查所研究的標(biāo)志有關(guān),則稱為有關(guān)標(biāo)志排隊(duì)。 分層隨機(jī)抽樣,整群抽樣是將全及總體單位劃分成群,然后成群地從中隨機(jī)抽取若干個(gè)樣本群,對(duì)中選群內(nèi)的所有單位進(jìn)行全面調(diào)查的抽樣組織方式。成本低,方便,但樣本的代表性低。,測(cè)試新產(chǎn)品的市場(chǎng)。按城市分群,在每一個(gè)測(cè)試的市場(chǎng)中對(duì)個(gè)體消費(fèi)者進(jìn)行調(diào)查。 如果群太大,就有必

13、要在原群的基礎(chǔ)上再進(jìn)行分群兩步抽樣(two-stage sampling),整群抽樣,方便抽樣:研究者按選擇的方便程度選擇樣本。研究者常選擇那些可以得到的、周圍的、愿意參與的個(gè)體作為樣本。 例:挨家挨戶的方便抽樣,樣本包括家中有人的家庭、無狗的家庭、在街道附近的家庭、住一樓的家庭、待人友善的家庭。,判斷抽樣:根據(jù)研究者的判斷進(jìn)行的抽樣。理性的專業(yè)研究者認(rèn)為與隨機(jī)抽樣相比,使用判斷抽樣可以得到更具代表性的樣本。不過研究表明,在估計(jì)總體均值時(shí),即使研究者采集的是最有代表性的樣本,隨機(jī)抽樣也優(yōu)于判斷抽樣。 弊病:研究者容易出現(xiàn)判斷錯(cuò)誤;沒有一個(gè)客觀的評(píng)價(jià)標(biāo)準(zhǔn),確定一個(gè)人的判斷是否優(yōu)于另一個(gè)人的判斷,

14、定額抽樣:類似分層抽樣。一定的總體被細(xì)分為諸如年齡、性別、地理區(qū)域等不同的層。與從每層中隨機(jī)抽樣。不同的是,研究者使用非隨機(jī)抽樣的方法從每層中采集數(shù)據(jù)直到達(dá)到理想的定額為止。,滾雪球抽樣:被訪對(duì)象是由推薦人推薦產(chǎn)生的,而推薦人又來源于其他被訪對(duì)象的推薦。研究者事先確定一個(gè)適合本研究項(xiàng)目的個(gè)體,然后向此人詢問其他符合本研究的個(gè)體的姓名、住址等基本信息。通過這些推薦人,能夠方便有效地確定研究對(duì)象,當(dāng)研究對(duì)象很難確定時(shí),這種研究方法尤其有效。,抽樣調(diào)查實(shí)例,實(shí)例1:蓋洛普民意測(cè)驗(yàn)(定額抽樣) 實(shí)例2:住房需求抽樣調(diào)查方案設(shè)計(jì)(分層抽樣) 實(shí)例3:未成年犯罪調(diào)查樣本抽取方法的研究(多階段抽樣),第二節(jié)

15、 抽樣分布與抽樣誤差,抽樣分布(樣本均值、樣本成數(shù)) 抽樣誤差的概念和種類 抽樣平均誤差的計(jì)算,所有樣本指標(biāo)(如均值、比例、方差等)所形成的分布稱為抽樣分布,是一種理論概率分布。,一、樣本均值的抽樣分布(一個(gè)例子),例:設(shè)一個(gè)總體,含有4個(gè)元素(個(gè)體),即總體單位數(shù)N=4。4 個(gè)個(gè)體分別為X1=1、X2=2、X3=3 、X4=4 ??傮w的均值、方差及分布如下,均值和方差,P(x),x,樣本均值的抽樣分布 (一個(gè)例子), 現(xiàn)從總體中抽取n2的簡(jiǎn)單隨機(jī)樣本,在重復(fù)抽樣條件下,共有42=16個(gè)樣本。所有樣本的結(jié)果如下表,各樣本的均值,所有樣本均值的均值和方差,式中:M為樣本數(shù)目,n為樣本容量 比較及

16、結(jié)論:1. 樣本均值的均值(數(shù)學(xué)期望)等于總體均值 2. 樣本均值的方差等于總體方差的1/n,樣本均值的分布與總體分布的比較,抽樣分布, = 2.5 2 =1.25,總體分布,x,P(x),不重復(fù)抽樣,樣本均值的抽樣分布與中心極限定理,當(dāng)總體服從正態(tài)分布N (,2 )時(shí),來自該總體的所有容量為n的樣本的均值X也服從正態(tài)分布,X 的數(shù)學(xué)期望為,方差為2/n。即XN(,2/n),中心極限定理(圖示),中心極限定理:設(shè)從均值為,方差為 2的一個(gè)任意總體中抽取容量為n的樣本,當(dāng)n充分大時(shí),樣本均值的抽樣分布近似服從均值為、方差為2/n的正態(tài)分布,樣本均值的抽樣分布 (證明見課本356、358、361頁(yè)

17、),由概率統(tǒng)計(jì)理論,,重復(fù)抽樣,不重復(fù)抽樣,樣本成數(shù)的抽樣分布(證明見課本360頁(yè)),重復(fù)抽樣,不重復(fù)抽樣,樣本平均數(shù)和成數(shù)的期望值和方差,重復(fù)抽樣:,不重復(fù)抽樣,二、抽樣誤差的概念和種類,可消除性誤差 登記性誤差:登記過程中產(chǎn)生的誤差 系統(tǒng)性誤差(抽樣偏差):受主觀影響破壞隨機(jī)原則產(chǎn)生的誤差 不可消除性誤差 技術(shù)性誤差:由度量衡工具的精密度引起的誤差 抽樣誤差:由于抽樣的隨機(jī)性而帶來的代表性誤差,這類誤差存在于任何一次抽樣推斷中,并且不可能通過任何方式加以消除。,統(tǒng)計(jì)誤差的種類,抽樣誤差的種類和影響因素,(1)抽樣實(shí)際誤差是某一個(gè)具體樣本指標(biāo)與總體指標(biāo)之間的差別,這是無法知道的差別。 (2)

18、抽樣平均誤差是指所有可能出現(xiàn)的樣本指標(biāo)的標(biāo)準(zhǔn)差。 (3)抽樣極限誤差是根據(jù)概率論的理論,以一定的可靠程度保證抽樣誤差不超過某一給定的范圍。,樣本容量n 全及總體標(biāo)志變動(dòng)程度 抽樣方法(重復(fù)抽樣及不重復(fù)抽樣) 抽樣組織方式(純隨機(jī)抽樣、機(jī)械抽樣、分層抽樣、整群抽樣、多階段抽樣),影響因素,三、抽樣平均誤差的計(jì)算,(一)抽樣平均誤差的意義(課本178頁(yè)、179頁(yè)) 抽樣平均誤差是由于抽樣的隨機(jī)性而產(chǎn)生的所有可能樣本指標(biāo)之間的平均離差,它是由一系列的抽樣平均數(shù)或抽樣成數(shù)的標(biāo)準(zhǔn)差來反映的。它能夠說明樣本指標(biāo)代表性大小以及樣本指標(biāo)與總體指標(biāo)相差的一般范圍。,原始公式,轉(zhuǎn)化后的一般公式,(二)抽樣平均誤差

19、的計(jì)算(平均數(shù)的抽樣平均誤差和成數(shù)的抽樣平均誤差),平均數(shù)的抽樣平均誤差X,當(dāng)總體單位數(shù)N很大時(shí),(N-l)可以用N來代替。 不重復(fù)抽樣的抽樣平均誤差一定小于重復(fù)抽樣的抽樣平均誤差。 當(dāng)n/N 5%時(shí),不重復(fù)抽樣的抽樣平均誤差公式近似地等于重復(fù)抽樣的抽樣平均誤差公式。,成數(shù)的抽樣平均誤差公式,在上述公式中,無論是平均數(shù)的標(biāo)準(zhǔn)差還是成數(shù)方差P(1-P),都是指全及總體而言的,而在統(tǒng)計(jì)調(diào)查實(shí)踐中,當(dāng)兩個(gè)指標(biāo)都是未知的,通常采用以下方法解決:,1、用歷史資料來代替。如果有幾個(gè)不同的總體方差的資料,則應(yīng)該用數(shù)值較大的,如:接近0.5的P,能使成數(shù)方差最大。 2、用樣本方差來代替。概率論的理論說明:樣本

20、方差可以非常接近總體方差。這是實(shí)踐中經(jīng)常應(yīng)用的方法,但是只能在抽樣之后才有樣本方差。 3、用小規(guī)模調(diào)查資料。如果既沒有過去的資料,又需要在調(diào)查前就估計(jì)抽樣誤差,可先組織一次實(shí)驗(yàn)性調(diào)查。 4、用估計(jì)的材料。例如;在農(nóng)產(chǎn)品產(chǎn)量抽樣調(diào)查中,用農(nóng)產(chǎn)量估產(chǎn)的資料,根據(jù)預(yù)計(jì)估產(chǎn)的資料計(jì)算出總體方差。,例(課本181頁(yè)):某地對(duì)2800戶家庭進(jìn)行年收入調(diào)查,抽取5%的家庭做樣本。抽查結(jié)果,每戶平均收入為30000元,其年收入的均方差為1048元,試計(jì)算年收入的重復(fù)抽樣和不重復(fù)抽樣的抽樣平均誤差。,例(課本181頁(yè)):某燈泡廠對(duì)10000個(gè)產(chǎn)品進(jìn)行使用壽命檢驗(yàn),隨機(jī)抽取2%樣本進(jìn)行測(cè)試,所得資料見下表所示,第

21、三節(jié) 抽樣估計(jì),估計(jì)的優(yōu)良標(biāo)準(zhǔn) 抽樣估計(jì)的方法 總體均值和總體成數(shù)的估計(jì)(實(shí)例),估計(jì)量和被估計(jì)的總體參數(shù),估計(jì)量:用于估計(jì)總體某一參數(shù)的隨機(jī)變量,如樣本均值,樣本比例、樣本中位數(shù)等,一、估計(jì)量的優(yōu)良性標(biāo)準(zhǔn),當(dāng)我們用樣本去估計(jì)總體時(shí),必須明白在什么情況下,估計(jì)量才能稱為總體參數(shù)的最優(yōu)估計(jì)量,一般認(rèn)為,判斷估計(jì)量的優(yōu)良性有以下標(biāo)準(zhǔn):,無偏性 有效性 一致性,一、估計(jì)量的優(yōu)良性標(biāo)準(zhǔn)(無偏性),估計(jì)量(樣本指標(biāo))的數(shù)學(xué)期望等于被估計(jì)的總體參數(shù)( 為估計(jì)量, 為總體參數(shù)),估計(jì)量的優(yōu)良性標(biāo)準(zhǔn)(有效性),方差較小的無偏估計(jì)量稱更有效的估計(jì)量。如,與其他估計(jì)量相比,樣本均值是總體均值的一個(gè)更有效的估計(jì)量。

22、,估計(jì)量的優(yōu)良性標(biāo)準(zhǔn)(一致性),隨著樣本容量(n)的不斷增大,估計(jì)量越來越接近被估計(jì)的總體參數(shù)。,二、抽樣估計(jì)的方法,估 計(jì) 方 法,點(diǎn) 估 計(jì),區(qū)間估計(jì),點(diǎn)估計(jì)(point estimate),1、從總體中抽取一個(gè)樣本,根據(jù)該樣本的統(tǒng)計(jì)量對(duì)總體的未知參數(shù)作出一個(gè)數(shù)值點(diǎn)的估計(jì)。例如: 用樣本均值作為總體未知均值的估計(jì)值就是一個(gè)點(diǎn)估計(jì) 2、點(diǎn)估計(jì)沒有給出估計(jì)值接近總體未知參數(shù)程度的信息 3、通常是在大樣本的情況下采用此方法對(duì)總體進(jìn)行推斷。即直接用樣本平均數(shù)、成數(shù)推斷全及總體的平均數(shù)和成數(shù),而不考慮任何的抽樣誤差。 4、點(diǎn)估計(jì)的方法有矩估計(jì)法、順序統(tǒng)計(jì)量法、最大似然法、最小二乘法等,二戰(zhàn)中的點(diǎn)估計(jì)

23、德軍有多少輛坦克?,二戰(zhàn)期間,盟軍非常想知道德軍總共制造了多少輛坦克。德國(guó)人在制造坦克時(shí)是墨守成規(guī)的,他們把坦克從1開始進(jìn)行了連續(xù)編號(hào)。在戰(zhàn)爭(zhēng)過程中,盟軍繳獲了一些敵軍坦克,并記錄了它們的生產(chǎn)編號(hào)。那么怎樣利用這些號(hào)碼來估計(jì)坦克總數(shù)呢?在這個(gè)問題中,總體參數(shù)是未知的坦克總數(shù)N,而繳獲坦克的編號(hào)則是樣本。 假設(shè)我們是盟軍手下負(fù)責(zé)解決這個(gè)問題的統(tǒng)計(jì)人員。制造出來的坦克總數(shù)肯定大于等于記錄的最大編號(hào)。為了找到它比最大編號(hào)大多少,我們特別假設(shè)繳獲的坦克代表了所有坦克的一個(gè)隨機(jī)樣本。我們先找到被繳獲坦克編號(hào)的平均值,并認(rèn)為這個(gè)值是全部編號(hào)的中點(diǎn)。因此樣本均值乘以2就是總數(shù)的一個(gè)估計(jì);這種估計(jì)N的公式的缺

24、點(diǎn)是:不能保證均值的2倍一定大于記錄中的最大編號(hào)。,N的另一個(gè)點(diǎn)估計(jì)方法是:我們認(rèn)為坦克的實(shí)際數(shù)略大于最大編號(hào)。對(duì)最大編號(hào)進(jìn)行調(diào)整,用觀測(cè)到的最大編號(hào)乘以因子1+1/n,其中 n 是被俘虜坦克個(gè)數(shù)。假如俘虜了10 輛坦克,其中最大編號(hào)是50,那么坦克總數(shù)的一個(gè)估計(jì)是(1+1/10)50=55。 從戰(zhàn)后發(fā)現(xiàn)的德軍記錄來看,盟軍的估計(jì)值非常接近所生產(chǎn)的坦克的真實(shí)值。記錄還表明統(tǒng)計(jì)學(xué)家們做得比間諜們更漂亮!統(tǒng)計(jì)估計(jì)比通過其他情報(bào)方式作出估計(jì)要大大接近于真實(shí)數(shù)目。,區(qū)間估計(jì)(interval estimate),1、根據(jù)一個(gè)樣本的觀察值給出總體參數(shù)的估計(jì)范圍 2、給出總體參數(shù)落在這一區(qū)間的概率 3、例

25、如: 總體均值落在5070之間,置信度為 95%,落在總體均值某一區(qū)間內(nèi)的樣本,總體指標(biāo)X和P的估計(jì)區(qū)間,總體平均指標(biāo)的估計(jì)區(qū)間:,總體成數(shù)的估計(jì)區(qū)間:,樣本平均數(shù)的抽樣極限誤差,樣本成數(shù)的抽樣極限誤差,抽樣估計(jì)里的相關(guān)概念、要點(diǎn),置信水平(置信度、可靠程度) 置信區(qū)間(精確度) 置信水平和置信區(qū)間的關(guān)系(即可靠程度和精確度的關(guān)系),1、總體未知參數(shù)落在區(qū)間內(nèi)的概率 2、表示為F(t)或 (1 - t 為概率度,為顯著性水平,是總體參數(shù)未在區(qū)間內(nèi)的概率 3、常用的t和F(t)的對(duì)應(yīng)關(guān)系有:,置信水平(置信度、可靠程度、把握度),置信區(qū)間與置信水平,均值的抽樣分布,被區(qū)間 包含的可能性是(1 -

26、 ) % 不被區(qū)間 包含的可能性是 %,F(t),影響置信區(qū)間寬度的因素: ,樣本容量,置信水平(1-),抽樣估計(jì)的精確度和可靠程度,置信區(qū)間 精確性 (置信區(qū)間越大,說明估計(jì)的精確性越低,反之亦然。) 置信度F(t) 參數(shù)估計(jì)的可靠程度 (置信度越大,估計(jì)可靠程度就越大,反之亦然。),一般說來,在樣本容量一定時(shí),精確度和可靠程度是相互矛盾的??煽砍潭仍黾?,置信區(qū)間必然增大,精確度就降低;若精確度提高,則置信區(qū)間縮小,可靠程度必然減小。 要同時(shí)提高可靠程度和精確度,可以通過增加樣本容量。,區(qū)間估計(jì)的特點(diǎn)(課本184頁(yè)),1、根據(jù)樣本指標(biāo)和抽樣誤差去推斷全及指標(biāo)時(shí),只是確定了全及指標(biāo)的估計(jì)范圍,

27、沒有確定其具體數(shù)值 2、所得估計(jì)區(qū)間表示的只是一個(gè)可能范圍,而不是絕對(duì)范圍,全及指標(biāo)在這個(gè)范圍的可能性為F(t)或1- 3、精確度和可靠程度兩者相互矛盾。擴(kuò)大極限誤差可以提高估計(jì)的可靠程度,但精確度將降低;縮小極限誤差會(huì)降低估計(jì)的可靠程度,但精確度將會(huì)提高,三、總體均值和總體成數(shù)的估計(jì)(實(shí)例),總體平均數(shù)的估計(jì): (一)給定置信度F(t),求抽樣極限誤差x,指出估計(jì)區(qū)間。 (二)給定抽樣極限誤差x,求置信度F(t)。,總體比例的估計(jì): (一)給定置信度F(t),求抽樣極限誤差p,指出估計(jì)區(qū)間。 (二)給定抽樣極限誤差p,求置信度F(t)。,總體均值的置信區(qū)間,1、假定條件 總體服從正態(tài)分布 如

28、果不是正態(tài)分布,可以由正態(tài)分布來近似 (n 30) 2、使用正態(tài)分布統(tǒng)計(jì)量,3、總體均值 在(1-)即F(t)的置信水平下的置信區(qū)間為,總體均值的區(qū)間估計(jì)(已知F(t) ,求置信區(qū)間)(正態(tài)總體),解:已知N(,0.152),x21.4, n=9, F(t) = 0.95,t=1.96 求總體均值的置信區(qū)間,我們可以95的概率保證該種零件的平均長(zhǎng)度在21.30221.498 mm之間,例:某種零件長(zhǎng)度服從正態(tài)分布,從該批產(chǎn)品中隨機(jī)抽取件,測(cè)得其平均長(zhǎng)度為21.4 mm。已知總體標(biāo)準(zhǔn)差 =0.15mm,試建立該種零件平均長(zhǎng)度的置信區(qū)間,給定置信水平為0.95。,總體均值的區(qū)間估計(jì)(已知F(t)

29、,求置信區(qū)間)(非正態(tài)總體),解:已知 x26, =6,n=100, F(t) = 0.95,t=1.96,我們可以95的概率保證平均每天參加鍛煉的時(shí)間在24.82427.176 分鐘之間,例:某大學(xué)從該校學(xué)生中隨機(jī)抽取100人,調(diào)查到他們平均每天參加體育鍛煉的時(shí)間為26分鐘。試以95的置信水平估計(jì)該大學(xué)全體學(xué)生平均每天參加體育鍛煉的時(shí)間(已知總體方差為36分鐘)。,總體均值的區(qū)間估計(jì)(已知置信區(qū)間,求F(t) ),例:某地區(qū)水稻總面積20000畝,以不重復(fù)抽樣方法從中隨機(jī)抽取400畝實(shí)測(cè)求得樣本平均畝產(chǎn)645公斤,標(biāo)準(zhǔn)差72公斤,要求估計(jì)的抽樣極限誤差不超過7.2公斤,試對(duì)該地區(qū)水稻的畝產(chǎn)量

30、作估計(jì)。,解:已知x645, s= 72,n=400,我們可以95.45的概率保證該地區(qū)水稻的畝產(chǎn)量在637.8652.2 公斤之間,總體比例的置信區(qū)間,1、假定條件 兩類結(jié)果 總體服從二項(xiàng)分布 可以由正態(tài)分布來近似 2、使用正態(tài)分布統(tǒng)計(jì)量,3. 總體比例 的置信區(qū)間為,總體比例的置信區(qū)間(已知F(t) ,求置信區(qū)間),解:已知 n=200 , p0.7 , F(t)= 0.95,t=1.96,我們可以95的概率保證該企業(yè)職工由于同管理人員不能融洽相處而離開的比例在63.65%76.35%之間,例:某企業(yè)在一項(xiàng)關(guān)于職工流動(dòng)原因的研究中,從該企業(yè)前職工的總體中隨機(jī)選取了200人組成一個(gè)樣本。在對(duì)

31、其進(jìn)行訪問時(shí),有140人說他們離開該企業(yè)是由于同管理人員不能融洽相處。試對(duì)由于這種原因而離開該企業(yè)的人員的真正比例構(gòu)造95%的置信區(qū)間。,總體比例的置信區(qū)間(已知置信區(qū)間,求F(t),解:已知 n=900 , p0.7 ,我們可以95.45的概率保證該市居民電視機(jī)普及率在72.2%77.8%之間,例:估計(jì)某市居民住戶擁有電視機(jī)的普及率,隨機(jī)抽取900戶,其中有675戶有電視機(jī),要求抽樣極限誤差不超過2.8%,試對(duì)該市居民電視機(jī)普及率作出估計(jì)。,附:兩個(gè)總體均值及兩個(gè)總體比例之差估計(jì),一、兩個(gè)總體均值之差的估計(jì) 二、兩個(gè)總體比例之差的估計(jì),一、兩個(gè)樣本均值之差的抽樣分布,(一)兩個(gè)總體均值之差的

32、估計(jì) (12、22 已知),1、使用正態(tài)分布統(tǒng)計(jì)量Z,2、兩個(gè)總體均值之差1-2在1- 置信水平下的置信區(qū)間為,兩個(gè)總體均值之差的估計(jì) (實(shí)例),例:一個(gè)銀行負(fù)責(zé)人想知道儲(chǔ)戶存入兩家銀行的錢數(shù)。他從兩家銀行各抽取了一個(gè)由25個(gè)儲(chǔ)戶組成的隨機(jī)樣本,樣本均值如下:銀行A:4500元;銀行B:3250元。設(shè)已知兩個(gè)總體服從方差分別為A2=2500和B2=3600的正態(tài)分布。試求A- B的區(qū)間估計(jì) (1)置信度為95% (2)置信度為99%,B,A,兩個(gè)總體均值之差的估計(jì) (計(jì)算結(jié)果),解:已知 XAN(A,2500) XB N(B,3600) xA=4500, xB=3250, A2 =2500 B

33、2 =3600 nA= nB =25,(1) A- B置信度為95%的置信區(qū)間為,(2) A- B置信度為99%的置信區(qū)間為,(二)兩個(gè)總體均值之差的估計(jì) (12、22未知,但相等),1、使用 t 分布統(tǒng)計(jì)量,2、兩個(gè)總體均值之差1-2在1- 置信水平下的置信 區(qū)間為,兩個(gè)總體均值之差的估計(jì) (實(shí)例),例:為比較兩位銀行職員為新顧客辦理個(gè)人結(jié)算賬目的平均時(shí)間長(zhǎng)度,分別給兩位職員隨機(jī)安排了10位顧客,并記錄下為每位顧客辦理賬單所需的時(shí)間(單位:分鐘),相應(yīng)的樣本均值和方差分別為:x1=22.2,s12=16.63,x2=28.5,s22=18.92。假定每位職員辦理賬單所需時(shí)間均服從正態(tài)分布,且

34、方差相等。試求兩位職員辦理賬單的服務(wù)時(shí)間之差的95%的區(qū)間估計(jì)。,兩個(gè)總體均值之差的估計(jì) (計(jì)算結(jié)果),解:已知 X1N(1,2) X2 N(2,2) x1=22.2, x2=28.5, s12=16.63 s22=18.92 n1= n2=10 12= 12,1- 2置信度為95%的置信區(qū)間為,(三)兩個(gè)總體均值之差的估計(jì) (12 、22未知,且不相等,大樣本),類似前(一),在大樣本情況下,直接用樣本方差代替總體方差。,1、假定條件 兩個(gè)總體是獨(dú)立的 兩個(gè)總體服從二項(xiàng)分布 可以用正態(tài)分布來近似 2、兩個(gè)總體比例之差P1-P2在1-置信水平下的置信區(qū)間為,二、兩個(gè)總體比例之差的區(qū)間估計(jì),兩個(gè)

35、總體比例之差的估計(jì) (實(shí)例),例:某飲料公司對(duì)其所做的報(bào)紙廣告在兩個(gè)城市的效果進(jìn)行了比較,它們從兩個(gè)城市中分別隨機(jī)地調(diào)查了1000個(gè)成年人,其中看過廣告的比例分別為p1=0.18和p2=0.14。試求兩城市成年人中看過廣告的比例之差的95%的置信區(qū)間。,兩個(gè)總體比例之差的估計(jì) (計(jì)算結(jié)果),P1- P2置信度為95%的置信區(qū)間為,我們有95%的把握估計(jì)兩城市成年人中看過該廣告的比例之差在0.79% 7.21%之間,第四節(jié) 抽樣方案的設(shè)計(jì),抽樣方案設(shè)計(jì)的基本原則和內(nèi)容 必要的樣本容量的確定 抽樣調(diào)查的組織形式,一、抽樣方案設(shè)計(jì)的基本原則和內(nèi)容,(一)基本原則 1、遵循隨機(jī)原則,保證樣本的代表性。 2、提高精度和節(jié)約費(fèi)用相結(jié)合的原則。 (二)設(shè)計(jì)內(nèi)容 1、確定必要的樣本容量n 2、確定適宜的組織方式,二、必要的樣本容量的確定,在保證抽樣推斷達(dá)到一定的可靠程度和精確程度的要求下,必須抽取的樣本單位數(shù)。,(1)調(diào)查者對(duì)一項(xiàng)抽樣推斷的可靠程度1-和精確程度的要求。 (2)總體各單位標(biāo)志值的變異程

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請(qǐng)下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請(qǐng)聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁(yè)內(nèi)容里面會(huì)有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫(kù)網(wǎng)僅提供信息存儲(chǔ)空間,僅對(duì)用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對(duì)用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對(duì)任何下載內(nèi)容負(fù)責(zé)。
  • 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請(qǐng)與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶因使用這些下載資源對(duì)自己和他人造成任何形式的傷害或損失。

最新文檔

評(píng)論

0/150

提交評(píng)論