第6章抽樣推斷統(tǒng)計學(xué)陶浪平南京大學(xué)出_第1頁
第6章抽樣推斷統(tǒng)計學(xué)陶浪平南京大學(xué)出_第2頁
第6章抽樣推斷統(tǒng)計學(xué)陶浪平南京大學(xué)出_第3頁
第6章抽樣推斷統(tǒng)計學(xué)陶浪平南京大學(xué)出_第4頁
第6章抽樣推斷統(tǒng)計學(xué)陶浪平南京大學(xué)出_第5頁
已閱讀5頁,還剩94頁未讀 繼續(xù)免費(fèi)閱讀

下載本文檔

版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進(jìn)行舉報或認(rèn)領(lǐng)

文檔簡介

想一想

ThinkingChallenge消費(fèi)者協(xié)會接到消費(fèi)者投訴,指控品牌紙包裝飲料存在容量不足,有欺騙消費(fèi)者之嫌。包裝上標(biāo)明的容量為250毫升。消費(fèi)者協(xié)會從市場上隨機(jī)抽取50盒該品牌紙包裝飲品,測試發(fā)現(xiàn)平均含量為248毫升,小于250毫升。這是生產(chǎn)中正常的波動,還是廠商的有意行為?消費(fèi)者協(xié)會能否根據(jù)該樣本數(shù)據(jù),判定飲料廠商欺騙了消費(fèi)者呢?250ml當(dāng)前1頁,總共99頁。抽樣推斷:

從樣本含有的信息中提取總體的信息一個輪胎制造商發(fā)明了一種新輪胎,這種輪胎的里程數(shù)超過了企業(yè)現(xiàn)有生產(chǎn)線上輪胎的里程數(shù)。為了對這種新型輪胎作出評估,管理人員需要對新型輪胎的平均里程作出估計。制造商選擇了120個這種新型輪胎作為樣本進(jìn)行檢驗,檢驗結(jié)果的樣本均值為36500英里。于是,該種新型輪胎平均里程的估計值為36500。某個政治團(tuán)體的成員正考慮支持某一候選人競選國會議員。為了決定是否參加即將到來的普選,政團(tuán)領(lǐng)導(dǎo)者需要對登記選民中支持這一候選人的比率做一個估計。受時間和成本的限制,不可能與登記選民總體中的每一個都取得聯(lián)系。于是,選取400個登記選民為樣本。如果400個選民中有160個對該候選人表示支持,則登記選民中支持該候選人的比率的估計值為160/400=0.4當(dāng)前2頁,總共99頁。參數(shù)估計在統(tǒng)計方法中的地位描述統(tǒng)計推斷統(tǒng)計參數(shù)估計假設(shè)檢驗參數(shù)估計:通過樣本的觀察結(jié)果來推斷總體參數(shù)的取值范圍以及得到此結(jié)論的可靠程度。假設(shè)檢驗:根據(jù)樣本所提供的信息,對總體的某些方面,如總體的分布類型、總體參數(shù)的性質(zhì)等作出結(jié)論性的判斷?;咀龇ǎ侯A(yù)先對總體參數(shù)的取值或總體分布形式作出假定,然后用樣本數(shù)據(jù)來驗證,從而作出是接受還是拒絕該假設(shè)的結(jié)論。統(tǒng)計方法當(dāng)前3頁,總共99頁。例:某大學(xué)從該校學(xué)生中隨機(jī)抽取100人,調(diào)查到他們平均每天參加體育鍛煉的時間為26分鐘。試以95%的置信水平估計該大學(xué)全體學(xué)生平均每天參加體育鍛煉的時間(已知總體方差為36分鐘)。例:某地區(qū)水土中缺乏一種微量元素,根據(jù)醫(yī)學(xué)研究結(jié)果可知,人們?nèi)绻麛z取這種元素過少,腦功能可能受影響,因此可推測該地區(qū)兒童的智力水平可能低于一般水平。心理學(xué)家使用某一標(biāo)準(zhǔn)化智力檢驗方法,對該地區(qū)隨機(jī)選取36名兒童進(jìn)行智力測驗,得到智力分?jǐn)?shù)的平均值是94分,已知總體標(biāo)準(zhǔn)差為15分,問該地區(qū)兒童的智力水平是否和一般水平(100分)有明顯差異?當(dāng)前4頁,總共99頁。抽樣推斷的過程樣本總體(參數(shù)待推斷)樣本統(tǒng)計量例如:樣本均值、比例、方差總體均值、比例、方差抽樣計算推斷當(dāng)前5頁,總共99頁。抽樣分布:樣本統(tǒng)計量(樣本平均數(shù)或樣本比率)的概率分布1.樣本統(tǒng)計量服從什么理論分布?2.統(tǒng)計量抽樣分布的參數(shù)與總體的參數(shù)有什么關(guān)系?核心概念兩個基本點(diǎn)如果將抽取簡單隨機(jī)樣本的過程看作一次試驗,樣本均值或比率就是試驗結(jié)果的一個數(shù)值描述,即樣本均值或樣本比率就是一個隨機(jī)變量。因此,也就有數(shù)學(xué)期望、方差和概率分布。當(dāng)前6頁,總共99頁。第一節(jié)抽樣推斷的一般問題一、抽樣推斷的概念和特征二、抽樣推斷的應(yīng)用范圍三、抽樣推斷的內(nèi)容四、有關(guān)抽樣的基本概念和理論依據(jù)統(tǒng)計學(xué)第6章抽樣推斷第一節(jié)抽樣推斷的概述本章目錄當(dāng)前7頁,總共99頁。一、抽樣推斷的概念和特征1.抽樣推斷的含義抽樣推斷是根據(jù)隨機(jī)原則從總體中抽取部分總體單位,以這一部分總體單位的實(shí)際數(shù)據(jù)推算總體相應(yīng)數(shù)量特征的一種統(tǒng)計分析方法。隨機(jī)原則指樣本單位的抽取不受主觀因素及其他系統(tǒng)性因素的影響,每個總體單位都有均等的被抽中機(jī)會。隨機(jī)抽樣的目的是使樣本與總體同分布。統(tǒng)計學(xué)第6章抽樣推斷第一節(jié)抽樣推斷的概述當(dāng)前8頁,總共99頁。統(tǒng)計推斷全及總體指標(biāo):參數(shù)(未知量)樣本總體指標(biāo):統(tǒng)計量(已知量)抽樣推斷《統(tǒng)計學(xué)》第6章抽樣推斷當(dāng)前9頁,總共99頁。隨機(jī)原則的實(shí)現(xiàn)抽簽法是將總體中每個單位的編號寫在外形完全一致的簽上,將其攪拌均勻,從中任意抽選,簽上的號碼所對應(yīng)的單位就是樣本單位。隨機(jī)數(shù)表法將總體中每個單位編上號碼,然后使用隨機(jī)數(shù)表,查出所要抽取的調(diào)查單位。計算機(jī)模擬法是將隨機(jī)數(shù)字編制為程序存儲在計算機(jī)中,需要時將總體中各單位編上號碼,啟用隨機(jī)數(shù)字發(fā)生器輸出隨機(jī)數(shù)字,然后從總體中找到相應(yīng)總體單位形成樣本。當(dāng)前10頁,總共99頁。并非所有的抽樣估計都按隨機(jī)原則抽取樣本,也有非隨機(jī)抽樣總體隨機(jī)樣本非隨機(jī)樣本與總體分布特征相同與總體分布特征不同《統(tǒng)計學(xué)》第6章抽樣推斷當(dāng)前11頁,總共99頁。2.抽樣推斷的特征(1)是由部分推算整體的一種認(rèn)識方法(2)按隨機(jī)原則抽取樣本(3)運(yùn)用概率估計的方法(4)抽樣推斷雖然存在一定的誤差,但抽樣誤差可以事先計算并加以控制統(tǒng)計學(xué)第6章抽樣推斷第一節(jié)抽樣推斷的概述當(dāng)前12頁,總共99頁。二、抽樣推斷的應(yīng)用范圍《統(tǒng)計學(xué)》第6章抽樣推斷1.對于一些具有破壞或損傷使用價值的檢驗調(diào)查方法,即被抽取的單位經(jīng)過觀測之后就失去了原有的形態(tài)或功能。(如燈泡耐用時間實(shí)驗)2.反映不可能進(jìn)行全面調(diào)查,而又要了解全面情況的社會經(jīng)濟(jì)現(xiàn)象總體的數(shù)量特征。(產(chǎn)品質(zhì)量檢驗、商品市場占有率調(diào)查)3.對可進(jìn)行全面調(diào)查的現(xiàn)象,抽樣調(diào)查可取得事半功倍的效果,并有其獨(dú)到的作用。(居民生活狀況調(diào)查)

當(dāng)前13頁,總共99頁。二、抽樣推斷的應(yīng)用范圍《統(tǒng)計學(xué)》第6章抽樣推斷4.可以對全面調(diào)查資料進(jìn)行補(bǔ)充和訂正。(人口的抽樣推斷檢查)5.可以用于工業(yè)生產(chǎn)過程的質(zhì)量控制。6.可以對某種總體指標(biāo)的假設(shè)進(jìn)行檢驗,來判斷這種假設(shè)的真?zhèn)危詻Q定取舍。當(dāng)前14頁,總共99頁。三、抽樣推斷的內(nèi)容1.抽樣估計抽樣估計是通過以樣本數(shù)據(jù)對總體某一未知數(shù)量特征進(jìn)行估計的一種統(tǒng)計分析方法。2.假設(shè)檢驗假設(shè)檢驗是根據(jù)研究的目的和要求,先對總體某一未知的數(shù)量特征作某種假設(shè),然后根據(jù)樣本數(shù)據(jù)對這一假設(shè)進(jìn)行檢驗,以判斷假設(shè)的真?zhèn)蔚囊环N統(tǒng)計分析方法。統(tǒng)計學(xué)第6章抽樣推斷第一節(jié)抽樣推斷的概述當(dāng)前15頁,總共99頁。四、有關(guān)抽樣的基本概念及理論依據(jù)1.全及總體和樣本2.全及指標(biāo)(總體參數(shù))和抽樣指標(biāo)(統(tǒng)計量)3.重復(fù)抽樣和不重復(fù)抽樣統(tǒng)計學(xué)第6章抽樣推斷第一節(jié)抽樣推斷的概述(一)相關(guān)概念當(dāng)前16頁,總共99頁。1.全及總體和樣本統(tǒng)計學(xué)第6章抽樣推斷第一節(jié)抽樣推斷的概述全及總體又稱總體或母體,是所要認(rèn)識研究對象的全體,它由具有某種共同性質(zhì)或特征的單位所組成。常用N表示全及總體的單位數(shù)目。樣本又稱樣本總體、抽樣總體或子樣,是指從全及總體中按照隨機(jī)原則抽取的那部分個體的組合。抽樣總體的單位數(shù)稱為樣本容量,通常用n表示。1<n<N。n≥30稱為大樣本,n

<30稱為小樣本.n/N稱為抽樣比。例如:在100萬戶居民中,隨機(jī)抽取1000戶居民進(jìn)行家庭收支情況調(diào)查,其中的100萬戶居

民就是全及總體,而被抽中的1000戶居民則構(gòu)成抽樣總體。當(dāng)前17頁,總共99頁。2.全及指標(biāo)(總體參數(shù))和抽樣指標(biāo)(統(tǒng)計量)統(tǒng)計學(xué)第6章抽樣推斷第一節(jié)抽樣推斷的概述(1)全及指標(biāo)根據(jù)全及總體各個單位的標(biāo)志值或標(biāo)志特征所計算的反映總體某種屬性的綜合指標(biāo),又稱總體參數(shù)。當(dāng)前18頁,總共99頁。設(shè)樣本中個樣本單位,某項標(biāo)志的標(biāo)志值分別為,其中具有和不具有某種屬性的樣本單位數(shù)目分別為和個,則①樣本平均數(shù)(又叫樣本均值):指根據(jù)抽樣總體各個單位的標(biāo)志值或標(biāo)志特征計算的綜合指標(biāo),又被稱為統(tǒng)計量,它是隨機(jī)變量。(2)抽樣指標(biāo)《統(tǒng)計學(xué)》第6章抽樣推斷當(dāng)前19頁,總共99頁。②樣本單位標(biāo)志值的標(biāo)準(zhǔn)差:③樣本單位標(biāo)志值的方差:為自由度為的無偏估計為的無偏估計當(dāng)前20頁,總共99頁。④樣本成數(shù):⑤樣本單位是非標(biāo)志的標(biāo)準(zhǔn)差:⑥樣本單位是非標(biāo)志的方差:為的無偏估計為的無偏估計《統(tǒng)計學(xué)》第八章抽樣推斷當(dāng)前21頁,總共99頁。當(dāng)前22頁,總共99頁。常用的參數(shù)常用統(tǒng)計量a.平均數(shù):成數(shù):b.方差:成數(shù)方差:(2)常用的參數(shù)和統(tǒng)計量統(tǒng)計學(xué)第6章抽樣推斷第一節(jié)抽樣推斷的概述當(dāng)前23頁,總共99頁。重復(fù)抽樣從總體N個單位中隨機(jī)抽取一個樣本容量為n的樣本,每次從總體中抽取一個,并把結(jié)果登記下來,又放回總體中重新參加下一次的抽選。又稱放回抽樣不重復(fù)抽樣每次從總體中抽選一個單位后就不再將其放回參加下一次的抽選。又稱不放回抽樣.總體單位數(shù)N不變,同一單位可能多次被抽中??傮w單位數(shù)減少n,同一單位只可能被抽中一次。《統(tǒng)計學(xué)》第6章抽樣推斷3.重復(fù)抽樣和不重復(fù)抽樣當(dāng)前24頁,總共99頁。抽樣方法的分類根據(jù)對樣本的要求不同,可分為:考慮順序抽樣不考慮順序抽樣考慮各單位的中選順序。ABC≠CBA不考慮各單位的中選順序。ABC=CBA考慮順序的重復(fù)抽樣不考慮順序的不重復(fù)抽樣考慮順序的不重復(fù)抽樣不考慮順序的重復(fù)抽樣綜合起來共有四種抽樣方法《統(tǒng)計學(xué)》第6章抽樣推斷當(dāng)前25頁,總共99頁。樣本的可能數(shù)目考慮順序的不重復(fù)抽樣不考慮順序的不重復(fù)抽樣考慮順序的重復(fù)抽樣不考慮順序的重復(fù)抽樣《統(tǒng)計學(xué)》第6章抽樣推斷當(dāng)前26頁,總共99頁。(二)抽樣推斷的理論基礎(chǔ)大數(shù)法則中心極限定理又稱大數(shù)定律,表明大量隨機(jī)觀象平均結(jié)果具有穩(wěn)定性的性質(zhì)。是指在隨機(jī)試驗中,每次出現(xiàn)的結(jié)果不同,但是大量重復(fù)試驗出現(xiàn)的結(jié)果的平均值卻幾乎總是接近于某個確定的值。簡單的說,大數(shù)定理就是“當(dāng)試驗次數(shù)足夠多時,事件發(fā)生的頻率無窮接近于該事件發(fā)生的概率”。如果變量總體存在有限的平均數(shù)和方差,那么不論這個總體的分布如何,隨著樣本容量的增加,樣本平均數(shù)的分布,便趨近于正態(tài)分布。即:當(dāng)前27頁,總共99頁。第二節(jié)抽樣誤差一、抽樣誤差的概念及影響因素二、抽樣平均誤差三、抽樣極限誤差統(tǒng)計學(xué)第6章抽樣推斷第二節(jié)抽樣誤差本章目錄當(dāng)前28頁,總共99頁。一、抽樣誤差的概念及影響因素(一)抽樣誤差的概念在抽樣推斷中,誤差的來源很多,包括登記性誤差和代表性誤差。⒈登記性誤差又稱為調(diào)查誤差或工作誤差,是指在調(diào)查過程中,由于各種主觀或客觀的原因而引起的誤差。統(tǒng)計學(xué)第6章抽樣推斷第二節(jié)抽樣誤差當(dāng)前29頁,總共99頁。⒉代表性誤差是指在抽樣調(diào)查中,樣本各單位的結(jié)構(gòu)情況不足以代表總體的狀況,而用部分去推斷總體所產(chǎn)生的誤差。它包括兩類誤差:系統(tǒng)性誤差和隨機(jī)性誤差。當(dāng)前30頁,總共99頁。⑴系統(tǒng)性誤差它是由于抽樣時違反隨機(jī)原則而產(chǎn)生的誤差。系統(tǒng)性誤差和登記誤差一樣,都是抽樣組織工作造成的,應(yīng)該采取措施預(yù)防或?qū)⑵錅p小到最低程度。⑵隨機(jī)性誤差它是指由于隨機(jī)抽樣的偶然因素使樣本代表性不足而引起的。隨機(jī)性誤差在抽樣推斷中是不可避免的。當(dāng)前31頁,總共99頁。⒊抽樣誤差廣義:指代表性誤差狹義:專指抽樣調(diào)查中的隨機(jī)性誤差當(dāng)前32頁,總共99頁。(二)抽樣誤差的影響因素

1.總體各單位標(biāo)志值的差異程度;2.樣本的單位數(shù);3.抽樣的方法;4.抽樣調(diào)查的組織形式。重復(fù)抽樣的抽樣誤差比不重復(fù)抽樣的大單位數(shù)越多,抽樣誤差越小差異越大,抽樣誤差越大簡單隨機(jī)抽樣的抽樣誤差最大當(dāng)前33頁,總共99頁。二、抽樣平均誤差(一)什么是抽樣平均誤差

抽樣平均誤差是反映抽樣誤差一般水平的指標(biāo),其實(shí)質(zhì)是指抽樣平均數(shù)的標(biāo)準(zhǔn)差,它反映了抽樣指標(biāo)與總體指標(biāo)的平均離散程度,也就是樣本指標(biāo)與總體指標(biāo)的標(biāo)準(zhǔn)差,通常用抽樣平均數(shù)的標(biāo)準(zhǔn)差來衡量。抽樣平均數(shù)的平均數(shù)=總體平均數(shù)(二)抽樣平均誤差的計算

1.重復(fù)抽樣的條件下

2.不重復(fù)抽樣的條件下統(tǒng)計學(xué)第6章抽樣推斷第二節(jié)抽樣誤差當(dāng)前34頁,總共99頁。1.重復(fù)抽樣的條件下統(tǒng)計學(xué)第6章抽樣推斷第二節(jié)抽樣誤差

式中,n為樣本容量為總體標(biāo)準(zhǔn)差一般情況下是未知,可用樣本標(biāo)準(zhǔn)差替代。

式中,n為樣本容量;為總體成數(shù)標(biāo)準(zhǔn)差,一般情況下是未知的,可用樣本成數(shù)標(biāo)準(zhǔn)差替代。當(dāng)前35頁,總共99頁。2.不重復(fù)抽樣的條件下統(tǒng)計學(xué)第6章抽樣推斷第二節(jié)抽樣誤差

式中,N為總體單位數(shù);n為樣本容量;為總體方差一般情況下是未知,可用樣本方差替代。當(dāng)前36頁,總共99頁。式中,N為總體單位數(shù);n為樣本容量;為總體成數(shù)方差一般情況下是未知,可用樣本成數(shù)方差替代。當(dāng)前37頁,總共99頁。由此可以看出,同樣條件下,重復(fù)抽樣與不重復(fù)抽樣的抽樣平均誤差之間相差一個,稱為校正因子。由于,因此在同樣條件下,不重復(fù)抽樣的平均誤差總是小于重復(fù)抽樣的平均誤差。在抽樣比例很小時,當(dāng)前38頁,總共99頁。3.當(dāng)總體方差和標(biāo)準(zhǔn)差未知時,可用以下方法解決:⑴用樣本方差來代替總體方差⑵可用過去全面調(diào)查的資料,也可以用過去抽樣調(diào)查的資料代替如果有多個不同的材料,則應(yīng)選擇用方差數(shù)值較大的。⑶用估計資料代替當(dāng)前39頁,總共99頁。例:某企業(yè)生產(chǎn)一批燈泡,共10000只,隨機(jī)抽取500只作耐用時間實(shí)驗。測算結(jié)果平均使用壽命為5000小時,樣本標(biāo)準(zhǔn)差為300小時,500只中發(fā)現(xiàn)10只不合格。求平均數(shù)和成數(shù)的抽樣平均誤差。當(dāng)前40頁,總共99頁。三、抽樣極限誤差抽樣極限誤差是指用絕對值形式表示的樣本指標(biāo)與總體指標(biāo)偏差可允許的最大范圍。即:

如果抽樣極限誤差用抽樣平均誤差來衡量,則有:或統(tǒng)計學(xué)第6章抽樣推斷第二節(jié)抽樣誤差即,抽樣極限誤差是抽樣平均誤差的多少倍。我們把倍數(shù)z稱為抽樣誤差的概率度本章目錄當(dāng)前41頁,總共99頁。第三節(jié)抽樣推斷的方法——參數(shù)估計

ParameterEstimation一、抽樣推斷的含義二、總體參數(shù)的點(diǎn)估計三、總體參數(shù)的區(qū)間估計統(tǒng)計學(xué)第6章抽樣推斷第三節(jié)參數(shù)估計本章目錄當(dāng)前42頁,總共99頁。

也叫抽樣估計,就是根據(jù)樣本指標(biāo)數(shù)值對總體指標(biāo)數(shù)值作出估計或推斷。由于總體指標(biāo)是表明總體數(shù)量特征的參數(shù),所以也稱為參數(shù)估計。參數(shù)估計主要分為點(diǎn)估計和區(qū)間估計兩種方法。抽樣推斷通常,把用來估計總體特征的樣本指標(biāo)叫估計量或統(tǒng)計量,待估計的總體指標(biāo)叫總體參數(shù)。特點(diǎn)1.它在邏輯上運(yùn)用歸納推理而不是演繹推理。

2.在方法上運(yùn)用不確定的概率估計方法,而不是運(yùn)用確定的數(shù)學(xué)分析方法。3.抽樣估計存在抽樣誤差。統(tǒng)計學(xué)第6章抽樣推斷第三節(jié)參數(shù)估計一、抽樣推斷的含義當(dāng)前43頁,總共99頁。二、總體參數(shù)的點(diǎn)估計(一)參數(shù)點(diǎn)估計的概念及特點(diǎn)(二)抽樣估計量的優(yōu)良標(biāo)準(zhǔn)(三)抽樣估計的估計精度(四)抽樣估計的置信度統(tǒng)計學(xué)第6章抽樣推斷第三節(jié)參數(shù)估計當(dāng)前44頁,總共99頁。(一)參數(shù)點(diǎn)估計的概念及特點(diǎn)1.概念點(diǎn)估計又稱為定值估計,就是用實(shí)際抽樣調(diào)查資料得到的樣本指標(biāo)值直接作為相應(yīng)總體參數(shù)的估計值。例如:統(tǒng)計學(xué)第6章抽樣推斷第三節(jié)參數(shù)估計當(dāng)前45頁,總共99頁。2.特點(diǎn)⑴方法簡單,能夠提供總體參數(shù)的具體估計值,從而可以作為行動決策的數(shù)量依據(jù)。⑵無法控制誤差,僅適用于對推斷的準(zhǔn)確程度與可靠程度要求不高的情況。統(tǒng)計學(xué)第6章抽樣推斷第三節(jié)參數(shù)估計當(dāng)前46頁,總共99頁。問題:

第一,我們?yōu)槭裁匆赃@一個而不是那一個統(tǒng)計量來估計某個總體參數(shù)?

估計值的優(yōu)良標(biāo)準(zhǔn)第二,如果有兩個以上的統(tǒng)計量可以用來估計某個總體參數(shù),其估計結(jié)果是否一致?是否一個統(tǒng)計量要優(yōu)于另一個?估計值的優(yōu)良標(biāo)準(zhǔn):無偏性、有效性、一致性《統(tǒng)計學(xué)》第6章抽樣推斷當(dāng)前47頁,總共99頁。(二)抽樣估計量的優(yōu)良標(biāo)準(zhǔn)

統(tǒng)計學(xué)第6章抽樣推斷第三節(jié)參數(shù)估計1.無偏性作為總體參數(shù)估計量的樣本統(tǒng)計量,要求其期望值(平均數(shù))等于被估計的總體參數(shù)。這樣的估計量稱為無偏估計量。

2.有效性

以抽樣指標(biāo)估計總體指標(biāo)時,要求作為優(yōu)良估計量的方差應(yīng)比其它估計量的方差小。

3.一致性

又稱相合性,作為優(yōu)良估計量的樣本容量充分大時,抽樣指標(biāo)也應(yīng)充分地靠近總體參數(shù)。即:

從樣本統(tǒng)計量期望的角度分析一般情況下均可滿足方差越小的估計量就越有效當(dāng)前48頁,總共99頁。優(yōu)良估計量標(biāo)準(zhǔn)無偏性:要求樣本統(tǒng)計量的平均數(shù)等于被估計的總體參數(shù)本身。有效性:一致性:當(dāng)樣本容量充分大時,樣本統(tǒng)計量充分靠近總體參數(shù)本身。當(dāng)前49頁,總共99頁。優(yōu)良估計量標(biāo)準(zhǔn)總體方差的無偏估計量為樣本方差點(diǎn)估計完全正確的概率通常為0。因此,我們更多的是考慮用樣本統(tǒng)計量去估計總體參數(shù)的范圍

區(qū)間估計。

當(dāng)前50頁,總共99頁。(三)抽樣估計的估計精度1.誤差率:

or

2.估計精度:統(tǒng)計學(xué)第6章抽樣推斷第三節(jié)參數(shù)估計當(dāng)前51頁,總共99頁。(四)抽樣推斷的置信度

抽樣推斷的置信度是表明樣本指標(biāo)和總體參數(shù)之間的誤差不超過一定范圍的概率的概率保證程度。置信度一般用“1-a”表示。用公式表示為:統(tǒng)計學(xué)第6章抽樣推斷第三節(jié)參數(shù)估計例如,“在95%置信度下,樣本平均身高與總體平均身高的誤差為5cm”表示在很多次抽樣中,樣本平均身高與總體平均身高相差小于5cm的抽樣次數(shù)占總抽樣次數(shù)的95%。當(dāng)前52頁,總共99頁。抽樣推斷的置信度是表明樣本指標(biāo)和總體參數(shù)之間的誤差不超過一定范圍的概率的概率保證程度。置信度一般用“1-α”表示。置信度與概率度的之間關(guān)系:

統(tǒng)計學(xué)第6章抽樣推斷第三節(jié)參數(shù)估計由定義可知:當(dāng)前53頁,總共99頁。同樣,置信度可以通過《正態(tài)分布概率表》(P149)獲得:

由此可見,抽樣極限誤差和估計的置信密度不可分:極限誤差范圍越小,估計的置信度也越小;極限誤差范圍越大,估計的置信度也越大。統(tǒng)計學(xué)第6章抽樣推斷第三節(jié)參數(shù)估計當(dāng)前54頁,總共99頁。三、總體參數(shù)的區(qū)間估計

ConfidenceIntervalEstimates(一)區(qū)間估計的基本特點(diǎn)及要素(二)總體參數(shù)區(qū)間估計的估計方法統(tǒng)計學(xué)第6章抽樣推斷第三節(jié)參數(shù)估計當(dāng)前55頁,總共99頁。估計過程

EstimationProcess均值是未知的總體隨機(jī)樣本我有95%的把握認(rèn)為在40和60之間。均值當(dāng)前56頁,總共99頁。

置信區(qū)間估計

ConfidenceIntervalEstimation置信區(qū)間ConfidenceInterval樣本統(tǒng)計量SampleStatistic置信邊界(下界)LowerLimit置信邊界(上界)UpperLimit總體參數(shù)落在某區(qū)間內(nèi)的概率當(dāng)前57頁,總共99頁。(一)區(qū)間估計的基本特點(diǎn)及要素1.區(qū)間估計的基本特點(diǎn)

根據(jù)給定的置信度,利用實(shí)際抽樣資料,指出總體參數(shù)可能存在的區(qū)間范圍,這個區(qū)間稱為置信區(qū)間。用公式表示為:

統(tǒng)計學(xué)第6章抽樣推斷第三節(jié)參數(shù)估計式中:是總體平均數(shù)(或總體成數(shù))區(qū)間的下限,

是總體平均數(shù)(或總體成數(shù))區(qū)間的上限當(dāng)前58頁,總共99頁。

被估計總體參數(shù)在區(qū)間和內(nèi)的概率為1-a,即:其中和為置信區(qū)間。

當(dāng)前59頁,總共99頁。統(tǒng)計學(xué)第6章抽樣推斷第三節(jié)參數(shù)估計2.區(qū)間估計必須具備的三個要素(1)要有合適的統(tǒng)計量作為估計值(2)要有合理的抽樣誤差范圍(3)要有一個可接受的置信度當(dāng)前60頁,總共99頁。(二)總體參數(shù)的區(qū)間估計估計方法統(tǒng)計學(xué)第6章抽樣推斷第三節(jié)參數(shù)估計1.根據(jù)給定的抽樣誤差范圍,估算概率保證程度F(t)例題:6.3-6.4(P152-153)2.根據(jù)置信度F(t)的要求,估計總體指標(biāo)出現(xiàn)的可能范圍例題:6.5-6.6(P153-153)抽取樣本,計算樣本指標(biāo),推算抽樣平均誤差根據(jù)抽樣極限誤差范圍,估計總體指標(biāo)的上下限根據(jù)給定的抽樣極限誤差求出概率度值;計算概率保證程度F(t),并對總體參數(shù)做區(qū)間估計抽取樣本,計算樣本指標(biāo),推算抽樣平均誤差根據(jù)給定的概率保證程度F(t),查表求出概率度值;推算抽樣極限誤差的可能范圍,計算被估計總體指標(biāo)的上下限,并對總體參數(shù)做區(qū)間估計當(dāng)前61頁,總共99頁。第四節(jié)抽樣的組織方式一、抽樣調(diào)查的組織原則二、常用的抽樣組織方式統(tǒng)計學(xué)第6章抽樣推斷第四節(jié)抽樣組織設(shè)計本章目錄當(dāng)前62頁,總共99頁。一、抽樣組織設(shè)計的基本原則1.要保證抽樣的隨機(jī)性抽取樣本單位時,應(yīng)確保每個總體單位都有被抽取的可能;在對樣本單位的資料進(jìn)行搜集和整理時,不能隨意遺漏或更換樣本單位。2.要選取適當(dāng)?shù)臉颖救萘?.要努力兼顧抽樣誤差和抽樣效果的要求在其他條件相同的情況下,選抽樣誤差最小的方案。4.費(fèi)用最少在其他條件相同的情況下,選費(fèi)用最少的方案。統(tǒng)計學(xué)第6章抽樣推斷第四節(jié)抽樣組織設(shè)計當(dāng)前63頁,總共99頁。二、常用的抽樣組織方式(一)簡單隨機(jī)抽樣(二)類型抽樣(三)等距抽樣(四)整群抽樣(五)多階段抽樣統(tǒng)計學(xué)第6章抽樣推斷第四節(jié)抽樣組織設(shè)計當(dāng)前64頁,總共99頁。(一)簡單隨機(jī)抽樣統(tǒng)計學(xué)第6章抽樣推斷第四節(jié)抽樣組織設(shè)計1.簡單隨機(jī)抽樣(純隨機(jī)抽樣)的含義——對總體單位逐一編號,然后按隨機(jī)原則直接從N個總體中抽取n個單位構(gòu)成樣本應(yīng)用僅適用于規(guī)模不大、內(nèi)部各單位標(biāo)志值差異較小的總體是最簡單、最基本、最符合隨機(jī)原則,但同時也是抽樣誤差最大的抽樣組織形式當(dāng)前65頁,總共99頁。2.簡單隨機(jī)抽樣的抽樣方法:直接抽樣法抽簽法隨機(jī)數(shù)字法是將總體中每個單位的編號寫在外形完全一致的簽上,將其攪拌均勻,從中任意抽選,簽上的號碼所對應(yīng)的單位就是樣本單位。將總體中每個單位編上號碼,然后使用隨機(jī)數(shù)表,查出所要抽取的調(diào)查單位。當(dāng)前66頁,總共99頁。3.簡單隨機(jī)抽樣的優(yōu)缺點(diǎn):優(yōu)點(diǎn):(1)操作簡單,無須分組、分類、排隊等處理;(2)在理論上最符合隨機(jī)的原則,是其他抽樣方式的基礎(chǔ)缺點(diǎn):在實(shí)踐中會受到限制,當(dāng)總體各單位標(biāo)志值之間差異很大時,采用此方法不能保證樣本的代表性當(dāng)前67頁,總共99頁。4.樣本容量的確定組織抽樣調(diào)查的一項重要工作就是確定合適的樣本容量在進(jìn)行抽樣推斷設(shè)計時,先根據(jù)研究問題的性質(zhì)確定允許的誤差范圍和必要的概率保證程度F(t)(或概率度t),并根據(jù)總體的標(biāo)準(zhǔn)差通過抽樣平均誤差的公式來計算必要的樣本單位數(shù)n。當(dāng)前68頁,總共99頁。簡單隨機(jī)抽樣下樣本容量的確定:統(tǒng)計學(xué)第6章抽樣推斷第四節(jié)抽樣的組織形式(1)對于重復(fù)抽樣:由于(2)對于不重復(fù)抽樣:由于當(dāng)前69頁,總共99頁。同理,重復(fù)抽樣和不重復(fù)抽樣的成數(shù)樣本必要單位數(shù)分別為:當(dāng)前70頁,總共99頁。5.應(yīng)用上述公式計算樣本容量應(yīng)注意的問題:⑴上述公式計算的n是最低的,也是最必要的樣本容量;⑵一般總體方差是未知的,在實(shí)際計算時往往用有關(guān)資料代替;⑶如果進(jìn)行一次抽樣調(diào)查,同時對總體平均數(shù)和總體成數(shù)進(jìn)行區(qū)間估計,運(yùn)用上述公式計算的和一般不等,為了同時滿足兩個推斷的要求,一般在兩個樣本容量中選擇較大的一個;⑷上面公式計算的n不一定是整數(shù),如果帶小數(shù),一般不采用四舍五入的辦法化成整數(shù),而是用比這個數(shù)大的臨近整數(shù)代替。例6.7-6.8P157統(tǒng)計學(xué)第6章抽樣推斷第四節(jié)抽樣的組織形式當(dāng)前71頁,總共99頁。(二)類型抽樣(分層抽樣或分類抽樣)——先將總體全部單位按某一標(biāo)志分類,形成若干個類型組,然后從各類型中按隨機(jī)原則分別抽取若干個樣本單位,由各類型的樣本單位組成樣本。總體N樣本n等額分配等比例分配最佳分配······經(jīng)濟(jì)分配當(dāng)前72頁,總共99頁。當(dāng)前73頁,總共99頁。當(dāng)前74頁,總共99頁。各組樣本單位數(shù)與樣本容量之比等于各組總體單位數(shù)與全部總體單位數(shù)之比:各組的樣本單位數(shù)為:類型抽樣的誤差僅與組內(nèi)方差有關(guān),而與組間方差無關(guān),抽樣平均誤差取決于各組內(nèi)方差的平均水平。樣本單位數(shù)的確定(以等比抽樣法為例)當(dāng)前75頁,總共99頁。關(guān)于類型抽樣的說明⒈分組標(biāo)志的選擇:一定是與研究目的有關(guān)的標(biāo)志⒉類型抽樣是將分組法和隨機(jī)原則相結(jié)合⒊類型抽樣的優(yōu)點(diǎn):⑴它提高了樣本的代表性⑵它降低了總方差對抽樣誤差的影響⒋類型抽樣可以是重復(fù)抽樣也可以是不重復(fù)抽樣當(dāng)前76頁,總共99頁。類型抽樣的樣本平均數(shù)的計算:⒈在各組分別取樣,計算各組抽樣平均數(shù)

⒉求樣本平均數(shù)當(dāng)前77頁,總共99頁。類型抽樣的抽樣平均誤差的計算:⒈計算各組內(nèi)方差

⒉計算各組內(nèi)方差的平均數(shù)3.計算抽樣平均誤差(1)重復(fù)抽樣(2)不重復(fù)抽樣當(dāng)前78頁,總共99頁。類型比例抽樣的必要抽樣數(shù)目的確定:⒈重復(fù)抽樣條件下:

或⒉不重復(fù)抽樣條件下:或例6.9P159當(dāng)前79頁,總共99頁。例:某鄉(xiāng)糧食播種面積20000畝,現(xiàn)在按平原和山區(qū)面積比例抽取其中2%,計算各組平均畝產(chǎn)和各組畝產(chǎn)標(biāo)準(zhǔn)差,如下表所示:要求:⑴樣本平均畝產(chǎn)和抽樣平均誤差⑵以95.45%的概率估計某鄉(xiāng)糧食平均畝產(chǎn)的可能范圍當(dāng)前80頁,總共99頁。⑴重復(fù)抽樣:不重復(fù)抽樣:⑵重復(fù)抽樣:不重復(fù)抽樣:當(dāng)前81頁,總共99頁。(三)等距抽樣(機(jī)械抽樣或系統(tǒng)抽樣)1.定義:先按某一標(biāo)志對總體各單位按順序進(jìn)行排隊,然后按相等的距離或間隔來抽取樣本單位。等距抽樣是不重復(fù)抽樣,適合于對單位數(shù)不多且能進(jìn)行排序的總體抽樣。當(dāng)前82頁,總共99頁。(三)等距抽樣(機(jī)械抽樣或系統(tǒng)抽樣)2.等距抽樣分類:⑴按排隊所依據(jù)的標(biāo)志不同,分為按有關(guān)標(biāo)志排隊和按無關(guān)標(biāo)志排隊。⑵按樣本單位抽選的方法不同,分為:隨機(jī)起點(diǎn)等距抽樣、半距中點(diǎn)等距抽樣和對稱等距抽樣。當(dāng)前83頁,總共99頁。按無關(guān)標(biāo)志排隊總體單位的排列順序和所研究的標(biāo)志數(shù)值大小是無關(guān)的。如調(diào)查居民生活水平時,按姓氏筆劃排隊。按有關(guān)標(biāo)志排隊總體單位的排列順序和所研究的標(biāo)志數(shù)值大小有密切關(guān)系。如居民收入調(diào)查,按銀行存款高低排序。當(dāng)前84頁,總共99頁。①隨機(jī)起點(diǎn)等距抽樣當(dāng)抽樣間隔d(=N/n)確定以后,在第一組隨機(jī)抽選第一個樣本單位,設(shè)順序號為a,則第二個樣本單位的順序號為d+a,其余類推,第n個樣本單位的順序號為(n-1)d+a。注:當(dāng)總體按無關(guān)標(biāo)志排隊時,隨機(jī)起點(diǎn)等距抽樣是可以應(yīng)用的;當(dāng)總體按有關(guān)標(biāo)志排隊時,隨機(jī)起點(diǎn)等距抽樣會產(chǎn)生系統(tǒng)性誤差。當(dāng)前85頁,總共99頁。②半距中點(diǎn)等距抽樣這種抽樣方法要求各樣本單位都選在各組的中點(diǎn),各樣本單位的順序號是:第一個樣本單位是d/2,第二個樣本單位是d+d/2,…,第n各樣本單位是(n-1)d+d/2。注:無論按有關(guān)標(biāo)志排隊還是按無關(guān)標(biāo)志排隊,都可以采用這種方法。當(dāng)前86頁,總共99頁。半距中點(diǎn)等距抽樣的優(yōu)缺點(diǎn)優(yōu)點(diǎn):簡單易懂,易于實(shí)踐缺點(diǎn):⑴隨機(jī)性不明顯⑵只能抽取一個樣本,不能進(jìn)行樣本輪換,因此,抽樣框的利用率太低當(dāng)前87頁,總共99頁。③對稱等距抽樣這種抽樣方法要求在第一組隨機(jī)抽取第一個樣本單位,假設(shè)該單位的序號為a;在第二組與第一個樣本單位對稱的位置抽取第二個樣本單位,它的序號為2d-a;在第三組與第二個樣本單位對稱的位置抽取第三個樣本單位,它的序號為2d+a。以后抽取的樣本單位序號依次為4d-a,4d+a,6d-a,6d+a。注:這種方法保留了半距起點(diǎn)等距抽樣的優(yōu)點(diǎn),而且又避免了它的局限性,使其優(yōu)點(diǎn)更加明顯。當(dāng)前88頁,總共

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負(fù)責(zé)。
  • 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時也不承擔(dān)用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

評論

0/150

提交評論