統(tǒng)計學第六章抽樣推斷_第1頁
統(tǒng)計學第六章抽樣推斷_第2頁
統(tǒng)計學第六章抽樣推斷_第3頁
統(tǒng)計學第六章抽樣推斷_第4頁
統(tǒng)計學第六章抽樣推斷_第5頁
已閱讀5頁,還剩150頁未讀, 繼續(xù)免費閱讀

下載本文檔

版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進行舉報或認領(lǐng)

文檔簡介

統(tǒng)計學第六章抽樣推斷第1頁,課件共155頁,創(chuàng)作于2023年2月第六章抽樣推斷★§1.1抽樣方案的設(shè)計§1.2簡單隨機抽樣的抽樣誤差的測定§1.3簡單隨機抽樣的抽樣估計第2頁,課件共155頁,創(chuàng)作于2023年2月§1.1抽樣方案的設(shè)計一、抽樣估計的意義和一般步驟二、抽樣方案設(shè)計的基本準則★第3頁,課件共155頁,創(chuàng)作于2023年2月一、抽樣估計的意義和一般步驟㈠抽樣估計的定義㈡抽樣估計的特點㈢抽樣估計的運用㈣抽樣估計的一般步驟㈤總體參數(shù)與樣本指標第4頁,課件共155頁,創(chuàng)作于2023年2月指樣本單位的抽取不受主觀因素及其他系統(tǒng)性因素的影響,每個總體單位都有均等的被抽中機會抽樣估計第六章抽樣推斷按照隨機原則

從調(diào)查對象中抽取一部分單位進行調(diào)查,并以調(diào)查結(jié)果對總體數(shù)量特征作出具有一定可靠程度的估計與推斷,從而認識總體的一種統(tǒng)計方法第5頁,課件共155頁,創(chuàng)作于2023年2月統(tǒng)計推斷全及總體指標:參數(shù)(未知量)樣本總體指標:統(tǒng)計量(已知量)抽樣估計第六章抽樣推斷第6頁,課件共155頁,創(chuàng)作于2023年2月并非所有的抽樣估計都按隨機原則抽取樣本,也有非隨機抽樣總體隨機樣本非隨機樣本與總體分布特征相同與總體分布特征不同第六章抽樣推斷第7頁,課件共155頁,創(chuàng)作于2023年2月按隨機原則抽取樣本單位目的是推斷總體的數(shù)量特征抽樣推斷的結(jié)果具有一定的可靠程度,抽樣誤差可以事先計算并控制抽樣估計的特點第六章抽樣推斷第8頁,課件共155頁,創(chuàng)作于2023年2月不可能進行全面調(diào)查時不必要進行全面調(diào)查時來不及進行全面調(diào)查時對全面調(diào)查資料進行補充修正時抽樣估計的應用第六章抽樣推斷第9頁,課件共155頁,創(chuàng)作于2023年2月第六章抽樣推斷抽樣調(diào)查研究

SamplingStudy為什么要抽樣?

1.

涉及破壞受試對象質(zhì)量控制2.取得精確可靠的結(jié)果3.實際情況的約束時間,成本等第10頁,課件共155頁,創(chuàng)作于2023年2月設(shè)計抽樣方案抽取樣本單位收集樣本數(shù)據(jù)計算樣本統(tǒng)計量推斷總體參數(shù)抽樣估計的一般步驟第六章抽樣推斷第11頁,課件共155頁,創(chuàng)作于2023年2月設(shè)總體中個總體單位某項標志的標志值分別為,其中具有某種屬性的有個單位,不具有某種屬性的有個單位,則⒈總體平均數(shù)(又叫總體均值):指被估計的總體指標,又被稱為全及指標總體參數(shù)第六章抽樣推斷第12頁,課件共155頁,創(chuàng)作于2023年2月⒉總體單位標志值的標準差:⒊總體單位標志值的方差:第六章抽樣推斷第13頁,課件共155頁,創(chuàng)作于2023年2月⒋總體成數(shù):⒌總體是非標志的標準差:⒍總體是非標志的方差:第六章抽樣推斷第14頁,課件共155頁,創(chuàng)作于2023年2月設(shè)樣本中個樣本單位某項標志的標志值分別為,其中具有和不具有某種屬性的樣本單位數(shù)目分別為和個,則⒈樣本平均數(shù)(又叫樣本均值):指根據(jù)樣本單位的標志值計算的用以估計和推斷相應總體指標的綜合指標,又被稱為估計量或統(tǒng)計量樣本指標第六章抽樣推斷第15頁,課件共155頁,創(chuàng)作于2023年2月1.樣本平均數(shù)的計算公式為:計算公式第16頁,課件共155頁,創(chuàng)作于2023年2月⒉樣本單位標志值的標準差:⒊樣本單位標志值的方差:為自由度第17頁,課件共155頁,創(chuàng)作于2023年2月2.樣本方差的計算公式為:計算公式第18頁,課件共155頁,創(chuàng)作于2023年2月第19頁,課件共155頁,創(chuàng)作于2023年2月⒋樣本成數(shù):⒌樣本單位是非標志的標準差:⒍樣本單位是非標志的方差:第六章抽樣推斷第20頁,課件共155頁,創(chuàng)作于2023年2月§1.1抽樣方案的設(shè)計一、抽樣估計的意義和一般步驟二、抽樣方案設(shè)計的基本準則三、抽樣方案設(shè)計的主要內(nèi)容★★第21頁,課件共155頁,創(chuàng)作于2023年2月㈠隨機原則——抽取樣本單位時,應確保每個總體單位都有被抽取的可能;在對樣本單位的資料進行搜集和整理時,不能隨意遺漏或更換樣本單位㈡抽樣誤差最小——在其他條件相同的情況下,選抽樣誤差最小的方案㈢費用最少——在其他條件相同的情況下,選費用最少的方案設(shè)計抽樣方案時,通常是在誤差達到一定要求的條件下,選擇費用最少的方案抽樣方案設(shè)計的基本準則第六章抽樣推斷第22頁,課件共155頁,創(chuàng)作于2023年2月§1.1抽樣方案的設(shè)計一、抽樣估計的意義和一般步驟二、抽樣方案設(shè)計的基本準則三、抽樣方案設(shè)計的主要內(nèi)容★★★第23頁,課件共155頁,創(chuàng)作于2023年2月㈠編制抽樣框㈡確定抽樣方法㈢確定抽樣組織方式㈣確定樣本容量三、抽樣方案設(shè)計的主要內(nèi)容第24頁,課件共155頁,創(chuàng)作于2023年2月抽樣框指包括全部抽樣單位的名單框架,僅對有限總體而言主要形式名單抽樣框區(qū)域抽樣框時間表抽樣框編制抽樣框第六章抽樣推斷第25頁,課件共155頁,創(chuàng)作于2023年2月區(qū)域抽樣框在商場的大門口在微波爐柜臺前在市區(qū)街道旁邊在某個住宅小區(qū)中山區(qū)…沙河口區(qū)星海街道…黑石礁街道尖山一委…尖山二委居民一組居民二組…某外國公司在大連進行微波爐市場調(diào)查:第六章抽樣推斷第26頁,課件共155頁,創(chuàng)作于2023年2月時間表抽樣框連續(xù)出產(chǎn)的產(chǎn)品總體可以編制抽樣框:均勻的出產(chǎn)時間、可以預見到的產(chǎn)品總量。連續(xù)到加油站加油的汽車總體無法編制抽樣框:時間不定、總量也無法確定。第六章抽樣推斷第27頁,課件共155頁,創(chuàng)作于2023年2月確定抽樣方法重復抽樣又被稱作重置抽樣、有放回抽樣抽出個體登記特征放回總體繼續(xù)抽取特點同一總體單位有可能被重復抽中,而且每次抽取都是獨立進行第六章抽樣推斷第28頁,課件共155頁,創(chuàng)作于2023年2月不重復抽樣又被稱作不重置抽樣、不放回抽樣抽出個體登記特征繼續(xù)抽取特點同一總體中每個單位被抽中的機會并不均等,在連續(xù)抽取時,每次抽取都不是獨立進行是最為常用的抽樣方法,用于無限總體和許多有限總體樣本單位的抽樣。確定抽樣方法第六章抽樣推斷第29頁,課件共155頁,創(chuàng)作于2023年2月確定抽樣組織方式1·簡單隨機抽樣(純隨機抽樣)——對總體單位逐一編號,然后按隨機原則直接從總體中抽出若干單位構(gòu)成樣本應用僅適用于規(guī)模不大、內(nèi)部各單位標志值差異較小的總體是最簡單、最基本、最符合隨機原則,但同時也是抽樣誤差最大的抽樣組織形式第六章抽樣推斷第30頁,課件共155頁,創(chuàng)作于2023年2月2·類型抽樣(分層抽樣)——將總體全部單位分類,形成若干個類型組,然后從各類型中分別抽取樣本單位組成樣本。總體N樣本n等額抽取等比例抽取······能使樣本結(jié)構(gòu)更接近于總體結(jié)構(gòu),提高樣本的代表性;能同時推斷總體指標和各子總體的指標確定抽樣組織方式第六章抽樣推斷第31頁,課件共155頁,創(chuàng)作于2023年2月3·等距抽樣(機械抽樣或系統(tǒng)抽樣)——將總體單位按某一標志排序,而后按一定的間隔抽取樣本單位?!ぁぁぁぁぁるS機起點半距起點對稱起點(總體單位按某一標志排序)按無關(guān)標志排隊,其抽樣效果相當于簡單隨機抽樣;按有關(guān)標志排隊,其抽樣效果相當于類型抽樣。確定抽樣組織方式第六章抽樣推斷第32頁,課件共155頁,創(chuàng)作于2023年2月4·整群抽樣(集團抽樣)——將總體全部單位分為若干“群”,然后隨機抽取一部分“群”,被抽中群體的所有單位構(gòu)成樣本例:總體群數(shù)R=16樣本群數(shù)r=4ABCDEFGHIJKLMNOPLHPD樣本容量簡單、方便,能節(jié)省人力、物力、財力和時間,但其樣本代表性可能較差確定抽樣組織方式第六章抽樣推斷第33頁,課件共155頁,創(chuàng)作于2023年2月5·多階段抽樣——指分兩個或兩個以上的階段來完成抽取樣本單位的過程例:在某省100多萬農(nóng)戶抽取1000戶調(diào)查農(nóng)戶生產(chǎn)性投資情況。第一階段:從該省所有縣中抽取5個縣第二階段:從被抽中的5個縣中各抽4個鄉(xiāng)第三階段:從被抽中的20個鄉(xiāng)中各抽5個村第四階段:從被抽中的100個村中各抽10戶樣本n=100×10=1000(戶)確定抽樣組織方式第六章抽樣推斷第34頁,課件共155頁,創(chuàng)作于2023年2月調(diào)查對象的性質(zhì)特點對調(diào)查對象的了解程度(抽樣框的特點)抽樣誤差的大小人力、財力和物力等條件的限制在實際工作中,選擇適當?shù)某闃咏M織方式主要應考慮:確定抽樣組織方式第六章抽樣推斷第35頁,課件共155頁,創(chuàng)作于2023年2月確定樣本容量n≥30,為大樣本;n<30,為小樣本樣本容量指樣本中含有的總體單位的數(shù)目,通常用n來表示。確定適當樣本容量的意義:若n過大,調(diào)查工作量增大,體現(xiàn)不出抽樣調(diào)查的優(yōu)越性;若n過小,抽樣誤差會增大,抽樣推斷就會失去價值。第六章抽樣推斷第36頁,課件共155頁,創(chuàng)作于2023年2月樣本的可能數(shù)目在考慮順序的抽樣條件下,從總體N中隨機抽取n個樣本單位共有多少種可能的抽選結(jié)果⒈重復抽樣的可能樣本數(shù)目:⒉不重復抽樣的可能樣本數(shù)目:共n個確定樣本容量第六章抽樣推斷第37頁,課件共155頁,創(chuàng)作于2023年2月第六章抽樣推斷★§1.1抽樣方案的設(shè)計§1.2簡單隨機抽樣的抽樣誤差的測定§1.3簡單隨機抽樣的抽樣估計★第38頁,課件共155頁,創(chuàng)作于2023年2月一、抽樣分布二、抽樣估計量的優(yōu)良標準三、抽樣誤差的概念四、抽樣平均誤差五、抽樣極限誤差§1.2簡單隨機抽樣的抽樣誤差的測定第39頁,課件共155頁,創(chuàng)作于2023年2月樣本統(tǒng)計量總體未知參數(shù)樣本統(tǒng)計量樣本統(tǒng)計量樣本統(tǒng)計量樣本統(tǒng)計量樣本統(tǒng)計量樣本統(tǒng)計量樣本統(tǒng)計量樣本統(tǒng)計量樣本統(tǒng)計量樣本統(tǒng)計量樣本統(tǒng)計量樣本統(tǒng)計量抽樣分布樣本統(tǒng)計量所有可能值的概率分布主要樣本統(tǒng)計量平均數(shù)比率(成數(shù))方差第六章抽樣推斷第40頁,課件共155頁,創(chuàng)作于2023年2月例:某大公司人事部經(jīng)理整理其2500個中層干部的檔案。其中一項內(nèi)容是考察這些中層干部的平均年薪及參加過公司培訓計劃的比例??傮w:2500名中層干部,

如果:上述情況可由每個人的個人檔案中得知,可容易地測出這2500名中層干部的平均年薪及標準差。假如:1:已經(jīng)得到了如下的結(jié)果:

總體均值:51800

總體標準差:

=4000第41頁,課件共155頁,創(chuàng)作于2023年2月

上述總體均值、總體標準差、比例均稱為總體的參數(shù)2、同時,有1500人參加了公司培訓,則參加公司培訓計劃的比例為:P=1500/2500=0.60如:上例中的中層干部平均年薪,年薪標準差及受培訓人數(shù)所占比例均為該公司中層干部這一總體的參數(shù)?!癯闃庸烙嬀褪且ㄟ^樣本而非總體來估計總體參數(shù)。第42頁,課件共155頁,創(chuàng)作于2023年2月如果抽樣的樣本與前一次的不同,則可得到另外的平均年薪樣本均值、標準差以及受訓干部的比例。

如果多次抽樣,則可得到多個不同的結(jié)果。

下表是一個假設(shè)的經(jīng)過500次抽樣后的情況表。第43頁,課件共155頁,創(chuàng)作于2023年2月下表給出了500個的頻數(shù)分布與相對頻數(shù)分布,第44頁,課件共155頁,創(chuàng)作于2023年2月圖4.1500個的相對頻數(shù)分布這里,的相對頻數(shù)分布,就稱為的抽樣分布。第45頁,課件共155頁,創(chuàng)作于2023年2月正是抽樣分布及其特征使得用樣本統(tǒng)計量估計總體參數(shù)的“精確程度”能夠給予概率上的描述。一般地,樣本統(tǒng)計量的可能取值及其取值概率所形成的概率分布,統(tǒng)計上稱為抽樣分布(samplingdistribution)。精確度可靠度第46頁,課件共155頁,創(chuàng)作于2023年2月平均數(shù)的抽樣分布全部可能樣本平均數(shù)的均值等于總體均值,即:從非正態(tài)總體中抽取的樣本平均數(shù)當n足夠大時其分布接近正態(tài)分布。從正態(tài)總體中抽取的樣本平均數(shù)不論容量大小其分布均為正態(tài)分布。樣本均值的標準差為總體標準差的。第六章抽樣推斷第47頁,課件共155頁,創(chuàng)作于2023年2月比率的抽樣分布全部可能樣本比率的均值等于總體比率,即:從非正態(tài)總體中抽取的樣本比率,當n足夠大時其分布接近正態(tài)分布。從正態(tài)總體中抽取的樣本比率,不論容量大小其分布均為正態(tài)分布。樣本比率的標準差為總體標準差的。第六章抽樣推斷樣本比率的抽樣分布是樣本比率所有可能值的概率分布。第48頁,課件共155頁,創(chuàng)作于2023年2月樣本抽樣分布原總體分布第六章抽樣推斷第49頁,課件共155頁,創(chuàng)作于2023年2月一、抽樣分布二、抽樣估計量的優(yōu)良標準三、抽樣誤差的概念四、抽樣平均誤差五、抽樣極限誤差§1.2簡單隨機抽樣的抽樣誤差的測定★★第50頁,課件共155頁,創(chuàng)作于2023年2月抽樣估計量的優(yōu)良標準設(shè)為待估計的總體參數(shù),為樣本統(tǒng)計量,則的優(yōu)良標準為:若,則稱為的無偏估計量指樣本指標的均值應等于被估計的總體指標無偏性第六章抽樣推斷第51頁,課件共155頁,創(chuàng)作于2023年2月若,則稱為比更有效的估計量若越大越小,則稱為的一致估計量作為優(yōu)良的估計量,除了滿足無偏性的要求外,其方差應比較小有效性指隨著樣本單位數(shù)的增大,樣本估計量將在概率意義下越來越接近于總體真實值一致性抽樣估計量的優(yōu)良標準第六章抽樣推斷第52頁,課件共155頁,創(chuàng)作于2023年2月為的無偏、有效、一致估計量;為的無偏、有效、一致估計量;為的無偏、有效、一致估計量。數(shù)理統(tǒng)計證明:抽樣估計量的優(yōu)良標準第六章抽樣推斷第53頁,課件共155頁,創(chuàng)作于2023年2月一、抽樣分布二、抽樣估計量的優(yōu)良標準三、抽樣誤差的概念四、抽樣平均誤差五、抽樣極限誤差§1.2簡單隨機抽樣的抽樣誤差的測定★★★第六章抽樣推斷第54頁,課件共155頁,創(chuàng)作于2023年2月說明對于任何一個樣本,其抽樣誤差都不可能測量出來抽樣誤差的大小可以依據(jù)概率分布理論加以說明指樣本估計量與總體參數(shù)之間數(shù)量上的差異,僅指由于按照隨機原則抽取樣本而產(chǎn)生的代表性誤差,不包括登記性誤差和系統(tǒng)偏差抽樣誤差第六章抽樣推斷第55頁,課件共155頁,創(chuàng)作于2023年2月影響因素1、樣本單位數(shù)。(越大,誤差越?。?、總體內(nèi)各單位被研究標志的變異程度。(越大,誤差越大)3、抽樣方法。(不重復小于重復)4、抽樣組織形式。(通常采用機械和類型抽樣方式組織抽樣調(diào)查)第56頁,課件共155頁,創(chuàng)作于2023年2月一、抽樣分布二、抽樣估計量的優(yōu)良標準三、抽樣誤差的概念四、抽樣平均誤差五、抽樣極限誤差§1.2簡單隨機抽樣的抽樣誤差的測定★★★★第57頁,課件共155頁,創(chuàng)作于2023年2月抽樣平均誤差指每一個可能樣本的估計值與總體指標值之間離差的平均數(shù),即樣本估計量的標準差式中:為樣本平均數(shù)的抽樣平均誤差;為可能的樣本數(shù)目;為第個可能樣本的平均數(shù);為總體平均數(shù)注意:不要混淆抽樣標準差與樣本標準差!第六章抽樣推斷第58頁,課件共155頁,創(chuàng)作于2023年2月〖例〗現(xiàn)有A、B、C、D四名工人構(gòu)成的總體,他們的日產(chǎn)量分別為22、24、26、28件。從四名工人中任取兩名構(gòu)成一個樣本,請利用重復抽樣和不重復抽樣的方法計算抽樣平均誤差?!痉治觥肯扔嬎愠鋈悢?shù)值:根據(jù)抽樣平均誤差的計算公式,我們必須本題要求我們計算抽樣平均誤差??赡軜颖究倲?shù)??傮w平均日產(chǎn)量、樣本平均日產(chǎn)量、第59頁,課件共155頁,創(chuàng)作于2023年2月總體平均日產(chǎn)量1、重復抽樣。樣本數(shù)為第60頁,課件共155頁,創(chuàng)作于2023年2月2、不重復抽樣。樣本數(shù)為第61頁,課件共155頁,創(chuàng)作于2023年2月但是,上面計算抽樣平均誤差的這個理論公式,在實際應用上會存在兩個困難:⑴運用這個公式要求把所有的樣本都抽選出來,然后計算它們的指標數(shù)值。這在實際應用過程中幾乎是不可能的。⑵運用上面公式要求總體平均數(shù)的數(shù)值是已知的。但實際上,總體平均數(shù)的數(shù)值是未知的,它正是抽樣調(diào)查要推斷的。第62頁,課件共155頁,創(chuàng)作于2023年2月抽樣平均誤差的計算公式⒈樣本平均數(shù)的抽樣平均誤差當N≥500時,有重復抽樣時:不重復抽樣時:第六章抽樣推斷第63頁,課件共155頁,創(chuàng)作于2023年2月如果總體單位數(shù)很“大”而樣本容量很“小”,則該修正因子趨近于1,這時,對不重復抽樣可直接按重復抽樣的公式去計算。

一個經(jīng)驗的衡量標準是n/N<=0.05。稱為修正因子第64頁,課件共155頁,創(chuàng)作于2023年2月⒉樣本成數(shù)的抽樣平均誤差重復抽樣時:不重復抽樣時:當N≥500時,有抽樣平均誤差的計算公式第六章抽樣推斷第65頁,課件共155頁,創(chuàng)作于2023年2月影響抽樣誤差的因素總體各單位的差異程度(即標準差的大?。涸酱?,抽樣誤差越大;樣本單位數(shù)的多少:越大,抽樣誤差越?。怀闃臃椒ǎ翰恢貜统闃拥某闃诱`差比重復抽樣的抽樣誤差??;抽樣組織方式:簡單隨機抽樣的誤差最大。第六章抽樣推斷第66頁,課件共155頁,創(chuàng)作于2023年2月一、抽樣分布二、抽樣估計量的優(yōu)良標準三、抽樣誤差的概念四、抽樣平均誤差五、抽樣極限誤差§1.2簡單隨機抽樣的抽樣誤差的測定★★★★★第67頁,課件共155頁,創(chuàng)作于2023年2月68.27%95.45%99.73%抽樣極限誤差第六章抽樣推斷第68頁,課件共155頁,創(chuàng)作于2023年2月抽樣極限誤差指在一定的概率保證程度下,抽樣誤差不允許超過的某一給定范圍,也稱作允許誤差、誤差范圍、誤差置信限等由于提高把握程度,會增大允許誤差,使估計精度降低,而縮小允許誤差,提高估計的精度,又會降低估計的把握程度,所以在實際中應根據(jù)具體情況,先確定一個合理的把握程度再求相應的允許誤差或先確定一個允許誤差范圍再求相應的把握程度。第六章抽樣推斷第69頁,課件共155頁,創(chuàng)作于2023年2月抽樣極限誤差的計算公式(大樣本條件下)樣本平均數(shù)的極限誤差:⒈樣本成數(shù)的極限誤差:⒉Z為概率度,是給定概率保證程度下樣本均值偏離總體均值的抽樣平均誤差的倍數(shù)。第六章抽樣推斷第70頁,課件共155頁,創(chuàng)作于2023年2月Z與相應的概率保證程度存在一一對應關(guān)系,常用Z值及相應的概率保證程度為:

z值概率保證程度

1.000.68271.650.90001.960.95002.000.95452.580.99003.000.9973抽樣極限誤差的計算公式(大樣本條件下)第六章抽樣推斷第71頁,課件共155頁,創(chuàng)作于2023年2月第72頁,課件共155頁,創(chuàng)作于2023年2月標準正態(tài)分布函數(shù)值表第73頁,課件共155頁,創(chuàng)作于2023年2月▼注意:

1、統(tǒng)計學上往往用抽樣極限誤差來測度抽樣誤差的大小或者說測度點估計的精度。

原因:總體參數(shù)值往往并不知道,因此,實際抽樣誤差與抽樣平均誤差也往往無法求出,但在抽樣分布大體知道的情況下,抽樣極限誤差是可以估計出來的。一定概率下抽樣誤差的可能范圍(也稱允許誤差):第74頁,課件共155頁,創(chuàng)作于2023年2月

2、抽樣極限誤差的估計總是要和一定的概率保證程度聯(lián)系在一起的。原因:樣本統(tǒng)計量往往是一隨機變量,它與總體參數(shù)真值之差也是一個隨機變量,因此就不能期望某次抽樣的樣本估計值落在一定區(qū)間內(nèi)是一個必然事件,而只能給予一定的概率保證。因此,在進行抽樣估計時,既需要考慮抽樣誤差的可能范圍,同時還需考慮落到這一范圍的概率大小。前者是估計的準確度問題,后者是估計的可靠性問題,兩者緊密聯(lián)系不可分開。這也正是區(qū)間估計所關(guān)心的主要問題。第75頁,課件共155頁,創(chuàng)作于2023年2月第六章抽樣推斷★§1.1抽樣方案的設(shè)計§1.2簡單隨機抽樣的抽樣誤差的測定§1.3簡單隨機抽樣的抽樣估計★★第76頁,課件共155頁,創(chuàng)作于2023年2月一、點估計二、區(qū)間估計三、樣本數(shù)目的確定§1.3簡單隨機抽樣的抽樣估計★第77頁,課件共155頁,創(chuàng)作于2023年2月點估計指直接以樣本指標來估計總體指標,也叫定值估計簡單,具體明確優(yōu)點缺點無法控制誤差,僅適用于對推斷的準確程度與可靠程度要求不高的情況第六章抽樣推斷第78頁,課件共155頁,創(chuàng)作于2023年2月

用樣本統(tǒng)計量(samplestatistics)可以作為其對應的總體的點估計量(pointestimator)。但要估計總體的某一指標,并非只能用一個樣本指標,而可能有多個指標可供選擇,即對同一總體參數(shù),可能會有不同的估計量。

點估計量的性質(zhì):估計量優(yōu)劣的衡量作為一個好的點估計量,統(tǒng)計量必須具有如下性質(zhì):

無偏性、有效性、一致性第79頁,課件共155頁,創(chuàng)作于2023年2月在上例中,假如隨機抽取了一個容量為30的樣本:年薪是否參加過培訓計劃

49094.3Yes53263.9Yes49643.5Yes……

點估計(PointEstimation)假如根據(jù)該樣本求得的年薪樣本平均數(shù)、標準差及參加過培訓計劃人數(shù)的比例分別為:第80頁,課件共155頁,創(chuàng)作于2023年2月

則可用上述結(jié)果分別代表2500名中層干部的平均年薪、年薪的標準差及受訓比例。

上述估計總體參數(shù)的過程被稱為點估計(pointestimation);樣本均值(標準差/比例)稱為總體均值(標準差/比例)的點估計量(pointestimator);樣本均值(標準差/比例)的具體數(shù)值稱為總體均值(標準差/比例)的點估計值(pointestimate)。由于點估計量是由樣本測算的,因此也稱為樣本統(tǒng)計量。第81頁,課件共155頁,創(chuàng)作于2023年2月一、點估計二、區(qū)間估計三、樣本數(shù)目的確定§1.3簡單隨機抽樣的抽樣估計★★第82頁,課件共155頁,創(chuàng)作于2023年2月二、區(qū)間估計㈠區(qū)間估計的定義和原理㈡總體平均數(shù)的區(qū)間估計㈢總體成數(shù)的區(qū)間估計第83頁,課件共155頁,創(chuàng)作于2023年2月區(qū)間估計指根據(jù)樣本指標和抽樣極限誤差以一定的可靠程度推斷總體指標的可能范圍;其中,被推斷的總體指標的下限與上限所包括的區(qū)間稱為置信區(qū)間,估計的可靠程度也稱為置信度。(這里只討論常用的大樣本的情況)第六章抽樣推斷是根據(jù)樣本估計量以一定的可靠程度推斷總體參數(shù)所在的區(qū)間范圍。第84頁,課件共155頁,創(chuàng)作于2023年2月

一般地,設(shè)總體參數(shù)為,L、U為由樣本確定的兩個統(tǒng)計量值,對于給定的(0<

<1),有則稱(L,U)為參數(shù)的置信度為1-的置信區(qū)間,L、U分別稱為置信下限與置信上限,為顯著性水平,1-為置信度。置信區(qū)間第85頁,課件共155頁,創(chuàng)作于2023年2月

2、

1-可以認為是用樣本估計值代替總體真值時誤差在某一范圍內(nèi)的“可能性”,則可認為是這種替代產(chǎn)生的抽樣極限誤差超過這一范圍的“可能性”。

注意:

1、置信區(qū)間的直觀意義為:多次抽樣形成的多個置信區(qū)間中,有(1-)100%包含總體參數(shù)真值。/2/2第86頁,課件共155頁,創(chuàng)作于2023年2月區(qū)間估計原理0.6827落在范圍內(nèi)的概率為68.27%樣本抽樣分布曲線原總體分布曲線第六章抽樣推斷第87頁,課件共155頁,創(chuàng)作于2023年2月區(qū)間估計原理0.9545落在范圍內(nèi)的概率為95.45%樣本抽樣分布曲線原總體分布曲線第六章抽樣推斷第88頁,課件共155頁,創(chuàng)作于2023年2月區(qū)間估計原理0.9973落在范圍內(nèi)的概率為99.73%樣本抽樣分布曲線總體分布曲線第六章抽樣推斷第89頁,課件共155頁,創(chuàng)作于2023年2月總體平均數(shù)的區(qū)間估計表達式其中,為極限誤差第六章抽樣推斷第90頁,課件共155頁,創(chuàng)作于2023年2月步驟⒈計算樣本平均數(shù);⒉搜集總體方差的經(jīng)驗數(shù)據(jù);或計算樣本標準差,即總體平均數(shù)的區(qū)間估計第六章抽樣推斷第91頁,課件共155頁,創(chuàng)作于2023年2月步驟⒊計算抽樣平均誤差:重復抽樣時:不重復抽樣時:總體平均數(shù)的區(qū)間估計第六章抽樣推斷修正因子如果總體單位數(shù)很“大”而樣本容量很“小”,則該修正因子趨近于1第92頁,課件共155頁,創(chuàng)作于2023年2月步驟⒋計算抽樣極限誤差:⒌確定總體平均數(shù)的置信區(qū)間:總體平均數(shù)的區(qū)間估計第六章抽樣推斷第93頁,課件共155頁,創(chuàng)作于2023年2月【例A】某企業(yè)生產(chǎn)某種產(chǎn)品的工人有1000人,某日采用不重復抽樣從中隨機抽取100人調(diào)查他們的當日產(chǎn)量,要求在95﹪的概率保證程度下,估計該廠全部工人的日平均產(chǎn)量和日總產(chǎn)量??傮w平均數(shù)的區(qū)間估計第六章抽樣推斷第94頁,課件共155頁,創(chuàng)作于2023年2月按日產(chǎn)量分組(件)組中值(件)工人數(shù)(人)110~114114~118118~122122~126126~130130~134134~138138~14211211612012412813213614037182321186433681221602852268823768165605887006489284648600784合計—100126004144100名工人的日產(chǎn)量分組資料第六章抽樣推斷第95頁,課件共155頁,創(chuàng)作于2023年2月解:第六章抽樣推斷第96頁,課件共155頁,創(chuàng)作于2023年2月則該企業(yè)工人人均產(chǎn)量及日總產(chǎn)量的置信區(qū)間為:即該企業(yè)工人人均產(chǎn)量在124.797至127.203件之間,其日總產(chǎn)量在124797至127303件之間,估計的可靠程度為95﹪。第六章抽樣推斷第97頁,課件共155頁,創(chuàng)作于2023年2月總體均值區(qū)間估計程序n>=30?知否?用s代替總體是否接近正態(tài)分布?知否?用s代替增大樣本容量至n>=30yesNoyesNoyesyesNoNo第98頁,課件共155頁,創(chuàng)作于2023年2月【例】某商場從一批袋裝食品中隨機抽取10袋,測得每袋重量(單位:克)分別為789、780、794、762、802、813、770、785、810、806。要求以95%的把握程度,估計這批食品的平均每袋重量的抽樣極限誤差。第99頁,課件共155頁,創(chuàng)作于2023年2月解:第100頁,課件共155頁,創(chuàng)作于2023年2月總體成數(shù)的區(qū)間估計表達式其中,為極限誤差第六章抽樣推斷第101頁,課件共155頁,創(chuàng)作于2023年2月步驟⒈計算樣本成數(shù);⒉搜集總體方差的經(jīng)驗數(shù)據(jù);⒊計算抽樣平均誤差:重復抽樣條件下不重復抽樣條件下總體成數(shù)的區(qū)間估計第六章抽樣推斷第102頁,課件共155頁,創(chuàng)作于2023年2月步驟⒋計算抽樣極限誤差:⒌確定總體成數(shù)的置信區(qū)間:總體成數(shù)的區(qū)間估計第六章抽樣推斷第103頁,課件共155頁,創(chuàng)作于2023年2月【例B】若例A中工人日產(chǎn)量在118件以上者為完成生產(chǎn)定額任務,要求在95﹪的概率保證程度下,估計該廠全部工人中完成定額的工人比重及完成定額的工人總數(shù)??傮w成數(shù)的區(qū)間估計第六章抽樣推斷第104頁,課件共155頁,創(chuàng)作于2023年2月按日產(chǎn)量分組(件)組中值(件)工人數(shù)(人)110~114114~118118~122122~126126~130130~134134~138138~142112116120124128132136140371823211864合計—100100名工人的日產(chǎn)量分組資料完成定額的人數(shù)第六章抽樣推斷第105頁,課件共155頁,創(chuàng)作于2023年2月解:第六章抽樣推斷第106頁,課件共155頁,創(chuàng)作于2023年2月則該企業(yè)全部工人中完成定額的工人比重及完成定額的工人總數(shù)的置信區(qū)間為:即該企業(yè)工人中完成定額的工人比重在0.8432至0.9568之間,完成定額的工人總數(shù)在843.2至956.8人之間,估計的可靠程度為95﹪。第六章抽樣推斷第107頁,課件共155頁,創(chuàng)作于2023年2月一、點估計二、區(qū)間估計三、樣本數(shù)目的確定§1.3簡單隨機抽樣的抽樣估計★★★第108頁,課件共155頁,創(chuàng)作于2023年2月三、樣本容量的確定㈠確定樣本容量的意義㈡推斷總體平均數(shù)所需的樣本容量㈢推斷總體成數(shù)所需的樣本容量㈣必要樣本容量的影響因素第109頁,課件共155頁,創(chuàng)作于2023年2月樣本容量調(diào)查誤差調(diào)查費用小樣本容量節(jié)省費用但調(diào)查誤差大大樣本容量調(diào)查精度高但費用較大找出在規(guī)定誤差范圍內(nèi)的最小樣本容量確定樣本容量的意義找出在限定費用范圍內(nèi)的最大樣本容量第六章抽樣推斷第110頁,課件共155頁,創(chuàng)作于2023年2月確定方法推斷總體平均數(shù)所需的樣本容量⑴重復抽樣條件下:通常的做法是先確定置信度,然后限定抽樣極限誤差?;騍通常未知。一般按以下方法確定其估計值:①過去的經(jīng)驗數(shù)據(jù);②試驗調(diào)查樣本的S。計算結(jié)果通常向上進位第六章抽樣推斷第111頁,課件共155頁,創(chuàng)作于2023年2月⑵不重復抽樣條件下:確定方法推斷總體平均數(shù)所需的樣本容量第六章抽樣推斷第112頁,課件共155頁,創(chuàng)作于2023年2月【例A】某食品廠要檢驗本月生產(chǎn)的10000袋某產(chǎn)品的重量,根據(jù)上月資料,這種產(chǎn)品每袋重量的標準差為25克。要求在95.45﹪的概率保證程度下,平均每袋重量的誤差范圍不超過5克,應抽查多少袋產(chǎn)品?第六章抽樣推斷第113頁,課件共155頁,創(chuàng)作于2023年2月解:第六章抽樣推斷第114頁,課件共155頁,創(chuàng)作于2023年2月確定方法推斷總體成數(shù)所需的樣本容量⑴重復抽樣條件下:通常的做法是先確定置信度,然后限定抽樣極限誤差。計算結(jié)果通常向上進位通常未知。一般按以下方法確定其估計值:①過去的經(jīng)驗數(shù)據(jù);②試驗調(diào)查樣本的;③取方差的最大值0.25。第六章抽樣推斷第115頁,課件共155頁,創(chuàng)作于2023年2月⑵不重復抽樣條件下:確定方法推斷總體成數(shù)所需的樣本容量第六章抽樣推斷第116頁,課件共155頁,創(chuàng)作于2023年2月【例B】某企業(yè)對一批總數(shù)為5000件的產(chǎn)品進行質(zhì)量檢查,過去幾次同類調(diào)查所得的產(chǎn)品合格率為93﹪、95﹪、96﹪,為了使合格率的允許誤差不超過3﹪,在99.73﹪的概率保證程度下,應抽查多少件產(chǎn)品?【分析】因為共有三個過去的合格率的資料,為保證推斷的把握程度,應選其中方差最大者,即P=93﹪。第六章抽樣推斷第117頁,課件共155頁,創(chuàng)作于2023年2月解:第六章抽樣推斷第118頁,課件共155頁,創(chuàng)作于2023年2月必要樣本容量的影響因素總體方差的大??;允許誤差范圍的大??;概率保證程度;抽樣方法;抽樣的組織方式。第六章抽樣推斷第119頁,課件共155頁,創(chuàng)作于2023年2月說明:4、重復抽樣應比不重復抽樣抽取較多的單位數(shù)。1、總體方差(是非標志總體為P(1-P))越大,表明離散程度越大,應抽取較多的單位數(shù)。2、允許誤差(或者)越小,表明推斷的精度要求增高,應抽取較多的單位數(shù)。3、置信水平越大,表明推斷的可靠程度要求增高,應抽取較多的單位數(shù)。第120頁,課件共155頁,創(chuàng)作于2023年2月抽樣復查的方法其全面調(diào)查時的登記結(jié)果為2.2861億元其抽樣復查的結(jié)果為2.1734億元隨機抽取五個下屬單位修正系數(shù)為則:該企業(yè)集團所擁有的固定資產(chǎn)原值應為16.851×0.9507=16.020(億元)所擁有固定資產(chǎn)原值的普查結(jié)果為16.851億元某企業(yè)集團總體第六章抽樣推斷第121頁,課件共155頁,創(chuàng)作于2023年2月中心極限定理的內(nèi)容中心極限定理是指從總體中抽取樣本容量為n的樣本,當樣本容量足夠大時,其統(tǒng)計量的分布可用正態(tài)概率分布近似。第122頁,課件共155頁,創(chuàng)作于2023年2月第123頁,課件共155頁,創(chuàng)作于2023年2月上圖中,在圖的上部分中,三個總體分別為均勻分布、U形分布和J形分布,即都是非正態(tài)的。隨著樣本容量的增加,抽樣分布開始發(fā)生變化。當樣本容量為2時,抽樣分布開始呈現(xiàn)與總體分布不同的外形;當樣本容量為5時,抽樣分布開始呈現(xiàn)一個鐘形;當樣本容量為30時,三個抽樣分布近似于同一種分布,即正態(tài)分布。因而,當樣本容量足夠大時,抽樣分布可用正態(tài)概率分布近似。第124頁,課件共155頁,創(chuàng)作于2023年2月t分布樣本統(tǒng)計量的抽樣分布,并不完全服從正態(tài)分布,而是服從與正態(tài)分布相似的t分布。當樣本容量不大于30,而且總體標準差未知時,可以使用t分布。t分布為對稱分布。對于不同的樣本容量都有一個不同的t分布,隨著樣本容量增加,t分布的形狀由平坦逐漸變得接近正態(tài)分布。當樣本容量大于30時,t分布就非常接近于正態(tài)分布。第125頁,課件共155頁,創(chuàng)作于2023年2月假設(shè)檢驗在統(tǒng)計方法中的地位統(tǒng)計方法描述統(tǒng)計推斷統(tǒng)計參數(shù)估計假設(shè)檢驗第126頁,課件共155頁,創(chuàng)作于2023年2月假設(shè)檢驗所謂假設(shè)檢驗,就是事先對總體參數(shù)或總體分布形式作出一個假設(shè),然后利用樣本信息來判斷原假設(shè)是否合理,即判斷樣本信息與原假設(shè)是否有顯著差異,從而決定是否接受或否定原假設(shè)

第127頁,課件共155頁,創(chuàng)作于2023年2月一、與參數(shù)估計的推斷角度不同。它是先對總體參數(shù)的值提出一個假設(shè),然后利用樣本信息去檢驗假設(shè)是否成立。二、首先提出原假設(shè)和替換假設(shè)(備擇假設(shè))三、進行假設(shè)正確性檢驗是基于“小概率事件原理”要確定顯著性水平α,通常取0.05、0.1、0.01四、雙側(cè)檢驗、單側(cè)檢驗第128頁,課件共155頁,創(chuàng)作于2023年2月總體假設(shè)檢驗的過程

(提出假設(shè)→抽取樣本→作出決策)抽取隨機樣本均值

X=20我認為人口的平均年齡是50歲提出假設(shè)拒絕假設(shè)!別無選擇.作出決策第129頁,課件共155頁,創(chuàng)作于2023年2月假設(shè)檢驗的步驟提出原假設(shè)和備擇假設(shè)確定適當?shù)臋z驗統(tǒng)計量規(guī)定顯著性水平計算檢驗統(tǒng)計量的值作出統(tǒng)計決策第130頁,課件共155頁,創(chuàng)作于2023年2月提出原假設(shè)和備擇假設(shè)什么是原假設(shè)?1. 待檢驗的假設(shè),又稱“0假設(shè)”2. 如果錯誤地作出決策會導致一系列后果3. 總是有等號,或4. 表示為H0H0:

某一數(shù)值指定為=號,即或例如,H0:

3190(克)第131頁,課件共155頁,創(chuàng)作于2023年2月什么是備擇假設(shè)?1. 與原假設(shè)對立的假設(shè)2. 總是有不等號:

,

或3. 表示為H1H1:

<某一數(shù)值,或某一數(shù)值例如,H1:

<3910(克),或3910(克)提出原假設(shè)和備擇假設(shè)第132頁,課件共155頁,創(chuàng)作于2023年2月什么是檢驗統(tǒng)計量?1. 用于假設(shè)檢驗問題的統(tǒng)計量2. 選擇統(tǒng)計量的方法與參數(shù)估計相同,需考慮是大樣本還是小樣本總體方差已知還是未知檢驗統(tǒng)計量的基本形式為確定適當?shù)臋z驗統(tǒng)計量第133頁,課件共155頁,創(chuàng)作于2023年2月規(guī)定顯著性水平什么顯著性水平?1. 是一個概率值2. 原假設(shè)為真時,拒絕原假設(shè)的概率被稱為抽樣分布的拒絕域3. 表示為常用的值有0.01,0.05,0.104. 由研究者事先確定第134頁,課件共155頁,創(chuàng)作于2023年2月作出統(tǒng)計決策計算檢驗的統(tǒng)計量根據(jù)給定的顯著性水平,查表得出相應的臨界值Z或Z/2將檢驗統(tǒng)計量的值與水平的臨界值進行比較得出接受或拒絕原假設(shè)的結(jié)論第135頁,課件共155頁,創(chuàng)作于2023年2月假設(shè)檢驗中的小概率原理什么小概率?1. 在一次試驗中,一個幾乎不可能發(fā)生的事件發(fā)生的概率2. 在一次試驗中小概率事件一旦發(fā)生,我們就有理由拒絕原假設(shè);反之,小概率事件沒有發(fā)生,則認為原假設(shè)是合理的。3. 小概率由研究者事先確定第136頁,課件共155頁,創(chuàng)作于2023年2月

1、提出原假設(shè)(nullhypothesis)和備擇假設(shè)(alternativehypothesis)

原假設(shè)為正待檢驗的假設(shè):H0;備擇假設(shè)為可供選擇的假設(shè):H1

一般地,假設(shè)有三種形式:

(1)雙側(cè)檢驗:

H0:0;H1:0

(2)左側(cè)檢驗:

H0:0;H1:<0

H0:0;H1:<0

(3)右側(cè)檢驗:

H0:0;H1:>0

H0:<=0;H1:>0

假設(shè)檢驗的步驟第137頁,課件共155頁,創(chuàng)作于2023年2月

2、選擇適當?shù)慕y(tǒng)計量,并確定其分布形式

統(tǒng)計量是根據(jù)所涉及的問題而定的,如總體均值、比例(率)可選取正態(tài)分布的Z統(tǒng)計量等。

3、選擇顯著性水平或置信度,確定臨界值

顯著性水平為原假設(shè)為真時,樣本點落在臨界值外的概率(即抽樣結(jié)果遠離中心點的概率,它為小概率),也是原假設(shè)為真時,拒絕原假設(shè)所冒的風險。

臨界值將樣本點所落區(qū)域分為拒絕域與接受域,臨界值“外”為拒絕域,“內(nèi)”為接受域。第138頁,課件共155頁,創(chuàng)作于2023年2月通過樣本計算統(tǒng)計量的具體值,與臨界值比較,根據(jù)落入拒絕域或接受域的情況來拒絕或接受原假設(shè)。

4、作出結(jié)論第139頁,課件共155頁,創(chuàng)作于2023年2月

由于假設(shè)檢驗是根據(jù)有限的樣本信息來推斷總體特征,由樣本的隨機性可能致使判斷出錯。

(一)第一類錯誤當原假設(shè)為真時,而拒絕原假設(shè)所犯的錯誤,稱為第I類錯誤或拒真錯誤。易知犯第I類錯誤的概率就是顯著性水平:

假設(shè)檢驗中的兩類錯誤(二)第二類錯誤當原假設(shè)為假時,而接受原假設(shè)所犯的錯誤,稱為第II類錯誤或采偽錯誤。犯第II類錯誤的概率常用表示:第140頁,課件共155頁,創(chuàng)作于2023年2月假設(shè)檢驗中的四種可能情況

H0為真H0不真接受H0GoodBad/TypeIIerror拒絕H0Bad/TypeIerrorGood第141頁,課件共155頁,創(chuàng)作于2023年2月1、犯第一類錯誤與犯第二類錯誤的概率存在此消彼長的關(guān)系;2、若要同時減少與,須增大樣本容量n。3、通常的作法是,取顯著性水平較小,即控制犯第一類錯誤的概率在較小的范圍內(nèi);

4、在犯第二類錯誤的概率不好控制時,將“接受原假設(shè)”更傾向于說成“不拒絕原假設(shè)”。注意:第142頁,課件共155頁,創(chuàng)作于2023年2月

一、總體均值的假設(shè)檢驗(一)總體方差已知,正態(tài)總體,樣本大小不限如果總體X~N(,2),在方差已知的情況下,對總體均值進行假設(shè)檢驗。由于總體均值和比例的假設(shè)檢驗

注意:

如果總體方差未知,且總體分布未知,但如果是大樣本(n>=30),仍可通過Z統(tǒng)計量進行檢驗,只不過總體方差需用樣本方差s替代。因此,可通過構(gòu)造Z統(tǒng)計量來進行假設(shè)檢驗:第143頁,課件共155頁,創(chuàng)作于2023年2月

例1:根據(jù)以往

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預覽,若沒有圖紙預覽就沒有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負責。
  • 6. 下載文件中如有侵權(quán)或不適當內(nèi)容,請與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

評論

0/150

提交評論