版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進(jìn)行舉報或認(rèn)領(lǐng)
文檔簡介
1、第四章 概率分布與抽樣 從這一章開始便進(jìn)入推斷統(tǒng)計學(xué)的內(nèi)容,它會節(jié)省人們的時間和財物最佳限度地認(rèn)識研究對象。 現(xiàn)實(shí)世界包含的素材集合非常龐大,從中提取需要的信息非常困難。如:選民人數(shù):每個候選人的支持率是多少?產(chǎn)品:不合格率是多少?環(huán)境:污染程度如何?市場:品種、價格、質(zhì)量、購買力等情況的了解。 在這一章里,你將會了解到樣本是怎樣抽取的,樣本統(tǒng)計量是怎樣分布的,如何根據(jù)樣本統(tǒng)計量對總體參數(shù)做估計。10/14/20221主要內(nèi)容容4.1抽抽樣的一一般問題題4.2三三種不同同性質(zhì)的的分布4.3一一個總體體參數(shù)推推斷時樣樣本統(tǒng)計計量的抽樣分分布4.4兩兩個總體體參數(shù)推推斷時樣樣本統(tǒng)計計量的抽樣分分布
2、4.5其其他抽樣樣方法2/8/202024.1抽抽樣樣的一般般問題4.1.1一個例子子4.1.2統(tǒng)計抽樣樣的幾個個基本概概念4.1.3簡單隨機(jī)機(jī)抽樣2/8/202034.1.1一一個例例子本例中存存欄肉豬豬10000頭組成的的集合,則稱為為總體,它是指指在統(tǒng)計計抽樣中中所要了了解的研研究對象象全體,又稱為為母體,當(dāng)確定定了研究究目標(biāo)時時,它具具有惟一一性。一一般總體體的單位位總數(shù)用用N表示,稱稱作總體容量量。本例中中所抽出出的100頭肉豬組組成的集集合,則則稱為樣本,它是指指在統(tǒng)計計抽樣中中按照“隨機(jī)原原則”從從總體體N(10000)中抽出的的部分單單位(每個單位位稱作樣樣本單位位)所組成的的
3、整體,又稱子子樣。一一般樣本本的單位位總數(shù)用用n(100)表示,稱稱作樣本容量量。樣本不不具惟一一性,它它的可能能個數(shù)與與N、n及抽樣方方法有關(guān)關(guān)。通常常n30稱為小樣本,n30稱為大樣本,在抽樣樣調(diào)查中中取大或或小樣本本會直接接影響到到抽樣分分布的特特征。例某養(yǎng)豬廠廠共有存存欄肉豬豬10000頭頭,現(xiàn)欲欲了解這這批肉豬豬平均每每頭毛重重(設(shè)為為),如果果將每頭頭肉豬過過稱去獲獲取數(shù)據(jù)據(jù)將是不不合算的的。我們們可以按按照“隨隨機(jī)原則則”從從中抽出出100頭稱重重量,計計算這100頭頭的平均均每頭毛毛重,以以達(dá)到我我們期望望的目的的。2/8/202041、總體體和樣本本總體:研研究對象象全體,又
4、稱母母體。容容量用N表示。具備惟一一性。樣本:按按隨機(jī)原原則從總總體中抽抽出的部部分單位位的全體體,被抽抽出的每每個單位位稱樣本本單位。樣本容容量用n表示。樣本不不具惟一一性。當(dāng)n30時,為小樣樣本。當(dāng)n30時,為大樣樣本。4.1.2統(tǒng)統(tǒng)計抽抽樣的幾幾個基本本概念2/8/202052、總體體參數(shù)和和樣本統(tǒng)統(tǒng)計量根據(jù)全及及總體各各單位變變量值計計算的反反映全及及總體某某數(shù)量特特征的綜綜合指標(biāo)標(biāo),由于于總體唯唯一確定定,故稱稱總體參參數(shù)。如上例中中的根據(jù)樣本本各單位位變量值值計算的的反映樣樣本某方方面數(shù)量量特征的的綜合指指標(biāo),由由于樣本本不具惟惟一性,故稱為為樣本統(tǒng)統(tǒng)計量,它是一一個隨機(jī)機(jī)變量。如
5、上例中中的抽出出100頭肉豬豬的平均均每頭毛毛重4.1.2統(tǒng)統(tǒng)計抽抽樣的幾幾個基本本概念2/8/202063、重復(fù)復(fù)抽樣與與不重復(fù)復(fù)抽樣從總體中中抽取樣樣本有兩兩種方法法:重復(fù)復(fù)抽樣和和不重復(fù)復(fù)抽樣。重復(fù)抽樣樣,抽樣安安排-對每每次被抽抽到的單單位經(jīng)登登記后再再放回總總體,重重新參與與下一次次抽選的的抽樣方方法。在在每次的的抽取中中樣本單單位被抽抽中的概概率都相相等,統(tǒng)統(tǒng)計中稱稱這樣的的抽樣為為相互獨(dú)獨(dú)立的試試驗(yàn)。不重復(fù)抽抽樣,抽樣安安排-對被被抽到的的單位登登記后不不再放回回總體的的抽樣方方法。不不重復(fù)抽抽樣與重重復(fù)抽樣樣比較,每次抽抽樣的條條件是不不同的,前一次次的抽取取結(jié)果會會對后一一次
6、的抽抽取產(chǎn)生生影響,統(tǒng)計中中稱這樣樣的抽樣樣為相互互不獨(dú)立立的試驗(yàn)驗(yàn)。4.1.2統(tǒng)統(tǒng)計抽抽樣的幾幾個基本本概念2/8/202074.1.3簡單隨機(jī)機(jī)抽樣簡單隨機(jī)機(jī)抽樣也也稱為純隨機(jī)抽抽樣。它是對對總體單單位不做做任何分分類或排排隊,直直接從總總體中按按“隨機(jī)原則則”抽取樣樣本單位位的調(diào)查查方式。為了便于于抽取樣樣本單位位,一般般在明確確抽樣框框的條件件下,對對總體的的每個單單位都要要編號,然后用用抽簽式式或利用用隨機(jī)機(jī)數(shù)字表表進(jìn)行行抽取。例如:N=500n=10編編碼從1-500號在隨機(jī)數(shù)數(shù)表中隨隨意選取取二個數(shù)數(shù)字,假假如得到到4行,43列列。則選選取的號號碼從這這個被選選中的數(shù)數(shù)開始,由于
7、500是是個三位位數(shù),則則小于500的的連續(xù)三三位數(shù)即即為中選選號碼,見表中中所示。2/8/202084.1.3簡單隨機(jī)機(jī)抽樣2/8/202094.2三三種種不同性性質(zhì)的分分布4.2.1幾種常見見分布4.2.2總體分布布4.2.3樣本分布布4.2.4抽樣分布布4.2.5樣本推斷斷總體的的理論依依據(jù)這些內(nèi)容容與前面面內(nèi)容有有什么關(guān)關(guān)系?2/8/202010一、隨機(jī)機(jī)變量的的概率分分布(一)概概率分布布的含義義1、在隨隨機(jī)試驗(yàn)驗(yàn)中,若若X隨著著試驗(yàn)結(jié)結(jié)果的不不同而隨隨機(jī)地取取各種不不同的數(shù)數(shù)值,并并且對取取每一個個數(shù)值或或某一范范圍內(nèi)的的值都有有相應(yīng)的的概率,則稱X為一個個隨機(jī)變量量,按其取取值特
8、點(diǎn)點(diǎn)可分為為離散型隨隨機(jī)變量量和連續(xù)型隨隨機(jī)變量量。2、隨機(jī)機(jī)變量在在其取值值范圍內(nèi)內(nèi),取值值與取值值概率間間一一對對應(yīng)的關(guān)關(guān)系,稱為隨隨機(jī)變量量的概率分布布(probabilitydistribution,簡稱分布)。3、概率率分布可可以用各各種圖表表來表示示,一些些也可以以用公式式來表示示。意義:描述隨隨機(jī)變量量變化的的統(tǒng)計規(guī)規(guī)律;方方便地計計算某一一事件發(fā)發(fā)生的概概率。4.2.1幾種常見見分布2/8/202011(二)離離散散型隨機(jī)機(jī)變量的的概率分分布離散型隨隨機(jī)變量量概率分分布的兩兩種表現(xiàn)現(xiàn)形式1.分布布列(律律)2.概率率函數(shù)2/8/202012概率函數(shù)數(shù)p(xi)的數(shù)學(xué)學(xué)性質(zhì)2/8
9、/202013(三)連連續(xù)續(xù)型隨機(jī)機(jī)變量的的概率分分布(1/3)1.連連續(xù)型隨隨機(jī)變量量的表現(xiàn)現(xiàn)方式密度度函數(shù)2/8/202014(三)連連續(xù)續(xù)型隨機(jī)機(jī)變量的的概率分分布(2/3)2.密度度函數(shù)的的數(shù)數(shù)學(xué)性質(zhì)質(zhì)3.事件件“aXb”發(fā)生生的概率率 的計計算方法法2/8/202015(三)連連續(xù)續(xù)型隨機(jī)機(jī)變量的的概率分分布(3/3)4.事件件“aXb”發(fā)生生的概率率的幾何何意義5.連續(xù)續(xù)型隨機(jī)機(jī)變量的的期望值值和方差差分別為為2/8/202016(四)隨隨機(jī)機(jī)變量的的分布函函數(shù)1.分布布函數(shù)的的來源如前所述述,離散散型隨機(jī)機(jī)變量的的分布用用概率函函數(shù)來描描述,連連續(xù)型隨隨機(jī)變量量的分布布用密度度函
10、數(shù)來來描述,兩者形形式不同同,表現(xiàn)現(xiàn)各異。為了更更方便地地表現(xiàn)隨隨機(jī)變量量的分布布,下面面引入分分布函數(shù)數(shù)。2.分布布函數(shù)的的定義2/8/2020173.分布布函數(shù)的的幾何意意義及數(shù)數(shù)學(xué)性質(zhì)質(zhì)1)幾何何意義2)數(shù)學(xué)學(xué)性質(zhì)2/8/2020184.隨機(jī)機(jī)變量分分布函數(shù)數(shù)的具體體表現(xiàn)2/8/202019二、正態(tài)態(tài)分布4.2.1幾種常見見分布1.定義義2/8/202020正態(tài)分布布的密度度函數(shù)圖形是一條以以均值為為中心的的對稱鐘鐘型曲線線二、正態(tài)態(tài)分布4.2.1幾種常見見分布2/8/2020212.正態(tài)態(tài)分布密密度函數(shù)數(shù)的的數(shù)數(shù)學(xué)性質(zhì)質(zhì)二、正態(tài)態(tài)分布4.2.1幾種常見見分布2/8/2020223.標(biāo)準(zhǔn)
11、準(zhǔn)正態(tài)分分布及其其重要意意義二、正態(tài)態(tài)分布4.2.1幾種常見見分布2/8/2020234.標(biāo)準(zhǔn)準(zhǔn)化法二、正態(tài)態(tài)分布4.2.1幾種常見見分布2/8/202024標(biāo)準(zhǔn)化法法的幾何意義義標(biāo)準(zhǔn)化變變換實(shí)質(zhì)質(zhì)上是作作了一個個坐標(biāo)軸軸的平移移和尺度度變換,使正態(tài)態(tài)分布的的平均數(shù)數(shù),標(biāo)準(zhǔn)差差。二、正態(tài)態(tài)分布4.2.1幾種常見見分布2/8/2020255.正態(tài)態(tài)分布表表及上側(cè)側(cè)分位數(shù)數(shù)二、正態(tài)態(tài)分布4.2.1幾種常見見分布2/8/2020266.3準(zhǔn)則則二、正態(tài)態(tài)分布4.2.1幾種常見見分布2/8/2020273準(zhǔn)則示意意圖二、正態(tài)態(tài)分布4.2.1幾種常見見分布2/8/2020287.正態(tài)態(tài)分布的的重要意意義
12、在隨機(jī)理理論中,正態(tài)分分布是最最重要的的一種分分布,理理由如下下: 它是是最常見見的一種種分布,現(xiàn)實(shí)中中許多隨隨機(jī)變量量服從或或近似服服從正態(tài)態(tài)分布。 在一一定的條條件下,正態(tài)分分布是其其他分布布的近似似分布。 許多多有用的的分布,特別是是小樣本本的精確確分布是是由正態(tài)態(tài)分布推推導(dǎo)出來來的。二、正態(tài)態(tài)分布4.2.1幾種常見見分布2/8/202029三、小樣樣本(n30)的精精確分布布1、2分布2、t分分布3、F分分布均由正態(tài)態(tài)分布導(dǎo)導(dǎo)出的分分布4.2.1幾種常見見分布2/8/2020301、2分布(2distribution)(1)推導(dǎo)說明明由阿貝貝(Abbe)于1863年首先給給出,后后來由
13、海海爾墨特特(Hermert)和卡皮爾遜(KPearson)分別于于1875年和1900年推導(dǎo)出出來。設(shè),則構(gòu)造,則Yi服從自由由度為1的2分布,即即當(dāng)總體體,從從中抽取取容量為為n的樣本,則4.2.1幾幾種常常見分布三、小樣本(n30)的的精確分分布2/8/2020311、2分布(2)性性質(zhì)和特特點(diǎn)由于2分布變量量為正態(tài)態(tài)變量的的平方和和,故分布的變變量值始始終為正正??杉有孕裕喝鬠和V為為兩個獨(dú)獨(dú)立的服服從2分布的隨隨機(jī)變量量,U2(n1),V2(n2),則U+V這這一隨機(jī)機(jī)變量服服從自由由度為n1+n2的2分布。n個獨(dú)立正正態(tài)變量量平方和和稱為有有n個自由度度的c2-分布,記為c2(n)
14、。c2-分布為為一族分分布,成成員由由自由度度區(qū)分。分布的的形狀取取決于其其自由度度n的大小,通常為為不對稱稱的正偏偏分布,但隨著著自由度度的增大大逐漸趨趨于對稱稱。期望為為E(2)=n,方差為為D(2)=2n(n為為自由度度)4.2.1幾幾種常常見分布三、小樣本(n30)的的精確分分布2/8/2020321、c2分布(3)圖圖示 選擇容量為n 的簡單隨機(jī)樣本計算樣本方差s2計算卡方值2 = (n-1)s2/2計算出所有的 2值不同容量樣本的抽樣分布c 2n=1n=4n=10n=20 ms總體4.2.1幾幾種常常見分布三、小樣本(n30)的的精確分分布2/8/2020331、c2分布(4)c2
15、分布的上分位點(diǎn)分位點(diǎn)設(shè)X 2(n),若對于:01,存在,滿足則稱為分布的上分位點(diǎn)點(diǎn)。4.2.1幾幾種常常見分布三、小樣本(n30)的的精確分分布2/8/202034由統(tǒng)計學(xué)學(xué)家哥賽賽特(W.S.Gosset)于1908年提出出,并以以其筆名名命名。2、t-分布布(t-distribution)(1)t分布的的構(gòu)造及及性質(zhì)4.2.1幾幾種常常見分布三、小樣本(n30)的的精確分分布構(gòu)造:若N(0,1),2(n), 與獨(dú)立,則t(n)稱為自由由度為n的t分布?;拘孕再|(zhì):(1)f(t)關(guān)于t=0(縱軸)對稱。(2)f(t)的極限為為N(0,1)的密度函函數(shù),即即2/8/202035t(n)分布的圖
16、圖形為2、t-分布布(t-distribution)(2)t分布的的圖示4.2.1幾幾種常常見分布三、小樣本(n30)的的精確分分布2/8/202036對于給定定的:0ta)=a的點(diǎn)ta為t(n)分布布的上a分位點(diǎn)。2、t-分布布(t-distribution)(3)t分布的的上a分位點(diǎn)4.2.1幾幾種常常見分布三、小樣本(n30)的的精確分分布2/8/202037由統(tǒng)計計學(xué)家費(fèi)費(fèi)希爾(R.A.Fisher)提出的,以其姓姓氏的第第一個字字母來命命名構(gòu)造:設(shè)若U為服從自自由度為為n1的2分布,即即U2(n1),V為服從自自由度為為n2的2分布,即即V2(n2),且U和V相互獨(dú)立立,則稱F為服從
17、自自由度n1和n2的F分布,記記為3、F分布(Fdistribution)(1)F分布的構(gòu)構(gòu)造4.2.1幾幾種常常見分布三、小樣本(n30)的的精確分分布2/8/202038F分布(圖示)不同自由由度的F分布F(1,10)(5,10)(10,10)3、F分布(Fdistribution)(2)F分布的圖圖示4.2.1幾幾種常常見分布三、小樣本(n30)的的精確分分布2/8/202039F分布的分分位點(diǎn):對于:01,若滿足條條件:PFF(n1,n2)=,則稱F(n1,n2)為F(n1,n2)的上分位點(diǎn)3、F分布(Fdistribution)(3)F分布的上上a分位點(diǎn)4.2.1幾幾種常常見分布三、
18、小樣本(n30)的的精確分分布2/8/2020401)總體體中各元元素的觀觀察值所所形成的的相對頻頻數(shù)(頻頻率)分分布2)分布布通常是是未知的的(因?yàn)闉閹缀醯玫貌坏娇偪倛D所有有觀察值值)3)可以以根據(jù)理理論分析析假定它它服從某某種分布布總體4.2.2總體分布2/8/2020411)一個個樣本中中各觀察察值形成成的相對對頻數(shù)(頻率)分布2)也稱稱經(jīng)驗(yàn)分分布3)當(dāng)樣樣本容量量n逐漸增大大時,樣樣本分布布逐漸接接近總體體的分布布樣本4.2.3樣本分布2/8/2020421、統(tǒng)計量量與參數(shù)數(shù)1)在抽樣樣推斷中中,無論論是總體體還是樣樣本,都都可以用用均值、比比例(或成數(shù))、標(biāo)準(zhǔn)差差和方差差等指標(biāo)來來描
19、述它它們的特特征。當(dāng)當(dāng)它們用用來描述述樣本的的特征時時,稱為為樣本統(tǒng)統(tǒng)計量;當(dāng)它們們用來描描述總體體特征時時,稱為為總體參參數(shù)。2)樣本統(tǒng)計計量是樣本的的函數(shù),依據(jù)不不同的樣樣本計算算出來的的值是不不同的,所以統(tǒng)計量是是隨機(jī)變變量,如樣本本均值,樣本比例例,樣本本方差等等。4.2.4抽樣分布2/8/2020432、抽樣樣分布的的含義1)含義:樣本統(tǒng)計計量的概概率分布布,是一種理理論分布布,在重重復(fù)選取取容量為為n的樣本時時,由該該統(tǒng)計量量的所有有可能取取值形成成的相對對頻數(shù)分分布。2)構(gòu)造抽樣樣分布包包括以下下幾個步步驟:(1)從從容量為為N的有有限總體體中隨機(jī)機(jī)抽出容容量為n的所有有可能樣樣
20、本;(2)算算出每個個樣本的的統(tǒng)計量量數(shù)值;(3)算算出與每每個樣本本統(tǒng)計量量數(shù)值相相對應(yīng)的的概率,作頻數(shù)數(shù)分布表表。4.2.4抽樣分布2/8/2020443、總體分分布、樣樣本均值值的抽樣樣分布(例題分析析)【例】設(shè)一個總總體,含有4個元素(個體),即總體體單位數(shù)數(shù)N=4。4個個體分分別為x1=1,x2=2,x3=3,x4=4??傮w分分布、總總體均值值、總體體方差如如下??傮w分布14230.1.2.3總體均值值和方差差4.2.4抽樣分布2/8/202045現(xiàn)從總體體中抽取取n2的簡單隨隨機(jī)樣本本,在重重復(fù)抽樣樣條件下下,共有有42=16個樣本。所有樣樣本的結(jié)結(jié)果為3,43,33,23,132
21、,42,32,22,124,44,34,24,141,441,33211,21,11第二個觀察值第一個觀察值所有可能的n = 2 的樣本(共16個)4.2.4抽樣分布2/8/202046x樣本均值的抽樣分布1.000.10.20.3P ( x )1.53.04.03.52.02.5計算出各各樣本的的均值,如下表表,并給給出樣本本均值的的抽樣分分布3.53.02.52.033.02.52.01.524.03.53.02.542.542.03211.51.01第二個觀察值第一個觀察值16個樣本的均值 ( x )4.2.4抽樣分布2/8/202047樣本均值值的分布布與總體體分布的的比較(例題分析析
22、)= 2.52=1.25的分布形形式與原原有總體的分分布和樣本容量量n的大小等因素有有關(guān)總體分布布抽樣分布布14230.1.2.3P ( x )1.00.1.2.31.53.04.03.52.02.5x4.2.4抽樣分布2/8/2020484、抽樣樣分布的的意義因?yàn)闃颖颈揪凳鞘且粋€個隨機(jī)變量量,因此,與其他他隨機(jī)變變量一樣樣,具有平均均數(shù)(期期望)、方差和和概率分分布。因?yàn)榈牡母鞲鞣N可能能取值是是多次簡簡單隨機(jī)機(jī)抽樣的的結(jié)果,所以的的概率率分布稱稱為的的抽樣分分布。對對于這個個抽樣分布布及其特征征的了解解,可以以使我們們能夠?qū)颖揪蹬c與總體均均值的的接近近程度進(jìn)進(jìn)行概率率描述。4.2.4
23、抽樣分布意義:抽樣分布布一方面面描述了了樣本的的隨機(jī)性性,提供供了樣本統(tǒng)計計量長遠(yuǎn)遠(yuǎn)而穩(wěn)定定的信息息即變化規(guī)規(guī)律;另另一方面面建立了了樣本與總總體的聯(lián)聯(lián)系,是進(jìn)行推推斷的理理論基礎(chǔ)礎(chǔ),也是是抽樣推推斷科學(xué)學(xué)性的重重要依據(jù)據(jù)。2/8/202049一、大數(shù)數(shù)定律1、是關(guān)關(guān)于均值值具有穩(wěn)穩(wěn)定性的的一類定定律。2、以切切比雪夫夫大數(shù)定定律為例例。設(shè)隨機(jī)變變量相相互互獨(dú)立,且具有有相同的的有限數(shù)數(shù)學(xué)期望望和方差差:則對于任任意正數(shù)數(shù),都都有3、若把把()看作作是來自自期望為為、方差為為2總體的一一個容量量為n的的樣本,隨著n的充分分增大,樣本均均值依概概率收斂斂于總體體均值。4、大數(shù)數(shù)定律為為統(tǒng)計量量估
24、計參參數(shù)提供供了理論論上的依依據(jù)。即即統(tǒng)計量量推斷參參數(shù)是可可行的。但大數(shù)數(shù)定律沒沒有提供供統(tǒng)計量量推斷參參數(shù)時誤誤差的計計算方法法。4.2.5樣樣本推推斷總體體的理論論依據(jù)2/8/202050二、中心心極限定定理(central limit theorem)當(dāng)樣本容量足夠大時(n 30) ,樣本均值的抽樣分布逐漸趨于正態(tài)分布1.中心心極限定定理:從均值為,方差為為2的一個任意總體體中重復(fù)抽抽取容量為n的樣本,當(dāng)n充分分大時,樣本均均值的抽抽樣分布布近似服服從均值為、方差差為2/n的正態(tài)分布布。一個任意分布的總體x4.2.5樣樣本推推斷總體體的理論論依據(jù)2/8/2020512.x的分布趨趨于正
25、態(tài)態(tài)分布的的過程4.2.5樣樣本推推斷總體體的理論論依據(jù)2/8/2020523.中心心極限定定理的重重要意義義1)確定了了正態(tài)分分布在各各種分布布中的首首要地位位。也回回答了正正態(tài)分布布是最重重要、最最常見的的分布。2)揭示了了正態(tài)分分布的形形成機(jī)制制。如果果某一個個量的變變化受到到許多種種隨機(jī)因因素的影影響,這這種影響響的總后后果是各各個因素素的迭加加,而且且,這些些因素中中沒有任任何一個個是起主主導(dǎo)作用用的,那那么,這這個量就就是一個個服從正正態(tài)分布布的隨機(jī)機(jī)變量。3)提供了了推斷誤誤差的計計算思想想方法,特別是是大樣本本處理方方法。但但沒有提提供小樣樣本下推推斷誤差差的計算算方法。4.2
26、.5樣樣本推推斷總體體的理論論依據(jù)2/8/2020534.3一一個個總體參參數(shù)推斷斷時樣本本統(tǒng)計量量的抽樣樣分布4.3.1樣本均值值的抽樣樣分布4.3.2樣本比例例的抽樣樣分布4.3.3樣本方差差的抽樣樣分布2/8/2020541、樣本本均值抽抽樣分布布的含義義1)在重復(fù)復(fù)選取容容量為n的樣本時時,由樣本均值值的所有有可能取取值形成的相對頻數(shù)數(shù)分布2)一種種理論概概率分布布3)是推推斷總體體均值的理論基基礎(chǔ)4.3.1樣樣本均均值的抽抽樣分布布2/8/2020552、樣本均值值抽樣分分布的形形式(1)總體分布布為正態(tài)態(tài)分布 = 50 =10X總體分布n = 4抽樣分布xn =16當(dāng)總體服服從正態(tài)
27、分布布N(,2)時,來來自該總總體的所所有容量量為n的樣本的的均值x也服從正正態(tài)分布布,x的數(shù)學(xué)期期望為,方差為為2/n。即xN(,2/n)4.3.1樣樣本均均值的抽抽樣分布布2/8/2020562、樣本均值值抽樣分分布的形形式(2)總體分分布為非非正態(tài)分分布(n30,大樣本情情形)當(dāng)樣本容量足夠大時(n 30) ,樣本均值的抽樣分布逐漸趨于正態(tài)分布從均值為,方差為為2的一個非正態(tài)分分布總體中抽抽取容量為n的樣本,當(dāng)n充分分大時,樣本均均值的抽抽樣分布布近似服服從均值為、方差差為2/n的正態(tài)分布布一個任意分布的總體x4.3.1樣樣本均均值的抽抽樣分布布2/8/2020571)總體體分布為為非正
28、態(tài)態(tài)分布且且為小樣本(n30)2)樣本均均值的分分布為非正態(tài)分分布2、樣本均值值抽樣分分布的形形式(3)總體分布布為非正正態(tài)分布布(n30,小樣本情情形)4.3.1樣樣本均均值的抽抽樣分布布2/8/202058總體分布正態(tài)分布非正態(tài)分布大樣本小樣本正態(tài)分布正態(tài)分布非正態(tài)分布2、樣本均值值抽樣分分布的形形式(4)小結(jié)4.3.1樣樣本均均值的抽抽樣分布布2/8/202059樣本均值值的數(shù)學(xué)學(xué)期望樣本均值值的方差差(方差的概概率意義義在于刻刻畫了隨隨機(jī)變量量取值的的分散程程度。方方差越小小,隨機(jī)機(jī)變量的的取值越越集中在在期望值值附近。)重復(fù)抽樣樣不重復(fù)抽抽樣3、樣本均均值抽樣樣分布的的特征設(shè)總體共共
29、有N個個元素,其均值值為,方差為為2,從中抽抽取容量量為n的的樣本,則4.3.1樣樣本均均值的抽抽樣分布布2/8/2020601)總體體(或樣樣本)中中具有某某種屬性性的單位位數(shù)與全全部單位位總數(shù)之之比不同性性別的人人與全部部人數(shù)之之比合格品品(或不不合格品品)與與全部產(chǎn)產(chǎn)品總數(shù)數(shù)之比2)總體體比例可可表示為為3)樣本本比例可可表示為為4.3.2樣樣本比比例(成成數(shù))的的抽樣分分布1、比例例(成數(shù)數(shù))的含含義2/8/202061在重復(fù)選選取容量量為n的的樣本時時,由樣本比例例的所有有可能取取值形成的相相對頻數(shù)數(shù)分布。一種理論論概率分分布。當(dāng)樣本容容量很大大時(np5和n(1-p)5),樣樣本比
30、例例的抽樣樣分布可可用正態(tài)分布布近似。推斷總體體比例的理論基基礎(chǔ)。4.3.2樣樣本比比例的抽抽樣分布布2、樣本本比例抽抽樣分布布的含義義及形式式2/8/202062樣本比例例的數(shù)學(xué)學(xué)期望樣本比例例的方差差重復(fù)抽樣樣不重復(fù)抽抽樣4.3.2樣樣本比比例的抽抽樣分布布3、樣本本比例抽抽樣分布布的特征征2/8/202063調(diào)查誤差差登記性誤誤差代表性誤誤差系統(tǒng)性誤誤差(偏偏差)抽樣平均均誤差實(shí)際誤差差抽樣誤差差主要是指指在用樣樣本數(shù)據(jù)據(jù)進(jìn)行推推斷時所所產(chǎn)生的的隨機(jī)誤誤差。統(tǒng)統(tǒng)計推斷斷中的抽抽樣誤差差通常是是指抽樣平均均誤差,它是抽抽樣調(diào)查查所固有有的,是是對抽樣樣推斷精精確度的的量度。4.3.2樣樣本
31、比比例的抽抽樣分布布4、抽樣誤差差(1)調(diào)調(diào)查誤差差的分類類抽樣極限限誤差抽樣誤差差(隨機(jī)誤誤差)2/8/2020644.3.2樣樣本比比例的抽抽樣分布布(2)統(tǒng)計量量的標(biāo)準(zhǔn)準(zhǔn)誤()定義:樣本統(tǒng)計計量的抽抽樣分布布的標(biāo)準(zhǔn)準(zhǔn)差,測測度所有有樣本統(tǒng)統(tǒng)計量的的離散程程度,也也稱標(biāo)準(zhǔn)誤差差或抽樣平均均誤差。A:樣本均值值的的抽樣誤誤差B:樣本成數(shù)數(shù)P的抽樣誤誤差4、抽樣誤差差2/8/202065 樣本平均均數(shù)的的抽樣樣平均誤誤差A(yù)、重復(fù)抽樣樣4、抽樣誤差差(3)標(biāo)標(biāo)準(zhǔn)誤差差的計算算4.3.2樣樣本比比例的抽抽樣分布布2/8/202066B、不重復(fù)抽抽樣4、抽樣誤差差(3)標(biāo)標(biāo)準(zhǔn)誤差差的計算算4.3.2
32、樣樣本比比例的抽抽樣分布布2/8/202067不重復(fù)抽樣有限總體重復(fù)抽樣或無限總體有限總體體中為校正因因子,一一般可簡簡寫為一般當(dāng)抽抽樣比小小于等于于5時時,校正正因子可可忽略不不計。標(biāo)準(zhǔn)誤差差就是樣樣本統(tǒng)計計量的抽抽樣分布布的標(biāo)準(zhǔn)準(zhǔn)差,也也稱抽樣樣平均誤誤差,其其計算公式式如下:4.3.2樣樣本比比例的抽抽樣分布布4、抽樣誤差差(3)標(biāo)標(biāo)準(zhǔn)誤差差的計算算2/8/202068當(dāng)計算算標(biāo)準(zhǔn)誤誤時涉及及的總體參數(shù)數(shù)未知時,用樣樣本統(tǒng)計計量代替替計算的的標(biāo)準(zhǔn)誤誤,稱為為估計的的標(biāo)準(zhǔn)誤誤。以樣本本均值的的抽樣分分布為例例,當(dāng)總總體標(biāo)準(zhǔn)準(zhǔn)差未知時,可用樣本本標(biāo)準(zhǔn)差差s代替替,則在重重復(fù)抽樣樣條件下下,樣
33、本本均值的的估計標(biāo)標(biāo)準(zhǔn)誤為為:標(biāo)準(zhǔn)差=標(biāo)準(zhǔn)誤=估計標(biāo)準(zhǔn)準(zhǔn)誤=抽樣誤差差?4.3.2樣樣本比比例的抽抽樣分布布4、抽樣誤差差(4)估估計的標(biāo)標(biāo)準(zhǔn)誤(standarderrorofestimation)2/8/202069總體各單位的差異程度(即標(biāo)準(zhǔn)差的大小): 越大,抽樣誤差越大;樣本單位數(shù)的多少: 越大,抽樣誤差越?。怀闃臃椒ǎ翰恢貜?fù)抽樣的抽樣誤差比重復(fù)抽樣的抽樣誤差?。怀闃咏M織方式:簡單隨機(jī)抽樣的誤差最大。4.3.2樣樣本比比例的抽抽樣分布布4、抽樣誤差差(5)影影響抽樣樣誤差的的因素2/8/202070在重復(fù)選選取容量量為n的樣本時時,由樣本方差差的所有有可能取取值形成的相相對頻數(shù)數(shù)分布對
34、于來自自正態(tài)總總體的簡簡單隨機(jī)機(jī)樣本,則比值值的抽樣分分布服從從自由度為為(n-1)的2分布,即4.3.3樣樣本方方差的抽抽樣分布布2/8/2020714.4兩兩個個總體參參數(shù)推斷斷時樣本本統(tǒng)計量量的抽樣樣分布4.4.1兩個樣本本均值之之差的抽抽樣分布布4.4.2兩個樣本本比例之之差的抽抽樣分布布4.4.3兩個樣本本方差比比的抽樣樣分布2/8/202072兩個總體體都為正正態(tài)分布布,即,兩個樣本本均值之之差的的抽抽樣分布布服從正正態(tài)分布布,其分分布的數(shù)數(shù)學(xué)期望望為兩個個總體均均值之差差方差為各各自的方方差之和和4.4.1兩兩個樣樣本均值值之差的的抽樣分分布即:2/8/202073兩個總體體都服
35、從從二項分分布分別從兩兩個總體體中抽取取容量為為n1和n2的獨(dú)立樣樣本,當(dāng)當(dāng)兩個樣樣本都為為大樣本本時,兩兩個樣本本比例之之差的抽抽樣分布布可用正正態(tài)分布布來近似似分布的數(shù)數(shù)學(xué)期望望為方差為各各自的方方差之和和4.4.2兩兩個樣樣本比例例之差的的抽樣分分布即:2/8/202074兩個總體都都為正態(tài)態(tài)分布,即X1N(1,12),X2N(2,22)從兩個總體中中分別抽抽取容量量為n1和n2的獨(dú)立樣樣本兩個樣本方方差比的的抽樣分分布,服服從分子子自由度度為(n1-1),分母自自由度為為(n2-1)的的F分布,即即4.4.3兩兩個樣樣本方差差比的抽抽樣分布布2/8/2020754.5其其他他抽樣方方法
36、4.5.1概率抽樣樣1、分層抽樣樣2、系統(tǒng)抽樣樣3、整群抽樣樣4、多階段抽抽樣4.5.2非概率抽抽樣1、方便抽樣樣2、判斷抽樣樣3、自愿樣本本4、滾雪球抽抽樣5、配額抽樣樣4.5.3概率抽樣樣和非概概率抽樣樣的比較較4.5.4抽樣調(diào)查查實(shí)例2/8/202076根據(jù)一個個已知的的概率來來抽取樣樣本單位位,也稱稱隨機(jī)抽抽樣,概率抽樣樣有簡單隨機(jī)機(jī)抽樣、分層抽樣樣、系統(tǒng)抽樣樣、整群抽樣樣、多階段抽抽樣等。特點(diǎn)按一定的的概率以以隨機(jī)原則則抽取樣本本抽取樣本本時使每每個單位位都有一一定的機(jī)機(jī)會被抽抽中每個單位位被抽中中的概率率是已知知的,或或是可以以計算出出來的當(dāng)用樣本本對總體體目標(biāo)量量進(jìn)行估估計時,要
37、考慮慮到每個個樣本單單位被抽抽中的概概率4.5.1概概率抽抽樣2/8/2020771.分層層抽樣(stratified sampling)1、定義義:將總總體單位位按某種特特征或某某種規(guī)則則劃分為為不同的的層,然后從不同的的層中獨(dú)獨(dú)立、隨隨機(jī)地抽抽取樣本本單位的方法,又稱類型抽樣樣或分類抽樣樣。2、特點(diǎn)點(diǎn):先分分層(對對總體),后抽抽樣(對對層)3、分層層要求:層間差別別大,層層內(nèi)差別別小4、抽樣樣方法:(見下張幻幻燈片)5、適用:總體單位位在總體體內(nèi)部分分布不均均勻且變變異程度度大的總總體。6、優(yōu)點(diǎn)點(diǎn):保證證樣本的的結(jié)構(gòu)與與總體的的結(jié)構(gòu)比比較相近近,從而而提高估估計的精精度;組組織實(shí)施施調(diào)查
38、方方便;既既可以對對總體參參數(shù)進(jìn)行行估計,也可以以對各層層的目標(biāo)標(biāo)量進(jìn)行行估計。2/8/202078總體N樣本n等額等比例不等比例例1.分層層抽樣(stratified sampling)2/8/202079例10人年齡資資料如下下。N=10n=3,推斷總體體平均年年齡。人:ABCDEFGHIJ年齡:581139424548707376簡單隨機(jī)機(jī)抽樣(B、H、I),(C、D、E),(F、G、I)結(jié)論:總總體變異異較大時時分層抽樣樣。分層抽樣樣(B、E、I),(C、D、H),(A、G、J)1.分層層抽樣(stratified sampling)2/8/202080隨機(jī)起點(diǎn)點(diǎn)半距起點(diǎn)點(diǎn)對稱起點(diǎn)點(diǎn)(
39、總體單單位按某某一標(biāo)志志排序)按無關(guān)標(biāo)志排序序,其抽樣效效果相當(dāng)當(dāng)于簡單隨機(jī)機(jī)抽樣;按有關(guān)關(guān)標(biāo)志排排序,其其抽樣效效果相當(dāng)當(dāng)于分層抽樣樣。2、系統(tǒng)統(tǒng)抽樣(機(jī)械抽抽樣或等等距抽樣樣)(systematicsampling)將總體中中的所有有單位(抽樣單單位)按一定順順序排列列,在規(guī)定的的范圍內(nèi)內(nèi)隨機(jī)地抽抽取一個個單位作作為初始始單位,然后按按事先規(guī)規(guī)定好的的規(guī)則確確定其他他樣本單單位。2/8/202081系統(tǒng)抽樣樣可以分分為無關(guān)關(guān)標(biāo)志排排序抽樣樣和有關(guān)關(guān)標(biāo)志排排序抽樣樣兩類。無關(guān)標(biāo)志志排序抽抽樣是指排序的的標(biāo)志與與被研究究的標(biāo)志志無關(guān)。如:觀觀察學(xué)生生考試成成績用姓姓氏筆劃劃;觀察察產(chǎn)品質(zhì)質(zhì)量按
40、生生產(chǎn)的先先后順序序等。無無關(guān)標(biāo)志志排序可可以保證證抽樣的的隨機(jī)性性,它實(shí)質(zhì)上相相當(dāng)于簡簡單隨機(jī)機(jī)抽樣。有關(guān)標(biāo)志志排序抽抽樣是指排序的的標(biāo)志與與被研究究標(biāo)志相相關(guān)。在對總總體各單單位的變變異情況況有所了了解的情情況下,也可以以采用有有關(guān)標(biāo)志志進(jìn)行總總體單位位排列,使各單單位的排排列順序序和它的的變量數(shù)數(shù)值大小小保持密密切的關(guān)關(guān)系。如如:農(nóng)產(chǎn)產(chǎn)量抽樣樣調(diào)查,可利用用各縣或或各鄉(xiāng)當(dāng)當(dāng)年估計計畝產(chǎn)或或最近三三年平均均畝產(chǎn)標(biāo)標(biāo)志排隊隊,抽取取調(diào)查單單位。由由此可見見,按有有關(guān)標(biāo)志志排序?qū)崒?shí)質(zhì)上是是運(yùn)用系系統(tǒng)抽樣樣的一些些特點(diǎn),有利于于提高樣樣本的代代表性,它實(shí)質(zhì)上相相當(dāng)于分分層抽樣樣。但也必須須注意到
41、,系統(tǒng)統(tǒng)抽樣在在排序時時,第一一個樣本本單位的的位置確確定后,其余單單位也隨隨之確定定,因此此要避免免抽樣間間隔和現(xiàn)現(xiàn)象本身身的周期性節(jié)奏相重重合,引起系統(tǒng)統(tǒng)性的影影響。2、系統(tǒng)統(tǒng)抽樣(systematicsampling)2/8/2020823、整群群抽樣(cluster sampling)1、定義義:將總總體中各各單位按按一定標(biāo)標(biāo)準(zhǔn)分成成若干群群(組),再從從總體中中隨機(jī)抽取取一定數(shù)數(shù)量的群群,對抽中中群的所所有單位位全部實(shí)實(shí)施調(diào)查查。2、特點(diǎn)點(diǎn):先分分群(對對總體),后抽抽樣(對對總體)3、群的的類型:自然形形成的群群;人為為劃分的的群4、分群群原則:群間差別別小,群群內(nèi)差別別大5、抽樣
42、樣方法:(見下張張幻燈片片)6、適用:在大規(guī)模模的抽樣樣調(diào)查中中,如果果總體單位位多且分分布區(qū)域域廣,缺缺少進(jìn)行行抽樣的的抽樣框框,或者在在按經(jīng)濟(jì)濟(jì)效益原原則不宜編制制這種抽抽樣框的情況下下,宜采采用整群抽樣樣方式。2/8/202083例:總體體群數(shù)R=16樣樣本本群數(shù)r=4ABCDEFGHIJKLMNOPLHPD樣本容量量簡單、方方便,能能節(jié)省人人力、物物力、財財力和時間間,但其其樣本代代表性可可能較差差3、整群群抽樣(cluster sampling)2/8/202084例:在某某省100多萬萬農(nóng)戶抽抽取1000戶戶調(diào)查農(nóng)農(nóng)戶生產(chǎn)產(chǎn)性投資資情況。 第一階段:從該省所有縣中抽取5個縣第二階段
43、:從被抽中的5個縣中各抽4個鄉(xiāng) 第三階段:從被抽中的20個鄉(xiāng)中各抽5個村 第四階段:從被抽中的100個村中各抽10戶樣本n=10010=1000(戶)又稱多級抽樣樣,它是將將抽取樣樣本單位位的過程程劃分為為幾個階階段,然然后逐階階段抽取取樣本單單位的抽抽樣組織織方式。4、多階階段抽樣樣2/8/202085其優(yōu)點(diǎn)在于:首先,便便于組織織抽樣。它可以以按現(xiàn)有有的行政政區(qū)劃或或地理區(qū)區(qū)域劃分分各階段段的抽樣樣單元,從而簡簡化抽樣樣框的編編制。其次,可可以獲得得各階段段單元的的調(diào)查資資料,即即根據(jù)最最初級資資料可進(jìn)進(jìn)行逐級級抽樣推推斷,得得到各級級的調(diào)查查資料。如農(nóng)產(chǎn)量調(diào)調(diào)查,可根據(jù)據(jù)樣本推推斷地塊塊
44、資料,根據(jù)地地塊資料料可推斷斷村的資資料,然然后依次次推斷鄉(xiāng)鄉(xiāng)、縣等等。第三,多多階段抽抽樣的方方式比較較靈活,各階段段抽樣的的組織方方式可以以前述四四種為依依據(jù)進(jìn)行行選擇。一般在在初級階階段抽樣樣時多用用類型抽抽樣和等等距抽樣樣,在次次級階段段抽樣時時多用等等距抽樣樣和簡單單隨機(jī)抽抽樣。同同時,還還可以根根據(jù)各階階段的不不同特點(diǎn)點(diǎn),采用用不同的的抽樣比比。如方方差大的的階段,抽樣比比大一些些;方差差小的階階段,抽抽樣比小小一些。而且多多階段抽抽樣在簡簡化抽樣樣工作的的同時,抽樣單單位的分分布較廣廣,具有有較強(qiáng)的的代表性性。4、多階階段抽樣樣2/8/2020864.5.2非概率抽抽樣(non-
45、probabilitysampling)相對于概概率抽樣樣而言抽取樣本本時不是依據(jù)據(jù)隨機(jī)原原則,而是根根據(jù)研究究目的對對數(shù)據(jù)的的要求,采用某某種方式式從總體體中抽出出部分單單位對其其實(shí)施調(diào)調(diào)查有方便抽樣樣、判斷抽樣樣、自愿樣本本、滾雪球抽抽樣、配額抽樣樣等方式2/8/2020871、方便抽樣樣調(diào)查過程程中由調(diào)調(diào)查員依據(jù)方便便的原則,自行確確定抽取取樣本的的單位調(diào)查員在在街頭、公園、商店等等公共場場所進(jìn)行行攔截調(diào)調(diào)查廠家在出出售產(chǎn)品品柜臺前前對路過過顧客進(jìn)進(jìn)行的調(diào)調(diào)查優(yōu)點(diǎn):容容易實(shí)施施,調(diào)查查的成本本低缺點(diǎn):樣樣本單位位的確定定帶有隨隨意性,樣本無無法代表表有明確確定義的的總體,調(diào)查結(jié)果果不宜推推斷總體體2/8/2020882、判斷抽抽樣研究人員員根據(jù)經(jīng)驗(yàn)驗(yàn)、判斷斷和對研研究對象象的了解解,有目的的選擇一一些單位位作為樣樣本有重點(diǎn)抽抽樣
溫馨提示
- 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
- 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
- 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
- 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負(fù)責(zé)。
- 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請與我們聯(lián)系,我們立即糾正。
- 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時也不承擔(dān)用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。
最新文檔
- 2023-2024年一級造價師之建設(shè)工程技術(shù)與計量(安裝)考前沖刺模擬A卷(含答案)
- 2022年中考化學(xué)二輪復(fù)習(xí)填空題之溶液
- 2023-2024年消防設(shè)施操作員之消防設(shè)備基礎(chǔ)知識考試題庫
- 2022年設(shè)備安裝施工基礎(chǔ)知識考試試卷及答案(共六卷)
- 2022-2024年江蘇中考英語試題匯編:任務(wù)型閱讀填空和閱讀回答問題(學(xué)生)
- 2024版城市供水供電項目建設(shè)的合同
- 2024版建筑工程項目管理與技術(shù)咨詢協(xié)議版B版
- 勞務(wù)派遣行業(yè)規(guī)范協(xié)議書
- 2024年項目咨詢合同范本
- 2025版辦公租賃合同(含物業(yè)維護(hù)服務(wù))3篇
- 游戲機(jī)策劃方案
- 2024消防安全基礎(chǔ)知識培訓(xùn)課件
- 《小兒留置導(dǎo)尿管》課件
- 粵教版科學(xué)四年級上冊全冊試卷(含答案)
- 宮腔鏡診治規(guī)范
- 安全管理計劃指標(biāo)和指標(biāo)體系
- 倉庫物料盤點(diǎn)作業(yè)規(guī)范培訓(xùn)課件
- 六年級《牽手兩代-第二講-乖孩子為什么會厭學(xué)》家長課程培訓(xùn)
- 水稻全生育期營養(yǎng)管理
- 節(jié)流閥流量計算公式
- 美甲店衛(wèi)生制度規(guī)章范本
評論
0/150
提交評論