概率概率分布與抽樣分布_第1頁
概率概率分布與抽樣分布_第2頁
概率概率分布與抽樣分布_第3頁
概率概率分布與抽樣分布_第4頁
概率概率分布與抽樣分布_第5頁
已閱讀5頁,還剩26頁未讀, 繼續(xù)免費(fèi)閱讀

下載本文檔

版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進(jìn)行舉報(bào)或認(rèn)領(lǐng)

文檔簡介

概率概率分布與抽樣分布第1頁,共32頁,2023年,2月20日,星期五第三章概率、概率分布與抽樣分布第一節(jié)常用的抽樣方法第二節(jié)抽樣分布第2頁,共32頁,2023年,2月20日,星期五1、理解常用的概率抽樣方法概念2、掌握抽樣分布的概念3、掌握單一總體的樣本統(tǒng)計(jì)量的分布及特征4、理解中心極限定理的內(nèi)涵學(xué)習(xí)目標(biāo)與要求第3頁,共32頁,2023年,2月20日,星期五第一節(jié)常用的抽樣方法簡單隨機(jī)抽樣分層抽樣整群抽樣系統(tǒng)抽樣概率抽樣非概率抽樣抽樣方法第4頁,共32頁,2023年,2月20日,星期五一、概率抽樣(probabilitysampling)1、含義:根據(jù)一個(gè)已知的概率來抽取樣本單位,也稱隨機(jī)抽樣。2、特點(diǎn):按隨機(jī)原則抽取樣本:每個(gè)單位都有機(jī)會(huì)每個(gè)單位被抽取的概率是已知或可計(jì)算的當(dāng)用樣本對總體估計(jì)時(shí),要考慮每個(gè)樣本單位被抽中的概率隨機(jī)原則:在從總體中抽取樣本單位時(shí),每一個(gè)單位被抽中的可能性相等,且不被人為確定。第5頁,共32頁,2023年,2月20日,星期五3、常用的概率抽樣方法(1)簡單隨機(jī)抽樣(simplerandomsampling)從總體N個(gè)單位中隨機(jī)抽取n個(gè)單位作為樣本,使得每一個(gè)單位都有相同的概率被抽中的抽樣方式。兩種抽取方法:重復(fù)抽樣(samplingwithreplacement)不重復(fù)抽樣(samplingwithoutreplacement優(yōu)點(diǎn):簡單、直觀用樣本統(tǒng)計(jì)量對總體參數(shù)進(jìn)行估計(jì)比較方便局限性:當(dāng)N和n很大時(shí),工作量太大抽出的單位分散,給實(shí)施調(diào)查增加了困難第6頁,共32頁,2023年,2月20日,星期五(2)分層抽樣(stratifiedsampling)將總體單位按某種特征劃分為若干不同的層,然后從各個(gè)層中抽取一定數(shù)量的單位共同構(gòu)成樣本的抽樣方式。優(yōu)點(diǎn):保證樣本與總體結(jié)構(gòu)相近,可提高估計(jì)精度組織實(shí)施調(diào)查方便既可估計(jì)總體,也可估計(jì)各層子總體分層注意事項(xiàng):層的劃分應(yīng)盡可能符合數(shù)據(jù)規(guī)律,使樣本很好代表總體,應(yīng)遵循“層間差異大,層內(nèi)差異小”。第7頁,共32頁,2023年,2月20日,星期五(3)系統(tǒng)抽樣(systematicsampling)將總體所有單位按一定順序排列后,按某種規(guī)則隨機(jī)地確定一個(gè)單位為抽樣起點(diǎn),每間隔一定距離抽取一個(gè)單位組成樣本的抽樣方式。也稱等距抽樣或機(jī)械抽樣實(shí)施方法:排序后,將單位編號(hào)1,2,…,N;確定距離k=N/n,隨機(jī)取r∈[1,k]作為初始位置;

依次取r+k,r+2k,…,r+(n-1)k等位置單位,組成樣本。●r●r+k●r+(n-1)k123Nk2k(n-1)k第8頁,共32頁,2023年,2月20日,星期五優(yōu)點(diǎn):操作簡便;總體數(shù)量均勻分布時(shí)可提高估計(jì)精度缺點(diǎn):對估計(jì)量方差的估計(jì)比較困難第9頁,共32頁,2023年,2月20日,星期五(4)整群抽樣(clustersampling)將總體劃分為若干個(gè)組(群),隨機(jī)抽取部分群,然后對中選群中的所有單位進(jìn)行調(diào)查的抽樣方式。優(yōu)點(diǎn):抽樣時(shí)只需群的抽樣框,簡化工作量調(diào)查相對集中,節(jié)省調(diào)查費(fèi)用,方便調(diào)查實(shí)施缺點(diǎn):估計(jì)的精度較差整群抽樣注意事項(xiàng):組群的劃分應(yīng)盡可能符合數(shù)據(jù)規(guī)律,體現(xiàn)出“群內(nèi)差異大,群間差異小”的原則。第10頁,共32頁,2023年,2月20日,星期五二、非概率抽樣(non-probabilitysampling)1、含義:抽取樣本時(shí)不是依據(jù)隨機(jī)原則,而是根據(jù)研究目的的要求,采用從總體中人為的選取部分單位實(shí)施調(diào)查。2、主要抽樣方式:方便抽樣:確定樣本單位時(shí)主要考慮到方便抽取的因素。判斷抽樣:研究人員根據(jù)研究內(nèi)容和以往的經(jīng)驗(yàn)來確定所抽取的樣本單位。3、特點(diǎn):不能對總體進(jìn)行推斷第11頁,共32頁,2023年,2月20日,星期五第二節(jié)抽樣分布一、參數(shù)與統(tǒng)計(jì)量二、抽樣分布的概念三、樣本均值的抽樣分布四、樣本比率的抽樣分布五、樣本方差的抽樣分布第12頁,共32頁,2023年,2月20日,星期五一、參數(shù)與統(tǒng)計(jì)量1、參數(shù)(Parameter)用來描述總體特征的綜合指標(biāo)?;诳傮w資料計(jì)算:2、統(tǒng)計(jì)量(Statistic)用來描述樣本特征的指標(biāo)。基于樣本資料計(jì)算得到:或、、相關(guān)提示:統(tǒng)計(jì)量是根據(jù)具體樣本數(shù)據(jù)計(jì)算而得的一個(gè)函數(shù)統(tǒng)計(jì)量中不包含任何未知參數(shù)第13頁,共32頁,2023年,2月20日,星期五3、參數(shù)與統(tǒng)計(jì)量的關(guān)系對于一個(gè)既定總體來說,參數(shù)是確定的、唯一的。而從同一個(gè)總體由于抽取的樣本組成單位不同,由此計(jì)算出的統(tǒng)計(jì)量則是隨機(jī)變量。實(shí)踐工作中,總體特征往往未知,需要由樣本資料進(jìn)行估計(jì),即由統(tǒng)計(jì)量來估計(jì)參數(shù)。第14頁,共32頁,2023年,2月20日,星期五1、總體分布:總體各元素的觀察值所形成的分布。2、樣本分布:一個(gè)樣本容量為n的樣本中n個(gè)觀察值的分布。3、抽樣分布:統(tǒng)計(jì)量所有可能取值形成的概率分布。1)是一種理論概率分布2)樣本統(tǒng)計(jì)量是隨機(jī)變量樣本均值,樣本比例等3)結(jié)果來自容量相同的所有可能樣本二、抽樣分布第15頁,共32頁,2023年,2月20日,星期五三、樣本均值的抽樣分布1、概念要點(diǎn)1)在重復(fù)選取容量為n的樣本時(shí),由樣本均值的所有可能取值形成的概率分布。2)一種理論概率分布3)是推斷總體均值的理論基礎(chǔ)第16頁,共32頁,2023年,2月20日,星期五2、形成過程(一個(gè)例子)【例】設(shè)一個(gè)總體,含有4個(gè)元素(個(gè)體),即總體單位數(shù)N=4。4個(gè)個(gè)體分別為X1=1、X2=2、X3=3、X4=4??傮w的均值、方差及分布如下均值和方差總體分布14230.1.2.3第17頁,共32頁,2023年,2月20日,星期五

現(xiàn)從總體中抽取n=2的簡單隨機(jī)樣本,在重復(fù)抽樣條件下,共有42=16個(gè)樣本。所有樣本的結(jié)果如下表3,43,33,23,132,42,32,22,124,44,34,24,141,441,33211,21,11第二個(gè)觀察值第一個(gè)觀察值所有可能的n=2的樣本(共16個(gè))第18頁,共32頁,2023年,2月20日,星期五計(jì)算出各樣本的均值,如下表。并給出樣本均值的抽樣分布3.53.02.52.033.02.52.01.524.03.53.02.542.542.03211.51.01第二個(gè)觀察值第一個(gè)觀察值16個(gè)樣本的均值(x)樣本均值的抽樣分布1.00.1.2.3P(x)1.53.04.03.52.02.5x第19頁,共32頁,2023年,2月20日,星期五3、抽樣分布形式抽樣分布=2.5σ2=1.25總體分布14230.1.2.3P(x)1.00.1.2.31.53.04.03.52.02.5x的分布形式與原有總體和樣本容量n的大小有關(guān)第20頁,共32頁,2023年,2月20日,星期五=50

=10X總體分布n=4抽樣分布Xn=16當(dāng)總體服從正態(tài)分布N~(μ,σ2)時(shí),來自該總體的所有容量為n的樣本的均值X也服從正態(tài)分布,X

的數(shù)學(xué)期望為μ,方差為σ2/n。即X~N(μ,σ2/n)。第21頁,共32頁,2023年,2月20日,星期五中心極限定理當(dāng)樣本容量足夠大時(shí)(n

30),樣本均值的抽樣分布逐漸趨于正態(tài)分布中心極限定理:從均值為,方差為

2的總體中抽取容量為n的樣本,當(dāng)n充分大時(shí)(通常n>=30),樣本均值的抽樣分布近似服從均值為μ、方差為σ2/n的正態(tài)分布。一個(gè)任意分布的總體X第22頁,共32頁,2023年,2月20日,星期五中心極限定理x的分布趨于正態(tài)分布的過程第23頁,共32頁,2023年,2月20日,星期五樣本均值的抽樣分布

與總體分布的關(guān)系總體分布正態(tài)分布非正態(tài)分布大樣本小樣本正態(tài)分布正態(tài)分布非正態(tài)分布大樣本小樣本第24頁,共32頁,2023年,2月20日,星期五4、樣本均值抽樣分布的特征1.樣本均值的數(shù)學(xué)期望2.樣本均值的方差重復(fù)抽樣不重復(fù)抽樣第25頁,共32頁,2023年,2月20日,星期五

從總體中抽取n=2的簡單隨機(jī)樣本,在重復(fù)抽樣條件下,共有42=16個(gè)樣本。所有樣本均值的結(jié)果如下表:3.53.02.52.033.02.52.01.524.03.53.02.542.542.03211.51.01第二個(gè)觀察值第一個(gè)觀察值16個(gè)樣本的均值(x)第26頁,共32頁,2023年,2月20日,星期五式中:M為可能樣本數(shù)目,是指從一個(gè)有N個(gè)單位的總體中抽取容量為n的樣本時(shí),出現(xiàn)的所有可能樣本的個(gè)數(shù)。結(jié)論:1)樣本均值的均值(數(shù)學(xué)期望)等于總體均值2)樣本均值的方差等于總體方差的1/n

第27頁,共32頁,2023年,2月20日,星期五三、樣本比率的抽樣分布(適于研究品質(zhì)數(shù)據(jù))1、比率的概念:比率:又叫成數(shù),總體(或樣本)中具有某種屬性的單位與全部單位總數(shù)之比。①不同性別的人與全部人數(shù)之比②合格品(或不合格品)與全部產(chǎn)品總數(shù)之比1)總體比率可表示為2)樣本比率可表示為

第28頁,共32頁,2023年,2月20日,星期五2、概念要點(diǎn)1)在重復(fù)選取容量為n的樣本時(shí),由樣本比率的所有可能取值形成的概率分布。2)一種理論概率分布。3)當(dāng)樣本容量很大時(shí)(np≥5和n(1-p)≥5)樣本比率的抽樣分布可用正態(tài)分布近似。4)推斷總體比例的理論基礎(chǔ)。

第29頁,共32頁,2023年,2月20日,星期五3、樣本比例的抽樣分布特征1)樣本比例的數(shù)學(xué)期望2)樣本比例的方差重復(fù)抽樣不重復(fù)抽樣第30頁,共32頁,2023年,2月20日,星期五四、樣本方差的抽樣分布1.在重

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會(huì)有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫網(wǎng)僅提供信息存儲(chǔ)空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負(fù)責(zé)。
  • 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

最新文檔

評(píng)論

0/150

提交評(píng)論