第三講樣本的抽取_第1頁
第三講樣本的抽取_第2頁
第三講樣本的抽取_第3頁
第三講樣本的抽取_第4頁
第三講樣本的抽取_第5頁
已閱讀5頁,還剩31頁未讀, 繼續(xù)免費閱讀

下載本文檔

版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進行舉報或認領(lǐng)

文檔簡介

第三講樣本的抽取第1頁,共36頁,2023年,2月20日,星期一一、抽樣的基本原理

抽樣就是從一個總體中抽取部分具有代表性的個體作為樣本,然后用這一樣本的結(jié)果去推斷總體。(總體、樣本、樣本容量)第2頁,共36頁,2023年,2月20日,星期一

總體100000人樣本1000人隨機抽樣

研究結(jié)果推斷

抽樣基本原理關(guān)系圖第3頁,共36頁,2023年,2月20日,星期一二、抽樣的基本要求1.明確規(guī)定總體2.取樣的隨機性3.取樣的代表性4.合理的樣本容量第4頁,共36頁,2023年,2月20日,星期一三、概率抽樣的方法遵循隨機化原則的抽樣稱為概率抽樣。理論依據(jù):

——大數(shù)法則

第5頁,共36頁,2023年,2月20日,星期一1.簡單隨機抽樣

定義:總體中每個個體被抽到的機會是均等的,且在抽樣取走一個個體之后總體內(nèi)成分不變。如圖:第6頁,共36頁,2023年,2月20日,星期一簡單隨機抽樣一般用下述三種方法:

(1)抽簽法

(2)查表法

(3)計算機造數(shù)法

主要適用于小總體的情況。

第7頁,共36頁,2023年,2月20日,星期一

2.系統(tǒng)抽樣(等距抽樣)

這種抽樣的具體做法是:(1)將總體的所有單位按一定順序排列起來。(2)計算抽樣間隔。抽樣間隔是有總體所含的單位數(shù)與樣本容量決定的。假設(shè)前者是N個,后者為n個,則抽樣間隔應(yīng)是K=N/n。(3)在第一個抽樣間隔內(nèi)用完全隨機的方法抽取一個單位作為第一個樣本單位。(4)以第一個抽中的單位為起點,每隔k個總體單位抽取一個單位作為樣本單位,直至抽滿為止。第8頁,共36頁,2023年,2月20日,星期一

[例1]

現(xiàn)有180名學(xué)生,要利用系統(tǒng)抽樣法從中抽取15名學(xué)生作研究樣本,其方法如下:先將學(xué)生按與學(xué)生學(xué)習(xí)成績無關(guān)的標(biāo)志編號,假設(shè)按學(xué)生座位順序把學(xué)生編為1-180號,然后按下述步驟抽?。?/p>

(1)確定間隔距離;

(2)決定起點R=(K+2)/2=(12+2)/2=7,即決定從第一部分的第7號單位作為第一個樣本。第二個樣本為7+12=19號單位;如此類推,抽出的15個樣本為:

(7),(19),(31),(43),(55),(67),(79),(91),(103),(115),(127),(139),(151),(163),(175)。第9頁,共36頁,2023年,2月20日,星期一例2、下列抽樣中不是系統(tǒng)抽樣的是()A、從標(biāo)有1—15號的15號的15個小球中任選3個作為樣本,按從小號到大號排序,隨機確定起點i,以后為i+5,i+10(超過15則從1再數(shù)起)號入樣。B、工廠生產(chǎn)的產(chǎn)品,用傳關(guān)帶將產(chǎn)品送入包裝車間前,檢驗人員從傳送帶上每隔五分鐘抽一件產(chǎn)品檢驗。C、搞某一市場調(diào)查,規(guī)定在商場門口隨機抽一個人進行詢問,直到調(diào)查到事先規(guī)定的調(diào)查人數(shù)為止。D、電影院調(diào)查觀眾的某一指標(biāo),通知每排(每排人數(shù)相等)座位號為14的觀眾留下來座談。第10頁,共36頁,2023年,2月20日,星期一例3、從編號為1~50的50枚最新研制的某種型號的導(dǎo)彈中隨機抽取5枚來進行發(fā)射實驗,若采用每部分選取的號碼間隔一樣的系統(tǒng)抽樣方法,則所選取5枚導(dǎo)彈的編號可能是()A、5,10,15,20,25B、3,13,23,33,43C、1,2,3,4,5D、2,4,6,16,32第11頁,共36頁,2023年,2月20日,星期一例4.從某廠生產(chǎn)的802輛轎車中隨機抽取80輛測試某項性能。請合理選擇抽樣方法進行抽樣,并寫出抽樣過程。例5.某裝訂廠平均每小時約裝訂圖書362冊,需要檢驗員每小時抽取40冊圖書,檢驗其質(zhì)量狀況,請你設(shè)計一個抽樣方案。第12頁,共36頁,2023年,2月20日,星期一3.分層抽樣(類型抽樣)

分層抽樣是先把總體按一定標(biāo)志分成不同類型或?qū)哟?,然后從各種不同類型中隨機抽取若干單位組成樣本。第13頁,共36頁,2023年,2月20日,星期一第14頁,共36頁,2023年,2月20日,星期一分層抽樣探究假設(shè)某地區(qū)有高中生2400人,初中生10900人,小學(xué)生11000人。此地區(qū)教育部門為了了解本地區(qū)中小學(xué)生的近視情況及其形成原因,要從本地區(qū)的中小學(xué)生中抽取1%的學(xué)生進行調(diào)查。你認為應(yīng)當(dāng)怎樣抽取樣本?能在14300人中任意取143個嗎?能將143個份額均分到這三部分中嗎?

分析:考察對象的特點是由具有明顯差異的幾部分組成。當(dāng)已知總體由差異明顯的幾部分組成時,為了使樣本更充分地反映總體的情況,常將總體分成幾個部分,然后按照各部分所占的比例進行抽樣,這種抽樣叫做“分層抽樣”,其中所分成的各部分叫做“層”。第15頁,共36頁,2023年,2月20日,星期一1、一個單位的職工500人,其中不到35歲的有125人,35到49歲的有280人,50歲以上的有95人。為了了解這個單位職工與身體狀況有關(guān)的某項指標(biāo),要從中抽取一個容量為100的樣本。由于職工年齡與這項指標(biāo)有關(guān),試問:應(yīng)用什么方法抽???解:1)確定樣本容量與總體的個體數(shù)之比100:500=1:52)利用抽樣比確定各年齡段應(yīng)抽取的個體數(shù),依次為:125/5,280/5,95/5,即25,56,19。3)利用簡單隨機抽樣或系統(tǒng)抽樣的方法,從各年齡段分別抽取25,56,19人,然后合在一起,就是所抽取的樣本。練習(xí)第16頁,共36頁,2023年,2月20日,星期一分層抽樣的步驟1、根據(jù)總體的差異將總體分為互不交叉的層。2、按比例k=n/N的比例在每層當(dāng)中抽取樣本。3、合成樣本。第17頁,共36頁,2023年,2月20日,星期一[例2]某政府機關(guān)有在編人員100人,其中副處級以上干部10人,一般干部70人,工人20人。上級機關(guān)為了了解政府機構(gòu)改革的意見,要從中抽取一個容量為20的樣本,試確定用何種方法抽取,請具體實施操作。1.抽樣比例k=1:5;2.每層中抽取的樣本分別為:n1=10*1/5=2(人)n2=70*1/5=14(人)N3=20*1/5=4(人)3.則樣本容量:n=n1+n2+n3=20。第18頁,共36頁,2023年,2月20日,星期一分層抽樣的主要優(yōu)點:

一是當(dāng)一個總體其內(nèi)部分層明顯時,分層抽樣能夠提高樣本的代表性,從而提高從樣本推斷總體的精確性。二是分層抽樣特別適用于既要對總體參數(shù)進行推斷,也要對各子總體(層)的參數(shù)進行推斷的情形。三是允許不同層的情況采用不同的抽樣方法。局限性:

調(diào)查者必須對總體情況有較多的了解,否則無法進行恰當(dāng)?shù)姆謱?。?9頁,共36頁,2023年,2月20日,星期一4.整群抽樣又稱聚類抽樣,它是將總體按照某種標(biāo)準劃分為一些子群體,每個子群體作為一個抽樣單位,用隨機的方法從中抽取若干子群,將抽出的子群中的所有單位合起來作為總體的樣本。

第20頁,共36頁,2023年,2月20日,星期一第21頁,共36頁,2023年,2月20日,星期一思考:分層抽樣與整群抽樣的聯(lián)系與區(qū)別?第22頁,共36頁,2023年,2月20日,星期一整群抽樣的主要優(yōu)點:

易于取得抽樣框,便于組織,可以節(jié)省人力、物力和財力。最大缺點:

樣本分布不均勻,樣本的代表性差。

第23頁,共36頁,2023年,2月20日,星期一

四、非概率抽樣不按照隨機化原則進行的抽樣叫非概率抽樣。四種類型:就近抽樣、目標(biāo)式或判斷式抽樣、滾雪球抽樣、配額抽樣。第24頁,共36頁,2023年,2月20日,星期一就近抽樣(偶遇抽樣、方便抽樣、自然抽樣)

定義:是指研究者根據(jù)現(xiàn)實情況,以自己方便的形式抽取偶然遇到的人作為調(diào)查對象,或者僅僅選擇那些離得最近的、最容易找到的人作為調(diào)查對象。例優(yōu)點——方便省力;缺點——樣本的代表性差,有很大的偶然性。第25頁,共36頁,2023年,2月20日,星期一目標(biāo)式和判斷式抽樣(主觀抽樣、立意抽樣):定義:調(diào)查者根據(jù)研究的目標(biāo)和自己主觀的分析,來選擇和確定調(diào)查對象的方法。它是“有目的的”選擇樣本

優(yōu)點:

可以充分發(fā)揮研究人員的主觀能動作用。缺點:

樣本的代表性難以判斷,不能推論。

第26頁,共36頁,2023年,2月20日,星期一滾雪球抽樣:定義:當(dāng)我們無法了解總體情況時,可以從總體中的少數(shù)成員入手,對他們進行調(diào)查,向他們詢問還知道哪些符合條件的人;再去找那些人并詢問他們知道的人。

第27頁,共36頁,2023年,2月20日,星期一配額抽樣(定額抽樣):定義:

按調(diào)查對象的某種屬性或特征將總體中所有個體分成若干類或?qū)?,然后在各層中抽樣,樣本中各層(類)所占比例與他們在總體中所占比例一樣。例:假設(shè)某高校有2000名學(xué)生,其中男生占60%,女生占40%;文科學(xué)生和理科學(xué)生各占50%;一年級學(xué)生占40%,二年級、三年級、四年級學(xué)生分別占30%、20%和10%。現(xiàn)要用定額抽樣方法依上述三個變量抽取一個規(guī)模為100人的樣本。

第28頁,共36頁,2023年,2月20日,星期一第29頁,共36頁,2023年,2月20日,星期一配額抽樣方法的缺陷:配額的框架必須十分精確。為了做到這一點,必須掌握最新的資料,但這是十分困難的。從某些特定的格子中選擇樣本時,可能會存在偏誤。

配額抽樣和分層抽樣的區(qū)別:

——本質(zhì)上的差別——

第30頁,共36頁,2023年,2月20日,星期一非概率抽樣的優(yōu)缺點及適用范圍:

其樣本的代表性往往較小,誤差有時相當(dāng)大,而且這種誤差又無法估計。

優(yōu)點:

操作方便、省錢省力,統(tǒng)計上也遠較概率抽樣簡單;適于探索性研究。第31頁,共36頁,2023年,2月20日,星期一舉例:“大學(xué)生學(xué)習(xí)現(xiàn)狀調(diào)查與學(xué)習(xí)指導(dǎo)的研究”

“弱智兒童智能特點的研究”

“小學(xué)學(xué)習(xí)困難學(xué)生教育的研究”第32頁,共36頁,2023年,2月20日,星期一樣本大小取決于以下諸方面因素:(1)研究的不同類型;(2)預(yù)定分析的精確程度;(3)允許誤差的大??;(4)總體的同質(zhì)性;(5)研究者的時間、人力和物力;(6)取樣的方法等。

第33頁,共36頁,2023年,2月20日,星期一

表1從給定的總體確定樣本大小一覽表總體樣本總體樣本總體樣本10102201401200291151423014413002972019240148140030225242501521500306302826015516003103532270159170031340362801621800317454029016519003205044300169200032255483201752200327605234018124003316556360186260033570593801912800338756340019630003418066420201350034685704402054000351907346021045003549576480214500035710080500217600036111086550226700036412092600234800036713097650242900036814010370024810000370150108750254150003751601138002602000037717011885026530000

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負責(zé)。
  • 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔(dān)用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

評論

0/150

提交評論