版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進行舉報或認領(lǐng)
文檔簡介
1、浙江工業(yè)大學(xué)浙江工業(yè)大學(xué)社會調(diào)查方法社會調(diào)查方法第第 四章四章 抽抽 樣樣 抽樣使我們能從總體具有代表性的部分樣本中獲取數(shù)據(jù),抽樣使我們能從總體具有代表性的部分樣本中獲取數(shù)據(jù),從而可以得到關(guān)于整個總體的有效結(jié)論。從而可以得到關(guān)于整個總體的有效結(jié)論。 英英 托尼托尼普羅科特普羅科特浙江工業(yè)大學(xué)浙江工業(yè)大學(xué)社會調(diào)查方法社會調(diào)查方法開篇案例 我們知道,近幾十年來,美國總統(tǒng)大選前夕,總有一些民意測驗機構(gòu)喜歡對總統(tǒng)選擇投票的結(jié)果進行預(yù)測。1936年美國總統(tǒng)選舉前夕,蓋洛普民意測驗所僅僅調(diào)查了3000人,就成功地預(yù)測了民主黨人羅斯福將當(dāng)選為美國的新一任總統(tǒng)。 1984年這家民意測驗機構(gòu)又一次成功地預(yù)測了羅
2、納得里根將以59%比41%的優(yōu)勢戰(zhàn)勝蒙代爾而當(dāng)選為美國的新一任總統(tǒng)。這一預(yù)測結(jié)果與實際投票結(jié)果(59%:41%)相一致。而當(dāng)時蓋洛普民意測驗所在將近1億美國選民中,調(diào)查的對象還不到2000人。浙江工業(yè)大學(xué)浙江工業(yè)大學(xué)社會調(diào)查方法社會調(diào)查方法案例2004年美國大選主要民調(diào)樣本數(shù)調(diào)查機構(gòu)調(diào)查機構(gòu)樣本量樣本量福克斯新聞??怂剐侣?1200 1200 蓋洛普蓋洛普 1573 1573 全國廣播公司全國廣播公司/ /華爾街日報華爾街日報 1014 1014 哥倫比亞廣播公司哥倫比亞廣播公司/ /紐約時報紐約時報 939 939 美國廣播公司美國廣播公司/ /華盛頓郵報華盛頓郵報 939 939 新聞周刊
3、新聞周刊 882882浙江工業(yè)大學(xué)浙江工業(yè)大學(xué)社會調(diào)查方法社會調(diào)查方法51.3448.3148.3120042004年美國總統(tǒng)大選一周前民調(diào)結(jié)果年美國總統(tǒng)大選一周前民調(diào)結(jié)果浙江工業(yè)大學(xué)浙江工業(yè)大學(xué)社會調(diào)查方法社會調(diào)查方法抽樣與我們的生活抽樣與我們的生活v生活中充滿了抽樣 冬泳之前,用腳尖試探一下水溫; 做菜時,用勺子舀起一些試試味道濃了還是淡了; 在書店挑選一本營銷調(diào)研的書籍,隨手拿起一本,翻看其中幾頁以決定是否購買; 體檢時抽一試管的血看看身體血液情況; 浙江工業(yè)大學(xué)浙江工業(yè)大學(xué)社會調(diào)查方法社會調(diào)查方法為什么需要抽樣?為什么需要抽樣?v一些實驗本質(zhì)上是破壞性的v物理上不具備考察總體所有項目的
4、可能性v對總體每一項目逐一考察費用過高v對總體每一項目逐一考察相當(dāng)耗時v樣本結(jié)論充分性浙江工業(yè)大學(xué)浙江工業(yè)大學(xué)社會調(diào)查方法社會調(diào)查方法抽樣方法論抽樣方法論v抽樣過程就是使用少量項目或者總體的一部分得出關(guān)于整個總體的結(jié)論v樣本(sample)是一個更大的總體的子集或一部分v抽樣的目的在于幫助我們對總體的一些未知特征進行估計浙江工業(yè)大學(xué)浙江工業(yè)大學(xué)社會調(diào)查方法社會調(diào)查方法抽樣的有關(guān)術(shù)語抽樣的有關(guān)術(shù)語抽樣的基本程序抽樣的基本程序抽樣類型(方法)抽樣類型(方法)樣本規(guī)模與抽樣誤差樣本規(guī)模與抽樣誤差1234浙江工業(yè)大學(xué)浙江工業(yè)大學(xué)社會調(diào)查方法社會調(diào)查方法一、抽樣的有關(guān)術(shù)語1 1、總體總體(Populat
5、ionPopulation)()(此指調(diào)查總體)(此指調(diào)查總體)(在社會調(diào)查中用在社會調(diào)查中用N N表示)表示) 通常與構(gòu)成的元素共同定義,總體是構(gòu)成它的所有元素的集合,而元通常與構(gòu)成的元素共同定義,總體是構(gòu)成它的所有元素的集合,而元素則是構(gòu)成總體的基本單位。素則是構(gòu)成總體的基本單位。 (1)(1)研究總體:是在理論上明確界定的個體(分析單位)集合體。(是理論研究總體:是在理論上明確界定的個體(分析單位)集合體。(是理論上的總體)上的總體)(2)(2)調(diào)查總體:是研究者實際抽樣樣本的個體(分析單位)的集合體。(是調(diào)查總體:是研究者實際抽樣樣本的個體(分析單位)的集合體。(是實際操作中的總體)實
6、際操作中的總體) 二者不同:研究總體是我們概念上的,而調(diào)查總體是我們實際抽取樣二者不同:研究總體是我們概念上的,而調(diào)查總體是我們實際抽取樣本的集合。本的集合。二者關(guān)系:二者關(guān)系:調(diào)查總體調(diào)查總體應(yīng)當(dāng)無限趨近直至等于應(yīng)當(dāng)無限趨近直至等于研究總體研究總體。如:開展對某省大學(xué)生擇業(yè)傾向調(diào)查時,該省所有在校大學(xué)生的集合就是如:開展對某省大學(xué)生擇業(yè)傾向調(diào)查時,該省所有在校大學(xué)生的集合就是研研究究總體,每個在校大學(xué)生就是構(gòu)成總體的元素。該省所有在總體,每個在校大學(xué)生就是構(gòu)成總體的元素。該省所有在冊大冊大學(xué)生學(xué)生則則構(gòu)成調(diào)查總體。構(gòu)成調(diào)查總體。2 2、樣本樣本(SampleSample)(社會調(diào)查中用)(社
7、會調(diào)查中用n n表示)表示) 是從調(diào)查總體中按一定方式抽取出來的那一部分代表的集合體。是從調(diào)查總體中按一定方式抽取出來的那一部分代表的集合體。浙江工業(yè)大學(xué)浙江工業(yè)大學(xué)社會調(diào)查方法社會調(diào)查方法3.3.抽樣(抽樣(SamplingSampling) 是一種選擇調(diào)查對象的程序與方法,即從總體中選取一部分代表的過程,是一種選擇調(diào)查對象的程序與方法,即從總體中選取一部分代表的過程,也即從總體中按一定方式選擇或抽取樣本的過程。也即從總體中按一定方式選擇或抽取樣本的過程。 如:從某省總數(shù)為如:從某省總數(shù)為1010萬人的大學(xué)生總體中按照一定方式抽取出萬人的大學(xué)生總體中按照一定方式抽取出10001000名大名大
8、學(xué)生進行調(diào)查,這學(xué)生進行調(diào)查,這10001000名大學(xué)生就是構(gòu)成總體的一個樣本。(名大學(xué)生就是構(gòu)成總體的一個樣本。(從一個總體中從一個總體中可以抽取出若干個不同的樣本可以抽取出若干個不同的樣本)4.4.抽樣單位抽樣單位(Sampling Unit)(Sampling Unit) 一次直接的抽樣所使用的基本單位。抽樣單位和構(gòu)成總體的元素有時相一次直接的抽樣所使用的基本單位。抽樣單位和構(gòu)成總體的元素有時相同,有時不同。同,有時不同。5.5.抽樣框抽樣框(Sampling FrameSampling Frame) 也稱抽樣范圍,指抽取樣本的所有抽樣單位的名單。也稱抽樣范圍,指抽取樣本的所有抽樣單位的
9、名單。如:從某所大學(xué)全體學(xué)生中直接抽取如:從某所大學(xué)全體學(xué)生中直接抽取200200名學(xué)生作為樣本名學(xué)生作為樣本該校全體學(xué)生的名單該校全體學(xué)生的名單 從某一所大學(xué)所有班級中抽取從某一所大學(xué)所有班級中抽取3 3個班級作為樣本個班級作為樣本該校所有班級的名單該校所有班級的名單浙江工業(yè)大學(xué)浙江工業(yè)大學(xué)社會調(diào)查方法社會調(diào)查方法6.6.參數(shù)值參數(shù)值(Parameter)(Parameter) 也稱總體值,是關(guān)于總體中某一變量的綜合描述。也稱總體值,是關(guān)于總體中某一變量的綜合描述。如:某廠職工的平均收入、平均年齡如:某廠職工的平均收入、平均年齡7.7.統(tǒng)計值統(tǒng)計值(StatisticStatistic) 也
10、稱樣本值,是關(guān)于樣本中某一變量的綜合描述。也稱樣本值,是關(guān)于樣本中某一變量的綜合描述。 如:某廠職工中抽取出一部分,得到的平均收入、平均年齡如:某廠職工中抽取出一部分,得到的平均收入、平均年齡參數(shù)值與統(tǒng)計值之間的區(qū)別與聯(lián)系:參數(shù)值與統(tǒng)計值之間的區(qū)別與聯(lián)系:(1)(1)參數(shù)值是確定不變的、唯一的,并且通常是未知的。參數(shù)值是確定不變的、唯一的,并且通常是未知的。(2)(2)統(tǒng)計值則是變化的,即對于同一個總體來說,不同樣本所得到的統(tǒng)計值統(tǒng)計值則是變化的,即對于同一個總體來說,不同樣本所得到的統(tǒng)計值常常是有差別的;對于某一個特定的樣本來說,統(tǒng)計值是已知的,是可以常常是有差別的;對于某一個特定的樣本來說
11、,統(tǒng)計值是已知的,是可以通過計算得到的。通過計算得到的。(3)(3)聯(lián)系:通過樣本統(tǒng)計值可以推算總體參數(shù)值,從而達到調(diào)查部分以認識聯(lián)系:通過樣本統(tǒng)計值可以推算總體參數(shù)值,從而達到調(diào)查部分以認識總體的目的。這就是抽樣調(diào)查的作用所在。總體的目的。這就是抽樣調(diào)查的作用所在。 浙江工業(yè)大學(xué)浙江工業(yè)大學(xué)社會調(diào)查方法社會調(diào)查方法8.8.抽樣誤差抽樣誤差(Sampling ErrorSampling Error) 是指在用樣本統(tǒng)計值去推估總體參數(shù)值時所存在的偏差。它是由是指在用樣本統(tǒng)計值去推估總體參數(shù)值時所存在的偏差。它是由抽樣本身的隨機性引起的,是不可避免的。但是抽樣誤差的大小抽樣本身的隨機性引起的,是不
12、可避免的。但是抽樣誤差的大小是控制的。是控制的。 抽樣誤差的意義:是衡量樣本代表性好壞的標(biāo)準(zhǔn),抽樣誤差越小,抽樣誤差的意義:是衡量樣本代表性好壞的標(biāo)準(zhǔn),抽樣誤差越小,說明樣本的代表性越好,反之,則越不好。說明樣本的代表性越好,反之,則越不好。 浙江工業(yè)大學(xué)浙江工業(yè)大學(xué)社會調(diào)查方法社會調(diào)查方法9.9.置信水平與置信區(qū)間置信水平與置信區(qū)間(1 1)置信水平()置信水平(Confidence LevelConfidence Level) 也稱置信度,指的是總體參數(shù)值落在樣本統(tǒng)計值某一區(qū)間內(nèi)的概率。也稱置信度,指的是總體參數(shù)值落在樣本統(tǒng)計值某一區(qū)間內(nèi)的概率。 (2 2)置信區(qū)間()置信區(qū)間(Confi
13、dence IntervalConfidence Interval) 是指在一定范圍的置信水平下,樣本統(tǒng)計值與總體參數(shù)值之間的誤差范圍是指在一定范圍的置信水平下,樣本統(tǒng)計值與總體參數(shù)值之間的誤差范圍(3 3)置信水平與)置信水平與置信區(qū)間的關(guān)系的關(guān)系置信水平反映的是抽樣的可靠性程度,置信區(qū)間反映的是抽樣的精確性程置信水平反映的是抽樣的可靠性程度,置信區(qū)間反映的是抽樣的精確性程度。度。在其他條件不變的情況下,置信水平越高,置信區(qū)間越大;置信水平越低,在其他條件不變的情況下,置信水平越高,置信區(qū)間越大;置信水平越低,置信區(qū)間越小。對抽樣的可靠性程度要求越高,抽樣的精確性程度將越置信區(qū)間越小。對抽樣
14、的可靠性程度要求越高,抽樣的精確性程度將越低;對抽樣的可靠性程度要求越低,則抽樣的精確性程度將越高。低;對抽樣的可靠性程度要求越低,則抽樣的精確性程度將越高。浙江工業(yè)大學(xué)浙江工業(yè)大學(xué)社會調(diào)查方法社會調(diào)查方法抽樣的有關(guān)術(shù)語抽樣的有關(guān)術(shù)語抽樣的基本程序抽樣的基本程序抽樣類型(方法)抽樣類型(方法)樣本規(guī)模與抽樣誤差樣本規(guī)模與抽樣誤差1234浙江工業(yè)大學(xué)浙江工業(yè)大學(xué)社會調(diào)查方法社會調(diào)查方法二、抽樣的基本程序二、抽樣的基本程序(一)界定總體(一)界定總體 即在具體抽樣前,對從中抽取樣本的總體范圍作出明確的即在具體抽樣前,對從中抽取樣本的總體范圍作出明確的界定。界定。為什么要對總體進行界定?為什么要對總
15、體進行界定? 原因之一:是由抽樣調(diào)查的目的決定的,其目的是調(diào)查部原因之一:是由抽樣調(diào)查的目的決定的,其目的是調(diào)查部分以反映總體。分以反映總體。 原因之二:界定總體是達到良好的抽樣效果的前提條件。原因之二:界定總體是達到良好的抽樣效果的前提條件。 例如:例如: 19361936年美國總統(tǒng)大選前年美國總統(tǒng)大選前文學(xué)文摘文學(xué)文摘雜志的抽樣雜志的抽樣 浙江工業(yè)大學(xué)浙江工業(yè)大學(xué)社會調(diào)查方法社會調(diào)查方法思考思考 美國的美國的文學(xué)文摘文學(xué)文摘是一本是一本18901890年年19381938年間在美國發(fā)行頗為年間在美國發(fā)行頗為流行的新聞雜志。流行的新聞雜志。19201920年、年、19241924、19281
16、928、19321932年的美國總統(tǒng)大選前都年的美國總統(tǒng)大選前都作出了準(zhǔn)確的預(yù)測。作出了準(zhǔn)確的預(yù)測。19361936,文學(xué)文摘文學(xué)文摘進行了一次最具雄心的民意進行了一次最具雄心的民意測驗活動:選票寄給了從測驗活動:選票寄給了從電話簿電話簿與車牌登記單中挑選出來的與車牌登記單中挑選出來的10001000萬人。萬人。收到了收到了200200萬人以上的回應(yīng);結(jié)果顯示,有萬人以上的回應(yīng);結(jié)果顯示,有57%57%人支持共產(chǎn)黨候選人阿人支持共產(chǎn)黨候選人阿爾夫爾夫蘭登,而當(dāng)時在任的美國總統(tǒng)富蘭克林蘭登,而當(dāng)時在任的美國總統(tǒng)富蘭克林羅斯福的支持率為羅斯福的支持率為43%43%。 兩個星期以后全民選舉的結(jié)果出來
17、了,羅斯福以歷史上最大的優(yōu)兩個星期以后全民選舉的結(jié)果出來了,羅斯福以歷史上最大的優(yōu)勢勢61%61%的得票率獲得第二屆任期。的得票率獲得第二屆任期。v 思考:為什么思考:為什么文學(xué)文摘文學(xué)文摘的預(yù)測會失?。康念A(yù)測會失???浙江工業(yè)大學(xué)浙江工業(yè)大學(xué)社會調(diào)查方法社會調(diào)查方法(二)選擇抽樣的具體方法,確定抽樣的精確性程度與樣本(二)選擇抽樣的具體方法,確定抽樣的精確性程度與樣本規(guī)模規(guī)模如何確定抽樣的精確性和樣本規(guī)模(待)如何確定抽樣的精確性和樣本規(guī)模(待)(三)制作抽樣框(回顧什么是抽樣框)(三)制作抽樣框(回顧什么是抽樣框) 當(dāng)采用一次性抽樣時,應(yīng)依據(jù)已經(jīng)明確界定的總體范圍,當(dāng)采用一次性抽樣時,應(yīng)依據(jù)
18、已經(jīng)明確界定的總體范圍,收集總體中全部抽樣單位的名單,并對名單按隨機原則進收集總體中全部抽樣單位的名單,并對名單按隨機原則進行統(tǒng)一編號,建立起供抽樣使用的抽樣框。行統(tǒng)一編號,建立起供抽樣使用的抽樣框。例如:我們要在浙江工業(yè)大學(xué)進行一項該校學(xué)生職業(yè)觀的例如:我們要在浙江工業(yè)大學(xué)進行一項該校學(xué)生職業(yè)觀的抽樣調(diào)查。抽樣調(diào)查。注意:當(dāng)采取多級抽樣時,則需制作多個抽樣框。注意:當(dāng)采取多級抽樣時,則需制作多個抽樣框。 例如:為了了解某市小學(xué)生的學(xué)習(xí)情況,需要從全市例如:為了了解某市小學(xué)生的學(xué)習(xí)情況,需要從全市500500所小學(xué)中抽取所小學(xué)中抽取500500名小學(xué)生調(diào)查。名小學(xué)生調(diào)查。浙江工業(yè)大學(xué)浙江工業(yè)大
19、學(xué)社會調(diào)查方法社會調(diào)查方法準(zhǔn)確的抽樣框原則:準(zhǔn)確的抽樣框原則:1 1、完整性、完整性2 2、不重復(fù)性、不重復(fù)性 例如:例如: 在城市居民戶的抽樣中,會經(jīng)常出現(xiàn)一戶有多處住房的在城市居民戶的抽樣中,會經(jīng)常出現(xiàn)一戶有多處住房的情況,這樣很容易把一戶重復(fù)列入抽樣框,使得他們在抽情況,這樣很容易把一戶重復(fù)列入抽樣框,使得他們在抽樣中的中選概率高于其他居民,相反,許多城市居民居住樣中的中選概率高于其他居民,相反,許多城市居民居住條件比較差,很多居民同住在一個門牌號中,因此很容易條件比較差,很多居民同住在一個門牌號中,因此很容易遺漏。兩種情況均違背了隨機抽樣的等概率原則。遺漏。兩種情況均違背了隨機抽樣的等
20、概率原則。浙江工業(yè)大學(xué)浙江工業(yè)大學(xué)社會調(diào)查方法社會調(diào)查方法(四)實際抽取樣本(四)實際抽取樣本 即在前進幾個步驟的基礎(chǔ)上,嚴(yán)格按照所選定的抽樣方法,從抽樣框中抽即在前進幾個步驟的基礎(chǔ)上,嚴(yán)格按照所選定的抽樣方法,從抽樣框中抽取一個個抽樣單位,構(gòu)成調(diào)查樣本。取一個個抽樣單位,構(gòu)成調(diào)查樣本。 (五)評估樣本質(zhì)量(五)評估樣本質(zhì)量 所謂樣本評估,就是對樣本的質(zhì)量、代表性、偏差等進行初步的檢驗和衡所謂樣本評估,就是對樣本的質(zhì)量、代表性、偏差等進行初步的檢驗和衡量,其目的是防止由于前面步驟中的失誤而使樣本偏差太大,進而導(dǎo)致量,其目的是防止由于前面步驟中的失誤而使樣本偏差太大,進而導(dǎo)致整個調(diào)查的失誤。整個
21、調(diào)查的失誤。 評估樣本的基本方法評估樣本的基本方法:將可得到的反映總體中某些重要特征及其分布的資:將可得到的反映總體中某些重要特征及其分布的資料與樣本中的同類指標(biāo)的資料進行對比。若二者之間的差別很小,則可料與樣本中的同類指標(biāo)的資料進行對比。若二者之間的差別很小,則可認為樣本的質(zhì)量較高,代表性較好;反之,若二者之間的差別十分明顯,認為樣本的質(zhì)量較高,代表性較好;反之,若二者之間的差別十分明顯,則表明樣本的質(zhì)量和代表性不可能高。因而需要對前面的抽樣步驟進行則表明樣本的質(zhì)量和代表性不可能高。因而需要對前面的抽樣步驟進行檢查、修正,直到抽出質(zhì)量較高、代表性較好的樣本為止。檢查、修正,直到抽出質(zhì)量較高、
22、代表性較好的樣本為止。 浙江工業(yè)大學(xué)浙江工業(yè)大學(xué)社會調(diào)查方法社會調(diào)查方法例如:例如: 從我從我校校30003000名學(xué)生中抽取名學(xué)生中抽取300300名學(xué)生作為樣本。同時,名學(xué)生作為樣本。同時,我們從學(xué)我們從學(xué)校校教務(wù)處或?qū)W生處得到下列統(tǒng)計資料:全教務(wù)處或?qū)W生處得到下列統(tǒng)計資料:全校校男生男生占學(xué)生總數(shù)的占學(xué)生總數(shù)的53%53%,女生占,女生占47%47%;本市學(xué)生占本市學(xué)生占40%40%,外省學(xué),外省學(xué)生占生占60%60%。那么,我們可以對抽出的。那么,我們可以對抽出的300300名學(xué)生進行這兩方名學(xué)生進行這兩方面分布情況的統(tǒng)計。假定樣本統(tǒng)計得到的結(jié)果是:面分布情況的統(tǒng)計。假定樣本統(tǒng)計得到的
23、結(jié)果是:男生占男生占52%52%, ,女生占女生占48%48%;本市學(xué)生占本市學(xué)生占41%41%, ,外省學(xué)生占外省學(xué)生占59%59%。兩相對。兩相對比,可以發(fā)現(xiàn)二者之間的差距很小,這就在一定程度上說比,可以發(fā)現(xiàn)二者之間的差距很小,這就在一定程度上說明,樣本的質(zhì)量較高,代表性較好,從這樣的樣本中得到明,樣本的質(zhì)量較高,代表性較好,從這樣的樣本中得到的結(jié)果往往能較好地反映和體現(xiàn)總體的情況。的結(jié)果往往能較好地反映和體現(xiàn)總體的情況。浙江工業(yè)大學(xué)浙江工業(yè)大學(xué)社會調(diào)查方法社會調(diào)查方法抽樣的有關(guān)術(shù)語抽樣的有關(guān)術(shù)語抽樣的基本程序抽樣的基本程序抽樣類型(方法)抽樣類型(方法)樣本規(guī)模與抽樣誤差樣本規(guī)模與抽樣誤
24、差1234浙江工業(yè)大學(xué)浙江工業(yè)大學(xué)社會調(diào)查方法社會調(diào)查方法三、抽樣類型 根據(jù)調(diào)查總體中每一個個體有無同等的機會入選樣本,根據(jù)調(diào)查總體中每一個個體有無同等的機會入選樣本,可以將抽樣分為概率抽樣與非概率抽樣兩大類??梢詫⒊闃臃譃楦怕食闃优c非概率抽樣兩大類。 概率抽樣概率抽樣是依據(jù)概率論的原理,按照是依據(jù)概率論的原理,按照等概率原則等概率原則進行進行的抽樣,因而它能夠避免抽樣過程中的人為誤差,保證樣的抽樣,因而它能夠避免抽樣過程中的人為誤差,保證樣本的代表性。此法在社會調(diào)查最常用。本的代表性。此法在社會調(diào)查最常用。 非概率抽樣非概率抽樣主要是依據(jù)研究者的主觀意愿、主觀判斷主要是依據(jù)研究者的主觀意愿、
25、主觀判斷或是否方便等因素來抽取調(diào)查對象,它或是否方便等因素來抽取調(diào)查對象,它不考慮抽樣中是否不考慮抽樣中是否等概率等概率,因而往往產(chǎn)生較大的誤差,難以保證樣本的代表,因而往往產(chǎn)生較大的誤差,難以保證樣本的代表性。此法在社會調(diào)查中用得較少。性。此法在社會調(diào)查中用得較少。浙江工業(yè)大學(xué)浙江工業(yè)大學(xué)社會調(diào)查方法社會調(diào)查方法根據(jù)抽取調(diào)查對象的具體方式的不同,又可分將概率抽樣與非概率抽樣分為若干小類,具體分類如下圖所示。 簡單隨機 系統(tǒng)抽樣 概率抽樣 分層抽樣 整群抽樣抽樣方法 多段抽樣 偶遇抽樣 非概率抽樣 判斷抽樣 定額抽樣 雪球抽樣 probability sample Non-probabilit
26、y sample sample浙江工業(yè)大學(xué)浙江工業(yè)大學(xué)社會調(diào)查方法社會調(diào)查方法(一)概率抽樣1 1、簡單隨機抽樣(、簡單隨機抽樣(Simple Random Sampling)概念:它是按等概率原則直接從含有概念:它是按等概率原則直接從含有N N個個體的總體中抽取個個體的總體中抽取n n個個體組成樣本個個體組成樣本(N nN n)。其典型就是抽簽。)。其典型就是抽簽。方法:一是抽簽;二是利用隨機數(shù)表來抽樣。方法:一是抽簽;二是利用隨機數(shù)表來抽樣。利用隨機數(shù)表進行抽樣的具體步驟是:利用隨機數(shù)表進行抽樣的具體步驟是:(1 1)先取得一份調(diào)查總體所有個體的名單(即抽樣框);)先取得一份調(diào)查總體所有個
27、體的名單(即抽樣框);(2 2)將總體中所有個體一一按順序編號;)將總體中所有個體一一按順序編號;(3 3)根據(jù)總體規(guī)模是幾位數(shù)來確定從隨機數(shù)表中選幾位數(shù)碼;)根據(jù)總體規(guī)模是幾位數(shù)來確定從隨機數(shù)表中選幾位數(shù)碼;(4 4)以總體規(guī)模為標(biāo)準(zhǔn),對隨機數(shù)表中的數(shù)碼逐一進行衡量并決定取舍;)以總體規(guī)模為標(biāo)準(zhǔn),對隨機數(shù)表中的數(shù)碼逐一進行衡量并決定取舍;(5 5)根據(jù)樣本規(guī)模的要求選擇出足夠的數(shù)碼個數(shù);)根據(jù)樣本規(guī)模的要求選擇出足夠的數(shù)碼個數(shù);(6 6)依據(jù)從隨機數(shù)表中選出的數(shù)碼,到抽樣框中去找出它所對應(yīng)的個體。這)依據(jù)從隨機數(shù)表中選出的數(shù)碼,到抽樣框中去找出它所對應(yīng)的個體。這些個案的集合就構(gòu)成樣本。些個案
28、的集合就構(gòu)成樣本。適用范圍:總體單位數(shù)目和所需樣本數(shù)目都比較少。適用范圍:總體單位數(shù)目和所需樣本數(shù)目都比較少。例:某總體共例:某總體共60006000人,現(xiàn)需要從中抽取人,現(xiàn)需要從中抽取300300名作為樣本進行調(diào)查,運用隨機數(shù)名作為樣本進行調(diào)查,運用隨機數(shù)表法。表法。浙江工業(yè)大學(xué)浙江工業(yè)大學(xué)社會調(diào)查方法社會調(diào)查方法2 2、系統(tǒng)抽樣(、系統(tǒng)抽樣(Systematic Sampling)概念:是把總體中的個體進行隨機編號并排序,再計算出某種間隔,然后概念:是把總體中的個體進行隨機編號并排序,再計算出某種間隔,然后按這一固定的間隔抽取個體的號碼來組成樣本的方法。按這一固定的間隔抽取個體的號碼來組成
29、樣本的方法。具體步驟:具體步驟:(1 1)給總體中的每一個個體隨機編上號碼并按號碼排序,即制作抽樣框;)給總體中的每一個個體隨機編上號碼并按號碼排序,即制作抽樣框;(2 2)計算出抽樣間距,公式為:)計算出抽樣間距,公式為: K=N/nK=N/n(K K抽樣間隔,抽樣間隔,N N總體規(guī)模,總體規(guī)模,n n樣本規(guī)模);樣本規(guī)模);(3 3)在最前面的)在最前面的K K個個體中,隨機抽取一個個體,并記號其編號(假定為個個體中,隨機抽取一個個體,并記號其編號(假定為A A),作為隨機起點;),作為隨機起點;(4 4)在抽樣框中,自)在抽樣框中,自A A開始,每隔開始,每隔K K個個體抽取一個個體,即
30、所抽取個體的個個體抽取一個個體,即所抽取個體的編號分別為編號分別為A A,A AK K,A A2K2K,A A(n n1 1)K K;(5 5)將這)將這n n個個體合起來,就構(gòu)成了該總體的一個樣本。個個體合起來,就構(gòu)成了該總體的一個樣本。浙江工業(yè)大學(xué)浙江工業(yè)大學(xué)社會調(diào)查方法社會調(diào)查方法v 例如:例如: 某某學(xué)院學(xué)院共有共有1 1000000名學(xué)生,要抽取一個容量為名學(xué)生,要抽取一個容量為100100的大學(xué)生的大學(xué)生樣本,使用系統(tǒng)抽樣的方法如何抽取。樣本,使用系統(tǒng)抽樣的方法如何抽取。v 課堂練習(xí):課堂練習(xí): 現(xiàn)要對某一產(chǎn)品的口味進行測試,需要從調(diào)查總體的現(xiàn)要對某一產(chǎn)品的口味進行測試,需要從調(diào)查
31、總體的150150人中抽取人中抽取1212人進行測試,請使用系統(tǒng)抽樣的方法抽取樣本。人進行測試,請使用系統(tǒng)抽樣的方法抽取樣本。?思考:如果總體的個體數(shù)不能被樣本容量整除時,如何處思考:如果總體的個體數(shù)不能被樣本容量整除時,如何處理?理?浙江工業(yè)大學(xué)浙江工業(yè)大學(xué)社會調(diào)查方法社會調(diào)查方法001011021031091002012022032092003013023033093004014024034094005015025035095006016026.096007017027097008018028098009019029099010020030100浙江工業(yè)大學(xué)浙江工業(yè)大學(xué)社會調(diào)查方法社會調(diào)查
32、方法注意:一般不選用系統(tǒng)抽樣方法的情況。注意:一般不選用系統(tǒng)抽樣方法的情況。(1 1)在總體的名單中,個體的排列具有次序上的先)在總體的名單中,個體的排列具有次序上的先后和等級上的高低的時候。后和等級上的高低的時候。 (2 2)在總體名單中,個體的排列上有與抽樣間隔相)在總體名單中,個體的排列上有與抽樣間隔相對應(yīng)的周期性分布的情況。對應(yīng)的周期性分布的情況。 適用范圍:總體數(shù)量不大,個體排列無次序性和適用范圍:總體數(shù)量不大,個體排列無次序性和周期性。周期性。 浙江工業(yè)大學(xué)浙江工業(yè)大學(xué)社會調(diào)查方法社會調(diào)查方法3 3、分層抽樣、分層抽樣(Stratified Sampling)概念:是先將總體中的所
33、有個體按概念:是先將總體中的所有個體按某種特征或標(biāo)志劃分為若干類型,某種特征或標(biāo)志劃分為若干類型,然后再在各類型中采用簡單隨機抽然后再在各類型中采用簡單隨機抽樣或系統(tǒng)抽樣的方法抽取一個子樣樣或系統(tǒng)抽樣的方法抽取一個子樣本,最后將這些子樣本合起來構(gòu)成本,最后將這些子樣本合起來構(gòu)成總體的一個樣本??傮w的一個樣本。NN2N1N3n1n2n3n其中,其中,N N為總體,為總體,N Ni i為子總體,為子總體,n n為樣本,為樣本,n ni i為子樣本為子樣本浙江工業(yè)大學(xué)浙江工業(yè)大學(xué)社會調(diào)查方法社會調(diào)查方法具體步驟:具體步驟:(1 1)確定分類標(biāo)準(zhǔn),如性別、年齡、地區(qū)等。)確定分類標(biāo)準(zhǔn),如性別、年齡、地
34、區(qū)等。(2 2)按確定的標(biāo)準(zhǔn)將總體單位分為若干類型。)按確定的標(biāo)準(zhǔn)將總體單位分為若干類型。(3 3)計算各類型單位數(shù)量占總體單位數(shù)量的比重。)計算各類型單位數(shù)量占總體單位數(shù)量的比重。 設(shè)設(shè)總體單位數(shù)為總體單位數(shù)為N N,各類型單位數(shù)為,各類型單位數(shù)為NiNi,各類型各類型單位數(shù)占總體單位數(shù)占總體單位數(shù)的單位數(shù)的比重為比重為RiRi。公式:公式: Ri= Ni/N Ri= Ni/N(4 4)根據(jù))根據(jù)RiRi計算出各類型中應(yīng)抽取樣本單位的數(shù)量。計算出各類型中應(yīng)抽取樣本單位的數(shù)量。設(shè)各類型的樣本單位數(shù)為設(shè)各類型的樣本單位數(shù)為nini,所需抽取的樣本總數(shù)為,所需抽取的樣本總數(shù)為n n。公式:公式:
35、ni= n ni= nRiRi(5 5)按簡單隨機抽樣或系統(tǒng)抽樣方法從各類型中按比例抽取樣)按簡單隨機抽樣或系統(tǒng)抽樣方法從各類型中按比例抽取樣本。本。 浙江工業(yè)大學(xué)浙江工業(yè)大學(xué)社會調(diào)查方法社會調(diào)查方法分類分類隨機隨機抽樣抽樣總體總體樣本樣本子群子群浙江工業(yè)大學(xué)浙江工業(yè)大學(xué)社會調(diào)查方法社會調(diào)查方法例如:某省例如:某省10001000個鄉(xiāng),其中山區(qū)鄉(xiāng)個鄉(xiāng),其中山區(qū)鄉(xiāng)500500個,丘陵鄉(xiāng)個,丘陵鄉(xiāng)300300個,平原鄉(xiāng)個,平原鄉(xiāng)200200個,現(xiàn)個,現(xiàn)在要抽取在要抽取100100個鄉(xiāng)進行調(diào)查,如何運用分層抽樣來抽取樣本?個鄉(xiāng)進行調(diào)查,如何運用分層抽樣來抽取樣本? 解:設(shè)山區(qū)解:設(shè)山區(qū)i=1,i=1
36、,丘陵丘陵i=2,i=2,平原平原i=3i=3 R1=N1/N R1=N1/N100100=500/1000=500/1000100100=50=50 R2=N2/N R2=N2/N100100=300/1000=300/1000100100=30=30 R3=N3/N R3=N3/N100100=200/1000=200/1000100100=20=20 n1=R1n1=R1n=50n=50100=50100=50 n2=R2 n2=R2n=30n=30100=30100=30 n3=R3 n3=R3n=20n=20100=20100=20 即從即從500500個山區(qū)鄉(xiāng)中抽取個山區(qū)鄉(xiāng)中抽取5
37、050個,從個,從300300個丘陵鄉(xiāng)中抽取個丘陵鄉(xiāng)中抽取3030個,從個,從200200個平原鄉(xiāng)個平原鄉(xiāng)中抽取中抽取2020個。其中各階段均使用簡單隨機抽樣的方法進行。個。其中各階段均使用簡單隨機抽樣的方法進行。浙江工業(yè)大學(xué)浙江工業(yè)大學(xué)社會調(diào)查方法社會調(diào)查方法課堂練習(xí):課堂練習(xí): 某地共有居民某地共有居民2000020000戶,其中高收入居民戶,其中高收入居民40004000戶,戶,中等收入居民中等收入居民1200012000戶,低收入居民戶,低收入居民40004000戶,現(xiàn)要從戶,現(xiàn)要從中抽取中抽取500500戶做購買力調(diào)查,如何運用分層抽樣抽取戶做購買力調(diào)查,如何運用分層抽樣抽取樣本?樣
38、本?浙江工業(yè)大學(xué)浙江工業(yè)大學(xué)社會調(diào)查方法社會調(diào)查方法優(yōu)點:優(yōu)點:(1 1)可以在不增加樣本規(guī)模的前提下,降低抽樣誤差,提高抽樣的精度。)可以在不增加樣本規(guī)模的前提下,降低抽樣誤差,提高抽樣的精度。(2 2)便于了解總體內(nèi)不同層次的情況,便于對總體中不同層次和類別進行單獨)便于了解總體內(nèi)不同層次的情況,便于對總體中不同層次和類別進行單獨研究,或進行比較。研究,或進行比較。注意:注意:(1 1)分層標(biāo)準(zhǔn):)分層標(biāo)準(zhǔn):A.A.以調(diào)查所要分析和研究的主要變量或相關(guān)的變量作為分層標(biāo)準(zhǔn);以調(diào)查所要分析和研究的主要變量或相關(guān)的變量作為分層標(biāo)準(zhǔn);B.B.以保證各層內(nèi)部同質(zhì)性強,各層之間異質(zhì)性強、突出總體內(nèi)在結(jié)
39、構(gòu)的變量作以保證各層內(nèi)部同質(zhì)性強,各層之間異質(zhì)性強、突出總體內(nèi)在結(jié)構(gòu)的變量作為分層標(biāo)準(zhǔn);為分層標(biāo)準(zhǔn);C.C.以那些已有明顯層次區(qū)分的變量作為分層變量。以那些已有明顯層次區(qū)分的變量作為分層變量。浙江工業(yè)大學(xué)浙江工業(yè)大學(xué)社會調(diào)查方法社會調(diào)查方法(2)(2)分層比例:分層比例:A.A.按比例分層按比例分層B.B.不按比例分層不按比例分層在用樣本資料去推斷總體時,要調(diào)整樣在用樣本資料去推斷總體時,要調(diào)整樣本中各層的比例,使數(shù)據(jù)資料恢復(fù)到總體中各層實際的比本中各層的比例,使數(shù)據(jù)資料恢復(fù)到總體中各層實際的比例結(jié)構(gòu)。例結(jié)構(gòu)。 例如:例如: 某廠有工人某廠有工人600600人,按性別分層則有男工人,按性別分層
40、則有男工500500人,女工人,女工100100人,現(xiàn)要抽取人,現(xiàn)要抽取6060人作為樣本進行調(diào)查,分別按比例分層和人作為樣本進行調(diào)查,分別按比例分層和不按比例分層抽樣。不按比例分層抽樣。適用范圍:總體單位數(shù)量較多,單位之間差異性較大適用范圍:總體單位數(shù)量較多,單位之間差異性較大。浙江工業(yè)大學(xué)浙江工業(yè)大學(xué)社會調(diào)查方法社會調(diào)查方法4 4、整群抽樣(、整群抽樣(Cluster Sampling) 思考:思考: 某高中有某高中有80008000名學(xué)生,分為名學(xué)生,分為200200個班級,每班有個班級,每班有4040名學(xué)名學(xué)生,現(xiàn)在要從中抽取生,現(xiàn)在要從中抽取400400名學(xué)生調(diào)查本校學(xué)生消費情況,名
41、學(xué)生調(diào)查本校學(xué)生消費情況,問:使用簡單隨機抽樣方法和系統(tǒng)抽樣方法分別如何抽取問:使用簡單隨機抽樣方法和系統(tǒng)抽樣方法分別如何抽取樣本?除了使用以上方法,還能怎樣抽取樣本?樣本?除了使用以上方法,還能怎樣抽取樣本? 浙江工業(yè)大學(xué)浙江工業(yè)大學(xué)社會調(diào)查方法社會調(diào)查方法概念:是從總體中隨機抽取一些小群體,概念:是從總體中隨機抽取一些小群體,然后由所抽出的若干個小群體內(nèi)的所有然后由所抽出的若干個小群體內(nèi)的所有元素構(gòu)成調(diào)查的一個樣本。元素構(gòu)成調(diào)查的一個樣本。其中,其中,N N為總體,為總體,NiNi為子總體,為子總體,n n為樣本為樣本浙江工業(yè)大學(xué)浙江工業(yè)大學(xué)社會調(diào)查方法社會調(diào)查方法劃分劃分子群子群隨機隨機
42、抽樣抽樣浙江工業(yè)大學(xué)浙江工業(yè)大學(xué)社會調(diào)查方法社會調(diào)查方法整群抽樣與前幾種抽樣方法的最大區(qū)別在于,它的抽樣單位整群抽樣與前幾種抽樣方法的最大區(qū)別在于,它的抽樣單位不是單個的個體,而是不是單個的個體,而是成群的個體成群的個體。具體步驟:具體步驟:1 1、將總體各單位按一定標(biāo)準(zhǔn)劃分為若干群體。、將總體各單位按一定標(biāo)準(zhǔn)劃分為若干群體。2 2、以群為單位,從整體中抽取部分群(數(shù)量確定)、以群為單位,從整體中抽取部分群(數(shù)量確定)3 3、將這些群中的、將這些群中的所有個體所有個體合起來,形成總體的一個樣本。合起來,形成總體的一個樣本。浙江工業(yè)大學(xué)浙江工業(yè)大學(xué)社會調(diào)查方法社會調(diào)查方法特點:特點:(1 1)優(yōu)
43、點:可簡化抽樣的過程,降低調(diào)查中收集資料的費用,同)優(yōu)點:可簡化抽樣的過程,降低調(diào)查中收集資料的費用,同時還能相對地擴大抽樣的應(yīng)用范圍。時還能相對地擴大抽樣的應(yīng)用范圍。(2 2)缺點:是樣本的分布面不廣,樣本對總體的代表性相對較差。)缺點:是樣本的分布面不廣,樣本對總體的代表性相對較差。 (解釋:在(解釋:在9595的置信度下,置信區(qū)間為的置信度下,置信區(qū)間為3 3這一范圍,簡單隨這一范圍,簡單隨機抽樣機抽樣500500個個體,整群抽樣個個體,整群抽樣800800個個體。)個個體。)整群抽樣的應(yīng)用范圍較廣,在簡單隨機抽樣與系統(tǒng)抽樣中,都要整群抽樣的應(yīng)用范圍較廣,在簡單隨機抽樣與系統(tǒng)抽樣中,都要
44、求有一份總體所有成員的名單,即抽樣框。但在實際調(diào)查過程中,求有一份總體所有成員的名單,即抽樣框。但在實際調(diào)查過程中,這樣的名單往往難獲得,此時可采用整群抽樣來解決問題。這樣的名單往往難獲得,此時可采用整群抽樣來解決問題。適用范圍:總體規(guī)模較大,各群體之間差異性不大,而群體內(nèi)部適用范圍:總體規(guī)模較大,各群體之間差異性不大,而群體內(nèi)部個體之間差異性較大。個體之間差異性較大。浙江工業(yè)大學(xué)浙江工業(yè)大學(xué)社會調(diào)查方法社會調(diào)查方法思考:分層抽樣與整群抽樣的適用范圍有何不同?為思考:分層抽樣與整群抽樣的適用范圍有何不同?為什么?什么? 當(dāng)群間同質(zhì)性高,群內(nèi)異質(zhì)性高時,適合于采用整群抽樣的方法當(dāng)群間同質(zhì)性高,群
45、內(nèi)異質(zhì)性高時,適合于采用整群抽樣的方法當(dāng)群間異質(zhì)性高,群內(nèi)同質(zhì)性高時,則適于采用分層抽樣的方法當(dāng)群間異質(zhì)性高,群內(nèi)同質(zhì)性高時,則適于采用分層抽樣的方法浙江工業(yè)大學(xué)浙江工業(yè)大學(xué)社會調(diào)查方法社會調(diào)查方法課堂練習(xí): 某中學(xué)有某中學(xué)有48004800名學(xué)生,分為名學(xué)生,分為4 4個年級,個年級,8080個班,現(xiàn)在要抽取個班,現(xiàn)在要抽取480480名學(xué)生進行學(xué)生身體名學(xué)生進行學(xué)生身體健康狀況調(diào)查,運用簡單隨機抽樣、系統(tǒng)健康狀況調(diào)查,運用簡單隨機抽樣、系統(tǒng)抽樣、分層抽樣和整群抽樣的方法分別如抽樣、分層抽樣和整群抽樣的方法分別如何抽取樣本?何抽取樣本? 浙江工業(yè)大學(xué)浙江工業(yè)大學(xué)社會調(diào)查方法社會調(diào)查方法5 5
46、、多段抽樣(、多段抽樣(Multi-stage sampling) 按抽樣單位的隸屬關(guān)系或?qū)哟侮P(guān)系,把抽樣分為幾個階段來按抽樣單位的隸屬關(guān)系或?qū)哟侮P(guān)系,把抽樣分為幾個階段來進行。進行。 例如:從全市例如:從全市300300所小學(xué)抽取所小學(xué)抽取300300名小學(xué)生調(diào)查,可以分為幾名小學(xué)生調(diào)查,可以分為幾個階段來進行?每個階段的抽樣單位分別是什么?個階段來進行?每個階段的抽樣單位分別是什么? 優(yōu)點:簡化抽樣過程。優(yōu)點:簡化抽樣過程。 缺點:抽樣誤差大。缺點:抽樣誤差大。 在同等條件下,減少多段抽樣誤差的方法在同等條件下,減少多段抽樣誤差的方法是:是: 適當(dāng)增加開頭階段的樣本數(shù)而相對減少后面階段的樣
47、本數(shù)。適當(dāng)增加開頭階段的樣本數(shù)而相對減少后面階段的樣本數(shù)。浙江工業(yè)大學(xué)浙江工業(yè)大學(xué)社會調(diào)查方法社會調(diào)查方法 例如:某地有例如:某地有2.42.4萬名教師,他們分布在全市萬名教師,他們分布在全市1010個區(qū)的個區(qū)的200200所學(xué)校里,現(xiàn)在要抽取一所學(xué)校里,現(xiàn)在要抽取一個由個由12001200名教師組成的樣本,按照三級抽樣的方法,有以下幾種抽樣方案:名教師組成的樣本,按照三級抽樣的方法,有以下幾種抽樣方案: ? ?思考:思考:1 1、哪一種方案最節(jié)省人力和經(jīng)費?、哪一種方案最節(jié)省人力和經(jīng)費?2 2、哪一種方案得到的樣本精確度最高?、哪一種方案得到的樣本精確度最高?3 3、考慮到實際情況,你在抽樣
48、中會選擇哪種方案?為什么?、考慮到實際情況,你在抽樣中會選擇哪種方案?為什么?第一階段第一階段第二階段第二階段第三階段第三階段方案方案1 11010個區(qū)個區(qū)每個區(qū)抽每個區(qū)抽4 4所學(xué)校所學(xué)校 每所學(xué)校抽每所學(xué)校抽3030名教師名教師 方案方案2 21010個區(qū)個區(qū)每個區(qū)抽每個區(qū)抽2020所學(xué)校所學(xué)校 每所學(xué)校抽每所學(xué)校抽6 6名教師名教師 方案方案3 3從從1010個區(qū)中抽個區(qū)中抽5 5個區(qū)個區(qū) 每個區(qū)抽每個區(qū)抽1212所學(xué)校所學(xué)校 每所學(xué)校抽每所學(xué)校抽2020名教師名教師 方案方案4 4從從1010個區(qū)中抽個區(qū)中抽3 3個區(qū)個區(qū) 每個區(qū)抽每個區(qū)抽1010所學(xué)校所學(xué)校 每所學(xué)校抽每所學(xué)校抽40
49、40名教師名教師 方案方案5 5從從1010個區(qū)中抽個區(qū)中抽1 1個區(qū)個區(qū) 每個區(qū)抽每個區(qū)抽1212所學(xué)校所學(xué)校 每所學(xué)校抽每所學(xué)校抽100100名教名教師師 浙江工業(yè)大學(xué)浙江工業(yè)大學(xué)社會調(diào)查方法社會調(diào)查方法n 假設(shè)我們的總體是全國所有城市的集合,我們要抽取一個規(guī)模為40個城市的樣本。n 若按簡單隨機抽樣或系統(tǒng)抽樣的方法,則首先需要弄到一份全國城市的名單,然后根據(jù)隨機數(shù)表或通過計算抽樣間距直接從抽樣框中抽取城市;n 若按分層抽樣的方法,則可以先按城市規(guī)模將總體分為特大城市、大城市、中等城市和小城市四類,然后分別從每一類中抽取若干城市,并將這些城市合起來構(gòu)成樣本;n 如果采用整群抽樣的方法,則可
50、以以省(自治區(qū),直轄市)為抽樣單位,從全國31個?。ㄗ灾螀^(qū)、直轄市)中隨機抽取三至五個省(自治區(qū)、直轄市),再以所抽中的這些省(自治區(qū)、直轄市)中所包含的全部城市的集合作為樣本。幾種抽樣方法的比較幾種抽樣方法的比較浙江工業(yè)大學(xué)浙江工業(yè)大學(xué)社會調(diào)查方法社會調(diào)查方法五種概率抽樣方法的圖示比較簡單隨機抽樣簡單隨機抽樣浙江工業(yè)大學(xué)浙江工業(yè)大學(xué)社會調(diào)查方法社會調(diào)查方法五種概率抽樣方法的圖示比較不按比例分層不按比例分層按比例分層按比例分層浙江工業(yè)大學(xué)浙江工業(yè)大學(xué)社會調(diào)查方法社會調(diào)查方法五種概率抽樣方法的圖示比較整群抽樣整群抽樣浙江工業(yè)大學(xué)浙江工業(yè)大學(xué)社會調(diào)查方法社會調(diào)查方法五種概率抽樣方法的圖示比較系統(tǒng)抽
51、樣系統(tǒng)抽樣浙江工業(yè)大學(xué)浙江工業(yè)大學(xué)社會調(diào)查方法社會調(diào)查方法五種概率抽樣方法的圖示比較多段抽樣多段抽樣浙江工業(yè)大學(xué)浙江工業(yè)大學(xué)社會調(diào)查方法社會調(diào)查方法6 6、PPSPPS抽樣抽樣 當(dāng)元素的大小不同,或者元素在總體中的地位不同時,我們需要采用不等概率抽樣的方法。比如,從全市幾百家企業(yè)中抽取20家企業(yè)進行調(diào)查時,一個有著數(shù)萬職工的大型企業(yè)與一個只有一二百人的小企業(yè)所占的地位,顯然是很不一樣的。如果此時仍然采用等概率抽樣的方法,則樣本的代表性和精度都會比較差。而如果采用不等概率抽樣的方法,使大的企業(yè)入選樣本的概率大一些,小企業(yè)入選樣本的概率小一些,這樣就可以大大提高估計的精度。 社會研究中最重要、也最
52、常用的一種不等概率抽樣叫做“概率與元素的規(guī)模大小成比例的抽樣”(sampling with probability proportionate to size ),簡稱PPS抽樣。浙江工業(yè)大學(xué)浙江工業(yè)大學(xué)社會調(diào)查方法社會調(diào)查方法v 假設(shè)要從全市100家企業(yè),總共20萬名職工中,抽取1000名職工進行調(diào)查。已知最大的企業(yè)多達16000名職工,而最小的企業(yè)則只有200名職工。v 如果我們采取多段抽樣的方法,先從100家企業(yè)中隨機抽取若干家企業(yè),比如說抽取20家;然后再從這20家企業(yè)中分別抽取50名職工(5020=1000)構(gòu)成樣本。v 第一階段:入選概率是相同的,即都為20100=20%v 第二階
53、段:規(guī)模大的企業(yè)中每個職工被抽中的概率則為20%(5016000)=0.0625%;規(guī)模小的企業(yè)中每個職工被抽中的概率為20%(50200)=5%浙江工業(yè)大學(xué)浙江工業(yè)大學(xué)社會調(diào)查方法社會調(diào)查方法v采用PPS的方法:先將各個元素(即企業(yè))排列起來,然后寫出它們的規(guī)模、計算它們的規(guī)模在總體規(guī)模中所占的比例;將它們的比例累計起來,并根據(jù)比例的累計數(shù)依次寫出每一元素所對應(yīng)的選擇號碼范圍,然后采用隨機數(shù)表的方法或系統(tǒng)抽樣的方法選擇號碼,號碼所對應(yīng)的元素入選第一階段樣本,最后再從所選樣本中進行第二階段抽樣(即從每個被抽中的元素中抽取50名職工)。浙江工業(yè)大學(xué)浙江工業(yè)大學(xué)社會調(diào)查方法社會調(diào)查方法用用PPSP
54、PS方法抽取第一階段樣本舉例方法抽取第一階段樣本舉例序號規(guī)模所占比例累計選擇號碼范圍所選號碼入樣元素企業(yè)1企業(yè)2企業(yè)3企業(yè)4企業(yè)5企業(yè)6企業(yè)7企業(yè)8企業(yè)9企業(yè)10企業(yè)98企業(yè)99企業(yè)1003000200016000200120060008006001400420040018006001.5%1%8%0.1%0.6%3%0.4%0.3%0.7%2.1%0.2%0.9%0.3%1.5%2.5%10.5%10.6%11.2%14.2%14.6%14.9%15.6%17.7%98.8%99.7%100%000-014015-024025-104105106-111112-141142-145146-1
55、48149-155156-176978-987988-996997-999012048、095133148171995元素1元素2、3元素4元素5元素6元素20浙江工業(yè)大學(xué)浙江工業(yè)大學(xué)社會調(diào)查方法社會調(diào)查方法v由于規(guī)模大的企業(yè)其所對應(yīng)的選擇號碼范圍也大,而選樣號碼范圍大時,被抽中的概率也大(有些特別大的企業(yè)還可能抽到不止一個號碼,比如企業(yè)3就抽到兩個號碼。那么在第二階段抽樣中,就要從企業(yè)3中抽取502=100名職工)。由于規(guī)模大的企業(yè)在第一階段抽樣時被抽中的概率大于規(guī)模小的企業(yè),這樣就補償了第二階段抽樣時規(guī)模大的企業(yè)中每個職工被抽中的概率小的情況,使得無論規(guī)模大還是規(guī)模小的企業(yè)中,每個職工總的
56、被抽中的概率都是相等的。所以,這種方法最終抽出的樣本對總體的代表性也大。浙江工業(yè)大學(xué)浙江工業(yè)大學(xué)社會調(diào)查方法社會調(diào)查方法7 7、戶內(nèi)抽樣、戶內(nèi)抽樣戶內(nèi)抽樣的概念 以家庭為單位時,從入選家庭中抽取一個成年人構(gòu)成訪談對象的抽樣方法。方法之一:科什選擇法(kish)方法之二:生日法浙江工業(yè)大學(xué)浙江工業(yè)大學(xué)社會調(diào)查方法社會調(diào)查方法 科什選擇法具體做法:1、調(diào)查表編號表編號AB1B2CDE1E2F表數(shù)量(N)1/61/12 1/121/61/61/121/121/62、印制選擇卡,給每個調(diào)查員發(fā)一套(八種)、印制選擇卡,給每個調(diào)查員發(fā)一套(八種)浙江工業(yè)大學(xué)浙江工業(yè)大學(xué)社會調(diào)查方法社會調(diào)查方法Kish
57、選擇表A 式選擇表如果家庭戶中18歲以上人口數(shù)為被抽選人的序號為11213141516或或以上以上1F 式選擇表如果家庭戶中18歲以上人口數(shù)為被抽選人的序號為11223344556或或以上以上6浙江工業(yè)大學(xué)浙江工業(yè)大學(xué)社會調(diào)查方法社會調(diào)查方法3.給抽中家庭每個成年人進行編號并排序。方法是男性在前、年級大的在前。序號年齡和性別特征1最年長的男性2次年長的男性n最年幼的男性n+1最年長的女性n+2次年長的女性n+m最年幼的女性序號成員特征1爸爸50歲2兒子23歲3奶奶70歲4媽媽48歲5女兒27歲浙江工業(yè)大學(xué)浙江工業(yè)大學(xué)社會調(diào)查方法社會調(diào)查方法4.根據(jù)調(diào)查表上的編號找出編號相同的那種“選擇表”查出
58、中選個體的序號,進行調(diào)查。序號成員特征1爸爸50歲2兒子23歲3奶奶70歲4媽媽48歲5女兒27歲F 式選擇表如果家庭戶中18歲以上人口數(shù)為被抽選人的序號為11223344556或以上6浙江工業(yè)大學(xué)浙江工業(yè)大學(xué)社會調(diào)查方法社會調(diào)查方法 生日法具體做法:1、隨機確定一年中的某一天為標(biāo)準(zhǔn)日前2、了解所抽中的戶中18歲以上的人口數(shù),以及每人的生日3、計算每人的生日距離標(biāo)準(zhǔn)日期的天數(shù)4、從中選出生日距離標(biāo)準(zhǔn)日期最近或最遠的人作為調(diào)查對象浙江工業(yè)大學(xué)浙江工業(yè)大學(xué)社會調(diào)查方法社會調(diào)查方法(二)非概率抽樣1.偶遇抽樣偶遇抽樣(Accidental or Convenience Sampling) 是指研究者
59、根據(jù)現(xiàn)實情況,以自己方便的形式抽取偶然遇到的人作為調(diào)查對象,或者僅僅選擇那些離得最近的、最容易找到的人作為調(diào)查對象2.判斷抽樣判斷抽樣(Judgmental or Purposive Sampling) 是調(diào)查者根據(jù)研究目標(biāo)和自己的主觀分析來選擇和確定調(diào)查對象的方法(對調(diào)查者的要求比較高)。3.定額抽樣定額抽樣(Quota Sampling) 是按調(diào)查對象的某種屬性或特征將總體中所有個體分成若干類或?qū)?,然后在各層中按比例抽樣。抽樣時不要求遵守隨機原則。浙江工業(yè)大學(xué)浙江工業(yè)大學(xué)社會調(diào)查方法社會調(diào)查方法例如:某高校2000名學(xué)生,其中男生60,女生40;文科學(xué)生和理科學(xué)生各占50,一、二、三、四年
60、級學(xué)生分別占40、30、20、10,現(xiàn)用定額抽樣方法依上述三個變數(shù)抽取一個規(guī)模為100的樣本。男生(男生(6060人)人)女生(女生(4040人)人)文科(文科(3030人)人)理科(理科(30人)人)文科(文科(2020人)人)理科(理科(2020人)人)一一 二二 三三 四四一一 二二 三三 四四一一 二二 三三 四四一一 二二 三三 四四12 9 6 312 9 6 312 9 6 312 9 6 38 6 4 28 6 4 28 6 4 28 6 4 2表表1 1001 100個人的定額樣本分布表個人的定額樣本分布表浙江工業(yè)大學(xué)浙江工業(yè)大學(xué)社會調(diào)查方法社會調(diào)查方法課堂練習(xí)v某工廠有某工
溫馨提示
- 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
- 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
- 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
- 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負責(zé)。
- 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請與我們聯(lián)系,我們立即糾正。
- 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時也不承擔(dān)用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。
最新文檔
- 2025銀行擔(dān)保合同
- 2024年電力工程電氣設(shè)備選型與設(shè)計咨詢合同2篇
- 小學(xué)生三年級作文我的媽媽
- 施工員轉(zhuǎn)正自我鑒定9篇
- 地鐵的實習(xí)報告錦集8篇
- 學(xué)校田徑運動會方案
- 高中美術(shù)教學(xué)工作計劃合集6篇
- 語文骨干教師工作總結(jié)
- 2025詳細版?zhèn)}儲合同樣本
- S7-1200PLC應(yīng)用技術(shù)(邵陽學(xué)院)知到智慧樹章節(jié)答案
- 最新標(biāo)點符號用法
- 特困人員生活自理能力評估表
- 預(yù)拌混凝土企業(yè)質(zhì)量管理體系·程序文件
- 外國人換發(fā)或補發(fā)永久居留證件申請表樣本
- 塔吊安裝旁站監(jiān)理記錄表(示范稿)
- GCC認證對整車的一般要求
- OBD-II標(biāo)準(zhǔn)故障代碼表
- 施工現(xiàn)場類安全隱患排查清單表
- 采購項目組織履約、驗收方案、程序、辦法
- 送貨單(三聯(lián)針式打印)
- pdca循環(huán)在護理教學(xué)中的應(yīng)用學(xué)習(xí)教案
評論
0/150
提交評論