抽樣設(shè)計(jì)1-抽樣方案、總體和樣本_第1頁(yè)
抽樣設(shè)計(jì)1-抽樣方案、總體和樣本_第2頁(yè)
抽樣設(shè)計(jì)1-抽樣方案、總體和樣本_第3頁(yè)
抽樣設(shè)計(jì)1-抽樣方案、總體和樣本_第4頁(yè)
抽樣設(shè)計(jì)1-抽樣方案、總體和樣本_第5頁(yè)
已閱讀5頁(yè),還剩26頁(yè)未讀, 繼續(xù)免費(fèi)閱讀

下載本文檔

版權(quán)說(shuō)明:本文檔由用戶(hù)提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請(qǐng)進(jìn)行舉報(bào)或認(rèn)領(lǐng)

文檔簡(jiǎn)介

1、第三部分 抽樣設(shè)計(jì)這是一個(gè)個(gè)很著名名的例子子。1936年,美國(guó)國(guó)總統(tǒng)選選舉前夕夕,兩家家民意測(cè)測(cè)驗(yàn)機(jī)構(gòu)構(gòu)就誰(shuí)將將當(dāng)選總總統(tǒng)進(jìn)行行民意調(diào)調(diào)查。競(jìng)選人黨派得票率F.Roosevelt民主黨60.8A.Landon共和黨31.5W.Lemke小黨調(diào)查結(jié)果果是:共共和黨候候選人Landon將以壓倒倒多數(shù)的的票數(shù)當(dāng)當(dāng)選總統(tǒng)統(tǒng)。文學(xué)文摘摘雜志耗資資50萬(wàn),發(fā)放放1000萬(wàn)份問(wèn)卷卷,回收收200萬(wàn)份。蓋洛普(Gallup)美國(guó)輿輿論研究究所抽了了3000個(gè)選民,預(yù)測(cè)結(jié)結(jié)果是:先來(lái)看一一個(gè)例子子!調(diào)查結(jié)果果是:Roosevelt的得票率率為54,當(dāng)選選為總統(tǒng)統(tǒng)!文學(xué)文摘摘失敗的主主要原因因是:他他們按照照電話

2、簿簿發(fā)放問(wèn)問(wèn)卷,而而當(dāng)時(shí)安安裝了電電話的都都是比較較富有的的人,因因此,他他們所調(diào)調(diào)查的結(jié)結(jié)果僅代代表了比比較富有有的人的的意見(jiàn),樣本缺乏乏代表性性。由這個(gè)例例子可以以看出,科學(xué)地地設(shè)計(jì)抽抽樣方法法很重要要!3.1抽樣方案案設(shè)計(jì)從一定總總體抽取取樣本資資料以前前,預(yù)先先確定抽抽樣程序序和方案案,在保保證所抽抽選的樣樣本對(duì)總總體有充分代表表性的前提下下,力求求取得最經(jīng)濟(jì)最最有效的結(jié)果。抽樣方案案設(shè)計(jì)抽樣方案案設(shè)計(jì)的的內(nèi)容與與步驟確定總體與總體目標(biāo)量確定抽樣方法提出精度要求計(jì)算樣本量確定總體目標(biāo)量的估計(jì)方法和估計(jì)效果制定實(shí)施抽樣方案的辦法和步驟3.2總體與樣樣本1、總體(Population)定義

3、:研究對(duì)象象的全體體分類(lèi):有限總體體和無(wú)限總體體元素的特特點(diǎn):(1)在抽樣樣調(diào)查中中一般考考慮有限限總體,即元素素個(gè)數(shù)有限(2)個(gè)體均均可識(shí)別別2、總體的的目標(biāo)量量總和。如:全國(guó)國(guó)人口總總數(shù)均值。如:全校校學(xué)生每每月的平平均支出出比例:具有某種種特性的的單元在在總體中中占的比比例。如如:對(duì)我我校本科科畢業(yè)生生就業(yè)前前景感到到樂(lè)觀的的同學(xué)的的比例。方差:總體中元元素之間間的變異異程度。如:我我校08級(jí)全體本本科生的的英語(yǔ)水水平的變變異程度度。3、總體的的表示形形式分類(lèi)描述述中山校區(qū)班級(jí)閔行校區(qū)班級(jí)未觀看春晚2510觀看了春晚不超過(guò)2小時(shí)3133觀看了春晚大于等于2小時(shí)3753不清楚743、總體的

4、的表示形形式分布描述述彩電的彩彩色濃度度是彩電電質(zhì)量好好壞的一一個(gè)重要要指標(biāo),它可用用一個(gè)實(shí)實(shí)數(shù)表示示。二十世紀(jì)紀(jì)七十年年代在美國(guó)銷(xiāo)售售的SONY牌彩電有兩個(gè)產(chǎn)產(chǎn)地:美國(guó)和日本,兩地的的工廠是是按同一一設(shè)計(jì)方方案和相相同的生生產(chǎn)線生生產(chǎn)同一一牌號(hào)SONY彩電,連連使用說(shuō)說(shuō)明書(shū)和和檢驗(yàn)合合格的標(biāo)標(biāo)準(zhǔn)也是是一樣的的。關(guān)于彩色色濃度X的標(biāo)準(zhǔn)是是:目標(biāo)標(biāo)值為m,公差為為5,即當(dāng)X在m-5,m+5內(nèi)該彩電電的彩色色濃度合合格,否否則不合合格。 例:彩電之間間的區(qū)別別3、總體的的表示形形式分布描述述在七十年年代后期期,美國(guó)國(guó)消費(fèi)者者購(gòu)買(mǎi)日日本產(chǎn)SONY彩電的熱熱情高于于購(gòu)買(mǎi)美美國(guó)產(chǎn)SONY彩電,原原因何在

5、在??jī)煞N彩電電彩色濃濃度的分布不同。日產(chǎn)SONY彩電的彩色濃濃度服從從正態(tài)分布布N(m,25/9)美產(chǎn)SONY彩電的彩色濃濃度服從從均勻分布布U(m-5,m+5) 例:彩電之間間的區(qū)別別3、總體的的表示形形式分布描述述例:彩電之間間的區(qū)別別各等級(jí)彩彩電的比比例(%)等級(jí)IIIIIIIIIIV美產(chǎn)33.333.333.30日產(chǎn)68.327.14.30.34、抽樣單單元(samplingunit)定義:把總體按按實(shí)際情情況劃分分成若干干小部分分抽取,這就是是抽樣單單元。這些單元元應(yīng)互不不重疊且且能合成成總體。抽樣單元元不一定是組成總總體的最最小單元元。抽樣單元元還有大大小之分分,一個(gè)個(gè)大的抽抽樣單

6、元元可以分分成一些些小的抽抽樣單元元。樣本(sample):按一定的的程序從從總體中中抽取的的一組抽樣單元元。樣本容量量(samplingsize):樣本中包包含的抽抽樣單元元個(gè)數(shù)。5、樣本(sample)5、樣本(sample)人們從總總體中抽抽取樣本本是為了了認(rèn)識(shí)總總體,即從樣本推推斷總體體,為了使使此種推推斷有所所依據(jù)、推斷結(jié)結(jié)果有效效,對(duì)樣樣本的抽抽取應(yīng)有有所要求求。滿(mǎn)足下面面兩個(gè)條條件的樣樣本稱(chēng)為為簡(jiǎn)單隨機(jī)機(jī)樣本,簡(jiǎn)稱(chēng)樣樣本:(1)隨機(jī)性:總體中每每個(gè)個(gè)體體有相同的的機(jī)會(huì)被選入樣樣本;(2)獨(dú)立性:從總體中中抽取的的每個(gè)樣樣品對(duì)其其他樣本本的抽取取沒(méi)有影影響。對(duì)無(wú)限總總體,獨(dú)獨(dú)立性容

7、容易實(shí)現(xiàn)現(xiàn),對(duì)有有限總體體,只要要總體所所含個(gè)體體數(shù)很大大,特別別是與樣樣本量相相比很大大,則獨(dú)獨(dú)立性也也可基本本得到滿(mǎn)滿(mǎn)足。據(jù)彭博社社2005年12月3日?qǐng)?bào)道,美國(guó)時(shí)代雜志進(jìn)行行的民意意調(diào)查顯顯示,受受伊拉克克戰(zhàn)爭(zhēng)和和一系列列國(guó)內(nèi)問(wèn)問(wèn)題影響響,美國(guó)國(guó)總統(tǒng)布布什的支支持率近近期一直直在低谷谷徘徊。53的美國(guó)人人不滿(mǎn)意意布什的的工作表表現(xiàn),而而在伊拉拉克問(wèn)題題上,更更是有60的美國(guó)人人對(duì)布什什不滿(mǎn)。布什在在伊拉克克政策等等領(lǐng)域的的糟糕表表現(xiàn)引發(fā)發(fā)美國(guó)“民心思變變”,高達(dá)60的美國(guó)國(guó)人希望望白宮的的下一位位主人,在類(lèi)型型上要與與布什完完全相反反。時(shí)代的這項(xiàng)民民調(diào)是在在11月29日至12月1日進(jìn)行的

8、的,共對(duì)對(duì)全美各各地1004名成年人人進(jìn)行了了電話采采訪,誤誤差率在在正負(fù)3個(gè)百分點(diǎn)點(diǎn)。例:伊拉拉克政策策讓布什什支持率率墜入谷谷底總體:全體美國(guó)國(guó)人,美美國(guó)人口口約24951.1萬(wàn),總體中有有24951.1萬(wàn)個(gè)個(gè)體體;樣本:1004人,樣本本容量為為1004。“誤差率在在3%之內(nèi)”的精確含含意是,“誤差率在在3%之內(nèi)的可可能性為為95%”。隨機(jī)調(diào)調(diào)查1004人(樣本本容量)就是根根據(jù)這個(gè)個(gè)精度要要求而計(jì)計(jì)算出來(lái)來(lái)的。例:伊拉拉克政策策讓布什什支持率率墜入谷谷底好樣本和和壞樣本本樣本容量量的大小顯顯然會(huì)影影響到樣樣本作為為總體的的代表的的可信程程度,抽抽取樣本本的目的的是要由由樣本的的數(shù)量特特

9、征去推推斷總體體的數(shù)量量特征,由于樣樣本具有有隨機(jī)性性(在樣樣本中包包含那些些個(gè)體,不包含含那些個(gè)個(gè)體是不不確定的的),用樣本特特征推斷斷總體特特征總是是會(huì)有一一定的誤誤差。如何科學(xué)學(xué)地從總總體中抽抽取樣本本,怎樣樣控制用用樣本推推斷總體體所產(chǎn)生生的誤差差,這是是統(tǒng)計(jì)學(xué)學(xué)的主要要研究問(wèn)問(wèn)題。但研究的的前提是是:我們們首先應(yīng)應(yīng)保證樣樣本是好好的!在實(shí)踐中中,得到到隨機(jī)樣本本不容易。很多搞搞調(diào)查的的人就采采取簡(jiǎn)單單的辦法法,這就就產(chǎn)生了了各種各各樣的樣樣本,也也就有了了好樣本本和壞樣樣本之分分。好樣本和和壞樣本本繼續(xù)總統(tǒng)統(tǒng)預(yù)測(cè)的的例子。從常理來(lái)來(lái)看,應(yīng)應(yīng)該調(diào)查查數(shù)據(jù)越越多,結(jié)論越可可靠。但這得以以

10、好樣本本為前提提!羅斯福的的實(shí)際得得票率為為54%,文學(xué)摘要要雜志的預(yù)預(yù)測(cè)為43%,誤差達(dá)達(dá)到11%。誤差之之大令人人驚異。這樣大大的誤差差是怎么么得來(lái)的的呢? 好樣本和和壞樣本本問(wèn)題之一一:抽樣樣總體與與目標(biāo)總總體不一一致經(jīng)過(guò)研究究發(fā)現(xiàn),原因在在于文學(xué)摘要要雜志選取取樣本有有偏性。雜志是是根據(jù)電電話簿和和俱樂(lè)部部會(huì)員的的名冊(cè),將問(wèn)卷卷郵寄給給一千萬(wàn)萬(wàn)人。當(dāng)當(dāng)時(shí)美國(guó)國(guó)四個(gè)家家庭中僅僅有一家家裝電話話。他選取的的樣本有有排斥窮窮人的選選擇偏性性。這樣的民民意測(cè)驗(yàn)驗(yàn)非常不不利于民民主黨人人羅斯福福。好樣本和和壞樣本本許多方便樣本本中都存在在抽樣總總體與目目標(biāo)總體體不一致致的問(wèn)題題!1、電話調(diào)調(diào)查中

11、:以上海市市民對(duì)建建設(shè)滬杭杭磁懸浮浮高速列列車(chē)的觀觀點(diǎn)的調(diào)調(diào)查為例例,若按按照隨機(jī)機(jī)選出的的電話號(hào)號(hào)碼進(jìn)行行調(diào)查,這樣肯肯定節(jié)省省時(shí)間和和資源,但這樣樣得到的的就不是一個(gè)個(gè)隨機(jī)樣樣本了。如果果按照隨隨機(jī)選擇擇的數(shù)字字(無(wú)論論號(hào)碼本本上有沒(méi)沒(méi)有)打打電話,那很多多電話是是空號(hào)或或單位電電話,顯顯然這種種樣本也也不是隨機(jī)機(jī)樣本,它稱(chēng)為為方便樣本本。好樣本和和壞樣本本2、其他問(wèn)問(wèn)題中,也有使使用方便便樣本的的情況。比如在肺肺癌研究究中,人人們往往往看到吸吸煙和肺肺癌的關(guān)關(guān)系的數(shù)數(shù)據(jù),這這些數(shù)據(jù)據(jù)并不是是整個(gè)人人群中采采集的隨隨機(jī)樣本本,它們們可能只只是醫(yī)院院中的病病人記錄錄中得到到的。在雜志和和報(bào)紙

12、上上也有問(wèn)問(wèn)卷,但但得到的的只是擁?yè)碛羞@份份報(bào)刊,而且愿愿意回答答的人的的觀點(diǎn)。好樣本和和壞樣本本問(wèn)題之二二:可能能存在不不回答偏偏性文學(xué)摘要要雜志調(diào)查查的一千千萬(wàn)人中中只有二二百四十十萬(wàn)人回回答了問(wèn)問(wèn)卷,不回答者者可能非非常有別別于回答答者,這二百百四十萬(wàn)萬(wàn)人代表表不了被被郵寄問(wèn)問(wèn)卷的一一千萬(wàn)人人。譬如,1936年文學(xué)摘要要雜志的一一次專(zhuān)門(mén)門(mén)的調(diào)查查,給在在芝加哥哥的選民民每三人人寄去一一張問(wèn)卷卷。約20%的被調(diào)查查者作了了回答,其中支支持蘭登登的超過(guò)過(guò)半數(shù)。但是在在選舉中中,蘭登登在芝加加哥的得得票率只只有三分分之一。所以當(dāng)出出現(xiàn)高不不回答率率時(shí),謹(jǐn)謹(jǐn)防不回回答偏性性。好樣本和和壞樣本本在

13、調(diào)查中中,即使使選擇對(duì)對(duì)象的確確是隨機(jī)機(jī)的,最最理想的的情況所所得到的的樣本也也只代表表那些愿愿意回答答問(wèn)題人人的觀點(diǎn)點(diǎn)所組成成的總體體,沒(méi)有回答答問(wèn)題的的人的觀觀點(diǎn)永遠(yuǎn)遠(yuǎn)不會(huì)被被這種調(diào)調(diào)查的樣樣本所代代表。心理研究究表明,低收入入和高收收入的人人傾向于于不回答答問(wèn)卷,因此中中等收入入的人在在回答者者中的比比例過(guò)高高。為此此現(xiàn)代調(diào)調(diào)查機(jī)構(gòu)構(gòu)更喜歡歡采用親親自詢(xún)問(wèn)問(wèn)來(lái)代替替郵寄問(wèn)問(wèn)卷。好樣本和和壞樣本本即使親自自詢(xún)問(wèn),也有不回答偏偏性的問(wèn)題。訪問(wèn)員來(lái)來(lái)訪時(shí),不在家家的人與與在家接接受訪問(wèn)問(wèn)的人可可能在工工作時(shí)間間、家庭庭關(guān)系和和社會(huì)背背景等方方面有比比較大的的差異,從而看看法也不不一樣。例如有一

14、一項(xiàng)關(guān)于于快餐的的市場(chǎng)調(diào)調(diào)查。抽抽取500戶(hù)家庭進(jìn)進(jìn)行調(diào)查查。白天天訪問(wèn)時(shí)時(shí),有150戶(hù)家庭沒(méi)沒(méi)人。能不能僅僅用白天天有人的的350戶(hù)家庭的的數(shù)據(jù)?不能。這里有有不回答答偏性。白天不不在家的的150戶(hù)可能是是吃快餐餐比較多多的家庭庭。好樣本和和壞樣本本問(wèn)題之三三:對(duì)目目標(biāo)總體體缺乏了了解 文學(xué)摘要要不了解其其目標(biāo)總總體,沒(méi)沒(méi)有考慮慮到安裝裝電話與與未安裝裝電話的的居民的的特征,導(dǎo)致樣樣本不具具代表性性。好樣本和和壞樣本本 蓋洛普也也失誤過(guò)過(guò)!1948年蓋洛普普的民意意調(diào)查預(yù)預(yù)測(cè)共和和黨候選選人杜威將戰(zhàn)勝民民主黨候候選人杜魯門(mén),而選舉舉結(jié)果正正好相反反。樣本出現(xiàn)現(xiàn)了偏差差!當(dāng)時(shí)城市市居民傾傾向于

15、投投民主黨黨的票,農(nóng)名傾傾向于投投共和黨黨的票。第二次次世界大大戰(zhàn)后,美國(guó)大大量人口口從農(nóng)村村流向城城市。而而蓋洛普普對(duì)人口口總體的的認(rèn)識(shí)卻卻仍停留留在1940年的狀況況,因而而樣本中中農(nóng)民的的比例過(guò)過(guò)大,造造成了對(duì)對(duì)共和黨黨得票人人數(shù)過(guò)高高的估計(jì)計(jì)。好樣本和和壞樣本本樣本質(zhì)量量不好的的原因通通常有如如下幾種種原因:登記性誤誤差(低低級(jí)誤差差);人為干擾擾(官出出數(shù)字,數(shù)字出出官-惡劣可惡惡,統(tǒng)計(jì)計(jì)法);代表性誤誤差(代代表性不不強(qiáng)-數(shù)據(jù)正確確,但它它不能說(shuō)說(shuō)明問(wèn)題題);設(shè)計(jì)不合合理(方方便樣本本)。課堂討論論某地電視視臺(tái)想了了解某電電視欄目目在該地地區(qū)的收收視率情情況,于于是委托托某市場(chǎng)場(chǎng)咨詢(xún)公公司進(jìn)行行一次電電話訪查

溫馨提示

  • 1. 本站所有資源如無(wú)特殊說(shuō)明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請(qǐng)下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請(qǐng)聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶(hù)所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁(yè)內(nèi)容里面會(huì)有圖紙預(yù)覽,若沒(méi)有圖紙預(yù)覽就沒(méi)有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫(kù)網(wǎng)僅提供信息存儲(chǔ)空間,僅對(duì)用戶(hù)上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對(duì)用戶(hù)上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對(duì)任何下載內(nèi)容負(fù)責(zé)。
  • 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請(qǐng)與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶(hù)因使用這些下載資源對(duì)自己和他人造成任何形式的傷害或損失。

最新文檔

評(píng)論

0/150

提交評(píng)論