統(tǒng)計(jì)學(xué)-第2章數(shù)據(jù)搜集_第1頁(yè)
統(tǒng)計(jì)學(xué)-第2章數(shù)據(jù)搜集_第2頁(yè)
統(tǒng)計(jì)學(xué)-第2章數(shù)據(jù)搜集_第3頁(yè)
統(tǒng)計(jì)學(xué)-第2章數(shù)據(jù)搜集_第4頁(yè)
統(tǒng)計(jì)學(xué)-第2章數(shù)據(jù)搜集_第5頁(yè)
已閱讀5頁(yè),還剩32頁(yè)未讀, 繼續(xù)免費(fèi)閱讀

下載本文檔

版權(quán)說(shuō)明:本文檔由用戶(hù)提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請(qǐng)進(jìn)行舉報(bào)或認(rèn)領(lǐng)

文檔簡(jiǎn)介

第2章數(shù)據(jù)的搜集2.1數(shù)據(jù)的來(lái)源2.2數(shù)據(jù)的誤差2.3數(shù)據(jù)文件2.1數(shù)據(jù)的來(lái)源2.1.1數(shù)據(jù)的間接來(lái)源中華人民共和國(guó)2012年國(guó)民經(jīng)濟(jì)和社會(huì)發(fā)展統(tǒng)計(jì)公報(bào)2.1.2數(shù)據(jù)的直接來(lái)源2.1.2調(diào)查數(shù)據(jù)2.1.2.1概率抽樣和非概率抽樣好樣本必須: 1.針對(duì)研究的問(wèn)題 2.具有最好的性能價(jià)格比總體隨機(jī)樣本1.概率抽樣

遵循隨機(jī)原則進(jìn)行的抽樣,總體中每個(gè)單位都有一定的機(jī)會(huì)被選入樣本排除主觀上有意識(shí)的抽取調(diào)查單位每個(gè)單位被抽中的概率是已知或可計(jì)算的當(dāng)用樣本對(duì)總體目標(biāo)量進(jìn)行估計(jì)時(shí),要考慮到每個(gè)樣本單位被抽中的概率(1)簡(jiǎn)單隨機(jī)抽樣

只適用于總體單位數(shù)量有限的情況,否則編號(hào)工作繁重;對(duì)于復(fù)雜的總體,樣本的代表性難以保證;不能利用總體的已知信息等每個(gè)樣本單位被抽中的概率相等,樣本的每個(gè)單位完全獨(dú)立,彼此間無(wú)一定的關(guān)聯(lián)性和排斥性從總體N個(gè)單位中任意抽取n個(gè)單位作為樣本,使每個(gè)可能的樣本被抽中的概率相等的一種抽樣方式(2)分層抽樣

先將總體的單位按某種特征分為若干次級(jí)總體(層),然后再?gòu)拿恳粚觾?nèi)進(jìn)行單純隨機(jī)抽樣,組成一個(gè)樣本的方法分組減小了各抽樣層變異性的影響,抽樣保證了所抽取的樣本具有足夠的代表性當(dāng)總體是由差異明顯的幾部分組成時(shí),往往選擇分層抽樣的方法例如,一個(gè)單位的職工有500人,其中不到35歲有125人,35歲至49歲的有280人,50歲以上的有95人.為了了解這個(gè)單位職工與身體狀況有關(guān)的某項(xiàng)指標(biāo),要從中抽取一個(gè)容量為100的樣本,由于職工年齡與這項(xiàng)指標(biāo)有關(guān),決定采用分層抽樣方法進(jìn)行抽取.因?yàn)闃颖救萘颗c總體的個(gè)數(shù)的比為1:5,所以在各年齡段抽取的個(gè)數(shù)依次為125/5,280/5,95/5,即25,56,19。(3)整群抽樣將總體中各單位歸并成若干個(gè)互不交叉、互不重復(fù)的集合,稱(chēng)之為群;然后以群為抽樣單位抽取樣本的一種抽樣方式.優(yōu)點(diǎn)是實(shí)施方便、節(jié)省經(jīng)費(fèi);缺點(diǎn)是抽樣誤差往往大于簡(jiǎn)單隨機(jī)抽樣例如,調(diào)查中學(xué)生患近視眼的情況,抽某一個(gè)班做統(tǒng)計(jì);進(jìn)行產(chǎn)品檢驗(yàn);每隔8h抽1h生產(chǎn)的全部產(chǎn)品進(jìn)行檢驗(yàn)等(4)系統(tǒng)抽樣首先將總體中各單位按一定順序排列,根據(jù)樣本容量要求確定抽選間隔,然后隨機(jī)確定起點(diǎn),每隔一定的間隔抽取一個(gè)單位的一種抽樣方式。是純隨機(jī)抽樣的變種最主要的優(yōu)勢(shì)就是經(jīng)濟(jì)性。最大的缺陷在于總體單位的排列上。一些總體單位數(shù)可能包含隱蔽的形態(tài)或者是“不合格樣本”,調(diào)查者可能疏忽,把它們抽選為樣本先將總體從1~N相繼編號(hào),并計(jì)算抽樣距離K=N/n。式中N為總體單位總數(shù),n為樣本容量。然后在1~K中抽一隨機(jī)數(shù)k1,作為樣本的第一個(gè)單位,接著取k1+K,k1+2K……,直至抽夠n個(gè)單位為止(5)多階段抽樣先從總體中抽取范圍較大的單元,稱(chēng)為一級(jí)抽樣單元,再?gòu)拿總€(gè)抽得的一級(jí)單元中抽取范圍更小的二級(jí)單元,依此類(lèi)推,最后抽取其中范圍更小的單元作為調(diào)查單位2.非概率抽樣

又稱(chēng)為不等概率抽樣或非隨機(jī)抽樣,就是調(diào)查者根據(jù)自己的方便或主觀判斷抽取樣本的方法

雖然根據(jù)樣本調(diào)查的結(jié)果也可在一定程度上說(shuō)明總體的性質(zhì)、特征,但不能從數(shù)量上推斷總體非概率抽樣方便抽樣判斷抽樣自愿樣本滾雪球抽樣配額抽樣(1)方便抽樣

調(diào)查人員本著隨意性原則去選擇樣本的抽樣方式兩種最常見(jiàn)的方法:“街頭攔人法”“空間抽樣法”

一般在調(diào)查總體中每一個(gè)體都是同質(zhì)時(shí),才能采用此類(lèi)方法。(2)判斷抽樣

根據(jù)調(diào)查人員的主觀經(jīng)驗(yàn)從總體樣本中選擇那些被判斷為最能代表總體的單位作樣本的抽樣方法例如,要對(duì)安徽省旅游市場(chǎng)狀況進(jìn)行調(diào)查,有關(guān)部門(mén)選擇黃山、九華山等旅游風(fēng)景區(qū)做為樣本調(diào)查,這就是判斷抽樣。(3)自愿樣本被調(diào)查者自愿參加,成為樣本中的一份子,向調(diào)查人員提供信息。如:網(wǎng)絡(luò)調(diào)查先隨機(jī)選擇一些被訪者并對(duì)其實(shí)施訪問(wèn),再請(qǐng)他們提供另外一些屬于所研究目標(biāo)總體的調(diào)查對(duì)象,根據(jù)所形成的線索選擇此后的調(diào)查對(duì)象在特定總體的成員難以找到時(shí)最適合的一種抽樣方法(4)滾雪球抽樣(5)配額抽樣

將調(diào)查總體樣本按一定標(biāo)志分類(lèi)或分層,確定各類(lèi)(層)單位的樣本數(shù)額,在配額內(nèi)任意抽選樣本的抽樣方式。

與分層抽樣的區(qū)別:分層抽樣是按隨機(jī)原則在層內(nèi)抽選樣本,而配額抽樣則是由調(diào)查人員在配額內(nèi)主觀判斷選定樣本3.概率抽樣與非概率抽樣的比較概率抽樣非概率抽樣抽樣原則特點(diǎn)非隨機(jī)原則,統(tǒng)計(jì)量的分布不確定,無(wú)法進(jìn)行參數(shù)估計(jì).操作簡(jiǎn)便、時(shí)效快、成本低,適用于探索性研究抽樣原則特點(diǎn)隨機(jī)原則,可以據(jù)以對(duì)總體參數(shù)進(jìn)行估計(jì)更精確,技術(shù)含量高,調(diào)查成本高2.1.2.2搜集數(shù)據(jù)的基本方法1.自填式調(diào)查者將調(diào)查問(wèn)卷發(fā)送給(或者郵寄給)被調(diào)查者,由被調(diào)查自己閱讀和填答,然后再由調(diào)查者收回的方法優(yōu)點(diǎn):1、節(jié)省時(shí)間、經(jīng)費(fèi)和人力.2、具有很好的匿名性.3、可避免某些人為誤差缺點(diǎn):1、問(wèn)卷的回收革有時(shí)難以保證2、自填問(wèn)卷法對(duì)被調(diào)查者的文化水平有一定要求3、調(diào)查資料的質(zhì)量常常得不到保證2.面訪式調(diào)查者直接走訪被調(diào)查者,當(dāng)面聽(tīng)取被調(diào)查者的意見(jiàn)。形式上可以個(gè)別面談,也可以小組座談提高調(diào)查的回答率,提高調(diào)查數(shù)據(jù)的質(zhì)量,對(duì)數(shù)據(jù)搜集所花費(fèi)的時(shí)間進(jìn)行調(diào)節(jié)

調(diào)查成本高,對(duì)調(diào)查的質(zhì)量控制有一定的難度對(duì)不起,打擾了!3.電話式

調(diào)查者利用電話與被調(diào)查者進(jìn)行語(yǔ)言交流以獲得信息優(yōu)點(diǎn):時(shí)效快、成本低缺點(diǎn):?jiǎn)栴}的數(shù)量不宜過(guò)多 您好,我是××調(diào)查公司調(diào)查員4.數(shù)據(jù)搜集方法的選擇實(shí)施調(diào)查的資源抽樣框中的有關(guān)信息管理與控制質(zhì)量要求目標(biāo)總體的特征調(diào)查問(wèn)題的內(nèi)容有形輔助物的使用考慮因素

是指在實(shí)驗(yàn)中控制實(shí)驗(yàn)對(duì)象而搜集到的變量的數(shù)據(jù)。在實(shí)驗(yàn)中,研究人員要控制某一情形的所有相關(guān)方面,操縱少數(shù)感興趣的變量,然后觀察實(shí)驗(yàn)的結(jié)果。2.3實(shí)驗(yàn)數(shù)據(jù)

2.3.1實(shí)驗(yàn)組和對(duì)照組

實(shí)驗(yàn)的基本邏輯:改變A的情況,觀察B是否隨A的變化而變化

實(shí)驗(yàn)組對(duì)照組2.3.2實(shí)驗(yàn)中的若干問(wèn)題人的意愿心理問(wèn)題道德問(wèn)題2.3.3實(shí)驗(yàn)中的統(tǒng)計(jì)Textinhere實(shí)驗(yàn)設(shè)計(jì)多變量研究實(shí)驗(yàn)次數(shù)實(shí)驗(yàn)2.2數(shù)據(jù)誤差2.2.1抽樣誤差一、概念:指由于抽樣的隨機(jī)性引起的樣本結(jié)果與總體真值之間的誤差“實(shí)際抽樣誤差”“抽樣平均誤差”影響因素樣本單位數(shù)總體變異性抽樣方法§2.4.1抽樣誤差二、抽樣誤差大小的影響因素樣本量的大?。簶颖玖吭酱螅闃诱`差越小??傮w的變異性:總體的變異性越大,即各單位之間的差異越大,抽樣誤差也就越大。在公布任何一次抽樣調(diào)查的結(jié)果時(shí),負(fù)責(zé)任的報(bào)告都應(yīng)說(shuō)明抽樣誤差的大小。282.2.2非抽樣誤差

抽樣框誤差1回答誤差2無(wú)回答誤差3調(diào)查員誤差4測(cè)量誤差5

非抽樣誤差是指除抽樣誤差以外所有的誤差的總和

任何一個(gè)環(huán)節(jié)出錯(cuò)都有可能導(dǎo)致非抽樣誤差增加而使數(shù)據(jù)失真§4.2.2未響應(yīng)誤差未響應(yīng)誤差非抽樣誤差中的一種。它是指由于種種原因,包含在樣本中的一部分人未對(duì)調(diào)查做出反應(yīng)或回答,而造成的誤差。

未響應(yīng)誤差是隨機(jī)的可以通過(guò)增大樣本量的方式解決

未響應(yīng)誤差是系統(tǒng)性的預(yù)防采取補(bǔ)救措施30§2.2.2響應(yīng)誤差

響應(yīng)誤差指在調(diào)查過(guò)程中,由于問(wèn)題的提問(wèn)方式、問(wèn)題所處的位置、訪員的影響或受訪者自身的原因,而使受訪者在回答問(wèn)題時(shí)產(chǎn)生的誤差。

響應(yīng)誤差的類(lèi)型問(wèn)題的措辭問(wèn)題所處的位置訪員的影響受訪者的影響312.2.3誤差的控制

抽樣誤差是不可避免的,能夠在調(diào)查過(guò)程中進(jìn)行控制的只有非抽樣誤差。抽樣誤差可以計(jì)算,因此可以通過(guò)統(tǒng)計(jì)學(xué)專(zhuān)業(yè)知識(shí)根據(jù)允許誤差確定樣本量,以控制抽樣誤差§3數(shù)據(jù)文件

數(shù)據(jù)

由一些變量和它們的觀測(cè)值所組成。數(shù)據(jù)文件將數(shù)據(jù)以表格的形式錄入計(jì)算機(jī),這樣的一個(gè)數(shù)據(jù)表通常叫做數(shù)據(jù)陣或數(shù)據(jù)文件。文件由行和列組成。一般行代表樣本單位,每一行稱(chēng)為一個(gè)觀測(cè)值。列表示不同的變量,每一列為一個(gè)變量的不同觀測(cè)值。33§3數(shù)據(jù)文件

原始數(shù)據(jù)文件的一般格式34§3數(shù)據(jù)文件編碼

男——1

溫馨提示

  • 1. 本站所有資源如無(wú)特殊說(shuō)明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請(qǐng)下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請(qǐng)聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶(hù)所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁(yè)內(nèi)容里面會(huì)有圖紙預(yù)覽,若沒(méi)有圖紙預(yù)覽就沒(méi)有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫(kù)網(wǎng)僅提供信息存儲(chǔ)空間,僅對(duì)用戶(hù)上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對(duì)用戶(hù)上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對(duì)任何下載內(nèi)容負(fù)責(zé)。
  • 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請(qǐng)與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶(hù)因使用這些下載資源對(duì)自己和他人造成任何形式的傷害或損失。

評(píng)論

0/150

提交評(píng)論