試議抽樣調(diào)查中的概率論_第1頁
試議抽樣調(diào)查中的概率論_第2頁
試議抽樣調(diào)查中的概率論_第3頁
試議抽樣調(diào)查中的概率論_第4頁
試議抽樣調(diào)查中的概率論_第5頁
已閱讀5頁,還剩2頁未讀 繼續(xù)免費閱讀

下載本文檔

版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進行舉報或認(rèn)領(lǐng)

文檔簡介

1、試議抽樣調(diào)查中的概率論武 昇(發(fā)表于石河子科技2008年第3期) 概率論論最基本的概概念,是在社社會和自然界界中某一類事事件在相同的的條件下可能能發(fā)生也可能能不發(fā)生,它它的發(fā)生具有有偶然性,這這類事件稱為為隨機事件或或偶然事件,不不同的隨機事事件發(fā)生的可可能性大小是是不同的。也就是說概概率是用來表表示隨機事件件發(fā)生的可能能大小的一個個量。很自然然的把必然發(fā)發(fā)生的事件的的概率規(guī)定為為1,即肯定定;并把不可能能發(fā)生的事件件的概率規(guī)定定為0,即否否定。而實際際上一般隨機機事件的概率率不是絕對的的肯定或絕對對的否定,而而是介于1和和0之間的一一個數(shù),即可可分出多個層層次。概率越越大表示事件件發(fā)生的可能

2、能性也越大。 在統(tǒng)計計學(xué)中,對應(yīng)應(yīng)該全部調(diào)查查的對象稱為為總體,而隨隨機抽取的若若干個體稱為為總體的樣本本。用全部調(diào)調(diào)查的結(jié)果雖雖然能夠準(zhǔn)確確的反映事物物的真實數(shù)目目,但它的不不足之處在于于工作量大、花花費人力、物物力多,時間間也拖的過長長,且在許多多特定條件下下也是不可能能的。只能采采取抽樣調(diào)查查其中的一部部分,獲得事事物的某些數(shù)數(shù)據(jù)指標(biāo),進進而推算總體體,即用概率率論的研究成成果,通過樣樣本來分析和和判斷總體。這這就是抽樣調(diào)調(diào)查方法。 由于各種偶偶然因素的影影響是隨機的的,因此,在在調(diào)查時的抽抽樣也必須是是隨機的。只只有這樣,才才能比較有效效地消除正負(fù)負(fù)兩方面偶然然因素的影響響,提高統(tǒng)計計

3、值的準(zhǔn)確性性。調(diào)查的數(shù)數(shù)量越多,偶偶然因素之間間的相互抵消消的就越徹底底,總體的內(nèi)內(nèi)在規(guī)律也就就表現(xiàn)的越充充分,這也是是客觀世界的的一個普遍規(guī)規(guī)律。 歸納起起來,隨機抽抽樣調(diào)查方法法有兩個顯著著的特點: 一是從從原則上講完完全排斥了人人民有意義的的選擇,不摻摻雜任何調(diào)查查者的主觀判判斷。也就是是說,抽中和和抽不中完全全是偶然的,每每一個單位被被抽取的機會會是均等的。 二是在在缺少資料的的情況下,通通過對部分單單位的調(diào)查研研究,獲得某某些數(shù)據(jù),計計算統(tǒng)計指標(biāo)標(biāo),即可對事事物的總體情情況作出相當(dāng)當(dāng)可靠的推算算。 現(xiàn)在我我們舉一應(yīng)用用實例,來闡闡述整個抽樣樣調(diào)查的全過過程。兵團廣廣播電視大學(xué)學(xué)系統(tǒng)在

4、我校校評估時,曾曾對某專業(yè)同同一年級944名學(xué)生的學(xué)學(xué)習(xí)成績進行行了抽樣調(diào)查查,是按整群群非重復(fù)抽樣樣方法,抽取取7名學(xué)生作作為樣本的。其其考試成績列列入下表,并并推算有關(guān)指指標(biāo)。樣本 分?jǐn)?shù) 偏差 偏差的平平方編號 (xi) (xi ) (xi -)21 885 3 99 2 777 -5 2253 880 -2 44 4 84 2 44 5 82 0 06 88 6 367 78 -4 16 574樣本的數(shù)字特征征有:樣本平均數(shù)??煽杀硎緲颖靖鞲鲾?shù)的集中位位置,它是代代替總體指標(biāo)標(biāo)一般水平的的統(tǒng)計指標(biāo)。若若樣本為x1,x2,、xxn時。按式(11)計算。將已已知數(shù)代入得得:= xxi= 82

5、(分) (1)樣本方差S2樣樣本標(biāo)準(zhǔn)差SS??杀硎緲訕颖局懈鲾?shù)與與集中位置的的偏離程度。在在抽樣調(diào)查中中占有很重要要的位置。當(dāng)當(dāng)n30時為小樣樣本,按式(22)(3)計計算。將已知知數(shù)代入得:S2= (xi -)2=15.677 (2)S=3.966 (3)式中:n 抽抽取樣本的個個數(shù)xi 樣本個體體分?jǐn)?shù)值樣本個體分分?jǐn)?shù)值之和n-1 tt分布的自由由度。與時為為大樣本。NN比較大時,nn與n-1的的差別是很小小的,為簡便便起見,可將將n近似的代代替式中的nn-1。 (xi -)2樣本個體體偏差的平方方和抽樣調(diào)查是一種種非全面的調(diào)調(diào)查,其數(shù)量量特征同它的的總體不完全全相同,不同同的樣本將是是不同

6、的樣本本的指標(biāo)。所所以,各樣本本平均指標(biāo)之之間存在著差差異,與總體體平均指標(biāo)之之間也存在著著不同程度的的差異,這就就是抽樣誤差差。平均指標(biāo)標(biāo)的抽樣誤差差,是指所有有的樣本指標(biāo)標(biāo)和總體指標(biāo)標(biāo)的平均離差差,可按式(44)計算。非重復(fù)抽樣是將將從總體單位位中已隨機抽抽取出來的樣樣本單位除去去,只從剩下下的總體單位位中再抽取。即即每個總體單單位多只能被被抽中一次,代代表性就大,所所以,平均指指標(biāo)的抽樣誤誤差就小,精精度就高。將將已知數(shù)代入入:=1.4877當(dāng)N很大時,NN-5與N-1差別是很很小的,為簡簡便起見,可可將N近似的的代替式中NN-1。區(qū)間估計是根據(jù)據(jù)樣本指標(biāo)和和平均指標(biāo)的的抽樣誤差計計算總

7、體指標(biāo)標(biāo)所在的范圍圍,表示的是是一個非絕對對準(zhǔn)確的范圍圍,即推斷總總體指標(biāo)在這這個范圍內(nèi)的的判斷不是十十分肯定的,只只有一定的把把握(概率)。那那么,對已知知的平均指標(biāo)標(biāo)的抽樣誤差差來說,總體體指標(biāo)落在估估計區(qū)間的把把握(概率)究竟有多大呢?一般比較常用的是以95%的把握(概率)作為區(qū)間估計,即t的取值為1.96,區(qū)間估計的把握程度(概率)按式(5)計算。-t+ t將已知數(shù)代入得得:82-1.9661.487782+1.961.48777985式中:T平均指標(biāo)標(biāo)的抽樣誤差差個數(shù)總體指標(biāo)平平均數(shù)因此,我們可以以得出這樣的的結(jié)論,某專專業(yè)同一級的的學(xué)生平均考試試分?jǐn)?shù)在822分左右,并并有95%的的

8、把握(概率率)推斷總體體平均考試分分?jǐn)?shù)在7985之間間。不難看出出,擴大平均均指標(biāo)的抽樣樣誤差,可以以提高推斷的的把握程度(概概率);反之之,則降低推推斷的把握程程度(概率)。即即平均指標(biāo)的的抽樣誤差范范圍的變化和和作推斷的把把握程度(概概率)之間是是有著一定數(shù)數(shù)量關(guān)系的。搞抽樣調(diào)查時抽抽取的樣本單單位應(yīng)該大致致是多少?這這是調(diào)查者在在制定方案時時首先需要考考慮的問題。抽抽取的樣本單單位如果太少少,估計值就就可能不太準(zhǔn)準(zhǔn)確,達不到到所要求的精精度;抽取的的樣本單位過過多,也有很很多不足之處處。因此,科科學(xué)地抽取樣樣本單位是很很必要的。假如,調(diào)查者認(rèn)認(rèn)為總體學(xué)生生平均考試分分?jǐn)?shù)推斷結(jié)果果近似為(

9、882 3)分分,即平均指指標(biāo)的抽樣誤誤差為1.448時,已達達到了所要求求的精度,那那么,就證明明從總體944各學(xué)生中抽抽取7名作為為樣本是合理理的;又如,調(diào)調(diào)查者認(rèn)為平平均指標(biāo)的抽抽樣誤差尚未未達到精度要要求,而是總總體學(xué)生平均均考試分?jǐn)?shù)區(qū)區(qū)間估計精度度還要提高。設(shè)設(shè)將總體學(xué)生生平均考試分分?jǐn)?shù)區(qū)間估計計控制在(882 2)分分之間時,那那么,平均指指標(biāo)的抽樣誤誤差則為,按按式(6)計計算所需抽取取的學(xué)生人數(shù)數(shù)。將已知數(shù)數(shù)代入得:=36(人)式中:N總體學(xué)生生人數(shù)。944人L平均指標(biāo)標(biāo)的允許抽樣樣誤差,1.02用同樣方法也可可推斷出要求求降低區(qū)間指指標(biāo)的估計精精度。所需抽抽取的學(xué)生人人數(shù)。從

10、以上計算結(jié)果果看出,若從從總體學(xué)生平平均考試分?jǐn)?shù)數(shù)區(qū)間估計在在(82 33)分之間的的精度提高到到(82 22)分之間的的精度時,雖雖然平均指標(biāo)標(biāo)的抽樣允許許誤差由1.4817降降到1.022,降低了331.4%。但但所需抽取的的學(xué)生人數(shù)卻卻由7人增加加到36人,提提高了4144.3%。這這就說明,它它們之間的變變動副值是不不成比例的。所所以,在區(qū)間間指標(biāo)估計精精度控制上需需要慎之又慎慎,絕不可盲盲目的追求高高精度,否則則將會造成極極大的浪費。再再者t的取值值與相應(yīng)的概概率取值關(guān)系系甚密,t究究竟采用何值值最好,要根根據(jù)工作實際際的需要而定定。實踐證明,抽樣樣調(diào)查方法產(chǎn)產(chǎn)生的平均指指標(biāo)抽樣誤差差,主要來自自于三個方面面:一是受樣本個體體數(shù)量的影響響。樣本個體體數(shù)量大代表表性就強,誤誤差就?。环捶粗硇孕跃筒?,誤差差就大。二是受

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負(fù)責(zé)。
  • 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時也不承擔(dān)用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

評論

0/150

提交評論