版權說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權,請進行舉報或認領
文檔簡介
統(tǒng)計基礎
抽樣推斷分析法7.1.1抽樣推斷的意義抽樣推斷是一種非全面的調(diào)查。抽樣推斷是按照隨機性的原則,從研究對象中抽取一部分進行觀察,并根據(jù)所得到的觀察數(shù)據(jù),對研究對象的數(shù)量特征做出具有一定可靠程度的估計和推斷,以達到認識總體的一種統(tǒng)計方法。7.1.2抽樣推斷的特點抽樣推斷的特點主要表現(xiàn)在以下幾個方面。(1)抽樣推斷屬于非全面調(diào)查的一種,它只調(diào)查總體中的一部分單位,而全面調(diào)查需要對總體中的所有單位都進行調(diào)查。(2)按照隨機原則從總體中抽取樣本單位。而典型調(diào)查、重點調(diào)查抽取樣本單位時是有意識地選取單位。(3)抽樣推斷是用樣本的指標數(shù)值去推斷總體的指標數(shù)值。抽樣推斷的目的不在于了解部分單位的情況,而是根據(jù)這部分單位的數(shù)量特征來推斷總體的數(shù)量特征。(4)抽樣誤差是可以事先計算并控制的。在抽樣推斷中,以樣本指標去推斷總體指標不可避免地會產(chǎn)生抽樣誤差,但抽樣誤差是可以事先通過一定的資料加以計算,并在抽樣過程中可以采取一定的措施來控制誤差,從而保證抽樣推斷的結果達到一定的可靠程度。抽樣推斷分析法7.1.3抽樣推斷適用范圍由于抽樣推斷具有省時、省力、經(jīng)濟等特點,因此抽樣推斷在統(tǒng)計工作中應用非常廣泛。(1)有些事物在測量或試驗時有破壞性,不可能進行全面調(diào)查。例如炸彈的爆炸能力檢測、人體血液指標化驗、衣料成分含量檢測等,都是有破壞性的,不可能進行全面調(diào)查,只能使用抽樣推斷。(2)有限總體從理論上講可以進行全面調(diào)查,但沒有必要進行全面調(diào)查。例如,了解水庫里魚尾數(shù)、城鎮(zhèn)居民可支配收入、農(nóng)民純收入等等。對這類情況的了解一般采取抽樣推斷。(3)全面調(diào)查后往往采取抽樣推斷的方法檢查其質(zhì)量。如歷次全國人口普查后,都要進行人口抽樣,以檢查人口普查中各項指標的準確性。(4)無限總體。如對生產(chǎn)流水線上的產(chǎn)品進行質(zhì)量控制,可以認為產(chǎn)品是無限總體。抽樣推斷分析法7.1.4抽樣推斷中的一些基本概念(1)總體指標根據(jù)總體各個單位的標志值或標志特征計算的、反映總體某種屬性的綜合指標,稱為總體指標??傮w指標又稱為全及指標。由于總體是唯一確定的,根據(jù)總體計算的總體指標也是唯一確定的。不同性質(zhì)的總體,需要計算不同的總體指標。對于變量總體,由于各單位的標志可以用數(shù)量來表示,所以可以計算總體平均數(shù)。
對于屬性總體,由于各單位的標志不可以用數(shù)量來表示,只能用品質(zhì)標志來描述,例如合格與不合格,所以,對于屬性總體只能計算結構相對指標,稱為總體成數(shù)。用大寫英文字母
表示,它說明總體中具有某種標志的單位數(shù)在總體中所占的比重。變量總體也可以計算成數(shù),即總體單位數(shù)在所規(guī)定的某變量值以上或以下的比重,視同具有或不具有某種屬性的單位數(shù)比重。設總體
個單位中,有
個單位具有某種屬性,
個單位不具有某種屬性,
,
為總體中具有某種屬性的單位數(shù)所占的比重,
為不具有某種屬性的單位數(shù)所占的比重,則總體成數(shù)為
抽樣推斷分析法此外,總體指標還有總體方差
和總體標準差
,它們都是測量總體標志值分散程度的指標。抽樣推斷分析法(2)樣本指標
根據(jù)樣本各個單位的標志值或標志特征所計算的指標稱為樣本指標。和總體指標相對應還有樣本平均數(shù)
、樣本成數(shù)
、樣本標準差
和樣本方差
等。
和
用小寫英文字母表示,以示區(qū)別。設樣本
個單位中有
個單位具有某種屬性,
個單位不具有某種屬性,
,
為樣本中具有某種屬性的單位數(shù)所占的比重,
為不具有某種屬性的單位數(shù)所占的比重,則成數(shù)為抽樣推斷分析法抽樣推斷分析法(3)重復抽樣與不重復抽樣在抽樣調(diào)查中,從總體中抽取樣本時,根據(jù)抽取每個單位是否允許重復抽取可將抽取樣本方法分為重復抽樣和不重復抽樣。重復抽樣。其特點是:①每次抽中的單位將其數(shù)量標志登記后放回原總體,重新參加下一次抽選。②每個單位在每次抽取過程中,抽中與不抽中的機會都完全一樣。不重復抽樣其特點是:①每個單位最多只能被抽中一次。②每個單位抽中與不抽中的機會在各次抽選過程中是不一樣的。(4)抽樣的組織形式①簡單隨機抽樣簡單隨機抽樣主要有以下兩種做法:1)抽簽法。2)隨機數(shù)表法。②分層抽樣③等距抽樣④整群抽樣抽樣推斷分析法(5)抽樣誤差①抽樣誤差抽樣誤差是指通過調(diào)查搜集到的數(shù)據(jù)與研究對象真實結果之間的差異。抽樣誤差有兩類:登記性誤差和代表性誤差。登記性誤差是指在調(diào)查過程中,由于觀察、測量、登記、計算上的差錯所引起的工作誤差。代表性誤差是指用總體中的部分單位的統(tǒng)計數(shù)據(jù)為代表去推斷總體指標所產(chǎn)生的誤差。隨機誤差可以分為抽樣實際誤差和抽樣平均誤差。②抽樣平均誤差抽樣平均誤差是指所有可能出現(xiàn)的樣本指標與總體指標之間的平均離差,用以反映抽樣誤差的一般水平。抽樣推斷分析法③影響抽樣平均誤差的因素1)總體標志的變異程度??傮w標志變異程度越大,抽樣平均誤差就越大;反之,總體標志變異程度越小,則抽樣平均誤差就越小。2)樣本容量
的多少。在其他條件不變的情況下,樣本容量
越大,抽樣誤差就越??;反之,抽樣誤差越大。3)抽樣方法的選擇。在抽樣調(diào)查時,采用何種方式和組織形式會直接影響到抽樣誤差的大小。在相同的情況下,不重復抽樣比重復抽樣的誤差小,是因為重復抽樣存在同一單位被多次抽中的可能,所以樣本對總體的代表性就較差。④抽樣平均誤差的計算1)抽樣平均數(shù)的平均誤差設以
表示抽樣平均數(shù)的平均誤差,
表示全部可能的樣本數(shù)目,則抽樣推斷分析法(6)抽樣極限誤差①抽樣極限誤差的概念和計算抽樣平均誤差說明了某一總體的所有樣本指標與總體指標間誤差的平均數(shù),但在實際工作中往往只能抽取一個樣本,因此實際抽樣誤差一般不會等于抽樣平均誤差。②抽樣估計的概率度抽樣極限誤差
是單個樣本值與總體指標值之間的絕對離差,而抽樣平均誤差
是所有可能樣本值與總體指標值之間的平均離差,用抽樣極限誤差與抽樣平均誤差相比,從而使由單一樣本值得到的抽樣極限誤差標準化,這樣可稱為抽樣標準極限誤差,但通常稱其為概率度
或相對誤差范圍。③抽樣估計的可靠程度置信區(qū)間的測定總是在一定的概率保證程度下進行的,因為既然抽樣誤差是一個隨機變量,就不能指望抽樣指標落在置信區(qū)間內(nèi)成為必然事件,只能視為一個可能事件,這樣就必定要用一定的概率來給予保證。抽樣推斷分析法7.2.1點估計點估計也稱定值估計,它是以抽樣得到的樣本指標作為總體指標的估計量,并以樣本指標的實際值直接作為總體未知參數(shù)的估計值的一種推斷方法。如電信公司隨機抽取了最近一個月100位客戶的賬單,計算每個客戶的通話時長為308分鐘,用這個樣本均值統(tǒng)計量作為總體均值的一個估計量,那么這個樣本均值就是被用作點估計。點估計的精度取決于樣本的代表性。如果從總體中抽取了其他的隨機樣本,那么這些樣本的點估計有可能不同。所以點估計適用于對推斷準確程度與可靠程度要求不高的情況。抽樣推斷分析法7.2.2區(qū)間估計點估計能夠給出總體參數(shù)的具體估計值,但是點估計無法提供這個估計值的精確性和可靠性。區(qū)間估計就是以一定的概率保證估計包含總體參數(shù)的一個值域,即根據(jù)樣本指標和抽樣平均誤差推斷總體指標的可能范圍。它包括兩部分內(nèi)容:一是這一可能范圍的大??;二是總體指標落在這個可能范圍內(nèi)的概率。區(qū)間估計既說清估計結果的準確程度,又同時表明這個估計結果的可靠程度,所以區(qū)間估計是比較科學的。用樣本指標來估計總體指標,要達到100%的準確而沒有任何誤差,幾乎是不可能的,所以在估計總體指標時就必須同時考慮估計誤差的大小。抽樣推斷分析法在重復抽樣情況下,抽樣平均數(shù)的平均誤差
與總體標準差
和樣本容量
有關,計算公式不重復抽樣條件下,抽樣平均數(shù)的平均誤差
不僅與總體標準差
和樣本容量
有關,還和總體單位數(shù)
有關,其計算公式抽樣推斷分析法由于
和
是預先給定的抽樣方案中所允許的誤差范圍,所以利用
和
可以反過來估計未知的總體指標的取值可能的范圍。抽樣推斷分析法在抽樣調(diào)查時,應當確定一個適當?shù)臉颖救萘?,也就是抽取多大的樣本來估計總體參數(shù)。樣本的容量越大,抽樣誤差就越小,但是樣本容量越大,成本就越高;樣本容量過小,使得抽樣誤差增大。抽樣推斷分析法7.3.1樣本容量的概念7.3.2影響樣本容量的因素(1)總體各單位標志值的差異程度。在其他條件不變的情況下,總體各單位標志值的差異度越大,樣本對總體的代表性就越小,就需要更大的樣本容量;總體各單位標志值的差異度越小,樣本對總體的代表性就越大,就需要小一些的樣本容量。(2)抽樣極限誤差的大小。在其他條件不變的情況下,要求的抽樣誤差越小,則需要需要的樣本容量越大,反之也亦然。對于重復抽樣而言,在其他條件不變的情況下,誤差范圍縮小
,則樣本容量必須增加至4倍;而誤差范圍擴大1倍,則樣本容量只需原來的
。(3)抽樣推斷的置信度。抽樣推斷要求的置信度越高,則需要的樣本容量越大,如果要求的置信度越低,則需要的樣本容量則可以小一些。抽樣推斷分析法7.3.3樣本容量的計算(1)推斷總體均值時樣本容量的確定重復抽樣時:不重復抽樣時:(2)推斷總體成數(shù)時樣本容量的確定①重復抽樣時:抽樣推斷分析法②不重復抽樣時:抽樣推斷分析法7.3.4樣本容量的計算時應注意的問題(1)計算得到的樣本容量如果是小數(shù)時,一般是取整,小數(shù)是只進不舍,而不是通常的四舍五入的方法。(2)在相同條件下,不重復抽樣需要的樣本容量要比重復抽樣的樣本容量要小。在實際工作中,一般
比較大時,兩個公式的計算的結果相差不大,所以計算一般使用重復抽樣的公式以簡化計算。(3)對于同一總體既要進行樣本平均數(shù)的推斷,又要進行樣本成數(shù)的推斷時,應采用較大的樣本容量,使之同時滿足兩個指標的抽樣要求。抽樣推斷分析法
相關分析與回歸分析法8.1.1相關關系的含義
(1)函數(shù)關系函數(shù)關系是指變量之間存在的一種完全確定性的一一對應關系,在這種關系中,對于某一變量的一個數(shù)值,都有另一變量的唯一確定的值與之對立??陀^世界的各種現(xiàn)象之間,特別是在自然界,廣泛存在著函數(shù)關系。(2)相關關系相關關系是指變量之間的一種不完全確定的關系,即對于某一變量的每一個數(shù)值,另一變量有若干個數(shù)值與之相適應在相關關系中,相互聯(lián)系的現(xiàn)象之間通常存在著一定的、因果關系,這時就把其中起著影響作用的變量叫作自變量(用x來表示),由于受到自變量響而發(fā)生變動的變量叫作因變量(用y來表示)。8.1.2相關關系的類型(1)按變量之間相關因素的多少分按變量之間的相關因素的多少分,有單相關和復相關。(2)按變量之間相關關系的方向分按變量之間相關關系的方向分,有正相關和負相關。(3)按變量之間相關關系的表現(xiàn)形式分按變量之間相關關系的表現(xiàn)形式分,有直線相關和曲線相關。(4)按變量之間相關的程度分
按變量之間相關的程度分,有完全相關、不相關和不完全相關。相關分析與回歸分析法8.1.3相關關系分析的內(nèi)容
(1)相關分析通過相關分析,確定現(xiàn)象之間有無關系及相關關系的表現(xiàn)形式。①確定現(xiàn)象之間相關關系的類型由于相關分析的研究對象是現(xiàn)象之間的相關關系,然而現(xiàn)象之間有無關系是個定性認識的問題。所以進行相關分析之前,首先要根據(jù)經(jīng)濟理論、專業(yè)知識和實踐經(jīng)驗對被研究對象進行定性判斷。當確認現(xiàn)象之間具有相關關系時,才能運用相關分析方法進行定量分析。為了驗證定性判斷是否正確,還要運用大量的實際資料,通過編制相關表、繪制相關圖及計算相關系數(shù)對被研究現(xiàn)象是否真正存在相關關系,以及相關關系的形式做出進一步的判斷。②測定現(xiàn)象之間相關關系的密切程度由于相關關系是一種不嚴格的數(shù)量關系,它們的關系有的不大密切,有的比較密切。所以相關分析的一個重要內(nèi)容,就是要從現(xiàn)象之間不嚴格的數(shù)量關系中想辦法來判斷它們之間相關關系的密切程度,只有相關關系的密切程度達到一定的標準,對其進行研究才具有實際意義。判斷相關關系密切程度的主要方法是計算相關系數(shù)或相關指數(shù)。相關圖表能幫助我們做出一般性的判斷,相關系數(shù)能從數(shù)量上明確說明直線相關關系的密切程度與方向,要確定曲線相關關系的密切程度則需要計算相關指數(shù)。相關分析與回歸分析法(2)回歸分析
通過回歸分析,說明現(xiàn)象變量之間的數(shù)量影響關系。
①建立相關變量之間的一般關系的數(shù)學表達式(即回歸方程)
如果相關的程度高,就需要進行回歸分析,即建立相關變量之間的一般關系的數(shù)學表達式。如果現(xiàn)象之間表現(xiàn)為直線相關,采用配合直線方程的方法;如果表現(xiàn)為曲線相關,就采用配合曲線方程的方法。所配合的方程稱為回歸方程式,它是進行判斷、推算和預測的依據(jù)。②對因變量估計值的可靠程度進行檢驗
根據(jù)回歸方程,可以給出自變量的若干數(shù)值,求得因變量的相應的估計值。估計值與實際值之間存在誤差的,確定因變量估計值誤差大小的指標叫作回歸誤差?;貧w誤差越小,則因變量估計值的可靠程度越高;反之,因變量估計值的可靠程度越低。相關分析與回歸分析法8.2.1相關表和相關圖對兩個現(xiàn)象變量作相關分析時,首先必須取得一系列的成對的統(tǒng)計資料。這是相關分析的原始數(shù)據(jù)。根據(jù)資料是否經(jīng)過分組,相關表可以分為簡單相關表與分組相關表。簡單相關表是指根據(jù)總體單位的原始資料,將其中一個變量的數(shù)值按一定的順序排列,同時列出與之對應的另一個變量的變量值而形成的表格。例如,研究棉紗產(chǎn)量與單位成本之間的關系,搜集數(shù)據(jù)排列形成表8—1就是簡單相關表。相關分析與回歸分析法月份產(chǎn)量(噸)單位成本(千元/噸)1977.22100731036.941096.751106.561156.571087.281067.291146.8101186.8表8—1某種棉紗產(chǎn)量與單位成本之間的關系相關分析與回歸分析法相關圖也稱散點圖,是根據(jù)原始數(shù)據(jù),在直角坐標中繪制出兩個變量相對應的觀察值的所有點,從這些點的分布情況觀察分析兩個變量間的關系,這個圖稱為相關圖。該圖表明相關點分布狀況,如將上表的資料畫在一坐標系中,以x軸代表產(chǎn)量,y軸代表單位成本,各點的分布狀況如圖,即散點圖(相關圖)。相關分析與回歸分析法分組相關表和相關圖當相關資料包括的對應數(shù)值很多時,直接根據(jù)兩變量各原始值編制相關表、繪制相關圖進而計算各相關指標,工作量很大,且相關表會很長,也不方便,相關圖也不好繪制,在這種情況下,可編制分組相關表或繪制分組相關圖。分組相關表是指將原始資料按某一變量的變量值進行統(tǒng)計分組,并計算相對應的變量值的平均數(shù)以后整理形成的表格。例如,為研究耕作深度與畝產(chǎn)量的關系,分別搜集了30塊地的耕作深度與畝產(chǎn)量的數(shù)據(jù),共60個數(shù)據(jù)值。由于數(shù)據(jù)多,所以把30塊地按耕作深度分組,形成成分組相關表如表8一2。
耕作深度(厘米)
田塊數(shù)(塊)平均畝產(chǎn)量(公斤/畝)81012141618459741427498568631683734
合計30——表8—2某鄉(xiāng)某農(nóng)作物耕作深度與平均畝產(chǎn)量分組資料相關分析與回歸分析法8.2.2相關系數(shù)相關關圖表可以幫助我們直觀地看出所觀察的兩個現(xiàn)象的數(shù)量變動之間是否存在直線相關關系和相關方向。相關系數(shù)是研究和判斷兩個現(xiàn)象之間線性相關密切程度大小的一個統(tǒng)計分析指標。通常用r來表示。
相關系數(shù)的最簡單的一種計算方法是積差法,它是用兩個變量的協(xié)方差與其標準差的乘積之比來計算的。其計算公式如下:
從上式可以看到,相關系數(shù)的性質(zhì)表現(xiàn)為:(1)取值范圍是在一1和+1之間,即一l≤r≤+1;(2)r>0為正相關,r<0則為負相關;(3)r的絕對值越接近于1,表示相關關系越強,越接近于0,表示相關關系越弱;(4)|γ|=1,則表明兩個變量完全相關,r=0,則表明兩個變量不存在直線相關關系。
相關分析與回歸分析法分組相關表更能清晰地反映兩變量之間相關關系的存在。從分組相關表中可以看出,耕作深度每增加2厘米,平均畝產(chǎn)量增加大致均等的量(即60公斤左右),由此可以初步判斷耕作深度與畝產(chǎn)量之間存在直線正相關關系。相關分析與回歸分析法8.3.1回歸分析的意義
(1)回歸分析的含義和種類(2)回歸分析的特點
一元線性回歸分析具有以下特點:
①區(qū)分自變量和因變量。兩含變量不是對等的,必須區(qū)分出自變量和因變量。如果是互為因果關系則根據(jù)研究的目的來確定因變量(y)與自變量(x)。②求回歸方程。在沒有明顯的因果關系的兩個變量x與y之間可以求得兩個回歸方程——y依x的回歸方程及x依y的回歸方程。兩個方程是互相獨立的,不能互相替換。
③回歸方程的作用?;貧w方程的主要作用在于給出自變量的數(shù)值來估計因變量的數(shù)值。一個回歸方程只能做一種推算。相關分析與回歸分析法8.3.2直線回歸方程的建立與應用
直線的一般方程為:y=a+bx,這個方程中的y值是x值的函數(shù),是確定性關系,也就是說只要給定一個x
溫馨提示
- 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權益歸上傳用戶所有。
- 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預覽,若沒有圖紙預覽就沒有圖紙。
- 4. 未經(jīng)權益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
- 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負責。
- 6. 下載文件中如有侵權或不適當內(nèi)容,請與我們聯(lián)系,我們立即糾正。
- 7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。
最新文檔
- 2025年度餐飲企業(yè)外賣配送服務合同6篇
- 2025年度生物制藥研發(fā)與生產(chǎn)合同模板3篇
- 二零二五年度智能化別墅建造及智能化系統(tǒng)采購合同3篇
- 《養(yǎng)老機構服務合同》示范文本
- 違法分包對揭陽匯金中心C項目影響評估合同(2025版)3篇
- 2025年網(wǎng)絡平臺肖像權授權使用合同3篇
- 二零二五年度蟲草資源保護與可持續(xù)利用合同范本3篇
- 2024私人之間的房屋買賣合同樣本
- 2024腳手架工程安全施工與技術服務協(xié)議版
- 2025年度智慧城市安全監(jiān)控系統(tǒng)設備采購合同2篇
- 橫格紙A4打印模板
- CT設備維保服務售后服務方案
- 重癥血液凈化血管通路的建立與應用中國專家共識(2023版)
- 兒科課件:急性細菌性腦膜炎
- 柜類家具結構設計課件
- 陶瓷瓷磚企業(yè)(陶瓷廠)全套安全生產(chǎn)操作規(guī)程
- 煤炭運輸安全保障措施提升運輸安全保障措施
- JTGT-3833-2018-公路工程機械臺班費用定額
- 保安巡邏線路圖
- (完整版)聚乙烯課件
- 建筑垃圾資源化綜合利用項目可行性實施方案
評論
0/150
提交評論