版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進行舉報或認領(lǐng)
文檔簡介
第四講統(tǒng)計學中的相關(guān)分析*2第一節(jié)相關(guān)分析的意義和種類
一、相關(guān)分析的意義現(xiàn)象總體各單位可以有若干個數(shù)量標志,這些數(shù)量標志之間都有一定的關(guān)系,有的關(guān)系密切一些,有的關(guān)系松散一些。一般地說,如果總體中某個變量x的每一個數(shù)值,與總體中另一個變量y的數(shù)值有對應(yīng)關(guān)系,我們則將其稱為二元總體。如果總體中某個變量x的每一個數(shù)值,與總體中另外若干個變量值有對應(yīng)關(guān)系,則可將其稱為多元總體。我們僅討論二元總體的情形。*3對于二元總體,我們將關(guān)注以下幾個問題:兩個變量是不是存在關(guān)系,關(guān)系的密切程度如何,如商品銷售額是否與它的價格有關(guān)系,關(guān)系密切到什么程度等。
如果存在關(guān)系,那么這種關(guān)系的表現(xiàn)形式是什么。兩個變量是同方向變動,還是反方向變動;是線性變動,還是非線性變動。
怎樣根據(jù)一個變量的變動來估計另一個變量的變動。例如,從全社會固定資產(chǎn)投資額的變動來估計國內(nèi)生產(chǎn)總值的變動,從居民收入的變動來估計零售商品銷售額的變動等。
相關(guān)分析就是研究兩個或兩個以上變量之間相互關(guān)系的統(tǒng)計分析方法。本章將通過分析二元總體的相關(guān)關(guān)系,來提供相關(guān)分析的一般模式。社會經(jīng)濟現(xiàn)象總體中的兩個變量往往表現(xiàn)為因素標志和結(jié)果標志的的相互關(guān)系,即自變量和因變量之間的因果關(guān)系。自變量和因變量之間的關(guān)系可以概括為兩種類型,即函數(shù)關(guān)系和相關(guān)關(guān)系。函數(shù)關(guān)系是指客觀現(xiàn)象存在的一種完全確定的相互依存關(guān)系,即自變量的每一個取值,因變量會有唯一確定的數(shù)值與之對應(yīng)。函數(shù)分析中的自變量和因變量有嚴格的區(qū)別,不能互換。相關(guān)關(guān)系是客觀現(xiàn)象存在的一種非確定的相互依存關(guān)系,即自變量的每一個取值,因變量由于受隨機因素影響,與其所對應(yīng)的數(shù)值是非確定性的。相關(guān)分析中的自變量和因變量沒有嚴格的區(qū)別,可以互換。社會經(jīng)濟的很多原發(fā)現(xiàn)象都是以相關(guān)關(guān)系表現(xiàn)出來的。相關(guān)關(guān)系不能用數(shù)學方程式表示,只能用相關(guān)表、相關(guān)圖及相關(guān)系數(shù)來分析。*4二、相關(guān)關(guān)系的概念
*5三、相關(guān)關(guān)系的種類
(一)單相關(guān)和復(fù)相關(guān)相關(guān)關(guān)系按影響因素的多少可分為單相關(guān)和復(fù)相關(guān)單相關(guān)就是結(jié)果標志只受一個因素標志影響的相關(guān)關(guān)系。即所謂二元總體的情形,有一個自變量和一個因變量。復(fù)相關(guān)就是結(jié)果標志受兩個或兩個以上因素標志影響的相關(guān)關(guān)系。即所謂多元總體的情形,一個因變量受多個自變量的影響。社會經(jīng)濟現(xiàn)象大多是復(fù)相關(guān)關(guān)系。
相關(guān)關(guān)系按表現(xiàn)形態(tài)可分為線性相關(guān)和非線性相關(guān),相關(guān)關(guān)系本身是一種在數(shù)量上不嚴格的依存關(guān)系。如果兩個變量所對應(yīng)的取值在直角坐標系中近似于一條直線,則可將這兩個變量的關(guān)系稱為線性相關(guān)。如果兩個變量所對應(yīng)的取值在直角坐標系中近似于一條曲線,則可將這兩個變量的關(guān)系稱為非線性相關(guān)。現(xiàn)實生活中大多數(shù)現(xiàn)象都表現(xiàn)為非線性相關(guān)。有時非線性相關(guān)現(xiàn)象可以轉(zhuǎn)化為線性相關(guān)現(xiàn)象來分析。例如,股票的長期K線圖呈現(xiàn)為曲線,但幾天或幾周的K線圖可視為直線。*6(二)線性相關(guān)和非線性相關(guān)*7(三)正相關(guān)和負相關(guān)相關(guān)關(guān)系按變動方向可分為正相關(guān)和負相關(guān)如果相關(guān)關(guān)系表現(xiàn)為因素標志和結(jié)果標志的數(shù)值在變動方向上保持一致,則稱為正相關(guān)。例如家庭收入增加,銀行儲蓄也會增加。如果相關(guān)關(guān)系表現(xiàn)為因素標志和結(jié)果標志的數(shù)值在變動方向上相反,則稱為負相關(guān)。例如企業(yè)的生產(chǎn)規(guī)模越大,產(chǎn)品的單位成本就越低?,F(xiàn)象總體表現(xiàn)出來的正相關(guān)或負相關(guān)是有一定條件和范圍的。某種現(xiàn)象不會永遠以正相關(guān)表現(xiàn),也不會永遠以負相關(guān)表現(xiàn)。例如,在一定的范圍內(nèi),增加施肥量能提高農(nóng)作物的產(chǎn)量,但如果施肥過多,反而使莊稼只長葉子,不長果實,最后可能收獲量很少。*第八章相關(guān)分析8四、相關(guān)分析的主要內(nèi)容
第一,判定相關(guān)關(guān)系呈現(xiàn)的形態(tài)、方向、以及相關(guān)關(guān)系的密切程度。判定的方法主要有繪制相關(guān)圖表和計算相關(guān)系數(shù)。第二,將相關(guān)關(guān)系轉(zhuǎn)化為函數(shù)關(guān)系來分析,即將變量的相關(guān)關(guān)系擬合成一個數(shù)學表達式。如果現(xiàn)象呈現(xiàn)線性相關(guān),我們就采用配合直線方程式的方法;如果現(xiàn)象呈現(xiàn)非線性相關(guān),我們就采用配合曲線方程式的方法。第三,確定因變量估計值誤差的程度。用數(shù)學表達式來代表變量之間的相關(guān)關(guān)系,必然會產(chǎn)生誤差,我們可計算這種估計標準誤差。估計標準誤差大,說明數(shù)學表達式的代表性差。反之,估計標準誤差小,說明數(shù)學表達式的代表性好,預(yù)測較為精確。相關(guān)分析的主要內(nèi)容有:*9第二節(jié)相關(guān)圖表和相關(guān)系數(shù)一、相關(guān)表的編制相關(guān)表可分為簡單相關(guān)表和分組相關(guān)表。相關(guān)表屬于統(tǒng)計表的一種。(一)簡單相關(guān)表簡單相關(guān)表是資料未經(jīng)分組的相關(guān)表,它是直接將原始數(shù)據(jù)中的自變量與因變量一一對應(yīng)排列,并將變量值按從小到大排序形成的統(tǒng)計表。從表中可以直觀地看出:隨著產(chǎn)量的增加,單位成本有逐漸降低的趨勢,但不是與產(chǎn)量成等比例地降低,即產(chǎn)量與單位成本呈現(xiàn)負相關(guān)關(guān)系。產(chǎn)量與單位成本這種變動關(guān)系體現(xiàn)了產(chǎn)品生產(chǎn)的規(guī)模經(jīng)濟效果。*10例8‐1某企業(yè)最近不斷擴大產(chǎn)品生產(chǎn)規(guī)模,每次擴大規(guī)模后產(chǎn)品產(chǎn)量與單位成本的相關(guān)資料如下表所示:某企業(yè)產(chǎn)品產(chǎn)量與單位成本資料
產(chǎn)量(萬件)x
單位成本(元)y
101632405060767267656359*11分組相關(guān)表是將原始數(shù)據(jù)進行分組而編制的統(tǒng)計表,它適用于資料數(shù)量很大的情況。下表為某地132戶居民人均收入與人均支出的分組相關(guān)表:(二)分組相關(guān)表分組相關(guān)表的自變量分組可以是單項式的,也可以是組距式的。本例為組距式,人均年收入以組中值表示。某地人均收入與人均支出的樣本資料
人均年收入(千元)組中值x(千元)戶數(shù)(戶)人均年支出y(千元)1.0以下1.0~2.02.0~3.03.0~4.04.0~5.05.0以上915233736120.51.52.53.54.55.50.51.21.82.23.64.0從表中可以看出:人均收入與人均支出的關(guān)系是正相關(guān)關(guān)系。即人均收入越高,相應(yīng)的人均支出也越多。*12二、相關(guān)圖的繪制相關(guān)圖又稱散點圖,它是將相關(guān)表中的觀察值在平面直角坐標系中用坐標點描繪出來的圖形。相關(guān)圖可以用來直觀地分析兩個變量相關(guān)的分布狀況。本例人均收入x與人均支出y呈現(xiàn)正相關(guān)關(guān)系,且相關(guān)程度較為密切。
下圖根據(jù)以上分組相關(guān)表資料繪制的:4321
??
??
?
?
01234560123456*13三、相關(guān)系數(shù)的計算和分析相關(guān)系數(shù)是測定變量之間相關(guān)密切程度的比較完善的指標。單相關(guān)是最基本的相關(guān)關(guān)系,而測定單相關(guān)的相關(guān)系數(shù)是最基本的相關(guān)分析方法。
0123456(一)相關(guān)系數(shù)計算公式剖析
計算公式為:*第八章相關(guān)分析14
0123456式中:是x和y的協(xié)方差;是x的標準差;是y的標準差。
1.協(xié)方差的意義
協(xié)方差是一個積差平均數(shù),可用來度量x和y的相關(guān)關(guān)系。協(xié)方差有兩個作用:一是它的數(shù)值有正有負,可表明兩個變量是正相關(guān)還是負相關(guān)。二是協(xié)方差數(shù)值的大小可表明兩個變量相關(guān)程度的大小。*15
0123456協(xié)方差的正負號與相關(guān)方向的關(guān)系圖示:Ⅰ
ⅡⅢⅣ
當相關(guān)點分布在Ⅰ和Ⅲ兩部分時,協(xié)方差表現(xiàn)為正數(shù),說明是正相關(guān);當相關(guān)點分布在Ⅱ和Ⅳ兩部分時,協(xié)方差表現(xiàn)為負數(shù),說明是負相關(guān)。從圖中可看出:*16
0123456協(xié)方差數(shù)值的大小與與變量相關(guān)程度大小的關(guān)系
如果相關(guān)點呈散亂分布狀態(tài),表明兩個變量的相關(guān)程度較低,這時因正負項相互抵消,所以絕對值很小,即協(xié)方差的絕對值很小,從而相關(guān)系數(shù)的絕對值也很小,表示x和y的相關(guān)程度較低。反之,若相關(guān)點的分布十分靠近某一直線,這時少有正負項抵消或沒有正負項抵消,則協(xié)方差的絕對值較大,表示x和y的相關(guān)程度密切。協(xié)方差是個隨機變量,可大可小,不能直接作為相關(guān)系數(shù)。*17
01234562.標準差的作用
標準差和的作用在于對協(xié)方差進行標準化處理:
由于
≥0所以
2r+2
≥0,r≥-1;-2r+2≥0,r≤1;-1≤r≤1或∣
r∣≤1當x和y完全相關(guān)時,且*18
0123456和
所以有:
即∣r∣=1,*19
0123456(二)相關(guān)系數(shù)的性質(zhì)
相關(guān)系數(shù)只適用于線性相關(guān)的現(xiàn)象,其性質(zhì)有如下幾點:1.當=1時,x和y為完全線性相關(guān),即存在線性函數(shù)關(guān)系。
2.當r>0時,表示x和y為正相關(guān);當r<
0時,為負相關(guān)。3.當=1時,即零相關(guān),表示x和y沒有線性相關(guān)關(guān)系。零相關(guān)表示x和y不相關(guān)或存在非線性關(guān)系。4.當0<<1時,表示x和y存在著一定的線性相關(guān)關(guān)系。<0.3稱為微弱相關(guān);<0.5稱為低度相關(guān);0.3≤<0.8稱為顯著相關(guān);0.5≤<1稱為高度相關(guān);0.8≤相關(guān)系數(shù)的的基本公式比較煩瑣,其簡式計算方法有:
*20
0123456(三)相關(guān)系數(shù)的簡化計算公式
*21
0123456例8‐2試根據(jù)下表資料,計算產(chǎn)品產(chǎn)量與單位成本的相關(guān)系數(shù)。產(chǎn)品產(chǎn)量與單位成本相關(guān)系數(shù)計算表
產(chǎn)量(萬件)序號123456合計10163240506208單位成本(元)
76726765635940210025610241600250036009080577651844489422539693481271247601152214426003150354013346即產(chǎn)品產(chǎn)量與單位成本呈現(xiàn)高度負相關(guān)。*22
0123456例8‐3試根據(jù)下表分組資料計算某地人均收入與人均支出的相關(guān)系數(shù)。
某地人均收入與人均支出的樣本資料
人均年收入(千元)組中值x(千元)戶數(shù)(戶)人均年支出y(千元)1.0以下1.0~2.02.0~3.03.0~4.04.0~5.05.0以上915233736120.51.52.53.54.55.50.51.21.82.23.64.0將上表資料計算如下(先利用表格計算):合計
人均收入與人均支出相關(guān)系數(shù)計算表
0.51.52.53.54.55.50.51.21.82.23.64.013.3915233736121324.522.557.5129.5162.066.0442.04.518.041.481.4129.648.0322.92.327.0103.5284.9583.2264.01264.92.2533.75143.75453.25729.00363.001725.002.2521.6074.52179.08466.56192.00936.01*23
0123456然后可用簡化公式計算如下:式中:計算結(jié)果表明該地居民人均收入與人均支出呈高度正相關(guān)關(guān)系?;貧w分析就是對具有相關(guān)關(guān)系的兩個或兩個以上變量之間數(shù)量變化的一般關(guān)系進行測定,確立一個相應(yīng)的數(shù)學表達式,以便從一個已知量來推測另一個未知量,為估算預(yù)測提供基礎(chǔ)的一種重要方法。*24第三節(jié)回歸分析一、回歸分析的意義相關(guān)分析是回歸分析的基礎(chǔ),回歸分析是相關(guān)分析的深入。只有當兩個變量具有顯著相關(guān)的情況下,進行線性回歸分析才有意義。按自變量的個數(shù)分,有一元回歸分析和多元回歸分析。一元回歸方程中只有一個自變量,多元回歸方程中,有兩個或兩個以上自變量。按回歸線的形狀分,有線性回歸分析和非線性回歸分析。其中,線性回歸分析是最基本的。本章只介紹一元線性回歸分析,即直線回歸分析。*25回歸分析的種類:*26二、直線回歸方程(一)直線回歸方程的建立當x和y呈現(xiàn)完全線性相關(guān)時,設(shè),則可用一元線性方程式表示:若兩個變量之間存在著顯著的相關(guān)關(guān)系,可在其相關(guān)圖的散點中引出一條模擬的直線,我們稱這條直線為估計回歸線,配合回歸線的方程式稱回歸方程。即:式中:yc表示y的估計值;a表示直線的起始值,在數(shù)學上稱為直線在縱軸上的截距;b表示自變量增加一個單位時因變量平均增加的值,數(shù)學上稱為斜率,這里被稱為回歸系數(shù)。a、b是兩個待定的參數(shù)。
最小二乘法的思路是:原始數(shù)據(jù)y與它的估計值yc之間存在離差,如果在求解出a、b的同時,能使這些離差的平方之和為最小,那么得到的回歸方程將是一條最能反映原始數(shù)據(jù)變化規(guī)律的理想直線。
*27用最小二乘法來求解直線方程式參數(shù)a、b
設(shè)以Q表示y對于yc的離差平方和,則有分別對a、b求一階偏導(dǎo),并令一階偏導(dǎo)等于0,有*28整理后得解之可得最小二乘法的數(shù)學基礎(chǔ)是為最小和*29例8‐4根據(jù)下表資料擬合一直線方程,并估算產(chǎn)量為70萬件時的單位成本。產(chǎn)品產(chǎn)量與單位成本資料及計算表
產(chǎn)量(萬件)序號123456合計10163240506208單位成本(元)
767267656359402100256102416002500360090807601152214426003150354013346可計算如下:*30得直線趨勢方程:當產(chǎn)量為70萬件時,可估算產(chǎn)品的單位成本為:回歸系數(shù)b的經(jīng)濟意義為:產(chǎn)品產(chǎn)量每增加1萬件,單位成本平均來說降低0.32元。注意:回歸系數(shù)b的正負號與同例的相關(guān)系數(shù)是相同的。
(元)注意:預(yù)測時只能給定自變量估算或預(yù)測因變量,不能給定因變量來估算或預(yù)測自變量。*31例8‐5根據(jù)下表資料試擬合一直線方程,并估算人均收入為6000元時,人均支出為多少?可計算如下:合計
某地人均收入與人均支出資料及計算表
0.51.52.53.54.55.50.51.21.82.23.64.013.3915233736121324.522.557.5129.5162.066.0442.04.518.041.481.4129.648.0322.92.327.0103.5284.9583.2264.01264.92.2533.75143.75453.25729.00363.001725.00人均收入人均支出戶數(shù)*32得直線趨勢方程:本例人均收入和人均支出的單位為千元,a為y軸上的截距;
b的經(jīng)濟意義是人均收入每增加1000元,則當年的人均支出將增加750元。彈性系數(shù)是因變量增長率與自變量增長率的比率,它表明自變量增長1%時,因變量增長百分之多少。*33(二)彈性系數(shù)、相關(guān)系數(shù)和回歸系數(shù)的關(guān)系
1.彈性系數(shù)與回歸系數(shù)的關(guān)系式中,為彈性系數(shù);就是直線回歸方程中的斜率,即回歸系數(shù)b。因此有*第八章相關(guān)分析342.相關(guān)系數(shù)與回歸系數(shù)的關(guān)系因此有相關(guān)系數(shù)的基本公式為而回歸系數(shù)可表達為:注意:r和b在不等于0的情況下正負方向相同。*35第一,回歸分析是研究兩個變量之間的必須有因果關(guān)系,相關(guān)分析兩個變量之間不一定有因果關(guān)系。第二,回歸分析中因變量是隨機的,自變量不是隨機變量,可以給定。相關(guān)分析中兩個變量都可以是隨機變量。第三,回歸分析對于因果關(guān)系不甚明確或互為因果關(guān)系的兩個變量,可以求出y倚x的回歸方程,也可以求出x倚y的回歸方程:(三)回歸分析與相關(guān)分析特點比較
其中:*36而相關(guān)分析時兩個變量是對等的。若將兩個變量互換位置,則計算的相關(guān)系數(shù)與原來是相同的。
第四,回歸方程在進行預(yù)測時,只能給出自變量的數(shù)值來估計因變量的可能值,而不能給出因變量的數(shù)值來估計自變量的可能值。回歸方程的逆向運算沒有現(xiàn)實意義。例如,可以根據(jù)降雨量來估計農(nóng)作物的收獲量,但不能根據(jù)農(nóng)作物的收獲量來估計降雨量。
值得注意的是:無論是相關(guān)分析還是回歸分析,在時間、空間上都是有限度的,超過了一定的范圍,所作的估算和預(yù)測就會失去實際意義。*37三、估計標準誤差(一)估計標準誤差的概念和計算利用回歸方程根據(jù)自變量來推算因變量的可能值是存在一定誤差的,這種誤差可以用估計標準誤差來表示。其計算公式為:
式中:Syx表示估計標準誤差,其下標yx表示y倚x的回歸;y表示因變量實際值;yc表示因變量估計值;分母n‐2稱為回歸估計自由度。因為回歸方程式中a、b兩個參數(shù)已知,所以失去了兩個自由度。*38計算估計標準誤差時,a、b兩個參數(shù)應(yīng)多保留幾位小數(shù)點。特別是b這個參數(shù),它與一個較大的數(shù)x相乘,在公式中將起到杠桿作用,其微小的變化會引起估計標準誤差計算結(jié)果的很大波動。注意點某企業(yè)產(chǎn)品產(chǎn)量與單位成本資料
產(chǎn)量(萬件)x
單位成本(元)y
101632405060767267656359例8‐6已知根據(jù)下表資料擬合的直線方程為:試計算估計標準誤差。*39合計序號單位成本倚產(chǎn)量回歸方程及估計標準誤差計算表12345610163240506020876726765635940274.784872.891267.841665.316862.160859.0048—1.47670.79420.70830.10040.70430.00023.7841先利用表格計算:公式計算如下:*40估計標準誤差的簡式計算公式:現(xiàn)證明如下:由于:,和所以有:*第八章相關(guān)分析41
0123456例8‐7已知下表資料的直線方程為:試用簡式計算公式計算估計標準誤差。產(chǎn)品產(chǎn)量與單位成本資料及計算表
產(chǎn)量(萬件)序號123456合計10163240506208單位成本(元)
767267656359402577651844489422539693481271247601152214426003150354013346計算如下:*42(二)估計標準誤差和相關(guān)系數(shù)的關(guān)系總誤差、估計誤差、回歸誤差圖示:
溫馨提示
- 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
- 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
- 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
- 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負責。
- 6. 下載文件中如有侵權(quán)或不適當內(nèi)容,請與我們聯(lián)系,我們立即糾正。
- 7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。
最新文檔
- 2024年雞鴨養(yǎng)殖供應(yīng)協(xié)議模板版
- 福建省南平市建陽漳墩中學2020-2021學年高一英語聯(lián)考試卷含解析
- 2024毛竹山林業(yè)資源培育承包合同范本3篇
- 2024軟裝設(shè)計合同范本:現(xiàn)代辦公環(huán)境設(shè)計協(xié)議3篇
- 2024年上海市《消防員資格證之一級防火考試》必刷500題(真題匯編)
- 2024年公司各部門管理制度
- 【學習課件】第課中華大地的遠古人類
- 2025年度出口合同履行中的國際貿(mào)易信用評估與擔保協(xié)議3篇
- 2024年音樂作品版權(quán)協(xié)議:錄音制品與表演權(quán)的分配3篇
- 2025年1A13365國際貿(mào)易實務(wù)操作手冊分銷合同3篇
- 2025中國制造重點領(lǐng)域技術(shù)路線圖
- 八大危險作業(yè)檢查表
- 村務(wù)監(jiān)督業(yè)務(wù)培訓(xùn)課件
- 初三家長會語文教師發(fā)言
- 粵教版科學四年級上冊全冊試卷(含答案)
- 疼痛科護士的疼痛評估與疼痛程度劃分
- 安全管理計劃指標和指標體系
- 倉庫物料盤點作業(yè)規(guī)范培訓(xùn)課件
- 無線網(wǎng)絡(luò)技術(shù)滿分期末大作業(yè)
- 2023無人機搭載紅外熱像設(shè)備檢測建筑外墻及屋面作業(yè)
- 《西游記》電子版閱讀-小學版
評論
0/150
提交評論