《新編統(tǒng)計學(xué)》第八章 相關(guān)分析與回歸分析_第1頁
《新編統(tǒng)計學(xué)》第八章 相關(guān)分析與回歸分析_第2頁
《新編統(tǒng)計學(xué)》第八章 相關(guān)分析與回歸分析_第3頁
《新編統(tǒng)計學(xué)》第八章 相關(guān)分析與回歸分析_第4頁
《新編統(tǒng)計學(xué)》第八章 相關(guān)分析與回歸分析_第5頁
已閱讀5頁,還剩49頁未讀, 繼續(xù)免費(fèi)閱讀

下載本文檔

版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進(jìn)行舉報或認(rèn)領(lǐng)

文檔簡介

第八章相關(guān)分析與回歸分析第一節(jié)相關(guān)分析第二節(jié)回歸分析第三節(jié)用Excel計算相關(guān)系數(shù)和回歸分析第一節(jié)相關(guān)分析【學(xué)習(xí)目標(biāo)】

了解相關(guān)分析的基本概念;掌握相關(guān)分析的主要方法;了解回歸分析的基本概念;了解相關(guān)分析及回歸分析之間的關(guān)系;掌握相關(guān)分析的主要方法;掌握最小平方原理在回歸分析中的簡單應(yīng)用?!菊虑皩?dǎo)讀】

通過本章學(xué)習(xí),要對客觀現(xiàn)象之間相互依存、相互制約的關(guān)系加以分析,分析它們之間存在什么樣的關(guān)系,相關(guān)關(guān)系的密切程度,并且用一定的數(shù)量表現(xiàn)出來。要掌握這種分析方法并能應(yīng)用于實(shí)際。要掌握回歸分析的概念及一元線性回歸的分析方法。【本章重點(diǎn)】:相關(guān)關(guān)系的概念及相關(guān)系數(shù)的計算;回歸分析的概念及一元線性回歸分析的方法;相關(guān)分析與回歸分析的區(qū)別與聯(lián)系。

下一頁返回第一節(jié)相關(guān)分析引子:俗語中的相關(guān),你知道嗎?

人們在長期的實(shí)踐生活中,總結(jié)出了很多俗語來形象地說明事物之間的相關(guān)關(guān)系,比如“名師出高徒”,“強(qiáng)將手下無弱兵”,“虎父無犬子”,“龍生龍,鳳生鳳”等。而現(xiàn)代統(tǒng)計學(xué)上的“相關(guān)”和“回歸”的概念是高爾頓第一次使用的。

1886年,高爾頓在研究人類身高的遺傳時,搜集了1078對父親及其兒子的身高數(shù)據(jù)。他發(fā)現(xiàn)這些數(shù)據(jù)的散點(diǎn)圖大致呈直線狀態(tài),也就是說,總的趨勢是父親的身高增加時,兒子的身高也傾向于增加。但是,高爾頓對試驗(yàn)數(shù)據(jù)進(jìn)行了深入的分析,發(fā)現(xiàn)了一個很有趣的現(xiàn)象—回歸效應(yīng)。因?yàn)楫?dāng)父親高于平均身高時,他們的兒子身高比他更高的概率要小于比他更接的概率;下一頁返回上一頁第一節(jié)相關(guān)分析父親矮于平均身高時,他們的兒子身高比他更矮的概率要小于比他更高的概率。它反映了一個規(guī)律,即后代的身高,有向他們父輩的平均身高回歸的趨勢,這就是統(tǒng)計學(xué)上最初出現(xiàn)“回歸”時的含義。高爾頓還引進(jìn)了回歸直線、相關(guān)系數(shù)的概念,創(chuàng)始了回歸分析。那么相關(guān)分析、回歸分析到底是什么意思,它們對我們的生活又有哪些幫助呢?一切客觀事物都是相互聯(lián)系和相互制約的??陀^現(xiàn)象之間的相互聯(lián)系,可以通過一定的數(shù)量關(guān)系反映出來。相關(guān)分析的含義可分為函數(shù)關(guān)系和相關(guān)關(guān)系。函數(shù)關(guān)系是指現(xiàn)象之間存在的嚴(yán)格依存的、確定的數(shù)量關(guān)系。例如,圓的面積與半徑之間的關(guān)系,S=下一頁返回上一頁第一節(jié)相關(guān)分析一、相關(guān)關(guān)系的概念和特點(diǎn)1.相關(guān)關(guān)系的概念。相關(guān)關(guān)系,即現(xiàn)象之間存在著不完全確定的依存關(guān)系。也就是說,當(dāng)一個現(xiàn)象發(fā)生數(shù)量變化時,另一個也發(fā)生數(shù)量變化,但是這種數(shù)量關(guān)系是不確定的,不是唯一的。例如,人們對消費(fèi)品的需求量與人們的收入水平存在一定關(guān)系,收入越高,人們的消費(fèi)量越大;收入越低,人們的消費(fèi)量越低,但同時消費(fèi)量還受其他因素的影響,如消費(fèi)習(xí)慣、消費(fèi)預(yù)期等。2.相關(guān)關(guān)系的特點(diǎn)

(1)現(xiàn)象之間確實(shí)存在數(shù)量上的相互依存關(guān)系?,F(xiàn)象之間數(shù)量上的相互依存關(guān)系表現(xiàn)在一個現(xiàn)象發(fā)生數(shù)量上的變化,另一個與之相聯(lián)系的現(xiàn)象也會相應(yīng)地發(fā)生數(shù)量上的變化。例如,播種面積與收獲量之間,播種面積越大,收獲量越大;相反收獲量越大,種植面積相應(yīng)也較大。下一頁返回上一頁第一節(jié)相關(guān)分析在相互依存的兩個變量中,可以根據(jù)研究的目的,把其中一個確定為自變量,一般用x表示;把另外一個對應(yīng)變化的變量確定為因變量,一般用y來表示。比如,播種面積量作為自變量,則收獲量就是因變量;把收獲量作為自變量,則播種面積就是因變量。

(2)現(xiàn)象之間數(shù)量上的關(guān)系是不確定的。即一個變量雖受另一個(或一組)變量的影響,卻并不由這一個(或一組)變量完全確定。如,體重與身高之間存在一定的依存關(guān)系,但身高為1.70米的人,其體重有許多個值;體重為60千克的人,其身高也有許多個值。身高與體重之間沒有完全確定的數(shù)量關(guān)系存在。相關(guān)關(guān)系和函數(shù)關(guān)系雖是兩種不同類型的變量關(guān)系,但它們之間并無嚴(yán)格的界限。因測量誤差的存在,確定的函數(shù)關(guān)系往往通過相關(guān)關(guān)系表現(xiàn)出來;相反當(dāng)人們對事物內(nèi)部關(guān)系了解的越深刻,相關(guān)關(guān)系就有可能轉(zhuǎn)化為確定關(guān)系。下一頁返回上一頁第一節(jié)相關(guān)分析

二、相關(guān)關(guān)系的種類現(xiàn)象之間的相關(guān)關(guān)系從不同的角度可以區(qū)分為不同類型。1.按相關(guān)關(guān)系的方向劃分

(1)正相關(guān)。正相關(guān)是指兩個變量之間的變化方向一致,即當(dāng)一個變量的值增加,另一個變量值也相應(yīng)地增加;當(dāng)一個變量的值減少,另一個變量值也隨之減少。例如,工人勞動生產(chǎn)率提高,產(chǎn)品產(chǎn)量也隨之增加;居民的消費(fèi)水平隨個人所支配收入的增加而增加。正相關(guān)如圖8-1所示。(2)負(fù)相關(guān)。負(fù)相關(guān)是指兩個變量的變化趨勢相反,即當(dāng)一個變量的值增加或減少時,另一個變量的值反而減少或增加(圖8-2)。例如,商品流轉(zhuǎn)額越大,商品流通費(fèi)用越低;利潤隨單位成本的降低而增加。下一頁返回上一頁第一節(jié)相關(guān)分析2.按相關(guān)形式的不同劃分

(1)線性相關(guān)。又稱直線相關(guān),是指當(dāng)一個變量變動時,另一變量隨之發(fā)生大致均等的變動。如圖8-3所示,觀察點(diǎn)的分布近似地表現(xiàn)為一條直線。

(2)非線性相關(guān)(曲線相關(guān))。當(dāng)一個變量變動時,另一變量也隨之發(fā)生變動,但這種變動是不均等的。例如,工人加班時間在一定數(shù)量界限內(nèi),產(chǎn)量增加,但一旦超過一定限度,產(chǎn)量反而可能下降,這就是一種非線性關(guān)系。如圖8-4所示,觀察點(diǎn)的分布近似地表現(xiàn)為一條曲線。3.按相關(guān)程度劃分

(1)完全相關(guān)。當(dāng)一個變量的數(shù)量變化完全由另一個變量的數(shù)量變化所唯一確定時,這兩個變量之間的關(guān)系為完全相關(guān)。在這種情況下,相關(guān)關(guān)系實(shí)際就是函數(shù)關(guān)系,所以函數(shù)關(guān)系是相關(guān)關(guān)系的一種特殊情況。下一頁返回上一頁第一節(jié)相關(guān)分析在價格不變的條件下,銷售額與銷售量之間的函數(shù)關(guān)系即為完全相關(guān),此時相關(guān)關(guān)系便成為函數(shù)關(guān)系,如圖8-5所示。

(2)不相關(guān)。如果兩個變量彼此的數(shù)量變化相互獨(dú)立,沒有關(guān)系,這種關(guān)系稱為不相關(guān)。例如,股票價格的高低與氣溫的高低一般情況下是不相關(guān)的,不相關(guān)關(guān)系如圖8-6所示。(3)不完全相關(guān)。它指的是兩個變量之間的關(guān)系介于完全相關(guān)和不相關(guān)之間。大多數(shù)相關(guān)關(guān)系屬于不完全相關(guān),如圖8-7所示,就屬于不完全相關(guān)關(guān)系。4.按自變量的多少劃分

(1)單相關(guān)。只反映一個自變量和一個因變量之間的相關(guān)關(guān)系。

(2)復(fù)相關(guān)。反映兩個或者兩個以上的自變量同一個因變量的相關(guān)關(guān)系。例如,商品銷售額與居民收入、商品價格之間的相關(guān)關(guān)系。下一頁返回上一頁第一節(jié)相關(guān)分析三、相關(guān)關(guān)系的判定(一)表格法表格法是一種反映變量之間相關(guān)關(guān)系的統(tǒng)計表。將某一變量按其取值的大小排列,然后再將與其相關(guān)的另一變量的對應(yīng)值平行排列,便可得到簡單的相關(guān)表。例8-1某地區(qū)某企業(yè)近8年產(chǎn)品產(chǎn)量與生產(chǎn)費(fèi)用的相關(guān)情況見表8-l。從表8-1可以看出,產(chǎn)品產(chǎn)量與生產(chǎn)費(fèi)用之間存在一定的正相關(guān)關(guān)系。(二)相關(guān)圖。相關(guān)圖又稱散點(diǎn)圖,它是將相關(guān)表中的觀測值在平面直角坐標(biāo)系中用坐標(biāo)點(diǎn)描繪出來,以表明相關(guān)點(diǎn)的分布狀況。通過相關(guān)圖,可以大致看出兩個變量之間有無相關(guān)關(guān)系以及相關(guān)的形態(tài)、方向和密切程度。下一頁返回上一頁第一節(jié)相關(guān)分析例8-2以表8-1為例,用Excel繪制相關(guān)圖,其產(chǎn)品產(chǎn)量與生產(chǎn)費(fèi)用的相關(guān)情況如圖8-8所示。通過相關(guān)散點(diǎn)圖的形狀,大概可以判斷變量之間是否具有相關(guān)關(guān)系,以及相關(guān)方向、相關(guān)程度的強(qiáng)弱,但并不能得知其相關(guān)的確切程度。為精確了解變量間的相關(guān)程度,還需作進(jìn)一步統(tǒng)計分析。在統(tǒng)計上,一般通過計算相關(guān)系數(shù)來測定兩種現(xiàn)象的相關(guān)程度。(三)相關(guān)系數(shù)1.相關(guān)系數(shù)的意義相關(guān)系數(shù)是在直線相關(guān)的條件下,說明兩個現(xiàn)象之間相關(guān)密切程度的統(tǒng)計分析指標(biāo),通常用r來表示。相關(guān)系數(shù)r的取值范圍在-1和+1之間,即-1≤r≤1。正負(fù)號表明兩變量間變化的方向;|r|表明兩變量間相關(guān)的程度,下一頁返回上一頁第一節(jié)相關(guān)分析即r>0表示正相關(guān),-r<0表示負(fù)相關(guān),r=0表示無直線相關(guān)。|r|越接近于1,表明兩變量相關(guān)程度越高,它們之間的關(guān)系越密切。r=±1,表示兩個變量完全直線相關(guān)。如果r=0,則表示兩個變量之間不是直線相關(guān)。這里要特別注意的是,r僅表示兩個變量的直線相關(guān)密切程度,當(dāng)r很小甚至等于零時,并不一定表不兩個變量之間就不存在其他非直線類型的相關(guān)關(guān)系。為了在判斷時有個標(biāo)準(zhǔn),現(xiàn)在介紹一種相關(guān)關(guān)系密切程度的劃分方法,見表8-2。2.相關(guān)系數(shù)的計算相關(guān)系數(shù)的定義公式為下一頁返回上一頁第一節(jié)相關(guān)分析式中:n為資料項數(shù);表示x變量的標(biāo)準(zhǔn)差;表示y變量的標(biāo)準(zhǔn)差;表示x,y變量數(shù)列的協(xié)方差。在實(shí)際應(yīng)用中,如果依據(jù)原始資料計算相關(guān)系數(shù),數(shù)據(jù)計算過于復(fù)雜,因此經(jīng)常用下面的簡化公式進(jìn)行計算的。下一頁返回上一頁第一節(jié)相關(guān)分析例8-3計算10個企業(yè)生產(chǎn)性固定資產(chǎn)價值與其工業(yè)增加值之間的相關(guān)系數(shù)。資料見表8-3。將表8-3中的數(shù)據(jù)代人相關(guān)系數(shù)計算公式得

上述計算結(jié)果表明,生產(chǎn)性固定資產(chǎn)價值和工業(yè)增加值之間存在高度的正相關(guān)關(guān)系。返回上一頁第二節(jié)回歸分析

一、回歸分析的概念和種類回歸分析是在相關(guān)分析的基礎(chǔ)上,考察變量之間的數(shù)量變化規(guī)律,并通過一定的數(shù)學(xué)表達(dá)式描述它們之間的關(guān)系,進(jìn)而確定一個或幾個變量的變化對另一個特定變量的影響程度。相關(guān)分析旨在測度變量之間的密切程度,它所使用的測度工具就是相關(guān)系數(shù);而回歸分析則側(cè)重于考察變量之間的數(shù)量變化規(guī)律,其所使用的數(shù)學(xué)工具就是配合回歸模型?;貧w分析有線性回歸分析與非線性回歸分析之分,其中線性回歸分析是我們研究的重點(diǎn)。在線性回歸分析中,又有一元線性回歸分析與多元線性回歸分析,后者指三個或者三個以上變量之間的回歸分析。一元線性回歸分析是多元線性回歸分析的基礎(chǔ),多元線性回歸分析是一元線性回歸分析的拓展。在本章只介紹一元線性回歸分析。下一頁返回第二節(jié)回歸分析

二、回歸分析和相關(guān)分析的關(guān)系1.相關(guān)分析與回歸分析的區(qū)別(1)相關(guān)分析所研究的兩個變量是對等關(guān)系,回歸分析所研究的兩個變量不是對等關(guān)系,必須根據(jù)研究目的,先確定其中一個是自變量,另一個是應(yīng)變量

(2)對兩個變量x和y來說,相關(guān)系數(shù)反映的是兩個變量之間相關(guān)的密切程度,因此在計算相關(guān)系數(shù)時,改變x和y的地位不會影響相關(guān)系數(shù)的數(shù)值;回歸分析有時可以根據(jù)研究目的的不同分別建立兩個不同的回歸方程。以x為自變量,y為因變量,可以得出y對x的回歸方程;以y為自變量,x為因變量,可得出x對y的回歸方程。

(3)相關(guān)分析對資料的要求是,兩個變量都必須是隨機(jī)變量,而回歸分析對資料的要求是,自變量是可以控制的變量或給定的變量,因變量是隨機(jī)變量。下一頁返回上一頁第二節(jié)回歸分析2.相關(guān)分析與回歸分析的聯(lián)系

(1)相關(guān)分析是回歸分析的基礎(chǔ)和前提。只有通過相關(guān)分析,確定客觀現(xiàn)象之間確實(shí)存在數(shù)量上的依存關(guān)系,而且其關(guān)系值又不確定的情況下,再進(jìn)行分析,在此基礎(chǔ)所上建立的回歸分析才有實(shí)際意義。假如對所研究的客觀現(xiàn)象不進(jìn)行相關(guān)分析,直接進(jìn)行回歸分析,這樣建立的回歸方程可能沒有實(shí)際意義。

(2)回歸分析是相關(guān)分析的深入和繼續(xù)。對所研究的現(xiàn)象只做相關(guān)分析,研究它們之間相關(guān)的密切程度是不夠的,統(tǒng)計上進(jìn)行相關(guān)分析的目的是為了進(jìn)行回歸分析,通過回歸分析將有依存關(guān)系的變量間的不確定的數(shù)量關(guān)系加以確定,然后由已知自變量值推算未知自變量值,只有這樣,相關(guān)分析才會具有實(shí)際意義。下一頁返回上一頁第二節(jié)回歸分析

三、簡單直線回歸模型1.簡單直線回歸模型的概念簡單直線回歸模型又稱一元線性回歸模型,它是根據(jù)兩個變量的成對數(shù)據(jù),配合直線方程式,并根據(jù)自變量的變動,來推算因變量的估計值的一種統(tǒng)計分析方法。對于所要考察的變量y來講,若其主要影響因素只有一個變量x,且y與x呈線性相關(guān)關(guān)系,則可在變量y與x之間建立數(shù)學(xué)模型

式中:為因變量y的估計理論值;x為自變量的實(shí)際值;a,b為待定參數(shù),a表T直線在y軸上的截距,b表示直線的斜率,又稱為y對x的回歸系數(shù),它的實(shí)際意義即表示,當(dāng)x每變化一個單位時,y的平均變化量。若x前為“+”,表示當(dāng)x每增加一個單位時,y平均增加b個單位;下一頁返回上一頁第二節(jié)回歸分析若x前為“-”,表不當(dāng)x每增加一個單位時,y平均減少b個單位。x前的“+”、“-”還分別表示x與y之間是正相關(guān)、負(fù)相關(guān)。2.擬合簡單直線回歸模型的條件

(1)兩個變量之間確實(shí)存在顯著的相關(guān)關(guān)系。在進(jìn)行回歸分析之前進(jìn)行相關(guān)分析,確定兩變量的相關(guān)系數(shù)值,若兩項變量之間確實(shí)具有顯著相關(guān)關(guān)系時,這樣擬合的簡單直線回歸模型才有實(shí)際意義;相反若兩變量之間沒有相關(guān)關(guān)系或相關(guān)程度較低時,則擬合的回歸模型就沒有實(shí)際意義。

(2)兩個變量之間確實(shí)存在著直線相關(guān)關(guān)系。若兩個變量的成對數(shù)據(jù)繪成散點(diǎn)圖,當(dāng)這些散點(diǎn)近似于直線時,才能擬合簡單直線回歸模型。

(3)應(yīng)用最小二乘法(又稱最小平方法)的原理擬合簡單直線回歸模型。應(yīng)用最小平方法配合直線,其基本要求是實(shí)際值與估計理論值的離差平方和為最小下一頁返回上一頁第二節(jié)回歸分析用公式表示為:①②3.簡單直線回歸模型的參數(shù)估計。由擬合簡單直線回歸模型的條件可知,若自變量與因變量對應(yīng)的散布點(diǎn)近似為直線,且計算出的相關(guān)系數(shù)具有顯著的相關(guān)關(guān)系,則可應(yīng)用最小平方法擬合一條簡單直線回歸模型。具體方法如下:

設(shè)簡單直線回歸模型為

,其中a,b為待定參數(shù),y對

的離差平方和為Q,由最小平方法知:要使Q達(dá)到最小值,其必要條件是它對a和b的一階偏導(dǎo),并令偏導(dǎo)等于零,即下一頁返回上一頁第二節(jié)回歸分析整理得:解方程式,得到:下一頁返回上一頁第二節(jié)回歸分析例8-4某地區(qū)10個同類工業(yè)企業(yè)生產(chǎn)性固定資產(chǎn)價值與工業(yè)增加值資料見表8-3,具體說明求解a,b值和建立簡單直線回歸方程的步驟和方法。

(1)設(shè)計求解參數(shù)a,b的計算表及計算有關(guān)數(shù)據(jù)。由例8-3可知兩變量的相關(guān)系數(shù)為0.9918,得知二者之間存在高度的正相關(guān)關(guān)系,由此可建立y對x的直線回歸方程。根據(jù)表8-4的資料求出所需的有關(guān)數(shù)據(jù)。(2)將上述數(shù)據(jù)代人有關(guān)公式,求解a和b的數(shù)值。下一頁返回上一頁第二節(jié)回歸分析(3)將a和b的數(shù)值代人公式,得出工業(yè)增加值對生產(chǎn)性固定資產(chǎn)價值的直線回歸方程。其中,a=4.11,是回歸直線在y軸上的截距;b=4.15,表示生產(chǎn)性固定資產(chǎn)每增加一個單位(百萬元),工業(yè)增加值平均增加4.15百萬元。

(4)利用回歸直線模型進(jìn)行預(yù)測。如某企業(yè)下一年生產(chǎn)性固定資產(chǎn)預(yù)計可達(dá)4百萬元,在其他條件相對穩(wěn)定時,可預(yù)測其工業(yè)增加值為注意:一個直線回歸方程只能作一種推算,不能相反進(jìn)行另一種推算。即只能以自變量x推算因變量y,而不能以y推算x。如上例所配合的直線回歸方程,只能在給定生產(chǎn)性固定資產(chǎn)價值時,來推算工業(yè)增加值,不可給定工業(yè)增加值來推算固定資產(chǎn)價值。下一頁返回上一頁第二節(jié)回歸分析四、估計標(biāo)準(zhǔn)差建立回歸方程的一個主要作用在于根據(jù)自變量的已知數(shù)據(jù)推算因變量的估計值,這個估計值與y值可能相同,也可能不同,這就產(chǎn)生了估計值的代表性問題。觀察表8-4中的數(shù)據(jù),因變量的估計值

與實(shí)際觀察值y是不等的,其估計誤差為y-,且存在著一系列的估計誤差。如何反映這些誤差的大小呢?估計值的代表性到底如何呢?一般可通過估計標(biāo)準(zhǔn)誤差來測定,估計標(biāo)準(zhǔn)誤差是用來說明回歸方程代表性大小的統(tǒng)計指標(biāo)。其計算原理與標(biāo)準(zhǔn)差基本上相同,計算公式為

式中:Sy為估計標(biāo)準(zhǔn)誤差;n-2為自由度,因在一元線性回歸方程中,計算了a,b兩個參數(shù),即失去了兩個自由度;下一頁返回上一頁第二節(jié)回歸分析y為因變量的實(shí)際值,是根據(jù)回歸方程推算出來的因變量的估計值。在回歸分析中,估計標(biāo)準(zhǔn)誤差越小,表明實(shí)際值與估計值的估計誤差越小,也就是實(shí)際值越靠近估計值,則所擬合的回歸模型的代表性越高;反之,估計標(biāo)準(zhǔn)誤差越大,表明實(shí)際值與估計值的估計誤差越大,也就是實(shí)際值越遠(yuǎn)離估計值,則所擬合的回歸模型的代表性越低。實(shí)際計算中,估計標(biāo)準(zhǔn)誤差用簡化公式下一頁返回上一頁第二節(jié)回歸分析例8-5沿用例8-4的有關(guān)資料,說明回歸標(biāo)準(zhǔn)誤差的計算方法。經(jīng)過有關(guān)計算已知n-2=8,

=10877,∑y=315,∑xy=2305,x=4.11b=4.15

其結(jié)果表明,10個企業(yè)工業(yè)增加值的估計理論值與實(shí)際值的平均誤差為1.44百萬元。由此可見,只有把回歸估計值與估計的標(biāo)準(zhǔn)誤差結(jié)合起來分析運(yùn)用,才更具有實(shí)際意義。返回上一頁第三節(jié)用Excel計算相關(guān)系數(shù)和回歸分析一、實(shí)訓(xùn)項目用Excel計算相關(guān)系數(shù)和回歸分析。二、實(shí)訓(xùn)目的與要求掌握Excel在相關(guān)與回歸中的作用,熟練運(yùn)用Excel進(jìn)行相關(guān)分析和回歸分析。三、實(shí)訓(xùn)資料某班10名學(xué)生的身高和體重的情況見表8-5。要求用Excel對身高和體重進(jìn)行相關(guān)分析和回歸分析。下一頁返回第三節(jié)用Excel計算相關(guān)系數(shù)和回歸分析四、操作步驟啟動Excel2003,新建一個工作簿Book1。第一步,將實(shí)訓(xùn)資料中的數(shù)據(jù)輸入到工作表中,如圖8-9所示。第二步,對這10名學(xué)生的身高和體重進(jìn)行相關(guān)分析和回歸分析。1.相關(guān)分析用Excel計算相關(guān)分析有兩種方法:一種是利用相關(guān)系數(shù)函數(shù),另一種是利用相關(guān)分析宏。

(1)利用相關(guān)系數(shù)函數(shù)計算相關(guān)系數(shù)。在Excel中,提供了計算兩個變量間相關(guān)系數(shù)的方法,即CORREI函數(shù)和PERSON函數(shù),這兩個函數(shù)計算的原理是相同的。這里只介紹利用CORREL函數(shù)計算相關(guān)系數(shù)。下一頁返回上一頁第三節(jié)用Excel計算相關(guān)系數(shù)和回歸分析首先,選擇任一空白單元格,單擊“插入”菜單,選擇“函數(shù)”選項,打開“插入函數(shù)”對話框。在“選擇類別”中選擇“統(tǒng)計”,在“選擇函數(shù)”中選擇CORREI,如圖8-10所示。其次,單擊“確定”按鈕后,出現(xiàn)CORREI對話框,在Arrayl中輸入“B2:Bll”,在Array2中輸入“C2:C11”,此時,在該對話框的下方顯示出計算結(jié)果0.8543,即為這10名學(xué)生身高與體重的相關(guān)系數(shù),如圖8-11。(2)利用相關(guān)系數(shù)宏計算相關(guān)系數(shù)。首先,單擊“工具”菜單,選擇“數(shù)據(jù)分析”選項,在“數(shù)據(jù)分析”選項中選擇“相關(guān)系數(shù)”,如圖8-12所示。其次,單擊“確定”按鈕后,出現(xiàn)“相關(guān)系數(shù)”對話框。在“輸入?yún)^(qū)域”中輸入“$B$1:$C$11”,“分組方式”中選擇“逐列”,同時勾選“標(biāo)志位于第一行”,在“輸出區(qū)域”輸入“$D$1”,如圖8-13所示。下一頁返回上一頁第三節(jié)用Excel計算相關(guān)系數(shù)和回歸分析然后單擊“確定”按鈕,輸出結(jié)果如圖8-14所示。在圖8-14中的輸出結(jié)果中,身高和體重的自相關(guān)系數(shù)均為1,身高和體重的相關(guān)系數(shù)為0.8543,與利用函數(shù)計算的相關(guān)系數(shù)是一致的。2.回歸分析首先,單擊“工具”菜單,選擇“數(shù)據(jù)分析”選項,出現(xiàn)“數(shù)據(jù)分析”對話框,在“分析工具”中選擇“回歸”選項,如圖8-15所示。其次,單擊“確定”按鈕,彈出“回歸”對話框。在“Y值輸入?yún)^(qū)域”輸入“$C$2:$C$11”,在“X值輸入?yún)^(qū)域”輸入“$B$2:$B$11”,在“輸出區(qū)域”中選擇“新工作表組”,如圖8-16所示。最后,單擊“確定”按鈕,即得到回歸分析結(jié)果,如圖8-17所示。下一頁返回上一頁第三節(jié)用Excel計算相關(guān)系數(shù)和回歸分析在回歸分析結(jié)果中,第一部分是回歸統(tǒng)計;第二部分是方差分析;第三部分是回歸系數(shù)。其中Intercept是截距,即一元線性回歸方程中的字母a。由圖8-17可以得出,該班學(xué)生身高和體重的回歸方程為:y=-75.85+0.82x?!颈菊滦〗Y(jié)】相關(guān)分析與回歸分析是重要的統(tǒng)計分析方法。本章的主要內(nèi)容是對現(xiàn)象之間相互依存、相互聯(lián)系的關(guān)系進(jìn)行分析,并對其關(guān)系密切程度進(jìn)行數(shù)量測定;依據(jù)這種數(shù)量測定結(jié)果建立回歸直

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負(fù)責(zé)。
  • 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時也不承擔(dān)用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

最新文檔

評論

0/150

提交評論