統計學之相關分析的意義與任務課件_第1頁
統計學之相關分析的意義與任務課件_第2頁
統計學之相關分析的意義與任務課件_第3頁
統計學之相關分析的意義與任務課件_第4頁
統計學之相關分析的意義與任務課件_第5頁
已閱讀5頁,還剩89頁未讀, 繼續(xù)免費閱讀

下載本文檔

版權說明:本文檔由用戶提供并上傳,收益歸屬內容提供方,若內容存在侵權,請進行舉報或認領

文檔簡介

本資料來源本資料來源第七章相關分析§1相關分析的意義和任務§2簡單線性相關§3回歸分析§4估計標準誤差第七章相關分析§1相關分析的意義和任務§1相關分析的意義與任務一、函數關系與相關關系例如:半徑與圓面積的關系工資水平與社會商品零售額的關系良種比重與收獲量的關系沸點(100度)(a+b)2=a2+2ab+b2磚頭的抗壓強度與抗折強度函數關系函數關系函數關系相關關系(因果)相關關系(因果)相關關系§1相關分析的意義與任務函數關系函數關系函數關系相關關現象之間的關系一般可以區(qū)分為兩種不同的類型:函數關系:當一個或幾個變量取一定值時,另一個變量有確定值與之相對應,這種關系稱為確定性的函數關系。

[在函數關系中,一般把作為影響因素的變量稱為自變量(x);把發(fā)生對應變化(結果)的變量稱為因變量(y)。]相關關系:當一個或幾個相互聯系的變量取一定數值時,與之相對應的另一變量的值雖然不確定,但仍按某種規(guī)律在一定的范圍內變化。變量間的這種相互關系,稱為具有不確定性的相關關系?,F象之間的關系一般可以區(qū)分為兩種不同的類型:函數關系:當一個函數關系與相關關系是兩種不同類型的關系,但兩者之間并不存在嚴格的界限。由于在觀察或實驗中出現的誤差,函數關系也就通過相關關系反映出來;而當對現象之間的內在聯系和規(guī)律性了解得更加清楚的時候,相關關系就可能轉化為函數關系。在相關關系中,通常存在一定的因果關系。但也應該知道,在相關關系中,有時兩個變量之間只存在相互聯系而并不存在明顯的因果關系。函數關系與相關關系是兩種不同類型的關系,但兩者之間并不存在嚴二、相關關系的種類按相關的程度劃分為:完全相關(函數關系)、不完全相關和不相關;按相關的方向劃分為:正相關和負相關;按相關的形式劃分為:線性相關(直線關系)和非線性相關;按所研究的變量多少可分為:單相關、復相關和偏相關。二、相關關系的種類按相關的程度劃分為:完全相關(函數關系)、按相關程度劃分為:完全相關:當一個現象的數量變化完全由另一個現象的數量變化所決定時,這兩種現象間的關系就為完全相關(函數關系)。如:半徑與圓面積之間的關系。不相關:當兩個現象彼此互不影響,其數量變化各自獨立時,這兩種現象間的關系就為不相關。如:股票價格與人的平均壽命之間的關系。不完全相關:當現象之間的關系介于完全相關和不相關之間時,這兩種現象間的關系就為不完全相關。如:居民的收入水平與恩格爾系數之間的關系。按相關程度劃分為:完全相關:當一個現象的數量變化完全由另一個按相關的方向劃分為:正相關:當一個現象的數量由小變大,另一個現象的數量也相應由小變大,這種相關稱為正相關。如:職工的工資水平應隨勞動生產率的提高而增加。負相關:當一個現象的數量由小變大,而另一個現象的數量相反地由大變小,這種相關稱為負相關。如:隨著銷售額的增加,流通費用率下降按相關的方向劃分為:正相關:當一個現象的數量由小變大,另一個按相關的形式劃分為:線性相關:當兩種相關現象之間的關系大致呈現為線性關系時,稱之為線性相關(直線相關)。如:人們的消費水平與收入水平之間的關系。非線性相關:當兩種相關現象之間近似于某種曲線方程的關系時,則這種相關關系稱為非線性關系。如:產品的平均成本與產品產量之間的關系。按相關的形式劃分為:線性相關:當兩種相關現象之間的關系大致呈按所研究的變量多少劃分為:單相關:兩個現象的相關,即一個變量對另一個變量的相關關系。如:投資額與國內生產總值之間的關系。復相關:當所研究的是一個變量對兩個或兩個以上其他變量的相關關系時,稱為復相關。如:某種商品的銷售額與其價格水平和人們收入水平之間的相關關系。偏相關:在某一現象與多種現象相關的場合,假定其它變量不變時,其中兩個變量的相關關系稱為偏相關。如:在假定人們的收入水平不變的條件下,某種商品的需求與其價格水平的關系就是一種偏相關。按所研究的變量多少劃分為:單相關:兩個現象的相關,即一個變量三、相關分析與回歸分析:這是兩種研究現象相關關系的基本方法。(一)、相關分析所謂相關分析,就是用一個指標來表明現象間相互依存關系的密切程度。(二)、回歸分析所謂回歸分析,就是根據相關關系的具體形態(tài),選擇一個合適的數學模型,來近似地表達變量間的平均變化關系。三、相關分析與回歸分析:這是兩種研究現象相關關系的基本方法?;貧w(Regression):

回歸一詞,最初是英國生物學家F.Golton在研究遺傳學的論文中所采用的詞匯(1877年)。他在研究中發(fā)現,具有較高身軀的雙親,或具有較矮身軀的雙親,其子女的身高均表現出退回(即回歸)到人的平均身高的趨勢。他在這一研究中所建立的數學公式被稱為回歸方程式,其涵義應是關系方程式或估計方程式,但基于歷史的原因,通常仍沿用回歸方程式這一提法?;貧w(Regression):回歸一詞(三)、相關分析與回歸分析的聯系相關分析與回歸分析不僅具有共同的研究對象,而且在具體應用時,常常必須相互補充。相關分析需要依靠回歸分析來表明現象數量相關的具體形式?;貧w分析需要依靠相關分析來表明現象數量變化的相關程度。只有當變量之間存在著高度相關時,進行回歸分析尋求其相關的具體形式才有意義。因此,相關分析與回歸分析被合稱為廣義的相關分析。(三)、相關分析與回歸分析的聯系相關分析與回歸分析不僅具有共(四)、相關分析與回歸分析的區(qū)別:研究目的不同:相關分析是研究變量之間相關的方向、相關程度和相關形式?;貧w分析是研究變量之間相互關系的具體形式,即:當一個變量發(fā)生數量上的變化時,另一個變量平均會發(fā)生什么樣的變化。研究方法不同:相關分析是通過計算相關系數或相關指數來判斷變量之間的相關關系?;貧w分析是通過數學模型來確定變量之間的具體的數量關系。變量的性質不同:在相關分析中,不用確定誰是自變量,誰是因變量,且所有變量都是隨機變量。在回歸分析中,必須事先確定在具有相關關系的變量中,誰是自變量和誰是因變量。一般來說,自變量是給定的非隨機變量(一般變量),因變量是隨機變量。(四)、相關分析與回歸分析的區(qū)別:研究目的不同:相關分析四、相關表和相關圖(一)、居民消費和收入的相關表消費支出15203040425360657078可支配收入18254560627588929998單位:百元四、相關表和相關圖(一)、居民消費和收入的相關表消費支出15可支配收入消費支出(二)、消費與收入的相關圖可支配收入消費支出(二)、消費與收入的相關圖§2簡單線性相關分析相關系數:用于判斷線性相關關系。用積差法進行計算。相關指數:用于判斷所有相關關系,包括線性和非線性的相關關系。但要用回歸系數b判別其相關方向?!?簡單線性相關分析相關系數:用于判斷線性相關關系。用一、相關系數(r):相關系數是在直線相關的條件下,說明兩個現象之間相關關系密切程度的統計指標。相關系數的取值范圍,是在-1和+1之間。計算結果r>0為正相關,r<0為負相關。相關系數的數值越接近于1(+1或-1),表示相關關系越強。越接近于0,相關關系越弱。如果r=0,則表明兩個現象之間完全沒有直線相關關系。(但并不表明兩個現象之間沒有非線性相關)相關系數的絕對值r

在0.3以下是無直線相關,在0.3—0.5是低度直線相關,在0.5—0.8是顯著相關,0.8以上是高度相關。一、相關系數(r):相關系數是在直線相關的條件下,說明兩個現計算相關系數的方法(積差法):·

···········(xy)ⅠⅡⅢⅣ計算相關系數的方法(積差法):·根據計算結果可以知道:在第一、三象限中,∑(x-x)(y-y)>0,為正值;在第二、四象限中,∑(x-x)(y-y)<0,為負值;根據計算結果可以知道:在第一、三象限中,

但∑(x-x)(y-y)的大小受變量值個數多少的影響,同樣的兩個現象會因為變量值個數的多少而出現計算結果的不一致。因此,需要消除計算結果受變量值個數多少的影響。方法就是:將計算結果除以變量值的個數n。但∑(x-x)(y-y)的大小受變量值協方差的作用:顯示x與y是正相關,還是負相關。相關系數的正負完全取決于協方差的正負。顯示x與y相關程度的大小。協方差的絕對值小,表示相關程度低;協方差的絕對值大,表示相關程度高。協方差的作用:顯示x與y是正相關,還是負相關。相關系

但x與y的協方差是名數,不同現象的變異情況不同,相關程度不能直接以協方差大小加以比較。需要以x與y的標準差加以標準化,使協方差化為無名數,使相關系數可以比較不同現象相關程度的高低。而且以x與y的標準差加以標準化以后,使相關系數的絕對值不超過1。但x與y的協方差是名數,不同現象的變異情況不統計學之相關分析的意義與任務舉例說明相關系數的計算:編號xyxyx2y21541926420381274832659127692287962689725910227101022811106311212331131293414138381515836合計15164234463216365412311例:觀察收入水平提高對用于食品支出的影響。設:收入水平為x,食品支出為y。舉例說明相關系數的計算:編號xyxyx2y215419264根據資料做散點圖:收入水平食品支出根據資料做散點圖:收入水平食品支出

從計算結果可以知道,收入水平與用于食品的支出成高度的正相關。從計算結果可以知道,收入水平與用于食品的支出§3一元線性回歸分析在相關分析中,已知兩個變量之間有直線相關關系。就需要確定一個數學表達式反映因變量與自變量之間的關系。有了這種數學表達式就便于進行解析,當有了自變量的一定數值,就可以估計因變量的數值平均來說將會有怎樣的變動。這樣的數學表達式稱為回歸方程式。由于變量之間關系的復雜性,回歸方程式也有多種類型和形式。一元線性回歸方程式是指一個自變量且相關形式為直線?!?一元線性回歸分析在相關分析中,已知兩個變量之間有舉例說明其研究方法:編號xyxyx2yc1541919.722642021.523812724.584832624.945912726.386922826.567962627.288972527.4691022728.36101022828.36111063129.0812123313222141383834.84151583638.44合計151642344632163654422.88舉例說明其研究方法:編號xyxyx2yc1541919.72設:x(自變量)為人均月收入水平,

y(因變量)為人均月食品支出額。從前面的相關分析中,已經看出兩個變量之間是線性趨勢,因此,可以通過一個線性方程式來表達這種關系:a、b是回歸方程的待定參數,其中b稱為回歸系數。設:x(自變量)為人均月收入水平,

y(因變對研究線性關系來說,回歸方程式應當滿足這樣的要求:

根據方程所確定的估計值應能代表所有觀察值y的全體,而按照求出的估計直線與各觀察點之間應達到最大限度的接近,也就是說,用這條直線來代表y與x的關系,它和實際數據的誤差比任何其他直線都小,這樣一來,根據回歸方程所求的直線就是反映y與x之間的關系的較為合理的一條直線。對研究線性關系來說,回歸方程式應當滿足這樣的要求:利用最小二乘法估計待定系數a和b:

a:是截距,表示當x等于0時,y=a;

b:是斜率,表示x每增加一個單位時,y所平均增加的數值。也是回歸系數,它與相關系數r

的取值方向一致:

b為正值時,r為正,表示正相關;

b為負值時,r為負,表示負相關。利用最小二乘法估計待定系數a和b:a:是截距,表示當x等于一元線性回歸方程的具體求法:一元線性回歸方程的具體求法:a=9.99元,表示當沒有任何收入時,人均用于

食品的支出需要9.99元。

b=0.18元,表示每增加一元的收入,人均用于

食品的支出平均會增加0.18元。b為

正值,表示收入水平與食品支出的

關系為正相關。將人均收入水平(x)代入回歸方程式,計算得到估計值,將其結果填入統計表。我們可以看到因變量(y)的觀察值和估計值并不一致,存在差異。這個差異的大小就是衡量直線方程式對所有觀察點的代表性的標準。a=9.99元,表示當沒有任何收入時,人均用于

§4估計標準誤差與相關指數

回歸方程反映了因變量與自變量之間的變動關系。但它本身并不能反映擬合程度的好壞,在建立方程之后,需要進一步分析估計直線的代表性,所有觀察點與估計值之間的離差程度等,這就需要建立一些指標來加以測定?!?估計標準誤差與相關指數回歸方程一、離差平方和的分解

所有觀察值y是上下波動的,y取值的這種波動的現象稱為變差。產生變差的原因是:受自變量變動的影響,即x取值的不同;其他因素的影響。為了分析這兩個方面的影響,需要對總變差進行分解,即:一、離差平方和的分解所有觀察值y是上下xy0xy0統計學之相關分析的意義與任務總變差的分解:

:根據線性方程,可以把它看作是由于x的變動所引起。因此,反映了在y的總變差中由于x與y的線性依存關系而引起y的變化部分,即總變差的變化中被判明或已經解釋了的部分,稱為回歸變差,記作U。

:是每個觀察點距回歸直線離差的平方和。根據最小二乘法原理,這個量是在所有的直線中與觀察點距離平方和最小的一個,它反映的是除了x對y的線性關系影響之外的一切因素對y的影響部分,稱為剩余變差,或未解釋的變差,記為Q??傋儾畹姆纸猓海焊鶕€性方程,可以y0y0二、估計標準誤差:二、估計標準誤差:從定義上看,它是觀察值y與估計值y的平均離差。在回歸分析中,Sq則反映了所有觀察值y對估計值y的平均差異程度。從回歸方程的意義中知道,對給定的自變量x值,觀察值y并非總在回歸直線上,而是分布在它的周圍,這樣就必然形成一定的離差。從直觀上看,它反映的是觀察值y與估計值y之間的離差,而在它的背后則是反映由自變量x來估計因變量y時所產生的誤差。若是這個離差的值愈小,即按照給定的x值來估計y的誤差愈小,因而y的準確程度愈高;相反,若是這個離差的值愈大,從直觀上看就是各觀察點離開直線愈遠,這時按給定的x值來估計y值,其誤差就愈大,因而y的準確程度降低。從這個意義上說,這個標準離差通稱為回歸估計標準誤差。從定義上看,它是觀察值y與估計值y的平均離差。在回歸分析中,回歸估計標準誤差的計算公式:說明:觀察值y與估計值y的平均差異程度是1.91元。回歸估計標準誤差的計算公式:說明:觀察值y與估計值y的平均差根據正態(tài)分布的性質:趨勢值(預測值)落在下列區(qū)間的概率是:落在y±Sq的區(qū)間內約占總次數的68.27%;落在y±2Sq的區(qū)間內約占總次數的95.45%;落在y±3Sq的區(qū)間內約占總次數的99.73%;根據正態(tài)分布的性質:趨勢值(預測值)落在下列區(qū)間的概率是:三、判定系數與相關系數回歸變差U,從意義上講,就是在影響總變差的因素當中已被查明或已被解釋了的部分,也就是自變量x影響的部分。當Q的數值愈小,而U的數值愈大,即表明總變差中已被判明或被解釋了的因素(x)占的比率大,在圖形上表現為所有觀察點離回歸直線愈近,因而也就表示x與y的關系愈密切。如果所有觀察點全在回歸直線上,則y=y,即總變差等于回歸變差,剩余變差等于零。這時產生的總變差完全是由x的變動所引起的,這就是完全相關。但在一般情況下,對相關關系,除自變量的影響而外,還有其他未判明的因素起作用,其觀察點的分布不是在回歸直線上,而是分布在它的周圍,并表現出上下波動的狀況。三、判定系數與相關系數回歸變差U,從意義上講,就是在影響總變在這種情況下,關系的密切程度主要根據U對總變差的比率大小而異:若U對總變差的比率逐漸增大,則相關關系隨之增加,并逐漸趨于完全相關;若U對總變差的比率逐漸減少,則相關關系隨之減小,并逐漸趨近于零相關。由此可見,通過比較U與總變差的關系及其比率的變動,可以反映已判明因素在總變差中所占比率的大小,反映x與y之間的密切程度?,F在以總變差為基數,計算U對總變差的比率,并以R2表示。在這種情況下,關系的密切程度主要根據U對總變差的比率大小而判定系數(相關指數、可決系數)(R)判定系數是反映相關關系密切程度的重要指標,不論是線性相關或非線性相關都可以運用。在非線性中常用R表示,以與線性相關系數r相區(qū)別。判定系數R只能取正值,判別相關方向要靠回歸系數b。判定系數(相關指數、可決系數)(R)判定系數是反映相關關系密本資料來源本資料來源第七章相關分析§1相關分析的意義和任務§2簡單線性相關§3回歸分析§4估計標準誤差第七章相關分析§1相關分析的意義和任務§1相關分析的意義與任務一、函數關系與相關關系例如:半徑與圓面積的關系工資水平與社會商品零售額的關系良種比重與收獲量的關系沸點(100度)(a+b)2=a2+2ab+b2磚頭的抗壓強度與抗折強度函數關系函數關系函數關系相關關系(因果)相關關系(因果)相關關系§1相關分析的意義與任務函數關系函數關系函數關系相關關現象之間的關系一般可以區(qū)分為兩種不同的類型:函數關系:當一個或幾個變量取一定值時,另一個變量有確定值與之相對應,這種關系稱為確定性的函數關系。

[在函數關系中,一般把作為影響因素的變量稱為自變量(x);把發(fā)生對應變化(結果)的變量稱為因變量(y)。]相關關系:當一個或幾個相互聯系的變量取一定數值時,與之相對應的另一變量的值雖然不確定,但仍按某種規(guī)律在一定的范圍內變化。變量間的這種相互關系,稱為具有不確定性的相關關系?,F象之間的關系一般可以區(qū)分為兩種不同的類型:函數關系:當一個函數關系與相關關系是兩種不同類型的關系,但兩者之間并不存在嚴格的界限。由于在觀察或實驗中出現的誤差,函數關系也就通過相關關系反映出來;而當對現象之間的內在聯系和規(guī)律性了解得更加清楚的時候,相關關系就可能轉化為函數關系。在相關關系中,通常存在一定的因果關系。但也應該知道,在相關關系中,有時兩個變量之間只存在相互聯系而并不存在明顯的因果關系。函數關系與相關關系是兩種不同類型的關系,但兩者之間并不存在嚴二、相關關系的種類按相關的程度劃分為:完全相關(函數關系)、不完全相關和不相關;按相關的方向劃分為:正相關和負相關;按相關的形式劃分為:線性相關(直線關系)和非線性相關;按所研究的變量多少可分為:單相關、復相關和偏相關。二、相關關系的種類按相關的程度劃分為:完全相關(函數關系)、按相關程度劃分為:完全相關:當一個現象的數量變化完全由另一個現象的數量變化所決定時,這兩種現象間的關系就為完全相關(函數關系)。如:半徑與圓面積之間的關系。不相關:當兩個現象彼此互不影響,其數量變化各自獨立時,這兩種現象間的關系就為不相關。如:股票價格與人的平均壽命之間的關系。不完全相關:當現象之間的關系介于完全相關和不相關之間時,這兩種現象間的關系就為不完全相關。如:居民的收入水平與恩格爾系數之間的關系。按相關程度劃分為:完全相關:當一個現象的數量變化完全由另一個按相關的方向劃分為:正相關:當一個現象的數量由小變大,另一個現象的數量也相應由小變大,這種相關稱為正相關。如:職工的工資水平應隨勞動生產率的提高而增加。負相關:當一個現象的數量由小變大,而另一個現象的數量相反地由大變小,這種相關稱為負相關。如:隨著銷售額的增加,流通費用率下降按相關的方向劃分為:正相關:當一個現象的數量由小變大,另一個按相關的形式劃分為:線性相關:當兩種相關現象之間的關系大致呈現為線性關系時,稱之為線性相關(直線相關)。如:人們的消費水平與收入水平之間的關系。非線性相關:當兩種相關現象之間近似于某種曲線方程的關系時,則這種相關關系稱為非線性關系。如:產品的平均成本與產品產量之間的關系。按相關的形式劃分為:線性相關:當兩種相關現象之間的關系大致呈按所研究的變量多少劃分為:單相關:兩個現象的相關,即一個變量對另一個變量的相關關系。如:投資額與國內生產總值之間的關系。復相關:當所研究的是一個變量對兩個或兩個以上其他變量的相關關系時,稱為復相關。如:某種商品的銷售額與其價格水平和人們收入水平之間的相關關系。偏相關:在某一現象與多種現象相關的場合,假定其它變量不變時,其中兩個變量的相關關系稱為偏相關。如:在假定人們的收入水平不變的條件下,某種商品的需求與其價格水平的關系就是一種偏相關。按所研究的變量多少劃分為:單相關:兩個現象的相關,即一個變量三、相關分析與回歸分析:這是兩種研究現象相關關系的基本方法。(一)、相關分析所謂相關分析,就是用一個指標來表明現象間相互依存關系的密切程度。(二)、回歸分析所謂回歸分析,就是根據相關關系的具體形態(tài),選擇一個合適的數學模型,來近似地表達變量間的平均變化關系。三、相關分析與回歸分析:這是兩種研究現象相關關系的基本方法?;貧w(Regression):

回歸一詞,最初是英國生物學家F.Golton在研究遺傳學的論文中所采用的詞匯(1877年)。他在研究中發(fā)現,具有較高身軀的雙親,或具有較矮身軀的雙親,其子女的身高均表現出退回(即回歸)到人的平均身高的趨勢。他在這一研究中所建立的數學公式被稱為回歸方程式,其涵義應是關系方程式或估計方程式,但基于歷史的原因,通常仍沿用回歸方程式這一提法?;貧w(Regression):回歸一詞(三)、相關分析與回歸分析的聯系相關分析與回歸分析不僅具有共同的研究對象,而且在具體應用時,常常必須相互補充。相關分析需要依靠回歸分析來表明現象數量相關的具體形式?;貧w分析需要依靠相關分析來表明現象數量變化的相關程度。只有當變量之間存在著高度相關時,進行回歸分析尋求其相關的具體形式才有意義。因此,相關分析與回歸分析被合稱為廣義的相關分析。(三)、相關分析與回歸分析的聯系相關分析與回歸分析不僅具有共(四)、相關分析與回歸分析的區(qū)別:研究目的不同:相關分析是研究變量之間相關的方向、相關程度和相關形式?;貧w分析是研究變量之間相互關系的具體形式,即:當一個變量發(fā)生數量上的變化時,另一個變量平均會發(fā)生什么樣的變化。研究方法不同:相關分析是通過計算相關系數或相關指數來判斷變量之間的相關關系?;貧w分析是通過數學模型來確定變量之間的具體的數量關系。變量的性質不同:在相關分析中,不用確定誰是自變量,誰是因變量,且所有變量都是隨機變量。在回歸分析中,必須事先確定在具有相關關系的變量中,誰是自變量和誰是因變量。一般來說,自變量是給定的非隨機變量(一般變量),因變量是隨機變量。(四)、相關分析與回歸分析的區(qū)別:研究目的不同:相關分析四、相關表和相關圖(一)、居民消費和收入的相關表消費支出15203040425360657078可支配收入18254560627588929998單位:百元四、相關表和相關圖(一)、居民消費和收入的相關表消費支出15可支配收入消費支出(二)、消費與收入的相關圖可支配收入消費支出(二)、消費與收入的相關圖§2簡單線性相關分析相關系數:用于判斷線性相關關系。用積差法進行計算。相關指數:用于判斷所有相關關系,包括線性和非線性的相關關系。但要用回歸系數b判別其相關方向?!?簡單線性相關分析相關系數:用于判斷線性相關關系。用一、相關系數(r):相關系數是在直線相關的條件下,說明兩個現象之間相關關系密切程度的統計指標。相關系數的取值范圍,是在-1和+1之間。計算結果r>0為正相關,r<0為負相關。相關系數的數值越接近于1(+1或-1),表示相關關系越強。越接近于0,相關關系越弱。如果r=0,則表明兩個現象之間完全沒有直線相關關系。(但并不表明兩個現象之間沒有非線性相關)相關系數的絕對值r

在0.3以下是無直線相關,在0.3—0.5是低度直線相關,在0.5—0.8是顯著相關,0.8以上是高度相關。一、相關系數(r):相關系數是在直線相關的條件下,說明兩個現計算相關系數的方法(積差法):·

···········(xy)ⅠⅡⅢⅣ計算相關系數的方法(積差法):·根據計算結果可以知道:在第一、三象限中,∑(x-x)(y-y)>0,為正值;在第二、四象限中,∑(x-x)(y-y)<0,為負值;根據計算結果可以知道:在第一、三象限中,

但∑(x-x)(y-y)的大小受變量值個數多少的影響,同樣的兩個現象會因為變量值個數的多少而出現計算結果的不一致。因此,需要消除計算結果受變量值個數多少的影響。方法就是:將計算結果除以變量值的個數n。但∑(x-x)(y-y)的大小受變量值協方差的作用:顯示x與y是正相關,還是負相關。相關系數的正負完全取決于協方差的正負。顯示x與y相關程度的大小。協方差的絕對值小,表示相關程度低;協方差的絕對值大,表示相關程度高。協方差的作用:顯示x與y是正相關,還是負相關。相關系

但x與y的協方差是名數,不同現象的變異情況不同,相關程度不能直接以協方差大小加以比較。需要以x與y的標準差加以標準化,使協方差化為無名數,使相關系數可以比較不同現象相關程度的高低。而且以x與y的標準差加以標準化以后,使相關系數的絕對值不超過1。但x與y的協方差是名數,不同現象的變異情況不統計學之相關分析的意義與任務舉例說明相關系數的計算:編號xyxyx2y21541926420381274832659127692287962689725910227101022811106311212331131293414138381515836合計15164234463216365412311例:觀察收入水平提高對用于食品支出的影響。設:收入水平為x,食品支出為y。舉例說明相關系數的計算:編號xyxyx2y215419264根據資料做散點圖:收入水平食品支出根據資料做散點圖:收入水平食品支出

從計算結果可以知道,收入水平與用于食品的支出成高度的正相關。從計算結果可以知道,收入水平與用于食品的支出§3一元線性回歸分析在相關分析中,已知兩個變量之間有直線相關關系。就需要確定一個數學表達式反映因變量與自變量之間的關系。有了這種數學表達式就便于進行解析,當有了自變量的一定數值,就可以估計因變量的數值平均來說將會有怎樣的變動。這樣的數學表達式稱為回歸方程式。由于變量之間關系的復雜性,回歸方程式也有多種類型和形式。一元線性回歸方程式是指一個自變量且相關形式為直線?!?一元線性回歸分析在相關分析中,已知兩個變量之間有舉例說明其研究方法:編號xyxyx2yc1541919.722642021.523812724.584832624.945912726.386922826.567962627.288972527.4691022728.36101022828.36111063129.0812123313222141383834.84151583638.44合計151642344632163654422.88舉例說明其研究方法:編號xyxyx2yc1541919.72設:x(自變量)為人均月收入水平,

y(因變量)為人均月食品支出額。從前面的相關分析中,已經看出兩個變量之間是線性趨勢,因此,可以通過一個線性方程式來表達這種關系:a、b是回歸方程的待定參數,其中b稱為回歸系數。設:x(自變量)為人均月收入水平,

y(因變對研究線性關系來說,回歸方程式應當滿足這樣的要求:

根據方程所確定的估計值應能代表所有觀察值y的全體,而按照求出的估計直線與各觀察點之間應達到最大限度的接近,也就是說,用這條直線來代表y與x的關系,它和實際數據的誤差比任何其他直線都小,這樣一來,根據回歸方程所求的直線就是反映y與x之間的關系的較為合理的一條直線。對研究線性關系來說,回歸方程式應當滿足這樣的要求:利用最小二乘法估計待定系數a和b:

a:是截距,表示當x等于0時,y=a;

b:是斜率,表示x每增加一個單位時,y所平均增加的數值。也是回歸系數,它與相關系數r

的取值方向一致:

b為正值時,r為正,表示正相關;

b為負值時,r為負,表示負相關。利用最小二乘法估計待定系數a和b:a:是截距,表示當x等于一元線性回歸方程的具體求法:一元線性回歸方程的具體求法:a=9.99元,表示當沒有任何收入時,人均用于

食品的支出需要9.99元。

b=0.18元,表示每增加一元的收入,人均用于

食品的支出平均會增加0.18元。b為

正值,表示收入水平與食品支出的

關系為正相關。將人均收入水平(x)代入回歸方程式,計算得到估計值,將其結果填入統計表。我們可以看到因變量(y)的觀察值和估計值并不一致,存在差異。這個差異的大小就是衡量直線方程式對所有觀察點的代表性的標準。a=9.99元,表示當沒有任何收入時,人均用于

§4估計標準誤差與相關指數

回歸方程反映了因變量與自變量之間的變動關系。但它本身并不能反映擬合程度的好壞,在建立方程之后,需要進一步分析估計直線的代表性,所有觀察點與估計值之間的離差程度等,這就需要建立一些指標來加以測定?!?估計標準誤差與相關指數回歸方程一、離差平方和的分解

所有觀察值y是上下波動的,y取值的這種波動的現象稱為變差。產生變差的原因是:受自變量變動的影響,即x取值的不同;其他因素的影響。為了分析這兩個方面的影響,需要對總變差進行分解,即:一、離差平方和的分解所有觀察值y是上下xy0xy0統計學之相關分析的意義與任務總變差的分解:

:根據線性方程,可以把它看作是由于x的變動所引起。因此,

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯系上傳者。文件的所有權益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網頁內容里面會有圖紙預覽,若沒有圖紙預覽就沒有圖紙。
  • 4. 未經權益所有人同意不得將文件中的內容挪作商業(yè)或盈利用途。
  • 5. 人人文庫網僅提供信息存儲空間,僅對用戶上傳內容的表現方式做保護處理,對用戶上傳分享的文檔內容本身不做任何修改或編輯,并不能對任何下載內容負責。
  • 6. 下載文件中如有侵權或不適當內容,請與我們聯系,我們立即糾正。
  • 7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

評論

0/150

提交評論