相關性分析課件_第1頁
相關性分析課件_第2頁
相關性分析課件_第3頁
相關性分析課件_第4頁
相關性分析課件_第5頁
已閱讀5頁,還剩39頁未讀, 繼續(xù)免費閱讀

下載本文檔

版權說明:本文檔由用戶提供并上傳,收益歸屬內容提供方,若內容存在侵權,請進行舉報或認領

文檔簡介

1、關于相關性分析第一張,PPT共四十四頁,創(chuàng)作于2022年6月一、相關分析的意義二、相關關系的測定6.1相關分析概述第二張,PPT共四十四頁,創(chuàng)作于2022年6月 出租汽車費用與行駛里程: 總費用=行駛里程 每公里單價 家庭收入與恩格爾系數(shù): 家庭收入高,則恩格爾系數(shù)低。函數(shù)關系(確定性關系)相關關系(非確定性關)比較下面兩種現(xiàn)象間的依存關系第三張,PPT共四十四頁,創(chuàng)作于2022年6月現(xiàn)象間的依存關系大致可以分成兩種類型:函數(shù)關系指現(xiàn)象間所具有的嚴格的確定性的依存關系相關關系指客觀現(xiàn)象間確實存在關系,但數(shù)量上不是嚴格對應的依存關系函數(shù)關系與相關關系之間并無嚴格的界限:有函數(shù)關系的變量間,由于有

2、測量誤差及各種隨機因素的干擾,可表現(xiàn)為相關關系;對具有相關關系的變量有深刻了解之后,相關關系有可能轉化為或借助函數(shù)關系來描述。相關關系的概念第四張,PPT共四十四頁,創(chuàng)作于2022年6月現(xiàn)象之間的相互聯(lián)系,常表現(xiàn)為一定的因果關系,將這些現(xiàn)象數(shù)量化則成為變量:其中一個或若干個起著影響作用的變量稱為自變量,通常用X表示,它是引起另一現(xiàn)象變化的原因,是可以控制、給定的值;而受自變量影響的變量稱為因變量,通常用Y表示,它是自變量變化的結果,是不確定的值。相關關系的概念第五張,PPT共四十四頁,創(chuàng)作于2022年6月 如果研究工業(yè)生產規(guī)模對工業(yè)貸款額的需求量問題,工業(yè)產值是自變量,工業(yè)貸款就是因變量; 如

3、果研究貸款量對工業(yè)生產規(guī)模的影響情況,工業(yè)貸款額是自變量,工業(yè)產值是因變量。研究居民收入水平與儲蓄存款余額的關系居民收入水平是自變量,儲蓄存款余額是因變量。有時相關關系表現(xiàn)的因果關系不明顯,要根據(jù)研究目的來確定。工業(yè)產值與工業(yè)貸款額的關系例如第六張,PPT共四十四頁,創(chuàng)作于2022年6月按涉及變量的多少分為相關關系的種類按照表現(xiàn)形式不同分為按照變化方向不同分為一元相關多元相關直線相關曲線相關負相關正相關相關關系的種類第七張,PPT共四十四頁,創(chuàng)作于2022年6月相關分析的內容對現(xiàn)象之間相互關系的方向和程度進行分析。 相關分析主要內容 確定現(xiàn)象之間是否存在相關關系以及相關關系的表現(xiàn)形式。 確定相

4、關關系的密切程度。 確定相關關系的數(shù)學表達式,即回歸方程式。 檢驗估計值的誤差。第八張,PPT共四十四頁,創(chuàng)作于2022年6月一、相關分析的意義二、相關關系的測定6.1相關分析概述第九張,PPT共四十四頁,創(chuàng)作于2022年6月定性分析 是依據(jù)研究者的理論知識和實踐經(jīng)驗,對客觀現(xiàn)象之間是否存在相關關系,以及何種關系作出判斷定量分析 在定性分析的基礎上,通過編制相關表、繪制相關圖、計算相關系數(shù)與判定系數(shù)等方法,來判斷現(xiàn)象之間相關的方向、形態(tài)及密切程度相關關系的測定第十張,PPT共四十四頁,創(chuàng)作于2022年6月簡單相關表適用于所觀察的樣本單位數(shù)較少,不需要分組的情況分組相關表適用于所觀察的樣本單位數(shù)

5、較多標志變異又較復雜,需要分組的情況將現(xiàn)象之間的相互關系,用表格的形式來反映。相關表第十一張,PPT共四十四頁,創(chuàng)作于2022年6月正 相 關負 相 關曲 線相關不 相 關xyxyxyxy又稱散點圖,用直角坐標系的x軸代表自變量,y軸代表因變量,將兩個變量間相對應的變量值用坐標點的形式描繪出來,用以表明相關點分布狀況的圖形。相關圖第十二張,PPT共四十四頁,創(chuàng)作于2022年6月在直線相關的條件下,用以反映兩變量間線性相關密切程度的統(tǒng)計指標,用r表示相關系數(shù) 第十三張,PPT共四十四頁,創(chuàng)作于2022年6月相關系數(shù)r的取值范圍:-1r1r0 為正相關,r 0 為負相關;|r|=0 表示不存在線性

6、關系;|r|1 表示完全線性相關;0|r|1表示存在不同程度線性相關: |r|0.3為不存在線性相關 0.3 |r| 0.5 為低度線性相關; 0.5 |r| 0.8為顯著線性相關; |r| 0.8為高度線性相關。第十四張,PPT共四十四頁,創(chuàng)作于2022年6月是相關系數(shù)的平方,用 表示;用來衡量回歸方程對y的解釋程度。判定系數(shù)取值范圍: 越接近于1,表明x與y之間的相關性越強; 越接近于0,表明兩個變量之間幾乎沒有直線相關關系.判定系數(shù)第十五張,PPT共四十四頁,創(chuàng)作于2022年6月【例】計算工業(yè)總產值與能源消耗量之間的相關系數(shù)及判定系數(shù) 資料結論:工業(yè)總產值與能源消耗量之間存在高度的正相關

7、關系,能源消耗量x的變化能夠解釋工業(yè)總產值y變化的95.2。第十六張,PPT共四十四頁,創(chuàng)作于2022年6月第六章 相關與回歸分析6.1相關分析概述6.2一元線性回歸分析第十七張,PPT共四十四頁,創(chuàng)作于2022年6月一、回歸分析概述二、一元線性回歸模型三、回歸估計標準差6.2一元線性回歸分析第十八張,PPT共四十四頁,創(chuàng)作于2022年6月回歸分析指在相關分析的基礎上,根據(jù)相關關系的數(shù)量表達式(回歸方程式)與給定的自變量x,揭示因變量y在數(shù)量上的平均變化,并求得因變量的預測值的統(tǒng)計分析方法回歸:退回regression第十九張,PPT共四十四頁,創(chuàng)作于2022年6月回歸分析與相關分析理論和方法

8、具有一致性;無相關就無回歸,相關程度越高,回歸越好; 相關系數(shù)和回歸系數(shù)方向一致,可以互相推算。聯(lián)系:第二十張,PPT共四十四頁,創(chuàng)作于2022年6月相關分析中x與y對等,回歸分析中x與y要確定自變量和因變量;相關分析中x、y均為隨機變量,回歸分析中只有y為隨機變量;相關分析測定相關程度和方向,回歸分析用回歸模型進行預測和控制?;貧w分析與相關分析區(qū)別:第二十一張,PPT共四十四頁,創(chuàng)作于2022年6月回歸分析的種類一元回歸(簡單回歸)多元回歸(復回歸)線性回歸非線性回歸一 元線性回歸按自變量的 個數(shù)分按回歸曲線的形態(tài)分第二十二張,PPT共四十四頁,創(chuàng)作于2022年6月一、回歸分析概述二、一元線

9、性回歸模型三、回歸估計標準差6.2一元線性回歸分析第二十三張,PPT共四十四頁,創(chuàng)作于2022年6月一元線性回歸模型對于經(jīng)判斷具有線性關系的兩個變量y與x,構造一元線性回歸模型為:假定E()=0,總體一元線性回歸方程:第二十四張,PPT共四十四頁,創(chuàng)作于2022年6月一元線性回歸方程的幾何意義截距斜率一元線性回歸方程的可能形態(tài)為正為負為0第二十五張,PPT共四十四頁,創(chuàng)作于2022年6月總體一元線性回歸方程:樣本一元線性回歸方程:以樣本統(tǒng)計量估計總體參數(shù)斜率(回歸系數(shù))截距截距a 表示在沒有自變量x的影響時,其它各種因素對因變量y的平均影響;回歸系數(shù)b 表明自變量x每變動一個單位,因變量y平均

10、變動b個單位。(估計的回歸方程)(一元線性回歸方程)第二十六張,PPT共四十四頁,創(chuàng)作于2022年6月隨機干擾:各種偶然因素、觀察誤差和其他被忽視因素的影響X對y的線性影響而形成的系統(tǒng)部分,反映兩變量的平均變動關系,即本質特征。第二十七張,PPT共四十四頁,創(chuàng)作于2022年6月一元線性回歸方程中參數(shù)a、b的確定:最小平方法基本數(shù)學要求:第二十八張,PPT共四十四頁,創(chuàng)作于2022年6月整理得到由兩個關于a、b的二元一次方程組成的方程組:進一步整理,有:第二十九張,PPT共四十四頁,創(chuàng)作于2022年6月【分析】因為工業(yè)總產值與能源消耗量之間存在高度正相關關系( ),所以可以擬合工業(yè)總產值對能源消

11、耗量的線性回歸方程?!纠拷⒐I(yè)總產值對能源消耗量的線性回歸方程 資料解:設線性回歸方程為第三十張,PPT共四十四頁,創(chuàng)作于2022年6月即線性回歸方程為:計算結果表明,在其他條件不變時,能源消耗量每增加一個單位(十萬噸),工業(yè)總產值將增加0.7961個單位(億元)。第三十一張,PPT共四十四頁,創(chuàng)作于2022年6月回歸系數(shù)b與相關系數(shù)r的關系: r0 r0 r=0b0 b0 b=0第三十二張,PPT共四十四頁,創(chuàng)作于2022年6月一、回歸分析概述二、一元線性回歸模型三、回歸方程的擬合優(yōu)度與評價6.2一元線性回歸分析第三十三張,PPT共四十四頁,創(chuàng)作于2022年6月離差平方和的分解每個因變量

12、y的實際值與其平均數(shù)之間存在的總離差(y- )的平方和稱為總離差平方和,簡稱總變差??傋儾罨貧w變差估計值 與平均數(shù) 離差的平方和,稱為回歸變差(可解釋變差)。剩余變差每個觀察值y與估計值 的離差平方和,稱為剩余變差(未解釋變差。第三十四張,PPT共四十四頁,創(chuàng)作于2022年6月剩余平方和回歸平方和總離差平方和第三十五張,PPT共四十四頁,創(chuàng)作于2022年6月Lyy=U+Q總離差平方和回歸平方和剩余(誤差)平方和第三十六張,PPT共四十四頁,創(chuàng)作于2022年6月判定系數(shù)是指因變量的總變差中可以被自變量解釋部分的比例,即可解釋因素的影響程度。用來說明因變量的變化有多少可通過自變量得到解釋。是衡量擬

13、合模型優(yōu)劣的重要分析指標。r2值越大,說明回歸模型擬合得愈優(yōu)。第三十七張,PPT共四十四頁,創(chuàng)作于2022年6月判定系數(shù)與相關系數(shù)的關系二者均可測定兩變量的線性相關密切程度第三十八張,PPT共四十四頁,創(chuàng)作于2022年6月判定系數(shù)與相關系數(shù)的區(qū)別:判定系數(shù)無方向性(不能反映負相關),相關系數(shù)則有方向,其方向與樣本回歸系數(shù) b 相同(可反映正相關,也可反映負相關);判定系數(shù)說明變量值的總離差平方和中可以用回歸線來解釋的比例,相關系數(shù)只說明兩變量間關聯(lián)程度及方向。第三十九張,PPT共四十四頁,創(chuàng)作于2022年6月估計標準誤差是因變量各實際值與其估計值之間的平均差異程度,表明其估計值對各實際值代表性

14、的強弱;其值越小,回歸方程的代表性越強,用回歸方程估計或預測的結果越準確??蓮囊环矫娣从郴貧w模型擬合的優(yōu)劣狀況。第四十張,PPT共四十四頁,創(chuàng)作于2022年6月在大樣本條件下,可用公式計算:【例】計算前面擬合的工業(yè)總產值對能源消耗量回歸方程的回歸標準差 資料第四十一張,PPT共四十四頁,創(chuàng)作于2022年6月估計標準差越小,則變量間相關程度越高,回歸線對Y的解釋程度越高。判定系數(shù)與估計標準誤差的關系:第四十二張,PPT共四十四頁,創(chuàng)作于2022年6月序號能源消耗量(十萬噸)x工業(yè)總產值(億元)yx2y2xy123456789101112131415163538404249525459626465686971727624252428323137404140475049514858122514441600176424012704291634813844409642

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內容里面會有圖紙預覽,若沒有圖紙預覽就沒有圖紙。
  • 4. 未經(jīng)權益所有人同意不得將文件中的內容挪作商業(yè)或盈利用途。
  • 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內容的表現(xiàn)方式做保護處理,對用戶上傳分享的文檔內容本身不做任何修改或編輯,并不能對任何下載內容負責。
  • 6. 下載文件中如有侵權或不適當內容,請與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

評論

0/150

提交評論