第七章相關與回歸_第1頁
第七章相關與回歸_第2頁
第七章相關與回歸_第3頁
第七章相關與回歸_第4頁
第七章相關與回歸_第5頁
已閱讀5頁,還剩52頁未讀, 繼續(xù)免費閱讀

下載本文檔

版權說明:本文檔由用戶提供并上傳,收益歸屬內容提供方,若內容存在侵權,請進行舉報或認領

文檔簡介

第七章相關與回歸第1頁,課件共57頁,創(chuàng)作于2023年2月一、相關分析概述二、相關關系的測定§11.1相關分析★第2頁,課件共57頁,創(chuàng)作于2023年2月⒈出租汽車費用與行駛里程:總費用=行駛里程每公里單價⒉家庭收入與恩格爾系數(shù):家庭收入高,則恩格爾系數(shù)低。函數(shù)關系(確定性關系)相關關系(非確定性關系)比較下面兩種現(xiàn)象間的依存關系第3頁,課件共57頁,創(chuàng)作于2023年2月現(xiàn)象間的依存關系大致可以分成兩種類型:函數(shù)關系指現(xiàn)象間所具有的嚴格的確定性的依存關系相關關系指客觀現(xiàn)象間確實存在,但數(shù)量上不是嚴格對應的依存關系函數(shù)關系與相關關系之間并無嚴格的界限:有函數(shù)關系的變量間,由于有測量誤差及各種隨機因素的干擾,可表現(xiàn)為相關關系;對具有相關關系的變量有深刻了解之后,相關關系有可能轉化為或借助函數(shù)關系來描述。第4頁,課件共57頁,創(chuàng)作于2023年2月⒈按涉及變量的多少分為相關關系的種類⒉按照表現(xiàn)形式不同分為⒊按照變化方向不同分為一元相關多元相關直線相關曲線相關負相關正相關相關分析的種類第5頁,課件共57頁,創(chuàng)作于2023年2月一、相關分析概述二、相關關系的測定§11.1相關分析★★第6頁,課件共57頁,創(chuàng)作于2023年2月定性分析是依據(jù)研究者的理論知識和實踐經驗,對客觀現(xiàn)象之間是否存在相關關系,以及何種關系作出判斷定量分析在定性分析的基礎上,通過編制相關表、繪制相關圖、計算相關系數(shù)與判定系數(shù)等方法,來判斷現(xiàn)象之間相關的方向、形態(tài)及密切程度相關關系的測定第7頁,課件共57頁,創(chuàng)作于2023年2月簡單相關表適用于所觀察的樣本單位數(shù)較少,不需要分組的情況分組相關表適用于所觀察的樣本單位數(shù)較多標志變異又較復雜,需要分組的情況將現(xiàn)象之間的相互關系,用表格的形式來反映。相關表第8頁,課件共57頁,創(chuàng)作于2023年2月正相關負相關曲線相關不相關xyxyxyxy又稱散點圖,用直角坐標系的x軸代表自變量,y軸代表因變量,將兩個變量間相對應的變量值用坐標點的形式描繪出來,用以表明相關點分布狀況的圖形。相關圖第9頁,課件共57頁,創(chuàng)作于2023年2月在直線相關的條件下,用以反映兩變量間線性相關密切程度的統(tǒng)計指標,用r表示相關系數(shù)第10頁,課件共57頁,創(chuàng)作于2023年2月相關系數(shù)r的取值范圍:-1≤r≤1r>0為正相關,r<0為負相關;|r|=0表示不存在線性關系;|r|=1表示完全線性相關;0<|r|<1表示存在不同程度線性相關:|r|

<

0.4為低度線性相關;0.4≤|r|<0.7為顯著性線性相關;0.7≤|r|<1.0為高度顯著性線性相關。第11頁,課件共57頁,創(chuàng)作于2023年2月是相關系數(shù)的平方,用表示;用來衡量回歸方程對y的解釋程度。判定系數(shù)取值范圍:越接近于1,表明x與y之間的相關性越強;越接近于0,表明兩個變量之間幾乎沒有直線相關關系.判定系數(shù)第12頁,課件共57頁,創(chuàng)作于2023年2月結論:工業(yè)總產值與能源消耗量之間存在高度的正相關關系,能源消耗量x的變化能夠解釋工業(yè)總產值y變化的95.2﹪?!纠坑嬎愎I(yè)總產值與能源消耗量之間的相關系數(shù)及判定系數(shù)資料第13頁,課件共57頁,創(chuàng)作于2023年2月第十一章回歸分析與相關分析§11.1相關分析§11.2一元線性回歸分析★★第14頁,課件共57頁,創(chuàng)作于2023年2月一、回歸分析概述二、一元線性回歸模型三、回歸估計標準差四、線性相關的顯著性檢驗五、回歸估計與預測§11.2一元線性回歸分析★第15頁,課件共57頁,創(chuàng)作于2023年2月回歸分析指根據(jù)相關關系的數(shù)量表達式(回歸方程式)與給定的自變量x,揭示因變量y在數(shù)量上的平均變化和求得因變量的預測值的統(tǒng)計分析方法回歸:退回regression第16頁,課件共57頁,創(chuàng)作于2023年2月回歸分析與相關分析理論和方法具有一致性;無相關就無回歸,相關程度越高,回歸越好;

相關系數(shù)和回歸系數(shù)方向一致,可以互相推算。聯(lián)系:第17頁,課件共57頁,創(chuàng)作于2023年2月相關分析中x與y對等,回歸分析中x與y要確定自變量和因變量;相關分析中x、y均為隨機變量,回歸分析中只有y為隨機變量;相關分析測定相關程度和方向,回歸分析用回歸模型進行預測和控制?;貧w分析與相關分析區(qū)別:第18頁,課件共57頁,創(chuàng)作于2023年2月注意

我們不能把回歸分析看作是在變量間建立一個因果關系的過程。回歸分析只能表明,變量是如何或者是以怎樣的程度彼此聯(lián)系在一起的。有關因果關系的任何結論,必須建立在理論分析的基礎之上。第19頁,課件共57頁,創(chuàng)作于2023年2月回歸分析的種類一元回歸(簡單回歸)多元回歸(復回歸)線性回歸非線性回歸一元線性回歸SimpleLinearregression按自變量的個數(shù)分⒈按回歸曲線的形態(tài)分⒉第20頁,課件共57頁,創(chuàng)作于2023年2月一、回歸分析概述二、一元線性回歸模型三、回歸估計標準差四、線性相關的顯著性檢驗五、回歸估計與預測★★§11.2一元線性回歸分析第21頁,課件共57頁,創(chuàng)作于2023年2月一元線性回歸模型對于經判斷具有線性關系的兩個變量y與x,構造一元線性回歸模型為:假定E(

)=0,有總體一元線性回歸方程:第22頁,課件共57頁,創(chuàng)作于2023年2月一元線性回歸方程的幾何意義截距斜率一元線性回歸方程的可能形態(tài)

為正

為負

為0第23頁,課件共57頁,創(chuàng)作于2023年2月總體一元線性回歸方程:樣本一元線性回歸方程:以樣本統(tǒng)計量估計總體參數(shù)斜率(回歸系數(shù))截距截距a表示在沒有自變量x的影響時,其它各種因素對因變量y的平均影響;回歸系數(shù)b表明自變量x每變動一個單位,因變量y平均變動b個單位。(估計的回歸方程)(一元線性回歸方程)第24頁,課件共57頁,創(chuàng)作于2023年2月隨機干擾:各種偶然因素、觀察誤差和其他被忽視因素的影響X對y的線性影響而形成的系統(tǒng)部分,反映兩變量的平均變動關系,即本質特征。第25頁,課件共57頁,創(chuàng)作于2023年2月殘差(Residual):第26頁,課件共57頁,創(chuàng)作于2023年2月一元線性回歸方程中參數(shù)a、b的確定:最小平方法基本數(shù)學要求:第27頁,課件共57頁,創(chuàng)作于2023年2月整理得到由兩個關于a、b的二元一次方程組成的方程組:進一步整理,有:第28頁,課件共57頁,創(chuàng)作于2023年2月【分析】因為工業(yè)總產值與能源消耗量之間存在高度正相關關系(),所以可以擬合工業(yè)總產值對能源消耗量的線性回歸方程?!纠拷⒐I(yè)總產值對能源消耗量的線性回歸方程資料解:設線性回歸方程為第29頁,課件共57頁,創(chuàng)作于2023年2月即線性回歸方程為:計算結果表明,在其他條件不變時,能源消耗量每增加一個單位(十萬噸),工業(yè)總產值將增加0.7961個單位(億元)。第30頁,課件共57頁,創(chuàng)作于2023年2月最小二乘法估計的優(yōu)良性質殘差之和為零所擬合直線通過樣本散點圖的重心誤差項與解釋變量不相關a與b分別是總體回歸系數(shù)的無偏估計量a與b均為服從正態(tài)分布的隨機變量第31頁,課件共57頁,創(chuàng)作于2023年2月一元線性回歸模型的假定第32頁,課件共57頁,創(chuàng)作于2023年2月b與r的關系:

r>0r<0r=0b>0b<0 b=0第33頁,課件共57頁,創(chuàng)作于2023年2月判定系數(shù)與相關系數(shù)的關系第34頁,課件共57頁,創(chuàng)作于2023年2月判定系數(shù)與相關系數(shù)的區(qū)別:判定系數(shù)無方向性,相關系數(shù)則有方向,其方向與樣本回歸系數(shù)b相同;判定系數(shù)說明變量值的總離差平方和中可以用回歸線來解釋的比例,相關系數(shù)只說明兩變量間關聯(lián)程度及方向;相關系數(shù)有夸大變量間相關程度的傾向,因而判定系數(shù)是更好的度量值。第35頁,課件共57頁,創(chuàng)作于2023年2月一、回歸分析概述二、一元線性回歸模型三、回歸估計標準差四、線性相關的顯著性檢驗五、回歸估計與預測★★§11.2一元線性回歸分析★第36頁,課件共57頁,創(chuàng)作于2023年2月回歸估計標準差是因變量各實際值與其估計值之間的平均差異程度,表明其估計值對各實際值代表性的強弱;其值越小,回歸方程的代表性越強,用回歸方程估計或預測的結果越準確。第37頁,課件共57頁,創(chuàng)作于2023年2月在大樣本條件下,可用公式計算:【例】計算前面擬合的工業(yè)總產值對能源消耗量回歸方程的回歸標準差

資料第38頁,課件共57頁,創(chuàng)作于2023年2月剩余離差平方和回歸離差平方和總離差平方和第39頁,課件共57頁,創(chuàng)作于2023年2月Lyy=U+Q總離差平方和回歸離差平方和剩余離差平方和第40頁,課件共57頁,創(chuàng)作于2023年2月估計標準差越小,則變量間相關程度越高,回歸線對Y的解釋程度越高。判定系數(shù)與估計標準差的關系:第41頁,課件共57頁,創(chuàng)作于2023年2月一、回歸分析概述二、一元線性回歸模型三、回歸估計標準差四、線性相關的顯著性檢驗五、回歸估計與預測★★§11.2一元線性回歸分析★★第42頁,課件共57頁,創(chuàng)作于2023年2月樣本相關系數(shù)r的顯著性檢驗(t檢驗法)⒈提出假設:目的檢驗總體兩變量間線性相關性是否顯著步驟⒉構造檢驗統(tǒng)計量:第43頁,課件共57頁,創(chuàng)作于2023年2月相關系數(shù)的顯著性檢驗(t檢驗法)⒊根據(jù)給定的顯著性水平,確定臨界值;⒌計算檢驗統(tǒng)計量并做出決策。⒋確定原假設的拒絕規(guī)則:若,則接受H0,表示總體兩變量間線性相關性不顯著;若,則拒絕H0,表示總體兩變量間線性相關性顯著步驟第44頁,課件共57頁,創(chuàng)作于2023年2月【例】檢驗工業(yè)總產值與能源消耗量之間的線性相關性是否顯著

資料當成立時,則統(tǒng)計量第45頁,課件共57頁,創(chuàng)作于2023年2月一、回歸分析概述二、一元線性回歸模型三、回歸估計標準差四、線性相關的顯著性檢驗五、回歸估計與預測★★§11.2一元線性回歸分析★★★第46頁,課件共57頁,創(chuàng)作于2023年2月回歸方程的估計與預測估計的前提:回歸方程經過檢驗,證明X和Y

的關系在統(tǒng)計上是顯著相關的。對于給定的

X

值,求出Y平均值的一個估計值或Y

的一個個別值的預測值。對于給定的X值,求出Y

的平均值的置信區(qū)間或Y

的一個個別值的預測區(qū)間。點估計區(qū)間估計第47頁,課件共57頁,創(chuàng)作于2023年2月點估計若x=80(十萬噸),則:第48頁,課件共57頁,創(chuàng)作于2023年2月區(qū)間估計對于給定的x=x0

,Y的1-

置信區(qū)間為:自由度為n-2的t分布的水平雙側分位數(shù)第49頁,課件共57頁,創(chuàng)作于2023年2月即:在大樣本條件下,近似有:第50頁,課件共57頁,創(chuàng)作于2023年2月SPSS輸出結果(一)第51頁,課件共57頁,創(chuàng)作于2023年2月方差分析表SPSS輸出結果(二)第52頁,課件共57頁,創(chuàng)作于2023年2月SPSS輸出結果(三)第53頁,課件共57頁,創(chuàng)作于2023年2月35.00 24.00 21.34872 -1.67557 18.71588 23.9815738.00 25.00 23.73710 -1.44965 21.36539 26.1088140.00 24.00 25.32935 -1.29904 23.12509 27.5336042.00 28.00 26.92160 -1.14842 24.87796 28.9652349.00 32.00 32.49447 -.62128 30.92932 34.0596252.00 31.00 34.88284 -.39536 33.45997 36.3057254.00 37.00 36.47509 -.24475 35.11637 37.8338259.00 40.00 40.45572 .13179 39.12628 41.7851662.00 41.00 42.84409 .35771 41.43978 44.2484164.00 40.00 44.43634 .50832 42.94855 45.9241365.00 47.00 45.23247 .58363 43.69437 46.7705668.00 50.00 47.62084 .80955 45.90378 49.3379169.00 49.00 48.41697 .88485 46.63245 50.2014871.00 51.00 50.00922 1.03547 48.08053 51.9379072.00 48.00 50.80534 1.11077 48.80060 52.8100876.00 58.00 53.98984 1.41200 51.66055 56.31912非標準預測值標準預測值下限上限第54頁,課件共57頁,創(chuàng)作于2023年2月企業(yè)編號月產量(千噸)X生產費用(萬元)Y123456781.22.03.13.85.06.17.28.0628680110115132135160八個同類工業(yè)企業(yè)的月產量與生產費用簡單相關表第55頁,課件共57頁,創(chuàng)作于2023年2月平均每晝夜產量固定資產原值35~4040~

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網頁內容里面會有圖紙預覽,若沒有圖紙預覽就沒有圖紙。
  • 4. 未經權益所有人同意不得將文件中的內容挪作商業(yè)或盈利用途。
  • 5. 人人文庫網僅提供信息存儲空間,僅對用戶上傳內容的表現(xiàn)方式做保護處理,對用戶上傳分享的文檔內容本身不做任何修改或編輯,并不能對任何下載內容負責。
  • 6. 下載文件中如有侵權或不適當內容,請與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

評論

0/150

提交評論