![《R語言與回歸分析》課件分析_第1頁](http://file4.renrendoc.com/view/9e4df36191b12756af17490b9f9a0a10/9e4df36191b12756af17490b9f9a0a101.gif)
![《R語言與回歸分析》課件分析_第2頁](http://file4.renrendoc.com/view/9e4df36191b12756af17490b9f9a0a10/9e4df36191b12756af17490b9f9a0a102.gif)
![《R語言與回歸分析》課件分析_第3頁](http://file4.renrendoc.com/view/9e4df36191b12756af17490b9f9a0a10/9e4df36191b12756af17490b9f9a0a103.gif)
![《R語言與回歸分析》課件分析_第4頁](http://file4.renrendoc.com/view/9e4df36191b12756af17490b9f9a0a10/9e4df36191b12756af17490b9f9a0a104.gif)
![《R語言與回歸分析》課件分析_第5頁](http://file4.renrendoc.com/view/9e4df36191b12756af17490b9f9a0a10/9e4df36191b12756af17490b9f9a0a105.gif)
版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進行舉報或認領(lǐng)
文檔簡介
R語言與回歸分析R簡介R語言分析一個簡單的線性模型總結(jié)與展望作業(yè)R語言與回歸分析R簡介1R簡介
1.S語言與R2.R的安裝與運行3.R程序包的安裝及使用4.R語言中的幾點注意事項R簡介
1.S語言與R2S語言與RR是一個有著強大統(tǒng)計分析及作圖功能的軟件系統(tǒng)R語言可以看作是貝爾實驗室開發(fā)的S語言的一種實現(xiàn)或形式S語言主要內(nèi)含在S-PLUS軟件中,可將R和S-PLUS視為S語言的兩種形式S/S-PLUS方面的文檔都可以直接用于RS語言與RR是一個有著強大統(tǒng)計分析及作圖功能的軟件系統(tǒng)3R的安裝與運行R的安裝:從網(wǎng)址/下載R的安裝程序和R程序包(R下載地址:/bin/windows/base/)
/,單擊downloadR單擊Windows,在單擊base單擊DownloadR2.11.1forWindows
R的安裝與運行R的安裝:從網(wǎng)址http://www.r-p4R程序包的安裝(1)菜單方式:聯(lián)網(wǎng)條件下,按程序包安裝程序包選擇CRAN鏡像服務(wù)器選擇程序包(2)命令方式:install.packages(“PKname”)(3)本地安裝:下載需要的程序包及與之關(guān)聯(lián)的程序包,再用“程序包”菜單中的“用本機的zip文件安裝程序包”R程序包的安裝(1)菜單方式:聯(lián)網(wǎng)條件下,按程序包5R程序包的使用除R的標準程序包外,新安裝的程序包使用前必須載入,兩種載入方式:菜單方式:通過“程序包”菜單中的“載入程序包”,再從已有程序包中選定需要的一個加載;(2)命令方式:在命令提示符后鍵入>libiary(“PKname”)#或libiary(‘PKname’),libiary(PKname)R程序包的使用除R的標準程序包外,新安裝的程序包使用前必須載6R語言中的幾點注意事項R語言區(qū)分大小寫,即A與a不同;正常情況下所有字母和數(shù)字都是可用的。命令由(;)分隔,或另起新行。基本命令由({和})合并成復(fù)合表達式注釋以(#)開始,到行末結(jié)束。命令未結(jié)束,R給出提示符(+)。R語言中的幾點注意事項R語言區(qū)分大小寫,即A與a不同;正常情7R語言與線性回歸線性回歸模型的簡單回顧如何應(yīng)用R語言進行回歸分析R語言與線性回歸線性回歸模型的簡單回顧8線性回歸模型的簡單回顧Y通常稱為因變量或響應(yīng)變量,X稱為自變量或預(yù)報變量。Y值由兩部分組成,一部分由X決定是X的函數(shù),記為f(X);另一部分由其他為考慮因素所產(chǎn)生的影響被稱為隨機誤差,記為e。模型記為:Y=f(X)+e要求E(e)=0,特別的f(X)取為線性函數(shù)。線性回歸模型的簡單回顧Y通常稱為因變量或響應(yīng)變量,X稱9線性回歸模型的簡單回顧回歸分析的主要目的是探尋因變量與自變量之間的關(guān)系。最常用的函數(shù)形式是線性函數(shù),含有p個自變量的一般線性模型:其中為常數(shù)項,為第j個解釋型變量的回歸系數(shù),它意味著,若變化一個單位,可以預(yù)期變化多少單位。線性回歸模型的簡單回顧回歸分析的主要目的是探尋因變量與自變量10線性回歸模型的簡單回顧對此普通線性模型做如下假定:(1)獨立性:不同觀測值之間相互獨立的;殘差項同解釋性變量之間是獨立的。(2)常方差:即殘差的方差不依賴于自變量的取值,為一個常數(shù)。(3)正態(tài)性:即殘差項是服從正態(tài)分布的。線性回歸模型的簡單回顧對此普通線性模型做如下假定:11案例介紹背景、目標、變量和分析案例介紹背景、目標、變量和分析12案例背景目前中國的資本市場逐漸成熟,投資于股市成為眾多企業(yè)乃至個人的重要理財方式。因此利用上市公司當年的公開的財務(wù)指標對其來年盈利狀況予以預(yù)測就成為投資人最重要的決策依據(jù)。本案例隨機抽取深市和滬市2002年和2003年各500個樣本,對上市公司的凈資產(chǎn)收益率(returnonequity,ROE)進行預(yù)測。案例背景目前中國的資本市場逐漸成熟,投資于股市成為眾多企業(yè)乃13案例目標與變量目標:盈利預(yù)測因變量:下一年的凈資產(chǎn)收益率(ROE)自變量:當年的財務(wù)信息樣本容量:2002年500;2003年500案例目標與變量目標:盈利預(yù)測14自變量ROEt:當年凈資產(chǎn)收益率ATO:資產(chǎn)周轉(zhuǎn)率(assetturnoverratio)LEV:債務(wù)資本比率(debttoassetratio)
反映公司基本債務(wù)狀況PB:市倍率(pricetobookratio)
反映公司預(yù)期未來成長率ARR:應(yīng)收賬款/主營業(yè)務(wù)收入(accountreceivableovertotalincome)
反映公司的收入質(zhì)量自變量ROEt:當年凈資產(chǎn)收益率15對模型的進一步分析哪個自變量在預(yù)測方面最有用?哪個自變量是最重要的?如何使用模型進行預(yù)測?對模型的進一步分析哪個自變量在預(yù)測方面最有用?16描述分析獲得對數(shù)據(jù)的整體性認識描述分析獲得對數(shù)據(jù)的整體性認識17數(shù)據(jù)讀取(1)使用函數(shù)read.table()創(chuàng)建數(shù)據(jù)框>rm(list=ls())#清理當前工作空間a<-read.table("D:\\暑期建模\\CH1\\roe.txt",header=T)(2)使用函數(shù)scan()比read.table()更靈活,并且可以指定變量的類型數(shù)據(jù)讀取(1)使用函數(shù)read.table()創(chuàng)建數(shù)據(jù)框18Excel數(shù)據(jù)讀取(1)利用剪切板:打開Excel電子表格,選中需要數(shù)據(jù),復(fù)制到剪切板。然后鍵入命令>a<-read.delim("clipboard")(2)使用程序包RODBC>library(RODBC)b<-odbcConnectExcel("d:/暑期建模/CH1/roe.xls")a<-sqlFetch(b,"roe")Excel數(shù)據(jù)讀取(1)利用剪切板:打開Excel電子表格,19數(shù)據(jù)保存>save(a,file="a.RData")load("d:\\我的文檔\\a.RData")#調(diào)用以保存數(shù)據(jù)write.table(a,"a.txt")#保存為文本文檔write.csv(a,"a.csv")a1=a[a$year==2002,-1]save(a1,file="a1.RData")數(shù)據(jù)保存>save(a,file="a.RData")20顯示數(shù)據(jù)顯示數(shù)據(jù)21變量的概括性度量a1=a[a$year==2002,-1]#從a中選出year為2002的數(shù)據(jù),并刪除第1列,然后賦值給a1Mean=sapply(a1,mean)#計算a1中各列的均值Min=sapply(a1,min)#計算a1中各列的最小值Median=sapply(a1,median)#計算a1中各列的中位數(shù)Max=sapply(a1,max)#計算a1中各列的最大值SD=sapply(a1,sd)#計算a1中各列的標準差cbind(Mean,Min,Median,Max,SD)#將均值、最小值、中位數(shù)、最大值、標準差集中在一起展示變量的概括性度量a1=a[a$year==2002,-1]22試驗結(jié)果試驗結(jié)果23變量間的相關(guān)性散點圖是一種最簡單的相關(guān)分析工具通過函數(shù)pairs()觀察各個變量間的相關(guān)性命令:>pairs(a,panel=panel.smooth)隨機變量樣本的相關(guān)系數(shù)>round(cor(a),3)相關(guān)性檢驗,使用函數(shù)cor.test()變量間的相關(guān)性散點圖是一種最簡單的相關(guān)分析工具24《R語言與回歸分析》課件分析25應(yīng)用R語言命令:plot(a1$ROEt,a1$ROE)繪制散點圖,可以看出ROEt與ROE的相關(guān)性應(yīng)用R語言命令:plot(a1$ROEt,a1$ROE)26模型的建立模型、假設(shè)和參數(shù)估計模型的建立模型、假設(shè)和參數(shù)估計27模型形式及假設(shè)線性回歸模型模型假設(shè)(1)獨立性假設(shè)(2)同方差假設(shè)(3)正態(tài)性假設(shè)模型形式及假設(shè)線性回歸模型28參數(shù)估計模型:最小二乘估計量:方差估計量:參數(shù)估計模型:29參數(shù)估計用矩陣形式表示線性模型記為
其中是回歸系數(shù)變量,是因變量向量,是隨機擾動向量,而X為設(shè)計矩陣。當存在時,回歸參數(shù)的最小二乘估計為。參數(shù)估計用矩陣形式表示線性模型記為30參數(shù)估計的R軟件實現(xiàn)R語句:使用函數(shù)lm()>lm1=lm(ROE~ROEt+ATO+PM+LEV+GROWTH+PB+ARR+INV+ASSET,data=a1)summary(lm1)注:我們采用2002年數(shù)據(jù)擬合模型參數(shù)估計的R軟件實現(xiàn)R語句:使用函數(shù)lm()31《R語言與回歸分析》課件分析32擬合優(yōu)度總平方和殘差平方和
計算殘差函數(shù)residuals()R-Square擬合優(yōu)度總平方和33
顯著性檢驗F檢驗、T檢驗顯著性檢驗F檢驗、T檢驗34F檢驗假設(shè)檢驗統(tǒng)計量拒絕域F檢驗假設(shè)35T檢驗假設(shè)檢驗統(tǒng)計量拒絕域T檢驗假設(shè)36《R語言與回歸分析》課件分析37各個結(jié)果的含義第一列:參數(shù)的估計值第二列:各個參數(shù)估計的標準差第三列:通過樣本計算得T檢驗統(tǒng)計量的值第四列:通過T檢驗計算的p值Residualstandarderror(殘差標準誤)R-squared(判別系數(shù))各個結(jié)果的含義第一列:參數(shù)的估計值38顯著性檢驗的結(jié)論從F檢驗的結(jié)果看,模型的線性關(guān)系是顯著的。從T檢驗的結(jié)果看,ROEt和LEV兩個變量通過了檢驗,GROWTH變量在顯著性水平降至0.1時也可以通過檢驗,因此這三個變量與因變量的線性關(guān)系較為顯著。注意,這不說明應(yīng)該刪除其它變量!顯著性檢驗的結(jié)論從F檢驗的結(jié)果看,模型的線性關(guān)系是顯著的。39模型的診斷異方差性、非正態(tài)性、異常值模型的診斷異方差性、非正態(tài)性、異常值40同方差性檢驗正常的殘差圖同方差性檢驗正常的殘差圖41同方差性檢驗觀測值不獨立同方差性檢驗觀測值不獨立42同方差性檢驗方差齊性不成立(即方差相等假設(shè)不成立)同方差性檢驗方差齊性不成立(即方差相等假設(shè)不成立)43同方差性檢驗應(yīng)改為曲線同方差性檢驗應(yīng)改為曲線44正態(tài)性檢驗若,并且則有正態(tài)性檢驗若45正態(tài)性檢驗進一步,可得到以及所以在正態(tài)性假設(shè)下,殘差與應(yīng)該成線性關(guān)系。正態(tài)性檢驗進一步,可得到46正態(tài)性檢驗Q-Q圖殘差:將殘差排序:Y:X:正態(tài)性檢驗Q-Q圖47《R語言與回歸分析》課件分析48《R語言與回歸分析》課件分析49將上面的方法應(yīng)用于本案例目標1:檢驗?zāi)P褪欠穹先齻€假設(shè)目標2:找出異常值R語句:
par(mfrow=c(2,2)) #設(shè)置畫圖為2x2的格式plot(lm1,which=c(1:4))#畫出lm1中對應(yīng)于模型檢驗的4張圖,包括殘差圖、QQ圖和Cook距離圖檢驗發(fā)現(xiàn)47號數(shù)據(jù)為異常值,需要將其消除
語句:a1=a1(-47)將上面的方法應(yīng)用于本案例目標1:檢驗?zāi)P褪欠穹先齻€假設(shè)50應(yīng)用上述方法,繪制擬合模型的診斷圖應(yīng)用上述方法,繪制擬合模型的診斷圖51異常點的識別一般把標準化殘差的絕對值大于等于2的觀測點認為是可疑點;而標準化殘差的絕對值大于等于3的觀測點認為是異常點。異常點的識別一般把標準化殘差的絕對值大于等于2的觀測點認為是52剔除異常點a1=a1[-47,]#刪除a1中第47行的觀測lm2=lm(ROE~ROEt+ATO+PM+LEV+GROWTH+PB+ARR+INV+ASSET,data=a1)#用上一行命令得到的新數(shù)據(jù)a1再次擬合線型回歸模型,結(jié)果賦值給lm2 plot(lm2,which=c(1:4)) #畫出lm2中對應(yīng)于模型檢驗的4張圖,包括殘差圖、QQ圖和Cook距離圖剔除異常點a1=a1[-47,]#刪除a1中第47行的觀53擬合結(jié)果擬合結(jié)果5447為異常點去掉之后,擬合模型診斷圖如下47為異常點去掉之后,擬合模型診斷圖如下55多重共線性含義及檢驗多重共線性含義及檢驗56共線性含義共線性問題是指擬合多元線性回歸時,自變量之間存在線性關(guān)系或近似線性關(guān)系。自變量間的線性關(guān)系將隱蔽變量的顯著性,增加參數(shù)估計的誤差,會產(chǎn)生不穩(wěn)定的模型共線性含義共線性問題是指擬合多元線性回歸時,自變量之間存在線57一個例子假如有兩個變量x1和x2,用最小二乘法得到如下參數(shù)估計量。一個例子假如有兩個變量x1和x2,用最小二乘法得到如下參數(shù)估58《R語言與回歸分析》課件分析59方差膨脹因子定義下面的回歸形式為輔助回歸令為輔助回歸的判定系數(shù)則方差膨脹因子為:它反映了在多大程度上第i個自變量所包含的信息被其他自變量覆蓋方差膨脹因子定義下面的回歸形式為輔助回歸60方差膨脹因子R語句:函數(shù)vif()所有的VIF值都小于10且接近1,所以沒有多重共線性問題。注:VIF>10,表明模型中有很強的共線性問題方差膨脹因子R語句:函數(shù)vif()61變量選擇AIC準則、BIC準則變量選擇AIC準則、BIC準則62AIC和BICAIC方法比較保守,其中p為自變量個數(shù),與RSS成反比。使AIC達到最小的模型是最優(yōu)的BIC相對不那么保守,因此保留的變量可能會比較少。AIC和BICAIC方法比較保守,其中p為自變量個數(shù),與63《R語言與回歸分析》課件分析64《R語言與回歸分析》課件分析65預(yù)測預(yù)測66預(yù)測值與置信區(qū)間預(yù)測值與置信區(qū)間67數(shù)據(jù)準備以2003年數(shù)據(jù)為檢驗數(shù)據(jù),可以用如下方法對數(shù)據(jù)進行準備數(shù)據(jù)準備以2003年數(shù)據(jù)為檢驗數(shù)據(jù),可以用如下方法對數(shù)據(jù)進行68預(yù)測預(yù)測69R語言的特點免費浮點運算功能強大不依賴于操作系統(tǒng)幫助功能完善作圖功能強大R語言的特點70R的特點統(tǒng)計分析能力尤為突出可移植性強強大的拓展與開發(fā)能力靈活而不死板R的特點統(tǒng)計分析能力尤為突出71R語言與回歸分析R簡介R語言分析一個簡單的線性模型總結(jié)與展望作業(yè)R語言與回歸分析R簡介72R簡介
1.S語言與R2.R的安裝與運行3.R程序包的安裝及使用4.R語言中的幾點注意事項R簡介
1.S語言與R73S語言與RR是一個有著強大統(tǒng)計分析及作圖功能的軟件系統(tǒng)R語言可以看作是貝爾實驗室開發(fā)的S語言的一種實現(xiàn)或形式S語言主要內(nèi)含在S-PLUS軟件中,可將R和S-PLUS視為S語言的兩種形式S/S-PLUS方面的文檔都可以直接用于RS語言與RR是一個有著強大統(tǒng)計分析及作圖功能的軟件系統(tǒng)74R的安裝與運行R的安裝:從網(wǎng)址/下載R的安裝程序和R程序包(R下載地址:/bin/windows/base/)
/,單擊downloadR單擊Windows,在單擊base單擊DownloadR2.11.1forWindows
R的安裝與運行R的安裝:從網(wǎng)址http://www.r-p75R程序包的安裝(1)菜單方式:聯(lián)網(wǎng)條件下,按程序包安裝程序包選擇CRAN鏡像服務(wù)器選擇程序包(2)命令方式:install.packages(“PKname”)(3)本地安裝:下載需要的程序包及與之關(guān)聯(lián)的程序包,再用“程序包”菜單中的“用本機的zip文件安裝程序包”R程序包的安裝(1)菜單方式:聯(lián)網(wǎng)條件下,按程序包76R程序包的使用除R的標準程序包外,新安裝的程序包使用前必須載入,兩種載入方式:菜單方式:通過“程序包”菜單中的“載入程序包”,再從已有程序包中選定需要的一個加載;(2)命令方式:在命令提示符后鍵入>libiary(“PKname”)#或libiary(‘PKname’),libiary(PKname)R程序包的使用除R的標準程序包外,新安裝的程序包使用前必須載77R語言中的幾點注意事項R語言區(qū)分大小寫,即A與a不同;正常情況下所有字母和數(shù)字都是可用的。命令由(;)分隔,或另起新行?;久钣?{和})合并成復(fù)合表達式注釋以(#)開始,到行末結(jié)束。命令未結(jié)束,R給出提示符(+)。R語言中的幾點注意事項R語言區(qū)分大小寫,即A與a不同;正常情78R語言與線性回歸線性回歸模型的簡單回顧如何應(yīng)用R語言進行回歸分析R語言與線性回歸線性回歸模型的簡單回顧79線性回歸模型的簡單回顧Y通常稱為因變量或響應(yīng)變量,X稱為自變量或預(yù)報變量。Y值由兩部分組成,一部分由X決定是X的函數(shù),記為f(X);另一部分由其他為考慮因素所產(chǎn)生的影響被稱為隨機誤差,記為e。模型記為:Y=f(X)+e要求E(e)=0,特別的f(X)取為線性函數(shù)。線性回歸模型的簡單回顧Y通常稱為因變量或響應(yīng)變量,X稱80線性回歸模型的簡單回顧回歸分析的主要目的是探尋因變量與自變量之間的關(guān)系。最常用的函數(shù)形式是線性函數(shù),含有p個自變量的一般線性模型:其中為常數(shù)項,為第j個解釋型變量的回歸系數(shù),它意味著,若變化一個單位,可以預(yù)期變化多少單位。線性回歸模型的簡單回顧回歸分析的主要目的是探尋因變量與自變量81線性回歸模型的簡單回顧對此普通線性模型做如下假定:(1)獨立性:不同觀測值之間相互獨立的;殘差項同解釋性變量之間是獨立的。(2)常方差:即殘差的方差不依賴于自變量的取值,為一個常數(shù)。(3)正態(tài)性:即殘差項是服從正態(tài)分布的。線性回歸模型的簡單回顧對此普通線性模型做如下假定:82案例介紹背景、目標、變量和分析案例介紹背景、目標、變量和分析83案例背景目前中國的資本市場逐漸成熟,投資于股市成為眾多企業(yè)乃至個人的重要理財方式。因此利用上市公司當年的公開的財務(wù)指標對其來年盈利狀況予以預(yù)測就成為投資人最重要的決策依據(jù)。本案例隨機抽取深市和滬市2002年和2003年各500個樣本,對上市公司的凈資產(chǎn)收益率(returnonequity,ROE)進行預(yù)測。案例背景目前中國的資本市場逐漸成熟,投資于股市成為眾多企業(yè)乃84案例目標與變量目標:盈利預(yù)測因變量:下一年的凈資產(chǎn)收益率(ROE)自變量:當年的財務(wù)信息樣本容量:2002年500;2003年500案例目標與變量目標:盈利預(yù)測85自變量ROEt:當年凈資產(chǎn)收益率ATO:資產(chǎn)周轉(zhuǎn)率(assetturnoverratio)LEV:債務(wù)資本比率(debttoassetratio)
反映公司基本債務(wù)狀況PB:市倍率(pricetobookratio)
反映公司預(yù)期未來成長率ARR:應(yīng)收賬款/主營業(yè)務(wù)收入(accountreceivableovertotalincome)
反映公司的收入質(zhì)量自變量ROEt:當年凈資產(chǎn)收益率86對模型的進一步分析哪個自變量在預(yù)測方面最有用?哪個自變量是最重要的?如何使用模型進行預(yù)測?對模型的進一步分析哪個自變量在預(yù)測方面最有用?87描述分析獲得對數(shù)據(jù)的整體性認識描述分析獲得對數(shù)據(jù)的整體性認識88數(shù)據(jù)讀取(1)使用函數(shù)read.table()創(chuàng)建數(shù)據(jù)框>rm(list=ls())#清理當前工作空間a<-read.table("D:\\暑期建模\\CH1\\roe.txt",header=T)(2)使用函數(shù)scan()比read.table()更靈活,并且可以指定變量的類型數(shù)據(jù)讀取(1)使用函數(shù)read.table()創(chuàng)建數(shù)據(jù)框89Excel數(shù)據(jù)讀取(1)利用剪切板:打開Excel電子表格,選中需要數(shù)據(jù),復(fù)制到剪切板。然后鍵入命令>a<-read.delim("clipboard")(2)使用程序包RODBC>library(RODBC)b<-odbcConnectExcel("d:/暑期建模/CH1/roe.xls")a<-sqlFetch(b,"roe")Excel數(shù)據(jù)讀取(1)利用剪切板:打開Excel電子表格,90數(shù)據(jù)保存>save(a,file="a.RData")load("d:\\我的文檔\\a.RData")#調(diào)用以保存數(shù)據(jù)write.table(a,"a.txt")#保存為文本文檔write.csv(a,"a.csv")a1=a[a$year==2002,-1]save(a1,file="a1.RData")數(shù)據(jù)保存>save(a,file="a.RData")91顯示數(shù)據(jù)顯示數(shù)據(jù)92變量的概括性度量a1=a[a$year==2002,-1]#從a中選出year為2002的數(shù)據(jù),并刪除第1列,然后賦值給a1Mean=sapply(a1,mean)#計算a1中各列的均值Min=sapply(a1,min)#計算a1中各列的最小值Median=sapply(a1,median)#計算a1中各列的中位數(shù)Max=sapply(a1,max)#計算a1中各列的最大值SD=sapply(a1,sd)#計算a1中各列的標準差cbind(Mean,Min,Median,Max,SD)#將均值、最小值、中位數(shù)、最大值、標準差集中在一起展示變量的概括性度量a1=a[a$year==2002,-1]93試驗結(jié)果試驗結(jié)果94變量間的相關(guān)性散點圖是一種最簡單的相關(guān)分析工具通過函數(shù)pairs()觀察各個變量間的相關(guān)性命令:>pairs(a,panel=panel.smooth)隨機變量樣本的相關(guān)系數(shù)>round(cor(a),3)相關(guān)性檢驗,使用函數(shù)cor.test()變量間的相關(guān)性散點圖是一種最簡單的相關(guān)分析工具95《R語言與回歸分析》課件分析96應(yīng)用R語言命令:plot(a1$ROEt,a1$ROE)繪制散點圖,可以看出ROEt與ROE的相關(guān)性應(yīng)用R語言命令:plot(a1$ROEt,a1$ROE)97模型的建立模型、假設(shè)和參數(shù)估計模型的建立模型、假設(shè)和參數(shù)估計98模型形式及假設(shè)線性回歸模型模型假設(shè)(1)獨立性假設(shè)(2)同方差假設(shè)(3)正態(tài)性假設(shè)模型形式及假設(shè)線性回歸模型99參數(shù)估計模型:最小二乘估計量:方差估計量:參數(shù)估計模型:100參數(shù)估計用矩陣形式表示線性模型記為
其中是回歸系數(shù)變量,是因變量向量,是隨機擾動向量,而X為設(shè)計矩陣。當存在時,回歸參數(shù)的最小二乘估計為。參數(shù)估計用矩陣形式表示線性模型記為101參數(shù)估計的R軟件實現(xiàn)R語句:使用函數(shù)lm()>lm1=lm(ROE~ROEt+ATO+PM+LEV+GROWTH+PB+ARR+INV+ASSET,data=a1)summary(lm1)注:我們采用2002年數(shù)據(jù)擬合模型參數(shù)估計的R軟件實現(xiàn)R語句:使用函數(shù)lm()102《R語言與回歸分析》課件分析103擬合優(yōu)度總平方和殘差平方和
計算殘差函數(shù)residuals()R-Square擬合優(yōu)度總平方和104
顯著性檢驗F檢驗、T檢驗顯著性檢驗F檢驗、T檢驗105F檢驗假設(shè)檢驗統(tǒng)計量拒絕域F檢驗假設(shè)106T檢驗假設(shè)檢驗統(tǒng)計量拒絕域T檢驗假設(shè)107《R語言與回歸分析》課件分析108各個結(jié)果的含義第一列:參數(shù)的估計值第二列:各個參數(shù)估計的標準差第三列:通過樣本計算得T檢驗統(tǒng)計量的值第四列:通過T檢驗計算的p值Residualstandarderror(殘差標準誤)R-squared(判別系數(shù))各個結(jié)果的含義第一列:參數(shù)的估計值109顯著性檢驗的結(jié)論從F檢驗的結(jié)果看,模型的線性關(guān)系是顯著的。從T檢驗的結(jié)果看,ROEt和LEV兩個變量通過了檢驗,GROWTH變量在顯著性水平降至0.1時也可以通過檢驗,因此這三個變量與因變量的線性關(guān)系較為顯著。注意,這不說明應(yīng)該刪除其它變量!顯著性檢驗的結(jié)論從F檢驗的結(jié)果看,模型的線性關(guān)系是顯著的。110模型的診斷異方差性、非正態(tài)性、異常值模型的診斷異方差性、非正態(tài)性、異常值111同方差性檢驗正常的殘差圖同方差性檢驗正常的殘差圖112同方差性檢驗觀測值不獨立同方差性檢驗觀測值不獨立113同方差性檢驗方差齊性不成立(即方差相等假設(shè)不成立)同方差性檢驗方差齊性不成立(即方差相等假設(shè)不成立)114同方差性檢驗應(yīng)改為曲線同方差性檢驗應(yīng)改為曲線115正態(tài)性檢驗若,并且則有正態(tài)性檢驗若116正態(tài)性檢驗進一步,可得到以及所以在正態(tài)性假設(shè)下,殘差與應(yīng)該成線性關(guān)系。正態(tài)性檢驗進一步,可得到117正態(tài)性檢驗Q-Q圖殘差:將殘差排序:Y:X:正態(tài)性檢驗Q-Q圖118《R語言與回歸分析》課件分析119《R語言與回歸分析》課件分析120將上面的方法應(yīng)用于本案例目標1:檢驗?zāi)P褪欠穹先齻€假設(shè)目標2:找出異常值R語句:
par(mfrow=c(2,2)) #設(shè)置畫圖為2x2的格式plot(lm1,which=c(1:4))#畫出lm1中對應(yīng)于模型檢驗的4張圖,包括殘差圖、QQ圖和Cook距離圖檢驗發(fā)現(xiàn)47號數(shù)據(jù)為異常值,需要將其消除
語句:a1=a1(-47)將上面的方法應(yīng)用于本案例目標1:檢驗?zāi)P褪欠穹先齻€假設(shè)121應(yīng)用上述方
溫馨提示
- 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
- 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
- 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
- 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負責。
- 6. 下載文件中如有侵權(quán)或不適當內(nèi)容,請與我們聯(lián)系,我們立即糾正。
- 7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。
最新文檔
- 第12課《詞四首:破陣子為陳同甫賦壯詞以寄之》教學(xué)設(shè)計 2023-2024學(xué)年統(tǒng)編版語文九年級下冊
- 9正確認識廣告 教學(xué)設(shè)計-2024-2025學(xué)年道德與法治四年級上冊統(tǒng)編版
- 小學(xué)五年級機器人編程課 6.《投石機》教學(xué)設(shè)計
- 不含括號的三步計算式題(教學(xué)設(shè)計)-2024-2025學(xué)年四年級上冊數(shù)學(xué)蘇教版
- 全國閩教版初中信息技術(shù)八年級上冊第二單元活動八《體驗順序、分支結(jié)構(gòu)程序設(shè)計》教學(xué)設(shè)計
- Module 1 Unit 1 Do you use chopsticks in the UK (教學(xué)設(shè)計)-2024-2025學(xué)年外研版(一起)英語三年級上冊
- 全國山西經(jīng)濟版小學(xué)信息技術(shù)第一冊第三單元活動2《小蘑菇》教學(xué)設(shè)計
- Unit7 Days of the Week(教學(xué)設(shè)計)-2023-2024學(xué)年北師大版(三起)英語五年級下冊
- 河南水利管理業(yè)市場前景及投資研究報告
- 稀土節(jié)能燈粉項目可行性研究報告
- 血透患者的健康宣教課件
- 醫(yī)院輿情應(yīng)對處置預(yù)案
- 方法驗證報告方案
- 關(guān)于企業(yè)高層管理人員職責的通知
- 電除顫并發(fā)癥的處理及預(yù)防
- 2024年中國華電集團招聘筆試參考題庫含答案解析
- (新湘科版)六年級下冊科學(xué)知識點
- 磁共振成像(MRI)基本知識及臨床應(yīng)用
- 商業(yè)銀行不良資產(chǎn)處置方式匯總課件
- 注塑生產(chǎn)過程控制流程
- 三相分離器操作手冊
評論
0/150
提交評論