數(shù)據(jù)分析習(xí)題題答案_第1頁
數(shù)據(jù)分析習(xí)題題答案_第2頁
數(shù)據(jù)分析習(xí)題題答案_第3頁
數(shù)據(jù)分析習(xí)題題答案_第4頁
數(shù)據(jù)分析習(xí)題題答案_第5頁
已閱讀5頁,還剩2頁未讀 繼續(xù)免費閱讀

下載本文檔

版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進行舉報或認(rèn)領(lǐng)

文檔簡介

第2章習(xí)題一、習(xí)題(1)回歸模型yxxi,1,2,15i01i12i2i調(diào)用procreg過程,得到參數(shù)估計的相關(guān)結(jié)果:ParameterEstimatesParameterStandardVariableDFEstimateErrort?ValuePr?>?|t|Intercept1x1x211<.0001<.0001由此輸出得到的回歸方程為:y由最后一列可以看出,使用化妝品的人數(shù)X1和月收入X2對化妝品的XX3.452610.496000.0092012銷售數(shù)量有著顯著影響。3.46521可以理解為該化妝品作為一種0必需品每個月的銷售量。當(dāng)購買該化妝品的人數(shù)固定時,月收入沒增加一個一個單位,改化妝品的銷售數(shù)量將增加個單位。同理,當(dāng)購買該化妝品的人均月收入固定時,購買該化妝品的人數(shù)每增加一千人,該化妝品的銷售數(shù)量將增加個單位。SSEnp2是2的無偏估計,所以2的估計值是.(2)調(diào)用procreg過程,得到方差分析表:AnalysisofVarianceSum?ofMeanSourceModelErrorDFSquaresSquareFValuePr?>?F35384517948<.000111CorrectedTotal1453902由此可到線性回歸關(guān)系顯著性檢驗:H:0H至少有一個為00121:1,2SSR/(p1)MSRSSE/(np)MSE5679.47,檢驗的p值的觀測值F0的統(tǒng)計量Fpp(FF)0.00010H00SSR5384553902另外,描述了由自由變量的線性關(guān)系函0.9989R2R2SST數(shù)值所能反映的Y的總變化量的比例。越大,表明線性關(guān)系越明顯。R2這些結(jié)果均表明Y與X1,X2之間的回歸關(guān)系高度顯著。(12)2.17881,利用參數(shù)估計值得(3)若置信水平,由t0.9750.05到的置信區(qū)間分別為:,0,12,即)對3.452162.17812.430653.45165.2942(1.8426,8.7458)0,:0.496002.17810.006050.496000.01318,即對1(0.48282,0.50198):0.009202.17810.00096810.009200.0021,即2(0.0071,0.00113)(4)首先檢驗X1對Y是否有顯著性影:yxi,1,2,15假設(shè)其約簡模型為:i02i2i由觀測數(shù)據(jù)并利用procreg過程擬合此模型求得:SSE(R)484.88137SSE(F)56.88357f15213Rf15312R[SSE(R)SSE(F)](ff)求得檢驗統(tǒng)計量的值為:由FRFSSE(F)/fF484.8813756.88357F090.356.88357/12pp(FF)P(F(1,13)F)0.050H000由此拒絕原假設(shè),所以x2對Y有顯著影響。同理檢驗X2對Y是否有顯著性影:yxi,1,2,15假設(shè)其約簡模型為:i01i1i由觀測數(shù)據(jù)并利用procreg過程擬合此模型求得:SSE(R)31872f15213RSSE(F)56.88357f15312R[SSE(R)SSE(F)](ff)求得檢驗統(tǒng)計量的值為:由FRFSSE(F)/fF3187256.88357F56.88357/12pp(FF)P(F(1,13)F)0.0500H000由此拒絕原假設(shè),所以x2對Y有顯著影響。檢驗X1、x2交叉項對Y是否有顯著性影:yxxxxi,1,2,15假設(shè)其全模型為:i01i12i23i1i2iH檢驗X1、X2的交互作用是否顯著即檢驗假設(shè)0是否能被拒:03絕。由觀測數(shù)據(jù)并利用procreg過程擬合此模型求得:SSE(F)56.72f15411FSSE(R)56.88357[SSE(R)SSE(F)](ff15312Rf)求得檢驗統(tǒng)計量的值為:由FRFSSE(F)/fF56.8835756.72F0.031756.72/11)((1,11)0.0317)0.1380.05pp(FFPF00H00由此接受原假設(shè),也即X1*X2對Y無顯著影響,即模型中沒有必要引進交叉項。(5)關(guān)于Y的預(yù)測:對于給定的X1,X2的值(220,2500),由回歸方程可以得到y(tǒng)0的預(yù)測值:y3.452610.496002200.009202500135.5730為了得到y(tǒng)0的95%的置信區(qū)間,我們需要知道(XX)1:TX'XInverse,ParameterEstimates,andSSEVariableInterceptx1x2yInterceptx1x2y,MSE4.74030,求得y的置信度為95%的置信區(qū)間由x(1,220,2500)T0為:yt(12)MSE[1xT(XTX)x]10.97500135.57262.17882.2818135.57264.9716即(130.6010,140.5442)(6)利用procreg過程可根據(jù)要求輸出學(xué)生化殘差:Obsypredictresidstudenth116221203223413156761697818192911610551125212232131441410315212利用學(xué)生化殘差,檢驗?zāi)P驼`差項的正態(tài)性假定的合理性:1頻率檢驗法:○學(xué)生化殘差中有10/15=(約)落在(-1,1)內(nèi);有13/15=(約)落在(,)內(nèi);有15/15=1(約)落在(-2,2)內(nèi)。由此可見,學(xué)生化殘差在上述各區(qū)間內(nèi)的頻率與N(0,1)分布的相應(yīng)概率相差均不大,因此模型誤差項的正態(tài)性假定是合理的。②正態(tài)QQ圖利用proccapability直接作出學(xué)生化殘差的正態(tài)QQ圖,如下所示:從圖像可以看出,散點明顯分布在一條直線上,則進一步說明學(xué)生化殘差來自正態(tài)總體分布。rq通過sas計算得到(,)iiObsRQ123456789101112131415再利用proccorr得到學(xué)生化殘差與相應(yīng)標(biāo)準(zhǔn)正態(tài)分布的分位數(shù)的pearson相關(guān)系數(shù)矩陣。可以看出學(xué)生化殘差與相應(yīng)標(biāo)準(zhǔn)正態(tài)分布的分位數(shù)的相關(guān)系數(shù)為<,所以學(xué)生化殘差與相應(yīng)標(biāo)準(zhǔn)正態(tài)分布的分位數(shù)顯著相關(guān)。Pearson?相關(guān)系數(shù),?N?=?15當(dāng)?H0:?Rho=0?時,Prob?>?|r|RQRQ<.0001<.0001為了進一步驗證模型假設(shè)的合理性,利用procgplot的做出的幾個殘差圖:由這些殘差圖可知,它們均沒有明顯的趨勢,結(jié)合以上分析的結(jié)果我們認(rèn)為相應(yīng)的線性回歸模型以及誤差的獨立正態(tài)分布的假設(shè)是合理的。二、習(xí)題回歸模型yxx,i1,2,15i01i12i2i調(diào)用procreg過程,得到參數(shù)估計的相關(guān)結(jié)果:ParameterEstimatesParameterStandardt?ValuPr?>?|VariableDFEstimateErroret|Intercept1<.0001x1x211<.0001調(diào)用procreg過程,得到方差分析表:AnalysisofVarianceSum?ofMeanPr?>?SourceModelErrorDFSquaresSquareFValueF22830<.0001CorrectedTotal根據(jù)上述回歸模型,畫出學(xué)生化殘差正態(tài)QQ圖以及Y的擬合值的殘差圖如下所示:從圖中可以看出,學(xué)生化殘差圖明顯不在同一條直線上,求得學(xué)生化殘差與相應(yīng)標(biāo)準(zhǔn)正態(tài)分布的分位數(shù)的相關(guān)系數(shù)為<,與1相差較大。另外擬合值的圖像也表明Y與X1和X2不能滿足線性關(guān)系。(2)對因變量Y做Box-Cox變換,對不同的值,利用sas系統(tǒng)中SSEZ(,)SSEZ(,)的prociml過程計算的值,給出隨變化的曲線:SSEZ由圖可知(,)在0.31時取得最小值,因此Box-Cox變換中取,記變換后的因變量為YY,對擬合后的變量重新做線性回歸,得到以下結(jié)果:從圖中可以看出,無論是學(xué)生化殘差的正態(tài)QQ圖還是變換后因變量YY的擬合值都有明顯的改觀。而且求得學(xué)生化殘差與相應(yīng)標(biāo)準(zhǔn)正態(tài)分布的分位數(shù)的相關(guān)系數(shù)達到了,并且檢驗p值小于差分析,認(rèn)為YY與XX1、XX2之間的線性關(guān)系較為合理。擬合YY與X1、X2的線性回歸模型,其方差分析以及參數(shù)計估如下所示。YY2.848300.4194010.04052XXAnalysisofVarianceSum?

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負責(zé)。
  • 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時也不承擔(dān)用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

最新文檔

評論

0/150

提交評論