版權說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權,請進行舉報或認領
文檔簡介
1、相關回歸分析案例一 質(zhì)量控制中的簡單線性回歸分析1、問題的提出某石油煉廠的催化裝置通過高溫及催化劑對原料的作用進行反應,生成各種產(chǎn)品,其中液化氣用途廣泛、易于儲存運輸,所以,提高液化氣收率,降低不凝氣體產(chǎn)量,成為提高經(jīng)濟效益的關鍵問題。量,通過因果分析圖和排列圖的觀察,發(fā)現(xiàn)回流溫度是影響液化氣收率的主要原因,因此,只有確定二者之間的相關關系,尋找適當?shù)幕亓鳒囟?,才能達到提高液化氣收率的目的。經(jīng)認真分析仔細研究,確定了在保持原有輕油收率的前提下,液化氣收率比去年同期增長1個百分點的目標,即達到12.24%的液化氣收率。2、數(shù)據(jù)的收集序號回流溫度(C)液化氣收率(%)序號回流溫度(C)液化氣收率(
2、%)13613.1164212.323912.8174311.934311.3184610.944311.4194410.453912.3204211.563812.5214112.574311.1224511.184410.8234011.193713.1244611.1104011.9254710.8113413.6264510.5123912.2273812.1134012.2283912.5144111.8294411.5154411.1304510.9目標值確定之后,我們收集了某年某季度的回流溫度與液化氣收率的30組數(shù)據(jù)(如上表),進行簡單直線回歸分析。3. 方法的確立設線性回歸模型
3、為y = Po + Pix + »估計回歸方程為? = bo+bix將數(shù)據(jù)輸入計算機,輸出散點圖可見,液化氣收率y具有隨著回流溫度x的提高而降低的趨勢。因此,建立描述y與x之間關系的模型時,首選直線型是合理的。1S151413121110330 035404550從線性回歸的計算結(jié)果,可以知道回歸系數(shù)的最小二乘估計值bo=21.263和bi=-0.229,于是最小二乘直線為y =21.263 -0.229X這就表明,回流溫度每增加C,估計液化氣收率將減少0.229%。16151413121110g0*035404550(3)殘差分析為了判別簡單線性模型的假定是否有效,作出殘差圖,進行
4、殘差分析。0.5-0. 53540-1-1,5從圖中可以看到,殘差基本在-0.5+0.5左右,說明建立回歸模型所依賴的 假定是恰當?shù)?。誤差項的估計值 s=0.388 。(4)回歸模型檢驗 a.顯著性檢驗在90%的顯著水平下,進行t檢驗,拒絕域為I t I = I bi/ sbi I >t 0/2=1.7011 o由輸出數(shù)據(jù)可以找到 bi和Sbi , t=bi/ Sbi=-0.229/0.022=-10.313,于是拒絕原假設,說明液化氣收率與回流溫度之間存在線性關系。b.擬合度檢驗判定系數(shù)r2=0.792。這意味著液化氣收率的樣本變差大約有80%可以由它與回流溫度的線性關系來解釋。r =
5、 Vr2 =-0.89這樣,r值為y與x之間存在中高度的負線性關系提供了進一步的證據(jù)。由于n馮0,我們近似確定y的90%置信區(qū)間為:0±(%Js=21.263-0.229x ±1.282 >0.388 = 21.263-0.229x± 0.497/2161514131211109S4045504、結(jié)果分析由回歸直線圖可知,要保持液化氣收率在 12.24%以上,回流溫度必須控制在34 C以下。因為裝置工藝卡片要求回流溫度在 3340 C之間,為確保液化氣質(zhì)量合格,可以將回流溫度控制在 3334 C之間。為此,應當采取各項有效措施,改善外部操作環(huán)境,將液化氣收率
6、控制在目標值范圍內(nèi)。案例二:轎車生產(chǎn)與GDP等關系研究中國的轎車生產(chǎn)是否與 GDP、城鎮(zhèn)居民人均可支配收入、城鎮(zhèn)居民家庭恩格爾系數(shù)、私人載客汽車擁有量、公路里程等都有密切關系?如果有關系, 它們之間是種什么關系?關系強度如何?(數(shù)據(jù)見中國統(tǒng)計年鑒)(1) 分析轎車生產(chǎn)量與私人載客汽車擁有量之間的關系:首先,求的因變量轎車生產(chǎn)量y和自變量私人載客汽車擁有量x1的相關系數(shù) r=0.992018,說明兩者間存在一定的線性相關關系且正相關程度很強。3E1yxlJo. 9920181然后以轎車生產(chǎn)量為因變量y,私人載客汽車擁有量x1為自變量進行一元線性 回歸分析,結(jié)果如下:SUWMWiY OUTPUTM
7、ultiple R Square Adjusted 標準誤差 觀測值0.9920180.9841010. 92304114.3861617dfssISF回歸分析1192150.3殘差153104. 422總計16195254*8192150. 3206. 9&15928. 4352904Coefficient標準誤差t StatP ralucIntercept 1.775687 4.676408 0,37971210., 7094815431xl0.206783 0.00678630. 470246. 60805E-15由回歸統(tǒng)計中的R=0.984101看出,所建立的回歸模型對樣本觀測
8、值的擬合程度很好;估計出的樣本回歸函數(shù)為:?=1.775687+0.206783 x1,說明私人載客汽車擁有量每增加1萬輛,轎車生產(chǎn)量增加2067.83輛;由上表中a和B?的P值分別是0.709481543和6.60805E-15,顯然a的P值大于顯著性水平a =0.05,不能拒絕原假設a =0,而B?的P值遠小于顯著性水平a=0.05,拒絕原假設P =0,說明私人載客汽車擁有量對轎車生產(chǎn)量有顯著影響。(2) 分析轎車生產(chǎn)量與城鎮(zhèn)居民家庭恩格爾系數(shù)之間的關系:首先,求的因變量轎車生產(chǎn)量y和自變量城鎮(zhèn)居民家庭恩格爾系數(shù)x2的相關系數(shù)r=-0.77499,說明兩者間存在一定的線性相關關系但負相關程
9、度一般。ye2y k21-0.774991然后以轎車生產(chǎn)量為因變量y,城鎮(zhèn)居民家庭恩格爾系數(shù)x2為自變量進行元線性回歸分析,結(jié)果如下:SUMMARY OUTPUTMultiple Q.7749S9 R Square 0.600603 Adjusted 0.573982 標淮誤差72.10323 觀測值17方恙分析NSdfSSItsF mif 譏 回歸分析1 117即1.6 117271.6 22. 55712 0, 00'殘差15 77983.13 5198* 875總計16 195器4. 8Cogfficicn-標準課差 t Stat Ppalue LowerIntercept 66
10、1. 243 120.1556 5. 503221 G. 07E-05 405. x2-12. 692 2. 6723174943 6 000258 -18.,由回歸統(tǒng)計中的R=0.600608看出,所建立的回歸模型對樣本觀測值的擬合程度一般,綜合其相關系數(shù)值可知此二者關系不太符合所建立的線性模型,說明 二者間沒有密切的線性相關關系。(3) 分析轎車生產(chǎn)量與公路里程之間的關系:首先,求的因變量轎車生產(chǎn)量y和自變量公路里程 x3的相關系數(shù)合程度較好;估計出的樣本回歸函數(shù)為:?=-70.7127+0.001829x4,說明GDP每增加1億元,轎車生產(chǎn)量增加18.29輛;r=0.941214,說明兩
11、者間存在一定的線性相關關系且正相關程度較強。yx3y1k30, 9412141然后以轎車生產(chǎn)量為因變量y,公路里程x3為自變量進行一元線性回歸分析,結(jié)果如下:SUMMARY OUTPUTMultiple R Square Adjusted 標準誤差 觀測值0,9412140. 8853830* 87827538. 5416817方差分析dfSSISF tnific1 172972,9 172972. 9 116, 4439 k82£15 2228L91 1485.46116 195254.8Coefficierr 標椎誤差 t Stat P-value LcjwerIntercept
12、 -125.156 22. 58047 -5.54268 5. 64E-05 -17i1,403022 0.130019 10, 79092 L 82E-08 k12E由回歸統(tǒng)計中的R=0.885883看出,所建立的回歸模型對樣本觀測值的擬由上表中a和B?的P值分別是5.64E-05和1.82E-08,顯然a和B?的P值 均遠小于顯著性水平a =0.05 ,拒絕原假設a=0、B=0,但由于P對兩者的影響更為 顯著,所以可以說明公路里程對轎車生產(chǎn)量有顯著影響。(4) 分析轎車生產(chǎn)量與GDP之間的關系:首先,求的因變量轎車生產(chǎn)量 y和自變量GDP x4的相關系數(shù)r=0.939995.說明兩者間存在
13、一定的線性相關關系且正相關程度較強。yx4y1x4CL 9399951然后以轎車生產(chǎn)量為因變量y, GDPX4為自變量進行一元線性回歸分析,結(jié)果如下:SUMMARY OUTPUTMultiple 6 939995R Square Ck 88359Adjusted 0.87583 標準誤差38. 92691方差分析回歸分析 殘差 總計df _ 5S ItsF mi1 172525.2 172525. 2 113. 8552 2.15 22729. 56 1515.30416 195254., 8 Coefficien 標準誤差 t Stat Pralue LqIntercept -70, 712
14、7 18* 30702 *3* 8626丄型°: 葢40 001829 6 000171 16 6口29l Z 11E-0810由回歸統(tǒng)計中的R=0.88359看出,所建立的回歸模型對樣本觀測值的擬由上表中a和B?的P值分別是0.001534和2.11E-08,顯然a和B?的p 值均小于顯著性水平a =0.05 ,拒絕原假設a=0、B=0,但由于P對兩者的影響更為 顯著,所以可以說明GDP對轎車生產(chǎn)量有較顯著影響。(5) 分析轎車生產(chǎn)量與城鎮(zhèn)居民人均可支配收入 x5之間的關系:首先,求的因變量轎車生產(chǎn)量y和自變量城鎮(zhèn)居民人均可支配收入x5的相關系數(shù)r=0.917695,說明兩者間存在
15、一定的線性相關關系且正相關程度較強。yx5y1x50. 9176951然后以轎車生產(chǎn)量為因變量 y,城鎮(zhèn)居民人均可支配收入 x5為自變量進行元線性回歸分析,結(jié)果如下:SUMARY OUTPUTMultiple R Square Adjusted 標準誤差 視測值0. 9176950. 8421640,83164145- 3271917方差分析ss析分歸差計回殘總df ss MS _ F mif1 164436. 5 164436. 5 80. 03511 2.115 3081 乩 31 2054*55416 195254.8ISCocfficicrr 標準誤差 t Stat Pvalue 卜切
16、e-92. 9054 23 875 -3帀匚肓咗6 032928 0 003681 £、946234 2.12E-O7 6 0由回歸統(tǒng)計中的R=0.842164看出,所建立的回歸模型對樣本觀測值的擬由上表中a和B?的P值分別是0.001444和2.12E-07,顯然a和B?的P 值均小于顯著性水平a =0.05 ,拒絕原假設a=0、B=0,但由于P對兩者的影響更為 顯著,所以可以說明城鎮(zhèn)居民人均可支配收入對轎車生產(chǎn)量有顯著影響。案例三:子女身高與父母身高的回歸分析1、問題的提出早在 19 世紀后期,英國生物學家 Galton 通過觀察 1078 個家庭中父親、母 親身高的平均值x和其
17、中一個成年兒子身高y,建立了關于父母身高與子女身高 的線性方程: y=33.73+0.516x從方程可以看出, 子女身高有回歸平均的傾向。 那么, 時隔一百多年后的今 天,人類的物質(zhì)生活和精神生活都已發(fā)生巨大的變化, 父母身高與子女身高之間 將呈現(xiàn)出什么樣的關系呢?在現(xiàn)實生活中, 我們都知道父母身高對子女身高是有影響的, 但父親與母親 的影響分別有多大?他們對兒子和女兒的影響程度是否相同?能否用定量的形 式回答這個問題呢?如果可以利用回歸方法, 進一步揭示父親身高、 母親身高與 子女身高之間量化關系的秘密, 將有助于那些關注自己后代身高的年輕父母們進 行早期預測,同時也可為那些未婚青年男女在選
18、擇理想配偶時提供科學的參考依 據(jù)。2、數(shù)據(jù)的收集為了問題的研究, 我們要求所調(diào)查的家庭滿足下列條件: (1)家庭中有一個 或多個子女( 2)家庭成員身體健康,發(fā)育正常,無先天性和遺傳性疾病,無殘疾(3)子女的年齡均在 23歲(含 23歲)以上??紤]到調(diào)查范圍的廣泛性,我們隨機抽取了機關干部、職員、工人、農(nóng)民、城市居民、軍人、大學生家庭,并 特意選擇了一所全國招生的院校應屆畢業(yè)生, 他們來自于全國各地, 家庭背景相 對復雜,這樣使得樣本更具代表性。在收回的 410 份(發(fā)放 460 份)調(diào)查表中,符合要求的有 290 個家庭,其中,有兒子 405 人,有女兒 270 人。3、方法的確定根據(jù)所收集
19、的數(shù)據(jù),應用二元回歸分析方法, 研究父親身高、 母親身高與兒子或女兒身高的關系。1) 建立回歸方程設 X1 為父親身高,X2 為母親身高, Y 為兒子或女兒身高。則父母身高與子女身高的回歸模型為:Y=刃+ 31X1+ 儀X2+ £根據(jù)樣本數(shù)據(jù)建立估計二元回歸方程:y?=b0+b1x1+b2x22) 顯著性檢驗對回歸方程進行F檢驗,拒絕區(qū)域為F > F a , n-3);對回歸系數(shù)進行t檢驗,拒絕區(qū)域為t> 10(/2(n-3)。3) 預測若某一家庭父親和母親身高分別為 x10 和 x20 ,則子女身高的點估計為:y?=b0+b1x10+b2x20 區(qū)間估計方法已超出大綱要
20、求,在此不要求。4、結(jié)果分析1)父母身高對兒子身高的影響y?=53.640+0.368x1+0.349x2 顯著性檢驗:在a=O.O1 的顯著水平下,F(xiàn)=62.714 > F a (2,400)=4.68t1=7.85 > ta/2(400)=2.689t2=6.71 > ta /2(400)=2.689結(jié)果說明回歸方程顯著, 兩個偏回歸系數(shù)顯著。 因此, 所建立回歸方程是有 意義的,即父母身高與兒子身高有顯著的線性關系。(2)父母身高對女兒身高的影響y?=47.140+0.249x1+0.455x2 顯著性檢驗:在 a=0.01 的顯著水平下,F(xiàn)=46.81> F 2,300)=4.68t1=4.92 > t 2(300)=2.68t2=7.61 > t 2(300)=2.689結(jié)果說明回歸方程顯著,回歸系數(shù)顯著,故所建立回歸方程有效,即女
溫馨提示
- 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權益歸上傳用戶所有。
- 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預覽,若沒有圖紙預覽就沒有圖紙。
- 4. 未經(jīng)權益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
- 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負責。
- 6. 下載文件中如有侵權或不適當內(nèi)容,請與我們聯(lián)系,我們立即糾正。
- 7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。
最新文檔
- 【2021屆備考】2020全國名?;瘜W試題分類解析匯編:H單元-水溶液中的離子平衡
- 四川省綿陽2024-2025學年高二上學期數(shù)學期末模擬試題(六)(含答案)
- 【同步課堂】2020年化學人教版選修5教案:2-2-芳香烴
- 2023年職工醫(yī)保門診報銷新規(guī)定
- 上冊《角的初步認識》課件設計
- 【備考專題】高考語文專題精講與新題賞析-專題-語言基礎和運用2020年新題賞析(下)-課后練習
- 【名師一號】2020-2021學年高中英語選修六-第五單元綜合測評
- 【全程復習方略】2020-2021學年高中數(shù)學(人教A版選修2-1)課時作業(yè)-2.1.1曲線與方程
- 【學練考】2021-2022新高考人民版歷史必修二-專題測評六-羅斯福新政與當代資本主義
- 信管部報告:2023年數(shù)字化轉(zhuǎn)型之路
- 品質(zhì)部規(guī)劃方案
- JGJT157-2014 建筑輕質(zhì)條板隔墻技術規(guī)程
- 2023-2024學年福建省泉州市惠安縣八年級(上)學期期末數(shù)學試題(含解析)
- 喬木移栽、栽植施工技術方案及方法
- 電性測試報告
- 債權債務清收工作方案
- 鼓脹教學查房
- 空調(diào)更換施工方案
- 普通高中思想政治課程標準
- 毛澤東詩詞作品欣賞
- 消化內(nèi)科交班本PDCA
評論
0/150
提交評論