




版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進(jìn)行舉報或認(rèn)領(lǐng)
文檔簡介
1、數(shù)學(xué)與生物數(shù)學(xué)教研室 蔡昌啟 回歸分析回歸分析 在許多科研問題中在許多科研問題中, ,經(jīng)常遇到一些同處經(jīng)常遇到一些同處于一個統(tǒng)一體中的變量于一個統(tǒng)一體中的變量, ,這些變量之間往往這些變量之間往往是相互依賴和相互制約的是相互依賴和相互制約的, ,根據(jù)實際問題的根據(jù)實際問題的要求要求, ,我們往往需要找出描述這些變量之間我們往往需要找出描述這些變量之間依存關(guān)系的數(shù)學(xué)表達(dá)式依存關(guān)系的數(shù)學(xué)表達(dá)式( (數(shù)學(xué)模型數(shù)學(xué)模型).). ( r e g r e s s i o n analysis)一、什么是回歸分析變量之間的相互關(guān)系大致可分為兩類變量之間的相互關(guān)系大致可分為兩類:(1)(1)確定關(guān)系確定關(guān)系-
2、函數(shù)關(guān)系函數(shù)關(guān)系. .(2)(2)不確定關(guān)系不確定關(guān)系-相關(guān)關(guān)系相關(guān)關(guān)系. . 在許多實際問題中在許多實際問題中 , ,由于生產(chǎn)或由于生產(chǎn)或試驗過程不可避免存在著誤差的影響試驗過程不可避免存在著誤差的影響, ,使得變量之間的關(guān)系具有某種程度的不使得變量之間的關(guān)系具有某種程度的不確定性確定性, ,并且不能用函數(shù)表示并且不能用函數(shù)表示, ,這些變量這些變量其實是隨機(jī)變量或至少其中有一個是隨其實是隨機(jī)變量或至少其中有一個是隨機(jī)變量機(jī)變量. . 為確定隨機(jī)變量與隨機(jī)變量為確定隨機(jī)變量與隨機(jī)變量(或非隨或非隨機(jī)變量機(jī)變量 ) 之間的相依關(guān)系之間的相依關(guān)系,需采用統(tǒng)計分需采用統(tǒng)計分析方法總結(jié)出隱藏在隨機(jī)性
3、后面的統(tǒng)計析方法總結(jié)出隱藏在隨機(jī)性后面的統(tǒng)計規(guī)律性規(guī)律性(統(tǒng)計模型統(tǒng)計模型).這類統(tǒng)計規(guī)律稱為回這類統(tǒng)計規(guī)律稱為回歸關(guān)系歸關(guān)系. 有關(guān)回歸關(guān)系的計算方法和理論統(tǒng)有關(guān)回歸關(guān)系的計算方法和理論統(tǒng)稱回歸分析稱回歸分析(regeression analysis). 回歸分析的目的是尋求一個隨機(jī)變回歸分析的目的是尋求一個隨機(jī)變量量Y(因變量因變量)對一組隨機(jī)變量對一組隨機(jī)變量X1, X2,Xp(自變量自變量 )的統(tǒng)計依賴關(guān)系的統(tǒng)計依賴關(guān)系.二、回歸分析的目的二、回歸分析的目的 一般來說一般來說, ,可通過直觀的方法可通過直觀的方法( (如如散點圖散點圖) )進(jìn)行粗略判斷進(jìn)行粗略判斷. .如只有一個自如只
4、有一個自變量變量, ,則稱為一元回歸分析則稱為一元回歸分析; ;如自變量如自變量個數(shù)多于一個個數(shù)多于一個 , ,則稱為多元回歸分析則稱為多元回歸分析. .三、變量的確定及要求三、變量的確定及要求 將一個需要預(yù)測的變量作為因?qū)⒁粋€需要預(yù)測的變量作為因變量變量 ,它的取值是可觀測的但不可控它的取值是可觀測的但不可控制的制的 ;將被認(rèn)為對因變量的取值具有將被認(rèn)為對因變量的取值具有顯著影響的哪些變量作為自變量顯著影響的哪些變量作為自變量. 通常情況下通常情況下,自變量的取值能得以自變量的取值能得以控制控制,稱為可控變量稱為可控變量. 例如,我們希望通過一些易測的指例如,我們希望通過一些易測的指標(biāo)去預(yù)測
5、正常兒童的心象面積標(biāo)去預(yù)測正常兒童的心象面積 , 由于心由于心象面積是一個不易檢測的指標(biāo),是一個象面積是一個不易檢測的指標(biāo),是一個需要預(yù)測的變量需要預(yù)測的變量,根據(jù)專業(yè)知識根據(jù)專業(yè)知識 ,認(rèn)為,認(rèn)為性別、年齡、身高、體重、胸圍可能對性別、年齡、身高、體重、胸圍可能對心象面積都有影響。心象面積都有影響。因變量因變量Y)-心象面積心象面積; 自變量-性別(X1)、年齡(X2 )、身高(X3 )、體重(X4 )、胸圍(X5)。 四、回歸分析的基本原理四、回歸分析的基本原理 回歸分析的實質(zhì)是根據(jù)隱含統(tǒng)計規(guī)回歸分析的實質(zhì)是根據(jù)隱含統(tǒng)計規(guī)律性的觀測值律性的觀測值, ,求出因變量對自變量的求出因變量對自變量
6、的具體表達(dá)式具體表達(dá)式 y = f ( x1,x2,xp ).y = f ( x1,x2,xp ). 一般一般, ,自變量自變量X1,X2,XpX1,X2,Xp是可控是可控變量變量, ,控制它們?nèi)√厥庵悼刂扑鼈內(nèi)√厥庵祒1,x2,xpx1,x2,xp時時, ,對不同個體對不同個體,Y,Y的取值依然不同的取值依然不同( (隨隨機(jī)性機(jī)性),Y),Y依然是隨機(jī)變量依然是隨機(jī)變量, ,記為記為Y( x1,x2,xp ).Y( x1,x2,xp ). Y Y雖然不能完全確定雖然不能完全確定( (隨機(jī)變量隨機(jī)變量),),但但卻有一個確定的條件分布卻有一個確定的條件分布p(Yx1,x2,xp),p(Yx1,
7、x2,xp),從而有一個確定條從而有一個確定條件均值件均值 E(Yx1,x2,xp),E(Yx1,x2,xp),它是它是x1,x2,xpx1,x2,xp的函數(shù)的函數(shù). . 是否可用是否可用y=E(Yx1,x2,xp)y=E(Yx1,x2,xp)作為作為Y Y對對X1,X2,XpX1,X2,Xp的回歸方程的回歸方程? ? 定義定義1 (1 (均方誤差均方誤差) )設(shè)設(shè)( Y,X1, ( Y,X1, X2,Xp )X2,Xp )具有聯(lián)合分布且二階矩存具有聯(lián)合分布且二階矩存在在,f(X1,X2,Xp),f(X1,X2,Xp)是隨機(jī)變量是隨機(jī)變量X1,X2,XpX1,X2,Xp的函數(shù)的函數(shù), ,則稱則
8、稱EY- f (X1,X2,Xp)2為f( X1 , X2 , , Xp )對Y的均方誤差(mean square error). 均方誤差從平均意義上反映了均方誤差從平均意義上反映了函數(shù)函數(shù)f(X1,X2,Xp )f(X1,X2,Xp )與隨機(jī)變量與隨機(jī)變量Y Y之之間差別的大小間差別的大小 , ,它可作為回歸函數(shù)好它可作為回歸函數(shù)好壞的判斷標(biāo)準(zhǔn)壞的判斷標(biāo)準(zhǔn) . .如果某個函數(shù)與如果某個函數(shù)與Y Y的的均方誤差最小均方誤差最小, ,我們有理由認(rèn)為在均我們有理由認(rèn)為在均方誤差最小標(biāo)準(zhǔn)下將它作為回歸函數(shù)方誤差最小標(biāo)準(zhǔn)下將它作為回歸函數(shù)進(jìn)行預(yù)報是最好的進(jìn)行預(yù)報是最好的. .EY-f(X1,X2,X
9、p)2 定義定義2 2 在定義在定義1 1的條件下的條件下 , , 函數(shù)函數(shù)E(YX1,X2,Xp)E(YX1,X2,Xp)是所有是所有X1,X2,XpX1,X2,Xp的函數(shù)中均方誤差最小的函數(shù)中均方誤差最小的函數(shù)的函數(shù), ,即對任意給定的函數(shù)即對任意給定的函數(shù)f(X1,X2,Xp),f(X1,X2,Xp),總有總有EY-E(YX1,X2,Xp )2成立成立. . 定義定義2 2揭示用揭示用E(Yx1,x2,xp)E(Yx1,x2,xp)去預(yù)報去預(yù)報Y Y在均方誤差最小標(biāo)準(zhǔn)下是最在均方誤差最小標(biāo)準(zhǔn)下是最好的好的, ,因而因而, ,y = E(Yx1,x2,xp )就是我們尋找的回歸函數(shù)就是我們
10、尋找的回歸函數(shù).在在(Y,X1,X2,Xp )的聯(lián)合分布為多元正態(tài)的聯(lián)合分布為多元正態(tài)分布時分布時, E(Yx1, x2,xp )為為x1,x2,xp的的線性函數(shù)線性函數(shù),此時的回歸函數(shù)為此時的回歸函數(shù)為y=a0+a1x1+a2x2+ap xp我們稱它為多元線性回歸方程我們稱它為多元線性回歸方程.五、多元線性回歸模型五、多元線性回歸模型 設(shè)設(shè)p個自變量個自變量X1 , X2 , , Xp 的的取值為取值為x1 , x2 , , xp 時,隨機(jī)時,隨機(jī)Y變變量滿足量滿足其中其中a0 a0 ,a1a1,a2a2,, ap , ap ,22均為未知常均為未知常數(shù),數(shù), a0 ,a1 , a2 , ,
11、 ap ,a0 ,a1 , a2 , , ap ,稱為稱為“偏回偏回歸系數(shù)歸系數(shù)” ” ;2;2稱為隨機(jī)誤差的方差。稱為隨機(jī)誤差的方差。稱上式為稱上式為p元正態(tài)線性回歸模型元正態(tài)線性回歸模型.), 0(222110NexaxaxaaYpp對對p元線性回歸模型我們要解決如下問題元線性回歸模型我們要解決如下問題: 1.根據(jù)樣本觀測值去估計未知參數(shù)根據(jù)樣本觀測值去估計未知參數(shù)a0 ,a1 , a2 , , ap ,2 , 從而建立從而建立Y與與X1,X2,Xp 間間的關(guān)系式的關(guān)系式(回歸方程回歸方程);2.對回歸方程的回歸效果進(jìn)行統(tǒng)計檢驗對回歸方程的回歸效果進(jìn)行統(tǒng)計檢驗; 3. 檢驗各變量檢驗各變量
12、X1,X2,Xp分別對指標(biāo)分別對指標(biāo)(Y)是否有顯著影響是否有顯著影響.按最小二乘估計的原理估計未知參數(shù). 實 際 問 題實 際 問 題 : 已 知已 知 2 9 例 兒 童 的 血 紅 蛋 白例 兒 童 的 血 紅 蛋 白hemoglo,g與鈣與鈣Ca,g)、鎂)、鎂Mg, g)、)、鐵鐵Fe, g)、錳)、錳(Mn,g)、銅、銅(Cu,g)的含量如的含量如表表,試建立一個鈣、鎂、鐵、錳、銅預(yù)測血紅蛋試建立一個鈣、鎂、鐵、錳、銅預(yù)測血紅蛋白的數(shù)學(xué)模型。白的數(shù)學(xué)模型。1 54.89 30.86 448.70 .012 1.010 13.50 2 72.49 42.61 467.30 .008
13、1.640 13.00 3 53.81 52.86 425.61 .004 1.220 13.75 編號編號 鈣鈣 鎂鎂 鐵鐵 錳錳 銅銅 血紅蛋白血紅蛋白29 47.31 28.55 294.70 .005 .838 7.00多元線性回歸數(shù)學(xué)模型多元線性回歸數(shù)學(xué)模型 1. 單擊單擊 “開場開場” “程序程序” SPSS for windows SPSS10.0 for windows type in data OK 單擊單擊 “ Variable View ” ( 在第在第一列輸入鈣一列輸入鈣 、鎂、鎂 、鐵、鐵 、錳、錳 、銅、銅 、血紅蛋、血紅蛋白白 ;單擊;單擊 “ Data View
14、”。SPSS軟件的實現(xiàn)與結(jié)果分析軟件的實現(xiàn)與結(jié)果分析2. SPSS輸入數(shù)據(jù)格式輸入數(shù)據(jù)格式: 29行行6列列2. 程序選項程序選項 Analyze Regression Linear 引入回歸分析的因變量引入回歸分析的因變量: : 引入回歸分析的自變量引入回歸分析的自變量 : :血紅蛋白血紅蛋白 .鈣、鎂、鐵、錳、銅鈣、鎂、鐵、錳、銅 .在多元回歸方法在多元回歸方法Method中選:強(qiáng)迫引入法中選:強(qiáng)迫引入法Enter)單擊單擊 Statistics ; 選項如下圖選項如下圖 ;單擊單擊 Continue Plots 點擊點擊 Plots 獲得分析資料的正態(tài)性檢驗圖形。獲得分析資料的正態(tài)性檢驗
15、圖形。單擊單擊 Continue OK 。2. 2. 方差分析表方差分析表1. 1. 模型摘要模型摘要主要結(jié)果主要結(jié)果M Mo od de el l S Su um mm ma ar ry yb b.900a.810.768Model1RR SquareAdjusted RSquarePredictors: (Constant), 銅(CU), 鐵(FE), 錳(MN), 鈣(CA), 鎂(MG)a. Dependent Variable: 血紅蛋白b. A AN NO OV VA Ab b107.721521.54419.552.000a25.343231.102133.06428Regre
16、ssionResidualTotalModel1Sum ofSquaresdfMean SquareFSig.Predictors: (Constant), 銅(CU), 鐵(FE), 錳(MN), 鈣(CA), 鎂(MG)a. Dependent Variable: 血紅蛋白b. C Co oe ef ff fi ic ci ie en nt ts sa a1.3801.550.890.383-6.93E-02.028-.304-2.500.0202.823E-02.053.079.533.5992.794E-02.004.8216.730.000-16.57216.415-.106-1.0
17、10.3231.7151.143.2051.501.147(Constant)鈣(CA)鎂(MG)鐵(FE)錳(MN)銅(CU)Model1BStd. ErrorUnstandardizedCoefficientsBetaStandardizedCoefficientstSig.Dependent Variable: 血紅蛋白a. 3. 3. 回歸系數(shù)表回歸系數(shù)表 結(jié)論結(jié)論: 回歸效果檢驗對應(yīng)的統(tǒng)計量回歸效果檢驗對應(yīng)的統(tǒng)計量 F = 19.552 , P .000 ,認(rèn)為利用鈣、鎂、鐵、錳、銅預(yù)測血紅蛋白有認(rèn)為利用鈣、鎂、鐵、錳、銅預(yù)測血紅蛋白有實際意義。實際意義。預(yù)測血紅蛋白的數(shù)學(xué)模型預(yù)測血
18、紅蛋白的數(shù)學(xué)模型: :54321715. 1578.16028. 0028. 0069. 038. 1XXXXXYR2=0.810, 較大較大, 認(rèn)為回歸方程有意義認(rèn)為回歸方程有意義.V Va ar ri ia ab bl le es s E En nt te er re ed d/ /R Re em mo ov ve ed db b銅, 鐵, 錳,鈣, 鎂a.EnterModel1VariablesEnteredVariablesRemovedMethodAll requested variables entered.a. Dependent Variable: 血紅蛋白b. 從偏回歸回歸系
溫馨提示
- 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
- 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
- 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
- 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負(fù)責(zé)。
- 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請與我們聯(lián)系,我們立即糾正。
- 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時也不承擔(dān)用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。
最新文檔
- 2025年湖北社工面試試題及答案
- 文化創(chuàng)意產(chǎn)品定制企業(yè)制定與實施新質(zhì)生產(chǎn)力戰(zhàn)略研究報告
- 生物藥品智能分析行業(yè)深度調(diào)研及發(fā)展戰(zhàn)略咨詢報告
- 華北土石山區(qū)側(cè)柏人工林NPP變化特征及影響因子研究
- 石家莊小燕子家居建材有限公司年橡膠顆粒生產(chǎn)項目(噪聲、固體廢物)竣工環(huán)境保護(hù)驗收報告
- 中國空心杯電機(jī)行業(yè)市場規(guī)模、產(chǎn)業(yè)鏈全景及市場競爭格局分析報告(智研咨詢發(fā)布)
- 2025年全熱風(fēng)載流焊機(jī)項目合作計劃書
- 眼鏡專門零售企業(yè)數(shù)字化轉(zhuǎn)型與智慧升級戰(zhàn)略研究報告
- 果膠酸酯企業(yè)ESG實踐與創(chuàng)新戰(zhàn)略研究報告
- 牙雕工藝品批發(fā)企業(yè)數(shù)字化轉(zhuǎn)型與智慧升級戰(zhàn)略研究報告
- 7.2.3 平行線的性質(zhì)與判定的綜合運用(專題:巧解平行線中的拐點問題)課件-2024-2025學(xué)年新教材七年級下冊數(shù)學(xué)
- 二零二五年度聘用級建造師施工技術(shù)指導(dǎo)聘用協(xié)議
- 2025年江蘇農(nóng)牧科技職業(yè)學(xué)院單招職業(yè)傾向性測試題庫帶答案
- 《DeepSeek入門寶典》第4冊·個人使用篇
- 水渠模板工程專項施工方案
- 2025年蘇州農(nóng)業(yè)職業(yè)技術(shù)學(xué)院高職單招高職單招英語2016-2024歷年頻考點試題含答案解析
- 加油站的流程優(yōu)化
- 關(guān)于美國地理知識的講課
- 浙江2024年浙江省有色金屬地質(zhì)勘查院選調(diào)專業(yè)技術(shù)人員筆試歷年典型考點(頻考版試卷)附帶答案詳解
- 投資銀行學(xué)第4版- 課件匯 馬曉軍 第5-9章 債券的發(fā)行和承銷-投資銀行的監(jiān)管
- 語文-江蘇省南通市、泰州市、鎮(zhèn)江市、鹽城市(部分學(xué)校)2025屆高三第一次調(diào)研測試(南通一模)試題和答案
評論
0/150
提交評論