![多元回歸分析k_第1頁](http://file4.renrendoc.com/view/9c46367e2b8e5fcf6a87827dbbd68438/9c46367e2b8e5fcf6a87827dbbd684381.gif)
![多元回歸分析k_第2頁](http://file4.renrendoc.com/view/9c46367e2b8e5fcf6a87827dbbd68438/9c46367e2b8e5fcf6a87827dbbd684382.gif)
![多元回歸分析k_第3頁](http://file4.renrendoc.com/view/9c46367e2b8e5fcf6a87827dbbd68438/9c46367e2b8e5fcf6a87827dbbd684383.gif)
![多元回歸分析k_第4頁](http://file4.renrendoc.com/view/9c46367e2b8e5fcf6a87827dbbd68438/9c46367e2b8e5fcf6a87827dbbd684384.gif)
![多元回歸分析k_第5頁](http://file4.renrendoc.com/view/9c46367e2b8e5fcf6a87827dbbd68438/9c46367e2b8e5fcf6a87827dbbd684385.gif)
版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進(jìn)行舉報或認(rèn)領(lǐng)
文檔簡介
多元回歸分析k第一頁,共四十七頁,編輯于2023年,星期五
在醫(yī)學(xué)中,往往要研究兩個定量變量間的相互關(guān)系。如人體的血壓和脈搏,身高和體重等。統(tǒng)計(jì)學(xué)中的相關(guān)與回歸是研究兩個變量線性關(guān)系的最基本的方法。
一、直線相關(guān)與回歸回顧第二頁,共四十七頁,編輯于2023年,星期五
y
。。。。。。。。
。。
━━┻━━━━┻━━━━┻━━━>X
散點(diǎn)圖第三頁,共四十七頁,編輯于2023年,星期五線性相關(guān)
線性相關(guān)是用相關(guān)系數(shù)r來表示兩個變量X,Y間的直線關(guān)系。相關(guān)系數(shù)r的計(jì)算公式
第四頁,共四十七頁,編輯于2023年,星期五其絕對值愈接近1,兩個變量間的直線相關(guān)愈密切,愈接近0,線性相關(guān)愈不密切。相關(guān)系數(shù)r沒有單位,在-1~+1范圍內(nèi)波動。第五頁,共四十七頁,編輯于2023年,星期五
相關(guān)分析的步驟(1)作散點(diǎn)圖(2)計(jì)算相關(guān)系數(shù)r(3)相關(guān)系數(shù)檢驗(yàn)
第六頁,共四十七頁,編輯于2023年,星期五CHISS的實(shí)現(xiàn)點(diǎn)擊統(tǒng)計(jì)→統(tǒng)計(jì)推斷→相關(guān)矩陣第七頁,共四十七頁,編輯于2023年,星期五例9-1
測得某地10名3歲兒童的體重(kg)與體表面y(103cm2)積,試對該資料進(jìn)行直線相關(guān)分析。第八頁,共四十七頁,編輯于2023年,星期五當(dāng)兩變量間存在著性線關(guān)系時,不僅可以用相關(guān)系數(shù)r表示變量Y與X線性相關(guān)的密切程度,還可以用一個二元一次方程來表示。
直線回歸第九頁,共四十七頁,編輯于2023年,星期五
其中:第十頁,共四十七頁,編輯于2023年,星期五CHISS的實(shí)現(xiàn)點(diǎn)擊多元分析→線性回歸第十一頁,共四十七頁,編輯于2023年,星期五例9-3Wainwright等(1988)在進(jìn)行營養(yǎng)學(xué)實(shí)驗(yàn)前,先對小鼠體重與每窩小鼠只數(shù)間的關(guān)系進(jìn)行了研究。從每窩分別為3只至12只的小鼠中,每個窩別大小隨機(jī)抽取兩窩。在出生后第32天測量不同窩別小鼠的平均體重,結(jié)果見下表。試作回歸分析。第十二頁,共四十七頁,編輯于2023年,星期五回歸方程的應(yīng)用
----預(yù)測與估計(jì)
求出回歸方程后,如果方程擬合度好話,可根據(jù)X的值來求Y預(yù)測值
第十三頁,共四十七頁,編輯于2023年,星期五[典型統(tǒng)計(jì)案例1]
腎臟為不規(guī)則體,怎樣測量?立方體體積規(guī)律:公式:V=長*寬*高=abc
a腎臟體積的測量bc腎臟體積計(jì)算公式:經(jīng)驗(yàn)公式:V=π/4*長*寬*高公式怎樣產(chǎn)生的?第十四頁,共四十七頁,編輯于2023年,星期五腎臟體積測量實(shí)驗(yàn)用20個腎臟標(biāo)本,測量計(jì)錄每個體積及其長,寬,高的數(shù)據(jù):采用什么方法找規(guī)律呢?
回歸方程的構(gòu)造:y=a+b*xV=π/4*長*寬*高實(shí)驗(yàn)的回顧編號體積V長a寬b高c11001052.521101062.631051152.1……….….….影響公式的因素:測量誤差模型的選擇第十五頁,共四十七頁,編輯于2023年,星期五二、多元線性回歸分析
直線相關(guān)與回歸分析一個自變量和一個因變量間的關(guān)系,在醫(yī)學(xué)實(shí)踐中,常會遇到一個應(yīng)變量與多個自變量數(shù)量關(guān)系的問題。如醫(yī)院住院人數(shù)不僅與門診人數(shù)有關(guān),而且可能與病床周轉(zhuǎn)次數(shù),床位數(shù)等有關(guān),多元回歸分析正是為解決這些問題而產(chǎn)生的。第十六頁,共四十七頁,編輯于2023年,星期五多元線性回歸模型通過實(shí)驗(yàn)測得含有p個自變量x1,x2,x3,…,xp及一個因變量y的n個觀察對象,利用最小二乘法原理,建立多元線性回歸模型:Y^=b0+b1X1+b2X2+…+bpXp。
其中b0為截距,b1,b2…bp稱為偏回歸系數(shù).bi表示當(dāng)將其它m-1個變量的作用加以固定后,Xi改變1個單位時Y的平均值Y^將改變bi個單位.第十七頁,共四十七頁,編輯于2023年,星期五1)多元回歸分析的前提條件(1)線性給定X1,X2…,Xp的數(shù)值后,
相應(yīng)的y隨機(jī)變動,其總體均數(shù)
y=b0+b1x1+b2x2+…….bpxp(2)獨(dú)立n個個體之間互相獨(dú)立;(3)正態(tài)給定X1,X2,…,Xp的數(shù)值后,相應(yīng)的y值服從正態(tài)分布;(4)等方差當(dāng)X1,X2,…,Xp的數(shù)值變動時,相應(yīng)的y有相同的方差。第十八頁,共四十七頁,編輯于2023年,星期五2)多元回歸方程的建立
1)求回歸系數(shù)常用最小二乘估計(jì)的方法求解待定系數(shù)b0和偏回歸系數(shù)b1、b2……bp。2)回歸方程的檢驗(yàn)由樣本計(jì)算得到的回歸方程是總體回歸的估計(jì)。多元回歸方程有沒有意義需要作假設(shè)檢驗(yàn),采用的是方差分析。第十九頁,共四十七頁,編輯于2023年,星期五3)樣本計(jì)算得到的這些偏回歸系數(shù)bi(i=1,2,……p)是總體偏回歸系數(shù)(i=1,2……p)的估計(jì)值。在建立起方程后有必要對這些偏回歸系數(shù)作檢驗(yàn)。第二十頁,共四十七頁,編輯于2023年,星期五3)多元回歸的作用
(1)建立回歸模型:
Y^=β0+β1X1+β2X2+…+βpXp;
(2)預(yù)測預(yù)報若已知x1,x2…xm數(shù)值大小時,通過模型可以預(yù)測y的值以及估計(jì)y的變化范圍;
(3)因素分析找出對因變量y有顯著影響的因素。
第二十一頁,共四十七頁,編輯于2023年,星期五
設(shè)研究問題中含有p個指標(biāo)變量x1,x2,…,xp及Y.n個觀察對象.其數(shù)據(jù)結(jié)構(gòu)為:編號X1X2….XPy1x11x12…x1py12x21x22…x2py23x31x32…x3py3………………nxn1xn2…xnpyp4)數(shù)據(jù)結(jié)構(gòu)第二十二頁,共四十七頁,編輯于2023年,星期五5)CHISS的實(shí)現(xiàn)點(diǎn)擊多元分析→線性回歸第二十三頁,共四十七頁,編輯于2023年,星期五6)實(shí)例講解
例10-1為研究初生兒體重與胎兒的孕齡、頭徑、胸徑、腹徑、股骨長的關(guān)系,以預(yù)測初生兒體重,某醫(yī)院用超聲波測得18名胎兒的有關(guān)指標(biāo)值、測量時的孕齡和出生時體重如表。試進(jìn)行多元回歸分析。第二十四頁,共四十七頁,編輯于2023年,星期五三、逐步回歸在多元線性回歸分析中,研究者往往是根據(jù)自己的經(jīng)驗(yàn)或借鑒他人的研究結(jié)果選定若干個自變量,這些自變量對因變量的影響作用是否都有統(tǒng)計(jì)學(xué)意義還有待于考察。通過多元性線回歸分析,常常會發(fā)現(xiàn)其中有很多自變量對因變量的影響無意義。第二十五頁,共四十七頁,編輯于2023年,星期五
同時,也常會遇到自變量間存在共線性的問題,影響到偏回歸系數(shù)估計(jì)和回歸方程的“質(zhì)量”。因此,在建立回歸方程的過程中有必要考慮對自變量進(jìn)行篩選,挑選出若干個與因變量作用較大的變量建立回歸方程。剔除那些對因變量沒有多大影響的變量,從而建立一個較理想、較穩(wěn)定的回歸方程。第二十六頁,共四十七頁,編輯于2023年,星期五1)逐步回歸的思想事先給定挑選自變量進(jìn)入方程的P界值(缺省值P=0.1),開始方程中沒有自變量,然后,按自變量對y的貢獻(xiàn)大小由大到小依次挑選進(jìn)入方程,每選入一個變量,都要對已在模型中的變量進(jìn)行檢驗(yàn),對大于剔除標(biāo)準(zhǔn)的變量要逐一剔除。第二十七頁,共四十七頁,編輯于2023年,星期五逐步回歸中F值的計(jì)算*
逐步選擇變量每一步都在權(quán)衡得失的情形下決定變量的取或舍。每一步都作一次如下的檢驗(yàn):
H0:p個自變量為好
H1:p+1個自變量為好
第二十八頁,共四十七頁,編輯于2023年,星期五
采用F作為統(tǒng)計(jì)量。
SS殘(H0)-SS殘(H1)
F=
SS殘(H1)/(n-p-2)
其中SS殘(H0)表示用p個變量回歸的殘差平方和
SS殘(H1)表示用p+1個變量回歸的殘差平方和。
若F≥F(界值),則拒絕H0,可決定增多相應(yīng)的自變量;
否則,不拒絕H0,可決定不增加相應(yīng)的自變量。
第二十九頁,共四十七頁,編輯于2023年,星期五2)CHISS的實(shí)現(xiàn)點(diǎn)擊多元分析→逐步回歸第三十頁,共四十七頁,編輯于2023年,星期五例10-2試對例10-1某醫(yī)院用超聲波測得18名胎兒的有關(guān)指標(biāo)值進(jìn)行逐步回歸分析。第三十一頁,共四十七頁,編輯于2023年,星期五3)Pe和Ps的確定1Pe,Ps需要多次選取。2常取0.5,0.4,0.3,0.2,0.1,0.05.3剔除變量的界值Ps要大于選進(jìn)變量的界值Pe第三十二頁,共四十七頁,編輯于2023年,星期五四、衡量回歸方程的標(biāo)準(zhǔn)
采用不同的剔除變量方法,選入不同剔除變量的標(biāo)準(zhǔn);會得到不同的回歸方程,我們要根據(jù)實(shí)際問題,對每個變量的單獨(dú)作用、變量間的交互作用作出恰當(dāng)?shù)脑u價。一般來說,當(dāng)回歸方程中自變量個數(shù)增加,或多或少總能減少剩余誤差,提高模型的擬合精度,但勢必導(dǎo)致模型的復(fù)雜性。第三十三頁,共四十七頁,編輯于2023年,星期五
因此,在建立回歸方程時,要遵循一個原則,即“少而精”,具體地說:既要盡可能地提高擬合的精度,又要盡可能地使模型簡單。這就需要有一個量化的標(biāo)準(zhǔn)來衡量所得模型的“優(yōu)”與“劣”。目前,常用的衡量方程好壞的標(biāo)準(zhǔn)有如下幾個:第三十四頁,共四十七頁,編輯于2023年,星期五1)決定系數(shù)R2(復(fù)相關(guān)系數(shù)的平方)
R2=1-SS殘/SS總=SS模/SS總,
,
它表示在因變量y的總變異中可由回歸方程所解釋部分的比例。0<R2≤1,越接近于1,說明回歸方程效果越好。第三十五頁,共四十七頁,編輯于2023年,星期五2)校正的決定系數(shù)AdjR2
復(fù)相關(guān)系數(shù)是隨方程中的變量個數(shù)增加而增加的,即使自變量對Y無顯著性意義,為了克服這一缺點(diǎn),對它進(jìn)行校正:
AdjR2=1-MS殘/MS總,0<AdjR2≤1,越接近于1,說明回歸方程效果越好。第三十六頁,共四十七頁,編輯于2023年,星期五3)
它反映了應(yīng)變量在扣除自變量的線性影響后的離散程度;剩余標(biāo)準(zhǔn)差越接近于0,說明回歸方程效果越好。3)剩余標(biāo)準(zhǔn)差第三十七頁,共四十七頁,編輯于2023年,星期五五、回歸分析注意幾點(diǎn)自變量間的共線性問題殘差分析異常點(diǎn)診斷第三十八頁,共四十七頁,編輯于2023年,星期五自變量間的共線性問題。當(dāng)自變量均為隨機(jī)變量時,若他們之間高度相關(guān),則稱自變量間存在共線性(colinearity)。共線性會給多重回歸帶來很大麻煩,其參數(shù)估計(jì)自然極不穩(wěn)定,甚至參數(shù)值可大可小,可正可負(fù),其意義無法解釋;有時,參數(shù)估計(jì)值的標(biāo)準(zhǔn)差很大,以致該參數(shù)估計(jì)值的統(tǒng)計(jì)學(xué)意義受到懷疑。第三十九頁,共四十七頁,編輯于2023年,星期五克服共線性的方法逐步回歸分析主成分回歸分析第四十頁,共四十七頁,編輯于2023年,星期五
逐步選擇變量是對付共線性的辦法之一,經(jīng)逐步選擇后,兩個高度相關(guān)的自變量X1和X2常常不能同時進(jìn)入方程,但兩者高度相關(guān),誰先進(jìn)入方程帶有偶然性
溫馨提示
- 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
- 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
- 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
- 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負(fù)責(zé)。
- 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請與我們聯(lián)系,我們立即糾正。
- 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時也不承擔(dān)用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。
最新文檔
- 人教版數(shù)學(xué)八年級下冊《章前引言及 加權(quán)平均數(shù)》聽評課記錄1
- 人教部編版八年級道德與法治上冊:7.1《關(guān)愛他人》聽課評課記錄2
- 蘇教版小學(xué)二年級下冊數(shù)學(xué)口算題
- 七年級生物教學(xué)計(jì)劃
- 工程建設(shè)項(xiàng)目招標(biāo)代理合同范本
- 2025年度二零二五年度食堂檔口租賃合同與食品安全宣傳教育協(xié)議
- 農(nóng)機(jī)合作社入社協(xié)議書范本
- 二零二五年度智能駕駛技術(shù)聘用駕駛員安全合作協(xié)議書
- 2025年度船舶買賣合同中的船舶交易市場分析及預(yù)測
- 2025年度員工公寓租賃補(bǔ)貼協(xié)議范本
- 2025年礦山開采承包合同實(shí)施細(xì)則4篇
- 2025年度茶葉品牌加盟店加盟合同及售后服務(wù)協(xié)議
- 氧氣、乙炔工安全操作規(guī)程(3篇)
- 建筑廢棄混凝土處置和再生建材利用措施計(jì)劃
- 集裝箱知識培訓(xùn)課件
- 某縣城區(qū)地下綜合管廊建設(shè)工程項(xiàng)目可行性實(shí)施報告
- 《架空輸電線路導(dǎo)線舞動風(fēng)偏故障告警系統(tǒng)技術(shù)導(dǎo)則》
- 2024年計(jì)算機(jī)二級WPS考試題庫
- JJF(京) 92-2022 激光標(biāo)線儀校準(zhǔn)規(guī)范
- 普惠金融政策解讀
- 廣東省廣州黃埔區(qū)2023-2024學(xué)年八年級上學(xué)期期末數(shù)學(xué)試卷(含答案)
評論
0/150
提交評論