多元回歸分析k_第1頁
多元回歸分析k_第2頁
多元回歸分析k_第3頁
多元回歸分析k_第4頁
多元回歸分析k_第5頁
已閱讀5頁,還剩42頁未讀 繼續(xù)免費(fèi)閱讀

下載本文檔

版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進(jìn)行舉報或認(rèn)領(lǐng)

文檔簡介

多元回歸分析k第一頁,共四十七頁,編輯于2023年,星期五

在醫(yī)學(xué)中,往往要研究兩個定量變量間的相互關(guān)系。如人體的血壓和脈搏,身高和體重等。統(tǒng)計(jì)學(xué)中的相關(guān)與回歸是研究兩個變量線性關(guān)系的最基本的方法。

一、直線相關(guān)與回歸回顧第二頁,共四十七頁,編輯于2023年,星期五

y

。。。。。。。。

。。

━━┻━━━━┻━━━━┻━━━>X

散點(diǎn)圖第三頁,共四十七頁,編輯于2023年,星期五線性相關(guān)

線性相關(guān)是用相關(guān)系數(shù)r來表示兩個變量X,Y間的直線關(guān)系。相關(guān)系數(shù)r的計(jì)算公式

第四頁,共四十七頁,編輯于2023年,星期五其絕對值愈接近1,兩個變量間的直線相關(guān)愈密切,愈接近0,線性相關(guān)愈不密切。相關(guān)系數(shù)r沒有單位,在-1~+1范圍內(nèi)波動。第五頁,共四十七頁,編輯于2023年,星期五

相關(guān)分析的步驟(1)作散點(diǎn)圖(2)計(jì)算相關(guān)系數(shù)r(3)相關(guān)系數(shù)檢驗(yàn)

第六頁,共四十七頁,編輯于2023年,星期五CHISS的實(shí)現(xiàn)點(diǎn)擊統(tǒng)計(jì)→統(tǒng)計(jì)推斷→相關(guān)矩陣第七頁,共四十七頁,編輯于2023年,星期五例9-1

測得某地10名3歲兒童的體重(kg)與體表面y(103cm2)積,試對該資料進(jìn)行直線相關(guān)分析。第八頁,共四十七頁,編輯于2023年,星期五當(dāng)兩變量間存在著性線關(guān)系時,不僅可以用相關(guān)系數(shù)r表示變量Y與X線性相關(guān)的密切程度,還可以用一個二元一次方程來表示。

直線回歸第九頁,共四十七頁,編輯于2023年,星期五

其中:第十頁,共四十七頁,編輯于2023年,星期五CHISS的實(shí)現(xiàn)點(diǎn)擊多元分析→線性回歸第十一頁,共四十七頁,編輯于2023年,星期五例9-3Wainwright等(1988)在進(jìn)行營養(yǎng)學(xué)實(shí)驗(yàn)前,先對小鼠體重與每窩小鼠只數(shù)間的關(guān)系進(jìn)行了研究。從每窩分別為3只至12只的小鼠中,每個窩別大小隨機(jī)抽取兩窩。在出生后第32天測量不同窩別小鼠的平均體重,結(jié)果見下表。試作回歸分析。第十二頁,共四十七頁,編輯于2023年,星期五回歸方程的應(yīng)用

----預(yù)測與估計(jì)

求出回歸方程后,如果方程擬合度好話,可根據(jù)X的值來求Y預(yù)測值

第十三頁,共四十七頁,編輯于2023年,星期五[典型統(tǒng)計(jì)案例1]

腎臟為不規(guī)則體,怎樣測量?立方體體積規(guī)律:公式:V=長*寬*高=abc

a腎臟體積的測量bc腎臟體積計(jì)算公式:經(jīng)驗(yàn)公式:V=π/4*長*寬*高公式怎樣產(chǎn)生的?第十四頁,共四十七頁,編輯于2023年,星期五腎臟體積測量實(shí)驗(yàn)用20個腎臟標(biāo)本,測量計(jì)錄每個體積及其長,寬,高的數(shù)據(jù):采用什么方法找規(guī)律呢?

回歸方程的構(gòu)造:y=a+b*xV=π/4*長*寬*高實(shí)驗(yàn)的回顧編號體積V長a寬b高c11001052.521101062.631051152.1……….….….影響公式的因素:測量誤差模型的選擇第十五頁,共四十七頁,編輯于2023年,星期五二、多元線性回歸分析

直線相關(guān)與回歸分析一個自變量和一個因變量間的關(guān)系,在醫(yī)學(xué)實(shí)踐中,常會遇到一個應(yīng)變量與多個自變量數(shù)量關(guān)系的問題。如醫(yī)院住院人數(shù)不僅與門診人數(shù)有關(guān),而且可能與病床周轉(zhuǎn)次數(shù),床位數(shù)等有關(guān),多元回歸分析正是為解決這些問題而產(chǎn)生的。第十六頁,共四十七頁,編輯于2023年,星期五多元線性回歸模型通過實(shí)驗(yàn)測得含有p個自變量x1,x2,x3,…,xp及一個因變量y的n個觀察對象,利用最小二乘法原理,建立多元線性回歸模型:Y^=b0+b1X1+b2X2+…+bpXp。

其中b0為截距,b1,b2…bp稱為偏回歸系數(shù).bi表示當(dāng)將其它m-1個變量的作用加以固定后,Xi改變1個單位時Y的平均值Y^將改變bi個單位.第十七頁,共四十七頁,編輯于2023年,星期五1)多元回歸分析的前提條件(1)線性給定X1,X2…,Xp的數(shù)值后,

相應(yīng)的y隨機(jī)變動,其總體均數(shù)

y=b0+b1x1+b2x2+…….bpxp(2)獨(dú)立n個個體之間互相獨(dú)立;(3)正態(tài)給定X1,X2,…,Xp的數(shù)值后,相應(yīng)的y值服從正態(tài)分布;(4)等方差當(dāng)X1,X2,…,Xp的數(shù)值變動時,相應(yīng)的y有相同的方差。第十八頁,共四十七頁,編輯于2023年,星期五2)多元回歸方程的建立

1)求回歸系數(shù)常用最小二乘估計(jì)的方法求解待定系數(shù)b0和偏回歸系數(shù)b1、b2……bp。2)回歸方程的檢驗(yàn)由樣本計(jì)算得到的回歸方程是總體回歸的估計(jì)。多元回歸方程有沒有意義需要作假設(shè)檢驗(yàn),采用的是方差分析。第十九頁,共四十七頁,編輯于2023年,星期五3)樣本計(jì)算得到的這些偏回歸系數(shù)bi(i=1,2,……p)是總體偏回歸系數(shù)(i=1,2……p)的估計(jì)值。在建立起方程后有必要對這些偏回歸系數(shù)作檢驗(yàn)。第二十頁,共四十七頁,編輯于2023年,星期五3)多元回歸的作用

(1)建立回歸模型:

Y^=β0+β1X1+β2X2+…+βpXp;

(2)預(yù)測預(yù)報若已知x1,x2…xm數(shù)值大小時,通過模型可以預(yù)測y的值以及估計(jì)y的變化范圍;

(3)因素分析找出對因變量y有顯著影響的因素。

第二十一頁,共四十七頁,編輯于2023年,星期五

設(shè)研究問題中含有p個指標(biāo)變量x1,x2,…,xp及Y.n個觀察對象.其數(shù)據(jù)結(jié)構(gòu)為:編號X1X2….XPy1x11x12…x1py12x21x22…x2py23x31x32…x3py3………………nxn1xn2…xnpyp4)數(shù)據(jù)結(jié)構(gòu)第二十二頁,共四十七頁,編輯于2023年,星期五5)CHISS的實(shí)現(xiàn)點(diǎn)擊多元分析→線性回歸第二十三頁,共四十七頁,編輯于2023年,星期五6)實(shí)例講解

例10-1為研究初生兒體重與胎兒的孕齡、頭徑、胸徑、腹徑、股骨長的關(guān)系,以預(yù)測初生兒體重,某醫(yī)院用超聲波測得18名胎兒的有關(guān)指標(biāo)值、測量時的孕齡和出生時體重如表。試進(jìn)行多元回歸分析。第二十四頁,共四十七頁,編輯于2023年,星期五三、逐步回歸在多元線性回歸分析中,研究者往往是根據(jù)自己的經(jīng)驗(yàn)或借鑒他人的研究結(jié)果選定若干個自變量,這些自變量對因變量的影響作用是否都有統(tǒng)計(jì)學(xué)意義還有待于考察。通過多元性線回歸分析,常常會發(fā)現(xiàn)其中有很多自變量對因變量的影響無意義。第二十五頁,共四十七頁,編輯于2023年,星期五

同時,也常會遇到自變量間存在共線性的問題,影響到偏回歸系數(shù)估計(jì)和回歸方程的“質(zhì)量”。因此,在建立回歸方程的過程中有必要考慮對自變量進(jìn)行篩選,挑選出若干個與因變量作用較大的變量建立回歸方程。剔除那些對因變量沒有多大影響的變量,從而建立一個較理想、較穩(wěn)定的回歸方程。第二十六頁,共四十七頁,編輯于2023年,星期五1)逐步回歸的思想事先給定挑選自變量進(jìn)入方程的P界值(缺省值P=0.1),開始方程中沒有自變量,然后,按自變量對y的貢獻(xiàn)大小由大到小依次挑選進(jìn)入方程,每選入一個變量,都要對已在模型中的變量進(jìn)行檢驗(yàn),對大于剔除標(biāo)準(zhǔn)的變量要逐一剔除。第二十七頁,共四十七頁,編輯于2023年,星期五逐步回歸中F值的計(jì)算*

逐步選擇變量每一步都在權(quán)衡得失的情形下決定變量的取或舍。每一步都作一次如下的檢驗(yàn):

H0:p個自變量為好

H1:p+1個自變量為好

第二十八頁,共四十七頁,編輯于2023年,星期五

采用F作為統(tǒng)計(jì)量。

SS殘(H0)-SS殘(H1)

F=

SS殘(H1)/(n-p-2)

其中SS殘(H0)表示用p個變量回歸的殘差平方和

SS殘(H1)表示用p+1個變量回歸的殘差平方和。

若F≥F(界值),則拒絕H0,可決定增多相應(yīng)的自變量;

否則,不拒絕H0,可決定不增加相應(yīng)的自變量。

第二十九頁,共四十七頁,編輯于2023年,星期五2)CHISS的實(shí)現(xiàn)點(diǎn)擊多元分析→逐步回歸第三十頁,共四十七頁,編輯于2023年,星期五例10-2試對例10-1某醫(yī)院用超聲波測得18名胎兒的有關(guān)指標(biāo)值進(jìn)行逐步回歸分析。第三十一頁,共四十七頁,編輯于2023年,星期五3)Pe和Ps的確定1Pe,Ps需要多次選取。2常取0.5,0.4,0.3,0.2,0.1,0.05.3剔除變量的界值Ps要大于選進(jìn)變量的界值Pe第三十二頁,共四十七頁,編輯于2023年,星期五四、衡量回歸方程的標(biāo)準(zhǔn)

采用不同的剔除變量方法,選入不同剔除變量的標(biāo)準(zhǔn);會得到不同的回歸方程,我們要根據(jù)實(shí)際問題,對每個變量的單獨(dú)作用、變量間的交互作用作出恰當(dāng)?shù)脑u價。一般來說,當(dāng)回歸方程中自變量個數(shù)增加,或多或少總能減少剩余誤差,提高模型的擬合精度,但勢必導(dǎo)致模型的復(fù)雜性。第三十三頁,共四十七頁,編輯于2023年,星期五

因此,在建立回歸方程時,要遵循一個原則,即“少而精”,具體地說:既要盡可能地提高擬合的精度,又要盡可能地使模型簡單。這就需要有一個量化的標(biāo)準(zhǔn)來衡量所得模型的“優(yōu)”與“劣”。目前,常用的衡量方程好壞的標(biāo)準(zhǔn)有如下幾個:第三十四頁,共四十七頁,編輯于2023年,星期五1)決定系數(shù)R2(復(fù)相關(guān)系數(shù)的平方)

R2=1-SS殘/SS總=SS模/SS總,

,

它表示在因變量y的總變異中可由回歸方程所解釋部分的比例。0<R2≤1,越接近于1,說明回歸方程效果越好。第三十五頁,共四十七頁,編輯于2023年,星期五2)校正的決定系數(shù)AdjR2

復(fù)相關(guān)系數(shù)是隨方程中的變量個數(shù)增加而增加的,即使自變量對Y無顯著性意義,為了克服這一缺點(diǎn),對它進(jìn)行校正:

AdjR2=1-MS殘/MS總,0<AdjR2≤1,越接近于1,說明回歸方程效果越好。第三十六頁,共四十七頁,編輯于2023年,星期五3)

它反映了應(yīng)變量在扣除自變量的線性影響后的離散程度;剩余標(biāo)準(zhǔn)差越接近于0,說明回歸方程效果越好。3)剩余標(biāo)準(zhǔn)差第三十七頁,共四十七頁,編輯于2023年,星期五五、回歸分析注意幾點(diǎn)自變量間的共線性問題殘差分析異常點(diǎn)診斷第三十八頁,共四十七頁,編輯于2023年,星期五自變量間的共線性問題。當(dāng)自變量均為隨機(jī)變量時,若他們之間高度相關(guān),則稱自變量間存在共線性(colinearity)。共線性會給多重回歸帶來很大麻煩,其參數(shù)估計(jì)自然極不穩(wěn)定,甚至參數(shù)值可大可小,可正可負(fù),其意義無法解釋;有時,參數(shù)估計(jì)值的標(biāo)準(zhǔn)差很大,以致該參數(shù)估計(jì)值的統(tǒng)計(jì)學(xué)意義受到懷疑。第三十九頁,共四十七頁,編輯于2023年,星期五克服共線性的方法逐步回歸分析主成分回歸分析第四十頁,共四十七頁,編輯于2023年,星期五

逐步選擇變量是對付共線性的辦法之一,經(jīng)逐步選擇后,兩個高度相關(guān)的自變量X1和X2常常不能同時進(jìn)入方程,但兩者高度相關(guān),誰先進(jìn)入方程帶有偶然性

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負(fù)責(zé)。
  • 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時也不承擔(dān)用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

評論

0/150

提交評論