直線回歸分析研_第1頁
直線回歸分析研_第2頁
直線回歸分析研_第3頁
直線回歸分析研_第4頁
直線回歸分析研_第5頁
已閱讀5頁,還剩38頁未讀, 繼續(xù)免費閱讀

下載本文檔

版權說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權,請進行舉報或認領

文檔簡介

直線回歸分析研1第一頁,共四十三頁,編輯于2023年,星期日編號

(1)尿雌三醇mg/24h(2)產(chǎn)兒體重kg(3)編號

(1)尿雌三醇mg/24h(2)產(chǎn)兒體重kg(3)172.517173.2292.518253.2392.519273.44122.720153.45142.721153.46162.722153.57162.423163.58143.024193.49163.025183.510163.126173.611173.027183.712193.128203.813213.029224.014242.830253.915153.231244.316163.2

表1孕婦尿中雌三醇含量與產(chǎn)兒的體重變量x變量y雙變量資料2第二頁,共四十三頁,編輯于2023年,星期日表212只大白鼠的進食量與體重增加量序號進食量(g)體重增加量(g)1305.723.62188.614.73277.219.24364.827.75285.318.96244.716.17255.917.28149.812.99268.918.310247.617.711168.813.712200.615.6合計2957.9215.6變量y變量x雙變量資料3第三頁,共四十三頁,編輯于2023年,星期日醫(yī)學上,許多現(xiàn)象之間也都有類似的或強或弱的相互依存的關系,例如:身高與體重、體溫與脈搏、年齡與血壓、胰島素與血糖水平、毒物劑量與動物的存活時間等等。4第四頁,共四十三頁,編輯于2023年,星期日回歸的由來英國統(tǒng)計學家PearsonK(1857~1936)1903年搜集了1078個家庭人員的身高、前臂長等指標的記錄,發(fā)現(xiàn)兒子身高(Y,英寸)與父親身高(X,英寸)存在線性關系:5第五頁,共四十三頁,編輯于2023年,星期日回歸的由來表明:高個子父親兒子的平均身高稍矮于其父親的平均身高;而矮個子父親兒子的平均身高稍高于其父親的平均身高。英國人類學家GaltonF(1822~1911)將這種趨向于種族穩(wěn)定的現(xiàn)象稱之為“回歸”。至此,“回歸”逐漸發(fā)展成為分析兩個變量或多個變量之間某種數(shù)量依存關系的一類統(tǒng)計方法。6第六頁,共四十三頁,編輯于2023年,星期日一、直線回歸的概念直線回歸:用直線回歸方程表示兩個變量間數(shù)量依存關系的統(tǒng)計分析方法,屬雙變量分析的范疇。7第七頁,共四十三頁,編輯于2023年,星期日例12.1(P165):為探討某地飲水中氟含量與氟骨癥的關系,試對測量得到的下列8對數(shù)據(jù)進行直線回歸分析。編號12345678氟含量(mg/L)X0.480.641.001.471.602.863.214.71患病率(%)Y22.3723.3125.3222.2928.5735.0046.0746.088第八頁,共四十三頁,編輯于2023年,星期日圖12-1某地區(qū)飲水氟含量與氟骨癥患病率散點圖兩相關變量的散點圖9第九頁,共四十三頁,編輯于2023年,星期日

在實際生活當中,由于其它因素的干擾,許多雙變量之間的關系呈直線趨勢,但并不是嚴格的直線關系,為了區(qū)別于兩變量間的直線關系,我們稱這種關系為直線回歸。直線回歸仍用直線方程來描述兩變量間的回歸關系,但稱為直線回歸方程.10第十頁,共四十三頁,編輯于2023年,星期日二、直線回歸方程

直線回歸方程:11第十一頁,共四十三頁,編輯于2023年,星期日xyb>0b<0a>0a<0a=012第十二頁,共四十三頁,編輯于2023年,星期日回歸系數(shù)與截距的計算:

應用數(shù)學上的最小二乘法原理13第十三頁,共四十三頁,編輯于2023年,星期日14第十四頁,共四十三頁,編輯于2023年,星期日1、繪制散點圖:(直線回歸的條件:“LINE”)2、求回歸系數(shù)b和截距a:例:12.1P16715第十五頁,共四十三頁,編輯于2023年,星期日計算16第十六頁,共四十三頁,編輯于2023年,星期日3、列出回歸方程:17第十七頁,共四十三頁,編輯于2023年,星期日方差分析法t檢驗法三、回歸系數(shù)的假設檢驗18第十八頁,共四十三頁,編輯于2023年,星期日回歸系數(shù)的假設檢驗:方差分析法方差分析的基本思想:把總的離均差平方和(即總變異)分解為至少兩個部分,其中有一部分主要表示某因素的效應,有一部分表示隨機誤差的影響,然后比較兩者的均方,計算F值,若F值遠大于1,可認為該因素有效應,否則認為該因素無效應。Y的總變異:SS總=SS回+SS剩19第十九頁,共四十三頁,編輯于2023年,星期日應變量Y的離均差平方和的分解XYP(X,Y)20第二十頁,共四十三頁,編輯于2023年,星期日應變量Y的離均差平方和的分解SS總=SS回+SS剩21第二十一頁,共四十三頁,編輯于2023年,星期日回歸系數(shù)的方差分析SS總=lYYSS回=blXY=lXY2/lXXSS剩=SS總-

SS回=lYY-

lXY2/lXXSS總=SS回+SS剩總

=n–1回=1剩=n-222第二十二頁,共四十三頁,編輯于2023年,星期日例:用方差分析法對例12.1數(shù)據(jù)求得的回歸系數(shù)進行假設檢驗b=6.43回歸系數(shù)方差分析的基本步驟:H0:β=0(飲水中氟含量與氟骨癥之間沒有直線關系)H1:β≠0(飲水中氟含量與氟骨癥之間有直線關系)α=0.05計算統(tǒng)計量:23第二十三頁,共四十三頁,編輯于2023年,星期日SS總=lYY=718.03SS回=blXY=lXY2/lXX=626.11SS剩=SS總-

SS回=lYY-

lXY2/lXX=91.9224第二十四頁,共四十三頁,編輯于2023年,星期日回歸系數(shù)方差分析的基本步驟:確定P值:回=1剩=6,查F界值表得P<0.01下結論:按=0.05的檢驗水準,拒絕H0,接受H1,可認為飲水中氟含量與氟骨癥之間有直線關系。25第二十五頁,共四十三頁,編輯于2023年,星期日表12-1回歸系數(shù)方差分析表變異來源SSDFMSFP回歸626.111626.1140.87P<0.01剩余91.92615.32總變異718.03726第二十六頁,共四十三頁,編輯于2023年,星期日回歸系數(shù)的假設檢驗:

t檢驗法SY.X:表示去除X影響后Y的變異程度,即剩余標準差27第二十七頁,共四十三頁,編輯于2023年,星期日H0:β=0H1:β≠0α=0.05n=8SS剩=91.97lxx=15.15,b=6.43SYX=…=3.92Sb=…=1.01t=…=6.37例:用t檢驗法對飲水中氟含量與氟骨癥之間的直線回歸系數(shù)進行假設檢驗28第二十八頁,共四十三頁,編輯于2023年,星期日按=6,查t界值表得P<0.001,按=0.05的檢驗水準,拒絕H0,接受H1,可認為飲水中氟含量與氟骨癥之間有直線關系。方差分析和t檢驗的關系:29第二十九頁,共四十三頁,編輯于2023年,星期日四、直線回歸方程的圖示在自變量X的實測范圍內(nèi)任取相距較遠且易讀數(shù)的兩X值代入回歸方程求得兩點坐標、連線即得其回歸直線。X:0.48~4.71X1(0.48,21.38)、X2(4.71,48.57)(X,Y)、(0,a)30第三十頁,共四十三頁,編輯于2023年,星期日五、回歸系數(shù)與預測值的區(qū)間估計預測:把易測量的預報因子(自變量x)代入回歸方程對不易測量的預報量(應變量y)進行點估計和區(qū)間估計。31第三十一頁,共四十三頁,編輯于2023年,星期日(一)回歸系數(shù)的可信區(qū)間(b-t/2,sb

,b+t/2,sb)

bt/2,sb

=n-2可信區(qū)間:β的100(1-α)%的可信區(qū)間為:32第三十二頁,共四十三頁,編輯于2023年,星期日例:(續(xù)前例)試求總體回歸系數(shù)β的95%可信區(qū)間b=6.43,=8-2=6,t0.05/2,6=2.447,

Sb=1.01β的95%可信區(qū)間為:(6.43-2.447×1.01,6.43+2.447×1.01)=(3.96,8.90)33第三十三頁,共四十三頁,編輯于2023年,星期日(二)可信區(qū)間:是總體中x取某定值X0時的總體均數(shù)34第三十四頁,共四十三頁,編輯于2023年,星期日yx35第三十五頁,共四十三頁,編輯于2023年,星期日例:(續(xù)前例)試計算當x0=1.00時的95%可信區(qū)間x0=1.00時=24.72SYX=3.92lxx=15.15,X=2.0036第三十六頁,共四十三頁,編輯于2023年,星期日

=8-2=6,t0.05/2,6=2.447

的95%可信區(qū)間:(24.72±2.447×1.71)=(20.54,28.90)37第三十七頁,共四十三頁,編輯于2023年,星期日(三)個體Y值的容許區(qū)間個體Y值的容許區(qū)間:總體中x為某定值X0時,Y值由于隨機誤差影響在上下波動的范圍。38第三十八頁,共四十三頁,編輯于2023年,星期日

例:(續(xù)前例)試計算當x0=1.00時個體Y值的95%容許區(qū)間=8-2=6,t0.05/2,6=2.447個體Y值的95%容許區(qū)間(24.72±2.447×4.28)=(14.25,35.19)39第三十九頁,共四十三頁,編輯于2023年,星期日剩余標準差x取某定值x0時應變量y的標準差樣本條件均數(shù)的標準誤40第四十頁,共四十三頁,編輯于2023年,星期日五直線回歸方程的應用(一)直線回歸方程的主要用途1、定量描述兩變量間的依存關系2、利用回歸方程進行預測3、利用回歸方程進行

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預覽,若沒有圖紙預覽就沒有圖紙。
  • 4. 未經(jīng)權益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負責。
  • 6. 下載文件中如有侵權或不適當內(nèi)容,請與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

評論

0/150

提交評論