衛(wèi)生統(tǒng)計學(xué)直線相關(guān)與回歸課件_第1頁
衛(wèi)生統(tǒng)計學(xué)直線相關(guān)與回歸課件_第2頁
衛(wèi)生統(tǒng)計學(xué)直線相關(guān)與回歸課件_第3頁
衛(wèi)生統(tǒng)計學(xué)直線相關(guān)與回歸課件_第4頁
衛(wèi)生統(tǒng)計學(xué)直線相關(guān)與回歸課件_第5頁
已閱讀5頁,還剩45頁未讀, 繼續(xù)免費閱讀

下載本文檔

版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進行舉報或認(rèn)領(lǐng)

文檔簡介

第十章直線回歸與相關(guān)Dec,8,2009前言單變量統(tǒng)計(univariatestatistics):描述某一變量的統(tǒng)計特征或比較該變量的組間差別,如t、u、F檢驗雙變量統(tǒng)計(bivariatestatistics):研究兩個變量之間的關(guān)系如何。糖尿病人的血糖與胰島素水平年齡與高血壓抗菌藥的濃度與瓊脂糖抑菌斑的直徑Dec,8,2009本章只介紹兩個變量間的直線關(guān)系的分析1.回歸關(guān)系:描述變量間的依存關(guān)系,即數(shù)量關(guān)系,2.相關(guān)關(guān)系:描述變量間的相互關(guān)系,即互依關(guān)系Dec,8,2009Dec,8,2009Dec,8,2009直線回歸:在直角坐標(biāo)系中繪制散點圖,所有散點并不都在一條直線上,但有一種直線趨勢回歸方程:區(qū)別與線性函數(shù),線性函數(shù)要求變量間有嚴(yán)格的函數(shù)關(guān)系──一一對應(yīng)。Dec,8,2009二、直線回歸方程的求法最小二乘估計法:要求各實測點到回歸直線的縱向距離的平方和最小。離均差積和Dec,8,2009Dec,8,2009表10-110名胎兒的股骨徑長度和出生體重的數(shù)據(jù)編號(1)股骨徑長度X(cm)(2)出生體重Y(g)(3)XY(4)X2(5)Y2(6)16.50272017680.042.2526.80284019312.046.2437.20345024840.051.8447.12316022499.250.6956.90283019527.047.6167.87398031322.661.9376.56247016203.243.0385.79174010074.633.5296.39248015847.240.83107.00332023240.049.00合計68.1328990200545.8466.96Dec,8,2009

3.求回歸系數(shù)b、截距a,列出方程。Dec,8,2009根據(jù)回歸方程式作圖,在自變量X取值范圍內(nèi)任取兩個X值,帶人方程式,得Y的估計值,連接兩點,即回歸直線?;貧w直線過(0,a)和(,)。4.繪制直線回歸直線(0,-4516.99)和(6.813,2899)Dec,8,2009●●三、回歸分析中的統(tǒng)計推斷P點的縱坐標(biāo)被回歸直線與均數(shù)截成三段:1.方差分析Dec,8,2009所有點平方求和,因有SS總=SS回+SS剩總=回+???n-1回=1剩=n-2反映了Y的總變異度反映了Y的總變異中可以用X和Y的直線關(guān)系解釋的那部分變異反映除了X對Y的線性影響之外一切因素對Y的變異作用Dec,8,2009回=1,剩=n-2構(gòu)造檢驗統(tǒng)計量Dec,8,2009表10.2回歸分析的方差分析表變異來源離均差平方和自由度均方F總

回歸1誤差

Dec,8,2009(1)建立假設(shè):

H0:β=0,胎兒的股骨徑長度與胎兒體重之間無直線回歸關(guān)系

H1:β≠0,胎兒的股骨徑長度與胎兒體重之間有直線回歸關(guān)系

α=0.05

(2)計算檢驗統(tǒng)計量SS剩=SS總-SS回=3460690-3305742.71=154947.29Dec,8,2009表10.3例10.2資料的方差分析計算表變異來源SSνMSF總變異34606909回歸3305742.7113305742.71170.67剩余154947.29819368.41查附表3.1方差分析表,得F0.05,(1,8)=5.32,F(xiàn)>F0.05,(1,8),所以P<0.05,按α=0.05水準(zhǔn),拒絕H0,接受H1,故認(rèn)為胎兒的股骨徑長度與胎兒體重之間存在直線回歸關(guān)系。(3)確定P值,作出統(tǒng)計推斷Dec,8,2009式中Sb為回歸系數(shù)的標(biāo)準(zhǔn)誤,計算公式為:2.t檢驗=n-2Dec,8,2009

=n-2=8Dec,8,20093.直線回歸的區(qū)間估計(1)總體回歸系數(shù)的區(qū)間估計

例10-3試用例10-1所計算的樣本回歸系數(shù)b=1088.51估計其總體回歸系數(shù)的95%可信區(qū)間。(1088.51-2.306×83.32,1088.51+2.306×83.32)=(896.37,1280.65)Dec,8,20094.直線回歸方程的應(yīng)用(1)描述兩變量的依存關(guān)系(2)利用回歸方程進行預(yù)測(3)利用回歸方程進行統(tǒng)計控制(4)應(yīng)用回歸方程應(yīng)注意的問題1)做回歸分析要有實際意義2)在進行直線回歸分析前,應(yīng)繪制散點圖3)直線回歸方程的適用范圍一般為自變量的取值范圍Dec,8,2009線性相關(guān)(linearcorrelation)

又稱簡單相關(guān)(simplecorrelation)用相關(guān)系數(shù)(r)來表示兩個變量間的直線關(guān)系。線性相關(guān)的性質(zhì)可由散點圖來直觀地說明一、線性相關(guān)和相關(guān)系數(shù)的概念適用于服從雙變量正態(tài)分布的雙隨機變量。第二節(jié)直線相關(guān)Dec,8,20090<r<1-1<r<0.r=0正相關(guān)負(fù)相關(guān)零相關(guān)r=-1完全相關(guān)零相關(guān)完全相關(guān)零相關(guān)零相關(guān)r=1..r=0.r=0.r=0Dec,8,2009二、相關(guān)系數(shù)的意義相關(guān)系數(shù)(correlationcoefficient)又稱為積差相關(guān)系數(shù)(coefficientofproduct-momentcorrelation)它是說明具有直線關(guān)系的兩變量間相關(guān)關(guān)系的密切程度與相關(guān)方向的指標(biāo)。相關(guān)系數(shù)r沒有單位,-1≤r≤1。Dec,8,2009計算r的公式為:三、相關(guān)系數(shù)的計算Dec,8,2009例10-8就例10-1資料試計算胎兒股骨徑長度和胎兒體重的相關(guān)系數(shù)。由例10-1中已計算出的lXX=2.79、lYY=3460690、lXY=3036.93按公式(10-20)計算Dec,8,2009四、相關(guān)系數(shù)的假設(shè)檢驗H0:=0H1:≠0α=0.05=n-2Dec,8,2009例10-9就例10-8所得r值,檢驗胎兒股骨徑長度和胎兒體重間是否有直線相關(guān)關(guān)系。建立假設(shè)檢驗:H0:ρ=0H1:ρ≠0=0.05計算檢驗統(tǒng)計量

=n-2=8查t界值表,得P<0.05,拒絕H0。Dec,8,2009相關(guān):相關(guān)關(guān)系1.區(qū)別(1)資料要求不同回歸:I型(Y正態(tài)分布)、II型都可以。相關(guān):II型資料(雙變量正態(tài)分布)(2)應(yīng)用情況不同回歸:依存關(guān)系五、直線回歸與相關(guān)的區(qū)別和聯(lián)系Dec,8,2009(1)方向一致(2)假設(shè)檢驗等價(3)用回歸解釋相關(guān)(4)r的平方稱為決定系數(shù)(coefficientofdetermination):反映了Y的總變異中由X變量可以解釋的部分。2.聯(lián)系Dec,8,2009直線回歸與相關(guān)應(yīng)用的注意事項根據(jù)專業(yè)知識確定自變量和應(yīng)變量;不能把毫無關(guān)聯(lián)的兩種現(xiàn)象勉強作回歸或相關(guān);在研究兩變量之間的密切程度時,不但要求總體相關(guān)系數(shù)ρ≠0,而且要求樣本的r不能太小,否則即使假設(shè)檢驗認(rèn)為兩變量之間有直線相關(guān)關(guān)系,但由于r太小,而使得這種關(guān)系變得毫無意義|r|≥0.70高度相關(guān),0.4≤|r|<0.70中度相關(guān),|r|<0.4低度相關(guān)要繪制散點圖直線回歸用于預(yù)測時,其適用范圍一般不超過樣本中自變量的取值范圍Dec,8,2009(3)特別是有率或構(gòu)成比等相對數(shù)作變量,或本來就是等級資料。(1)不服從雙變量正態(tài)分布;(2)總體分布類型未知;第三節(jié)等級相關(guān)Dec,8,2009總體等級相關(guān)系數(shù)的假設(shè)檢驗H0:ρs=0H1:ρs≠0,或單側(cè)ρs<0(或ρs>0)相關(guān)系數(shù)rs的公式為:當(dāng)n>50時直接查rs界值表。當(dāng)n>50時Dec,8,2009相同秩次較多時,rs的校正:Dec,8,2009第五節(jié)曲線擬合醫(yī)學(xué)現(xiàn)象中并非所有的兩變量間關(guān)系都表現(xiàn)為前面所述的直線形式,其較為典型的是服藥后血藥濃度-時間曲線或毒理學(xué)動物實驗中動物死亡率與給藥劑量的關(guān)系就非直線形式。當(dāng)散點圖中應(yīng)變量Y和自變量X間表現(xiàn)出非線性趨勢時,可以通過曲線擬合(curvefitting)方法來刻畫兩變量間數(shù)量上的依存關(guān)系。Dec,8,2009一、曲線擬合的基本方法據(jù)專業(yè)知識及過去經(jīng)驗(或文獻)選擇曲線類型。算術(shù)格紙、半對數(shù)格紙、雙對數(shù)格紙等,將實測數(shù)據(jù)制成點圖。目前已使用不多。如果既無前人經(jīng)驗作參考,又無合適的格紙可作散點圖趨勢分析,則可先在普通格

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負(fù)責(zé)。
  • 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時也不承擔(dān)用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

評論

0/150

提交評論