衛(wèi)生統(tǒng)計學(xué)線性相關(guān)與回歸_第1頁
衛(wèi)生統(tǒng)計學(xué)線性相關(guān)與回歸_第2頁
衛(wèi)生統(tǒng)計學(xué)線性相關(guān)與回歸_第3頁
衛(wèi)生統(tǒng)計學(xué)線性相關(guān)與回歸_第4頁
衛(wèi)生統(tǒng)計學(xué)線性相關(guān)與回歸_第5頁
已閱讀5頁,還剩19頁未讀, 繼續(xù)免費(fèi)閱讀

下載本文檔

版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進(jìn)行舉報或認(rèn)領(lǐng)

文檔簡介

衛(wèi)生統(tǒng)計學(xué)線性相關(guān)與回歸中醫(yī)科研設(shè)計與統(tǒng)計湖北中醫(yī)學(xué)院衛(wèi)生教研室1第一頁,共二十四頁,2022年,8月28日中醫(yī)科研設(shè)計與統(tǒng)計湖北中醫(yī)學(xué)院衛(wèi)生教研室2第十章線性相關(guān)與回歸第一節(jié)線性相關(guān)第二節(jié)線性回歸第三節(jié)線性相關(guān)和回歸的區(qū)別與聯(lián)系第四節(jié)等級相關(guān)第二頁,共二十四頁,2022年,8月28日中醫(yī)科研設(shè)計與統(tǒng)計湖北中醫(yī)學(xué)院衛(wèi)生教研室3概述“回歸”名稱的由來:最早由英國遺傳學(xué)家弗朗西斯·高爾頓(FrancisGalton)引入。在一篇著名的論文“FamilyLikenessinStature”中,高爾頓發(fā)現(xiàn),雖然有一個趨勢:父母高,子女也高;父母矮,子女也矮,即父母的身高對子女的身高起到?jīng)Q定性作用。但給定父母的身高,子女的平均身高卻趨向于或者“回歸”到種族人群的平均身高。換言之,盡管父母都非常高或非常矮,但兒女的身高卻有回歸到人群總體平均身高的趨勢。這就是Galton的普遍回歸定律(lawofuniversalregression)。第三頁,共二十四頁,2022年,8月28日中醫(yī)科研設(shè)計與統(tǒng)計湖北中醫(yī)學(xué)院衛(wèi)生教研室4第四頁,共二十四頁,2022年,8月28日中醫(yī)科研設(shè)計與統(tǒng)計湖北中醫(yī)學(xué)院衛(wèi)生教研室5現(xiàn)代統(tǒng)計學(xué)奠基人卡爾·皮爾遜(KarlPearson)也證明了子女身高確實“回歸到中等”(regressiontomediocrity)。他發(fā)現(xiàn),對于一個父親高的群體,兒子的平均身高通常低于他們父輩的身高;而對于一個父親矮的群體,兒子的平均身高通常高于其父輩的身高。即高的和矮的兒子身高一同“回歸”到所有男性的平均身高。皮爾遜觀察了1078對夫婦,以每對夫婦中父親的身高作為解釋變量X(自變量),取他們的一個成年兒子的身高作為被解釋變量Y(應(yīng)變量),將結(jié)果在平面直角坐標(biāo)系上繪成散點(diǎn)圖,發(fā)現(xiàn)散點(diǎn)的趨勢近乎一條直線。計算出直線回歸方程為:第五頁,共二十四頁,2022年,8月28日中醫(yī)科研設(shè)計與統(tǒng)計湖北中醫(yī)學(xué)院衛(wèi)生教研室6第六頁,共二十四頁,2022年,8月28日中醫(yī)科研設(shè)計與統(tǒng)計湖北中醫(yī)學(xué)院衛(wèi)生教研室7回歸的現(xiàn)代釋義

在普遍回歸定律中,高爾頓的興趣在于發(fā)現(xiàn)為什么人口的身高分布有一種穩(wěn)定性。但是現(xiàn)代統(tǒng)計學(xué)并不關(guān)心這種解釋,我們關(guān)心的是知道了父輩的身高,怎樣去估計或預(yù)測子女的身高?;貧w的現(xiàn)代解釋和應(yīng)用大致上可以這樣說:回歸分析是研究一種叫做被解釋變量(或稱應(yīng)變量:DependentVariable)的變量對另一種叫做解釋變量(或稱自變量:IndependentVariable)的變量之間依賴關(guān)系的統(tǒng)計方法,當(dāng)解釋變量取某個已知或設(shè)定值時,能夠估計或預(yù)測出與之相關(guān)的被解釋變量所有可能出現(xiàn)對應(yīng)值的(總體)均值。第七頁,共二十四頁,2022年,8月28日中醫(yī)科研設(shè)計與統(tǒng)計湖北中醫(yī)學(xué)院衛(wèi)生教研室8變量關(guān)聯(lián)性分析變量關(guān)系函數(shù)關(guān)系:有精確數(shù)學(xué)表達(dá)式(S=R2,C=2R)統(tǒng)計關(guān)系(非確定性關(guān)系)相關(guān)分析(確定性關(guān)系)(平等關(guān)系)多元相關(guān)分析復(fù)相關(guān)分析偏相關(guān)分析簡單相關(guān)分析:直線相關(guān)分析回歸分析(因果關(guān)系)一元回歸分析多元回歸分析直線回歸分析曲線回歸分析多元非線性回歸分析多元線性回歸分析第八頁,共二十四頁,2022年,8月28日中醫(yī)科研設(shè)計與統(tǒng)計湖北中醫(yī)學(xué)院衛(wèi)生教研室9直線相關(guān)與回歸的區(qū)別直線相關(guān)分析:研究兩隨機(jī)變量之間的是否存在線性關(guān)系,以及線性關(guān)系的性質(zhì)和強(qiáng)弱;分析的兩變量沒有自變量和應(yīng)變量之分;兩變量間是共變關(guān)系(雙向),地位是平等的;不能用一個變量去預(yù)測或控制另一個變量的變化。直線回歸分析:研究兩相關(guān)變量之間是否存在線性依存關(guān)系,以及依存關(guān)系的數(shù)量比例關(guān)系;分析的兩變量有自變量和應(yīng)變量之分;兩變量間是因果關(guān)系(單向),地位不平等的;可以用自變量來預(yù)測或控制應(yīng)變量。第九頁,共二十四頁,2022年,8月28日中醫(yī)科研設(shè)計與統(tǒng)計湖北中醫(yī)學(xué)院衛(wèi)生教研室10第一節(jié)線性相關(guān)一、二維散點(diǎn)圖例1:一個產(chǎn)科醫(yī)師發(fā)現(xiàn)孕婦尿中雌三醇含量與新生兒的體重有關(guān)。于是設(shè)想,通過測量待產(chǎn)孕婦尿液中雌三醇含量,是否可以預(yù)測新生兒體重,以便對低體重新生兒進(jìn)行預(yù)防準(zhǔn)備。因此收集了31例待產(chǎn)孕婦24小時的尿液,測量其中的雌三醇含量,同時記錄新生兒的體重。數(shù)據(jù)記錄如表1所示:第十頁,共二十四頁,2022年,8月28日中醫(yī)科研設(shè)計與統(tǒng)計湖北中醫(yī)學(xué)院衛(wèi)生教研室1131例待產(chǎn)婦尿雌三醇含量(mg/24h)與新生兒的體重(kg)編號尿雌三醇產(chǎn)兒體重編號尿雌三醇產(chǎn)兒體重172.517173.2292.518253.2392.519273.44122.720153.45142.721153.46162.722153.57162.423163.58143.024193.49163.025183.510163.126173.611173.027183.712193.128203.813213.029224.014242.830253.915153.231244.316163.2

第十一頁,共二十四頁,2022年,8月28日中醫(yī)科研設(shè)計與統(tǒng)計湖北中醫(yī)學(xué)院衛(wèi)生教研室12第十二頁,共二十四頁,2022年,8月28日中醫(yī)科研設(shè)計與統(tǒng)計湖北中醫(yī)學(xué)院衛(wèi)生教研室13二、相關(guān)關(guān)系的度量:離均差乘積和(簡稱乘積和,Sumofproducts)SPxy>0:正相關(guān)SPxy<0:負(fù)相關(guān)SPxy=0:無相關(guān)或非線性相關(guān)缺點(diǎn):SPxy的大小與樣本含量有關(guān)第十三頁,共二十四頁,2022年,8月28日中醫(yī)科研設(shè)計與統(tǒng)計湖北中醫(yī)學(xué)院衛(wèi)生教研室14協(xié)方差(covariance):離均差乘積和除以自由度Cov(x,y)>0:正相關(guān)Cov(x,y)<0:負(fù)相關(guān)Cov(x,y)=0:無相關(guān)或非線性相關(guān)缺點(diǎn):Cov的大小受變量取值尺度(數(shù)量級)的影響 Cov有單位(量綱),不同單位資料不能比較第十四頁,共二十四頁,2022年,8月28日中醫(yī)科研設(shè)計與統(tǒng)計湖北中醫(yī)學(xué)院衛(wèi)生教研室15皮爾遜相關(guān)系數(shù):將協(xié)方差標(biāo)準(zhǔn)化(Pearsoncorrelationcoefficient)又稱為皮爾遜積差相關(guān)系數(shù)(Pearsonproductmomentcorrelationcoefficient)第十五頁,共二十四頁,2022年,8月28日中醫(yī)科研設(shè)計與統(tǒng)計湖北中醫(yī)學(xué)院衛(wèi)生教研室16相關(guān)系數(shù)的性質(zhì)相關(guān)系數(shù)的定義閾:-1≤r≤1,其中絕對值大小反映了兩隨機(jī)變量之間相關(guān)關(guān)系的密切程度,而正負(fù)則反映了相關(guān)關(guān)系的方向。+1>r>0:正相關(guān)-1<r<0:負(fù)相關(guān)

r=0:零相關(guān)或無相關(guān)

r=+1:完全正相關(guān)

r=-1:完全負(fù)相關(guān)生物界影響因素眾多,|r|值為l的機(jī)會極為罕見,因而很少有完全相關(guān)。在醫(yī)學(xué)數(shù)據(jù)中經(jīng)常見到的是r值介于-1與+l之間,即不完全相關(guān)。第十六頁,共二十四頁,2022年,8月28日中醫(yī)科研設(shè)計與統(tǒng)計湖北中醫(yī)學(xué)院衛(wèi)生教研室17相關(guān)關(guān)系示意圖r=0(h)r=0(g)r=-1(d)r=1(c)0<r<1(a)-1<r<0(b)r0(e)r0(f)零相關(guān)正相關(guān)負(fù)相關(guān)完全正相關(guān)完全負(fù)相關(guān)零相關(guān)零相關(guān)零相關(guān)第十七頁,共二十四頁,2022年,8月28日中醫(yī)科研設(shè)計與統(tǒng)計湖北中醫(yī)學(xué)院衛(wèi)生教研室18計算例1資料的相關(guān)系數(shù)∑x=534,∑y=99.2∑x2=9876,∑y2=324.18,∑xy=1750,n=31從計算結(jié)果可以知道,31例待產(chǎn)婦尿中雌三醇含量與新生兒體重之間呈正相關(guān),相關(guān)系數(shù)是0.6097。問題:能否得出結(jié)論,即待產(chǎn)婦尿中雌三醇含量與新生兒體重之間呈正相關(guān),相關(guān)系數(shù)就是0.6097?第十八頁,共二十四頁,2022年,8月28日中醫(yī)科研設(shè)計與統(tǒng)計湖北中醫(yī)學(xué)院衛(wèi)生教研室19相關(guān)系數(shù)的假設(shè)檢驗上例中的相關(guān)系數(shù)r等于0.6097不為0,說明了31例樣本中雌三醇含量與出生體重之間存在相關(guān)關(guān)系。但是,這31例只是總體中的一個樣本,由此得到的相關(guān)系數(shù)必然會存在抽樣誤差。因為:即使總體相關(guān)系數(shù)為零時,由于抽樣誤差,從總體抽出的31例樣本,其相關(guān)系數(shù)r也可能不等于零。所以,我們必須對該樣本所代表總體的相關(guān)系數(shù)是否為0進(jìn)行假設(shè)檢驗,判斷r不等于零是由于抽樣誤差所致,還是兩個變量之間確實存在相關(guān)關(guān)系。第十九頁,共二十四頁,2022年,8月28日中醫(yī)科研設(shè)計與統(tǒng)計湖北中醫(yī)學(xué)院衛(wèi)生教研室201.查表法:以自由度v=n-2直接查r界值表。查t界值表t0.05(29)=2.045v雙側(cè)0.500.200.100.050.020.010.0050.0020.001單側(cè)0.250.100.050.0250.010.0050.00250.0010.0005260.1330.2500.3170.3740.4370.4790.5150.5590.588270.1310.2450.3110.3670.4300.4710.5070.5500.579280.1280.2410.3060.3610.4230.4630.4990.5410.570290.1260.2370.3010.3550.4160.4560.4910.5330.562300.1240.2330.2960.3490.4090.4490.4840.5260.554第二十頁,共二十四頁,2022年,8月28日中醫(yī)科研設(shè)計與統(tǒng)計湖北中醫(yī)學(xué)院衛(wèi)生教研室212.t檢驗:H0:=0,雌三醇含量與出生體重不存在相關(guān)關(guān)系H1:≠0,雌三醇含量與出生體重存在相關(guān)關(guān)系α=0.05查t界值表t0.05(29)=2.045<t,在α=0.05水準(zhǔn)拒絕H0,認(rèn)為總體相關(guān)系數(shù)不為零,雌三醇含量與新生兒出生體重之間存在線性相關(guān)關(guān)系。第二十一頁,共二十四頁,2022年,8月28日中醫(yī)科研設(shè)計與統(tǒng)計湖北中醫(yī)學(xué)院衛(wèi)生教研室223.F檢驗(方差分析):F0.05(1,29)=4.18將y的總平方和分解為相關(guān)平方和和非相關(guān)平方和。第二十二頁,共二十四頁,2022年,8月28日

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負(fù)責(zé)。
  • 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時也不承擔(dān)用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

評論

0/150

提交評論