版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進行舉報或認領(lǐng)
文檔簡介
1、第十一章 線性相關(guān)與回歸教師:衛(wèi)生統(tǒng)計教研室 胡冬梅世間萬物是普遍聯(lián)系的醫(yī)學上,許多現(xiàn)象之間也都有相互聯(lián)系糖尿病病人的血糖與胰島素水平的關(guān)系;某人群年齡與收縮壓的關(guān)系;兒童身高與體重的關(guān)系;動物實驗中動物進食量與增加體重的關(guān)系等。常用回歸與相關(guān)分析,屬雙變量分析范疇(bivariate analysis)。相關(guān)就是用于研究和解釋兩個變量之間相互關(guān)系的,給兩個變量定性?;貧w是設法找出變量間的依存變化(數(shù)量)關(guān)系, 用函數(shù)關(guān)系式表達出來,給出兩個或多個變量的定量的關(guān)系第一節(jié) 線性相關(guān)相關(guān)關(guān)系當一個變量增大,另一個也隨之增大(或減少),我們稱這種現(xiàn)象為共變,或相關(guān)(correlation)。兩個變量
2、有共變現(xiàn)象,稱為有相關(guān)關(guān)系。 相關(guān)關(guān)系不一定是因果關(guān)系。相關(guān)分析的任務:兩變量間有無相關(guān)關(guān)系?兩變量間如有相關(guān)關(guān)系,相關(guān)的方向?相關(guān)的程度?直線相關(guān)的資料要求:直線相關(guān)(linear correlation),又稱簡單相關(guān),用于雙變量正態(tài)分布資料。例如,同性別成人的身高與體重的關(guān)系:對某一身高(如女性160cm),體重為正態(tài)分布;對某一體重(如女性50kg),身高為正態(tài)分布。主要內(nèi)容一、散點圖二、相關(guān)系數(shù)三、相關(guān)注意事項一、散點圖 為了確定相關(guān)變量之間的關(guān)系,首先應該收集一些數(shù)據(jù),這些數(shù)據(jù)應該是成對的。例如,每人的身高和體重。然后在直角坐標系上描述這些點,這一組點集稱為散點圖。作法:為了研究父
3、親與成年兒子身高之間的關(guān)系,卡爾.皮爾遜測量了1078對父子的身高。把1078對數(shù)字表示在坐標上,如圖。用水平軸X上的數(shù)代表父親身高,垂直軸Y上的數(shù)代表兒子的身高,1078個點所形成的圖形是一個散點圖。它的形狀象一塊橄欖狀的云,中間的點密集,邊沿的點稀少,其主要部分是一個橢圓。 作用:粗略地給出了兩個變量的關(guān)聯(lián)類型與程度相關(guān)類型:二、相關(guān)系數(shù)相關(guān)系數(shù)(correlation coefficient)是衡量兩個連續(xù)變量之間關(guān)聯(lián)的強度的指標,樣本的相關(guān)系數(shù)用r 表示,總體的相關(guān)系數(shù)用表示。相關(guān)系數(shù)取值: -1相關(guān)系數(shù)1二、相關(guān)系數(shù)正相關(guān): 0r1,散點云圖是斜向上的,這時一個變量增加,另一個變量也
4、增加;負相關(guān):-1r0,散點云圖是斜向下的,此時一個變量增加,另一個變量將減少。二、相關(guān)系數(shù)相關(guān)系數(shù)的絕對值越接近1,兩變量的關(guān)聯(lián)程度越強,相關(guān)系數(shù)的絕對值越接近0,兩變量的關(guān)聯(lián)程度越弱。010.40.7低度相關(guān)中度相關(guān)高度相關(guān)相關(guān)系數(shù)計算公式: Pearson原理:取圖形的中心點O( ),任意一點P(x,y) 例11.2 從男青年總體中隨機抽取11名男青年組成樣本,分別測量每個男青年的身高和前臂長,身高和前臂長均以cm為單位,測量結(jié)果如下表所示,試計算身高與前臂長之間的相關(guān)系數(shù)。 編號身高(cm)前臂長(cm)XYX2Y2(X)(Y)1 170 47 7990 2890022092 173
5、42 7266 2992917643 160 44 7040 2560019364 155 41 6355 2402516815 173 47 8131 2992922096 188 50 9400 3534425007 178 47 8366 3168422098 183 46 8418 3348921169 180 49 8820 32400240110 165 43 7095 27225184911 166 44 3174 285612116合計18915008618532608122810三、相關(guān)系數(shù)的顯著性檢驗 與前面講的其它統(tǒng)計量一樣,根據(jù)樣本資料計算出來的相關(guān)系數(shù)同樣存在抽樣誤差
6、。即假設在一個X與Y無關(guān)總體中作隨機抽樣,由于抽樣誤差的影響,所得的樣本相關(guān)系數(shù)也常常不等于零。 因此要判斷兩個變量X與Y是否真的存在相關(guān)關(guān)系,仍需根據(jù)作總體相關(guān)系數(shù)是否為零的假設檢驗。 相關(guān)系數(shù)的假設檢驗查表法 當n52,v=n-2,查r界值表,得到P值t檢驗法 當n52,計算檢驗統(tǒng)計量tr,查t界值表,得到P值 例11.2所得的 值檢驗男青年身高與前臂長之間是否存在相關(guān)關(guān)系?相關(guān)注意事項線性相關(guān)的前提條件是X、Y都服從正態(tài)分布(雙變量正態(tài)分布)必須在假設檢驗認為相關(guān)的前提下才能以r的大小判斷相關(guān)程度相關(guān)關(guān)系并不一定是因果關(guān)系,有可能是伴隨關(guān)系前面我們討論了身高和前臂長之間的關(guān)系,知道了二者
7、之間成正相關(guān)。那么,如果我們知道了一人的身高,能推斷出其前臂長嗎?或前臂長可能在什么范圍內(nèi)呢?還有,隨著身高的增加,體重也在增大,它們之間也成正相關(guān)關(guān)系。那么,身高每增加1厘米,體重增加多少克呢?上面的相關(guān)關(guān)系分析不能提供給我們需要的答案。這些要用直線回歸的方法來解決。第二節(jié) 線性回歸主要內(nèi)容一、線性回歸基本概念二、線性回歸方程計算三、線性回歸方程的假設檢驗四、回歸注意事項一、線性回歸基本概念自變量(X):容易得到的、變化小的量,原因因變量(Y):不容易得到的、變化大的變量、結(jié)果當兩個變量存在準確、嚴格的直線關(guān)系時,可以用Y=a+bX,表示兩者的函數(shù)關(guān)系,但在實際生活當中,由于其它因素的干擾,
8、許多雙變量之間的關(guān)系并不是嚴格的函數(shù)關(guān)系,不能用函數(shù)方程反映,為了區(qū)別于兩變量間的函數(shù)方程,我們稱這種關(guān)系式為直線回歸方程,這種關(guān)系為直線回歸. 二、線性回歸方程的計算式中的 是由自變量X推算應變量Y的估計值,a是回歸直線在Y 軸上的截距,即X=0時的Y值;b為樣本的回歸系數(shù),即回歸直線的斜率,表示當X變動一個單位時,Y平均變動b個單位。計算原理:最小二乘法,即保證各實測點到回歸直線的縱向距離的平方和最小,并使計算出的回歸方程最能代表實測數(shù)據(jù)所反映出的直線趨勢。二、線性回歸方程的計算 例 有人研究了溫度對蛙的心率的影響,得到了下表中所示的資料,試進行回歸分析。對象溫度(X) 心率(Y) XY
9、X2Y21 2 5 10 4 252 4 11 44 16 1213 6 11 66 36 1214 8 14 112 64 196510 22 220 100 484612 23 276 144 529714 32 448 1961024816 29 464 256 841918 32 576 32410241020 34 680 40011561122 33 726 4841089合計132246362220246610根據(jù)表中數(shù)據(jù)繪制散點圖,如下圖所示:2.計算回歸系數(shù)與常數(shù)項 在本例中: 則,回歸方程為3. 作回歸直線三、回歸方程的假設檢驗與直線相關(guān)一樣,直線回歸方程也是從樣本資料計算
10、而得的,同樣也存在著抽樣誤差問題。所以,需要對樣本的回歸系數(shù)b進行假設檢驗,以判斷b是否從回歸系數(shù)為零的總體中抽得。為了判斷抽樣誤差的影響,需對回歸系數(shù)進行假設檢驗??傮w的回歸系數(shù)一般用表示。 H0:=0 回歸方程無意義 H1:0 回歸方程有意義 =0.05選擇合適的假設檢驗方法(方差分析或t檢驗),計算統(tǒng)計量計算概率值P做出推論:統(tǒng)計學結(jié)論和專業(yè)結(jié)論回歸方程檢驗:方差分析法基本思想:Y值的變異可用 表示, 為離均差平方和,又稱總平方和,表示Y總的變異,用SS總表示; 稱回歸平方和,表示在Y總的變異中,可以用X與Y的線性關(guān)系一起Y變異來解釋的部分,可用SS回歸表示; 稱離均差平方和或殘差平方和
11、,說明除X對Y的線性影響之外的一切其他隨機因素對Y的影響,可用SS剩余表示?;貧w方程檢驗:方差分析法因變量總變異的分解X P (X,Y)Y回歸系數(shù)檢驗的基本思想如果X與Y無線性回歸關(guān)系,在SS回歸和SS剩余都是其他隨機因素對Y的影響,由此,MS回歸MS剩余,總體回歸系數(shù)=0,反之, 0。所以用F檢驗對X與Y之間有無回歸關(guān)系進行檢驗。公式:自由度:回歸系數(shù)檢驗:t檢驗法基本思想同樣本均數(shù)與總體均數(shù)的比較t檢驗 Sb是樣本回歸系數(shù)的標準誤,反映樣本回歸系數(shù)與總體回歸系數(shù)之間的抽樣誤差,SY*X為剩余標準差,表示Y對于回歸直線的離散程度四、線性回歸分析的注意事項 只有將兩個內(nèi)在有聯(lián)系的變量放在一起進
12、行回歸分析才是有意義的。 作回歸分析時,如果兩個有內(nèi)在聯(lián)系的變量之間存在的是一種依存因果的關(guān)系,那么應該以“因”的變量為X ,以“果”的變量為Y 。如果變量之間并無因果關(guān)系,則應以易于測定、較為穩(wěn)定或變異較小者為X 。 在回歸分析中,因變量是隨機變量,自變量既可以是隨機變量(II型回歸模型,兩個變量應該都服從正態(tài)分布),也可以是給定的量(I型回歸模型,這時,與每個X 取值相對應的變量Y必須服從正態(tài)分布),如果數(shù)據(jù)不符合要求,在進行回歸分析前,必須先進行變量的變換。 回歸方程建立后必須作假設檢驗,只有經(jīng)假設檢驗拒絕了無效假設,回歸方程才有意義。 使用回歸方程計算估計值時,不可把估計的范圍擴大到建
13、立方程時的自變量的取值范圍之外。 第三節(jié) 線性相關(guān)和回歸的 區(qū)別和聯(lián)系一、線性相關(guān)與回歸的區(qū)別 相關(guān)系數(shù)的計算只適用于兩個變量都服從正態(tài)分布的情形,而在回歸分析中,因變量是隨機變量,自變量既可以是隨機變量(II型回歸模型,兩個變量都應該服從正態(tài)分布),也可以是給定的量(I型回歸模型,這時,與每個X 取值相對應的變量Y必須服從正態(tài)分布)。 線性相關(guān)表示兩個變量之間的相互關(guān)系是雙向的,回歸則反映兩個變量之間的依存關(guān)系,是單向的。 二、線性相關(guān)與回歸的聯(lián)系1. 如果對同一資料進行相關(guān)與回歸分析,則得到的相關(guān)系數(shù)r與回歸方程中的b正負號是相同的。2. 在相關(guān)分析中,求出r后要進行假設檢驗,同樣,在回歸
14、分析中,對b也要進行假設檢驗。實際上,通過數(shù)學推導,對同一樣本可以得出r與b互化的公式,同一樣本的這兩種假設檢驗也是等價的。因此,由于r的假設檢驗可以直接查表,較為簡單,所以可以用其代替對b的假設檢驗。 r與b的符號一致,檢驗等價3. 相關(guān)回歸可以互相解釋。R 的平方稱為確定系數(shù) (coefficient of determination)應用確定系數(shù),也可以從回歸的角度對相關(guān)程度做進一步的了解。二、線性相關(guān)與回歸的聯(lián)系 第四節(jié) 等級相關(guān)如果觀測值是等級資料,則可以用等級相關(guān)來 表達兩事物之間的關(guān)系。等級相關(guān)是分析X、Y 兩變量等級間是否相關(guān)的一種非參數(shù)方法。常用的等級相關(guān)方法是Spearma
15、n等級相關(guān)。與線性相關(guān)系數(shù)r 一樣,等級相關(guān)系數(shù) rs的數(shù)值亦在 -1與 +1之間,數(shù)值為正表示正相關(guān),數(shù)值為負表示負相關(guān)。 一、等級相關(guān)系數(shù)的計算 Spearman 等級相關(guān)系數(shù) rs 可由公式計算式中,n 表示樣本含量; d 表示 X、Y 的秩次之差。例10.4 某醫(yī)生做一種研究,欲了解人群中氟骨癥患病率(%)與飲用水中氟含量(mg/l)之間的關(guān)系。隨機觀察8個地區(qū)氟骨癥患病率與飲用水中氟含量,數(shù)據(jù)如表10-4(2)、(4)兩欄。試計算等級相關(guān)系數(shù)rs。2.差數(shù)d,見(6)欄,注意3.算d2見(7)欄,本例 4.代入公式(10-18)計算 rs若資料中相同觀察值的例數(shù)較多時,計算的結(jié)果偏差較大,此時可由公式 計算校正的 rs 值 rs。 二、等級相關(guān)系數(shù)的顯著性檢驗 rs 是由樣本資料計算出的相關(guān)系數(shù),亦存在抽樣誤差問題,故要推斷總體中兩變量間有無線性相關(guān)關(guān)系,須經(jīng)假設檢驗。 檢驗步驟 1.
溫馨提示
- 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
- 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預覽,若沒有圖紙預覽就沒有圖紙。
- 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
- 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負責。
- 6. 下載文件中如有侵權(quán)或不適當內(nèi)容,請與我們聯(lián)系,我們立即糾正。
- 7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。
最新文檔
- 二零二五年度創(chuàng)意產(chǎn)業(yè)園區(qū)廠房租賃合同續(xù)簽與品牌推廣協(xié)議4篇
- 專項商鋪租賃更新協(xié)議2024版
- 2025合同模板船舶碰撞仲裁協(xié)議范本
- 2025年度出租車大包車合同模板升級版3篇
- 二零二五年度櫥柜工程承包與智能家居系統(tǒng)融合協(xié)議4篇
- 二零二四年法律服務熱線錄音協(xié)議3篇
- 二零二五年度儲罐安裝與安全培訓合同4篇
- 2025年度智慧農(nóng)業(yè)項目個人經(jīng)營承包合同4篇
- 2025年度漁業(yè)科技示范園承包合同4篇
- 二零二四年度宿管員宿舍綜合服務與考核評價合同3篇
- 2024版塑料購銷合同范本買賣
- 2024-2025學年人教新版高二(上)英語寒假作業(yè)(五)
- JJF 2184-2025電子計價秤型式評價大綱(試行)
- GB/T 44890-2024行政許可工作規(guī)范
- 2024年安徽省中考數(shù)學試卷含答案
- 2025屆山東省德州市物理高三第一學期期末調(diào)研模擬試題含解析
- 2024年滬教版一年級上學期語文期末復習習題
- 兩人退股協(xié)議書范文合伙人簽字
- 2024版【人教精通版】小學英語六年級下冊全冊教案
- 汽車噴漆勞務外包合同范本
- 微項目 探討如何利用工業(yè)廢氣中的二氧化碳合成甲醇-2025年高考化學選擇性必修第一冊(魯科版)
評論
0/150
提交評論