線性相關(guān)與線性回歸分析_第1頁
線性相關(guān)與線性回歸分析_第2頁
線性相關(guān)與線性回歸分析_第3頁
線性相關(guān)與線性回歸分析_第4頁
線性相關(guān)與線性回歸分析_第5頁
已閱讀5頁,還剩38頁未讀, 繼續(xù)免費閱讀

下載本文檔

版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進行舉報或認領(lǐng)

文檔簡介

第五章線性相關(guān)與線性回歸分析1.相關(guān)分析原理2.Bivariate過程3.回歸分析原理4.Regression過程5.1一元相關(guān)與回歸5.2多元回歸方程例

測某地10名三歲兒童的體重X(kg)與體表面積Y(10-1m2),體重11.011.812.012.313.113.714.414.915.216.0體表5.2835.2995.3585.6025.2926.0145.8306.1026.0756.411判斷X和Y是否是線性相關(guān)的。5.1相關(guān)分析原理1.直線相關(guān):(1)兩個變量均服從正態(tài)分布

總體相關(guān)系數(shù):樣本相關(guān)系數(shù):r絕對值愈接近1,兩個變量間的線性相關(guān)越密切r絕對值越接近0,兩個變量間的線性相關(guān)越不密切性質(zhì):Pearson簡單相關(guān)分析相關(guān)系數(shù)的檢驗原假設(shè)則:()×(2)如果不服從正態(tài)分布,則應(yīng)考慮變量變換,或采用等級相關(guān)來分析。Spearman等級相關(guān)Kendall等級相關(guān)注:列聯(lián)表可用“Crosstabs過程”中的“ContingencyCoefficient”

計算Pearson列聯(lián)相關(guān)系數(shù)2.曲線相關(guān):兩變量存在相關(guān)趨勢,但非線性,而是呈某種可能的曲線趨勢。一般都先將變量變換,再將趨勢變換為直線來分析,或者采用曲線回歸方法來分析。5.2Bivariate過程例

某次體檢中抽取12名學生的體重和血壓,現(xiàn)通過相關(guān)分析過程來觀測學生的體重與血壓是否相關(guān)?體重68485660835662597758血壓95988796110155135128113168目的:檢驗問題:兩變量數(shù)據(jù)是否服從正態(tài)分布?(需提前進行)是Pearson相關(guān)分析否數(shù)據(jù)轉(zhuǎn)換或進行等級相關(guān)分析

實現(xiàn)步驟:1.將數(shù)據(jù)錄入SPSS并整理加工定義變量輸入數(shù)據(jù)保存weight:體重;pressure:血壓;保存為:“體重與血壓.sav”2.正態(tài)性檢驗:Analyze|DescriptiveStatistics|Explore(探索性)可以認為體重值、血壓值服從正態(tài)分布?!綱ariables框】用于選入需要進行相關(guān)分析的變量,至少需要選入兩個?!綜orrelationCoefficients

復(fù)選框組】用于選擇需要計算的相關(guān)分析指標?!綟lagsignificantcorrelations】用于確定是否在結(jié)果中用星號標記有統(tǒng)計學意義的相關(guān)系數(shù),一般選中。此時P<0.05的系數(shù)值旁會標記一個星號,P<0.01的則標記兩個星號。將“體重[weight]”、“血壓[pressure]”點入“Variables”框,點擊“Options”按鈕。

3.相關(guān)分析過程菜單“Analyze”|“Correlate

”|“Bivariate”命令【Options鈕】彈出Options對話框,選擇需要計算的描述統(tǒng)計量和統(tǒng)計分析:選擇“Meansandstandarddeviations”,點擊“Continue”返回上一層對話框。點擊“OK”按鈕

結(jié)果輸出和討論:分析:左圖給出了體重和血壓的平均值、標準差和樣本數(shù)目。分析:Pearson相關(guān)系數(shù)r為-0.112,即兩者是微弱相關(guān)的,但P=0.728>0.05,所以不能認為二者相關(guān)。即不存在直線相關(guān)關(guān)系。(反映了觀測值總的分散程度)(回歸平方和

)反映了回歸值的分散程度(由于線性影響引起的離散性)(剩余平方和)反映了觀測值偏離回歸直線的程度(由于隨機誤差引起的離散性)5.3回歸分析原理F檢驗:

H0:β=0()當時:或決定系數(shù)R2=SS回/SS總=1-SS剩/SS總

0≤R2≤1,越接近于1,回歸效果越好。臨床:R2≥0.7就認為回歸效果不錯高精度醫(yī)藥實驗研究:R2>0.9R2=r2一元線性回歸方程中:越接近于1,回歸效果越好。校正決定系數(shù)1-MS剩/MS總例

測某地10名三歲兒童的體重X(kg)與體表面積Y(10-1m2),體重11.011.812.012.313.113.714.414.915.216.0體表5.2835.2995.3585.6025.2926.0145.8306.1026.0756.411做體表Y關(guān)于體重X的回歸方程。做散點圖建立回歸方程并檢驗

實現(xiàn)步驟:保存為:“體重與體表.sav”x:體重;y:體表;1.將數(shù)據(jù)錄入SPSS并整理加工定義變量輸入數(shù)據(jù)保存2.利用Scatter/Dot命令做散點圖菜單“Graphs”|“Legacy

Dialogs”|“Scatter/Dot”點擊“simple

scatter”命令,點擊“Define”按鈕。將“體重[x]”變量選入“XAxis”框,將“體表[y]”選入“YAxis”框中,點擊“OK”按鈕輸出結(jié)果。(2)正態(tài)性檢驗:Analyze|DescriptiveStatistics|Explore(探索性)3.Regression過程菜單“Analyze”|“Regression

”|“l(fā)inear”命令將“體表[y]”選入【Dependent框】;將“體重[x]”選入【Independent(s)框】中,點擊“Statistics”按鈕Enter

強迫進入Stepwise

逐步回歸Remove

只出不進Backward

向后剔除,只出不進Forward

向前選擇,只進不出【Modelfit】輸出復(fù)相關(guān)系數(shù)R,其平方,校正決定系數(shù)和標準差,以及方差分析表。選擇“Estimates”、“Confidenceinterval”、“Modelfit”、“Descriptives”,點擊“continue”返回?!綞stimates】

輸出有關(guān)回歸系數(shù)和相關(guān)測量【Confidenceinterval】輸出回歸系數(shù)95%的置信區(qū)間【Descriptives】描述性統(tǒng)計量點擊“OK”按鈕輸出結(jié)果分析:給出了體表和體重的均數(shù)和標準差情況。分析:此表給出了體重和體表的相關(guān)系數(shù)陣和P值。

結(jié)果輸出和討論:分析:R=0.918(即相關(guān)系數(shù)r),決定系數(shù)校正的決定系數(shù)為0.823,估計值的標準誤差為0.17434分析:可見回歸平方和為1.301,剩余平方和為0.243,F(xiàn)=42.798,P=0.000<0.05,拒絕原假設(shè),認為是線性相關(guān)的,即回歸方程有意義。分析:非標準化系數(shù),t統(tǒng)計量分別為5.616和6.542,其P值分別為0.001和0.000,均小于0.005,有顯著性意義。其回歸方程為

多元線性回歸分析

研究在線性相關(guān)條件下,兩個或兩個以上自變量對一個因變量的數(shù)量變化關(guān)系,稱為多元線性回歸分析。多元線性回歸模型是一元線性回歸模型的擴展,其基本原理與一元線性回歸模型類似,在計算上更為復(fù)雜,一般需借助計算機來完成。是偏回歸系數(shù)編號載脂蛋白AI(mg/dl)載脂蛋白B(mg/dl)載脂蛋白E

(mg/dl)載脂蛋白C(mg/dl)膽固醇含量(mg/dl)11731067.014.76221391326.417.84331981126.916.78141181387.115.7395139948.613.651617516012.120.365713115411.221.54081581419.729.642有研究認為血清中高密度脂蛋白降低是引起動脈硬化的一個重要原因,現(xiàn)測量了30名被懷疑患有動脈硬化的就診患者的載脂蛋白AⅠ、載脂蛋白B、載脂蛋白E、載脂蛋白C和高密度脂蛋白中的膽固醇含量,資料見表,分析四種載脂蛋白對高密度脂蛋白中膽固醇含量的影響。91581377.418.256101321517.517.237111621106.015.9701214411310.142.841131621377.220.756141691298.516.758151291386.310.1471616614811.533.449171851186.017.569181551216.120.457191751114.127.274201361109.426.039211531338.516.965221101499.524.74023160865.310.857241121238.016.634251471108.518.454262041226.121.072271311026.613.451281701278.424.762291731238.719.0853013213113.829.238

實現(xiàn)步驟:x1:載脂蛋白AI;X2:載脂蛋白B;X3:載脂蛋白EX4:載脂蛋白C;y:膽固醇含量。1.將數(shù)據(jù)錄入SPSS并整理加工定義變量輸入數(shù)據(jù)保存2.正態(tài)性檢驗:Analyze|DescriptiveStatistics|Explore(探索性)3.Regression過程菜單“Analyze”|“Regression

”|“l(fā)inear”命令將“y”選入【Dependent框】;將“x1、x2、x3、x4選入【Independent(s)框】中在methods中選擇“stepwise”。點擊“Statistics”按鈕選擇“Estimates”、“Confideceinterval”、“Modelfit”、“Descriptives”,點擊“continue”返回?!綩ptions鈕】選擇進入或排除變量的顯著水平此處因為是stepwise(逐步回歸),所以entry填0.10Removal填0.15.點擊continue回到主對話框。點擊“OK”按鈕

結(jié)果輸出和討論:其回歸方程為分析:非標準化系數(shù),標準化回歸方程為小結(jié)

一元線性回歸只涉及一個自變量的回歸問題;

多元線性回歸用于解決兩個或兩個以上自變量對一個因變量的數(shù)量變化關(guān)系問題;

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負責。
  • 6. 下載文件中如有侵權(quán)或不適當內(nèi)容,請與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

最新文檔

評論

0/150

提交評論