版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請(qǐng)進(jìn)行舉報(bào)或認(rèn)領(lǐng)
文檔簡(jiǎn)介
直線相關(guān)與回歸第一頁,共五十七頁,編輯于2023年,星期一
一、直線相關(guān)【目的】
掌握直線相關(guān)的作用、應(yīng)用前提掌握線性相關(guān)SPSS操作方法正確解釋線性相關(guān)的輸出結(jié)果第二頁,共五十七頁,編輯于2023年,星期一【原理】直線相關(guān)是分析兩個(gè)不分主次的變量間的線性相關(guān)關(guān)系,適用于雙變量正態(tài)分布的資料。相關(guān)并不表示一個(gè)變量的改變是另一個(gè)變量變化的原因,也有可能同時(shí)受另一個(gè)因素的影響。相關(guān)分析的任務(wù)是對(duì)相關(guān)關(guān)系給出定量的描述。通常用Pearson相關(guān)系數(shù)來定量地描述線性相關(guān)的程度。第三頁,共五十七頁,編輯于2023年,星期一相關(guān)種類相關(guān)不相關(guān)第四頁,共五十七頁,編輯于2023年,星期一相關(guān)系數(shù)沒有量綱,且-1r1。當(dāng)r>0,且H0(ρ=0)被拒絕時(shí),認(rèn)為兩變量之間呈正相關(guān)關(guān)系;當(dāng)r<0,且H0(ρ=0)被拒絕時(shí),認(rèn)為兩變量之間呈負(fù)相關(guān)關(guān)系;當(dāng)r值接近于零,且H0(ρ=0)被接受時(shí),認(rèn)為兩變量之間不呈直線關(guān)系,但不能排除兩變量之間可能存在某種曲線關(guān)系。第五頁,共五十七頁,編輯于2023年,星期一線性相關(guān)的注意事項(xiàng)person相關(guān)系數(shù)的計(jì)算要求兩個(gè)變量都服從正態(tài)分布,并且在作相關(guān)分析時(shí),一般先作散點(diǎn)圖,考慮是否有可能直線相關(guān)。相關(guān)系數(shù)需要做假設(shè)檢驗(yàn)。如果變量X和Y不服從雙變量正態(tài)分布,或均為多分類有序資料,可以用Spearman秩相關(guān)相關(guān)關(guān)系不一定是因果關(guān)系,可能僅是表面上的伴隨關(guān)系,或兩個(gè)變量同時(shí)受另一因素的影響,如小孩的身高和小樹的樹高同時(shí)受時(shí)間的影響,在校兒童的鞋的大小和閱讀技能同時(shí)受年齡的影響。第六頁,共五十七頁,編輯于2023年,星期一【操作步驟】路徑:Analyze—>Correlate—>Bivariate…—>將分析變量選入Variables中,
—>在CorrelationCoefficients中選擇Pearson—>在TestofSignificance中選擇Two-tailed(雙側(cè)檢驗(yàn))—>OK。第七頁,共五十七頁,編輯于2023年,星期一例8-1.某地10名一年級(jí)女大學(xué)生的胸圍(cm)與肺活量(L)數(shù)據(jù)見下表,試分析兩個(gè)變量有無線性相關(guān)關(guān)系?表8-1某地10名一年級(jí)女大學(xué)生的胸圍(cm)與肺活量(L)第八頁,共五十七頁,編輯于2023年,星期一【操作步驟】1.建立SPSS數(shù)據(jù)文件,如圖8-1所示圖8-1數(shù)據(jù)庫文件第九頁,共五十七頁,編輯于2023年,星期一2.繪制散點(diǎn)圖,直觀判斷兩個(gè)變量之間有無線性關(guān)系
Graphs—>Scatter/Dot…—>SimpleScatter—>Define,將胸圍選入XAxis中,將肺活量選入YAxis中—>Titles…—>在Title的Line1中輸入散點(diǎn)圖的標(biāo)題—>Continue—>OK。第十頁,共五十七頁,編輯于2023年,星期一圖8-210名女大學(xué)生胸圍與肺活量散點(diǎn)圖結(jié)果解釋:從圖中可以看出,胸圍和肺活量似乎沒有線性關(guān)系,但是具體結(jié)論要通過以下步驟的分析才能得到。第十一頁,共五十七頁,編輯于2023年,星期一3.對(duì)兩變量進(jìn)行正態(tài)性判斷
analyze—>descriptivestatistics—>explore—>“胸圍”、“肺活量”導(dǎo)入dependentlist—>plots選項(xiàng)—>選中Normalityplotswithtests—>continue—>ok圖8-3變量正態(tài)性檢驗(yàn)結(jié)果結(jié)果分析,兩變量均符合正態(tài)分布。第十二頁,共五十七頁,編輯于2023年,星期一4.線性相關(guān)分析
Analyze—>Correlate—>Bivariate…—>將“胸圍”、“肺活量”選入Variables中—>在CorrelationCoefficients中選擇Pearson—>在TestofSignificance中選擇Two-tailed(雙側(cè)檢驗(yàn))—>選擇Flagsignificantcorrelations—>OK。第十三頁,共五十七頁,編輯于2023年,星期一變量X和Y不服從雙變量正態(tài)分布,或均為多分類有序資料,可以用Spearman秩相關(guān)第十四頁,共五十七頁,編輯于2023年,星期一主要輸出結(jié)果:圖8-6correlations結(jié)果胸圍與肺活量之間的相關(guān)系數(shù)為0.504,P=0.138,無統(tǒng)計(jì)學(xué)意義,那么我們可以認(rèn)為女大學(xué)生胸圍與肺活量之間不存在線性相關(guān)性。第十五頁,共五十七頁,編輯于2023年,星期一
Spearman秩相關(guān)補(bǔ)充例題
某醫(yī)生收集12例急性腦梗死(AMI)病人,記錄了患者在搶救期間的總膽固醇,用愛丁堡-斯堪的納維亞神經(jīng)病學(xué)卒中SNSS量表評(píng)分標(biāo)準(zhǔn)評(píng)定患者的神經(jīng)功能缺損程度,試分析總膽固醇與神經(jīng)功能評(píng)分是否相關(guān)。第十六頁,共五十七頁,編輯于2023年,星期一量表評(píng)分X總膽固醇Y104.04446.21154.83195.23144.71124.44154.38113.73996.00114.38124.00114.36表12例AMI患者的量表評(píng)分與膽固醇測(cè)量值第十七頁,共五十七頁,編輯于2023年,星期一建立數(shù)據(jù)庫設(shè)立兩個(gè)變量X和Y,X代表量表評(píng)分,Y代表總膽固醇正態(tài)性檢驗(yàn)Spearman秩相關(guān)第十八頁,共五十七頁,編輯于2023年,星期一建立數(shù)據(jù)庫第十九頁,共五十七頁,編輯于2023年,星期一正態(tài)性檢驗(yàn)P=0.000<0.05,差異有統(tǒng)計(jì)學(xué)意義結(jié)果分析,兩變量均不符合正態(tài)分布。第二十頁,共五十七頁,編輯于2023年,星期一Spearman秩相關(guān)第二十一頁,共五十七頁,編輯于2023年,星期一rs=0.851,P=0.000<0.05,差異有統(tǒng)計(jì)學(xué)意義結(jié)果第二十二頁,共五十七頁,編輯于2023年,星期一
二、直線回歸【目的】
掌握簡(jiǎn)單線性回歸的作用、應(yīng)用前提掌握簡(jiǎn)單線性回歸SPSS操作方法正確解釋簡(jiǎn)單線性回歸的輸出結(jié)果第二十三頁,共五十七頁,編輯于2023年,星期一【原理】
簡(jiǎn)單線性回歸是分析兩個(gè)連續(xù)型變量之間依存變化的數(shù)量關(guān)系的統(tǒng)計(jì)方法。線性回歸中兩變量的地位是不同的,其中一個(gè)作為自變量,亦稱為解釋變量,X用表示,另一個(gè)為因變量,Y用表示。如果自變量與因變量間關(guān)系有線性趨勢(shì),可以用某個(gè)適合的線性回歸方程來描述的總體均數(shù)依賴于的數(shù)值變化。假設(shè)總體回歸方程如下:
第二十四頁,共五十七頁,編輯于2023年,星期一a是截距;b為回歸系數(shù),即直線的斜率
用樣本數(shù)據(jù)建立的有關(guān)依存變化的線性表達(dá)式稱為樣本回歸方程:第二十五頁,共五十七頁,編輯于2023年,星期一
回歸參數(shù)的估計(jì),通常用回歸參數(shù)估計(jì)的最小二乘原則。即用一定的數(shù)學(xué)方法確定a與b的適宜值,能使n個(gè)數(shù)據(jù)點(diǎn)的殘差平方和達(dá)到最小值,則稱這一對(duì)a與b為回歸方程的最小二乘估計(jì),使回歸殘差平方和最小的原則稱為最小二乘原則。第二十六頁,共五十七頁,編輯于2023年,星期一簡(jiǎn)單線性回歸只有將兩個(gè)內(nèi)在有聯(lián)系的變量放在一起進(jìn)行回歸分析才有意義做回歸分析時(shí),如果兩個(gè)有內(nèi)在聯(lián)系的變量之間存在的是一種依存因果關(guān)系,那么應(yīng)該以因的變量為X,以果的變量為Y。如果變量之間并無因果關(guān)系,則應(yīng)以易于測(cè)定、較為穩(wěn)定或變異較小者為X進(jìn)行回歸分析時(shí),應(yīng)先繪制散點(diǎn)圖第二十七頁,共五十七頁,編輯于2023年,星期一線性回歸分析的前提條件線性(linear)反應(yīng)變量Y與自變量X呈線性變化趨勢(shì)獨(dú)立(independent)任意兩個(gè)觀察值相互獨(dú)立,一個(gè)個(gè)體的取值不受其他個(gè)體的影響給定X時(shí),Y正態(tài)分布(normal)給定X取值時(shí),Y的取值服從正態(tài)分布等方差(equalvariance)指對(duì)應(yīng)于不同的X值,Y值的總體變異相同第二十八頁,共五十七頁,編輯于2023年,星期一建立回歸方程后,須對(duì)回歸系數(shù)進(jìn)行假設(shè)檢驗(yàn)。使用回歸方程進(jìn)行估計(jì)與預(yù)測(cè)時(shí),一般只適用于原來的觀測(cè)范圍,即自變量的取值范圍,不能隨意將范圍擴(kuò)大。在線性回歸分析時(shí),要注意遠(yuǎn)離群體的極端值對(duì)回歸效果的影響。第二十九頁,共五十七頁,編輯于2023年,星期一【操作步驟】路徑:Analyze—>Regression—>Linear,彈出LinearRegression主對(duì)話框,自變量選入Independent框因變量選入Dependent框—>單擊Statistics,打開Statistics對(duì)話框—>選擇Descriptives、Estimates、Modelfit—>Continue—>OK.第三十頁,共五十七頁,編輯于2023年,星期一例8-2.某地方病研究所調(diào)查8名正常兒童的尿肌酐含量(mmol/24h),估計(jì)尿肌酐含量(y)對(duì)其年齡(x)的回歸方程表8-28名正常兒童的年齡與尿肌酐含量第三十一頁,共五十七頁,編輯于2023年,星期一【操作步驟】1.建立SPSS數(shù)據(jù)文件第三十二頁,共五十七頁,編輯于2023年,星期一2.繪制散點(diǎn)圖,判斷兩變量之間有無線性趨勢(shì)
Graphs—>Scatter/Dot…—>SimpleScatter—>Define,將年齡選入XAxis中,將尿肌酐含量選入YAxis中—>OK第三十三頁,共五十七頁,編輯于2023年,星期一圖8-108名正常兒童年齡與尿肌酐含量散點(diǎn)圖第三十四頁,共五十七頁,編輯于2023年,星期一3.對(duì)因變量進(jìn)行正態(tài)性判斷
analyze—>descriptivestatistics—>explore—>“尿肌酐含量”導(dǎo)入dependentlist—>plots選項(xiàng)—>選中Normalityplotswithtests—>continue—>ok圖8-11因變量正態(tài)性檢驗(yàn)結(jié)果結(jié)果解釋:Z=0.94,P=0.612>0.05,無統(tǒng)計(jì)學(xué)意義,認(rèn)為正常兒童的尿肌酐含量符合正態(tài)分布第三十五頁,共五十七頁,編輯于2023年,星期一4.模型擬合Analyze—>Regression—>Linear—>在LinearRegression對(duì)話框中將年齡選入Independent(s)中,將尿肌酐含量選入Dependent中—>在Method中選擇Enter—>
第三十六頁,共五十七頁,編輯于2023年,星期一
單擊Statistics,打開子對(duì)話框—>在RegressionCoefficients中選擇Estimates選擇Modelfit—>Continue—>OK。第三十七頁,共五十七頁,編輯于2023年,星期一主要輸出結(jié)果
圖8-14擬合過程中變量進(jìn)入/退出模型的情況線性回歸中只有一個(gè)自變量,并且采取強(qiáng)行進(jìn)入的方法第三十八頁,共五十七頁,編輯于2023年,星期一圖8-15模型的擬合優(yōu)度情況模型中相關(guān)系數(shù)R=0.882,決定系數(shù)為0.778,校正決定系數(shù)為0.740第三十九頁,共五十七頁,編輯于2023年,星期一圖8-16整個(gè)模型的檢驗(yàn)結(jié)果所擬合的回歸模型F值為20.968,P為0.004,因此擬合模型是有意義的(直線回歸中,模型中只有一個(gè)自變量,對(duì)模型的檢驗(yàn)就等價(jià)于對(duì)回歸系數(shù)的檢驗(yàn))第四十頁,共五十七頁,編輯于2023年,星期一圖8-17常數(shù)項(xiàng)和系數(shù)的檢驗(yàn)結(jié)果常數(shù)項(xiàng)和系數(shù)的檢驗(yàn)結(jié)果,均有意義;回歸系數(shù)t檢驗(yàn)所得P值與整個(gè)模型檢驗(yàn)結(jié)果相等,未標(biāo)化回歸系數(shù)為0.139,常數(shù)項(xiàng)為1.622第四十一頁,共五十七頁,編輯于2023年,星期一結(jié)果解釋(1)得到的直線回歸方程為:(2)方程整體假設(shè)檢驗(yàn)結(jié)果:F=20.968,P=0.004<0.05,回歸方程有統(tǒng)計(jì)學(xué)意義。(3)回歸方程系數(shù)的解釋:兒童的年齡每增加1歲,其24小時(shí)尿肌酐含量增加0.139mmol。第四十二頁,共五十七頁,編輯于2023年,星期一對(duì)話框說明第四十三頁,共五十七頁,編輯于2023年,星期一第四十四頁,共五十七頁,編輯于2023年,星期一第四十五頁,共五十七頁,編輯于2023年,星期一第四十六頁,共五十七頁,編輯于2
溫馨提示
- 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請(qǐng)下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請(qǐng)聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
- 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會(huì)有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
- 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
- 5. 人人文庫網(wǎng)僅提供信息存儲(chǔ)空間,僅對(duì)用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對(duì)用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對(duì)任何下載內(nèi)容負(fù)責(zé)。
- 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請(qǐng)與我們聯(lián)系,我們立即糾正。
- 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶因使用這些下載資源對(duì)自己和他人造成任何形式的傷害或損失。
最新文檔
- 二零二五版城市住宅抵押借款合同示范4篇
- 二零二五年度農(nóng)產(chǎn)品電商平臺(tái)農(nóng)產(chǎn)品質(zhì)量保險(xiǎn)合同4篇
- 二零二五年度滅鼠防治項(xiàng)目監(jiān)理合同3篇
- 2025年度紡織面料品牌形象設(shè)計(jì)與推廣合同4篇
- 2025年度自然人與音樂制作人創(chuàng)作合同3篇
- 二零二五年度出境領(lǐng)隊(duì)培訓(xùn)基地建設(shè)合同4篇
- 2025物業(yè)保潔與緊急維修值班服務(wù)一體化項(xiàng)目合同9篇
- 2025年度智能停車設(shè)施門面房產(chǎn)權(quán)轉(zhuǎn)讓合同4篇
- 2025年度個(gè)人與公司租賃合同糾紛處理?xiàng)l款4篇
- 二零二五年度啤酒品牌市場(chǎng)推廣代理合同3篇
- 中國人民銀行清算總中心直屬企業(yè)2023年招聘筆試上岸歷年典型考題與考點(diǎn)剖析附帶答案詳解
- 2024年湖南高速鐵路職業(yè)技術(shù)學(xué)院?jiǎn)握新殬I(yè)技能測(cè)試題庫及答案解析
- (正式版)SJT 11449-2024 集中空調(diào)電子計(jì)費(fèi)信息系統(tǒng)工程技術(shù)規(guī)范
- 廣州綠色金融發(fā)展現(xiàn)狀及對(duì)策的研究
- 人教版四年級(jí)上冊(cè)加減乘除四則混合運(yùn)算300題及答案
- 合成生物學(xué)技術(shù)在生物制藥中的應(yīng)用
- 消化系統(tǒng)疾病的負(fù)性情緒與心理護(hù)理
- 高考語文文學(xué)類閱讀分類訓(xùn)練:戲劇類(含答案)
- 協(xié)會(huì)監(jiān)事會(huì)工作報(bào)告大全(12篇)
- WS-T 813-2023 手術(shù)部位標(biāo)識(shí)標(biāo)準(zhǔn)
- 同意更改小孩名字協(xié)議書
評(píng)論
0/150
提交評(píng)論