版權(quán)說(shuō)明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請(qǐng)進(jìn)行舉報(bào)或認(rèn)領(lǐng)
文檔簡(jiǎn)介
應(yīng)用統(tǒng)計(jì)學(xué)相關(guān)與回歸第一頁(yè),共四十三頁(yè),2022年,8月28日
內(nèi)容提要相關(guān)分析簡(jiǎn)介簡(jiǎn)單相關(guān)分析偏相關(guān)分析Distance過(guò)程簡(jiǎn)單回歸分析小結(jié)第二頁(yè),共四十三頁(yè),2022年,8月28日相關(guān)分析簡(jiǎn)介
在醫(yī)學(xué)科學(xué)研究中,常常要分析兩個(gè)變量之間的關(guān)系,例如身高和體重、年齡和血壓、體溫和脈搏、藥物劑量和療效等問(wèn)題,因此涉及到研究?jī)蓚€(gè)變量的相互關(guān)系。這時(shí)就涉及到兩個(gè)變量之間的相關(guān)與回歸。第三頁(yè),共四十三頁(yè),2022年,8月28日積差相關(guān)系數(shù),又稱Pearson相關(guān)系數(shù):定量描述線性相關(guān)程度好壞的常用指標(biāo),只適用于兩變量呈線性相關(guān)時(shí)。特點(diǎn):相關(guān)系數(shù)r
是一個(gè)無(wú)單位的量值,且-1<r<1;
r>0為正相關(guān),r<0為負(fù)相關(guān);
r越接近于1,說(shuō)明相關(guān)性越好;越接近于0,相關(guān)性越差。Spearman等級(jí)相關(guān)系數(shù):當(dāng)數(shù)據(jù)不滿足條件雙變量正態(tài)時(shí)。相關(guān)分析簡(jiǎn)介
連續(xù)變量的相關(guān)指標(biāo)(最常見)第四頁(yè),共四十三頁(yè),2022年,8月28日Gamma統(tǒng)計(jì)量:描述有序分類變量數(shù)據(jù)聯(lián)系強(qiáng)度的指標(biāo),以下指標(biāo)都是基于Gamma統(tǒng)計(jì)量衍生出來(lái)的。Kendall‘sTau-b:反映兩個(gè)有序分類變量的一致性。Kendall‘sTau-c:對(duì)Kendall‘sTau-b進(jìn)行了校正。相關(guān)分析簡(jiǎn)介
有序變量的相關(guān)指標(biāo)第五頁(yè),共四十三頁(yè),2022年,8月28日列聯(lián)系數(shù):基于2值得出PhiandCramer‘sV:也是基于2值得出Lambda系數(shù):用于反映自變量對(duì)因變量的預(yù)測(cè)效果不確定系數(shù)相關(guān)分析簡(jiǎn)介
名義變量的相關(guān)指標(biāo)第六頁(yè),共四十三頁(yè),2022年,8月28日EtaKappa值OR、RR等相關(guān)分析簡(jiǎn)介
其他相關(guān)指標(biāo)第七頁(yè),共四十三頁(yè),2022年,8月28日相關(guān)分析簡(jiǎn)介
實(shí)際上,在Crosstabs過(guò)程的statistics子對(duì)話框中提供了非常整齊的相關(guān)分析指標(biāo)體系,如左圖。第八頁(yè),共四十三頁(yè),2022年,8月28日
除了Crosstab過(guò)程的statistics子對(duì)話框外,SPSS還在statistics菜單的correlation中提供了幾個(gè)更專業(yè)的相關(guān)分析過(guò)程:Bivariate過(guò)程:最常用Partial過(guò)程:專門進(jìn)行偏相關(guān)分析Distances過(guò)程:一般不單獨(dú)使用,而用于因子分析、聚類分析和多維尺度分析的預(yù)分析相關(guān)分析簡(jiǎn)介第九頁(yè),共四十三頁(yè),2022年,8月28日
例1
某醫(yī)院研究某種代乳粉的營(yíng)養(yǎng)價(jià)值是用大白鼠做試驗(yàn),得大鼠進(jìn)食量和體重增量間的關(guān)系的原始數(shù)據(jù)如下,試分析兩者有無(wú)直線相關(guān)關(guān)系。(數(shù)據(jù)文件見corr.sav)動(dòng)物編號(hào)12345678910進(jìn)食量feed820780720867690787934679639820體重增量weight165158130180134167186145120158進(jìn)食量和體重增量的數(shù)據(jù)簡(jiǎn)單相關(guān)分析第十頁(yè),共四十三頁(yè),2022年,8月28日首先繪制散點(diǎn)圖,結(jié)果如下:簡(jiǎn)單相關(guān)分析①兩變量間存在線性相關(guān)趨勢(shì)②沒有發(fā)現(xiàn)明顯的異常值第十一頁(yè),共四十三頁(yè),2022年,8月28日簡(jiǎn)單相關(guān)分析第十二頁(yè),共四十三頁(yè),2022年,8月28日選入希望進(jìn)行相關(guān)分析的變量選擇相關(guān)分析指標(biāo)簡(jiǎn)單相關(guān)分析第十三頁(yè),共四十三頁(yè),2022年,8月28日簡(jiǎn)單相關(guān)分析結(jié)果分析Pearson相關(guān)系數(shù)為0.940,且具有統(tǒng)計(jì)學(xué)意義,表明feed和weight有非常密切的關(guān)系,隨著feed的增加,weight也隨之增加。第十四頁(yè),共四十三頁(yè),2022年,8月28日簡(jiǎn)單相關(guān)分析
利用上述對(duì)話框可以計(jì)算秩相關(guān)系數(shù),即spearman相關(guān)系數(shù),對(duì)原始數(shù)據(jù)分布不作要求,利用兩變量的秩次關(guān)系作線性相關(guān)分析,適用范圍更廣,但效能也較低。第十五頁(yè),共四十三頁(yè),2022年,8月28日簡(jiǎn)單相關(guān)分析結(jié)果分析
對(duì)上面的例子計(jì)算秩相關(guān)系數(shù)的結(jié)果顯示,秩相關(guān)系數(shù)為0.899,P值<0.001。第十六頁(yè),共四十三頁(yè),2022年,8月28日簡(jiǎn)單相關(guān)分析
上述對(duì)話框可用于計(jì)算kendall’s等級(jí)相關(guān)系數(shù),適用于兩變量均為有序分類的情況。第十七頁(yè),共四十三頁(yè),2022年,8月28日簡(jiǎn)單相關(guān)分析結(jié)果分析
對(duì)上面的例子計(jì)算等級(jí)相關(guān)系數(shù),結(jié)果顯示,等級(jí)相關(guān)系數(shù)為0.750,P值=0.003。注意本例并未違反計(jì)算積差相關(guān)系數(shù)的適用條件,這里僅僅是作為演示用。第十八頁(yè),共四十三頁(yè),2022年,8月28日
大家可以發(fā)現(xiàn),對(duì)相同的數(shù)據(jù),秩相關(guān)系數(shù)和等級(jí)相關(guān)系數(shù)的絕對(duì)值均比積差相關(guān)系數(shù)小,為什么?簡(jiǎn)單相關(guān)分析
顯然,這是由于在秩變換或數(shù)據(jù)按有序分類處理時(shí)損失信息所導(dǎo)致的。第十九頁(yè),共四十三頁(yè),2022年,8月28日
前面介紹的相關(guān)分析是分析兩個(gè)計(jì)量資料間的關(guān)系,在計(jì)算積差相關(guān)系數(shù)、Spearman相關(guān)系數(shù)和Kendall’s相關(guān)系數(shù)的時(shí)候,都沒有考慮第三方的影響,這就導(dǎo)致可能對(duì)事物的解釋出現(xiàn)偏差。下面以一個(gè)例子對(duì)此作進(jìn)一步的說(shuō)明。偏相關(guān)分析第二十頁(yè),共四十三頁(yè),2022年,8月28日
例2
某地29名13歲男童身高(x1,cm)、體重(x2,kg)及肺活量的實(shí)測(cè)數(shù)據(jù)文件為partial.sav。試計(jì)算其簡(jiǎn)單相關(guān)系數(shù)。當(dāng)體重固定時(shí),計(jì)算身高與肺活量的偏相關(guān)系數(shù),并做假設(shè)檢驗(yàn)。偏相關(guān)分析第二十一頁(yè),共四十三頁(yè),2022年,8月28日偏相關(guān)分析第二十二頁(yè),共四十三頁(yè),2022年,8月28日偏相關(guān)分析選擇需要在偏相關(guān)分析時(shí)進(jìn)行控制的變量。第二十三頁(yè),共四十三頁(yè),2022年,8月28日
選擇Zero-ordercorrelations復(fù)選框,則可以給出包括協(xié)變量在內(nèi)所有變量?jī)蓛上嚓P(guān)的系數(shù)陣。偏相關(guān)分析第二十四頁(yè),共四十三頁(yè),2022年,8月28日偏相關(guān)分析結(jié)果分析
可見,控制了體重的影響后,身高和肺活量之間的關(guān)系無(wú)統(tǒng)計(jì)學(xué)意義。包括協(xié)變量在內(nèi)所有變量?jī)蓛上嚓P(guān)的系數(shù)陣。第二十五頁(yè),共四十三頁(yè),2022年,8月28日Distance過(guò)程
簡(jiǎn)單相關(guān)和偏相關(guān)有一個(gè)共同點(diǎn),那就是對(duì)所分析的數(shù)據(jù)背景應(yīng)當(dāng)有一定程度的了解。但有時(shí)會(huì)遇到一種情況,在分析之前對(duì)數(shù)據(jù)所代表的專業(yè)背景知識(shí)了解尚不充分,本身就屬于探索性的研究,這時(shí)往往就需要先對(duì)幾個(gè)指標(biāo)或者案例的差異性、相似程度進(jìn)行考察,以先對(duì)數(shù)據(jù)有一個(gè)初步的了解,然后再根據(jù)結(jié)果考慮如何進(jìn)行深入的分析。第二十六頁(yè),共四十三頁(yè),2022年,8月28日
Distance過(guò)程用于計(jì)算記錄或變量間的距離(或相似程度),根據(jù)變量的不同類型可以有許多距離、相似程度測(cè)量指標(biāo)供用戶選擇。但由于本模塊只是一個(gè)預(yù)分析過(guò)程,因此距離分析并不會(huì)給出常用的P值,而只給出距離大小,以供用戶自行判斷相似性。Distance過(guò)程第二十七頁(yè),共四十三頁(yè),2022年,8月28日
例3
某實(shí)驗(yàn)室制作了一張基因芯片,上面一共檢測(cè)了上萬(wàn)個(gè)基因,現(xiàn)在從數(shù)據(jù)庫(kù)中提取出7個(gè)基因的數(shù)據(jù),由于對(duì)這7個(gè)基因的生物學(xué)功能現(xiàn)在一無(wú)所知,因此首先想對(duì)其進(jìn)行距離測(cè)量,看看哪幾個(gè)基因“距離”比較接近,然后可以通過(guò)臨床或?qū)嶒?yàn)室進(jìn)一步驗(yàn)證。(數(shù)據(jù)見distance.sav。)Distance過(guò)程第二十八頁(yè),共四十三頁(yè),2022年,8月28日Distance過(guò)程第二十九頁(yè),共四十三頁(yè),2022年,8月28日Distance過(guò)程注意選擇該項(xiàng)第三十頁(yè),共四十三頁(yè),2022年,8月28日Distance過(guò)程結(jié)果分析
可見,代號(hào)為CDK2AP1,TCEB1和IRF2三個(gè)基因比較接近,可以粗略的劃為一類,而FPGS,ELF3和GFRA2可以劃為另一類,而NFE2可能作為單獨(dú)一類,這樣就可以進(jìn)一步研究了。第三十一頁(yè),共四十三頁(yè),2022年,8月28日
例4
仍以數(shù)據(jù)corr.sav為例,進(jìn)一步作回歸分析,計(jì)算進(jìn)食量與體重增量之間的回歸方程。
分析:
與相關(guān)分析類似,在回歸分析之前首先要考慮的問(wèn)題是兩變量是否存在某種趨勢(shì),通過(guò)前面的散點(diǎn)圖已經(jīng)得到了肯定的結(jié)論,因此直接進(jìn)行回歸分析。簡(jiǎn)單回歸分析第三十二頁(yè),共四十三頁(yè),2022年,8月28日繪制散點(diǎn)圖如下:簡(jiǎn)單回歸分析①兩變量間存在線性相關(guān)趨勢(shì)②沒有發(fā)現(xiàn)明顯的異常值第三十三頁(yè),共四十三頁(yè),2022年,8月28日簡(jiǎn)單回歸分析第三十四頁(yè),共四十三頁(yè),2022年,8月28日選擇應(yīng)變量選擇自變量簡(jiǎn)單回歸分析第三十五頁(yè),共四十三頁(yè),2022年,8月28日簡(jiǎn)單回歸分析結(jié)果分析
對(duì)各自變量納入模型情況的匯總,本例只有一個(gè)自變量。第三十六頁(yè),共四十三頁(yè),2022年,8月28日簡(jiǎn)單回歸分析結(jié)果分析
對(duì)模型的簡(jiǎn)單匯總,即對(duì)回歸方程擬合情況的描述。本例決定系數(shù)為0.883。第三十七頁(yè),共四十三頁(yè),2022年,8月28日簡(jiǎn)單回歸分析結(jié)果分析
對(duì)模型進(jìn)行方差分析的結(jié)果,說(shuō)明模型具有統(tǒng)計(jì)學(xué)意義。第三十八頁(yè),共四十三頁(yè),2022年,8月28日最重要簡(jiǎn)單回歸分析結(jié)果分析
給出了回歸方程中的常數(shù)項(xiàng)、回歸系數(shù)的估計(jì)值和檢驗(yàn)結(jié)果,可寫出回歸方程如下:體重增量=-17.357+0.222×進(jìn)食量第三十九頁(yè),共四十三頁(yè),2022年,8月28日小結(jié)
相關(guān)系數(shù)r表示兩變量間的直線相關(guān)程度,r值的范圍為-1~1。r為正表示X與Y之間為正相關(guān),r為負(fù)表示負(fù)相關(guān)。r接近于0表示兩變量間關(guān)系不密切。但r
有抽樣誤差,故算得相關(guān)系數(shù)之后,必須檢驗(yàn)相應(yīng)的總體相關(guān)系數(shù)是否為0。第四十頁(yè),共四十三頁(yè),2022年,8月28日小結(jié)
研究中一般只涉及直線相關(guān)關(guān)系,但從理論上講,可以進(jìn)行變量間的曲線相關(guān)分析;如果希望扣除其他變量的影響,可以進(jìn)行偏相關(guān)分析;如果變量不滿足線性相關(guān)分析的適用條件,則可以進(jìn)行Spearman秩相關(guān)分析。第四十一頁(yè),共四十三頁(yè),2022年,8月28日小結(jié)
①在意義和應(yīng)用上,回歸反映兩變量間的依存關(guān)系,相關(guān)反映兩變量間的相互關(guān)系。
②在資料要求上,相關(guān)要求X與Y都是隨機(jī)變量,而且服從雙變量正態(tài)分布,這種資料若進(jìn)行回歸分析,一般稱為Ⅱ型回歸模型。而回歸要求應(yīng)變量Y是隨機(jī)變量,服從正態(tài)分布,自變量是固定的非隨機(jī)變量,建立的模型稱為Ⅰ型回歸模型。
相關(guān)與回歸既有區(qū)別又有聯(lián)系。第四十二頁(yè),共四十三頁(yè),2022年,8月28日
③相關(guān)系數(shù)和回歸系數(shù)的正負(fù)號(hào)相同,假設(shè)
溫馨提示
- 1. 本站所有資源如無(wú)特殊說(shuō)明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請(qǐng)下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請(qǐng)聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
- 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁(yè)內(nèi)容里面會(huì)有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
- 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
- 5. 人人文庫(kù)網(wǎng)僅提供信息存儲(chǔ)空間,僅對(duì)用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對(duì)用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對(duì)任何下載內(nèi)容負(fù)責(zé)。
- 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請(qǐng)與我們聯(lián)系,我們立即糾正。
- 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶因使用這些下載資源對(duì)自己和他人造成任何形式的傷害或損失。
最新文檔
- 2025年度LNG運(yùn)輸車輛改裝與安全檢測(cè)合同3篇
- 2024年食品行業(yè)社會(huì)保險(xiǎn)管理與代繳合同
- 2025年度物流車輛智能系統(tǒng)升級(jí)合同4篇
- 2025年度醫(yī)療健康公司股權(quán)轉(zhuǎn)讓與產(chǎn)業(yè)鏈合作合同3篇
- 2025年度商業(yè)大廈車位包銷及物業(yè)管理合同4篇
- 2025年度智能倉(cāng)儲(chǔ)物流系統(tǒng)建設(shè)承包經(jīng)營(yíng)協(xié)議4篇
- 2024石材行業(yè)石材應(yīng)用技術(shù)研究采購(gòu)合同2篇
- 2025年度網(wǎng)絡(luò)直播個(gè)人勞務(wù)合同范本3篇
- 2025年度嬰幼兒專用牛奶采購(gòu)合作協(xié)議書3篇
- 2025年電動(dòng)自行車品牌代理銷售合同標(biāo)準(zhǔn)版2篇
- 有砟軌道施工工藝課件
- 兩辦意見八硬措施煤礦安全生產(chǎn)條例宣貫學(xué)習(xí)課件
- 廣西失敗企業(yè)案例分析報(bào)告
- 湖南建設(shè)工程施工階段監(jiān)理服務(wù)費(fèi)計(jì)費(fèi)規(guī)則
- 人教版高中數(shù)學(xué)必修二《第九章 統(tǒng)計(jì)》同步練習(xí)及答案解析
- 兒科護(hù)理安全警示教育課件
- GB/T 16886.23-2023醫(yī)療器械生物學(xué)評(píng)價(jià)第23部分:刺激試驗(yàn)
- 三年級(jí)下冊(cè)口算天天100題
- 洪恩識(shí)字識(shí)字卡(001-100)可直接打印剪裁
- 國(guó)家中英文名稱及代碼縮寫(三位)
- 高二物理選修講義
評(píng)論
0/150
提交評(píng)論