應(yīng)用統(tǒng)計(jì)學(xué)相關(guān)與回歸_第1頁(yè)
應(yīng)用統(tǒng)計(jì)學(xué)相關(guān)與回歸_第2頁(yè)
應(yīng)用統(tǒng)計(jì)學(xué)相關(guān)與回歸_第3頁(yè)
應(yīng)用統(tǒng)計(jì)學(xué)相關(guān)與回歸_第4頁(yè)
應(yīng)用統(tǒng)計(jì)學(xué)相關(guān)與回歸_第5頁(yè)
已閱讀5頁(yè),還剩38頁(yè)未讀, 繼續(xù)免費(fèi)閱讀

下載本文檔

版權(quán)說(shuō)明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請(qǐng)進(jìn)行舉報(bào)或認(rèn)領(lǐng)

文檔簡(jiǎn)介

應(yīng)用統(tǒng)計(jì)學(xué)相關(guān)與回歸第一頁(yè),共四十三頁(yè),2022年,8月28日

內(nèi)容提要相關(guān)分析簡(jiǎn)介簡(jiǎn)單相關(guān)分析偏相關(guān)分析Distance過(guò)程簡(jiǎn)單回歸分析小結(jié)第二頁(yè),共四十三頁(yè),2022年,8月28日相關(guān)分析簡(jiǎn)介

在醫(yī)學(xué)科學(xué)研究中,常常要分析兩個(gè)變量之間的關(guān)系,例如身高和體重、年齡和血壓、體溫和脈搏、藥物劑量和療效等問(wèn)題,因此涉及到研究?jī)蓚€(gè)變量的相互關(guān)系。這時(shí)就涉及到兩個(gè)變量之間的相關(guān)與回歸。第三頁(yè),共四十三頁(yè),2022年,8月28日積差相關(guān)系數(shù),又稱Pearson相關(guān)系數(shù):定量描述線性相關(guān)程度好壞的常用指標(biāo),只適用于兩變量呈線性相關(guān)時(shí)。特點(diǎn):相關(guān)系數(shù)r

是一個(gè)無(wú)單位的量值,且-1<r<1;

r>0為正相關(guān),r<0為負(fù)相關(guān);

r越接近于1,說(shuō)明相關(guān)性越好;越接近于0,相關(guān)性越差。Spearman等級(jí)相關(guān)系數(shù):當(dāng)數(shù)據(jù)不滿足條件雙變量正態(tài)時(shí)。相關(guān)分析簡(jiǎn)介

連續(xù)變量的相關(guān)指標(biāo)(最常見)第四頁(yè),共四十三頁(yè),2022年,8月28日Gamma統(tǒng)計(jì)量:描述有序分類變量數(shù)據(jù)聯(lián)系強(qiáng)度的指標(biāo),以下指標(biāo)都是基于Gamma統(tǒng)計(jì)量衍生出來(lái)的。Kendall‘sTau-b:反映兩個(gè)有序分類變量的一致性。Kendall‘sTau-c:對(duì)Kendall‘sTau-b進(jìn)行了校正。相關(guān)分析簡(jiǎn)介

有序變量的相關(guān)指標(biāo)第五頁(yè),共四十三頁(yè),2022年,8月28日列聯(lián)系數(shù):基于2值得出PhiandCramer‘sV:也是基于2值得出Lambda系數(shù):用于反映自變量對(duì)因變量的預(yù)測(cè)效果不確定系數(shù)相關(guān)分析簡(jiǎn)介

名義變量的相關(guān)指標(biāo)第六頁(yè),共四十三頁(yè),2022年,8月28日EtaKappa值OR、RR等相關(guān)分析簡(jiǎn)介

其他相關(guān)指標(biāo)第七頁(yè),共四十三頁(yè),2022年,8月28日相關(guān)分析簡(jiǎn)介

實(shí)際上,在Crosstabs過(guò)程的statistics子對(duì)話框中提供了非常整齊的相關(guān)分析指標(biāo)體系,如左圖。第八頁(yè),共四十三頁(yè),2022年,8月28日

除了Crosstab過(guò)程的statistics子對(duì)話框外,SPSS還在statistics菜單的correlation中提供了幾個(gè)更專業(yè)的相關(guān)分析過(guò)程:Bivariate過(guò)程:最常用Partial過(guò)程:專門進(jìn)行偏相關(guān)分析Distances過(guò)程:一般不單獨(dú)使用,而用于因子分析、聚類分析和多維尺度分析的預(yù)分析相關(guān)分析簡(jiǎn)介第九頁(yè),共四十三頁(yè),2022年,8月28日

例1

某醫(yī)院研究某種代乳粉的營(yíng)養(yǎng)價(jià)值是用大白鼠做試驗(yàn),得大鼠進(jìn)食量和體重增量間的關(guān)系的原始數(shù)據(jù)如下,試分析兩者有無(wú)直線相關(guān)關(guān)系。(數(shù)據(jù)文件見corr.sav)動(dòng)物編號(hào)12345678910進(jìn)食量feed820780720867690787934679639820體重增量weight165158130180134167186145120158進(jìn)食量和體重增量的數(shù)據(jù)簡(jiǎn)單相關(guān)分析第十頁(yè),共四十三頁(yè),2022年,8月28日首先繪制散點(diǎn)圖,結(jié)果如下:簡(jiǎn)單相關(guān)分析①兩變量間存在線性相關(guān)趨勢(shì)②沒有發(fā)現(xiàn)明顯的異常值第十一頁(yè),共四十三頁(yè),2022年,8月28日簡(jiǎn)單相關(guān)分析第十二頁(yè),共四十三頁(yè),2022年,8月28日選入希望進(jìn)行相關(guān)分析的變量選擇相關(guān)分析指標(biāo)簡(jiǎn)單相關(guān)分析第十三頁(yè),共四十三頁(yè),2022年,8月28日簡(jiǎn)單相關(guān)分析結(jié)果分析Pearson相關(guān)系數(shù)為0.940,且具有統(tǒng)計(jì)學(xué)意義,表明feed和weight有非常密切的關(guān)系,隨著feed的增加,weight也隨之增加。第十四頁(yè),共四十三頁(yè),2022年,8月28日簡(jiǎn)單相關(guān)分析

利用上述對(duì)話框可以計(jì)算秩相關(guān)系數(shù),即spearman相關(guān)系數(shù),對(duì)原始數(shù)據(jù)分布不作要求,利用兩變量的秩次關(guān)系作線性相關(guān)分析,適用范圍更廣,但效能也較低。第十五頁(yè),共四十三頁(yè),2022年,8月28日簡(jiǎn)單相關(guān)分析結(jié)果分析

對(duì)上面的例子計(jì)算秩相關(guān)系數(shù)的結(jié)果顯示,秩相關(guān)系數(shù)為0.899,P值<0.001。第十六頁(yè),共四十三頁(yè),2022年,8月28日簡(jiǎn)單相關(guān)分析

上述對(duì)話框可用于計(jì)算kendall’s等級(jí)相關(guān)系數(shù),適用于兩變量均為有序分類的情況。第十七頁(yè),共四十三頁(yè),2022年,8月28日簡(jiǎn)單相關(guān)分析結(jié)果分析

對(duì)上面的例子計(jì)算等級(jí)相關(guān)系數(shù),結(jié)果顯示,等級(jí)相關(guān)系數(shù)為0.750,P值=0.003。注意本例并未違反計(jì)算積差相關(guān)系數(shù)的適用條件,這里僅僅是作為演示用。第十八頁(yè),共四十三頁(yè),2022年,8月28日

大家可以發(fā)現(xiàn),對(duì)相同的數(shù)據(jù),秩相關(guān)系數(shù)和等級(jí)相關(guān)系數(shù)的絕對(duì)值均比積差相關(guān)系數(shù)小,為什么?簡(jiǎn)單相關(guān)分析

顯然,這是由于在秩變換或數(shù)據(jù)按有序分類處理時(shí)損失信息所導(dǎo)致的。第十九頁(yè),共四十三頁(yè),2022年,8月28日

前面介紹的相關(guān)分析是分析兩個(gè)計(jì)量資料間的關(guān)系,在計(jì)算積差相關(guān)系數(shù)、Spearman相關(guān)系數(shù)和Kendall’s相關(guān)系數(shù)的時(shí)候,都沒有考慮第三方的影響,這就導(dǎo)致可能對(duì)事物的解釋出現(xiàn)偏差。下面以一個(gè)例子對(duì)此作進(jìn)一步的說(shuō)明。偏相關(guān)分析第二十頁(yè),共四十三頁(yè),2022年,8月28日

例2

某地29名13歲男童身高(x1,cm)、體重(x2,kg)及肺活量的實(shí)測(cè)數(shù)據(jù)文件為partial.sav。試計(jì)算其簡(jiǎn)單相關(guān)系數(shù)。當(dāng)體重固定時(shí),計(jì)算身高與肺活量的偏相關(guān)系數(shù),并做假設(shè)檢驗(yàn)。偏相關(guān)分析第二十一頁(yè),共四十三頁(yè),2022年,8月28日偏相關(guān)分析第二十二頁(yè),共四十三頁(yè),2022年,8月28日偏相關(guān)分析選擇需要在偏相關(guān)分析時(shí)進(jìn)行控制的變量。第二十三頁(yè),共四十三頁(yè),2022年,8月28日

選擇Zero-ordercorrelations復(fù)選框,則可以給出包括協(xié)變量在內(nèi)所有變量?jī)蓛上嚓P(guān)的系數(shù)陣。偏相關(guān)分析第二十四頁(yè),共四十三頁(yè),2022年,8月28日偏相關(guān)分析結(jié)果分析

可見,控制了體重的影響后,身高和肺活量之間的關(guān)系無(wú)統(tǒng)計(jì)學(xué)意義。包括協(xié)變量在內(nèi)所有變量?jī)蓛上嚓P(guān)的系數(shù)陣。第二十五頁(yè),共四十三頁(yè),2022年,8月28日Distance過(guò)程

簡(jiǎn)單相關(guān)和偏相關(guān)有一個(gè)共同點(diǎn),那就是對(duì)所分析的數(shù)據(jù)背景應(yīng)當(dāng)有一定程度的了解。但有時(shí)會(huì)遇到一種情況,在分析之前對(duì)數(shù)據(jù)所代表的專業(yè)背景知識(shí)了解尚不充分,本身就屬于探索性的研究,這時(shí)往往就需要先對(duì)幾個(gè)指標(biāo)或者案例的差異性、相似程度進(jìn)行考察,以先對(duì)數(shù)據(jù)有一個(gè)初步的了解,然后再根據(jù)結(jié)果考慮如何進(jìn)行深入的分析。第二十六頁(yè),共四十三頁(yè),2022年,8月28日

Distance過(guò)程用于計(jì)算記錄或變量間的距離(或相似程度),根據(jù)變量的不同類型可以有許多距離、相似程度測(cè)量指標(biāo)供用戶選擇。但由于本模塊只是一個(gè)預(yù)分析過(guò)程,因此距離分析并不會(huì)給出常用的P值,而只給出距離大小,以供用戶自行判斷相似性。Distance過(guò)程第二十七頁(yè),共四十三頁(yè),2022年,8月28日

例3

某實(shí)驗(yàn)室制作了一張基因芯片,上面一共檢測(cè)了上萬(wàn)個(gè)基因,現(xiàn)在從數(shù)據(jù)庫(kù)中提取出7個(gè)基因的數(shù)據(jù),由于對(duì)這7個(gè)基因的生物學(xué)功能現(xiàn)在一無(wú)所知,因此首先想對(duì)其進(jìn)行距離測(cè)量,看看哪幾個(gè)基因“距離”比較接近,然后可以通過(guò)臨床或?qū)嶒?yàn)室進(jìn)一步驗(yàn)證。(數(shù)據(jù)見distance.sav。)Distance過(guò)程第二十八頁(yè),共四十三頁(yè),2022年,8月28日Distance過(guò)程第二十九頁(yè),共四十三頁(yè),2022年,8月28日Distance過(guò)程注意選擇該項(xiàng)第三十頁(yè),共四十三頁(yè),2022年,8月28日Distance過(guò)程結(jié)果分析

可見,代號(hào)為CDK2AP1,TCEB1和IRF2三個(gè)基因比較接近,可以粗略的劃為一類,而FPGS,ELF3和GFRA2可以劃為另一類,而NFE2可能作為單獨(dú)一類,這樣就可以進(jìn)一步研究了。第三十一頁(yè),共四十三頁(yè),2022年,8月28日

例4

仍以數(shù)據(jù)corr.sav為例,進(jìn)一步作回歸分析,計(jì)算進(jìn)食量與體重增量之間的回歸方程。

分析:

與相關(guān)分析類似,在回歸分析之前首先要考慮的問(wèn)題是兩變量是否存在某種趨勢(shì),通過(guò)前面的散點(diǎn)圖已經(jīng)得到了肯定的結(jié)論,因此直接進(jìn)行回歸分析。簡(jiǎn)單回歸分析第三十二頁(yè),共四十三頁(yè),2022年,8月28日繪制散點(diǎn)圖如下:簡(jiǎn)單回歸分析①兩變量間存在線性相關(guān)趨勢(shì)②沒有發(fā)現(xiàn)明顯的異常值第三十三頁(yè),共四十三頁(yè),2022年,8月28日簡(jiǎn)單回歸分析第三十四頁(yè),共四十三頁(yè),2022年,8月28日選擇應(yīng)變量選擇自變量簡(jiǎn)單回歸分析第三十五頁(yè),共四十三頁(yè),2022年,8月28日簡(jiǎn)單回歸分析結(jié)果分析

對(duì)各自變量納入模型情況的匯總,本例只有一個(gè)自變量。第三十六頁(yè),共四十三頁(yè),2022年,8月28日簡(jiǎn)單回歸分析結(jié)果分析

對(duì)模型的簡(jiǎn)單匯總,即對(duì)回歸方程擬合情況的描述。本例決定系數(shù)為0.883。第三十七頁(yè),共四十三頁(yè),2022年,8月28日簡(jiǎn)單回歸分析結(jié)果分析

對(duì)模型進(jìn)行方差分析的結(jié)果,說(shuō)明模型具有統(tǒng)計(jì)學(xué)意義。第三十八頁(yè),共四十三頁(yè),2022年,8月28日最重要簡(jiǎn)單回歸分析結(jié)果分析

給出了回歸方程中的常數(shù)項(xiàng)、回歸系數(shù)的估計(jì)值和檢驗(yàn)結(jié)果,可寫出回歸方程如下:體重增量=-17.357+0.222×進(jìn)食量第三十九頁(yè),共四十三頁(yè),2022年,8月28日小結(jié)

相關(guān)系數(shù)r表示兩變量間的直線相關(guān)程度,r值的范圍為-1~1。r為正表示X與Y之間為正相關(guān),r為負(fù)表示負(fù)相關(guān)。r接近于0表示兩變量間關(guān)系不密切。但r

有抽樣誤差,故算得相關(guān)系數(shù)之后,必須檢驗(yàn)相應(yīng)的總體相關(guān)系數(shù)是否為0。第四十頁(yè),共四十三頁(yè),2022年,8月28日小結(jié)

研究中一般只涉及直線相關(guān)關(guān)系,但從理論上講,可以進(jìn)行變量間的曲線相關(guān)分析;如果希望扣除其他變量的影響,可以進(jìn)行偏相關(guān)分析;如果變量不滿足線性相關(guān)分析的適用條件,則可以進(jìn)行Spearman秩相關(guān)分析。第四十一頁(yè),共四十三頁(yè),2022年,8月28日小結(jié)

①在意義和應(yīng)用上,回歸反映兩變量間的依存關(guān)系,相關(guān)反映兩變量間的相互關(guān)系。

②在資料要求上,相關(guān)要求X與Y都是隨機(jī)變量,而且服從雙變量正態(tài)分布,這種資料若進(jìn)行回歸分析,一般稱為Ⅱ型回歸模型。而回歸要求應(yīng)變量Y是隨機(jī)變量,服從正態(tài)分布,自變量是固定的非隨機(jī)變量,建立的模型稱為Ⅰ型回歸模型。

相關(guān)與回歸既有區(qū)別又有聯(lián)系。第四十二頁(yè),共四十三頁(yè),2022年,8月28日

③相關(guān)系數(shù)和回歸系數(shù)的正負(fù)號(hào)相同,假設(shè)

溫馨提示

  • 1. 本站所有資源如無(wú)特殊說(shuō)明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請(qǐng)下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請(qǐng)聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁(yè)內(nèi)容里面會(huì)有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫(kù)網(wǎng)僅提供信息存儲(chǔ)空間,僅對(duì)用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對(duì)用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對(duì)任何下載內(nèi)容負(fù)責(zé)。
  • 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請(qǐng)與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶因使用這些下載資源對(duì)自己和他人造成任何形式的傷害或損失。

最新文檔

評(píng)論

0/150

提交評(píng)論