統(tǒng)計(jì)學(xué)教程:相關(guān)與回歸.ppt_第1頁(yè)
統(tǒng)計(jì)學(xué)教程:相關(guān)與回歸.ppt_第2頁(yè)
統(tǒng)計(jì)學(xué)教程:相關(guān)與回歸.ppt_第3頁(yè)
統(tǒng)計(jì)學(xué)教程:相關(guān)與回歸.ppt_第4頁(yè)
統(tǒng)計(jì)學(xué)教程:相關(guān)與回歸.ppt_第5頁(yè)
已閱讀5頁(yè),還剩41頁(yè)未讀, 繼續(xù)免費(fèi)閱讀

下載本文檔

版權(quán)說(shuō)明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請(qǐng)進(jìn)行舉報(bào)或認(rèn)領(lǐng)

文檔簡(jiǎn)介

1、關(guān)聯(lián)和回歸,第九回,王曉莉,基本內(nèi)容,關(guān)聯(lián)和回歸,3,醫(yī)學(xué)上,身高和體重,父親身高和兒子身高,體溫和脈搏,產(chǎn)前檢查和嬰兒體重,乙肝病毒和乙肝等多種現(xiàn)象之間有關(guān)聯(lián)。 在這些有關(guān)系的現(xiàn)象中,它們之間的聯(lián)系程度和性質(zhì)也各不相同。 相關(guān)與回歸、4、變量之間的關(guān)系:乙肝病毒感染是前因,得到乙肝是結(jié)果,乙肝病毒與乙肝之間存在因果關(guān)系的現(xiàn)象之間因果關(guān)系不明確,但并不能說(shuō)伴隨關(guān)系如丈夫身高與妻子身高之間存在因果關(guān)系。相關(guān)和回歸、5、相關(guān)和回歸用于研究和解釋兩個(gè)變量之間的相互關(guān)系。相關(guān)與回歸、6、主要內(nèi)容、第一節(jié)直線相關(guān)第二節(jié)直線回歸第三節(jié)注意事項(xiàng)、第一節(jié)直線相關(guān)、一、相關(guān)的類型二、相關(guān)系數(shù)的校正公式相關(guān)系數(shù)的

2、假設(shè)檢驗(yàn)三、直線相關(guān)的意義、為了研究父子與成年兒子的身高的關(guān)系,皮爾遜將1078對(duì)父子的身高進(jìn)行了測(cè)量的1078對(duì)數(shù)字x上的數(shù)字表示父親的身高,y上的數(shù)字表示兒子的身高1078個(gè)點(diǎn)形成圖案是散點(diǎn)圖。 收集一些數(shù)據(jù)以確定相關(guān)和回歸、9、散點(diǎn)圖和相關(guān)變量之間的關(guān)系。 這些數(shù)據(jù)成對(duì),然后用笛卡爾坐標(biāo)系描述這些點(diǎn)。 此點(diǎn)集稱為散點(diǎn)圖。相關(guān)的類型、正相關(guān)負(fù)相關(guān)完全正相關(guān)完全負(fù)相關(guān)被稱為零相關(guān),關(guān)于相關(guān)系數(shù)、樣本的相關(guān)系數(shù),用r表示的r的值在-1和1之間的r的絕對(duì)值越接近1,兩變量的相關(guān)度越強(qiáng),r的絕對(duì)值越接近0,兩變量的相關(guān)度越弱的正相關(guān)此時(shí),在一個(gè)變量增加,另一個(gè)變量也增加的負(fù)相關(guān)的情況下,r值在-1

3、到0之間,一個(gè)變量增加,另一個(gè)變量減少。相關(guān)系數(shù)修正公式,產(chǎn)科醫(yī)生發(fā)現(xiàn)孕婦尿中雌三醇含量與產(chǎn)兒體重有關(guān),因此認(rèn)為通過(guò)測(cè)定被產(chǎn)婦尿中雌三醇含量,可以預(yù)測(cè)出產(chǎn)體重,預(yù)防低出生體重。 為此,收集31例產(chǎn)婦24小時(shí)尿液,測(cè)定其中雌三醇含量,并記錄產(chǎn)兒的體重。 尿中雌三醇含量與產(chǎn)兒體重的相關(guān)系數(shù)是多少?是正相關(guān)還是負(fù)相關(guān)? 分析問(wèn)題:總體樣品、目的、變量、關(guān)系,產(chǎn)婦尿母三醇含量與產(chǎn)體重的關(guān)系,x=534 y=99.2 x2=9876 y2=324.8 xy=1750 n=31,關(guān)系與回歸問(wèn)題:產(chǎn)婦尿中母三醇含量與產(chǎn)兒體重之間呈正相關(guān),相關(guān)為什么? 修正結(jié)果表明,31例產(chǎn)婦尿中雌三醇含量與產(chǎn)兒體重之間程度

4、呈正相關(guān),相關(guān)系數(shù)為r0.61。 相關(guān)和回歸,18,相關(guān)系數(shù)假設(shè)檢驗(yàn),上例相關(guān)系數(shù)r為0.61,說(shuō)明31例樣品中雌三醇含量與出生體重之間存在相關(guān)關(guān)系。 然而,這31個(gè)示例是整體上的一個(gè)樣本,使得產(chǎn)生的相關(guān)系數(shù)中有采樣誤差。 因?yàn)槿绻傮w相關(guān)系數(shù)()為0,則由采樣誤差從總體提取出的31個(gè)實(shí)例可能不等于零。 這是對(duì)r進(jìn)行假設(shè)檢查,判斷r不等于零是取樣誤差引起的,還是兩個(gè)變量之間確實(shí)存在相關(guān)關(guān)系。 選擇相關(guān)和回歸、19、相關(guān)系數(shù)的假設(shè)檢查、常用t檢查、統(tǒng)一校正量t的校正公式如下:=n-2、相關(guān)和回歸、20,1.h0:=0h1: 02.=0. 053 . 接受還是什么? 可以認(rèn)為產(chǎn)婦24小時(shí)以內(nèi)的尿中

5、雌三醇濃度與產(chǎn)兒體重之間存在正相關(guān)關(guān)系。直線關(guān)聯(lián)的意思,確實(shí)是在有關(guān)聯(lián)的前提下(? 什么? 的雙曲馀弦值。 r的絕對(duì)值越大,表示兩個(gè)變量之間的關(guān)聯(lián)度越強(qiáng)時(shí),就知道一個(gè)變量有助于預(yù)測(cè)另一個(gè)變量。r的絕對(duì)值越小,兩個(gè)變量之間的關(guān)系就越弱,一個(gè)變量的信息對(duì)于推測(cè)另一個(gè)變量的值就越不起作用。 一般來(lái)說(shuō),樣本量大,對(duì)r進(jìn)行假設(shè)檢查,在有統(tǒng)一校正學(xué)意義的情況下,如果r的絕對(duì)值大于0.7,則表示兩個(gè)變量高的相關(guān)性的r的絕對(duì)值大于0.4,如果在0.7以下,則表示兩個(gè)變量間的中等程度的相關(guān)性的r的絕對(duì)值大于0.2 雌三醇含量與產(chǎn)兒體重有關(guān):如果知道產(chǎn)婦的尿雌三醇含量,能否推測(cè)產(chǎn)兒的體重?能夠預(yù)測(cè)的體重在哪個(gè)范圍

6、內(nèi)? 必須用直線回歸的方法來(lái)解決這個(gè)。 第二節(jié)直線回歸,一,回歸方程式二,回歸系數(shù)三,回歸系數(shù)假設(shè)檢驗(yàn)四,直線回歸的應(yīng)用,一個(gè)人的樂(lè)趣不是因?yàn)樗麚碛械臇|西多,而是因?yàn)樗P(guān)心的東西少,在休息,相關(guān)和回歸,24,一,回歸方程式二,回歸系數(shù)三個(gè)變量之間直線在這種情況下,它們的變化可以由函數(shù)方程表示,將其稱為函數(shù)關(guān)系,并且將其關(guān)系表達(dá)式稱為函數(shù)方程。 由于相關(guān)和回歸、26,其它因素的干擾,許多二變量之間的關(guān)系不是嚴(yán)格的函數(shù)關(guān)系,而是不能用函數(shù)方程式來(lái)反映。 為了與二變量間的函數(shù)方程式區(qū)別開(kāi)來(lái),把這個(gè)關(guān)系式叫做直線回歸方程式,把這個(gè)關(guān)系叫做直線回歸。 相關(guān)和回歸,27,線性回歸用于解釋一個(gè)變量如何依賴于

7、另一個(gè)變量,以找到一個(gè)變量隨另一個(gè)變量變化的線性方程為使命,這個(gè)線性方程被稱為線性回歸方程。相關(guān)和回歸、28、回歸式、a、bX、=、式中的是根據(jù)自變量x推定的應(yīng)變量y的推定值,a是回歸直線在y軸上的截距,即X=0時(shí)的y值,b是樣本的回歸系數(shù),即回歸直線的斜率,x變動(dòng)1個(gè)單位時(shí),y平均為b 如果a、b已知,則代入上式可以求出直線回歸式。 根據(jù)相關(guān)和回歸、29、y、相關(guān)和回歸、30、回歸系數(shù)、上例的數(shù)據(jù),求出產(chǎn)婦尿中雌三醇含量與出生體重的回歸式。 根據(jù)相關(guān)系數(shù)的校正計(jì)算,可以根據(jù)我們求出的兩者的關(guān)系的回歸式、相關(guān)和回歸、32、回歸直線的圖、求出的回歸式,在自變量x的實(shí)測(cè)范圍內(nèi)任意取2個(gè)值,在代入式

8、中,求出對(duì)應(yīng)的2個(gè)y值,在這2個(gè)數(shù)據(jù)中對(duì)應(yīng)的2 這兩點(diǎn)可以用來(lái)確保繪圖繪制正確。 相關(guān)和回歸,34,=2.15 0.061X,一定能說(shuō)明雌三醇和產(chǎn)兒體重之間存在回歸關(guān)系嗎?相關(guān)和回歸,35,和直線相關(guān)一樣,直線回歸方程式也是根據(jù)樣本數(shù)據(jù)進(jìn)行修正,同樣存在采樣誤差的問(wèn)題。 因此,必須假設(shè)檢查樣本的回歸系數(shù)b,并確定b是否是從整個(gè)零回歸系數(shù)中提取的。 為了判斷取樣誤差的影響,有必要對(duì)回歸系數(shù)進(jìn)行假說(shuō)檢查。 整體回歸系數(shù)一般用表示。采用相關(guān)和回歸、36、t檢驗(yàn)方法,其中Sy.x是從各觀察值y到回歸直線的距離的標(biāo)準(zhǔn)偏差,表示去除x的影響后的y的變異程度,回歸系數(shù)的假設(shè)檢驗(yàn),H0:=0 H1:0=0.0

9、5校正量:校正t=4=31-2=29,=2.045用修正概率值P: P0.05推論:在0.05檢查水平上拒絕H0,認(rèn)為接受H1產(chǎn)婦24小時(shí)尿中雌三醇含量與產(chǎn)體重之間存在直線回歸關(guān)系。、相關(guān)和回歸、39、直線回歸的應(yīng)用、描述兩變量間的依存關(guān)系:通過(guò)回歸系數(shù)的假設(shè)檢驗(yàn),如果認(rèn)為兩變量間有直線回歸關(guān)系,則可以用直線回歸來(lái)描述。 基于回歸式的預(yù)測(cè):將自變量代入回歸式,根據(jù)變量進(jìn)行估計(jì),由此能夠求出應(yīng)變量的變動(dòng)范圍。 例如,將某產(chǎn)婦的尿雌三醇濃度代入回歸式,通過(guò)使用區(qū)間推定的方法,可知生產(chǎn)時(shí)的生產(chǎn)時(shí)的體重范圍。 用回歸公式進(jìn)行統(tǒng)一控制:空氣質(zhì)量和汽車數(shù)量、相關(guān)和回歸、40、第三節(jié)應(yīng)用時(shí)的注意事項(xiàng)、一、注

10、意事項(xiàng)二、相關(guān)和回歸的區(qū)別三、相關(guān)和回歸、相關(guān)和回歸、41、應(yīng)用直線相關(guān)和回歸的注意事項(xiàng),1、在實(shí)際意義上進(jìn)行相關(guān)回歸分析是實(shí)際的尋求孩子和小樹(shù)的相關(guān)關(guān)系是沒(méi)有意義的,從孩子的身高推測(cè)小樹(shù)的高度更加慌張。 2 .相關(guān)關(guān)系相關(guān)關(guān)系不一定是因果關(guān)系,也許是伴隨關(guān)系,但不能證明事物之間有內(nèi)在的關(guān)系。 例如,發(fā)現(xiàn)對(duì)于學(xué)校的孩子,鞋子的大小和閱讀技能有很強(qiáng)的相關(guān)關(guān)系。 但是,學(xué)習(xí)新詞不是擴(kuò)大腳步,而是關(guān)系到第三要因年齡。 孩子長(zhǎng)大后,閱讀能力提高,長(zhǎng)大后也不能穿原來(lái)的鞋子。相關(guān)和回歸、42、3 .可以利用散布圖對(duì)性質(zhì)不明的2組數(shù)據(jù)首先制作散布圖,在用圖觀察它們的關(guān)系的有無(wú)、關(guān)系的密切度、正的相關(guān)還是負(fù)的

11、相關(guān)之后,進(jìn)行相關(guān)回歸分析。 4 .變量范圍的相關(guān)分析和回歸公式只能適用于樣本的原始數(shù)據(jù)范圍內(nèi),但是不能提取該范圍,得到兩變量的相關(guān)關(guān)系和原始的回歸關(guān)系。相關(guān)與回歸、43、相關(guān)與回歸的區(qū)別、1 .意義:相關(guān)反映兩個(gè)變量的相互關(guān)系,即兩個(gè)變量中任一個(gè)變化引起另一個(gè)變化,是一個(gè)雙向變化的關(guān)系。 回歸反映了兩個(gè)變量的依賴關(guān)系,一個(gè)變量的變化引起另一個(gè)變量的變化,是單方面的關(guān)系。 2 .應(yīng)用:研究?jī)蓚€(gè)變量相互關(guān)系的相關(guān)分析。 為了研究?jī)蓚€(gè)變量的依存關(guān)系,使用了回歸分析。 3 .研究性質(zhì):相關(guān)描述兩個(gè)變量之間的關(guān)系,看兩個(gè)變量是否相關(guān),關(guān)系是否密切,關(guān)系的性質(zhì)是什么,正相關(guān)還是負(fù)相關(guān)。 已知回歸定量地描

12、述兩個(gè)變量,研究?jī)蓚€(gè)變量的數(shù)量關(guān)系,一個(gè)變量值可以預(yù)測(cè)另一個(gè)變量值,可以得到定量的結(jié)果。 4 .相關(guān)系數(shù)r和回歸系數(shù)b :r和b的絕對(duì)值反映的含義不同。 r的絕對(duì)值越大,散布圖中的點(diǎn)越有成為一直線的傾向,兩變量的關(guān)系越密切,表示相關(guān)度越高。 b的絕對(duì)值越大表示回歸直線越陡峭,x變化1個(gè)單位表示y的平均變化越大。 反之亦然。 相關(guān)和回歸的聯(lián)系,1 .可以進(jìn)行關(guān)系回歸分析的變量之間存在相關(guān)關(guān)系。 因此,可以對(duì)兩組新數(shù)據(jù)制作散布圖,求出它們的相關(guān)系數(shù),對(duì)具有相關(guān)關(guān)系的變量進(jìn)行回歸分析,求出回歸式。 2. r和b的符號(hào)一致:當(dāng)r為正時(shí),b也為正,表示兩變量為正的相關(guān),為同向變化。 當(dāng)r為負(fù)時(shí),b也為負(fù),表示兩變量為負(fù)的相關(guān),是反變化。 r與b的假設(shè)檢驗(yàn)結(jié)果一致:可以用r的顯性檢驗(yàn)代替b的顯性檢驗(yàn)。相關(guān)和回歸,4

溫馨提示

  • 1. 本站所有資源如無(wú)特殊說(shuō)明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請(qǐng)下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請(qǐng)聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁(yè)內(nèi)容里面會(huì)有圖紙預(yù)覽,若沒(méi)有圖紙預(yù)覽就沒(méi)有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫(kù)網(wǎng)僅提供信息存儲(chǔ)空間,僅對(duì)用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對(duì)用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對(duì)任何下載內(nèi)容負(fù)責(zé)。
  • 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請(qǐng)與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶因使用這些下載資源對(duì)自己和他人造成任何形式的傷害或損失。

最新文檔

評(píng)論

0/150

提交評(píng)論