




版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請(qǐng)進(jìn)行舉報(bào)或認(rèn)領(lǐng)
文檔簡介
第十講相關(guān)與回歸演示文稿相關(guān)與回歸1目前一頁\總數(shù)三十五頁\編于十點(diǎn)相關(guān)與回歸2(優(yōu)選)第十講相關(guān)與回歸目前二頁\總數(shù)三十五頁\編于十點(diǎn)直線相關(guān)LinearCorrelation目前三頁\總數(shù)三十五頁\編于十點(diǎn)散點(diǎn)圖為了確定相關(guān)變量之間的關(guān)系,首先應(yīng)該收集一些數(shù)據(jù),這些數(shù)據(jù)應(yīng)該是成對(duì)的。例如,每人的身高和體重。然后在直角坐標(biāo)系上描述這些點(diǎn),這一組點(diǎn)集稱為散點(diǎn)圖。目前四頁\總數(shù)三十五頁\編于十點(diǎn)為了研究父親與成年兒子身高之間的關(guān)系,卡爾.皮爾遜測(cè)量了1078對(duì)父子的身高。把1078對(duì)數(shù)字表示在坐標(biāo)上,如圖。用水平軸X上的數(shù)代表父親身高,垂直軸Y上的數(shù)代表兒子的身高,1078個(gè)點(diǎn)所形成的圖形是一個(gè)散點(diǎn)圖。它的形狀象一塊橄欖狀的云,中間的點(diǎn)密集,邊沿的點(diǎn)稀少,其主要部分是一個(gè)橢圓。
目前五頁\總數(shù)三十五頁\編于十點(diǎn)相關(guān)的類型★正相關(guān)★負(fù)相關(guān)★完全正相關(guān)★完全負(fù)相關(guān)★稱零相關(guān)
目前六頁\總數(shù)三十五頁\編于十點(diǎn)相關(guān)系數(shù)
樣本的相關(guān)系數(shù)用r(correlationcoefficient)相關(guān)系數(shù)r的值在-1和1之間,但可以是此范圍內(nèi)的任何值。正相關(guān)時(shí),r值在0和1之間,散點(diǎn)云圖是斜向上的,這時(shí)一個(gè)變量增加,另一個(gè)變量也增加;負(fù)相關(guān)時(shí),r值在-1和0之間,散點(diǎn)云圖是斜向下的,此時(shí)一個(gè)變量增加,另一個(gè)變量將減少。r的絕對(duì)值越接近1,兩變量的關(guān)聯(lián)程度越強(qiáng),r的絕對(duì)值越接近0,兩變量的關(guān)聯(lián)程度越弱。目前七頁\總數(shù)三十五頁\編于十點(diǎn)相關(guān)系數(shù)的計(jì)算公式r的計(jì)算結(jié)果說明了兩個(gè)變量X與Y之間關(guān)聯(lián)的密切程度(絕對(duì)值大小)與關(guān)聯(lián)的性質(zhì)(正負(fù)號(hào))。目前八頁\總數(shù)三十五頁\編于十點(diǎn)例一一個(gè)產(chǎn)科醫(yī)師發(fā)現(xiàn)孕婦尿中雌三醇含量與產(chǎn)兒的體重有關(guān)。于是設(shè)想,通過測(cè)量待產(chǎn)婦尿中雌三醇含量,可以預(yù)測(cè)產(chǎn)兒體重,以便對(duì)低出生體重進(jìn)行預(yù)防。因此收集了31例待產(chǎn)婦24小時(shí)的尿,測(cè)量其中的雌三醇含量,同時(shí)記錄產(chǎn)兒的體重。問尿中雌三醇含量與產(chǎn)兒體重之間相關(guān)系數(shù)是多少?是正相關(guān)還是負(fù)相關(guān)?分析問題:目的、變量、關(guān)系
目前九頁\總數(shù)三十五頁\編于十點(diǎn)編號(hào)
(1)尿雌三醇mg/24h(2產(chǎn)兒體重kg(3)編號(hào)
(1)尿雌三醇mg/24h(2)產(chǎn)兒體重kg(3)172.517173.2292.518253.2392.519273.44122.720153.45142.721153.46162.722153.57162.423163.58143.024193.49163.025183.510163.126173.611173.027183.712193.128203.813213.029224.014242.830253.915153.231244.316163.2
待產(chǎn)婦尿雌三醇含量與產(chǎn)兒體重關(guān)系
目前十頁\總數(shù)三十五頁\編于十點(diǎn)∑X=534∑Y=99.2∑X2=9876∑Y2=324.8∑XY=1750N=31目前十一頁\總數(shù)三十五頁\編于十點(diǎn)計(jì)算結(jié)果從計(jì)算結(jié)果可以知道,31例待產(chǎn)婦尿中雌三醇含量與產(chǎn)兒體重之間程正相關(guān),相關(guān)系數(shù)是0.61。目前十二頁\總數(shù)三十五頁\編于十點(diǎn)問題:我們能否得出結(jié)論說明待產(chǎn)婦尿中雌三醇含量與產(chǎn)兒體重之間程正相關(guān),相關(guān)系數(shù)是0.61。為什么?目前十三頁\總數(shù)三十五頁\編于十點(diǎn)相關(guān)系數(shù)的假設(shè)檢驗(yàn)
上例中的相關(guān)系數(shù)r等于0.61,說明了31例樣本中雌三醇含量與出生體重之間存在相關(guān)關(guān)系。但是,這31例只是總體中的一個(gè)樣本,由此得到的相關(guān)系數(shù)會(huì)存在抽樣誤差。因?yàn)?,總體相關(guān)系數(shù)()為零時(shí),由于抽樣誤差,從總體抽出的31例,其r可能不等于零。所以,要判斷該樣本的r是否有意義,需與總體相關(guān)系數(shù)=0進(jìn)行比較,看兩者的差別有無統(tǒng)計(jì)學(xué)意義。這就要對(duì)r進(jìn)行假設(shè)檢驗(yàn),判斷r不等于零是由于抽樣誤差所致,還是兩個(gè)變量之間確實(shí)存在相關(guān)關(guān)系。
目前十四頁\總數(shù)三十五頁\編于十點(diǎn)對(duì)相關(guān)系數(shù)的假設(shè)檢驗(yàn),常用t檢驗(yàn),選用統(tǒng)計(jì)量t的計(jì)算公式如下:
=n-2
目前十五頁\總數(shù)三十五頁\編于十點(diǎn)H0:
=0
H1:
≠0=0.05r=0.61,n=31,代入公式t==n-2=31-2=29
t=4.14查t值表,t0.05(29)=2.045
查t值表,t0.05(29)=2.756,上述計(jì)算t=4.14>2.045,由t所推斷的P值小于0.05,按=0.05水準(zhǔn)拒絕,接受,認(rèn)為臨產(chǎn)婦24小時(shí)內(nèi)尿中雌三醇濃度與產(chǎn)兒體重之間有正相關(guān)關(guān)系。
目前十六頁\總數(shù)三十五頁\編于十點(diǎn)直線相關(guān)的應(yīng)用
前面我們已經(jīng)講過,相關(guān)是研究兩個(gè)變量間的相互關(guān)系,而且這種相互關(guān)系是用相關(guān)系數(shù)反應(yīng)的。在確實(shí)存在相關(guān)關(guān)系的前提下,如果r的絕對(duì)值越大,說明兩個(gè)變量之間的關(guān)聯(lián)程度越強(qiáng),那么,已知一個(gè)變量對(duì)預(yù)測(cè)另一個(gè)變量越有幫助;如果r絕對(duì)值越小,則說明兩個(gè)變量之間的關(guān)系越弱,一個(gè)變量的信息對(duì)猜測(cè)另一個(gè)變量的值無多大幫助。一般說來,當(dāng)樣本量較大(n>100),并對(duì)r進(jìn)行假設(shè)檢驗(yàn),有統(tǒng)計(jì)學(xué)意義時(shí),r的絕對(duì)值大于0.7,則表示兩個(gè)變量高度相關(guān);r的絕對(duì)值大于0.4,小于等于0.7時(shí),則表示兩個(gè)變量之間中度相關(guān);r的絕對(duì)值大于0.2,小于等于0.4時(shí),則兩個(gè)變量低度相關(guān)。
目前十七頁\總數(shù)三十五頁\編于十點(diǎn)
前面我們討論了待產(chǎn)婦尿中雌三醇含量和產(chǎn)兒體重之間的關(guān)系,知道了二者之間成正相關(guān)。那么,如果我們知道了一位待產(chǎn)婦的尿雌三醇含量,能推斷出產(chǎn)兒的體重嗎?或產(chǎn)兒的體重可能在什么范圍內(nèi)呢?還有,隨著身高的增加,體重也在增大,它們之間也成正相關(guān)關(guān)系。那么,身高每增加1厘米,體重增加多少克呢?上面的相關(guān)關(guān)系分析不能提供給我們需要的答案。這些要用直線回歸的方法來解決。目前十八頁\總數(shù)三十五頁\編于十點(diǎn)直線回歸SimpleRegression目前十九頁\總數(shù)三十五頁\編于十點(diǎn)當(dāng)我們知道了兩個(gè)變量之間有直線相關(guān)關(guān)系,并且一個(gè)變量的變化會(huì)引起另一個(gè)變量的變化,這時(shí),如果它們之間存在準(zhǔn)確、嚴(yán)格的關(guān)系,它們的變化可用函數(shù)方程來表示,叫它們是函數(shù)關(guān)系,它們之間的關(guān)系式叫函數(shù)方程。但在實(shí)際生活當(dāng)中,由于其它因素的干擾,許多雙變量之間的關(guān)系并不是嚴(yán)格的函數(shù)關(guān)系,不能用函數(shù)方程反映,為了區(qū)別于兩變量間的函數(shù)方程,我們稱這種關(guān)系式為直線回歸方程,這種關(guān)系為直線回歸.目前二十頁\總數(shù)三十五頁\編于十點(diǎn)直線回歸就是用來描述一個(gè)變量如何依賴于另一個(gè)變量
目前二十一頁\總數(shù)三十五頁\編于十點(diǎn)回歸方程
直線回歸的任務(wù)就是要找出一個(gè)變量隨另一個(gè)變量變化的直線方程,我們把這個(gè)直線方程叫做直線回歸方程。
式中的是由自變量X推算應(yīng)變量Y的估計(jì)值,a是回歸直線在Y軸上的截距,即X=0時(shí)的Y值;b為樣本的回歸系數(shù),即回歸直線的斜率,表示當(dāng)X變動(dòng)一個(gè)單位時(shí),Y平均變動(dòng)b個(gè)單位。如果a、b已知,代入上式,就可求得直線回歸方程。
目前二十二頁\總數(shù)三十五頁\編于十點(diǎn)回歸系數(shù)根據(jù)上例的數(shù)據(jù),求待產(chǎn)婦尿中雌三醇含量與產(chǎn)兒體重之間的回歸方程。從相關(guān)系數(shù)的計(jì)算中,已經(jīng)求得:目前二十三頁\總數(shù)三十五頁\編于十點(diǎn)這就是我們求得的二者關(guān)系的回歸方程目前二十四頁\總數(shù)三十五頁\編于十點(diǎn)回歸直線的描繪
根據(jù)求得的回歸方程,可以在自變量X的實(shí)測(cè)范圍內(nèi)任取兩個(gè)值,代入方程中,求得相應(yīng)的兩個(gè)Y值,以這兩對(duì)數(shù)據(jù)找出對(duì)應(yīng)的兩個(gè)坐標(biāo)點(diǎn),將兩點(diǎn)連接為一條直線,就是該方程的回歸直線?;貧w直線一定經(jīng)過(0,a),()。這兩點(diǎn)可以用來核對(duì)圖線繪制是否正確。目前二十五頁\總數(shù)三十五頁\編于十點(diǎn)目前二十六頁\總數(shù)三十五頁\編于十點(diǎn)與直線相關(guān)一樣,直線回歸方程也是從樣本資料計(jì)算而得的,同樣也存在著抽樣誤差問題。所以,需要對(duì)樣本的回歸系數(shù)b進(jìn)行假設(shè)檢驗(yàn),以判斷b是否從回歸系數(shù)為零的總體中抽得。為了判斷抽樣誤差的影響,需對(duì)回歸系數(shù)進(jìn)行假設(shè)檢驗(yàn)??傮w的回歸系數(shù)一般用β表示。
目前二十七頁\總數(shù)三十五頁\編于十點(diǎn)=2.15+0.061X
是否一定能說明雌三醇與產(chǎn)兒體重之間存在回歸關(guān)系?
目前二十八頁\總數(shù)三十五頁\編于十點(diǎn)1.方差分析F=MS組間/MS組內(nèi)2.t檢驗(yàn)
回歸系數(shù)的假設(shè)檢驗(yàn)H0:β=0H1:β≠0α=0.05選擇合適的假設(shè)檢驗(yàn)方法,計(jì)算統(tǒng)計(jì)量計(jì)算概率值P做出推論:統(tǒng)計(jì)學(xué)結(jié)論和專業(yè)結(jié)論目前二十九頁\總數(shù)三十五頁\編于十點(diǎn)采用t檢驗(yàn)方法其中Sy.x為各觀察值Y到回歸直線的距離的標(biāo)準(zhǔn)差,表示去除X影響后Y的變異程度,
目前三十頁\總數(shù)三十五頁\編于十點(diǎn)自由度=31-2=29,查t值表,t0.05(29)=2.045,P<0.05,按=0.05檢驗(yàn)水準(zhǔn),拒絕H0,認(rèn)為待產(chǎn)婦24小時(shí)尿中雌三醇含量與產(chǎn)兒體重之間存在直線回歸關(guān)系。目前三十一頁\總數(shù)三十五頁\編于十點(diǎn)直線回歸的應(yīng)用
描述兩變量之間的依存關(guān)系:通過回歸系數(shù)的假設(shè)檢驗(yàn),若認(rèn)為兩變量之間存在直線回歸關(guān)系,則可用直線回歸來描述。例如上例回歸方程:就是待產(chǎn)婦尿雌三醇含量與產(chǎn)兒出生體重的定量表達(dá)式。利用回歸方程進(jìn)行預(yù)測(cè):把自變量代入回歸方程,對(duì)應(yīng)變量進(jìn)行估計(jì),可求出應(yīng)變量的波動(dòng)范圍。例如,已知某待產(chǎn)婦的尿雌三醇濃度,代入回歸方程,再用區(qū)間估計(jì)的方法,即可知道生產(chǎn)時(shí),產(chǎn)兒的體重的范圍。
利用回歸方程進(jìn)行統(tǒng)計(jì)控制
利用多元回歸描述多因素的影響
目前三十二頁\總數(shù)三十五頁\編于十點(diǎn)應(yīng)用直線相關(guān)與回歸的注意事項(xiàng)
1.實(shí)際意義進(jìn)行相關(guān)回歸分析要有實(shí)際意義,不可把毫無關(guān)系的兩個(gè)事物或現(xiàn)象用來作相關(guān)回歸分析。例如,有人說,孩子長,公園里的小樹也在長。求孩子和小樹之間的相關(guān)關(guān)系就毫無意義,用孩子的身高推測(cè)小樹的高度則更加慌謬。
2.相關(guān)關(guān)系相關(guān)關(guān)系不一定是因果關(guān)系,也可能是伴隨關(guān)系,并不能證明事物間有內(nèi)在聯(lián)系,例如,有人發(fā)現(xiàn),對(duì)于在校兒童,鞋的大小與閱讀技能有很強(qiáng)的相關(guān)關(guān)系。然而,學(xué)會(huì)新詞并不能使腳變大,而是涉及到第三個(gè)因素??年齡。當(dāng)兒童長大一些,他們的閱讀能力會(huì)提高而且由于長大也穿不下原來的鞋。
目前三十三頁\總數(shù)三十五頁\編于十點(diǎn)3.利用散點(diǎn)圖對(duì)于性質(zhì)不明確的兩組數(shù)據(jù),可先做散點(diǎn)圖,在圖上看它們有無關(guān)系、關(guān)系的密切程度、是正相關(guān)還是負(fù)相關(guān),然后再進(jìn)行相關(guān)回歸分析。4.變量范圍相關(guān)分析和回歸方程僅適用于樣本的原始數(shù)據(jù)范圍之內(nèi),出了這個(gè)范圍,我們不能得出兩變量的相關(guān)關(guān)系和原來的回歸關(guān)系。目前三十四頁\總數(shù)三十五頁\編于十點(diǎn)相關(guān)與回歸的區(qū)別
1.意義:相關(guān)反映兩變量的相互關(guān)系,即在兩個(gè)變量中,任何一個(gè)的變化都會(huì)引起另一個(gè)的變化,是一種雙向變化的關(guān)系?;貧w是反映兩個(gè)變量的依存關(guān)系,一個(gè)變量的改變會(huì)引起另一個(gè)變量的變化,是一種單向的關(guān)系。2.應(yīng)用:研究兩個(gè)變量的相互關(guān)系用相關(guān)分析。研究兩個(gè)變量的依存關(guān)系用回歸分析。3.研究性質(zhì):相關(guān)是對(duì)兩
溫馨提示
- 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請(qǐng)下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請(qǐng)聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
- 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會(huì)有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
- 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
- 5. 人人文庫網(wǎng)僅提供信息存儲(chǔ)空間,僅對(duì)用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對(duì)用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對(duì)任何下載內(nèi)容負(fù)責(zé)。
- 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請(qǐng)與我們聯(lián)系,我們立即糾正。
- 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶因使用這些下載資源對(duì)自己和他人造成任何形式的傷害或損失。
最新文檔
- 2025年度汽車牌照借用與租賃期限調(diào)整協(xié)議
- 2025年度私人法律援助合作協(xié)議
- 第九單元實(shí)驗(yàn)活動(dòng)6一定溶質(zhì)質(zhì)量分?jǐn)?shù)的氯化鈉溶液的配制教學(xué)設(shè)計(jì)-2024-2025學(xué)年九年級(jí)化學(xué)人教版(2024)下冊(cè)
- 住宅老舊電梯更新改造實(shí)施方案
- 2025年度跨國公司股權(quán)變更協(xié)議書模板
- 2025年度文化產(chǎn)業(yè)項(xiàng)目投資合同格式規(guī)范
- 5《守株待兔》教學(xué)設(shè)計(jì)-2023-2024學(xué)年三年級(jí)下冊(cè)語文統(tǒng)編版
- 第六章幾何圖形初步單元起始課 教學(xué)設(shè)計(jì)2024-2025學(xué)年人教版數(shù)學(xué)七年級(jí)上冊(cè)
- 杭州瑜伽館裝修合同模板
- 2025年度車輛運(yùn)輸安全與車輛保險(xiǎn)合作協(xié)議
- 聯(lián)通欠費(fèi)催繳業(yè)務(wù)項(xiàng)目實(shí)施方案
- 《學(xué)位論文選題與寫作》教學(xué)大綱
- 《三國演義》題庫單選題100道及答案解析
- 全國網(wǎng)約車出租車駕駛員公共題模擬考試題及答案
- 2024電動(dòng)牙刷行業(yè)洞察
- 總經(jīng)理助理招聘面試題與參考回答(某大型央企)2025年
- 高盛-比亞迪:全球汽車市場(chǎng)上的新興領(lǐng)先企業(yè)-2024-10-企業(yè)研究
- 無人機(jī)實(shí)操技術(shù)課件:模擬器飛行
- 2024-2030年一次性治療服裝市場(chǎng)發(fā)展現(xiàn)狀分析及行業(yè)投資戰(zhàn)略研究報(bào)告
- 關(guān)于開展農(nóng)業(yè)領(lǐng)域非法集資活動(dòng)風(fēng)險(xiǎn)排查工作的總結(jié)
- 幼兒園食品安全教育課件
評(píng)論
0/150
提交評(píng)論