版權(quán)說(shuō)明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請(qǐng)進(jìn)行舉報(bào)或認(rèn)領(lǐng)
文檔簡(jiǎn)介
第三節(jié)直線相關(guān)第二節(jié)直線回歸第一節(jié)回歸和相關(guān)的概念第七章直線回歸與相關(guān)一、變量的關(guān)系二、相關(guān)變量三、回歸分析和相關(guān)分析第一節(jié)回歸和相關(guān)的概念函數(shù)關(guān)系一、變量的關(guān)系xy是一一對(duì)應(yīng)的確定關(guān)系設(shè)有兩個(gè)變量x和y,當(dāng)變量x取某個(gè)數(shù)值時(shí),
y依確定的關(guān)系取相應(yīng)的值,則稱y是x的函數(shù),記為y=f(x),則x稱為自變量,y稱為因變量各觀測(cè)點(diǎn)落在一條線上相關(guān)關(guān)系xy變量間關(guān)系不能用函數(shù)關(guān)系精確表達(dá)一個(gè)變量的取值不能由另一個(gè)變量唯一確定當(dāng)變量x取某個(gè)值時(shí),變量y的取值可能有幾個(gè)各觀測(cè)點(diǎn)分布在直線周圍黃牛的體長(zhǎng)與體重的關(guān)系⑴、相關(guān)關(guān)系的類型相關(guān)關(guān)系非線性相關(guān)線性相關(guān)正相關(guān)正相關(guān)負(fù)相關(guān)負(fù)相關(guān)完全相關(guān)不相關(guān)⑵、相關(guān)關(guān)系的圖示不相關(guān)負(fù)線性相關(guān)正線性相關(guān)非線性相關(guān)完全負(fù)線性相關(guān)完全正線性相關(guān)7一個(gè)變量的變化受另一個(gè)或多個(gè)變量的影響仔豬的生長(zhǎng)速度受遺傳特性、營(yíng)養(yǎng)水平、飼養(yǎng)管理?xiàng)l件等因素的影響;子代的身高受親本身高的影響相關(guān)變量存在相關(guān)關(guān)系的變量稱為相關(guān)變量。相關(guān)變量間的關(guān)系分為兩類因果關(guān)系平行關(guān)系二、相關(guān)變量相關(guān)變量存在相關(guān)關(guān)系的變量稱為相關(guān)變量。相關(guān)變量間的關(guān)系分為兩類因果關(guān)系平行關(guān)系二、相關(guān)變量?jī)蓚€(gè)變量之間互為因果或共同受到另外因素的影響人的身高和體重之間的關(guān)系;兄弟姐妹身高之間的關(guān)系一元回歸分析研究“一因一果”,即一個(gè)自變量與一個(gè)因變量的回歸分析多元回歸分析研究“多因一果”,即多個(gè)自變量與一個(gè)因變量的回歸分析回歸分析研究變量之間的因果關(guān)系以計(jì)算回歸方程為基礎(chǔ)的分析方法x為自變量(表示原因的變量)y為因變量或依變量(表示結(jié)果的變量)三、回歸分析和相關(guān)分析回歸分析的任務(wù)揭示因果關(guān)系的變量間的聯(lián)系形式建立它們之間的回歸方程利用所建立的回歸方程,由自變量(原因)來(lái)預(yù)測(cè)因變量(結(jié)果)簡(jiǎn)單相關(guān)分析對(duì)兩個(gè)變量間的直線關(guān)系進(jìn)行相關(guān)分析偏相關(guān)分析研究其余變量保持不變的情況下兩個(gè)變量間的線性相關(guān)相關(guān)分析以計(jì)算相關(guān)系數(shù)為基礎(chǔ)的統(tǒng)計(jì)分析方法研究呈平行關(guān)系的相關(guān)變量之間的關(guān)系x和y都受誤差的影響,無(wú)自變量和因變量的區(qū)別變量間的關(guān)系及分析方法隨機(jī)關(guān)系(無(wú)關(guān))三、預(yù)測(cè)及應(yīng)用二、回歸方程的顯著性檢驗(yàn)一、直線回歸方程的建立第二節(jié)直線回歸一、直線回歸方程的建立對(duì)于兩個(gè)相關(guān)變量,一個(gè)變量用x表示,另一個(gè)變量用y表示,如果通過(guò)試驗(yàn)或調(diào)查獲得兩個(gè)變量的n對(duì)觀測(cè)值:
(x1,y1),(x2,y2),……,(xn,yn)如何知道x和y間的變化趨勢(shì)?
㈠、散點(diǎn)圖直觀地、定性地表示了兩個(gè)變量之間的關(guān)系通過(guò)散點(diǎn)圖可初步判斷兩個(gè)變量是否相關(guān);若相關(guān),是直線型還是曲線型相關(guān)兩個(gè)變量間直線關(guān)系的性質(zhì)(是正相關(guān)還是負(fù)相關(guān))和相關(guān)程度(是密切還是不密切)
㈡、直線回歸的數(shù)學(xué)模型變量y與x內(nèi)在聯(lián)系,可用一條線性方程表示:y=+x因變量y的實(shí)際觀測(cè)值總是帶有隨機(jī)誤差因變量y的實(shí)際觀測(cè)值yi記為yi
=+xi+i
(i=1,2,…,n)回歸模型:描述因變量y如何依賴于自變量x和誤差項(xiàng)的方程模型參數(shù)相互獨(dú)立,服從N(0,2)誤差項(xiàng)ε是一個(gè)期望值為0的隨機(jī)變量,即E(ε)=0。對(duì)于一個(gè)給定的x值,y的期望值為:E(y)=+x誤差項(xiàng)ε是一個(gè)服從正態(tài)分布的隨機(jī)變量,且相互獨(dú)立。即ε~N(0,σ2)基本假定回歸方程:描述y的期望值如何依賴于x的方程簡(jiǎn)單線性回歸方程的形式如下E(y)=+x方程的圖示是一條直線,因此也稱為直線回歸方程是回歸直線在y軸上的截距,是當(dāng)x=0時(shí)y的期望值是直線的斜率,稱為回歸系數(shù),表示當(dāng)x每變動(dòng)一個(gè)單位時(shí),y的平均變動(dòng)值
㈢、回歸方程1、估計(jì)(經(jīng)驗(yàn))的回歸方程總體回歸參數(shù)和是未知的,必需利用樣本數(shù)據(jù)去估計(jì)用樣本統(tǒng)計(jì)量a和b代替回歸方程中的未知參數(shù)和,就得到了估計(jì)的回歸方程簡(jiǎn)單線性回歸中估計(jì)的回歸方程為a叫做樣本回歸截距,是回歸直線與y軸交點(diǎn)的縱坐標(biāo),當(dāng)x=0時(shí),y=ab叫做樣本回歸系數(shù),表示x改變一個(gè)單位,y平均改變的數(shù)量;b的符號(hào)反映了x影響y的性質(zhì),b的絕對(duì)值大小反映了x影響y的程度y叫做回歸估計(jì)值,是當(dāng)x取某一個(gè)值時(shí),y值平均數(shù)+x的估計(jì)值2、參數(shù)和
的估計(jì)用最小二乘法擬合的直線與實(shí)際數(shù)據(jù)的誤差比其他任何直線都小通過(guò)計(jì)算因變量的觀察值與估計(jì)值之間的離差平方和達(dá)到最小,來(lái)求得a和b的方法。即最小二乘法(圖示)xy(xn,yn)(x1,y1)(x2,y2)(xi,yi)^ei=yi-yi}據(jù)微積分的極值原理,Q(a,b)對(duì)a,b的一階偏導(dǎo)數(shù)等于0,即計(jì)算公式【例】在四川白鵝的生產(chǎn)性能研究中,得到如下一組關(guān)于雛鵝重(g)與70日齡重(g)的數(shù)據(jù),試建立70日齡重(y)與雛鵝重(x)的直線回歸方程。已知:x2=118112,x=1182
y=32650,xy=32526101、作散點(diǎn)圖以雛鵝重(x)為橫坐標(biāo),70日齡重(y)為縱坐標(biāo)作散點(diǎn)圖2、計(jì)算回歸截距a,回歸系數(shù)b,建立直線回歸方程x2=118112,x=1182
y=32650,xy=3252610y=582.1816+21.7122x二、回歸方程的顯著性檢驗(yàn)若x和y變量間并不存在直線關(guān)系,但由n對(duì)觀測(cè)值(xi,yi)也可以根據(jù)上面介紹的方法求得一個(gè)回歸方程
y=a+bx顯然,這樣的回歸方程所反應(yīng)的兩個(gè)變量間的直線關(guān)系是不真實(shí)的如何判斷直線回歸方程所反應(yīng)的兩個(gè)變量間的直線關(guān)系的真實(shí)性?
1、離差平方和的分解因變量y
變異來(lái)源于兩個(gè)方面:由自變量x的取值不同造成的隨機(jī)誤差等其他因素造成的對(duì)一個(gè)具體的觀測(cè)值來(lái)說(shuō),變異大小可以通過(guò)該實(shí)際觀測(cè)值與其均值之差y-y
來(lái)表示三個(gè)平方和的關(guān)系兩邊平方后求和dfy
=n-1,dfR=1自變量個(gè)數(shù),dfr=n–2SSy=SSR+SSr
dfy=dfR+dfr總平方和SSy{回歸平方和SSR{殘差平方和SSr{總平方和:SSy=(yi
-y)2反映y的總變異程度,即因變量的n
個(gè)觀察值與其均值的總離差回歸平方和:SSR=(yi
-y)2反映自變量x
的變化對(duì)因變量y
取值變化的影響,也稱為可解釋的平方和殘差平方和:SSr=(yi
-y)2反映的是除x
以外的其他因素對(duì)y
取值的影響,也稱為不可解釋的平方和或剩余平方和三個(gè)平方和的意義2、線性關(guān)系的檢驗(yàn)——F檢驗(yàn)檢驗(yàn)自變量和因變量之間的線性關(guān)系是否顯著將回歸均方(SSR/dfR)同殘差(SSr/dfr)加以比較,用F檢驗(yàn)來(lái)分析差別是否顯著顯著兩個(gè)變量之間存在線性關(guān)系不顯著兩個(gè)變量之間不存在線性關(guān)系檢驗(yàn)的步驟提出假設(shè)H0:線性關(guān)系不顯著計(jì)算檢驗(yàn)統(tǒng)計(jì)量F確定顯著性水平,并根據(jù)分子自由度1和分母自由度n-2找出臨界值F
作出決策FF,拒絕H0F<F,接受H0【續(xù)前例】四川白鵝70日齡重與雛鵝重回歸關(guān)系方差分析表6-1四川白鵝70日齡重與雛鵝重回歸關(guān)系方差分析
F=213.81>F0.01(1,10)=10.04,P<0.01,表明四川白鵝70日齡重與雛鵝重間存在極顯著的直線關(guān)系。檢驗(yàn)x與y之間是否具有線性關(guān)系理論基礎(chǔ)是回歸系數(shù)b的抽樣分布在一元線性回歸中,等價(jià)于回歸方程的顯著性檢驗(yàn)3、回歸系數(shù)的顯著性檢驗(yàn)——t檢驗(yàn)樣本統(tǒng)計(jì)量b的分布b是根據(jù)最小二乘法求出的樣本統(tǒng)計(jì)量,它有自己的分布b的分布具有如下性質(zhì)分布形式:正態(tài)分布數(shù)學(xué)期望:E(b)=標(biāo)準(zhǔn)差:由于未知,需用其估計(jì)量Sy來(lái)代替得到的估計(jì)的標(biāo)準(zhǔn)差估計(jì)標(biāo)準(zhǔn)誤差Sy實(shí)際觀察值與回歸估計(jì)值離差平方和的均方根反映實(shí)際觀察值在回歸直線周圍的分散狀況從另一個(gè)角度說(shuō)明了回歸直線的擬合程度計(jì)算公式b的抽樣分布樣本統(tǒng)計(jì)量b的分布和計(jì)算E(b)=檢驗(yàn)的步驟提出假設(shè)H0:
=0(沒(méi)有線性關(guān)系)H1:
0(有線性關(guān)系)計(jì)算檢驗(yàn)的統(tǒng)計(jì)量確定顯著性水平,并進(jìn)行決策t>t,拒絕H0t<t,接受H0【續(xù)前例】對(duì)四川白鵝70日齡重與雛鵝重回歸系數(shù)進(jìn)行顯著性檢驗(yàn)提出假設(shè)H0:=0四川白鵝70日齡重與雛鵝重之間無(wú)線性關(guān)系H1:
0四川白鵝70日齡重與雛鵝重之間有線性關(guān)系計(jì)算檢驗(yàn)的統(tǒng)計(jì)量t=b/Sb=21.7122/1.4849=14.62df=n-2=12-2=10,t0.05(10)=2.228,t0.01(10)=3.169
t=14.62>t0.01(10),P<0.01,表明回歸系數(shù)b=21.7122是極顯著的,即四川白鵝70日齡重與雛鵝重間存在極顯著的直線關(guān)系。利用直線回歸方程進(jìn)行預(yù)測(cè)或控制,一般只適用于原來(lái)研究的范圍,不能隨意把范圍擴(kuò)大。在研究范圍內(nèi)兩變量是直線關(guān)系,并不能保證在這研究范圍之外仍然是直線關(guān)系若需要擴(kuò)大預(yù)測(cè)和控制范圍,則要有充分的理論依據(jù)或進(jìn)一步的實(shí)驗(yàn)依據(jù)利用直線回歸方程進(jìn)行預(yù)測(cè)或控制,一般只能內(nèi)推,不要輕易外延三、預(yù)測(cè)及應(yīng)用五、應(yīng)用直線回歸與相關(guān)的注意事項(xiàng)四、相關(guān)系數(shù)與回歸系數(shù)的關(guān)系三、相關(guān)系數(shù)的顯著性檢驗(yàn)二、相關(guān)系數(shù)的計(jì)算一、決定系數(shù)和相關(guān)系數(shù)第三節(jié)直線相關(guān)相關(guān)分析的基本任務(wù):根據(jù)x、y的觀測(cè)值,計(jì)算其相關(guān)程度和并進(jìn)行顯著性檢驗(yàn)一、決定系數(shù)和相關(guān)系數(shù)
直線回歸效果的好壞取決于回歸平方和(y-y)2占總平方和(y-y)2的比例大小。比例越大,直線回歸效果越好,反之則差1、決定系數(shù)比值叫做x對(duì)y的決定系數(shù),記為r2,即:決定系數(shù)的大小表示了回歸方程估測(cè)可靠程度的高低,或者說(shuō)反映了回歸直線的擬合度高低取值范圍在[0,1]之間r2
1,說(shuō)明回歸方程擬合的越好r20,說(shuō)明回歸方程擬合的越差2、相關(guān)系數(shù)(coefficientofcorrelation)兩個(gè)變量之間線性相關(guān)程度稱為簡(jiǎn)單相關(guān)系數(shù)若相關(guān)系數(shù)是根據(jù)總體全部數(shù)據(jù)計(jì)算的,稱為總體相關(guān)系數(shù),記為若是根據(jù)樣本數(shù)據(jù)計(jì)算的,則稱為樣本相關(guān)系數(shù),記為r計(jì)算:相關(guān)系數(shù)取值及其意義r
的取值范圍是[-1,1]|r|=1,為完全相關(guān)r=1,為完全正相關(guān)r=-1,為完全負(fù)正相關(guān)
r=0,不存在線性相關(guān)關(guān)系相關(guān)-1r<0,為負(fù)相關(guān)0<r1,為正相關(guān)|r|1表示關(guān)系越密切|r|0表示關(guān)系越不密切相關(guān)系數(shù)取值及其意義(圖示)-1.0+1.00-0.5+0.5完全負(fù)相關(guān)無(wú)線性相關(guān)完全正相關(guān)負(fù)相關(guān)程度增加r正相關(guān)程度增加【例】計(jì)算10只綿羊的胸圍(cm)和體重(kg)的相關(guān)系數(shù)。解:x2=51904,x=720y2=46818,y=680xy=49123二、相關(guān)系數(shù)的計(jì)算三、相關(guān)系數(shù)的顯著性檢驗(yàn)檢驗(yàn)兩個(gè)變量之間是否存在線性相關(guān)關(guān)系等價(jià)于對(duì)回歸系數(shù)b的檢驗(yàn)采用t檢驗(yàn)或F檢驗(yàn)均可檢驗(yàn)步驟提出假設(shè)H0:H1:0計(jì)算檢驗(yàn)的統(tǒng)計(jì)量確定顯著性水平,并作出決策若t>t,拒絕H0
若t<t,接受H0t檢驗(yàn)的公式
Sr相關(guān)系數(shù)標(biāo)準(zhǔn)誤【續(xù)前例】對(duì)10只綿羊的胸圍(cm)和體重(kg)的相關(guān)系數(shù)進(jìn)行顯著性檢驗(yàn)提出假設(shè)H0:H1:0計(jì)算檢驗(yàn)的統(tǒng)計(jì)量df=n-2=10-2=8,t0.05(8)=2.306,t0.01(8)=3.355t=4.5160>t0.01(8)=3.355,拒絕H0,綿羊的胸圍(cm)和體重(kg)的相關(guān)系數(shù)極顯著四、相關(guān)系數(shù)與回歸系數(shù)的關(guān)系r2=(r)2y=a+bx,相關(guān)系數(shù)b研究對(duì)象都是呈直線關(guān)系的相關(guān)變量直線回歸分析將二個(gè)相關(guān)變量區(qū)分為自變量和因變量,側(cè)重于尋求它們之間的聯(lián)系形式——直線回歸方程相關(guān)分析不區(qū)分自變量和因變量,側(cè)重于揭示變量之間的聯(lián)系程度和性質(zhì)——計(jì)算出相關(guān)系數(shù)實(shí)際進(jìn)行直線回歸分析時(shí),可用相關(guān)系數(shù)顯著性檢驗(yàn)代替直線回歸關(guān)系顯著性檢驗(yàn)兩種分析都是針對(duì)y與x是否存在直線關(guān)系二者的檢驗(yàn)是等價(jià)的相關(guān)系數(shù)顯著,回歸系數(shù)亦顯著相關(guān)系數(shù)不顯著,回歸系數(shù)也必然不顯著直線回歸分析和相關(guān)分析是處理變量間關(guān)系的數(shù)學(xué)方法將這些方法應(yīng)用于生物科學(xué)研究時(shí)要考慮到生物本身的客觀實(shí)際情況變量間是否本身存在相關(guān)關(guān)系其余變量盡量保持一致觀測(cè)值要盡可能的多外推要謹(jǐn)慎正確理解回歸或相關(guān)顯著與否的含義顯著的回歸方程并不一定具有實(shí)踐上意義五、應(yīng)用直線回歸與相關(guān)的注意事項(xiàng)同一變量往往受到許多其它變量的影響研究?jī)蓚€(gè)變量間關(guān)系時(shí),要求其余變量應(yīng)盡量保持在同一水平研究人的身高和胸圍之間的關(guān)系體重固定,身高,胸圍體重變化,結(jié)果就會(huì)變化變量間是否本身存在相關(guān)關(guān)系其余變量盡量保持一致觀測(cè)值要盡可能的多外推要謹(jǐn)慎正確理解回歸或相關(guān)顯著與否的含義顯著的回歸方程并不一定具有實(shí)踐上意義五、應(yīng)用直線回歸與相關(guān)的注意事項(xiàng)兩個(gè)變量成對(duì)觀測(cè)值應(yīng)盡可能多一些可提高分析的精確性,一般至少有5對(duì)以上的觀測(cè)值變量x的取值范圍要盡可能大一些容易發(fā)現(xiàn)兩個(gè)變量間的變化關(guān)系變量間是否本身存在
溫馨提示
- 1. 本站所有資源如無(wú)特殊說(shuō)明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請(qǐng)下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請(qǐng)聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
- 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁(yè)內(nèi)容里面會(huì)有圖紙預(yù)覽,若沒(méi)有圖紙預(yù)覽就沒(méi)有圖紙。
- 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
- 5. 人人文庫(kù)網(wǎng)僅提供信息存儲(chǔ)空間,僅對(duì)用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對(duì)用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對(duì)任何下載內(nèi)容負(fù)責(zé)。
- 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請(qǐng)與我們聯(lián)系,我們立即糾正。
- 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶因使用這些下載資源對(duì)自己和他人造成任何形式的傷害或損失。
最新文檔
- 企業(yè)合同管理制度指南
- 衣柜定制購(gòu)銷合同
- 2025版私募股權(quán)投資融資居間服務(wù)合同樣本3篇
- 二零二五年度房地產(chǎn)項(xiàng)目合作協(xié)議轉(zhuǎn)讓合同
- 物業(yè)服務(wù)合同樣板
- 5G通信技術(shù)服務(wù)合同
- 水果代辦合同
- 二零二五年度區(qū)塊鏈企業(yè)完整管理體系合同2篇
- 混凝土購(gòu)銷簡(jiǎn)單合同范本年
- 三方裝修合同范本
- 2025屆山東省德州市物理高三第一學(xué)期期末調(diào)研模擬試題含解析
- 2024年滬教版一年級(jí)上學(xué)期語(yǔ)文期末復(fù)習(xí)習(xí)題
- 兩人退股協(xié)議書范文合伙人簽字
- 2024版【人教精通版】小學(xué)英語(yǔ)六年級(jí)下冊(cè)全冊(cè)教案
- 汽車噴漆勞務(wù)外包合同范本
- 微項(xiàng)目 探討如何利用工業(yè)廢氣中的二氧化碳合成甲醇-2025年高考化學(xué)選擇性必修第一冊(cè)(魯科版)
- 廣東省廣州市黃埔區(qū)2024-2025學(xué)年八年級(jí)物理上學(xué)期教學(xué)質(zhì)量監(jiān)測(cè)試題
- 2024年重慶南開(kāi)(融僑)中學(xué)中考三模英語(yǔ)試題含答案
- 財(cái)務(wù)管理學(xué)(第10版)課件 第1章 總論
- 《鼻咽癌的診治》課件
- 16J914-1 公用建筑衛(wèi)生間
評(píng)論
0/150
提交評(píng)論