直線回歸和相關(guān)完整版_第1頁
直線回歸和相關(guān)完整版_第2頁
直線回歸和相關(guān)完整版_第3頁
直線回歸和相關(guān)完整版_第4頁
直線回歸和相關(guān)完整版_第5頁
已閱讀5頁,還剩152頁未讀, 繼續(xù)免費(fèi)閱讀

下載本文檔

版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請(qǐng)進(jìn)行舉報(bào)或認(rèn)領(lǐng)

文檔簡(jiǎn)介

直線回歸和相關(guān)田間試驗(yàn)設(shè)計(jì)與統(tǒng)計(jì)分析1回歸和相關(guān)的概念前面幾章討論的資料和統(tǒng)計(jì)方法只著重一個(gè)單獨(dú)變數(shù),例如產(chǎn)量等變數(shù)的分布及其特征在農(nóng)業(yè)試驗(yàn)工作中,大部分問題是包括兩個(gè)或兩個(gè)以上變數(shù)在一起變異的問題例如降雨量、溫度和光照等氣候因子對(duì)番茄產(chǎn)量的影響等。2023/10/201回歸和相關(guān)的概念把許多種變數(shù)擺在一起的研究,目的在于發(fā)現(xiàn)它們之間存在的規(guī)律性,以預(yù)測(cè)或估計(jì)變數(shù)間的變異趨向,在統(tǒng)計(jì)上稱作回歸與相關(guān)研究研究?jī)蓚€(gè)變數(shù)之間關(guān)系時(shí),因變數(shù)不同而有兩種不同的研究方法。變數(shù)之間的關(guān)系函數(shù)關(guān)系統(tǒng)計(jì)關(guān)系1.變數(shù)之間的關(guān)系1回歸和相關(guān)的概念函數(shù)關(guān)系是一種一一對(duì)應(yīng)的確定關(guān)系不包含誤差的干擾

xy1回歸和相關(guān)的概念統(tǒng)計(jì)關(guān)系一種非確定的關(guān)系一個(gè)變數(shù)取值受到另一個(gè)變數(shù)的影響兩者之間既有關(guān)系,但又不是完全確定的函數(shù)關(guān)系變數(shù)之間的關(guān)系受到誤差的干擾

xy是指一個(gè)變數(shù)的取值受到另一個(gè)變數(shù)的影響,兩者有關(guān)系,但不存在完全確定的函數(shù)關(guān)系。相關(guān)關(guān)系因果關(guān)系:自變數(shù)(原因變數(shù))和依變數(shù)(結(jié)果變數(shù))。從統(tǒng)計(jì)學(xué)角度講,確定性關(guān)系與不確定性關(guān)系的區(qū)別僅在于前者不存在隨機(jī)誤差,而后者不可避免地具有試驗(yàn)誤差。1回歸和相關(guān)的概念2.自變數(shù)和依變數(shù)變數(shù)之間的統(tǒng)計(jì)關(guān)系因果關(guān)系相關(guān)關(guān)系自變數(shù)(independentvariable)依變數(shù)(dependentvariable)呈現(xiàn)出一種共同變化的特點(diǎn)1回歸和相關(guān)的概念3.回歸分析和相關(guān)分析回歸分析對(duì)具有因果關(guān)系的兩個(gè)變數(shù),可以推算出Y隨X改變的方程,此時(shí)的方程稱為Y依X的回歸方程(regressionequationofYonX)以計(jì)算回歸方程為基礎(chǔ)的分析方法稱為回歸分析原則上兩個(gè)變數(shù)中Y含有試驗(yàn)誤差而X不含有試驗(yàn)誤差時(shí)著重進(jìn)行回歸分析1回歸和相關(guān)的概念3.回歸分析和相關(guān)分析回歸分析的類型一個(gè)自變量?jī)蓚€(gè)及兩個(gè)以上自變量回歸模型多元回歸一元回歸線性回歸非線性回歸線性回歸非線性回歸回歸分析的特征:①有自變數(shù)和依變數(shù)之分;②具有預(yù)測(cè)的作用,即可以由X的數(shù)量變化來預(yù)測(cè)Y的數(shù)量變化;③自變數(shù)x無誤差或誤差很小,依變數(shù)y存在誤差?;貧w分析(regressionanalysis)

對(duì)回歸模型資料,通常在確定自變數(shù)和依變數(shù)的基礎(chǔ)上,建立由X來預(yù)測(cè)Y的回歸方程式,并推定當(dāng)自變數(shù)X取某一定值時(shí)依變數(shù)Y將會(huì)在什么范圍內(nèi)變化。1回歸和相關(guān)的概念3.回歸分析和相關(guān)分析相關(guān)分析對(duì)具有相關(guān)關(guān)系的兩個(gè)變數(shù),可以計(jì)算出表示相關(guān)密切程度的統(tǒng)計(jì)數(shù),并檢驗(yàn)其顯著性通常在Y和X均含有誤差時(shí)著重進(jìn)行相關(guān)分析1回歸和相關(guān)的概念3.回歸分析和相關(guān)分析相關(guān)分析在直線相關(guān)時(shí),這一統(tǒng)計(jì)數(shù)稱為相關(guān)系數(shù)(correlationcoefficient),記為r在多元相關(guān)時(shí)稱為復(fù)相關(guān)系數(shù)(multiplecorrelation)記為Ry.1.2…m曲線相關(guān)時(shí)稱為相關(guān)指數(shù)(correlationindex),記為R1回歸和相關(guān)的概念3.回歸分析和相關(guān)分析相關(guān)系數(shù)簡(jiǎn)單相關(guān)系數(shù)r復(fù)相關(guān)系數(shù)Ry.1.2..m相關(guān)指數(shù)R直線相關(guān)多元相關(guān)曲線相關(guān)偏相關(guān)系數(shù)Ry.1…多元相關(guān)相關(guān)系數(shù)的種類①表示兩個(gè)變數(shù)的偕同變異;②沒有自變數(shù)與依變數(shù)之分;③不具有預(yù)測(cè)的作用;④存在隨機(jī)誤差。特征:

相關(guān)分析

(correlationanalysis):研究?jī)蓚€(gè)變數(shù)之間有無關(guān)系,以及關(guān)系的密切程度和性質(zhì),而不需要由一變數(shù)去估測(cè)另一變數(shù)。相關(guān)系數(shù)復(fù)相關(guān)系數(shù)相關(guān)指數(shù)rRy.12…mR1回歸和相關(guān)的概念回歸分析和相關(guān)關(guān)系對(duì)具有因果關(guān)系的兩個(gè)變數(shù),統(tǒng)計(jì)分析的任務(wù)是由試驗(yàn)數(shù)據(jù)推算一個(gè)方程為y依x的回歸方程對(duì)具有相關(guān)關(guān)系的兩個(gè)變數(shù),統(tǒng)計(jì)分析的目標(biāo)是計(jì)算表示y和x相關(guān)密切和程度的統(tǒng)計(jì)數(shù)并測(cè)其顯著性1回歸和相關(guān)的概念回歸分析和相關(guān)關(guān)系原則上y含有試驗(yàn)誤差而x不含試驗(yàn)誤差時(shí)著重進(jìn)行回歸分析;y和x均含有試驗(yàn)誤差時(shí)則著重去進(jìn)行相關(guān)分析但沒有明顯的界限,而實(shí)際它們的分析包括著相互的信息1回歸和相關(guān)的概念兩個(gè)變數(shù)資料的散點(diǎn)圖

對(duì)具有統(tǒng)計(jì)關(guān)系的兩個(gè)變數(shù)資料,將其觀測(cè)值分別以坐標(biāo)點(diǎn)的形式標(biāo)記與同一直角坐標(biāo)平面上,獲得散點(diǎn)圖(scatterdiagram)通過散點(diǎn)圖可以初步判定變數(shù)之間的關(guān)系相關(guān)的性質(zhì)和密切程度變數(shù)的關(guān)系是直線型,還是非直線型是否有一些特殊的點(diǎn)表示著其他因素的干擾1回歸和相關(guān)的概念1234x,生物產(chǎn)量(g)0.00.51.01.52.0y,稻谷產(chǎn)量(g)水稻單株生物產(chǎn)量與稻谷產(chǎn)量的散點(diǎn)圖1回歸和相關(guān)的概念3.23.644.44.8x,每平方米穎花數(shù)(萬)05560657075y,結(jié)實(shí)率(%)水稻每平方米穎花數(shù)和結(jié)實(shí)率的散點(diǎn)圖1回歸和相關(guān)的概念34567890250300350400450x,最高葉面積指數(shù)y,產(chǎn)量(kg/畝)水稻最高葉面積指數(shù)和畝產(chǎn)量的散點(diǎn)圖第二節(jié)

直線回歸田間試驗(yàn)設(shè)計(jì)與統(tǒng)計(jì)分析2.1直線回歸方程1.直線回歸方程式在散點(diǎn)圖上呈直線趨勢(shì)的兩個(gè)變數(shù),如果要概括其在數(shù)量上的互變規(guī)律,即從X的變化來預(yù)測(cè)或估計(jì)Y的變化,則要采用直線回歸方程來描述linearregressionequation

是和x對(duì)應(yīng)的依變數(shù)的點(diǎn)估計(jì)值

a是回歸截距(regressionintercept)b是回歸系數(shù)(regressioncoefficient)要使能夠最好地代表y和x在數(shù)量上的互變關(guān)系,必須使XY2.1直線回歸方程1.直線回歸方程式分別對(duì)a和b求偏導(dǎo)數(shù)并另其為0,即可獲得正規(guī)方程組(normalequations):2.1直線回歸方程1.直線回歸方程式正規(guī)方程組解之得:2.1直線回歸方程1.直線回歸方程式

是x的離均差和y的離均差的乘積和,簡(jiǎn)稱為乘積和(sumofproducts),記作SP分母是x的離均差平方和,記作SSx2.1直線回歸方程1.直線回歸方程式a、b的取值及意義A、b皆可正可負(fù)若b=0或和0的差異不顯著,表明y的變異和x的取值大小無關(guān),直線回歸關(guān)系不能成立2.1直線回歸方程XY2.1直線回歸方程2.直線回歸的計(jì)算[例]一些夏季害蟲盛發(fā)期的早遲和春季溫度高低有關(guān)。江蘇武進(jìn)連續(xù)9年測(cè)定3月下旬至4月中旬旬平均溫度累積值(x,旬.度)和水稻一代三化螟盛發(fā)期(y,以5月10日為0)的關(guān)系,得結(jié)果于下表。試計(jì)算其直線回歸方程。Y12169273139-1X35.534.131.740.336.840.231.73244.22.1直線回歸方程因而有:從而得到回歸方程:2.1直線回歸方程對(duì)回歸方程的解析回歸系數(shù)的意義:當(dāng)3月下旬至4月中旬的積溫每提高1旬.度時(shí),一代三化螟蟲的盛發(fā)期平均將提早1.1天截距的意義:若積溫為0,則一代三化螟蟲的盛發(fā)期將在6月27-28日由于x的實(shí)測(cè)區(qū)間為[31.7,44.2],根據(jù)回歸方程對(duì)Y的預(yù)測(cè)只能內(nèi)插而不能外延2.1直線回歸方程303438425/5-55/1005/1555/20105/2515(月/日)x,3月下旬至4月中旬平均溫度累積值y,一代三化螟盛發(fā)期2.1直線回歸方程例.在粉皮冬瓜雌花謝花后7-11天測(cè)量果實(shí)縱徑,獲得如下數(shù)據(jù),試作回歸分析謝花后天數(shù)x7891011果實(shí)縱徑y(tǒng)14.316.817.217.618.52.1直線回歸方程2.1直線回歸方程例.測(cè)得大紅番茄果實(shí)橫徑與果重的一組數(shù)據(jù)資料,試作橫徑與果重兩個(gè)變數(shù)間的回歸分析。果實(shí)橫徑x10628.98.587.87.77.47果重y14013213012111610810510695902.1直線回歸方程2.1直線回歸方程四、直線回歸的估計(jì)標(biāo)準(zhǔn)誤滿足為最小的直線回歸方程和實(shí)測(cè)的觀察點(diǎn)并不重合,表明該回歸方程仍然存在隨機(jī)誤差。Q就是誤差的一種度量,稱之為離回歸平方和(sumofsquarestodeviationfromregression)或剩余平方和2.1直線回歸方程四、直線回歸的估計(jì)標(biāo)準(zhǔn)誤由于在建立回歸方程時(shí)用了a和b兩個(gè)統(tǒng)計(jì)數(shù),故Q的自由度ν=n-2因而,可定義回歸方程的估計(jì)標(biāo)準(zhǔn)誤為:越小,各觀測(cè)值點(diǎn)越靠近回歸曲線,反之,越遠(yuǎn)2.1直線回歸方程四、直線回歸的估計(jì)標(biāo)準(zhǔn)誤Q值的計(jì)算:2.1直線回歸方程四、直線回歸的估計(jì)標(biāo)準(zhǔn)誤Q值的計(jì)算:2.1直線回歸方程Q值的計(jì)算:使用EXCEL中STEYX函數(shù)計(jì)算返回通過線性回歸法計(jì)算每個(gè)x的y預(yù)測(cè)值時(shí)所產(chǎn)生的標(biāo)準(zhǔn)誤差。標(biāo)準(zhǔn)誤差用來度量根據(jù)單個(gè)x變量計(jì)算出的y預(yù)測(cè)值的誤差量。語法STEYX(known_y's,known_x's)Known_y's

為因變量數(shù)據(jù)點(diǎn)數(shù)組或區(qū)域。Known_x's

為自變量數(shù)據(jù)點(diǎn)數(shù)組或區(qū)域。2.1直線回歸方程五、直線回歸的數(shù)學(xué)模型和基本假定數(shù)學(xué)模型樣本的線性組成為:2.1直線回歸方程五、直線回歸的數(shù)學(xué)模型和基本假定基本假定:Y是隨機(jī)變數(shù),而X是沒有誤差的固定變數(shù),至少和Y比較起來X的誤差小到可以忽略在任一X上都存在一個(gè)Y的總體,是作正態(tài)分布的,其平均數(shù)是X的線形函數(shù)2.1直線回歸方程五、直線回歸的數(shù)學(xué)模型和基本假定基本假定:所有Y總體都具有共同的方差,這一方差不因X的不同而不同,直線回歸總體具有隨機(jī)誤差項(xiàng)相互獨(dú)立,并作正態(tài)分布,具有樣本b≠0總體β≠0?回歸系數(shù)也有抽樣誤差!總體β=0HAH02.2直線回歸的假設(shè)測(cè)驗(yàn)和區(qū)間估計(jì)一、直線回歸的假設(shè)測(cè)驗(yàn)1、回歸關(guān)系的假設(shè)測(cè)驗(yàn)t測(cè)驗(yàn)若總體不存在直線回歸關(guān)系,則總體回歸系數(shù)β=0若總體存在直線回歸關(guān)系,則總體回歸系數(shù)β≠0。2.2直線回歸的假設(shè)測(cè)驗(yàn)和區(qū)間估計(jì)一、直線回歸的假設(shè)測(cè)驗(yàn)-t測(cè)驗(yàn)對(duì)直線回歸的假設(shè)測(cè)驗(yàn)為:H0:β=0;對(duì)HA:β≠0回歸系數(shù)b的標(biāo)準(zhǔn)誤為:遵循ν=n-2的t分布2.2直線回歸的假設(shè)測(cè)驗(yàn)和區(qū)間估計(jì)[例]水稻一代三化螟盛發(fā)期夏季害蟲盛發(fā)期的早遲和春季溫度高低有關(guān)Y12169273139-1X35.534.131.740.336.840.231.73244.2試測(cè)驗(yàn)回歸關(guān)系的顯著性2.2直線回歸的假設(shè)測(cè)驗(yàn)和區(qū)間估計(jì)ν=n-2=9-2=72.2直線回歸的假設(shè)測(cè)驗(yàn)和區(qū)間估計(jì)接受HA:β≠0,即認(rèn)為積溫和一代三化螟盛發(fā)期是有真實(shí)的直線回歸關(guān)系。2.2直線回歸的假設(shè)測(cè)驗(yàn)和區(qū)間估計(jì)一、直線回歸的假設(shè)測(cè)驗(yàn)F測(cè)驗(yàn)2.2直線回歸的假設(shè)測(cè)驗(yàn)和區(qū)間估計(jì)總平方和ν=n-1離回歸平方和ν=n-2回歸平方和ν=(n-1)-(n-2)=12.2直線回歸的假設(shè)測(cè)驗(yàn)和區(qū)間估計(jì)三個(gè)平方和的意義總平方和(SSy)反映因變量的n個(gè)觀察值與其均值的總離差回歸平方和(SSR或U)反映自變量x的變化對(duì)因變量y取值變化的影響,或者說,是由于x與y之間的線性關(guān)系引起的y的取值變化,也稱為可解釋的平方和離回歸平方和(SSE或Q)反映除x以外的其他因素對(duì)y取值的影響,也稱為不可解釋的平方和或剩余平方和2.1直線回歸方程XYF測(cè)驗(yàn)SS總=SS回+SS離ν總=ν回+ν離ν總=n-1ν回=1ν離=n-22.2直線回歸的假設(shè)測(cè)驗(yàn)和區(qū)間估計(jì)2.2直線回歸的假設(shè)測(cè)驗(yàn)和區(qū)間估計(jì)[例]水稻一代三化螟盛發(fā)期夏季害蟲盛發(fā)期的早遲和春季溫度高低有關(guān)用F測(cè)驗(yàn)檢測(cè)回歸關(guān)系的顯著性變異來源DFSSMSFF0.01回歸1174.8886174.888616.40**12.25離回歸774.667010.6667總變異8245556SUMMARYOUTPUT回歸統(tǒng)計(jì)MultipleR0.837138563RSquare0.700800973AdjustedRSquare0.658058255標(biāo)準(zhǔn)誤差3.265988788觀測(cè)值9方差分析

dfSSMSFSignificanceF回歸分析1174.8887762174.888776216.395798030.004875908殘差774.6667793410.66668276總計(jì)8245555556

Coefficients標(biāo)準(zhǔn)誤差tStatP-value下限95.0%上限95.0%Intercept48.5493193610.127786264.7936753520.00198070424.6009103672.49772836XVariable1-1.0996220390.271567101-4.0491725120.004875908-1.74177619-0.4574678872.2直線回歸的假設(shè)測(cè)驗(yàn)和區(qū)間估計(jì)直線回歸分析中的t檢驗(yàn)和F檢驗(yàn)F(v1=1,v2=n-2)=t2(v=n-2)在直線回歸方程中,t檢驗(yàn)和F檢驗(yàn)的結(jié)果是一致的在多元非線性回歸方程中F檢驗(yàn)是針對(duì)回歸方程總體回歸關(guān)系存在與否的檢驗(yàn)而t檢驗(yàn)是對(duì)各個(gè)回歸系數(shù)是否為零進(jìn)行檢驗(yàn)因此,應(yīng)先進(jìn)行F檢驗(yàn),F值顯著的情況下再進(jìn)行t檢驗(yàn)2.2直線回歸的假設(shè)測(cè)驗(yàn)和區(qū)間估計(jì)兩個(gè)樣本回歸系數(shù)比較時(shí)的假設(shè)檢驗(yàn)若有兩個(gè)直線回歸樣本,分別具有回歸系數(shù)b1、b2和總體回歸系數(shù)β1、β2,則在檢驗(yàn)b1、b2的差異顯著性時(shí),有:Ho:β1-β2=0HA:β1-β2≠0兩個(gè)樣本回歸數(shù)差數(shù)的標(biāo)準(zhǔn)誤為2.2直線回歸的假設(shè)測(cè)驗(yàn)和區(qū)間估計(jì)兩個(gè)樣本回歸系數(shù)比較時(shí)的假設(shè)檢驗(yàn)由于遵循v=(n1-2)+(n2-2)的t分布,故由可測(cè)定在β1-β2=0的總體中獲得現(xiàn)有

b1-b2≠0的概率2.2直線回歸的假設(shè)測(cè)驗(yàn)和區(qū)間估計(jì)二.直線回歸的區(qū)間估計(jì)-直線回歸的抽樣誤差在直線回歸總體中抽取若干樣本時(shí),由于的存在,各樣本的a、b值都有誤差由給出的點(diǎn)估計(jì)的精確性,決定于和a、b的誤差的大小因此對(duì)α、β以及μY/X作出區(qū)間估計(jì)是比較科學(xué)的2.2直線回歸的假設(shè)測(cè)驗(yàn)和區(qū)間估計(jì)回歸截距的置信區(qū)間樣本回歸截距而和b的誤差a的標(biāo)準(zhǔn)誤為2.2直線回歸的假設(shè)測(cè)驗(yàn)和區(qū)間估計(jì)回歸截距的置信區(qū)間而(a-α)/sa是遵循ν=n-2的t分布所以對(duì)總體回歸截距α有95%可靠度的置信區(qū)間為2.2直線回歸的假設(shè)測(cè)驗(yàn)和區(qū)間估計(jì)回歸系數(shù)的置信區(qū)間服從自由度為n-2的t分布可以導(dǎo)出β的95%、99%置信區(qū)間為:2.2直線回歸的假設(shè)測(cè)驗(yàn)和區(qū)間估計(jì)條件總體平均數(shù)

Y/X的置信區(qū)間根據(jù)回歸模型的定義,每一個(gè)X上都由一個(gè)Y變數(shù)的條件總體,該條件總體的平均數(shù)為

Y/X

,而樣本估計(jì)值為

由于,故的標(biāo)準(zhǔn)誤為:

2.2直線回歸的假設(shè)測(cè)驗(yàn)和區(qū)間估計(jì)條件總體平均數(shù)

Y/X的置信區(qū)間可以導(dǎo)出

Y/X的95%、99%置信區(qū)間為:由于服從自由度為n-2的t分布

2.2直線回歸的假設(shè)測(cè)驗(yàn)和區(qū)間估計(jì)例:試根據(jù)例1資料估計(jì):當(dāng)3月下旬至4月中旬的積溫為40旬·度時(shí),歷年的一代三化螟平均盛發(fā)期在何時(shí)(取95%可靠度)?將x=40代入方程得:2.2直線回歸的假設(shè)測(cè)驗(yàn)和區(qū)間估計(jì)2.2直線回歸的假設(shè)測(cè)驗(yàn)和區(qū)間估計(jì)條件總體預(yù)測(cè)值的置信區(qū)間這是以一定的保證概率估計(jì)任一X上Y單個(gè)預(yù)測(cè)值的存在范圍2.2直線回歸的假設(shè)測(cè)驗(yàn)和區(qū)間估計(jì)條件總體預(yù)測(cè)值的置信區(qū)間故保證概率為0.95的Y(p)預(yù)測(cè)區(qū)間為:2.2直線回歸的假設(shè)測(cè)驗(yàn)和區(qū)間估計(jì)條件總體預(yù)測(cè)值的置信區(qū)間[例]試根據(jù)例1資料估計(jì):某年3月下旬至4月中旬的積溫為40旬·度,試估計(jì)該年的一代三化螟盛發(fā)期在何時(shí)(取95%可靠度)?2.2直線回歸的假設(shè)測(cè)驗(yàn)和區(qū)間估計(jì)置信區(qū)間和預(yù)測(cè)區(qū)間圖示第三節(jié)

直線相關(guān)田間試驗(yàn)設(shè)計(jì)與統(tǒng)計(jì)分析3直線相關(guān)有時(shí)我們無法或不需要由一個(gè)變數(shù)來估計(jì)另一個(gè)變數(shù)的值,我們感興趣的是這兩個(gè)變數(shù)之間有沒有什么關(guān)系如:番茄的產(chǎn)量和什么性狀有關(guān)呢?通過相關(guān)分析表明:產(chǎn)量和每花序上花的數(shù)目以及每果序上果實(shí)的數(shù)目有關(guān)如何提高產(chǎn)量呢??;ǎ9?直線相關(guān)什么是相關(guān)分析呢?相關(guān)分析是一種用來表示兩個(gè)變量之間關(guān)系強(qiáng)度的數(shù)學(xué)方法。3直線相關(guān)什么情況下使用相關(guān)分析呢?變數(shù)(性狀)之間是平行的關(guān)系簡(jiǎn)化數(shù)據(jù),如:產(chǎn)量、生育期等性狀的構(gòu)成要素很多,可從中找出影響大的要素一個(gè)性狀的數(shù)據(jù)比較難以獲得時(shí),找出一個(gè)與之相關(guān)性大的數(shù)據(jù)容易獲得的性狀取代之3直線相關(guān)如何判斷直線相關(guān)關(guān)系的存在呢?先作scatterplot,散點(diǎn)圖是直觀地觀察連續(xù)變化變量間關(guān)系的重要工具用直線描述用曲線描述可能有周期變化無明顯關(guān)系相關(guān)性有多大?3直線相關(guān)相關(guān)系數(shù)設(shè)有一X、Y均為隨機(jī)變量的雙變數(shù)總體,具有N對(duì)(X,Y)。若在標(biāo)有這N個(gè)(X,Y)坐標(biāo)點(diǎn)的直角坐標(biāo)上移動(dòng)坐標(biāo)軸,將X軸和Y軸分別平移到μX和μY上,則各點(diǎn)位置不變,而所取坐標(biāo)變?yōu)?X-μX,Y-μY)3直線相關(guān)IIIIVIII3直線相關(guān)IIIIVIII3直線相關(guān)IIIIVIII3直線相關(guān)

的值可用來度量?jī)蓚€(gè)變數(shù)直線相關(guān)程度和性質(zhì)但是,X和Y的變異程度、所取單位及N的大小都會(huì)影響3直線相關(guān)為了具有可比性,需要將離均差轉(zhuǎn)化為標(biāo)準(zhǔn)化離均差,再以N除之,從而得到雙變數(shù)總體的相關(guān)系數(shù)為:3直線相關(guān)決定系數(shù)(determinationcoefficient)從這個(gè)等式可以看出:y與x直線回歸效果的好壞取決于回歸平方和

和離回歸平方和或者說回歸效果取決于回歸平方和在總平方和中所占的比例3直線相關(guān)決定系數(shù)(determinationcoefficient)即:這個(gè)比例越大,y與x的直線回歸效果就越好,反之則差。我們把上式的比值叫做x對(duì)y的決定系數(shù),記為r23直線相關(guān)決定系數(shù)(determinationcoefficient)決定系數(shù)的大小表示了回歸方程可靠程度的高低,或者說表示了回歸直線擬合度的高低。

0≤r2≤1

決定系數(shù)表示了兩個(gè)互為因果關(guān)系的相關(guān)變量間直線相關(guān)的程度。3直線相關(guān)決定系數(shù)(determinationcoefficient)因?yàn)槿绻@得了一個(gè)回歸方程:

y=a+bxbyx=b如果將x變?yōu)橐雷償?shù),方程可變?yōu)?/p>

x=-a/b+1/b*ybxy=1/b

那么r2=1forever!Why?根據(jù)函數(shù)關(guān)系獲得的3直線相關(guān)根據(jù)統(tǒng)計(jì)關(guān)系獲得的決定系數(shù)會(huì)是怎樣的?如例1

以積溫x為依變數(shù),盛發(fā)期y為自變數(shù),回歸方程為:

x=42.0-0.64y

以盛發(fā)期y為依變數(shù),積溫x為自變數(shù),回歸方程為:

y=48.5-1.1x

那么

r2=-0.64×(-1.1)=0.7因有誤差的存在使統(tǒng)計(jì)關(guān)系不同于函數(shù)關(guān)系3直線相關(guān)但決定系數(shù)介于0和1之間,不能反應(yīng)直線關(guān)系的性質(zhì)——是同向增減或是異向增減若求r2的平方根,且取平方根的符號(hào)與乘積和SPxy的符號(hào)一致,這樣求出的平方根既可表示y與x的直線相關(guān)的程度,也可表示直線相關(guān)的性質(zhì)。3直線相關(guān)把這樣計(jì)算所得的統(tǒng)計(jì)量稱為x與y的相關(guān)系數(shù)(coefficientofcorrelation),記為r,即3直線相關(guān)-1.0+1.00-0.5+0.5完全負(fù)相關(guān)無線性相關(guān)完全正相關(guān)負(fù)相關(guān)程度增加r正相關(guān)程度增加3直線相關(guān)相關(guān)關(guān)系都有哪些類型呢?相關(guān)關(guān)系非線性相關(guān)線性相關(guān)正相關(guān)正相關(guān)負(fù)相關(guān)負(fù)相關(guān)完全相關(guān)不相關(guān)0<r<1-1<r<0r=0r=0零相關(guān)正相關(guān)負(fù)相關(guān)零相關(guān)r=0r=0r=-1r=1完全正相關(guān)完全負(fù)相關(guān)零相關(guān)零相關(guān)3直線相關(guān)相關(guān)系數(shù)和決定系數(shù)有何區(qū)別?決定系數(shù)是相關(guān)系數(shù)的平方值除|r|=1or0外,r2<|r|

因此,決定系數(shù)可以防止對(duì)相關(guān)系數(shù)所表示的相關(guān)程度作夸張的解釋r值可正可負(fù),而r2都取正值,因此,在相關(guān)分析中可以將兩者結(jié)合起來,即由r表示正或負(fù)的相關(guān)性質(zhì),由r2表示相關(guān)的程度在多元回歸分析中r2是表示一個(gè)回歸方程優(yōu)劣的重要參數(shù)3直線相關(guān)相關(guān)系數(shù)和決定系數(shù)有何區(qū)別?相關(guān)系數(shù)實(shí)際是兩個(gè)回歸系數(shù)的幾何平均值。這正反映了相關(guān)與回歸的不同:相關(guān)是雙向的關(guān)系,而回歸是單向的。3直線相關(guān)相關(guān)系數(shù)和決定系數(shù)有何區(qū)別?直線回歸分析側(cè)重于尋求它們之間的聯(lián)系形式

——直線回歸方程直線相關(guān)分析側(cè)重于揭示它們之間的聯(lián)系程度和性質(zhì)

——計(jì)算出相關(guān)系數(shù)。兩種分析所進(jìn)行的顯著性檢驗(yàn)都是解決y與x間是否存在直線關(guān)系。因而二者的檢驗(yàn)是等價(jià)的。

3直線相關(guān)所獲得的r值有統(tǒng)計(jì)學(xué)意義嗎?由于有抽樣誤差的,r是否能真正地表明相關(guān)關(guān)系的存在,還需進(jìn)一步進(jìn)行假設(shè)檢驗(yàn)ρ=0的假設(shè)檢驗(yàn)r本身不服從某個(gè)已知的理論分布,但當(dāng)n>5時(shí)ρ=0總體中的抽樣分布近似與正態(tài)分布,因此,可用t檢驗(yàn),統(tǒng)計(jì)量為:3直線相關(guān)根據(jù)例1的資料r=-0.8344,作假設(shè)檢驗(yàn)提出假設(shè):H0:

;H1:

0確定顯著水平計(jì)算得t=-4.05|t|>t0.01否定原假設(shè),認(rèn)為線性關(guān)系是真實(shí)存在的3直線相關(guān)與本例中回歸系數(shù)的t檢驗(yàn)相比較,我們會(huì)發(fā)現(xiàn),相關(guān)系數(shù)假設(shè)檢驗(yàn)的t值和回歸系數(shù)的t值是相同的兩種分析所進(jìn)行的顯著性檢驗(yàn)都是解決y與x間是否存在直線關(guān)系。因而二者的檢驗(yàn)是等價(jià)的。在實(shí)際應(yīng)用中,對(duì)同一資料而言,兩種檢驗(yàn)只選其一即可。3直線相關(guān)ρ=C的假設(shè)檢驗(yàn)?zāi)康臅r(shí)為了檢驗(yàn)實(shí)得的r與某一指定的或理論的相關(guān)系數(shù)C是否有顯著差異在ρ≠0時(shí),r的抽樣分布有很大的偏態(tài),需對(duì)r進(jìn)行反雙曲正切變換3直線相關(guān)ρ=C的假設(shè)檢驗(yàn)r>0r<0Z具有近似的正態(tài)分布,可用統(tǒng)計(jì)量u進(jìn)行檢驗(yàn)3直線相關(guān)直線回歸和相關(guān)都有哪些內(nèi)在關(guān)系?直線回歸與相關(guān)的性質(zhì)或方向相同,顯著性檢驗(yàn)等價(jià)。相關(guān)系數(shù)是標(biāo)準(zhǔn)化的回歸系數(shù)?;貧w系數(shù)是有單位的,但若對(duì)b作消去單位的標(biāo)準(zhǔn)化處理,即對(duì)b中x和y的離均差以各自的標(biāo)準(zhǔn)差sx

和sy為單位,則有:3直線相關(guān)3直線相關(guān)直線回歸和相關(guān)都有哪些內(nèi)在關(guān)系?相關(guān)系數(shù)r是y依x的回歸系數(shù)和x依y的回歸系數(shù)的幾何平均數(shù)3直線相關(guān)直線回歸何相關(guān)都有哪些內(nèi)在關(guān)系?線性回歸方程也可以用相關(guān)系數(shù)表示3直線相關(guān)直線回歸何相關(guān)都有哪些內(nèi)在關(guān)系?線性回歸和離回歸平方和也可用相關(guān)系數(shù)表示3直線相關(guān)直線回歸和相關(guān)的應(yīng)用要點(diǎn)直線回歸分析與相關(guān)分析在生物科學(xué)研究領(lǐng)域中已得到了廣泛的應(yīng)用,但在實(shí)際工作中卻很容易被誤用或作出錯(cuò)誤的解釋。必須注意以下幾點(diǎn):回歸和相關(guān)分析要有學(xué)科專業(yè)知識(shí)作指導(dǎo)要嚴(yán)格控制研究對(duì)象(X和Y)以外的有關(guān)因素。直線回歸和相關(guān)不顯著并不意味X和Y沒有關(guān)系3直線相關(guān)直線回歸和相關(guān)的應(yīng)用要點(diǎn)一個(gè)顯著的r或b并不代表X和Y的關(guān)系就一定是線性的。對(duì)難以發(fā)現(xiàn)X和Y的真實(shí)曲線關(guān)系,允許X和Y在一定的范圍之內(nèi)用線性關(guān)系進(jìn)行描述,但是使用范圍也必須嚴(yán)格限制在觀察值范圍之內(nèi)3直線相關(guān)直線回歸和相關(guān)的應(yīng)用要點(diǎn)一個(gè)顯著的相關(guān)或回歸并不一定具有實(shí)踐上的預(yù)測(cè)意義。例如,當(dāng)ν=50時(shí),|r|=0.273即顯著,但r2=0.074,表明X和Y可用線性關(guān)系說明的部分僅占總變異的7.4%,未說明的部分占92.6%,顯然由X預(yù)測(cè)Y并不可靠因此,當(dāng)需要用X預(yù)測(cè)Y時(shí)要求|r|>0.7。3直線相關(guān)直線回歸和相關(guān)的應(yīng)用要點(diǎn)為了提高回歸和相關(guān)分析的準(zhǔn)確性,兩個(gè)變數(shù)的樣本容量n(觀察值對(duì)數(shù))要盡可能大,最小不能低于5第五節(jié)

協(xié)方差分析田間試驗(yàn)設(shè)計(jì)與統(tǒng)計(jì)分析Analysisofcovariance5.1協(xié)方差分析的意義和功用

一、協(xié)方差分析的意義協(xié)方差(covariance)是兩個(gè)變數(shù)的互變異數(shù)總體協(xié)方差定義樣本協(xié)方差定義稱為均積(meanproducts)或協(xié)方,記作MP5.1協(xié)方差分析的意義和功用

5.1協(xié)方差分析的意義和功用

方差與協(xié)方差VariancexX變異Covariancex,yx,y協(xié)同變異5.1協(xié)方差分析的意義和功用

方差分析與協(xié)方差分析方差分析變異平方和自由度SStSSe協(xié)方差分析變異乘積和自由度SPtSPe回歸分析相關(guān)分析5.1協(xié)方差分析的意義和功用

二、協(xié)方差分析的功用統(tǒng)計(jì)控制估計(jì)協(xié)方差分量5.1協(xié)方差分析的意義和功用

統(tǒng)計(jì)控制試驗(yàn)設(shè)計(jì)的基本原則隨機(jī)重復(fù)局部控制試驗(yàn)控制5.1協(xié)方差分析的意義和功用

統(tǒng)計(jì)控制在有些情況下,試驗(yàn)控制很難做到如:研究幾種生長素對(duì)減少番茄落花落果的效應(yīng)要求番茄的花序上的初始花數(shù)相同若初始花數(shù)與落花落果率存在線性回歸關(guān)系y=a+bx將落花落果率矯正到初始花數(shù)都相同時(shí)的落花落果率統(tǒng)計(jì)控制5.1協(xié)方差分析的意義和功用

估計(jì)協(xié)方差分量方差分析中根據(jù)均方MS與期望均方EMS間的關(guān)系可獲得不同變異來源的方差分量估計(jì)值協(xié)方差分析中也可以根據(jù)均積MP與期望均積EMP間的關(guān)可獲得不同變異來源的協(xié)方差分量估計(jì)值5.2單向分組資料的協(xié)方差分析

一、資料模式與線性組成設(shè)有k組回歸樣本,每組各有n對(duì)觀察值處理處理1…處理k觀測(cè)指標(biāo)xy…xy觀測(cè)值xij、yij(i=1,2,…kj=1,2,…n)x11x12…x1j…x1ny11y12…y1j…y1n…xk1xk2…xkj…xknyk1yk2…ykj…ykn5.2單向分組資料的協(xié)方差分析

一、資料模式與線性組成每個(gè)y觀察值不僅具有組效應(yīng)和隨機(jī)誤差,還受x變數(shù)的影響為第i個(gè)處理效應(yīng)為經(jīng)回歸矯正的處理平均數(shù)為Y依X的回歸系數(shù)5.2單向分組資料的協(xié)方差分析

一、資料模式與線性組成ay’ij如在觀察值中剔除處理效應(yīng),則協(xié)方差分析就是與x的線性回歸分析5.2單向分組資料的協(xié)方差分析

一、資料模式與線性組成對(duì)觀察值進(jìn)行回歸矯正,除去x不同的影響,則協(xié)方差分析就是的方差分析5.2單向分組資料的協(xié)方差分析

二、乘積和和自由度的分解根據(jù)方差分析中平方和分解的原理,協(xié)方差分析中總乘積和SPT也可分為組間SPt和組內(nèi)SPe兩部分5.2單向分組資料的協(xié)方差分析

例:為了研究A、B、C三種肥料對(duì)于蘋果的增產(chǎn)效果,選了24株同齡蘋果樹,第一年記下各樹的產(chǎn)量(x),第二年將每種肥料隨機(jī)施于8株蘋果樹上,再記下其產(chǎn)量(y),結(jié)果見下表肥料觀察值A(chǔ)x4758534649565444y5466635156666150BX5253645859616366Y5453676262636469CX4448465059575853y5258546170646966三、回歸關(guān)系的協(xié)方差分析5.2單向分組資料的協(xié)方差分析

三、回歸關(guān)系的協(xié)方差分析對(duì)x和y分別進(jìn)行方差分析,可得如下結(jié)果變異來源DFx變數(shù)y變數(shù)SSMSFSSMSF肥料間2356.08178.046.34**60.75030.375<1肥料內(nèi)21587528.083830.873565總變異23945.83891.62推斷可靠嗎?5.2單向分組資料的協(xié)方差分析

上述推斷是否可靠受以下條件限制:如x和y之間沒有回歸關(guān)系,那么上述推斷是正確的如果x和y之間有回歸關(guān)系,那么上述推斷就是不可靠的需要將x對(duì)y的影響消除后,才能檢驗(yàn)處理間是否真正存在顯著差異利用專業(yè)知識(shí)進(jìn)行分析:x和y是同一株蘋果樹上相鄰兩年的產(chǎn)量,第一年是基礎(chǔ),第二年產(chǎn)量是在原基礎(chǔ)上的發(fā)展,兩者具有因果關(guān)系x,y之間是否存在直線回歸關(guān)系專業(yè)知識(shí)分析回歸的顯著性測(cè)驗(yàn)NoANOVA(y)Yes測(cè)驗(yàn)矯正平均數(shù)之間的差異顯著性No無差異Yes矯正平均數(shù)的多重比較協(xié)方差分析的基本步驟5.2單向分組資料的協(xié)方差分析

測(cè)驗(yàn)x和y是否存在直線回歸關(guān)系對(duì)處理內(nèi)項(xiàng)(誤差)作回歸分析測(cè)驗(yàn)H0:β=0對(duì)HA≠0離回歸平方和Qe和自由度ve=k(n-1)-1如接受H0:β=0則表明該資料只能用Y變數(shù)值作方差分析如否定H0:β=0則表明x和y有著顯著的直線回歸關(guān)系,因而需要進(jìn)行以下步驟5.2單向分組資料的協(xié)方差分析

測(cè)驗(yàn)x和y是否存在直線回歸關(guān)系5.2單向分組資料的協(xié)方差分析

測(cè)驗(yàn)x和y是否存在直線回歸關(guān)系**否定H0:β=05.2單向分組資料的協(xié)方差分析

測(cè)驗(yàn)矯正平均數(shù)間的差異顯著性校正y的總平方和與自由度,即總離回歸平方和與自由度5.2單向分組資料的協(xié)方差分析

測(cè)驗(yàn)矯正平均數(shù)間的差異顯著性矯正y的誤差項(xiàng)平方和與自由度,即誤差離回歸平方和與自由度5.2單向分組資料的協(xié)方差分析

測(cè)驗(yàn)矯正平均數(shù)間的差異顯著性矯正y的處理間平方和與自由度及F檢驗(yàn)**5.2單向分組資料的協(xié)方差分析

處理平均數(shù)的矯正和矯正平均數(shù)的多重比較已經(jīng)算得y依x的回歸系數(shù)b=1.1515說明無論哪個(gè)處理,若x增加一個(gè)單位,y則平均將增加b=1.1515個(gè)單位對(duì)y的矯正可用以下公式5.2單向分組資料的協(xié)方差分析

處理平均數(shù)的矯正和矯正平均數(shù)的多重比較對(duì)于是:肥料B=肥料C>肥料A對(duì)于是:肥料C>肥料A>肥料B5.2單向分組資料的協(xié)方差分析

矯正平均數(shù)的多重比較矯正數(shù)差數(shù)的標(biāo)準(zhǔn)誤假設(shè)5.2單向分組資料的協(xié)方差分析

矯正平均數(shù)的多重比較根據(jù)上式可對(duì)矯正平均數(shù)的差異顯著性做出測(cè)驗(yàn)還可以使用LSD、LSR等方法進(jìn)行多重比較5.2單向分組資料的協(xié)方差分析

矯正平均數(shù)的多重比較測(cè)驗(yàn)不同肥料效應(yīng)的矯正平均數(shù)的差異顯著性時(shí),算得:肥料A和B:t=6.84**肥料A與C:t=-2.844*肥料B與C:t=-512**肥料矯正后的蘋果產(chǎn)量差異顯著性5%1%C64.29aAA62.06bAB55.51cB5.2單向分組資料的協(xié)方差分析

本例中,不考慮第一年產(chǎn)量對(duì)第二年產(chǎn)量的影響時(shí),通過方差分析,不同肥料對(duì)蘋果產(chǎn)量的效應(yīng)是不顯著的如考慮了第一年產(chǎn)量對(duì)第二年產(chǎn)量的影響時(shí),發(fā)現(xiàn)它們之間存在回歸關(guān)系,用協(xié)方差分析時(shí)發(fā)現(xiàn),不同肥料對(duì)蘋果產(chǎn)量的效應(yīng)差異是顯著的。因此,正確的試驗(yàn)設(shè)計(jì)、嚴(yán)格的試驗(yàn)控制和相應(yīng)的統(tǒng)計(jì)方法,對(duì)于獲得正確的試驗(yàn)結(jié)論是十分重要的5.2單向分組資料的協(xié)方差分析

協(xié)方差分析步驟總結(jié):測(cè)驗(yàn)x和y是否存在直線回歸關(guān)系如不存在直線回歸關(guān)系,直接作方差分析測(cè)驗(yàn)矯正平均數(shù)間的差異顯著性如矯正平均數(shù)間差異顯著,則算出各個(gè)矯正平均數(shù)并進(jìn)行多重比較,作出相應(yīng)的統(tǒng)計(jì)推斷5.3兩向分組資料的協(xié)方差分析例:對(duì)6個(gè)菜豆品種(k=6)進(jìn)行維生素C含(y,mg/100g)比較試驗(yàn),4次重復(fù)(n=4),隨機(jī)區(qū)組設(shè)計(jì)根據(jù)前人的研究,菜豆維生素C含量不僅與品種有關(guān),而且與豆莢的成熟度有關(guān)。但在試驗(yàn)中又無法使所有小區(qū)的豆莢都同時(shí)成熟,所以同時(shí)測(cè)定了100g所采豆莢干物重百分率x,作為豆莢成熟度指標(biāo)。測(cè)定結(jié)果列于表,試作協(xié)方差分析5.3兩向分組資料的協(xié)方差分析菜豆品種的維生素C含量與豆莢干物重百分率測(cè)定結(jié)果品種區(qū)組I

區(qū)組II區(qū)組III區(qū)組IV合計(jì)平均xi1yi1xi2yi2xi3yi3xi4yi4xi·yi·A134.093.033.494.834.791.738.980.8141.0360.335.2590.08A23647.33851.551.233.352.027.2182.615345.65383A331.781.430.110033.

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請(qǐng)下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請(qǐng)聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會(huì)有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫網(wǎng)僅提供信息存儲(chǔ)空間,僅對(duì)用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對(duì)用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對(duì)任何下載內(nèi)容負(fù)責(zé)。
  • 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請(qǐng)與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶因使用這些下載資源對(duì)自己和他人造成任何形式的傷害或損失。

最新文檔

評(píng)論

0/150

提交評(píng)論