第七章直線回歸與相關(guān)_第1頁
第七章直線回歸與相關(guān)_第2頁
第七章直線回歸與相關(guān)_第3頁
第七章直線回歸與相關(guān)_第4頁
第七章直線回歸與相關(guān)_第5頁
已閱讀5頁,還剩78頁未讀 繼續(xù)免費閱讀

下載本文檔

版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進行舉報或認領(lǐng)

文檔簡介

1、第第七七章章 直線回歸與相關(guān)分析直線回歸與相關(guān)分析變量之間常常是變量之間常常是相互影響、彼此相關(guān)相互影響、彼此相關(guān)的,的,例如例如 產(chǎn)量與施肥量有關(guān),產(chǎn)量與施肥量有關(guān),病蟲害發(fā)生時期與溫度有關(guān),病蟲害發(fā)生時期與溫度有關(guān),小麥單位面積產(chǎn)量與單位面積穗數(shù)、每穗小麥單位面積產(chǎn)量與單位面積穗數(shù)、每穗粒數(shù)、千粒重有關(guān),等等。粒數(shù)、千粒重有關(guān),等等。常常需要研究兩個或多個變量之間的關(guān)系。常常需要研究兩個或多個變量之間的關(guān)系。變量間的關(guān)系有兩類變量間的關(guān)系有兩類,一類是變量間存在,一類是變量間存在著完全確定性的關(guān)系,可以用精確的數(shù)學表達著完全確定性的關(guān)系,可以用精確的數(shù)學表達式來表示。式來表示。如長方體的體

2、積(如長方體的體積(V V)與長()與長(a a)、寬()、寬(b b)、)、高(高(h h)的關(guān)系可以表達為:)的關(guān)系可以表達為: V=abhV=abh 它們之間的關(guān)系是確定性的,只要知道了其它們之間的關(guān)系是確定性的,只要知道了其中中3 3個變量的值就可以精確地計算出另一個變量個變量的值就可以精確地計算出另一個變量的值。的值。這類變量間的關(guān)系稱為函數(shù)關(guān)系這類變量間的關(guān)系稱為函數(shù)關(guān)系。另一類是變量間不存在完全的確定性關(guān)系,另一類是變量間不存在完全的確定性關(guān)系,不能用精確的數(shù)學公式來表示。不能用精確的數(shù)學公式來表示。如如 產(chǎn)量與施肥量的關(guān)系,產(chǎn)量與施肥量的關(guān)系,病蟲害發(fā)生時期與溫度的關(guān)系,病蟲害

3、發(fā)生時期與溫度的關(guān)系,小麥單位面積產(chǎn)量與單位面積穗數(shù)、每穗小麥單位面積產(chǎn)量與單位面積穗數(shù)、每穗粒數(shù)、千粒重的關(guān)系等。粒數(shù)、千粒重的關(guān)系等。這些變量間都存在著十分密切的關(guān)系,但這些變量間都存在著十分密切的關(guān)系,但由于隨機誤差的影響,不能由一個或幾個變量由于隨機誤差的影響,不能由一個或幾個變量的值精確地求出另一個變量的值。這樣的變量的值精確地求出另一個變量的值。這樣的變量在生物界中是大量存在的,統(tǒng)計學中把這類變在生物界中是大量存在的,統(tǒng)計學中把這類變量稱為量稱為相關(guān)變量相關(guān)變量。相關(guān)變量間的關(guān)系分為兩種:相關(guān)變量間的關(guān)系分為兩種:一種是因果關(guān)系,即一個變量的變化受另一種是因果關(guān)系,即一個變量的變化

4、受另一個或幾個變量的影響。一個或幾個變量的影響。如如 病蟲害發(fā)生時期受溫度的影響,病蟲害發(fā)生時期受溫度的影響,小麥單位面積產(chǎn)量受單位面積穗數(shù)、每穗小麥單位面積產(chǎn)量受單位面積穗數(shù)、每穗粒數(shù)、千粒重的影響;粒數(shù)、千粒重的影響;另一種是平行關(guān)系,即二個變量相互影另一種是平行關(guān)系,即二個變量相互影響,互為因果。響,互為因果。如小麥每穗粒數(shù)與千粒重之間的關(guān)系,如小麥每穗粒數(shù)與千粒重之間的關(guān)系,株高與穗長之間的關(guān)系等都屬于平行關(guān)系。株高與穗長之間的關(guān)系等都屬于平行關(guān)系。統(tǒng)計學上采用回歸分析統(tǒng)計學上采用回歸分析 研究呈因果關(guān)研究呈因果關(guān)系的相關(guān)變量間的關(guān)系。系的相關(guān)變量間的關(guān)系。表示原因的變量稱為表示原因的

5、變量稱為自變量自變量,表示結(jié)果,表示結(jié)果的變量稱為的變量稱為依變量依變量。研究研究“一因一果一因一果”,即一個自變量與一,即一個自變量與一個依變量的回歸分析稱為個依變量的回歸分析稱為一元回歸分析一元回歸分析;研究研究“多因一果多因一果”,即多個自變量與一,即多個自變量與一個依變量的回歸分析稱為個依變量的回歸分析稱為多元回歸分析多元回歸分析。一元回歸分析又分為直線回歸分析與曲一元回歸分析又分為直線回歸分析與曲線回歸分析兩種;線回歸分析兩種;多元回歸分析又分為多元線性回歸分析多元回歸分析又分為多元線性回歸分析與多元非線性回歸分析兩種。與多元非線性回歸分析兩種。回歸分析的任務(wù)回歸分析的任務(wù)是揭示出呈

6、因果關(guān)系的是揭示出呈因果關(guān)系的相關(guān)變量間的聯(lián)系形式,建立它們之間的回相關(guān)變量間的聯(lián)系形式,建立它們之間的回歸方程,利用所建立的回歸方程,由自變量歸方程,利用所建立的回歸方程,由自變量(原因)來預(yù)測、控制依變量(結(jié)果)。(原因)來預(yù)測、控制依變量(結(jié)果)。統(tǒng)計學上采用相關(guān)分析研究呈平行關(guān)系統(tǒng)計學上采用相關(guān)分析研究呈平行關(guān)系的相關(guān)變量之間的關(guān)系。的相關(guān)變量之間的關(guān)系。對兩個變量間的直線關(guān)系進行相關(guān)分析對兩個變量間的直線關(guān)系進行相關(guān)分析稱為稱為直線相關(guān)分析(也叫簡單相關(guān)分析)直線相關(guān)分析(也叫簡單相關(guān)分析);對多個變量進行相關(guān)分析時,研究一個對多個變量進行相關(guān)分析時,研究一個變量與多個變量間的線性相

7、關(guān)稱為變量與多個變量間的線性相關(guān)稱為復(fù)相關(guān)分復(fù)相關(guān)分析析; 研究其余變量保持不變的情況下兩個變量研究其余變量保持不變的情況下兩個變量間的線性相關(guān)稱為間的線性相關(guān)稱為偏相關(guān)分析偏相關(guān)分析。在相關(guān)分析中,。在相關(guān)分析中,不區(qū)分自變量和依變量。不區(qū)分自變量和依變量。相關(guān)分析只研究兩個變量之間線性相關(guān)的相關(guān)分析只研究兩個變量之間線性相關(guān)的程度和性質(zhì)或一個變量與多個變量之間線性相程度和性質(zhì)或一個變量與多個變量之間線性相關(guān)的程度,不能用一個或多個變量去預(yù)測、控關(guān)的程度,不能用一個或多個變量去預(yù)測、控制另一個變量的變化。制另一個變量的變化。本章介紹直線回歸與相關(guān)分析。本章介紹直線回歸與相關(guān)分析。 第一節(jié)第一

8、節(jié) 直線回歸分析直線回歸分析對于兩個相關(guān)變量對于兩個相關(guān)變量x x和和y y,通過試驗或調(diào),通過試驗或調(diào)查獲得查獲得n n對觀測值,(對觀測值,(x x1 1,y y1 1),(),(x x2 2,y y2 2),), ,(,(x xn n,y yn n),作出),作出散點圖散點圖。 從散點圖可以看出:從散點圖可以看出:兩個變量間關(guān)系的類型,是直線還是兩個變量間關(guān)系的類型,是直線還是曲線。曲線。 圖(圖(a a)、)、(d)(d)表明表明 x x 與與 y y是完全直線關(guān)是完全直線關(guān)系,這種情況在生物界不多見;圖(系,這種情況在生物界不多見;圖(b b)、)、(e) (e) 表明表明x x與與

9、y y是直線相關(guān)關(guān)系,這種情況在生物是直線相關(guān)關(guān)系,這種情況在生物界較常見;圖(界較常見;圖(f f)表明)表明x x與與y y是曲線關(guān)系,這是曲線關(guān)系,這種情況在生物界也較常見;圖(種情況在生物界也較常見;圖(c c)表明)表明x x與與y y無關(guān)。無關(guān)。兩個變量間關(guān)系的性質(zhì)(是同向增減兩個變量間關(guān)系的性質(zhì)(是同向增減還是異向增減。還是異向增減。 圖(圖(a a)、)、(b) (b) 表明表明 x x與與y y的直線關(guān)系是的直線關(guān)系是同向增減,圖(同向增減,圖(d d)、)、(e) (e) 表明表明 x x與與y y的是直的是直線關(guān)系是異向增減)和程度(是密切還是不線關(guān)系是異向增減)和程度(

10、是密切還是不密切)。密切)。是否有異常觀測值。是否有異常觀測值。 一、直線回歸方程的建立一、直線回歸方程的建立 如果呈因果關(guān)系的兩個相關(guān)變量如果呈因果關(guān)系的兩個相關(guān)變量x x與與y y間的間的關(guān)系是直線關(guān)系,由于依變量關(guān)系是直線關(guān)系,由于依變量x x與與y y間的關(guān)系是間的關(guān)系是直線關(guān)系,由于依變量直線關(guān)系,由于依變量 的實際觀測值總是帶的實際觀測值總是帶有隨機誤差,因而有隨機誤差,因而 可表示為:可表示為:yiiiyx( (i i=1,2, , =1,2, , n n) ) (7171) iy 為總體回歸系數(shù)為總體回歸系數(shù) i i 為相互獨立、且都服從為相互獨立、且都服從N N(0 0,2

11、2) 的隨機變量。的隨機變量。 為總體回歸截距為總體回歸截距 其中,其中, 在在x x, ,y y的直角坐標平面上可以作出無數(shù)條直的直角坐標平面上可以作出無數(shù)條直線線 ,回歸直線是指所有直線中最接近散點圖全,回歸直線是指所有直線中最接近散點圖全部散點的直線。部散點的直線。 設(shè)直線回歸方程設(shè)直線回歸方程 為:為: yabx(7-2) (7-2) a a、b b應(yīng)使回歸估計值應(yīng)使回歸估計值與實際觀測值的偏差與實際觀測值的偏差平方和最小,即:平方和最小,即:22()()Qyyyabx最小最小 令令 Q Q對對a a、b b的一階偏導數(shù)等于的一階偏導數(shù)等于0 0,即:,即: 2()0Qyabxa 2(

12、)0Qyabx xb 整理得關(guān)于整理得關(guān)于a a、b b的正規(guī)方程組的正規(guī)方程組 anbxy2axbxxy 解正規(guī)方程組,得:解正規(guī)方程組,得:222()()/() /()()()xyxxyxynbxxnSPxxyyxxSSaybx(7-37-3) (7-47-4) (7-37-3)式中的分子是自變量)式中的分子是自變量x x的離均差與的離均差與依變量依變量y y的離均差的乘積和的離均差的乘積和 ,簡,簡稱乘積和,記作稱乘積和,記作 ,分母是自變量,分母是自變量x x的離均差的離均差平方和平方和 ,記作,記作 。()()xxyyxySP2()xxxSSa a叫做樣本回歸截距,是總體回歸截距的叫

13、做樣本回歸截距,是總體回歸截距的最小二乘估計值也是無偏估計值,是回歸直線最小二乘估計值也是無偏估計值,是回歸直線與與y y軸交點的縱坐標,當軸交點的縱坐標,當x x=0=0時,時, = =a a; y b b叫做樣本回歸系數(shù),是總體回歸系數(shù)叫做樣本回歸系數(shù),是總體回歸系數(shù) 的最小二乘估計值也是無偏估計值,表的最小二乘估計值也是無偏估計值,表示示x x改變一個單位,改變一個單位,y y平均改變的數(shù)量,平均改變的數(shù)量,b b的的符號反映了符號反映了x x影響影響y y的性質(zhì),的性質(zhì),b b的絕對值大小的絕對值大小反映了反映了x x影響影響y y的大?。坏拇笮?; 叫做回歸估計值叫做回歸估計值 ,是當

14、,是當x x在其研究在其研究范圍內(nèi)取某一個值時,范圍內(nèi)取某一個值時,y y總體平均數(shù)總體平均數(shù)( )的估計值。)的估計值。x y如果將(如果將(7-37-3)式代入()式代入(7-27-2)式,得到回)式,得到回歸方程的另一種形式:歸方程的另一種形式:()yybxbxyb xx(7-57-5) 【例【例7171】 江蘇武進縣測定江蘇武進縣測定1956-19641956-1964年年間間3 3月下旬至月下旬至4 4月中旬平均溫度累積值月中旬平均溫度累積值 ( (x x,單,單位:旬位:旬 度度) )和一代三化螟蛾盛發(fā)期和一代三化螟蛾盛發(fā)期 (y y,以,以5 5月月1010日為日為0 0)的資料

15、如下表,建立)的資料如下表,建立y y與與x x的直線回歸的直線回歸方程。方程。表表7-1 7-1 平均溫度累積值平均溫度累積值( (x x) )與一代三化螟盛發(fā)期(與一代三化螟盛發(fā)期(y y)資料)資料 1 1、作、作散點圖散點圖 -505101520293439444948.5485 1.0996yx(月/日)5/255/205/155/105/55/30 x,3月下旬至4月中旬平均溫度累計值 y,一代三化螟盛發(fā)期圖7-2 旬平均溫度累積值和一代三化螟蛾盛發(fā)期的關(guān)系2 2、計算回歸系數(shù)、計算回歸系數(shù)b b,回歸截距,回歸截距a a,建立直線回歸方程建立直線回歸方程 /333.7/937.0

16、778xx n/70/97.7778yy n222/12517.49333.7/9144.6356xSSxxn 222/79470/9249.5556ySSyyn ()()/2436.4(333.7 70)/9159.0444xySPxyxyn /159.0444/144.63561.0996xyxbSPSS (天(天/ /旬旬度)度)7.7778( 1.0996 37.0778)48.5485aybx (天)(天) 直線回歸方程為:直線回歸方程為:48.5485 1.0996yx上述回歸方程的顯著性還有待檢驗。上述回歸方程的顯著性還有待檢驗。注意注意,由于實測區(qū)間為,由于實測區(qū)間為31.73

17、1.7,44.244.2,當,當 31.731.7或或 44.244.2時,時, 的變化是否還符合的變化是否還符合 的規(guī)律,還必須提供新的依據(jù)。的規(guī)律,還必須提供新的依據(jù)。 如果顯著,回歸系數(shù)如果顯著,回歸系數(shù) = -1.0996= -1.0996的意義為:當?shù)囊饬x為:當3 3月下旬的積溫(月下旬的積溫( )每提高)每提高1 1旬旬 度時,一代三化螟度時,一代三化螟盛發(fā)期將平均提早盛發(fā)期將平均提早1.09961.0996天;天; bx回歸截距回歸截距 =48.5485=48.5485的意義為:若的意義為:若3 3月下旬的積月下旬的積溫為溫為0 0,則一代三化螟盛發(fā)期為,則一代三化螟盛發(fā)期為48

18、.548548.5485,即在,即在6 6月月27-27-2828日。日。axy48.5485 1.0996yxx 3 3、直線回歸方程的離回歸標準誤、直線回歸方程的離回歸標準誤 偏差平方和的大小表示了實測點偏差平方和的大小表示了實測點與回歸直線偏離的程度,因而偏差平方和又稱與回歸直線偏離的程度,因而偏差平方和又稱為離回歸平方和。統(tǒng)計學已經(jīng)證明:在直線回為離回歸平方和。統(tǒng)計學已經(jīng)證明:在直線回歸分析中離回歸平方和的自由度為歸分析中離回歸平方和的自由度為n n-2-2。2()yy于是可求得離回歸均方為:于是可求得離回歸均方為: 2() /(2)yyn離回歸均方是模型(離回歸均方是模型(7-17-

19、1)中方差)中方差2 2的估計的估計值。值。離回歸均方的平方根叫離回歸標準誤,記離回歸均方的平方根叫離回歸標準誤,記為,即為,即 yxS2()2yxyySn(7-67-6) 離回歸標準誤離回歸標準誤的大小表示了回歸直線的大小表示了回歸直線與實測點,即回歸估計值與實際觀測值與實測點,即回歸估計值與實際觀測值y y偏離偏離度的大小。度的大小。yxS y以后將證明:以后將證明:22()xyyxSPyySSSS(7-77-7) 對于【例對于【例7171】有】有 222144.6356()( 159.0444)249.555674.6670 xyyxSPyySSSS 所以所以 2()74.6670292

20、yxyySn=3.2660=3.2660(天)(天) 三、直線回歸的顯著性檢驗三、直線回歸的顯著性檢驗如何判斷直線回歸方程所反應(yīng)的兩個變?nèi)绾闻袛嘀本€回歸方程所反應(yīng)的兩個變量間的直線關(guān)系的真實性呢?這取決于變量量間的直線關(guān)系的真實性呢?這取決于變量y y與與x x間是否存在直線關(guān)系,也就是須對直線回間是否存在直線關(guān)系,也就是須對直線回歸進行顯著性檢驗。歸進行顯著性檢驗。 直線回歸顯著性檢驗的方法有直線回歸顯著性檢驗的方法有F F檢驗和檢驗和t t檢驗兩種。檢驗兩種。 從從圖圖7-37-3看到,看到,可表示為與可表示為與 之和,即之和,即:()yy()yy()yy()()()yyyyyy則有則有:

21、 : 2()yy2()()yyyy 22()()2()()yyyyyyyy(一)(一)F檢驗檢驗1 1、依變量、依變量y y的總平方和與自由度的分解的總平方和與自由度的分解 由于由于()yabxyb xx所以所以()yyb xx于是于是 ()()()()yyyyb xxyy ()()()b xxyyb xx()()()()b xxyyb xxb xx 2xyxb SPbSS20 xyxyxyxxxSPSPSPSSSSSS 所以所以2()yy22()()yyyy(7-87-8) 反映了反映了y y的總變異程度,稱為的總變異程度,稱為y y的總平方和,記為;的總平方和,記為;2()yyySS反映了

22、由于反映了由于y y與與x x間存在直線關(guān)間存在直線關(guān)系所引起的系所引起的y y的變異程度,稱為回歸平方和,的變異程度,稱為回歸平方和,記為記為 ;2()yyRSS 反映了除反映了除y y與與x x存在直線關(guān)系存在直線關(guān)系以外的原因以外的原因 (包括隨機誤差)(包括隨機誤差) 所引起的所引起的y y的變異程度的變異程度 ,稱為離回歸平方和或剩余平,稱為離回歸平方和或剩余平方和方和 , 記為記為 。2()yyrSS 于是,(于是,(7-87-8)式又可表示為:)式又可表示為:yRrSSSSSS 與此相對應(yīng),與此相對應(yīng), yRrdfdfdf(7-97-9) (7-107-10) 在直線回歸分析中在

23、直線回歸分析中1Rdf 1ydfn2rdfn 、回歸關(guān)系顯著性檢驗、回歸關(guān)系顯著性檢驗F F 檢驗檢驗 對對y y與與x x間是否存在直線關(guān)系的假設(shè)檢驗其間是否存在直線關(guān)系的假設(shè)檢驗其無效假設(shè):無效假設(shè): =0=0,備擇假設(shè):,備擇假設(shè): 00。0HAH在無效假設(shè)成立的條件下,回歸均方與離在無效假設(shè)成立的條件下,回歸均方與離回歸均方的比值服從和的回歸均方的比值服從和的F F分分布,所以可以用布,所以可以用11df 22dfn/(2)RRRRrrrrMSMSdfSSFMSSSdfSSn, df1=1,df2=n-2 (7-11) 來檢驗回歸關(guān)系即回歸方程的顯著性。來檢驗回歸關(guān)系即回歸方程的顯著性

24、。 22() ()RSSyyb xx 222()xxybxxb SSbSP(7-12)2xyxyxyxxSPSPSPSSSS(7-13)2xyryRyxSPSSSSSSSSSS對于對于【例【例7171】 249.5556ySS ,159.0444xySP 144.6356xSS 22( 159.0444)174.8886144.6356xyRxSPSSSS,249.5556 174.888674.6670ryRSSSSSS 而,而, 于是于是 1,927Rrdfdf174.888616.4074.6670/7ReMSFMS , , , , p p0.010.01,表明一代三化螟蛾盛發(fā)期(,表明

25、一代三化螟蛾盛發(fā)期(y y)與積)與積溫(溫( )的直線回歸關(guān)系極顯著。)的直線回歸關(guān)系極顯著。0.01(1,7)12.25F0.01(1,7)16.4012.25FFx 3 3、回歸系數(shù)的顯著性檢驗、回歸系數(shù)的顯著性檢驗t t檢驗檢驗 回歸系數(shù)顯著性檢驗的無效假設(shè)和備擇假回歸系數(shù)顯著性檢驗的無效假設(shè)和備擇假設(shè)分別為設(shè)分別為 :0 0, :00。 0HAHt t檢驗的計算公式為:檢驗的計算公式為: ,bbtS2dfn(7-147-14) 其中,為回歸系數(shù)標準誤其中,為回歸系數(shù)標準誤 : yxbxSSSS(7-157-15) 對于【例對于【例7171】 ,已計算得已計算得1.0996b 144.

26、6356xSS 3.266yxS, , , 故有故有 3.2660.2715144.6356yxbxSSSS1.09964.050.2715bbtS , ,因因 , ,否,否定定 :0 0,接受,接受 :00,即一代三化螟,即一代三化螟蛾盛發(fā)期(蛾盛發(fā)期(y y)與積溫()與積溫(x x)的直線回歸系數(shù))的直線回歸系數(shù)b b=-1.0996=-1.0996極顯著,表明一代三化螟蛾盛發(fā)期極顯著,表明一代三化螟蛾盛發(fā)期與積溫間存在極顯著的直線關(guān)系。與積溫間存在極顯著的直線關(guān)系。0.01(7)3.50t0.01(7)4.05tt0.01P 0HAH F F 檢驗的結(jié)果與檢驗的結(jié)果與t t檢驗的結(jié)果一

27、致。檢驗的結(jié)果一致。 事實上,統(tǒng)計學已證明,在直線回歸分析事實上,統(tǒng)計學已證明,在直線回歸分析中,這二種檢驗方法是等價的,可任選一種進中,這二種檢驗方法是等價的,可任選一種進行檢驗。行檢驗。 四、直線回歸的區(qū)間估計四、直線回歸的區(qū)間估計 經(jīng)檢驗直線回歸關(guān)系顯著之后:經(jīng)檢驗直線回歸關(guān)系顯著之后: 可用樣本統(tǒng)計數(shù)可用樣本統(tǒng)計數(shù) 來估計總體參來估計總體參數(shù),數(shù), ,ab, 可利用來估計某一值對應(yīng)的總可利用來估計某一值對應(yīng)的總體的平均數(shù)();體的平均數(shù)(); yxyx 還可對總體參數(shù)還可對總體參數(shù),某一值對應(yīng)的,某一值對應(yīng)的總體的平均數(shù)()和單個觀測值作出總體的平均數(shù)()和單個觀測值作出區(qū)間估計,即求

28、出它們在一定置信度下的置信區(qū)間估計,即求出它們在一定置信度下的置信區(qū)間。區(qū)間。 ,xyxy表表7-27-2 回歸截距,回歸系數(shù),總體回歸截距,回歸系數(shù),總體平均數(shù)()和單個觀測值平均數(shù)()和單個觀測值 置信度為置信度為()的置信區(qū)間()的置信區(qū)間 xy1 【例【例7272】 根據(jù)【例根據(jù)【例7171】的資料估計:】的資料估計:(1 1)當)當3 3月下旬至月下旬至4 4月中旬的積溫為月中旬的積溫為4040旬旬 度時,歷年的一代三化螟蛾平均盛發(fā)期在何時度時,歷年的一代三化螟蛾平均盛發(fā)期在何時(置信度為(置信度為9595)?)?(2 2)某年)某年3 3月下旬至月下旬至4 4月中旬的積溫為月中旬的

29、積溫為4040旬旬 度時,該年的一代三化螟蛾盛發(fā)期在何時度時,該年的一代三化螟蛾盛發(fā)期在何時(置信度為(置信度為9595)?)?利用直線回歸方程利用直線回歸方程 計計算當算當 時的時的 , 48.5485 1.0996yx40 x y48.5485 1.0996 404.56y 因為因為 23.2661.351(4037.0778)9144.6356yS23.26613.531(4037.0778)9144.6356yS將將 =4.56=4.56、 、 2.36代入,得代入,得 所以所以 (1 1)在置信度為)在置信度為9595時,時, 的的 總體平均數(shù)(總體平均數(shù)( )的置信區(qū)間為:)的置信

30、區(qū)間為: 40 x yx0.05(7)0.05(7)()yyytSxytS y1.35ys0.05(7)t4.56(2.36 1.35)()4.56(2.36 1.35)x1.4()7.7x即當即當3 3月下旬至月下旬至4 4月中旬的積溫為月中旬的積溫為4040旬旬 度時,度時,歷年的一代三化螟蛾平均盛發(fā)期在歷年的一代三化螟蛾平均盛發(fā)期在1.4, 7.71.4, 7.7或或5 5月月12181218日,置信度為日,置信度為9595。(2 2)在置信度為)在置信度為9595時,時, 的單個觀的單個觀測值測值 的置信區(qū)間為:的置信區(qū)間為:40 x y0.05(7)0.05(7)yyytSyytS將

31、將 =4.56=4.56、 、 2.36代入,代入,得得 y3.53ys0.05(7)t4.56(2.36 3.53) 4.56(2.36 3.53)y 3.819.9y 即當某年即當某年3 3月下旬至月下旬至4 4月中旬的積溫為月中旬的積溫為4040旬旬 度時,度時,該年的一代三化螟蛾盛發(fā)期在該年的一代三化螟蛾盛發(fā)期在-3.8, 19.9-3.8, 19.9或或5 5月月630630日,置信度為日,置信度為9595。類似地,可求出取其它值時總體平均數(shù)類似地,可求出取其它值時總體平均數(shù)()和單個觀測值的()和單個觀測值的95%95%置信區(qū)間,列于表置信區(qū)間,列于表7-37-3。 xyx表表7-

32、3 7-3 一代三化螟蛾盛發(fā)期一代三化螟蛾盛發(fā)期95%95%置信區(qū)間置信區(qū)間 從從和的計算公式看出,越接近,和的計算公式看出,越接近,和越小,置信區(qū)間的置信距也越小,預(yù)測越和越小,置信區(qū)間的置信距也越小,預(yù)測越精確。精確。 ySySxx ySyS第二節(jié)第二節(jié) 直線相關(guān)分析直線相關(guān)分析進行直線相關(guān)分析的基本任務(wù)在于根據(jù)進行直線相關(guān)分析的基本任務(wù)在于根據(jù)x x、y y的實際觀測值計算表示兩個相關(guān)變量的實際觀測值計算表示兩個相關(guān)變量x x與與y y線性相線性相關(guān)程度和性質(zhì)的統(tǒng)計數(shù)關(guān)程度和性質(zhì)的統(tǒng)計數(shù)相關(guān)系數(shù)相關(guān)系數(shù)r r,并進行,并進行顯著性檢驗。顯著性檢驗。 一、決定系數(shù)和相關(guān)系數(shù)、決定系數(shù)和相關(guān)

33、系數(shù)已經(jīng)證明了等式:已經(jīng)證明了等式: 2()yy22()()yyyy。 從這個等式不難看到:從這個等式不難看到:y y與與x x直線回歸效果的好壞直線回歸效果的好壞取決于回歸平方和與離回歸平方和取決于回歸平方和與離回歸平方和的大小,或者說取決于回歸平方和在的大小,或者說取決于回歸平方和在y y的總的總平方和中所占比例的大小。這個比例越大,平方和中所占比例的大小。這個比例越大,y y與與x x的直線回歸效果就越好,反之則差。的直線回歸效果就越好,反之則差。2()yy2()yy2()yy2()yy比值叫做比值叫做x x對對y y的決定系的決定系數(shù)數(shù) ,記為,記為 r r2 2,即,即2() /yy

34、2()yy222()()yyryy(7-167-16) 決定系數(shù)的大小表示了回歸方程估測可靠決定系數(shù)的大小表示了回歸方程估測可靠程度的高低,或者說表示了回歸直線擬合度的高程度的高低,或者說表示了回歸直線擬合度的高低,顯然低,顯然00r r2 211。 因為因為2222()()xyxyxyyxxyxyxySPSP SPyyrb byySS SSSSSS而而SPSPxyxy/ /SSSSx x是以是以x x為自變量、為自變量、y y為依變量時的為依變量時的回歸系數(shù)回歸系數(shù)b byxyx。 若把若把y y作為自變量、作為自變量、x x作為依變量,則回歸作為依變量,則回歸系數(shù)系數(shù)b bxyxy= =S

35、PSPxyxy/ /SSSSy y。 所以決定系數(shù)所以決定系數(shù)r r2 2等于等于y y對對x x的回歸系數(shù)與的回歸系數(shù)與x x對對y y的回歸系數(shù)的乘積。的回歸系數(shù)的乘積。這就是說,決定系數(shù)反應(yīng)了這就是說,決定系數(shù)反應(yīng)了x x為自變量、為自變量、y y為依變量和為依變量和y y為自變量、為自變量、x x為依變量時兩個相關(guān)變?yōu)橐雷兞繒r兩個相關(guān)變量量x x與與y y直線相關(guān)的信息,即決定系數(shù)表示了兩個直線相關(guān)的信息,即決定系數(shù)表示了兩個互為因果關(guān)系的相關(guān)變量間直線相關(guān)的程度。但互為因果關(guān)系的相關(guān)變量間直線相關(guān)的程度。但決定系數(shù)介于決定系數(shù)介于0 0和和1 1之間,不能反應(yīng)直線關(guān)系的性之間,不能反

36、應(yīng)直線關(guān)系的性質(zhì)質(zhì)是同向增減或是異向增減。是同向增減或是異向增減。若求若求r r2 2的平方根,且取平方根的符號與乘的平方根,且取平方根的符號與乘積和積和SPSPxyxy的符號一致,即與的符號一致,即與b bxyxy 、b byxyx的符號一致,的符號一致,這樣求出的平方根既可表示這樣求出的平方根既可表示y y與與x x的直線相關(guān)的的直線相關(guān)的程度,也可表示程度,也可表示y y與與x x直線相關(guān)的性質(zhì)。直線相關(guān)的性質(zhì)。統(tǒng)計學上把這樣計算所得的統(tǒng)計數(shù)稱為統(tǒng)計學上把這樣計算所得的統(tǒng)計數(shù)稱為x x與與y y的相關(guān)系數(shù)的相關(guān)系數(shù), ,記為記為r r,即,即xyxySPrSS SS(7-17)2222(

37、)()()()xyxynxyxynn(7-18)顯然顯然 -1-1r r11。當。當r r0 0時,相關(guān)變量時,相關(guān)變量x x與與y y異向增減,稱為異向增減,稱為x x與與y y負相關(guān);當負相關(guān);當r r0 0時,相關(guān)變時,相關(guān)變量量x x與與y y同向增減,稱為同向增減,稱為x x與與y y正相關(guān)。正相關(guān)。【例【例7373】 計算【例計算【例7171】資料】資料3 3月下旬月下旬至至4 4月中旬積溫和一代三化螟蛾盛發(fā)期的決定系月中旬積溫和一代三化螟蛾盛發(fā)期的決定系數(shù)和相關(guān)系數(shù)。數(shù)和相關(guān)系數(shù)。已經(jīng)算得已經(jīng)算得249.5556ySS 144.6356xSS 、159.0444xySP 222(

38、 159.0444)0.7007.144.6356 249.5556xyxySPrSS SS 、表明,用一代三化螟盛發(fā)期(表明,用一代三化螟盛發(fā)期(y y)與)與3 3月下月下旬至旬至4 4月中旬積溫(月中旬積溫(x x)的直線回歸方程來進行)的直線回歸方程來進行預(yù)測其可靠程度為預(yù)測其可靠程度為70.0770.07。 .159.04440.8371144.6356 249.5556xyxySPrSS SS 二、相關(guān)系數(shù)的顯著性檢驗二、相關(guān)系數(shù)的顯著性檢驗 上述根據(jù)實際觀測值計算得來的上述根據(jù)實際觀測值計算得來的r r是樣本相是樣本相關(guān)系數(shù),關(guān)系數(shù), 它是雙變量正態(tài)總體的總體相關(guān)系數(shù)它是雙變量正

39、態(tài)總體的總體相關(guān)系數(shù)的估計值。樣本相關(guān)系數(shù)的估計值。樣本相關(guān)系數(shù)r r是否來自是否來自00的的總體,還須對樣本相關(guān)系數(shù)總體,還須對樣本相關(guān)系數(shù)r r 進行顯著性檢驗。進行顯著性檢驗。此時無效假設(shè)、備擇假設(shè)為此時無效假設(shè)、備擇假設(shè)為: : :0H=0=0,AH00。 采用查表法對相關(guān)系數(shù)采用查表法對相關(guān)系數(shù)r r進行顯著性檢驗進行顯著性檢驗 具體作法是:具體作法是: 先根據(jù)自由度先根據(jù)自由度n n-2-2查臨界查臨界r r值值( (附附表表8)8),得,得 0.05(2)nr ,0.01(2)nr。若若| |r r| | ,p p0.050.05,則相關(guān)系數(shù),則相關(guān)系數(shù)r r不顯著,在不顯著,在

40、r r的右上方標記的右上方標記“nsns”或不標記符號;或不標記符號; 0.05(2)nr若若 |r r| | ,0.010.01p p0.050.05,則相關(guān)系數(shù),則相關(guān)系數(shù)r r顯著,在顯著,在r r的右上方標記的右上方標記“* *”; 0.05(2)nr0.01(2)nr若若| |r r| | ,p p0.010.01, 則相關(guān)系則相關(guān)系數(shù)數(shù)r r極顯著,在極顯著,在r r的右上方標記的右上方標記“* * *”。0.01(2)nr對于【例對于【例7373】,】, =0.666=0.666, =0.798=0.798,而而 | |r r|=0.8371|=0.8371 ,p p0.010.

41、01,表明一代三,表明一代三化螟盛發(fā)期與化螟盛發(fā)期與3 3月下旬至月下旬至4 4月中旬積溫的相關(guān)系數(shù)月中旬積溫的相關(guān)系數(shù)極顯著,即一代三化螟盛發(fā)期與極顯著,即一代三化螟盛發(fā)期與3 3月下旬至月下旬至4 4月中月中旬積溫呈極顯著負相關(guān),積溫越高,螟蛾的盛發(fā)旬積溫呈極顯著負相關(guān),積溫越高,螟蛾的盛發(fā)期越早。期越早。 0.05(7)r0.01(7)r0.01(7)r 三、直線相關(guān)分析與回歸分析的關(guān)系三、直線相關(guān)分析與回歸分析的關(guān)系相關(guān)變量相關(guān)變量x x與與y y的相關(guān)系數(shù)的相關(guān)系數(shù)r r是是y y對對x x的回歸系的回歸系數(shù)數(shù) 與與x x對對y y的回歸系數(shù)的回歸系數(shù) 的幾何平均數(shù):的幾何平均數(shù): yxbyxxyrb byxb這表明直線相關(guān)分析與回歸分析關(guān)系十分密這表明直線相關(guān)分析與回歸分析關(guān)系十分密切。切。 直線回歸分析將二個相關(guān)變量區(qū)分為自變量和依直線回歸分析將二個相關(guān)變量區(qū)分為自變量和依變量,側(cè)重于尋求它們之間的聯(lián)系形式變量,側(cè)重于尋求它們之間的聯(lián)系形式直線回歸直線回歸方程;方程;直線相關(guān)分析不區(qū)分自變量和依變量,側(cè)重于揭直線相關(guān)分析不區(qū)分自變

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負責。
  • 6. 下載文件中如有侵權(quán)或不適當內(nèi)容,請與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

評論

0/150

提交評論