第四章 相關(guān)分析與_第1頁(yè)
第四章 相關(guān)分析與_第2頁(yè)
第四章 相關(guān)分析與_第3頁(yè)
第四章 相關(guān)分析與_第4頁(yè)
第四章 相關(guān)分析與_第5頁(yè)
已閱讀5頁(yè),還剩121頁(yè)未讀, 繼續(xù)免費(fèi)閱讀

下載本文檔

版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請(qǐng)進(jìn)行舉報(bào)或認(rèn)領(lǐng)

文檔簡(jiǎn)介

1、第四章第四章 相關(guān)分析和回歸分析相關(guān)分析和回歸分析相關(guān)分析和回歸分析相關(guān)分析和回歸分析第一節(jié)第一節(jié) 地理要素間的地理要素間的相關(guān)分析相關(guān)分析第二節(jié)第二節(jié) 地理要素間的地理要素間的回歸分析回歸分析一一 相關(guān)關(guān)系與函數(shù)關(guān)系相關(guān)關(guān)系與函數(shù)關(guān)系二二 地理要素的相關(guān)類型地理要素的相關(guān)類型三三 相關(guān)程度的程度方法及顯相關(guān)程度的程度方法及顯著性檢驗(yàn)著性檢驗(yàn) 第一節(jié)第一節(jié) 地理要素間的地理要素間的相關(guān)分析相關(guān)分析一一 相關(guān)關(guān)系與函數(shù)關(guān)系相關(guān)關(guān)系與函數(shù)關(guān)系 1.確定性的函數(shù)關(guān)系確定性的函數(shù)關(guān)系 。 2.不確定性的統(tǒng)計(jì)關(guān)系不確定性的統(tǒng)計(jì)關(guān)系相關(guān)關(guān)系相關(guān)關(guān)系3. 相關(guān)關(guān)系與函數(shù)關(guān)系的共同點(diǎn),區(qū)別與聯(lián)系相關(guān)關(guān)系與函數(shù)

2、關(guān)系的共同點(diǎn),區(qū)別與聯(lián)系(1) 共同點(diǎn):都是反映現(xiàn)象變量之間存在的相互依存關(guān)系。共同點(diǎn):都是反映現(xiàn)象變量之間存在的相互依存關(guān)系。 (2) 區(qū)別:相關(guān)關(guān)系是一種不嚴(yán)格的依存關(guān)系,函數(shù)關(guān)系區(qū)別:相關(guān)關(guān)系是一種不嚴(yán)格的依存關(guān)系,函數(shù)關(guān)系是嚴(yán)格確定的依存關(guān)系。是嚴(yán)格確定的依存關(guān)系。 (3) 聯(lián)系:由于觀察值和測(cè)量誤差的存在,函數(shù)關(guān)系在現(xiàn)聯(lián)系:由于觀察值和測(cè)量誤差的存在,函數(shù)關(guān)系在現(xiàn)實(shí)生活中往往通過相關(guān)關(guān)系表現(xiàn)出來;而相關(guān)關(guān)系又往往要實(shí)生活中往往通過相關(guān)關(guān)系表現(xiàn)出來;而相關(guān)關(guān)系又往往要使用函數(shù)關(guān)系的形式來模擬描述使用函數(shù)關(guān)系的形式來模擬描述。()Yf X()Yf Xn為了研究父親與成年兒為了研究父親與成

3、年兒子身高之間的關(guān)系,卡子身高之間的關(guān)系,卡爾爾.皮爾遜測(cè)量了皮爾遜測(cè)量了1078對(duì)對(duì)父子的身高。把父子的身高。把1078對(duì)對(duì)數(shù)字表示在坐標(biāo)上,如數(shù)字表示在坐標(biāo)上,如圖。圖。n它的形狀象一塊橄欖狀它的形狀象一塊橄欖狀的云,中間的點(diǎn)密集,的云,中間的點(diǎn)密集,邊沿的點(diǎn)稀少,其主要邊沿的點(diǎn)稀少,其主要部分是一個(gè)橢圓。部分是一個(gè)橢圓。正相關(guān) 負(fù)相關(guān) 完全正相關(guān) 完全負(fù)相關(guān) 零相關(guān) 二二 地理要素間的相關(guān)類型地理要素間的相關(guān)類型曲線相關(guān)(非線性相關(guān))曲線相關(guān)(非線性相關(guān))按變量按變量 數(shù)量數(shù)量?jī)蓚€(gè)變量?jī)蓚€(gè)變量?jī)蓚€(gè)以上兩個(gè)以上 變量變量直線相關(guān)(線性相關(guān))直線相關(guān)(線性相關(guān))復(fù)相關(guān)復(fù)相關(guān)偏相關(guān)偏相關(guān)按質(zhì)量

4、按質(zhì)量等級(jí)相關(guān)(順序相關(guān))等級(jí)相關(guān)(順序相關(guān))品質(zhì)相關(guān)品質(zhì)相關(guān) 三三 相關(guān)程度的度量及顯著性檢驗(yàn)相關(guān)程度的度量及顯著性檢驗(yàn)由于地理相關(guān)類型各不相同,因此測(cè)度的方法也不同。由于地理相關(guān)類型各不相同,因此測(cè)度的方法也不同。(一)線性相關(guān)程度的測(cè)度(一)線性相關(guān)程度的測(cè)度所謂所謂相關(guān)程度相關(guān)程度,就是研究它們之間的相互關(guān)系是否密切。,就是研究它們之間的相互關(guān)系是否密切。所謂所謂相關(guān)方向相關(guān)方向,又可以分兩種,即正相關(guān)和負(fù)相關(guān)。,又可以分兩種,即正相關(guān)和負(fù)相關(guān)。n正相關(guān)正相關(guān)變量同方向變化,同增同減變量同方向變化,同增同減n負(fù)相關(guān)負(fù)相關(guān)變量反方向變化,一增一減變量反方向變化,一增一減n 不相關(guān)不相關(guān)用

5、來測(cè)度直線相關(guān)程度和方向的指標(biāo)就是相關(guān)系數(shù)。用來測(cè)度直線相關(guān)程度和方向的指標(biāo)就是相關(guān)系數(shù)。 當(dāng)兩個(gè)變量之間為直線相關(guān)時(shí)當(dāng)兩個(gè)變量之間為直線相關(guān)時(shí),可以利用皮爾遜相關(guān)系數(shù)可以利用皮爾遜相關(guān)系數(shù)表示變量之間的相關(guān)關(guān)系及程度表示變量之間的相關(guān)關(guān)系及程度 設(shè)設(shè) 表示變量表示變量 , 的取值的取值, 為兩為兩個(gè)變量的算術(shù)平均數(shù)個(gè)變量的算術(shù)平均數(shù), , 為這兩個(gè)變量的標(biāo)準(zhǔn)差為這兩個(gè)變量的標(biāo)準(zhǔn)差, 為自為自變量數(shù)列與因變量數(shù)列的協(xié)方差,變量數(shù)列與因變量數(shù)列的協(xié)方差, 為相關(guān)系數(shù),則直線相關(guān)為相關(guān)系數(shù),則直線相關(guān)系數(shù)定義為:系數(shù)定義為:),2 , 1)(,(niyxiiXYyx,x2yxyxyxr2y1. 簡(jiǎn)

6、單相關(guān)系數(shù)公式及檢驗(yàn)簡(jiǎn)單相關(guān)系數(shù)公式及檢驗(yàn) r(1) 簡(jiǎn)單相關(guān)系數(shù)公式簡(jiǎn)單相關(guān)系數(shù)公式22)(1)(xxnnxxx)(12yyxxnxy22)(1)(yynnyyy22)()()(yyxxyyxxr222222)2()(xxxxxxxxxxnyyyy222)(nyxxyyyxx)( )(2222)(22nxnxnxxxnxxxnxx22)(nxxxx222)()(22)()()(yyxxyyxxrnyynxxyxnxyr22221(2)相關(guān)系數(shù)的性質(zhì))相關(guān)系數(shù)的性質(zhì)相關(guān)系數(shù)的分布范圍,介于相關(guān)系數(shù)的分布范圍,介于-1-1和和+1+1之間之間當(dāng)相關(guān)系數(shù)為正值時(shí),表示兩個(gè)要素(或變數(shù))之間呈正相當(dāng)

7、相關(guān)系數(shù)為正值時(shí),表示兩個(gè)要素(或變數(shù))之間呈正相關(guān),相關(guān)系數(shù)為負(fù)值時(shí),表示兩個(gè)要素(或變數(shù))之間為負(fù)相關(guān);關(guān),相關(guān)系數(shù)為負(fù)值時(shí),表示兩個(gè)要素(或變數(shù))之間為負(fù)相關(guān);相關(guān)系數(shù)的絕對(duì)值越大。表示兩個(gè)要素間相關(guān)程度越密切。相關(guān)系數(shù)的絕對(duì)值越大。表示兩個(gè)要素間相關(guān)程度越密切。當(dāng)r=+1時(shí),為完全正相關(guān)。R=-1時(shí),為完全負(fù)相關(guān);r=0則完全無直線相關(guān),可能存在其他形式的相關(guān)關(guān)系。 (3)相關(guān)程度的判斷)相關(guān)程度的判斷當(dāng)當(dāng) 時(shí),時(shí),X與與Y高度相關(guān)高度相關(guān)當(dāng)當(dāng) 時(shí),時(shí),X與與Y顯著相關(guān)顯著相關(guān)當(dāng)當(dāng) 時(shí),時(shí),X與與Y低度相關(guān)低度相關(guān)當(dāng)當(dāng) 時(shí),時(shí),X與與Y微相關(guān)或不相關(guān)微相關(guān)或不相關(guān)0 . 18 . 0r

8、8 . 05 . 0r5 . 03 . 0r3 . 00 . 0r 例 某企業(yè)生產(chǎn)某種產(chǎn)品的月產(chǎn)量和生產(chǎn)費(fèi)用的統(tǒng)計(jì)資料如表,試判斷月產(chǎn)量與生產(chǎn)費(fèi)用之間存在怎樣相關(guān)關(guān)系,相關(guān)程度為多少。 序號(hào) 月產(chǎn)量 生產(chǎn)費(fèi)用 序號(hào) 月產(chǎn)量 生產(chǎn)費(fèi)用 1 2 3 4 1.2 2.0 3.1 3.8 62 86 80 110 5 6 7 8 5.0 6.1 7.2 8.0 115 132 135 160 表 月產(chǎn)量和生產(chǎn)費(fèi)用的統(tǒng)計(jì)資料(4)簡(jiǎn)單相關(guān)系數(shù)的應(yīng)用)簡(jiǎn)單相關(guān)系數(shù)的應(yīng)用序號(hào) iX iY 2iX 2iY iiYX 1 2 3 4 5 6 7 8 1.2 2.0 3.1 3.8 5.0 6.1 7.2 8.0

9、 62 86 80 110 115 132 135 160 1.44 4.00 9.61 14.44 25.00 37.21 51.84 64.00 3844 7396 6400 12100 13225 17424 18225 25600 74.4 172.0 248.0 418.0 575.0 805.2 972.0 1280.0 合計(jì) 36.4 880 207.54 104214 4544.6 相關(guān)系數(shù)數(shù)據(jù)計(jì)算表 nyynxxyxnxyr22221)8880104214)(84 .3654.207()880)(4 .36(816 .45442297. 0741492.416 .540表明X

10、與Y之間存在線性相關(guān)關(guān)系,且是高度相關(guān)。 和和 都是相互對(duì)稱的隨機(jī)變量都是相互對(duì)稱的隨機(jī)變量 線性線性相關(guān)系數(shù)只反映變量間的線性相關(guān)程度,不相關(guān)系數(shù)只反映變量間的線性相關(guān)程度,不 能說明非線性相關(guān)關(guān)系能說明非線性相關(guān)關(guān)系 樣本相關(guān)系數(shù)是總體相關(guān)系數(shù)的樣本估計(jì)值,由樣本相關(guān)系數(shù)是總體相關(guān)系數(shù)的樣本估計(jì)值,由 于抽樣波動(dòng),樣本相關(guān)系數(shù)是個(gè)隨機(jī)變量,其統(tǒng)于抽樣波動(dòng),樣本相關(guān)系數(shù)是個(gè)隨機(jī)變量,其統(tǒng) 計(jì)顯著性有待檢驗(yàn)計(jì)顯著性有待檢驗(yàn) 相關(guān)系數(shù)只能反映線性相關(guān)程度,不能確定因果相關(guān)系數(shù)只能反映線性相關(guān)程度,不能確定因果關(guān)系,不能說明相關(guān)關(guān)系具體接近哪條直線關(guān)系,不能說明相關(guān)關(guān)系具體接近哪條直線 使用簡(jiǎn)單相

11、關(guān)系數(shù)時(shí)的注意事項(xiàng)使用簡(jiǎn)單相關(guān)系數(shù)時(shí)的注意事項(xiàng)XY 相關(guān)系數(shù)是根據(jù)要素之間的樣本值計(jì)算出來相關(guān)系數(shù)是根據(jù)要素之間的樣本值計(jì)算出來的,它隨著樣本數(shù)的多少或取樣方式的不同而不的,它隨著樣本數(shù)的多少或取樣方式的不同而不同,因此它只是要素之間的樣本相關(guān)系數(shù),只有同,因此它只是要素之間的樣本相關(guān)系數(shù),只有通過檢驗(yàn),才能知道它的可信度。通過檢驗(yàn),才能知道它的可信度。 (5)相關(guān)系數(shù)的顯著性檢驗(yàn))相關(guān)系數(shù)的顯著性檢驗(yàn) 一般情況下,相關(guān)系數(shù)的檢驗(yàn),是在給定的一般情況下,相關(guān)系數(shù)的檢驗(yàn),是在給定的置信水平下,通過查相關(guān)系數(shù)檢驗(yàn)的臨界值表來置信水平下,通過查相關(guān)系數(shù)檢驗(yàn)的臨界值表來完成的。完成的。檢驗(yàn)相關(guān)系數(shù)檢驗(yàn)

12、相關(guān)系數(shù)=0的臨界值(的臨界值(ra)表表prra=f f值稱為自由度,值稱為自由度,其數(shù)值為其數(shù)值為f=n-2f=n-2,這里這里n n為樣本數(shù)為樣本數(shù)a a代表不同的代表不同的顯著性水平顯著性水平表內(nèi)的數(shù)值表內(nèi)的數(shù)值代表不同的代表不同的置信水平下置信水平下相關(guān)系數(shù)相關(guān)系數(shù)=0=0的臨界的臨界值,值,即即ra公式公式p=p=r rrara=a=a的意的意思是當(dāng)所計(jì)算的相關(guān)系數(shù)思是當(dāng)所計(jì)算的相關(guān)系數(shù)r r的的絕對(duì)值大于在絕對(duì)值大于在a a水平下的臨界水平下的臨界值值rara時(shí),兩要素不相關(guān)(即時(shí),兩要素不相關(guān)(即=0)=0)的可能性只有的可能性只有a a。相關(guān)系數(shù)相關(guān)系數(shù)r的具體檢驗(yàn)方法步驟如

13、下:的具體檢驗(yàn)方法步驟如下:(1)計(jì)算相關(guān)系數(shù))計(jì)算相關(guān)系數(shù)r(2)給定顯著水平)給定顯著水平,按按n-2查相關(guān)系數(shù)臨界值,查相關(guān)系數(shù)臨界值,查出相應(yīng)的臨界值查出相應(yīng)的臨界值(3)比較)比較r的絕對(duì)值與臨界值的大小。當(dāng)?shù)慕^對(duì)值與臨界值的大小。當(dāng)r的絕的絕對(duì)值大于或等于臨界值時(shí),說明兩變量在對(duì)值大于或等于臨界值時(shí),說明兩變量在水平水平上達(dá)到顯著性;若小于臨界值,則說明兩變量沒上達(dá)到顯著性;若小于臨界值,則說明兩變量沒有達(dá)到所要求的精度。有達(dá)到所要求的精度。如果仍需研究二者的關(guān)系如果仍需研究二者的關(guān)系,可考慮降低精度,即修改顯著性水平,可考慮降低精度,即修改顯著性水平、相關(guān)系數(shù)的顯著性檢驗(yàn)步驟相關(guān)

14、系數(shù)的顯著性檢驗(yàn)步驟2、等級(jí)相關(guān)系數(shù)的計(jì)算公式及檢驗(yàn)、等級(jí)相關(guān)系數(shù)的計(jì)算公式及檢驗(yàn)表示兩個(gè)變量順序間直線相關(guān)程度和方向表示兩個(gè)變量順序間直線相關(guān)程度和方向的系數(shù),稱為等級(jí)(或順序)相關(guān)系數(shù)。等級(jí)的系數(shù),稱為等級(jí)(或順序)相關(guān)系數(shù)。等級(jí)相關(guān)系數(shù)不僅適用于數(shù)量指標(biāo)的相關(guān)分析,同相關(guān)系數(shù)不僅適用于數(shù)量指標(biāo)的相關(guān)分析,同時(shí)亦適用于質(zhì)量指標(biāo)的相關(guān)分析。時(shí)亦適用于質(zhì)量指標(biāo)的相關(guān)分析。等級(jí)相關(guān)系數(shù),又稱順序相關(guān)系數(shù)是將兩等級(jí)相關(guān)系數(shù),又稱順序相關(guān)系數(shù)是將兩要素的樣本值按數(shù)值的大小順序排列位次,以要素的樣本值按數(shù)值的大小順序排列位次,以各要素樣本值的位次代替實(shí)際數(shù)據(jù)而求得的一各要素樣本值的位次代替實(shí)際數(shù)據(jù)而求

15、得的一種統(tǒng)計(jì)量。實(shí)際上,它是位次分析方法的數(shù)量種統(tǒng)計(jì)量。實(shí)際上,它是位次分析方法的數(shù)量化。化。(1)等級(jí)相關(guān)系數(shù)的計(jì)算公式)等級(jí)相關(guān)系數(shù)的計(jì)算公式) 1(*61212nndRniid(2)等級(jí)相關(guān)系數(shù)的計(jì)算及檢驗(yàn))等級(jí)相關(guān)系數(shù)的計(jì)算及檢驗(yàn)1985年全國(guó)各?。ㄊ?,區(qū)年全國(guó)各省(市,區(qū))總?cè)丝谂c社會(huì)總產(chǎn)值總?cè)丝谂c社會(huì)總產(chǎn)值即:總?cè)丝冢矗嚎側(cè)丝冢▁)x)與社會(huì)總產(chǎn)值(與社會(huì)總產(chǎn)值(y)y)的等級(jí)相關(guān)系的等級(jí)相關(guān)系數(shù)為數(shù)為0.7260.726等級(jí)相關(guān)系數(shù)檢驗(yàn)的臨界值等級(jí)相關(guān)系數(shù)檢驗(yàn)的臨界值在上例中,在上例中,n=29n=29,表中沒有給出相應(yīng)的樣本數(shù),表中沒有給出相應(yīng)的樣本數(shù)下的臨界值下的臨界值ra

16、ra,但我們發(fā)現(xiàn),在同一顯著水平,但我們發(fā)現(xiàn),在同一顯著水平下,隨著樣本數(shù)的增大,臨界值下,隨著樣本數(shù)的增大,臨界值rara減少。在減少。在n = 2 8n = 2 8 時(shí) , 查 表 可 知 :時(shí) , 查 表 可 知 : r 0 . 0 5 = 0 . 3 1 7r 0 . 0 5 = 0 . 3 1 7 ,r0.01=0.448r0.01=0.448,由于,由于rxy=0.726rxy=0.726r0.01=0.448r0.01=0.448,故故rxyrxy在在a=0.01a=0.01的置信水平上是顯著的。的置信水平上是顯著的。等級(jí)相關(guān)系數(shù)檢驗(yàn)結(jié)果等級(jí)相關(guān)系數(shù)檢驗(yàn)結(jié)果(二)(二)多要素間相

17、關(guān)程度的測(cè)定多要素間相關(guān)程度的測(cè)定1.偏相關(guān)系數(shù)的計(jì)算與檢驗(yàn)偏相關(guān)系數(shù)的計(jì)算與檢驗(yàn) 在多要素所構(gòu)成的地理系統(tǒng)中,當(dāng)我們研究在多要素所構(gòu)成的地理系統(tǒng)中,當(dāng)我們研究某一個(gè)要素對(duì)另一個(gè)要素的影響或相關(guān)程度時(shí),某一個(gè)要素對(duì)另一個(gè)要素的影響或相關(guān)程度時(shí),把其它要素的影響視為常數(shù)(保持不變把其它要素的影響視為常數(shù)(保持不變),即,即暫不考慮其它要素的影響,而單獨(dú)研究那兩個(gè)暫不考慮其它要素的影響,而單獨(dú)研究那兩個(gè)要素之間的相互關(guān)系的密切程度時(shí),則稱為偏要素之間的相互關(guān)系的密切程度時(shí),則稱為偏相關(guān)。用以度量偏相關(guān)程度的統(tǒng)計(jì)量,稱為偏相關(guān)。用以度量偏相關(guān)程度的統(tǒng)計(jì)量,稱為偏相關(guān)系數(shù)。相關(guān)系數(shù)。624C當(dāng)研究當(dāng)研

18、究2 2個(gè)相關(guān)變量個(gè)相關(guān)變量x1x1、x2x2的關(guān)系時(shí)的關(guān)系時(shí),用直線相關(guān),用直線相關(guān)系數(shù)系數(shù)r12r12表示表示x1x1與與x2x2線性相關(guān)的性質(zhì)與程度。此時(shí)固定的線性相關(guān)的性質(zhì)與程度。此時(shí)固定的變量個(gè)數(shù)為變量個(gè)數(shù)為0 0,所以直線相關(guān)系數(shù),所以直線相關(guān)系數(shù)r12r12又叫做零級(jí)偏相關(guān)系又叫做零級(jí)偏相關(guān)系數(shù)。數(shù)。當(dāng)研究當(dāng)研究3 3個(gè)相關(guān)變量個(gè)相關(guān)變量x1x1、x2x2、x3x3的相關(guān)時(shí)的相關(guān)時(shí),我們把我們把x3x3保持固定不變,保持固定不變,x1x1與與x2x2的相關(guān)系數(shù)稱為的相關(guān)系數(shù)稱為x1x1與與x2x2的偏相關(guān)的偏相關(guān)系數(shù),記為系數(shù),記為r12.3r12.3,類似地,還有偏相關(guān)系數(shù),類

19、似地,還有偏相關(guān)系數(shù)r13.2r13.2、 r23.1r23.1。這。這3 3個(gè)偏相關(guān)系數(shù)固定的變量個(gè)數(shù)為個(gè)偏相關(guān)系數(shù)固定的變量個(gè)數(shù)為1 1,所以都叫,所以都叫做一級(jí)偏相關(guān)系數(shù)。做一級(jí)偏相關(guān)系數(shù)。當(dāng)研究當(dāng)研究4 4個(gè)相關(guān)變量個(gè)相關(guān)變量x1x1、x2x2、x3x3、x4x4的相關(guān)時(shí)的相關(guān)時(shí),須將其中的須將其中的2 2個(gè)變量固定不變,研究另外兩個(gè)變量間的相個(gè)變量固定不變,研究另外兩個(gè)變量間的相關(guān)。即此時(shí)只有二級(jí)偏相關(guān)系數(shù)才真實(shí)地反映兩個(gè)相關(guān)變關(guān)。即此時(shí)只有二級(jí)偏相關(guān)系數(shù)才真實(shí)地反映兩個(gè)相關(guān)變量間線性相關(guān)的性質(zhì)與程度。二級(jí)偏相關(guān)系數(shù)共有量間線性相關(guān)的性質(zhì)與程度。二級(jí)偏相關(guān)系數(shù)共有6 6個(gè):個(gè):r12

20、.34r12.34,r13.24r13.24,r14.23r14.23,r23.14r23.14,r24.13r24.13,r34.12r34.12。624C2/ ) 1(2mmCm一般,當(dāng)研究一般,當(dāng)研究m個(gè)相關(guān)變量個(gè)相關(guān)變量x1、x2、xm的的相關(guān)時(shí),只有將其中的相關(guān)時(shí),只有將其中的m-2個(gè)變量保持固定不變,個(gè)變量保持固定不變,研究另外兩個(gè)變量的相關(guān)才能真實(shí)地反映這兩個(gè)研究另外兩個(gè)變量的相關(guān)才能真實(shí)地反映這兩個(gè)相關(guān)變量間的相關(guān),即此時(shí)只有相關(guān)變量間的相關(guān),即此時(shí)只有m-2級(jí)偏相關(guān)系數(shù)級(jí)偏相關(guān)系數(shù)才真實(shí)地反映了這兩個(gè)相關(guān)變量間線性相關(guān)的性才真實(shí)地反映了這兩個(gè)相關(guān)變量間線性相關(guān)的性質(zhì)與程度。質(zhì)

21、與程度。m-2級(jí)偏相關(guān)系數(shù)共有級(jí)偏相關(guān)系數(shù)共有個(gè)。個(gè)。xi與與xj的的m-2級(jí)偏相關(guān)系數(shù)記為級(jí)偏相關(guān)系數(shù)記為rij.(i,j=1,2,m,ij)。偏相關(guān)系數(shù),可利用單相關(guān)系數(shù)來計(jì)算。偏相關(guān)系數(shù),可利用單相關(guān)系數(shù)來計(jì)算。假設(shè)有三個(gè)要素假設(shè)有三個(gè)要素x1,x2,x3,其兩兩間單,其兩兩間單相關(guān)系數(shù)矩陣為相關(guān)系數(shù)矩陣為對(duì)于上述三個(gè)要素對(duì)于上述三個(gè)要素x1,x2,x3,它們之間的偏,它們之間的偏相關(guān)系數(shù)共有三個(gè),即相關(guān)系數(shù)共有三個(gè),即r123,r132,r231(下(下標(biāo)點(diǎn)后面的數(shù)字,代表在計(jì)算偏相關(guān)系數(shù)時(shí),保標(biāo)點(diǎn)后面的數(shù)字,代表在計(jì)算偏相關(guān)系數(shù)時(shí),保持不變量,如持不變量,如r123即表示即表示x3保

22、持不變保持不變),其計(jì)算,其計(jì)算公式分別如下:公式分別如下:式(式(5)(7)表示三個(gè)偏表示三個(gè)偏相關(guān)系數(shù),相關(guān)系數(shù),稱為一級(jí)偏稱為一級(jí)偏相關(guān)系數(shù)。相關(guān)系數(shù)。若有四個(gè)要素若有四個(gè)要素X1,X2,X3,X4,則有六個(gè)偏相,則有六個(gè)偏相關(guān)系數(shù),即關(guān)系數(shù),即r1234,r1324,r1423,r2314,r2412,r3412,它們稱為二級(jí)偏相關(guān)系數(shù),其,它們稱為二級(jí)偏相關(guān)系數(shù),其計(jì)算公式分別如下:計(jì)算公式分別如下:在式(在式(8)8)中,中,r1234r1234表示在表示在x3x3和和x4x4保持不變保持不變的條件,的條件,x1x1和和x2x2的偏相的偏相關(guān)系數(shù)。關(guān)系數(shù)。為了計(jì)算二級(jí)偏相關(guān)系數(shù),需

23、要先計(jì)算一級(jí)偏相為了計(jì)算二級(jí)偏相關(guān)系數(shù),需要先計(jì)算一級(jí)偏相關(guān)系數(shù),由(關(guān)系數(shù),由(5)式可求得式可求得 同理,依次可以計(jì)算出其它各一級(jí)偏相關(guān)系數(shù),同理,依次可以計(jì)算出其它各一級(jí)偏相關(guān)系數(shù),見下表見下表 在一級(jí)偏相關(guān)系數(shù)求出以后,便可代入公式計(jì)算二級(jí)偏相關(guān)系數(shù),如由(8)式計(jì)算可得同理,依次可計(jì)算出其它各二級(jí)偏相關(guān)系數(shù),見同理,依次可計(jì)算出其它各二級(jí)偏相關(guān)系數(shù),見下表下表 偏相關(guān)系數(shù)具有下述性質(zhì):偏相關(guān)系數(shù)具有下述性質(zhì):(1)偏相關(guān)系數(shù)分布的范圍在偏相關(guān)系數(shù)分布的范圍在-1到到1之間;之間;(2) 偏相關(guān)系數(shù)的絕對(duì)值越大,表示其偏相關(guān)程偏相關(guān)系數(shù)的絕對(duì)值越大,表示其偏相關(guān)程度越大;度越大;(3)

24、偏相關(guān)系數(shù)的絕對(duì)值必小于或最多等于由同)偏相關(guān)系數(shù)的絕對(duì)值必小于或最多等于由同一系列資料所求得的復(fù)相關(guān)系數(shù),即一系列資料所求得的復(fù)相關(guān)系數(shù),即 R123|r123|。偏相關(guān)系數(shù)的顯著性檢驗(yàn)偏相關(guān)系數(shù)的顯著性檢驗(yàn)偏相關(guān)系數(shù)的顯著性檢驗(yàn),一般采用偏相關(guān)系數(shù)的顯著性檢驗(yàn),一般采用t檢驗(yàn)法。檢驗(yàn)法。其統(tǒng)計(jì)量計(jì)算公式為其統(tǒng)計(jì)量計(jì)算公式為在(在(15)15)式中,式中,r1234mr1234m為偏相關(guān)系數(shù),為偏相關(guān)系數(shù),n n為為樣本數(shù),樣本數(shù),m m為自變量個(gè)數(shù)。為自變量個(gè)數(shù)。對(duì)于前述計(jì)算得到的偏相關(guān)系數(shù)對(duì)于前述計(jì)算得到的偏相關(guān)系數(shù)r2413=0.821,由于由于n=23,m=3,故,故查查t分布表,可

25、得出不同顯著水平上的臨界值分布表,可得出不同顯著水平上的臨界值ta,若若t ta ,則表示偏相關(guān)顯著;反之,則表示偏相關(guān)顯著;反之,tta,則,則偏相關(guān)不顯著。在自由度為偏相關(guān)不顯著。在自由度為23-3-1=19時(shí),查表得時(shí),查表得t0.001=3.883,所以,所以tta,這表明在顯著性水平,這表明在顯著性水平a=0.001上,偏相關(guān)系數(shù)上,偏相關(guān)系數(shù)r2413是顯著的。是顯著的。Correlations1.943*.998*.000.000171717.943*1.940*.000.000171717.998*.940*1.000.000.171717Pearson Correlation

26、Sig. (2-tailed)NPearson CorrelationSig. (2-tailed)NPearson CorrelationSig. (2-tailed)NVAR00001VAR00002VAR00003VAR00001VAR00002VAR00003Correlation is significant at the 0.01 level (2-tailed).*. 1.計(jì)算簡(jiǎn)單相關(guān)系數(shù)計(jì)算簡(jiǎn)單相關(guān)系數(shù)n- - - P A R T I A L C O R R E L A T I O N C O E F F I C I E N T S - - Controlling for. 時(shí)

27、間時(shí)間n GDP 人口人口nGDP 1.0000 -.0690n人口人口 -.0690 1.0000 2.計(jì)算偏相關(guān)系數(shù)計(jì)算偏相關(guān)系數(shù) 如果令時(shí)間如果令時(shí)間 T不變不變 ,計(jì)算人口與計(jì)算人口與 GDP的偏相關(guān)系數(shù)為的偏相關(guān)系數(shù)為 =- 0. 0690 ,且且 t = -0.259 0. 8 =。由此可以看出。由此可以看出 ,如果如果去掉時(shí)間的因素去掉時(shí)間的因素 ,人口與人口與 GDP之間的偏相關(guān)系數(shù)很小之間的偏相關(guān)系數(shù)很小 ,即即如果固定時(shí)間不變?nèi)绻潭〞r(shí)間不變 ,人口與人口與 GDP 之間的關(guān)系是微弱的之間的關(guān)系是微弱的 ,且且經(jīng)檢驗(yàn)人口與經(jīng)檢驗(yàn)人口與 GDP之間沒有什么內(nèi)在的必然的線性聯(lián)系

28、。之間沒有什么內(nèi)在的必然的線性聯(lián)系。人口越多未必人口越多未必 GDP越高越高 ,這是比較合乎實(shí)際的。這是比較合乎實(shí)際的。2.復(fù)相關(guān)系數(shù)的計(jì)算與檢驗(yàn)復(fù)相關(guān)系數(shù)的計(jì)算與檢驗(yàn) 復(fù)相關(guān)系數(shù):反映幾個(gè)要素與某一個(gè)要復(fù)相關(guān)系數(shù):反映幾個(gè)要素與某一個(gè)要素之間的復(fù)相關(guān)程度素之間的復(fù)相關(guān)程度 。n復(fù)相關(guān)系數(shù)的計(jì)算復(fù)相關(guān)系數(shù)的計(jì)算 當(dāng)有兩個(gè)自變量時(shí)當(dāng)有兩個(gè)自變量時(shí) 當(dāng)有三個(gè)自變量時(shí)當(dāng)有三個(gè)自變量時(shí))1)(1 (11 . 221212.yyyrrR)1)(1)(1 (112. 321 . 2212123.yyyyrrrR當(dāng)有當(dāng)有k個(gè)自變量時(shí)個(gè)自變量時(shí))1 )1)(1 (1) 1.(12.21 . 2212.12.

29、kykyykyrrrR復(fù)相關(guān)系數(shù)的性質(zhì)復(fù)相關(guān)系數(shù)的性質(zhì) 復(fù)相關(guān)系數(shù)介于復(fù)相關(guān)系數(shù)介于0到到1之間,即之間,即1012.kyR 復(fù)相關(guān)系數(shù)越大,則表明要素(變量)之間的相復(fù)相關(guān)系數(shù)越大,則表明要素(變量)之間的相關(guān)程度越密切。復(fù)相關(guān)系數(shù)為關(guān)程度越密切。復(fù)相關(guān)系數(shù)為1,表示完全相關(guān);,表示完全相關(guān);復(fù)相關(guān)系數(shù)為復(fù)相關(guān)系數(shù)為0,表示完全無關(guān)。,表示完全無關(guān)。 復(fù)相關(guān)系數(shù)必大于或至少等于單相關(guān)系數(shù)的絕對(duì)復(fù)相關(guān)系數(shù)必大于或至少等于單相關(guān)系數(shù)的絕對(duì)值。值。n復(fù)相關(guān)系數(shù)的顯著性檢驗(yàn)復(fù)相關(guān)系數(shù)的顯著性檢驗(yàn) F檢驗(yàn)法。其統(tǒng)計(jì)量計(jì)算公式為檢驗(yàn)法。其統(tǒng)計(jì)量計(jì)算公式為kknRRFkyky11212.212.例題:在上

30、例中,若以例題:在上例中,若以x4為因變量,為因變量,x1,x2,x3為自為自變量,試計(jì)算變量,試計(jì)算x4與與x1,x2,x3之間的復(fù)相關(guān)系數(shù)。之間的復(fù)相關(guān)系數(shù)。 解:按照公式計(jì)算解:按照公式計(jì)算 檢驗(yàn):檢驗(yàn): ,故復(fù)相關(guān)達(dá)到了,故復(fù)相關(guān)達(dá)到了極顯著水平。極顯著水平。974. 0337. 01)(956. 01)(579. 01 (1)1)(1)(1 (1222212.4321 .42241123. 4)rrrR3010. 57190.12001. 0FF一一 回歸分析的意義與研究?jī)?nèi)容回歸分析的意義與研究?jī)?nèi)容二二 一元回歸分析一元回歸分析三三 多元回歸分析多元回歸分析四四 非線性回歸模型非線性

31、回歸模型第二節(jié)第二節(jié) 地理要素間的地理要素間的回歸分析回歸分析1 1、 回歸分析意義回歸分析意義回歸的古典意義回歸的古典意義: 高爾頓遺傳學(xué)的回歸概念高爾頓遺傳學(xué)的回歸概念 ( 父母身高與子女身高的關(guān)系父母身高與子女身高的關(guān)系)回歸的現(xiàn)代意義回歸的現(xiàn)代意義: 一個(gè)因變量對(duì)若干自變量一個(gè)因變量對(duì)若干自變量 依存關(guān)系依存關(guān)系 的研究的研究回歸的目的(實(shí)質(zhì))回歸的目的(實(shí)質(zhì)): 由固定的自變量去由固定的自變量去 估計(jì)因變量的平均值估計(jì)因變量的平均值一一 回歸分析的意義與研究?jī)?nèi)容回歸分析的意義與研究?jī)?nèi)容2、回歸分析的概念、回歸分析的概念 就是對(duì)具有相互聯(lián)系的要素,根據(jù)其就是對(duì)具有相互聯(lián)系的要素,根據(jù)其

32、聯(lián)系的形態(tài),選擇一個(gè)合適的數(shù)學(xué)模式,聯(lián)系的形態(tài),選擇一個(gè)合適的數(shù)學(xué)模式,用來近似地表達(dá)要素間平均變化關(guān)系的用來近似地表達(dá)要素間平均變化關(guān)系的數(shù)理統(tǒng)計(jì)方法。這個(gè)數(shù)學(xué)模式稱為回歸數(shù)理統(tǒng)計(jì)方法。這個(gè)數(shù)學(xué)模式稱為回歸模型(回歸方程)模型(回歸方程) 3、回歸分析的目的、回歸分析的目的10 用樣本回歸函數(shù)去估計(jì)總體回歸函數(shù)。用樣本回歸函數(shù)去估計(jì)總體回歸函數(shù)。 由于樣本對(duì)總體總是存在代表性誤差,樣本回歸函由于樣本對(duì)總體總是存在代表性誤差,樣本回歸函數(shù)總會(huì)過數(shù)總會(huì)過 高或過低估計(jì)總體回歸函數(shù)。高或過低估計(jì)總體回歸函數(shù)。要解決的問題:要解決的問題:尋求一種規(guī)則和方法,使得到的樣本回歸函數(shù)的參尋求一種規(guī)則和方法

33、,使得到的樣本回歸函數(shù)的參數(shù)數(shù) 和和 盡可能盡可能“接近接近”總體回歸函數(shù)中的參數(shù)總體回歸函數(shù)中的參數(shù) 和和 。這樣的這樣的“規(guī)則和方法規(guī)則和方法”有多種,最常用的是最小二有多種,最常用的是最小二乘法乘法10iY 樣本 總體 A iY()iiE Y XiYYiXX4、回歸分析研究的主要內(nèi)容回歸分析研究的主要內(nèi)容 從一組地理數(shù)據(jù)出發(fā),確定這些要素(變量)從一組地理數(shù)據(jù)出發(fā),確定這些要素(變量)間的定量數(shù)學(xué)表達(dá)式,即回歸模型。間的定量數(shù)學(xué)表達(dá)式,即回歸模型。 根據(jù)一個(gè)或幾個(gè)要素(自變量)的值來預(yù)測(cè)根據(jù)一個(gè)或幾個(gè)要素(自變量)的值來預(yù)測(cè)或控制另一個(gè)要素(因變量)的取值。或控制另一個(gè)要素(因變量)的取

34、值。 從影響某一地理過程中的許多要素中,找出從影響某一地理過程中的許多要素中,找出哪些要素(變量)是主要的,哪些因素是次要的,哪些要素(變量)是主要的,哪些因素是次要的,這些要素之間又有什么聯(lián)系。這些要素之間又有什么聯(lián)系。 回歸分析研究的地理數(shù)學(xué)模型,依要素(變量)的回歸分析研究的地理數(shù)學(xué)模型,依要素(變量)的多少可分為一元地理回歸模型和多元地理回歸模型。多少可分為一元地理回歸模型和多元地理回歸模型。5、回歸分析與相關(guān)分析回歸分析與相關(guān)分析 相關(guān)分析所研究的變量是對(duì)等關(guān)系;回歸分析所相關(guān)分析所研究的變量是對(duì)等關(guān)系;回歸分析所研究的兩個(gè)變量不是對(duì)等關(guān)系。研究的兩個(gè)變量不是對(duì)等關(guān)系。 對(duì)兩個(gè)變量來

35、說,相關(guān)分析只能計(jì)算出一個(gè)相關(guān)對(duì)兩個(gè)變量來說,相關(guān)分析只能計(jì)算出一個(gè)相關(guān)系數(shù),而回歸分析,可分別建立兩個(gè)不同的回歸方程。系數(shù),而回歸分析,可分別建立兩個(gè)不同的回歸方程。 相關(guān)分析要求兩個(gè)變量都必須是隨機(jī)的,而回歸相關(guān)分析要求兩個(gè)變量都必須是隨機(jī)的,而回歸分析的要求,自變量是給定的,因變量是隨機(jī)的。分析的要求,自變量是給定的,因變量是隨機(jī)的。計(jì)量地理學(xué)關(guān)心:變量間的因果關(guān)系及隱藏在計(jì)量地理學(xué)關(guān)心:變量間的因果關(guān)系及隱藏在隨機(jī)性后面的統(tǒng)計(jì)規(guī)律性,這有賴于回歸分析隨機(jī)性后面的統(tǒng)計(jì)規(guī)律性,這有賴于回歸分析方法方法二、二、 一元回歸分析一元回歸分析(一)一元線性回歸及其基本思想(一)一元線性回歸及其基本

36、思想 1. 一元線性回歸的最小二乘法一元線性回歸的最小二乘法某城市各年居民生活費(fèi)收入與消費(fèi)支出額的數(shù)據(jù)表序號(hào)生活費(fèi)收入消費(fèi)支出額序號(hào)生活費(fèi)收入消費(fèi)支出額12345250290360420450170250290310330678910490570650750820370400500550640根據(jù)表中的資料,確定生活費(fèi)收入與消費(fèi)支出之間存在的關(guān)系。 用X表示生活費(fèi)收入,Y表示消費(fèi)支出,把表中數(shù)據(jù)的關(guān)系用坐標(biāo)系中的相關(guān)點(diǎn)表示, XY10)(iiYY iX 從圖中我們看到,相關(guān)點(diǎn)的分布呈現(xiàn)出線性的形態(tài),這說明,生活費(fèi)收入與消費(fèi)支出之間不僅存在著相關(guān)關(guān)系相關(guān)關(guān)系,而且它們之間具有線性關(guān)系線性關(guān)系。因

37、此我們就希望通過這些相關(guān)點(diǎn)確定出一條直線,利用這條直線表示它們的線性關(guān)系。 設(shè)這條直線的方程為XY10 對(duì)于這些相關(guān)點(diǎn),可以做出多條直線表示變量之間的關(guān)系,我們希望在這些直線中找出最有“代表性”的直線。尋找最有“代表性”直線的常用方法是“最小二乘法”。稱為回歸系數(shù)稱為回歸方程,1010,XY)(n3 , 2 , 1ieYii10iX或 最小二乘法的基本思想是最小二乘法的基本思想是:最有 “代表性” 的直線應(yīng)該是直線到各點(diǎn)的距離最近。等價(jià)的提法是:各點(diǎn)到直線的縱向距離最近。 對(duì)于變量X 的每一個(gè)值,相關(guān)點(diǎn)到直線的縱向距離是離差 ,為避免出現(xiàn)負(fù)號(hào)可用 表示。對(duì)于多個(gè)點(diǎn),點(diǎn)到直線的距離用 表示。即利

38、用離差的平方和表示多個(gè)點(diǎn)到直線的距離。 根據(jù)最小二乘法的原理,最佳的直線是“的實(shí)際值與估計(jì)值 之間的離差平方和為最小” iXiYiiYY2)(iiYY2)(iiYYiYiYYniiiXYSSE121010)(),(最小即使得niiiYYSSE12)(SSE 稱為誤差平方和,將 代入上式得到 iiXY10達(dá)到最小的條件是:根據(jù)極值理論SSE,0)(0)(10SSESSE,02)(100XYSSE02)(101XXYSSE22110)(11XnXYXnXYXY0021010XXXYXnYXYXXYXn21010解方程組得2.一元回歸方程參數(shù)的求解公式一元回歸方程參數(shù)的求解公式22110)(11Xn

39、XYXnXYXY22110)(1111XnXYXnXYXnYn( (手算)手算)3 3、具體計(jì)算方法、具體計(jì)算方法(1 1)將原始數(shù)據(jù)根據(jù)需要列表)將原始數(shù)據(jù)根據(jù)需要列表(2 2)根據(jù)公式計(jì)算)根據(jù)公式計(jì)算(3 3)計(jì)算)計(jì)算(4 4)寫出回歸模型)寫出回歸模型(5 5)一般情況下還要求出相關(guān)系數(shù))一般情況下還要求出相關(guān)系數(shù)01序號(hào) iX iY 2iX 2iY iiYX 1 2 3 4 5 6 7 8 9 10 250 290 360 420 450 490 570 650 750 820 170 250 290 310 330 370 400 500 550 640 62500 84100

40、129600 176400 202500 240100 324900 422500 562500 672400 28900 62500 84100 96100 108900 136900 160000 250000 302500 409600 42500 72500 104400 130200 148500 181300 228000 325000 412500 524800 合計(jì) 5050 3810 2877500 1639500 2169700 回歸方程數(shù)據(jù)表回歸方程數(shù)據(jù)表50501niiX38101niiY287750012niiX163950012niiY21697001niiiYX2

41、1)5050(1012877503810505010121697003272502456507506.0974. 150501017506. 038101010X7506.0974.1XY10得回歸方程為:iX(二)一元線性回歸模型應(yīng)用條件(二)一元線性回歸模型應(yīng)用條件 自變量X與因變量Y,X與Y之間的線性相關(guān)關(guān)系用函數(shù)關(guān)系表達(dá)式一般可以表示為 XY10德國(guó)數(shù)學(xué)家高斯提出了如下理論假設(shè). 1. 零均值假設(shè)。又稱為無偏性假設(shè),在給定 的條件下, 的條件數(shù)學(xué)期望等于0.即 2 同方差假設(shè)。又稱為等方差性假設(shè)。即對(duì)所有的 , 的條件方差都相等,且為常數(shù)。即 i0)(iEi)(iDiX 3. 無自相關(guān)

42、假設(shè)。又稱為獨(dú)立性假設(shè)。它假設(shè)隨機(jī)誤差項(xiàng)的逐次觀察值互不相關(guān),即4. 與X不相關(guān)假設(shè)?;貧w模型中的隨機(jī)誤差項(xiàng) 與自變量 各自獨(dú)立影響因變量Yi。即 5. 正態(tài)性假設(shè)。假設(shè)隨機(jī)誤差項(xiàng) 服從均值為零,方差為 的正態(tài)分布。即: 0),(jiCOVi0),(jixCOV2iX), 0(2Ni 1、 線性關(guān)系檢驗(yàn)線性關(guān)系檢驗(yàn) 線性關(guān)系檢驗(yàn):是指檢驗(yàn)自變量與因變量之間關(guān)系能否用一個(gè)線性模型來表示。 擬合優(yōu)度檢驗(yàn)擬合優(yōu)度檢驗(yàn)判定系數(shù)法判定系數(shù)法 擬合優(yōu)度檢驗(yàn)就是檢驗(yàn)回歸模型擬和實(shí)際數(shù)據(jù)的擬和程度。 一元分析中Y值的變化可以看成是由兩個(gè)原因兩個(gè)原因的變化引起的,一個(gè)是由于自變量自變量X變動(dòng)引起的,二是由于其它

43、因素其它因素變動(dòng)引起的,如圖。(三)回歸模型的檢驗(yàn)(三)回歸模型的檢驗(yàn)擬合優(yōu)度擬合優(yōu)度? ? 概念概念:樣本回歸線是對(duì)樣本數(shù)據(jù)樣本回歸線是對(duì)樣本數(shù)據(jù)的一種擬合,不同估計(jì)方的一種擬合,不同估計(jì)方法可擬合出不同的回歸線,法可擬合出不同的回歸線,擬合的回歸線與樣本觀測(cè)擬合的回歸線與樣本觀測(cè)值總有偏離。值總有偏離。 樣本回歸線對(duì)樣本觀測(cè)數(shù)據(jù)擬合的優(yōu)劣程度樣本回歸線對(duì)樣本觀測(cè)數(shù)據(jù)擬合的優(yōu)劣程度 擬合優(yōu)度擬合優(yōu)度擬合優(yōu)度的度量建立在對(duì)總變差分解的基礎(chǔ)上擬合優(yōu)度的度量建立在對(duì)總變差分解的基礎(chǔ)上XY總變差的分解總變差的分解 分析分析Y Y 的觀測(cè)值、估計(jì)值與平均值的關(guān)系的觀測(cè)值、估計(jì)值與平均值的關(guān)系將上式兩邊

44、平方加總,可證得將上式兩邊平方加總,可證得 (TSSTSS) (ESSESS) (RSSRSS) )()(iiiiYYYYYY222)()()(iiiiYYYYYY 總變差總變差 (TSSTSS):因變量):因變量Y Y的觀測(cè)值與其平均值的觀測(cè)值與其平均值的離差平方和(總平方和)的離差平方和(總平方和) 解釋了的變差解釋了的變差 (ESSESS):因變量):因變量Y Y的估計(jì)值與其的估計(jì)值與其平均值的離差平方和(回歸平方和)平均值的離差平方和(回歸平方和) 剩余平方和剩余平方和 (RSSRSS):因變量觀測(cè)值與估計(jì)值之):因變量觀測(cè)值與估計(jì)值之差的平方和(未解釋的平方和)差的平方和(未解釋的平

45、方和)2iy2iy2ieiY 總變差i(Y -Y)i(Y -Y )來自回歸ie來自殘差iXY變差分解的圖示變差分解的圖示YX可決系數(shù)可決系數(shù) 以TSS同除總變差等式兩邊: 或 定義:定義:回歸平方和(解釋了的變差回歸平方和(解釋了的變差ESS) 在總變?cè)诳傋?差(差(TSS) 中所占的比重稱為可決系數(shù),用中所占的比重稱為可決系數(shù),用 表示表示: 或 222iyyrTSSRSSTSSESSTSSTSS2iy2r2iy2221iiyer22221iiiyeyy 簡(jiǎn)捷計(jì)算公式: YnYYnXYY22102r222)()(rYYYY或 222)()(1rYYYYR作用:作用:可決系數(shù)越大,說明在總變差

46、中由模型作出了可決系數(shù)越大,說明在總變差中由模型作出了解釋的部分占的比重越大,模型擬合優(yōu)度越好。反解釋的部分占的比重越大,模型擬合優(yōu)度越好。反之可決系數(shù)小,說明模型對(duì)樣本觀測(cè)值的擬合程度之可決系數(shù)小,說明模型對(duì)樣本觀測(cè)值的擬合程度越差。越差。特點(diǎn):特點(diǎn):可決系數(shù)取值范圍:可決系數(shù)取值范圍: 隨抽樣波動(dòng),樣本可決系數(shù)隨抽樣波動(dòng),樣本可決系數(shù) 是隨抽樣是隨抽樣 而變動(dòng)的隨機(jī)變量而變動(dòng)的隨機(jī)變量 可決系數(shù)是非負(fù)的統(tǒng)計(jì)可決系數(shù)是非負(fù)的統(tǒng)計(jì)可決系數(shù)的作用和特點(diǎn)可決系數(shù)的作用和特點(diǎn)102 r2r可決系數(shù)與相關(guān)系數(shù)的關(guān)系可決系數(shù)與相關(guān)系數(shù)的關(guān)系a聯(lián)系聯(lián)系 數(shù)值上,可決系數(shù)等于因變量與自變量之間簡(jiǎn)單相數(shù)值上,

47、可決系數(shù)等于因變量與自變量之間簡(jiǎn)單相關(guān)系數(shù)的平方關(guān)系數(shù)的平方:222222222222222()()()()iiiiiiiiiiiiiyxx yxRyyxyx yrxy可決系數(shù)與相關(guān)系數(shù)的關(guān)系可決系數(shù)與相關(guān)系數(shù)的關(guān)系b區(qū)別區(qū)別 在上例 中50501niiX38101niiY287750012niiX974. 1021697001niiiYXYnYYnXYYR221027506. 01222) 1 .38(101639500) 1 .38(1021697007506. 03810974. 1R1 .1451616395001 .1451682.162857694.75209 .162498366

48、.1621581997906. 02R2、 回歸系數(shù)檢驗(yàn)回歸系數(shù)檢驗(yàn) 回歸系數(shù)檢驗(yàn)主要是對(duì) 檢驗(yàn) 10:10H(1) 假設(shè)(2) 計(jì)算檢驗(yàn)統(tǒng)計(jì)量其中 是 的標(biāo)準(zhǔn)差,111St 2)(1XXSy2)(2nYYyn為樣本中數(shù)據(jù)的個(gè)數(shù)1給定顯著性水平 ,查 自由度為n-2的 t 分布表得臨界值(3)根據(jù)統(tǒng)計(jì)知識(shí)可知 服從自由度為n-2的 分布)2(2nt(4) 用樣本計(jì)算 t 的值 若: 則拒絕 ,認(rèn)為X,Y之間有線性關(guān)系 若: 則接受 ,認(rèn)為X,Y之間無線性關(guān)系)(2tt )(2tt 0H0H1tt)2(1ntt即0:1OH55.20)2(111St231. 255.201tt31. 22t現(xiàn)對(duì)上

49、例中的模型進(jìn)行t檢驗(yàn)(1) 假設(shè) (3) 給定顯著性水平=0.05,查自由度為8的 t 分布臨界值表,得(4) 因?yàn)閯t方程的 t 檢驗(yàn)通過,說明X與Y之間是線性關(guān)系的假設(shè)成立.基本思想基本思想在多元回歸中有多個(gè)解釋變量,需要說明所有解在多元回歸中有多個(gè)解釋變量,需要說明所有解釋變量聯(lián)合起來對(duì)應(yīng)變量影響的總顯著性或整個(gè)釋變量聯(lián)合起來對(duì)應(yīng)變量影響的總顯著性或整個(gè)方程總的聯(lián)合顯著性。對(duì)方程總顯著性檢驗(yàn)需要方程總的聯(lián)合顯著性。對(duì)方程總顯著性檢驗(yàn)需要在方差分析的基礎(chǔ)上進(jìn)行在方差分析的基礎(chǔ)上進(jìn)行F檢驗(yàn)。檢驗(yàn)。3、回歸方程的顯著性檢。、回歸方程的顯著性檢。 總變差 自由度 模型解釋了的變差 自由度 剩余變差

50、 自由度變差來源變差來源 平方和平方和 自由度自由度 方差方差歸于回歸模型歸于回歸模型歸于剩余歸于剩余總變差總變差方差分析表方差分析表22TSS( - )iiY Yy2ESS(- )iY Y2RSS( - )iiY Y2ESS( - )iY Y1n-2TSS( - )iY Y2RSS( - )iiY YTSS/ -1nE S S / -1kR SS/ n-k1n-檢驗(yàn)的步驟為: F0:iOH(1) 提出假設(shè) (2) 計(jì)算回歸方程的 檢驗(yàn)值 F(3) 確定檢驗(yàn)的臨界值 F1)() 1,(22knYYkYYknkFiii)( 服從自由度為 , 的 分布,對(duì)于給定的顯著性水平 ,可以通過 分布表查得

51、顯著性水平為 、自由度分別為 、 的臨界值 ) 1,( knkFkn 1FFkn 112knnF12knn 1) 若 ,則否定假設(shè),回歸方程總體線性關(guān)系的顯著性檢驗(yàn)通過, 將 值與臨界值 比較 ) 1,( knkFFF 2) 若 ,則接受假設(shè),回歸方程總體線性關(guān)系的顯著性檢驗(yàn)未通過, ) 1,( knkFF) 1,( knkF 對(duì)上例中的模型進(jìn)行檢驗(yàn) 1) 假設(shè) 2) 計(jì)算 3) 給定顯著性水平0.05,查 分布的臨界值表 4) 檢驗(yàn): 5.23= ,則模型的 檢驗(yàn)通過。0:1OH325.422) 2, 1 (nF21)() 2, 1 (22nYYYYnF)(325.4228988.34921

52、0246.184397)2, 1 (nFF32. 5FFF三、多元線性回歸分析三、多元線性回歸分析 (一)二元線性回歸分析(一)二元線性回歸分析 二元線性回歸分析的模型可以由下式表示: 22110XXY,是回歸值Y,210是參數(shù)稱為偏回歸系數(shù)是自變量21,XX二元線性回歸分析就是根據(jù) n 個(gè)已知的樣本觀察值),(21111XXY),(22122XXY),(21nnnXXY, 來計(jì)算出參數(shù)值,得到回歸模型 參數(shù)的計(jì)算主要是采用最小二乘法 )(或n3 , 2 , 1ieYii 22i 110iXX由最小二乘法,參數(shù)的計(jì)算是使SSE 最小2210)(),(YYSSE222110210)(),(XXY

53、SSE0)(0SSE0)(1SSE0)(2SSE0)(20)(20)(222211021221101221100XXXYSSEXXXYSSEXXYSSE22221120221221110122110XXXXYXXXXXYXXXnY221222121121222212221212221122110)()(XXXXXXYXXYXXXXXXXYXXYXXXY(二)(二) 多元線性回歸分析多元線性回歸分析 kkXXXY ,22110k元線性回歸模型為 kkiiiiniXXXY,), 2 , 1(),(1021,計(jì)算出,根據(jù)觀察值 1、 多元線性回歸模型多元線性回歸模型 模型中參數(shù)模型中參數(shù) 是偏回歸系

54、數(shù)。是偏回歸系數(shù)。偏回歸系數(shù)偏回歸系數(shù):控制其它自變量不變的條件下,:控制其它自變量不變的條件下,第第k個(gè)自變量的單位變動(dòng)對(duì)因變量平均值的個(gè)自變量的單位變動(dòng)對(duì)因變量平均值的影響。影響。k,10,)(n3 , 2 , 1ie,iii22i 110i kkXXX或或2、多元線性回歸模型的矩陣表示、多元線性回歸模型的矩陣表示 K K個(gè)解釋變量的多元線性回歸模型的個(gè)解釋變量的多元線性回歸模型的n n個(gè)觀測(cè)個(gè)觀測(cè)樣本,可表示為樣本,可表示為 1112211101e, kkXXX1222221102e, kkXXX1nn22n110e,n kkXXX 1n用矩陣表示用矩陣表示1nXYnyyy21knnnk

55、kxxxxxxxxxxxx2132313222121k211111.11k10neee21)(1kn11k )(e樣本回歸函數(shù)樣本回歸函數(shù)或或其中:其中:Y,e都是有都是有n個(gè)元素的列向量個(gè)元素的列向量是有是有k+1個(gè)元素的列向量個(gè)元素的列向量X是第一列為是第一列為1的的n*( k+1)階自)階自變量數(shù)據(jù)矩陣變量數(shù)據(jù)矩陣 (截距項(xiàng)可視為解截距項(xiàng)可視為解釋變量取值為釋變量取值為1)XeXi22110e, kkXXXY最小210)(),(YYSSEk nikikiiiXXXY1222110)(0)(0SSE0)(1SSE0)(kSSEk元線性回歸模型為 kkiiiiniXXXY,), 2 , 1(

56、),(1021,計(jì)算出,根據(jù)觀察值 由最小二乘法 , 3、 最小二乘法確定回歸模型最小二乘法確定回歸模型 0),(20),(20)(2122110112211011221100nikikikiiikniikikiiinikikiiiXXXXYSSEXXXXYSSEXXXYSSEnikikniikinikiniikinikiikniiniiniiinikikniiniiniiXXXXYXXXXXYXXXXnY1211110111121111011112211101 方程組式稱為正規(guī)方程組。 引入矩陣knnnkkxxxxxxxxxxxxX2132313222121k211111.11knnnkkk

57、knkkknnxxxxxxxxxxxxxxxxxxxxxxxxXXA213231322212121113212232221113121111111111nknknknknknnnnnnnnknnxxxxxxxxxxxxxxxxxxxxxn1i2i1iii21iii 11ii1iii21i2i21ii2i 11ii21iii 11ii2i 11i2i 11ii 11ii1ii21ii 1nyyyY21n210 則正規(guī)方程組式可以進(jìn)一步寫成矩陣形式BAnknnnnknkkknnyyyxyxyyyyyxxxxxxxxxxxxYX1iii1iii21iii 11ii321321223222111312

58、111111B-1 = (X X) X Y(三)多元線性回歸模型的檢驗(yàn)(三)多元線性回歸模型的檢驗(yàn) 1、判定系數(shù)檢驗(yàn)、判定系數(shù)檢驗(yàn) 222)()()(YYYYYYiiii2222)()()()(1YYYYYYYYiiiii222)()(YYYYRii222)()(1YYYYRiii222)()(1YYYYRiii1)(1)(1222nYYknYYRiii11)1 (122knnRR調(diào)整判定系數(shù)2、回歸系數(shù)顯著性檢驗(yàn)、回歸系數(shù)顯著性檢驗(yàn) ), 2 , 1(kj式中 是回歸系數(shù) 的標(biāo)準(zhǔn)差, jSjjjCSSj22), 2 , 1(kj122knCSjj1/knYXXYjjjbCSSj2jjStj是

59、矩陣是矩陣 中第中第j行第行第j列的元素列的元素1 -)( XXjjC給定顯著性水平 ,查自由度為n-k-1的 t 分布表得臨界值根據(jù)統(tǒng)計(jì)知識(shí)可知 服從自由度為n-k-1的 分布 )1(2 knt用樣本計(jì)算 t 的值 若: 認(rèn)為 之間有線性關(guān)系 若: 認(rèn)為 之間無線性關(guān)系)(2tt )(2tt jtt) 1(knttj即YXj與YXj與3、回歸方程的顯著性檢驗(yàn)、回歸方程的顯著性檢驗(yàn)假設(shè) 0:21kOH1)() 1,(22knYYkYYknkFiii)( 服從自由度為 , 的 分布,對(duì)于給定的顯著性水平 ,可以通過 分布表查得顯著性水平為 、自由度分別為 、 的臨界值 ) 1,( knkFkn

60、1FFkn 112knnF12knn 1) 若 ,則否定假設(shè),回歸方程總體線性關(guān)系的顯著性檢驗(yàn)通過, 將 值與臨界值 比較 ) 1,( knkFFF 2) 若 ,則接受假設(shè),回歸方程總體線性關(guān)系的顯著性檢驗(yàn)未通過, ) 1,( knkFF) 1,( knkF某市近幾年的工農(nóng)業(yè)總產(chǎn)值與社會(huì)商品的零售額資料如表某市近幾年的工農(nóng)業(yè)總產(chǎn)值與社會(huì)商品的零售額資料如表工農(nóng)業(yè)總產(chǎn)值與社會(huì)商品的零售額資料表年 份 1990 1991 1992 1993 1994 1995 1996 工業(yè)總產(chǎn)值 6.1 7.2 6.8 8.2 8.8 9.6 9.8 農(nóng)業(yè)總產(chǎn)值 5.9 6.2 6.4 6.3 6.8 7.2

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請(qǐng)下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請(qǐng)聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁(yè)內(nèi)容里面會(huì)有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫(kù)網(wǎng)僅提供信息存儲(chǔ)空間,僅對(duì)用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對(duì)用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對(duì)任何下載內(nèi)容負(fù)責(zé)。
  • 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請(qǐng)與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶因使用這些下載資源對(duì)自己和他人造成任何形式的傷害或損失。

最新文檔

評(píng)論

0/150

提交評(píng)論