版權(quán)說(shuō)明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請(qǐng)進(jìn)行舉報(bào)或認(rèn)領(lǐng)
文檔簡(jiǎn)介
1、第六章第六章 回歸與相關(guān)分析回歸與相關(guān)分析chapter 6 regression and chapter 6 regression and correlation analysiscorrelation analysis 本章重點(diǎn)和難點(diǎn)本章重點(diǎn)和難點(diǎn) l理解并掌握回歸與相關(guān)的區(qū)別與聯(lián)系;理解并掌握回歸與相關(guān)的區(qū)別與聯(lián)系;l一元線性回歸的基本原理、方法,線性回歸的一元線性回歸的基本原理、方法,線性回歸的顯著性檢驗(yàn)、區(qū)間估計(jì)和預(yù)測(cè);顯著性檢驗(yàn)、區(qū)間估計(jì)和預(yù)測(cè);l相關(guān)系數(shù)的定義、性質(zhì)和顯著性檢驗(yàn);相關(guān)系數(shù)的定義、性質(zhì)和顯著性檢驗(yàn);l常用曲線方程的線性化方法及回歸方程擬合情常用曲線方程的線性化方法及
2、回歸方程擬合情況的比較。況的比較。 本章內(nèi)容本章內(nèi)容 l 回歸與相關(guān)的概念回歸與相關(guān)的概念l 一元線性回歸分析一元線性回歸分析l 線性相關(guān)分析線性相關(guān)分析l 一元非線形回歸(可直線化的曲線回歸)一元非線形回歸(可直線化的曲線回歸)第一節(jié)第一節(jié) 回歸與相關(guān)的概念回歸與相關(guān)的概念l【本節(jié)內(nèi)容本節(jié)內(nèi)容】l回歸與相關(guān)的概念回歸與相關(guān)的概念l兩者的主要差別兩者的主要差別一、回歸與相關(guān)的概念一、回歸與相關(guān)的概念l1、回歸分析(、回歸分析(regression analysis)l概念概念:是研究一個(gè)隨機(jī)變量是研究一個(gè)隨機(jī)變量y y與另一些變與另一些變量(主要為固定變量)關(guān)系的一種統(tǒng)計(jì)量(主要為固定變量)關(guān)
3、系的一種統(tǒng)計(jì)方法。方法。l即:將一個(gè)變量即:將一個(gè)變量y y表述為另一些變量的函表述為另一些變量的函數(shù),并通過(guò)建立變量間的函數(shù)關(guān)系,達(dá)數(shù),并通過(guò)建立變量間的函數(shù)關(guān)系,達(dá)到根據(jù)一個(gè)或一些變量的取值去估計(jì)或到根據(jù)一個(gè)或一些變量的取值去估計(jì)或預(yù)測(cè)另一個(gè)變量的目的。預(yù)測(cè)另一個(gè)變量的目的。l自變量與因變量自變量與因變量l在某些問(wèn)題中,在某些問(wèn)題中,y y隨隨x x的變化而變化的變化而變化lx x帶有帶有“原因原因”的性質(zhì),稱為的性質(zhì),稱為“自變量自變量”ly y帶有帶有“結(jié)果結(jié)果”的性質(zhì),稱為的性質(zhì),稱為“因變量因變量”l有時(shí)有時(shí)x x和和y y之間并無(wú)明顯的因果關(guān)系之間并無(wú)明顯的因果關(guān)系l仍然沿用仍然
4、沿用上述名稱上述名稱l一元線性回歸一元線性回歸(linear regression)l如果自變量與因變量都是一個(gè),且如果自變量與因變量都是一個(gè),且y y和和x x大體上有線性關(guān)系,這種研究?jī)蓚€(gè)變量大體上有線性關(guān)系,這種研究?jī)蓚€(gè)變量線性關(guān)系的回歸稱為線性關(guān)系的回歸稱為一元線性回歸一元線性回歸。l多元回歸多元回歸l如果自變量如果自變量x x是多個(gè),如是多個(gè),如x x1 1,x x2 2, ,x xk k,而因變量是一個(gè),而因變量是一個(gè)y y,這種研究因變,這種研究因變量量y y與多個(gè)自變量與多個(gè)自變量x x之間的定量關(guān)系的問(wèn)之間的定量關(guān)系的問(wèn)題稱為題稱為多元回歸多元回歸。l回歸分析的研究目的回歸分
5、析的研究目的l變量之間存在怎樣的函數(shù)關(guān)系變量之間存在怎樣的函數(shù)關(guān)系l能否通過(guò)這種關(guān)系,由能否通過(guò)這種關(guān)系,由x x的變化定量地解釋或預(yù)的變化定量地解釋或預(yù)測(cè)測(cè)y y的變化的變化l回歸分析的變量類型回歸分析的變量類型l因變量因變量y y 隨機(jī)變量隨機(jī)變量l自變量自變量x x 固定變量(為主)或隨機(jī)變量固定變量(為主)或隨機(jī)變量l回歸分析中回歸分析中x和和y的關(guān)系的關(guān)系l地位不平等地位不平等l關(guān)心的是關(guān)心的是y y依依x x的變化規(guī)律的變化規(guī)律l2、相關(guān)分析(、相關(guān)分析(correlation analysis)l概念:概念:是研究隨機(jī)變量之間是研究隨機(jī)變量之間“相關(guān)關(guān)系相關(guān)關(guān)系”的一種統(tǒng)計(jì)方法。
6、用于研究?jī)蓚€(gè)或數(shù)個(gè)的一種統(tǒng)計(jì)方法。用于研究?jī)蓚€(gè)或數(shù)個(gè)變量共同變化的程度,主要通過(guò)計(jì)算相變量共同變化的程度,主要通過(guò)計(jì)算相關(guān)系數(shù)來(lái)判斷這種相關(guān)關(guān)系的強(qiáng)弱。關(guān)系數(shù)來(lái)判斷這種相關(guān)關(guān)系的強(qiáng)弱。l相關(guān)關(guān)系:相關(guān)關(guān)系:是一種非確定性的關(guān)系,即一種隨是一種非確定性的關(guān)系,即一種隨機(jī)關(guān)系。按其形成的原因,可分為機(jī)關(guān)系。按其形成的原因,可分為l直接相關(guān)直接相關(guān)(real correlation)l間接相關(guān)間接相關(guān)(nonsense correlation)l二元相關(guān)分析(簡(jiǎn)單相關(guān)分析)二元相關(guān)分析(簡(jiǎn)單相關(guān)分析)l研究?jī)蓚€(gè)變量間相關(guān)關(guān)系的方法。研究?jī)蓚€(gè)變量間相關(guān)關(guān)系的方法。l只介紹簡(jiǎn)單相關(guān)。只介紹簡(jiǎn)單相關(guān)。l相
7、關(guān)分析的研究目的相關(guān)分析的研究目的l變量之間是否存在某種隨機(jī)的共變關(guān)系變量之間是否存在某種隨機(jī)的共變關(guān)系l各變量一起變化的程度各變量一起變化的程度l相關(guān)分析不具備預(yù)測(cè)性相關(guān)分析不具備預(yù)測(cè)性l相關(guān)分析的變量類型與關(guān)系相關(guān)分析的變量類型與關(guān)系l所有變量都必須是隨機(jī)變量所有變量都必須是隨機(jī)變量l沒(méi)有自變量和因變量之分,沒(méi)有自變量和因變量之分,x和和y的地位一樣的地位一樣l分析側(cè)重于隨機(jī)變量之間的相關(guān)特征分析側(cè)重于隨機(jī)變量之間的相關(guān)特征二、二者的主要差別二、二者的主要差別l回歸分析與相關(guān)分析回歸分析與相關(guān)分析在計(jì)算上有很多在計(jì)算上有很多相似相似之處之處,如果在應(yīng)用時(shí)不注意所研究,如果在應(yīng)用時(shí)不注意所研
8、究變量的變量的類型類型以及兩種方法的以及兩種方法的內(nèi)在差別內(nèi)在差別,很容易出,很容易出現(xiàn)錯(cuò)誤。現(xiàn)錯(cuò)誤?;貧w分析與相關(guān)分析的主要差別回歸分析與相關(guān)分析的主要差別 統(tǒng)計(jì)方法統(tǒng)計(jì)方法相關(guān)分析相關(guān)分析回歸分析回歸分析研究對(duì)象研究對(duì)象若干變量一起若干變量一起變化的程度變化的程度一個(gè)變量與其它變量間的函一個(gè)變量與其它變量間的函數(shù)關(guān)系數(shù)關(guān)系變量關(guān)系變量關(guān)系變量間的共變變量間的共變關(guān)系關(guān)系一個(gè)因變量及一個(gè)或數(shù)個(gè)自一個(gè)因變量及一個(gè)或數(shù)個(gè)自變量,前者是后者的函數(shù)變量,前者是后者的函數(shù)變量類型變量類型均為隨機(jī)變量均為隨機(jī)變量因變量:為隨機(jī)變量因變量:為隨機(jī)變量自變量:為固定變量(為主)自變量:為固定變量(為主)或隨
9、機(jī)變量或隨機(jī)變量統(tǒng)計(jì)量統(tǒng)計(jì)量無(wú)量綱的相關(guān)無(wú)量綱的相關(guān)系數(shù)系數(shù)有單位的回歸系數(shù)有單位的回歸系數(shù)第二節(jié)第二節(jié) 一元線性回歸分析一元線性回歸分析l【本節(jié)內(nèi)容【本節(jié)內(nèi)容】l一元線性回歸的數(shù)學(xué)模型一元線性回歸的數(shù)學(xué)模型l一元線性回歸方程的建立一元線性回歸方程的建立l線性回歸的顯著性檢驗(yàn)線性回歸的顯著性檢驗(yàn)l線性回歸的區(qū)間估計(jì)和預(yù)測(cè)線性回歸的區(qū)間估計(jì)和預(yù)測(cè) 一、一元線性回歸的數(shù)學(xué)模型一、一元線性回歸的數(shù)學(xué)模型l一元線性回歸的常用數(shù)學(xué)模型為:一元線性回歸的常用數(shù)學(xué)模型為:l: 回歸截距(回歸截距(intercept)(又稱回歸常數(shù))(又稱回歸常數(shù))l: 回歸系數(shù)(回歸系數(shù)(coefficient of re
10、gression)iiixy二、一元線性回歸方程的建立二、一元線性回歸方程的建立 l(一)原理(一)原理最小二乘法最小二乘法l線性回歸方程的一般形式為:線性回歸方程的一般形式為: l殘差:殘差:l最小二乘法最小二乘法:使殘差平方和(剩余平方和):使殘差平方和(剩余平方和)最小的一種確定最小的一種確定a a 和和b b 的方法。的方法。bxayiiiyye使:使:l根據(jù)微積分學(xué)中的極值原理,必須使根據(jù)微積分學(xué)中的極值原理,必須使q 對(duì)對(duì)a 和和b的一階偏導(dǎo)數(shù)為的一階偏導(dǎo)數(shù)為0:2020iiiiiiiqyabxaqyabxxb 22iiiiiiqyyyabx最小值整理得到整理得到l一元線性回歸的正
11、規(guī)方程組:一元線性回歸的正規(guī)方程組: 2iiiiiiiiiiianbxyaxbxx yl(二)一元線性回歸的計(jì)算(二)一元線性回歸的計(jì)算 l(三)回歸直線的圖示(三)回歸直線的圖示l資料的散點(diǎn)圖資料的散點(diǎn)圖l回歸直線圖回歸直線圖 121()()()niiiniixxyyspbssxxxaybx(四)一元線性回歸方程建立的基本步驟(四)一元線性回歸方程建立的基本步驟(4 4步)步) l根據(jù)資料計(jì)算根據(jù)資料計(jì)算8個(gè)一級(jí)數(shù)據(jù)個(gè)一級(jí)數(shù)據(jù) lx , x2, , y , y2 , , xy , n l計(jì)算計(jì)算3個(gè)二級(jí)數(shù)據(jù):個(gè)二級(jí)數(shù)據(jù):ssx , ssy , sp l計(jì)算參數(shù)的估計(jì)值計(jì)算參數(shù)的估計(jì)值a和和b
12、,并寫出回歸方程,并寫出回歸方程 l作出資料的散點(diǎn)圖和回歸直線圖作出資料的散點(diǎn)圖和回歸直線圖 xyxaybxbsp ss yabxl為了研究特定條件下魚類對(duì)水中某農(nóng)藥的為了研究特定條件下魚類對(duì)水中某農(nóng)藥的富集能力,搜集了富集能力,搜集了10組有關(guān)數(shù)據(jù)如下組有關(guān)數(shù)據(jù)如下(g/l和和g/kg),試建立二者間的一元線),試建立二者間的一元線性回歸方程。性回歸方程。 i12345678910水中含水中含量量(x)4.65.14.84.45.94.75.15.24.95.1魚體含魚體含量量(y)17.418.617.918.319.918.419.1 19.9 18.7 18.9【例【例6.16.1】解
13、解:經(jīng)計(jì)算:經(jīng)計(jì)算所以,所以,b = sp / ssx = 1.5508,a = 10.987 x與與y的回歸方程為:的回歸方程為: 10.987 1.5508yx4.98 1.563 18.71 5.6692.382xyxssysssp,散點(diǎn)圖和回歸直線圖散點(diǎn)圖和回歸直線圖某某農(nóng)農(nóng)藥藥的的水水中中含含量量與與魚魚體體中中含含量量的的關(guān)關(guān)系系y = 10.987+1.5508xr2 = 0.65161516171819202134567x ( ug / l )y ( ug / kg )三、線性回歸的顯著性檢驗(yàn)三、線性回歸的顯著性檢驗(yàn) (一)線性回歸的變異來(lái)源(一)線性回歸的變異來(lái)源 l變異來(lái)源
14、變異來(lái)源 隨機(jī)變量隨機(jī)變量y的觀測(cè)值的觀測(cè)值y1, y2, , yn之間的變異是由兩個(gè)方面的原因引起的:之間的變異是由兩個(gè)方面的原因引起的:l自變量自變量 x 取值的不同;取值的不同;l其它因素(試驗(yàn)誤差)的影響。其它因素(試驗(yàn)誤差)的影響。l平方和的分解平方和的分解(ssyssessr) ly 的離均差平方和的離均差平方和ssy(總平方和總平方和sst):): l (dftn1)l離回歸平方和離回歸平方和sse(剩余平方和,殘差平方剩余平方和,殘差平方和和):): (dfen2) 2yiissyy2eiiissyy l回歸平方和回歸平方和ssr: (dfr1) ssssr r的意義:的意義:
15、根據(jù)等式根據(jù)等式ssyssysssse essssr r可知,如可知,如果果ssssr r的值較大,的值較大,sssse e的數(shù)值便比較小,說(shuō)明回歸的數(shù)值便比較小,說(shuō)明回歸的效果好;反之,如果的效果好;反之,如果ssssr r的值較小,的值較小,sssse e的數(shù)值的數(shù)值便比較大,說(shuō)明回歸的效果差。便比較大,說(shuō)明回歸的效果差。2riissyy(二)(二)f f 檢驗(yàn)檢驗(yàn)當(dāng)零假設(shè)當(dāng)零假設(shè)h0:0成立時(shí),成立時(shí),ssr與與sse相互相互獨(dú)立,且統(tǒng)計(jì)量獨(dú)立,且統(tǒng)計(jì)量當(dāng)當(dāng)f f時(shí),時(shí),h0 :0不成立,稱不成立,稱回歸方程回歸方程顯著顯著1(1,2)2ressffnssn具體檢驗(yàn)可在方差分析表上進(jìn)行:
16、具體檢驗(yàn)可在方差分析表上進(jìn)行:ssessyssr ssrbspb2ssxsp 2ssx 變異來(lái)源變異來(lái)源自由度自由度平方和平方和均方均方fx1ssrsr2sr2se2殘余殘余n2ssese2總和總和n1ssy【例【例6.2】 l根據(jù)例根據(jù)例6.16.1給出的魚類對(duì)水中農(nóng)藥的富集給出的魚類對(duì)水中農(nóng)藥的富集資料,試檢驗(yàn)其線性回歸方程的顯著性。資料,試檢驗(yàn)其線性回歸方程的顯著性。變異來(lái)源變異來(lái)源dfssmsff0.01回回 歸歸13.6943.69414.96*11.3離回歸離回歸81.9750.247總總 計(jì)計(jì)95.669(三)(三)t t 檢驗(yàn)檢驗(yàn)采用采用t檢驗(yàn)可以檢驗(yàn)回歸系數(shù)檢驗(yàn)可以檢驗(yàn)回歸系
17、數(shù)b的顯著性,進(jìn)而的顯著性,進(jìn)而對(duì)回歸方程的顯著性作出判斷。對(duì)回歸方程的顯著性作出判斷。1、統(tǒng)計(jì)假設(shè)、統(tǒng)計(jì)假設(shè) h0:0,ha:02、b的標(biāo)準(zhǔn)誤的標(biāo)準(zhǔn)誤3、檢驗(yàn)統(tǒng)計(jì)量、檢驗(yàn)統(tǒng)計(jì)量4、判斷:若、判斷:若t t(n2),則否定,則否定h0,接受,接受ha。 bexssss(2)bbtt ns 前述資料回歸關(guān)系的前述資料回歸關(guān)系的t檢驗(yàn)檢驗(yàn)(2)1.975 80.497eesssn0.4971.5360.401bexssss1.553.8650.401bbbbtss 0.010.01(102)(8)3.355tt0.01(8)tt所以,否定所以,否定h0,接受,接受ha,即,即b極顯著。極顯著。 四
18、、線性回歸的區(qū)間估計(jì)和預(yù)測(cè)四、線性回歸的區(qū)間估計(jì)和預(yù)測(cè) l(一)(一)和和的區(qū)間估計(jì)的區(qū)間估計(jì) l有時(shí)有時(shí)和和在專業(yè)上有特殊意義時(shí),要確在專業(yè)上有特殊意義時(shí),要確定其置信區(qū)間。定其置信區(qū)間。l1、的置信區(qū)間的置信區(qū)間la 的標(biāo)準(zhǔn)誤為:的標(biāo)準(zhǔn)誤為:l而而 l所以所以 的置信區(qū)間為:的置信區(qū)間為:21aexxssnss(2)aatt ns (,)aaat sat s l2、的置信區(qū)間的置信區(qū)間lb 的標(biāo)準(zhǔn)誤為:的標(biāo)準(zhǔn)誤為:l而而 l所以所以 的置信區(qū)間為:的置信區(qū)間為:bexssss(2)bbtt ns (,)bbbt sbt s l(二)對(duì)(二)對(duì)x的區(qū)間估計(jì)的區(qū)間估計(jì)l對(duì)對(duì)x的區(qū)間估計(jì),即是對(duì)
19、總體均的區(qū)間估計(jì),即是對(duì)總體均值(期望值)的區(qū)間估計(jì)。值(期望值)的區(qū)間估計(jì)。l當(dāng)當(dāng)xxi 時(shí),估計(jì)標(biāo)準(zhǔn)誤為:時(shí),估計(jì)標(biāo)準(zhǔn)誤為:21ieyxxxssnss lx的點(diǎn)估計(jì)為:的點(diǎn)估計(jì)為:l所以,所以,x 的置信度為(的置信度為(1)的置信)的置信區(qū)間為:區(qū)間為:iiyabx(2)iyytns l以魚體對(duì)水中農(nóng)藥富集的數(shù)據(jù)為例:以魚體對(duì)水中農(nóng)藥富集的數(shù)據(jù)為例:l在在x5.5處,處,y 的期望值的置信區(qū)間(的期望值的置信區(qū)間(95的置信度)為:的置信度)為:21(5.54.98)(10.99 1.55 5.5)2.306 0.247()101.53619.520.60(18.92,20.12)l(三
20、)對(duì)(三)對(duì)y yxx的預(yù)測(cè)的預(yù)測(cè)l當(dāng)當(dāng)xxi 時(shí),對(duì)時(shí),對(duì)yx的預(yù)測(cè),即對(duì)的預(yù)測(cè),即對(duì)子總體的某一觀察值子總體的某一觀察值 yixii進(jìn)行預(yù)進(jìn)行預(yù)測(cè),相當(dāng)于預(yù)測(cè)個(gè)體值的問(wèn)題。測(cè),相當(dāng)于預(yù)測(cè)個(gè)體值的問(wèn)題。 l預(yù)測(cè)標(biāo)準(zhǔn)誤為:預(yù)測(cè)標(biāo)準(zhǔn)誤為:l當(dāng)當(dāng)xxi 時(shí),時(shí),yi 的預(yù)測(cè)值的置信區(qū)間(置的預(yù)測(cè)值的置信區(qū)間(置信度為信度為1)為:)為:211iyexxxssnss(2)iyytns l以魚體對(duì)水中農(nóng)藥富集的數(shù)據(jù)為例以魚體對(duì)水中農(nóng)藥富集的數(shù)據(jù)為例l求求x5.5 時(shí)魚體內(nèi)農(nóng)藥含量時(shí)魚體內(nèi)農(nóng)藥含量y 的預(yù)測(cè)區(qū)間。的預(yù)測(cè)區(qū)間。l在在x5.5 處,魚體內(nèi)農(nóng)藥含量處,魚體內(nèi)農(nóng)藥含量y 的置信度為的置信度為95
21、的預(yù)測(cè)區(qū)間為:的預(yù)測(cè)區(qū)間為:21(5.5 4.98)(10.99 1.55 5.5) 2.306 0.247(1)101.53619.52 1.29(18.23,20.81)l從計(jì)算可知,當(dāng)從計(jì)算可知,當(dāng)x5.5 時(shí),時(shí),y 的區(qū)間估計(jì)的區(qū)間估計(jì)的區(qū)間范圍(的區(qū)間范圍(18.92,20.12)小于)小于y 的預(yù)測(cè)的預(yù)測(cè)區(qū)間范圍(區(qū)間范圍(18.23,20.81)。)。l因此,回歸分析的預(yù)測(cè)精度低于估計(jì)精度。因此,回歸分析的預(yù)測(cè)精度低于估計(jì)精度。 4.24.44.64.85.05.25.45.65.86.0 x17.017.518.018.519.019.520.020.5yy = 10.987
22、 + 1.5508 xr = 0.80722回歸方程的區(qū)間估計(jì)和預(yù)測(cè)區(qū)間回歸方程的區(qū)間估計(jì)和預(yù)測(cè)區(qū)間第三節(jié)第三節(jié) 線性相關(guān)分析線性相關(guān)分析l【講授內(nèi)容【講授內(nèi)容】l相關(guān)系數(shù)相關(guān)系數(shù)l相關(guān)系數(shù)的顯著性檢驗(yàn)相關(guān)系數(shù)的顯著性檢驗(yàn)l相關(guān)與回歸的關(guān)系相關(guān)與回歸的關(guān)系 一、相關(guān)系數(shù) 如果兩個(gè)變量間呈線性關(guān)系,又不需要如果兩個(gè)變量間呈線性關(guān)系,又不需要由由x 來(lái)估計(jì)來(lái)估計(jì) y,只需了解,只需了解 x 和和 y 相關(guān)的性質(zhì)相關(guān)的性質(zhì)以及相關(guān)的程度,便可以通過(guò)計(jì)算表示以及相關(guān)的程度,便可以通過(guò)計(jì)算表示x 和和y 之間相關(guān)性質(zhì)和相關(guān)程度的統(tǒng)計(jì)量之間相關(guān)性質(zhì)和相關(guān)程度的統(tǒng)計(jì)量相相關(guān)系數(shù)關(guān)系數(shù)進(jìn)行相關(guān)分析。進(jìn)行相關(guān)分
23、析。 (一)雙變量(正態(tài))總體(一)雙變量(正態(tài))總體如果如果:研究對(duì)象僅僅涉及兩個(gè)變量,而且這:研究對(duì)象僅僅涉及兩個(gè)變量,而且這兩個(gè)變量均服從正態(tài)分布(即服從二元正態(tài)兩個(gè)變量均服從正態(tài)分布(即服從二元正態(tài)分布分布bivariate normal distribution)則則:研究樣本所屬的總體稱為:研究樣本所屬的總體稱為雙變量(正態(tài))雙變量(正態(tài))總體總體。 (二)相關(guān)系數(shù)及其計(jì)算(二)相關(guān)系數(shù)及其計(jì)算 如果研究的兩個(gè)變量服從如果研究的兩個(gè)變量服從二元正態(tài)分布二元正態(tài)分布,則,則可以采用可以采用參數(shù)相關(guān)分析參數(shù)相關(guān)分析方法方法計(jì)算計(jì)算相關(guān)系相關(guān)系數(shù)數(shù)來(lái)研究變量間的線性相關(guān)關(guān)系。來(lái)研究變量間
24、的線性相關(guān)關(guān)系。1、雙變量總體的相關(guān)系數(shù)、雙變量總體的相關(guān)系數(shù) 設(shè):二元正態(tài)總體的兩個(gè)變量為設(shè):二元正態(tài)總體的兩個(gè)變量為x和和y,具有,具有n對(duì)對(duì)(x,y) 則:總體的相關(guān)系數(shù)為則:總體的相關(guān)系數(shù)為 221()()cov()()()11()()xyxyx x y yxyx x y ynss ssx xy ynn 相關(guān)性質(zhì)相關(guān)性質(zhì)l0,x 和和y 有有正相關(guān)關(guān)系(正相關(guān))正相關(guān)關(guān)系(正相關(guān)),兩個(gè)變,兩個(gè)變量表現(xiàn)出共同增加或共同減少的趨勢(shì);量表現(xiàn)出共同增加或共同減少的趨勢(shì); l0,x 和和y 有有負(fù)相關(guān)關(guān)系(負(fù)相關(guān))負(fù)相關(guān)關(guān)系(負(fù)相關(guān)),一個(gè)變,一個(gè)變量的增加伴隨著另一個(gè)變量的減?。涣康脑黾影殡S
25、著另一個(gè)變量的減??; l0,x 和和y 完全不相關(guān)完全不相關(guān)。l| |1l1,完全正相關(guān);,完全正相關(guān); 1,完全負(fù)相關(guān)。,完全負(fù)相關(guān)。2、樣本的相關(guān)系數(shù)、樣本的相關(guān)系數(shù)r(對(duì)應(yīng)對(duì)應(yīng))22()()()()xyxx yysprssssxxyyl 從二元正態(tài)總體抽樣,得到從二元正態(tài)總體抽樣,得到n 對(duì)觀察值(對(duì)觀察值(xi,yi)l則:樣本的相關(guān)系數(shù)則:樣本的相關(guān)系數(shù)r 可由下式定義可由下式定義 例例6.3l pearson和和lee研究了研究了1401個(gè)家庭兄妹身個(gè)家庭兄妹身高的問(wèn)題,我們從中抽取高的問(wèn)題,我們從中抽取11對(duì)數(shù)據(jù)紀(jì)錄如對(duì)數(shù)據(jù)紀(jì)錄如下,試求樣本的相關(guān)系數(shù)。下,試求樣本的相關(guān)系數(shù)。
26、編號(hào)編號(hào)1234567891011兄弟兄弟(x)7168666770717073726566姊妹姊妹(y)6964656365626564665962解:解:l1)先求出一些基本統(tǒng)計(jì)量)先求出一些基本統(tǒng)計(jì)量 lx759, , x252445 l (xx)274l y704, , y245122 l(yy)266l xy48615, (xx)(yy)39 69x 64y l2)計(jì)算)計(jì)算r 統(tǒng)計(jì)量統(tǒng)計(jì)量22()()()()390.55874 66xyspxxyyrssssxxyy二、相關(guān)系數(shù)的顯著性檢驗(yàn)二、相關(guān)系數(shù)的顯著性檢驗(yàn)l1 1、t t 檢驗(yàn)檢驗(yàn)l統(tǒng)計(jì)假設(shè)統(tǒng)計(jì)假設(shè) h0:0;ha:0l統(tǒng)計(jì)
27、量統(tǒng)計(jì)量lr 的標(biāo)準(zhǔn)誤:的標(biāo)準(zhǔn)誤:l當(dāng)當(dāng)h0:0成立時(shí),檢驗(yàn)統(tǒng)計(jì)量成立時(shí),檢驗(yàn)統(tǒng)計(jì)量212rrsn(2)rrtt ns l判斷:給定顯著性水平判斷:給定顯著性水平,將,將|t|與與t(n2)進(jìn)行比較,即可作出進(jìn)行比較,即可作出r 是否顯著的結(jié)論。是否顯著的結(jié)論。l2 2、利用、利用r r 和和r r 的相關(guān)系數(shù)表的相關(guān)系數(shù)表進(jìn)行檢驗(yàn)進(jìn)行檢驗(yàn)l將統(tǒng)計(jì)量將統(tǒng)計(jì)量t 變形,可得:變形,可得:l將將t(n2)代入上式,計(jì)算出)代入上式,計(jì)算出|r|的臨界值的臨界值r(n2),制作為,制作為“r和和r的相關(guān)系數(shù)表的相關(guān)系數(shù)表”。22trtnl將計(jì)算所得的將計(jì)算所得的|r|直接與臨界值直接與臨界值r(n2
28、)進(jìn)進(jìn)行比較,也可以作出行比較,也可以作出r是否顯著的結(jié)論。是否顯著的結(jié)論。l若:若: |r| r(n2)l則:則:r 值在值在水平上顯著水平上顯著【實(shí)例【實(shí)例】 l試檢驗(yàn)【例試檢驗(yàn)【例6.3】中相關(guān)系數(shù)】中相關(guān)系數(shù)r0.558的顯的顯著性。著性。l解:查表得解:查表得l由于由于 l所以,接受零假設(shè)所以,接受零假設(shè)h0:0,即樣本的,即樣本的相關(guān)系數(shù)相關(guān)系數(shù)r 不顯著。不顯著。0.05(9)0.602r0.050.5580.602(9)rr三、三、相關(guān)與回歸的關(guān)系相關(guān)與回歸的關(guān)系 l1 1、相關(guān)與回歸的關(guān)系、相關(guān)與回歸的關(guān)系l(1)從檢驗(yàn)結(jié)果,即數(shù)量上從檢驗(yàn)結(jié)果,即數(shù)量上,b 與與r 有著密切
29、的聯(lián)系,表現(xiàn)出一致性。對(duì)有著密切的聯(lián)系,表現(xiàn)出一致性。對(duì)b 與與r 的顯著性檢驗(yàn),其實(shí)質(zhì)是完全相同的顯著性檢驗(yàn),其實(shí)質(zhì)是完全相同的,的,b 顯著,則顯著,則r 必顯著;反之亦然。必顯著;反之亦然。l(2)從相關(guān)關(guān)系與回歸關(guān)系的區(qū)別來(lái)看從相關(guān)關(guān)系與回歸關(guān)系的區(qū)別來(lái)看l若若自變量為固定變量自變量為固定變量,則兩變量間可進(jìn),則兩變量間可進(jìn)行回歸分析,而相關(guān)系數(shù)沒(méi)有任何幾何行回歸分析,而相關(guān)系數(shù)沒(méi)有任何幾何意義,意義,r 僅可用來(lái)間接反映回歸方程的僅可用來(lái)間接反映回歸方程的顯著程度,即表示回歸曲線與觀測(cè)數(shù)據(jù)顯著程度,即表示回歸曲線與觀測(cè)數(shù)據(jù)的吻合程度。的吻合程度。 l如果如果兩個(gè)變量均為隨機(jī)變量?jī)蓚€(gè)變
30、量均為隨機(jī)變量,則相關(guān)系,則相關(guān)系數(shù)與回歸系數(shù)均存在,這時(shí)兩種關(guān)系的數(shù)與回歸系數(shù)均存在,這時(shí)兩種關(guān)系的顯著性才是真正一致的。顯著性才是真正一致的。|r|大時(shí),回歸大時(shí),回歸方程顯著,且變量間線性相關(guān)關(guān)系密切;方程顯著,且變量間線性相關(guān)關(guān)系密切;當(dāng)當(dāng)|r|小時(shí),則回歸方程不顯著,變量間小時(shí),則回歸方程不顯著,變量間線性相關(guān)關(guān)系松懈。線性相關(guān)關(guān)系松懈。l2 2、決定系數(shù)、決定系數(shù)l如果僅考慮回歸方程與觀測(cè)數(shù)據(jù)的接近如果僅考慮回歸方程與觀測(cè)數(shù)據(jù)的接近程度,即回歸方程對(duì)數(shù)據(jù)擬合的優(yōu)劣,程度,即回歸方程對(duì)數(shù)據(jù)擬合的優(yōu)劣,那么決定系數(shù)提供了一個(gè)很好的度量,那么決定系數(shù)提供了一個(gè)很好的度量,可以避免將相關(guān)與
31、回歸混淆??梢员苊鈱⑾嚓P(guān)與回歸混淆。l決定系數(shù)決定系數(shù) l兩變量均為隨機(jī)變量即存在相關(guān)關(guān)系時(shí),兩變量均為隨機(jī)變量即存在相關(guān)關(guān)系時(shí),r2 的大小也反映了變量間的相關(guān)程度的的大小也反映了變量間的相關(guān)程度的大小,但不能反映出相關(guān)性質(zhì)(正相關(guān)大小,但不能反映出相關(guān)性質(zhì)(正相關(guān)與負(fù)相關(guān))。與負(fù)相關(guān))。22rxyyyssspb sprssssssss第四節(jié)第四節(jié) 一元非線性回歸(一元非線性回歸(可可直線化的曲線回歸直線化的曲線回歸 )l【講授內(nèi)容【講授內(nèi)容】l非線形回歸及曲線類型的選擇非線形回歸及曲線類型的選擇l常用曲線方程的線性化方法常用曲線方程的線性化方法 l非線形回歸方程擬合情況的比較非線形回歸方程
32、擬合情況的比較一、非線形回歸及曲線類型的選擇一、非線形回歸及曲線類型的選擇 l1、非線性回歸非線性回歸(nonlinear regression)l在許多情況下,因變量與自變量之間的函在許多情況下,因變量與自變量之間的函數(shù)關(guān)系不能用簡(jiǎn)單的回歸直線來(lái)表述,采數(shù)關(guān)系不能用簡(jiǎn)單的回歸直線來(lái)表述,采用適當(dāng)?shù)那€方程往往更符合總體間的實(shí)用適當(dāng)?shù)那€方程往往更符合總體間的實(shí)際關(guān)系,這就是所謂的非線性回歸或曲線際關(guān)系,這就是所謂的非線性回歸或曲線回歸(回歸(curvilinear regression)。)。l一元非線性回歸一元非線性回歸:只有一個(gè)自變量的非線:只有一個(gè)自變量的非線性回歸。性回歸。l2 2、
33、曲線類型的選擇方法、曲線類型的選擇方法l選用正確、合適的曲線類型,是非線性選用正確、合適的曲線類型,是非線性回歸的回歸的關(guān)鍵關(guān)鍵。曲線類型的確定方式可以。曲線類型的確定方式可以是理論的,也可以是經(jīng)驗(yàn)的。是理論的,也可以是經(jīng)驗(yàn)的。l(1 1)理論法(經(jīng)驗(yàn)法)理論法(經(jīng)驗(yàn)法)l根據(jù)專業(yè)知識(shí)或前人的經(jīng)驗(yàn)選用合適的回根據(jù)專業(yè)知識(shí)或前人的經(jīng)驗(yàn)選用合適的回歸方程。歸方程。l根據(jù)已知理論確定曲線類型雖是最理想的根據(jù)已知理論確定曲線類型雖是最理想的選擇,但是,如果不考慮已知理論的應(yīng)用選擇,但是,如果不考慮已知理論的應(yīng)用對(duì)象和條件而盲目照搬,將會(huì)造成錯(cuò)誤的對(duì)象和條件而盲目照搬,將會(huì)造成錯(cuò)誤的結(jié)論。結(jié)論。l(2)
34、圖示法)圖示法 l描出(描出(xi ,yi)的散點(diǎn)圖,根據(jù)散點(diǎn)的變)的散點(diǎn)圖,根據(jù)散點(diǎn)的變化趨勢(shì)畫出趨勢(shì)線,并對(duì)照曲線圖譜來(lái)選化趨勢(shì)畫出趨勢(shì)線,并對(duì)照曲線圖譜來(lái)選用合適的曲線類型。用合適的曲線類型。 l(3 3)擬合比較法)擬合比較法l如果采用圖示法時(shí)遇到幾種曲線形式與試如果采用圖示法時(shí)遇到幾種曲線形式與試驗(yàn)數(shù)據(jù)較接近,則可同時(shí)選擇多個(gè)曲線方驗(yàn)數(shù)據(jù)較接近,則可同時(shí)選擇多個(gè)曲線方程,求出回歸系數(shù)后,再比較各個(gè)回歸方程,求出回歸系數(shù)后,再比較各個(gè)回歸方程的擬合情況,從中選出擬合情況較好的程的擬合情況,從中選出擬合情況較好的回歸方程作為所求的一元非線性回歸方程。回歸方程作為所求的一元非線性回歸方程。
35、 二、常用曲線方程的線性化方法二、常用曲線方程的線性化方法 l“線性化線性化”是建立非線性回歸方程的方法之一。是建立非線性回歸方程的方法之一。一元非線性回歸方程一元非線性回歸方程直線形式直線形式( (線性回歸方程線性回歸方程) )配合線性回歸方程配合線性回歸方程轉(zhuǎn)換為轉(zhuǎn)換為變量變換變量變換(一)(一)直接引入新變量直接引入新變量 l這一類非線性回歸方程這一類非線性回歸方程“線性化線性化”后,回后,回歸系數(shù)沒(méi)有變化,線性回歸方程的系數(shù)也歸系數(shù)沒(méi)有變化,線性回歸方程的系數(shù)也是非線性回歸方程的系數(shù)。是非線性回歸方程的系數(shù)。l1 1、拋物線、拋物線l令:令:l可化為:可化為:2 yabx2xx yab
36、x0b 0b yx0 l2 2、 型曲線型曲線l令:令:l可化為:可化為:1 yabx1yy yabx 0b0b xy0l3 3、雙曲線(、雙曲線(1 1)l l令:令:l可化為:可化為:byax1xx yabx00abxy00,0abxy0l3 3、雙曲線(、雙曲線(2 2)l l令:令:l可化為:可化為:1()bxayyxaxb或或11xxyy yabx0b xy00b xy0l(4 4)對(duì)數(shù)函數(shù)曲線)對(duì)數(shù)函數(shù)曲線l l令:令:l可化為:可化為:lgyabx lnyabx(或或)lgxx yabx0b0b x0y(二)(二)原方程經(jīng)過(guò)數(shù)學(xué)變換后再引入原方程經(jīng)過(guò)數(shù)學(xué)變換后再引入新變量新變量
37、l這類曲線方程需要這類曲線方程需要“改變形式改變形式”后才可以后才可以線性化為線性方程。但是線性化為線性方程。但是“線性化線性化”前后前后兩個(gè)方程的回歸系數(shù)有變化,由線性回歸兩個(gè)方程的回歸系數(shù)有變化,由線性回歸方程的系數(shù)易于求出非線性回歸方程的系方程的系數(shù)易于求出非線性回歸方程的系數(shù)。數(shù)。l1 1、指數(shù)函數(shù)曲線、指數(shù)函數(shù)曲線 l(1 1)bxyae0b 0b x0yl1 1、指數(shù)函數(shù)曲線、指數(shù)函數(shù)曲線 l(2 2)b xyae0b xy0a0b xy0al2 2、冪函數(shù)曲線、冪函數(shù)曲線 byax1b 1b 01baxy010b axy01l3 3、logisticlogistic生長(zhǎng)曲線生長(zhǎng)曲
38、線11a bxbxkkyeae 或或 kxy0三、非線形回歸方程擬合情況的比較三、非線形回歸方程擬合情況的比較 l1 1、非線性回歸的剩余平方和、非線性回歸的剩余平方和li1,2,n l其中其中 來(lái)自非線性方程來(lái)自非線性方程 2iiiqyyiyl2 2、非線性關(guān)系的相關(guān)指數(shù)、非線性關(guān)系的相關(guān)指數(shù)l非線性關(guān)系的非線性關(guān)系的相關(guān)指數(shù)相關(guān)指數(shù) 的大小與非線的大小與非線性回歸方程性回歸方程“線性化線性化”以后所得線性回歸以后所得線性回歸方程的方程的決定系數(shù)決定系數(shù)r2 的大小的大小并非總是一致的并非總是一致的。222()11()iiiyiiyyqrssyy2rlr r2 2 與與 的適用范圍的適用范圍l決定系數(shù)決定系數(shù)r2 適用于適用于線性回歸線性回歸的情況,反映的情況,反映線性回歸方程擬合情況的優(yōu)劣。線性回歸方程擬合情況的優(yōu)劣。l相關(guān)指數(shù)相關(guān)指數(shù) 適用于適用于非線性回歸非線性回歸的情況,的情況,反映了非線性回歸方程擬合的好壞。反映了非線性回歸方程擬合的好壞。
溫馨提示
- 1. 本站所有資源如無(wú)特殊說(shuō)明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請(qǐng)下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請(qǐng)聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
- 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁(yè)內(nèi)容里面會(huì)有圖紙預(yù)覽,若沒(méi)有圖紙預(yù)覽就沒(méi)有圖紙。
- 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
- 5. 人人文庫(kù)網(wǎng)僅提供信息存儲(chǔ)空間,僅對(duì)用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對(duì)用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對(duì)任何下載內(nèi)容負(fù)責(zé)。
- 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請(qǐng)與我們聯(lián)系,我們立即糾正。
- 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶因使用這些下載資源對(duì)自己和他人造成任何形式的傷害或損失。
最新文檔
- 2025版信用證抵押貸款業(yè)務(wù)合作協(xié)議范本3篇
- 2025版土方工程居間代理服務(wù)合同范本下載33篇
- 2025年度股權(quán)分割與繼承處理協(xié)議
- 2025年度房地產(chǎn)合作終止協(xié)議書
- 2025年度旅游文化股權(quán)合作協(xié)議書
- 二零二五年度木工機(jī)械操作人員勞務(wù)租賃合同4篇
- 2025年度牧業(yè)產(chǎn)品品牌推廣與營(yíng)銷合同4篇
- 二零二五年度火鍋餐飲品牌區(qū)域代理授權(quán)協(xié)議
- 二零二五年度餐飲店員工激勵(lì)機(jī)制與績(jī)效考核合同
- 二零二五版環(huán)保技術(shù)入股合作協(xié)議書3篇
- 房地產(chǎn)銷售任務(wù)及激勵(lì)制度
- 并購(gòu)指南(如何發(fā)現(xiàn)好公司)
- DL-T-1642-2016環(huán)形混凝土電桿用腳扣
- 銅礦成礦作用與地質(zhì)環(huán)境分析
- 30題紀(jì)檢監(jiān)察位崗位常見面試問(wèn)題含HR問(wèn)題考察點(diǎn)及參考回答
- 詢價(jià)函模板(非常詳盡)
- 《AI營(yíng)銷畫布:數(shù)字化營(yíng)銷的落地與實(shí)戰(zhàn)》
- 麻醉藥品、精神藥品、放射性藥品、醫(yī)療用毒性藥品及藥品類易制毒化學(xué)品等特殊管理藥品的使用與管理規(guī)章制度
- 乘務(wù)培訓(xùn)4有限時(shí)間水上迫降
- 2023年低年級(jí)寫話教學(xué)評(píng)語(yǔ)方法(五篇)
- DB22T 1655-2012結(jié)直腸外科術(shù)前腸道準(zhǔn)備技術(shù)要求
評(píng)論
0/150
提交評(píng)論