相關(guān)數(shù)列分析_第1頁
相關(guān)數(shù)列分析_第2頁
相關(guān)數(shù)列分析_第3頁
相關(guān)數(shù)列分析_第4頁
相關(guān)數(shù)列分析_第5頁
已閱讀5頁,還剩48頁未讀, 繼續(xù)免費閱讀

下載本文檔

版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進(jìn)行舉報或認(rèn)領(lǐng)

文檔簡介

第1頁,課件共53頁,創(chuàng)作于2023年2月13.1相關(guān)分析13.1.1相關(guān)關(guān)系的概念現(xiàn)象間的關(guān)系有兩種類型:1.函數(shù)關(guān)系。指現(xiàn)象之間存在著嚴(yán)格的依存關(guān)系,即變量之間依一定的函數(shù)形式形成的一一對應(yīng)的關(guān)系稱為函數(shù)關(guān)系。2.相關(guān)關(guān)系。又稱統(tǒng)計關(guān)系,是指兩個變量之間存在某種依存關(guān)系,但變量y并不是由變量x唯一確定的,它們之間沒有嚴(yán)格的一一對應(yīng)關(guān)系。2第2頁,課件共53頁,創(chuàng)作于2023年2月13.1.2相關(guān)關(guān)系的種類1.按相關(guān)關(guān)系涉及的因素多少,可分為單相關(guān)與復(fù)相關(guān)。2.按相關(guān)關(guān)系的表現(xiàn)形式,分為直線相關(guān)和曲線相關(guān)。3.按相關(guān)關(guān)系的變動方向,分為正相關(guān)和負(fù)相關(guān)。4.按相關(guān)關(guān)系是否涉及有關(guān)影響因素,分為因相關(guān)和自相關(guān)。3第3頁,課件共53頁,創(chuàng)作于2023年2月13.1.3簡單相關(guān)系數(shù)相關(guān)分析的內(nèi)容主要是研究現(xiàn)象之間有無關(guān)系,相關(guān)關(guān)系的表現(xiàn)形式和密切程度。相關(guān)分析的方法主要有相關(guān)圖表和相關(guān)系數(shù)等。當(dāng)變量y與變量x之間具有線性相關(guān)時,可用簡單相關(guān)系數(shù)測定它們之間的密切程度。計算公式為:4第4頁,課件共53頁,創(chuàng)作于2023年2月簡單相關(guān)系數(shù)r的取值范圍為

-1≤r≤1其中,為x與y變量的協(xié)方差,為x變量的標(biāo)準(zhǔn)差,為y變量的標(biāo)準(zhǔn)差,、分別表示變量y和x的n個數(shù)據(jù)的平均值。5第5頁,課件共53頁,創(chuàng)作于2023年2月當(dāng)r<1時,則x與y之間為負(fù)相關(guān),r>1時,則x與y之間為正相關(guān)。當(dāng)r=1時,則x與y是完全正相關(guān),r=-1時,則x與y是完全負(fù)相關(guān)。在這兩種情形下,兩個變量之間的關(guān)系是函數(shù)關(guān)系。當(dāng)r=0時,則x與y之間不存在線性相關(guān)關(guān)系,但有可能存在非線性相關(guān)關(guān)系。通常有下列判別標(biāo)準(zhǔn):

r<0.3,無相關(guān);

0.3≤r<0.5,低度相關(guān);

0.5≤r<0.8,中度相關(guān);

r≤0.8,高度相關(guān)。[例13.1]6第6頁,課件共53頁,創(chuàng)作于2023年2月需要指出的是,測定簡單相關(guān)系數(shù)時,x與y兩個變量是對等的關(guān)系,即所研究的兩個變量不分彼此,誰作x,誰作y都可以;兩個變量只能算出一個相關(guān)系數(shù),其值大小反映兩變量之間的密切程度;計算相關(guān)系數(shù)要求兩個變量必須都是隨機(jī)的。7第7頁,課件共53頁,創(chuàng)作于2023年2月13.1.4相關(guān)指數(shù)簡單相關(guān)系數(shù)只適用于兩個變量間的直線相關(guān)的測定。而不適用于曲線相關(guān)和復(fù)相關(guān)的測定。若要測定曲線相關(guān)或復(fù)相關(guān)的緊密程度,則需要先進(jìn)行回歸分析,求出回歸方程后,再由自變量x求出因變量y的估值,用下列公式計算相關(guān)指數(shù)(R):(―1≤R≤1)8第8頁,課件共53頁,創(chuàng)作于2023年2月相關(guān)指數(shù)是一種廣義的相關(guān)系數(shù),線性相關(guān)與曲線相關(guān),單相關(guān)與復(fù)相關(guān)均可應(yīng)用。對于簡單線性相關(guān)而言,相關(guān)指數(shù)與相關(guān)系數(shù)是一致的。但是對于曲線相關(guān)與復(fù)相關(guān)而言,相關(guān)指數(shù)與簡單相關(guān)系數(shù)在含義上是不同的。9第9頁,課件共53頁,創(chuàng)作于2023年2月13.1.5時間數(shù)列自相關(guān)時間數(shù)列自相關(guān)是指某個變量(y)自身隨時間不同,其數(shù)值在前后時期之間表現(xiàn)出一定的依存關(guān)系?;蛘哒f,任一具體時期的數(shù)值都和它前一期或前幾期的數(shù)值之間存在一定的聯(lián)系。研究時間數(shù)列本身的相關(guān)關(guān)系,對于分析社會經(jīng)濟(jì)現(xiàn)象發(fā)展變化的規(guī)律性和進(jìn)行預(yù)測,具有重要的意義。時間數(shù)列自相關(guān)也有正相關(guān)與負(fù)相關(guān),直線相關(guān)與曲線相關(guān),簡單相關(guān)與復(fù)相關(guān)等不同的形態(tài)。下面著重介紹簡單的直線自相關(guān),即本期與前期或某一期數(shù)值相關(guān)。10第10頁,課件共53頁,創(chuàng)作于2023年2月設(shè)為y數(shù)列t期的數(shù)值,為y數(shù)列t-i期的數(shù)值,I可以為1,亦可為2,3,4……等等,但必須固定遞推期。則自相關(guān)系數(shù)計算公式為:[例13.2]11第11頁,課件共53頁,創(chuàng)作于2023年2月13.2一元線性回歸13.2.1一元線性回歸模型如果兩個變量之間存在相關(guān)關(guān)系,并且一個變量(自變量)的變化會引起另一個變量(因變量)按某一線性關(guān)系變化,則兩個變量間的關(guān)系可用一元線性回歸模型描述:

y=a+bx+e式中:a、b為回歸系數(shù),a為回歸直線的截距,b為回歸直線的斜率,e是誤差項。一元線性回歸模型具有以下特點:12第12頁,課件共53頁,創(chuàng)作于2023年2月1.兩個變量y、x之間必須存在著真實的線性相關(guān)關(guān)系;2.兩個變量y、x之間不是對等的關(guān)系,一個是因變量,一個是自變量。3.因變量y是隨機(jī)變量,自變量x是非隨機(jī)變量,是給定的數(shù)值。4.回歸系數(shù)b有正負(fù)之分,b為正值,則x與y之間正相關(guān);b為負(fù)值,x與y之間負(fù)相關(guān)。13第13頁,課件共53頁,創(chuàng)作于2023年2月13.2.2一元線性回歸模型的參數(shù)估計一元線回歸模型的a、b參數(shù),通常采用最小二乘法估計。其要求是誤差項e的平方和最小,即:按照這一要求,要導(dǎo)出下列求解a、b參數(shù)的標(biāo)準(zhǔn)方程組:14第14頁,課件共53頁,創(chuàng)作于2023年2月求解可得:如果先做相關(guān)分析,后做回歸分析,則a、b參數(shù):[例13.4]15第15頁,課件共53頁,創(chuàng)作于2023年2月13.2.3回歸模型的評價與檢驗1.?dāng)M合程度的測定。因變量y的各個觀測值點聚集在回歸直線周圍的緊密程度,稱為回歸直線對樣本數(shù)據(jù)點的擬合程度。通常用可決系數(shù)來表示。計算公式為:16第16頁,課件共53頁,創(chuàng)作于2023年2月稱為回歸平方和;為離差平方和;其中:為剩余平方和(殘差平方和)三者的關(guān)系可表示為:17第17頁,課件共53頁,創(chuàng)作于2023年2月可決系數(shù)的取值區(qū)間為[0,1]。實際上,可決系數(shù)

是線性相關(guān)系數(shù)r的平方,因此,相關(guān)系數(shù)又可用下列公式求得:

r的正負(fù)號與回歸系數(shù)b的正負(fù)號相同,越接近于1,表明回歸直線對樣本數(shù)據(jù)點的擬合程度越高??蓻Q系數(shù)

的實用計算式為:18第18頁,課件共53頁,創(chuàng)作于2023年2月19第19頁,課件共53頁,創(chuàng)作于2023年2月2.估計標(biāo)準(zhǔn)誤差。又稱剩余標(biāo)準(zhǔn)差,它是評價回歸直線代表性大小或?qū)嶋H值與估計值誤差大小的綜合性指標(biāo)。計算公式為:由估計標(biāo)準(zhǔn)誤差sy和因變量y的平均值,可計算相對標(biāo)準(zhǔn)誤差:20第20頁,課件共53頁,創(chuàng)作于2023年2月3.回歸系數(shù)b的顯著性檢驗?;貧w系數(shù)b是一個估計值,若y與x之間不存在線性關(guān)系,則回歸系數(shù)b不具有顯著性,所建立的回歸方程是不能利用的?;貧w系數(shù)b的顯著性檢驗采用t檢驗。其統(tǒng)計量為:21第21頁,課件共53頁,創(chuàng)作于2023年2月根據(jù)給定的顯著水平α(通常α

=0.05)和自由度,n-2,查t分布表得到臨界值,若>

,則回歸系數(shù)b具有顯著性,若<,則回歸為系數(shù)b不具有顯著性,即b與0的差異是不顯著的。4.回歸方程的顯著性檢驗?;貧w方程顯著性檢驗是檢驗整個回歸方程是否具有顯著性,判斷y與x之間是否存在真實的線性相關(guān),亦即對相關(guān)系數(shù)r進(jìn)行檢驗?;貧w方程的顯著性檢驗采用F檢驗。首先計算回歸方程的F統(tǒng)計量,計算公式為:22第22頁,課件共53頁,創(chuàng)作于2023年2月然后,根據(jù)給定的顯著水平α(通常α=0.01或0.05)及自由度(1,n—2)查F分布表得到臨界值F。若F>Fα,則回歸方程的回歸效果是顯著的;F<

,則回歸方程的回歸效果是不顯著的。23第23頁,課件共53頁,創(chuàng)作于2023年2月需要說明的是,對于一元線性回歸方程而言,t檢驗和F檢驗只要作任意一個檢驗即可。因為只有一個自變量,回歸系數(shù)b具有顯著性,則相關(guān)系數(shù)r必定具有顯著性。但是,在多元回歸分析中,二者之間并不是等價的。24第24頁,課件共53頁,創(chuàng)作于2023年2月13.2.4一元線性回歸模型的應(yīng)用一元線性回歸模型通過各種檢驗評價之后,則可利用回歸模型進(jìn)行有關(guān)問題的分析、預(yù)測和控制。其應(yīng)用有以下幾個方面:1.邊際分析和彈性分析。一元線性回歸模型中的回歸系數(shù)b就是平均邊際變化率,它能說明x增加一個單位y能增加多少個單位。而要說明x增減1%,y能增減百分之幾,則可用下列公式測定平均彈性系數(shù)(E)。25第25頁,課件共53頁,創(chuàng)作于2023年2月2.臨界點或平衡點分析。當(dāng)一元線性回歸模型中的x、y是一種收支關(guān)系時,并且是根據(jù)橫截面樣本數(shù)據(jù)建立的回歸模型,則可用來測定收支相等的臨界點。即:y=a+bx

令x=y,則3.利用回歸模型進(jìn)行預(yù)測。將自變量的預(yù)測值代人回歸模型可求得因變量的預(yù)測值。作為與相對應(yīng)的的預(yù)測值就是點預(yù)測。亦可用利余標(biāo)準(zhǔn)差和一定的置信概率進(jìn)行區(qū)間預(yù)測。26第26頁,課件共53頁,創(chuàng)作于2023年2月當(dāng)y為正態(tài)分布,n較大,自變量x的預(yù)測值離樣本均值不遠(yuǎn)時,可用構(gòu)建預(yù)測區(qū)間。(概率為95%,z為1.96,概率為95.45%,z為2)。當(dāng)n較小(n<30)時,并且不遠(yuǎn)離時,需用t分布構(gòu)建預(yù)測區(qū)間。即。(概率為95%,t為2;概率為99%,t為3)。4.利用回歸模型進(jìn)行控制。所謂控制,是指預(yù)測的反問題,就是說,如果我們要求y在確定范圍內(nèi)取值,那么應(yīng)該把自變量x控制在什么數(shù)值上或取值范圍內(nèi)。27第27頁,課件共53頁,創(chuàng)作于2023年2月13.3多元線性回歸

13.3.1多元線性回歸模型設(shè)y為因變量,

為自變量,并且自變量與因變量之間為線性關(guān)系時,則多元線性回歸模型為:其中,

為常數(shù)項,

為回歸系數(shù),又稱偏回歸系數(shù)。28第28頁,課件共53頁,創(chuàng)作于2023年2月如果兩個自變量

同一個因變量y呈線性相關(guān)時,可用二元線性回歸模型描述:建立多元線性回歸模型時,為了保證回歸模型具有優(yōu)良的解釋能力和預(yù)測效果,應(yīng)首先注意自變量的選擇,其準(zhǔn)則是:(1)自變量對因變量必須有顯著的影響,并呈密切的線性相關(guān);29第29頁,課件共53頁,創(chuàng)作于2023年2月(2)自變量與因變量之間的線性相關(guān)必須是真實的,而不是形式上的;(3)自變量之間應(yīng)具有一定的互斥性,即自變量之間的相關(guān)程度不應(yīng)高于自變量與因變量之間的相關(guān)程度。(4)自變量應(yīng)具有完整的統(tǒng)計數(shù)據(jù),其預(yù)測值容易確定。30第30頁,課件共53頁,創(chuàng)作于2023年2月13.3.2多元線性回歸模型的參數(shù)估計用最小二乘法求解參數(shù)。以二元線性回歸模型為例,求解回歸參數(shù)的標(biāo)準(zhǔn)方程組為:解此方程組可求得

的數(shù)值。亦可用下列矩陣法求解:31第31頁,課件共53頁,創(chuàng)作于2023年2月亦即:32第32頁,課件共53頁,創(chuàng)作于2023年2月13.3.3多元線性回歸模型的檢驗與評價1.?dāng)M合程度的測定。多重可決系數(shù)

,它是在因變量的總變化中,由回歸方程解釋的變動(回歸平方和)所占的比重,越大,回歸方程對樣本數(shù)據(jù)點擬合的程度越強,所有自變量與因變量的關(guān)系越密切。計算公式為:33第33頁,課件共53頁,創(chuàng)作于2023年2月其中:2.估計標(biāo)準(zhǔn)誤差。即因變量y的實際值與回歸方程求出的估計值之間的平均誤差,估計標(biāo)準(zhǔn)誤差越小,回歸方程擬合程度越強。34第34頁,課件共53頁,創(chuàng)作于2023年2月其中k為多元線性回歸方程中自變量的個數(shù)。3.回歸方程的顯著性檢驗。即檢驗整個回歸方程的顯著性,或者說評價所有自變量與因變量的線性關(guān)系是否密切。通常采用F檢驗,F(xiàn)統(tǒng)計量的計算公式為:35第35頁,課件共53頁,創(chuàng)作于2023年2月根據(jù)給定的顯著水平α,自由度(k,n-k-1)查F分布表,得到相應(yīng)的臨界值Fα,若F>Fα,則回歸方程具有顯著意義,回歸效果顯著;F<

Fα,則回歸方程無顯著意義,回歸效果不顯著。4.回歸系數(shù)的顯著性檢驗。檢驗回歸模型中各個回歸系數(shù)是否具有顯著性,以便使模型中只保留那些對因變量有顯著影響的因素。檢驗時先計算統(tǒng)計量ti,然后根據(jù)給定的顯著水平α,自由度n-k-1查t分布表,得臨界值tα或tα/2,t>tα或tα/2,則回歸系數(shù)bi與0有顯著差異,反之,則與0無顯著差異。統(tǒng)計量t的計算公式為:36第36頁,課件共53頁,創(chuàng)作于2023年2月其中Cij是多元線性回歸方程中求解回歸系數(shù)矩陣的逆短陣的主對角線上的第j個元素。對二元線性回歸而言,可用下列公式計算:37第37頁,課件共53頁,創(chuàng)作于2023年2月其中:38第38頁,課件共53頁,創(chuàng)作于2023年2月5.多重共線性判別。多重共線性是指在多元線性回歸方程中,自變量之間有較強的線性關(guān)系,這種關(guān)系若超過了因變量與自變量的線性關(guān)系,則回歸模型的穩(wěn)定性受到破壞,回歸系數(shù)估計不準(zhǔn)確。需要指出的是,在多元回歸模型中,多重共線性是難以避免的,只要多重共線性不太嚴(yán)重就行了。判別多元線性回歸方程是否存在嚴(yán)重的多重共線性,可分別計算每兩個自變量之間的可決系數(shù),若>或接近于

,則應(yīng)設(shè)法降低多重共線性的影響。其辦法主要是轉(zhuǎn)換自變量的取值,如變絕對數(shù)為相對數(shù)或平均數(shù),或者更換其他的自變量。39第39頁,課件共53頁,創(chuàng)作于2023年2月5.D.W檢驗,當(dāng)回歸模型是根據(jù)動態(tài)數(shù)據(jù)建立的,則誤差項e也是一個時間序列,若誤差序列諸項之間相互獨立,則誤差序列各項之間沒有相關(guān)關(guān)系,若誤差序列之間存在密切的相關(guān)關(guān)系,則建立的回歸模型就不能表述白變量與因變量之間的真實變動關(guān)系。D.w檢驗就是誤差序列的自相關(guān)檢驗。首先計算誤差序列統(tǒng)計量d(D.w值):(0≤d≤4)40第40頁,課件共53頁,創(chuàng)作于2023年2月然后根據(jù)給定的顯著水平α,自變量個數(shù)k和樣本數(shù)據(jù)個數(shù)n,查D.W分布表,得到下限值dL和上限值du,用下列原則作出判別:(1)du<d<4-du

無自相關(guān);(2)0<d<dL

存在正自相關(guān);(3)4-dL<d≤4

存在負(fù)相關(guān);(4)dL≤d≤du

難以判定;(5)4-du

≤d≤4-dL

,難以判定。41第41頁,課件共53頁,創(chuàng)作于2023年2月13.3.4多元線性回歸模型的應(yīng)用1.因素分析。因素分析是多元線性回歸模型的—個重要應(yīng)用,利用多元線性回歸模型可以進(jìn)行多因素分析。一是利用回歸系數(shù)揭示變量間的結(jié)構(gòu)關(guān)系,并能揭示主次因素;二是利用彈性系數(shù)揭示各個自變量的變動對因變量的影響程度,利用多元線性回歸模型測定彈性系數(shù)

的計算公式為:(i=1,2,……,k)42第42頁,課件共53頁,創(chuàng)作于2023年2月2.預(yù)測。利用多元線性回歸模型進(jìn)行預(yù)測,首先應(yīng)確定各個自變量的預(yù)測值,然后代入回歸模型中求因變量的點預(yù)測值或預(yù)測區(qū)間,其預(yù)測區(qū)間的建立與與一元線性回歸模型相同。3.控制。通過給定被解釋變量(因變量)的目標(biāo)值來控制解釋變量(自變量)的取值.

[例13.5]43第43頁,課件共53頁,創(chuàng)作于2023年2月13.4非線性回歸13.4.1非線性回歸模型

在實際問題研究中,變量之間的關(guān)系不一定都是線性關(guān)系,而是表現(xiàn)為某種曲線關(guān)系。1.指數(shù)曲線:

。兩邊取對數(shù)得:44第44頁,課件共53頁,創(chuàng)作于2023年2月2.對數(shù)曲線:3.雙曲線:4.冪函數(shù):

兩邊取對數(shù)得:45第45頁,課件共53頁,創(chuàng)作于2023年2月5.高次方程:可轉(zhuǎn)化為多元線性回歸形式:

6.柯柏——道格拉斯函數(shù):,兩邊取對數(shù)得:7.S曲線:,46第46頁,課

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負(fù)責(zé)。
  • 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時也不承擔(dān)用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

最新文檔

評論

0/150

提交評論