相關(guān)與回歸分析_第1頁
相關(guān)與回歸分析_第2頁
相關(guān)與回歸分析_第3頁
相關(guān)與回歸分析_第4頁
相關(guān)與回歸分析_第5頁
已閱讀5頁,還剩67頁未讀 繼續(xù)免費閱讀

下載本文檔

版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進(jìn)行舉報或認(rèn)領(lǐng)

文檔簡介

第七章

相關(guān)與回歸分析教學(xué)要求1、理解相關(guān)關(guān)系的概念及種類;2、熟練掌握相關(guān)系數(shù)的計算方法;3、熟練掌握一元線性回歸分析方法。發(fā)生車禍的次數(shù)與司機的年齡有關(guān)嗎?一年的葡萄酒消耗量(平均每人喝葡萄酒攝取酒精的升數(shù))以及一年中因心臟病死亡的人數(shù)(每十萬人死亡人數(shù))之間有關(guān)系嗎?身高與足跡長度有關(guān)嗎?

第一節(jié)相關(guān)分析一、相關(guān)關(guān)系的概念現(xiàn)象之間的關(guān)系一般可以區(qū)分為兩種不同的類型:——函數(shù)關(guān)系:客觀現(xiàn)象之間確實存在的、而且數(shù)量表現(xiàn)上是嚴(yán)格的確定性的依存關(guān)系?!嚓P(guān)關(guān)系:客觀現(xiàn)象之間確實存在的、但在數(shù)量表現(xiàn)上不嚴(yán)格對應(yīng)的依存關(guān)系。

函數(shù)關(guān)系是一一對應(yīng)的確定關(guān)系;設(shè)有兩個變量x和y,當(dāng)變量x取某個數(shù)值時,y有確定的值與之對應(yīng),則稱y是x的函數(shù)y=f(x);[在函數(shù)關(guān)系中,一般把作為影響因素的變量稱為自變量(x);把發(fā)生對應(yīng)變化(結(jié)果)的變量稱為因變量(y)。]所有觀察點全都落在一條線上(直線或曲線)。

XY函數(shù)關(guān)系(例)圓的面積(S)與半徑(R)之間的函數(shù)關(guān)系

S=R2

里程(D)與速度(V)、時間(t)之間的關(guān)系D=Vt企業(yè)的原材料消耗額(y)與產(chǎn)量(x1)

、單位產(chǎn)量消耗(x2)

、原材料價格(x3)之間的關(guān)系

y=x1x2x3

相關(guān)關(guān)系變量間關(guān)系不能用函數(shù)關(guān)系精確表達(dá);一個變量的取值不能唯一地由另一個變量來確定。即當(dāng)變量x取某個值時,與之相關(guān)的變量y的取值可能有若干個;各觀察點分布在直線(或曲線)周圍。XY理解相關(guān)關(guān)系把握兩個要點1.相關(guān)關(guān)系是指現(xiàn)象之間確實存在數(shù)量上的相互依賴關(guān)系。

兩個現(xiàn)象之間,一個現(xiàn)象發(fā)生數(shù)量變化,另一個現(xiàn)象也會相應(yīng)地發(fā)生數(shù)量上的變化。如人的身高與體重。2.現(xiàn)象之間數(shù)量依存關(guān)系的具體關(guān)系值不是固定的。

對于某項標(biāo)志的每一數(shù)值,可以有另外標(biāo)志的若干個數(shù)值與之相適應(yīng),在這些數(shù)值之間表現(xiàn)出一定的波動性,但又總是圍繞著它們的平均數(shù)并遵循一定的規(guī)律而變化。相關(guān)關(guān)系(例)父親身高(y)與子女身高(x)之間的關(guān)系社會商品零售額(y)與居民可支配收入(x)之間的關(guān)系收入(y)與文化程度(x)之間的關(guān)系商品銷售量(y)與廣告費支出(x1)、價格(x2)之間的關(guān)系函數(shù)關(guān)系與相關(guān)關(guān)系的聯(lián)系函數(shù)關(guān)系往往通過相關(guān)關(guān)系表現(xiàn)出來。由于存在測量誤差和其他隨機因素的干擾,可以說現(xiàn)實中沒有純粹的函數(shù)關(guān)系。相關(guān)關(guān)系要通過函數(shù)關(guān)系進(jìn)行研究。相關(guān)變量之間的數(shù)量變動雖然表現(xiàn)出一定的波動性,但是這種波動總是按照一定的分布規(guī)律圍繞其理論均值而波動的,因此可以通過尋找這種數(shù)量變化規(guī)律,使相關(guān)關(guān)系轉(zhuǎn)化為函數(shù)關(guān)系進(jìn)行研究。(其它有關(guān)概念)因果關(guān)系原因與結(jié)果之間、影響因素與被影響因素之間的關(guān)系。相關(guān)關(guān)系比因果關(guān)系包括的范圍更廣泛。即,因果關(guān)系屬于相關(guān)關(guān)系,但相關(guān)關(guān)系不一定是因果關(guān)系。如:商品銷售量(y)與廣告費支出(x1)、價格(x2)之間的關(guān)系。社會商品零售額(y)與居民可支配收入(x)之間的關(guān)系?;橐蚬那闆r收入水平和股票持有額是正相關(guān),但是是由于收入增加使股票持有增加?還是持有股票的盈利使收入增加?收入水平和物價水平之間的關(guān)系。統(tǒng)計只能說明現(xiàn)象間有無數(shù)量上的關(guān)系,不能說明誰因誰果。因與果的確定——定性分析(根據(jù)經(jīng)濟理論或經(jīng)濟常識以及相關(guān)學(xué)科的知識分析判斷是否存在這樣的關(guān)系)

注意假相關(guān)(偽相關(guān))現(xiàn)象之間沒有本質(zhì)聯(lián)系,只是表面數(shù)字的偶然巧合或受到其他潛在變量的影響而表現(xiàn)出不真實的相關(guān)性。如上證股票價格綜合指數(shù)與氣溫的關(guān)系;

有人測算出教師工資增長與酒價上升是正相關(guān);有人測算出小孩腳的大小與識字多少是正相關(guān);還有人做過測算,發(fā)現(xiàn)在美國經(jīng)濟學(xué)學(xué)位越高的人,收入越低,相關(guān)系數(shù)為負(fù)(要注意不正確的計算方法也會模糊對事物本質(zhì)的認(rèn)識)。

即時思考:有數(shù)據(jù)顯示世界各國平均每人擁有電視機數(shù)x及居民預(yù)期壽命y之間有很強的正相關(guān),可否認(rèn)為電視機很多的國家,居民預(yù)期壽命比較長?有人測試出火災(zāi)現(xiàn)場的消防員人數(shù)和該場火災(zāi)造成的損害之間有很強的正相關(guān),可否認(rèn)為派出的消防員越多造成的損害越大?

二、相關(guān)關(guān)系的種類1.按涉及變量多少分為:

單相關(guān)(一元相關(guān)):兩個變量之間的相關(guān)。

復(fù)相關(guān)(多元相關(guān)):當(dāng)所研究的是一個變量對兩個或兩個以上其他變量的相關(guān)關(guān)系時,稱為復(fù)相關(guān)。

偏相關(guān):某一變量與多個變量相關(guān)的場合,假定其他變量不變,專門考察其中兩個變量的相關(guān)關(guān)系稱為偏相關(guān)。2.按相關(guān)關(guān)系的表現(xiàn)形式分為:直線相關(guān)(線性相關(guān)):一個變量的值會隨另一變量的值的變化發(fā)生大致均等的變動。曲線相關(guān)(非線性相關(guān)):一個變量的值會隨另一變量的值的變化發(fā)生變動,但這種變動不是均等的。

正相關(guān):兩個相關(guān)現(xiàn)象間,當(dāng)一個變量的數(shù)值增加(或減少)時,另一個變量的數(shù)值也隨之增加(或減少),即同方向變化。例如收入與消費的關(guān)系。

負(fù)相關(guān):當(dāng)一個變量的數(shù)值增加(或減少)時,而另一個變量的數(shù)值相反地呈減少(或增加)趨勢變化,即反方向變化。

例如物價與消費的關(guān)系。3.按相關(guān)方向分為:4.按相關(guān)關(guān)系的程度分為:完全相關(guān)(函數(shù)關(guān)系)完全不相關(guān)(零相關(guān))不完全相關(guān)(狹義的相關(guān)關(guān)系)相關(guān)關(guān)系的兩種極端情況廣告投入和銷售之間的關(guān)系三、相關(guān)分析的內(nèi)容

●確定現(xiàn)象之間是否存在相關(guān)分析

●確定現(xiàn)象之間相關(guān)關(guān)系的表現(xiàn)形式

●判定現(xiàn)象之間相關(guān)關(guān)系的方向和密切程度第二節(jié)

簡單線性相關(guān)分析進(jìn)行相關(guān)分析的一般程序:定性分析定量分析在定性分析的基礎(chǔ)上,通過編制相關(guān)表、繪制相關(guān)圖、計算相關(guān)系數(shù)等方法,來判斷現(xiàn)象之間相關(guān)的方向、形態(tài)及密切程度。是依據(jù)研究者的理論知識和實踐經(jīng)驗,對客觀現(xiàn)象之間是否存在相關(guān)關(guān)系,以及何種關(guān)系作出判斷。一、相關(guān)表和相關(guān)圖(一)相關(guān)表一般將成對數(shù)據(jù)依其中一個變量按大小順序排列,另一個變量對應(yīng)排列而成。僅能對現(xiàn)象作大體初步觀測,當(dāng)涉及多個影響因素時制表較困難。(二)相關(guān)圖(也稱為散點圖)一對數(shù)據(jù)對應(yīng)坐標(biāo)圖上一個點,將成對的觀察數(shù)據(jù)表現(xiàn)為坐標(biāo)圖的散點而形成的圖。某市1998年—2005年的工資性現(xiàn)金支出與城鎮(zhèn)儲蓄存款余額的資料,說明簡單相關(guān)表和相關(guān)圖的編制方法。

序號年份工資性

現(xiàn)金支出(萬元)x城鎮(zhèn)儲蓄存款余額(萬元)y11998

50012021999

54014032000

62015042001

73020052002

90028062003

97035072004

105045082005

1170510例1企業(yè)按銷售額分組(萬元)流通費用率(%)4以下9.65

4~87.68

8~127.2512~167.0016~206.8620~246.7324~286.6428~326.6032~366.58例2相關(guān)關(guān)系的圖示線性正相關(guān)完全線性負(fù)相關(guān)完全線性正相關(guān)線性負(fù)相關(guān)相關(guān)關(guān)系的圖示(續(xù))曲線相關(guān)不相關(guān)(零相關(guān))不相關(guān)能源消耗量與工業(yè)總產(chǎn)值的相關(guān)表能源消耗量(十萬噸)工業(yè)總產(chǎn)值(億元)能源消耗量(十萬噸)工業(yè)總產(chǎn)值(億元)3524624138256440402465474228685049326949523171515437724859407658

能源消耗量與工業(yè)總產(chǎn)值相關(guān)圖

19個發(fā)達(dá)國家一年的葡萄酒消耗量(每人從葡萄酒所攝取的酒精)以及一年中因心臟病死亡的人數(shù)資料(選自《統(tǒng)計學(xué)的世界》):國家從葡萄酒攝取的酒精(升)心臟病死亡率(每十萬人死亡人數(shù))國家從葡萄酒攝取的酒精(升)心臟病死亡率(每十萬人死亡人數(shù))澳大利亞2.5211荷蘭1.8167奧地利3.9167新西蘭1.9266比利時/盧森堡2.9131挪威0.8227加拿大2.4191西班牙6.586丹麥2.9220瑞典1.6207芬蘭0.8297瑞士5.8115法國9.171英國1.3285冰島0.8211美國1.2199愛爾蘭0.7300德國2.7172意大利7.9107

19個發(fā)達(dá)國家一年的葡萄酒消耗量(每人從葡萄酒所攝取的酒精)以及一年中因心臟病死亡的的相關(guān)圖身高與足跡長度的相關(guān)圖二、相關(guān)系數(shù)

相關(guān)系數(shù)是在線性條件下對變量之間關(guān)系密切程度的度量;(1)總體相關(guān)系數(shù):反映總體的相關(guān)程度,根據(jù)總體全部數(shù)據(jù)計算,通常用“ρ”表示;

樣本相關(guān)系數(shù):反映樣本的相關(guān)程度,根據(jù)樣本數(shù)據(jù)計算通常用“r”表示。(2)單相關(guān)系數(shù):反映兩個變量之間的相關(guān)程度;

復(fù)相關(guān)系數(shù):反映兩個以上變量之間的相關(guān)程度。(3)直線相關(guān)系數(shù)(通常簡稱為相關(guān)系數(shù)):反映變量之間直線相關(guān)關(guān)系的密切程度;

曲線相關(guān)系數(shù)(也稱為非線性相關(guān)系數(shù))反映變量之間曲線相關(guān)關(guān)系的密切程度。(5)直線相關(guān)系數(shù)的取值范圍是[-1,1]|r|=1,完全線性相關(guān);r=0,沒有線性相關(guān);-1r<0,負(fù)線性相關(guān);0<r1,正線性相關(guān);|r|越趨于1表示兩變量線性關(guān)系越密切;|r|越趨于0表示線性關(guān)系越不密切。完全負(fù)相關(guān)完全正相關(guān)無線性相關(guān)-1.0+1.00-0.5+0.5負(fù)相關(guān)程度增加r正相關(guān)程度增加

00.30.50.81.0相關(guān)程度的劃分法:不相關(guān)

低度相關(guān)顯著相關(guān)高度相關(guān)完全相關(guān)計算式直線相關(guān)系數(shù)的計算直線相關(guān)系數(shù)一般用積差法公式測算從公式可以看出,r的符號決定于分子。

相關(guān)系數(shù)的特點(1)兩個變量是對等的,不必區(qū)分自變量和因變量;(2)只能計算出一個相關(guān)系數(shù);(3)r只反映兩個變量的直線關(guān)系密切程度,當(dāng)r的絕對值很小,甚至為0,只表示它們之間沒有直線相關(guān)關(guān)系,但有可能存在其它類型的相關(guān)關(guān)系。(4)相關(guān)系數(shù)的平方稱為判定系數(shù)(可決系數(shù)),用r2

表示;可用于判斷回歸方程的擬合優(yōu)度。案例研究:發(fā)生車禍次數(shù)與司機年齡有關(guān)嗎?作為交通安全研究的一部分,美國交通部采集了每1000個駕駛執(zhí)照發(fā)生死亡事故的車禍次數(shù)和有駕駛執(zhí)照的司機中21歲以下者所占比例的數(shù)據(jù),樣本由42個城市組成,在一年間采集的數(shù)據(jù)及散點圖如下:21歲以下者所占比例(%)

21歲以下者所占比例(%)21歲以下者所占比例(%)21歲以下者所占比例(%)80.885100.039121.913152.81480.368101.014132.962162.80180.645100.493131.142163.62382.19101.926132.634162.94380.82112.091142.885172.62781.267111.849142.352174.191.082111.294142.89173.25691.433120.708141.443183.8390.338121.652141.643183.61490.835121.405152.623

90.926122.246153.224

每千個駕駛執(zhí)照中發(fā)生車禍次數(shù)每千個駕駛執(zhí)照中發(fā)生車禍次數(shù)每千個駕駛執(zhí)照中發(fā)生車禍次數(shù)每千個駕駛執(zhí)照中發(fā)生車禍次數(shù)EXCEL(三)相關(guān)系數(shù)的顯著性檢驗1)檢驗總體X與Y之間的線性相關(guān)關(guān)系是否顯著,即檢驗自變量X對因變量Y的線性影響是否顯著;2)在一元線性回歸中,等價于回歸方程的顯著性檢驗及回歸系數(shù)的顯著性檢驗;3)一般采用t檢驗法(大樣本也可用z檢驗法)1、兩個變量都是連續(xù)性的;2、必須是成對數(shù)據(jù),且每對數(shù)據(jù)相互獨立;3、兩個變量的總體都接近正態(tài)分布;4、兩個變量的關(guān)系是線性的;(四)直線積差相關(guān)系數(shù)的應(yīng)用條件5、排除共變因素的影響。6、只能描述兩變量之間線性關(guān)系的密切程度和方向,不能闡明二者的本質(zhì)聯(lián)系。7、一般地說,n小于30時計算出的r缺乏有效意義。第三節(jié)一元線性回歸分析一、回歸分析的概念概念:是指對具有相關(guān)關(guān)系的現(xiàn)象,根據(jù)其相關(guān)關(guān)系的具體形態(tài),選擇一個合適的數(shù)學(xué)模型(稱為回歸方程式),用來近似地表達(dá)變量間的平均變化關(guān)系。之所以強調(diào)“平均”,是因為如果給定自變量一個值,因變量有若干值與之對應(yīng),這些值雖然表現(xiàn)出一定的隨機性、波動性,但是又總是按一定的分布規(guī)律圍繞因變量的均值(數(shù)學(xué)期望)上下波動,即對于自變量的某個確定值,因變量有一個平均值與之對應(yīng)。這樣現(xiàn)象之間數(shù)量不確定的相關(guān)關(guān)系,從平均意義上說已轉(zhuǎn)變?yōu)榇_定的函數(shù)關(guān)系,從而為研究不確定關(guān)系提供了可能。05001000150020002500300035005001000150020002500300035004000每月可支配收入X(元)每月消費支出Y(元)

隨著收入的增加,“平均而言”消費也在增加,且Y的條件均值均落在一根正斜率的直線上?;貧w模型的類型一個自變量兩個及兩個以上自變量回歸模型多元回歸一元回歸線性回歸非線性回歸線性回歸非線性回歸二、一元線性回歸分析的特點兩個變量之間不是對稱關(guān)系回歸分析中,必須確定誰是自變量,誰是因變量。兩個變量的性質(zhì)不同回歸分析要求因變量是隨機變量,自變量是一般變量。回歸方程式反映的是變量之間具體的數(shù)量變動規(guī)律,而不是抽象的系數(shù)回歸分析的內(nèi)容從樣本數(shù)據(jù)出發(fā),確定變量之間的數(shù)學(xué)關(guān)系式——建立回歸模型;借助于數(shù)學(xué)模型來表達(dá)變量之間的平均數(shù)量關(guān)系對這些關(guān)系式的可信程度進(jìn)行各種統(tǒng)計檢驗并從某一特定變量的諸多影響因素(變量)中找出哪些變量的影響顯著,哪些不顯著;利用所求的回歸模型進(jìn)行分析,預(yù)測或控制。

(并給出這種預(yù)測或控制的精確程度)三、相關(guān)分析與回歸分析(一)概念:1.相關(guān)分析就是用一個指標(biāo)來表明現(xiàn)象間相互依存關(guān)系的密切程度。廣義的相關(guān)分析包括相關(guān)關(guān)系的分析(狹義的相關(guān)分析)和回歸分析。2.回歸分析是指對具有相關(guān)關(guān)系的現(xiàn)象,根據(jù)其相關(guān)關(guān)系的具體形態(tài),選擇一個合適的數(shù)學(xué)模型(稱為回歸方程式),用來近似地表達(dá)變量間的平均變化關(guān)系。(二)相關(guān)分析與回歸分析的聯(lián)系1.相關(guān)分析需要依靠回歸分析來表明現(xiàn)象數(shù)量相關(guān)的具體形式。2.回歸分析則需要依靠相關(guān)分析來表明現(xiàn)象數(shù)量變化的相關(guān)程度。只有當(dāng)變量之間存在著高度相關(guān)時,進(jìn)行回歸分析尋求其相關(guān)的具體形式才有意義。簡單說:1.相關(guān)分析是回歸分析的基礎(chǔ)和前提;2.回歸分析是相關(guān)分析的深入和繼續(xù)。(三)相關(guān)分析與回歸分析的區(qū)別

1.變量的地位相關(guān)分析中,變量之間處于平等地位;回歸分析中,必須確定因變量(處在被解釋的地位)、自變量(用于解釋和預(yù)測因變量變化)。2.變量的性質(zhì)相關(guān)分析中所涉及的變量都是隨機變量;回歸分析中,因變量是隨機變量,自變量一般是非隨機的確定變量。3.分析內(nèi)容(側(cè)重點)相關(guān)分析主要描述兩個變量之間相關(guān)關(guān)系的密切程度;主要通過計算相關(guān)系數(shù)來測定?;貧w分析揭示變量之間數(shù)量變動的統(tǒng)計規(guī)律性;主要通過擬合回歸方程來描述或推斷。四、簡單線性回歸方程的求解3、條件:所分析的兩個變量之間必須存在相關(guān)關(guān)系,且相關(guān)程度在顯著相關(guān)以上。1、方程式為:2、回歸系數(shù)b的經(jīng)濟涵義:當(dāng)自變量變動一個單位時,因變量的平均變動值。(一)方程式(二)估計a、b的幾種方法根據(jù)求出的擬合值與實際值總有誤差,如果求出的a和b能使誤差為最小,就是最好的。而使誤差達(dá)到最小的準(zhǔn)則,可從以下四方面考慮。1、使=min,其缺陷在于正、負(fù)誤差可抵消。

2、使=min,其缺陷在于存在極端值時,不易作出正確判斷,且計算不方便。

3、使=min,其缺陷在于未考慮所有觀測值,且計算繁雜。

4、使=min,可消除正、負(fù)號,也便于數(shù)學(xué)處理。所以實際中常用該法,稱為最小二乘法(最小平方法)。1、用最小平方法配合回歸直線的基本思想是:在所有的相關(guān)點中,通過數(shù)學(xué)方法配合一條較為理想的直線,這條直線必須滿足兩點:⑵原數(shù)列與趨勢線的離差平方和為最小值。即⑴原數(shù)列與趨勢線的離差之和為零。即:(三)a、b的最小二乘估計通過求a、b的一階偏導(dǎo)可得到求解a、b的聯(lián)立方程:解聯(lián)立方程得到:2、具體求解4544.674.4172.0248.0418.0575.0805.2972.01280.01042143844739664001210013225174241822525600207.541.444.009.6114.4425.0037.2151.8464.00

88036.4∑6286801101151321351601.22.03.13.85.06.17.28.012345678生產(chǎn)費用(萬元)

月產(chǎn)量(千噸)序號例7-3-1:根據(jù)例7-2-1資料配合生產(chǎn)費用依產(chǎn)量變化的回歸方程:則回歸方程為:回歸系數(shù)b的涵義:月產(chǎn)量每增加1000噸,生產(chǎn)費用平均增加12.9萬元。計算得到:6708290100114140144耐用消費品銷售額(萬元)2820340380450470560620

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負(fù)責(zé)。
  • 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時也不承擔(dān)用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

評論

0/150

提交評論