第8相關(guān)與回歸分析_第1頁
第8相關(guān)與回歸分析_第2頁
第8相關(guān)與回歸分析_第3頁
第8相關(guān)與回歸分析_第4頁
第8相關(guān)與回歸分析_第5頁
已閱讀5頁,還剩64頁未讀, 繼續(xù)免費(fèi)閱讀

下載本文檔

版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請(qǐng)進(jìn)行舉報(bào)或認(rèn)領(lǐng)

文檔簡(jiǎn)介

例1:中國婦女生育水平的決定因素是什么?婦女生育水平除了受計(jì)劃生育政策影響以外,還可能與社會(huì)、經(jīng)濟(jì)、文化等多種因素有關(guān)。1.影響中國婦女生育率變動(dòng)的因素有哪些?2.各種因素對(duì)生育率的作用方向和作用程度如何?3.哪些因素是影響婦女生育率的主要決定性因素?4.如何評(píng)價(jià)計(jì)劃生育政策在生育水平變動(dòng)中的作用?5.計(jì)劃生育政策與經(jīng)濟(jì)因素比較,什么是影響生育率的決定因素?6.如果某些地區(qū)的計(jì)劃生育政策及社會(huì)、經(jīng)濟(jì)、文化等因素發(fā)生重大變化,預(yù)期對(duì)這些地區(qū)的婦女生育水平會(huì)產(chǎn)生怎樣的影響?本文檔共69頁;當(dāng)前第1頁;編輯于星期三\8點(diǎn)46分

據(jù)世界衛(wèi)生組織統(tǒng)計(jì),全球肥胖癥患者達(dá)3億人,其中兒童占2200萬人,11億人體重過重。肥胖癥和體重超常早已不是發(fā)達(dá)國家的專利,已遍及五大洲。目前全球因”吃”致病乃至死亡的人數(shù)已高于因饑餓死亡的人數(shù)

(引自《光明日?qǐng)?bào)》劉軍/文)問題:

肥胖癥和體重超常與死亡人數(shù)真有顯著的數(shù)量關(guān)系嗎?

這些類型的問題可以運(yùn)用相關(guān)分析與回歸分析的方法去解決。實(shí)例2:全球吃死的人比餓死的人多?本文檔共69頁;當(dāng)前第2頁;編輯于星期三\8點(diǎn)46分8.1相關(guān)與回歸的基本概念一、變量間的相互關(guān)系二、相關(guān)關(guān)系的類型三、相關(guān)分析與回歸分析本文檔共69頁;當(dāng)前第3頁;編輯于星期三\8點(diǎn)46分

一、變量間的相互關(guān)系確定性的函數(shù)關(guān)系Y=f(X)不確定性的統(tǒng)計(jì)關(guān)系—相關(guān)關(guān)系

Y=f(X)+ε=f(X,ε

)(ε為隨機(jī)變量)

可支配收入與消費(fèi) 支出沒有關(guān)系變量間的關(guān)系可用坐標(biāo)圖(散點(diǎn)圖)描述本文檔共69頁;當(dāng)前第4頁;編輯于星期三\8點(diǎn)46分相關(guān)關(guān)系的類型

從涉及的變量數(shù)量看

簡(jiǎn)單相關(guān)、多重相關(guān)(復(fù)相關(guān))

從變量相關(guān)關(guān)系的表現(xiàn)形式看

線性相關(guān)(左圖)、非線性相關(guān)(右圖)本文檔共69頁;當(dāng)前第5頁;編輯于星期三\8點(diǎn)46分從變量相關(guān)關(guān)系變化的方向看正相關(guān)——變量同方向變化A

同增同減(A)

負(fù)相關(guān)——變量反方向變化一增一減(B)B從變量相關(guān)的程度看

完全相關(guān)(B)

不完全相關(guān)(A)C

不相關(guān)(C)相關(guān)關(guān)系的類型本文檔共69頁;當(dāng)前第6頁;編輯于星期三\8點(diǎn)46分相關(guān)分析與回歸分析回歸的古典意義:

高爾頓遺傳學(xué)的回歸概念

父母身高與子女身高的關(guān)系:

無論高個(gè)子或低個(gè)子的子女都有向人的平均身高回歸的趨勢(shì)本文檔共69頁;當(dāng)前第7頁;編輯于星期三\8點(diǎn)46分

回歸的現(xiàn)代意義一個(gè)因變量對(duì)若干解釋變量依存關(guān)系的研究回歸的目的(實(shí)質(zhì)):

由固定的自變量去估計(jì)因變量的平均值自變量取固定值樣本總體估計(jì)因變量的平均值本文檔共69頁;當(dāng)前第8頁;編輯于星期三\8點(diǎn)46分

相關(guān)分析與回歸分析的聯(lián)系共同的研究對(duì)象:都是從數(shù)據(jù)出發(fā)定量地研究變量間的相互聯(lián)系,不能揭示本質(zhì)聯(lián)系相關(guān)分析用一個(gè)指標(biāo)----相關(guān)系數(shù)表明現(xiàn)象間相互依存關(guān)系的性質(zhì)和密切程度相關(guān)分析只表明變量間相關(guān)關(guān)系的性質(zhì)和程度;要確定變量間相關(guān)的具體數(shù)學(xué)形式依賴于回歸分析,即相關(guān)分析中相關(guān)系數(shù)的確定建立在回歸分析的基礎(chǔ)上回歸分析研究一個(gè)變量對(duì)另一個(gè)或多個(gè)變量依存關(guān)系,尋求變量間聯(lián)系的具體數(shù)學(xué)形式,并依此和自變量的固定值去估計(jì)和預(yù)測(cè)因變量的值本文檔共69頁;當(dāng)前第9頁;編輯于星期三\8點(diǎn)46分

相關(guān)分析與回歸分析的聯(lián)系只有當(dāng)變量間存在相關(guān)關(guān)系時(shí),用回歸分析去尋求相關(guān)的具體數(shù)學(xué)形式才有實(shí)際意義。相關(guān)分析中變量是對(duì)稱的隨機(jī)變量,不存在因果關(guān)系;回歸分析中區(qū)分因變量和自變量,變量間具有因果關(guān)系。通常假定自變量是在重復(fù)抽樣中取固定值的非隨機(jī)變量,因變量是具有一定概率分布的隨機(jī)變量。進(jìn)行相關(guān)(回歸)分析時(shí),要定性、定量相結(jié)合。因?yàn)閮H憑數(shù)據(jù),可能會(huì)是一種偽相關(guān)(偽回歸)。本文檔共69頁;當(dāng)前第10頁;編輯于星期三\8點(diǎn)46分8.2簡(jiǎn)單線性相關(guān)與回歸分析一、簡(jiǎn)單線性相關(guān)系數(shù)及檢驗(yàn)二、總體回歸函數(shù)與樣本回歸函數(shù)三、回歸系數(shù)的估計(jì)四、簡(jiǎn)單線性回歸模型的檢驗(yàn)五、簡(jiǎn)單線性回歸模型預(yù)測(cè)本文檔共69頁;當(dāng)前第11頁;編輯于星期三\8點(diǎn)46分一、簡(jiǎn)單線性相關(guān)系數(shù)及檢驗(yàn)總體相關(guān)系數(shù)

對(duì)于所研究的總體,表示兩個(gè)相互聯(lián)系的變量相關(guān)程度的總體相關(guān)系數(shù)為:

總體相關(guān)系數(shù)反映兩個(gè)變量X和Y的線性相關(guān)程度。特點(diǎn):對(duì)于特定的總體來說,X和Y的數(shù)值是既定的,

總體相關(guān)系數(shù)是客觀存在的特定數(shù)值。本文檔共69頁;當(dāng)前第12頁;編輯于星期三\8點(diǎn)46分樣本相關(guān)系數(shù)通過X和Y

的樣本觀測(cè)值去估計(jì)樣本相關(guān)系數(shù)變量X和Y的樣本相關(guān)系數(shù)通常用表示簡(jiǎn)單線性相關(guān)系數(shù)及檢驗(yàn)(續(xù))本文檔共69頁;當(dāng)前第13頁;編輯于星期三\8點(diǎn)46分特點(diǎn):樣本相關(guān)系數(shù)是根據(jù)從總體中抽取的隨機(jī)樣本的觀測(cè)值計(jì)算出來的,是對(duì)總體相關(guān)系數(shù)的一致估計(jì),它是個(gè)隨機(jī)變量。

相關(guān)系數(shù)的Excel計(jì)算:工具--數(shù)據(jù)分析--相關(guān)系數(shù)

--輸入?yún)^(qū)域:數(shù)據(jù)范圍

--分組方式:逐列(逐行)

--輸出區(qū)域:相關(guān)系數(shù)的輸出位置簡(jiǎn)單線性相關(guān)系數(shù)及檢驗(yàn)(續(xù))本文檔共69頁;當(dāng)前第14頁;編輯于星期三\8點(diǎn)46分

相關(guān)系數(shù)的特點(diǎn):

相關(guān)系數(shù)的取值在-1與1之間。當(dāng)r=0時(shí),表明X與Y沒有線性相關(guān)關(guān)系。當(dāng)時(shí),表明X與Y存在一定的線性相關(guān)關(guān)系:

若表明X與Y為正相關(guān);

若表明X與Y為負(fù)相關(guān)。當(dāng)時(shí),表明X與Y完全線性相關(guān):

若r=1,稱X與Y完全正相關(guān);若r=-1,稱X與Y完全負(fù)相關(guān)。本文檔共69頁;當(dāng)前第15頁;編輯于星期三\8點(diǎn)46分使用相關(guān)系數(shù)的注意事項(xiàng):X和Y

都是相互對(duì)稱的隨機(jī)變量,所以相關(guān)系數(shù)只反映變量間的線性相關(guān)程度,不能說明非線性相關(guān)關(guān)系。相關(guān)系數(shù)不能確定變量的因果關(guān)系,也不能說明相關(guān)關(guān)系具體接近于哪條直線。本文檔共69頁;當(dāng)前第16頁;編輯于星期三\8點(diǎn)46分

相關(guān)系數(shù)的檢驗(yàn)

為什么要檢驗(yàn)?

樣本相關(guān)系數(shù)是隨抽樣而變動(dòng)的隨機(jī)變量,只是對(duì)總體相關(guān)系數(shù)的估計(jì),其統(tǒng)計(jì)顯著性還有待檢驗(yàn)。檢驗(yàn)的依據(jù)(最常用的檢驗(yàn)):

若X和Y都服從正態(tài)分布,在總體相關(guān)系數(shù)的假設(shè)下,與樣本相關(guān)系數(shù)r

有關(guān)的t統(tǒng)計(jì)量服從自由度為n–2的t分布:本文檔共69頁;當(dāng)前第17頁;編輯于星期三\8點(diǎn)46分

相關(guān)系數(shù)的檢驗(yàn)方法給定顯著性水平,查自由度為n-2的臨界值若,表明相關(guān)系數(shù)r

在統(tǒng)計(jì)上是顯著的,應(yīng)否定而接受的假設(shè);反之,若,不能拒絕的假設(shè)。另一類種檢驗(yàn):總體相關(guān)系數(shù)是否等于某一不等于0的特定常數(shù)值。本文檔共69頁;當(dāng)前第18頁;編輯于星期三\8點(diǎn)46分

二、總體回歸函數(shù)與樣本回歸函數(shù)

若干基本概念Y的條件分布:Y在X取某固定值條件下的分布。對(duì)于X的每一個(gè)取值,都有Y的條件期望與之對(duì)應(yīng),在坐標(biāo)圖上Y的條件期望的點(diǎn)隨X而變化的軌跡所形成的直線或曲線,稱為回歸線。如果把Y的條件期望表示為X的某種函數(shù):,這個(gè)函數(shù)稱為回歸函數(shù)。如果其函數(shù)形式是只有一個(gè)自變量的線性函數(shù),如,稱為簡(jiǎn)單線性回歸函數(shù)。本文檔共69頁;當(dāng)前第19頁;編輯于星期三\8點(diǎn)46分

總體回歸函數(shù)(PRF)

概念:將總體因變量Y的條件均值表現(xiàn)為自變量X的某種函數(shù),這個(gè)函數(shù)稱為總體回歸函數(shù).表現(xiàn)形式:(1)條件均值表現(xiàn)形式(2)個(gè)別值表現(xiàn)形式(隨機(jī)設(shè)定形式)本文檔共69頁;當(dāng)前第20頁;編輯于星期三\8點(diǎn)46分

樣本回歸函數(shù)(SRF)概念:

Y的樣本觀測(cè)值的條件均值隨自變量X而變動(dòng)的軌跡,稱為樣本回歸線。若把因變量Y的樣本條件均值表示為自變量X的某種函數(shù),這個(gè)函數(shù)稱為樣本回歸函數(shù).表現(xiàn)形式:線性樣本回歸函數(shù)可表示為本文檔共69頁;當(dāng)前第21頁;編輯于星期三\8點(diǎn)46分樣本回歸函數(shù)與總體回歸函數(shù)的關(guān)系

——相互聯(lián)系

樣本回歸函數(shù)的函數(shù)形式應(yīng)與設(shè)定的總體回歸函數(shù)的函數(shù)形式一致。和是對(duì)總體回歸函數(shù)參數(shù)的估計(jì)。是對(duì)總體條件期望的估計(jì)殘差e

在概念上類似總體回歸函數(shù)中的隨機(jī)誤差u

?;貧w分析的目的:用樣本回歸函數(shù)去估計(jì)總體回歸函數(shù)。本文檔共69頁;當(dāng)前第22頁;編輯于星期三\8點(diǎn)46分樣本回歸函數(shù)與總體回歸函數(shù)的關(guān)系

——相互區(qū)別

總體回歸函數(shù)雖然未知,但它是確定的;樣本回歸線隨抽樣波動(dòng)而變化,可以有許多條。樣本回歸線還不是總體回歸線,至多只是未知總體回歸線的近似表現(xiàn)。總體回歸函數(shù)的參數(shù)雖未知,但是確定的常數(shù);樣本回歸函數(shù)的參數(shù)可估計(jì),但是隨抽樣而變化的隨機(jī)變量。總體回歸函數(shù)中的是不可直接觀測(cè)的;而樣本回歸函數(shù)中的是只要估計(jì)出樣本回歸的參數(shù)就可以計(jì)算的數(shù)值。本文檔共69頁;當(dāng)前第23頁;編輯于星期三\8點(diǎn)46分

三、回歸系數(shù)的估計(jì)回歸系數(shù)估計(jì)的思想:為什么只能對(duì)未知參數(shù)作估計(jì)?

參數(shù)是未知的、不可直接觀測(cè)的、不能精確計(jì)算,能夠得到的只是變量的樣本觀測(cè)值。結(jié)論:只能通過變量樣本觀測(cè)值選擇適當(dāng)方法去近似地估計(jì)回歸系數(shù)。前提:u是隨機(jī)變量,其分布性質(zhì)不確定,必須作某些假定,其估計(jì)才有良好性質(zhì),其檢驗(yàn)才可進(jìn)行。原則:使參數(shù)估計(jì)值“盡可能地接近”總體參數(shù)真實(shí)值本文檔共69頁;當(dāng)前第24頁;編輯于星期三\8點(diǎn)46分

簡(jiǎn)單線性回歸的基本假定假定1:零均值假定假定2:同方差假定

假定3:無自相關(guān)假定

假定4:隨機(jī)擾動(dòng)與自變量不相關(guān)假定5:正態(tài)性假定本文檔共69頁;當(dāng)前第25頁;編輯于星期三\8點(diǎn)46分

回歸系數(shù)的最小二乘估計(jì)基本思想:

估計(jì)值偏離實(shí)際觀測(cè)值的殘差平方和作為衡量與偏離程度的標(biāo)準(zhǔn)—最小二乘準(zhǔn)則。本文檔共69頁;當(dāng)前第26頁;編輯于星期三\8點(diǎn)46分

最小二乘估計(jì)的性質(zhì)

——高斯—馬爾可夫定理

前提:在基本假定滿足時(shí)最小二乘估計(jì)是因變量的線性函數(shù)最小二乘估計(jì)是無偏估計(jì),即

在所有的線性無偏估計(jì)中,回歸系數(shù)的最小二乘估計(jì)的方差最小。結(jié)論:回歸系數(shù)的最小二乘估計(jì)是最佳線性無偏估計(jì)(BLUE)—高斯-馬爾可夫定理本文檔共69頁;當(dāng)前第27頁;編輯于星期三\8點(diǎn)46分

最小二乘估計(jì)的概率分布性質(zhì)

和都是服從正態(tài)分布的隨機(jī)變量,其期望為方差和標(biāo)準(zhǔn)差為結(jié)論:本文檔共69頁;當(dāng)前第28頁;編輯于星期三\8點(diǎn)46分

的無偏估計(jì)

為什么要估計(jì)?

確定所估計(jì)參數(shù)的方差需要由于不能直接觀測(cè),也是未知的。對(duì)的數(shù)值只能通過樣本信息去估計(jì)。怎樣估計(jì)?可以證明的無偏估計(jì)為:本文檔共69頁;當(dāng)前第29頁;編輯于星期三\8點(diǎn)46分

擬合優(yōu)度的度量

基本思想:樣本回歸直線是對(duì)樣本數(shù)據(jù)的一種擬合,不同估計(jì)方法可擬合出不同的回歸線。樣本回歸擬合優(yōu)度的度量建立在對(duì)因變量總離差平方和分解的基礎(chǔ)上

總離差平方和TSS

回歸平方和ESS殘差平方和RSS

可決系數(shù):本文檔共69頁;當(dāng)前第30頁;編輯于星期三\8點(diǎn)46分

對(duì)可決系數(shù)的理解本文檔共69頁;當(dāng)前第31頁;編輯于星期三\8點(diǎn)46分

可決系數(shù)的特點(diǎn)

可決系數(shù)是非負(fù)的統(tǒng)計(jì)量;可決系數(shù)取值范圍:;可決系數(shù)是樣本觀測(cè)值的函數(shù),可決系數(shù)是隨抽樣而變動(dòng)的隨機(jī)變量;在一元線性回歸中,可決系數(shù)在數(shù)值上是簡(jiǎn)單線性相關(guān)系數(shù)的平方:本文檔共69頁;當(dāng)前第32頁;編輯于星期三\8點(diǎn)46分

回歸系數(shù)顯著性的t檢驗(yàn)?zāi)康模焊鶕?jù)樣本回歸估計(jì)的結(jié)果對(duì)總體回歸函數(shù)的有關(guān)假設(shè)進(jìn)行檢驗(yàn),以檢驗(yàn)總體回歸系數(shù)是否等于某個(gè)特定的數(shù)值。思想:

是未知的,而且不一定能獲得大樣本,這時(shí)可用的無偏估計(jì)代替去估計(jì)參數(shù)的標(biāo)準(zhǔn)誤差:本文檔共69頁;當(dāng)前第33頁;編輯于星期三\8點(diǎn)46分回歸系數(shù)顯著性的t

檢驗(yàn)(續(xù))用估計(jì)的參數(shù)標(biāo)準(zhǔn)誤差對(duì)估計(jì)的參數(shù)作標(biāo)準(zhǔn)化變換,所得的t統(tǒng)計(jì)量將不再服從正態(tài)分布,而是服從t分布,可利用t分布作有關(guān)的假設(shè)檢驗(yàn)。本文檔共69頁;當(dāng)前第34頁;編輯于星期三\8點(diǎn)46分

回歸系數(shù)顯著性t

檢驗(yàn)的方法(1)提出假設(shè)

一般假設(shè):

常用假設(shè):(2)計(jì)算統(tǒng)計(jì)量(3)給定顯著性水平α,確定臨界值

(4)檢驗(yàn)結(jié)果判斷

若,則拒絕原假設(shè),接受備擇假設(shè)若,則接受原假設(shè),拒絕備擇假設(shè)本文檔共69頁;當(dāng)前第35頁;編輯于星期三\8點(diǎn)46分回歸系數(shù)顯著性的P值檢驗(yàn)

——P值的意義P值的意義:

在既定原假設(shè)下計(jì)算回歸系數(shù)的t統(tǒng)計(jì)量,可求得統(tǒng)計(jì)量大于的概率:這里的是

t統(tǒng)計(jì)量大于值的概率,是尚不能拒絕原假設(shè)的最大顯著水平,稱為所估計(jì)的回歸系數(shù)的P

值。本文檔共69頁;當(dāng)前第36頁;編輯于星期三\8點(diǎn)46分回歸系數(shù)顯著性的P值檢驗(yàn)

——檢驗(yàn)方法回歸系數(shù)顯著性的P

值檢驗(yàn)方法:

將所取顯著性水平與P值對(duì)比所取的顯著性水平(例如取0.05)若比P值更大,就可在顯著性水平下拒絕原假設(shè)。

所取的若小于P值,就應(yīng)在顯著性水平下接受原假設(shè)。

一元線性回歸模型的Excel估計(jì):本文檔共69頁;當(dāng)前第37頁;編輯于星期三\8點(diǎn)46分五、簡(jiǎn)單線性回歸模型預(yù)測(cè)對(duì)平均值的點(diǎn)預(yù)測(cè)值:

Y的個(gè)別值置信度為1-α的預(yù)測(cè)區(qū)間:

本文檔共69頁;當(dāng)前第38頁;編輯于星期三\8點(diǎn)46分

Y的總體條件均值的置信度為1-α的預(yù)測(cè)區(qū)間:

本文檔共69頁;當(dāng)前第39頁;編輯于星期三\8點(diǎn)46分因變量的區(qū)間預(yù)測(cè)的特點(diǎn)

(1)個(gè)別值的預(yù)測(cè)區(qū)間大于平均值的預(yù)測(cè)區(qū)間:

Y平均值的預(yù)測(cè)值與真實(shí)平均值有誤差,主要是受抽樣波動(dòng)的影響;Y個(gè)別值的預(yù)測(cè)值與真實(shí)個(gè)別值的差異不僅受抽樣波動(dòng)影響,而且還受隨機(jī)擾動(dòng)項(xiàng)的影響.(2)對(duì)預(yù)測(cè)區(qū)間隨變化而變化:

時(shí),,此時(shí)預(yù)測(cè)區(qū)間最窄;越是遠(yuǎn)離,越大,預(yù)測(cè)區(qū)間越寬。本文檔共69頁;當(dāng)前第40頁;編輯于星期三\8點(diǎn)46分

因變量的區(qū)間預(yù)測(cè)的特點(diǎn)(續(xù))(3)預(yù)測(cè)區(qū)間與樣本容量有關(guān):樣本容量n越大,越大,預(yù)測(cè)誤差的方差越小,預(yù)測(cè)區(qū)間也越窄。(4)當(dāng)樣本容量趨于無窮大(即n→∞)時(shí),不存在抽樣誤差,平均值預(yù)測(cè)誤差趨于0,此時(shí)個(gè)別值的預(yù)測(cè)誤差只決定于隨機(jī)擾動(dòng)的方差。本文檔共69頁;當(dāng)前第41頁;編輯于星期三\8點(diǎn)46分8.3多元線性相關(guān)與回歸分析一、多元線性回歸模型及假定二、多元線性回歸模型的估計(jì)三、多元線性回歸模型的檢驗(yàn)四、多元線性回歸模型的預(yù)測(cè)五、復(fù)相關(guān)系數(shù)和偏相關(guān)系數(shù)本文檔共69頁;當(dāng)前第42頁;編輯于星期三\8點(diǎn)46分一、多元線性回歸模型及假定多元總體線性回歸函數(shù)一般形式條件均值形式多元線性樣本回歸函數(shù):一般形式因?yàn)轭A(yù)測(cè)值和真實(shí)值之間有偏差,也可表示成本文檔共69頁;當(dāng)前第43頁;編輯于星期三\8點(diǎn)46分多元線性回歸模型的矩陣表示多元總體線性回歸模型的矩陣表示:Y=Xβ+U

多元線性樣本回歸函數(shù)的矩陣表示:偏回歸系數(shù):多元線性回歸模型中,回歸系數(shù)表示當(dāng)控制其它自變量不變的條件下,第j個(gè)自變量的單位變動(dòng)對(duì)因變量均值的影響,這樣的回歸系數(shù)稱為偏回歸系數(shù).本文檔共69頁;當(dāng)前第44頁;編輯于星期三\8點(diǎn)46分

二、多元線性回歸模型的估計(jì)多元回歸模型的假定相同的假定:

零均值、同方差、無自相關(guān)、隨機(jī)擾動(dòng)項(xiàng)與自變量不相關(guān)、U正態(tài)性增加的假定:各自變量之間不存在線性關(guān)系(多重共線)

在此條件下,自變量觀測(cè)值矩陣X列滿秩

r(X)=k;方陣滿秩r()=k。意義:可逆,存在。本文檔共69頁;當(dāng)前第45頁;編輯于星期三\8點(diǎn)46分多元回歸參數(shù)的最小二乘估計(jì)使殘差平方和達(dá)到最小,其充分必要條件整理成正規(guī)方程組

本文檔共69頁;當(dāng)前第46頁;編輯于星期三\8點(diǎn)46分多元線性回歸的最小二乘估計(jì)式正規(guī)方程組可簡(jiǎn)記為矩陣形式存在,則參數(shù)向量β的最小二乘估計(jì)為參數(shù)最小二乘估計(jì)量的性質(zhì):

可以證明:多元線性回歸的最小二乘估計(jì)也是最佳線性無偏估計(jì)。本文檔共69頁;當(dāng)前第47頁;編輯于星期三\8點(diǎn)46分隨機(jī)誤差項(xiàng)方差的估計(jì)方差未知,需要利用樣本回歸的殘差平方和去估計(jì)??梢宰C明是隨機(jī)擾動(dòng)項(xiàng)方差的無偏估計(jì)。多元線性回歸模型的Excel估計(jì)本文檔共69頁;當(dāng)前第48頁;編輯于星期三\8點(diǎn)46分三、多元線性回歸模型的檢驗(yàn)擬合優(yōu)度檢驗(yàn)多元線性回歸離差平方和的分解式變差

TSS=RSS+ESS(總離差平方和)(殘差平方和)(回歸平方和)

自由度n-1=n-k+k-1

多重可決系數(shù)本文檔共69頁;當(dāng)前第49頁;編輯于星期三\8點(diǎn)46分修正的可決系數(shù)為什么要修正可決系數(shù)?可決系數(shù)是自變量個(gè)數(shù)的不減函數(shù),比較因變量相同而自變量個(gè)數(shù)不同的兩個(gè)模型的擬合程度時(shí),不能簡(jiǎn)單地對(duì)比多重可決系數(shù),需要用自由度去修正多重可決系數(shù)中的殘差平方和與回歸平方和。

相互關(guān)系:本文檔共69頁;當(dāng)前第50頁;編輯于星期三\8點(diǎn)46分修正的可決系數(shù)(續(xù))在樣本容量一定的條件下,雖然可決系數(shù)是關(guān)于自變量個(gè)數(shù)的不減函數(shù),但并不是變量個(gè)數(shù)越多越好(增加調(diào)查取樣的樣本,損失自由度)。人們希望(修正)可決系數(shù)越大越好,但它們只是對(duì)模型擬合優(yōu)度的度量,只能說明解釋變量對(duì)因變量的聯(lián)合影響程度越大,并不能說明單個(gè)變量的影響程度大。因此在選擇模型時(shí),不能單純地憑多重(修正)可決系數(shù)的大小來斷定模型的優(yōu)劣(如經(jīng)濟(jì)學(xué)意義)。本文檔共69頁;當(dāng)前第51頁;編輯于星期三\8點(diǎn)46分回歸參數(shù)的顯著性檢驗(yàn)----t檢驗(yàn)

在多元回歸中可以證明其中是矩陣第

j行第j列的元素。因?yàn)槲粗?,故也未知。用代替?gòu)造統(tǒng)計(jì)量對(duì)原假設(shè)分別作t檢驗(yàn).:本文檔共69頁;當(dāng)前第52頁;編輯于星期三\8點(diǎn)46分

回歸方程的顯著性檢驗(yàn)

——F

檢驗(yàn)?zāi)康?檢驗(yàn)多個(gè)變量聯(lián)合對(duì)因變量是否有顯著影響方法:在方差分析的基礎(chǔ)上利用F檢驗(yàn)進(jìn)行假定:

方差分析表離差來源平方和自由度方差源于回歸源于殘差k-1n–kESS/(k-1)RSS/(n-k)總離差n-1本文檔共69頁;當(dāng)前第53頁;編輯于星期三\8點(diǎn)46分

F檢驗(yàn)的方法F檢驗(yàn):在成立的條件下,統(tǒng)計(jì)量給定顯著性水平,在分布表中查出對(duì)應(yīng)自由度的臨界值若,則拒絕,說明回歸方程中所有自變量聯(lián)合起來對(duì)因變量有顯著影響。若,則不能拒絕,說明回歸方程中所有自變量聯(lián)合起來對(duì)因變量影響不顯。本文檔共69頁;當(dāng)前第54頁;編輯于星期三\8點(diǎn)46分F

檢驗(yàn)與t檢驗(yàn)、擬合優(yōu)度檢驗(yàn)的關(guān)系在一元線性回歸中,由于解釋變量只有一個(gè),不用做F

檢驗(yàn),且可以證明,即二者是等價(jià)的。F

檢驗(yàn)與擬合優(yōu)度檢驗(yàn)都是在將總離差平方和TSS分解為回歸平方和ESS與殘差平方和RSS的基礎(chǔ)上構(gòu)造統(tǒng)計(jì)量進(jìn)行的檢驗(yàn),但前者考慮了自由度,后者沒有考慮;一般情況下,模型對(duì)觀測(cè)值的擬合程度越高,模型總體線性關(guān)系的顯著性越強(qiáng)。F

檢驗(yàn)可以在給定的顯著性水平下,給出F數(shù)值達(dá)到多少后可以通過檢驗(yàn),但(修正)可決系數(shù)沒有給出。本文檔共69頁;當(dāng)前第55頁;編輯于星期三\8點(diǎn)46分四、多元線性回歸模型的預(yù)測(cè)點(diǎn)預(yù)測(cè)值預(yù)測(cè)的殘差可證明用代替,則構(gòu)造t

統(tǒng)計(jì)量給定顯著性水平,可得臨界值,則置信為的預(yù)測(cè)區(qū)間為

-

本文檔共69頁;當(dāng)前第56頁;編輯于星期三\8點(diǎn)46分

五、復(fù)相關(guān)系數(shù)和偏相關(guān)系數(shù)復(fù)相關(guān)系數(shù):

度量一個(gè)變量與其他若干個(gè)變量聯(lián)合線性相關(guān)程度在數(shù)值上:多重可決系數(shù)的平方根等于復(fù)相關(guān)系數(shù)偏相關(guān)系數(shù):

對(duì)于相互聯(lián)系的多個(gè)變量,當(dāng)控制其他變量保持不變的條件下,度量因變量和某一個(gè)自變量之間線性相關(guān)程度的指標(biāo)稱為偏相關(guān)系數(shù)。本文檔共69頁;當(dāng)前第57頁;編輯于星期三\8點(diǎn)46分偏相關(guān)系數(shù)與簡(jiǎn)單相關(guān)系數(shù)的內(nèi)在聯(lián)系

以三個(gè)變量為例,可以證明:本文檔共69頁;當(dāng)前第58頁;編輯于星期三\8點(diǎn)46分8.4非線性相關(guān)與

非線性回歸分析一、非線性回歸的函數(shù)形式與估計(jì)方法二、非線性相關(guān)指數(shù)本文檔共69頁;當(dāng)前第59頁;編輯于星期三\8點(diǎn)46分一、非線性回歸的函數(shù)形式與估計(jì)方法

常用的可以轉(zhuǎn)換為線性的非線性函數(shù)形式冪函數(shù)其中的參數(shù)度量了變量Y對(duì)變量X的彈性,即X的單位百分比變動(dòng)引起Y變動(dòng)的百分比(半)對(duì)數(shù)函數(shù)其中的參數(shù)b說明當(dāng)變量X每變動(dòng)一個(gè)百分點(diǎn),引起因變量Y絕對(duì)量的變動(dòng)量(半)對(duì)數(shù)函數(shù)變量X

每變動(dòng)一個(gè)單位,引起因變量Y

百分比的變動(dòng)量本文檔共69

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請(qǐng)下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請(qǐng)聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會(huì)有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫網(wǎng)僅提供信息存儲(chǔ)空間,僅對(duì)用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對(duì)用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對(duì)任何下載內(nèi)容負(fù)責(zé)。
  • 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請(qǐng)與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶因使用這些下載資源對(duì)自己和他人造成任何形式的傷害或損失。

最新文檔

評(píng)論

0/150

提交評(píng)論