回歸分析應(yīng)用_第1頁(yè)
回歸分析應(yīng)用_第2頁(yè)
回歸分析應(yīng)用_第3頁(yè)
回歸分析應(yīng)用_第4頁(yè)
回歸分析應(yīng)用_第5頁(yè)
已閱讀5頁(yè),還剩56頁(yè)未讀, 繼續(xù)免費(fèi)閱讀

下載本文檔

版權(quán)說(shuō)明:本文檔由用戶(hù)提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請(qǐng)進(jìn)行舉報(bào)或認(rèn)領(lǐng)

文檔簡(jiǎn)介

定義(dìngyì):現(xiàn)實(shí)世界中大多數(shù)現(xiàn)象表現(xiàn)相關(guān)關(guān)系,人們通過(guò)的大量觀察,將現(xiàn)象之間的相關(guān)關(guān)系抽象概括為函數(shù)關(guān)系,并用函數(shù)形式或模型來(lái)描述與推斷現(xiàn)象間的具體變動(dòng)關(guān)系,用一或一組變量(biànliàng)的變化來(lái)估計(jì)與推算另一變量(biànliàng)的變化。這種分析方法成為回歸分析。精品資料依據(jù)要素(yàosù)分類(lèi)

一元線(xiàn)性回歸分析一元回歸分析冪函數(shù)一元非線(xiàn)性回歸分析指數(shù)函數(shù)多元(duōyuán)線(xiàn)性回歸分析對(duì)數(shù)函數(shù)多元(duōyuán)回歸分析冪函數(shù)多元(duōyuán)非線(xiàn)性回歸分析指數(shù)函數(shù)對(duì)數(shù)函數(shù)

精品資料回歸分析的主要(zhǔyào)內(nèi)容:①?gòu)囊唤M數(shù)據(jù)出發(fā),確定某些變量之間的定量關(guān)系式,即建立數(shù)學(xué)模型并估計(jì)其中的未知參數(shù)。估計(jì)參數(shù)的常用方法是最小二乘法。②對(duì)這些關(guān)系式的可信程度進(jìn)行檢驗(yàn)。③在許多自變量共同影響著一個(gè)因變量的關(guān)系中,判斷(pànduàn)哪個(gè)(或哪些)自變量的影響是顯著的,哪些自變量的影響是不顯著的,將影響顯著的自變量選入模型中,而剔除影響不顯著的變量,通常用逐步回歸、向前回歸和向后回歸等方法。④利用所求的關(guān)系式對(duì)某一生產(chǎn)過(guò)程進(jìn)行預(yù)測(cè)或控制?;貧w分析的應(yīng)用是非常廣泛的,統(tǒng)計(jì)軟件包使各種回歸方法計(jì)算十分方便。精品資料線(xiàn)性回歸(huíguī)的局限性:不應(yīng)該使用(shǐyòng)這種方法來(lái)預(yù)測(cè)和建立模型時(shí)所使用(shǐyòng)的數(shù)據(jù)值相關(guān)差甚遠(yuǎn)的值。避免模型中自變量之間有較高的相關(guān)性。對(duì)噪聲數(shù)據(jù)敏感。一般假設(shè)誤差變量(

errorvariances或residuals)服從均值為0的正態(tài)分布。精品資料回歸(huíguī)分析在地理學(xué)中的意義和作用:

主要研究地理系統(tǒng)各要素之間相互關(guān)系(guānxì),尋找出隱藏在隨機(jī)性后面的統(tǒng)計(jì)規(guī)律。

有預(yù)測(cè)地理中要素的變化趨勢(shì)。

精品資料回歸分析(fēnxī)的一般步驟精品資料涉及一個(gè)自變量的回歸;因變量y與自變量x之間為線(xiàn)性關(guān)系(guānxì);因變量(dependentvariable):被預(yù)測(cè)或被解釋的變量,用y表示。自變量(independentvariable):預(yù)測(cè)或解釋因變量的一個(gè)或多個(gè)變量,用x表示。因變量與自變量之間的關(guān)系(guānxì)用一條線(xiàn)性方程來(lái)表示;精品資料實(shí)例(shílì):氣溫是否會(huì)顯著影響地溫;降雨量是否會(huì)影響到糧食產(chǎn)量;航班(hánɡbān)正點(diǎn)率是否對(duì)顧客投訴次數(shù)有顯著影響;廣告費(fèi)用支出是否對(duì)銷(xiāo)售額有顯著影響;北極熊數(shù)量是否會(huì)影響企鵝的出生率(不會(huì),反例);植物生長(zhǎng)是否受土壤、降水、陽(yáng)光等因素影響。精品資料描述因變量y如何依賴(lài)于自變量x和誤差項(xiàng)的方程稱(chēng)為回歸模型一元線(xiàn)性回歸模型:y=b0+b1x+ey是x的線(xiàn)性函數(shù)(部分)加上誤差項(xiàng)線(xiàn)性部分反映了由于x的變化引起(yǐnqǐ)的y的變化誤差項(xiàng)是隨機(jī)變量反映了除x和y之間線(xiàn)性關(guān)系之外的隨機(jī)因素對(duì)y的影響是不能由x和y之間的線(xiàn)性關(guān)系所解釋的變異性0和1稱(chēng)為模型的參數(shù)一元(yīyuán)線(xiàn)性回歸精品資料描述因變量y如何依賴(lài)于自變量x和誤差項(xiàng)的方程稱(chēng)為回歸模型一元線(xiàn)性回歸模型:y=b0+b1x+ey是x的線(xiàn)性函數(shù)(部分)加上誤差項(xiàng)線(xiàn)性部分反映了由于x的變化引起的y的變化誤差項(xiàng)是隨機(jī)變量反映了除x和y之間線(xiàn)性關(guān)系之外的隨機(jī)因素對(duì)y的影響(yǐngxiǎng)是不能由x和y之間的線(xiàn)性關(guān)系所解釋的變異性0和1稱(chēng)為模型的參數(shù)精品資料描述y的平均值或期望值如何依賴(lài)于x的方程稱(chēng)為回歸方程;一元線(xiàn)性回歸方程的形式如下:E(y)=0+1x方程表示一條直線(xiàn),也稱(chēng)為直線(xiàn)回歸方程;0是回歸直線(xiàn)在y軸上的截距,是當(dāng)x=0時(shí)y的期望值;1是直線(xiàn)的斜率,稱(chēng)為回歸系數(shù),表示當(dāng)x每變動(dòng)(biàndòng)一個(gè)單位時(shí),y的平均變動(dòng)(biàndòng)值精品資料估計(jì)(gūjì)的回歸方程總體回歸參數(shù)和是未知的,必須利用樣本數(shù)據(jù)去估計(jì);用樣本統(tǒng)計(jì)量和代替回歸方程中的未知參數(shù)和,就得到了估計(jì)的回歸方程;一元線(xiàn)性回歸中估計(jì)的回歸方程為:其中:是估計(jì)的回歸直線(xiàn)在y軸上的截距,是直線(xiàn)的斜率(xiélǜ),它表示對(duì)于一個(gè)給定的x的值,是y的估計(jì)值,也表示x每變動(dòng)一個(gè)單位時(shí),y的平均變動(dòng)值。精品資料最小二乘法(chéngfǎ)估計(jì)使因變量的觀察值與估計(jì)值之間的離差平方和達(dá)到最小來(lái)求得和的方法(fāngfǎ)。即

用最小二乘法擬合的直線(xiàn)來(lái)代表x與y之間的關(guān)系與實(shí)際數(shù)據(jù)的誤差比其他任何直線(xiàn)都小精品資料最小二乘估計(jì)(gūjì)(圖示)xy(xn,yn)(x1,y1)(x2,y2)(xi,yi)}ei=yi-yi^精品資料最小二乘法(chéngfǎ)根據(jù)最小二乘法的要求,可得求解和的公式(gōngshì)如下精品資料一元回歸方程統(tǒng)計(jì)(tǒngjì)檢驗(yàn)的主要內(nèi)容精品資料變差因變量y取值的波動(dòng)稱(chēng)為變差變差來(lái)源于兩個(gè)方面:由于自變量x的取值不同造成;除x以外的其他因素(如測(cè)量誤差等)的影響;對(duì)一個(gè)(yīɡè)具體的觀測(cè)值來(lái)說(shuō),變差的大小可以通過(guò)該實(shí)際觀測(cè)值與其均值之差來(lái)表示。精品資料變差的分解(fēnjiě)(圖示)xyy{}}精品資料離差平方和的分(三個(gè)平方和的意義(yìyì))總平方和(SST)用S表示反映因變量的n個(gè)觀察值與其均值的總離差;回歸平方和(SSR)用U表示反映自變量x的變化對(duì)因變量y取值變化的影響,是由于x與y之間的線(xiàn)性關(guān)系引起的y的取值變化,也稱(chēng)為可解釋的平方和;殘差平方和(SSE)用Q表示反映除x以外的其他(qítā)因素對(duì)y取值的影響,也稱(chēng)為不可解釋的平方和或剩余平方和;精品資料離差平方和的分解(fēnjiě)

(三個(gè)平方和的關(guān)系)SST=SSR+SSE或S=U+Q總平方和(SST){回歸平方和(SSR)殘差平方和(SSE){{精品資料判定(pàndìng)系數(shù)R2(coefficientofdetermination)回歸(huíguī)平方和占總離差平方和的比例反映回歸方程的擬合程度;取值范圍在[0,1]之間;

R21,說(shuō)明回歸方程擬合的越好;R20,說(shuō)明回歸方程擬合的越差;一元線(xiàn)性回歸中,判定系數(shù)等于y和x相關(guān)系數(shù)的平方,即R2=(r)2;精品資料線(xiàn)性關(guān)系的檢驗(yàn)(jiǎnyàn)檢驗(yàn)所有自變量與因變量之間的線(xiàn)性關(guān)系是否顯著;將均方回歸(MSR)同均方殘差(MSE)加以(jiāyǐ)比較,應(yīng)用F檢驗(yàn)來(lái)分析二者之間的差別是否顯著;均方回歸:回歸平方和SSR除以相應(yīng)的自由度(自變量的個(gè)數(shù)K);均方殘差:殘差平方和SSE除以相應(yīng)的自由度(n-k-1)。精品資料線(xiàn)性關(guān)系的檢驗(yàn)(jiǎnyàn)(檢驗(yàn)(jiǎnyàn)的步驟)提出假設(shè)H0:1=0所有回歸系數(shù)與零無(wú)顯著差異(chāyì),y與全體x的線(xiàn)性關(guān)系不顯著計(jì)算檢驗(yàn)統(tǒng)計(jì)量F確定顯著性水平,并根據(jù)分子自由度1和分母自由度n-2找出臨界值F作出決策:若F>F,拒絕H0;若F<F,不能拒絕H0精品資料線(xiàn)性關(guān)系的檢驗(yàn)(jiǎnyàn)(sig值檢驗(yàn)(jiǎnyàn))Sig值小于顯著性水平a,拒絕零假設(shè)認(rèn)為所有回歸系數(shù)與零存在顯著差異,被解釋變量y與解釋變量x的線(xiàn)性關(guān)系顯著,可以(kěyǐ)用線(xiàn)性模型描述它們之間的關(guān)系;Sig值大于顯著性水平a,不應(yīng)拒絕零假設(shè)說(shuō)明用線(xiàn)性模型描述x和y之間的關(guān)系是不恰當(dāng)?shù)?。精品資料檢驗(yàn)回歸方程中的每個(gè)解釋變量(biànliàng)x與被解釋變量(biànliàng)y之間是否存在顯著的線(xiàn)性關(guān)系;確定解釋變量(biànliàng)能否保留在線(xiàn)性回歸方程中?;貧w系數(shù)的顯著性檢驗(yàn)(jiǎnyàn)精品資料回歸系數(shù)的檢驗(yàn)(jiǎnyàn)(樣本統(tǒng)計(jì)量的分布)是根據(jù)最小二乘法求出的樣本統(tǒng)計(jì)量,服從正態(tài)分布;的分布具有(jùyǒu)如下性質(zhì)數(shù)學(xué)期望:標(biāo)準(zhǔn)差:由于未知,需用其估計(jì)量se來(lái)代替得到的估計(jì)標(biāo)準(zhǔn)差精品資料回歸系數(shù)的檢驗(yàn)(jiǎnyàn)(檢驗(yàn)(jiǎnyàn)步驟)提出假設(shè)H0:b1=0(沒(méi)有線(xiàn)性關(guān)系)H1:b10(有線(xiàn)性關(guān)系)計(jì)算檢驗(yàn)(jiǎnyàn)的統(tǒng)計(jì)量

確定顯著性水平,并進(jìn)行決策t>t,拒絕H0;t<t,不能拒絕H0Sig值小于a,拒絕H0精品資料利用回歸方程進(jìn)行(jìnxíng)估計(jì)和預(yù)測(cè)根據(jù)自變量x的取值估計(jì)或預(yù)測(cè)因變量y的取值估計(jì)或預(yù)測(cè)的類(lèi)型點(diǎn)估計(jì)y的平均值的點(diǎn)估計(jì)y的個(gè)別(gèbié)值的點(diǎn)估計(jì)區(qū)間估計(jì)y的平均值的置信區(qū)間估計(jì)y的個(gè)別(gèbié)值的預(yù)測(cè)區(qū)間估計(jì)精品資料線(xiàn)性關(guān)系的檢驗(yàn)(jiǎnyàn)檢驗(yàn)(jiǎnyàn)所有自變量與因變量之間的線(xiàn)性關(guān)系是否顯著;將均方回歸(MSR)同均方殘差(MSE)加以比較,應(yīng)用F檢驗(yàn)(jiǎnyàn)來(lái)分析二者之間的差別是否顯著;均方回歸:回歸平方和SSR除以相應(yīng)的自由度(自變量的個(gè)數(shù)K);均方殘差:殘差平方和SSE除以相應(yīng)的自由度(n-k-1)。精品資料線(xiàn)性關(guān)系的檢驗(yàn)(jiǎnyàn)(檢驗(yàn)(jiǎnyàn)的步驟)提出假設(shè)H0:1=0所有(suǒyǒu)回歸系數(shù)與零無(wú)顯著差異,y與全體x的線(xiàn)性關(guān)系不顯著計(jì)算檢驗(yàn)統(tǒng)計(jì)量F確定顯著性水平,并根據(jù)分子自由度1和分母自由度n-2找出臨界值F作出決策:若F>F,拒絕H0;若F<F,不能拒絕H0精品資料線(xiàn)性關(guān)系的檢驗(yàn)(jiǎnyàn)(sig值檢驗(yàn)(jiǎnyàn))Sig值小于顯著性水平a,拒絕零假設(shè)認(rèn)為所有回歸系數(shù)與零存在顯著差異,被解釋變量y與解釋變量x的線(xiàn)性關(guān)系顯著,可以用線(xiàn)性模型描述(miáoshù)它們之間的關(guān)系;Sig值大于顯著性水平a,不應(yīng)拒絕零假設(shè)說(shuō)明用線(xiàn)性模型描述(miáoshù)x和y之間的關(guān)系是不恰當(dāng)?shù)?。精品資料實(shí)例(shílì):精品資料精品資料(1)點(diǎn)擊(diǎnjī)statistics在回歸系數(shù)下拉框中估計(jì),殘差下拉框中選中Durbin-Waston

(2)點(diǎn)擊(diǎnjī)在繪圖在左選框中選中DEPENDNT,標(biāo)準(zhǔn)化殘差圖選中正態(tài)概率圖

(3)點(diǎn)擊(diǎnjī)選項(xiàng)中默認(rèn)設(shè)置精品資料殘差統(tǒng)計(jì)(tǒngjì)量方差分析模型(móxíng)匯總回歸分析圖精品資料在【模型匯總】中,主要顯示回歸模型中的相關(guān)系數(shù)、相關(guān)系數(shù)的平方、調(diào)整后的相關(guān)系數(shù)和估計(jì)(gūjì)的標(biāo)準(zhǔn)誤值在【方差分析】中主要顯示F檢驗(yàn)值、顯著性檢驗(yàn)P值、平方和、自由度在【殘差統(tǒng)計(jì)量】主要顯示預(yù)測(cè)值、殘差、標(biāo)準(zhǔn)預(yù)測(cè)值和標(biāo)準(zhǔn)殘差精品資料Multivariatelinearregression概念(gàiniàn):多元線(xiàn)性回歸分析也稱(chēng)復(fù)線(xiàn)性回歸分析(multiplelinearregressionanalysis),它研究一組自變量如何直接影響(yǐngxiǎng)一個(gè)因變量。自變量(independentvariable)是指獨(dú)立自由變量的變量,用向量X表示;因變量(dependentvariable)是指非獨(dú)立的、受其它變量影響(yǐngxiǎng)的變量,用向量Y表示;由于模型僅涉及一個(gè)因變量,所以多元線(xiàn)性回歸分析也稱(chēng)單變量線(xiàn)性回歸分析(univariatelinearregressionanalysis)精品資料多元回歸分析(fēnxī)數(shù)據(jù)格式精品資料多元線(xiàn)性回歸必須滿(mǎn)足的假定(jiǎdìng)條件因變量是服從正態(tài)分布的連續(xù)型隨機(jī)(suíjī)變量;k個(gè)自變量是固定變量,即非隨機(jī)(suíjī)或無(wú)度量誤差的變量;k個(gè)自變量間不存在多重共線(xiàn)性;k個(gè)自變量與殘差獨(dú)立;殘差是隨機(jī)(suíjī)變量,均值為零,方差為常數(shù);各殘差間相互獨(dú)立;殘差服從正態(tài)分布。精品資料因變量是服從正態(tài)分布的連續(xù)型隨機(jī)(suíjī)變量;k個(gè)自變量是固定變量,即非隨機(jī)(suíjī)或無(wú)度量誤差的變量;k個(gè)自變量間不存在多重共線(xiàn)性;k個(gè)自變量與殘差獨(dú)立;殘差是隨機(jī)(suíjī)變量,均值為零,方差為常數(shù);各殘差間相互獨(dú)立;殘差服從正態(tài)分布。統(tǒng)計(jì)檢驗(yàn)(jiǎnyàn)結(jié)果偏倚結(jié)果失真結(jié)論的非唯一性模型中缺乏重要變量參數(shù)估計(jì)偏倚結(jié)果誤導(dǎo)精品資料假定因變量Y與自變量間存在如下關(guān)系:式中,是常數(shù)項(xiàng),稱(chēng)為偏回歸系數(shù)(partialregressioncoefficient)。的含義為在其它自變量保持不變的條件下,自變量改變一個(gè)單位時(shí)因變量Y的平均改變量。為隨機(jī)誤差,又稱(chēng)殘差(residual),它表示的變化中不能由自變量解釋的部分。一、多元(duōyuán)線(xiàn)性回歸方程模型精品資料x(chóng)1x2y精品資料應(yīng)用(yìngyòng)條件:注意:雖然模型要求因變量是連續(xù)數(shù)值變量,但對(duì)自變量的類(lèi)型不限。若自變量是分類(lèi)變量,特別是無(wú)序分類(lèi)變量,要轉(zhuǎn)化為亞變量才能分析。對(duì)于(duìyú)自變量是分類(lèi)變量的情形,需要用廣義線(xiàn)性回歸模型分析。精品資料二、多元線(xiàn)性回歸分析(fēnxī)的步驟(一)估計(jì)各項(xiàng)參數(shù),建立多元線(xiàn)性回歸方程模型(二)對(duì)整個(gè)模型進(jìn)行假設(shè)檢驗(yàn),模型有意義的前提下,再分別(fēnbié)對(duì)各偏回歸系數(shù)進(jìn)行假設(shè)檢驗(yàn)。(三)計(jì)算相應(yīng)指標(biāo),對(duì)模型的擬合效果進(jìn)行評(píng)價(jià)。精品資料(一)模型(móxíng)的參數(shù)估計(jì)精品資料27名糖尿病患者的血清總膽固醇(x1)、甘油三酯(x2)、空腹(kōngfù)胰島素(x3)、糖化血紅蛋白(x4)、空腹(kōngfù)血糖(y)的測(cè)量值列于表中,試建立血糖與其它幾項(xiàng)指標(biāo)關(guān)系的多元線(xiàn)性回歸方程。例精品資料各變量的離差矩陣精品資料線(xiàn)性回歸方程模型為:精品資料1、對(duì)模型的假設(shè)檢驗(yàn)(jiǎnyàn)—F檢驗(yàn)(jiǎnyàn)2、對(duì)偏回歸系數(shù)的假設(shè)檢驗(yàn)(jiǎnyàn)—F檢驗(yàn)(jiǎnyàn)和t檢驗(yàn)(jiǎnyàn)3、標(biāo)準(zhǔn)偏化回歸系數(shù)(二)對(duì)模型及偏回歸系數(shù)的假設(shè)檢驗(yàn)精品資料1、對(duì)模型的假設(shè)檢驗(yàn)(jiǎnyàn)—F檢驗(yàn)(jiǎnyàn)精品資料SS回歸=b1l1y+b2l2y

+b3l3y+b4l4y=0.1424×67.6962+0.3515×89.8025+0.2706×142.4347+0.6382×84.5570=133.7107;ν回歸=m=4各變量的離差矩陣精品資料SS總=lyy=222.5519;ν總=n-1=26SS剩余(shèngyú)=SS總-SS回歸=222.5519-133.7107=88.8412ν剩余(shèngyú)=n-m-1=22MS回歸=SS回歸/ν回歸;MS剩余(shèngyú)=SS剩余(shèngyú)/ν剩余(shèngyú);F=MS回歸/MS剩余(shèngyú)1、對(duì)模型的假設(shè)檢驗(yàn)(jiǎnyàn)—F檢驗(yàn)(jiǎnyàn)精品資料1、對(duì)模型的假設(shè)檢驗(yàn)(jiǎnyàn)—F檢驗(yàn)(jiǎnyàn)精品資料2、對(duì)偏回歸系數(shù)的假設(shè)檢驗(yàn)(jiǎnyàn)—F檢驗(yàn)(jiǎnyàn)和t檢驗(yàn)(jiǎnyàn)回歸方程成立(chénglì)只能認(rèn)為總的來(lái)說(shuō)自變量與因變量間存在線(xiàn)性關(guān)系,但是否每一個(gè)自變量都與因變量間存在線(xiàn)性關(guān)系,須對(duì)其偏回歸系數(shù)進(jìn)行假設(shè)檢驗(yàn)。①方差分析法②t

檢驗(yàn)法精品資料①偏回歸系數(shù)的假設(shè)檢驗(yàn)--方差分析法精品資料①偏回歸系數(shù)的假設(shè)檢驗(yàn)--方差分析法精品資料ParameterSta

溫馨提示

  • 1. 本站所有資源如無(wú)特殊說(shuō)明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請(qǐng)下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請(qǐng)聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶(hù)所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁(yè)內(nèi)容里面會(huì)有圖紙預(yù)覽,若沒(méi)有圖紙預(yù)覽就沒(méi)有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫(kù)網(wǎng)僅提供信息存儲(chǔ)空間,僅對(duì)用戶(hù)上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對(duì)用戶(hù)上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對(duì)任何下載內(nèi)容負(fù)責(zé)。
  • 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請(qǐng)與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶(hù)因使用這些下載資源對(duì)自己和他人造成任何形式的傷害或損失。

最新文檔

評(píng)論

0/150

提交評(píng)論