應(yīng)用回歸分析人大版-前四章課后習(xí)題答案詳解_第1頁
應(yīng)用回歸分析人大版-前四章課后習(xí)題答案詳解_第2頁
應(yīng)用回歸分析人大版-前四章課后習(xí)題答案詳解_第3頁
應(yīng)用回歸分析人大版-前四章課后習(xí)題答案詳解_第4頁
應(yīng)用回歸分析人大版-前四章課后習(xí)題答案詳解_第5頁
已閱讀5頁,還剩38頁未讀, 繼續(xù)免費閱讀

下載本文檔

版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進行舉報或認領(lǐng)

文檔簡介

應(yīng)用回歸分析[1-4章習(xí)題詳解)

(21世紀統(tǒng)計學(xué)系列教材,第二(三)版,何曉群,劉文卿

編著中國人民大學(xué)出版社)

目錄

1回歸分析概述4

1.1變量間統(tǒng)計關(guān)系和函數(shù)關(guān)系的區(qū)別是什么?5

1.2回歸分析與相關(guān)分析的區(qū)別與聯(lián)系是什么?5

1.3回歸模型中隨機誤差項£的意義是什么?5

1.4線性回歸模型的根本假設(shè)是什么?5

1.5回歸模型的設(shè)置理論根據(jù)是什么?在回歸變量設(shè)置中應(yīng)該注意哪些問題?6

1.6收集,整理數(shù)據(jù)包括哪些內(nèi)容?6

1.7構(gòu)造回歸理論模型的根本根據(jù)是什么?7

1.8為什么要對回歸模型進行檢驗?7

1.9回歸模型有哪幾個方面的應(yīng)用?7

1.10為什么強調(diào)運用回歸分析研究經(jīng)濟問題要定性分析和定量分析相結(jié)合?8

2一元線性回歸8

2.1一元線性回歸模型有哪些根本假定?8

2.2考慮過原點的線性回歸模型y=,」%十&,,=1,2,/誤差&,£2尸?£〃仍滿足根本假定,

求的最小二乘估計。8

2.3證明為8=0,Zxe=0,9

J=lf=l

2.4回歸方程氏y)二尸+尸]]的參數(shù)乃。,夕1的最小二乘估計與最大似然估計在什么條件下等

價?給出理由?9

2.5證明反是總的無偏估計。10

—2

2.6證明丫@「(£;)=(,+1-/_2)。"?成立。10

2.7證明平方和分解式SST=SSR+SSE.10

2.8驗證三種檢驗的關(guān)系,即證:10

var(g)=(l」_(”X)右10

2.9驗證式子:

n

XX

2.10用第9題證明:/2=七之(y_);)’是人的無偏估計。11

2p

2.11驗證決定系數(shù)廠與F之間的關(guān)系式:/=---11

尸+〃一2

2.12如果把自變量觀測值都乘以2,回歸參數(shù)的最小二乘估計尸。和尸;會發(fā)生什么變化?如果把

自變量觀測值都加上2,回歸參數(shù)的最小二乘估計£;科16:會發(fā)生什么變化?11

2.13如果回歸方程:(二,:+/;X相應(yīng)的相關(guān)系數(shù)「很大,那么用它預(yù)測時預(yù)測誤差一定較小,

這一結(jié)論能成立嗎?對你的答復(fù)說明理由。12

2.14為了調(diào)查某廣告對銷售收入的影響,某商店記錄了5個月的銷售收入y(萬元〕和廣告費用x(萬

元〕13

表2.613

1〕利用SPSS軟件,散點圖為:13

2]由圖易知:x與y之間大致呈現(xiàn)線性關(guān)系。13

3〕最小二乘估計得到的回歸方程為:13

4〕求回歸標準誤差14

5〕給出口;與夕?的置信度為95%的區(qū)間估計;14

6)x與y的決定系數(shù);15

7)由SPSS軟件可以得到回歸方程作方差分析為:15

8)對回歸系數(shù)Si顯著性的檢驗15

9)做相關(guān)系數(shù)的顯著性檢驗15

10〕對回歸方程作殘差圖并作相應(yīng)的分析;15

11)對當(dāng)廣告費用為4.2萬元時,銷售收入將到達多少,并給出置信度95$的置信區(qū)間。16

2.15一家保險公司十分關(guān)心其總公司營業(yè)部加班的程度,決定認真調(diào)查一次現(xiàn)狀,經(jīng)過10周時間,

收集了每周加班工作時間的數(shù)據(jù)和簽發(fā)的新保單數(shù)目,x為每周簽發(fā)的新保單數(shù)目,Y為每周加班

工作時間〔小時〕,16

1〕畫散點圖;17

2)x與y之間是否大致呈線性關(guān)系?17

3)用最小二乘估計求出回歸方程;17

A

4)求回歸標準誤差°;17

5)給出°。與O'的置信度為95%的區(qū)間估計;18

6)計算x與y的決定系數(shù);18

7)對回歸方程作方差分析;18

8)對回歸系數(shù))?顯著性的檢驗;18

9)做相關(guān)系數(shù)的顯著性檢驗;18

10)對回歸方程作殘差圖并作相應(yīng)的分析;19

11)該公司預(yù)計下一周簽發(fā)新保單Xo=l°0°張,需要加班的時間是多少?19

12)給出丁。的置信水平為95與精確預(yù)測區(qū)間和近似預(yù)測區(qū)間;19

13)給出E〔丁?!持眯潘?5%的區(qū)間估計。19

2.16,表2.8是1985年美國50個州和哥倫比業(yè)特區(qū)公立學(xué)校中教師的人均年工資y〔美元〕和學(xué)

生的人均經(jīng)費收入x(美元〕。19

1)繪制y對x的散點圖,可以用直線回歸描述兩者之間的關(guān)系嗎?20

2)建立y對x的線性回歸;20

3)用線性回歸的Plots功能繪制標準殘差的直方圖和正態(tài)概率圖,檢驗誤差項的正態(tài)性假設(shè)。

20

3多元線性回歸20

3.1寫出多元線性回歸模型的矩陣表示形式,并給出多元線性回歸模型的根本假設(shè)。20

3.2討論樣本容量n與自變量個數(shù)p的關(guān)系,它們對模型的參數(shù)估計有何影響?21

2

a=—!—SSE2

3.3證明〃一〃一1是誤差項0的無偏估計。21

3.4一個回歸方程的復(fù)相關(guān)系數(shù)R=0.99,樣本決定系數(shù)=09801我們能判斷這個回歸方程就很

理想嗎?21

3.5如何正確理解回歸方程顯著性檢驗拒絕”。,接受H。?21

3.6數(shù)據(jù)中心化和標準化在回歸分析中的意義是什么?22

3.7驗證〔3.5〕式夕訪“22

丁_:12—八3—32

3.8利用〔3.60〕式證明〔3.61〕式成立,即在一乃3)(1一廠23)22

3.9證明y與自變量工,的偏決定系數(shù)與〔3.42〕偏F檢驗值是等價的。22

,F(xiàn)

2R=-------------------

3.10驗證決定系數(shù)A與F值之間的關(guān)系式:F+m-/7-l).,/722

3.11研究貨運總量y〔萬噸〕與工業(yè)總產(chǎn)值22

1〕計算出y,x1,x2,x3的相關(guān)系數(shù)矩陣23

2〕求y關(guān)于x1,x2,x3的三元線性回歸方程24

3]對所求的的方程作擬合優(yōu)度檢驗24

4〕對回歸方程做顯著性檢驗25

5]對每個回歸系數(shù)做顯著性檢驗25

6〕將x3剔除后,進行回歸分析得25

7〕有上述系數(shù)表可知,常量的95%置信區(qū)間為〔-82Z547,-97.700]26

8〕求標準化回歸方程26

9〕求當(dāng)”)1=75,XO2=42,XO3=3」時的給定置信水平為95%,用SPSS軟件計算精

1.1變量間統(tǒng)計關(guān)系和函數(shù)關(guān)系的區(qū)別是什么?

答:變量間的統(tǒng)計關(guān)系指的是:在推斷統(tǒng)計中,我們把變量間具有密切關(guān)聯(lián)而又不能由一

個或某一些變量唯一確定另外一個變量的關(guān)系成為變量間的統(tǒng)計關(guān)系。而函數(shù)關(guān)系指的是

一個變量的變化能完全確定另一個變量的變化。

1.2回歸分析與相關(guān)分析的區(qū)別與聯(lián)系是什么?

答:區(qū)別:回歸分析和相關(guān)分析相互結(jié)合,相互滲透但又有不同。他們之間的區(qū)別見下表:

設(shè)X,Y為變量,

回歸分析相關(guān)分析

Y是因變量[被解釋變量),X是自變X,Y地位平等

量(解釋變量)

Y是隨機變量,X可以是隨機變量也可X,Y都是隨機變量

以是普通變量

回歸分析不僅可以揭示變量X對變量Y相關(guān)分析的研究主要是為刻畫兩類變

的影響大小,還可以由回歸方程進行預(yù)量間線性相關(guān)的密切程度

測與控制。

聯(lián)系:回歸分析和相關(guān)分析都是相關(guān)關(guān)系1統(tǒng)計關(guān)系),即:兩個變量間雖然有密切的聯(lián)系

但他們的密切程度并沒有到由一個可以完全確定另一個的程度?;貧w分析和相關(guān)分析都是

研究變量間關(guān)系的統(tǒng)計學(xué)課題。

1.3回歸模型中隨機誤差項£的意義是什么?

答:回歸模型的一般形式為:),=/(%,工2-戊〃)+£其中隨機變量丫稱為被解釋變量(因

變量);R&,…%成為解釋變量(自變量)。1八圻為一般變量月,無,…%確

實定性關(guān)系,£為隨機誤差c

回歸模型中隨機誤差項£的意義是:正是因為隨機誤差項£的引入,才將變量之間的關(guān)系描

述為一個隨機方程,使得我們可以借助隨機數(shù)學(xué)方法研究y與/22,...與的關(guān)系。

1.4線性回歸模型的根本假設(shè)是什么?

答:線性回歸模型的根本假設(shè)為:

1)解釋變量萬,無,...,為是確定性變量,不是隨機變量,樣本容量的個數(shù)應(yīng)大于解釋變量

的個數(shù)。

2)隨機誤差項具有0均值和等方差,即

=(),,=1,2,…

3V9,2)=b\(i=j)這個假定常稱為高斯-馬爾科夫條件。

c?v(g£.)=0,(i=j)i,j=1,2,...J?

既&)=0,即假設(shè)觀測值沒有系統(tǒng)誤差,隨機誤差京的平均值為零。隨機誤差項&的協(xié)方

差為零說明隨機誤差項在不同的樣本點之間是不相關(guān)的(在正本假定下即為獨立的),不存

在序列相關(guān),并且有相同的精度。

3),正態(tài)分布的假定條件為:

2(~陽0,。-),i=1,2,...,//

4T通常為了便于數(shù)學(xué)上的處理,還要求n>p,即樣本容量的個數(shù)要多于解釋變量的個數(shù)。

1.5回歸模型的設(shè)置理論根據(jù)是什么?在回歸變量設(shè)置中應(yīng)該注意哪些問

題?

答:回歸模型的設(shè)置理論依據(jù)是:要根據(jù)所研究問題的目的設(shè)置因變量y,然后再選取與y

有統(tǒng)計關(guān)系的一些變量作為自變量。

變量設(shè)置中應(yīng)注意的問題:1)變量的正確選擇關(guān)鍵在于能否正確把握所研究的經(jīng)濟活動的

經(jīng)濟學(xué)內(nèi)涵。即藥酒研究者對所研究的經(jīng)濟問題及背景要有足夠的了解。2)對于一些從經(jīng)

濟關(guān)系角度考慮非常重要的需要引進,但在實際中并沒有這樣的統(tǒng)計數(shù)據(jù)的變量,應(yīng)該考

慮用相近的變量代替,或者由其他幾個指標復(fù)合成一個新指標。3)在選擇變量時要注意與

一些專門領(lǐng)域的專家合作。4)一個回歸模型中并不是所涉及的解釋變量越多越好。

1.6收集,整理數(shù)據(jù)包括哪些內(nèi)容?

答:1〕回歸模型的建立是基于回歸變量的樣本統(tǒng)計數(shù)據(jù)。當(dāng)確定好回歸模型的變量之后,

就要對這些變量收集,整理統(tǒng)計數(shù)據(jù)。

2)數(shù)據(jù)的收集是建立經(jīng)濟問題回歸模型的重要一環(huán),是一項根底性工作,樣本數(shù)據(jù)的質(zhì)量

如何,對回歸模型的水平有至關(guān)重要的影響。

3)常用的樣本數(shù)據(jù)分為時間序列數(shù)據(jù)和橫截面數(shù)據(jù)。

①時間序列數(shù)據(jù)是按時間順序排列的統(tǒng)計數(shù)據(jù)。研究宏觀經(jīng)濟問題,這方面的時間序列數(shù)

據(jù)來自國家統(tǒng)計局或一些專業(yè)部委的統(tǒng)計年鑒。如果研究微觀經(jīng)濟現(xiàn)象,如研究某企業(yè)的

產(chǎn)值與能耗,那么數(shù)據(jù)就要在這個企業(yè)的方案統(tǒng)計科獲取。

對于收集到的時間序列資料要特別注意數(shù)據(jù)的可比性與數(shù)據(jù)的統(tǒng)計口徑問題。對于沒有可

比性和統(tǒng)計口徑計算不致的統(tǒng)計數(shù)據(jù)耍作認真調(diào)整,這個調(diào)整過程就是個數(shù)據(jù)整理過

程。

由于許多經(jīng)濟變量的前后期之間總是有關(guān)聯(lián)的,因此時間序列數(shù)據(jù)容易產(chǎn)生模型中隨機誤

差項的序列相關(guān)。對于具有隨機誤差項序列相關(guān)的情況,就要通過對數(shù)據(jù)的某種計算整理

來消除序列相關(guān)性,最常用的處理方法是差分法。

②橫截面數(shù)據(jù)是在同一時間截面上的統(tǒng)計數(shù)據(jù)。由于一個回歸模型往往涉及眾多解釋變量,

如果其中某i因素或一些因素隨著解釋變量觀測值的變化而對被解釋變量產(chǎn)生不同影響,

就產(chǎn)生異方差。因此當(dāng)用截面數(shù)據(jù)作樣本時,容易產(chǎn)生異方差。對于具有異方差性的建模

問題,數(shù)據(jù)整理就是注意消除異方差性,這常與模型參數(shù)估計方法結(jié)合起來考慮。

③不管是時間序列數(shù)據(jù)還是橫截面數(shù)據(jù)的,樣本容量的多少一般要與設(shè)置的解釋變量數(shù)

目相配套。

4)統(tǒng)計數(shù)據(jù)的整理中不僅要把一些變量數(shù)據(jù)進行折算,差分,甚至把數(shù)據(jù)對數(shù)化,標準化

等,有時還須注意剔除個別特別大或特別小的“野值〃,有時需要利用差值的方法把空缺

的數(shù)據(jù)補齊。

1.7構(gòu)造回歸理論模型的根本根據(jù)是什么?

答:1)經(jīng)濟回歸模型的建立,通常要依據(jù)經(jīng)濟理論和一些數(shù)理經(jīng)濟學(xué)結(jié)果。例如研究的模

型有某些具體的函數(shù)形式。

2)對于根據(jù)所獲信息無法確定模型的形式時,此時采月不同的形式進行計算機模擬,對于

不同的模擬結(jié)果,選擇較好的一個作為理論模型。

1.8為什么要對回歸模型進行檢驗?

答:當(dāng)模型的未知參數(shù)估計出來后,便初步建立了一個回歸模型,建立回歸模型的目的是

為了應(yīng)用它來研究經(jīng)濟問題,但不能馬上就用這個模型去作預(yù)測,控制和分析,因為這個

模型是否真正解釋了被解釋變量與解釋變量之間的關(guān)系,必須通過對模型的檢驗才能決定。

1.9回歸模型有哪幾個方面的應(yīng)用?

答:歸分析的應(yīng)用非常廣泛,例如在經(jīng)濟領(lǐng)域有廣泛應(yīng)用。1)矩陣理論和計算機技術(shù)的開

展為回歸分析模型在經(jīng)濟研究中的應(yīng)用提供了極大的方便。2)模型技術(shù)在經(jīng)濟問題研究中

的應(yīng)用也在盛行起來。3)近年來,新的研究方法不斷出現(xiàn),如非參數(shù)統(tǒng)計,自助法,刀切

法,經(jīng)驗貝葉斯估計等方法都對法回歸分析起著滲透和促進作用。

由此回歸模型技術(shù)隨著它本身的不斷完善和開展以及應(yīng)用領(lǐng)域的不斷擴大,將在統(tǒng)計學(xué)中

占有更重要的位置,也必將為人類社會的開展起著它獨到的作用。

1.10為什么強調(diào)運用回歸分析研究經(jīng)濟問題要定性分析和定量分析相結(jié)合?

答:因為數(shù)理統(tǒng)計方法只是從事物外在的數(shù)量外表上去研究問題,不涉及事物質(zhì)的規(guī)定性。

單純的外表上的數(shù)量關(guān)系是否反映事物的本質(zhì)?這本質(zhì)研究如何?必須依靠專門學(xué)科的研

究才能下定論。所以,在經(jīng)濟問題的研究中,我們不能僅憑樣本數(shù)據(jù)估計的結(jié)果就不加分

析的說長道短,必須把參數(shù)估計的結(jié)果和具體經(jīng)濟問題以及現(xiàn)實情況緊密結(jié)合,這樣才能

俁證回歸模型在經(jīng)濟問題研究中的正確運用。

2一元線性回歸

2.1一元線性回歸模型有哪些根本假定?

答:1)解釋變量A丫i是確定性變量,不是隨機變量。

2)隨機誤差項具有0均值和等方差,即

耳&)=()〃=12…4

cov(8,&六。'".j)這個假定常稱為高斯-馬爾科夫條件。

1,(£&)=O,(z=j)i,j=1,2,...j?

雙&)=0,即假設(shè)觀測值沒有系統(tǒng)誤差,隨機誤差,的平均值為零。隨機誤差項&的協(xié)方

差為零說明隨機誤差項在不同的樣本點之間是不相關(guān)的(在正態(tài)假定下即為獨立的),不存

在序列相關(guān),并且有相同的精度。

3),正態(tài)分布的假定條件為:

g(~N(0、b),i=

2%考慮過原點的線性回歸模型丫="*工+&/=12"誤差…6仍滿足

根本假定,求目的最小二乘估計。

答:由題知離差平方和為:2=。(力)=七(?—4*為)2,那么回的最小二乘估計及即

1=1

是使得:Q(/?;)=n^nQ(/71)有:號后田[圻*—=。解得:

,Zy「x

2

Yxi

2.3證明為e=o,'X£=0.

!=1;=1

n

證明:由正規(guī)方程:以及殘差:巳="d邛:x,=y1y:

X(y-戊";短》=0

,=1

由以上等式解得:支已=o,txe=0?

i=]i=l

2.4回歸方程£(),)=/?+B、x的參數(shù)人力的最小二乘估計與最大似然估計在

什么條件下等價?給出理由?

答:回歸方程&),)=尸+/J4的參數(shù)國,力的最小二乘估計與最大似然估計在

g~N(O,bb的條件下等價。

證明:設(shè)獲得的n組樣本觀測值為:(不,y),...,(x“,y)那么有:

弘=0。+0\尤+?尸=\2"1那么求氏甲、的最小二乘估計就是滿足使

。(萬。,力)二2(?—孔—0為)一到達最小時的反£。即對

!=1

。(尸?!辏?宜(y[Po-夕MJ求極小值。

/=1

對于極大似然估計,當(dāng)a?N(O,bb時,

v、1()廠〃0一夕1修)一

X的分布密度沏九/力e

.一—二()丁po-6M

似然函數(shù)為:q?。力./)=「[£=(2"4)26-一后一

1=1X

對數(shù)似然函數(shù)為:/=lnL(£o,£[,b~)=Tln(2;Tb)-二二Z(y廠尸(尸為)

'-2b<=i

要求國,力的極大似然估計,即求/的極大值,等價于對工(%一60—四即)‘求極大值。

1=1

由以上可知,在假設(shè)白?MO,bb時,的最小二乘估計與最大似然估計等價。

2.5證明戊是民的無偏估計。

./Z(")y

。,今=『一

曰Ixx

記明:氏,力的最小二乘估計分別為:

A-1t(工一招

0°=y-仇x=£(丁'一)y

,=lIXX

因為x為非隨機變量,y1=0。+0'Xi+&、i=',2'n

E(G=a4y)=B(、+B、%,,=12...〃

解得:石(")=力那么:

得證。

—2

2.6證明var(£>=d+-^-成立。

°〃Z(U

1=1

證明:因為尤為非隨機變量,y=£o+qx+g.,i=1,2…刀,那么,var(y)=b。

2.7證明平方和分解式SST=SSR+SSE.

證明:

2.8驗證三種檢驗的關(guān)系,即證:

證明:

(1)

2.9驗證式子:丫叫)=(1—一(年302

XX

2.10用第9題證明:b八2=W?(y廠y萬是/的無偏估計。

2.11驗證決定系數(shù)/與F之間的關(guān)系式:/=—^―

'F+n-2

以上表達式說明尸與F之間是等價的,那么我們?yōu)槭裁匆謩e引入這兩個統(tǒng)計量,而不是

只使用其中一個?

2二SSR

r~SSE+SSR

SSR(n-2)

-SSR(〃-2)+SSE(〃-2)

…叫SSR(n-2)/SSE

址明:=-----------:—:----------

SSR(n-2)/SSE+(n-2)

SSR/X

SSE/n-2

F

F+n-2

2

(2)雖然〃與F之間是等價的,但我們不能只使用其中的一個,因為這兩個統(tǒng)計量研究的

對象和目的均有所不同°

1)統(tǒng)計量F是用來進行F檢驗,即對線性回歸方程顯著性的一種檢驗,即其研究的是引起

總平方和SST的兩個因素SSR和SSE所占必中的多少,也就是如果回歸平方和SSR越大回

歸的效果越好,回歸方程便更顯著,F(xiàn)的數(shù)值大于1.

2)決定系數(shù)尸=鄴是研究的總體的離差平方和SST中回歸平方和SSR所占的比重,即如

果尸=鄴接近于1,說明因變量不確定性的絕大局部能由回歸方程解釋,回歸方程擬合

優(yōu)度就越好。另外決定系數(shù)尸=鄴的數(shù)值在。與1之間。

'SST

2.12如果把自變量觀測值都乘以2,回歸參數(shù)的最小二乘估計氏'和川會發(fā)生

什么變化?如果把自變量觀測值都加上2,回歸參數(shù)的最小二乘估計由和力:

會發(fā)生什么變化?

答:設(shè)開始時的n組觀測值為:5,y),4x〃,y“),離差平方和為:

0(夕。,尸)=t(%—60—四加)2

f=l

夕。,力的最小二乘估計就是滿足使。(民力)=£(y[Qo—Pi為)2到達最小時的

r=l

伙干;即對。(瓦力)一/(為一4r四方)2求極小值。

/=]

卷后瓦)72廠緇十小。

?

即:%后四)=y(丁廠/-圻樂)為二。

解得:

1)當(dāng)自變量的觀測值均乘以2時,此時的觀測值為:(2弟,y),../2x”,y〃)離差平方和即

為:

2)當(dāng)自變量的觀測值都加上2時,即此時的觀測值為:((X+2),y),...,((x“+2),y〃)離差

平方和為:

2.13如果回歸方程:(二式+力犬相應(yīng)的相關(guān)系數(shù)r很大,那么用它預(yù)測時預(yù)測

誤差一定較小,這一結(jié)論能成立嗎?對你的答復(fù)說明理由。

答:這一結(jié)論不一定能成立。原因如有:

1)當(dāng)樣本量較小時,與前面在講述相關(guān)系數(shù)時所強調(diào)的一樣,此時即使得到一個大的決定

系數(shù),但是這個大的決定系數(shù)很可能是虛假現(xiàn)象。為此,可以結(jié)合樣本量和自變量個數(shù)對

決定系數(shù)做調(diào)整,計算調(diào)整的決定系數(shù)。

2)即使樣本量并不小,決定系數(shù)很大,例如是0.9,也并不能肯定自變量和因變量之間的

關(guān)系是線性的,這是因為有可能曲線回歸的效果更好。尤其是當(dāng)自變量的取值范圍很窄時,

線性回歸的效果通常是較好的,這樣的回歸方程是不能用于外推預(yù)測的。模型失擬檢驗來

判定因變量與自變量之間的真實函數(shù)關(guān)系,到底是線性關(guān)系還是曲線關(guān)系,如果是曲線關(guān)

系到底是哪一種曲線關(guān)系,這是可以用殘差分析方法來判斷回歸方程的正確性。

3)反之,當(dāng)算出一個很小的決定系數(shù)尸,例如尸習(xí)時,與相關(guān)系數(shù)的顯著性檢驗相似,

這時如果樣本量U不大,就會得到線性回歸不顯著的檢驗結(jié)論,而在樣本容量“很大時,

檢驗結(jié)果仍然會得出線性回歸顯著的結(jié)論,不管檢驗結(jié)果是否顯著,這時都應(yīng)該嘗試改良

回歸的效果,例如增加自變量,改用曲線回歸等。

2.14為了調(diào)查某廣告對銷售收入的影響,某商店記錄了5個月的銷售收入v

〔萬元〕和廣告費用x(萬元〕,數(shù)據(jù)見表2.6,

表2.6

月12345

xI2345

y10102020

40

1〕畫散點圖;

2)x與y之間是否大致呈線性關(guān)系?

3)用最小二乘估計求出回歸方程;

4)求回歸標準誤差。;

5)給出尸;與尸;的置信度為95%的區(qū)間估計;

6)計算x與y的決定系數(shù);

7)對回歸方程作方差分析;

8)對回歸系數(shù)修顯著性的檢驗;

9)做相關(guān)系數(shù)的顯著性檢驗;

10)對回歸方程作殘差圖并作相應(yīng)的分析;

11)對當(dāng)廣告費用為4.2萬元時,銷售收入將到達多少,并給出置信度95%的置信區(qū)間。

答:

1〕利用SPSS軟件,散點圖為:

2〕由圖易知:x與y之間大致呈現(xiàn)線性關(guān)系。

3〕最小二乘估計得到的回歸方程為:

由:

系數(shù)a

非標準化系數(shù)標準系數(shù)B的95.0%置信區(qū)間

模型B標準誤之試用版tSig.下限上限

\(常量)-1.0006.351-.157.885-21.21119.211

X7.0001.915.9043.656.035.90613.094

系數(shù)”

非標準化系數(shù)標準系數(shù)B的950%置信區(qū)間

模型B標準誤差試用版tSig.卜一限上限

1(常量)-1.0006.351-.157.885-21.21119.211

X7.0001.915.9043.656.035.90613.094

a.因變量:y

可以得到回歸方程為:y=-H7x

另外:設(shè)回歸方程為j=片十%x

Y^y^nxy

*1

XV一〃(4

J=1

同樣可得回歸方程為-1+7x

4)求回歸標準誤差。;

模型匯總b

模型RR方調(diào)整R方標準估計的誤差

1.904u.817.7566.0553()

a.預(yù)測變量:(常量).x。

b因變量:y

由以上可以知道:回歸標準誤差0=6.00530,Q-2=6.00530*6.00530=36.0636,另外:

_1F(1O-(-1+7x1))2+(10-(-1+7x2))2+(20-(-1+7x3))r

-3|_+(20-(-1+7x4)>+(40-(-1+7x5))2

同樣可得。

5〕給出??;與萬;的置信度為95%的區(qū)間估計;

系數(shù)”

模型非標準化系數(shù)標準系數(shù)B的95.0%置信區(qū)間

B標準誤差試用版tSig.下限上限

1(常量)-1.0006.351-.157.885-21.21119.211

X7.(XX)1.915.9043.656.035.90613.094

a.因變量:y

由以上可以知道:給出£;與£;的置信度為95%的區(qū)間估計分別為:(0.906,13.094)

(-21.211,19.211)

6)x與y的決定系數(shù);

模型匯總b

更改統(tǒng)計量

模型R方更改F更改dfldf2Sig.F更改

1.81713.36413.035

日SPSS軟件,可以知道x與y的決定系數(shù)為:尸=0.817

7)由SPSS軟件可以得到回歸方程作方差分析為:

Anovab

模型平方和df均方FSig.

1回歸490.0001490,00013.364.035a

殘差110.000336.667

總計600.0004

a.預(yù)測變量:(常量),x°

b.因變量:y

由方差分析表可得:F=13.364,顯著性Sig=0.035,說明y對x的線性關(guān)系顯著,

8)對回歸系數(shù)顯著性的檢驗

八21n1n八2

其中。二百92=一32

???接受原假設(shè)H0;1=0,認為4顯著不為0,因變量y對自變量x的一元線性回歸成立。

9)做相關(guān)系數(shù)的顯著性檢驗

”.■

工(為一刀)(丫一)')T

相關(guān)系數(shù)r=「=一^

|nn-1J

歸…A

Vi=lr=l

70_7

?0.904

710x600-V60

r小于表中a=1%的相應(yīng)值同時大于表中a=5%的相應(yīng)值,.二x與y有顯著的線性關(guān)系.

10)對回歸方程作殘差圖并作相應(yīng)的分析;

殘差圖如下:

從圖上看,殘差是圍繞e=()隨機波動,從而模型的根本假定是滿足的。

散點圖

因變量:y

1.0-o

O

|>3>|

^O

O

O

IIIIIII

?1.5-1.0-0.50.00.51.01.5

回回標準化預(yù)計值

11)對當(dāng)廣告費用為4.2萬元時,銷售收入將到達多少,并給出置信度的置信區(qū)間。

當(dāng)廣告費與二4.2萬元時,銷售收入),。=28.4萬元,置信度為95%的置信區(qū)間

近似為,±20,即(17.1,39.7)

2.15一家保險公司十分關(guān)心其總公司營業(yè)部加班的程度,決定認真調(diào)查一次現(xiàn)

狀,經(jīng)過10周時間,收集了每周加班工作時間的數(shù)據(jù)和簽發(fā)的新保單數(shù)目,x

為每周簽發(fā)的新保單數(shù)目,Y為每周加班工作時間〔小時〕,

表2.7

周序號123456789

10

X82521510705504809201350325670

1215

y3.51.04.02.01.03.04.51.53.0

5.0

1)畫散占圖.

2)x與;之高是否大致呈線性關(guān)系?

3)用最小二乘估計求出回歸方程;

4)求回歸標準誤差。:

5〕給出〃;與〃:的置信度為95%的區(qū)間估計;

6)計算x與y的決定系數(shù);

7)對回歸方程作方差分析;

8)對回歸系數(shù)四顯著性的檢驗;

9)做相關(guān)系數(shù)的顯著性檢驗;

10)對回歸方程作殘差圖并作相應(yīng)的分析;

11)該公司預(yù)計下一周簽發(fā)新保單H=1OOO張,需要加班的時間是多少?

12)給出y。的置信水平為95%精確預(yù)測區(qū)間和近似預(yù)測區(qū)間;

13)給出E(y。)置信水平95%的區(qū)間估計。

答:

1〕畫散點圖;

由SPSS軟件,得到散點圖如下:

2)x與y之間是否大致呈線性關(guān)系?

由散點圖易知,x與y大致呈線性關(guān)系。

3)用最小二乘估計求出回歸方程;

系數(shù)a

非標準化系數(shù)標準系數(shù)

模型B標準誤差試用版tSig.

1(常量).118.355.333.748

每周簽發(fā)的新保單數(shù)目.004.000.9498.509.000

a.因變量:每周加班工作時間

由系數(shù)表可知,用最小二乘估計求出的回歸方程為:y=0.118+0.004x

4)求回歸標準誤差。;

模型匯總b

模型RR方調(diào)整R方標準估計的誤差

1.949a.900.888.48002

a.預(yù)測變量:(常量),每周簽發(fā)的新保單數(shù)目。

b.因變量:每周加班工作時間

由模型匯總表可以知道,標準回歸誤差。為:0.4800.

5)給出民與力的置信度為95%的區(qū)間估計;

系數(shù)a

B的95.0%置信區(qū)間

模型下限上限

1(常量)-.701.937

每周簽發(fā)的新保單數(shù)目.003.005

a.因變量:每周加班工作時間

由上表可以知道:常數(shù)項的置信度為95%的區(qū)間估計為(-0.701,0.937),回歸系數(shù)的置

信度為95%的區(qū)間估計為(0.003,0.005Jo

6)計算x與y的決定系數(shù);

工人-

x與y的決定系數(shù)戶=弋1-------=一’agog

-—、218.525

r=l

7)對回歸方程作方差分析;

由SPSS做出的方差分析如下:由方差分析表可得,F(xiàn)=72.396,顯著性Sig=0.000,說明y

對x的線性關(guān)系顯著。

Anovab

模型平方和df均方FSig.

1回歸16.682116.68272.396.000a

殘差1.8438.230

總計18.5259

a.預(yù)測變量:(常量),每周簽發(fā)的新保單數(shù)目。

b.因變量:每周加班工作時間

8)對回歸系數(shù)目顯著性的檢驗;

人21n1n八2

其中。

VU9.XX

???接受原假設(shè)H。邙、=0,認為4顯著不為0,因變量y對自變量x的一元線性回歸成立。

9)做相關(guān)系數(shù)的顯著性檢驗;

4653

71297860x18.525

r小于表中a=l%的相應(yīng)值同時大于表中a=5%的相應(yīng)值,,x與y有顯著的線性關(guān)系.

10)對回歸方程作殘差圖并作相應(yīng)的分析;

從圖上看,殘差是圍繞e=O隨機波動,從而模型的根本假定是滿足的

11)該公司預(yù)計下一周簽發(fā)新保單乂印000張,需要加班的時間是多少?

將尢o=IOOO,代入回歸方程中,得到y(tǒng);=3.7小時。

12)給出乂的置信水平為95%精確預(yù)測區(qū)間和近似預(yù)測區(qū)間;

%的置信概率為的置信區(qū)間精確為y°±匕2(〃-2)J1+%。,

即為(2.7,4.7)

近似置信區(qū)間為:£±2。,即(2.74,4.66)

13)給出E〔丁?!持眯潘降膮^(qū)間估計。

可得置信水平為的置信區(qū)間為1土%2(〃-2)匹即為(3.33,4.07)

2.16,表2.8是1985年美國50個州和哥倫比業(yè)特區(qū)公立學(xué)校中教師的人均年工

資y〔美元〕和學(xué)生的人均經(jīng)費收入x(美元〕。

1)繪制y對x的散點圖,可以用直線回歸描述兩者之間的關(guān)系嗎?

2)建立y對x的線性回歸;

3)用線性回歸的Plots功能繪制標準殘差的直方圖和正態(tài)概率圖,檢驗誤差項的正態(tài)性假

設(shè)。

表2?8

序號yX序號)'X序號y%

11958333461820816305935195382642

22026331141918095296736204603124

32032535542020939328537214192752

42680045422122644391438251603429

52947046692224624451739224823947

62661048882327186434940209692509

73067857102433990502041272245440

82717055362523382359442258924042

92585341682620627282143226443402

102450035472722795336644246402829

112427431592821570292045223412297

122717036212922080298046256102932

133016837823022250373147260153705

142652542473120940285348257884123

152736039823221800253349291323608

162169035683322934272950414808349

172197431553418443230551258453766

答:

1)繪制y對x的散點圖,可以用直線回歸描述兩者之間的關(guān)系嗎?

由SPSS軟件可以得到散點圖如下:

由散點圖可以知道,y與x大致呈線性關(guān)系,因此可以用直線回歸描述兩者之間的關(guān)系。

2)建立y對x的線性回歸;

系數(shù)"

非標準化系數(shù)標準系數(shù)

模型B標準誤差試用版tSig.

1(常量)12112.6291197.76810.113.000

X3.314.312.83510.621.000

a.因變量:Y

由系數(shù)表可知,用最小二乘估計求出的回歸方程為:y=12112.629+3.314x

3)用線性回歸的Plots功能繪制標準殘差的直方圖和正態(tài)概率圖,檢驗誤差項的正態(tài)性假

設(shè)。

從圖上可看出,檢驗誤差項服從正本分布。

3多元線性回歸

3.1寫出多元線性回歸模型的矩陣表示形式,并給出多元線性回歸模型的根本

假設(shè)。

答:多元線性回歸模型的矩陣表示形式如下:

多元線性回歸模型的根本假定:

(1)解釋變量%,工2,...,.是確定性變量,不是隨機變量,樣本容量的個數(shù)應(yīng)大于解釋變

量的個數(shù)。

(2)隨機誤差項具有。均值和等方差,即

的)二°,,=12

C卜=/,(,=7)這個假定常稱為高斯-馬爾科夫條件。

c!v(£j,£/)=0,(,=j)i,j=1,2,...,〃

£?(&)=(),即假設(shè)觀測值沒有系統(tǒng)誤差,隨機誤差,的平均值為零。隨機誤差項;的協(xié)方

差為零說明隨機誤差項在不同的樣本點之間是不相關(guān)的(在正態(tài)假定下即為獨立的),不存

在序列相關(guān),并且有相同的精度。

(3),正態(tài)分布的假定條件為:

N(O,b),i=1,2,…,〃

3.12討論樣本容量n與自變量個數(shù)p的美系,它們對模型的參數(shù)估計有何影響?

答:n>p+l。即設(shè)計矩陣X中的自變量之間不相關(guān)。樣本容量的個數(shù)應(yīng)該大于解釋變量的個

數(shù)。又因為X為滿秩矩陣,得證。

rrA2=—!—SSE2

3.3證明〃-是誤差項。的無偏估計。

證明:

3.4一個回歸方程的復(fù)相關(guān)系數(shù)R=0.99,樣本決定系數(shù)尺2二0.9801我們能判斷

這個回歸方程就很理想嗎?

答:我們并不能判斷這個回歸模型很理想。因為當(dāng)樣本容量N較小,變量個數(shù)P較大時,F(xiàn)

檢驗或者t檢驗的自由度太小,這時較多會造成樣本系數(shù)A,很大的虛假現(xiàn)象。此時,如果

樣本容量再稍微改變,位置參數(shù)會發(fā)生.較大變化即,參數(shù)估計的效果很不穩(wěn)定。

3.5如何正確理解回歸方程顯著性檢驗拒絕"八接受"。?

答:一般來說,當(dāng)接受假設(shè)“。時,認為在給定的顯著性水平。之下,自變量/,至,…,樂

對因變量y無顯著性影響,于是通過月,無,…,與去推斷y無多大意義。在這種情況下,一

方面可能這個問題本來應(yīng)該用非線性模型去描述,而我們無用線性模型描述了,使得自變

量對因變量無顯著影響;另一方面,很可能是在考慮自變量時,由于我們認識上的局限性

把一些影響因變量y的自變量漏掉了。

當(dāng)我們拒絕了假設(shè)“。時,我們也不能過于相信這個檢驗,認為這個回歸模型己經(jīng)很完

美了,其實,當(dāng)我們拒絕“。時,我們只能認為這個回歸模型在一定程度上說明了自變量

月與因變量y的線性關(guān)系。因此這時仍不能排除我們漏掉了一些重要的自變量。

此檢驗只宜用于輔助性的,事后驗證性質(zhì)的目的。研究者在事前根據(jù)專業(yè)知識及經(jīng)驗,

認為已把較重要的自變量選入了,可以用來驗證原先的考慮是否周全。這時,假設(shè)拒絕,

可認為至少并不與原來的設(shè)想矛盾。如果接受””,可以肯定模型是不能反映因變量y與

自變量%,%,...,%〃的線性關(guān)系的,這個模型就不能應(yīng)用于實際預(yù)測和分析。

3.6數(shù)據(jù)中心化和標準化在回歸分析中的意義是什么?

答:原始數(shù)據(jù)由于自變量的單位往往不同,會給分析芍來一定的困難;又由于設(shè)計的數(shù)據(jù)

量較大,可能會以為舍入誤差而使得計算結(jié)果并不理想。中心化和標準化回歸系數(shù)有利于

涓除由于量綱不同、數(shù)量級不同帶來的影響,防止不必要的誤差。

A

3.7驗證〔3.5〕式四瓦加卬

證明:

.二八2一八

r12.3'I2~~

3.8利用〔3.60〕式證明(3,61]式成立,即WRfJ

證明:

3.9證明y與自變量無的偏決定系數(shù)與〔3.42)偏F檢驗值居是等價的。

證明:

由上兩式可知,其考慮的都是通過ASS與在總體中所占比例來衡量第j個因素的重要程度,

因而鳥與廳是等價的。

,F(xiàn)

.R=-----------------------------

3.10驗證決定系數(shù)R與F值之間的關(guān)系式:尸+("

證明:

3.11研究貨運總量y〔萬噸〕與工業(yè)總產(chǎn)值為1億元),農(nóng)業(yè)總產(chǎn)值至(億元),居民非

商品支出工1億元)的關(guān)系,數(shù)據(jù)見表39

表3.9

編號貨運總量工業(yè)總產(chǎn)值農(nóng)業(yè)總產(chǎn)值居民非商品支

y(萬噸)X1(億元)x2(億元)出x3(億元)

116070351.0

226075402.4

321065402.0

426574423.0

524072381.2

622068451.5

727578424.0

816066362.0

9275704442

1025065423.0

1)計算出y,左,無,乂的相關(guān)系數(shù)矩陣;

2)求y關(guān)于無,劉,劉的三元先行回歸方程;

3)對所求得的方程作擬合優(yōu)度檢驗;

4〕對回歸方程作顯著性檢驗;

5)對每一個回歸系數(shù)作顯著性檢驗;

6)如果有的回歸系數(shù)沒通過顯著性檢驗,將其剔除,重新建立回歸方程,再作回歸方程的

顯著性檢驗和回歸系數(shù)的顯著性檢驗;

7)求出每一個回歸系數(shù)的置信水平為95%的置信區(qū)間;

8)求標準化方程;

9)求當(dāng)月=75,后=42,吩=3.1時的訃給定置信水平為95%,用SPSS軟件計算精

確置信區(qū)間,用手工計算近似預(yù)測區(qū)間;

10)結(jié)合回歸方程對問題作一些根本分析。

答:

1〕計算出y,x1,x2,x3的相關(guān)系數(shù)矩陣

由SPSS軟件可得相關(guān)分析結(jié)果如下:

相關(guān)性

居民非商品支出

貨運總量y工業(yè)總產(chǎn)值xl農(nóng)業(yè)總產(chǎn)值x2x3

貨運總量yPearson相關(guān)性1.556.731*.724*

顯著性(雙側(cè):.095.016.018

平方與叉積的和16952.500965.50()934.000273.050

協(xié)方差1883.611107.278103.77830.339

N10101010

工業(yè)總產(chǎn)值xlPearson相關(guān)性.5561,113.398

顯著性(雙側(cè):.095.756.254

平方與叉積的和965.500178.10014.80015,410

協(xié)方差107.27819.7891.6441.712

N10101010

農(nóng)業(yè)總產(chǎn)值x2Pearson相關(guān)性.73r.1131.547

顯著性(雙側(cè):.016.756,101

平方與叉積的和934.00014.80096.40015.580

協(xié)方差103.77

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負責(zé)。
  • 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔(dān)用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

評論

0/150

提交評論