版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進(jìn)行舉報(bào)或認(rèn)領(lǐng)
文檔簡介
統(tǒng)計(jì)學(xué)主編:費(fèi)宇、石磊(第二版)1/5/20231《統(tǒng)計(jì)學(xué)》第3章參數(shù)估計(jì)第6章回歸分析6.1相關(guān)分析6.2一元線性回歸6.3多元線性回歸6.4虛擬變量回歸6.5Logistic回歸6.6回歸分析的擴(kuò)展6.7可化為線性情形的非線性回歸1/5/20232《統(tǒng)計(jì)學(xué)》第3章參數(shù)估計(jì)【引例6.0】(數(shù)據(jù)文件為example6.0)某公司經(jīng)理想研究公司員工的年薪問題,根據(jù)初步分析,他認(rèn)為員工的當(dāng)前年薪y(tǒng)(元)與員工的開始年薪x1(元)、在公司的工作時(shí)間x2(月)、先前的工作經(jīng)驗(yàn)x3(月)和受教育年限x4(年)有關(guān)系,他隨機(jī)抽樣調(diào)查了36個(gè)員工,收集到以下數(shù)據(jù),如表6.1所示。1/5/20233《統(tǒng)計(jì)學(xué)》第3章參數(shù)估計(jì)1/5/20234《統(tǒng)計(jì)學(xué)》第3章參數(shù)估計(jì)問題經(jīng)理想根據(jù)以上樣本數(shù)據(jù),構(gòu)建一個(gè)模型來反映y與x1、x2、x3和x4之間關(guān)系,并希望利用該模型在給定一個(gè)員工的x2、x3和x4的條件下,預(yù)測該員工的當(dāng)前年薪y(tǒng)。此外,經(jīng)理認(rèn)為,公司男女員工的薪水結(jié)構(gòu)不同,他想在建立模型的時(shí)候能把性別因素考慮進(jìn)來,這是否可行?1/5/20235《統(tǒng)計(jì)學(xué)》第3章參數(shù)估計(jì)6.1相關(guān)分析6.1.1相關(guān)的概念1.人的身高與體重有相關(guān)關(guān)系。2.居民可支配收入與支出有相關(guān)關(guān)系。3.糧食產(chǎn)量與施肥量有相關(guān)關(guān)系。1/5/20236《統(tǒng)計(jì)學(xué)》第3章參數(shù)估計(jì)6.1.2相關(guān)的種類1.按相關(guān)程度劃分:分為完全相關(guān)、不完全相關(guān)和不相關(guān);如圖6.1所示。2.按相關(guān)方向劃分:分為正相關(guān)和負(fù)相關(guān)。如圖6.2所示。3.按相關(guān)形式劃分:分為線性相關(guān)和非線性相關(guān);如圖6.3所示。4.按變量多少劃分:分為簡單相關(guān)和復(fù)相關(guān)。1/5/20237《統(tǒng)計(jì)學(xué)》第3章參數(shù)估計(jì)6.1.3相關(guān)關(guān)系的度量1.簡單線性相關(guān)系數(shù)1/5/20238《統(tǒng)計(jì)學(xué)》第3章參數(shù)估計(jì)1/5/20239《統(tǒng)計(jì)學(xué)》第3章參數(shù)估計(jì)1/5/202310《統(tǒng)計(jì)學(xué)》第3章參數(shù)估計(jì)2.偏相關(guān)系數(shù)1/5/202311《統(tǒng)計(jì)學(xué)》第3章參數(shù)估計(jì)1/5/2023《統(tǒng)計(jì)學(xué)實(shí)驗(yàn)》第6章回歸分析(數(shù)據(jù)文件為li6.1.sav)為研究初中一年級男生身高x(單位:厘米)、體重z(單位:千克)和肺活量y(單位:升)的關(guān)系,隨機(jī)抽取了16名初一男生測量得有關(guān)數(shù)據(jù)如表6.2所示:表6.2初一男生身高、體重和肺活量的測量值身高x體重z肺活量y身高x體重z肺活量y140.137.02.25162.548.32.75151.538.53.0165.542.52.5161.242.13.25148.036.52.25172.846.53.25165.845.43.25150.038.03.0164.043.53.0153.542.22.75149.539.72.75170.554.53.5159.644.53.0157.037.02.25162.545.03.2【例6.1】1/5/202312《統(tǒng)計(jì)學(xué)》第3章參數(shù)估計(jì)要求:(1)繪制變量散點(diǎn)圖,分析身高x、體重z和肺活量y之間是否存在相關(guān)關(guān)系;(2)計(jì)算簡單相關(guān)系數(shù),分析身高x、體重z和肺活量y的之間是否存在直線相關(guān)關(guān)系;(3)計(jì)算偏相關(guān)系數(shù),分析身高x、體重z和肺活量y的之間的偏相關(guān)關(guān)系。1/5/2023《統(tǒng)計(jì)學(xué)實(shí)驗(yàn)》第6章回歸分析【例6.1】1/5/202313《統(tǒng)計(jì)學(xué)》第3章參數(shù)估計(jì)
解:
(1)畫散點(diǎn)圖,觀察身高x、體重z和肺活量y之間的相關(guān)關(guān)系1/5/2023《統(tǒng)計(jì)學(xué)實(shí)驗(yàn)》第6章回歸分析1/5/202314《統(tǒng)計(jì)學(xué)》第3章參數(shù)估計(jì)1/5/2023《統(tǒng)計(jì)學(xué)實(shí)驗(yàn)》第6章回歸分析【軟件操作】打開數(shù)據(jù)文件li6.1.sav選擇“圖形(G)”→點(diǎn)擊“舊對話框(L)→“散點(diǎn)/點(diǎn)狀(S)”在“散點(diǎn)圖/點(diǎn)圖”中選“矩陣分布”→點(diǎn)擊“定義”→將身高x、體重z和肺活量y選入“矩陣變量(M)”框中→點(diǎn)擊“確定”,可得圖6.1。1/5/202315《統(tǒng)計(jì)學(xué)》第3章參數(shù)估計(jì)1/5/2023《統(tǒng)計(jì)學(xué)實(shí)驗(yàn)》第6章回歸分析圖6.1身高x、體重z和肺活量y矩陣式散點(diǎn)圖1/5/202316《統(tǒng)計(jì)學(xué)》第3章參數(shù)估計(jì)(2)計(jì)算身高x、體重z和肺活量y之間的相關(guān)系數(shù)1/5/2023《統(tǒng)計(jì)學(xué)實(shí)驗(yàn)》第6章回歸分析1/5/202317《統(tǒng)計(jì)學(xué)》第3章參數(shù)估計(jì)“分析”→點(diǎn)擊“相關(guān)(C)”→“雙變量”(B)將身高x、體重z和肺活量y三個(gè)變量同時(shí)選入“變量”框,在“相關(guān)系數(shù)”框選“Pearson”點(diǎn)擊“確定”即可得如表6.3所示的相關(guān)系數(shù)。1/5/2023《統(tǒng)計(jì)學(xué)實(shí)驗(yàn)》第6章回歸分析【軟件操作】1/5/202318《統(tǒng)計(jì)學(xué)》第3章參數(shù)估計(jì)1/5/2023《統(tǒng)計(jì)學(xué)實(shí)驗(yàn)》第6章回歸分析表6.3初一男生身高、體重和肺活量的相關(guān)系數(shù)表相關(guān)性身高,cm體重,kg肺活量,L身高(cm)Pearson相關(guān)性1.810**.650**顯著性(雙側(cè)).000.006N161616體重(kg)Pearson相關(guān)性.810**1.707**顯著性(雙側(cè)).000.002N161616肺活量(L)Pearson相關(guān)性.650**.707**1顯著性(雙側(cè)).006.002N161616**.在.01水平(雙側(cè))上顯著相關(guān)。1/5/202319《統(tǒng)計(jì)學(xué)》第3章參數(shù)估計(jì)(3)計(jì)算偏相關(guān)系數(shù),分析身高x、體重z和肺活量y的之間的偏相關(guān)關(guān)系1/5/2023《統(tǒng)計(jì)學(xué)實(shí)驗(yàn)》第6章回歸分析1/5/202320《統(tǒng)計(jì)學(xué)》第3章參數(shù)估計(jì)選擇“分析(A)”→點(diǎn)擊“相關(guān)(C)”→“偏相關(guān)(R)”將身高x和肺活量y兩個(gè)變量同時(shí)選入“變量”框,再將控制變量體重z選入“控制(C)”框中點(diǎn)擊“確定”即可得相關(guān)系數(shù)表表6.4。1/5/2023《統(tǒng)計(jì)學(xué)實(shí)驗(yàn)》第6章回歸分析【軟件操作】1/5/202321《統(tǒng)計(jì)學(xué)》第3章參數(shù)估計(jì)1/5/2023《統(tǒng)計(jì)學(xué)實(shí)驗(yàn)》第6章回歸分析表6.4初一男生身高、體重和肺活量偏相關(guān)系數(shù)表相關(guān)性控制變量身高,cm肺活量,L體重,kg身高,cm相關(guān)性1.000.186顯著性(雙側(cè))..508df013肺活量,L相關(guān)性.1861.000顯著性(雙側(cè)).508.df1301/5/202322《統(tǒng)計(jì)學(xué)》第3章參數(shù)估計(jì)6.2一元線性回歸6.2.1回歸的含義回歸(regression)一詞最早由英國生物學(xué)家兼統(tǒng)計(jì)學(xué)家高爾頓(F.Galton)于1886年在論文“Regressiontowardsmediocrityinhereditarystature”中正式提出?;貧w分析(regressionanalysis)是通過建立回歸模型來研究相關(guān)變量的關(guān)系并作出相應(yīng)估計(jì)和預(yù)測的一種統(tǒng)計(jì)方法,1/5/202323《統(tǒng)計(jì)學(xué)》第3章參數(shù)估計(jì)6.2.2一元線性回歸1/5/202324《統(tǒng)計(jì)學(xué)》第3章參數(shù)估計(jì)1/5/202325《統(tǒng)計(jì)學(xué)》第3章參數(shù)估計(jì)6.2.3最小二乘估計(jì)圖6.4x和y的散點(diǎn)圖1/5/202326《統(tǒng)計(jì)學(xué)》第3章參數(shù)估計(jì)1/5/202327《統(tǒng)計(jì)學(xué)》第3章參數(shù)估計(jì)1/5/202328《統(tǒng)計(jì)學(xué)》第3章參數(shù)估計(jì)1/5/202329《統(tǒng)計(jì)學(xué)》第3章參數(shù)估計(jì)1/5/202330《統(tǒng)計(jì)學(xué)》第3章參數(shù)估計(jì)1/5/202331《統(tǒng)計(jì)學(xué)》第3章參數(shù)估計(jì)【例6.2】(數(shù)據(jù)文件為example6.2)已知我國2007年31個(gè)地區(qū)城鎮(zhèn)居民年人均可支配收入和年人均消費(fèi)性支出數(shù)據(jù)如表6.5(單位:元),試分析城鎮(zhèn)居民年人均可支配收入和年人均消費(fèi)性支出之間的關(guān)系,如果有線性相關(guān)關(guān)系,試建立一元線性回歸模型。1/5/202332《統(tǒng)計(jì)學(xué)》第3章參數(shù)估計(jì)1/5/202333《統(tǒng)計(jì)學(xué)》第3章參數(shù)估計(jì)解:1.先畫散點(diǎn)圖,打開數(shù)據(jù)文件example6.2,點(diǎn)擊“圖形”→點(diǎn)擊“舊對話框”→點(diǎn)擊“散點(diǎn)/點(diǎn)狀”→點(diǎn)擊“簡單分布”,點(diǎn)擊“定義”,將兩個(gè)變量年人均可支配收入x和年人均消費(fèi)性支出y分別選入“X軸”和“Y軸”,點(diǎn)“確定”即可得散點(diǎn)圖,如圖6.5所示。1/5/202334《統(tǒng)計(jì)學(xué)》第3章參數(shù)估計(jì)圖6.5人均可支配收入x和人均消費(fèi)性支出y散點(diǎn)圖
1/5/202335《統(tǒng)計(jì)學(xué)》第3章參數(shù)估計(jì)2.計(jì)算相關(guān)系數(shù)點(diǎn)擊“分析”→點(diǎn)擊“相關(guān)”→點(diǎn)擊“雙變量”,將兩個(gè)變量年人均可支配收入x和年人均消費(fèi)性支出y同時(shí)選入“變量”,在“相關(guān)系數(shù)”中選“Pearson”,點(diǎn)“確定”即可得相關(guān)系數(shù)表,如表6.6所示。1/5/202336《統(tǒng)計(jì)學(xué)》第3章參數(shù)估計(jì)表6.6年人均可支配收入和年人均消費(fèi)性支出的相關(guān)系數(shù)表相關(guān)性可支配收入消費(fèi)支出可支配收入Pearson相關(guān)性1.976**顯著性(雙側(cè)).000N3131消費(fèi)支出Pearson相關(guān)性.976**1顯著性(雙側(cè)).000N3131**.在.01水平(雙側(cè))上顯著相關(guān)。1/5/202337《統(tǒng)計(jì)學(xué)》第3章參數(shù)估計(jì)3.作一元線性回歸點(diǎn)擊“分析”→點(diǎn)擊“回歸”→點(diǎn)擊“線性”,將自變量年人均可支配收入x選入“自變量”,再將因變量年人均消費(fèi)性支出y選入“因變量”中,然后選擇“方法”為默認(rèn)值“進(jìn)入”,點(diǎn)“確定”即可得表6.7和表6.8。1/5/202338《統(tǒng)計(jì)學(xué)》第3章參數(shù)估計(jì)表6.7年人均可支配收入和年人均消費(fèi)性支出的方差分析表Anovaa模型平方和df均方FSig.1回歸182436901.3701182436901.370583.144.000b殘差9072666.76529312850.578總計(jì)191509568.13530a.因變量:消費(fèi)支出b.預(yù)測變量:(常量),可支配收入。1/5/202339《統(tǒng)計(jì)學(xué)》第3章參數(shù)估計(jì)表6.8年人均可支配收入和年人均消費(fèi)性支出的回歸方程系數(shù)表系數(shù)a模型非標(biāo)準(zhǔn)化系數(shù)標(biāo)準(zhǔn)系數(shù)tSig.B標(biāo)準(zhǔn)誤差試用版1(常量)450.334388.9061.158.256可支配收入.692.029.97624.148.000a.因變量:消費(fèi)支出1/5/202340《統(tǒng)計(jì)學(xué)》第3章參數(shù)估計(jì)6.2.4回歸方程的檢驗(yàn)1/5/202341《統(tǒng)計(jì)學(xué)》第3章參數(shù)估計(jì)1.F檢驗(yàn)1/5/202342《統(tǒng)計(jì)學(xué)》第3章參數(shù)估計(jì)1/5/202343《統(tǒng)計(jì)學(xué)》第3章參數(shù)估計(jì)1/5/202344《統(tǒng)計(jì)學(xué)》第3章參數(shù)估計(jì)1/5/202345《統(tǒng)計(jì)學(xué)》第3章參數(shù)估計(jì)2.t檢驗(yàn)1/5/202346《統(tǒng)計(jì)學(xué)》第3章參數(shù)估計(jì)3.r檢驗(yàn)1/5/202347《統(tǒng)計(jì)學(xué)》第3章參數(shù)估計(jì)1/5/202348《統(tǒng)計(jì)學(xué)》第3章參數(shù)估計(jì)【例6.3】給定顯著水平,對例6.2的回歸方程進(jìn)行檢驗(yàn)。解:用SPSS打開數(shù)據(jù)文件example6.2,選擇點(diǎn)擊“分析”→點(diǎn)擊“回歸”→點(diǎn)擊“線性”,將自變量年人均可支配收入x選入“自變量”,再將因變量年人均消費(fèi)性支出y選入“因變量”中,然后選擇“方法”為默認(rèn)值“進(jìn)入”,點(diǎn)“確定”即可得表6.7、表6.8和表6.10。1/5/202349《統(tǒng)計(jì)學(xué)》第3章參數(shù)估計(jì)1/5/202350《統(tǒng)計(jì)學(xué)》第3章參數(shù)估計(jì)1/5/202351《統(tǒng)計(jì)學(xué)》第3章參數(shù)估計(jì)6.2.5估計(jì)與預(yù)測1/5/202352《統(tǒng)計(jì)學(xué)》第3章參數(shù)估計(jì)1/5/202353《統(tǒng)計(jì)學(xué)》第3章參數(shù)估計(jì)圖6.6回歸預(yù)測的預(yù)測區(qū)間1/5/202354《統(tǒng)計(jì)學(xué)》第3章參數(shù)估計(jì)6.3多元線性回歸6.3.1多元線性回歸模型1/5/202355《統(tǒng)計(jì)學(xué)》第3章參數(shù)估計(jì)引入矩陣符號
1/5/202356《統(tǒng)計(jì)學(xué)》第3章參數(shù)估計(jì)1/5/202357《統(tǒng)計(jì)學(xué)》第3章參數(shù)估計(jì)1/5/202358《統(tǒng)計(jì)學(xué)》第3章參數(shù)估計(jì)6.3.2多元線性回歸方程的檢驗(yàn)1/5/202359《統(tǒng)計(jì)學(xué)》第3章參數(shù)估計(jì)1/5/202360《統(tǒng)計(jì)學(xué)》第3章參數(shù)估計(jì)2.方程顯著性檢驗(yàn)1/5/202361《統(tǒng)計(jì)學(xué)》第3章參數(shù)估計(jì)1/5/202362《統(tǒng)計(jì)學(xué)》第3章參數(shù)估計(jì)表6.11多元回歸方程顯著性檢驗(yàn)的方差分析表1/5/202363《統(tǒng)計(jì)學(xué)》第3章參數(shù)估計(jì)3.回歸系數(shù)顯著性檢驗(yàn)1/5/202364《統(tǒng)計(jì)學(xué)》第3章參數(shù)估計(jì)【例6.4】(數(shù)據(jù)文件為example6.0)沿用本章引例中的資料,建立多元線性回歸方程并對回歸方程進(jìn)行檢驗(yàn)(給定顯著水平=0.05)。解:(1)先畫散點(diǎn)圖,用SPSS打開數(shù)據(jù)文件example6.0,點(diǎn)擊“圖形”→點(diǎn)擊“舊對話框”→點(diǎn)擊“散點(diǎn)/點(diǎn)狀”,點(diǎn)擊“定義”,將兩個(gè)變量開始年薪和當(dāng)前年薪y(tǒng)分別選入“X軸”和“Y軸”,點(diǎn)擊“確定”即可得散點(diǎn)圖,如圖6.7所示,可以看出開始年薪和當(dāng)前年薪y(tǒng)呈直線相關(guān),同樣可以做y對其它x變量的散點(diǎn)圖幫助判斷。1/5/202365《統(tǒng)計(jì)學(xué)》第3章參數(shù)估計(jì)圖6.7當(dāng)前年薪對開始年薪的散點(diǎn)圖1/5/202366《統(tǒng)計(jì)學(xué)》第3章參數(shù)估計(jì)(2)做多元線性回歸:點(diǎn)擊“分析”→點(diǎn)擊“回歸”→點(diǎn)擊“線性”,將自變量開始年薪、工作時(shí)間、先前工作經(jīng)驗(yàn)和受教育年限選入“自變量”,再將因變量當(dāng)前年薪y(tǒng)選入“因變量”中,然后選擇“方法”為默認(rèn)值“進(jìn)入”,點(diǎn)擊“確定”即可得3個(gè)主要表格(見表6.12至表6.14)。1/5/202367《統(tǒng)計(jì)學(xué)》第3章參數(shù)估計(jì)表6.12員工年薪問題的回歸方程的可決系數(shù)模型匯總模型RR方調(diào)整R方標(biāo)準(zhǔn)估計(jì)的誤差1.959a.919.9097858.180a.預(yù)測變量:(常量),受教育年限,工作時(shí)間,先前工作經(jīng)驗(yàn),開始年薪。1/5/202368《統(tǒng)計(jì)學(xué)》第3章參數(shù)估計(jì)表6.13員工年薪問題的方差分析表Anovaa模型平方和df均方FSig.1回歸21723657594.52745430914398.63287.949.000b殘差1914280929.7793161750997.735總計(jì)23637938524.30635a.因變量:當(dāng)前年薪b.預(yù)測變量:(常量),受教育年限,工作時(shí)間,先前工作經(jīng)驗(yàn),開始年薪。1/5/202369《統(tǒng)計(jì)學(xué)》第3章參數(shù)估計(jì)表6.14員工年薪問題的多元回歸方程回歸系數(shù)表系數(shù)a模型非標(biāo)準(zhǔn)化系數(shù)標(biāo)準(zhǔn)系數(shù)tSig.B標(biāo)準(zhǔn)誤差試用版1(常量)-1613.93811237.288-.144.887開始年薪1.683.130.89712.929.000工作時(shí)間-34.552130.260-.014-.265.793先前工作經(jīng)驗(yàn)-13.00013.788-.056-.943.353受教育年限808.322547.802.1081.476.150a.因變量:當(dāng)前年薪1/5/202370《統(tǒng)計(jì)學(xué)》第3章參數(shù)估計(jì)于是可得如下回歸方程:從回歸方程可以看出:當(dāng)前年薪y(tǒng)與開始年薪x1和受教育年限x4正相關(guān)(回歸系數(shù)為正),這是合理的;但與工作時(shí)間x2和先前工作經(jīng)驗(yàn)x3負(fù)相關(guān)(回歸系數(shù)為負(fù)),這是不合理的,為什么?1/5/202371《統(tǒng)計(jì)學(xué)》第3章參數(shù)估計(jì)3.對回歸方程進(jìn)行檢驗(yàn)。1/5/202372《統(tǒng)計(jì)學(xué)》第3章參數(shù)估計(jì)6.3.3估計(jì)與預(yù)測1.均值E(y0)的估計(jì)1/5/202373《統(tǒng)計(jì)學(xué)》第3章參數(shù)估計(jì)2.個(gè)值
y0的預(yù)測1/5/202374《統(tǒng)計(jì)學(xué)》第3章參數(shù)估計(jì)6.4虛擬變量回歸1/5/202375《統(tǒng)計(jì)學(xué)》第3章參數(shù)估計(jì)【例6.5】在例6.4中,將性別作為虛擬變量引入回歸方程,建立當(dāng)前年薪y(tǒng)關(guān)于受教育年限和性別虛擬變量的線性回歸模型。解:性別x5是虛擬變量,所以這是虛擬變量回歸問題;將性別變量“量化”,x5=0表示男性,x5=1表示女性,統(tǒng)計(jì)模型設(shè)定為1/5/202376《統(tǒng)計(jì)學(xué)》第3章參數(shù)估計(jì)用SPSS打開數(shù)據(jù)文件example6.0,點(diǎn)擊“分析”→點(diǎn)擊“一般線性模型”→點(diǎn)擊“單變量”,將因變量當(dāng)前年薪y(tǒng)選入“因變量”中,把定量自變量受教育年限選入“協(xié)變量”中,把虛擬變量性別選入“固定因子”中,點(diǎn)擊“模型”,在“指定模型”中選“設(shè)定”,再把定量自變量和虛擬變量選入右邊,在“構(gòu)建項(xiàng)”中選“主效應(yīng)”,然后點(diǎn)“繼續(xù)”回到主對話框,在“選項(xiàng)”中的“輸出”中選擇“參數(shù)估計(jì)”,點(diǎn)擊“繼續(xù)”→點(diǎn)擊“確定”即可得如表6.15所示的參數(shù)估計(jì)值表。1/5/202377《統(tǒng)計(jì)學(xué)》第3章參數(shù)估計(jì)表6.15引入性別虛擬變量的線性回歸模型回歸系數(shù)表參數(shù)估計(jì)因變量:當(dāng)前年薪參數(shù)B標(biāo)準(zhǔn)誤差tSig.95%置信區(qū)間下限上限截距[x5=f]-11556.01013143.534-0.8790.386-38296.73215184.712-16840.4816344.927-2.6540.012-29749.332-3931.630[x5=m]0a.....x44434.394915.4784.8440.0002571.8406296.949a.此參數(shù)為冗余參數(shù),將被設(shè)為零。1/5/202378《統(tǒng)計(jì)學(xué)》第3章參數(shù)估計(jì)由表6.15容易得如下回歸方程顯然,這兩條線是截距不同的兩條平行線,截距的差異表示男女職工年薪的差別。1/5/202379《統(tǒng)計(jì)學(xué)》第3章參數(shù)估計(jì)6.5Logistic回歸本節(jié)討論因變量是二值定性變量的回歸,即Logistic回歸。1/5/202380《統(tǒng)計(jì)學(xué)》第3章參數(shù)估計(jì)【例6.6】
(數(shù)據(jù)文件為example6.6)為了研究家庭年收入與是否有私家車的關(guān)系,隨機(jī)調(diào)查了50個(gè)家庭的情況得結(jié)果如表6.16,以是否有私家車為因變量(它是一個(gè)二值定性變量),年收入為自變量建立回歸方程,并估計(jì)年收入為12萬元的家庭有私家車的可能性。1/5/202381《統(tǒng)計(jì)學(xué)》第3章參數(shù)估計(jì)表6.16抽樣調(diào)查得到的50個(gè)家庭的數(shù)據(jù)資料1/5/202382《統(tǒng)計(jì)學(xué)》第3章參數(shù)估計(jì)1/5/202383《統(tǒng)計(jì)學(xué)》第3章參數(shù)估計(jì)1/5/202384《統(tǒng)計(jì)學(xué)》第3章參數(shù)估計(jì)利用SPSS軟件實(shí)現(xiàn)Logistic回歸具體操作如下:打開數(shù)據(jù)文件example6.6,選擇“分析”→“回歸”→“二元Logistic”,將因變量y選入“因變量”中,把自變量x選入“協(xié)變量”中,點(diǎn)擊“確定”即可得參數(shù)估計(jì)表,如表6.17所示。1/5/202385《統(tǒng)計(jì)學(xué)》第3章參數(shù)估計(jì)表6.17Logistic回歸方程回歸系數(shù)表方程中的變量BS.E,WalsdfSig.Exp(B)步驟1ax1.6890.5369.94310.0025.412常量-21.7646.77610.31710.0010.000a.在步驟1中輸入的變量:x.1/5/202386《統(tǒng)計(jì)學(xué)》第3章參數(shù)估計(jì)如果要估計(jì)年收入為12萬元的家庭有私家車的可能性,可以打開數(shù)據(jù)文件example6.7,在x變量末尾增加一個(gè)值12,點(diǎn)擊“分析”→點(diǎn)擊“回歸”→點(diǎn)擊“二元Logistic”,將因變量y選入“因變量”中,把自變量x選入“協(xié)變量”中,點(diǎn)擊“保存”,在“預(yù)測值”里選“概率”,返回主對話框,點(diǎn)擊“確定”,在原數(shù)據(jù)文件里就會(huì)得到一列預(yù)測值(PRE_1),對應(yīng)于x=12的PRE值為0.18237,這就是年收入為12萬元的家庭有私家車的可能性的估計(jì)值。1/5/202387《統(tǒng)計(jì)學(xué)》第3章參數(shù)估計(jì)6.6回歸分析的擴(kuò)展6.6.1異方差1.異方差的概念1/5/202388《統(tǒng)計(jì)學(xué)》第3章參數(shù)估計(jì)異方差的三種類型(1)單調(diào)遞增型:隨的增大而增大;(2)單調(diào)遞減型:隨的增大而減?。?3)復(fù)雜型:隨的的變化呈復(fù)雜形式變化。1/5/202389《統(tǒng)計(jì)學(xué)》第3章參數(shù)估計(jì)圖6.8異方差的類型1/5/202390《統(tǒng)計(jì)學(xué)》第3章參數(shù)估計(jì)2.異方差的修正1/5/202391《統(tǒng)計(jì)學(xué)》第3章參數(shù)估計(jì)加權(quán)最小二乘(WLS)估計(jì)1/5/202392《統(tǒng)計(jì)學(xué)》第3章參數(shù)估計(jì)1/5/202393《統(tǒng)計(jì)學(xué)》第3章參數(shù)估計(jì)【例6.7】在例6.4中,求當(dāng)前年薪y(tǒng)
(元)關(guān)于開始年薪x1(元)的線性回歸方程。1/5/202394《統(tǒng)計(jì)學(xué)》第3章參數(shù)估計(jì)解:用SPSS打開數(shù)據(jù)文件example6.0,做的散點(diǎn)圖圖6.7,容易看出模型存在異方差性,因此先用OLS法求的估計(jì),點(diǎn)擊“分析”→點(diǎn)擊“回歸”→點(diǎn)擊“線性”,將自變量開始年薪選入“自變量”,再將因變量當(dāng)前年薪y(tǒng)選入“因變量”中,然后選擇“方法”為默認(rèn)值“進(jìn)入”,點(diǎn)擊“保存”,在“殘差”中選“未標(biāo)準(zhǔn)化”(將回歸殘差保存到原數(shù)據(jù)文件中),點(diǎn)擊“繼續(xù)”→點(diǎn)擊“確定”即可得如表6.18至6.20所示的三個(gè)主要表格。1/5/202395《統(tǒng)計(jì)學(xué)》第3章參數(shù)估計(jì)表6.18普通最小二乘回歸方程的可決系數(shù)模型匯總b模型RR方調(diào)整R方標(biāo)準(zhǔn)估計(jì)的誤差1.951a.904.9018183.736a.預(yù)測變量:(常量),開始年薪。b.因變量:當(dāng)前年薪1/5/202396《統(tǒng)計(jì)學(xué)》第3章參數(shù)估計(jì)表6.19普通最小二乘回歸方程的方差分析表Anovaa模型平方和df均方FSig.1回歸21360838107.992121360838107.992318.944.000b殘差2277100416.3133466973541.656總計(jì)23637938524.30635a.因變量:當(dāng)前年薪b.預(yù)測變量:(常量),開始年薪。1/5/202397《統(tǒng)計(jì)學(xué)》第3章參數(shù)估計(jì)表6.20普通最小二乘回歸方程的回歸系數(shù)表
系數(shù)a模型非標(biāo)準(zhǔn)化系數(shù)標(biāo)準(zhǔn)系數(shù)tSig.B標(biāo)準(zhǔn)誤差試用版1(常量)2563.2832486.3921.031.310開始年薪1.784.100.95117.859.000a.因變量:當(dāng)前年薪1/5/202398《統(tǒng)計(jì)學(xué)》第3章參數(shù)估計(jì)加權(quán)最小二乘回歸
點(diǎn)擊“轉(zhuǎn)換”→點(diǎn)擊“計(jì)算變量”,在“目標(biāo)變量”中輸入目標(biāo)變量名ei,在“數(shù)字表達(dá)式”中輸入表達(dá)式ABS(RES_1)求得殘差向量的絕對值ei,類似再計(jì)算殘差向量的絕對值ei的倒數(shù)inei:點(diǎn)擊“轉(zhuǎn)換”→點(diǎn)擊“計(jì)算變量”,在“目標(biāo)變量”中輸入目標(biāo)變量名inei,在“數(shù)字表達(dá)式”中輸入表達(dá)式1/ei,回到數(shù)據(jù)窗口可見已經(jīng)產(chǎn)生了兩列新數(shù)據(jù):殘差向量的絕對值ei和它的倒數(shù)inei,最后進(jìn)行加權(quán)最小二乘回歸:點(diǎn)擊“分析”→點(diǎn)擊“回歸”→點(diǎn)擊“線性”,將自變量開始年薪選入“自變量”,將因變量當(dāng)前年薪y(tǒng)選入“因變量”中,將權(quán)向量inei選入“WLS權(quán)重”中,然后選擇“方法”為默認(rèn)值“進(jìn)入”,點(diǎn)擊“確定”即可得如表6.21至6.23所示的三個(gè)主要表格。1/5/202399《統(tǒng)計(jì)學(xué)》第3章參數(shù)估計(jì)表6.21加權(quán)最小二乘回歸方程可決系數(shù)模型匯總b,c模型RR方調(diào)整R方標(biāo)準(zhǔn)估計(jì)的誤差1.975a.950.94872.560a.預(yù)測變量:(常量),開始年薪。b.因變量:當(dāng)前年薪c.加權(quán)的最小二乘回歸-按inei
進(jìn)行加權(quán)1/5/2023100《統(tǒng)計(jì)學(xué)》第3章參數(shù)估計(jì)表6.22加權(quán)最小二乘回歸方程的方差分析表Anovaa,b模型平方和df均方FSig.1回歸3396677.90213396677.902645.154.000c殘差179006.828345264.907
總計(jì)3575684.73035a.因變量:當(dāng)前年薪b.加權(quán)的最小二乘回歸-按inei
進(jìn)行加權(quán)c.預(yù)測變量:(常量),開始年薪。1/5/2023101《統(tǒng)計(jì)學(xué)》第3章參數(shù)估計(jì)表6.23加權(quán)最小二乘回歸方程的回歸系數(shù)表系數(shù)a,b模型非標(biāo)準(zhǔn)化系數(shù)標(biāo)準(zhǔn)系數(shù)tSig.B標(biāo)準(zhǔn)誤差試用版1(常量)2620.7381295.6802.023.051開始年薪1.762.069.97525.400.000a.因變量:當(dāng)前年薪b.加權(quán)的最小二乘回歸-按inei
進(jìn)行加權(quán)1/5/2023102《統(tǒng)計(jì)學(xué)》第3章參數(shù)估計(jì)6.6.2多重共線多元回歸模型(6.34)的基本假定之一是自變量是互不相關(guān)的,如果其中兩個(gè)或多個(gè)自變量之間出現(xiàn)了相關(guān)性,則稱為存在多重共線性。1/5/2023103《統(tǒng)計(jì)學(xué)》第3章參數(shù)估計(jì)1/5/2023104《統(tǒng)計(jì)學(xué)》第3章參數(shù)估計(jì)1/5/2023105《統(tǒng)計(jì)學(xué)》第3章參數(shù)估計(jì)1/5/2023106《統(tǒng)計(jì)學(xué)》第3章參數(shù)估計(jì)【例6.4(續(xù))】
(數(shù)據(jù)文件為example6.0)沿用本章引例中的資料,試建立當(dāng)前年薪y(tǒng)關(guān)于開始年薪x1,工作時(shí)間x2
,先前工作經(jīng)驗(yàn)x3和受教育年限x4的多元線性回歸模型。1/5/2023107《統(tǒng)計(jì)學(xué)》第3章參數(shù)估計(jì)點(diǎn)擊“分析”→點(diǎn)擊“回歸”→點(diǎn)擊“線性”,將自變量開始年薪,工作時(shí)間,先前工作經(jīng)驗(yàn)和受教育年限選入“自變量”,再將因變量當(dāng)前年薪y(tǒng)選入“因變量”中,然后選擇“方法”為默認(rèn)值“進(jìn)入”(全變量回歸),點(diǎn)擊“確定”即可得表6.12,6.13和6.14。從方差分析表表6.13可以看出,對應(yīng)的p值,所以回歸方程顯著;但從回歸系數(shù)表表6.14可知回歸系數(shù)對應(yīng)的t統(tǒng)計(jì)量的p值分別為0.793,0.353和0.150,都大于0.05,所以這三個(gè)回歸系數(shù)都不顯著,因此估計(jì)存在多重共線性。解:1.全變量回歸1/5/2023108《統(tǒng)計(jì)學(xué)》第3章參數(shù)估計(jì)2.逐步回歸,點(diǎn)擊“分析”→點(diǎn)擊“回歸”→點(diǎn)擊“線性”,將自變量開始年薪,工作時(shí)間,先前工作經(jīng)驗(yàn)和受教育年限選入“自變量”,再將因變量當(dāng)前年薪y(tǒng)選入“因變量”中,然后選擇“方法”為“逐步”(逐步回歸法),點(diǎn)擊“確定”即可得以下回歸系數(shù)表(見表6.24)。1/5/2023109《統(tǒng)計(jì)學(xué)》第3章參數(shù)估計(jì)表6.24逐步回歸方程回歸系數(shù)表系數(shù)a模型非標(biāo)準(zhǔn)化系數(shù)標(biāo)準(zhǔn)系數(shù)tSig.B標(biāo)準(zhǔn)誤差試用版1(常量)2563.2832486.3921.0310.310開始年薪1.7840.1000.95117.8590.0002(常量)-7902.8355265.218-1.5010.143開始年薪1.6310.1170.86913.9340.000受教育年限1039.260467.6700.1392.2220.033a.因變量:當(dāng)前年薪1/5/2023110《統(tǒng)計(jì)學(xué)》第3章參數(shù)估計(jì)6.7可化為線性情形的非線性回歸1/5/2023111《統(tǒng)計(jì)學(xué)》第3章參數(shù)估計(jì)1/5/2023112《統(tǒng)計(jì)學(xué)》第3章參數(shù)估計(jì)1/5/2023113《統(tǒng)計(jì)學(xué)》第3章參數(shù)估計(jì)1/5/2023114《統(tǒng)計(jì)學(xué)》第3章參數(shù)估計(jì)【例6.8】(數(shù)據(jù)文件為example6.8)表6.25給出了1990-2002年某市人均消費(fèi)性支出x和教育支出y的數(shù)據(jù),試建立y關(guān)于x的回歸模型。1/5/2023115《統(tǒng)計(jì)學(xué)》第3章參數(shù)估計(jì)表6.25人均消費(fèi)性支出和人均教育支出數(shù)據(jù)1/5/2023116《統(tǒng)計(jì)學(xué)》第3章參數(shù)估計(jì)解:1.先畫散點(diǎn)圖點(diǎn)擊“圖形”→點(diǎn)擊“舊對話框”→點(diǎn)擊“散點(diǎn)/點(diǎn)狀”,點(diǎn)擊“定義”,將兩個(gè)變量人均消費(fèi)性支出x和人均教育支出y分別選入“X軸”和“Y軸”點(diǎn)擊“確定”即可得散點(diǎn)圖,如圖6.9所示。1/5/2023117《統(tǒng)計(jì)學(xué)》第3章參數(shù)估計(jì)圖6.9人均消費(fèi)性支出x對人均教育支出y的散點(diǎn)圖1/5/2023118《統(tǒng)計(jì)學(xué)》第3章參數(shù)估計(jì)2.再嘗試采用二次、三次曲線、冪函數(shù)曲線和指數(shù)函數(shù)曲線擬合數(shù)據(jù):點(diǎn)擊“分析”→點(diǎn)擊“回歸”→點(diǎn)擊“曲線估計(jì)”,將自變量人均消費(fèi)性支出x選入“自變量”,再將因變量人均教育支出y選入“因變量”中,在“模型”中選“線性”(線
溫馨提示
- 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
- 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會(huì)有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
- 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
- 5. 人人文庫網(wǎng)僅提供信息存儲(chǔ)空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負(fù)責(zé)。
- 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請與我們聯(lián)系,我們立即糾正。
- 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。
最新文檔
- 2024郵政業(yè)行業(yè)分析報(bào)告
- 電子工業(yè)用助劑項(xiàng)目可行性研究報(bào)告申請立項(xiàng)
- 2025年液位傳感器項(xiàng)目評估報(bào)告
- 2025年中國常壓儲(chǔ)罐行業(yè)市場前瞻與投資戰(zhàn)略規(guī)劃分析報(bào)告
- 2025年18L馬口鐵罐項(xiàng)目可行性研究報(bào)告
- 2025年中國食品禮品行業(yè)發(fā)展趨勢及投資前景預(yù)測報(bào)告
- 殺豬場可行性研究報(bào)告
- 2025年智能體溫計(jì)市場調(diào)研報(bào)告
- 2025年配電控制設(shè)備項(xiàng)目評估報(bào)告
- 2025農(nóng)場雇傭合同范文
- 08S305-小型潛水泵選用及安裝圖集
- 視頻監(jiān)控室值班記錄表
- 歌曲《梁?!泛喿V完整版
- 四川2020版清單定額
- 教材編寫工作總結(jié)
- 企業(yè)員工上下班交通安全培訓(xùn)(簡詳共2份)
- 城市高密度建成區(qū)合流制溢流污染系統(tǒng)研究-黃孝河機(jī)場河水環(huán)境綜合治理項(xiàng)目實(shí)踐
- word 公章 模板
- T∕ZSQX 008-2020 建設(shè)工程全過程質(zhì)量行為導(dǎo)則
- ISO-IEC17025-2017實(shí)驗(yàn)室管理體系全套程序文件
- 深圳智能水表項(xiàng)目商業(yè)計(jì)劃書_參考模板
評論
0/150
提交評論