《管理定量分析:方法與技術(shù)(第三版)》課件 第6、7章 變量間關(guān)系研究:相關(guān)與回歸分析、時(shí)間序列分析_第1頁
《管理定量分析:方法與技術(shù)(第三版)》課件 第6、7章 變量間關(guān)系研究:相關(guān)與回歸分析、時(shí)間序列分析_第2頁
《管理定量分析:方法與技術(shù)(第三版)》課件 第6、7章 變量間關(guān)系研究:相關(guān)與回歸分析、時(shí)間序列分析_第3頁
《管理定量分析:方法與技術(shù)(第三版)》課件 第6、7章 變量間關(guān)系研究:相關(guān)與回歸分析、時(shí)間序列分析_第4頁
《管理定量分析:方法與技術(shù)(第三版)》課件 第6、7章 變量間關(guān)系研究:相關(guān)與回歸分析、時(shí)間序列分析_第5頁
已閱讀5頁,還剩88頁未讀, 繼續(xù)免費(fèi)閱讀

下載本文檔

版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請(qǐng)進(jìn)行舉報(bào)或認(rèn)領(lǐng)

文檔簡(jiǎn)介

第6章變量間關(guān)系研究:相關(guān)與回歸分析引例世界上的事物或多或少存在著某種聯(lián)系。例如:吸煙和人的健康之間受教育程度與收入水平之間課程考核次數(shù)和學(xué)生對(duì)知識(shí)的掌握程度之間公路上汽車的平均車速是否與那段公路上巡邏車的數(shù)量之間這種聯(lián)系可分為兩類:函數(shù)關(guān)系與相關(guān)關(guān)系6.1相關(guān)分析㈠函數(shù)關(guān)系(二)相關(guān)關(guān)系相關(guān)關(guān)系是指現(xiàn)象之間確實(shí)存在依存關(guān)系,但這種關(guān)系不確定不嚴(yán)格。例如:身高與體重之間,存在一定的依存關(guān)系。但是體重除了與身高有關(guān)外,還受年齡、性別、區(qū)域、種族等因素影響。身高與體重并無嚴(yán)格的對(duì)應(yīng)關(guān)系,同一身高的人,體重大多數(shù)情況下是不相等的。但即便如此,這兩個(gè)變量之間仍舊存在一定的規(guī)律性,在一般條件下,身高越高,體重越大。相關(guān)關(guān)系的種類㈠按相關(guān)關(guān)系涉及的變量多少來劃分,可分為單相關(guān)和復(fù)相關(guān)㈡按相關(guān)的方向分,可分為正相關(guān)和負(fù)相關(guān)㈢按相關(guān)的表現(xiàn)形式分,分為線性相關(guān)(直線相關(guān))和非線性相關(guān)(曲線相關(guān))㈣按照相關(guān)的密切程度分,分為完全相關(guān)、不完全相關(guān)和無相關(guān)變量間關(guān)系的密切程度一般用相關(guān)系數(shù)r衡量6.2回歸分析相關(guān)分析可以說明變量間相關(guān)關(guān)系的方向和程度,但是卻不能說明變量之間具體的數(shù)量因果關(guān)系。當(dāng)自變量給出一個(gè)數(shù)值時(shí),因變量可能取值是多少,這是相關(guān)分析不能解決的。這需要通過新的方法,即回歸分析。例如,交警隊(duì)隊(duì)長認(rèn)為,高速公路路段上汽車的平均車速與在該路段上的巡邏車數(shù)有關(guān)。于是,他專門派人進(jìn)行測(cè)試,試圖證實(shí)這一假設(shè)。測(cè)試連續(xù)進(jìn)行了60天。隨機(jī)抽取了5天的測(cè)試結(jié)果列在表6—2中。主講人:劉蘭劍公路上的巡邏車數(shù)和該路段上汽車平均車速的例子中,能繪出一條描述這兩個(gè)變量之間關(guān)系的直線。直線因斜率不同而不同斜率斜率(第一個(gè)決定直線的要素):相對(duì)于點(diǎn)在直線上移動(dòng)的水平距離,點(diǎn)在直線上上升或下降的距離。主講人:劉蘭劍截距截距:直線與y軸的交點(diǎn)(第二個(gè)決定直線的要素)。截距常用α表示因此有時(shí)候同樣的散點(diǎn)圖上可以配上多條斜率不同的直線,哪一條才是最優(yōu)的呢?

根據(jù)最小二乘法則,可以確定回歸方程的兩個(gè)系數(shù):回歸方程的應(yīng)用第一,當(dāng)6輛巡邏車在執(zhí)勤時(shí),公路上汽車的平均車速是多少?第二,7量巡邏車呢?第三,一輛巡邏車也沒有呢?6輛警車和7輛警車對(duì)車速的影響有多少差距?擬合優(yōu)度的測(cè)度有三種擬合優(yōu)度的測(cè)度方法㈠估計(jì)標(biāo)準(zhǔn)誤差

剩余剩余離差利用如下公式可以進(jìn)行任意一點(diǎn)預(yù)測(cè)值的區(qū)間估計(jì)假定交通警察想預(yù)測(cè)當(dāng)3輛巡邏車在公路上時(shí)汽車的平均車速時(shí),利用回歸方程,有Y=72.2-2.55×3=72.2-7.65=64.55當(dāng)有3輛巡邏車在公路上時(shí),我們有90%的把握確定車速在60.28公里/小時(shí)——

68.82公里/小時(shí)之間。㈡判定系數(shù)㈢斜率的標(biāo)準(zhǔn)誤差

巡邏車與車速關(guān)系問題的斜率t檢驗(yàn)

巡邏車與車速關(guān)系問題回歸系數(shù)的區(qū)間估計(jì)~6.3線性回歸的假定上述內(nèi)容并沒有討論線性回歸的假定和限制條件。許多分析人員經(jīng)常忽視這些假定,這樣做確實(shí)冒著一定的決策風(fēng)險(xiǎn)。只要任何一個(gè)假定被違背,上面的處理結(jié)果就會(huì)變得不可信。假定1:對(duì)所有的X值,Y的預(yù)測(cè)值的誤差服從均值為0的標(biāo)準(zhǔn)正態(tài)分布。假定1要求每一個(gè)Y的估計(jì)值與真實(shí)值相減而形成的一列數(shù)(誤差項(xiàng))服從標(biāo)準(zhǔn)正態(tài)分布。假定2無論X為何值,誤差項(xiàng)的方差都為常數(shù)。異方差的處理異方差的檢驗(yàn)有圖示法及解析法。檢驗(yàn)異方差的解析方法的共同思想是,由于不同的觀察值隨機(jī)誤差項(xiàng)具有不同的方差,因此檢驗(yàn)異方差的主要問題是判斷隨機(jī)誤差項(xiàng)的方差與解釋變量之間的相關(guān)性。如果相關(guān),則存在異方差,反之沒有。異方差的修正方法有加權(quán)最小二乘法和模型對(duì)數(shù)變換法等,其基本思路是變異方差為同方差,或者盡量緩解方差變異的程度。假定3:誤差相互獨(dú)立。這個(gè)假定的另一種說法是,一個(gè)誤差的大小不是任何從前誤差的函數(shù)。如果殘差相互之間是隨機(jī)的,誤差就是相互獨(dú)立的。誤差不獨(dú)立就存在自相關(guān)問題。自相關(guān)不是指兩個(gè)或兩個(gè)以上的變量之間的相關(guān)關(guān)系,而是指一個(gè)變量前后期數(shù)值之間存在的相關(guān)關(guān)系。存在自相關(guān)的數(shù)據(jù)用以上回歸方法得出的結(jié)論是不可靠的。自相關(guān)發(fā)生在時(shí)間序列分析中。自相關(guān)性產(chǎn)生的原因有以下幾種:第一,所建模型遺漏關(guān)鍵變量會(huì)產(chǎn)生序列的自相關(guān)性。第二,經(jīng)濟(jì)變量的滯后性會(huì)給序列帶來自相關(guān)性。第三,采用錯(cuò)誤的回歸函數(shù)形式也可能引起自相關(guān)性。第四,蛛網(wǎng)現(xiàn)象可能帶來序列的自相關(guān)性。第五,因?qū)?shù)據(jù)加工整理而導(dǎo)致誤差項(xiàng)之間產(chǎn)生自相關(guān)性自相關(guān)一般用圖示檢驗(yàn)法或D-W檢驗(yàn)來檢測(cè)。假定4:自變量和因變量都必須是定距變量。定類和定序變量對(duì)回歸分析是個(gè)問題,但并不是不可克服的。從技術(shù)上來講,回歸需要定距層次的數(shù)據(jù)。然而,通過將數(shù)字1,2,3等簡(jiǎn)單地分派給有順序的分類,定序數(shù)據(jù)就常常在回歸分析中使用。對(duì)于定類變量,不能簡(jiǎn)單地分派數(shù)字給變量的類別,可以通過構(gòu)造虛擬變量(dummyvariable)將定類變量納入回歸中。一個(gè)例子某企業(yè)的負(fù)責(zé)人想確定品牌A和品牌B的機(jī)器中哪種品牌的效率更高。他將每一品牌的3臺(tái)機(jī)器在同等條件的車間中進(jìn)行了測(cè)試,測(cè)試結(jié)果見表計(jì)算回歸方程并檢驗(yàn)顯著性定類因變量回歸的一個(gè)例子某一單位的人事處對(duì)將被錄用的10個(gè)求職者的打字速度進(jìn)行了測(cè)試。1年后,這些打字員中的5個(gè)被解雇。人事主管假設(shè)打字員被解雇是因打字速度太慢。工作境遇和打字速度列在表中。假定5:變量間關(guān)系是線性的。對(duì)數(shù)關(guān)系二次曲線關(guān)系三次曲線關(guān)系關(guān)鍵術(shù)語相關(guān)關(guān)系相關(guān)系數(shù)擬合優(yōu)度線性相關(guān)非線性相關(guān)估計(jì)的標(biāo)準(zhǔn)誤差判定系數(shù)

本章到此結(jié)束!

謝謝各位!管理定量分析長安大學(xué):劉蘭劍第7章時(shí)間序列分析引例某一城市從2012年到2021年中,每年參加體育鍛煉的人口數(shù),排列起來,共有10個(gè)數(shù)據(jù)構(gòu)成一個(gè)時(shí)間序列。人們希望用某個(gè)數(shù)學(xué)模型,根據(jù)這10個(gè)歷史數(shù)據(jù),來預(yù)測(cè)2022年或以后若干年中每年的體育鍛煉人數(shù)是多少,以便于該城市制訂一個(gè)有關(guān)體育健身的發(fā)展戰(zhàn)略。年份參加鍛煉人數(shù)(萬人)20121500201318502014123020151639201616002017199320181995201920302020201120212050對(duì)一些與管理有關(guān)的變量的未來狀態(tài)進(jìn)行估計(jì)被稱為預(yù)測(cè)(forcasting)。依據(jù)數(shù)據(jù)進(jìn)行預(yù)測(cè)的主要技術(shù)是時(shí)間序列分析(timeseriesanalysis)。本章將介紹幾種時(shí)間序列分析技術(shù):首先,介紹時(shí)間序列分析的一般原則;其次,介紹簡(jiǎn)單的時(shí)間序列線性回歸模型;其后,介紹一種更為常見的對(duì)數(shù)回歸模型;再次,介紹這些模型的預(yù)測(cè)能力;最后,討論二元時(shí)間序列模型。7.1時(shí)間序列簡(jiǎn)介時(shí)間序列分析(Timeseriesanalysis)是一種動(dòng)態(tài)數(shù)據(jù)處理的統(tǒng)計(jì)方法。時(shí)間序列分析是根據(jù)系統(tǒng)觀測(cè)得到的時(shí)間序列數(shù)據(jù),通過曲線擬合和參數(shù)估計(jì)來建立數(shù)學(xué)模型的理論和方法進(jìn)行處理。時(shí)間序列分析法作為一種常用的預(yù)測(cè)手段被廣泛應(yīng)用。在二次大戰(zhàn)中和戰(zhàn)后,在軍事科學(xué)、空間科學(xué)、氣象預(yù)報(bào)和工業(yè)自動(dòng)化等部門的應(yīng)用更加廣泛。當(dāng)前,時(shí)間序列分析常用在國民經(jīng)濟(jì)宏觀控制、區(qū)域綜合發(fā)展規(guī)劃、企業(yè)經(jīng)營管理、市場(chǎng)潛量預(yù)測(cè)、氣象預(yù)報(bào)、水文預(yù)報(bào)、地震前兆預(yù)報(bào)、農(nóng)作物病蟲災(zāi)害預(yù)報(bào)、環(huán)境污染控制、生態(tài)平衡、天文學(xué)和海洋學(xué)等方面。7.2時(shí)間序列分析方法時(shí)間序列分析有六個(gè)基本步驟。第一,繪制數(shù)據(jù)的散點(diǎn)圖。第二,檢驗(yàn)散點(diǎn)圖并確定是否存在短期波動(dòng)。第三,如果數(shù)據(jù)表明有短期波動(dòng),確定短期波動(dòng)的長度并剔除這個(gè)趨勢(shì)。第四,確定時(shí)間與分析變量之間是否存在某種關(guān)系。第五,利用線性回歸來估計(jì)時(shí)間與分析變量之間的關(guān)系。第六,根據(jù)回歸方程進(jìn)行預(yù)測(cè)。7.2.1沒有波動(dòng)的預(yù)測(cè)望山市人力資源與社會(huì)保障局需要預(yù)測(cè)今后5年每年大致的公務(wù)員人數(shù)。首席人力資源分析師王女士所掌握的唯一的信息是該市2008年以來的公務(wù)員人數(shù)。數(shù)據(jù)見表:年份公務(wù)員人數(shù)(千人)200835.7200938.8201040.9201143.4201244.9201347.2201448.8201550.8201650.8201750.7201855.0201955.3202058.6202159.9步驟1:繪制數(shù)據(jù)的散點(diǎn)圖。就業(yè)應(yīng)被視為因變量,年份應(yīng)被視為自變量,見圖7-3。步驟2檢驗(yàn)數(shù)據(jù)散點(diǎn)圖,確定是否存在短期波動(dòng)。數(shù)據(jù)表明沒有明顯的短期波動(dòng),因此跳至步驟4。步驟3如果數(shù)據(jù)表明存在周期趨勢(shì),如缺勤數(shù)量顯示的那樣,就有必要確定短期趨勢(shì)的長度。利用這個(gè)長度(L),構(gòu)造一個(gè)L項(xiàng)移動(dòng)平均模型。步驟4確定變量間是否有關(guān)。根據(jù)圖7-3,可以識(shí)別出時(shí)間與望山市公務(wù)員人數(shù)之間存在一個(gè)正的線性關(guān)系。步驟5:利用線性回歸估計(jì)時(shí)間與分析變量之間的關(guān)系。

為此,把第一年(2008)記為1,第二年記為2,依此類推。重新計(jì)數(shù)之后,得到如下數(shù)據(jù)集:步驟6

利用回歸方程,對(duì)今后5年的就業(yè)進(jìn)行預(yù)測(cè)。

由于2021年相當(dāng)于X的值等于14,因此2022年,即預(yù)測(cè)的第一年,其X值等于15。把15代入回歸方程,得到:

我們對(duì)望山市2022年就業(yè)的最好的估計(jì)是61640人。根據(jù)估計(jì)的標(biāo)準(zhǔn)誤差,到均值的距離的修正項(xiàng),以及自由度為12、置信度為90%的t值,我們可以得到這個(gè)估計(jì)值的90%置信區(qū)間:對(duì)望山市2023年、2024年、2025年和2026年的就業(yè)預(yù)測(cè)如下:年份

X×b202316×1.7327.68+35.69=63.37202417×1.7329.41+35.69=65.10202518×1.7331.14+35.69=66.83202619×1.7332.87+35.69=68.567.2.2一種指數(shù)趨勢(shì)的預(yù)測(cè)案例:望山市財(cái)政局的首席預(yù)算員李先生需要對(duì)本市下一年度的收入進(jìn)行預(yù)測(cè)。他想測(cè)算未來5年的收入減去支出之后的盈余能否足夠建設(shè)一個(gè)預(yù)算100萬元的公共游樂場(chǎng)。望山市2021年的支出預(yù)算是2100萬元,估計(jì)今后5年每年的支出將以7%的速度增長,在過去的收入趨勢(shì)今后仍將繼續(xù)的假定下,望山市今后5年能夠積累起100萬元的超額收入嗎?(2021年節(jié)余的收入不能作為100萬元的一部分)收入數(shù)據(jù)見表7-3。年份收入(萬元)2008678200967920107432011837201294920139822014108120151205201613172017141620181479201916372020196820212138表7-3望山市2008-2021年財(cái)政收入表7-4望山市2021-2026年計(jì)劃支出年份支出(萬元)20212100(實(shí)際數(shù)字)2022224720232404202425732025275320262945根據(jù)表7-3繪制的散點(diǎn)圖見圖7-4。通過散點(diǎn)圖可以發(fā)現(xiàn),圖中沒有明顯的短期波動(dòng),因此李先生假定不存在短期波動(dòng)。利用線性回歸,李先生估計(jì)了線性方程。為此,他把2008年轉(zhuǎn)換為1,其后的年份依次類推(2021年為14)。他估計(jì)了如下的回歸線:年份X×b202215×108.11621.5+412=2033.5202316×108.11729.6+412=2141.6202417×108.11837.7+412=2249.7202518×108.11945.8+412=2357.8202619×108.12053.9+412=2465.9利用回歸方程,李先生預(yù)測(cè)了2022-2026年望山市的財(cái)政收入:如果把回歸斜率轉(zhuǎn)換為反對(duì)數(shù)(在本例中,0.0389的反對(duì)數(shù)為1.094),再將反對(duì)數(shù)減去1,結(jié)果就是Y每年增長的百分比。1.094-1.0=0.094或9.4%望山市收入年增長率為9.4%。年份X×b202215×0.03890.584+2.767=3.351202316×0.03890.622+2.767=3.389202417×0.03890.661+2.767=3.428202518×0.03890.700+2.767=3.467202619×0.03890.739+2.767=3.506要用對(duì)數(shù)回歸模型預(yù)測(cè)市收入,先按照一般的程序求得收入的對(duì)數(shù)預(yù)測(cè)值。年份預(yù)測(cè)收入(萬元)20223.351224120233.389245120243.428268120253.467293220263.5063207表7-7把

轉(zhuǎn)換為收入年份收入(萬元)支出(萬元)盈余(萬元)202222412247﹣620232451240447202426812573108202529322753179202632072945262表7-8新回歸方程下的收入與支出對(duì)比表7.2.3一種有短期波動(dòng)的預(yù)測(cè)某局機(jī)關(guān)的缺勤率一直比較高,而且呈一定的規(guī)律出現(xiàn),為了降低缺勤率,該局提出了新的考勤辦法。下圖顯示了新的考勤辦法公布之后的6周內(nèi)工作人員的缺勤數(shù)量。請(qǐng)根據(jù)數(shù)據(jù)分析該考勤辦法有沒有效果。

7.2.4二元預(yù)測(cè)在前面的例子中,自變量都是時(shí)間。其實(shí),在一些預(yù)測(cè)中,自變量可以不是時(shí)間,這樣的預(yù)測(cè)稱為二元預(yù)測(cè)。案例未央?yún)^(qū)是位于長安市北部的一個(gè)區(qū)。張先生是未央污水處理廠的經(jīng)理,他希望對(duì)今后5年中工廠每天需要處理的污水量進(jìn)行預(yù)測(cè)。未央污水處理廠的處理能力為每天處理500萬噸污水。目前,廠里每天處理375萬噸污水。擴(kuò)建工廠需要4年時(shí)間(籌措資金,政府授權(quán),建造和測(cè)試)。為此,張先生需要預(yù)測(cè)未來對(duì)污水處理廠的需求量。如果今后5年中,每天需求超過500萬噸,張先生現(xiàn)在就必須著手?jǐn)U建工廠。分析因?yàn)槲囱雲(yún)^(qū)是一個(gè)沒有工業(yè)且商業(yè)設(shè)施也很少的近郊區(qū),因此污水量主要與未央?yún)^(qū)的住戶有關(guān)。張先生發(fā)現(xiàn)通過把未央?yún)^(qū)現(xiàn)有房屋數(shù)量與頒發(fā)的新房建筑許可數(shù)量的90%(之所以用90%,是因?yàn)榈玫皆S可的新房中有10%尚未建好)合并起來,就可以準(zhǔn)確地預(yù)測(cè)下一年的污水處理需求量。張先生搜集的數(shù)據(jù)見表7-9。表7-9未央?yún)^(qū)污水排放及房屋建設(shè)數(shù)據(jù)年份每天的污水噸數(shù)(萬噸)房屋數(shù)(萬套)新房建筑許可數(shù)(萬套)下一年預(yù)計(jì)房屋數(shù)(萬套)200811003001370200915813701501505201018815005702013201119220006002540201223025105112970201323430007543679201425237003103979201528540506804662201629346203184906201731548858155619201833555005105959201935360406036583202035865805907111202137571504757578預(yù)測(cè)把2022年的預(yù)測(cè)房屋數(shù)(7578)代入X,張先生得到2022年的預(yù)測(cè)污水處理量如下:區(qū)間估計(jì)年份X×b20237983×0.0367293.0+125.2=418.220248388×0.0367307.8+125.2=433.020258793×0.0367322.7+125.2=447.920269198×0.0367337.6+125.2=462.8用同樣的方法,對(duì)未來幾年的污水處理數(shù)量進(jìn)行預(yù)測(cè):哪一年將超過500?出于計(jì)劃的需要,區(qū)長還想知道到哪一年需求量將超過500萬噸。張先生將

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請(qǐng)下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請(qǐng)聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會(huì)有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫網(wǎng)僅提供信息存儲(chǔ)空間,僅對(duì)用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對(duì)用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對(duì)任何下載內(nèi)容負(fù)責(zé)。
  • 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請(qǐng)與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶因使用這些下載資源對(duì)自己和他人造成任何形式的傷害或損失。

評(píng)論

0/150

提交評(píng)論