數(shù)據(jù)分析spss作業(yè)_第1頁
數(shù)據(jù)分析spss作業(yè)_第2頁
數(shù)據(jù)分析spss作業(yè)_第3頁
已閱讀5頁,還剩11頁未讀, 繼續(xù)免費閱讀

下載本文檔

版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進(jìn)行舉報或認(rèn)領(lǐng)

文檔簡介

1、數(shù)據(jù)分析方法及軟件應(yīng)用(作業(yè))題目: 4、8、13 、16 題指導(dǎo)教師: 學(xué) 院:交通運輸學(xué)院姓 名: 學(xué) 號:4、在某化工生產(chǎn)中為了提高收率,選了三種不同濃度,四種不同溫度做試驗。 在同一濃度與溫度組合下各做兩次試驗,其收率數(shù)據(jù)如下面計算表所列。試在 =0.05 顯著性水平下分析(1) 給出 SPSS數(shù)據(jù)集的格式 (列舉前 3個樣本即可 );(2) 分析濃度對收率有無顯著影響;(3) 分析濃度、溫度以及它們間的交互作用對收率有無顯著影響。解答:(1)分別定義分組變量濃度、溫度、收率,在變量視圖與數(shù)據(jù)視圖中 輸入表格數(shù)據(jù),具體如下圖。(2) 思路: 本問是研究一個控制變量即濃度的不同水平是否對

2、觀測變量收率 產(chǎn)生了顯著影響,因而應(yīng)用單因素方差分析。假設(shè):濃度對收率無顯著影響。步驟:【分析 - 比較均值-單因素】,將收率選入到因變量列表中, 將濃度選入 到因子框中,確定。輸出:變異數(shù)分析收率平方和df平均值平方F顯著性群組之間39.083219.5425.074.016在群組內(nèi)80.875213.851總計119.95823顯著性水平為 0.05 ,由于概率 p值小于顯著性水平,則應(yīng)拒絕原假設(shè), 認(rèn)為濃度對收率有顯著影響。(3)思路: 本問首先是研究兩個控制變量濃度及溫度的不同水平對觀測變 量收率的獨立影響, 然后分析兩個這控制變量的交互作用能否對收率產(chǎn)生顯著影 響,因而應(yīng)該采用多因素

3、方差分析。假設(shè), H01:濃度對收率無顯著影響; H02: 溫度對收率無顯著影響; H03:濃度與溫度的交互作用對收率無顯著影響。步驟:【分析-一般線性模型 -單變量】,把收率制定到因變量中, 把濃度與溫 度制定到固定因子框中,確定。輸出:主旨間效果檢定因變數(shù) : 收率來源第 III 類平方 和df平均值平方F顯著性修正的模型70.458 a116.4051.553.230截距2667.04212667.042646.556.000濃度39.083219.5424.737.030溫度13.79234.5971.114.382濃度 * 溫度17.58362.931.710.648錯誤49.500

4、124.125總計2787.00024校正後總數(shù)119.95823a. R 平方 = .587 (調(diào)整的 R 平方 = .209 )第一列是對觀測變量總變差分解的說明;第二列是觀測變量變差分解的結(jié) 果;第三列是自由度;第四列是均方;第五列是檢驗統(tǒng)計量的觀測值;第六列 是檢驗統(tǒng)計量的概率值??梢钥吹接^測變量收率的總變差為 119.958 ,由濃度 不同引起的變差是 39.083 ,由溫度不同引起的變差為 13.792 ,由濃度和溫度的交 互作用引起的變差為 17.583 ,由隨機因素引起的變差為 49.500。濃度,溫度和濃 度*溫度的概率 p值分別為 0.030,0.382 和0.648 。濃

5、度:顯著性0.05說明拒絕原假設(shè) (濃度對收率無顯著影響) ,證明濃度對 收率有顯著影響; 溫度:顯著性 0.05 說明不拒絕原假設(shè) (溫度對收率無顯著影 響),證明溫度對收率無顯著影響;濃度與溫度 : 顯著性 0.05說明不拒絕原假 設(shè)(濃度與溫度的交互作用對收率無顯著影響) ,證明溫濃度與溫度的交互作用 對收率無顯著影響。8、以高??蒲醒芯繑?shù)據(jù)為例:以課題總數(shù) X5為被解釋變量,解釋變量為投入人 年數(shù) X2、投入科研事業(yè)費 X4、專著數(shù) X6、獲獎數(shù) X8;建立多元線性回歸模型, 分析它們之間的關(guān)系。解釋變量采用逐步篩選策略,并做多重共線性、方差齊 性和殘差的自相關(guān)性檢驗。解答:思路:根據(jù)

6、要求采用逐步篩選的解釋變量篩選策略, 利用回歸分析方法建立 多元線性回歸模型, 分析它們之間的關(guān)系, 并且要求做多重共線性、 方差齊性和 殘差的自相關(guān)性檢驗。(1)步驟:【分析 -回歸-線性】,X5選入因變量, X2、X4、X6、X8選入自變 量,方法選擇【逐步】 ?!窘y(tǒng)計量】勾選【估計】 、【模型擬合度】、【共線性診斷】 與【Durbin-Waston(U) 】?!纠L制(T)按鈕】,將*ZRESID添加到 Y(Y)框中,將*ZPRED 添加到X2(X)框中,勾選【正態(tài)概率圖】 ,【保存( S)】按鈕。在預(yù)測值與殘差 中勾選【標(biāo)準(zhǔn)化】選項。選擇菜單【分析相關(guān)雙變量】將標(biāo)準(zhǔn)化預(yù)測值和標(biāo) 準(zhǔn)化殘差

7、選入 【變量】框,在相關(guān)系數(shù)中選擇 Spearman,各項完成后點擊 【確定】。輸出:變數(shù)已輸入 / 已移除模型變數(shù)已輸入變數(shù)已移除方法1投入人年數(shù)逐步(準(zhǔn)則: F-to-enter 的 機率 <= .050 , F-to-remove 的 機率 >= .100 )。a. 應(yīng)變數(shù) : 課題總數(shù)模型摘要模型RR 平方調(diào)整後 R 平方標(biāo)準(zhǔn)偏斜度錯誤Durbin-Watson1.959 a.919.917241.95821.747a. 預(yù)測值:(常數(shù)),投入人年數(shù)b. 應(yīng)變數(shù) : 課題總數(shù)表中變量為投入人年數(shù),參考調(diào)整的判定系數(shù), 由于調(diào)整的判定系數(shù) (0.917) 較接近于 1,因此認(rèn)

8、為擬合優(yōu)度較高,被解釋變量可以被模型解釋的部分較多, 未能被解釋的部分較少。方程 DW檢驗值為 1.747 ,殘差存在一定的正自相關(guān)。變異數(shù)分析模型平方和df平均值平方F顯著性1迴歸19379040.047119379040.047331.018.000 b殘差1697769.9532958543.791總計21076810.00030a. 應(yīng)變數(shù) :課題總數(shù)b. 預(yù)測值:(常數(shù)),投入人年數(shù)被解釋變量的總離差平方和為 21076810.00 ,回歸平方和及均方分別為19379040.047 和19379040.047,剩余平方和及均方分別為 1697769.953和 58543.791,?檢

9、驗統(tǒng)計量的觀測值為 331.018 ,對應(yīng)的概率 ?值近似為 0。依據(jù)該 表可進(jìn)行回歸方程的顯著性檢驗。如果顯著性水平 ?為0.05 ,由于概率 ?值小于 顯著性水平 ? ,應(yīng)拒絕回歸方程顯著性檢驗的零假設(shè),認(rèn)為回歸系數(shù)不為 0,被 解釋變量與解釋變量的線性關(guān)系是顯著的,可建立線性模型。係數(shù)模型非標(biāo)準(zhǔn)化係數(shù)標(biāo)準(zhǔn)化係數(shù)T顯著性共線性統(tǒng)計資料B標(biāo)準(zhǔn)錯誤Beta允差VIF1 (常數(shù))-94.52472.442-1.305.202投入人年數(shù).492.027.95918.194.0001.0001.000a. 應(yīng)變數(shù) : 課題總數(shù)依據(jù)該表可以進(jìn)行回歸系數(shù)顯著性檢驗,寫出回歸方程和檢測多重共線性。 可以看

10、到, 如果顯著性水平 ?為0.05,投入人年數(shù)變量的回歸系數(shù)顯著性 t檢驗的 概率p值小于顯著性水平 ?,因此拒絕零假設(shè), 認(rèn)為其偏回歸系數(shù)與 0有顯著差異, 與被解釋變量與解釋變量的線性關(guān)系是顯著的, 應(yīng)保留在方程中。 同時從容忍度 和方差膨脹因子看, 解釋變量與投入人年數(shù)多重共線性很弱, 可以建立模型。 最 終回歸方程為, 課題總數(shù) = -94.524+0.492 投入人年數(shù)。排除的變數(shù)模型Beta 入T顯著性偏相關(guān)共線性統(tǒng)計資料允差VIF允差下 限1 投入科研事業(yè)費(百元).152 b1.528.138.278.2673.748.267專著數(shù).023 b.182.857.034.1885

11、.308.188獲獎數(shù).030 b.411.684.077.5421.846.542a. 應(yīng)變數(shù) : 課題總數(shù)b. 模型中的預(yù)測值:(常數(shù)),投入人年數(shù)該表展示回歸方程的剔除變量,可以看到,如果顯著性水平 ?為0.05,表中 三個變量的回歸系數(shù)顯著性 t檢驗的概率 p值大于顯著性水平 ?,因此不拒絕零假 設(shè),認(rèn)為其偏回歸系數(shù)與 0無顯著差異,與被解釋變量與解釋變量的線性關(guān)系是 不顯著的, 不應(yīng)保留在方程中。 同時從容忍度和方差膨脹因子看, 解釋變量與三 個解釋變量多重共線性嚴(yán)重,在建立模型的時候應(yīng)當(dāng)被剔除。共線性診斷模型 維度特徵值條件指數(shù)變異數(shù)比例(常數(shù))投入人年數(shù)111.8001.000.

12、10.102.2003.001.90.90a. 應(yīng)變數(shù) : 課題總數(shù)依據(jù)該表可進(jìn)行多重共線性檢測, 從方差比例上看第二個變量可解釋常量的 90%,也可解釋投入人年數(shù)的 90% ,一次認(rèn)為這些變量存在多重共線性。 條件指 數(shù)都小于 10,說明存在共線性較弱,低個變量特征值小于 0.7,說明線性相關(guān)關(guān) 系較弱。殘差統(tǒng)計資料最小值最大值平均數(shù)標(biāo)準(zhǔn)偏差N預(yù)測值-57.6423246.986960.000803.721331殘差-466.2850509.6787.0000237.891431標(biāo)準(zhǔn)預(yù)測值-1.2662.845.0001.00031標(biāo)準(zhǔn)殘差-1.9272.106.000.98331a. 應(yīng)變

13、數(shù) : 課題總數(shù)數(shù)據(jù)點圍繞基準(zhǔn)線還存在一定的規(guī)律性, 但標(biāo)準(zhǔn)化殘差的非參數(shù)檢驗結(jié)果表明標(biāo)準(zhǔn)化殘差與標(biāo)準(zhǔn)正態(tài)分布不存在顯著差異, 可以認(rèn)為殘差滿足了線性模型的 前提要求。隨著標(biāo)準(zhǔn)化預(yù)測值的變化,殘差點在 0線周圍隨機分布,但殘差的等方差性 并不完全滿足,方差似乎有增大的趨勢。但計算殘差與預(yù)測值的Spearman等級相關(guān)系數(shù)為 -0.176,且檢驗并不顯著,因此認(rèn)為異方差現(xiàn)象并不明顯。相關(guān)Standardized Predicted ValueStandardizedResidualSpearman 的 rhoStandardized Predicted相關(guān)係數(shù)1.000-.176Value顯著性

14、 (雙尾).344N3131Standardized Residual相關(guān)係數(shù)-.1761.000顯著性 (雙尾).344N3131依據(jù)該表可以對標(biāo)準(zhǔn)化殘差和標(biāo)準(zhǔn)化預(yù)測值的 Spearman等級進(jìn)行分析,可以看到,計算殘差與預(yù)測值的相關(guān)性弱,認(rèn)為異方差現(xiàn)象不明顯。13、利用 1950年1990年的天津食品消費數(shù)據(jù),分析這段時間內(nèi)的人均生活費 用年收入的變化情況。要求:數(shù)據(jù)進(jìn)行對數(shù)變換后,運用 Holt線性趨勢平滑模型 分析。(1) 輸出均方根誤差和參數(shù)估計結(jié)果;(2) 輸出ACF和PACF圖形并對其特征進(jìn)行分析, 是否滿足白噪聲序列的條件;(3) 給出1991-1992 的預(yù)測值,并輸出擬合圖

15、。解答:思路:根據(jù)題意, 先不進(jìn)行序列圖和自相關(guān)、 偏自相關(guān)的觀察和檢驗階段處 理。直接利用指數(shù)平滑模型中的 Holt 線性趨勢模型對數(shù)據(jù)進(jìn)行分析,同時輸出均 方根誤差和參數(shù)估計誤差, ACF和PACF圖像判斷是否滿足白噪音序列的條件; 最后然后對數(shù)據(jù)進(jìn)行 1991 年、1992年做出預(yù)測,并用模型進(jìn)行擬合步驟:【分析-預(yù)測-創(chuàng)建模型】,將人均生活費年收入選入【因變量】中,將 【方法】選為【指數(shù)平滑法】;點擊【條件】,在【因變量轉(zhuǎn)換】 中選【自然對數(shù)】, 在【模型類型】中【 Holt 線性趨勢】,【繼續(xù)】?!窘y(tǒng)計量】,在【擬合度量】中選擇【平穩(wěn)的 R方、均方根誤差】,在【個別 模型的統(tǒng)計量】中

16、選中【參數(shù)估計】 ,在【比較模型的統(tǒng)計量】中選中【擬合優(yōu) 度】,選中【顯示預(yù)測值】 ,【確定】【圖表】,在【單個模型圖】中選擇【序列、殘差自相關(guān)函數(shù)、殘差部分自 相關(guān)函數(shù)】,在【每張圖顯示的內(nèi)容】中現(xiàn)則【觀察值、預(yù)測值、擬合值】 ?!具x項】,在【預(yù)測階段】選擇第二個, 在【日期】的【年】框中填入【1992】。 輸出:模型適合度適合度統(tǒng)計資料平均數(shù)SE最小值最大值百分位數(shù)5102550759095平穩(wěn) R平方.221.221.221.221.221.221.221.221.221.221R 平方.994.994.994.994.994.994.994.994.994.994RMSE28.1792

17、8.17928.17928.17928.17928.17928.17928.17928.17928.179MAPE3.5173.5173.5173.5173.5173.5173.5173.5173.5173.517MaxAPE12.49512.49512.49512.49512.49512.49512.49512.49512.49512.495MAE17.14617.14617.14617.14617.14617.14617.14617.14617.14617.146MaxAE82.91182.91182.91182.91182.91182.91182.91182.91182.91182.91

18、1標(biāo)準(zhǔn)化BIC6.8586.8586.8586.8586.8586.8586.8586.8586.8586.858模型統(tǒng)計資料模型預(yù)測變數(shù)數(shù) 目模型適合度統(tǒng)計資料Ljung-Box Q(18)離群值數(shù) 目平穩(wěn) R 平 方RMSE統(tǒng)計資 料DF顯著性人均生活費年收入 - 模 型 10.22128.17916.36016.4280均方根誤差為 28.179 ,誤差較小指數(shù)平滑化模型參數(shù)模型估計SET顯著性人均生活費年收入 - 模型自然對數(shù) Alpha (水準(zhǔn))1.000.1576.381.0001Gamm(a 趨勢).400.1782.244.031模型的兩個參數(shù)分別為: 1.0和0.4,則具體模

19、型為 ft+m =1.0+0.4m ,但兩函數(shù)都預(yù)測模型19911992人均生活費年收入 - 模型_1 預(yù)測1708.821920.58UCL1887.022274.43LCL1543.631609.99雖然殘差自相關(guān)函數(shù)和偏自相關(guān)函數(shù)絕大多數(shù)處于置信區(qū)間內(nèi), 具有明顯減少趨勢,且具有一定的季節(jié)性,因此不屬于白噪音序列。針對每一個模型,預(yù)測是在所要求的估計期間範(fàn)圍內(nèi)的前次非遺 漏開始,並在其所有預(yù)測值的非遺漏值可用的前次期間,或是在 所要求的預(yù)測期間的結(jié)束日期結(jié)束,取較早的時間。1991、1992 年的預(yù)測值與 1990年的觀測值有較大的增長趨勢。從整個數(shù)據(jù) 來看, 1950年至1980年這段

20、時期較為平穩(wěn)的增長,但是 1980年之后迅速上升, 最后預(yù)測值上升較為明顯,這與實際趨勢基本一致。且 1991 、1992年預(yù)測值分 別為1708.82 、1920.58 。16 、結(jié)合自己的研究方向、參與項目等,舉出一個說明 SPSS在交通運輸中應(yīng)用 的例子。例子需包含問題說明、數(shù)據(jù)來源、統(tǒng)計方法、統(tǒng)計結(jié)果及其主要結(jié)論。解答:問題說明:利用1950年2013 年美國么歷年定期航班旅客周轉(zhuǎn)量 (單位:“臺 億客公里)歷年數(shù)據(jù)數(shù)據(jù),建立幾種指數(shù)平滑模型,預(yù)測 2016 年美國定期航班 旅客周轉(zhuǎn)量。數(shù)據(jù)來源:從統(tǒng)計看民航( 2014)中國民航出版社,2014年11月第一版年份19501951195

21、21953195419551956195719581959定期航班旅客周轉(zhuǎn) 量 / 億客公里164.4211.8250.3292.1331.6391.8444.5503506.9585.3年份1960196119621963196419651966196719681969定期航班旅客周轉(zhuǎn) 量 / 億客公里625.4640.9704.2810.4941.31105.21285.71605.81830.72017.3年份1970197119721973197419751976197719781979定期航班旅客周轉(zhuǎn) 量 / 億客公里2131.32155.9145326062621262028823

22、11036404080年份1980198119821983198419851986198719881989定期航班旅客周轉(zhuǎn) 量 / 億客公里3930395041004460472052795800647067436948年份1990199119921993199419951996199719981999定期航班旅客周轉(zhuǎn) 量 / 億客公里731471837651.477598199.88491.69214.89655.7984710448.7年份2000200120022003200420052006200720082009定期航班旅客周轉(zhuǎn) 量 / 億客公里11109.510444.810218

23、.410389.611643.712446.912753.813120.51279012570年份2010201120122013定期航班旅客周轉(zhuǎn) 量 / 億客公里12998.713105.413247.513525.2解題思路:首先首先繪制和觀察彩電出口量的序列圖, 通過圖形觀察和檢驗 尋找規(guī)律,然后通過指數(shù)平滑模型簡單、 HOIT線性趨勢、 Brown 線性趨勢三 個模型進(jìn)行分析預(yù)測,比較選擇最佳模型預(yù)測 2016年億客公里數(shù)。統(tǒng)計結(jié)果:美國億客公里時間序列圖如下:該序列圖為平穩(wěn)序列則可以直接進(jìn)行建模分析1)簡單指數(shù)平滑模型型號說明模型類型模型 ID 億客公里 模型 1簡單模型統(tǒng)計資料模型

24、預(yù)測變數(shù)數(shù) 目模型適合度統(tǒng)計資料Ljung-Box Q(18)離群值數(shù) 目平穩(wěn) R 平 方RMSE統(tǒng)計資料DF顯著性億客公里 - 模型10-.417367.91812.51117.0460指數(shù)平滑化模型參數(shù)模型估計SET顯著性億客公里 -模型 1 自然對數(shù)Alpha (水準(zhǔn))1.000.1228.175.000預(yù)測模型201420152016億客公里 - 模型 _1 預(yù)測13638.2113752.1613867.06UCL17502.4819474.7921137.62LCL10451.729393.228654.28針對每一個模型,預(yù)測是在所要求的估計期間範(fàn)圍內(nèi)的前次非遺漏開 始,並在其所有預(yù)測值的非遺漏值可用的前次期間,或是在所要求的預(yù) 測期間的結(jié)束日期結(jié)束,取較早的時間。2) HOIT線性趨勢指數(shù)平滑模型型號說明模型類型模型 ID 億客公里 模型 1Holt模型統(tǒng)計資料預(yù)測變數(shù)數(shù)模型適合度統(tǒng)計資料Ljung-Box Q(18)離群值數(shù)目平穩(wěn) R 平 方RMSE統(tǒng)計資料DF顯著性目億客公里 - 模型10.610417.99015.33616.0500指數(shù)平滑化模型參數(shù)模型估計SET顯著性億客公里 -模型_1 自然對數(shù) Alpha (水準(zhǔn)).694.1185.893.000Gamm(a 趨勢).117.0621.895.063預(yù)測模型201420152016億客公里 -

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負(fù)責(zé)。
  • 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時也不承擔(dān)用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

評論

0/150

提交評論