最新的SPSS21使用教程哦參考模板_第1頁
最新的SPSS21使用教程哦參考模板_第2頁
最新的SPSS21使用教程哦參考模板_第3頁
最新的SPSS21使用教程哦參考模板_第4頁
最新的SPSS21使用教程哦參考模板_第5頁
已閱讀5頁,還剩54頁未讀 繼續(xù)免費閱讀

下載本文檔

版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進(jìn)行舉報或認(rèn)領(lǐng)

文檔簡介

2/59SPSS工具簡介最新統(tǒng)計要與大量的數(shù)據(jù)打交道,涉及繁雜的計算和圖表繪制?,F(xiàn)代的數(shù)據(jù)分析工作如果離開統(tǒng)計軟件幾乎是無法正常開展。在準(zhǔn)確理解和掌握了各種統(tǒng)計方法原理之后,再來掌握幾種統(tǒng)計分析軟件的實際操作,是十分必要的。常見的統(tǒng)計軟件有SAS,SPSS,MINITAB,EXCEL等。這些統(tǒng)計軟件的功能和作用大同小異,各自有所側(cè)重。其中的SAS和SPSS是目前在大型企業(yè)、各類院校以及科研機(jī)構(gòu)中較為流行的兩種統(tǒng)計軟件。特別是SPSS,其界面友好、功能強(qiáng)大、易學(xué)、易用,包含了幾乎全部尖端的統(tǒng)計分析方法,具備完善的數(shù)據(jù)定義、操作管理和開放的數(shù)據(jù)接口以及靈活而美觀的統(tǒng)計圖表制作。SPSS在各類院校以及科研機(jī)構(gòu)中更為流行。SPSS(StatisticalProductandServiceSolutions,意為統(tǒng)計產(chǎn)品與服務(wù)解決方案)。自20世紀(jì)60年代SPSS誕生以來,為適應(yīng)各種操作系統(tǒng)平臺的要求經(jīng)歷了多次版本更新,各種版本的SPSSforWindows大同小異,在本試驗課程中我們選擇PASWStatistics20.0作為統(tǒng)計分析應(yīng)用試驗活動的工具。SPSS的運行模式SPSS主要有三種運行模式:批處理模式這種模式把已編寫好的程序(語句程序)存為一個文件,提交給[開始]菜單上[SPSSforWindows]→[ProductionModeFacility]程序運行。完全窗口菜單運行模式這種模式通過選擇窗口菜單和對話框完成各種操作。用戶無須學(xué)會編程,簡單易用。程序運行模式這種模式是在語句(Syntax)窗口中直接運行編寫好的程序或者在腳本(script)窗口中運行腳本程序的一種運行方式。這種模式要求掌握SPSS的語句或腳本語言。本試驗指導(dǎo)手冊為初學(xué)者提供入門試驗教程,采用“完全窗口菜單運行模式”。SPSS的啟動在windows[開始]→[程序]→[PASW],在它的次級菜單中單擊“SPSS12.0forWindows”即可啟動SPSS軟件,進(jìn)入SPSSforWindows對話框,如圖1.1,圖1.2所示。圖1.1SPSS啟動圖1.1PASWStatistics啟動對話框SPSS軟件的退出SPSS軟件的退出方法與其他Windows應(yīng)用程序相同,有兩種常用的退出方法:按File→Exist的順序使用菜單命令退出程序。直接單擊SPSS窗口右上角的“關(guān)閉”按鈕,回答系統(tǒng)提出的是否存盤的問題之后即可安全退出程序。SPSS的主要窗口介紹SPSS軟件運行過程中會出現(xiàn)多個界面,各個界面用處不同。其中,最主要的界面有三個:數(shù)據(jù)編輯窗口、結(jié)果輸出窗口和語句窗口。數(shù)據(jù)編輯窗口啟動SPSS后看到的第一個窗口便是數(shù)據(jù)編輯窗口,如圖1.3所示。在數(shù)據(jù)編輯窗口中可以進(jìn)行數(shù)據(jù)的錄入、編輯以及變量屬性的定義和編輯,是SPSS的基本界面。主要由以下幾部分構(gòu)成:標(biāo)題欄、菜單欄、工具欄、編輯欄、變量名欄、觀測序號、窗口切換標(biāo)簽、狀態(tài)欄。菜單欄工具欄菜單欄工具欄編輯欄觀測序號變量名欄窗口切換標(biāo)簽狀態(tài)欄標(biāo)題欄圖1.3數(shù)據(jù)瀏覽界面標(biāo)題欄:顯示數(shù)據(jù)編輯的數(shù)據(jù)文件名。菜單欄:通過對這些菜單的選擇,用戶可以進(jìn)行幾乎所有的SPSS操作。關(guān)于菜單的詳細(xì)的操作步驟將在后續(xù)實驗內(nèi)容中分別介紹。為了方便用戶操作,SPSS軟件把菜單項中常用的命令放到了工具欄里。當(dāng)鼠標(biāo)停留在某個工具欄按鈕上時,會自動跳出一個文本框,提示當(dāng)前按鈕的功能。另外,如果用戶對系統(tǒng)預(yù)設(shè)的工具欄設(shè)置不滿意,也可以用[視圖]→[工具欄]→[設(shè)定]命令對工具欄按鈕進(jìn)行定義。編輯欄:可以輸入數(shù)據(jù),以使它顯示在內(nèi)容區(qū)指定的方格里。變量名欄:列出了數(shù)據(jù)文件中所包含變量的變量名觀測序號:列出了數(shù)據(jù)文件中的所有觀測值。觀測的個數(shù)通常與樣本容量的大小一致。窗口切換標(biāo)簽:用于“數(shù)據(jù)視圖”和“變量視圖”的切換。即數(shù)據(jù)瀏覽窗口與變量瀏覽窗口。數(shù)據(jù)瀏覽窗口用于樣本數(shù)據(jù)的查看、錄入和修改。變量瀏覽窗口用于變量屬性定義的輸入和修改。狀態(tài)欄:用于說明顯示SPSS當(dāng)前的運行狀態(tài)。SPSS被打開時,將會顯示“PASWStatisticsProcessor”的提示信息。結(jié)果輸出窗口在SPSS中大多數(shù)統(tǒng)計分析結(jié)果都將以表和圖的形式在結(jié)果觀察窗口中顯示。窗口右邊部分顯示統(tǒng)計分析結(jié)果,左邊是導(dǎo)航窗口,用來顯示輸出結(jié)果的目錄,可以通過單擊目錄來展開右邊窗口中的統(tǒng)計分析結(jié)果。當(dāng)用戶對數(shù)據(jù)進(jìn)行某項統(tǒng)計分析,結(jié)果輸出窗口將被自動調(diào)出。當(dāng)然,用戶也可以通過雙擊后綴名為.spo的SPSS輸出結(jié)果文件來打開該窗口。試驗1數(shù)據(jù)文件管理一、試驗?zāi)康呐c要求通過本試驗項目,使學(xué)生理解并掌握SPSS軟件包有關(guān)數(shù)據(jù)文件創(chuàng)建和整理的基本操作,學(xué)習(xí)如何將收集到的數(shù)據(jù)輸入計算機(jī),建成一個正確的SPSS數(shù)據(jù)文件,并掌握如何對原始數(shù)據(jù)文件進(jìn)行整理,包括數(shù)據(jù)查詢,數(shù)據(jù)修改、刪除,數(shù)據(jù)的排序等等。二、試驗原理SPSS數(shù)據(jù)文件是一種結(jié)構(gòu)性數(shù)據(jù)文件,由數(shù)據(jù)的結(jié)構(gòu)和數(shù)據(jù)的內(nèi)容兩部分構(gòu)成,也可以說由變量和觀測兩部分構(gòu)成。一個典型的SPSS數(shù)據(jù)文件如表2.1所示。觀測變量觀測變量數(shù)據(jù)內(nèi)容姓名性別年齡…張三145…李四223………王五245…SPSS變量的屬性SPSS中的變量共有10個屬性,分別是變量名(Name)、變量類型(Type)、長度(Width)、小數(shù)點位置(Decimals)、變量名標(biāo)簽(Label)、變量名值標(biāo)簽(Value)、缺失值(Missing)、數(shù)據(jù)列的顯示寬度(Columns)、對其方式(Align)和度量尺度(Measure)。定義一個變量至少要定義它的兩個屬性,即變量名和變量類型,其他屬性可以暫時采用系統(tǒng)默認(rèn)值,待以后分析過程中如果有需要再對其進(jìn)行設(shè)置。在spss數(shù)據(jù)編輯窗口中單擊“變量視窗”標(biāo)簽,進(jìn)入變量視窗界面(如圖2.1所示)即可對變量的各個屬性進(jìn)行設(shè)置。圖2.1變量視窗三、試驗內(nèi)容與步驟1.創(chuàng)建一個數(shù)據(jù)文件數(shù)據(jù)文件的創(chuàng)建分成三個步驟:(1)選擇菜單【文件】→【新建】→【數(shù)據(jù)】新建一個數(shù)據(jù)文件,進(jìn)入數(shù)據(jù)編輯窗口。窗口頂部標(biāo)題為“PASWStatistics數(shù)據(jù)編輯器”。(2)單擊左下角【變量視窗】標(biāo)簽進(jìn)入變量視圖界面,根據(jù)試驗的設(shè)計定義每個變量類型。(3)變量定義完成以后,單擊【數(shù)據(jù)視窗】標(biāo)簽進(jìn)入數(shù)據(jù)視窗界面,將每個具體的變量值錄入數(shù)據(jù)庫單元格內(nèi)。2.讀取外部數(shù)據(jù)當(dāng)前版本的SPSS可以很容易地讀取Excel數(shù)據(jù),步驟如下:(1)按【文件】→【打開】→【數(shù)據(jù)】的順序使用菜單命令調(diào)出打開數(shù)據(jù)對話框,在文件類型下拉列表中選擇數(shù)據(jù)文件,如圖2.2所示。圖2.2OpenFile對話框(2)選擇要打開的Excel文件,單擊“打開”按鈕,調(diào)出打開Excel數(shù)據(jù)源對話框,如圖2.3所示。對話框中各選項的意義如下:工作表下拉列表:選擇被讀取數(shù)據(jù)所在的Excel工作表。范圍輸入框:用于限制被讀取數(shù)據(jù)在Excel工作表中的位置。圖2.3OpenExcelDataSource對話框3.?dāng)?shù)據(jù)編輯在SPSS中,對數(shù)據(jù)進(jìn)行基本編輯操作的功能集中在Edit和Data菜單中。4.SPSS數(shù)據(jù)的保存SPSS數(shù)據(jù)錄入并編輯整理完成以后應(yīng)及時保存,以防數(shù)據(jù)丟失。保存數(shù)據(jù)文件可以通過【文件】→【保存】或者【文件】→【另存為】菜單方式來執(zhí)行。在數(shù)據(jù)保存對話框(如圖2.5所示)中根據(jù)不同要求進(jìn)行SPSS數(shù)據(jù)保存。圖2.5SPSS數(shù)據(jù)的保存5.數(shù)據(jù)整理在SPSS中,數(shù)據(jù)整理的功能主要集中在【數(shù)據(jù)】和【轉(zhuǎn)換】兩個主菜單下。(1)數(shù)據(jù)排序(SortCase)對數(shù)據(jù)按照某一個或多個變量的大小排序?qū)⒂欣趯?shù)據(jù)的總體瀏覽,基本操作說明如下:選擇菜單【數(shù)據(jù)】→【排列個案】,打開對話框,如圖2.7所示。(2)抽樣(SelectCase)在統(tǒng)計分析中,有時不需要對所有的觀測進(jìn)行分析,而可能只對某些特定的對象有興趣。利用SPSS的SelectCase命令可以實現(xiàn)這種樣本篩選的功能。以SPSS安裝配套數(shù)據(jù)文件Growthstudy.sav為例,選擇年齡大于10的觀測,基本操作說明圖2.7排列個案對話框如下:打開數(shù)據(jù)文件Growthstudy.sav,選擇【數(shù)據(jù)】→【選擇個案】命令,打開對話框,如圖2.8圖2.8選擇個案對話框指定抽樣的方式:【全部個案】不進(jìn)行篩選;【如果條件滿足】按指定條件進(jìn)行篩選。本例設(shè)置:產(chǎn)品數(shù)量>150,如圖2.9所示;圖2.9選擇個案對話框設(shè)置完成以后,點擊continue,進(jìn)入下一步。確定未被選擇的觀測的處理方法,這里選擇默認(rèn)選項【過濾掉未選定的個案】。單擊ok進(jìn)行篩選,結(jié)果如圖2.10圖2.10選擇個案的結(jié)果(3)增加個案的數(shù)據(jù)合并(【合并文件】→【添加個案】)將新數(shù)據(jù)文件中的觀測合并到原數(shù)據(jù)文件中,在SPSS中實現(xiàn)數(shù)據(jù)文件縱向合并的方法如下:選擇菜單【數(shù)據(jù)】→【合并文件】→【添加個案】,如圖2.11,選擇需要追加的數(shù)據(jù)文件,單擊打開按鈕,彈出AddCases對話框,如圖2.12。圖2.11選擇個體數(shù)據(jù)來源的文件圖2.12選擇變量(4)增加變量的數(shù)據(jù)合并(【合并文件】→【添加變量】)增加變量時指把兩個或多個數(shù)據(jù)文件實現(xiàn)橫向?qū)印@鐚⒉煌n程的成績文件進(jìn)行合并,收集來的數(shù)據(jù)被放置在一個新的數(shù)據(jù)文件中。在SPSS中實現(xiàn)數(shù)據(jù)文件橫向合并的方法如下:選擇菜單【數(shù)據(jù)】→【合并文件】→【添加變量】,選擇合并的數(shù)據(jù)文件,單擊“打開”,彈出添加變量,如圖2.12所示。圖2.12單擊Ok執(zhí)行合并命令。這樣,兩個數(shù)據(jù)文件將按觀測的順序一對一地橫向合并。(5)數(shù)據(jù)拆分(SplitFile)在進(jìn)行統(tǒng)計分析時,經(jīng)常要對文件中的觀測進(jìn)行分組,然后按組分別進(jìn)行分析。例如要求按性別不同分組。在SPSS中具體操作如下:選擇菜單【數(shù)據(jù)】→【分割文件】,打開對話框,如圖2.13所示。圖2.13分割文件對話框選擇拆分?jǐn)?shù)據(jù)后,輸出結(jié)果的排列方式,該對話框提供了3種方式:對全部觀測進(jìn)行分析,不進(jìn)行拆分;在輸出結(jié)果種將各組的分析結(jié)果放在一起進(jìn)行比較;按組排列輸出結(jié)果,即單獨顯示每一分組的分析結(jié)果。選擇分組變量選擇數(shù)據(jù)的排序方式單擊ok按鈕,執(zhí)行操作(6)計算新變量在對數(shù)據(jù)文件中的數(shù)據(jù)進(jìn)行統(tǒng)計分析的過程中,為了更有效地處理數(shù)據(jù)和反映事務(wù)的本質(zhì),有時需要對數(shù)據(jù)文件中的變量加工產(chǎn)生新的變量。比如經(jīng)常需要把幾個變量加總或取加權(quán)平均數(shù),SPSS中通過【計算】菜單命令來產(chǎn)生這樣的新變量,其步驟如下:選擇菜單【轉(zhuǎn)換】→【計算變量】,打開對話框,如圖2.14所示。圖2.14ComputeVariable對話框在目標(biāo)變量輸入框中輸入生成的新變量的變量名。單擊輸入框下面類型與標(biāo)簽按鈕,在跳出的對話框中可以對新變量的類型和標(biāo)簽進(jìn)行設(shè)置。在數(shù)字表達(dá)式輸入框中輸入新變量的計算表達(dá)式。例如“年齡>20”。單擊【如果】按鈕,彈出子對話框,如圖2.15所示。包含所有個體:對所有的觀測進(jìn)行計算;如果個案滿足條件則包括:僅對滿足條件的觀測進(jìn)行計算。單擊Ok按鈕,執(zhí)行命令,則可以在數(shù)據(jù)文件中看到一個新生成的變量。圖2.15如果…子對話框四、備擇試驗?zāi)澈娇展?8名職員性別和工資情況的調(diào)查數(shù)據(jù),如表2.3所示,試在SPSS中進(jìn)行如下操作:(1)將數(shù)據(jù)輸入到SPSS的數(shù)據(jù)編輯窗口中,將gender定義為字符型變量,將salary定義為數(shù)值型變量,并保存數(shù)據(jù)文件,命名為“試驗1-1.sav”。(2)插入一個變量income,定義為數(shù)值型變量。(3)將數(shù)據(jù)文件按性別分組(4)查找工資大于40000美元的職工(5)當(dāng)工資大于40000美元時,職工的獎金是工資的20%;當(dāng)工資小于40000美元時,職工的獎金是工資的10%,假設(shè)實際收入=工資+獎金,計算所有職工的實際收入,并添加到income變量中。表2.3某航空公司38名職員情況的調(diào)查數(shù)據(jù)表IdGenderSalaryIdGenderSalary1M$5700020F$262502M$4020021F$388503F$2145022M$217504F$2190023F$240005M$4500024F$169506M$3210025F$211507M$3600026M$310508F$2190027M$603759F$2790028M$3255010F$2400029M$13500011F$3030030M$3120012M$2835031M$3615013M$2775032M$11062514F$3510033M$4200015M$2730034M$9200016M$4080035M$8125017M$4600036F$3135018M$10375037M$2910019M$4230038M$31350試驗2描述統(tǒng)計一、試驗?zāi)康呐c要求統(tǒng)計分析的目的在于研究總體特征。但是,由于各種各樣的原因,我們能夠得到的往往只能是從總體中隨機(jī)抽取的一部分觀察對象,他們構(gòu)成了樣本,只有通過對樣本的研究,我們才能對總體的實際情況作出可能的推斷。因此描述性統(tǒng)計分析是統(tǒng)計分析的第一步,做好這一步是進(jìn)行正確統(tǒng)計推斷的先決條件。通過描述性統(tǒng)計分析可以大致了解數(shù)據(jù)的分布類型和特點、數(shù)據(jù)分布的集中趨勢和離散程度,或?qū)?shù)據(jù)進(jìn)行初步的探索性分析(包括檢查數(shù)據(jù)是否有錯誤,對數(shù)據(jù)分布特征和規(guī)律進(jìn)行初步觀察)。本本試驗旨在于:引到學(xué)生利用正確的統(tǒng)計方法對數(shù)據(jù)進(jìn)行適當(dāng)?shù)恼砗惋@示,描述并探索出數(shù)據(jù)內(nèi)在的數(shù)量規(guī)律性,掌握統(tǒng)計思想,培養(yǎng)學(xué)生學(xué)習(xí)統(tǒng)計學(xué)的興趣,為繼續(xù)學(xué)習(xí)推斷統(tǒng)計方法及應(yīng)用各種統(tǒng)計方法解決實際問題打下必要而堅實的基礎(chǔ)。二、試驗原理描述統(tǒng)計是統(tǒng)計分析的基礎(chǔ),它包括數(shù)據(jù)的收集、整理、顯示,對數(shù)據(jù)中有用信息的提取和分析,通常用一些描述統(tǒng)計量來進(jìn)行分析。集中趨勢的特征值:算術(shù)平均數(shù)、調(diào)和平均數(shù)、幾何平均數(shù)、眾數(shù)、中位數(shù)等。其中均數(shù)適用于正態(tài)分布和對稱分布資料,中位數(shù)適用于所有分布類型的資料。離散趨勢的特征值:全距、內(nèi)距、平均差、方差、標(biāo)準(zhǔn)差、標(biāo)準(zhǔn)誤、離散系數(shù)等。其中標(biāo)準(zhǔn)差、方差適用于正態(tài)分布資料,標(biāo)準(zhǔn)誤實際上反映了樣本均數(shù)的波動程度。

分布特征值:偏態(tài)系數(shù)、峰度系數(shù)、他們反映了數(shù)據(jù)偏離正態(tài)分布的程度。三、試驗內(nèi)容與步驟下面給出的一個例題是來自SPSS軟件自帶的數(shù)據(jù)文件“Employee.data”,該文件包含某公司員工的工資、工齡、職業(yè)等變量,我們將利用此例題給出相關(guān)的描述統(tǒng)計說明,本例中,我們將以員工的當(dāng)前工資為例,計算該公司員工當(dāng)前工資的一些描述統(tǒng)計量,如均值、頻數(shù)、方差等描述統(tǒng)計量的計算。1.頻數(shù)分析(Frequencies)頻數(shù)分析多適用于離散變量,其功能是描述離散變量的分布特征。頻數(shù)分析多適用于離散變量,其功能是描述離散變量的分布特征?;窘y(tǒng)計分析往往從頻數(shù)分析開始。通過頻數(shù)分析能夠了解變量取值的狀況,對把握數(shù)據(jù)的分布特征是非常有用的。比如,在某項調(diào)查中,想要知道被調(diào)查者的性別分布狀況。頻數(shù)分析的第一個基本任務(wù)是編制頻數(shù)分布表。SPSS中的頻數(shù)分布表包括的內(nèi)容有:(1)頻數(shù)(Frequency)即變量值落在某個區(qū)間中的次數(shù)。(2)百分比(Percent)即各頻數(shù)占總樣本數(shù)的百分比。(3)有效百分比(ValidPercent)即各頻數(shù)占有效樣本數(shù)的百分比。這里有效樣本數(shù)=總樣本-缺失樣本數(shù)。(4)累計百分比(CumulativePercent)即各百分比逐級累加起來的結(jié)果。最終取值為百分之百。頻數(shù)分析的第二個基本任務(wù)是繪制統(tǒng)計圖。統(tǒng)計圖是一種最為直接的數(shù)據(jù)刻畫方式,能夠非常清晰直觀地展示變量的取值狀況。頻數(shù)分析中常用的統(tǒng)計圖包括:條形圖,餅圖,直方圖等。頻數(shù)分析的應(yīng)用步驟在SPSS中的頻數(shù)分析的實現(xiàn)步驟如下:選擇菜單“【文件】—>【打開】—>【數(shù)據(jù)】”在對話框中找到需要分析的數(shù)據(jù)文件“SPSS/Employeedata”,然后選擇“打開”。選擇菜單“【分析】—>【描述統(tǒng)計】—>【頻率】”。如圖2.1所示詢問是否輸出頻數(shù)分布表詢問是否輸出頻數(shù)分布表圖2.1Frequencies對話框確定所要分析的變量,例如年齡在變量選擇確定之后,在同一窗口上,點擊“Statistics”按鈕,打開統(tǒng)計量對話框,如下圖2.2所示,選擇統(tǒng)計輸出選項。圖2.2統(tǒng)計量子對話框圖2.3Charts子對話框結(jié)果輸出與分析點擊Frequencies對話框中的“OK”按鈕,即得到下面的結(jié)果。表2.4描述性統(tǒng)計量 StatisticsGenderNValid474Missing0表2.4中給出了總樣本量(N),其中變量Gender的有效個數(shù)(Valid)為474個、缺失值(missing)為0。 表2.5Gender頻數(shù)分布表FrequencyPercentValidPercentCumulativePercentValidFemale21645.645.645.6Male25854.454.4100.0Total474100.0100.0表2.5中,F(xiàn)requency是頻數(shù),Percent是按總樣本量為分母計算的百分比,ValidPercent是以有效樣本量為分母計算的百分比,CumulativePercent是累計百分比。圖2.5變量Gender的條形圖,圖2.6變量Gender的餅圖。圖2.5變量gender的條形圖圖2.6變量gender的餅圖2.描述統(tǒng)計(Descriptives)描述統(tǒng)計主要對定距型或定比型數(shù)據(jù)的分布特征作具體分析。SPSS的【描述】命令專門用于計算各種描述統(tǒng)計性統(tǒng)計量。本節(jié)利用某年國內(nèi)上市公司的財務(wù)數(shù)據(jù)來介紹描述統(tǒng)計量在SPSS中的計算方法。具體操作步驟如下:選擇菜單【分析】→【描述統(tǒng)計】→【描述】,如圖2.7所示圖2.7描述對話框?qū)⒋治龅淖兞恳迫隫ariables列表框,例如將每股收益率、凈資產(chǎn)收益率、資產(chǎn)負(fù)債率等2個變量進(jìn)行描述性統(tǒng)計,以觀察上市公司股權(quán)集中度情況和負(fù)債比率的高低。Savestandardizedvaluesasvariables,對所選擇的每個變量進(jìn)行標(biāo)準(zhǔn)化處理,產(chǎn)生相應(yīng)的Z分值,作為新變量保存在數(shù)據(jù)窗口中。其變量名為相應(yīng)變量名前加前綴z。標(biāo)準(zhǔn)化計算公式:單擊【選項】按鈕,如圖2.8所示,選擇需要計算的描述統(tǒng)計量。各描述統(tǒng)計量同F(xiàn)requencies命令中的Statistics子對話框中大部分相同,這里不再重復(fù)。圖2.8選項子對話框在主對話框中單擊ok執(zhí)行操作。結(jié)果輸出與分析在結(jié)果輸出窗口中給出了所選變量的相應(yīng)描述統(tǒng)計,如表2.6所示。從表中可以看到,我國上市公司前兩大股東持股比例之比平均高達(dá)102.9,說明“一股獨大”的現(xiàn)象比較嚴(yán)重;前五大股東持股比例之和平均為51.8%,資產(chǎn)負(fù)債率平均為46.78%。另外,從偏態(tài)和峰度指標(biāo)看出,前兩大股東持股比例之比的分布呈現(xiàn)比較明顯的右偏,而且比較尖峭。為了驗證這一結(jié)論,可以利用Frequencies命令畫出變量z的直方圖,如圖2.9表2.6描述統(tǒng)計量表DescriptiveStatisticsNMeanStd.SkewnessKurtosisStatisticStatisticStatisticStatisticStd.ErrorStatisticStd.Error前兩大股東持股比例之比315102.865199.1997464.168.13722.404.274前五大股東持股比例的平方和315.51836.1496003.602.137-.318.274資產(chǎn)負(fù)債率315.4677.16773-.165.137-.414.274ValidN(listwise)315圖2.9變量Z的直方圖3.探索分析(Explore)調(diào)用此過程可對變量進(jìn)行更為深入詳盡的描述性統(tǒng)計分析,故稱之為探索分析。它在一般描述性統(tǒng)計指標(biāo)的基礎(chǔ)上,增加有關(guān)數(shù)據(jù)其他特征的文字與圖形描述,顯得更加細(xì)致與全面,對數(shù)據(jù)分析更進(jìn)一步。探索分析一般通過數(shù)據(jù)文件在分組與不分組的情況下獲得常用統(tǒng)計量和圖形。一般以圖形方式輸出,直觀幫助研究者確定奇異值、影響點、還可以進(jìn)行假設(shè)檢驗,以及確定研究者要使用的某種統(tǒng)計方式是否合適。在打開的數(shù)據(jù)文件上,選擇如下命令:選擇菜單“【分析】—>【描述統(tǒng)計】—>【探索】”,打開對話框。因變量列表;待分析的變量名稱,例如將每股收益率作為研究變量。因子列表:從源變量框中選擇一個或多個變量進(jìn)入因子列表,分組變量可以將數(shù)據(jù)按照該觀察值進(jìn)行分組分析。標(biāo)準(zhǔn)個案:在源變量表中指定一個變量作為觀察值的標(biāo)識變量。在輸出欄中,選擇兩者都,表示輸出圖形及描述統(tǒng)計量。選擇【統(tǒng)計量】按鈕,選擇想要計算的描述統(tǒng)計量。如圖所示對所要計算的變量的頻數(shù)分布及其統(tǒng)計量值作圖打開“Plots對話框”,出現(xiàn)如下圖。結(jié)果的輸出與說明(1)CaseProcessingSummary表在CaseProcessingSummary表中可以看出female有216個個體,Male258個個體,均無缺失值。(2)Descriptives表 DescriptivesGenderStatisticStd.ErrorCurrentSalaryFemaleMean$26,031.92$514.25895%ConfidenceIntervalforMeanLowerBound$25,018.29UpperBound$27,045.555%TrimmedMean$25,248.30Median$24,300.00Variance57123688.268Std.Deviation$7,558.021Minimum$15,750Maximum$58,125Range$42,375Interquartile$7,013Skewness1.863.166Kurtosis4.641.330MaleMean$41,441.78$1,213.96895%ConfidenceIntervalforMeanLowerBound$39,051.19UpperBound$43,832.375%TrimmedMean$39,445.87Median$32,850.00Variance380219336.303Std.Deviation$19,499.214Minimum$19,650Maximum$135,000Range$115,350Interquartile$22,675Skewness1.639.152Kurtosis2.780.302(3)職位員工薪水直方圖顯示(4)莖葉圖描述莖葉圖自左向右可以分為3大部分:頻數(shù)(Frequency)、莖(Stem)和葉(Leaf)。莖表示數(shù)值的整數(shù)部分,葉表示數(shù)值的小數(shù)部分。每行的莖和每個葉組成的數(shù)字相加再乘以莖寬(StemWidth),即莖葉所表示的實際數(shù)值的近似值。CurrentSalaryStem-and-LeafPlotforgender=FemaleFrequencyStem&Leaf2.001.5516.001.666666666677777714.001.8888999999999931.002.000000000000011111111111111111135.002.2222222222222222222223333333333333338.002.4444444444444444444444444455555555555522.002.666666666667777777777717.002.888888999999999997.003.00011118.003.222333338.003.444445555.003.667772.003.8811.00Extremes(>=40800)Stemwidth:10000Eachleaf:1case(s)(5)箱圖圖中灰色區(qū)域的方箱為箱圖的主體,上中下3條線分別表示變量值的第75、50、25百分位數(shù),因此變量的50%觀察值落在這一區(qū)域中。方箱中的中心粗線為中位數(shù)。箱圖中的觸須線是中間的縱向直線,上端截至線為變量的最大值,下端截至線為變量的最小值。四、備擇試驗完成下列試驗內(nèi)容,并按試驗(1)所附試驗報告的格式撰寫報告。1.表2.7為某班級16位學(xué)生的身高數(shù)據(jù),對其進(jìn)行頻數(shù)分析,并對實驗報告作出說明。表2.7某班16位學(xué)生的身高數(shù)據(jù)學(xué)號性別身高(cm)學(xué)號性別身高(cm)1M1709M1502F17310M1573F16911F1774M15512M1605F17413F1696F17814M1547M15615F1728F17116F1802.測量18臺電腦筆記重量,見表2.8,對其進(jìn)行描述統(tǒng)計量分析,并對試驗結(jié)果作出說明。表2.818臺筆記本電腦重量表序號123456789重量1.751.921.591.851.831.681.891.701.79序號101112131415161718重量1.661.801.832.051.911.761.881.831.79試驗3:統(tǒng)計推斷一、試驗?zāi)康呐c要求1.熟悉點估計概念與操作方法2.熟悉區(qū)間估計的概念與操作方法3.熟練掌握T檢驗的SPSS操作4.學(xué)會利用T檢驗方法解決身邊的實際問題二、試驗原理1.參數(shù)估計的基本原理2.假設(shè)檢驗的基本原理三、試驗演示內(nèi)容與步驟1.單個總體均值的區(qū)間估計例題:為研究在黃金時段中,即每晚8:30-9:00內(nèi),電視廣告所占時間的多少。美國廣告協(xié)會抽樣調(diào)查了20個最佳電視時段中廣告所占的時間(單位:分鐘)。請給出每晚8:30開始的半小時內(nèi)廣告所占時間區(qū)間估計,給定的置信度為95%。操作程序:打開SPSS,建立數(shù)據(jù)文件:“電視節(jié)目市場調(diào)查.sav”。這里,研究變量為:time,即每天看電視的時間。選擇區(qū)間估計選項,方法如下:選擇菜單【分析】—>【描述統(tǒng)計】—>【探索】”,打開圖3.1Explore對話框。從源變量清單中將“time”變量移入DependentList框中。圖3.1Explore對話框單擊上圖右方的“統(tǒng)計量”按鈕打開“探索:統(tǒng)計量”對話框。在設(shè)置均值的置信水平,如鍵入95%,完成后單擊“繼續(xù)”按鈕回到主窗口。圖3.2探索統(tǒng)計量設(shè)置窗口返回主窗口點擊ok運行操作。計算結(jié)果簡單說明:表3.1描述統(tǒng)計量Descriptives StatisticStd.ErrortimeMean6.5350.1348095%ConfidenceIntervalforMeanLowerBound6.2529UpperBound6.81715%TrimmedMean6.5167Median6.4500Variance.363Std.Deviation.60287Minimum5.60Maximum7.80Range2.20Interquartile.95Skewness.295.512Kurtosis-.612.992如上表顯示。從上表“95%ConfidenceIntervalforMean”中可以得出,每晚8:30開始的半小時內(nèi)廣告所占時間區(qū)間估計(置信度為95%)為:(6.2529,6.8171),其中l(wèi)owerBound表示置信區(qū)間的下限,UpperBound表示置信區(qū)間的上限。點估計是:6.5350。2.兩個總體均值之差的區(qū)間估計例題:TheWallStreetJournal(1994,7)聲稱在制造業(yè)中,參加工會的婦女比未參加工會的婦女的報酬要多2.5美元。想通過統(tǒng)計方法,對這個觀點是否正確給出檢驗。假設(shè)抽取了7位女性工會會員與8位非工會會員女性報酬數(shù)據(jù)。要求對制造業(yè)中參加工會會員的女性報酬與未參加工會的女性報酬平均工資之差進(jìn)行區(qū)間估計,預(yù)設(shè)的置信度為95%。打開SPSS,按如下圖示格式輸入原始數(shù)據(jù),建立數(shù)據(jù)文件:“工會會員工資差別.spss”。這里,“會員”表示是否為工會會員的變量,y表示是工會會員,n表示非工會會員,“報酬”表示女性員工報酬變量,單位:千美元。計算兩總體均值之差的區(qū)間估計,采用“獨立樣本T檢驗”方法。選擇菜單“【分析】→【比較均值】→獨立樣本T檢驗”,打開對話框。變量選擇(1)從源變量清單中將“報酬”變量移入檢驗變量框中。表示要求該變量的均值的區(qū)間估計。(2)從源變量清單中將“group”變量移入分組變量框中。表示總體的分類變量。圖3.3獨立樣本T檢驗對話框定義分組單擊定義組按鈕,打開DefineGroups對話框。在Group1中輸入1,在Group2中輸入2(1表示非工會會員,2表示工會會員)。完成后單擊“繼續(xù)”按鈕回到主窗口。圖3.4definegroups設(shè)置窗口計算結(jié)果單擊上圖中“OK”按鈕,輸出結(jié)果如下圖所示。(1)GroupStatistics(分組統(tǒng)計量)表分別給出不同總體下的樣本容量、均值、標(biāo)準(zhǔn)差和平均標(biāo)準(zhǔn)誤。從該表中可以看出,參加工會的婦女平均報酬為19.925,不參加工會的婦女平均報酬為20.1429。表3.2分組統(tǒng)計量GroupStatistics會員NMeanStd.DeviationStd.ErrorMean報酬1.00819.9250.46522.164482.00720.1429.52236.19743 (2)IndependentSampleTest(獨立樣本T檢驗)表Levene’sTestforEqualityofVariance,為方差檢驗,在Equalvariancesassumed(原假設(shè):方差相等)下,F(xiàn)=0.623,因為其P-值大于顯著性水平,即:Sig.=0.444>0.05,說明不能拒絕方差相等的原假設(shè),接受兩個總體方差是相等的假設(shè)。因此參加工會會員的女性報酬與未參加工會的女性報酬平均工資之差95%的區(qū)間估計為[0.76842,0.33271]。T-testforEqualityofMeans為檢驗總體均值是否相等的t檢驗,由于在本例中,其P-值大于顯著性水平,即:Sig.=0.408>0.05,因此不應(yīng)該拒絕原假設(shè),也就是說參加工會的婦女跟未參加工會的婦女的報酬沒有顯著差異。本次抽樣推斷結(jié)論不支持TheWallStreetJournal(1994,7)提出的“參加工會的婦女比未參加工會的婦女的報酬要多2.5美元”觀點,即參加工會的婦女不比未參加工會的婦女的報酬多。表3.3獨立樣本T檢驗結(jié)果IndependentSamplesTestLevene'sTestforEqualityofVariancest-testforEqualityofMeansFSig.tdfSig.(2-tailed)MeanDifferenceStd.ErrorDifference95%ConfidenceIntervaloftheDifferenceLowerUpper報酬Equalvariancesassumed.623.444-.85513.408-.21786.25485-.76842.33271Equalvariancesnotassumed-.84812.187.413-.21786.25697-.77679.341083.單個總體均值的假設(shè)檢驗(單樣本T檢驗)例子:某種品牌的沐浴肥皂制造程序的設(shè)計規(guī)格中要求每批平均生產(chǎn)120塊肥皂,高于或低于該數(shù)量均被認(rèn)為是不合理的,在由10批產(chǎn)品所組成的一個樣本中,每批肥皂的產(chǎn)量數(shù)據(jù)見下表,在0.05的顯著水平下,檢驗該樣本結(jié)果能否說明制造過程運行良好?判斷檢驗類型該例屬于“大樣本、總體標(biāo)準(zhǔn)差σ未知。假設(shè)形式為:H0:μ=μ0,H1:μ≠μ0軟件實現(xiàn)程序打開已知數(shù)據(jù)文件,然后選擇菜單“【分析】→【比較均值】→單樣本T檢驗”,打開One-SampleTTest對話框。從源變量清單中將“產(chǎn)品數(shù)量”向右移入“TestVariables”框中。圖3.5one-sampleTtest窗口在“TestValue”框里輸入一個指定值(即假設(shè)檢驗值,本例中假設(shè)為120),T檢驗過程將對每個檢驗變量分別檢驗它們的平均值與這個指定數(shù)值相等的假設(shè)?!癘ne-SampleTTest”窗口中“OK”按鈕,輸出結(jié)果如下表所示。(1)“One-SampleStatistics”(單個樣本的統(tǒng)計量)表分別給出樣本的容量、均值、標(biāo)準(zhǔn)差和平均標(biāo)準(zhǔn)誤。去去去試驗4:方差分析一、試驗?zāi)繕?biāo)與要求1.幫助學(xué)生深入了解方差及方差分析的基本概念,掌握方差分析的基本思想和原理2.掌握方差分析的過程。3.增強(qiáng)學(xué)生的實踐能力,使學(xué)生能夠利用SPSS統(tǒng)計軟件,熟練進(jìn)行單因素方差分析、兩因素方差分析等操作,激發(fā)學(xué)生的學(xué)習(xí)興趣,增強(qiáng)自我學(xué)習(xí)和研究的能力。二、試驗原理在現(xiàn)實的生產(chǎn)和經(jīng)營管理過程中,影響產(chǎn)品質(zhì)量、數(shù)量或銷量的因素往往很多。例如,農(nóng)作物的產(chǎn)量受作物的品種、施肥的多少及種類等的影響;某種商品的銷量受商品價格、質(zhì)量、廣告等的影響。為此引入方差分析的方法。方差分析也是一種假設(shè)檢驗,它是對全部樣本觀測值的變動進(jìn)行分解,將某種控制因素下各組樣本觀測值之間可能存在的由該因素導(dǎo)致的系統(tǒng)性誤差與隨即誤差加以比較,據(jù)以推斷各組樣本之間是否存在顯著差異。若存在顯著差異,則說明該因素對各總體的影響是顯著的。方差分析有3個基本的概念:觀測變量、因素和水平。觀測變量是進(jìn)行方差分析所研究的對象;因素是影響觀測變量變化的客觀或人為條件;因素的不同類別或不通取值則稱為因素的不同水平。在上面的例子中,農(nóng)作物的產(chǎn)量和商品的銷量就是觀測變量,作物的品種、施肥種類、商品價格、廣告等就是因素。在方差分析中,因素常常是某一個或多個離散型的分類變量。根據(jù)觀測變量的個數(shù),可將方差分析分為單變量方差分析和多變量方差分析;根據(jù)因素個數(shù),可分為單因素方差分析和多因素方差分析。在SPSS中,有One-wayANOVA(單變量-單因素方差分析)、GLMUnivariate(單變量多因素方差分析);GLMMultivariate(多變量多因素方差分析),不同的方差分析方法適用于不同的實際情況。本節(jié)僅練習(xí)最為常用的單因素單變量方差分析。三、試驗演示內(nèi)容與步驟單因素方差分析也稱一維方差分析,對兩組以上的均值加以比較。檢驗由單一因素影響的一個分析變量由因素各水平分組的均值之間的差異是否有統(tǒng)計意義。并可以進(jìn)行兩兩組間均值的比較,稱作組間均值的多重比較。主要采用One-wayANOVA過程。采用One-wayANOVA過程要求:因變量屬于正態(tài)分布總體,若因變量的分布明顯是非正態(tài),應(yīng)該用非參數(shù)分析過程。若對被觀測對象的試驗不是隨機(jī)分組的,而是進(jìn)行的重復(fù)測量形成幾個彼此不獨立的變量,應(yīng)該用RepeatedMeasure菜單項,進(jìn)行重復(fù)測量方差分析,條件滿足時,還可以進(jìn)行趨勢分析。假設(shè)某汽車經(jīng)銷商為了研究東部、西部和中部地區(qū)市場上汽車的銷量是否存在顯著差異,在每個地區(qū)隨機(jī)抽取幾個城市進(jìn)行調(diào)查統(tǒng)計,調(diào)查數(shù)據(jù)放置于數(shù)據(jù)文件“汽車銷量調(diào)查.sav”中。在SPSS中試驗該檢驗的步驟如下:步驟1:選擇菜單【分析】→【比較均值】→【單因素方差分析】,依次將觀測變量銷量移入因變量列表框,將因素變量地區(qū)移入因子列表框。圖4.1One-WayANOVA對話框單擊兩兩比較按鈕,如圖4.2,該對話框用于進(jìn)行多重比較檢驗,即各因素水平下觀測變量均值的兩兩比較。方差分析的原假設(shè)是各個因素水平下的觀測變量均值都相等,備擇假設(shè)是各均值不完全相等。假如一次方差分析的結(jié)果是拒絕原假設(shè),我們只能判斷各觀測變量均值不完全相等,卻不能得出各均值完全不相等的結(jié)論。各因素水平下觀測變量均值的更為細(xì)致的比較就需要用多重比較檢驗。圖4.2兩兩比較對話框假定方差齊性選項欄中給出了在觀測變量滿足不同因素水平下的方差齊性條件下的多種檢驗方法。這里選擇最常用的LSD檢驗法;未假定方差齊性選項欄中給出了在觀測變量不滿足方差齊性條件下的多種檢驗方法。這里選擇Tamhane’sT2檢驗法;Significancelevel輸入框中用于輸入多重比較檢驗的顯示性水平,默認(rèn)為5%。單擊選項按鈕,彈出options子對話框,如圖所示。在對話框中選中描述性復(fù)選框,輸出不同因素水平下觀測變量的描述統(tǒng)計量;選擇方差同質(zhì)性檢驗復(fù)選框,輸出方差齊性檢驗結(jié)果;選中均值圖復(fù)選框,輸出不同因素水平下觀測變量的均值直線圖。在主對話框中點擊ok按鈕,可以得到單因素分析的結(jié)果。試驗結(jié)果分析:表4.1給出了不同地區(qū)汽車銷量的基本描述統(tǒng)計量以及95%的置信區(qū)間。圖4.3選項子對話框表4.1各個地區(qū)汽車銷量描述統(tǒng)計量Descriptives銷量NMeanStd.DeviationStd.Error95%ConfidenceIntervalforMeanMinimumMaximumLowerBoundUpperBound西10157.9022.2787.045141.96173.84120194中9176.4419.7176.572161.29191.60135198東7196.1430.92711.689167.54224.75145224Total26174.6227.8455.461163.37185.86120224表4.2給出了Levene方差齊性檢驗結(jié)果。從表中可以看到,Levene統(tǒng)計量對應(yīng)的p值大于0.05,所以得到不同地區(qū)汽車銷量滿足方差齊性的結(jié)論。Levene統(tǒng)計量對應(yīng)的p值大于0.05,所以得到不同地區(qū)汽車銷量滿足方差齊性的結(jié)論。表4.2Levene統(tǒng)計量對應(yīng)的p值大于0.05,所以得到不同地區(qū)汽車銷量滿足方差齊性的結(jié)論。TestofHomogeneityofVariancesLeveneStatisticdf1df2Sig.1.262223.302表4.3是單因素方差分析,輸出的方差分析表解釋如下:總離差SST=19384.154,組間平方和SSR=6068.174,組內(nèi)平方和或殘差平方和SSE=13315.979,相應(yīng)的自由度分別為25,2,23;組間均方差MSR=3034.087,組內(nèi)均方差578.956,F(xiàn)=5.241,由于p=0.013<0.05說明在α=0.05顯著性水平下,F(xiàn)檢驗是顯著的。即認(rèn)為各個地區(qū)的汽車銷量并不完全相同。表4.3單因素方差分析結(jié)果ANOVA銷量SumofSquaresdfMeanSquareFSig.BetweenGroups6068.17423034.0875.241.013WithinGroups13315.97923578.956Total19384.15425表4.4多重比較檢驗結(jié)果MultipleComparisonsDependentVariable:銷量(I)地區(qū)(J)地區(qū)MeanDifference(I-J)Std.ErrorSig.95%ConfidenceIntervalLowerBoundUpperBoundLSD西中-18.54411.055.107-41.414.33東-38.243(*)11.858.004-62.77-13.71中西18.54411.055.107-4.3341.41東-19.69812.126.118-44.785.39東西38.243(*)11.858.00413.7162.77中19.69812.126.118-5.3944.78Tamhane西中-18.5449.635.199-44.056.96東-38.24313.648.054-77.10.61中西18.5449.635.199-6.9644.05東-19.69813.410.436-58.3118.91東西38.24313.648.054-.6177.10中19.69813.410.436-18.9158.31*Themeandifferenceissignificantatthe.05level.如前所述,拒絕單因素方差分析原假設(shè)并不能得出各地區(qū)汽車銷量均值完全不等的結(jié)論。各地區(qū)銷量均值的兩兩比較要看表4.4所示的多重比較檢驗結(jié)果。表中上半部分為LSD檢驗結(jié)果,下半部分為Tamhane檢驗結(jié)果。由于方差滿足齊性,所以這里應(yīng)該看LSD檢驗結(jié)果。表中的Meandifference列給出了不同地區(qū)汽車銷量的平均值之差。其中后面帶“﹡”號的表示銷量有顯著差異,沒有帶“﹡”號的表示沒有顯著差異??梢钥闯?,東部和西部汽車銷量存在顯著差異,而中部與東部、中部與西部汽車銷量并沒有什么顯著差異。這一結(jié)論也可以從表中Sig列給出的p值大小得到印證。四、備擇試驗1.用SPSS進(jìn)行單因素方差分析。某個年級有三個小班,他們進(jìn)行了一次數(shù)據(jù)考試,現(xiàn)從各班隨機(jī)地抽取了一些學(xué)生,記錄其成績?nèi)绫?。原始?shù)據(jù)文件保存為“數(shù)學(xué)考試成績.sav”。試在顯著性水平0.05下檢驗各班級的平均分?jǐn)?shù)有無顯著差異。數(shù)學(xué)考試成績表ⅠⅡⅢ7366887768418960783179598245487856684393916291538036517671797377859671157879748087757687568597892.某學(xué)校給3組學(xué)生以3種不同方式輔導(dǎo)學(xué)習(xí),一個學(xué)期后,學(xué)生獨立思考水平提高的成績?nèi)绫硭尽W(xué)生獨立思考水平提高的成績方式137424243414245464140方式249484848474546474849方式333333532313534323233問:該數(shù)據(jù)中的因變量是什么?因素又是什么?如何建立數(shù)據(jù)文件?對該數(shù)據(jù)進(jìn)行方差分析,檢驗3種方式的影響是否存在顯著差異?試驗5:相關(guān)分析與回歸分析一、試驗?zāi)繕?biāo)與要求本試驗項目的目的是學(xué)習(xí)并使用SPSS軟件進(jìn)行相關(guān)分析和回歸分析,具體包括:皮爾遜pearson簡單相關(guān)系數(shù)的計算與分析學(xué)會在SPSS上實現(xiàn)一元及多元回歸模型的計算與檢驗。學(xué)會回歸模型的散點圖與樣本方程圖形。學(xué)會對所計算結(jié)果進(jìn)行統(tǒng)計分析說明。要求試驗前,了解回歸分析的如下內(nèi)容。參數(shù)α、β的估計回歸模型的檢驗方法:回歸系數(shù)β的顯著性檢驗(t-檢驗);回歸方程顯著性檢驗(F-檢驗)。二、試驗原理1.相關(guān)分析的統(tǒng)計學(xué)原理相關(guān)分析使用某個指標(biāo)來表明現(xiàn)象之間相互依存關(guān)系的密切程度。用來測度簡單線性相關(guān)關(guān)系的系數(shù)是Pearson簡單相關(guān)系數(shù)。2.回歸分析的統(tǒng)計學(xué)原理相關(guān)關(guān)系不等于因果關(guān)系,要明確因果關(guān)系必須借助于回歸分析。回歸分析是研究兩個變量或多個變量之間因果關(guān)系的統(tǒng)計方法。其基本思想是,在相關(guān)分析的基礎(chǔ)上,對具有相關(guān)關(guān)系的兩個或多個變量之間數(shù)量變化的一般關(guān)系進(jìn)行測定,確立一個合適的數(shù)據(jù)模型,以便從一個已知量推斷另一個未知量?;貧w分析的主要任務(wù)就是根據(jù)樣本數(shù)據(jù)估計參數(shù),建立回歸模型,對參數(shù)和模型進(jìn)行檢驗和判斷,并進(jìn)行預(yù)測等。線性回歸數(shù)學(xué)模型如下:在模型中,回歸系數(shù)是未知的,可以在已有樣本的基礎(chǔ)上,使用最小二乘法對回歸系數(shù)進(jìn)行估計,得到如下的樣本回歸函數(shù):回歸模型中的參數(shù)估計出來之后,還必須對其進(jìn)行檢驗。如果通過檢驗發(fā)現(xiàn)模型有缺陷,則必須回到模型的設(shè)定階段或參數(shù)估計階段,重新選擇被解釋變量和解釋變量及其函數(shù)形式,或者對數(shù)據(jù)進(jìn)行加工整理之后再次估計參數(shù)?;貧w模型的檢驗包括一級檢驗和二級檢驗。一級檢驗又叫統(tǒng)計學(xué)檢驗,它是利用統(tǒng)計學(xué)的抽樣理論來檢驗樣本回歸方程的可靠性,具體又可以分為擬和優(yōu)度評價和顯著性檢驗;二級檢驗又稱為經(jīng)濟(jì)計量學(xué)檢驗,它是對線性回歸模型的假定條件能否得到滿足進(jìn)行檢驗,具體包括序列相關(guān)檢驗、異方差檢驗等。三、試驗演示內(nèi)容與步驟1.連續(xù)變量簡單相關(guān)系數(shù)的計算與分析在上市公司財務(wù)分析中,常常利用資產(chǎn)收益率、凈資產(chǎn)收益率、每股凈收益和托賓Q值4個指標(biāo)來衡量公司經(jīng)營績效。本試驗利用SPSS對這4個指標(biāo)的相關(guān)性進(jìn)行檢驗。操作步驟與過程:打開數(shù)據(jù)文件“上市公司財務(wù)數(shù)據(jù)(連續(xù)變量相關(guān)分析).sav”,依次選擇“【分析】→【相關(guān)】→【雙變量】”打開對話框如圖,將待分析的4個指標(biāo)移入右邊的變量列表框內(nèi)。其他均可選擇默認(rèn)項,單擊ok提交系統(tǒng)運行。圖5.1BivariateCorrelations對話框結(jié)果分析:表給出了Pearson簡單相關(guān)系數(shù),相關(guān)檢驗t統(tǒng)計量對應(yīng)的p值。相關(guān)系數(shù)右上角有兩個星號表示相關(guān)系數(shù)在0.01的顯著性水平下顯著。從表中可以看出,每股收益、凈資產(chǎn)收益率和總資產(chǎn)收益率3個指標(biāo)之間的相關(guān)系數(shù)都在0.8以上,對應(yīng)的p值都接近0,表示3個指標(biāo)具有較強(qiáng)的正相關(guān)關(guān)系,而托賓Q值與其他3個變量之間的相關(guān)性較弱。 表5.1Pearson簡單相關(guān)分析Correlations每股收益率凈資產(chǎn)收益率資產(chǎn)收益率托賓Q值每股收益率PearsonCorrelation1.877(**).824(**)-.073Sig.(2-tailed)..000.000.199N315315315315凈資產(chǎn)收益率PearsonCorrelation.877(**)1.808(**)-.001Sig.(2-tailed).000..000.983N315315315315資產(chǎn)收益率PearsonCorrelation.824(**).808(**)1.011Sig.(2-tailed).000.000..849N315315315315托賓Q值PearsonCorrelation-.073-.001.0111Sig.(2-tailed).199.983.849.N315315315315**Correlationissignificantatthe0.01level(2-tailed).2.一元線性回歸分析實例分析:家庭住房支出與年收入的回歸模型在這個例子里,考慮家庭年收入對住房支出的影響,建立的模型如下:其中,yi是住房支出,xi是年收入線性回歸分析的基本步驟及結(jié)果分析:(1)繪制散點圖打開數(shù)據(jù)文件,選擇【圖形】-【舊對話框】-【散點/點狀】,如圖5.2所示。圖5.2散點圖對話框選擇簡單分布,單擊定義,打開子對話框,選擇X變量和Y變量,如圖5.3所示。單擊ok提交系統(tǒng)運行,結(jié)果見圖5.4所示。圖5.3SimpleScatterplot子對話框從圖上可直觀地看出住房支出與年收入之間存在線性相關(guān)關(guān)系。圖5.4散點圖(2)簡單相關(guān)分析選擇【分析】—>【相關(guān)】—>【雙變量】,打開對話框,將變量“住房支出”與“年收入”移入variables列表框,點擊ok運行,結(jié)果如表5.2所示。表5.2住房支出與年收入相關(guān)系數(shù)表Correlations住房支出(千美元)年收入(千美元)住房支出(千美元)PearsonCorrelation1.966(**)Sig.(2-tailed)..000N2020年收入(千美元)PearsonCorrelation.966(**)1Sig.(2-tailed).000.N2020**Correlationissignificantatthe0.01level(2-tailed).從表中可得到兩變量之間的皮爾遜相關(guān)系數(shù)為0.966,雙尾檢驗概率p值尾0.000<0.05,故變量之間顯著相關(guān)。根據(jù)住房支出與年收入之間的散點圖與相關(guān)分析顯示,住房支出與年收入之間存在顯著的正相關(guān)關(guān)系。在此前提下進(jìn)一步進(jìn)行回歸分析,建立一元線性回歸方程。(3)線性回歸分析步驟1:選擇菜單“【分析】—>【回歸】—>【線性】”,打開LinearRegression對話框。將變量住房支出y移入Dependent列表框中,將年收入x移入Independents列表框中。在Method框中選擇Enter選項,表示所選自變量全部進(jìn)入回歸模型。圖5.5LinearRegresssion對話框步驟2

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負(fù)責(zé)。
  • 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時也不承擔(dān)用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

評論

0/150

提交評論