SPSS教程中文完整版_第1頁
SPSS教程中文完整版_第2頁
SPSS教程中文完整版_第3頁
SPSS教程中文完整版_第4頁
SPSS教程中文完整版_第5頁
已閱讀5頁,還剩101頁未讀, 繼續(xù)免費(fèi)閱讀

下載本文檔

版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請(qǐng)進(jìn)行舉報(bào)或認(rèn)領(lǐng)

文檔簡介

...wd......wd......wd...SPSS統(tǒng)計(jì)與分析統(tǒng)計(jì)要與大量的數(shù)據(jù)打交道,涉及繁雜的計(jì)算和圖表繪制?,F(xiàn)代的數(shù)據(jù)分析工作如果離開統(tǒng)計(jì)軟件幾乎是無法正常開展。在準(zhǔn)確理解和掌握了各種統(tǒng)計(jì)方法原理之后,再來掌握幾種統(tǒng)計(jì)分析軟件的實(shí)際操作,是十分必要的。常見的統(tǒng)計(jì)軟件有SAS,SPSS,MINITAB,EXCEL等。這些統(tǒng)計(jì)軟件的功能和作用大同小異,各自有所側(cè)重。其中的SAS和SPSS是目前在大型企業(yè)、各類院校以及科研機(jī)構(gòu)中較為流行的兩種統(tǒng)計(jì)軟件。特別是SPSS,其界面友好、功能強(qiáng)大、易學(xué)、易用,包含了幾乎全部尖端的統(tǒng)計(jì)分析方法,具備完善的數(shù)據(jù)定義、操作管理和開放的數(shù)據(jù)接口以及靈活而美觀的統(tǒng)計(jì)圖表制作。SPSS在各類院校以及科研機(jī)構(gòu)中更為流行。SPSS〔StatisticalProductandServiceSolutions,意為統(tǒng)計(jì)產(chǎn)品與服務(wù)解決方案〕。自20世紀(jì)60年代SPSS誕生以來,為適應(yīng)各種操作系統(tǒng)平臺(tái)的要求經(jīng)歷了屢次版本更新,各種版本的SPSSforWindows大同小異,在本試驗(yàn)課程中我們選擇PASWStatistics18.0作為統(tǒng)計(jì)分析應(yīng)用試驗(yàn)活動(dòng)的工具。1.SPSS的運(yùn)行模式SPSS主要有三種運(yùn)行模式:批處理模式這種模式把已編寫好的程序〔語句程序〕存為一個(gè)文件,提交給[開場]菜單上[SPSSforWindows]→[ProductionModeFacility]程序運(yùn)行。完全窗口菜單運(yùn)行模式這種模式通過選擇窗口菜單和對(duì)話框完成各種操作。用戶無須學(xué)會(huì)編程,簡單易用。程序運(yùn)行模式這種模式是在語句〔Syntax〕窗口中直接運(yùn)行編寫好的程序或者在腳本〔script〕窗口中運(yùn)行腳本程序的一種運(yùn)行方式。這種模式要求掌握SPSS的語句或腳本語言。本試驗(yàn)指導(dǎo)手冊(cè)為初學(xué)者提供入門試驗(yàn)教程,采用“完全窗口菜單運(yùn)行模式〞。2.SPSS的啟動(dòng)〔1〕在windows[開場]→[程序]→[PASW],在它的次級(jí)菜單中單擊“SPSS12.0forWindows〞即可啟動(dòng)SPSS軟件,進(jìn)入SPSSforWindows對(duì)話框,如圖1.1,圖1.2所示。圖1.1SPSS啟動(dòng)圖1.1PASWStatistics啟動(dòng)對(duì)話框3.SPSS軟件的退出SPSS軟件的退出方法與其他Windows應(yīng)用程序一樣,有兩種常用的退出方法:?按File→Exist的順序使用菜單命令退出程序。?直接單擊SPSS窗口右上角的“關(guān)閉〞按鈕,答復(fù)系統(tǒng)提出的是否存盤的問題之后即可安全退出程序。4.SPSS的主要窗口介紹SPSS軟件運(yùn)行過程中會(huì)出現(xiàn)多個(gè)界面,各個(gè)界面用處不同。其中,主要的界面有三個(gè):數(shù)據(jù)編輯窗口、結(jié)果輸出窗口和語句窗口?!?〕數(shù)據(jù)編輯窗口啟動(dòng)SPSS后看到的第一個(gè)窗口便是數(shù)據(jù)編輯窗口,如圖1.3所示。在數(shù)據(jù)編輯窗口中可以進(jìn)展數(shù)據(jù)的錄入、編輯以及變量屬性的定義和編輯,是SPSS的根本界面。主要由以下幾局部構(gòu)成:標(biāo)題欄、菜單欄、工具欄、編輯欄、變量名欄、觀測圖1.3圖1.3數(shù)據(jù)瀏覽界面菜單欄工具欄編輯欄觀測序號(hào)變量名欄窗口切換標(biāo)簽狀態(tài)欄標(biāo)題欄?標(biāo)題欄:顯示數(shù)據(jù)編輯的數(shù)據(jù)文件名。?菜單欄:通過對(duì)這些菜單的選擇,用戶可以進(jìn)展幾乎所有的SPSS操作。關(guān)于菜單的詳細(xì)的操作步驟將在后續(xù)實(shí)驗(yàn)內(nèi)容中分別介紹。為了方便用戶操作,SPSS軟件把菜單項(xiàng)中常用的命令放到了工具欄里。當(dāng)鼠標(biāo)停留在某個(gè)工具欄按鈕上時(shí),會(huì)自動(dòng)跳出一個(gè)文本框,提示當(dāng)前按鈕的功能。另外,如果用戶對(duì)系統(tǒng)預(yù)設(shè)的工具欄設(shè)置不滿意,也可以用[視圖]→[工具欄]→[設(shè)定]命令對(duì)工具欄按鈕進(jìn)展定義。?編輯欄:可以輸入數(shù)據(jù),以使它顯示在內(nèi)容區(qū)指定的方格里。?變量名欄:列出了數(shù)據(jù)文件中所包含變量的變量名 3?觀測序號(hào):列出了數(shù)據(jù)文件中的所有觀測值。觀測的個(gè)數(shù)通常與樣本容量的大小一致。?窗口切換標(biāo)簽:用于“數(shù)據(jù)視圖〞和“變量視圖〞的切換。即數(shù)據(jù)瀏覽窗口與變量瀏覽窗口。數(shù)據(jù)瀏覽窗口用于樣本數(shù)據(jù)的查看、錄入和修改。變量瀏覽窗口用于變量屬性定義的輸入和修改。?狀態(tài)欄:用于說明顯示SPSS當(dāng)前的運(yùn)行狀態(tài)。SPSS被翻開時(shí),將會(huì)顯示“PASWStatisticsProcessor〞的提示信息?!?〕結(jié)果輸出窗口在SPSS中大多數(shù)統(tǒng)計(jì)分析結(jié)果都將以表和圖的形式在結(jié)果觀察窗口中顯示。窗口右邊局部顯示統(tǒng)計(jì)分析結(jié)果,左邊是導(dǎo)航窗口,用來顯示輸出結(jié)果的目錄,可以通過單擊目錄來展開右邊窗口中的統(tǒng)計(jì)分析結(jié)果。當(dāng)用戶對(duì)數(shù)據(jù)進(jìn)展某項(xiàng)統(tǒng)計(jì)分析,結(jié)果輸出窗口將被自動(dòng)調(diào)出。當(dāng)然,用戶也可以通過雙擊后綴名為.spo的SPSS輸出結(jié)果文件來翻開該窗口。試驗(yàn)1數(shù)據(jù)文件管理一、試驗(yàn)?zāi)康呐c要求通過本試驗(yàn)工程,使學(xué)生理解并掌握SPSS軟件包有關(guān)數(shù)據(jù)文件創(chuàng)立和整理的根本操作,學(xué)習(xí)如何將收集到的數(shù)據(jù)輸入計(jì)算機(jī),建成一個(gè)正確的SPSS數(shù)據(jù)文件,并掌握如何對(duì)原始數(shù)據(jù)文件進(jìn)展整理,包括數(shù)據(jù)查詢,數(shù)據(jù)修改、刪除,數(shù)據(jù)的排序等等。二、試驗(yàn)原理SPSS數(shù)據(jù)文件是一種構(gòu)造性數(shù)據(jù)文件,由數(shù)據(jù)的構(gòu)造和數(shù)據(jù)的內(nèi)容兩局部構(gòu)成,也可以說由變量和觀測兩局部構(gòu)成。一個(gè)典型的SPSS數(shù)據(jù)文件如表2.1所示。表表SPSS2.1數(shù)據(jù)文件構(gòu)造姓名性別年齡…張三451…李四23…2……王五245…觀測變量數(shù)據(jù)內(nèi)容SPSS變量的屬性SPSS中的變量共有10個(gè)屬性,分別是變量名〔Name〕、變量類型〔Type〕、長度〔Width〕、小數(shù)點(diǎn)位置〔Decimals〕、變量名標(biāo)簽〔Label〕、變量名值標(biāo)簽〔Value〕、缺失值〔Missing〕、數(shù)據(jù)列的顯示寬度〔Columns〕、對(duì)其方式〔Align〕和度量尺度〔Measure〕。定義一個(gè)變量至少要定義它的兩個(gè)屬性,即變量名和變量類型,其他屬性可以暫時(shí)采用系統(tǒng)默認(rèn)值,待以后分析過程中如果有需要再對(duì)其進(jìn)展設(shè)置。在spss數(shù)據(jù)編輯窗口中單擊“變量視窗〞標(biāo)簽,進(jìn)入變量視窗界面〔如圖2.1所示〕即可對(duì)變量的各個(gè)屬性進(jìn)展設(shè)置。圖2.1變量視窗三、試驗(yàn)內(nèi)容與步驟1.創(chuàng)立一個(gè)數(shù)據(jù)文件數(shù)據(jù)文件的創(chuàng)立分成三個(gè)步驟:選擇菜單【文件】→【新建】→【數(shù)據(jù)】新建一個(gè)數(shù)據(jù)文件,進(jìn)入數(shù)據(jù)編輯窗口。窗口頂部標(biāo)題為“PASWStatistics數(shù)據(jù)編輯器〞。單擊左下角【變量視窗】標(biāo)簽進(jìn)入變量視圖界面,根據(jù)試驗(yàn)的設(shè)計(jì)定義每個(gè)變量類型。變量定義完成以后,單擊【數(shù)據(jù)視窗】標(biāo)簽進(jìn)入數(shù)據(jù)視窗界面,將每個(gè)具體的變量值錄入數(shù)據(jù)庫單元格內(nèi)。2.讀取外部數(shù)據(jù)當(dāng)前版本的SPSS可以很容易地讀取Excel數(shù)據(jù),步驟如下:按【文件】→【翻開】→【數(shù)據(jù)】的順序使用菜單命令調(diào)出翻開數(shù)據(jù)對(duì)話框,在文件類型下拉列表中選擇數(shù)據(jù)文件,如圖2.2所示。圖2.2OpenFile對(duì)話框選擇要翻開的Excel文件,單擊“翻開〞按鈕,調(diào)出翻開Excel數(shù)據(jù)源對(duì)話框,如圖2.3所示。對(duì)話框中各選項(xiàng)的意義如下:工作表下拉列表:選擇被讀取數(shù)據(jù)所在的Excel工作表。范圍輸入框:用于限制被讀取數(shù)據(jù)在Excel工作表中的位置。圖2.3OpenExcelDataSource對(duì)話框3.?dāng)?shù)據(jù)編輯在SPSS中,對(duì)數(shù)據(jù)進(jìn)展根本編輯操作的功能集中在Edit和Data菜單中。4.SPSS數(shù)據(jù)的保存SPSS數(shù)據(jù)錄入并編輯整理完成以后應(yīng)及時(shí)保存,以防數(shù)據(jù)喪失。保存數(shù)據(jù)文件可以通過【文件】→【保存】或者【文件】→【另存為】菜單方式來執(zhí)行。在數(shù)據(jù)保存對(duì)話框〔如圖2.5所示〕中根據(jù)不同要求進(jìn)展SPSS數(shù)據(jù)保存。圖2.5SPSS數(shù)據(jù)的保存5.數(shù)據(jù)整理在SPSS中,數(shù)據(jù)整理的功能主要集中在【數(shù)據(jù)】和【轉(zhuǎn)換】兩個(gè)主菜單下。數(shù)據(jù)排序〔SortCase〕對(duì)數(shù)據(jù)按照某一個(gè)或多個(gè)變量的大小排序?qū)⒂欣趯?duì)數(shù)據(jù)的總體瀏覽,根本操作說明如下:?選擇菜單【數(shù)據(jù)】→【排列個(gè)案】,翻開對(duì)話框,如圖2.7所示。抽樣〔SelectCase〕在統(tǒng)計(jì)分析中,有時(shí)不需要對(duì)所有的觀測進(jìn)展分析,而可能只對(duì)某些特定的對(duì)象有興趣。利用SPSS的SelectCase命令可以實(shí)現(xiàn)這種樣本篩選的功能。以SPSS安裝配套數(shù)據(jù)文件Growthstudy.sav為例,選擇年齡大于10的觀測,根本操作說明圖2.7排列個(gè)案對(duì)話框如下:?翻開數(shù)據(jù)文件Growthstudy.sav,選擇【數(shù)據(jù)】→【選擇個(gè)案】命令,翻開對(duì)話框,如圖2.8圖2.8選擇個(gè)案對(duì)話框?指定抽樣的方式:【全部個(gè)案】不進(jìn)展篩選;【如果條件滿足】按指定條件進(jìn)展篩選。本例設(shè)置:產(chǎn)品數(shù)量>150,如圖2.9所示;圖2.9選擇個(gè)案對(duì)話框設(shè)置完成以后,點(diǎn)擊continue,進(jìn)入下一步。?確定未被選擇的觀測的處理方法,這里選擇默認(rèn)選項(xiàng)【過濾掉未選定的個(gè)案】。?單擊ok進(jìn)展篩選,結(jié)果如圖2.10圖2.10選擇個(gè)案的結(jié)果〔3〕增加個(gè)案的數(shù)據(jù)合并〔【合并文件】→【添加個(gè)案】〕將新數(shù)據(jù)文件中的觀測合并到原數(shù)據(jù)文件中,在SPSS中實(shí)現(xiàn)數(shù)據(jù)文件縱向合并的方法如下:選擇菜單【數(shù)據(jù)】→【合并文件】→【添加個(gè)案】,如圖2.11,選擇需要追加的數(shù)據(jù)文件,單擊翻開按鈕,彈出AddCases對(duì)話框,如圖2.12。圖2.11選擇個(gè)體數(shù)據(jù)來源的文件圖2.12選擇變量〔4〕增加變量的數(shù)據(jù)合并〔【合并文件】→【添加變量】〕增加變量時(shí)指把兩個(gè)或多個(gè)數(shù)據(jù)文件實(shí)現(xiàn)橫向?qū)?。例如將不同課程的成績文件進(jìn)展合并,收集來的數(shù)據(jù)被放置在一個(gè)新的數(shù)據(jù)文件中。在SPSS中實(shí)現(xiàn)數(shù)據(jù)文件橫向合并的方法如下:選擇菜單【數(shù)據(jù)】→【合并文件】→【添加變量】,選擇合并的數(shù)據(jù)文件,單擊“翻開〞,彈出添加變量,如圖2.12所示。圖2.12?單擊Ok執(zhí)行合并命令。這樣,兩個(gè)數(shù)據(jù)文件將按觀測的順序一對(duì)一地橫向合并。數(shù)據(jù)拆分〔SplitFile〕在進(jìn)展統(tǒng)計(jì)分析時(shí),經(jīng)常要對(duì)文件中的觀測進(jìn)展分組,然后按組分別進(jìn)展分析。例如要求按性別不同分組。在SPSS中具體操作如下:?選擇菜單【數(shù)據(jù)】→【分割文件】,翻開對(duì)話框,如圖2.13所示。圖2.13分割文件對(duì)話框?選擇拆分?jǐn)?shù)據(jù)后,輸出結(jié)果的排列方式,該對(duì)話框提供了3種方式:對(duì)全部觀測進(jìn)展分析,不進(jìn)展拆分;在輸出結(jié)果種將各組的分析結(jié)果放在一起進(jìn)展比擬;按組排列輸出結(jié)果,即單獨(dú)顯示每一分組的分析結(jié)果。?選擇分組變量?選擇數(shù)據(jù)的排序方式?單擊ok按鈕,執(zhí)行操作計(jì)算新變量在對(duì)數(shù)據(jù)文件中的數(shù)據(jù)進(jìn)展統(tǒng)計(jì)分析的過程中,為了更有效地處理數(shù)據(jù)和反映事務(wù)的本質(zhì),有時(shí)需要對(duì)數(shù)據(jù)文件中的變量加工產(chǎn)生新的變量。比方經(jīng)常需要把幾個(gè)變量加總或取加權(quán)平均數(shù),SPSS中通過【計(jì)算】菜單命令來產(chǎn)生這樣的新變量,其步驟如下:?選擇菜單【轉(zhuǎn)換】→【計(jì)算變量】,翻開對(duì)話框,如圖2.14所示。圖2.14ComputeVariable對(duì)話框?在目標(biāo)變量輸入框中輸入生成的新變量的變量名。單擊輸入框下面類型與標(biāo)簽按鈕,在跳出的對(duì)話框中可以對(duì)新變量的類型和標(biāo)簽進(jìn)展設(shè)置。?在數(shù)字表達(dá)式輸入框中輸入新變量的計(jì)算表達(dá)式。例如“年齡>20〞。?單擊【如果】按鈕,彈出子對(duì)話框,如圖2.15所示。包含所有個(gè)體:對(duì)所有的觀測進(jìn)展計(jì)算;如果個(gè)案滿足條件則包括:僅對(duì)滿足條件的觀測進(jìn)展計(jì)算。?單擊Ok按鈕,執(zhí)行命令,則可以在數(shù)據(jù)文件中看到一個(gè)新生成的變量。圖2.15如果…子對(duì)話框四、備擇試驗(yàn)?zāi)澈娇展?8名職員性別和工資情況的調(diào)查數(shù)據(jù),如表2.3所示,試在SPSS中進(jìn)展如下操作:將數(shù)據(jù)輸入到SPSS的數(shù)據(jù)編輯窗口中,將gender定義為字符型變量,將salary定義為數(shù)值型變量,并保存數(shù)據(jù)文件,命名為“試驗(yàn)1-1.sav〞。插入一個(gè)變量income,定義為數(shù)值型變量。將數(shù)據(jù)文件按性別分組查找工資大于40000美元的職工當(dāng)工資大于40000美元時(shí),職工的獎(jiǎng)金是工資的20%;當(dāng)工資小于40000美元時(shí),職工的獎(jiǎng)金是工資的10%,假設(shè)實(shí)際收入=工資+獎(jiǎng)金,計(jì)算所有職工的實(shí)際收入,并添加到income變量中。表2.3某航空公司38名職員情況的調(diào)查數(shù)據(jù)表IdGenderSalaryIdGenderSalary1M$5700020F$262502M$4020021F$388503F$2145022M$217504F$2190023F$240005M$4500024F$169506M$3210025F$211507M$3600026M$310508F$2190027M$603759F$2790028M$3255010F$2400029M$13500011F$3030030M$3120012M$2835031M$3615013M$2775032M$11062514F$3510033M$4200015M$2730034M$9200016M$4080035M$8125017M$4600036F$3135018M$10375037M$2910019M$4230038M$31350試驗(yàn)2描述統(tǒng)計(jì)一、試驗(yàn)?zāi)康呐c要求統(tǒng)計(jì)分析的目的在于研究總體特征。但是,由于各種各樣的原因,我們能夠得到的往往只能是從總體中隨機(jī)抽取的一局部觀察對(duì)象,他們構(gòu)成了樣本,只有通過對(duì)樣本的研究,我們才能對(duì)總體的實(shí)際情況作出可能的推斷。因此描述性統(tǒng)計(jì)分析是統(tǒng)計(jì)分析的第一步,做好這一步是進(jìn)展正確統(tǒng)計(jì)推斷的先決條件。通過描述性統(tǒng)計(jì)分析可以大致了解數(shù)據(jù)的分布類型和特點(diǎn)、數(shù)據(jù)分布的集中趨勢和離散程度,或?qū)?shù)據(jù)進(jìn)展初步的探索性分析〔包括檢查數(shù)據(jù)是否有錯(cuò)誤,對(duì)數(shù)據(jù)分布特征和規(guī)律進(jìn)展初步觀察〕。本本試驗(yàn)旨在于:引到學(xué)生利用正確的統(tǒng)計(jì)方法對(duì)數(shù)據(jù)進(jìn)展適當(dāng)?shù)恼砗惋@示,描述并探索出數(shù)據(jù)內(nèi)在的數(shù)量規(guī)律性,掌握統(tǒng)計(jì)思想,培養(yǎng)學(xué)生學(xué)習(xí)統(tǒng)計(jì)學(xué)的興趣,為繼續(xù)學(xué)習(xí)推斷統(tǒng)計(jì)方法及應(yīng)用各種統(tǒng)計(jì)方法解決實(shí)際問題打下必要而堅(jiān)實(shí)的根基。試驗(yàn)原理描述統(tǒng)計(jì)是統(tǒng)計(jì)分析的根基,它包括數(shù)據(jù)的收集、整理、顯示,對(duì)數(shù)據(jù)中有用信息的提取和分析,通常用一些描述統(tǒng)計(jì)量來進(jìn)展分析。集中趨勢的特征值:算術(shù)平均數(shù)、調(diào)和平均數(shù)、幾何平均數(shù)、眾數(shù)、中位數(shù)等。其中均數(shù)適用于正態(tài)分布和對(duì)稱分布資料,中位數(shù)適用于所有分布類型的資料。離散趨勢的特征值:全距、內(nèi)距、平均差、方差、標(biāo)準(zhǔn)差、標(biāo)準(zhǔn)誤、離散系數(shù)等。其中標(biāo)準(zhǔn)差、方差適用于正態(tài)分布資料,標(biāo)準(zhǔn)誤實(shí)際上反映了樣本均數(shù)的波動(dòng)程度。分布特征值:偏態(tài)系數(shù)、峰度系數(shù)、他們反映了數(shù)據(jù)偏離正態(tài)分布的程度。試驗(yàn)內(nèi)容與步驟下面給出的一個(gè)例題是來自SPSS軟件自帶的數(shù)據(jù)文件“Employee.data〞,該文件包含某公司員工的工資、工齡、職業(yè)等變量,我們將利用此例題給出相關(guān)的描述統(tǒng)計(jì)說明,本例中,我們將以員工的當(dāng)前工資為例,計(jì)算該公司員工當(dāng)前工資的一些描述統(tǒng)計(jì)量,如均值、頻數(shù)、方差等描述統(tǒng)計(jì)量的計(jì)算。1.頻數(shù)分析〔Frequencies〕頻數(shù)分析多適用于離散變量,其功能是描述離散變量的分布特征。頻數(shù)分析多適用于離散變量,其功能是描述離散變量的分布特征。根本統(tǒng)計(jì)分析往往從頻數(shù)分析開場。通過頻數(shù)分析能夠了解變量取值的狀況,對(duì)把握數(shù)據(jù)的分布特征是非常有用的。比方,在某項(xiàng)調(diào)查中,想要知道被調(diào)查者的性別分布狀況。頻數(shù)分析的第一個(gè)根本任務(wù)是編制頻數(shù)分布表。SPSS中的頻數(shù)分布表包括的內(nèi)容有:頻數(shù)〔Frequency〕即變量值落在某個(gè)區(qū)間中的次數(shù)。百分比〔Percent〕即各頻數(shù)占總樣本數(shù)的百分比。有效百分比〔ValidPercent〕即各頻數(shù)占有效樣本數(shù)的百分比。這里有效樣本數(shù)=總樣本-缺失樣本數(shù)。累計(jì)百分比〔CumulativePercent〕即各百分比逐級(jí)累加起來的結(jié)果。終取值為百分之百。頻數(shù)分析的第二個(gè)根本任務(wù)是繪制統(tǒng)計(jì)圖。統(tǒng)計(jì)圖是一種為直接的數(shù)據(jù)刻畫方式,能夠非常清晰直觀地展示變量的取值狀況。頻數(shù)分析中常用的統(tǒng)計(jì)圖包括:條形圖,餅圖,直方圖等。頻數(shù)分析的應(yīng)用步驟在SPSS中的頻數(shù)分析的實(shí)現(xiàn)步驟如下:選擇菜單“【文件】—>【翻開】—>【數(shù)據(jù)】〞在對(duì)話框中找到需要分析的數(shù)據(jù)文件“SPSS/Employeedata〞,然后選擇“翻開〞。選擇菜單“【分析】—>【描述統(tǒng)計(jì)】—>【頻率】〞。如圖2.1所示詢問是否輸出頻數(shù)分布表圖2.1Frequencies對(duì)話框確定所要分析的變量,例如年齡在變量選擇確定之后,在同一窗口上,點(diǎn)擊“Statistics〞按鈕,翻開統(tǒng)計(jì)量對(duì)話框,如以以下圖2.2所示,選擇統(tǒng)計(jì)輸出選項(xiàng)。圖2.2統(tǒng)計(jì)量子對(duì)話框圖2.3Charts子對(duì)話框結(jié)果輸出與分析點(diǎn)擊Frequencies對(duì)話框中的“OK〞按鈕,即得到下面的結(jié)果。表2.4描述性統(tǒng)計(jì)量StatisticsGenderNValidMissing4740表2.4中給出了總樣本量〔N〕,其中變量Gender的有效個(gè)數(shù)〔Valid〕為474個(gè)、缺失值〔missing〕為0。表2.5Gender頻數(shù)分布表FrequencyPercentValidPercentCumulativePercentValidFemaleMale21645.645.645.625854.454.4100.0Total474100.0100.0表2.5中,F(xiàn)requency是頻數(shù),Percent是按總樣本量為分母計(jì)算的百分比,ValidPercent是以有效樣本量為分母計(jì)算的百分比,CumulativePercent是累計(jì)百分比。圖2.5變量Gender的條形圖,圖2.6變量Gender的餅圖。GenderFemaleFemaleMaleGender050100150200250300Frequency圖2.5變量gender的條形圖GenderFemaleGenderMale圖2.6變量gender的餅圖2.描述統(tǒng)計(jì)〔Descriptives〕描述統(tǒng)計(jì)主要對(duì)定距型或定比型數(shù)據(jù)的分布特征作具體分析。描述統(tǒng)計(jì)主要對(duì)定距型或定比型數(shù)據(jù)的分布特征作具體分析。SPSS的【描述】命令專門用于計(jì)算各種描述統(tǒng)計(jì)性統(tǒng)計(jì)量。本節(jié)利用某年國內(nèi)上市公司的財(cái)務(wù)數(shù)據(jù)來介紹描述統(tǒng)計(jì)量在SPSS中的計(jì)算方法。具體操作步驟如下:選擇菜單【分析】→【描述統(tǒng)計(jì)】→【描述】,如圖2.7所示圖2.7描述對(duì)話框?qū)⒋治龅淖兞恳迫隫ariables列表框,例如將每股收益率、凈資產(chǎn)收益率、資產(chǎn)負(fù)債率等2個(gè)變量進(jìn)展描述性統(tǒng)計(jì),以觀察上市公司股權(quán)集中度情況和負(fù)債比率的上下。Savestandardizedvaluesasvariables,對(duì)所選擇的每個(gè)變量進(jìn)展標(biāo)準(zhǔn)化處理,產(chǎn)生相應(yīng)的Z分值,作為新變量保存在數(shù)據(jù)窗口中。其變量名為相應(yīng)變量名前加前綴z。標(biāo)準(zhǔn)化計(jì)算公式:xi?xZi=s 單擊【選項(xiàng)】按鈕,如圖2.8所示,選擇需要計(jì)算的描述統(tǒng)計(jì)量。各描述統(tǒng)計(jì)量同F(xiàn)requencies命令中的Statistics子對(duì)話框中大局部一樣,這里不再重復(fù)。圖2.8選項(xiàng)子對(duì)話框在主對(duì)話框中單擊ok執(zhí)行操作。結(jié)果輸出與分析在結(jié)果輸出窗口中給出了所選變量的相應(yīng)描述統(tǒng)計(jì),如表2.6所示。從表中可以看到,我國上市公司前兩大股東持股比例之比平均高達(dá)102.9,說明“一股獨(dú)大〞的現(xiàn)象比擬嚴(yán)重;前五大股東持股比例之和平均為51.8%,資產(chǎn)負(fù)債率平均為46.78%。另外,從偏態(tài)和峰度指標(biāo)看出,前兩大股東持股比例之比的分布呈現(xiàn)比擬明顯的右偏,而且比擬尖峭。為了驗(yàn)證這一結(jié)論,可以利用Frequencies命令畫出變量z的直方圖,如圖2.9表2.6描述統(tǒng)計(jì)量表DescriptiveStatisticsNMeanStd.SkewnessKurtosisStatisticStatisticStatisticStatisticStd.ErrorStatisticStd.Error前兩大股東持股比例之比前五大股東持股比例的平方和315102.865199.1997464.168.602-.165.13722.404.274.274.274315.51836.1496003.137-.318資產(chǎn)負(fù)債率315.4677.16773.137-.414ValidN(listwise)315Histogram0.000000.00000-2.000008.000006.000004.000002.000000306090120150FrequencyMean=-1.4224733E-16Zscore:前兩大股東持股比例之比 Std.Dev.=1.0000...圖2.9變量Z的直方圖3.探索分析〔Explore〕調(diào)用此過程可對(duì)變量進(jìn)展更為深入詳盡的描述性統(tǒng)計(jì)分析,故稱之為探索分析。它在一般描述性統(tǒng)計(jì)指標(biāo)的根基上,增加有關(guān)數(shù)據(jù)其他特征的文字與圖形描述,顯得更加細(xì)致與全面,對(duì)數(shù)據(jù)分析更進(jìn)一步。探索分析一般通過數(shù)據(jù)文件在分組與不分組的情況下獲得常用統(tǒng)計(jì)量和圖形。一般以圖形方式輸出,直觀幫助研究者確定奇異值、影響點(diǎn)、還可以進(jìn)展假設(shè)檢驗(yàn),以及確定研究者要使用的某種統(tǒng)計(jì)方式是否適宜。在翻開的數(shù)據(jù)文件上,選擇如下命令:選擇菜單“【分析】—>【描述統(tǒng)計(jì)】—>【探索】〞,翻開對(duì)話框。因變量列表;待分析的變量名稱,例如將每股收益率作為研究變量。因子列表:從源變量框中選擇一個(gè)或多個(gè)變量進(jìn)入因子列表,分組變量可以將數(shù)據(jù)按照該觀察值進(jìn)展分組分析。標(biāo)準(zhǔn)個(gè)案:在源變量表中指定一個(gè)變量作為觀察值的標(biāo)識(shí)變量。在輸出欄中,選擇兩者都,表示輸出圖形及描述統(tǒng)計(jì)量。選擇【統(tǒng)計(jì)量】按鈕,選擇想要計(jì)算的描述統(tǒng)計(jì)量。如以下圖對(duì)所要計(jì)算的變量的頻數(shù)分布及其統(tǒng)計(jì)量值作圖翻開“Plots對(duì)話框〞,出現(xiàn)如以以下圖。?結(jié)果的輸出與說明CaseProcessingSummary表在CaseProcessingSummary表中可以看出female有216個(gè)個(gè)體,Male258個(gè)個(gè)體,均無缺失值。Descriptive表DescriptiveGenderStatisticStd.ErrorCurrentSalaryFemaleMean95%ConfidenceIntervalforMean5%TrimmedMeanLowerBound$26,031.92$514.258.166.330$1,213.968.152.302$25,018.29UpperBound$27,045.55$25,248.30MedianVariance$24,300.0057123688.268Std.Deviation$7,558.021MinimumMaximum$15,750$58,125Range$42,375InterquartileRange$7,013Skewness1.863Kurtosis4.641MaleMean$41,441.7895%Confidence LowerBoundIntervalforMean UpperBound5%TrimmedMean$39,051.19$43,832.37$39,445.87Median$32,850.00Variance380219336.303Std.Deviation$19,499.214Minimum$19,650MaximumRange$135,000$115,350InterquartileRange$22,675Skewness1.639Kurtosis2.780職位員工薪水直方圖顯示Histogram$50,000$50,000$40,000$30,000$20,000$60,000CurrentSalary010203040FrequencyMean=$26,031.92Std.Dev.=$7,558.021N=216forgender=Female莖葉圖描述莖葉圖自左向右可以分為3大局部:頻數(shù)〔Frequency〕、莖〔Stem〕和葉〔Leaf〕。莖表示數(shù)值的整數(shù)局部,葉表示數(shù)值的小數(shù)局部。每行的莖和每個(gè)葉組成的數(shù)字相加再乘以莖寬〔StemWidth〕,即莖葉所表示的實(shí)際數(shù)值的近似值。CurrentSalaryStem-and-LeafPlotforgender=FemaleFrequencyStem&Leaf2.001.5516.001.666666666677777714.001.8888999999999931.002.000000000000011111111111111111135.002.2222222222222222222223333333333333338.002.4444444444444444444444444455555555555522.002.666666666667777777777717.002.888888999999999997.003.00011118.003.222333338.003.444445555.003.667772.003.8811.00Extremes(>=40800)Stemwidth:10000Eachleaf:1case(s)箱圖FemaleFemaleMale$0$20,000$40,000$60,000$80,000$100,000$120,000$140,000CurrentSalary4314541063410344634318322421342774131682980240468348371Gender圖中灰色區(qū)域的方箱為箱圖的主體,上中下3條線分別表示變量值的第75、50、25百分位數(shù),因此變量的50%觀察值落在這一區(qū)域中。方箱中的中心粗線為中位數(shù)。箱圖中的觸須線是中間的縱向直線,上端截至線為變量的大值,下端截至線為變量的小值。四、備擇試驗(yàn)完成以下試驗(yàn)內(nèi)容,并按試驗(yàn)〔1〕所附試驗(yàn)報(bào)告的格式撰寫報(bào)告。1.表2.7為某班級(jí)16位學(xué)生的身高數(shù)據(jù),對(duì)其進(jìn)展頻數(shù)分析,并對(duì)實(shí)驗(yàn)報(bào)告作出說明。表2.7某班16位學(xué)生的身高數(shù)據(jù)學(xué)號(hào)性別身高〔cm〕學(xué)號(hào)性別身高〔cm〕1M1709M1502F17310M1573F16911F1774M15512M1605F17413F1696F17814M1547M15615F1728F17116F1802.測量18臺(tái)電腦筆記重量,見表2.8,對(duì)其進(jìn)展描述統(tǒng)計(jì)量分析,并對(duì)試驗(yàn)結(jié)果作出說明。表2.818臺(tái)筆記本電腦重量表序號(hào)123456789重量1.751.921.591.851.831.681.891.701.79序號(hào)101112131415161718重量1.661.801.832.051.911.761.881.831.79試驗(yàn)3:統(tǒng)計(jì)推斷一、試驗(yàn)?zāi)康呐c要求1.熟悉點(diǎn)估計(jì)概念與操作方法2.熟悉區(qū)間估計(jì)的概念與操作方法3.熟練掌握T檢驗(yàn)的SPSS操作4.學(xué)會(huì)利用T檢驗(yàn)方法解決身邊的實(shí)際問題二、試驗(yàn)原理1.參數(shù)估計(jì)的根本原理2.假設(shè)檢驗(yàn)的根本原理三、試驗(yàn)演示內(nèi)容與步驟1.單個(gè)總體均值的區(qū)間估計(jì)例題:為研究在黃金時(shí)段中,即每晚8:30-9:00內(nèi),電視廣告所占時(shí)間的多少。美國廣告協(xié)會(huì)抽樣調(diào)查了20個(gè)佳電視時(shí)段中廣告所占的時(shí)間〔單位:分鐘〕。請(qǐng)給出每晚8:30開場的半小時(shí)內(nèi)廣告所占時(shí)間區(qū)間估計(jì),給定的置信度為95%。操作程序:?翻開SPSS,建設(shè)數(shù)據(jù)文件:“電視節(jié)目市場調(diào)查.sav〞。這里,研究變量為:time,即每天看電視的時(shí)間。?選擇區(qū)間估計(jì)選項(xiàng),方法如下:選擇菜單【分析】—>【描述統(tǒng)計(jì)】—>【探索】〞,翻開圖3.1Explore對(duì)話框。?從源變量清單中將“time〞變量移入DependentList框中。圖3.1Explore對(duì)話框?單擊上圖右方的“統(tǒng)計(jì)量〞按鈕翻開“探索:統(tǒng)計(jì)量〞對(duì)話框。在設(shè)置均值的置信水平,如鍵入95%,完成后單擊“繼續(xù)〞按鈕回到主窗口。圖3.2探索統(tǒng)計(jì)量設(shè)置窗口?返回主窗口點(diǎn)擊ok運(yùn)行操作。?計(jì)算結(jié)果簡單說明:表3.1描述統(tǒng)計(jì)量DescriptiveStatisticStd.ErrortimeMean6.5350.1348095%ConfidenceIntervalforMeanLowerBound6.2529UpperBound6.81715%TrimmedMeanMedian6.51676.4500Variance.363Std.Deviation.60287Minimum5.60Maximum7.80Range2.20InterquartileRange.95Skewness.295.512Kurtosis-.612.992?如上表顯示。從上表“95%ConfidenceIntervalforMean〞中可以得出,每晚8:30開場的半小時(shí)內(nèi)廣告所占時(shí)間區(qū)間估計(jì)〔置信度為95%〕為:(6.2529,6.8171),其中l(wèi)owerBound表示置信區(qū)間的下限,UpperBound表示置信區(qū)間的上限。點(diǎn)估計(jì)是:6.5350。2.兩個(gè)總體均值之差的區(qū)間估計(jì)例題:TheWallStreetJournal〔1994,7〕聲稱在制造業(yè)中,參加工會(huì)的婦女比未參加工會(huì)的婦女的報(bào)酬要多2.5美元。想通過統(tǒng)計(jì)方法,對(duì)這個(gè)觀點(diǎn)是否正確給出檢驗(yàn)。假設(shè)抽取了7位女性工會(huì)會(huì)員與8位非工會(huì)會(huì)員女性報(bào)酬數(shù)據(jù)。要求對(duì)制造業(yè)中參加工會(huì)會(huì)員的女性報(bào)酬與未參加工會(huì)的女性報(bào)酬平均工資之差進(jìn)展區(qū)間估計(jì),預(yù)設(shè)的置信度為95%。?翻開SPSS,按如以以下圖示格式輸入原始數(shù)據(jù),建設(shè)數(shù)據(jù)文件:“工會(huì)會(huì)員工資差異.spss〞。這里,“會(huì)員〞表示是否為工會(huì)會(huì)員的變量,y表示是工會(huì)會(huì)員,n表示非工會(huì)會(huì)員,“報(bào)酬〞表示女性員工報(bào)酬變量,單位:千美元。?計(jì)算兩總體均值之差的區(qū)間估計(jì),采用“獨(dú)立樣本T檢驗(yàn)〞方法。選擇菜單“【分析】→【比擬均值】→獨(dú)立樣本T檢驗(yàn)〞,翻開對(duì)話框。?變量選擇從源變量清單中將“報(bào)酬〞變量移入檢驗(yàn)變量框中。表示要求該變量的均值的區(qū)間估計(jì)。從源變量清單中將“group〞變量移入分組變量框中。表示總體的分類變量。圖3.3獨(dú)立樣本T檢驗(yàn)對(duì)話框?定義分組單擊定義組按鈕,翻開DefineGroups對(duì)話框。在Group1中輸入1,在Group2中輸入2〔1表示非工會(huì)會(huì)員,2表示工會(huì)會(huì)員〕。完成后單擊“繼續(xù)〞按鈕回到主窗口。圖3.4definegroups設(shè)置窗口?計(jì)算結(jié)果單擊上圖中“OK〞按鈕,輸出結(jié)果如以以下圖所示。GroupStatistics〔分組統(tǒng)計(jì)量〕表分別給出不同總體下的樣本容量、均值、標(biāo)準(zhǔn)差和平均標(biāo)準(zhǔn)誤。從該表中可以看出,參加工會(huì)的婦女平均報(bào)酬為19.925,不參加工會(huì)的婦女平均報(bào)酬為20.1429。表3.2分組統(tǒng)計(jì)量GroupStatistics會(huì)員NMeanStd.DeviationStd.ErrorMean報(bào)酬1.002.00819.925020.1429.46522.52236.16448.197437IndependentSampleTest〔獨(dú)立樣本T檢驗(yàn)〕表Levene’sTestforEqualityofVariance,為方差檢驗(yàn),在Equalvariancesassumed〔原假設(shè):方差相等〕下,F(xiàn)=0.623,因?yàn)槠銹-值大于顯著性水平,即:Sig.=0.444>0.05,說明不能拒絕方差相等的原假設(shè),承受兩個(gè)總體方差是相等的假設(shè)。因此參加工會(huì)會(huì)員的女性報(bào)酬與未參加工會(huì)的女性報(bào)酬平均工資之差95%的區(qū)間估計(jì)為[0.76842,0.33271]。T-testforEqualityofMeans為檢驗(yàn)總體均值是否相等的t檢驗(yàn),由于在本例中,其P-值大于顯著性水平,即:Sig.=0.408>0.05,因此不應(yīng)該拒絕原假設(shè),也就是說參加工會(huì)的婦女跟未參加工會(huì)的婦女的報(bào)酬沒有顯著差異。本次抽樣推斷結(jié)論不支持TheWallStreetJournal〔1994,7〕提出的“參加工會(huì)的婦女比未參加工會(huì)的婦女的報(bào)酬要多2.5美元〞觀點(diǎn),即參加工會(huì)的婦女不比未參加工會(huì)的婦女的報(bào)酬多。表3.3獨(dú)立樣本T檢驗(yàn)結(jié)果IndependentSamplesTestLevene'sTestforEqualityofVariancest-testforEqualityofMeansFSig.tdfSig.(2-tailed)MeanDifferenceStd.ErrorDifference95%ConfidenceIntervaloftheDifferenceLowerUpper報(bào)酬EqualvariancesassumedEqualvariancesnotassumed.623.444-.85513.408.413-.21786.25485.25697-.76842-.77679.33271.34108-.84812.187-.217863.單個(gè)總體均值的假設(shè)檢驗(yàn)〔單樣本T檢驗(yàn)〕例子:某種品牌的沐浴肥皂制造程序的設(shè)計(jì)規(guī)格中要求每批平均生產(chǎn)120塊肥皂,高于或低于該數(shù)量均被認(rèn)為是不合理的,在由10批產(chǎn)品所組成的一個(gè)樣本中,每批肥皂的產(chǎn)量數(shù)據(jù)見下表,在0.05的顯著水平下,檢驗(yàn)該樣本結(jié)果能否說明制造過程運(yùn)行良好?判斷檢驗(yàn)類型該例屬于“大樣本、總體標(biāo)準(zhǔn)差σ未知。假設(shè)形式為:H0:μ=μ0,H1:μ≠μ0?軟件實(shí)現(xiàn)程序翻開數(shù)據(jù)文件,然后選擇菜單“【分析】→【比擬均值】→單樣本T檢驗(yàn)〞,翻開One-SampleTTest對(duì)話框。從源變量清單中將“產(chǎn)品數(shù)量〞向右移入“TestVariables〞框中。圖3.5one-sampleTtest窗口在“TestValue〞框里輸入一個(gè)指定值〔即假設(shè)檢驗(yàn)值,本例中假設(shè)為120〕,T檢驗(yàn)過程將對(duì)每個(gè)檢驗(yàn)變量分別檢驗(yàn)它們的平均值與這個(gè)指定數(shù)值相等的假設(shè)。?“One-SampleTTest〞窗口中“OK〞按鈕,輸出結(jié)果如下表所示?!癘ne-SampleStatistics〞〔單個(gè)樣本的統(tǒng)計(jì)量〕表分別給出樣本的容量、均值、標(biāo)準(zhǔn)差和平均標(biāo)準(zhǔn)誤。本例中,產(chǎn)品數(shù)量均值為118.9000。表3.4單樣本統(tǒng)計(jì)量One-SampleStatisticsNMeanStd.DeviationStd.ErrorMean產(chǎn)品數(shù)量10118.90004.931761.55956“One-SampleTest〞〔單個(gè)樣本的檢驗(yàn)〕表表中的t表示所計(jì)算的T檢驗(yàn)統(tǒng)計(jì)量的數(shù)值,本例中為-0.705。表中的“df〞,表示自由度,本例中為9。表中的“Sig〞〔雙尾T檢驗(yàn)〕,表示統(tǒng)計(jì)量的P-值,并與雙尾T檢驗(yàn)的顯著性的大小進(jìn)展比擬:Sig.=0.498>0.05,說明這批樣本的平均產(chǎn)量與120無顯著差異。表中的“MeanDifference〞,表示均值差,即樣本均值與檢驗(yàn)值120之差,本例中為-1.1000。表中的“95%ConfidenceInternaloftheDifference〞,樣本均值與檢驗(yàn)值偏差的95%置信區(qū)間為〔-4.628,2.428〕,置信區(qū)間包括數(shù)值0,說明樣本數(shù)量與120無顯著差異,符合要求。表3.5單樣本T檢驗(yàn)結(jié)果One-SampleTestTestValue=120Sig.(2-tailed)95%ConfidenceIntervaloftheDifferenceMeanDifferenceLowerUppertdf產(chǎn)品數(shù)量-.7059.498-1.10000-4.62802.42804.兩獨(dú)立樣本的假設(shè)檢驗(yàn)〔兩獨(dú)立樣本T檢驗(yàn)〕例題:TheWallStreetJournal〔1994,7〕聲稱在制造業(yè)中,參加工會(huì)的婦女比未參加工會(huì)的婦女的報(bào)酬要多2.5美元。想通過統(tǒng)計(jì)方法,對(duì)這個(gè)觀點(diǎn)是否正確給出檢驗(yàn)。假設(shè)抽取了7位女性工會(huì)會(huì)員與8位非工會(huì)會(huì)員女性報(bào)酬數(shù)據(jù)。要求對(duì)制造業(yè)中參加工會(huì)會(huì)員的女性報(bào)酬與未參加工會(huì)的女性報(bào)酬平均工資之差進(jìn)展區(qū)間估計(jì),預(yù)設(shè)的置信度為95%。?翻開SPSS,按如以以下圖示格式輸入原始數(shù)據(jù),建設(shè)數(shù)據(jù)文件:“工會(huì)會(huì)員工資差異.sav〞。這里,“會(huì)員〞表示是否為工會(huì)會(huì)員的變量,y表示是工會(huì)會(huì)員,n表示非工會(huì)會(huì)員,“報(bào)酬〞表示女性員工報(bào)酬變量,單位:千美元。?計(jì)算兩總體均值之差的區(qū)間估計(jì),采用“獨(dú)立樣本T檢驗(yàn)〞方法。選擇菜單“【分析】→【比擬均值】→【獨(dú)立樣本T檢驗(yàn)】〞。從源變量清單中將“報(bào)酬〞變量移入檢驗(yàn)變量框中。表示要求該變量的均值的檢驗(yàn)。從源變量清單中將“會(huì)員〞變量移入分組變量框中。表示總體的分類變量。圖3.6sampleTtest窗口?定義分組單擊GroupingVariable框下面的DefineGroups按鈕,翻開DefineGroups對(duì)話框。在Group1中輸入1,在Group2中輸入2〔1表示非工會(huì)會(huì)員,2表示工會(huì)會(huì)員〕。完成后單擊“繼續(xù)〞按鈕返回主窗口。圖3.7definegroups對(duì)話框?計(jì)算結(jié)果單擊上圖中“OK〞按鈕,輸出結(jié)果如以以下圖所示。GroupStatistics〔分組統(tǒng)計(jì)量〕表分別給出不同總體下的樣本容量、均值、標(biāo)準(zhǔn)差和平均標(biāo)準(zhǔn)誤。從該表中可以看出,參加工會(huì)的婦女平均報(bào)酬為19.925,不參加工會(huì)的婦女平均報(bào)酬為20.1429。表3.6分組統(tǒng)計(jì)量GroupStatistics會(huì)員NMeanStd.DeviationStd.ErrorMean報(bào)酬1.002.00819.925020.1429.46522.52236.16448.197437IndependentSampleTest〔獨(dú)立樣本T檢驗(yàn)〕表Levene’sTestforEqualityofVariance,為方差檢驗(yàn),在Equalvariancesassumed〔原假設(shè):方差相等〕下,F(xiàn)=0.623,因?yàn)槠銹-值大于顯著性水平,即:Sig.=0.444>0.05,說明不能拒絕方差相等的原假設(shè),承受兩個(gè)總體方差是相等的假設(shè)。T-testforEqualityofMeans為檢驗(yàn)總體均值是否相等的t檢驗(yàn),由于在本例中,其P-值大于顯著性水平,即:Sig.=0.408>0.05,因此不應(yīng)該拒絕原假設(shè),也就是說參加工會(huì)的婦女跟未參加工會(huì)的婦女的報(bào)酬沒有顯著差異。本次抽樣推斷結(jié)論不支持TheWallStreetJournal〔1994,7〕提出的“參加工會(huì)的婦女比未參加工會(huì)的婦女的報(bào)酬要多2.5美元〞觀點(diǎn),即參加工會(huì)的婦女不比未參加工會(huì)的婦女的報(bào)酬多。表3.7獨(dú)立樣本T檢驗(yàn)結(jié)果IndependentSamplesTestLevene'sTestforEqualityofVariancest-testforEqualityofMeansFSig.tdfSig.(2-tailed)MeanDifferenceStd.ErrorDifference95%ConfidenceIntervaloftheDifferenceLowerUpper報(bào)酬EqualvariancesassumedEqualvariancesnotassumed.623.444-.85513.408.413-.21786.25485.25697-.76842-.77679.33271.34108-.84812.187-.217865.配對(duì)樣本T檢驗(yàn)配對(duì)樣本是對(duì)應(yīng)獨(dú)立樣本而言的,配對(duì)樣本是指一個(gè)樣本在不同時(shí)間做了兩次試驗(yàn),或者具有兩個(gè)類似的記錄,從而比擬其差異;獨(dú)立樣本檢驗(yàn)是指不同樣本平均數(shù)的比擬,而配對(duì)樣本檢驗(yàn)往往是對(duì)一樣樣本二次平均數(shù)的檢驗(yàn)。配對(duì)樣本T檢驗(yàn)的前提條件為:第一,兩樣本必須是配對(duì)的。即兩樣本的觀察值數(shù)目一樣,兩樣本的觀察值順序不隨意更改。第二,樣本來自的兩個(gè)總體必須服從正態(tài)分布。例如針對(duì)試驗(yàn)前學(xué)習(xí)成績何智商一樣的兩組學(xué)生,分別進(jìn)展不同教學(xué)方法的訓(xùn)練,進(jìn)展一段時(shí)間試驗(yàn)教學(xué)后,比擬參與試驗(yàn)的兩組學(xué)生的學(xué)習(xí)成績是否存在顯著性差異。假設(shè)某校為了檢驗(yàn)進(jìn)展新式培訓(xùn)前后學(xué)生的學(xué)習(xí)成績是否有了顯著提高,從全校學(xué)生中隨機(jī)抽出30名進(jìn)展測試,這些學(xué)生培訓(xùn)前后的考試成績放置于數(shù)據(jù)文件“學(xué)生培訓(xùn).sav〞中。在SPSS中對(duì)這30名學(xué)生的成績進(jìn)展配對(duì)樣本t檢驗(yàn)的操作步驟如下:?選擇菜單【分析】→【比擬均值】→【配對(duì)樣本T檢驗(yàn)】,翻開對(duì)話框,如圖3.8所示,將兩個(gè)配對(duì)變量移入右邊的PairVariables列表框中。移動(dòng)的方法是先選擇其中的一個(gè)配對(duì)變量,再選擇第二個(gè)配對(duì)變量,接著單擊中間的箭頭按鈕。圖3.8Paired-SamplesTTest對(duì)話框?選項(xiàng)按鈕的用于設(shè)置置信度選項(xiàng),這里保持系統(tǒng)默認(rèn)的95%?在主對(duì)話框中單擊ok按鈕,執(zhí)行操作。?實(shí)例結(jié)果分析表3.8和表3.9給出了培訓(xùn)前后學(xué)生考試成績的均值、標(biāo)準(zhǔn)差、均值標(biāo)準(zhǔn)誤差以及培訓(xùn)前后成績的相關(guān)系數(shù)。從表3.8來看,培訓(xùn)前后平均成績并沒有發(fā)生顯著的提高。表3.10給出了配對(duì)樣本t檢驗(yàn)結(jié)果,包括配對(duì)變量差值的均值、標(biāo)準(zhǔn)差、均值標(biāo)準(zhǔn)誤差以及差值的95%置信度下的區(qū)間估計(jì)。當(dāng)然也給出了為重要的t統(tǒng)計(jì)量和p值。結(jié)果顯示p=0.246>0.05,所以,學(xué)校的所謂新式培訓(xùn)并未帶來學(xué)生成績的顯著變化。表3.8培訓(xùn)前后成績的描述統(tǒng)計(jì)量PairedSamplesStatisticsMeanNStd.DeviationStd.ErrorMeanPair1培訓(xùn)前67.003014.7342.690培訓(xùn)后68.603012.9472.364表3.9培訓(xùn)前后成績的相關(guān)系數(shù)PairedSamplesCorrelationsNCorrelationSig.Pair1培訓(xùn)前&培訓(xùn)后30.865.000表3.10配對(duì)樣本T檢驗(yàn)結(jié)果PairedSamplesTestPairedDifferencestdfSig.(2-tailed)MeanStd.DeviationStd.ErrorMean95%ConfidenceIntervaloftheDifferenceLowerUpperPair1培訓(xùn)前-培訓(xùn)后-1.6007.3981.351-4.3621.162-1.18529.246四、備擇試驗(yàn)1.某省大學(xué)生四級(jí)英語測驗(yàn)平均成績?yōu)?5,現(xiàn)從某高校隨機(jī)抽取20份試卷,其分?jǐn)?shù)為:72、76、68、78、62、59、64、85、70、75、61、74、87、83、54、76、56、66、68、62,問該校英語水平與全區(qū)是否根本一致設(shè)α=0.052.分析某班級(jí)學(xué)生的高考數(shù)學(xué)成績是否存在性別上的差異。數(shù)據(jù)如表所示:某班級(jí)學(xué)生的高考數(shù)學(xué)成績性別數(shù)學(xué)成績男〔n=18〕858975588680787684899995828760 857580女〔n=12〕92968683788770657065707872563.SPSS自帶的數(shù)據(jù)文件world95.sav中,保存了1995年世界上109個(gè)國家和地區(qū)的局部指標(biāo)的數(shù)據(jù),其中變量“l(fā)ifeexpf〞,“l(fā)ifeexpm〞分別為各國或地區(qū)女性和男性人口的平均壽命。假設(shè)將這兩個(gè)指標(biāo)數(shù)據(jù)作為樣本,試用配對(duì)樣本T檢驗(yàn),女性人口的平均壽命是否確實(shí)比男性人口的平均壽命長,并給出差異的置信區(qū)間。〔設(shè)α=0.05〕試驗(yàn)4:方差分析一、試驗(yàn)?zāi)繕?biāo)與要求1.幫助學(xué)生深入了解方差及方差分析的根本概念,掌握方差分析的根本思想和原理2.掌握方差分析的過程。3.增強(qiáng)學(xué)生的實(shí)踐能力,使學(xué)生能夠利用SPSS統(tǒng)計(jì)軟件,熟練進(jìn)展單因素方差分析、兩因素方差分析等操作,激發(fā)學(xué)生的學(xué)習(xí)興趣,增強(qiáng)自我學(xué)習(xí)和研究的能力。二、試驗(yàn)原理在現(xiàn)實(shí)的生產(chǎn)和經(jīng)營管理過程中,影響產(chǎn)品質(zhì)量、數(shù)量或銷量的因素往往很多。例如,農(nóng)作物的產(chǎn)量受作物的品種、施肥的多少及種類等的影響;某種商品的銷量受商品價(jià)格、質(zhì)量、廣告等的影響。為此引入方差分析的方法。方差分析也是一種假設(shè)檢驗(yàn),它是對(duì)全部樣本觀測值的變動(dòng)進(jìn)展分解,將某種控制因素下各組樣本觀測值之間可能存在的由該因素導(dǎo)致的系統(tǒng)性誤差與隨即誤差加以比擬,據(jù)以推斷各組樣本之間是否存在顯著差異。假設(shè)存在顯著差異,則說明該因素對(duì)各總體的影響是顯著的。方差分析有3個(gè)根本的概念:觀測變量、因素和水平。觀測變量是進(jìn)展方差分析所研究的對(duì)象;因素是影響觀測變量變化的客觀或人為條件;因素的不同類別或不通取值則稱為因素的不同水平。在上面的例子中,農(nóng)作物的產(chǎn)量和商品的銷量就是觀測變量,作物的品種、施肥種類、商品價(jià)格、廣告等就是因素。在方差分析中,因素常常是某一個(gè)或多個(gè)離散型的分類變量。根據(jù)觀測變量的個(gè)數(shù),可將方差分析分為單變量方差分析和多變量方差分析;根據(jù)因素個(gè)數(shù),可分為單因素方差分析和多因素方差分析。在SPSS中,有One-wayANOVA(單變量-單因素方差分析)、GLMUnivariate〔單變量多因素方差分析〕;GLMMultivariate〔多變量多因素方差分析〕,不同的方差分析方法適用于不同的實(shí)際情況。本節(jié)僅練習(xí)為常用的單因素單變量方差分析。三、試驗(yàn)演示內(nèi)容與步驟單因素方差分析也稱一維方差分析,對(duì)兩組以上的均值加以比擬。檢驗(yàn)由單一因素影響的一個(gè)分析變量由因素各水平分組的均值之間的差異是否有統(tǒng)計(jì)意義。并可以進(jìn)展兩兩組間均值的比擬,稱作組間均值的多重比擬。主要采用One-wayANOVA過程。采用One-wayANOVA過程要求:因變量屬于正態(tài)分布總體,假設(shè)因變量的分布明顯是非正態(tài),應(yīng)該用非參數(shù)分析過程。假設(shè)對(duì)被觀測對(duì)象的試驗(yàn)不是隨機(jī)分組的,而是進(jìn)展的重復(fù)測量形成幾個(gè)彼此不獨(dú)立的變量,應(yīng)該用RepeatedMeasure菜單項(xiàng),進(jìn)展重復(fù)測量方差分析,條件滿足時(shí),還可以進(jìn)展趨勢分析。假設(shè)某汽車經(jīng)銷商為了研究東部、西部和中部地區(qū)市場上汽車的銷量是否存在顯著差異,在每個(gè)地區(qū)隨機(jī)抽取幾個(gè)城市進(jìn)展調(diào)查統(tǒng)計(jì),調(diào)查數(shù)據(jù)放置于數(shù)據(jù)文件“汽車銷量調(diào)查.sav〞中。在SPSS中試驗(yàn)該檢驗(yàn)的步驟如下:?步驟1:選擇菜單【分析】→【比擬均值】→【單因素方差分析】,依次將觀測變量銷量移入因變量列表框,將因素變量地區(qū)移入因子列表框。圖4.1One-WayANOVA對(duì)話框?單擊兩兩比擬按鈕,如圖4.2,該對(duì)話框用于進(jìn)展多重比擬檢驗(yàn),即各因素水平下觀測變量均值的兩兩比擬。方差分析的原假設(shè)是各個(gè)因素水平下的觀測變量均值都相等,備擇假設(shè)是各均值不完全相等。假設(shè)一次方差分析的結(jié)果是拒絕原假設(shè),我們只能判斷各觀測變量均值不完全相等,卻不能得出各均值完全不相等的結(jié)論。各因素水平下觀測變量均值的更為細(xì)致的比擬就需要用多重比擬檢驗(yàn)。圖4.2兩兩比擬對(duì)話框假定方差齊性選項(xiàng)欄中給出了在觀測變量滿足不同因素水平下的方差齊性條件下的多種檢驗(yàn)方法。這里選擇常用的LSD檢驗(yàn)法;未假定方差齊性選項(xiàng)欄中給出了在觀測變量不滿足方差齊性條件下的多種檢驗(yàn)方法。這里選擇Tamhane’sT2檢驗(yàn)法;Significancelevel輸入框中用于輸入多重比擬檢驗(yàn)的顯示性水平,默認(rèn)為5%。?單擊選項(xiàng)按鈕,彈出options子對(duì)話框,如以下圖。在對(duì)話框中選中描述性復(fù)選框,輸出不同因素水平下觀測變量的描述統(tǒng)計(jì)量;選擇方差同質(zhì)性檢驗(yàn)復(fù)選框,輸出方差齊性檢驗(yàn)結(jié)果;選中均值圖復(fù)選框,輸出不同因素水平下觀測變量的均值直線圖。?在主對(duì)話框中點(diǎn)擊ok按鈕,可以得到單因素分析的結(jié)果。試驗(yàn)結(jié)果分析:表4.1給出了不同地區(qū)汽車銷量的根本描述統(tǒng)計(jì)量以及95%的置信區(qū)間。圖4.3選項(xiàng)子對(duì)話框表4.1各個(gè)地區(qū)汽車銷量描述統(tǒng)計(jì)量Descriptive銷量NMeanStd.DeviationStd.Error95%ConfidenceIntervalforMeanMinimumMaximumLowerBoundUpperBound西中10157.9022.27819.71730.92727.8457.045141.96161.29167.54163.37173.841201949176.446.572191.60135198東7196.1411.689224.75145224Total26174.625.461185.86120224表4.2給出了Levene方差齊性檢驗(yàn)結(jié)果。從表中可以看到,Levene統(tǒng)計(jì)量對(duì)應(yīng)的p值大于0.05,所以得到不同地區(qū)汽車銷量滿足方差齊性的結(jié)論。表表4.2各地區(qū)汽車銷量方差齊性檢驗(yàn)表TestofHomogeneityofVariancesLeveneStatisticdf1df2Sig.1.262223.302Levene統(tǒng)計(jì)量對(duì)應(yīng)的p值大于0.05,所以得到不同地區(qū)汽車銷量滿足方差齊性的結(jié)論。表4.3是單因素方差分析,輸出的方差分析表解釋如下:總離差SST=19384.154,組間平方和SSR=6068.174,組內(nèi)平方和或殘差平方和SSE=13315.979,相應(yīng)的自由度分別為25,2,23;組間均方差MSR=3034.087,組內(nèi)均方差578.956,F(xiàn)=5.241,由于p=0.013<0.05說明在α=0.05顯著性水平下,F(xiàn)檢驗(yàn)是顯著的。即認(rèn)為各個(gè)地區(qū)的汽車銷量并不完全一樣。表4.3單因素方差分析結(jié)果ANOVA銷量SumofSquaresdfMeanSquareFSig.BetweenGroupsWithinGroups6068.17423034.0875.241.01313315.97923578.956Total19384.15425表4.4多重比擬檢驗(yàn)結(jié)果MultipleComparisonsDependentVariable:銷量95%ConfidenceIntervalMeanDifference(I-J)LowerBoundUpperBound(I)地區(qū)(J)地區(qū)Std.ErrorSig.LSD西中東-18.54411.055.107-41.414.33-13.7141.415.3962.7744.786.96.6144.0518.9177.1058.31-38.243(*)11.858.004-62.77中東西中東西18.54411.055.107-4.33東-19.69812.126.118-44.78西中38.243(*)11.858.00413.7119.69812.126.118-5.39Tamhane中-18.5449.635.199-44.05東-38.24313.648.054-77.10西東西中18.5449.635.199-6.96-19.69813.410.436-58.3138.24313.648.054-.6119.69813.410.436-18.91*Themeandifferenceissignificantatthe.05level.如前所述,拒絕單因素方差分析原假設(shè)并不能得出各地區(qū)汽車銷量均值完全不等的結(jié)論。各地區(qū)銷量均值的兩兩比擬要看表4.4所示的多重比擬檢驗(yàn)結(jié)果。表中上半局部為LSD檢驗(yàn)結(jié)果,下半局部為Tamhane檢驗(yàn)結(jié)果。由于方差滿足齊性,所以這里應(yīng)該看LSD檢驗(yàn)結(jié)果。表中的Meandifference列給出了不同地區(qū)汽車銷量的平均值之差。其中后面帶“﹡〞號(hào)的表示銷量有顯著差異,沒有帶“﹡〞號(hào)的表示沒有顯著差異。可以看出,東部和西部汽車銷量存在顯著差異,而中部與東部、中部與西部汽車銷量并沒有什么顯著差異。這一結(jié)論也可以從表中Sig列給出的p值大小得到印證。四、備擇試驗(yàn)1.用SPSS進(jìn)展單因素方差分析。某個(gè)年級(jí)有三個(gè)小班,他們進(jìn)展了一次數(shù)據(jù)考試,現(xiàn)從各班隨機(jī)地抽取了一些學(xué)生,記錄其成績?nèi)绫?。原始?shù)據(jù)文件保存為“數(shù)學(xué)考試成績.sav〞。試在顯著性水平0.05下檢驗(yàn)各班級(jí)的平均分?jǐn)?shù)有無顯著差異。數(shù)學(xué)考試成績表ⅠⅡⅢ7366887768418960783179598245487856684393916291538036517671797377859671157879748087757687568597892.某學(xué)校給3組學(xué)生以3種不同方式輔導(dǎo)學(xué)習(xí),一個(gè)學(xué)期后,學(xué)生獨(dú)立思考水平提高的成績?nèi)绫硭?。學(xué)生獨(dú)立思考水平提高的成績方式137424243414245464140方式249484848474546474849方式333333532313534323233問:該數(shù)據(jù)中的因變量是什么因素又是什么如何建設(shè)數(shù)據(jù)文件對(duì)該數(shù)據(jù)進(jìn)展方差分析,檢驗(yàn)3種方式的影響是否存在顯著差異試驗(yàn)5:相關(guān)分析與回歸分析一、試驗(yàn)?zāi)繕?biāo)與要求本試驗(yàn)工程的目的是學(xué)習(xí)并使用SPSS軟件進(jìn)展相關(guān)分析和回歸分析,具體包括:皮爾遜pearson簡單相關(guān)系數(shù)的計(jì)算與分析學(xué)會(huì)在SPSS上實(shí)現(xiàn)一元及多元回歸模型的計(jì)算與檢驗(yàn)。學(xué)會(huì)回歸模型的散點(diǎn)圖與樣本方程圖形。學(xué)會(huì)對(duì)所計(jì)算結(jié)果進(jìn)展統(tǒng)計(jì)分析說明。要求試驗(yàn)前,了解回歸分析的如下內(nèi)容。?參數(shù)α、β的估計(jì)?回歸模型的檢驗(yàn)方法:回歸系數(shù)β的顯著性檢驗(yàn)〔t-檢驗(yàn)〕;回歸方程顯著性檢驗(yàn)〔F-檢驗(yàn)〕。二、試驗(yàn)原理1.相關(guān)分析的統(tǒng)計(jì)學(xué)原理相關(guān)分析使用某個(gè)指標(biāo)來說明現(xiàn)象之間相互依存關(guān)系的密切程度。用來測度簡單線性相關(guān)關(guān)系的系數(shù)是Pearson簡單相關(guān)系數(shù)。2.回歸分析的統(tǒng)計(jì)學(xué)原理相關(guān)關(guān)系不等于因果關(guān)系,要明確因果關(guān)系必須借助于回歸分析?;貧w分析是研究兩個(gè)變量或多個(gè)變量之間因果關(guān)系的統(tǒng)計(jì)方法。其根本思想是,在相關(guān)分析的根基上,對(duì)具有相關(guān)關(guān)系的兩個(gè)或多個(gè)變量之間數(shù)量變化的一般關(guān)系進(jìn)展測定,確立一個(gè)適宜的數(shù)據(jù)模型,以便從一個(gè)量推斷另一個(gè)未知量?;貧w分析的主要任務(wù)就是根據(jù)樣本數(shù)據(jù)估計(jì)參數(shù),建設(shè)回歸模型,對(duì)參數(shù)和模型進(jìn)展檢驗(yàn)和判斷,并進(jìn)展預(yù)測等。線性回歸數(shù)學(xué)模型如下:yi=β0+β1xi1+β2xi2++βkxik+εi在模型中,回歸系數(shù)是未知的,可以在已有樣本的根基上,使用小二乘法對(duì)回歸系數(shù)進(jìn)展估計(jì),得到如下的樣本回歸函數(shù):yi=β?0+β?1xi1+β?2xi2++β?kxik+ei回歸模型中的參數(shù)估計(jì)出來之后,還必須對(duì)其進(jìn)展檢驗(yàn)。如果通過檢驗(yàn)發(fā)現(xiàn)模型有缺陷,則必須回到模型的設(shè)定階段或參數(shù)估計(jì)階段,重新選擇被解釋變量和解釋變量及其函數(shù)形式,或者對(duì)數(shù)據(jù)進(jìn)展加工整理之后再次估計(jì)參數(shù)?;貧w模型的檢驗(yàn)包括一級(jí)檢驗(yàn)和二級(jí)檢驗(yàn)。一級(jí)檢驗(yàn)又叫統(tǒng)計(jì)學(xué)檢驗(yàn),它是利用統(tǒng)計(jì)學(xué)的抽樣理論來檢驗(yàn)樣本回歸方程的可靠性,具體又可以分為擬和優(yōu)度評(píng)價(jià)和顯著性檢驗(yàn);二級(jí)檢驗(yàn)又稱為經(jīng)濟(jì)計(jì)量學(xué)檢驗(yàn),它是對(duì)線性回歸模型的假定條件能否得到滿足進(jìn)展檢驗(yàn),具體包括序列相關(guān)檢驗(yàn)、異方差檢驗(yàn)等。三、試驗(yàn)演示內(nèi)容與步驟1.連續(xù)變量簡單相關(guān)系數(shù)的計(jì)算與分析在上市公司財(cái)務(wù)分析中,常常利用資產(chǎn)收益率、凈資產(chǎn)收益率、每股凈收益和托賓Q值4個(gè)指標(biāo)來衡量公司經(jīng)營績效。本試驗(yàn)利用SPSS對(duì)這4個(gè)指標(biāo)的相關(guān)性進(jìn)展檢驗(yàn)。操作步驟與過程:?翻開數(shù)據(jù)文件“上市公司財(cái)務(wù)數(shù)據(jù)(連續(xù)變量相關(guān)分析).sav〞,依次選擇“【分析】→【相關(guān)】→【雙變量】〞翻開對(duì)話框如圖,將待分析的4個(gè)指標(biāo)移入右邊的變量列表框內(nèi)。其他均可選擇默認(rèn)項(xiàng),單擊ok提交系統(tǒng)運(yùn)行。圖5.1BivariateCorrelations對(duì)話框結(jié)果分析:表給出了Pearson簡單相關(guān)系數(shù),相關(guān)檢驗(yàn)t統(tǒng)計(jì)量對(duì)應(yīng)的p值。相關(guān)系數(shù)右上角有兩個(gè)星號(hào)表示相關(guān)系數(shù)在0.01的顯著性水平下顯著。從表中可以看出,每股收益、凈資產(chǎn)收益率和總資產(chǎn)收益率3個(gè)指標(biāo)之間的相關(guān)系數(shù)都在0.8以上,對(duì)應(yīng)的p值都接近0,表示3個(gè)指標(biāo)具有較強(qiáng)的正相關(guān)關(guān)系,而托賓Q值與其他3個(gè)變量之間的相關(guān)性較弱。表5.1Pearson簡單相關(guān)分析Correlations每股收益率凈資產(chǎn)收益率資產(chǎn)收益率托賓Q值每股收益率PearsonCorrelationSig.(2-tailed)1.877(**).0003151.315.808(**).000315-.001.983315.824(**).000315.808(**).0003151.315.011.849315-.073.199315-.001.983315.011.8493151.315.N315凈資產(chǎn)收益率PearsonCorrelation.877(**)Sig.(2-tailed).000N315資產(chǎn)收益率PearsonCorrelationSig.(2-tailed).824(**).000N315托賓Q值PearsonCorrelation-.073Sig.(2-tailed).199N315**Correlationissignificantatthe0.01level(2-tailed).2.一元線性回歸分析實(shí)例分析:家庭住房支出與年收入的回歸模型在這個(gè)例子里,考慮家庭年收入對(duì)住房支出的影響,建設(shè)的模型如下:yi=α+βxi+εi其中,yi是住房支出,xi是年收入線性回歸分析的根本步驟及結(jié)果分析:繪制散點(diǎn)圖翻開數(shù)據(jù)文件,選擇【圖形】-【舊對(duì)話框】-【散點(diǎn)/點(diǎn)狀】,如圖5.2所示。圖5.2散點(diǎn)圖對(duì)話框選擇簡單分布,單擊定義,翻開子對(duì)話框,選擇X變量和Y變量,如圖5.3所示。單擊ok提交系統(tǒng)運(yùn)行,結(jié)果見圖5.4所示。圖5.3SimpleScatterplot子對(duì)話框從圖上可直觀地看出住房支出與年收入之間存在線性相關(guān)關(guān)系。簡單相關(guān)分析選擇【分析】—>【相關(guān)】—>【雙變量】,翻開對(duì)話框,將變量“住房支出〞與“年收入〞移入variables列表框,點(diǎn)擊ok運(yùn)行,結(jié)果如表5.2所示。表5.2住房支出與年收入相關(guān)系數(shù)表Correlations住房支出〔千美元〕年收入〔千美元〕住房支出〔千美元〕PearsonCorrelationSig.(2-tailed)1.966(**)..000N2020年收入〔千美元〕PearsonCorrelation.966(**)1Sig.(2-tailed).000.N2020**Correlationissignificantatthe0.01level(2-tailed).從表中可得到兩變量之間的皮爾遜相關(guān)系數(shù)為0.966,雙尾檢驗(yàn)概率p值尾0.000<0.05,故變量之間顯著相關(guān)。根據(jù)住房支出與年收入之間的散點(diǎn)圖與相關(guān)分析顯示,住房支出與年收入之間存在顯著的正相關(guān)關(guān)系。在此前提下進(jìn)一步進(jìn)展回歸分析,建設(shè)一元線性回歸方程。(3)線性回歸分析步驟1:選擇菜單“【分析】—>【回歸】—>【線性】〞,翻開LinearRegression對(duì)話框。將變量住房支出y移入Dependent列表框中,將年收入x移入Independents列表框中。在Method框中選擇Enter選項(xiàng),表示所選自變量全部進(jìn)入回歸模型。圖5.5LinearRegresssion對(duì)話框步驟2:單擊Statistics按鈕,如圖在Statistics子對(duì)話框。該對(duì)話框中設(shè)置要輸出的統(tǒng)計(jì)量。這里選中估計(jì)、模型擬合度復(fù)選框。圖5.6Statistics子對(duì)話框?估計(jì):輸出有關(guān)回歸系數(shù)的統(tǒng)計(jì)量,包括回歸系數(shù)、回歸系數(shù)的標(biāo)準(zhǔn)差、標(biāo)準(zhǔn)化的回歸系數(shù)、t統(tǒng)計(jì)量及其對(duì)應(yīng)的p值等。?置信區(qū)間:輸出每個(gè)回歸系數(shù)的95%的置信度估計(jì)區(qū)間。?協(xié)方差矩陣:輸出解釋變量的相關(guān)系數(shù)矩陣和協(xié)差陣。?模型擬合度:輸出可決系數(shù)、調(diào)整的可決系數(shù)、回歸方程的標(biāo)準(zhǔn)誤差、回歸方程F檢驗(yàn)的方差分析。步驟3:單擊繪制按鈕,在Plots子對(duì)話框中的標(biāo)準(zhǔn)化殘差圖選項(xiàng)欄中選中正態(tài)概率圖復(fù)選框,以便對(duì)殘差的正態(tài)性進(jìn)展分析。圖5.7plots子對(duì)話框步驟4:單擊保存按鈕,在Save子對(duì)話框中殘差選項(xiàng)欄中選中未標(biāo)準(zhǔn)化復(fù)選框,這樣可以在數(shù)據(jù)文件中生成一個(gè)變量名尾res_1的殘差變量,以便對(duì)殘差進(jìn)展進(jìn)一步分析。圖5.8Save子對(duì)話框其余保持Spss默認(rèn)選項(xiàng)。在主對(duì)話框中單擊ok按鈕,執(zhí)行線性回歸命令,其結(jié)果如下:表5.3給出了回歸模型的擬和優(yōu)度〔RSquare〕、調(diào)整的擬和優(yōu)度〔AdjustedRSquare〕、估計(jì)標(biāo)準(zhǔn)差〔Std.ErroroftheEstimate〕以及Durbin-Watson統(tǒng)計(jì)量。從結(jié)果來看,回歸的可決系數(shù)和調(diào)整的可決系數(shù)分別為0.934和0.93,即住房支出的90%以上的變動(dòng)都可以被該模型所解釋,擬和優(yōu)度較高。表5.4給出了回歸模型的方差分析表,可以看到,F(xiàn)統(tǒng)計(jì)量為252.722,對(duì)應(yīng)的p值為0,所以,拒絕模型整體不顯著的原假設(shè),即該模型的整體是顯著的。表5.5給出了回歸系數(shù)、回歸系數(shù)的標(biāo)準(zhǔn)差、標(biāo)準(zhǔn)化的回歸系數(shù)值以及各個(gè)回歸系數(shù)的顯著性t檢驗(yàn)。從表中可以看到無論是常數(shù)項(xiàng)還是解釋變量x,其t統(tǒng)計(jì)量對(duì)應(yīng)的p值都小于顯著性水平0.05,因此,在0.05的顯著性水平下都通過了t檢驗(yàn)。變量x的回歸系數(shù)為0.237,即年收入每增加1千美元,住房支出就增加0.237千美元。表5.3回歸模型擬和優(yōu)度評(píng)價(jià)及Durbin-Watson檢驗(yàn)結(jié)果ModelSummary(b)ModelRRSquareAdjustedRSquareStd.ErroroftheEstimate1.966(a).934.930.37302aPredictors:(Constant),年收入〔千美元〕bDependentVariable:住房支出〔千美元〕表5.4方差分析表ANOVA(b)ModelSu

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請(qǐng)下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請(qǐng)聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會(huì)有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫網(wǎng)僅提供信息存儲(chǔ)空間,僅對(duì)用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對(duì)用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對(duì)任何下載內(nèi)容負(fù)責(zé)。
  • 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請(qǐng)與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶因使用這些下載資源對(duì)自己和他人造成任何形式的傷害或損失。

最新文檔

評(píng)論

0/150

提交評(píng)論