spss基礎(chǔ)教學(xué)第1部分_第1頁(yè)
spss基礎(chǔ)教學(xué)第1部分_第2頁(yè)
spss基礎(chǔ)教學(xué)第1部分_第3頁(yè)
spss基礎(chǔ)教學(xué)第1部分_第4頁(yè)
spss基礎(chǔ)教學(xué)第1部分_第5頁(yè)
已閱讀5頁(yè),還剩180頁(yè)未讀, 繼續(xù)免費(fèi)閱讀

下載本文檔

版權(quán)說(shuō)明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請(qǐng)進(jìn)行舉報(bào)或認(rèn)領(lǐng)

文檔簡(jiǎn)介

1、SPSS統(tǒng)計(jì)分析基礎(chǔ)教程(第2版)第一章 SPSS概述第一節(jié) SPSS的發(fā)展及特點(diǎn)SPSS的發(fā)展SPSS最早的全稱是Statistical Package for the Social Sciences,即社會(huì)科學(xué)統(tǒng)計(jì)程序包,是世界公認(rèn)的最優(yōu)秀的統(tǒng)計(jì)分析軟件包之一。1968年,美國(guó)斯坦福大學(xué)的三位研究生開(kāi)發(fā)了最早的統(tǒng)計(jì)分析軟件SPSS,并于1975年在芝加哥成立了SPSS公司。 SPSS原是為大中型計(jì)算機(jī)開(kāi)發(fā)的,面向企事業(yè)單位用戶。 80年代初,微機(jī)開(kāi)始普及以后,它率先推出了微機(jī)版本(統(tǒng)稱為SPSS/PC版),占領(lǐng)了微機(jī)市場(chǎng),大大地?cái)U(kuò)大了自己的用戶量。 90年代,Microsoft推出操作系統(tǒng)

2、Windows后,SPSS迅速向Windows移植(統(tǒng)稱為SPSSfor Windows版)。 2000年正式將英文全稱更改為 Statistical Product and Service Solutions, 意為“統(tǒng)計(jì)產(chǎn)品與服務(wù)解決方案”,標(biāo)志著SPSS的戰(zhàn)略方向正在做出重大調(diào)整。 2009年4月9日 在美國(guó)的芝加哥SPSS公司宣布重新包裝旗下的SPSS產(chǎn)品線,定位為預(yù)測(cè)統(tǒng)計(jì)分析軟件(Predictive Analytics Software)PASW,包括四部分: * PASW Statistics ( SPSS Statistics):統(tǒng)計(jì)分析* PASW Modeler ( Cle

3、mentine) :數(shù)據(jù)挖掘* Data Collection family ( Dimensions):數(shù)據(jù)收集* PASW Collaboration and Deployment Services ( Predictive Enterprise Services):企業(yè)應(yīng)用服務(wù) 2009年7月28日,IBM以12億美元現(xiàn)金收購(gòu)統(tǒng)計(jì)分析軟件公司SPSS。具體的收購(gòu)方式為,IBM以每股50美元的價(jià)格收購(gòu)SPSS,該交易全部以現(xiàn)金形式支付。 SPSS在2009年10月2日召開(kāi)特別股東大會(huì)投票表決通過(guò)了有關(guān)該公司出售給IBM的交易。 IBM成功收購(gòu)SPSS后,其名稱又發(fā)生了改變,總稱為 IBM

4、SPSS,包括四個(gè)部分: * IBM SPSS Statistics ( SPSS Statistics):統(tǒng)計(jì)分析 (ISS) * IBM SPSS Modeler ( Clementine) :數(shù)據(jù)挖掘 (ISM) * IBM SPSS Data Collection family ( Dimensions):數(shù)據(jù)收集 * IBM SPSS Collaboration and Deployment Services ( Predictive Enterprise Services):企業(yè)應(yīng)用服務(wù) 一、功能強(qiáng)大(1)囊括了各種成熟的統(tǒng)計(jì)方法與模型,為統(tǒng)計(jì)分析用戶提供了全方位的統(tǒng)計(jì)學(xué)算法,為各

5、種研究提供了相應(yīng)的統(tǒng)計(jì)學(xué)方法。(2)提供了各種數(shù)據(jù)準(zhǔn)備與數(shù)據(jù)整理技術(shù)。(3)自由靈活的表格功能。(4)各種常用的統(tǒng)計(jì)學(xué)圖形。二、SPSS的實(shí)驗(yàn)環(huán)境要求(1)系統(tǒng)運(yùn)行環(huán)境SPSS10.0以上版本軟件包可以工作在兩種模式下,單機(jī)模式和作為網(wǎng)絡(luò)系統(tǒng)的用戶界面模式。(2)輔助軟件環(huán)境三、SPSS的主要界面SPSS的主要界面有數(shù)據(jù)編輯窗口和結(jié)果輸出窗口。 四、SPSS的幫助系統(tǒng)SPSS對(duì)一些基本模塊中的統(tǒng)計(jì)提供了幫助,可以通過(guò)單擊Help菜單中的Statistics Coach命令,選擇所需要的統(tǒng)計(jì)指導(dǎo)。 SPSS附加模塊功能SPSS Advanced一般線性模型、混合線性模型、對(duì)數(shù)線性模型、生存分析等

6、SPSS Categories對(duì)應(yīng)分析、感知圖、Proxscal等SPSS Complex Sample多階段復(fù)雜抽樣技術(shù)等SPSS Conjoint正交設(shè)計(jì)、聯(lián)合分析等,適用于市場(chǎng)研究SPSS Exact Test精確P值計(jì)算、隨機(jī)抽樣P值計(jì)算等SPSS Maps在地圖上展示數(shù)據(jù)等SPSS Missing Value Analysis缺失數(shù)據(jù)的報(bào)告與填補(bǔ)等SPSS RegressionLogistic回歸、非線性回歸、Probit回歸等SPSS Tables交互式創(chuàng)建各種表格(如堆積表、嵌套表、分層表等)SPSS TrendsArima模型、指數(shù)平滑、自回歸等五、SPSS的運(yùn)行方式SPSS提

7、供了3種基本運(yùn)行方式:完全窗口菜單方式,程序運(yùn)行方式、混合運(yùn)行方式。程序運(yùn)行方式和混合運(yùn)行方式是使用者從特殊的分析需要出發(fā),編寫(xiě)自己的SPSS命令程序,通過(guò)語(yǔ)句直接運(yùn)行。 SPSS中使用的對(duì)話框主要有兩類,一類是文件操作對(duì)話框,文件操作對(duì)話窗口操作與Windows應(yīng)用軟件操作風(fēng)格一致。另一類是統(tǒng)計(jì)分析對(duì)話框,統(tǒng)計(jì)分析對(duì)話框可以分為主窗口和下級(jí)窗口,在該類對(duì)話框中,選擇參與分析的各類變量及統(tǒng)計(jì)方法是對(duì)話框的主要任務(wù)。 1.1.2 spss的安裝一、啟動(dòng)Windows 后,把SPSS 系統(tǒng)安裝軟盤(pán)(或光盤(pán))插入軟驅(qū)(或光驅(qū)),并找到SPSS的安裝程序的可執(zhí)行文件Setup.exe。二、雙擊 Set

8、up.exe 文件,安裝程序向?qū)⒔o出每一步操作的提示。在出現(xiàn) e(歡迎)窗口后,選擇Next進(jìn)入下一步。三、安裝程序顯示Software License Agreement對(duì)話框時(shí),選擇Yes接受顯示的協(xié)議條款。1.2 spss操作入門1.2.1 spss軟件的啟動(dòng)與退出單擊Windows 的開(kāi)始按鈕,在程序菜單項(xiàng)SPSS for Windows中找到SPSS 20.0 for Windows并單擊。1.2.2 SPSS的5個(gè)窗口(1)數(shù)據(jù)編輯窗口(SPSS Data Editor)Spss處理數(shù)據(jù)的工作全在此窗口進(jìn)行。(2)結(jié)果管理窗口(SPSS Output viewer)此窗口用于存放

9、分析結(jié)果。左邊是目錄區(qū),右邊是內(nèi)容區(qū)。(3)草稿結(jié)果窗口(SPSS Draft Viewer)草稿結(jié)果是結(jié)果的一種簡(jiǎn)化文本格式。實(shí)際上就是WORD所兼容的rtf超文本格式,因此可以在沒(méi)有安裝SPSS的PC機(jī)上使用文字編輯軟件打開(kāi)。(4)語(yǔ)法編輯窗口(SPSS Syntax Editor)(5)腳本窗口(SPSS Script Editor)1.2.3 SPSS的四種運(yùn)行方式一、菜單對(duì)話方式首先打開(kāi)SPSS軟件,然后選擇菜單File Open file。然后,利用菜單Analyze Descriptive Statistics Frequencies, 二、程序方式在Syntax編輯窗口中鍵入以

10、下程序:Get file=c:program filesspssemployee data.sav.Frequencies variables = jobcat/order = analysis。只需要選擇菜單Run All,運(yùn)行該程序也一樣會(huì)出現(xiàn)相同的分析結(jié)果。三、Include命令方式當(dāng)編寫(xiě)Syntax程序時(shí),如果發(fā)現(xiàn)將要編寫(xiě)的程序語(yǔ)句正好是另一個(gè)Syntax文件的內(nèi)容;或者發(fā)現(xiàn)所需要的程序語(yǔ)句其實(shí)是幾個(gè)Syntax文件的總和是,除了可以通過(guò)“Copy”、“Paste”的方法利用資源,生產(chǎn)一個(gè)新的Syntax文件外,還可以利用Include命令。Include c:sytaxsample.

11、sps.四、spss Production Faccility 方式在Windows的程序菜單中,spss菜單組除了有“spss for windows”項(xiàng)之外,還有一個(gè)“spss production facility”。(1)單擊Syntax框下的“Add”按鈕,到C盤(pán)根目錄下打開(kāi)“syntaxsample”。(2)單擊Syntax框下的“Edit”按鈕,對(duì)程序進(jìn)行編輯。(3)單擊右下角的“uesr prompts”按鈕,添加對(duì)程序的交互分析界面。(4)單擊“Browse”按鈕制定結(jié)果保存路徑,單擊“export options”按鈕還可以制定結(jié)果保存格式。1.2.4 spss的四種輸出結(jié)

12、果1、表格格式2、文本格式3、標(biāo)準(zhǔn)圖與交互圖4、結(jié)果的保存和導(dǎo)出第2章 數(shù)據(jù)錄入與數(shù)據(jù)獲取本章主要解決兩個(gè)問(wèn)題:第一個(gè)問(wèn)題,根據(jù)問(wèn)題類型的不同,將會(huì)從開(kāi)放題、單選題和多選題的錄入方式為例進(jìn)行介紹。第二個(gè)問(wèn)題,重點(diǎn)介紹如何用SPSS直接讀取Excel類型和文本格式的數(shù)據(jù),以及如何用ODBC接口讀取數(shù)據(jù)庫(kù)文件。什么是消費(fèi)者信心指數(shù)消費(fèi)者信心 (Consumer Confidence or Consumer Sentiment) 是指消費(fèi)者根據(jù)國(guó)家或地區(qū)的經(jīng)濟(jì)發(fā)展形勢(shì),對(duì)就業(yè)、收入、物價(jià)、利率等問(wèn)題的綜合判斷后得出的一種看法和預(yù)期消費(fèi)者信心指數(shù)(Consumer Sentiment Index, C

13、SI) 的概念和方法是由美國(guó)密歇根大學(xué)調(diào)查研究中心的喬治 卡通納(George Katona) 在上世紀(jì)40年代后期提出的。消費(fèi)者的看法、態(tài)度和預(yù)期這些心理的直接感受決定了他們的消費(fèi)支出計(jì)劃。對(duì)消費(fèi)者心理及其變動(dòng)的測(cè)度就是對(duì)消費(fèi)總量變動(dòng)測(cè)度的一個(gè)補(bǔ)充。根據(jù)消費(fèi)者調(diào)查結(jié)果可以計(jì)算消費(fèi)者情緒指數(shù)(Consumer Sentiment Index),又稱“消費(fèi)者信心”。文彤老師282022年8月12日消費(fèi)者信心指數(shù)背后的經(jīng)濟(jì)學(xué)原理居民在決策家庭的開(kāi)銷,特別是購(gòu)買諸如住宅、汽車等耐用商品時(shí),是經(jīng)過(guò)深思熟慮才決定的。不僅是以目前的經(jīng)濟(jì)條件為基礎(chǔ),同時(shí)結(jié)合了對(duì)未來(lái)收入、就業(yè)、物價(jià)、利率變動(dòng)等因素的判斷和預(yù)

14、期六十多年的時(shí)間已經(jīng)充分驗(yàn)證了上述理論在解釋宏觀經(jīng)濟(jì)現(xiàn)狀時(shí)的有效性與合理性2022年8月12日文彤老師29密歇根大學(xué)消費(fèi)者信心指數(shù)的價(jià)值已得到實(shí)際證明是預(yù)測(cè)宏觀經(jīng)濟(jì)走向的精確指標(biāo) 消費(fèi)者總體信心可預(yù)測(cè)GDP增長(zhǎng)趨勢(shì) (平均領(lǐng)先3個(gè)季度,相關(guān)系數(shù)0.9) 消費(fèi)者就業(yè)信心可預(yù)測(cè)實(shí)際失業(yè)率 (平均領(lǐng)先3個(gè)季度,相關(guān)系數(shù)0.8) 消費(fèi)者的物價(jià)預(yù)期可預(yù)測(cè)實(shí)際通脹率 (平均領(lǐng)先1個(gè)季度,相關(guān)系數(shù)0.9) 消費(fèi)者購(gòu)車信心可預(yù)測(cè)實(shí)際汽車銷量 (平均領(lǐng)先2個(gè)季度,相關(guān)系數(shù)0.73) 密歇根大學(xué)消費(fèi)者信心指數(shù)對(duì)美、歐股市以及美國(guó)政府的經(jīng)濟(jì)政策有直接影響 已列入美國(guó)商務(wù)部發(fā)布的主要綜合指標(biāo),并被各大媒體廣泛引用 前

15、美國(guó)聯(lián)邦儲(chǔ)備委員會(huì)主席格林斯潘就曾表示,他非常重視消費(fèi)者信心指數(shù)在美國(guó)及全球各大消費(fèi)品生產(chǎn)商中廣泛使用,用于預(yù)測(cè)銷量及利潤(rùn) 全球各國(guó)的消費(fèi)者信心指數(shù)研究方式大致相同,其理論基礎(chǔ)均源于密歇根大學(xué)的研究方法,指數(shù)有效性在各國(guó)已得到廣泛驗(yàn)證 中國(guó)消費(fèi)者信心調(diào)研遵循了美國(guó)密歇根大學(xué)消費(fèi)者信心調(diào)研的方法學(xué),并根據(jù)中國(guó)國(guó)情進(jìn)行了修正和深化,是密歇根大學(xué)消費(fèi)者信心調(diào)研的中國(guó)版2022年8月12日文彤老師30中國(guó)消費(fèi)者信心調(diào)研(China Consumer Sentiment Survey, CCSS)每月進(jìn)行的、反映中國(guó)消費(fèi)市場(chǎng)狀況及消費(fèi)者對(duì)家庭經(jīng)濟(jì)及宏觀經(jīng)濟(jì)信心的獨(dú)立第三方調(diào)研目前屬于全球最大的德交-泛歐

16、-紐交集團(tuán)旗下產(chǎn)品中國(guó)消費(fèi)者信心調(diào)研的研究方法是在美國(guó)密歇根大學(xué)社會(huì)研究院消費(fèi)者信心調(diào)查課題組負(fù)責(zé)人Richard Curtin博士的協(xié)助與指導(dǎo)下完成的月度總信心指數(shù)現(xiàn)狀指數(shù)預(yù)期指數(shù)當(dāng)前家庭經(jīng)濟(jì)狀況耐用品消費(fèi)未來(lái)1年家庭經(jīng)濟(jì)預(yù)期未來(lái)1年宏觀經(jīng)濟(jì)預(yù)期未來(lái)5年宏觀經(jīng)濟(jì)預(yù)期行業(yè)分類指數(shù)耐用品購(gòu)買房地產(chǎn)證券投資汽車消費(fèi)消費(fèi)者物價(jià)感受及預(yù)期消費(fèi)者利率預(yù)期中國(guó)消費(fèi)者信心調(diào)研(CCSS)包括以下方面:2022年8月12日文彤老師31中國(guó)消費(fèi)者信心調(diào)研的研究方法發(fā)布頻率每月一次數(shù)據(jù)采集方式CATI (電腦輔助電話訪問(wèn)),隨機(jī)抽樣,第一手調(diào)研樣本選擇18-64歲中國(guó)城市居民,家庭開(kāi)支或投資決策者抽取中國(guó)經(jīng)濟(jì)最發(fā)

17、達(dá)的30個(gè)城市代表中國(guó)1/7的人口與1/3的GDP訪談時(shí)間長(zhǎng)度1015 分鐘問(wèn)卷問(wèn)題數(shù)量不少于30題樣本量每月不少于1,000樣本2022年8月12日文彤老師32中國(guó)消費(fèi)者信心指數(shù)研究問(wèn)卷S0 受訪者所在城市:100 北京 200 上海 300 廣州S1 請(qǐng)問(wèn)您貴姓是?_S2 記錄被訪者性別:1 男性 2 女性S3 請(qǐng)問(wèn)您的十足年齡是?_S4 請(qǐng)問(wèn)您的學(xué)歷是?1 初中/技?;蛞韵?2 高中/中專 3 大專 4 本科 5 碩士或以上2022年8月12日文彤老師33中國(guó)消費(fèi)者信心指數(shù)研究問(wèn)卷C0 請(qǐng)問(wèn)您的家庭目前有下列還貸支出嗎?C0_1 房貸 1 有 2 無(wú) 99 拒答C0_2 車貸 1 有 2

18、 無(wú) 99 拒答C0_3 其他一般消費(fèi)還貸 1 有 2 無(wú) 99 拒答A3 首先,請(qǐng)問(wèn)與一年前相比,您的家庭現(xiàn)在的經(jīng)濟(jì)狀況怎么樣呢?是變好、基本不變還是變差?1 明顯好轉(zhuǎn) 2 略有好轉(zhuǎn) 3 基本不變 4 略有變差 5 明顯變差 9 說(shuō)不清/拒答A3a 為什么您這樣說(shuō)呢?(最多限選兩項(xiàng))_0 中性原因90 不知道/拒答10 改善:收入相關(guān)110 惡化:收入相關(guān)20 改善:就業(yè)狀況相關(guān)120 惡化:就業(yè)狀況相關(guān)30 改善:投資相關(guān)130 惡化:投資相關(guān)40 改善:家庭開(kāi)支相關(guān)140 惡化:家庭開(kāi)支相關(guān)50 改善:政策/宏觀經(jīng)濟(jì)150 惡化:政策/宏觀經(jīng)濟(jì)相關(guān)2022年8月12日文彤老師342.1.

19、1 統(tǒng)計(jì)軟件中數(shù)據(jù)的錄入格式(1)不同觀測(cè)對(duì)象的數(shù)據(jù)不能在同一記錄中出現(xiàn),即同一觀測(cè)數(shù)據(jù)應(yīng)當(dāng)獨(dú)占一行。(2)每一個(gè)觀測(cè)量指標(biāo)或影響因素只能占據(jù)一列的位置,即同一指標(biāo)的數(shù)量觀測(cè)值都應(yīng)當(dāng)錄入到同一個(gè)變量中去。2.1 數(shù)據(jù)格式概述即:一個(gè)觀測(cè)占一行,一個(gè)變量占一列在錄入數(shù)據(jù)時(shí),歸納為以下三步:第一步:定義變量名;第一步:指定每個(gè)變量的各種屬性;第一步:錄入數(shù)據(jù)。變量名不能與spss保留字相同,spss的保留字有ALL、END、BY、EQ、GE、GT、LE、LT、NE、NOT、OR、TO、WITH。2.1.2 變量屬性介紹一、變量的儲(chǔ)存類型SPSS中,變量有三種的基本類型:數(shù)值型、字符型和日期型。標(biāo)準(zhǔn)

20、數(shù)值型逗號(hào)數(shù)值型圓點(diǎn)數(shù)值型科學(xué)技術(shù)法數(shù)值型美元數(shù)值型用戶自定義型數(shù)值型:數(shù)值型的數(shù)據(jù)是0-9的阿拉伯?dāng)?shù)字和其他符號(hào),如美元符號(hào)、逗號(hào)或圓點(diǎn)組成的。日期型用戶自定義型字符型:字符型數(shù)據(jù)的默認(rèn)顯示寬度為8個(gè)字符位,系統(tǒng)不區(qū)分變量名中的大小寫(xiě)字母,并且不能進(jìn)行數(shù)學(xué)運(yùn)算。注意:在輸入數(shù)據(jù)時(shí)不應(yīng)輸入引號(hào),否則雙引號(hào)將會(huì)作為字符型數(shù)據(jù)的一部分。日期型:日期型數(shù)據(jù)是用來(lái)表示日期或時(shí)間的。日期型數(shù)據(jù)的顯示格式有很多,SPSS以菜單方式列出日期型數(shù)據(jù)的顯示格式以供用戶選擇。事實(shí)上,SPSS存儲(chǔ)中的日期型變量是該實(shí)踐與1582年10月14日零點(diǎn)相差的秒數(shù)。關(guān)于日期型格式的幾點(diǎn)說(shuō)明:“m”在年與日(字母y與d)之間

21、表示月份;在時(shí)與秒(字母h與s)之間表示“分”鐘。“mmm”表示要求書(shū)寫(xiě)英文月份單詞的前三個(gè)字母組成的縮寫(xiě)。“ddd”三個(gè)字母d表示要求用從元月一日算起的日數(shù)表示日期。指定了日期變量的格式,不一定在輸入時(shí)就使用指定的格式。可以輸入用“/”或“”作分隔符的具體日期,回車后,系統(tǒng)將自動(dòng)將輸入的格式轉(zhuǎn)化為指定的格式,顯示在單元各種。二、變量的測(cè)量尺度在SPSS中使用Measure屬性對(duì)變量的測(cè)量尺度進(jìn)行定義。(1)定類尺度(Nominal Measurement):定類尺度是對(duì)事物的類別或?qū)傩缘囊环N測(cè)度,按照事物的某種屬性對(duì)其進(jìn)行分類或分組。特點(diǎn):其值僅代表了事物的類別和屬性,即能測(cè)度類別差異,不能

22、比較各類之間的大小,所以各類之間沒(méi)有順序和等級(jí)。對(duì)定類尺度的變量只能計(jì)算頻數(shù)和頻率。在spss中,能適用定類尺度的數(shù)據(jù)可以是數(shù)值型,也可以是字符型變量。使用定類變量對(duì)事物進(jìn)行分類時(shí),必須符合窮盡原則和互斥原則。(2)定序尺度(Ordinal Measurement):定序尺度是對(duì)事物之間的等級(jí)或順序差別的一種測(cè)度,可比較優(yōu)劣或排序。特點(diǎn):由于定序變量只能側(cè)度類別之間的順序,無(wú)法測(cè)出類別之間的準(zhǔn)確差值,即測(cè)量數(shù)值不代表絕對(duì)的數(shù)量大小,所以其測(cè)量結(jié)果只能排序,不能進(jìn)行運(yùn)算。(3)定矩尺度(Interval Measurement):定矩尺度是對(duì)事物類別或次序之間間距的測(cè)度。特點(diǎn):不僅能將事物區(qū)分為

23、不同類型并進(jìn)行排序,而且可能準(zhǔn)確指出類別之間的差距是多少;定居變量通常以自然或物理單位為計(jì)量尺度,因此測(cè)量結(jié)果往往表現(xiàn)為數(shù)值,所以計(jì)量結(jié)果可以進(jìn)行加減運(yùn)算。(4)定比尺度(Scale Measurement):定比尺度是能夠測(cè)算兩個(gè)測(cè)度值之間比值的一種計(jì)量尺度,它的測(cè)量結(jié)果同定距變量一樣表現(xiàn)為數(shù)值。特點(diǎn):定必變量是測(cè)量尺度的最高水平,它除了具有其他三種測(cè)量尺度的全部特點(diǎn)外,還具有可計(jì)算兩個(gè)側(cè)度至之間筆直的特點(diǎn),因此它可以進(jìn)行加、減、乘、除運(yùn)算,而定居變量值可進(jìn)行加減運(yùn)算。三、變量名與變量標(biāo)簽值Label:定義變量名標(biāo)簽Value:定義變量值標(biāo)簽四、缺失值Spss中缺失值有用戶自定義缺失值和系統(tǒng)

24、缺失值兩大類。在SPSS中,對(duì)字符型變量,默認(rèn)的缺失值為空格;對(duì)數(shù)值型變量,默認(rèn)的缺失值為零。2.2 數(shù)據(jù)的直接錄入2.1.1 操作界面說(shuō)明標(biāo)尺欄菜單欄工具欄數(shù)據(jù)輸入?yún)^(qū)數(shù)據(jù)編輯區(qū)窗口標(biāo)簽標(biāo)題欄狀態(tài)欄當(dāng)前數(shù)據(jù)欄顯示區(qū)滾動(dòng)條Data View表可以直接輸入觀測(cè)數(shù)據(jù)值或存放數(shù)據(jù),表的左端列邊框顯示觀測(cè)個(gè)體的序號(hào),最上端行邊框顯示變量名。 Variable View表用來(lái)定義和修改變量的名稱、類型及其他屬性,如圖所示。如果輸入變量名后回車,將給出變量的默認(rèn)屬性。如果不定義變量的屬性,直接輸入數(shù)據(jù),系統(tǒng)將默認(rèn)變量Var00001,Var00002等。在Variable View表中,每一行描述一個(gè)變量,

25、依次是:Name:變量名。變量名必須以字母、漢字及開(kāi)頭,總長(zhǎng)度不超過(guò)8個(gè)字符,共容納4個(gè)漢字或8個(gè)英文字母,英文字母不區(qū)別大小寫(xiě),最后一個(gè)字符不能是句號(hào)。Type:變量類型。變量類型有8 種,最常用的是Numeric數(shù)值型變量。其它常用的類型有:String字符型,Date日期型 ma逗號(hào)型(隔3位數(shù)加一個(gè)逗號(hào))等。Width:變量所占的寬度。Decimals:小數(shù)點(diǎn)后位數(shù)。Label:變量標(biāo)簽。關(guān)于變量涵義的詳細(xì)說(shuō)明。Values:變量值標(biāo)簽。關(guān)于變量各個(gè)取值的涵義說(shuō)明。Missing:缺失值的處理方式。Columns:變量在Date View 中所顯示的列寬(默認(rèn)列寬為8)。Align:數(shù)

26、據(jù)對(duì)齊格式(默認(rèn)為右對(duì)齊)。Measure:數(shù)據(jù)的測(cè)度方式。系統(tǒng)給出名義尺度、定序尺度和等間距尺度三種(默認(rèn)為等間距尺度)。為了在統(tǒng)計(jì)分析過(guò)程中能有效的利用其它軟件產(chǎn)生的數(shù)據(jù),SPSS軟件編輯窗口除可以使用*.sav擴(kuò)展名數(shù)據(jù)文件,還可以直接打開(kāi)和保存下述類型的文件:SPSS DOS版本產(chǎn)生的數(shù)據(jù)文件*.sys;Excel 報(bào)表程序產(chǎn)生的數(shù)據(jù)文件*.xls;DBASE 數(shù)據(jù)庫(kù)格式文件*.dbf;SAS統(tǒng)計(jì)軟件產(chǎn)生的數(shù)據(jù)文件。2.2.2 開(kāi)放題和簡(jiǎn)單單選題的錄入一、在spss中定義變量錄入數(shù)據(jù)的第一步是定義變量屬性,隨后才能進(jìn)行數(shù)據(jù)錄入。二、開(kāi)放題的錄入三、單選題的錄入單選題的錄入可以采用字符直

27、接錄入、字符代碼+值標(biāo)簽、數(shù)值代碼+值標(biāo)簽三種方式。2.2.3多選題的錄入一、多重二分法(Multiple Dichotomy Method)所謂多重二分法,是在編碼的時(shí)候,對(duì)應(yīng)每一個(gè)選項(xiàng)都要定義一個(gè)變量,有幾個(gè)選項(xiàng)就有幾個(gè)變量,這些變量均為二分類,他們各自代表對(duì)一個(gè)選項(xiàng)的選擇結(jié)果。二、多重分類法(Multiple Category Method)多重分類法,也是利用多個(gè)變量對(duì)一個(gè)多選題的答案進(jìn)行定義,應(yīng)該用多少個(gè)變量,由被訪者實(shí)際可能給出的最多答案數(shù)而定。三、多選題錄入在spss中的實(shí)現(xiàn)2.3 外部數(shù)據(jù)的獲取SPSS讀入非SPSS類型的文件數(shù)據(jù),有三種主要方式:直接打開(kāi),利用文本導(dǎo)向讀入文本

28、數(shù)據(jù)以及利用數(shù)據(jù)庫(kù)OBDC接口讀入數(shù)據(jù)。2.3.1 電子表格數(shù)據(jù)如何導(dǎo)入spss中SPSS中可以直接讀入許多常用格式的數(shù)據(jù)文件,選擇菜單File Open Data或直接單擊快捷鍵工具欄上的 快捷按鈕,系統(tǒng)就會(huì)彈出Open File 對(duì)話框,單擊“文件類型”列表框,在里面能夠看到可以直接打開(kāi)的數(shù)據(jù)文件格式。2.3.2 文本數(shù)據(jù)如何導(dǎo)入spss中第一步:首先,在Open File 文件框中選中文件,單擊“打開(kāi)”,系統(tǒng)會(huì)自動(dòng)啟動(dòng)文本倒入向?qū)?duì)話框。第二步:選擇“NO”并單擊“下一步”按鈕。用某種字符區(qū)分固定寬度第三步:分別選擇“Delimited”和“yes”,然后單擊“下一步”按鈕。第四步第五步

29、第六步第七步2.4 數(shù)據(jù)的保存2.4.1 存為spss格式2.4.2 存為其他數(shù)據(jù)格式第3章 數(shù)據(jù)管理3.1 變量級(jí)別的數(shù)據(jù)管理對(duì)變量進(jìn)行操作的內(nèi)容主要集中于Transform菜單中,包括新變量的生成、記錄的排序、對(duì)變量進(jìn)行計(jì)數(shù)等。計(jì)算新變量:就是用Compute過(guò)程。變量轉(zhuǎn)換:包括Recode、Visual Bander、Count、Rank Case、Automatic Recode這五個(gè)過(guò)程。專用過(guò)程:包括建立時(shí)間序列、缺失值代替和設(shè)定隨機(jī)種子三個(gè)過(guò)程。Run Pending Transforming:用于執(zhí)行編程中被掛起的數(shù)據(jù)整理操作。計(jì)算產(chǎn)生新變量變量值自動(dòng)編碼設(shè)定隨機(jī)數(shù)種子創(chuàng)建代替

30、缺失值變量創(chuàng)建時(shí)間序列變量運(yùn)行其它轉(zhuǎn)換程序變量值重新編碼創(chuàng)建計(jì)數(shù)變量觀測(cè)量排秩連續(xù)變量進(jìn)行分段3.1.1 計(jì)算新變量計(jì)算新變量的功能就是在原有spss數(shù)據(jù)文件的基礎(chǔ)上,根據(jù)用戶的要求,使用spss算術(shù)表達(dá)式及函數(shù),對(duì)所有記錄或滿足SPSS條件表達(dá)式的記錄,計(jì)算出一個(gè)新結(jié)果,并將結(jié)果存入一個(gè)用戶指定的變量中。一、常用基本概念 (1)spss算術(shù)表達(dá)式 spss算術(shù)表達(dá)式是由常量、spss變量名、spss的算術(shù)運(yùn)算符、圓括號(hào)等組成的式子。(2)spss函數(shù) spss提供了多達(dá)70多種函數(shù),分為八大類:算術(shù)函數(shù)、統(tǒng)計(jì)函數(shù)、分布函數(shù)、邏輯函數(shù)、字符串函數(shù)、日期時(shí)間函數(shù)、缺失值函數(shù)和其它函數(shù)。(3)sp

31、ss條件表達(dá)式 通過(guò)spss的算術(shù)表達(dá)式和函數(shù)可以對(duì)所有記錄計(jì)算一個(gè)結(jié)果,如果僅希望對(duì)部分記錄進(jìn)行計(jì)算,則應(yīng)當(dāng)利用spss的條件表達(dá)式指定對(duì)那些記錄進(jìn)行計(jì)算。二、compute過(guò)程的分析實(shí)例例3.1 統(tǒng)計(jì)英語(yǔ)成績(jī)?cè)?0分以上的學(xué)生的數(shù)學(xué)和語(yǔ)文的平均成績(jī)。例3.2 計(jì)算工人工資的所得稅。學(xué)生自己練習(xí)。3.1.2 對(duì)變量值進(jìn)行分組合并一、對(duì)連續(xù)變量進(jìn)行分組在SPSS中可以將連續(xù)變量轉(zhuǎn)換為離散(等級(jí)或定序)變量,按照某種一一對(duì)應(yīng)的關(guān)系生成新變量值,可以將新值賦給原變量。Recode過(guò)程和Visual Bander過(guò)程都可以完成這一任務(wù),但前者給為簡(jiǎn)單和常用。例3.3 當(dāng)學(xué)生英語(yǔ)成績(jī)小于60時(shí)取值為“

32、不及格”,大于等于60且小于70為“及格”,大于等于70且小于80為“較好”,大于等于80為“優(yōu)秀”。二、分類變量類別的合并Recode過(guò)程也常用于合并某個(gè)分類變量的幾個(gè)水平為一個(gè)水平。將上例grade中優(yōu)秀、良好和及格三個(gè)等級(jí)合并為一個(gè)等級(jí)“PASS”,將grade的等級(jí)“不及格”轉(zhuǎn)換為“NOPASS”。3.1.3 連續(xù)變量的可視化分段VISUAL Bander 用于將連續(xù)變量進(jìn)行分段,該過(guò)程使用百分位數(shù)、標(biāo)準(zhǔn)差范圍或者等間距方式將連續(xù)變量劃分為若干組段,并采用圖形化操作的方式。例3.4 對(duì)數(shù)學(xué)成績(jī)進(jìn)行分段,假設(shè)現(xiàn)在希望按變量math將學(xué)生分為5組,60分以下為第一組,60分以上的按照等間距

33、的方式分為4組。3.1.4 將字符變量轉(zhuǎn)換為數(shù)值變量用automatic recode將字符變量轉(zhuǎn)換為數(shù)值變量。3.1.5 變量的編秩所謂編秩,就是對(duì)記錄按照某個(gè)變量值大小來(lái)排序。Rank case過(guò)程就是用來(lái)排序的一個(gè)專用過(guò)程。例:根據(jù)性別分組計(jì)算數(shù)學(xué)成績(jī)的秩次。3.1.6 Transform菜單中的其它功能(1)count過(guò)程 如果用戶需要對(duì)滿足某項(xiàng)條件的數(shù)據(jù)進(jìn)行計(jì)數(shù),可以使用Count命令。 先在Target Variable中指定一個(gè)變量(可以是已經(jīng)存在的變量或新變量),并定義變量標(biāo)簽,然后指定要統(tǒng)計(jì)的變量加到Numeric Variables框中,再單擊Define Values按紐

34、,打開(kāi)Value to Count對(duì)話框。 Value:輸入某個(gè)值為清點(diǎn)對(duì)象;System-missing:以系統(tǒng)的缺失值為清點(diǎn)對(duì)象;System-or user missing:以系統(tǒng)或用戶指定的缺失值為清點(diǎn)對(duì)象;Range:指定數(shù)值的計(jì)數(shù)區(qū)域:其中包括: ( )through( )在框內(nèi)指定下限和上限lowest through( ): 在框內(nèi)只指定上限;( )highest through: 在框內(nèi)只指定下限。(2)random Number Seed過(guò)程: 用于設(shè)定偽隨機(jī)函數(shù)的隨機(jī)種子。3.2 文件級(jí)別的數(shù)據(jù)管理(一)數(shù)據(jù)編輯窗口的Data菜單為用戶創(chuàng)建和定義數(shù)據(jù)提供了方便的功能。這個(gè)

35、菜單是SPSS統(tǒng)計(jì)軟件數(shù)據(jù)整理的特有功能菜單。它的功能包括:對(duì)變量、觀測(cè)量的編輯處理;對(duì)變量數(shù)據(jù)的變換;對(duì)觀察量數(shù)據(jù)整理。(1)簡(jiǎn)單命令:包括插入變量、插入記錄和到達(dá)某條記錄,他們的功能實(shí)際上都可以用鼠標(biāo)在數(shù)據(jù)表界面上直接完成,很少會(huì)使用菜單來(lái)調(diào)用。(2)常用的簡(jiǎn)單過(guò)程:包括排序、拆分文件、選擇記錄和加權(quán)記錄。(3)變量與數(shù)據(jù)文件屬性導(dǎo)向:用于定義數(shù)據(jù)字典,或者將于定義的數(shù)據(jù)字典直接引入當(dāng)前數(shù)據(jù)文件。 (4)數(shù)重構(gòu)過(guò)導(dǎo)向:用于進(jìn)行數(shù)據(jù)轉(zhuǎn)置,或者對(duì)重復(fù)測(cè)量數(shù)據(jù)表進(jìn)行長(zhǎng)型、寬型記錄間的轉(zhuǎn)換。(5)文件合并過(guò)程:將幾個(gè)數(shù)據(jù)文件合并為一個(gè)大的spss數(shù)據(jù)文件,含橫向合并和縱向合并兩種情況。(6)正交設(shè)

36、計(jì)過(guò)程:實(shí)際上是聯(lián)合分析模塊的一部分,用于生成實(shí)施聯(lián)合分析所需要的設(shè)計(jì)。(7)其他過(guò)程:包括定義日期變量過(guò)程、數(shù)據(jù)匯總過(guò)程和查找重復(fù)記錄導(dǎo)向。定義變量屬性定義變量日期插入觀測(cè)量拷貝數(shù)據(jù)屬性插入一個(gè)變量定位觀測(cè)量觀測(cè)量排序重構(gòu)數(shù)據(jù)結(jié)構(gòu)分類或不分類匯總正交設(shè)計(jì)數(shù)據(jù)文件轉(zhuǎn)置合并數(shù)據(jù)文件標(biāo)識(shí)重復(fù)觀測(cè)量拆分?jǐn)?shù)據(jù)文件選擇觀測(cè)量觀測(cè)量加權(quán)3.2.1 記錄排序一、排序的兩種方法:(1)在數(shù)據(jù)表格的變量名處單擊右鍵,彈出的右鍵菜單最后兩項(xiàng)就是“sort Ascending”和“Sort Descending”。(2)對(duì)于多變量排序,則需要使用Sort Cases過(guò)程來(lái)進(jìn)行。二、多變量排序需要注意的三點(diǎn):(1)在

37、多重排序中,制定排序變量名是很關(guān)鍵的,先指定的變量在排序時(shí)必然優(yōu)先于后制訂的變量。(2)可以指定按某變量值升序排序的同時(shí)按另一變量值降序排序,或相反。(3)排序以后,原來(lái)記錄數(shù)據(jù)的排列次序?qū)⒈淮騺y。3.2.2 記錄拆分Split File 分割文件的功能是把當(dāng)前工作分割成兩個(gè)或兩個(gè)以上的組,隨后的分析將對(duì)每個(gè)組進(jìn)行。3.2.3 記錄篩選Select Cases:當(dāng)用戶不需要分析全部的數(shù)據(jù),而是按要求分析其中的一部分,使用該選擇。All case:選擇所有數(shù)據(jù);If condition is satisfied: 按指定條件選擇數(shù)據(jù)。Random Sample of cases:對(duì)觀察值進(jìn)行隨機(jī)

38、抽樣。 Use filter variable:用指定變量作過(guò)濾。先選擇一個(gè)變量,系統(tǒng)自動(dòng)在數(shù)據(jù)管理器中將該變量值為0的觀測(cè)單位標(biāo)上刪除記號(hào),系統(tǒng)對(duì)標(biāo)有刪除記號(hào)的觀測(cè)單位不作分析。Based on time or case range:順序抽樣。單擊Range按紐,打開(kāi)Select Case: Range對(duì)話框,用戶自行定義從第幾個(gè)觀察值開(kāi)始抽到第幾個(gè)觀察值結(jié)束。3.2.4 加權(quán)記錄Weight Cases:設(shè)定某變量為頻數(shù)變量。3.2.5 數(shù)據(jù)匯總所謂分類匯總就是按指定的分類變量對(duì)觀測(cè)值進(jìn)行分組,對(duì)每組記錄的各變量求指定的描述統(tǒng)計(jì)量,結(jié)果可以存入新數(shù)據(jù)文件,也可以替換當(dāng)前數(shù)據(jù)文件。一、匯總的

39、概念二、進(jìn)行分類匯總的方法1、打開(kāi)“data”菜單,選擇“Aggregate”,展開(kāi)aggregate data”對(duì)話框。2、在左側(cè)的源變量框中選擇一個(gè)或多個(gè)變量作為分類變量進(jìn)入分類變量(Break Variables)框中。3、在左側(cè)的源變量框中選擇一個(gè)或多個(gè)變量作為要求匯總的變量進(jìn)入?yún)R總變量(Aggregate Variables)框中,即要求這些變量的值進(jìn)行分類匯總。4、“name& label” (名稱與標(biāo)簽):?jiǎn)螕舸税粹o可以修改組合后所生成新變量名稱以及標(biāo)簽:可以在name后面的矩形框中輸入新變量名。在Label后面的矩形框中輸入新變量標(biāo)簽。單擊“continue”按鈕繼續(xù)。5、“F

40、unction”(函數(shù)) 選擇此項(xiàng)可以確定匯總變量的描述內(nèi)容;系統(tǒng)默認(rèn)函數(shù)為平均數(shù)。3.3文件級(jí)別的數(shù)據(jù)管理(二)3.3.1 數(shù)據(jù)字典的定義與應(yīng)用在大型的數(shù)據(jù)分析項(xiàng)目中,數(shù)據(jù)管理是非常重要的一個(gè)環(huán)節(jié),為了保證工作質(zhì)量,數(shù)據(jù)處理人員往往會(huì)事先定義好一個(gè)非常詳細(xì)的數(shù)據(jù)格式,包括變量格式、變量標(biāo)簽、標(biāo)簽值、缺失值定義等,這被稱為數(shù)據(jù)字典。一、變量屬性定義導(dǎo)向:Define Variable Properties 具體說(shuō)來(lái),可以列出所選變量的所有值;分辨沒(méi)有值標(biāo)簽的值,并且提供自動(dòng)給出值標(biāo)簽的功能;可以將另一個(gè)變量的屬性拷貝到所選變量,也可以將所選變量的屬性拷貝到其他變量。二、復(fù)制數(shù)據(jù)文件屬性導(dǎo)向Co

41、py Data Properties 過(guò)程用于將定義好的數(shù)據(jù)字典直接應(yīng)用到當(dāng)前文件中。操作時(shí)不僅可以將一個(gè)外部數(shù)據(jù)文件相關(guān)屬性拷貝到當(dāng)前數(shù)據(jù)文件中,還可以進(jìn)行自行定義,只選擇某些變量,或者某些屬性進(jìn)行拷貝,這無(wú)疑大大提高了連續(xù)性項(xiàng)目對(duì)原有資源的利用程度。3.3.2 查找重復(fù)記錄Identifying Duplicate Cases:用于查找重復(fù)記錄。運(yùn)行結(jié)束后,結(jié)果窗口會(huì)給出本次操作的信息匯總:3.3.3 數(shù)據(jù)文件的重新排列與轉(zhuǎn)置一、數(shù)據(jù)的長(zhǎng)型與寬型格式:長(zhǎng)型格式和寬型格式指的是重復(fù)測(cè)量數(shù)據(jù)的兩種不同的排列方式。由于重復(fù)測(cè)量模型可以使用不同的統(tǒng)計(jì)模型加以分析,因此根據(jù)模型的要求進(jìn)行長(zhǎng)型格式和寬

42、型格式之間的互轉(zhuǎn)換是數(shù)據(jù)分析中經(jīng)常要遇到的問(wèn)題。二、長(zhǎng)型格式轉(zhuǎn)換為寬型格式:Restructure。選擇Data Restructure,系統(tǒng)就會(huì)彈出下圖導(dǎo)向。三、數(shù)據(jù)轉(zhuǎn)置Transpose:用于對(duì)數(shù)進(jìn)行行列轉(zhuǎn)置,數(shù)據(jù)文件的轉(zhuǎn)置就是將數(shù)據(jù)編輯窗口中數(shù)據(jù)的行列互換,即將記錄轉(zhuǎn)為變量,將變量轉(zhuǎn)為記錄后,重新顯示在數(shù)據(jù)編輯窗口中。Variable(s):放入將要行列轉(zhuǎn)置的變量名。在數(shù)據(jù)文件中,未放入欄中的變量會(huì)遺失。字符串變量不能轉(zhuǎn)換,如強(qiáng)迫轉(zhuǎn)換,變量值轉(zhuǎn)變?yōu)橄到y(tǒng)缺失值。Name variable:變量命名欄,在左側(cè)源變量欄中選擇一個(gè)變量,放入name variable欄,技改變量的數(shù)據(jù)作為轉(zhuǎn)置后的

43、變量名。3.3.4 多個(gè)數(shù)據(jù)文件的合并縱向連接:幾個(gè)數(shù)據(jù)集中的數(shù)據(jù)相加,組成一個(gè)新的數(shù)據(jù)集,新數(shù)據(jù)集中的記錄是原來(lái)幾個(gè)數(shù)據(jù)集中記錄數(shù)的總和。橫向連接:指的是按照記錄的次序,或者某個(gè)關(guān)鍵變量的數(shù)值,將不同數(shù)據(jù)集中的不同變量合并為一個(gè)數(shù)據(jù)集,新數(shù)據(jù)集中的變量數(shù)是所有原數(shù)據(jù)集中不重名變量的總和。一、數(shù)據(jù)文件的縱向連接縱向合并實(shí)質(zhì)就是將兩個(gè)數(shù)據(jù)文件的變量列,按照各個(gè)變量名的含義,一一對(duì)應(yīng)的進(jìn)行首尾相接??v向合并必須遵循兩個(gè)條件:第一,兩個(gè)合并的spss數(shù)據(jù)文件,其內(nèi)容合并是有實(shí)際意義的。第二,為方便spss數(shù)據(jù)文件的合并,在不同的數(shù)據(jù)文件中,最好起相同的名字,變量類型和變量長(zhǎng)度也要盡量相同。Unpai

44、red variable:不匹配變量欄。指變量名相同而變量定義不同的變量,或變量名不同的變量。Variable in new working data:新工作數(shù)據(jù)變量欄。Indicate case source as variable:指示記錄來(lái)源的變量選項(xiàng)/二、數(shù)據(jù)文件的橫向合并橫向合并的實(shí)質(zhì)是將兩個(gè)數(shù)據(jù)文件的記錄,按照記錄對(duì)應(yīng),一一進(jìn)行左右對(duì)接。橫向合并遵循三個(gè)條件:第一,如果不是按照記錄號(hào)對(duì)應(yīng)的規(guī)律進(jìn)行合并,則兩個(gè)數(shù)據(jù)文件必須至少有一個(gè)變量名相同的公共變量,這個(gè)變量是兩個(gè)數(shù)據(jù)文件橫向合并的依據(jù),成為關(guān)鍵變量。第二,如果是使用關(guān)鍵變量進(jìn)行合并的對(duì)應(yīng),則兩個(gè)數(shù)據(jù)文件都必須事先按關(guān)鍵變量進(jìn)行升

45、序排列。第三,為方便SPSS文件的合并,在不同的數(shù)據(jù)文件中,數(shù)據(jù)含義不相同的列,變量名不應(yīng)取相同的名稱。Excluded Variables:拒絕變量名。外部文件與當(dāng)前數(shù)據(jù)的同變量,拒絕加到新工作區(qū)中。New Working Data:新工作數(shù)據(jù)變量欄。Match Case on Key Variable in sort:排序文件中按關(guān)鍵變量匹配記錄選項(xiàng)。Both files provide case:由外部文件和當(dāng)前數(shù)據(jù)量?jī)烧咛峁┯涗?。External file is keyed table:外部文件為關(guān)鍵表,以當(dāng)前數(shù)據(jù)為基準(zhǔn),外部文件匹配當(dāng)前數(shù)據(jù)的關(guān)鍵變量值,如匹配成功,外部文件的新變量值

46、加入到當(dāng)前數(shù)據(jù)的新變量中,匹配不成功則不加入。Working Data File is keyed table:當(dāng)前數(shù)據(jù)為關(guān)鍵表。Key Variables:關(guān)鍵變量欄,在拒絕變量選擇某變量作為關(guān)鍵變量。Indicate case source as variable:指示記錄來(lái)源的變量選項(xiàng)。第五章 spss 編程操作入門 內(nèi)容:1.進(jìn)入程序編輯窗口界面2.熟用Paste 按鈕3.編程進(jìn)行對(duì)話框無(wú)法完成的工作4.簡(jiǎn)單編程命令介紹(變量標(biāo)簽定義 、Compute、Count 、Recode)5.結(jié)構(gòu)化語(yǔ)句 (條件語(yǔ)句 、循環(huán)語(yǔ)句 )6.綜合練習(xí)進(jìn)入程序編輯窗口界面創(chuàng)建一個(gè)新程序Filenewsy

47、ntax打開(kāi)一個(gè)舊程序 Fileopensyntax程序文件的擴(kuò)展名為*.sps注:syntax窗口的菜單和SPSS窗口的菜單功能基本一致,區(qū)別在于RUN菜單。RUN ALL運(yùn)行全部程序 RUN SELECTION運(yùn)行所選擇的部分程序熟用Paste 按鈕在所有對(duì)話框選擇完畢后,不選擇 OK,而使用Paste 例如:打開(kāi)xuelin編程進(jìn)行對(duì)話框無(wú)法完成的工作例4.1 打開(kāi)cars.sav P50 操作后的語(yǔ)句:COUNT G1 = year cylinder weight (Lowest thru 76) year cylinder weight (Lowest thru 4) year cy

48、linder weight (3000 thru Highest) .EXECUTE .修改為正確的格式:COUNT G1 = year (Lowest thru 76) cylinder (Lowest thru 4) weight (3000 thru Highest) .EXECUTE .注:編程基本小知識(shí):每句命令完成后,以點(diǎn)號(hào)結(jié)束,否則程序不被執(zhí)行。全部命令編輯完成后,以Execute.結(jié)束,否則程序不被執(zhí)行.學(xué)會(huì)使用helpcommand syntax reference自學(xué)編程。簡(jiǎn)單編程命令介紹 1、變量標(biāo)簽定義Variable labels varname label.Eg:

49、variable labels x1 語(yǔ)文 x2 數(shù)學(xué) x3 英語(yǔ).2、Compute(用于給變量賦值)Compute target variable=expressionEx: 請(qǐng)建立成績(jī)文件,要求包含變量X1語(yǔ)文/X2數(shù)學(xué)/X3英語(yǔ)/X4總分/ X5均值其中x1服從均值為75標(biāo)準(zhǔn)差為5的正態(tài)分布,x2服從50100的均勻分布,x3服從均值為70標(biāo)準(zhǔn)差為5的正態(tài)分布 程序:Set seed 5502090(可寫(xiě),也可不寫(xiě))input program.loop #i=1 to pute x1=rv.normal (75, 5).Compute x2= rv.uniform (50,100).C

50、ompute x3=rv.normal(70, 5).Compute x4=sum(x1, x2,x3).Compute x5=mean(x1, x2,x3).variable labels x1 語(yǔ)文 x2 數(shù)學(xué) x3 英語(yǔ) x4 總分x5均值.end case.end loop.end file.end input program.execute.3、Count(用于標(biāo)示某個(gè)值或某些值在某個(gè)變量的取值中是否出現(xiàn))Count Varname=varlist (value list)Key words for value list Lo /Hi/Thru Ex: 要求,在成績(jī)文件中,統(tǒng)計(jì)各位同

51、學(xué)不及格門數(shù),以及每位同學(xué)有幾門功課處于70到80之間。Count target1=x1 to x3 (lo thru 60).Count target2=x1 to x3 (70 through 80).Count target3=x1 to x3 (60 through hi).練習(xí)答案input program.loop #i=1 to pute x1=rv.normal (75, 5).Compute x2= rv.uniform (50,100).Compute x3=rv.normal(70, 5).Compute x4=sum(x1, x2,x3).Compute x5=mean

52、(x1, x2,x3).variable labels x1 語(yǔ)文 x2 數(shù)學(xué) x3 英語(yǔ) x4 總分x5均值.Count target1=x1 to x3 (lo thru 60).Count target2=x1 to x3 (70 through 80).Count target3=x1 to x3 (60 through hi).end case.end loop.end file.end input program.execute.4、Recode(用于從原變量值按照某種一一對(duì)應(yīng)的關(guān)系生成新變量值)Recode variable (value list) into target va

53、riableEx: recode x (1 through 2=10) (else=20) into x1. (相當(dāng)于條件)Ex :string x7(a1)(字符型)(a1表示寬度) Compute x7=女. recode x7 (女=1) into xx.練習(xí)Ex : 打開(kāi)pkc.sav文件,將sex變量進(jìn)行重新編碼,定義為新變量sex1,其中sex為1,sex1為女, sex為2,sex1為男。GET FILE=E:study大三上個(gè)學(xué)期spss案例數(shù)據(jù)pkc.sav.string sex1(a3).recode sex(1=女)(else=男) into sex1.Execute.分

54、支語(yǔ)句(條件語(yǔ)句) 語(yǔ)句程序格式: 邏輯表達(dá)式目標(biāo)表達(dá)式邏輯表達(dá)式用于給出判斷條件目標(biāo)比達(dá)式表示如果滿足邏輯表達(dá)式后該如何操作。練習(xí)示例:打開(kāi)案例數(shù)據(jù)brain1.sav,要求將年齡小于20,性別為1(男)的病人歸為第一組(group=1).GET FILE=F:Jane案例數(shù)據(jù)brain1.sav.if age20 & sex=1 group=1.Execute.示例2:打開(kāi)案例數(shù)據(jù)brain1.sav,要求將年齡小于等于40歲的女性病人歸為組2.GET FILE=H:案例數(shù)據(jù)brain1.sav.if age le 40 group=2.execute.或者用recode 語(yǔ)句來(lái)做試試!r

55、ecode age (lo thru 40=2) into group.練習(xí)1:將血小板大于等于100的取值為1。GET FILE=H:案例數(shù)據(jù)brain1.sav.if plt ge 100 group=1.execute.用recode來(lái)試試看,也可以的!recode plt (100 thru hi=1) into group.練習(xí)2:打開(kāi)brain1.sav,創(chuàng)造一個(gè)新的字符型變量sex1,當(dāng)sex取值為1時(shí),sex1取值為f, 當(dāng)sex取值為2時(shí),sex1取值為m.GET FILE=H:案例數(shù)據(jù)brain1.sav.string sex1 (a1).(a1寬度)compute sex

56、1=f.if sex=2 sex1=m.execute. 語(yǔ)句如果需要多重分支,有多個(gè)條件限制時(shí),需要用到DO IF語(yǔ)句程序格式:IF邏輯表達(dá)式目標(biāo)表達(dá)式.目標(biāo)表達(dá)式示例:見(jiàn)書(shū)()GET FILE=F:Jane案例數(shù)據(jù)brain1.sav.DO IF (age20).COMPUTE ageclass=1.ELSE IF (age30).COMPUTE ageclass=2.ELSE IF (age=0). COMPUTE B=A. (如果A=0,則新變量b=a)ELSE.COMPUTE B=A*2.(否則,b=a*2)END IF.EXECUTE.(開(kāi)始執(zhí)行以上程序)LIST.(在結(jié)果窗口中輸

57、出數(shù)據(jù)列表)實(shí)例GET FILE=E:study大三上個(gè)學(xué)期spss案例數(shù)據(jù)brain1.sav.SET mxloops=10. Loop.Compute x1=x+1.End loop. EXECUTE.或者:Loop #lop=1 to 10. 開(kāi)始循環(huán),要求循環(huán)10次Compute x=x+1. 將變量累加1End loop. 示例2:產(chǎn)生1200的連續(xù)自然數(shù)Input program.Loop #i=1 to 200.Compute x=#i.end case.End loop.End file.End input program.Execute.宏的基本格式定義DEFINE !M_S

58、AMPLE() ABC* 任何有效的SPSS程序段.!ENDDEFINE.IF VARX=1 VARY=!M_SAMPLE.EXECUTE.2022年8月12日文彤老師158宏參數(shù)DEFINE P ( INVAR1=!CHAREND(/) ).RECODE !INVAR1 (1 THRU 5 = COPY) (ELSE= 9) INTO !CONCAT(T,!INVAR1) .EXEC.!ENDDEFINE. P INVAR1=A3 .2022年8月12日文彤老師159OMS系統(tǒng)即輸出管理系統(tǒng)(Output Management System)提供了結(jié)果輸出和數(shù)據(jù)文件的自動(dòng)交互功能可以將輸出結(jié)

59、果存儲(chǔ)為SPSS數(shù)據(jù)格式(SAV)、XML格式、HTML格式、TXT格式、PDF格式等可以指定輸出結(jié)果中的表格、文本、圖形2022年8月12日文彤老師160OMS控制面板2022年8月12日文彤老師161分析實(shí)例DATASET DECLARE freq.sav.OMS /SELECT TABLES /IF COMMANDS=Frequencies SUBTYPES=Frequencies /DESTINATION FORMAT=SAV NUMBERED=TableNumber_ OUTFILE=freq.sav.OMSEND.2022年8月12日文彤老師162分析實(shí)例2022年8月12日文彤老

60、師163綜合練習(xí)練習(xí)1:要求產(chǎn)生有100條記錄的新數(shù)據(jù)集。要求:隨機(jī)變量A服從均值為5,標(biāo)準(zhǔn)差為10的正態(tài)分布的,當(dāng)該變量大于5時(shí),改為新變量B,若該變量小于等于5時(shí),則B等于A的平方。(要求固定隨機(jī)種子)。(可以通過(guò)編程指南查找怎樣產(chǎn)生這樣一個(gè)正態(tài)分布)。練習(xí)2 請(qǐng)建立共50人的成績(jī)文件,要求包含變量X1語(yǔ)文/X2數(shù)學(xué)/X3英語(yǔ)/X4總分/ X5均值,要求x1服從均值為75,標(biāo)準(zhǔn)差為5的正態(tài)分布隨機(jī)序列,x2為服從50100之間的均勻分布隨機(jī)序列,x3服從均值為70,標(biāo)準(zhǔn)差為5的正態(tài)分布序列,x4為三科總成績(jī),x5為三科的平均成績(jī)。(參考教材53頁(yè)例題)(前面例子)第四講 實(shí)戰(zhàn)案例文彤老師C

溫馨提示

  • 1. 本站所有資源如無(wú)特殊說(shuō)明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請(qǐng)下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請(qǐng)聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁(yè)內(nèi)容里面會(huì)有圖紙預(yù)覽,若沒(méi)有圖紙預(yù)覽就沒(méi)有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫(kù)網(wǎng)僅提供信息存儲(chǔ)空間,僅對(duì)用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對(duì)用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對(duì)任何下載內(nèi)容負(fù)責(zé)。
  • 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請(qǐng)與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶因使用這些下載資源對(duì)自己和他人造成任何形式的傷害或損失。

評(píng)論

0/150

提交評(píng)論