spss數(shù)據(jù)文件的建立與整理_第1頁(yè)
spss數(shù)據(jù)文件的建立與整理_第2頁(yè)
spss數(shù)據(jù)文件的建立與整理_第3頁(yè)
spss數(shù)據(jù)文件的建立與整理_第4頁(yè)
spss數(shù)據(jù)文件的建立與整理_第5頁(yè)
已閱讀5頁(yè),還剩131頁(yè)未讀, 繼續(xù)免費(fèi)閱讀

下載本文檔

版權(quán)說(shuō)明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請(qǐng)進(jìn)行舉報(bào)或認(rèn)領(lǐng)

文檔簡(jiǎn)介

StatisticalProgramforSocialSciencesSPSSforWindows第二章數(shù)據(jù)文件的建立與整理第一節(jié)重點(diǎn)介紹spss軟件及其數(shù)據(jù)文件的建立第二節(jié)數(shù)據(jù)文件的整理第三節(jié)簡(jiǎn)單介紹Minitab軟件及其數(shù)據(jù)文件的建立學(xué)習(xí)目標(biāo)1.熟悉SPSS統(tǒng)計(jì)軟件中數(shù)據(jù)文件的建立數(shù)據(jù)的預(yù)處理一.數(shù)據(jù)的審核與篩選二.數(shù)據(jù)的排序數(shù)據(jù)的審核、篩選與排序數(shù)據(jù)的審核發(fā)現(xiàn)數(shù)據(jù)中的錯(cuò)誤數(shù)據(jù)的篩選找出符合條件的數(shù)據(jù)數(shù)據(jù)排序發(fā)現(xiàn)數(shù)據(jù)的基本特征升序和降序數(shù)據(jù)的審核

(原始數(shù)據(jù))審核的內(nèi)容完整性審核檢查應(yīng)調(diào)查的單位或個(gè)體是否有遺漏所有的調(diào)查項(xiàng)目或指標(biāo)是否填寫(xiě)齊全準(zhǔn)確性審核檢查數(shù)據(jù)是否真實(shí)反映客觀實(shí)際情況,內(nèi)容是否符合實(shí)際檢查數(shù)據(jù)是否有錯(cuò)誤,計(jì)算是否正確等數(shù)據(jù)的審核

(第二手?jǐn)?shù)據(jù))適用性審核弄清楚數(shù)據(jù)的來(lái)源、數(shù)據(jù)的口徑以及有關(guān)的背景材料確定這些數(shù)據(jù)是否符合自己分析研究的需要時(shí)效性審核應(yīng)盡可能使用最新的統(tǒng)計(jì)數(shù)據(jù)確認(rèn)是否必要做進(jìn)一步的加工整理數(shù)據(jù)的篩選對(duì)審核過(guò)程中發(fā)現(xiàn)的錯(cuò)誤應(yīng)盡可能予以糾正當(dāng)發(fā)現(xiàn)數(shù)據(jù)中的錯(cuò)誤不能予以糾正,或者有些數(shù)據(jù)不符合調(diào)查的要求而又無(wú)法彌補(bǔ)時(shí),需要對(duì)數(shù)據(jù)進(jìn)行篩選數(shù)據(jù)篩選的內(nèi)容包括:將某些不符合要求的數(shù)據(jù)或有明顯錯(cuò)誤的數(shù)據(jù)予以剔除將符合某種特定條件的數(shù)據(jù)篩選出來(lái),而不符合特定條件的數(shù)據(jù)予以剔出引例:某克山病區(qū)測(cè)得11例克山病患者與13名健康人的血磷值(mmol/L)如下,問(wèn)該地急性克山病患者與健康人的血磷值是否不同?患者:

0.841.051.201.201.391.531.671.801.872.072.11健康人:0.540.640.640.750.760.811.161.201.341.351.481.561.87具體工作流程如下:

建立數(shù)據(jù)文件數(shù)據(jù)的加工整理統(tǒng)計(jì)分析解釋分析結(jié)果定義數(shù)據(jù)文件的結(jié)構(gòu)錄入修改保存數(shù)據(jù)統(tǒng)計(jì)軟件參與的主要是:數(shù)據(jù)輸入數(shù)據(jù)分析數(shù)據(jù)輸出§2.2

SPSS數(shù)據(jù)文件的建立一.SPSS軟件簡(jiǎn)介二.SPSS數(shù)據(jù)文件的建立第一講SPSS簡(jiǎn)介1簡(jiǎn)介SPSS是StatisticalProgramforSocialSciences的簡(jiǎn)稱(chēng),即社會(huì)科學(xué)統(tǒng)計(jì)程序,由美國(guó)SPSS公司1970年代推出,迄今已有近30年的歷史。是國(guó)際著名三大社會(huì)科學(xué)統(tǒng)計(jì)軟件包之一(SAS、SPSS、Statis)。我們現(xiàn)在使用的是SPSSforWindows12.0版。SPSSForWindows的概述

SPSSForWindows的特點(diǎn)SPSSForWindows對(duì)環(huán)境的要求SPSSForWindows的軟件安裝SPSSForWindows的啟動(dòng)與退出1.1SPSSForWindows的特點(diǎn)操作界面極為友好,輸出結(jié)果美觀漂亮多種實(shí)用分析方法,強(qiáng)大的圖形處理能力操作簡(jiǎn)便,易于學(xué)習(xí)、易于使用與其他軟件有數(shù)據(jù)轉(zhuǎn)換接口(ODBC)1.2SPSSForWindows對(duì)環(huán)境的要求

對(duì)硬件環(huán)境的要求16M以上內(nèi)存30%以上自由空間對(duì)軟件環(huán)境的要求Windows95.98.2000關(guān)于spss的漢化1.3SPSSForWindows的軟件安裝

開(kāi)機(jī)啟動(dòng)windows把spss的安裝光盤(pán)放入光驅(qū)雙擊setup文件同意版權(quán)聲明next選擇安裝目錄填寫(xiě)用戶名、單位名和系列號(hào)選擇安裝類(lèi)型安裝完成1.4SPSSForWindows的啟動(dòng)與退出

SPSSForWindows系統(tǒng)的啟動(dòng)SPSSForWindows系統(tǒng)的退出§2.1數(shù)據(jù)的輸入和保存1.1.1進(jìn)入SPSS的界面1.1.2定義變量1.1.3輸入數(shù)據(jù)1.1.4保存數(shù)據(jù)1.1.1進(jìn)入SPSS的界面數(shù)據(jù)視圖:用于查看、錄入和修改數(shù)據(jù)

變量視圖:用來(lái)定義和修改變量的定義

請(qǐng)將鼠標(biāo)在上圖中的各處停留,很快就會(huì)彈出相應(yīng)部位的名稱(chēng)。現(xiàn)在所看到的是SPSS的數(shù)據(jù)管理窗口。這是一個(gè)典型的Windows軟件界面,有菜單欄、工具欄。特別的,工具欄下方的是數(shù)據(jù)欄,數(shù)據(jù)欄下方則是數(shù)據(jù)管理窗口的主界面。該界面和EXCEL極為相似,由若干行和列組成,每行對(duì)應(yīng)了一條記錄,每列則對(duì)應(yīng)了一個(gè)變量。由于現(xiàn)在我們沒(méi)有輸入任何數(shù)據(jù),所以行、列的標(biāo)號(hào)都是灰色的。

小貼士:對(duì)數(shù)據(jù)表界面操作不熟悉的朋友可先學(xué)習(xí)一下EXCEL的操作(因?yàn)樗膸椭侵形牡模?/p>

§2.1數(shù)據(jù)的輸入和保存1.1.1進(jìn)入SPSS的界面1.1.2定義變量1.1.3輸入數(shù)據(jù)1.1.4保存數(shù)據(jù)1.1.2定義變量在VariableView對(duì)話框中對(duì)變量進(jìn)行定義,變量的定義要符合規(guī)則,對(duì)不同數(shù)據(jù)的變量類(lèi)型要合乎定義,如單擊“Type”按鈕可以實(shí)現(xiàn)變量類(lèi)型的定義等。

單擊VariableView按鈕后該資料是定量資料,設(shè)計(jì)為成組設(shè)計(jì),因此我們需要建立兩個(gè)變量,一個(gè)變量代表血磷值,習(xí)慣上取名為X,另一個(gè)變量代表觀察對(duì)象是健康人還是克山病人,習(xí)慣上取名為GROUP。在VariableView對(duì)話框中第一個(gè)變量定義為group,Type為Numeric,并在Lable處注明1為患者,2為健康人;第二個(gè)變量定義為X,Type為Numeric,Width為8,Decimals為2等等。

變量標(biāo)簽就在Label框中直接輸入,變量值標(biāo)簽則在它右側(cè)的Value框定義。以group為例,單擊Value框右半部的省略號(hào),會(huì)彈出變量值標(biāo)簽對(duì)話框如下:上部的兩個(gè)文本框分別為變量值輸入框和變量值標(biāo)簽輸入框,分別在其中輸入“1”和“克山病患者”,此時(shí)下方的Add鈕變黑,單擊它,該變量值標(biāo)簽就會(huì)被加入下方的標(biāo)簽框內(nèi)。與此類(lèi)似定義變量值“2”為“健康人”,最后按OK,變量值標(biāo)簽就設(shè)置完成。此時(shí)你做任何分析,在結(jié)果中都有相應(yīng)的標(biāo)簽出現(xiàn)。如果你現(xiàn)在就想看效果,切換回DataView界面,然后選擇菜單View==>ValueLabels,怎么樣,看到了嗎?值標(biāo)簽定義方法缺失值

單擊missing框右側(cè)的省略號(hào),會(huì)彈出缺失值對(duì)話框如下:界面上有一列三個(gè)單選鈕,默認(rèn)值為最上方的“無(wú)缺失值”;第二項(xiàng)為“不連續(xù)缺失值”,最多可以定義3個(gè)值;最后一項(xiàng)為“缺失值范圍加可選的一個(gè)缺失值”,文如其意,不用我多解釋了吧。缺失值定義方法數(shù)據(jù)表達(dá)——常量

常量類(lèi)型數(shù)值型普通書(shū)寫(xiě)方式例如2638.4科學(xué)記數(shù)法用于表示特大或特小的數(shù)字如1.23E182.56E-16字符型被單引號(hào)或雙引號(hào)括起來(lái)的一串字符如:‘book’“I’maboy”日期型SPSS變量名由不多于8個(gè)字符組成首字母是可為字母或數(shù)字或除?-!和*以外的字符注意不能以下劃線_和園點(diǎn)“.”作為變量名的最后一個(gè)字符變量名不能與SPSS保留字相同,SPSS的保留字有ALLANDBYEQGEGTLELTNENOTORTOWITH不區(qū)分變量名的大小寫(xiě),如ABC和abc

被認(rèn)為是同一個(gè)變量數(shù)據(jù)表達(dá)——Spss變量(變量命名原則)數(shù)據(jù)表達(dá)—Spss變量(變量類(lèi)型與默認(rèn)長(zhǎng)度)三種基本類(lèi)型:數(shù)值型、字符型、日期類(lèi)型長(zhǎng)度小數(shù)顯示方式輸入顯示Numeric8.2標(biāo)準(zhǔn)格式,圓點(diǎn)表示小數(shù)點(diǎn)38.4238.42Comma8.2圓點(diǎn)做小數(shù)點(diǎn),逗點(diǎn)做三位分割符1,343,438.11,343,438.1Dot8.2逗點(diǎn)做小數(shù)點(diǎn),圓點(diǎn)做三位分割符34.3434E23.434,34Scietific8.2科學(xué)計(jì)數(shù)法457.8E4457.8E4Date8.2格式非常多Dollar8.2前綴為$,以逗點(diǎn)為分割符$12343$12343Cuscurrency8.2String8.2一串字符串BelieveBelieve數(shù)據(jù)表達(dá)—Spss變量(標(biāo)簽、值標(biāo)簽和格式)

變量標(biāo)簽VariableLabels例如:變量名變量標(biāo)簽

Wweight或體重

HHeight或身高值標(biāo)簽ValueLabels例如變量值值標(biāo)簽

SexfFemalemMale

變量格式顯示寬度對(duì)齊方式缺失值(MissingValue)原始數(shù)據(jù)的組織方式

SPSS數(shù)據(jù)的基本組織方式在原始數(shù)據(jù)的組織方式中,數(shù)據(jù)編輯窗口中的一行稱(chēng)為一個(gè)個(gè)案(Case),數(shù)據(jù)編輯窗口中的一列稱(chēng)為一個(gè)變量,每個(gè)變量都有一個(gè)名字。居民儲(chǔ)蓄調(diào)查問(wèn)卷性別職業(yè)年齡1、請(qǐng)問(wèn)您的收入是()

A1000以內(nèi)B1000~2000C2000~5000D5000以上。。。。。。一份關(guān)于居民儲(chǔ)蓄的調(diào)查問(wèn)卷變量1變量2變量3變量4原始數(shù)據(jù)組織形式性別職業(yè)年齡收入11124A22333B…….…….…..頻數(shù)數(shù)據(jù)的組織方式

SPSS數(shù)據(jù)的基本組織方式在頻數(shù)數(shù)據(jù)的組織方式中,數(shù)據(jù)編輯窗口中的一行為變量的一個(gè)分組(Case),數(shù)據(jù)編輯窗口中的一列仍為一個(gè)變量,代表某個(gè)問(wèn)題及頻數(shù)。頻數(shù)數(shù)據(jù)舉例年齡段職稱(chēng)35歲以下(1)36~49歲(2)50~60歲(3)60歲以上教授015835副教授102022講師201010變量1變量2變量3:人數(shù)頻數(shù)數(shù)據(jù)組織形式職稱(chēng)年齡段人數(shù)1101215。。。。。。。。。。錄入下面10名學(xué)生成績(jī)調(diào)查表

上機(jī)轉(zhuǎn)化為學(xué)生成績(jī)的調(diào)查表編碼將個(gè)人的學(xué)號(hào)(姓名)作為地址碼用數(shù)字表示,該變量相應(yīng)由字符型變?yōu)閿?shù)字型,性別編碼為男性為M,女性為F,對(duì)于未答、缺失、缺考、情況不清的編碼,使用不可能出現(xiàn)的碼表示。如字符變量用U碼、數(shù)據(jù)變量用-9表示,編碼后的結(jié)果如下圖學(xué)生成績(jī)的調(diào)查表編碼所示:

問(wèn)卷調(diào)查數(shù)據(jù)處理實(shí)例步驟:1、問(wèn)題分類(lèi)2、建立變量3、輸入數(shù)據(jù)4、驗(yàn)收2進(jìn)入SPSS之前的準(zhǔn)備工作2-1-1數(shù)據(jù)資料的形式:矩陣式數(shù)據(jù):數(shù)據(jù)要求每一橫行為一個(gè)個(gè)案(Case,即一份調(diào)查數(shù)據(jù)),縱列按變量排列,一列是一個(gè)變量(問(wèn)卷中的一道問(wèn)題),從而形成矩陣格式。2-1數(shù)據(jù)資料的形式及編碼編碼錄入2-1-2

編碼的概念:根據(jù)一定的規(guī)則將研究資料轉(zhuǎn)換為可進(jìn)行統(tǒng)計(jì)分析的數(shù)碼資料的過(guò)程。問(wèn)題025:您認(rèn)為打工的外地人對(duì)北京市的社會(huì)秩序是否有影響?(單選)1□有很大影響2□有較大影響

3□沒(méi)有影響4□不好說(shuō)4編碼答案2-1-3編碼的步驟:1)確定變量;變量:用來(lái)反映文意概念的量化形式。在統(tǒng)計(jì)中往往指最小的分析單位。編碼就是對(duì)變量進(jìn)行編碼。變量由兩個(gè)部分構(gòu)成:變量名和變量值。要注意區(qū)分何為變量,何為變量值。在調(diào)查問(wèn)卷中還要注意區(qū)分問(wèn)題和變量。問(wèn)題009:您有幾個(gè)兒子?幾個(gè)女兒?

1□兒子_______人

2□女兒________人

23問(wèn)題變量1變量2變量1的值變量2的值2)制作編碼表直接過(guò)錄0-1編碼變量名:一個(gè)數(shù)據(jù)文件中,一個(gè)變量只能有一個(gè)唯一名稱(chēng)。碼位:某一變量在數(shù)據(jù)文件中占據(jù)的欄位碼數(shù):某一變量由幾位數(shù)組成。該變量是數(shù)值型(Numeric)——如定距、定比,還是字串型(String),如定類(lèi)、定序。前者在統(tǒng)計(jì)中可以做高級(jí)運(yùn)算,后者則不可以。不適于被訪人回答的問(wèn)題的編碼。一般采用7,97,997等。被訪人回答不知道時(shí)的編碼。一般采用8,98,998等。被訪人拒絕回答某變量時(shí)的編碼。一般采用9,99,999等。問(wèn)卷中出現(xiàn)漏答時(shí)的處理編碼。一般采用9,99,999等。23100011不好進(jìn)行后續(xù)的數(shù)據(jù)分析!多選項(xiàng)問(wèn)題將多選項(xiàng)問(wèn)題進(jìn)行分解!解決辦法方法多選項(xiàng)二分法多選項(xiàng)分類(lèi)法將多選項(xiàng)問(wèn)題中每個(gè)答案設(shè)為一個(gè)SPSS變量,每個(gè)變量只有0或1兩個(gè)取值,分別表示選擇了該答案和不選擇該答案。應(yīng)估計(jì)多選項(xiàng)問(wèn)題最多可能出現(xiàn)的答案?jìng)€(gè)數(shù);然后為每個(gè)答案設(shè)置為一個(gè)SPSS變量,變量取值為多選項(xiàng)問(wèn)題中的可選答案。案例1你家中是否有下列物品:(1)電話(2)傳真機(jī)(3)有線電視(4)衛(wèi)星電視(5)大哥大(6)BP機(jī)對(duì)應(yīng)設(shè)置6個(gè)SPSS變量,其取值為1或0,其中1表示報(bào)考,0表示不報(bào)考。多選項(xiàng)二分法SPSS變量名變量名標(biāo)簽變量值V1有電話嗎?0/1V2有傳真機(jī)嗎?0/1V3有有線電視嗎?0/1V4有衛(wèi)星電視嗎?0/1V5有大哥大嗎?0/1V6有BP機(jī)嗎?0/1假設(shè)問(wèn)卷調(diào)查中出現(xiàn)的最多答案?jìng)€(gè)數(shù)為4,則可設(shè)置4個(gè)SPSS變量,分別表示答案一、答案二、答案三,答案四,變量取值為0~6,其中0代表此答案未選,其余對(duì)應(yīng)6個(gè)可選答案。多選項(xiàng)分類(lèi)法SPSS變量名變量名標(biāo)簽變量值V1答案一0/1/2/3/4/5/6V2答案二0/1/2/3/4/5/6V3答案三0/1/2/3/4/5/6V4答案四0/1/2/3/4/5/6如選擇了電話(1),大哥大(5),BP機(jī)(6),則V1,V2,V3,V4依次取值為1,5,6,0某地區(qū)高三學(xué)生的高考志愿調(diào)查中,為分析學(xué)生填報(bào)志愿的傾向性,設(shè)計(jì)了這樣一道問(wèn)題。案例2按照你的志愿,請(qǐng)按順序依次選擇你打算報(bào)考的三所大學(xué):(1)北京大學(xué)(2)清華大學(xué)(3)南京大學(xué)(4)南京理工大學(xué)(5)東南大學(xué)(6)南京師范大學(xué)對(duì)應(yīng)設(shè)置6個(gè)SPSS變量,其取值為1或0,其中1表示報(bào)考,0表示不報(bào)考。多選項(xiàng)二分法SPSS變量名變量名標(biāo)簽變量值V1報(bào)考北京大學(xué)嗎?0/1V2報(bào)考清華大學(xué)嗎?0/1V3報(bào)考南京大學(xué)嗎?0/1V4報(bào)考南京理工大學(xué)嗎?0/1V5報(bào)考東南大學(xué)嗎?0/1V6報(bào)考南京師范大學(xué)嗎?0/1由于問(wèn)卷要求被調(diào)查者選擇三個(gè)答案,所以可設(shè)置3個(gè)SPSS變量,分別表示志愿一、志愿二、志愿三,變量取值為1~6,依次對(duì)應(yīng)6所大學(xué)。多選項(xiàng)分類(lèi)法SPSS變量名變量名標(biāo)簽變量值V1志愿一1/2/3/4/5/6V2志愿二1/2/3/4/5/6V3志愿三1/2/3/4/5/6兩種方法選擇依據(jù)便于分析是否丟失信息案例1中,無(wú)論采用哪種分解方法都會(huì)存在一定的問(wèn)題。但從避免信息丟失方面考慮,第一種方式要優(yōu)于第二種,因?yàn)榈诙N方式會(huì)導(dǎo)致較多的缺失數(shù)據(jù)。案例2兩種方法對(duì)比多選項(xiàng)二分法優(yōu)點(diǎn):能很方便地分析出各個(gè)學(xué)校的考生報(bào)考情況。缺點(diǎn):不便于分析考生在各個(gè)志愿中的報(bào)考學(xué)校情況。多選項(xiàng)分類(lèi)法優(yōu)點(diǎn):能很方便地分析出考生在各個(gè)志愿中的報(bào)考學(xué)校情況。缺點(diǎn):但不便于分析各個(gè)學(xué)校的考生報(bào)考情況。從信息丟失方面考慮,第二種分解方式?jīng)]有造成信息丟失。結(jié)論在選擇多選項(xiàng)問(wèn)題的分解方法時(shí),應(yīng)考慮到具體問(wèn)題和具體分析目標(biāo),在避免信息丟失的前提下,減少稀疏數(shù)據(jù)。

SPSS變量的數(shù)據(jù)類(lèi)型大多應(yīng)定義成數(shù)值型,這樣有利于以后的數(shù)據(jù)分析;不同的數(shù)據(jù)應(yīng)根據(jù)其實(shí)際含義規(guī)定其度量尺度,如存(?。┛钅康模殬I(yè)等應(yīng)為定類(lèi)型變量,收入水平、年齡等為定序型變量,存(?。┛罱痤~為定距型變量等;變量值標(biāo)簽的定義在問(wèn)卷數(shù)據(jù)的處理中有重要作用。小貼士:§2.1數(shù)據(jù)的輸入和保存1.1.1進(jìn)入SPSS的界面1.1.2定義變量1.1.3輸入數(shù)據(jù)1.1.4保存數(shù)據(jù)1.1.3輸入數(shù)據(jù)直接在第一行第一列g(shù)roup下方用鍵盤(pán)鍵入1,第一行第二列X下方用鍵盤(pán)鍵入0.84,其余依次鍵入,從第12行開(kāi)始為健康人,因此group應(yīng)取為2,最終該數(shù)據(jù)集應(yīng)該有24條記錄。數(shù)據(jù)錄入方法——直接敲就是了!按行輸入數(shù)據(jù)(按Tab鍵)按列輸入數(shù)據(jù)(按Enter鍵)錄入帶有變量值標(biāo)簽的數(shù)據(jù)(通過(guò)下拉按鈕完成)

數(shù)據(jù)的錄入

但在此之前應(yīng)首先通過(guò)選擇菜單:view==>ValueLabels,打開(kāi)變量值標(biāo)簽的顯示開(kāi)關(guān),如果它前面顯示一個(gè)√,則表示變量值標(biāo)簽的顯示開(kāi)關(guān)已經(jīng)打開(kāi),變量值標(biāo)簽將顯示在數(shù)據(jù)編輯窗口中;反之,則表示開(kāi)關(guān)尚未打開(kāi),不顯示變量值標(biāo)簽只顯示變量值。

應(yīng)當(dāng)說(shuō)明的是,在值標(biāo)簽顯示開(kāi)關(guān)打開(kāi)的狀態(tài)下,雖然屏幕顯示的是標(biāo)簽,但實(shí)際內(nèi)部存儲(chǔ)的仍是變量值?!?.1數(shù)據(jù)的輸入和保存1.1.1進(jìn)入SPSS的界面1.1.2定義變量1.1.3輸入數(shù)據(jù)1.1.4保存數(shù)據(jù)1.1.4保存數(shù)據(jù)單擊保存類(lèi)型列表框,可以看到SPSS所支持的各種數(shù)據(jù)類(lèi)型,有DBF、FoxPro、EXCEL、ACCESS等,這里我們?nèi)匀粚⑵浯鏋镾PSS自己的數(shù)據(jù)格式(*.sav文件)。在文件名框內(nèi)鍵入Li1_1并回車(chē),可以看到數(shù)據(jù)管理窗口左上角由Untitled變?yōu)榱爽F(xiàn)在的變量名Li1_1。

選擇菜單File==>Save,由于該數(shù)據(jù)從來(lái)沒(méi)有被保存過(guò),所以彈出Saveas對(duì)話框如下:根據(jù)居民儲(chǔ)蓄調(diào)查問(wèn)卷,設(shè)計(jì)SPSS變量,并定義SPSS數(shù)據(jù)的結(jié)構(gòu),并選取部分填答好的問(wèn)卷,建立居民儲(chǔ)蓄調(diào)查數(shù)據(jù)文件。上機(jī)題目可選答案1.您認(rèn)為現(xiàn)在買(mǎi)東西合算還是存錢(qián)合算?(1)買(mǎi)東西合算(2)存錢(qián)合算2.您今年的收入比去年增加了還是減少了?(1)增加(2)基本不變(3)減少3.預(yù)計(jì)未來(lái)一兩年中您的收入?(1)增加(2)基本不變(3)減少4.您的月收入水平屬于?(1)800元以下(2)800~1500元(3)1500~5000(4)5000元以上5.您本次存(?。┛畹慕痤~是多少?()元6.您本次存(?。┛畹姆N類(lèi)?(1)三年以上定期(2)三年以下定期(3)活期(4)定活兩便(5)有獎(jiǎng)儲(chǔ)蓄(6)個(gè)人通知存款(7)活期工資賬戶(8)各類(lèi)信用卡表1居民儲(chǔ)蓄調(diào)查問(wèn)卷題目可選答案7.存(?。┛畹哪康模啥噙x)?(1)買(mǎi)高檔消費(fèi)品(2)結(jié)婚用(3)正常生活零用(4)做生意(5)購(gòu)買(mǎi)農(nóng)業(yè)生產(chǎn)資料(6)買(mǎi)證券及單位集資(7)買(mǎi)房或建房(8)支付孩子教育費(fèi)(9)養(yǎng)老金(10)防止意外事故(11)得利息8.您認(rèn)為現(xiàn)在的物價(jià)水平?(1)過(guò)高,難以接受(2)偏高,可以接受(3)正常9.您對(duì)近期市場(chǎng)物價(jià)趨勢(shì)的看法?(1)會(huì)迅速上升(2)基本穩(wěn)定(3)會(huì)略有下降10.若物價(jià)上升幅度較大,您準(zhǔn)備?(1)提款購(gòu)物(2)購(gòu)買(mǎi)其它證券(3)繼續(xù)存款11.如果目前利率維持不變,您準(zhǔn)備?(1)繼續(xù)存款(2)提款購(gòu)物(3)購(gòu)買(mǎi)其它證券12.您手中一部分現(xiàn)金不存入銀行的原因?(1)日常生活用錢(qián)(2)生意周轉(zhuǎn)金(3)便于隨時(shí)購(gòu)買(mǎi)中意商品(4)購(gòu)買(mǎi)國(guó)庫(kù)券、債券、股票等續(xù)表題目可選答案13.您的戶口屬于?(1)城鎮(zhèn)戶口(2)農(nóng)村戶口14.您的工作單位或職業(yè)是?(1)國(guó)家機(jī)關(guān)(2)商業(yè)服務(wù)業(yè)(3)文科衛(wèi)行業(yè)(4)公交建筑業(yè)(5)經(jīng)營(yíng)性公司(6)學(xué)校(7)一般農(nóng)戶(8)種糧棉專(zhuān)業(yè)戶(9)種果菜專(zhuān)業(yè)戶(10)工商運(yùn)輸個(gè)體戶(11)退休人員(12)金融機(jī)構(gòu)(13)現(xiàn)役軍人15.您的年齡是?(1)20歲以下(2)20~35歲(3)35~50歲(4)50歲以上續(xù)表補(bǔ)充說(shuō)明——讀取其他格式的數(shù)據(jù)文件直接讀入其他格式的數(shù)據(jù)文件使用文本向?qū)ёx入文本文件選擇菜單File==>Open==>Data或直接單擊快捷工具欄上的按鈕,系統(tǒng)就會(huì)彈出OpenFile對(duì)話框:1、直接打開(kāi)選擇數(shù)據(jù)文件類(lèi)型,并輸入數(shù)據(jù)文件名即可。其次中間還有一個(gè)“Paste”按鈕,該按鈕在SPSS的大多數(shù)對(duì)話框中都存在,是用于自動(dòng)生成SPSS程序的。2、

使用文本導(dǎo)入向?qū)ёx入文本文件選擇菜單File==>ReadTextData,系統(tǒng)就會(huì)彈出OpenFile對(duì)話框:對(duì)!和前面的情況完全一樣,只是文件類(lèi)型自動(dòng)跳到了Text(*.txt)。實(shí)際上,該功能在SPSS中已被整合到了OpenFile對(duì)話框中之所以在菜單上保留該條目有兩個(gè)原因:1.讀入純文本的情況非常普遍,放在這里更加醒目;2.為了和SPSS老版本的使用上保持兼容。2.1.3.3

使用文本導(dǎo)入向?qū)ёx入文本文件例2.1現(xiàn)有一數(shù)據(jù)文件以純文本的形式存為“e:\work\經(jīng)濟(jì)管理統(tǒng)計(jì)分析軟件\SPSSDATA\Li1_1.txt”,且第一行為變量名,請(qǐng)將其讀入SPSS。解:在OpenFile對(duì)話框選中相應(yīng)的文件名并單擊“確定”,系統(tǒng)會(huì)自動(dòng)啟動(dòng)文本導(dǎo)入向?qū)?duì)話框如下:2.1.3.3

使用文本導(dǎo)入向?qū)ёx入文本文件可以看到該向?qū)Ч卜?步,這是第一步。中部為一對(duì)單選按鈕,問(wèn)題為“你的文本文件和預(yù)定義格式相一致嗎?”,下方為按預(yù)定義格式讀入的數(shù)據(jù)文件的預(yù)覽。顯然,SPSS的預(yù)定義格式并沒(méi)有正確識(shí)別該文件。因此選擇“No”并單擊“下一步”,系統(tǒng)彈出向?qū)У南乱粋€(gè)對(duì)話框如下:2.1.3.3

使用文本導(dǎo)入向?qū)ёx入文本文件最上方的問(wèn)題是“你的變量是如何排列的?”,下面的選項(xiàng)分別為Delimite(用某種字符區(qū)分)和FixedWidth(固定寬度),一般都是Delimite,第二個(gè)問(wèn)題是“變量名包括在文件最前面了嗎?”,我們當(dāng)然選“Yes”,單擊“下一步”,系統(tǒng)彈出第三個(gè)對(duì)話框:2.1.3.3

使用文本導(dǎo)入向?qū)ёx入文本文件最上方的句子意為“第一條記錄從第幾行開(kāi)始?”,右側(cè)可以輸入行數(shù)。由于我們所用的數(shù)據(jù)第一行為變量名,因此這里輸入2。下面的問(wèn)題是“你的記錄是怎樣存儲(chǔ)在文件中的?”??梢允恰懊恳恍写硪粭l記錄”,或者“每**個(gè)變量代表一條記錄”,數(shù)據(jù)一般都是第一種情況。下一個(gè)問(wèn)題是“你想導(dǎo)入多少條記錄?”,可以是“所有記錄”、“前**條”或“隨機(jī)導(dǎo)入**%的記錄”。一般也選前者。單擊“下一步”,第四個(gè)對(duì)話框如下:2.1.3.3

使用文本導(dǎo)入向?qū)ёx入文本文件最上方的問(wèn)題為“變量間用的是哪種分隔符?”,可選的有Tab鍵、空格、逗號(hào)、分號(hào)或自行定義的其他符號(hào)。本數(shù)據(jù)采用的是空格,可見(jiàn)系統(tǒng)已經(jīng)自動(dòng)識(shí)別并選擇了空格,而下方的數(shù)據(jù)預(yù)覽窗口顯示出了正確的數(shù)據(jù)讀入情況。單擊“下一步”,第五個(gè)對(duì)話框如下:2.1.3.3

使用文本導(dǎo)入向?qū)ёx入文本文件上方的提示為“定義在數(shù)據(jù)預(yù)覽窗口中所選擇的變量?!薄n櫭剂x,在這個(gè)對(duì)話框中你可以在數(shù)據(jù)預(yù)覽窗口中選擇某一列變量,然后更改其變量名和類(lèi)型。當(dāng)然,在這里我們不用這樣做,直接單擊“下一步”,系統(tǒng)彈出文本導(dǎo)入向?qū)У淖詈笠粋€(gè)對(duì)話框如下:2.1.3.3

使用文本導(dǎo)入向?qū)ёx入文本文件最上面的問(wèn)題為“你愿意保存這次的文件(讀入)格式設(shè)置以備下次使用嗎?”,第二個(gè)問(wèn)題為“你是否愿意將以上操作粘貼為SPSS語(yǔ)句?”,一般這兩個(gè)問(wèn)題我們都可以不管。單擊“完成”,系統(tǒng)最終成功的讀入了Li1_1.txt。3、

讀取EXCEL文件現(xiàn)在SPSS10.0以上的版本讀取EXCEL數(shù)據(jù)和讀取SPSS的數(shù)據(jù)并無(wú)太大差異。選擇菜單File==>Open==>Data或直接單擊快捷工具欄上的按鈕,系統(tǒng)就會(huì)彈出OpenFile對(duì)話框:3、

讀取EXCEL文件輸入文件名,選擇文件類(lèi)型為EXCEL(﹡.xls),然后單擊『打開(kāi)』按鈕:3、

讀取EXCEL文件在顯示的對(duì)話框中單擊OK按鈕:事實(shí)上,SPSS11.0以上版本在出現(xiàn)最終數(shù)據(jù)文件之前還會(huì)跳出一個(gè)output1SPSSViewer輸出窗口,可以保存,也可以不保存。SPSS數(shù)據(jù)的編輯主要包括對(duì)數(shù)據(jù)的定位、增加、刪除、修改和復(fù)制等工作。補(bǔ)充說(shuō)明——SPSS數(shù)據(jù)的編輯SPSS數(shù)據(jù)的定位自動(dòng)定位1、按個(gè)案號(hào)碼自動(dòng)定位選擇菜單Data==>Gotocase2、按變量值自動(dòng)定位選擇菜單Edit==>Find人工定位:適用于數(shù)據(jù)量較少的情形;(略)自動(dòng)定位:按用戶給出的定位條件自動(dòng)尋找滿足條件的第一個(gè)數(shù)據(jù)單元,適用于數(shù)據(jù)量多的情形。SPSS數(shù)據(jù)個(gè)案的插入和刪除1、插入一個(gè)個(gè)案選擇菜單Data==>Insertcase2、刪除一個(gè)個(gè)案單擊鼠標(biāo)左鍵,選中待刪除的個(gè)案,然后單擊鼠標(biāo)右鍵,從彈出菜單中選擇Cut選項(xiàng)SPSS數(shù)據(jù)的移動(dòng)、復(fù)制和刪除定義源數(shù)據(jù)塊:將鼠標(biāo)移到到源數(shù)據(jù)塊的左上角單元上,并拖動(dòng)鼠標(biāo)至源數(shù)據(jù)塊的右下角單元上;單擊鼠標(biāo)右鍵:如果要清除數(shù)據(jù)塊內(nèi)容,則選Clear選項(xiàng);如復(fù)制,選Copy;如移動(dòng),選Cut;指定目標(biāo)單元:將鼠標(biāo)移到目標(biāo)單元的左上角,然后單擊右鍵,選擇Paste選項(xiàng)。SPSS能夠?qū)?shù)據(jù)保存成多種格式的數(shù)據(jù)文件,常見(jiàn)的有SPSS格式文件、Excel、dbf和文本格式文件。補(bǔ)充說(shuō)明——SPSS數(shù)據(jù)保存的格式文件優(yōu)點(diǎn)缺點(diǎn)SPSS文件可以被SPSS軟件直接讀取,且能夠?qū)PSS數(shù)據(jù)的結(jié)構(gòu)和數(shù)據(jù)兩部分全部完整保存下來(lái)無(wú)法被其它軟件讀取,通用性差Excel文件Dbf格式文件文本文件可以被相應(yīng)軟件直接讀取。其中保存為Excel文件時(shí),會(huì)將各變量的變量名寫(xiě)入Excel工作表的第一行上,且一個(gè)個(gè)案為一行;保存為Dbf文件時(shí),會(huì)將變量名和相應(yīng)的數(shù)據(jù)類(lèi)型轉(zhuǎn)成數(shù)據(jù)庫(kù)文件的字段名和字段類(lèi)型,且一個(gè)個(gè)案為一條記錄;保存為文本文件時(shí),第一種,固定格式,依據(jù)每個(gè)變量顯示的寬度,將變量值數(shù)據(jù)以空格左補(bǔ)齊對(duì)齊;第二種以Tab鍵作為各數(shù)據(jù)之間的分隔符,第一行是變量名,第二行以后是數(shù)據(jù),一個(gè)個(gè)案為一行;僅保存SPSS數(shù)據(jù)編輯窗口中的變量值,而不保存變量的其它屬性。如果用戶希望將SPSS數(shù)據(jù)與其他軟件共享,則可將SPSS數(shù)據(jù)保存成兩份,一份為SPSS文件格式,另一份為其他軟件可以讀取的數(shù)據(jù)文件格式,從而方便數(shù)據(jù)共享。讀入居民儲(chǔ)蓄調(diào)查數(shù)據(jù).xls文件和居民儲(chǔ)蓄調(diào)查數(shù)據(jù).Dat文件上機(jī)SPSS的運(yùn)行步驟如下:錄入數(shù)據(jù)定義數(shù)據(jù)整理數(shù)據(jù)統(tǒng)計(jì)數(shù)據(jù)察看結(jié)果§

2.2

數(shù)據(jù)文件的整理在SPSS中,數(shù)據(jù)文件的編輯、整理等功能被集中在了Data和Transform兩個(gè)菜單項(xiàng)中,這兩個(gè)菜單的內(nèi)容如下所示:Data菜單項(xiàng)Transform菜單項(xiàng)

1.

【SortCases對(duì)話框】

2.【Transepose對(duì)話框】2.2.1用于數(shù)據(jù)管理的菜單項(xiàng)——Data菜單項(xiàng)

3.【MergeFiles對(duì)話框】

4.【Aggregate對(duì)話框】

5.【SplitFile對(duì)話框】

6.【SelectCases對(duì)話框】

7.【W(wǎng)eightCases對(duì)話框】

8.【Data菜單中的其余對(duì)話框】例2.5

對(duì)數(shù)據(jù)集li1_1.sav按group升序,x降序的次序排列?!維ortCases對(duì)話框】解:選擇菜單Data==>SortCases,系統(tǒng)彈出SortCases對(duì)話框:該對(duì)話框并不復(fù)雜,其中比較特殊的是下方的SortOrder單選鈕,有升序和降序兩種選擇。請(qǐng)注意,該單選鈕是和上方的SortBy框一起使用的.請(qǐng)注意:group和x后面分別跟著Ascending和Descending,表明前者是按升序、后者按降序排列;由于Group在前,因此排序時(shí)以Group優(yōu)先。數(shù)據(jù)排序步驟:Data=>sortcase1、數(shù)據(jù)文件:數(shù)據(jù)加工(職工數(shù)據(jù)).sav

按照年齡排序;按照基本工資排序;先后按年齡和基本工資排序。2、數(shù)據(jù)文件:學(xué)生成績(jī)調(diào)查表.sav

按照年齡排序;找出數(shù)學(xué)成績(jī)最高分和物理成績(jī)最低分。上機(jī)【MergeFiles對(duì)話框】

——合并數(shù)據(jù)文件合并的方式增加觀測(cè)量到當(dāng)前數(shù)據(jù)(縱向合并)增加變量到當(dāng)前數(shù)據(jù)文件(橫向合并)縱向合并數(shù)據(jù)文件選擇菜單Data==>MergeFile==>

AddCases,然后輸入一個(gè)已存在于磁盤(pán)上的需進(jìn)行縱向合并處理的SPSS數(shù)據(jù)文件名。彈出對(duì)話框如下:

【MergeFiles對(duì)話框】縱向合并數(shù)據(jù)文件

VariablesinNewWorkingDataFile框中顯示的變量名是兩個(gè)數(shù)據(jù)文件中的同名變量,SPSS默認(rèn)它們有相同的數(shù)據(jù)含義,并將它們作為合并后新數(shù)據(jù)文件中的變量;

UnpairedVariables框中顯示的變量名是兩個(gè)數(shù)據(jù)文件中的不同名變量,變量名后面的﹡表示該變量是當(dāng)前數(shù)據(jù)編輯窗口的變量,+表示該變量是欲插入數(shù)據(jù)文件中變量;選Indicatecasesourceasvariable項(xiàng),可在合并后數(shù)據(jù)文件中將自動(dòng)生成一個(gè)名為source01的變量,取值為0代表個(gè)案來(lái)自第一份數(shù)據(jù)文件,取值為1代表個(gè)案來(lái)自第二份數(shù)據(jù)文件;橫向合并數(shù)據(jù)文件選擇菜單Data==>MergeFile==>

AddVariables,然后輸入一個(gè)已存在于磁盤(pán)上的需進(jìn)行橫向合并處理的SPSS數(shù)據(jù)文件名。彈出對(duì)話框如下:

利用職工數(shù)據(jù)文件演示數(shù)據(jù)文件的縱向合并和橫向合并。上機(jī)用于對(duì)數(shù)據(jù)進(jìn)行分類(lèi)匯總,所謂分類(lèi)匯總就是按指定的分類(lèi)變量對(duì)觀測(cè)值進(jìn)行分組,對(duì)每組記錄的各變量值求指定的描述統(tǒng)計(jì)量,結(jié)果可以存入新數(shù)據(jù)文件,也可以替換當(dāng)前數(shù)據(jù)文件。選擇菜單Data==>Aggregate,系統(tǒng)彈出Aggregate窗口:【Aggregate對(duì)話框】上圖中各個(gè)零件的含義如下:

BreakVariables框:用于選擇分組變量;

AggregateVariables框:用于選擇被匯總的變量;

Name&Label鈕:用于定義新產(chǎn)生的匯總變量的名稱(chēng)和標(biāo)簽;

Function鈕:用于定義匯總函數(shù),共有三組函數(shù),以最常用的第一組為例,可選的函數(shù)有均數(shù)、同組的第一個(gè)觀測(cè)值、最后一個(gè)觀測(cè)值、同組記錄數(shù)、標(biāo)準(zhǔn)差、最小值、和、最大值共8個(gè);

其他不再一一介紹。例2.6

計(jì)算Li1_1.sav中兩組的血磷值標(biāo)準(zhǔn)差?!続ggregate對(duì)話框】解:該題完全可以用更簡(jiǎn)單的方法完成,這里只是演示一下匯總對(duì)話框的用法。

BreakVariables框:GroupAggregateVariables框:xFunction鈕:(Standarddeviation單選鈕:Continue鈕)Addaggregatedvariablestoworkingdatafile單選鈕:選中

OK1、利用居民儲(chǔ)蓄調(diào)查數(shù)據(jù),分析城鎮(zhèn)儲(chǔ)戶和農(nóng)村儲(chǔ)戶的一次平均存(?。┛罱痤~是否有顯著的差異(計(jì)算各自的均值和標(biāo)準(zhǔn)差)。2、利用學(xué)生成績(jī)調(diào)查表數(shù)據(jù),分析數(shù)學(xué)、物理、化學(xué)、英文各科成績(jī)的平均成績(jī)和標(biāo)準(zhǔn)方差。上機(jī)【SelectCases

對(duì)話框】很多時(shí)候我們不需要分析全部的數(shù)據(jù),而是按某種要求分析其中的一部分(比如只分析男性的身高、只對(duì)前200個(gè)數(shù)據(jù)進(jìn)行分析以了解大概情況),這時(shí)使用SelectCases對(duì)話框可以大大簡(jiǎn)化工作。該對(duì)話框界面如下所示:【SelectCases

對(duì)話框】

Allcases單選鈕:和下面的4個(gè)單選鈕為一組,選中它則分析所有的記錄;

Ifconditionissatisfied單選鈕:只分析滿足條件的記錄;

If按鈕:和If單選鈕一起使用,單擊后彈出If對(duì)話框;

Randomsampleofcases單選鈕:從原數(shù)據(jù)中隨機(jī)抽樣;

Sample按鈕:和Random單選鈕一起使用,可以設(shè)定按百分比抽取記錄,或者精確設(shè)定從前若干個(gè)記錄中抽取多少個(gè)記錄;

Basedontimeorcaserange單選鈕:基于記錄序號(hào)來(lái)選擇記錄;

Range按鈕:和Based單選鈕一起使用,用于輸入記錄序號(hào)范圍;

Usefiltervariable單選鈕:使用篩選指示變量來(lái)選擇記錄,必需在下面選入一個(gè)篩選指示變量,該變量取值為非0的記錄將被選中,進(jìn)入以后的分析;

Filtered單選鈕:和下面的Deleted單選鈕為一組,表示未被選中的記錄只是被隔離,這些記錄的記錄號(hào)會(huì)被加上斜杠以示區(qū)別;

Deleted單選鈕:未被選中的記錄將被刪除,一般不要使用。當(dāng)對(duì)數(shù)據(jù)集做出篩選后,所做的篩選將在以后的分析中一直有效,直到再次改變選擇條件為止。同時(shí)在多數(shù)情況下,系統(tǒng)會(huì)自動(dòng)產(chǎn)生一個(gè)名為filter_$的篩選指示變量,被選中的記錄該變量取值為1,反之則為0。利用居民儲(chǔ)蓄調(diào)查數(shù)據(jù),根據(jù)不同的分析要求采用不同的數(shù)據(jù)選取方法抽樣:如果只希望分析城鎮(zhèn)儲(chǔ)戶的情況,則可以通過(guò)數(shù)據(jù)選擇功能采用指定條件的抽樣方法進(jìn)行抽樣;如果只希望對(duì)其中的70%的數(shù)據(jù)進(jìn)行分析,可通過(guò)數(shù)據(jù)選擇功能采用隨機(jī)抽樣中的近似抽樣方法進(jìn)行抽樣。上機(jī)

1.

【SortCases對(duì)話框】

2.【Transepose對(duì)話框】2.2.1用于數(shù)據(jù)管理的菜單項(xiàng)

3.【MergeFiles對(duì)話框】

4.【Aggregate對(duì)話框】

5.【SplitFile對(duì)話框】

6.【SelectCases對(duì)話框】

7.【W(wǎng)eightCases對(duì)話框】

8.【Data菜單中的其余對(duì)話框】【Transepose對(duì)話框】該對(duì)話框用于對(duì)數(shù)據(jù)進(jìn)行行列轉(zhuǎn)置,可以在原數(shù)據(jù)文件中指定一個(gè)變量記錄轉(zhuǎn)置后的變量名。原變量名則自動(dòng)保存在系統(tǒng)產(chǎn)生的名為case_lbl的字符變量中。該對(duì)話框也非常簡(jiǎn)單,左側(cè)為候選變量框;右上方為Variable框,用于選入需要轉(zhuǎn)置的變量,一般應(yīng)選入除名稱(chēng)變量外的所有其他變量,如果有變量未選入,則轉(zhuǎn)置時(shí)會(huì)被自動(dòng)丟棄;右下方為NameVariable框,用于指定原數(shù)據(jù)文件中記錄轉(zhuǎn)置后變量名的字符變量,但不是必需的,此時(shí)系統(tǒng)會(huì)將新變量自動(dòng)按var001、var002...的順序命名?!維plitFile

對(duì)話框】用于將數(shù)據(jù)文件分組進(jìn)行處理,該對(duì)話框我們?cè)诘谝徽聲r(shí)已經(jīng)使用過(guò)了,這里再介紹一下各個(gè)對(duì)話框元素的用途:

Analyzeallcases單選框:和下面的兩個(gè)單選框?yàn)橐唤M,選中本框不拆分文件;

Comparegroups單選框:按所選變量拆分文件,各組分析結(jié)果緊挨在一起便于相互比較;

Organizeoutputbygroups單選框:按所選變量拆分文件,各組分析結(jié)果單獨(dú)放置;

Groupsbasedon框:用于選擇拆分?jǐn)?shù)據(jù)文件的變量;

Sortthefilebygroupingvariables單選框:將數(shù)據(jù)按所用的拆分變量排序;

Fileisalreadysorted單選框:數(shù)據(jù)保持原狀,不按所用的拆分變量排序。【W(wǎng)eight

Cases

對(duì)話框】在默認(rèn)情況下,每一行就是一條記錄,這在多數(shù)情況下沒(méi)有什么問(wèn)題,但有時(shí)卻非常麻煩,想想看如果你需要計(jì)算一個(gè)四格表卡方,有100例,如果每一行就是一條記錄,你就需要輸入100條記錄!如果希望在計(jì)算過(guò)程中利用不同的變量對(duì)數(shù)據(jù)進(jìn)行加權(quán)處理,就需要用到WeightCases對(duì)話框。該對(duì)話框的使用極為簡(jiǎn)單,界面上有兩個(gè)單選鈕,分別是不權(quán)重記錄和用某變量權(quán)重記錄,如果選擇后者,則需要選中一個(gè)權(quán)重變量?!綝ata菜單中的其余對(duì)話框】

Definedates對(duì)話框:可以自動(dòng)生成時(shí)間變量。

InsertVariable命令:在當(dāng)前列插入新變量(在當(dāng)前列點(diǎn)右鍵選擇InsertVariable

命令亦可)。

Insertcases命令:在當(dāng)前行插入新記錄(在當(dāng)前行點(diǎn)右鍵選擇InsertCases命令亦可)

。

Gotocases對(duì)話框:到達(dá)指定記錄號(hào)的記錄,該命令在記錄數(shù)極多時(shí)(1000條以上)非常有用。

1.

【ComputeVariable對(duì)話框】

2.【Count對(duì)話框】2.2.2用于數(shù)據(jù)管理的菜單項(xiàng)——Transform菜單項(xiàng)

3.【Record對(duì)話框】

4.【RankCases對(duì)話框】

5.【AutomaticRecode對(duì)話框】

6.【CreateTimeSeries對(duì)話框】

7.【ReplaceMissingValues對(duì)話框】

8.【Transform菜單中的其余對(duì)話框】【ComputeVariable對(duì)話框】例3.2

在li1_1.sav中建立新變量temp,令其值當(dāng)血磷值大于1時(shí)為2,否則為1。解:這里需要用到ComputeVariable對(duì)話框,外加一點(diǎn)技巧。第一步:給變量temp均賦值為1,然后將血磷值大于1的記錄其temp變量值改為2即可。選擇菜單Transform==>Compute,彈出ComputeVariable對(duì)話框如下:

【ComputeVariable對(duì)話框】左上角為需要計(jì)算的變量名,在其中鍵入“temp”,此時(shí)“Type&Lable”按鈕就會(huì)變黑,左下方為候選變量列表,現(xiàn)在還用不著;中部為類(lèi)似計(jì)算器的軟鍵盤(pán),可以用鼠標(biāo)按鍵輸入數(shù)字和符號(hào),這里我們直接輸入“1”,輸入的內(nèi)容會(huì)立刻在右上方的數(shù)值表達(dá)式窗口中出現(xiàn);軟鍵盤(pán)右側(cè)為函數(shù)窗口,可以在這里找到并使用所需的SPSS函數(shù);這次也用不到。好,現(xiàn)在“OK”按鈕已經(jīng)變黑,單擊他,系統(tǒng)就會(huì)自動(dòng)生成一個(gè)新變量temp,并且取值均為1?!綜omputeVariable對(duì)話框】軟鍵盤(pán)上幾個(gè)奇奇怪怪的符號(hào)的含義如下:~=&|**~不等號(hào),等價(jià)于<>邏輯符號(hào)AND邏輯符號(hào)OR乘方,相當(dāng)于函數(shù)EXP()邏輯符號(hào)NOT在函數(shù)窗口中選中某個(gè)函數(shù)并單擊右鍵,系統(tǒng)就會(huì)彈出該函數(shù)的用法說(shuō)明。函數(shù)主要是和變量名組合起來(lái)使用的,比如說(shuō)ABS(x)就是取變量x的絕對(duì)值?!綜omputeVariable對(duì)話框】第二步:再次選擇菜單Transform==>Compute,系統(tǒng)也再次彈出這個(gè)對(duì)話框,將數(shù)值表達(dá)式窗口中的1改為2,然后單擊中下部的“If”按鈕,系統(tǒng)彈出記錄選擇對(duì)話框如下:

由于我們這里不是對(duì)所有記錄做變換,因此選中第二個(gè)單選鈕“Includeifcasestatisfies

confition:”,此時(shí)下方的所有窗口變亮,表明現(xiàn)在可用;在左側(cè)選中血磷值(x),然后單擊“”,x就被引入了右側(cè)的變量框,任你用鍵盤(pán)或者用鼠標(biāo),總之將下面這個(gè)算式補(bǔ)充完:x>1,單擊continue按鈕。第三步:?jiǎn)螕簟癘K”按鈕,由于我們要替換變量值,系統(tǒng)會(huì)彈出一個(gè)確認(rèn)對(duì)話框,確認(rèn)替換,就ok了。1、利用學(xué)生成績(jī)調(diào)查表計(jì)算每位同學(xué)的總分和平均分,并排名;2、利用職工基本情況數(shù)據(jù),假設(shè)職稱(chēng)1至4級(jí)職工的工資分別上調(diào)50%,30%,20%,10%,依據(jù)職稱(chēng)級(jí)別計(jì)算實(shí)發(fā)工資。提示:定義實(shí)發(fā)工資變量名:sfgz,并輸入計(jì)算方法:(sr-bx)×系數(shù),系數(shù)因職稱(chēng)不同而不同。上機(jī)【Count對(duì)話框】Count對(duì)話框用于計(jì)算某個(gè)值或某些值在某個(gè)變量的取值中是否出現(xiàn),比如我們想看看有哪些記錄的血磷值在2~3之間,選擇菜單Transform==>Count,系統(tǒng)彈出Count對(duì)話框如下:TargetVariable框中用于指定記錄變量值是否出現(xiàn)的變量名,在這里輸入temp2;選中血磷值(x),將其選入Variables窗口,此時(shí)“DefineValues”按鈕變黑,單擊它,系統(tǒng)彈出變量值定義窗口如下:【Count對(duì)話框】左半部為變量值定義窗口,可以定義某個(gè)值、系統(tǒng)缺失值、系統(tǒng)或用戶定義缺失值、變量值范圍、小于某值或大于某值。我們這里是第四種情況:選擇Range,在through兩側(cè)分別鍵入2、3,然后單擊已變黑的“Add”按鈕,“2thru3”就會(huì)被加入“ValuestoCount”框內(nèi)。然后單擊“Continue”,再單擊Count對(duì)話框的“OK”,可以看到系統(tǒng)自動(dòng)生成變量temp2,其中10、11號(hào)記錄因血磷值介于2和3之間,temp2取值為1,其余的記錄temp2取值均為0。利用居民儲(chǔ)蓄調(diào)查數(shù)據(jù),分析近些年儲(chǔ)戶收入的總體狀況。提示:由于數(shù)據(jù)的限制,我們暫且認(rèn)為,如果儲(chǔ)戶收入今年比去年增加了,且認(rèn)為今后兩年內(nèi)收入仍會(huì)增加,則認(rèn)為收入狀況較好。因此可對(duì)所有個(gè)案計(jì)算“今年收入”和“未來(lái)收入”這兩個(gè)變量中有幾個(gè)取1(1代表收入增加)。如果計(jì)算結(jié)果為2,則表示兩變量值均為增加,相應(yīng)的儲(chǔ)戶收入狀況較好。進(jìn)一步,還可以計(jì)算計(jì)數(shù)值為2的個(gè)案數(shù)占總個(gè)案數(shù)的百分比,進(jìn)而分析被調(diào)查儲(chǔ)戶的總體收入狀況。上機(jī)1、利用學(xué)生成績(jī)調(diào)查表,找出各科成績(jī)?cè)?5分以上的人數(shù)各有多少?2、利用數(shù)據(jù)加工(職工數(shù)據(jù)),找出年齡在20-30,30-40,40-50以及50以上的人數(shù)各有多少?基本工資在1000以上的有多少人?上機(jī)【Recode對(duì)話框】Recode對(duì)話框用于從原變量值按照某種一一對(duì)應(yīng)的關(guān)系生成新變量值,可以將新值賦給原變量,也可以生成一個(gè)新變量。例2.3

在Li1_1.sav中生成新變量temp3,當(dāng)血磷值小于1時(shí)取值為0,1~2時(shí)取值為10,大于2時(shí)取值為20。解:選擇菜單Transform==>Record==>IntoDifferentVariables,Recode對(duì)話框如下:【Recode對(duì)話框】將血磷值(x)選入InputVariable->OutputVariable框,此時(shí)OutputVariable框變黑,在其中鍵入新變量名temp3并單擊Change,可見(jiàn)原來(lái)的x->?變成了x->temp3。單擊“OldandNewValues”,系統(tǒng)彈出變量值定義對(duì)話框如下:按照題目的要求,選擇Range:Lowestthrough,在右側(cè)框中鍵入1,然后在右上方的Value右側(cè)框中鍵入對(duì)應(yīng)的新變量值0,此時(shí)下方Add鍵變黑,單擊它,Old->New框中就會(huì)加入Lowestthru1->0,按照類(lèi)似的方法依次加入另兩條轉(zhuǎn)換規(guī)則,最終Old->New框中共有Lowestthru1->0、1thru2->10、Else->20三條,現(xiàn)在單擊Continue,再單擊OK,系統(tǒng)就會(huì)按要求生成新變量temp3?!綬ecode對(duì)話框】

OutputVariable框:選入xOutputVariableName框:鍵入temp3:?jiǎn)螕鬋hange鈕選中x->temp3:?jiǎn)螕鬙ldandNewValues鈕:

Range:Lowestthrough單選鈕:鍵入1:NewValueValue單選鈕:鍵入0:?jiǎn)螕鬉dd鈕

Range:through單選鈕:兩側(cè)分別鍵入1、2:NewValueValue單選鈕:鍵入10:?jiǎn)螕鬉dd鈕

Range:Allothervalues單選鈕:NewValueValue單選鈕:鍵入20:?jiǎn)螕鬉dd鈕單擊Continue

單擊OK。圖片太多了,雖然這樣非常直觀,但太慢了。等大家對(duì)基本界面操作熟悉了后,我們將對(duì)比較簡(jiǎn)單的對(duì)話框試著對(duì)操作用文字的方式描述,比如上面的操作我們將用文字表達(dá)為:【Recode對(duì)話框】在連續(xù)變量或變量值較多的情況下,可采用組距分組。組距分組是將全部變量值依次劃分為若干個(gè)區(qū)間,并將這一區(qū)間的變量值作為一組,為以后的頻數(shù)分析以及直方圖的繪制打下基礎(chǔ)?!綬ecode對(duì)話框】組距分組

a.選擇組數(shù)。=6b.確定各組的寬度。=(2.11-0.54)/6=0.266,可近似取為0.3分組操作

a指定分組變量

b定義分組區(qū)間

c指定存放分組結(jié)果的變量選擇菜單Transform==>Record==>

intoDifferentVariables:將分組變量血磷值X選擇到NumericVariable→Output框中;在OutputVariable框后輸入存放分組結(jié)果的變量名,并單擊Change鈕確認(rèn),可以在Lable后輸入相應(yīng)的變量名標(biāo)簽;單擊OldandNewValues按鈕進(jìn)行分組區(qū)間定義。指定分組區(qū)間的下限和上限,并在NewValue框中給出該區(qū)間對(duì)應(yīng)的分組值(也可以指定該區(qū)間數(shù)據(jù)在分組后為系統(tǒng)缺失值)單擊Add按鈕確認(rèn)分組區(qū)間并加到Old→New框中,單擊Change和Remove按鈕用來(lái)修改和刪除分組區(qū)間。如果僅對(duì)符合一定條件的個(gè)案分組,則單擊If按鈕并輸入SPSS條件表達(dá)式,否則本步可略去。

例2.4對(duì)血磷值數(shù)據(jù)進(jìn)行組距分組?!綬ecode對(duì)話框】一般選擇DifferentVariables,否則會(huì)覆蓋掉原來(lái)的變量選擇菜單Transform==>CategorizeVariables:將分組變量選擇到CreateCategories框中;在Numberofcategories框后輸入分組數(shù)目(如四分位數(shù)分組,組數(shù)為4);在連續(xù)變量或變量值較多的情況下,分位數(shù)分組是一種較為有效而快捷的分組方法。分位數(shù)分組與組距分組類(lèi)似,所不同的是,分位數(shù)分組中各組的下限值和上限值是由分位數(shù)決定的?!綜ategorizeVariables對(duì)話框】SPSS將自動(dòng)計(jì)算各四分位數(shù)并進(jìn)行分組,分組結(jié)果將存放在一個(gè)名為n+分組變量名的新變量中。選擇菜單Transform==>AutomaticRecord:將分組變量血磷值X選擇到Variable→NewName框中;在NewName框后輸入存放分組結(jié)果的變量名,并單擊AddNewName鈕;在RecordStartingfrom框中選擇單變量值分組按升序還是按降序進(jìn)行,Lowestvalue表示升序,Highestvalue表

溫馨提示

  • 1. 本站所有資源如無(wú)特殊說(shuō)明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請(qǐng)下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請(qǐng)聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁(yè)內(nèi)容里面會(huì)有圖紙預(yù)覽,若沒(méi)有圖紙預(yù)覽就沒(méi)有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫(kù)網(wǎng)僅提供信息存儲(chǔ)空間,僅對(duì)用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對(duì)用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對(duì)任何下載內(nèi)容負(fù)責(zé)。
  • 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請(qǐng)與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶因使用這些下載資源對(duì)自己和他人造成任何形式的傷害或損失。

最新文檔

評(píng)論

0/150

提交評(píng)論