第二章-SPSS數(shù)據(jù)文件的建立和管理課件_第1頁
第二章-SPSS數(shù)據(jù)文件的建立和管理課件_第2頁
第二章-SPSS數(shù)據(jù)文件的建立和管理課件_第3頁
第二章-SPSS數(shù)據(jù)文件的建立和管理課件_第4頁
第二章-SPSS數(shù)據(jù)文件的建立和管理課件_第5頁
已閱讀5頁,還剩35頁未讀, 繼續(xù)免費閱讀

下載本文檔

版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進行舉報或認領(lǐng)

文檔簡介

1、第二章SPSS數(shù)據(jù)文件 建立與管理第二章2-1 SPSS數(shù)據(jù)文件一、SPSS數(shù)據(jù)文件的特點 1、SPSS數(shù)據(jù)文件的擴展名是.sav;2、SPSS數(shù)據(jù)文件是一種有結(jié)構(gòu)的數(shù)據(jù)文件。(結(jié)構(gòu)內(nèi)容)二、SPSS數(shù)據(jù)的基本組織方式1、原始數(shù)據(jù)的組織方式 如果待分析的數(shù)據(jù)是一些原始的調(diào)查問卷數(shù)據(jù),或是一些基本的統(tǒng)計指標,那么這些數(shù)據(jù)就可按原始數(shù)據(jù)的方式組織。打開住房狀況調(diào)查:桌面培訓(xùn)-住房狀況調(diào)查2-1 SPSS數(shù)據(jù)文件一、SPSS數(shù)據(jù)文件的特點 1一行為一個個案一列為一個變量一行為一個個案一列為一個變量二、計數(shù)數(shù)據(jù)的組織方式 有時所采集的數(shù)據(jù)不是原始的調(diào)查問卷數(shù)據(jù),而是經(jīng)過分組匯總后的計數(shù)數(shù)據(jù)。 在研究職

2、稱和年齡的關(guān)系時匯總得到如表所示的數(shù)據(jù)。其中職稱的分組值分別為14,年齡段的分組值為13。職稱年齡段35歲以下(1)3649歲(2)50歲以上(3)教授(1)0158副教授(2)10201講師(3)20101助教(4)3520二、計數(shù)數(shù)據(jù)的組織方式 有時所采集的數(shù)據(jù)不是原始的調(diào)頻數(shù)數(shù)據(jù)舉例頻數(shù)數(shù)據(jù)舉例2-2 數(shù)據(jù)文件的結(jié)構(gòu)和定義方法 一、變量名二、數(shù)據(jù)類型三、變量名標簽四、變量值標簽五、缺失數(shù)據(jù)六、計量尺度 SPSS數(shù)據(jù)的結(jié)構(gòu)是對SPSS每列變量及其相關(guān)屬性的描述,它的定義是通過數(shù)據(jù)編輯窗口中的變量視圖實現(xiàn)的。2-2 數(shù)據(jù)文件的結(jié)構(gòu)和定義方法 一、變量名 一、變量名(Name) 變量名是變量存

3、取的惟一標志。在定義SPSS數(shù)據(jù)文件結(jié)構(gòu)時應(yīng)首先給出每列變量的變量名。為了方便記憶,變量名最好與代表的數(shù)據(jù)含義相對應(yīng)。 變量名一般的起名規(guī)則: 1、變量名的字符個數(shù)不多于8個;變量名不區(qū)分大小寫字母。允許漢字作為變量名,漢字總數(shù)不能超過4個; 2、首字符應(yīng)以英文字母開頭,后面可以跟除了!,?,*之外的字母或數(shù)字。下劃線、圓點不能為變量名的最后一個字母; 3、變量名不能與SPSS內(nèi)部特有的具有特定含義的保留字相同,如ALL,BY,NOT,OR等;SPSS有默認的變量名,它以字母“VAR”開頭,后面補足5位數(shù)字,如VAR00001,VAR00012等。 一、變量名(Name) 變量名是變量存取的惟

4、二、數(shù)據(jù)的類型、寬度、小數(shù)位數(shù) Type、 Width、Decimals 數(shù)據(jù)類型是指每個變量取值的類型。SPSS中有三種基本數(shù)據(jù)類型,分別為數(shù)值型、字符型和日期型。相應(yīng)的類型會有默認的列寬或小數(shù)位數(shù)等。1、數(shù)值型 數(shù)值型是SPSS最常用的數(shù)據(jù)類型,通常由阿拉伯?dāng)?shù)字(09)和其他特殊符號(如美元符號、逗號、圓點)等組成。SPSS中數(shù)值型有以下五種不同的標識方法:(1)標準型(Numeric)(2)科學(xué)記數(shù)法型(Scientific Notation)(3)逗號型(Comma)(4)圓點型(Dot)(5)美元符號型(Dollar)二、數(shù)據(jù)的類型、寬度、小數(shù)位數(shù) TypeSPSS變量類型默認長度小

5、數(shù)位數(shù)顯示方式標準型Numeric82標準格式數(shù)值變量,圓點表示小數(shù)點數(shù)值科學(xué)記數(shù)法型Scientific Notation82科學(xué)記數(shù)法逗號型Comma82圓點做小數(shù)點,逗點做三位分隔符的數(shù)值圓點型Dot82逗點做小數(shù)點,圓點做三位分隔符的數(shù)值美元符號型Dollar82有效數(shù)值前帶$,以逗點為分隔符字符型String8無一串字符日期型Datedd-mmm-yyyy、mm/dd/yyyy 等SPSS變量默認小數(shù)顯示方式標準型82標準格式數(shù)值變量,圓點2、字符型(String)3、日期型(Date) 字符型也是SPSS較常用的數(shù)據(jù)類型,由一串字符串組成。如職工號碼、姓名、地址等變量都可以定義為字

6、符型數(shù)據(jù)。 日期型用來表示日期或者時間數(shù)據(jù),如生日、成立日期等變量可以定義為日期型。 2、字符型(String)3、日期型(Date) 字三、變量名標簽(Label) 1、 變量名標簽是對變量名含義的進一步解釋說明,它可增強變量名的可視性和統(tǒng)計分析結(jié)果的可讀性。 2、變量名標簽可用中文,總長度可達120字符,但在統(tǒng)計分析結(jié)果的顯示中,一般不可能顯示如此長的變量名標簽信息。 3、變量名標簽這個屬性是可以省略的,但建議最好給出變量名的標簽。三、變量名標簽(Label) 1、 變量名標簽是對變量四、變量值標簽(Values) 變量值標簽是對變量取值含義的解釋說明信息,對于定類型和定序型數(shù)據(jù)尤為總要。

7、 例,用數(shù)值1表示男, 用數(shù)值2表示女。 可見,變量值標簽對于定序數(shù)據(jù)(如收入的高、中、低)和定類數(shù)據(jù)(如民族、性別)來說是必不可少的,它不但明確了數(shù)據(jù)的含義,也增強了最后統(tǒng)計分析結(jié)果的可讀性。變量值標簽可以用中文。 四、變量值標簽(Values) 變量值標簽是對五、缺失數(shù)據(jù)(Missing) 數(shù)據(jù)中明顯錯誤或明顯不合理的數(shù)據(jù)以及漏填的數(shù)據(jù)都可看做缺失數(shù)據(jù)。 例,在某項客戶滿意度的問卷調(diào)查數(shù)據(jù)中,某個被調(diào)查者的年齡是213歲。這個數(shù)據(jù)顯然是一個不符合實際情況的失真數(shù)據(jù)。 例,在某項客戶滿意度的問卷調(diào)查數(shù)據(jù)中,某個被調(diào)查者的年收入沒有填,是空缺的。 SPSS中說明缺失數(shù)據(jù)的基本方法是指定用戶缺失

8、值。在SPSS中處理的方式是:首先,在遺漏的數(shù)據(jù)處填入某個特定的標記數(shù)據(jù),例,將遺漏的年收入數(shù)據(jù)用特定的標記數(shù)據(jù)(如9999999)來替代;然后,再指明這個特定的標記數(shù)據(jù)(如9999999)或那些明顯的失真的數(shù)據(jù)(如213)等為用戶缺失值。這樣,在進行統(tǒng)計分析時,SPSS就能將這些用戶缺失值與正常的數(shù)據(jù)區(qū)分開來,并依據(jù)用戶選擇的處理策略對其進行處理或分析等。五、缺失數(shù)據(jù)(Missing) 數(shù)據(jù)中明顯錯誤或明顯不SPSS用戶缺失值是: 對字符型或數(shù)值型變量,用戶缺失值可以是13個特定的離散值。 對一個數(shù)值型變量,用戶缺失值可以在一個連續(xù)的閉區(qū)間內(nèi)并同時附加一個區(qū)間以外的離散值。 SPSS系統(tǒng)缺失

9、值: 是用一個圓點表示,它不等于0或.00,通常出現(xiàn)在數(shù)值型變量數(shù)據(jù)中。SPSS用戶缺失值是: 對字符型或數(shù)值型變六、計量尺度(Measure) 定距型數(shù)據(jù)(Scale):通常是指諸如年齡、身高、體重、血壓等連續(xù)數(shù)值型數(shù)據(jù),也包括“人數(shù)”、“商品件數(shù)”等離散數(shù)值型數(shù)據(jù); 定序型數(shù)據(jù)(Ordinal):具有內(nèi)在固有大小或高低順序,一般可以用數(shù)值或字符表示,它取值的大小能夠表示觀測對象的某種順序關(guān)系(等級、方位或大小等),但是相鄰級別之間的差距是不相等。例如,職稱變量可以有低級、中級、高級三個取值,可分別用1,2,3表示。年齡段變量可以有老、中、青三個取值,分別用A、B、C表示等。 定類型數(shù)據(jù)(N

10、ominal):是指沒有內(nèi)在固有大小或高低順序,而只是一種名義上的指代,一般以數(shù)值或字符表示的分類數(shù)據(jù)。如性別變量中的男、女取值,可以分別用1,2表示。民族變量中的各個民族,可以分別用漢、回、滿等字符表示。六、計量尺度(Measure) 定距型數(shù)據(jù)(S單擊Variable View 進入;定義變量名定義變量類型定義變量名標簽變量值標簽定義度量尺度定義顯示寬度定義對齊方式 定義變量類型對話框 定義變量值標簽對話框定義變量缺省值對話框變量結(jié)構(gòu)定義的基本操作單擊Variable View 進入;定義定義變量類型定義2-3 SPSS數(shù)據(jù)的錄入與編輯 一、SPSS數(shù)據(jù)的錄入 SPSS數(shù)據(jù)的錄入操作在數(shù)據(jù)

11、編輯窗口中的數(shù)據(jù)視圖中實現(xiàn)。其操作方法與Excel基本類似,也是以電子表格的方式進行錄入。二、SPSS數(shù)據(jù)的編輯1、SPSS數(shù)據(jù)定位 (1)人工定位:指通過人工瀏覽數(shù)據(jù),確定當(dāng)前數(shù)據(jù)單元,適用于數(shù)據(jù)量較少的情況。用戶只需要用鼠標拖動數(shù)據(jù)編輯窗口右邊的滾動鈕,或按鍵盤上的Page Up , Page Down 鍵就可以完成數(shù)據(jù)的瀏覽和定位。 (2)自動定位:指SPSS按照用戶給出的定位條件自動尋找滿足條件的第一個數(shù)據(jù)單元,并設(shè)置它為當(dāng)前數(shù)據(jù)單元,適用于數(shù)據(jù)量較大的情況。定位條件可以是一個個案的號碼,也可以是某個變量的變量值。2-3 SPSS數(shù)據(jù)的錄入與編輯 一、SPSS數(shù)據(jù)的錄入 A、按個案號碼

12、自動定位將當(dāng)前單元定位在任何單元中。選擇菜單: 編輯 - 轉(zhuǎn)至個案 - 輸入個案號碼B、按變量值自動定位將當(dāng)前單元定位在要查找的變量的任何一條個案上。選擇菜單: 編輯 - 查找 - 輸入定位變量值A(chǔ)、按個案號碼自動定位將當(dāng)前單元定位在任何單元中。選擇菜2、插入和刪除一條個案 (1)插入一條個案:在數(shù)據(jù)編輯窗口的某條個案前插入一條新個案。 將當(dāng)前數(shù)據(jù)單元確定在一條個案上。 選擇菜單: 編輯 - 插入個案 (2)刪除一條個案:即刪除數(shù)據(jù)編輯窗口中的某條個案。 在要刪除的個案號碼上單擊左鍵,于是待刪除的個案數(shù)據(jù)全部反色顯示。單擊右鍵,從彈出菜單中選擇 cut選項。2、插入和刪除一條個案 (1)插入一

13、條個案:在數(shù)據(jù)3、插入和刪除一個變量(1)插入一個新變量:即在數(shù)據(jù)編輯窗口的某個變量前插入一個新變量。 將當(dāng)前數(shù)據(jù)單元確定在某變量上選擇菜單:編輯 - 插入變量(2)刪除一個變量:即刪除數(shù)據(jù)編輯窗口中的某列變量。 在要刪除列的變量名上單擊左鍵,于是待刪除列的數(shù)據(jù)全部反色顯示。單擊右鍵,從彈出菜單中選擇 cut選項。3、插入和刪除一個變量(1)插入一個新變量:即在數(shù)據(jù)編輯窗口4、數(shù)據(jù)的移動、復(fù)制和刪除 數(shù)據(jù)的移動、復(fù)制和刪除:與一般的應(yīng)用程序相同(1)選擇操作對象(變量、個案、若干連續(xù)單元等)(2)剪切:Edit+Cut(Ctrl+X) 復(fù)制:Edit+Copy(Ctrl+C) 粘貼:Edit+

14、Paste(Ctrl+V) 恢復(fù)刪除或修改前數(shù)據(jù) Edit+Undo4、數(shù)據(jù)的移動、復(fù)制和刪除 數(shù)據(jù)的移動、復(fù)制和刪除:與一般插入與刪 除變量插入與刪除個案數(shù)據(jù)的剪切、粘貼與復(fù)制 1.插入變量在添加處單擊Var,單擊右鼠標鍵出現(xiàn)右側(cè)對話框, 單擊Insert Variables2.刪除變量1.插入個案在添加處單擊觀測量,單擊右鼠標鍵出現(xiàn)右側(cè)對話框, 單擊Insert Case2.刪除個案剪切復(fù)制粘貼若想恢復(fù),打開EditUndo插入與刪 除變量插入與刪除個案數(shù)據(jù)的剪切、粘貼與復(fù)制 1.插2-4 讀取其他格式的數(shù)據(jù)文件 一、直接讀入其他格式的數(shù)據(jù)文件基本操作步驟如下:(1)選擇菜單:文件 - 打

15、開 - 數(shù)據(jù)(2)選擇數(shù)據(jù)文件的類型,并輸入數(shù)據(jù)文件名。2-4 讀取其他格式的數(shù)據(jù)文件 一、直接讀入其他格式的數(shù)據(jù)文注意: 如果讀入的是Excel格式文件,SPSS默認將它的所有數(shù)據(jù)讀到SPSS數(shù)據(jù)編輯窗口中,也可以指定讀取工作表中某個區(qū)域內(nèi)的數(shù)據(jù)(A5:B10,表示僅讀取以A5單元為左上角,B10單元為右下角的矩形區(qū)域內(nèi)的數(shù)據(jù))。工作表上的一行數(shù)據(jù)為SPSS的個案。如果Excel工作表文件第一行或指定讀取區(qū)域內(nèi)的第一行上存儲了變量名信息,則應(yīng)選擇讀取變量名選項。 注意: 如果讀入的是Excel格式文件,SPS二、使用文本導(dǎo)向讀入文本文件(1)選擇菜單:文件 - 檢索二、使用文本導(dǎo)向讀入文本文

16、件(1)選擇菜單:文件 - 檢索數(shù)據(jù)間如何分割數(shù)據(jù)文件的第一行上是否有變量名數(shù)據(jù)間如何分割數(shù)據(jù)文件的第一行上是否有變量名數(shù)據(jù)部分從文本文件的第幾行開始個案數(shù)據(jù)在文本文件中是如何安排的數(shù)據(jù)部分從文本文件的第幾行開始個案數(shù)據(jù)在文本文件中是如何安排指定文本文件的分割符號字符型數(shù)據(jù)表示方法指定文本文件的分割符號字符型數(shù)據(jù)表示方法第二章-SPSS數(shù)據(jù)文件的建立和管理課件第二章-SPSS數(shù)據(jù)文件的建立和管理課件2-5 SPSS數(shù)據(jù)文件合并 一、縱向合并數(shù)據(jù)文件 縱向合并數(shù)據(jù)文件就是將數(shù)據(jù)編輯窗口中的數(shù)據(jù)與另一個SPSS數(shù)據(jù)文件中的數(shù)據(jù)進行首尾對接,即將一個SPSS數(shù)據(jù)文件的內(nèi)容追加到數(shù)據(jù)編輯窗口中當(dāng)前數(shù)據(jù)

17、的后面,依據(jù)兩個數(shù)據(jù)文件中的變量名進行數(shù)據(jù)對接??v向合并SPSS數(shù)據(jù)時,通常要注意以下兩個問題: 兩個待合并的SPSS數(shù)據(jù)文件的內(nèi)容合并起來應(yīng)是有實際意義的。換句話說,如果兩份完全不相干的數(shù)據(jù),雖然操作上能夠?qū)崿F(xiàn)他們的縱向合并,但卻是毫無意義的。 為方便SPSS數(shù)據(jù)文件的縱向合并,在不同數(shù)據(jù)文件中數(shù)據(jù)含義相同的數(shù)據(jù)項最好用相同的變量名,且數(shù)據(jù)類型也最好相同,利于SPSS對變量的自動匹配。2-5 SPSS數(shù)據(jù)文件合并 一、縱向合并數(shù)據(jù)文件 縱 例 有兩份關(guān)于職工基本情況的SPSS數(shù)據(jù)文件,文件名分別為“職工數(shù)據(jù).sav”和“追加職工.sav”。兩份數(shù)據(jù)文件中的數(shù)據(jù)項不盡相同,且同一數(shù)據(jù)項的變量名

18、也不完全一致?,F(xiàn)需要將這兩份數(shù)據(jù)合并到一起。 例 有兩份關(guān)于職工基本情況的SPSS數(shù)據(jù)文件,文件縱向合并數(shù)據(jù)文件的基本操作步驟1、在數(shù)據(jù)編輯窗口中打開一個需要合并的SPSS數(shù)據(jù)文件。2、選擇菜單: 數(shù)據(jù) - 合并文件 - 添加個案 縱向合并數(shù)據(jù)文件的基本操作步驟1、在數(shù)據(jù)編輯窗口中打開一個需 3、新的活動數(shù)據(jù)集中的變量: 框中顯示的變量名是兩個數(shù)據(jù)文件中的同名變量,SPSS默認它們有相同的數(shù)據(jù)含義,并將它們作為合并后新數(shù)據(jù)文件中的變量。如果不接受這種默認,可以按 按鈕將它們剔除到非成對變量框中。 *表示該變量是當(dāng)前數(shù)據(jù)編輯窗口中的變量,表示該變量是指定的要追加的磁盤的數(shù)據(jù)文件中的變量。 4、非

19、成對變量:框中顯示的變量名是兩個文件中的不同變量。SPSS默認這些變量的含義不同,且不放入合并后的新文件中。如果不接受這種默認,可選擇其中的兩個變量名并按 指定配對,表示雖然它們的名稱不同,但數(shù)據(jù)含義是相同的??蛇M入合并后的數(shù)據(jù)文件中。或者,對某變量按 改名后再指定配對。 縱向合并數(shù)據(jù)文件的基本操作步驟 3、新的活動數(shù)據(jù)集中的變量:*表示該變量 5、如果希望在合并后的數(shù)據(jù)文件中看出哪些個案來自合并前的哪個SPSS數(shù)據(jù)文件,可以選 項。于是合并后的數(shù)據(jù)文件中將自動生產(chǎn)一個名為源01取值為0或1的變量??梢允÷浴?0表示個案來自第一份數(shù)據(jù)文件, 1表示來自第二份數(shù)據(jù)文件??v向合并數(shù)據(jù)文件的基本操作

20、步驟 5、如果希望在合并后的數(shù)據(jù)文件中看出哪些個案二、橫向合并數(shù)據(jù)文件 橫向合并數(shù)據(jù)文件就是將數(shù)據(jù)編輯窗口中的數(shù)據(jù)與另一個SPSS數(shù)據(jù)文件中的數(shù)據(jù)進行左右對接,即將一個數(shù)據(jù)文件的內(nèi)容拼到數(shù)據(jù)編輯窗口中當(dāng)前數(shù)據(jù)的右邊,依據(jù)兩個數(shù)據(jù)文件中的個案進行數(shù)據(jù)對接。橫向合并數(shù)據(jù)文件時,通常要注意以下三個問題: 兩個數(shù)據(jù)文件必須至少有一個名稱相同的變量,該變量是兩個數(shù)據(jù)文件橫向拼接的依據(jù),稱為關(guān)鍵變量。 兩個數(shù)據(jù)文件都必須事先按照關(guān)鍵變量進行升序排列。 為方便SPSS數(shù)據(jù)文件的橫向合并,不同數(shù)據(jù)文件中數(shù)據(jù)含義不相同的數(shù)據(jù)項,變量名不應(yīng)相同。二、橫向合并數(shù)據(jù)文件 橫向合并數(shù)據(jù)文件就是將數(shù)據(jù)編輯窗 例 有兩份關(guān)于職工基本情況的SPSS數(shù)據(jù)文件,文件名分別為“職工數(shù)據(jù).sav”和“職工獎金.sav”。這里,兩份數(shù)據(jù)文件中職工號的變量名是相同的,第二份數(shù)據(jù)中只有部分職工的獎金數(shù)據(jù)?,F(xiàn)需要將這兩份數(shù)據(jù)文件合并。 例 有兩份關(guān)

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負責(zé)。
  • 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔(dān)用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

評論

0/150

提交評論