數(shù)據(jù)的編碼錄入與整理_第1頁
數(shù)據(jù)的編碼錄入與整理_第2頁
數(shù)據(jù)的編碼錄入與整理_第3頁
數(shù)據(jù)的編碼錄入與整理_第4頁
數(shù)據(jù)的編碼錄入與整理_第5頁
已閱讀5頁,還剩45頁未讀, 繼續(xù)免費閱讀

下載本文檔

版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進行舉報或認領(lǐng)

文檔簡介

第1講

數(shù)據(jù)的編碼、錄入與整理一、數(shù)據(jù)的編碼概念原理是研究者利用SPSS進行統(tǒng)計分析的必要前提。就是把通過問卷調(diào)查獲得的資料轉(zhuǎn)變?yōu)镾PSS能夠識別的數(shù)據(jù)文件,為各種統(tǒng)計分析做好準備。數(shù)據(jù)編碼概念數(shù)據(jù)編碼是指把需要加工處理的數(shù)據(jù)庫信息,用特定的數(shù)字來表示的一種技術(shù)。根據(jù)一定數(shù)據(jù)結(jié)構(gòu)和目標的定性特征,將數(shù)據(jù)轉(zhuǎn)換為代碼或編碼字符,在數(shù)據(jù)傳輸中表示數(shù)據(jù)的組成,并作為傳送、接受和處理的一組規(guī)則和約定。二、數(shù)據(jù)問卷與編碼(舉例)問卷量表序號調(diào)查內(nèi)容選項1您的性別:(1)男(2)女2你的文化程度:(1)沒上過學(2)小學(3)初中(4)高中(5)大專以上3您想選擇下列哪些擇偶條件(最多選三項):(1)相貌(2)文化水準(3)氣質(zhì)風度(4)志同道合(5)人品(6)家庭條件(7)個人收入(8)其他4您購買房屋時,會考慮哪些因素(任選):(1)離工作地點的遠近(2)小孩所就讀的學校(3)居家附近的環(huán)境5您對心理學感興趣:(1)不感興趣(2)感興趣(3)非常感興趣6您對學英語感到厭惡:(1)不厭惡(2)厭惡(3)非常厭惡二、數(shù)據(jù)問卷與編碼(舉例)變量名編碼樣例第1題1-男;2-女男1第2題1-沒上過學;2-小學;3-初中;4-高中;5-大專以上小學2第3題-11-相貌;2-文化水準;3-氣質(zhì)風度;4-志同道合;5-人品;6-家庭條件;7-個人收入;8-其他文化水準2第3題-21-相貌;2-文化水準;3-氣質(zhì)風度;4-志同道合;5-人品;6-家庭條件;7-個人收入;8-其他志同道合4第3題-31-相貌;2-文化水準;3-氣質(zhì)風度;4-志同道合;5-人品;6-家庭條件;7-個人收入;8-其他人品5第4題-工作1-選;0-不選選1第4題-學校1-選;0-不選不選0第4題-環(huán)境1-選;0-不選選1第5題ABC(A-1,B-2,C-3)A1第6題ABC(A-3,B-2,C-1)A3問卷編碼方案三、編碼類型數(shù)值型數(shù)據(jù)的編碼數(shù)值型數(shù)據(jù)的編碼就是根據(jù)調(diào)查問卷的評分標準對變量賦予分值。通常采用三點計分、四點計分和五點計分等方式進行評分

如選項A、B、C計分為1、2、3

如選項A、B、C、D計分為1、2、3、4

編碼示例中的第5、6題就是屬于數(shù)值型編碼第5題是正向數(shù)值型(被選項的程度越高,分值越大)第6題是反向數(shù)值型(被選項的程度越高,分值越小)變量名編碼樣例第5題ABC(A-1,B-2,C-3)A1第6題ABC(A-3,B-2,C-1)A3三、編碼類型非數(shù)值型數(shù)據(jù)的編碼

非數(shù)值型數(shù)據(jù)的編碼,首先要確定編碼規(guī)則,然后根據(jù)規(guī)則對變量賦予分值。

雙值型變量的編碼多采用“0、1”或“1、2”來賦值;如編碼示例中的第1題

多值型變量的編碼采用“1、2、3、…”來賦值;如編碼示例中的第2題

通常對非數(shù)值型數(shù)據(jù)編碼,主要起到分組的作用,不能進行各種算術(shù)運算變量名編碼樣例第1題1-男;0-女男1第2題1-沒上過學;2-小學;3-初中;4-高中;5-大專以上小學2三、編碼類型多項選擇題

多項選擇題就是題目答案的選項是多選項,標準定義有兩種:二分法和多重分類法任意多項二分法

表示每一次可以任選幾個選項;編碼方法把每一個被選項作為一個變量來定義,每個變量只能選擇“1或0”;如編碼示例中的第4題變量名編碼樣例第3題-11-相貌;2-文化水準;3-氣質(zhì)風度;4-志同道合;5-人品;6-家庭條件;7-個人收入;8-其他文化水準2第3題-21-相貌;2-文化水準;3-氣質(zhì)風度;4-志同道合;5-人品;6-家庭條件;7-個人收入;8-其他志同道合4第3題-31-相貌;2-文化水準;3-氣質(zhì)風度;4-志同道合;5-人品;6-家庭條件;7-個人收入;8-其他人品5第4題-工作1-選;0-不選選1第4題-學校1-選;0-不選不選0第4題-環(huán)境1-選;0-不選選1三、編碼類型多項選擇題

多項選擇題就是題目答案的選項是多選項,標準定義有兩種:二分法和多重分類法多選項多重分類法

限定了一次最多可以選擇項目的個數(shù);不能直接對題目進行編碼,必須先確定最多選擇,并給每個選項建立一個變量;如編碼示例中的第3題變量名編碼樣例第3題-11-相貌;2-文化水準;3-氣質(zhì)風度;4-志同道合;5-人品;6-家庭條件;7-個人收入;8-其他文化水準2第3題-21-相貌;2-文化水準;3-氣質(zhì)風度;4-志同道合;5-人品;6-家庭條件;7-個人收入;8-其他志同道合4第3題-31-相貌;2-文化水準;3-氣質(zhì)風度;4-志同道合;5-人品;6-家庭條件;7-個人收入;8-其他人品5第4題-工作1-選;0-不選選1第4題-學校1-選;0-不選不選0第4題-環(huán)境1-選;0-不選選1多重分類定義變量集四、缺失值的處理概念

缺失值是指在數(shù)據(jù)采集與整理過程中丟失的內(nèi)容,往往會給統(tǒng)計分析帶來一些麻煩和誤差。類型

用戶缺失值在問卷調(diào)查中把不回答的選項當作缺失值來處理缺失值可用研究者能識別的數(shù)字來表示如“0、9、99”系統(tǒng)缺失值指計算機默認的缺失方式,如輸入數(shù)據(jù)空缺、輸入非法字符等通常把缺失值標記為“.”四、缺失值的處理缺失值處理方法

替代法:采用統(tǒng)計命令或在相關(guān)統(tǒng)計功能中利用參數(shù)替代

Transform→ReplaceMissingValues

剔除法:剔除有缺失值的題目或剔除有缺失值的整份問卷五、數(shù)據(jù)處理中的操作術(shù)語個案(Cases)一個研究對象就是一個個案;一個個案就是一條記錄;在數(shù)據(jù)表格中表示為“一行”每一個個案記錄的是一個研究對象各個屬性的具體數(shù)值,如學生信息(姓名、性別、年齡等)個案學號姓名性別出生日期專業(yè)編號0604231張三男87-1-1010604253李四女88-6-30020605321王五女88-8六男88-12-2402每一行為一條記錄每一列為一個字段每個記錄只能對應(yīng)一個對象且僅為一個字段學生表五、數(shù)據(jù)處理中的操作術(shù)語樣本(Sample)是指具有共同屬性的所有研究對象,如學生的所有信息樣本包含多個個案,在數(shù)據(jù)表格中表示為“n行”變量(Variable)

是指問卷中每一個問題,數(shù)據(jù)庫里字段,數(shù)據(jù)表格中表示為“一列”量值(Value)

是指問卷中的答案,也稱為觀測值,在SPSS系統(tǒng)里,單元格中的數(shù)值就是變量值六、定義變量啟動SPSS后進入數(shù)據(jù)編輯窗口,顯示為一個空文件,輸入數(shù)據(jù)前首先要定義變量。建立數(shù)據(jù)文件數(shù)據(jù)加工整理統(tǒng)計分析解釋分析結(jié)果定義數(shù)據(jù)文件結(jié)構(gòu)錄入、修改、保存數(shù)據(jù)六、定義變量定義變量所包含的內(nèi)容:變量名(Name):變量的名稱變量類型(Type):變量的類型寬度(Width):存儲變量值的最大值(1-可存儲1個字節(jié)的字符,2-可存儲1個漢字)小數(shù)位數(shù)(Decimals):變量為數(shù)值類型時,小數(shù)后的位數(shù)變量標簽(Label):對變量名的注釋。光標在變量名上時,會顯示該標簽變量值標簽(Values):變量標簽的取值缺失值(MissingValues):定義缺失的值,例如,當定義99為缺失值時,當該變量的值為99時,把它認為是缺失值顯示數(shù)據(jù)的列寬(Colums):與上面“寬度”不同,它只管顯示對齊方式(Align):左對齊、右對齊、居中量度類型(Measure):定比變量(Scale)、定序變量(Ordinal)、定類變量(Nominal)。只用于統(tǒng)計制圖時坐標軸變量的區(qū)分和SPSS決策樹模塊的變量定義。六、定義變量單擊數(shù)據(jù)編輯窗口左下方的“VariableView”標簽或雙擊列的題頭(Var),打開變量定義窗口,進行變量定義。六、定義變量定義變量名

在定義變量窗口中Name下的單元格中輸入變量名變量名必須以字母開頭,長度不超過8個SPSS保留的關(guān)鍵詞不能作為變量名AND、OR、NOT、WITH、TO、BY、GT、GE、LT、LE、EQ、NE、ALL等

SPSS中允許使用中文變量名,但盡量不要使用,以免出現(xiàn)兼容性問題六、定義變量定義變量類型、寬度及小數(shù)位數(shù)

在Type下單擊單元格,打開變量類型窗口,選擇變量類型常用變量類型有:數(shù)值型(Numeric)日期型(Date)貨幣型(Dollar)字符型(String)

在Width、Decimal下單元格,選擇寬度和小數(shù)位數(shù),系統(tǒng)默認為“8”和“2”;或者在變量類型窗口中設(shè)置六、定義變量定義變量標簽

在Label下單擊單元格,輸入變量標簽SPSS允許變量標簽長度為255字節(jié)定義變量值標簽

變量值標簽是對變量的每一可能取值進一步描述,當變量是定類或定序變量時,非常有用。變量值標簽系統(tǒng)默認為None在Values下單擊單元格,打開變量值標簽窗口,輸入變量值標簽:“1”代表男,“2”代表女。選中顯示值標簽按鈕,,可以通過下拉框錄入性別。六、定義變量定義缺失值在Missing下單擊單元格,打開缺失值窗口,輸入缺失值Nomissingvalues:沒有缺失值Discretemissingvalues:定義1~3個單一數(shù)為缺失值Rangeplusoneoptionaldiscretemissingvalues:定義指定范圍為缺失值,同時指定另外一個不在這一范圍的單一數(shù)為缺失值六、定義變量變量定義的信息復(fù)制如果有多個變量的類型相同,可以先定義一個變量,然后把該變量定義的信息復(fù)制給新變量操作步驟:先定義一個變量在該變量行號上單擊右鍵,在快捷菜單中選擇“Copy”選擇同類型新變量所在行,單擊右鍵,在快捷菜單中選擇“Paste”

七、數(shù)據(jù)的錄入定義完所有變量后,單擊“DataView”標簽,在數(shù)據(jù)編輯窗口輸入數(shù)據(jù)。數(shù)據(jù)錄入如果按逐行進行,按Tab鍵改變行數(shù)據(jù)錄入如果按逐列進行,按Enter鍵改變列系統(tǒng)默認的數(shù)據(jù)文件保存類型為“.sav”八、數(shù)據(jù)的導(dǎo)入

SPSS具有強大的與其他軟件共享數(shù)據(jù)文件的功能,所以能夠?qū)攵喾N格式的數(shù)據(jù):八、數(shù)據(jù)的導(dǎo)入-Excel文件例一(1):數(shù)據(jù)的導(dǎo)入將EXCEL文件2-recode.xls導(dǎo)入到SPSS中啟動SPSS;步驟:File→Open→Data.

數(shù)據(jù)導(dǎo)入后,查看“VariableView”標簽中的字段名、類型、寬度等。把導(dǎo)入后的數(shù)據(jù)文件保存為2-recode.sav八、數(shù)據(jù)的導(dǎo)入例一(2):把Access中shift-MIS.accdb中的“學生表”信息導(dǎo)入到SPSS中.方法1:a).打開shift-MIS.accdb文件,選中“表”對象,再選中“學生表”。八、數(shù)據(jù)的導(dǎo)入例一(1):把Access中shift-MIS.accdb中的“學生表”信息導(dǎo)入到SPSS中.b).菜單上,文件→導(dǎo)出…,“保存類型”選擇“MicrosoftExcel”,文件名自動為“學生表”→“導(dǎo)出”

八、數(shù)據(jù)的導(dǎo)入例一(1):把Access中shift-MIS.accdb中的“學生表”信息導(dǎo)入到SPSS中.c).啟動SPSS,F(xiàn)ile→Open→Data,“文件類型”選擇“Excel(*.xls)”,找到“學生表.xls”文件后→“打開”d).保存為:學生表.sav八、數(shù)據(jù)的導(dǎo)入例一(1):把Access中shift-MIS.accdb中的“學生表”信息導(dǎo)入到SPSS中.方法2:直接打開數(shù)據(jù)源

文件>打開數(shù)據(jù)庫>新查詢

(按照向?qū)瓿桑┚?、?shù)據(jù)的整理概念

數(shù)據(jù)整理是對錄入的數(shù)據(jù)進行轉(zhuǎn)換、檢測、量表統(tǒng)分、個案選擇、文件拆分與合并等操作,使原始數(shù)據(jù)生成后續(xù)研究所需要的數(shù)據(jù)。包含:文件級數(shù)據(jù)整理變量級數(shù)據(jù)整理其他數(shù)據(jù)整理九、數(shù)據(jù)的整理操作SPSS實現(xiàn)數(shù)據(jù)整理的功能主要集中在“Data”和“Transform”兩個菜單九、數(shù)據(jù)的整理-Recode例二:數(shù)據(jù)分值的轉(zhuǎn)換

數(shù)據(jù)分值的轉(zhuǎn)換是通過對數(shù)據(jù)進行重新編碼來實現(xiàn)的。在SPSS中主要通過Recode命令來實現(xiàn)九、數(shù)據(jù)的整理例二:數(shù)據(jù)分值的轉(zhuǎn)換IntoSameVariables:編碼后數(shù)據(jù)存放在原變量中,覆蓋原數(shù)據(jù)IntoDifferentVariables:編碼后數(shù)據(jù)存放在新定義的變量中,保留原數(shù)據(jù)

九、數(shù)據(jù)的整理例二:數(shù)據(jù)分值的轉(zhuǎn)換假設(shè)一套量表共10題,每題有A、B、C三個選項,現(xiàn)有10個被試作答。要求根據(jù)評分規(guī)則,將被試的原始數(shù)據(jù)選擇轉(zhuǎn)換為量表分數(shù)注意:1、2、4、7、8、10:正向題3、5、6、9:反向題量表評分規(guī)則

題號選項12345678910A1131331131B2222222222C331311331310名被試的作答結(jié)果表

題號被試123456789101ABBBABCACB2ABBCABCACB3ACBBABCABB4BBBBBACBCB5ACABBABABC6BCABABBBBA7BCCCABCABB8ACABBABACB9ABBBBACACB10BBBBABCBCC九、數(shù)據(jù)的整理例二:數(shù)據(jù)分值的轉(zhuǎn)換原數(shù)據(jù)轉(zhuǎn)換后數(shù)據(jù)九、數(shù)據(jù)的整理例二:數(shù)據(jù)分值的轉(zhuǎn)換數(shù)據(jù)輸入:打開數(shù)據(jù)文件(2-recode.sav)Transform→Recode→IntoDifferentVariables

打開“Recode”對話框,定義新變量名打開“OldandNewValue…”對話框,定義轉(zhuǎn)換規(guī)則九、數(shù)據(jù)的整理-Compute例三:量表的統(tǒng)分在數(shù)據(jù)錄入過程中,輸入的是最原始、最穩(wěn)定的反應(yīng)選項,但在后續(xù)的統(tǒng)計分析中通常需要對量表的總分進行推斷統(tǒng)計。量表的統(tǒng)分工作包括分量表的統(tǒng)分和總量表的統(tǒng)分,SPSS中通常用“Compute”命令實現(xiàn)量表的統(tǒng)分工作注:變量計算的目的分為1.數(shù)據(jù)的轉(zhuǎn)換處理,新變量更具有直觀有效的特點,如:根據(jù)顧客的消費總金額和消費時間計算平均消費以預(yù)測理想客戶;根據(jù)購房客戶的貸款總額和按揭方案計算指標來評價客戶的風險大小。2.對數(shù)據(jù)原有分布狀態(tài)進行轉(zhuǎn)換。如:利用對數(shù)或多項式轉(zhuǎn)換對非正態(tài)或非線性數(shù)據(jù)進行處理;對時間序列進行平穩(wěn)化處理等。九、數(shù)據(jù)的整理例三:量表的統(tǒng)分以分值轉(zhuǎn)化后的數(shù)據(jù)文件2-recode.sav為例。假定該量表由2個分量表構(gòu)成,其中1個量表由第1、2、5、8、9題組成,另一個量表由第3、4、6、7、10題組成。計算出每一個被試的分量表分和總量表分。九、數(shù)據(jù)的整理例三:量表的統(tǒng)分打開數(shù)據(jù)文件2-recode.sav。Transform→Compute(計算分量表分flb1、flb2和總量表分zlb)

統(tǒng)分結(jié)果保存為2-lb.sav九、數(shù)據(jù)的整理-SortCases例四:數(shù)據(jù)的排序

分為:個案排序和變量排序

在SPSS中,主要通過Data→SortCases、Data→SortVariables來實現(xiàn)。注:排序使我們初步了解數(shù)據(jù)的離散程度,發(fā)現(xiàn)數(shù)據(jù)的異常值。九、數(shù)據(jù)的整理例四:數(shù)據(jù)的排序以數(shù)據(jù)文件2-lb.sav為例,找出變量zlb的高低分組的分組一般以總個案的40%為界限確定高低分

九、數(shù)據(jù)的整理例四:數(shù)據(jù)的排序

打開數(shù)據(jù)文件2-lb.sav

Data→SortCases

將分數(shù)排序,確定高分組和低分組的起點分數(shù)值將變量zlb轉(zhuǎn)換為變量zlb1(重

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負責。
  • 6. 下載文件中如有侵權(quán)或不適當內(nèi)容,請與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

評論

0/150

提交評論