版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進(jìn)行舉報(bào)或認(rèn)領(lǐng)
文檔簡介
數(shù)據(jù)分析方法及軟件應(yīng)用授課教師:楊小寶北京交通大學(xué)2016.092023/2/4第2章SPSS的數(shù)據(jù)文件2.1SPSS數(shù)據(jù)文件的特點(diǎn)2.2定義變量屬性(重點(diǎn))2.3SPSS數(shù)據(jù)的錄入、編輯(自學(xué))2.4
SPSS數(shù)據(jù)的保存2.5讀取其他格式的數(shù)據(jù)文件(重點(diǎn))2.6SPSS數(shù)據(jù)文件的合并(自學(xué))2.1SPSS數(shù)據(jù)文件的特點(diǎn)SPSS的數(shù)據(jù)文件擴(kuò)展名是.sav;SPSS數(shù)據(jù)文件是一種有結(jié)構(gòu)的數(shù)據(jù)文件,它由數(shù)據(jù)結(jié)構(gòu)和內(nèi)容兩部分組成,其中的數(shù)據(jù)結(jié)構(gòu)記錄數(shù)據(jù)變量的名稱、類型、變量寬度、小數(shù)位數(shù)、變量名標(biāo)簽、變量值標(biāo)簽、缺失值、顯示寬度、對齊方式和度量尺度等必要信息,數(shù)據(jù)的內(nèi)容才是那些待分析的具體數(shù)據(jù)。數(shù)據(jù)結(jié)構(gòu)數(shù)據(jù)內(nèi)容
基于上述特點(diǎn),建立SPSS數(shù)據(jù)文件時(shí)應(yīng)完成兩項(xiàng)任務(wù):描述SPSS數(shù)據(jù)的結(jié)構(gòu)(變量視圖)錄入編輯SPSS數(shù)據(jù)的內(nèi)容(數(shù)據(jù)視圖)(1)原始數(shù)據(jù)的組織方式數(shù)據(jù)編輯窗口中的一行稱為一個(gè)個(gè)案或記錄(Case),所有個(gè)案組成SPSS數(shù)據(jù)文件的內(nèi)容。數(shù)據(jù)編輯窗口的一列稱為一個(gè)變量(Variable),每個(gè)變量都有一個(gè)名字,稱為變量名,它是訪問和分析SPSS每個(gè)變量的唯一標(biāo)志。SPSS數(shù)據(jù)文件的結(jié)構(gòu)就是對每個(gè)變量及相關(guān)特征的描述。SPSS數(shù)據(jù)的組織方式直接的問卷數(shù)據(jù)(2)頻數(shù)數(shù)據(jù)的組織方式例:職稱年齡段35歲以下(1)36-49歲(2)50歲以上(3)教授(1)0158副教授(2)10202講師(3)20101助教(4)3520頻數(shù)數(shù)據(jù)的組織方式中:一行為變量的一個(gè)分組(或多個(gè)變量交叉分組下的一個(gè)分組),所有行囊括了該變量的所有分組情況,一列仍為一個(gè)變量,代表某個(gè)問題(或某個(gè)方面)及頻數(shù)。分組匯總后的數(shù)據(jù)頻數(shù)數(shù)據(jù)的組織方式—SPSS格式職稱年齡段人數(shù)110121513821102220232312032103314135422430變量名(Name)數(shù)據(jù)類型(Type)、寬度(Width)、列寬度(Columns)-重點(diǎn)變量名標(biāo)簽(Label)變量值標(biāo)簽(Values)-重點(diǎn)缺失數(shù)據(jù)(Missing)變量對齊格式(Align)度量標(biāo)準(zhǔn)(Measure)-重點(diǎn)2.2定義變量屬性
變量名是變量訪問和分析的唯一標(biāo)志。在定義SPSS數(shù)據(jù)結(jié)構(gòu)時(shí)應(yīng)首先給出每列變量的變量名。變量的命名規(guī)則如下:1.以前版本的首字符應(yīng)以英文字母開頭,20版本的可以直接是漢字開頭。后面可以跟除了!、?、*之外的字母或數(shù)字。下劃線、圓點(diǎn)不能為變量名的最后一個(gè)字符。SPSS允許用漢字作為變量名。1)變量名(Variablename)定義時(shí)直接錄入即可2.變量名的字符個(gè)數(shù)最好不多于8個(gè);變量名不區(qū)分大小寫字母。3.SPSS有默認(rèn)的變量名,以字母“VAR”開頭,后面補(bǔ)足5位數(shù)字,如VAR00001,VAR00012等。變量名不能與SPSS內(nèi)部特有的具有特定含義的保留字同名,如ALL,BY,AND,NOT,OR等。4.變量名最好與其代表的數(shù)據(jù)含義相對應(yīng),每個(gè)變量名必須具有唯一性。2)數(shù)據(jù)類型(Type)
每種類型的變量都有自己的變量寬度、小數(shù)位和顯示寬度,其中變量寬度是變量允許的最大字符位數(shù),列寬度是數(shù)據(jù)編輯窗口中顯示每列的字符位數(shù)。通常這兩個(gè)寬度是一致的。2)變量寬度(Width)、顯示寬度(Columns)3)變量名標(biāo)簽(Variablelabel)變量名標(biāo)簽是對變量名含義的進(jìn)一步解釋說明,它可以增強(qiáng)變量名的可視性和統(tǒng)計(jì)分析結(jié)果的可讀性。變量名標(biāo)簽可用中文,總長度可達(dá)120個(gè)字符,但在統(tǒng)計(jì)分析結(jié)果的顯示中一般不能顯示如此長的變量名標(biāo)簽信息。定義時(shí)直接錄入即可4)變量值標(biāo)簽(Valuelabel)
變量值標(biāo)簽是對變量取值含義的解釋說明信息,對于品質(zhì)型數(shù)據(jù)(定性數(shù)據(jù)包括分類和順序數(shù)據(jù))尤為重要,比如1代表男性,2代表女性,它不但明確了數(shù)據(jù)的含義,也增強(qiáng)了最后統(tǒng)計(jì)分析結(jié)果的可讀性,變量值標(biāo)簽可以用中文。鼠標(biāo)單擊再單擊右邊的省略號彈出值標(biāo)簽定義窗口逐個(gè)添加5)缺失數(shù)據(jù)(Missingvalues)數(shù)據(jù)中存在明顯錯(cuò)誤或明顯不合理的數(shù)據(jù)或漏填數(shù)據(jù)項(xiàng)時(shí)統(tǒng)計(jì)學(xué)上稱為不完全數(shù)據(jù)或缺失數(shù)據(jù)。數(shù)據(jù)中如果存在缺失數(shù)據(jù),分析時(shí)通常不能直接采用,要進(jìn)行說明。SPSS用戶缺失值定義窗口鼠標(biāo)單擊再單擊右邊的省略號彈出缺失值定義窗口逐個(gè)添加6)變量對齊格式(Align)定義顯示對齊方式,對齊方式分為右對齊、左對齊和中間對齊;系統(tǒng)中,數(shù)值型變量默認(rèn)為右對齊,字符型變量默認(rèn)為左對齊。7)度量標(biāo)準(zhǔn)(Measure)
統(tǒng)計(jì)學(xué)依據(jù)數(shù)據(jù)的度量尺度將數(shù)據(jù)劃分為三大類:名義(Nominal)—分類數(shù)據(jù),如民族、宗教信仰、性別、黨派;序號(Ordinal)—順序數(shù)據(jù),如職稱、職務(wù)、對某事物的贊同程度;度量(Scale)—數(shù)值型數(shù)據(jù),如身高、體重。通常建立SPSS數(shù)據(jù)文件時(shí)應(yīng)首先定義數(shù)據(jù)的結(jié)構(gòu)部分,然后再輸入數(shù)據(jù),但實(shí)際應(yīng)用中,邊錄入、邊分析、邊修改數(shù)據(jù)結(jié)構(gòu)的情況也是常見的。數(shù)據(jù)的結(jié)構(gòu)定義完成之后,可以在變量視圖(VariableView)卡片中瀏覽,也可以通過菜單選項(xiàng)實(shí)用程序(Utilities)變量(Variable)來實(shí)現(xiàn)。SPSS數(shù)據(jù)的錄入(與Excel類似,自學(xué))
SPSS數(shù)據(jù)的編輯(與Excel類似,自學(xué))
SPSS數(shù)據(jù)的定位
插入和刪除一條個(gè)案
插入和刪除一個(gè)變量
數(shù)據(jù)的移動(dòng)、復(fù)制和刪除2.3SPSS數(shù)據(jù)的錄入、編輯(自學(xué))查找
1、SPSS文件格式,擴(kuò)展名為.sav2、Excel格式文件,擴(kuò)展名為.xls3、dbf格式文件,擴(kuò)展名為.dbf4、文本格式文件,擴(kuò)展名為.datSPSS支持的數(shù)據(jù)格式2.4SPSS數(shù)據(jù)的保存文件File保存Save,對于新的:提示文件名和類型;對于舊的,覆蓋原來的,不再提問;文件File另存為SaveAs,另存一個(gè)數(shù)據(jù)文件,也有格式(類型)問題;變量Variable按鈕允許用戶指定保存哪些變量,不保存哪些變量,變量名前畫叉的變量將被保存到磁盤中。保存數(shù)據(jù)的基本操作保存為SPSS格式時(shí)將數(shù)據(jù)保存為Excel文件格式時(shí),將變量名寫入表格Writevariablesnamestospreadsheet選項(xiàng)呈可用狀態(tài),它的作用是指定是否將SPSS變量名寫入Excel工作表的第一行上。直接讀入其它格式的數(shù)據(jù)文件使用文本向?qū)ёx入文本文件(自學(xué))使用數(shù)據(jù)庫向?qū)ёx入數(shù)據(jù)(自學(xué))2.5讀取其它格式的數(shù)據(jù)文件1)直接讀入其它格式的數(shù)據(jù)文件SPSS現(xiàn)在可以直接讀入許多格式的數(shù)據(jù)文件,其中就包括EXCEL各個(gè)版本的數(shù)據(jù)文件。選擇菜單文件File打開Open數(shù)據(jù)Data;或直接單擊快捷工具欄上的OpenFile按鈕,系統(tǒng)就會(huì)彈出OpenFile對話框,單擊“文件類型”列表框,在里面能看到直接打開的數(shù)據(jù)文件格式。
注:讀入Excel文件時(shí),SPSS默認(rèn)將Excel工作表中的全部數(shù)據(jù)讀到SPSS數(shù)據(jù)編輯窗口,但也可以指定僅讀取工作表中某個(gè)區(qū)域內(nèi)的數(shù)據(jù)(如A5:B10)。工作表上的一行數(shù)據(jù)為SPSS中的一個(gè)個(gè)案。如果Excel工作表文件第一行或指定讀取區(qū)域內(nèi)的第一行存儲(chǔ)了變量名信息,則應(yīng)選擇讀取變量名Readvariablenames項(xiàng),即以第一行的文字信息作為SPSS的變量名,否則不選。讀取EXCEL數(shù)據(jù)文件2)使用文本向?qū)ёx入文本文件選擇菜單文件File打開文本數(shù)據(jù)ReadTextData,系統(tǒng)就會(huì)彈出OpenFile對話框,和前面的情況完全一樣,只是文件類型自動(dòng)跳到了Text(*.txt)。也可直接單擊快捷工具欄上的OpenFile按鈕,系統(tǒng)就會(huì)彈出OpenFile對話框,單擊“文件類型”列表框,在里面能看到直接打開的文本文件格式。類似于從文本格式轉(zhuǎn)為EXCEL格式的操作例:現(xiàn)有一數(shù)據(jù)文件以純文本的形式保存,且第一行為變量名,請將其讀入SPSS。在文件File打開文本數(shù)據(jù)ReadTextData對話框選中相應(yīng)的文件名并單擊“確定”,系統(tǒng)會(huì)自動(dòng)啟動(dòng)文本導(dǎo)入向?qū)υ捒蛉缦拢侯愃朴趶奈谋靖袷睫D(zhuǎn)為EXCEL格式的操作選擇菜單文件File打開數(shù)據(jù)庫OpenDatabase
新建查詢NewQuery,系統(tǒng)會(huì)彈出數(shù)據(jù)庫向?qū)У牡谝粋€(gè)窗口,其中會(huì)列出你使用的機(jī)器上已安裝的所有數(shù)據(jù)庫驅(qū)動(dòng)程序,選中所需的數(shù)據(jù)源,然后單擊下一步,向?qū)?huì)一步一步的提示你如何做,直至將數(shù)據(jù)讀入SPSS。3)使用數(shù)據(jù)庫向?qū)ёx入數(shù)據(jù)縱向合并數(shù)據(jù)文件橫向合并數(shù)據(jù)文件2.6SPSS數(shù)據(jù)文件合并(
溫馨提示
- 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
- 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會(huì)有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
- 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
- 5. 人人文庫網(wǎng)僅提供信息存儲(chǔ)空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負(fù)責(zé)。
- 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請與我們聯(lián)系,我們立即糾正。
- 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。
最新文檔
- 2025年度商鋪?zhàn)赓U合同違約責(zé)任及賠償細(xì)則4篇
- 二零二五版摩托車行業(yè)信用體系建設(shè)合同范本3篇
- 二零二五版柴油現(xiàn)貨交易及風(fēng)險(xiǎn)管理合同2篇
- 2021-2026年中國儲(chǔ)氣筒市場深度評估及行業(yè)投資前景咨詢報(bào)告
- 2024某互聯(lián)網(wǎng)公司與某金融機(jī)構(gòu)關(guān)于金融科技合作的合同
- 2024年兩相流量計(jì)項(xiàng)目規(guī)劃申請報(bào)告模板
- 2025版門窗品牌授權(quán)代理銷售與售后服務(wù)合同4篇
- 2025年度數(shù)據(jù)中心建設(shè)個(gè)人工程勞務(wù)分包合同4篇
- 2023-2028年中國注射用降纖酶行業(yè)市場調(diào)查研究及發(fā)展戰(zhàn)略規(guī)劃報(bào)告
- 二零二五版班組施工退場風(fēng)險(xiǎn)評估協(xié)議3篇
- 2019級水電站動(dòng)力設(shè)備專業(yè)三年制人才培養(yǎng)方案
- 室內(nèi)裝飾裝修施工組織設(shè)計(jì)方案
- 洗浴中心活動(dòng)方案
- 送電線路工程施工流程及組織措施
- 肝素誘導(dǎo)的血小板減少癥培訓(xùn)課件
- 韓國文化特征課件
- 抖音認(rèn)證承諾函
- 清潔劑知識培訓(xùn)課件
- 新技術(shù)知識及軍事應(yīng)用教案
- 高等數(shù)學(xué)(第二版)
- 肺炎喘嗽的中醫(yī)護(hù)理常規(guī)
評論
0/150
提交評論