




版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進(jìn)行舉報或認(rèn)領(lǐng)
文檔簡介
1、2020/9/5,SPSS數(shù)據(jù)文件的建立步驟,2020/9/5,一、變量類型與測量尺度 變量類型:數(shù)值型 和 字符型 數(shù)值型:如分?jǐn)?shù)、收入、銷售額等 字符型:如血型、性別等 Tips:SPSS默認(rèn)的是數(shù)值型,2020/9/5,變量類型 vs 測量尺度 例:“性別”變量: 1男, 2女 “成績等級”變量:1最高,2中等,3最低 Question:“1” 在不同變量中意義有何不同?,2020/9/5,測量尺度: 數(shù)據(jù)的測量尺度表現(xiàn)為: 定類尺度定序尺度定距尺度定比尺度 計量水平由低級到高級,2020/9/5,一般來說,數(shù)據(jù)的等級越高,應(yīng)用范圍越廣泛,等級越低,應(yīng)用范圍越受限。 不同測度級別的數(shù)據(jù),
2、應(yīng)用范圍不同。 等級高的數(shù)據(jù),可以兼有等級低的數(shù)據(jù)的功能,而等級低的數(shù)據(jù),不能兼有等級高的數(shù)據(jù)的功能。,2020/9/5,二、定義新變量(進(jìn)入變量編輯窗口),名稱:名稱長度控制在8位以內(nèi),并盡量使用英文名稱。 類型: 寬度: 小數(shù): 標(biāo)簽:對變量進(jìn)行解釋 值:可簡化數(shù)據(jù)錄入例:性別 1男 2女 缺失:缺失值的處理方法,多用于嚴(yán)格的大型調(diào)查 列: 對齊: 測量:變量的測量尺度,2020/9/5,二、定義新變量,練習(xí)題: ID 城市 北京 廣州 上海 深圳 武漢 性別 男 女 文化程度 大專及以下 大專 本科 碩士研究生 碩士研究生以上 職位等級 一般員工 基層管理者 中層管理者 高層管理者 企業(yè)
3、規(guī)模 小型(50人以下) 中型(50-200人) 大型(200人以上) 企業(yè)性質(zhì) 國企 機(jī)關(guān) 事業(yè)單位 外資 合資 年總收入 月基本工資 1月-12月份加班工資 1月-12月獎金,虛擬100人,隨機(jī)數(shù)據(jù)的產(chǎn)生(RAND),2020/9/5,Problems: 名稱:盡可能用英文 變量類型:字符 or 數(shù)值型,寬度,小數(shù)點 模擬數(shù)據(jù)的合理性數(shù)據(jù)檢查 無數(shù)據(jù) vs 缺失值 變量命名必須唯一,不能有兩個相同的變量名,SPSS數(shù)據(jù)文件的建立,1、數(shù)據(jù)的輸入 2、數(shù)據(jù)的檢查 3、數(shù)據(jù)整理,SPSS數(shù)據(jù)文件的建立,1、數(shù)據(jù)的輸入 (進(jìn)入數(shù)據(jù)編輯的數(shù)據(jù)窗口data view) 在SPSS中直接輸入 從外部文
4、件導(dǎo)入 (1)Excel(.xls): 菜單:file open data選擇.xls文件類型 直接從excel中copy,paste到spss Tips:簡單但不智能,如變量名空缺,字符型變量缺失 (2)文本文檔(.txt) 菜單:fileRead text data,2020/9/5,Exercise,1、導(dǎo)入SPSS自帶的demo.xls文件,導(dǎo)入時只要包含demo中的前三個變量 2、導(dǎo)入SPSS自帶的demo.txt文件 Tips:C:Program Files SPSS tutorial sample_filesdemo(.xls/.txt),2020/9/5,Problems: 名
5、稱:盡可能用英文 變量類型:字符 or 數(shù)值型,寬度,小數(shù)點 模擬數(shù)據(jù)的合理性數(shù)據(jù)檢查 無數(shù)據(jù) vs 缺失值,2020/9/5,三、數(shù)據(jù)的錄入和修改,(進(jìn)入數(shù)據(jù)編輯的數(shù)據(jù)窗口data view) 1. 在SPSS中直接錄入 Tips:使用鍵盤而非鼠標(biāo)進(jìn)行操作,2020/9/5,三、數(shù)據(jù)的錄入和修改,2. 從外部文件導(dǎo)入 (1)Excel(.xls): 菜單:file open data選擇.xls文件類型 直接從excel中copy,paste到spss Tips:簡單但不智能,如變量名空缺,字符型變量缺失 (2)文本文檔(.txt) 菜單:fileRead text data,2020/9/
6、5,第一步:“你的文本文件和預(yù)定義格式是否相一致”,2020/9/5,第二步:“變量如何排列”? “變量名包括在文件最前面么?”,2020/9/5,第三步: “第一條記錄從第幾行開始” “你的記錄是怎樣存儲在文件中的?” “你想導(dǎo)入多少條記錄?”,2020/9/5,第四步:“變量間用的是哪種分隔符?”,2020/9/5,第五步:“定義在數(shù)據(jù)預(yù)覽窗口中所選擇的變量?!?2020/9/5,第六步: “你愿意保存這次的文件(讀入)格式設(shè)置以備下次使用嗎?” “你是否愿意將以上操作粘貼為SPSS語句?”,2020/9/5,Exercise,1、導(dǎo)入SPSS自帶的demo.xls文件,導(dǎo)入時只要包含de
7、mo中的前三個變量 2、導(dǎo)入SPSS自帶的demo.txt文件 Tips:C:Program Files SPSS tutorial sample_filesdemo(.xls/.txt),2020/9/5,三、數(shù)據(jù)的錄入和修改,數(shù)據(jù)必須輸入正確才能保證正確的分析結(jié)果。 但很難一次輸入正確,所以就需要進(jìn)行修改,一般包括數(shù)據(jù)的插入、刪除、修改等。,2020/9/5,三、數(shù)據(jù)的錄入和修改,找到單元格 - 重新輸入數(shù)據(jù) 查找辦法: 1、移動指針到指定序號的觀測值 Data Go to Case 2、查找指定變量中的指定數(shù)據(jù)(定位到單元格) Edit+Find(或工具欄上的Find圖標(biāo)按鈕),2020
8、/9/5,三、數(shù)據(jù)的錄入和修改,插入一個變量 在現(xiàn)存變量的右邊:直接在Variable View中定義 在現(xiàn)存變量的中間: Data View或Variable View 點擊右鍵“insert variables” 菜單:Data Insert Variable Tips:所添加的變量都在現(xiàn)存變量前一個位置 刪除一個變量 Data View選中一列數(shù)據(jù),右鍵clear Variable View選中一變量名,右鍵clear,2020/9/5,三、數(shù)據(jù)的錄入和修改,插入一個觀測值 在最后:直接輸入 在中間 :Data Insert Cases Tips:結(jié)果是直接插入一空白行 刪除一個觀測值
9、選中觀測量序號,后按Del,或右鍵clear 批量數(shù)據(jù)調(diào)整 選中一列數(shù)據(jù),鼠標(biāo)右鍵cut,copy,paste Exercise:數(shù)據(jù)的錄入和修改,2020/9/5,數(shù)據(jù)文件的管理 SPSS的一個重要功能,File, Data, Transform 三大菜單,2020/9/5,數(shù)據(jù)文件的管理 之File菜單詳解,一、新建數(shù)據(jù)文件(略) 二、導(dǎo)入外部數(shù)據(jù)(重點) 三、保存數(shù)據(jù)文件 Save 保存為同一數(shù)據(jù)文件 Save as 保存為不同數(shù)據(jù)文件,或者只保存文件中的部分變量 Example in SPSS,2020/9/5,四、File 菜單中的其他條目 Display Data Info 系統(tǒng)會
10、在結(jié)果窗口中顯示所選數(shù)據(jù)文件的詳細(xì)情況,包括建立時間、標(biāo)簽設(shè)置、變量設(shè)置等信息 Give Example Cache Data 緩沖區(qū)加快處理速度,用于處理遠(yuǎn)程數(shù)據(jù) Print 和 Print view打印和打印預(yù)覽,2020/9/5,數(shù)據(jù)文件的管理 之Utilities菜單詳解,一、 Utilities Variables 菜單項: 該菜單項用于顯示各個變量的基本信息 注:與FILE菜單中的Display Data Info 有所不同,前者單獨顯示各個變量的信息,后者顯示整個文件的信息 Give example 二、 Utilities File info菜單項:,Thinking:比較Fi
11、le菜單中的display data info與Utilities菜單中的variables以及Display data info 三者功能有何不同?,2020/9/5,數(shù)據(jù)文件的管理 之Utilities菜單詳解,三、 UtilitiesDefine Sets :定義變量集 用途:當(dāng)數(shù)據(jù)文件中涉及到大量的變量,而我們所做的統(tǒng)計分析僅用到文件中的某幾個變量時常常需要定義變量集,即將所要用到的變量定義成一個集合。 Exercise:定義工資表中的變量集,2020/9/5,數(shù)據(jù)文件的管理 之Data菜單詳解,【Sort Cases對話框】 用途:將數(shù)據(jù)按照某一變量或某幾個變量進(jìn)行排序 Give E
12、xample,2020/9/5,數(shù)據(jù)文件的管理 之Data菜單詳解,【Transpose對話框】 對數(shù)據(jù)進(jìn)行行列轉(zhuǎn)置原文件中的一行數(shù)據(jù)變?yōu)樾挛募械囊涣袛?shù)據(jù),反之亦然 可以在原數(shù)據(jù)文件中指定一個變量記錄轉(zhuǎn)置后的變量名 Give Example:性別為新變量名,將第一季度獎金進(jìn)行轉(zhuǎn)置,2020/9/5,數(shù)據(jù)文件的管理 之Data菜單詳解,【Merge Files對話框】 Add cases 從外部數(shù)據(jù)文件中增加記錄(僅觀測值)到當(dāng)前數(shù)據(jù)文件中,稱為縱向合并兩文件需具有相同的變量 Give Example Add variables 從外部數(shù)據(jù)文件增加變量到當(dāng)前數(shù)據(jù)文 件,稱為橫向合并 Give
13、Example,2020/9/5,Exercise Data,1:以文化程度(升)和職業(yè)等級(降)將工資表排序 Tips:注意當(dāng)兩個變量的排序相反時,SPSS如何處理? 2:以城市類型為新變量名,將工人全年加班費(12個變量)進(jìn)行行列轉(zhuǎn)置 Tips:注意轉(zhuǎn)換后文件的變量名,2020/9/5,Exercise Data,3:新建一個數(shù)據(jù)文件,其中含有“城市”和“地區(qū)”兩個變量,每個變量有10個觀測值(數(shù)值為隨機(jī)數(shù)),然后將新文件的“城市”變量中所有觀測值合并到“工資表”中 4:新建一個數(shù)據(jù)文件,其中含有“id”和“area”兩個變量。其中id變量的數(shù)值為100110,area變量的數(shù)值為隨機(jī)數(shù)。
14、然后以id為key variable將新數(shù)據(jù)文件中的“area”變量合并到“工資表”中 Tips:注意有無key variable的結(jié)果差異,2020/9/5,數(shù)據(jù)文件的管理 之Data菜單詳解,【Aggregate對話框】 用于對數(shù)據(jù)進(jìn)行分類匯總即按指定的分類變量對觀測值進(jìn)行分組,對每組記錄的各變量值求指定的描述統(tǒng)計量,結(jié)果可以存入新數(shù)據(jù)文件,也可以替換當(dāng)前數(shù)據(jù)文件。,2020/9/5,Break Variables:用于選擇分組變量; Aggregate Variables框:用于選擇被匯總的變量; Name&Label鈕:用于定義新產(chǎn)生的匯總變量的名稱和標(biāo)簽 Function鈕:用于定義
15、匯總函數(shù) Save Number of cases in break group as variable復(fù)選框:用于定義一個新變量以存儲同組的記錄數(shù); Create new data file單選鈕:定義一個新文件以存儲匯總結(jié)果 Replace working data file單選鈕:用匯總的結(jié)果替換原來的數(shù)據(jù),2020/9/5,Aggregate對話框提供的函數(shù)形式: Give Example:不同城市工人的平均年總收入,求數(shù)值概況 求特殊值 求觀測值數(shù) 求百分比 求百分?jǐn)?shù),2020/9/5,數(shù)據(jù)文件的管理 之Data菜單詳解,【Split File對話框】 用于將數(shù)據(jù)文件分組為進(jìn)一步處理
16、做準(zhǔn)備 Analyze all cases單選框:選中本框不拆分文件; Compare groups單選框:結(jié)果緊挨在一起便于相互比較; Organize output by groups單選框:各組分析結(jié)果單獨放置; Groups based on框:用于選擇拆分?jǐn)?shù)據(jù)文件的變量; Sort the file by grouping variables單選框:將數(shù)據(jù)按所用的拆分變量排序; File is already sorted單選框:數(shù)據(jù)保持原狀,不按所用的拆分變量排序。 Give Example: 根據(jù)文化程度對工資表進(jìn)行拆分,2020/9/5,數(shù)據(jù)文件的管理 之Data菜單詳解,【S
17、elect Cases對話框】 當(dāng)不需要分析全部數(shù)據(jù),而是按某種要求分析其中的一部分時使用 例如:數(shù)據(jù)庫中包括全省所有學(xué)生高考語文成績。由于數(shù)據(jù)量太大,現(xiàn)在我們想只選取數(shù)據(jù)庫中前5000個學(xué)生的成績進(jìn)行統(tǒng)計,以得到一個粗略的估計。,2020/9/5,All cases:分析所有的記錄; If condition is satisfied:只分析滿足條件的記錄; Random sample of cases:從原數(shù)據(jù)中按某種條件抽樣; Based on time or case range:基于記錄序號來選擇記錄; Use filter variable:使用篩選指示變量來選擇記錄,該變量取值為
18、非0的記錄將被選中 Filtered:未被選中的記錄只是被隔離 Deleted:未被選中的記錄將被刪除,一般不要使用。,2020/9/5,Exercise Data,5:計算工資表中不同性別的一月份平均加班費和一月份加班費總值 6:只選取觀測值中男性的數(shù)據(jù),再計算不同性別的一月份加班費總值 Tips:注意觀察最后的結(jié)果與練習(xí)4最后的結(jié)果有何差異?,2020/9/5,數(shù)據(jù)文件的管理 之Transform菜單詳解,Transform:主要針對數(shù)據(jù)中變量的變換,如根據(jù)已知變量產(chǎn)生一個新的變量 Data:主要針對數(shù)據(jù)庫的維護(hù),如數(shù)據(jù)文件的合并、拆分、匯總等。,2020/9/5,Transform菜單,
19、Compute:計算一個新變量 Count:計數(shù),比如60分以下有幾人 Recode:變量數(shù)值重新編碼,比如考試分?jǐn)?shù)轉(zhuǎn)為及格或不及格 Categorize:歸類 Rank case:對調(diào)查對象進(jìn)行排序,如對考分進(jìn)行排名 Automatic recode:自動編碼 Create time series:創(chuàng)造時間系列 Replace missing valuve:缺失數(shù)據(jù)替代(用某一個數(shù)字),2020/9/5,1、【Compute對話框】最常用,2020/9/5,Compute菜單中的函數(shù)介紹:,1、Arithmetic 函數(shù)數(shù)學(xué)函數(shù) Abs (?) 返回變量的絕對值 Arsin(?)返回變量的反
20、三角函數(shù)值 Rnd(?)返回數(shù)值表達(dá)式四舍五入后得到的整數(shù)值 Trunc (?) 返回數(shù)值表達(dá)式截尾以后得到的整數(shù)值,2020/9/5,Compute菜單中的函數(shù)介紹:,2、 Random numbers隨機(jī)變量函數(shù) RV.Normal(mean,stddev) 返回來自指定均值和標(biāo)準(zhǔn)離差的正態(tài)分布的隨機(jī)數(shù) RV.EXP(shape) 返回服從指定參數(shù)的指數(shù)分布隨機(jī)數(shù) RV.Possion(mean) 返回服從指定均值的泊松分布的隨機(jī)數(shù) RV.Uniform ( min,max) 返回指定最小值和最大值的均勻分布的隨機(jī)數(shù) Eg:如有100個case, 想打亂它們的順序,該如何解決? 方法:首先
21、產(chǎn)生一個均勻分布的隨機(jī)數(shù), 然后按隨機(jī)數(shù)進(jìn)行排序后即可。,2020/9/5,Compute菜單中的函數(shù)介紹:,3、統(tǒng)計函數(shù) CFVAR(標(biāo)準(zhǔn)離差/均值) MAX/最大值 MIN/最小值 MEAN/均值 SD/標(biāo)準(zhǔn)差 SUM /求和 VARIANCE/方差,2020/9/5,Compute菜單中的函數(shù)介紹:,4、日期和時間函數(shù) Eg:Date 5、邏輯函數(shù) Eg:ANY 6、字符串函數(shù) Eg:String 7、轉(zhuǎn)換函數(shù) converse 主要用于字符型變量與數(shù)值型變量的轉(zhuǎn)換,2020/9/5,Demo: 1、將“職位等級” 由一般員工 基層管理者 中層管理者 高層管理者 這四個等級改變?yōu)橐话銌T工 基層管理者 中高層管理者 三個等級 2、計算所有工人的第一月總收入,命名為sum_Jan 3、計算前五十名工人第一季度的月平均獎金,命名為mean_bon 4、將廣州市工人的年總收入值增加10000,2020/9/5,計數(shù)用于標(biāo)示某個值或某些值在某個變量的取值中是否出現(xiàn)。 SPSS會自動用數(shù)字1來標(biāo)注滿足所需條件的記錄。 例:如果想知道月基本工資在1000元以下的記錄 注意: 千萬注意,Count對話框有一個潛在的bug,當(dāng)需要計算同時滿足兩個變量取值條件的記錄數(shù)有多少時,直接用該對話框會得出完全錯誤的結(jié)果。,2、【Count對話框】,Eg:如果
溫馨提示
- 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
- 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
- 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
- 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負(fù)責(zé)。
- 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請與我們聯(lián)系,我們立即糾正。
- 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時也不承擔(dān)用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。
最新文檔
- 城市更新項目廠房土地轉(zhuǎn)讓與城市基礎(chǔ)設(shè)施改造合同
- 產(chǎn)業(yè)園區(qū)場地租賃終止合同范本
- 廠房維修安全方案
- 中醫(yī)理療義診方案
- 招牌柱子施工方案
- 蘇幕遮高考試題及答案
- 2026版《全品高考》選考復(fù)習(xí)方案生物628 課時作業(yè)(二十六) DNA分子的結(jié)構(gòu)、復(fù)制及基因的本質(zhì)含答案
- 2026版《全品高考》選考復(fù)習(xí)方案生物08 7.2 物質(zhì)出入細(xì)胞的方式含答案
- 牙醫(yī)胸牌設(shè)計方案
- 中班健康:鱷魚怕怕
- 2025年社區(qū)專職干部招聘考試真題及答案
- 腦室腹腔分流術(shù)護(hù)理
- 2025年重慶出版集團(tuán)招聘筆試沖刺題2025
- 明星考試題及答案
- 小學(xué)生暑假安全教育主題班會教案
- 開展打擊電信網(wǎng)絡(luò)詐騙知識培訓(xùn)
- 冬雨季施工進(jìn)度保障措施
- 2025至2030中國食品軟管行業(yè)發(fā)展趨勢分析與未來投資戰(zhàn)略咨詢研究報告
- 跨文化沖突技術(shù)緩解方案-洞察及研究
- 2025年中新天津生態(tài)城教育系統(tǒng)教職人員招聘考試筆試試題
- 三非人員介紹課件
評論
0/150
提交評論