版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進(jìn)行舉報(bào)或認(rèn)領(lǐng)
文檔簡介
1、第二章 數(shù)據(jù)與SPSS數(shù)據(jù)處理 v第1節(jié) 數(shù)據(jù)v第2節(jié) SPSS數(shù)據(jù)文件的建立和管理v第3節(jié) SPSS數(shù)據(jù)的預(yù)處理1;.第二章 數(shù)據(jù)與SPSS數(shù)據(jù)處理 v第1節(jié) 數(shù)據(jù)2;.3小時(shí)數(shù)燈泡數(shù)43-48248-53153-58258-632163-682868-732873-783378-832683-882188-931993-981098-1036103-1082108-1130113-1181200只燈泡使用壽命頻數(shù)分布表使用壽命二百只燈泡的可使用壽命直方圖頻數(shù)4公司1公司2公司3公司4合計(jì)贊成68755779279反對32453331141合計(jì)10012090110420關(guān)于改革方案調(diào)查結(jié)果
2、可口可樂新 騎 士可口可樂雪 碧雪 碧杏 仁 露可口可樂可口可樂醒 目可口可樂新 騎 士可口可樂可口可樂雪 碧可口可樂醒 目可口可樂雪 碧杏 仁 露杏 仁 露雪 碧雪 碧可口可樂可口可樂雪 碧新 騎 士雪 碧可口可樂雪 碧醒 目雪 碧雪 碧杏 仁 露可口可樂可口可樂杏 仁 露可口可樂杏 仁 露新 騎 士杏 仁 露可口可樂新 騎 士雪 碧可口可樂杏 仁 露可口可樂醒 目可口可樂醒 目雪 碧5種軟飲料購買頻數(shù)56數(shù)據(jù)的定義 現(xiàn)代漢語詞典:數(shù)據(jù)(data)是進(jìn)行各種統(tǒng)計(jì)、計(jì)算、科學(xué)研究和技術(shù)設(shè)計(jì)等所依據(jù)的數(shù)值。 數(shù)理統(tǒng)計(jì)學(xué):通過對樣本進(jìn)行觀察或測定的方法,得到的觀察值或變量(variable)就是數(shù)
3、據(jù)。數(shù)據(jù)是原始事實(shí),如員工的姓名、每周的工作小時(shí)數(shù)、商店存貨數(shù)量或銷售訂單等。u 傳統(tǒng)的數(shù)據(jù):狹義的數(shù)據(jù),指用數(shù)值表示的字據(jù),僅能用數(shù)字表示u 現(xiàn)代的數(shù)據(jù):廣義的數(shù)據(jù),指代表真實(shí)世界的客觀事物,可以是數(shù)字、文字、圖像、聲音等。v 數(shù)據(jù)是簡單的客觀事實(shí),除它本身以外沒有什么價(jià)值。但如果在各個(gè)數(shù)據(jù)之間定義了相互的關(guān)系,它們就具有了價(jià)值。 7數(shù)據(jù)的類型按照數(shù)據(jù)的表現(xiàn)形式,廣義的數(shù)據(jù)常分為4種 基本數(shù)據(jù),包括數(shù)字、文字、字母、符號和字符 圖形數(shù)據(jù),包括圖形、圖片 聲音數(shù)據(jù),包括聲音、噪聲和音調(diào) 視覺數(shù)據(jù),包括動(dòng)作、脈沖、電磁波、信號和動(dòng)畫當(dāng)這些事實(shí)按照一定意義的方式組織和安排在一起,就成為信息8數(shù)據(jù)的
4、類型正確理解所研究變量的類型對選擇適當(dāng)?shù)慕y(tǒng)計(jì)分析方法至關(guān)重要對變量分類可以根據(jù)不同標(biāo)準(zhǔn)進(jìn)行 獲得方式 觀測水平 取值性質(zhì)9(1)根據(jù)數(shù)據(jù)的獲得方式 觀測數(shù)據(jù)(observed data): 取值直接來自研究者的觀察、測量或調(diào)查 表現(xiàn)物質(zhì)特征的數(shù)據(jù)為客觀數(shù)據(jù)。如空氣污染物、某商品的物價(jià) 表現(xiàn)精神屬性的數(shù)據(jù)為主觀數(shù)據(jù)(是客觀數(shù)據(jù)的能動(dòng)反映和抽象) ,如人們對某事物的反映 按照數(shù)據(jù)來源,有對離散數(shù)的觀測數(shù)據(jù)計(jì)數(shù)數(shù)據(jù),人數(shù)、桌椅數(shù);有對連續(xù)數(shù)的觀測數(shù)據(jù)計(jì)量數(shù)據(jù),如溫度、長度。衍生數(shù)據(jù)(derived data): 又稱之為二手?jǐn)?shù)據(jù),其來源于他人直接觀察和調(diào)查,或者是觀測(初級)數(shù)據(jù)的再處理,經(jīng)過高度抽
5、象,是高級的客觀數(shù)據(jù)。 客觀數(shù)據(jù)經(jīng)人為的加工,即轉(zhuǎn)化為衍生數(shù)據(jù) 衍生數(shù)據(jù)取值往往是通過某種數(shù)學(xué)方法根據(jù)觀測量計(jì)算出來的,如平均氣溫、平均物價(jià)等。 10(2)根據(jù)數(shù)據(jù)的觀測水平定量數(shù)據(jù)(quantitative data) 連續(xù)數(shù)據(jù) (continuous data) (氣溫、氣壓) 離散數(shù)據(jù)(discrete data) (上課人數(shù)、上班人數(shù)) 順序數(shù)據(jù)(ordinal data) (比賽名次、考試成績名次等) 連續(xù)數(shù)據(jù)可轉(zhuǎn)化為離散數(shù)據(jù),也可轉(zhuǎn)化為順序數(shù)據(jù);但順序數(shù)據(jù)不能轉(zhuǎn)化為離散數(shù)據(jù)或連續(xù)數(shù)據(jù)。 為方便起見,年齡數(shù)據(jù)、時(shí)間(天、年)、貨幣(價(jià)格、工資)等數(shù)據(jù)雖然是連續(xù)數(shù)據(jù),也常常作為離散數(shù)據(jù)
6、來處理。定性數(shù)據(jù)(qualitative data) 又叫做類型數(shù)據(jù)(categorical data)定量數(shù)據(jù)與定性數(shù)據(jù)的根本區(qū)別在于前者取值有明確的順序意義,而后者取值僅具有屬性特征(今天是否下雨、有無球賽、班里是否開會(huì)) 11在使用有關(guān)統(tǒng)計(jì)方法時(shí)要注意具體方法的要求,與所研究數(shù)據(jù)之間的一致性根據(jù)測量水平劃分的各類數(shù)據(jù)之間的最重要差別在于它們的信息量不同。測量水平最高的數(shù)據(jù)是連續(xù)量,它包含的信息量在所有數(shù)據(jù)中為最高,其次是離散量和順序量,最后才是類型量。不同數(shù)理統(tǒng)計(jì)方法適用于不同類型的數(shù)據(jù) 用針對高測量水平數(shù)據(jù)的方法去分析低測量水平的數(shù)據(jù),導(dǎo)致錯(cuò)誤的結(jié)論 使用為低測量水平數(shù)據(jù)設(shè)計(jì)的方法去檢
7、驗(yàn)高測量水平數(shù)據(jù),會(huì)造成數(shù)據(jù)信息的浪費(fèi)12不同類型數(shù)據(jù)之間的轉(zhuǎn)換不同類型數(shù)據(jù)之間的轉(zhuǎn)換是允許的,但此類轉(zhuǎn)換必然是單向的。由于不同數(shù)據(jù)中包含的信息量不同,只可能將觀測水平較高的數(shù)據(jù)轉(zhuǎn)換為觀測水平較低的類型在進(jìn)行統(tǒng)計(jì)分析時(shí)最常用的數(shù)據(jù)類型轉(zhuǎn)換是將連續(xù)量或離散量變換為順序量,即所謂求秩運(yùn)算。鑒于此類轉(zhuǎn)換將導(dǎo)致數(shù)據(jù)信息的損失,非必要時(shí)盡量不要使用。 13(3)按照數(shù)據(jù)的取值(性質(zhì))能否由觀察者加以控制,可將其分成隨機(jī)數(shù)據(jù)(random data)和確定性數(shù)據(jù)(fixed data)兩大類數(shù)理統(tǒng)計(jì)方法的研究對象是隨機(jī)數(shù)據(jù)。隨機(jī)數(shù)據(jù)的主要特點(diǎn)在于它們的每一次取值都是不確定的,因此研究者不可能控制也無法預(yù)知
8、每個(gè)取值的確切數(shù)值。另一方面,隨機(jī)數(shù)據(jù)在大量觀察中的取值又有其特定的規(guī)律性,而數(shù)理統(tǒng)計(jì)方法就是要揭示這種規(guī)律性。確定性數(shù)據(jù)本身不能成為數(shù)理統(tǒng)計(jì)方法研究的直接對象,但當(dāng)研究涉及兩個(gè)或兩個(gè)以上數(shù)據(jù)之間的關(guān)系時(shí),確定性數(shù)據(jù)仍有其特定的地位(方差分析中的因素或回歸分析中的自變量)。 14數(shù)據(jù)的計(jì)量-尺度 在現(xiàn)代科學(xué)研究中,對研究對象一般都要采取測量的方法進(jìn)行觀察。測量的尺度,就是用于觀察研究對象和處理資料的測量方法。資料的統(tǒng)計(jì)分析處理,就是要運(yùn)用這些尺度測量被研究對象。有的事物、現(xiàn)象只能或只需對其屬性進(jìn)行分類(稱之為定性分析) ,有些則可以或要求必須用比較精確的數(shù)字加以計(jì)量(稱之為定量分析)。由粗略到
9、精確可分為4個(gè)層次,定類尺度 (nominal scale)、定序尺度(Ordinal scale)、定距尺度(interval scale)和定比尺度 (ratio scale) 共4級。每一級都代表了測量的一個(gè)層次。15數(shù)據(jù)的計(jì)量的四種尺度定類尺度nominal scale定序尺度ordinal scale定距尺度interval scale定比尺度ratio scale按照某屬性對事物進(jìn)行平行的分類。(=、)對事物類別間等級或順序差別的測度。(、)對事物類別或次序之間差距的測度。(+、-)對事物類別或次序之間差距及差別程度的測度。(、)161.定類尺度定類尺度也稱作名義尺度,是測量尺度中
10、層次最低的計(jì)量尺度,是僅能區(qū)分出不同類別的測量尺度。按照某種屬性把事物進(jìn)行分類,是判斷“屬于/不屬于”的基準(zhǔn)。常用于測量定類數(shù)據(jù),如性別分為男和女兩類。定類尺度在統(tǒng)計(jì)處理時(shí)也可用數(shù)字表示,但這些數(shù)字只是由研究者任意規(guī)定的某一類別的代號,不具任何數(shù)學(xué)意義。如對性別可以規(guī)定女是0、男是1。這里的數(shù)據(jù)不能區(qū)分大小或進(jìn)行加減乘除數(shù)學(xué)運(yùn)算,只能計(jì)算各類別的頻數(shù)與 頻率。在市場調(diào)查中,定類尺度常被用來度量被調(diào)查的品牌、屬性、商店等對象。 17變量變量值編碼性別男 女12人種白 黃 棕 黑123418定類尺度的兩個(gè)特點(diǎn):它僅僅只是區(qū)別不同事物的性質(zhì)而沒有任何數(shù)量比較關(guān)系,在代號上也沒有任何量的關(guān)系,因而不能
11、進(jìn)行數(shù)的比較和運(yùn)算; 這種代號具有隨意性,其符號既可用數(shù)字也可用英文、拼音字母等。在對它們進(jìn)行排列時(shí),可以按研究者認(rèn)定的形式進(jìn)行。 定類尺度的設(shè)計(jì)必須遵循兩個(gè)原則: 第一,規(guī)定的類別必須具有窮盡性,即所有被測量的現(xiàn)象都可分別納入這些類別; 第二,各類別必須是相互排斥的,一種現(xiàn)象只能歸入一類,而不能出現(xiàn)同時(shí)歸入兩類的情況。 192. 定序尺度 定序尺度又叫順序尺度,是指能將社會(huì)指標(biāo)排列出大小或高低秩序的測量尺度。它比定類尺度高級一些,不僅能將事物分成不同的類別,還可以確定這些類別的優(yōu)劣或順序,是判斷“A比B”的基準(zhǔn)。 用于測量定序數(shù)據(jù) 如文化程度可分成文盲、小學(xué)、初中、高中、大專、大學(xué)、研究生等
12、7級,每一級都較前一級更高,所給編號分別為1、2,3,4、5,6、7。 定序數(shù)據(jù)可以計(jì)算各類別的頻數(shù)與頻率 可以比較大小,但不能進(jìn)行加減乘除數(shù)學(xué)運(yùn)算。 如根據(jù)文化程度排序,可以判斷初中文化程度讀書時(shí)間多于小學(xué)而低于高中,并用數(shù)字符號表示為小學(xué)初中 Variables61單擊單擊Variable View 進(jìn)入;進(jìn)入;定義定義變量變量名名定義變量類定義變量類型型定義變量名標(biāo)簽定義變量名標(biāo)簽變量值標(biāo)簽變量值標(biāo)簽定義度量尺度定義度量尺度定義顯示寬定義顯示寬度度定義對定義對齊方式齊方式 定義變量類型對定義變量類型對話框話框 定義變量值標(biāo)簽對話定義變量值標(biāo)簽對話框框定義變量缺省值對話框定義變量缺省值對話
13、框62例題2.2 問卷示例問題的類型:單選題-3,5數(shù)值型開放題-1,7文字型開放題-2日期型開放題-4多選題-663開放題的錄入1 序號2 姓名4 出生年月日(mm/dd/yyyy)64單選題1-選項(xiàng)沒有順序之分: 不含其它: 字符型錄入:字符加值標(biāo)簽 數(shù)值型錄入:數(shù)值加值標(biāo)簽含其它:兩個(gè)變量來錄入(“其它” 選項(xiàng)中如需填寫需單獨(dú)變量)單選題2-選項(xiàng)有順序之分?jǐn)?shù)值型錄入: 數(shù)值加值標(biāo)簽 是否喜歡足球 1 非常喜歡 2 喜歡 3 無所謂 4 不喜歡 5 非常不喜歡單選題的錄入6566一份簡單的調(diào)查問卷單項(xiàng)選擇題 提供幾個(gè)備選擇答案,從其中選擇一個(gè)答案 變量類型:分類數(shù)據(jù)、定序數(shù)據(jù) 數(shù)據(jù)類型:字
14、符型填空題 變量類型:定距數(shù)值型 數(shù)據(jù)類型:數(shù)值型67一份簡單的調(diào)查問卷多項(xiàng)選擇題 提供幾個(gè)備選擇答案,從其中選擇多個(gè)答案 在下列品牌中您信任哪些品牌? 伊利、蒙牛、光明、銀橋、歐德寶、德運(yùn) 被診斷為高血壓后你采取了以下哪些輔助治療手段? 高考時(shí)報(bào)考學(xué)校 (1)北京大學(xué) (2)清華大學(xué) (3)人民大學(xué) (4)北京理工大學(xué) (5)北京師范大學(xué) (6)北京外國語大學(xué)68多項(xiàng)選擇題的處理方法多項(xiàng)選擇題不能在SPSS中直接存儲,因?yàn)镾PSS的一個(gè)變量只能有一個(gè)取值思路 將一個(gè)問題定義成幾個(gè)變量,用這幾個(gè)變量來描述該問題的幾個(gè)可能被選擇的答案編碼方式 多選項(xiàng)二分法(multiple dichotomiz
15、e method) 多選項(xiàng)分類法(multiple category method)69l將每個(gè)答案作為一個(gè)變量,每個(gè)變量只有兩個(gè)取值(0或1)。多選項(xiàng)二分法70l預(yù)先估計(jì)多選項(xiàng)問題可能被選擇的最多答案數(shù).為每個(gè)答案建立一個(gè)變量,取值為多選項(xiàng)問題的可選答案多選項(xiàng)分類法71問題 1:您家中是否有下列物品: (可多選)1、電話2、傳真機(jī)3、有線電視4、衛(wèi)星電視5、手機(jī)6、電腦多選二分法則有6個(gè)選項(xiàng),故應(yīng)設(shè)6個(gè)變量,運(yùn)用0-1編碼方法編碼,即:1,0,1,0,1,1。多選分類法,則編碼為1,3,5,6,0,0。1 3 5 672問題2:擇業(yè)中考慮的主要因素(多選)1經(jīng)濟(jì)收入 2專業(yè)對口 3發(fā)展前途
16、4地理區(qū)位5個(gè)人愛好 6風(fēng)險(xiǎn)大小7勞動(dòng)強(qiáng)度 8社會(huì)福利9其他編碼應(yīng)為:1,0,1,1,1,0,1,1,0?;?,3,4,5,7,8,0,0,0。731 3 6問題3 3:您擇業(yè)中考慮的主要因素有(限選三項(xiàng))1經(jīng)濟(jì)收入 2 專業(yè)對口 3發(fā)展前途 4地理區(qū)位5個(gè)人愛好 6風(fēng)險(xiǎn)大小7勞動(dòng)強(qiáng)度 8社會(huì)福利9社會(huì)地位 10其他 因?yàn)橄捱x三項(xiàng),故應(yīng)設(shè)三個(gè)變量,編碼依次為因?yàn)橄捱x三項(xiàng),故應(yīng)設(shè)三個(gè)變量,編碼依次為1, 3,6。74練習(xí)2.2根據(jù)居民儲蓄調(diào)查問卷,建立SPSS格式的數(shù)據(jù)文件75SPSS數(shù)據(jù)的錄入與保存錄入時(shí)應(yīng)注意: 黑框確定當(dāng)前數(shù)據(jù)單元 錄入帶有變量值標(biāo)簽(Value)的數(shù)據(jù): 手工輸入代碼 屏
17、幕顯示變量值標(biāo)簽,在下拉菜單中選擇 在View-Value Labels中切換76SPSS數(shù)據(jù)的編輯定位插入刪除修改復(fù)制在數(shù)據(jù)視圖中進(jìn)行77SPSS數(shù)據(jù)的定位目的:將當(dāng)前數(shù)據(jù)單元定位到某個(gè)特定的單元中兩種定位方式: 按個(gè)案號碼定位菜單: Data - Go to case - 輸入樣本號-確認(rèn)輸入要尋找觀測量序號輸入要尋找觀測量序號782. 按變量值定位: 將當(dāng)前單元定位在某變量列的任何一個(gè)個(gè)案上 選擇菜單 Edit-Find,出現(xiàn)如下對話框 輸入定位變量值并確認(rèn) SPSS自動(dòng)對指定的變量進(jìn)行搜索,并將當(dāng)前單元定位到與定位變量值相等的第一個(gè)個(gè)案上。SPSS數(shù)據(jù)的定位79插入和刪除一個(gè)個(gè)案插入一
18、個(gè)個(gè)案:在數(shù)據(jù)編輯窗口的某個(gè)個(gè)案前插入一個(gè)新個(gè)案 將當(dāng)前數(shù)據(jù)單元確定在一個(gè)個(gè)案上 選擇菜單 Data-Insert Case(或工具欄插入個(gè)案圖標(biāo)按鈕)刪除一個(gè)個(gè)案: 在欲刪除的個(gè)案號碼上單擊鼠標(biāo)左鍵,于是待刪除的個(gè)案數(shù)據(jù)全部呈藍(lán)色顯示 單擊鼠標(biāo)右鍵,從彈出菜單中選擇clear選項(xiàng)80插入和刪除一個(gè)變量插入一個(gè)變量:在數(shù)據(jù)編輯窗口的某個(gè)變量前插入一個(gè)新變量 將當(dāng)前數(shù)據(jù)單元確定在一個(gè)變量上 選擇菜單 Data-Insert Varible(或工具欄插入變量圖標(biāo)按鈕)刪除一個(gè)變量: 在欲刪除的變量名上單擊鼠標(biāo)左鍵,于是待刪除的個(gè)案數(shù)據(jù)全部呈藍(lán)色顯示 單擊鼠標(biāo)右鍵,從彈出菜單中選擇clear選項(xiàng)81
19、數(shù)據(jù)的移動(dòng)、復(fù)制和刪除與一般的應(yīng)用程序相同選擇操作對象(變量、個(gè)案、若干連續(xù)單元等)剪切:Edit+Cut(Ctrl+X)復(fù)制:Edit+Copy(Ctrl+C)粘貼:Edit+Paste(Ctrl+V)恢復(fù)刪除或修改前數(shù)據(jù) Edit+Undo (或工具欄Undo圖標(biāo)按鈕)82插入變量與刪除變量插入變量與刪除變量插入與刪除觀測量插入與刪除觀測量數(shù)據(jù)的剪切、粘數(shù)據(jù)的剪切、粘貼與復(fù)制貼與復(fù)制 1.插入變量插入變量在添加處單擊Var,單擊右鼠標(biāo)鍵出現(xiàn)右側(cè)對話框, 單擊Insert Variables2.刪除變量刪除變量1.插入觀測量插入觀測量在添加處單擊觀測量,單擊右鼠標(biāo)鍵出現(xiàn)右側(cè)對話框, 單擊In
20、sert Case2.刪除觀測量刪除觀測量剪切剪切復(fù)制復(fù)制粘貼粘貼若想恢復(fù),打開若想恢復(fù),打開Edit-Undo83SPSS支持的數(shù)據(jù)格式 1、SPSS文件格式,擴(kuò)展名為.sav 2、Excel格式文件,擴(kuò)展名為.xls 3、dbf格式文件,擴(kuò)展名為.dbf 4、文本格式文件,擴(kuò)展名為.dat注意:有些信息會(huì)丟失SPSS數(shù)據(jù)的保存84SPSS數(shù)據(jù)的保存基本操作 , 對于新的:提示文件名和類型;對于舊的,覆蓋原來的,不再提問 As,另存一個(gè)數(shù)據(jù)文件,也有格式(類型)問題 Variable按鈕允許用戶指定保存哪些變量,不保存哪些變量,變量名前畫叉的變量將被保存到磁盤中85SPSS數(shù)據(jù)的保存基本操作
21、 將數(shù)據(jù)保存為Excel文件格式時(shí),Write variables names to spreadsheet選項(xiàng)呈可用狀態(tài),它的作用是指定是否將SPSS變量名寫入Excel工作表的第一行上 Save value labels where defined insted of data valve選項(xiàng)呈可用狀態(tài),它的作用是指定是否在Excel工作表中用變量值標(biāo)簽來替代變量值86讀取其他格式的數(shù)據(jù)文件SPSS能夠直接讀取其他格式的數(shù)據(jù)文件,并將其保存為SPSS格式的數(shù)據(jù) 直接讀取其他格式的數(shù)據(jù)文件:(1)選擇菜單;(2)選擇數(shù)據(jù)文件的類型,并輸入數(shù)據(jù)文件名 使用數(shù)據(jù)庫查詢打開 利用通用數(shù)據(jù)庫ODBC
22、接口讀取數(shù)據(jù)文件 在9.0及以前版本中非常重要 使用文本向?qū)ёx入文本文件:選擇菜單 Text Data87直接打開選擇菜單File=Open=Data或直接單擊快捷工具欄上的Open File按鈕文件類型SPSS(*.sav)SPSS數(shù)據(jù)文件(6.010.0版)SPSS/PC+(*.sys)SPSS 4.0版數(shù)據(jù)文件Systat(*.syd)*.syd格式的Systat數(shù)據(jù)文件Systat(*.sys)*.sys格式的Systat數(shù)據(jù)文件SPSS portable(*.por)SPSS便攜格式的數(shù)據(jù)文件EXCEL(*.xls)EXCEL數(shù)據(jù)文件(從5.0版2000版)Lotus(*.w*)Lo
23、tus數(shù)據(jù)文件SYLK(*.slk)SYLK數(shù)據(jù)文件dBase(*.dbf)dBase系列數(shù)據(jù)文件,(從dBase IIIV)Text(*.txt)純文本格式的數(shù)據(jù)文件data(*.dat)純文本格式的數(shù)據(jù)文件88讀取EXCEL文件 SPSS默認(rèn)將Excel工作表中的全部數(shù)據(jù)讀到SPSS數(shù)據(jù)編輯窗口 可以指定僅讀取工作表中某個(gè)區(qū)域內(nèi)的數(shù)據(jù)(如A5:B10) 工作表上的一行數(shù)據(jù)為SPSS中的一個(gè)個(gè)案 如果Excel工作表文件第一行或指定讀取區(qū)域內(nèi)的第一行存儲了變量名信息,則應(yīng)選擇Read variable names項(xiàng),即以第一行的文字信息作為SPSS的變量名,否則不選89讀取dbase文件 字
24、段名、字段類型自動(dòng)轉(zhuǎn)成SPSS數(shù)據(jù)文件中的變量名和類型 一條記錄為一個(gè)個(gè)案90使用文本導(dǎo)入向?qū)ёx入文本文件File=Read Text Data該功能在SPSS中已被整合到了Open File對話框中,之所以在菜單上保留該條目的原因是讀入純文本的情況非常普遍,放在這里更加醒目例 :現(xiàn)有一數(shù)據(jù)文件以純文本的形式保存,且第一行為變量名,請將其讀入SPSS。在 File =Read Text Data對話框選中相應(yīng)的文件名并單擊“確定”,系統(tǒng)會(huì)自動(dòng)啟動(dòng)文本導(dǎo)入向?qū)υ捒?1Spss是否已經(jīng)正確的識別和分割了數(shù)據(jù)項(xiàng)92數(shù)據(jù)間如何分割數(shù)據(jù)文件的第一行上是否有變量名93數(shù)據(jù)部分從文本文件的第幾行開始個(gè)案數(shù)
25、據(jù)在文本文件中是如何安排的94指定文本文件的分割符號字符型數(shù)據(jù)表示方法95對隨后出現(xiàn)的兩個(gè)窗口中的問題,通常不必回答。對隨后出現(xiàn)的兩個(gè)窗口中的問題,通常不必回答。96對隨后出現(xiàn)的兩個(gè)窗口中的問題,通常不必回答。對隨后出現(xiàn)的兩個(gè)窗口中的問題,通常不必回答。97使用數(shù)據(jù)庫查詢打開SPSS可以直接打開許多類型的數(shù)據(jù)文件,但這并不是說它可以打開所有類型的數(shù)據(jù)文件SPSS還提供了另一個(gè)適用范圍更廣、但使用上較為專業(yè)的數(shù)據(jù)接口數(shù)據(jù)庫查詢SPSS在這里使用的是一種叫ODBC(Open DataBase Capture)的數(shù)據(jù)接口,該接口被大多數(shù)數(shù)據(jù)庫軟件和辦公軟件(如MS Office)支持,通過它,應(yīng)用程
26、序可以直接訪問以結(jié)構(gòu)化查詢語言(SQL)做為數(shù)據(jù)訪問標(biāo)準(zhǔn)的數(shù)據(jù)庫管理系統(tǒng)由于SPSS 10.0可以直接打開EXCEL所有系列的數(shù)據(jù)文件,因此數(shù)據(jù)庫查詢接口的用處不是很大。但是,在9.0及以前的版本中,該查詢?nèi)允侵苯哟蜷_EXCEL 95、97及2000數(shù)據(jù)文件的唯一辦法98使用數(shù)據(jù)庫查詢打開ODBC數(shù)據(jù)引擎是獨(dú)立于各種應(yīng)用軟件,直接安裝到Windows系統(tǒng)中的,因此你所用的系統(tǒng)中ODBC所支持的數(shù)據(jù)類型取決于所安裝的ODBC引擎的情況。大多數(shù)支持該接口的軟件都會(huì)在安裝光盤上附送該引擎的安裝文件(如MS Office)選擇菜單File=Open Database=New Query,系統(tǒng)會(huì)彈出數(shù)據(jù)
27、庫向?qū)У牡谝粋€(gè)窗口,其中會(huì)列出你使用的機(jī)器上已安裝的所有數(shù)據(jù)庫驅(qū)動(dòng)程序,選中所需的數(shù)據(jù)源,然后單擊下一步,向?qū)?huì)一步一步的提示你如何做,直至將數(shù)據(jù)讀入SPSS。99SPSS數(shù)據(jù)文件合并當(dāng)數(shù)據(jù)量較多時(shí)經(jīng)常會(huì)把一份大的數(shù)據(jù)分成幾個(gè)小的部分,由幾個(gè)錄入員分別錄入合并: 首先將其中的某個(gè)數(shù)據(jù)文件讀入數(shù)據(jù)編輯窗口中 然后依次與其他數(shù)據(jù)文件合并合并方式 縱向合并數(shù)據(jù)文件:從外部數(shù)據(jù)文件中增加個(gè)案到當(dāng)前數(shù)據(jù)文件中(Add Cases) 橫向合并數(shù)據(jù)文件:從外部數(shù)據(jù)文件增加變量到當(dāng)前數(shù)據(jù)文件(Add Variables)100縱向合并數(shù)據(jù)文件(Add Cases)將數(shù)據(jù)編輯窗口中的數(shù)據(jù)與另一個(gè)SPSS數(shù)據(jù)文件
28、中的數(shù)據(jù)進(jìn)行首尾對接,即將一個(gè)SPSS數(shù)據(jù)文件的內(nèi)容追加到數(shù)據(jù)編輯窗口中的數(shù)據(jù)后面-依據(jù)變量名進(jìn)行數(shù)據(jù)對接相互合并的數(shù)據(jù)文件應(yīng)該有相同的變量注意 兩個(gè)待合并的spss數(shù)據(jù)文件的內(nèi)容合并起來應(yīng)有實(shí)際意義 在不同數(shù)據(jù)文件中數(shù)據(jù)含義相同的數(shù)據(jù)項(xiàng)最好起相同的變量名,且數(shù)據(jù)類型也最好相同,利于spss對變量的自動(dòng)匹配101縱向合并數(shù)據(jù)文件(Add Cases)步驟 打開一個(gè)數(shù)據(jù)文件 菜單:Data+Merge Cases同名變量不同名變量顯示數(shù)據(jù)來源102縱向合并數(shù)據(jù)文件(Add Cases)注意 Variables In new working data file框中顯示的變量名是兩個(gè)數(shù)據(jù)文件中都有的
29、變量名 Unpaired Variables框中的變量名是兩個(gè)文件中的不同變量名。*表示該變量是當(dāng)前數(shù)據(jù)編輯窗口中的變量,+表示該變量是待合并文件中的變量 Indicate case source as variable:是否希望在合并后的數(shù)據(jù)文件中看出個(gè)案的來源 自動(dòng)生成一個(gè)變量名為source01,取值0或1的變量103縱向合并數(shù)據(jù)文件(Add Cases)不同變量名但含義相同的變量名的處理配對(Pair) 選擇其中的兩個(gè)變量名并按“Pair”按鈕指定配對。默認(rèn)原數(shù)據(jù)中的變量名 對某變量按“Rename”按鈕改名后在指定配對不經(jīng)匹配,強(qiáng)行合并 兩個(gè)(多個(gè))變量104橫向合并數(shù)據(jù)文件(Add
30、 Variables)將數(shù)據(jù)編輯文件窗口中的數(shù)據(jù)與另一個(gè)SPSS數(shù)據(jù)文件中的數(shù)據(jù)進(jìn)行左右對接。即兩個(gè)數(shù)據(jù)文件依據(jù)個(gè)案進(jìn)行數(shù)據(jù)對接注意: 相互合并的數(shù)據(jù)文件必須至少有一個(gè)名稱相同的變量,該變量是兩文件橫向合作的依據(jù),稱為關(guān)鍵變量 兩個(gè)數(shù)據(jù)文件都必須先按關(guān)鍵變量進(jìn)行升序排列 不同數(shù)據(jù)文件中數(shù)據(jù)含義不相同的數(shù)據(jù)項(xiàng)變量名不應(yīng)相同105橫向合并數(shù)據(jù)文件(Add Variables)步驟: 打開一個(gè)數(shù)據(jù)文件 菜單:Data+Merge Variables106當(dāng)個(gè)案數(shù)據(jù)不是一一對應(yīng)待合并數(shù)據(jù)的共有變量名待合并數(shù)據(jù)文件中的所有變量名107橫向合并數(shù)據(jù)文件(Add Variables)合并數(shù)據(jù)的方式 Both
31、 files provide cases:合并后的數(shù)據(jù)由原來兩個(gè)數(shù)據(jù)文件共同提供 External keyed table :在數(shù)據(jù)編輯窗口中的數(shù)據(jù)基礎(chǔ)上,將第二個(gè)數(shù)據(jù)文件中的其他變量合并進(jìn)來 Working Data Keyed Table:在第二個(gè)數(shù)據(jù)文件數(shù)據(jù)的基礎(chǔ)之上,將數(shù)據(jù)編輯窗口中的其他變量合并進(jìn)來108練習(xí)2.3 數(shù)據(jù)錄入109練習(xí)2.4 多選題錄入在一項(xiàng)關(guān)于汽車品牌的研究中,我們希望了解人們在購買汽車的時(shí)候關(guān)注的是哪些因素,問題如下 您在購買汽車的時(shí)候,關(guān)注以下哪些因素:品牌、車型、價(jià)位、油耗、其他我們希望了解目標(biāo)人群對手機(jī)的哪些品牌的信任度較高,在問卷中列出了10個(gè)品牌,讓被訪
32、者從中選擇他認(rèn)為最可信的幾個(gè)。問題如下 請?jiān)谙旅?0個(gè)品牌中選出您認(rèn)為最信得過的幾個(gè)(最多選三個(gè)) 諾基亞、蘋果、三星、波導(dǎo)、西門子、康佳、華為中興、聯(lián)想、海爾110練習(xí)2.5 Excel數(shù)據(jù)的讀取將文件名為“居民儲蓄調(diào)查數(shù)據(jù).xls”的Excel數(shù)據(jù)文件轉(zhuǎn)換為SPSS數(shù)據(jù)文件,并在SPSS中指定其變量名標(biāo)簽和變量值標(biāo)簽111練習(xí)2.6 數(shù)據(jù)文件合并將名為“學(xué)生成績一.sav”和“學(xué)生成績二.sav”兩個(gè)數(shù)據(jù)文件以學(xué)號為關(guān)鍵變量進(jìn)行橫向合并,形成一個(gè)完整的數(shù)據(jù)文件第二章 數(shù)據(jù)與SPSS數(shù)據(jù)處理 v第3節(jié) SPSS數(shù)據(jù)的預(yù)處理112;.113為什么要進(jìn)行數(shù)據(jù)的預(yù)處理缺失值?異常值?使用所有個(gè)案還
33、是部分個(gè)案?使用所有變量還是部分變量?數(shù)據(jù)是否可以直接用于數(shù)據(jù)分析和建模?在數(shù)據(jù)文件建立好后,通常還需要對待分析的數(shù)據(jù)進(jìn)行必要的預(yù)加工處理,這是數(shù)據(jù)分析過程中不可缺少的一個(gè)關(guān)鍵環(huán)節(jié)隨著數(shù)據(jù)分析的不斷深入,對數(shù)據(jù)的加工處理還會(huì)多次反復(fù),實(shí)現(xiàn)數(shù)據(jù)加工和數(shù)據(jù)分析的螺旋上升114數(shù)據(jù)的預(yù)處理SPSS提供了一些專門的功能輔助用戶實(shí)現(xiàn)數(shù)據(jù)的預(yù)加工處理工作。通過預(yù)處理還可以使用戶對數(shù)據(jù)的總體分布有所了解數(shù)據(jù)的預(yù)加工處理服務(wù)于數(shù)據(jù)分析和建模,包括: 數(shù)據(jù)的排序 變量計(jì)算 數(shù)據(jù)選取 計(jì)數(shù) 分類匯總 數(shù)據(jù)分組 數(shù)據(jù)預(yù)處理的其他功能:轉(zhuǎn)置、加權(quán)、數(shù)據(jù)拆分、缺失值處理、數(shù)據(jù)排秩、定義變量集115數(shù)據(jù)的排序數(shù)據(jù)排序的目
34、的通常數(shù)據(jù)編輯窗口中個(gè)案的前后次序是由數(shù)據(jù)錄入的先后順序決定的。 數(shù)據(jù)預(yù)處理中,有時(shí)需要將數(shù)據(jù)按照一定的順序重新排列作用 數(shù)據(jù)排序便于數(shù)據(jù)的瀏覽,有助于了解數(shù)據(jù)的取值狀況、缺失值數(shù)量的多少等 通過數(shù)據(jù)排序能夠快捷地找到數(shù)據(jù)的最大值和最小值,進(jìn)而可以計(jì)算出數(shù)據(jù)的全距,初步把握和比較數(shù)據(jù)的離散程度 通過數(shù)據(jù)排序能夠快捷地發(fā)現(xiàn)數(shù)據(jù)的異常值,為進(jìn)一步明確它們是否對分析產(chǎn)生重要影響等提供幫助116數(shù)據(jù)排序的方法SPSS的數(shù)據(jù)排序是將數(shù)據(jù)編輯窗口中的數(shù)據(jù)按照某個(gè)或多個(gè)指定變量的變量值升序或降序重新排列。這里的變量也稱為排序變量排序變 量只有一個(gè)時(shí),排序稱為單值排序。排序變量有多個(gè)時(shí),排序稱為多重排序多重排
35、序中,第一個(gè)指定的排序變量稱為主排序變量,其他依次 指定的變量分別稱為第二排序變量、第三排序變量等多重排序時(shí),數(shù)據(jù)首先按主排序變量值的大小次序排序,然后對那些具有相同主排序變量值的數(shù)據(jù),再按照第二排序變量值的次序依次排序下去117數(shù)據(jù)排序的操作步驟選擇菜單:【Data】【Sort Cases】指定主排序變量到【Sort by】框中,并選擇【Sort Order】框中的選 項(xiàng)指出該變量按升序排還是降序排序。Ascending表示升序, Descending 表示降序。如果是多重排序,還要依次指定第二、第三排序變量及相應(yīng)的排序規(guī)則。否則,本步可略118在左邊的源變量框源變量框中選擇排序變量進(jìn)入So
36、rt by框。如果選擇2個(gè)以上的變量,觀測量的排序結(jié)果與排序變量在Sort by框中的順序有關(guān)。列于首位的為第一排序變量。在Sort Order 欄欄內(nèi)選擇排序方式升序與降序119說明數(shù)據(jù)排序是整行數(shù)據(jù)(個(gè)案)排序,而不是只對某列變量排序多重排序中指定排序變量的次序很關(guān)鍵。先指定的變量優(yōu)先于后指定的變量。多重排序可以在按某個(gè)變量值升序(或降序)排序的同時(shí)再按其他變量值降序(或升序)排序數(shù)據(jù)排序后,原有數(shù)據(jù)的排序次序必然被打亂,應(yīng)保存原始數(shù)據(jù)120例題2.3利用住房狀況調(diào)查數(shù)據(jù),通過數(shù)據(jù)排序功能分別找到本市戶口和外地戶口家庭住房面積的最大值和最小值多重排序 主排序變量-戶口狀況 第二排序變量-現(xiàn)
37、住面積121變量計(jì)算變量計(jì)算的目的 數(shù)據(jù)的轉(zhuǎn)換處理 數(shù)據(jù)的轉(zhuǎn)換處理是在原有數(shù)據(jù)的基礎(chǔ)上,計(jì)算產(chǎn)生一些含有更豐富信息的新數(shù)據(jù)。例如,根據(jù)職工的基本工資、失業(yè)保險(xiǎn)、獎(jiǎng)金等數(shù)據(jù)項(xiàng),計(jì)算實(shí)際月收入; 這些新產(chǎn)生的變量具有更直觀和更有效的特點(diǎn)。 對數(shù)據(jù)的原有分布狀態(tài)進(jìn)行轉(zhuǎn)換 由于數(shù)據(jù)分析和建模中某些模型對數(shù)據(jù)的分布有一定的要求,因此可以利用變量計(jì)算對原有數(shù)據(jù)的分布進(jìn)行轉(zhuǎn)換。例如,利用對數(shù)或多項(xiàng)式轉(zhuǎn)換對非正態(tài)或非線性數(shù)據(jù)進(jìn)行處理;對時(shí)間序列進(jìn)行平穩(wěn)化處理;利用區(qū)間變換壓縮數(shù)據(jù)取值范圍和標(biāo)準(zhǔn)化處理等。LKALAKYlnlnln122變量計(jì)算的方法SPSS變量計(jì)算是在原有數(shù)據(jù)的基礎(chǔ)上,根據(jù)用戶給出的SPSS算
38、術(shù)表達(dá)式以及函數(shù),對所有個(gè)案或滿足條件的部分個(gè)案,計(jì)算產(chǎn)生一系列新變量注意:(1)變量計(jì)算是針對所有個(gè)案(或指定的部分個(gè)案)的,每條個(gè)案(或指定的部分個(gè)案)都有自己的計(jì)算結(jié)果。(2)變量計(jì)算的結(jié)果應(yīng)保存到一個(gè)指定變量中,該變量的數(shù)據(jù)類型應(yīng)與計(jì)算結(jié)果的數(shù)據(jù)類型相一致。123變量計(jì)算的幾個(gè)概念SPSS 算術(shù)表達(dá)式SPSS 條件表達(dá)式SPSS 函數(shù)124SPSS算術(shù)表達(dá)式(numeric expression)在變量計(jì)算過程中,應(yīng)根據(jù)實(shí)際需要指出按照什么方法計(jì)算變量。這里的方法一般以SPSS算術(shù)表達(dá)式的形式給出。由常量、變量、算術(shù)運(yùn)算符、圓括號、函數(shù)等組成的式子。 字符型常量應(yīng)用引號引起來 變量是指
39、那些已存在于數(shù)據(jù)編輯窗口中的現(xiàn)有變量 算術(shù)運(yùn)算符主要包括:+(加)、-(減)、*(乘)、/ (除)、*(乘方)。操作對象的數(shù)據(jù)類型為數(shù)值型。 運(yùn)算次序:先乘方,再乘除,最后加減。在同級運(yùn)算中,按從左到右的順序進(jìn)行運(yùn)算通過圓括號改變原有的計(jì)算順序在同一算術(shù)表達(dá)式中的常量及變量,數(shù)據(jù)類型應(yīng)該一致,否則無法計(jì)算 125SPSS條件表達(dá)式在變量計(jì)算中通常要求對不同組(類)的個(gè)案分別按不同的方法進(jìn)行計(jì)算,于是就需要通過一定的方式來指定個(gè)案。條件表達(dá)式能夠幫助實(shí)現(xiàn)這一目標(biāo)條件表達(dá)式是一個(gè)對條件進(jìn)行判斷的式子。其結(jié)果有兩種取值:如果判斷條件成立,則結(jié)果為真;如果判斷條件不成立,則結(jié)果為假條件表達(dá)式包括簡單條
40、件表達(dá)式和復(fù)合條件表達(dá)式1261.簡單條件表達(dá)式簡單條件表達(dá)式是由關(guān)系運(yùn)算符、常量、變量以及算術(shù)表達(dá)式等組成的式子。關(guān)系運(yùn)算符包括(大于)、= (大于等于)、35,表示年齡大于35歲。在數(shù)據(jù)編輯窗口中,對于年齡大于35 歲的個(gè)案,該條件判斷的結(jié)果為真,而對于年齡小于或等于35歲的個(gè)案,該條件判斷的結(jié)果為假。1272.復(fù)合條件表達(dá)式復(fù)合條件表達(dá)式又稱邏輯表達(dá)式,是由邏輯運(yùn)算符、圓括號和簡單條件表達(dá)式等組成的式子。其中,邏輯運(yùn)算符包括&或AND (并且)、|或OR (或者)、或NOT (非)NOT的運(yùn)算最優(yōu)先,其次是AND,最低是OR。 可以通過圓括號改變這種運(yùn)算次序 例如,職工基本情況數(shù)
41、據(jù)可以寫成這樣的復(fù)合條件表達(dá)式: (nl=35) and not (zc Output】框中。(3)在【Output Variable】框中的【Name】后輸入存放分組結(jié)果的變量名,并按Change按鈕確認(rèn)。也可在【Label】后輸入相應(yīng)的變量名標(biāo)簽。(4)按Old and New values按鈕進(jìn)行分組區(qū)間定義。這里,應(yīng)根據(jù)分析要求逐個(gè)定義各分組區(qū)間(5)如果僅對符合一定條件的個(gè)案分組,則單擊If按鈕并輸入SPSS條件表達(dá)式。否則,本步可略去163選擇分組變量到此處存放分組結(jié)果的變量名按Change按鈕確認(rèn)定義分組區(qū)間164指定分組區(qū)間的下限和上限給出該區(qū)間對應(yīng)的分組值單擊Add按鈕確認(rèn)分
42、組區(qū)間并加到此處165例題2.9利用住房狀況調(diào)查數(shù)據(jù),分析被調(diào)查家庭的人均住房面積的分布特征v 確定分組變量v 確定組距和分組數(shù)目v 進(jìn)行分組166數(shù)據(jù)預(yù)處理的其他功能數(shù)據(jù)轉(zhuǎn)置 將數(shù)據(jù)編輯窗口中數(shù)據(jù)的行列互換選擇菜單: Data】【Transpose】指定數(shù)據(jù)轉(zhuǎn)置后應(yīng)保留哪些變量指定轉(zhuǎn)置后數(shù)據(jù)文件中各變量如何取名選擇一個(gè)取值唯一的變量(如職工號)作為標(biāo)記變量到此處167數(shù)據(jù)轉(zhuǎn)置轉(zhuǎn)置后數(shù)據(jù)各變量取名為:K_標(biāo)記變量值標(biāo)記變量值(如K_001、K_002、K_003等)。如果略去本步,則轉(zhuǎn)置后數(shù)據(jù)各變量名默認(rèn)為VAR00001,VAR00002,VAR00003等SPSS將自動(dòng)完成數(shù)據(jù)轉(zhuǎn)置,并將轉(zhuǎn)
43、置結(jié)果顯示在數(shù)據(jù)編輯窗口中。同時(shí), SPSS還會(huì)自動(dòng)產(chǎn)生一個(gè)名為Case _ lbl的新變量,用來存放原數(shù)據(jù)文件中的各變量名168統(tǒng)計(jì)分析中的加權(quán)處理是極為常見的,如計(jì)算加權(quán)平均數(shù)如果僅用各種蔬菜銷售單價(jià)的平均數(shù)作為平均價(jià)格是不合理的,還應(yīng)考慮到銷售量對平均價(jià)格的影響因此,以蔬菜的銷售量為權(quán)數(shù)計(jì)算各種蔬菜銷售單價(jià)的加權(quán)平均數(shù),就能夠準(zhǔn)確反映平均價(jià)格的水平加權(quán)處理169加權(quán)處理 【Data】【W(wǎng)eight Cases】fxfx選擇某變量作為加權(quán)變量到此處170加權(quán)處理注意 SPSS中指定加權(quán)變量的過程本質(zhì)上是數(shù)據(jù)復(fù)制。對表3-14的蔬菜銷售數(shù)據(jù),如果指定銷售量為加權(quán)變量,那么SPSS將蘿卜這條數(shù)
44、據(jù)復(fù)制1025行,將西紅柿這條數(shù)據(jù)復(fù)制850行,等等。但加權(quán)操作完畢后,數(shù)據(jù)編輯窗口中的數(shù)據(jù)并沒有變化,而僅在狀態(tài)欄中有已經(jīng)加權(quán)的提示信息 一旦指定了加權(quán)變量,那么在以后的分析處理中加權(quán)是一直有效的,直到取消加權(quán)為止。取消加權(quán)應(yīng)在相應(yīng)的窗口中選擇(Do weight cases)選項(xiàng) 通過加權(quán)處理,可以達(dá)到將數(shù)據(jù)編輯窗口中的計(jì)數(shù)數(shù)據(jù)還原為原始數(shù)據(jù)的目的171數(shù)據(jù)拆分SPSS的數(shù)據(jù)拆分與數(shù)據(jù)排序很相似,但也有一個(gè)重要的不同點(diǎn),即數(shù)據(jù)拆分不僅是按指定變量對數(shù)據(jù)進(jìn)行簡單排序,更重要的是根據(jù)指定變量對數(shù)據(jù)進(jìn)行分組,它將為以后所進(jìn)行的分組統(tǒng)計(jì)分析提供便利數(shù)據(jù)拆分將對后面的分析一直起作用,即無論進(jìn)行哪種統(tǒng)
45、計(jì)分析,都將是按拆分變量的不同組分別進(jìn)行分析計(jì)算。如采希望對所有數(shù)據(jù)進(jìn)行整體分析,則需要重新執(zhí)行數(shù)據(jù)拆分,并在相應(yīng)的窗口中選擇Analyze all case項(xiàng)。 對數(shù)據(jù)可以進(jìn)行多重拆分,類似于數(shù)據(jù)的多重排序。多重拆分的次序決定于選擇拆分變量的前后次序172DataSplit File將拆分變量選到此處將分組統(tǒng)計(jì)結(jié)果輸出在同一表格中,以便于不同組之間的比較將分組統(tǒng)計(jì)結(jié)果分別輸出在不同的表格中數(shù)據(jù)編輯窗口中的數(shù)據(jù)已經(jīng)事先按所指定的拆分變量進(jìn)行了排序未排序173例題2.11利用職工情況數(shù)據(jù)選擇職稱和(或)性別變量進(jìn)行數(shù)據(jù)拆分并進(jìn)行計(jì)算各組的基本工資174SPSSSPSS缺失值處理缺失值處理大量的缺
46、失值會(huì)給數(shù)據(jù)分析帶來極大的影響,這就需要采用科學(xué)的方法對缺失值進(jìn)行插補(bǔ) 選擇菜單Transformreplace missing values175將需要插補(bǔ)的變量單擊按鈕送到此處自動(dòng)會(huì)生成一個(gè)新的變量,變量名為原變量名_1選擇插補(bǔ)方法176缺失值插補(bǔ)方法Series meanSeries mean :該變量所有非缺失值的均值Mean of nearby pointsMean of nearby points:該變量相鄰非缺失值的均值Median of nearby pointsMedian of nearby points:該變量相鄰非缺失值的中位數(shù)Linear interpolationL
47、inear interpolation:線性內(nèi)插法(用缺失值前后兩點(diǎn)的中點(diǎn)值做替代,如果前后值有一個(gè)是缺失值,則得不到替換值 )Linear trend at pointLinear trend at point:用線性擬合方式確定替代值,自變量為1-n的數(shù)值177數(shù)據(jù)排秩數(shù)據(jù)排秩是根據(jù)某變量觀測值的大小,按一定的順序排秩,生成一個(gè)代表其秩次的新變量,但原始觀測值本身順序不發(fā)生改變Transformrank cases178需要排秩的變量單擊按鈕送到此處該變量自動(dòng)會(huì)生成一個(gè)新的變量,變量名為R+原變量名選擇分類變量到By框中,如果選擇,系統(tǒng)將按照此變量的不同組別分別進(jìn)行排秩選擇排秩的順序選擇排
48、秩方式選擇相同觀測值排秩方式179例題2.12在職工數(shù)據(jù)中通過數(shù)據(jù)排秩找到不同職稱的最高基本工資對基本工資排秩按照職稱分類180SPSS變量集實(shí)際統(tǒng)計(jì)分析中, SPSS數(shù)據(jù)編輯窗口中的變量會(huì)有幾十甚至上百個(gè).這樣進(jìn)行各種數(shù)據(jù)預(yù)處理和統(tǒng)計(jì)分析時(shí),這些變量都會(huì)列在窗口上供用戶選擇.在如此多的變量中反復(fù)選擇某幾個(gè)變量進(jìn)行某種處理或分析無疑是很麻煩的.此時(shí),簡化變量選擇的操作就顯得非常必要。SPSS變量集就是一種通過減少變量顯示個(gè)數(shù)而簡化變量選擇操作的方式SPSS變量集是存放著許多SPSS變量名的集合。SPSS變量集包括系統(tǒng)變量集和用戶變量集兩大類181系統(tǒng)變量集系統(tǒng)變量集是SPSS系統(tǒng)事先定義好的變量集,包括: ALL VARIAB
溫馨提示
- 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
- 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會(huì)有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
- 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
- 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負(fù)責(zé)。
- 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請與我們聯(lián)系,我們立即糾正。
- 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。
最新文檔
- 二零二五年度成都二手房房源交易稅費(fèi)減免政策解讀合同4篇
- 2025年醫(yī)療網(wǎng)絡(luò)推廣合同
- 2025年家具制作及安裝合同
- 2025年勞務(wù)派遣服務(wù)合同書格式
- 2025年居住小區(qū)規(guī)劃設(shè)計(jì)合同
- 2025年三方倉儲合同
- 二零二五年度教育產(chǎn)品銷售合同英文版制作與海外市場推廣3篇
- 2025年分期宴會(huì)預(yù)訂合同
- 二零二五年度大型模具采購合同及模具研發(fā)合作協(xié)議2篇
- 2025年度農(nóng)業(yè)電商平臺合作推廣合同2篇
- 完整版秸稈炭化成型綜合利用項(xiàng)目可行性研究報(bào)告
- 油氣行業(yè)人才需求預(yù)測-洞察分析
- 《數(shù)據(jù)采集技術(shù)》課件-Scrapy 框架的基本操作
- 2025年河北省單招語文模擬測試二(原卷版)
- 工作計(jì)劃 2025年度醫(yī)院工作計(jì)劃
- 高一化學(xué)《活潑的金屬單質(zhì)-鈉》分層練習(xí)含答案解析
- DB34∕T 4010-2021 水利工程外觀質(zhì)量評定規(guī)程
- 2024年內(nèi)蒙古中考英語試卷五套合卷附答案
- 2024年電工(高級)證考試題庫及答案
- 2024年全國各地中考試題分類匯編:古詩詞閱讀
- 農(nóng)產(chǎn)品質(zhì)量評估與分級
評論
0/150
提交評論