數(shù)據(jù)與SPSS數(shù)據(jù)處理_第1頁
數(shù)據(jù)與SPSS數(shù)據(jù)處理_第2頁
數(shù)據(jù)與SPSS數(shù)據(jù)處理_第3頁
數(shù)據(jù)與SPSS數(shù)據(jù)處理_第4頁
數(shù)據(jù)與SPSS數(shù)據(jù)處理_第5頁
已閱讀5頁,還剩189頁未讀, 繼續(xù)免費(fèi)閱讀

下載本文檔

版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進(jìn)行舉報(bào)或認(rèn)領(lǐng)

文檔簡介

第二章數(shù)據(jù)與SPSS數(shù)據(jù)處理第1節(jié)數(shù)據(jù)第2節(jié)SPSS數(shù)據(jù)文件的建立和管理第3節(jié)SPSS數(shù)據(jù)的預(yù)處理1精選ppt第二章數(shù)據(jù)與SPSS數(shù)據(jù)處理第1節(jié)數(shù)據(jù)2精選ppt200只燈泡使用壽命頻數(shù)分布表使用壽命二百只燈泡的可使用壽命直方圖頻數(shù)3精選ppt關(guān)于改革方案調(diào)查結(jié)果5種軟飲料購買頻數(shù)4精選ppt5精選ppt數(shù)據(jù)的定義現(xiàn)代漢語詞典:數(shù)據(jù)(data)是進(jìn)行各種統(tǒng)計(jì)、計(jì)算、科學(xué)研究和技術(shù)設(shè)計(jì)等所依據(jù)的數(shù)值。數(shù)理統(tǒng)計(jì)學(xué):通過對樣本進(jìn)行觀察或測定的方法,得到的觀察值或變量(variable)就是數(shù)據(jù)。數(shù)據(jù)是原始事實(shí),如員工的姓名、每周的工作小時數(shù)、商店存貨數(shù)量或銷售訂單等。傳統(tǒng)的數(shù)據(jù):狹義的數(shù)據(jù),指用數(shù)值表示的字據(jù),僅能用數(shù)字表示現(xiàn)代的數(shù)據(jù):廣義的數(shù)據(jù),指代表真實(shí)世界的客觀事物,可以是數(shù)字、文字、圖像、聲音等。數(shù)據(jù)是簡單的客觀事實(shí),除它本身以外沒有什么價(jià)值。但如果在各個數(shù)據(jù)之間定義了相互的關(guān)系,它們就具有了價(jià)值。6精選ppt數(shù)據(jù)的類型按照數(shù)據(jù)的表現(xiàn)形式,廣義的數(shù)據(jù)常分為4種基本數(shù)據(jù),包括數(shù)字、文字、字母、符號和字符圖形數(shù)據(jù),包括圖形、圖片聲音數(shù)據(jù),包括聲音、噪聲和音調(diào)視覺數(shù)據(jù),包括動作、脈沖、電磁波、信號和動畫當(dāng)這些事實(shí)按照一定意義的方式組織和安排在一起,就成為信息7精選ppt數(shù)據(jù)的類型正確理解所研究變量的類型對選擇適當(dāng)?shù)慕y(tǒng)計(jì)分析方法至關(guān)重要對變量分類可以根據(jù)不同標(biāo)準(zhǔn)進(jìn)行獲得方式觀測水平取值性質(zhì)8精選ppt(1)根據(jù)數(shù)據(jù)的獲得方式觀測數(shù)據(jù)(observeddata):取值直接來自研究者的觀察、測量或調(diào)查表現(xiàn)物質(zhì)特征的數(shù)據(jù)為客觀數(shù)據(jù)。如空氣污染物、某商品的物價(jià)表現(xiàn)精神屬性的數(shù)據(jù)為主觀數(shù)據(jù)(是客觀數(shù)據(jù)的能動反映和抽象),如人們對某事物的反映按照數(shù)據(jù)來源,有對離散數(shù)的觀測數(shù)據(jù)——計(jì)數(shù)數(shù)據(jù),人數(shù)、桌椅數(shù);有對連續(xù)數(shù)的觀測數(shù)據(jù)——計(jì)量數(shù)據(jù),如溫度、長度。衍生數(shù)據(jù)(deriveddata):又稱之為二手?jǐn)?shù)據(jù),其來源于他人直接觀察和調(diào)查,或者是觀測(初級)數(shù)據(jù)的再處理,經(jīng)過高度抽象,是高級的客觀數(shù)據(jù)。客觀數(shù)據(jù)經(jīng)人為的加工,即轉(zhuǎn)化為衍生數(shù)據(jù)衍生數(shù)據(jù)取值往往是通過某種數(shù)學(xué)方法根據(jù)觀測量計(jì)算出來的,如平均氣溫、平均物價(jià)等。9精選ppt(2)根據(jù)數(shù)據(jù)的觀測水平定量數(shù)據(jù)(quantitativedata)連續(xù)數(shù)據(jù)(continuousdata)(氣溫、氣壓)離散數(shù)據(jù)(discretedata)(上課人數(shù)、上班人數(shù))順序數(shù)據(jù)(ordinaldata)(比賽名次、考試成績名次等)連續(xù)數(shù)據(jù)可轉(zhuǎn)化為離散數(shù)據(jù),也可轉(zhuǎn)化為順序數(shù)據(jù);但順序數(shù)據(jù)不能轉(zhuǎn)化為離散數(shù)據(jù)或連續(xù)數(shù)據(jù)。為方便起見,年齡數(shù)據(jù)、時間(天、年)、貨幣(價(jià)格、工資)等數(shù)據(jù)雖然是連續(xù)數(shù)據(jù),也常常作為離散數(shù)據(jù)來處理。定性數(shù)據(jù)(qualitativedata)又叫做類型數(shù)據(jù)(categoricaldata)定量數(shù)據(jù)與定性數(shù)據(jù)的根本區(qū)別在于前者取值有明確的順序意義,而后者取值僅具有屬性特征(今天是否下雨、有無球賽、班里是否開會)10精選ppt在使用有關(guān)統(tǒng)計(jì)方法時要注意具體方法的要求,與所研究數(shù)據(jù)之間的一致性根據(jù)測量水平劃分的各類數(shù)據(jù)之間的最重要差別在于它們的信息量不同。測量水平最高的數(shù)據(jù)是連續(xù)量,它包含的信息量在所有數(shù)據(jù)中為最高,其次是離散量和順序量,最后才是類型量。不同數(shù)理統(tǒng)計(jì)方法適用于不同類型的數(shù)據(jù)用針對高測量水平數(shù)據(jù)的方法去分析低測量水平的數(shù)據(jù),導(dǎo)致錯誤的結(jié)論使用為低測量水平數(shù)據(jù)設(shè)計(jì)的方法去檢驗(yàn)高測量水平數(shù)據(jù),會造成數(shù)據(jù)信息的浪費(fèi)11精選ppt不同類型數(shù)據(jù)之間的轉(zhuǎn)換不同類型數(shù)據(jù)之間的轉(zhuǎn)換是允許的,但此類轉(zhuǎn)換必然是單向的。由于不同數(shù)據(jù)中包含的信息量不同,只可能將觀測水平較高的數(shù)據(jù)轉(zhuǎn)換為觀測水平較低的類型在進(jìn)行統(tǒng)計(jì)分析時最常用的數(shù)據(jù)類型轉(zhuǎn)換是將連續(xù)量或離散量變換為順序量,即所謂求秩運(yùn)算。鑒于此類轉(zhuǎn)換將導(dǎo)致數(shù)據(jù)信息的損失,非必要時盡量不要使用。12精選ppt(3)按照數(shù)據(jù)的取值(性質(zhì))能否由觀察者加以控制,可將其分成隨機(jī)數(shù)據(jù)(randomdata)和確定性數(shù)據(jù)(fixeddata)兩大類數(shù)理統(tǒng)計(jì)方法的研究對象是隨機(jī)數(shù)據(jù)。隨機(jī)數(shù)據(jù)的主要特點(diǎn)在于它們的每一次取值都是不確定的,因此研究者不可能控制也無法預(yù)知每個取值的確切數(shù)值。另一方面,隨機(jī)數(shù)據(jù)在大量觀察中的取值又有其特定的規(guī)律性,而數(shù)理統(tǒng)計(jì)方法就是要揭示這種規(guī)律性。確定性數(shù)據(jù)本身不能成為數(shù)理統(tǒng)計(jì)方法研究的直接對象,但當(dāng)研究涉及兩個或兩個以上數(shù)據(jù)之間的關(guān)系時,確定性數(shù)據(jù)仍有其特定的地位(方差分析中的因素或回歸分析中的自變量)。13精選ppt數(shù)據(jù)的計(jì)量--尺度

在現(xiàn)代科學(xué)研究中,對研究對象一般都要采取測量的方法進(jìn)行觀察。測量的尺度,就是用于觀察研究對象和處理資料的測量方法。資料的統(tǒng)計(jì)分析處理,就是要運(yùn)用這些尺度測量被研究對象。有的事物、現(xiàn)象只能或只需對其屬性進(jìn)行分類(稱之為定性分析),有些則可以或要求必須用比較精確的數(shù)字加以計(jì)量(稱之為定量分析)。由粗略到精確可分為4個層次,定類尺度(nominalscale)、定序尺度(Ordinalscale)、定距尺度(intervalscale)和定比尺度(ratioscale)共4級。每一級都代表了測量的一個層次。14精選ppt數(shù)據(jù)的計(jì)量的四種尺度定類尺度

nominalscale定序尺度

ordinalscale定距尺度

intervalscale定比尺度

ratioscale按照某屬性對事物進(jìn)行平行的分類。(=、≠)對事物類別間等級或順序差別的測度。(<、>)對事物類別或次序之間差距的測度。

(+、-)對事物類別或次序之間差距及差別程度的測度。

(×、÷)15精選ppt1.定類尺度定類尺度也稱作名義尺度,是測量尺度中層次最低的計(jì)量尺度,是僅能區(qū)分出不同類別的測量尺度。按照某種屬性把事物進(jìn)行分類,是判斷“屬于/不屬于”的基準(zhǔn)。常用于測量定類數(shù)據(jù),如性別分為男和女兩類。定類尺度在統(tǒng)計(jì)處理時也可用數(shù)字表示,但這些數(shù)字只是由研究者任意規(guī)定的某一類別的代號,不具任何數(shù)學(xué)意義。如對性別可以規(guī)定女是0、男是1。這里的數(shù)據(jù)不能區(qū)分大小或進(jìn)行加減乘除數(shù)學(xué)運(yùn)算,只能計(jì)算各類別的頻數(shù)與頻率。在市場調(diào)查中,定類尺度常被用來度量被調(diào)查的品牌、屬性、商店等對象。16精選ppt變量變量值編碼性別男女12人種白黃棕黑123417精選ppt定類尺度的兩個特點(diǎn):它僅僅只是區(qū)別不同事物的性質(zhì)而沒有任何數(shù)量比較關(guān)系,在代號上也沒有任何量的關(guān)系,因而不能進(jìn)行數(shù)的比較和運(yùn)算;這種代號具有隨意性,其符號既可用數(shù)字也可用英文、拼音字母等。在對它們進(jìn)行排列時,可以按研究者認(rèn)定的形式進(jìn)行。

定類尺度的設(shè)計(jì)必須遵循兩個原則:第一,規(guī)定的類別必須具有窮盡性,即所有被測量的現(xiàn)象都可分別納入這些類別;第二,各類別必須是相互排斥的,一種現(xiàn)象只能歸入一類,而不能出現(xiàn)同時歸入兩類的情況。18精選ppt2.定序尺度定序尺度又叫順序尺度,是指能將社會指標(biāo)排列出大小或高低秩序的測量尺度。它比定類尺度高級一些,不僅能將事物分成不同的類別,還可以確定這些類別的優(yōu)劣或順序,是判斷“A比B···”的基準(zhǔn)。用于測量定序數(shù)據(jù)如文化程度可分成文盲、小學(xué)、初中、高中、大專、大學(xué)、研究生等7級,每一級都較前一級更高,所給編號分別為1、2,3,4、5,6、7。定序數(shù)據(jù)可以計(jì)算各類別的頻數(shù)與頻率可以比較大小,但不能進(jìn)行加減乘除數(shù)學(xué)運(yùn)算。如根據(jù)文化程度排序,可以判斷初中文化程度讀書時間多于小學(xué)而低于高中,并用數(shù)字符號表示為小學(xué)<初中<高中,但無法判斷初中與小學(xué)受教育年限的差別是否同高中與初中受教育年限的差別一樣大。定序尺度常被用來度量相對態(tài)度、意見、感覺和偏好。19精選ppt定序尺度的特點(diǎn)定序數(shù)據(jù)在統(tǒng)計(jì)處理上,其代號也是由研究者任意確定的,使用符號既可是數(shù)字,也可是別的字符。和定類數(shù)據(jù)不同的是,它的排列順序不能有任意性,只能從小到大或由大到小。定序尺度仍然不能進(jìn)行數(shù)學(xué)運(yùn)算,因?yàn)檫@類運(yùn)算不僅無法進(jìn)行,而且也不具有任何的實(shí)際意義。定序尺度是行為學(xué)研究中最常用的測量尺度。如在態(tài)度測量中要問及調(diào)查對象是否喜歡跳舞時就可以列出非常喜歡、喜歡、一般、不喜歡、厭惡等5個等級,并可用代號來表示。使用定序尺度時需要注意:當(dāng)定序尺度之外的因素引入實(shí)際測量之后,原測量的對象會導(dǎo)致由定序數(shù)據(jù)變成定類數(shù)據(jù),從而降低測量的層次。20精選ppt變量編碼產(chǎn)品等級一等品二等品三等品123對事物的態(tài)度很滿意滿意中立不滿意反對12345變量值21精選ppt3.定距尺度定距尺度也稱間隔尺度,是指能用某種計(jì)量單位去測定研究現(xiàn)象的測量尺度。它用于測量定距數(shù)據(jù),度量層次高于定序尺度,它不僅能將事物分成不同類別并進(jìn)行排序,而且可以準(zhǔn)確地計(jì)量它們間的差距。用定距尺度測量的樣本數(shù)據(jù)間的距離是可以確定的,因而不僅可以比較樣本數(shù)據(jù)的大小,而且可以比較各數(shù)據(jù)間差別的大小。如溫度,90度比80度高10度。其中的數(shù)據(jù)除可以分類與比較大小以外,還可以進(jìn)行加減運(yùn)算。22精選ppt定距尺度特征由于沒有絕對零點(diǎn),因此乘除運(yùn)算是沒有意義的,攝氏溫度是個很好的例子。如當(dāng)三個地點(diǎn)的氣溫分別為20度、25度、40度時,不僅知道他們的氣溫定序排列是25度大于20度而小于40度,而且也知道25度與20度的差別小于25度與40度的差別。由于定距數(shù)據(jù)有統(tǒng)一計(jì)算單位,故可以進(jìn)行加減運(yùn)算,但不能做乘除運(yùn)算,因?yàn)樽龀顺\(yùn)算要一個表示真正是“無”的絕對零,如氣溫為0度(嚴(yán)格地講,溫度有絕對零度),就不能說其沒有溫度,也不能說溫度數(shù)為30度的氣溫,是溫度數(shù)為15度的氣溫2倍。23精選ppt4.定比尺度定比尺度也稱比率尺度,是最高層次的度量尺度,除具有以上3種尺度的所有特性以外,還有絕對零點(diǎn)。因此,除了可以分類、比較大小以及加減運(yùn)算以外,還可做乘除運(yùn)算,可以計(jì)量測度值間的比值。如以“元”作為計(jì)量單位來測定人們的收入,對于收入,0表示無收入,在此是有實(shí)際意義的,不僅可以計(jì)算500元比300元也是多200元,還可以計(jì)算1000元是500元的2倍。在市場調(diào)查中,銷售額、成本、市場份額、消費(fèi)者數(shù)等變量都是定比數(shù)據(jù)。定比尺度一般都是連續(xù)性數(shù)據(jù)。例如收入,不僅可有從40、41、42、43直到100元之別,而且每1元之間,還可有精確到分的100個點(diǎn)相連接,正因?yàn)槿绱耍ū瘸叨纫话闶怯糜?jì)算單位的量度值作為數(shù)據(jù)值,具有客觀的確定性,而沒有隨意性。24精選ppt6枚3枚25精選ppt小結(jié)變量類型的劃分26精選ppt品質(zhì)型變量數(shù)量型變量10青少年身高體重表品質(zhì)型變量品質(zhì)型變量數(shù)量型變量關(guān)于投票選舉一次抽樣調(diào)查的數(shù)據(jù)陣列27精選ppt以上4種尺度對事物的度量層次是由低級到高級,由粗略到精確逐步遞進(jìn)的,定類尺度是最低層次的測量尺度,定序尺度較定類尺度則高一層次,它包括了定類尺度的特性。定距尺度較定類尺度又高一層次,而且也包括了前兩者的特性。由于它們測量的層次、特性的不同,在統(tǒng)計(jì)處理中便針對有不同類型變量的統(tǒng)計(jì)方法。高層次計(jì)量尺度的數(shù)據(jù)可以轉(zhuǎn)化成低層次計(jì)量尺度的數(shù)據(jù),但反過來,低層次計(jì)量尺度的數(shù)據(jù)不能轉(zhuǎn)化成高層次計(jì)量尺度的數(shù)據(jù)。不同的轉(zhuǎn)換方法,高層次計(jì)量尺度可產(chǎn)生不同形式、不同數(shù)量的低層次計(jì)量數(shù)值,尺度轉(zhuǎn)換就會有信息損失,所以除了高層次計(jì)量尺度數(shù)據(jù)質(zhì)量比較差,或者研究一致性的需要,一般不要隨意轉(zhuǎn)換尺度。28精選ppt第二章數(shù)據(jù)與SPSS數(shù)據(jù)處理第2節(jié)SPSS數(shù)據(jù)文件的建立和管理29精選ppt對數(shù)據(jù)類型數(shù)據(jù)文件的建立原始資料數(shù)據(jù)錄入:文本格式

電子表格

用SPSS進(jìn)行數(shù)據(jù)錄入

大樣本---數(shù)據(jù)庫二手資料數(shù)據(jù)讀取:用SPSS讀取各種格式的數(shù)據(jù)30精選ppt數(shù)據(jù)錄入三步曲確定變量,定義各變量屬性錄入數(shù)據(jù)檢查錄入錯誤31精選pptSPSS數(shù)據(jù)文件的特點(diǎn)SPSS數(shù)據(jù)文件是一種有結(jié)構(gòu)的數(shù)據(jù)文件數(shù)據(jù)結(jié)構(gòu):記錄數(shù)據(jù)變量的名稱、類型、變量寬度、小數(shù)位數(shù)、變量名標(biāo)簽、變量值標(biāo)簽、缺失值、顯示寬度、對齊方式和度量尺度等必要信息數(shù)據(jù)內(nèi)容:待分析的具體數(shù)據(jù)建立SPSS數(shù)據(jù)文件描述數(shù)據(jù)的結(jié)構(gòu)--VariableView錄入編輯數(shù)據(jù)--DataView32精選pptSPSS數(shù)據(jù)的組織方式原始數(shù)據(jù)的組織方式計(jì)數(shù)數(shù)據(jù)(頻數(shù)數(shù)據(jù))的組織方式33精選ppt原始數(shù)據(jù)的組織方式數(shù)據(jù)編輯窗口中的一行稱為一個個案或記錄(Case),所有個案組成SPSS數(shù)據(jù)文件的內(nèi)容數(shù)據(jù)編輯窗口的一列稱為一個變量(Variable),每個變量都有一個名字,稱為變量名,它是訪問和分析SPSS每個變量的唯一標(biāo)志34精選ppt原始數(shù)據(jù)的組織方式35精選ppt頻數(shù)數(shù)據(jù)的組織方式在頻數(shù)數(shù)據(jù)的組織方式中,數(shù)據(jù)編輯窗口中的一行為變量的一個分組(或多個變量交叉分組下的一個分組)所有行囊括了該變量的分組情況(或多個變量交叉下的所有分組情況)。數(shù)據(jù)編輯窗口中的一列仍為一個變量,代表某個問題(或某個方面及頻數(shù))36精選ppt頻數(shù)數(shù)據(jù)的組織方式37精選ppt例題2.1關(guān)于計(jì)算機(jī)課程教學(xué)意見的樣本數(shù)據(jù)38精選ppt組織數(shù)據(jù)39精選ppt練習(xí)2.1頻數(shù)數(shù)據(jù)(計(jì)數(shù)數(shù)據(jù))設(shè)置三個變量:專業(yè)方向、性別、人數(shù)40精選ppt組織數(shù)據(jù)41精選pptSPSS數(shù)據(jù)的結(jié)構(gòu)和定義方法SPSS數(shù)據(jù)的結(jié)構(gòu)是對SPSS每列變量及其相關(guān)屬性的描述變量名數(shù)值類型寬度小數(shù)位數(shù)變量標(biāo)簽數(shù)值標(biāo)簽缺失值列寬對齊方式數(shù)據(jù)量度42精選ppt變量名(Variablename)變量名是變量存取的唯一標(biāo)志起名規(guī)則:不多于8個字符組成首字符應(yīng)以英文字母開頭,后面可以跟除了!、?、*之外的字母或數(shù)字。下劃線、圓點(diǎn)不能為變量名的最后一個字符不區(qū)分大小寫允許漢字作為變量名默認(rèn)變量名為VARn,如:var00001變量名不能與SPSS內(nèi)部特有的具有特定含義的保留字同名,如ALL,BY,AND,NOT,OR等43精選ppt數(shù)據(jù)類型(TYPE)數(shù)據(jù)類型是指每個變量取值的類型三種基本數(shù)據(jù)類型數(shù)值型(1)標(biāo)準(zhǔn)型(Numeric)(2)科學(xué)記數(shù)法型(ScientificNotation)(3)逗號型(Comma)(4)圓點(diǎn)型(Dot)(5)美元符號型(Dollar)(6)用戶自定義型(CustomCurrency)字符型(String)日期型(Date)44精選ppt列寬(Width),小數(shù)位寬(Decimals)

顯示寬度(Columns)每種類型的變量都有自己的列寬、小數(shù)位和顯示寬度列寬是變量允許的最大字符位數(shù)顯示寬度是數(shù)據(jù)編輯窗口中顯示每列的字符位數(shù)通常這兩個寬度是一致的數(shù)據(jù)的顯示并不影響數(shù)據(jù)的存儲,也不影響數(shù)據(jù)的計(jì)算45精選ppt數(shù)值型--標(biāo)準(zhǔn)型(Numeric)SPSS默認(rèn)的數(shù)據(jù)類型默認(rèn)的顯示寬度為8位,包括正負(fù)符號位、小數(shù)點(diǎn)和小數(shù)位在內(nèi)小數(shù)位默認(rèn)為2位如果數(shù)據(jù)的實(shí)際寬度大于8位,spss將自動按照科學(xué)計(jì)數(shù)法顯示

12345678

-1234.56

46精選ppt數(shù)值型--科學(xué)記數(shù)法型(ScientificNotation)表示很大或很小的數(shù)據(jù)120表示為1.2E2,0.0012表示為1.2E-3默認(rèn)的顯示寬度為8位,包括正負(fù)符號位、字母E和跟在其后的正負(fù)符號及冪次數(shù)字在內(nèi)輸入時可按標(biāo)準(zhǔn)方式輸入,SPSS會自動進(jìn)行轉(zhuǎn)換

1.2E+00247精選ppt數(shù)值型--逗號型(Comma)從個位開始三位一個逗號默認(rèn)的顯示寬度為8位,逗號包括在內(nèi)小數(shù)位默認(rèn)為2位輸入時可按標(biāo)準(zhǔn)方式輸入,SPSS會自動進(jìn)行轉(zhuǎn)換1234.5671,234.5748精選ppt數(shù)值型--圓點(diǎn)型(Dot)從個位開始三位一個圓點(diǎn)分隔以逗號作為整數(shù)和小數(shù)部分的分隔符默認(rèn)列寬8,小數(shù)位寬2輸入時可按標(biāo)準(zhǔn)方式輸入,SPSS會自動進(jìn)行轉(zhuǎn)換1.234,5649精選ppt數(shù)值型--美元符號型(Dollar)表示貨幣數(shù)據(jù)前附加美元符號顯示格式很多50精選ppt數(shù)值型--用戶自定義型(CustomCurrency)51精選ppt字符型(String)由一個字符串組成,默認(rèn)顯示寬度為8個字符區(qū)分大小寫字母不能夠進(jìn)行算術(shù)運(yùn)算在SPSS命令處理過程中應(yīng)用一對雙引號括起來在輸入數(shù)據(jù)時不應(yīng)輸入雙引號52精選ppt日期型(Date)用來表示日期或者時間53精選ppt變量名標(biāo)簽(Variablelabel)對變量名含義的進(jìn)一步解釋說明,它可以增強(qiáng)變量名的可視性和統(tǒng)計(jì)分析結(jié)果的可讀性變量名標(biāo)簽可用中文總長度可達(dá)120個字符,但在統(tǒng)計(jì)分析結(jié)果的顯示中一般不能顯示如此長的變量名標(biāo)簽信息可省略54精選ppt變量值標(biāo)簽(Value)對變量取值含義的解釋說明信息,對于定類型數(shù)據(jù)和定序性數(shù)據(jù)尤為重要可以用中文可省略變量值輸入框變量值標(biāo)簽輸入框55精選ppt缺失值(Missing)缺失值:漏填數(shù)據(jù)明顯錯誤的數(shù)據(jù)對缺失值的一般處理事先指定:指定某個特定值為缺失值(用戶缺失值)其他處理方法,如:以均值、眾數(shù)替代等SPSS缺失值用戶缺失值系統(tǒng)缺失值:用圓點(diǎn)表示;字符型變量中空格不是系統(tǒng)缺失值56精選pptSPSS用戶缺失值對字符型或數(shù)值型變量,用戶缺失值可以是1至3個特定的離散值(Discretemissingvalues)對一個數(shù)值型變量,用戶缺失值可以在一個連續(xù)的閉區(qū)間內(nèi)并同時再附加一個區(qū)間以外的離散值(Rangeplusoneoptionaldiscrete)57精選ppt變量對齊格式(Align)定義顯示對齊方式右對齊、左對齊和中間對齊數(shù)值型變量默認(rèn)為右對齊字符型變量默認(rèn)為左對齊58精選ppt計(jì)量尺度(Measure)定距型數(shù)據(jù)(scale):一般為數(shù)值型數(shù)據(jù) 如:收入、人數(shù)、身高定序型數(shù)據(jù)(ordinal):有固有大小或高低順序,數(shù)值型或字符型數(shù)據(jù)。 如:職稱、年齡段定類型數(shù)據(jù)(nominal):沒有有固有大小或高低順序,一般為數(shù)值或字符表示的分類數(shù)據(jù)

如:性別、民族59精選ppt定義SPSS數(shù)據(jù)文件結(jié)構(gòu)操作方法:利用變量視圖如何查看變量定義的情況菜單選項(xiàng):

Utilities->Variables60精選ppt單擊VariableView進(jìn)入;定義變量名定義變量類型定義變量名標(biāo)簽變量值標(biāo)簽定義度量尺度定義顯示寬度定義對齊方式

定義變量類型對話框

定義變量值標(biāo)簽對話框定義變量缺省值對話框61精選ppt例題2.2問卷示例問題的類型:單選題----3,5數(shù)值型開放題----1,7文字型開放題----2日期型開放題----4多選題----662精選ppt開放題的錄入1序號

2姓名

4出生年月日(mm/dd/yyyy)63精選ppt單選題1----選項(xiàng)沒有順序之分:不含其它:字符型錄入:字符加值標(biāo)簽數(shù)值型錄入:數(shù)值加值標(biāo)簽含其它:兩個變量來錄入(“其它”選項(xiàng)中如需填寫需單獨(dú)變量)單選題2----選項(xiàng)有順序之分?jǐn)?shù)值型錄入:數(shù)值加值標(biāo)簽是否喜歡足球1非常喜歡2喜歡3無所謂4不喜歡5非常不喜歡單選題的錄入64精選ppt65精選ppt一份簡單的調(diào)查問卷單項(xiàng)選擇題提供幾個備選擇答案,從其中選擇一個答案變量類型:分類數(shù)據(jù)、定序數(shù)據(jù)數(shù)據(jù)類型:字符型填空題變量類型:定距數(shù)值型數(shù)據(jù)類型:數(shù)值型66精選ppt一份簡單的調(diào)查問卷多項(xiàng)選擇題提供幾個備選擇答案,從其中選擇多個答案在下列品牌中您信任哪些品牌?伊利、蒙牛、光明、銀橋、歐德寶、德運(yùn)被診斷為高血壓后你采取了以下哪些輔助治療手段?高考時報(bào)考學(xué)校

(1)北京大學(xué)(2)清華大學(xué)(3)人民大學(xué)(4)北京理工大學(xué)

(5)北京師范大學(xué)(6)北京外國語大學(xué)67精選ppt多項(xiàng)選擇題的處理方法多項(xiàng)選擇題不能在SPSS中直接存儲,因?yàn)镾PSS的一個變量只能有一個取值思路將一個問題定義成幾個變量,用這幾個變量來描述該問題的幾個可能被選擇的答案編碼方式多選項(xiàng)二分法(multipledichotomizemethod)多選項(xiàng)分類法(multiplecategorymethod)68精選ppt將每個答案作為一個變量,每個變量只有兩個取值(0或1)。多選項(xiàng)二分法69精選ppt預(yù)先估計(jì)多選項(xiàng)問題可能被選擇的最多答案數(shù).為每個答案建立一個變量,取值為多選項(xiàng)問題的可選答案多選項(xiàng)分類法70精選ppt多選二分法則有6個選項(xiàng),故應(yīng)設(shè)6個變量,運(yùn)用0-1編碼方法編碼,即:1,0,1,0,1,1。多選分類法,則編碼為1,3,5,6,0,0。135671精選ppt問題2:擇業(yè)中考慮的主要因素(多選)1經(jīng)濟(jì)收入2專業(yè)對口3發(fā)展前途4地理區(qū)位5個人愛好6風(fēng)險(xiǎn)大小7勞動強(qiáng)度8社會福利9其他編碼應(yīng)為:1,0,1,1,1,0,1,1,0?;?,3,4,5,7,8,0,0,0。72精選ppt136問題3:您擇業(yè)中考慮的主要因素有(限選三項(xiàng))1經(jīng)濟(jì)收入2專業(yè)對口3發(fā)展前途4地理區(qū)位5個人愛好6風(fēng)險(xiǎn)大小7勞動強(qiáng)度8社會福利9社會地位10其他

因?yàn)橄捱x三項(xiàng),故應(yīng)設(shè)三個變量,編碼依次為1,3,6。73精選ppt練習(xí)2.2根據(jù)居民儲蓄調(diào)查問卷,建立SPSS格式的數(shù)據(jù)文件74精選pptSPSS數(shù)據(jù)的錄入與保存錄入時應(yīng)注意:黑框確定當(dāng)前數(shù)據(jù)單元錄入帶有變量值標(biāo)簽(Value)的數(shù)據(jù):手工輸入代碼屏幕顯示變量值標(biāo)簽,在下拉菜單中選擇在View-->ValueLabels中切換75精選pptSPSS數(shù)據(jù)的編輯定位插入刪除修改復(fù)制在數(shù)據(jù)視圖中進(jìn)行76精選pptSPSS數(shù)據(jù)的定位目的:將當(dāng)前數(shù)據(jù)單元定位到某個特定的單元中兩種定位方式:按個案號碼定位菜單:Data->Gotocase->輸入樣本號->確認(rèn)輸入要尋找觀測量序號77精選ppt2.按變量值定位:將當(dāng)前單元定位在某變量列的任何一個個案上選擇菜單Edit->Find,出現(xiàn)如下對話框輸入定位變量值并確認(rèn)SPSS自動對指定的變量進(jìn)行搜索,并將當(dāng)前單元定位到與定位變量值相等的第一個個案上。SPSS數(shù)據(jù)的定位78精選ppt插入和刪除一個個案插入一個個案:在數(shù)據(jù)編輯窗口的某個個案前插入一個新個案將當(dāng)前數(shù)據(jù)單元確定在一個個案上選擇菜單Data--InsertCase(或工具欄插入個案圖標(biāo)按鈕)刪除一個個案:在欲刪除的個案號碼上單擊鼠標(biāo)左鍵,于是待刪除的個案數(shù)據(jù)全部呈藍(lán)色顯示單擊鼠標(biāo)右鍵,從彈出菜單中選擇clear選項(xiàng)79精選ppt插入和刪除一個變量插入一個變量:在數(shù)據(jù)編輯窗口的某個變量前插入一個新變量將當(dāng)前數(shù)據(jù)單元確定在一個變量上選擇菜單Data--InsertVarible(或工具欄插入變量圖標(biāo)按鈕)刪除一個變量:在欲刪除的變量名上單擊鼠標(biāo)左鍵,于是待刪除的個案數(shù)據(jù)全部呈藍(lán)色顯示單擊鼠標(biāo)右鍵,從彈出菜單中選擇clear選項(xiàng)80精選ppt數(shù)據(jù)的移動、復(fù)制和刪除與一般的應(yīng)用程序相同選擇操作對象(變量、個案、若干連續(xù)單元等)剪切:Edit+Cut(Ctrl+X)復(fù)制:Edit+Copy(Ctrl+C)粘貼:Edit+Paste(Ctrl+V)恢復(fù)刪除或修改前數(shù)據(jù)Edit+Undo(或工具欄Undo圖標(biāo)按鈕)81精選ppt插入變量與刪除變量插入與刪除觀測量數(shù)據(jù)的剪切、粘貼與復(fù)制1.插入變量在添加處單擊Var,單擊右鼠標(biāo)鍵出現(xiàn)右側(cè)對話框,單擊InsertVariables2.刪除變量1.插入觀測量在添加處單擊觀測量,單擊右鼠標(biāo)鍵出現(xiàn)右側(cè)對話框,單擊InsertCase2.刪除觀測量剪切復(fù)制粘貼若想恢復(fù),打開Edit---Undo82精選pptSPSS支持的數(shù)據(jù)格式1、SPSS文件格式,擴(kuò)展名為.sav2、Excel格式文件,擴(kuò)展名為.xls3、dbf格式文件,擴(kuò)展名為.dbf4、文本格式文件,擴(kuò)展名為.dat注意:有些信息會丟失SPSS數(shù)據(jù)的保存83精選pptSPSS數(shù)據(jù)的保存基本操作File--Save,對于新的:提示文件名和類型;對于舊的,覆蓋原來的,不再提問File+SaveAs,另存一個數(shù)據(jù)文件,也有格式(類型)問題Variable按鈕允許用戶指定保存哪些變量,不保存哪些變量,變量名前畫叉的變量將被保存到磁盤中84精選pptSPSS數(shù)據(jù)的保存基本操作將數(shù)據(jù)保存為Excel文件格式時,Writevariablesnamestospreadsheet選項(xiàng)呈可用狀態(tài),它的作用是指定是否將SPSS變量名寫入Excel工作表的第一行上Savevaluelabelswheredefinedinstedofdatavalve選項(xiàng)呈可用狀態(tài),它的作用是指定是否在Excel工作表中用變量值標(biāo)簽來替代變量值85精選ppt讀取其他格式的數(shù)據(jù)文件SPSS能夠直接讀取其他格式的數(shù)據(jù)文件,并將其保存為SPSS格式的數(shù)據(jù)直接讀取其他格式的數(shù)據(jù)文件:(1)選擇菜單File+Open+Data;(2)選擇數(shù)據(jù)文件的類型,并輸入數(shù)據(jù)文件名使用數(shù)據(jù)庫查詢打開利用通用數(shù)據(jù)庫ODBC接口讀取數(shù)據(jù)文件在9.0及以前版本中非常重要使用文本向?qū)ёx入文本文件:選擇菜單File+ReadTextData86精選ppt直接打開選擇菜單File==>Open==>Data或直接單擊快捷工具欄上的OpenFile按鈕文件類型87精選ppt讀取EXCEL文件SPSS默認(rèn)將Excel工作表中的全部數(shù)據(jù)讀到SPSS數(shù)據(jù)編輯窗口可以指定僅讀取工作表中某個區(qū)域內(nèi)的數(shù)據(jù)(如A5:B10)工作表上的一行數(shù)據(jù)為SPSS中的一個個案如果Excel工作表文件第一行或指定讀取區(qū)域內(nèi)的第一行存儲了變量名信息,則應(yīng)選擇Readvariablenames項(xiàng),即以第一行的文字信息作為SPSS的變量名,否則不選88精選ppt讀取dbase文件字段名、字段類型自動轉(zhuǎn)成SPSS數(shù)據(jù)文件中的變量名和類型一條記錄為一個個案89精選ppt使用文本導(dǎo)入向?qū)ёx入文本文件File==>ReadTextData該功能在SPSS中已被整合到了OpenFile對話框中,之所以在菜單上保留該條目的原因是讀入純文本的情況非常普遍,放在這里更加醒目例:現(xiàn)有一數(shù)據(jù)文件以純文本的形式保存,且第一行為變量名,請將其讀入SPSS。在File==>ReadTextData對話框選中相應(yīng)的文件名并單擊“確定”,系統(tǒng)會自動啟動文本導(dǎo)入向?qū)υ捒?0精選pptSpss是否已經(jīng)正確的識別和分割了數(shù)據(jù)項(xiàng)91精選ppt數(shù)據(jù)間如何分割數(shù)據(jù)文件的第一行上是否有變量名92精選ppt數(shù)據(jù)部分從文本文件的第幾行開始個案數(shù)據(jù)在文本文件中是如何安排的93精選ppt指定文本文件的分割符號字符型數(shù)據(jù)表示方法94精選ppt對隨后出現(xiàn)的兩個窗口中的問題,通常不必回答。95精選ppt對隨后出現(xiàn)的兩個窗口中的問題,通常不必回答。96精選ppt使用數(shù)據(jù)庫查詢打開SPSS可以直接打開許多類型的數(shù)據(jù)文件,但這并不是說它可以打開所有類型的數(shù)據(jù)文件SPSS還提供了另一個適用范圍更廣、但使用上較為專業(yè)的數(shù)據(jù)接口--數(shù)據(jù)庫查詢SPSS在這里使用的是一種叫ODBC(OpenDataBaseCapture)的數(shù)據(jù)接口,該接口被大多數(shù)數(shù)據(jù)庫軟件和辦公軟件(如MSOffice)支持,通過它,應(yīng)用程序可以直接訪問以結(jié)構(gòu)化查詢語言(SQL)做為數(shù)據(jù)訪問標(biāo)準(zhǔn)的數(shù)據(jù)庫管理系統(tǒng)由于SPSS10.0可以直接打開EXCEL所有系列的數(shù)據(jù)文件,因此數(shù)據(jù)庫查詢接口的用處不是很大。但是,在9.0及以前的版本中,該查詢?nèi)允侵苯哟蜷_EXCEL95、97及2000數(shù)據(jù)文件的唯一辦法97精選ppt使用數(shù)據(jù)庫查詢打開ODBC數(shù)據(jù)引擎是獨(dú)立于各種應(yīng)用軟件,直接安裝到Windows系統(tǒng)中的,因此你所用的系統(tǒng)中ODBC所支持的數(shù)據(jù)類型取決于所安裝的ODBC引擎的情況。大多數(shù)支持該接口的軟件都會在安裝光盤上附送該引擎的安裝文件(如MSOffice)選擇菜單File==>OpenDatabase==>NewQuery,系統(tǒng)會彈出數(shù)據(jù)庫向?qū)У牡谝粋€窗口,其中會列出你使用的機(jī)器上已安裝的所有數(shù)據(jù)庫驅(qū)動程序,選中所需的數(shù)據(jù)源,然后單擊下一步,向?qū)徊揭徊降奶崾灸闳绾巫觯敝翆?shù)據(jù)讀入SPSS。98精選pptSPSS數(shù)據(jù)文件合并當(dāng)數(shù)據(jù)量較多時經(jīng)常會把一份大的數(shù)據(jù)分成幾個小的部分,由幾個錄入員分別錄入合并:首先將其中的某個數(shù)據(jù)文件讀入數(shù)據(jù)編輯窗口中然后依次與其他數(shù)據(jù)文件合并合并方式縱向合并數(shù)據(jù)文件:從外部數(shù)據(jù)文件中增加個案到當(dāng)前數(shù)據(jù)文件中(AddCases)橫向合并數(shù)據(jù)文件:從外部數(shù)據(jù)文件增加變量到當(dāng)前數(shù)據(jù)文件(AddVariables)99精選ppt縱向合并數(shù)據(jù)文件(AddCases)將數(shù)據(jù)編輯窗口中的數(shù)據(jù)與另一個SPSS數(shù)據(jù)文件中的數(shù)據(jù)進(jìn)行首尾對接,即將一個SPSS數(shù)據(jù)文件的內(nèi)容追加到數(shù)據(jù)編輯窗口中的數(shù)據(jù)后面--依據(jù)變量名進(jìn)行數(shù)據(jù)對接相互合并的數(shù)據(jù)文件應(yīng)該有相同的變量注意兩個待合并的spss數(shù)據(jù)文件的內(nèi)容合并起來應(yīng)有實(shí)際意義在不同數(shù)據(jù)文件中數(shù)據(jù)含義相同的數(shù)據(jù)項(xiàng)最好起相同的變量名,且數(shù)據(jù)類型也最好相同,利于spss對變量的自動匹配100精選ppt縱向合并數(shù)據(jù)文件(AddCases)步驟打開一個數(shù)據(jù)文件菜單:Data+MergeFiles+AddCases同名變量不同名變量顯示數(shù)據(jù)來源101精選ppt縱向合并數(shù)據(jù)文件(AddCases)注意VariablesInnewworkingdatafile框中顯示的變量名是兩個數(shù)據(jù)文件中都有的變量名UnpairedVariables框中的變量名是兩個文件中的不同變量名。*表示該變量是當(dāng)前數(shù)據(jù)編輯窗口中的變量,+表示該變量是待合并文件中的變量Indicatecasesourceasvariable:是否希望在合并后的數(shù)據(jù)文件中看出個案的來源自動生成一個變量名為source01,取值0或1的變量102精選ppt縱向合并數(shù)據(jù)文件(AddCases)不同變量名但含義相同的變量名的處理配對(Pair)選擇其中的兩個變量名并按“Pair”按鈕指定配對。默認(rèn)原數(shù)據(jù)中的變量名對某變量按“Rename”按鈕改名后在指定配對不經(jīng)匹配,強(qiáng)行合并兩個(多個)變量103精選ppt橫向合并數(shù)據(jù)文件(AddVariables)將數(shù)據(jù)編輯文件窗口中的數(shù)據(jù)與另一個SPSS數(shù)據(jù)文件中的數(shù)據(jù)進(jìn)行左右對接。即兩個數(shù)據(jù)文件依據(jù)個案進(jìn)行數(shù)據(jù)對接注意:相互合并的數(shù)據(jù)文件必須至少有一個名稱相同的變量,該變量是兩文件橫向合作的依據(jù),稱為關(guān)鍵變量兩個數(shù)據(jù)文件都必須先按關(guān)鍵變量進(jìn)行升序排列不同數(shù)據(jù)文件中數(shù)據(jù)含義不相同的數(shù)據(jù)項(xiàng)變量名不應(yīng)相同104精選ppt橫向合并數(shù)據(jù)文件(AddVariables)步驟:打開一個數(shù)據(jù)文件菜單:Data+MergeFiles+AddVariables105精選ppt當(dāng)個案數(shù)據(jù)不是一一對應(yīng)待合并數(shù)據(jù)的共有變量名待合并數(shù)據(jù)文件中的所有變量名106精選ppt橫向合并數(shù)據(jù)文件(AddVariables)合并數(shù)據(jù)的方式Bothfilesprovidecases:合并后的數(shù)據(jù)由原來兩個數(shù)據(jù)文件共同提供Externalfileiskeyedtable:在數(shù)據(jù)編輯窗口中的數(shù)據(jù)基礎(chǔ)上,將第二個數(shù)據(jù)文件中的其他變量合并進(jìn)來WorkingDataFileisKeyedTable:在第二個數(shù)據(jù)文件數(shù)據(jù)的基礎(chǔ)之上,將數(shù)據(jù)編輯窗口中的其他變量合并進(jìn)來107精選ppt練習(xí)2.3數(shù)據(jù)錄入108精選ppt練習(xí)2.4多選題錄入在一項(xiàng)關(guān)于汽車品牌的研究中,我們希望了解人們在購買汽車的時候關(guān)注的是哪些因素,問題如下您在購買汽車的時候,關(guān)注以下哪些因素:品牌、車型、價(jià)位、油耗、其他我們希望了解目標(biāo)人群對手機(jī)的哪些品牌的信任度較高,在問卷中列出了10個品牌,讓被訪者從中選擇他認(rèn)為最可信的幾個。問題如下請?jiān)谙旅?0個品牌中選出您認(rèn)為最信得過的幾個(最多選三個)

諾基亞、蘋果、三星、波導(dǎo)、西門子、康佳、華為中興、聯(lián)想、海爾109精選ppt練習(xí)2.5Excel數(shù)據(jù)的讀取將文件名為“居民儲蓄調(diào)查數(shù)據(jù).xls”的Excel數(shù)據(jù)文件轉(zhuǎn)換為SPSS數(shù)據(jù)文件,并在SPSS中指定其變量名標(biāo)簽和變量值標(biāo)簽110精選ppt練習(xí)2.6數(shù)據(jù)文件合并將名為“學(xué)生成績一.sav”和“學(xué)生成績二.sav”兩個數(shù)據(jù)文件以學(xué)號為關(guān)鍵變量進(jìn)行橫向合并,形成一個完整的數(shù)據(jù)文件111精選ppt第二章數(shù)據(jù)與SPSS數(shù)據(jù)處理第3節(jié)SPSS數(shù)據(jù)的預(yù)處理112精選ppt為什么要進(jìn)行數(shù)據(jù)的預(yù)處理缺失值?異常值?使用所有個案還是部分個案?使用所有變量還是部分變量?數(shù)據(jù)是否可以直接用于數(shù)據(jù)分析和建模?在數(shù)據(jù)文件建立好后,通常還需要對待分析的數(shù)據(jù)進(jìn)行必要的預(yù)加工處理,這是數(shù)據(jù)分析過程中不可缺少的一個關(guān)鍵環(huán)節(jié)隨著數(shù)據(jù)分析的不斷深入,對數(shù)據(jù)的加工處理還會多次反復(fù),實(shí)現(xiàn)數(shù)據(jù)加工和數(shù)據(jù)分析的螺旋上升113精選ppt數(shù)據(jù)的預(yù)處理SPSS提供了一些專門的功能輔助用戶實(shí)現(xiàn)數(shù)據(jù)的預(yù)加工處理工作。通過預(yù)處理還可以使用戶對數(shù)據(jù)的總體分布有所了解數(shù)據(jù)的預(yù)加工處理服務(wù)于數(shù)據(jù)分析和建模,包括:數(shù)據(jù)的排序變量計(jì)算數(shù)據(jù)選取計(jì)數(shù)分類匯總數(shù)據(jù)分組數(shù)據(jù)預(yù)處理的其他功能:轉(zhuǎn)置、加權(quán)、數(shù)據(jù)拆分、缺失值處理、數(shù)據(jù)排秩、定義變量集114精選ppt數(shù)據(jù)的排序數(shù)據(jù)排序的目的通常數(shù)據(jù)編輯窗口中個案的前后次序是由數(shù)據(jù)錄入的先后順序決定的。數(shù)據(jù)預(yù)處理中,有時需要將數(shù)據(jù)按照一定的順序重新排列作用數(shù)據(jù)排序便于數(shù)據(jù)的瀏覽,有助于了解數(shù)據(jù)的取值狀況、缺失值數(shù)量的多少等通過數(shù)據(jù)排序能夠快捷地找到數(shù)據(jù)的最大值和最小值,進(jìn)而可以計(jì)算出數(shù)據(jù)的全距,初步把握和比較數(shù)據(jù)的離散程度通過數(shù)據(jù)排序能夠快捷地發(fā)現(xiàn)數(shù)據(jù)的異常值,為進(jìn)一步明確它們是否對分析產(chǎn)生重要影響等提供幫助115精選ppt數(shù)據(jù)排序的方法SPSS的數(shù)據(jù)排序是將數(shù)據(jù)編輯窗口中的數(shù)據(jù)按照某個或多個指定變量的變量值升序或降序重新排列。這里的變量也稱為排序變量排序變量只有一個時,排序稱為單值排序。排序變量有多個時,排序稱為多重排序多重排序中,第一個指定的排序變量稱為主排序變量,其他依次指定的變量分別稱為第二排序變量、第三排序變量等多重排序時,數(shù)據(jù)首先按主排序變量值的大小次序排序,然后對那些具有相同主排序變量值的數(shù)據(jù),再按照第二排序變量值的次序依次排序下去116精選ppt數(shù)據(jù)排序的操作步驟選擇菜單:【Data】→【SortCases】指定主排序變量到【Sortby】框中,并選擇【SortOrder】框中的選項(xiàng)指出該變量按升序排還是降序排序。[Ascending]表示升序,[Descending]表示降序。如果是多重排序,還要依次指定第二、第三排序變量及相應(yīng)的排序規(guī)則。否則,本步可略117精選ppt在左邊的源變量框中選擇排序變量進(jìn)入Sortby框。如果選擇2個以上的變量,觀測量的排序結(jié)果與排序變量在Sortby框中的順序有關(guān)。列于首位的為第一排序變量。在SortOrder欄內(nèi)選擇排序方式——升序與降序118精選ppt說明 數(shù)據(jù)排序是整行數(shù)據(jù)(個案)排序,而不是只對某列變量排序多重排序中指定排序變量的次序很關(guān)鍵。先指定的變量優(yōu)先于后指定的變量。多重排序可以在按某個變量值升序(或降序)排序的同時再按其他變量值降序(或升序)排序數(shù)據(jù)排序后,原有數(shù)據(jù)的排序次序必然被打亂,應(yīng)保存原始數(shù)據(jù)119精選ppt例題2.3利用住房狀況調(diào)查數(shù)據(jù),通過數(shù)據(jù)排序功能分別找到本市戶口和外地戶口家庭住房面積的最大值和最小值多重排序主排序變量--戶口狀況第二排序變量--現(xiàn)住面積120精選ppt變量計(jì)算變量計(jì)算的目的數(shù)據(jù)的轉(zhuǎn)換處理

數(shù)據(jù)的轉(zhuǎn)換處理是在原有數(shù)據(jù)的基礎(chǔ)上,計(jì)算產(chǎn)生一些含有更豐富信息的新數(shù)據(jù)。例如,根據(jù)職工的基本工資、失業(yè)保險(xiǎn)、獎金等數(shù)據(jù)項(xiàng),計(jì)算實(shí)際月收入;這些新產(chǎn)生的變量具有更直觀和更有效的特點(diǎn)。

對數(shù)據(jù)的原有分布狀態(tài)進(jìn)行轉(zhuǎn)換

由于數(shù)據(jù)分析和建模中某些模型對數(shù)據(jù)的分布有一定的要求,因此可以利用變量計(jì)算對原有數(shù)據(jù)的分布進(jìn)行轉(zhuǎn)換。例如,利用對數(shù)或多項(xiàng)式轉(zhuǎn)換對非正態(tài)或非線性數(shù)據(jù)進(jìn)行處理;對時間序列進(jìn)行平穩(wěn)化處理;利用區(qū)間變換壓縮數(shù)據(jù)取值范圍和標(biāo)準(zhǔn)化處理等。121精選ppt變量計(jì)算的方法SPSS變量計(jì)算是在原有數(shù)據(jù)的基礎(chǔ)上,根據(jù)用戶給出的SPSS算術(shù)表達(dá)式以及函數(shù),對所有個案或滿足條件的部分個案,計(jì)算產(chǎn)生一系列新變量注意:(1)變量計(jì)算是針對所有個案(或指定的部分個案)的,每條個案(或指定的部分個案)都有自己的計(jì)算結(jié)果。(2)變量計(jì)算的結(jié)果應(yīng)保存到一個指定變量中,該變量的數(shù)據(jù)類型應(yīng)與計(jì)算結(jié)果的數(shù)據(jù)類型相一致。122精選ppt變量計(jì)算的幾個概念SPSS

算術(shù)表達(dá)式SPSS條件表達(dá)式SPSS

函數(shù)123精選pptSPSS算術(shù)表達(dá)式(numericexpression)在變量計(jì)算過程中,應(yīng)根據(jù)實(shí)際需要指出按照什么方法計(jì)算變量。這里的方法一般以SPSS算術(shù)表達(dá)式的形式給出。由常量、變量、算術(shù)運(yùn)算符、圓括號、函數(shù)等組成的式子。字符型常量應(yīng)用引號引起來變量是指那些已存在于數(shù)據(jù)編輯窗口中的現(xiàn)有變量算術(shù)運(yùn)算符主要包括:+(加)、-(減)、*(乘)、/(除)、**(乘方)。操作對象的數(shù)據(jù)類型為數(shù)值型。運(yùn)算次序:先乘方,再乘除,最后加減。在同級運(yùn)算中,按從左到右的順序進(jìn)行運(yùn)算.通過圓括號改變原有的計(jì)算順序在同一算術(shù)表達(dá)式中的常量及變量,數(shù)據(jù)類型應(yīng)該一致,否則無法計(jì)算124精選pptSPSS條件表達(dá)式在變量計(jì)算中通常要求對不同組(類)的個案分別按不同的方法進(jìn)行計(jì)算,于是就需要通過一定的方式來指定個案。條件表達(dá)式能夠幫助實(shí)現(xiàn)這一目標(biāo)條件表達(dá)式是一個對條件進(jìn)行判斷的式子。其結(jié)果有兩種取值:如果判斷條件成立,則結(jié)果為真;如果判斷條件不成立,則結(jié)果為假條件表達(dá)式包括簡單條件表達(dá)式和復(fù)合條件表達(dá)式125精選ppt1.簡單條件表達(dá)式簡單條件表達(dá)式是由關(guān)系運(yùn)算符、常量、變量以及算術(shù)表達(dá)式等組成的式子。關(guān)系運(yùn)算符包括>(大于)、<(小于)、=(等于)、~=(不等于)、>=(大于等于)、<=(小于等于)例如,對職工基本情況數(shù)據(jù)可以寫成這樣的簡單條件表達(dá)式:nl>35,表示年齡大于35歲。在數(shù)據(jù)編輯窗口中,對于年齡大于35歲的個案,該條件判斷的結(jié)果為真,而對于年齡小于或等于35歲的個案,該條件判斷的結(jié)果為假。126精選ppt2.復(fù)合條件表達(dá)式復(fù)合條件表達(dá)式又稱邏輯表達(dá)式,是由邏輯運(yùn)算符、圓括號和簡單條件表達(dá)式等組成的式子。其中,邏輯運(yùn)算符包括&或AND(并且)、|或OR(或者)、~或NOT(非).NOT的運(yùn)算最優(yōu)先,其次是AND,最低是OR??梢酝ㄟ^圓括號改變這種運(yùn)算次序例如,職工基本情況數(shù)據(jù)可以寫成這樣的復(fù)合條件表達(dá)式:(nl<=35)andnot(zc<3)表示年齡小于等于35歲并且職稱不低于3。對于年齡小于等于35歲并且職稱不低于3的個案,該條件判斷的結(jié)果為真,其余個案的條件判斷結(jié)果為假。在變量計(jì)算時,如果根據(jù)實(shí)際需要給出了條件表達(dá)式,SPSS將只對數(shù)據(jù)編輯窗口中條件判斷結(jié)果為真的那些個案進(jìn)行計(jì)算。因此,構(gòu)造條件表達(dá)式是很關(guān)鍵的。127精選pptSPSS函數(shù)函數(shù)是事先編好并存儲在SPSS軟件中,能夠?qū)崿F(xiàn)某些特定計(jì)算任務(wù)的一段計(jì)算機(jī)程序。這些程序段都有各自的名字稱為函數(shù)名。執(zhí)行這些程序段得到的計(jì)算結(jié)果稱為函數(shù)值用戶在使用這些函數(shù)時,只需通過書寫相應(yīng)的函數(shù)名,并給出必要的計(jì)算參數(shù),SPSS便會自動計(jì)算函數(shù)值函數(shù)書寫的具體形式為:函數(shù)名(參數(shù))函數(shù)名是SPSS已經(jīng)規(guī)定好的圓括號中的參數(shù)可以是常量(字符型常量應(yīng)用引號引起來),也可以是變量或算術(shù)表達(dá)式參數(shù)可能是一個,也可能有多個,各參數(shù)之間用逗號分隔128精選pptSPSS函數(shù)分類算術(shù)函數(shù)統(tǒng)計(jì)函數(shù)分布函數(shù)查找函數(shù)(邏輯)字符函數(shù)缺失值函數(shù)日期函數(shù)其他函數(shù):雜項(xiàng)函數(shù)、轉(zhuǎn)換函數(shù)等課本P54~P58129精選pptSPSS變量計(jì)算的基本操作步驟(1)選擇菜單:【Transform】→【Compute】(2)在[NumericExpression]框給出SPSS算術(shù)表達(dá)式和函數(shù)??梢允止ぽ斎耄部梢园创翱诘陌粹o以及函數(shù)下拉菜單來完成算術(shù)表達(dá)式和函數(shù)的輸人工作。(3)在Target框中輸入存放計(jì)算結(jié)果的變量名。該變量可以是一個新變量,也可以是已經(jīng)存在的變量。新變量的變量類型默認(rèn)為數(shù)值型,用戶可以根據(jù)需要按Type&Label按鈕修改,還可對新變量加變量名標(biāo)簽。(4)如果用戶僅希望對符合一定條件的個案計(jì)算產(chǎn)生變量,則按if按鈕,選擇[Incudeifcasesatisfescondition]選項(xiàng),然后輸入條件表達(dá)式。否則,本步驟略去。130精選ppt輸入算術(shù)表達(dá)式和函數(shù)存放計(jì)算結(jié)果的變量名所有函數(shù)的分類各類函數(shù)包含的函數(shù)名131精選ppt例題2.4利用職工基本情況數(shù)據(jù),依據(jù)職稱級別計(jì)算實(shí)發(fā)工資。假設(shè)職稱1至4職工的工資分別上調(diào)5%,3%,2%,1%132精選ppt數(shù)據(jù)選取數(shù)據(jù)選取就是根據(jù)分析的需要,從已收集到的大批量數(shù)據(jù)(總體)中按照一定的規(guī)則抽取部分?jǐn)?shù)據(jù)(樣本)參與分析的過程,通常也稱為樣本抽樣SPSS可根據(jù)指定的抽樣方法從數(shù)據(jù)編輯窗口中選出部分樣本以實(shí)現(xiàn)數(shù)據(jù)選取,這樣后面的分析操作就只針對選出的數(shù)據(jù),直到用戶取消這種選取為止133精選ppt數(shù)據(jù)選取的目的服務(wù)于以后的數(shù)據(jù)分析:提高數(shù)據(jù)分析效率

如果數(shù)據(jù)量較大,會在一定程度上影響計(jì)算和建模的效率,因此,通常可以依據(jù)一定的抽樣方法從總體中抽取少量樣本,后面的分析只針對樣本進(jìn)行,這樣會大大提高分析的效率檢驗(yàn)?zāi)P偷男枰?/p>

在數(shù)據(jù)分析中,所建的模型是否能夠較完整準(zhǔn)確地反映數(shù)據(jù)的特征,是否能夠用于以后的數(shù)據(jù)預(yù)測,這些問題都是人們極為關(guān)心的。為了驗(yàn)證模型,一般可依據(jù)一定的抽樣方法只選擇部分樣本參與數(shù)據(jù)建模,剩余的數(shù)據(jù)用于模型檢驗(yàn)134精選ppt數(shù)據(jù)選取方法按指定條件選取(Ifconditionissatisfied)隨機(jī)選取(Randomsampleofcases)近似選取(Approximately)精確選取(Exactly)選取某一區(qū)域內(nèi)的樣本(Basedontimeorcaserange)通過過濾變量選取(Usefiltervariable)135精選ppt按指定條件選取(Ifconditionissatisfied)選取符合條件的數(shù)據(jù)SPSS要求用戶以條件表達(dá)式的形式給出數(shù)據(jù)選取的條件。SPSS將自動對數(shù)據(jù)編輯窗口中的所有個案進(jìn)行條件判斷。那些滿足條件的個案,即條件判斷為真的個案將被自動選取出來,而那些條件判斷為假的個案則不被選中136精選ppt近似選取(Approximately)近似選取要求用戶給出一個百分比數(shù)值。SPSS將按照這個比例自動從數(shù)據(jù)編輯窗口中隨機(jī)抽取出相應(yīng)百分比數(shù)目的個案根據(jù)SPSS隨機(jī)數(shù)種子發(fā)生器設(shè)計(jì)和實(shí)現(xiàn)抽取出的個案總數(shù)不一定恰好精確等于用戶指定的百分比數(shù)目,會有小的偏差,因而稱為近似選取。通常不會對數(shù)據(jù)分析產(chǎn)生重要影響。137精選ppt精確選取(Exactly)近似選取精確選取希望選取的個案數(shù)指定在前幾個個案中選取138精選ppt隨機(jī)數(shù)種子發(fā)生器【Transform】→【RandomNumberGenerators】隨機(jī)種子為具體的正整數(shù)小于等于2,000,000一般用于隨機(jī)化結(jié)果需要重復(fù)出現(xiàn)的情況隨機(jī)種子每次自動取一個新的值隨機(jī)化結(jié)果不會重復(fù)出現(xiàn)139精選ppt選取某一區(qū)域內(nèi)的樣本(Basedontimeorcaserange)選取數(shù)據(jù)編輯窗口中的樣本號范圍內(nèi)的所有個案,要求給出這個范圍的上下限個案號碼通常適用于時間序列數(shù)據(jù)140精選ppt通過過濾變量選取(Usefiltervariable)依據(jù)過濾變量的取值進(jìn)行樣本選取要求指定一個變量作為過濾變量,變量值為非0或非系統(tǒng)缺失值的個案將被選中通常用于排除包含系統(tǒng)缺失值的個案141精選ppt數(shù)據(jù)選取的操作步驟(1)選擇菜單:【Data】→【Selectcases】(2)在select框中選擇抽樣方法。Allcases表示全部選中。(3)指定對未選中個案的處理方式。其中,F(xiàn)iltered表示在未被選中的個案號碼上打一個“\”標(biāo)記;Deleted表示將未被選中的個案從數(shù)據(jù)編輯窗口中刪除。一般采取第一個處理方式較好。142精選ppt數(shù)據(jù)選取的操作步驟說明按上述操作步驟完成數(shù)據(jù)這取后,以后的SPSS分析操作僅針對那些被選中的個案,直到用戶再次改變數(shù)據(jù)選取為止采用指定條件抽樣和隨機(jī)抽樣方法進(jìn)行數(shù)據(jù)選取后,SPSS將在數(shù)據(jù)編輯窗口中自動生成一個名為filer_$的新變量,取值為1或0,1表示本條個案被選中,0表示未被選中。filer_$是SPSS產(chǎn)生的中間變量,如果刪除它則自動取消樣本抽樣143精選ppt例題2.5利用居民儲蓄調(diào)查數(shù)據(jù),根據(jù)不同的分析要求采用不同的數(shù)據(jù)選取方法抽樣:(1)希望分析城市儲戶的情況(2)希望對其中的70%的數(shù)據(jù)進(jìn)行分析,可通過數(shù)據(jù)選擇功能采用隨機(jī)抽樣中的近似抽樣方法進(jìn)行抽樣采用指定條件的抽樣方法采用近似抽樣方法144精選ppt計(jì)數(shù)計(jì)數(shù)的目的把握個案各方面的特征SPSS實(shí)現(xiàn)的計(jì)數(shù)是對所有個案或滿足某條件的部分個案,計(jì)算若干個變量中有幾個變量的值落在指定的區(qū)間內(nèi),并將計(jì)數(shù)結(jié)果存入一個新變量中的過程對個案中的變量進(jìn)行計(jì)數(shù)SPSS實(shí)現(xiàn)計(jì)數(shù)的關(guān)鍵步驟是:1.指定哪些變量參與計(jì)數(shù),計(jì)數(shù)的結(jié)果存入哪個新變量中2.指定計(jì)數(shù)區(qū)間145精選ppt計(jì)數(shù)區(qū)間描述形式:

1.單個變量值(Value)2.系統(tǒng)缺失值(System-missing)3.系統(tǒng)缺失值或用戶缺失值(Systemoruser-missing)

4.給定最大值和最小值的區(qū)間(nthroughm)5.小于等于某指定值的區(qū)間(Lowestthroughn)6.大于等于某指定值的區(qū)間(nthroughhighest)SPSS中的計(jì)數(shù)區(qū)間是一個廣義的概念,包含了離散值146精選ppt計(jì)數(shù)對大學(xué)畢業(yè)班同學(xué)的學(xué)習(xí)成績進(jìn)行綜合評價(jià)時,可以依次計(jì)算每個學(xué)生的若干門專業(yè)課中有幾門課程得了優(yōu),有幾門課程得了良,有幾門得了中等等,并以門次為權(quán)重做進(jìn)一步的分析。這樣的計(jì)算門次數(shù)據(jù)的過程就是一個計(jì)數(shù)過程評價(jià)學(xué)生成績,成績?yōu)閮?yōu)的計(jì)數(shù)區(qū)間可以指定為90throughhighest,成績?yōu)榱嫉挠?jì)數(shù)區(qū)間指定為80through89,不及格的計(jì)數(shù)區(qū)間指定為Lowestthrough59147精選ppt計(jì)數(shù)的基本操作步驟選擇菜單:[Transform】→[Count】選擇參與計(jì)數(shù)的變量到【NumericVariables】框中在[TargetVariable】框中輸入存放計(jì)數(shù)結(jié)果的變量名,并在【TargetLabel】框中輸入相應(yīng)的變量名標(biāo)簽按DefineValues按鈕定義計(jì)數(shù)區(qū)間,出現(xiàn)如圖所示的窗口。通過【add】,【Change】,【Remove】按鈕完成計(jì)數(shù)區(qū)間的增加、修改和刪除如果僅希望對滿足某條件的個案進(jìn)行計(jì)數(shù),則按if按鈕并輸入相應(yīng)的SPSS條件表達(dá)式。否則,本步略。148精選ppt例題2.6利用住房狀況調(diào)查數(shù)據(jù),分析被調(diào)查家庭中有多少比例的家庭對目前的住房滿意且近幾年不準(zhǔn)備購買住房149精選ppt分類匯總分類匯總是按照某分類進(jìn)行分類匯總計(jì)算某企業(yè)希望了解本企業(yè)不同學(xué)歷職工的基本工資是否存在較大差距最簡單的做法就是分類匯總,即將職工按學(xué)歷進(jìn)行分類,然后分別計(jì)算不同學(xué)歷職工的平均工資,就可對平均工資進(jìn)行比較150精選ppt分類匯總某商廈希望分析假日周內(nèi)不同職業(yè)和不同年齡段的顧客對某商品的“打折促銷”反應(yīng)是否存在較大差異,用以分析不同消費(fèi)群體的消費(fèi)心理。最初步的分析可以是分別計(jì)算不同職業(yè)中不同年齡段顧客的平均消費(fèi)金額和平均消費(fèi)金額差異程度(標(biāo)準(zhǔn)差),并對它們進(jìn)行比較。這個過程可通過分類匯總過程完成分析大學(xué)男生和大學(xué)女生入校和畢業(yè)時每月生活費(fèi)的變化情況151精選ppt分類匯總SPSS實(shí)現(xiàn)分類匯總涉及兩個主要方面:1.按照哪個變量(如上例中的學(xué)歷、職業(yè)和文化程度;性別、年級)進(jìn)行分類。2.對哪個變量(如上例中的基本工資、消費(fèi)金額、生活費(fèi))進(jìn)行匯總,并指定對匯總變量計(jì)算哪些統(tǒng)計(jì)量(如上例中的平均工資、平均消費(fèi)金額和標(biāo)準(zhǔn)差、平均生活費(fèi))152精選ppt分類匯總的基本操作步驟選擇菜單:【Data】→【Aggregate】指定分類變量指定匯總變量指定對匯總變量計(jì)算哪些統(tǒng)計(jì)量SPSS默認(rèn)計(jì)算均值分類匯總結(jié)果覆蓋數(shù)據(jù)編輯窗口中的數(shù)據(jù)將結(jié)果生成到系統(tǒng)默認(rèn)的名為aggr.sav的SPSS數(shù)據(jù)文件中可以按File按鈕重新指定文件名重新指定結(jié)果文件中的變量名或加變量名標(biāo)簽SPSS默認(rèn)的變量名為原變量名后加_1在結(jié)果文件中保存各分類組的個案數(shù)153精選ppt分類匯總說明分類匯總中的分類變量可以是多個,此時的分類匯總稱為多重分類匯總。如上述不同職業(yè)和不同年齡段顧客消費(fèi)的例子即是多重分類匯總的應(yīng)用。類似于數(shù)據(jù)的排序,在多重分類匯總中,指定多個分類變量的前后次序是很關(guān)鍵的。第一個指定的分類變量為主分類變量(如職業(yè)),其他的依次為第二(如年齡段)、第三分類變量等,它們決定了分類匯總的先后次序。154精選ppt例題2.7根據(jù)職工情況數(shù)據(jù)研究不同學(xué)歷的職工的工資水平是否存在差異利用分類匯總功能計(jì)算不同學(xué)歷職工的平均工資,然后進(jìn)行比較。選擇文化程度為分類變量基本工資為匯總變量155精選ppt例題2.8利用住房狀況調(diào)查數(shù)據(jù),分析本市戶口家庭和外地戶口家庭目前人均住房面積的平均值是否有較大差距,未來打算購買住房的平均面積是否有較大的差距。分類變量是“戶口狀況”,匯總變量是“人均面積”和“計(jì)劃面積”156精選ppt數(shù)據(jù)分組數(shù)據(jù)分組就是根據(jù)統(tǒng)計(jì)分析的需要,將數(shù)據(jù)按照某種標(biāo)準(zhǔn)重新劃分為不同的組別數(shù)據(jù)分組的目的數(shù)據(jù)分組是對定距型數(shù)據(jù)進(jìn)行整理和粗略把握數(shù)據(jù)分布的重要工具,因而在實(shí)際數(shù)據(jù)分析中經(jīng)常使用。在數(shù)據(jù)分組的基礎(chǔ)上進(jìn)行的頻數(shù)分析,更能概括和體現(xiàn)數(shù)據(jù)的分布特征。另外,分組還能夠?qū)崿F(xiàn)數(shù)據(jù)的離散化處理等。157精選ppt數(shù)據(jù)分組職工基本情況數(shù)據(jù)中的基本工資數(shù)據(jù)為定距數(shù)據(jù),表現(xiàn)為具體的工資金額。如此“細(xì)致”的數(shù)據(jù)有時并不利于展現(xiàn)數(shù)據(jù)的總體分布特征。因此,可以將工資收入進(jìn)行“粗化”,即分組,將其按照一定的標(biāo)準(zhǔn)重新分成高收入、中收入、低收入三個組,之后再進(jìn)行頻數(shù)分析,繪制直方圖等。200只燈泡的使用壽命學(xué)生英語成績按照分?jǐn)?shù)分為優(yōu)秀、良好和不及格158精選ppt組距分組在變量值較多的情況下,數(shù)據(jù)分組通常采用組距分組。組距分組是將全部變量值依次劃分為若干個區(qū)間,并將同一區(qū)間的變量值作為一組組距分組中有兩個關(guān)鍵問題分組數(shù)目的確定組距的確定“不重不漏”的原則"不重"是指一個變量值只能分在某一個組中,不能在其他組中重復(fù)出現(xiàn)"不漏"是指所有數(shù)據(jù)都應(yīng)分配在某個組中,不能遺漏159精選ppt分組數(shù)目的確定數(shù)據(jù)應(yīng)分成多少組比較合適通常與數(shù)據(jù)本身的特點(diǎn)和數(shù)據(jù)個數(shù)有關(guān)。由于分組的目的之一是觀察數(shù)據(jù)分布的特征,因此組數(shù)的確定應(yīng)以能夠清楚地顯示數(shù)據(jù)分布特征和規(guī)律為原則。組數(shù)太少會使數(shù)據(jù)的分布過于集中,而組數(shù)太多又會使數(shù)據(jù)的分布過于分散,這樣都不便于觀察數(shù)據(jù)分布的特征和規(guī)律。在實(shí)際分組時,可以按照Sturges提出的經(jīng)驗(yàn)公式來確定組數(shù)K;

K=1+lgn/lg2n為數(shù)據(jù)個數(shù),對結(jié)果四舍五入取整后為理論分組數(shù)目160精選ppt組距的確定組距是一個組的上限(組中的最大值)與下限(組中的最小值)之差。組距可根據(jù)全部數(shù)據(jù)的最大值和最小值及組數(shù)來確定

組距=(最大值-最小值)/組數(shù)職工基本工資情況分組數(shù)目:K=1+lg16/lg2=5組距:(1044-824)/5=44近似取50

161精選ppt組距分組的基本操作步驟SPSS對分組結(jié)果的兩種存放策略用分組變量值覆蓋原變量(IntoSameVariables)將分組結(jié)果存到一個新變量中(IntoDifferentVariables)通常采用第二種策略操作步驟(1)選擇菜單:[Transform]→[RecodeintoDiferentVariables](2)選擇分組變量到【NumericVariable->Output】框中。(3)在【OutputVariable】框中的【Name】后輸入存放分組結(jié)果的變量名,并按Change按鈕確認(rèn)。也可在【Label】后輸入相應(yīng)的變量名標(biāo)簽。(4)按OldandNewvalues按鈕進(jìn)行分組區(qū)間定義。這里,應(yīng)根據(jù)分析要求逐個定義各分組區(qū)間(5)如果僅對符合一定條件的個案分組,則單擊If按鈕并輸入SPSS條件表達(dá)式。否則,本步可略去162精選ppt選擇分組變量到此處存放分組結(jié)果的變量名按Change按鈕確認(rèn)定義分組區(qū)間163精選ppt指定分組區(qū)間的下限和上限給出該區(qū)間對應(yīng)的分組值單擊Add按鈕確認(rèn)分組區(qū)間并加到此處164精選ppt例題2.9利用住房狀況調(diào)查數(shù)據(jù),分析被調(diào)查家庭的人均住房面積的分布特征確定分組變量確定組距和分組數(shù)目進(jìn)行分組165精選ppt數(shù)據(jù)預(yù)處理的其他功能數(shù)據(jù)轉(zhuǎn)置將數(shù)據(jù)編輯窗口中數(shù)據(jù)的行列互換選擇菜單:[Data】→【Transpose】指定數(shù)據(jù)轉(zhuǎn)置后應(yīng)保留哪些變量指定轉(zhuǎn)置后數(shù)據(jù)文件中各變量如何取名選擇一個取值唯一的變量(如職工號)作為標(biāo)記變量到此處166精選ppt數(shù)據(jù)轉(zhuǎn)置轉(zhuǎn)置后數(shù)據(jù)各變量取名為:K_標(biāo)記變量值(如K_001、K_002、K_003等)。如果略去本步,則轉(zhuǎn)置后數(shù)據(jù)各變量名默認(rèn)為VAR00001,VAR00002,VAR00003等SPSS將自動完成數(shù)據(jù)轉(zhuǎn)置,并將轉(zhuǎn)置結(jié)果顯示在數(shù)據(jù)編輯窗口中。同時,SPSS還會自動產(chǎn)生一個名為Case_lbl的新變量,用來存放原數(shù)據(jù)文件中的各變量名167精選ppt統(tǒng)計(jì)分析中的加權(quán)處理是極為常見的,如計(jì)算加權(quán)平均數(shù)如果僅用各種蔬菜銷售單價(jià)的平均數(shù)作為平均價(jià)格是不合理的,還應(yīng)考慮到銷售量對平均價(jià)格的影響因此,以蔬菜的銷售量為權(quán)數(shù)計(jì)算各種蔬菜銷售單價(jià)的加權(quán)平均數(shù),就能夠準(zhǔn)確反映平均價(jià)格的水平加權(quán)處理168精選ppt加權(quán)處理【Data】→【W(wǎng)eightCases】選擇某變量作為加權(quán)變量到此處169精選ppt加權(quán)處理注意SPSS中指定加權(quán)變量的過程本質(zhì)上是數(shù)據(jù)復(fù)制。對表3-14的蔬菜銷售數(shù)據(jù),如果指定銷售量為加權(quán)變量,那么SPSS將蘿卜這條數(shù)據(jù)復(fù)制1025行,將西紅柿這條數(shù)據(jù)復(fù)制850行,等等。但加權(quán)操作完畢后,數(shù)據(jù)編輯窗口中的數(shù)據(jù)并沒有變化,而僅在狀態(tài)欄中有已經(jīng)加權(quán)的提示信息一旦指定了加權(quán)變量,那么在以后的分析處理中加權(quán)是一直有效的,直到取消加權(quán)為止。取消加權(quán)應(yīng)在相應(yīng)的窗口中選擇(Doweightcases)選項(xiàng)通過加權(quán)處理,可以達(dá)到將數(shù)據(jù)編輯窗口中的計(jì)數(shù)數(shù)據(jù)還原為原始數(shù)據(jù)的目的170精選ppt數(shù)據(jù)拆分SPSS的數(shù)據(jù)拆分與數(shù)據(jù)排序很相似,但也有一個重要的不同點(diǎn),即數(shù)據(jù)拆分不僅是按指定變量對數(shù)據(jù)進(jìn)行簡單排序,更重要的是根據(jù)指定變量對數(shù)據(jù)進(jìn)行分組,它將為以后所進(jìn)行的分組統(tǒng)計(jì)分析提供便利數(shù)據(jù)拆分將對后面的分析一直起作用,即無論進(jìn)行哪種統(tǒng)計(jì)分析,都將是按拆分變量的不同組分別進(jìn)行分析計(jì)算。如采希望對所有數(shù)據(jù)進(jìn)行整體分析,則需要重新執(zhí)行數(shù)據(jù)拆分,并在相應(yīng)的窗口中選擇[Analyzeallcase]項(xiàng)。對數(shù)據(jù)可以進(jìn)行多重拆分,類似于數(shù)據(jù)的多重排序。多重拆分的次序決定于選擇拆分變量的前后次序171精選pptData-SplitFile將拆分變量選到此處將分組統(tǒng)計(jì)結(jié)果輸出在同一表格中,以便于不同組

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負(fù)責(zé)。
  • 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時也不承擔(dān)用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

評論

0/150

提交評論