SPSS統(tǒng)計(jì)數(shù)據(jù)的收集與預(yù)處理.ppt_第1頁
SPSS統(tǒng)計(jì)數(shù)據(jù)的收集與預(yù)處理.ppt_第2頁
SPSS統(tǒng)計(jì)數(shù)據(jù)的收集與預(yù)處理.ppt_第3頁
SPSS統(tǒng)計(jì)數(shù)據(jù)的收集與預(yù)處理.ppt_第4頁
SPSS統(tǒng)計(jì)數(shù)據(jù)的收集與預(yù)處理.ppt_第5頁
免費(fèi)預(yù)覽已結(jié)束,剩余76頁可下載查看

下載本文檔

版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進(jìn)行舉報(bào)或認(rèn)領(lǐng)

文檔簡介

第二章,統(tǒng)計(jì)數(shù)據(jù)的收集和預(yù)處理,主要內(nèi)容,2.1統(tǒng)計(jì)數(shù)據(jù)的收集,2.2SPSS數(shù)據(jù)文件的建立,2.2SPSS數(shù)據(jù)文件的編輯,2.2SPSS數(shù)據(jù)處理,2.1.1問卷設(shè)計(jì)1。問卷的構(gòu)成(1)標(biāo)題(2)引言(3)正文(4)結(jié)論,2.1統(tǒng)計(jì)數(shù)據(jù)的收集,2.1.1問卷設(shè)計(jì)2。問卷的問題類型(1)封閉式問題(2)開放式問題,2.1統(tǒng)計(jì)數(shù)據(jù)收集,2.1.1問卷設(shè)計(jì)3。主要問卷類型(1)連續(xù)評定量表(2)部分評定量表(李克特量表)(3)等級量表,2.1統(tǒng)計(jì)數(shù)據(jù)收集,2.1.1問卷設(shè)計(jì)4。問卷設(shè)計(jì)中的注意事項(xiàng)(1)明確的目的(2)先簡單后困難,先簡單后復(fù)雜(3)要問的具體問題,避免一般性問題(4)單選項(xiàng)問題的備選答案應(yīng)完全劃分到答案空間(5)多選項(xiàng)問題的備選答案必須分布在兩個以上的維度。并且至少一些陳述和問題的替代答案不是相互排斥的(6)它們不能有多重含義(7)在問題設(shè)計(jì)中使用的術(shù)語應(yīng)該有明確的含義,并且應(yīng)答者不能有不同的理解(8)在問題的陳述中,詢問行為的時間、方式和目的應(yīng)該被定義為必要的,2.1統(tǒng)計(jì)數(shù)據(jù)的收集,2.1.1問卷設(shè)計(jì)4。問卷設(shè)計(jì)中的注意事項(xiàng)(9)對于不能如實(shí)回答但必須理解的數(shù)據(jù),可以通過改變問題的提法獲得相應(yīng)的數(shù)據(jù),或者通過理解相關(guān)數(shù)據(jù)來判斷整體情況(10)問卷不宜過長,20-30分鐘為宜;店鋪截取問卷需要3-5分鐘,2.1統(tǒng)計(jì)數(shù)據(jù)的收集,2.1.2問卷分析的信度分析和效度分析,2.1統(tǒng)計(jì)數(shù)據(jù)的收集,主要內(nèi)容,2.1統(tǒng)計(jì)數(shù)據(jù)的收集,2.2SPSS數(shù)據(jù)文件的建立,2.2SPSS數(shù)據(jù)文件的編制,2.2SPSS數(shù)據(jù)的處理,2.2 SPSS數(shù)據(jù)文件的建立,2.2.1統(tǒng)計(jì)數(shù)據(jù)的標(biāo)準(zhǔn)尺度,即固定尺度,這只是區(qū)分變量不同值的一個標(biāo)志, 類別數(shù)據(jù)之間沒有區(qū)別,例如,人口的性別、商品的名稱、身份證、商店的類型等。 序數(shù)是衡量事物之間等級或順序差異的尺度。例如,考試成績(優(yōu)、良、中、差)、人的身高等級(高、中、低)、教育水平(博士、碩士、學(xué)士)等。間隔是對事物類別或順序之間距離的度量。例如,100分檢查的結(jié)果、重量、溫度等。固定比率(Ratio),指可以測量值之間比率的測量尺度。例如,員工的月收入、企業(yè)產(chǎn)值等。2.2 SPSS數(shù)據(jù)文件的建立和統(tǒng)計(jì)數(shù)據(jù)的測量尺度表明,不同測量尺度的統(tǒng)計(jì)數(shù)據(jù)對應(yīng)于SPSS數(shù)據(jù)文件中不同的變量數(shù)據(jù)類型。標(biāo)稱尺度-數(shù)值型、字符型排序尺度-數(shù)值型、字符型區(qū)間尺度-數(shù)值型,建立2.2 PSS數(shù)據(jù)文件,2 . 2 . 2 SPSS數(shù)據(jù)文件的特征、變量、案例、樣本、變量值,建立2.2 PSS數(shù)據(jù)文件,建立2.2.3輸入數(shù)據(jù)建立數(shù)據(jù)文件SPSS數(shù)據(jù)文件包括兩個方面,首先定義數(shù)據(jù)的結(jié)構(gòu),然后輸入數(shù)據(jù)。(1)數(shù)據(jù)結(jié)構(gòu)定義結(jié)構(gòu)定義包括:名稱、類型、寬度、小數(shù)、標(biāo)簽、值、缺失值、列、對齊、測量標(biāo)準(zhǔn)、作用,2.2建立SPSS數(shù)據(jù)文件,(1)數(shù)據(jù)結(jié)構(gòu)定義名稱命名規(guī)則:高版本SPSS的變量名長度可達(dá)64位,但由于老版本SPSS的變量名長度應(yīng)在8位以內(nèi), 為了避免與舊版本和其他軟件的兼容性問題,變量名一般控制在8位以內(nèi),盡量避免中文,必要的中文解釋可以放在標(biāo)簽欄中。 第一個字符應(yīng)該以英文字母開頭,后面可以跟except!“*”以外的字母或數(shù)字。下劃線和點(diǎn)不能是變量名的最后一個字符。變量名必須是唯一的,不能區(qū)分大小寫。允許使用漢字作為變量名,漢字總數(shù)一般不超過4個。變量名不能與SPSS的保留字相同。SPSS的保留詞包括,2.2 PSS數(shù)據(jù)文件建立,(1)數(shù)據(jù)結(jié)構(gòu)定義變量類型,2.2 PSS數(shù)據(jù)文件建立,(1)數(shù)據(jù)結(jié)構(gòu)定義變量類型具體描述如下表所示:2.2 PSS數(shù)據(jù)文件建立,(1)數(shù)據(jù)結(jié)構(gòu)定義變量寬度設(shè)置變量寬度。通常不需要調(diào)整,直接采用默認(rèn)值。它的大小可以通過“寬度”列后面的微調(diào)按鈕進(jìn)行調(diào)整。如果變量類型是數(shù)字,則可以設(shè)置變量的十進(jìn)制數(shù),而其他類型的變量則不能。十進(jìn)制數(shù)字默認(rèn)為兩個變量名標(biāo)簽??紤]到與舊版本的兼容性,變量名應(yīng)限制在8位以內(nèi),盡可能避免使用中文,因?yàn)橹形目赡懿荒芡耆枋鲎兞康男畔ⅰT谶@種情況下,可以在標(biāo)簽中進(jìn)一步解釋變量名。標(biāo)簽欄的使用不僅可以詳細(xì)解釋變量,還可以使用中文,極大地方便了用戶對變量的理解。2.2SPSS數(shù)據(jù)文件的建立,(1)數(shù)據(jù)結(jié)構(gòu)定義變量值標(biāo)簽(Values)變量值標(biāo)簽是對變量可能值的進(jìn)一步解釋,標(biāo)簽內(nèi)容最多可有120個字符,通常只指定值類型或分類變量的值標(biāo)簽。例如,將變量Departmt定義為數(shù)值變量時,可以遵循下表中指定的值和值標(biāo)簽。具體的定義方法如下圖所示。2.2建立SPSS數(shù)據(jù)文件,(1)數(shù)據(jù)定義缺失值的結(jié)構(gòu)SPSS統(tǒng)計(jì)軟件的另一個特點(diǎn)是缺失數(shù)據(jù)可以通過制作缺失值來定義,以便其他有效數(shù)據(jù)可以更好的使用。列寬定義數(shù)據(jù)窗口中顯示的變量的寬度。對齊定義變量值顯示的對齊,默認(rèn)為左對齊。指標(biāo)根據(jù)統(tǒng)計(jì)數(shù)據(jù)的類型定義指標(biāo)。度量在數(shù)據(jù)分析中的作用并不明顯,但是如果用戶想要制作交互式繪圖,他們必須很好地定義度量。2.2建立SPSS數(shù)據(jù)文件,(1)數(shù)據(jù)定義缺失值的結(jié)構(gòu)SPSS統(tǒng)計(jì)軟件的另一個特點(diǎn)是缺失數(shù)據(jù)可以通過制作缺失值來定義,以便其他有效數(shù)據(jù)可以更好的使用。角色輸入:變量將用作輸入(如預(yù)測變量、自變量)。目標(biāo):變量將用作輸出或目標(biāo)(如因變量)。兩者:變量將被用作輸入和輸出。無:變量沒有角色分配。劃分:變量用于將數(shù)據(jù)劃分為單獨(dú)的訓(xùn)練、檢查和驗(yàn)證樣本。拆分:此角色被設(shè)置為與SPSSModeler兼容。具有此角色的變量將不會用作SPSSStatistics中的拆分文件變量。2.2SPSS數(shù)據(jù)文件的建立,(2)數(shù)據(jù)錄入的一般方法是從Word或Excel中逐行直接復(fù)制并粘貼到數(shù)據(jù)文件中連續(xù)粘貼同樣的值到帶有變量值標(biāo)簽的數(shù)據(jù)中(變量值標(biāo)簽可以使我們在輸入數(shù)據(jù)時更加方便)當(dāng)輸入定義變量值標(biāo)簽的數(shù)據(jù)時,可以直接輸入變量值或以下拉列框的形式輸入,如圖2.3所示。2.2建立SPSS數(shù)據(jù)文件,2.2.4從其他數(shù)據(jù)文件導(dǎo)入數(shù)據(jù)建立數(shù)據(jù)文件(1)直接打開選擇菜單文件打開數(shù)據(jù),彈出打開文件對話框,左鍵點(diǎn)擊文件類型,可以看到SPSS可以打開的數(shù)據(jù)文件的類型。如下表所示,23,2.2建立SPSS數(shù)據(jù)文件,2.2.4從其他數(shù)據(jù)文件導(dǎo)入數(shù)據(jù)建立數(shù)據(jù)文件(1)直接打開,表示:最常用的是直接打開Excel數(shù)據(jù)文件。當(dāng)以Excel格式打開文件時,默認(rèn)情況下,SPSS會將Excel工作表中的所有數(shù)據(jù)讀入SPSS數(shù)據(jù)編輯窗口,但它也可以指定只讀取工作表中某個區(qū)域的數(shù)據(jù)。如果變量名信息存儲在Excel工作表文件的第一行或指定讀取區(qū)域的第一行,則應(yīng)選擇打開對話框中的“讀取變量名稱表單第一行數(shù)據(jù)”復(fù)選框,即工作表第一行或指定讀取區(qū)域第一行的文本信息用作SPSS的變量名。如果未選擇此項(xiàng),SPSS的變量名將自動命名為V1、V2等。,2.2SPSS數(shù)據(jù)文件建立,2.2.4從其他數(shù)據(jù)文件導(dǎo)入數(shù)據(jù)建立數(shù)據(jù)文件(2)數(shù)據(jù)庫查詢方法如果數(shù)據(jù)是數(shù)據(jù)庫格式文件,可以使用相同的數(shù)據(jù)庫查詢方法將數(shù)據(jù)導(dǎo)入SPSS。操作步驟如下:步驟1:選擇菜單“文件打開數(shù)據(jù)庫新建查詢”打開數(shù)據(jù)庫向?qū)Т翱?。這里顯示了所有可以打開的數(shù)據(jù)源類型。步驟2用戶根據(jù)打開文件的向?qū)нx擇要打開的文件類型,并逐步打開文件。2.2建立SPSS數(shù)據(jù)文件,2.2.4從其他數(shù)據(jù)文件導(dǎo)入數(shù)據(jù)建立數(shù)據(jù)文件(3)從文本文件導(dǎo)入文本格式數(shù)據(jù)文件是最常見的格式數(shù)據(jù)文件之一,SPSS提供了讀取文本文件的特殊功能。選擇菜單“文件打開文本數(shù)據(jù).”,將彈出“打開文件”對話框。選擇要導(dǎo)入的文本文件的名稱后,將出現(xiàn)文本數(shù)據(jù)向?qū)?。該向?qū)且粋€6步打開向?qū)?,每個步驟可以根據(jù)文本文件的格式和導(dǎo)入數(shù)據(jù)的需要來設(shè)置。主要內(nèi)容2.1統(tǒng)計(jì)數(shù)據(jù)的收集2.2建立SPSS數(shù)據(jù)文件2.3編輯SPSS數(shù)據(jù)文件2.4處理SPSS數(shù)據(jù),2.3編輯SPSS數(shù)據(jù)文件,2.3.1合并數(shù)據(jù)文件SPSS提供兩種合并形式:一是橫向整合,將外部文件中的變量添加到當(dāng)前數(shù)據(jù)文件中;第二種是垂直合并,即把外部數(shù)據(jù)文件中的觀測數(shù)據(jù)添加到當(dāng)前數(shù)據(jù)文件中。水平整合,垂直合并,編輯2.3 PSS數(shù)據(jù)文件,合并2.3.1數(shù)據(jù)文件(1)水平整合,點(diǎn)擊“瀏覽”按鈕選擇要合并的SPSS數(shù)據(jù)文件的文件名,從左側(cè)文本框選擇要合并的變量,編輯2.3 PSS數(shù)據(jù)文件,2.3.1合并數(shù)據(jù)文件(1)水平整合中垂直合并數(shù)據(jù)文件的操作方法與水平整合相似。此處不再重復(fù)操作,但應(yīng)注意以下幾點(diǎn):待合并的兩個SPSS數(shù)據(jù)文件內(nèi)容的合并應(yīng)具有實(shí)際意義;兩個數(shù)據(jù)文件的結(jié)構(gòu)最好是一致的;不同數(shù)據(jù)文件中具有相同含義的變量最好使用相同的變量名和數(shù)據(jù)類型。2.3SPSS數(shù)據(jù)文件的編輯和2.3.2數(shù)據(jù)文件的拆分所謂數(shù)據(jù)文件的拆分并不意味著將數(shù)據(jù)文件拆分成幾個,而是根據(jù)實(shí)際情況根據(jù)變量對數(shù)據(jù)進(jìn)行分組,為以后的分組統(tǒng)計(jì)分析提供方便。編輯2.3SPSS數(shù)據(jù)文件,拆分2.3.2數(shù)據(jù)文件,選項(xiàng)1:不拆分,也用于取消原來的拆分;選項(xiàng)2和3:分割數(shù)據(jù),并將分割變量選擇到“分組方法”框中。數(shù)據(jù)拆分后排序、編輯SPSS數(shù)據(jù)文件2.3、拆分?jǐn)?shù)據(jù)文件2.3.2的方法表明,在“拆分文件”對話框中,“比較組”和“按組組織輸出”的區(qū)別在于:前者將分組統(tǒng)計(jì)結(jié)果輸出到同一個表中,便于不同組之間的比較;后者分別在不同的表中輸出分組統(tǒng)計(jì)結(jié)果。通常選擇第一種輸出模式。要取消數(shù)據(jù)拆分,只需選擇“分析所有案例而不創(chuàng)建組”。數(shù)據(jù)可以分為多個部分,類似于數(shù)據(jù)的多重排序。多個部分的順序取決于選擇拆分變量前后的順序。2.3、2.3SPSS數(shù)據(jù)文件編輯,2.3.3數(shù)據(jù)選擇數(shù)據(jù)選擇即根據(jù)觀測測量的選擇條件分析選擇觀測測量目的有時為了進(jìn)行具體分析,需要從所有數(shù)據(jù)中選擇一些數(shù)據(jù)進(jìn)行統(tǒng)計(jì)分析。例如,有關(guān)于學(xué)生表現(xiàn)的數(shù)據(jù)。如果只分析男生的結(jié)果,那么男生的數(shù)據(jù)應(yīng)該用選擇視圖來衡量。2.3編輯SPSS數(shù)據(jù)文件,2.3.3數(shù)據(jù)選擇,以及1)所有情況:選擇了所有觀測測量,這可用于取消原始觀測測量選擇。(2)如果條件滿足,則表示根據(jù)規(guī)定的條件選擇觀測;(3)隨機(jī)病例樣本:隨機(jī)抽樣觀察,即在數(shù)據(jù)編輯窗口中隨機(jī)篩選所有病例,包括兩種方式的隨機(jī)篩選;一種是近似抽樣,即系統(tǒng)在輸入抽樣比例后進(jìn)行隨機(jī)抽樣;第二個是精確采樣,即從第一次觀察中需要提取多少樣本。4)基于時間或案例跨度:按順序采樣,單擊“范圍.”按鈕定義要進(jìn)行的觀察次數(shù)。5)使用過濾變量:使用指定的變量(僅數(shù)字變量)進(jìn)行過濾,即根據(jù)過濾變量的值選擇樣本。將選擇變量值不是0或缺少值的情況。此方法通常用于排除包含缺失系統(tǒng)值的案例。設(shè)置所選案例的輸出形式:1)生成一個名為filter_$的新變量,其值為0或1;2)選定的病例被輸出到新的數(shù)據(jù)文件,2.3編輯SPSS數(shù)據(jù)文件,以及2.3.3數(shù)據(jù)加權(quán)。所謂的加權(quán)是指在所有觀測測量中相同觀測值出現(xiàn)的次數(shù)或頻率。SPSS的觀察加權(quán)函數(shù)是在數(shù)據(jù)文件中選擇一個變量。該變量中的值是相應(yīng)觀察發(fā)生的次數(shù)。這個變量被稱為權(quán)重變量。SPSS中規(guī)定的加權(quán)變量的本質(zhì)是數(shù)據(jù)重復(fù)。例如,表2-5顯示了工人每天生產(chǎn)的產(chǎn)品數(shù)量。第一行數(shù)據(jù)顯示,當(dāng)天有3名工人生產(chǎn)了20種產(chǎn)品。將“工人數(shù)量”作為加權(quán)變量后,數(shù)據(jù)實(shí)際上轉(zhuǎn)換成表2-6所示的數(shù)據(jù)進(jìn)行分析。表2-5、表2-6、2.3編輯SPSS數(shù)據(jù)文件和2.3.3數(shù)據(jù)加權(quán):一旦指定了加權(quán)變量,加權(quán)將保持有效,直到在隨后的分析和處理中取消加權(quán)。只有數(shù)值變量可以用作加權(quán)變量。主要內(nèi)容2.1統(tǒng)計(jì)數(shù)據(jù)的收集2.2建立SPSS數(shù)據(jù)文件2.3編制SPSS數(shù)據(jù)文件2.4 PSS數(shù)據(jù)處理2.4 PSS數(shù)據(jù)處理2.4變量的計(jì)算2.4.1輸入新生成變量的變量名,輸入計(jì)算公式,在SPSS中提供函數(shù)進(jìn)行計(jì)算,使用這些函數(shù)可以生成指定分布的隨機(jī)數(shù),給定參數(shù)的概率密度函數(shù)等。2.4SPSS數(shù)據(jù)處理,2.4.2數(shù)據(jù)的可視化離散化由SPSS提供的可視化離散化函數(shù)可將連續(xù)數(shù)值數(shù)據(jù)從小到大分組(測量值從最低到最高分組),從而將等距或比率變量轉(zhuǎn)換為不連續(xù)變量。2.4.2數(shù)據(jù)的可視化離散化顯示在第41頁案例2-5,5,2.4SPSS數(shù)據(jù)處理中,在此框中選擇要分組的變量“評估結(jié)果”。選擇“轉(zhuǎn)換可視化離散化”彈出右圖所示的變量選擇對話框,2.4SPSS數(shù)據(jù)處理,2.4.2可視化離散化參見第41頁示例2-5,輸入存儲段值的新變量的名稱,點(diǎn)擊此按鈕設(shè)置段分段點(diǎn),2.4.2可視化數(shù)據(jù)離散化。(1)按變量值的等間距分割:在“第一分割點(diǎn)的位置”中輸入第一個斷點(diǎn)處的值,在“寬度”欄中輸入組段中變量值的長度,“分割點(diǎn)的數(shù)量”欄中自動出現(xiàn)的斷點(diǎn)數(shù)量,以及2.4秒的數(shù)據(jù)處理。該圖提供了三種自動劃分組段的方法、(2)按觀察值的數(shù)量等比例分組:在“劃分點(diǎn)數(shù)”欄中輸入斷點(diǎn)的數(shù)量。系統(tǒng)自動輸出每組中觀察值的數(shù)量與“寬度”的比例,(3)根據(jù)變量的平均值和標(biāo)準(zhǔn)偏差產(chǎn)生分段劃分,2.4 PSS數(shù)據(jù)處理,2.4.2數(shù)據(jù)的可視化離散化和分段劃分的結(jié)果,2.4 PSS數(shù)據(jù)處理,2.4.2數(shù)據(jù)記錄是重新

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負(fù)責(zé)。
  • 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時也不承擔(dān)用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

評論

0/150

提交評論