




版權說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權,請進行舉報或認領
文檔簡介
1、SPSS四種輸出結果:樞軸表/輕量表、文本格式、統(tǒng)計圖表、模型SPSS四種窗口:語法窗口、輸出窗口、數(shù)據(jù)窗口、腳本窗口SPSS三種運行方式:命令行方式、批程序方式、菜單對話框SPSS默認文件類型:數(shù)據(jù)文件*.sav:此為SPSS軟件默認的數(shù)據(jù)文件格式,雙擊可由SPSS直接讀取。命令文件*.sps:可在語法編輯程序(syntax)中先編寫或貼上欲執(zhí)行之分析指令,并將其存貯起來,供日后重復使用或檢查之用。輸出文件*.spo: 允許直接加以編輯或轉貼到其他編輯軟件,SPSS 16.0版之后將輸出文件的默認格式改為*.spv。 數(shù)據(jù)文件清洗多余重復的數(shù)據(jù)篩選清楚,將確實的數(shù)據(jù)補充完整,將錯誤的數(shù)據(jù)糾正
2、或刪除。 數(shù)據(jù)標識重復個案 標識異常個案問題的答案被稱作變量的取值。將答案轉變成可用于統(tǒng)計分析的數(shù)據(jù),需要經(jīng)過一個被稱作“編碼coding”的過程。數(shù)據(jù)陣/數(shù)據(jù)文件:n個案例、m個變量構成的陣列SPSS對數(shù)據(jù)的處理是以變量為基礎的。所以,數(shù)據(jù)錄入前一定先定義變量及其屬性,包括指定名稱、(存儲)類型、寬度、小數(shù)、標簽、值、缺失、列(寬)、對齊、度量標準和角色。這也被稱作建立數(shù)據(jù)框架。變量名必須以字母、漢字或字符開頭,數(shù)字不可以,其他字符可以是任何字母、數(shù)字或_、#、$等符號。變量名中不能有空白字符或其他特殊字符(如“!”、“?”、“*”等)。 變量名最后一個字符不能是英文句號(.)。在SPSS中
3、不區(qū)分大小寫。例如,HXH、hxh或Hxh對SPSS而言,均被視為同一個變量。SPSS的保留字不能作為變量的名稱,如ALL、AND、BY、EQ、GE、GT、LT、NE、NOT、OR、TO、WITH等。SPSS中變量有3種基本類型:數(shù)值型、字符型(區(qū)分大小寫)和日期型。但根據(jù)不同的顯示方式,數(shù)值型又被區(qū)分成:數(shù)值、逗號、圓點、科學計數(shù)法、美元、(用戶)設定貨幣等6個子類型。不過,只有數(shù)值(N)最為常用。默認狀態(tài)下,所有變量的類型均為數(shù)值型,且寬度是8位、小數(shù)位是2位。對話框界面可修改寬度和小數(shù)位,然后“確定”,但寬度必須大于小數(shù)位。變量標簽是對變量名的進一步描述,可長達120個字符SPSS有兩類
4、缺失值:系統(tǒng)默認缺失值和用戶定義缺失值。對于數(shù)值型變量值,系統(tǒng)默認缺失值為圓點“.”,而字符型變量值的系統(tǒng)默認缺失值為空字符串(什么也沒有)。指定“列”實際上是設定變量的顯示寬度,默認為8個字符的寬度。統(tǒng)計學中,按照對事物描述的精確程度,將度量標準從低到高區(qū)分為4種類型:定類尺度:僅能測定類別差,不能比較大小,各類之間沒有順序和等級,只能計算頻數(shù)頻率百分比,可以使用數(shù)值型變量,也可以是字符型變量。要符合窮盡和互斥的原則。定序尺度:可比較優(yōu)劣或排序,但數(shù)值不代表絕對數(shù)量大小,可以是數(shù)值型變量,可以是字符型變量??梢杂嬎泐l數(shù)、頻率和累計頻率、累計頻數(shù)。定距尺度:不僅能區(qū)分不同類型并排序,還能指出類
5、別之間的差距是多少,最典型的是溫度。嚴格來說只能加減。其0值沒有物理含義,沒有絕對的“0”點,故不能做乘、除運算。定比尺度:測算兩個測度值之間比值,與定距變量相比差別是有一個固定的絕對“零點”。0在定距變量中僅是一個測量值,而定比變量真正表示沒有??梢约訙p乘除。E.g.重量、年齡可以將高層次測量尺度的結果轉換為低層次測量尺度的測量結果,但不能把低層次的轉化為高層次的。半開放題的處理:指定變量時,可以使用兩個變量,第1個變量中,“其他”作為一個選項;第2個變量將“其他”中“請注明”的內(nèi)容作為一個單獨的開放題,而將沒有選擇“其他”一項的案例在此變量上的取值作為系統(tǒng)缺失值。為使得變量名之間具有一定的
6、邏輯聯(lián)系,可以考慮將第二個變量的名稱設置為由第一個變量名稱后直接加“a”之類的字符。多選題的處理:多重二分法:編碼時,將每一個選項定義成一個變量,有幾個選項就有幾個變量,且均以取值等于1表示選了該項、以取值等于0表示未選該項。(標準處理方式)多重分類法:也是利用多個變量來對一個多選題的答案進行編碼。應該用多少個變量,取決于實際可能給出的最多答案的數(shù)目而定。這多個變量必須為數(shù)值型變量,所有變量采用同一套取值標簽。Excel、txt的文件讀取之后要保存為SPSS的文件。插入終止線時,開始(即0列)處和結尾(最后一列)處必須插入,否則會少變量F4.0 A1 F是數(shù)值型 A是字符串 F4.0就是 數(shù)值
7、型 寬度是4 小數(shù)是0什么是固定寬度的,什么是分隔符等分開的?數(shù)據(jù)管理轉換變量級別的計算新變量:compute已有變量值的分組合并:recode(重新編碼為不同/相同變量)將度量變量重新分組為序號變量,或者將序號變量、名義變量的不同取值加以歸類合并“重新編碼為相同變量”:對現(xiàn)有變量直接進行編碼,保留該變量,只是根據(jù)設定的規(guī)則替換掉原來的取值?!爸匦戮幋a為不同變量”:根據(jù)現(xiàn)有變量的取值生成一個新變量來保存重新編碼的結果。包括端點!連續(xù)變量的離散化如果想進行的分組是比較有規(guī)律的,例如,等距分組,或等樣本量分組,可以使用SPSS提供的“可視離散化”過程進行分組。SPSS提供了兩種可視離散化:需用戶自
8、行判斷設定的可視離散化和基本全自動的最優(yōu)離散化。建議生成分割點的時候先填第一個分割點的位置和個數(shù),然后自動生成寬度。變量的自動重編碼與數(shù)值移動自動重編碼:自動按照原變量取值的大小或字符順序生成新變量,而新變量的值就是原變量值大小的序號或先后序次。個案排秩:變量的排秩實際上就是根據(jù)某個變量的取值大小來對個案排次序,同時將得到的排序結果保存到一個新變量中。雖然效果同樣都是基于某個變量對個案進行排序,但“個案排秩”過程比“自動重新編碼”過程更為靈活。 結:遇到相同取值如何給序號值默認為最常用的秩:新變量的值等于原變量取值的序號數(shù)值移動:在SPSS中,一種方式是以“計算變量”過程利用Lag( )函數(shù)、
9、Lead( )函數(shù)來實現(xiàn) lag函數(shù)是返回之前的,取前面的數(shù)(滯后),在雜項里面;lead函數(shù)是返回后面的,取后面的數(shù)(提前),但是計算變量里面沒有l(wèi)ead函數(shù)了轉換轉換值“轉換”菜單中的其他功能“對個案內(nèi)的值計數(shù)”過程用于標識某個變量中是否出現(xiàn)了某個值或某個范圍的值,也可以計算一組變量中出現(xiàn)特定取值的變量個數(shù)。數(shù)據(jù)文件級別的排序個案用戶所指定的變量被稱作排序變量排序個案v.s.個案排秩 區(qū)別:是否產(chǎn)生新變量;個案相對位置是否變動。拆分文件 可以和選擇個案達到同樣的目的按照不同組分別匯總統(tǒng)計結果 “按組組織輸出”拆分文件一旦設定,除非另行取消,否則將在后續(xù)的數(shù)據(jù)處理和分析中一直有效,而且會被另
10、存在數(shù)據(jù)集里。選擇個案(篩選)除了拆分文件的功能,還有并不想對全部個案進行分析,而只是想對其中的一部分進行分析,這也需要用到“選擇個案”過程。過濾掉未選中個案:默認未選中個案不包括在分析中,但保留在數(shù)據(jù)中;并在數(shù)據(jù)文件中生成名為filter_$的變量加以標識,取值1表示被選中,0表示未被選中;數(shù)據(jù)視圖最左端未被選中個案處會標以反斜杠。選擇個案一旦設定,除非另行取消,否則將在后續(xù)的數(shù)據(jù)處理和分析中一直有效,而且會被另存在數(shù)據(jù)集里。隨機個案樣本 精確 后面的兩個框框:第一個框表示樣本的容量。第二個框表示樣本的范圍,也就是從第一個個案開始到第多少個個案老師隨機抽選同學回答問題就是這樣做的。加權個案給
11、不同個案賦以不同的權重,以改變個案在統(tǒng)計分析中的重要性。通常兩種情況下會用到這一過程:以頻數(shù)形式錄入的數(shù)據(jù);不等概率樣本數(shù)據(jù)。加權個案一旦設定,除非另行取消,否則將在后續(xù)的數(shù)據(jù)處理和分析中一直有效,而且會被另存在數(shù)據(jù)集里。(同樣的還有選擇個案和拆分文件)分類匯總按指定的分類變量對個案進行分組,并按分組對變量求指定的描述性統(tǒng)計量,結果可以另存為新數(shù)據(jù)文件,也可以直接(生成新變量)添加到當前數(shù)據(jù)文件。個案數(shù):定義一個新變量,其取值等于每一分組下的個案數(shù)目上方、下方都是開區(qū)間內(nèi)部:取值大于等于a且小于等于b外部:取值小于a或大于b分類匯總與拆分文件兩個過程有何異同:分類匯總還對變量做了描述性統(tǒng)計,而
12、拆分文件只是對變量做了分類匯總,對變量進行描述還需要進一步的操作。數(shù)據(jù)文件的重組 (指的是長、寬格式之間的轉換)數(shù)據(jù)錄入的默認格式每一案例占一行、每一變量占一列。這種數(shù)據(jù)被稱作寬格式數(shù)據(jù)某些特殊情況下,比如重復測量數(shù)據(jù),進行分析時需要采用長格式數(shù)據(jù),即:按照每一觀測(observation)占一行、同一個案占多行的格式排列的數(shù)據(jù)。(標識符變量、索引變量)長寬 將選定個案重組為變量轉換后原文件中的數(shù)據(jù)被直接替換,但文件名沒有變。寬長 將選定變量重組為個案數(shù)據(jù)文件的合并縱向拼接/垂直合并 添加的是個案橫向合并/水平合并 添加的是變量若使用關鍵變量(指定橫向合并時按照什么樣的規(guī)則進行對應)進行橫向合
13、并,則各數(shù)據(jù)文件都必須事先按照關鍵變量取值進行升序排列,否則會出錯。為便于以SPSS進行橫向合并,各數(shù)據(jù)文件中,表示不同含義的變量盡量采用不同的變量名稱。單變量描述統(tǒng)計:集中趨勢測量(中心性、中心測量)眾數(shù)(適用于任何測量等級的變量:名義、序號和尺度變量)中位數(shù)(只適用于序號、尺度變量,而不適用于名義變量,序號變量要還原到數(shù)字本來代表的意思,有一半的被調查對象的在以下/上)均值(均值是數(shù)據(jù)分布的平衡點。只適用于尺度變量,而不適用于名義、序號變量。另外,均值對變量的取值大小很敏感,故,對于存在極端值的情形,均值不宜用作反映變量分布集中趨勢的指標,更好的選擇是中位數(shù)。)左偏(負偏態(tài)):均值中位數(shù)眾
14、數(shù)右偏(正偏態(tài)):眾數(shù)中位數(shù)0,故也稱正偏態(tài);當分布為左偏態(tài)時,SK 0.05,故接受零假設,即三地居民在消費信心上不存在顯著的差別。單側檢驗:備擇假設a 是右側檢驗 計算出雙側sig值之后除以2,再拿1減去這個數(shù),再和0.05比較左側檢驗就是拒絕域在左邊誤差=隨機誤差(因素的同一水平下各觀測值之間的差異)+系統(tǒng)誤差(因素的不同水平下各觀測值之間的差異)組內(nèi)方差只包括隨機誤差 組間方差既包括隨機誤差,也包括系統(tǒng)誤差SST=SSE+SSA交叉表與卡方檢驗 針對分類變量(包括名義和序號)之間獨立性檢驗的工作可以通過SPSS的“交叉表過程”提供的“卡方檢驗”來完成。分類變量間關系的統(tǒng)計描述分類變量間
15、關系的統(tǒng)計推斷分類變量間關系強度的測度問題1:從(樣本)數(shù)據(jù)來看變量間有關聯(lián)嗎? 查看SPSS形成的交叉表回答問題2:若有關系,那么這個關系是否也存在總體中? 執(zhí)行2(卡方)檢驗回答問題3:若變量間有關系,這個關系有多強? 估計相應的關聯(lián)測度指標來回答交叉表:列邊緣分布、行邊緣分布 一般自變量放在列,因變量放在行 條件分布分析 描述統(tǒng)計 交叉表 單元格期望的計數(shù):零假設成立條件下每單元格中的頻數(shù)。H0:總體中性別與學歷無關 H1:總體中性別與學歷有關若H0為真的話,觀測的計數(shù)與期望的計數(shù)應較為接近;反之,若兩者差別較大,則H0很可能不成立。卡方檢驗的自由度:(行變量的個數(shù)-1)(列變量的個數(shù)-1)分析關系強度:在統(tǒng)計量這一選項里面 “相關”適合兩個尺度變量;“名義”適合兩個名義變量;“有序”適合兩個序號變量;“按區(qū)間標定”適合一個名義變量和一個尺度變量。和相依系數(shù)越大,表示關聯(lián)越強。Lamb
溫馨提示
- 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權益歸上傳用戶所有。
- 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預覽,若沒有圖紙預覽就沒有圖紙。
- 4. 未經(jīng)權益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
- 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負責。
- 6. 下載文件中如有侵權或不適當內(nèi)容,請與我們聯(lián)系,我們立即糾正。
- 7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。
最新文檔
- 微電網(wǎng)發(fā)電機組與儲能系統(tǒng)的多目標優(yōu)化設計考核試卷
- 投標文件編制中的成本控制要點考核試卷
- 廢料處理技術創(chuàng)新與應用考核試卷
- 農(nóng)村土地租賃合同中的租賃物保險制度解析考核試卷
- 2025年中國PP聚丙烯塑料漆數(shù)據(jù)監(jiān)測報告
- 2025年中國PB地板采暖管數(shù)據(jù)監(jiān)測報告
- 2025年中國COD消解加熱器數(shù)據(jù)監(jiān)測研究報告
- 2025年中國3-辛酮數(shù)據(jù)監(jiān)測報告
- 高支模板工程培訓
- 2025至2030年中國食堂自動售飯結算系統(tǒng)市場分析及競爭策略研究報告
- 住宅工程質量通病防治方案及施工措施
- 醬料生產(chǎn)知識培訓課件模板
- 高墩(40m高)安全專項施工方案(專家)
- 苯系物的危害及怎樣預防
- 腸梗阻護理查房(小腸減壓管的應用)
- 檔案密集架采購投標方案(技術標)
- 診所的可行性報告
- 中南大學工程測量實習報告
- 40篇 短文搞定3500詞匯
- 行風建設培訓課件
- 思政課說課稿課件
評論
0/150
提交評論