版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進行舉報或認(rèn)領(lǐng)
文檔簡介
1、傳播優(yōu)秀Word版文檔 ,希望對您有幫助,可雙擊去除!Spss的數(shù)據(jù)預(yù)處理一、 數(shù)據(jù)預(yù)處理的目的:在數(shù)據(jù)文件建立好后,通常還要對待分析的數(shù)據(jù)進行必要的預(yù)加工處理,這是數(shù)據(jù)分析過程中不可缺少的一個關(guān)鍵環(huán)節(jié)。數(shù)據(jù)的預(yù)加工處理是服務(wù)與數(shù)據(jù)分析和建模的,需要解決的問題如下:1、缺失值和異常數(shù)據(jù)的處理。2、數(shù)據(jù)的轉(zhuǎn)換處理。數(shù)據(jù)的轉(zhuǎn)換處理是在原有數(shù)據(jù)的基礎(chǔ)上,計算產(chǎn)生一些含有更豐富信息的新數(shù)據(jù)或?qū)?shù)據(jù)原有分布進行轉(zhuǎn)換等。3、數(shù)據(jù)抽樣。從實際問題、算法或效率等方面考慮,并非收集到的所有數(shù)據(jù)(個案)在某項分析中都有用途,有必要按照一定的規(guī)則從大量數(shù)據(jù)中選取部分樣本參與分析。4、選取變量。并非所有數(shù)據(jù)項(變量)
2、在某項分析中均有意以,選取部分變量參與分析是必要的。Spss提供了一些專門的功能輔助用戶實現(xiàn)數(shù)據(jù)的預(yù)加工處理工作,通過預(yù)處理還可以使用戶對數(shù)據(jù)的總體分布有所了解。二、數(shù)據(jù)預(yù)處理步驟:1、數(shù)據(jù)的排序: (1)數(shù)據(jù)排序的目的: a、通常數(shù)據(jù)編輯窗口中個案的前后次序是由數(shù)據(jù)數(shù)錄入的先后順序決定的,數(shù)據(jù)排序便于數(shù)據(jù)的瀏覽,有助于了解數(shù)據(jù)取值狀況、缺失值數(shù)量的多少。 b、通過數(shù)據(jù)排序能夠快速找到最大值和最小值,進而可以計算出數(shù)據(jù)的全距,快速把握和比較數(shù)據(jù)的離散程度。 c、通過數(shù)據(jù)排序能夠快速發(fā)現(xiàn)數(shù)據(jù)的異常值。 (2)、數(shù)據(jù)排序的步驟: a、選擇菜單:【Date】【Sort Cases】 b、指定主排序量
3、到【Sort by】框中,并選擇【Sort Order】框中的選項指出傳播優(yōu)秀Word版文檔 ,希望對您有幫助,可雙擊去除!該變量按升序還是降序排序排序?!続scending】表示升序,【Descending】表示降序。 c、如果是多重排序,還要依次指定第二、第三排序變量及相應(yīng)的排序規(guī)則。否則本部可略。排序窗口如下圖: 圖12、變量計算:(1)變量計算的目的: a、通過數(shù)據(jù)的轉(zhuǎn)換處理,在原有數(shù)據(jù)的基礎(chǔ)上,計算產(chǎn)生一些含量更豐富的新數(shù)據(jù)。 b、對數(shù)據(jù)的原有分布狀態(tài)進行轉(zhuǎn)換,由于數(shù)據(jù)分析和建模中某些模型對數(shù)據(jù)分布 有一定的要求,因此可以利用變量計算對原有數(shù)據(jù)的分布進行轉(zhuǎn)換。 c、spss變量計算是
4、在原有數(shù)據(jù)的基礎(chǔ)上,根據(jù)用戶給出的spss的算術(shù)表達式以及傳播優(yōu)秀Word版文檔 ,希望對您有幫助,可雙擊去除!函數(shù),對所有個案或滿足條件的部分個案,計算產(chǎn)生一系列新變量。(2)變量計算的操作步驟: a、選擇菜單:【Transform】【Compute Variable】 出現(xiàn)如圖2所示窗口: 圖2 b、在【Numeric Exepression】框給出spss算術(shù)表達式和函數(shù)??梢允止ぽ斎胍部梢园创翱诘陌粹o算數(shù)表達式和函數(shù)的輸入工作。c、在【Target Variable】框中輸入存放結(jié)果的變量名。d、如果用戶只希望對符合一定條件的個案計算產(chǎn)生變量,則按if按鈕,出現(xiàn)如圖3所示的窗口。選擇【
5、Include if case satisfies condition】選項,然后輸入條件表達式,否則本步略去。傳播優(yōu)秀Word版文檔 ,希望對您有幫助,可雙擊去除! 圖3 3、變量的選取: (1)數(shù)據(jù)選取的目的: a、提高數(shù)據(jù)的分析效率。 b、檢驗?zāi)P汀?(2)數(shù)據(jù)選取的步驟:a、【Date】【Select Case】 b、在【Select】框中選擇選取方法。如圖4所示:傳播優(yōu)秀Word版文檔 ,希望對您有幫助,可雙擊去除! 圖4 4、計數(shù): (1)計數(shù)的目的: 把握個案各方面的特征。 (2)計數(shù)的步驟: a、選擇菜單:【Transform】【Count Values within Case
6、s】如圖5所示: b、選擇參與計數(shù)的變量到【Numeric Variables】框中。 c、在【Target Variable】框中輸入存放技術(shù)結(jié)果的的變量名,并在【Target Label】框中輸入相應(yīng)的變量名標(biāo)簽。 傳播優(yōu)秀Word版文檔 ,希望對您有幫助,可雙擊去除! 圖5d、按Define Values 按鈕定義計數(shù)區(qū)間,出現(xiàn)圖6所示窗口。通過Add、Change、Remove按鈕完成計數(shù)區(qū)間的增加、修改和刪除。 e、如果僅希望對滿足條件的個案進行計數(shù),則按if按鈕并輸入spss相應(yīng)表達式。否則本部可略。傳播優(yōu)秀Word版文檔 ,希望對您有幫助,可雙擊去除! 圖65、分類匯總: (1)
7、【Date】【Aggregate】 (2)指定分類變量到【Break Variables】框中,指定匯總變量到【aggregated Variables】 框中,如圖7: (3)按function按鈕指定對匯總變量計算那些統(tǒng)計量。Spss默認(rèn)計算均值。 (4)制定將匯總結(jié)果保存到何處。 (5)按name&Lab按鈕重新指定匯總結(jié)果中的變量名或變量名標(biāo)簽。 (6)如果希望在結(jié)果文件中保存各分類組的個案數(shù)則選擇【Number of cases】.傳播優(yōu)秀Word版文檔 ,希望對您有幫助,可雙擊去除!6、數(shù)據(jù)分組: (1)【Transform】【Recode into Dfferent Variab
8、les】 (2)選擇分組變量到【Numeric VariableOutput】框中。 (3)在【Numeric Variable】框中的【name】后輸入存放分組結(jié)果的變量名,并按change按鈕確認(rèn)。 (4)按old and new Values按鈕進行分組區(qū)間定義。如圖8所示: (5)如果只對符合條件的個案進行分組,則按if按鈕輸入spss條件表達式。 7、數(shù)據(jù)轉(zhuǎn)置: (1)【Date】【transpose】如圖9所示: (2)指定數(shù)據(jù)轉(zhuǎn)置后保留那些變量,將它們們選入【Variables】框中。 (3)指定數(shù)據(jù)轉(zhuǎn)置后應(yīng)保留那些變量名。8、加權(quán)處理: (1)【Date】【W(wǎng)eight Cas
9、es】 (2)選擇【W(wǎng)eight Cases by】選項,并選擇某變量作為加權(quán)變量到【Frequency Variable】框中。如圖10所示:傳播優(yōu)秀Word版文檔 ,希望對您有幫助,可雙擊去除!9、數(shù)據(jù)拆分: (1)數(shù)據(jù)拆分的目的: 根據(jù)指定變量對數(shù)據(jù)進行分組,它將為以后進行的分組統(tǒng)計分析提供便利。 (2)數(shù)據(jù)分組的步驟: a、【Date】【Split File】如圖11所示: b、選擇拆分變量到【Groups based on】框中。 c、拆分會使后面的分組統(tǒng)計產(chǎn)生兩種不同格式的結(jié)果。 d、如果數(shù)據(jù)編輯窗口中的數(shù)據(jù)已經(jīng)事先安所指定的拆分變量進行了排序,則可以選擇【File is alre
10、ady sorted】項,他可以提高拆分執(zhí)行的速度,否則選擇【Sort the file by grouping Variables】項。傳播優(yōu)秀Word版文檔 ,希望對您有幫助,可雙擊去除!三、spss數(shù)據(jù)預(yù)處理應(yīng)注意的事項: 1、數(shù)據(jù)排序時須注意的事項: (1)數(shù)據(jù)排序是整行數(shù)據(jù)排序,而不只是對某列變量進行排序 。 (2)多重排序中指定排序變量的次序很關(guān)鍵。 (3)數(shù)據(jù)排序以后,原有數(shù)據(jù)的排列必然別打亂。 2、變量計算: (1)如果指定存放計算結(jié)果的變量為新變量,spss會自動創(chuàng)建它,如果指定產(chǎn)生的變量已經(jīng)存在,spss會提問用戶是否以計算出的新值覆蓋原有舊值。(2)對不滿足指定條件的個案
11、,spss不進行變量值計算。對新變量取值為系統(tǒng)缺失值,對已有舊變量,變量值保持不變。 3、數(shù)據(jù)選?。?(1按上述操作步驟完成數(shù)據(jù)選取后,以后的spss分析操作僅針對那些被選中的個案直到用戶再次改變數(shù)據(jù)選取為止。 (2)采用按指定條件選取和隨機選取方法進行數(shù)據(jù)選取后,spss將在數(shù)據(jù),編輯窗口中自動生成一個名為filter_$的新變量,取值為1或0。1表示本條個案被選中,0表示為別選中。該變量是spss產(chǎn)生的中間變量,如果刪除它,則自動取消樣本選取。 4、分類匯總:(1)分類匯總中的分類變量可以是多個,此時的分類匯總陳偉多重分類匯總。(2)類似與數(shù)據(jù)排序,在多重分類匯總中,指定多個分類變量的先后次序是關(guān)鍵的。5、數(shù)據(jù)的分組: 在定義分組區(qū)間時,應(yīng)遵循補充不漏的原則。6、加權(quán)處理:傳播優(yōu)秀Word版文檔 ,希望對您有幫助,可雙擊去除! 一旦指定了
溫馨提示
- 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
- 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
- 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
- 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負(fù)責(zé)。
- 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請與我們聯(lián)系,我們立即糾正。
- 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時也不承擔(dān)用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。
最新文檔
- 《傅雷家書》有感范文10篇
- 簡單大方的辭職報告(集合8篇)
- 質(zhì)量月的活動總結(jié)合集15篇
- 少年宮活動計劃4篇
- 離職申請書(合集15篇)
- 2023小學(xué)四年級數(shù)學(xué)教學(xué)計劃
- 售后服務(wù)協(xié)議書六篇
- 老舊廠區(qū)改造項目實施方案
- 國家級產(chǎn)業(yè)園基礎(chǔ)設(shè)施項目運營方案
- 供氣項目初步設(shè)計
- 倉庫班長年終總結(jié)
- 北京市海淀區(qū)2023-2024學(xué)年四年級上學(xué)期期末英語試題
- LNG液化天然氣項目事故后果模擬分析評價
- 2024年湖北省漢江國有資本投資集團有限公司招聘筆試參考題庫含答案解析
- 脂肪肝健康教育-課件
- 廣州市九區(qū)聯(lián)考2023-2024學(xué)年高一上學(xué)期期末教學(xué)質(zhì)量監(jiān)測數(shù)學(xué)試卷(原卷版)
- 體育與健康(水平二)《花樣跳繩一級動作(18課時)》大單元教學(xué)計劃
- 游戲方案模板
- 地產(chǎn)集團品牌管理辦法
- 2024年廚房述職報告
- 腹腔穿刺術(shù)評分表
評論
0/150
提交評論