已閱讀5頁(yè),還剩74頁(yè)未讀, 繼續(xù)免費(fèi)閱讀
版權(quán)說(shuō)明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請(qǐng)進(jìn)行舉報(bào)或認(rèn)領(lǐng)
文檔簡(jiǎn)介
,數(shù)據(jù)管理,在數(shù)據(jù)文件建立好之后,還需要對(duì)數(shù)據(jù)進(jìn)行必要的加工處理。對(duì)同一個(gè)數(shù)據(jù)往往需要從各種不同的側(cè)面進(jìn)行研究,采取多種統(tǒng)計(jì)方法進(jìn)行分析,而不同的統(tǒng)計(jì)方法對(duì)數(shù)據(jù)文件結(jié)構(gòu)的要求不盡相同,這就需要對(duì)數(shù)據(jù)文件的結(jié)構(gòu)進(jìn)行重新調(diào)整或轉(zhuǎn)換,以便適合于相同的統(tǒng)計(jì)方法。,數(shù)據(jù)管理,文件級(jí)別的數(shù)據(jù)管理變量級(jí)別的數(shù)據(jù)管理,文件級(jí)別的數(shù)據(jù)管理(1),SPSS中的Data菜單提供了文件級(jí)別的數(shù)據(jù)管理,可以對(duì)整個(gè)數(shù)據(jù)文件進(jìn)行加工整理。,InsertVariable:插入變量InsertCases:插入記錄GotoCase:到達(dá)某條記錄,簡(jiǎn)單命令(這些功能都可以用鼠標(biāo)在數(shù)據(jù)表界面直接完成,很少用菜單操作,在此不詳述),SortCases:記錄排序SplitFile:記錄拆分SelectCases:記錄篩選WeightCases:記錄加權(quán),常用的簡(jiǎn)單過(guò)程(使用頻繁,必須掌握),文件級(jí)別的數(shù)據(jù)管理(2),DefineVariableProperties:定義數(shù)據(jù)字典CopyVariableProperties:將預(yù)定義的數(shù)據(jù)字典直接引入當(dāng)前數(shù)據(jù)文件,即復(fù)制外部數(shù)據(jù)文件屬性到當(dāng)前數(shù)據(jù)文件,變量與數(shù)據(jù)文件屬性向?qū)В▽?duì)大型或連續(xù)性數(shù)據(jù)分析項(xiàng)目非常有用),Transpose:數(shù)據(jù)轉(zhuǎn)置Restructure:數(shù)據(jù)文件的重新排列,數(shù)據(jù)重構(gòu)向?qū)?文件級(jí)別的數(shù)據(jù)管理(3),AddCases:縱向合并AddVariable:橫向合并,文件合并過(guò)程(MergeFiles),DefineDates:定義日期變量過(guò)程,用于時(shí)間序列數(shù)據(jù)Aggregate:數(shù)據(jù)匯總過(guò)程IdentifyDuplicateCases:查找重復(fù)記錄,其他過(guò)程,文件級(jí)別的數(shù)據(jù)管理(4),正交設(shè)計(jì)過(guò)程(OrthogonalDesign),單變量排序:SPSS提供了一種簡(jiǎn)易操作方法,即在數(shù)據(jù)表格的變量名處單擊右鍵,彈出右圖多變量排序:使用SortCases過(guò)程來(lái)進(jìn)行,查看詳情,記錄排序,記錄排序,選中District,選擇升序選鈕(默認(rèn)),將District選入Sortby框,選中Region,選擇降序選鈕,將Region選入Sortby框,記錄排序,注意:在多重排序中,指定排序變量名的次序很關(guān)鍵,首先安第一個(gè)變量排序,對(duì)于與第一個(gè)變量取值相同的記錄考慮按第二個(gè)變量排序排序后,原來(lái)記錄數(shù)據(jù)的排序?qū)⒈淮騺y,對(duì)于時(shí)間序列數(shù)據(jù),若未存放有記錄標(biāo)志的變量,應(yīng)注意保存原數(shù)據(jù)的排列順序,以免數(shù)據(jù)混亂,記錄排序,記錄拆分,1.選中此框不拆分文件,2.按所選變量拆分文件,各組分析結(jié)果放在一起便于比較,3.按所選變量拆分文件,各組分析結(jié)果單獨(dú)放置,4.用于選擇拆分?jǐn)?shù)據(jù)文件的變量,5.要求將數(shù)據(jù)按所用拆分變量排序,6.數(shù)據(jù)集很大,且拆分變量已排序,選此可節(jié)省運(yùn)行時(shí)間,1,2,3,4,5,6,記錄拆分,記錄篩選,1,2,3,4,5,1.分析所有記錄,2.分析滿足條件的記錄,按If按鈕設(shè)定篩選條件,3.從原數(shù)據(jù)中按某種條件抽樣,按Sample進(jìn)行設(shè)定,4.基于時(shí)間或記錄序號(hào)選擇記錄,按Range進(jìn)行設(shè)定,5.使用篩選指示變量選擇記錄,非0值的記錄被選中,6.未選中的記錄被隔離,7.未選中的記錄被刪除,6,7,記錄篩選,記錄篩選,記錄加權(quán),設(shè)置作為權(quán)重的變量,如第一行表示agecat1gender1的人共33個(gè),accid表示人數(shù),應(yīng)設(shè)為權(quán)重,記錄加權(quán),定義數(shù)據(jù)字典,變量名、測(cè)量尺度等,變量列表,頻數(shù)、標(biāo)簽、缺失值設(shè)定等,拷貝變量屬性,自動(dòng)生成值標(biāo)簽,定義數(shù)據(jù)字典,數(shù)據(jù)轉(zhuǎn)置,Transpose:該過(guò)程用于對(duì)數(shù)據(jù)進(jìn)行行列轉(zhuǎn)置,即原來(lái)的一條記錄轉(zhuǎn)成為一個(gè)變量,而變量則轉(zhuǎn)成為一個(gè)記錄,兩次Transpose過(guò)程后數(shù)據(jù)集會(huì)恢復(fù)原樣(點(diǎn)此見具體操作)。,數(shù)據(jù)轉(zhuǎn)置,將變量Group、x選入variable框,再點(diǎn)擊OK鍵,轉(zhuǎn)置前的數(shù)據(jù)集,轉(zhuǎn)置后的數(shù)據(jù)集,注:未選中的變量id其數(shù)據(jù)信息在轉(zhuǎn)置后丟失,數(shù)據(jù)轉(zhuǎn)置,數(shù)據(jù)文件重新排列,Restructure:此過(guò)程是用來(lái)改變數(shù)據(jù)的排列格式,即長(zhǎng)型格式和寬型格式之間的互轉(zhuǎn)。,數(shù)據(jù)文件重新排列,數(shù)據(jù)文件重新排列,數(shù)據(jù)anxiety轉(zhuǎn)換前后的長(zhǎng)型格式和型格式,數(shù)據(jù)文件重新排列,文件縱向合并,*:當(dāng)前數(shù)據(jù)集中的變量+:新添加數(shù)據(jù)集中的變量,左框:新、老數(shù)據(jù)文件中不匹配的變量名,右框:已匹配的變量名,選擇完成后單擊OK即可,AddCases:縱向合并,從外部數(shù)據(jù)文件中增加記錄到當(dāng)前數(shù)據(jù)文件中,相互合并的數(shù)據(jù)文件中應(yīng)該有相同的變量。,文件縱向合并,文件橫向合并,1.未被納入的變量列2.被納入合并后新數(shù)據(jù)集的變量列表3.記錄匹配使用的關(guān)鍵變量,AddVariables:橫向合并,從外部數(shù)據(jù)文件增加變量到當(dāng)前數(shù)據(jù)文件,兩個(gè)數(shù)據(jù)集要有一個(gè)一一對(duì)應(yīng)的關(guān)鍵變量進(jìn)行匹配合并,且記錄應(yīng)按關(guān)鍵變量升序后再合并。,1,2,3,文件橫向合并,數(shù)據(jù)匯總,分組變量,被匯總變量,數(shù)據(jù)匯總,定義匯總函數(shù),定義新產(chǎn)生匯總變量的名稱和標(biāo)簽,Function,Name&Label,數(shù)據(jù)匯總,查找重復(fù)記錄,希望查找重復(fù)值的變量,重復(fù)記錄按該變量的取值排序,設(shè)定第一個(gè)還是最后一個(gè)重復(fù)記錄為主記錄,查找重復(fù)記錄,PrimaryLast0表示相應(yīng)的記錄為重復(fù)記錄,查找重復(fù)記錄,變量級(jí)別的數(shù)據(jù)管理(1),SPSS中的Transform菜單提供了變量級(jí)別的數(shù)據(jù)管理,可以對(duì)變量進(jìn)行操作。,計(jì)算新變量(Compute):最常用,Recode:對(duì)變量值進(jìn)行分組合并VisualBander:連續(xù)變量的可視化分段Count:表示某個(gè)變量的取值中是否出現(xiàn)某個(gè)值,或某個(gè)區(qū)間RankCases:變量編秩AutomaticRecode:對(duì)記錄按某個(gè)變量值的大小排序,變量轉(zhuǎn)換,變量級(jí)別的數(shù)據(jù)管理(2),CreateTimeSeries:建立時(shí)間序列ReplaceMissingValues:缺失值替代RandomNumberSeed:設(shè)定隨機(jī)種子,專用過(guò)程,變量級(jí)別的數(shù)據(jù)管理(3),控制命令,RunPendingTransforms:用于執(zhí)行編程中被掛起的數(shù)據(jù)整理操作,專用于時(shí)間序列模型,例1數(shù)據(jù)fee.sav是上海和杭州16名住院病人的費(fèi)用數(shù)據(jù),計(jì)算上海的住院病人平均每天的住院費(fèi)用,要求結(jié)果取整。,計(jì)算新變量,輸入新變量名perfee,計(jì)算新變量,計(jì)算新變量,輸入條件表達(dá)式,計(jì)算新變量,選擇函數(shù),輸入函數(shù)表達(dá)式,計(jì)算新變量,例2在數(shù)據(jù)fee.sav中生成新變量grade,當(dāng)住院總費(fèi)用小于5000元時(shí)取值為“相對(duì)較低”,大于等于5000元且小于7000元取值為“中等”,大于等于7000元且小于10000元為“較高”,大于等于10000元為“很高”。,變量值分組合并,新變量名grade,選入原變量total,變量值分組合并,變量值分組合并,三種Range的設(shè)置,所有的范圍均包含了端點(diǎn),而前面設(shè)定的變換會(huì)優(yōu)于后面的變換,因此應(yīng)該將大于等于10000元最先設(shè)定,而將小于5000元最后設(shè)定。,變量值分組合并,變量值分組合并,變量值分組合并,變量值分組合并,務(wù)必選上該項(xiàng),變量值分組合并,變量值分組合并,recode過(guò)程提供了精確分組的功能,但如果希望進(jìn)行的分組是有規(guī)律的,比如等距分組,或等樣本量分組,使用recode過(guò)程進(jìn)行操作就顯得非常麻煩,且可視化程度不高。此時(shí)可以考慮使用visualbander過(guò)程進(jìn)行可視化分段。,連續(xù)變量的可視化分段,例3仍以數(shù)據(jù)fee.sav為例,按變量total將病人分為5組,5000元以下為第一組,5000元以上的按等間距的方式分4組。,連續(xù)變量的可視化分段,連續(xù)變量的可視化分段,連續(xù)變量的可視化分段,設(shè)定分段規(guī)則,連續(xù)變量的可視化分段,連續(xù)變量的可視化分段,自動(dòng)填充值標(biāo)簽,連續(xù)變量的可視化分段,例4仍以數(shù)據(jù)fee.sav為例,查看變量total中是否出現(xiàn)值6890。,查看特定變量值,查看特定變量值,查看特定變量值,查看特定變量值,查看特定變量值,例5仍以數(shù)據(jù)fee.sav為例,根據(jù)城市分組計(jì)算住院總費(fèi)用的秩次。,
溫馨提示
- 1. 本站所有資源如無(wú)特殊說(shuō)明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請(qǐng)下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請(qǐng)聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
- 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁(yè)內(nèi)容里面會(huì)有圖紙預(yù)覽,若沒(méi)有圖紙預(yù)覽就沒(méi)有圖紙。
- 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
- 5. 人人文庫(kù)網(wǎng)僅提供信息存儲(chǔ)空間,僅對(duì)用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對(duì)用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對(duì)任何下載內(nèi)容負(fù)責(zé)。
- 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請(qǐng)與我們聯(lián)系,我們立即糾正。
- 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶因使用這些下載資源對(duì)自己和他人造成任何形式的傷害或損失。
最新文檔
- 2025年度雪花啤酒智能家居產(chǎn)品代理合作合同范本3篇
- 2025年度個(gè)人養(yǎng)老保險(xiǎn)補(bǔ)充合同范本2篇
- 2025年度個(gè)人信用擔(dān)保服務(wù)協(xié)議3篇
- 2025年度個(gè)性化個(gè)人家政服務(wù)合同范本(定制服務(wù))4篇
- 異地書店買賣合同(2篇)
- 高端鈦鍋:烹飪藝術(shù)革新科技與健康的融合 頭豹詞條報(bào)告系列
- 2024年中級(jí)經(jīng)濟(jì)師考試題庫(kù)及答案(網(wǎng)校專用) (一)
- 2025年度智能門窗定制服務(wù)合同4篇
- 2024年中級(jí)經(jīng)濟(jì)師考試題庫(kù)【考試直接用】
- 遮光式計(jì)數(shù)器課程設(shè)計(jì)
- 湖北省黃石市陽(yáng)新縣2024-2025學(xué)年八年級(jí)上學(xué)期數(shù)學(xué)期末考試題 含答案
- 硝化棉是天然纖維素硝化棉制造行業(yè)分析報(bào)告
- 央視網(wǎng)2025亞冬會(huì)營(yíng)銷方案
- 《無(wú)砟軌道施工與組織》 課件 第十講雙塊式無(wú)砟軌道施工工藝
- 江蘇省南京市、鹽城市2023-2024學(xué)年高三上學(xué)期期末調(diào)研測(cè)試+英語(yǔ)+ 含答案
- 2024新版《藥品管理法》培訓(xùn)課件
- 《阻燃材料與技術(shù)》課件 第7講 阻燃橡膠材料
- 國(guó)家開放大學(xué)學(xué)生成績(jī)單
- 船員外包服務(wù)投標(biāo)方案
- 沉積相及微相劃分教學(xué)課件
- 移動(dòng)商務(wù)內(nèi)容運(yùn)營(yíng)(吳洪貴)任務(wù)五 引發(fā)用戶共鳴外部條件的把控
評(píng)論
0/150
提交評(píng)論