版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進行舉報或認領(lǐng)
文檔簡介
1、 SPSS的基本(jbn)數(shù)據(jù)管理功能SPSS Basic Data Management參考文獻:SPSS Programming and Data Management, 2nd Edition: A Guide for SPSS and SAS Users. SPSS Inc. 2005.第1頁/共86頁第一頁,共87頁。一、數(shù)據(jù)獲取二、變量屬性三、記錄排序四、文件拆分五、篩選記錄 六、數(shù)據(jù)文件的合并縱向合并七、數(shù)據(jù)文件的合并橫向(hn xin)合并八、通過計算產(chǎn)生新變量九、重新賦值十、排秩十一、重排格式十二、日期計算十三、隨機抽樣第2頁/共86頁第二頁,共87頁。一、數(shù)據(jù)(shj)獲取
2、Getting Data into SPSS讀取SPSS數(shù)據(jù)文件:*.sav , 常用的其他外部數(shù)據(jù)文件: *.xls , *.dbf , *.txt , *.dat, *.w*, *.sas7bdat, *.mdb 注意:醫(yī)學(xué)領(lǐng)域(ln y)常用數(shù)據(jù)庫EpiData軟件,先將數(shù)據(jù)文件*.rec轉(zhuǎn)換為*.sps文件,然后在SPSS的語法窗口運行,生成*.sav 文件。第3頁/共86頁第三頁,共87頁。數(shù)據(jù)獲取途徑第4頁/共86頁第四頁,共87頁。二、變量(binling)屬性Variable Properties:變量名。允許用中文,但習(xí)慣上采用英文變量名。:變量類型,常用數(shù)值型(Numeri
3、c)、字符型(String)、日期型(Date)。:變量寬度,默認為8。:小數(shù)位數(shù),默認為2。5.Label:變量編碼(bin m),又稱為變量標(biāo)簽,用于注釋變量名的含義。第5頁/共86頁第五頁,共87頁。6.Values:變量值編碼,又稱為變量值標(biāo)簽,用于注釋變量值的含義。例如:變量sex,變量標(biāo)簽為“性別”;變量值為1與2,變量值編碼:1為“男性”,2為“女性(nxng)”。:缺失值。默認為系統(tǒng)缺失值,用“.”表示。:列寬,默認為8。:對齊方式。數(shù)值型變量默認右對齊(Right),字符型變量默認左對齊(Left) 。:測度,包括三類:數(shù)值變量(Scale),名義變量或無序分類變量(Nomi
4、nal),有序分類變量或等級變量(Ordinal)。第6頁/共86頁第六頁,共87頁。數(shù)據(jù)清單變量清單數(shù)據(jù)文件(數(shù)據(jù)窗口(chungku)數(shù)據(jù)清單界面)第7頁/共86頁第七頁,共87頁。數(shù)據(jù)文件(數(shù)據(jù)窗口(chungku)變量清單界面)注意:一行對應(yīng)一個“記錄(Case)”;一列(y li)對應(yīng)一個“變量(Variable)”。此數(shù)據(jù)窗口不是一個很好的數(shù)據(jù)錄入界面。第8頁/共86頁第八頁,共87頁。刪除(shnch)ex .sav文件中id為57的case,將文件另存為為以后(yhu)使用方便,將ex .sav另存為如下數(shù)據(jù)庫(Save As.)第9頁/共86頁第九頁,共87頁。刪除(shnc
5、h)ex .sav文件中id為14的case,將文件另存為第10頁/共86頁第十頁,共87頁。刪除ex .sav文件(wnjin)中變量sbp1dbp2,刪除id6的記錄,將文件(wnjin)另存為第11頁/共86頁第十一頁,共87頁。只保留ex .sav文件(wnjin)中變量id、sbp1dbp2,刪除id7的記錄,將文件(wnjin)另存為第12頁/共86頁第十二頁,共87頁。三、記錄(jl)排序Sort Cases 第13頁/共86頁第十三頁,共87頁。ex .sav文件中, 按照“height(身高(shn o))”的大小排序。升序降序第14頁/共86頁第十四頁,共87頁。四、文件(
6、wnjin)拆分 Split File 第15頁/共86頁第十五頁,共87頁。比較組分組變量根據(jù)分組變量排序ex .sav文件中, 按照(nzho)“sex(性別)”拆分文件第16頁/共86頁第十六頁,共87頁。第17頁/共86頁第十七頁,共87頁。分性別對“height(身高(shn o))”進行統(tǒng)計描述描述性統(tǒng)計第18頁/共86頁第十八頁,共87頁。第19頁/共86頁第十九頁,共87頁。不同(b tn)性別的“height(身高)”統(tǒng)計描述所有記錄(jl)的“height(身高)”統(tǒng)計描述注意(zh y):SPSS的輸出結(jié)果文件為*.spo第20頁/共86頁第二十頁,共87頁。 五、篩選(
7、shixun)記錄 Select Cases第21頁/共86頁第二十一頁,共87頁。如果條件滿足過濾刪除selectunselect第22頁/共86頁第二十二頁,共87頁。篩選(shixun)條件:有高血壓家族史(genic 0)第23頁/共86頁第二十三頁,共87頁。如果選用Deleted,則一定要將篩選后的文件另存一個文件名第24頁/共86頁第二十四頁,共87頁。filter_$變量,0表示未選中該記錄,1表示選中該記錄不符合條件的記錄,被用斜線篩除第25頁/共86頁第二十五頁,共87頁。有高血壓家族史的患者身高的統(tǒng)計(tngj)描述所有(suyu)患者身高的統(tǒng)計描述第26頁/共86頁第二
8、十六頁,共87頁。六、數(shù)據(jù)文件的合并(hbng)縱向合并(hbng):增加記錄Merge Files.Add Cases打開(d ki)數(shù)據(jù)文件作為“工作數(shù)據(jù)文件”第27頁/共86頁第二十七頁,共87頁。打開(d ki)作為“外部數(shù)據(jù)文件”第28頁/共86頁第二十八頁,共87頁。*代表工作數(shù)據(jù)文件,代表外部數(shù)據(jù)文件。第29頁/共86頁第二十九頁,共87頁。將連接后的文件(wnjin)另存一個文件(wnjin)名:第30頁/共86頁第三十頁,共87頁。七、數(shù)據(jù)文件的合并(hbng)橫向合并(hbng):增加變量Merge Files.Add Variables打開作為(zuwi)“工作數(shù)據(jù)文件”
9、第31頁/共86頁第三十一頁,共87頁。打開(d ki)作為“外部數(shù)據(jù)文件”第32頁/共86頁第三十二頁,共87頁。(1)兩個文件(wnjin)均提供記錄(Both files provide cases)關(guān)鍵變量對于排序的文件,按照關(guān)鍵變量進行匹配*代表工作數(shù)據(jù)文件,代表外部數(shù)據(jù)文件。第33頁/共86頁第三十三頁,共87頁。警告:如果數(shù)據(jù)未按照關(guān)鍵變量的升序進行排序,那么不能按照關(guān)鍵變量匹配第34頁/共86頁第三十四頁,共87頁。連接(linji)后的數(shù)據(jù)文件,另存為第35頁/共86頁第三十五頁,共87頁。(2)按照關(guān)鍵變量,將外部數(shù)據(jù)文件匹配(ppi)到工作數(shù)據(jù)文件中(External f
10、ile is keyed table)。第36頁/共86頁第三十六頁,共87頁。連接(linji)后的數(shù)據(jù)文件,另存為第37頁/共86頁第三十七頁,共87頁。(3)按照關(guān)鍵(gunjin)變量,將工作數(shù)據(jù)文件匹配到外部數(shù)據(jù)文件中(Working file is keyed table)。第38頁/共86頁第三十八頁,共87頁。連接(linji)后的數(shù)據(jù)文件,另存為第39頁/共86頁第三十九頁,共87頁。八、通過計算(j sun)產(chǎn)生新變量 compute第40頁/共86頁第四十頁,共87頁。產(chǎn)生一個(y )新變量:bmi體重/(身高)*2)第41頁/共86頁第四十一頁,共87頁。第42頁/共8
11、6頁第四十二頁,共87頁。九、重新(chngxn)賦值Recode. Into different variables第43頁/共86頁第四十三頁,共87頁。舊及新的變量值第44頁/共86頁第四十四頁,共87頁。根據(jù)bmi對7個記錄(jl)進行分組,bmi: 正常:;超重:;肥胖:。第45頁/共86頁第四十五頁,共87頁。定義新的變量名:bmi _ gr第46頁/共86頁第四十六頁,共87頁。第47頁/共86頁第四十七頁,共87頁。問題(wnt):當(dāng)bmi時,bmi_gr的取何值?根據(jù)上述recode方法(fngf), bmi_gr為缺失值!解決辦法:RECODE bmi (18.0 thru
12、 =1) (24.0 thru =2) (28.0 thru Highest=3) INTO bmi_gr .EXECUTE .第48頁/共86頁第四十八頁,共87頁。十、排秩 rank cases第49頁/共86頁第四十九頁,共87頁。對sbp1(治療(zhlio)前SBP)進行排秩第50頁/共86頁第五十頁,共87頁。排秩后產(chǎn)生新變量rsbp1,其中對于(duy)相等的變量值(稱為結(jié)點ties)取平均秩次。本例中第2、3位的平均秩次為。第51頁/共86頁第五十一頁,共87頁。十一(ShY)、重排格式Restructure第52頁/共86頁第五十二頁,共87頁。1.將變量轉(zhuǎn)換(zhunhun
13、)為記錄 Restructure selected variables into cases 第53頁/共86頁第五十三頁,共87頁。將變量轉(zhuǎn)換為同一組第54頁/共86頁第五十四頁,共87頁。記錄標(biāo)識轉(zhuǎn)置后的新變量需要轉(zhuǎn)置的變量需要固定的變量第55頁/共86頁第五十五頁,共87頁。創(chuàng)建一個索引變量第56頁/共86頁第五十六頁,共87頁。索引變量的變量名按照自然數(shù)列對索引變量取值第57頁/共86頁第五十七頁,共87頁。未選取的變量從新數(shù)據(jù)庫中刪除第58頁/共86頁第五十八頁,共87頁。開始重排第59頁/共86頁第五十九頁,共87頁。重排后的數(shù)據(jù)文件。 第60頁/共86頁第六十頁,共87頁。2.將
14、記錄(jl)轉(zhuǎn)換為變量 Restructure selected cases into variables第61頁/共86頁第六十一頁,共87頁。第62頁/共86頁第六十二頁,共87頁。記錄標(biāo)識索引變量第63頁/共86頁第六十三頁,共87頁。按照“記錄標(biāo)識”變量排序第64頁/共86頁第六十四頁,共87頁。按照原變量值順序,排列新變量組第65頁/共86頁第六十五頁,共87頁。開始重排第66頁/共86頁第六十六頁,共87頁。重排后的數(shù)據(jù)文件。 第67頁/共86頁第六十七頁,共87頁。十二(sh r)、日期計算 Date/Time 第68頁/共86頁第六十八頁,共87頁。用日期與時間進行計算第69頁
15、/共86頁第六十九頁,共87頁。兩個日期之間的計算第70頁/共86頁第七十頁,共87頁。Date1與Date2之差以“天”為單位第71頁/共86頁第七十一頁,共87頁。結(jié)果變量:day,單位為“天”變量標(biāo)簽第72頁/共86頁第七十二頁,共87頁。第73頁/共86頁第七十三頁,共87頁。十三、隨機抽樣 Random Sampling 步驟(bzhu)1 隨機數(shù)種子(Random Number Seed)的設(shè)定以數(shù)據(jù)文件data.sav為例第74頁/共86頁第七十四頁,共87頁。指定種子(此處以隨機抽樣的日期為種子)第75頁/共86頁第七十五頁,共87頁。步驟2 隨機篩選(shixun)記錄(Se
16、lect Cases Randomly)第76頁/共86頁第七十六頁,共87頁。隨機抽取樣本單擊Sample按鈕第77頁/共86頁第七十七頁,共87頁。從前10個記錄中隨機抽取2個記錄第78頁/共86頁第七十八頁,共87頁。從前10個記錄中隨機抽取2個記錄第79頁/共86頁第七十九頁,共87頁。隨機抽樣的結(jié)果(ji gu): 抽取了no為3、4的兩個記錄。第80頁/共86頁第八十頁,共87頁。注意:1.隨機抽樣主要用于現(xiàn)場調(diào)查中,從總體中用簡單隨機的方法隨機抽取一個樣本。2.隨機抽樣的過程中,需要設(shè)定種子,以保證隨機抽樣結(jié)果是可重現(xiàn)的。(一般來說,如果不設(shè)定種子,那么(n me)第二次抽樣很可
17、能與第一次抽樣的結(jié)果不同。)第81頁/共86頁第八十一頁,共87頁。小貼士:SPSS通過菜單,可以實現(xiàn)大部分的數(shù)據(jù)管理及統(tǒng)計分析功能,軟件操作簡單(jindn)、易學(xué)。在學(xué)習(xí)SPSS時,要養(yǎng)成一個好習(xí)慣:用語法文件(*.sps)保存每一步操作(只需要在每個對話框中點擊Paste,就可以將操作粘貼到語法窗口,即Syntax窗口)。這樣做,至少有兩個益處:1.避免重復(fù)地操作;2.很清楚地記錄了統(tǒng)計分析的過程。第82頁/共86頁第八十二頁,共87頁。如果您偷懶(tu ln),從不保存語法文件1.您花了一整天的時間進行了復(fù)雜的數(shù)據(jù)整理(zhngl)及統(tǒng)計分析幾天后,老板告訴您:數(shù)據(jù)庫需要刪除一個記錄,
18、您要重新做統(tǒng)計!天??!為了這一個記錄(jl),難道還要再花費一整天重頭開始么?!第83頁/共86頁第八十三頁,共87頁。如果您偷懶,從不保存(bocn)語法文件2.您花了一整天的時間進行(jnxng)了復(fù)雜的數(shù)據(jù)整理及統(tǒng)計分析。很幸運,數(shù)據(jù)很準確,方法很合適,似乎沒有什么遺憾了。N年后,有人拿著您的統(tǒng)計結(jié)果,很崇拜地請教:當(dāng)初您是怎么算出這個結(jié)果的?天??!我怎么(zn me)可能記得N年前的事情?!第84頁/共86頁第八十四頁,共87頁。如果您養(yǎng)成了這個(zh ge)好習(xí)慣:用語法文件(*.sps)保存每一步操作哈哈(h ha)!只需要幾秒鐘我就能將統(tǒng)計結(jié)果重現(xiàn)!a piece of cake !第85頁/
溫馨提示
- 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
- 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
- 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
- 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負責(zé)。
- 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請與我們聯(lián)系,我們立即糾正。
- 7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔(dān)用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。
最新文檔
- 2025年度網(wǎng)絡(luò)安全拓展合作協(xié)議書范本3篇
- 課程設(shè)計自動打標(biāo)機
- 二零二五年度廢塑料瓶回收處理及循環(huán)利用合同3篇
- 舞伴匹配課程設(shè)計
- 二零二五年度景區(qū)道路路燈安裝服務(wù)合同范本2篇
- 貨運實訓(xùn)課程設(shè)計
- 苯酚丙酮課程設(shè)計
- 建筑公司安全技術(shù)措施管理制度(2篇)
- 2025年小學(xué)防溺水安全制度樣本(3篇)
- 2025年滬科新版九年級物理上冊階段測試試卷
- 樁裂縫計算(自動版)
- 高邊坡施工危險源辨識及分析
- 給排水全套資料表格模版
- 萬噸鈦白粉項目建議
- 化妝品購銷合同范本
- 7725i進樣閥說明書
- 銀監(jiān)會流動資金貸款需求量測算表
- 榴園小學(xué)寒假留守兒童工作總結(jié)(共3頁)
- 初中物理-電功率大題專項
- 時光科技主軸S系列伺服控制器說明書
- 社會組織績效考核管理辦法
評論
0/150
提交評論