版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請(qǐng)進(jìn)行舉報(bào)或認(rèn)領(lǐng)
文檔簡(jiǎn)介
1、第4章 文件級(jí)別的數(shù)據(jù)管理文件級(jí)別的數(shù)據(jù)管理數(shù)據(jù)編輯窗口的Data菜單為用戶創(chuàng)建和定義數(shù)據(jù)提供了方便的功能。這個(gè)菜單是SPSS統(tǒng)計(jì)軟件數(shù)據(jù)整理的特有功能菜單。它的功能包括:對(duì)變量排序;文件合并、拆分。(1)簡(jiǎn)單命令:包括插入變量、插入記錄、到達(dá)某條記錄,復(fù)制數(shù)據(jù)集。他們的功能實(shí)際上都可以用鼠標(biāo)在數(shù)據(jù)表界面上直接完成,很少會(huì)使用菜單來調(diào)用。(2)常用的簡(jiǎn)單過程:包括排序、拆分文件、個(gè)案篩選和個(gè)案加權(quán)。(3)數(shù)據(jù)重組導(dǎo)向:用于進(jìn)行數(shù)據(jù)轉(zhuǎn)置,或者對(duì)重復(fù)測(cè)量數(shù)據(jù)進(jìn)行長(zhǎng)型、寬型記錄間的轉(zhuǎn)換。(4)文件合并過程:將幾個(gè)數(shù)據(jù)文件合并為一個(gè)大的spss數(shù)據(jù)文件,含橫向合并和縱向合并兩種情況。(5)與數(shù)字字典有
2、關(guān)的功能:定義變量屬性,復(fù)制變量屬性,新建設(shè)定屬性。 (6)與數(shù)據(jù)準(zhǔn)備有關(guān)的功能:針對(duì)復(fù)雜數(shù)據(jù)管理。用于數(shù)據(jù)自動(dòng)查錯(cuò)的數(shù)據(jù)驗(yàn)證模塊,查找異常記錄的重復(fù)個(gè)案,異常數(shù)據(jù)查找向?qū)?。?)其他過程:包括正交設(shè)計(jì),定義日期變量、數(shù)據(jù)匯總和多重響應(yīng)集。定義變量屬性定義變量日期插入觀測(cè)量拷貝數(shù)據(jù)屬性插入一個(gè)變量定位觀測(cè)量觀測(cè)量排序重構(gòu)數(shù)據(jù)結(jié)構(gòu)分類或不分類匯總正交設(shè)計(jì)數(shù)據(jù)文件轉(zhuǎn)置合并數(shù)據(jù)文件標(biāo)識(shí)重復(fù)觀測(cè)量拆分?jǐn)?shù)據(jù)文件選擇觀測(cè)量觀測(cè)量加權(quán)4.1 常用過程常用過程一、排序的兩種方法:(1)在數(shù)據(jù)表格的變量名處單擊右鍵,彈出的右鍵菜單最后兩項(xiàng)就是“sort Ascending”和“Sort Descending”。
3、(2)對(duì)于多變量排序,則需要使用Sort Cases過程來進(jìn)行。二、多變量排序需要注意的三點(diǎn):(1)在多重排序中,制定排序變量名是很關(guān)鍵的,先指定的變量在排序時(shí)必然優(yōu)先于后制訂的變量。(2)可以指定按某變量值升序排序的同時(shí)按另一變量值降序排序,或相反。(3)排序以后,原來記錄數(shù)據(jù)的排列次序?qū)⒈淮騺y。2 拆分文件拆分文件Split File 分割文件的功能是把當(dāng)前工作分割成兩個(gè)或兩個(gè)以上的組,隨后的分析將對(duì)每個(gè)組進(jìn)行。例:CCSS按月份進(jìn)行拆分,計(jì)算S3的統(tǒng)計(jì)描述。3 選擇個(gè)案Select Cases:當(dāng)用戶不需要分析全部的數(shù)據(jù),而是按要求分析其中的一部分,使用該選擇。篩選CCSS中的月份為20
4、0912All case:選擇所有數(shù)據(jù);If condition is satisfied: 按指定條件選擇數(shù)據(jù)。Random Sample of cases:對(duì)觀察值進(jìn)行隨機(jī)抽樣。 Use filter variable:用指定變量作過濾。先選擇一個(gè)變量,系統(tǒng)自動(dòng)在數(shù)據(jù)管理器中將該變量值為0的觀測(cè)單位標(biāo)上刪除記號(hào),系統(tǒng)對(duì)標(biāo)有刪除記號(hào)的觀測(cè)單位不作分析。Based on time or case range:順序抽樣。單擊Range按紐,打開Select Case: Range對(duì)話框,用戶自行定義從第幾個(gè)觀察值開始抽到第幾個(gè)觀察值結(jié)束。4 加權(quán)個(gè)案Weight Cases:設(shè)定某變量為頻數(shù)變量
5、。:設(shè)定某變量為頻數(shù)變量。以頻數(shù)格式錄入的數(shù)據(jù)以頻數(shù)格式錄入的數(shù)據(jù)非等概率抽樣非等概率抽樣5 分類匯總分類匯總所謂分類匯總就是按指定的分類變量對(duì)觀測(cè)值進(jìn)行分組,對(duì)每組記錄的各變量求指定的描述統(tǒng)計(jì)量,結(jié)果可以存入新數(shù)據(jù)文件,也可以替換當(dāng)前數(shù)據(jù)文件。一、匯總的概念一、匯總的概念二、進(jìn)行分類二、進(jìn)行分類匯總的方法匯總的方法1、打開“data”菜單,選擇“Aggregate”,展開aggregate data”對(duì)話框。2、在左側(cè)的源變量框中選擇一個(gè)或多個(gè)變量作為分類變量進(jìn)入分類變量(Break Variables)框中。3、在左側(cè)的源變量框中選擇一個(gè)或多個(gè)變量作為要求匯總的變量進(jìn)入?yún)R總變量(Aggre
6、gate Variables)框中,即要求這些變量的值進(jìn)行分類匯總。4、“name& label” (名稱與標(biāo)簽):?jiǎn)螕舸税粹o可以修改組合后所生成新變量名稱以及標(biāo)簽:可以在name后面的矩形框中輸入新變量名。在Label后面的矩形框中輸入新變量標(biāo)簽。單擊“continue”按鈕繼續(xù)。5、“Function”(函數(shù)) 選擇此項(xiàng)可以確定匯總變量的描述內(nèi)容;系統(tǒng)默認(rèn)函數(shù)為平均數(shù)。例:按time和S0對(duì)CCSS的變量進(jìn)行均數(shù)匯總,并保存到Sum_index14.2 數(shù)據(jù)文件的重組與轉(zhuǎn)置數(shù)據(jù)文件的重組與轉(zhuǎn)置一、數(shù)據(jù)的長(zhǎng)型與寬型格式:長(zhǎng)型格式和寬型格式指的是重復(fù)測(cè)量數(shù)據(jù)的兩種不同的排列方式。由于重復(fù)測(cè)量模
7、型可以使用不同的統(tǒng)計(jì)模型加以分析,因此根據(jù)模型的要求進(jìn)行長(zhǎng)型格式和寬型格式之間的互轉(zhuǎn)換是數(shù)據(jù)分析中經(jīng)常要遇到的問題。二、長(zhǎng)型格式轉(zhuǎn)換為寬型格式:二、長(zhǎng)型格式轉(zhuǎn)換為寬型格式:Restructure。選擇Data Restructure,系統(tǒng)就會(huì)彈出下圖導(dǎo)向。G enerated VariablesG enerated Variablesscore.1score.1:Scorescore.2score.2:Scorescore.3score.3:Scorescore.4score.4:ScoreTrial1234O riginal VariableScoreNam eLabelResul tPro
8、cessi ng St atist icsProcessi ng St atist ics48124.0574Cases InCases O utCases In/Cases O utVari ables InVari ables O utIndex Values三、數(shù)據(jù)轉(zhuǎn)置Transpose:用于對(duì)數(shù)進(jìn)行行列轉(zhuǎn)置,數(shù)據(jù)文件的轉(zhuǎn)置就是將數(shù)據(jù)編輯窗口中數(shù)據(jù)的行列互換,即將記錄轉(zhuǎn)為變量,將變量轉(zhuǎn)為記錄后,重新顯示在數(shù)據(jù)編輯窗口中。Variable(s):放入將要行列轉(zhuǎn)置的變量名。在數(shù)據(jù)文件中,未放入欄中的變量會(huì)遺失。字符串變量不能轉(zhuǎn)換,如強(qiáng)迫轉(zhuǎn)換,變量值轉(zhuǎn)變?yōu)橄到y(tǒng)缺失值。Name variable
9、:變量命名欄,在左側(cè)源變量欄中選擇一個(gè)變量,放入name variable欄,技改變量的數(shù)據(jù)作為轉(zhuǎn)置后的變量名。4.3 多個(gè)數(shù)據(jù)文件的合并多個(gè)數(shù)據(jù)文件的合并縱向連接:幾個(gè)數(shù)據(jù)集中的數(shù)據(jù)相加,組成一個(gè)新的數(shù)據(jù)集,新數(shù)據(jù)集中的記錄是原來幾個(gè)數(shù)據(jù)集中記錄數(shù)的總和。橫向連接:指的是按照記錄的次序,或者某個(gè)關(guān)鍵變量的數(shù)值,將不同數(shù)據(jù)集中的不同變量合并為一個(gè)數(shù)據(jù)集,新數(shù)據(jù)集中的變量數(shù)是所有原數(shù)據(jù)集中不重名變量的總和。一、數(shù)據(jù)文件的縱向連接一、數(shù)據(jù)文件的縱向連接縱向合并實(shí)質(zhì)就是將兩個(gè)數(shù)據(jù)文件的變量列,按照各個(gè)變量名的含義,一一對(duì)應(yīng)的進(jìn)行首尾相接??v向合并必須遵循兩個(gè)條件:第一,兩個(gè)合并的spss數(shù)據(jù)文件,其
10、內(nèi)容合并是有實(shí)際意義的。第二,為方便spss數(shù)據(jù)文件的合并,在不同的數(shù)據(jù)文件中,最好起相同的名字,變量類型和變量長(zhǎng)度也要盡量相同。Unpaired variable:不匹配變量欄。指變量名相同而變量定義不同的變量,或變量名不同的變量。Variable in new working data:新工作數(shù)據(jù)變量欄。Indicate case source as variable:指示記錄來源的變量選項(xiàng)/二、數(shù)據(jù)文件的橫向合并二、數(shù)據(jù)文件的橫向合并橫向合并的實(shí)質(zhì)是將兩個(gè)數(shù)據(jù)文件的記錄,按照記錄對(duì)應(yīng),一一進(jìn)行左右對(duì)接。橫向合并遵循三個(gè)條件:第一,如果不是按照記錄號(hào)對(duì)應(yīng)的規(guī)律進(jìn)行合并,則兩個(gè)數(shù)據(jù)文件必須至
11、少有一個(gè)變量名相同的公共變量,這個(gè)變量是兩個(gè)數(shù)據(jù)文件橫向合并的依據(jù),成為關(guān)鍵變量。第二,如果是使用關(guān)鍵變量進(jìn)行合并的對(duì)應(yīng),則兩個(gè)數(shù)據(jù)文件都必須事先按關(guān)鍵變量進(jìn)行升序排列。第三,為方便SPSS文件的合并,在不同的數(shù)據(jù)文件中,數(shù)據(jù)含義不相同的列,變量名不應(yīng)取相同的名稱。Excluded Variables:拒絕變量名。外部文件與當(dāng)前數(shù)據(jù)的同變量,拒絕加到新工作區(qū)中。New Working Data:新工作數(shù)據(jù)變量欄。Match Case on Key Variable in sort:排序文件中按關(guān)鍵變量匹配記錄選項(xiàng)。Both files provide case:由外部文件和當(dāng)前數(shù)據(jù)量?jī)烧咛峁┯?/p>
12、錄。External file is keyed table:外部文件為關(guān)鍵表,以當(dāng)前數(shù)據(jù)為基準(zhǔn),外部文件匹配當(dāng)前數(shù)據(jù)的關(guān)鍵變量值,如匹配成功,外部文件的新變量值加入到當(dāng)前數(shù)據(jù)的新變量中,匹配不成功則不加入。Working Data File is keyed table:當(dāng)前數(shù)據(jù)為關(guān)鍵表。Key Variables:關(guān)鍵變量欄,在拒絕變量選擇某變量作為關(guān)鍵變量。Indicate case source as variable:指示記錄來源的變量選項(xiàng)。4.4 與數(shù)據(jù)字典有關(guān)的功能1 數(shù)據(jù)字典的定義與應(yīng)用在大型的數(shù)據(jù)分析項(xiàng)目中,數(shù)據(jù)管理是非常重要的一個(gè)環(huán)節(jié),為了保證工作質(zhì)量,數(shù)據(jù)處理人員往往會(huì)事
13、先定義好一個(gè)非常詳細(xì)的數(shù)據(jù)格式,包括變量格式、變量標(biāo)簽、標(biāo)簽值、缺失值定義等,這被稱為數(shù)據(jù)字典。一、變量屬性定義導(dǎo)向:Define Variable Properties 具體說來,可以列出所選變量的所有值;分辨沒有值標(biāo)簽的值,并且提供自動(dòng)給出值標(biāo)簽的功能;可以將另一個(gè)變量的屬性拷貝到所選變量,也可以將所選變量的屬性拷貝到其他變量。二、復(fù)制數(shù)據(jù)文件屬性導(dǎo)向Copy Data Properties 過程用于將定義好的數(shù)據(jù)字典直接應(yīng)用到當(dāng)前文件中。操作時(shí)不僅可以將一個(gè)外部數(shù)據(jù)文件相關(guān)屬性拷貝到當(dāng)前數(shù)據(jù)文件中,還可以進(jìn)行自行定義,只選擇某些變量,或者某些屬性進(jìn)行拷貝,這無疑大大提高了連續(xù)性項(xiàng)目對(duì)原有資源的利用程度。4.5 與數(shù)據(jù)準(zhǔn)備有關(guān)的功能1 數(shù)據(jù)驗(yàn)證模塊2 標(biāo)識(shí)重復(fù)個(gè)案3 標(biāo)識(shí)異常個(gè)案1. 數(shù)據(jù)驗(yàn)證模塊單變量規(guī)則交叉變量規(guī)則1.定義驗(yàn)證規(guī)則2.進(jìn)行數(shù)據(jù)驗(yàn)證2. 標(biāo)識(shí)重復(fù)個(gè)案運(yùn)行結(jié)束后,結(jié)果窗口會(huì)給出本次操作的信息匯總:Stat isticsStat isticsIndicator of each last m atching case as Prim ary120Vali dM i ssingNIndicator
溫馨提示
- 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請(qǐng)下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請(qǐng)聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
- 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會(huì)有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
- 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
- 5. 人人文庫網(wǎng)僅提供信息存儲(chǔ)空間,僅對(duì)用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對(duì)用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對(duì)任何下載內(nèi)容負(fù)責(zé)。
- 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請(qǐng)與我們聯(lián)系,我們立即糾正。
- 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶因使用這些下載資源對(duì)自己和他人造成任何形式的傷害或損失。
最新文檔
- 不動(dòng)產(chǎn)買賣合同范例2024版
- 2025年槽探施工項(xiàng)目地質(zhì)信息采集合同范本3篇
- 2024月子中心定制化月子套餐及專業(yè)護(hù)理服務(wù)合同3篇
- KTV轉(zhuǎn)讓合同范本
- 2024版正規(guī)裝修分期付款合同范本
- 不動(dòng)產(chǎn)全抵押清償債務(wù)合同樣本版
- 2024幼兒園教師學(xué)生社會(huì)實(shí)踐與綜合素質(zhì)提升合同3篇
- 情緒與溝通技巧培訓(xùn)
- 福建省南平市塔前中學(xué)高三化學(xué)下學(xué)期期末試卷含解析
- 2025年玻璃深加工技術(shù)培訓(xùn)與推廣合同3篇
- 談基層稅務(wù)干部隊(duì)伍建設(shè)難點(diǎn)及應(yīng)對(duì)經(jīng)驗(yàn)
- 2018中國(guó)美業(yè)發(fā)展經(jīng)濟(jì)共享峰會(huì)方案-41P
- 電子病歷質(zhì)控操作手冊(cè)1.9.1版(共26頁)
- 利潤(rùn)表空白表下載
- 人教版八年級(jí)下冊(cè)英語單詞表(按單元排序)全冊(cè)(附音標(biāo)和解釋)
- DVPR設(shè)計(jì)驗(yàn)證計(jì)劃和報(bào)告
- 移出異常申請(qǐng)書
- 機(jī)房設(shè)備搬遷解決方案
- 二年級(jí)上冊(cè)音樂課件---選唱歌曲-我們和祖國(guó)最親親-西師大版(共8張PPT)
- 設(shè)備租賃服務(wù)方案
- 最新中石油帶壓作業(yè)技術(shù)規(guī)程
評(píng)論
0/150
提交評(píng)論