湘雅衛(wèi)生統(tǒng)計spss課件_第1頁
湘雅衛(wèi)生統(tǒng)計spss課件_第2頁
湘雅衛(wèi)生統(tǒng)計spss課件_第3頁
湘雅衛(wèi)生統(tǒng)計spss課件_第4頁
湘雅衛(wèi)生統(tǒng)計spss課件_第5頁
已閱讀5頁,還剩222頁未讀 繼續(xù)免費閱讀

下載本文檔

版權說明:本文檔由用戶提供并上傳,收益歸屬內容提供方,若內容存在侵權,請進行舉報或認領

文檔簡介

3.0 在醫(yī)學科研統(tǒng)計中的應用 中南大學公共衛(wèi)生學院 衛(wèi)生統(tǒng)計教研室 虞仁和 數據處理的一般原則 醫(yī)學數據的統(tǒng)計處理涉及到醫(yī)學專業(yè)知識、統(tǒng)計專業(yè)知識、處理數據的經驗和技巧等各個方面,是一門很高超的藝術。在數據處理過程中,原始數據的采集和錄入,數據的管理,恰當選用統(tǒng)計方法,熟練使用統(tǒng)計軟件等,都是必須重視的關鍵環(huán)節(jié)。 原始數據的記錄形式 醫(yī)學研究的原始數據常列成類似下表的二維結構,即行與列結構的數據集形式。在下表中,每一行稱為一個記錄 (r ,或一個觀察單位 ( e) ;每一列稱為一個變量 ( v ar i ab l e ) ,用以表示變量、項目或觀察指標等。下表記錄的原始數據是一個由 2 7 4 例觀察單位和 11個變量組成的數據集。 腎衰病人預后研究的臨床資料記錄 病人 編號 病案號 性別 年齡 生理 評分 腎毒性 黃疸 昏迷 肌酐 膽固醇 腎功能預后 1 0 0 4 7 5 7 男 26 14 無 有 無 520 治愈 2 0 0 7 9 5 0 女 31 13 無 無 無 523 4 . 5 治愈 3 0 1 1 0 9 3 男 55 17 無 無 無 209 3 . 3 治愈 4 0 1 7 5 5 5 男 25 9 無 無 無 1 3 0 3 4 . 1 治愈 274 2 7 9 1 8 3 女 88 15 有 無 無 331 6 . 1 喪失 原始數據的記錄形式 原始數據中 , 變量分為標識變量和分析變量兩種 。 包括數據的核對與增刪等 , 是研究記錄中不可缺少的內容 , 如上表中的 “ 病人編號 ” 和 “ 病案號 ” 即為標識變量 。 上表中除上述 2個標識變量外 ,其它 9個變量均為分析變量 。 分析變量又被分為反應變量 (解釋變量( 反應變量是表示試驗效應或觀察結果大小的變量或指標。 解釋變量又稱指示變量 (分組變量 (、分類變量 (、協變量等。 根據研究目的以及變量間的相互關系,各變量的作用并非一成不變。 原始數據的錄入 在進行統(tǒng)計分析前 , 原始數據需錄入計算機 。 錄入的文件類型大致有: 如 如 如 據文件等 。 目前 , 上述文件類型絕大多數都可以相互轉換 。 錄入數據時 , 應遵循便于錄入 , 便于核查 , 便于轉換 , 便于分析的原則 。 便于錄入是指盡可能地減少錄入工作量 , 例如 , 下圖是前表原始數據錄入為 數據 的形式 , 錄入時 , 用數值變量取代了字符變量 ( 如圖中的 “ 性別 ” , “ 腎毒性 ” , “ 黃疸 ” , “ 昏迷 ” ) , 可以大大節(jié)約錄入的時間和費用 。 (如將性別標記為 1=“男 ” , 0=“女 ” )。 原始數據的錄入 數據處理中的幾個基本問題 1 數據核查 數據錄入后 , 首先須對錄入的數據進行核查 , 以確保錄入數據的準確性和真實性 。 核查準確性可分兩步進行 。 第一步邏輯檢查 , 通過運行統(tǒng)計軟件中的基本統(tǒng)計量過程 , 列出每個變量的最大和最小值 , 如果某變量的最大或最小值不符合邏輯 , 則數據有誤 。 例如 , 在 數據 件中 , 當變量 “ 年齡 ” 的最大值為 “ 300”時 ,一定有誤 。 利用軟件的查找功能可立即找到該數據 , 然后根據該數據對應的標識值找出原始記錄 , 更正該數據 。 如本例可查到該數據對應的 “ 病人編號 ” 為 “ 27”, 查原始記錄的年齡為 “ 30”。 第二步數據核對 ,將原始數據與錄入的數據一一核對 , 錯者更正 。 有時 , 為慎重起見 , 采用雙份錄入的方式 , 然后用程序作一一比較 , 不一致者一定是錄錯的數據 。 數據核查的另一項任務是對數據的真實性做出初步判斷。 數據處理中的幾個基本問題 2 離群數據的處理 當個別數據與群體數據嚴重偏離時 , 被稱為離群數據 (極端數據 ( 。 統(tǒng)計軟件一般都有判斷離群數據的方法 。 判斷離群數據有多種方法 , 例如 , 觀察值距箱式圖 (箱體底線 ( 第 25百分位數 ) 或頂線 ( 第75百分位數 ) 的距離為箱體高度 ( 四分位數間距 ) 的 倍時被視為離群點;觀察值距箱體底線或頂線的距離超過 3倍的箱體高度時被視為極端值 。 若有離群數據出現,可分為兩種情況處理: 一種是,如果確認數據有邏輯錯誤,又無法糾正,可直接刪除該數據。例如,若某一數據中某病例的身高變量為 “ 1755”原始記錄亦如此,又無法再找到該病例時,顯然這是一個錯誤的記錄,只能刪除。 另一種是,若數據并無明顯的邏輯錯誤,可將該數據剔除前后各做一次分析,若結果不矛盾,則不剔除;若結果矛盾,并需要剔除,必須給以充分合理的解釋,例如用何種方法確定偏離數據,該數據在實驗中何種干擾下產生等。 數據處理中的幾個基本問題 3統(tǒng)計方法 前提條件的檢驗 : 應用參數方法進行假設檢驗往往要求數據滿足某些前提條件,如兩個獨立樣本比較 要求方差齊性,因此需要做方差齊性檢驗。 如果要用正態(tài)分布法估計參考值范圍,首先要檢驗資料是否服從正態(tài)分布。 在建立各種多重回歸方程時,常需檢驗變量間的多重共線性和殘差分布的正態(tài)性。 統(tǒng)計方法選擇的基本思路 數據處理中,正確選擇統(tǒng)計方法至關重要。選擇統(tǒng)計方法可以沿著以下思路進行。 第一個層面,看反應變量是單變量、雙變量還是多變量。 對于前者,第二個層面看屬于三種資料類型中的哪一種; 第三個層面看單因素還是多因素; 第四個層面看單樣本、兩樣本或多樣本; 第五個層面看是否是配對或配伍設計; 第六個層面看是否滿足檢驗方法所需的前提條件。 單變量計量資料的分析 1 樣本均數與總體均數比較 分析思路為:反應變量為單變量 計量資料 單因素 樣本均數與總體均數比較 如果服從正態(tài)分布 , 選用樣本均數與總體均數比較的 如果不服從正態(tài)分布 ,則考慮用非參數檢驗方法 。 2 兩個相關樣本均數的比較 分析思路為:反應變量為單變量 計量資料 單因素 兩個相關樣本均數比較 ( 因為是配對設計 ) 。 如果差值服從正態(tài)分布 , 選用配對 如果差值不服從正態(tài)分布 , 選用單樣本秩和檢驗 ( 3 兩個獨立樣本均數比較 分析思路為:反應變量為單變量 計量資料 單因素 兩個獨立樣本均數比較 。 如果方差齊性 , 且兩樣本均服從正態(tài)分布 , 選用兩樣本 如果方差不齊 , 但兩樣本均服從正態(tài)分布 , 選用 t檢驗 , 或兩樣本秩和檢驗 ( 如果方差不齊 , 且兩樣本不服從正態(tài)分布 , 選用兩樣本秩和檢驗 。 本例選兩樣本 單變量計量資料的分析 4 多個樣本均數比較 應變量為單變量 , 又屬計量資料時 , 多個樣本均數比較分為單因素和多因素兩種情形 。 而重復測量資料則被視為多個反應變量的類型 。 (1) 單因素方差分析:若方差齊性 , 且各樣本均服從正態(tài)分布 , 選單因素方差分析 ( ;若方差不齊 , 或某樣本不服從正態(tài)分布 , 選 和檢驗 ( 若方差分析或秩和檢驗結果顯著 , 需進一步做多重比較 , 如 擴展 (2) 兩因素方差分析但不分析交互作用:主要是隨機區(qū)組設計資料 ,涉及 2個因素 , 即 1個處理因素和 1個區(qū)組因素 。 如果滿足方差齊性和正態(tài)分布兩個條件 , 選用兩因素方差分析 ( 如果不滿足上述兩個條件 , 選用隨機區(qū)組設計資料的 單變量計量資料的分析 (3) 三因素方差分析但不分析交互作用: 主要有拉丁方設計和二階段交叉設計兩種資料類型 。 對于拉丁方設計資料 , 涉及 3個因素 , 即 1個處理因素和 2個區(qū)組因素;對于二階段交叉設計資料 , 3個因素分別為處理因素 、 受試者和試驗階段 。 如果滿足方差齊性和正態(tài)分布兩個條件 ,拉丁方設計可選用三因素方差分析 ( 如例4階段交叉設計可選用廣義線性模型的方差分析 , 如例4如果不滿足上述兩個條件 , 選用非參數方法 ( 參見有關文獻 ) 。 若對處理因素的方差分析或秩和檢驗結果顯著,均需進一步做多重比較。 單變量計量資料的分析 (4) 多因素方差分析且分析交互作用: 此類資料包括析因設計資料 ( 例 11, 正交設計資料 ( 例 11, 嵌套設計資料 ( 例 11,裂區(qū)設計資料 ( 例 11等 。 (5) 重復測量資料: 單因素重復測量只有 1個重復測量因素,如表 12因素重復測量除有 1個重復測量因素外,至少還有 1個其它處理因素,可分析交互作用,如例12 單變量計數資料的分析 兩個率 總體與樣本 2檢驗 /切概率法 / 兩樣本率的 u 檢驗 配對 2檢驗 ( 單 樣本 u 檢驗 / 基于二項分布的確切概率法 兩樣本 非配對 配對 多個樣本率 / 構成比 2檢驗 分層 2檢驗( Co c h r 分層計數資料 雙向無序 單向有序 雙向有序 關聯度 分組變量有序 反應變量有序 配對 / 配伍設計 非配對 / 配伍設計 列聯系數分析 2檢驗 秩和 檢驗 驗/ 系數檢驗 秩相關分析 /線性趨勢檢驗 單變量等級資料的分析 若為兩組配對等級資料的比較,選 若為兩組獨立樣本等級資料的比較,選 若為多組獨立樣本等級資料的比較,選 雙變量資料的分析 1 簡單相關分析 分析兩變量的相關關系時 , 若兩變量滿足二元正態(tài)分布 , 可選 若兩變量不滿足二元正態(tài)分布 , 可選 相 關 分 析 ( 2 線性回歸分析 分析兩變量的回歸關系時 , 若兩變量關系呈線性趨勢 , 可選簡單線性回歸分析( 。 3 曲線回歸分析 分析兩變量的回歸關系時 , 若兩變量關系呈曲線趨勢 , 可按曲線類型選指數曲線 ,多項式曲線 , 生長曲線 , 也可選用非線性回歸分析方法 。 多變量資料的分析 1 有應變量的多元分析 若應變量 且服從正態(tài)分布 , 自變量滿足多元正態(tài)分布 , 可選 多元回歸分析或多元逐步回歸分析 因變量 二分類或多分類 ) , 且以判別分類為主要目的 , 自變量滿足多元正態(tài)分布 , 可選判別分析或逐步判別分析 。 若因變量 并含有截尾數據 , 可選 若因變量 且以分析危險因素為主要目的 , 如果為配比設計 , 選條件 果無配比設計 , 選非條件 多變量資料的分析 2. 無因變量的多元分析 欲將變量或觀察單位劃分為性質相近的 可選用聚類分析 。 3. 相關分析 若分析 1個變量與 1組變量的相關關系 , 可選多重線性相關分析;若分析 1組變量與另 1組變量的相關關系 , 可選典型相關分析 。 述 社會科學用統(tǒng)計軟件包,是目前世界上最優(yōu)秀統(tǒng)計分析軟件之一。 隨著產品服務領域的擴大和服務深度的增加,其英文全稱已于 2000年更改為 “ 統(tǒng)計產品與服務解決方案 。 述 . C. . 968年。 1984年 C+,其最初的幾個版本是基于 C+雖然功能強大,但在用戶界面、輸入、輸出環(huán)境等方面并不十分理想。 1992年 最初的 過對操作平臺的升級、數據交換與管理功能的升級、輸出結果的升級和統(tǒng)計分析功能的升級, 按照約定,凡是 C+;凡是 C+的 述 雖然也可以通過編輯程序來運行,但他最顯著的特點是菜單和對話框操作方式,絕大多數操作過程僅靠點擊鼠標即可完成 。因而,它以易于操作而成為最受歡迎的統(tǒng)計軟件包之一。 1 操作簡便 有一定統(tǒng)計基礎且熟悉 了數據錄入及部分命令程序等少數輸入工作需要使用鍵盤鍵入外 , 對于常見的統(tǒng)計分析方法完全可以通過對 “ 菜單 ” 、 “ 對話框 ” 的操作完成 , 無需編程 。 2 數據管理功能強大且操作直觀 轉換 、 檢索 、 統(tǒng)計分析 、 作圖 、 制表及編輯等功能;采用類似 數據接口較為通用 ,能方便的從其他數據庫中讀入數據 。 3 統(tǒng)計分析方法比較全面 件的統(tǒng)計過程包括了常用的 、較為成熟的統(tǒng)計分析方法 , 提供了從簡單的描述統(tǒng)計到復雜的多因素統(tǒng)計分析方法 。 比如數據的探索性分析 、 一般統(tǒng)計描述 、 簡單列聯表分析 、 均數比較 、 一般線性模型 、 混合模型 、 相關回歸 、 對數線性模型 、 聚類和判別 、 因子和對應分析 、 多維標度 、 信度分析 、 非參數檢驗 、 時間序列 、 生存分析及缺失值估計等 。 4 功能模塊組合靈活 件由 其中 其余為擴展模塊 , 分別用于完成某一方面的統(tǒng)計分析功能 。 用戶可根據自己的分析工作需要和計算機設備的實際配置情況選擇和裝配模塊 。 總之 , 形象直觀 、 易學易用 。 只要掌握一定的 懂得統(tǒng)計分析基本原理和方法 , 就可使用該軟件為特定的科研服務 。 (一 ) 1、 雙擊 ( 或單擊 ) 程序的桌面快捷方式圖標啟動 2、 通過 “ 開始 ” 菜單的 “ 程序 ” 運行方式啟動 (二 ) 1、 單擊主菜單中的 “ 在下拉菜單中單擊“ 可退出 2、單擊主菜單右上角控制框中的關閉按扭,可 退出 主界面 (數據編輯窗 )簡介 一、 數據編輯窗 在數據編輯窗中 , 有標題欄 、 菜單欄 、 工具欄 、 狀態(tài)欄和數據表視窗及變量表視窗 。 數據編輯窗主要有建立新的數據文件 、 編輯和顯示已有數據文件等功能 。 數據編輯窗組成 數據編輯窗由 數據表視窗 )和 變量表視窗 ) 兩個視窗組成 , 兩個視窗切換單獨顯示 。 數據表視窗用于顯示和編輯變量值;變量表視窗用于定義 、 顯示和編輯變量特征 。 在 一次只能打開和顯示一個數據文件 。 1標題欄 標題欄位于窗口頂部 , 左邊為控制菜單圖標和窗口名稱 , 右邊為窗口控制按鈕 。 標題欄 菜單欄 工具欄 數據表視圖 變量表視圖 狀態(tài)欄 2菜單欄 標題欄下面是一行由 10個菜單項組成的主菜單 , 其內容為: 文件操作 文件編輯 視圖 建立數據與數據整理 數據轉換 統(tǒng)計分析 繪圖 實用程序 窗口信息與控制 幫助 3工具欄 為了方便用戶 , 4狀態(tài)欄 狀態(tài)欄位于窗口的底部 , 顯示 當執(zhí)行 狀態(tài)欄中顯示正在執(zhí)行的相應過程名稱 。 5數據表視窗 ( 數據表視窗用于數據輸入 、 編輯 、 顯示 。 視窗中為一個可擴展的平面二維表格 , 表格的頂部為變量名 , 表格的左邊是觀察單位序號 。 一個變量名和一個觀察單位序號就對應了二維表格中的一個單元格 ( 視窗的工具欄下面有一個條形欄 , 它的左邊為窗口狀態(tài)欄 , 顯示輸入數據的記錄號和變量名 , 右邊為輸入數據欄 ,顯示從鍵盤輸入的變量值 。 當用戶選定某個單元格位置 , 它就被圈為黑框 , 用戶從數據輸入欄輸入數據 , 單擊該單元格或回車后 , 數據就以隱含格式進入黑框 。 觀察單位序號 變量 數據單元格顯示 6變量表視窗( 變量表視窗用于定義 、 顯示變量和編輯變量特征 , 視窗中有一個平面二維表格 , 表格的頂部為變量特征 , 表格的左則是變量序號 ,一行可定義一個變量 。 定義變量有如下內容:變量名 ( , 變量類型 ( , 變量寬度 ( , 保留小數位 ( ,變量標簽 ( , 變量值標簽 ( ,缺失值 ( , 變量顯示 ( ,對齊方式 ( , 變量類型 ( 。 變量特征 變量序號 二、結果輸出窗( 件包對數據進行分析后,把統(tǒng)計分析的結果自動地寫到結果輸出窗口中。 該窗口由左右兩框組成:左框主要顯示輸出的標題,為右框的內容提供了一大綱視圖,右框主要顯示統(tǒng)計圖、表以及一些文字說明(輸出統(tǒng)計分析結果)。移動該窗口的垂直與水平滾動條便可看到輸出結果的全部內容,或可用鼠標單擊左框中的標題直接轉入相應的輸出結果。 左框和右框的寬窄可通過移動兩框架間的縱線調節(jié)。雙擊左框架所選內容的標題圖標可在右框架中顯示或隱藏該內容,還可以通過移動左框中的選項來改變輸出結果的順序。 二、結果輸出窗( 二、結果輸出窗( 打開結果輸出窗有以下幾種方式:在第一次產生分析結果的 果輸出窗被自動打開;打開新的結果輸出窗,從菜單選擇 根據輸出結果的 3種形式,即文本、圖形和表格,結果輸出窗相應地設有 3個編輯器,即文本編輯器、統(tǒng)計圖編輯器和統(tǒng)計表編輯器,輸出結果可通過激活這些編輯器進行編輯。 三、程序編輯窗( 程序編輯窗口用于建立、編輯命令文件和其它文本文件。命令文件由若干條 用 1 啟動 . 數據文件的建立或讀入 (1)制定數據文件結構 (2)錄入數據 (3)編輯數據文件 3 數據的統(tǒng)計處理 4 結果輸出 5 保存文件 數據文件的建立 一是在 二是從 在 般來說,包括三個步驟: 定義變量, 錄入數據, 保存數據。 一、 定義變量 定義變量名 定義變量類型 定義變量長度(小數點) 定義變量標簽 定義變量值標簽 定義變量顯示格式(寬度、對齊方式) 定義變量步驟 (一 ) 首先啟動 入 數據編輯窗口。 數據編輯窗口被分為兩個視窗: “ 據表視窗) ” 和 “ 量表視窗) ” 。 (二 ) 單擊數據編輯窗口底部的 “ 簽切換到變量定義界面。 此時,電子表格中的行為變量,列依次為變量名、變量類型、變量長度、小數點位數、變量標簽、變量值標簽、缺失值、變量寬度、對齊方式和數據量度十個選項。 定義變量步驟 (三 ) 定義變量名 在 定義變量對話框 中的 “ 面輸入要定義的變量名 。 系統(tǒng)按變量定義順序給出的變量名默認值為: 此類推 。 定義變量名應遵循如下原則: 1. 首字符必須是英文字母或漢字,不能以下劃線 “ ”或圓點 “ .”結尾。 2. 變量名不能使用 謂 “ 保留字( ” 就是在程序語言或操作系統(tǒng)內已經指定用途的字句。 Y、 3. 變量名中不能有空格或某些特殊符號,如 “ !”、 “ ? ”和 “ ” 等。 4. 系統(tǒng)中不區(qū)分變量名中的大小寫字符。例如 5. 變量名稱最好以能夠代表該數據意義的文字來命名,如此可提高變量的可讀性。 定義變量步驟 (四 ) 定義變量類型 在 “ 的單元格,單擊定位后,單元格右方出現按鈕 。單擊該按鈕,彈出定義變量類型 (話框。系統(tǒng)默認為數值型 對話框中出現八種可供選擇的變量類型,分別是: 八種可供選擇的變量類型 “ 標準數值型變量 , 系統(tǒng)默認 “ 帶逗點的數值型變量:千進位用逗號分隔 , 小數與整數間用圓點分隔 “ 圓點數值型變量:千進位用圓點分隔 , 小數 與整數間用逗號分隔 “ 科學計數法 “ 日期型變量 “ 帶美元符號的數值型變量 “ 自定義變量 “ 字符型變量 定義變量 類型 若選了 “ 則用戶可在 定義變量類型(話框 中部的 “ “ 本框中鍵入相應的數值型的寬度 ( 長度 ) 及小數位數 。 其默認值為寬度: 8, 小數位數:2。 應該注意 , 數值型的寬度應該大于該變量的數據的 “ 整數位數 +小數位數 + ” 。 若選了 “ 則用戶可在 定義變量類型(話框 “ 本框中鍵入字符串的長度 。 (五 ) 定義變量名的標簽,簡稱變量標簽 (定義變量標簽是對該變量名所表示的數據項內涵的進一步說明。有時變量名不足以表示該變量的內涵,這時需要定義變量的標簽。而變量標簽最多可由 256個字符組成。在統(tǒng)計分析過程的輸出中會在變量名對應的位置顯示該變量的標簽,有助于理解輸出結果。變量標簽為可選項 (可以定義,也可以不定義。 單擊 定義變量對話框中的 “ 鈕 , 鍵入 “ .”即可 (六 )定義變量值標簽 每個變量名對應一個數據項 , 每個變量取不同的值 ,表示數據項中的不同信息 。 有時為了更好理解統(tǒng)計分析過程中的輸出結果 , 要給變量的取值 ( 簡稱變量值 ) 賦以標簽 。 那么在輸出結果的相應位置上就會出現該標簽 , 使讀者一目了然 。 并不是所有變量值都要取標簽 , 一般來說離散變量才給變量值定義標簽 。 例如: 變量名 變量標簽 變量值 變量值標簽 性別 1 男 2 女 (六 )定義變量值標簽 單擊定義變量對話框中的 “ 鈕,彈出變量值標簽對話框 在 “ 域用戶可鍵入變量值標簽:首先在“ 后的文本框內鍵入變量值 , 再在 “ 的文本框內鍵入該變量值的標簽 , 然后用單擊 “ 鈕 。重復此操作 , 直到全部變量值及其標簽都輸完為止 。 例如 應先在 “ 中鍵入 1, 再在 “ 鍵入 “ 男 ” , 然后擊 “ 鈕 。 類似的 , 繼續(xù)在“ 中鍵入 2, 在 “ 鍵入 “ 女 ” , 然后再單擊“ 至此 , 所有變量值都已賦以標簽 , 按 “ , 返回到 定義變量對話框 。 (七 ) 定義變量缺失值 在 系統(tǒng)缺失值和用戶缺失值。前者不需定義,系統(tǒng)自動生成。只有用戶缺失值才需定義。 在變量表視圖中的 “ 的單元格中,單擊定位后,單元格右方出現按鈕 。單擊該按鈕,彈出缺失值定義(話框。 若無缺失值,可選 “ No (八 ) 定義變量的顯示寬度 變量表視圖的 “ 示列寬,用于調整數據表中各列的顯示寬度。系統(tǒng)默認為 8位。 “ 的單元格中,單擊定位后,單元格右方出現按鈕 ,點擊可增加或減少位數,或直接在方格中填入數字。列寬位數要大于該變量中 則在數據表中,數據顯示不完整。 (九 ) 定義變量顯示的對齊方式 在變量表視圖 “ 的單元格中,單擊定位后,單元格右方出現按鈕 , 點擊該按鈕,在下拉列表框選擇對齊方式。三個選項 “ “ 、“ 別為左對齊、右對齊、居中。系統(tǒng)默認為右對齊。 (十)定義變量的度量類型 在變量表視圖 “ 的單元格中,單擊定位后,單元格右方出現按鈕 , 點擊該按鈕,在下拉列表框中選擇度量類型。 變量類型為 量類型默認值為 量類型為 默認值為 量變量,如身高、體重、血壓等測量值。 級變量(半定量,有序分類) 如療效記錄: 治愈、顯效、 好 轉、無效。 性變量,如血型記錄: 二、 數據錄入 完成變量定義后,單擊數據編輯窗口左下方的 ” 簽,切換到數據表視圖,此時,電子表格中的列為變量,行為個案。數據錄入方法主要有以下三種: 把光標移到要輸入的該變量名對應的一列的頂部 , 即序號為 1的單元格并單擊之 , 使該單元格為當前操作的單元格 , 輸入該變量的第一個值 , 回車 。 此時 , 序號為 1的單元格接受該數值 , 并且當前操作單元格下移到序號為 2的單元格 。 輸入第二個值 , 回車 。 如此一直到把該變量的數值輸完為止 。 先把光標移到第一個變量和第一個觀察單位序號的交叉單元并單擊之,使之成為當前操作單元格。輸入第一個觀察單位序號的第一個變量值,按 “ ,該單元格接受該數據,同時激活右邊一個單元格(即成為當前操作單元格)。接著,輸入第一個觀察單位序號的第二個變量,按 “ ; 。直到輸完第一個觀察序號的最后一個變量值。 要想輸入某個觀察序號的某個變量值 , 可以移動光標到二維數據表格中的相應的單元格并單擊之 , 使之成為當前操作單元格 。 鍵入變量值 , 回車即可 。 三、 數據文件的存儲 (一 )數據存儲 選主菜單 “ 的 “ “ 彈出保存文件 ( s) 對話框 , 選擇保存路徑 , 鍵入文件名 , 確定數據類型 , 單擊保存 。 展名為 展名為 展名為 l 展名為 l 展名為 S P S S (*v) S P S S W 立 的數據文件 S P S S (*v) S P S S 據文件 S P S S /P C + (*.s y s ) S P S S 建立的數據文件 S P S S P * 其他軟件生成的 I 文件 T a bde li mi *t) I ( T a b 分隔符 ) 文件 S y .s y d), (*.s y s) S y 據文件 F ix e d I ( *t) 文本文件 E L (*.x E L 建立的數據文件 1 - 2 - 3 R e l .w 用 L - 2 - 3 3. X 產生的數據文件 1 - 2 - 3 R e l .w 用 L - 2 - 3 2. X 產生的數據文件 1 - 2 - 3 R e l .w 用 L - 2 - 3 1. X 產生的數據文件 S Y L K( *k) S Y L K( 符號鏈接 ) 格式數據文件 V (*f) 式數據文件 I I (*f) 式數據文件 I (* 式數據文件 調用已建立的數據文件 選擇 “ “打開文件( “ 文件類型 ” 下拉列表框中選擇相應的文件類型 。 * C+ (* * 其他軟件生成的 * * * 用 產生的數據文件 選定文件 ,單擊打開 (O)按鈕 , 選定的文件就被讀入 。 數據文件整理 數據整理是對原始數據中的變量或觀察單位進行編輯、增加、刪除、排序、轉置、合并和加權等處理。數據文件的整理主要是通過主菜單的 “ “ 個菜單項來實現,其主要功能分別見下表。 “單項說明 命令 說明 Un d o 撤銷前一個操作。 用來刪除剛剛輸入的數據或恢復修改的數據。 Re d o 重做用“ u n d o ”命令撤銷了的操作。 Cu t 剪切指定的內容到剪貼板。 Co p y 復制指定的內容到剪貼板。 P a 粘貼剪貼板中內容到指定的位置。 P a V a b 粘貼剪貼板中的變量到指定的位置。 r 清除數據編輯窗口中指定的內容(包括變量或觀察單位)。 F in d 搜尋指定變量的某個變量值。 Op ti o n s 提供了“ Ge n e ra l ” 、“ V ie we r ” 、“ D ra f t V e r ” 、“ Ou tp u t L a b 、“ Ch a 、“ In c ti v e ” 、“ P iv o t T a b 、“ Da 、“ Cu n c y ”、“ S c 10 個選項卡,可以對數據文件以及輸出結果(包括統(tǒng)計表、圖)的格式、外觀等進行定 義。 “單項說明 命令 說明 De f in e V a r o p e e s 定義與修改一個變量的屬性。 Co p y Da ro p e e s 將某個變量的屬性(如小數位數)復制給變量類型與其相同的一個或多個變量。 De f in e Da te s 定義時間。主要用于時間序列分析。 In se a 在指定位置插入一個變量 In se a se s 在指定位置插入一個觀察單位 G o Ca 定位到指定的觀察單位 S o a se s 按某變量值對觀察值進行排序 T ra n sp o 轉置數據文件 Re c tu 數據結構的重組 M e r g e F il e s 合并數據文件 Ag g re g a 對數據進行分類與不分類的匯總 Id e n ti f y Du p li c a as e s 定義重復的觀察值 o g o n a l De n 正交設計 S p li t F il e 分割數據文件 S e t Ca se s 選擇觀察單位 W e ig h t c a s e s 變量加權。常用于計數頻數表資料,如列聯表和等級資料頻數表,加權后的變量被說明 成頻數。 一、數據編輯 數據編輯操作在數據編輯窗口中的 “ 圖下進行。 (一 ) 選擇操作對象 光標定位于選定的變量名上,單擊鼠標左鍵,則該變量名所在列全部反白顯示。 光標定位于選定的觀察單位序號上,單擊鼠標左鍵,則該觀察單位所在行全部反白顯示。 光標定位于第一個變量名上,單擊鼠標左鍵不要松開,向右移動鼠標,直到要選的列全部反白顯示,再松開鼠標左鍵。 光標定位于第一個觀察單位序號上,單擊鼠標左鍵不要松開,向下移動鼠標,直到要選的行全部反白顯示,再松開鼠標左鍵。 一、數據編輯 鼠標左鍵單擊要選的第一個變量名,然后按下 用鼠標左鍵單擊其他變量名,最后松開 6. 選擇不連續(xù)的若干個觀察單位:用鼠標左鍵單擊要選的第一個觀察單位序號,然后按下 用鼠標左鍵單擊其他觀察單位序號,最后松開 要選擇某個變量的第二個至第九個的變量值,可將光標定位于該變量的第二個變量值上,按下鼠標左,向下拖動鼠標一直到第九個變量值再松開鼠標左鍵,使選中的單元格全部反白顯示。 光標定位于開始的單元格,按下鼠標左鍵,向右橫向拖動鼠標,直到選中的單元格全部變?yōu)榉窗罪@示時,松開鼠標左鍵。 一、數據編輯 (二 ) 數據剪切、拷貝和粘貼 含兩種狀態(tài):一種是單純剪切,相當于刪除 ;另一 種在原處剪切,轉移粘貼到另一處適當的地方。 剪切的方法有: 方法一:選定要剪切的內容,再從 “ 單項中選擇“ 。 方法二:選定要剪切的內容,點鼠標右鍵,從快捷菜單中選擇 “ 方法三:選定要剪切的內容,用鼠標左鍵單擊工具欄的圖標按鈕 。 方法四:選定要剪切的內容,同時按下 X 鍵。 以上四種方法都會使選定的內容從數據編輯器中消失,并且暫時轉存到假想的剪貼板上保存起來。 一、數據編輯 (二 ) 數據剪切、拷貝和粘貼 要把選中的內容復制到另一適當的位置,而其原來的內容還在原來的位置上。 拷貝的方法有: 方法一:選定要復制的內容,再從 “ 單項中選擇“ 方法二:選定要復制的內容,點鼠標右鍵,從快捷菜單中選擇 “ 方法三:選定要復制的內容,用鼠標左鍵單擊工具欄的圖標按鈕 。 方法四:選定要復制的內容,同時按下 C 鍵。 以上四種方法的結果是原來選定的內容不變,而其相同內容存儲到剪貼板上。 一、數據編輯 (二 ) 數據剪切、拷貝和粘貼 把剪切操作或拷貝操作存入剪貼板的內容粘貼到新的適當的地方。 拷貝和粘貼一個變量 按 (一 )的方法選擇一個變量; 按剪切或拷貝操作,把它轉存到剪貼板上 ; 按后述插入變量的方法,在適當位置上插入一個空變量; 第 4步有四種方法: 方法一: 從 “ 菜單項中選擇 “ 方法二:點鼠標右鍵,從快捷菜單中選擇 “ 方法三:用鼠標左鍵單擊工具欄的圖標按鈕 。 方法四:同時按下 V 鍵。 一、數據編輯 (二 ) 數據剪切、拷貝和粘貼 拷貝和粘貼一個觀察單位 按

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯系上傳者。文件的所有權益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網頁內容里面會有圖紙預覽,若沒有圖紙預覽就沒有圖紙。
  • 4. 未經權益所有人同意不得將文件中的內容挪作商業(yè)或盈利用途。
  • 5. 人人文庫網僅提供信息存儲空間,僅對用戶上傳內容的表現方式做保護處理,對用戶上傳分享的文檔內容本身不做任何修改或編輯,并不能對任何下載內容負責。
  • 6. 下載文件中如有侵權或不適當內容,請與我們聯系,我們立即糾正。
  • 7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

評論

0/150

提交評論