spss實戰(zhàn)_第1頁
spss實戰(zhàn)_第2頁
spss實戰(zhàn)_第3頁
spss實戰(zhàn)_第4頁
spss實戰(zhàn)_第5頁
已閱讀5頁,還剩174頁未讀, 繼續(xù)免費閱讀

下載本文檔

版權說明:本文檔由用戶提供并上傳,收益歸屬內容提供方,若內容存在侵權,請進行舉報或認領

文檔簡介

Dept. of Epi. & Biostat.,School of Public Health,NJMUJunchengDai,E_mail:,常用統(tǒng)計學方法簡介 SPSS實戰(zhàn)篇,提 綱,背景介紹,數(shù)據(jù)管理,數(shù)據(jù)導入,數(shù)據(jù)分析,一些建議,參考文獻,SPSS 軟件簡介,SPSS原為Statistical Package for the Social Sciences的簡稱,意為“社會科學統(tǒng)計軟件包”。2002年SPSS公司正式將英文全稱更改為Statistical Product and Service Solutions,意為“統(tǒng)計產品與服務解決方案”。 SPSS for Windows是一個集數(shù)據(jù)整理、分析功能于一身的組合式軟件包。SPSS的基本功能:數(shù)據(jù)管理、統(tǒng)計分析、圖表分析、輸出管理等,創(chuàng) 始 人 Nie、Hull and Bent 歷史悠久 1968年完成spss基本框架的構建 1984年正式推出基于pc的版本用戶群廣 全球范圍內用戶超過250,000 遍及全世界60多個國家,有1,200多名員工 權 威 全美50個州的政府所指定使用的統(tǒng)計軟件,SPSS 軟件簡介,常用的統(tǒng)計分析軟件,SASSPSSStataS-plusR,軟件的特點,功能強大囊括了各種成熟的統(tǒng)計方法和模型提供各種數(shù)據(jù)準備與數(shù)據(jù)整理技術自由靈活的表格功能提供了各種常用的統(tǒng)計學圖形兼容性好在數(shù)據(jù)方面在結果方面易用性強,SPSS13.0的新增功能,圖形和結果新增三種新的圖形:Population pyramids、3-D bar charts以及Dot charts圖形功能的表達:組圖功能、添加誤差條、參考線、連接線等數(shù)據(jù)和結果的管理與導出字符型變量可長達32767字節(jié)可以讀入SAS 9.1.3數(shù)據(jù)應用日期時間向導可將結果中的統(tǒng)計圖表直接導出到PowerPoint文件統(tǒng)計功能的增強新增決策樹模塊在復雜抽樣模塊中增加了線型回歸、方差分析和協(xié)方差分析等二分類和多分類Logistic回歸等定性數(shù)據(jù)的分析功能,提 綱,背景介紹,數(shù)據(jù)管理,數(shù)據(jù)導入,數(shù)據(jù)分析,一些建議,參考文獻,SPSS界面介紹,SPSS界面介紹,數(shù)據(jù)的錄入,數(shù)據(jù)的錄入,數(shù)據(jù)的錄入,數(shù)據(jù)的錄入,數(shù)據(jù)的錄入,變量名:不超過64個字符,首字符必須是字母或漢字,不能以“_”或“.”結尾變量名不能有空格或某些特殊符號,如“!”、“?”和“*”變量名不能與SPSS的關鍵字相同,如ALL、AND、BY、EQ、WITH、OR等,數(shù)據(jù)的錄入,標準數(shù)值型逗號數(shù)值型圓點數(shù)值型科學計數(shù)法型日期型美元數(shù)值型用戶自定義型字符型,變量類型,數(shù)據(jù)的錄入,數(shù)據(jù)的錄入,數(shù)據(jù)的錄入,數(shù)值標簽,數(shù)據(jù)的錄入,缺失值的定義,數(shù)據(jù)的錄入,列寬,對齊,連續(xù)性變量有序分類變量無序分類變量,數(shù)據(jù)的獲取,方法一:,數(shù)據(jù)的獲取,方法二:,數(shù)據(jù)的獲取,SPSS13.0可以導入*.sav,*.xls,*.dbf,*.dat,*.txt,*.mdb,*.w,*.dbc以及各類SAS數(shù)據(jù)文件。,數(shù)據(jù)的獲取,使用文本導入向導讀入文本類型的數(shù)據(jù)*.txt,數(shù)據(jù)的保存,數(shù)據(jù)的保存,提 綱,背景介紹,數(shù)據(jù)管理,數(shù)據(jù)導入,數(shù)據(jù)分析,一些建議,參考文獻,數(shù)據(jù)的管理,文件級別的管理,Define Variable PropertiesCopy Data PropertiesDefine DatesInsert VariableInsert CaseGo to Case Sort CasesTranspose RestructureMerge Files Aggregate Identify Duplicate CasesOrthogonal DesignSplit File Select Cases Weight Cases,Define Variable Properties ,Define Variable Properties ,Insert Variables/Cases,插入變量,插入記錄,Insert Variables/Cases,點擊右鍵,插入變量,插入記錄,Go to Case.,Sort Case.,Sort Case.,點擊右鍵,*只能進行單變量排序,Transpose.,將數(shù)據(jù)庫的行 列,列 行,Restructure.,Restructure.,Restructure.,Merge Files.,縱向合并,橫向合并,Add Cases.,遵循兩個原則:兩個待合并的SPSS數(shù)據(jù)文件,其內容合并是有實際意義的;為方便SPSS數(shù)據(jù)文件的合并,在不同數(shù)據(jù)文件中,數(shù)據(jù)含義相同的列,最好起相同的變量名,變量類型和變量長度也要盡量相同,這樣方便 SPSS對變量的自動對應和匹配。,Add Cases.,Add Variables.,遵循三個原則:如果不是按照記錄號對應的規(guī)則進行合并,則兩個數(shù)據(jù)文件必須至少有一個變量名相同的公共變量,這個變量是兩個數(shù)據(jù)文件橫向對應合并的依據(jù),稱為關鍵變量;如果是使用關鍵變量進行合并的對應,則兩個數(shù)據(jù)文件都必須事先按關鍵變量進行升序排列;為方便SPSS數(shù)據(jù)文件的合并,在不同數(shù)據(jù)文件中,數(shù)據(jù)含義不同的列,變量名不應該取相同的名稱。,Add Variables.,Add Variables.,*橫向合并一定要按照關鍵變量進行排序,否則相應的合并操作將會失敗!,Aggregate.,Aggregate.,Identify Duplicate Cases.,Identify Duplicate Cases.,Split File.,Select Cases.,Select Cases.,分析所有的記錄只分析滿足條件的記錄從原始數(shù)據(jù)中按某種條件抽樣基于時間或記錄序號來選擇記錄使用篩選指標變量來選擇,Weight Cases.,ComputeRecodeVisual BanderCountRank CasesAutomatic RecodeDate/TimeCreat Time SeriesReplace Missing ValueRandom Number GeneratorsRun Pending Transforms,變量級別的管理,Compute.,生成新變量,Compute.,設置條件,練習:1、計算平均的收縮壓和舒張壓:2、計算BMI:3、計算年齡:有兩種方法,Age=RND(CTIME.DAYS(invidate)-CTIME.DAYS(birth)/365.25)Age=RND(invidate - birth)/(60 * 60 * 24 * 365.25),bmi=weight/(height/100)*2,sbp= (sbp1+sbp2+sbp3)/3dbp=(dbp1+dbp2+dbp3)/3,Recode.,練習:1、Into Same Variables 將性別變量編碼(1=男;2=女)修改為0=男;1=女2、Into Different Variables 根據(jù)計算出來的年齡分組,1表示=60歲,Into Different Variables,Into Different Variables,Visual Bander.,Visual Bander.,Visual Bander.,Visual Bander.,Count.,Rank Cases.,Rank Cases.,Automatic Recode.,Date/Time.,Replace Missing Value.,Replace Missing Value.,用所有記錄該變量上數(shù)值的均值用相鄰的前和后的鄰近數(shù)值的均值用相鄰的前和后鄰近數(shù)值的中位數(shù)線性內插值法:以缺失值前后的2個有效觀察值,根據(jù)內插法估計和替代缺失值。線型趨勢法。用線性回歸法生成和替代缺失值。,Random Number Generators.,提 綱,背景介紹,數(shù)據(jù)管理,數(shù)據(jù)導入,數(shù)據(jù)分析,一些建議,參考文獻,數(shù)據(jù)匯總報告描述性統(tǒng)計統(tǒng)計表均數(shù)比較一般線性模型混合模型相關分析回歸分析對數(shù)線性模型聚類/判別分析因子分析及主成分分析量表(信度、效度)分析非參數(shù)檢驗時間序列分析生存分析多重響應等幾大類缺失值分析復雜抽樣,SPSS統(tǒng)計分析過程,數(shù)據(jù)匯總報告(Reports),即時匯總數(shù)據(jù)匯總行匯總報告列匯總報告,OLAP Cubes,OLAP:Online Analytical Processing,OLAP Cubes,OLAP Cubes,OLAP Cubes,基本描述統(tǒng)計分析,Frequencies,Frequencies,Frequencies,Descriptives,Descriptives,Explore,判斷有無離群點或極端值提示數(shù)據(jù)轉換方法了解組間差異的特征給出統(tǒng)計量、正態(tài)檢驗和描述性統(tǒng)計圖,包括莖葉圖、直方圖及箱圖,Explore,Explore,Explore,Explore,Crosstabs,例:某醫(yī)師研究用蘭苓口服液與銀黃口服液治療慢性咽炎療效有無差別,將病情相似的80名患者隨機分成兩組,分別用兩種藥物治療。問兩藥的治療有效率是否相同。,Crosstabs,Crosstabs,Crosstabs,、P值,連續(xù)性變量的假設檢驗,一、t檢驗 1、樣本均數(shù)與總體均數(shù)的比較 2、完全隨機設計(成組設計)的兩樣本均數(shù)的比較 3、完全配對設計的兩樣本均數(shù)比較二、方差分析 1、完全隨機設計(成組設計)的單因素方差分析 2、隨機區(qū)組設計(配伍設計)的兩因素方差分析三、協(xié)方差分析,樣本均數(shù)與已知總體均數(shù)的比較,例:通過大量調查,已知某地正常男嬰體重為3.26Kg,某醫(yī)生隨機抽取20名難產男嬰,測得出生體重如下:問,該地難產男嬰體重是否不同于本地正常男嬰?3.5 3.5 3.2 3.5 3.3 3.0 3.3 3.2 3.4 2.7 3.4 3.6 3.5 2.8 3.4 2.9 3.5 3.5 4.0 4.0,SPSS 分析命令:AnalyzeCompare MeansOne-Sample T Test,樣本均數(shù)與已知總體均數(shù)的比較,總體均數(shù),樣本均數(shù)與已知總體均數(shù)的比較,結論:不能認為難產男嬰的出生體重與正常男嬰不同。,完全隨機設計(成組設計)兩個樣本均數(shù)的比較,例:某醫(yī)生測得12名正常人和13名病毒性肝炎患者血清轉鐵蛋白含量(g/L) 結果如下:問肝炎患者和正常人血清轉鐵蛋白含量有無差異?病毒性肝炎患者:2.34 2.47 2.22 2.31 2.36 2.38 2.15 2.57 2.19 2.25 2.28 2.31 2.42正常人: 2.61 2.71 2.73 2.64 2.68 2.81 2.76 2.55 2.91 2.85 2.71 2.64,SPSS 分析命令:AnalyzeCompare MeansIndependent-Samples T Test,完全隨機設計(成組設計)兩個樣本均數(shù)的比較,完全隨機設計(成組設計)兩個樣本均數(shù)的比較,統(tǒng)計描述,方差齊性檢驗,結論:病毒性肝炎患者與正常人血清轉鐵蛋白含量有差別。,配對設計的兩個樣本均數(shù)比較,例:為比較某新藥與常規(guī)藥降血脂的效果,將性別相同、血清總膽固醇水平相近的高血脂患者配成對子,每對中隨機抽取一個人服用新藥,另一個人服用常規(guī)藥。服用一段時間后,測得血清總膽固醇含量(mmol/L)如下:問新藥與常規(guī)藥降血清總膽固醇效果是否相同?新 藥:6.57 6.46 6.27 6.89 6.21 7.61 7.60 7.04 6.68 7.42常規(guī)藥:6.00 6.83 5.97 7.28 6.30 6.64 7.38 7.00 6.03 7.22,SPSS 分析命令:AnalyzeCompare MeansPaired-Samples T Test,配對設計的兩個樣本均數(shù)比較,配對設計的兩個樣本均數(shù)比較,結論:不能認為新藥與常規(guī)藥降低血清總膽固醇的效果不同。,配對差值,方差分析Analysis of Variance, ANOVA,方差分析的目的: 推斷多個總體均數(shù)是否相等方差分析的使用條件:各處理組樣本來自正態(tài)總體各樣本是相互獨立的隨機樣本各處理組的總體方差相等,即方差齊性,方差分析的結果解釋: 方差分析的F 檢驗,當P0.05,可以認為各組總體均數(shù)不等或不全相等,但并不以為著任意兩組總體均數(shù)都有差別。需要進一步作兩兩比較才能知道哪些組間有差別。多個樣本均數(shù)間的兩兩比較 當樣本組數(shù)大于2時,不宜再用前述的t檢驗分別作兩兩比較,否則會增大犯第一類錯誤的概率。方差分析與t檢驗的聯(lián)系 t檢驗可以看作時方差分析的特例:,方差分析的注意事項,完全隨機設計(成組設計)的單因素方差分析1個因素,k個水平,例:某社區(qū)隨機抽取30名糖尿病患者、糖耐量減低(IGT)者和正常人進行載脂蛋白(mg/dl)測定,結果如下:問三種人載脂蛋白水平有無差別?糖尿病患者:85.70 105.20 109.50 96.00 115.20 95.30 110.00 100.00 125.60 111.00 106.50IGT異常者:96.00 124.50 105.10 76.40 95.30 110.00 95.20 99.00 120.00正 常 人:144.00 117.00 110.00 109.00 103.00 123.00 127.00 121.00 159.00 115.00,方法一:AnalyzeCompare MeansOne-Way ANOVA,完全隨機設計(成組設計)的單因素方差分析1個因素,k個水平,指定進行方差齊性檢驗,完全隨機設計(成組設計)的單因素方差分析1個因素,k個水平,結論:可以認為三種人血清載脂蛋白水平有差別。,兩兩比較,假定方差齊時,假定方差不齊時,兩兩比較,多重比較,結論:糖尿病患者與正常人、IGT異常者與正常人的載脂蛋白水平有差異;糖尿病患者與IGT異常者的載脂蛋白水平無差異。,兩兩比較,結論:糖尿病患者與正常人、IGT異常者與正常人的載脂蛋白水平有差異;糖尿病患者與IGT異常者的載脂蛋白水平無差異。,SNK,同一列,無差別不同列,有差別,分類變量的假設檢驗和非參數(shù)檢驗,一、分類變量的假設檢驗 1、完全隨機設計(成組設計)的兩樣本率(構成比)比較 2、配對設計的兩樣本率(構成比)比較 3、完全隨機設計的多個樣本率(構成比)比較二、非參數(shù)檢驗 1、完全隨機設計的兩樣本比較 2、配對設計的兩樣本比較 3、完全隨機設計的多個樣本比較 4、隨機區(qū)組設計多個樣本比較,完全隨機設計兩個樣本率的比較,例1:某中藥在改變劑型前曾在臨床觀察152例,治愈129例,未治愈23例;改變劑型后又在臨床觀察130例,治愈101例,未治愈29例,能否得出新劑型療效與舊劑型不同的結論?,完全隨機設計兩個樣本率的比較,完全隨機設計兩個樣本率的比較,SPSS 分析命令:AnalyzeDescriptive StatisticsCrosstabs,行變量,列變量,例2:某礦石粉廠當生產一種礦石粉時,在數(shù)天內即有部分工人患職業(yè)性皮炎,本生產季節(jié)開始,隨機抽取15名車間工人穿上新防護服,其中1名患皮炎,其余28名工人仍穿舊防護服,其中10名患皮炎。生產一段時間后,檢查兩組工人皮炎患病率,問兩組工人皮炎患病率有無差異?,例3:某醫(yī)師A藥治療9例病人,治愈7人;用B藥治療10例病人,治愈1人,問兩藥療效是否有差別?,配對設計兩個樣本率的比較,例1:分別用反向血凝法和酶標法對200名獻血員進行HBsAg檢測,結果如下,問兩種檢驗方法檢出率有無差異?,方法一:Crosstabs,方法一:Crosstabs,方法一:Crosstabs,方法一:Crosstabs,方法 二:非參數(shù)檢驗 Nonparametric Test,方法 二:非參數(shù)檢驗 Nonparametric Test,方法 二:非參數(shù)檢驗 Nonparametric Test,完全隨機設計的多個樣本率的比較,例:某省從水氟含量不同的地區(qū)隨機抽取10-12歲兒童,進行第一恒齒患病率的調查,問3個地區(qū)第一恒齒患病率是否不同?,SPSS 分析命令:AnalyzeDescriptive StatisticsCrosstabs,完全隨機設計的多個樣本率的比較,結論:3個地區(qū)第一恒齒患病率不同或不全相同。,分層資料的2檢驗,例:Doll和Hill以709例肺癌患者作病例、709個非腫瘤患者作對照,按照性別分層,研究吸煙與肺癌的關系,調查結果見表,試做病例對照分析,SPSS 分析命令:AnalyzeDescriptive StatisticsCrosstabs,分層資料的2檢驗,分層資料的2檢驗,分層資料的2檢驗,分層資料的2檢驗,分層資料的2檢驗,結果顯示:在剔除了混雜因素性別的影響后,吸煙與肺癌仍然顯著相關,即吸煙是導致肺癌發(fā)生的危險因素。,秩和檢驗主要適用于以下情況:數(shù)值變量資料:嚴重偏離正態(tài)分布或者分布未知數(shù)值變量資料:完全隨機設計中方差不齊有序分類資料(等級資料)注:但數(shù)據(jù)滿足參數(shù)檢驗的條件時,若采用秩和檢驗,會降低統(tǒng)計效能(1)。,非參數(shù)檢驗秩和檢驗,兩組連續(xù)性變量資料的秩和檢驗,例:某實驗室觀察某種抗癌新藥治療小鼠移植性腫瘤的療效,兩組各10只老鼠,以生存日期作為觀察指標,試檢驗兩組小鼠生存日數(shù)有無差別?,SPSS 分析命令:AnalyzeNonparametric Tests2 Independent Samples,兩組連續(xù)性變量資料的秩和檢驗,結論:兩組小鼠生存日數(shù)差別有統(tǒng)計學意義,試驗組小鼠生存時間長于對照組。,兩組連續(xù)性變量資料的秩和檢驗,兩組有序變量資料的秩和檢驗,例:某研究者欲評價新藥按摩樂口服液治療高甘油三酯血癥的療效,將高甘油三酯血癥患者189例隨機分為兩組,分別用按摩樂口服液和山楂降脂片治療,問兩種藥物治療高甘油三酯血癥的療效有何不同?,SPSS 分析命令:AnalyzeNonparametric Tests2 Independent Samples,結論:兩種藥物對高甘油三酯血癥的療效分布不同。,兩組有序變量資料的秩和檢驗,配對設計資料的符號秩和檢驗,例:某研究者欲研究保健食品對小鼠抗疲勞作用,將同種屬的

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內容里面會有圖紙預覽,若沒有圖紙預覽就沒有圖紙。
  • 4. 未經權益所有人同意不得將文件中的內容挪作商業(yè)或盈利用途。
  • 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內容的表現(xiàn)方式做保護處理,對用戶上傳分享的文檔內容本身不做任何修改或編輯,并不能對任何下載內容負責。
  • 6. 下載文件中如有侵權或不適當內容,請與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

評論

0/150

提交評論