統(tǒng)計(jì)描述與t檢驗(yàn)SPSS應(yīng)用PPT課件_第1頁(yè)
統(tǒng)計(jì)描述與t檢驗(yàn)SPSS應(yīng)用PPT課件_第2頁(yè)
統(tǒng)計(jì)描述與t檢驗(yàn)SPSS應(yīng)用PPT課件_第3頁(yè)
統(tǒng)計(jì)描述與t檢驗(yàn)SPSS應(yīng)用PPT課件_第4頁(yè)
統(tǒng)計(jì)描述與t檢驗(yàn)SPSS應(yīng)用PPT課件_第5頁(yè)
已閱讀5頁(yè),還剩65頁(yè)未讀 繼續(xù)免費(fèi)閱讀

下載本文檔

版權(quán)說(shuō)明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請(qǐng)進(jìn)行舉報(bào)或認(rèn)領(lǐng)

文檔簡(jiǎn)介

1、教學(xué)目的 掌握各集中趨勢(shì)指標(biāo)與離散趨勢(shì)指標(biāo)的意義和應(yīng)用; 掌握在SPSS上對(duì)資料進(jìn)行描述性統(tǒng)計(jì)分析; 掌握在SPSS上對(duì)資料進(jìn)行正態(tài)性檢驗(yàn)和方差齊性檢驗(yàn); 掌握t檢驗(yàn)的應(yīng)用條件及常用的檢驗(yàn)方法。1第1頁(yè)/共70頁(yè)統(tǒng)計(jì)描述v 統(tǒng)計(jì)學(xué)分析主要有兩個(gè)方面,一方面是統(tǒng)計(jì)描述,另一方面是統(tǒng)計(jì)推斷。統(tǒng)計(jì)描述是指用統(tǒng)計(jì)指標(biāo)和適當(dāng)?shù)慕y(tǒng)計(jì)圖表來(lái)描述資料的分布規(guī)律及其數(shù)量特征。通過(guò)描述性統(tǒng)計(jì)分析可以初步掌握數(shù)據(jù)的基本統(tǒng)計(jì)學(xué)特征,為采用其他統(tǒng)計(jì)學(xué)分析方法打下基礎(chǔ),為進(jìn)一步進(jìn)行統(tǒng)計(jì)學(xué)分析提供依據(jù)。v 統(tǒng)計(jì)學(xué)描述的基本方法有數(shù)據(jù)頻數(shù)分布特征描述、集中趨勢(shì)值和離散趨勢(shì)值的計(jì)算等。2第2頁(yè)/共70頁(yè)資料分類v 針對(duì)不同的資

2、料類型,采用的統(tǒng)計(jì)學(xué)描述方法也不同。v 那么,常見的資料類型有哪些呢? 資料類型計(jì)量資料計(jì)數(shù)資料等級(jí)資料3第3頁(yè)/共70頁(yè)資料分類v 計(jì)量資料:可分為連續(xù)型和離散型,是指對(duì)每個(gè)觀察對(duì)象的觀察指標(biāo)用定量方法測(cè)定其數(shù)值大小所得,一般帶有度量衡單位。例如:血壓值、身高、體重等。v 計(jì)數(shù)資料:可分為二分類和多分類,是指將觀察對(duì)象的觀察指標(biāo)按性質(zhì)或類別進(jìn)行分組,然后計(jì)數(shù)各組的數(shù)目所得。(注意:二分類變量?jī)蓚€(gè)分類之間相互對(duì)立,互不相容;而多分類變量是互不相容的幾個(gè)類別。)例如:某種疾病在個(gè)體中,發(fā)病或者不發(fā)病。v 等級(jí)資料:是指按照觀察對(duì)象的某種屬性或者特征進(jìn)行分類,但是這些分類之間本身具有強(qiáng)弱、輕重、大

3、小程度的區(qū)分。例如:某治療方法療效,可以是治愈、顯效、好轉(zhuǎn)和無(wú)效。4第4頁(yè)/共70頁(yè)頻率分布表與頻率分布圖頻率表和頻率分布圖是常用的綜合描述樣本資料的方式。頻率分布圖能夠直觀地以圖形的方式顯示樣本數(shù)據(jù)的分布情況。對(duì)于計(jì)量資料,頻率表可以提示資料的分布特征,描述資料的集中趨勢(shì)和離散趨勢(shì),便于發(fā)現(xiàn)特大或特小的可疑值。對(duì)于計(jì)數(shù)資料,頻率表可以清楚的顯示各個(gè)分類的數(shù)量或頻率;5第5頁(yè)/共70頁(yè) 算術(shù)均數(shù)(Mean) 幾何均數(shù)(Geometric Mean) 中位數(shù)(Median) 眾數(shù)(Mode) 計(jì)量資料的統(tǒng)計(jì)描述集中趨勢(shì)統(tǒng)計(jì)指標(biāo)6第6頁(yè)/共70頁(yè) 極差(Range) 四分位數(shù)間距(Quartile

4、 range) 方差(Variance) 標(biāo)準(zhǔn)差(Standard Deviation) 變異系數(shù)( Coefficient of variation ) 計(jì)量資料的統(tǒng)計(jì)描述離散趨勢(shì)統(tǒng)計(jì)指標(biāo)7第7頁(yè)/共70頁(yè)spss操作過(guò)程在spss中,統(tǒng)計(jì)學(xué)描述主要采用Analyze Descriptive Statistic菜單完成,該菜單下的子菜單對(duì)應(yīng)于不同的統(tǒng)計(jì)學(xué)描述過(guò)程。Analyze Descriptive StatisticDescriptivesExploreFrequencies 8第8頁(yè)/共70頁(yè)Frequencies操作過(guò)程v Frequencies:頻數(shù)表過(guò)程的主要功能是編制頻數(shù)表,計(jì)

5、算描述統(tǒng)計(jì)量包含的百分位數(shù),統(tǒng)計(jì)圖。利用它能產(chǎn)生原始數(shù)據(jù)的詳細(xì)頻數(shù),取值結(jié)果還能用于數(shù)據(jù)清理。9第9頁(yè)/共70頁(yè)Frequencies操作過(guò)程 實(shí)例1:某年抽樣調(diào)查某地120名18-35歲健康男性居民血清鐵含量(umol/L),請(qǐng)大家利用spss軟件進(jìn)行統(tǒng)計(jì)性描述。10第10頁(yè)/共70頁(yè)Frequencies操作過(guò)程統(tǒng)計(jì)量統(tǒng)計(jì)圖輸入格式可選變量表分析變量表輸出頻數(shù)表一種抽樣填補(bǔ)缺失值的方法,暫時(shí)不用。11第11頁(yè)/共70頁(yè)Frequencies操作過(guò)程v Statistics:設(shè)定要分析的統(tǒng)計(jì)量百分位數(shù)集中趨勢(shì)統(tǒng)計(jì)量離散統(tǒng)計(jì)量分布參數(shù)12第12頁(yè)/共70頁(yè)Frequencies操作過(guò)程v Ch

6、arts:設(shè)定要繪制的統(tǒng)計(jì)圖13第13頁(yè)/共70頁(yè)Frequencies結(jié)果分析14第14頁(yè)/共70頁(yè)Frequencies結(jié)果分析Distribution計(jì)算分布參數(shù)計(jì)算分布參數(shù)Skewness偏度系數(shù):理論上偏度系數(shù)為偏度系數(shù):理論上偏度系數(shù)為0時(shí)時(shí)對(duì)稱分布,取正值為正偏峰,取對(duì)稱分布,取正值為正偏峰,取負(fù)值為負(fù)偏峰。負(fù)值為負(fù)偏峰。Kurtosis峰度系數(shù):正態(tài)分布峰度系數(shù)為峰度系數(shù):正態(tài)分布峰度系數(shù)為0;取正值時(shí)分布峰尖陡峭,取負(fù)值取正值時(shí)分布峰尖陡峭,取負(fù)值時(shí)峰平闊。時(shí)峰平闊。 -0.041(P=0.968)。結(jié)合兩個(gè)結(jié)果,可以認(rèn)為該資料服從正態(tài)分布。15第15頁(yè)/共70頁(yè)Freque

7、ncies結(jié)果分析Frequency:頻數(shù)Percent:百分比當(dāng)前頻數(shù)/總數(shù)(包括缺失值)Valid Percent:有效百分比當(dāng)前頻數(shù)/有效總數(shù)(不包括缺失值)Cumulative Percent:累積百分比累積頻數(shù)/有效總數(shù)(不包括缺失值)16第16頁(yè)/共70頁(yè)Frequencies結(jié)果分析17第17頁(yè)/共70頁(yè)Frequencies實(shí)戰(zhàn)演練試分析實(shí)例2資料中身高的頻數(shù)分布情況。(數(shù)據(jù)見練習(xí)1.sav)。18第18頁(yè)/共70頁(yè)Descriptives操作過(guò)程v Descriptives:主要用于描述統(tǒng)計(jì)量計(jì)算和變量標(biāo)準(zhǔn)化,與Frequencies過(guò)程相比,其統(tǒng)計(jì)量不能計(jì)算百分位數(shù),也不能

8、繪制統(tǒng)計(jì)圖。19第19頁(yè)/共70頁(yè)Descriptives操作過(guò)程 實(shí)例1:某年抽樣調(diào)查某地120名18-35歲健康男性居民血清鐵含量(umol/L),請(qǐng)大家利用spss軟件進(jìn)行統(tǒng)計(jì)性描述。20第20頁(yè)/共70頁(yè)Descriptives操作過(guò)程該界面類似于Frequencies的界面,其中Save standardized values as variables是指將標(biāo)準(zhǔn)化得分另存為變量(Z)。21第21頁(yè)/共70頁(yè)Descriptives操作過(guò)程選項(xiàng)選項(xiàng)說(shuō)明說(shuō)明Display Order定義頻數(shù)表中定義頻數(shù)表中值的排列順序值的排列順序Variable list按變量表中的按變量表中的順序輸出

9、結(jié)果,順序輸出結(jié)果,默認(rèn)默認(rèn)Alphabetic按字母順序排按字母順序排列變量的輸出列變量的輸出順序順序Ascending means按均數(shù)從小到按均數(shù)從小到大排列變量的大排列變量的輸出順序輸出順序Descending means按均數(shù)從大到按均數(shù)從大到小排列變量的小排列變量的輸出順序輸出順序22第22頁(yè)/共70頁(yè)Descriptives結(jié)果分析v 該資料一共120個(gè)有效數(shù)據(jù),無(wú)缺失值。血清含量的最小值為7.42,最大值為29.64,均數(shù)18.6136,標(biāo)準(zhǔn)差4.3432,方差為18.863,偏度系數(shù)=-0.194,偏度系數(shù)標(biāo)準(zhǔn)誤=0.221,Z=-0.194/0.221=-0.878(P=0

10、.3788);峰度系數(shù)=-0.018,峰度系數(shù)標(biāo)準(zhǔn)誤=0.438,Z=-0.018/0.438=0.041(P=0.968)。結(jié)合兩個(gè)結(jié)果,可以認(rèn)為該資料服從正態(tài)分布。23第23頁(yè)/共70頁(yè)Descriptives實(shí)戰(zhàn)演練試分析實(shí)例2資料中身高的頻數(shù)分布情況。(數(shù)據(jù)見練習(xí)1.sav)。24第24頁(yè)/共70頁(yè)Explore操作過(guò)程v Explore:探索性分析使用圖形、描述統(tǒng)計(jì)量的方法來(lái)探索數(shù)據(jù)的分布特征,主要適用于連續(xù)性資料。主要功能有:分離特異值、離群值;繪制多種統(tǒng)計(jì)分布圖,觀察其分布特征;描述統(tǒng)計(jì)量的計(jì)算,包括文件統(tǒng)計(jì)量的估計(jì);特定分布特征的假設(shè)檢驗(yàn);百分位數(shù)的估算。25第25頁(yè)/共70頁(yè)

11、Explore操作過(guò)程 實(shí)例2,對(duì)照資料中不同性別(XB)的身高(SG)進(jìn)行分別描述。26第26頁(yè)/共70頁(yè)Explore操作過(guò)程 要進(jìn)行分析的應(yīng)變量:身高分類變量:性別27第27頁(yè)/共70頁(yè)Explore操作過(guò)程選項(xiàng)選項(xiàng)說(shuō)明說(shuō)明Descriptives輸出描述統(tǒng)計(jì)輸出描述統(tǒng)計(jì)量,默認(rèn)量,默認(rèn)Confidence interval for Mean:95%計(jì)算均數(shù)的計(jì)算均數(shù)的95%置信區(qū)間,置信區(qū)間,默認(rèn)默認(rèn)M-estimators描述平均水平,描述平均水平,其意義同均數(shù)其意義同均數(shù)和中位數(shù)和中位數(shù)Outliers列出極端值,列出極端值,即最大和最小即最大和最小的各五個(gè)數(shù)據(jù)的各五個(gè)數(shù)據(jù)Perc

12、entiles輸出輸出5%、10%、25%、50%、75%、90%、95%的百分位的百分位數(shù)數(shù)28第28頁(yè)/共70頁(yè)Explore操作過(guò)程箱式圖以分組變量繪圖分析變量一起繪圖莖葉圖直方圖正態(tài)概率圖和正態(tài)性檢驗(yàn)離散水平圖,Levene方差齊性檢驗(yàn)不繪圖冪轉(zhuǎn)換不轉(zhuǎn)換用冪轉(zhuǎn)換進(jìn)行數(shù)據(jù)轉(zhuǎn)換29第29頁(yè)/共70頁(yè)Explore操作過(guò)程缺失值設(shè)置,一般選擇默認(rèn)。按觀察個(gè)體排除缺失值將缺失值單獨(dú)列成一組成對(duì)排除缺失值30第30頁(yè)/共70頁(yè)Explore結(jié)果分析缺失值報(bào)告:本例沒有缺失值,男性有效人數(shù)為29人,女性有效人數(shù)為77人。31第31頁(yè)/共70頁(yè)Explore結(jié)果分析探索性分析的統(tǒng)計(jì)描述跟前面兩種分析

13、的統(tǒng)計(jì)描述相似,需要注意的是95%Confidence interval for Mean( Lower Round/Upper Round)指的是95%可信區(qū)間上限/下限;5%Trimmed Mean指的是5%調(diào)整均數(shù),去掉最大和最小各5%的數(shù)據(jù)后的均數(shù);Interquartile Range指的是四分位數(shù)間距。32第32頁(yè)/共70頁(yè)Explore結(jié)果分析極端值列表:分別列出男性女性的最高與最低的五組數(shù)據(jù),其中Case Number 指的是極端值所在的編碼,Value指的是具體的數(shù)值33第33頁(yè)/共70頁(yè)Explore結(jié)果分析上圖是按性別不同對(duì)身高進(jìn)行的正態(tài)性檢驗(yàn),給出兩種方法的結(jié)果:Kol

14、mogorov-Smirnov檢驗(yàn)和Shapiro-Wilk檢驗(yàn)。其中,Statistic為統(tǒng)計(jì)量;dfP值。經(jīng)檢驗(yàn),男組兩組P值均小于0.05,所以拒絕正態(tài)分析的假設(shè),尚不能認(rèn)為男組呈正態(tài)分布。而女組Kolmogorov-Smirnov檢驗(yàn)中p值小于0.05,Shapiro-Wilk檢驗(yàn)p值大于0.05,應(yīng)該再參考別的方法判定女組是否呈正態(tài)分布。34第34頁(yè)/共70頁(yè)Explore結(jié)果分析 上圖是對(duì)按性別不同對(duì)身高進(jìn)行的方差齊性檢驗(yàn),采用了四種方法計(jì)算統(tǒng)計(jì)量:Based on Mean(基于均數(shù)的統(tǒng)計(jì)量)、 Based on Median (基于中位數(shù)的統(tǒng)計(jì)量)、 Based on Medi

15、an and with adjusted df(基于中位數(shù)并調(diào)整自由度的統(tǒng)計(jì)量)、Based on trimmed Mean (基于調(diào)整均數(shù)的統(tǒng)計(jì)量)。Df1是分子自由度、df2為分母自由度。經(jīng)檢驗(yàn),上述四種方法的計(jì)算出的P值均大于0.05,不拒絕零假設(shè),可以認(rèn)為兩組總體方差相同。35第35頁(yè)/共70頁(yè)Explore結(jié)果分析由上直方圖可以看出,男組明顯不是正態(tài)分布,女組與正態(tài)分布相近。36第36頁(yè)/共70頁(yè)正態(tài)性檢驗(yàn) 圖示法主要采用概率圖(Probability-probability Plot,P-P圖)和分位數(shù)圖(Quantile-quantile Plot, Q-Q圖)。其中,P-P圖是

16、以樣本的累計(jì)頻率作為橫坐標(biāo),以按照正態(tài)分布計(jì)算的相應(yīng)累計(jì)概率作為縱坐標(biāo),把樣本值表現(xiàn)為直角坐標(biāo)系中的散點(diǎn)。如果資料服從正態(tài)分布,則樣本點(diǎn)應(yīng)該圍繞第一象限的對(duì)角線分布。Q-Q圖則是以樣本的分位數(shù)作為橫坐標(biāo),以按照正態(tài)分布計(jì)算的相應(yīng)分位數(shù)作為縱坐標(biāo),把樣本表現(xiàn)為直角坐標(biāo)系的散點(diǎn)。如果資料服從正態(tài)分布,則樣本點(diǎn)應(yīng)該呈一條圍繞第一象限對(duì)角線的直線。這兩種方法中,以Q-Q圖法的效率較高。37第37頁(yè)/共70頁(yè)Normal Q-Q Plot of 身高For XB= 女Observed Value140130120110100Expected Normal3210-1-2-3Normal Q-Q Plot

17、 of 身高For XB= 男Observed Value130120110100Expected Normal210-1-2 圖中的直線是正態(tài)分布的標(biāo)準(zhǔn)參考線,散點(diǎn)越接近這條直線,則該變量的分布越接近正態(tài)分布。本例中可以看出女生的散點(diǎn)更接近標(biāo)準(zhǔn)參考線,說(shuō)明女性更接近于正態(tài)分布。38第38頁(yè)/共70頁(yè)Explore結(jié)果分析莖葉圖39第39頁(yè)/共70頁(yè)Explore結(jié)果分析莖葉圖結(jié)果分析: 兩莖葉圖的莖寬(Stem Width)是10,莖葉圖從左至右分別為頻數(shù)(Frequency)、莖(Stem)及葉(Leaf):莖表示變量值的整數(shù)部分,葉表示變量值的小數(shù)部分,每行的莖和每一個(gè)葉組成的數(shù)值相加后

18、再乘以莖寬,就是莖葉所表示的實(shí)際數(shù)據(jù)的近似值。 例如:性別為1的第三行,在這個(gè)變量值下頻數(shù)為4,莖為11,這行葉的組成是6789,它表示在這一行的六個(gè)變量值大約是116,117,118,119.40第40頁(yè)/共70頁(yè)Explore結(jié)果分析41第41頁(yè)/共70頁(yè)Explore結(jié)果分析箱式圖結(jié)果分析: 男女生箱式圖中中間長(zhǎng)方形的底部與頂部分別表示下四分位數(shù)(p25)和上四分位數(shù)(p75),中間的橫線代表它們各自的中位數(shù),箱式圖的上下柄分別代表最大值跟最小值。 由上圖結(jié)果可以看出,女生組的最大值、上四分位數(shù)和下四分位數(shù)分別大于男生組,而中位數(shù)與最小值均小于男生組。42第42頁(yè)/共70頁(yè)對(duì)練習(xí)實(shí)例3中危重病人的APACHE評(píng)分及其預(yù)后情況進(jìn)行探索性分析,了解不同預(yù)后情況的APACHE評(píng)分情況。(數(shù)據(jù)見練習(xí).sav)。Explore實(shí)戰(zhàn)演練43第43頁(yè)/共70頁(yè) (1)隨機(jī)樣本; (2)來(lái)自正態(tài)分布總體; (3)兩小樣本均數(shù)比較時(shí),要求兩總體方差相等(方差齊性)t檢驗(yàn)應(yīng)用條件44第44頁(yè)/共70頁(yè)幾種不同資料的t檢驗(yàn)45第45頁(yè)/共70頁(yè)單樣本t檢驗(yàn)?zāi)康?推斷該樣本來(lái)自的總體均數(shù)與已知的某一總體均數(shù)有無(wú)差別。單樣本資料t t檢驗(yàn)實(shí)例: : 根據(jù)大量調(diào)查,已知健康成年男子脈搏的均數(shù)為7272次/ /分,某醫(yī)生

溫馨提示

  • 1. 本站所有資源如無(wú)特殊說(shuō)明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請(qǐng)下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請(qǐng)聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁(yè)內(nèi)容里面會(huì)有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫(kù)網(wǎng)僅提供信息存儲(chǔ)空間,僅對(duì)用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對(duì)用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對(duì)任何下載內(nèi)容負(fù)責(zé)。
  • 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請(qǐng)與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶因使用這些下載資源對(duì)自己和他人造成任何形式的傷害或損失。

最新文檔

評(píng)論

0/150

提交評(píng)論