




下載本文檔
版權(quán)說(shuō)明:本文檔由用戶(hù)提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請(qǐng)進(jìn)行舉報(bào)或認(rèn)領(lǐng)
文檔簡(jiǎn)介
1、第三講 統(tǒng)計(jì)描述與常用統(tǒng)計(jì)圖Part I 數(shù)值變量的統(tǒng)計(jì)描述一、數(shù)值變量統(tǒng)計(jì)描述的內(nèi)容數(shù)值變量(Numerical variable),數(shù)理統(tǒng)計(jì)里常被稱(chēng)為連續(xù)型隨機(jī)變量,它的特點(diǎn)是有單位,其可能取值充滿(mǎn)某個(gè)區(qū)間。對(duì)數(shù)值變量作描述性統(tǒng)計(jì)(Descriptive statistics)內(nèi)容主要包括:1. 作頻數(shù)表(frequency table)和直方圖(histogram),了解資料的分布特征(對(duì)稱(chēng)or 偏態(tài))2. 根據(jù)分布特征,選擇適合的平均數(shù)指標(biāo),反映其集中趨勢(shì)(Central tendency)3. 根據(jù)分布特征,選擇適合的變異度指標(biāo),反映其離散趨勢(shì)(Dispersion)例1 某校100
2、名健康男生的血清總蛋白含量(g/L),血清總蛋白.sav74.379.575.073.575.874.073.567.275.873.578.875.673.575.075.872.079.576.573.579.568.875.078.872.068.876.573.572.775.070.478.078.874.364.376.574.374.770.472.776.570.472.075.875.870.476.565.077.273.572.780.572.065.080.371.277.676.568.873.577.280.572.074.369.781.267.381.667.3
3、72.784.369.774.371.274.375.072.075.467.381.675.071.271.269.773.570.475.072.767.370.376.573.572.068.073.568.074.372.772.774.370.4例2 某年某地200名正常成人的血鉛含量(g/100g),正常成人血鉛含量.sav34444455555555556666666777777777777788888888888999999910101010101010101011111111111212121212121213131313131313131313131314141414141
4、41414141415151515151515161616161616171717171717171717171717181818181819191919191920202020202020202121212121222222222222232323242424242424252526262626262727282829293030313131313232323232323333363838394041414347505360三、SPSS編制頻數(shù)表的方法1. 打開(kāi)血清總蛋白.sav,里面有編號(hào)id、總蛋白x兩列變量,有100個(gè)觀測(cè)值,最小值為64.3,最大值為84.3,全距R =84.3-64
5、.3=20,如果頻數(shù)表的組數(shù)為10的話(huà),組距i=2。2. Transform->visual bander(可視化分組) -> variable to band:x -> banded variable: xx upper endpoints: exclude 3. 進(jìn)入make cutpoints界面,first cutpoint location: 66,width: 2,則可知會(huì)有11個(gè)組段4. 選make labels,OK運(yùn)行,SPSS提示會(huì)新產(chǎn)生一個(gè)分組變量5. 列頻數(shù)表:Analyze -> Descriptive statistics -> fre
6、quencies -> xx,得以下結(jié)果 FrequencyPercentValid PercentCumulative PercentValid<66.033.03.03.066.0 - 67.955.05.08.068.0 - 69.988.08.016.070.0 - 71.91111.011.027.072.0 - 73.92525.025.052.074.0 - 75.92424.024.076.076.0 - 77.91010.010.086.078.0 - 79.977.07.093.080.0 - 81.966.06.099.084.0+11.01.0100.0To
7、tal100100.0100.0 6. 整理為符合規(guī)范的統(tǒng)計(jì)表表3.1 100名健康男生的血清總蛋白(g/L)的頻數(shù)分布組段(1)頻數(shù)(2)頻率(3)累計(jì)頻率(4)64.0 33.03.066.0 55.08.068.0 88.016.070.0 1111.027.072.0 2525.052.074.0 2424.076.076.0 1010.086.078.0 77.093.080.0 66.099.082.0 84.011.0100.0合計(jì)100100.0四、SPSS作直方圖的方法Graphs -> histogram -> variable: xx -> displa
8、y normal curve,得出圖3.1。注意該圖的橫軸取值為0到12,實(shí)際它代表的是表3.1的組段(1),Mean等計(jì)算結(jié)果也無(wú)實(shí)際意義。需要對(duì)該圖作進(jìn)一步編輯,得到符合規(guī)范的直方圖(圖3.2)。圖3.1 SPSS結(jié)果總蛋白(g/L)頻數(shù)圖3.2 符合統(tǒng)計(jì)要求的直方圖從頻數(shù)表和直方圖看出,健康男生的血清總蛋白資料屬于對(duì)稱(chēng)分布資料,中間位置在7276g/L處,越往兩側(cè),頻數(shù)逐漸減少。練習(xí)1 用頻數(shù)表和直方圖描述例2的某年某地200名正常成人的血鉛資料的分布特征。表3.2 200名正常成人的血鉛值(g/100g)的頻數(shù)分布組段(1)頻數(shù)(2)頻率(3)累計(jì)頻率(4)3 8 13 18 23 2
9、8 33 3843 48 53 58 62合計(jì)200100.0二、反映集中趨勢(shì)、離散趨勢(shì)的常用指標(biāo)英文中文含義計(jì)算公式適用資料Mean均數(shù)(期望)X / n對(duì)稱(chēng)分布,尤其是正態(tài)分布Median中位數(shù)M偏態(tài)分布Range全距R =Xmax-Xmin末端有確定值Interquartile Range四分位數(shù)間距Q = P75-P25偏態(tài)分布Variance 方差S2對(duì)稱(chēng)分布,尤其是正態(tài)分布Standard deviation標(biāo)準(zhǔn)差S對(duì)稱(chēng)分布,尤其是正態(tài)分布總體方差 樣本方差 總體標(biāo)準(zhǔn)差 樣本標(biāo)準(zhǔn)差 練習(xí)2對(duì)血清總蛋白資料,用Analyze-> Descriptive statistics -
10、>frequencies命令,計(jì)算均數(shù)、中位數(shù)、第25分位數(shù)、第75分位數(shù)、方差、標(biāo)準(zhǔn)差、四分位間距等指標(biāo)。(注:不列頻數(shù)表)練習(xí)3對(duì)血清總蛋白資料,用Analyze-> Descriptive statistics ->descriptives命令作分析,在假定X服從均數(shù)為,標(biāo)準(zhǔn)差為的正態(tài)分布的情況下,對(duì)X進(jìn)行標(biāo)準(zhǔn)化處理,得出ZX,ZX將服從均數(shù)為0,標(biāo)準(zhǔn)差為1的標(biāo)準(zhǔn)正態(tài)分布。如果和值已知,如果樣本量n較大,練習(xí)4對(duì)雇員數(shù)據(jù)employee data.sav,用Analyze-> Descriptive statistics ->explore命令作分析,描述不
11、同性別雇員的平均受教育年數(shù)educ和標(biāo)準(zhǔn)差。 某公司雇員的受教育情況性別人數(shù)均數(shù)(年)標(biāo)準(zhǔn)差(年)男25814.43.0女21612.42.3合計(jì)47413.52.9Part II 分類(lèi)變量的統(tǒng)計(jì)描述一、分類(lèi)變量的概念分類(lèi)變量(Categorical variable),數(shù)理統(tǒng)計(jì)里被稱(chēng)為離散型隨機(jī)變量。根據(jù)取值個(gè)數(shù)分為二分類(lèi)、多分類(lèi)變量。多分類(lèi)變量又可進(jìn)一步分為無(wú)序、有序多分類(lèi)變量。舉例:employee data.sav,性別、種族、職業(yè)類(lèi)別、年齡組、按受教育年數(shù)分組。二、SPSS描述分類(lèi)變量資料1. 用Descriptive statistics -> frequencies描述單個(gè)
12、變量2. 用Descriptive statistics -> crosstabs描述兩個(gè)變量,得出二維列聯(lián)表,如四格表、R×C表。如果要同時(shí)描述三個(gè)及以上的變量,對(duì)應(yīng)的就是三維甚至高維列聯(lián)表。3. 對(duì)構(gòu)成比資料作圓圖(pie),對(duì)兩組或多組率比較的資料作直條圖(bar),對(duì)隨時(shí)間連續(xù)變化的資料作線(xiàn)圖(line)。練習(xí)5 描述474名觀測(cè)的性別構(gòu)成,并輸出統(tǒng)計(jì)表和統(tǒng)計(jì)圖步驟:analyze ->descriptive statistics -> frequencies->gender 某公司雇員的性別構(gòu)成性別人數(shù)構(gòu)成(%)男25854.4女21645.6合計(jì)474100.0練習(xí)6 對(duì)全部觀測(cè)按性別gender與工作類(lèi)別jobcat作交叉表crosstabs步驟:analyze ->des
溫馨提示
- 1. 本站所有資源如無(wú)特殊說(shuō)明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請(qǐng)下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請(qǐng)聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶(hù)所有。
- 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁(yè)內(nèi)容里面會(huì)有圖紙預(yù)覽,若沒(méi)有圖紙預(yù)覽就沒(méi)有圖紙。
- 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
- 5. 人人文庫(kù)網(wǎng)僅提供信息存儲(chǔ)空間,僅對(duì)用戶(hù)上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對(duì)用戶(hù)上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對(duì)任何下載內(nèi)容負(fù)責(zé)。
- 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請(qǐng)與我們聯(lián)系,我們立即糾正。
- 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶(hù)因使用這些下載資源對(duì)自己和他人造成任何形式的傷害或損失。
最新文檔
- 備考價(jià)值的中級(jí)經(jīng)濟(jì)師試題及答案亮點(diǎn)
- 2025年工程經(jīng)濟(jì)評(píng)審方法試題及答案
- 2024-2025廠級(jí)員工安全培訓(xùn)考試試題附答案(精練)
- 行政管理公共關(guān)系學(xué)溝通能力試題及答案
- 2025-2030年連衣裙行業(yè)市場(chǎng)現(xiàn)狀供需分析及投資評(píng)估規(guī)劃分析研究報(bào)告
- 工程項(xiàng)目管理行業(yè)規(guī)范試題及答案
- 2025-2030年空氣凈化設(shè)備行業(yè)市場(chǎng)發(fā)展分析及投資發(fā)展前景研究報(bào)告
- 2025-2030年皮包行業(yè)市場(chǎng)現(xiàn)狀供需分析及投資評(píng)估規(guī)劃分析研究報(bào)告
- 2025年飯店用工合同樣本
- 2025-2030年城市供水產(chǎn)業(yè)市場(chǎng)深度調(diào)研及發(fā)展趨勢(shì)與投資戰(zhàn)略研究報(bào)告
- 熔鹽法合成鎂鋁尖晶石的開(kāi)題報(bào)告
- 統(tǒng)編版六年級(jí)下冊(cè)期中復(fù)習(xí)閱讀專(zhuān)項(xiàng)訓(xùn)練-閱讀理解(三)(含答案+詳細(xì)解析)
- 成品灰氣力輸送計(jì)算書(shū)
- 不同直徑和標(biāo)鋼筋植筋拉拔試驗(yàn)設(shè)計(jì)值
- 名校滬教牛津上海版六年級(jí)英語(yǔ)下冊(cè)Unit 4單元同步測(cè)試卷含答案
- 工程量計(jì)算服務(wù)合同
- 雪茄培訓(xùn)雪茄知識(shí)學(xué)習(xí)課件
- 年產(chǎn)十萬(wàn)噸丙烯酸項(xiàng)目設(shè)計(jì)說(shuō)明書(shū)(西北大學(xué))
- 《擬行路難》(其四) 統(tǒng)編版高中語(yǔ)文選擇性必修下冊(cè)
- 2023年中考物理復(fù)習(xí)方法技巧及備考策略指導(dǎo)(教學(xué)交流課件)
- 員工警告通知書(shū)(六篇)
評(píng)論
0/150
提交評(píng)論