




版權說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權,請進行舉報或認領
文檔簡介
1、常用統(tǒng)計量數(shù)授課教師:禤宇明本章內(nèi)容描述統(tǒng)計統(tǒng)計量數(shù):定義、性質、用法集中量數(shù)眾數(shù)、中數(shù)、算術平均數(shù)、加權平均數(shù)、幾何平均數(shù)差異量數(shù)全距、平均差、方差、標準差、差異系數(shù)地位量數(shù)百分位數(shù)、十分位數(shù)、四分位數(shù)、中(位)數(shù)1. 描述統(tǒng)計 descriptive statistics描述統(tǒng)計對數(shù)據(jù)特征的描述數(shù)據(jù)的兩個主要特征中心位置分散性2. 集中量數(shù)measures of central tendency集中量數(shù)對數(shù)據(jù)的集中趨勢的度量確定一組數(shù)據(jù)的代表值2.1 常用集中量數(shù)眾數(shù)mode中數(shù)median算術平均數(shù) mean加權平均數(shù) weighted mean幾何平均數(shù) geometric mean調
2、和平均數(shù) harmonic mean問題某部門有5名一般職員和1名經(jīng)理。一般職員的薪水是3000元,而經(jīng)理的薪水是10000元,請問該部門收入的平均水平是多少?2.1.1 眾數(shù)(Mode,Mo)P. 66眾數(shù):一組數(shù)據(jù)中出現(xiàn)次數(shù)最多的數(shù)如2、3、5、3、4、3、6的眾數(shù)為3卡爾皮爾遜 1894如果次數(shù)分布最多的有兩個數(shù),而且兩個數(shù)是相鄰的,那么一般取兩者的平均值作為眾數(shù);如果這兩個數(shù)不相鄰,那么一般需要報告兩個眾數(shù),而且認為該組數(shù)據(jù)是bimodal雙峰分布的計算眾數(shù)的皮爾遜經(jīng)驗法Mo3Mdn2M眾數(shù)的用途快速粗略尋求一組數(shù)據(jù)的代表值做不同質數(shù)據(jù)的代表值,如工資次數(shù)分布中有兩極端的數(shù)目(一般用中
3、數(shù),有時用眾數(shù))用平均數(shù)和眾數(shù)之差作為次數(shù)分布是否偏態(tài)的指標眾數(shù)與從眾買東西2.1.2 中數(shù)(Median,Md或Mdn)P62中數(shù):一組數(shù)據(jù)中按從小到大排序后,處于中間位置上的變量值中數(shù)的位置:(n+1)/21883 高爾頓將全部數(shù)據(jù)排序后,如果項數(shù)是奇數(shù),則正中央的那一項即為中位數(shù)例:4、7、8、9、10、11、12、13、14Mdn10如果項數(shù)是偶數(shù),則正中央的那兩項的平均值即為中位數(shù)例: 2、3、5、7、8、10、15、19Mdn(78)/27.5思考題某病患者的潛伏期如下,求中數(shù)2,3,3,3,4,5,6,9,16 上述數(shù)據(jù)中的16改為30天,求中數(shù)求15,35,25,5的中數(shù)中數(shù)的
4、應用不易受極端值的影響當數(shù)據(jù)呈明顯偏態(tài)時,中數(shù)較均數(shù)或幾何均數(shù)合理2.1.3 平均數(shù)(Mean) p. 55 平均數(shù)的定義又叫均數(shù)、算術平均數(shù),縮寫M, 設一組數(shù)據(jù)為x1,x2,xn練習 平均數(shù)的特點 p58一組數(shù)據(jù)的每一個數(shù)與平均數(shù)的差(離均差)的總和等于零一組數(shù)據(jù)的每一個數(shù)加上常數(shù)C,其平均數(shù)為原來的平均數(shù)加常數(shù)C一組數(shù)據(jù)的每一個數(shù)乘以常數(shù)C,其平均數(shù)為原來的平均數(shù)乘常數(shù)C一組數(shù)據(jù)的每一個數(shù)與常數(shù)C的差的平方和不小于該組數(shù)據(jù)的每一個數(shù)與平均數(shù)的差的平方和 算術平均數(shù)的優(yōu)點和缺點 p60優(yōu)點反應靈敏確定嚴密簡明易解計算簡單符合代數(shù)方法進一步演算較少受抽樣變動的影響缺點易受極端值的影響若出現(xiàn)模
5、糊不清的數(shù)據(jù)時無法計算 算術平均數(shù)的適用條件 p61數(shù)據(jù)必須是同質的如:如果身高均數(shù)在性別上有差異,那么不分性別地求某一年齡組的身高均數(shù)時沒有實際意義的數(shù)據(jù)取值必須明確適用于呈正態(tài)分布的數(shù)據(jù)數(shù)據(jù)離散不能太大 思考題你們念統(tǒng)計的常以算術平均數(shù)來代表總體 (population),那么你們一手泡在沸水中,另一手浸在冰水中,一定會感到很舒服,因為你們的平均感受是正常體溫。請舉例說明什么情況下我們會對估計總體的平均數(shù)感興趣。2.1.4 加權平均數(shù)(Weighted mean) p69用于分組數(shù)據(jù)學校均數(shù)人數(shù)ABC72.680.275324036Grade Point Average2.1.5 幾何平均
6、數(shù)(Geometric mean)p71數(shù)據(jù)分布近似正態(tài)分布,但呈偏態(tài)傳染病的潛伏期心理物理學的等距與等比量表實驗呈(近似)等比數(shù)列變化的數(shù)據(jù),即變量值呈倍數(shù)關系或近似倍數(shù)關系的數(shù)據(jù)用于計算平均發(fā)展速度、平均增長率、學習記憶的平均進步率、學校經(jīng)費平均增加率、平均人口出生率等等血清中抗體滴度、血清凝集效價年度人數(shù)變化率19871988198919901991200022002430260028801.10001.10451.07001.1077例:某學生背單詞周次12345記住單詞2023263034求該生記憶單詞的平均進步率2.1.6 調和平均數(shù) (harmonic mean) p75即倒數(shù)平
7、均數(shù)的倒數(shù),用于求平均速度例被試號123456完成題數(shù)101010101010時間(小時)0.81.01.21.52.55.02.2 平均數(shù)、中數(shù)和眾數(shù)的關系 p68在一個正態(tài)分布中,三者相等在正偏態(tài)分布中,M Md Mo在負偏態(tài)分布中,M Md Mo一般偏態(tài)情況下,Md離M較近,而離Mo較遠平均數(shù):支點兩端的力矩相等中數(shù):兩側數(shù)據(jù)個數(shù)相同眾數(shù):出現(xiàn)次數(shù)最多2.3 集中量數(shù)的適用數(shù)據(jù)類別數(shù)據(jù)順序數(shù)據(jù)等距數(shù)據(jù)比例數(shù)據(jù)*眾數(shù)*中數(shù)*均數(shù)*均數(shù) 四分位 眾數(shù) 調和平均數(shù) 眾數(shù) 中數(shù)幾何平均數(shù) 四分位數(shù) 中數(shù)四分位數(shù) 眾數(shù)*表示該數(shù)據(jù)類型最適合用的量數(shù)思考題不做運算比較下面兩個數(shù)列的平均數(shù)10, 7,
8、 8,3, 5, 910, 7, 8,3, 5, 9, 113. 差異量數(shù)又叫離中量數(shù),是表示數(shù)據(jù)分散程度的統(tǒng)計量,反映的是各變量值遠離其中心值的程度表示數(shù)據(jù)離中趨勢的量數(shù)有全距平均差方差標準差差異系數(shù)3.1 全距(range) p81也稱極差,是一組數(shù)據(jù)的最大值與最小值之差。R=max(Xi)-min(Xi)3.2 平均差(Average deviation)p87Mean absolute deviation各變量值與均值之差的絕對值的平均數(shù)不利于代數(shù)運算離均差(離差) deviation from the mean3.3方差和標準差Variance & Standard Deviatio
9、n3.3.1 定義 p883.3.2 方差和標準差的變式 Xi xXXi=- ()22XXxi-= 2iX 6 0 0 36 5 -1 1 25 7 1 1 49 4 -2 4 16 6 0 0 36 8 2 4 64 N=6 =36iX =0 x =102x =2262iX 3.3.3樣本方差與總體方差的區(qū)別在計算上,總體方差是用數(shù)據(jù)個數(shù)或總次數(shù)去除離差平方和,而樣本方差則用樣本數(shù)據(jù)個數(shù)或總次數(shù)減一去除離差平方和樣本方差是統(tǒng)計量,用S2表示;總體方差是總體參數(shù),用2表示當n很大時, S2與2相差很小,前者是后者的無偏估計3.3.4 標準差的性質 p94一組數(shù)據(jù)的每一個數(shù)據(jù)都加常數(shù)C后標準差不
10、變一組數(shù)據(jù)的每一個數(shù)據(jù)都乘常數(shù)C后標準差變?yōu)樵瓉淼腃倍3.3.5方差與標準差的優(yōu)點 p94方差與標準差是表示一組數(shù)據(jù)離散程度的最好的指標。其值越大,說明離散程度大,其值小說明數(shù)據(jù)比較集中。具有以下優(yōu)點:(1)反應靈敏。(2)由計算公式嚴格確定;(3)容易計算;(4)適合代數(shù)運算;(5)受抽樣變動的影響小,既不同樣本的標準差或方差比較穩(wěn)定;(6)簡單明了;(7)具有可加性??梢园芽傋儺惙纸鉃椴煌瑏碓吹淖儺悺#?)各變量值對均值的方差小于對任意數(shù)的方差。標準差的應用表示數(shù)據(jù)的離散程度標準差越大越離散結合均數(shù)描述正態(tài)分布特征根據(jù)正態(tài)分布原理求正常值范圍3.4 差異系數(shù) (Coefficient of
11、 variation) p95變異系數(shù)指出了標準差對于平均值的大小,用于比較不同總體或樣本數(shù)據(jù)的離散程度。同一樣本不同測量的變異的比較,如相同班級不同科目的變異的比較;不同樣本同一測量的變異的比較,如不同年級同一科目變異大小的比較。例:已知某小學一年級學生的平均體重為25公斤,體重的標準差是3.7公斤,平均身高110厘米,標準差為6.2厘米,問體重與身高的離散程度哪個大?解:CV體重=3.7/25100%=14.8% CV身高=6.2/110 100%=5.64%, 所以, 體重的離散程度比身高的離散程度大。例: 通過同一個測驗,一年級學生的平均分數(shù)為60分,標準差為4.02分,五年級學生的平
12、均分數(shù)為80分,標準差為6.04分,問這兩個年級的測驗分數(shù)中哪一個離散程度大。解:CV一年級=4.02/60 100%=6.7%, CV五年級=6.04/80 100%=7.55%, 所以,五年級的測驗分數(shù)的分散程度大。3.5 數(shù)據(jù)類型和差異量數(shù)四分位差 Quartile deviationQD = (QU-QL)/2思考題以下每組數(shù)的平均數(shù)均為50,哪組數(shù)在平均數(shù)附近的散布程度最大?哪組最???A0,20,40,50,60,80,1000,48,49,50,51,52,1000,1,2,50,98,99,100B47,49,50,51,5346,48,50,52,5446,49,50,51,5
13、44. 地位量數(shù)百分位數(shù)(Percentile):第p百分位是這樣一個值,它使得至少有p%的數(shù)據(jù)小于或等于這個值,且至少有(100-p)%的數(shù)據(jù)項大于或等于這個值四分位數(shù)(Quartile):將數(shù)據(jù)劃分為4部分,每部分各占25%的數(shù)據(jù)項,這種劃分的臨界點即為四分位數(shù)。三個四分位數(shù)分別為:Q1, Q2 ,Q3 十分位數(shù)(Decile):將數(shù)據(jù)劃分為10個部分,每部分占十分之一的數(shù)據(jù)項。其劃分的臨界點為十分位數(shù)Q1 Q2 Q30.25 0.25 0.25 0.25計算第p百分位步驟第一步:從小到大排列原始數(shù)據(jù)第二步:計算指數(shù)i i=(p/100)n, n為項數(shù),p為所求的百分位的位置第三步:若i不
14、是整數(shù),將i向上取整;若i是整數(shù),則第p百分位數(shù)是第i項與第 i+1 項數(shù)據(jù)的平均值例:有12個職員薪金的數(shù)據(jù),求第85和第50百分位數(shù)。解:(1)將12個數(shù)據(jù)從小到大排序如下: 2210 2225 2350 2380 2380 2390 2420 2440 2450 2550 2630 2825 (2) i=(p/100)n=(85/100)12=10.2 (3) 由于i=10.2不是整數(shù), 向上取整,所以第85百分位數(shù)對應的是第11項, 其值為2630。 同理,計算第50百分位(中位數(shù))。i=(50/100) 12=6,是整數(shù),第50百分位數(shù)是第6項和第7項的平均值,即(2390+2420)/2=2405。百分位差:P90P10p82四分位差: (Q3-Q1)/2p85百分位數(shù)的應用常用于確定正常值范圍,如醫(yī)學參考值范圍reference ranges習慣上確定95%(也可用80%, 90%, 99%)的人的界線雙側參考值,計算P2.5和P97.5白細胞總數(shù)過高過低均屬異常單側參考值,計算P5或P95肺活量:過低為異常尿鉛:過高為異常Weights of Girl
溫馨提示
- 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權益歸上傳用戶所有。
- 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預覽,若沒有圖紙預覽就沒有圖紙。
- 4. 未經(jīng)權益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
- 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負責。
- 6. 下載文件中如有侵權或不適當內(nèi)容,請與我們聯(lián)系,我們立即糾正。
- 7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。
最新文檔
- 中學2025年寒假工作計劃
- 國家健康教育特色學校計劃
- 放化療護理常規(guī)
- 編譯打包部署培訓
- 左側腹股溝腫物鑒別診斷
- 小腦腫瘤的臨床診療策略
- 腎臟內(nèi)科業(yè)務查房
- 公交安全生產(chǎn)月
- 【酒泉】2025年甘肅酒泉市瓜州縣事業(yè)單位招聘21人筆試歷年典型考題及考點剖析附帶答案詳解
- 幼兒教學多媒體課件
- 新生兒腹脹的觀察及護理
- SJG85-2020邊坡工程技術標準
- 2024年上海浦東新區(qū)公辦學校儲備教師招聘筆試真題
- 項目總工聘用合同書
- 安徽大學專職輔導員招聘筆試真題2024
- 2025至2030中國城市公共交通行業(yè)深度發(fā)展研究與企業(yè)投資戰(zhàn)略規(guī)劃報告
- 2025春季學期國開電大本科《管理英語4》一平臺機考真題及答案(第八套)
- 2025屆上海市中考語文真題作文題目解析+范文
- 2025年全國普通高校招生全國統(tǒng)一考試數(shù)學試卷(新高考Ⅰ卷)含答案
- 2025年河南省豫地科技集團有限公司社會招聘169人筆試參考題庫附帶答案詳解析集合
- DZ/T 0269-2014地質災害災情統(tǒng)計
評論
0/150
提交評論