《統(tǒng)計(jì)學(xué)》研究生課件3.4統(tǒng)計(jì)量數(shù)_第1頁
《統(tǒng)計(jì)學(xué)》研究生課件3.4統(tǒng)計(jì)量數(shù)_第2頁
《統(tǒng)計(jì)學(xué)》研究生課件3.4統(tǒng)計(jì)量數(shù)_第3頁
《統(tǒng)計(jì)學(xué)》研究生課件3.4統(tǒng)計(jì)量數(shù)_第4頁
《統(tǒng)計(jì)學(xué)》研究生課件3.4統(tǒng)計(jì)量數(shù)_第5頁
已閱讀5頁,還剩52頁未讀, 繼續(xù)免費(fèi)閱讀

下載本文檔

版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請(qǐng)進(jìn)行舉報(bào)或認(rèn)領(lǐng)

文檔簡介

1、常用統(tǒng)計(jì)量數(shù)授課教師:禤宇明本章內(nèi)容描述統(tǒng)計(jì)統(tǒng)計(jì)量數(shù):定義、性質(zhì)、用法集中量數(shù)眾數(shù)、中數(shù)、算術(shù)平均數(shù)、加權(quán)平均數(shù)、幾何平均數(shù)差異量數(shù)全距、平均差、方差、標(biāo)準(zhǔn)差、差異系數(shù)地位量數(shù)百分位數(shù)、十分位數(shù)、四分位數(shù)、中(位)數(shù)1. 描述統(tǒng)計(jì) descriptive statistics描述統(tǒng)計(jì)對(duì)數(shù)據(jù)特征的描述數(shù)據(jù)的兩個(gè)主要特征中心位置分散性2. 集中量數(shù)measures of central tendency集中量數(shù)對(duì)數(shù)據(jù)的集中趨勢(shì)的度量確定一組數(shù)據(jù)的代表值2.1 常用集中量數(shù)眾數(shù)mode中數(shù)median算術(shù)平均數(shù) mean加權(quán)平均數(shù) weighted mean幾何平均數(shù) geometric mean調(diào)

2、和平均數(shù) harmonic mean問題某部門有5名一般職員和1名經(jīng)理。一般職員的薪水是3000元,而經(jīng)理的薪水是10000元,請(qǐng)問該部門收入的平均水平是多少?2.1.1 眾數(shù)(Mode,Mo)P. 66眾數(shù):一組數(shù)據(jù)中出現(xiàn)次數(shù)最多的數(shù)如2、3、5、3、4、3、6的眾數(shù)為3卡爾皮爾遜 1894如果次數(shù)分布最多的有兩個(gè)數(shù),而且兩個(gè)數(shù)是相鄰的,那么一般取兩者的平均值作為眾數(shù);如果這兩個(gè)數(shù)不相鄰,那么一般需要報(bào)告兩個(gè)眾數(shù),而且認(rèn)為該組數(shù)據(jù)是bimodal雙峰分布的計(jì)算眾數(shù)的皮爾遜經(jīng)驗(yàn)法Mo3Mdn2M眾數(shù)的用途快速粗略尋求一組數(shù)據(jù)的代表值做不同質(zhì)數(shù)據(jù)的代表值,如工資次數(shù)分布中有兩極端的數(shù)目(一般用中

3、數(shù),有時(shí)用眾數(shù))用平均數(shù)和眾數(shù)之差作為次數(shù)分布是否偏態(tài)的指標(biāo)眾數(shù)與從眾買東西2.1.2 中數(shù)(Median,Md或Mdn)P62中數(shù):一組數(shù)據(jù)中按從小到大排序后,處于中間位置上的變量值中數(shù)的位置:(n+1)/21883 高爾頓將全部數(shù)據(jù)排序后,如果項(xiàng)數(shù)是奇數(shù),則正中央的那一項(xiàng)即為中位數(shù)例:4、7、8、9、10、11、12、13、14Mdn10如果項(xiàng)數(shù)是偶數(shù),則正中央的那兩項(xiàng)的平均值即為中位數(shù)例: 2、3、5、7、8、10、15、19Mdn(78)/27.5思考題某病患者的潛伏期如下,求中數(shù)2,3,3,3,4,5,6,9,16 上述數(shù)據(jù)中的16改為30天,求中數(shù)求15,35,25,5的中數(shù)中數(shù)的

4、應(yīng)用不易受極端值的影響當(dāng)數(shù)據(jù)呈明顯偏態(tài)時(shí),中數(shù)較均數(shù)或幾何均數(shù)合理2.1.3 平均數(shù)(Mean) p. 55 平均數(shù)的定義又叫均數(shù)、算術(shù)平均數(shù),縮寫M, 設(shè)一組數(shù)據(jù)為x1,x2,xn練習(xí) 平均數(shù)的特點(diǎn) p58一組數(shù)據(jù)的每一個(gè)數(shù)與平均數(shù)的差(離均差)的總和等于零一組數(shù)據(jù)的每一個(gè)數(shù)加上常數(shù)C,其平均數(shù)為原來的平均數(shù)加常數(shù)C一組數(shù)據(jù)的每一個(gè)數(shù)乘以常數(shù)C,其平均數(shù)為原來的平均數(shù)乘常數(shù)C一組數(shù)據(jù)的每一個(gè)數(shù)與常數(shù)C的差的平方和不小于該組數(shù)據(jù)的每一個(gè)數(shù)與平均數(shù)的差的平方和 算術(shù)平均數(shù)的優(yōu)點(diǎn)和缺點(diǎn) p60優(yōu)點(diǎn)反應(yīng)靈敏確定嚴(yán)密簡明易解計(jì)算簡單符合代數(shù)方法進(jìn)一步演算較少受抽樣變動(dòng)的影響缺點(diǎn)易受極端值的影響若出現(xiàn)模

5、糊不清的數(shù)據(jù)時(shí)無法計(jì)算 算術(shù)平均數(shù)的適用條件 p61數(shù)據(jù)必須是同質(zhì)的如:如果身高均數(shù)在性別上有差異,那么不分性別地求某一年齡組的身高均數(shù)時(shí)沒有實(shí)際意義的數(shù)據(jù)取值必須明確適用于呈正態(tài)分布的數(shù)據(jù)數(shù)據(jù)離散不能太大 思考題你們念統(tǒng)計(jì)的常以算術(shù)平均數(shù)來代表總體 (population),那么你們一手泡在沸水中,另一手浸在冰水中,一定會(huì)感到很舒服,因?yàn)槟銈兊钠骄惺苁钦sw溫。請(qǐng)舉例說明什么情況下我們會(huì)對(duì)估計(jì)總體的平均數(shù)感興趣。2.1.4 加權(quán)平均數(shù)(Weighted mean) p69用于分組數(shù)據(jù)學(xué)校均數(shù)人數(shù)ABC72.680.275324036Grade Point Average2.1.5 幾何平均

6、數(shù)(Geometric mean)p71數(shù)據(jù)分布近似正態(tài)分布,但呈偏態(tài)傳染病的潛伏期心理物理學(xué)的等距與等比量表實(shí)驗(yàn)呈(近似)等比數(shù)列變化的數(shù)據(jù),即變量值呈倍數(shù)關(guān)系或近似倍數(shù)關(guān)系的數(shù)據(jù)用于計(jì)算平均發(fā)展速度、平均增長率、學(xué)習(xí)記憶的平均進(jìn)步率、學(xué)校經(jīng)費(fèi)平均增加率、平均人口出生率等等血清中抗體滴度、血清凝集效價(jià)年度人數(shù)變化率19871988198919901991200022002430260028801.10001.10451.07001.1077例:某學(xué)生背單詞周次12345記住單詞2023263034求該生記憶單詞的平均進(jìn)步率2.1.6 調(diào)和平均數(shù) (harmonic mean) p75即倒數(shù)平

7、均數(shù)的倒數(shù),用于求平均速度例被試號(hào)123456完成題數(shù)101010101010時(shí)間(小時(shí))0.81.01.21.52.55.02.2 平均數(shù)、中數(shù)和眾數(shù)的關(guān)系 p68在一個(gè)正態(tài)分布中,三者相等在正偏態(tài)分布中,M Md Mo在負(fù)偏態(tài)分布中,M Md Mo一般偏態(tài)情況下,Md離M較近,而離Mo較遠(yuǎn)平均數(shù):支點(diǎn)兩端的力矩相等中數(shù):兩側(cè)數(shù)據(jù)個(gè)數(shù)相同眾數(shù):出現(xiàn)次數(shù)最多2.3 集中量數(shù)的適用數(shù)據(jù)類別數(shù)據(jù)順序數(shù)據(jù)等距數(shù)據(jù)比例數(shù)據(jù)*眾數(shù)*中數(shù)*均數(shù)*均數(shù) 四分位 眾數(shù) 調(diào)和平均數(shù) 眾數(shù) 中數(shù)幾何平均數(shù) 四分位數(shù) 中數(shù)四分位數(shù) 眾數(shù)*表示該數(shù)據(jù)類型最適合用的量數(shù)思考題不做運(yùn)算比較下面兩個(gè)數(shù)列的平均數(shù)10, 7,

8、 8,3, 5, 910, 7, 8,3, 5, 9, 113. 差異量數(shù)又叫離中量數(shù),是表示數(shù)據(jù)分散程度的統(tǒng)計(jì)量,反映的是各變量值遠(yuǎn)離其中心值的程度表示數(shù)據(jù)離中趨勢(shì)的量數(shù)有全距平均差方差標(biāo)準(zhǔn)差差異系數(shù)3.1 全距(range) p81也稱極差,是一組數(shù)據(jù)的最大值與最小值之差。R=max(Xi)-min(Xi)3.2 平均差(Average deviation)p87Mean absolute deviation各變量值與均值之差的絕對(duì)值的平均數(shù)不利于代數(shù)運(yùn)算離均差(離差) deviation from the mean3.3方差和標(biāo)準(zhǔn)差Variance & Standard Deviatio

9、n3.3.1 定義 p883.3.2 方差和標(biāo)準(zhǔn)差的變式 Xi xXXi=- ()22XXxi-= 2iX 6 0 0 36 5 -1 1 25 7 1 1 49 4 -2 4 16 6 0 0 36 8 2 4 64 N=6 =36iX =0 x =102x =2262iX 3.3.3樣本方差與總體方差的區(qū)別在計(jì)算上,總體方差是用數(shù)據(jù)個(gè)數(shù)或總次數(shù)去除離差平方和,而樣本方差則用樣本數(shù)據(jù)個(gè)數(shù)或總次數(shù)減一去除離差平方和樣本方差是統(tǒng)計(jì)量,用S2表示;總體方差是總體參數(shù),用2表示當(dāng)n很大時(shí), S2與2相差很小,前者是后者的無偏估計(jì)3.3.4 標(biāo)準(zhǔn)差的性質(zhì) p94一組數(shù)據(jù)的每一個(gè)數(shù)據(jù)都加常數(shù)C后標(biāo)準(zhǔn)差不

10、變一組數(shù)據(jù)的每一個(gè)數(shù)據(jù)都乘常數(shù)C后標(biāo)準(zhǔn)差變?yōu)樵瓉淼腃倍3.3.5方差與標(biāo)準(zhǔn)差的優(yōu)點(diǎn) p94方差與標(biāo)準(zhǔn)差是表示一組數(shù)據(jù)離散程度的最好的指標(biāo)。其值越大,說明離散程度大,其值小說明數(shù)據(jù)比較集中。具有以下優(yōu)點(diǎn):(1)反應(yīng)靈敏。(2)由計(jì)算公式嚴(yán)格確定;(3)容易計(jì)算;(4)適合代數(shù)運(yùn)算;(5)受抽樣變動(dòng)的影響小,既不同樣本的標(biāo)準(zhǔn)差或方差比較穩(wěn)定;(6)簡單明了;(7)具有可加性??梢园芽傋儺惙纸鉃椴煌瑏碓吹淖儺悺#?)各變量值對(duì)均值的方差小于對(duì)任意數(shù)的方差。標(biāo)準(zhǔn)差的應(yīng)用表示數(shù)據(jù)的離散程度標(biāo)準(zhǔn)差越大越離散結(jié)合均數(shù)描述正態(tài)分布特征根據(jù)正態(tài)分布原理求正常值范圍3.4 差異系數(shù) (Coefficient of

11、 variation) p95變異系數(shù)指出了標(biāo)準(zhǔn)差對(duì)于平均值的大小,用于比較不同總體或樣本數(shù)據(jù)的離散程度。同一樣本不同測(cè)量的變異的比較,如相同班級(jí)不同科目的變異的比較;不同樣本同一測(cè)量的變異的比較,如不同年級(jí)同一科目變異大小的比較。例:已知某小學(xué)一年級(jí)學(xué)生的平均體重為25公斤,體重的標(biāo)準(zhǔn)差是3.7公斤,平均身高110厘米,標(biāo)準(zhǔn)差為6.2厘米,問體重與身高的離散程度哪個(gè)大?解:CV體重=3.7/25100%=14.8% CV身高=6.2/110 100%=5.64%, 所以, 體重的離散程度比身高的離散程度大。例: 通過同一個(gè)測(cè)驗(yàn),一年級(jí)學(xué)生的平均分?jǐn)?shù)為60分,標(biāo)準(zhǔn)差為4.02分,五年級(jí)學(xué)生的平

12、均分?jǐn)?shù)為80分,標(biāo)準(zhǔn)差為6.04分,問這兩個(gè)年級(jí)的測(cè)驗(yàn)分?jǐn)?shù)中哪一個(gè)離散程度大。解:CV一年級(jí)=4.02/60 100%=6.7%, CV五年級(jí)=6.04/80 100%=7.55%, 所以,五年級(jí)的測(cè)驗(yàn)分?jǐn)?shù)的分散程度大。3.5 數(shù)據(jù)類型和差異量數(shù)四分位差 Quartile deviationQD = (QU-QL)/2思考題以下每組數(shù)的平均數(shù)均為50,哪組數(shù)在平均數(shù)附近的散布程度最大?哪組最???A0,20,40,50,60,80,1000,48,49,50,51,52,1000,1,2,50,98,99,100B47,49,50,51,5346,48,50,52,5446,49,50,51,5

13、44. 地位量數(shù)百分位數(shù)(Percentile):第p百分位是這樣一個(gè)值,它使得至少有p%的數(shù)據(jù)小于或等于這個(gè)值,且至少有(100-p)%的數(shù)據(jù)項(xiàng)大于或等于這個(gè)值四分位數(shù)(Quartile):將數(shù)據(jù)劃分為4部分,每部分各占25%的數(shù)據(jù)項(xiàng),這種劃分的臨界點(diǎn)即為四分位數(shù)。三個(gè)四分位數(shù)分別為:Q1, Q2 ,Q3 十分位數(shù)(Decile):將數(shù)據(jù)劃分為10個(gè)部分,每部分占十分之一的數(shù)據(jù)項(xiàng)。其劃分的臨界點(diǎn)為十分位數(shù)Q1 Q2 Q30.25 0.25 0.25 0.25計(jì)算第p百分位步驟第一步:從小到大排列原始數(shù)據(jù)第二步:計(jì)算指數(shù)i i=(p/100)n, n為項(xiàng)數(shù),p為所求的百分位的位置第三步:若i不

14、是整數(shù),將i向上取整;若i是整數(shù),則第p百分位數(shù)是第i項(xiàng)與第 i+1 項(xiàng)數(shù)據(jù)的平均值例:有12個(gè)職員薪金的數(shù)據(jù),求第85和第50百分位數(shù)。解:(1)將12個(gè)數(shù)據(jù)從小到大排序如下: 2210 2225 2350 2380 2380 2390 2420 2440 2450 2550 2630 2825 (2) i=(p/100)n=(85/100)12=10.2 (3) 由于i=10.2不是整數(shù), 向上取整,所以第85百分位數(shù)對(duì)應(yīng)的是第11項(xiàng), 其值為2630。 同理,計(jì)算第50百分位(中位數(shù))。i=(50/100) 12=6,是整數(shù),第50百分位數(shù)是第6項(xiàng)和第7項(xiàng)的平均值,即(2390+2420)/2=2405。百分位差:P90P10p82四分位差: (Q3-Q1)/2p85百分位數(shù)的應(yīng)用常用于確定正常值范圍,如醫(yī)學(xué)參考值范圍reference ranges習(xí)慣上確定95%(也可用80%, 90%, 99%)的人的界線雙側(cè)參考值,計(jì)算P2.5和P97.5白細(xì)胞總數(shù)過高過低均屬異常單側(cè)參考值,計(jì)算P5或P95肺活量:過低為異常尿鉛:過高為異常Weights of Girl

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請(qǐng)下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請(qǐng)聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會(huì)有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫網(wǎng)僅提供信息存儲(chǔ)空間,僅對(duì)用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對(duì)用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對(duì)任何下載內(nèi)容負(fù)責(zé)。
  • 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請(qǐng)與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶因使用這些下載資源對(duì)自己和他人造成任何形式的傷害或損失。

最新文檔

評(píng)論

0/150

提交評(píng)論