敘述統(tǒng)計(jì)統(tǒng)計(jì)量數(shù)_第1頁
敘述統(tǒng)計(jì)統(tǒng)計(jì)量數(shù)_第2頁
敘述統(tǒng)計(jì)統(tǒng)計(jì)量數(shù)_第3頁
敘述統(tǒng)計(jì)統(tǒng)計(jì)量數(shù)_第4頁
敘述統(tǒng)計(jì)統(tǒng)計(jì)量數(shù)_第5頁
已閱讀5頁,還剩79頁未讀, 繼續(xù)免費(fèi)閱讀

下載本文檔

版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請(qǐng)進(jìn)行舉報(bào)或認(rèn)領(lǐng)

文檔簡(jiǎn)介

敘述統(tǒng)計(jì)統(tǒng)計(jì)量數(shù)平均數(shù)算術(shù)平均數(shù)所有觀察值的總和除以觀察值的個(gè)數(shù)算術(shù)平均數(shù)在數(shù)在線代表資料的平衡點(diǎn)

母體平均數(shù)i=1NXiμ=

N樣本平均數(shù)X=nnxii=1

資料的平衡點(diǎn)18000200002500027000平均數(shù)2800050000中位數(shù):數(shù)值大小順序排列的觀察值中央的那一個(gè)數(shù)值眾數(shù)(Mode):觀察值中其出現(xiàn)次數(shù)最多的那一個(gè)數(shù)值四分位數(shù):將順序資料分成四等分?jǐn)?shù)值的分位數(shù)求下列二組資料之中位數(shù)與眾數(shù):(I):3,8,9,9,5(II):4,8,6,2Sol:

按大小順序排列,找中間位置3,5,8,9,92,4,6,8(4+6)/2=5百分位數(shù)(Pk):將順序資料均分為一百等分?jǐn)?shù)值,取第k個(gè)等分點(diǎn)將順序資料排列求位置指標(biāo)

ii=n(k/100)

n:觀測(cè)值個(gè)數(shù)

I:非整數(shù)Pk:下一個(gè)整數(shù)位置值

I:整數(shù)Pk:(第i+第i+1

位置值)/2

Ex:假定某一班級(jí)20位學(xué)生之統(tǒng)計(jì)學(xué)成績(jī)?nèi)缦?

4255667696806959462822445668788874635339計(jì)算平均數(shù),中位數(shù),P35,P68Sol:22283942444653

555659

63666869747678808896

中位數(shù):(59+63)/2=61P35:i=20(35/100)=7為整數(shù)取第7與第8兩位置之平均數(shù)

(53+55)/2=54P68:i=20(68/100)=13.6不為整數(shù)取第14位置值69

四分位距IQR=第3四分位數(shù)-第1四分位數(shù)=Q3-Q1全距

R=最大值-最小值Ex:病房中的兩個(gè)病人,他們一天要測(cè)量脈搏三次,結(jié)果如下:A:727578B:4864113A=75=B請(qǐng)問:可否只從平均數(shù)據(jù)下結(jié)論?Ex:兩個(gè)學(xué)生的各項(xiàng)成績(jī)?nèi)缦?甲:8076788383

乙:8560956595甲=80=乙請(qǐng)問:可否只從平均數(shù)下結(jié)論?平均分?jǐn)?shù)相同能力或表現(xiàn)相同比較兩組數(shù)值時(shí),需要考慮每個(gè)數(shù)值的變異程度變異程度:全距

甲:83-76=7分乙:95-60=35分請(qǐng)問:從全距可否得到?信息變異數(shù)將所有數(shù)據(jù)都納入考慮,來測(cè)量一組數(shù)據(jù)的變異程度,分布程度,離散程度,或一致性變異程度:測(cè)量各個(gè)數(shù)值和平均數(shù)的差距平均絕對(duì)離差:為了避免正負(fù)值相抵消

母體變異數(shù)

測(cè)量原始數(shù)值和平均數(shù)的相近程度式中:μ:母體平均數(shù),N:母體個(gè)數(shù)。

甲的成績(jī)xx-u(x-u)2807678838380-80=076-80=-478-80=-283-80=383-80=3

016499變異數(shù):38/5=7.6母體標(biāo)準(zhǔn)差樣本標(biāo)準(zhǔn)差平均絕對(duì)離差平均絕對(duì)離差母體:MAD=1NNi=1Xi-μ樣本:mad=1NNi=1Xi-X平均絕對(duì)離差越大分散程度越大一組數(shù)據(jù)資料中的標(biāo)準(zhǔn)差越大,這些數(shù)的離散或變異程度越大標(biāo)準(zhǔn)差不只考慮到資料中的最大數(shù)和最小數(shù),資料中的每一個(gè)數(shù)都有被列入計(jì)算平均數(shù)中央數(shù).探討各個(gè)數(shù)值分布在平均數(shù)的附近用標(biāo)準(zhǔn)差來精確敘述這種離散程度

變異數(shù)樣本變異數(shù)式中:X:樣本均數(shù),n:樣本數(shù)此離差為

(Xi-X);

一般而言,μ為未知,以樣本平均數(shù)X來推估μ,故失去一個(gè)自由度一家銀行有八臺(tái)自動(dòng)柜員機(jī),在1小時(shí)中,各機(jī)器的使用次數(shù)如下:

2431201635282529試問每臺(tái)柜員機(jī)使用次數(shù)的平均值和標(biāo)準(zhǔn)差

xx-u(x-u)21616-26=-101002020-26=-6362424-26=-242525-26=-112828-26=242929-26=393131-26=5253535-26=9

81Total:260S2=260/8=32.5S=

=5.75每小時(shí)每臺(tái)服務(wù)次數(shù)

32.5

相對(duì)差異量數(shù):用來比較兩種或性質(zhì)不同,或單位不同的資料,或

單位相同但平均數(shù)相差很大Ex:兩組測(cè)量同一批鋼管長(zhǎng)度的觀測(cè)值:

I:

8,9,10,11,12(公尺)

II:800,900,1000,1100,1200(公分)變異數(shù)I:2標(biāo)準(zhǔn)差I(lǐng):2變異數(shù)II:20000標(biāo)準(zhǔn)差I(lǐng)I:1002柴比氏(Chebyshev)定理不論資料為何種分配,至少有(1-1/k)的資料落在距離平均數(shù)k個(gè)標(biāo)準(zhǔn)差的范圍內(nèi)K為大于1的任意數(shù)即k>1

由平均數(shù)和標(biāo)準(zhǔn)差柴比氏定理

資料的范圍比例2根據(jù)柴比氏定理,當(dāng)k=2時(shí),至少有1-1/22=3/4=75%觀測(cè)值落在平均數(shù)左右的兩個(gè)標(biāo)準(zhǔn)差的區(qū)間內(nèi).即(x-2s,x+2s)k區(qū)間落于該區(qū)間的比例1(x-s,x+s)至少為02(x-2s,x+2s)至少為3/4or(75%)3(x-3s,x+3s)至少為8/9or(89%)標(biāo)準(zhǔn)差的顯著程度若資料為鐘形分配,則有68%的觀察值落在內(nèi),有95%的觀察值落在內(nèi),有99%的觀察值落在內(nèi)(S為標(biāo)準(zhǔn)差)Ex:隨機(jī)抽出200名員工,發(fā)現(xiàn)每日支出平均為615元,標(biāo)準(zhǔn)差為135元.利用柴比氏,求每日支出落于(345,885)的區(qū)間人數(shù)假設(shè)呈對(duì)稱分配,試?yán)媒?jīng)驗(yàn)法則求出落于(i)區(qū)間的人工員數(shù)Sol:x

=615,s=135345=615-k*135885=615+k*135k=2根據(jù)柴比氏,至少有1-1/22=3/4=75%的員工其每日支出落在(345,885)的區(qū)間內(nèi),即0.75*200=150個(gè)員工(ii)根據(jù)經(jīng)驗(yàn)法則,約95%的觀測(cè)值落在(x-2s,x+2s)的區(qū)間.故約200*95%=190個(gè)員工每日支出金額在(345,885)之內(nèi)P:Me所在組的組下界q-p:

Me所在組的組距Fi:Me所在組的組次數(shù)

Fi-1:

Me前一組的累加次數(shù)中位數(shù)組別組界次數(shù)fi

以下累積次數(shù)Fi

120~30f1F1

2

30~40f2F2….….………

i-1h~kfi-1Fi-1ip~qfi

Fi假設(shè)中位數(shù)于此組i+1r~s

fi+1Fi+1

………Fk=n

內(nèi)插法pFi-1

Men/2qFi

Me–pn/2-Fi-1

q-pFi-

Fi-1=眾數(shù)粗略法眾數(shù)皮爾生眾數(shù)眾數(shù)金氏法眾數(shù)

式中:母體變異數(shù)與標(biāo)準(zhǔn)差樣本變異數(shù)與標(biāo)準(zhǔn)差四分位數(shù)全部資料的前25%全部資料的第二個(gè)25%全部資料的第三個(gè)25%全部資料的末25%Q1P25

P50

P75Q2

Q3中位數(shù)?分位數(shù)分組資料的第?分位數(shù)

位置指標(biāo)

i=n*(k/100)n:總次數(shù)

k:第k個(gè)百分位數(shù)計(jì)算以下累積次數(shù),確定Pk組所在位置利用內(nèi)插法求PkEx:某一班50位學(xué)生統(tǒng)計(jì)成績(jī)次數(shù)分配如下:求中位數(shù),第三四分位數(shù)與P70

組別組界次數(shù)以下累積次數(shù)

130~4011240~5023

350~60710

460~701020570~801838680~90846790~100450插入法?-該組下界?-在組中的的臨界值順位=該組的組距該組的總次數(shù)母體共變量樣本共變量母體相關(guān)系數(shù)相關(guān)系數(shù)顯示出兩個(gè)變量的關(guān)系或趨勢(shì)點(diǎn)分布圖形……………....……....….….….....………..………….……............樣本相關(guān)系數(shù)2.23

由導(dǎo)出的

,將C=0合并S:HW1)某研究針對(duì)某大學(xué)生每晚的睡眠時(shí)間進(jìn)行統(tǒng)計(jì),一個(gè)含20位學(xué)生的隨機(jī)樣本統(tǒng)計(jì)結(jié)果如下:

6,7,5,6,8,4,5,6.5,7,3.5,6,5,6,6,4.5,7.5,3,6,5,7

請(qǐng)求出這組資料的平均數(shù),中位數(shù),眾數(shù),變異數(shù),標(biāo)準(zhǔn)差,及繪制箱圖HW2)一所大學(xué)針對(duì)每天學(xué)生攝取卡路里數(shù)進(jìn)行調(diào)查.結(jié)果得知平均數(shù)為1450卡路里,標(biāo)準(zhǔn)差為300卡路里.試問:(a)有多少比例的學(xué)生,其每天攝取卡路里數(shù)介于850~2050間?(b)68%的學(xué)生卡路里攝取數(shù)落在甚么區(qū)間中?HW3)一所大學(xué)對(duì)于其學(xué)生申請(qǐng)助學(xué)金的貸款進(jìn)行統(tǒng)計(jì),結(jié)果如下表:

貸款金額學(xué)生人數(shù)<9993001000~199918002000~299921003000~399911504000~4999

6005000~599950試估計(jì)學(xué)生貸款金額之平均數(shù),標(biāo)準(zhǔn)差,中位數(shù).

Ex:民國(guó)87年某人研究臺(tái)灣地區(qū)騎機(jī)車未戴安全帽的比率,在臺(tái)南市某交通要道觀看半小時(shí)內(nèi)經(jīng)過之機(jī)車,得到如下資料:

未戴安全帽戴安全帽男52158女3085推估臺(tái)灣地區(qū)未戴安全帽的比率:82325=5.23%此推估是否恰當(dāng)?次數(shù)分配表:(FrequencyDistributionTable)

將一組數(shù)據(jù)分成“幾個(gè)組”,然后再統(tǒng)計(jì)每一組的次數(shù),做成一個(gè)表=>畫圖組距:取全部資料的Max&Min之

difference再除以組數(shù),取

近似值一組資料的次數(shù)分配如下,由于受到污染,致使表中A.B二欄字跡不清,試求A、B值組別組中點(diǎn)(mi)次數(shù)(fi)mi*fi0~201033020~4030412040~6050945060~8070A?80~10090B?

Total402480求A、B值之Solution:3+4+9+A+B=40A+B=24=>A+B=2430+120+450+70A+90B=2480=>70A+90B=1880解聯(lián)立方程序:A+B=2470A+90B=188070A=980,90B=900A=14,B=10職籃聯(lián)盟的旗下計(jì)有25支籃球隊(duì),其比賽得分記錄:74728679747291846475638078958286777369728185926290請(qǐng)編制此組資料的次數(shù)分配、相對(duì)次數(shù)分配、以下累積和以上累積的次數(shù)分配b.繪制長(zhǎng)條圖與繪制枝葉圖c.中位數(shù)與標(biāo)準(zhǔn)差聯(lián)籃聯(lián)盟:a.將資料由小->大min:62Max:95定組距為4組別次數(shù)相對(duì)次數(shù)累積相對(duì)次數(shù)60~6433/25=.12.1265~6911/25=.04.1670~7466/25=.24.4075~7944/25=.16.5680~8444/25=.16.72組別次數(shù)相對(duì)次數(shù)累積相對(duì)次數(shù)85~8933/25=.12.8490~9433/25=.12.9695~9911/25=.041.00合計(jì)

251.00b.長(zhǎng)條圖:得分記錄(分)次數(shù)c.枝葉圖:依照a的組距62346*972223447*5789801248*56690129*5某電信局記錄長(zhǎng)途電話撥入時(shí)間的間隔(min)12.610.55.015.316.89.24.220.227.58.912.218.214.514.012.67.811.55.515.58.9a.試將資料整理成次數(shù)&相對(duì)次數(shù)分配表b.請(qǐng)繪制枝葉圖,由枝葉圖求Max、min&資料大多集中在?范圍c.計(jì)算變異數(shù)與標(biāo)準(zhǔn)差電信局的solution:a.取5為單位,將資料由小大,最?。?.2最大:27.5(因有小數(shù)點(diǎn),小心計(jì)算)時(shí)間間隔(x)次數(shù)(f)相對(duì)次數(shù)3≦x<844/20=.28≦x<1388/20=.413≦x<1855/20=.2518≦x<2322/20=.1023≦x<2811/20=.05Total201.00b.電信局枝葉圖:以0.1(min)為單位425057889992105115一診所完病人的等待急診時(shí)間之資料搜集(近一個(gè)月),等待的時(shí)間:(分鐘)251012445171189812216871383請(qǐng)以0為起始時(shí)間,并用5

min為分組寬度

a.列出次數(shù)分配表

b.相對(duì)次數(shù)分配表

c.累積次數(shù)分配表

d.繪出直方圖急診等待時(shí)間(solution):a.b.等待時(shí)間(x)次數(shù)相對(duì)次數(shù)0≦x<544/20=.2=20%5≦x<1088/20=.4=40%10≦x<1555/20=.25=25%15≦x<2022/20=.10=10%20≦x<2511/20=.05=5%Total201.00100%急診等待時(shí)間c.等待時(shí)間(x)次數(shù)累計(jì)次數(shù)累積相數(shù)次數(shù)0≦x<544.205≦x<10812.6010≦x<15517.8515≦x<20219.9520≦x<251201.00次數(shù)分配直方圖:T時(shí)間(分鐘)次數(shù)f觀念題:甲班與乙班成績(jī)平均=60分但,甲班成績(jī)分布呈對(duì)稱乙班成績(jī)分布呈右偏試問,那一班及格的人數(shù)較多?那一班的中位數(shù)較大?有100位學(xué)生,統(tǒng)計(jì)學(xué)的考試平均分?jǐn)?shù)

=75,

=5試求,介于60分~90分有幾位學(xué)生?65分~85分有幾位學(xué)生?6065759065分:為x-3

(75-3*5=65)90分:為x+3

(75+3*5=90) 按照柴比氏定理,至少有1-321=1-98=89%的學(xué)生(89位)由柴比氏定理(用于任何型態(tài))

不對(duì)稱也可以

x-2sx-sxx+sx+2sK=2,1-1/k2=1-1/4=3/4=75%的觀察值在(x-2s,x+2s)之內(nèi)K=3,K=4,…分組資料的第3四分位數(shù)Q3=LQ3+3n/4—FQ3fQ3WQ3式中:LQ3:Q3所在組的組下界,fQ3:Q3所在組的組次數(shù),WQ3:Q3所在組的組距,FQ3:Q3前一組的累加次數(shù)分組資料的百分位數(shù)Pi=Lpi+ni/100–FpifpiWpi式中:Pi:第i個(gè)百分位數(shù),Lpi:Pi所在組的組下界,fpi:Pi所在組的組次數(shù),Wpi:Pi所組的組距,F(xiàn)pi:Pi前一組的累加次數(shù)分組資料的十分位數(shù)Di=LDi+ni/10-FdifDiWDi式中:Di:第i個(gè)十分位數(shù),LDi:Di所在組的組下界,fDi:Di所在組的組次數(shù),WDi:Di所在組的組距,F(xiàn)Di:Di前一組的累加次數(shù)試求下列(a)中位數(shù)Me(b)Q1(c)Q3(d)IQR分組別x:資料學(xué)生累積次數(shù)

30~4030≦x<40240~5040≦x<50350~6050≦x<601160~7060≦x<702070~8070≦x<803280~9080≦x<902590~10090≦x<1007(a)中位數(shù):因?yàn)?1/2)×100=50,由上表得知,中位數(shù)落在第五組(看累積次數(shù))Me-組下界組距n/2-前一組的累加次數(shù)所在的組次數(shù)=Me-701050-3632=Me=50-36

32

10+70=74.38(b)Q1:因1/4

100=25,由上表得知,Q落在第4組

Q1-6025-161020=Q1=64.5(C)Q3:因3/4

100=75,由上表得知,Q3落在第6組Q3-組下界組距=3n/4-前組的累加次數(shù)所在的組次數(shù)Q3-8010=2575-68Q3=82.8(d)I.Q.R:Q3-Q1=82.8-64.5=18.3GD#33)設(shè)XA為A組的平均成績(jī):80設(shè)XB為B組的平均成績(jī):74

X:全班平均成績(jī):∑Xi=30XA+20XB=77.65050

設(shè)SA表示A組的標(biāo)準(zhǔn)差:6設(shè)SB表示B組的標(biāo)準(zhǔn)差:8,S表示全班的標(biāo)準(zhǔn)差50i=1SA2=36.∑

Ai2-30·XA2∑

Ai2=193.080

3030i=130i=1SB2=64.∑

Bi2-20·XB2∑

Bi2=110.800

2020i=1i=12020∑Xi2=∑Ai2+∑Bi2=193.080+110.080=303.880502030i=1i=1i=1S2=∑Xi2-50X2=303.880–50*(77.6)2=55.84505050i=1S=55.84=7.47n=1100135175215215=175+4*10,175-4*10=135由柴氏定理得知:最多有1/42的報(bào)考人數(shù)的分?jǐn)?shù)會(huì)落入(-∞,135)(215,∞),1100*1/16=68.75

最多68人的分?jǐn)?shù)會(huì)高于215分,所以考生會(huì)錄取柴氏定理至少有(1-1/k2)的資料會(huì)落在距離平均數(shù)K個(gè)標(biāo)準(zhǔn)差的范圍內(nèi)最多有(1-1/k2)的資料不會(huì)落在距離平均數(shù)個(gè)k個(gè)標(biāo)準(zhǔn)差的范圍內(nèi)或

會(huì)落在距離平均數(shù)個(gè)k個(gè)標(biāo)準(zhǔn)差的范圍外

汽油組界次數(shù)0~4-.5~4.5

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請(qǐng)下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請(qǐng)聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會(huì)有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫網(wǎng)僅提供信息存儲(chǔ)空間,僅對(duì)用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對(duì)用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對(duì)任何下載內(nèi)容負(fù)責(zé)。
  • 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請(qǐng)與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶因使用這些下載資源對(duì)自己和他人造成任何形式的傷害或損失。

最新文檔

評(píng)論

0/150

提交評(píng)論