統(tǒng)計數(shù)據(jù)的收集與整理_第1頁
統(tǒng)計數(shù)據(jù)的收集與整理_第2頁
統(tǒng)計數(shù)據(jù)的收集與整理_第3頁
統(tǒng)計數(shù)據(jù)的收集與整理_第4頁
統(tǒng)計數(shù)據(jù)的收集與整理_第5頁
已閱讀5頁,還剩7頁未讀 繼續(xù)免費閱讀

下載本文檔

版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進行舉報或認領(lǐng)

文檔簡介

1、第一章統(tǒng)計數(shù)據(jù)的收集與整理1.1算術(shù)平均數(shù)是怎樣計算的?為什么要計算平均數(shù)?答:算數(shù)平均數(shù)由下式計算: 個數(shù)除,所得之商稱為算術(shù)平均數(shù)。 是說是樣本數(shù)據(jù)的代表。滬亙一,含義為將全部觀測值相加再被觀測值的計算算數(shù)平均數(shù)的目的, 是用平均數(shù)表示樣本數(shù)據(jù)的集中點,n1.2既然方差和標準差都是衡量數(shù)據(jù)變異程度的,有了方差為什么還要計算標準差?答:標準差的單位與數(shù)據(jù)的原始單位一致,能更直觀地反映數(shù)據(jù)地離散程度。1.3標準差是描述數(shù)據(jù)變異程度的量,變異系數(shù)也是描述數(shù)據(jù)變異程度的量,兩者之間有什么不同?答:變異系數(shù)可以說是用平均數(shù)標準化了的標準差。在比較兩個平均數(shù)不同的樣本時所得結(jié)果更 可靠。1.4完整地描

2、述一組數(shù)據(jù)需要哪幾個特征數(shù)?答:平均數(shù)、標準差、偏斜度和峭度。1.5下表是我國青年男子體重(kg )。由于測量精度的要求,從表面上看像是離散型數(shù)據(jù),不要 忘記,體重是通過度量得到的,屬于連續(xù)型數(shù)據(jù)。根據(jù)表中所給出的數(shù)據(jù)編制頻數(shù)分布表。666964656466686562646961616866576669666570645867666667666662666664626265646566726066656161666762656561646264656265686865676862637065646562666263686568576766686364666864636064696566676

3、767656767666864675966656356666363666763706770626472696767666864657161636164646769706664656463706462697068656365666468696563676370656867696665676674646965646565686765656667726567626771696565756269686865636666656261686564676664606168676359656064636962716960635967616869666469656867646466697368606063386

4、267656569656765726667646164666363666666636563676866626361666163686566696466706970636465646767656662616565606365626664答:首先建立一個外部數(shù)據(jù)文件,名稱和路徑為:E:dataexer1-5e.dat。所用的SAS程序和計算結(jié)果如下:proc format; value hfmt 56-57=56-57 58-59=58-59 60-6仁60-61 62-63=62-63 64-65=64-65 66-67=66-67 68-69=68-69 70-71=70-71 72-73=7

5、2-73 74-75=74-75: run;data weight;in file E:dataexer1-5e.dat; input bw ;run;proc freq;table bw;format bw hfmt.;run;The SAS SystemCumulative CumulativeBW Freque ncy P erce nt Freque ncy P erce nt56-57 3 1.0 3 1.058-59 4 1.3 7 2.360-61 22 7.3 29 9.762-63 46 15.3 75 25.064-65 83 27.7 158 52.766-67 77 2

6、5.7 235 78.368-69 45 15.0 280 93.370-71 13 4.3 293 97.772-73 5 1.7 298 99.374-75 2 0.7 300 100.01.6將上述我國男青年體重看作一個有限總體,用隨機數(shù)字表從該總體中隨機抽出含量為10的兩個樣本,分別計算它們的平均數(shù)和標準差并進行比較。它們的平均數(shù)相等嗎?標準差相等嗎?能夠解釋為什么嗎?答:用means過程計算,兩個樣本分別稱為和,結(jié)果見下表:The SAS SystemVariable N Mea n Std DevY1 10 64.5000000 3.5039660Y2 10 63.9000000

7、3.1780497 隨機抽出的兩個樣本,它們的平均數(shù)和標準差都不相等。因為樣本平均數(shù)和標準差都是統(tǒng)計量,統(tǒng)計量有自己的分布,很難得到平均數(shù)和標準差都相等的兩個樣本。1.7從一個有限總體中采用非放回式抽樣,所得到的樣本是簡單的隨機樣本嗎?為什么?本課程要求的樣本都是隨機樣本,應(yīng)當采用哪種抽樣方法,才能獲得一隨機樣本?答:不是簡單的隨機樣本。從一個有限總體中以非放回式抽樣方法抽樣,在前后兩次抽樣之間因此不是隨機樣本。 應(yīng)采用隨機抽不是相互獨立的,后一次的抽樣結(jié)果與前一次抽樣的結(jié)果有關(guān)聯(lián),樣的方法抽取樣本,具體說應(yīng)當采用放回式抽樣。X也-買F = ZGf -才1.8證明口U時,前式是否仍然相等?其中

8、若用L c或珀5編碼答:( 1)令 史平均數(shù)特性之。耳一 C=辦T一 一侃 b 仙S平均數(shù)特性之。用第二種編碼方式編碼結(jié)果,兩式不再相等。1.9有一個樣本:加,設(shè)B為其中任意一個數(shù)值。證明只有當=y詼一%小。這是平均數(shù)的一個重要特性,在后面講到一元線型回歸時還會用到該特性。答:令F厶V W,為求使p達最小之B,令鈿1.10檢測菌肥的功效,在施有菌肥的土壤中種植小麥,成苗后測量苗高,共100株,數(shù)據(jù)如下:10.09.37.29.18.58.010.510.69.610.17.06.79.57.810.57.98.19.67.69.410.07.57.25.07.38.77.16.15.26.81

9、0.09.97.54.57.67.09.76.28.06.98.38.610.04.84.97.08.38.47.87.56.610.06.59.58.511.09.76.610.05.06.58.08.48.37.47.48.17.77.57.17.87.68.66.07.06.46.76.36.411.010.57.85.08.07.07.45.26.79.08.64.66.93.56.29.76.45.86.49.36.4編制苗高的頻數(shù)分布表,繪制頻數(shù)分布圖,并計算出該樣本的四個特征數(shù)。答:首先建立一個外部數(shù)據(jù)文件,名稱和路徑為:E:dataexr1-10e.dat。SAS 程序及結(jié)果如

10、下:op ti ons no date;proc format;value hfmt3.5- 4.4=3.5-4.4 4.5-5.4=4.5-5.4 5.5-6.4=5.5-6.46.5- 7.4=6.5-7.4 7.5-8.4=7.5-8.4 8.5-9.4=8.5-9.49.5- 10.4=9.5-10.4 10.5-11.4=10.5-11.4;run;data wheat;in file E:dataexr1-10e.dat; input height ;run;proc freq;table height;format height hfmt.;run;|proc Cap abili

11、ty grap hics noprint; var height; |histogram/vscale=co unt;in set mean var skew ness kurtosis; run;The SAS SystemThe FREQ P rocedureCumulative Cumulative height Freque ncy P erce nt Freque ncy P erce nt3.5- 4.4 1 1.00 1 1.004.5- 5.4 9 9.00 10 10.005.5- 6.4 11 11.00 21 21.006.5- 7.4 23 23.00 44 44.00

12、7.5- 8.4 24 24.00 68 68.008.5- 9.4 11 11.00 79 79.009.5- 10.4 15 15.00 94 94.0010.5- 11.4 6 6.00 100 100.001.11北太平洋寬吻海豚羥丁酸脫氫酶(HDBH )數(shù)據(jù)的接收范圍頻數(shù)表 如下:(略作調(diào)整)頻數(shù)HDBH數(shù)據(jù)的接收范圍-1/(U - L ) 214245.909 13277.818 211309.727 319341.636 426373.545 522405.454 511437.363 613469.272 76501.181 83533.090 92根據(jù)上表中的數(shù)據(jù)作出直方圖。

13、答:以表中第一列所給出的數(shù)值為組界,直方圖如下:1.12靈長類手掌和腳掌可以握物一側(cè)的皮膚表面都有突起的皮膚紋嵴。紋嵴有許多特征,這些特征在胚胎形成之后是終生不變的。人類手指尖的紋型,大致可以分為弓、箕和斗三種類型。在手指 第一節(jié)的基部可以找到一個點,從該點紋嵴向三個方向輻射,這個點稱為三叉點。弓形紋沒有三叉點, 箕形紋有一個三叉點,斗形紋有兩個三叉點,記錄從三叉點到箕或斗中心的紋嵴數(shù)目稱為紋嵴數(shù)(fin ger ridge count, FRC)。將雙手十個指尖的全部箕形紋的紋嵴數(shù)和/或斗形紋兩個紋嵴數(shù)中較大者 相加,稱為總紋嵴數(shù)(total fin ger ridge cou nt, TF

14、RC )。下表給出了大理白族人群總紋嵴數(shù)的頻數(shù)分布3.TFRC分組中值頻數(shù)113020231504015170608719080299111010054111130120631311501406815117016051171190180181912102006首先判斷數(shù)據(jù)的類型,然后繪出樣本頻數(shù)分布圖,計算樣本的四個特征數(shù)并描述樣本分布形態(tài)。答:總紋脊數(shù)屬計數(shù)數(shù)據(jù)。計數(shù)數(shù)據(jù)的頻數(shù)分布圖為柱狀圖,頻數(shù)分布圖如下:樣本特征數(shù)(以 TFRC的中值計算)SAS程序:op ti ons no date;data tfrc;do i=1 to 10; input y ; inp ut n ;do j=1

15、to n;out put;en d;en d;cards;20 240 1 60 880 29100 54 120 63140 68160 51180 18 200 6 run;proc means mean std skew ness kurtosis; var y;run;結(jié)果見下表:The SAS SystemAn alysis Variable : YMea n Std Dev Skew ness Kurtosis126.5333333 32.8366112 -0.2056527 -0.0325058140的那一組。分布不對從頻數(shù)分布圖可以看出,該分布的眾數(shù)在第七組,即總紋脊數(shù)的中值為

16、稱,平均數(shù)略小于眾數(shù),有些負偏。偏斜度為-0.2056527,偏斜的程度不是很明顯,基本上還可以認 為是對稱的,峭度幾乎為零。1.13海南粗榧葉長度的頻數(shù)分布:葉長度/mm中值頻數(shù)2.02.22.13902.22.42.31 4342.42.62.52 6432.62.82.73 5462.83.02.95 6923.03.23.15 1873.23.43.34 3333.43.63.52 7673.63.83.71 6773.84.03.91 137nag4.04.24.16674.24.44.33464.44.64.5181繪出頻數(shù)分布圖,并計算偏斜度和峭度。答:表中第一列所給出的數(shù)值為組

17、限,下圖為海南粗榧葉長度的頻數(shù)分布圖。計算偏斜度和峭度的 SAS程序和計算結(jié)果如下:op ti ons no date;data len gth;do i=1 to 13; input y ; inp ut n ;do j=1 to n;out put;end;end;cards;2.1 3902.3 14342.5 2643 2.7 3546 2.9 56923.1 51873.3 43333.5 2767 3.7 1677 3.9 11374.1 6674.3 3464.5 181 run;proc mea ns n skew ness kurtosis;var y;run;The SAS

18、 SystemAn alysis Variable : Y n Skew ness Kurtosis30000 0.4106458 0.0587006樣本含量n= 30000,是一個很大的樣本,樣本的偏斜度和峭度都已經(jīng)很可靠了。偏斜度為0.41,有一個明顯的正偏。1.14馬邊河貝氏高原鰍繁殖群體體重分布如下體質(zhì)量/g中值雌魚雄魚2.003.002.50143.004.003.50674.005.004.5013115.006.005.5030256.007.006.5025257.008.007.5016238.009.008.5021179.0010.009.50181610.0011.00

19、10.5012411.0012.0011.50312.0013.0012.5025.峭度并比較兩者的變異程度。答:魚的體重為度量數(shù)據(jù),表中第一列所給出的數(shù)值為組限。在下面的分布圖中雌魚和雄魚的分布繪在了同一張圖上,以不同的顏色表示。計算統(tǒng)計量的SAS程序與前面的例題類似,這里不再給出,只給出結(jié)果。雌魚:The SAS SystemAn alysis Variable : YN Mea n Std Dev Skew ness Kurtosis147 7.2414966 2.1456820 0.2318337 -0.6758677雄魚:The SAS SystemAn alysis Variabl

20、e : YN Mea n Std Dev Skew ness Kurtosis132 6.7803030 1.9233971 -0.1322816 -0.5510332直觀地看,雄魚的平均體重低于雌魚。雌魚有一正偏,雄魚有一負偏。因此,相對來說雌魚低體重者 較多,雄魚高體重者較多。但兩者都有很明顯的負峭度,說明“曲線”較平坦,兩尾翹得較高。1.15黃胸鼠體重的頻數(shù)分布 :頻數(shù)組界/g0yw 151015yw 302630yw 453045yw 602260yw 752275yw 901790yw 10516105yw 12140120w 1356135w 1504150w 1652總數(shù)169繪制頻數(shù)分布圖,從圖形上看分布是對稱的嗎,說明什么問題?答:下面是頻數(shù)分布圖:從上圖可見,圖形不是對稱的,有一些正偏。說明在該黃雄鼠群體中,低體重者分布數(shù)量,高于高體 重者的數(shù)量。另外,似乎峭度也有些低。1.16 25名患者入院后最初的白細胞數(shù)量(X103)如下表:871053141211441451168771211966565計算白細胞數(shù)量的平均數(shù)、方差和標準差。答:用means過程計算,程序不再給出,只給出運行結(jié)果。The SAS SystemAn alysis

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負責。
  • 6. 下載文件中如有侵權(quán)或不適當內(nèi)容,請與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

評論

0/150

提交評論