




版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進行舉報或認領(lǐng)
文檔簡介
次數(shù)分布和統(tǒng)計特征數(shù)FrequencyDistributionandStatisticalIndex
正確地進行資料的分類是資料整理的前提。在調(diào)查或試驗中,由觀察、測量所得的數(shù)據(jù)按其性質(zhì)的不同,一般可以分為數(shù)量性狀資料和質(zhì)量性狀資料兩大類。
一、數(shù)量性狀資料第一節(jié)資料的分類
數(shù)量性狀(quantitativecharacter)是指能夠以測量或計數(shù)的方式表示其特征的性狀。觀察測定數(shù)量性狀而獲得的數(shù)據(jù)就是數(shù)量性狀資料(dataofquantitativecharacteristics)。數(shù)量性狀資料的獲得有測量和計數(shù)兩種方式,因而數(shù)量性狀資料又分為計量資料和計數(shù)資料兩種。
(一)計量資料指用測量方式獲得的數(shù)量性狀資料,即用度、量、衡等計量工具直接測定獲得的數(shù)量性狀資料。這種資料的各個觀測值不一定是整數(shù),兩個相鄰的整數(shù)間可以有帶小數(shù)的任何數(shù)值出現(xiàn),其小數(shù)位數(shù)的多少由度量工具的精度而定,它們之間的變異是連續(xù)性的。因此,計量資料也稱為連續(xù)性變異資料。
(二)計數(shù)資料指用計數(shù)方式獲得的數(shù)量性狀資料。在這類資料中,它的各個觀察值只能以整數(shù)表示,在兩個相鄰整數(shù)間不得有任何帶小數(shù)的數(shù)值出現(xiàn)。這些觀察值只能以整數(shù)來表示,各觀察值是不連續(xù)的,因此該類資料也稱為不連續(xù)性變異資料或間斷性變異資料。
二、質(zhì)量性狀資料
質(zhì)量性狀(qualitativecharacter)是指能觀察到而不能直接測量的性狀,如顏色、性別、生死等。這類性狀本身不能直接用數(shù)值表示,要獲得這類性狀的數(shù)據(jù)資料,須對其觀察結(jié)果作數(shù)量化處理,其方法有以下兩種:
(一)統(tǒng)計次數(shù)法
在一定的總體或樣本中,根據(jù)某一質(zhì)量性狀的類別統(tǒng)計其次數(shù),以次數(shù)作為質(zhì)量性狀的數(shù)據(jù)。例如1.調(diào)查早豐番茄的裂果情況;2.100株南瓜上雌花與雄花的比率。表2-1100株南瓜上雌花與雄花的比率性別次數(shù)(f)頻率(%)雌花2819.6雄花11580.4合計143100.0
這種由質(zhì)量性狀數(shù)量化得來的資料又叫
次數(shù)資料。
(二)評分法
對某一質(zhì)量性狀,因其類別不同,分別給予評分。例如,調(diào)查紅富士蘋果的著色情況,將依據(jù)蘋果果面的著色面積分別給予1
5分的評分,以便統(tǒng)計分析。
色澤分級代表值207個果實中各級果數(shù)全紅104514>2/3紅2134361/3~2/3紅322397<1/3紅431253全綠54017例如,紅富士蘋果果色調(diào)查資料:第二節(jié)資料的整理
一、資料的檢查與核對
檢查和核對原始資料的目的在于確保原始資料的完整性和正確性。
所謂完整性是指原始資料無遺缺或重復(fù)。
所謂正確性是指原始資料的測量和記載無差錯或未進行不合理的歸并。檢查中要特別注意特大、特小和異常數(shù)據(jù)(可結(jié)合專業(yè)知識作出判斷)。對于有重復(fù)、異常或遺漏的資料,應(yīng)予以刪除或補齊;對有錯誤、相互矛盾的資料應(yīng)進行更正,必要時進行復(fù)查或重新試驗。
二、資料的整理方法
當觀測值不多(n≤30)時,不必分組,直接進行統(tǒng)計分析。當觀測值較多(n>30)時,宜將觀測值分成若干組,以便統(tǒng)計分析。將觀測值分組后,制成次數(shù)分布表,即可看到資料的集中和變異情況。
(一)計數(shù)資料的整理
現(xiàn)以100株黃瓜單株結(jié)瓜數(shù)為例,說明計數(shù)資料的整理。
表2-2100株黃瓜單株結(jié)瓜數(shù)1815171916152018191717181716182019171618171817161820191716181716171918181717171818151618181817201918171915171717161718181719191719171816181717191616171717161716181918181919201516191817182019171817171615161817181617191917黃瓜單株結(jié)瓜數(shù)在15-20個范圍內(nèi)變動,有6個不同的觀察值。用各個不同觀察值進行分組,共分為6組,可得表2-3形式的次數(shù)分布表。表2-3100株黃瓜單株結(jié)瓜數(shù)的次數(shù)分布表每株瓜數(shù)劃記號數(shù)次數(shù)(f)15正一616正正正1517正正正正正正T3218正正正正2519正正正T1720正5合計100
有些計數(shù)資料,觀察值較多,變異范圍較大,若以每一觀察值為一組,則組數(shù)太多,而每組內(nèi)包含的觀察值太少,資料的規(guī)律性顯示不出來。對于這樣的資料,可擴大為以幾個相鄰觀察值為一組,適當減少組數(shù),這樣資料的規(guī)律性就較明顯,對資料進一步計算分析也比較方便。例2:200個甘藍單株一級分枝的結(jié)莢數(shù)次數(shù)分布表每株莢數(shù)(X)次數(shù)(f)26-30131-35336-401041-452145-503251-554156-603861-652566-701671-75876-80381-852c.i=5,n=200
(二)計量資料的整理
計量資料在分組前需要確定全距、組數(shù)、組距、組中值及組限,然后將全部觀測值歸組。步驟:數(shù)據(jù)排序(sort)求極差(range)確定組數(shù)和組距確定組限和組中點值(組值)原始資料的各個觀察值歸組實例:今測得100株湘菊梨的單株產(chǎn)量如表2-4,其次數(shù)分布表的制作方法如下:1.排序
1、求全距
全距是資料中最大值與最小值之差,又稱為極差(range),用R表示,即R=max{xi}-min{xi}
本例:R=73.7-47.9=25.8(kg)
2、確定組數(shù)
組數(shù)的多少視樣本含量及資料的變動范圍大小而定,一般以達到既簡化資料又不影響反映資料的規(guī)律性為原則。組數(shù)要適當,不宜過多,亦不宜過少。分組越多所求得的統(tǒng)計量越精確,但增大了運算量;若分組過少,資料的規(guī)律性就反映不出來,計算出的統(tǒng)計量的精確性也較差。一般組數(shù)的確定,可參考表2-5。表2-5樣本容量大小與組數(shù)的關(guān)系樣本內(nèi)觀察值的個數(shù)分組時的組數(shù)505-101008-1620010-2030012-2450015-30100020-40本例中,n=100,根據(jù)表2-5,初步確定組數(shù)為9組。3、確定組距
每組最大值與最小值之差稱為組距,記為i。分組時要求各組的組距相等。組距的計算公式為:為了便于計算,組距一般取整數(shù)。組距(i)=全距(R)/組數(shù)
本例R=25.8,分為9組,故組距:(i)=25.8/9=2.9≈3.0(kg)
4、確定組限及組中值
各組的最大值與最小值稱為組限。最小值稱為下限,最大值稱為上限。每一組的中點值稱為組中值,它是該組的代表值。組中值與組限、組距的關(guān)系如下:組中值=(組下限+組上限)/2=組下限+1/2組距=組上限-1/2組距。由于相鄰兩組的組中值間的距離等于組距,所以當?shù)谝唤M的組中值確定以后,加上組距就是第二組的組中值,第二組的組中值加上組距就是第三組的組中值,其余類推。
組距確定后,首先要選定第一組的組中值。在分組時為了避免第一組中觀察值過多,一般第一組的組中值以接近或等于資料中的最小值為好。第一組組中值確定后,該組組限即可確定,其余各組的組中值和組限也可相繼確定。注意,最末一組的上限應(yīng)大于資料中的最大值。
表2-4中,最小值為47.9,第一組的組中值取48.5,因組距已確定為3.0,所以第一組的下限為:
48.5-(1/2)×3.0=47.0;第一組的上限也就是第二組的下限為:
47.0+3.0=50.0;第二組的上限也就是第三組的下限為:
50.0+3.0=53.0,……,以此類推,一直到某一組的上限大于資料中的最大值為止。于是可分組為:
47.0
50.0,50.0
53.0,……。
為了使恰好等于前一組上限和后一組下限的數(shù)據(jù)能確切歸組,約定將其歸入上一組。第一組記為47.01
50.0,第二組記為50.01
53.0,
……
5、歸組劃線計數(shù),作次數(shù)分布表
分組結(jié)束后,將資料中的每一觀測值逐一歸組,劃線計數(shù),然后制成次數(shù)分布表。
100株想湘菊梨單株產(chǎn)量的次數(shù)分布表
在歸組劃線時應(yīng)注意,不要重復(fù)或遺漏,歸組劃線后將各組的次數(shù)相加,結(jié)果應(yīng)與樣本含量相等,如不等,證明歸組劃線有誤,應(yīng)予糾正。
在分組后所得實際組數(shù),有時和最初確定的組數(shù)不同,如第一組下限和資料中的最小值相差較大或?qū)嶋H組距比計算的組距為小,則實際分組的組數(shù)將比原定組數(shù)多;反之則少。第三節(jié)常用統(tǒng)計表與統(tǒng)計圖
一、統(tǒng)計表
(一)統(tǒng)計表的結(jié)構(gòu)和要求
統(tǒng)計表由標題、橫標目、縱標目、線條、數(shù)字及合計構(gòu)成,其基本格式如下表:
表號標題編制統(tǒng)計表的總原則:結(jié)構(gòu)簡單,層次分明,內(nèi)容安排合理,重點突出,數(shù)據(jù)準確,便于理解和比較分析。具體要求如下:
1、標題
標題要簡明扼要、準確地說明表的內(nèi)容,有時須注明時間、地點。
2、標目
標目分橫標目和縱標目兩項。橫標目列在表的左側(cè),用以表示被說明事物的主要標志;縱標目列在表的上端,說明橫標目各統(tǒng)計指標內(nèi)容,并注明計算單位,如%、kg、cm等等。
3、數(shù)字
一律用阿拉伯數(shù)字,數(shù)字以小數(shù)點對齊,小數(shù)位數(shù)一致,無數(shù)字的用“─”表示,數(shù)字是“0”的,則填寫“0”。
4、線條
表的上下兩條邊線略粗,縱、橫標目間及合計用細線分開,表的左右邊線可省去,表的左上角一般不用斜線。
(二)統(tǒng)計表的種類
統(tǒng)計表可根據(jù)縱、橫標目是否有分組分為簡單表和復(fù)合表兩類。
1、簡單表
由一組橫標目和一組縱標目組成,縱橫標目都未分組。此類表適于簡單資料的統(tǒng)計,如表2-6。
表2-6100株南瓜上雌花與雄花的比率性別次數(shù)(f)頻率(%)雌花2819.6雄花11580.4合計143100.0
2、復(fù)合表
由兩組或兩組以上的橫標目與一組縱標目結(jié)合而成,或由一組橫標目與兩組或兩組以上的縱標目結(jié)合而成,或由兩組或兩組以上的橫、縱標目結(jié)合而成。此類表適用于復(fù)雜資料的統(tǒng)計,如表2-7。
二、統(tǒng)計圖
常用的統(tǒng)計圖有條形圖
(bardiagram)、餅圖(piediagram)、方柱形圖(histogram)和
多邊形圖(polygon)等。一般情況下,計數(shù)資料、質(zhì)量性狀資料常用條形圖、餅圖,計量資料采用方柱形圖和多邊形圖。
(一)統(tǒng)計圖繪制的基本要求
1、標題簡明扼要,列于圖的下方。
2、縱、橫兩軸應(yīng)有刻度,注明單位。
3、橫軸由左至右、縱軸由下而上,數(shù)值由小到大;圖形長寬比例約5:4或6:5。
4、圖中需用不同顏色或線條代表不同事物時,應(yīng)有圖例說明。
(二)常用統(tǒng)計圖及其繪制方法
1、條形圖
它用等寬長條的長短或高低表示按某一研究指標劃分屬性種類或等級的次數(shù)或頻率分布。如果只涉及一項指標,則采用單式長條圖;如果涉及兩個或兩個以上的指標,則采用復(fù)式長條圖。
在繪制長條圖時,應(yīng)注意以下幾點:(1)縱軸尺度從“0”開始,間隔相等,標明所表示指標的尺度及單位。(2)橫軸是長條圖的共同基線,應(yīng)標明各長條的內(nèi)容。長條的寬度要相等,間隔相同。間隔的寬度可與長條寬度相同或者是其一半。(3)在繪制復(fù)式長條圖時,將同一屬性種類、等級的兩個或兩個以上指標的長條繪制在一起,各長條所表示的指標用圖例說明,同一屬性種類、等級的各長條間不留間隔。圖2-2解凍溫度對禪寺丸花粉超低溫保存后活力的影響2、餅圖
用于表示計數(shù)資料、質(zhì)量性狀資料的構(gòu)成比。所謂構(gòu)成比,就是各類別、等級的觀測值個數(shù)(次數(shù))與觀測值總個數(shù)(樣本含量)的百分比。把園圖的全面積看成100%,按各類別、等級的構(gòu)成比將園面積分成若干分,以扇形面積的大小表分別表示各類別、等級的比例。
圖2-3世界柑桔產(chǎn)量情況
3、方柱形圖
對計量資料,可根據(jù)次數(shù)分布表作出直方圖以表示資料的分布情況。其作法是:在橫軸上標記組限,縱軸標記次數(shù)(f),在各組上作出其高等于次數(shù)的矩形,即得次數(shù)分布直方圖。
20151050圖2-4100株湘菊梨單株產(chǎn)量方柱形圖47.050.053.056.059.062.065.068.071.074.0
方柱形圖(histogram):適用于表示連續(xù)性變數(shù)的次數(shù)分布。4、多邊形圖
對于計量資料,還可根據(jù)次數(shù)分布表作出次數(shù)分布多邊形圖。其作法是:在橫軸上標記組中值,縱軸上標記次數(shù),以各組組中值為橫坐標,次數(shù)為縱坐標描點,用線段依次連接各點,即可得次數(shù)分布多邊形圖。圖2-5100株湘菊梨單株產(chǎn)量方柱形圖48.551.554.557.560.563.566.569.572.5
20151050·····
····次數(shù)f
適用于計量資料的次數(shù)分布圖,且在同一圖上可比較直觀地比較兩組以上資料。
平均數(shù)是統(tǒng)計學(xué)中最常用的統(tǒng)計量,用來表明資料中各觀測值相對集中較多的中心位置。平均數(shù)主要包括有:
算術(shù)平均數(shù)(arithmeticmean)幾何平均數(shù)(geometricmean)中位數(shù)(median)眾數(shù)(mode)第四節(jié)平均數(shù)
一、算術(shù)平均數(shù)
算術(shù)平均數(shù)是指資料中各觀測值的總和除以觀測值個數(shù)所得的商,簡稱平均數(shù)或均數(shù),記為。
算術(shù)平均數(shù)可根據(jù)樣本大小及分組情況而采用直接法或加權(quán)法計算。
(一)直接法
主要用于樣本含量n≤30以下、未經(jīng)分組資料平均數(shù)的計算。
設(shè)某一資料包含n個觀測值:
x1、x2、…、xn,則樣本平均數(shù)可通過下式計算:【例3.1】測得某果園的10株湘菊梨的單株產(chǎn)量(Kg/株)分別為57.3、67.2、52.8、59.1、56.4、49.7、73.7、61.2、55.5、53.9(kg),求其平均數(shù)。
由于Σx=57.3+67.2+52.8+59.1+56.4+49.7+73.7+61.2+55.5+53.9=587n=10即10株湘菊梨的平均單產(chǎn)為58.7kg。(二)加權(quán)法
對于樣本含量n≥30以上且已分組的資料,可以在次數(shù)分布表的基礎(chǔ)上采用加權(quán)法計算平均數(shù),計算公式為:x—組中值f—各組次數(shù)【例3.2】在100株湘菊梨次數(shù)分布表的基礎(chǔ)上,計算其平均單株產(chǎn)量。
由于Σx=48.5×3+51.5×6+54.5×10+57.5×18+60.5×21+63.5×17+66.5×14+69.5×7+72.5×4=6092n=100即100株湘菊梨的平均單產(chǎn)為60.9kg。若利用直接法計算Σx=
6101.4
加權(quán)法應(yīng)用于質(zhì)量性狀資料求平均數(shù)?!纠?.3】利用加權(quán)法調(diào)查某200棵果樹的平均受病害情況。病情分級一(<5%)二(5~25%)三(25~50%)四(50~75%)五(>75%)
各級株數(shù)f2030804030病情分級代表值
各級株數(shù)fx1x2x3一(<5%)15020二(5~25%)24130三(25~50%)33280四(50~75%)42340五(>75%)51430平均受害程度:平均數(shù)的基本性質(zhì):離均差的代數(shù)和等于零離均差的平方和最小二、幾何平均數(shù)
n個觀測值相乘之積開n次方所得的方根,稱為幾何平均數(shù),記為G。它主要應(yīng)用于園藝植物的生產(chǎn)動態(tài)分析和藥物效價的統(tǒng)計分析。如園藝植物的增長率,農(nóng)藥的效價等,用幾何平均數(shù)比用算術(shù)平均數(shù)更能代表其平均水平。其計算公式如下:
幾何平均數(shù)常用于求增長率這類資料的平均數(shù)。例:番茄遺傳試驗中從兩親本果重預(yù)測F1果重親本果重P1=10.36g,P2=0.45g實際測到的F1果重2.33克。第五節(jié)變異數(shù)極差方差標準差變異系數(shù)(一)、變異數(shù)的意義
用平均數(shù)作為樣本的代表,其代表性的強弱受樣本資料中各觀測值變異程度的影響。僅用平均數(shù)對一個資料的特征作統(tǒng)計描述是不全面的,還需引入一個表示資料中觀測值變異程度大小的統(tǒng)計量。1、全距(極差)是表示資料中各觀測值變異程度大小最簡便的統(tǒng)計量。當資料很多而又要迅速對資料的變異程度作出判斷時,可以利用全距這個統(tǒng)計量。極差大,平均數(shù)代表性差;相反,代表性較好。但極差只由兩個極端觀察值決定,不能精確表示資料的變異度。用其代表整個樣本的變異是有缺陷的。
為了準確地表示樣本內(nèi)各個觀測值的變異程度,人們首先會考慮到以平均數(shù)為標準,求出各個觀測值與平均數(shù)的離差,(),稱為離均差。
雖然離均差能表示一個觀測值偏離平均數(shù)的性質(zhì)和程度,但因為離均差有正、有負,離均差之和為零,因而不能用來表示資料中所有觀測值的總偏離程度。二、方差和標準差
為了解決離均差有正、有負,離均差之和為零的問題,可以采用離均差平方的辦法來解決。先將各個離均差平方,即()2
,再求
離均差平方和,即,簡稱平方和,記為SS;由于離差平方和常隨樣本大小而改變,為了消除樣本大小的影響,用平方和除以樣本大小,即,求出離均差平方和的平均數(shù);
為了使所得的統(tǒng)計量是相應(yīng)總體參數(shù)的無偏估計量,統(tǒng)計學(xué)證明,在求離均差平方和的平均數(shù)時,分母不用樣本含量n,而用自由度
n-1,于是,我們采用統(tǒng)計量表示樣本的變異程度。
溫馨提示
- 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
- 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
- 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
- 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負責(zé)。
- 6. 下載文件中如有侵權(quán)或不適當內(nèi)容,請與我們聯(lián)系,我們立即糾正。
- 7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔(dān)用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。
最新文檔
- 電商平臺用戶體驗設(shè)計行業(yè)深度調(diào)研及發(fā)展項目商業(yè)計劃書
- 汽車租賃保險理賠合同范本
- 拆遷安置房交易合同及附屬設(shè)施使用權(quán)限協(xié)議
- 茶館茶具租賃及茶葉原料供應(yīng)綜合服務(wù)合同
- 跨區(qū)域危險品車輛運輸安全責(zé)任協(xié)議
- 草場租賃與草原資源可持續(xù)利用合同
- 產(chǎn)業(yè)園區(qū)廠房物業(yè)管理與設(shè)施更新服務(wù)合同
- 展覽館場地租賃合同終止及展會服務(wù)協(xié)議書
- 財務(wù)數(shù)據(jù)保密及第三方審計協(xié)議
- 無人機測繪信息保密及數(shù)據(jù)處理合同范本
- 【MOOC】創(chuàng)業(yè)管理-江蘇大學(xué) 中國大學(xué)慕課MOOC答案
- 《中國的科技成就》課件
- 【MOOC】電工學(xué)-西北工業(yè)大學(xué) 中國大學(xué)慕課MOOC答案
- 房地產(chǎn)公司突發(fā)事件應(yīng)急預(yù)案
- 稿件模板-中國管理科學(xué)
- 深邃的世界:西方繪畫中的科學(xué)學(xué)習(xí)通超星期末考試答案章節(jié)答案2024年
- 練習(xí)題:利潤表的編制習(xí)題及答案
- DB35T 1989-2021 醫(yī)療消毒供應(yīng)服務(wù)規(guī)范
- 高速公路工程投標文件施工組織設(shè)計(技術(shù)標)
- DB11T 1846-2021 施工現(xiàn)場裝配式路面技術(shù)規(guī)程
- 上海市幼兒園幼小銜接活動指導(dǎo)意見(修訂稿)
評論
0/150
提交評論