數(shù)理統(tǒng)計方差與標準差_第1頁
數(shù)理統(tǒng)計方差與標準差_第2頁
數(shù)理統(tǒng)計方差與標準差_第3頁
數(shù)理統(tǒng)計方差與標準差_第4頁
數(shù)理統(tǒng)計方差與標準差_第5頁
已閱讀5頁,還剩7頁未讀, 繼續(xù)免費閱讀

下載本文檔

版權說明:本文檔由用戶提供并上傳,收益歸屬內容提供方,若內容存在侵權,請進行舉報或認領

文檔簡介

1、心理和教育方面的實驗或調查所得到的數(shù)據(jù),大都具有隨機變量的性質。而對這些隨機變量的描述,僅有前一章所講集中趨勢的度量是不夠的。集中量數(shù)只描述數(shù)據(jù)的集中趨勢和典型情況,它還不能說明一組數(shù)據(jù)的全貌。數(shù)據(jù)除典型情況之外,還有變異性的特點。對于數(shù)據(jù)變異性即離中趨勢進行度量的一組統(tǒng)計量,稱作差異量數(shù),這些差異量數(shù)有標準差或方差,全距,平均差,四分差及各種百分差等等。第一節(jié)    方差與標準差      方差(Variance)也稱變異數(shù)、均方。作為統(tǒng)計量,常用符號S2表示,作為總體參數(shù),常用符號2表示。它是每個數(shù)據(jù)

2、與該組數(shù)據(jù)平均數(shù)之差乘方后的均值,即離均差平方后的平均數(shù)。方差,在數(shù)理統(tǒng)計中又常稱之為二階中心矩或二級動差。它是度量數(shù)據(jù)分散程度的一個很重要的統(tǒng)計特征數(shù)。標準差(Standard deviation)即方差的平方根,常用S或SD表示。若用表示,則是指總體的標準差,本章只討論對一組數(shù)據(jù)的描述,尚未涉及總體問題,故本章方差的符號用S2,標準差的符號用S。符號不同,其含義不完全一樣,這一點望讀者能夠給予充分的注意。一、方差與標準差的計算(一)未分組的數(shù)據(jù)求方差與標準差基本公式是: (3l a) (31b)表31說明公式31a與31b的計算步驟表31 未分組的數(shù)據(jù)求方差與標準差Xi XiXx x2(X

3、iX)2 Xi2 6 5 7 4 6 8 0 -1 l -2 0 2 0 l 1 4 0 4 36 25 49 16 36 64 N6 Xi36 x0 x210 Xi2226   應用31公式的具體步驟:先求平均數(shù)X36/66;計算Xi -X;求(Xi - X)2即離均差x2;將各離均差的平方求和 (x2);代入公式31a與31b求方差與標準差。具體結果如下: S2=10/6=1.67 (二)已分組的數(shù)據(jù)求標準差與方差數(shù)據(jù)分組后,便以次數(shù)分布表的形式出現(xiàn),這時原始數(shù)據(jù)不見了,若計算方差與標準差可用下式: (33a) (33b)式中d(Xc - AM) / i,AM為估計平均數(shù)Xc為各

4、分組區(qū)間的組中值f為各組區(qū)間的次數(shù)N=f 為總次數(shù)或各組次數(shù)和i為組距。下面以表18數(shù)據(jù)為例,說明分組數(shù)據(jù)求方差與標準差的步驟:表32 次數(shù)分布表求方差與標準差   分組區(qū)間 Xc f d fd fd2 計 算 96- 93- 90- 87- 84- 81- 78- 75- 72- 69- 66- 63- 60- 97 94 91 88 85 82 79 76 73 70 67 64 61 2 3 4 8 11 17 19 14 10 7 3 l 1 6 5 4 3 2 1 0 1 2 3 4 5 6 12 15 16 24 22 17 0 14 20 21 12 5 6 72 75

5、 64 72 44 17 0 14 40 63 48 25 36   S2=32* (570/100 -(28/100)2)=50.5944   S7113     i=3   f100   fd=28 fd2=570       具體步驟: 設估計平均數(shù)AM,任選一區(qū)間的Xc充任; 求d 用f乘d,并計算fd; 用d與fd相乘得fd2,并求fd2; 代入公式計算。二、方差與標準差的意義 方差與標準差是表示一組數(shù)據(jù)離散程度的最好的指標。其值越大,說明離散程度大,其值小說明數(shù)據(jù)比較集中,它是統(tǒng)計描

6、述與統(tǒng)計分析中最常應用的差異量數(shù)。它基本具備一個良好的差異量數(shù)應具備的條件:反應靈敏,每個數(shù)據(jù)取值的變化,方差或標準差都隨之變化;有一定的計算公式嚴密確定;容易計算;適合代數(shù)運算;受抽樣變動的影響小,即不同樣本的標準差或方差比較穩(wěn)定;簡單明了,這一點與其他差異量數(shù)比較稍有不足,但其意義還是較明白的。除上述之外,方差還具有可加性特點,它是對一組數(shù)據(jù)中造成各種變異的總和的測量,能利用其可加性分解并確定出屬于不同來源的變異性(如組間、組內等)并可進一步說明每種變異對總結果的影響,是以后統(tǒng)計推論部分常用的統(tǒng)計特征數(shù)。在描述統(tǒng)計部分,只需要標準差就足以表明一組數(shù)據(jù)的離中趨勢了。標準差比其他各種差異量數(shù)具

7、有數(shù)學上的優(yōu)越性,特別是當已知一組數(shù)據(jù)的平均數(shù)與標準差后,便可知占一定百分比的數(shù)據(jù)落在平均數(shù)上下各兩個標準差,或三個標準差之內。對于任何一個數(shù)據(jù)集合,至少有1一1/h2的數(shù)據(jù)落在平均數(shù)的h(大于1的實數(shù))個標準差之內。(切比雪夫定理)。例如某組數(shù)據(jù)的平均數(shù)為50,標準差是5,則至少有75(1一1/22)的數(shù)據(jù)落在50-2*5至50+2*5即40至60之間,至少有889(1一1/32)的數(shù)據(jù)落在50-3*5至50+3*53565之間 (h=2,1-1/h2=1-1/22=3/4=75%,h=3, -1/h2=1-1/32=8/9=88.9%)。如果數(shù)據(jù)是呈正態(tài)分布,則數(shù)據(jù)將以更大的百分數(shù)落在平均

8、數(shù)上下兩個標準差之內(95)或三個標準差之內 (99.)。三、由各小組的標準差求總標準差 由于方差具有可加性特點,在已知幾個小組的方差或標準差的情況下,可以計算出幾個小組聯(lián)合在一起的總的方差或標準差。這種計算常在科研協(xié)作中應用,例如先了解各班學生情況,再了解全年級情況;或先了解各年級情況,再了解全??偟那闆r。但這種方差或標準差的合成,只有在應用同一種觀測手段,測量的是同一個特質,只是樣本不同時,才能應用。計算總方差或總標準差的公式如下; (34a) (34b) 式中 為總方差 為總標準差 N1Nn為各小組數(shù)據(jù)個數(shù) 為總平均數(shù) 為各小組的平均數(shù)四、標準差的應用 (一)差異系數(shù)(Coefficie

9、nt of variation)當所觀測的樣本水平比較接近,而且是對同一個特質使用同一種測量工具進行測量時,要比較不同樣本之間離散程度的大小,一般可直接比較標準差或方差的大小-標準差的值大說明該組數(shù)據(jù)較分散,若標準差小,則說明該組數(shù)據(jù)較集中。標準差的單位與原數(shù)據(jù)的單位相同,因而有時稱它為絕對差異量。在對不同樣本的觀測結果的離散程度進行比較時,常會遇到下述情況:兩個或多個樣本所測的特質不同,即所使用的觀測工具不同,如何比較其離散程度?即使使用的是同+種觀測工具,但樣本的水平相差較大時,如何比較它們的離散程度?在第一種情況下,標準差的單位不同,顯然不能直接比較標準差的大小。第二種情況雖然標準差的單

10、位相同,但兩樣本的水平不同,這可從平均數(shù)的大小明顯不同確定。通常情況下,平均數(shù)的值較大,其標準差的值一般也較大,平均數(shù)的值較小,其標準差的值也較小。這種情況下,若直接比較標準差取值的大小,借以比較不同樣本的分散情況是無意義的??梢?,上述兩種情況下,若用絕對差異量進行直接比較以確定其分散程度的大小是不行的,這時可用相對差異量進行比較。最常用的相對差異量就是差異系數(shù)。差異系數(shù),又稱變異系數(shù)、相對標準差等,通常用符號CV表示,其計算如下,CV=S / M * 100 (35) 式中S為某樣本的標準差M為該樣本的平均數(shù)。差異系數(shù)在心理與教育研究中常用于:同一團體不同觀測值離散程度的比較,對于水平相差較

11、大,但進行的是同一種觀測的各種團體,進行觀測值離散程度的比較。例2 已知某小學一年級學生的平均體重為25公斤,體重的標準差是3.7公斤,平均身高110厘米,標準差為6.2厘米,問體重與身高的離散程度哪個大?解: CV體重3.7 / 25 * 10014.8 CV身高6.2 / 110 * 1005.64通過比較差異系數(shù)可知,體重的分散程度比身高的分散程度大(14.8>5.64)。例3 通過同一個測驗,一年級(7歲)學生的平均分數(shù)為60分,標準差為4.02分,五年級(14歲)學生的平均分數(shù)為 80分,標準差為6.04分,問這兩個年級的測驗分數(shù)中哪一個分散程度大?解: CV一年級4.02 /

12、 60 * 100= 6.7 CV五年級6.04 /80 * 100= 7.55答;五年級的測驗分數(shù)分散程度大。在應用差異系數(shù)比較相對差異大小時,一般應注意測量的數(shù)據(jù)要保證具有等距的尺度,這時計算的平均數(shù)和標準差才有意義,應用差異系數(shù)進行比較也才有意義。另外,觀測工具應具備絕對零,這時應用差異系數(shù)去比較分散程度效果才更好。因此,差異系數(shù)常用于重量、長度、時間,編制得好的測驗量表范圍內。第三,差異系數(shù)只能用于一般的相對差異量的描述上,至今尚無有效的假設檢驗方法,因此對差異系數(shù)不能進行統(tǒng)計推論。(二)標準分數(shù)(standard score)標準分數(shù)又稱基分數(shù)或z分數(shù),是以標準差為單位表示一個分數(shù)在

13、團體中所處位置的相對位置量數(shù)。1計算公式; Z = (X )/ S (36)式中X代表原始數(shù)據(jù),X為一組數(shù)據(jù)的平均數(shù),S為標準差。從公式36可以明了,Z分數(shù)的意義,它是一個數(shù)與平均數(shù)之差除以標準差所得的商數(shù),它無實際單位。如果了個數(shù)小于平均數(shù),其值為負數(shù),如果一個數(shù)的值大于平均數(shù),其值為正數(shù),如果一個數(shù)的值等于平均數(shù),其值為零??梢奪分數(shù)可以表明原數(shù)目在該組數(shù)據(jù)分布中的位置,故稱為相對位置量數(shù)。例4 某班平均成績?yōu)?0分,標準差為3分,甲生得942分,乙生得891分,求甲乙'學生的Z分數(shù)各是多少?解:根據(jù)公式36Z甲=(94.290) / 3 = 1.4Z乙=(89.190) / 3

14、= -0.3Z分數(shù)表示其原分數(shù)在以平均數(shù)為中心時的相對位置,這比使用平均數(shù)和原分數(shù)表達了更多的信息。 2Z分數(shù)的性質 在一組數(shù)據(jù)中所有由原分數(shù)轉換得出的z分數(shù)之和為零,其Z分數(shù)的平均數(shù)亦為零。一組數(shù)據(jù)中各z分數(shù)的標準差為1。3Z分數(shù)的應用Z分數(shù)可用于比較分屬性質不同的觀測值在各自數(shù)據(jù)分布中相對位置的高低。因為z分數(shù)可以表明各原數(shù)目在該組數(shù)據(jù)分布中的相對位置,它無實際單位。這樣不同觀測值的比較便可進行。這里所說的數(shù)據(jù)分布中相對位置包括兩個意思,一個是表示某原數(shù)目以平均數(shù)為中心以標準差為單位所處距離的遠近與方向;另一個意思是表示某原數(shù)目在該組數(shù)據(jù)分布中的位置,即在該數(shù)目以下或以上的數(shù)據(jù)各有多少,如

15、果在一個正態(tài)分布(或至少是一個對稱分布)中,這兩個意思可合二為一。但在一個偏態(tài)分布中,這兩個意思就不能統(tǒng)一。這一點在應用z分數(shù)時要特別注意。例如有一人的身高是170厘米,體重是65公斤(也可以是另一人的體重),究竟身高還是體重在各自的分布中較高?這是屬于兩種不同質的觀測,不能直接比較。但若我們知道各自數(shù)據(jù)分布的平均數(shù)與標準差,這樣我們可分別求出z分數(shù)進行比較。設Z身高1.700.5,Z體重65=1.2,則可得出該人的體重離平均數(shù)的距離要比身高離平均數(shù)的距離遠,即該人在某團體中身高稍偏高,而體重更偏重些。如果該團體,身高與體重的次數(shù)分布為正態(tài),我們還可更確切地知道該人的身高與體重在次數(shù)分布的相對

16、位置是多少,從而進行更確切(或更數(shù)量化)的比較。 、當已知各不同質的觀測值的次數(shù)分布為正態(tài)時,可用z分數(shù)求不同的觀測值的總和或平均值,以示在團體中的相對位置。在算術平均數(shù)一節(jié)中講到,在計算平均數(shù)時,要求數(shù)據(jù)必須同質,否則會使平均數(shù)沒有意義,但有時需要將不同質的數(shù)據(jù)合成,這時可采用Z分數(shù)。例如已知高考的各科成績分布是正態(tài)分布,但是由于各科的難易度不同,因此,各科成績就屬于不同質的數(shù)據(jù)。以前常采取總和分數(shù)或求平均分數(shù)的方法,這是不科學的。如果應用Z分數(shù)求總和或平均數(shù)則更有意義。類似這種情況有期末成績總和等。舉例如下表3-3 利用Z分數(shù)求總和  科目 原始分數(shù) 甲 乙 全體考生 平均數(shù) 標

17、準差 Z分數(shù) 甲 乙 語文 政治 外語 數(shù)學 理化 85 89 70 62 68 72 53 40 72 87 70 lO 65 5 69 8 50 6 75 8 1.500 1.900 1.000 -0.600 0.125 0.375 0.500 -1.667 0.315 1.500 總計 348 350   2.500 1.505 假設二例是高等學校入學考試兩名考生甲與乙的成績分數(shù)。如果按總分錄取則取乙生,若按標準分數(shù)錄取則應取甲生;為何會出現(xiàn)如此懸殊的差別?這是由于不恰當?shù)赜嬎憧偤头謹?shù)造成的,因為各科成績難易度不同,分散程度也不同;:各門學科的成績分數(shù)是不等價的,亦即數(shù)據(jù)是不同

18、質的,這時應用總和分數(shù)不夠科學,故此出現(xiàn)這類問題,科學的方法應當用Z分數(shù)合成。從Z分數(shù)可知甲生多數(shù)成績是在平均數(shù)以上,即使有兩種成績低于平均數(shù),差別也小??傊煽冚^穩(wěn)定且在分布較高處,而乙生則不然。可見應用Z分數(shù)更趨合理。表示標準測驗分數(shù) 經(jīng)過標準化的心理與教育測驗,如果其常模分數(shù)分布接近正態(tài)分布,常常轉換成正態(tài)標準分數(shù)。轉換公式為 Z= aZ + b (37)式中Z為正態(tài)標準分數(shù),Z(X )/,a、b為常數(shù),為測驗常模的標準差。例如早期的智力測驗所測的智力指標為智商(IQ) 這種表示智力的方法有一定局限性,因為人到成年以后智力不再隨年齡而增長,到了老年甚至智力有衰退。要用上面的公式表示,則不好。因此,韋克斯勒(DWechsler)制定新的智力量表時則用離差智商的概念表示一個人在同齡團體中的相對智力。 IQ=15Z+100(WAIS)韋氏成人智力量表,其中Z = (X )/ S ,X為原分數(shù), 為某團體(或年齡組)的平均數(shù),S為該年齡組的標準差。離差智商的常數(shù)100與15實際為總平均數(shù)與

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內容里面會有圖紙預覽,若沒有圖紙預覽就沒有圖紙。
  • 4. 未經(jīng)權益所有人同意不得將文件中的內容挪作商業(yè)或盈利用途。
  • 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內容的表現(xiàn)方式做保護處理,對用戶上傳分享的文檔內容本身不做任何修改或編輯,并不能對任何下載內容負責。
  • 6. 下載文件中如有侵權或不適當內容,請與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

評論

0/150

提交評論