




版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進行舉報或認領(lǐng)
文檔簡介
教育統(tǒng)計學(xué)數(shù)據(jù)的統(tǒng)計描述與數(shù)據(jù)的表示學(xué)部本科科生課課程北京師范大學(xué)教育學(xué)部胡詠梅第一節(jié)描述統(tǒng)計的原理第二節(jié)數(shù)據(jù)的表示第三節(jié)描述統(tǒng)計的SPSS操作contents31.一班、二班學(xué)生數(shù)學(xué)(英語、物理)
平均成績分別是多少?2.一班、二班學(xué)生數(shù)學(xué)成績最高分分
別是多少?3.哪個班學(xué)生數(shù)學(xué)成績更整齊(或更
分散)?4.從兩個班成績來看,這次數(shù)學(xué)考試
是偏難還是偏易?5.從兩個班學(xué)生數(shù)學(xué)、物理成績來看,
是否數(shù)學(xué)成績高的學(xué)生,其物理成績
也高?概括描述數(shù)值數(shù)據(jù)一個變量的問題:解釋數(shù)值數(shù)據(jù)的特征
l
集中趨勢l
變異程度(或離散程度)l
分布形狀兩個以上變量的問題:l
相關(guān)分析第一節(jié)
描述統(tǒng)計的原理4數(shù)值數(shù)據(jù)的特征標準差半四分位距峰度中位數(shù)分布形狀集中量數(shù)差異量數(shù)方差眾數(shù)全距偏態(tài)平均數(shù)s1.概念:描述統(tǒng)計是通過圖表或統(tǒng)計量對數(shù)據(jù)進行整理、分析,以對數(shù)據(jù)
分布形態(tài)、數(shù)字特征和隨機變量之間關(guān)系進行估計和描述的方法。它包括
集中趨勢分析、離散趨勢分析和相關(guān)分析三部分。2.特點:以簡單明了的統(tǒng)計量或統(tǒng)計圖表來描述龐大的數(shù)據(jù)。一、描述統(tǒng)計集中量數(shù)是描述數(shù)據(jù)集中趨勢的統(tǒng)計量。(一)平均數(shù)(二)中位數(shù)(三)眾數(shù)二、集中量數(shù)
1.概念:平均數(shù)是取某一變量的所有數(shù)值的總和除以數(shù)據(jù)個數(shù)所得到的值。又稱算術(shù)平均數(shù)。2.
公式:
總體平均數(shù)為
μ
,
數(shù)據(jù)個數(shù)為N;
樣本平均數(shù)為
X,數(shù)據(jù)個數(shù)為n;Xi
表示第
i個數(shù)據(jù);n表示數(shù)據(jù)的數(shù)量;Σ
是累加求和符號,即
Xi
=
X1
+
X2
+
X
3
+
…
+
X
ni
=
1
(一)平均數(shù)(Mean)
(二)中位數(shù)(Median)
1.概念:中位數(shù)是指按數(shù)值的大小順序排列在一起的一組數(shù)據(jù)中居于中間位置的數(shù)。2.
求法(1)將所有數(shù)據(jù)按大小順序排序。n+
1(2)如果數(shù)據(jù)的個數(shù)為奇數(shù),中數(shù)為位于這列數(shù)據(jù)第2
位置上的數(shù)。如果數(shù)據(jù)的個數(shù)為偶數(shù),中數(shù)為位于這列數(shù)據(jù)第
位置和第
+
1
位置上的兩
個數(shù)值的平均數(shù)。3.例子:
3,6,
8,
9,
12,
15,
16;3,6,
8,
9,
12,
151.概念:眾數(shù)是指一組數(shù)據(jù)中出現(xiàn)次數(shù)最多的那個數(shù)值。2.
例子:50,55,
60,
60,
60,
65,
66,
70,
903.注意:一組數(shù)據(jù)可能沒有眾數(shù)或有多個眾數(shù)。
(三)眾數(shù)(Mode)
101.定類變量:眾數(shù)口沒有單位、沒有順序口例:9個學(xué)生的居住地:3,2,
1,
1,
1,
1,3,2,
21為北京,2為上海,3為廣州2.定序變量:中位數(shù)、眾數(shù)口無單位,有順序口例:
9個學(xué)生的年級:3,3,2,2,
2,
1,
1,
1,
1口例:9個學(xué)生的成績排名:
1,2,2,4,5,5,7,8,9(四)集中量數(shù)的使用時機3.定距/定比變量:平均數(shù)、中位數(shù)、眾數(shù)口有單位,有順序口例:數(shù)學(xué)成績:78,56,89,58,67,97,85,83,97口例:量表得分:5,5,
4,
4,
3,
2,
2,
2,
1(四)集中量數(shù)的使用時機測量層次集中量數(shù)眾數(shù)中位數(shù)平均數(shù)定類變量√定序變量√√定距/定比變量√√√優(yōu)點不受極端值的影響,
計算方法簡便。對數(shù)值變化不敏感,
較少受極端值影響,
計算方法較為簡便。測量最為精確,考慮到每一個樣本,具有代表性。缺點測量過于粗糙,無法反映所有樣本
的狀況。無法反映所有樣本
的狀況。易受極端值的影響。
(五)集中量數(shù)的測量特性與優(yōu)缺點假如某班1小組期末考試數(shù)學(xué)成績?yōu)?83
,52
,96
,79
,83
,88
,64
,79
,83
,69試用平均數(shù)、中位數(shù)、眾數(shù)分別描述數(shù)學(xué)成績的集中趨勢。練習(xí)一
10=
77
.683
+
52
+
96
+
79
+
83
+
88
+
64
+
79
+
83
+
691.
平均數(shù)題解1s=位置位置
+
1=6中位數(shù)
原數(shù)據(jù):83排序數(shù)據(jù):
52排序位置:
183795888362.
中位數(shù)(Median)798387979496693699610648375264283889題解3.
眾數(shù)原數(shù)據(jù):83
52
96
79
83
88
64
79
83
69排序數(shù)據(jù):
52
64
69
79
79
83
83
83
88
96排序位置:12
3
45
6
7
8
910題解
題解差異量數(shù)是描述數(shù)據(jù)離散趨勢的統(tǒng)計量。(一)全距(二)半四分位距(三)標準差和方差三、差異量數(shù)1.概念:全距是一組數(shù)據(jù)中最大值與最小值之差。
R=
Xmax
-Xmin2.全距反映了數(shù)據(jù)波動的最大范圍。3.不考慮數(shù)據(jù)如何分布,取決于數(shù)據(jù)的極端值。4.
注意:全距越大,說明觀察值分布越分散,反之就越集中。(一)全距(Range)
1.
百分位數(shù)(Percentile)指以一定順序排列的一組觀測值中某個百分位置所對應(yīng)的數(shù)值。百分位數(shù)用Pp表示,作為下標的p表示百分位置。例:P80表示第80百分位數(shù),P80=
60分在一組觀測值中,小于這個數(shù)值的觀測值個數(shù)占80%
,大于它的占20%。
(二)半四分位距(Semi-interquartilerange)20第i個四分位數(shù)的位置:Qi
=
Q1是第一四分位數(shù)
(P25)
,是處于(n+1)/4位置上的觀測值,即25%的觀測值比Q1
小。Q2是第二四分位數(shù)(P50
)
,中位數(shù),處于2(n+1)/4=(n+1)/2的位置上,即50%的觀測值比
Q2
小。Q3是第三四分位數(shù)(P75)
,處于3(n+1)/4
的位置上,即75%的觀測值比Q3
小。25%
25%
25%
25%是將一組已排序的數(shù)據(jù)按個數(shù)四等分的百分位數(shù)。分別是位于25%
、50%
、75%的百2.
四分位數(shù)(Quartile)Q1
Q2
Q3分位數(shù)。3.
四分位距(IQR
,又稱四分差)指排序數(shù)據(jù)處于中間50%數(shù)據(jù)的全距。公式:為第三和第一四分位之差I(lǐng)QR=
Q3–Q14.半四分位距(SIQR
,又稱絕對中位差)是四分位距的一半。
半四分位距越大,代表分數(shù)的離散程度越大。1.標準差:刻畫數(shù)據(jù)到平均數(shù)的平均距離的一種統(tǒng)計量。2.方差:標準差的平方??跇藴什钍亲畛S煤妥钪匾淖儺愋詼y量???/p>
表示全部觀測值相對于平均數(shù)的平均變異程度。(三)標準差(StandardDeviation)和方差(Variance)3.公式推導(dǎo)目標:測量到平均數(shù)的標準距離步驟1:求每個數(shù)到平均數(shù)的距離(離差)數(shù)據(jù)的離差
=X
-μ例:對于一個μ
=50的樣本分布,如果X=53
,
離差=53
-
50=
3如果X=45
,
離差=45–50=-5離差:符號(+或
-)與數(shù)字步驟2:求離差的平均數(shù)(將離差相加,再除以N)
例:下面這組N=4的數(shù)據(jù),和是∑X=
12,平均數(shù)是
μ
=12/4=3,對于每個數(shù)據(jù),離差為X8
1
3
0X-μ
+5-20-3∑(X-μ)=
0注意:離差總和為零。因此無法測量離散程度。2s然后:用這個平方值計算平均離差平方,稱為方差??傮w方差
=
平均離差平方=
方差是離差的平方的平均數(shù)。注意:距離的平方的平均數(shù)不是對離散程度的最好描述。
步驟4:標準差為方差的平方根。標準差步驟3:去掉符號(+和-)
去掉符號的標準方法:將每個數(shù)據(jù)的離差平方?!页銎椒胶蟮木嚯x
的平均數(shù)(方差)找出距離(每
個數(shù)值與平均
數(shù)之間的距離)如果計算所有
距離的平均數(shù),
總會得到零標準差:距離平
均數(shù)的標準距離計算方差的平方根將每個距離平方
離差平方和
=(X1
-
X)2
+
(X2
-
X)2
+
…+
(X3
-
X)2n
-
1總體方差公式
樣本方差公式
()(
)()
1X
X
X
X
X
Xn一
+
一
+
+
一=一總體標準差公式:標準差為方差的平方根樣本標準差公式22223…1測量層次離散量數(shù)全距四分位距標準差/方差定類變量定序變量√√定距/定比變量√√√優(yōu)點計算方法簡便,適用于大部分測量尺度。對極端值較不敏
感,能表現(xiàn)定序變量
的變異情形。測量最為精確,考慮到每一個樣
本,具有代表性。缺點測量過于粗糙,無法反映所有樣本狀況,
易受極端值的影響。穩(wěn)健性較好,不
過無法反映所有
樣本的變異狀況。當樣本量較小時,
易受極端值的影
響。(四)變異量數(shù)的測量特性與優(yōu)缺點30假如某班1小組期末考試數(shù)學(xué)成績?yōu)?83
,52
,96
,79
,83
,88
,64
,79
,83
,69試用全距、四分位距、方差、標準差分別描述數(shù)學(xué)成績的離散程度。練習(xí)二題解
1.全距和四分位距原始數(shù)據(jù):835296
79
83
88
64
79
83
69排序數(shù)據(jù):526469
79
79
83
83
83
88
96排序位置
12
3
4
5
6
7
8
9
10o
全距
=X最大
-X最小=96-52=44o
Q1
的位置
(n+1)/4=2.75≈3
,Q1
=69o
Q3
的位置
3(n+1)/4=8.25≈
8
,Q3
=83o
四分位距
=Q3
-Q1
=83-69
=
14S
=
i
1
,
其中
77
.6i(2X)21-nXS2
=
(83-
77.6)2
+
(52-
77.6)2
+…(69-
77.6)2
=
160.210-12.樣本方差(Sample
Variance)原數(shù)據(jù):835296
79
83
88
64
79
83
69題解
··160
.2
=
12
.73.樣本標準差(Sample
Standard
Deviation)題解一、統(tǒng)計表和統(tǒng)計圖的一般說明二、數(shù)據(jù)表示中的錯誤第二節(jié)
數(shù)據(jù)的表示35(一)統(tǒng)計表1.統(tǒng)計表的結(jié)構(gòu)及其
編制的原則和要求2.統(tǒng)計表的種類(二)統(tǒng)計圖1.統(tǒng)計圖的結(jié)構(gòu)及其繪
制規(guī)則2.統(tǒng)計圖的主要種類一、統(tǒng)計表和統(tǒng)計圖的一般說明數(shù)學(xué)語文英語1班8488952班9089923班8693874班9690891.統(tǒng)計表的結(jié)構(gòu)及其編制的原則和要求標題,表號,標目,線條,數(shù)字,表注(一)統(tǒng)計表
例:
表4.
1四年級各班各科學(xué)期平均成績注:4班是實驗班。年份19981999200020012002總和錄取人數(shù)132154144123125678簡單表,組合表,復(fù)合表(1)簡單表舉例:只按一個標志分組。標志是年份表4.2
元培中學(xué)各年的高考錄取人數(shù)2.統(tǒng)計表的種類優(yōu)良中及格差總和1班8251520502班9201531483班515227352總和226052124150
(2)組合表舉例:按二個標志分組表4.3
元培中學(xué)五年級的體育達標結(jié)果按班級和
成績分組1班
2班
3班優(yōu)
良
中
及格
差男
女
男
女
男
女
男
女
男
女
(3)復(fù)合表舉例:按三個標志分組表4.4
元培中學(xué)五年級的體育達標結(jié)果按班級,成績,
和性別分組5048521501310629108102857122412109316521324390145223701120022班級總和總和例:成
績
等
級人數(shù)圖4.1
四年級數(shù)學(xué)考試成績1.統(tǒng)計圖的結(jié)構(gòu)及其繪制規(guī)則標題,圖號,標目,圖形,圖注(二)統(tǒng)計圖
2.統(tǒng)計圖的主要種類圖4.2四年級數(shù)學(xué)考試成績(1)條形圖2.統(tǒng)計圖的主要種類圖4.3
四年級數(shù)學(xué)考試成績(2)柱形圖(3)圓形圖(餅圖)2.統(tǒng)計圖的主要種類圖4.4四年級數(shù)學(xué)考試成績2.統(tǒng)計圖的主要種類圖4.s
元培學(xué)校高考入學(xué)率的變化(4)折線圖4s2.統(tǒng)計圖的主要種類(5)散點圖(加趨勢線)圖4.7
文化課學(xué)習(xí)成績與體育成績的關(guān)系(6)復(fù)式條形圖——按兩個標志分組2.統(tǒng)計圖的主要種類圖4.8四年級數(shù)學(xué)考試成績應(yīng)用普遍程度統(tǒng)計:o
圓形圖(5%)o
條形圖(25%)o
柱狀圖和線形圖(50%)o
散點圖(10%)o
其它(10%)選擇圖的形式選擇合適的統(tǒng)計圖
示例:各高校4種科研合作類型的科研質(zhì)量對比圖(篇均被引次數(shù)作為科研質(zhì)量指標)o
以上是各高校4種科研合作類型的科研質(zhì)量對比圖(篇均被引次數(shù)作為科研質(zhì)量指標),第一個圖是雷達圖,優(yōu)點是不同合作類型直接比較得
很清楚,缺點是具體到每個高校的數(shù)據(jù)不清晰;第二個圖是做的簇狀條
形圖,4種合作類型的條形圖均從起點開始,缺點是對比條形太多,不
易看清是哪類合作;第三個圖是堆積條形圖,就是4個合作類型的篇均
被引次數(shù)放在一個直條圖上(此圖相對最合適),優(yōu)點是簡潔,可以看
清四類合作篇均被引次數(shù)的相對差異。選擇合適的統(tǒng)計圖1.使用花哨(Junk)圖表2.數(shù)據(jù)比較時沒有可靠的相對基準3.壓縮或擴大縱軸4.縱軸上無零點二、數(shù)據(jù)表示中的錯誤在報紙、雜志上的圖表里通常都會加上花哨的圖標和符號以增加吸引力,這種做法常常會掩蓋或曲解數(shù)據(jù)應(yīng)傳遞的準確信息。
最低小時工資(wage)
1960:
$1.00
1970:
$1.60
1980:
$3.101.花哨圖表(ChartJunk)最低小時工資
$1960
1970
1980
19904201990:
$3.8053某校2000-2003年初中升高中的比例百分比某校2000-2003年初中升高中人數(shù)2.無相對基準30%20%
10%
0%300200100000年
01年
02年
03年00年
01年
02年
03年人數(shù)通常百分比之間較為可比,而絕對數(shù)之間比較卻可能產(chǎn)生誤解。實例:比較各校畢業(yè)班的升學(xué)情況,應(yīng)當采用升入高一級學(xué)校的百分比,
而不是升入高一級學(xué)校的學(xué)生總數(shù)。相對基準(RelativeBasis)季度銷售
季度銷售$
$50
25
0
1季
2季
3季
4季
1季
2季
3季
4季3.壓縮縱軸20010003.擴大縱軸(單元刻度值過?。?023-3-52023-3-5合理的縱軸刻度月銷售量$一
三
五
七
九
十一4.縱軸無零點一
三
五
七
九
十一454239366040200月銷售量$一、單選題的統(tǒng)計分析二、復(fù)選題的統(tǒng)計分析三、排序題的統(tǒng)計分析四、量表題的統(tǒng)計分析第三節(jié)
描述統(tǒng)計的SPSS操作(一)頻數(shù)分析(二)輸出描述性統(tǒng)計量(三)列聯(lián)表分析一、單選題的統(tǒng)計分析62
數(shù)據(jù)文件4-1.sav為某小學(xué)五年級學(xué)生語文成績等級得分
1為“>=90”分,2為“80-90”分,3為“70-79”分,4為“60-69”分,5為
“<=59”分。
假如我們統(tǒng)計語文成績五個等級各組的人數(shù)和比例,并以柱狀圖和餅
圖來表示。(一)頻數(shù)分析
(1)打開數(shù)據(jù)文件:4-1.sav(2)單擊Analyze—Descriptive
Statistics—Frequencies(3)將“語文成績等級”變量選入Variable(s)列表框中(4)勾選左下角“Display
frequency
tables”64(一)頻數(shù)分析
(5)輸出結(jié)果
66(6)使用Excel作圖:柱狀圖和餅圖
a.
SPSS輸出結(jié)果復(fù)制到Excel中6768b.
選中變量列和有效百分比列,單擊“插入”
,選中“柱形圖”。a.將SPSS輸出結(jié)果復(fù)制到Excel中b.選中變量列和有效百分比列,單擊插入,選中圖形(6)使用Excel作圖:柱狀圖和餅圖
69l
保留兩位小數(shù)點l
帶有百分號c.
其他要求:70制作圓餅圖71721.研究問題:求出樣本觀測量在數(shù)學(xué)、英語測驗成績的描述性統(tǒng)計量。2.數(shù)據(jù):4-1.sav(二)輸出描述性統(tǒng)計量
(1)打開數(shù)據(jù)文件:4-1.sav(2)單擊Analyze—Descriptive
Statistics—Descriptives(3)將“數(shù)學(xué)”和“英語”變量選入Variable(s)列表框(4)單擊Options
,選中相應(yīng)選項7s(5)SPSS輸出結(jié)果
78l
單擊Statistics
,選中相應(yīng)選項l
單擊Analyze—Descriptive
Statistics—Frequenciesl
將“數(shù)學(xué)”和“英語”變量選入Variable(s)列表框中方式二:
79l
SPSS輸出結(jié)果1.研究問題:輸出班級變量與性別變量的列聯(lián)表,并用柱狀圖表示(三)列聯(lián)表分析
2.數(shù)據(jù):4-1.sav(2)單擊Analyze—Descriptive
Statistics—Crosstabs(3)將“班級”選入Row(s)
,將“性別”選入Column(s)(4)單擊Cells
,選中
Row,Column,Total等選項(1)打開數(shù)據(jù)文件4-1.sav
81(5)SPSS輸出結(jié)果
8a.將SPSS輸出結(jié)果復(fù)制到Excel中b.建立數(shù)據(jù)表格,選中行、列變量類別及數(shù)據(jù),單擊插入-三維柱形圖。(6)使用Excel作圖:柱狀圖或條形圖84c.點擊圖形網(wǎng)格線,點擊右鍵,再單擊“刪除”
,去掉網(wǎng)格線。8s6d.
單擊柱形,點右鍵,單擊“添加數(shù)據(jù)標簽”。8788e.
單擊左上角菜單欄中的“切換行列”。(6)使用Excel作圖:柱狀圖或條形圖
練習(xí)一遍剛才的演示l求出班級變量與性別變量的列聯(lián)表,并用柱狀圖表示。l
要求:數(shù)字保留2位小數(shù)點,帶有百分號%練習(xí)三二、復(fù)選題的描述統(tǒng)計
(一)頻數(shù)分析(二)列聯(lián)表分析91
數(shù)據(jù)文件4-2.sav中涉及一題:“您未來選擇孩子就讀的中學(xué)時,會考慮哪
些因素?”
該題可復(fù)選,共四個選項:學(xué)校辦學(xué)口碑、校長領(lǐng)導(dǎo)風(fēng)格、學(xué)校升學(xué)率、
交通因素。
a1m1表示選項“學(xué)校辦學(xué)口碑”
,a2m2表示選項“校長領(lǐng)導(dǎo)風(fēng)格”,a3m3
表示選項“學(xué)校升學(xué)率”
,a4m4表示選項“交通因素”
,以上四個變量均
為二分變量,1表示選中,0表示未選中。
統(tǒng)計各選項勾選的次數(shù)及百分比,并用柱狀圖表示(一)頻數(shù)分析
o
(1)讀取數(shù)據(jù)文件4-2.sav;o
(2)按Analyze—Multiple
Response—Define
Variable
Sets
…順序逐一單
擊鼠標鍵,打開Define
Multiple
Response
Sets主對話框o
(3)
將所有選項變量選入變量集中編計數(shù)輸入命新
a1
。點擊Add
,增加生成新的虛擬變量$a93單擊Analyze—Multiple
Response—Frequencies復(fù)選題的頻數(shù)分析使用Excel作圖:柱狀圖或條形圖
a.將SPSS輸出結(jié)果復(fù)制到Excel中b.建立數(shù)據(jù)表格,單擊插入,選中圖形96c.選中百分比數(shù)據(jù)列,點擊菜單欄右上角的“排序和
篩選”
,選中“升序”
,并選中“擴展選定區(qū)域”
97c.
選項排序練習(xí)一遍剛才的演示l求全體樣本在復(fù)選題一“您未來選擇孩子就讀的中學(xué)時,會考慮哪些因
素?”各選項勾選的次數(shù)及百分比,并用柱狀圖排序表示。l
要求:數(shù)字保留2位小數(shù)點,不帶有百分號。練習(xí)四
數(shù)據(jù)文件4-2.sav
統(tǒng)計不同年齡父母樣本在題項“您未來選擇孩子就讀的中學(xué)時,會考慮
哪些因素?”各選項勾選的個數(shù)、百分比情況,并用條形圖表示。(二)列聯(lián)表分析(1)單擊Analyze—Multiple
Response—Crosstabs(2)將需要分析的變量age選入行變量欄,并定義取值范圍。由于age變量
為三分變量,1表示“35歲以下”
,2表示“36-44歲”
,2表示“45歲以
上”,因此定義取值范圍最大值為3
,最小值為1。101
單擊Options
,打開設(shè)置
103結(jié)果報表
104a.將SPSS輸出結(jié)果復(fù)制到Excel中b.建立數(shù)據(jù)表格,單擊插入,選中圖形使用Excel作圖:柱狀圖或條形圖105三、排序題的描述統(tǒng)計
“對于子女小學(xué)高年級的學(xué)習(xí)科目,您重視的重要性次序為何?
(請按不滿意程度
排序,1-最重視的學(xué)科,2-次重視的學(xué)科,3-第三重視的學(xué)科,4-第四重視的學(xué)科,
5-最不重視的學(xué)科)
”。
在數(shù)據(jù)文件4-2.sav中,a2m1為“語文”變量,a2m2為“數(shù)學(xué)”變量,a2m3為“英
語”變量,a2m4為“
自然”變量,a2m5為“社會”變量,它們均為分類變量,1
表示最重視的學(xué)科,2表示次重視的學(xué)科,3表示第三重視的學(xué)科,4表示第四重視
的學(xué)科,5表示最不重視的學(xué)科。
了解全體樣本“對于子女小學(xué)高年級的學(xué)習(xí)科目重視的重要性次序”情況并用柱
狀圖表示。(1)打開數(shù)據(jù)文件:4-2.sav(2)單擊Analyze—Descriptive
Statistics—Descriptives(3)將科目變量選入Variable(s)列表框中(4)單擊Options
,選中均值、標準差等描述性統(tǒng)計量107SPSS輸出結(jié)果
使用Excel作圖:柱狀圖或條形圖
a.將SPSS輸出結(jié)果復(fù)制到Excel中b.建立數(shù)據(jù)表格,單擊插入,選中圖形練習(xí)一遍剛才的演示l了解全體樣本對于題項二“對于子女小學(xué)高年級的學(xué)習(xí)科目”
,重視
的重要性次序,并用條形圖表示。l
要求:數(shù)字保留2位小數(shù)點,并排序練習(xí)五110(一)量表層面的加總(二)量表層面單題平均分(三)量表的描述統(tǒng)計四、量表題的描述統(tǒng)計n
數(shù)據(jù)文件4-3.savn該數(shù)據(jù)反映教師工作滿意度水平,將“教師工作滿意度”分為對領(lǐng)導(dǎo)
與管理的滿意度、對學(xué)校發(fā)展環(huán)境的滿意度、對付出-回報合理性的滿
意度、對自我實現(xiàn)的滿意度和對人際關(guān)系滿意度五個維度。n
“對領(lǐng)導(dǎo)與管理的滿意度”維度包含b1至b5變量5個題項,現(xiàn)對該維度
進行加總。(一)量表層面的加總
(1)打開數(shù)據(jù)文件:4-3.sav(2)單擊Transform—ComputeVariable(3)在Compute
Variable對話框中輸入加總變量名稱(factor1)及計算公
式(sum
b1to
b5或b1+b2+b3+b4+b5)。113n
數(shù)據(jù)文件:4-3.savn
對“對領(lǐng)導(dǎo)與管理的滿意度”維度計算單題平均分。(1)單擊Transform—ComputeVariable;(2)在Compute
Variable對話框中輸入單題平均分變量名稱(ave1)及計
算公式(factor1/5)(二)量表層面的單題平均分
o
若我們要對量表“對領(lǐng)導(dǎo)與管理的滿意度”維度進行描述統(tǒng)計即對新生成
的維度總分(factor1)和維度的單題平均分(ave1)進行描述,需要進行
如下操作:o
(1)讀取數(shù)據(jù)文件4-3.sav;o
(2)單擊Analyze—Descriptive
Statistics—Descriptives;o
(3)將新變量選入Variable(s)列表框中。(三)量表的描述統(tǒng)計116SPSS輸出結(jié)果
作業(yè)及練習(xí)
1.假如某班學(xué)生體育測試成績?nèi)缦拢?3,50,87,79,83,88,65,79,83
。試用平均數(shù)、中位數(shù)、眾數(shù)分別描述數(shù)學(xué)成績的集中趨勢,用全距、四分位距、方差、標準差分別描述數(shù)學(xué)成績的離散程度。2.利用SPSS軟件,將下列兩種數(shù)據(jù)分別制成頻數(shù)分布表,并繪制條形圖,給出它們的四分位數(shù)的
值,對它們的成績分布情況進行比較。甲班學(xué)生的數(shù)學(xué)成績:60,63,96,52,59,45,32,82,68,68,62,70,76,91,72,86,77,69,88,86,95,71,75,72,57,75,84,90,53,40,47,87,97,71,75,82,87,64,74,81乙班學(xué)生的數(shù)學(xué)成績:48,61,78,39,40,60,72,65,43,76,52,50,54,55,64,99,67,63,74,67,75,85,78,96,66,44,88,82,58,95,67,77,89,56,73,62,88,63,50,913.使用數(shù)據(jù)文件“exe4-1.sav”
,給出教師性別變量與年齡變量的列聯(lián)表,并用柱形圖表示(要求:數(shù)字保留2位小數(shù)點,帶有百分號“%”)。4.使用數(shù)據(jù)文件“exe4-1.sav”
,“教師學(xué)校認同感”維度包含a1至a6共6個題
項,求出“教師學(xué)校認同感”維度總分和單題平均分,并進行描述統(tǒng)計分析。作業(yè)及練習(xí)概率與概率分布學(xué)部本科科生課課程教育統(tǒng)計學(xué)
北京師范大學(xué)教育學(xué)部胡詠梅隨機現(xiàn)象與隨機事件概率的兩種定義(統(tǒng)計、古典)概率的性質(zhì)概率的加法、乘法定理事件的概率計算隨機變量及其概率分布二項分布及其計算正態(tài)分布及其性質(zhì)正態(tài)分布表的使用正態(tài)分布在考試成績中的應(yīng)用37contents什么是隨機現(xiàn)象?在一定條件下,事先可以斷言必然會發(fā)生某種結(jié)果的現(xiàn)象,叫做確定性
現(xiàn)象。確定性現(xiàn)象又分兩種情況:一是在一定條件下必然會發(fā)生的現(xiàn)象,簡稱
必然現(xiàn)象。二是在一定條件下必然不會發(fā)生的現(xiàn)象,簡稱為不可能現(xiàn)象。
在一定條件下,事先不能斷言會出現(xiàn)哪種結(jié)果的現(xiàn)象,叫做隨機現(xiàn)象。1.隨機現(xiàn)象與隨機事件什么是隨機試驗?對隨機現(xiàn)象的一次觀察叫做一次隨機試驗。隨機試驗反映了隨機現(xiàn)象的兩
個顯著特點:(1)一次試驗之前,不能預(yù)言發(fā)生哪一種結(jié)果,這說明隨機現(xiàn)象具有偶
然性。(2)在相同條件下,進行“大數(shù)次”的重復(fù)試驗,試驗結(jié)果會呈現(xiàn)某些
統(tǒng)計規(guī)律,這說明隨機現(xiàn)象具有規(guī)律性。1.隨機現(xiàn)象與隨機事件什么是隨機事件?o
隨機試驗的各種可能的結(jié)果,我們稱為隨機事件,簡稱事件。o
“正面朝上”是一個事件A,
“反面朝上”是另一個事件B。1.隨機現(xiàn)象與隨機事件頻率o
設(shè)在N次重復(fù)試驗中事件A發(fā)生的次數(shù)為n
,則稱n/N為事件A發(fā)生的頻率,
記作FN(A)。o2.概率的定義
(5.1)次數(shù)n與頻率
FN事
件試
驗
次
數(shù)頻率所逼
近的定值1000020000300004000050000正面向上249460.49890.5000反面向上250540.50110.5000n487599221494119934FN0.48750.49610.49800.498451251007815059200660.51250.50390.50200.5016表
1拋硬幣的大數(shù)次試驗所呈現(xiàn)的頻率向定值逼近的情況nFN概率o
將隨機事件A發(fā)生的可能性大小稱作隨機事件A發(fā)生的概率,記作P(A)。o
概率的統(tǒng)計定義o
概率的古典定義
2.概率的定義
o
概率的統(tǒng)計定義與頻率是密切相關(guān)的,若隨機試驗滿足以下條件:①
每次試驗中某一事件發(fā)生的可能性不變;②
試驗?zāi)艽罅恐貜?fù),且每次試驗相互獨立。o
此時,事件A發(fā)生的概率就是事件A發(fā)生的頻率的穩(wěn)定值。2.概率的統(tǒng)計定義定義1在N次重復(fù)試驗中,當N無限增大時,事件A發(fā)生的頻率n/N穩(wěn)定在一個確定的常數(shù)附近,我們就用這個常數(shù)來表示事件A發(fā)生的概率,記
作P(A)。
(5.2)例:A表示事件“隨機拋扔質(zhì)地均勻的硬幣,出現(xiàn)正面朝上”
,則:P(A)=0.50002.概率的統(tǒng)計定義
概率的古典定義要求隨機試驗滿足以下兩個條件:①每次試驗中所可能出現(xiàn)的結(jié)果的個數(shù)是有限的。這些結(jié)果叫作基本事
件。②每次試驗中每個基本事件的出現(xiàn)是等可能的,即每個基本事件出現(xiàn)的
可能性是相等的。2.概率的古典定義定義2
若某項試驗的所有可能結(jié)果只有有限個,設(shè)共有n個,并且這些結(jié)果的出現(xiàn)具有等可能性。如果這些結(jié)果中的m個出現(xiàn)將導(dǎo)致事件A發(fā)生,
則事件A的概率為:
(5.3)n2.概率的古典定義例如,拋硬幣這個隨機試驗,其基本事件只有兩個:A=“正面朝上”,
B=“反面朝上”
,而且這兩個事件出現(xiàn)的可能性相等,所以拋硬幣時出
現(xiàn)事件A的概率為:1
2.概率的古典定義學(xué)生從三道題中任選兩題有三種可能的結(jié)果:第一題和第二題;第一題和第三題;第二題和第三題。所以,基本事件數(shù)n=3。如果用A表示事件“恰好抽到第一題和第二題”
,則A只包含前述三個結(jié)果中的一個。因此,m=
1
。于是,事件A發(fā)生的概率為:P(A)=1/3。例5-1:某學(xué)生從教師準備好的三道試題中隨機抽出兩道題,問恰好抽到第一題和第二題的概率是多少?事件的概率計算
例5-2:在一個盒子中有10個球,分別標有1
、2
、
…
、10
,現(xiàn)在隨機地取出一個球,求此球的號碼為偶數(shù)的概率。解:用A表示“抽到偶數(shù)球
”這一事件?;臼录?shù)n為10
,事件A
包含的基本事件的個數(shù)m為5
(即抽到2
、4
、6
、8
、10號球)
,所以抽到
偶數(shù)球的概率為:P(A)
=
=
=
事件的概率計算以上兩種定義的概率都具有以下基本性質(zhì):①
非負性:
P(A)≥0。②正規(guī)性:
必然事件Ω發(fā)生的概率為:P(Ω)=1③
事件A的逆事件
A(即“A不發(fā)生”這一事件)發(fā)生的概率:
P(A)=
1-P(A)。3.概率的性質(zhì)例5-3:在五選一的單項選擇題中,每題有5個備選的答案,即n=5
,但只
有1個是正確答案,即m=
1
,如果一個答題者不具備答此題的知識,他完全憑隨機猜測,那么他回答正確的概率P(A),
回答錯誤(即逆事件A
)
的概率
=
1-P
事件的概率計算?
加法定理設(shè)A1
,A2
,
?
,
An
是n個互不相容的事件,即它們中任何兩個都不
可能同時發(fā)生。則“A1
,A2
,
?
,
An
中至少有一個發(fā)生”這個事件的概
率是這n個互不相容事件的概率之和,即:P(A1+A2
+
…+An)=P(A1)+P(A2)+
…+P(An)(5.4)其中A1
+A2
+
…+An表示“A1
,A2
,
?
,
An
中至少有一個發(fā)生”這一事
件。4.概率的加法和乘法定理例5-4:有一個盒中有紅色粉筆8支,藍色粉筆7支,白色粉筆5支,問任意摸得一支紅色或藍色粉筆的概率是多少?解:設(shè)摸出一支紅色粉筆的事件為A
,摸出一支藍色粉筆的事件為B
,
事件A和事件B是互不相容的。由于盒中共有20支粉筆,所以,
即任意摸得一支紅色或藍色粉筆的概率是
4
。事件的概率計算根據(jù)加法定理?
乘法定理設(shè)A1
,A2
,
?
,
An
是n個相互獨立的事件,即它們中任何一個事件是
否發(fā)生都不會影響其它事件的發(fā)生。則“n個相互獨立的事件同時發(fā)生”這一事件的概率是n個相互獨立事件的概率之積,即:P(A1A2…An)=P(A1)?P(A2)
…P(An)(5.5)其中A1A2…An
表示“n個相互獨立的事件同時發(fā)生”這一事件。4.概率的加法和乘法定理例5-5:某年級舉行數(shù)學(xué)競賽,其中有10道四選一的單項選擇題,若一考生全憑隨機猜測,則他將這10道題全猜對的概率有多大?解:設(shè)Ai表示“該生猜對第i題”這一事件,i=
1,2,
…
,
10
。顯然,這10
個事件相互獨立,且P(Ai
,i=
1,2,
…
,
10
。根據(jù)乘法定理,
即他將這10道題全猜對的概率是0.00000094
,這個概
率是相當小的,接近于0。事件的概率計算?
隨機變量表示隨機現(xiàn)象各種結(jié)果的變量稱為隨機變量,即隨機變量是隨機事件
的數(shù)量化表示。隨機變量每取一個數(shù)值,就表示一個隨機事件,變量取
不同的數(shù)值就表示不同的事件。例如,某班有男女生各若干名,如果從班上隨機抽取1人,則抽得學(xué)
生的性別是一個隨機現(xiàn)象(可將性別作為隨機變量)
,結(jié)果可能是男,
也可能是女。如果我們用1表示“男
”
,0表示“
女
”
,則這兩個事件
(
“抽得一名男生”和“抽得一名女生”
)便各有一個數(shù)值與之對應(yīng)。6.隨機變量及其概率分布o
隨機變量按其取值是否連續(xù),可以分為非連續(xù)型隨機變量和連續(xù)型隨機
變量。o
在非連續(xù)型隨機變量中,如果它的取值可以按照一定次序一一列舉出來,
則稱之為離散型隨機變量。例如,從10人中抽出2人參加數(shù)學(xué)競賽,抽取的結(jié)果按性別分共有三種
情況,如果用上述方法加以量化,即用0表示“抽到2個女生”
,用1表
示“抽到2個男生”
,用2表示“抽到1男1女”
,則變量可能取的值為0
、
1與2
,我們當然可以將它們一一列舉出來。因此,抽出2人的性別變量
是離散型變量。6.隨機變量及其概率分布對離散型隨機變量X
,當我們把它們可能取的每一個值xi
和與之對應(yīng)
的概率P(X=xi)=pi
列入表中,則我們就能夠全面地展示離散型隨機變量X
的概率分布,從而掌握它的取值規(guī)律。XPx1
x2
…
…
xi
…
…p1
p2
…
…
pi
…
…離散型隨機變量的概率分布連續(xù)型隨機變量可取的值是充滿整個取值區(qū)間的。因此,人們研究連續(xù)型隨機變量的概率分布時,所考察的都是它在一個個區(qū)間上的取值的
概率。連續(xù)型隨機變量在區(qū)間[x1,
x2]中取值的概率用P(x1≤X≤x2
)
表示,其分
布規(guī)律由密度函數(shù)f(x)
決定。
(5.6)連續(xù)型隨機變量及其概率分布
o
二項分布是一種離散型隨機變量的概率分布,在實際中有著廣泛的應(yīng)
用。它適用于n次獨立試驗即貝努里(Bernoulli)概型問題,貝努里概
型具有以下的特點:1)n次試驗是相互獨立的(所謂相互獨立是指各次
試驗的結(jié)果彼此間沒有什么影響)。2)每次試驗都是在相同的條件下進行,并且只有兩
個結(jié)果A和A:P(A)=p,P(A)=1-p=q。7.離散型變量的分布--二項分布如果用隨機變量X表示在n次獨立試驗中事件A發(fā)生的次數(shù),則有P(X
=
k)
=
C
pk
qn-k
(p>0,q=
1-p,k=0,
1,2,
…
,n)(5.7)稱X服從二項分布。7.離散型變量的分布--二項分布例5-6:有10道是非題,若一考生完全不懂,全憑猜測作答,問分別答對5道題、6道題的概率各為多少?至少猜對1道題的概率又是多少?解:把考生回答一道題看作一次試驗,則回答10道題是10次相互獨立的試驗,每次試驗只有兩個結(jié)果,記答對的概率為p
,答錯的概率為q
,則
p=q=
1/2。貝努里(Bernoulli)概型用隨機變量X表示10次試驗中答對的題數(shù),由公式(5.7)得:猜中5道題的概率為:
猜中6道題的概率為:
二項分布
至少猜中1道題的概率為:P(至少猜中1道題)=
1-P(10道題全答錯)=
1-P(X=0)=
1-
C
p
0
q
10=
1-
|((
,)|
=0.9990210100二項分布
可以證明,二項分布的均值、方差和標準差分別為:μ
=np
(5.8)σ
2
=npq
(5.9)
(5.
10)理論上可以證明,當n充分大時,二項分布近似于正態(tài)分布。二項分布的均值、方差和標準差?正態(tài)分布的特征正態(tài)分布的密度函數(shù):
(5.
11)其中μ和σ
2分別為正態(tài)分布的均值和方差。我們將該分布記作
X~N(μ,σ
2
)
。2當
μ
=0,
σ
2
=1時,分布密度為
。此時,我們稱隨機變量X
服從標準正態(tài)分布,記作X~N(0,
1)。8.正態(tài)分布及其性質(zhì)正態(tài)分布的密度曲線?
曲線呈鐘形,且位于x軸的上方。?以直線
x=μ為對稱軸,向左、右無限延伸,且以x軸為漸近線。即當
x→+∞
時,f(x)→0
,但曲線始終不與x軸相交。?
當
x
=
μ
時,曲線處于最高點,即當x=μ
時,f(μ)
=
為最大值;曲線呈現(xiàn)“
中間高,兩邊低”的形狀。正態(tài)分布的特征正態(tài)曲線與x軸之間的面積等于1
,而且曲線f(x)與兩直線x=x1
、x=x2
(
x1<x2
)
及x軸所圍成的面積等于隨機變量x落入?yún)^(qū)間(x1
,x2)的概率,即概
率P(x1
<x<x2)為圖中陰影部分的面積。正態(tài)分布的特征
正態(tài)分布N(μ,σ2
)是由均值
μ
和標準差
σ唯一決定的分布。如下圖所示。正態(tài)分布
則Z~N(0,1)
。利用(5.
12)式可將各種形狀的正態(tài)曲線轉(zhuǎn)換成前圖所示的標準正態(tài)曲線。正態(tài)分布表包括以下三列:第一列表示曲線底線即橫軸上的位置,用Z表示。對于正態(tài)分布x
~N(μ,σ
2
)而言σ正態(tài)分布表的使用
若x
~
N(μ,σ
2
)
,令
(5.
12)第二列是縱高Y
,即曲線的高度。對于某Z0值縱高Y的值由
計算。第三列是上圖中陰影部分的面積,用P表示,即P(0<Z≤Z0)。P如Z=
1時,P=0.3413;
Z=2時,P=0.4772;
Z=3時,P=0.4987。9.正態(tài)分布表的使用使用正態(tài)分布表時要注意以下兩個問題:(1)
正態(tài)分布表只列出Z≥0
所對應(yīng)的縱高和面積。當Z≤0時,可根據(jù)正
態(tài)曲線的對稱性,在正態(tài)分布表中查出-Z所對應(yīng)的面積和縱高即可。即P(Z0<Z≤0)=P(0<Z≤-Z0),例如,P(-1<Z<0)=P(0<Z<1)。(2)對服從正態(tài)分布N(μ,σ
2
)的變量x
,先進行變換
z=(x
-μ)
/
σ轉(zhuǎn)化為
Z值后,才能查表。9.正態(tài)分布表的使用例5-7:設(shè)X服從正態(tài)分布X~
N(μ,σ
2
)
,求以下事件的概率。(1)P(μ—σ≤
x≤μ
+
σ)(2)
P(μ—
2σ≤x≤μ
+
3σ)(3)
P(μ—
2.79σ≤x≤μ
+
2.79σ)
9.正態(tài)分布表的使用
(1)P(μ—σ≤x≤
μ
+
σ)=P(—σ
≤
x
—μ
≤
σ)
σ=P(—1≤Z≤1)=2P(0≤Z
≤1)=2
×
0.3413=0.6826(2)
P(μ-
2σ≤
x≤
μ
+
3σ)=P(-2σ
≤
x
-μ
≤
3σ)
σ=P(-2≤
Z≤3)=P(-2≤Z≤0)
+
P(0<
Z≤3)=0.4772+
0.4987=0.9759(3)
P(μ一
2.79σ≤x≤μ
+
2.79σ)=P(一2.79σ
≤x
一
μ
≤2.79σ)
σ=P(一2.79≤Z
≤2.79)=2P(0<Z
≤2.79)=2
×
0.4974=0.9948例5-8:Z~N(0,
1)
,已知下列概率,求對應(yīng)的Z值。(1)P(0<Z≤Z0)=0.3765(2)P(-Z0<Z≤Z0)=0.2661(3)
P(Z
≥Z0
)=0.059.正態(tài)分布表的使用(1)P(0<Z≤Z0)=0.3765解:從正態(tài)分布表中第三列找出與概率0.3765相近的值為0.37698
,對應(yīng)
的Z0
≈
1.
16
。(2)P(-Z0<Z≤Z0)=0.2661解:由對稱性,P(0<Z≤Z0)=1/2P(-Z0<Z≤Z0)=0.2661/2=0.
13305,查表第三列得與之相近的數(shù)為0.
13307
,因而所對應(yīng)的Z0=0.34.9.正態(tài)分布表的使用(3)P(Z≥Z0
)=0.05P(0<Z≤Z0)=1/2-P(Z≥Z0)=0.5-0.05=0.495,查表第三列0.495所對應(yīng)的Z0
≈
2.58。標準分數(shù)標準分數(shù)又稱為Z分數(shù),它以標準差為單位,反映了一個分數(shù)在團體中所
處的位置。若已知一個總體,則這個總體中的原始分數(shù)的標準分數(shù)用下式計算:
(5.
13)其中Z為標準分數(shù),x
為原始分數(shù),μ
為總體平均數(shù),σ
為總體標準差。10.正態(tài)分布在考試成績中的應(yīng)用若總體的μ
和
σ
未知,我們通常用樣本平均數(shù)和樣本標準差來代替,即用如下公式計算標準分數(shù):
(5.
14)其中Z為標準分數(shù),x為原始分數(shù),x
為樣本平均數(shù),S為樣本標準差。易證,標準分數(shù)Z的均值為0
,方差為1
。若x服從正態(tài)分布x~N(μ,σ
2
)
,
則其標準分數(shù)z=
溫馨提示
- 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
- 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
- 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
- 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負責(zé)。
- 6. 下載文件中如有侵權(quán)或不適當內(nèi)容,請與我們聯(lián)系,我們立即糾正。
- 7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔(dān)用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。
最新文檔
- 纖維板生產(chǎn)的人力資源管理考核試卷
- 通信設(shè)備故障診斷與處理考核試卷
- 行政組織理論的數(shù)字化轉(zhuǎn)型研究試題及答案
- 嵌入式市場分析與展望試題及答案
- 絲綢產(chǎn)業(yè)人才培養(yǎng)與引進考核試卷
- 嵌入式設(shè)計實例分析試題及答案
- 數(shù)據(jù)庫面試技巧計算機三級試題及答案
- 計算機三級嵌入式技術(shù)比較試題及答案
- 公路維修與加固技術(shù)試題及答案
- 計算機四級網(wǎng)軟件測試的知識整合試題及答案
- 《危重病人護理常規(guī)》課件
- 小學(xué)生認識醫(yī)生的課件
- 2023-2024學(xué)年人教版數(shù)學(xué)八年級下冊期末復(fù)習(xí)試卷(含答案)
- 2025中國華電集團限公司校招+社招高頻重點提升(共500題)附帶答案詳解
- 2024年高級測井工職業(yè)技能鑒定理論知識考試題庫(含答案)
- 拔火罐法操作流程及評價標準
- 藥棒穴位按摩治療技術(shù)
- 傳遞過程原理知到智慧樹章節(jié)測試課后答案2024年秋華南理工大學(xué)
- 中國科學(xué)院大學(xué)《機器學(xué)習(xí)(一級核心)》2021-2022學(xué)年第一學(xué)期期末試卷
- 寧德時代推出“寧家服務(wù)”
- 2024年高考真題-物理(貴州卷) 含解析
評論
0/150
提交評論