版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請(qǐng)進(jìn)行舉報(bào)或認(rèn)領(lǐng)
文檔簡(jiǎn)介
1、1第五講:?jiǎn)巫兞棵枋鼋y(tǒng)計(jì)第五講:?jiǎn)巫兞棵枋鼋y(tǒng)計(jì) 集中趨勢(shì)測(cè)量集中趨勢(shì)測(cè)量 離散趨勢(shì)測(cè)量離散趨勢(shì)測(cè)量2知識(shí)點(diǎn):知識(shí)點(diǎn):兩個(gè)維度兩個(gè)維度七個(gè)統(tǒng)計(jì)量數(shù)七個(gè)統(tǒng)計(jì)量數(shù)眾值中位數(shù)均值集集中中趨趨勢(shì)勢(shì)異眾比率四分位差方差與標(biāo)準(zhǔn)差離離散散程程度度數(shù)數(shù)據(jù)據(jù)的的簡(jiǎn)簡(jiǎn)化化3學(xué)習(xí)要求學(xué)習(xí)要求1、集中趨勢(shì)各測(cè)量法的計(jì)算方法;、集中趨勢(shì)各測(cè)量法的計(jì)算方法;2、集中趨勢(shì)各測(cè)量法的特點(diǎn)和應(yīng)用;、集中趨勢(shì)各測(cè)量法的特點(diǎn)和應(yīng)用;3、離散程度各測(cè)量法的計(jì)算方法;、離散程度各測(cè)量法的計(jì)算方法;4、離散程度各測(cè)量法的特點(diǎn)與應(yīng)用;、離散程度各測(cè)量法的特點(diǎn)與應(yīng)用; 4單變量描述統(tǒng)計(jì)單變量描述統(tǒng)計(jì)n在統(tǒng)計(jì)分析中,是否可以找出一個(gè)有代表性的數(shù)
2、值來(lái)說在統(tǒng)計(jì)分析中,是否可以找出一個(gè)有代表性的數(shù)值來(lái)說明變量的分布,反映資料的集中或差異情況?明變量的分布,反映資料的集中或差異情況? n集中趨勢(shì)測(cè)量,就是以一個(gè)數(shù)值來(lái)代表變量的資料分布,集中趨勢(shì)測(cè)量,就是以一個(gè)數(shù)值來(lái)代表變量的資料分布,反映的是變量值向中心值聚集的程度,也就是說以這一反映的是變量值向中心值聚集的程度,也就是說以這一個(gè)數(shù)值(或稱典型值)來(lái)估計(jì)或預(yù)測(cè)每一個(gè)研究對(duì)象的個(gè)數(shù)值(或稱典型值)來(lái)估計(jì)或預(yù)測(cè)每一個(gè)研究對(duì)象的數(shù)值時(shí)發(fā)生的錯(cuò)誤總數(shù)在理論上是最小的。數(shù)值時(shí)發(fā)生的錯(cuò)誤總數(shù)在理論上是最小的。n離散趨勢(shì)測(cè)量(離散趨勢(shì)測(cè)量(Measures of dispersion)就是用一)就是用一
3、個(gè)值表示數(shù)據(jù)之間的差異情況。個(gè)值表示數(shù)據(jù)之間的差異情況。n離散趨勢(shì)測(cè)量法和集中趨勢(shì)測(cè)量法具有互補(bǔ)作用。在進(jìn)離散趨勢(shì)測(cè)量法和集中趨勢(shì)測(cè)量法具有互補(bǔ)作用。在進(jìn)行統(tǒng)計(jì)分析時(shí),既要測(cè)量變量的集中趨勢(shì),也要測(cè)量離行統(tǒng)計(jì)分析時(shí),既要測(cè)量變量的集中趨勢(shì),也要測(cè)量離散趨勢(shì)。散趨勢(shì)。 5集中趨勢(shì)測(cè)量集中趨勢(shì)測(cè)量/分析分析集中趨勢(shì)測(cè)量:集中趨勢(shì)測(cè)量:用某一個(gè)典型的變量值或特征值用某一個(gè)典型的變量值或特征值來(lái)代表全體變量的問題,這個(gè)典型的變量值或來(lái)代表全體變量的問題,這個(gè)典型的變量值或特征值就稱作集中值或集中趨勢(shì)。特征值就稱作集中值或集中趨勢(shì)。 眾值(眾值(Mode) 定類層次定類層次 中位值(中位值(Median
4、)定序?qū)哟味ㄐ驅(qū)哟?均值(均值(Mean) 定距層次定距層次6一、眾數(shù)(一、眾數(shù)(mode)1、出現(xiàn)頻次最多的變量值;、出現(xiàn)頻次最多的變量值;2、眾數(shù)的不唯一性;、眾數(shù)的不唯一性;3、主要應(yīng)用于定類變量,當(dāng)然也可以、主要應(yīng)用于定類變量,當(dāng)然也可以應(yīng)用于定序和定距變量應(yīng)用于定序和定距變量7眾數(shù)的特點(diǎn):不唯一性眾數(shù)的特點(diǎn):不唯一性n原始數(shù)據(jù):原始數(shù)據(jù):4、5、7、8、19(無(wú)眾值)(無(wú)眾值)n原始數(shù)據(jù):原始數(shù)據(jù):4、5、7、5、5、16(一個(gè)眾值)(一個(gè)眾值)n原始數(shù)據(jù):原始數(shù)據(jù):4、4、5、7、7、9(兩個(gè)眾值)(兩個(gè)眾值)8例例1:非連續(xù)取值:非連續(xù)取值9例例2 分組數(shù)據(jù)分組數(shù)據(jù)收入收入(元元
5、)fCfCf500-6991010550700-8996575540900-10991262114751100-12991583693391300-14991415101811500-16994055040總數(shù)總數(shù) 55010n從分布來(lái)看,眾數(shù)是具有明顯集中趨勢(shì)點(diǎn)從分布來(lái)看,眾數(shù)是具有明顯集中趨勢(shì)點(diǎn)的數(shù)值,一組數(shù)據(jù)分布的最高峰點(diǎn)所對(duì)應(yīng)的數(shù)值,一組數(shù)據(jù)分布的最高峰點(diǎn)所對(duì)應(yīng)的數(shù)值及為眾數(shù)的數(shù)值及為眾數(shù)。11二、中位值(二、中位值(Median)1、把一組數(shù)據(jù)、把一組數(shù)據(jù)按順序排列按順序排列,處于,處于中間位中間位置置的那個(gè)數(shù)值就是中位值。的那個(gè)數(shù)值就是中位值。2、主要應(yīng)用于定序變量,也可用于定距、
6、主要應(yīng)用于定序變量,也可用于定距變量,但不可用于定類變量。變量,但不可用于定類變量。Md12(1)未分組數(shù)據(jù)求中位數(shù):)未分組數(shù)據(jù)求中位數(shù): Md位置位置= (2)中位數(shù))中位數(shù)=中間位置的值中間位置的值注意:先找位置,再找中位數(shù)注意:先找位置,再找中位數(shù)將各個(gè)個(gè)將各個(gè)個(gè)案由低至高排列案由低至高排列起來(lái),居序列中央位起來(lái),居序列中央位置的個(gè)案值就是中位值。置的個(gè)案值就是中位值。12n13(1)、個(gè)案數(shù)為奇數(shù))、個(gè)案數(shù)為奇數(shù)【例【例1】:甲地的】:甲地的5戶人家的人數(shù)為:戶人家的人數(shù)為:2,4,3,6,8,求中位值。,求中位值。 解:Md的位置 321N215排序排序2,3,4,6,8中位值Md
7、=414(2)個(gè)案數(shù)為偶數(shù))個(gè)案數(shù)為偶數(shù)【例【例2】:乙地的】:乙地的6戶人家的人數(shù)為:戶人家的人數(shù)為:2,4,3,6,8,5求中位值。求中位值。 解:Md的位置 3.521N216排序排序2,3,4, 5, 6,8Md= =4.525415(3)頻數(shù)分布表)頻數(shù)分布表【例3】根據(jù)下表求中位值。解:Md位置 250.5 中位值Md乙成成績(jī)績(jī) 頻頻次次 累累計(jì)計(jì)頻頻次次c cf f 甲 85 500 乙 195 415 丙 210 220 丁 10 10 N 500 500 21N21500162、分組數(shù)據(jù)、分組數(shù)據(jù)n根據(jù)統(tǒng)計(jì)表中的累積百分比,找出含有根據(jù)統(tǒng)計(jì)表中的累積百分比,找出含有50%的區(qū)
8、間的區(qū)間n找出含有找出含有50%區(qū)間的上界值區(qū)間的上界值U,下界值,下界值L,上界累計(jì)百分?jǐn)?shù),上界累計(jì)百分?jǐn)?shù)U%,下界累計(jì)百分,下界累計(jì)百分?jǐn)?shù)數(shù)L%以及組距等信息以及組距等信息n根據(jù)線段對(duì)應(yīng)成比例的原理,計(jì)算出累根據(jù)線段對(duì)應(yīng)成比例的原理,計(jì)算出累計(jì)百分比為計(jì)百分比為50%的變量值的變量值172ncfMdLwfnL:中位數(shù)組的下限:中位數(shù)組的下限nf:中位數(shù)組的頻數(shù):中位數(shù)組的頻數(shù)nw:中位數(shù)組的組距:中位數(shù)組的組距(U-L)ncf:低于中位數(shù)組下:低于中位數(shù)組下限的累加次數(shù)限的累加次數(shù)nn:全部個(gè)案數(shù):全部個(gè)案數(shù)nMd位置位置=n/2 (上(上下各下各50%的位置)的位置)18例:分組數(shù)據(jù):例
9、:分組數(shù)據(jù):n首先將各組的次數(shù)累加起來(lái)首先將各組的次數(shù)累加起來(lái)n求中位數(shù)的位置:求中位數(shù)的位置:nMd位置位置=n/2 =212/2=106n第第106個(gè)位置在個(gè)位置在 25-35之間之間19n分組變量看作是一組連續(xù)的數(shù)值分組變量看作是一組連續(xù)的數(shù)值259435124?10610301220【例【例4】:】:根據(jù)下表數(shù)據(jù)求中位值。根據(jù)下表數(shù)據(jù)求中位值。解:解:Md位置位置50;從累積頻數(shù)從累積頻數(shù)cf欄找到中位數(shù)位欄找到中位數(shù)位置所在組為置所在組為“300400”引入公式:引入公式:收入收入(元元) 職工數(shù)職工數(shù) Cf 100200 10 10 200300 20 30 300400 40 7
10、0 400500 30 100 合計(jì)合計(jì) N 100 =35050 30300100402fwNcfMd L 21三、均值三、均值1、均值的定義:總體各單位取值之和除、均值的定義:總體各單位取值之和除以總體單位數(shù)目。以總體單位數(shù)目。2、僅適用于定距變量?jī)H適用于定距變量,不適用于定類和,不適用于定類和定序;定序;221、未分組數(shù)據(jù)、未分組數(shù)據(jù)(1)簡(jiǎn)單原始資料求均值)簡(jiǎn)單原始資料求均值xXn23均值的計(jì)算未分組數(shù)據(jù)【例5】某班10名學(xué)生年齡分別為20、21、19、19、20、20、21、22、18、20歲,求他們的平均年齡。解:根據(jù)平均數(shù)的計(jì)算公式有:歲2010200NXX24(2)、加權(quán)平均數(shù)
11、)、加權(quán)平均數(shù)某個(gè)變項(xiàng)值重復(fù)出現(xiàn)多次,可以先統(tǒng)計(jì)每某個(gè)變項(xiàng)值重復(fù)出現(xiàn)多次,可以先統(tǒng)計(jì)每個(gè)值(個(gè)值(x)的次數(shù)()的次數(shù)(f),再求次數(shù)與相),再求次數(shù)與相應(yīng)變量值的乘積(應(yīng)變量值的乘積(fx),利用各乘積之),利用各乘積之和求出均值和求出均值。(。(f也稱為權(quán)數(shù)也稱為權(quán)數(shù),f/n稱為權(quán)稱為權(quán)重)重)公式:fxXn25未分組數(shù)據(jù)加權(quán)平均數(shù)未分組數(shù)據(jù)加權(quán)平均數(shù)【例【例6】調(diào)查某年】調(diào)查某年120名學(xué)名學(xué)生的年齡,結(jié)果如下表,生的年齡,結(jié)果如下表,求平均年齡。求平均年齡。解:根據(jù)公式得18.9歲年齡 人數(shù) 17 20 18 25 19 35 20 20 21 20 N 120 nxfnXX12020
12、212017262、分組資料求均值:、分組資料求均值:根據(jù)組中值求均值根據(jù)組中值求均值n先求出組中值先求出組中值組中值組中值=(上限(上限+下限)下限)/2n計(jì)算組中值的和計(jì)算組中值的和n計(jì)算分組數(shù)據(jù)的均值計(jì)算分組數(shù)據(jù)的均值1599.417mfxXn組中值組中值27眾值、中位數(shù)和均值的比較眾值、中位數(shù)和均值的比較1數(shù)數(shù)據(jù)據(jù)類類型型和和所所適適用用的的集集中中趨趨勢(shì)勢(shì)測(cè)測(cè)量量值值 數(shù)數(shù)據(jù)據(jù)類類型型 定定類類 定定序序 定定距距 眾眾值值 眾眾值值 眾眾值值 中中位位值值 中中位位值值 測(cè)測(cè)度度值值 均均值值 注:注: 表示該數(shù)據(jù)類型最適合用的測(cè)度值表示該數(shù)據(jù)類型最適合用的測(cè)度值28眾數(shù)、中位數(shù)和
13、平均值的比較眾數(shù)、中位數(shù)和平均值的比較n眾數(shù)是一組數(shù)據(jù)中出現(xiàn)次數(shù)最多的數(shù)值。眾數(shù)是一組數(shù)據(jù)中出現(xiàn)次數(shù)最多的數(shù)值。但在社會(huì)調(diào)查中眾數(shù)的代表性較小但在社會(huì)調(diào)查中眾數(shù)的代表性較小29中位數(shù)和平均數(shù)的比較中位數(shù)和平均數(shù)的比較n計(jì)算平均數(shù)時(shí)用到數(shù)據(jù)中所有的數(shù)值,而求中位數(shù)時(shí)只用到計(jì)算平均數(shù)時(shí)用到數(shù)據(jù)中所有的數(shù)值,而求中位數(shù)時(shí)只用到數(shù)值的相對(duì)位置,平均數(shù)比中位數(shù)利用了更多的有關(guān)數(shù)據(jù)的數(shù)值的相對(duì)位置,平均數(shù)比中位數(shù)利用了更多的有關(guān)數(shù)據(jù)的信息信息n平均數(shù)容易受到極端值的影響,而中位數(shù)則不會(huì)受這種影響。平均數(shù)容易受到極端值的影響,而中位數(shù)則不會(huì)受這種影響。當(dāng)樣本中數(shù)據(jù)值的分布是高度傾斜的,中位數(shù)一般比平均數(shù)當(dāng)樣
14、本中數(shù)據(jù)值的分布是高度傾斜的,中位數(shù)一般比平均數(shù)更適合一些更適合一些如如100,200,400,500,600,均值為均值為360,中位數(shù)為,中位數(shù)為400100,200,400,500,1000,均值為均值為440,中位數(shù)為,中位數(shù)為40030n對(duì)隨機(jī)抽樣調(diào)查來(lái)說,平均數(shù)比中位數(shù)更對(duì)隨機(jī)抽樣調(diào)查來(lái)說,平均數(shù)比中位數(shù)更穩(wěn)定,它隨樣本的變化比較小穩(wěn)定,它隨樣本的變化比較小n平均數(shù)比中位數(shù)更容易進(jìn)行算術(shù)運(yùn)算。平均數(shù)比中位數(shù)更容易進(jìn)行算術(shù)運(yùn)算。31眾數(shù)、中位數(shù)、均值比較眾數(shù)、中位數(shù)、均值比較2但兩種情況不宜用均值但兩種情況不宜用均值:n(1)(1)分組數(shù)據(jù)的極端組沒有組限分組數(shù)據(jù)的極端組沒有組限。n
15、(2)(2)個(gè)別數(shù)值非常特殊個(gè)別數(shù)值非常特殊。3233練習(xí): 求下表求下表(單項(xiàng)數(shù)列單項(xiàng)數(shù)列)所示數(shù)據(jù)的算術(shù)平均數(shù)所示數(shù)據(jù)的算術(shù)平均數(shù) 。人口數(shù)(人口數(shù)(X)戶數(shù)戶數(shù)(f)頻率頻率(P)23456785816106410.100.160.320.200.120.080.02合計(jì)合計(jì)501.0034 求下表所示數(shù)據(jù)的的算術(shù)平均數(shù)求下表所示數(shù)據(jù)的的算術(shù)平均數(shù) f XfX間距頻數(shù)(f) 組中值(X)148152152156156160160164164168168172172176176180180184184188188192192196 1 2 51019251712 5 3 0 1 15015
16、4158162166170174178182186190194合計(jì) 100 35n 求54,65,78,66,43這些數(shù)字的中位數(shù)。n求54,65,78,66,43,38 這些數(shù)字的中位數(shù)。36 某年級(jí)學(xué)生身高如下,求中位數(shù)某年級(jí)學(xué)生身高如下,求中位數(shù)37人口數(shù)(人口數(shù)(X)戶數(shù)戶數(shù)(f)頻率頻率(P)23456785816106410.100.160.320.200.120.080.02合計(jì)合計(jì)501.00求下表中的眾數(shù)求下表中的眾數(shù)38求下表中的眾數(shù)求下表中的眾數(shù)39 城鎮(zhèn)自殺率的分組次數(shù)分布城鎮(zhèn)自殺率的分組次數(shù)分布 自殺率自殺率 次數(shù)次數(shù)真實(shí)組限真實(shí)組限組中值組中值向上累積次數(shù)向上累積次
17、數(shù)3-5126-8359-118112-145215-173018-20721-23924-263合計(jì)合計(jì)22940第五講第五講 單變量的描述統(tǒng)計(jì)(單變量的描述統(tǒng)計(jì)(2) 離散趨勢(shì)測(cè)量離散趨勢(shì)測(cè)量41離散趨勢(shì)測(cè)量離散趨勢(shì)測(cè)量(Measures of dispersion)n反映的是各變量值偏離其中心值的程度,反映的是各變量值偏離其中心值的程度,是個(gè)案與個(gè)案之間的差異情況。是個(gè)案與個(gè)案之間的差異情況。n這種測(cè)量法,與前面所講的集中趨勢(shì)測(cè)這種測(cè)量法,與前面所講的集中趨勢(shì)測(cè)量法具有相互補(bǔ)充的作用。量法具有相互補(bǔ)充的作用。n集中趨勢(shì)求出的是一個(gè)最能代表變量所集中趨勢(shì)求出的是一個(gè)最能代表變量所有資料的值
18、,但是集中趨勢(shì)值代表性的有資料的值,但是集中趨勢(shì)值代表性的高低還要看各個(gè)個(gè)案之間的差異情況。高低還要看各個(gè)個(gè)案之間的差異情況。42舉例:某校舉例:某校3個(gè)系各選個(gè)系各選5名同學(xué)參加智力競(jìng)賽,名同學(xué)參加智力競(jìng)賽,他們的成績(jī)?nèi)缦拢核麄兊某煽?jī)?nèi)缦拢褐形南担褐形南担?8,79,80,81,82 ( 80)數(shù)學(xué)系:數(shù)學(xué)系:65,72,80,88,95 ( 80)英語(yǔ)系:英語(yǔ)系:35,78,89,98,100 ( 80)如果僅從集中趨勢(shì)測(cè)量(平均分?jǐn)?shù))來(lái)看,這如果僅從集中趨勢(shì)測(cè)量(平均分?jǐn)?shù))來(lái)看,這三個(gè)系的成績(jī)都一致,不存在什么差別。三個(gè)系的成績(jī)都一致,不存在什么差別。但從直觀上可看出,三個(gè)系選手之間的差
19、距程但從直觀上可看出,三個(gè)系選手之間的差距程度(離散程度)很不一樣度(離散程度)很不一樣?XXX43 n異眾比率異眾比率/離異比率離異比率(Variation ratio) 定類層定類層次次n四分位差四分位差(Interquartile range)定序?qū)哟味ㄐ驅(qū)哟蝞方差方差 (Variance) 標(biāo)準(zhǔn)差標(biāo)準(zhǔn)差 (Standard deviation)定距層次定距層次44一、異眾比率一、異眾比率(Variation ratio) 1、異眾比率、異眾比率(簡(jiǎn)寫簡(jiǎn)寫Vr) :指非眾值在總數(shù)中:指非眾值在總數(shù)中所占的比率。所占的比率。表示以眾數(shù)來(lái)預(yù)測(cè)一組數(shù)據(jù)時(shí),所犯錯(cuò)誤表示以眾數(shù)來(lái)預(yù)測(cè)一組數(shù)據(jù)時(shí),所
20、犯錯(cuò)誤的大小的大小.即即Vr值越大值越大,則眾值的代表性就越則眾值的代表性就越小小. Vr值越小值越小,則眾值的代表性就越大則眾值的代表性就越大.2、計(jì)算公式:、計(jì)算公式:NfNrVOM:眾值的頻次眾值的頻次oMf45異眾比率異眾比率(先找出眾值先找出眾值.找到眾值的頻次分布找到眾值的頻次分布)【例例1】:根據(jù)表根據(jù)表1中中的數(shù)據(jù),計(jì)算眾值的數(shù)據(jù),計(jì)算眾值和異眾比率。和異眾比率。解:解:眾值眾值Mo “核心家庭核心家庭”異眾比率異眾比率507. 0213010502130rV46例例2:眾數(shù)和異眾比率的比較:眾數(shù)和異眾比率的比較表表2 甲乙兩校學(xué)生的父親職業(yè)甲乙兩校學(xué)生的父親職業(yè)n甲乙兩校學(xué)生
21、的父親職甲乙兩校學(xué)生的父親職業(yè)的眾數(shù)都為業(yè)的眾數(shù)都為“農(nóng)民農(nóng)民”n甲校甲校n乙校乙校n眾數(shù)的代表性中甲校小眾數(shù)的代表性中甲校小于乙校,甲校中有于乙校,甲校中有47.6%非農(nóng)民,乙校非農(nóng)民,乙校只有只有38.5%.550 2880.476550v480 2950.386480v47異眾比率異眾比率&眾值眾值n異眾比率是眾值的補(bǔ)充。取值范圍是異眾比率是眾值的補(bǔ)充。取值范圍是0,1。n不屬于眾數(shù)的個(gè)案所占的比例愈大,就表示眾數(shù)的代不屬于眾數(shù)的個(gè)案所占的比例愈大,就表示眾數(shù)的代表性愈小,以之作估計(jì)或預(yù)測(cè)時(shí)所犯的錯(cuò)誤也就愈大。表性愈小,以之作估計(jì)或預(yù)測(cè)時(shí)所犯的錯(cuò)誤也就愈大。當(dāng)當(dāng) Vr 0,說明變
22、量只有一個(gè)值,那就是眾值;,說明變量只有一個(gè)值,那就是眾值;當(dāng)當(dāng) Vr 0,說明資料比較集中,眾值的代表性比較高;,說明資料比較集中,眾值的代表性比較高;當(dāng)當(dāng) Vr 1,說明資料比較分散,眾值的代表性低。,說明資料比較分散,眾值的代表性低。48二、四分位差二、四分位差(Interquartile range) 將數(shù)據(jù)由低至高排列將數(shù)據(jù)由低至高排列,然后分為四等分(即每個(gè),然后分為四等分(即每個(gè)等分包括等分包括25的數(shù)據(jù)),的數(shù)據(jù)),第一個(gè)四分位置的值(第一個(gè)四分位置的值( Q1 )與第三個(gè)四分位置的值(與第三個(gè)四分位置的值(Q3)的差異)的差異,就是四分位差,就是四分位差(簡(jiǎn)寫為(簡(jiǎn)寫為Q)。
23、)。Q1Q2Q3Q425%25%25%25%49n1.離散程度的測(cè)度值之一離散程度的測(cè)度值之一n2.也稱為內(nèi)距或四分間距也稱為內(nèi)距或四分間距n3.上四分位數(shù)與下四分位數(shù)之差上四分位數(shù)與下四分位數(shù)之差n4.反映了中間反映了中間50%數(shù)據(jù)的離散程度數(shù)據(jù)的離散程度n5.不受極端值的影響不受極端值的影響n6.用于衡量中位數(shù)的代表性用于衡量中位數(shù)的代表性50基本公式基本公式n求位置,找出求位置,找出4分位對(duì)應(yīng)的數(shù)值分位對(duì)應(yīng)的數(shù)值nQ1= nQ3=四分位差四分位差Q Q3 Q1。14n 3(1)4n511、根據(jù)原始未分組資料求四分位差、根據(jù)原始未分組資料求四分位差解:解: Q1 的位置的位置 =75.25
24、 Q3的位置的位置 225.75那么那么 Q1 不滿意;不滿意; Q3 一般一般Q Q3 Q1 一般不滿意一般不滿意結(jié)論,有一半的家庭對(duì)住房評(píng)價(jià)結(jié)論,有一半的家庭對(duì)住房評(píng)價(jià)在不滿意到一般之間。在不滿意到一般之間。表 甲城市家庭對(duì)住房狀況評(píng)價(jià)的頻數(shù)分布回答類別回答類別甲城市甲城市戶數(shù)戶數(shù) (戶戶)累計(jì)頻數(shù)累計(jì)頻數(shù) 非常不滿意 不滿意 一般 滿意 非常滿意2410894443024132226270300合計(jì)300【例【例3 3】求下表的四分位差】求下表的四分位差41n4) 13 n(52例例4:調(diào)查甲乙兩村的家庭人數(shù):調(diào)查甲乙兩村的家庭人數(shù)n其中甲村有其中甲村有11戶人家,每戶人數(shù)為戶人家,每戶
25、人數(shù)為 2,2,3,4,6,9,10,10,11,13,15n乙村有乙村有8戶人家,每戶人口數(shù)為戶人家,每戶人口數(shù)為 2,3,4,7,9,10,12,12則甲村中:則甲村中:Q1 位置位置=(n+1)/4=(11+1)/4=3, Q1 =3 Q3位置位置=3(n+1)/4=9, Q3=11 Q=Q3-Q1=11-3=8則乙村中:則乙村中: Q1 位置位置=(n+1)/4=2.25, Q1 =3+0.25(4-3)=3.25 Q3位置位置=3(n+1)/4=6.75, Q3=10+0.75(12-10)=11.5 Q=Q3-Q1=11.5-3.25=8.25n甲的離散程度低于乙村,以中位置估計(jì)甲
26、乙兩村的人口甲的離散程度低于乙村,以中位置估計(jì)甲乙兩村的人口數(shù)時(shí),在甲村犯的錯(cuò)誤小于乙村數(shù)時(shí),在甲村犯的錯(cuò)誤小于乙村532、根據(jù)分組資料求四分位差、根據(jù)分組資料求四分位差有四步:有四步:n計(jì)算向上累加次數(shù)計(jì)算向上累加次數(shù)n求出求出Q1 和和Q3的位置的位置 Q1= Q3=n參考累加次數(shù)分布,決定參考累加次數(shù)分布,決定Q1和和Q3屬于哪一組屬于哪一組n從所屬組中,計(jì)算從所屬組中,計(jì)算Q1位置和位置和Q3位置的數(shù)值。位置的數(shù)值。4n34n54公式如下:公式如下:nL1=Q1屬組之屬組之真實(shí)真實(shí)下限下限nL3=Q3屬組之屬組之真實(shí)真實(shí)下限下限nf1=Q1屬組之次數(shù)屬組之次數(shù)nf3=Q3屬組之次數(shù)屬組
27、之次數(shù)ncf1=低于低于Q1屬組之累計(jì)屬組之累計(jì)次數(shù)次數(shù)ncf3=低于低于Q3屬組之累計(jì)屬組之累計(jì)次數(shù)次數(shù)nw1=Q1屬組之組距屬組之組距nw3=Q3屬組之組距屬組之組距nn=全部個(gè)案數(shù)目全部個(gè)案數(shù)目3333334ncfQLwf111114ncfQLwf55四分位差四分位差&中位數(shù)中位數(shù)n四分位差反映的是中位數(shù)的代表性四分位差反映的是中位數(shù)的代表性n差距越大,中位數(shù)的代表性越小,用中差距越大,中位數(shù)的代表性越小,用中位數(shù)估計(jì)變量時(shí)所犯的錯(cuò)誤越大位數(shù)估計(jì)變量時(shí)所犯的錯(cuò)誤越大;反之,;反之,中位數(shù)的代表性越大,用中位數(shù)作估計(jì)中位數(shù)的代表性越大,用中位數(shù)作估計(jì)犯的錯(cuò)誤越小。犯的錯(cuò)誤越小。56
28、三、方差和標(biāo)準(zhǔn)差三、方差和標(biāo)準(zhǔn)差n1.離散程度的測(cè)度值之一離散程度的測(cè)度值之一n2.最常用的測(cè)度值最常用的測(cè)度值n3.反映了數(shù)據(jù)的分布反映了數(shù)據(jù)的分布n4.反映了各變量值與均值的平均差異反映了各變量值與均值的平均差異n5.根據(jù)總體數(shù)據(jù)計(jì)算的,稱為總體方差或標(biāo)根據(jù)總體數(shù)據(jù)計(jì)算的,稱為總體方差或標(biāo)準(zhǔn)差;根據(jù)樣本數(shù)據(jù)計(jì)算的,稱為樣本方差準(zhǔn)差;根據(jù)樣本數(shù)據(jù)計(jì)算的,稱為樣本方差或標(biāo)準(zhǔn)差或標(biāo)準(zhǔn)差57三、方差與標(biāo)準(zhǔn)差三、方差與標(biāo)準(zhǔn)差n所謂方差(所謂方差(Variance) ,觀察值與其均,觀察值與其均值之差的平方和除以全部觀察總數(shù)值之差的平方和除以全部觀察總數(shù)N。n方差的平方根就是標(biāo)準(zhǔn)差方差的平方根就是標(biāo)準(zhǔn)
29、差(Standard deviation),用,用 或或S221()NiiXXN21()NiiXXN58n表示以均值作代表值時(shí)引起的偏差或錯(cuò)誤,也就表示以均值作代表值時(shí)引起的偏差或錯(cuò)誤,也就是說用均值來(lái)估計(jì)或預(yù)測(cè)各個(gè)個(gè)案的數(shù)值,所犯是說用均值來(lái)估計(jì)或預(yù)測(cè)各個(gè)個(gè)案的數(shù)值,所犯的錯(cuò)誤(的錯(cuò)誤( )平均是)平均是n標(biāo)準(zhǔn)差是用得最多,也是最重要的離散量數(shù)的統(tǒng)標(biāo)準(zhǔn)差是用得最多,也是最重要的離散量數(shù)的統(tǒng)計(jì)量計(jì)量;n方差是統(tǒng)計(jì)學(xué)上的一個(gè)重要概念,在以后的統(tǒng)計(jì)方差是統(tǒng)計(jì)學(xué)上的一個(gè)重要概念,在以后的統(tǒng)計(jì)方法學(xué)習(xí)過程中會(huì)進(jìn)一步了解;方法學(xué)習(xí)過程中會(huì)進(jìn)一步了解;n只適用于定距層次的變量只適用于定距層次的變量;XX5
30、9總體方差和標(biāo)準(zhǔn)差總體方差和標(biāo)準(zhǔn)差n未分組數(shù)據(jù):221()Kmif XXNNXXNii122)(NXXNii12)(21()Kmif X XN60樣本方差和標(biāo)準(zhǔn)差樣本方差和標(biāo)準(zhǔn)差2211()1kminf xxSn1)(1221nxxSniin1)(121nxxSniin211()1kminf xxSn未分組數(shù)據(jù)未分組數(shù)據(jù)61樣本方差的樣本方差的自由度自由度(degree of freedom)(degree of freedom)一組數(shù)據(jù)中可以自由取值的數(shù)據(jù)的個(gè)數(shù)一組數(shù)據(jù)中可以自由取值的數(shù)據(jù)的個(gè)數(shù)當(dāng)樣本數(shù)據(jù)的個(gè)數(shù)為當(dāng)樣本數(shù)據(jù)的個(gè)數(shù)為 n 時(shí),若樣本均值時(shí),若樣本均值 x 確定后,確定后,只有只有n-1個(gè)數(shù)據(jù)可以自由取值,其中必有一個(gè)數(shù)據(jù)個(gè)數(shù)據(jù)可以自由取值,其中必有一個(gè)數(shù)據(jù)則不能自由取值則不能自由取值例如,樣本有例如,樣本有3個(gè)數(shù)值,即個(gè)數(shù)值,即x1=2,x2=4,x3=9,則則 x = 5。當(dāng)。當(dāng) x = 5 確定后,確定后,x1,x2和和x3有兩個(gè)有兩個(gè)數(shù)據(jù)可以自由取值,另一個(gè)則不能自由取值,比如數(shù)據(jù)可以自由取值,另一個(gè)則不能自由取值,比
溫馨提示
- 1. 本站所有資源如無(wú)特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請(qǐng)下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請(qǐng)聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
- 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁(yè)內(nèi)容里面會(huì)有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
- 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
- 5. 人人文庫(kù)網(wǎng)僅提供信息存儲(chǔ)空間,僅對(duì)用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對(duì)用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對(duì)任何下載內(nèi)容負(fù)責(zé)。
- 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請(qǐng)與我們聯(lián)系,我們立即糾正。
- 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶因使用這些下載資源對(duì)自己和他人造成任何形式的傷害或損失。
最新文檔
- 二零二五版醫(yī)療設(shè)施暖通工程設(shè)計(jì)施工合同4篇
- 2025年度老舊小區(qū)改造施工監(jiān)理合同樣本4篇
- 2025年度門面房商鋪?zhàn)赓U與體育產(chǎn)業(yè)合作合同4篇
- 二零二五版門衛(wèi)服務(wù)及突發(fā)事件應(yīng)急預(yù)案合同4篇
- 二零二四年學(xué)校校服租賃服務(wù)及安全管理合同3篇
- 二零二五年度寧波商貿(mào)流通企業(yè)勞動(dòng)合同與商品質(zhì)量管理協(xié)議4篇
- 2025年度門衛(wèi)人員安全教育與培訓(xùn)效果評(píng)估合同2篇
- 個(gè)人簽訂的分包合同(2024年)
- 二零二五年度綠色建筑農(nóng)民工合作協(xié)議2篇
- 2025年度綠色建筑農(nóng)民工勞務(wù)合同書4篇
- 勞務(wù)協(xié)議范本模板
- 2024年全國(guó)職業(yè)院校技能大賽高職組(生產(chǎn)事故應(yīng)急救援賽項(xiàng))考試題庫(kù)(含答案)
- 2025大巴車租車合同范文
- 老年上消化道出血急診診療專家共識(shí)2024
- 人教版(2024)數(shù)學(xué)七年級(jí)上冊(cè)期末測(cè)試卷(含答案)
- 2024年國(guó)家保密培訓(xùn)
- 2024年公務(wù)員職務(wù)任命書3篇
- CFM56-3發(fā)動(dòng)機(jī)構(gòu)造課件
- 會(huì)議讀書交流分享匯報(bào)課件-《殺死一只知更鳥》
- 2025屆撫州市高一上數(shù)學(xué)期末綜合測(cè)試試題含解析
- 《霧都孤兒人物分析4000字(論文)》
評(píng)論
0/150
提交評(píng)論