應(yīng)用統(tǒng)計之數(shù)據(jù)的整理與抽樣課件_第1頁
應(yīng)用統(tǒng)計之數(shù)據(jù)的整理與抽樣課件_第2頁
應(yīng)用統(tǒng)計之數(shù)據(jù)的整理與抽樣課件_第3頁
應(yīng)用統(tǒng)計之數(shù)據(jù)的整理與抽樣課件_第4頁
應(yīng)用統(tǒng)計之數(shù)據(jù)的整理與抽樣課件_第5頁
已閱讀5頁,還剩119頁未讀 繼續(xù)免費閱讀

下載本文檔

版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進行舉報或認領(lǐng)

文檔簡介

本資料來源本資料來源1數(shù)據(jù)的整理與抽樣

§4、數(shù)據(jù)的描述性指標頻數(shù)分布所給定的是一個分布形狀,要進一步描述和刻畫其分布的數(shù)量特征,則需要計算數(shù)據(jù)的集中趨勢和離散程度。它們是反映數(shù)據(jù)分布數(shù)量規(guī)律的一對代表值。若所描述的數(shù)據(jù)是所觀察研究的總體,則稱這些代表值為參數(shù);若所描述的數(shù)據(jù)僅是總體中隨機抽取的一個樣本,則稱這些代表值為統(tǒng)計量。數(shù)據(jù)的整理與抽樣§4、數(shù)據(jù)的描述性指標2數(shù)據(jù)的整理與抽樣

一、集中趨勢

集中趨勢亦稱趨中性。它表示同類現(xiàn)象在一定時間、地點條件下所達到的一般水平與大量單位的綜合數(shù)量特征。集中趨勢有三個特點:

①它用一個代表值綜合反映總體各單位(所有個體)某種標志值的一般水平或代表水平;②它抽象掉了各個個體之間標志值的差異;③它一般用單位的數(shù)值表示,其計量單位與標志值的計量單位相一致。數(shù)據(jù)的整理與抽樣一、集中趨勢3數(shù)據(jù)的整理與抽樣

集中趨勢的作用:①可方便地比較若干總體的某種標志值的平均水平,說明它們在某一數(shù)量標志上的差異。如平均成績、平均身高等;②可研究總體某種標志值的平均水平隨時間的變化,說明其發(fā)展趨勢和規(guī)律。如人均收入的變化、勞動生產(chǎn)率的變化等;③可分析社會經(jīng)濟現(xiàn)象間的依存關(guān)系,為此必須采用分組的方法。數(shù)據(jù)的整理與抽樣集中趨勢的作用:4數(shù)據(jù)的整理與抽樣4、可作為評價事物優(yōu)劣的數(shù)量標準。如各批產(chǎn)品合格率;5、可用以計算和估算其他重要經(jīng)濟指標(如由人均收入估算社會購買力)。數(shù)據(jù)的整理與抽樣4、可作為評價事物優(yōu)劣的數(shù)量標準。如5數(shù)據(jù)的整理與抽樣

統(tǒng)計學上對集中趨勢有以下幾種主要測度值:

1、均值均值又稱算術(shù)平均數(shù)。是數(shù)據(jù)集中趨勢的主要測度值。對于未經(jīng)整理的原始數(shù)據(jù),一般用以下公式:數(shù)據(jù)的整理與抽樣統(tǒng)計學上對集中趨勢有以下幾種主要測6數(shù)據(jù)的整理與抽樣⑴簡單算術(shù)平均數(shù)

如平均工資、平均身高、平均成績等的計算。均值觀察值容量總體N樣本n數(shù)據(jù)的整理與抽樣⑴簡單算術(shù)平均數(shù)均值觀察值容量總體7數(shù)據(jù)的整理與抽樣例:某班級28名學生的應(yīng)用統(tǒng)計學成績?nèi)缦拢?/p>

72856492767387829666776557907169707468796053758872786167計算該班學生應(yīng)用統(tǒng)計學的平均成績。解:數(shù)據(jù)的整理與抽樣例:某班級28名學生的應(yīng)用統(tǒng)計學8數(shù)據(jù)的整理與抽樣簡單算術(shù)平均數(shù)較準確地描述了總體與個體之間的數(shù)量關(guān)系,其描述方式同時考慮了變量值的次數(shù)和變量值的大小對集中趨勢的影響,數(shù)列中任何數(shù)值和次數(shù)的變化都會引起算術(shù)平均數(shù)的改變,它是最靈敏、對資料運用最充分的指標。數(shù)據(jù)的整理與抽樣簡單算術(shù)平均數(shù)較準確地描述了總體與個9數(shù)據(jù)的整理與抽樣⑵加權(quán)算術(shù)平均數(shù)當數(shù)據(jù)是已經(jīng)分組的頻數(shù)分布資料時,計算算術(shù)平均數(shù)需要用加權(quán)平均法?!皺?quán)”即占總次數(shù)的比重。近似算法如下:數(shù)據(jù)的整理與抽樣⑵加權(quán)算術(shù)平均數(shù)10數(shù)據(jù)的整理與抽樣均值組中值組數(shù)總體K樣本k數(shù)據(jù)的整理與抽樣均值組中值組數(shù)總體K樣本k11數(shù)據(jù)的整理與抽樣成績分組組中值人數(shù)50~6055211060~7065852070~80751182580~9085434090~100953285合計—282080數(shù)據(jù)的整理與抽樣成績分組組中值人數(shù)50~605521112數(shù)據(jù)的整理與抽樣在使用組中值作為第i組的代表值時,假設(shè)各組數(shù)據(jù)在組內(nèi)分布均勻,但實際上并非如此,所以計算的均值會產(chǎn)生誤差。均值不僅受組中值大小的影響,而且也會受權(quán)數(shù)的影響,權(quán)數(shù)越大,則該組數(shù)值對均值的影響就越大。由均值的計算公式很容易看出這一點。數(shù)據(jù)的整理與抽樣在使用組中值作為第i組的13數(shù)據(jù)的整理與抽樣

月工資(元)員工數(shù)(人)各組平均工資工資總額

fxx·f

1600以下401550620001600~170010016501650001700~180020017503500001800~190040018507400001900~200045019508750002000~220025021005250002200以上602300138000合計1500—2855000數(shù)據(jù)的整理與抽樣月工資(元)員工數(shù)(人)14數(shù)據(jù)的整理與抽樣

=2855000/1500=1903.33元算術(shù)平均數(shù)的特點:

⑴各變量值與其算術(shù)平均數(shù)的離差之和等于0,即⑵各變量值與其算術(shù)平均數(shù)的離差平方和為最小值(相對于其他任何數(shù)),即數(shù)據(jù)的整理與抽樣15數(shù)據(jù)的整理與抽樣

例如,為分析某鄉(xiāng)農(nóng)民家庭生活水平與家庭人口的關(guān)系,則需按人均月收入對該鄉(xiāng)農(nóng)戶分組。也可按戶人口數(shù)分組。人均月收入(分組)調(diào)查戶數(shù)人口數(shù)戶均人口數(shù)250以下9546.0250~3009495.4300~350311625.2350~400964034.2400~600692393.5600以上12352.9合計2269424.2數(shù)據(jù)的整理與抽樣例如,為分析某鄉(xiāng)農(nóng)民家庭生活水平與家庭人口16數(shù)據(jù)的整理與抽樣

2、幾何平均數(shù)它是與算術(shù)平均數(shù)不同的另一種平均數(shù),主要用于環(huán)比發(fā)展速度或比率均值的計算。⑴簡單幾何平均數(shù)這是在資料未分組情況下采用的一種計算方法。其中,是第i期的發(fā)展速度或比率。數(shù)據(jù)的整理與抽樣2、幾何平均數(shù)17數(shù)據(jù)的整理與抽樣某企業(yè)“九五”期間產(chǎn)品銷售額的年增長速度為因,所以可用對數(shù)計算幾何平均數(shù)。年份199519961997199819992000增長速度(%)2718231625相對前一年(%)127118123116125相對1995(%)100127149.9184.3213.8267.3數(shù)據(jù)的整理與抽樣某企業(yè)“九五”期間產(chǎn)品銷售額的年增長速度為18數(shù)據(jù)的整理與抽樣⑵加權(quán)幾何平均數(shù)在資料已經(jīng)分組,每個變量值出現(xiàn)次數(shù)或比重不等時,應(yīng)使用加權(quán)幾何平均。即對數(shù)計算公式為數(shù)據(jù)的整理與抽樣⑵加權(quán)幾何平均數(shù)19數(shù)據(jù)的整理與抽樣假設(shè)投資銀行某項投資的年利率按復(fù)利計算,25年的年利率分配為:有1年3%,有4年4%,有8年8%,有10年10%,有2年15%,求平均年利率。(單利:)數(shù)據(jù)的整理與抽樣假設(shè)投資銀行某項投資的年利率按復(fù)利計20數(shù)據(jù)的整理與抽樣

3、中位數(shù)將一組變量值按大小順序排列,位于數(shù)列中間位置的變量值即為中位數(shù)。由于中位數(shù)居于數(shù)列正中,所以它可以作為代表一般水平和集中趨勢的代表值。在標志變異度較大的情況下,可避免極端數(shù)值(不穩(wěn)健)的影響。⑴單項變量數(shù)數(shù)列

中位數(shù)為為中位數(shù)的位置。數(shù)據(jù)的整理與抽樣3、中位數(shù)21數(shù)據(jù)的整理與抽樣例:某班級28名學生的應(yīng)用統(tǒng)計學成績?nèi)缦拢?/p>

72856492767387829666776557907169707468796053758872786167計算該班學生應(yīng)用統(tǒng)計學成績的中位數(shù)。解:N=28,Me=(N+1)/2=(28+1)/2=14.5對成績順序排列后,X14=72,X15=73

數(shù)據(jù)的整理與抽樣例:某班級28名學生的應(yīng)用統(tǒng)計學22數(shù)據(jù)的整理與抽樣

⑵組距變量數(shù)列①確定中位數(shù)所在組計算公式為N/2或,N和為總次數(shù);②計算中位數(shù)下限公式含有中位組均勻分布的假設(shè)。數(shù)據(jù)的整理與抽樣⑵組距變量數(shù)列23數(shù)據(jù)的整理與抽樣其中,L—中位數(shù)所在組的下組限;—數(shù)值在L之下各組的累計次數(shù);—中位數(shù)所在組的次數(shù);

d—中位數(shù)所在組的組距。上限公式數(shù)據(jù)的整理與抽樣其中,L—中位數(shù)所在組的下組限;24數(shù)據(jù)的整理與抽樣例:成績分組組中值人數(shù)50~6055211060~7065852070~80751182580~9085434090~100953285合計—282080數(shù)據(jù)的整理與抽樣例:成績分組組中值人數(shù)50~625數(shù)據(jù)的整理與抽樣解:N=28,L=70,Sm-1=10,=11,d=10顯然,數(shù)據(jù)的整理與抽樣解:N=28,L=70,Sm26數(shù)據(jù)的整理與抽樣

例:

年收入額(元)農(nóng)戶數(shù)百分比(%)2600~280024082800~300048016

3000~3200

1050

353200~3400600203400~360027093600~380021073800~400012044200~4400301

合計3000100數(shù)據(jù)的整理與抽樣例:年收入額(元)27數(shù)據(jù)的整理與抽樣解:N=3000,L=3000,Sm-1=720,=1050,d=200顯然,數(shù)據(jù)的整理與抽樣解:N=3000,L=30028數(shù)據(jù)的整理與抽樣

4、四分位數(shù)四分位數(shù)是將數(shù)據(jù)排序后,將數(shù)據(jù)四等分的三個數(shù)值,其中中間的數(shù)值是中位數(shù)。在中位數(shù)與最大值和中位數(shù)與最小值之間再找到兩個數(shù)值,即可將數(shù)據(jù)四等分。四分位數(shù)的三個分割點的位置分別為數(shù)據(jù)的整理與抽樣4、四分位數(shù)29數(shù)據(jù)的整理與抽樣⑴上四分位數(shù)若上四分位數(shù)為Xi,則⑵下四分位數(shù)若下四分位數(shù)為Xj,則其中,表示向上取整。數(shù)據(jù)的整理與抽樣⑴上四分位數(shù)30數(shù)據(jù)的整理與抽樣

在資料分組的情況下,四分位值的三個點分別以N/4、2N/4和3N/4定位,之后求3個四分位數(shù)。第i個四分位點的值為其中,—第i個分位值所在組的下限;—其前各組的累計次數(shù);—其所在組的次數(shù);—其所在組的組距。數(shù)據(jù)的整理與抽樣在資料分組的情況下,四分位值的三個點31數(shù)據(jù)的整理與抽樣

5、眾數(shù)眾數(shù)是將數(shù)據(jù)按大小順序排隊后,出現(xiàn)次數(shù)明顯最多或最有明顯集中趨勢的點的數(shù)值。它是指在總體中最常遇到的現(xiàn)象,即在一個數(shù)列中出現(xiàn)最多的標志值。例如,大多數(shù)工人可完成的工作量、大多數(shù)人的收入、最一般的身高等。它不受變量數(shù)列極值的影響,用具有次數(shù)最多的標志值描述集中趨勢,代表的范圍最廣。但是,眾數(shù)的取得必須在個體數(shù)足夠多且又有明顯集中趨勢時才有意義。數(shù)據(jù)的整理與抽樣5、眾數(shù)32數(shù)據(jù)的整理與抽樣

如果分布沒有明顯的最高點,則眾數(shù)不存在。如果有兩個相同的最高點,也可有兩個眾數(shù)。M0M0M0M0數(shù)據(jù)的整理與抽樣如果分布沒有明顯的最高點,則眾數(shù)不存33數(shù)據(jù)的整理與抽樣眾數(shù)的確定方法⑴若為單項變量數(shù)列,則變量出現(xiàn)次數(shù)最多(頻率最高)的變量值就是眾數(shù)。

日班次平均加工零件數(shù)量(個)x工人數(shù)(人)f50205530

60806510705

合計145數(shù)據(jù)的整理與抽樣眾數(shù)的確定方法日班次平均加工零件數(shù)量(個)34數(shù)據(jù)的整理與抽樣

⑵若為等組距變量數(shù)列,則分兩步:年收入額(元)農(nóng)戶數(shù)百分比(%)2600~280024082800~300048016

3000~3200

1050

353200~3400600203400~360027093600~380021073800~400012044200~4400301

合計3000100數(shù)據(jù)的整理與抽樣⑵若為等組距變量數(shù)列,則分兩步:年35數(shù)據(jù)的整理與抽樣⑴確定眾數(shù)組頻次最高的一組為眾數(shù)組。3000~3200元之間;⑵計算眾數(shù)與眾數(shù)組相鄰的兩組數(shù)頻次的多少有關(guān):①若相鄰兩組數(shù)的頻次相等,則眾數(shù)組的中值就是眾數(shù);數(shù)據(jù)的整理與抽樣⑴確定眾數(shù)組36數(shù)據(jù)的整理與抽樣

②若相鄰兩組數(shù)的頻次不等,則眾數(shù)為其中:L—眾數(shù)組的下限值;—眾數(shù)組與其下限相鄰組的頻次差;—眾數(shù)組與其上限相鄰組的頻次差;

d—眾數(shù)組的組距。(下限公式)數(shù)據(jù)的整理與抽樣②若相鄰兩組數(shù)的頻次不等,則眾數(shù)為37數(shù)據(jù)的整理與抽樣

在本例中,L=3000d=3200-3000=200=1050-480=570或=35%-16%=19%=1050-600=450或=35%-20%=15%則或

上限公式為數(shù)據(jù)的整理與抽樣在本例中,L=3000d=3238數(shù)據(jù)的整理與抽樣

例:計算全班學生應(yīng)用統(tǒng)計學的眾數(shù)。成績分組人數(shù)50~60260~70870~801180~90490~1003合計28數(shù)據(jù)的整理與抽樣例:計算全班學生應(yīng)用統(tǒng)計學的眾數(shù)。39數(shù)據(jù)的整理與抽樣

解:L=70,,,d=10

數(shù)據(jù)的整理與抽樣解:L=70,40數(shù)據(jù)的整理與抽樣在度量集中趨勢的幾種均值指標中,算術(shù)平均數(shù)、中位數(shù)、眾數(shù)最為重要。三者之間存在如下關(guān)系:當次數(shù)分布完全對稱時,當次數(shù)分布為偏態(tài)時,數(shù)據(jù)的整理與抽樣在度量集中趨勢的幾種均值指標中,算術(shù)41數(shù)據(jù)的整理與抽樣6、集中趨勢分析應(yīng)注意的幾個問題⑴只有同質(zhì)總體才能計算平均值,各個體之間僅存在數(shù)量差異;⑵在分組的條件下,總體的均值不僅受組的均值大小的影響,同時還受總體內(nèi)部結(jié)構(gòu)變動的影響。當總體內(nèi)部結(jié)構(gòu)變化時,總體均值就不能全面、準確地反映現(xiàn)象的特征和規(guī)律;數(shù)據(jù)的整理與抽樣6、集中趨勢分析應(yīng)注意的幾個問題42數(shù)據(jù)的整理與抽樣⑶應(yīng)以分布數(shù)量和典型事例作補充說明總體的集中趨勢;⑷應(yīng)與離散趨勢分析相結(jié)合,以全面反映現(xiàn)象個體的差異。數(shù)據(jù)的整理與抽樣⑶應(yīng)以分布數(shù)量和典型事例作補充說明43數(shù)據(jù)的整理與抽樣二、離散趨勢

1、問題的提出

集中趨勢反映了總體單位(個體)標志值分布特征的一個重要方面,但僅用此指標描述這些標志的一般水平是不夠的。要全面描述總體單位標志值的分布特征,必須對標志值的差異性進行研究。離中趨勢是指一組變量值背離分布中心值的特征,它與集中趨勢共同說明總體的分布特征。數(shù)據(jù)的整理與抽樣二、離散趨勢44數(shù)據(jù)的整理與抽樣2、離中趨勢度量的目的⑴描述總體內(nèi)部差異程度,反映社會經(jīng)濟活動的均衡性,為管理決策提供信息。班級語文數(shù)學歷史地理化學物理總評甲班82868083838483乙班75898478809283數(shù)據(jù)的整理與抽樣2、離中趨勢度量的目的班級語文45數(shù)據(jù)的整理與抽樣⑵衡量和比較均值指標代表性的高低離中趨勢指標數(shù)值的大小和均值代表程度高低有密切關(guān)系。離中趨勢指標數(shù)值越大,均值的代表性就越??;而離中趨勢指標數(shù)值越小,均值的代表性就越大。這充分說明,均值代表性的大小必須與離中趨勢指標結(jié)合運用。數(shù)據(jù)的整理與抽樣⑵衡量和比較均值指標代表性的高低46數(shù)據(jù)的整理與抽樣⑶為選取樣本單位數(shù)提供依據(jù)。各個體標志值變異度越小,即總體越一致,則為獲取代表性資料,只需選取較少的樣本單位;反之,就需要選取較多的樣本單位。數(shù)據(jù)的整理與抽樣⑶為選取樣本單位數(shù)提供依據(jù)。47數(shù)據(jù)的整理與抽樣

3、離中趨勢度量方法⑴按總體內(nèi)單位標志值差異距離度量。如極差、四分位差等;⑵按異眾比例度量;⑶按個體標志值的平均離差度量。如平均差、標準差等。離中趨勢的度量由變異指標給出,它可以是絕對數(shù),也可以是相對數(shù)。數(shù)據(jù)的整理與抽樣3、離中趨勢度量方法48數(shù)據(jù)的整理與抽樣

4、極差極差又稱為全距,是數(shù)據(jù)離散或差異程度的最簡單的測度值。全距的計算是數(shù)據(jù)的最大值與最小值之差。即或數(shù)據(jù)的整理與抽樣4、極差49數(shù)據(jù)的整理與抽樣例:計算全班學生應(yīng)用統(tǒng)計學成績的極差。解:顯然,數(shù)據(jù)越分散,則極差越大。極差易受極端數(shù)據(jù)的影響,而中間數(shù)據(jù)的變化對它無任何影響。數(shù)據(jù)的整理與抽樣例:計算全班學生應(yīng)用統(tǒng)計學成績的極差50數(shù)據(jù)的整理與抽樣5、方差和標準差

⑴方差①未分組數(shù)據(jù)

—總體方差;—樣本方差;

數(shù)據(jù)的整理與抽樣5、方差和標準差51數(shù)據(jù)的整理與抽樣稱n-1為自由度。因為當樣本確定之后,樣本n個數(shù)據(jù)中只有n-1個可以自由變動,即樣本數(shù)據(jù)中只有n-1個誤差的有用信息。另一種解釋是,樣本方差之所以要除以n-1,是為保證樣本方差對總體方差估計的無偏性。數(shù)據(jù)的整理與抽樣稱n-1為自由度。52數(shù)據(jù)的整理與抽樣

②分組數(shù)據(jù)

對于分組數(shù)據(jù)的方差,還要考慮各組的次數(shù),即對其離差平方和加權(quán)。數(shù)據(jù)的整理與抽樣②分組數(shù)據(jù)53數(shù)據(jù)的整理與抽樣

⑵標準差σ、S標準差就是方差的平方根。即數(shù)據(jù)的整理與抽樣⑵標準差σ、S54數(shù)據(jù)的整理與抽樣

⑶方差與標準差的關(guān)系方差與標準差的差異在于對離差的處理不同。①方差不僅便于數(shù)學上進一步計算,而且其統(tǒng)計推斷的性質(zhì)也優(yōu)于標準差;②方差與標準差都是以均值為比較中心,它們都是離差的某種平均;③方差的大小不僅可以反映數(shù)據(jù)離散程度的大小,而且也反映均值代表性的高低。方差小,則均值的代表性強;方差大,則均值的代表性弱。數(shù)據(jù)的整理與抽樣⑶方差與標準差的關(guān)系55數(shù)據(jù)的整理與抽樣例:甲組乙組生產(chǎn)件數(shù)離差離差平方生產(chǎn)件數(shù)離差離差平方

xx73-24532950-25625250074-11547665-1010042257500562570-52549007611577690152258100772459291002562510000合計—1028135合計—160029725數(shù)據(jù)的整理與抽樣例:甲組56數(shù)據(jù)的整理與抽樣

例:計算全班學生應(yīng)用統(tǒng)計學成績的方差和標準差。數(shù)據(jù)的整理與抽樣例:計算全班學生應(yīng)用統(tǒng)計學成績的方差57數(shù)據(jù)的整理與抽樣

解:N=28,,數(shù)據(jù)的整理與抽樣58數(shù)據(jù)的整理與抽樣例:用分組數(shù)據(jù)計算全班應(yīng)用統(tǒng)計學成績的方差和標準差。成績分組組中值fi50~6055-18.64347.452694.9060~7065-8.6474.658597.2070~80751.361.851120.3580~908511.36129.054516.2090~1009521.36456.2531368.75合計283197.40數(shù)據(jù)的整理與抽樣例:用分組數(shù)據(jù)計算全班應(yīng)用統(tǒng)計學成績59數(shù)據(jù)的整理與抽樣解:N=28,,數(shù)據(jù)的整理與抽樣60數(shù)據(jù)的整理與抽樣利用前面的公式計算方差或標準差比較麻煩。常常利用它們的變形公式。數(shù)據(jù)的整理與抽樣利用前面的公式計算方差或標準差比較麻61數(shù)據(jù)的整理與抽樣對于分組數(shù)據(jù),有數(shù)據(jù)的整理與抽樣對于分組數(shù)據(jù),有62本資料來源本資料來源63數(shù)據(jù)的整理與抽樣

§4、數(shù)據(jù)的描述性指標頻數(shù)分布所給定的是一個分布形狀,要進一步描述和刻畫其分布的數(shù)量特征,則需要計算數(shù)據(jù)的集中趨勢和離散程度。它們是反映數(shù)據(jù)分布數(shù)量規(guī)律的一對代表值。若所描述的數(shù)據(jù)是所觀察研究的總體,則稱這些代表值為參數(shù);若所描述的數(shù)據(jù)僅是總體中隨機抽取的一個樣本,則稱這些代表值為統(tǒng)計量。數(shù)據(jù)的整理與抽樣§4、數(shù)據(jù)的描述性指標64數(shù)據(jù)的整理與抽樣

一、集中趨勢

集中趨勢亦稱趨中性。它表示同類現(xiàn)象在一定時間、地點條件下所達到的一般水平與大量單位的綜合數(shù)量特征。集中趨勢有三個特點:

①它用一個代表值綜合反映總體各單位(所有個體)某種標志值的一般水平或代表水平;②它抽象掉了各個個體之間標志值的差異;③它一般用單位的數(shù)值表示,其計量單位與標志值的計量單位相一致。數(shù)據(jù)的整理與抽樣一、集中趨勢65數(shù)據(jù)的整理與抽樣

集中趨勢的作用:①可方便地比較若干總體的某種標志值的平均水平,說明它們在某一數(shù)量標志上的差異。如平均成績、平均身高等;②可研究總體某種標志值的平均水平隨時間的變化,說明其發(fā)展趨勢和規(guī)律。如人均收入的變化、勞動生產(chǎn)率的變化等;③可分析社會經(jīng)濟現(xiàn)象間的依存關(guān)系,為此必須采用分組的方法。數(shù)據(jù)的整理與抽樣集中趨勢的作用:66數(shù)據(jù)的整理與抽樣4、可作為評價事物優(yōu)劣的數(shù)量標準。如各批產(chǎn)品合格率;5、可用以計算和估算其他重要經(jīng)濟指標(如由人均收入估算社會購買力)。數(shù)據(jù)的整理與抽樣4、可作為評價事物優(yōu)劣的數(shù)量標準。如67數(shù)據(jù)的整理與抽樣

統(tǒng)計學上對集中趨勢有以下幾種主要測度值:

1、均值均值又稱算術(shù)平均數(shù)。是數(shù)據(jù)集中趨勢的主要測度值。對于未經(jīng)整理的原始數(shù)據(jù),一般用以下公式:數(shù)據(jù)的整理與抽樣統(tǒng)計學上對集中趨勢有以下幾種主要測68數(shù)據(jù)的整理與抽樣⑴簡單算術(shù)平均數(shù)

如平均工資、平均身高、平均成績等的計算。均值觀察值容量總體N樣本n數(shù)據(jù)的整理與抽樣⑴簡單算術(shù)平均數(shù)均值觀察值容量總體69數(shù)據(jù)的整理與抽樣例:某班級28名學生的應(yīng)用統(tǒng)計學成績?nèi)缦拢?/p>

72856492767387829666776557907169707468796053758872786167計算該班學生應(yīng)用統(tǒng)計學的平均成績。解:數(shù)據(jù)的整理與抽樣例:某班級28名學生的應(yīng)用統(tǒng)計學70數(shù)據(jù)的整理與抽樣簡單算術(shù)平均數(shù)較準確地描述了總體與個體之間的數(shù)量關(guān)系,其描述方式同時考慮了變量值的次數(shù)和變量值的大小對集中趨勢的影響,數(shù)列中任何數(shù)值和次數(shù)的變化都會引起算術(shù)平均數(shù)的改變,它是最靈敏、對資料運用最充分的指標。數(shù)據(jù)的整理與抽樣簡單算術(shù)平均數(shù)較準確地描述了總體與個71數(shù)據(jù)的整理與抽樣⑵加權(quán)算術(shù)平均數(shù)當數(shù)據(jù)是已經(jīng)分組的頻數(shù)分布資料時,計算算術(shù)平均數(shù)需要用加權(quán)平均法?!皺?quán)”即占總次數(shù)的比重。近似算法如下:數(shù)據(jù)的整理與抽樣⑵加權(quán)算術(shù)平均數(shù)72數(shù)據(jù)的整理與抽樣均值組中值組數(shù)總體K樣本k數(shù)據(jù)的整理與抽樣均值組中值組數(shù)總體K樣本k73數(shù)據(jù)的整理與抽樣成績分組組中值人數(shù)50~6055211060~7065852070~80751182580~9085434090~100953285合計—282080數(shù)據(jù)的整理與抽樣成績分組組中值人數(shù)50~605521174數(shù)據(jù)的整理與抽樣在使用組中值作為第i組的代表值時,假設(shè)各組數(shù)據(jù)在組內(nèi)分布均勻,但實際上并非如此,所以計算的均值會產(chǎn)生誤差。均值不僅受組中值大小的影響,而且也會受權(quán)數(shù)的影響,權(quán)數(shù)越大,則該組數(shù)值對均值的影響就越大。由均值的計算公式很容易看出這一點。數(shù)據(jù)的整理與抽樣在使用組中值作為第i組的75數(shù)據(jù)的整理與抽樣

月工資(元)員工數(shù)(人)各組平均工資工資總額

fxx·f

1600以下401550620001600~170010016501650001700~180020017503500001800~190040018507400001900~200045019508750002000~220025021005250002200以上602300138000合計1500—2855000數(shù)據(jù)的整理與抽樣月工資(元)員工數(shù)(人)76數(shù)據(jù)的整理與抽樣

=2855000/1500=1903.33元算術(shù)平均數(shù)的特點:

⑴各變量值與其算術(shù)平均數(shù)的離差之和等于0,即⑵各變量值與其算術(shù)平均數(shù)的離差平方和為最小值(相對于其他任何數(shù)),即數(shù)據(jù)的整理與抽樣77數(shù)據(jù)的整理與抽樣

例如,為分析某鄉(xiāng)農(nóng)民家庭生活水平與家庭人口的關(guān)系,則需按人均月收入對該鄉(xiāng)農(nóng)戶分組。也可按戶人口數(shù)分組。人均月收入(分組)調(diào)查戶數(shù)人口數(shù)戶均人口數(shù)250以下9546.0250~3009495.4300~350311625.2350~400964034.2400~600692393.5600以上12352.9合計2269424.2數(shù)據(jù)的整理與抽樣例如,為分析某鄉(xiāng)農(nóng)民家庭生活水平與家庭人口78數(shù)據(jù)的整理與抽樣

2、幾何平均數(shù)它是與算術(shù)平均數(shù)不同的另一種平均數(shù),主要用于環(huán)比發(fā)展速度或比率均值的計算。⑴簡單幾何平均數(shù)這是在資料未分組情況下采用的一種計算方法。其中,是第i期的發(fā)展速度或比率。數(shù)據(jù)的整理與抽樣2、幾何平均數(shù)79數(shù)據(jù)的整理與抽樣某企業(yè)“九五”期間產(chǎn)品銷售額的年增長速度為因,所以可用對數(shù)計算幾何平均數(shù)。年份199519961997199819992000增長速度(%)2718231625相對前一年(%)127118123116125相對1995(%)100127149.9184.3213.8267.3數(shù)據(jù)的整理與抽樣某企業(yè)“九五”期間產(chǎn)品銷售額的年增長速度為80數(shù)據(jù)的整理與抽樣⑵加權(quán)幾何平均數(shù)在資料已經(jīng)分組,每個變量值出現(xiàn)次數(shù)或比重不等時,應(yīng)使用加權(quán)幾何平均。即對數(shù)計算公式為數(shù)據(jù)的整理與抽樣⑵加權(quán)幾何平均數(shù)81數(shù)據(jù)的整理與抽樣假設(shè)投資銀行某項投資的年利率按復(fù)利計算,25年的年利率分配為:有1年3%,有4年4%,有8年8%,有10年10%,有2年15%,求平均年利率。(單利:)數(shù)據(jù)的整理與抽樣假設(shè)投資銀行某項投資的年利率按復(fù)利計82數(shù)據(jù)的整理與抽樣

3、中位數(shù)將一組變量值按大小順序排列,位于數(shù)列中間位置的變量值即為中位數(shù)。由于中位數(shù)居于數(shù)列正中,所以它可以作為代表一般水平和集中趨勢的代表值。在標志變異度較大的情況下,可避免極端數(shù)值(不穩(wěn)健)的影響。⑴單項變量數(shù)數(shù)列

中位數(shù)為為中位數(shù)的位置。數(shù)據(jù)的整理與抽樣3、中位數(shù)83數(shù)據(jù)的整理與抽樣例:某班級28名學生的應(yīng)用統(tǒng)計學成績?nèi)缦拢?/p>

72856492767387829666776557907169707468796053758872786167計算該班學生應(yīng)用統(tǒng)計學成績的中位數(shù)。解:N=28,Me=(N+1)/2=(28+1)/2=14.5對成績順序排列后,X14=72,X15=73

數(shù)據(jù)的整理與抽樣例:某班級28名學生的應(yīng)用統(tǒng)計學84數(shù)據(jù)的整理與抽樣

⑵組距變量數(shù)列①確定中位數(shù)所在組計算公式為N/2或,N和為總次數(shù);②計算中位數(shù)下限公式含有中位組均勻分布的假設(shè)。數(shù)據(jù)的整理與抽樣⑵組距變量數(shù)列85數(shù)據(jù)的整理與抽樣其中,L—中位數(shù)所在組的下組限;—數(shù)值在L之下各組的累計次數(shù);—中位數(shù)所在組的次數(shù);

d—中位數(shù)所在組的組距。上限公式數(shù)據(jù)的整理與抽樣其中,L—中位數(shù)所在組的下組限;86數(shù)據(jù)的整理與抽樣例:成績分組組中值人數(shù)50~6055211060~7065852070~80751182580~9085434090~100953285合計—282080數(shù)據(jù)的整理與抽樣例:成績分組組中值人數(shù)50~687數(shù)據(jù)的整理與抽樣解:N=28,L=70,Sm-1=10,=11,d=10顯然,數(shù)據(jù)的整理與抽樣解:N=28,L=70,Sm88數(shù)據(jù)的整理與抽樣

例:

年收入額(元)農(nóng)戶數(shù)百分比(%)2600~280024082800~300048016

3000~3200

1050

353200~3400600203400~360027093600~380021073800~400012044200~4400301

合計3000100數(shù)據(jù)的整理與抽樣例:年收入額(元)89數(shù)據(jù)的整理與抽樣解:N=3000,L=3000,Sm-1=720,=1050,d=200顯然,數(shù)據(jù)的整理與抽樣解:N=3000,L=30090數(shù)據(jù)的整理與抽樣

4、四分位數(shù)四分位數(shù)是將數(shù)據(jù)排序后,將數(shù)據(jù)四等分的三個數(shù)值,其中中間的數(shù)值是中位數(shù)。在中位數(shù)與最大值和中位數(shù)與最小值之間再找到兩個數(shù)值,即可將數(shù)據(jù)四等分。四分位數(shù)的三個分割點的位置分別為數(shù)據(jù)的整理與抽樣4、四分位數(shù)91數(shù)據(jù)的整理與抽樣⑴上四分位數(shù)若上四分位數(shù)為Xi,則⑵下四分位數(shù)若下四分位數(shù)為Xj,則其中,表示向上取整。數(shù)據(jù)的整理與抽樣⑴上四分位數(shù)92數(shù)據(jù)的整理與抽樣

在資料分組的情況下,四分位值的三個點分別以N/4、2N/4和3N/4定位,之后求3個四分位數(shù)。第i個四分位點的值為其中,—第i個分位值所在組的下限;—其前各組的累計次數(shù);—其所在組的次數(shù);—其所在組的組距。數(shù)據(jù)的整理與抽樣在資料分組的情況下,四分位值的三個點93數(shù)據(jù)的整理與抽樣

5、眾數(shù)眾數(shù)是將數(shù)據(jù)按大小順序排隊后,出現(xiàn)次數(shù)明顯最多或最有明顯集中趨勢的點的數(shù)值。它是指在總體中最常遇到的現(xiàn)象,即在一個數(shù)列中出現(xiàn)最多的標志值。例如,大多數(shù)工人可完成的工作量、大多數(shù)人的收入、最一般的身高等。它不受變量數(shù)列極值的影響,用具有次數(shù)最多的標志值描述集中趨勢,代表的范圍最廣。但是,眾數(shù)的取得必須在個體數(shù)足夠多且又有明顯集中趨勢時才有意義。數(shù)據(jù)的整理與抽樣5、眾數(shù)94數(shù)據(jù)的整理與抽樣

如果分布沒有明顯的最高點,則眾數(shù)不存在。如果有兩個相同的最高點,也可有兩個眾數(shù)。M0M0M0M0數(shù)據(jù)的整理與抽樣如果分布沒有明顯的最高點,則眾數(shù)不存95數(shù)據(jù)的整理與抽樣眾數(shù)的確定方法⑴若為單項變量數(shù)列,則變量出現(xiàn)次數(shù)最多(頻率最高)的變量值就是眾數(shù)。

日班次平均加工零件數(shù)量(個)x工人數(shù)(人)f50205530

60806510705

合計145數(shù)據(jù)的整理與抽樣眾數(shù)的確定方法日班次平均加工零件數(shù)量(個)96數(shù)據(jù)的整理與抽樣

⑵若為等組距變量數(shù)列,則分兩步:年收入額(元)農(nóng)戶數(shù)百分比(%)2600~280024082800~300048016

3000~3200

1050

353200~3400600203400~360027093600~380021073800~400012044200~4400301

合計3000100數(shù)據(jù)的整理與抽樣⑵若為等組距變量數(shù)列,則分兩步:年97數(shù)據(jù)的整理與抽樣⑴確定眾數(shù)組頻次最高的一組為眾數(shù)組。3000~3200元之間;⑵計算眾數(shù)與眾數(shù)組相鄰的兩組數(shù)頻次的多少有關(guān):①若相鄰兩組數(shù)的頻次相等,則眾數(shù)組的中值就是眾數(shù);數(shù)據(jù)的整理與抽樣⑴確定眾數(shù)組98數(shù)據(jù)的整理與抽樣

②若相鄰兩組數(shù)的頻次不等,則眾數(shù)為其中:L—眾數(shù)組的下限值;—眾數(shù)組與其下限相鄰組的頻次差;—眾數(shù)組與其上限相鄰組的頻次差;

d—眾數(shù)組的組距。(下限公式)數(shù)據(jù)的整理與抽樣②若相鄰兩組數(shù)的頻次不等,則眾數(shù)為99數(shù)據(jù)的整理與抽樣

在本例中,L=3000d=3200-3000=200=1050-480=570或=35%-16%=19%=1050-600=450或=35%-20%=15%則或

上限公式為數(shù)據(jù)的整理與抽樣在本例中,L=3000d=32100數(shù)據(jù)的整理與抽樣

例:計算全班學生應(yīng)用統(tǒng)計學的眾數(shù)。成績分組人數(shù)50~60260~70870~801180~90490~1003合計28數(shù)據(jù)的整理與抽樣例:計算全班學生應(yīng)用統(tǒng)計學的眾數(shù)。101數(shù)據(jù)的整理與抽樣

解:L=70,,,d=10

數(shù)據(jù)的整理與抽樣解:L=70,102數(shù)據(jù)的整理與抽樣在度量集中趨勢的幾種均值指標中,算術(shù)平均數(shù)、中位數(shù)、眾數(shù)最為重要。三者之間存在如下關(guān)系:當次數(shù)分布完全對稱時,當次數(shù)分布為偏態(tài)時,數(shù)據(jù)的整理與抽樣在度量集中趨勢的幾種均值指標中,算術(shù)103數(shù)據(jù)的整理與抽樣6、集中趨勢分析應(yīng)注意的幾個問題⑴只有同質(zhì)總體才能計算平均值,各個體之間僅存在數(shù)量差異;⑵在分組的條件下,總體的均值不僅受組的均值大小的影響,同時還受總體內(nèi)部結(jié)構(gòu)變動的影響。當總體內(nèi)部結(jié)構(gòu)變化時,總體均值就不能全面、準確地反映現(xiàn)象的特征和規(guī)律;數(shù)據(jù)的整理與抽樣6、集中趨勢分析應(yīng)注意的幾個問題104數(shù)據(jù)的整理與抽樣⑶應(yīng)以分布數(shù)量和典型事例作補充說明總體的集中趨勢;⑷應(yīng)與離散趨勢分析相結(jié)合,以全面反映現(xiàn)象個體的差異。數(shù)據(jù)的整理與抽樣⑶應(yīng)以分布數(shù)量和典型事例作補充說明105數(shù)據(jù)的整理與抽樣二、離散趨勢

1、問題的提出

集中趨勢反映了總體單位(個體)標志值分布特征的一個重要方面,但僅用此指標描述這些標志的一般水平是不夠的。要全面描述總體單位標志值的分布特征,必須對標志值的差異性進行研究。離中趨勢是指一組變量值背離分布中心值的特征,它與集中趨勢共同說明總體的分布特征。數(shù)據(jù)的整理與抽樣二、離散趨勢106數(shù)據(jù)的整理與抽樣2、離中趨勢度量的目的⑴描述總體內(nèi)部差異程度,反映社會經(jīng)濟活動的均衡性,為管理決策提供信息。班級語文數(shù)學歷史地理化學物理總評甲班82868083838483乙班75898478809283數(shù)據(jù)的整理與抽樣2、離中趨勢度量的目的班級語文107數(shù)據(jù)的整理與抽樣⑵衡量和比較均值指標代表性的高低離中趨勢指標數(shù)值的大小和均值代表程度高低有密切關(guān)系。離中趨勢指標數(shù)值越大,均值的代表性就越?。欢x中趨勢指標數(shù)值越小,均值的代表性就越大。這充分

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負責。
  • 6. 下載文件中如有侵權(quán)或不適當內(nèi)容,請與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

評論

0/150

提交評論