版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進(jìn)行舉報或認(rèn)領(lǐng)
文檔簡介
數(shù)據(jù)的描述分析賈俊平2024/3/94.1數(shù)據(jù)水平的描述4.2數(shù)據(jù)差異的描述4.3分布形狀的描述4.4R的綜合描述函數(shù)
數(shù)據(jù)的描述分析學(xué)習(xí)目標(biāo)掌握各描述統(tǒng)計量的特點(diǎn)和應(yīng)用場合使用R函數(shù)計算各描述統(tǒng)計量利用各統(tǒng)計量分析數(shù)據(jù)并能對結(jié)果進(jìn)行合理解釋思政目標(biāo)數(shù)據(jù)的描述性分析主要是利用各種統(tǒng)計量來概括數(shù)據(jù)的特征。描述性分析中,要根據(jù)各統(tǒng)計量的特點(diǎn)和應(yīng)用條件進(jìn)行合理使用和分析描述性分析要結(jié)合我國的宏觀經(jīng)濟(jì)和社會數(shù)據(jù),分析社會和經(jīng)濟(jì)發(fā)展的成就和公平與合理程度,避免以偏概全等不恰當(dāng)應(yīng)用學(xué)習(xí)目標(biāo)和思政目標(biāo)學(xué)習(xí)目標(biāo)和思政目標(biāo)
平均數(shù)簡單平均數(shù)加權(quán)平均數(shù)
4.1
數(shù)據(jù)水平的描述R函數(shù)mean\\weighted.mean【例4-1】隨機(jī)抽取30個大學(xué)生,得到他們在“雙十一”期間的網(wǎng)購金額數(shù)據(jù),如表所示。計算30個人的平均網(wǎng)購金額平均數(shù)——簡單平均數(shù)——例題分析479.0721.2672.4728.7443.2381.3527.0500.0586.0500.0528.2633.8705.9423.5590.1353.6447.4565.3557.1481.3561.1620.1477.1436.2562.9505.1515.4502.7487.5675.4
4.1
數(shù)據(jù)水平的描述【例4-2】假定將表4-1的數(shù)據(jù)分成組距為50的組,分組結(jié)果如表4-2所示,計算網(wǎng)購金額的平均數(shù)平均數(shù)——加權(quán)平均數(shù)——例題分析
分組人數(shù)350~4002400~4504450~5004500~5507550~6006600~6502650~7002700~7503合計30分組350~4003752750400~45042541700450~50047541900500~55052573675550~60057563450600~65062521250650~70067521350700~75072532175合計
3016250
4.1
數(shù)據(jù)水平的描述分位數(shù)——中位數(shù)——例題分析分位數(shù)——一組數(shù)據(jù)按從小到大排序后,可以找出排在某個位置上的數(shù)值,該數(shù)值可以代表數(shù)據(jù)水平的高低。這些位置上的數(shù)值就是相應(yīng)的分位數(shù)(quantile)。常用的分位數(shù)有中位數(shù)、四分位數(shù)、百分位數(shù)等中位數(shù)——排序后處于中間位置上的值。不受極端值影響位置確定數(shù)值計算
4.1
數(shù)據(jù)水平的描述R函數(shù)median分位數(shù)——四分位數(shù)——例題分析四分位數(shù)一組數(shù)據(jù)排序后處在25%和75%位置上的數(shù)值用3個點(diǎn)將全部數(shù)據(jù)等分為4部分,其中每部分包含25%的數(shù)據(jù)中間的四分位數(shù)就是中位數(shù),通常所說的四分位數(shù)是指處在25%位置上和75%位置上的兩個數(shù)值位置確定
4.1
數(shù)據(jù)水平的描述R函數(shù)quantile分位數(shù)——百分位數(shù)百分位數(shù)(percentile)是用99個點(diǎn)將數(shù)據(jù)分成100等分,處于各分位點(diǎn)上的數(shù)值就是百分位數(shù)百分位數(shù)提供了各項數(shù)據(jù)在最小值和最大值之間分布的信息中間的四分位數(shù)就是中位數(shù),通常所說的四分位數(shù)是指處在25%位置上和75%位置上的兩個數(shù)值
4.1
數(shù)據(jù)水平的描述位置確定
R函數(shù)quantile分位數(shù)——百分位數(shù)——例題分析
4.1
數(shù)據(jù)水平的描述眾數(shù)
4.1
數(shù)據(jù)水平的描述R函數(shù)#DescTools包//Mode各度量值的比較平均數(shù)易受極端值影響數(shù)學(xué)性質(zhì)優(yōu)良,實(shí)際中最常用數(shù)據(jù)對稱分布或接近對稱分布時代表性較好中位數(shù)不受極端值影響數(shù)據(jù)分布偏斜程度較大時代表性接好眾數(shù)不受極端值影響具有不惟一性數(shù)據(jù)分布偏斜程度較大且有明顯峰值時代表性較好
4.1
數(shù)據(jù)水平的描述極差和四分位差——極差
4.2
數(shù)據(jù)差異的描述極差和四分位差——四分位差
4.2
數(shù)據(jù)差異的描述方差和標(biāo)準(zhǔn)差——例題分析【例4-7】沿用例4-1。計算30個人網(wǎng)購金額的極差和四分位差和標(biāo)準(zhǔn)差解:使用R函數(shù)得極差=375.1四分位差=109.5
4.2
數(shù)據(jù)差異的描述R函數(shù)IQR方差和標(biāo)準(zhǔn)差方差——各變量值與均值的平均差異標(biāo)準(zhǔn)差——上四分位數(shù)與下四分位數(shù)之差
樣本標(biāo)準(zhǔn)差s
樣本標(biāo)準(zhǔn)差s
原始數(shù)據(jù)分組數(shù)據(jù)
4.2
數(shù)據(jù)差異的描述方差和標(biāo)準(zhǔn)差——例題分析
【例4-9】沿用例4-2。根據(jù)表4-2的分組數(shù)據(jù),計算網(wǎng)購金額的標(biāo)準(zhǔn)差
4.2
數(shù)據(jù)差異的描述分組350~400375227777.7955555.58400~450425413611.1254444.48450~50047544444.4517777.80500~5505257277.781944.45550~60057561111.116666.65600~65062526944.4413888.88650~700675217777.7735555.54700~750725333611.10100833.30合計—30105555.55286666.67R函數(shù)#var;#sd離散系數(shù)——例題分析離散系數(shù)——標(biāo)準(zhǔn)差與其相應(yīng)的均值之比對數(shù)據(jù)相對離散程度的測度消除了數(shù)據(jù)水平高低和計量單位的影響用于對不同組別數(shù)據(jù)離散程度的比較計算公式為【例4-10】
為分析不同行業(yè)上市公司每股收益的差異,在互聯(lián)網(wǎng)服務(wù)行業(yè)和機(jī)械制造行業(yè)各隨機(jī)抽取10家上市公司,得到某年度的每股收益數(shù)據(jù)如表4-5所示。比較兩類上市公司每股收益的離散程度
4.2
數(shù)據(jù)差異的描述互聯(lián)網(wǎng)公司機(jī)械制造公司0.320.680.470.430.890.280.970.030.870.421.090.240.730.660.960.290.960.020.630.59統(tǒng)計量互聯(lián)網(wǎng)公司機(jī)械制造公司平均數(shù)0.7890.364標(biāo)準(zhǔn)差0.2470020.236606離散系數(shù)0.3130570.650015標(biāo)準(zhǔn)分?jǐn)?shù)標(biāo)準(zhǔn)分?jǐn)?shù)也稱標(biāo)準(zhǔn)化值。對某一個值在一組數(shù)據(jù)中相對位置的度量可用于判斷一組數(shù)據(jù)是否有離群點(diǎn)(outlier)用于對變量的標(biāo)準(zhǔn)化處理計算公式為
4.2
數(shù)據(jù)差異的描述R函數(shù)scale標(biāo)準(zhǔn)分?jǐn)?shù)——例題分析【例4-11】沿用例4-1。計算30個人網(wǎng)購金額的標(biāo)準(zhǔn)分?jǐn)?shù)網(wǎng)購金額標(biāo)準(zhǔn)分?jǐn)?shù)網(wǎng)購金額標(biāo)準(zhǔn)分?jǐn)?shù)網(wǎng)購金額標(biāo)準(zhǔn)分?jǐn)?shù)479.0-0.6141672.41.3670443.2-0.9808527.0-0.1224586.00.4820528.2-0.1101705.91.7102590.10.5240447.4-0.9378557.10.1859561.10.2269477.1-0.6336562.90.2453515.4-0.2412487.5-0.5270721.21.8669728.71.9438381.3-1.6149500.0-0.3990500.0-0.3990633.80.9716423.5-1.1826353.6-1.8987565.30.2699481.3-0.5906620.10.8313436.2-1.0526505.1-0.3468502.7-0.3713675.41.3978
4.2
數(shù)據(jù)差異的描述偏度系數(shù)和峰度系數(shù)
峰度(kurtosis)——指數(shù)據(jù)分布峰值的高低由統(tǒng)計學(xué)家K.Pearson于1905年首次提出峰度系數(shù)—測度一組數(shù)據(jù)分布峰值高低的統(tǒng)計量是(coefficientofkurtosis),記作K計算公式
4.3
數(shù)據(jù)形狀的描述偏度系數(shù)和峰度系數(shù)——例題分析
4.3
數(shù)據(jù)形狀的描述R函數(shù)#e1071包//
skewness//
kurtosis
pastecs包中的stat.desc函數(shù)和psych包中的describe函數(shù)【例4-13】
沿用例4-10。計算互聯(lián)網(wǎng)服務(wù)行業(yè)和機(jī)械制造行業(yè)上市公司每股盈的各描述統(tǒng)計量,并進(jìn)行綜合分析#使用pastecs包中的stat.desc函數(shù)計算描述統(tǒng)計量
4.4
R的綜合描述函數(shù)互聯(lián)網(wǎng)公司機(jī)械制造公司nbr.val10.000010.0000nbr.null0.00000.0000nbr.na0.00000.0000min0.32000.0200max1.09000.6800range0.77000.6600sum7.89003.6400median0.88000.3550mean0.78900.3640SE.mean0.07810.0748CI.mean.0.950.17670.1693var0.06100.0560std.dev0.24700.2366coef.var0.31310.6500
pastecs包中的stat.desc函數(shù)和psych包中的describe函數(shù)【例4-13】
沿用例4-10#使用psych包中的describe函數(shù)計算描述統(tǒng)計量varsnmeansdmediantrimmedmadminmaxrangeskewkurtosisse互聯(lián)網(wǎng)公司1100.790.250.880.810.180.321.090.77-0.63-1.110.08機(jī)械制造公司2100.360.240.360.370.260.020.680.66-0.09-1.500.07
4.4
R的綜合描述函數(shù)綜合分析互聯(lián)網(wǎng)類上市公司的每股平均盈利高于機(jī)械制造類上市公司,雖然從標(biāo)準(zhǔn)差看互聯(lián)網(wǎng)類上市公司大于機(jī)械制造類上市公司,但離散系數(shù)(互聯(lián)網(wǎng)類上市公司0.3131,機(jī)械制造類上市公司為0.6500)離散系數(shù)看,互聯(lián)網(wǎng)類上
溫馨提示
- 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
- 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
- 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
- 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負(fù)責(zé)。
- 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請與我們聯(lián)系,我們立即糾正。
- 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時也不承擔(dān)用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。
最新文檔
- 二零二五年度物聯(lián)網(wǎng)技術(shù)代開發(fā)保密合同4篇
- 二零二五年度打印機(jī)銷售與市場推廣服務(wù)合同4篇
- 2025年度櫥柜行業(yè)綠色環(huán)保認(rèn)證合同4篇
- 二零二五版綠色建筑配套綠化施工合同4篇
- 二零二五年度汽車4S店年度促銷活動合同4篇
- 2025年銷售業(yè)務(wù)合同簽訂及物流配送服務(wù)流程規(guī)范2篇
- 2025版事業(yè)單位合同到期員工轉(zhuǎn)正及晉升激勵方案3篇
- 二零二五年度教育培訓(xùn)機(jī)構(gòu)借款合同范本4篇
- 2024版武漢二手住宅買賣合同
- 二零二五版毛石石材質(zhì)量檢測與認(rèn)證合同4篇
- 化學(xué)-河南省TOP二十名校2025屆高三調(diào)研考試(三)試題和答案
- 智慧農(nóng)貿(mào)批發(fā)市場平臺規(guī)劃建設(shè)方案
- 2023年水利部黃河水利委員會招聘考試真題
- Python編程基礎(chǔ)(項目式微課版)教案22
- 半導(dǎo)體工藝用膠帶全球市場、份額、市場規(guī)模、趨勢、行業(yè)分析報告2024-2030年
- 建筑施工中常見的安全問題及解決方法
- 近五年重慶中考物理試題及答案2023
- 乳腺導(dǎo)管原位癌
- 冷庫管道應(yīng)急預(yù)案
- 《學(xué)習(xí)教育重要論述》考試復(fù)習(xí)題庫(共250余題)
- 網(wǎng)易云音樂用戶情感畫像研究
評論
0/150
提交評論