




版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進(jìn)行舉報或認(rèn)領(lǐng)
文檔簡介
1、Chapter 2,描述,本章重點(diǎn),尺度,形態(tài),分位數(shù),箱線圖,位置,詹姆斯,杜蘭特,詹姆斯,杜蘭特,詹姆斯,分布形態(tài),鐘型分布(bell shaped),鐘型分布中間觀測值分布多,越往兩側(cè)分布越少。因其形狀像鐘而得名。 根據(jù)分布的對稱性,鐘型分布又可分為對稱分布、左偏分布和右偏分布,對稱分布(symmetry),對稱分布,左偏(left skewed),左偏,右偏(right skewed),右偏,正態(tài)分布(normal distribution),也叫高斯分布(gaussian distribution)是一種完美的、對稱的鐘型分布,可以用函數(shù)精確地表達(dá)出來 實(shí)踐中大量的變量逼近正態(tài)分布,
2、換而言之,一個變量大約成正態(tài)分布才是正常(normal)的,杜蘭特,對比,雙直方圖( bi-histogram),對比,描述,位置(location):中心(center) 尺度(scale):差異(variability)或離散(spread) 形態(tài)(shape),第一節(jié) 位置,均值(mean) 眾數(shù) (mode) 中位數(shù) (median) 分位數(shù) (quantile),均值,觀測值之和除以觀測值數(shù)目,中位數(shù),中間位置上的數(shù) 觀測值從小到大排列 中間位置:(n-1)/2+1,中位數(shù),排序: 中間位置:(n-1)/2+1=(101-1)/2+1=51 中位數(shù):31,眾數(shù),分布次數(shù)(頻數(shù))最多的
3、觀測值 次數(shù)分布 找到分布最多的觀測值 眾數(shù)不一定存在,也不一定唯一 事實(shí)上,連續(xù)型變量很難精確地找到眾數(shù),眾數(shù)位置,分布,眾數(shù),位置:最多分布為9 眾數(shù):33,分位數(shù),q分位數(shù):觀測值從小到大排序后,q等分,處于分界點(diǎn)上的數(shù) 二分位數(shù)(中位數(shù)) 三分位數(shù)(tertiles) 四分位數(shù)(quartiles) 五分位數(shù)(quintiles) 六分位數(shù)(sextiles) 十分位數(shù)(deciles) 十二分位數(shù)(duo-deciles) 二十分位數(shù)(vigintiles) 百分位數(shù)(percentiles) 千分位數(shù)(permilles),四分位數(shù),觀測值按大小順序排列后,均分為四部分,處于分界點(diǎn)
4、上的數(shù) 2/4位置:中位數(shù) 1/4位置:下四分位數(shù) 3/4位置:上四分位數(shù),四分位數(shù),詹姆斯: 杜蘭特:,月薪,從某公司隨機(jī)抽取13位職工,調(diào)查他們的月薪如下: 2000 2600 3500 1800 2500 4800 2800 3000 2200 3300 5200 4600 4000,四分位數(shù)位置,1,7,6,5,4,3,2,13,12,11,10,9,8,4,7,10,十分位數(shù)位置,1,7,6,5,4,3,2,13,12,11,10,9,8,2.2,3.4,4.6,5.8,7,8.2,9.4,10.6,11.8,分位數(shù)位置,第k個q分位數(shù)的位置:,位置匯總,均值:27.13 中位數(shù):2
5、6 眾數(shù):25 下四分位數(shù):22 上四分位數(shù):32,均值:31.62 中位數(shù):31 眾數(shù):33 下四分位數(shù):27 上四分位數(shù):36,練習(xí),求30家經(jīng)銷商銷量均值、中位數(shù)、眾數(shù)、四分位數(shù)、十分位數(shù),第二節(jié) 尺度,絕對平均差(average absolute deviation) 方差(variance) 標(biāo)準(zhǔn)差(standard deviation) 全距(range) 四分位距(inter-quartile range) 絕對中位差(median absolute deviation),散點(diǎn)圖,均值,差異( 離散),中心化( centering),中心化,合計,合計不為0,絕對值,絕對平均差,
6、平方,方差,自由度,計算樣本方差時應(yīng)除以n-1,而不是n,這里n-1叫自由度(degree of freedom),表示樣本可自由取值的數(shù)目,自由度?,如果某班只有1位學(xué)生,身高為172,如果從某班抽取1位學(xué)生調(diào)查其身高為172,總體無差異,無法獲知總體差異,標(biāo)準(zhǔn)差,變異系數(shù)( coefficient of variation),標(biāo)準(zhǔn)差只能度量絕對差異,而不能度量相對差異 變異系數(shù),全距,四分位距,絕對中位差,尺度匯總,絕對平均差: 6.31 方差: 67.3 標(biāo)準(zhǔn)差: 8.20 變異系數(shù):0.302 全距: 54 四分位距: 10 絕對中位差:5,絕對平均差: 5.96 方差: 59.0 標(biāo)
7、準(zhǔn)差: 7.68 變異系數(shù):0.243 全距: 41 四分位距: 9 絕對中位差:5,總體均值和方差,假設(shè)知道總體的數(shù)據(jù),則可計算總體均值和方差 因?yàn)榭傮w是唯一的,總體均值和方差也是唯一的,故也稱總體參數(shù)(parameter) 實(shí)際中只能用樣本均值和方差去估計總體,練習(xí),求10家經(jīng)銷商銷量的絕對平均差、方差、標(biāo)準(zhǔn)差、變異系數(shù)、全距、四分位距、絕對中位差,極端值(extremes),也叫離群值(outliers),指明顯偏離主體數(shù)據(jù)的值。極端值應(yīng)給予特別關(guān)注: 觀測錯誤 特殊情況,判定,3倍標(biāo)準(zhǔn)差 1.5倍四分位距,準(zhǔn)則,極小值,極大值,標(biāo)準(zhǔn)化(無尺度化),極小值,極大值,準(zhǔn)則,極小值,極大值,
8、討論,判斷30家經(jīng)銷商銷量的極端值,月薪,正常數(shù)據(jù) 有極大值數(shù)據(jù),右偏,正常,右偏,月薪,正常數(shù)據(jù) 有極小值數(shù)據(jù),左偏,正常,左偏,月薪,正常數(shù)據(jù) 既有極大值,又有極小值數(shù)據(jù),尖峰(厚尾),正常,尖峰(厚尾),銷量,正常數(shù)據(jù) 有極大值數(shù)據(jù),位置描述,均值:50.1 中位數(shù):48.5 眾數(shù):47,均值:63.9 中位數(shù):50 眾數(shù):47,正常,極大值,尺度描述,正常,極大值,絕對平均差: 9.87 方差: 171.4 標(biāo)準(zhǔn)差: 13.1 變異系數(shù):0.26 全距: 58 四分位距: 10 絕對中位差:6.5,絕對平均差: 28.85 方差: 5768.5 標(biāo)準(zhǔn)差: 76.0 變異系數(shù):1.19
9、全距: 440 四分位距: 10 絕對中位差:8.5,穩(wěn)健(robust),諸如中位數(shù)、四分位距、絕對中位差的只受主體數(shù)據(jù)影響不受極端值影響的統(tǒng)計量成為穩(wěn)健統(tǒng)計量 穩(wěn)健統(tǒng)計量意味著缺乏敏感性,調(diào)整均值,中間均值(mid-mean):用25%75%分位數(shù)之間的數(shù)據(jù)計算均值 切尾均值(trimmed mean):用5%95%分位數(shù)之間的數(shù)據(jù)計算均值 縮尾均值(winsorized mean):將5%分位數(shù)之前的數(shù)據(jù)替為5%分位數(shù),95%之后的數(shù)據(jù)替為95%分位數(shù),再計算均值,討論,求30家經(jīng)銷商銷量均值、中間均值、切尾均值、縮尾均值,第三節(jié) 形態(tài),偏度(skewness) 峰度(kurtosis)
10、,中心化數(shù)據(jù)(一次方),二次方,三次方,四次方,匯總圖,中心矩(central moment),二階中心矩即為方差 三階中心矩可度量偏度 四階中心矩可度量峰度,偏度,標(biāo)準(zhǔn)化(無尺度化)三階中心矩 偏度大于0為右偏,小于0為左偏,峰度,標(biāo)準(zhǔn)化(無尺度化)四階中心矩 正態(tài)分布的峰度為3,因此峰度大于3為尖峰(厚尾),小于3為平峰(薄尾)。超額峰度(excess kurtosis):,形態(tài),偏度:0.705 峰度:4.99 超額峰度:1.99,偏度:0.249 峰度:3.29 超額峰度:0.29,討論,求10家經(jīng)銷商銷量的偏度和峰度,箱線圖(box plot),5點(diǎn): P1: P2: P3: P4: P5:,繪圖,P1,P2,P3,P4,P5,箱線圖可以看出,位置(中心) 尺度(差異或離散) 偏態(tài)和峰態(tài) 極端值,對比,練習(xí) 相對濕度(%),濕度,第四節(jié) 其它,分組數(shù)據(jù)(grouped data) 質(zhì)量變量的描述,分組數(shù)據(jù),30,2029 3039 4049 5059 6069 7079,2 4 10 8 4 2,24.534.544.554.564.574.5,分組數(shù)據(jù),加權(quán)平均,均值 方差 其中,x為組中值,f為權(quán)數(shù),加權(quán)平均,計算,加權(quán)的意義,較之簡單(simple)平均,加權(quán)(weighted)平均意味著觀測值在均值中的重要性會隨著權(quán)數(shù)調(diào)整 簡單平均可看作加權(quán)平均的特
溫馨提示
- 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
- 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
- 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
- 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負(fù)責(zé)。
- 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請與我們聯(lián)系,我們立即糾正。
- 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時也不承擔(dān)用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。
最新文檔
- 智能家居股權(quán)并購保密協(xié)議及產(chǎn)業(yè)鏈合作合同
- 水性外墻涂料購銷與售后服務(wù)協(xié)議
- 醫(yī)療健康股權(quán)收購意向合同范本
- 文化產(chǎn)業(yè)股權(quán)收購與跨界合作框架協(xié)議
- 購房合同補(bǔ)充協(xié)議中關(guān)于房屋交易價格調(diào)整的機(jī)制
- 樓房管道檢修方案
- 閑置廚房資產(chǎn)評估方案
- 老房翻新修建方案
- 園林栽樹預(yù)算方案模板
- 裝修污染全程監(jiān)控方案
- 互聯(lián)網(wǎng)行業(yè)產(chǎn)品經(jīng)理專業(yè)顧問聘用協(xié)議
- 2025年 東北石油大學(xué)招聘考試筆試試題附答案
- 2025年安徽省中考地理真題試卷(含答案)
- 人教版2025年八年級英語下學(xué)期期末總復(fù)習(xí)(專題訓(xùn)練)專題01單項選擇【期末易錯100題】(人教版)(學(xué)生版+解析)
- 企業(yè)財務(wù)內(nèi)控管理制度
- 2025以色列與伊朗沖突全面解析課件
- 警察抓捕教學(xué)課件
- 2025年農(nóng)產(chǎn)品質(zhì)量安全追溯體系在食品安全監(jiān)管中的應(yīng)用與改進(jìn)報告
- 做賬實(shí)操-漁業(yè)行業(yè)的賬務(wù)處理分錄實(shí)例
- 2025-2030年中國手持三維激光掃描儀行業(yè)市場深度分析及發(fā)展趨勢與投資前景研究報告
- 2025-2030年中國單壁碳納米管(SWNT)行業(yè)市場現(xiàn)狀供需分析及投資評估規(guī)劃分析研究報告
評論
0/150
提交評論