版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請(qǐng)進(jìn)行舉報(bào)或認(rèn)領(lǐng)
文檔簡(jiǎn)介
●教育部經(jīng)濟(jì)管理類核心課程教材●“十二五”普通高等教育本科國家級(jí)規(guī)劃教材●北京高等教育精品教材●北京高等學(xué)校優(yōu)質(zhì)本科教材課件(第8版)—SPSS和Excel實(shí)現(xiàn)五”普通高等教臺(tái)本科國家級(jí)現(xiàn)則教材統(tǒng)計(jì)學(xué)SPSS
和Excel實(shí)現(xiàn)(第8版)STATISTICS統(tǒng)計(jì)學(xué)2022/5/22北京高等教育精品教材第
1
章
統(tǒng)計(jì)、數(shù)據(jù)和計(jì)算機(jī)1.1統(tǒng)計(jì)學(xué)及其應(yīng)用領(lǐng)域
1.2怎樣獲得數(shù)據(jù)1
.3
統(tǒng)計(jì)與計(jì)算機(jī)第1章數(shù)據(jù)、統(tǒng)計(jì)和計(jì)算機(jī)描述推
斷
)應(yīng)用2022/5/22思維導(dǎo)圖數(shù)據(jù)分析基礎(chǔ)統(tǒng)計(jì)方法基礎(chǔ)關(guān)系分析預(yù)測(cè)非參數(shù)檢驗(yàn)統(tǒng)
計(jì)
學(xué)(
第
8
版
)
—第2章用圖表展示數(shù)據(jù)第3章用統(tǒng)計(jì)量描述數(shù)據(jù)第4章概率分布第5章參數(shù)估計(jì)第6章假設(shè)檢驗(yàn)第7章類別變量推斷第8章方
頭
v
反
計(jì)第9章一元線性回歸第10章多元線性回歸第11章時(shí)間序列預(yù)測(cè)第12章非參數(shù)檢驗(yàn)1-3圖表展示統(tǒng)計(jì)量描述推斷理論基礎(chǔ)估計(jì)原理與方法檢驗(yàn)原理與方法類別變量與類別變量因變量,數(shù)值
自變量:類別因變量:數(shù)值
自變量:數(shù)值或類別時(shí)間序列參數(shù)方法不適應(yīng)的情形描述方法推斷方法其他方法統(tǒng)計(jì)方法分類與本書框架思考以下問題●吸煙對(duì)健康是有害的,吸香煙的男性減少壽命2250天●不結(jié)婚的男性會(huì)減少壽命3500天,不結(jié)婚的女性會(huì)減少壽命1600天●身體超重30%會(huì)使壽命減少1300天●每天攝取500毫升維生素C,生命可延長(zhǎng)6年●身材高的父親,其子女的身材也較高●第二個(gè)出生的子女沒有第一個(gè)聰明,第三個(gè)出生的子女沒有第二個(gè)聰明,依此類推●學(xué)生們?cè)诼犃四劁撉偾?0分鐘后的推理,要比他們聽10分鐘娛樂性的其他曲目后的推理做得更好●漂亮的女性有損男性的智力。男性在看到漂亮女性時(shí)智力會(huì)下降,這就是為什么大學(xué)里的女孩子比
男孩子學(xué)習(xí)好的原因●上課坐在前面的學(xué)生平均考試分?jǐn)?shù)比坐在后面的學(xué)生高●中國科學(xué)院空間環(huán)境研究預(yù)報(bào)中心的專家稱,在神舟七號(hào)載人航天飛行期間,飛船遭遇空間碎片的
概率在百萬分之一以下2022/5/22
統(tǒng)計(jì)學(xué)(第8版)—
1-4怎樣理解這樣一些統(tǒng)計(jì)結(jié)論第1章數(shù)據(jù)、統(tǒng)計(jì)和計(jì)算機(jī)
、
統(tǒng)計(jì)學(xué)及其應(yīng)用領(lǐng)域什么是統(tǒng)計(jì)學(xué)統(tǒng)計(jì)學(xué)——收集、處理、分析、解釋數(shù)據(jù)并從數(shù)據(jù)中得出結(jié)論的科學(xué)描述性方法⑩
研究數(shù)據(jù)收集、整理和描述的統(tǒng)計(jì)學(xué)
方法⑩
描述數(shù)據(jù)特征,找出數(shù)據(jù)的基本規(guī)律⑩內(nèi)容包括:數(shù)據(jù)收集、處理、展示、描述性分析推斷性方法⑩
研究如何利用樣本數(shù)據(jù)來推斷總體特征的統(tǒng)計(jì)學(xué)方法⑩
對(duì)總體特征作出推斷⑩內(nèi)容包括:參數(shù)估計(jì)和假設(shè)檢驗(yàn)2022/5/22
統(tǒng)計(jì)學(xué)(第8版)—
1-5●統(tǒng)計(jì)學(xué)研究的是來自各領(lǐng)域的數(shù)據(jù)●統(tǒng)計(jì)學(xué)沒有任何固定的對(duì)象,是一門獨(dú)特的學(xué)問●用于解決其他領(lǐng)域內(nèi)的問題統(tǒng)計(jì)學(xué)基本上是寄生的。靠研究其他領(lǐng)域內(nèi)的工作而生存。這不是對(duì)統(tǒng)計(jì)學(xué)的輕視,
這是因?yàn)閷?duì)很多寄主來說,如果沒有寄生蟲就會(huì)死。對(duì)有的動(dòng)物來說,如果沒有寄生
蟲就不能消化它們的食物。因此,人類奮斗的很多領(lǐng)域,如果沒有統(tǒng)計(jì)學(xué),雖然不會(huì)
死亡,但一定會(huì)變得很弱2022/5/22
統(tǒng)計(jì)學(xué)(第8版)—1-6統(tǒng)計(jì)學(xué)及其應(yīng)用領(lǐng)域第1章數(shù)據(jù)、統(tǒng)計(jì)和計(jì)算機(jī)統(tǒng)計(jì)學(xué)研究什么例1-
1】——用統(tǒng)計(jì)識(shí)別作者1787—1788年,三位作者亞歷山大
·漢密爾頓(AlexanderHamilton)、約翰
·杰伊(JohnJay)和詹姆斯
·麥迪遜(JamesMadison)為了說服紐約人認(rèn)可
憲法,匿名發(fā)表了85篇著名的論文。這些論文中的大多數(shù)作者已經(jīng)得到了識(shí)別
但是,其中12篇的作者身份引起了爭(zhēng)議。通過對(duì)這些論文不同單詞的頻數(shù)進(jìn)行統(tǒng)計(jì)分析,得出的結(jié)論是詹姆斯
·麥迪遜最有可能是這12篇論文的作者?,F(xiàn)在對(duì)于這些存在爭(zhēng)議的論文,認(rèn)為詹姆斯
·麥迪遜是原創(chuàng)作者的說法占主導(dǎo)地位
而且?guī)缀蹩梢钥隙ㄟ@種說法是正確的2022/5/22
統(tǒng)計(jì)學(xué)(第8版)—1-7統(tǒng)計(jì)學(xué)的應(yīng)用領(lǐng)域——幾個(gè)例子第1章數(shù)據(jù)、統(tǒng)計(jì)和計(jì)算機(jī)統(tǒng)計(jì)學(xué)的應(yīng)用領(lǐng)域【例1-2】
——用簡(jiǎn)單的描述統(tǒng)計(jì)量得到一個(gè)重要發(fā)現(xiàn)費(fèi)舍(R.A.Fisher)在1952的一篇文章中舉了一個(gè)例子,說明如何由基本的描述統(tǒng)計(jì)量的知
識(shí)引出一個(gè)重要的發(fā)現(xiàn)。20世紀(jì)早期,哥本哈根卡爾堡實(shí)驗(yàn)室的施密特(J.Schmidt)發(fā)現(xiàn)不同
地區(qū)所捕獲的同種魚類的脊椎骨和鰓線的數(shù)量有很大不同;甚至在同一海灣內(nèi)不同地點(diǎn)所捕
獲的同種魚類,也發(fā)現(xiàn)這樣的傾向然而,鰻魚的脊椎骨的數(shù)量變化不大。施密特從歐洲各地、冰島、亞速爾群島以及尼羅河
等幾乎分離的海域里所捕獲的鰻魚的樣本中,計(jì)算發(fā)現(xiàn)了幾乎一樣的均值和標(biāo)準(zhǔn)偏差值。由
此,施密特推斷所有各個(gè)不同海域內(nèi)的鰻魚是由海洋中某公共場(chǎng)所繁殖的。后來名為“戴納
(Dana)”的科學(xué)考察船在一次遠(yuǎn)征中發(fā)現(xiàn)了這個(gè)場(chǎng)所2022/5/22
統(tǒng)計(jì)學(xué)(第8版)—1-8統(tǒng)計(jì)學(xué)的應(yīng)用領(lǐng)域——幾個(gè)例子統(tǒng)計(jì)學(xué)的應(yīng)用領(lǐng)域第1章數(shù)據(jù)、統(tǒng)計(jì)和計(jì)算機(jī)1.1【
例1-3】——挑戰(zhàn)者號(hào)航天飛機(jī)失事預(yù)測(cè)1986年1月28日清晨,載有7名航天員的挑戰(zhàn)者號(hào)進(jìn)入發(fā)射狀態(tài)。發(fā)射幾分鐘后,航天飛機(jī)發(fā)生爆炸,
機(jī)上的航天員全部遇難。在此次失事前,該航天飛機(jī)24次發(fā)射成功。將航天飛機(jī)送入太空的兩個(gè)固體燃
料推進(jìn)器有6支O型項(xiàng)圈密封,在幾次飛行中,曾發(fā)生過O型項(xiàng)圈被腐蝕或氣體泄漏事故。這類事故與氣溫是否有關(guān)系呢?本次發(fā)射時(shí)的天氣預(yù)報(bào)氣溫為攝氏零下0.56°C。根據(jù)前23次飛行中O型項(xiàng)圈發(fā)生腐蝕或泄漏事故損壞的個(gè)數(shù)(因變量y)及發(fā)射時(shí)火箭連接處的溫度(自變量x)數(shù)據(jù)進(jìn)行線性回歸得到的回歸方程為y=2.1771-0.0856x當(dāng)溫度為-0.56°C時(shí),O型項(xiàng)圈發(fā)生事故的預(yù)計(jì)次數(shù)為2.225次。結(jié)果顯示溫度與O型項(xiàng)圈事故之間有
一定的相關(guān)性。如果當(dāng)時(shí)那些經(jīng)理們看到了回歸的預(yù)測(cè)結(jié)果,也許推遲發(fā)射會(huì)成為其謹(jǐn)慎的選擇2022/5/22
統(tǒng)計(jì)學(xué)(第8版)—1-9統(tǒng)計(jì)學(xué)的應(yīng)用領(lǐng)域——幾個(gè)例子統(tǒng)計(jì)學(xué)的應(yīng)用領(lǐng)域第1章數(shù)據(jù)、統(tǒng)計(jì)和計(jì)算機(jī)●統(tǒng)計(jì)濫用不好的樣本或過小的樣本誤導(dǎo)性圖表局部描述故意曲解●統(tǒng)計(jì)應(yīng)用上的兩個(gè)極端——不用或幾乎不用統(tǒng)計(jì);簡(jiǎn)單問題復(fù)雜化●在統(tǒng)計(jì)應(yīng)用中,這兩個(gè)極端都是不可取的●簡(jiǎn)單的方法不一定沒用,復(fù)雜的方法也不一定
有用。正如有的學(xué)者所說的,最簡(jiǎn)單的模型往
往是最有用的●統(tǒng)計(jì)應(yīng)該恰當(dāng)?shù)貞?yīng)用到它能起作用的地方。不能把統(tǒng)計(jì)神秘化,更不能歪曲統(tǒng)計(jì),把統(tǒng)計(jì)作
為掩蓋實(shí)事的陷阱2022/5/22統(tǒng)計(jì)學(xué)(第8版)—
1-10統(tǒng)計(jì)學(xué)的應(yīng)用領(lǐng)域第1章數(shù)據(jù)、統(tǒng)計(jì)和計(jì)算機(jī)統(tǒng)計(jì)的誤用與濫用1.1●
變
量
(
v
a
r
i
a
b
l
e
)觀察一個(gè)企業(yè)的銷售額,這個(gè)月和上個(gè)月不同;觀察股票市場(chǎng)上漲股票的家數(shù),今天與昨天數(shù)量不一樣;觀察一個(gè)班學(xué)生的生活費(fèi)
支出,一個(gè)人和另一個(gè)人不一樣;投擲一枚骰子觀察其出現(xiàn)的點(diǎn)數(shù),這次投擲的結(jié)果和下一次也不一樣“企業(yè)銷售額”、“上漲股票的家數(shù)”、“
生活費(fèi)支出”、“投擲一枚骰子出現(xiàn)的點(diǎn)數(shù)
”等就是變量●
數(shù)
據(jù)
(
d
a
t
a
)變量的觀測(cè)結(jié)果無序類別變量(名義值)有序類別變量
(順序值)離散變量
(有限值)連續(xù)變量
(無限制)類別變量(定性變量)數(shù)值變量
(定量變量)2022/5/22
統(tǒng)計(jì)學(xué)(第8版)—1-11變量與數(shù)據(jù)——變量及其分類第1章數(shù)據(jù)、統(tǒng)計(jì)和計(jì)算機(jī)怎樣獲得數(shù)據(jù)變量的基本分類●類別變量(categorical
variable)>取值為事物屬性或類別以及區(qū)間值的變量,也稱分類變量(classified
variable)或定性變量(qualitative
variable)>比如,觀察人的性別、公司所屬的行業(yè)、用戶對(duì)商品的評(píng)價(jià)時(shí),得到的結(jié)果就不是數(shù)字,而是用法文字表示
的類別類別變量根據(jù)取值是否有序分為兩種口名義(nominal)值類別變量也稱無序類別變量,其取值是不可以排序的口順序(ordinal)值類別變量也稱有序類別變量,其取值間可以排序●數(shù)值變量(metric
variable)>取值為數(shù)字的變量,也稱為定量變量(quantitative
variable)數(shù)值型變量根據(jù)其取值的不同,可以分為離散變量(discrete
variable)和連續(xù)變量(continuous
variable口離散型變量是只能取有限個(gè)值是變量,而且其取值可以——列舉。連續(xù)型變量是可以在一個(gè)或多個(gè)區(qū)間中取任何值的變量,它的取值是連續(xù)
不斷的,不能——列舉●數(shù)據(jù)(data)量
的觀察
結(jié)
果2022/5/22
統(tǒng)計(jì)學(xué)(第8版)—
1-12變量與數(shù)據(jù)——變量及其分類第1章數(shù)據(jù)、統(tǒng)計(jì)和計(jì)算機(jī)怎樣獲得數(shù)據(jù)●簡(jiǎn)單隨機(jī)抽樣從總體N個(gè)單位(元素)中隨機(jī)地抽取n個(gè)單位作為樣本,使得總體中每一個(gè)元素
都有相同的機(jī)會(huì)(概率)被抽中抽取元素的具體方法有放回抽樣和無放回抽樣●
分層抽樣將總體單位按某種特征或規(guī)則劃分為不同層,再從不同的層中隨機(jī)地抽取樣本●系統(tǒng)抽樣將總體中的所有單位(抽樣單位)按一定順序排列,在規(guī)定的范圍內(nèi)隨機(jī)地抽取
一個(gè)單位作為初始單位,然后按事先規(guī)定好的規(guī)則確定其他樣本元素●整群抽樣將總體中若干個(gè)單位合并為組(群),抽樣時(shí)直接抽取群,再對(duì)中選群中的所有
單位全部實(shí)施調(diào)查●二手?jǐn)?shù)據(jù)●抽取樣本總體(population):
包含所研究
的全部個(gè)體(或數(shù)據(jù))的集合樣本(sample):
從總體中抽取的
一部分元素的集合樣本量(sample
size):構(gòu)成樣本
的元素的數(shù)目●概率抽樣方法根據(jù)已知的概率抽取樣本元素
,也稱隨機(jī)抽樣2022/5/22
統(tǒng)計(jì)學(xué)(第8版)—
1-13第1章數(shù)據(jù)、統(tǒng)計(jì)和計(jì)算機(jī)怎樣獲得數(shù)據(jù)數(shù)據(jù)的來源●SAS
——統(tǒng)計(jì)分析系統(tǒng)(Statistical
Analysis
System)的縮寫●SPSS
——SPSS原是社會(huì)科學(xué)統(tǒng)計(jì)軟件包(statisticalpackageforthesocial
science)的縮寫,現(xiàn)為統(tǒng)計(jì)產(chǎn)品與服務(wù)解決方案軟件(Statistical
Product
and
Service
Solutions)
的縮寫,是世界最早的統(tǒng)計(jì)分析軟件●
R—
——基于R語言的一種優(yōu)秀的統(tǒng)計(jì)軟件。在CRAN網(wǎng)站/
上下載R的各種版本●
EXCEL——Microsoft公司推出的Office系列產(chǎn)品之一,是一個(gè)功能強(qiáng)大的電子表格
軟件2022/5/22
統(tǒng)計(jì)學(xué)(第8版)—
1-14第1章數(shù)據(jù)、統(tǒng)計(jì)和計(jì)算機(jī)統(tǒng)計(jì)與計(jì)算機(jī)常用統(tǒng)計(jì)軟件THE
END統(tǒng)計(jì)THANKSTHE
ENDTHANKS●教育部經(jīng)濟(jì)管理類核心課程教材●“十二五”普通高等教育本科國家級(jí)規(guī)劃教材●北京高等教育精品教材●北京高等學(xué)校優(yōu)質(zhì)本科教材課件統(tǒng)計(jì)學(xué)(第8版)2022/5/22無"普通高等教有本科國家級(jí)現(xiàn)則教材統(tǒng)計(jì)學(xué)SPSS
和Excel實(shí)現(xiàn)(第8版)STATISTICS北京高等教育精品教材第
2
章
用圖表展示數(shù)據(jù)2
.1生成頻數(shù)分布表2.2類別數(shù)值數(shù)據(jù)可視化2.3數(shù)值數(shù)據(jù)可視化2.3合理使用圖表類別數(shù)據(jù)生成頻數(shù)表數(shù)值數(shù)據(jù)觀察頻數(shù)類別數(shù)據(jù)可視化觀察頻數(shù)構(gòu)成展示分布展示關(guān)系數(shù)值數(shù)據(jù)可視化展示相似時(shí)間序列簡(jiǎn)單頻數(shù)表二維列聯(lián)表類別化分組表簡(jiǎn)單條形圖帕累托圖簇狀條形圖
堆積條形圖餅圖
環(huán)
形圖直方圖莖葉圖
箱形圖
散
點(diǎn)
圖
氣泡圖
雷達(dá)圖
輪廓圖
折線圖
面積圖統(tǒng)計(jì)學(xué)(第8版)—
2-19思維導(dǎo)圖數(shù)據(jù)的圖表展示2022/5/22下面的數(shù)據(jù)是2016年8月5日到2016年8月21日在巴西里約熱內(nèi)盧舉辦的第31屆奧運(yùn)會(huì)
上,獲得金牌前6名的國家獎(jiǎng)牌數(shù)的分布狀況日在倫敦舉辦的第30屆奧運(yùn)會(huì)上,獲得
金牌前6名的國家獎(jiǎng)牌排名國家金牌銀牌銅牌總數(shù)1美國637381212英國272317673中國261826704俄羅斯191819565德國171015426日本1282141根據(jù)上面的數(shù)據(jù),你認(rèn)為可以選擇哪些圖形來展示三個(gè)國家所獲得的獎(jiǎng)牌情況?學(xué)完
本章的圖表展示技術(shù),這樣的問題就會(huì)迎刃而解2022/5/22統(tǒng)計(jì)學(xué)(第8版)—
2-20用哪些圖形展示獎(jiǎng)牌思考以下問題類別數(shù)據(jù)的頻數(shù)分布表生成頻數(shù)分布表●
列出各類別●
計(jì)算各類別的頻數(shù)●
生成頻數(shù)分布表計(jì)算描述統(tǒng)計(jì)量●頻數(shù)(frequency):落在各類別中的數(shù)
據(jù)個(gè)數(shù)●比例(proportion):某一類別數(shù)據(jù)個(gè)數(shù)占全部數(shù)據(jù)個(gè)數(shù)的比值●百分比(percentage):將對(duì)比的基數(shù)作
為100而計(jì)算的比值●比率(ratio):不同類別數(shù)值個(gè)數(shù)的比值2022/5/22統(tǒng)計(jì)學(xué)(第8版)—
2-21第2章用圖表展示數(shù)據(jù)生成頻數(shù)分布表性別飲料類型性別飲料類型女碳酸飲料女茶類飲料男茶類飲料男礦泉水男礦泉水女茶類飲料女礦泉水女碳酸飲料男碳酸飲料女礦泉水男礦泉水男其他飲料…………男其他飲料女茶類飲料女碳酸飲料女其他飲料男茶類飲料女果汁男茶類飲料男茶類飲料女碳酸飲料女其他飲料男碳酸飲料女礦泉水
生成頻數(shù)分布表類別數(shù)據(jù)的頻數(shù)分布表——簡(jiǎn)單頻數(shù)表——例題分析【例2
-
1]為研究人們對(duì)不同類型軟飲料的偏好
情況,一家調(diào)查公司在
某超市隨機(jī)調(diào)查了50名
消費(fèi)者。表2-1是消費(fèi)者
性別及其所偏好的飲料
類型記錄。生成頻數(shù)分
布表,觀察不同性別的消費(fèi)者及其所偏好的飲
料類型的分布狀況●
只涉及一個(gè)類別變量●
這個(gè)變量的各類別(
取值)可以放在頻數(shù)
分布表中“行”的位置
,也可以放在“列”的
位置●
將該變量的各類別及其相應(yīng)的頻數(shù)列出來就是一個(gè)簡(jiǎn)單的頻數(shù)
表,也稱為一維列聯(lián)
表2022/5/22
統(tǒng)計(jì)學(xué)(第8版)—
2-22飲料類型頻率百分比有效百分比累積百分比有效茶類飲料1122.022.022.0果汁612.012.034.0礦泉水1020.020.054.0其他飲料816.016.070.0碳酸飲料1530.030.0100.0總計(jì)50100.0100.0性別頻率百分比有效百分比累積百分比有效男2244.044.044.0女2856.056.0100.0總計(jì)50100.0100.0類別數(shù)據(jù)的頻數(shù)分布表——簡(jiǎn)單頻數(shù)表——例題分析2022/5/22統(tǒng)計(jì)學(xué)(第8版)—
2-23生成頻數(shù)分布表第2
章用圖表展示數(shù)據(jù)SPSS
輸
出●涉及兩個(gè)類別變量●將一個(gè)變量的各類別放在“行”的位置,另一個(gè)變量的各類別放在“列”
的位置(行和列可以互換)生成頻數(shù)分布表,這樣表格稱為二維列聯(lián)表(contingency
table),簡(jiǎn)稱列聯(lián)表或交叉表(cross
table)●列聯(lián)表主要用于反映兩個(gè)類別變量的交叉頻數(shù)分布狀況2022/5/22
統(tǒng)計(jì)學(xué)(第8版)—2-24類別數(shù)據(jù)的頻數(shù)分布表——二維列聯(lián)表第
2
章
用圖表展示數(shù)據(jù)生成頻數(shù)分布表性別。飲料類型交叉表飲料類型總計(jì)茶類飲料果汁礦泉水其他飲料碳酸飲料性別男計(jì)數(shù)7162622占性別的百分比31.8%4.5%273%9.1%273%100.0%占飲料類型的百分比63.6%16.7%60.0%25.0%40.0%44.0%占總計(jì)的百分比14.0%2.0%12.0%4.0%12.0%44.0%女計(jì)數(shù)4546928占性別的百分比14.3%17.9%14.3%21.4%32.1%100.0%占飲料類型的百分比364%83.3%40.0%75.0%60.0%56.0%占總計(jì)的百分比8.0%10.0%8.0%12.0%18.0%56.0%總計(jì)計(jì)數(shù)161081550占性別的百分比22.0%12.0%20.0%16.0%30.0%100.0%占飲料類型的百分比100.0%100.0%100.0%100.0%100.0%100.0%占總計(jì)的百分比22.0%12.0%20.0%16.0%30.0%100.0%性別*飲料類型
交叉表計(jì)數(shù)飲料類型總計(jì)茶類
飲料果汁礦泉
水其他
飲料碳酸
飲料性別男7162622女4546928總計(jì)1161081550類別數(shù)據(jù)的頻數(shù)分布表——二維列聯(lián)表——例題分析第2章用圖表展示數(shù)據(jù)統(tǒng)計(jì)學(xué)(第8版)—
2-25生成頻數(shù)分布表【例2-2】沿用例2-1。SPSS輸出結(jié)果2022/5/22234159187155172183182177163158143198141167194225177189196203187160214168173178184209176188161152149211196234185189196206150161178168174153186190160171228162223170165179186175197208153163218180175144178191197192166196179171233179187173174210154164215233175188237194198168174226180172190172187189200211156165175210207181205195201172203165196172176182188195202213
生成頻數(shù)分布表數(shù)值數(shù)據(jù)的頻數(shù)分布表——數(shù)據(jù)分組——類別化處理——例題分析表展2【例2-3】某電腦公司2021年前4個(gè)月的銷售額數(shù)據(jù)如表2-6
所示。對(duì)數(shù)據(jù)額做適當(dāng)分組
,分析銷售額的分布特征2022/5/22統(tǒng)計(jì)學(xué)(第8版)—
2-26確定組數(shù)的方法有幾種。設(shè)組數(shù)為K,根據(jù)斯特奇斯
(Sturges)
給出的組數(shù)確定方法,K=1+log?0(n)/log?0(2)
。
當(dāng)然這只是個(gè)
大概數(shù),具體的組數(shù)可根據(jù)需要適當(dāng)調(diào)整。表2-6共有120個(gè)數(shù)據(jù),
K=1+log?0(100)/log?0(2)≈8,因此,可以將數(shù)據(jù)大概分成8
組。當(dāng)然,這只是個(gè)大概數(shù),實(shí)際分組時(shí),可根據(jù)需要適當(dāng)調(diào)整。
本例可將組距確定為10●
確定各組的組距(組的寬度)>組距可根據(jù)全部數(shù)據(jù)的最大值和最小值及所分的組數(shù)來確定,即
組距=(最大值-最小值)÷組數(shù)。對(duì)于表2-6數(shù)據(jù),最小值為141,
最大值為237,則組距=(237-141)/8≈12,因此組距可取12。為便
于理解,本例取組距=10(使用者根據(jù)分析的需要確定一個(gè)大概數(shù)即可)●
統(tǒng)計(jì)出各組的頻數(shù)即得頻數(shù)分布表>
在統(tǒng)計(jì)各組頻數(shù)時(shí),恰好等于某一組上限的變量值一般不算在本
組內(nèi),而算在下一組,即一個(gè)組的數(shù)值x滿足a≤x<b。銷售額分組(萬元)天數(shù)(天)頻率(%)140-15043.3315-16097.50160-1701613.33170-1802722.50180-1902016.67190-2001714.17200-210108.33210=22086.67220-23043.33230-24054.17合計(jì)120100.00數(shù)值數(shù)據(jù)的頻數(shù)分布表——數(shù)據(jù)分組——類別化處理——例題分析●確定要分的組數(shù)
某電腦公司2021年前4個(gè)月銷售額的分組表2022/5/22
統(tǒng)計(jì)學(xué)(第8版)—
2-27生成頻數(shù)分布表第2
章用圖表展示數(shù)據(jù)●條形圖(bar
plot)是用一定寬度和高度的矩形表示各類別頻數(shù)多少的圖形
,主要用于展示類別數(shù)據(jù)的頻數(shù)分布●繪制條形圖時(shí),各類別可以放在x軸(橫軸),也可以放在y軸(縱軸)。類別放在x軸的條形圖稱為垂直條形圖(verticalbarplot)或柱形圖,類別放在
y軸的條形圖稱為水平條形圖(horizontal
bar
plot)●只有一個(gè)類別變量時(shí),可以繪制簡(jiǎn)單條形圖和帕累托圖;有兩個(gè)類別變量時(shí)
,可以繪制簇狀條形圖或堆積條形圖類別數(shù)據(jù)可視化——簡(jiǎn)單條形圖和帕累托圖——簡(jiǎn)單條形圖2022/5/22
統(tǒng)計(jì)學(xué)(第8版)—2-28第2章
用圖表展示數(shù)據(jù)類別數(shù)據(jù)可視化類別數(shù)據(jù)可視化——簡(jiǎn)單條形圖和帕累托圖——簡(jiǎn)單條形圖——例題分析2022/5/22統(tǒng)計(jì)學(xué)(第8版)—
2-29類別數(shù)據(jù)可視化第2
章用圖表展示數(shù)據(jù)●
帕累托圖
(paretoplot)
是以意大利經(jīng)濟(jì)學(xué)家V.Pareto的名字而命名●按各類別的頻數(shù)多少降序排列后繪制
的條形圖●帕累托圖可以看做是簡(jiǎn)單條形圖的一
個(gè)變種,利用該圖很容易看出哪類頻
數(shù)出現(xiàn)得多,哪類頻數(shù)出現(xiàn)得少類別數(shù)據(jù)可視化——簡(jiǎn)單條形圖和帕累托圖——帕累托圖——例題分析2022/5/22統(tǒng)計(jì)學(xué)(第8版)—
2-30類別數(shù)據(jù)可視化例2-4沿用例2-1第2
章用圖表展示數(shù)據(jù)四礦泉水
飲料類型四碳酸飲料團(tuán)茶類飲料日果汁其他飲料百分比計(jì)
數(shù)20●簇狀條形圖中,一個(gè)類別變量作為坐標(biāo)軸,另一個(gè)類別變量各類別頻數(shù)的條形并列擺放計(jì)數(shù)計(jì)數(shù)D2●當(dāng)有據(jù)兩個(gè)類別變量時(shí),可以將兩個(gè)變量的條形圖以簇狀或
堆積的方式繪制,這就是簇狀
條形圖和堆積條形圖●在堆積條形圖中,
一個(gè)類別變量作為坐標(biāo)軸,另一個(gè)類別變
量各類別的頻數(shù)按比例堆疊在同一個(gè)條中(例2
-
5沿用例2-1108類別數(shù)據(jù)可視化——簇狀條形圖和堆積條形圖——例題分析性別□男
■女6152022/5/22
統(tǒng)計(jì)學(xué)(第8版)—2-31日礦泉水其他飲料碳酸飲料
飲料類型類別數(shù)據(jù)可視化果汁
礦泉水
其
飲碳
飲飲料類型4茶類飲料
果汁第2章用圖表展示數(shù)據(jù)4茶類飲
料性別□男
■女5
類別數(shù)據(jù)可視化類別數(shù)據(jù)可視化——餅圖和環(huán)形圖——餅圖——例題分析●
餅圖
(piechart)
是用圓形及圓內(nèi)
扇形的角度來表
示一個(gè)樣本(或
總體)中各類別
的頻數(shù)占總頻數(shù)
比例大小的圖形●對(duì)于研究結(jié)構(gòu)性
問題十分有用性別44009飲料類型數(shù)飲2-322022/5/22
統(tǒng)計(jì)學(xué)(第8版)—例2-6沿用例2-1性別男飲料類型茶類飲
料果汁礦泉水其他飲料
碳酸飲料女
類別數(shù)據(jù)可視化類別數(shù)據(jù)可視化——餅圖和環(huán)形圖——環(huán)形圖——例題分析表展2東部中部西部總計(jì)非常滿意104140132376比較滿意156108120384一般148148160456不滿意156108140404非常不滿意156116108380總計(jì)7206206602000●環(huán)形圖與餅圖類似,但
又有區(qū)別。環(huán)形圖中間
有一個(gè)“空洞”,每個(gè)樣本用一個(gè)環(huán)來表示,樣
本中每一類別的頻數(shù)構(gòu)
成用環(huán)中的一段表示●環(huán)形圖可顯示多個(gè)樣本
各類別頻數(shù)占其相應(yīng)總頻數(shù)的比例,從而有利
于構(gòu)成的比較研究例
2
-
7
■為研究不同地區(qū)的消費(fèi)者對(duì)網(wǎng)上購物的滿意度,隨機(jī)抽取東部、中部和西部的2000個(gè)消費(fèi)者進(jìn)行調(diào)查,得到的結(jié)果如表2
-8所示。繪制環(huán)形
圖,分析各類別的人數(shù)構(gòu)成狀況2022/5/22
統(tǒng)計(jì)學(xué)(第8版)—2-33數(shù)值數(shù)據(jù)可視化——展示分布的圖形——直方圖●直方圖——將數(shù)據(jù)分組后,在x軸上用矩形的寬度表示每個(gè)組
的組距,在y軸上用矩形的高度
表示每個(gè)組的頻數(shù)或密度,多
個(gè)矩形并列在一起就是直方圖●利用直方圖的形狀可以觀察數(shù)
據(jù)分布的特征2022/5/22統(tǒng)計(jì)學(xué)(第8版)—
2-34數(shù)值數(shù)據(jù)的圖表展示第2
章用圖表展示數(shù)據(jù)與條形圖的區(qū)別●條形圖中的每一矩形表示一個(gè)類別,其寬度沒有意義,而直方圖的寬
度則表示各組的組距●由于分組數(shù)據(jù)具有連續(xù)性,直方圖的各矩形通常是連續(xù)排列,而條形
圖則是分開排列●條形圖主要用于展示類別數(shù)據(jù),而直方圖則主要用于展示數(shù)值數(shù)據(jù)數(shù)值數(shù)據(jù)可視化——展示分布的圖形——直方圖——與條形圖的區(qū)別2022/5/22
統(tǒng)計(jì)學(xué)(第8版)—2-35第2章
用圖表展示數(shù)據(jù)數(shù)值數(shù)據(jù)可視化日期1
月2月3月4月5
月6月13592191081925131251655233501814145942443101123348561263830481227158285419662817165105937552970864561592830466890531531446411
數(shù)值數(shù)據(jù)的圖表展示數(shù)值數(shù)據(jù)可視化——展示分布的圖形——直方圖——例題分析展2【例2-8】
2020年1月-6月北京市的PM2.5
數(shù)據(jù)。繪制
直方圖分析PM2.5的分布特
征2022/5/22統(tǒng)計(jì)學(xué)(第8版)—
2-362022/5/22統(tǒng)計(jì)學(xué)(第8版)—
2-37數(shù)值數(shù)據(jù)的圖表展示第2章用圖表展示數(shù)據(jù)●用于顯示未分組的原始數(shù)據(jù)的分布●由“莖”和“葉”兩部分構(gòu)成,其圖形是由數(shù)字組成的●以該組數(shù)據(jù)的高位數(shù)值作樹莖,低位數(shù)字作樹葉●樹葉上只保留最后一位數(shù)字●莖葉圖類似于橫置的直方圖,但又有區(qū)別直方圖可觀察一組數(shù)據(jù)的分布狀況,但沒有給出具體的數(shù)值莖葉圖既能給出數(shù)據(jù)的分布狀況,又能給出每一個(gè)原始數(shù)值,保留了原始數(shù)據(jù)的信息
直方圖適用于大批量數(shù)據(jù),莖葉圖適用于小批量數(shù)據(jù)數(shù)值數(shù)據(jù)可視化——展示分布的圖形——莖葉圖2022/5/22統(tǒng)計(jì)學(xué)(第8版)—
2-38第
2
章
用圖表展示數(shù)據(jù)數(shù)值數(shù)據(jù)可視化【例2-9】沿用例2-8●圖中的第1列給出每個(gè)莖上葉子的頻數(shù)(顯示為頻率
),第2列是“莖”
(Stem),
第3列是“葉”●下面標(biāo)出了極端值的個(gè)數(shù),共有11個(gè)(系統(tǒng)自動(dòng)將
>=117的數(shù)值定義為極端值。莖的寬度為10,每個(gè)
葉代表一個(gè)數(shù)據(jù)(案例)。圖2-11顯示,PM2.5主要分
布在10~19之間,有35個(gè)葉子,即出現(xiàn)35天。從葉
子的分布看,PM2.5
呈現(xiàn)右偏分布PM2.5莖葉圖頻率
Stem
&葉21.00
0.35566777777888888999935.00
1.0000000111112244444567777788889999924.002.00111133333356666788889926.003.0000112344445555667778899920.00
4.0111112233444556788918.00
5.00011113355556899913.00
6.01112344566688.00
7.001225562.00
8.562.00
9.072.00
10.8911.00極值(>=117)主干寬度:10每
個(gè)
葉:1
個(gè)
案
數(shù)值數(shù)據(jù)可視化數(shù)值數(shù)據(jù)可視化——展示分布的圖形——莖葉圖——例題分析2022/5/22統(tǒng)計(jì)學(xué)(第8版)—
2-39●首先,找出一組數(shù)據(jù)的中位數(shù)
(
median)
和兩個(gè)四分位數(shù)
(quartiles)
,并畫出箱子箱形圖的示意圖●其次,計(jì)算出內(nèi)圍欄和相鄰值,并畫出須線。內(nèi)圍欄
(
interfence)是與Q
?5%和
Q?5%的距離等于1.5倍四分位差的兩個(gè)點(diǎn)
,其中Q?5%-1.5×1QR
稱為下內(nèi)圍欄,Q?5%+1.5×1QR
稱
為上內(nèi)圍欄。上下內(nèi)圍欄一般不在箱線圖中顯示,只是作為
確定離群點(diǎn)的界限。然后找出上下內(nèi)圍欄之間的最大值和最
小值(即非離群點(diǎn)的最大值和最小值),稱為相鄰值(
adjacent
value)
,其中大于Q?5%-1.5×1QR
的最小值稱
為下相鄰值,小于Q?5%+1.5×1Q
R
的最大值稱為上相鄰值。用直線將上下相鄰值分別與箱子連接,稱為須線(
whiskers)
。25%四分位數(shù)離群點(diǎn)00須線中位數(shù)75%四分位數(shù)上相鄰值離群點(diǎn)0須線●最后,找出離群點(diǎn),并在圖中單獨(dú)標(biāo)出。離群點(diǎn)
(
outlier)
是
大
于
上
內(nèi)
圍
欄
或
小
于
下
內(nèi)
圍
欄
的
數(shù)
值
,
也
稱
外
部
點(diǎn)(
outside
value)
,
在圖中用“O”單獨(dú)標(biāo)出1.5倍四分位差一下內(nèi)圍欄Q?5%-1.5×IQR四分位差1.5倍四分位差上內(nèi)圍欄Q75%+1.5×IQR2022/5/22統(tǒng)計(jì)學(xué)(第8版)—
2-40數(shù)值數(shù)據(jù)可視化——展示分布的圖形——箱形圖第
2
章
用圖表展示數(shù)據(jù)數(shù)值數(shù)據(jù)可視化下相鄰值左偏分布010
20對(duì)稱分布古。否呂-3
-2
0
2
3右偏分布0
10
20
30010
2030-3
30.00
0.02
0.04
0.06
0.08
0.10數(shù)值數(shù)據(jù)可視化——展示分布的圖形——箱形圖2022/5/22統(tǒng)計(jì)學(xué)(第8版)—
2-41第2
章用圖表展示數(shù)據(jù)數(shù)值數(shù)據(jù)可視化的箱
形圖
【例2-9】沿用例2-8圖中,“O”和對(duì)應(yīng)的數(shù)字表示離
群點(diǎn)的位置及其數(shù)值。圖2顯示
,2月份的PM2.5數(shù)值較高(中
位數(shù)較大),4月份的PM2.5數(shù)
值較低(中位數(shù)較小)。從分布
形狀看,6月份PM2.5的分布大致為對(duì)稱,其余月份PM2.5的分
布均為右偏分布,其中,2月份
PM2.5的分布偏斜程度最大,其次是1月份和3月份。這幾個(gè)月均
出現(xiàn)了較多的離群值數(shù)值數(shù)據(jù)可視化——展示分布的圖形——箱形圖——例題分析2022/5/22統(tǒng)計(jì)學(xué)(第8版)—
2-42第
2
章
用圖表展示數(shù)據(jù)數(shù)值數(shù)據(jù)可視化地區(qū)地區(qū)生產(chǎn)總值房地產(chǎn)開發(fā)投資社會(huì)消費(fèi)品零售總額北京市35371.33838.415063.7天津市14104.32727.84218.2河北省35104.54347.112985.5山西省17026.71656.57030.5內(nèi)蒙古自治區(qū)17212.51042.05051.1陜西省25793.23903.710213.0甘肅省8718.31257.93700.3青海省2966.0406.3948.5寧夏回族自治區(qū)3748.5403.11399.4新疆維吾爾自治區(qū)13597.11074.03617.0●散點(diǎn)圖——將兩個(gè)變量的各
對(duì)觀測(cè)點(diǎn)畫在二維坐標(biāo)中,
并利用各觀測(cè)點(diǎn)的分布來展
示兩個(gè)變量間的關(guān)系●設(shè)兩個(gè)變量分別為x
和y,
每對(duì)觀測(cè)值(xi,yi)
在二維坐標(biāo)中用一個(gè)點(diǎn)表示,n
對(duì)觀測(cè)值在坐標(biāo)中形成的n
個(gè)點(diǎn)圖稱為散點(diǎn)圖●利用散點(diǎn)圖可以觀察兩個(gè)變
量間是否有關(guān)系,如果有,
則關(guān)系的形態(tài)以及關(guān)系強(qiáng)度
如何等
數(shù)值數(shù)據(jù)可視化數(shù)值數(shù)據(jù)可視化——展示變量間關(guān)系的圖形——散點(diǎn)圖【例2-11】我國2019年我國31個(gè)地區(qū)的地區(qū)生產(chǎn)總值、房地產(chǎn)開發(fā)投
資和社會(huì)消費(fèi)品零售總額數(shù)據(jù)。繪散點(diǎn)圖觀察它們之間的關(guān)系2022/5/22
統(tǒng)計(jì)學(xué)(第8版)—2-43
數(shù)值數(shù)據(jù)可視化數(shù)值數(shù)據(jù)可視化——展示變量間關(guān)系的圖形——散點(diǎn)圖——例題分析600001重疊散點(diǎn)圖300000
4000005000042022/5/22
統(tǒng)計(jì)學(xué)(第8版)—
2-44(例2-11地區(qū)生產(chǎn)總值
房地產(chǎn)開發(fā)投資
社會(huì)消費(fèi)品零售總額O醫(yī)產(chǎn)開發(fā)段責(zé)△地區(qū)圈棄復(fù)段費(fèi)
囚費(fèi)要四總額普通散點(diǎn)圖房地產(chǎn)開發(fā)投資
社會(huì)消費(fèi)品零售總額200000房地產(chǎn)開發(fā)投資矩陣散點(diǎn)圖1000001600004000020000120001000000800000120000R2線性(L)-0935地區(qū)生產(chǎn)總值地區(qū)生產(chǎn)總值6【例2-11】繪氣泡圖觀察它們之間的關(guān)系氣泡大小=社會(huì)消費(fèi)品零售總額180001600014000120001000080006000400020002000040000
60000
80000地區(qū)生產(chǎn)總值●普通散點(diǎn)圖只能展示兩個(gè)變量間的關(guān)系●對(duì)于3個(gè)變量之間的關(guān)系,除
了可以繪制三維散點(diǎn)圖外,也
可
以
繪
制氣
泡
圖
(bubblechart),
它可以看作是散點(diǎn)
圖的一個(gè)變種●在氣泡圖中,第3個(gè)變量數(shù)值
的大小用圓的大小表示。數(shù)值數(shù)據(jù)可視化——展示變量間關(guān)系的圖形——?dú)馀輬D——例題分析2022/5/22統(tǒng)計(jì)學(xué)(第8版)—
2-45第2章用圖表展示數(shù)據(jù)數(shù)值數(shù)據(jù)可視化房地產(chǎn)開發(fā)投資100000120000●
雷
達(dá)圖
(rad
ar
chart)
是從一個(gè)
點(diǎn)出發(fā),用每一
條射線代表一個(gè)
變量,多個(gè)變量
的數(shù)據(jù)點(diǎn)連接成
線,即圍成一個(gè)
區(qū)域,多個(gè)樣本
圍成多個(gè)區(qū)域,就是雷達(dá)圖●可用于研究多個(gè)樣本之間的相似程度。
【例2-12】2
018年北京、天津、上海和重慶的人均消費(fèi)支出數(shù)據(jù),繪制雷達(dá)圖
,比較不同地區(qū)的家庭消費(fèi)支出的特點(diǎn)和相似性地區(qū)食品煙酒衣著居住生活用品及服務(wù)交通通信教育文
化娛樂醫(yī)療保健其他用品
及服務(wù)北京8064.92175.514110.32371.94767.43999.43274.51078.6天津8647.51990.06406.31818.44280.93186.62676.9896.3上海10728.22036.814208.52095.54881.25049.43070.21281.5重慶6220.81454.53498.81338.92545.02087.81660.0442.8數(shù)值數(shù)據(jù)可視化——展示樣本相似性的圖形——雷達(dá)圖——例題分析2022/5/22
統(tǒng)計(jì)學(xué)(第8版)—
2-46第
2
章
用圖表展示數(shù)據(jù)數(shù)值數(shù)據(jù)可視化 【例2-12]2018年北京、天津、上海和重慶的人均消費(fèi)支出數(shù)據(jù),繪制雷達(dá)圖,比較不同地區(qū)的家庭消費(fèi)支出的特點(diǎn)和相似性食品煙酒1600014000其他用品及服務(wù)12000
衣著10000800060醫(yī)療保健
住一北京-天津上海重慶食品煙酒100000其他用品及服務(wù)醫(yī)療保健1000010010010衣著居住一北京
一天津
-上海
重慶教育文化娛樂
生活用品及服務(wù)交通通信教育文化娛樂
生活用品及服務(wù)交通通信數(shù)值數(shù)據(jù)可視化——展示樣本相似性的圖形——雷達(dá)圖——例題分析2022/5/22統(tǒng)計(jì)學(xué)(第8版)—
2-47第2章
用圖表展示數(shù)據(jù)數(shù)值數(shù)據(jù)可視化●
輪廓圖
(outlinechart)也稱為平
行坐標(biāo)圖或多線圖●用x軸表示各樣本
,y
軸表示每個(gè)樣
本的多個(gè)變量的
取值,將同一樣
本的不同變量取
值用折線連接,
即為輪廓圖食品煙酒衣著居住生活用品及服務(wù)交通通信教育文化娛樂醫(yī)療
保健其他用品及服務(wù)4.92175.514110.32371.94767.43999.44.51078.68647.51990.06406.31818.44280.93186.626
6.9896.310728.22036.814208.52095.54881.25049.430
0.21281.56220.81454.53498.81338.92545.02087.81660.0442.8
【例2-12】2018年北京、天津、上海和重慶的人均消費(fèi)支出數(shù)據(jù),繪制輪廓圖
,比較不同地區(qū)的家庭消費(fèi)支出的特點(diǎn)和相似性數(shù)值數(shù)據(jù)可視化——展示樣本相似性的圖形——輪廓圖——例題分析2022/5/22
統(tǒng)計(jì)學(xué)(第8版)—
2-48第2章用圖表展示數(shù)據(jù)數(shù)值數(shù)據(jù)可視化16000140001200010000支出金額400006000002月份的數(shù)據(jù)為例,繪制的PM2.5的折線圖。日
期■1
月■2
月
200●時(shí)間序列是一種常見的數(shù)
據(jù)形式,它是在不同時(shí)間
點(diǎn)上記錄的一組數(shù)據(jù),如
各年份的GDP數(shù)據(jù)、各月
份的CPI數(shù)據(jù)、一年中各交
易日的股票價(jià)格指數(shù)收盤
數(shù)據(jù)等●利用折線圖(linechart)
和面積圖
(area
graph),
可以觀察時(shí)間序列的變化
模式和特征12345678910111213141516171819202122232425262728293031日
期2022/5/22
統(tǒng)計(jì)學(xué)(第8版)—
2-49數(shù)值數(shù)據(jù)可視化——時(shí)間序列圖形——折線圖和面積圖——例題分析數(shù)值數(shù)據(jù)可視化【例2-13】沿用例2-8。以例2-8中1月份和第2章用
圖表
展
示數(shù)
據(jù)-O-
1
月
一
-2
月●一幅完整的圖形大體上包括圖形主體、標(biāo)題、坐標(biāo)軸注釋等要素。圖形主體用于表達(dá)數(shù)據(jù)信息●標(biāo)題用于注釋圖形的內(nèi)容,
一般包括數(shù)據(jù)所屬的時(shí)間(when)、地點(diǎn)(where)和內(nèi)容(what),此外,還應(yīng)包括必要的圖形編號(hào)。標(biāo)題可以放在圖的上方,也可放在圖的下方●坐標(biāo)軸注釋需要標(biāo)示出坐標(biāo)軸代表的變量名稱,以便于閱讀和理解●圖形的比例也十分重要,一般圖形大致為4:3的一個(gè)矩形,過長(zhǎng)或過高的圖形都有
可能歪曲數(shù)據(jù),給人留下錯(cuò)誤的印象2022/5/22
統(tǒng)計(jì)學(xué)(第8版)—2-50第
2
章
用圖表展示數(shù)據(jù)使用圖表的注意事項(xiàng)合理使用圖表數(shù)據(jù)特征THANKSTHE
END用圖形探索●教育部經(jīng)濟(jì)管理類核心課程教材●“十二五”普通高等教育本科國家級(jí)規(guī)劃教材●北京高等教育精品教材●北京高等學(xué)校優(yōu)質(zhì)本科教材課件統(tǒng)計(jì)學(xué)(第8版)2022/5/22無"普通高等教有本科國家級(jí)現(xiàn)則教材統(tǒng)計(jì)學(xué)SPSS
和Excel實(shí)現(xiàn)(第8版)STATISTICS北京高等教育精品教材第
3
章
用統(tǒng)計(jì)量描述性數(shù)據(jù)3
.1描述水平的統(tǒng)計(jì)量3.2描述差異的統(tǒng)計(jì)量3.3
描述分布形狀的統(tǒng)計(jì)量納塔利婭
帕杰林娜郭文琚卓格巴德拉赫
蒙赫珠勒妮諾
·薩盧克瓦澤維多利亞
柴卡萊萬多夫斯卡
薩貢亞斯娜
舍卡里奇10.010.09.39.89.38.110.28.510.510.010.39.410.39.610.010.48.710.010.49.29.910.210.48.39.510.19.99.910.610.19.210.210.29.89.310.510.39.510.710.510.49.19.89.48.510.49.29.99.79.710.710.710.610.59.410.09.510.89.29.19.810.79.39.39.79.210.88.69.69.9在2008年的第29屆北京奧運(yùn)會(huì)女子10米氣手槍比賽中,每個(gè)運(yùn)動(dòng)員首先進(jìn)行每組10槍共4組的預(yù)賽,根據(jù)預(yù)賽總成績(jī)確定進(jìn)入決賽的8名運(yùn)動(dòng)員。決賽時(shí)8名運(yùn)動(dòng)員再進(jìn)行10槍射擊,預(yù)賽成績(jī)加上決賽成績(jī)確定最后的名次。在2008年8月10日舉行的第29屆北京奧運(yùn)會(huì)女子10米氣手槍決賽中,進(jìn)入決賽的8名運(yùn)動(dòng)員的預(yù)賽成績(jī)和最后10槍的決賽成績(jī)?nèi)缦卤硭咀詈蟮谋荣惤Y(jié)果是,中國運(yùn)動(dòng)員郭文…憑借決賽的穩(wěn)定發(fā)揮,以總成績(jī)492.3環(huán)奪得金牌,預(yù)賽排在第1名的俄羅斯運(yùn)動(dòng)員納塔利婭
·
帕杰林娜以總成績(jī)489.1環(huán)獲得銀牌,預(yù)賽
排在第4名的格魯吉亞運(yùn)動(dòng)員妮諾
·薩盧克瓦澤以總成績(jī)487.4環(huán)獲得銅牌,而預(yù)賽排在第3名的蒙古國運(yùn)動(dòng)員卓格巴德拉赫
·
蒙赫珠勒僅以479.6環(huán)的成績(jī)名列第8。由此可見,在射擊比賽中,運(yùn)動(dòng)員能否取得好的成績(jī),發(fā)揮的穩(wěn)定性至關(guān)重要。那么,怎樣評(píng)價(jià)一名運(yùn)動(dòng)員的發(fā)揮是否穩(wěn)定呢?通過本章內(nèi)容的學(xué)習(xí)就能很容易回答這樣的問題
哪名運(yùn)動(dòng)員發(fā)揮更穩(wěn)定思考以下問題2022/5/22統(tǒng)計(jì)學(xué)(第8版)—
2-54中位數(shù)四分位數(shù)百分位數(shù)2-55描述水平描述差異描述分布
形狀統(tǒng)計(jì)學(xué)(第8版)—平均數(shù)分位數(shù)眾數(shù)極差和四分位差方差和標(biāo)準(zhǔn)差離散系數(shù)標(biāo)準(zhǔn)分?jǐn)?shù)偏度系數(shù)峰度系數(shù)第2
章用圖表展示數(shù)據(jù)思維導(dǎo)圖用統(tǒng)計(jì)量描述數(shù)據(jù)2022/5/22平均數(shù)簡(jiǎn)單平均數(shù)●平均數(shù)——也稱為均值,常用
的統(tǒng)計(jì)量之一●消除了觀測(cè)值的隨機(jī)波動(dòng)●易受極端值的影響●根據(jù)總體數(shù)據(jù)計(jì)算的,稱為總
體平均數(shù),記為μ;根據(jù)樣本
數(shù)據(jù)計(jì)算的,稱為樣本平均數(shù),
記為x加權(quán)平均數(shù)2022/5/22統(tǒng)計(jì)學(xué)(第8版)—
2-56描述水平的統(tǒng)計(jì)量第2章用圖表展示數(shù)據(jù)859783616786559270868175915596868991668772925082799090859566平均數(shù)——簡(jiǎn)單平均數(shù)——例題分析【例3-1]
在某年級(jí)中隨機(jī)抽取30名學(xué)生,得到每名學(xué)生的統(tǒng)計(jì)學(xué)考試分?jǐn)?shù)如表3-12022/5/22統(tǒng)計(jì)學(xué)(第8版)—
2-57所示。計(jì)算30名學(xué)生考試分?jǐn)?shù)的平均數(shù)描述水平的統(tǒng)計(jì)量第2章用圖表展示數(shù)據(jù)=80【例3
-
1】沿用例3-1。假定將30名學(xué)生的數(shù)學(xué)考試分?jǐn)?shù)分組后結(jié)果表3-2所示。計(jì)算
考試分?jǐn)?shù)的平均數(shù)分組組中值(m)人數(shù)(f)分組組中值(m;)人數(shù)(f)60以下55360以下55360~7065460~7065470~8075470~8075480~90851080~908510850Zi=1x=90~10095990~1009598552430二30n=81合計(jì)
30合計(jì)302430
描述水平的統(tǒng)計(jì)量平均數(shù)——加權(quán)平均數(shù)——例題分析2022/5/22統(tǒng)計(jì)學(xué)(第8版)—
2-58m;×f165260300●
分位數(shù)———組數(shù)據(jù)按從小到大排序后,可以找出排在某個(gè)
位置上的數(shù)值,該數(shù)值可以代
表數(shù)據(jù)水平的高低。這些位置上的數(shù)值就是相應(yīng)的分位數(shù)(quantile)。常用的分位數(shù)有
中位數(shù)、四分位數(shù)、百分位數(shù)
等
描述水平的統(tǒng)計(jì)量分位數(shù)——中位數(shù)——例題分析例3-3■計(jì)算例3-1的中位數(shù)將30名學(xué)生的考試分?jǐn)?shù)排序,然后確定中位數(shù)的位置:
(30+1)÷2=15.5,中位數(shù)是排序后的第15.5位置上的數(shù)值,即中位數(shù)在第15個(gè)數(shù)值(85)和第16個(gè)數(shù)值(85)中間(0.5)的位置上。因此(85+85)/2=852022/5/22
統(tǒng)計(jì)學(xué)(第8版)—
2-59●中
位
數(shù)——排序后處于中間位置上的值。不受極端值影響數(shù)值計(jì)算位置確
定【例3-4】沿用例3-1。計(jì)算四分位數(shù),即Q?
5%在第7個(gè)數(shù)值(67)和第8個(gè)數(shù)值(70)之間0.75的位置上,因此,Q?
5%=67+0.75×(70-67)=69.25。,即Q75%在第23個(gè)數(shù)值(90)和第24
個(gè)數(shù)值(91)之間0.25的位置上,因此,Q75%=90+0.25×(91-90)=90.25?!?/p>
四分位數(shù)——
一組數(shù)據(jù)排序
后處在25%和75%位置上的數(shù)
值●
它是用3個(gè)點(diǎn)將全部數(shù)據(jù)等分
為4部分,其中每部分包含
25%的數(shù)據(jù)。●
中間的四分位數(shù)就是中位數(shù),
通常所說的四分位數(shù)是指處
在25%位置上和75%位置上的
兩個(gè)數(shù)值2022/5/22
統(tǒng)計(jì)學(xué)(第8版)—
2-60分位數(shù)——四分位數(shù)——例題分析第2章用圖表展示數(shù)據(jù)描述水平的統(tǒng)計(jì)量位置確定分位數(shù)——百分位數(shù)——例題分析●百分位數(shù)——用99個(gè)
點(diǎn)將數(shù)據(jù)分成100等份,
處在各分位點(diǎn)上的數(shù)
值就是百分位數(shù)●百分位數(shù)提供了各項(xiàng)
數(shù)據(jù)在最小值和最大
值之間分布的信息【例3
-
5】沿用例3-1。計(jì)算30個(gè)學(xué)生考試分?jǐn)?shù)的第5個(gè)百分位數(shù)和第90個(gè)百分位數(shù)第5個(gè)百分位數(shù)在第1個(gè)值(50)和第2個(gè)值(55)之間0.5
溫馨提示
- 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請(qǐng)下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請(qǐng)聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
- 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會(huì)有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
- 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
- 5. 人人文庫網(wǎng)僅提供信息存儲(chǔ)空間,僅對(duì)用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對(duì)用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對(duì)任何下載內(nèi)容負(fù)責(zé)。
- 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請(qǐng)與我們聯(lián)系,我們立即糾正。
- 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶因使用這些下載資源對(duì)自己和他人造成任何形式的傷害或損失。
最新文檔
- 2025年度高端寵物品種買賣及繁殖權(quán)轉(zhuǎn)讓合同范本3篇
- 2024版事業(yè)編人員聘用合同范本
- 2024消防設(shè)施改造合同范本
- 2025年度汽車用材料采購與銷售合作協(xié)議3篇
- 2024年食品加工生產(chǎn)外包合同
- 福建省南平市武夷山第二中學(xué)高一生物模擬試題含解析
- 福建省南平市外屯中學(xué)高一語文聯(lián)考試卷含解析
- 2025廠區(qū)綠化升級(jí)改造及養(yǎng)護(hù)綜合服務(wù)合同3篇
- 2024版事業(yè)單位醫(yī)療專業(yè)技術(shù)崗位聘用協(xié)議一
- 2024汽車美容店承包合同模板
- 幼兒園幼兒營養(yǎng)食譜手冊(cè)
- 《護(hù)理科研》課件
- 屋頂分布式光伏發(fā)電項(xiàng)目 投標(biāo)方案(技術(shù)方案)
- 2024宏泰集團(tuán)所屬湖北省征信限公司招聘9人高頻難、易錯(cuò)點(diǎn)500題模擬試題附帶答案詳解
- 部編版語文四年級(jí)下冊(cè)第六單元大單元作業(yè)設(shè)計(jì)
- 中國畜禽養(yǎng)殖污染物處理行業(yè)市場(chǎng)集中度、企業(yè)競(jìng)爭(zhēng)格局分析報(bào)告-智研咨詢發(fā)布
- DL∕T 2594-2023 電力企業(yè)標(biāo)準(zhǔn)化工作 評(píng)價(jià)與改進(jìn)
- 廣東省廣州白云區(qū)六校聯(lián)考2025屆九上數(shù)學(xué)期末教學(xué)質(zhì)量檢測(cè)試題含解析
- 2024年末端無人配送行業(yè)研究報(bào)告
- 肛瘺患者的護(hù)理查房
- 義務(wù)教育數(shù)學(xué)課程標(biāo)準(zhǔn)(2024年版)
評(píng)論
0/150
提交評(píng)論