![統(tǒng)計(jì)與決策培訓(xùn)講義_第1頁(yè)](http://file4.renrendoc.com/view3/M01/01/2F/wKhkFmY4DHyActbAAACDx4AYKa0216.jpg)
![統(tǒng)計(jì)與決策培訓(xùn)講義_第2頁(yè)](http://file4.renrendoc.com/view3/M01/01/2F/wKhkFmY4DHyActbAAACDx4AYKa02162.jpg)
![統(tǒng)計(jì)與決策培訓(xùn)講義_第3頁(yè)](http://file4.renrendoc.com/view3/M01/01/2F/wKhkFmY4DHyActbAAACDx4AYKa02163.jpg)
![統(tǒng)計(jì)與決策培訓(xùn)講義_第4頁(yè)](http://file4.renrendoc.com/view3/M01/01/2F/wKhkFmY4DHyActbAAACDx4AYKa02164.jpg)
![統(tǒng)計(jì)與決策培訓(xùn)講義_第5頁(yè)](http://file4.renrendoc.com/view3/M01/01/2F/wKhkFmY4DHyActbAAACDx4AYKa02165.jpg)
版權(quán)說(shuō)明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請(qǐng)進(jìn)行舉報(bào)或認(rèn)領(lǐng)
文檔簡(jiǎn)介
統(tǒng)計(jì)在線學(xué)習(xí)課件講義
《統(tǒng)計(jì)與決策》
主講人:袁衛(wèi)
制作單位:北京市統(tǒng)計(jì)局
2007年5月
第一部分緒論
同志們,同學(xué)們,大家好!下面我們一起學(xué)習(xí)統(tǒng)計(jì)與決
策。這一部分共分3個(gè)單元,第一單元介紹統(tǒng)計(jì)的應(yīng)用,我
把它稱為緒論;第二單元介紹描述統(tǒng)討,就是搜集數(shù)據(jù)、整
理數(shù)據(jù)的一些基本知識(shí);第三單元介紹如何應(yīng)用統(tǒng)計(jì)方法來(lái)
幫助我們進(jìn)行管理,進(jìn)行決策。
首先,我們看一下什么是統(tǒng)計(jì)。我們每一個(gè)人在做每一
項(xiàng)工作時(shí)都會(huì)有自己對(duì)統(tǒng)計(jì)的認(rèn)識(shí),比如,我們經(jīng)常在報(bào)刊
上看到類似這樣的消息:”思科公司(Cisco)在納期達(dá)克周
一收盤時(shí)的市值為5550億美元二這條信息就是一個(gè)統(tǒng)計(jì)分
析的結(jié)果,就是經(jīng)濟(jì)管理統(tǒng)計(jì)的一項(xiàng)工作。再比如,“50家
最大公司CEO的年均收入是930萬(wàn)美元”,這是2000年福布
斯報(bào)道的一個(gè)消息,這又是一個(gè)統(tǒng)計(jì),里邊含有一個(gè)概念,
即:什么是“平均收入二它反映了什么樣的問(wèn)題,能夠帶
給讀者什么樣的信息?再看第三個(gè),”股票平均能夠使75%
的投資者盈利”,這樣的一條信息又意味著什么?我們?cè)趪?guó)
內(nèi)的報(bào)刊上也經(jīng)??吹竭@樣一些信息,比如:股票的一個(gè)百
分比。對(duì)于每一位投資者,當(dāng)你進(jìn)行投資選擇的時(shí)候,這小
百分比會(huì)有什么樣的作用呢?
統(tǒng)計(jì),簡(jiǎn)單地說(shuō)就是搜集數(shù)據(jù)、整理數(shù)據(jù)、分析數(shù)據(jù)的
一些簡(jiǎn)單方法。如果用更簡(jiǎn)單的方法給它下個(gè)定義,統(tǒng)計(jì)就
是處理數(shù)據(jù)的一門科學(xué)。更簡(jiǎn)單地說(shuō).統(tǒng)計(jì)學(xué)就是數(shù)據(jù)的科
學(xué)。由于現(xiàn)在任何一項(xiàng)工作在信息時(shí)代都有很多數(shù)據(jù),我們
在日常的工作和生活中都離不開(kāi)數(shù)據(jù),因而.統(tǒng)計(jì)離我們的
生活很近很近。
下面我就分別介紹統(tǒng)計(jì)在經(jīng)濟(jì)管理中的一些主要應(yīng)用,
這里叫做統(tǒng)計(jì)在商務(wù)中的應(yīng)用。
首先我舉一個(gè)財(cái)務(wù)會(huì)計(jì)方面的例子。會(huì)計(jì)師事務(wù)所在對(duì)
某公司進(jìn)行審計(jì)的時(shí)候,并不是要對(duì)它的每一筆流水都進(jìn)行
核實(shí),因?yàn)橥ǔR粋€(gè)規(guī)模較大的公司,一年的經(jīng)濟(jì)往來(lái)會(huì)有
幾萬(wàn)、甚至幾十萬(wàn)筆,如果對(duì)每一筆業(yè)務(wù)都做逐項(xiàng)核對(duì),會(huì)
花費(fèi)大量的時(shí)間,精力、人力、物力。他們所做的工作是選
擇一個(gè)抽樣的方式,從有效的應(yīng)收帳款賬目中抽取一小部分
進(jìn)行核實(shí)。但是,根據(jù)對(duì)這一小部分瞇目核實(shí)的結(jié)果,他們
就能對(duì)這個(gè)公司整體的經(jīng)濟(jì)運(yùn)行狀況做出一個(gè)結(jié)論,即:這
個(gè)公司在財(cái)務(wù)方面是否合法,是否遵守規(guī)章制度,是否有財(cái)
經(jīng)方面的問(wèn)題。因此,從大量的數(shù)據(jù)中抽出一部分作為樣本,
并且通過(guò)對(duì)樣本的分析和計(jì)算,就能夠推斷出總體,正是統(tǒng)
計(jì)的科學(xué)性所在。
其次,看一下統(tǒng)計(jì)在營(yíng)銷方面的應(yīng)用。舉一個(gè)在零售付
款柜臺(tái)上的例子。現(xiàn)在,中國(guó)無(wú)論是大型超市、百貨商場(chǎng),
還是小型零售商店,在收款時(shí)都用掃描儀對(duì)條型碼進(jìn)行掃
指。在掃描的同時(shí).商品的所有信息就進(jìn)入到計(jì)算機(jī)。在很
多大公司,特別是在國(guó)外.人們通常使用信用卡或銀行借記
卡支付,在刷卡的同時(shí),一些個(gè)人信息也就進(jìn)入了數(shù)據(jù)庫(kù)。
這些消費(fèi)者的個(gè)人信息和購(gòu)買商品的信息,無(wú)論是對(duì)生產(chǎn)
商、制造商還是對(duì)零售商,都非常有用。例如,作為國(guó)際知
名的數(shù)據(jù)供應(yīng)商,A.C.Nielson和InformationResources,Inc.
的主要工作就是花錢從零售商店或超市購(gòu)買剛才提到的顧
客購(gòu)買商品時(shí)掃描的基礎(chǔ)信息,進(jìn)行加工后,再賣給制造商
或者零售商。一份關(guān)于啤酒這種商品的數(shù)據(jù),大概可以賣到
30多萬(wàn)美元。由此可見(jiàn),數(shù)據(jù)經(jīng)過(guò)整理,就可以變成一種產(chǎn)
品,一種商品,制造商和零售商購(gòu)買后,就可以為他們的生
產(chǎn)和服務(wù)做決策。例如,大型超市在掌握了這個(gè)信息后,就
能合理地安排超市的進(jìn)貨,甚至貨架的擺放。眾所周知,沃
爾瑪作為世界知名的大型零售商.對(duì)自己客戶的信息做了大
量分析,由專門的分析人員運(yùn)用數(shù)據(jù)挖掘技術(shù),對(duì)所有客戶
信息進(jìn)行分析,如:客戶中有多少客戶購(gòu)買什么樣的商品,
在什么時(shí)間購(gòu)買,在購(gòu)買某一種商品的同時(shí)是否還購(gòu)買其他
商品等。所有這些信息,對(duì)像沃爾瑪這樣的零售商非常有用,
通過(guò)對(duì)大量數(shù)據(jù)進(jìn)行分析,我們會(huì)發(fā)現(xiàn)經(jīng)常買啤酒的顧客會(huì)
買一些熟食作為下酒食品,假定通過(guò)分析發(fā)現(xiàn)這兩種商品具
有非常緊密的聯(lián)系,零售商沃爾瑪就會(huì)考慮兩種設(shè)計(jì):一種
設(shè)計(jì)是將啤酒專柜與熟食專柜放得非常近,好處是當(dāng)顧客往
購(gòu)物車上裝入一箱啤酒后,可以到不遠(yuǎn)的地方很方便地購(gòu)買
一些熟食:另一種設(shè)計(jì)是將這兩種商品放得遠(yuǎn)一點(diǎn).中間擺
放一些商品貨架,顧客在買完啤酒再去購(gòu)買熟食時(shí),會(huì)路過(guò)
這些貨架,在四處觀看的過(guò)程中.也許會(huì)發(fā)現(xiàn)他原本沒(méi)有準(zhǔn)
備購(gòu)買的東西,這樣就增加了顧客購(gòu)買商品的機(jī)會(huì)。所以,
現(xiàn)在很多大公司都對(duì)這樣一些信息非常重視,會(huì)考慮什么樣
的客戶會(huì)在什么時(shí)間購(gòu)買什么樣的商品,購(gòu)買某種商品的客
戶群是什么等,并利用這樣一些信息來(lái)做最好的安排,滿足
客戶的需要。這樣的研究,對(duì)提高管理水平非常有效。最近,
我也在網(wǎng)上看到中國(guó)的一些商品信息。目前,中國(guó)的數(shù)據(jù)分
析公司巳經(jīng)對(duì)彩電、洗衣機(jī)、冰箱等家用電器的數(shù)據(jù)做了整
理和分析,包括各個(gè)品牌的市場(chǎng)需求情況等,制造商和零售
商可付費(fèi)購(gòu)買。上述這些對(duì)統(tǒng)計(jì)的應(yīng)用,在營(yíng)銷管理方面有
著非常好的前景。
第三,在金融領(lǐng)域,金融部門也通過(guò)利用統(tǒng)計(jì)信息來(lái)指
導(dǎo)他們的客戶,包括他們自己進(jìn)行投資。例如,如果把個(gè)股
信息和股票市場(chǎng)的均值進(jìn)行比較,可以分析個(gè)股的價(jià)格是否
被高估。如果在Barron報(bào)告中,道瓊斯30種股票的平均市
盈率是24.7,而其中一支股票PhilipMorris的市盈率是9,
假定這個(gè)信息的數(shù)據(jù)是準(zhǔn)確的,投資者就會(huì)通過(guò)把這2個(gè)數(shù)
據(jù)進(jìn)行比較來(lái)做投資決策,因?yàn)榘凑找话愕某WR(shí),購(gòu)買市盈
率低的股票,投資回報(bào)的周期就會(huì)比較短。所以,如果有適
當(dāng)?shù)慕y(tǒng)計(jì)知識(shí),會(huì)應(yīng)用這些統(tǒng)計(jì)知識(shí)。所有公布的信息對(duì)于
消費(fèi)者、投資者和我們的客戶都會(huì)有價(jià)值,它可以幫助我們
選擇,幫助我們做更好的投資。
在現(xiàn)在的保險(xiǎn)領(lǐng)域里,就更離不開(kāi)統(tǒng)計(jì)。在保險(xiǎn)業(yè)里有
一種特殊的職業(yè)——精算師。這一職業(yè)就是專門利用概率和
統(tǒng)計(jì)知識(shí)分析風(fēng)險(xiǎn)、計(jì)算風(fēng)險(xiǎn)、盡量回避或減少在投資和保
險(xiǎn)業(yè)中的風(fēng)險(xiǎn)。這里是2006年我國(guó)保費(fèi)的一些情況。首先,
我們來(lái)看壽險(xiǎn)和健康險(xiǎn)。保險(xiǎn)可以分成壽險(xiǎn)和非壽險(xiǎn)兩類。
在壽險(xiǎn)里,精算師所做的統(tǒng)計(jì)分析有什么用呢?在壽險(xiǎn)中,
所有健康險(xiǎn)、醫(yī)療險(xiǎn)和意外險(xiǎn),最重要的工作是怎樣設(shè)計(jì)保
單、怎樣設(shè)計(jì)保費(fèi)。計(jì)算保費(fèi)的根據(jù)是什么?在壽險(xiǎn)中,最
基本的根據(jù)是生命表。生命表,簡(jiǎn)單地說(shuō)就是不同性別的人,
在0歲到100歲之間每一個(gè)年齡的死亡率。通過(guò)這個(gè)死亡率,
就可以計(jì)算每個(gè)年齡不同性別人群的風(fēng)險(xiǎn),進(jìn)而計(jì)算合理的
保費(fèi)。假如一個(gè)30歲的男性和一個(gè)60歲的男性都想購(gòu)買一
年30萬(wàn)保獻(xiàn)的保險(xiǎn),大家想一想,兩個(gè)人支付的保費(fèi)是不
是應(yīng)該一樣?一定是不一樣的。那么誰(shuí)應(yīng)該多付一些保費(fèi)
呢?是30歲的人還是60歲的人?顯然應(yīng)該是60歲的人。
為什么呢?就是因?yàn)?0歲的死亡率比30歲的死亡率要高一
些,換而言之,就是60歲比30歲的風(fēng)險(xiǎn)要大一些,既然風(fēng)
險(xiǎn)大,他就應(yīng)該多支付保險(xiǎn),因?yàn)樗氲玫酵瑯拥谋kU(xiǎn)補(bǔ)償,
因此,要想科學(xué)地制定人壽保險(xiǎn)的保單和保費(fèi),最基本的就
是要有一個(gè)好的生命表。簡(jiǎn)單地回顧一下我們國(guó)家的人壽保
險(xiǎn)。眾所周知,我國(guó)在解放以后的50年代有保險(xiǎn)業(yè)務(wù),但
到了大躍進(jìn)時(shí)期,似乎一切事務(wù)都要由國(guó)家承擔(dān)風(fēng)險(xiǎn),所以,
中國(guó)人民保險(xiǎn)公司在大躍進(jìn)后就停滯下來(lái)。直到文革結(jié)束以
后,我國(guó)實(shí)施了改革開(kāi)放政策,隨著社會(huì)主義市場(chǎng)經(jīng)濟(jì)的建
立,人們逐漸認(rèn)識(shí)到,我們的國(guó)家、社會(huì)、企業(yè)、家庭,包
括我們個(gè)人.實(shí)際上無(wú)時(shí)無(wú)刻不面臨著風(fēng)險(xiǎn)。國(guó)家有國(guó)家的
風(fēng)險(xiǎn),個(gè)人有個(gè)人的風(fēng)險(xiǎn),家庭有家庭的風(fēng)險(xiǎn),國(guó)家不可能
把所有的風(fēng)險(xiǎn)全部承擔(dān)下來(lái)。因此,到了1982年,我國(guó)的
保險(xiǎn)業(yè)開(kāi)始恢復(fù)。恢復(fù)人壽保險(xiǎn)的第一件事情就是制定保
費(fèi),但由于保瞼業(yè)已經(jīng)停滯了20年,我國(guó)實(shí)際上已沒(méi)有自
己的生命表。為了計(jì)算保費(fèi),我們借用了臺(tái)灣地區(qū)和其他國(guó)
家的生命表。我國(guó)是一個(gè)擁有十幾億人口的大國(guó),國(guó)土面積
達(dá)960萬(wàn)平方公里,南北東西城鄉(xiāng)差異很大,而臺(tái)灣作為我
國(guó)的一個(gè)地區(qū),用他的生命表來(lái)計(jì)算大陸壽險(xiǎn)的保費(fèi),顯然
是不盡合理的。隨著保險(xiǎn)事業(yè)的開(kāi)展,我們不斷枳累了很多
數(shù)據(jù).到90年代初,就開(kāi)始著手進(jìn)行生命表的編制。大概
在1993—1994年,我國(guó)第一張生命表編制完成,并且在90
年代開(kāi)始使用。又經(jīng)過(guò)大概10年的時(shí)間,我國(guó)對(duì)這張生命
表進(jìn)行了完善,而且編制了第二張生命表。在第二張生命表
即將編制完成、準(zhǔn)備使用時(shí),社會(huì)上有一些人制造輿論,說(shuō)
“新的生命表已經(jīng)編出來(lái)了,如果使用新的生命表,保險(xiǎn)產(chǎn)
品要漲價(jià)”,因而在那里煽動(dòng),“如果要購(gòu)買保險(xiǎn),現(xiàn)在買是
合適的,因?yàn)橐坏┮獙?shí)行新的生命表,保費(fèi)要漲了:這里,
用我們的知識(shí)判斷一下,如果其他條件不變,購(gòu)買同樣保額
的保險(xiǎn),用10年后的生命表取代10年前的生命表進(jìn)行計(jì)算,
我們的保野應(yīng)該是升還是降?顯然,應(yīng)該降。因?yàn)?隨著杜
會(huì)經(jīng)濟(jì)的發(fā)展,隨著醫(yī)療條件的改善,每個(gè)年齡組的死亡率
都在不斷下降,人均的預(yù)期壽命在不斷上升,在這樣的條件
下,我們的保費(fèi)不是應(yīng)該升,而是應(yīng)該降。這也說(shuō)明,如果
有一些概率、統(tǒng)計(jì)、保險(xiǎn)方面的知識(shí),我們就不會(huì)被那些蠱
感人心的言論所左右。事后,也有一些專家出來(lái)澄清這一事
實(shí),希望大家不要搶購(gòu),而應(yīng)該根據(jù)自己的計(jì)劃來(lái)購(gòu)買保險(xiǎn).
在財(cái)產(chǎn)保險(xiǎn)中,我們重點(diǎn)看一下抗空意外保險(xiǎn)。大家在
坐飛機(jī)前通常要做一件事就是購(gòu)買一份航空意外保險(xiǎn)。過(guò)去
曾經(jīng)是20元錢保20萬(wàn),現(xiàn)在是20元錢保40萬(wàn)。利用我們
的知識(shí)可以做一點(diǎn)基本分析:如果暫時(shí)不考慮保險(xiǎn)公司的利
潤(rùn)和管理費(fèi)用,保險(xiǎn)的保費(fèi)價(jià)格應(yīng)該和什么有關(guān)系?應(yīng)該與
航空的風(fēng)險(xiǎn)有關(guān),風(fēng)險(xiǎn)越高,你所支付的保費(fèi)就應(yīng)該越多。
請(qǐng)大家計(jì)算一下,現(xiàn)在用20元錢購(gòu)買40萬(wàn)的保額,這就意
味著航空意外的風(fēng)險(xiǎn)應(yīng)該是多少?二萬(wàn)分之一。中國(guó)民航的
實(shí)際風(fēng)險(xiǎn)是多少?這個(gè)數(shù)據(jù)大家可能不太在意。我國(guó)在計(jì)算
民航實(shí)際風(fēng)險(xiǎn)時(shí),是以10年間所有的骯班作為一個(gè)統(tǒng)計(jì)周
期,即;10年間我國(guó)共有多少萬(wàn)次航班,航空意外事故有幾
次。目前,我國(guó)民航的平均風(fēng)險(xiǎn)是二百萬(wàn)分之一。剛才已經(jīng)
計(jì)算過(guò),我國(guó)航空意外保險(xiǎn)保責(zé)設(shè)計(jì)的風(fēng)險(xiǎn)是二萬(wàn)分之一,
而實(shí)際風(fēng)險(xiǎn)是二百萬(wàn)分之一,如果不考慮保險(xiǎn)公司的利潤(rùn)和
管理費(fèi)用,那么保險(xiǎn)公司在航空意外險(xiǎn)上的利潤(rùn)就是100倍。
正是因?yàn)楹娇找馔怆U(xiǎn)有如此大的利潤(rùn)空間,在過(guò)去的幾年
里,我國(guó)航空意外險(xiǎn)的保險(xiǎn)市場(chǎng)非?;靵y,出現(xiàn)了一些不規(guī)
范、不合法的保險(xiǎn)公司和中介公司,甚至賣出一些假保單.
因?yàn)槲覈?guó)民航的風(fēng)險(xiǎn)非常低,所以,他們一旦把保單賣出去,
就可以凈賺20元錢。為此,我國(guó)保監(jiān)會(huì)、保監(jiān)局等部門整
頓了航空保險(xiǎn)市場(chǎng)。從技術(shù)層面講,一般國(guó)外的保險(xiǎn)公司,
其利潤(rùn)僅占所有保險(xiǎn)產(chǎn)品的10V20%,據(jù)此分析,我國(guó)的航
空意外險(xiǎn)應(yīng)該降價(jià),如果保額仍為40萬(wàn)元,保費(fèi)不應(yīng)該建
過(guò)1元錢,這個(gè)比例比較合理,也能夠保證保險(xiǎn)公司正常的
利潤(rùn)空間。這就是我們利用概率統(tǒng)計(jì)進(jìn)行分析的結(jié)果。
生產(chǎn)管理是概率統(tǒng)計(jì)方法應(yīng)用得最為經(jīng)典,也最為成功
的領(lǐng)域。在生產(chǎn)過(guò)程中被廣泛應(yīng)用的SPC管理(Statistica)
ProcessControl),簡(jiǎn)稱為統(tǒng)計(jì)過(guò)程控制,是在上個(gè)世紀(jì)30
年代.由美國(guó)的貝爾電話實(shí)臉室首先創(chuàng)建的。它是利用統(tǒng)計(jì)
方法制作控制圖,運(yùn)用統(tǒng)計(jì)分析技術(shù)對(duì)生產(chǎn)過(guò)程進(jìn)行實(shí)時(shí)監(jiān)
控,它的貢獻(xiàn)是對(duì)整個(gè)工業(yè)企業(yè)的生產(chǎn)效率和產(chǎn)品質(zhì)量的提
高起了板大作用,是一個(gè)非常偉大的應(yīng)用。此外,還有大家
同樣熟悉的6西格瑪管理,從上個(gè)世紀(jì)80年代后期到今天,
一直在國(guó)際上的一些大公司,包括GC、摩托羅拉等世界級(jí)
大公司廣泛使用,并且取得了成功。6西格瑪管理運(yùn)用了贊
率統(tǒng)計(jì)中關(guān)于正態(tài)分布標(biāo)準(zhǔn)差的理論,這是一種非常成功的
管理模式,巳成為現(xiàn)在國(guó)際化大公司進(jìn)行管理的一種重要工
具。第三個(gè)重要應(yīng)用是實(shí)驗(yàn)設(shè)計(jì),它的作用是在生產(chǎn)之前,
用統(tǒng)計(jì)方法進(jìn)行實(shí)驗(yàn)設(shè)計(jì),從而保障企業(yè)在生產(chǎn)過(guò)程中可以
盡量少生產(chǎn)、甚至不生產(chǎn)不合格產(chǎn)品。以上三個(gè)例子,都是
利用統(tǒng)計(jì)進(jìn)行生產(chǎn)管理的典型案例。作為經(jīng)濟(jì)的宏觀管理部
n,包括政府管理部門.我們會(huì)應(yīng)用到對(duì)經(jīng)濟(jì)的預(yù)測(cè)和分析,
也會(huì)應(yīng)用到經(jīng)濟(jì)計(jì)量模型,這里會(huì)涉及到一些統(tǒng)計(jì)的指標(biāo)和
概念,如:通貨膨脹率、物價(jià)指數(shù)和失業(yè)率等。作為一個(gè)好
的管理者,我們應(yīng)該熟悉一些在生活和管理中用得最多的一
些統(tǒng)計(jì)指標(biāo),了解其內(nèi)涵、應(yīng)用范圍等。如果想更深入地做
一些研究,我們還會(huì)利用到回歸分析和統(tǒng)計(jì)模型進(jìn)行預(yù)測(cè).
這種建立在比較準(zhǔn)確的數(shù)據(jù)分析基礎(chǔ)上的分析和預(yù)測(cè),能使
管理者的工作效率更高,工作做得更好。
統(tǒng)計(jì)不僅在生產(chǎn)和管理中被廣泛應(yīng)用,而且在生活中也
有許多應(yīng)用,比如:體育。首先,我們來(lái)看籃球比賽。由于
姚明加入了美國(guó)NBA,所以在NBA中我們的影響很大,NBA
還專匚建立了一個(gè)中文網(wǎng)站,網(wǎng)址為。該
網(wǎng)站中有兩個(gè)關(guān)于統(tǒng)計(jì)數(shù)據(jù)的網(wǎng)頁(yè),分別是“數(shù)據(jù)”和“排
名”。2007年NBA的常規(guī)賽剛剛結(jié)束,目前正在進(jìn)行季后賽。
在“數(shù)據(jù)”頁(yè)面中,我們可以看到季后賽的得分情況,這就
是NBA球員的技術(shù)統(tǒng)計(jì),它是按照球員平均每場(chǎng)的投籃命
中率和得分情況進(jìn)行排序的。目前排在第一位的是洛杉磯湖
人隊(duì)的科比布萊恩特,他平均每場(chǎng)得分為32.8分。排在第
二位的球員平均每場(chǎng)得分為32分。中國(guó)非常優(yōu)秀的球員姚
明,在NBA季后賽中排在第8位,平均每場(chǎng)得分為25.1分。
在球員的技術(shù)統(tǒng)計(jì)數(shù)據(jù)中,還包括平均每場(chǎng)出場(chǎng)時(shí)間,投球
數(shù),命中數(shù)。姚明平均每場(chǎng)投籃17.9個(gè),平均命中7.9個(gè).
命中率是44%,罰球的命中率是88%?這些觀眾和球迷都能
看到的數(shù)據(jù),對(duì)球隊(duì)管理者更為有用。NBA每一支球隊(duì)的教
練員和教練組,都會(huì)利用這些數(shù)據(jù)安排技戰(zhàn)術(shù),球隊(duì)的老板
和管理人員用更為具體的數(shù)據(jù)安排球員的獎(jiǎng)金,甚至是出場(chǎng)
費(fèi)。在國(guó)外,體肓比賽的數(shù)據(jù)搜集得非常詳細(xì)。眾所周知,
美國(guó)哥倫比亞大學(xué)經(jīng)濟(jì)系非常知名,去年諾貝爾獎(jiǎng)金獲得者
就是哥大經(jīng)濟(jì)系的教授,另外,該系的蒙黛爾教授、斯第格
里西教授等也都曾獲得過(guò)諾貝爾經(jīng)濟(jì)學(xué)獎(jiǎng)。有一位馬丁教
授,除了在哥大經(jīng)濟(jì)系做教授外,還兼任西班牙巴塞羅那足
球隊(duì)體育技術(shù)委員會(huì)的主席,其工作就是迸行統(tǒng)計(jì)數(shù)據(jù)的收
集和分析。該委員會(huì)把巴塞羅那隊(duì)的每一場(chǎng)比賽進(jìn)行錄像,
把每一名隊(duì)員的每一個(gè)動(dòng)作作為數(shù)據(jù)輸入到計(jì)算機(jī)里,用來(lái)
做分析、做管理。嚴(yán)格地說(shuō),他所做的工作是記錄隊(duì)員在球
場(chǎng)比賽的每一個(gè)動(dòng)作,包括成功、失誤、助攻、射門的次數(shù)
等,這些情況全部與隊(duì)員的獎(jiǎng)金掛鉤,這就是一位經(jīng)濟(jì)學(xué)教
授在巴塞羅那足球隊(duì)所做的管理性的工作。通過(guò)上述案例可
以看出,對(duì)數(shù)據(jù)的搜集、整理和分析,不僅在管理和工作中
非常有效,而且在生活中、在體育比賽中,甚至在娛樂(lè)中都
被經(jīng)常用到。著名科學(xué)家愛(ài)因斯坦曾經(jīng)說(shuō)過(guò),“數(shù)學(xué)定律不
能百分之百確實(shí)地用在現(xiàn)實(shí)生活中間;能夠百分之百確實(shí)地
用數(shù)學(xué)定律描述的,就不是現(xiàn)實(shí)生活?!币馑际钦f(shuō),我們的
現(xiàn)實(shí)生活是紛紜復(fù)雜的,不能簡(jiǎn)單地用數(shù)學(xué)公式進(jìn)行描述,
如果需要做補(bǔ)充,統(tǒng)計(jì)的方法、概率的方法恰恰是能夠從比
較紛紜復(fù)雜的現(xiàn)實(shí)生活中發(fā)現(xiàn)規(guī)律的一種方法和一種有效
工具。它能夠從雜亂無(wú)章、無(wú)規(guī)律可循的數(shù)據(jù)中間發(fā)現(xiàn)事務(wù)
的內(nèi)部規(guī)律,換而言之,統(tǒng)計(jì)方法就是要發(fā)現(xiàn)事務(wù)內(nèi)部的、
規(guī)律性的數(shù)量關(guān)系和數(shù)置變化0
請(qǐng)看下面一組統(tǒng)計(jì)數(shù)據(jù)。第一,在正常情況下新生嬰兒
的男女性別比率是106:100,其含義是,在大量的新生兒中,
男孩和女孩的比例是106;100o現(xiàn)實(shí)生活中,新生娶兒并非
是男孩和女孩一樣多,而是平均每100個(gè)女孩就會(huì)有106個(gè)
男孩,即:新生嬰兒中男孩比女孩要多,平均每206個(gè)新生
嬰兒中,男孩就比女孩多6個(gè)。那么,人類是如何保持男女
性別的平衡、保證人類的遺傳、社會(huì)的和諧發(fā)展呢?是什么
原因使人類具有這樣一個(gè)基本規(guī)律呢?為什么在新生要兒
中是男孩比女孩多一些呢?因?yàn)槟行员扰缘乃劳雎矢?,?/p>
僅在新生嬰兒時(shí)期,在所有的年齡組中,男性的死亡率都比
女性要高。因而,在新生嬰兒中男孩比女孩多一點(diǎn),恰恰可
以保證人類社會(huì)能夠和諧地、可持續(xù)地發(fā)展。雖然新生嬰兒
男孩略多一些,但是由于男性在每一個(gè)年齡組的死亡率都比
女性要高一點(diǎn),在中青年結(jié)陪生育的時(shí)候,男性與女性的人
數(shù)就基本相等了,從而保證了在生育時(shí)期人口性別的平衡.
隨著人們進(jìn)入中年、進(jìn)入老年,由于男性的死亡率仍然比女
性高,就導(dǎo)致了真正長(zhǎng)壽的女性要比男性多一些。由于處在
要幼兒時(shí)期的男性比女性多一點(diǎn).中青年時(shí)男女大體持平,
年老時(shí)期的男性比女性要少,從人口的總規(guī)模來(lái)看.男女的
人口總量又俁持了另外的一個(gè)平衡,這就是人類社會(huì)幾十萬(wàn)
年,幾百萬(wàn)年甚至更長(zhǎng)時(shí)間遺傳變異的結(jié)果,就形成了一個(gè)
規(guī)律。在我國(guó)尚未實(shí)行計(jì)劃生育政策時(shí),多數(shù)家庭都有4—5
個(gè)孩子,也許有些家庭都是女孩,而有些家庭都是男孩.如
果到一些居委會(huì)去做統(tǒng)計(jì),也許某一個(gè)居委會(huì)的女孩多、而
另一個(gè)居委會(huì)的男孩多,可一旦我們進(jìn)行大量數(shù)據(jù)的搜集整
理,新生嬰兒的男女性別比一定符合這個(gè)規(guī)律;106:100.
這個(gè)規(guī)律在古今中外,每一個(gè)國(guó)家、每一個(gè)大洲都基本相同.
這是我們對(duì)大量數(shù)據(jù)進(jìn)行分析發(fā)現(xiàn)的規(guī)律。早在17世紀(jì),
英國(guó)倫敦的統(tǒng)計(jì)學(xué)者就發(fā)現(xiàn)了這個(gè)規(guī)律,這也應(yīng)該作為統(tǒng)計(jì)
學(xué)發(fā)展的源頭之一。
笫二個(gè)數(shù)據(jù)來(lái)自于生活中常做的一種游戲:當(dāng)陵機(jī)地投
擲一枚硬幣時(shí),出現(xiàn)正、反面的規(guī)律都應(yīng)該是50%。這也是
經(jīng)過(guò)大量實(shí)驗(yàn)得出的規(guī)律。同樣.如果我們隨機(jī)地投擲一個(gè)
骰子,其六面中每一面出現(xiàn)的可能性都是六分之一。這些規(guī)
律,對(duì)于現(xiàn)代人來(lái)說(shuō)毋廊質(zhì)疑,但在200-300年前,一些
數(shù)學(xué)家和學(xué)者為研究這一規(guī)律進(jìn)行了大量的投擲,最多可達(dá)
2萬(wàn)多次。在這個(gè)過(guò)程中,他們發(fā)現(xiàn),投擲的次數(shù)越多,現(xiàn)
幣正、反兩面出現(xiàn)的比率就越接近50%。
第三,美國(guó)越戰(zhàn)時(shí)期通過(guò)“抓閹”征兵時(shí)出現(xiàn)的兩個(gè)數(shù)
據(jù):73/183和110/183。越南戰(zhàn)爭(zhēng)在60年代初期剛爆發(fā)時(shí),
美國(guó)的年輕人非常踴躍地報(bào)名參軍,但幾年后,隨著越市戰(zhàn)
爭(zhēng)被拖入一個(gè)沒(méi)有盡頭的泥潭,美國(guó)社會(huì)出現(xiàn)了反戰(zhàn)情署。
雖然戰(zhàn)爭(zhēng)還沒(méi)有結(jié)束,但美國(guó)的年輕人已不再愿意去當(dāng)兵.
美國(guó)政府迫于無(wú)奈,由國(guó)會(huì)通過(guò)了一個(gè)征兵法案。因?yàn)槊绹?guó)
的立國(guó)之本就是平等,該法案為了保證每一個(gè)年輕人擁有平
等的當(dāng)兵機(jī)會(huì),采取了類似“折閹”的方式,其做法與我國(guó)
現(xiàn)在的體肓彩票、福利彩票相似,即:把一年中的每一天和
閏年的2月29日分別寫(xiě)在紙條上,把這366個(gè)紙條分別裝
在藍(lán)色小球中,再放到一個(gè)大的透明的玻璃罐中,像體育彩
票和福利彩票搖獎(jiǎng)一樣進(jìn)行搖號(hào)。這項(xiàng)法案茯得美國(guó)國(guó)會(huì)通
過(guò)后,1969年在美國(guó)現(xiàn)場(chǎng)直播。當(dāng)把366個(gè)生日小球放入一
個(gè)透明的大玻璃罐中攪拌均勻后,小球一個(gè)接一個(gè)地掉下
來(lái),并被按照掉下來(lái)的順序排隊(duì)。如果某一個(gè)生日第一個(gè)掉
下來(lái),在征兵時(shí),這一天出生的人就要第一批去當(dāng)兵。顯然,
生日搖得越靠前,被征兵的機(jī)會(huì)就越大.如果某一個(gè)生日被
排在一年的一半以后,那么這一天出生的人去當(dāng)兵的機(jī)會(huì)就
比較小,因?yàn)槊绹?guó)不會(huì)把他所有的年輕人都派去當(dāng)兵。實(shí)際
上,如果某一個(gè)生日被排到了183以后,即一年的一半以后,
這一天出生的人就基本上不會(huì)去當(dāng)兵。當(dāng)時(shí)征兵的范圍是18
至29歲的男性青年,只要身體健康,都要按照搖號(hào)的順序
去當(dāng)兵。為什么?因?yàn)檫@是公平的、這是隨機(jī)的、這是合理
的。電視直播后,統(tǒng)計(jì)學(xué)家立即對(duì)這個(gè)數(shù)據(jù)進(jìn)行了分析,正
如幻燈片上所講,搖出的結(jié)果是,在前183個(gè)生日中,有73
個(gè)是上半年、有110個(gè)是下半年,而并非為各50%左右。因
為國(guó)會(huì)在逋過(guò)該法案的時(shí)候,就是要保證公平,保證每一個(gè)
生日被抽中的機(jī)會(huì)是相等的,但實(shí)際上,上半年出生的人征
兵的機(jī)會(huì)是73/183.而下半年出生的人去當(dāng)兵的機(jī)會(huì)是
110/183o顯然,下半年出生的人去當(dāng)兵的機(jī)會(huì)要大一些。
統(tǒng)計(jì)學(xué)家對(duì)這個(gè)數(shù)據(jù)進(jìn)行了假設(shè)檢臉,結(jié)果是這兩個(gè)數(shù)據(jù)之
間有顯著的差異。因此,統(tǒng)計(jì)學(xué)家立刻對(duì)國(guó)會(huì)提出質(zhì)疑:這
一次征兵過(guò)程中的搖號(hào)不隨機(jī),對(duì)下半年出生的人不公平,
他們?nèi)ギ?dāng)兵的機(jī)會(huì)遠(yuǎn)遠(yuǎn)大于上半年出生的人,似乎對(duì)下半年
出生的人存在著歧視。國(guó)會(huì)為檢驗(yàn)這個(gè)數(shù)據(jù)也請(qǐng)了學(xué)者,證
明統(tǒng)計(jì)學(xué)家是正確的。國(guó)會(huì)于是承認(rèn),”這一次的設(shè)計(jì)還不
夠科學(xué),366個(gè)小球放到一個(gè)大玻璃罐中應(yīng)該完全搖勻,但
實(shí)際上還不夠均勻,導(dǎo)致了在掉下來(lái)的前183個(gè)小球中,下
半年的生日多一些。明年我們會(huì)做得再好一些,今年就這樣
了J從這個(gè)例子中可以看出,統(tǒng)計(jì)在我們的日常生活和工
作中,都可以被廣泛地應(yīng)用。
第四個(gè)是上個(gè)世紀(jì)50年代初期小兒麻痹癥疫苗試卷的
數(shù)據(jù)。一般情況下,新藥和新疫苗在研究過(guò)程中,都要經(jīng)過(guò)
三個(gè)嚴(yán)格的試臉階段。例子中的這組數(shù)據(jù)是在試臉的最后一
個(gè)階段,服用疫苗和沒(méi)有服用疫苗的孩子各有20萬(wàn),服用
疫苗的孩子中有56人得了小兒麻痹癥,而沒(méi)有服用疫苗的
孩子中有138個(gè)孩子患病。根據(jù)對(duì)這一數(shù)據(jù)進(jìn)行統(tǒng)計(jì)計(jì)算和
分析后,研究人員就可以得出這種疫苗是否有效的結(jié)論。目
前,所有新藥都要經(jīng)過(guò)這樣嚴(yán)格的數(shù)據(jù)檢驗(yàn),包括中國(guó)正在
著力開(kāi)發(fā)的非典疫苗、艾滋病疫苗等,都在做這樣的檢驗(yàn)。
最后是一個(gè)關(guān)于廣告費(fèi)用、企業(yè)知名度和銷售額的一組
數(shù)據(jù)%如果能夠搜集到充分的數(shù)據(jù)一,我們就可以描述出某一
個(gè)公司、某一個(gè)企業(yè)通過(guò)做廣告.為提高企業(yè)知名度和銷售
額所帶來(lái)的變化e通過(guò)發(fā)現(xiàn)他們之間的數(shù)量關(guān)系,就可以制
定科學(xué)的廣告策略。
從上述例子中可以看出,統(tǒng)計(jì)的方法,或者說(shuō)是數(shù)據(jù)分
析的方法,是在各個(gè)領(lǐng)域里進(jìn)行科學(xué)研究的一個(gè)基本工具,
既包括經(jīng)濟(jì)、管理、醫(yī)療、物理、天文等領(lǐng)域,也包括人文
社會(huì)科學(xué)的一些領(lǐng)域,如法律、歷史等。在現(xiàn)在的法庭審判
中,越來(lái)越多地依賴于數(shù)據(jù)分析,數(shù)據(jù)分析作為法庭審判中
的證據(jù),有非常好的應(yīng)用。因而,作為一種數(shù)據(jù)分析的方法,
統(tǒng)計(jì)不僅滲透在幾乎所有的學(xué)科領(lǐng)域里,而且在日常生活的
每一個(gè)角落,都可以找到很好的數(shù)據(jù)分析、統(tǒng)計(jì)分析的應(yīng)用。
統(tǒng)計(jì)的方法可以分成兩大類.一類是描述統(tǒng)計(jì),一類是
推斷統(tǒng)計(jì)。在推斷統(tǒng)計(jì)中,又可以分為參數(shù)估計(jì)和假設(shè)檢驗(yàn)。
實(shí)際上,幻燈片中的框圖已非常簡(jiǎn)單地勾畫(huà)出完整的統(tǒng)計(jì)體
系。
首先看播述統(tǒng)計(jì)。在幻燈片的右邊是一個(gè)柱形圖,我們
可以直觀地看到數(shù)據(jù)變化的過(guò)程.每個(gè)柱形下面分別標(biāo)有
QLQ2.Q3、Q4,這是英文和數(shù)字的縮寫(xiě),大家很容易就可
以猜到這可能是反映一個(gè)公司、一個(gè)企業(yè)甚至一個(gè)行業(yè)季度
銷售額或利潤(rùn)的變化,這里的Q代表季度。假定這反映的是
銷售額的變化,我們從直觀的柱形圖中可以看到,這種商品
或服務(wù)具有在前三個(gè)季度逐漸上升、在第四季度下降的規(guī)律
或趨勢(shì)。我們會(huì)很快聯(lián)想到飲料、游泳衣或某地區(qū)旅游業(yè)等
情況,因?yàn)檫@些商品或服務(wù)都具有這樣的規(guī)律。因此,凡是
看到這樣的柱形圖.如果我們有統(tǒng)計(jì)的知識(shí),就可以很容易
地聯(lián)想到這背后反映的是一類什么樣的事務(wù),這就是描述統(tǒng)
計(jì)。簡(jiǎn)單地說(shuō),描述統(tǒng)計(jì)就是怎樣有效地搜集數(shù)據(jù)、整理數(shù)
據(jù)、顯示數(shù)據(jù),并且發(fā)現(xiàn)數(shù)據(jù)基本的、數(shù)量的特征。在此圖
下邊有兩個(gè)數(shù)據(jù),一個(gè)是平均數(shù),用N表示;一個(gè)是方差,
用/表示。這兩個(gè)數(shù)據(jù)是統(tǒng)計(jì)的核心數(shù)據(jù),分別.表明數(shù)據(jù)的
平均水平和數(shù)據(jù)之間的一個(gè)平均的差異水平,有了這兩個(gè)數(shù)
據(jù)一一平均值和方差(也叫標(biāo)準(zhǔn)差),我們就可以比較清造
地把握數(shù)據(jù)的規(guī)律。
其次是推斷統(tǒng)計(jì)。推斷統(tǒng)計(jì)的思路和原理就是幻燈片中
右邊的這張圖,其目的是了解一個(gè)總體的數(shù)量特征,并對(duì)總
體的數(shù)量特征做出科學(xué)的估計(jì)或推斷。通常情況下,這個(gè)總
體非常大,有時(shí)是沒(méi)有數(shù)量界限的一個(gè)無(wú)窮的總體,要對(duì)它
的特點(diǎn)做出估計(jì)或了解,就很難對(duì)總體里每一個(gè)單位都進(jìn)行
調(diào)查。我們能夠做的是從總體中抽出一個(gè)樣本,通常是一個(gè)
很小的樣本,通過(guò)對(duì)樣本的分析或數(shù)據(jù)描述,就可以推斷出
總體的特征。例如,美國(guó)在總統(tǒng)大選期間都要做民意測(cè)驗(yàn)。
美國(guó)總統(tǒng)大選的總體就是美國(guó)的全體選民,是18歲以上的
美國(guó)成年人。目前.美國(guó)的總?cè)丝谒冉?jīng)趣過(guò)3億,選民在2
億左右。如果通過(guò)對(duì)每一個(gè)選民都進(jìn)行遍查的方式進(jìn)行總統(tǒng)
大選預(yù)測(cè),顯然是不可能的,因?yàn)榧词沟搅嗣绹?guó)大選投票的
那一天,一般也只會(huì)有60%—7(用的選民去投票,而幾千萬(wàn)甚
至更多的選民不會(huì)去投票。因此,美國(guó)一些大的新聞機(jī)構(gòu)和
調(diào)查公司就采取隨機(jī)抽樣的方式,從2億的選民總體中抽取
一個(gè)樣本進(jìn)行調(diào)查。如果想研究全部2億人,并做出一個(gè)科
學(xué)的推斷,估計(jì)的誤差不越過(guò)2-3個(gè)百分點(diǎn),即:誤差不
超過(guò)2$或3樂(lè)那么,樣本量應(yīng)該是多少呢?蓋洛普——美
國(guó)一個(gè)非常有名的調(diào)查機(jī)構(gòu),只調(diào)查1000-1500人,即:
從2億的一個(gè)人口總體中,只調(diào)查其中的1000—1500人,
顯然,與總體相比,這個(gè)樣本是很小的。那么準(zhǔn)確性如何呢?
蓋洛普從1936年起至今,已有近70年的實(shí)踐,在每四年一
次的總統(tǒng)大選中,其平均誤差在2%左右,歷史上只有一次做
了錯(cuò)誤的推斷和預(yù)測(cè),其他都對(duì)了。其他一些大的新聞機(jī)構(gòu).
如:美國(guó)的CNN、CBS.ABC等,其調(diào)查的樣本量都是1000
-1500o這個(gè)例子告訴我們,只要方法科學(xué),就可以做到抽
取一個(gè)很小的樣本,而得到非常精確的結(jié)果,這就是統(tǒng)計(jì)方
法的科學(xué)性所在。目前,在我們的許多調(diào)查中經(jīng)常出現(xiàn)一個(gè)
問(wèn)題:調(diào)查的樣本量很大,可方法并不科學(xué),有時(shí)調(diào)查了幾
千甚至上萬(wàn)人,但得到的結(jié)果卻與真實(shí)的情況相差很多。因
此,我們不能僅追求調(diào)杳的數(shù)量,而應(yīng)追求調(diào)查的質(zhì)量,要
掌握這一技術(shù),統(tǒng)計(jì)方法非常之重要。
我們談到了,在統(tǒng)計(jì)的方法體系里,主要是描述統(tǒng)計(jì)和
推斷統(tǒng)計(jì)兩部分?;脽羝杏幸粋€(gè)框圖.最左邊是我們研究
事務(wù)的開(kāi)始,是反映客觀現(xiàn)象數(shù)據(jù)的開(kāi)始,換而言之,統(tǒng)計(jì)
分析和統(tǒng)計(jì)研究必須要有數(shù)據(jù),我們本身也應(yīng)該做到科學(xué)地
搜集數(shù)據(jù)和整理數(shù)據(jù)。一旦有數(shù)據(jù),我們就可以進(jìn)行分析。
這里有兩條路緩,如果我們得到的是總體的數(shù)據(jù),經(jīng)過(guò)描述
統(tǒng)計(jì),我們就能達(dá)到目的,即:認(rèn)識(shí)總體內(nèi)在數(shù)量的規(guī)律性。
但90%以上的情況是,我們很難得到總儂的數(shù)據(jù),而通常得
到的是樣本的數(shù)據(jù),因此,我們先要經(jīng)過(guò)描逑統(tǒng)計(jì),同時(shí)再
經(jīng)過(guò)推斷統(tǒng)計(jì),在這個(gè)過(guò)程中,還要用到概,辜的一些知識(shí).
作為統(tǒng)計(jì)知識(shí)的基礎(chǔ),我們特別強(qiáng)調(diào)兩對(duì)基本強(qiáng)念,-
對(duì)概念就是剛才舉例中提到的總體和樣本??傮w就是我們研
究事務(wù)的全部,英語(yǔ)叫做Population,也有人口的意思;跟
它對(duì)應(yīng)的一個(gè)概念就叫做樣本,是從總體中隨機(jī)抽出來(lái)的一
部分。我們通常只研究樣本,然后對(duì)總體進(jìn)行推斷。
第二對(duì)概念是參數(shù)和統(tǒng)計(jì)量。參數(shù)是描述總體數(shù)量特征
的,最關(guān)健的3個(gè)數(shù)據(jù)是總體的平均數(shù)、總體的標(biāo)準(zhǔn)差、總
體的百分比,分別用3個(gè)希臘字母表述為:口、。、P;另
外一個(gè)概念是描述樣本數(shù)量特征的,稱為統(tǒng)計(jì)量,最重要的
3個(gè)數(shù)據(jù)為樣本的平均數(shù)、樣本的標(biāo)準(zhǔn)差、樣本的比率或百
分比。
我們可以把這兩對(duì)基本概念用幻燈片中的圖例表述出
來(lái),左邊是總體,描述總體的是參數(shù):右邊是總體的一部分,
可能是很小的一部分,我們稱之為樣本,描述樣本的是統(tǒng)計(jì)
量,這里有三對(duì)主要的量.就是均值、標(biāo)準(zhǔn)差和比率。實(shí)際
上,我們?cè)趯W(xué)習(xí)統(tǒng)計(jì)的時(shí)候,在掌握統(tǒng)計(jì)方法的時(shí)候,最最
核心的就是應(yīng)該理解均值、標(biāo)準(zhǔn)差和百分比。這是我們做分
析計(jì)算用得最多的量。
既然要處理數(shù)據(jù),自然離不開(kāi)統(tǒng)計(jì)軟件,在這里介紹5
種:排在前邊3A$、SPSS.MINITAB和STATIST1CA都是
專業(yè)的統(tǒng)計(jì)分析軟件,用于較高或較深層次的統(tǒng)計(jì)研究;對(duì)
于一般的應(yīng)用者,我們只需要熟悉EXCEL軟件即可,因?yàn)?/p>
它是一個(gè)非常簡(jiǎn)單的數(shù)據(jù)列表和分析軟件e
第一部分緒論就到這里。通過(guò)緒論,希望大家能終了解,
統(tǒng)計(jì)作為一個(gè)數(shù)據(jù)分析的方法和基本工具,對(duì)我們的科學(xué)研
究,對(duì)我們的生產(chǎn)、管理和日常生活有著廣泛的應(yīng)用。在我
們生活和工作的所有方面都離不開(kāi)數(shù)據(jù)丁有了數(shù)據(jù)就有了統(tǒng)
計(jì),應(yīng)用統(tǒng)計(jì)來(lái)分析數(shù)據(jù),就可以幫助我們提高管理.使我
們的生活更加豐富多彩.
第二部分描述統(tǒng)計(jì)
下面我們簡(jiǎn)單的紿大家介紹描述統(tǒng)計(jì)部分的內(nèi)容。描述
統(tǒng)計(jì)就是指怎樣有效地收集數(shù)據(jù),并通過(guò)圖表形式對(duì)所收集
數(shù)據(jù)進(jìn)行初步的加工整理和顯示,進(jìn)而分析得出結(jié)論。我們
有不同地獲得數(shù)據(jù)的方法,這里主要介紹兩種:第一是普查.
這是獲得數(shù)據(jù)的一種主要方法,普查就是為某一個(gè)調(diào)查目的
組織的全面調(diào)查,一般只做一次或者是周期性的做一次,需
要?jiǎng)佑煤艽蟮膰?guó)情國(guó)力,通常只是對(duì)國(guó)家或地區(qū)的最基本
的、涉及到國(guó)計(jì)民生的、極其重要的數(shù)據(jù)才實(shí)施普查的方式。
就我國(guó)而言,通過(guò)普查獲得數(shù)據(jù)的調(diào)查方法主要有兩類:一
是人口普查,目的是了解我國(guó)的基本國(guó)情,每隔十年做一次,
2000年國(guó)家實(shí)施了第五次人口普查,2010年將進(jìn)行第六次
人口普查。搞一次人口普查需要做很長(zhǎng)時(shí)間的準(zhǔn)備,需要?jiǎng)?/p>
用和培訓(xùn)大量的普查員,所獲得的數(shù)據(jù)也是相當(dāng)大的信息
量,普查是一次對(duì)整個(gè)國(guó)情國(guó)力的動(dòng)員,國(guó)家要有很大的投
入,所以不是經(jīng)常進(jìn)行的。二是經(jīng)濟(jì)普查,除人口普查外,
我國(guó)還有第三產(chǎn)業(yè)普查、工業(yè)普查、基本單位巡查等等。01
年經(jīng)國(guó)務(wù)院批準(zhǔn),把幾個(gè)普查珠合成一個(gè),就是經(jīng)濟(jì)普查.
第一次經(jīng)濟(jì)普查從03年開(kāi)始準(zhǔn)備,到04年底將普查結(jié)果向
社會(huì)公布。大家可能關(guān)注到一個(gè)數(shù)據(jù),即普查后的GDP比普
查前增加了2.3萬(wàn)億元人民幣,總量增長(zhǎng)了16.8K原因是
原來(lái)的第三產(chǎn)業(yè)統(tǒng)計(jì)還有很多不完善的地方,如一些服務(wù)業(yè)
企業(yè)沒(méi)有納入統(tǒng)計(jì)范圍,造成數(shù)據(jù)缺失。所以增加的2.3萬(wàn)
億元中約有90%以上來(lái)自于第三產(chǎn)業(yè)。因此,通過(guò)經(jīng)濟(jì)普查
也進(jìn)一步完善了調(diào)查制度和數(shù)據(jù)收集方法??傊?,普查是一
種重要的收集數(shù)據(jù)的方法,但由于它要?jiǎng)佑么罅康娜肆?、?/p>
力、財(cái)力,調(diào)查的周期也很長(zhǎng),因而只有關(guān)系到國(guó)計(jì)民生的
一些最基本的信息才采取普查的方式。而在實(shí)際工作中,我
們用的更多的是另外一種調(diào)查方式抽樣調(diào)查。所謂抽樣調(diào)
查,是指按照隨機(jī)原則從調(diào)查總體中抽取一部分單位作為樣
本進(jìn)行調(diào)查,只要樣本抽取的有代表性,就可以通過(guò)很小的
樣本對(duì)總體,也就是我們所要研究的全部事物,做出一個(gè)科
學(xué)的推斷。那么,什么叫隨機(jī)原則?簡(jiǎn)單地說(shuō)就是總體中的
每個(gè)單位都有同樣被抽中的機(jī)會(huì)。只要能做到這點(diǎn),調(diào)查就
有代表性。即使樣本很小,都可以做得相當(dāng)準(zhǔn)確,抽樣調(diào)查
如果做好了,應(yīng)該是一種高效率的調(diào)查方式,它在科學(xué)研究
和日常管理中用得最多,具有經(jīng)濟(jì)實(shí)效性強(qiáng)、準(zhǔn)確程度高的
特點(diǎn)。
前面介紹了普查和抽樣調(diào)查兩種主要調(diào)查方式,那么每
種調(diào)查方式都涉及到一個(gè)采用什么方法獲取數(shù)據(jù)的問(wèn)題。我
們可以有各種各樣的收集數(shù)據(jù)的方法,譬如訪問(wèn)方式,就是
通過(guò)調(diào)查者和被訪問(wèn)者面對(duì)面的交談獲得數(shù)據(jù).在早期調(diào)查
中用的比較多,現(xiàn)在主霎應(yīng)用于一些深層次問(wèn)題的調(diào)查,不
再作為一種普遍性的調(diào)查方式被調(diào)查業(yè)所實(shí)施.取而代之的
是郵寄問(wèn)卷調(diào)查。即設(shè)計(jì)一個(gè)調(diào)查問(wèn)卷.然后通過(guò)郵寄的方
式送到被調(diào)查者手中,由他們來(lái)填寫(xiě)。這種調(diào)查方式在一些
發(fā)達(dá)國(guó)家持續(xù)了50年左右,即從上個(gè)世紀(jì)的30年代到80
年代。郵寄問(wèn)卷調(diào)查目前在我國(guó)仍是一種主要的調(diào)查方式.
之所以在國(guó)外不大被采用,主要由于以下原因:第一,回收
率越來(lái)越低,通常情況下不超過(guò)20%,甚至低于10骯第二,
回答的數(shù)據(jù)和沒(méi)有回答的數(shù)據(jù)之同具有顯著差異,因此僅僅
根據(jù)回答的數(shù)據(jù)做推斷,不具有代表性。例如:1995年美國(guó)
ABC廣播公司曾經(jīng)在一個(gè)晚間節(jié)目中做調(diào)查,問(wèn)美國(guó)的電視
觀眾:”聯(lián)合國(guó)總部應(yīng)不應(yīng)該繼續(xù)留在紐約?”調(diào)查對(duì)象是
電視觀眾,完全是自愿回答,電話反饋,回答結(jié)果是2/3的
電視觀眾認(rèn)為聯(lián)合國(guó)不應(yīng)該繼續(xù)留在美國(guó),即聯(lián)合國(guó)可以撤
到別的地方去。因此可以得到這樣的結(jié)論;“美國(guó)多數(shù)人不
歡迎聯(lián)合國(guó)留在美國(guó)而在同一年,某調(diào)查公司就此問(wèn)題
做旗機(jī)調(diào)查,結(jié)果剛好相反,大約70%的美國(guó)人認(rèn)為聯(lián)合國(guó)
留在美國(guó)理所當(dāng)然,只有不到30%的人反對(duì)。大家注意,這
兩個(gè)調(diào)查結(jié)果完全相反,哪一個(gè)更準(zhǔn)確呢?顯然是隨機(jī)調(diào)查
更準(zhǔn),原因在于大多數(shù)美國(guó)人認(rèn)為這個(gè)問(wèn)題用不著討論,美
國(guó)在全世界經(jīng)濟(jì)最強(qiáng)大、最富有.而且是世界老大.聯(lián)合國(guó)
不設(shè)在美國(guó)難道還應(yīng)該在別的地方嗎?所以這部分人在收
看電視后根本就不作回答.認(rèn)為這個(gè)問(wèn)題根本就不值得回
答,而愿意回答的人往往是帶有比較強(qiáng)的情緒,即聯(lián)合國(guó)設(shè)
在美國(guó),美國(guó)要付比較高的聯(lián)合國(guó)會(huì)費(fèi)。這個(gè)案例告訴我們
當(dāng)采取自愿回答的調(diào)查方式時(shí),在搜集數(shù)據(jù)、分析數(shù)據(jù)的時(shí)
候要特別小心,由于郵寄問(wèn)卷調(diào)查采取自愿回答的方式,故
有比較強(qiáng)的局限性,目前在國(guó)外已經(jīng)被電話調(diào)查所取代。第
三就是電話調(diào)查方式。由于現(xiàn)在已經(jīng)進(jìn)入到了高度的信息社
會(huì),電話的普及率相當(dāng)高,特別是在城市,因而電話調(diào)查已
經(jīng)取代郵寄問(wèn)卷調(diào)查,成為獲得數(shù)據(jù)最主要的方法。電話調(diào)
查比較簡(jiǎn)潔,效率較高,成本較低,但是在我國(guó)的實(shí)施過(guò)程
中碰到了很多困難.主要是我們的調(diào)查業(yè)立法、規(guī)章制度不
健全。很多各種各樣的調(diào)查公司并沒(méi)有經(jīng)過(guò)批準(zhǔn),即相當(dāng)多
的調(diào)查是不合法的,因而擾亂了調(diào)查市場(chǎng)。我們經(jīng)常接到手
機(jī)、固定電話的調(diào)查,超過(guò)90%的人接到電話后還沒(méi)有聽(tīng)清
楚要調(diào)查什么,就立刻拒絕了,所以電話調(diào)查在我國(guó)的實(shí)施
過(guò)程中有很大困難,但是專門的調(diào)查公司有專門的技術(shù)來(lái)解
決這些問(wèn)題??傊?,電話調(diào)查是目前調(diào)查業(yè)獲得信息的非常
重要的方法。網(wǎng)絡(luò)調(diào)查也是一種獲得數(shù)據(jù)的方式,我們隨便
打開(kāi)一些網(wǎng)頁(yè),在首頁(yè)上經(jīng)常可以看到各種各樣的調(diào)查,但
是我們要注意,這種調(diào)查有很強(qiáng)的局限性。被調(diào)查總體實(shí)際
上是經(jīng)常上網(wǎng)、且愿意在河上回答問(wèn)題的人群,他們并不代
表大多數(shù),甚至不能代表所有網(wǎng)民,因此在使用調(diào)查結(jié)果時(shí)
一定要特別注意0我們也經(jīng)常看到很多調(diào)查公司用網(wǎng)絡(luò)調(diào)查
來(lái)發(fā)布調(diào)查信息,譬如說(shuō)青年知識(shí)分子中70—80%的人都過(guò)
勞,甚至知識(shí)分子的過(guò)勞死、平均壽命比著逋老百姓要低等
等,實(shí)際上我們箱作分析,就會(huì)對(duì)這樣的網(wǎng)絡(luò)調(diào)查結(jié)果非常
慎重,因?yàn)楣嫉臄?shù)據(jù)不是全部總體的代表性數(shù)值,而僅僅
是愿意回答的數(shù)據(jù)。例如:最近新浪網(wǎng)做了一個(gè)調(diào)查:“你
在工作中是不是經(jīng)常加班加點(diǎn)?”他得出的信息是80%的人
都加班加點(diǎn)。大家想一想,一般人對(duì)這樣的問(wèn)題可能不屑一
顧,只有那些對(duì)加班加點(diǎn)有意見(jiàn)或者對(duì)這個(gè)問(wèn)題有比較強(qiáng)烈
反映的人才愿意回答。所以回答的結(jié)果說(shuō)現(xiàn)在的勞動(dòng)者中間
有80%的人都加班,甚至都極度疲勞,不一定有代表性,所
以我們要特別注意這樣的一個(gè)問(wèn)題,即樣本對(duì)總體有沒(méi)有代
表性。另外,座談會(huì)也是獲得數(shù)據(jù)的一個(gè)重要方式,特別是
一些專業(yè)調(diào)查公司做某些深度訪問(wèn)的時(shí)候應(yīng)用較多,這種方
法有專門的設(shè)計(jì),通常以6—10人為宜。還有個(gè)別的深度訪
問(wèn),如對(duì)那些特殊問(wèn)題、敏感問(wèn)題,不宜于以座談會(huì)形式獲
取信息的,可以此做為一種特殊的獲得數(shù)據(jù)的方式,但是這
種方式也有一定的局限性,它主要應(yīng)用于定性分析,而比較
難做定量推斷。這里我們還特別要介紹另外一種獲得數(shù)據(jù)的
方法一觀察法,這個(gè)方法和前面所講的不同之處在于調(diào)查者
和被調(diào)查者不直接接觸,調(diào)查者站在一個(gè)客觀中立的立場(chǎng)上
對(duì)所要進(jìn)行調(diào)查的事物或一些調(diào)查對(duì)象進(jìn)行客觀的記錄和
描述。我個(gè)人認(rèn)為這種方法在獲得數(shù)據(jù)的方式中應(yīng)該有更廣
泛的用途。
那么,什么是觀察法的應(yīng)用呢?以交通流量統(tǒng)計(jì)為例.
現(xiàn)在很多大城市,特別是北京,市政府和管理部門正在下大
的力氣解決交通擁堵問(wèn)題,在一些重要的十字路口或道路上
做一些改善,比如增加公共交通、開(kāi)辟公共專用珞線等,其
中路口的管理還有很大的余地,這就可以利用到統(tǒng)討觀察
法。例如,長(zhǎng)安街的某一個(gè)路口,東西向和南北向紅綠燈間
隔時(shí)間的長(zhǎng)短,是不是一旦設(shè)定了就不能更改?比如主干道
綠燈一分半鐘,非主干道車流量少一點(diǎn),綠燈的能行時(shí)間就
可以控制在40-45秒鐘。是不是在一定的時(shí)間段里,東西
向的車流量較大,而另外一個(gè)時(shí)間段里南北向的車流量又更
多一些?要想做到以人為本的管理設(shè)計(jì),就需要掌握一個(gè)路
口一天24小時(shí)、一周不同的時(shí)間段(比如平時(shí)和周末)的
交通流量變化,就需要用觀察的方法來(lái)搜集路口車流量通過(guò)
的數(shù)據(jù)。掌握了比較科學(xué)準(zhǔn)確的數(shù)據(jù),就可以做非常好的管
理.我舉一個(gè)國(guó)外交通管理的例子,美國(guó)紐約是一個(gè)島,在
曼哈頓地區(qū)有很多大公司,白天會(huì)有幾百萬(wàn)的人從長(zhǎng)島、新
澤西涌入曼哈頓,而在晚上又要返回他們?cè)诮紖^(qū)的住所。曼
哈頓島跟兩邊的聯(lián)系主要靠幾個(gè)鐵橋和隧道,它的管理非常
人性化。鐵橋是30年代建的,上下兩層,每層有8個(gè)車道,
上層是進(jìn)城.下層是出城,它根據(jù)每天車流量的大小來(lái)控制
道路通行的方向,早上可能有12條車道都是進(jìn)城,因?yàn)樯?/p>
午進(jìn)城的人多:下午4一5點(diǎn)出城的人開(kāi)始增多,可能會(huì)有
13條車道出城。靠什么來(lái)管理?就靠紅綠燈,非常人性化。
我們經(jīng)??吹剿牡缆钒凑樟髁康拇笮?lái)分配路權(quán)。因此,
利用觀察法掌握不同時(shí)間、不同方向車流量的數(shù)據(jù)時(shí)于透行
科學(xué)、高效地管理非常重要。我在日本訪問(wèn)的時(shí)候,就發(fā)現(xiàn)
日本地鐵的效率非常高,它保證所有的乘客在任何一個(gè)車站
的等候時(shí)間不超過(guò)3-4分鐘,怎么能夠做到這點(diǎn)呢?原因
在于它對(duì)流量的數(shù)據(jù)掌握得非常細(xì)致。經(jīng)常看到一些大學(xué)生
或志愿者拿著記數(shù)器,在地鐵上、下入口統(tǒng)計(jì)人流量,再按
照這個(gè)流量的分布來(lái)安排地鐵車量,人流量最密的時(shí)候每隔
2分鐘就有一輛地鐵通過(guò),平時(shí)的6節(jié)車.廂也會(huì)加到10節(jié),
在最短的時(shí)間內(nèi)將乘客送走。這就是觀察法的應(yīng)用。另外,
還有觀察實(shí)驗(yàn)法,是通過(guò)做一些特殊的實(shí)臉獲取數(shù)據(jù).在自
然科學(xué)中應(yīng)用較多。剛才談到的調(diào)查方法都是直接獲得數(shù)據(jù)
的方式。在現(xiàn)代社會(huì)還有更多地獲得數(shù)據(jù)的渠道,我們把通
過(guò)網(wǎng)絡(luò)、出版物等得到的數(shù)據(jù)稱為間接的數(shù)據(jù)來(lái)源?,F(xiàn)在網(wǎng)
絡(luò)非常方便,在國(guó)家統(tǒng)計(jì)局、北京市統(tǒng)討局和各個(gè)地方統(tǒng)計(jì)
部門的網(wǎng)站都可以獲得當(dāng)?shù)卣墓_(kāi)數(shù)據(jù),也可以通過(guò)這
些網(wǎng)站鏈接到世界各國(guó)的政府、大的國(guó)際組織、甚至大的公
司的網(wǎng)站獲得數(shù)據(jù)。
有了數(shù)據(jù),下面就簡(jiǎn)單紿大家介紹一下,怎么樣對(duì)這些
數(shù)據(jù)做一些簡(jiǎn)單的整理和描述。例如:這里有某車間50名
工人日加工零件的50個(gè)數(shù)據(jù)(見(jiàn)PPT例24),原始數(shù)據(jù)很零
亂,看不出任何規(guī)律。最基本、最簡(jiǎn)單的整理是對(duì)這50個(gè)
數(shù)據(jù)進(jìn)行分組,我們看到所有數(shù)據(jù)的最小值為105件.最大
值為140件,把所有加工零件分成7個(gè)組,每5件作為一組
的組距,形成組距數(shù)列(見(jiàn)PPT表2-1):中間這一列就是在
每一組里有多少小工人,稱為頻數(shù),即次數(shù),所有的頻數(shù)之
和為50,即指一共有50個(gè)工人;最右的一列,是計(jì)算每組
工人的百分比,即6樂(lè)10%等。頻數(shù)經(jīng)過(guò)分組后對(duì)我們了解
數(shù)據(jù)有什么作用呢?為了觀察更直觀,我們可以把須數(shù)做成
直方圖(見(jiàn)PPT圖2-1)。直方圖是分析數(shù)據(jù)、發(fā)現(xiàn)數(shù)據(jù)規(guī)律
非常有效的方式。在橫軸上按105、110、115、120、125、
130.135,140等距離的進(jìn)行標(biāo)記,然后把每一個(gè)組里的次
數(shù)或是頻數(shù)的多少作為縱軸或者說(shuō)Y軸的標(biāo)記,就得到一個(gè)
直方圖。根據(jù)直方圖就可以進(jìn)一步對(duì)數(shù)據(jù)做出分析或判斷:
這50個(gè)工人加工零件數(shù)類似于一個(gè)對(duì)稱的分布,即兩頭小
中間大的分布。換句話說(shuō),就是50個(gè)工人中加工零件數(shù)在
120-125這個(gè)區(qū)間的人數(shù)是最多的,這就是加工零件最適
中、最中間的數(shù)值;而加工最多的、效率很高的130—140
這一組的人數(shù)并不多;加工數(shù)量比較少的105—110件的人
數(shù)也比較少,兩頭小中間大,這就稱作對(duì)稱分布,統(tǒng)計(jì)專業(yè)
術(shù)語(yǔ)稱之為類似于正態(tài)分布。如果一個(gè)數(shù)列是這樣分布的,
我們就可以做出進(jìn)一步的判斷,即50個(gè)工人平均加工件數(shù)
在120-125這個(gè)區(qū)間。如果不是對(duì)稱分布,我們就很難做
出這樣的判斷,這就是直方圖的作用。如果我們把直方圖的
每一個(gè)柱形的上端中點(diǎn)相連接,就變成折線圖(PPT圖2-2).
同時(shí)我假定直方圖下面的面積之和為1.我的問(wèn)題是:直方
圖下邊的面枳和折線圖下邊的面枳是不是相等?答案是相
等。因?yàn)槲覀冞B接的是兩個(gè)柱形的中點(diǎn),在折線圖外邊的那
個(gè)三角形和里邊的三角形的面積剛好是一樣。利用這個(gè)性
質(zhì),在以后學(xué)習(xí)概率論時(shí),就可以用曲線以下面積的一部分
計(jì)算每一個(gè)區(qū)間發(fā)生的概率。這里,還要紿大家介紹一種利
用計(jì)算機(jī)畫(huà)出來(lái)的圖一箱線圖(見(jiàn)PPT圖2-3),它是由一個(gè)
盒子和兩條線段組成的圖。作箱線圖最重要的是找出一殂數(shù)
據(jù)的五個(gè)代表性的數(shù)值,這個(gè)圖就畫(huà)出來(lái)了。這五個(gè)數(shù)值就
是一組數(shù)據(jù)的最大值、最小值、中間值和兩個(gè)四分位數(shù)。中
間值就是統(tǒng)計(jì)中的中位數(shù),即把數(shù)據(jù)從大到小排列,形成一
個(gè)數(shù)列,如果是單數(shù)項(xiàng)就是中間的那個(gè)數(shù);如果是偶數(shù)項(xiàng)就
是中間兩個(gè)數(shù)值的平均數(shù)。兩個(gè)四分位數(shù)是指中間值和最大
值之間的中間值(上四分位數(shù)),以及中間值和最小值之間
的中間值(下四分位數(shù))。中間值和兩個(gè)四分位值把數(shù)據(jù)的
個(gè)數(shù)四等分。有了這五個(gè)數(shù)值,就很容易將一組數(shù)據(jù)的分布
特征和特點(diǎn)用箱線圖表現(xiàn)出來(lái)。大家可以看到,這就是前面
舉例中的50個(gè)工人加工零件的箱戰(zhàn)圖(見(jiàn)PPT圖2-4),最大
139件,最小107件,中間值123件,在123—139之間的中
間值是128,即上四分位數(shù)。】07—123之間的中位數(shù)稱為下
四分位數(shù),是117.75,117.75—123之間所包含的數(shù)據(jù)是50
個(gè)數(shù)據(jù)中的1/4,即12-13個(gè)數(shù)據(jù),107-117.75之間有1/4
的數(shù)據(jù)。箱線圖的兩條線段和盒子的兩半分別表示四個(gè)區(qū)
間,50個(gè)數(shù)據(jù)落在每一個(gè)區(qū)間里的個(gè)數(shù)是相等的。熟練的
人一看這個(gè)圖.就應(yīng)該反映出背后的分布是正態(tài)分布.還是
偏態(tài)分布?我們也請(qǐng)大家來(lái)考慮一下不同的箱線圖背后的
分布態(tài)勢(shì)是什么樣?算是一個(gè)思考題.那么.箱線困有什么
用呢?我們學(xué)習(xí)的目的是為了理解、分析圖形背后的含義。
舉個(gè)例子:從某大學(xué)經(jīng)濟(jì)管理專業(yè)二年級(jí)學(xué)生中隨機(jī)抽取11
人,分別記錄下每一名同學(xué)8門主要課程的考試成績(jī),就形
成了演示文稿中的列聯(lián)表或者數(shù)據(jù)表(見(jiàn)PPT例22,表22).
我們給11個(gè)同學(xué)每人一個(gè)編號(hào),同時(shí)列出每個(gè)同學(xué)8門課
程的考試成績(jī),然后利用箱線圖對(duì)這11個(gè)同學(xué)及8門課程
做一個(gè)分析。首先,用Statistic軟件時(shí)8門課程繪出軸線圖
(見(jiàn)PPT圖2-5).橫軸列出每門課程的名稱;縱軸列出考試
成績(jī),從45分到]00分。大家看到這8個(gè)箱線圖的形狀是
不一樣的,每一個(gè)箱線圖的最高位置就表示這門課程的最高
分,最下沿就表示這門課程的最低分。箱線圖上邊、下邊的
兩條線段和箱線困中間的盒子的兩個(gè)部分分別代表了四個(gè)
區(qū)域,每一區(qū)域里大概有三個(gè)學(xué)生的成績(jī)(如果正好是12
個(gè)同學(xué)的話,就表示每一個(gè)區(qū)間里有3個(gè)同學(xué)的成績(jī)八現(xiàn)
在請(qǐng)大家考慮,這8門課程,哪門課程對(duì)同學(xué)們來(lái)說(shuō)最容易?
即同學(xué)們考試的分?jǐn)?shù)都比較高:哪門課程相對(duì)最難?有人
說(shuō),西方經(jīng)濟(jì)學(xué)和英語(yǔ)最容易。好,我們對(duì)這兩門課程做一
個(gè)比較。英語(yǔ)的最高分比西方經(jīng)濟(jì)學(xué)高,而且是所有8門課
程里最高的.英語(yǔ)的最低分也是8門課程最低分里最高的,
英語(yǔ)的平均分?jǐn)?shù),即余子中間的中位數(shù)的成績(jī)也是8門課程
中最高的。在盒子的上沿.四分位數(shù)也是8個(gè)盒子上沿最高
的,唯一一點(diǎn)是英語(yǔ)盒子的下沿比西方經(jīng)濟(jì)學(xué)略低一點(diǎn)點(diǎn).
所以,從總體上看,英語(yǔ)是最容易的.如果計(jì)算平均分,英
語(yǔ)的平均分一定是最高的。那么,哪門課程相對(duì)比較難呢?
一個(gè)是統(tǒng)計(jì)學(xué),另一個(gè)是經(jīng)濟(jì)數(shù)學(xué)。比較一下,從所有成績(jī)
的最低分來(lái)看,經(jīng)濟(jì)數(shù)學(xué)是最低的,但是經(jīng)濟(jì)數(shù)學(xué)的最高分
也是所有成績(jī)里面相當(dāng)高的(僅次于英語(yǔ)),再看它們金子
中間類似于平均成績(jī)的中位數(shù),會(huì)發(fā)現(xiàn)統(tǒng)計(jì)學(xué)的中位數(shù)成續(xù)
偏低,所以,由此得出統(tǒng)計(jì)學(xué)更難一點(diǎn)。另外,我們?cè)谂袛?/p>
一門課程出題好與不好,按照教育統(tǒng)計(jì)或者說(shuō)考試學(xué)的要
求,這門課程的成績(jī)一定要服從正態(tài)分布。我們看基礎(chǔ)會(huì)計(jì)
就明顯不是正態(tài)分布,其中比較接近正態(tài)分布的是經(jīng)濟(jì)數(shù)學(xué)
和財(cái)務(wù)。但是這個(gè)例題數(shù)據(jù)量還是少了一些,只有11個(gè).
大家還可以進(jìn)一步分析這8門課程箱繪圖的其它特點(diǎn)。我們
可以用同樣的軟件對(duì)11個(gè)同學(xué)8門課程的成績(jī)做出11個(gè)箱
線圖(見(jiàn)PPT圖2-6),它們的形狀差別就很大了,有的比較
短,也有的很長(zhǎng)e按照現(xiàn)在的高考標(biāo)準(zhǔn),總分最高就能上好
一些的學(xué)校,請(qǐng)大家考慮,幾號(hào)同學(xué)最有可能上好學(xué)校?答
案是2號(hào)同學(xué)。因?yàn)樗南渚€圖位置很高,而且最高分和最
低分的距離很短,說(shuō)明他不偏科,各科成績(jī)都很好.而且分
數(shù)比較集中。再看3號(hào)同學(xué),最高分和最低分都是他,他的
箱線圖距離很長(zhǎng).這樣的同學(xué)可能在某一科目上表現(xiàn)出優(yōu)
勢(shì),而其它學(xué)科成績(jī)就比較低.高考按總分錄取,3號(hào)同學(xué)
就不大容易考上很好的學(xué)校,但是他很可能在某一學(xué)科上有
潛質(zhì),我們的教育應(yīng)該給3號(hào)同學(xué)提供更多的發(fā)展空阿。
關(guān)于對(duì)數(shù)據(jù)進(jìn)行整理,還可以再看一些例子。這里搜集
整理了我國(guó)1995-2005年城值居民和農(nóng)村居民人均收入的
數(shù)據(jù)(見(jiàn)PPT例2,3.表2-3,摘自國(guó)家統(tǒng)計(jì)局的統(tǒng)計(jì)年鑒)。
如果僅是把數(shù)據(jù)列在這兒,不太容易看出它們的發(fā)展變化規(guī)
律。現(xiàn)在,我們用EXCEL畫(huà)圖功能把這些數(shù)據(jù)表現(xiàn)出來(lái),
就會(huì)看到變化。黃色代表農(nóng)村居民家庭的人均收入,粉色代
表城鎮(zhèn)居民家庭的人均收入。我們看到1995—2005年11年
間,城鄉(xiāng)居民的收入差距越來(lái)越大,它有一點(diǎn)像張開(kāi)的剪刀
的口子。由此可以更直觀地看到我們國(guó)家過(guò)去十幾年間城鄉(xiāng)
居民家庭收入差距的變化,盡管農(nóng)村居民家庭收入也在增
加,但是和城鎮(zhèn)居民家庭收入的增長(zhǎng)速度比較,還是太慢了.
所以,可據(jù)此判斷城鄉(xiāng)之間的差距不是減少了,而是擴(kuò)大了。
再看另外一組數(shù)據(jù),1978年—2005年我國(guó)城鄉(xiāng)居民的恩
格爾系數(shù)(見(jiàn)PPT表2-4)。什么是恩格爾系數(shù)?就是一個(gè)家
庭中用于吃的支出占總支出的百分比.我們看到,1978年改
革開(kāi)放之初,農(nóng)村居民家庭的恩格爾系數(shù)是67.7%,即收入
的2/3還多一點(diǎn)都用來(lái)吃了,城鄉(xiāng)居民家庭的恩格爾系數(shù)是
57.5%,接近60%。到2005年,恩格爾系數(shù)都下降了20%以
上,農(nóng)村居民家庭由67.7$降到了45%.城鎮(zhèn)降到了36.7%,
這反映出隨著收入的增加、生活水平的提高,消費(fèi)結(jié)構(gòu)發(fā)生
了變化。經(jīng)濟(jì)越發(fā)達(dá),恩格爾系數(shù)就越低,發(fā)達(dá)國(guó)家的恩格
爾系數(shù)在10%左右.吃已經(jīng)不是整個(gè)支出的主要部分了。我
們國(guó)家還處在發(fā)展中國(guó)家階段,恩格爾系數(shù)還會(huì)不斷地、持
續(xù)地下降。如果我們把上面的兩列數(shù)據(jù)周折線,圖來(lái)描述,就
可以看到從改革開(kāi)放之初的1978年到2005年,前后大概都
相差20個(gè)百分點(diǎn),但是中間的變化,特別是農(nóng)村居民家庭,
在80年代中期的時(shí)候,恩格爾系數(shù)降低的速度特別快,有
一段時(shí)間城市和農(nóng)村的恩格爾系數(shù)已經(jīng)非常接近了,但后來(lái)
差距又?jǐn)U大了,這描述了我國(guó)自80年代改革開(kāi)放以來(lái)的一
段歷史。改革是從農(nóng)村開(kāi)始的,在80年代初期和中期,農(nóng)
民的受益是比較明顯的,但是到了80年代末特別是90年代
初期.改革的重點(diǎn)推向了城市,城市受益更多,而農(nóng)民建到
的改革的益處相對(duì)少了。
我們還可以用統(tǒng)計(jì)數(shù)據(jù)面很多很多圖,時(shí)間的關(guān)系,只
列出來(lái)了兩、三個(gè),讓大家理解,統(tǒng)計(jì)圖如果做得好的話,
是非常有效的。
下面談?wù)劷y(tǒng)計(jì)表。
統(tǒng)計(jì)表是表現(xiàn)統(tǒng)計(jì)資料的最有效的形式,也是政府工作、
管理工作最基本的工具.好的統(tǒng)計(jì)表應(yīng)該是簡(jiǎn)單、直觀、一
目了然,可在短附間內(nèi)給人以明碓的疑念。但是我們生活中
經(jīng)常看到的報(bào)紙、雜志上的很多統(tǒng)計(jì)表都很不規(guī)范,所以,
我們介紹一下統(tǒng)計(jì)表最基本的要素,強(qiáng)調(diào)政府機(jī)關(guān)、工作部
門都應(yīng)該作規(guī)范的統(tǒng)計(jì)表。一張規(guī)范的統(tǒng)計(jì)表首先要有表
頭,表頭一般應(yīng)包括表號(hào)、表的標(biāo)題和表中數(shù)據(jù)的單位等內(nèi)
容。表號(hào)如2—14.表明是第二章或第二部門的第14個(gè)表;
標(biāo)題內(nèi)容應(yīng)表明統(tǒng)計(jì)數(shù)據(jù)的時(shí)間(When),地點(diǎn)(Where)
及數(shù)據(jù)內(nèi)容(What),即滿足3年的要求:如果表中的數(shù)據(jù)是
同一個(gè)計(jì)量單位,可在表的右上角標(biāo)明,若不同,可單列出
一列標(biāo)明。再看這張表,是1997-1998年城鎮(zhèn)居民家庭抽
樣調(diào)查資料(見(jiàn)PPT表2-5,摘自1999年中國(guó)統(tǒng)計(jì)摘要),
時(shí)間有了,地點(diǎn)是我國(guó)城鎮(zhèn)居民家庭,內(nèi)容是家庭抽樣調(diào)查
資料。第二,表中要有橫(行標(biāo)題)的或豎(列標(biāo)題)的標(biāo)
題。上表中的列標(biāo)題是時(shí)間、項(xiàng)目等,行標(biāo)題包括調(diào)查戶數(shù)、
每戶人口數(shù)等,后邊藍(lán)色的部分是表的主要數(shù)據(jù)內(nèi)容。第三,
表的下方要加上注釋,稱為附加,標(biāo)明咨料來(lái)源,或者是自
己調(diào)查的,或者是引自年鑒、報(bào)刊,方便讀者查閱使用。我
們還要特別強(qiáng)調(diào)編制統(tǒng)計(jì)表時(shí)應(yīng)注意的幾點(diǎn)規(guī)則:一是統(tǒng)計(jì)
表的左右兩邊不封口,通常只是上下兩條粗橫線,中間的其
它線要用細(xì)線,而且橫、豎線越少越好;二是統(tǒng)計(jì)表中左上
角的單元格不能有斜線,真正規(guī)范的統(tǒng)計(jì)表中從不出現(xiàn)斜
線,大家可以從聯(lián)合國(guó)或世界各國(guó)的年鑒、網(wǎng)上看一看統(tǒng)計(jì)
部門做出的規(guī)范的統(tǒng)計(jì)表。三是表中的數(shù)據(jù)一定要對(duì)齊,一
般是右對(duì)齊:沒(méi)有數(shù)字的表格,一般用“一”表示,一張?zhí)?/p>
好的統(tǒng)計(jì)表不應(yīng)該出現(xiàn)空白單元格??傊y(tǒng)計(jì)表的設(shè)計(jì)應(yīng)
符合科學(xué),實(shí)用、簡(jiǎn)襪、美觀的要求。
下面我舉幾個(gè)不太規(guī)范的、錯(cuò)誤的例子,讓大家進(jìn)一步
明確如何正確的使用統(tǒng)計(jì)表。首先,請(qǐng)大家看圖左邊的這部
分(見(jiàn)PPT第二章31頁(yè))。這是一個(gè)柱形圖,想反映某高校
大學(xué)四個(gè)年級(jí)考試成績(jī)得A的人數(shù),大一、大二、大三、大
四的英文縮寫(xiě)分別為FR,SO.JR.SR.柱形圖給我們的感覺(jué)
好像是大一得A的人最多,大二得A的人最少,如果要相信
這個(gè)數(shù)據(jù),可能得到這樣的結(jié)論,即這個(gè)學(xué)校里大一的同學(xué)
素質(zhì)比較高.大二相對(duì)來(lái)說(shuō)弱一點(diǎn)。左邊是用絕對(duì)數(shù)來(lái)做的
圖,即用人數(shù)的多少。但有時(shí)用絕對(duì)數(shù)來(lái)表示可能會(huì)產(chǎn)生誤
導(dǎo),如果我們把四個(gè)年級(jí)得A的人數(shù)除以全部學(xué)生數(shù),就得
到了右邊的困,各年級(jí)得A的百分比,都是25凱結(jié)論是四
個(gè)年級(jí)學(xué)生之間的成績(jī)沒(méi)有什么差異。如果用絕對(duì)數(shù)(左邊
的圖)就有可能得到有差異的信息。所以,比較上述兩種分
析,應(yīng)該選擇用相對(duì)數(shù)做分析。
第二個(gè)例子是一個(gè)季節(jié)銷售蹶的數(shù)據(jù)(見(jiàn)PPT第二章32
頁(yè))。橫軸是一季度、二季度、三季度、四季度;縱軸是以
100為一個(gè)單位,可能是萬(wàn)元,也可能是1。萬(wàn)元。左圖紿我
們的感覺(jué)是四個(gè)季度的銷售額差別不大;同樣的數(shù)據(jù)用右圖
表示,也是四個(gè)季度的銷售額,給我們的直觀感覺(jué)是差別比
較大,即一至三季度銷售額不斷地增長(zhǎng),四季度下降。左右
兩圖的差別在哪兒??jī)H僅在于縱軸的單位標(biāo)準(zhǔn)。左圖是用
100作為一個(gè)單位,右圖是用25作為一個(gè)單位。如果再用
10作為一個(gè)單位,大家設(shè)想會(huì)是什么樣的結(jié)果?差距一定會(huì)
更明顯。因而,我們?cè)谧鰣D的時(shí)候,應(yīng)該選擇適當(dāng)?shù)臉?biāo)準(zhǔn)和
適當(dāng)?shù)膯挝?,否則就有可能會(huì)掩蓋數(shù)據(jù)的差距,甚至是夸大
數(shù)據(jù)的差距。顯然.以此題為例,如果要夸大數(shù)據(jù)的差距,
就把單位設(shè)的很?。喝绻谑緮?shù)據(jù)的差距,就可以把單位
選得很大e而我們的目的是要把數(shù)據(jù)之間的差距客觀公正地
表述出來(lái),因此單位的選擇非常重要。
再看一個(gè)例子,是12個(gè)月份的銷售額資料(見(jiàn)PPT第二
章33頁(yè))。圖中是12個(gè)月的銷售額,分別用英文標(biāo)識(shí)在下
面。左圖給我們的感覺(jué)是月份的銷售額之間變化非常之副
烈,先增加,然后又降下來(lái),六、七月份時(shí)非常低,年底又
非常高。請(qǐng)大家看這個(gè)圖有一個(gè)明顯的錯(cuò)誤,就是縱軸沒(méi)有
從0開(kāi)始,這是我們畫(huà)圖時(shí)最忌諱的,縱軸一定要從0開(kāi)始,
因?yàn)槟鞘潜容^的原點(diǎn),對(duì)照的基準(zhǔn)點(diǎn)。如果從0開(kāi)始把同樣
的數(shù)據(jù)做分析,就可以得到右邊的圖。盡管12個(gè)月份之間
有一些差距,但是差距也不過(guò)是在6-7個(gè)單位之間,和整
體來(lái)比,變化并不顯著。以上的幾個(gè)例子告訴我們,用統(tǒng)計(jì)
圖或統(tǒng)計(jì)表直觀地反映數(shù)據(jù)變化的規(guī)律非常重要,但是如果
我們操作時(shí)不慎重就有可能會(huì)得到一些錯(cuò)誤的結(jié)論。因而,
在此引用美國(guó)著名統(tǒng)計(jì)學(xué)家Mos⑷ler的話:“要用統(tǒng)計(jì)騙人
是很容易的”。以上所舉案例中的統(tǒng)計(jì)圖有的是騙人的,如
果我們沒(méi)有統(tǒng)計(jì)知識(shí),就很容易上當(dāng)受騙。所以,不管是作
為管理者,還是政策執(zhí)行者,我們都應(yīng)該掌握統(tǒng)計(jì)知識(shí),用
好統(tǒng)計(jì)這個(gè)工具。
笫三部分統(tǒng)計(jì)決策
第二部分講的是描述統(tǒng)計(jì),我們非常簡(jiǎn)單地給大家介紹
了一些獲得數(shù)據(jù)的方法,及對(duì)數(shù)據(jù)進(jìn)行簡(jiǎn)單整理的方法,并
利用圖和表把它們表示出來(lái)。第二部分還應(yīng)包括計(jì)算數(shù)據(jù)的
主要的統(tǒng)計(jì)量,如均值和標(biāo)準(zhǔn)差等,由于時(shí)間關(guān)系沒(méi)能展開(kāi)
介紹。描述統(tǒng)計(jì)中搜集、整理數(shù)據(jù)和分析樣本數(shù)據(jù)的目的在
于為決策提供依據(jù),幫助我們進(jìn)行決策。第三部分我們將討
論統(tǒng)計(jì)決策的問(wèn)題。
先看一個(gè)實(shí)例,這是某石油公司的決策。石油勘探是一
個(gè)高風(fēng)險(xiǎn),高回報(bào)的行業(yè),統(tǒng)計(jì)決策的方法在此類行業(yè)中都
有比較寬、比較廣的用處。該石油公司掌握了一份石油開(kāi)采
合同,公司有三種策略可以選擇,第一,可以將合同實(shí)棹:
第二.合同先不賣,觀察一段時(shí)間,比如說(shuō)一年以后再考慮
把它賣掉;第三,現(xiàn)在就可以進(jìn)行采掘。
我們有三種策略的結(jié)果。
第一,現(xiàn)在把合同賣出去,它的市場(chǎng)價(jià)格為125萬(wàn)元。
第二,把合同留下來(lái),一年以后再出售。這就要看一年
以后的油價(jià)是升還是降,如果油價(jià)升,估計(jì)合同能賣到440
萬(wàn);如果油價(jià)降,這個(gè)合同顯然就賣不到現(xiàn)在的125萬(wàn),估
計(jì)只能賣110萬(wàn)。同時(shí)還可以對(duì)一年以后油價(jià)升還是降做出
一個(gè)判斷:油價(jià)升和降的概率分別為10%和90%,認(rèn)為油價(jià)
升的概率小一點(diǎn),油價(jià)降的可能性大一點(diǎn)。這個(gè)例子和現(xiàn)實(shí)
情況剛好相反.如果今天做未來(lái)一年的判斷,相信多數(shù)人會(huì)
判斷一年以后油價(jià)升的可能性大,油價(jià)降的可能性相對(duì)比較
小,因?yàn)樯弦荒陣?guó)際市場(chǎng)原油的價(jià)格波動(dòng)劇烈,一桶原油的
最高價(jià)格接近80美元,最低降到60美元左右,現(xiàn)在大體維
持在這個(gè)水平。
第三,現(xiàn)在采掘。鉆井的費(fèi)用是200萬(wàn)元,打下去可能
發(fā)生的情況在講稿PPT3-2中列出:首先,可能沒(méi)有油,公
司搜集了自己幾十年鉆井的歷史數(shù)據(jù),如果歷史很短,也可
以搜集別的石油公司的數(shù)據(jù),比如說(shuō),一個(gè)石油公司可能打
了幾千口井,大概有一半是沒(méi)有油的,即打下去無(wú)油的可能
性是50%,這個(gè)概率稱為先驗(yàn)概率.通常是歷史的數(shù)據(jù);其次,
開(kāi)采有油的可能性又是多少呢?是40%,即打出一口一般的
油井,也就是比較正常情況下開(kāi)采一口油井的回報(bào)率:另外
還有10%的可能性是打出一口高產(chǎn)油井。注意這里概率為
50%、,10轉(zhuǎn)、10%的前提是這個(gè)石油公司有歷史數(shù)據(jù)。如果沒(méi)
有歷史數(shù)據(jù),可以搜集其他石油公司或已經(jīng)公布的一些數(shù)
據(jù),這是因?yàn)樵谧鰶Q策判斷時(shí)要把風(fēng)險(xiǎn)加以考慮。顯然如果
打的是一口沒(méi)油的井,報(bào)償值即收益為0;如果打出一口一
般的油井,按市場(chǎng)價(jià)值討算其未來(lái)的收益是400萬(wàn)元;如果
打出一口高產(chǎn)的自噴井是最好的,將有1500萬(wàn)元的收益。
這就是擺在我們面前的一個(gè)實(shí)際的統(tǒng)計(jì)決策的例子,我
們應(yīng)該怎么辦?現(xiàn)在把合同賣掉?一年以后賣?或現(xiàn)在采
掘?決策時(shí)首先應(yīng)考慮哪個(gè)策略對(duì)我們來(lái)說(shuō)收益比較大,還
要考慮其他的問(wèn)題。這是我們一會(huì)要進(jìn)一步討論的問(wèn)題,在
此之前,給大家介紹一下決策的三要素。
我們換一個(gè)比較簡(jiǎn)單的例子。來(lái)看講稿PPT3-3的表格,
某木罌廠對(duì)是否生產(chǎn)一種新型組合家具做出決策。影響
溫馨提示
- 1. 本站所有資源如無(wú)特殊說(shuō)明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請(qǐng)下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請(qǐng)聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
- 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁(yè)內(nèi)容里面會(huì)有圖紙預(yù)覽,若沒(méi)有圖紙預(yù)覽就沒(méi)有圖紙。
- 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
- 5. 人人文庫(kù)網(wǎng)僅提供信息存儲(chǔ)空間,僅對(duì)用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對(duì)用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對(duì)任何下載內(nèi)容負(fù)責(zé)。
- 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請(qǐng)與我們聯(lián)系,我們立即糾正。
- 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶因使用這些下載資源對(duì)自己和他人造成任何形式的傷害或損失。
最新文檔
- 《鋼鐵是怎樣煉成的》讀書(shū)心得10篇
- 2025年度航空航天技術(shù)股份合作合同
- 2025年度公園戶外廣告使用權(quán)年度租賃合同
- 2025年度科技項(xiàng)目投資居間合同風(fēng)險(xiǎn)管理與法律保障
- 2025年度海安企業(yè)勞動(dòng)合同員工薪酬福利調(diào)整合同
- 北師大版歷史九年級(jí)下冊(cè)第12課《社會(huì)主義國(guó)家的探索》聽(tīng)課評(píng)課記錄
- 環(huán)境教育與公共意識(shí)提升
- 2025年度智能家居水電改造專業(yè)施工協(xié)議合同范本
- 浙教版數(shù)學(xué)七年級(jí)下冊(cè)《5.5 分式方程》聽(tīng)評(píng)課記錄4
- 2025年度互聯(lián)網(wǎng)大數(shù)據(jù)分析技術(shù)服務(wù)合同
- 醫(yī)院感染及其危害
- 2025年三人合伙投資合作開(kāi)店合同模板(三篇)
- 2025年合資經(jīng)營(yíng)印刷煙包盒行業(yè)深度研究分析報(bào)告
- 天津市五區(qū)縣重點(diǎn)校2024-2025學(xué)年高一上學(xué)期1月期末聯(lián)考試題 化學(xué) 含答案
- 安徽省招生考試數(shù)學(xué)試卷
- 吉林省吉林市普通中學(xué)2024-2025學(xué)年高三上學(xué)期二模試題 生物 含答案
- 2024全國(guó)各省高考詩(shī)歌鑒賞真題及解析
- 高考日語(yǔ)閱讀理解練習(xí)2篇-高考日語(yǔ)復(fù)習(xí)
- 2025年湖南省通信產(chǎn)業(yè)服務(wù)限公司春季校園招聘76人高頻重點(diǎn)提升(共500題)附帶答案詳解
- 《電影之創(chuàng)戰(zhàn)紀(jì)》課件
- 印刷基礎(chǔ)知識(shí)培訓(xùn)資料
評(píng)論
0/150
提交評(píng)論