統(tǒng)計(jì)與決策培訓(xùn)講義_第1頁(yè)
統(tǒng)計(jì)與決策培訓(xùn)講義_第2頁(yè)
統(tǒng)計(jì)與決策培訓(xùn)講義_第3頁(yè)
統(tǒng)計(jì)與決策培訓(xùn)講義_第4頁(yè)
統(tǒng)計(jì)與決策培訓(xùn)講義_第5頁(yè)
已閱讀5頁(yè),還剩62頁(yè)未讀, 繼續(xù)免費(fèi)閱讀

下載本文檔

版權(quán)說(shuō)明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請(qǐng)進(jìn)行舉報(bào)或認(rèn)領(lǐng)

文檔簡(jiǎn)介

統(tǒng)計(jì)在線學(xué)習(xí)課件講義

《統(tǒng)計(jì)與決策》

主講人:袁衛(wèi)

制作單位:北京市統(tǒng)計(jì)局

2007年5月

第一部分緒論

同志們,同學(xué)們,大家好!下面我們一起學(xué)習(xí)統(tǒng)計(jì)與決

策。這一部分共分3個(gè)單元,第一單元介紹統(tǒng)計(jì)的應(yīng)用,我

把它稱為緒論;第二單元介紹描述統(tǒng)討,就是搜集數(shù)據(jù)、整

理數(shù)據(jù)的一些基本知識(shí);第三單元介紹如何應(yīng)用統(tǒng)計(jì)方法來(lái)

幫助我們進(jìn)行管理,進(jìn)行決策。

首先,我們看一下什么是統(tǒng)計(jì)。我們每一個(gè)人在做每一

項(xiàng)工作時(shí)都會(huì)有自己對(duì)統(tǒng)計(jì)的認(rèn)識(shí),比如,我們經(jīng)常在報(bào)刊

上看到類似這樣的消息:”思科公司(Cisco)在納期達(dá)克周

一收盤時(shí)的市值為5550億美元二這條信息就是一個(gè)統(tǒng)計(jì)分

析的結(jié)果,就是經(jīng)濟(jì)管理統(tǒng)計(jì)的一項(xiàng)工作。再比如,“50家

最大公司CEO的年均收入是930萬(wàn)美元”,這是2000年福布

斯報(bào)道的一個(gè)消息,這又是一個(gè)統(tǒng)計(jì),里邊含有一個(gè)概念,

即:什么是“平均收入二它反映了什么樣的問(wèn)題,能夠帶

給讀者什么樣的信息?再看第三個(gè),”股票平均能夠使75%

的投資者盈利”,這樣的一條信息又意味著什么?我們?cè)趪?guó)

內(nèi)的報(bào)刊上也經(jīng)??吹竭@樣一些信息,比如:股票的一個(gè)百

分比。對(duì)于每一位投資者,當(dāng)你進(jìn)行投資選擇的時(shí)候,這小

百分比會(huì)有什么樣的作用呢?

統(tǒng)計(jì),簡(jiǎn)單地說(shuō)就是搜集數(shù)據(jù)、整理數(shù)據(jù)、分析數(shù)據(jù)的

一些簡(jiǎn)單方法。如果用更簡(jiǎn)單的方法給它下個(gè)定義,統(tǒng)計(jì)就

是處理數(shù)據(jù)的一門科學(xué)。更簡(jiǎn)單地說(shuō).統(tǒng)計(jì)學(xué)就是數(shù)據(jù)的科

學(xué)。由于現(xiàn)在任何一項(xiàng)工作在信息時(shí)代都有很多數(shù)據(jù),我們

在日常的工作和生活中都離不開(kāi)數(shù)據(jù),因而.統(tǒng)計(jì)離我們的

生活很近很近。

下面我就分別介紹統(tǒng)計(jì)在經(jīng)濟(jì)管理中的一些主要應(yīng)用,

這里叫做統(tǒng)計(jì)在商務(wù)中的應(yīng)用。

首先我舉一個(gè)財(cái)務(wù)會(huì)計(jì)方面的例子。會(huì)計(jì)師事務(wù)所在對(duì)

某公司進(jìn)行審計(jì)的時(shí)候,并不是要對(duì)它的每一筆流水都進(jìn)行

核實(shí),因?yàn)橥ǔR粋€(gè)規(guī)模較大的公司,一年的經(jīng)濟(jì)往來(lái)會(huì)有

幾萬(wàn)、甚至幾十萬(wàn)筆,如果對(duì)每一筆業(yè)務(wù)都做逐項(xiàng)核對(duì),會(huì)

花費(fèi)大量的時(shí)間,精力、人力、物力。他們所做的工作是選

擇一個(gè)抽樣的方式,從有效的應(yīng)收帳款賬目中抽取一小部分

進(jìn)行核實(shí)。但是,根據(jù)對(duì)這一小部分瞇目核實(shí)的結(jié)果,他們

就能對(duì)這個(gè)公司整體的經(jīng)濟(jì)運(yùn)行狀況做出一個(gè)結(jié)論,即:這

個(gè)公司在財(cái)務(wù)方面是否合法,是否遵守規(guī)章制度,是否有財(cái)

經(jīng)方面的問(wèn)題。因此,從大量的數(shù)據(jù)中抽出一部分作為樣本,

并且通過(guò)對(duì)樣本的分析和計(jì)算,就能夠推斷出總體,正是統(tǒng)

計(jì)的科學(xué)性所在。

其次,看一下統(tǒng)計(jì)在營(yíng)銷方面的應(yīng)用。舉一個(gè)在零售付

款柜臺(tái)上的例子。現(xiàn)在,中國(guó)無(wú)論是大型超市、百貨商場(chǎng),

還是小型零售商店,在收款時(shí)都用掃描儀對(duì)條型碼進(jìn)行掃

指。在掃描的同時(shí).商品的所有信息就進(jìn)入到計(jì)算機(jī)。在很

多大公司,特別是在國(guó)外.人們通常使用信用卡或銀行借記

卡支付,在刷卡的同時(shí),一些個(gè)人信息也就進(jìn)入了數(shù)據(jù)庫(kù)。

這些消費(fèi)者的個(gè)人信息和購(gòu)買商品的信息,無(wú)論是對(duì)生產(chǎn)

商、制造商還是對(duì)零售商,都非常有用。例如,作為國(guó)際知

名的數(shù)據(jù)供應(yīng)商,A.C.Nielson和InformationResources,Inc.

的主要工作就是花錢從零售商店或超市購(gòu)買剛才提到的顧

客購(gòu)買商品時(shí)掃描的基礎(chǔ)信息,進(jìn)行加工后,再賣給制造商

或者零售商。一份關(guān)于啤酒這種商品的數(shù)據(jù),大概可以賣到

30多萬(wàn)美元。由此可見(jiàn),數(shù)據(jù)經(jīng)過(guò)整理,就可以變成一種產(chǎn)

品,一種商品,制造商和零售商購(gòu)買后,就可以為他們的生

產(chǎn)和服務(wù)做決策。例如,大型超市在掌握了這個(gè)信息后,就

能合理地安排超市的進(jìn)貨,甚至貨架的擺放。眾所周知,沃

爾瑪作為世界知名的大型零售商.對(duì)自己客戶的信息做了大

量分析,由專門的分析人員運(yùn)用數(shù)據(jù)挖掘技術(shù),對(duì)所有客戶

信息進(jìn)行分析,如:客戶中有多少客戶購(gòu)買什么樣的商品,

在什么時(shí)間購(gòu)買,在購(gòu)買某一種商品的同時(shí)是否還購(gòu)買其他

商品等。所有這些信息,對(duì)像沃爾瑪這樣的零售商非常有用,

通過(guò)對(duì)大量數(shù)據(jù)進(jìn)行分析,我們會(huì)發(fā)現(xiàn)經(jīng)常買啤酒的顧客會(huì)

買一些熟食作為下酒食品,假定通過(guò)分析發(fā)現(xiàn)這兩種商品具

有非常緊密的聯(lián)系,零售商沃爾瑪就會(huì)考慮兩種設(shè)計(jì):一種

設(shè)計(jì)是將啤酒專柜與熟食專柜放得非常近,好處是當(dāng)顧客往

購(gòu)物車上裝入一箱啤酒后,可以到不遠(yuǎn)的地方很方便地購(gòu)買

一些熟食:另一種設(shè)計(jì)是將這兩種商品放得遠(yuǎn)一點(diǎn).中間擺

放一些商品貨架,顧客在買完啤酒再去購(gòu)買熟食時(shí),會(huì)路過(guò)

這些貨架,在四處觀看的過(guò)程中.也許會(huì)發(fā)現(xiàn)他原本沒(méi)有準(zhǔn)

備購(gòu)買的東西,這樣就增加了顧客購(gòu)買商品的機(jī)會(huì)。所以,

現(xiàn)在很多大公司都對(duì)這樣一些信息非常重視,會(huì)考慮什么樣

的客戶會(huì)在什么時(shí)間購(gòu)買什么樣的商品,購(gòu)買某種商品的客

戶群是什么等,并利用這樣一些信息來(lái)做最好的安排,滿足

客戶的需要。這樣的研究,對(duì)提高管理水平非常有效。最近,

我也在網(wǎng)上看到中國(guó)的一些商品信息。目前,中國(guó)的數(shù)據(jù)分

析公司巳經(jīng)對(duì)彩電、洗衣機(jī)、冰箱等家用電器的數(shù)據(jù)做了整

理和分析,包括各個(gè)品牌的市場(chǎng)需求情況等,制造商和零售

商可付費(fèi)購(gòu)買。上述這些對(duì)統(tǒng)計(jì)的應(yīng)用,在營(yíng)銷管理方面有

著非常好的前景。

第三,在金融領(lǐng)域,金融部門也通過(guò)利用統(tǒng)計(jì)信息來(lái)指

導(dǎo)他們的客戶,包括他們自己進(jìn)行投資。例如,如果把個(gè)股

信息和股票市場(chǎng)的均值進(jìn)行比較,可以分析個(gè)股的價(jià)格是否

被高估。如果在Barron報(bào)告中,道瓊斯30種股票的平均市

盈率是24.7,而其中一支股票PhilipMorris的市盈率是9,

假定這個(gè)信息的數(shù)據(jù)是準(zhǔn)確的,投資者就會(huì)通過(guò)把這2個(gè)數(shù)

據(jù)進(jìn)行比較來(lái)做投資決策,因?yàn)榘凑找话愕某WR(shí),購(gòu)買市盈

率低的股票,投資回報(bào)的周期就會(huì)比較短。所以,如果有適

當(dāng)?shù)慕y(tǒng)計(jì)知識(shí),會(huì)應(yīng)用這些統(tǒng)計(jì)知識(shí)。所有公布的信息對(duì)于

消費(fèi)者、投資者和我們的客戶都會(huì)有價(jià)值,它可以幫助我們

選擇,幫助我們做更好的投資。

在現(xiàn)在的保險(xiǎn)領(lǐng)域里,就更離不開(kāi)統(tǒng)計(jì)。在保險(xiǎn)業(yè)里有

一種特殊的職業(yè)——精算師。這一職業(yè)就是專門利用概率和

統(tǒng)計(jì)知識(shí)分析風(fēng)險(xiǎn)、計(jì)算風(fēng)險(xiǎn)、盡量回避或減少在投資和保

險(xiǎn)業(yè)中的風(fēng)險(xiǎn)。這里是2006年我國(guó)保費(fèi)的一些情況。首先,

我們來(lái)看壽險(xiǎn)和健康險(xiǎn)。保險(xiǎn)可以分成壽險(xiǎn)和非壽險(xiǎn)兩類。

在壽險(xiǎn)里,精算師所做的統(tǒng)計(jì)分析有什么用呢?在壽險(xiǎn)中,

所有健康險(xiǎn)、醫(yī)療險(xiǎn)和意外險(xiǎn),最重要的工作是怎樣設(shè)計(jì)保

單、怎樣設(shè)計(jì)保費(fèi)。計(jì)算保費(fèi)的根據(jù)是什么?在壽險(xiǎn)中,最

基本的根據(jù)是生命表。生命表,簡(jiǎn)單地說(shuō)就是不同性別的人,

在0歲到100歲之間每一個(gè)年齡的死亡率。通過(guò)這個(gè)死亡率,

就可以計(jì)算每個(gè)年齡不同性別人群的風(fēng)險(xiǎn),進(jìn)而計(jì)算合理的

保費(fèi)。假如一個(gè)30歲的男性和一個(gè)60歲的男性都想購(gòu)買一

年30萬(wàn)保獻(xiàn)的保險(xiǎn),大家想一想,兩個(gè)人支付的保費(fèi)是不

是應(yīng)該一樣?一定是不一樣的。那么誰(shuí)應(yīng)該多付一些保費(fèi)

呢?是30歲的人還是60歲的人?顯然應(yīng)該是60歲的人。

為什么呢?就是因?yàn)?0歲的死亡率比30歲的死亡率要高一

些,換而言之,就是60歲比30歲的風(fēng)險(xiǎn)要大一些,既然風(fēng)

險(xiǎn)大,他就應(yīng)該多支付保險(xiǎn),因?yàn)樗氲玫酵瑯拥谋kU(xiǎn)補(bǔ)償,

因此,要想科學(xué)地制定人壽保險(xiǎn)的保單和保費(fèi),最基本的就

是要有一個(gè)好的生命表。簡(jiǎn)單地回顧一下我們國(guó)家的人壽保

險(xiǎn)。眾所周知,我國(guó)在解放以后的50年代有保險(xiǎn)業(yè)務(wù),但

到了大躍進(jìn)時(shí)期,似乎一切事務(wù)都要由國(guó)家承擔(dān)風(fēng)險(xiǎn),所以,

中國(guó)人民保險(xiǎn)公司在大躍進(jìn)后就停滯下來(lái)。直到文革結(jié)束以

后,我國(guó)實(shí)施了改革開(kāi)放政策,隨著社會(huì)主義市場(chǎng)經(jīng)濟(jì)的建

立,人們逐漸認(rèn)識(shí)到,我們的國(guó)家、社會(huì)、企業(yè)、家庭,包

括我們個(gè)人.實(shí)際上無(wú)時(shí)無(wú)刻不面臨著風(fēng)險(xiǎn)。國(guó)家有國(guó)家的

風(fēng)險(xiǎn),個(gè)人有個(gè)人的風(fēng)險(xiǎn),家庭有家庭的風(fēng)險(xiǎn),國(guó)家不可能

把所有的風(fēng)險(xiǎn)全部承擔(dān)下來(lái)。因此,到了1982年,我國(guó)的

保險(xiǎn)業(yè)開(kāi)始恢復(fù)。恢復(fù)人壽保險(xiǎn)的第一件事情就是制定保

費(fèi),但由于保瞼業(yè)已經(jīng)停滯了20年,我國(guó)實(shí)際上已沒(méi)有自

己的生命表。為了計(jì)算保費(fèi),我們借用了臺(tái)灣地區(qū)和其他國(guó)

家的生命表。我國(guó)是一個(gè)擁有十幾億人口的大國(guó),國(guó)土面積

達(dá)960萬(wàn)平方公里,南北東西城鄉(xiāng)差異很大,而臺(tái)灣作為我

國(guó)的一個(gè)地區(qū),用他的生命表來(lái)計(jì)算大陸壽險(xiǎn)的保費(fèi),顯然

是不盡合理的。隨著保險(xiǎn)事業(yè)的開(kāi)展,我們不斷枳累了很多

數(shù)據(jù).到90年代初,就開(kāi)始著手進(jìn)行生命表的編制。大概

在1993—1994年,我國(guó)第一張生命表編制完成,并且在90

年代開(kāi)始使用。又經(jīng)過(guò)大概10年的時(shí)間,我國(guó)對(duì)這張生命

表進(jìn)行了完善,而且編制了第二張生命表。在第二張生命表

即將編制完成、準(zhǔn)備使用時(shí),社會(huì)上有一些人制造輿論,說(shuō)

“新的生命表已經(jīng)編出來(lái)了,如果使用新的生命表,保險(xiǎn)產(chǎn)

品要漲價(jià)”,因而在那里煽動(dòng),“如果要購(gòu)買保險(xiǎn),現(xiàn)在買是

合適的,因?yàn)橐坏┮獙?shí)行新的生命表,保費(fèi)要漲了:這里,

用我們的知識(shí)判斷一下,如果其他條件不變,購(gòu)買同樣保額

的保險(xiǎn),用10年后的生命表取代10年前的生命表進(jìn)行計(jì)算,

我們的保野應(yīng)該是升還是降?顯然,應(yīng)該降。因?yàn)?隨著杜

會(huì)經(jīng)濟(jì)的發(fā)展,隨著醫(yī)療條件的改善,每個(gè)年齡組的死亡率

都在不斷下降,人均的預(yù)期壽命在不斷上升,在這樣的條件

下,我們的保費(fèi)不是應(yīng)該升,而是應(yīng)該降。這也說(shuō)明,如果

有一些概率、統(tǒng)計(jì)、保險(xiǎn)方面的知識(shí),我們就不會(huì)被那些蠱

感人心的言論所左右。事后,也有一些專家出來(lái)澄清這一事

實(shí),希望大家不要搶購(gòu),而應(yīng)該根據(jù)自己的計(jì)劃來(lái)購(gòu)買保險(xiǎn).

在財(cái)產(chǎn)保險(xiǎn)中,我們重點(diǎn)看一下抗空意外保險(xiǎn)。大家在

坐飛機(jī)前通常要做一件事就是購(gòu)買一份航空意外保險(xiǎn)。過(guò)去

曾經(jīng)是20元錢保20萬(wàn),現(xiàn)在是20元錢保40萬(wàn)。利用我們

的知識(shí)可以做一點(diǎn)基本分析:如果暫時(shí)不考慮保險(xiǎn)公司的利

潤(rùn)和管理費(fèi)用,保險(xiǎn)的保費(fèi)價(jià)格應(yīng)該和什么有關(guān)系?應(yīng)該與

航空的風(fēng)險(xiǎn)有關(guān),風(fēng)險(xiǎn)越高,你所支付的保費(fèi)就應(yīng)該越多。

請(qǐng)大家計(jì)算一下,現(xiàn)在用20元錢購(gòu)買40萬(wàn)的保額,這就意

味著航空意外的風(fēng)險(xiǎn)應(yīng)該是多少?二萬(wàn)分之一。中國(guó)民航的

實(shí)際風(fēng)險(xiǎn)是多少?這個(gè)數(shù)據(jù)大家可能不太在意。我國(guó)在計(jì)算

民航實(shí)際風(fēng)險(xiǎn)時(shí),是以10年間所有的骯班作為一個(gè)統(tǒng)計(jì)周

期,即;10年間我國(guó)共有多少萬(wàn)次航班,航空意外事故有幾

次。目前,我國(guó)民航的平均風(fēng)險(xiǎn)是二百萬(wàn)分之一。剛才已經(jīng)

計(jì)算過(guò),我國(guó)航空意外保險(xiǎn)保責(zé)設(shè)計(jì)的風(fēng)險(xiǎn)是二萬(wàn)分之一,

而實(shí)際風(fēng)險(xiǎn)是二百萬(wàn)分之一,如果不考慮保險(xiǎn)公司的利潤(rùn)和

管理費(fèi)用,那么保險(xiǎn)公司在航空意外險(xiǎn)上的利潤(rùn)就是100倍。

正是因?yàn)楹娇找馔怆U(xiǎn)有如此大的利潤(rùn)空間,在過(guò)去的幾年

里,我國(guó)航空意外險(xiǎn)的保險(xiǎn)市場(chǎng)非?;靵y,出現(xiàn)了一些不規(guī)

范、不合法的保險(xiǎn)公司和中介公司,甚至賣出一些假保單.

因?yàn)槲覈?guó)民航的風(fēng)險(xiǎn)非常低,所以,他們一旦把保單賣出去,

就可以凈賺20元錢。為此,我國(guó)保監(jiān)會(huì)、保監(jiān)局等部門整

頓了航空保險(xiǎn)市場(chǎng)。從技術(shù)層面講,一般國(guó)外的保險(xiǎn)公司,

其利潤(rùn)僅占所有保險(xiǎn)產(chǎn)品的10V20%,據(jù)此分析,我國(guó)的航

空意外險(xiǎn)應(yīng)該降價(jià),如果保額仍為40萬(wàn)元,保費(fèi)不應(yīng)該建

過(guò)1元錢,這個(gè)比例比較合理,也能夠保證保險(xiǎn)公司正常的

利潤(rùn)空間。這就是我們利用概率統(tǒng)計(jì)進(jìn)行分析的結(jié)果。

生產(chǎn)管理是概率統(tǒng)計(jì)方法應(yīng)用得最為經(jīng)典,也最為成功

的領(lǐng)域。在生產(chǎn)過(guò)程中被廣泛應(yīng)用的SPC管理(Statistica)

ProcessControl),簡(jiǎn)稱為統(tǒng)計(jì)過(guò)程控制,是在上個(gè)世紀(jì)30

年代.由美國(guó)的貝爾電話實(shí)臉室首先創(chuàng)建的。它是利用統(tǒng)計(jì)

方法制作控制圖,運(yùn)用統(tǒng)計(jì)分析技術(shù)對(duì)生產(chǎn)過(guò)程進(jìn)行實(shí)時(shí)監(jiān)

控,它的貢獻(xiàn)是對(duì)整個(gè)工業(yè)企業(yè)的生產(chǎn)效率和產(chǎn)品質(zhì)量的提

高起了板大作用,是一個(gè)非常偉大的應(yīng)用。此外,還有大家

同樣熟悉的6西格瑪管理,從上個(gè)世紀(jì)80年代后期到今天,

一直在國(guó)際上的一些大公司,包括GC、摩托羅拉等世界級(jí)

大公司廣泛使用,并且取得了成功。6西格瑪管理運(yùn)用了贊

率統(tǒng)計(jì)中關(guān)于正態(tài)分布標(biāo)準(zhǔn)差的理論,這是一種非常成功的

管理模式,巳成為現(xiàn)在國(guó)際化大公司進(jìn)行管理的一種重要工

具。第三個(gè)重要應(yīng)用是實(shí)驗(yàn)設(shè)計(jì),它的作用是在生產(chǎn)之前,

用統(tǒng)計(jì)方法進(jìn)行實(shí)驗(yàn)設(shè)計(jì),從而保障企業(yè)在生產(chǎn)過(guò)程中可以

盡量少生產(chǎn)、甚至不生產(chǎn)不合格產(chǎn)品。以上三個(gè)例子,都是

利用統(tǒng)計(jì)進(jìn)行生產(chǎn)管理的典型案例。作為經(jīng)濟(jì)的宏觀管理部

n,包括政府管理部門.我們會(huì)應(yīng)用到對(duì)經(jīng)濟(jì)的預(yù)測(cè)和分析,

也會(huì)應(yīng)用到經(jīng)濟(jì)計(jì)量模型,這里會(huì)涉及到一些統(tǒng)計(jì)的指標(biāo)和

概念,如:通貨膨脹率、物價(jià)指數(shù)和失業(yè)率等。作為一個(gè)好

的管理者,我們應(yīng)該熟悉一些在生活和管理中用得最多的一

些統(tǒng)計(jì)指標(biāo),了解其內(nèi)涵、應(yīng)用范圍等。如果想更深入地做

一些研究,我們還會(huì)利用到回歸分析和統(tǒng)計(jì)模型進(jìn)行預(yù)測(cè).

這種建立在比較準(zhǔn)確的數(shù)據(jù)分析基礎(chǔ)上的分析和預(yù)測(cè),能使

管理者的工作效率更高,工作做得更好。

統(tǒng)計(jì)不僅在生產(chǎn)和管理中被廣泛應(yīng)用,而且在生活中也

有許多應(yīng)用,比如:體育。首先,我們來(lái)看籃球比賽。由于

姚明加入了美國(guó)NBA,所以在NBA中我們的影響很大,NBA

還專匚建立了一個(gè)中文網(wǎng)站,網(wǎng)址為。該

網(wǎng)站中有兩個(gè)關(guān)于統(tǒng)計(jì)數(shù)據(jù)的網(wǎng)頁(yè),分別是“數(shù)據(jù)”和“排

名”。2007年NBA的常規(guī)賽剛剛結(jié)束,目前正在進(jìn)行季后賽。

在“數(shù)據(jù)”頁(yè)面中,我們可以看到季后賽的得分情況,這就

是NBA球員的技術(shù)統(tǒng)計(jì),它是按照球員平均每場(chǎng)的投籃命

中率和得分情況進(jìn)行排序的。目前排在第一位的是洛杉磯湖

人隊(duì)的科比布萊恩特,他平均每場(chǎng)得分為32.8分。排在第

二位的球員平均每場(chǎng)得分為32分。中國(guó)非常優(yōu)秀的球員姚

明,在NBA季后賽中排在第8位,平均每場(chǎng)得分為25.1分。

在球員的技術(shù)統(tǒng)計(jì)數(shù)據(jù)中,還包括平均每場(chǎng)出場(chǎng)時(shí)間,投球

數(shù),命中數(shù)。姚明平均每場(chǎng)投籃17.9個(gè),平均命中7.9個(gè).

命中率是44%,罰球的命中率是88%?這些觀眾和球迷都能

看到的數(shù)據(jù),對(duì)球隊(duì)管理者更為有用。NBA每一支球隊(duì)的教

練員和教練組,都會(huì)利用這些數(shù)據(jù)安排技戰(zhàn)術(shù),球隊(duì)的老板

和管理人員用更為具體的數(shù)據(jù)安排球員的獎(jiǎng)金,甚至是出場(chǎng)

費(fèi)。在國(guó)外,體肓比賽的數(shù)據(jù)搜集得非常詳細(xì)。眾所周知,

美國(guó)哥倫比亞大學(xué)經(jīng)濟(jì)系非常知名,去年諾貝爾獎(jiǎng)金獲得者

就是哥大經(jīng)濟(jì)系的教授,另外,該系的蒙黛爾教授、斯第格

里西教授等也都曾獲得過(guò)諾貝爾經(jīng)濟(jì)學(xué)獎(jiǎng)。有一位馬丁教

授,除了在哥大經(jīng)濟(jì)系做教授外,還兼任西班牙巴塞羅那足

球隊(duì)體育技術(shù)委員會(huì)的主席,其工作就是迸行統(tǒng)計(jì)數(shù)據(jù)的收

集和分析。該委員會(huì)把巴塞羅那隊(duì)的每一場(chǎng)比賽進(jìn)行錄像,

把每一名隊(duì)員的每一個(gè)動(dòng)作作為數(shù)據(jù)輸入到計(jì)算機(jī)里,用來(lái)

做分析、做管理。嚴(yán)格地說(shuō),他所做的工作是記錄隊(duì)員在球

場(chǎng)比賽的每一個(gè)動(dòng)作,包括成功、失誤、助攻、射門的次數(shù)

等,這些情況全部與隊(duì)員的獎(jiǎng)金掛鉤,這就是一位經(jīng)濟(jì)學(xué)教

授在巴塞羅那足球隊(duì)所做的管理性的工作。通過(guò)上述案例可

以看出,對(duì)數(shù)據(jù)的搜集、整理和分析,不僅在管理和工作中

非常有效,而且在生活中、在體育比賽中,甚至在娛樂(lè)中都

被經(jīng)常用到。著名科學(xué)家愛(ài)因斯坦曾經(jīng)說(shuō)過(guò),“數(shù)學(xué)定律不

能百分之百確實(shí)地用在現(xiàn)實(shí)生活中間;能夠百分之百確實(shí)地

用數(shù)學(xué)定律描述的,就不是現(xiàn)實(shí)生活?!币馑际钦f(shuō),我們的

現(xiàn)實(shí)生活是紛紜復(fù)雜的,不能簡(jiǎn)單地用數(shù)學(xué)公式進(jìn)行描述,

如果需要做補(bǔ)充,統(tǒng)計(jì)的方法、概率的方法恰恰是能夠從比

較紛紜復(fù)雜的現(xiàn)實(shí)生活中發(fā)現(xiàn)規(guī)律的一種方法和一種有效

工具。它能夠從雜亂無(wú)章、無(wú)規(guī)律可循的數(shù)據(jù)中間發(fā)現(xiàn)事務(wù)

的內(nèi)部規(guī)律,換而言之,統(tǒng)計(jì)方法就是要發(fā)現(xiàn)事務(wù)內(nèi)部的、

規(guī)律性的數(shù)量關(guān)系和數(shù)置變化0

請(qǐng)看下面一組統(tǒng)計(jì)數(shù)據(jù)。第一,在正常情況下新生嬰兒

的男女性別比率是106:100,其含義是,在大量的新生兒中,

男孩和女孩的比例是106;100o現(xiàn)實(shí)生活中,新生娶兒并非

是男孩和女孩一樣多,而是平均每100個(gè)女孩就會(huì)有106個(gè)

男孩,即:新生嬰兒中男孩比女孩要多,平均每206個(gè)新生

嬰兒中,男孩就比女孩多6個(gè)。那么,人類是如何保持男女

性別的平衡、保證人類的遺傳、社會(huì)的和諧發(fā)展呢?是什么

原因使人類具有這樣一個(gè)基本規(guī)律呢?為什么在新生要兒

中是男孩比女孩多一些呢?因?yàn)槟行员扰缘乃劳雎矢?,?/p>

僅在新生嬰兒時(shí)期,在所有的年齡組中,男性的死亡率都比

女性要高。因而,在新生嬰兒中男孩比女孩多一點(diǎn),恰恰可

以保證人類社會(huì)能夠和諧地、可持續(xù)地發(fā)展。雖然新生嬰兒

男孩略多一些,但是由于男性在每一個(gè)年齡組的死亡率都比

女性要高一點(diǎn),在中青年結(jié)陪生育的時(shí)候,男性與女性的人

數(shù)就基本相等了,從而保證了在生育時(shí)期人口性別的平衡.

隨著人們進(jìn)入中年、進(jìn)入老年,由于男性的死亡率仍然比女

性高,就導(dǎo)致了真正長(zhǎng)壽的女性要比男性多一些。由于處在

要幼兒時(shí)期的男性比女性多一點(diǎn).中青年時(shí)男女大體持平,

年老時(shí)期的男性比女性要少,從人口的總規(guī)模來(lái)看.男女的

人口總量又俁持了另外的一個(gè)平衡,這就是人類社會(huì)幾十萬(wàn)

年,幾百萬(wàn)年甚至更長(zhǎng)時(shí)間遺傳變異的結(jié)果,就形成了一個(gè)

規(guī)律。在我國(guó)尚未實(shí)行計(jì)劃生育政策時(shí),多數(shù)家庭都有4—5

個(gè)孩子,也許有些家庭都是女孩,而有些家庭都是男孩.如

果到一些居委會(huì)去做統(tǒng)計(jì),也許某一個(gè)居委會(huì)的女孩多、而

另一個(gè)居委會(huì)的男孩多,可一旦我們進(jìn)行大量數(shù)據(jù)的搜集整

理,新生嬰兒的男女性別比一定符合這個(gè)規(guī)律;106:100.

這個(gè)規(guī)律在古今中外,每一個(gè)國(guó)家、每一個(gè)大洲都基本相同.

這是我們對(duì)大量數(shù)據(jù)進(jìn)行分析發(fā)現(xiàn)的規(guī)律。早在17世紀(jì),

英國(guó)倫敦的統(tǒng)計(jì)學(xué)者就發(fā)現(xiàn)了這個(gè)規(guī)律,這也應(yīng)該作為統(tǒng)計(jì)

學(xué)發(fā)展的源頭之一。

笫二個(gè)數(shù)據(jù)來(lái)自于生活中常做的一種游戲:當(dāng)陵機(jī)地投

擲一枚硬幣時(shí),出現(xiàn)正、反面的規(guī)律都應(yīng)該是50%。這也是

經(jīng)過(guò)大量實(shí)驗(yàn)得出的規(guī)律。同樣.如果我們隨機(jī)地投擲一個(gè)

骰子,其六面中每一面出現(xiàn)的可能性都是六分之一。這些規(guī)

律,對(duì)于現(xiàn)代人來(lái)說(shuō)毋廊質(zhì)疑,但在200-300年前,一些

數(shù)學(xué)家和學(xué)者為研究這一規(guī)律進(jìn)行了大量的投擲,最多可達(dá)

2萬(wàn)多次。在這個(gè)過(guò)程中,他們發(fā)現(xiàn),投擲的次數(shù)越多,現(xiàn)

幣正、反兩面出現(xiàn)的比率就越接近50%。

第三,美國(guó)越戰(zhàn)時(shí)期通過(guò)“抓閹”征兵時(shí)出現(xiàn)的兩個(gè)數(shù)

據(jù):73/183和110/183。越南戰(zhàn)爭(zhēng)在60年代初期剛爆發(fā)時(shí),

美國(guó)的年輕人非常踴躍地報(bào)名參軍,但幾年后,隨著越市戰(zhàn)

爭(zhēng)被拖入一個(gè)沒(méi)有盡頭的泥潭,美國(guó)社會(huì)出現(xiàn)了反戰(zhàn)情署。

雖然戰(zhàn)爭(zhēng)還沒(méi)有結(jié)束,但美國(guó)的年輕人已不再愿意去當(dāng)兵.

美國(guó)政府迫于無(wú)奈,由國(guó)會(huì)通過(guò)了一個(gè)征兵法案。因?yàn)槊绹?guó)

的立國(guó)之本就是平等,該法案為了保證每一個(gè)年輕人擁有平

等的當(dāng)兵機(jī)會(huì),采取了類似“折閹”的方式,其做法與我國(guó)

現(xiàn)在的體肓彩票、福利彩票相似,即:把一年中的每一天和

閏年的2月29日分別寫(xiě)在紙條上,把這366個(gè)紙條分別裝

在藍(lán)色小球中,再放到一個(gè)大的透明的玻璃罐中,像體育彩

票和福利彩票搖獎(jiǎng)一樣進(jìn)行搖號(hào)。這項(xiàng)法案茯得美國(guó)國(guó)會(huì)通

過(guò)后,1969年在美國(guó)現(xiàn)場(chǎng)直播。當(dāng)把366個(gè)生日小球放入一

個(gè)透明的大玻璃罐中攪拌均勻后,小球一個(gè)接一個(gè)地掉下

來(lái),并被按照掉下來(lái)的順序排隊(duì)。如果某一個(gè)生日第一個(gè)掉

下來(lái),在征兵時(shí),這一天出生的人就要第一批去當(dāng)兵。顯然,

生日搖得越靠前,被征兵的機(jī)會(huì)就越大.如果某一個(gè)生日被

排在一年的一半以后,那么這一天出生的人去當(dāng)兵的機(jī)會(huì)就

比較小,因?yàn)槊绹?guó)不會(huì)把他所有的年輕人都派去當(dāng)兵。實(shí)際

上,如果某一個(gè)生日被排到了183以后,即一年的一半以后,

這一天出生的人就基本上不會(huì)去當(dāng)兵。當(dāng)時(shí)征兵的范圍是18

至29歲的男性青年,只要身體健康,都要按照搖號(hào)的順序

去當(dāng)兵。為什么?因?yàn)檫@是公平的、這是隨機(jī)的、這是合理

的。電視直播后,統(tǒng)計(jì)學(xué)家立即對(duì)這個(gè)數(shù)據(jù)進(jìn)行了分析,正

如幻燈片上所講,搖出的結(jié)果是,在前183個(gè)生日中,有73

個(gè)是上半年、有110個(gè)是下半年,而并非為各50%左右。因

為國(guó)會(huì)在逋過(guò)該法案的時(shí)候,就是要保證公平,保證每一個(gè)

生日被抽中的機(jī)會(huì)是相等的,但實(shí)際上,上半年出生的人征

兵的機(jī)會(huì)是73/183.而下半年出生的人去當(dāng)兵的機(jī)會(huì)是

110/183o顯然,下半年出生的人去當(dāng)兵的機(jī)會(huì)要大一些。

統(tǒng)計(jì)學(xué)家對(duì)這個(gè)數(shù)據(jù)進(jìn)行了假設(shè)檢臉,結(jié)果是這兩個(gè)數(shù)據(jù)之

間有顯著的差異。因此,統(tǒng)計(jì)學(xué)家立刻對(duì)國(guó)會(huì)提出質(zhì)疑:這

一次征兵過(guò)程中的搖號(hào)不隨機(jī),對(duì)下半年出生的人不公平,

他們?nèi)ギ?dāng)兵的機(jī)會(huì)遠(yuǎn)遠(yuǎn)大于上半年出生的人,似乎對(duì)下半年

出生的人存在著歧視。國(guó)會(huì)為檢驗(yàn)這個(gè)數(shù)據(jù)也請(qǐng)了學(xué)者,證

明統(tǒng)計(jì)學(xué)家是正確的。國(guó)會(huì)于是承認(rèn),”這一次的設(shè)計(jì)還不

夠科學(xué),366個(gè)小球放到一個(gè)大玻璃罐中應(yīng)該完全搖勻,但

實(shí)際上還不夠均勻,導(dǎo)致了在掉下來(lái)的前183個(gè)小球中,下

半年的生日多一些。明年我們會(huì)做得再好一些,今年就這樣

了J從這個(gè)例子中可以看出,統(tǒng)計(jì)在我們的日常生活和工

作中,都可以被廣泛地應(yīng)用。

第四個(gè)是上個(gè)世紀(jì)50年代初期小兒麻痹癥疫苗試卷的

數(shù)據(jù)。一般情況下,新藥和新疫苗在研究過(guò)程中,都要經(jīng)過(guò)

三個(gè)嚴(yán)格的試臉階段。例子中的這組數(shù)據(jù)是在試臉的最后一

個(gè)階段,服用疫苗和沒(méi)有服用疫苗的孩子各有20萬(wàn),服用

疫苗的孩子中有56人得了小兒麻痹癥,而沒(méi)有服用疫苗的

孩子中有138個(gè)孩子患病。根據(jù)對(duì)這一數(shù)據(jù)進(jìn)行統(tǒng)計(jì)計(jì)算和

分析后,研究人員就可以得出這種疫苗是否有效的結(jié)論。目

前,所有新藥都要經(jīng)過(guò)這樣嚴(yán)格的數(shù)據(jù)檢驗(yàn),包括中國(guó)正在

著力開(kāi)發(fā)的非典疫苗、艾滋病疫苗等,都在做這樣的檢驗(yàn)。

最后是一個(gè)關(guān)于廣告費(fèi)用、企業(yè)知名度和銷售額的一組

數(shù)據(jù)%如果能夠搜集到充分的數(shù)據(jù)一,我們就可以描述出某一

個(gè)公司、某一個(gè)企業(yè)通過(guò)做廣告.為提高企業(yè)知名度和銷售

額所帶來(lái)的變化e通過(guò)發(fā)現(xiàn)他們之間的數(shù)量關(guān)系,就可以制

定科學(xué)的廣告策略。

從上述例子中可以看出,統(tǒng)計(jì)的方法,或者說(shuō)是數(shù)據(jù)分

析的方法,是在各個(gè)領(lǐng)域里進(jìn)行科學(xué)研究的一個(gè)基本工具,

既包括經(jīng)濟(jì)、管理、醫(yī)療、物理、天文等領(lǐng)域,也包括人文

社會(huì)科學(xué)的一些領(lǐng)域,如法律、歷史等。在現(xiàn)在的法庭審判

中,越來(lái)越多地依賴于數(shù)據(jù)分析,數(shù)據(jù)分析作為法庭審判中

的證據(jù),有非常好的應(yīng)用。因而,作為一種數(shù)據(jù)分析的方法,

統(tǒng)計(jì)不僅滲透在幾乎所有的學(xué)科領(lǐng)域里,而且在日常生活的

每一個(gè)角落,都可以找到很好的數(shù)據(jù)分析、統(tǒng)計(jì)分析的應(yīng)用。

統(tǒng)計(jì)的方法可以分成兩大類.一類是描述統(tǒng)計(jì),一類是

推斷統(tǒng)計(jì)。在推斷統(tǒng)計(jì)中,又可以分為參數(shù)估計(jì)和假設(shè)檢驗(yàn)。

實(shí)際上,幻燈片中的框圖已非常簡(jiǎn)單地勾畫(huà)出完整的統(tǒng)計(jì)體

系。

首先看播述統(tǒng)計(jì)。在幻燈片的右邊是一個(gè)柱形圖,我們

可以直觀地看到數(shù)據(jù)變化的過(guò)程.每個(gè)柱形下面分別標(biāo)有

QLQ2.Q3、Q4,這是英文和數(shù)字的縮寫(xiě),大家很容易就可

以猜到這可能是反映一個(gè)公司、一個(gè)企業(yè)甚至一個(gè)行業(yè)季度

銷售額或利潤(rùn)的變化,這里的Q代表季度。假定這反映的是

銷售額的變化,我們從直觀的柱形圖中可以看到,這種商品

或服務(wù)具有在前三個(gè)季度逐漸上升、在第四季度下降的規(guī)律

或趨勢(shì)。我們會(huì)很快聯(lián)想到飲料、游泳衣或某地區(qū)旅游業(yè)等

情況,因?yàn)檫@些商品或服務(wù)都具有這樣的規(guī)律。因此,凡是

看到這樣的柱形圖.如果我們有統(tǒng)計(jì)的知識(shí),就可以很容易

地聯(lián)想到這背后反映的是一類什么樣的事務(wù),這就是描述統(tǒng)

計(jì)。簡(jiǎn)單地說(shuō),描述統(tǒng)計(jì)就是怎樣有效地搜集數(shù)據(jù)、整理數(shù)

據(jù)、顯示數(shù)據(jù),并且發(fā)現(xiàn)數(shù)據(jù)基本的、數(shù)量的特征。在此圖

下邊有兩個(gè)數(shù)據(jù),一個(gè)是平均數(shù),用N表示;一個(gè)是方差,

用/表示。這兩個(gè)數(shù)據(jù)是統(tǒng)計(jì)的核心數(shù)據(jù),分別.表明數(shù)據(jù)的

平均水平和數(shù)據(jù)之間的一個(gè)平均的差異水平,有了這兩個(gè)數(shù)

據(jù)一一平均值和方差(也叫標(biāo)準(zhǔn)差),我們就可以比較清造

地把握數(shù)據(jù)的規(guī)律。

其次是推斷統(tǒng)計(jì)。推斷統(tǒng)計(jì)的思路和原理就是幻燈片中

右邊的這張圖,其目的是了解一個(gè)總體的數(shù)量特征,并對(duì)總

體的數(shù)量特征做出科學(xué)的估計(jì)或推斷。通常情況下,這個(gè)總

體非常大,有時(shí)是沒(méi)有數(shù)量界限的一個(gè)無(wú)窮的總體,要對(duì)它

的特點(diǎn)做出估計(jì)或了解,就很難對(duì)總體里每一個(gè)單位都進(jìn)行

調(diào)查。我們能夠做的是從總體中抽出一個(gè)樣本,通常是一個(gè)

很小的樣本,通過(guò)對(duì)樣本的分析或數(shù)據(jù)描述,就可以推斷出

總體的特征。例如,美國(guó)在總統(tǒng)大選期間都要做民意測(cè)驗(yàn)。

美國(guó)總統(tǒng)大選的總體就是美國(guó)的全體選民,是18歲以上的

美國(guó)成年人。目前.美國(guó)的總?cè)丝谒冉?jīng)趣過(guò)3億,選民在2

億左右。如果通過(guò)對(duì)每一個(gè)選民都進(jìn)行遍查的方式進(jìn)行總統(tǒng)

大選預(yù)測(cè),顯然是不可能的,因?yàn)榧词沟搅嗣绹?guó)大選投票的

那一天,一般也只會(huì)有60%—7(用的選民去投票,而幾千萬(wàn)甚

至更多的選民不會(huì)去投票。因此,美國(guó)一些大的新聞機(jī)構(gòu)和

調(diào)查公司就采取隨機(jī)抽樣的方式,從2億的選民總體中抽取

一個(gè)樣本進(jìn)行調(diào)查。如果想研究全部2億人,并做出一個(gè)科

學(xué)的推斷,估計(jì)的誤差不越過(guò)2-3個(gè)百分點(diǎn),即:誤差不

超過(guò)2$或3樂(lè)那么,樣本量應(yīng)該是多少呢?蓋洛普——美

國(guó)一個(gè)非常有名的調(diào)查機(jī)構(gòu),只調(diào)查1000-1500人,即:

從2億的一個(gè)人口總體中,只調(diào)查其中的1000—1500人,

顯然,與總體相比,這個(gè)樣本是很小的。那么準(zhǔn)確性如何呢?

蓋洛普從1936年起至今,已有近70年的實(shí)踐,在每四年一

次的總統(tǒng)大選中,其平均誤差在2%左右,歷史上只有一次做

了錯(cuò)誤的推斷和預(yù)測(cè),其他都對(duì)了。其他一些大的新聞機(jī)構(gòu).

如:美國(guó)的CNN、CBS.ABC等,其調(diào)查的樣本量都是1000

-1500o這個(gè)例子告訴我們,只要方法科學(xué),就可以做到抽

取一個(gè)很小的樣本,而得到非常精確的結(jié)果,這就是統(tǒng)計(jì)方

法的科學(xué)性所在。目前,在我們的許多調(diào)查中經(jīng)常出現(xiàn)一個(gè)

問(wèn)題:調(diào)查的樣本量很大,可方法并不科學(xué),有時(shí)調(diào)查了幾

千甚至上萬(wàn)人,但得到的結(jié)果卻與真實(shí)的情況相差很多。因

此,我們不能僅追求調(diào)杳的數(shù)量,而應(yīng)追求調(diào)查的質(zhì)量,要

掌握這一技術(shù),統(tǒng)計(jì)方法非常之重要。

我們談到了,在統(tǒng)計(jì)的方法體系里,主要是描述統(tǒng)計(jì)和

推斷統(tǒng)計(jì)兩部分?;脽羝杏幸粋€(gè)框圖.最左邊是我們研究

事務(wù)的開(kāi)始,是反映客觀現(xiàn)象數(shù)據(jù)的開(kāi)始,換而言之,統(tǒng)計(jì)

分析和統(tǒng)計(jì)研究必須要有數(shù)據(jù),我們本身也應(yīng)該做到科學(xué)地

搜集數(shù)據(jù)和整理數(shù)據(jù)。一旦有數(shù)據(jù),我們就可以進(jìn)行分析。

這里有兩條路緩,如果我們得到的是總體的數(shù)據(jù),經(jīng)過(guò)描述

統(tǒng)計(jì),我們就能達(dá)到目的,即:認(rèn)識(shí)總體內(nèi)在數(shù)量的規(guī)律性。

但90%以上的情況是,我們很難得到總儂的數(shù)據(jù),而通常得

到的是樣本的數(shù)據(jù),因此,我們先要經(jīng)過(guò)描逑統(tǒng)計(jì),同時(shí)再

經(jīng)過(guò)推斷統(tǒng)計(jì),在這個(gè)過(guò)程中,還要用到概,辜的一些知識(shí).

作為統(tǒng)計(jì)知識(shí)的基礎(chǔ),我們特別強(qiáng)調(diào)兩對(duì)基本強(qiáng)念,-

對(duì)概念就是剛才舉例中提到的總體和樣本??傮w就是我們研

究事務(wù)的全部,英語(yǔ)叫做Population,也有人口的意思;跟

它對(duì)應(yīng)的一個(gè)概念就叫做樣本,是從總體中隨機(jī)抽出來(lái)的一

部分。我們通常只研究樣本,然后對(duì)總體進(jìn)行推斷。

第二對(duì)概念是參數(shù)和統(tǒng)計(jì)量。參數(shù)是描述總體數(shù)量特征

的,最關(guān)健的3個(gè)數(shù)據(jù)是總體的平均數(shù)、總體的標(biāo)準(zhǔn)差、總

體的百分比,分別用3個(gè)希臘字母表述為:口、。、P;另

外一個(gè)概念是描述樣本數(shù)量特征的,稱為統(tǒng)計(jì)量,最重要的

3個(gè)數(shù)據(jù)為樣本的平均數(shù)、樣本的標(biāo)準(zhǔn)差、樣本的比率或百

分比。

我們可以把這兩對(duì)基本概念用幻燈片中的圖例表述出

來(lái),左邊是總體,描述總體的是參數(shù):右邊是總體的一部分,

可能是很小的一部分,我們稱之為樣本,描述樣本的是統(tǒng)計(jì)

量,這里有三對(duì)主要的量.就是均值、標(biāo)準(zhǔn)差和比率。實(shí)際

上,我們?cè)趯W(xué)習(xí)統(tǒng)計(jì)的時(shí)候,在掌握統(tǒng)計(jì)方法的時(shí)候,最最

核心的就是應(yīng)該理解均值、標(biāo)準(zhǔn)差和百分比。這是我們做分

析計(jì)算用得最多的量。

既然要處理數(shù)據(jù),自然離不開(kāi)統(tǒng)計(jì)軟件,在這里介紹5

種:排在前邊3A$、SPSS.MINITAB和STATIST1CA都是

專業(yè)的統(tǒng)計(jì)分析軟件,用于較高或較深層次的統(tǒng)計(jì)研究;對(duì)

于一般的應(yīng)用者,我們只需要熟悉EXCEL軟件即可,因?yàn)?/p>

它是一個(gè)非常簡(jiǎn)單的數(shù)據(jù)列表和分析軟件e

第一部分緒論就到這里。通過(guò)緒論,希望大家能終了解,

統(tǒng)計(jì)作為一個(gè)數(shù)據(jù)分析的方法和基本工具,對(duì)我們的科學(xué)研

究,對(duì)我們的生產(chǎn)、管理和日常生活有著廣泛的應(yīng)用。在我

們生活和工作的所有方面都離不開(kāi)數(shù)據(jù)丁有了數(shù)據(jù)就有了統(tǒng)

計(jì),應(yīng)用統(tǒng)計(jì)來(lái)分析數(shù)據(jù),就可以幫助我們提高管理.使我

們的生活更加豐富多彩.

第二部分描述統(tǒng)計(jì)

下面我們簡(jiǎn)單的紿大家介紹描述統(tǒng)計(jì)部分的內(nèi)容。描述

統(tǒng)計(jì)就是指怎樣有效地收集數(shù)據(jù),并通過(guò)圖表形式對(duì)所收集

數(shù)據(jù)進(jìn)行初步的加工整理和顯示,進(jìn)而分析得出結(jié)論。我們

有不同地獲得數(shù)據(jù)的方法,這里主要介紹兩種:第一是普查.

這是獲得數(shù)據(jù)的一種主要方法,普查就是為某一個(gè)調(diào)查目的

組織的全面調(diào)查,一般只做一次或者是周期性的做一次,需

要?jiǎng)佑煤艽蟮膰?guó)情國(guó)力,通常只是對(duì)國(guó)家或地區(qū)的最基本

的、涉及到國(guó)計(jì)民生的、極其重要的數(shù)據(jù)才實(shí)施普查的方式。

就我國(guó)而言,通過(guò)普查獲得數(shù)據(jù)的調(diào)查方法主要有兩類:一

是人口普查,目的是了解我國(guó)的基本國(guó)情,每隔十年做一次,

2000年國(guó)家實(shí)施了第五次人口普查,2010年將進(jìn)行第六次

人口普查。搞一次人口普查需要做很長(zhǎng)時(shí)間的準(zhǔn)備,需要?jiǎng)?/p>

用和培訓(xùn)大量的普查員,所獲得的數(shù)據(jù)也是相當(dāng)大的信息

量,普查是一次對(duì)整個(gè)國(guó)情國(guó)力的動(dòng)員,國(guó)家要有很大的投

入,所以不是經(jīng)常進(jìn)行的。二是經(jīng)濟(jì)普查,除人口普查外,

我國(guó)還有第三產(chǎn)業(yè)普查、工業(yè)普查、基本單位巡查等等。01

年經(jīng)國(guó)務(wù)院批準(zhǔn),把幾個(gè)普查珠合成一個(gè),就是經(jīng)濟(jì)普查.

第一次經(jīng)濟(jì)普查從03年開(kāi)始準(zhǔn)備,到04年底將普查結(jié)果向

社會(huì)公布。大家可能關(guān)注到一個(gè)數(shù)據(jù),即普查后的GDP比普

查前增加了2.3萬(wàn)億元人民幣,總量增長(zhǎng)了16.8K原因是

原來(lái)的第三產(chǎn)業(yè)統(tǒng)計(jì)還有很多不完善的地方,如一些服務(wù)業(yè)

企業(yè)沒(méi)有納入統(tǒng)計(jì)范圍,造成數(shù)據(jù)缺失。所以增加的2.3萬(wàn)

億元中約有90%以上來(lái)自于第三產(chǎn)業(yè)。因此,通過(guò)經(jīng)濟(jì)普查

也進(jìn)一步完善了調(diào)查制度和數(shù)據(jù)收集方法??傊?,普查是一

種重要的收集數(shù)據(jù)的方法,但由于它要?jiǎng)佑么罅康娜肆?、?/p>

力、財(cái)力,調(diào)查的周期也很長(zhǎng),因而只有關(guān)系到國(guó)計(jì)民生的

一些最基本的信息才采取普查的方式。而在實(shí)際工作中,我

們用的更多的是另外一種調(diào)查方式抽樣調(diào)查。所謂抽樣調(diào)

查,是指按照隨機(jī)原則從調(diào)查總體中抽取一部分單位作為樣

本進(jìn)行調(diào)查,只要樣本抽取的有代表性,就可以通過(guò)很小的

樣本對(duì)總體,也就是我們所要研究的全部事物,做出一個(gè)科

學(xué)的推斷。那么,什么叫隨機(jī)原則?簡(jiǎn)單地說(shuō)就是總體中的

每個(gè)單位都有同樣被抽中的機(jī)會(huì)。只要能做到這點(diǎn),調(diào)查就

有代表性。即使樣本很小,都可以做得相當(dāng)準(zhǔn)確,抽樣調(diào)查

如果做好了,應(yīng)該是一種高效率的調(diào)查方式,它在科學(xué)研究

和日常管理中用得最多,具有經(jīng)濟(jì)實(shí)效性強(qiáng)、準(zhǔn)確程度高的

特點(diǎn)。

前面介紹了普查和抽樣調(diào)查兩種主要調(diào)查方式,那么每

種調(diào)查方式都涉及到一個(gè)采用什么方法獲取數(shù)據(jù)的問(wèn)題。我

們可以有各種各樣的收集數(shù)據(jù)的方法,譬如訪問(wèn)方式,就是

通過(guò)調(diào)查者和被訪問(wèn)者面對(duì)面的交談獲得數(shù)據(jù).在早期調(diào)查

中用的比較多,現(xiàn)在主霎應(yīng)用于一些深層次問(wèn)題的調(diào)查,不

再作為一種普遍性的調(diào)查方式被調(diào)查業(yè)所實(shí)施.取而代之的

是郵寄問(wèn)卷調(diào)查。即設(shè)計(jì)一個(gè)調(diào)查問(wèn)卷.然后通過(guò)郵寄的方

式送到被調(diào)查者手中,由他們來(lái)填寫(xiě)。這種調(diào)查方式在一些

發(fā)達(dá)國(guó)家持續(xù)了50年左右,即從上個(gè)世紀(jì)的30年代到80

年代。郵寄問(wèn)卷調(diào)查目前在我國(guó)仍是一種主要的調(diào)查方式.

之所以在國(guó)外不大被采用,主要由于以下原因:第一,回收

率越來(lái)越低,通常情況下不超過(guò)20%,甚至低于10骯第二,

回答的數(shù)據(jù)和沒(méi)有回答的數(shù)據(jù)之同具有顯著差異,因此僅僅

根據(jù)回答的數(shù)據(jù)做推斷,不具有代表性。例如:1995年美國(guó)

ABC廣播公司曾經(jīng)在一個(gè)晚間節(jié)目中做調(diào)查,問(wèn)美國(guó)的電視

觀眾:”聯(lián)合國(guó)總部應(yīng)不應(yīng)該繼續(xù)留在紐約?”調(diào)查對(duì)象是

電視觀眾,完全是自愿回答,電話反饋,回答結(jié)果是2/3的

電視觀眾認(rèn)為聯(lián)合國(guó)不應(yīng)該繼續(xù)留在美國(guó),即聯(lián)合國(guó)可以撤

到別的地方去。因此可以得到這樣的結(jié)論;“美國(guó)多數(shù)人不

歡迎聯(lián)合國(guó)留在美國(guó)而在同一年,某調(diào)查公司就此問(wèn)題

做旗機(jī)調(diào)查,結(jié)果剛好相反,大約70%的美國(guó)人認(rèn)為聯(lián)合國(guó)

留在美國(guó)理所當(dāng)然,只有不到30%的人反對(duì)。大家注意,這

兩個(gè)調(diào)查結(jié)果完全相反,哪一個(gè)更準(zhǔn)確呢?顯然是隨機(jī)調(diào)查

更準(zhǔn),原因在于大多數(shù)美國(guó)人認(rèn)為這個(gè)問(wèn)題用不著討論,美

國(guó)在全世界經(jīng)濟(jì)最強(qiáng)大、最富有.而且是世界老大.聯(lián)合國(guó)

不設(shè)在美國(guó)難道還應(yīng)該在別的地方嗎?所以這部分人在收

看電視后根本就不作回答.認(rèn)為這個(gè)問(wèn)題根本就不值得回

答,而愿意回答的人往往是帶有比較強(qiáng)的情緒,即聯(lián)合國(guó)設(shè)

在美國(guó),美國(guó)要付比較高的聯(lián)合國(guó)會(huì)費(fèi)。這個(gè)案例告訴我們

當(dāng)采取自愿回答的調(diào)查方式時(shí),在搜集數(shù)據(jù)、分析數(shù)據(jù)的時(shí)

候要特別小心,由于郵寄問(wèn)卷調(diào)查采取自愿回答的方式,故

有比較強(qiáng)的局限性,目前在國(guó)外已經(jīng)被電話調(diào)查所取代。第

三就是電話調(diào)查方式。由于現(xiàn)在已經(jīng)進(jìn)入到了高度的信息社

會(huì),電話的普及率相當(dāng)高,特別是在城市,因而電話調(diào)查已

經(jīng)取代郵寄問(wèn)卷調(diào)查,成為獲得數(shù)據(jù)最主要的方法。電話調(diào)

查比較簡(jiǎn)潔,效率較高,成本較低,但是在我國(guó)的實(shí)施過(guò)程

中碰到了很多困難.主要是我們的調(diào)查業(yè)立法、規(guī)章制度不

健全。很多各種各樣的調(diào)查公司并沒(méi)有經(jīng)過(guò)批準(zhǔn),即相當(dāng)多

的調(diào)查是不合法的,因而擾亂了調(diào)查市場(chǎng)。我們經(jīng)常接到手

機(jī)、固定電話的調(diào)查,超過(guò)90%的人接到電話后還沒(méi)有聽(tīng)清

楚要調(diào)查什么,就立刻拒絕了,所以電話調(diào)查在我國(guó)的實(shí)施

過(guò)程中有很大困難,但是專門的調(diào)查公司有專門的技術(shù)來(lái)解

決這些問(wèn)題??傊?,電話調(diào)查是目前調(diào)查業(yè)獲得信息的非常

重要的方法。網(wǎng)絡(luò)調(diào)查也是一種獲得數(shù)據(jù)的方式,我們隨便

打開(kāi)一些網(wǎng)頁(yè),在首頁(yè)上經(jīng)常可以看到各種各樣的調(diào)查,但

是我們要注意,這種調(diào)查有很強(qiáng)的局限性。被調(diào)查總體實(shí)際

上是經(jīng)常上網(wǎng)、且愿意在河上回答問(wèn)題的人群,他們并不代

表大多數(shù),甚至不能代表所有網(wǎng)民,因此在使用調(diào)查結(jié)果時(shí)

一定要特別注意0我們也經(jīng)常看到很多調(diào)查公司用網(wǎng)絡(luò)調(diào)查

來(lái)發(fā)布調(diào)查信息,譬如說(shuō)青年知識(shí)分子中70—80%的人都過(guò)

勞,甚至知識(shí)分子的過(guò)勞死、平均壽命比著逋老百姓要低等

等,實(shí)際上我們箱作分析,就會(huì)對(duì)這樣的網(wǎng)絡(luò)調(diào)查結(jié)果非常

慎重,因?yàn)楣嫉臄?shù)據(jù)不是全部總體的代表性數(shù)值,而僅僅

是愿意回答的數(shù)據(jù)。例如:最近新浪網(wǎng)做了一個(gè)調(diào)查:“你

在工作中是不是經(jīng)常加班加點(diǎn)?”他得出的信息是80%的人

都加班加點(diǎn)。大家想一想,一般人對(duì)這樣的問(wèn)題可能不屑一

顧,只有那些對(duì)加班加點(diǎn)有意見(jiàn)或者對(duì)這個(gè)問(wèn)題有比較強(qiáng)烈

反映的人才愿意回答。所以回答的結(jié)果說(shuō)現(xiàn)在的勞動(dòng)者中間

有80%的人都加班,甚至都極度疲勞,不一定有代表性,所

以我們要特別注意這樣的一個(gè)問(wèn)題,即樣本對(duì)總體有沒(méi)有代

表性。另外,座談會(huì)也是獲得數(shù)據(jù)的一個(gè)重要方式,特別是

一些專業(yè)調(diào)查公司做某些深度訪問(wèn)的時(shí)候應(yīng)用較多,這種方

法有專門的設(shè)計(jì),通常以6—10人為宜。還有個(gè)別的深度訪

問(wèn),如對(duì)那些特殊問(wèn)題、敏感問(wèn)題,不宜于以座談會(huì)形式獲

取信息的,可以此做為一種特殊的獲得數(shù)據(jù)的方式,但是這

種方式也有一定的局限性,它主要應(yīng)用于定性分析,而比較

難做定量推斷。這里我們還特別要介紹另外一種獲得數(shù)據(jù)的

方法一觀察法,這個(gè)方法和前面所講的不同之處在于調(diào)查者

和被調(diào)查者不直接接觸,調(diào)查者站在一個(gè)客觀中立的立場(chǎng)上

對(duì)所要進(jìn)行調(diào)查的事物或一些調(diào)查對(duì)象進(jìn)行客觀的記錄和

描述。我個(gè)人認(rèn)為這種方法在獲得數(shù)據(jù)的方式中應(yīng)該有更廣

泛的用途。

那么,什么是觀察法的應(yīng)用呢?以交通流量統(tǒng)計(jì)為例.

現(xiàn)在很多大城市,特別是北京,市政府和管理部門正在下大

的力氣解決交通擁堵問(wèn)題,在一些重要的十字路口或道路上

做一些改善,比如增加公共交通、開(kāi)辟公共專用珞線等,其

中路口的管理還有很大的余地,這就可以利用到統(tǒng)討觀察

法。例如,長(zhǎng)安街的某一個(gè)路口,東西向和南北向紅綠燈間

隔時(shí)間的長(zhǎng)短,是不是一旦設(shè)定了就不能更改?比如主干道

綠燈一分半鐘,非主干道車流量少一點(diǎn),綠燈的能行時(shí)間就

可以控制在40-45秒鐘。是不是在一定的時(shí)間段里,東西

向的車流量較大,而另外一個(gè)時(shí)間段里南北向的車流量又更

多一些?要想做到以人為本的管理設(shè)計(jì),就需要掌握一個(gè)路

口一天24小時(shí)、一周不同的時(shí)間段(比如平時(shí)和周末)的

交通流量變化,就需要用觀察的方法來(lái)搜集路口車流量通過(guò)

的數(shù)據(jù)。掌握了比較科學(xué)準(zhǔn)確的數(shù)據(jù),就可以做非常好的管

理.我舉一個(gè)國(guó)外交通管理的例子,美國(guó)紐約是一個(gè)島,在

曼哈頓地區(qū)有很多大公司,白天會(huì)有幾百萬(wàn)的人從長(zhǎng)島、新

澤西涌入曼哈頓,而在晚上又要返回他們?cè)诮紖^(qū)的住所。曼

哈頓島跟兩邊的聯(lián)系主要靠幾個(gè)鐵橋和隧道,它的管理非常

人性化。鐵橋是30年代建的,上下兩層,每層有8個(gè)車道,

上層是進(jìn)城.下層是出城,它根據(jù)每天車流量的大小來(lái)控制

道路通行的方向,早上可能有12條車道都是進(jìn)城,因?yàn)樯?/p>

午進(jìn)城的人多:下午4一5點(diǎn)出城的人開(kāi)始增多,可能會(huì)有

13條車道出城。靠什么來(lái)管理?就靠紅綠燈,非常人性化。

我們經(jīng)??吹剿牡缆钒凑樟髁康拇笮?lái)分配路權(quán)。因此,

利用觀察法掌握不同時(shí)間、不同方向車流量的數(shù)據(jù)時(shí)于透行

科學(xué)、高效地管理非常重要。我在日本訪問(wèn)的時(shí)候,就發(fā)現(xiàn)

日本地鐵的效率非常高,它保證所有的乘客在任何一個(gè)車站

的等候時(shí)間不超過(guò)3-4分鐘,怎么能夠做到這點(diǎn)呢?原因

在于它對(duì)流量的數(shù)據(jù)掌握得非常細(xì)致。經(jīng)常看到一些大學(xué)生

或志愿者拿著記數(shù)器,在地鐵上、下入口統(tǒng)計(jì)人流量,再按

照這個(gè)流量的分布來(lái)安排地鐵車量,人流量最密的時(shí)候每隔

2分鐘就有一輛地鐵通過(guò),平時(shí)的6節(jié)車.廂也會(huì)加到10節(jié),

在最短的時(shí)間內(nèi)將乘客送走。這就是觀察法的應(yīng)用。另外,

還有觀察實(shí)驗(yàn)法,是通過(guò)做一些特殊的實(shí)臉獲取數(shù)據(jù).在自

然科學(xué)中應(yīng)用較多。剛才談到的調(diào)查方法都是直接獲得數(shù)據(jù)

的方式。在現(xiàn)代社會(huì)還有更多地獲得數(shù)據(jù)的渠道,我們把通

過(guò)網(wǎng)絡(luò)、出版物等得到的數(shù)據(jù)稱為間接的數(shù)據(jù)來(lái)源?,F(xiàn)在網(wǎng)

絡(luò)非常方便,在國(guó)家統(tǒng)計(jì)局、北京市統(tǒng)討局和各個(gè)地方統(tǒng)計(jì)

部門的網(wǎng)站都可以獲得當(dāng)?shù)卣墓_(kāi)數(shù)據(jù),也可以通過(guò)這

些網(wǎng)站鏈接到世界各國(guó)的政府、大的國(guó)際組織、甚至大的公

司的網(wǎng)站獲得數(shù)據(jù)。

有了數(shù)據(jù),下面就簡(jiǎn)單紿大家介紹一下,怎么樣對(duì)這些

數(shù)據(jù)做一些簡(jiǎn)單的整理和描述。例如:這里有某車間50名

工人日加工零件的50個(gè)數(shù)據(jù)(見(jiàn)PPT例24),原始數(shù)據(jù)很零

亂,看不出任何規(guī)律。最基本、最簡(jiǎn)單的整理是對(duì)這50個(gè)

數(shù)據(jù)進(jìn)行分組,我們看到所有數(shù)據(jù)的最小值為105件.最大

值為140件,把所有加工零件分成7個(gè)組,每5件作為一組

的組距,形成組距數(shù)列(見(jiàn)PPT表2-1):中間這一列就是在

每一組里有多少小工人,稱為頻數(shù),即次數(shù),所有的頻數(shù)之

和為50,即指一共有50個(gè)工人;最右的一列,是計(jì)算每組

工人的百分比,即6樂(lè)10%等。頻數(shù)經(jīng)過(guò)分組后對(duì)我們了解

數(shù)據(jù)有什么作用呢?為了觀察更直觀,我們可以把須數(shù)做成

直方圖(見(jiàn)PPT圖2-1)。直方圖是分析數(shù)據(jù)、發(fā)現(xiàn)數(shù)據(jù)規(guī)律

非常有效的方式。在橫軸上按105、110、115、120、125、

130.135,140等距離的進(jìn)行標(biāo)記,然后把每一個(gè)組里的次

數(shù)或是頻數(shù)的多少作為縱軸或者說(shuō)Y軸的標(biāo)記,就得到一個(gè)

直方圖。根據(jù)直方圖就可以進(jìn)一步對(duì)數(shù)據(jù)做出分析或判斷:

這50個(gè)工人加工零件數(shù)類似于一個(gè)對(duì)稱的分布,即兩頭小

中間大的分布。換句話說(shuō),就是50個(gè)工人中加工零件數(shù)在

120-125這個(gè)區(qū)間的人數(shù)是最多的,這就是加工零件最適

中、最中間的數(shù)值;而加工最多的、效率很高的130—140

這一組的人數(shù)并不多;加工數(shù)量比較少的105—110件的人

數(shù)也比較少,兩頭小中間大,這就稱作對(duì)稱分布,統(tǒng)計(jì)專業(yè)

術(shù)語(yǔ)稱之為類似于正態(tài)分布。如果一個(gè)數(shù)列是這樣分布的,

我們就可以做出進(jìn)一步的判斷,即50個(gè)工人平均加工件數(shù)

在120-125這個(gè)區(qū)間。如果不是對(duì)稱分布,我們就很難做

出這樣的判斷,這就是直方圖的作用。如果我們把直方圖的

每一個(gè)柱形的上端中點(diǎn)相連接,就變成折線圖(PPT圖2-2).

同時(shí)我假定直方圖下面的面積之和為1.我的問(wèn)題是:直方

圖下邊的面枳和折線圖下邊的面枳是不是相等?答案是相

等。因?yàn)槲覀冞B接的是兩個(gè)柱形的中點(diǎn),在折線圖外邊的那

個(gè)三角形和里邊的三角形的面積剛好是一樣。利用這個(gè)性

質(zhì),在以后學(xué)習(xí)概率論時(shí),就可以用曲線以下面積的一部分

計(jì)算每一個(gè)區(qū)間發(fā)生的概率。這里,還要紿大家介紹一種利

用計(jì)算機(jī)畫(huà)出來(lái)的圖一箱線圖(見(jiàn)PPT圖2-3),它是由一個(gè)

盒子和兩條線段組成的圖。作箱線圖最重要的是找出一殂數(shù)

據(jù)的五個(gè)代表性的數(shù)值,這個(gè)圖就畫(huà)出來(lái)了。這五個(gè)數(shù)值就

是一組數(shù)據(jù)的最大值、最小值、中間值和兩個(gè)四分位數(shù)。中

間值就是統(tǒng)計(jì)中的中位數(shù),即把數(shù)據(jù)從大到小排列,形成一

個(gè)數(shù)列,如果是單數(shù)項(xiàng)就是中間的那個(gè)數(shù);如果是偶數(shù)項(xiàng)就

是中間兩個(gè)數(shù)值的平均數(shù)。兩個(gè)四分位數(shù)是指中間值和最大

值之間的中間值(上四分位數(shù)),以及中間值和最小值之間

的中間值(下四分位數(shù))。中間值和兩個(gè)四分位值把數(shù)據(jù)的

個(gè)數(shù)四等分。有了這五個(gè)數(shù)值,就很容易將一組數(shù)據(jù)的分布

特征和特點(diǎn)用箱線圖表現(xiàn)出來(lái)。大家可以看到,這就是前面

舉例中的50個(gè)工人加工零件的箱戰(zhàn)圖(見(jiàn)PPT圖2-4),最大

139件,最小107件,中間值123件,在123—139之間的中

間值是128,即上四分位數(shù)。】07—123之間的中位數(shù)稱為下

四分位數(shù),是117.75,117.75—123之間所包含的數(shù)據(jù)是50

個(gè)數(shù)據(jù)中的1/4,即12-13個(gè)數(shù)據(jù),107-117.75之間有1/4

的數(shù)據(jù)。箱線圖的兩條線段和盒子的兩半分別表示四個(gè)區(qū)

間,50個(gè)數(shù)據(jù)落在每一個(gè)區(qū)間里的個(gè)數(shù)是相等的。熟練的

人一看這個(gè)圖.就應(yīng)該反映出背后的分布是正態(tài)分布.還是

偏態(tài)分布?我們也請(qǐng)大家來(lái)考慮一下不同的箱線圖背后的

分布態(tài)勢(shì)是什么樣?算是一個(gè)思考題.那么.箱線困有什么

用呢?我們學(xué)習(xí)的目的是為了理解、分析圖形背后的含義。

舉個(gè)例子:從某大學(xué)經(jīng)濟(jì)管理專業(yè)二年級(jí)學(xué)生中隨機(jī)抽取11

人,分別記錄下每一名同學(xué)8門主要課程的考試成績(jī),就形

成了演示文稿中的列聯(lián)表或者數(shù)據(jù)表(見(jiàn)PPT例22,表22).

我們給11個(gè)同學(xué)每人一個(gè)編號(hào),同時(shí)列出每個(gè)同學(xué)8門課

程的考試成績(jī),然后利用箱線圖對(duì)這11個(gè)同學(xué)及8門課程

做一個(gè)分析。首先,用Statistic軟件時(shí)8門課程繪出軸線圖

(見(jiàn)PPT圖2-5).橫軸列出每門課程的名稱;縱軸列出考試

成績(jī),從45分到]00分。大家看到這8個(gè)箱線圖的形狀是

不一樣的,每一個(gè)箱線圖的最高位置就表示這門課程的最高

分,最下沿就表示這門課程的最低分。箱線圖上邊、下邊的

兩條線段和箱線困中間的盒子的兩個(gè)部分分別代表了四個(gè)

區(qū)域,每一區(qū)域里大概有三個(gè)學(xué)生的成績(jī)(如果正好是12

個(gè)同學(xué)的話,就表示每一個(gè)區(qū)間里有3個(gè)同學(xué)的成績(jī)八現(xiàn)

在請(qǐng)大家考慮,這8門課程,哪門課程對(duì)同學(xué)們來(lái)說(shuō)最容易?

即同學(xué)們考試的分?jǐn)?shù)都比較高:哪門課程相對(duì)最難?有人

說(shuō),西方經(jīng)濟(jì)學(xué)和英語(yǔ)最容易。好,我們對(duì)這兩門課程做一

個(gè)比較。英語(yǔ)的最高分比西方經(jīng)濟(jì)學(xué)高,而且是所有8門課

程里最高的.英語(yǔ)的最低分也是8門課程最低分里最高的,

英語(yǔ)的平均分?jǐn)?shù),即余子中間的中位數(shù)的成績(jī)也是8門課程

中最高的。在盒子的上沿.四分位數(shù)也是8個(gè)盒子上沿最高

的,唯一一點(diǎn)是英語(yǔ)盒子的下沿比西方經(jīng)濟(jì)學(xué)略低一點(diǎn)點(diǎn).

所以,從總體上看,英語(yǔ)是最容易的.如果計(jì)算平均分,英

語(yǔ)的平均分一定是最高的。那么,哪門課程相對(duì)比較難呢?

一個(gè)是統(tǒng)計(jì)學(xué),另一個(gè)是經(jīng)濟(jì)數(shù)學(xué)。比較一下,從所有成績(jī)

的最低分來(lái)看,經(jīng)濟(jì)數(shù)學(xué)是最低的,但是經(jīng)濟(jì)數(shù)學(xué)的最高分

也是所有成績(jī)里面相當(dāng)高的(僅次于英語(yǔ)),再看它們金子

中間類似于平均成績(jī)的中位數(shù),會(huì)發(fā)現(xiàn)統(tǒng)計(jì)學(xué)的中位數(shù)成續(xù)

偏低,所以,由此得出統(tǒng)計(jì)學(xué)更難一點(diǎn)。另外,我們?cè)谂袛?/p>

一門課程出題好與不好,按照教育統(tǒng)計(jì)或者說(shuō)考試學(xué)的要

求,這門課程的成績(jī)一定要服從正態(tài)分布。我們看基礎(chǔ)會(huì)計(jì)

就明顯不是正態(tài)分布,其中比較接近正態(tài)分布的是經(jīng)濟(jì)數(shù)學(xué)

和財(cái)務(wù)。但是這個(gè)例題數(shù)據(jù)量還是少了一些,只有11個(gè).

大家還可以進(jìn)一步分析這8門課程箱繪圖的其它特點(diǎn)。我們

可以用同樣的軟件對(duì)11個(gè)同學(xué)8門課程的成績(jī)做出11個(gè)箱

線圖(見(jiàn)PPT圖2-6),它們的形狀差別就很大了,有的比較

短,也有的很長(zhǎng)e按照現(xiàn)在的高考標(biāo)準(zhǔn),總分最高就能上好

一些的學(xué)校,請(qǐng)大家考慮,幾號(hào)同學(xué)最有可能上好學(xué)校?答

案是2號(hào)同學(xué)。因?yàn)樗南渚€圖位置很高,而且最高分和最

低分的距離很短,說(shuō)明他不偏科,各科成績(jī)都很好.而且分

數(shù)比較集中。再看3號(hào)同學(xué),最高分和最低分都是他,他的

箱線圖距離很長(zhǎng).這樣的同學(xué)可能在某一科目上表現(xiàn)出優(yōu)

勢(shì),而其它學(xué)科成績(jī)就比較低.高考按總分錄取,3號(hào)同學(xué)

就不大容易考上很好的學(xué)校,但是他很可能在某一學(xué)科上有

潛質(zhì),我們的教育應(yīng)該給3號(hào)同學(xué)提供更多的發(fā)展空阿。

關(guān)于對(duì)數(shù)據(jù)進(jìn)行整理,還可以再看一些例子。這里搜集

整理了我國(guó)1995-2005年城值居民和農(nóng)村居民人均收入的

數(shù)據(jù)(見(jiàn)PPT例2,3.表2-3,摘自國(guó)家統(tǒng)計(jì)局的統(tǒng)計(jì)年鑒)。

如果僅是把數(shù)據(jù)列在這兒,不太容易看出它們的發(fā)展變化規(guī)

律。現(xiàn)在,我們用EXCEL畫(huà)圖功能把這些數(shù)據(jù)表現(xiàn)出來(lái),

就會(huì)看到變化。黃色代表農(nóng)村居民家庭的人均收入,粉色代

表城鎮(zhèn)居民家庭的人均收入。我們看到1995—2005年11年

間,城鄉(xiāng)居民的收入差距越來(lái)越大,它有一點(diǎn)像張開(kāi)的剪刀

的口子。由此可以更直觀地看到我們國(guó)家過(guò)去十幾年間城鄉(xiāng)

居民家庭收入差距的變化,盡管農(nóng)村居民家庭收入也在增

加,但是和城鎮(zhèn)居民家庭收入的增長(zhǎng)速度比較,還是太慢了.

所以,可據(jù)此判斷城鄉(xiāng)之間的差距不是減少了,而是擴(kuò)大了。

再看另外一組數(shù)據(jù),1978年—2005年我國(guó)城鄉(xiāng)居民的恩

格爾系數(shù)(見(jiàn)PPT表2-4)。什么是恩格爾系數(shù)?就是一個(gè)家

庭中用于吃的支出占總支出的百分比.我們看到,1978年改

革開(kāi)放之初,農(nóng)村居民家庭的恩格爾系數(shù)是67.7%,即收入

的2/3還多一點(diǎn)都用來(lái)吃了,城鄉(xiāng)居民家庭的恩格爾系數(shù)是

57.5%,接近60%。到2005年,恩格爾系數(shù)都下降了20%以

上,農(nóng)村居民家庭由67.7$降到了45%.城鎮(zhèn)降到了36.7%,

這反映出隨著收入的增加、生活水平的提高,消費(fèi)結(jié)構(gòu)發(fā)生

了變化。經(jīng)濟(jì)越發(fā)達(dá),恩格爾系數(shù)就越低,發(fā)達(dá)國(guó)家的恩格

爾系數(shù)在10%左右.吃已經(jīng)不是整個(gè)支出的主要部分了。我

們國(guó)家還處在發(fā)展中國(guó)家階段,恩格爾系數(shù)還會(huì)不斷地、持

續(xù)地下降。如果我們把上面的兩列數(shù)據(jù)周折線,圖來(lái)描述,就

可以看到從改革開(kāi)放之初的1978年到2005年,前后大概都

相差20個(gè)百分點(diǎn),但是中間的變化,特別是農(nóng)村居民家庭,

在80年代中期的時(shí)候,恩格爾系數(shù)降低的速度特別快,有

一段時(shí)間城市和農(nóng)村的恩格爾系數(shù)已經(jīng)非常接近了,但后來(lái)

差距又?jǐn)U大了,這描述了我國(guó)自80年代改革開(kāi)放以來(lái)的一

段歷史。改革是從農(nóng)村開(kāi)始的,在80年代初期和中期,農(nóng)

民的受益是比較明顯的,但是到了80年代末特別是90年代

初期.改革的重點(diǎn)推向了城市,城市受益更多,而農(nóng)民建到

的改革的益處相對(duì)少了。

我們還可以用統(tǒng)計(jì)數(shù)據(jù)面很多很多圖,時(shí)間的關(guān)系,只

列出來(lái)了兩、三個(gè),讓大家理解,統(tǒng)計(jì)圖如果做得好的話,

是非常有效的。

下面談?wù)劷y(tǒng)計(jì)表。

統(tǒng)計(jì)表是表現(xiàn)統(tǒng)計(jì)資料的最有效的形式,也是政府工作、

管理工作最基本的工具.好的統(tǒng)計(jì)表應(yīng)該是簡(jiǎn)單、直觀、一

目了然,可在短附間內(nèi)給人以明碓的疑念。但是我們生活中

經(jīng)常看到的報(bào)紙、雜志上的很多統(tǒng)計(jì)表都很不規(guī)范,所以,

我們介紹一下統(tǒng)計(jì)表最基本的要素,強(qiáng)調(diào)政府機(jī)關(guān)、工作部

門都應(yīng)該作規(guī)范的統(tǒng)計(jì)表。一張規(guī)范的統(tǒng)計(jì)表首先要有表

頭,表頭一般應(yīng)包括表號(hào)、表的標(biāo)題和表中數(shù)據(jù)的單位等內(nèi)

容。表號(hào)如2—14.表明是第二章或第二部門的第14個(gè)表;

標(biāo)題內(nèi)容應(yīng)表明統(tǒng)計(jì)數(shù)據(jù)的時(shí)間(When),地點(diǎn)(Where)

及數(shù)據(jù)內(nèi)容(What),即滿足3年的要求:如果表中的數(shù)據(jù)是

同一個(gè)計(jì)量單位,可在表的右上角標(biāo)明,若不同,可單列出

一列標(biāo)明。再看這張表,是1997-1998年城鎮(zhèn)居民家庭抽

樣調(diào)查資料(見(jiàn)PPT表2-5,摘自1999年中國(guó)統(tǒng)計(jì)摘要),

時(shí)間有了,地點(diǎn)是我國(guó)城鎮(zhèn)居民家庭,內(nèi)容是家庭抽樣調(diào)查

資料。第二,表中要有橫(行標(biāo)題)的或豎(列標(biāo)題)的標(biāo)

題。上表中的列標(biāo)題是時(shí)間、項(xiàng)目等,行標(biāo)題包括調(diào)查戶數(shù)、

每戶人口數(shù)等,后邊藍(lán)色的部分是表的主要數(shù)據(jù)內(nèi)容。第三,

表的下方要加上注釋,稱為附加,標(biāo)明咨料來(lái)源,或者是自

己調(diào)查的,或者是引自年鑒、報(bào)刊,方便讀者查閱使用。我

們還要特別強(qiáng)調(diào)編制統(tǒng)計(jì)表時(shí)應(yīng)注意的幾點(diǎn)規(guī)則:一是統(tǒng)計(jì)

表的左右兩邊不封口,通常只是上下兩條粗橫線,中間的其

它線要用細(xì)線,而且橫、豎線越少越好;二是統(tǒng)計(jì)表中左上

角的單元格不能有斜線,真正規(guī)范的統(tǒng)計(jì)表中從不出現(xiàn)斜

線,大家可以從聯(lián)合國(guó)或世界各國(guó)的年鑒、網(wǎng)上看一看統(tǒng)計(jì)

部門做出的規(guī)范的統(tǒng)計(jì)表。三是表中的數(shù)據(jù)一定要對(duì)齊,一

般是右對(duì)齊:沒(méi)有數(shù)字的表格,一般用“一”表示,一張?zhí)?/p>

好的統(tǒng)計(jì)表不應(yīng)該出現(xiàn)空白單元格??傊y(tǒng)計(jì)表的設(shè)計(jì)應(yīng)

符合科學(xué),實(shí)用、簡(jiǎn)襪、美觀的要求。

下面我舉幾個(gè)不太規(guī)范的、錯(cuò)誤的例子,讓大家進(jìn)一步

明確如何正確的使用統(tǒng)計(jì)表。首先,請(qǐng)大家看圖左邊的這部

分(見(jiàn)PPT第二章31頁(yè))。這是一個(gè)柱形圖,想反映某高校

大學(xué)四個(gè)年級(jí)考試成績(jī)得A的人數(shù),大一、大二、大三、大

四的英文縮寫(xiě)分別為FR,SO.JR.SR.柱形圖給我們的感覺(jué)

好像是大一得A的人最多,大二得A的人最少,如果要相信

這個(gè)數(shù)據(jù),可能得到這樣的結(jié)論,即這個(gè)學(xué)校里大一的同學(xué)

素質(zhì)比較高.大二相對(duì)來(lái)說(shuō)弱一點(diǎn)。左邊是用絕對(duì)數(shù)來(lái)做的

圖,即用人數(shù)的多少。但有時(shí)用絕對(duì)數(shù)來(lái)表示可能會(huì)產(chǎn)生誤

導(dǎo),如果我們把四個(gè)年級(jí)得A的人數(shù)除以全部學(xué)生數(shù),就得

到了右邊的困,各年級(jí)得A的百分比,都是25凱結(jié)論是四

個(gè)年級(jí)學(xué)生之間的成績(jī)沒(méi)有什么差異。如果用絕對(duì)數(shù)(左邊

的圖)就有可能得到有差異的信息。所以,比較上述兩種分

析,應(yīng)該選擇用相對(duì)數(shù)做分析。

第二個(gè)例子是一個(gè)季節(jié)銷售蹶的數(shù)據(jù)(見(jiàn)PPT第二章32

頁(yè))。橫軸是一季度、二季度、三季度、四季度;縱軸是以

100為一個(gè)單位,可能是萬(wàn)元,也可能是1。萬(wàn)元。左圖紿我

們的感覺(jué)是四個(gè)季度的銷售額差別不大;同樣的數(shù)據(jù)用右圖

表示,也是四個(gè)季度的銷售額,給我們的直觀感覺(jué)是差別比

較大,即一至三季度銷售額不斷地增長(zhǎng),四季度下降。左右

兩圖的差別在哪兒??jī)H僅在于縱軸的單位標(biāo)準(zhǔn)。左圖是用

100作為一個(gè)單位,右圖是用25作為一個(gè)單位。如果再用

10作為一個(gè)單位,大家設(shè)想會(huì)是什么樣的結(jié)果?差距一定會(huì)

更明顯。因而,我們?cè)谧鰣D的時(shí)候,應(yīng)該選擇適當(dāng)?shù)臉?biāo)準(zhǔn)和

適當(dāng)?shù)膯挝?,否則就有可能會(huì)掩蓋數(shù)據(jù)的差距,甚至是夸大

數(shù)據(jù)的差距。顯然.以此題為例,如果要夸大數(shù)據(jù)的差距,

就把單位設(shè)的很?。喝绻谑緮?shù)據(jù)的差距,就可以把單位

選得很大e而我們的目的是要把數(shù)據(jù)之間的差距客觀公正地

表述出來(lái),因此單位的選擇非常重要。

再看一個(gè)例子,是12個(gè)月份的銷售額資料(見(jiàn)PPT第二

章33頁(yè))。圖中是12個(gè)月的銷售額,分別用英文標(biāo)識(shí)在下

面。左圖給我們的感覺(jué)是月份的銷售額之間變化非常之副

烈,先增加,然后又降下來(lái),六、七月份時(shí)非常低,年底又

非常高。請(qǐng)大家看這個(gè)圖有一個(gè)明顯的錯(cuò)誤,就是縱軸沒(méi)有

從0開(kāi)始,這是我們畫(huà)圖時(shí)最忌諱的,縱軸一定要從0開(kāi)始,

因?yàn)槟鞘潜容^的原點(diǎn),對(duì)照的基準(zhǔn)點(diǎn)。如果從0開(kāi)始把同樣

的數(shù)據(jù)做分析,就可以得到右邊的圖。盡管12個(gè)月份之間

有一些差距,但是差距也不過(guò)是在6-7個(gè)單位之間,和整

體來(lái)比,變化并不顯著。以上的幾個(gè)例子告訴我們,用統(tǒng)計(jì)

圖或統(tǒng)計(jì)表直觀地反映數(shù)據(jù)變化的規(guī)律非常重要,但是如果

我們操作時(shí)不慎重就有可能會(huì)得到一些錯(cuò)誤的結(jié)論。因而,

在此引用美國(guó)著名統(tǒng)計(jì)學(xué)家Mos⑷ler的話:“要用統(tǒng)計(jì)騙人

是很容易的”。以上所舉案例中的統(tǒng)計(jì)圖有的是騙人的,如

果我們沒(méi)有統(tǒng)計(jì)知識(shí),就很容易上當(dāng)受騙。所以,不管是作

為管理者,還是政策執(zhí)行者,我們都應(yīng)該掌握統(tǒng)計(jì)知識(shí),用

好統(tǒng)計(jì)這個(gè)工具。

笫三部分統(tǒng)計(jì)決策

第二部分講的是描述統(tǒng)計(jì),我們非常簡(jiǎn)單地給大家介紹

了一些獲得數(shù)據(jù)的方法,及對(duì)數(shù)據(jù)進(jìn)行簡(jiǎn)單整理的方法,并

利用圖和表把它們表示出來(lái)。第二部分還應(yīng)包括計(jì)算數(shù)據(jù)的

主要的統(tǒng)計(jì)量,如均值和標(biāo)準(zhǔn)差等,由于時(shí)間關(guān)系沒(méi)能展開(kāi)

介紹。描述統(tǒng)計(jì)中搜集、整理數(shù)據(jù)和分析樣本數(shù)據(jù)的目的在

于為決策提供依據(jù),幫助我們進(jìn)行決策。第三部分我們將討

論統(tǒng)計(jì)決策的問(wèn)題。

先看一個(gè)實(shí)例,這是某石油公司的決策。石油勘探是一

個(gè)高風(fēng)險(xiǎn),高回報(bào)的行業(yè),統(tǒng)計(jì)決策的方法在此類行業(yè)中都

有比較寬、比較廣的用處。該石油公司掌握了一份石油開(kāi)采

合同,公司有三種策略可以選擇,第一,可以將合同實(shí)棹:

第二.合同先不賣,觀察一段時(shí)間,比如說(shuō)一年以后再考慮

把它賣掉;第三,現(xiàn)在就可以進(jìn)行采掘。

我們有三種策略的結(jié)果。

第一,現(xiàn)在把合同賣出去,它的市場(chǎng)價(jià)格為125萬(wàn)元。

第二,把合同留下來(lái),一年以后再出售。這就要看一年

以后的油價(jià)是升還是降,如果油價(jià)升,估計(jì)合同能賣到440

萬(wàn);如果油價(jià)降,這個(gè)合同顯然就賣不到現(xiàn)在的125萬(wàn),估

計(jì)只能賣110萬(wàn)。同時(shí)還可以對(duì)一年以后油價(jià)升還是降做出

一個(gè)判斷:油價(jià)升和降的概率分別為10%和90%,認(rèn)為油價(jià)

升的概率小一點(diǎn),油價(jià)降的可能性大一點(diǎn)。這個(gè)例子和現(xiàn)實(shí)

情況剛好相反.如果今天做未來(lái)一年的判斷,相信多數(shù)人會(huì)

判斷一年以后油價(jià)升的可能性大,油價(jià)降的可能性相對(duì)比較

小,因?yàn)樯弦荒陣?guó)際市場(chǎng)原油的價(jià)格波動(dòng)劇烈,一桶原油的

最高價(jià)格接近80美元,最低降到60美元左右,現(xiàn)在大體維

持在這個(gè)水平。

第三,現(xiàn)在采掘。鉆井的費(fèi)用是200萬(wàn)元,打下去可能

發(fā)生的情況在講稿PPT3-2中列出:首先,可能沒(méi)有油,公

司搜集了自己幾十年鉆井的歷史數(shù)據(jù),如果歷史很短,也可

以搜集別的石油公司的數(shù)據(jù),比如說(shuō),一個(gè)石油公司可能打

了幾千口井,大概有一半是沒(méi)有油的,即打下去無(wú)油的可能

性是50%,這個(gè)概率稱為先驗(yàn)概率.通常是歷史的數(shù)據(jù);其次,

開(kāi)采有油的可能性又是多少呢?是40%,即打出一口一般的

油井,也就是比較正常情況下開(kāi)采一口油井的回報(bào)率:另外

還有10%的可能性是打出一口高產(chǎn)油井。注意這里概率為

50%、,10轉(zhuǎn)、10%的前提是這個(gè)石油公司有歷史數(shù)據(jù)。如果沒(méi)

有歷史數(shù)據(jù),可以搜集其他石油公司或已經(jīng)公布的一些數(shù)

據(jù),這是因?yàn)樵谧鰶Q策判斷時(shí)要把風(fēng)險(xiǎn)加以考慮。顯然如果

打的是一口沒(méi)油的井,報(bào)償值即收益為0;如果打出一口一

般的油井,按市場(chǎng)價(jià)值討算其未來(lái)的收益是400萬(wàn)元;如果

打出一口高產(chǎn)的自噴井是最好的,將有1500萬(wàn)元的收益。

這就是擺在我們面前的一個(gè)實(shí)際的統(tǒng)計(jì)決策的例子,我

們應(yīng)該怎么辦?現(xiàn)在把合同賣掉?一年以后賣?或現(xiàn)在采

掘?決策時(shí)首先應(yīng)考慮哪個(gè)策略對(duì)我們來(lái)說(shuō)收益比較大,還

要考慮其他的問(wèn)題。這是我們一會(huì)要進(jìn)一步討論的問(wèn)題,在

此之前,給大家介紹一下決策的三要素。

我們換一個(gè)比較簡(jiǎn)單的例子。來(lái)看講稿PPT3-3的表格,

某木罌廠對(duì)是否生產(chǎn)一種新型組合家具做出決策。影響

溫馨提示

  • 1. 本站所有資源如無(wú)特殊說(shuō)明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請(qǐng)下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請(qǐng)聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁(yè)內(nèi)容里面會(huì)有圖紙預(yù)覽,若沒(méi)有圖紙預(yù)覽就沒(méi)有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫(kù)網(wǎng)僅提供信息存儲(chǔ)空間,僅對(duì)用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對(duì)用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對(duì)任何下載內(nèi)容負(fù)責(zé)。
  • 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請(qǐng)與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶因使用這些下載資源對(duì)自己和他人造成任何形式的傷害或損失。

最新文檔

評(píng)論

0/150

提交評(píng)論