版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進行舉報或認領(lǐng)
文檔簡介
社會統(tǒng)計學案例
案例一:內(nèi)在有偏的樣本
一、內(nèi)在有偏的樣本案例
有一個裝著紅、白兩色豆子的桶,如果你想要準確知道這個桶中兩種豆子的數(shù)量,你惟
一能做的只有一顆一顆地數(shù)豆子。
用一種更簡單的方法也可以揣測紅豆的數(shù)量:抓一把豆子,假定手中紅豆的比例與桶中
紅豆的比例相同,只要數(shù)一數(shù)手中的豆子即可。如果你的樣本足夠大,并且選擇方法正確,
在大多數(shù)情況下它能夠很好地代表整體。但是,如果以上兩個條件不滿足,這樣的樣本比一
個臆想好不到哪兒去,除了能夠營造科學精確的假象之外,其他則根本不值一提。不幸的是,
我們所看到的,或者我們自以為了解的許多事物,往往都是根據(jù)類似樣本所得出的結(jié)論,這
種樣本可能變得有偏,由于選擇方式的不合理或者容量過小,抑或兩種情況同時存在。
通過一個極端的例子可以馬上看到如何形成有偏的樣本。假設你向同胞發(fā)放問卷,問卷
中包含這樣一個問題:"你樂意回答調(diào)查問卷嗎?”整理所有的答案,你很有可能得到下面的
結(jié)論:”一個選自總體、典型的橫截面”中,壓倒多數(shù)的人選擇了"樂意”。為了具有說服力,
你還可以詳細列出這個比例,直至最后一位小數(shù)。事實上,大多數(shù)持否定意見的人,已經(jīng)隨
手將你的問卷丟進最近的紙簍中,從樣本中自動除名了。哪怕最初的樣本中,10個里面有9
個會當這種''投手",在宣布你的結(jié)果時,你仍然會遵從慣例,忽略他們。
現(xiàn)實生活中,樣本會按照上述方式變得有偏嗎?相信我,一定會。
不久前,報紙和新聞雜志上報道:近10年來美國大約有400萬名天主教徒變成了基督
教徒。資料來源于由丹尼爾?A.波林(DanielA.Poling)牧師主導的調(diào)查,丹尼爾?A?波
林是教派組織《基督教先驅(qū)報》(ChristianHerald)的編輯?!稌r代》(Time)雜志描述
了整個故事的梗概:
“通過對全美基督教牧師的橫截面展開調(diào)查,《先驅(qū)報》得到了調(diào)查結(jié)果。調(diào)查共發(fā)出
25000份問卷,其中2219名牧師反饋回了問卷,回收的問卷顯示:在過去10年里共有51361
名原羅馬天主教徒變成了基督教徒。根據(jù)樣本推算,波林得到了全國范圍的估計:近10年
來全美共有4144366名天主教徒改變信仰,變成了基督教徒。主教威爾?奧斯勒(Will
Oursler)寫道:'即便考慮到誤差,全美范圍內(nèi)這一數(shù)據(jù)也不可能少于200萬或者300萬,
而且很有可能接近500萬。
雖然《時代》沒能指出真相的關(guān)鍵之處,但是它卻使我們了解到被調(diào)查的牧師中超過
90%的人沒有回答,這已經(jīng)值得我們向它鞠躬表示敬意了。為了徹底破壞調(diào)查結(jié)果的可信度,
我們只需要指出:這個“500萬〃是不可靠的,因為調(diào)查中有高達90%的牧師沒有發(fā)表看法,
或許他們中大多數(shù)都早已將調(diào)查問卷投進了紙簍。
根據(jù)以上判斷,我們利用管轄范圍內(nèi)所有牧師人數(shù),即181000人一該數(shù)據(jù)就是波林博
士計算時所采用的數(shù)據(jù)一進行自己的推算。由于從181000名牧師中抽取了25000人接受調(diào)
查,得到了改變信仰的教徒為51361人,如果調(diào)查全部牧師,轉(zhuǎn)變信仰的總?cè)藬?shù)應該約為
370000人。
我們這種粗糙的方法產(chǎn)生了一個十分可疑的數(shù)據(jù),但是它至少與那個在全國范圍發(fā)布的
數(shù)據(jù)一樣"可靠",而后者卻是前者的11倍,是的,300萬看上去更加令人歡欣鼓舞些。
至于奧斯勒先生充滿自信的那句話”考慮到誤差",好吧,如果他發(fā)現(xiàn)了一種方法足以彌
補未知量所帶來的誤差,那么整個統(tǒng)計界都將會為之感激涕零。
在上述背景下,讓我們來研究一則以前的新聞報道:“1924級的耶魯畢業(yè)生平均年收入
為25111美元”,要知道幾年前的錢是更值錢的。
好家伙,他們干得真不賴!
可是,等一等,這個令人印象深刻的數(shù)字到底意味著什么?是否像表面看到的那樣,足
以證明如果你把你的男孩送進耶魯大學,或者牛津大學,那么在年老時,你就不需要辛苦地
上班,甚至他將來年老時也不用上班?
在充滿懷疑的驚鴻一瞥后,關(guān)于該數(shù)字的兩個疑點凸現(xiàn)出來:它驚人的精確;它大得令
人難以置信。
對一群相隔千山萬水的人,了解他們的平均收入,而且竟然精確到以元為單位,這幾乎
不太可能。就算是自己去年的收入,除非全部來自薪水,否則也很難知道得如此準確。但是
對于年收入25000美元的階層來說,投資渠道更廣,因此他們的收入不可能完全來自于薪水。
而且毫無疑問,這個可愛的平均數(shù)出自耶魯人之口。即使1924年他們在紐海文譯者注:
紐海文是美國東北部康涅狄格州的一個城市,耶魯大學就坐落在這個城市。接受過優(yōu)良的教
育,也很難保證四分之一個世紀后,他們還能堅持說真話。當問及收入時,有些人出于虛榮
或者天生樂觀而夸大數(shù)據(jù);有些人卻故意縮小數(shù)字,特別當涉及征所得稅問題時,往往會猶
豫不決,生怕與其他文件填報的數(shù)據(jù)不符,誰知道稅務員又看到了什么?這兩種趨勢一夸大
與縮小,也許將相互抵消,但這種可能性很小。一般而言,一種趨勢總會強于另一種,但我
們很難猜測哪種趨勢將勝出。
我們試著來解釋這個數(shù)字,單憑常識就知道這個數(shù)字與現(xiàn)實出入很大?,F(xiàn)在,讓我們找
找最大誤差的可能來源。是什么使那些實際上收入也許只有25111美元一半的人們最終會擁
有如此豐厚的平均收入?讓我們來揭開這神秘的面紗。
可以肯定的是:耶魯畢業(yè)生的報道基于對某個樣本的分析,因為常識告訴我們,沒有
人能夠掌握所有仍在世的1924級學生的情況,25年后,他們中的許多人已經(jīng)消失在茫茫人
海中。
并且,在那些能夠取得聯(lián)系的人中,許多人根本不會回答問卷,特別是一個涉及隱私的
問卷。一般情況下,郵寄問卷的回收率達到5%?10%就已經(jīng)相當可觀了。也許這個調(diào)查的回
收率會高些,但也不可能達到100%。
因此,這個收入數(shù)據(jù)建立在一個樣本之上:由能夠取得聯(lián)系并愿意回答問卷的耶魯學生
組成。那么,這個樣本的代表性強嗎?也就是說,能否假設樣本與未被樣本包括的那些人一
無法聯(lián)系的人或者不愿意回答的人一具有同等的收入水平?
那些在耶魯大學畢業(yè)生通訊錄上被注明"地址不詳"的迷路小羊羔是誰呢?他們是高收
入階層嗎?華爾街的金融家、公司領(lǐng)導層,亦或是制造企業(yè)或公用事業(yè)的總裁?不,要找到
富人的地址根本不難。這個班級最顯赫的人,即使忽略了與校友辦公室聯(lián)系,他們的地址也
可以通過查《美國名人錄》(Who?sWhoinAmerica)或其他參考資料找到。因此,我們可
以較合理地推測,那些被遺漏的人在獲取耶魯文學學士以后的25年間,他們沒能實現(xiàn)自己
光輝夢想,他們是小職員、技工、流浪漢、失業(yè)的酒鬼、僅僅得以糊口的作家或藝術(shù)家……
將六七個甚至更多這種人的收入相加才可能達到25111美元。他們不會在班級的聯(lián)誼會上注
冊,僅僅是因為他們支付不起路費。
又是誰會將調(diào)查問卷丟進最近的廢紙簍?我們不太肯定,但是猜想他們中大部分人并沒
有賺到足以炫耀的數(shù)目。他們的心態(tài)有些類似于第一次拿到工資的小職員,當他發(fā)現(xiàn)工資支
票上粘著一張小紙條,建議保密工資并不要將工資作為與同事的談資時,“別擔心,”他對老
板說,"我與你一樣,對這么低的工資感到羞愧。”
很明顯,樣本遺漏了可能降低平均收入的兩類人。讓我們見識一下25111美元的廬山真
面目:如果它是一個真實的數(shù)據(jù),它也僅僅代表了1924級耶魯學生中能夠聯(lián)系上的,并愿
意站出來說出收入的一個特殊群體。當然,它的真實性還需要滿足這個假定:這些紳士們說
的都是真話。
二、內(nèi)在有偏樣本的危害
我們能否過于輕率地做出這樣的假定呢?來自抽樣理論的一個分支,即市場研究的經(jīng)驗
告訴我們,人們會說真話的假定往往是不可靠的。以前曾經(jīng)做過一項了解雜志讀者閱讀量的
上門調(diào)查,其中的一個主要問題是:‘‘你和你的家人閱讀什么雜志?“當將調(diào)查結(jié)果制表并分
析后發(fā)現(xiàn):喜歡《哈潑斯》(Harper's)雜志的人相當多,這本雜志如果不能說是曲高和寡,
但至少也是品位不俗;而喜歡《真實故事》(TrueStoiry)----本定位大眾化雜志的人就不
多了。但是幾乎同時期的、由出版商提供的數(shù)據(jù)很明顯地顯示出相反的結(jié)果:《哈潑斯》雜
志的發(fā)行量只有幾十萬份,而《真實故事》雜志的發(fā)行量卻多出了百萬份。正如這項調(diào)查的
設計者所疑惑的,也許他們問錯了對象,但這又并不可能,因為上門調(diào)查走訪了美國范圍內(nèi)
各式各樣的居民區(qū)。惟一合理的解釋是許多被調(diào)查者,即那些調(diào)查中回答問題的人沒有說實
話,幾乎所有的調(diào)查都無法阻止人們往自己臉上貼金的做法。
最后你將發(fā)現(xiàn),當你想知道到底什么人在讀某本雜志時,詢問是無濟于事的。直接上門
去告訴他們你想收購舊雜志好了,看看他們能提供什么,這樣你才能掌握更多的信息。你只
需要清點一下《耶魯評論》(YaleReviews)和《愛情羅曼史》(LoveRomances)各自的
份數(shù)就夠了。當然,即便采用這種方法也只能說明人們曾經(jīng)買了什么,而不能確定人們讀過
些什么。
同樣,當你下次看到普通美國人(最近,這個詞頻繁出現(xiàn),但大多數(shù)情況下卻是不現(xiàn)實
的)每天刷牙L02次時,雖然這個數(shù)據(jù)是我瞎編的,但它與別人的數(shù)據(jù)一樣好用。請問自
己一個問題:不管是誰,他怎樣才能發(fā)現(xiàn)這個事實呢?在看了鋪天蓋地的、宣傳不刷牙是對
社會冒犯的廣告之后,一名婦女還會向陌生人承認自己不經(jīng)常刷牙嗎?這個統(tǒng)計資料只能對
那些希望了解人們?nèi)绾慰创⒀赖娜瞬庞袃r值,卻根本不能反映牙刷接觸牙齒的頻率。
我們知道,除非在某處安裝了泵站,否則一條河流永遠不可能高于它的源頭。同樣的,
根據(jù)樣本得到的結(jié)論不會比樣本更精確。當數(shù)據(jù)經(jīng)過層層統(tǒng)計處理,最后簡化為一個帶小數(shù)
點的平均數(shù)時,結(jié)論似乎閃耀著精確的光芒,但只要再仔細留心整個抽樣過程,這個光芒就
會消逝。
為了確保結(jié)論有價值,根據(jù)抽樣得出的結(jié)論一定要采用具有代表性的樣本,這種樣本才
能排除各種誤差。這就是耶魯?shù)氖杖霐?shù)據(jù)失真的原因,它也是你在報紙和雜志中讀到的許多
資料根本不值一提的原因。
一位心理醫(yī)生曾經(jīng)寫道:實際上每個人都有點神經(jīng)質(zhì)。暫且不去管這種提法是否破壞了
"神經(jīng)質(zhì)"一詞的含義,我們來看看這個醫(yī)生的樣本,也就是說,他觀察了哪些人才得到了上
述結(jié)論?事實上,他是在對他的病人進行研究后才得到了這個發(fā)人深省的結(jié)論,這和代表全
體人的樣本可差的是十萬八千里。想想看,如果一個人心理健全,他是永遠都不會接受心理
醫(yī)生的治療的。
對你所讀到的東西多思考一下,你將避免接受許多似是而非的結(jié)論。
記住下面這點是有益的:無形的誤差與有形的誤差一樣容易破壞樣本的可信度。也就是
說,即使你找不到任何破壞性的誤差來源,但只要有產(chǎn)生誤差的可能性,你就有必耍對結(jié)果
保留一定的懷疑。事實上誤差總是存在,如果你仍舊半信半疑,想想1948年和1952年的美
國總統(tǒng)大選,它們已足夠證明這一點。(1948年美國選舉時,所有民調(diào)都顯示民主黨的杜
威會獲勝,結(jié)果卻是杜威敗給了共和黨人杜魯門,這是美國歷史上至今最大的“選舉驚奇
1952年美國大選,新聞傳媒普遍看好民主黨競選人史蒂文森,最終共和黨候選人艾森豪威
爾以絕對優(yōu)勢贏得這場選舉。)
更遠的例子可以追溯到著名的《文學文摘》(LiteraryDigest)的慘敗,這件事發(fā)生
在1936年。曾經(jīng)準確預測了1932年美國大選的1000萬個電話用戶和《文學文摘》訂戶,
他們又對1936年的大選結(jié)果進行了預測,他們向那個倒霉的雜志編輯信誓旦旦地保證:蘭
登(Landon)將在競選中脫穎而出,并且與羅斯福(Roosevelt)的所得票數(shù)之比為370:161。
這樣一個久經(jīng)考驗的調(diào)查群體怎么可能產(chǎn)生誤差呢?但的確有誤差,正如后來許多大學論文
和其他史學分析人員所發(fā)現(xiàn)的,1936年就有能力購買電話和訂閱雜志的人并不能代表所有
的選民,至少在經(jīng)濟上,他們是一個極特殊的群體,是有偏的,后來證實他們中的許多人是
共和黨的選民。該樣本選擇了蘭登,而全國選民卻心系羅斯福。
三、隨機樣本的代表性
最基本的樣本是隨機樣本,它是指完全遵循隨機原則從總體中選出的樣本。總體即形成
樣本的母體。把索引卡片文件夾中每隔10個的名字抽出來,從許多紙張中任意抽出50張,
在皮卡迪利大街譯者注:皮卡迪利大街是英國倫敦市一條繁華的街道。每遇見的第20個人
作為訪問對象。(但需要注意的是,在最后一個例子中,總體并不是全世界的人,也不是全
體英國人或者所有舊金山人,而只是當時在皮卡迪利大街上的人。一個進行民意調(diào)查的訪問
員宣稱,她選擇在火車站進行調(diào)查的原因是〃在那里能遇到所有類型的人?!辈贿^,不得不向
她指出的是,某些人比如嬰兒母親的代表性并不足。)
隨機樣本的檢驗方法是:總體中的每個名字或每個事物是否具有相同的幾率被選進樣
本?純隨機樣本是惟一有足夠把握經(jīng)受統(tǒng)計理論審查的樣本。但它也有不足之處,在很多情
況下,獲得這種樣本的難度很大并且十分昂貴,以至于單純考慮成本就會排除它。分層隨機
抽樣是一個更經(jīng)濟的替代品,目前在民意調(diào)查和市場研究等領(lǐng)域中得到了廣泛的應用。
為了獲得分層抽樣下的隨機樣本,你需要將總體按照事先已知的優(yōu)勢比例劃分出不同的
組。這時你就可能遇上麻煩:關(guān)于分組比例的信息可能并不正確。你對訪問員進行指導,以
確保他們調(diào)查到一定數(shù)量的黑人,按照這樣或那樣的比例調(diào)查屬于不同收入階層的人,調(diào)查
一定數(shù)量的農(nóng)民,等等。同時,每一組人中40歲以下和40歲以上的人數(shù)相同。
這聽上去很不錯,但實際上會怎樣呢?在黑人還是白人的問題上,大部分時候訪問員能
夠準確判斷。但在收入分組時,他會出很多錯。至于農(nóng)民,你如何劃分一個在城鎮(zhèn)上班又有
部分時間種地的人?即便是歲數(shù)的問題也會引起差錯,為了確保準確性,訪問員會挑選那些
看上去明顯小于40歲或明顯大于40歲的人進行調(diào)查。在這種情況下,由于缺少40歲左右
的人而導致樣本有偏。你不可能獲得可靠的結(jié)果!
除此之外,你如何在各層內(nèi)部獲得隨機樣本呢?最有效的辦法是準備好每一層內(nèi)部所有
單位的名單,并調(diào)查那些被隨機抽中的單位。當然,這耗資不菲。于是你轉(zhuǎn)而進行街頭調(diào)查,
但由于遺漏了那些窩在家里的人而變得有偏;你在白天挨家挨戶地上門調(diào)查,又把大部分上
班族給弄丟了;轉(zhuǎn)而改成晚上訪問,又忽略了那些看電影和去夜總會的人。
民意調(diào)查最終將演變?yōu)橐粓雠c誤差的持久戰(zhàn)。所有信譽良好的調(diào)查公司始終戰(zhàn)斗在第一
線。調(diào)查報告的讀者應謹記這點:這場戰(zhàn)斗永遠不可能取得勝利。在看到"67%的英國人反對
“某事或其他類似的字眼時,應保留這樣一個問題:67%的哪部分英國人?
阿爾弗雷德?金西(AlfredC.Kinsey)博士近期出版的《男性卷》和《女性卷》
也存在這個問題。書中的人雖然已經(jīng)證實了是不折不扣的新潮人物,但是由于抽樣過程與隨
機抽樣實在差得太遠,調(diào)查結(jié)果仍然受到了質(zhì)疑。抽樣名單包含了太多接受過大學教育的人
(女性中該比例達到75%)和服刑人員,這已經(jīng)夠糟糕的了,但是更嚴重的缺陷是樣本極有
可能嚴重偏向于有自我宣傳性行為傾向的人,而且人們很難察覺到這個缺陷。當談論的主題
與性有關(guān)時,那些沉默寡言的、對著滿懷希望的訪員說不,并對于那些將自己從樣本中淘汰
出局的人,他們與主動站出來說出全部的家伙在性行為上存在很大的差異。
布魯克林學院(BrooklynCollege)的A?H?馬斯洛夫(A.H.Maslow)所作的一項
研究表明:上述推斷不僅僅是猜測。他的研究樣本中包括了許多女學生,后來她們都主動參
加了金西博士的訪談。馬斯洛夫發(fā)現(xiàn):一般而言,這些女孩子在關(guān)于性的問題上觀念更開放
而且有更多的經(jīng)歷。
當我們閱讀金西的書,或者閱讀任意一個近期關(guān)于性行為的研究成果時,關(guān)鍵的問題在
于如何理解它,才能避免學習到一些根本就不是那么回事的東西。在任意一個基于抽樣的研
究中,這個問題都十分嚴重,當你將你的"大部頭”或者主要的研究報告采用通俗的手法進行
概括時,這個問題會更加嚴重。
首先,在與金西相類似的工作中,至少包含了3次抽樣。正如以前所指出的,從總體中
抽出的樣本(第一次抽樣)遠不能稱為隨機抽樣,因此可能對所有的總體都不具備顯著的代
表性。同樣重要的是,我們還需要了解到:任何一個調(diào)查問卷都只不過是所有相關(guān)問題的樣
本(第二次抽樣)?而紳士或者女士們所給的答案也只不過是他(或她)關(guān)于每個問題的態(tài)
度或者經(jīng)歷的樣本(第三次抽樣)。正如在其他調(diào)查中發(fā)現(xiàn)的那樣:由哪些人組成調(diào)查人員
會對結(jié)果產(chǎn)生有趣的影響,金西的調(diào)查也可能如此。二戰(zhàn)期間,美國民意調(diào)查中心(The
NationalOpinionResearchCenter)派出了兩組調(diào)查人員對某南方城市的500名黑人進行
提問,問題只有3個。一組調(diào)查人員由白人組成,另一組是黑人。
其中一個問題是:”如果日本占領(lǐng)美國,你認為黑人的境況會得到改善還是變得更糟?”
黑人組成的調(diào)查組,9%的被調(diào)查者回答"變好",而白人調(diào)查組該比例只有2虬回答"變壞"
的比例也不相同,黑人調(diào)查組只有25%,而白人調(diào)查組則達到45樂
用"納粹分子"替代"日本”,兩組的結(jié)果大體相同。
第三個問題試圖探測被訪者的真實態(tài)度,這種態(tài)度以前兩個問題所表現(xiàn)出來的感受為基
礎(chǔ)?!蹦阏J為目前致力于打敗軸心國(theAxis)比在國內(nèi)進一步推進民主更重要嗎?"在
黑人組成的調(diào)查組中,選擇“打敗軸心國''的比例是39%,而白人組成的調(diào)查組則是62%。
這是由莫名因素造成的誤差,恐怕其中最重要的因素是被調(diào)查者迎合對方說好話的傾
向,當我們在閱讀調(diào)查結(jié)果時必須考慮到這一點。在戰(zhàn)爭時期回答一個暗含是否忠誠的問題
時,一個南方黑人對白人說了一些聽起來不錯但并不代表他真實想法的話,這不是很正常
嗎?當然,區(qū)別的起因也可能在于不同的調(diào)查人員選擇了不同的對象進行交談。
在上述例子中,結(jié)果如此明顯有偏而導致毫無價值。你可以試著自己分析還有多少民意
調(diào)查的結(jié)論,雖然并無有效的方法揭露它們,但卻同樣有偏,同樣無價值.
一般而言,民意調(diào)查都帶有一定方向的誤差。就像前文所舉《文學文摘》例子的偏差一
樣,如果對此表示懷疑,你還可以找到許多恰當?shù)睦觼碜C明。在《文學文摘》的例子中,
與希望代表的全體選民相比,由于偏向了比平均選民收入更高、受過更多教育、信息面更廣、
反應更快、舉止優(yōu)雅、行為保守、更多固定習慣等特點的群體,而產(chǎn)生了誤差。
為什么會這樣呢?下面的例子將有助于你理解這一點。假設你是一個被分配到街道某個
角落進行調(diào)查的人員,有兩個看上去符合調(diào)查要求的人一年齡大于40歲的黑人農(nóng)民一向你
走來,一個人穿著干凈制服,上面打著整齊的補丁,感覺整潔清爽,而另一個人看上去骯臟、
態(tài)度粗暴。為了完成工作,毫無疑問你會向更加符合要求的人走過去,而遍布城市其他角落
的你的同事也會做出同樣的抉擇。
一些反對民意調(diào)查的最強烈的情緒來自于自由主義者或是左翼集團,他們普遍認為這些
調(diào)查都是人為操縱的。這種觀點背后的事實是:民意調(diào)查結(jié)果經(jīng)常與那些思想開放人士的觀
點和意愿不相符合。他們指出,民意調(diào)查的結(jié)果選擇了共和黨人,但不久之后選票者卻做出
了相反的選擇。
但實際上,正如我們前面所看到的,民意調(diào)查并不一定是被操縱了,也就是說,并不一
定要為了制造假象而惡意扭曲結(jié)果。樣本有偏的趨勢本身就可以自動地操縱結(jié)果,使其變得
扭曲。
案例二:精心挑選的平均數(shù)
一、千萬問清哪一個平均數(shù)
我相信你不是一個勢利小人,而我也并不做房地產(chǎn)生意。但請讓我們作這樣的假定,并
且假設,此刻你正在一條我熟知的街上看房子。對你的情況進行了初步判斷后,我巧舌如簧、
費盡心思地讓你相信附近居民的平均年收入大約有10000英鎊。也許這堅定了你要在此居住
的信心,不管怎樣,買賣最終成交了,那美妙的數(shù)字也被牢記在你的腦海。而且,既然你已
經(jīng)買下了房子一你有那么一點勢利,當與朋友聊天時,你就會不經(jīng)意地流露出你居住的地點:
我住在一個相當棒的高收入小區(qū)。
一年左右過后,我們又見面了。作為某納稅者委員會的成員,我正在四處奔走,為降低
稅率、降低財產(chǎn)估價,或降低公共交通費用而呼吁。我的理由很簡單,我們支付不起各種上
漲的費用,畢竟,附近居民的平均年收入只有2000英鎊。也許你會加入到我們委員會的工
作中來一你不僅勢利,而且還挺吝嗇。但是,當聽到那可憐的2000英鎊時,你也禁不住大
吃一驚。到底是我現(xiàn)在撒謊了呢?還是一年前撒了謊?
其實這兩次你都無法怪罪于我,利用統(tǒng)計撒謊的妙處被展現(xiàn)得淋漓盡致。無論是10000
英鎊,還是2000英鎊,它們都是正規(guī)的平均數(shù),計算方法也完全正確。兩個數(shù)字都基于相
同的數(shù)據(jù),來自相同的居民,根據(jù)相同的收入。所有都是相同的,但顯然其中有一個數(shù)據(jù)令
人誤解,足以與彌天大謊相媲美。
我的花招就是兩次分別使用了不同的平均數(shù),"平均數(shù)”這個詞寬泛的涵義幫了大忙。當
一個家伙希望用數(shù)據(jù)影響公眾觀點,或者向其他人推銷廣告版面,平均數(shù)便是一個經(jīng)常被使
用的伎倆,雖然偶爾是出于無心,但更多的時候是明知故犯。所以,當你被告知某個數(shù)是平
均數(shù)時,除非能說出它的具體種類一均值,中位數(shù),還是眾數(shù),否則你對它的具體涵義仍知
之甚少。
在希望數(shù)值較大時,我使用的10000英鎊是均值,也就是附近居民收入的算術(shù)平均數(shù)。
你只要將所有家庭的收入加起來并除以家庭總戶數(shù)便可得到這種算術(shù)平均數(shù)。數(shù)值相對較小
的是中位數(shù),它告訴我們一半家庭的年收入超過2000英鎊,另一半家庭的年收入不及2000
英鎊。我還可以利用眾數(shù)一所有家庭收入序列中出現(xiàn)次數(shù)最多的那個收入。例如,附近的居
民中年收入為3000英鎊的家庭數(shù)是最多的,那么收入的眾數(shù)就是一年3000英鎊。
在這個例子中,不合適的"平均數(shù)”實際上是毫無意義的,只要碰到關(guān)于收入的數(shù)據(jù),這
種情況就經(jīng)常出現(xiàn)。還有一個因素會讓我們困惑不已一某種條件下,各種類型平均數(shù)的數(shù)值
十分接近,如果出于一般的目的,根本沒有必要區(qū)分它們。
比方說,當你看到某個原始部落男性的平均身高為5英尺時,你對這些人的外形條件就
能有很好的了解,根本不需要進一步詢問這個平均數(shù)是均值、中位數(shù)或者眾數(shù),因為此時各
種平均數(shù)的數(shù)值大致相等。(當然,如果你正在為非洲人趕制一批制服,那么就需要比平均
數(shù)更多的信息,你要用到全距和標準差,這些我們將在下一章進行介紹。)
在處理諸如人類特征的數(shù)據(jù)時,各種平均數(shù)的數(shù)值十分接近。這些數(shù)據(jù)具有我們常說的
正態(tài)分布的形態(tài)特點,在你用曲線繪制正態(tài)分布時,將看到一根鐘形的曲線,均值、中位數(shù)
和眾數(shù)都落在相同的點上。
在描述人類身高時,用哪種平均數(shù)無關(guān)緊要,但在描述他們的錢袋時,卻并不是那么回
事兒了。如果把某個城市所有家庭的年收入都列出來,你會發(fā)現(xiàn),這些數(shù)從很小的值變動到
很大的數(shù),也許有20000英鎊左右,甚至還能看到少數(shù)巨額收入。年收入低于5000英鎊所
占的比例超過了95%,在收入曲線上朝左邊拖出了一條長長的尾巴。這種分布不再像鐘形一
樣對稱,而是有偏的,它的形狀類似于孩子玩的滑梯,梯子一側(cè)是陡斜地升到頂部,而滑道
一側(cè)則緩慢向下傾斜。均值與中位數(shù)相差甚遠,這樣一來,比較去年的“平均數(shù)”(均值)與
今年的“平均數(shù)"(中位數(shù)),這種比較的有效性就不言而喻了。
二、平均數(shù)的代表性
在我賣給你房子所在的居民區(qū)里,兩個平均數(shù)的差距如此之大,因為收入是顯著偏斜的。
你的鄰居中大多數(shù)都是小農(nóng)、在附近村莊上班的工薪階層或是靠養(yǎng)老金為生的退休老人,但
有3戶鄰居是百萬富翁,他們僅僅是來此度周末。就是這3戶鄰居的收入提高了總收入,相
應地抬高了算術(shù)平均數(shù)。這樣一來,均值達到了絕大多數(shù)家庭遙不可及的水平,幾乎每個人
都低于平均數(shù)。雖然這聽起來像是笑話或者文學修辭,但的確是不爭的事實。
當你聽到公司執(zhí)行總裁或企業(yè)所有者宣稱,在他的企業(yè)中員工的平均收入是多少時,你
應該好好思考一下其中的原因。如果這個數(shù)是中位數(shù),你可以獲得一些顯而易見的信息:一
半員工賺得比它多,一半比它少。但如果是均值(請相信我,沒有確切指出它的種類時,多
半是均值),它僅僅是所有者25000英鎊的高收入與全體工人低水平收入的平均數(shù),根本沒
有什么意義?!逼骄晔杖霝?800英鎊”既隱瞞了1400英鎊的低收入,又隱瞞了所有者以巨
額薪金形式抽取的高額利潤。
這類似于雙人拉鋸一現(xiàn)實情況越糟,看上去卻越好。在一些公司的聲明中也會采用這種
方法。讓我們試著舉個簡單的例子來說明。假設你是某個小型制造企業(yè)的3個合伙人之一。
這是豐收的一年,到了年底,你給企業(yè)的90個職工共發(fā)了99000英鎊,他們的工作是生產(chǎn)、
運輸椅子,或者你所經(jīng)營的任何東西。你和其他合伙人每人各獲得5500英鎊的工資;最后
還余下21000英鎊,作為利潤可供你們3個合伙人平分。你將如何說明這種情況呢?為了便
于理解,你打算采用平均數(shù)的形式。既然所有的職工從事相同的工作,獲得同樣的收入,對
于他們來說用均值還是中位數(shù)沒有區(qū)別。說明如下:
職工的平均工資……1100英鎊
所有者的平均工資及利潤……12500英鎊
看上去太不公平了,不是嗎?讓我們來試試另一種形式:從利潤中拿出15000英鎊以獎
金的形式平分給3位合伙人。這一次將包括了所有者和職工的工資進行平均,不要忘記還是
采用均值,結(jié)果變成:
所有人員的平均工資或薪金……1403英鎊
所有者平均利潤……2000英鎊
哈,看上去好多了吧。雖然還能進一步改善,但這已經(jīng)有了長足的進步,總額中只有低
于6%的部分形成了利潤。如果樂意,你還可以繼續(xù)如法炮制。但不管怎樣,現(xiàn)在的結(jié)果已
經(jīng)足以作為公布的內(nèi)容張貼在公告欄中,或者作為與職工談判的依據(jù)。
因為簡化,這個例子是十分粗糙的。但和以會計的名義所做的手腳相比,它簡直就是小
兒科。從薪水微薄的打字員到領(lǐng)取80萬美元獎金的總裁,在這樣一個等級森嚴的復雜公司
中,所有事情都可用類似的方法進行掩蓋。
因此,當你看到某個平均收入時,首先問問:是什么的平均?包括了哪些人?美國鋼鐵
公司(theUnitedStatesSteelCorporation)曾經(jīng)指出:10年間,該公司職工的平均周
收入攀升了107%。確實如此,但是當你注意到早期的數(shù)據(jù)包括了兼職員工時,奇妙的增長
率會大打折扣。也就是說,如果你某年只工作了半年,而第二年全年都在工作,你的收入毫
無疑問會翻番,但這并不意味著工資率發(fā)生了變動。
你也許曾在報紙上看到過,某年美國的家庭平均收入是6940美元。別太在意這個數(shù)字,
除非你知道這個數(shù)字包括了哪些家庭,以及使用了哪種平均數(shù)。(甚至這是誰說的,他是如
何獲得該信息的以及這個數(shù)的準確性你都要知道。)
上述數(shù)據(jù)來自于普查局(theBureauoftheCensus)。如果手頭有普查局的整篇報告,
你將不費吹灰之力地弄清楚所需要的其他信息。首先,這是個中位數(shù);其次,"家庭"是指兩
個或更多具有親屬關(guān)系的人住在一起所形成的''家庭如果再回過頭讀一下表中的數(shù)據(jù),你
還將發(fā)現(xiàn)這個數(shù)據(jù)建立在抽樣基礎(chǔ)之上,該調(diào)查以19/20的概率保證真實的數(shù)值會落在估計
值加減71美元的范圍之內(nèi)。
類似的概率和誤差范圍構(gòu)成了一個很好的估計。普查工作者掌握了足夠的統(tǒng)計知識和足
夠的財力,如果沒有特殊的企圖,他們能夠?qū)⒊闃友芯拷Y(jié)果控制在較好的精度范圍之內(nèi)。但
并不是所有的數(shù)據(jù)都出自這種嚴謹?shù)沫h(huán)境,也不是所有的數(shù)據(jù)會附上關(guān)于數(shù)據(jù)精確度的任何
說明。在下一章,我們還將展開詳細的分析。
同樣,對《時代》雜志“編者的話”欄目中的某些項目,你會表示懷疑。該雜志這樣描述
他們的新訂戶:"他們年齡的中位數(shù)是34歲,家庭平均年收入為7270美元。"早期關(guān)于"舊
時代”讀者的調(diào)查發(fā)現(xiàn),"年齡的中位數(shù)是41歲……平均年收入為9535美元……”一目了然
的是,為什么兩次談到年齡時都指出采用了中位數(shù),而關(guān)于收入?yún)s不明確平均數(shù)的類型。也
許收入使用的是數(shù)值較大的均值,以達到利用高收入讀者群吸引廣告商的目的。
對開頭所提到的1924級耶魯學生的平均收入,你同樣可以提這樣一個問題:這里用的
是哪種平均數(shù)?
案例三:2008年上海畢業(yè)生月工資中位數(shù)2783元
當前即將進入畢業(yè)生求職高峰,為給用人雙方合理確定工資水平提供參考?,上海市人力
資源和社會保障局對2008年畢業(yè)并從事工作半年以內(nèi)的畢業(yè)生工資水平進行了調(diào)查,在此
基礎(chǔ)上,發(fā)布了畢業(yè)生工資指導價位。本次調(diào)查范圍涵蓋研究生、本科、大專、中職等各學
歷層次畢業(yè)生。
一、畢業(yè)生工資增幅減緩
2008年,畢業(yè)生月工資中位數(shù)為2783元,比上年增長11.7%,但增幅較上年(18.3%)
回落了6.6個百分點;高位數(shù)為6328元,增長4.4%,增幅回落1.8個百分點;低位數(shù)為1426
元,增長5.7%,增幅回落1.6個百分點??梢?,畢業(yè)生工資水平雖然繼續(xù)保持增長,但增
幅出現(xiàn)了回落。這主要是受去年下半年以來的金融危機影響,部分企業(yè)生產(chǎn)經(jīng)營壓力增大,
在招聘新進員工時加強了人工成本的控制和管理。
二、多數(shù)月薪1501-2500元
2008年,月工資在1500元及以下的畢業(yè)生占7.1%,1501-2500元的占38.9%,2501-3500
元的占26.5%,3501-4500元的占14.7%,4501元及以上的占12.8%。可見,對于剛工作半
年以內(nèi)的畢業(yè)生來說,其工資主要集中在1501-2500元,其次是2501-3500元,兩者合計占
到65.4%o
三、各學歷工資差距縮小
從各學歷層次看,2008年,月工資中位數(shù)最高的是研究生,為4634元;其次是大學本
科,為3000元;第三是大專(含高職),為2237元;第四是中職(含中專、技校、職校),
為2013元;各學歷層次畢業(yè)生的月工資中位數(shù)差距比例為2.3:1.5:1.1:1,而上年為2.7:
1.5:1.2:1o
可見,在影響畢業(yè)生工資水平上,雖然學歷仍是重要因素之一,但各學歷層次畢業(yè)生的
工資差距有所縮小.這反映出,企業(yè)在看重學歷的同時,更看重實際工作能力。
四、薪酬行情
1、建筑行業(yè)畢業(yè)生工資增長
受金融危機、消費需求下降、企業(yè)生產(chǎn)經(jīng)營壓力大等影響,汽車制造、對外貿(mào)易、住宿
餐飲等行業(yè)的畢業(yè)生工資水平有所下降。如,汽車制造業(yè)中,車輛零部件設計人員和汽車電
機電器設計人員的月工資中位數(shù)為3464元和3778元,分別比上年下降了4%和19.7%;對外
貿(mào)易行業(yè)中,進出口業(yè)務人員的月工資中位數(shù)為2414元,下降了13.9%,住宿餐飲行業(yè)中,
總臺管理員和餐飲服務員的月工資中位數(shù)為1600元和1750元,分別下降了2.7%和7.8%。
但與此同時,為應對金融危機影響,本市出臺了各項促進經(jīng)濟發(fā)展的措施,特別是加強
了基建投資,以加快城市各類基礎(chǔ)設施的建設。
因此,從工資水平看,建筑行業(yè)的畢業(yè)生工資水平有所增長。如,建筑設計工程技術(shù)人
員的月工資中位數(shù)為2538元,比上年增長8.1版土木建筑工程技術(shù)人員為2220元,增長
12.9%;給排水工程技術(shù)人員為2100元,增長15.3%。
2、生產(chǎn)技能崗位工資上升
在就業(yè)形勢嚴峻的情況下,由于一般管理和銷售類崗位的就業(yè)“門檻”較低,畢業(yè)生往
往爭相應聘,因此企業(yè)選擇余地較大,對于一些供大于求的崗位,提供的工資水平不高,且
出現(xiàn)了一定下降。如,前臺服務接待的月工資中位數(shù)為1793元,比上年下降了5.4%;銷
售助理為2000元,下降17.4%;采購助理為2546元,下降3.1機
而既注重專業(yè)知識又強調(diào)動手能力的生產(chǎn)技能崗位,是企業(yè)生產(chǎn)經(jīng)營中不可或缺的基礎(chǔ)
性崗位,因此依舊受到市場青睞,其工資水平不低且有一定增長。如,沖壓工的月工資中位
數(shù)為3024元,比上年增長17.1%;機修工為2619元,增長9.5%;焊工為2483元,增長14%;
數(shù)控機床工為2338元,增長10.4%o
案例四:當代女性其實蠻幸福
隨著社會變遷,女性的社會角色正發(fā)生著翻天覆地的變化,由傳統(tǒng)相夫教子轉(zhuǎn)變成
具有獨立精神和獨立能力的現(xiàn)代女性,既要做溫存善良呵護家人的妻子和母親又要做拼搏進
取的職場戰(zhàn)士。女性在努力尋找平衡支點的同時,她們對婚姻中的信任感如何評價?什么是
她們最重要的幸福感源泉?擇偶時她們會重視哪些標準?職場中,她們?nèi)绾谓o自己的角色打
分?又有哪些人際關(guān)系讓她們頭疼?日前零點研究咨詢集團與新浪聯(lián)合進行的女性調(diào)查結(jié)
果顯示:家庭中,女性對婚姻中的信任感評價較高,她們的幸福感來源隨著結(jié)婚生子逐漸轉(zhuǎn)
移;擇偶時,無論男性還是女性中都一致認同“性格脾氣”是自己重點關(guān)注對方的方面,此
外,“郎財女貌”經(jīng)典搭配標準仍未改變;在多重身份中,女性對自我的職業(yè)身份評價最高,
但她們坦言同性間職場關(guān)系難于處理。
本次調(diào)查為網(wǎng)絡調(diào)查,從2009年3月11日11時起至3月13日18時,共回收有
效問卷2,993份,其中女性用戶2,612、男性用戶381;18歲以下41人、19-25歲之間
800人、26—35歲之間1,445人、36-45歲之間533人、46歲以上的參與人數(shù)為154人。
一、兩性關(guān)系信任感較高,幸福感來源隨結(jié)婚生子逐漸轉(zhuǎn)移
女性在兩性關(guān)系中的信任感較高:78.6%的已婚女性認為自己和配偶之間相互信任
(包括非常信任和比較信任);62.9%的未婚女性認為自己和男友之間相互信任。隨著年齡
的增長,兩性之間的信任感有一定程度的上升,19至25歲的女性對兩性信任度評價得分為
3.75分(按5級量表得分衡量,5分表示非常信任,1分表示非常不信任),36至45歲的
女性兩性信任度升至3.99分,56至65歲的女性則達到4.11分。少年夫妻老來伴,一方面
老年夫妻相濡以沫,在人生路程上互相照顧、生活習慣上相互磨合,有助于年長伴侶雙方信
任感的增加;另一方面,現(xiàn)實社會誘惑太多,婚外戀、一夜情等不斷考驗新婚夫婦的信任感。
隨著結(jié)婚、生子,女性的幸福感來源逐漸轉(zhuǎn)移:對于未婚且沒有孩子的女性而言,
父母是她們最重要的幸福感來源,48.2%的未婚女性認為父母讓自己最大限度地體驗過幸福;
其次,有27.3%的未婚女性選擇了男朋友。而41.8%的已婚但沒有孩子的女性則選擇了“丈
夫”。對于已婚并有孩子的女性來說,則有超過5成的受訪者認為“孩子”讓她們體驗了最
大限度的幸福。
附圖誰讓您最大限度地體效過幸福?
麥料來源:2009年3月份零點研究咨詢集團與新浪聯(lián)會進行的女性網(wǎng)絡調(diào)查.
二、個性是擇偶最受關(guān)注的得分點,女性重“財”男性重“貌”
擇偶時,無論男性還是女性中都有超過6成的受訪者認為“性格脾氣”是自己重點
關(guān)注對方的方面,其次為“道德品質(zhì)”,分別有54.6%的男性和50.1%的女性選擇了此項。
同時,男性和女性在擇偶標準上也表現(xiàn)出一定的差異性:男性更重視“外表長相”,48.3%
的男性承認自己會重點關(guān)注這個方面,高于女性31.6個百分點;而女性更重視男性的“家
庭責任感”、“經(jīng)濟狀況”以及是否有“事業(yè)心”,分別有48.5樂35.2%和36.3%的女性認
為自己會重點考察男性的這三個方面,“郎財女貌”經(jīng)典搭配標準仍未改變。
相對來說,年輕女性(25歲及以下)更看重男方的“性格脾氣”、是否有“事業(yè)
心”以及他們的“經(jīng)濟狀況”,分別有63.03%、40.83%和39.45%的年輕女性認同這些擇偶
標準,明顯高于46歲以上的女性(45.61%、40.83%和39.45%);年紀較大的則更看重配偶
的“健康狀況”,44.74%的46歲以上的女性重視此項,分別高于25歲以下的女性和26-35
歲女性22.25和14.78個百分點。
附圖找配偶時,重點關(guān)注對方哪些方面的情況?
資料來源:2009年3月份零點研究咨詢集團與新搬金:進行的女性網(wǎng)絡調(diào)查.
三、女性對自己職業(yè)身份評價最高,職場人際關(guān)系“同性相斥”
人有多重身份,當被要求對于“員工(或?qū)W生)”、“女兒”、“女朋友”、“妻
子”以及“母親”這五種身份的合格程度自我評分時,女性對自己職場身份的合格程度評價
最高,達3.94分(按5級量表得分衡量,5分表示非常稱職,1分表示非常不稱職)。其中,
70.5%的女性認為自己作為員工或?qū)W生是稱職的(包括非常稱職和比較稱職)。
無論男性還是女性都一致認同“職場中同性間難打交道”,認為與“女上司、女同
事”這兩種人難處理關(guān)系的女性均明顯多于男性:28.6%的女性認為與女上司不好相處,但
持此種觀點的男性為14.7%;27.9%的女性認為與女同事不太容易搞好關(guān)系,高于男性11.9
個百分點。同樣,認為與男上司、男同事、男下屬難打交道的男性也明顯多于女性??梢?
人際關(guān)系中“同性相斥、異性相吸”的定律仍發(fā)揮著作用。
資料來源:2009年3月份零點研究咨詢集團與新溟肽盒進行的女性網(wǎng)絡調(diào)查.
社會發(fā)展至今,女性的社會角色仍在家庭內(nèi)外搖擺不定,她們面臨著前所未有的壓
力。女性通過不斷調(diào)整自我心態(tài),努力面對多重角色的挑戰(zhàn),逐漸成為工作中的鏗鏘玫瑰、
家庭生活中的溫馨康乃馨。社會在不斷對女性提出新要求的同時,也需要給她們更多的關(guān)愛。
案例五:毫無意義的工作
一、樣本精確性問題
喬賽亞?斯坦普爵士(SirJosiahStamp)曾經(jīng)描述過這樣一個場景:倫道夫爵士(Lord
Randolph)正在檢查一份稅收報告,私人秘書站在他的身后,當看到與去年同期相比海關(guān)稅
收增加了34%時,倫道夫感到很滿意。
秘書馬上糾正他,指出增長率只不過才.34雙
“這有什么區(qū)別?"倫道夫爵士問道。
當聽到一個數(shù)值是另一個的100倍時,倫道夫說:“我以前經(jīng)常可以看到位于數(shù)字前的
小數(shù)點,但是直到現(xiàn)在我才真正知道它們的作用?!?/p>
在比較考試成績時,不單單是小數(shù)點,甚至其他一些討厭的細微差異也會突然冒出來給
大家造成困擾。為了舉例說明,只要你不介意,我們將賦予你兩個孩子,順便給他們起了很
時髦的名字。如同許多受教育的孩子一樣,彼德(Peter)和琳達(Linda)接受了智力測試。
現(xiàn)在任何形式的智力測試都有點原始伏都教(伏都教:又譯巫毒教,源于非洲西部,是糅合
祖先崇拜、萬物有靈論、通靈術(shù)的原始宗教。)盲目崇拜的味道,因此你費了不少口舌來打
聽測試的結(jié)果,這個信息是保密的,一般只有心理學家和教育者才知道,或許這樣是對的。
但不管怎樣,你還是通過某種方式探聽到:琳達的智商(IQ)是101,彼德只有98。當然你
很清楚:智商的平均數(shù)是100,即100意味著"正?!?。
哈!琳達是比較聰明的孩子,而且她的智商高于平均水平,彼德則低于平均水平。對此
我們先不進行評論。
任何類似的結(jié)論純粹都是胡說。
為了澄清事實,我們首先必須指出:無論智力測驗測試的是什么,它與我們通常意義上
的智商都不會是一碼事。它忽略了類似領(lǐng)導才能、創(chuàng)造性想象力等十分重要的素質(zhì):它沒有
考慮到社交判斷力以及音樂、藝術(shù)或者其他方面的才能;它無法測試出諸如勤勞、情感平衡
等重要的人格品質(zhì)?最主要的是,多數(shù)情況下學校進行的智力測試都是簡單、低層次的類型,
它們極大程度上依賴于閱讀能力、測驗者反應快慢等因素,不擅長閱讀的人根本沒有拿高分
的希望。
假設我們已經(jīng)意識到了上述問題并達成共識:智力測驗的智商僅僅是一種測量工具,它
測量了人們處理事先準備好的抽象問題的能力,對這些能力我們很難給出確切的定義,哪怕
彼德和琳達所做的是公認最好的智力測驗一修訂的斯坦福-比內(nèi)測驗(一種獨立進行的并且
不需要特別閱讀能力的測驗)。
智力測試只是智力水平的一個抽樣。與其他抽樣結(jié)果一樣,代表智力水平的智商值也具
有統(tǒng)計誤差,這個誤差將用來衡量該數(shù)值的準確度或可信度。
智力測驗類似于估計某塊地玉米質(zhì)量時所做的工作,你在地里四處走動,隨意地到處摘
取一些玉米穗,當剝開并研究了大約100顆玉米穗時,你就能對整塊地的質(zhì)量大致有數(shù)。當
己知兩塊地的質(zhì)量不同,這些信息已經(jīng)足夠?qū)λ鼈兊馁|(zhì)量進行比較了。但如果兩塊地的質(zhì)量
接近,你就得摘取更多的玉米穗,并始終采用某種精確的質(zhì)量標準來給它們劃分等級。
我們可以定量地衡量你的樣本以多大的精度代表總體,那就是:可能誤差和標準誤差。
假設你要完成一項丈量任務,即通過步測柵欄來了解幾塊地的大小。你要做的第一件事
自然是檢查丈量體系的準確性,通過多次步量后量出自認為的100碼,你發(fā)現(xiàn)平均而言有3
碼的誤差。這意味著,有一半的試驗是你離開真實100碼的距離在3碼之內(nèi),而另一半試驗
是你與真實100碼的距離在3碼之上.
這樣一來,在測量100碼時,你的可能誤差是3碼,或者說3%。從此之后,每次被你
步量測出的100碼應該被記錄成100±3碼。
(大多數(shù)統(tǒng)計工作者更傾向于使用另一個類似的誤差度量工具:標準誤差。全部實驗中
將有2/3的試驗落在加減1個標準誤差的范圍內(nèi),而不是剛好1/2的比例,人們還認為標準
誤差的數(shù)學處理更方便。出于分析目的的考慮,在這里我們還是堅持使用可能誤差,并將其
運用到斯坦福-比內(nèi)測試中。)
假設智力測驗的可能誤差為3%,與我們假定的步量任務具有相同的可能誤差。這與智
力測驗的好壞無關(guān),而只是反映了測驗與它所要測試的內(nèi)容具有怎樣的一致性。這樣彼德的
智商更全面的表達是98±3,琳達的智商則是101±3。
這說明彼德的智商以相等的機會落在95~101中任何一點上,并且大于或者小于98的
可能性完全一樣。同樣,琳達的智商落在98?104范圍內(nèi)的可能性也不過50%從中你會很
快發(fā)現(xiàn):有1/4的可能性彼德的智商將超過101,這與琳達的智商低于98的可能性相同。
這樣看來,彼德的智商并不低于而是高于琳達的智商,它們之間還有3分的差距。
我們的結(jié)論是:對待智力測驗以及許多其他類似的抽樣結(jié)果應注意它的范圍。正常的智
商不應該只是100這樣一個數(shù)值,而應是諸如90~110的一個范圍。將處于這個范圍的孩子
與低于或高于此范圍的孩子進行比較時會得出一些有用的結(jié)論。但比較相差不大的兩個數(shù)據(jù)
則毫無意義。你必須在腦中牢記這個加減符號,即使(特別是當)它沒有明確給出。
二、抽樣誤差
在所有抽樣研究中都有誤差,忽略這些誤差將導致一些愚蠢的舉動。那些把讀者調(diào)查
奉若神明的雜志編輯,是因為他們不了解調(diào)查。對于一篇有40%男性讀者喜愛的文章與另一
篇只有35%男性讀者喜愛的文章,他們會刊載更多類似于前者的作品。
對于雜志而言,40%與35%讀者人數(shù)的差異是很重要的,但抽樣調(diào)查形成的差別卻并不
一定是真實的。出于成本的考慮,讀者人數(shù)調(diào)查的實際樣本,特別是已經(jīng)扣除了那些從來不
讀該雜志的人后,也許只有幾百人。對于一本女性雜志,樣本中的男性讀者會很少。當這些
人又根據(jù)他們的回答:〃全部讀了"、“讀了大部分"、”讀了一部分''以及"沒看”這篇文章而被
劃分成四組后,35%男性讀者的結(jié)論也許僅僅建立在幾個人基礎(chǔ)之上。隱藏在這個看似顯著
的數(shù)據(jù)背后的誤差可能會很大,依靠它抉擇的編輯并沒能抓住一根救命的稻草。
為了一個數(shù)學上可論證,但是卻小得沒有意義的差別,人們有時會費盡力氣。這種行為
藐視了一句古訓:只有當差別有意義時才能稱之為差別。我們可以看一個相關(guān)的案例:老黃
金(OldGold)香煙公司利用一個毫無價值的結(jié)論制造了大量喧鬧并大賺了一筆。
故事起源于《讀者文摘》(Reader?sDigest)某編輯的一個偶然想法。該編輯自己抽
煙,而且他并不認為各種品牌的香煙完全相同。他的雜志開始行動起來,聘請了一些實驗室
人員對不同品牌香煙的煙霧展開了分析。雜志刊登了最終結(jié)果,列出每種品牌香煙的煙霧中
尼古丁以及其他有害物質(zhì)的含量。在詳盡的數(shù)據(jù)支持下,該雜志聲明:所有品牌的香煙是一
樣的,無論你吸的是什么牌子的香煙,不會有任何差異。
也許你會認為,對于香煙生產(chǎn)廠商和那些為香煙杜撰嶄新廣告詞的家伙而言,這是一個
有力的打擊,它還將引爆關(guān)于平緩喉痛和對胸部有益的廣告索賠案。但某些人卻有了其他發(fā)
現(xiàn),在一長串具有相同有害物質(zhì)的品牌名單上,總有一個排在最后,這就是"老黃金"牌香煙。
于是,電報漫天飛舞,大幅廣告以最大的字體刊登在報紙上。廣告的標題和副本僅僅提到,
由一家國家級雜志主持的實驗證明"老黃金"牌香煙在不良物質(zhì),以及尼古丁含量方面“排名
最后",任何關(guān)于各個品牌的差異并不顯著的文字甚至是暗示都被省略了。
最后,"老黃金”公司被通知“中止并停止“使用這個具有誤導性的廣告。但這并不要緊,
他們早已獲得了足夠的好處。
案例六:一維圖形的濫用
幾十年以來,我們一直聽到"小人物''這種說法,它其實指的就是我們自己。當人們覺得
這個詞過于卑微后,就改用"普通人",但很快這個提法也被遺忘了。但是“小人物”仍然跟隨
著我們,扮演著統(tǒng)計圖中的角色。
用一個小人來表示成千上萬的人,一個錢袋或一堆硬幣表示一千英鎊或者百萬美金,一
片牛肉表示明年牛肉的供應量,這些都是形象的圖形表達。由于這種圖形非常吸引眼球,所
以可以作為一種有用的工具,但同時它也能搖身一變,成為一個老練、狡猾而且成功的騙子。
形象圖形,又稱為象形圖,它的前身是普通的柱狀圖,在比較兩種或兩種以上事物某個
方面的具體數(shù)量時,柱狀圖是一種便捷常用的方法。但是柱狀圖也具有欺騙性:在描述單一
物體時,柱體改變寬度的同時,長度也發(fā)生變化;在描述三維物體時,物體的體積又不容易
進行比較,以上任何一種情況都提醒我們應該對柱狀圖保留一些懷疑。一個被截短的柱狀圖
與我們曾經(jīng)討論過的被截短的折線圖實乃一丘之貉。柱狀圖通常出現(xiàn)在地理書籍、公司聲明
以及新聞雜志中,也是因為它‘‘迷人"的特性。
如果我想比較兩個數(shù)據(jù),例如英國與羅坦提亞(Rotundia)某工種工人的平均周工資,
假設數(shù)值分別為30英鎊和15英鎊。為了利用它吸引你的注意,我不會僅僅滿足于將數(shù)字打
印出來,而是畫了柱狀圖。(順便提一句,如果你去年為了給游廊做一個新扶手而支付的大
筆工錢,與這的30英鎊不一致的話,請記住你雇用的工人并不是每周都會有這么好的收入。
而且,畢竟這里我也沒有指明使用了哪種平均數(shù)以及是怎樣計算得到的,因此它不值得你去
爭論。瞧瞧,只要你省略了其他一些信息,那么偽裝哪怕是最聲名狼藉的統(tǒng)計資料又是多么
容易呀!也許,你會懷疑我為了舉例編造了這個數(shù)據(jù),但我敢肯定,如果這里用的是29.55
英鎊,你就根本不會有這個念頭。)
這就是柱狀圖,其縱軸的上方注明"英鎊/平均每周"。這是張清楚且忠于事實的圖形,
正如收入是1:2的比例關(guān)系一樣,圖中兩根柱體的比例也是1:2。
然而這張圖形并不吸引你的眼球,不是嗎?我可以用比柱體看上去更像錢的東西一錢袋
來加以改善。一個錢袋表示不幸的羅坦提亞人微薄的收入,兩個錢袋表示英國佬的收入;或
者3個表示羅坦提亞人的每周收入,而用6個表示英國佬的每周收入。不管哪種方式,這種
圖仍然沿襲了真實可信的風格,它不會因為你只是匆忙的一瞥而欺騙你。
我有其他的目的,我希望說明英國工人比羅坦提亞工人的境況好得多,因此15與30
之間的差距渲染得越大,我的論據(jù)就越充分。老實說(當然這種話我并不會真正說出口),
我希望你能從中推斷出什么,或者留下一個夸張的印象,而我又不會因此惹上麻煩。下面介
紹一種方法,這種方法幾乎每天都被用來愚弄人。
我隨手畫一個錢袋用來表示羅坦提亞人的15英鎊,然后再畫一個高兩倍的錢袋代表英
國佬的30英鎊。還是1:2的比例,對嗎?
但是現(xiàn)在卻達到了我所追求的直觀感受一英國佬的收入使得羅坦提亞工人相形見細。
奧妙的關(guān)鍵在于,既然第二個袋子比第一個高一倍,也應該同樣寬一倍,那么占用紙張
的空間就不是2倍而變成4倍。數(shù)字全是2:1,但視覺效果卻是4:1,而在大多數(shù)時候視
覺效果起著決定性的作用。更糟糕的是,既然實際事物往往是三維的,那么第二個袋子還應
該比第一個袋子厚一倍,幾何知識告訴我們:相似物體體積的變化等于任意相似邊長度變化
的三次方。于是,2乘2乘2等于8,如果一個錢袋里有15英鎊,另一個錢袋里面就不僅僅
只裝了30英鎊,而應該是15英鎊的8倍,即120英鎊。
這就是我這富有創(chuàng)造性圖形的威力!明明說的是"2倍”,我卻最終讓你留下了令人震驚
的8倍的印象。
想要怪罪于我,可不是那么簡單,因為我只不過在跟風隨大流。一家新聞雜志的領(lǐng)頭羊
也曾經(jīng)反復使用過類似的錢袋
美國的鋼鐵協(xié)會(theIronandSteelInstitute)也這么做了,不過用的是一對鼓風
爐。他們希望通過圖形顯示20年來鋼鐵產(chǎn)量有了大幅度的提升,說明該行業(yè)表現(xiàn)出色,從
而指出政府的任何干預都是不必要的。暫且不論這個論點多不可靠,然而這么說的好處卻優(yōu)
于圖形的直接表現(xiàn)。表示前10年增產(chǎn)1000萬噸的鼓風爐,其高度僅是表示后10年增產(chǎn)1425
萬噸鼓風爐高度的2/3。但是眼睛看到的兩個鼓風爐,一個卻是另一個的3倍。嘴上說的是
1.5倍,看起來卻是3倍一這就是一維圖形的功勞。
鋼鐵協(xié)會的這個藝術(shù)品還有其他有趣之處。從水平上看,第二個鼓風爐似乎“胖些”,其
寬度與其鄰居的比例失調(diào)。同時,鼓風爐內(nèi)的黑色條塊,代表著熔化的鐵,其長度看上去是
10年前的2.5倍。于是,50%的增長率被畫成了15(?的增長率,除非我和我的尺子都不去考
慮爐子的高度,否則視覺效果又會將其變成1500%的增長率。算術(shù)簡直變成了魔術(shù)。
雖然似乎過于苛刻,但我們還是需要指出,光滑的彩色頁面上同時還提供了一個截短的
折線圖。通過將圖形的下半部分截去,雖然能夠節(jié)省紙張,但是卻夸大了人均鋼產(chǎn)量,使產(chǎn)
出增長速度攀升了兩倍。
有些例子制圖人可以用粗心大意為借口,但就像發(fā)現(xiàn)出納老是少找錢一樣,如果所有的
錯誤都對出納有利,那你就禁不住要懷疑了。
《新聞周刊》曾經(jīng)利用圖形來證明"美國人長壽了”,圖形中有兩個男性圖案,一個代表
1879~1889年間人們的平均預期壽命34歲,另一個代表現(xiàn)代人的平均預期壽命68.2歲。
又是同樣的把戲:一個人是另一個的兩倍高,按此推理,體積或重量的比例應該是8:1。
這張圖形通過夸大事實來達到更好的效果,我把它看成是“新聞炒作”的一種形式,同期雜志
上還有一張被截短的折線圖,十分驚人。
在圖中改變事物的大小還有另外一個弊端。1860年美國只有800萬頭奶牛,而一個世
紀后該數(shù)量超過了2500萬頭。通過畫兩頭奶牛來顯示產(chǎn)量的增長,一頭奶牛是另一頭的3
倍高,當然,這會以我們探討過的方式夸大人們的印象。但是對于一個快速瀏覽內(nèi)容的讀者
而言,這幅圖將產(chǎn)生更加奇特的效果,他可能很容易就得出一個錯誤結(jié)論:現(xiàn)在的牛要比以
前的牛大得多。
將同樣的技巧運用在犀牛上,你會得到下面的圖形。奧格登?納什(OgdenNash)曾經(jīng)
用‘'荒誕的"與"像犀牛一樣的"來押韻,"荒誕"一詞的修飾作用同樣適用于這種方法。
案例七:令人驚奇的圖形
人們對于數(shù)字似乎有一種天生的畏懼,當漢普蒂?湯普蒂(HumptyDumpty)譯者注:
HumptyDumpty在英語俚語中是指“又矮又胖的人充滿自信地告訴愛麗斯(Alice),他
能熟練地駕馭文字時,恐怕沒有多少人能將同樣的自信延伸到對數(shù)字的掌握上。也許早期的
數(shù)學經(jīng)驗對我們造成了心靈的創(chuàng)傷。
不管什么原因,當作者渴望自己的書有人讀,廣告商希望自己的廣告能促進商品的銷售,
出版商希望自己的書或雜志暢銷時,數(shù)字產(chǎn)生了真正的問題。很多情況下,表格中的數(shù)字是
禁用的,而文字又不能達到很好的效果,這個時候解決的方法就只有一種:畫圖。
最簡單的統(tǒng)計圖形是直線類圖形。在顯示趨勢時,直線圖形非常有用。而對于趨勢,人
們總是津津樂道于了解它、發(fā)現(xiàn)它、分析它,甚至預測它?下面,我們將用圖形來顯示國民
收入怎樣在一年內(nèi)實現(xiàn)了10%的增長。
首先,在紙上用相互垂直的直線畫出許多小方格。然后,在橫軸的底部注明月份,在縱
軸旁標上數(shù)字,單位是"十億美元"。在圖中點出每個月的國民收入,再用直線將這些點連接
起來,你的圖形看起來像這樣:
這張圖清晰地顯示了一年來的變化,而且變化是逐月反映出來的。然而畫圖者很快就會
發(fā)現(xiàn),由于圖形縱軸從原點即“0"開始,并且整張圖形是按比例繪制的,雖然看上去的確上
升了10%——個了不起的上漲趨勢,但是卻并不振奮人心。如果你所要做的僅僅是傳遞信息,
那么目的已經(jīng)達到了。但假如你希望利用圖形贏得一場爭論、讓讀者大吃一驚、促使某項行
動,或者向他人推銷貨物等,它就缺乏渲染的效果了。試試把圖形的底部抹去,這樣不是更
好嗎?(如果某個愛挑剔的家伙反對這種有誤導的變動,你可以理直氣壯地指出,這樣做節(jié)
省紙張。)數(shù)據(jù)是相同的,所以圖形也相同,除了圖形給人留下的印象不同之外,沒有進行
任何的偽造。但是粗心的讀
溫馨提示
- 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
- 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預覽,若沒有圖紙預覽就沒有圖紙。
- 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
- 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負責。
- 6. 下載文件中如有侵權(quán)或不適當內(nèi)容,請與我們聯(lián)系,我們立即糾正。
- 7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。
最新文檔
- 硫酸鋅施工單位廉政合同
- 古鎮(zhèn)陶藝店租賃協(xié)議
- 交通運輸行業(yè)人員租賃合同
- 停車場水電布線協(xié)議
- 市政資源拓展房屋拆遷施工合同
- 通信項目經(jīng)理聘用合同年薪制
- 培訓機構(gòu)租賃合同模板
- 商務樓大堂清潔維護協(xié)議
- 食品添加劑廠自來水安裝合同
- 網(wǎng)絡技術(shù)研發(fā)合作協(xié)議
- 2023屆上海市嘉定區(qū)初三中考物理一模試卷+答案
- 中國古典文獻學(全套)
- 業(yè)委會關(guān)于小區(qū)物業(yè)公司解除物業(yè)服務合同的函
- “統(tǒng)計與概率”在小學數(shù)學教材中的編排分析
- xx中心小學綜合實踐基地計劃模板(完整版)
- 安規(guī)考試題庫500題(含標準答案)
- 2022年度個人政治素質(zhì)考察自評報告三篇
- NB∕T 13007-2021 生物柴油(BD100)原料 廢棄油脂
- 肺結(jié)核患者管理結(jié)案評估表
- 2021離婚協(xié)議書電子版免費
- 《班主任工作常規(guī)》課件
評論
0/150
提交評論