統(tǒng)計(jì)數(shù)字會統(tǒng)計(jì)謊言_第1頁
統(tǒng)計(jì)數(shù)字會統(tǒng)計(jì)謊言_第2頁
統(tǒng)計(jì)數(shù)字會統(tǒng)計(jì)謊言_第3頁
統(tǒng)計(jì)數(shù)字會統(tǒng)計(jì)謊言_第4頁
統(tǒng)計(jì)數(shù)字會統(tǒng)計(jì)謊言_第5頁
全文預(yù)覽已結(jié)束

下載本文檔

版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進(jìn)行舉報(bào)或認(rèn)領(lǐng)

文檔簡介

統(tǒng)計(jì)數(shù)字會統(tǒng)計(jì)謊言

在這本書中,只有8萬多字的翻譯成中文,60多萬幅插圖中只有160頁,但在美國50年中傳播開來。在中國出版和出版的那一年,他被評估為“2009年最佳閱讀次數(shù)”之一。它就是美國統(tǒng)計(jì)專家達(dá)萊爾·哈夫(DarrellHuff)在上個世紀(jì)50年代所著《Howtoliewithstatistics》一書,中文譯名《統(tǒng)計(jì)數(shù)字會撒謊》。本書用風(fēng)趣的插圖和通俗的語言把高深的統(tǒng)計(jì)學(xué)寫得像“故事書”一樣精彩。作者重說明、輕證明,重文字描述、輕理論推導(dǎo),并結(jié)合活生生的案例,語言輕松詼諧,揭露了大量的“統(tǒng)計(jì)謊言”。重新設(shè)定是抽煙過分的標(biāo)準(zhǔn),這也是認(rèn)知偏差的原因之一本書一共10章。前九章,作者按照統(tǒng)計(jì)的指標(biāo)、方法等,從九個方面選取大量案例,指出涉及這九個方面的真實(shí)的統(tǒng)計(jì)數(shù)據(jù)所產(chǎn)生的謊言。比如“平均數(shù)”。作者舉例:“你的鄰居中大多數(shù)都是小農(nóng)、在附近村莊上班的工薪階層或是靠養(yǎng)老金為生的退休老人,但有3戶鄰居是百萬富翁,他們僅僅是來此度周末。就是這3戶鄰居的收入提高了總收入,相應(yīng)地抬高了算術(shù)平均數(shù)。這樣一來,均值達(dá)到了絕大多數(shù)家庭遙不可及的水平,幾乎每個人都低于平均數(shù)。雖然這聽起來像是笑話,或者文學(xué)修飾,但的確是不爭的事實(shí)?!庇直热纭皹颖尽薄W髡吲e例:一則新聞報(bào)道:“1924級的耶魯畢業(yè)生平均年收入為25111美元?!痹摂?shù)據(jù)的兩個疑點(diǎn)是(收入)“驚人的精確”和“大得令人難以置信”。再比如“相關(guān)關(guān)系”。作者舉例:有人曾經(jīng)費(fèi)盡周折以探求是否抽煙者的大學(xué)成績比不吸煙者的差,結(jié)果的確如此。這著實(shí)讓一些人高興,從此,他們多次使用這個結(jié)論:在通往好成績的道路上,需要忍受放棄抽煙的痛苦。進(jìn)一步使用該結(jié)論,還有這樣的合理推斷:抽煙使人的頭腦變笨。雖然這是一個古老的謬誤,但是它卻仍頻繁地出現(xiàn)在統(tǒng)計(jì)資料中。它掩飾在一大堆讓人印象深刻的數(shù)據(jù)之中,讓人很難看清其廬山真面目。這個謬誤是:如果B緊跟著A出現(xiàn),那么A一定導(dǎo)致B。上例中,當(dāng)抽煙與低分同時出現(xiàn)時,人們得到了一個無根據(jù)的假設(shè),抽煙導(dǎo)致低分。難道就不能是相反的解釋嗎?也許不理想的分?jǐn)?shù)促使學(xué)生不喝酒而變得愛抽煙。數(shù)字勞工:過多數(shù)據(jù)的競爭作者運(yùn)用統(tǒng)計(jì)學(xué)、邏輯學(xué)、心理學(xué)、社會學(xué)等諸多學(xué)科的原理和思辨方法,深入淺出、鞭辟入里地分析了各種真實(shí)的統(tǒng)計(jì)數(shù)字成為“謊言”的原因。比如“平均值”有幾個具體種類(指標(biāo))——均值,中位數(shù),眾數(shù),各個指標(biāo)的具體涵義不同。當(dāng)被平均的一組數(shù)值呈正態(tài)分布時,均值,中位數(shù),眾數(shù)十分接近,甚至落在相同的點(diǎn)上。而當(dāng)一組數(shù)值呈偏態(tài)分布時,均值與中位數(shù)相差甚遠(yuǎn),使用不當(dāng),就會掩蓋真相,給人以撒謊的感覺。又比如樣本的選取可能“內(nèi)在有偏”。被調(diào)查的“1924級的耶魯畢業(yè)生”是那些“能夠取得聯(lián)系并愿意回答問卷的耶魯學(xué)生”,這些人更可能是畢業(yè)后發(fā)展得比較好,調(diào)查時比較富有的人?!斑@個班級最富有的人,即使忽略了與校友辦公室聯(lián)系,他們的地址也可以通過查《美國名人錄》(who’sWhoinAmerica)或其他參考資料找到。因此,我們可以較合理地猜測,那些被遺漏的人是獲取耶魯文學(xué)學(xué)士學(xué)位之后的25年來沒能實(shí)現(xiàn)自己光輝夢想的人,他們是小職員、技工、流浪者、失業(yè)的酒鬼、僅僅得以糊口的作家或藝術(shù)家……六七個甚至更多這樣的人將其收入相加才可能達(dá)到25111美元,他們不會在班級的聯(lián)誼會上注冊,僅僅因?yàn)樗麄冎Ц恫黄鹇焚M(fèi)。(P8)”由此看來,調(diào)查得到的收入偏高就不奇怪了。再比如“相關(guān)關(guān)系的誤解”。“兩個事物之間的關(guān)聯(lián)關(guān)系并不能用于說明其中一個將引起另一個的變化”,即不構(gòu)成因果關(guān)系。即使構(gòu)成因果關(guān)系,也要留意超過了推斷相關(guān)關(guān)系的數(shù)據(jù)范圍而得出的結(jié)論?!袄鐝某@韥碚f,雨下得越多,谷物則長得越高,收成越多。雨是農(nóng)民的福音。但一季暴雨則可能破壞甚至毀滅莊稼。正相關(guān)到了一定的程度后便急劇地轉(zhuǎn)化為負(fù)相關(guān)。超過了一定的降雨量,雨越多,收成卻越少。”還有,明明沒有能力或證據(jù)證明某事,卻通過使用不完全匹配的資料,解釋其他的事,“并假裝它們是一回事?!北热?“去年因飛機(jī)失事造成的死亡人數(shù)比1910年多,這是否意味著乘坐現(xiàn)代化的飛機(jī)反而更加危險(xiǎn)?這根本是無稽之談,因?yàn)楝F(xiàn)在選擇作為交通工具的人已經(jīng)是以前的幾百倍了?!鄙踔两y(tǒng)計(jì)圖形的畫法,都可以在視覺上有意識地夸大兩個數(shù)據(jù)的對比。在第9章,作者更是全面揭露了人為的“統(tǒng)計(jì)操縱”——利用統(tǒng)計(jì)資料傳遞錯誤的信息而誤導(dǎo)他人?!盀榱耸棺盥暶墙宓慕y(tǒng)計(jì)資料看上去更有分量、更精確,你應(yīng)該考慮使用小數(shù)”,百分?jǐn)?shù)“也能為不確切的事物蒙上精確的面紗”;通過改變基數(shù)使人產(chǎn)生增加折扣的幻覺;投資回報(bào)率由3%到6%,謙虛的描述是“增長了3個百分點(diǎn)”,也可以描述成“增長高達(dá)100%”,等等。作者指出:“統(tǒng)計(jì)工作者經(jīng)常要在許多方法中主觀地選擇一種方法以描述事實(shí)。在商業(yè)活動中,統(tǒng)計(jì)工作者不大可能選擇不利于己的方法”,“即使是學(xué)術(shù)界,學(xué)者也有自己的偏好(可能是無意識的)”,更重要的是“許多統(tǒng)計(jì)資料的歪曲和被控制并不是資深統(tǒng)計(jì)學(xué)家所為,出自統(tǒng)計(jì)學(xué)家之手的完善資料也許最終會被銷售人員、關(guān)系專家、記者或者廣告撰稿人扭曲、夸張、簡化或是刻意地進(jìn)行挑選。”從第9章的敘述風(fēng)格和闡述內(nèi)容看,將書名譯為《如何利用統(tǒng)計(jì)數(shù)字撒謊》似乎更貼切些。實(shí)際上,Howtoliewithstatistics的英文原意確實(shí)如此。這個短語的主語雖然被省略了,但主語顯然不是“統(tǒng)計(jì)數(shù)據(jù)”。畢竟統(tǒng)計(jì)數(shù)據(jù)是客觀的、真實(shí)的,只是它們被人用來撒謊了。資料:可靠的資料《統(tǒng)計(jì)數(shù)字會撒謊》一書所列舉的統(tǒng)計(jì)數(shù)據(jù)撒謊案例多達(dá)近百個,配合案例分析,隨處可見振聾發(fā)聵的警句:“一般而言,民意調(diào)查都帶有一定方向的誤差”;“采用嚴(yán)重有偏的樣本幾乎能夠產(chǎn)生任何人需要的任何結(jié)果”;“只有當(dāng)差別有意義時才能稱之為差別”;“兩個事物之間的關(guān)聯(lián)關(guān)系并不能用于說明其中一個將引起另一個的變化”;“數(shù)據(jù)是真實(shí)的,然而唯一不妥的是依據(jù)這些數(shù)據(jù)和事實(shí)推斷出了一個未經(jīng)證實(shí)的結(jié)論”;等等。著名詞作家閆肅曾經(jīng)為1993年的“3.15打假晚會”寫了一首主題歌《霧里看花》,歌詞中寫到:“借我一雙慧眼吧,讓我把這紛擾看得清清楚楚明明白白真真切切”,《統(tǒng)計(jì)數(shù)字會撒謊》的作者便給讀者提供了這樣一雙“慧眼”:在第10章接連提出5個問題,告訴讀者“怎樣憑雙眼就能識破虛假的統(tǒng)計(jì)資料,并揭開它的老底;同樣重要的是,如何在這一大片充滿了欺騙性的數(shù)據(jù)海洋中找出可靠有用的資料?!眴栴}1:“誰說的?”作者指出:“出于學(xué)術(shù)、名譽(yù)或收入的考慮而需要證明某些結(jié)論的實(shí)驗(yàn)室,希望獲得一篇好報(bào)道的報(bào)界,工資已岌岌可危的工人和管理部門,他們提供的數(shù)據(jù)都有可能產(chǎn)生偏差?!边€要注意:“當(dāng)某個權(quán)威人士被引用時,請弄清楚到底資料的內(nèi)容是權(quán)威的,還是僅僅扯上了權(quán)威人士的大名?!眴栴}2:“他是如何知道的?”要看樣本是否有偏,“由刻意挑選有利的樣本造成有偏?!蓖ㄟ^仔細(xì)的、長時間的觀察,“你就會發(fā)現(xiàn)由于缺乏足夠多的觀測值,報(bào)告的內(nèi)容不足以說服任何人?!眴栴}3:“遺漏了什么?”作者提醒:“數(shù)據(jù)的缺失,特別當(dāng)信息來源于與信息存在利害關(guān)系一方時,已足以使你對整件事情提出質(zhì)疑。同樣,對一個缺失可信度(可能誤差、標(biāo)準(zhǔn)誤差)檢驗(yàn)的相關(guān)關(guān)系也不用太當(dāng)真?!薄坝袝r文章中遺漏了引起變化的原因,這容易讓讀者認(rèn)為其他的因素才應(yīng)對變化負(fù)責(zé)?!眴栴}4:“是否有人偷換了概念?”作者反復(fù)告誡:“請留心從搜集原始資料,到形成結(jié)論的整個過程中,是否存在著概念的偷換?!弊髡吡信e偷換概念的諸多方式:將疾病案例的增多等同于發(fā)病率的上升;兩次普查的對“農(nóng)場”的定義不同;將“相關(guān)關(guān)系”偷換成“因果關(guān)系”;標(biāo)榜自己在某個領(lǐng)域獲得了第一——沒有特別指出是哪個領(lǐng)域。問題5:“這個資料有意義嗎?”作者自信地說:“這個問題通常能將一個偽裝得很好的統(tǒng)計(jì)資料打回原形?!薄霸S多統(tǒng)計(jì)資料一眼就可以看出是有誤的,這是因?yàn)槠婷畹臄?shù)據(jù)與平常的感覺不符。”“你可以通過觀察周圍所認(rèn)識的人進(jìn)行反駁。”“讓人印象深刻的精確數(shù)據(jù)也會與實(shí)際情況相左。紐約的某家報(bào)紙?jiān)?jīng)報(bào)道:研究顯示,一個與家庭住在一起的上班婦女需要40.13美元的日常支出。在讀這張報(bào)紙時,任何人——只要沒有完全喪失邏輯思考能力——就會意識到,物質(zhì)和精神需要的費(fèi)用加在一起是不可能精確到美分的。”對于使用外推法預(yù)測趨勢,作者強(qiáng)調(diào):“到目前為止的趨勢都是事實(shí).而未來的趨勢只不過是受教育者的猜測。該方法暗含‘其他所有條件都相同’,以及‘現(xiàn)有趨勢將繼續(xù)下去’的前提。但實(shí)際上,條件總是在變化的”。有趣的是,作者嘲諷美國歷史上的兩次人口預(yù)測“已經(jīng)變成了全美國人民的笑柄”,這兩次預(yù)測分別低估和高估了美國的人口總數(shù),而做出預(yù)測的分別是由專家組成的總統(tǒng)顧問團(tuán)和大名鼎鼎的總統(tǒng)阿伯拉罕·林肯(AbrahamLincoln)。(P146-P147)統(tǒng)計(jì)數(shù)據(jù)的使用應(yīng)用樣品主要解決了“指標(biāo)出現(xiàn)偏差”或“數(shù)字媒體”美國的《圖書期刊》評價(jià)本書“能給你帶來娛樂,又能引發(fā)思考”。筆者多年從事人口與計(jì)劃生育統(tǒng)計(jì)工作,經(jīng)常與統(tǒng)計(jì)數(shù)據(jù)打交道,既要識別其他部門、機(jī)構(gòu)、人員提供的可能是“謊言”的統(tǒng)計(jì)數(shù)據(jù),又要避免本部門所提供的統(tǒng)計(jì)數(shù)據(jù)被認(rèn)為是“謊言”。要做到后一點(diǎn),難度更大。讀了《統(tǒng)計(jì)數(shù)字會撒謊》,結(jié)合自己的實(shí)踐,梳理幾條感悟:公開透明是謊言的天敵。要證明所提供的統(tǒng)計(jì)數(shù)據(jù)不是“謊言”,就要講清所提供數(shù)據(jù)的基本定義、采集過程、整理方法、推算技巧。這表明數(shù)據(jù)提供者對事實(shí)的尊重和對數(shù)據(jù)使用者的尊重。比如:在公布相對數(shù)時給出相應(yīng)的絕對數(shù),在公布抽樣調(diào)查的推算結(jié)果時給出置信區(qū)間,盡可能地提供原始數(shù)據(jù),等等。尤其應(yīng)說明原始數(shù)據(jù)采集過程中可能產(chǎn)生的調(diào)查誤差,以及調(diào)查的組織者為控制誤差所采取的措施,這樣,即使數(shù)據(jù)的準(zhǔn)確性不夠,至少數(shù)據(jù)的使用者可以了解、分析數(shù)據(jù)的可靠程度和真實(shí)程度(包括其中真實(shí)的誤差)。每個統(tǒng)計(jì)指標(biāo)和相應(yīng)的統(tǒng)計(jì)數(shù)據(jù)都是有具體含義的,一個數(shù)據(jù)的計(jì)算受到諸多條件限制,其作用是有限的。要全面地反映客觀事實(shí),常常要采用多個指標(biāo)和數(shù)據(jù)。正常情況下,如果沒有其他相關(guān)指標(biāo)和數(shù)據(jù)的“呼應(yīng)”,某一個指標(biāo)的數(shù)值的變化就容易被認(rèn)為“有假”。比如:采用平均數(shù)描述全體社會成員收入的增加幅度,由于近年來不同職業(yè)、行業(yè),不同人群收入的絕對差和相對差不斷拉大,處于低收入水平人群的收入增加幅度一定是低于“平均增加幅度”的,這些人理所當(dāng)然地質(zhì)疑“收入增加幅度”的數(shù)據(jù)不正確。因此,就收入增加而言,單一使用平均數(shù)描述全社會成員的收入水平是不夠的,還應(yīng)當(dāng)輔之以其他相關(guān)數(shù)據(jù),如低收入群體的收入增加幅度,低收入群體與高收入群體的收入差距變化等等。在由抽樣調(diào)查數(shù)據(jù)推斷總體參數(shù)的時候需要綜合考慮抽樣方法(samplingmethod)和樣本規(guī)模(samplesize)。從抽樣原理看,二者是決定樣本代表性(samplerepresentativeness)的重要因素。在實(shí)際調(diào)查中,往往受客觀條件的制約,樣本分布很難做到完全合理、隨機(jī),由調(diào)查數(shù)據(jù)推斷總體參數(shù)(指標(biāo))就可能產(chǎn)生一定的偏性。一次綜合性的調(diào)查,往往包含了許多調(diào)查項(xiàng)目,其中有的項(xiàng)目的調(diào)查質(zhì)量好一些,有的質(zhì)量可能差一些,有的指標(biāo)推斷總體的把握度比較大(或者說誤差比較小),而有的指標(biāo)推斷總體的把握度比較小(或者說誤差比較大),應(yīng)具體情況具體分析。比如,人口和計(jì)劃生育部門進(jìn)行生育節(jié)育方面的抽樣調(diào)查,對于生育節(jié)育方面的內(nèi)容最為重視,這方面各項(xiàng)指標(biāo)數(shù)據(jù)的比較準(zhǔn)確,推斷總體把握比較大,而調(diào)查中涉及婦女的民族構(gòu)成、受教育程度、就業(yè)情況等指標(biāo)的準(zhǔn)確性就差一些(在很大程度上,這些指標(biāo)的抽樣誤差本身就比較大),人們可以使用這些指標(biāo)輔助分析生育節(jié)育情況,但用它們來推斷總體的相應(yīng)數(shù)據(jù),誤差就比較大。要正確地使用統(tǒng)計(jì)指標(biāo),合理地應(yīng)用統(tǒng)計(jì)數(shù)據(jù),恰如其分地解釋統(tǒng)計(jì)指標(biāo)和統(tǒng)計(jì)數(shù)據(jù)的含義,不可把一些指標(biāo)的作用過分夸大,或者對某些(哪怕是真實(shí)的)數(shù)據(jù)過分地渲染,否則,就算不是“撒謊”,也難免有“忽悠”的嫌疑。既然統(tǒng)計(jì)數(shù)據(jù)本身存在誤差,即使真實(shí)的數(shù)據(jù)也有可能被“曲解”,政府的公信力和社會的誠信度還有待提高,那么,社會各界從專家學(xué)者到商人學(xué)生,從政府官員到普通百姓,對于反映社會生活的各種統(tǒng)計(jì)數(shù)據(jù)(大多由官方發(fā)布)提出質(zhì)疑(有些質(zhì)疑甚至是相互矛盾的)是很正常的。近些年發(fā)布的不少統(tǒng)計(jì)數(shù)據(jù)與公眾的生活非常密切,卻與公眾的直接感受差距明顯,統(tǒng)計(jì)數(shù)據(jù)因此被詬病,留下“學(xué)生被就業(yè)”、“收入被增長”的笑談。質(zhì)疑反映了公眾對統(tǒng)計(jì)數(shù)據(jù)的關(guān)注,有助于統(tǒng)計(jì)工作的改進(jìn)和完善。作為統(tǒng)計(jì)數(shù)據(jù)的發(fā)布者,應(yīng)理性地看待和回應(yīng)社會上各方面的質(zhì)疑。1992年,當(dāng)時的國家計(jì)生委組織進(jìn)行的全國38萬人生育節(jié)育抽樣調(diào)查的結(jié)果表明,我國婦女的生育率已經(jīng)低于更替水平。這樣“史無前例”的調(diào)查數(shù)據(jù)遭到來自各方的懷疑、

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負(fù)責(zé)。
  • 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時也不承擔(dān)用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

評論

0/150

提交評論