


下載本文檔
版權(quán)說(shuō)明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請(qǐng)進(jìn)行舉報(bào)或認(rèn)領(lǐng)
文檔簡(jiǎn)介
1、統(tǒng)計(jì)陷阱讀后感放寒假前,經(jīng)學(xué)長(zhǎng)的介紹,特地在圖書(shū)館里借了一本統(tǒng)計(jì)陷阱在假期里讀,看完之后的感觸到真不少,而且總想著什么時(shí)候?qū)懸稽c(diǎn)讀后心得之類的東西,無(wú)奈,因?yàn)槎栊?,總是找各種各樣的理由來(lái)推遲。這次還得感謝學(xué)校這個(gè)次機(jī)會(huì),讓我終于可以完成早該結(jié)束的任務(wù)了。先來(lái)談?wù)剬?xiě)這本書(shū)的背景:在20世紀(jì)50年代,美國(guó)出現(xiàn)了一種尊崇統(tǒng)計(jì)風(fēng),太多的人都樂(lè)意,也輕易的相信了那些統(tǒng)計(jì)數(shù)據(jù),原因很簡(jiǎn)單,大多數(shù)的統(tǒng)計(jì)數(shù)據(jù)都可以讓不同的人產(chǎn)生不同的效果。例如,一個(gè)企業(yè)可以讓員工看出今年的效益,同樣的數(shù)據(jù),換一種統(tǒng)計(jì)方法,也可以反映出企業(yè)的不景氣,這就是為什么太多的公司,企業(yè),甚至政府部門(mén)都習(xí)慣用統(tǒng)計(jì)的方法來(lái)傳達(dá)自己的意思。
2、介于這個(gè)背景之下,美國(guó)作家達(dá)萊爾·哈夫以一個(gè)經(jīng)驗(yàn)老道,且退休的竊賊的身份,用回憶錄的形式,在本書(shū)的前八章講述了常用的一些行騙手段,在第九章總結(jié)了前面所列出的所有方法,而在最后一章中,教人們?nèi)绾巫R(shí)破統(tǒng)計(jì)數(shù)據(jù)中的陷阱,告誡人們以一個(gè)正確的態(tài)度去看待一個(gè)數(shù)據(jù),從而不做一個(gè)被數(shù)據(jù)玩弄于手的玩偶。本書(shū)中列舉出的,常用統(tǒng)計(jì)手段大致可分為:利用內(nèi)在有偏樣本,選出不同的平均數(shù),隱藏總要的數(shù)據(jù),忽略必要的誤差,濫用統(tǒng)計(jì)圖形,采用不完整匹配的資料以及誤解相關(guān)關(guān)系等。當(dāng)讀完這本書(shū)時(shí),回過(guò)頭在,如果你用書(shū)中的衡量標(biāo)準(zhǔn)來(lái)看任何一組數(shù)據(jù),都會(huì)發(fā)現(xiàn)其中的不可行性,所有的數(shù)據(jù)都是可以質(zhì)疑的,那么不禁會(huì)有兩種念頭:其
3、一,為什么統(tǒng)計(jì)著要這樣做,公布這樣的數(shù)據(jù)是為什么?答案很簡(jiǎn)單,無(wú)非是利益所趨,商家,政府乃至所有人都想隱藏掉那些自己認(rèn)為很重要的數(shù)據(jù),公諸于世的無(wú)非是想博得同情或者獲得榮耀。其二,這個(gè)世上不就沒(méi)有可以相信的數(shù)據(jù),因?yàn)闆](méi)喲絕對(duì)的正確,那么我們是否就因此而否定自己看到的,聽(tīng)到的一切呢?顯然不是,這本書(shū)最重要的是,教會(huì)我們?nèi)绾握_的看待數(shù)據(jù),正確的從數(shù)據(jù)中拿去自己需要的,不可全信,但不意味著一點(diǎn)也都不可信。在這里,我重點(diǎn)來(lái)談?wù)劊簝?nèi)在有偏樣本,選取不同平均數(shù),采用不完整匹配的資料以及誤解相關(guān)關(guān)系這幾種“行騙手段”。首先說(shuō)說(shuō)內(nèi)在有偏樣本,我用原文中的一個(gè)例子來(lái)解釋這種方法的意思:“1924級(jí)的耶魯畢業(yè)生
4、平均年收入有25111美元。”時(shí)代雜志在評(píng)論紐約太陽(yáng)報(bào)的某篇報(bào)道時(shí)曾經(jīng)指出。 乍眼一看,感覺(jué)耶魯大學(xué)的確是個(gè)很了不起的學(xué)校,那里面的畢業(yè)生都有高質(zhì)量的就業(yè)率。在感嘆之余,細(xì)細(xì)想想,你會(huì)發(fā)現(xiàn)有兩點(diǎn)可以之處:第一,如此的精確;第二,竟然如此的大。那么,這個(gè)精確地個(gè)位的收入是如何得出來(lái)的呢?除非是在保證沒(méi)有外快的情況下,只靠工資條生活的人,他的工資才是有可能精確地個(gè)位的,那么現(xiàn)實(shí)并非如此,越是成功的人,他的工資來(lái)源越是不那么單一。我們都知道,只要樣本足夠大,并且具有代表性,在多數(shù)情況下,樣本的信息可以很好地代表總體。但如果條件不滿足,抽樣的結(jié)果比一個(gè)臆想的結(jié)果好不到哪兒去除了會(huì)形成一種十分科學(xué)精確的
5、虛假印象意外,這種方法分本不值得推薦。然而,令人悲傷的事實(shí)是,在我們看到的或自以為知道的事物中,充斥著許多從類似的樣本,即有偏的或過(guò)小的或兩者都滿足的樣本中得出的結(jié)論。 耶魯大學(xué)的收入同樣也是一個(gè)樣本,但恰恰這個(gè)因?yàn)槭怯刑嗟钠畹???梢钥隙ǖ氖牵瑳](méi)有誰(shuí)可以掌握25年后所以存活的1924屆耶魯大學(xué)生的收入情況。此外,在你可以聯(lián)系得到的人中,能接受問(wèn)卷調(diào)查的人數(shù)是屈指可數(shù)的。在這里,需要提醒大家的是,一般的問(wèn)卷調(diào)查,5%10%的回收率就已是相當(dāng)可觀的了,在加上調(diào)查內(nèi)容的不同,這個(gè)比例還是會(huì)有出入的,但決定不能達(dá)到百分之百。最重要的,并非所有接受問(wèn)卷調(diào)查的人都是可以說(shuō)實(shí)話的。尤其是在工資這種很敏感
6、的話題上。試想想一個(gè)稅務(wù)局的人員來(lái)調(diào)查你的收入情況,你會(huì)如實(shí)回答嗎?我想未必,多數(shù)人都會(huì)盡可能的說(shuō)的小一點(diǎn),畢竟說(shuō)的多了,可能意味著要多交一點(diǎn)稅呢。再有,和同學(xué)聚會(huì)是,看見(jiàn)被人都在侃侃而談,你非但不會(huì)如實(shí)回答自己的工資數(shù),因?yàn)樘摌s心,多多少少都會(huì)夸大一點(diǎn)。這些都是合乎常理,同樣也是無(wú)法避免的。而對(duì)于那些從名校畢業(yè),但現(xiàn)狀落魄的人,肯定不愿意透露自己的實(shí)際情況。那么,不難看出,耶魯大學(xué)的畢業(yè)生收入情況,它僅僅代表了1924屆中可以聯(lián)系得到的人中的愿意站出來(lái)說(shuō)出自己輸入的那些特殊人群。因?yàn)檎{(diào)查的對(duì)象本來(lái)就存在明顯的差異和偏向性,這是導(dǎo)致其最終結(jié)果失敗的根本原因。接下來(lái),同樣用一個(gè)例子來(lái)談?wù)剬?duì)平均數(shù)
7、的選取。一個(gè)老板為了炫耀自己公司的福利有多好,就在招聘部門(mén)公布了這樣的一個(gè)信息:本公司的全體員工的平均收入是5700美元。聽(tīng)上去挺不錯(cuò)的??墒悄愕米粤?xí)想想,這里的平均到底是什么平均數(shù)?是算術(shù)平均數(shù)?是眾數(shù)還是中位數(shù)?作為應(yīng)聘的你,更希望的這個(gè)平均是眾數(shù)吧,因?yàn)檫@樣以來(lái),公司總出現(xiàn)次數(shù)最多的是5700美元,而任何一個(gè)公司的基層人員往往是最多的,那么就意味著即使你是普通員工,也可以拿到這個(gè)豐厚的薪水。可現(xiàn)實(shí)并非如此,通常這里的均數(shù)都是算術(shù)平均數(shù),因?yàn)槿w員工中,包含了老板,經(jīng)理等高層人士,同樣也包括了基層員工??墒钱?dāng)高層的工資數(shù)高達(dá)上萬(wàn),甚至幾十萬(wàn),而基層的員工拿著不到兩千甚至不足一千的收入時(shí),照
8、樣可以平均到五六千的收入。所以,在以后的閱讀中,尤其是對(duì)這種帶有平均感念的統(tǒng)計(jì)數(shù)據(jù)中,不禁的要反問(wèn)一句,它到底是什么平均數(shù),不然,你將得到會(huì)與你的想法大徑相同。讓我們一同來(lái)看看不完整的匹配資料這種手段。有這樣的一個(gè)例子:“去年飛機(jī)失事造成的人員死亡比1910年多”,這是否意味著現(xiàn)在乘飛機(jī)要比過(guò)去危險(xiǎn)?我們都知道,在現(xiàn)階段的這個(gè)社會(huì)中,因交通事故死亡的人數(shù)比上個(gè)世紀(jì)中整整一百年中死亡的人數(shù)還要多,難道就因此要否定社會(huì)的進(jìn)步嗎?這種牛頭不對(duì)馬嘴的匹配顯然是不對(duì)的??纯礆v史,不難發(fā)現(xiàn),在過(guò)去的一個(gè)世紀(jì)了,能乘坐飛機(jī)的的人數(shù)有多少,而現(xiàn)階段,在這樣大的一個(gè)基數(shù)下,我們不妨做個(gè)簡(jiǎn)單是算術(shù),用每年死亡的人
9、數(shù)除以每年的客流量,那么你將會(huì)發(fā)現(xiàn),現(xiàn)階段的死亡比率將會(huì)小的可以忽略。而太多的人們總喜歡用比較多額手段來(lái)評(píng)判事物的好壞,可遺憾的是用錯(cuò)誤的參考對(duì)象;來(lái)作比較。這種情況在我們的生活中比比皆是。在這里也不一一列舉,只想告訴大家的是,在對(duì)于比較性的統(tǒng)計(jì)數(shù)據(jù)中,在被統(tǒng)計(jì)數(shù)據(jù)所震驚的同時(shí),想想他們的對(duì)比是否在同一個(gè)標(biāo)準(zhǔn),所采用的對(duì)象是否具有比較的意義。接下來(lái)的這種“行騙手段”是我們?cè)谏钪凶铍y察覺(jué),恰恰是最被“騙子們”慣用的一種手法。相關(guān)關(guān)系與因果關(guān)系。在這里先介紹一種統(tǒng)計(jì)學(xué)中的一個(gè)經(jīng)典謬誤:如果B緊跟著A出現(xiàn),那么A一定導(dǎo)致了B的發(fā)生。舉一個(gè)簡(jiǎn)單例子:有兩塊準(zhǔn)時(shí)的時(shí)鐘,當(dāng)a到某一整點(diǎn)時(shí)刻是,時(shí)鐘b就會(huì)
10、敲響。那么是否b鐘的敲響是否取決于a鐘是否走到該整點(diǎn)時(shí)刻呢?顯然不是的。我們只能稱之為是一種聯(lián)合變動(dòng)。而聯(lián)合變動(dòng)一種普遍形式是存在其真實(shí)性的,但無(wú)法區(qū)分之間的因果關(guān)系,或者說(shuō),他們之間就沒(méi)有必然的因果聯(lián)系。收入與擁有的股票之間便是這種相關(guān)。你擁有越多的錢(qián),便能買(mǎi)更多的股票;同時(shí),你手頭的股票越多,又可以為你帶來(lái)更多的收入。在這種情況下,簡(jiǎn)單地認(rèn)為一個(gè)因素引起另一個(gè)因素是不全面的。最具有戲劇性的相關(guān)是所有變量相互間沒(méi)有任何影響,卻存在著顯著的相關(guān)。例如:抽煙和學(xué)習(xí)成績(jī)的問(wèn)題。有人曾經(jīng)費(fèi)盡周折以探求是否抽煙者的大學(xué)成績(jī)比不吸煙者的差,結(jié)果的確如此。這著實(shí)讓一些人高興,從此,他們多次使用這個(gè)結(jié)論。往
11、通往好成績(jī)的道路上存在著放棄抽煙的痛苦。進(jìn)步使用該結(jié)論,還有這樣合理的推斷:抽煙使人的頭腦變笨。當(dāng)抽煙與低分同時(shí)出現(xiàn)時(shí),人們得到了一個(gè)未經(jīng)證實(shí)的假設(shè),抽煙導(dǎo)致低分。難道就不能是相反的解釋嗎?也許低分促使學(xué)生不喝酒而變得愛(ài)抽煙。這種說(shuō)法與前一種一樣能得到證據(jù)很好的支撐。只是它不能夠滿足宣傳人員的要求。 最后,和大家共同分享一則我最喜歡的統(tǒng)計(jì)案例。紐約時(shí)報(bào)在報(bào)道一條來(lái)自印第安納波利斯城的美聯(lián)社新聞時(shí),在偷換基數(shù)問(wèn)題上犯了錯(cuò)誤。 今天,經(jīng)濟(jì)危機(jī)已大為緩解。屬于印第安納波利斯城建筑貿(mào)易工會(huì)的管子工、泥水匠、木工、油漆工和其他工種的工人享受了5的工資提升,這是去年冬天工資下降20的四分之一補(bǔ)償。表面上很
12、合理但是請(qǐng)注意,減少是以原有工資為基數(shù)計(jì)算的,而增加卻使用了較小的基數(shù),即削減后的收入。 我們可以通過(guò)一些假設(shè)數(shù)據(jù)來(lái)進(jìn)行檢驗(yàn)。為簡(jiǎn)單起見(jiàn),假設(shè)原有收入為1美元,減少20,即為80美分,而在80美分的基礎(chǔ)上增加5僅提高了4美分,它是原來(lái)減少量20美分的五分之一,而非四分之一。和許多看起來(lái)似乎正確的錯(cuò)誤一樣,這個(gè)錯(cuò)誤通過(guò)巧妙的夸張,使事情看上去更美妙了。 這種偷換概念是最難察覺(jué)得到的,同時(shí)是欺騙手段最高明的,舉一個(gè)最簡(jiǎn)單的例子,讓我們假設(shè)去年一夸脫牛奶值20美分,一條面包5美分。今年牛奶的價(jià)格降至10美分,而面包的價(jià)格升至l0美分?,F(xiàn)在你想證明什么呢?物價(jià)指數(shù)上升?物價(jià)指數(shù)下降?或者根本沒(méi)有變化?
13、 首先選擇去年作為基期,也就是說(shuō),以去年的價(jià)格為100。既然牛奶的價(jià)格降了一半(即50),并且面包的價(jià)格是去年的2倍(即200),將50與200進(jìn)行平均得125,與去年相比,今年的價(jià)格上漲了25。用另一種方法試試,以今年的價(jià)格為基期。去年牛奶的價(jià)格是今年的200,而面包的價(jià)格是今年的50,平均數(shù)又是125,也就是說(shuō),去年的價(jià)格比今年的高25,今年的價(jià)格下降了。如果你想證明價(jià)格沒(méi)有發(fā)生變化,試試使用幾何平均數(shù),這時(shí)你可以隨意選擇基期。幾何平均數(shù)不同于算術(shù)平均數(shù),或均值;但它也是合法的計(jì)算方法,而且在某些情況下它是一種最有效的方法。計(jì)算3個(gè)數(shù)的幾何平均數(shù),只需將3個(gè)數(shù)相乘,開(kāi)3次方根;4個(gè)數(shù)的幾何平均數(shù),開(kāi)4次方根;兩個(gè)數(shù)的則開(kāi)平方根,以此類推。 事實(shí)是,如果不去考慮它的數(shù)學(xué)基礎(chǔ)。統(tǒng)計(jì)不僅是一門(mén)科學(xué),而且還是一門(mén)藝術(shù)。許多控制甚至扭曲都是在合理范圍之內(nèi)進(jìn)行的。統(tǒng)計(jì)工作者經(jīng)常要在許多方法中主觀地選擇一
溫馨提示
- 1. 本站所有資源如無(wú)特殊說(shuō)明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請(qǐng)下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請(qǐng)聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
- 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁(yè)內(nèi)容里面會(huì)有圖紙預(yù)覽,若沒(méi)有圖紙預(yù)覽就沒(méi)有圖紙。
- 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
- 5. 人人文庫(kù)網(wǎng)僅提供信息存儲(chǔ)空間,僅對(duì)用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對(duì)用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對(duì)任何下載內(nèi)容負(fù)責(zé)。
- 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請(qǐng)與我們聯(lián)系,我們立即糾正。
- 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶因使用這些下載資源對(duì)自己和他人造成任何形式的傷害或損失。
最新文檔
- 2025至2030年慢回彈高低枕項(xiàng)目投資價(jià)值分析報(bào)告
- 2025年接待臺(tái)項(xiàng)目可行性研究報(bào)告
- 2024-2025學(xué)年高中政治第一單元公民的政治生活第二課我國(guó)公民的政治參與課時(shí)二民主決策:作出最佳選擇課時(shí)精練含解析新人教版必修2
- 2024-2025學(xué)年高中政治第二單元經(jīng)濟(jì)發(fā)展與社會(huì)進(jìn)步4.2我國(guó)的社會(huì)保障練習(xí)含解析部編版必修2
- 2024醫(yī)院康復(fù)科年度考核個(gè)人總結(jié)范文(9篇)
- EPC模式下的工程總承包造價(jià)及其成本控制分析
- 2024年低碳環(huán)保調(diào)查報(bào)告范文
- 紅木無(wú)縫家具生產(chǎn)項(xiàng)目可行性研究報(bào)告申請(qǐng)報(bào)告
- 2025年微型電機(jī)驅(qū)動(dòng)系統(tǒng)項(xiàng)目投資可行性研究分析報(bào)告
- 酒店拍照租賃合同范本
- 3.1產(chǎn)業(yè)轉(zhuǎn)移對(duì)區(qū)域發(fā)展的影響(第1課時(shí)) 【知識(shí)精研】高二地理課件(湘教版2019選擇性必修2)
- 2025年醫(yī)院實(shí)習(xí)協(xié)議書(shū)樣本
- 2025年湖南工程職業(yè)技術(shù)學(xué)院高職單招職業(yè)技能測(cè)試近5年??及鎱⒖碱}庫(kù)含答案解析
- 2024年云南中煙工業(yè)有限責(zé)任公司招聘筆試真題
- 2024年山東輕工職業(yè)學(xué)院高職單招語(yǔ)文歷年參考題庫(kù)含答案解析
- 三一重工全面預(yù)算管理
- 小公司財(cái)務(wù)報(bào)銷制度及報(bào)銷流程
- 《環(huán)境感知技術(shù)》2024年課程標(biāo)準(zhǔn)(含課程思政設(shè)計(jì))
- 礦山用電安全培訓(xùn)課件
- 2025年中考語(yǔ)文一輪復(fù)習(xí):八年級(jí)上冊(cè)知識(shí)點(diǎn)梳理
- 航空物流運(yùn)輸服務(wù)標(biāo)準(zhǔn)
評(píng)論
0/150
提交評(píng)論