《統(tǒng)計學中的常見誤導及生活中的應用案例》4200字_第1頁
《統(tǒng)計學中的常見誤導及生活中的應用案例》4200字_第2頁
《統(tǒng)計學中的常見誤導及生活中的應用案例》4200字_第3頁
《統(tǒng)計學中的常見誤導及生活中的應用案例》4200字_第4頁
《統(tǒng)計學中的常見誤導及生活中的應用案例》4200字_第5頁
已閱讀5頁,還剩2頁未讀 繼續(xù)免費閱讀

下載本文檔

版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進行舉報或認領

文檔簡介

統(tǒng)計學中的常見誤導及生活中的應用案例目錄TOC\o"1-2"\h\u30581統(tǒng)計學中的常見誤導及生活中的應用案例 1262491引言 1320242常見的統(tǒng)計學陷阱及其解決 158192.1研究設計階段 1224802.2數(shù)據(jù)整理與清洗階段 2145352.3數(shù)據(jù)分析階段 2324292.4結(jié)果報告階段 3128723統(tǒng)計學在工作或生活中的應用 321813.1統(tǒng)計學在相關性方面中的應用 3286303.2統(tǒng)計學在投資選擇方面中的應用 410844結(jié)語 43755參考文獻 4摘要:統(tǒng)計學是一門應用十分廣泛的課程,在我們的生活以及工作中都可能涉及到。但是統(tǒng)計學也是容易出現(xiàn)陷阱,誤導人們的判斷,因此需要對常見的統(tǒng)計學陷阱進行分辨,并能避免?;诖吮疚膰@常見的統(tǒng)計學陷阱及其避免展開,并就生活中統(tǒng)計學的應用進行了案例分析,希望以此給統(tǒng)計學的應用能提供點思路。關鍵詞:統(tǒng)計學;陷阱;應用1引言在我們?nèi)粘?蒲谢蛘撐膶懽髦?,統(tǒng)計學錯誤廣泛存在,近年來,也越來越引起學者們和大眾媒體的普遍關注。如何提高統(tǒng)計學應用和實踐等方面存在爭議,目前,研究重點是統(tǒng)計推斷方法選擇問題,特別在P值及顯著性檢驗方面[1]。下面對常見統(tǒng)計學陷阱作一剖析,并提出了解決辦法。2常見的統(tǒng)計學陷阱及其解決2.1研究設計階段(1)研究目的是為了證明等效性或非劣效性,但研究未進行相應設計例如:30名運動員被隨機分為兩組:生酮飲食組及習慣性飲食組分別為四周。本研究旨在論證生酮飲食對正常飲食的影響,不導致炎癥反應的增加。研究人員直接比較了兩組患者4周的脂聯(lián)素(炎癥標志物)水平,兩組比較差異無統(tǒng)計學意義(P=0.50),所以結(jié)論是:4周生酮飲食并不加重炎癥反應。解決辦法:研究人員應該將研究設計為非劣效性的實驗,旨在證明某一干預措施并不比其他措施差。所以研究人員應該預先確定非劣效性界值(non-inferioritymargin),例如脂聯(lián)素使0.5mg/L升高,同時,樣本量的計算還應該包括該非劣效性界值的計算。(2)未進行樣本量計算,導致結(jié)果估計不精確、可信區(qū)間過寬例如:一項研究的目的是評價一項新的卒中患者平衡測試中評分者之間的可靠性。兩位評分者對10名例卒中患者進行測評,研究者計算了組內(nèi)相關系數(shù)(intra-classcorrelationcoefficient,ICC)和95%可信區(qū)間,結(jié)果為0.76(0.23-0.93)。問題是ICC估算太不準確,造成不能對結(jié)果可靠性進行評判。解決辦法:研究者應提前計算樣本量。針對評估一致性還是可靠性問題進行了研究,樣本量應該建立在達到很高ICC精度或ICC和非零值(比如0.50)對比的基礎上。(3)研究使用了既往未經(jīng)驗證的測量量表例如:一項研究的目的是考察網(wǎng)球比賽在主觀精神疲勞方面所起的作用,對12名的運動員進行了全賽季的隨訪,并于每一場的前,中,后采集精神疲勞評分。研究人員要求運動員在自制量表上(0-100分)報告自己的心理疲勞狀況。結(jié)果發(fā)現(xiàn)比賽前后精神狀況顯著降低。但是問題在于這個自制量表是否有效可靠都沒有得到證實,因此,觀測上的不同很可能是由測量誤差造成的。解決辦法:研究人員應采用一種以前已被證實的主觀精神疲勞測量方法。這種方法要有已知信度與效度,并以相似的研究人群為佳。2.2數(shù)據(jù)整理與清洗階段(1)數(shù)據(jù)處理中的錯誤操作導致了二分類變量編碼的1/0反轉(zhuǎn)例如:研究人員調(diào)查了700名跑步者,為了掌握其防曬習慣。初步的分析表明:婦女、年紀大、皮膚癌病史多的跑步者,不大可能頻繁使用防曬霜,這些發(fā)現(xiàn)和人們的期望恰恰相反。經(jīng)進一步排查,發(fā)現(xiàn)編碼錯誤1個:防曬指數(shù)按1(經(jīng)常使用)到5(從不使用)的維度進行編碼,然而,當Excel中的數(shù)據(jù)被轉(zhuǎn)換成二分類變量后,4、5數(shù)值誤碼成常用防曬霜,并將1至3之間的數(shù)值重新編碼,以說明防曬措施不足。解決辦法:推薦在統(tǒng)計分析軟件(如SAS、STATA、R)中進行數(shù)據(jù)清洗,以使數(shù)據(jù)更改記錄均能保存到代碼。操作統(tǒng)計模型前,要考察所有變量是否準確,一致。(2)數(shù)據(jù)輸入錯誤導致了虛假關聯(lián)例如:研究人員前瞻性地收集了150名美國高校長跑運動員的數(shù)據(jù),包括睡覺的習慣和1英里跑步的時間。初步分析表明,較長的夜間平均睡眠時間與較快的1英里跑時間有中度相關(r=-0.55,P<0.01)[2]。但在畫數(shù)據(jù)散點圖的過程中卻發(fā)現(xiàn)有數(shù)據(jù)輸入錯誤的情況:一位運動員匯報說,他跑步的時間(7分30秒)和睡眠時長都相當短暫(每晚5小時)。去掉該數(shù)據(jù)點后,睡眠時長與跑步時間相關性轉(zhuǎn)為陰性(r=-0.15,P=0.46),其終極原因在于數(shù)據(jù)庫內(nèi)運動員數(shù)據(jù)錄入錯誤。解決辦法:正式分析前,研究者應驗證資料,盡量畫出散點圖,為了確定異常值以及數(shù)據(jù)輸入是否存在誤差。對錄入錯誤的資料,應當及時糾正,應該將異常值留在數(shù)據(jù)集中,但對它的影響要用敏感性分析的方法進行探討。2.3數(shù)據(jù)分析階段(1)未檢查統(tǒng)計模型的相關性假設,導致錯誤的推斷例如:部分同學對健康對照組及輕度腦外傷患者4種不同情況下頭部旋轉(zhuǎn)角度資料進行分析。利用重復測量進行方差分析,結(jié)果表明,主效應在研究條件上的差異有統(tǒng)計學意義(P=0.032)。不過,當你看原始數(shù)據(jù)的時候,你會發(fā)現(xiàn)在其中兩個研究條件中旋轉(zhuǎn)角度方差比其他條件大三倍,而不是正態(tài)分布[3]。所以,這一資料有悖于方差分析中的兩條假定:方差齊性(在這個例子里,比較具體的有球形檢驗)與殘差正態(tài)性。與球形檢驗背道而馳的假設,有可能造成一類錯誤率的上升。在對該實例的數(shù)據(jù)作非參數(shù)檢驗的情況下,所得P值遠高于(P=0.24)。解決辦法:研究人員操作任何形式統(tǒng)計模型,并進行測試前,對數(shù)據(jù)集中各變量的狀況要有全面認識,對所有有關變量的描述性統(tǒng)計、產(chǎn)生散點圖、直方圖等信息。研究人員還要考察數(shù)據(jù)是符合統(tǒng)計模型還是符合所考察的假設。(2)數(shù)據(jù)分析忽略了重要的相關性來源,導致P值被嚴重低估例如:研究人員開展了以防止運動性傷害為目的的整組隨機對照試驗,隨機選擇五所中學介入,將五所中學隨機分成對照組。其中干預組教練出席一個時長教育研討會,研究能夠降低損傷的具體熱身方案,并且對照組教練接受教育性郵件[4]。接下來一年,研究者們加入隊伍,并且對熱身活動數(shù)量進行記錄。研究發(fā)現(xiàn),干預組教練員在54/200(27%)的比賽中實施了這一過程,但對照組教練員僅在30/200(15%)的比賽中進行熱身訓練。經(jīng)卡方檢驗,研究人員認為:2組比較有極顯著差異,P<0.005。本項研究的問題是,本研究中400個的觀察對象實際上是非獨立的,并有兩個相關來源:1)每一位教練都是經(jīng)過多次比賽后重復衡量的;2)出自同一所中學的教練亦有相關性。所以這項研究有可能使P值顯著增加,由于有效樣本量遠在400以下。解決辦法:在對有相關關系的觀測值進行分析,資料中某些相關性的來源需要加以調(diào)整或修正,例如,可通過更改觀察單位(從比賽到教練),也可使用能處理有關觀測值的統(tǒng)計學模型。2.4結(jié)果報告階段(1)摘要突出強調(diào)了組內(nèi)比較結(jié)果,但忽略了組間比較結(jié)果,掩蓋了組間差異不具有統(tǒng)計學意義的事實例如:研究人員通過隨機對照試驗,對魚油提高卒中患者認知功能進行評價。魚油組(n=20)病人平均認知功能提高3個點,在α=0.05的水平上,各組變化的差異有統(tǒng)計學意義(P=0.043);安慰劑組(n=20)認知功能提高2.1分鐘,組間差異無統(tǒng)計學意義(P=0.087);平均分組(0.9分)差異無統(tǒng)計學意義(P=0.47)。不過研究人員總結(jié)說:魚油組顯著提高(P<0.05),但安慰劑組則不存在(P>0.05)。所以魚油對認知功能的提高可能有一定幫助。這是一種高誤導性結(jié)果陳述[5]。解決辦法:報告隨機對照試驗結(jié)果時應將摘要及主要結(jié)論以組間比較為主。(2)來自單一數(shù)據(jù)集的高度相關結(jié)果分別在多篇不同文章中進行報告例如:究者調(diào)查了1000名老年人,為瞭解其目前關節(jié)疼痛和鍛煉習慣之相關。研究人員分別構(gòu)建了3個Logistic回歸模型,討論游泳的前期問題、跑步,球類運動在老年關節(jié)疼痛中的作用。研究發(fā)現(xiàn)游泳能減少關節(jié)疼痛危險,跑步會增加危險,而且球類運動也沒什么作用。這些成果已發(fā)表于3篇單獨的文章,筆者亦未向讀者通報有別的研究。該研究的問題是,測試三項運動可提高整體I型錯誤率;單獨分析時,排除潛在相關性調(diào)整的可能性,比如,調(diào)整同時參加不同項目的情況;讀者在各種模式下也難以找到微小的區(qū)別。解決辦法:研究人員應該慎重考慮從同一個數(shù)據(jù)集中進行多次分析,是否有價值單獨刊登于幾篇文章。若對同一份樣品的有關結(jié)果,用同樣的統(tǒng)計方法進行統(tǒng)計,如此更為恰當。3統(tǒng)計學在工作或生活中的應用3.1統(tǒng)計學在相關性方面中的應用統(tǒng)計和概率有著千絲萬縷的聯(lián)系,同時,我們還可以把統(tǒng)計應用到事件或物品的相關性分析中去,以此判斷兩項目之間是否存在關聯(lián),在生活中經(jīng)常被用于財務分析,生態(tài)分析和遺傳分析[6]。生活中常常會碰到這樣一個問題,那就是評判兩個乃至更多變量之間是否存在相關性,比如,某家公司為了增強自己的才能,組織員工進行專業(yè)知識的培訓活動。為了弄清培訓活動的成效,隨機抽取50名男生和70名女生進行培訓知識考核,運用所得考核結(jié)果,可對有無90%的掌握情況進行分析,得出培訓知識測試成績是否優(yōu)異與性別相關,并據(jù)此確定此后性別是否被用作招聘要求。表1考核結(jié)果統(tǒng)計表性別優(yōu)秀非優(yōu)秀總計男153550女304070表2獨立性檢驗表P0.250.150.100.05K01.3232.0722.7063.841通過公式計算,計算求得K2≈2.057,且2.057<2.706,因此,沒有90%的把握地認為培訓知識考核測試成績是否出色與性別相關。3.2統(tǒng)計學在投資選擇方面中的應用生活中,無論是企業(yè)還是個人均有可能遭遇余款問題。才能讓這一部分錢有較好的收益,人們常常會遇到投資選擇的難題,還需運用于統(tǒng)計知識中。比如,一個人現(xiàn)在有20萬元的剩余錢,需作出一年投資決策。假定銀行利率是10%,那么就可以選擇兩個投資選擇了,其一,股票投資,二是銀行存款。表3股票收益情況表(單位:萬元)股票收益經(jīng)濟形勢發(fā)生概率%8好302中50-4差20股票的收益由經(jīng)濟狀況決定。經(jīng)濟形勢一片大好,股票投資能掙8萬元;在溫和的經(jīng)濟形勢下,股票投資能掙2萬元;經(jīng)濟低迷時,投資股票會損失4萬元。多種經(jīng)濟狀況出現(xiàn)的可能性可從經(jīng)驗中得出,這時就可以計算出股票投資的預期收益=8×30%+2×50%+(-4)×20%=26,000元。存入銀行能得到的收益=20×10%=20000元。故可采用比較分析的方法進行決策:把錢投在股票上比較理想。在此應注意,股票投資的收益和經(jīng)濟狀況有直接的關系。所以,當我們憑經(jīng)驗來估算經(jīng)濟狀況發(fā)生的概率,要堅持謹慎原則,否則,就會造成決策上失誤[7]。4結(jié)語總之,統(tǒng)計是和我們生活緊密相連,它可能需要使用專門的統(tǒng)計學工具與理論,又或許只是單純的統(tǒng)計學原理,具備統(tǒng)計學的基本知識,能更容易地處理人生難題,遠離生活中的某些陷阱。參考文獻[1]BarrowM.StatisticsforEconomics,AccountingandBusinessStudies(4thedition)[J].FinancialTimes/PrenticeHall;4edition,2005.[2]StrasbergSM.Errortrapsandvasculo‐biliaryinjuryinlaparoscopicandopencholecystectomy[J].JournalofHepato‐Biliary‐PancreaticSciences,2008,15(3):284-292.[3]BarakatA,BianchiP,HachemW,etal.Stochasticoptimizationwithmomentum:Convergence,fluctuations,andtrapsavoidance[J].InstituteofMathe

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預覽,若沒有圖紙預覽就沒有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負責。
  • 6. 下載文件中如有侵權(quán)或不適當內(nèi)容,請與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

最新文檔

評論

0/150

提交評論