統(tǒng)計分析P值的含義_第1頁
統(tǒng)計分析P值的含義_第2頁
統(tǒng)計分析P值的含義_第3頁
全文預(yù)覽已結(jié)束

下載本文檔

版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進行舉報或認領(lǐng)

文檔簡介

1、p值是怎么來的從某總體中抽、這一樣本是由該總體抽出,其差別是由抽樣誤差所致;、這一樣本不是從該總體抽出,所以有所不同。如何判斷是那種原因呢?統(tǒng)計學(xué)中用顯著性檢驗賴判斷。其步驟是:、建立檢驗假設(shè)(又稱無效假設(shè),符號為h0):如要比較a藥和b藥的療效是否相等,則假設(shè)兩組樣本來自同一總體,即a藥的總體療效和b藥相等,差別僅由抽樣誤差引起的碰巧出現(xiàn)的。、選擇適當(dāng)?shù)慕y(tǒng)計方法計算h0成立的可能性即概率有多大,概率用p值表示。、根據(jù)選定的顯著性水平(0.05或0.01),決定接受還是拒絕h0。如果p0.05,不能否定“差別由抽樣誤差引起”,則接受h0;如果p0.05或p 0.01,可以認為差別不由抽樣誤差引

2、起,可以拒絕h0,則可以接受令一種可能性的假設(shè)(又稱備選假設(shè),符號為h1),即兩樣本來自不同的總體,所以兩藥療效有差別。統(tǒng)計學(xué)上規(guī)定的p值意義見下表p值 碰巧的概率 對無效假設(shè) 統(tǒng)計意義 p0.05 碰巧出現(xiàn)的可能性大于5% 不能否定無效假設(shè) 兩組差別無顯著意義 p0.05 碰巧出現(xiàn)的可能性小于5% 可以否定無效假設(shè) 兩組差別有顯著意義 p 0.01 碰巧出現(xiàn)的可能性小于1% 可以否定無效假設(shè) 兩者差別有非常顯著意義 理解p值,下述幾點必須注意:p的意義不表示兩組差別的大小,p反映兩組差別有無統(tǒng)計學(xué)意義,并不表示差別大小。因此,與對照組相比,c藥取得p0.05,d藥取得p 0.01并不表示d的

3、藥效比c強。 p0.05時,差異無顯著意義,根據(jù)統(tǒng)計學(xué)原理可知,不能否認無效假設(shè),但并不認為無效假設(shè)肯定成立。在藥效統(tǒng)計分析中,更不表示兩藥等效。哪種將“兩組差別無顯著意義”與“兩組基本等效”相同的做法是缺乏統(tǒng)計學(xué)依據(jù)的。統(tǒng)計學(xué)主要用上述三種p值表示,也可以計算出確切的p值,有人用p 0.001,無此必要。顯著性檢驗只是統(tǒng)計結(jié)論。判斷差別還要根據(jù)專業(yè)知識。樣所得的樣本,其統(tǒng)計量會與總體參數(shù)有所不同,這可能是由于兩種原因p值是最常用的一個統(tǒng)計學(xué)指標,幾乎統(tǒng)計軟件輸出結(jié)果都有p值。了解p值的由來、計算和意義很有必要。 統(tǒng)計學(xué)意義(p值)(這是經(jīng)理每次爭論的焦點) 結(jié)果的統(tǒng)計學(xué)意義是結(jié)果真實程度(能

4、夠代表總體)的一種估計方法。專業(yè)上,p值為結(jié)果可信程度的一個遞減指標,p值越大,我們越不能認為樣本中變量的關(guān)聯(lián)是總體中各變量關(guān)聯(lián)的可靠指標。p值是將觀察結(jié)果認為有效即具有總體代表性的犯錯概率。如p=0.05提示樣本中變量關(guān)聯(lián)有5%的可能是由于偶然性造成的。即假設(shè)總體中任意變量間均無關(guān)聯(lián),我們重復(fù)類似實驗,會發(fā)現(xiàn)約20個實驗中有一個實驗,我們所研究的變量關(guān)聯(lián)將等于或強于我們的實驗結(jié)果。(這并不是說如果變量間存在關(guān)聯(lián),我們可得到5%或95%次數(shù)的相同結(jié)果,當(dāng)總體中的變量存在關(guān)聯(lián),重復(fù)研究和發(fā)現(xiàn)關(guān)聯(lián)的可能性與設(shè)計的統(tǒng)計學(xué)效力有關(guān)。)在許多研究領(lǐng)域,0.05的p值通常被認為是可接受錯誤的邊界水平。如何

5、判定結(jié)果具有真實的顯著性在最后結(jié)論中判斷什么樣的顯著性水平具有統(tǒng)計學(xué)意義,不可避免地帶有武斷性。換句話說,認為結(jié)果無效而被拒絕接受的水平的選擇具有武斷性。實踐中,最后的決定通常依賴于數(shù)據(jù)集比較和分析過程中結(jié)果是先驗性還是僅僅為均數(shù)之間的兩兩比較,依賴于總體數(shù)據(jù)集里結(jié)論一致的支持性證據(jù)的數(shù)量,依賴于以往該研究領(lǐng)域的慣例。通常,許多的科學(xué)領(lǐng)域中產(chǎn)生p值的結(jié)果0.05被認為是統(tǒng)計學(xué)意義的邊界線,但是這顯著性水平還包含了相當(dāng)高的犯錯可能性。結(jié)果0.05p0.01被認為是具有統(tǒng)計學(xué)意義,而0.01p0.001被認為具有高度統(tǒng)計學(xué)意義。但要注意這種分類僅僅是研究基礎(chǔ)上非正規(guī)的判斷常規(guī)。所有的檢驗統(tǒng)計都是正

6、態(tài)分布的嗎?并不完全如此,但大多數(shù)檢驗都直接或間接與之有關(guān),可以從正態(tài)分布中推導(dǎo)出來,如t檢驗、f檢驗或卡方檢驗。這些檢驗一般都要求:所分析變量在總體中呈正態(tài)分布,即滿足所謂的正態(tài)假設(shè)。許多觀察變量的確是呈正態(tài)分布的,這也是正態(tài)分布是現(xiàn)實世界的基本特征的原因。當(dāng)人們用在正態(tài)分布基礎(chǔ)上建立的檢驗分析非正態(tài)分布變量的數(shù)據(jù)時問題就產(chǎn)生了,(參閱非參數(shù)和方差分析的正態(tài)性檢驗)。這種條件下有兩種方法:一是用替代的非參數(shù)檢驗(即無分布性檢驗),但這種方法不方便,因為從它所提供的結(jié)論形式看,這種方法統(tǒng)計效率低下、不靈活。另一種方法是:當(dāng)確定樣本量足夠大的情況下,通常還是可以使用基于正態(tài)分布前提下的檢驗。后一

7、種方法是基于一個相當(dāng)重要的原則產(chǎn)生的,該原則對正態(tài)方程基礎(chǔ)上的總體檢驗有極其重要的作用。即,隨著樣本量的增加,樣本分布形狀趨于正態(tài),即使所研究的變量分布并不呈正態(tài)。1統(tǒng)計軟件的選擇 在進行統(tǒng)計分析時,作者常使用非專門的數(shù)理統(tǒng)計軟件excel進行統(tǒng)計分析。由于excel提供的統(tǒng)計分析功能十分有限,很難滿足實際需要。目前,國際上已開發(fā)出的專門用于統(tǒng)計分析的商業(yè)軟件很多,比較著名有spss(statistical package for social sciences)、sas(statistical analysis system)、bmdp和statistica等。其中,spss是專門為社會科學(xué)

8、領(lǐng)域的研究者設(shè)計的(但是,此軟件在自然科學(xué)領(lǐng)域也得到廣泛應(yīng)用);bmdp是專門為生物學(xué)和醫(yī)學(xué)領(lǐng)域研究者編制的統(tǒng)計軟件。目前,國際學(xué)術(shù)界有一條不成文的約定:凡是用spss和sas軟件進行統(tǒng)計分析所獲得的結(jié)果,在國際學(xué)術(shù)交流中不必說明具體算法。由此可見,spss和sas軟件已被各領(lǐng)域研究者普遍認可。建議作者們在進行統(tǒng)計分析時盡量使用這2個專門的統(tǒng)計軟件。2均值的計算 在處理實驗數(shù)據(jù)或采樣數(shù)據(jù)時,經(jīng)常會遇到對相同采樣或相同實驗條件下同一隨機變量的多個不同取值進行統(tǒng)計處理的問題。此時,多數(shù)作者會不假思索地直接給出算術(shù)平均值和標準差。顯然,這種做法是不嚴謹?shù)?。在?shù)理統(tǒng)計學(xué)中,作為描述隨機變量總體大小特征

9、的統(tǒng)計量有算術(shù)平均值、幾何平均值和中位數(shù)等。何時用算術(shù)平均值?何時用幾何平均值?以及何時用中位數(shù)?這不能由研究者根據(jù)主觀意愿隨意確定,而要根據(jù)隨機變量的分布特征確定。反映隨機變量總體大小特征的統(tǒng)計量是數(shù)學(xué)期望,而在隨機變量的分布服從正態(tài)分布時,其總體的數(shù)學(xué)期望就是其算術(shù)平均值。此時,可用樣本的算術(shù)平均值描述隨機變量的大小特征。如果所研究的隨機變量不服從正態(tài)分布,則算術(shù)平均值不能準確反映該變量的大小特征。在這種情況下,可通過假設(shè)檢驗來判斷隨機變量是否服從對數(shù)正態(tài)分布。如果服從對數(shù)正態(tài)分布,則可用幾何平均值描述該隨機變量總體的大小。此時,就可以計算變量的幾何平均值。如果隨機變量既不服從正態(tài)分布也不

10、服從對數(shù)正態(tài)分布,則按現(xiàn)有的數(shù)理統(tǒng)計學(xué)知識,尚無合適的統(tǒng)計量描述該變量的大小特征。退而求其次,此時可用中位數(shù)來描述變量的大小特征。3相關(guān)分析中相關(guān)系數(shù)的選擇 在相關(guān)分析中,作者們常犯的錯誤是簡單地計算pearson積矩相關(guān)系數(shù),而且既不給出正態(tài)分布檢驗結(jié)果,也往往不明確指出所計算的相關(guān)系數(shù)就是pearson 積矩相關(guān)系數(shù)。常用的相關(guān)系數(shù)除有pearson積矩相關(guān)系數(shù)外,還有spearman秩相關(guān)系數(shù)和kendall秩相關(guān)系數(shù)等。其中,pearson 積矩相關(guān)系數(shù)可用于描述2個隨機變量的線性相關(guān)程度(相應(yīng)的相關(guān)分析方法稱為“參數(shù)相關(guān)分析”,該方法的檢驗功效高,檢驗結(jié)果明確);spearman或k

11、endall秩相關(guān)系數(shù)用來判斷兩個隨機變量在二維和多維空間中是否具有某種共變趨勢,而不考慮其變化的幅度(相應(yīng)的相關(guān)分析稱為“非參數(shù)相關(guān)分析” ,該方法的檢驗功效較參數(shù)方法稍差,檢驗結(jié)果也不如參數(shù)方法明確)。各種成熟的統(tǒng)計軟件如spss、sas等均提供了這些相關(guān)系數(shù)的計算模塊。在相關(guān)分析中,計算各種相關(guān)系數(shù)是有前提的。對于二元相關(guān)分析,如果2個隨機變量服從二元正態(tài)分布,或2個隨機變量經(jīng)數(shù)據(jù)變換后服從二元正態(tài)分布,則可以用pearson積矩相關(guān)系數(shù)描述這2個隨機變量間的相關(guān)關(guān)系(此時描述的是線性相關(guān)關(guān)系),而不宜選用功效較低的spearman或kendall秩相關(guān)系數(shù)。如果樣本數(shù)據(jù)或其變換值不服從

12、正態(tài)分布,則計算pearson 積矩相關(guān)系數(shù)就毫無意義。退而求其次,此時只能計算spearman或kendall秩相關(guān)系數(shù)(盡管這樣做會導(dǎo)致檢驗功效的降低)。因此,在報告相關(guān)分析結(jié)果時,還應(yīng)提供正態(tài)分布檢驗結(jié)果,以證明計算所選擇的相關(guān)系數(shù)是妥當(dāng)?shù)摹P枰赋龅氖?,由于spearman或kendall秩相關(guān)系數(shù)是基于順序變量(秩)設(shè)計的相關(guān)系數(shù),因此,如果所采集的數(shù)據(jù)不是確定的數(shù)值而僅僅是秩,則使用spearman或kendall秩相關(guān)系數(shù)進行非參數(shù)相關(guān)分析就成為唯一的選擇。4相關(guān)分析與回歸分析的區(qū)別 相關(guān)分析和回歸分析是極為常用的2種數(shù)理統(tǒng)計方法,在地質(zhì)學(xué)研究領(lǐng)域有著廣泛的用途。然而,由于這2種

13、數(shù)理統(tǒng)計方法在計算方面存在很多相似之處,且在一些數(shù)理統(tǒng)計教科書中沒有系統(tǒng)闡明這2種數(shù)理統(tǒng)計方法的內(nèi)在差別,從而使一些研究者不能嚴格區(qū)分相關(guān)分析與回歸分析。最常見的錯誤是,用回歸分析的結(jié)果解釋相關(guān)性問題。例如,作者將“回歸直線(曲線)圖”稱為“相關(guān)性圖”或“相關(guān)關(guān)系圖”;將回歸直線的r2(擬合度,或稱“可決系數(shù)”)錯誤地稱為“相關(guān)系數(shù)”或“相關(guān)系數(shù)的平方”;根據(jù)回歸分析的結(jié)果宣稱2個變量之間存在正的或負的相關(guān)關(guān)系。這些情況在國內(nèi)極為普遍。 相關(guān)分析與回歸分析均為研究2個或多個隨機變量間關(guān)聯(lián)性的方法,但2種數(shù)理統(tǒng)計方法存在本質(zhì)的差別,即它們用于不同的研究目的。相關(guān)分析的目的在于檢驗兩個隨機變量的共

14、變趨勢(即共同變化的程度),回歸分析的目的則在于試圖用自變量來預(yù)測因變量的值。在相關(guān)分析中,兩個變量必須同時都是隨機變量,如果其中的一個變量不是隨機變量,就不能進行相關(guān)分析。這是相關(guān)分析方法本身所決定的。對于回歸分析,其中的因變量肯定為隨機變量(這是回歸分析方法本身所決定的),而自變量則可以是普通變量(規(guī)范的叫法是“固定變量”,有確定的取值)也可以是隨機變量。如果自變量是普通變量,采用的回歸方法就是最為常用的“最小二乘法”,即模型回歸分析;如果自變量是隨機變量,所采用的回歸方法與計算者的目的有關(guān)-在以預(yù)測為目的的情況下,仍采用“最小二乘法”,在以估值為目的的情況下須使用相對嚴謹?shù)摹爸鬏S法”、“約化主軸法”或“bartlett法”,即模型回歸分析。顯然,對于回歸分析,如果是模型回歸分析,就根本不可能回答變量的“相關(guān)性”問題,因為普通變量與隨機變量之間不存在“相關(guān)性”這一概念(問題在于,大多數(shù)的回歸分析都是模型回歸分析!)。此時,即使作者想描述2個變量間的“共變趨勢”而改用相關(guān)分析,也會因相關(guān)分析的前提不存在而使分析結(jié)果毫無意義。如果是模型回歸分析,鑒于兩個隨機變量客觀上存在“相關(guān)性”問題,但因回歸分析方法本身不能提供針對自變量和因變量之間相關(guān)關(guān)系的準確的檢驗手段,

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負責(zé)。
  • 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔(dān)用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

最新文檔

評論

0/150

提交評論