![大數(shù)據(jù)分析中數(shù)理統(tǒng)計(jì)方法的正確使用_第1頁](http://file4.renrendoc.com/view/bc060300b6b9fa2923810386151ffea2/bc060300b6b9fa2923810386151ffea21.gif)
![大數(shù)據(jù)分析中數(shù)理統(tǒng)計(jì)方法的正確使用_第2頁](http://file4.renrendoc.com/view/bc060300b6b9fa2923810386151ffea2/bc060300b6b9fa2923810386151ffea22.gif)
![大數(shù)據(jù)分析中數(shù)理統(tǒng)計(jì)方法的正確使用_第3頁](http://file4.renrendoc.com/view/bc060300b6b9fa2923810386151ffea2/bc060300b6b9fa2923810386151ffea23.gif)
![大數(shù)據(jù)分析中數(shù)理統(tǒng)計(jì)方法的正確使用_第4頁](http://file4.renrendoc.com/view/bc060300b6b9fa2923810386151ffea2/bc060300b6b9fa2923810386151ffea24.gif)
![大數(shù)據(jù)分析中數(shù)理統(tǒng)計(jì)方法的正確使用_第5頁](http://file4.renrendoc.com/view/bc060300b6b9fa2923810386151ffea2/bc060300b6b9fa2923810386151ffea25.gif)
版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進(jìn)行舉報(bào)或認(rèn)領(lǐng)
文檔簡介
大數(shù)據(jù)分析中數(shù)理統(tǒng)計(jì)方法的正確使用第1頁/共110頁作者所處理的數(shù)據(jù)屬于隨機(jī)變量的特定樣本。作者已經(jīng)掌握最基本的數(shù)理統(tǒng)計(jì)學(xué)常識,如概率、假設(shè)檢驗(yàn)、均值、方差、標(biāo)準(zhǔn)差、正態(tài)分布、相關(guān)分析、回歸分析、方差分析……。重要假定第2頁/共110頁在科學(xué)研究中,經(jīng)常會涉及到對隨機(jī)變量大小、離散及分布特征的描述以及對2個(gè)或多個(gè)隨機(jī)變量之間的關(guān)系描述問題。地學(xué)、環(huán)境科學(xué)研究也不例外。對隨機(jī)變量及隨機(jī)變量之間的關(guān)系進(jìn)行定量描述的數(shù)學(xué)工具就是數(shù)理統(tǒng)計(jì)學(xué)。在科學(xué)研究中,能否正確使用各種數(shù)理統(tǒng)計(jì)方法關(guān)系到所得出結(jié)論的客觀性和可信性。所以,來稿中使用的數(shù)理統(tǒng)計(jì)方法是否正確應(yīng)是學(xué)術(shù)期刊編輯和作者極為重視的問題。目前,國內(nèi)科技期刊對稿件中數(shù)理統(tǒng)計(jì)方法問題的重視程度存在差異。數(shù)理統(tǒng)計(jì)問題的重要性第3頁/共110頁統(tǒng)計(jì)分析通常涉及大量的數(shù)據(jù),需要較大的計(jì)算工作量。在進(jìn)行統(tǒng)計(jì)分析時(shí),盡管作者可以自行編寫計(jì)算程序,但在統(tǒng)計(jì)軟件很普及的今天,這樣做是毫無必要的。出于對工作效率以及對算法的通用性、可比性的考慮,一些學(xué)術(shù)期刊要求作者采用專門的數(shù)理統(tǒng)計(jì)軟件進(jìn)行統(tǒng)計(jì)分析。1統(tǒng)計(jì)軟件的選擇
第4頁/共110頁問題:作者未使用專門的數(shù)理統(tǒng)計(jì)軟件,而采用Excel這樣的電子表格軟件進(jìn)行數(shù)據(jù)統(tǒng)計(jì)分析。由于電子表格軟件提供的統(tǒng)計(jì)分析功能十分有限,只能借助它進(jìn)行較為簡單的統(tǒng)計(jì)分析,故我們不主張作者采用這樣的軟件進(jìn)行統(tǒng)計(jì)分析。1統(tǒng)計(jì)軟件的選擇第5頁/共110頁目前,國際上已開發(fā)出的專門用于統(tǒng)計(jì)分析的商業(yè)軟件很多,比較著名有SPSS(StatisticalPackageforSocialSciences)和SAS(StatisticalAnalysisSystem)。此外,還有BMDP和STATISTICA等……。SPSS是專門為社會科學(xué)領(lǐng)域的研究者設(shè)計(jì)的,但此軟件在自然科學(xué)領(lǐng)域也得到廣泛應(yīng)用。BMDP是專門為生物學(xué)和醫(yī)學(xué)領(lǐng)域研究者編制的統(tǒng)計(jì)軟件。1統(tǒng)計(jì)軟件的選擇第6頁/共110頁目前,國際學(xué)術(shù)界有一條不成文的約定:凡是用SPSS和SAS軟件進(jìn)行統(tǒng)計(jì)分析所獲得的結(jié)果,在國際學(xué)術(shù)交流中不必說明具體算法。由此可見,SPSS和SAS軟件已被各領(lǐng)域研究者普遍認(rèn)可。我們建議作者們在進(jìn)行統(tǒng)計(jì)分析時(shí)盡量使用這2個(gè)專門的統(tǒng)計(jì)軟件。目前,有關(guān)這2個(gè)軟件的使用教程在書店中可很容易地買到。
1統(tǒng)計(jì)軟件的選擇第7頁/共110頁1)均值(準(zhǔn)確的稱呼應(yīng)為“樣本均值”)的統(tǒng)計(jì)學(xué)意義:反映隨機(jī)變量樣本的大小特征。
2)均值對應(yīng)于隨機(jī)變量總體的數(shù)學(xué)期望—總體的數(shù)學(xué)期望客觀上決定著樣本的均值,反過來,通過計(jì)算樣本的均值可以描述總體的數(shù)學(xué)期望。2.1均值的計(jì)算
:理論問題第8頁/共110頁3)在處理實(shí)驗(yàn)數(shù)據(jù)或采樣數(shù)據(jù)時(shí),經(jīng)常會遇到對相同采樣或相同實(shí)驗(yàn)條件下同一隨機(jī)變量的多個(gè)不同取值進(jìn)行統(tǒng)計(jì)處理的問題。
4)為找到代表這些觀測值總體大小特征的代表值(統(tǒng)計(jì)量,該統(tǒng)計(jì)量根據(jù)樣本數(shù)據(jù)算出),多數(shù)作者會不假思索地直接給出算術(shù)平均值和標(biāo)準(zhǔn)差。顯然,這種做法是不嚴(yán)謹(jǐn)?shù)摹灰欢偸钦_的2.1均值計(jì)算:理論問題(續(xù))
第9頁/共110頁在數(shù)理統(tǒng)計(jì)學(xué)中,作為描述隨機(jī)變量樣本的總體大小特征的統(tǒng)計(jì)量有算術(shù)平均值、幾何平均值和中位數(shù)等多個(gè)。何時(shí)用算術(shù)平均值?何時(shí)用幾何平均值?以及何時(shí)用中位數(shù)?這不能由研究者根據(jù)主觀意愿隨意確定,而要根據(jù)隨機(jī)變量的分布特征確定。2.2均值計(jì)算:技術(shù)問題第10頁/共110頁反映隨機(jī)變量總體大小特征的統(tǒng)計(jì)量是數(shù)學(xué)期望,而在隨機(jī)變量的分布服從正態(tài)分布時(shí),其數(shù)學(xué)期望就可以用樣本的算術(shù)平均值描述。此時(shí),可用樣本的算術(shù)平均值描述隨機(jī)變量的大小特征。如果所研究的隨機(jī)變量不服從正態(tài)分布,則算術(shù)平均值不能準(zhǔn)確反映該變量的大小特征。在這種情況下,可通過假設(shè)檢驗(yàn)來判斷隨機(jī)變量是否服從對數(shù)正態(tài)分布。如果服從對數(shù)正態(tài)分布,則幾何平均值就是數(shù)學(xué)期望的值。此時(shí),就可以計(jì)算變量的幾何平均值。如果隨機(jī)變量既不服從正態(tài)分布也不服從對數(shù)正態(tài)分布,則按現(xiàn)有的數(shù)理統(tǒng)計(jì)學(xué)知識,尚無合適的統(tǒng)計(jì)量描述該變量的大小特征。此時(shí),可用中位數(shù)來描述變量的大小特征。2.2均值計(jì)算:技術(shù)問題(續(xù))第11頁/共110頁在相關(guān)分析中,作者們常犯的錯(cuò)誤是:簡單地計(jì)算Pearson積矩相關(guān)系數(shù),而且既不給出正態(tài)分布檢驗(yàn)結(jié)果,也往往不明確指出所計(jì)算的相關(guān)系數(shù)就是Pearson積矩相關(guān)系數(shù)。在數(shù)理統(tǒng)計(jì)學(xué)中,除有針對數(shù)值變量設(shè)計(jì)的Pearson積矩相關(guān)系數(shù)(對應(yīng)于“參數(shù)方法”)外,還有針對順序變量(即“秩變量”)設(shè)計(jì)的Spearman秩相關(guān)系數(shù)和Kendall秩相關(guān)系數(shù)(對應(yīng)于“非參數(shù)方法”)等。Pearson積矩相關(guān)系數(shù)可用于描述2個(gè)隨機(jī)變量的線性相關(guān)程度,Spearman或Kendall秩相關(guān)系數(shù)用來判斷兩個(gè)隨機(jī)變量在二維和多維空間中是否具有某種共變趨勢。3相關(guān)分析:相關(guān)系數(shù)的選擇
第12頁/共110頁在相關(guān)分析中,計(jì)算各種相關(guān)系數(shù)是有前提條件的。在相關(guān)分析中,對于秩變量,一般別無選擇,只能計(jì)算Spearman或Kendall秩相關(guān)系數(shù)。對于數(shù)值變量,只要條件許可,應(yīng)盡量使用檢驗(yàn)功效最高的參數(shù)方法,即計(jì)算用Pearson積矩相關(guān)系數(shù)。只有計(jì)算Pearson積矩相關(guān)系數(shù)的前提不存在時(shí),才考慮退而求其次,計(jì)算專門為秩變量設(shè)計(jì)的Spearman或Kendall秩相關(guān)系數(shù)(盡管這樣做會導(dǎo)致檢驗(yàn)功效的降低)。3相關(guān)分析:相關(guān)系數(shù)的選擇第13頁/共110頁對于數(shù)值變量,相關(guān)系數(shù)選擇的依據(jù)是變量是否服從正態(tài)分布,或變換后的數(shù)據(jù)是否服從正態(tài)分布。對于二元相關(guān)分析,如果2個(gè)隨機(jī)變量服從二元正態(tài)分布假設(shè),則應(yīng)該用Pearson積矩相關(guān)系數(shù)描述這2個(gè)隨機(jī)變量間的相關(guān)關(guān)系。如果樣本數(shù)據(jù)不服從二元正態(tài)分布,則可嘗試進(jìn)行數(shù)據(jù)變換,看變換后的數(shù)據(jù)是否符合正態(tài)分布?如果是,則可以針對變換后的數(shù)據(jù)計(jì)算Pearson積矩相關(guān)系數(shù);否則,就不能計(jì)算Pearson積矩相關(guān)系數(shù),而應(yīng)改用檢驗(yàn)功效較低的Spearman或Kendall秩相關(guān)系數(shù)(此時(shí),如果強(qiáng)行計(jì)算Pearson積矩相關(guān)系數(shù)有可能會得出完全錯(cuò)誤的結(jié)論)。3相關(guān)分析:相關(guān)系數(shù)的選擇第14頁/共110頁相關(guān)分析和回歸分析是極為常用的2種數(shù)理統(tǒng)計(jì)方法,在環(huán)境科學(xué)及其它科學(xué)研究領(lǐng)域有著廣泛的用途。然而,由于這2種數(shù)理統(tǒng)計(jì)方法在計(jì)算方面存在很多相似之處,且在一些數(shù)理統(tǒng)計(jì)教科書中沒有系統(tǒng)闡明這2種數(shù)理統(tǒng)計(jì)方法的內(nèi)在差別,從而使一些研究者不能嚴(yán)格區(qū)分相關(guān)分析與回歸分析。4相關(guān)分析與回歸分析的區(qū)別
第15頁/共110頁1)最常見的錯(cuò)誤是:用回歸分析的結(jié)果解釋相關(guān)性問題。例如,作者將“回歸直線(曲線)圖”稱為“相關(guān)性圖”或“相關(guān)關(guān)系圖”;將回歸直線的R2(擬合度,或稱“可決系數(shù)”)錯(cuò)誤地稱為“相關(guān)系數(shù)”或“相關(guān)系數(shù)的平方”;根據(jù)回歸分析的結(jié)果宣稱2個(gè)變量之間存在正的或負(fù)的相關(guān)關(guān)系。
4相關(guān)分析與回歸分析的區(qū)別第16頁/共110頁2)相關(guān)分析與回歸分析均為研究2個(gè)或多個(gè)變量間關(guān)聯(lián)性的方法,但2種數(shù)理統(tǒng)計(jì)方法存在本質(zhì)的差別,即它們用于不同的研究目的。3)相關(guān)分析的目的在于檢驗(yàn)兩個(gè)隨機(jī)變量的共變趨勢(即共同變化的程度),回歸分析的目的則在于試圖用自變量來預(yù)測因變量的值。
4相關(guān)分析與回歸分析的區(qū)別第17頁/共110頁4)在相關(guān)分析中,兩個(gè)變量必須同時(shí)都是隨機(jī)變量,如果其中的一個(gè)變量不是隨機(jī)變量,就不能進(jìn)行相關(guān)分析。這是相關(guān)分析方法本身所決定的。
4相關(guān)分析與回歸分析的區(qū)別第18頁/共110頁5)對于回歸分析,其中的因變量肯定為隨機(jī)變量(這是回歸分析方法本身所決定的),而自變量則可以是普通變量(有確定的取值)也可以是隨機(jī)變量。
4相關(guān)分析與回歸分析的區(qū)別第19頁/共110頁6)如果自變量是普通變量,即模型Ⅰ回歸分析,采用的回歸方法就是最為常用的最小二乘法。7)如果自變量是隨機(jī)變量,即模型Ⅱ回歸分析,所采用的回歸方法與計(jì)算者的目的有關(guān)。在以預(yù)測為目的的情況下,仍采用“最小二乘法”(但精度下降—最小二乘法是專為模型Ⅰ設(shè)計(jì)的,未考慮自變量的隨機(jī)誤差);在以估值為目的(如計(jì)算可決系數(shù)、回歸系數(shù)等)的情況下,應(yīng)使用相對嚴(yán)謹(jǐn)?shù)姆椒ǎㄈ纭爸鬏S法”、“約化主軸法”或“Bartlett法”)。4相關(guān)分析與回歸分析的區(qū)別第20頁/共110頁8)顯然,對于回歸分析,如果是模型Ⅱ回歸分析,鑒于兩個(gè)隨機(jī)變量客觀上存在“相關(guān)性”問題,只是由于回歸分析方法本身不能提供針對自變量和因變量之間相關(guān)關(guān)系的準(zhǔn)確的檢驗(yàn)手段,因此,若以預(yù)測為目的,最好不提“相關(guān)性”問題;若以探索兩者的“共變趨勢”為目的,應(yīng)該改用相關(guān)分析。9)如果是模型Ⅰ回歸分析,就根本不可能回答變量的“相關(guān)性”問題,因?yàn)槠胀ㄗ兞颗c隨機(jī)變量之間不存在“相關(guān)性”這一概念(問題在于,大多數(shù)的回歸分析都是模型Ⅰ回歸分析?。?。此時(shí),即使作者想描述2個(gè)變量間的“共變趨勢”而改用相關(guān)分析,也會因相關(guān)分析的前提不存在而使分析結(jié)果毫無意義。4相關(guān)分析與回歸分析的區(qū)別第21頁/共110頁10)需要特別指出的是,回歸分析中的R2在數(shù)學(xué)上恰好是Pearson積矩相關(guān)系數(shù)r的平方。因此,這極易使作者們錯(cuò)誤地理解R2的含義,認(rèn)為R2就是“相關(guān)系數(shù)”或“相關(guān)系數(shù)的平方”。問題在于,對于自變量是普通變量(即其取值有確定性的變量)、因變量為隨機(jī)變量的模型Ⅰ回歸分析,2個(gè)變量之間的“相關(guān)性”概念根本不存在,又何談“相關(guān)系數(shù)”呢?11)更值得注意的是,一些早期的教科書作者不是用R2來描述回歸效果(擬合程度,擬合度)的,而是用Pearson積矩相關(guān)系數(shù)來描述。這就更容易誤導(dǎo)讀者。4相關(guān)分析與回歸分析的區(qū)別第22頁/共110頁5.1假設(shè)檢驗(yàn)基本思想統(tǒng)計(jì)推斷:是根據(jù)樣本數(shù)據(jù)推斷總體特征的一種方法。假設(shè)檢驗(yàn):是進(jìn)行統(tǒng)計(jì)推斷的途徑之一(另一種途徑是參數(shù)估計(jì),如點(diǎn)估計(jì)和區(qū)間估計(jì))。假設(shè)檢驗(yàn)中的關(guān)鍵問題:1)在原假設(shè)成立的情況下,如何計(jì)算樣本值或某一極端值發(fā)生的概率?2)如何界定小概率事件?5重要的數(shù)理統(tǒng)計(jì)學(xué)常識第23頁/共110頁基本思路
首先,對總體參數(shù)值提出假設(shè)(原假設(shè));然后,利用樣本數(shù)據(jù)提供的信息來驗(yàn)證所提出的假設(shè)是否成立(統(tǒng)計(jì)推斷)——如果樣本數(shù)據(jù)提供的信息不能證明上述假設(shè)成立,則應(yīng)拒絕該假設(shè);如果樣本數(shù)據(jù)提供的信息不能證明上述假設(shè)不成立,則不應(yīng)拒絕該假設(shè)。接受或拒絕原假設(shè)的依據(jù)小概率事件不可能發(fā)生。顯然,這樣做是有風(fēng)險(xiǎn)的(小概率事件真的發(fā)生了)。5.1假設(shè)檢驗(yàn)第24頁/共110頁基本步驟1)提出原假設(shè)(或稱“零假設(shè)”,H0);2)選擇檢驗(yàn)統(tǒng)計(jì)量;3)根據(jù)樣本數(shù)據(jù)計(jì)算檢驗(yàn)統(tǒng)計(jì)量觀測值的發(fā)生概率(相伴概率,p);4)根據(jù)給定的小概率事件界定標(biāo)準(zhǔn)(顯著性水平,如0.05,0.01)做出統(tǒng)計(jì)推斷。5.1假設(shè)檢驗(yàn)第25頁/共110頁基本步驟:為什么要設(shè)計(jì)并計(jì)算檢驗(yàn)統(tǒng)計(jì)量?在假設(shè)檢驗(yàn)中,樣本值(或更極端的取值)發(fā)生的概率不能直接通過樣本數(shù)據(jù)計(jì)算,而是通過計(jì)算檢驗(yàn)統(tǒng)計(jì)量觀測值的發(fā)生概率而間接得到的。所設(shè)計(jì)的檢驗(yàn)統(tǒng)計(jì)量一般服從或近似服從某種已知的理論分布(如t-分布、F-分布、卡方分布),易于估算其取值概率。對于不同的假設(shè)檢驗(yàn)和不同的總體,會有不同的選擇檢驗(yàn)統(tǒng)計(jì)量的理論和方法。5.1假設(shè)檢驗(yàn)第26頁/共110頁基本步驟:計(jì)算檢驗(yàn)統(tǒng)計(jì)量觀測值的發(fā)生概率在假定原假設(shè)成立的前提下,利用樣本數(shù)據(jù)計(jì)算檢驗(yàn)統(tǒng)計(jì)量觀測值發(fā)生的概率(即p值,又稱“相伴概率”—指該檢驗(yàn)統(tǒng)計(jì)量在某個(gè)特定的極端區(qū)域在原假設(shè)成立時(shí)的概率)。該概率值間接地給出了在原假設(shè)成立的條件下樣本值(或更極端值)發(fā)生的概率。5.1假設(shè)檢驗(yàn)第27頁/共110頁進(jìn)行統(tǒng)計(jì)推斷依據(jù)預(yù)先確定的“顯著性水平”(即α值),如0.01或0.05,決定是否拒絕原假設(shè)。如果p值小于α值,即認(rèn)為原假設(shè)成立時(shí)檢驗(yàn)統(tǒng)計(jì)量觀測值的發(fā)生是小概率事件,則拒絕原假設(shè)。否則,就接受原假設(shè)。5.1假設(shè)檢驗(yàn)第28頁/共110頁在假設(shè)檢驗(yàn)中,顯著性水平(Significantlevel,用α表示)的確定是假設(shè)檢驗(yàn)中至關(guān)重要的問題。顯著性水平是在原假設(shè)成立時(shí)檢驗(yàn)統(tǒng)計(jì)量的制落在某個(gè)極端區(qū)域的概率值。因此,如果取α=0.05,如果計(jì)算出的p值小于α
,則可認(rèn)為原假設(shè)是一個(gè)不可能發(fā)生的小概率事件。當(dāng)然,如果真的發(fā)生了,則犯錯(cuò)誤的可能性為5%。顯然,顯著性水平反映了拒絕某一原假設(shè)時(shí)所犯錯(cuò)誤的可能性,或者說,α是指拒絕了事實(shí)上正確的原假設(shè)的概率。5.2顯著性水平:概念與意義第29頁/共110頁α值一般在進(jìn)行假設(shè)檢驗(yàn)前由研究者根據(jù)實(shí)際的需要確定。常用的取值是0.05或0.01。對于前者,相當(dāng)于在原假設(shè)事實(shí)上正確的情況下,研究者接受這一假設(shè)的可能性為95%;對于后者,則研究者接受事實(shí)上正確的原假設(shè)的可能性為99%。顯然,降低α值可以減少拒絕原假設(shè)的可能性。因此,在報(bào)告統(tǒng)計(jì)分析結(jié)果時(shí),必須給出α值。
5.2顯著性水平:通常的取值第30頁/共110頁在進(jìn)行假設(shè)檢驗(yàn)時(shí),各種統(tǒng)計(jì)軟件均會給出檢驗(yàn)統(tǒng)計(jì)量觀測值以及原假設(shè)成立時(shí)該檢驗(yàn)統(tǒng)計(jì)量取值的相伴概率(即檢驗(yàn)統(tǒng)計(jì)量某特定取值及更極端可能值出現(xiàn)的概率,用p表示)。p值是否小于事先確定的α值,是接受或拒絕原假設(shè)的依據(jù)。如果p值小于事先已確定的α值,就意味著檢驗(yàn)統(tǒng)計(jì)量取值的可能性很小,進(jìn)而可推斷原假設(shè)成立的可能性很小,因而可以拒絕原假設(shè)。相反,如果p值大于事先已確定的α值,就不能拒絕原假設(shè)。5.2顯著性水平:進(jìn)行統(tǒng)計(jì)推斷第31頁/共110頁1)在計(jì)算機(jī)技術(shù)十分發(fā)達(dá),以及專業(yè)統(tǒng)計(jì)軟件功能十分強(qiáng)大的今天,計(jì)算檢驗(yàn)統(tǒng)計(jì)量及其相伴概率是一件十分容易的事情。2)然而,在20世紀(jì)90年代以前,只有服從標(biāo)準(zhǔn)正態(tài)分布的檢驗(yàn)統(tǒng)計(jì)量,人們可以直接查閱事先準(zhǔn)備好的標(biāo)準(zhǔn)正態(tài)分布函數(shù)表,從中獲得特定計(jì)算結(jié)果的相伴概率。而對于的服從t-分布、F-分布、卡方分布或其它特殊的理論分布的檢驗(yàn)統(tǒng)計(jì)量(大多數(shù)的假設(shè)檢驗(yàn)是這樣),人們無法直接計(jì)算相伴概率。人們通常查閱各類假設(shè)檢驗(yàn)的臨界值表進(jìn)行統(tǒng)計(jì)推斷。這些表格以自由度和很少的幾個(gè)相伴概率(通常為0.1、0.05和0.01)為自變量,以檢驗(yàn)統(tǒng)計(jì)量的臨界值為函數(shù)排列。5.3統(tǒng)計(jì)推斷:過去的回憶第32頁/共110頁3)在進(jìn)行統(tǒng)計(jì)推斷時(shí),人們使用上述臨界值表根據(jù)事先確定的顯著性水平,查閱對應(yīng)于某一自由度和特定相伴概率的檢驗(yàn)統(tǒng)計(jì)量的臨界值,然后將所計(jì)算出的檢驗(yàn)統(tǒng)計(jì)量與該臨界值相比較。如果檢驗(yàn)統(tǒng)計(jì)量的計(jì)算值大于臨界值,即實(shí)際的相伴概率小于事先規(guī)定的顯著性水平,便可拒絕原假設(shè)。否則,可接受原假設(shè)。5.3統(tǒng)計(jì)推斷:過去的回憶第33頁/共110頁在根據(jù)顯著性水平進(jìn)行統(tǒng)計(jì)推斷時(shí),應(yīng)注意原假設(shè)的性質(zhì)。以二元相關(guān)分析為例,相關(guān)分析中的原假設(shè)是“相關(guān)系數(shù)為零”(即2個(gè)隨機(jī)變量間不存在顯著的相關(guān)關(guān)系)。如果計(jì)算出的檢驗(yàn)統(tǒng)計(jì)量的相伴概率(p值)低于事先給定α值(如0.05),就可以認(rèn)為“相關(guān)系數(shù)為零”的可能性很低,既2個(gè)隨機(jī)變量之間存在顯著的相關(guān)關(guān)系。在正態(tài)分布檢驗(yàn)時(shí),原假設(shè)是“樣本數(shù)據(jù)來自服從正態(tài)分布的總體”。此時(shí),如果計(jì)算出的檢驗(yàn)統(tǒng)計(jì)量的相伴概率(p值)低于事先給定α值(如0.05),則表明數(shù)據(jù)不服從正態(tài)分布。只有p值高于α值時(shí),數(shù)據(jù)才服從正態(tài)分布。這與相關(guān)分析的假設(shè)檢驗(yàn)不同。5.4顯著性水平:舉例第34頁/共110頁作者在描述相關(guān)分析結(jié)果時(shí)常有的失誤是:僅給出相關(guān)系數(shù)的值,而不給出顯著性水平。這就無法判斷2個(gè)隨機(jī)變量間的相關(guān)性是否顯著。有時(shí)作者不是根據(jù)顯著性水平判斷相關(guān)關(guān)系是否顯著,而是根據(jù)相關(guān)系數(shù)的大小來推斷(相關(guān)系數(shù)越近1,則相關(guān)關(guān)系越顯著)。問題是,相關(guān)系數(shù)本身是一個(gè)基于樣本數(shù)據(jù)計(jì)算出的觀測值,其本身的可靠性尚需檢驗(yàn)。此外,作者在論文中常常用“顯著相關(guān)”和“極顯著相關(guān)”來描述相關(guān)分析結(jié)果,即認(rèn)為p值小于0.05就是顯著相關(guān)關(guān)系(或顯著相關(guān)),小于0.01就是極顯著相關(guān)關(guān)系(或極顯著相關(guān))。5.4顯著性水平:舉例第35頁/共110頁在假設(shè)檢驗(yàn)中,只有“顯著”和“不顯著”,沒有“極顯著”這樣的斷語。只要計(jì)算出的檢驗(yàn)統(tǒng)計(jì)量的相伴概率(p值)低于事先確定的α值,就可以認(rèn)為檢驗(yàn)結(jié)果“顯著”(相關(guān)分析的原假設(shè)是“相關(guān)系數(shù)為零”,故此處的“顯著”實(shí)際意味著“相關(guān)系數(shù)不為零”,或說“2個(gè)隨機(jī)變量間有顯著的相關(guān)關(guān)系”);同樣,只要計(jì)算出的檢驗(yàn)統(tǒng)計(jì)量的相伴概率(p值)高于事先確定的α值,就可以認(rèn)為檢驗(yàn)結(jié)果“不顯著”。
5.5統(tǒng)計(jì)推斷的注意事項(xiàng)第36頁/共110頁在進(jìn)行相關(guān)分析時(shí),不能同時(shí)使用0.05和0.01這2個(gè)顯著性水平來決定是否拒絕原假設(shè),只能使用其中的1個(gè)。
5.5統(tǒng)計(jì)推斷的注意事項(xiàng)第37頁/共110頁1)顯著和不顯著:描述相關(guān)關(guān)系是否存在。2)相關(guān)性強(qiáng)或不強(qiáng):在存在相關(guān)關(guān)系的前提下,這種相關(guān)關(guān)系的強(qiáng)或弱。可以認(rèn)為,相關(guān)系數(shù)越接近1,則相關(guān)性越強(qiáng)。聲明:第1)條是公認(rèn)的數(shù)理統(tǒng)計(jì)常識,但第2)條是個(gè)人理解,僅供參考。本文不對第2)條承擔(dān)責(zé)任。有關(guān)相關(guān)分析的斷語第38頁/共110頁1)假設(shè)檢驗(yàn)統(tǒng)計(jì)推斷:單側(cè)檢驗(yàn)與雙側(cè)檢驗(yàn)對于假設(shè)檢驗(yàn),其檢驗(yàn)統(tǒng)計(jì)量的異常取值有2個(gè)方向,即概率分布曲線的左側(cè)(對應(yīng)于過小的值)和右側(cè)(對應(yīng)于過大的值)。6重要的數(shù)理統(tǒng)計(jì)學(xué)常識第39頁/共110頁檢驗(yàn)統(tǒng)計(jì)量在左側(cè)和右側(cè)均有可能取值檢驗(yàn)統(tǒng)計(jì)量的極端取值檢驗(yàn)統(tǒng)計(jì)量的取值空間第40頁/共110頁一般情況下,概率分布函數(shù)曲線兩側(cè)尾端的小概率事件都要考慮(即雙側(cè)檢驗(yàn))。如果事先有把握確定其中的一側(cè)不可能取值,則僅需對另一側(cè)的小概率事件進(jìn)行檢驗(yàn)即可(單側(cè)檢驗(yàn))。在用“查表法”進(jìn)行統(tǒng)計(jì)推斷時(shí),基于單側(cè)小概率事件檢驗(yàn)的臨界值表稱“單尾表”,基于雙側(cè)小概率事件檢驗(yàn)的臨界值表稱“雙尾表”。除t-分布臨界值表是雙尾表外,大多數(shù)的檢驗(yàn)臨界值表均為單尾表。單側(cè)檢驗(yàn)與雙側(cè)檢驗(yàn)第41頁/共110頁在顯著性水平一定的情況下(例如α=0.05),對于單尾表,單側(cè)檢驗(yàn)時(shí)仍使用α進(jìn)行統(tǒng)計(jì)推斷,雙側(cè)檢驗(yàn)則用α/2進(jìn)行統(tǒng)計(jì)推斷;對于雙尾表,單側(cè)檢驗(yàn)時(shí)改用2α進(jìn)行統(tǒng)計(jì)推斷,雙側(cè)檢驗(yàn)則用α
進(jìn)行統(tǒng)計(jì)推斷。在統(tǒng)計(jì)軟件(如SPSS或SAS統(tǒng)計(jì)軟件)給出的計(jì)算結(jié)果中,已標(biāo)注出所計(jì)算的相伴概率是單側(cè)還是雙側(cè),對應(yīng)于上述的單尾表和雙尾表。單側(cè)檢驗(yàn)與雙測檢驗(yàn)第42頁/共110頁以下是SPSS中的單樣本t檢驗(yàn)輸出結(jié)果:One-SampleTest(原假設(shè):儲戶1次平均存取的現(xiàn)金與2000元無顯著差異)TestValue=2000(均值比較的參比值)t=1.240(檢驗(yàn)統(tǒng)計(jì)量的觀測值)df=312(自由度,樣本量N=313)Sig.(2-tailed)=0.216(雙側(cè)相伴概率p
)MeanDifference=473.78(均值的標(biāo)準(zhǔn)誤差)95%ConfidenceIntervaloftheDifference(總體均值與原假設(shè)值之差的95%的置信區(qū)間):-278.13~1225.69(有95%的把握可認(rèn)為:儲戶1次平均存取的金額為1721.87~3225.69元)單側(cè)檢驗(yàn)與雙側(cè)檢驗(yàn)第43頁/共110頁上述檢驗(yàn)屬“均值比較”,是雙側(cè)檢驗(yàn)(大于或小于2000元都算拒絕原假設(shè)),計(jì)算的相伴概率也是雙側(cè)的。因此,可直接用p與α比較。取α=0.05,則因p大于α,故不能拒絕原假設(shè)(不是小概率事件)。統(tǒng)計(jì)推斷結(jié)果:根據(jù)313個(gè)儲戶調(diào)查數(shù)據(jù),每個(gè)儲戶一次平均存取金額大體為2000元。單側(cè)檢驗(yàn)與雙側(cè)檢驗(yàn)第44頁/共110頁在統(tǒng)計(jì)軟件中,可通過選擇TestofSignificance選項(xiàng)來控制所輸出的相伴概率是單尾(1tailed)概率還是雙尾(2tailed)概率。單側(cè)檢驗(yàn)與雙側(cè)檢驗(yàn)第45頁/共110頁2)正態(tài)分布檢驗(yàn)?zāi)康模簷z驗(yàn)樣本是否來自正態(tài)分布的總體原假設(shè):樣本來自正態(tài)分布的總體分布檢驗(yàn)只能使用非參數(shù)方法(只有分布形式已知時(shí)才能使用參數(shù)方法)。不同的統(tǒng)計(jì)軟件給出了不同的檢驗(yàn)方法。6重要的數(shù)理統(tǒng)計(jì)學(xué)常識第46頁/共110頁在SAS中,提供了Shapiro-Wilk(適用于樣本量小于50的情形)檢驗(yàn)法。此檢驗(yàn)無單尾、雙尾之分。在SPSS中提供了卡方檢驗(yàn)(Chi-SquareTest)和單樣本的Kolmogorov-Smirnov(柯爾莫哥洛夫-斯米爾諾夫,簡稱K-S)檢驗(yàn)。后者比前者精確一些,建議采用。正態(tài)分布檢驗(yàn)第47頁/共110頁單樣本的Kolmogorov-Smirnov(柯爾莫哥洛夫-斯米爾諾夫,簡稱K-S)檢驗(yàn)屬于雙側(cè)檢驗(yàn),計(jì)算檢驗(yàn)統(tǒng)計(jì)量(Z)的雙尾概率。正態(tài)分布檢驗(yàn)第48頁/共110頁3)均值比較a)將樣本均值與某一特定值相比:t-檢驗(yàn)(參數(shù)檢驗(yàn))原假設(shè):總體均值與特定值無顯著差異前提:樣本來自正態(tài)分布的總體雙側(cè)檢驗(yàn):是否等于。單側(cè)檢驗(yàn):已知不可能大于(或不可能小于),檢驗(yàn)是否等于。b)比較2個(gè)獨(dú)立樣本均值:t-檢驗(yàn)(參數(shù)檢驗(yàn))原假設(shè):2個(gè)樣本所代表的2個(gè)總體的均值無顯著差異用于對2個(gè)來自正態(tài)分布總體的樣本的大小進(jìn)行比較,且2個(gè)樣本相互獨(dú)立(無相關(guān)關(guān)系)。改檢驗(yàn)有單側(cè)和雙側(cè)之分。6重要的數(shù)理統(tǒng)計(jì)學(xué)常識第49頁/共110頁3)均值比較c)比較2個(gè)獨(dú)立總體大小的非參數(shù)檢驗(yàn)適用于對2個(gè)順序變量的大小進(jìn)行比較或?qū)?個(gè)不服從正態(tài)分布的數(shù)值變量的大小進(jìn)行比較“Mann-WhitneyU”
檢驗(yàn):適合樣本量較大的樣本。
“Wilcoxon秩和”檢驗(yàn):與“Mann-WhitneyU”
檢驗(yàn)在本質(zhì)上完全等價(jià)。Kolmogorov單側(cè)檢驗(yàn):適用于樣本量較小的樣本。5重要的數(shù)理統(tǒng)計(jì)學(xué)常識第50頁/共110頁3)均值比較d)比較多個(gè)來自正態(tài)分布總體的樣本均值的檢驗(yàn)方法:單因子方差分析(single-factoranova)。對于將因子作為固定處理(而不是隨機(jī)變量)的情形,即模型1單因子方差分析,實(shí)際上可以看作比較2個(gè)總體均值的t-檢驗(yàn)的直接推廣。該方法屬于參數(shù)檢驗(yàn)。有關(guān)假定:多個(gè)樣本相互獨(dú)立、樣本均服從正態(tài)分布、方差同質(zhì)性(各個(gè)樣本的方差大小沒有顯著差異)等。原假設(shè):各樣本的均值間無顯著差異,即某影響因子的不同取值(等級)對各樣本的大小沒有影響。5重要的數(shù)理統(tǒng)計(jì)學(xué)常識第51頁/共110頁3)均值比較d)比較多個(gè)來自非正態(tài)分布總體的樣本均值的檢驗(yàn)方法:Kruskal-Wallis檢驗(yàn):該方法基于順序變量設(shè)計(jì),用于檢驗(yàn)3個(gè)以上獨(dú)立樣本是否來自大小相同的總體,是應(yīng)用最廣泛的非參數(shù)檢驗(yàn)方法。推廣的中位數(shù)檢驗(yàn):用于檢驗(yàn)3個(gè)以上的獨(dú)立樣本是否來自中位數(shù)無顯著差異的樣本。該方法檢驗(yàn)功效低,不推薦采用。原假設(shè):各獨(dú)立樣本所代表的總體的中位數(shù)無顯著差異。Friedman秩方差分析:用于檢驗(yàn)3個(gè)以上相關(guān)樣本是否來自大小相同的總體。5重要的數(shù)理統(tǒng)計(jì)學(xué)常識第52頁/共110頁2.4Cd、Pb之間的交互作用如表4所示,三種花卉植物各部位對重金屬Cd、Pb的積累量與培養(yǎng)溶液中所投加的Cd、Pb量之間,可以很恰當(dāng)?shù)乇桓鞫嘣貧w方程表示出來,它們之間呈極顯著相關(guān)關(guān)系(P<0.01),并且各部位的Cd、Pb積累量與溶液中所投加的該種重金屬濃度之間也呈極顯著相關(guān)關(guān)系,各對應(yīng)偏相關(guān)系數(shù)的差異性顯著標(biāo)準(zhǔn)值P都小于0.01。對于鳳仙花,其地上部積累Cd量與所投加的Pb量呈顯著正相關(guān),而根部卻與所投加的Pb量呈負(fù)相關(guān),但這種作用是不顯著的,因此可認(rèn)為根部積累Cd量與所投加的Pb量無關(guān),地上部和根部積累的Pb量與所投加的Cd量都呈負(fù)相關(guān),只不過對于前者是極顯著的,對于后者不顯著,因此可認(rèn)為,Pb對鳳仙花地上部積累Cd有顯著的促進(jìn)作用,而Cd對鳳仙花地上部積累Pb有極顯著的抑制作用,兩種情況下對于根部卻都沒有明顯影響。對于金盞菊,其地上部和根部積累Cd量與所投加的Pb量呈負(fù)相關(guān),但只對根部是顯著的,而對于地上部Pb積累量與所投加的Cd量之間呈顯著負(fù)相關(guān),對于根部Pb積累量反而成顯著正相關(guān)??傊?,Pb對金盞菊根部積累Cd有抑制作用,而Cd對金盞菊地上部吸收Pb有抑制作用,對根部積累Pb有促進(jìn)作用。案例1第53頁/共110頁有相關(guān)性,但不顯著(p>0.05);有相關(guān)性,顯著(0.05>p>0.01);有相關(guān)性,極顯著(p<0.01).案例1中隱含的相關(guān)性的判定標(biāo)準(zhǔn)第54頁/共110頁3.3BDE209與ΣPBDEs的相關(guān)分析運(yùn)用統(tǒng)計(jì)軟件SPSS對各研究區(qū)域中BDE209與ΣPBDEs進(jìn)行相關(guān)分析.用K-S檢驗(yàn)對變量(BDE209和ΣPBDEs)進(jìn)行正態(tài)分布檢驗(yàn)發(fā)現(xiàn),珠江(p>0.200)、珠江口(p>0.091)和澳門水域(p>0.110)呈正態(tài)分布(α=0.05).因此對珠江、珠江口和澳門水域進(jìn)行Pearson相關(guān)分析,對東江、西江和南海北部海域進(jìn)行Kendall相關(guān)分析.從表2可以看出,除澳門水域外其它研究區(qū)域,BDE209與ΣPBDEs相關(guān)性不顯著(r<0.434,p>0.047),這是由于BDE209與其它PBDEs同系物分別來自不同的溴代阻燃劑;但澳門水域沉積物中的BDE209與ΣPBDEs相關(guān)性顯著(r=0.955,p=0)(圖5),表明澳門水域BDE209和其它其它PBDEs同系物具有相同的輸入途徑,正如上述,它們主要都是通過水體中顆粒物輸入的,它們之間較高的相關(guān)性是PBDEs在水體顆粒物中再分配的結(jié)果,這也證實(shí)了澳門水域是珠三角水體環(huán)境中PBDEs的“匯”.案例2第55頁/共110頁案例3圖2b表明,1/qN對1/D有很好的線性關(guān)系,相關(guān)系數(shù)R=0.9922(R2=0.9845)。第56頁/共110頁案例4HA對有機(jī)農(nóng)藥甲基對硫磷、西維因、克百威的吸附等溫線見圖3,用線性吸附方程擬合甲基對硫磷、西維因和克百威的吸附等溫線,擬合結(jié)果見表3。線性吸附方程為:
Q=KdCe+A
(1)式中Q為吸附量(mg/kg);Ce為平衡濃度(mg/l);Kd為線性吸附平衡常數(shù),A為線性方程待定常數(shù)。用HA總有機(jī)碳標(biāo)化有機(jī)農(nóng)藥的吸附系數(shù)Kd得有機(jī)碳標(biāo)化吸附系數(shù)Koc,有機(jī)農(nóng)藥在HA上的Koc值見表3。由圖3、表3可知,甲基對硫磷、西維因和克百威在HA上的吸附等溫線較好的符合線性吸附方程,相關(guān)系數(shù)在0.8748~0.9940之間,但是克百威的相關(guān)系數(shù)要小于甲基對硫磷和西維因;從整體上看有機(jī)農(nóng)藥在HA上的Kd大小順序?yàn)椋核馓幚鞨A>原始HA>肟化處理HA>氧化處理HA。第57頁/共110頁案例6在下表中,作者將回歸方程的可決系數(shù)誤稱為“相關(guān)系數(shù)”。第58頁/共110頁早期的研究表明有機(jī)污染物通過分配作用吸附到土壤/沉積物有機(jī)質(zhì)上,其吸附量與有機(jī)碳含量和有機(jī)污染物的辛醇-水分配系數(shù)成正比[3]。從甲基對硫磷、西維因和克百威分配系數(shù)Kd與改性HA有機(jī)碳含量的關(guān)系可知(見圖4),Kd與HA的有機(jī)碳含量成正比,但相關(guān)性不高分別為:0.7429、0.8870和0.6900,這表明有機(jī)農(nóng)藥在HA上的吸附行為不是由HA的有機(jī)碳含量唯一確定,還受到其他因素的影響。圖5為有機(jī)農(nóng)藥在處理前后HA上的有機(jī)碳標(biāo)化吸附系數(shù)Koc對數(shù)(lgKoc)與三種有機(jī)農(nóng)藥辛醇-水分配系數(shù)Kow對數(shù)(lgKow)之間的關(guān)系曲線,lgKoc與lgKow呈現(xiàn)較好的線性關(guān)系,相關(guān)系數(shù)分別為:0.8573、0.8367、0.8420和0.9408,可見用辛醇-水分配系數(shù)來預(yù)測有機(jī)污染物在土壤/沉積物上的吸附具有一定的合理性[3]。案例7第59頁/共110頁案例8圖6Kd與腐殖酸O元素含量和H/C比的相關(guān)性Fig6CorrelationofKdandOcontentandH/Crateofthehumicacids第60頁/共110頁案例9圖4為取每天19:00的DO值與葉綠素值做的趨勢圖,通過分析它們數(shù)據(jù)得出它們的相關(guān)性為0.8899,在一定程度上能反映藻類的變化趨勢??梢宰鳛樵孱愒鲩L趨勢的預(yù)報(bào)指標(biāo)。
第61頁/共110頁作圖得到一條直線見圖6,二級動(dòng)力學(xué)速率方程可很好的描述Cu2+、Cd2+在生物膜上的吸附(RCu=0.9989,RCd=0.9978)。案例10第62頁/共110頁案例11第63頁/共110頁
由表1可知,0~5cm土壤層中,活動(dòng)區(qū)土壤微生物生物量碳和緩沖區(qū)土壤微生物生物量碳分別比背景區(qū)土壤微生物生物量碳降低了65.96%和20.05%,而活動(dòng)區(qū)土壤微生物生物量碳比緩沖區(qū)土壤微生物生物量碳降低了57.42%,并且3個(gè)試驗(yàn)區(qū)的差異均達(dá)到顯著水平(P<0.05).5~15cm土壤層中,活動(dòng)區(qū)土壤微生物生物量碳比緩沖區(qū)土壤微生物生物量碳降低了43.14%,而緩沖區(qū)土壤微生物生物量碳比背景區(qū)土壤微生物生物量碳降低了13.85%,3個(gè)試驗(yàn)區(qū)的差異也均達(dá)到顯著水平(P<0.05).15~25cm土壤層中,活動(dòng)區(qū)土壤微生物生物量碳比緩沖區(qū)土壤微生物生物量碳降低了18.58%,而緩沖區(qū)土壤微生物生物量碳只比背景區(qū)土壤微生物生物量碳降低了11.06%,但3個(gè)試驗(yàn)區(qū)的差異均達(dá)到顯著水平(P<0.05).
案例11(續(xù))第64頁/共110頁由表2可知,在0~5cm土壤層和5~15cm土壤層,旅游踩踏對土壤微生物生物量氮的影響與對土壤微生物生物量碳的影響是相似的.但在15~25cm土壤層,活動(dòng)區(qū)土壤微生物生物量氮比背景區(qū)土壤微生物生物量氮低,并且達(dá)到顯著水平(P<0.05);緩沖區(qū)土壤微生物生物量氮與活動(dòng)區(qū)土壤微生物生物量氮的差異也達(dá)到顯著水平(P<0.05);緩沖區(qū)土壤微生物生物量氮雖然比背景區(qū)土壤微生物生物量氮低,但2個(gè)試驗(yàn)區(qū)的差異沒達(dá)到顯著水平(P>0.05).案例11(續(xù))第65頁/共110頁2.10相關(guān)性分析所有相關(guān)數(shù)據(jù)分析,通過SPSS10.0軟件分析完成,采用t測驗(yàn)法檢驗(yàn)相關(guān)系數(shù)的顯著性。
案例12第66頁/共110頁案例12(續(xù))表2:噴灑菌株與TSNA與硝酸鹽、亞硝酸鹽的相關(guān)性及顯著性分析Table2:ThecorrelationandsignificantanalysisofsprayingWB5withnitrate,nitrite注:**極顯著*顯著第67頁/共110頁從表2可知,晾制期間煙葉中WB5的菌量與硝酸鹽含量幾乎沒有相關(guān)性,而與亞硝酸鹽、NNN和總TSNA都存在著顯著的負(fù)相關(guān)性,與NAT+NAB存在極顯著的負(fù)相關(guān)性,而與NNK的負(fù)相關(guān)性則不顯著。結(jié)果表明,噴灑WB5菌株可以明顯降低煙葉中的TSNA含量,對煙草的安全性來說,最主要是降低用于卷煙煙葉中的有害物質(zhì),因此,該菌株對提高煙草安全性有積極的意義。案例12(續(xù))第68頁/共110頁從表3可知,亞硝酸鹽與硝酸鹽存在一定的相關(guān)性,相關(guān)系數(shù)為0.4875,但不顯著。而各種TSNA及其總量與亞硝酸鹽都存在著顯著的相關(guān)性,尤其是與NNN、NAT+NAB和TSNA之間有極顯著的相關(guān)性。TSNA總量與NNN、NAT+NAB和NNK都具有極顯著相關(guān)性,但與NNK的相關(guān)性稍低。而NNK與NNN、NAT+NAB也存在著顯著的相關(guān)性,NNN與NAT+NAB之間的相關(guān)性極為顯著。案例12(續(xù))第69頁/共110頁案例13第70頁/共110頁案例14第71頁/共110頁案例15第72頁/共110頁案例16第73頁/共110頁2.1苦草現(xiàn)存量增加百分比的變化由圖1可知,在Hg2+、Cd2+和Hg2++Cd2+三種脅迫下,苦草的現(xiàn)存量增加百分比均隨著金屬離子濃度的增加而下降,其中在Hg2+或Hg2++Cd2+>5μmol/L時(shí)急劇下降,即快速致死,而在Cd2+脅迫下,現(xiàn)存量增加百分比隨脅迫程度的增加呈逐步下降趨勢,說明Hg2+和Hg2++Cd2+復(fù)合對苦草的毒性遠(yuǎn)大于Cd2+。經(jīng)相關(guān)分析,苦草現(xiàn)存量增加百分比與金屬離子濃度間顯著負(fù)相關(guān),其決定系數(shù)R2分別為0.893,0.87,0.886,P<0.05。案例17(初稿)第74頁/共110頁2.2對苦草光合與呼吸作用的影響苦草的Pg、Pn、R是隨著金屬離子濃度的增加而下降(圖2)。Pg、Pn與金屬離子濃度間在Cd2+、以及Hg2++Cd2+復(fù)合脅迫時(shí)呈明顯負(fù)相關(guān),其決定系數(shù)R2的范圍是0.744~0.876(P<0.05)。R與金屬離子濃度間只有復(fù)合脅迫時(shí)明顯負(fù)相關(guān),其決定系數(shù)R2=0.726(P<0.05)。案例17(初稿:續(xù)1)第75頁/共110頁2.3對苦草葉綠素含量的影響3種處理均導(dǎo)致葉綠素含量隨著時(shí)間的延長和金屬離子濃度的增加而降低,但略有波動(dòng)(圖3)。在低濃度脅迫時(shí)(≤2.5μmol/L,下同)葉綠素含量升高(Hg2+處理72h時(shí)降低),之后較明顯地降低;葉綠素含量與金屬離子的濃度除Hg2+、Cd2+單一脅迫6h時(shí)外,其他明顯負(fù)相關(guān);其決定系數(shù)R2的范圍是0.669~0.850(P<0.05)。案例17(初稿:續(xù)2)第76頁/共110頁2.4對苦草可溶性蛋白濃度的影響總體上看,3種處理均導(dǎo)致苦草可溶性蛋白含量隨著時(shí)間的延長和金屬離子濃度的增加而明顯降低,但略有波動(dòng)(圖4)。在單一Hg2+和復(fù)合處理時(shí),可溶性蛋白含量在低濃度脅迫時(shí),基本保持穩(wěn)定或略有升高,之后,除單一Hg2+處理6h時(shí)蛋白質(zhì)含量隨金屬離子濃度增加而緩慢下降外,其他均隨著時(shí)間的延長和金屬離子濃度的增加而較大幅度下降;在單一Cd2+處理時(shí),可溶性蛋白含量在≤10μmol/L濃度時(shí)穩(wěn)定或升高,之后相對較緩慢地降低。經(jīng)回歸分析,蛋白質(zhì)含量與金屬離子的濃度在Hg2+脅迫24h、Cd2+脅迫72h、以及復(fù)合脅迫24h和72h時(shí)呈明顯負(fù)相關(guān);其決定系數(shù)R2的范圍是0.684~0.763(P<0.05)。案例17(初稿:續(xù)3)第77頁/共110頁2.5對苦草POD活性的影響由圖5可知,在Hg2+和Hg2++Cd2+復(fù)合脅迫時(shí),6h時(shí)POD活性穩(wěn)定或隨金屬離子濃度的增加而緩慢上升,24h時(shí)先明顯升高,在Hg2+=10μmol/L、Hg2++Cd2+=20μmol/L時(shí)達(dá)最高,之后下降,72h時(shí)金屬離子濃度在5μmol/L前明顯上升,之后下降至最低。兩者間的變化趨勢相似,即隨著脅迫濃度和時(shí)間的增加,POD的活性逐步增大,超過一定限度后,開始降低。而在Cd2+單一脅迫下,POD活性除在最高濃度和最長時(shí)間脅迫(即最大脅迫)下略有降低外,均隨脅迫強(qiáng)度的增加而增加。經(jīng)相關(guān)分析,在Hg2+脅迫72h時(shí),POD活性與金屬離子濃度間顯著負(fù)相關(guān)(決定系數(shù)R2=0.773,P<0.05),在Cd2+脅迫6和24h,Hg2++Cd2+復(fù)合脅迫6h時(shí),POD活性與金屬離子濃度間顯著正相關(guān),決定系數(shù)R2分別為0.989,0.994(P<0.01)和0.774(P<0.05)。案例17(初稿:續(xù)4)第78頁/共110頁2.6對苦草SOD活性的影響由圖6可知,SOD活性與POD活性的變化趨勢基本一致,但在40μmol/L的Hg2+和Hg2++Cd2+復(fù)合脅迫6h時(shí),SOD活性是降低的。經(jīng)相關(guān)分析,在Cd2+脅迫6和24h時(shí),SOD活性與金屬離子濃度間顯著正相關(guān)(決定系數(shù)R2分別為0.899,0.86,P<0.01)。案例17(初稿:續(xù)5)第79頁/共110頁案例17來稿之初審結(jié)果:修改后送審修改意見:5)第2.1節(jié)“經(jīng)相關(guān)分析,現(xiàn)存量增加百分比與金屬離子濃度間顯著負(fù)相關(guān),其決定系數(shù)R2(2是上角標(biāo))分別為0.893,0.87,0.886,P<0.05?!边@段文字存在常識性錯(cuò)誤。相關(guān)分析計(jì)算的是“相關(guān)系數(shù)”(其符號是r)而不是“決定系數(shù)”(符號是R2(2是上角標(biāo))),決定系數(shù)是回歸分析中應(yīng)計(jì)算的統(tǒng)計(jì)參數(shù)。作者進(jìn)行的是相關(guān)分析還是回歸分析?此外,按照數(shù)理統(tǒng)計(jì)常識,關(guān)于相關(guān)系數(shù),有Pearson相關(guān)系數(shù),還有Spearman或Kendall秩相關(guān)系數(shù)。如果沒有特別指出,r就是Pearson相關(guān)系數(shù)。但是,Pearson相關(guān)系數(shù)僅在樣本數(shù)據(jù)的分布服從正態(tài)分布時(shí)才有意義。如果樣本數(shù)據(jù)不服從正態(tài)分布,則必須計(jì)算Spearman或Kendall秩相關(guān)系數(shù)。請作者確認(rèn),你計(jì)算的是否為Pearson相關(guān)系數(shù)?如果是,則請報(bào)告正態(tài)分布檢驗(yàn)結(jié)果,以證明計(jì)算此相關(guān)系數(shù)是妥當(dāng)?shù)?。按?guī)定需要作者報(bào)告相關(guān)分析時(shí)使用的統(tǒng)計(jì)軟件(如SPSS,SAS)……案例17(初審意見)第80頁/共110頁2.2測試指標(biāo)與方法
……實(shí)驗(yàn)結(jié)果為三次平均值。用Spss11.5軟件進(jìn)行相關(guān)分析,采用Kendall相關(guān)系數(shù)。案例17(修改結(jié)果)第81頁/共110頁3結(jié)果(Results)3.1苦草現(xiàn)存量增加百分比的變化由圖1可知,在Hg2+、Cd2+和Hg2++Cd2+三種脅迫下,苦草的現(xiàn)存量增加百分比均隨著金屬離子濃度的增加而下降,其中在Hg2+或Hg2++Cd2+>5μmol·L-1時(shí)急劇下降,即快速致死,而在Cd2+脅迫下,現(xiàn)存量增加百分比隨脅迫程度的增加呈逐步下降趨勢,說明Hg2+和Hg2++Cd2+復(fù)合對苦草的毒性遠(yuǎn)大于Cd2+。經(jīng)相關(guān)分析,現(xiàn)存量增加百分比與金屬離子濃度間極顯著負(fù)相關(guān),其相關(guān)系數(shù)r分別為-0.933**,-0.945**,-0.941**(*為顯著,**為極顯著,下同)。案例17(修改結(jié)果:續(xù)1)第82頁/共110頁3.2對苦草光合與呼吸作用的影響苦草的Pg、Pn、R是隨著金屬離子濃度的增加而下降(圖2)。三者與金屬離子濃度間顯著或極顯著負(fù)相關(guān),其相關(guān)系數(shù)r的范圍是-0.600*~-0.966**。3.3對苦草葉綠素含量的影響3種處理均導(dǎo)致葉綠素含量隨著時(shí)間的延長和金屬離子濃度的增加而降低,但略有波動(dòng)(圖3)。在低濃度脅迫時(shí)(≤2.5μmol·L-1,下同)葉綠素含量升高(Hg2+處理72h時(shí)降低),之后較明顯地降低;葉綠素含量與金屬離子的濃度除Hg2+脅迫6、24h和Cd2+脅迫6h外,其他顯著或極顯著負(fù)相關(guān);其相關(guān)系數(shù)r的范圍是-0.690*~-969**。
案例17(修改結(jié)果:續(xù)2)第83頁/共110頁總體上看,3種處理均導(dǎo)致苦草可溶性蛋白含量隨著時(shí)間的延長和金屬離子濃度的增加而明顯降低,但略有波動(dòng)(圖4)。在單一Hg2+和復(fù)合處理時(shí),可溶性蛋白含量在低濃度脅迫時(shí),基本保持穩(wěn)定或略有升高,之后,除單一Hg2+處理6h時(shí)蛋白質(zhì)含量隨金屬離子濃度增加而緩慢下降外,其他均隨著時(shí)間的延長和金屬離子濃度的增加而較大幅度下降;在單一Cd2+處理時(shí),可溶性蛋白含量在≤10μmol·L-1濃度時(shí)穩(wěn)定或升高,之后相對較緩慢地降低。經(jīng)相關(guān)分析,蛋白質(zhì)含量與金屬離子的濃度在Hg2+脅迫24、72h,復(fù)合脅迫6、24和72h時(shí)極顯著負(fù)相關(guān),相關(guān)系數(shù)r的范圍是-0.867**~-0.969**;Cd2+脅迫72h時(shí)顯著負(fù)相關(guān),r=-0.600*。案例17(修改結(jié)果:續(xù)3)
3.4對苦草可溶性蛋白濃度的影響第84頁/共110頁3.5對苦草POD活性的影響由圖5可知,在Hg2+和Hg2++Cd2+復(fù)合脅迫時(shí),6h時(shí)POD活性穩(wěn)定或隨金屬離子濃度的增加而緩慢上升,24h時(shí)先明顯升高,在Hg2+=10μmol·L-1、Hg2++Cd2+=20μmol·L-1時(shí)達(dá)最高,之后下降,72h時(shí)金屬離子濃度在5μmol·L-1前明顯上升,之后下降至最低。兩者間的變化趨勢相似,即隨著脅迫濃度和時(shí)間的增加,POD的活性逐步增大,超過一定限度后,開始降低。而在Cd2+單一脅迫下,POD活性除在最高濃度和最長時(shí)間脅迫(即最大脅迫)下略有降低外,均隨脅迫強(qiáng)度的增加而增加。經(jīng)相關(guān)分析,在Cd2+脅迫6、24、72h,Hg2++Cd2+復(fù)合脅迫6h時(shí),POD活性與金屬離子濃度間顯著或極顯著正相關(guān),相關(guān)系數(shù)r分別為0.828*,0.997**,0.733*,0.828*。案例17(修改結(jié)果:續(xù)4)第85頁/共110頁由圖6可知,SOD活性與POD活性的變化趨勢基本一致,但在40μmol·L-1的Hg2+和Hg2++Cd2+復(fù)合脅迫6h時(shí),SOD活性是降低的。經(jīng)相關(guān)分析,在Cd2+脅迫6、24、72h時(shí),SOD活性與金屬離子濃度間顯著或極顯著正相關(guān),相關(guān)系數(shù)r分別為0.948**、0.927**、0.733*。
案例17(修改結(jié)果:續(xù)5)
3.6對苦草SOD活性的影響第86頁/共110頁1)在第2.2節(jié)中,請將“用Spss11.5軟件進(jìn)行相關(guān)分析,采用Kendall相關(guān)系數(shù)?!币痪湫薷臑椤氨狙芯恐械南嚓P(guān)分析用SPSS11.5軟件進(jìn)行。經(jīng)正態(tài)分布檢驗(yàn),因數(shù)據(jù)不服從正態(tài)分布,故相關(guān)分析時(shí)采用Kendall相關(guān)系數(shù)。”2)文中將p<0.05的情形(即在α=0.05下顯著)稱為“顯著”是可以的,但將p<0.01的情形(即在α=0.01下顯著)稱為“極顯著”就不妥。數(shù)理統(tǒng)計(jì)中無“極顯著”這樣的說法(盡管一些統(tǒng)計(jì)軟件教程中有這樣的提法,但這樣說不嚴(yán)瑾,也不規(guī)范)。因此,請全面修改第3章和結(jié)論一章中相應(yīng)的提法,將斷語統(tǒng)一改為“顯著相關(guān)”,將括號內(nèi)的注釋改為“(*表示在α=0.05下顯著,**表示在α=0.01下顯著)”。
案例17(復(fù)審意見)第87頁/共110頁初審結(jié)果:修改后送審修改意見:8)第3.3節(jié):作者實(shí)際進(jìn)行的是回歸分析而非相關(guān)分析?;貧w分析的結(jié)果并不能解釋相關(guān)性問題。請作者全面修改本節(jié)正文及圖、表中的相應(yīng)提法。如果作者不能理解回歸分析與相關(guān)分析的區(qū)別,請您登陸本刊網(wǎng)站查閱本刊編輯部發(fā)布的有關(guān)數(shù)理統(tǒng)計(jì)問題最新公告。類似“本試驗(yàn)在冬小麥-夏玉米輪作田也發(fā)現(xiàn)了類似現(xiàn)象.去除施肥影響后土壤N2O通量和地溫呈指數(shù)關(guān)系,并達(dá)到極顯著水平(P<0.001)(見圖3a)”這樣的提法欠妥(此后的行文中仍有此類錯(cuò)誤)。對于假設(shè)檢驗(yàn),顯著性的斷語只有“顯著”和“不顯著”,沒有“極顯著”這樣的說法(決不是p小于0.05就是“顯著”,p小于0.01就是“極顯著”)。按照通常做法,在下“顯著”或“不顯著”結(jié)論的同時(shí),還需注明顯著性水平α(α通常取0.05或0.01)。表3中的“關(guān)系式”應(yīng)為“回歸方程”,可決系數(shù)(不是“相關(guān)系數(shù)”)R應(yīng)寫為R2(2為平方)。此外,表3的表下注“**P<0.001”應(yīng)為“**P<0.01”。圖3和第3.3.4節(jié)所列各回歸方程中R也應(yīng)修改為R2(2為平方)。案例18第88頁/共110頁氮肥施用對紫色土-玉米根系系統(tǒng)N2O排放的影響摘要:利用靜態(tài)箱-氣相色譜法對不同施氮水平和氮肥品種處理的石灰性紫色土下玉米根系-土壤系統(tǒng)的N2O排放變化進(jìn)行了觀測。結(jié)果表明,N2O排放通量在施肥及降雨后的短時(shí)間內(nèi)都會出現(xiàn)峰值,土壤水分含量高且較長時(shí)間保持穩(wěn)定不利于N2O的排放。不施肥條件下,土壤-作物根系系統(tǒng)N2O的排放量為0.88kg·hm-2~0.90kg·hm-2;施用氮肥顯著地增加了N2O排放,N2O的排放量為1.27kg·hm-2~2.52kg·hm-2。施氮量越高,N2O排放量也越高,中氮和高氮處理的排放量分別為2.19kg·hm-2和2.52kg·hm-2;N2O排放量分別占施氮量的0.87%和0.66%。氮肥品種對N2O排放的影響也十分顯著。尿素、硫酸銨和硝酸鉀處理的排放量分別為2.09kg·hm-2、1.80kg·hm-2和1.27kg·hm-2;銨態(tài)氮肥和硝態(tài)氮肥的N2O排放量分別占施氮量的0.60%和0.26%,顯著或極顯著地低于施用酰胺態(tài)氮肥(0.80%)。此外,玉米根系也是N2O的主要排放源。案例19第89頁/共110頁1.2試驗(yàn)設(shè)計(jì)氮肥施用水平試驗(yàn)設(shè)3個(gè)處理,分別為不施肥(CK:0kg·hm-2);中等施氮(MN:150kg·hm-2);高氮(HN:250kg·hm-2)。同時(shí),在中氮處理區(qū)兩行玉米間設(shè)置空白處理(MN-NP:不種玉米,施肥),施用氮肥為尿素。氮肥品種試驗(yàn)設(shè)4個(gè)處理,以尿素-酰胺態(tài)氮肥(UN,Urea)、硫酸銨-銨態(tài)氮肥(AN,AmmoniumSulphate)及硝酸鉀-硝態(tài)氮肥(NN,PotassiumNitrate)等作為氮肥供給來源,以不施氮肥作為對照(CK)。氮肥施用量為150kg·hm-2
……
1.5數(shù)據(jù)處理試驗(yàn)結(jié)果中所有數(shù)據(jù)的處理和作圖皆由EXCELL2003完成;統(tǒng)計(jì)分析則由SPSS軟件完成。上述表述中存在的問題:1)SPSS軟件的版本號未說明;2)“統(tǒng)計(jì)分析”提法太籠統(tǒng)。究竟用的什么統(tǒng)計(jì)分析方法?應(yīng)明確交代(本項(xiàng)研究中,作者實(shí)際進(jìn)行的是“方差分析”,但作者始終未交代)。案例20第90頁/共110頁2.1.2N2O排放差異與不施氮肥相比較,中氮和高氮處理的排放通量在整個(gè)生育期內(nèi)都比較高,在施肥或降雨后的短時(shí)間內(nèi)這種現(xiàn)象更為明顯。二者N2O平均排放通量分別為71.3μg·m-2·h-1和87.2μg·m-2·h-1,比不施肥處理增加了128%和179%;相應(yīng)地,中氮處理和高氮處理的排放總量大大高于不施肥處理,排放總量(以N形式表示)分別為2.19
kg·hm-2和2.52
kg·hm-2(表2)。高氮處理與中氮處理的差異主要表現(xiàn)在苗期;高氮處理排放總量雖然略高于中氮處理,但二者間差異并不顯著,表明施肥量超過一定水平后,N2O排放總量并不會隨施氮量的增加而呈線性地增加。不種玉米處理(MN-NP)在二次施肥后的排放通量都比施肥種玉米處理(MN)的排放通量要高很多(圖2),在植株旺盛生長期(6月下旬到7月中旬間),MN-NP處理的排放量一直都較MN處理高,但整個(gè)生育期內(nèi)MN處理排放總量比MN-NP處理的N2O排放量還要略高,且二者在平均排放通量和總排放量上并無明顯差異(表2),表明玉米植株根系的存在增加了N2O的排放。案例21第91頁/共110頁案例22第92頁/共110頁2.2.2N2O排放差異由圖3可知,除個(gè)別峰值低于其他處理外,酰胺態(tài)氮肥處理的N2O排放通量都高于其他兩種形態(tài),而銨態(tài)氮肥處理除7月18日的排放高峰外,排放通量都低于酰胺態(tài)氮處
溫馨提示
- 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
- 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
- 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
- 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負(fù)責(zé)。
- 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請與我們聯(lián)系,我們立即糾正。
- 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。
最新文檔
- 2025年企業(yè)機(jī)器質(zhì)押借款合同
- 2025年勞動(dòng)解除合同標(biāo)準(zhǔn)條款
- 2025年抗瘧藥項(xiàng)目申請報(bào)告模范
- 2025年貨車租賃與運(yùn)輸服務(wù)合同樣本
- 2025年國際貨物買賣合同與慣例
- 2025年專業(yè)清潔人員派遣協(xié)議
- 2025年二手車購買合同范本
- 2025年三板市場股權(quán)買賣協(xié)議
- 2025年伙伴開設(shè)教育機(jī)構(gòu)合作協(xié)議書模板
- 2025年繼電器研發(fā)策劃技術(shù)協(xié)議書范本
- 小報(bào):人工智能科技科學(xué)小報(bào)手抄報(bào)電子小報(bào)word小報(bào)
- GB/T 41509-2022綠色制造干式切削工藝性能評價(jià)規(guī)范
- 全面介紹現(xiàn)貨中遠(yuǎn)期交易
- 公安系防暴安全03安檢
- 孫權(quán)勸學(xué)教案全國一等獎(jiǎng)教學(xué)設(shè)計(jì)
- 企業(yè)生產(chǎn)現(xiàn)場6S管理知識培訓(xùn)課件
- 五年級下冊數(shù)學(xué)課件 第10課時(shí) 練習(xí)課 蘇教版(共11張PPT)
- 電梯口包邊施工方案正式
- 三年級道德與法治下冊我是獨(dú)特的
- 青年卒中 幻燈
- 典型倒閘操作票
評論
0/150
提交評論