




版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請(qǐng)進(jìn)行舉報(bào)或認(rèn)領(lǐng)
文檔簡介
1、野外實(shí)習(xí)資料的數(shù)理統(tǒng)計(jì)分析· 一元線性回歸分析 一元回歸處理的是兩個(gè)變量之間的關(guān)系,即兩個(gè)變量X和Y之間如果存在一定的關(guān)系,則通過觀測所得數(shù)據(jù),找出兩者之間的關(guān)系式。如果兩個(gè)變量的關(guān)系大致是線性的,那就是一元線性回歸問題。對(duì)兩個(gè)現(xiàn)象X和Y進(jìn)行觀察或?qū)嶒?yàn),得到兩組數(shù)值:X1,X2,,Xn和Y1,Y2,Yn,假如要找出一個(gè)函數(shù)Y=f(X),使它在X=X1,X2, ,Xn時(shí)的數(shù)值f(X1),f(X2), ,f(Xn)與觀察值Y1,Y2,Yn趨于接近。在一個(gè)平面直角坐標(biāo)XOY中找出(X1,Y1),(X2,Y2),(Xn,Yn)各點(diǎn),將其各點(diǎn)分布狀況進(jìn)行察看,即可以清楚地看出其各點(diǎn)分布狀況接近
2、一條直線。對(duì)于這種線性關(guān)系,可以用數(shù)學(xué)公式表示:Y = a + bX這條直線所表示的關(guān)系,叫做變量Y對(duì)X的回歸直線,也叫Y對(duì)X的回歸方程。其中a為常數(shù),b為Y對(duì)于X的回歸系數(shù)。對(duì)于任何具有線性關(guān)系的兩組變量Y與X,只要求解出a與b的值,即可以寫出回歸方程。計(jì)算a與b值的公式為:式中:為變量X的均值,Xi為第i個(gè)自變量的樣本值,為因變量的均值,Yi為第i個(gè)因變量Y的樣本值。n為樣本數(shù)。當(dāng)前一般計(jì)算機(jī)的Microsoft Excel中都有現(xiàn)成的回歸程序,只要將所獲得的數(shù)據(jù)錄入就可自動(dòng)得到回歸方程。得到的回歸方程是否有意義,其相關(guān)的程度有多大,可以根據(jù)相關(guān)系數(shù)的大小來決定。通常用r來表示兩個(gè)變量X和
3、Y之間的直線相關(guān)程度,r為X和Y的相關(guān)系數(shù)。r值的絕對(duì)值越大,兩個(gè)變量之間的相關(guān)程度就越高。當(dāng)r為正值時(shí),叫做正相關(guān),r為負(fù)值時(shí)叫做負(fù)相關(guān)。r 的計(jì)算公式如下:式中各符號(hào)的意義同上。在求得了回歸方程與兩個(gè)變量之間的相關(guān)系數(shù)后,可以利用F檢驗(yàn)法、t檢驗(yàn)法或r檢驗(yàn)法來檢驗(yàn)兩個(gè)變量是否顯著相關(guān)。具體的檢驗(yàn)方法在后面介紹。2多元線性回歸分析一元回歸研究的是一個(gè)自變量和一個(gè)因變量的各種關(guān)系。但是客觀事物的變化往往受到多種因素的影響,即使其中有一個(gè)因素起著主導(dǎo)作用,但其它因素的作用也是不可忽視的。因此,我們還需要研究多種變量的關(guān)系,這種多個(gè)變量之間的關(guān)系就叫做多元回歸問題。例如,水稻的產(chǎn)量不僅與生長期內(nèi)的
4、雨量有關(guān),而且與溫度也有關(guān)系。所以尋求水稻的產(chǎn)量不僅與生長期內(nèi)的雨量之間的相互關(guān)系,就是多元回歸問題。如果假設(shè)自變量為X1,X2,Xm,因變量為Y,而且因變量與自變量之間是線性的關(guān)系,則因變量Y與自變量為X1,X2,Xm的多元線性回歸方程為:Y = a+b1X1+b2X2+bmXm式中:a,b1,b2,bm為常數(shù)。因此,只要能夠求出a,b1,b2,bm這些常數(shù),就可以得到因變量Y與自變量為X1,X2,Xm之間的多元回歸方程。具體的算法比較簡單,但很煩瑣。這里不再敘述。求解多元回歸的計(jì)算機(jī)程序很多,只要將自變量的數(shù)據(jù)以及與其相對(duì)應(yīng)的因變量的數(shù)據(jù)輸入計(jì)算機(jī)程序中,立刻就可以求出a,b1,b2,bm
5、各常數(shù)的值,從而可以獲得因變量Y與自變量為X1,X2,Xm的多元線性回歸方程。例如,設(shè)已知因變量Y的自變量X1,X2,X3,共得18組數(shù)據(jù),并已知Y對(duì)Xi存在著線性關(guān)系,求其回歸方程。樣品X1X2X3Y10.4531586420.4231636033.119377140.6341576154.724595461.7651237779.4444681810629173931012.658112511110.937111761223.146114961323.150134771421.64473931523936143541726.8582021
6、681829.95112499通過求解,得到a=41.6516b1=1.7410b2=-0.0062b3=0.1553所以,回歸方程為Y=41.6516+1.7410 X1 -0.0062 X2+0.1553 X3通??刹捎脝蜗嚓P(guān)系數(shù)、偏相關(guān)系數(shù)和復(fù)相關(guān)系數(shù)來說明這三個(gè)自變量與因變量之間是否有明顯的線性關(guān)系以及它們之間相關(guān)的程度如何。單相關(guān)系數(shù)是指在不考慮其他因素影響的條件下,所求兩個(gè)變量之間的相關(guān)系數(shù)。用rX1X2、rYX1和rYX2分別表示X1和X2、Y和X1以及Y與X2之間的單相關(guān)系數(shù)。偏相關(guān)系數(shù)是指在這三個(gè)變量中,將其中一個(gè)變量保持常數(shù)時(shí),其他兩個(gè)變量之間的相關(guān)系數(shù)。用rYX1X2和r
7、YX2X1分別表示X2為常數(shù)時(shí),Y與X1的偏相關(guān)系數(shù)和X1為常數(shù)時(shí),Y與X2的偏相關(guān)系數(shù)。偏相關(guān)系數(shù)可以用單相關(guān)系數(shù)求得。當(dāng)這三個(gè)變量中,同時(shí)考慮兩個(gè)變量對(duì)另一個(gè)變量相關(guān)系數(shù)時(shí),叫做復(fù)相關(guān)系數(shù)。用r(X1X2)Y表示X1和X2、兩個(gè)自變量對(duì)于Y的復(fù)相關(guān)系數(shù)。3.方差分析方差分析法是分析多組平均數(shù)之間差異顯著性時(shí)常用的一種統(tǒng)計(jì)方法。方差(或均方)是一個(gè)表示變異程度的量,它是離均差的平方和與自由度之商。在一項(xiàng)實(shí)驗(yàn)或調(diào)查中往往存在著許多造成生物形狀變異的因素,這些因素有比較重要的,也有較次要的。分析時(shí)主要是把平方和與自由度按不同的變異起因分解為若干部分,從而構(gòu)成來自不同起因的方差。利用它來檢驗(yàn)各組平
8、均數(shù)之間差異的顯著性。在正態(tài)總體及方差相同的基本假定下,我們將利用方差比給出F分布的檢驗(yàn)統(tǒng)計(jì)量。因此這種方法稱為方差分析法。方差分析是分析和處理試驗(yàn)或觀測數(shù)據(jù)的主要方法之一。它首先被應(yīng)用于農(nóng)業(yè)試驗(yàn),目前它在農(nóng)業(yè)、工業(yè)、生物、醫(yī)學(xué)等各部門有著廣泛的應(yīng)用。方差分析的方法往往與試驗(yàn)設(shè)計(jì)的方式緊密地聯(lián)系在一起。對(duì)于從不同試驗(yàn)設(shè)計(jì)中得出觀測資料,進(jìn)行方差分析時(shí)將有不同的計(jì)算方法,類型繁多,但其基本原理卻大同小異。在這里將結(jié)合一個(gè)較簡單的例子介紹方差分析的數(shù)學(xué)模型和基本方法,以便于讀者對(duì)方差分析的方法有一個(gè)大致的了解。在實(shí)驗(yàn)設(shè)計(jì)的基礎(chǔ)上,分組試驗(yàn),如分為a組,每組作b個(gè)水平的試驗(yàn),共得到a×b個(gè)
9、數(shù)據(jù)。然后,算出組平均值和總平均值,組內(nèi)和組間的離差平方和,組內(nèi)和組間方差,作F檢驗(yàn)。 F 組間方差/組內(nèi)方差 假設(shè) HO: 1 2··· b ,表示各水平的均值相等。當(dāng) F F 時(shí),HO: 真;當(dāng) F > F時(shí), HO:假。試驗(yàn)中必不可少地會(huì)產(chǎn)生誤差。誤差有兩種:條件誤差和試驗(yàn)誤差。前者是由試驗(yàn)條件不同而引起的系統(tǒng)性誤差,后者是在相同試驗(yàn)條件下引起的隨機(jī)誤差。例如,把四種不同的飼料分別喂給4組小雞,每組5只,它們的增重情況如下:組別增重(Xij)15549422152261112308963342978195924試問四組小雞在平均增重量方面有沒有明顯的差
10、別?通過計(jì)算,得到組內(nèi)和組間方差分別為719.2和8706.3,因此,F(xiàn)=8706.3/719.2=12.1對(duì)于給定的顯著性水平,將有臨界值F一,當(dāng)=0.01時(shí),F(xiàn)0.01(3,16)=5.3,其中3與16是自由度。所以F=12.1>5.3= F0.01(3,16)故,否定各種飼料效果一致的假設(shè),可以認(rèn)為四種飼料的效果有極明顯的差別。目前現(xiàn)成的計(jì)算機(jī)方差分析計(jì)算程序很多,如SPASS、SAS軟件等,將數(shù)據(jù)輸入后,都可以直接計(jì)算,并按要求輸出結(jié)果。上述例子是單因素的方差分析,比較簡單。對(duì)于多因素的方差分析,由于比較復(fù)雜,這里就不再敘述了。4. T檢驗(yàn)生物學(xué)中所遇到的絕大多數(shù)問題,總體標(biāo)準(zhǔn)差
11、都是未知的。在未知時(shí),平均數(shù)的顯著性檢驗(yàn)有兩種解決方法。其一是根據(jù)以往的經(jīng)驗(yàn)或從類似的工作中估計(jì)出一個(gè)值,用這個(gè)做檢驗(yàn)。使用估計(jì)的做檢驗(yàn)并不是很可靠的。因此在實(shí)際工作中,一般不用這種方法而廣泛使用t檢驗(yàn)。對(duì)于一個(gè)正態(tài)分布總體,若未知?jiǎng)t服從n-1自由度的t分布,因此,在未知時(shí)可以用t檢驗(yàn)做平均數(shù)的顯著性檢驗(yàn)。t檢驗(yàn)的零假設(shè)H0為:=0備擇假設(shè)有以下三種情況:(1)HA:>0,若已知不可能小于0;(2)HA:<0,若已知不可能大于0;(3)HA:0,包括>0和<0 。三種備擇假設(shè)的拒絕域?yàn)椋海?)t>t ;(2)t< -t;(3)t > t/2,或表示為t
12、 > t(雙側(cè)) 。其中為給定的顯著性水平。t檢驗(yàn)的統(tǒng)計(jì)量為:t = (-0)/(s/n1/2)例如,已知玉米單交種群單105的平均穗重0=300克,噴藥后,隨機(jī)抽取9個(gè)果穗,其穗重為分別:308、305、311、298、315、300、321、294、320克。問噴藥后與噴藥前的果穗重差異是否顯著?根據(jù)上面介紹的基本程序:· 已知玉米穗重是服從正態(tài)分布的隨機(jī)變量,未知。 (2)假設(shè):H0 :=0=300HA:0=300由于問題要求檢驗(yàn)的是“果穗重差異是否顯著”,并沒有明確穗重一定增加或一定減少,所以備擇假設(shè)為HA:0(3)顯著性水平:根據(jù)實(shí)驗(yàn)的要求(差異是否“顯著”)規(guī)定=0
13、.05。(4)統(tǒng)計(jì)量的值:由于未知需使用t檢驗(yàn)。t = (-0)/(s/n1/2)t = (308-3000)/(9.62/91/2)=2.49(5)建立的拒絕域H0:因HA:0,所以是雙側(cè)檢驗(yàn)。當(dāng) t > t0.05(雙側(cè))時(shí)拒絕H0,=0.05時(shí),經(jīng)查表t8,0.05(雙側(cè))=2.306。(6)結(jié)論:因t =2.49> t8,0.05(雙側(cè))=2.306 ,所以結(jié)論是拒絕H0,接受HA。即噴藥前后果穗重的差異是顯著的。5. F檢驗(yàn)t檢驗(yàn)屬于單個(gè)樣本的顯著性檢驗(yàn),即在樣本統(tǒng)計(jì)量與零假設(shè)所提出的總體參量之間做比較。這種檢驗(yàn)需要我們事先能夠提出合理的參量假設(shè)值和對(duì)參量有某種意義的備擇
14、值。然而,在實(shí)際工作中,很難提出這樣的假設(shè)值及備擇值。因此,限制了這種方法在實(shí)際工作中的應(yīng)用。為了避免上述問題的出現(xiàn),在實(shí)際應(yīng)用時(shí),常常選擇兩個(gè)樣本,一個(gè)作為處理,一個(gè)作為對(duì)照。在這兩個(gè)樣本之間做比較。判斷它們之間是否存在足夠顯著的差異。當(dāng)它們之間的差異不能用偶然性解釋時(shí),則認(rèn)為它們之間存在足夠顯著的差異,這兩個(gè)樣本來自兩個(gè)不同的總體。而F檢驗(yàn)是關(guān)于兩個(gè)方差的檢驗(yàn),所以常用F檢驗(yàn)來解決上述問題。F檢驗(yàn)的程序概述如下:(1)假定從兩個(gè)正態(tài)總體中,獨(dú)立地抽取含量分別為n1和n2的兩個(gè)隨機(jī)樣本,計(jì)算出s12和s22??傮w平均數(shù)1和2可以相等也可以不相等。(2)零假設(shè)H0為:1=2備擇假設(shè)有以下三種情況:(1)HA:1>2,若已知1不可能小于2; (2)HA:1<2,若已知1不可能大
溫馨提示
- 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請(qǐng)下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請(qǐng)聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
- 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會(huì)有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
- 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
- 5. 人人文庫網(wǎng)僅提供信息存儲(chǔ)空間,僅對(duì)用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對(duì)用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對(duì)任何下載內(nèi)容負(fù)責(zé)。
- 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請(qǐng)與我們聯(lián)系,我們立即糾正。
- 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶因使用這些下載資源對(duì)自己和他人造成任何形式的傷害或損失。
最新文檔
- 小學(xué)讀書拍賣會(huì)活動(dòng)方案
- 工會(huì)培訓(xùn)式活動(dòng)方案
- 小貓黏土活動(dòng)方案
- 巧克力王國國慶活動(dòng)方案
- 小班慢跑活動(dòng)方案
- 小學(xué)野營活動(dòng)方案
- 市北區(qū)工會(huì)活動(dòng)方案
- 小學(xué)謝師宴活動(dòng)方案
- 市井火鍋活動(dòng)方案
- 巧手繡花活動(dòng)方案
- 2023-2024學(xué)年景德鎮(zhèn)市珠山區(qū)數(shù)學(xué)五年級(jí)第二學(xué)期期末監(jiān)測試題含解析
- 小鎮(zhèn)文旅康養(yǎng)項(xiàng)目可研報(bào)告【健康養(yǎng)老】【旅游康養(yǎng)】
- CTD申報(bào)資料:創(chuàng)新藥IND模塊一-行政文件和藥品信息
- EHS專項(xiàng)施工EHS管理組織機(jī)構(gòu)
- 生理學(xué)神經(jīng)系統(tǒng)的功能
- 發(fā)電廠機(jī)組優(yōu)化調(diào)度與運(yùn)行控制策略
- (高清版)DZT 0211-2020 礦產(chǎn)地質(zhì)勘查規(guī)范 重晶石、毒重石、螢石、硼
- 2024山西杏花村汾酒集團(tuán)有限責(zé)任公司人才招聘筆試參考題庫附帶答案詳解
- wedo2完整版本.0第一課拉力小車
- 珠寶行業(yè)市場競爭與監(jiān)管研究
- 會(huì)員經(jīng)理培訓(xùn)課件
評(píng)論
0/150
提交評(píng)論