




已閱讀5頁,還剩43頁未讀, 繼續(xù)免費閱讀
版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進行舉報或認領(lǐng)
文檔簡介
方差分析與回歸分析,西北農(nóng)林科技大學(xué)理學(xué)院,徐 釗編制,方差分析 Analysis Of Variance,一、方差分析的概念與基本思想 1.問題的提出 例題8.1 在飼料養(yǎng)雞增肥研究中,某飼料研究所提出三 種配方: A1以魚粉為添加料, A2以槐樹粉為添加料, A3 以苜蓿粉添加料。為比較三種飼料的效果,特選24只相似 的雛雞隨機分為三組,每組用一種飼料喂養(yǎng),60天后測其 體重,獲得數(shù)據(jù)如下表,比較三種飼料的增重效果是否一致,可以轉(zhuǎn)化為利用樣本 比較三個總體均值是否相等。直觀上看該問題可以用兩個 總體均值差異顯著性檢驗解決,但細想想還是存在一定問 題,因為這樣的比較能增大犯錯誤的概率。為解決這類問 題,英國統(tǒng)計學(xué)家R.A.Fisher于1924年提出了解距此類問題 的通用方法-方差分析法。,2.方差分析的概念 因素:影響試驗指標變化的原因。 水平:因素所劃分成不同等級,每個等級稱為該因素的一 個水平。 條件變差:能反映控制因素不同水平對試驗指標的作用的 量,又稱為處理效應(yīng)或組間效應(yīng)。 隨機誤差:能反映控制因素以外因素對試驗指標作用的量。,3.方差分析的基本思想 試驗指標的變化可以用指標值的方差反映,導(dǎo)致指標值 發(fā)生變化的原因有兩方面:一是可控因素,二是不可控因 素。方差分析就是將指標值的方差分解成條件變差與隨機 誤差,然后依據(jù)概率遠離比較條件變差與隨機誤差大小關(guān) 系,從而決定引起指標值的變化的主要原因。 4.方差分析的基本假定 不同因素對試驗指標值的影響作用是加性效應(yīng),即試驗 指標值的變化是各種因素所起作用的累加; 試驗指標服從正態(tài)分布; 試驗數(shù)據(jù)是隨機的,并且可控因素不同水平的試驗數(shù)據(jù) 方差齊性。,二、單因素方差分析的統(tǒng)計模型,1.單因素方差分析的數(shù)據(jù)結(jié)構(gòu) 單因素方差分析的試驗數(shù)據(jù)應(yīng)具有下列結(jié)構(gòu)形式。,2.單因素方差分析的統(tǒng)計模型,該形式稱為單因素方差分析的統(tǒng)計模型。 在方差分析統(tǒng)計模型下,方差分析要解決的問題轉(zhuǎn)化為 下列假設(shè)檢驗問題:,為了分析方便,我們往往對單因素方差分析的統(tǒng)計模型進 行如下轉(zhuǎn)化。令,稱其為總均值,而稱,因素A第i格水平下的主效應(yīng)。,三、單因素方差分析的原理,1. 試驗數(shù)據(jù)離差平方和分解,離差平方和分解式,例題8.2 對例題8.1的試驗數(shù)據(jù)進行方差分析。 解:H0:飼料種類對雞的增肥沒有影響; H1:有影響。,三、單因素方差分析模型的參數(shù)估計,一、相關(guān)關(guān)系的概念 在現(xiàn)實問題中,處于同一個過程中的一些變量,往往是相互依賴和相互制約的,形成一定的相互關(guān)系,這種相互關(guān)系大致可分為兩種:,相關(guān)關(guān)系與回歸關(guān)系 Correlation and Regression,(1)確定性關(guān)系函數(shù)關(guān)系; (2)非確定性關(guān)系相關(guān)關(guān)系;,1.相關(guān)關(guān)系 相關(guān)關(guān)系表現(xiàn)為這些變量之間有一定的依賴關(guān),但這種關(guān)系并不完全確定,它們之間的關(guān)系不能精確地用函數(shù)表示出來,這些變量其實是隨機變量,或至少有一個是隨機變量。,2.相關(guān)關(guān)系舉例,例如:在氣候、土壤、水利、種子和耕作技術(shù)等條件基本相同時,某農(nóng)作物的畝產(chǎn)量 Y 與施肥量 X 之間有一定的關(guān)系,但施肥量相同,畝產(chǎn)量卻不一定相同。畝產(chǎn)量是一個隨機變量。,又如:人的血壓Y與年齡X之間有一定的依賴關(guān)系,一般來說,年齡越大,血壓越高,但年齡相同的兩個人的血壓不一定相等。血壓是一個隨機變量。,農(nóng)作物的畝產(chǎn)量與施肥量、血壓與年齡之間的這種關(guān)系稱為相關(guān)關(guān)系,在這些變量中,施肥量、年齡是可控變量,畝產(chǎn)量、血壓是不可控變量。一般在討論相關(guān)關(guān)系問題中,可控變量稱為自變量,不可控變量稱為因變量。,因此,統(tǒng)計學(xué)上討論兩變量的相關(guān)關(guān)系時,是設(shè)法 確定:在給定自變量 的條件下,因變量 的條 件數(shù)學(xué)期望,這種關(guān)系直觀表達出來,一下圖所示,二、回歸關(guān)系的概念 1.回歸關(guān)系,回歸分析主要包括三方面的內(nèi)容: 1)確定變量間的回歸函數(shù)形式提供建立有相關(guān)關(guān)系的變 量之間的數(shù)學(xué)關(guān)系式(稱為經(jīng)驗公式)的一般方法; 2)判別所建立的經(jīng)驗公式是否有效,并從影響隨機變量 的諸變量中判別哪些變量的影響是顯著的,哪些是不顯著 的; 3)利用所得到的經(jīng)驗公式進行預(yù)測和控制。,3.回歸分析與回歸分析的內(nèi)容 回歸分析就是研究變量間的相關(guān)關(guān)系,通過對客觀事物中變量的大量觀測獲得數(shù)據(jù),去尋找隱藏在數(shù)據(jù)后面的相關(guān)關(guān)系,給出他們的表達式回歸函數(shù)的估計式。,一元線性回歸模型,如果試驗的散點圖中各點呈直線狀,則假設(shè)這批數(shù)據(jù)的數(shù)學(xué)模型為,設(shè)隨機變量Y依賴于自變量x,作n次獨立試驗,得n對觀測值: ,稱這n對觀測值為容量為n的一個子樣,若把這n對觀測值在平面直角坐標系中描點,得到試驗的散點圖.,因此,其中 是與 無關(guān)的未知常數(shù)。,一、一元線性回歸模型,1.一元回歸模型 一般地,稱如下數(shù)學(xué)模型為一元線性模型,2.回歸函數(shù)(方程)的建立,由觀測值 確定的回歸函數(shù) , 應(yīng)使得 較小。考慮函數(shù),問題:確定 ,使得 取得極小值。,記,表示對 的估計值,則變量 對 的經(jīng)驗回歸方程為,最小二乘法,3.回歸方程有效性的檢驗,對于任何一組數(shù)據(jù) ,都可按最 小二乘法確定一個線性函數(shù),但變量 與 之間是否真 有近似于線性函數(shù)的相關(guān)關(guān)系呢?尚需進行假設(shè)檢驗。,假設(shè),如果 成立,則不能認為 與 有線性相關(guān)關(guān)系。,三種檢驗方法:F檢驗法、t-檢驗法、r檢驗法。,(一)回歸方程有效性的F檢驗法,記,總離差平方和,反映觀測值與平均值的偏差程度。,經(jīng)恒等變形,將 分解,回歸平方和,反映回歸值與平均值的偏差,揭示 變量 與 的線性關(guān)系所引起的數(shù)據(jù)波動。,剩余平方和,反映觀測值與回歸值的偏差,揭示 試驗誤差和非線性關(guān)系對試驗結(jié)果所引起的數(shù)據(jù)波動。,如果 為真,則,于是,統(tǒng)計量,對給定的檢驗水平 ,,(1)當 時,拒絕 ,即可認為變量 與 有線性相關(guān)關(guān)系;,(2)當 時,接受 ,即可認為變量 與 沒有線性相關(guān)關(guān)系;,記,樣本的相關(guān)系數(shù),可反映變量 與 之間的線性相關(guān)程度。,因為,(二)回歸方程有效性的r檢驗法,越大,變量 與 之間的線性相關(guān)程度越強。,因為,(1),(2) 時,,(3) 時,,與 有線性相關(guān)關(guān)系;,與 無線性相關(guān)關(guān)系;,計算,對給定的檢驗水平 ,查相關(guān)系數(shù)的臨界值表,如果 ,則拒絕 ,即線性回歸方程 有效;否則,接受 ,即線性回歸方程無效。,F檢驗與r檢驗是一致的:,(三)回歸方程有效性的t檢驗法,統(tǒng)計量,H0成立時,,對給定的檢驗水平 ,H0的拒絕域為,即當 時,變量 與 有線性相關(guān)關(guān)系。,F檢驗與t檢驗是一致的:,試求出 與 的關(guān)系,并判斷是否有效。,例8.3 為了研究大豆脂肪含量 和蛋白質(zhì)含量 的關(guān)系, 測定了九種大豆品種籽粒內(nèi)的脂肪含量和蛋白質(zhì)含量, 得到如下數(shù)據(jù),解 (1)描散點圖,(2)建立模型,由散點圖,設(shè)變量 與 為線性相關(guān)關(guān)系:,確定回歸系數(shù) 和 :,所以,所求的回歸方程為,(3)檢驗回歸方程的有效性,查相關(guān)系數(shù)臨界值表,因為,所以回歸方程在 的檢驗水平下有統(tǒng)計意義。,即可以認為大豆的蛋白質(zhì)含量與脂肪含量有線性相關(guān)性。,利用回歸方程進行預(yù)測,1、點預(yù)測,時, 即為 的點預(yù)測值。,2、區(qū)間預(yù)測,統(tǒng)計量,對給定的置信水平 , 的預(yù)測區(qū)間為,續(xù)例1 求大豆脂肪含量為18.6%的條件下蛋白質(zhì) 95%的預(yù)測區(qū)間。,解 由已求得的回歸方程,得蛋白質(zhì)的點預(yù)測值為,所以脂肪含量為18.6%時,蛋白質(zhì)的95%的預(yù)測區(qū)間為,控制則為預(yù)測的反問題:已知因變量的取值區(qū)間為,,確定自變量的取值區(qū)間 使得,利用回歸方程進行控制,一般地,要解出 和 很復(fù)雜,可作簡化求解:,當樣本容量很大時,,,則,前一節(jié),我們學(xué)習了一元線性回歸分析問題,在實 際應(yīng)用中,有些變量之間并不是線性相關(guān)關(guān)系,但可以 經(jīng)過適當?shù)淖儞Q,把非線性回歸問題轉(zhuǎn)化為線性回歸問 題。,可線性化的一元非線性回歸,常見的幾種變換形式:,1、雙曲線,令,2、冪函數(shù)曲線,令,化非線性回歸為線性回歸,變形,3、指數(shù)函數(shù)曲線,令,變形,4、負指數(shù)函數(shù)曲線,令,化非線性回歸為線性回歸,變形,5、對數(shù)
溫馨提示
- 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
- 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
- 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
- 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負責。
- 6. 下載文件中如有侵權(quán)或不適當內(nèi)容,請與我們聯(lián)系,我們立即糾正。
- 7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。
最新文檔
- 法律意識基礎(chǔ)試題及答案
- 二級考試C++全方位知識總結(jié)試題及答案
- 法律文書考試題及答案二
- 詩歌的創(chuàng)作背景試題及答案
- 法律社會學(xué)試題及答案
- 2025年Delphi編程應(yīng)考心態(tài)調(diào)整試題及答案
- 2025年Delphi產(chǎn)品維護與更新策略題目及答案
- 2025年MySQL數(shù)據(jù)同步技術(shù)試題及答案
- 2025年木材供貨合同范本
- 2025港口貨物運輸合同
- 礦石加工中的化學(xué)工藝安全技術(shù)考核試卷
- 2025屆江蘇省蘇州市高考沖刺押題(最后一卷)英語試卷含解析
- 中國共產(chǎn)主義青年團紀律處分條例試行解讀學(xué)習
- 網(wǎng)絡(luò)釣魚攻擊防范-第1篇-全面剖析
- 《環(huán)境設(shè)計中的天人合一》教學(xué)課件-2024-2025學(xué)年人美版(北京)(2024)初中美術(shù)七年級下冊
- 三方水泥合同協(xié)議
- 2025至2030年抗應(yīng)激添加劑項目投資價值分析報告
- 采礦管理協(xié)議書范本
- 23《“蛟龍”探海》公開課一等獎創(chuàng)新教學(xué)設(shè)計
- 廣西壯族自治區(qū)2025年4月高三畢業(yè)班診斷學(xué)考試數(shù)學(xué)試卷及答案(廣西三模)
- 安徽中醫(yī)藥大學(xué)專職輔導(dǎo)員招聘筆試真題2024
評論
0/150
提交評論