版權說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權,請進行舉報或認領
文檔簡介
1、方差、相關與回歸分析主要內(nèi)容方差分析方差分析的過程單因素方差分析二因素方差分析相關分析相關分析的過程回歸分析一元回歸多元回歸9.2 方差方析 方差分析是檢驗兩個或兩個以上樣本均數(shù)間差異是否顯著的方法。 在比較幾個組時,H0假設通常是設各組平均值相等。檢驗兩個均數(shù)間差別的顯著性可以用t檢驗法,也可用方差分析法。方差分析的基本概念樣本均數(shù)間所以有差別,可能有兩 種原因造成:首先它們必須有抽樣誤差(個體間變異的影響;其次,如果各組所接受的不同處理方法是有不同的作用的,那么,它也是由于處理不同所造成的。方差分析的基本概念如果處理是沒有作用的,即各樣本均數(shù)來自同一總體,那么用方差分析的方法可以算出個體間
2、變異 2的估計值組內(nèi)均方(M.S組內(nèi))。這時,由方差分析法算出的組間均方(M.S組間),也是個體間變異2的估計值。如以組內(nèi)均方除組間均方,稱之為F值,即F=M.S組間/M.S組內(nèi),則由于組間和組內(nèi)均方都是個體間變異2的估計值,因之,如無抽樣誤差則F應該等于1。但由于組間和組內(nèi)均方都只是2的估計值,由于抽樣誤差的關系,組間均方和組內(nèi)均方都不正好等于2,因之F也不正好等于1,而可以大于或小于1。方差分析的基本概念但由于樣本來自相同總體,F(xiàn)值一般不會距1很遠,其分布情況(F分布)與組間和組內(nèi)自由度有關。與此相反,如果處理是確有作用的,即各樣本均數(shù)不是取自相同總體,這時用方差分析計算出來的組內(nèi)均方仍是
3、個體間變異2的估計值。但組間均方則不僅是個體變異所致,同時也由于處理的作用不同所致。9.2 方差方析方差分析的基本思想是把全部數(shù)據(jù)關于總均值的離均差平方和分解成幾個部分,每一部分表示某因素或交互作用所產(chǎn)生的效應,將各部分均方與誤差均方相比較,從而確認或否認某些因素或交互作用的重要性。方差分析公式概括為: 總變異組間變異組內(nèi)變異 其中:組間變異由各因素所引起;組內(nèi)變異由個體差異或者說由誤差引起的。 常用的方差分析法有以下種:完全隨機設計資料的方差分析(單因素方差分析)隨機區(qū)組設計資料的方差分析(兩因素方差分析)拉丁方設計資料的方差分析(三因素方差分析)R*C析因設計資料的方差分析(有交互因素的方
4、差分析) SAS系統(tǒng)中,ANOVA過程可以處理以上情形的方差分析,但它要求每個分類因子的組合觀察數(shù)相等,即數(shù)據(jù)是均衡的。若不均衡,就要求用GLM過程進行處理。9.2.1 均衡數(shù)據(jù)的方差方析1. 過程格式:PROC ANOVA DATA=數(shù)據(jù)集;CLASS 變量;MODEL 因變量效應;MEANS 效應/選擇項;2. 說明 (1) 程序中,CLASS語句和MODEL語句是必需的,并且CLASS語句必須出現(xiàn)在MODEL語句之前。 (2) CLASS語句中的變量是分類變量,可以是數(shù)值型,也可以是字符型。 (3) MODEL語句指明因變量和自變量(因子變量)效應,其效應可以是主效應、交互效應、嵌套效應
5、和混合效應。常用MODEL語句效應模型如下:1)主效應模型 MODEL y=a ;(單因素方差分析模型) MODEL y=a b;(二因素方差分析模型) MODEL y=a b c;(三因素方差分析模型) 模型中,a ,b ,c 是主效應,y 是因變量。 2)交互效應模型 MDOEL y=a b a*b MDOEL y=a b c a*b a*c b*c a*b*c; 模型中, a ,b ,c 是主效應, a*b,a*c,b*c,a*b*c 是交互效應,y 是因變量。(4) MEANS語句是選擇語句,計算并輸出所列的效應對應的因變量均數(shù),若指明了選擇項,則將進行主效應均數(shù)間的檢驗。常用的選擇項
6、如下:SNK(Q檢驗)均數(shù)間兩兩比較 DUNCAN 一組均數(shù)與其余各組比較ALPHAp用以確定檢驗的顯著性水平。缺省值是0.05。3. 舉例 例1完全隨機設計資料的方差分析(單因素方差分析) 某勞動衛(wèi)生教研組研究棉布、府綢、的確涼、尼龍四種衣料內(nèi)棉花吸附十硼氫量。每種衣料各做五次測量,所得數(shù)據(jù)如表9-4。試檢驗各種衣料間棉花吸附十硼氫量有沒有顯著差別?表9-4棉布府綢的確涼尼龍2.332.483.064.002.00 2.343.065.132.932.683.004.612.732.342.662.802.332.223.063.60程序如下:DATA an; DROP i; DO i=1
7、TO 5; DO a=1 TO 4; INPUT x ; OUTPUT; END; END; CARDS; 2.33 2.48 3.06 4.00 2.00 2.34 3.06 5.13 2.93 2.68 3.00 4.61 2.73 2.34 2.66 2.80 2.33 2.22 3.06 3.60PROC ANOVA; CLASS a; MODEL x=a;RUN;例2隨機區(qū)組設計資料的方差分析(兩因素方差分析) 用4種不同方法治療8名患者,其血漿凝固時間的資料如表9-5,試作方差分析。 數(shù)據(jù)步中,變量a代表不同治療方法,其水平數(shù)是4,變量b代表區(qū)組因素,其水平數(shù)是8。過程步中,用CL
8、ASS語句指明兩個因素a和b,用MODEL語句指明二因素的效果模型。受試者編號(區(qū)組) 處理組 1 2 3 4 18.49.49.812.2212.815.212.914.439.69.111.29.849.88.89.912.058.48.28.58.568.69.99.810.978.99.09.210.488.49.49.810.0DATA an; DO b=1 TO 8; DO a=1 TO 4; INPUT x ; OUTPUT; END; END;CARDS; 8.4 9.4 9.8 12.2 12.8 15.2 12.9 14.4 9.6 9.1 11.2 9.8 9.8 8.8
9、 9.9 12.0 8.4 8.2 8.5 8.5 8.6 9.9 9.8 10.9 8.9 9.0 9.2 10.4 7.9 8.1 8.2 10.0PROC ANOVA; CLASS a b; MODEL x=a b;RUN; 例用SNK法(Q檢驗)作均數(shù)間的兩兩比較 研究酵解作用對血糖濃度的影響,我們從8名健康人中抽取了血液并制備成血濾液。每一個受試者的血濾液又分成4份,然后隨機地把各份血濾液分別放置0、45、90、135分鐘后測定其中血糖濃度(資料見表9-9)。試比較放置時間對血糖濃度有無影響。受試者編號(區(qū)組號)放置時間(分)04595135123456789595106981021
10、1210595 9594105979811210392 89889795971019790 8384909088948880 DATA an; DO a=1 TO 8; DO b=0 TO 135 BY 45; INPUT x ; OUTPUT; END; END; CARDS; 95 95 89 83 95 94 88 84 106 105 97 90 98 97 95 90 102 98 97 88 112 112 101 94 105 103 97 88 95 92 90 80 PROC ANOVA; CLASS a b; MODEL x=a b; MEANS b/SNK; RUN;第十
11、章 相關與回歸 在醫(yī)學上人的身高與體重、體溫與脈搏次數(shù)、年齡與血壓、藥物劑量與療效等均有一定的聯(lián)系。說明客觀事物或現(xiàn)象相互關系的密切程度并用適當?shù)慕y(tǒng)計指標表示出來,這是相關分析的任務。把客觀事物或現(xiàn)象間的關系用函數(shù)形式表示出來,則是回歸分析所要解決的問題。第十章 相關與回歸 CORR過程計算變量間的相關系數(shù),包括PEARSON積矩相關系數(shù)等,同時給出單變量描述統(tǒng)計。 REG過程是SAS中通用的基本的回歸分析過程,它是用最小二乘法原理求解線性回歸方程的有效過程。此外,因為逐步回歸分析的方法在實際工作中應用甚廣,故將其單獨提出來介紹如何使用REG過程進行逐步回歸分析。 10.1 CORR 過程10
12、.1.1 相關分析相關是研究隨機變量之間相互關系的統(tǒng)計分析方法,它研究隨機變量之間相互關系的密切程度。 線性相關,又稱簡單相關。其統(tǒng)計指標是PEARSON 相關系數(shù) r 。 當研究多個隨機變量之間的相互關系時,可對變量進行多元線性相關分析。多元線性相關的統(tǒng)計量是全相關系數(shù)R和各偏相關系數(shù)。在多元線性相關分析中,變量之間的關系是錯綜復雜的,兩個變量間的簡單線性相關系數(shù)往往不能正確說明兩者的真實關系,只有在其它變量固定,即扣除了其它變量的影響后,計算兩變量間的偏相關系數(shù)才能反映此兩變量的真實情況。 當變量不服從正態(tài)分布時,例如按等級分類或相對數(shù)資料,這時需用非參數(shù)相關分析方法,如等級相關分析法等。
13、10.1.2 語句說明1. 過程格式PROC CORR 選擇項; VAR 變量表; WITH 變量表; PARTIAL 變量表; WEIGHT 變量; FREQ 變量; BY 變量表;2.說明 (1) PROC CORR 語句 PROC CORR 選擇項; PROC CORR 語句的選擇項主要有: PEARSON 計算通常的PEARSON積矩相關,是缺省值。 KENDALL 計算肯德爾-b系數(shù)。 SPEARMAN 計算斯皮爾曼等級相關系數(shù)。HOEFFDING 計算霍夫丁統(tǒng)計量。OUTP=dataset 產(chǎn)生含有PEARSON 相關的一個新數(shù)據(jù)集。NOMISS 將帶有某一變量缺項值的觀測值從所有
14、計算中除去。 NOSIMPLE 抑制簡單統(tǒng)計。(2) VAR 語句 (3) WITH 語句 WITH 變量表; 指明特別配對的變量名, 與VAR語句配對使用,VAR語句列出相關矩陣上部出現(xiàn)的變量,WITH語句列出左側出現(xiàn)的變量。 (4) PARTIAL 語句 PARTIAL 變量表; 指明求偏相關系數(shù)時需要固定的偏變量名。 DATA ABC; INFILE d:panyancorr.dat; INPUT NO HEIGHT WEIGHT VITAL; PROC CORR; VAR HEIGHT WEIGHT VITAL; PROC CORR NOSIMPLE; VAR HEIGHT WEIGH
15、T; WITH VITAL; PROC CORR NOSIMPLE; VAR HEIGHT VITAL; PARTIAL WEIGHT; RUN;10.2 REG 過程10.2.1 簡介 回歸是研究隨機變量和非隨機變量之間的數(shù)量依存關系的統(tǒng)計分析方法。當自變量X與因變量Y之間呈直線關系時,稱為直線回歸。直線回歸要求因變量是服從正態(tài)分布的且方差相等。 當自變量不只一個時,可進行多元線性回歸分析。研究一個因變量與多個自變量之間的線性依存關系,稱為多元線性回歸。 REG 過程是用最小二乘法原理求解線性回歸方程的過程。10.2.2 語句說明1. 過程格式 PROC REG 選擇項; MODEL 因變量
16、=自變量 /選擇項; VAR 變量; FREQ 變量; WEIGHT 變量; BY 變量; (1)PROC REG 語句 PROC REG 選擇項;(略)(2)MODEL 語句 MODEL 因變量=自變量表/選擇項; 指明因變量和自變量, 選擇項是有關回歸計算、估計、預測值和殘差,常用的選擇項有: STB 打印標準回歸系數(shù) CORRB 打印估計的相關矩陣 COLLINOINT請求進行自變量的共線 性分析 P 計算預測值及殘差 R 請求分析殘差 CLM 打印因變量均值95%的 置信界限的上下限 CLI 對各預測值打印95%的 置信界限的上下限3. 舉例(1) 簡單線性回歸分析 仍以上節(jié)相關分析資
17、料為例,進行以身高估計肺活量的線性回歸分析,同時要求打印出各觀測點上因變量均值的95%置信區(qū)間。 DATA ABC; INFILE d:panyancorr.dat; INPUT NO HEIGHT WEIGHT VITAL ; PROC REG; MODEL VITAL=HEIGHT/CLM; RUN;(2)多元線性回歸分析 仍以表10-1的資料為例,進行身高、體重與肺活量的多元線性回歸分析,程序如下: DATA ABC; INFILE d:panyancorr.dat; INPUT NO HEIGHT WEIGHT VITAL ; PROC REG; MODEL VITAL=HEIGHT WEIGHT / COLLINOINT; RUN;10.3 逐步回歸分析 在進行逐步回歸分析時,應用MODEL語句中的SELECTION=name選擇項,來選擇用于進行逐步回歸分析時模型;其中name可以是FORWARD(或F); BACKWARD(或B); STEPWISE ;MAXR; MINR;
溫馨提示
- 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權益歸上傳用戶所有。
- 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預覽,若沒有圖紙預覽就沒有圖紙。
- 4. 未經(jīng)權益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
- 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負責。
- 6. 下載文件中如有侵權或不適當內(nèi)容,請與我們聯(lián)系,我們立即糾正。
- 7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。
最新文檔
- 單位管理制度集合大合集人員管理篇
- 單位管理制度匯編大合集人力資源管理
- 《家具導購圣經(jīng)》課件
- 單位管理制度分享匯編職員管理篇十篇
- 單位管理制度分享大全職工管理十篇
- 2024教科室工作計劃
- 單位管理制度呈現(xiàn)合集職工管理篇十篇
- 《投資管理復習》課件
- 《市場考察報告》課件
- 《廣告效果的測定》課件
- 快速響應客戶需求機制
- 環(huán)境影響評價技術方案
- 皖醫(yī)大兒科學習題及答案
- 劉鐵敏《金融專業(yè)英語》(第2版)-習題參考答案20
- 《公路工程建設監(jiān)理》課件
- 2023-2024學年黑龍江省哈爾濱一中高一(上)期末數(shù)學試卷
- 2024年管理學理論考核試題及答案
- 地理信息系統(tǒng)試卷及答案
- 干部考察延伸談話范圍
- (新)公共常識知識考試復習題庫800題(含答案)
- 叉車維修檢驗原始記錄
評論
0/150
提交評論