




版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進行舉報或認領(lǐng)
文檔簡介
R語?之?差分析篇當包含的因?是解釋變量時,通常會從預(yù)測轉(zhuǎn)向級別差異的分析,即稱作?差分析(ANOVA)組間因?因變量?變量均衡設(shè)計(balanceddesign)組內(nèi)因?單因素組間?差分析單因素組內(nèi)?差分析重復(fù)測量?差分析主效應(yīng)交叉效應(yīng)因素?差分析混淆因素?擾變數(shù)協(xié)變量協(xié)?差1、ANOVA模型擬合1.aov()函數(shù)語法:aov(formula,data=dataframe)R表達式中的特殊符號符號?法~分隔符號,左邊為響應(yīng)變量,右邊為解釋變量eg:y~A+B+C+分隔解釋變量:表?變量的交互項eg:y~A+B+A:B*表?所有可能交互項eg:y~A*B*C可展開為:y~A+B+C+A:B+A:C+B:C+A:B:C^表?交互項達到次數(shù)eg:y~(A+B+C)^2展開為:y~A+B+C+A:B+A:C+B:C.表?包含除因變量外的所有變量eg:若?個數(shù)據(jù)框包括變量y,A、B和C,代碼y~.可展開為y~A+B+C常見研究設(shè)計的表達式設(shè)計表達式單因素ANOVAy~A含單個協(xié)變量的單因素ANCOVAy~x+A雙因素ANOVAy~A*B含兩個協(xié)變量的雙因素ANCOVAy~x1+x2+A*B隨機化區(qū)組y~B+A(B是區(qū)組因?)單因素組內(nèi)ANOVAy~A+Error(Subject/A)含單個組內(nèi)因?(W)和單個組間因?(B)的重復(fù)測量ANOVAy~B*W+Error(Subject/W)?平衡設(shè)計時或存在協(xié)變量時,效應(yīng)項的順序?qū)Y(jié)果影響較?越基礎(chǔ)的效應(yīng)應(yīng)越需要放在表達式前?,?先是協(xié)變量、然后是主效應(yīng)、接著是雙因素的交互項,再接著是三因素的交互項若研究不是正交的,?定要謹慎設(shè)置疚的順序2、單因素?差分析(1)單因素?差分析#單因素?差分析(感興趣地是?較分類因?定義的兩個或多個組別中的因變量均值)install.packages("multcomp")library(multcomp)attach(cholesterol)str(cholesterol)cholesteroltable(trt)aggregate(response,by=list(trt),FUN=mean)aggregate(response,by=list(trt),FUN=sd)fit<-aov(response~trt)summary(fit)library(gplots)plotmeans(response~trt,xlab="Treatment",ylab="Response",main="MeanPlot\nwith95%CI")(2)多重?較多重?較?于解決某?組別與其他的不同TukeyHSD()函數(shù)提供了對各組均值差異的成對檢驗,但與HH包存在兼容性問題((某些版本中);TukeyHSD(fit)par(las=2)par(mar=c(5,4,6,2))plot(TukeyHSD(fit))library(multcomp)par(mar=c(5,4,6,2))tuk<-glht(fit,linfct=mcp(trt="Tukey"))plot(cld(tuk,level=0.05),col="lightgrey")(3)評估檢驗的假設(shè)條件當因變量服從正態(tài)頒,各組?差相等時,可?Q-Q圖來檢驗正態(tài)性假設(shè)qqPlot()要求?lm()擬合,若數(shù)據(jù)落在95%的置信區(qū)間范圍內(nèi),說明滿?正態(tài)性假設(shè)。R提供的可以做?差齊性檢驗的函數(shù)Bartlett檢驗bartlet.test()Fligner-Killeen檢驗fligner.test()Brown-Forsythe檢驗離群點檢驗car包中的outlierTest()函數(shù)來檢測離群點3、單因素協(xié)?差分析install.packages("multcomp")library(multcomp)head(litter,n=21)data(litter,package="multcomp")attach(litter)options(digits=5)table(litter$dose)aggregate(weight,by=list(litter$dose),FUN=mean)fit<-aov(weight~gesttime+litter$dose)summary(fit)因使?了協(xié)變量,短途運輸獲取調(diào)整的組均值即去除協(xié)變量疚后的組均值,可使?effects包中的effects()函數(shù)來計算調(diào)整的均值library(effects)effect("dose",fit)?戶定義的對照的多重?較library(multcomp)contrast<-rbind("nodrugvs.drug"=c(3,-1,-1,-1))summary(glht(fit,linfct=mcp(dose=contrast)))(1)評估檢驗的假設(shè)條件ANCOVA與ANOVA相同,都城要正態(tài)性和同?差性假設(shè)另ANOCVA還假定回歸低低斜率相同,eg當ANCOVA模型飲?懷孕時間*劑量的交互項時,可對回歸斜率的同質(zhì)性進?檢驗。eg檢驗回歸斜率的同質(zhì)性library(multcomp)fit2<-aov(weight~gesttime*dose,data=litter)summary(fit2)(2)結(jié)果的可視化install.packages("HH")library(HH)ancova(weight~gesttime+dose,data=litter)4、雙因素?差分析<strong>雙因素ANOVA</strong>attach(ToothGrowth)head(ToothGrowth)table(supp,ToothGrowth$dose)aggregate(len,by=list(supp,ToothGrowth$dose),FUN=mean)aggregate(len,by=list(supp,ToothGrowth$dose),FUN=sd)fit<-aov(len~supp*ToothGrowth$dose)summary(fit)detach(ToothGrowth)可視化處理interaction.plot(ToothGrowth$dose,supp,len,type="b",col=c("red","blue"),pch=c(16,18),main="InteractionbetweenDoseandSupplementType")可?gplots包中的plotmans()來展?交互效應(yīng)install.packages("gplots")library(gplots)plotmeans(len~interaction(supp,ToothGrowth$dose,sep=""),col=c("red","darkgreen"),connect=list(c(1,3,5),c(2,4,6)),main="InteracitonPlotwith95%CIS",xlab="TreatmentandDoseCombination")?HH包中的interaction2wt()函數(shù)來可視化結(jié)果library(HH)interaction2wt(len~supp*ToothGrowth$dose)5、重復(fù)測量?差分析所謂重復(fù)測量?差分析,即受試者被測量不??次。w1b1<-subset(CO2,Treatment=="chilled")w1b1fit<-aov(uptake~conc*Type+Error(Plant/(conc)),w1b1)summary(fit)par(las=2)par(mar=c(10,4,4,2))with(w1b1,interaction.plot(conc,Type,uptake,type="b",col=c("red","blue"),pch=c(16,18),main="InteractionPlotforPlantTypeandConcentration"))boxplot(uptake~Type*conc,data=w1b1,col=c("gold","green"),main="ChilledQuebecandMississippiPlants",ylab="Carbondioxideuptakerateumol/m^2sec")數(shù)據(jù)集寬格式(wideformat):列是變量,?是觀測值,且???個受試對象處理重復(fù)測量設(shè)計時,需要有長格式(longformat)數(shù)據(jù)才能擬合模型;在長格式中,因變量每次測量都要放到它獨有的?中。reshape包可為?正直將數(shù)據(jù)轉(zhuǎn)換為相應(yīng)的格式。6、多元?差分析(1)單因素多元?差分析library(MASS)head(UScereal)attach(UScereal)y<-cbind(calories,fat,sugars)aggregate(y,by=list(shelf),FUN=mean)cov(y)fit<-manova(y~shelf)summary(fit)summary.aov(fit)(2)評估假設(shè)檢驗單因素多元?差分析有兩個前提假設(shè),?個是多元正態(tài)性,?個是?差-協(xié)?差同質(zhì)性。前者可?Q-Q圖來檢驗該假設(shè)條件;?差-協(xié)?差矩陣同持性即指各組的協(xié)?差矩陣相同,可?Box'sM檢驗來估計該假設(shè)。多元正態(tài)分布:若有?個p*1的多元正態(tài)隨機向量x,均值為u,存在協(xié)?差矩陣,那么x與u的馬?距離的平?服從?由度為p的卡?分布。Q-Q圖展?卡?頒的分位數(shù),橫縱坐標分別是樣本量與馬?距離平?值。如果點全部落在斜率為1、截距為0的直線上,則表明數(shù)據(jù)服從多元正態(tài)分布。center<-colMeans(y)n<-nrow(y)p<-ncol(y)cov<-cov(y)d<-mahalanobis(y,center,cov)coord<-qqplot(qchisq(ppoints(n),df=p),d,main="Q-QPlotAssessingMultivariateNormality",ylab="MahalanobisD2")abline(a=0,b=1)identify(coord$x,coord$y,labels=s(UScereal))可?mvoutlier包中的ap.plot()函數(shù)來檢驗多元離群點install.packages("mvoutlier")library(mvoutlier)outliers<-aq.plot(y)outliers(3)穩(wěn)健多元?差分析若多元正態(tài)性或者?差-協(xié)?差均值假設(shè)都不滿?,?擔?多元離群點,可考慮?穩(wěn)健或?參版本的MANOVA檢驗。rrcov包中的Wilks.test()函數(shù)實現(xiàn)vegan包中的adonis()函數(shù)提供了?參數(shù)MANOVA的等同形式library(rrcov)Wilks.test(y,shelf,method="mcd")7、?回歸來做ANOVA?aov()函數(shù)擬合模型library(multcomp)levels(cholesterol$trt)fit.aov<-aov(response~trt,data=cholesterol)summary(fit.aov)?回歸lm()來解決ANOVA問題fit.lm<-lm(response~trt,data=cholesterol)summary(fit.lm)因線性模型要求預(yù)測變量是數(shù)值型,當lm()函數(shù)碰到因?時,它會??系列因??平相對應(yīng)的數(shù)值型對照變量為代替因?。若因?有k個?平,它將會創(chuàng)建k-1個對照變量。contrasts(cholesterol$trt)內(nèi)置對照組對照變量創(chuàng)建?法描述contr.helmert第?個與第?個?平對照第三個?平對照前兩個均值第四個?平對照前三個的均值contr.poly基于正交多項式的對照,?于趨勢分析和等距?平的有序因?contr.sum對照變量之和限制為0,也稱作偏差找對,對各?平的均值與所有?平的
溫馨提示
- 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
- 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
- 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
- 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負責。
- 6. 下載文件中如有侵權(quán)或不適當內(nèi)容,請與我們聯(lián)系,我們立即糾正。
- 7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。
最新文檔
- 品牌口碑提升計劃
- 創(chuàng)新思維與解決方案探討計劃
- 《四川省木里縣灰?guī)r山金礦普查實施方案》評審意見書
- 2025年美術(shù)元宵燈會標準教案
- 三年級數(shù)學(xué)下冊7小數(shù)的初步認識教學(xué)反思二新人教版
- 健康保險類知識培訓(xùn)課件
- 2025年山西道路貨運從業(yè)資格證考試
- 2025年甘肅貨運從業(yè)資格證模擬考試試題答案
- 人教版八年級歷史與社會下冊教學(xué)設(shè)計:5.1.3《農(nóng)耕文明的繁盛》
- 2025年巢湖道路運輸從業(yè)資格證
- 典型火災(zāi)案例及消防安全知識專題培訓(xùn)
- 雪鐵龍DS6保養(yǎng)手冊
- 廣東省廣州市海珠區(qū)南武小學(xué)2023-2024學(xué)年三年級下學(xué)期3月期中語文試題
- 金融糾紛調(diào)解培訓(xùn)課件模板
- 高速公路日常保潔管理管理標準化方案
- 村(社區(qū))“兩委”班子五年任期規(guī)劃和2024年工作目標10篇
- 《皮內(nèi)注射技術(shù)》課件
- 三年級下冊口算天天100題(A4打印版)
- 部編版初中語文文言文對比閱讀 九年級下冊(下)(解析版)
- 停電計劃現(xiàn)場勘查培訓(xùn)課件
- 變電運維講安全
評論
0/150
提交評論