R語(yǔ)言學(xué)習(xí)總結(jié)_第1頁(yè)
R語(yǔ)言學(xué)習(xí)總結(jié)_第2頁(yè)
R語(yǔ)言學(xué)習(xí)總結(jié)_第3頁(yè)
R語(yǔ)言學(xué)習(xí)總結(jié)_第4頁(yè)
R語(yǔ)言學(xué)習(xí)總結(jié)_第5頁(yè)
已閱讀5頁(yè),還剩5頁(yè)未讀, 繼續(xù)免費(fèi)閱讀

下載本文檔

版權(quán)說(shuō)明:本文檔由用戶(hù)提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請(qǐng)進(jìn)行舉報(bào)或認(rèn)領(lǐng)

文檔簡(jiǎn)介

1、經(jīng)過(guò)接近一個(gè)學(xué)期的學(xué)習(xí),從對(duì) R語(yǔ)言的完全陌生,到現(xiàn)在對(duì)其有了一些粗 淺的認(rèn)識(shí),其中經(jīng)歷了遇到困難苦思冥想的艱辛,也有解決問(wèn)題以后豁然開(kāi)朗 的暢快。在學(xué)習(xí)的過(guò)程中,以前掌握的數(shù)理基礎(chǔ)給我?guī)?lái)了不少便利,而認(rèn)真 地態(tài)度和踏實(shí)的性格也使我獲益匪淺。在這個(gè)學(xué)期中,我學(xué)會(huì)了 R語(yǔ)言的基本操作和語(yǔ)法,以及針對(duì)具體的統(tǒng)計(jì)學(xué) 問(wèn)題相應(yīng)的解決方法。并按時(shí)完成老師布置的課后作業(yè),以達(dá)到學(xué)以致用的目 的,也加強(qiáng)了對(duì)R語(yǔ)言操作的熟練度。一、初識(shí)R軟件R軟件是一套完整的數(shù)據(jù)處理、計(jì)算和制圖軟件系統(tǒng)。其功能包括:據(jù)存儲(chǔ)和處理,數(shù)組運(yùn)算,完整連貫的統(tǒng)計(jì)分析工具,優(yōu)秀的統(tǒng)計(jì)制圖功能已及簡(jiǎn)便而 強(qiáng)大編程語(yǔ)言。接觸R語(yǔ)言以后,

2、我的第一感覺(jué)就是方便和強(qiáng)大。 R語(yǔ)言中有非常多的函數(shù)和包,我們幾乎不用自己去編一些復(fù)雜的算法, 而往往只需要短短幾行代碼就能 解決很復(fù)雜的問(wèn)題,這給我們的使用帶來(lái)了極大地方便; 于此同時(shí),它又可操縱 數(shù)據(jù)的輸入輸出,實(shí)習(xí)分支、循環(huán),使用者可以自定義功能,這就意味著當(dāng)找不 到合適的函數(shù)或包來(lái)解決所遇的問(wèn)題時(shí),我們又可以自己編程去實(shí)現(xiàn)各種具體功 能,這也正是R語(yǔ)言的強(qiáng)大之處。二、學(xué)習(xí)心得在學(xué)習(xí)該書(shū)的過(guò)程中,我不僅加深了對(duì)統(tǒng)計(jì)學(xué)方法的理解,同時(shí)也掌握了 R 軟件的編程方法和基本技巧,了解了各種函數(shù)的意義和用法,并能把兩者結(jié)合起 來(lái),解決實(shí)際中的統(tǒng)計(jì)問(wèn)題。1、R語(yǔ)言的基本語(yǔ)法及技巧R語(yǔ)言不僅可以進(jìn)行基

3、礎(chǔ)的數(shù)字、字符以及向量的運(yùn)算,內(nèi)置了許多與向量 運(yùn)算有關(guān)的函數(shù)。而且還提供了十分靈活的訪(fǎng)問(wèn)向量元素和子集的功能。R語(yǔ)言中經(jīng)常出現(xiàn)數(shù)組,它可以看作是定義了維數(shù)(dim屬性)的向量。因此數(shù)組同樣 可以進(jìn)行各種運(yùn)算,以及訪(fǎng)問(wèn)數(shù)組元素和子集。二維數(shù)組(矩陣)是比較重要和 特殊的一類(lèi)數(shù)組,R可以對(duì)矩陣進(jìn)行內(nèi)積、外積、乘法、求解、奇異值分解及最 小二乘擬合等運(yùn)算,以及進(jìn)行矩陣的合并、拉直等。appIyO函數(shù)可以在對(duì)矩陣的一維或若干維進(jìn)行某種計(jì)算,例如 appIy(A,1,mean)表示對(duì)A按行求和。R語(yǔ)言允許將不同類(lèi)型的元素放在一個(gè)集合中,這個(gè)集合叫做一個(gè)列表,列 表兀素總可以用“列表名下標(biāo)”的格式引用。

4、而“列表名下標(biāo)”表示的是 一個(gè)子列表,這是一個(gè)很容易混淆的地方。R語(yǔ)言中非常重要的一種數(shù)據(jù)結(jié)構(gòu)是 data.frame (數(shù)據(jù)框),它通常是矩陣形式的數(shù)據(jù),但每列可以是不同類(lèi)型,數(shù)據(jù)框每列是一個(gè)變量,每行是一個(gè)觀測(cè),要注意的是每一列必須有相同的長(zhǎng)度。 數(shù)據(jù)框元素可以使用下標(biāo)或者下標(biāo)向量引用。用一個(gè)非常簡(jiǎn)單的例子來(lái)說(shuō)明向量、矩陣和數(shù)據(jù)框的簡(jiǎn)單運(yùn)用。為一個(gè)2行6列,按行排列的矩陣#把A輸入:Av-matrix(c(1:12),2,6,byrow=T)#A轉(zhuǎn)化成數(shù)據(jù)框形式的X2行和1、3、5列X1:2,seq(1,5,2)# 輸出 X 的第 1、輸出:V1V3V5113527911X,計(jì)算并輸出V1

5、和V5的比值輸入:attach(X);Rv-V1/V5;R# 調(diào)用數(shù)據(jù)框輸出:10.20000000.6363636與此同時(shí)R語(yǔ)言中也提供了其它高級(jí)程序語(yǔ)言共有的分支、循環(huán)等程序控制 結(jié)構(gòu)。比如if/else 語(yǔ)句,for循環(huán)等。因此R語(yǔ)言也可以很容易的根據(jù)情況編 寫(xiě)自己所需要的函數(shù)。n是偶數(shù),則將n除2賦值給n;否 “運(yùn)算成功”,寫(xiě)入代碼:例:編寫(xiě)一個(gè)R程序,輸入一個(gè)整數(shù)n,如果n小于等于0,中止運(yùn)算,并輸 出:“要求輸入一個(gè)正整數(shù)”;否則,如果 則將3n+1賦給n。不斷循環(huán),直到n=1停止,并輸出:解:新建一個(gè)程序腳本,名為 cha pter2.Rfv-fu nctio n(n)if(nv

6、=0)list("要求輸入一個(gè)正整數(shù)")elsere peat為偶數(shù)if(n=1)break#n=1 時(shí)終止 elseif(n/2=eger(n/2)*-n/2#n 時(shí)除 2else nv-3* n+1list("運(yùn)算成功")在R窗口中輸入:Source( “chapter2.R ”);f(32)輸出:1"運(yùn)算成功"輸入:f(-5)輸出:1"要求輸入一個(gè)正整數(shù)"2、R在統(tǒng)計(jì)描述中的應(yīng)用 數(shù)據(jù)框操作(plyr包)輔助小函數(shù)1splat 函數(shù):作用:把原函數(shù)中多個(gè)參數(shù)打包為一個(gè)list作為參數(shù),然后輸出新的

7、函數(shù)。 也就是說(shuō)本來(lái)某個(gè)函數(shù)需要輸入多個(gè)參數(shù),現(xiàn)在套上splat后,只要輸入一個(gè)參數(shù)list就可以了,不需要單獨(dú)地輸入?yún)?shù)。它的作用結(jié)果 是把一個(gè)函數(shù)變成一個(gè)新函數(shù)。m*ply(a_matrix,FUN)的作用和 a*ply(a_matrix, 1,splat(FUN)樣例:(1) 參數(shù)使用>hp_p er_cy |v-function(hp ,cyl,.)h p/cyl>s plat(hp_ per_cyl)(mtcars1,)1 18.33333>s plat(hp_ per_cyl)(mtcars)118.3333318.3333323.2500018.3333321.

8、8750017.5000030. 6250015.5000023.750001020.5000020.5000022.5000022.5000022.5000025.6250026.8750028.7500016.500001913.0000016.2500024.2500018.7500018.7500030.6250021.8750016.5000022.750002828.2500033.0000029.1666741.8750027.25000等價(jià)于:>hp_p er_cyl(mtcars$h p, mtcars$cyl)splat函數(shù)的優(yōu)點(diǎn)就是可以不用拆分字段,可以一起輸入作為

9、參數(shù)。(2) 與plyr函數(shù)合用:>f<-fu nctio n(mp g,wt,.)data.frame(mw=mp g/wt)>dd ply(mtcars,.(cyl),s plat(f)2each函數(shù)作用:把多個(gè)函數(shù)匯聚成一個(gè)函數(shù),當(dāng)使用這個(gè)函數(shù)時(shí),將分別作用多個(gè)函 數(shù)。它的作用結(jié)果是把一個(gè)函數(shù)變成一個(gè)新函數(shù)。不足:不能給作用的函數(shù)指定附加參數(shù),只能使用默認(rèn)參數(shù)。例:>funv-function( x)c( min=min( x),max=max(x),mea n=mea n( x)>fun (1:10)等價(jià)于:>f<-each( min, max

10、,mea n)>f(1:10)3colwise 函數(shù)colwise(.f un ,.cols,.)說(shuō)明:.fun :要轉(zhuǎn)化的函數(shù);.cols是測(cè)試數(shù)據(jù)框的列是否應(yīng)包含的判別函數(shù)或者是要包含的列的名稱(chēng)。catcolwise(.fun,.)與colwise 功能類(lèi)似,只是對(duì)離散型變量有效numcolwise(.fun,.)與colwise 功能類(lèi)似,只是對(duì)數(shù)值型變量有效作用:把作用于數(shù)據(jù)框行向量的函數(shù)(如mean, median等)轉(zhuǎn)化為作用于數(shù)據(jù)框列向量的函數(shù)。于plyr函數(shù)一起使用十分方便。作用結(jié)果生 成一個(gè)新的函數(shù)。例:>nm iss in g<-f un cti on(

11、x)sum(is .n a(x)>colwise( nm iss in g)(baseball)>colwise( nm iss in g,.(sb,cs,so)(baseball)>dd ply (baseball,.(year),colwise( nm iss in g,.(sb,cs,so)>numcol等價(jià)于:colwise(nmissing,is.numenc)(baseball) >catcolwise( nm issi ng)(baseball)|等價(jià)于:colwise(nmissing,is.discrete)(baseball)4failwith

12、 函數(shù)failwith(default=NULL,f,quiet=FALSE)作用:修正一個(gè)函數(shù),使得當(dāng)該函數(shù)出現(xiàn)錯(cuò)誤時(shí)返回一個(gè)設(shè)定的默認(rèn)值,默認(rèn)為空。作用結(jié)果生成一個(gè)新的函數(shù)。>fv-fun cti on( x)if(x=1)st op ("Error")else1>f(1)Errori nf(1):Error>safef<-failwith(,f)>safef(1)Errori nf(.):ErrorNULL>safefv-failwith(12,f,quiet=TRUE)>safef(1)1125summarise ()函數(shù)s

13、ummarise(.data,.)作用:對(duì)數(shù)據(jù)框做統(tǒng)計(jì)匯總,為設(shè)定的統(tǒng)計(jì)方法或函數(shù) 例:>summarise(baseball,durati on=max(year)-min( year) ,n team s=le ngth( uniq ue(team)durati onn teams1136132>head(dd ply(baseball,"id",summanse,durati on=max(year) -mi n(year), nteams=le ngth(u nique(team) idduratio nn teams1aaro nha012232abe

14、rnte021773adairje011244adamsba012025adamsbo031346adcocjo01165數(shù)據(jù)集變量操作1變量排序:arran ge函數(shù))arran ge(df,.(var1),.(var2)作用:按照指定列排序。注意:使用arrange函數(shù)排完序后行名會(huì)丟失,需要用cbind補(bǔ)回。例:>arra nge(mtcars,cyl,dis p)>cars<-cbi nd(vehicle=row. names(mtcars),mtcars)>arra nge(cars,cyl,dis p)-先把行名作為一個(gè)新的列加到數(shù)據(jù)框再排序2更改變量名re

15、n ame(x,re place,wam_missi ng=TRUE)cly = new作用:通過(guò)名字修改變量名字,不是根據(jù)它的位置。 例:>head(re name(tmt,re place=c(" mp g"="avg pg",)3取行或列的數(shù)據(jù)take(x,alo ng,i ndices,dro p=FALSE)作用:在x中,按照某個(gè)維度取數(shù)。參數(shù)說(shuō)明:x為取數(shù)的源數(shù)據(jù),可以是 array或者dataframe;along:維度。1表示行,2表示列,3表示數(shù)組快等等;in dices:具體維度所對(duì)應(yīng)的指;drop:是否整合取第一列 取第一行例

16、:>take(mtcars,2,1)->take(mtcars,1,1)-數(shù)據(jù)集操作1數(shù)據(jù)集鏈接1) match_dfmatch_df(x,y,o n=NULL)作用:x為原始的需要提取的數(shù)據(jù)框,y為條件數(shù)據(jù)框;on指定用來(lái)連接的 變量,默認(rèn)為兩個(gè)數(shù)據(jù)框中所有變量,可以為多個(gè)。通過(guò)on后面的字段,到x數(shù)據(jù)框取選取數(shù)據(jù),相當(dāng)于innerjoin,區(qū)別為:前者結(jié)果 集是x的一個(gè)子集;innerjoin包括兩個(gè)數(shù)據(jù)框中所有字段。例:基礎(chǔ)數(shù)據(jù)>a<-c("a","b","c","d")>b&l

17、t;-c("aa","bb","aa","dd")>cv-c(1,2,3,4)>t1v-data.frame(a,b,c)>t2v-data.frame(a=c("a","c","e"),b=c("aa","ab","cd") >match_df(t1,t2, on=c("a","b") abc 1aaa12) join“l(fā)eft ”

18、 ,match= “all ”)joi n(x,y,by=NULL,t ype=by=為要連接的字段,type為連接類(lèi)型:left、right、 all (所有匹配上的其他屬性值都帶上)、first (只作用:連接兩個(gè)數(shù)據(jù)框 參數(shù)說(shuō)明:x, y為數(shù)據(jù)框;full ; match:帶上匹配上的第一個(gè)屬性值)>joi n(t1,t2,by="x2",ty pe="i nne廣)>joi n(t1,t2,by="x2",ty pe="left")>joi n(t1,t2,by="x2",ty

19、pe="right") >tt1v-data.frame(x1=c(1,2,3,4),x2=c(5,6,7,8) >tt2v-data.frame(y仁c(1,2,3,4)*10,x2=c(6,6,6,6)>joi n(tt1,tt2,by="x2",ty pe="i nn er",match="all") x1x2y112610226203263042640>joi n(tt1,tt2,by="x2",t yp e="i nn er",match=&

20、quot;first") x2x1y1262102.162102.262102.36210注意:merge和join相似,但是效率上join更優(yōu)。3) merge例:>x<-data.frame(a=c(1,2,4,5,6),x=c(9,12,14,21,8) >yv-data.frame(a=c(1,3,4,6),y=c(8,14,19,2),x=c(2,3,4,5 )>merge(x,y)-根據(jù)相同字段默認(rèn)內(nèi)連接根據(jù)相同字段全鏈接左連接右連接 根據(jù)a和x兩個(gè)字段連接根據(jù)x表中a和y表中y連接>merge(x,y,all=TRUE)- >merg

21、e(x,y,all.x=TRUE)- >merge(x,y,all.y=TRUE)- >merge(x,y,by=c("a","x")- >merge(x,y,by.x="a",by.y="y")-數(shù)據(jù)統(tǒng)計(jì)1*ply函數(shù)作用:拆分?jǐn)?shù)據(jù),應(yīng)用函數(shù),再組合函數(shù)作用后的數(shù)據(jù)輸入:array、dataframe list輸出:array、dataframe list、discarededa*pl y(.data,.margi ns,.f unprogress=" non e") 參數(shù)說(shuō)

22、明:.data是要進(jìn)行處理的數(shù)組.margins是用哪種方式去切割數(shù)據(jù),取值為1, 2, c(1,2).fun是對(duì)切割的數(shù)據(jù)指定一個(gè)函數(shù)進(jìn)行處理 .p rogress決定是否顯示及用哪種方式顯示進(jìn)度條>aa ply(a,1,mea n,. progress-' non e")以文本形式展示進(jìn)度條窗口展示進(jìn)度條>aa ply(a,1,mea n,.p rogress="text")->aa ply(a,1,mea n,. progress="wi n")-wi ndowsd*pl y(.data,.variables,.

23、f un,.,. progress-" non e")參數(shù)說(shuō)明:.variables指定要按其分割的變量名稱(chēng)>da ply (data,.(age),.fu n=amea n)>da ply(data,.(sex),.fu n=amea n)>da ply (data,.(age,sex),.f un=amea n)>dd ply(data,.(sex),.fu n=amea n)>dlply (data,.(sex),.f un=amea n)l*pl y(.data,.fu n,.,. progress-" non e"

24、)說(shuō)明:列表類(lèi)型的數(shù)據(jù)是最簡(jiǎn)單的數(shù)據(jù),因?yàn)樗呀?jīng)被分割成一個(gè)個(gè)了 (也 就是列表數(shù)據(jù)的一個(gè)個(gè)元素),所以這類(lèi)函數(shù)沒(méi)有參數(shù)用來(lái)描述是按 什么進(jìn)行切分的。>ll ply(list,mea n)>la ply(list,mea n)>ld pl y(list,mea n)m* ply(.data,.fu n=NULL,.i nform-FALSE,)說(shuō)明:把參數(shù)放到array或dataframe中整體輸入作為參數(shù),然后fun后面的 函數(shù)運(yùn)用.data中的相應(yīng)數(shù)值作為參數(shù)分別作用,得到dataframe(mdply),array (maply) 或者 list (miply )。與

25、splat相似:m*ply(a_matrix,FUN)的作用和 a*ply(a_matrix,1,splat(FUN) 一樣。>data=data.frame( n=c(10,100,50),mea n=c(5,5,10),sd=c(1,2,1)>datanmeansd11051210052350101>ml ply(data,rnorm)2觀測(cè)值出現(xiàn)個(gè)數(shù)(1) count 函數(shù):count(df,vars=NULL,wt_var=NULL)參數(shù):df是要處理的數(shù)據(jù)框;vars是要進(jìn)行分組統(tǒng)計(jì)的變量;wt_var為權(quán)重。 注意:該函數(shù)的功能類(lèi)似于table例:基礎(chǔ)數(shù)據(jù):>

26、;a=data.frame( names=c("a","b","c","d","a","a","a","b","b","c"),wt=c(1,1,1,1,2,2,2,2,2,2)>co un t(a,vars=" names")-單變量分組>cou nt(a,vars=" names",wt_var="wt")-力卩上權(quán)重&g

27、t;cou nt(a,c(” names","wt")-雙變量分組使用R軟件可以方便直觀的對(duì)數(shù)據(jù)進(jìn)行描述性分析。如順序統(tǒng)計(jì)量等度量位置;用方差、標(biāo)準(zhǔn)差、變異系數(shù)等度量分散程度;以及用峰 度系數(shù)、偏度系數(shù)度量分布形狀。例如在窗口中輸入:xv-seq(1,589,3)len gth(x);mea n( x);var(x);sd(x);media n( x);100*sd(x)/mea n(x)1197# 長(zhǎng)度1295# 均值129254.5# 方差1171.0395# 標(biāo)準(zhǔn)差1295#中位數(shù)157.97948#樣本標(biāo)準(zhǔn)差nv-le ngth(x);mv-mea n(x

28、);sv-sd(x)n/(n-1)*( n-2)*sum(x-m)A3)/sA3;( n*( n+1)/( n-1)*( n-2)*( n-3)*s um(x-m)M)/sA4-(3*(門(mén)-1)八2)/( n-2)* (n-3)10#偏度系數(shù)1-1.2#峰度系數(shù)K-S檢驗(yàn)方法的應(yīng)用范圍則更加廣也能判斷是否來(lái)自其它類(lèi)型的分布總R軟件可以檢驗(yàn)樣本是不是來(lái)自某種分布總體,以正態(tài)分布為例,我們可以 通過(guò)shapiro.testO函數(shù)提供W統(tǒng)計(jì)量和相應(yīng)的p值,并通過(guò)p值的大小判斷樣本是否來(lái)自正態(tài)分布的總體。經(jīng)驗(yàn)分布的 泛,不僅可以判斷樣本是否來(lái)自正態(tài)總體, 體。例如我們可以通過(guò)作直方圖、莖葉除此之外,R

29、語(yǔ)言還有強(qiáng)大的畫(huà)圖功能, 圖和總體分析來(lái)描述數(shù)據(jù)的分布。R中的高水平作圖函數(shù)有:Plot() 、pairs()、 coplot() 、qqnorm()、hist()等等。當(dāng)高水平作圖函數(shù)并不能完全達(dá)到作圖的指 標(biāo)時(shí),需要低水平的作圖函數(shù)予以補(bǔ)充。低水平作圖函數(shù)有:Points() 、lines()、 text()、polygon()、legend()、title() 和 axis()等。需要注意的是低水平作 圖函數(shù)必須是在高水平作圖函數(shù)所繪圖形的基礎(chǔ)之上增加新的圖形。hist()函數(shù)可以做出已知數(shù)據(jù)的直方圖,stem()函數(shù)可以作莖葉圖, boxplot()函數(shù)可用作箱線(xiàn)圖,qqline()和

30、qqmorm()可以做出正態(tài)QQ圖和相應(yīng) 的直線(xiàn)。R語(yǔ)言同時(shí)還能對(duì)兩組數(shù)據(jù)進(jìn)行相關(guān)性檢驗(yàn),cor.test()函數(shù)提供了 Pearson相關(guān)性檢驗(yàn),Spearman秩檢驗(yàn)和Kendall秩檢驗(yàn)。其原假設(shè)為兩組數(shù)據(jù)不相關(guān),通 過(guò)P值的大小來(lái)判斷是否拒絕原假設(shè)。我們還能用stars()函數(shù)作出星圖,來(lái)表示多元數(shù)據(jù),以上用法都非常簡(jiǎn)單易用,這里就不再贅述。3、R語(yǔ)言在統(tǒng)計(jì)推斷中的應(yīng)用首先,R語(yǔ)言可以用來(lái)進(jìn)行參數(shù)估計(jì);統(tǒng)計(jì)學(xué)中我們應(yīng)用矩估計(jì)和極大似然估計(jì)來(lái)進(jìn)行點(diǎn)估計(jì),矩估計(jì)是通過(guò)解正 規(guī)方程組得到參數(shù)估計(jì)的值;極大似然估計(jì)通過(guò)解極大似然函數(shù)的極值點(diǎn)得到參 數(shù)估計(jì)的值。在R中我們可以使用Newton迭代

31、法求解正規(guī)方程組,獲得矩估計(jì); 用optimizeO函數(shù)求解極大似然函數(shù),獲得最大似然估計(jì);由此可見(jiàn),R語(yǔ)言能 夠很方便的解決參數(shù)點(diǎn)估計(jì)問(wèn)題。點(diǎn)估計(jì)給出未知參數(shù)的近似值以后,并不能知道這種估計(jì)的精確性如何,可 信程度如何,為了解決這些問(wèn)題,就需要用到區(qū)間估計(jì),在學(xué)習(xí)用R語(yǔ)言解決區(qū) 間估計(jì)問(wèn)題的過(guò)程中,我最大的體會(huì)就是R軟件中內(nèi)置的一些函數(shù)極大地方便了 我們處理具體問(wèn)題。比如t.testO函數(shù)。對(duì)單個(gè)正態(tài)總體,向量 x包含了來(lái)自該總體的一個(gè)樣本,我們可以直接用t.test(x)指令得到均值u的點(diǎn)估計(jì)和區(qū)間估計(jì);對(duì)于兩個(gè)正態(tài)總體,向量y包含了來(lái)自第二個(gè)總體的一個(gè)樣本,我們可以用t.test(x,y

32、) 來(lái)得到均值差u1-u2的點(diǎn)估計(jì)和區(qū)間估計(jì),其中當(dāng)兩個(gè)總體方差 相同時(shí),只需要加上var.equal=T (缺省值為F,即默認(rèn)兩個(gè)總體的方差是不同 的);同時(shí)t.test()函數(shù)不僅可以進(jìn)行雙側(cè)置信區(qū)間估計(jì),也能進(jìn)行單側(cè)置信區(qū)間估計(jì),只需要在括號(hào)內(nèi)加上 al= ” I”或者al= ” g”。當(dāng)數(shù)據(jù)不服從正態(tài)分 布是,可以利用中心極限定理,取較大的樣本量,構(gòu)造近似服從正態(tài)分布的統(tǒng)計(jì) 量進(jìn)行估計(jì)。其次,R語(yǔ)言可以用來(lái)進(jìn)行假設(shè)檢驗(yàn)。假設(shè)檢驗(yàn)也是統(tǒng)計(jì)推斷中的一個(gè)重要的內(nèi)容,在統(tǒng)計(jì)學(xué)中,我們用搜索到的 數(shù)據(jù)對(duì)某個(gè)事先作出的統(tǒng)計(jì)假設(shè)按照某種設(shè)計(jì)好的方法進(jìn)行檢驗(yàn),來(lái)判斷此假設(shè)是否正確。也就是說(shuō)為了檢驗(yàn)一個(gè)

33、假設(shè)是否成立,先假定它是成立的,看看由此 會(huì)導(dǎo)致什么結(jié)果。如果導(dǎo)致一個(gè)不合理的現(xiàn)象出現(xiàn),就認(rèn)為原假設(shè)不正確,如果沒(méi)有導(dǎo)出不合理的現(xiàn)象,則不能拒絕原假設(shè)。R軟件給出了參數(shù)假設(shè)檢驗(yàn)的方法。以正態(tài)總體為例,t.test()函數(shù)也可以用來(lái)進(jìn)行單個(gè)或者兩個(gè)正態(tài)總體的均值的假設(shè)檢驗(yàn)。進(jìn)行單邊檢驗(yàn)時(shí)可以加入指 令alternative(備擇假設(shè)),缺省時(shí)表示雙邊檢驗(yàn),less表示備擇假設(shè)為uvuO,greater則相反,用conf.level指定置信水平。Xv-c(78.1,72.4,76.2,74.3,77.4,78.4,76.0,75.5,76.7,77.3)Yv-c(79.1,81.0,77.3,79

34、.1,80.0,79.1,79.1,77.3,80.2,82.1) t.test(X,Y,var.equal=T,al= ” I ”)輸出:TwoSamplet-testdata:Xa ndYt=-4.2957,df=18, p-value=0.0002176alternativeh yp othesis:truediffere ncei nmean sislesstha n095p erce ntcon fide ncein terval:-In f-1.908255sampi eestimates:meano fxmea nofy76.2379.43結(jié)果中我們不僅能得到X和丫的均值的點(diǎn)估計(jì)

35、76.23和79.43、左側(cè)區(qū)間估計(jì)、 同時(shí)也能通過(guò)P值的大小判斷是否接受原假設(shè),該例中 P<0.05,認(rèn)為拒絕原假 設(shè),即認(rèn)為兩總體方差不同。與均值假設(shè)檢驗(yàn)相類(lèi)似。R語(yǔ)言中還可以用var.testO函數(shù)進(jìn)行正態(tài)總體的方差假設(shè)檢驗(yàn)。而且R語(yǔ)言不僅能就正態(tài)總體進(jìn)行均值和方差檢驗(yàn),也能對(duì)其他總體分布進(jìn)行檢驗(yàn)。例如 用binom.test()進(jìn)行二項(xiàng)分布的檢驗(yàn)和估計(jì)。習(xí)題中檢驗(yàn)鐵劑和飲食兩種方法 治療后患者病情表現(xiàn)有無(wú)差異:xv-c(113,120,138,120,100,118,138,123) yv-c(138,116,125,136,110,132,130,110) bi no m.te

36、st(sum(xvy),8) Exactbi no mialtestdata:sum(x<y)a nd8nu mberofsuccesses=4,nu mberoftnals=8 ,p-value=1 alternativeh yp othesis:true probabilityofsuccessis no tequalto0.5 95p erce ntcon fide ncein terval: 0.15701280.8429872 sampi eestimates: p robabilityofsuccess0.5由結(jié)果我們可以判斷兩種診斷方法無(wú)顯著差異(其中用到的統(tǒng)計(jì)學(xué)原理見(jiàn)下 面的符號(hào)檢驗(yàn))。參數(shù)假設(shè)檢驗(yàn)假定了總體分布的具體形式,但實(shí)際問(wèn)題中我們往往不知道總 體的分布,很難對(duì)總體的分布做出假定,所

溫馨提示

  • 1. 本站所有資源如無(wú)特殊說(shuō)明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請(qǐng)下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請(qǐng)聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶(hù)所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁(yè)內(nèi)容里面會(huì)有圖紙預(yù)覽,若沒(méi)有圖紙預(yù)覽就沒(méi)有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫(kù)網(wǎng)僅提供信息存儲(chǔ)空間,僅對(duì)用戶(hù)上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對(duì)用戶(hù)上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對(duì)任何下載內(nèi)容負(fù)責(zé)。
  • 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請(qǐng)與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶(hù)因使用這些下載資源對(duì)自己和他人造成任何形式的傷害或損失。

評(píng)論

0/150

提交評(píng)論