版權(quán)說(shuō)明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請(qǐng)進(jìn)行舉報(bào)或認(rèn)領(lǐng)
文檔簡(jiǎn)介
1、實(shí)驗(yàn)?zāi)康膶?shí)驗(yàn)內(nèi)容初步學(xué)習(xí)如何應(yīng)用R軟件解決統(tǒng)計(jì)問(wèn)題1、R 簡(jiǎn)介2、應(yīng)用實(shí)例3、實(shí)驗(yàn)作業(yè)入門實(shí)例1一、 R簡(jiǎn)介為什么要學(xué)習(xí)R語(yǔ)言R的資源 資料與文獻(xiàn) 網(wǎng)站 統(tǒng)計(jì)分析軟件包S-Plus和R的初步比較 R的運(yùn)行平臺(tái) R_GUI R_Commander R_WinEdt R_ESS+XEmacs 2R的無(wú)私奉獻(xiàn)者Bill Venables Robert Gentleman Ross Ihaka 3R是一個(gè)開(kāi)放(GPL)的統(tǒng)計(jì)編程環(huán)境一種語(yǔ)言,是語(yǔ)言(由AT&T Bell實(shí)驗(yàn)室的Rick Becker, John Chambers,Allan Wilks開(kāi)發(fā))的一種方言(dialect) 之一,另一則為
2、S-plus.一種軟件,是集統(tǒng)計(jì)分析與圖形直觀顯示于一體.R作為一個(gè)計(jì)劃(project),最早(1995年)是由Auckland大學(xué)統(tǒng)計(jì)系的Robert Gentleman和Ross Ihaka開(kāi)始編制,目前由核心開(kāi)發(fā)小組(R Development Core Team 以后用R DCT表示)維護(hù),他們完全自愿、工作努力負(fù)責(zé),并將全球優(yōu)秀的統(tǒng)計(jì)應(yīng)用軟件打包提供給我們。我們可以通過(guò)計(jì)劃的網(wǎng)站()了解有關(guān)的最新信息和使用說(shuō)明,得到最新版本的軟件和基于的應(yīng)用統(tǒng)計(jì)軟件包. 為什么要學(xué)習(xí)語(yǔ)言4是完全免費(fèi)的! 而S-Plus盡管是非常優(yōu)秀的統(tǒng)計(jì)分析軟件,可是你需要支付一筆$US .R可以在運(yùn)行于UNIX
3、, Windows和Macintosh的操作系統(tǒng)上 .R嵌入了一個(gè)非常實(shí)用的幫助系統(tǒng).R具有很強(qiáng)的作圖能力.我們能將程序容易地移植到S-Plus程序中,反之的許多過(guò)程直接或稍作修改即可用于.通過(guò)語(yǔ)言的許多內(nèi)嵌統(tǒng)計(jì)函數(shù),很容易學(xué)習(xí)和掌握R語(yǔ)言的語(yǔ)法.我們可以編制自己的函數(shù)來(lái)擴(kuò)展現(xiàn)有的語(yǔ)言(這就是為什么它在不斷升級(jí)完善!).5R主頁(yè): CRAN (Comprehensive R Archive Network), CRAN的鏡像站點(diǎn) UCLA提供的關(guān)于R與S-Plus的聯(lián)接,具有搜索功能 李東風(fēng)主頁(yè)提供了的Windows版本 如果使用FTP軟件(如Cuteftp)則推薦使用(匿名訪問(wèn)) 的網(wǎng)站資源
4、6CRAN提供了許多便于統(tǒng)計(jì)分析的宏包:stable - 穩(wěn)妥(分布)廣義回歸分析tseries 時(shí)間序列分析 VaR 風(fēng)險(xiǎn)值分析matrix 矩陣運(yùn)算cinterface C與R的接口foreign 讀寫由S, Minitab, SAS, SPSS, Stata等軟件的數(shù)據(jù)normix 混合正態(tài)分布分析nortest 正態(tài)分布的Anderson-Darling檢驗(yàn)MCMCpack 基于Gibbs抽樣的MCMC抽樣方法 fracdiff 分?jǐn)?shù)差分模型的極大似然估計(jì) 還有很多統(tǒng)計(jì)分析軟件包7S-Plus與R初步比較 豐富的數(shù)據(jù)類型(向量、數(shù)組、列表、對(duì)象等)特別有利于實(shí)現(xiàn)新的統(tǒng)計(jì)算法。S語(yǔ)言是由
5、AT&T貝爾實(shí)驗(yàn)室開(kāi)發(fā)的一種用來(lái)進(jìn)行數(shù)據(jù)探索、統(tǒng)計(jì)分析、作圖的解釋型語(yǔ)言。其交互式運(yùn)行方式及強(qiáng)大的圖形及交互圖形功能使得我們可以方便的探索數(shù)據(jù)。目前S語(yǔ)言的實(shí)現(xiàn)版本主要是S-PLUS。它基于S語(yǔ)言,并由MathSoft公司的統(tǒng)計(jì)科學(xué)部進(jìn)一步完善。8作為統(tǒng)計(jì)學(xué)家及一般研究人員的通用方法工具箱,S-PLUS強(qiáng)調(diào)圖形演示、探索性數(shù)據(jù)分析、統(tǒng)計(jì)方法、開(kāi)發(fā)新統(tǒng)計(jì)工具的計(jì)算方法,以及可擴(kuò)展性。S-PLUS可以直接用來(lái)進(jìn)行標(biāo)準(zhǔn)的統(tǒng)計(jì)分析得到所需結(jié)果,但是它的主要的特點(diǎn)是它可以交互地從各個(gè)方面去發(fā)現(xiàn)數(shù)據(jù)中的信息,并可以很容易地實(shí)現(xiàn)一個(gè)新的統(tǒng)計(jì)方法。S-PLUS有微機(jī)版本和工作站版本,它是一個(gè)商業(yè)軟件。9Auc
6、kland大學(xué)的Robert Gentleman 和 Ross Ihaka 及其他志愿人員開(kāi)發(fā)了一個(gè)R系統(tǒng),其語(yǔ)法形式與S語(yǔ)言基本相同,但實(shí)現(xiàn)不同,兩種語(yǔ)言的程序有一定的兼容性。R是一個(gè)GPL自由軟件,現(xiàn)在的版本是2.4.1版,它比S-PLUS 還少些功能,但已經(jīng)具有了很強(qiáng)的實(shí)用性。本課程中盡量介紹S-PLUS和R都能使用的功能,以R為主。下面我們用S統(tǒng)稱S-PLUS和R。 10R的運(yùn)行平臺(tái)R_GUI啟動(dòng)R,我們看到R GUI (graphic users interface)的主窗口, 它由三部分組成主菜單 工具條 R console (R的運(yùn)行窗口)R console你的主要工作是在這里通
7、過(guò)發(fā)布命令來(lái)完成的,包括數(shù)據(jù)集的建立,數(shù)據(jù)的分析,作圖等.在這里你可以得到在線幫助help() 得到相應(yīng)函數(shù)的幫助,例如help(plot)help.start() HTML格式的關(guān)于R的幫助文件demo() 得到R提供的幾個(gè)示例; demo(fm)q() 退出R11工具條介紹Source R codeLoad imageSave imageCopy and PasteStop current computationSource R code 執(zhí)行R文件(*.R或*.r)Save image 保存工作空間,文件名為*.RDataLoad image 打開(kāi)已有的工作空間Stop current
8、computation 中止當(dāng)前計(jì)算(由于超時(shí)等原因) (打開(kāi)程序腳本) (載入映象) (保存映象) (打印) (中斷目前的計(jì)算) 12主菜單介紹(相應(yīng)有中文對(duì)照)13S的基本界面是一個(gè)交互式命令窗口,命令提示符是一個(gè)大于號(hào),命令的結(jié)果馬上顯示在命令下面。二、應(yīng)用實(shí)例S命令主要有兩種形式:表達(dá)式或賦值運(yùn)算(用 x11() 可以打開(kāi)一個(gè)作圖窗口。然后,輸入以下語(yǔ)句: x1 x2 y plot(x2,y, type=l) plot(x2,y,type=“s”,main=“畫圖練習(xí)”,sub=“好好練, xlab=x軸,ylab=y軸)151617這些語(yǔ)句可以繪制正弦曲線圖。其中,“ x1 x y
9、plot(x,y, type=l) 1920簡(jiǎn)單統(tǒng)計(jì)量sum, mean, var, sd, min, max, range, median, IQR(四分位間距)等為統(tǒng)計(jì)量,sort,order,rank與排序有關(guān),其它還有ave,fivenum,mad,quantile,stem等。21下面我們看一看S的統(tǒng)計(jì)功能: marks mean(marks) sd(marks) median(marks) min(marks) max(marks) boxplot(marks) 22第一個(gè)語(yǔ)句輸入若干數(shù)據(jù)到一個(gè)向量,函數(shù)c()用來(lái)把數(shù)據(jù)組合為一個(gè)向量。后面用了幾個(gè)函數(shù)來(lái)計(jì)算數(shù)據(jù)的均值、標(biāo)準(zhǔn)差、中位
10、數(shù)、最小值、最大值。最后的函數(shù)繪制數(shù)據(jù)的盒形圖。例中sd()是R中才有的函數(shù),在S-PLUS中要用sqrt(var()來(lái)計(jì)算。在S命令方式中要顯示一個(gè)表達(dá)式的值只要鍵入它。23中位數(shù)(median)排序后處于中間位置上的值Me50%50%不受極端值的影響主要用于順序數(shù)據(jù),也可用數(shù)值型數(shù)據(jù),但不能用于分類數(shù)據(jù)各變量值與中位數(shù)的離差絕對(duì)值之和最小,即24四分位數(shù)(quartile)排序后處于25%和75%位置上的值不受極端值的影響主要用于順序數(shù)據(jù),也可用于數(shù)值型數(shù)據(jù),但不能用于分類數(shù)據(jù)QLQMQU25%25%25%25%25四分位差(quartile deviation)對(duì)順序數(shù)據(jù)離散程度的測(cè)度也
11、稱為內(nèi)距或四分間距上四分位數(shù)與下四分位數(shù)之差 QD = QU QL反映了中間50%數(shù)據(jù)的離散程度不受極端值的影響用于衡量中位數(shù)的代表性26未分組數(shù)據(jù)箱線圖(box plot)用于顯示未分組的原始數(shù)據(jù)的分布箱線圖由一組數(shù)據(jù)的5個(gè)特征值繪制而成,它由一個(gè)箱子和兩條線段組成其繪制方法是:首先找出一組數(shù)據(jù)的5個(gè)特征值,即最大值、最小值、中位數(shù)Me 和兩個(gè)四分位數(shù)(下四分位數(shù)QL和上四分位數(shù)QU)連接兩個(gè)四分(位)數(shù)畫出箱子,再將兩個(gè)極值點(diǎn)與箱子相連接 27未分組數(shù)據(jù)單批數(shù)據(jù)箱線圖(箱線圖的構(gòu)成)中位數(shù)4681012QUQLX最大值X最小值簡(jiǎn)單箱線圖28可以把若干行命令保存在一個(gè)文本文件(比如E:/WO
12、RK/MYPROG.S)中,然后用source 函數(shù)來(lái)運(yùn)行整個(gè)文件: source(E:/lian.R)注意字符串中的反斜杠。用sink()函數(shù)可以把以后的輸出從屏幕窗口轉(zhuǎn)向到一個(gè)外部文本文件,例如: sink(“E:/WORK/MYPROG.txt)要恢復(fù)輸出到屏幕窗口,使用: sink()在S中還可以用“?”號(hào)后面跟要查詢的函數(shù)來(lái)顯示幫助信息,例如: ?c ?=29例2:計(jì)算6, 4, 7, 8,10的均值和標(biāo)準(zhǔn)差,把若干行命令保存在一個(gè)文本文件(比如E:lian1.R)中,然后用source 函數(shù)來(lái)運(yùn)行整個(gè)文件。a - c(10, 6, 4, 7, 8) b-mean(a) c ?fiv
13、enum fivenum(0:100) fivenum(1:100)fivenum(c(rnorm(100) fivenum(c(rnorm(100),-1:1/0)32實(shí)驗(yàn)作業(yè)1、查詢stem的函數(shù)幫助信息,并用幫助文件中的案例進(jìn)一步學(xué)習(xí).繪制 12 12 11 10 9 10 12 的莖葉圖。2、繪制y=x3 +sin(x)*cos(x)的函數(shù)圖,并加注圖例“自變量X”、“函數(shù)Y”、“示意圖”.要求:需給出程序、結(jié)果,存成word文檔星期日前發(fā)送到 用戶名:ryy 密碼: ryy33一個(gè)R的演示會(huì)話見(jiàn)相應(yīng)文件作為閱讀材料34附錄一 S常用函數(shù)參考 一、數(shù)據(jù)管理 vector:向量 nume
14、ric:數(shù)值型向量 logical:邏輯型向量 character;字符型向量 list:列表 data.frame:數(shù)據(jù)框 c:連接為向量或列表 length:求長(zhǎng)度 subset:求子集 rep:重復(fù) NA:缺失值 seq,from:to,sequence:等差序列 NULL:空對(duì)象 sort,order,unique,rev:排序 unlist:展平列表 attr,attributes:對(duì)象屬性 mode,typeof:對(duì)象存儲(chǔ)模式與類型 names:對(duì)象的名字屬性 35二、字符串處理 character:字符型向量 nchar:字符數(shù)substr:取子串 format,formatC:
15、把對(duì)象用格式轉(zhuǎn)換為字符串 paste,strsplit:連接或拆分 charmatch,pmatch:字符串匹配 grep,sub,gsub:模式匹配與替換 三、復(fù)數(shù) complex,Re,Im,Mod,Arg,Conj:復(fù)數(shù)函數(shù) 36四、因子 factor:因子 codes:因子的編碼 levels:因子的各水平的名字nlevels:因子的水平個(gè)數(shù) cut:把數(shù)值型對(duì)象分區(qū)間轉(zhuǎn)換為因子 table:交叉頻數(shù)表 split:按因子分組 aggregate:計(jì)算各數(shù)據(jù)子集的概括統(tǒng)計(jì)量 tapply:對(duì)“不規(guī)則”數(shù)組應(yīng)用函數(shù) 37數(shù)學(xué) 一、計(jì)算 +, -, *, /, , %, %/%:四則運(yùn)算
16、ceiling,floor,round,signif,trunc,zapsmall:舍入 max,min,pmax,pmin:最大最小值 range:最大值和最小值 sum,prod:向量元素和,積 cumsum,cumprod,cummax,cummin:累加、累乘 sort:排序 approx和approx fun:插值 diff:差分 sign:符號(hào)函數(shù) 38二、數(shù)學(xué)函數(shù)(I) abs,sqrt:絕對(duì)值,平方根 log, exp, log10, log2:對(duì)數(shù)與指數(shù)函數(shù) sin,cos,tan,asin,acos,atan:三角函數(shù) sinh,cosh,tanh,asinh,acosh:
17、雙曲函數(shù) beta,lbeta,gamma,lgamma,digamma,trigamma,tetragamma,pentagamma,choose ,lchoose:與貝塔函數(shù)、伽瑪函數(shù)、組合數(shù)有關(guān)的特殊函數(shù)39 fft,mvfft,convolve:富利葉變換及卷積 polyroot:多項(xiàng)式求根 poly:正交多項(xiàng)式 spline,splinefun:樣條差值 besselI,besselK,besselJ,besselY,gammaCody:Bessel函數(shù) deriv:簡(jiǎn)單表達(dá)式的符號(hào)微分或算法微分 二、數(shù)學(xué)函數(shù)(II)40三、數(shù)組array:建立數(shù)組 matrix:生成矩陣 data
18、.matrix:把數(shù)據(jù)框轉(zhuǎn)換為數(shù)值型矩陣 lower.tri:矩陣的下三角部分 mat.or.vec:生成矩陣或向量 t:矩陣轉(zhuǎn)置 cbind:把列合并為矩陣 rbind:把行合并為矩陣 diag:矩陣對(duì)角元素向量或生成對(duì)角矩陣 aperm:數(shù)組轉(zhuǎn)置 nrow, ncol:計(jì)算數(shù)組的行數(shù)和列數(shù) dim:對(duì)象的維向量 dimnames:對(duì)象的維名 row/colnames:行名或列名 %*%:矩陣乘法 crossprod:矩陣交叉乘積(內(nèi)積)41三、數(shù)組crossprod:矩陣交叉乘積(內(nèi)積) outer:數(shù)組外積 kronecker:數(shù)組的Kronecker積 apply:對(duì)數(shù)組的某些維應(yīng)用函
19、數(shù) tapply:對(duì)“不規(guī)則”數(shù)組應(yīng)用函數(shù) sweep:計(jì)算數(shù)組的概括統(tǒng)計(jì)量 aggregate:計(jì)算數(shù)據(jù)子集的概括統(tǒng)計(jì)量 scale:矩陣標(biāo)準(zhǔn)化 matplot:對(duì)矩陣各列繪圖 cor:相關(guān)陣或協(xié)差陣 Contrast:對(duì)照矩陣 row:矩陣的行下標(biāo)集 col:求列下標(biāo)集 42四、線性代數(shù) solve:解線性方程組或求逆 eigen:矩陣的特征值分解 svd:矩陣的奇異值分解 backsolve:解上三角或下三角方程組 chol:Choleski分解 qr:矩陣的QR分解 chol2inv:由Choleski分解求逆 43五、邏輯運(yùn)算 ,=,=,!=:比較運(yùn)算符 !,&,&,|,|,xor(
20、):邏輯運(yùn)算符 logical:生成邏輯向量 all,any:邏輯向量都為真或存在真 ifelse():二者擇一 match,%in%:查找 unique:找出互不相同的元素 which:找到真值下標(biāo)集合 duplicated:找到重復(fù)元素 44六、優(yōu)化及求根optimize,uniroot,polyroot:一維優(yōu)化與求根程序設(shè)計(jì) 一、控制結(jié)構(gòu) if,else,ifelse,switch:分支 for,while,repeat,break,next:循環(huán) apply,lapply,sapply,tapply,sweep:替代循環(huán)的函數(shù)。 45二、函數(shù) function:函數(shù)定義 source
21、:調(diào)用文件call:函數(shù)調(diào)用 .C,.Fortran:調(diào)用C或者Fortran子程序的動(dòng)態(tài)鏈接庫(kù)。 Recall:遞歸調(diào)用 browser,debug,trace,traceback:程序調(diào)試options:指定系統(tǒng)參數(shù) missing:判斷虛參是否有對(duì)應(yīng)實(shí)參 nargs:參數(shù)個(gè)數(shù) stop:終止函數(shù)執(zhí)行 46二、函數(shù) on.exit:指定退出時(shí)執(zhí)行 eval,expression:表達(dá)式計(jì)算 system.time:表達(dá)式計(jì)算計(jì)時(shí) invisible:使變量不顯示 menu:選擇菜單(字符列表菜單) 其它與函數(shù)有關(guān)的還有:delay,environment ,formals,interact
22、ive,is.finite,is.function,is.language,is.recursive ,match.arg,match.call,match.fun,model.extract,name,parse,substitute,sys.parent ,warning,machine。 47三、輸入輸出 cat,print:顯示對(duì)象sink:輸出轉(zhuǎn)向到指定文件 dump,save,dput,write:輸出對(duì)象scan,read.table,load,dget:讀入 48四、工作環(huán)境ls,objects:顯示對(duì)象列表 rm, remove:刪除對(duì)象 q,quit:退出系統(tǒng) .First,.Last:初始運(yùn)行函數(shù)與退出運(yùn)行函數(shù)。options:系統(tǒng)選項(xiàng) ?,help,help.start,apropos:幫助功能 data:列出數(shù)據(jù)集 49統(tǒng)計(jì)計(jì)算 一、統(tǒng)計(jì)分布 每一種分布有四個(gè)函數(shù): ddensity(密度函數(shù)),p分布函數(shù), q分位數(shù)函數(shù),r隨機(jī)數(shù)函數(shù)。 比如,正
溫馨提示
- 1. 本站所有資源如無(wú)特殊說(shuō)明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請(qǐng)下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請(qǐng)聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
- 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁(yè)內(nèi)容里面會(huì)有圖紙預(yù)覽,若沒(méi)有圖紙預(yù)覽就沒(méi)有圖紙。
- 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
- 5. 人人文庫(kù)網(wǎng)僅提供信息存儲(chǔ)空間,僅對(duì)用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對(duì)用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對(duì)任何下載內(nèi)容負(fù)責(zé)。
- 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請(qǐng)與我們聯(lián)系,我們立即糾正。
- 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶因使用這些下載資源對(duì)自己和他人造成任何形式的傷害或損失。
最新文檔
- 武漢職業(yè)技術(shù)學(xué)院《土地統(tǒng)計(jì)與R語(yǔ)言》2023-2024學(xué)年第一學(xué)期期末試卷
- 武漢工貿(mào)職業(yè)學(xué)院《中級(jí)日語(yǔ)聽(tīng)說(shuō)》2023-2024學(xué)年第一學(xué)期期末試卷
- 新疆建設(shè)職業(yè)技術(shù)學(xué)院《環(huán)境微生物實(shí)驗(yàn)技術(shù)》2023-2024學(xué)年第一學(xué)期期末試卷
- 2024年跨境電商物流服務(wù)合同協(xié)議書
- 二零二五年度廠房安全檢查與整改合同模板3篇
- 2024我國(guó)電子商務(wù)平臺(tái)服務(wù)商合作協(xié)議依法簽訂3篇
- 2024物品寄售及電商合作運(yùn)營(yíng)合同范本3篇
- 二零二五版果園廢棄物資源化利用與環(huán)保合作協(xié)議3篇
- 2024年高級(jí)人工智能語(yǔ)音識(shí)別技術(shù)轉(zhuǎn)讓合同
- 二零二五年港灣云物聯(lián)網(wǎng)平臺(tái)接入服務(wù)協(xié)議3篇
- 高一上半學(xué)期總結(jié)教學(xué)課件
- 高速公路初步設(shè)計(jì)匯報(bào)課件
- 申根簽證申請(qǐng)表模板
- 企業(yè)會(huì)計(jì)準(zhǔn)則、應(yīng)用指南及附錄2023年8月
- 2022年浙江省事業(yè)編制招聘考試《計(jì)算機(jī)專業(yè)基礎(chǔ)知識(shí)》真題試卷【1000題】
- 認(rèn)養(yǎng)一頭牛IPO上市招股書
- GB/T 3767-2016聲學(xué)聲壓法測(cè)定噪聲源聲功率級(jí)和聲能量級(jí)反射面上方近似自由場(chǎng)的工程法
- GB/T 23574-2009金屬切削機(jī)床油霧濃度的測(cè)量方法
- 動(dòng)物生理學(xué)-全套課件(上)
- 河北省衡水市各縣區(qū)鄉(xiāng)鎮(zhèn)行政村村莊村名居民村民委員會(huì)明細(xì)
- DB32-T 2665-2014機(jī)動(dòng)車維修費(fèi)用結(jié)算規(guī)范-(高清現(xiàn)行)
評(píng)論
0/150
提交評(píng)論