Lecture1 入門實(shí)例_第1頁(yè)
Lecture1 入門實(shí)例_第2頁(yè)
Lecture1 入門實(shí)例_第3頁(yè)
Lecture1 入門實(shí)例_第4頁(yè)
Lecture1 入門實(shí)例_第5頁(yè)
已閱讀5頁(yè),還剩52頁(yè)未讀, 繼續(xù)免費(fèi)閱讀

下載本文檔

版權(quán)說(shuō)明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請(qǐng)進(jìn)行舉報(bào)或認(rèn)領(lǐng)

文檔簡(jiǎn)介

1、實(shí)驗(yàn)?zāi)康膶?shí)驗(yàn)內(nèi)容初步學(xué)習(xí)如何應(yīng)用R軟件解決統(tǒng)計(jì)問(wèn)題1、R 簡(jiǎn)介2、應(yīng)用實(shí)例3、實(shí)驗(yàn)作業(yè)入門實(shí)例1一、 R簡(jiǎn)介為什么要學(xué)習(xí)R語(yǔ)言R的資源 資料與文獻(xiàn) 網(wǎng)站 統(tǒng)計(jì)分析軟件包S-Plus和R的初步比較 R的運(yùn)行平臺(tái) R_GUI R_Commander R_WinEdt R_ESS+XEmacs 2R的無(wú)私奉獻(xiàn)者Bill Venables Robert Gentleman Ross Ihaka 3R是一個(gè)開(kāi)放(GPL)的統(tǒng)計(jì)編程環(huán)境一種語(yǔ)言,是語(yǔ)言(由AT&T Bell實(shí)驗(yàn)室的Rick Becker, John Chambers,Allan Wilks開(kāi)發(fā))的一種方言(dialect) 之一,另一則為

2、S-plus.一種軟件,是集統(tǒng)計(jì)分析與圖形直觀顯示于一體.R作為一個(gè)計(jì)劃(project),最早(1995年)是由Auckland大學(xué)統(tǒng)計(jì)系的Robert Gentleman和Ross Ihaka開(kāi)始編制,目前由核心開(kāi)發(fā)小組(R Development Core Team 以后用R DCT表示)維護(hù),他們完全自愿、工作努力負(fù)責(zé),并將全球優(yōu)秀的統(tǒng)計(jì)應(yīng)用軟件打包提供給我們。我們可以通過(guò)計(jì)劃的網(wǎng)站()了解有關(guān)的最新信息和使用說(shuō)明,得到最新版本的軟件和基于的應(yīng)用統(tǒng)計(jì)軟件包. 為什么要學(xué)習(xí)語(yǔ)言4是完全免費(fèi)的! 而S-Plus盡管是非常優(yōu)秀的統(tǒng)計(jì)分析軟件,可是你需要支付一筆$US .R可以在運(yùn)行于UNIX

3、, Windows和Macintosh的操作系統(tǒng)上 .R嵌入了一個(gè)非常實(shí)用的幫助系統(tǒng).R具有很強(qiáng)的作圖能力.我們能將程序容易地移植到S-Plus程序中,反之的許多過(guò)程直接或稍作修改即可用于.通過(guò)語(yǔ)言的許多內(nèi)嵌統(tǒng)計(jì)函數(shù),很容易學(xué)習(xí)和掌握R語(yǔ)言的語(yǔ)法.我們可以編制自己的函數(shù)來(lái)擴(kuò)展現(xiàn)有的語(yǔ)言(這就是為什么它在不斷升級(jí)完善!).5R主頁(yè): CRAN (Comprehensive R Archive Network), CRAN的鏡像站點(diǎn) UCLA提供的關(guān)于R與S-Plus的聯(lián)接,具有搜索功能 李東風(fēng)主頁(yè)提供了的Windows版本 如果使用FTP軟件(如Cuteftp)則推薦使用(匿名訪問(wèn)) 的網(wǎng)站資源

4、6CRAN提供了許多便于統(tǒng)計(jì)分析的宏包:stable - 穩(wěn)妥(分布)廣義回歸分析tseries 時(shí)間序列分析 VaR 風(fēng)險(xiǎn)值分析matrix 矩陣運(yùn)算cinterface C與R的接口foreign 讀寫由S, Minitab, SAS, SPSS, Stata等軟件的數(shù)據(jù)normix 混合正態(tài)分布分析nortest 正態(tài)分布的Anderson-Darling檢驗(yàn)MCMCpack 基于Gibbs抽樣的MCMC抽樣方法 fracdiff 分?jǐn)?shù)差分模型的極大似然估計(jì) 還有很多統(tǒng)計(jì)分析軟件包7S-Plus與R初步比較 豐富的數(shù)據(jù)類型(向量、數(shù)組、列表、對(duì)象等)特別有利于實(shí)現(xiàn)新的統(tǒng)計(jì)算法。S語(yǔ)言是由

5、AT&T貝爾實(shí)驗(yàn)室開(kāi)發(fā)的一種用來(lái)進(jìn)行數(shù)據(jù)探索、統(tǒng)計(jì)分析、作圖的解釋型語(yǔ)言。其交互式運(yùn)行方式及強(qiáng)大的圖形及交互圖形功能使得我們可以方便的探索數(shù)據(jù)。目前S語(yǔ)言的實(shí)現(xiàn)版本主要是S-PLUS。它基于S語(yǔ)言,并由MathSoft公司的統(tǒng)計(jì)科學(xué)部進(jìn)一步完善。8作為統(tǒng)計(jì)學(xué)家及一般研究人員的通用方法工具箱,S-PLUS強(qiáng)調(diào)圖形演示、探索性數(shù)據(jù)分析、統(tǒng)計(jì)方法、開(kāi)發(fā)新統(tǒng)計(jì)工具的計(jì)算方法,以及可擴(kuò)展性。S-PLUS可以直接用來(lái)進(jìn)行標(biāo)準(zhǔn)的統(tǒng)計(jì)分析得到所需結(jié)果,但是它的主要的特點(diǎn)是它可以交互地從各個(gè)方面去發(fā)現(xiàn)數(shù)據(jù)中的信息,并可以很容易地實(shí)現(xiàn)一個(gè)新的統(tǒng)計(jì)方法。S-PLUS有微機(jī)版本和工作站版本,它是一個(gè)商業(yè)軟件。9Auc

6、kland大學(xué)的Robert Gentleman 和 Ross Ihaka 及其他志愿人員開(kāi)發(fā)了一個(gè)R系統(tǒng),其語(yǔ)法形式與S語(yǔ)言基本相同,但實(shí)現(xiàn)不同,兩種語(yǔ)言的程序有一定的兼容性。R是一個(gè)GPL自由軟件,現(xiàn)在的版本是2.4.1版,它比S-PLUS 還少些功能,但已經(jīng)具有了很強(qiáng)的實(shí)用性。本課程中盡量介紹S-PLUS和R都能使用的功能,以R為主。下面我們用S統(tǒng)稱S-PLUS和R。 10R的運(yùn)行平臺(tái)R_GUI啟動(dòng)R,我們看到R GUI (graphic users interface)的主窗口, 它由三部分組成主菜單 工具條 R console (R的運(yùn)行窗口)R console你的主要工作是在這里通

7、過(guò)發(fā)布命令來(lái)完成的,包括數(shù)據(jù)集的建立,數(shù)據(jù)的分析,作圖等.在這里你可以得到在線幫助help() 得到相應(yīng)函數(shù)的幫助,例如help(plot)help.start() HTML格式的關(guān)于R的幫助文件demo() 得到R提供的幾個(gè)示例; demo(fm)q() 退出R11工具條介紹Source R codeLoad imageSave imageCopy and PasteStop current computationSource R code 執(zhí)行R文件(*.R或*.r)Save image 保存工作空間,文件名為*.RDataLoad image 打開(kāi)已有的工作空間Stop current

8、computation 中止當(dāng)前計(jì)算(由于超時(shí)等原因) (打開(kāi)程序腳本) (載入映象) (保存映象) (打印) (中斷目前的計(jì)算) 12主菜單介紹(相應(yīng)有中文對(duì)照)13S的基本界面是一個(gè)交互式命令窗口,命令提示符是一個(gè)大于號(hào),命令的結(jié)果馬上顯示在命令下面。二、應(yīng)用實(shí)例S命令主要有兩種形式:表達(dá)式或賦值運(yùn)算(用 x11() 可以打開(kāi)一個(gè)作圖窗口。然后,輸入以下語(yǔ)句: x1 x2 y plot(x2,y, type=l) plot(x2,y,type=“s”,main=“畫圖練習(xí)”,sub=“好好練, xlab=x軸,ylab=y軸)151617這些語(yǔ)句可以繪制正弦曲線圖。其中,“ x1 x y

9、plot(x,y, type=l) 1920簡(jiǎn)單統(tǒng)計(jì)量sum, mean, var, sd, min, max, range, median, IQR(四分位間距)等為統(tǒng)計(jì)量,sort,order,rank與排序有關(guān),其它還有ave,fivenum,mad,quantile,stem等。21下面我們看一看S的統(tǒng)計(jì)功能: marks mean(marks) sd(marks) median(marks) min(marks) max(marks) boxplot(marks) 22第一個(gè)語(yǔ)句輸入若干數(shù)據(jù)到一個(gè)向量,函數(shù)c()用來(lái)把數(shù)據(jù)組合為一個(gè)向量。后面用了幾個(gè)函數(shù)來(lái)計(jì)算數(shù)據(jù)的均值、標(biāo)準(zhǔn)差、中位

10、數(shù)、最小值、最大值。最后的函數(shù)繪制數(shù)據(jù)的盒形圖。例中sd()是R中才有的函數(shù),在S-PLUS中要用sqrt(var()來(lái)計(jì)算。在S命令方式中要顯示一個(gè)表達(dá)式的值只要鍵入它。23中位數(shù)(median)排序后處于中間位置上的值Me50%50%不受極端值的影響主要用于順序數(shù)據(jù),也可用數(shù)值型數(shù)據(jù),但不能用于分類數(shù)據(jù)各變量值與中位數(shù)的離差絕對(duì)值之和最小,即24四分位數(shù)(quartile)排序后處于25%和75%位置上的值不受極端值的影響主要用于順序數(shù)據(jù),也可用于數(shù)值型數(shù)據(jù),但不能用于分類數(shù)據(jù)QLQMQU25%25%25%25%25四分位差(quartile deviation)對(duì)順序數(shù)據(jù)離散程度的測(cè)度也

11、稱為內(nèi)距或四分間距上四分位數(shù)與下四分位數(shù)之差 QD = QU QL反映了中間50%數(shù)據(jù)的離散程度不受極端值的影響用于衡量中位數(shù)的代表性26未分組數(shù)據(jù)箱線圖(box plot)用于顯示未分組的原始數(shù)據(jù)的分布箱線圖由一組數(shù)據(jù)的5個(gè)特征值繪制而成,它由一個(gè)箱子和兩條線段組成其繪制方法是:首先找出一組數(shù)據(jù)的5個(gè)特征值,即最大值、最小值、中位數(shù)Me 和兩個(gè)四分位數(shù)(下四分位數(shù)QL和上四分位數(shù)QU)連接兩個(gè)四分(位)數(shù)畫出箱子,再將兩個(gè)極值點(diǎn)與箱子相連接 27未分組數(shù)據(jù)單批數(shù)據(jù)箱線圖(箱線圖的構(gòu)成)中位數(shù)4681012QUQLX最大值X最小值簡(jiǎn)單箱線圖28可以把若干行命令保存在一個(gè)文本文件(比如E:/WO

12、RK/MYPROG.S)中,然后用source 函數(shù)來(lái)運(yùn)行整個(gè)文件: source(E:/lian.R)注意字符串中的反斜杠。用sink()函數(shù)可以把以后的輸出從屏幕窗口轉(zhuǎn)向到一個(gè)外部文本文件,例如: sink(“E:/WORK/MYPROG.txt)要恢復(fù)輸出到屏幕窗口,使用: sink()在S中還可以用“?”號(hào)后面跟要查詢的函數(shù)來(lái)顯示幫助信息,例如: ?c ?=29例2:計(jì)算6, 4, 7, 8,10的均值和標(biāo)準(zhǔn)差,把若干行命令保存在一個(gè)文本文件(比如E:lian1.R)中,然后用source 函數(shù)來(lái)運(yùn)行整個(gè)文件。a - c(10, 6, 4, 7, 8) b-mean(a) c ?fiv

13、enum fivenum(0:100) fivenum(1:100)fivenum(c(rnorm(100) fivenum(c(rnorm(100),-1:1/0)32實(shí)驗(yàn)作業(yè)1、查詢stem的函數(shù)幫助信息,并用幫助文件中的案例進(jìn)一步學(xué)習(xí).繪制 12 12 11 10 9 10 12 的莖葉圖。2、繪制y=x3 +sin(x)*cos(x)的函數(shù)圖,并加注圖例“自變量X”、“函數(shù)Y”、“示意圖”.要求:需給出程序、結(jié)果,存成word文檔星期日前發(fā)送到 用戶名:ryy 密碼: ryy33一個(gè)R的演示會(huì)話見(jiàn)相應(yīng)文件作為閱讀材料34附錄一 S常用函數(shù)參考 一、數(shù)據(jù)管理 vector:向量 nume

14、ric:數(shù)值型向量 logical:邏輯型向量 character;字符型向量 list:列表 data.frame:數(shù)據(jù)框 c:連接為向量或列表 length:求長(zhǎng)度 subset:求子集 rep:重復(fù) NA:缺失值 seq,from:to,sequence:等差序列 NULL:空對(duì)象 sort,order,unique,rev:排序 unlist:展平列表 attr,attributes:對(duì)象屬性 mode,typeof:對(duì)象存儲(chǔ)模式與類型 names:對(duì)象的名字屬性 35二、字符串處理 character:字符型向量 nchar:字符數(shù)substr:取子串 format,formatC:

15、把對(duì)象用格式轉(zhuǎn)換為字符串 paste,strsplit:連接或拆分 charmatch,pmatch:字符串匹配 grep,sub,gsub:模式匹配與替換 三、復(fù)數(shù) complex,Re,Im,Mod,Arg,Conj:復(fù)數(shù)函數(shù) 36四、因子 factor:因子 codes:因子的編碼 levels:因子的各水平的名字nlevels:因子的水平個(gè)數(shù) cut:把數(shù)值型對(duì)象分區(qū)間轉(zhuǎn)換為因子 table:交叉頻數(shù)表 split:按因子分組 aggregate:計(jì)算各數(shù)據(jù)子集的概括統(tǒng)計(jì)量 tapply:對(duì)“不規(guī)則”數(shù)組應(yīng)用函數(shù) 37數(shù)學(xué) 一、計(jì)算 +, -, *, /, , %, %/%:四則運(yùn)算

16、ceiling,floor,round,signif,trunc,zapsmall:舍入 max,min,pmax,pmin:最大最小值 range:最大值和最小值 sum,prod:向量元素和,積 cumsum,cumprod,cummax,cummin:累加、累乘 sort:排序 approx和approx fun:插值 diff:差分 sign:符號(hào)函數(shù) 38二、數(shù)學(xué)函數(shù)(I) abs,sqrt:絕對(duì)值,平方根 log, exp, log10, log2:對(duì)數(shù)與指數(shù)函數(shù) sin,cos,tan,asin,acos,atan:三角函數(shù) sinh,cosh,tanh,asinh,acosh:

17、雙曲函數(shù) beta,lbeta,gamma,lgamma,digamma,trigamma,tetragamma,pentagamma,choose ,lchoose:與貝塔函數(shù)、伽瑪函數(shù)、組合數(shù)有關(guān)的特殊函數(shù)39 fft,mvfft,convolve:富利葉變換及卷積 polyroot:多項(xiàng)式求根 poly:正交多項(xiàng)式 spline,splinefun:樣條差值 besselI,besselK,besselJ,besselY,gammaCody:Bessel函數(shù) deriv:簡(jiǎn)單表達(dá)式的符號(hào)微分或算法微分 二、數(shù)學(xué)函數(shù)(II)40三、數(shù)組array:建立數(shù)組 matrix:生成矩陣 data

18、.matrix:把數(shù)據(jù)框轉(zhuǎn)換為數(shù)值型矩陣 lower.tri:矩陣的下三角部分 mat.or.vec:生成矩陣或向量 t:矩陣轉(zhuǎn)置 cbind:把列合并為矩陣 rbind:把行合并為矩陣 diag:矩陣對(duì)角元素向量或生成對(duì)角矩陣 aperm:數(shù)組轉(zhuǎn)置 nrow, ncol:計(jì)算數(shù)組的行數(shù)和列數(shù) dim:對(duì)象的維向量 dimnames:對(duì)象的維名 row/colnames:行名或列名 %*%:矩陣乘法 crossprod:矩陣交叉乘積(內(nèi)積)41三、數(shù)組crossprod:矩陣交叉乘積(內(nèi)積) outer:數(shù)組外積 kronecker:數(shù)組的Kronecker積 apply:對(duì)數(shù)組的某些維應(yīng)用函

19、數(shù) tapply:對(duì)“不規(guī)則”數(shù)組應(yīng)用函數(shù) sweep:計(jì)算數(shù)組的概括統(tǒng)計(jì)量 aggregate:計(jì)算數(shù)據(jù)子集的概括統(tǒng)計(jì)量 scale:矩陣標(biāo)準(zhǔn)化 matplot:對(duì)矩陣各列繪圖 cor:相關(guān)陣或協(xié)差陣 Contrast:對(duì)照矩陣 row:矩陣的行下標(biāo)集 col:求列下標(biāo)集 42四、線性代數(shù) solve:解線性方程組或求逆 eigen:矩陣的特征值分解 svd:矩陣的奇異值分解 backsolve:解上三角或下三角方程組 chol:Choleski分解 qr:矩陣的QR分解 chol2inv:由Choleski分解求逆 43五、邏輯運(yùn)算 ,=,=,!=:比較運(yùn)算符 !,&,&,|,|,xor(

20、):邏輯運(yùn)算符 logical:生成邏輯向量 all,any:邏輯向量都為真或存在真 ifelse():二者擇一 match,%in%:查找 unique:找出互不相同的元素 which:找到真值下標(biāo)集合 duplicated:找到重復(fù)元素 44六、優(yōu)化及求根optimize,uniroot,polyroot:一維優(yōu)化與求根程序設(shè)計(jì) 一、控制結(jié)構(gòu) if,else,ifelse,switch:分支 for,while,repeat,break,next:循環(huán) apply,lapply,sapply,tapply,sweep:替代循環(huán)的函數(shù)。 45二、函數(shù) function:函數(shù)定義 source

21、:調(diào)用文件call:函數(shù)調(diào)用 .C,.Fortran:調(diào)用C或者Fortran子程序的動(dòng)態(tài)鏈接庫(kù)。 Recall:遞歸調(diào)用 browser,debug,trace,traceback:程序調(diào)試options:指定系統(tǒng)參數(shù) missing:判斷虛參是否有對(duì)應(yīng)實(shí)參 nargs:參數(shù)個(gè)數(shù) stop:終止函數(shù)執(zhí)行 46二、函數(shù) on.exit:指定退出時(shí)執(zhí)行 eval,expression:表達(dá)式計(jì)算 system.time:表達(dá)式計(jì)算計(jì)時(shí) invisible:使變量不顯示 menu:選擇菜單(字符列表菜單) 其它與函數(shù)有關(guān)的還有:delay,environment ,formals,interact

22、ive,is.finite,is.function,is.language,is.recursive ,match.arg,match.call,match.fun,model.extract,name,parse,substitute,sys.parent ,warning,machine。 47三、輸入輸出 cat,print:顯示對(duì)象sink:輸出轉(zhuǎn)向到指定文件 dump,save,dput,write:輸出對(duì)象scan,read.table,load,dget:讀入 48四、工作環(huán)境ls,objects:顯示對(duì)象列表 rm, remove:刪除對(duì)象 q,quit:退出系統(tǒng) .First,.Last:初始運(yùn)行函數(shù)與退出運(yùn)行函數(shù)。options:系統(tǒng)選項(xiàng) ?,help,help.start,apropos:幫助功能 data:列出數(shù)據(jù)集 49統(tǒng)計(jì)計(jì)算 一、統(tǒng)計(jì)分布 每一種分布有四個(gè)函數(shù): ddensity(密度函數(shù)),p分布函數(shù), q分位數(shù)函數(shù),r隨機(jī)數(shù)函數(shù)。 比如,正

溫馨提示

  • 1. 本站所有資源如無(wú)特殊說(shuō)明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請(qǐng)下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請(qǐng)聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁(yè)內(nèi)容里面會(huì)有圖紙預(yù)覽,若沒(méi)有圖紙預(yù)覽就沒(méi)有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫(kù)網(wǎng)僅提供信息存儲(chǔ)空間,僅對(duì)用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對(duì)用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對(duì)任何下載內(nèi)容負(fù)責(zé)。
  • 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請(qǐng)與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶因使用這些下載資源對(duì)自己和他人造成任何形式的傷害或損失。

最新文檔

評(píng)論

0/150

提交評(píng)論