




版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請(qǐng)進(jìn)行舉報(bào)或認(rèn)領(lǐng)
文檔簡介
1、實(shí)驗(yàn)?zāi)康?實(shí)驗(yàn)內(nèi)容,初步學(xué)習(xí)如何應(yīng)用R軟件解決統(tǒng)計(jì)問題,1、R 簡介 2、應(yīng)用實(shí)例 3、實(shí)驗(yàn)作業(yè),入門實(shí)例,一、 R簡介,為什么要學(xué)習(xí)R語言 R的資源 資料與文獻(xiàn) 網(wǎng)站 統(tǒng)計(jì)分析軟件包 S-Plus和R的初步比較 R的運(yùn)行平臺(tái) R_GUI R_Commander R_WinEdt R_ESS+XEmacs ,R的無私奉獻(xiàn)者,Bill Venables,Robert Gentleman,Ross Ihaka,R是 一個(gè)開放(GPL)的統(tǒng)計(jì)編程環(huán)境 一種語言,是語言(由AT demo(fm) q() 退出R,工具條介紹,Source R code,Load image,Save image,Cop
2、y and Paste,Stop current computation,Source R code 執(zhí)行R文件(*.R或*.r) Save image 保存工作空間,文件名為*.RData Load image 打開已有的工作空間 Stop current computation 中止當(dāng)前計(jì)算(由于超時(shí)等原因),(打開程序腳本),(載入映象),(保存映象),(打印),(中斷目前的計(jì)算),主菜單介紹(相應(yīng)有中文對(duì)照),S的基本界面是一個(gè)交互式命令窗口,命令提示符是一個(gè)大于號(hào),命令的結(jié)果馬上顯示在命令下面。后期版本也接受等號(hào) “=”。,二、應(yīng)用實(shí)例,S命令主要有兩種形式:表達(dá)式或賦值運(yùn)算(用表示
3、)。在命令提示符后鍵入一個(gè)表達(dá)式表示計(jì)算此表達(dá)式并顯示結(jié)果。賦值運(yùn)算把賦值號(hào)右邊的值計(jì)算出來賦給左邊的變量。,可以用向上光標(biāo)鍵來找回以前運(yùn)行的命令再次運(yùn)行或修改后再運(yùn)行。 S是區(qū)分大小寫的,所以x和X是不同的名字。,我們用一些例子來看R軟件的特點(diǎn)。 假設(shè)我們已經(jīng)進(jìn)入了R的交互式窗口。 如果沒有打開的圖形窗口,在R中,用: x11(),可以打開一個(gè)作圖窗口。然后,輸入以下語句:, x1 x2 y plot(x2,y, type=l),plot(x2,y,main=“畫圖練習(xí)”, type=“s”, sub=“好好練, xlab=x軸,ylab=y軸),這些語句可以繪制正弦曲線圖。其中,“”是賦值
4、運(yùn)算符。0:100表示一個(gè)從0到100 的等差數(shù)列向量。,第二個(gè)語句可以看出,我們可以對(duì)向量直接進(jìn)行四則運(yùn)算,計(jì)算得到的x2 是向量x1的所有元素乘以常數(shù)2*pi/100的結(jié)果。,從第三個(gè)語句可看到函數(shù)可以以向量為輸入,并可以輸出一個(gè)向量,結(jié)果向量y的每一個(gè)分量是自變量x2的每一個(gè)分量的正弦函數(shù)值。從最后一個(gè)語句可以看出函數(shù)的調(diào)用也很自由,可以按位置給出自變量,也可以用“自變量名”的形式指定自變量值,這樣可以使用缺省值。,數(shù)學(xué)函數(shù) abs,sqrt:絕對(duì)值,平方根 log, log10, log2 , exp:對(duì)數(shù)與指數(shù)函數(shù) sin,cos,tan,asin,acos,atan,atan2:三
5、角函數(shù) sinh,cosh,tanh,asinh,acosh,atanh:雙曲函數(shù),簡單統(tǒng)計(jì)量,sum, mean, var, sd, min, max, range, median, IQR(四分位間距)等統(tǒng)計(jì)量, sort,order,rank與排序有關(guān), 其它還有ave,fivenum,mad,quantile, stem等。,下面我們看一看S的簡單統(tǒng)計(jì)功能:, marks mean(marks) sd(marks) median(marks) min(marks) max(marks) boxplot(marks),第一個(gè)語句輸入若干數(shù)據(jù)到一個(gè)向量,函數(shù)c()用來把數(shù)據(jù)組合為一個(gè)向量。
6、 后面用了幾個(gè)函數(shù)來計(jì)算數(shù)據(jù)的均值、標(biāo)準(zhǔn)差、中位數(shù)、最小值、最大值。 最后的函數(shù)繪制數(shù)據(jù)的盒形圖。 例中sd()是R中才有的函數(shù),在S-PLUS中要用sqrt(var()來計(jì)算。 在S命令方式中要顯示一個(gè)表達(dá)式的值只要鍵入它。,中位數(shù)(median),排序后處于中間位置上的值,不受極端值的影響 主要用于順序數(shù)據(jù),也可用數(shù)值型數(shù)據(jù),但不能用于分類數(shù)據(jù) 各變量值與中位數(shù)的離差絕對(duì)值之和最小,即,四分位數(shù)(quartile),排序后處于25%和75%位置上的值,不受極端值的影響 主要用于順序數(shù)據(jù),也可用于數(shù)值型數(shù)據(jù),但不能用于分類數(shù)據(jù),四分位差(quartile deviation),對(duì)順序數(shù)據(jù)離散
7、程度的測度 也稱為內(nèi)距或四分間距 上四分位數(shù)與下四分位數(shù)之差 QD = QU QL 反映了中間50%數(shù)據(jù)的離散程度 不受極端值的影響 用于衡量中位數(shù)的代表性,未分組數(shù)據(jù)箱線圖(box plot),用于顯示未分組的原始數(shù)據(jù)的分布 箱線圖由一組數(shù)據(jù)的5個(gè)特征值繪制而成,它由一個(gè)箱子和兩條線段組成 其繪制方法是: 首先找出一組數(shù)據(jù)的5個(gè)特征值,即最大值、最小值、中位數(shù)Me 和兩個(gè)四分位數(shù)(下四分位數(shù)QL和上四分位數(shù)QU) 連接兩個(gè)四分(位)數(shù)畫出箱子,再將兩個(gè)極值點(diǎn)與箱子相連接。另外注意 兩邊的豎線也稱為胡須,分別離箱子邊的距離為1.5倍的四分位差(IQR),在其外被認(rèn)為離群點(diǎn),未分組數(shù)據(jù)單批數(shù)據(jù)箱
8、線圖(箱線圖的構(gòu)成),可以把若干行命令保存在一個(gè)文本文件(比如E:/WORK/MYPROG.S)中,然后用source 函數(shù)來運(yùn)行整個(gè)文件: source(E:/lian.R),注意字符串中的反斜杠。用sink()函數(shù)可以把以后的輸出從屏幕窗口轉(zhuǎn)向到一個(gè)外部文本文件,例如: sink(“E:/WORK/MYPROG.txt) 要恢復(fù)輸出到屏幕窗口,使用: sink(),在S中還可以用“?”號(hào)后面跟要查詢的函數(shù)來顯示幫助信息,例如: ?c ?=,例2:計(jì)算6, 4, 7, 8,10的均值和標(biāo)準(zhǔn)差,把若干行命令保存在一個(gè)文本文件(比如E:lian1.R)中,然后用source 函數(shù)來運(yùn)行整個(gè)文件。
9、,a - c(10, 6, 4, 7, 8) b-mean(a) c-sd(a),source(F:/lian1.R) a b c,要退出S-PLUS或R,可以用q()函數(shù),也可以用菜單命令。,R在退出時(shí)提問是否保存當(dāng)前工作空間,它可以把當(dāng)前定義的所有對(duì)象(有名字的向量、矩陣、列表、函數(shù)等)保存到一個(gè)文件。 ls()/ objects()查看當(dāng)前空間的對(duì)象,例3:查詢函數(shù)fivenum的幫助信息,并用幫助文件中的示例進(jìn)一步學(xué)習(xí)., ?fivenum, fivenum(0:100), fivenum(1:100),fivenum(c(rnorm(100), fivenum(c(rnorm(100
10、),-1:1/0),實(shí)驗(yàn)作業(yè),1、查詢stem的函數(shù)幫助信息,并用幫助文件 中的案例進(jìn)一步學(xué)習(xí). 然后 繪制 12 12 11 10 9 10 12 的莖葉圖。 2、繪制y=x3 +sin(x)*cos(x)的函數(shù)圖,并加注 圖例“自變量X”、“函數(shù)Y”、“示意圖”.,要求:需給出程序、結(jié)果,存成word文檔 星期日前發(fā)送到 3 用戶名:Sryy 密碼: ryy,一個(gè)R的演示會(huì)話,見相應(yīng)文件 作為閱讀材料,附錄一 S常用函數(shù)參考,一、數(shù)據(jù)管理 vector:向量 numeric:數(shù)值型向量 logical:邏輯型向量 character;字符型向量 list:列表
11、data.frame:數(shù)據(jù)框 c:連接為向量或列表 length:求長度 subset:求子集 rep:重復(fù) NA:缺失值 seq,from:to,sequence:等差序列 NULL:空對(duì)象 sort,order,unique,rev:排序 unlist:展平列表 attr,attributes:對(duì)象屬性 mode,typeof:對(duì)象存儲(chǔ)模式與類型 names:對(duì)象的名字屬性,二、字符串處理,character:字符型向量 nchar:字符數(shù)substr:取子串 format,formatC:把對(duì)象用格式轉(zhuǎn)換為字符串 paste,strsplit:連接或拆分 charmatch,pmatch
12、:字符串匹配 grep,sub,gsub:模式匹配與替換,三、復(fù)數(shù),complex,Re,Im, Mod,Arg,Conj:復(fù)數(shù)函數(shù),四、因子,factor:因子 codes:因子的編碼 levels:因子的各水平的名字 nlevels:因子的水平個(gè)數(shù) cut:把數(shù)值型對(duì)象分區(qū)間轉(zhuǎn)換為因子 table:交叉頻數(shù)表 split:按因子分組 aggregate:計(jì)算各數(shù)據(jù)子集的概括統(tǒng)計(jì)量 tapply:對(duì)“不規(guī)則”數(shù)組應(yīng)用函數(shù),數(shù)學(xué),一、計(jì)算,+, -, *, /, , %, %/%:四則運(yùn)算 ceiling,floor,round,signif,trunc,zapsmall:舍入 max,min
13、,pmax,pmin:最大最小值 range:最大值和最小值 sum,prod:向量元素和,積 cumsum,cumprod,cummax,cummin:累加、累乘 sort:排序 approx和approx fun:插值 diff:差分 sign:符號(hào)函數(shù),二、數(shù)學(xué)函數(shù)(I),abs,sqrt:絕對(duì)值,平方根 log, exp, log10, log2:對(duì)數(shù)與指數(shù)函數(shù) sin,cos,tan,asin,acos,atan:三角函數(shù) sinh,cosh,tanh,asinh,acosh:雙曲函數(shù),beta,lbeta,gamma,lgamma,digamma,trigamma,tetragam
14、ma,pentagamma,choose ,lchoose:與貝塔函數(shù)、伽瑪函數(shù)、組合數(shù)有關(guān)的特殊函數(shù),fft,mvfft,convolve:富利葉變換及卷積 polyroot:多項(xiàng)式求根 poly:正交多項(xiàng)式 spline,splinefun:樣條差值 besselI,besselK,besselJ,besselY,gammaCody:Bessel函數(shù) deriv:簡單表達(dá)式的符號(hào)微分或算法微分,二、數(shù)學(xué)函數(shù)(II),三、數(shù)組,array:建立數(shù)組 matrix:生成矩陣 data.matrix:把數(shù)據(jù)框轉(zhuǎn)換為數(shù)值型矩陣 lower.tri:矩陣的下三角部分 mat.or.vec:生成矩陣或
15、向量 t:矩陣轉(zhuǎn)置 cbind:把列合并為矩陣 rbind:把行合并為矩陣 diag:矩陣對(duì)角元素向量或生成對(duì)角矩陣 aperm:數(shù)組轉(zhuǎn)置 nrow, ncol:計(jì)算數(shù)組的行數(shù)和列數(shù) dim:對(duì)象的維向量 dimnames:對(duì)象的維名 row/colnames:行名或列名 %*%:矩陣乘法 crossprod:矩陣交叉乘積(內(nèi)積),三、數(shù)組,crossprod:矩陣交叉乘積(內(nèi)積) outer:數(shù)組外積 kronecker:數(shù)組的Kronecker積 apply:對(duì)數(shù)組的某些維應(yīng)用函數(shù) tapply:對(duì)“不規(guī)則”數(shù)組應(yīng)用函數(shù) sweep:計(jì)算數(shù)組的概括統(tǒng)計(jì)量 aggregate:計(jì)算數(shù)據(jù)子集的
16、概括統(tǒng)計(jì)量 scale:矩陣標(biāo)準(zhǔn)化 matplot:對(duì)矩陣各列繪圖 cor:相關(guān)陣或協(xié)差陣 Contrast:對(duì)照矩陣 row:矩陣的行下標(biāo)集 col:求列下標(biāo)集,四、線性代數(shù),solve:解線性方程組或求逆 eigen:矩陣的特征值分解 svd:矩陣的奇異值分解 backsolve:解上三角或下三角方程組 chol:Choleski分解 qr:矩陣的QR分解 chol2inv:由Choleski分解求逆,五、邏輯運(yùn)算,,=,=,!=:比較運(yùn)算符 !,&,&,|,|,xor():邏輯運(yùn)算符 logical:生成邏輯向量 all,any:邏輯向量都為真或存在真 ifelse():二者擇一 mat
17、ch,%in%:查找 unique:找出互不相同的元素 which:找到真值下標(biāo)集合 duplicated:找到重復(fù)元素,六、優(yōu)化及求根,optimize,uniroot,polyroot:一維優(yōu)化與求根,程序設(shè)計(jì),一、控制結(jié)構(gòu),if,else,ifelse,switch:分支 for,while,repeat,break,next:循環(huán) apply,lapply,sapply,tapply,sweep:替代循環(huán)的函數(shù)。,二、函數(shù),function:函數(shù)定義 source:調(diào)用文件 call:函數(shù)調(diào)用 .C,.Fortran:調(diào)用C或者Fortran子程序的動(dòng)態(tài)鏈接庫。 Recall:遞歸調(diào)用
18、 browser,debug,trace,traceback:程序調(diào)試 options:指定系統(tǒng)參數(shù) missing:判斷虛參是否有對(duì)應(yīng)實(shí)參 nargs:參數(shù)個(gè)數(shù) stop:終止函數(shù)執(zhí)行,二、函數(shù),on.exit:指定退出時(shí)執(zhí)行 eval,expression:表達(dá)式計(jì)算 system.time:表達(dá)式計(jì)算計(jì)時(shí) invisible:使變量不顯示 menu:選擇菜單(字符列表菜單),其它與函數(shù)有關(guān)的還有:delay,environment ,formals,,interactive,is.finite,is.function,is.language,is.recursive
19、 ,match.arg,match.call,match.fun,model.extract,name,parse,substitute,sys.parent ,warning,machine。,三、輸入輸出,cat,print:顯示對(duì)象 sink:輸出轉(zhuǎn)向到指定文件 dump,save,dput,write:輸出對(duì)象 scan,read.table,load,dget:讀入,四、工作環(huán)境,ls,objects:顯示對(duì)象列表 rm, remove:刪除對(duì)象 q,quit:退出系統(tǒng) .First,.Last:初始運(yùn)行函數(shù)與退出運(yùn)行函數(shù)。 options:系統(tǒng)選項(xiàng) ?,help,help.start,apropos:幫助功能 data:列出數(shù)據(jù)集,統(tǒng)計(jì)計(jì)算 一、統(tǒng)計(jì)分布,每一種分布有四個(gè)函數(shù): ddensity(密度函數(shù)),p分布函數(shù), q分位數(shù)函數(shù),r隨機(jī)數(shù)函數(shù)。 比如,正態(tài)分布dnorm,pnorm,qnorm,rnorm,下列各分布前面加前綴d、p、q或r就構(gòu)成函數(shù)名: norm:正態(tài), t:t分布, f:F分布,chisq:卡方(包括非中心) unif:均勻,,統(tǒng)計(jì)計(jì)算 一、
溫馨提示
- 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請(qǐng)下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請(qǐng)聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
- 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會(huì)有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
- 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
- 5. 人人文庫網(wǎng)僅提供信息存儲(chǔ)空間,僅對(duì)用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對(duì)用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對(duì)任何下載內(nèi)容負(fù)責(zé)。
- 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請(qǐng)與我們聯(lián)系,我們立即糾正。
- 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶因使用這些下載資源對(duì)自己和他人造成任何形式的傷害或損失。
最新文檔
- 鳳凰陵園公墓管理辦法
- 新疆煤田火災(zāi)管理辦法
- 公司投資評(píng)價(jià)管理辦法
- 人工智能在材料成型與控制工程專業(yè)人才培養(yǎng)中的應(yīng)用
- 煤礦班組建設(shè)實(shí)施建議
- 煤層氣開采過程中壓力分布的研究
- 硅酸鹽水泥生產(chǎn)工藝流程
- 企業(yè)培訓(xùn)計(jì)劃書設(shè)計(jì)與實(shí)施效果評(píng)估
- 體育中考成績分析與改進(jìn)策略
- 噪聲污染心理應(yīng)激-洞察及研究
- 2024年安徽省合肥市北城片區(qū)七年級(jí)數(shù)學(xué)第一學(xué)期期末學(xué)業(yè)水平測試試題含解析
- 2025至2030中國銅冶煉行業(yè)發(fā)展現(xiàn)狀及應(yīng)用需求現(xiàn)狀分析報(bào)告
- 茶園租賃合同(含茶葉加工銷售)
- 2025至2030全球及中國浮式液化天然氣行業(yè)產(chǎn)業(yè)運(yùn)行態(tài)勢(shì)及投資規(guī)劃深度研究報(bào)告
- 藥品連鎖總部管理制度
- 2025至2030中國家用清潔工具行業(yè)發(fā)展趨勢(shì)分析與未來投資戰(zhàn)略咨詢研究報(bào)告
- 20250617國金證券機(jī)器人行業(yè)研究垂直領(lǐng)域具身智能機(jī)器人的野望416mb
- 管理類本科論文
- 招商人員筆試題目及答案
- 物理●湖北卷丨2024年湖北省普通高中學(xué)業(yè)水平選擇性考試物理試卷及答案
- 全科規(guī)培考試試題及答案
評(píng)論
0/150
提交評(píng)論