數(shù)據(jù)分析與R語言實(shí)現(xiàn)01_第1頁
數(shù)據(jù)分析與R語言實(shí)現(xiàn)01_第2頁
數(shù)據(jù)分析與R語言實(shí)現(xiàn)01_第3頁
數(shù)據(jù)分析與R語言實(shí)現(xiàn)01_第4頁
數(shù)據(jù)分析與R語言實(shí)現(xiàn)01_第5頁
已閱讀5頁,還剩47頁未讀, 繼續(xù)免費(fèi)閱讀

下載本文檔

版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請(qǐng)進(jìn)行舉報(bào)或認(rèn)領(lǐng)

文檔簡(jiǎn)介

數(shù)據(jù)分析與R語言實(shí)現(xiàn)第一講多層模型

使用統(tǒng)計(jì)方法,有目的地對(duì)收集到的數(shù)據(jù)進(jìn)行分析處理,并且解讀分析結(jié)果。

數(shù)據(jù)分析常用算法數(shù)據(jù)分析工具數(shù)據(jù)挖掘數(shù)據(jù)挖掘是以查找隱藏在數(shù)據(jù)中的信息為目標(biāo)的技術(shù),是應(yīng)用算法從大型數(shù)據(jù)庫(kù)中提取知識(shí)的過程,這些算法確定信息項(xiàng)之間的隱性關(guān)聯(lián),并且向用戶顯示這些關(guān)聯(lián)數(shù)據(jù)挖掘思想來源:假設(shè)檢驗(yàn),模式識(shí)別,人工智能,機(jī)器學(xué)習(xí)常見數(shù)據(jù)挖掘任務(wù):關(guān)聯(lián)分析,聚類分析,孤立點(diǎn)分析等等例:啤酒與尿布的故事

例:《Science》的文章《科學(xué)家摸索出大型數(shù)據(jù)集內(nèi)的趨勢(shì)》展現(xiàn)層:報(bào)表與圖形老土的報(bào)表常見的報(bào)表儀表盤一些有趣的圖表某條微博的擴(kuò)散路徑數(shù)據(jù)分析和數(shù)據(jù)挖掘(分析層)+報(bào)表(展現(xiàn)層)我們課程的位置查看網(wǎng)絡(luò)資料,了解下列問題:1、什么是R語言?2、R語言的起源3、R語言的優(yōu)缺點(diǎn)?4、R軟件的安裝?R16R網(wǎng)絡(luò)資源R主頁:R資源列表NCEAS

/scicomp/software/rRGraphicalManualhttp://bm2.genes.nig.ac.jp/RGM2/index.php統(tǒng)計(jì)之都:

/QuikR/

丁國(guó)徽的R文檔:/R/R-doc/

R語言中文論壇/Rbbs/forums/list.page

R的Windows圖形用戶界面(RGUI)菜單按鈕命令行繪圖區(qū)R管理的幾個(gè)概念使用期(Session):

啟動(dòng)R系統(tǒng)到結(jié)束R系統(tǒng)之間的時(shí)間段對(duì)象(Object):

由R產(chǎn)生或處理的實(shí)體,包括變量、向量、矩陣、組合、函數(shù)等歷史(Histroy):R使用期間所應(yīng)用的歷史記錄(XXX.Rhistroy)工作空間(Workspace):

當(dāng)前被存儲(chǔ)對(duì)象的集合(XXX.Rdata)不但對(duì)象而且包含了對(duì)象的系統(tǒng)環(huán)境;當(dāng)一次使用完畢要關(guān)閉R時(shí),R會(huì)詢問是否保存工作空間軟件包(Package):

執(zhí)行一定功能的函數(shù)、數(shù)據(jù)等的集合,一些內(nèi)置于R系統(tǒng)內(nèi),大部分外置于網(wǎng)絡(luò)R代碼管理R文件(對(duì)象)管理工作空間載入和存儲(chǔ)歷史記錄管理路徑管理文件管理R文件(對(duì)象)管理工作路徑:getwd()setwd(“aa:/bb/…”)導(dǎo)入Rcode:source(“aa:/bb/…/XXX.rorXXX.txt”)如果已設(shè)定是工作路徑則source(“XXX.rorXXX.txt”)存儲(chǔ)工作空間:save.image(“XXX.Rdata”);導(dǎo)入工作空間load(“XXX.Rdata”),或者直接雙擊XXX.Rdata打開R界面,此時(shí)工作空間自動(dòng)導(dǎo)入,工作路徑默認(rèn)為XXX.Rdata存儲(chǔ)時(shí)的工作路徑存儲(chǔ)、導(dǎo)入命令行歷史記savehistory(file=“XXX.Rhistory”)loadhistory(file=“XXX.Rhistory”)R界面調(diào)整R工作空間內(nèi)對(duì)象和軟件包顯示顯示工作空間中的對(duì)象刪除工作空間中的所有對(duì)象顯示置入R工作空間的所有Packagels()rm(list=ls())search()R的Package管理將R的library的package載入R工作空間library(“packagename”)從網(wǎng)絡(luò)將外置的package載入R的library從計(jì)算機(jī)硬盤其它文件夾的package載入R的library24CRANTheComprehensiveRArchiveNetwork簡(jiǎn)稱CRAN,由世界幾十個(gè)鏡像網(wǎng)站組成網(wǎng)絡(luò),提供下載安裝程序和相應(yīng)軟件包。各鏡像更新頻率一般為1-2天推薦鏡像:中國(guó)的鏡像:數(shù)學(xué)所/mirrors/CRAN/及時(shí)更新的CRAN源/綜合性例子:模擬產(chǎn)生統(tǒng)計(jì)專業(yè)同學(xué)的名單(學(xué)號(hào)區(qū)分),記錄數(shù)學(xué)分析,線性代數(shù),概率統(tǒng)計(jì)三科成績(jī),然后進(jìn)行一些統(tǒng)計(jì)分析help()函數(shù)R語言—尋求幫助R語言—?jiǎng)?chuàng)建向量1:101:10-11:10*2a=2:20*2+1aa[5]a[-5]猜各行代碼的結(jié)果是什么?以下的呢?a[1:5]a[-(1:5)]a[c(2,4,7)]a[a<10]a[a[2]]seq()函數(shù)seq(5,20)seq(5,121,by=2)seq(5,121,length=10)seq(5,121,by=2,length=10)

產(chǎn)生字母序列l(wèi)etters

letters[1:30]

求平均值,和,連乘,最值,方差,標(biāo)準(zhǔn)差

函數(shù)mean(),sum(),prod(),min(),max(),var(),sd()

which()函數(shù)a=c(2,3,4,2,5,1,6,3,2,5,8,5,7,3)which.max(a)which.min(a)a[which.max(a)]which(a==2)a[which(a==2)]which(a>5)a[which(a>5)]rev(),sort()函數(shù)a=1:10;arev(a)#reverse:倒過來a=c(2,3,5,8,1,9,2,4,3,2)sort(a)rev(sort(a))matrix()函數(shù)R語言—生成矩陣x1=seq(2,12,length=5)x2=seq(3,15,length=5)R語言—矩陣運(yùn)算函數(shù)t(),矩陣加減矩陣相乘,函數(shù)diag()矩陣求逆,函數(shù)rnorm(),solve()R語言—解線性方程組函數(shù)solve(a,b)R語言—矩陣的特征值與特征向量函數(shù)eigen()R語言—數(shù)據(jù)框矩陣形式,但列可以不同數(shù)據(jù)類型每列是一個(gè)變量,每行是一個(gè)觀測(cè)值R語言—畫散點(diǎn)圖函數(shù)plot()R語言—讀外部數(shù)據(jù)讀文本文件先設(shè)置工作目錄,把文本文件放于該目錄下讀剪切板文本或excel的數(shù)據(jù)均可通過剪貼板操作讀excel文件數(shù)據(jù)方法1:先把excel另存為空格分隔的prn文本格式再讀

方法2:安裝RODBC包,再通過ODBC讀R語言—分布函數(shù)正態(tài)分布函數(shù)rnorm()泊松分布函數(shù)rpois()指數(shù)分布函數(shù)rexp()Gamma分布函數(shù)rgamma()均勻分布函數(shù)runif()二項(xiàng)分布函數(shù)rbinom()幾何分布函數(shù)rgeom()綜合例子講解模擬產(chǎn)生統(tǒng)計(jì)專業(yè)同學(xué)的名單(學(xué)號(hào)區(qū)分),記錄數(shù)學(xué)分析,線性代數(shù),概率統(tǒng)計(jì)三科成績(jī),然后進(jìn)行一些統(tǒng)計(jì)分析。num=seq(10378001,10378100)x1=round(runif(100,min=80,max=100))x2=round(rnorm(100,mean=80,sd=7))x3=round(rnorm(100,mean=83,sd=18))x3[which(x3>100)]=1001、模擬生產(chǎn)學(xué)號(hào)和三科成績(jī)2、合成數(shù)據(jù)框并保存到硬盤—data.frame()、write.tablex=data.frame(num,x1,x2,x3)write.table(x,file=

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請(qǐng)下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請(qǐng)聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會(huì)有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫(kù)網(wǎng)僅提供信息存儲(chǔ)空間,僅對(duì)用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對(duì)用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對(duì)任何下載內(nèi)容負(fù)責(zé)。
  • 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請(qǐng)與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶因使用這些下載資源對(duì)自己和他人造成任何形式的傷害或損失。

最新文檔

評(píng)論

0/150

提交評(píng)論