




版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進行舉報或認領(lǐng)
文檔簡介
1、 大數(shù)據(jù)與數(shù)據(jù)挖掘?qū)嶒炏到y(tǒng)北京紅亞華宇科技有限公司大數(shù)據(jù)的特點大數(shù)據(jù)的特點大數(shù)據(jù)首先是數(shù)據(jù)量大,典型的大數(shù)據(jù)系統(tǒng)所管理的數(shù)據(jù)可達PB級其次大數(shù)據(jù)的來源復雜,數(shù)據(jù)質(zhì)量差異較大最后大數(shù)據(jù)的數(shù)據(jù)關(guān)系復雜,難以用傳統(tǒng)的關(guān)系型數(shù)據(jù)庫描述大數(shù)據(jù)分析的基石大數(shù)據(jù)分析的基石大數(shù)據(jù)實驗系統(tǒng)所支撐的學科與課程大數(shù)據(jù)實驗系統(tǒng)所支撐的學科與課程大數(shù)據(jù)與數(shù)據(jù)挖掘?qū)嶒烆悇e大數(shù)據(jù)與數(shù)據(jù)挖掘?qū)嶒烆悇e大數(shù)據(jù)實驗系統(tǒng)整體框架大數(shù)據(jù)實驗系統(tǒng)整體框架大數(shù)據(jù)與數(shù)據(jù)挖掘?qū)嶒灮A(chǔ)軟件大數(shù)據(jù)與數(shù)據(jù)挖掘?qū)嶒灮A(chǔ)軟件數(shù)據(jù)挖掘基礎(chǔ)語言環(huán)境R語言最為流行的開源統(tǒng)計與數(shù)據(jù)挖掘軟件可跨平臺運行,高效的腳本語言為數(shù)據(jù)分析和顯示提供的強大圖形功能豐富的高質(zhì)
2、量的開源第三方算法軟件包大數(shù)據(jù)分析環(huán)境Hadoop開源大數(shù)據(jù)分析的事實標準大量的互聯(lián)網(wǎng)公司作為實際生產(chǎn)平臺方便的Java開發(fā)環(huán)境不斷演進的良好生態(tài)環(huán)境大數(shù)據(jù)與數(shù)據(jù)挖掘?qū)嶒灮A(chǔ)軟件大數(shù)據(jù)與數(shù)據(jù)挖掘?qū)嶒灮A(chǔ)軟件最流行的商用數(shù)據(jù)統(tǒng)計分析軟件SAS功能強大,統(tǒng)計方法齊全功能強大,統(tǒng)計方法齊全使用簡便,操作靈活使用簡便,操作靈活簡單而強大的通用數(shù)據(jù)分析軟件Excel數(shù)據(jù)統(tǒng)計分析數(shù)據(jù)統(tǒng)計分析利用利用VBA進行數(shù)據(jù)挖掘分析進行數(shù)據(jù)挖掘分析通用開發(fā)語言Java數(shù)據(jù)爬取自然語言處理大數(shù)據(jù)實驗平臺網(wǎng)絡(luò)拓撲大數(shù)據(jù)實驗平臺網(wǎng)絡(luò)拓撲服務(wù)器端R計算服務(wù)Hadoop集群虛擬化實驗臺學生端 遠程連接 開發(fā)環(huán)境 測試環(huán)境大數(shù)據(jù)
3、實驗系統(tǒng)實驗內(nèi)容(大數(shù)據(jù)實驗系統(tǒng)實驗內(nèi)容(1)數(shù)據(jù)挖掘展示性實驗用于展示常用數(shù)據(jù)挖掘算法的作用,使用者通過實驗系統(tǒng)所提供數(shù)據(jù)集,直觀理解數(shù)據(jù)挖掘算法的輸出結(jié)果實驗類型實驗名稱統(tǒng)計與建模方法演示實驗統(tǒng)計推斷基礎(chǔ)統(tǒng)計分布假設(shè)檢驗基本線性回歸多變量線性回歸廣義線性模型實驗類型實驗名稱數(shù)據(jù)挖掘方法演示實驗數(shù)據(jù)可視化聚類數(shù)據(jù)降維分類基礎(chǔ)決策樹分類方法高級分類方法關(guān)聯(lián)分析大數(shù)據(jù)實驗系統(tǒng)實驗內(nèi)容(大數(shù)據(jù)實驗系統(tǒng)實驗內(nèi)容(2)數(shù)據(jù)挖掘R語言開發(fā)實驗利用實驗系統(tǒng)提供的R語言環(huán)境,學習基本的R語言開發(fā)方法,并針對提供的數(shù)據(jù)集開發(fā)數(shù)據(jù)挖掘算法實驗類型實驗名稱R語言編程基礎(chǔ)R語言基礎(chǔ)R語言控制語句R語言數(shù)據(jù)類型R語言
4、常用函數(shù)R語言程序調(diào)試實驗類型實驗名稱R語言統(tǒng)計與建模R語言統(tǒng)計推斷基礎(chǔ)R語言統(tǒng)計分布R語言假設(shè)檢驗R語言基本線性回歸R語言多變量線性回歸R語言廣義線性模型實驗類型實驗名稱R語言數(shù)據(jù)分析綜合應(yīng)用R語言建立信用評分模型R語言預測股票市場收益R語言預測經(jīng)濟指標R語言偵測欺詐交易R語言微陣列樣本分類大數(shù)據(jù)實驗系統(tǒng)實驗內(nèi)容(大數(shù)據(jù)實驗系統(tǒng)實驗內(nèi)容(3)數(shù)據(jù)挖掘SAS開發(fā)實驗利用實驗系統(tǒng)提供的SAS環(huán)境,學習基本的SAS開發(fā)方法,并針對提供的數(shù)據(jù)集開發(fā)數(shù)據(jù)挖掘算法實驗類型實驗名稱SAS基礎(chǔ)編程實驗SAS基礎(chǔ)SAS控制語句SAS數(shù)據(jù)類型SAS常用函數(shù)SAS程序調(diào)試實驗類型實驗名稱SAS統(tǒng)計與建模SAS統(tǒng)計
5、推斷基礎(chǔ)SAS統(tǒng)計分布SAS假設(shè)檢驗SAS線性回歸SAS多變量線性回歸SAS廣義線性模型實驗類型實驗名稱SAS數(shù)據(jù)挖掘算法SAS數(shù)據(jù)可視化SAS聚類SAS數(shù)據(jù)降維SAS分類基礎(chǔ)SAS決策樹分類方法SAS高級分類方法SAS關(guān)聯(lián)分析實驗類型實驗名稱SAS數(shù)據(jù)分析綜合應(yīng)用SAS建立信用評分模型SAS預測股票市場收益SAS預測經(jīng)濟指標SAS偵測欺詐交易SAS微陣列樣本分類大數(shù)據(jù)實驗系統(tǒng)實驗內(nèi)容(大數(shù)據(jù)實驗系統(tǒng)實驗內(nèi)容(4)基于Hadoop的大數(shù)據(jù)基礎(chǔ)實驗利用實驗所提供的環(huán)境,學習基本的MapReduce 算法,利用提供大數(shù)據(jù)在Hadoop實現(xiàn)大數(shù)據(jù)實戰(zhàn)分析實驗類型實驗名稱大數(shù)據(jù)基礎(chǔ)實驗Hadoop環(huán)境
6、的搭建實驗基礎(chǔ)MapReduce開發(fā)實驗迭代式MapReduce程序和計數(shù)器實驗分區(qū)、排序和合并算法實驗Hive的使用實驗類型實驗名稱大數(shù)據(jù)實戰(zhàn)實驗超市零售數(shù)據(jù)分析實驗NetFlix電影數(shù)據(jù)分析實驗新浪微博消息分析實驗帶有情感標簽的微博數(shù)據(jù)分析實驗網(wǎng)絡(luò)安全日志分析實驗出租車GPS位置分析實驗社交資源共享站點用戶行為分析實驗大數(shù)據(jù)實驗系統(tǒng)實驗內(nèi)容(大數(shù)據(jù)實驗系統(tǒng)實驗內(nèi)容(5)與大數(shù)據(jù)相關(guān)的其他實驗實現(xiàn)大數(shù)據(jù)分析中常用的Excel數(shù)據(jù)分析、數(shù)據(jù)爬取、自然語言處理、數(shù)據(jù)庫使用等實驗實驗類型實驗名稱Excel數(shù)據(jù)處理與分析Excel基本操作Excel數(shù)據(jù)可視化Excel函數(shù)與公式Excel透視表Exc
7、el數(shù)據(jù)分析VBA程序基礎(chǔ)VBA控制語句VBA常用函數(shù)VBA綜合應(yīng)用實驗類型實驗名稱My SQL數(shù)據(jù)庫操作MySQL配置SQL中的DDL語句SQL中的DML語句SQL中的DCL語句MySQL常用函數(shù)MySQL存儲過程和自定義函數(shù)實驗類型實驗名稱JAVA數(shù)據(jù)爬取抓取網(wǎng)頁處理HTML頁面非HTML正文抽取設(shè)計爬蟲隊列并行爬蟲實驗類型實驗名稱JAVA自然語言處理字符串編碼正則表達式自動分詞句法分析語義分析實驗平臺管理方式實驗平臺管理方式B/S架構(gòu)的管理體系,系統(tǒng)分為管理員、教師與學生三種角色管理員管理實驗內(nèi)容以及教師用戶注冊,教師管理實驗開放、實驗流程以及學生打分學生用戶完成實驗內(nèi)容,提交實驗報告虛實結(jié)合的實驗平臺虛實結(jié)合的實驗平臺以云計算的方式提供實驗開發(fā)環(huán)境以學生端虛擬化的方式提供本地Hadoop環(huán)境以后臺服務(wù)方式提供R語言自動運行服務(wù)以Shell方式提供支持大數(shù)據(jù)的Hadoop運行環(huán)境自動化實驗管理平臺自動化實驗管理平臺學生端實驗環(huán)境自動啟動與環(huán)境恢復服務(wù)端資源自動分配與
溫馨提示
- 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
- 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預覽,若沒有圖紙預覽就沒有圖紙。
- 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
- 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負責。
- 6. 下載文件中如有侵權(quán)或不適當內(nèi)容,請與我們聯(lián)系,我們立即糾正。
- 7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。
最新文檔
- 2025年廢棄倉庫區(qū)補償協(xié)議書策劃范本
- 2025年海洋貨物運輸互惠協(xié)議
- 2025年大學實習生就業(yè)協(xié)議樣本
- 2025年工程領(lǐng)域策劃人員協(xié)作管理協(xié)議
- 2025年深圳市二手房購買預約協(xié)議書
- 2025年企業(yè)間市場營銷合作協(xié)議書
- 2025年名鑄廣場瑞鯨公司裝修施工協(xié)議
- 2025年標準版文儀采購協(xié)議
- 2025年官方土地使用權(quán)轉(zhuǎn)讓協(xié)議樣本
- 2025年農(nóng)村道路拓寬土地租賃策劃協(xié)議范本
- 核電站建設(shè)工程承包合同
- 漢字與對外漢語教學知到智慧樹章節(jié)測試課后答案2024年秋西北師范大學
- APP開發(fā)及運營投資協(xié)議
- 青海省西寧市2025屆中考一模生物試題含解析
- 2025屆四川省成都市彭州市重點達標名校中考沖刺卷生物試題含解析
- 成人術(shù)中非計劃低體溫預防與護理-2024中華護理學會團體標準
- 砌體及構(gòu)造柱圈梁等二次結(jié)構(gòu)施工方案
- 團建活動復盤匯報
- 項目管理流程制度標題
- 2025版 初中 語文 學考復習 第三部分 模擬練《江西省2025年初中語文學業(yè)水平考試模擬練(三)》課件
- 2024年危險化學品生產(chǎn)經(jīng)營單位其他從業(yè)人員考試題庫附答案
評論
0/150
提交評論