




版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進(jìn)行舉報(bào)或認(rèn)領(lǐng)
文檔簡介
廈門大學(xué)林子雨編著《大數(shù)據(jù)技術(shù)原理與應(yīng)用》教材配套機(jī)房上機(jī)實(shí)驗(yàn)指南實(shí)驗(yàn)3第四章熟悉常用的HBase操作(版本號:2016年5月14日版本)主講教師:林子雨廈門大學(xué)數(shù)據(jù)庫實(shí)驗(yàn)室二零一六年五月目錄
目錄1 實(shí)驗(yàn)?zāi)康?12 實(shí)驗(yàn)平臺(tái) 13 實(shí)驗(yàn)內(nèi)容和要求 14 實(shí)驗(yàn)報(bào)告 1附錄1:任課教師介紹 2附錄2:課程教材介紹 2附錄3:中國高校大數(shù)據(jù)課程公共服務(wù)平臺(tái)介紹 3廈門大學(xué)林子雨編著《大數(shù)據(jù)技術(shù)原理與應(yīng)用》教材配套機(jī)房上機(jī)實(shí)驗(yàn)指南實(shí)驗(yàn)3第四章熟悉常用的HBase操作 主講教師:林子雨/linziyu第1頁
廈門大學(xué)林子雨編著《大數(shù)據(jù)技術(shù)原理與應(yīng)用》教材配套機(jī)房上機(jī)實(shí)驗(yàn)指南實(shí)驗(yàn)3第四章熟悉常用的HBase操作主講教師:林子雨E-mail:ziyulin@個(gè)人主頁:/linziyu實(shí)驗(yàn)?zāi)康?. 理解HBase在Hadoop體系結(jié)構(gòu)中的角色;2. 熟練使用HBase操作常用的Shell命令;3. 熟悉HBase操作常用的JavaAPI。實(shí)驗(yàn)平臺(tái)操作系統(tǒng):LinuxHadoop版本:2.6.0或以上版本HBase版本:1.1.2或以上版本JDK版本:1.6或以上版本JavaIDE:Eclipse實(shí)驗(yàn)內(nèi)容和要求編程實(shí)現(xiàn)以下指定功能,并用Hadoop提供的HBaseShell命令完成相同任務(wù):列出HBase所有的表的相關(guān)信息,例如表名;在終端打印出指定的表的所有記錄數(shù)據(jù);向已經(jīng)創(chuàng)建好的表添加和刪除指定的列族或列;清空指定的表的所有記錄數(shù)據(jù);統(tǒng)計(jì)表的行數(shù)?,F(xiàn)有以下關(guān)系型數(shù)據(jù)庫中的表和數(shù)據(jù),要求將其轉(zhuǎn)換為適合于HBase存儲(chǔ)的表并插入數(shù)據(jù):學(xué)生表(Student)學(xué)號(S_No)姓名(S_Name)性別(S_Sex)年齡(S_Age)2015001Zhangsanmale232015003Maryfemale222015003Lisimale24課程表(Course)課程號(C_No)課程名(C_Name)學(xué)分(C_Credit)123001Math2.0123002ComputerScience5.0123003English3.0選課表(SC)學(xué)號(SC_Sno)課程號(SC_Cno)成績(SC_Score)201500112300186201500112300369201500212300277201500212300399201500312300198201500312300295同時(shí),請編程完成以下指定功能:(1)createTable(StringtableName,String[]fields) 創(chuàng)建表,參數(shù)tableName為表的名稱,字符串?dāng)?shù)組fields為存儲(chǔ)記錄各個(gè)域名稱的數(shù)組。要求當(dāng)HBase已經(jīng)存在名為tableName的表的時(shí)候,先刪除原有的表,然后再創(chuàng)建新的表。 (2)addRecord(StringtableName,Stringrow,String[]fields,String[]values) 向表tableName、行row(用S_Name表示)和字符串?dāng)?shù)組files指定的單元格中添加對應(yīng)的數(shù)據(jù)values。其中fields中每個(gè)元素如果對應(yīng)的列族下還有相應(yīng)的列限定符的話,用“columnFamily:column”表示。例如,同時(shí)向“Math”、“ComputerScience”、“English”三列添加成績時(shí),字符串?dāng)?shù)組fields為{“Score:Math”,”Score;ComputerScience”,”Score:English”},數(shù)組values存儲(chǔ)這三門課的成績。 (3)scanColumn(StringtableName,Stringcolumn) 瀏覽表tableName某一列的數(shù)據(jù),如果某一行記錄中該列數(shù)據(jù)不存在,則返回null。要求當(dāng)參數(shù)column為某一列族名稱時(shí),如果底下有若干個(gè)列限定符,則要列出每個(gè)列限定符代表的列的數(shù)據(jù);當(dāng)參數(shù)column為某一列具體名稱(例如“Score:Math”)時(shí),只需要列出該列的數(shù)據(jù)。 (4)modifyData(StringtableName,Stringrow,Stringcolumn) 修改表tableName,行row(可以用學(xué)生姓名S_Name表示),列column指定的單元格的數(shù)據(jù)。(5)deleteRow(StringtableName,Stringrow) 刪除表tableName中row指定的行的記錄。利用HBase和MapReduce完成如下任務(wù):假設(shè)HBase有2張表,表的邏輯視圖及部分?jǐn)?shù)據(jù)如下所示:表邏輯視圖及部分?jǐn)?shù)據(jù)書名(bookName)價(jià)格(price)DatabaseSystemConcept30$ThinkinginJava60$DataMining25$要求:從HBase讀出上述兩張表的數(shù)據(jù),對“price”的排序,并將結(jié)果存儲(chǔ)到HBase中。實(shí)驗(yàn)報(bào)告《大數(shù)據(jù)技術(shù)原理與應(yīng)用》課程機(jī)房上機(jī)實(shí)驗(yàn)報(bào)告題目:姓名日期實(shí)驗(yàn)環(huán)境:實(shí)驗(yàn)內(nèi)容與完成情況:出現(xiàn)的問題:解決方案(列出遇到的問題和解決辦法,列出沒有解決的問題):附錄1:任課教師介紹林子雨(1978-),男,博士,廈門大學(xué)計(jì)算機(jī)科學(xué)系助理教授,主要研究領(lǐng)域?yàn)閿?shù)據(jù)庫,實(shí)時(shí)主動(dòng)數(shù)據(jù)倉庫,數(shù)據(jù)挖掘.主講課程:《大數(shù)據(jù)技術(shù)基礎(chǔ)》辦公地點(diǎn):廈門大學(xué)海韻園科研2號樓E-mail:ziyulin@個(gè)人主頁:/linziyu數(shù)據(jù)庫實(shí)驗(yàn)室網(wǎng)站:附錄2:課程教材介紹《大數(shù)據(jù)技術(shù)原理與應(yīng)用——概念、存儲(chǔ)、處理、分析與應(yīng)用》,由廈門大學(xué)計(jì)算機(jī)科學(xué)系教師林子雨博士編著,是中國高校第一本系統(tǒng)介紹大數(shù)據(jù)知識的專業(yè)教材。本書定位為大數(shù)據(jù)技術(shù)入門教材,為讀者搭建起通向“大數(shù)據(jù)知識空間”的橋梁和紐帶,以“構(gòu)建知識體系、闡明基本原理、引導(dǎo)初級實(shí)踐、了解相關(guān)應(yīng)用”為原則,為讀者在大數(shù)據(jù)領(lǐng)域“深耕細(xì)作”奠定基礎(chǔ)、指明方向。全書共有13章,系統(tǒng)地論述了大數(shù)據(jù)的基本概念、大數(shù)據(jù)處理架構(gòu)Hadoop、分布式文件系統(tǒng)HDFS、分布式數(shù)據(jù)庫HBase、NoSQL數(shù)據(jù)庫、云數(shù)據(jù)庫、分布式并行編程模型MapReduce、流計(jì)算、圖計(jì)算、數(shù)據(jù)可視化以及大數(shù)據(jù)在互聯(lián)網(wǎng)、生物醫(yī)學(xué)和物流等各個(gè)領(lǐng)域的應(yīng)用。在Hadoop、HDFS、HBase和MapReduce等重要章節(jié),安排了入門級的實(shí)踐操作,讓讀者更好地學(xué)習(xí)和掌握大數(shù)據(jù)關(guān)鍵技術(shù)。本書可以作為高等院校計(jì)算機(jī)專業(yè)、信息管理等相關(guān)專業(yè)的大數(shù)據(jù)課程教材,也可供相關(guān)技術(shù)人員參考、學(xué)習(xí)、培訓(xùn)之用。歡迎訪問《大數(shù)據(jù)技術(shù)原理與應(yīng)用——概念、存儲(chǔ)、處理、分析與應(yīng)用》教材官方網(wǎng)站:/post/bigdata掃一掃訪問教材官網(wǎng)附錄3:中國高校大數(shù)據(jù)課程公共服務(wù)平臺(tái)介紹中國高校大數(shù)據(jù)課程公共服務(wù)平臺(tái),由中國高校首個(gè)“數(shù)字教師”的提出者和建設(shè)者——林子雨老師發(fā)起,由廈門大學(xué)數(shù)據(jù)庫實(shí)驗(yàn)室全力打造,由廈門大學(xué)云計(jì)算與大數(shù)據(jù)研究中心、海峽云計(jì)算與大數(shù)據(jù)應(yīng)用研究中心攜手共建。這是國內(nèi)第一個(gè)服務(wù)于高校大數(shù)據(jù)課程建設(shè)的公共服務(wù)平臺(tái),旨在促進(jìn)國內(nèi)高校大數(shù)據(jù)課程體系建設(shè),提高大數(shù)據(jù)課程教學(xué)水平,降低大數(shù)據(jù)課程學(xué)習(xí)門檻,提升學(xué)生課程學(xué)習(xí)效果。平臺(tái)服務(wù)對象涵蓋高校、教師和學(xué)生。平臺(tái)為高校開設(shè)大數(shù)據(jù)課程提供全流程輔助,為教師開展教學(xué)工作提供一
溫馨提示
- 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
- 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會(huì)有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
- 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
- 5. 人人文庫網(wǎng)僅提供信息存儲(chǔ)空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負(fù)責(zé)。
- 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請與我們聯(lián)系,我們立即糾正。
- 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。
最新文檔
- 創(chuàng)新管理與組織變革-洞察闡釋
- 樂理卷子試題及答案
- 胎盤黃疸與新生兒黃疸的遺傳易感性研究-洞察闡釋
- 業(yè)務(wù)合同執(zhí)行狀態(tài)跟蹤統(tǒng)計(jì)表
- 線上線下游戲融合-洞察闡釋
- 2025大學(xué)食堂餐飲承包合同
- 煙草種植現(xiàn)場調(diào)研與質(zhì)量控制合同范本
- 保密項(xiàng)目參觀保密協(xié)議書模板
- 車輛抵押貸款風(fēng)險(xiǎn)分析合同模板
- 柴油儲(chǔ)備庫建設(shè)與購銷合作協(xié)議
- 2025屆上海市嘉定區(qū)八下數(shù)學(xué)期末考試試題含解析
- 四川省眉山市東坡區(qū)東坡區(qū)東坡中學(xué)2025年數(shù)學(xué)七下期末調(diào)研模擬試題含解析
- 2025年4月自考00158資產(chǎn)評估試題及答案含評分標(biāo)準(zhǔn)
- 車間原輔材料消耗管理
- 2025國家開放大學(xué)《員工勞動(dòng)關(guān)系管理》形考任務(wù)1234答案
- 2025年湖北省新高考信息卷(一)物理試題及答案
- 2025年廣西文化和旅游廳所屬事業(yè)單位招聘考試備考題庫
- 物聯(lián)網(wǎng)環(huán)境下精準(zhǔn)作物生長監(jiān)測與預(yù)警系統(tǒng)-全面剖析
- 2025-2030深水采油樹行業(yè)市場現(xiàn)狀供需分析及重點(diǎn)企業(yè)投資評估規(guī)劃分析研究報(bào)告
- 高鐵動(dòng)車組運(yùn)維成本分析-全面剖析
- 2025年中考語文作文文化傳承主題作文高分模板(分步詳解+例文示范)
評論
0/150
提交評論