




版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進(jìn)行舉報(bào)或認(rèn)領(lǐng)
文檔簡介
1、參考書籍: Hadoop in action, 吳超沉思錄1.Hbase簡介1.面向列的分布式數(shù)據(jù)庫2. 以HDFS作為文件系統(tǒng)3. 利用MapReduce處理Hbase中海量數(shù)據(jù)4. ZookKeeper作為協(xié)調(diào)工具5. sqoop提供Hbase到關(guān)系型數(shù)據(jù)庫中數(shù)據(jù)導(dǎo)入功能6. Hive和pig提供高層語言支持如HSQL2. 偽分布式安裝準(zhǔn)備: 安裝Hadoop 詳細(xì)見上一篇日志: hadoop分布式安裝hbase版本: 安裝目錄 /usr/local步驟:1. 2. 重命名: mv hbase-0.94.7-security hbase
2、3. 配置環(huán)境變量hbase_home (vi /etc/profile)4. 修改配置文件1. hbase_home/conf/hbase_env.sh 修改java_home export JAVA_HOME=/usr/local/jdk/ 修改zookeeper(最后一行) export HBASE_MANAGES_ZK=true(使用Hbase托管的ZooKeeper)2. hbase_home/conf/hbase-site.xml文件 configuration 中加入:<property> <name>hbase.rootdir</nam
3、e> <value>hdfs:/hadoop0:9000/hbase</value></property><property> <name></name> <value>true</value></property><property> <name></name> <value>hadoop0</value></property><property> <name>dfs.replicat
4、ion</name> <value>1</value></property>5. 啟動(dòng)hbase先啟動(dòng)hadoop(start-all.sh)啟用hbase (start-hbase.sh)jps查看進(jìn)程 (HMaster,HRegionServer, HQuorumPeer)http:/hadoop0:60010可以查看管理界面,如下:6. 進(jìn)程說明:HMaster: 管理Hbase table的DDL操作給region分配工作HResionServer: 原則上每個(gè)slave對應(yīng)一個(gè)HRegionServerHQuorumPeer: ZooK
5、eeper的守護(hù)進(jìn)程,此處我們使用的是Hbase內(nèi)置的ZooKeeper(在hbase-env.sh中有配置) 3. 分布式安裝準(zhǔn)備條件: hadoop分布式環(huán)境已安裝,查看 hadoop分布式安裝hadoop0主機(jī)上hbase偽分布已安裝完成安裝:1. scp -rp /usr/local/hbase hadoop1:/usr/local2. 在hadoop0上更改hbase_home/conf/regionservers 將localhost更改為hadoop13. 在hadoop0上啟動(dòng)hbase4. jps查看,如下:hadoop0上進(jìn)程: h
6、adoop1上進(jìn)程:同理可通過 hostname:60010訪問hbase管理界面,同分布式安裝部分4. 數(shù)據(jù)模型1. Hbase數(shù)據(jù)庫采用了和Bigtable非常類似的數(shù)據(jù)類型,表格是稀疏的;1. row key 行鍵,table的主鍵2. timestamp 時(shí)間戳,數(shù)據(jù)操作時(shí)對應(yīng)的時(shí)間戳,可以看成數(shù)據(jù)的version number3. Column Family 列簇,每個(gè)family可以由任意多個(gè)column組成,列名是<族名>:<標(biāo)簽>形式;一個(gè)表格的族名時(shí)固定的,除非使用管理員權(quán)限來改變表格的族名; 不過可以在任何時(shí)候添加新的標(biāo)簽;eg:course對于表來
7、說是一個(gè)有兩個(gè)列的列族(該列族由兩個(gè)列組成math和art);rowkeynameTimeStampcoursemathartwishwisht1t2t3979397987699rainraint410090 4.兩張?zhí)厥獾谋? -ROOT- 和 .META.作用如下:(即-ROOT-記錄.META.的region信息,.META.記錄用戶表的region信息)關(guān)系如下:基本操作 (注意操作后不要加分號,習(xí)慣了sql,總是在后面加分號,然后發(fā)現(xiàn)執(zhí)行語句后都一直沒有反應(yīng),去掉分號后成功)(表名和列名都需要加引號,不區(qū)分單雙引號
8、)Hbase shell,是Hbase的命令行工具,命令行中執(zhí)行hbase shell即可進(jìn)入hbase shell命令行 1) list 查看hbase中所有表2) 創(chuàng)建表: create '表名','列簇1','列簇2'.create 'student', 'name','grade','course'在管理界面中查看student3)describe 查看表結(jié)構(gòu)describe '表名' eg: describe
9、9;student'hbase(main):003:0> describe "student"DESCRIPTION ENABLED 'student', NAME => 'course', DATA_BLOCK_ENCODING = true > 'NONE', BLOOMFILTER => 'NONE', REPLICATION_SCOPE => '0', VERSIONS => '3', COMPRESSION =>
10、9;NONE', MIN _VERSIONS => '0', TTL => '2147483647', KEEP_DELETED _CELLS => 'false', BLOCKSIZE => '65536', IN_MEMORY => 'false', ENCODE_ON_DISK => 'true', BLOCKCACHE => 'true', NAME => 'grade', DATA_BLOCK_ENCO
11、DING => 'NONE', BLOOMFILTER => 'NONE', REPLICATION_SCOPE => '0', VERSIONS => '3', COMPRESSION => 'NONE', MIN_V ERSIONS => '0', TTL => '2147483647', KEEP_DELETED_C ELLS => 'false', BLOCKSIZE => '65536',
12、 IN_MEMORY => 'false', ENCODE_ON_DISK => 'true', BLOCKCACHE => ' true', NAME => 'name', DATA_BLOCK_ENCODING => 'NO NE', BLOOMFILTER => 'NONE', REPLICATION_SCOPE => '0 ', VERSIONS => '3', COMPRESSION => 'NO
13、NE', MIN_VERS IONS => '0', TTL => '2147483647', KEEP_DELETED_CELL S => 'false', BLOCKSIZE => '65536', IN_MEMORY => 'f alse', ENCODE_ON_DISK => 'true', BLOCKCACHE => 'tru e'4)插入數(shù)據(jù)和查看數(shù)據(jù)put '表名','行鍵名','
14、列名','value','列名2','value2','family:列名1','value3'.put 'student','wish','name:','wish' 查詢數(shù)據(jù):get '表名','行名'get 'student','wish'插入更多數(shù)據(jù)hbase(main):004:0> put 'student','wish'
15、,'course:English','100'hbase(main):005:0> put 'student','wish','course:Chinese','60'hbase(main):006:0> put 'student','rain','course:Chinese','100'hbase(main):007:0> put 'student','rain','course:English','200'查看表中數(shù)據(jù): scan 'student'其他get例子:get 'student','wish','course'get 'student','wish',&
溫馨提示
- 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
- 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會(huì)有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
- 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
- 5. 人人文庫網(wǎng)僅提供信息存儲(chǔ)空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負(fù)責(zé)。
- 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請與我們聯(lián)系,我們立即糾正。
- 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。
最新文檔
- 微生物檢驗(yàn)技術(shù)人員的職業(yè)素養(yǎng)與試題及答案
- 童車制造企業(yè)生產(chǎn)調(diào)度與優(yōu)化練習(xí)考核試卷
- 室外拱形廊道施工方案
- 垃圾運(yùn)輸防滲漏施工方案
- 2025年【光氣及光氣化工藝】模擬考試題及答案
- 移動(dòng)通信技術(shù)在智慧工廠行業(yè)的應(yīng)用考核試卷
- 項(xiàng)目材料采購的試題及答案
- 2024年花藝師考試的學(xué)習(xí)方法與技巧試題及答案
- 畜牧業(yè)綠色發(fā)展政策建議考核試卷
- 紙張表面裝飾技術(shù)的創(chuàng)新與發(fā)展考核試卷
- DL∕T 5210.4-2018 電力建設(shè)施工質(zhì)量驗(yàn)收規(guī)程 第4部分:熱工儀表及控制裝置
- B江水利樞紐工程畢業(yè)設(shè)計(jì)計(jì)算書
- HG+20231-2014化學(xué)工業(yè)建設(shè)項(xiàng)目試車規(guī)范
- 2024海南中考化學(xué)二輪重點(diǎn)專題突破 專題三 流程圖題(課件)
- 急性冠脈綜合征患者健康教育
- 道德與法治賽課一等獎(jiǎng):《勿忘國恥》教學(xué)課件(五下)
- 2024年全國初中數(shù)學(xué)競賽試題含答案
- 任務(wù)花式噴泉PLC控制任務(wù)課件
- 手術(shù)室轉(zhuǎn)運(yùn)工人培訓(xùn)
- MOOC 電子線路分析基礎(chǔ)-西安電子科技大學(xué) 中國大學(xué)慕課答案
- 15j403-1樓梯欄桿標(biāo)準(zhǔn)
評論
0/150
提交評論