HBase的安装部署

Spark学习技巧

发布于 2018-01-31 11:35:12

8350

发布于 2018-01-31 11:35:12

文章被收录于专栏：Spark学习技巧

一、准备环境

Java-- jdk-8u121-linux-x64.tar.gz

Hadoop--hadoop-2.7.4.tar.gz (jdk1.7会报错)

Hbase-- hbase-1.2.0-bin.tar.gz

Zookeeper-- zookeeper-3.4.5.tar.gz

本系列教程所有jar包，请关注微信公众号 ：Spark高级玩法，输入software获取。

Centos 6.5是本文采用的操作系统

二，安装Zookeeper

Zookeeper的单机版安装很简单。主要是配置数据存储目录。

1，配置环境变量

# zookeeper
export ZOOKEEPER_HOME=/opt/modules/zookeeper-3.4.5/
export ZOOKEEPER_CONF_DIR=$ZOOKEEPER_HOME/conf
export PATH=$PATH:$ZOOKEEPER_HOME/bin

2，创建data目录

在Zookeeper的当前节点创建一个data子目录

mkdir -p /opt/modules/zookeeper-3.4.5/data

3，修改zoo.cfg

mv zoo_sample.cfg zoo.cfg

修改配置zoo.cfg，下面属性为我们创建的Zookeeper的data目录。

dataDir=/opt/modules/zookeeper-3.4.5/data

4，启动Zookeeper

zkServer.sh start

5，查看状态

zkServer.sh status

三，安装测试hbase

Hbase的角色也简单，服务端就是master，regionserver，Zookeeper，剩下的就是管理客户端或者数据插入读取客户端。配置使用hbase主要有以下几个步骤。

1， regionserver配置

主要是配置主机名，其实不配置也可以，就是要逐台去启动，当然，也可以写个批处理脚本。

Luffy.OnePiece.com

2，在hbse-site.xml中添加如下配置

要首先创建一个data/tmp目录。

mkdir -p /opt/modules/hbase-1.2.0/data/tmp

然后，修改hbase-site.xml

<property>
 <name>hbase.tmp.dir</name>
 <value>/opt/modules/hbase-1.2.0/data/tmp</value>
 </property>
 <property >
 <name>hbase.rootdir</name>
 <value>hdfs://Luffy.OnePiece.com:8020/hbase</value>
 </property>
 <property >
 <name>hbase.cluster.distributed</name>
 <value>true</value>
 </property>
 <property>
 <name>hbase.zookeeper.quorum</name>
 <value>Luffy.OnePiece.com</value>
 </property>

3，启动hbase

首先要启动Zookeeper，因为hbase是依赖于Zookeeper的，然后启动hbase。

配置环境变量

# HBase
export HBASE_HOME=/opt/modules/hbase-1.2.0
export HBASE_CONF_DIR=$HBASE_HOME/conf
export PATH=$PATH:$HBASE_HOME/bin

启动hbase

hbase-daemon.sh start master

hbase-daemon.sh start regionserver

4，可在web浏览器中查看

以前的默认端口是60010，而新版本的是16010，在浏览器中输入

http://luffy.onepiece.com:16010

可以看到

5，在Zookeeper中查看hbase信息

6，测试hbase指令

首先输入，hbase shell等待

创建表

create 'user','info'

插入数据

put 'user','1001','info:name','lisi'

put 'user','1001','info:age','18'

put 'user','1001','info:sex','male'

查看数据

scan 'user'

使用get查看数据

删除数据

禁用表

删除表

删除表要先禁用，再删除。

四，总结

Hbase是运行在Hadoop上的NoSQL数据库，它是一个分布式的和可扩展的大数据仓库，也就是说HBase能够利用HDFS的分布式处理模

式，并从Hadoop的MapReduce程序模型中获益。这意味着在一组商业硬件上存储许多具有数十亿行和上百万列的大表。除去Hadoop的优

势，HBase本身就是十分强大的数据库，它能够融合key/value存储模式带来实时查询的能力，以及通过MapReduce进行离线处理或者批处理

的能力。

HBase不是一个关系型数据库，它需要不同的方法定义你的数据模型，HBase实际上定义了一个四维数据模型，下面就是每一维度的定义：

行键：每行都有唯一的行键，行键没有数据类型，它内部被认为是一个字节数组。

列簇：数据在行中被组织成列簇，每行有相同的列簇，但是在行之间，相同的列簇不需要有相同的列修饰符。在引擎中，HBase将列簇存储在它自己的数据文件中，所以，它们需要事先被定义，此外，改变列簇并不容易。

列修饰符：列簇定义真实的列，被称之为列修饰符，你可以认为列修饰符就是列本身。

推荐阅读：

1，Hadoop伪分布式集群安装部署

2，Spark部署模式另类详解

3，Spark调优系列之硬件要求

4，Kafka源码系列之topic创建分区分配及leader选举

本文参与腾讯云自媒体同步曝光计划，分享自微信公众号。

原始发表：2017-11-07，如有侵权请联系 cloudcommunity@tencent.com 删除

其他

本文分享自浪尖聊大数据微信公众号，前往查看

如有侵权，请联系 cloudcommunity@tencent.com 删除。

本文参与腾讯云自媒体同步曝光计划，欢迎热爱写作的你一起参与！

其他

登录后参与评论

0 条评论

热度

HBase的安装部署

HBase的安装部署

社区

活动

资源

关于

腾讯云开发者

热门产品

热门推荐

更多推荐