此篇是在Hadoop分布式环境搭建(简单高效~)这篇博文的基础上进行搭建的,如果有不会的同学可自行查看操作。同时,如果缺少Zookeeper包的同学可上博主的分享的百度云连接进行下载。 下面为百度云链接: 链接:https://pan.baidu.com/s/178EYOx9N5rHZyjRnrHu13Q 提取码:199b
在hadoop002、hadoop003和hadoop004三个节点上部署Zookeeper。
[bigdata@hadoop002 software]$ tar -zxvf zookeeper-3.4.10.tar.gz -C /opt/module/
[bigdata@hadoop002 zookeeper-3.4.10]$ mkdir -p zkData
[bigdata@hadoop002 zkData]$ vim myid
添加myid文件,注意一定要在linux里面创建,在notepad++里面很可能乱码
[bigdata@hadoop002 zookeeper-3.4.10]$ cd conf
[bigdata@hadoop002 conf]$ mv zoo_sample.cfg zoo.cfg
[bigdata@hadoop002 conf]$ vim zoo.cfg
dataDir=/opt/module/zookeeper-3.4.10/zkData
增加如下配置
#######################cluster##########################
server.2=hadoop002:2888:3888
server.3=hadoop003:2888:3888
server.4=hadoop004:2888:3888
server.A=B:C:D。
A是一个数字,表示这个是第几号服务器; 集群模式下配置一个文件myid,这个文件在dataDir目录下,这个文件里面有一个数据就是A的值,Zookeeper启动时读取此文件,拿到里面的数据与zoo.cfg里面的配置信息比较从而判断到底是哪个server。 B是这个服务器的地址; C是这个服务器Follower与集群中的Leader服务器交换信息的端口; D是万一集群中的Leader服务器挂了,需要一个端口来重新进行选举,选出一个新的Leader,而这个端口就是用来执行选举时服务器相互通信的端口。
[bigdata@hadoop002 zookeeper-3.4.10]$ bin/zkServer.sh start
[bigdata@hadoop003 zookeeper-3.4.10]$ bin/zkServer.sh start
[bigdata@hadoop004 zookeeper-3.4.10]$ bin/zkServer.sh start
[bigdata@hadoop002 zookeeper-3.4.10]$ bin/zkServer.sh status
[bigdata@hadoop003 zookeeper-3.4.10]$ bin/zkServer.sh status
[bigdata@hadoop004 zookeeper-3.4.10]$ bin/zkServer.sh status
如果进行到这里和上图显示的一样,那么基本可以判定是成功了。