前往小程序,Get更优阅读体验!
立即前往
首页
学习
活动
专区
工具
TVP
发布
社区首页 >专栏 >如何修改启用了高可用HDFS的NameService ID

如何修改启用了高可用HDFS的NameService ID

作者头像
Fayson
发布2018-07-12 15:03:09
4.7K0
发布2018-07-12 15:03:09
举报
文章被收录于专栏:Hadoop实操Hadoop实操

温馨提示:要看高清无码套图,请使用手机打开并单击图片放大查看。

Fayson的github:https://github.com/fayson/cdhproject

提示:代码块部分可以左右滑动查看噢

1.文档编写目的


启用HDFS的NameNode高可用时,需要指定一个nameservice ID。这个ID用来标识由2个NameNode组成的单个HDFS实例。默认情况下,在启用NameNode高可用时,这个nameservice ID使用的是nameservice1。在启用HA的时候,我们可以通过指定dfs.nameservices参数来设置nameservice ID,但我们一样可以在后期修改nameservice ID,即在已经成功启用HA的集群中。本文Fayson就主要介绍如何修改启用了高可用HDFS的NameService ID。因为假设你有多个集群环境的话,nameservice ID都设置为一样的,有时候往往会造成困扰。

  • 测试环境

1.RedHat7.4

2.CM/CDH5.14.2

3.集群已经启用HDFS高可用

4.集群未启用Kerberos

2.操作步骤


1.操作前我们先记录HDFS的50070页面的block数量,方便后面进行比对

2.首先我们准备好一个启用了HDFS高可用正常的集群,并查看nameservice ID当前状态是nameservice2。

一个运行正常的集群如下:

查看HDFS的nameservice ID

3.去HDFS配置项里修改nameservice ID,注意有两个地方需要修改,Fayson的环境现有的是nameservice2,我们修改为nameservice3

保存配置

4.回到CM主页,发现所有服务都需要重启,按照提示要求进行部署配置并重启所有服务。

5.等待重启完成,回到CM主页发现大量报错,主要是HDFS服务的两个FC服务都没启动成功,实际就是HDFS不可用,导致其他所有的服务都异常。

6.我们先去HDFS配置那里确认nameservice修改成功了,见下图,已经是nameservice3。

7.为什么HDFS启动失败,是因为Zookeeper里注册的HA的nameservice信息没更新的原因,我们通过进入ZK的CLI,来手动更新nameservice,如下。

/opt/cloudera/parcels/CDH/lib/zookeeper/bin/zkCli.sh
ls /hadoop-ha
rmr /hadoop-ha/nameservice2

(可左右滑动)

注意:如果删除的时候碰到以下错误

Authentication is not valid : /hadoop-ha/nameservice1/ActiveBreadCrumb

(可左右滑动)

可以在Zookeeper CLI执行以下命令:

addauth digest hdfs-fcs:PASSWORD

(可左右滑动)

如何获取该命令中的PASSWORD呢?先ssh到NameNode节点

cd /var/run/cloudera-scm-agent/process
ls -d *FAILOVERCONTROLLER

(可左右滑动)

有多个文件,进入任意一个目录都可以。

cd 689-hdfs-FAILOVERCONTROLLER/

(可左右滑动)

在core-site.xml中搜索ha.zookeeper.auth,它的值类似

digest:hdfs-fcs:Rf4qxbgoODa96rO3Zb31ND5fSOGx8g

(可左右滑动)

digers:hdfs-fcs后面你看不到的那一部分就是Zookeeper需要的PASSWORD。这里是Rf4qxbgoODa96rO3Zb31ND5fSOGx8g

然后使用addauth digest hdfs-fcs:Rf4qxbgoODa96rO3Zb31ND5fSOGx8g登录Zookeeper来删除,执行以下命令:

rmr /hadoop-ha/<nameservice_id>

(可左右滑动)

8.选择HDFS服务,选择FC角色,执行“在Zookeeper中初始化高可用状态”,HDFS > Instances > Failover Controller role > Actions >"Initialize High Availability State in Zookeeper"

选择任意一台FC服务即可。

等待执行成功

9.再次登录Zookeeper客户端可以发现已经注册了我们修改的nameservice3

10.再次重启HDFS,发现还是会报错,JournalNode的edits没有格式化。

启动失败

发现是NameNode启动失败

查看任意一个NameNode的日志,发现有以下报错。

Error: recoverUnfinalizedSegments failed for required journal (JournalAndStream(mgr=QJM to [172.31.5.38:8485, 172.31.7.193:8485, 172.31.8.230:8485], stream=null))
org.apache.hadoop.hdfs.qjournal.client.QuorumException: Got too many exceptions to achieve quorum size 2/3. 3 exceptions thrown:
172.31.8.230:8485: Journal Storage Directory /jn/nameservice3 not formatted
    at org.apache.hadoop.hdfs.qjournal.server.Journal.checkFormatted(Journal.java:472)
    at org.apache.hadoop.hdfs.qjournal.server.Journal.getLastPromisedEpoch(Journal.java:245)
    at org.apache.hadoop.hdfs.qjournal.server.JournalNodeRpcServer.getJournalState(JournalNodeRpcServer.java:124)
    at org.apache.hadoop.hdfs.qjournal.protocolPB.QJournalProtocolServerSideTranslatorPB.getJournalState(QJournalProtocolServerSideTranslatorPB.java:118)
    at org.apache.hadoop.hdfs.qjournal.protocol.QJournalProtocolProtos$QJournalProtocolService$2.callBlockingMethod(QJournalProtocolProtos.java:25415)
    at org.apache.hadoop.ipc.ProtobufRpcEngine$Server$ProtoBufRpcInvoker.call(ProtobufRpcEngine.java:617)
    at org.apache.hadoop.ipc.RPC$Server.call(RPC.java:1073)
    at org.apache.hadoop.ipc.Server$Handler$1.run(Server.java:2281)
    at org.apache.hadoop.ipc.Server$Handler$1.run(Server.java:2277)
    at java.security.AccessController.doPrivileged(Native Method)
    at javax.security.auth.Subject.doAs(Subject.java:422)
    at org.apache.hadoop.security.UserGroupInformation.doAs(UserGroupInformation.java:1920)
    at org.apache.hadoop.ipc.Server$Handler.run(Server.java:2275)

(可左右滑动)

11.继续在这个NameNode页面下执行操作“初始化共享编辑目录”,也可以参考Fayson之前写的文章《JournalNode的edits目录没有格式化异常分析

执行成功

12.回到CM主页再次重启HDFS服务,这次启动成功

13.注意还要更新一下Hive的元数据,先停止Hive服务。

启动Hive服务

所有集群服务恢复正常

3.修改nameservice ID后前后HDFS数据比较


再次进入HDFS的50070查看,block数量还是对的,与之前的一致。

进入命令行测试HDFS与Hive

都正常,表明修改nameservice ID成功。

提示:代码块部分可以左右滑动查看噢

为天地立心,为生民立命,为往圣继绝学,为万世开太平。 温馨提示:要看高清无码套图,请使用手机打开并单击图片放大查看。

推荐关注Hadoop实操,第一时间,分享更多Hadoop干货,欢迎转发和分享。

原创文章,欢迎转载,转载请注明:转载自微信公众号Hadoop实操

本文参与 腾讯云自媒体分享计划,分享自微信公众号。
原始发表:2018-05-11,如有侵权请联系 cloudcommunity@tencent.com 删除

本文分享自 Hadoop实操 微信公众号,前往查看

如有侵权,请联系 cloudcommunity@tencent.com 删除。

本文参与 腾讯云自媒体分享计划  ,欢迎热爱写作的你一起参与!

评论
登录后参与评论
0 条评论
热度
最新
推荐阅读
相关产品与服务
专用宿主机
专用宿主机(CVM Dedicated Host,CDH)提供用户独享的物理服务器资源,满足您资源独享、资源物理隔离、安全、合规需求。专用宿主机搭载了腾讯云虚拟化系统,购买之后,您可在其上灵活创建、管理多个自定义规格的云服务器实例,自主规划物理资源的使用。
领券
问题归档专栏文章快讯文章归档关键词归档开发者手册归档开发者手册 Section 归档