CDH高可用集群误删NameNode故障恢复

温馨提示:要看高清无码套图,请使用手机打开并单击图片放大查看。

1.问题描述


在已启用HA的CDH集群中,误删Standby Namenode服务,导致集群异常,无法再次通过CM启用HA。异常如下

2.问题复现


测试环境:

  • CDH5.11.2

1.一个健康集群并配置了HA

2.停止StandbyNameNode服务并删除

3.集群异常

4.再次通过CM启用HA

集群无法再次启用HA,问题复现。

3.解决方法


1.向集群添加一个新的NameNode角色

新增NN角色

2.添加完成NN后集群异常如下

3.修改新增角色的配置如下

4.保存以上修改的配置后,回到CM主页

5.重启完成集群恢复正常

醉酒鞭名马,少年多浮夸! 岭南浣溪沙,呕吐酒肆下!挚友不肯放,数据玩的花! 温馨提示:要看高清无码套图,请使用手机打开并单击图片放大查看。


推荐关注Hadoop实操,第一时间,分享更多Hadoop干货,欢迎转发和分享。

原创文章,欢迎转载,转载请注明:转载自微信公众号Hadoop实操

原文发布于微信公众号 - Hadoop实操(gh_c4c535955d0f)

原文发表时间:2017-10-04

本文参与腾讯云自媒体分享计划,欢迎正在阅读的你也加入,一起分享。

编辑于

我来说两句

0 条评论
登录 后参与评论

相关文章

来自专栏Hadoop实操

如何为Hive2启用Kerberos认证

3672
来自专栏Hadoop实操

Cloudera Manager分发Parcel异常分析

在使用Cloudera Manager分发Parcel包时一直处于激活状态不变,相关CM日志及CM界面截图如下:

9377
来自专栏Hadoop实操

Spark的HistoryServer不能查看到所有历史作业分析

Spark的HistoryServer能正常查看之前的历史作业日志,但新提交的作业在执行完成后未能在HistoryServer页面查看。

1.4K8
来自专栏Hadoop实操

在同时使用Hive+Sentry,因HMS死锁导致的高并发写入工作负载时,查询速度缓慢或者停滞

1725
来自专栏Hadoop实操

如何编译适用于CDH的Tez版本并集成Kerberos环境的Hive2

在上一篇文章Fayson介绍了《非Kerberos环境下Hive2.2.0 On Tez集成》,使用Apache官网默认编译好的0.8.5版本的Tez,默认的版...

5612
来自专栏星汉技术

原 Spark的架构

3315
来自专栏Spark学习技巧

Spark部署模式另类详解

一, Spark的运行模式讲解 Spark运行模式有很多种,本文主要是将local,Standalone,yarn。因为平时生产中用的最多的也是...

3185
来自专栏牛肉圆粉不加葱

【容错篇】Spark Streaming的还原药水——Checkpoint

一个 Streaming Application 往往需要7*24不间断的跑,所以需要有抵御意外的能力(比如机器或者系统挂掉,JVM crash等)。为了让这成...

802
来自专栏闵开慧

job监控与hadoop权限管理

监测Hadoop控制中心及作业运行状况 MapReduce框架由一个单独的Master JobTracker和集群节点上的Slave TaskTracker共...

40712
来自专栏Hadoop实操

如何使用Nginx实现Impala负载均衡

在使用Impala JDBC连接Impala服务时,默认是不带负载均衡的,但一个Impala Daemon很可能会产生单点的问题,这里我们就需要考虑Impala...

5618

扫码关注云+社区

领取腾讯云代金券