3、但糟糕的是, 当天 16:36 左右, 另一个 ResourceManager(cmsnn001)似乎一直无法进入 Active 状态, (但是由于相关日志缺失, 无法确认具体的原因, 不过很可能也是因为...2.一般这个问题可能与正在运行的作业数量、 以及作业的 Attempts数量、应用负载增加,、集群扩容后都可能出现。...9月15日YARN待定container有7万多:
?
9月10日YARN待定container也有7万多:
?
过去30天YARN待定container:
?...我们的集群是CDH5.15.1,通过调查发现, ResourceManager的这个问题在 CDH5上并没有修复, 虽然 CDH5 已经包括了YARN-3469, 但是根本上解决这个问题至少需要YARN...另外, 虽然社区已经改进了 YARN, 但由于 YARN 的新功能也在不断加入, Zookeeper的存储需求也在增加, 即使升级到了 CDH6, 还是有可能出现 YARN 到 Zookeeper之间大数据量写入的问题