我从cloudera经理那里得到了这些警告。JOURNAL_NODE_FSYNC_LATENCY的健康测试结果令人担忧:前一分钟的第99百分位数fsync延迟为2.3秒。警告阈值:1秒。
我查看了cloudera文档,它显示1秒是警告,3秒是关键。造成这一问题的原因是什么,如何解决?
发布于 2016-01-26 23:59:17
原因;JournalNode频率同步延迟"JOURNAL_NODE_FSYNC_LATENCY“
这是一个检查JournalNode的fsync延迟的JournalNode健康测试。如果前一分钟的第99百分位数fsync延迟超过配置的阈值,则此测试返回“坏”健康。不佳的fsync性能可能表示一个糟糕的或重载的磁盘(即JournalNode与NameNode和DataNode共享同一个磁盘)。并将对NameNode执行的HDFS元数据操作的性能产生负面影响。
如何解决这个问题;在受影响的节点上使用iostat监视您的磁盘;或者将JournalNode内容移动到单独的磁盘上。
https://stackoverflow.com/questions/35025934
复制相似问题