前往小程序,Get更优阅读体验!
立即前往
首页
学习
活动
专区
工具
TVP
发布
社区首页 >专栏 >0746-5.16.2-Impala中查询监控状态检查告警解析

0746-5.16.2-Impala中查询监控状态检查告警解析

作者头像
Fayson
发布2020-03-03 13:26:13
2K0
发布2020-03-03 13:26:13
举报
文章被收录于专栏:Hadoop实操Hadoop实操

作者:唐辉

文档说明

在使用impala 的过程中,在CM页面经常能看到IMPALA时, 经常看到IMPALA DAEMON 出现如下告警

代码语言:javascript
复制
The health test result for IMPALAD_QUERY_MONITORING_STATUS has become bad: There are 1 error(s) seen monitoring executing queries, and 0 errors(s) seen monitoring completed queries for this role in the previous 5 minute(s). Critical threshold: any.

本文主要讲述该告警产生的原因

告警重现和说明

首先我们需要知道这个告警产生的原因,通常该告警是在impala服务比较忙的集群上出现, CM会尝试链接impala 25000端口看网页是不是可用的,检查的超时时间默认为5秒,默认报错的次数是一次。检查时间为每5分钟检查一次。超时时间5秒对于比较忙的集群会比较短,所以会报这个问题。基于在这了解这个的基础上,由于测试集群的空间有限,所以这里通过kill 25000 端口进程来进行复现该问题。

通过lsof -i:25000 查找到端口并kill 复现问题后,如果你的浏览器首选语言是中文告警如下图:

相关参数如下:

impala 英文界面中搜索Query Monitoring Timeout

或者impala 中文界面搜索 查询监控超时

该参数为检查的超时时间

impala 配置中搜索 impala_query_monitoring_failure_window ,

意外退出监控周期 默认是 5分钟

意外退出阀值默认是任意值都出现严重告警

修改参数如下图:

重新进行验证后如下:

被kill 的impala 25000 端口进程会被自动拉起恢复,这里会出现一个5守护进程意外退出的告警,对于25000 端口超时告警由于被修改过阈值,出现的为一个黄色的警告查询。

监控状态检查出现上述的告警,它并不代表着该节点impala deamon 的服务不可用,多数情况下是端口繁忙访问超时影响,如果它对你的日常使用造成了困扰,那么你可以通过修改上述的参数进行合理的调整

Impala守护程序查询监视状态文档参考:

代码语言:javascript
复制
https://docs.cloudera.com/documentation/enterprise/5-16-x/topics/cm_ht_impala_daemon.html#concept_xrf_knn_yk
本文参与 腾讯云自媒体同步曝光计划,分享自微信公众号。
原始发表:2020-02-11,如有侵权请联系 cloudcommunity@tencent.com 删除

本文分享自 Hadoop实操 微信公众号,前往查看

如有侵权,请联系 cloudcommunity@tencent.com 删除。

本文参与 腾讯云自媒体同步曝光计划  ,欢迎热爱写作的你一起参与!

评论
登录后参与评论
0 条评论
热度
最新
推荐阅读
领券
问题归档专栏文章快讯文章归档关键词归档开发者手册归档开发者手册 Section 归档