Zabbix agent on Zabbix server is unreachable for 5 minutes

Zabbix agent on Zabbix server is unreachable for 5 minutes

主机运行时,会报这个错,所以要先按安装Zabbix agent,

Zabbix-server在监控的过程中,发现Web上报错提示zabbix server与agent之间已经失联超过5分钟了,为了找到问题出现的根本原因,在troubleshouting的时候,应该首先去查看服务对应的日志。首先应该查看server端的日志有无错误消息,通过日志查看,发现server端运行正常,那么问题很可能就出现在了客户端上,来到这台agent上查看服务日志。

1.查看日志

  1. [root@iZbp11rfoyeescusr9ha9qZ tmp]# find / -name *agentd.log
  2. /var/log/zabbix/zabbix_agentd.log
  3. [root@iZbp11rfoyeescusr9ha9qZ tmp]# vim /var/log/zabbix/zabbix_agentd.log
  4. 23904:20170310:092458.633 Starting Zabbix Agent [Zabbix server]. Zabbix 2.2.16 (revision 64243).
  5. 23904:20170310:092458.634 using configuration file: /etc/zabbix_agentd.conf
  6. 23915:20170310:092458.636 agent #1 started [listener #1]
  7. 23918:20170310:092458.636 agent #3 started [listener #3]
  8. 23917:20170310:092458.636 agent #2 started [listener #2]
  9. 23914:20170310:092458.636 agent #0 started [collector]
  10. 23919:20170310:092458.637 agent #4 started [active checks #1]
  11. 23919:20170310:092458.637 active check configuration update from [127.0.0.1:10051] started to fail (cannot connect to [[127.0.0.1]:10051]: [111] Connection refused)
  12. 23919:20170310:102358.983 active check configuration update from [127.0.0.1:10051] is working again
  13. 23919:20170310:102358.983 no active checks on server [127.0.0.1:10051]: host [Zabbix server] not monitored
  14. 23919:20170310:102559.020 no active checks on server [127.0.0.1:10051]: host [Zabbix server] not monitored
  15. 23919:20170310:102759.073 no active checks on server [127.0.0.1:10051]: host [Zabbix server] not monitored
  16. 23919:20170310:102959.109 no active checks on server [127.0.0.1:10051]: host [Zabbix server] not monitored
  17. 23904:20170310:103011.545 Got signal [signal:15(SIGTERM),sender_pid:26144,sender_uid:0,reason:0]. Exiting ...
  18. 23904:20170310:103011.547 Zabbix Agent stopped. Zabbix 2.2.16 (revision 64243).
  19. 26157:20170310:103011.659 Starting Zabbix Agent [Zabbix server]. Zabbix 2.2.16 (revision 64243).
  20. 26157:20170310:103011.659 using configuration file: /etc/zabbix_agentd.conf
  21. 26168:20170310:103011.663 agent #1 started [listener #1]
  22. 26172:20170310:103011.663 agent #4 started [active checks #1]
  23. 26171:20170310:103011.663 agent #3 started [listener #3]
  24. 26170:20170310:103011.663 agent #2 started [listener #2]
  25. 26166:20170310:103011.664 agent #0 started [collector]
  26. 26172:20170310:103011.667 no active checks on server [127.0.0.1:10051]: host [Zabbix server] not monitored

通过查看日志,发现23919:20170310:092458.637 这条日志记录告诉我们说,主动从[127.0.0.1:10051]检查配置更新失败,agent与server之间的连接失败。

2.修改agent的配置文件,将ServerActive的地址改为zabbix-server的IP地址

  1. [root@iZbp11rfoyeescusr9ha9qZ tmp]# vim /etc/zabbix/zabbix_agentd.conf
  2. 122 ServerActive=121.43.161.35

3.重启zabbix-agent服务,使得配置生效

  1. [root@iZbp11rfoyeescusr9ha9qZ tmp]# /etc/init.d/zabbix-agentd restart
  2. Shutting down Zabbix agent: [ OK ]
  3. Starting Zabbix agent: [ OK ]

4.浏览器刷新页面,发现server端已经重新监控到agent运行状况的数据了

Tips:

  1. 在troubleshouting查看服务日志的时候,可以将注意力集中在有显示“fail”或者“Error”这类失败的关键词上,这样可以快速排错,找到问题的原因,而不必通篇阅读所有的日志,极大的提高效率。
  2. 作为运维工程师,脑袋储存的信息可能比较多、杂,时而出现忘记了某个服务、配置文件的绝对路径,如果记得文件或者目录的完整名,可以使用“locate+文件名”命令来定位文件的绝对路径,若是连文件名也记不大清了,没关系,还可以用Linux平台强大的搜索命令find,以全局查找的方式,通过星号来匹配到想要查找的文件的绝对路径,例如:find / -name *agentd.conf (从/目录开始,全局搜索以agentd结尾的.conf文件)。这些都是作为一名运维工程师应该具备的基本技能,而不必通过死记硬背的方式来记忆所有文件的绝对路径。

本文参与腾讯云自媒体分享计划,欢迎正在阅读的你也加入,一起分享。

发表于

我来说两句

0 条评论
登录 后参与评论

相关文章

来自专栏FreeBuf

警惕新型勒索病毒来袭,勒索提示信息使用德语!

近日国外某独立安全研究员(专门从事恶意样本分析工作),发现了一款新型的勒索病毒,这款勒索病毒使用了高强度代码混淆手段,会修改桌面背景,这种手法与之前的GandC...

8220
来自专栏蚂蚁开源社区

前端常见技术点 - CSS / DOM / 布局(43问)

这里总结一下 WEB 前端面试 CSS 部分的常见问题,同时这些问题也是对一些基础的技术概念和思想的理解。对这些基本知识的掌握程度和深度决定了你的技术层级。高级...

11730
来自专栏迈向前端工程师

企业面试题: DOCTYPE 在HTML5中如何使用

<!DOCTYPE>是关于页面写入了什么版本的HTML的指令。<!DOCTYPE>标记没有结束标记,它不区分大小写。

10330
来自专栏迈向前端工程师

- 企业面试题: CSS中 link 和@import 的区别是?

(2) 页面被加载的时,link会同时被加载,而@import引用的CSS会等到页面被加载完再加载;

9010
来自专栏前端小叙

webpack打包配置禁止html标签全部转为小写

用webpack打包页面,发现html中特别写的用来给后端识别的大写标签全部被转为了小写标签,这时候需要将加一个配置 ,caseSensitive:true ,...

9520
来自专栏编程创造城市

python中类的多继承

类似于c++中某个类,一次可以继承多个父类,所有被继承的这些父类的方法和属性都将可以被子类使用。

13830
来自专栏木溪知识加油站

从Eclipse项目迁徙至AndroidStudio

安卓已经烂大街多年了,开发工具也从Eclipse一路火花带闪电的到了Android Studio。都说用过AS你就回不去以往Eclipse的纯真年代了,事实证明...

8820
来自专栏编程创造城市

python中利用API文档开发与学习

实际上在早期的linux类型的系统中早就自带Python这个编译器,我们可以直接使用,但是这些编译器大多是2.x版本的。

10720
来自专栏蚂蚁开源社区

前端常见技术点-HTML扫盲(17问)

根据 <!DOCTYPE> 是否存在选择呈现模式,被称为 <!DOCTYPE> 切换或 <!DOCTYPE> 侦测。

12020
来自专栏玩转JavaEE

Spring Boot 修改静态资源一定要重启项目才会生效吗?未必!

Spring Boot 中的热部署相信大家都用过吧,只需要添加 spring-boot-devtools 依赖就可以轻松实现热部署。Spring Boot 中热...

13420

扫码关注云+社区

领取腾讯云代金券

年度创作总结 领取年终奖励