在负载下运行任何类型的服务器时,有一些资源需要监视以确保服务器运行正常。在负载下测试系统时尤其如此。
这方面的一些示例是CPU利用率,内存使用率以及可能的磁盘空间。我应该监控哪些其他资源,以及可以使用哪些工具?
发布于 2018-09-30 08:17:19
我在生产中广泛使用Zabbix,它带有一堆有用的默认值。我们已将其配置为要监控的各种事物的一些示例:
你可以使用Zabbix监控任何东西,你也可以附加触发器 - 这样它就可以重启失败的服务; 或打电话给你提醒问题。
在性能成为问题之前,立即收集数据。当它发生时,你会对历史基线感到高兴,事实上你将能够显示当你需要追捕并严厉惩罚哪个开发者做出了不好的改变时,会发生什么样的日期和时间问题:)
发布于 2018-09-30 09:56:53
尽可能多的人,然后可以绘制/理解/查看结果。监控资源不仅可用于容量规划,还可用于异常检测,异常检测可显着帮助您检测安全事件。
你的基本图表有一个不错的开始。我还想监视线程数,连接数,网络I / O,磁盘I / O,页面错误(可以说这与内存使用有关),上下文切换。
我非常喜欢munin用于绘制与主机相关的内容。
https://stackoverflow.com/questions/-100000819
复制相似问题