监控告警概述

最近更新时间:2019-04-18 14:53:27

概述

良好的监控环境为腾讯云容器服务高可靠性、高可用性和高性能提供重要保证。您可以方便为不同资源收集不同维度的监控数据,能方便掌握资源的使用状况,轻松定位故障。
腾讯云容器服务提供集群、节点、工作负载、Pod、Container 5个层面的监控数据收集和展示功能。
收集监控数据有助于您建立容器集群性能的正常标准。通过在不同时间、不同负载条件下测量容集群的性能并收集历史监控数据,您可以较为清楚的了解容器集群和服务运行时的正常性能,并能快速根据当前监控数据判断服务运行时是否处于异常状态,及时找出解决问题的方法。例如,您可以监控服务的 CPU 利用率、内存使用率和磁盘 I/O。

监控

容器服务的监控功能使用指引请参见 查看监控数据
目前覆盖的监控指标请参见 监控及告警指标列表

告警

为了方便您及时发现容器服务的异常状况,以保证您业务的稳定性和可靠性。建议您为所有生产集群配置必要告警,告警配置指引请参见 设置告警
目前覆盖的告警指标请参见 监控及告警指标列表

注意:

容器服务提供的监控和告警功能主要覆盖 Kubernetes 对象的核心指标或事件,请结合 云监控 提供的基础资源监控(如云服务器、块存储、负载均衡等)使用,以保证更细的指标覆盖。