引擎运行监控

最近更新时间:2025-06-04 11:46:02

我的收藏

操作场景

北极星对运行的实例、接口提供了多项监控指标,用以监测北极星网格节点及服务的运行情况,例如:请求失败总数、请求延迟等请求指标,CPU、内存、网络等系统指标。您可以根据这些指标实时了解北极星网格的运行状况,针对可能存在的风险及时处理,保障系统的稳定运行。本文为您介绍通过 TSF 控制台查看北极星监控数据的操作方法。

监控指标及含义

注册配置指标

指标分类
指标名
指标含义
注册中心
总服务数
注册中心内所有已完成注册的服务总量,包含在线、离线、异常等全状态服务

在线服务数
当前至少存在1个健康实例的服务数量,可正常接收请求

离线服务数
在线服务实例为0的服务数量

异常服务数
存在服务实例但无健康节点的服务数量

总服务实例数
所有服务实例的全局计数,包含健康、异常、隔离、未隔离状态

在线服务实例数
通过健康检查且可响应请求的实例数量

异常服务实例数
连续心跳超时或主动标记为不可用的实例数量

隔离服务实例数
因熔断策略或人工操作暂停流量转发的实例数量
配置中心
配置文件总数
配置文件数量

配置分组总数
配置分组数量

已发布配置文件总数
已推送至客户端的配置文件数量

请求指标

指标分类
指标名
指标含义
请求数
请求失败数(次)
注册中心集群内各节点/接口的请求失败数。
请求数(次)
注册中心集群内各节点/接口的请求次数。
请求成功数(次)
注册中心集群内各节点/接口的请求成功数。
请求失败细分
网络失败数(次)
注册中心集群内各节点/接口的网络失败数。
其他失败数(次)
注册中心集群内各节点/接口的其他失败数。
系统失败数(次)
注册中心集群内各节点/接口的系统失败数。
请求延时
请求平均延时(ms)
注册中心集群内各节点/接口的请求平均延时。
最大请求延迟(ms)
注册中心集群内各节点/接口的最大请求延迟。
请求最小延时(ms)
注册中心集群内各节点/接口的请求最小延时。

系统指标

指标名
指标含义
CPU使用率(%)
注册中心集群内各节点的 CPU 使用率。
内存使用率(%)
注册中心集群内各节点的内存使用率。
网络入包量(个/s)
注册中心集群内各节点的网络入包量。
网络入流量(MBytes)
注册中心集群内各节点的网络入流量。
网络出包量(个/s)
注册中心集群内各节点的网络出包量。
网络出流量(MBytes)
注册中心集群内各节点的网络出流量。
磁盘读取次数(次)
注册中心集群内各节点的磁盘读取次数。
磁盘读取带宽(MBps)
注册中心集群内各节点的磁盘读取带宽。
磁盘写入次数(次)
注册中心集群内各节点的磁盘写入次数。
磁盘写入带宽(MBps)
注册中心集群内各节点的磁盘写入带宽。

查看监控入口

1. 登录 TSF 控制台,在左侧导航栏选择 Polaris(北极星)进入引擎实例列表页。
2. 在引擎实例列表页,单击目标引擎的“ID”,进入基本信息页面。
3. 在左边页签单击引擎运行监控,可查看业务指标和系统指标。
注册配置指标
系统指标
系统指标
运行日志
选择好指标节点命名空间,设置好时间范围(支持近1小时、近12小时、近1天、近30天和自定义),可查看对应的监控数据。

图标
说明



单击可查看监控指标同环比。



单击可刷新获取最新的监控数据。



单击可将图表复制到 Dashboard,关于 Dashboard 请参见 什么是 Dashboard



勾选后可在图表上显示图例信息。



跳转至 腾讯云可观测平台控制台 配置告警策略。
选择好指标节点接口,设置好时间范围(支持近1小时、近12小时、近1天、近30天和自定义),可查看对应的监控数据。


选择好时间范围(支持近1小时、近12小时、近1天、近3天和自定义)、指标节点后,查看相应的监控数据。

支持查看实时日志和CLS日志。
1. 实时日志
1.1 选择好节点后,可查看对应节点的运行日志。
1.2 在日志页面的搜索框,可以通过关键字查询相关日志。输入关键词查询,例如:“info”,注意日志检索区分大小写。

2. CLS日志
PolarisMesh 持久化日志、事件中心、操作记录、告警数据存储在CLS服务中,开启CLS日志服务后可查看。