为什么从集群维度上看集群 TPS 没有达到阈值,但是集群维度监控的限流次数指标却不为0?
目前限流是以秒维度进行限流的,但目前 TPS avg 统计方式显示的是分钟维度的 TPS 平均值,当用户的集群毛刺较多时,就会出现当前分钟 TPS 没达到阈值,但是这分钟的某一秒达到了阈值被限流,详情可以参考限流机制说明。查看秒维度的 TPS 指标,需要将指标的 avg 统计方式修改为 max 统计方式。如果只是偶发限流,可以在客户端调大生产超时时间,如果频繁出现限流,建议用户评估当前集群是否需要升配。

除此之外,由于默认集群规格的 TPS 是生产和消费各占比 50%,假设当前集群规格 1000,则生产和消费默认的 TPS 上限都是 500,如果用户的场景生产和消费比例不同,需要在控制台进行修改生产消费的 TPS 占比。
当前控制台 Topic 各项监控指标,需要点击某个 Topic 对应的监控按钮,才能进行展示。要如何比较多个 Topic 的相同指标监控?
目前 TDMQ Pulsar 版控制台不支持同时比较多个 Topic 的相关监控数据。但是由于 TDMQ Pulsar 版监控是依赖腾讯云可观测平台实现,因此可以复用可观测平台的 Dashboard 相关能力。可参考 Dashboard 相关文档。

如何导出当前集群的监控指标数据?
当前 TDMQ Pulsar 版控制台暂时无法导出监控数据,可以通过可观测性平台的 Dashboard 功能实现,在引入相关指标后,导出 CSV 格式 的监控指标。可参考 Dashboard 相关文档。
