我已经按照文档度量部分中的说明设置了PrometheusPushGatewayReporter。
我可以看到来自flink作业管理器和推送网关UI中暴露的任务管理器的指标,以及它们被Prometheus集群正确抓取。
问题是,即使我已经显式设置了deleteOnJobShutdown配置选项,当通过flink cli工具取消作业时,只有作业管理器的指标会被删除。
有没有办法也删除陈旧的任务管理器指标?我的配置如下:
metrics.reporter.promgateway.class: org.apache.flink.metrics.prometheus.PrometheusPushGatewayReporter
metrics.reporter.promgateway.host: $PUSH_GATEWAY_HOST
metrics.reporter.promgateway.port: 80
metrics.reporter.promgateway.jobName: foo
metrics.reporter.promgateway.randomJobNameSuffix: true
metrics.reporter.promgateway.deleteOnShutdown: true
metrics.reporter.promgateway.interval: 60 SECONDS我在Hadoop 2.6.0上使用Flink 1.7.1
发布于 2019-08-21 10:24:25
。
在我们的产品环境中,我们也遇到了同样的问题。如果pushgateway能够实现TTL for pushed metrics1,那将非常有用。但目前,我们使用外部调度系统来检查flink作业是否处于活动状态,然后通过推送网关的rest api2删除指标。
https://stackoverflow.com/questions/54420498
复制相似问题