我正在尝试让Prometheus发现的警报使用警报管理器在slack中得到通知。
这是alert.rules文件,运行良好。
groups:
- name: Instances
rules:
# Alert for any instance that is unreachable for >5 minutes.
- alert: InstanceDown
expr: up == 0
for: 5m
labels:
severity: page
# Prometheus templates apply here in the anno
我需要帮助我的普罗米修斯头盔图表中的"if“语句。我正在尝试实现的是在EBS或NFS中具有持久卷的普罗米修斯图表。它适用于EBS,但不适用于NFS。我认为问题出在我的if语句逻辑上。 当我设置storageClass:"nfs“values.yaml时,我得到了错误: Error: release prometheus failed: PersistentVolume "prometheus-alertmanager" is invalid: spec: Required value: must specify a volume type 在我的values.
我想我可能对如何经营码头有一些误解。到目前为止,我有一个服务器和一个脚本来运行多个坞映像。
现在我想要一个单一的码头形象,其中包含所有这些,但我遇到了一些问题。
这是我的Dockerfile:
FROM prom/prometheus:latest AS prometheus
FROM bitnami/node-exporter:latest as node-exporter
FROM prom/pushgateway:latest AS pushgateway
FROM bitnami/alertmanager:latest AS alert-manager
WORKDIR /app
CO
为什么我在路由中使用接收器为空?注释掉与null相关的路由仍然会产生相同的错误。
知道怎么解决这个问题吗?配置看起来正确吗?它昨天确实起作用了,但我删除了所有东西,并试图重新安装,我得到了这个错误。
failed: provision alertmanager configuration: base config from Secret could not be parsed: undefined receiver \"null\" used in route
另外,我如何为每个警报有单独的电子邮件?当它工作时,它通常发送一个摸索警报。我能不能只停用路由部分而只有接收器?会单独
我是k8s的新手,并试图为k8s设置prometheus监控。我用“头盔安装”来安装prometheus。现在:
两个豆荚仍处于待定状态:
prometheus服务器
普罗米修斯-警报管理器
我手动创建的持久卷,为这两个,谁能帮助我如何映射这些PV与PVC创建的头盔图表?
[centos@k8smaster1 ~]$ kubectl get pod -n monitoring
NAME READY STATUS RESTARTS AGE
prometh
我正在尝试配置Prometheus,根据,它包含在Gitlab图表中。
我的主要问题是如何配置Prometheus,因为下面的values.yaml似乎被忽略了:
global:
registry:
enabled: false
# Disabling minio still requires to disable gitlab.minio or it will complain about "A valid backups.objectStorage.config.secret is needed"
minio:
enabled: false
在Vagrant中安装了Rancher服务器和2个Rancher代理。然后从Rancher服务器切换到K8S环境。
在牧场器服务器主机上,安装了kubectl和helm。然后通过Helm安装Prometheus
helm install stable/prometheus
现在从Kubernetes仪表板查看状态,有2个pods挂起:
它注意到了PersistentVolumeClaim is not bound,那么K8S组件不是默认随Rancher服务器一起安装的吗?
(另一个名字,同样的问题)
编辑
> kubectl get pvc
NAME
我试图用argocd app delete Prometheus --cascade命令删除argo应用程序。
这是提示确认后,按下y,能够删除资源,但有些资源不是删除。
Are you sure you want to delete 'prometheus' and all its resources? [y/n]
如何确认某些资源未被删除?
kubectl get all -n prometheus
NAME READY AGE sta
我正在尝试jsonnet (我的自定义grafana a.jsonnet)来实现grafana dashboard.I,我尝试了下面的代码。
local grafana = import 'grafonnet/grafana.libsonnet';
local dashboard = grafana.dashboard;
local row = grafana.row;
local prometheus = grafana.prometheus;
local template = grafana.template;
local graphPanel = grafana.grap