DEV-891 added alert for minio cluster down
parent
ec7d3f1e5c
commit
7637872ee0
@ -0,0 +1,20 @@
|
|||||||
|
apiVersion: monitoring.coreos.com/v1
|
||||||
|
kind: PrometheusRule
|
||||||
|
metadata:
|
||||||
|
labels:
|
||||||
|
prometheus: kube-prometheus-stack-prometheus # dieser name ist fest
|
||||||
|
role: alert-rules # auch fest
|
||||||
|
release: kube-prometheus-stack # IMPORTANT: ohne das Label wird die Rule vom PrometheusOperator nicht gefunden
|
||||||
|
name: minio-tenant-health-alert
|
||||||
|
namespace: mobene-{{ .Values.stage }} # Rule im namespace anlegen in dem die zu ueberwachende App laeuft
|
||||||
|
spec:
|
||||||
|
groups:
|
||||||
|
- name: "minio-tenant-health-alert.rules" # ".rules" muss unbedingt im Namen enthalten sein!!
|
||||||
|
rules:
|
||||||
|
- alert: {{ .Values.stage }}-minio-tenant-health
|
||||||
|
for: 1m
|
||||||
|
labels:
|
||||||
|
severity: critical # Sollte dazu geschrieben werden um Alerts Sauber zwischen Teams zu trennen
|
||||||
|
expr: minio_cluster_nodes_online_total{namespace="mobene-{{ .Values.stage }}"} < 4 # hier kommt die eigentliche Alert expression rein
|
||||||
|
annotations:
|
||||||
|
message: minio cluster for {{ .Values.stage }} is down
|
||||||
Loading…
Reference in New Issue