DEV-891 added alert for minio cluster down

MOB-755
Hoan To 2 years ago
parent 6eca292a79
commit 4fae252977

@ -0,0 +1,20 @@
apiVersion: monitoring.coreos.com/v1
kind: PrometheusRule
metadata:
labels:
prometheus: kube-prometheus-stack-prometheus # dieser name ist fest
role: alert-rules # auch fest
release: kube-prometheus-stack # IMPORTANT: ohne das Label wird die Rule vom PrometheusOperator nicht gefunden
name: minio-tenant-health-alert
namespace: mobene-{{ .Values.stage }} # Rule im namespace anlegen in dem die zu ueberwachende App laeuft
spec:
groups:
- name: "minio-tenant-health-alert.rules" # ".rules" muss unbedingt im Namen enthalten sein!!
rules:
- alert: {{ .Values.stage }}-minio-tenant-health
for: 1m
labels:
severity: critical # Sollte dazu geschrieben werden um Alerts Sauber zwischen Teams zu trennen
expr: minio_cluster_nodes_online_total{namespace="mobene-{{ .Values.stage }}"} < 4 # hier kommt die eigentliche Alert expression rein
annotations:
message: minio cluster for {{ .Values.stage }} is down

@ -1,3 +1,5 @@
stage: cusprod
domainMonitoring:
enabled: true
domains:

@ -1,3 +1,5 @@
stage: cusqa
# minio tenant
tenant:
tenant:

@ -1,3 +1,5 @@
stage: nsodev
# minio tenant
tenant:
tenant:

Loading…
Cancel
Save