From 4fae252977d9042270d31025cebf6e7654fd06db Mon Sep 17 00:00:00 2001 From: Hoan To Date: Mon, 24 Jul 2023 16:35:07 +0200 Subject: [PATCH] DEV-891 added alert for minio cluster down --- templates/alerts/minio_health_alert.yaml | 20 ++++++++++++++++++++ values_cusprod.yaml | 2 ++ values_cusqa.yaml | 2 ++ values_nsodev.yaml | 2 ++ 4 files changed, 26 insertions(+) create mode 100644 templates/alerts/minio_health_alert.yaml diff --git a/templates/alerts/minio_health_alert.yaml b/templates/alerts/minio_health_alert.yaml new file mode 100644 index 0000000..77dd4c0 --- /dev/null +++ b/templates/alerts/minio_health_alert.yaml @@ -0,0 +1,20 @@ +apiVersion: monitoring.coreos.com/v1 +kind: PrometheusRule +metadata: + labels: + prometheus: kube-prometheus-stack-prometheus # dieser name ist fest + role: alert-rules # auch fest + release: kube-prometheus-stack # IMPORTANT: ohne das Label wird die Rule vom PrometheusOperator nicht gefunden + name: minio-tenant-health-alert + namespace: mobene-{{ .Values.stage }} # Rule im namespace anlegen in dem die zu ueberwachende App laeuft +spec: + groups: + - name: "minio-tenant-health-alert.rules" # ".rules" muss unbedingt im Namen enthalten sein!! + rules: + - alert: {{ .Values.stage }}-minio-tenant-health + for: 1m + labels: + severity: critical # Sollte dazu geschrieben werden um Alerts Sauber zwischen Teams zu trennen + expr: minio_cluster_nodes_online_total{namespace="mobene-{{ .Values.stage }}"} < 4 # hier kommt die eigentliche Alert expression rein + annotations: + message: minio cluster for {{ .Values.stage }} is down \ No newline at end of file diff --git a/values_cusprod.yaml b/values_cusprod.yaml index 39c12d6..de5d8a5 100644 --- a/values_cusprod.yaml +++ b/values_cusprod.yaml @@ -1,3 +1,5 @@ +stage: cusprod + domainMonitoring: enabled: true domains: diff --git a/values_cusqa.yaml b/values_cusqa.yaml index f408f42..3aee666 100644 --- a/values_cusqa.yaml +++ b/values_cusqa.yaml @@ -1,3 +1,5 @@ +stage: cusqa + # minio tenant tenant: tenant: diff --git a/values_nsodev.yaml b/values_nsodev.yaml index 4718a49..eeb22af 100644 --- a/values_nsodev.yaml +++ b/values_nsodev.yaml @@ -1,3 +1,5 @@ +stage: nsodev + # minio tenant tenant: tenant: