diff --git a/templates/alerts/minio_health_alert.yaml b/templates/alerts/minio_health_alert.yaml new file mode 100644 index 0000000..77dd4c0 --- /dev/null +++ b/templates/alerts/minio_health_alert.yaml @@ -0,0 +1,20 @@ +apiVersion: monitoring.coreos.com/v1 +kind: PrometheusRule +metadata: + labels: + prometheus: kube-prometheus-stack-prometheus # dieser name ist fest + role: alert-rules # auch fest + release: kube-prometheus-stack # IMPORTANT: ohne das Label wird die Rule vom PrometheusOperator nicht gefunden + name: minio-tenant-health-alert + namespace: mobene-{{ .Values.stage }} # Rule im namespace anlegen in dem die zu ueberwachende App laeuft +spec: + groups: + - name: "minio-tenant-health-alert.rules" # ".rules" muss unbedingt im Namen enthalten sein!! + rules: + - alert: {{ .Values.stage }}-minio-tenant-health + for: 1m + labels: + severity: critical # Sollte dazu geschrieben werden um Alerts Sauber zwischen Teams zu trennen + expr: minio_cluster_nodes_online_total{namespace="mobene-{{ .Values.stage }}"} < 4 # hier kommt die eigentliche Alert expression rein + annotations: + message: minio cluster for {{ .Values.stage }} is down \ No newline at end of file diff --git a/values_cusprod.yaml b/values_cusprod.yaml index 39c12d6..de5d8a5 100644 --- a/values_cusprod.yaml +++ b/values_cusprod.yaml @@ -1,3 +1,5 @@ +stage: cusprod + domainMonitoring: enabled: true domains: diff --git a/values_cusqa.yaml b/values_cusqa.yaml index f408f42..3aee666 100644 --- a/values_cusqa.yaml +++ b/values_cusqa.yaml @@ -1,3 +1,5 @@ +stage: cusqa + # minio tenant tenant: tenant: diff --git a/values_nsodev.yaml b/values_nsodev.yaml index 4718a49..eeb22af 100644 --- a/values_nsodev.yaml +++ b/values_nsodev.yaml @@ -1,3 +1,5 @@ +stage: nsodev + # minio tenant tenant: tenant: