diff --git a/clusterspecifics/alerts/alert_backup_minio.yaml b/clusterspecifics/alerts/alert_backup_minio.yaml new file mode 100644 index 0000000..6a9bd72 --- /dev/null +++ b/clusterspecifics/alerts/alert_backup_minio.yaml @@ -0,0 +1,20 @@ +apiVersion: monitoring.coreos.com/v1 +kind: PrometheusRule +metadata: + labels: + prometheus: kube-prometheus-stack-prometheus # dieser name ist fest + role: alert-rules # auch fest + release: kube-prometheus-stack # IMPORTANT: ohne das Label wird die Rule vom PrometheusOperator nicht gefunden + name: backup-minio + namespace: monitoring # Rule im namespace anlegen in dem die zu ueberwachende App laeuft +spec: + groups: + - name: "backup-minio-nsodev.rules" # ".rules" muss unbedingt im Namen enthalten sein!! + rules: + - alert: backup_minio_nsodev_successful + for: 1m + labels: + severity: warning # Sollte dazu geschrieben werden um Alerts Sauber zwischen Teams zu trennen + expr: nightly_backup_successful{stage="nsodev"} > 0 # hier kommt die eigentliche Alert expression rein + annotations: + message: Nightly Backup of Minio NSODEV Bucket failed \ No newline at end of file diff --git a/clusterspecifics/alerts/kustomization.yaml b/clusterspecifics/alerts/kustomization.yaml index ca207fe..e8033d3 100644 --- a/clusterspecifics/alerts/kustomization.yaml +++ b/clusterspecifics/alerts/kustomization.yaml @@ -1,2 +1,3 @@ resources: -- alert_hetzner_api_requestlimit.yaml \ No newline at end of file +- alert_hetzner_api_requestlimit.yaml +- alert_backup_minio.yaml \ No newline at end of file