Der Senior SRE sorgt für die Zuverlässigkeit, Leistung und Skalierbarkeit von unternehmenskritischen Systemen. Sie kombinieren Software-Engineering und Betriebswissen, um die Beobachtbarkeit zu verbessern, den Betrieb zu automatisieren und Ausfallzeiten zu reduzieren.
Aufbau und Pflege von Überwachungs-, Alarmierungs- und Beobachtungssystemen
Verbessern Sie die Systemzuverlässigkeit durch Automatisierung und Leistungsoptimierung
Reaktion auf Vorfälle, Ursachenanalyse und Post-Mortems
Arbeiten Sie mit den Teams für Plattform, Automatisierung und Sicherheit zusammen.
Entwickeln Sie Tools, um die manuelle Arbeit zu reduzieren
Sicherstellen, dass SLAs, SLOs und SLIs definiert und erfüllt werden
Starker SRE- oder DevOps-Hintergrund in Cloud-Umgebungen
Erfahrung mit Überwachungstools (Prometheus, Grafana, Azure Monitor, etc.)
Kenntnisse in Skripting und Automatisierung
Ausgeprägtes Verständnis von verteilten Systemen und Zuverlässigkeitstechnik
Niederländischsprachig
Hybrid: 1-2 Tage pro Woche in Amstelveen