Aufgabenspektrum
- Du verantwortest den stabilen Betrieb und die Weiterentwicklung von APIs, Kubernetes-Umgebungen (K8s) sowie zugehörigen Tools.
- Du führst Installationen, Updates und Patchings von APIs, K8s und Tools durch – inklusive Rollouts in neue Regionen.
- Du überwachst kontinuierlich die Infrastruktur (Health Monitoring) und kümmerst Dich um Kapazitätsmanagement.
- Du bearbeitest Service Requests und stellst den reibungslosen Betrieb der Plattform sicher.
- Du arbeitest aktiv in Slack-Workflows und sorgst für eine strukturierte Kommunikation im Betrieb.
- Du priorisierst, steuerst, trackst und löst Incidents entlang definierter Prozesse.
- Du unterstützt bei Troubleshooting und der schnellen Behebung von Störungen.
- Du informierst Kunden proaktiv über Incidents und übernimmst Eskalationen – auch in Zusammenarbeit mit externen Vendoren.
- Du eskalierst technische Themen gezielt an fortgeschrittene interne Support- und Entwicklungsteams.
- Du unterstützt die nachhaltige Wiederherstellung und Stabilisierung von Services.
- Du bearbeitest und dokumentierst Problem Records (PRs).
- Du führst Root Cause Analysen durch – bei Bedarf gemeinsam mit internen Teams oder externen Partnern.
- Du erstellst und pflegst Betriebsdokumentationen, SOPs und operative Playbooks.
- Du erstellst Jira-Tickets oder Git-Issues für Entwicklungsteams, wenn Defects identifiziert werden.
- Du arbeitest kontinuierlich an der Verbesserung von Betriebsprozessen und der Aktualisierung von Dokumentationen.






