Observability Training: Grundlagen, Tools und Best Practices für Kubernetes & Cloud | Academy

Herausforderungen

Moderne IT-Systeme basieren zunehmend auf Cloud-nativen Architekturen, Microservices und Kubernetes. Diese verteilten, hochdynamischen Umgebungen stellen neue Anforderungen an Betrieb, Stabilität und Fehlersuche. Klassisches Monitoring stößt hier schnell an seine Grenzen, da es oft nur Symptome sichtbar macht, nicht jedoch die Ursachen komplexer Probleme.

Observability ermöglicht ein tiefgehendes Verständnis des Systemverhaltens – setzt jedoch fundiertes Wissen über Konzepte, Architekturen, Tools und Best Practices voraus. Viele Teams stehen vor der Herausforderung, Observability nicht nur technisch einzuführen, sondern sie sinnvoll, skalierbar und anwenderorientiert in ihren Betrieb zu integrieren. Dieses Training adressiert genau diese Lücke und schafft eine belastbare Grundlage für den professionellen Einsatz moderner Observability-Lösungen.

Ziel

Ziel des Trainings ist es, den Teilnehmer:innen die Grundlagen moderner Observability zu vermitteln und sie zu befähigen, Observability-Konzepte mit bewährten Mustern und Tools effektiv im Betrieb einzusetzen.

Die Teilnehmer:innen verstehen:

was Observability ist und warum sie für moderne Systeme essentiell ist,
wie Metriken, Logs und Traces zusammenspielen,
wie Observability-Tools genutzt werden, um Performance zu optimieren, Fehler proaktiv zu erkennen und die Benutzererfahrung nachhaltig zu verbessern.

Nach dem Training sind die Teilnehmer:innen in der Lage, Observability-Daten zu interpretieren und gezielt für Betrieb, Troubleshooting und Weiterentwicklung ihrer Systeme zu nutzen.

Zielgruppe

Inhalt

Dieses 2-tägige Training legt die theoretische und praktische Basis für moderne Observability-Konzepte. Der Fokus liegt auf den drei Säulen der Observability – Metriken, Logs und Traces – sowie auf deren Integration in eine ganzheitliche Observability-Architektur.

Neben der Vermittlung von Konzepten und Best Practices steht die Anwendersicht im Mittelpunkt:
Wie werden Observability-Tools im Alltag genutzt? Welche Anforderungen haben Betriebsteams an Dashboards, Alarme und Analysefunktionen? Und wie unterstützen Observability-Daten bei Fehlerbehebung und Performance-Optimierung?

Die Trainingsinhalte werden in thematische Sektionen gegliedert. Jede Sektion kombiniert einen interaktiven Theorieteil mit einer anschließenden Lab- & Exercise-Einheit, in der die Teilnehmer:innen das Gelernte eigenständig anwenden.

Themenschwerpunkte:

Einführung in moderne Observability – Konzepte, Patterns und Abgrenzung
Unterschiede zwischen Monitoring, Observability und Logging
Die drei Säulen der Observability: Metriken, Traces und Logs
Moderne Observability-Architekturen und End-to-End-Ansätze
Überblick und Einsatz relevanter Tools (z. B. Prometheus, Grafana, Kibana, Loki, OpenTelemetry, Jaeger)
Best Practices für SLOs, Fehlererkennung und Performance-Optimierung
Observability als Teil des DevOps- und CI/CD-Lebenszyklus
Observability in Kubernetes- und Cloud-nativen Umgebungen
Anwendersicht: Nutzung von Observability für Betrieb und Zusammenarbeit
Troubleshooting und Skalierung von Observability-Systemen

Aufbau / Agenda

‍

Tag 1: Grundlagen, Konzepte und Architekturen

Einführung in Observability: Motivation, Nutzen und Anwendungsfälle
Monitoring vs. Observability vs. Logging
Die drei Säulen der Observability
Distributed Tracing: Konzepte und Einsatz
Metriken und Logs als zentrale Analyseinstrumente
End-to-End-Observability-Architekturen
Praktische Übungen: Analyse von Logs, Metriken und Traces

Tag 2: Tools, Betrieb und Praxis

Überblick über Observability-Tools und deren Zusammenspiel
- Prometheus, Grafana, Kibana, Loki
- OpenTelemetry und Jaeger
Best Practices für Observability im DevOps-Umfeld
Observability in Kubernetes- und Cloud-Umgebungen
Nutzung von Dashboards und KPIs zur proaktiven Überwachung
Troubleshooting und Performance-Optimierung mit Observability-Daten
Praktische Übungen:
- Erstellen und Anpassen von Dashboards
- Log-Analyse und Fehleridentifikation
- Distributed Tracing und Performance-Analyse
- Skalierung von Observability-Lösungen

Organisatorische Infos

Dauer: 2 Tage (ist erweiterbar auf 3 Tage für ein Deep Dive)

Ort: wahlweise vor Ort / Remote

Sprache: wahlweise Deutsch/Englisch

Teilnehmeranzahl: min. 5 - max. 10

Voraussetzungen:

Sicherer Umgang mit Git, YAML, Bash und Docker
Grundkenntnisse Cloud-native Entwicklung
Idealerweise praktische Erfahrung mit Kubernetes

Technische Anforderungen:

Notebook mit Internetverbindung
Aktueller Webbrowser

Was andere sagen

Stimmen unserer Teilnehmer

No items found.

Unsere Trainer

Kevin Schu ist Director für Cloud & DevOps Consulting und Spezialist für die Automatisierung von IT-Prozessen und Cloud-Architekturen. Er unterstützt Unternehmen bei der Entwicklung und Skalierung von CI/CD-Pipelines sowie bei der Integration von KI-Workloads wie ChatGPT zur Optimierung komplexer Kommunikationsprozesse. Mit Erfahrung in Docker, Kubernetes und Multi-Cloud-Strategien auf AWS, Azure und Google Cloud legt er Wert auf Effizienz, Flexibilität und Sicherheit in modernen IT-Infrastrukturen.

Linus ist erfahrener DevOps‑ und Cloud‑Engineer mit Fokus auf moderne Softwarelieferprozesse und kollaborative Entwicklungs‑Workflows. In seiner Rolle als Consultant bei AOE unterstützt er Teams dabei, effiziente CI/CD‑Pipelines aufzubauen, Cloud‑Infrastrukturen zu orchestrieren und Entwicklungsprozesse skalierbar sowie wartbar zu gestalten. Als Trainer vermittelt Linus sein praxisorientiertes Wissen verständlich und hilft Teilnehmenden, Best‑Practices direkt im Arbeitsalltag anzuwenden – von Versionskontrolle über automatisierte Builds bis hin zur Integration in moderne DevOps‑Toolchains.

Martin Dubb ist erfahrener DevOps- und Cloud-Engineer mit Schwerpunkt auf Automatisierung, Optimierung und Sicherung von Cloud-Infrastrukturen. Er unterstützt Teams beim Aufbau skalierbarer CI/CD-Pipelines, der Implementierung moderner Cloud-Architekturen und der Einführung effizienter DevOps-Prozesse. Als Trainer vermittelt Martin sein praxisnahes Wissen, sodass Teilnehmende Best Practices direkt verstehen und in Projekten anwenden können – von Infrastructure as Code über Kubernetes, Terraform und Ansible bis hin zu Observability und Cloud Security.

Unsere Academy Ansprechpartnerin

Jetzt unverbindliches Beratungsgespräch vereinbaren

Cordula Kartheininger

HR & AOE Academy Strategy Lead

Observability Training