Academy Training

Observability Training

Grundlagen, Tools und Best Practices für Kubernetes & Cloud

2 Tage
Remote
Remote

Herausforderungen

Moderne IT-Systeme basieren zunehmend auf Cloud-nativen Architekturen, Microservices und Kubernetes. Diese verteilten, hochdynamischen Umgebungen stellen neue Anforderungen an Betrieb, Stabilität und Fehlersuche. Klassisches Monitoring stößt hier schnell an seine Grenzen, da es oft nur Symptome sichtbar macht, nicht jedoch die Ursachen komplexer Probleme.

Observability ermöglicht ein tiefgehendes Verständnis des Systemverhaltens – setzt jedoch fundiertes Wissen über Konzepte, Architekturen, Tools und Best Practices voraus. Viele Teams stehen vor der Herausforderung, Observability nicht nur technisch einzuführen, sondern sie sinnvoll, skalierbar und anwenderorientiert in ihren Betrieb zu integrieren. Dieses Training adressiert genau diese Lücke und schafft eine belastbare Grundlage für den professionellen Einsatz moderner Observability-Lösungen.

Ziel

Ziel des Trainings ist es, den Teilnehmer:innen die Grundlagen moderner Observability zu vermitteln und sie zu befähigen, Observability-Konzepte mit bewährten Mustern und Tools effektiv im Betrieb einzusetzen.

Die Teilnehmer:innen verstehen:

  • was Observability ist und warum sie für moderne Systeme essentiell ist,
  • wie Metriken, Logs und Traces zusammenspielen,
  • wie Observability-Tools genutzt werden, um Performance zu optimieren, Fehler proaktiv zu erkennen und die Benutzererfahrung nachhaltig zu verbessern.

Nach dem Training sind die Teilnehmer:innen in der Lage, Observability-Daten zu interpretieren und gezielt für Betrieb, Troubleshooting und Weiterentwicklung ihrer Systeme zu nutzen.

Zielgruppe

Inhalt

Dieses 2-tägige Training legt die theoretische und praktische Basis für moderne Observability-Konzepte. Der Fokus liegt auf den drei Säulen der Observability – Metriken, Logs und Traces – sowie auf deren Integration in eine ganzheitliche Observability-Architektur.

Neben der Vermittlung von Konzepten und Best Practices steht die Anwendersicht im Mittelpunkt:
Wie werden Observability-Tools im Alltag genutzt? Welche Anforderungen haben Betriebsteams an Dashboards, Alarme und Analysefunktionen? Und wie unterstützen Observability-Daten bei Fehlerbehebung und Performance-Optimierung?

Die Trainingsinhalte werden in thematische Sektionen gegliedert. Jede Sektion kombiniert einen interaktiven Theorieteil mit einer anschließenden Lab- & Exercise-Einheit, in der die Teilnehmer:innen das Gelernte eigenständig anwenden.

Themenschwerpunkte:

  • Einführung in moderne Observability – Konzepte, Patterns und Abgrenzung
  • Unterschiede zwischen Monitoring, Observability und Logging
  • Die drei Säulen der Observability: Metriken, Traces und Logs
  • Moderne Observability-Architekturen und End-to-End-Ansätze
  • Überblick und Einsatz relevanter Tools (z. B. Prometheus, Grafana, Kibana, Loki, OpenTelemetry, Jaeger)
  • Best Practices für SLOs, Fehlererkennung und Performance-Optimierung
  • Observability als Teil des DevOps- und CI/CD-Lebenszyklus
  • Observability in Kubernetes- und Cloud-nativen Umgebungen
  • Anwendersicht: Nutzung von Observability für Betrieb und Zusammenarbeit
  • Troubleshooting und Skalierung von Observability-Systemen

Aufbau / Agenda

Tag 1: Grundlagen, Konzepte und Architekturen

  • Einführung in Observability: Motivation, Nutzen und Anwendungsfälle
  • Monitoring vs. Observability vs. Logging
  • Die drei Säulen der Observability
  • Distributed Tracing: Konzepte und Einsatz
  • Metriken und Logs als zentrale Analyseinstrumente
  • End-to-End-Observability-Architekturen
  • Praktische Übungen: Analyse von Logs, Metriken und Traces

Tag 2: Tools, Betrieb und Praxis

  • Überblick über Observability-Tools und deren Zusammenspiel
    • Prometheus, Grafana, Kibana, Loki
    • OpenTelemetry und Jaeger
  • Best Practices für Observability im DevOps-Umfeld
  • Observability in Kubernetes- und Cloud-Umgebungen
  • Nutzung von Dashboards und KPIs zur proaktiven Überwachung
  • Troubleshooting und Performance-Optimierung mit Observability-Daten
  • Praktische Übungen:
    • Erstellen und Anpassen von Dashboards
    • Log-Analyse und Fehleridentifikation
    • Distributed Tracing und Performance-Analyse
    • Skalierung von Observability-Lösungen

Organisatorische Infos

Dauer: 2 Tage (ist erweiterbar auf 3 Tage für ein Deep Dive)

Ort: wahlweise vor Ort / Remote

Sprache: wahlweise Deutsch/Englisch

Teilnehmeranzahl: min. 5 - max. 10

Voraussetzungen:

  • Sicherer Umgang mit Git, YAML, Bash und Docker
  • Grundkenntnisse Cloud-native Entwicklung
  • Idealerweise praktische Erfahrung mit Kubernetes

Technische Anforderungen:

  • Notebook mit Internetverbindung
  • Aktueller Webbrowser
Was andere sagen

Stimmen unserer Teilnehmer

No items found.

Unsere Trainer

Kevin Schu
Kevin Schu ist Director für Cloud & DevOps Consulting und Spezialist für die Automatisierung von IT-Prozessen und Cloud-Architekturen. Er unterstützt Unternehmen bei der Entwicklung und Skalierung von CI/CD-Pipelines sowie bei der Integration von KI-Workloads wie ChatGPT zur Optimierung komplexer Kommunikationsprozesse. Mit Erfahrung in Docker, Kubernetes und Multi-Cloud-Strategien auf AWS, Azure und Google Cloud legt er Wert auf Effizienz, Flexibilität und Sicherheit in modernen IT-Infrastrukturen.

Unsere Academy Ansprechpartnerin

Jetzt unverbindliches Beratungsgespräch vereinbaren

Cordula Kartheininger

Cordula Kartheininger

HR & AOE Academy Strategy Lead