settings
OTEX_BIG
Süddeutsche Zeitung Institut Auszeichnung
 Image
Alle ETL Schulungen

Schulung Debezium: Change Data Capture für Echtzeit-Datenintegration

Die Brücke zur Echtzeit: CDC-Strategien für moderne Datenplattformen

2 Tage / S6547
Neues Seminar
Per E-Mail senden

Schulungsformen

Inhouse-/Firmenschulung

  • 2 Tage - anpassbar
  • Termin nach Wunsch
  • In Ihrem Hause oder bei der GFU
  • Preis nach Angebot

  • Lernumgebung in der Cloud
  • Inhalte werden auf Wunsch an die Anforderungen Ihres Teams angepasst.
Präsenz Online Hybrid

Beschreibung

Dieses Fachseminar führt Sie tief in die Welt von Debezium ein, dem De-facto-Standard für Open-Source Change Data Capture (CDC) . Während klassische ETL-Prozesse Daten in Batches (z. B. nachts) kopieren, "lauscht" Debezium direkt an den Transaktionslogs Ihrer Datenbanken. Jede Änderung (Insert, Update, Delete) wird sofort als Ereignis in Kafka-Topics gestreamt. Sie lernen, wie Sie diese Technologie für Echtzeit-Analytics, die Synchronisation von Microservices und die Validierung von Caches nutzen, ohne die Last auf Ihren Quellsystemen spürbar zu erhöhen.
Unternehmen profitieren von drastisch reduzierten Latenzen in ihren Daten-Pipelines, einer Entlastung der Produktionsdatenbanken von schweren Analyse-Queries und der Fähigkeit, eine wirklich ereignisgesteuerte IT-Landschaft aufzubauen.

Entdecken Sie unsere weiteren ETL Seminare.

Schulungsziel

Die Teilnehmenden erlernen die Installation und Konfiguration von Debezium-Connectoren für verschiedene Datenbanksysteme. Ziel ist es, log-basierte CDC-Pipelines aufzubauen, die Datenkonsistenz sicherzustellen und Datenbank-Events effizient in Kafka-Topics zu überführen, um nachgelagerte Systeme wie Data Warehouses oder Caches in Echtzeit zu aktualisieren.

Details

Inhalt

  • Ziele und Erwartungen der Teilnehmenden
    • Klärung individueller Lernziele und Erwartungen für ein praxisnahes und relevantes Seminar
  • 1. Grundlagen des Change Data Capture (CDC)
    • Query-based vs. Log-based CDC: Warum das Auslesen von Logs (Binlog, WAL) überlegen ist.
    • Das Debezium-Ökosystem: Architektur und Zusammenspiel mit Kafka und Kafka Connect.
    • Einsatzszenarien: Vom Echtzeit-Dashboard bis zur Cache-Invalidierung.
  • 2. Debezium für PostgreSQL (Write-Ahead-Log)
    • Logical Decoding: Konfiguration von pgoutput und Replikations-Slots.
    • Rechte & Rollen: Notwendige Datenbank-Berechtigungen für den Debezium-User.
    • Umgang mit Schemata: Wie Debezium Tabellenstrukturen in Kafka-Messages übersetzt.
  • 3. Debezium für MySQL und MariaDB (Binlog)
    • Binlog-Konfiguration: Row-based Logging (ROW) und Server-IDs.
    • Snapshots: Wie Debezium den initialen Datenbestand erfasst, bevor das Streaming beginnt.
    • GTID-Support: Sicherstellung der Konsistenz bei Failover-Szenarien.
  • 4. Enterprise DBs: SQL Server, Oracle und MongoDB
    • SQL Server: Nutzung von SQL Server Agent und Change Tracking (CT).
    • Oracle LogMiner: Integration der Oracle-Redo-Logs in den Datenstrom.
    • MongoDB Change Streams: CDC für dokumentenbasierte NoSQL-Datenbanken.
  • 5. Datenformate und Serialisierung
    • Struktur der Messages: Before-State, After-State und Metadaten (Source-Info).
    • Avro & JSON Schema: Integration mit der Confluent/Apicurio Schema Registry.
    • SMT (Single Message Transforms): Daten-Mapping und Event-Routing während des Streamings.
  • 6. Fehlertoleranz und Datenkonsistenz
    • At-least-once vs. Exactly-once: Wie Debezium mit Offsets arbeitet.
    • Troubleshooting: Umgang mit korrupten Logs oder Verbindungsabbrüchen.
    • Monitoring: JMX-Metriken zur Überwachung von Latenz und Durchsatz.
  • 7. Microservices und Event Sourcing Patterns
    • Outbox Pattern: Wie man Datenbank-Updates und Event-Publikation atomar macht.
    • CQRS: Trennung von Schreib- und Lesemodellen durch CDC-Synchronisation.
    • Strangler Fig Pattern: Legacy-Monolithen schrittweise mittels CDC ablösen.
  • 8. Integration in den Modern Data Stack
    • Cloud Sinks: Streaming von Debezium-Events nach Snowflake, BigQuery oder S3.
    • Event-Processing: Weiterverarbeitung mit Flink oder Kafka Streams.
    • Data Quality: Validierung von Datenströmen in Echtzeit.
  • 9. Praxis-Workshop: "The Live Sync Challenge"
    • Workshop: Setup einer PostgreSQL-zu-Kafka-Strecke via Debezium.
    • Transformation-Task: Filtern und Maskieren von sensiblen PII-Daten via SMT.
    • Failure-Scenario: Simulation eines Datenbank-Ausfalls und Recovery des CDC-Connectors.
    • Final Roadmap: Design einer unternehmensweiten CDC-Strategie.

  • Data Engineers: Zur Automatisierung von Real-time ETL/ELT-Strecken.
  • Software-Architekten: Zur Implementierung von Event Sourcing und CQRS.
  • Datenbankadministratoren (DBA): Zur Unterstützung moderner Replikationsverfahren.
  • DevOps Engineers: Zum Betrieb und Monitoring von CDC-Pipelines auf Kafka Connect.


In Präsenz

Online
Lernmethode

Ausgewogene Mischung aus Theorie und Praxis

Wie auch bei unseren Präsenz-Seminaren: Ausgewogene Mischung aus Theorie und praktischen Übungen. Trainer durchgehend präsent.

Unterlagen

Seminarunterlagen oder Fachbuch inklusive. Das Fachbuch wählt der Trainer passend zum Seminar aus - Ihren individuellen Buch-Wunsch berücksichtigen wir auf Nachfrage gerne.

Seminarunterlagen oder Fachbuch inklusive (via DHL). Das Fachbuch wählt der Trainer passend zum Seminar aus - Ihren individuellen Buch-Wunsch berücksichtigen wir auf Nachfrage gerne.

Arbeitsplatz
  • PC/VMs für alle Teilnehmenden
  • Hochwertige und performante Hardware
  • Große, höhenverstellbare Bildschirme
  • Zugang zu Ihrem Firmennetz erlaubt
  • 86-90 Zoll Bildschirm für perfekte Präsentationen in jedem Schulungsraum
  • Online Meeting + Remote Zugriff auf persönlichen GFU-Schulungs-PC
  • Keine Installation auf dem eigenem PC notwendig
Lernumgebung

Neu aufgesetzte Remote-Systeme für jeden Kurs in Abstimmung mit dem Seminarleiter, sodass Sie über ein perfektes Setup für die Durchführung aller praktischen Übungen verfügen.

Arbeitsmaterialien

Din A4 Block, Notizblock, Kugelschreiber, USB-Stick, Textmarker, Post-its

Teilnahmezertifikat

Nach Abschluss des Seminars erhalten Sie das Teilnahmezertifikat inkl. Inhaltsverzeichnis per E-Mail als PDF.


In Präsenz

Online
Teilnehmendenzahl

min. 1, max. 8 Personen

Garantierte Durchführung *

Ab 1 Teilnehmenden

Schulungszeiten
2 Tage, 09:00 - 16:00 Uhr
Ort der Schulung
GFU Schulungszentrum oder Virtual Classroom
GFU Schulungszentrum
Am Grauen Stein 27
51105 Köln-Deutz

oder online im Virtual Classroom oder europaweit bei Ihnen als Inhouse-Schulung

Um ein optimales Raumklima zu gewährleisten, haben wir das Schulungszentrum mit 17 hochmodernen Trotec TAC V+ Luftreinigern ausgestattet. Diese innovative Filtertechnologie (H14 zertifiziert nach DIN EN1822) sorgt dafür, dass die Raumluft mehrfach pro Stunde umgewälzt wird und Schadstoffe zu 99.995% im HEPA-Filter abgeschieden und infektiöse Aerosole abgetötet werden.

Zusätzlich sind alle Räume mit CO2-Ampeln ausgestattet, um jederzeit eine hervorragende Luftqualität sicherzustellen.

Räumlichkeiten

Helle und modern ausgestattete Räume mit perfekter Infrastruktur

Bequem aus dem Homeoffice von überall

All-Inclusive

Frühstück, Snacks und Getränke ganztägig, Mittagessen im eigenen Restaurant, täglich 6 Menüs, auch vegetarisch

Eine Auswahl unserer Frühstücks-Snacks und Nervennahrungs-Highlights senden wir Ihnen mit den Seminarunterlagen via DHL zu.
Barrierefreiheit

Das GFU-Schulungszentrum (Am Grauen Stein 27) ist barrierefrei

-

In Präsenz

Online
  • Eigener Shuttle-Service
  • Reservierte Parkplätze
  • Hotelreservierung
  • Technik-Sofort-Support

Buchungsmöglichkeiten

Online oder in Präsenz teilnehmen

Sie können sowohl Online als auch in Präsenz am Seminar teilnehmen. Klicken Sie bei Ihrer Buchung oder Anfrage einfach die entsprechende Option an.

Inhouse-/Firmenschulung
  • Lernumgebung in der Cloud
  • Inhalte werden auf Wunsch an die Anforderungen Ihres Teams angepasst.
Präsenz Online Hybrid

So haben GFU-Kunden gestimmt

Zu diesem Seminar wurden noch keine Bewertungen abgegeben.

FAQ für Inhouse Schulungen

Bei einer offenen Schulung stehen Ort und Termin vorab fest. Jeder Interessent kann eine offene Schulung buchen, daher treffen Teilnehmer aus verschiedenen Unternehmen aufeinander.

Inhouse Schulungen können auf Ihren individuellen Schulungsbedarf zugeschnitten werden. Sie bestimmen den Teilnehmerkreis, Termin und Schulungsort.

Bei einer Inhouse Schulung gehen wir auf die individuellen Bedürfnisse Ihres Unternehmens ein und decken den Schulungsbedarf direkt bei Ihnen im Unternehmen ab.

Das spart Zeit und Geld und sorgt für einen schnellen Wissenstransfer Ihrer Mitarbeiter.

Eine komplette Lernumgebung in der Cloud mit Remote Zugriff ist für uns selbstverständlich. Sie müssen sich um nichts kümmern. Lediglich ein funktionierender PC oder Notebook mit Internetanschluss sollte für jeden Teilnehmer am Schulungstag bereit stehen.

  • Kompetente Seminarberatung
  • Dozenten aus der Praxis
  • Auf Ihre Bedürfnisse zugeschnittener individueller Lernstoff
  • Sie können den Termin flexibel gestalten, so wie es für Sie am besten passt
  • Unsere Inhouse Schulungen können Europaweit durchgeführt werden
  • Der Fokus liegt auf Ihrem Schulungsbedarf, somit schonen Sie Ihr Budget
  • Wissenslücken Ihrer Mitarbeitet werden schnell geschlossen
aegallianzaxaElement 1deutsche-bankdeutsche-postlufthansamercedessonyzdf