
Bitte wählen Sie die Bereiche, die Sie exportieren möchten:

Schulung Datenqualität in der Praxis: Data Quality, Data Catalog und Data Lineage
DQ-Dimensionen, Data Profiling, Data Contracts und Governance
Schulungsformen
Offene Schulung
- 2 Tage
- 5 gesicherte Termine
- Köln / Online
- 1.440,00 p. P. zzgl. MwSt.
- Dritter Mitarbeitende kostenfrei
- Learning & Networking in einem. Garantierte Durchführung ab 1 Teilnehmenden.
Inhouse-/Firmenschulung
- 2 Tage - anpassbar
- Termin nach Wunsch
- In Ihrem Hause oder bei der GFU
- Preis nach Angebot
- Lernumgebung in der Cloud
- Inhalte werden auf Wunsch an die Anforderungen Ihres Teams angepasst.
Individualschulung
- 2 Tage - anpassbar
- Termin nach Wunsch
- In Ihrem Hause oder bei der GFU
- Preis nach Angebot
- Lernumgebung in der Cloud
- 1 Teilnehmender = Fokus aufs Fachliche und maximaler Raum für individuelle Fragen.
Beschreibung
Was 2026 zählt, ist der messbare Datenqualitäts-Output: Anzahl produktiv überwachter DQ-Regeln, Catalog-Abdeckung kritischer Datenprodukte, Lineage-Tiefe vom Quellsystem bis zum BI-Layer, Time-to-Detection von DQ-Vorfällen. Dieses Zwei-Tage-Seminar vermittelt Datenqualitäts-Praxis konsequent werkzeug-nah und governance-anschlussfähig mit klarem Production-Fokus.
Schulungsziel
Jede teilnehmende Person verlässt das Seminar mit einem strukturierten Verständnis der Datenqualitäts-Realität 2026 und einer persönlichen 90-Tage-Datenqualitäts-Roadmap mit messbaren Output-Zielen - einsetzbar im eigenen Daten-Alltag ab dem ersten Arbeitstag nach dem Seminar.
Details
Inhalt
1. Datenqualität in der Praxis 2026
- Ziele und Erwartungen der Teilnehmenden
- Klärung individueller Lernziele und Erwartungen für ein praxisnahes und relevantes Seminar
- Datenqualität als Voraussetzung für Analytics, BI und KI: warum schlechte Daten alle nachgelagerten Investitionen entwerten.
- Business-Schaden durch schlechte Datenqualität: gescheiterte Migrationen, falsche Reports, halluzinierende KI, regulatorische Beanstandungen.
- Output-Disziplin: Anzahl produktiv überwachter DQ-Regeln, Catalog-Abdeckung kritischer Datenprodukte, Lineage-Tiefe, Time-to-Detection als persönliche KPIs.
- Abgrenzung Datenqualität, Data Catalog und Data Lineage: drei Disziplinen mit gemeinsamem Fundament Metadaten.
- Anti-Patterns: einmalige DQ-Initiative ohne Betrieb, Catalog ohne Pflege, Lineage als manuelles Wiki, DQ-Verantwortung ohne Mandat.
- Praxis-Übung: Eigene Datenqualitäts-Bestandsaufnahme - aktuelle DQ-Realität in der eigenen Organisation benennen, drei kritische DQ-Vorfälle der letzten zwölf Monate aufschreiben, Output-Ziele skizzieren.
- DQ-Dimensionen nach ISO/IEC 25012: Genauigkeit, Vollständigkeit, Konsistenz, Aktualität, Glaubwürdigkeit, Zugänglichkeit, Verständlichkeit, weitere.
- DAMA-DMBOK 2 als Referenz-Rahmenwerk für Data Management.
- Pragmatische Kern-Dimensionen für die Praxis: Completeness, Uniqueness, Validity, Consistency, Timeliness, Accuracy.
- Business-Regeln versus technische DQ-Regeln: wer formuliert was.
- DQ-Metriken: Regel-Erfüllungsgrad, Trend-Analysen, Severity-Klassifikation.
- Data Stewardship und RACI: wer ist verantwortlich für DQ welcher Datenprodukte.
- ISO 8000 als ergänzender Standard für Stammdaten-Qualität.
- KI-Use-Cases: DQ-Regel-Vorschläge aus Tabellen-Schemas mit Claude, Mapping von Business-Regeln zu technischen Checks.
- Praxis-Übung: DQ-Dimensionen-Übung mit KI - für drei eigene Datenprodukte je fünf DQ-Regeln entlang der Kern-Dimensionen mit KI-Unterstützung formulieren und in Business-Sprache übersetzen.
- Data Profiling als Einstieg: Verteilung, Null-Quoten, Kardinalität, Pattern-Analyse.
- Open-Source-Profiler: ydata-profiling (vormals pandas-profiling), Great Expectations Data Assistant.
- Great Expectations: Expectation Suites, Checkpoints, Data Docs, Integration in Airflow und Dagster.
- Soda Core und Soda Cloud: SodaCL als YAML-DSL, Observability-Integration.
- dbt-Tests: built-in Tests (unique, not_null, accepted_values, relationships), dbt-expectations als Erweiterung, dbt-utils.
- Anomaly Detection: statistische Verfahren, ML-basierte Anomalie-Erkennung in kommerziellen Tools.
- DQ-Tests in CI/CD: Tests im Pull-Request, Tests im Daily-Run, Tests als Pre-Production-Gate.
- KI-Use-Cases: Generierung von Great-Expectations-Suiten aus Sample-Daten mit Claude, Übersetzung von Business-Regeln in dbt-Tests.
- Praxis-Übung: Profiling- und Test-Übung mit KI in geschütztem Lab - ein Datenprodukt mit ydata-profiling profilieren, mit Claude eine Great-Expectations-Suite mit zehn Expectations entwerfen und ausführen.
- Was ein Data Catalog leistet: Auffindbarkeit, fachliche und technische Metadaten, Glossare, Stewardship-Zuordnung, Such-Funktion.
- Open-Source-Catalogs: DataHub (LinkedIn, Apache 2.0), OpenMetadata (Apache 2.0), Apache Atlas, Amundsen (Lyft).
- Kommerzielle Catalogs: Collibra, Alation, Atlan, data.world, Informatica EDC.
- Cloud-Anbieter-Catalogs: Microsoft Purview, AWS Glue Data Catalog, Google Dataplex, Databricks Unity Catalog.
- Auswahl-Kriterien: Connector-Reife, Lineage-Fähigkeit, Self-Hosting-Option, Glossar-Workflows, Such-Qualität, API-Reife.
- Business Glossary und semantische Modelle: fachliche Begriffsklärung als Voraussetzung für DQ.
- Active Metadata: Catalog als operatives Werkzeug, nicht als Inventar-Friedhof.
- KI-Use-Cases: Generierung von Tabellen- und Spalten-Beschreibungen aus Schemas mit Claude, Glossar-Pflege-Vorschläge.
- Praxis-Übung: Catalog-Übung mit KI in geschütztem Lab - in DataHub oder OpenMetadata eine Beispiel-Datenquelle anbinden, mit Claude fachliche Beschreibungen für zehn Tabellen generieren und einpflegen.
5. Data Lineage mit OpenLineage
- Data Lineage als Disziplin: Column-Level-Lineage, Table-Level-Lineage, Process-Lineage.
- Anwendungsfälle: Impact-Analyse vor Änderungen, Root-Cause-Analyse bei DQ-Vorfällen, regulatorische Nachweis-Pflichten, BCBS 239 im Banking.
- OpenLineage als offener Standard unter LF AI & Data: Lineage-Events, Runs, Datasets, Facets.
- Marquez als Referenz-Implementierung von OpenLineage.
- Integrationen: Airflow, dbt, Spark, Flink, Trino, dbt-OpenLineage.
- Lineage in Catalogs: DataHub, OpenMetadata, Atlan, Collibra mit eigenen Lineage-Engines.
- Grenzen: Lineage durch Stored Procedures, dynamisches SQL, Excel-Brücken.
- KI-Use-Cases: Lineage-Lücken-Analyse mit Claude, Vorschläge für manuelle Lineage-Ergänzungen.
- Praxis-Übung: Lineage-Übung mit KI in geschütztem Lab - für eine dbt-Pipeline OpenLineage-Events erzeugen, in Marquez visualisieren, mit Claude eine Impact-Analyse für eine Beispiel-Änderung erstellen.
- Data Contracts als Vertrag zwischen Daten-Produzent und Daten-Konsument: Schema, Semantik, SLAs, Qualitäts-Garantien.
- Data-Contract-Spezifikationen: Open Data Contract Standard, dbt-Contracts, Soda Contracts.
- Schema-Evolution: Breaking Changes, Versionierung, Deprecation-Workflows.
- Data Observability als Erweiterung von DQ-Tests: Freshness, Volume, Schema, Distribution, Lineage als fünf Säulen.
- Tools: Monte Carlo, Bigeye, Anomalo, Datafold, Elementary für dbt-Observability.
- Incident-Management für Daten: DQ-Incidents wie Production-Incidents behandeln, Post-Mortems, Runbooks.
- Daten-SLAs und SLOs: messbare Zusagen statt Hoffnungs-Werte.
- KI-Use-Cases: Data-Contract-Entwurf aus Schema und Use-Case-Beschreibung mit Claude, Post-Mortem-Strukturen.
- Praxis-Übung: Contracts- und Observability-Übung mit KI - für ein kritisches Datenprodukt einen Data Contract mit Schema, drei SLAs und fünf DQ-Garantien mit KI-Unterstützung formulieren.
- Data Governance als Klammer um DQ, Catalog und Lineage: Rollen, Gremien, Prozesse.
- Rollen-Modelle: Data Owner, Data Steward, Data Custodian, Data Quality Officer.
- DSGVO-Pflichten mit DQ-Bezug: Richtigkeit nach Artikel 5, Auskunfts- und Löschungsrechte mit Lineage-Bezug.
- EU-AI-Act seit 2. August 2026: Datenqualitäts-Anforderungen an Hochrisiko-KI-Systeme nach Artikel 10 (Repräsentativität, Relevanz, Fehlerfreiheit, Vollständigkeit), Lineage-Nachweise.
- BCBS 239 im Banking: Grundsätze für Risikodaten-Aggregation und -Berichterstattung mit DQ- und Lineage-Pflichten.
- ISO/IEC 42001 (AIMS) mit Daten-Qualitäts-Anforderungen für KI-Management-Systeme.
- Audit-Vorbereitung: Catalog, Lineage und DQ-Reporting als Nachweis-Werkzeuge.
- KI-Use-Cases: Mapping von DSGVO- und EU-AI-Act-Pflichten auf konkrete Catalog- und Lineage-Anforderungen mit Claude.
- Praxis-Übung: Governance-Übung mit KI - für ein hypothetisches Hochrisiko-KI-System die DQ- und Lineage-Anforderungen nach EU-AI-Act Artikel 10 mit KI-Unterstützung in eine Anforderungsliste übersetzen.
- Skalierungs-Patterns: Catalog-Adoption über Daten-Produkte, nicht über Tabellen-Inventare.
- Data Mesh als organisatorisches Modell: föderierte Verantwortung, Self-Serve-Plattform, computational Governance.
- Stewardship-Programme: Aktivierung von Fach-Stewards, Anreize, Tooling-Unterstützung.
- DQ als Plattform-Funktion: zentrale DQ-Plattform versus dezentrale Tool-Auswahl.
- Cost-Management: Catalog-Lizenz-Kosten, Compute-Kosten für DQ-Tests, Observability-Kosten.
- Reifegrad-Modelle: von Ad-hoc über reaktiv und gemanagt zu optimiert.
- Karriere-Pfade: vom Data Engineer zum Data Quality Lead, Data Architect, Head of Data Governance, Chief Data Officer.
- Lernpfad: Data-Engineering-Schulungen im Bestand für Pipeline-Tiefe, dbt-Schulungen für Modellierungs-Tiefe, KI-gestützter AIMS-Implementer ISO 42001 (NEU, 3T) für KI-Governance, DSGVO-konformer KI-Einsatz für regulatorische Tiefe, EU-AI-Act in der Praxis für regulatorische Vertiefung.
- Praxis-Übung: Persönliche 90-Tage-Datenqualitäts-Roadmap - aktuelle Position, Zielposition in zwölf Monaten, drei Lern-Schwerpunkte, drei Werkzeuge im Stack, ein messbares Output-Ziel pro Monat (überwachte DQ-Regeln, Catalog-Abdeckung, Lineage-Tiefe, Time-to-Detection), Sparring-Buddy aus dem Seminar.
Zielgruppe & Vorkenntnisse
- Data Engineers und Analytics Engineers: Die Datenqualitäts-Praxis in Pipelines und Plattformen verankern wollen.
- Data Stewards und Data Quality Officers: Die DQ-Frameworks, Catalog-Pflege und Lineage-Verantwortung methodisch tragen.
- Data Architects und Solution Architects: Die DQ-, Catalog- und Lineage-Architekturen plattformübergreifend gestalten.
- BI-Leads und Data Platform Engineers mit Governance-Mandat: Die Datenqualität in Produktion sichern und nachweisen müssen.
Abgrenzung: Vermittelt Datenqualitäts-Praxis mit Tool-Vergleich und Governance-Anschluss - nicht reine Datenmodellierung (dafür: Data-Modeling-Schulungen im Bestand), nicht Master Data Management im engeren Sinne (dafür: dedizierte MDM-Schulung), nicht reine Data-Engineering-Tool-Schulung ohne Qualitäts-Fokus, nicht reine Compliance-Schulung ohne technische Tiefe (dafür: DSGVO- und EU-AI-Act-Schulungen im Bestand). Fokussiert auf operative Datenqualitäts-Disziplin mit Catalog- und Lineage-Anbindung.
Ihre Schulung
In Präsenz | Online |
|---|---|
| Lernmethode | |
Ausgewogene Mischung aus Theorie und praktischen Übungen auf persönlichem Schulungs-PC. | Wie auch bei unseren Präsenz-Seminaren: Ausgewogene Mischung aus Theorie und praktischen Übungen. Trainer durchgehend präsent. |
| Unterlagen | |
Seminarunterlagen oder Fachbuch inklusive. Das Fachbuch wählt der Trainer passend zum Seminar aus - Ihren individuellen Buch-Wunsch berücksichtigen wir auf Nachfrage gerne. | Seminarunterlagen oder Fachbuch inklusive (via DHL). Das Fachbuch wählt der Trainer passend zum Seminar aus - Ihren individuellen Buch-Wunsch berücksichtigen wir auf Nachfrage gerne. |
| Arbeitsmaterialien | |
DIN A4 Block, Notizblock, Kugelschreiber, USB-Stick, Textmarker, Post-its | |
| Teilnahmezertifikat | |
Nach Abschluss des Seminars erhalten Sie das Teilnahmezertifikat inkl. Inhaltsverzeichnis per E-Mail als PDF. | |
Organisation
In Präsenz | Online | |
|---|---|---|
| Teilnehmendenzahl | ||
min. 1, max. 8 Personen | ||
| Garantierte Durchführung | ||
Ab 1 Teilnehmenden* | ||
| Schulungszeiten | ||
| ||
| Ort der Schulung | ||
GFU SchulungszentrumAm Grauen Stein 27 51105 Köln-Deutz oder online im Virtual Classroom oder europaweit bei Ihnen als Inhouse-Schulung Um ein optimales Raumklima zu gewährleisten, haben wir das Schulungszentrum mit 17 hochmodernen Trotec TAC V+ Luftreinigern ausgestattet. Diese innovative Filtertechnologie (H14 zertifiziert nach DIN EN1822) sorgt dafür, dass die Raumluft mehrfach pro Stunde umgewälzt wird und Schadstoffe zu 99.995% im HEPA-Filter abgeschieden und infektiöse Aerosole abgetötet werden. Zusätzlich sind alle Räume mit CO2-Ampeln ausgestattet, um jederzeit eine hervorragende Luftqualität sicherzustellen. | ||
| Räumlichkeiten | ||
Helle und modern ausgestattete Räume mit perfekter Infrastruktur | Bequem aus dem Homeoffice von überall | |
| Preisvorteil | ||
Dritter Mitarbeitende nimmt kostenfrei teil. Eventuell anfallende Prüfungskosten für den dritten Teilnehmenden werden zusätzlich berechnet - auch bei Seminaren inkl. Prüfungsgebühr. Hinweis: Um den Erfolg der Schulung zu gewährleisten, sollte auch der dritte Teilnehmende die erwarteten Vorkenntnisse mitbringen. | ||
| All-Inclusive | ||
Gebäck, Snacks und Getränke ganztägig, Mittagessen im eigenen Restaurant, täglich 6 Menüs, auch vegetarisch | Eine Auswahl unserer Frühstücks-Snacks und Nervennahrungs-Highlights senden wir Ihnen mit den Seminarunterlagen via DHL zu. | |
| Barrierefreiheit | ||
Das GFU-Schulungszentrum (Am Grauen Stein 27) ist barrierefrei | - | |
Buchen ohne Risiko
| Rechnungsstellung |
Erst nach dem erfolgreichen Seminar. Keine Vorkasse. |
| Stornierung |
Kostenfrei bis zum Vortag des Seminars |
| Vormerken statt buchen |
Sichern Sie sich unverbindlich Ihren Seminarplatz schon vor der Buchung - auch wenn Sie selbst nicht berechtigt sind zu buchen |
Kostenfreie Services
In Präsenz | Online |
|---|---|
|
|
Buchungsmöglichkeiten
Online oder in Präsenz teilnehmen
Sie können sowohl Online als auch in Präsenz am Seminar teilnehmen. Klicken Sie bei Ihrer Buchung oder Anfrage einfach die entsprechende Option an.
Gesicherte offene Termine
| Termin | Ort | Preis | ||
|---|---|---|---|---|
| 21.12.-22.12.2026 Plätze vorhanden Köln / Online 1.440,00 | Köln / Online | 1.440,00 | Buchen Vormerken | |
| 2027 | ||||
| 26.04.-27.04.2027 Plätze vorhanden Köln / Online 1.440,00 | Köln / Online | 1.440,00 | Buchen Vormerken | |
| 28.06.-29.06.2027 Plätze vorhanden Köln / Online 1.440,00 | Köln / Online | 1.440,00 | Buchen Vormerken | |
| 30.08.-31.08.2027 Plätze vorhanden Köln / Online 1.440,00 | Köln / Online | 1.440,00 | Buchen Vormerken | |
| 01.11.-02.11.2027 Plätze vorhanden Köln / Online 1.440,00 | Köln / Online | 1.440,00 | Buchen Vormerken | |
- Lernumgebung in der Cloud
- Inhalte werden auf Wunsch an die Anforderungen Ihres Teams angepasst.
- Lernumgebung in der Cloud
- 1 Teilnehmender = Fokus aufs Fachliche und maximaler Raum für individuelle Fragen.
- Alle folgenden Schulungsformen können auch Online als Virtual Classroom durchgeführt werden.
- Eine Offene Schulung findet zu einem festgelegten Zeitpunkt im voll ausgestatteten Schulungszentrum oder Online/Remote statt. Sie treffen auf Teilnehmende anderer Unternehmen und profitieren vom direkten Wissensaustausch.
- Eine Inhouse-/Firmen-Schulung geht auf die individuellen Bedürfnisse Ihres Unternehmens ein. Sie erhalten eine kostenfreie Beratung von Ihrem Seminarleiter und können Inhalte und Dauer auf Ihren Schulungsbedarf anpassen. Inhouse-Schulungen können Europaweit durchgeführt werden.
- Bei einer Individual-Schulung erhalten Sie eine 1-zu-1 Betreuung und bestimmen Inhalt, Zeit und Lerntempo. Der Dozent passt sich Ihren Wünschen und Bedürfnissen an.
Sie können unsere Schulungen auch als Remote Schulung im Virtual Classroom anfragen.
In drei Schritten zum Online Seminar im Virtual Classroom:
- Seminar auswählen und auf "Buchen" klicken
- Wählen Sie bei "Wie möchten Sie teilnehmen?" einfach "Online" aus.
- Formular ausfüllen und über den Button "Jetzt buchen" absenden.
Unser Kundenservice meldet sich bei Ihnen mit der Buchungsbestätigung.
Unsere Online Schulungen finden im Virtual Classroom statt. Ein Virtual Classroom bündelt mehrere Werkzeuge, wie Audio-Konferenz, Text-Chat, Interaktives Whiteboard, oder Application Sharing.
Vorteile von Virtual Classroom:
- Sie erhalten 1 zu 1 die gleiche Lernumgebung, die Sie auch vor Ort bei uns vorfinden
- Die technische Vorbereitung wird von den GFU-Technikern vorgenommen
- Sie erhalten remote Zugriff auf Ihren persönlichen Schulungs-PC im GFU-Seminarraum
- Die Virtual Classroom Lösung lässt sich auch im Browser betreiben
- Die GFU-Technik leistet wie gewohnt Soforthilfe bei Problemen
- Die Schulungsunterlagen bekommen Sie via DHL zugeschickt
- Sie sparen Reisekosten und Zeit
- 21. Dez. - 22. Dez. ✓ Noch einige Plätze frei ▶ Köln + Online/Remote
- 26. Apr. - 27. Apr. ✓ Noch einige Plätze frei ▶ Köln + Online/Remote
- 28. Jun. - 29. Jun. ✓ Noch einige Plätze frei ▶ Köln + Online/Remote
- 30. Aug. - 31. Aug. ✓ Noch einige Plätze frei ▶ Köln + Online/Remote
- 01. Nov. - 02. Nov. ✓ Noch einige Plätze frei ▶ Köln + Online/Remote
- Auch als Inhouse-Schulung, bundesweit mit Termin nach Wunsch und individuellen Inhalten
- Buchen ohne Risiko! Kostenfreie Stornierung bis zum Vortag des Seminars
Die Seminare der GFU finden in angenehmer Atmosphäre statt und sind perfekt organisiert. Profitieren Sie von dem Rundum-Service der GFU!
Machen Sie sich keinen Kopf um die Anreise! Unser Shuttle fährt Sie. Oder Sie parken einfach auf einem extra für Sie reservierten Parkplatz.
Hotelzimmer gesucht? Wir organisieren Ihnen eins. Ihr Vorteil: Sie sparen Zeit und Geld!
Stornierung bei offenen Seminaren kostenfrei bis einen Tag vor Schulungsbeginn.
Unsere Techniker sind immer zur Stelle, egal ob online oder vor Ort.
GFU Schulungszentrum