settings
OTEX_BIGISTQB®
Süddeutsche Zeitung Institut Auszeichnung
 Image
Alle Microsoft Fabric Schulungen

Schulung Microsoft Fabric für Data Engineers: Lakehouse, Pipelines und Real-Time Intelligence

Lakehouse, Warehouse, Spark und KQL in einem Stack

3 Tage / S7176
Neues Seminar
Per E-Mail senden

Schulungsformen

Inhouse-/Firmenschulung

  • 3 Tage - anpassbar
  • Termin nach Wunsch
  • In Ihrem Hause oder bei der GFU
  • Preis nach Angebot

  • Lernumgebung in der Cloud
  • Inhalte werden auf Wunsch an die Anforderungen Ihres Teams angepasst.
Präsenz Online Hybrid

Individualschulung

  • 3 Tage - anpassbar
  • Termin nach Wunsch
  • In Ihrem Hause oder bei der GFU
  • Preis nach Angebot

  • Lernumgebung in der Cloud
  • 1 Teilnehmender = Fokus aufs Fachliche und maximaler Raum für individuelle Fragen.
Präsenz Online Hybrid

Beschreibung

Ein Unternehmen möchte verstreute Datenquellen auf einer Analyseplattform zusammenführen - Batch und Streaming, Lake und Warehouse, ohne Kopien hin und her zu schieben. Microsoft Fabric bringt das auf OneLake zusammen. Dieser Kurs baut eine vollständige Data-Engineering-Lösung in Fabric Schritt für Schritt auf.
Gearbeitet wird entlang einer Medaillon-Architektur. Von Datenaufnahme und Lakehouse über Spark- und Warehouse-Transformationen bis zu Real-Time Intelligence, Governance und Auslieferung entsteht ein durchgängiges, praxisnahes Bild.

Noch mehr Microsoft Fabric Wissen erhalten Sie auch in unseren weiteren Microsoft Fabric Seminare.

Schulungsziel

Jede teilnehmende Person verlässt das Seminar mit der Fähigkeit, End-to-End-Datenlösungen auf Microsoft Fabric zu bauen - von der Datenaufnahme über Lakehouse- und Warehouse-Transformationen bis zu Real-Time Intelligence. Sie arbeitet mit OneLake, Delta Lake und der Medaillon-Architektur, beherrscht Spark, T-SQL und KQL in Grundzügen und sichert Governance, Auslieferung und Betrieb ihrer Lösung ab.

Details

Inhalt

  • Ziele und Erwartungen der Teilnehmenden
    • Klärung individueller Lernziele und Erwartungen für ein praxisnahes und relevantes Seminar
  • Tag 1: 1. Fabric-Überblick: Plattform, Workspaces und Kapazitäten
    • Fabric als einheitliche SaaS-Analyseplattform
    • Die Workloads im Überblick: Data Engineering, Data Warehouse, Real-Time Intelligence und Power BI
    • Workspaces, Domains und Organisation
    • Kapazitäten, Lizenzierung und Ressourcensteuerung
    • Die Rolle des Data Engineers im Fabric-Stack
    • Praxis-Übung: Einen Workspace einrichten und die verfügbaren Workloads erkunden.
  • 2. OneLake: einheitlicher Data Lake, Shortcuts und Mirroring
    • OneLake und der One-Copy-Ansatz ohne Datenduplikate
    • Speicherung im Delta- und Parquet-Format
    • Interne und externe Shortcuts auf vorhandene Daten
    • Mirroring aus SQL Server 2025, Azure SQL und weiteren Quellen
    • Der OneLake File Explorer für den Zugriff
    • Praxis-Übung: Einen Shortcut auf eine externe Datenquelle anlegen und die Daten ohne Kopie nutzen.
  • 3. Lakehouse, Delta Lake und Medaillon-Architektur
    • Das Lakehouse als Verbindung von Data Lake und Warehouse
    • Verwaltete und externe Tabellen auf Delta Lake
    • ACID-Transaktionen und Versionierung mit Delta
    • Die Medaillon-Architektur: Bronze, Silver und Gold
    • Schema-Verwaltung und Datenqualität je Schicht
    • Praxis-Übung: Ein Lakehouse anlegen, Rohdaten als Bronze laden und eine Delta-Tabelle erzeugen.
  • 4. Datenaufnahme: Pipelines und Dataflows Gen2
    • Datenaufnahme planen: Pipelines, Dataflows und Notebooks abwägen
    • Data-Factory-Pipelines für die Orchestrierung
    • Dataflows Gen2 mit Power Query für Low-Code-Transformationen
    • Anbindung verschiedener Quellsysteme
    • Inkrementelle Last und Zeitpläne
    • Praxis-Übung: Eine Pipeline aufbauen, die Daten aus einer Quelle in das Bronze-Lakehouse lädt.
  • Tag 2: 5. Spark und Notebooks
    • Apache Spark in Fabric und die Notebook-Umgebung
    • PySpark und Spark SQL für Transformationen
    • DataFrame-Operationen: Filtern, Verbinden und Aggregieren
    • Umgang mit fehlenden Werten und Datenbereinigung
    • Umgebungen, notebookutils und Wiederverwendung
    • Praxis-Übung: In einem Notebook Bronze-Daten mit PySpark bereinigen und als Silver schreiben.
  • 6. Transformationen über die Medaillon-Schichten
    • Von Silver zu Gold: aggregierte und veredelte Daten
    • Dimensionale Modellierung: Fakten und Dimensionen
    • Umgang mit langsam veränderlichen Dimensionen
    • Wiederverwendbare und wartbare Transformationslogik
    • Orchestrierung der Schichten
    • Praxis-Übung: Aus Silver-Daten ein Gold-Sternschema mit Fakten und Dimensionen aufbauen.
  • 7. Fabric Data Warehouse und T-SQL
    • Das Fabric Data Warehouse und sein Einsatzfeld
    • T-SQL: Abfragen, Funktionen und gespeicherte Prozeduren
    • Lakehouse gegenüber Warehouse: wann was
    • Der SQL-Analyse-Endpunkt auf dem Lakehouse
    • Direct Lake für Power BI im Überblick
    • Praxis-Übung: Ein Warehouse anlegen und eine gespeicherte Prozedur für eine Transformation schreiben.
  • 8. Delta-Optimierung und Performance
    • Delta Lake gegenüber Parquet und die Vorteile
    • V-Order für schnelleres Lesen
    • OPTIMIZE und das Zusammenführen kleiner Dateien
    • VACUUM und die Bereinigung alter Versionen
    • Time Travel und Schema-Evolution
    • Praxis-Übung: Eine langsame Delta-Tabelle mit OPTIMIZE und V-Order beschleunigen.
  • Tag 3: 9. Real-Time Intelligence: Eventstream, Eventhouse und KQL
    • Streaming-Daten aufnehmen mit Eventstream
    • Das Eventhouse und die KQL-Datenbank
    • Grundlagen der Kusto Query Language
    • Filtern, Aggregieren und Zeitreihen mit KQL
    • Reaktionen automatisieren mit Activator
    • Praxis-Übung: Einen Eventstream in ein Eventhouse leiten und mit KQL abfragen.
  • 10. Governance und Sicherheit
    • Workspace-Rollen und Item-Level-Sharing
    • Row-Level Security und Object-Level Security
    • Domains und die Organisation großer Umgebungen
    • Datenherkunft, Lineage und Endorsements
    • Datenschutz und Compliance in der Plattform
    • Praxis-Übung: Row-Level Security für eine Tabelle einrichten und die Wirkung prüfen.
  • 11. CI/CD und ALM
    • Git-Integration für Fabric-Artefakte
    • Deployment-Pipelines über Entwicklungs-, Test- und Produktionsstufen
    • Versionierung und Wiederverwendung von Artefakten
    • Parametrisierung zwischen Umgebungen
    • Praxis-Übung: Eine Deployment-Pipeline einrichten und ein Artefakt zwischen zwei Stufen verschieben.
  • 12. Monitoring, Optimierung und Peer-Review
    • Monitoring Hub und Kapazitäts-Metriken
    • Pipelines, Notebooks und Abfragen überwachen
    • Performance von Lakehouse, Warehouse und Spark optimieren
    • Kosten und Kapazität im Blick behalten
    • Praxis-Übung (Peer-Review): Eine Fabric-Datenlösung einer anderen teilnehmenden Person gegen Architektur, Performance und Governance prüfen und die Rückmeldungen einarbeiten.

  • Data Engineers, die Datenlösungen auf Microsoft Fabric umsetzen
  • ETL- und BI-Entwickelnde, die von klassischen Pipelines zu Fabric wechseln
  • SQL-Fachkräfte, die Lakehouse, Spark und KQL erschließen
  • Azure-Data-Engineers mit DP-203-Hintergrund, die auf Fabric umsteigen
Voraussetzungen: Die Teilnehmenden bringen ein Grundverständnis von Data Engineering (Datenaufnahme, Transformation, Modellierung) und sicheres SQL mit. Grundkenntnisse in Python oder PySpark sind hilfreich; KQL wird im Kurs eingeführt. Azure-Tiefenwissen ist nicht erforderlich, da Fabric als SaaS-Plattform arbeitet.


In Präsenz

Online
Lernmethode

Ausgewogene Mischung aus Theorie und praktischen Übungen auf persönlichem Schulungs-PC.

Wie auch bei unseren Präsenz-Seminaren: Ausgewogene Mischung aus Theorie und praktischen Übungen. Trainer durchgehend präsent.

Unterlagen

Seminarunterlagen oder Fachbuch inklusive. Das Fachbuch wählt der Trainer passend zum Seminar aus - Ihren individuellen Buch-Wunsch berücksichtigen wir auf Nachfrage gerne.

Seminarunterlagen oder Fachbuch inklusive (via DHL). Das Fachbuch wählt der Trainer passend zum Seminar aus - Ihren individuellen Buch-Wunsch berücksichtigen wir auf Nachfrage gerne.

Arbeitsmaterialien

Din A4 Block, Notizblock, Kugelschreiber, USB-Stick, Textmarker, Post-its

Teilnahmezertifikat

Nach Abschluss des Seminars erhalten Sie das Teilnahmezertifikat inkl. Inhaltsverzeichnis per E-Mail als PDF.


In Präsenz

Online
Teilnehmendenzahl

min. 1, max. 8 Personen

Garantierte Durchführung *

Ab 1 Teilnehmenden

Schulungszeiten
3 Tage, 09:00 - 16:00 Uhr
Ort der Schulung
GFU Schulungszentrum oder Virtual Classroom
GFU Schulungszentrum
Am Grauen Stein 27
51105 Köln-Deutz

oder online im Virtual Classroom oder europaweit bei Ihnen als Inhouse-Schulung

Um ein optimales Raumklima zu gewährleisten, haben wir das Schulungszentrum mit 17 hochmodernen Trotec TAC V+ Luftreinigern ausgestattet. Diese innovative Filtertechnologie (H14 zertifiziert nach DIN EN1822) sorgt dafür, dass die Raumluft mehrfach pro Stunde umgewälzt wird und Schadstoffe zu 99.995% im HEPA-Filter abgeschieden und infektiöse Aerosole abgetötet werden.

Zusätzlich sind alle Räume mit CO2-Ampeln ausgestattet, um jederzeit eine hervorragende Luftqualität sicherzustellen.

Räumlichkeiten

Helle und modern ausgestattete Räume mit perfekter Infrastruktur

Bequem aus dem Homeoffice von überall

All-Inclusive

Frühstück, Snacks und Getränke ganztägig, Mittagessen im eigenen Restaurant, täglich 6 Menüs, auch vegetarisch

Eine Auswahl unserer Frühstücks-Snacks und Nervennahrungs-Highlights senden wir Ihnen mit den Seminarunterlagen via DHL zu.
Barrierefreiheit

Das GFU-Schulungszentrum (Am Grauen Stein 27) ist barrierefrei

-

In Präsenz

Online
  • Eigener Shuttle-Service
  • Reservierte Parkplätze
  • Hotelreservierung
  • Technik-Sofort-Support

Buchungsmöglichkeiten

Online oder in Präsenz teilnehmen

Sie können sowohl Online als auch in Präsenz am Seminar teilnehmen. Klicken Sie bei Ihrer Buchung oder Anfrage einfach die entsprechende Option an.

Inhouse-/Firmenschulung
  • Lernumgebung in der Cloud
  • Inhalte werden auf Wunsch an die Anforderungen Ihres Teams angepasst.
Präsenz Online Hybrid
Individualschulung
  • Lernumgebung in der Cloud
  • 1 Teilnehmender = Fokus aufs Fachliche und maximaler Raum für individuelle Fragen.
Präsenz Online Hybrid

So haben GFU-Kunden gestimmt

Zu diesem Seminar wurden noch keine Bewertungen abgegeben.

FAQ für Inhouse Schulungen

Bei einer offenen Schulung stehen Ort und Termin vorab fest. Jeder Interessent kann eine offene Schulung buchen, daher treffen Teilnehmer aus verschiedenen Unternehmen aufeinander.

Inhouse Schulungen können auf Ihren individuellen Schulungsbedarf zugeschnitten werden. Sie bestimmen den Teilnehmerkreis, Termin und Schulungsort.

Bei einer Inhouse Schulung gehen wir auf die individuellen Bedürfnisse Ihres Unternehmens ein und decken den Schulungsbedarf direkt bei Ihnen im Unternehmen ab.

Das spart Zeit und Geld und sorgt für einen schnellen Wissenstransfer Ihrer Mitarbeiter.

Eine komplette Lernumgebung in der Cloud mit Remote Zugriff ist für uns selbstverständlich. Sie müssen sich um nichts kümmern. Lediglich ein funktionierender PC oder Notebook mit Internetanschluss sollte für jeden Teilnehmer am Schulungstag bereit stehen.

  • Kompetente Seminarberatung
  • Dozenten aus der Praxis
  • Auf Ihre Bedürfnisse zugeschnittener individueller Lernstoff
  • Sie können den Termin flexibel gestalten, so wie es für Sie am besten passt
  • Unsere Inhouse Schulungen können Europaweit durchgeführt werden
  • Der Fokus liegt auf Ihrem Schulungsbedarf, somit schonen Sie Ihr Budget
  • Wissenslücken Ihrer Mitarbeitet werden schnell geschlossen
aegallianzaxaElement 1deutsche-bankdeutsche-postlufthansamercedessonyzdf