germanyuksettings
Präsenz + Online Schulungen: Bei uns, bei Ihnen oder online - Sie haben die Wahl!

Buchen Sie Ihr Wunschseminar als Präsenz-Schulung bei uns im Schulungszentrum in Köln, als Inhouse-Schulung bei Ihnen oder als Online-Training - ganz wie es für Sie am besten passt!

Mehr Infos

Schulung Apache Spark Workshop mit Übungen 

Als Online-Schulung oder in Präsenz
3 Tage / S2864

Schulungsformen

Inhouse-/Firmenschulung

  • 3 Tage - anpassbar
  • Termin nach Wunsch
  • Preis nach Angebot
  • In Ihrem Hause oder bei der GFU

Individualschulung

  • 3 Tage - anpassbar
  • Termin nach Wunsch
  • Preis nach Angebot
  • In Ihrem Hause oder bei der GFU

Beschreibung

Der dreitägige Apache Spark-Workshop ist ein intensiver Kurs, der den Teilnehmern eine umfassende Einführung in die Verarbeitung großer Datenmengen mit Apache Spark und die Implementierung von Machine-Learning-Modellen mit Spark MLlib bietet.
Im Laufe des Workshops lernen die Teilnehmer, wie sie Spark installieren und eine Spark-Anwendung erstellen, Daten mit SparkSQL und Spark DataFrames analysieren, RDDs erstellen und Transformationen und Aktionen auf RDDs anwenden sowie Machine-Learning-Modelle mit Spark MLlib trainieren und evaluieren können.
Das praktische Projekt zur Vorhersage von Kundenabwanderung gibt den Teilnehmern die Möglichkeit, das Gelernte in die Praxis umzusetzen und eine voll funktionsfähige Spark-Anwendung auf einer Cluster-Umgebung zu erstellen.

Schulungsziel

Die Teilnehmer sollten am Ende des Workshops in der Lage sein, Apache  Spark effektiv zu nutzen, um große Datenmengen zu verarbeiten und  Machine-Learning-Modelle zu trainieren und zu evaluieren. Darüber hinaus  sollten sie in der Lage sein, Spark-Anwendungen effizient zu erstellen  und zu optimieren, um die Leistung und Skalierbarkeit zu maximieren.

Details

Wer teilnehmen sollte

 Der Workshop ist ideal für:

  • Datenwissenschaftler und Analysten, die ihre Fähigkeiten in der Verarbeitung großer Datenmengen mit Apache Spark verbessern möchten.
  • Softwareentwickler, die mit Apache Spark arbeiten und ihre Kenntnisse in der Entwicklung von Spark-Anwendungen vertiefen möchten.
  • Data Engineers, die für die Implementierung und Wartung von Spark-Clustern verantwortlich sind.
  • Business-Profis, die Machine-Learning-Modelle für ihre Unternehmen implementieren möchten.

Ihre Schulung


Präsenz-Schulung

Online-Schulung
Lernmethode

Ausgewogene Mischung aus Theorie und praktischen Übungen auf persönlichem Schulungs-PC.

Wie auch bei unseren Präsenz-Seminaren: Ausgewogene Mischung aus Theorie und praktischen Übungen. Trainer durchgehend präsent.

Unterlagen

Seminarunterlagen oder Fachbuch inklusive. Das Fachbuch wählt der Trainer passend zum Seminar aus - Ihren individuellen Buch-Wunsch berücksichtigen wir auf Nachfrage gerne.

Seminarunterlagen oder Fachbuch inklusive (per Post). Das Fachbuch wählt der Trainer passend zum Seminar aus - Ihren individuellen Buch-Wunsch berücksichtigen wir auf Nachfrage gerne.

Arbeitsplatz
  • PC/VMs für alle Teilnehmenden
  • Hochwertige und performante Hardware
  • Große, höhenverstellbare Bildschirme
  • Zugang zu Ihrem Firmennetz erlaubt
  • 86-90 Zoll Bildschirm für perfekte Präsentationen in jedem Schulungsraum
  • Online Meeting + Remote Zugriff auf persönlichen GFU-Schulungs-PC
  • Keine Installation auf dem eigenem PC notwendig
  • Auf Wunsch: Günstige Hardware-Miete (2. Monitor, Webcam, etc.)
Lernumgebung

Neu aufgesetzte Remote-Systeme für jeden Kurs in Abstimmung mit dem Seminarleiter, sodass Sie über ein perfektes Setup für die Durchführung aller praktischen Übungen verfügen.

Arbeitsmaterialien

Din A4 Block, Notizblock, Kugelschreiber, USB-Stick, Textmarker, Post-its

Teilnahmebescheinigung

Die Teilnahmebescheinigung inkl. Inhaltsverzeichnis wird Ihnen am Ende des Seminars ausgehändigt.

Die Teilnahmebescheinigung inkl. Inhaltsverzeichnis wird Ihnen per Post zugesandt.


Präsenz-Schulung

Online-Schulung
Teilnehmendenzahl

min. 1, max. 8 Personen

Garantierte Durchführung *

Ab einem Teilnehmenden

Schulungszeiten
3 Tage, 09:00 - 16:00 Uhr
Ort der Schulung
GFU Schulungszentrum oder Virtual Classroom
GFU Schulungszentrum
Am Grauen Stein 27
51105 Köln-Deutz

oder online im Virtual Classroom oder europaweit bei Ihnen als Inhouse-Schulung

Das Hygienekonzept wurde mit professioneller Hilfe umgesetzt und mit der zuständigen Behörde abgestimmt. Gerne stellen wir Ihnen dieses zur Verfügung. Darüber hinaus haben wir zu Ihrer Sicherheit das Schulungszentrum mit insgesamt 17 Trotec TAC V+ Hochleistungsluftreinigern ausgestattet. Durch die neuartig entwickelte Filtertechnik (H14 zertifiziert nach DIN EN1822) wird die Raumluft mehrfach stündlich umgewälzt und infektiöse Aerosole im HEPA-Virenfilter zu 99.995% abgeschieden und abgetötet. Zusätzlich sind alle Räume mit CO2 Ampeln ausgestattet, wir stellen Ihnen gerne zertifizierte FFP2 Masken zur Verfügung.

Räumlichkeiten

Helle und modern ausgestattete Räume mit perfekter Infrastruktur

Bequem aus dem Homeoffice von überall

All-Inclusive

Frühstück, Snacks und Getränke ganztägig, Mittagessen im eigenen Restaurant, täglich 6 Menüs, auch vegetarisch

Eine Auswahl unserer Frühstücks-Snacks und Nervennahrungs-Highlights senden wir Ihnen mit den Seminarunterlagen per Post zu.
Barrierefreiheit

Das GFU-Schulungszentrum (Am Grauen Stein 27) ist barrierefrei

-

Präsenz-Schulung

Online-Schulung
  • Eigener Shuttle-Service
  • Reservierte Parkplätze
  • Hotelreservierung
  • Monitor, Webcam etc. günstig mieten
  • Technik-Sofort-Support

Inhalt

Einführung in Apache Spark:
  • Vorstellung von Apache Spark als leistungsfähige Big-Data-Verarbeitungsplattform.
  • Diskussion über die Vorteile von Apache Spark gegenüber anderen Big-Data-Verarbeitungswerkzeugen.
  • Überblick über die Architektur von Apache Spark und wie es auf einem Cluster ausgeführt wird.
Installation von Apache Spark:
  • Anleitung zur Installation von Apache Spark auf einem lokalen Rechner.
  • Demonstration der Installation von Apache Spark auf einer Cluster-Umgebung.
Erste Schritte mit Apache Spark :
  • Vorstellung von Spark-Shell und wie es verwendet wird.
  • Verwendung von SparkSQL zur Datenanalyse.
  • Verwendung von Spark DataFrames.
Übung: Verwendung von Spark-Shell und SparkSQL für Datenanalyse mit Kundendaten:
  • Verwendung von Spark-Shell und SparkSQL, um Kundendaten wie Vertragsdetails, Abrechnungsinformationen, Kundensupport-Interaktionen usw. zu analysieren.
  • Ausführung von grundlegenden Abfragen und Filtern, um Erkenntnisse über die Daten zu gewinnen.
Fortgeschrittene Spark-Konzepte:
  • Vorstellung von RDDs (Resilient Distributed Datasets).
  • Vorstellung von Transformationen und Aktionen auf RDDs.
  • Einführung in Spark Streaming.
  • Einführung in Machine Learning mit Spark MLlib.
Übung: Erstellung von RDDs und Durchführung von Transformationen und Aktionen auf Kundendaten für Machine Learning:
  • Erstellung von RDDs aus Kundendaten.
  • Durchführung von Transformationen und Aktionen auf den RDDs zur Vorverarbeitung der Daten für Machine Learning.
  • Verwendung von MLlib für Machine-Learning-Modelltraining auf den vorverarbeiteten Daten.
Spark in der Praxis:
  • Best Practices für Spark-Entwicklung, einschließlich der Erstellung effizienter und skalierbarer Spark-Anwendungen.
  • Fehlerbehebung und Optimierung von Spark-Anwendungen.
  • Verwendung von Spark auf AWS, Azure und Google Cloud.
Übung: Erstellung einer Spark-Anwendung für Machine Learning zur Vorhersage von Kundenabwanderung auf einer Cluster-Umgebung:
  • Erstellung einer voll funktionsfähigen Spark-Anwendung zur Vorhersage von Kundenabwanderung auf einer Cluster-Umgebung.
  • Optimierung der Anwendung für die effiziente Verarbeitung großer Kundendatenmengen.
  • Durchführung von Machine-Learning-Vorhersagen auf den Kundendaten und Analyse der Vorhersageergebnisse.

Am Ende des dreitägigen Workshops haben die Teilnehmer eine solide Kenntnis von Apache Spark und Machine Learning mit Spark MLlib erworben. Sie haben auch eine voll funktionsfähige Spark-Anwendung erstellt, die in der Lage ist, Kundenabwanderung vorherzusagen. Die Teilnehmer sind nun in der Lage, ihre neuen Fähigkeiten in der Praxis anzuwenden und die Vorteile von Apache Spark bei der Verarbeitung großer Datenmengen zu nutzen.

Buchungsmöglichkeiten

Teilnahme auch online möglich

Auf Wunsch können unsere Seminare auch als Online Seminar (Virtual Classroom) gebucht oder angefragt werden. Klicken Sie einfach bei Ihrer Buchung oder Anfrage die entsprechende Option an.

Inhouse-/Firmenschulung

Inhalte werden auf Wunsch an die Anforderungen Ihres Teams angepasst.

Individualschulung

Fokus aufs Fachliche und maximaler Raum für individuelle Fragen.

So haben GFU-Kunden gestimmt

Zu diesem Seminar wurden noch keine Bewertungen abgegeben.

FAQ für Inhouse Schulungen

Bei einer offenen Schulung stehen Ort und Termin vorab fest. Jeder Interessent kann eine offene Schulung buchen, daher treffen Teilnehmer aus verschiedenen Unternehmen aufeinander.

Inhouse Schulungen können auf Ihren individuellen Schulungsbedarf zugeschnitten werden. Sie bestimmen den Teilnehmerkreis, Termin und Schulungsort.

Bei einer Inhouse Schulung gehen wir auf die individuellen Bedürfnisse Ihres Unternehmens ein und decken den Schulungsbedarf direkt bei Ihnen im Unternehmen ab.

Das spart Zeit und Geld und sorgt für einen schnellen Wissenstransfer Ihrer Mitarbeiter.

Eine komplette Lernumgebung in der Cloud mit Remote Zugriff ist für uns selbstverständlich. Sie müssen sich um nichts kümmern. Lediglich ein funktionierender PC oder Notebook mit Internetanschluss sollte für jeden Teilnehmer am Schulungstag bereit stehen.

  • Kompetente Seminarberatung
  • Dozenten aus der Praxis
  • Auf Ihre Bedürfnisse zugeschnittener individueller Lernstoff
  • Sie können den Termin flexibel gestalten, so wie es für Sie am besten passt
  • Unsere Inhouse Schulungen können Europaweit durchgeführt werden
  • Der Fokus liegt auf Ihrem Schulungsbedarf, somit schonen Sie Ihr Budget
  • Wissenslücken Ihrer Mitarbeitet werden schnell geschlossen
116.495
TEILNEHMENDE
2.083
SEMINARTHEMEN
29.466
DURCHGEFÜHRTE SEMINARE
aegallianzaxabayerElement 1boschdeutsche-bankdeutsche-postdouglasfordfujitsuhenkelhermeslufthansamercedesnokiasonytelekomvwzdf