germanyuksettings

Schulung Apache Spark Basics

2 Tage / S2973

Schulungsformen

Offene Schulung


Inhouse-/Firmenschulung

  • 2 Tage - anpassbar
  • Termin nach Wunsch
  • Preis nach Angebot
  • In Ihrem Hause oder bei der GFU

Individualschulung

  • 2 Tage - anpassbar
  • Termin nach Wunsch
  • Preis nach Angebot
  • In Ihrem Hause oder bei der GFU

Beschreibung

The Apache Spark Basics course covers the fundamentals of Apache Spark using Python (PySpark). The course includes an introduction to Spark's architecture and components, such as the driver, executor, and cluster manager. It also explores Resilient Distributed Datasets (RDDs) and their operations.
Additionally, the course covers Spark Streaming, which enables real-time data processing. It introduces concepts like DStreams, windowed operations, and stateful processing.
Furthermore, the course includes integration topics, such as integrating Apache Flume and Apache Kafka with Spark for data ingestion and utilizing Apache Cassandra for data storage and retrieval.
Throughout the course, hands-on exercises and demonstrations are conducted to provide practical experience with PySpark and its various components.

Schulungsziel

The goal of the Apache Spark Basics course is to provide participants  with a solid understanding of Apache Spark and its fundamental concepts.  By the end of the course, participants should be able to understand the  challenges of big data processing and the advantages of Spark. They  will gain comprehension of Spark's architecture and its components, such  as the driver, executor, and cluster manager. Participants will also  learn how to work with Resilient Distributed Datasets (RDDs) and perform  various transformations and actions on them. Additionally, they will  acquire knowledge of Spark Streaming for real-time data processing and  gain the ability to integrate Spark with other technologies like Flume,  Kafka, and Cassandra. Through hands-on exercises using PySpark,  participants will develop practical skills and gain the confidence to  effectively utilize Apache Spark for big data processing and analytics  tasks.

Details

Wer teilnehmen sollte

  • Data Engineers: Data engineers responsible for processing and analyzing large datasets can benefit from learning Apache Spark to leverage its distributed computing capabilities.
  • Data Scientists: Data scientists looking to work with big data and perform advanced analytics can enhance their skills by gaining knowledge of Apache Spark and its machine learning library, MLlib.
  • Software Developers: Software developers interested in distributed computing and working with big data can expand their skill set by learning Apache Spark and PySpark.
  • Data Analysts: Data analysts who want to analyze and process large datasets efficiently can learn Apache Spark to improve their data processing workflows.
  • IT Professionals: IT professionals involved in managing big data infrastructure and processing can benefit from understanding Apache Spark's architecture and its integration with other technologies.

Ihre Schulung


Präsenz-Schulung

Online-Schulung
Lernmethode

Ausgewogene Mischung aus Theorie und Praxis

Wie auch bei unseren Präsenz-Seminaren: Ausgewogene Mischung aus Theorie und praktischen Übungen. Trainer durchgehend präsent.

Unterlagen

Seminarunterlagen oder Fachbuch zum Seminar inklusive, das man nach Rücksprache mit dem Trainer individuell auswählen kann.

Seminarunterlagen oder Fachbuch inklusive (per Post). Das Fachbuch wählt der Trainer passend zum Seminar aus - Ihren individuellen Buch-Wunsch berücksichtigen wir auf Nachfrage gerne.

Arbeitsplatz
PC/VMs für jeden Teilnehmenden
Hochwertige und performante Hardware
Große, höhenverstellbare Bildschirme
Zugang zu Ihrem Firmennetz erlaubt
  • Online Meeting + Remote Zugriff auf persönlichen GFU-Schulungs-PC
  • Keine Installation auf dem eigenen PC notwendig
Lernumgebung


Neu aufgesetzte Systeme für jeden Kurs in Abstimmung mit dem Seminarleiter.

Arbeitsmaterialien

DIN A4 Block, Notizblock, Kugelschreiber, USB-Stick, Textmarker, Post-its

Teilnahmebescheinigung

Die Teilnahmebescheinigung inkl. Inhaltsverzeichnis wird Ihnen am Ende des Seminars ausgehändigt.

Die Teilnahmebescheinigung inkl. Inhaltsverzeichnis wird Ihnen per Post zugesandt.


Präsenz-Schulung

Online-Schulung
Teilnehmendenzahl

min. 1, max. 8 Personen

Garantierte Durchführung

Ab 1 Teilnehmenden*

Schulungszeiten
2 Tage, 09:00 - 16:00 Uhr
Ort der Schulung
GFU Schulungszentrum oder Virtual Classroom
GFU Schulungszentrum
Am Grauen Stein 27
51105 Köln-Deutz

oder online im Virtual Classroom oder europaweit bei Ihnen als Inhouse-Schulung

Das Hygienekonzept wurde mit professioneller Hilfe umgesetzt und mit der zuständigen Behörde abgestimmt. Gerne stellen wir Ihnen dieses zur Verfügung. Darüber hinaus haben wir zu Ihrer Sicherheit das Schulungszentrum mit insgesamt 17 Trotec TAC V+ Hochleistungsluftreinigern ausgestattet. Durch die neuartig entwickelte Filtertechnik (H14 zertifiziert nach DIN EN1822) wird die Raumluft mehrfach stündlich umgewälzt und infektiöse Aerosole im HEPA-Virenfilter zu 99.995% abgeschieden und abgetötet. Zusätzlich sind alle Räume mit CO2 Ampeln ausgestattet, wir stellen Ihnen gerne zertifizierte FFP2 Masken zur Verfügung.

Räumlichkeiten

Helle und modern ausgestattete Räume mit perfekter Infrastruktur

Bequem aus dem Homeoffice von überall

Preisvorteil

Dritter Mitarbeitende nimmt kostenfrei teil.

Eventuell anfallende Prüfungskosten für den dritten Teilnehmenden werden zusätzlich berechnet.

Hinweis: Um den Erfolg der Schulung zu gewährleisten, sollte auch der dritte Teilnehmende die erwarteten Vorkenntnisse mitbringen.

All-Inclusive

Gebäck, Snacks und Getränke ganztägig, Mittagessen im eigenen Restaurant, täglich 6 Menüs, auch vegetarisch

Eine Auswahl unserer Frühstücks-Snacks und Nervennahrungs-Highlights senden wir Ihnen mit den Seminarunterlagen per Post zu.

Barrierefreiheit

Das GFU-Schulungszentrum (Am Grauen Stein 27) ist barrierefrei

-
Rechnungsstellung

Erst nach dem erfolgreichen Seminar. Keine Vorkasse.

Stornierung

Kostenfrei bis zum Vortag des Seminars

Vormerken statt buchen

Sichern Sie sich unverbindlich Ihren Seminarplatz schon vor der Buchung - auch wenn Sie selbst nicht berechtigt sind zu buchen


Präsenz-Schulung

Online-Schulung
  • Eigener Shuttle-Service
  • Reservierte Parkplätze
  • Hotelreservierung
  • Technik-Sofort-Support

Inhalt

  • Introduction to Apache Spark with Python (PySpark)
    • Overview of big data processing challenges
    • Introduction to distributed computing and parallel processing
    • Introduction to Spark's architecture and components (driver, executor, cluster manager)
    • Comparison with traditional batch processing frameworks (Hadoop MapReduce)
    • Setting up Spark with Python-Shell
  • Spark Fundamentals with PySpark
    • Understanding Resilient Distributed Datasets (RDDs)
      • RDD characteristics (immutable, partitioned, resilient)
      • RDD operations: transformations (map, filter, flatMap, etc.) and actions (count, collect, reduce, etc.)
      • Lazy evaluation and lineage in Spark
    • Hands-on exercises using PySpark
  • Spark Streaming
    • Introduction to Spark Streaming
    • Streaming data processing concepts
    • DStream (Discretized Stream) operations in Spark Streaming
      • Windowed operations
      • Stateful processing using updateStateByKey()
    • Handling data sources (Flume, Kafka) and sinks (HDFS, Cassandra) in Spark Streaming
    • Hands-on exercises with Spark Streaming
  • Integration with Flume, Kafka, and Cassandra
    • Introduction to Apache Flume and its integration with Spark
      • Overview of Flume's event-based data ingestion
      • Setting up Flume agents and Spark integration
    • Integration of Apache Kafka with Spark Streaming
      • Overview of Kafka's distributed publish-subscribe messaging system
      • Configuring Kafka and Spark integration for real-time data processing
    • Introduction to Apache Cassandra and its integration with Spark
      • Overview of Cassandra's distributed NoSQL database
      • Connecting Spark to Cassandra for data storage and retrieval

Buchungsmöglichkeiten

Online oder in Präsenz teilnehmen

Sie können sowohl Online als auch in Präsenz am Seminar teilnehmen. Klicken Sie bei Ihrer Buchung oder Anfrage einfach die entsprechende Option an.

Weiterbildung Apache Spark Basics

TerminOrtPreis
19.08.-20.08.2024
Plätze vorhanden
Köln / Online 1.370,00
Köln / Online 1.370,00 Buchen Vormerken
21.10.-22.10.2024
Plätze vorhanden
Köln / Online 1.370,00
Köln / Online 1.370,00 Buchen Vormerken
02.01.-03.01.2025
Plätze vorhanden
Köln / Online 1.370,00
Köln / Online 1.370,00 Buchen Vormerken
03.03.-04.03.2025
Plätze vorhanden
Köln / Online 1.370,00
Köln / Online 1.370,00 Buchen Vormerken
05.05.-06.05.2025
Plätze vorhanden
Köln / Online 1.370,00
Köln / Online 1.370,00 Buchen Vormerken
  • Buchen ohne Risiko
  • Keine Vorkasse
  • Kostenfreies Storno bis zum Vortag des Seminars
  • Rechnung nach erfolgreichem Seminar
  • All-Inclusive-Preis
  • Garantierter Termin und Veranstaltungsort
  • Preise pro Person zzgl. Mehrwertsteuer
  • Dritter Mitarbeitende kostenfrei

Inhouse-/Firmenschulung

Inhalte werden auf Wunsch an die Anforderungen Ihres Teams angepasst.

Individualschulung

Fokus aufs Fachliche und maximaler Raum für individuelle Fragen.

Nachbetreuung

Unterstützung nach der Schulung durch
individuelle Nachbetreuung

Details & Anfrage

So haben GFU-Kunden gestimmt

Zu diesem Seminar wurden noch keine Bewertungen abgegeben.

FAQ für Offene Schulungen
  • Alle folgenden Schulungsformen können auch Online als Virtual Classroom durchgeführt werden.
  • Eine Offene Schulung findet zu einem festgelegten Zeitpunkt im voll ausgestatteten Schulungszentrum oder Online/Remote statt. Sie treffen auf Teilnehmende anderer Unternehmen und profitieren vom direkten Wissensaustausch.
  • Eine Inhouse-/Firmen-Schulung geht auf die individuellen Bedürfnisse Ihres Unternehmens ein. Sie erhalten eine kostenfreie Beratung von Ihrem Seminarleiter und können Inhalte und Dauer auf Ihren Schulungsbedarf anpassen. Inhouse-Schulungen können Europaweit durchgeführt werden.
  • Bei einer Individual-Schulung erhalten Sie eine 1-zu-1 Betreuung und bestimmen Inhalt, Zeit und Lerntempo. Der Dozent passt sich Ihren Wünschen und Bedürfnissen an.

Sie können unsere Schulungen auch als Remote Schulung im Virtual Classroom anfragen.

In drei Schritten zum Online Seminar im Virtual Classroom:

  1. Seminar auswählen und auf "Buchen" klicken
  2. Wählen Sie bei "Wie möchten Sie teilnehmen?" einfach "Online" aus.
  3. Formular ausfüllen und über den Button "Jetzt buchen" absenden.

Unser Kundenservice meldet sich bei Ihnen mit der Buchungsbestätigung.

Unsere Online Schulungen finden im Virtual Classroom statt. Ein Virtual Classroom bündelt mehrere Werkzeuge, wie Audio-Konferenz, Text-Chat, Interaktives Whiteboard, oder Application Sharing.

Vorteile von Virtual Classroom:

  • Sie erhalten 1 zu 1 die gleiche Lernumgebung, die Sie auch vor Ort bei uns vorfinden
  • Die technische Vorbereitung wird von den GFU-Technikern vorgenommen
  • Sie erhalten remote Zugriff auf Ihren persönlichen Schulungs-PC im GFU-Seminarraum
  • Die Virtual Classroom Lösung lässt sich auch im Browser betreiben
  • Die GFU-Technik leistet wie gewohnt Soforthilfe bei Problemen
  • Die Schulungsunterlagen bekommen Sie per Post zugeschickt
  • Sie sparen Reisekosten und Zeit
  • 19. Aug. - 20. Aug. ✓ Noch einige Plätze frei ▶ Köln + Online/Remote
  • 21. Okt. - 22. Okt. ✓ Noch einige Plätze frei ▶ Köln + Online/Remote
  • 02. Jan. - 03. Jan. ✓ Noch einige Plätze frei ▶ Köln + Online/Remote
  • 03. Mär. - 04. Mär. ✓ Noch einige Plätze frei ▶ Köln + Online/Remote
  • 05. Mai - 06. Mai ✓ Noch einige Plätze frei ▶ Köln + Online/Remote
  • Auch als Inhouse-Schulung, bundesweit mit Termin nach Wunsch und individuellen Inhalten
  • Buchen ohne Risiko! Kostenfreie Stornierung bis zum Vortag des Seminars
Das GFU-Sorglos-Paket

Buchen Sie diese kostenfreien Serviceleistungen für Präsenzseminare ganz einfach während des Buchungsprozesses dazu!

Shuttle Service
Shuttle Service

Machen Sie sich keinen Kopf um die Anreise! Unser Shuttle fährt Sie. Oder Sie parken einfach auf einem extra für Sie reservierten Parkplatz.

Hotelreservierung
Hotelreservierung

Hotelzimmer gesucht? Wir organisieren Ihnen eins. Ihr Vorteil: Sie sparen Zeit und Geld!

Verpflegung
Verpflegung

Gesund oder lecker? Warum nicht beides? Freuen Sie sich auf unsere kulinarische Verpflegung!

Parkplätze
Parkplätze

Parkplätze sind in ausreichender Zahl vorhanden. Reisen Sie mit dem Auto an, reservieren wir Ihnen einen Parkplatz.

129.412
TEILNEHMENDE
2.561
SEMINARTHEMEN
32.039
DURCHGEFÜHRTE SEMINARE
aegallianzaxabayerElement 1boschdeutsche-bankdeutsche-postdouglasfordfujitsuhenkelhermeslufthansamercedesnokiasonytelekomvwzdf