Schulung Kompakte Einführung in die Datenanalyse mit R

Schulungsformen

Inhouse-/Firmenschulung

2 Tage - anpassbar
Termin nach Wunsch
Preis nach Angebot
In Ihrem Hause oder bei der GFU

Online, Präsenz oder Hybrid
Lernumgebung in der Cloud

Inhalte werden auf Wunsch an die Anforderungen Ihres Teams angepasst.

Unverbindlich anfragen

Individualschulung

2 Tage - anpassbar
Termin nach Wunsch
Preis nach Angebot
In Ihrem Hause oder bei der GFU

Online, Präsenz oder Hybrid
Lernumgebung in der Cloud

1 Teilnehmer = max. Fokus aufs Fachliche und max. Raum für individuelle Fragen.

Unverbindlich anfragen

Beschreibung

R ist mit über zwei Millionen Nutzern weltweit eine der meistverwendeten Programmiersprachen im data science und data mining. Als eine der de-facto data science Programmiersprachen (neben Python) bieten viele Software Anbieter Schnittstellen zu R an. Die meistgenutzte Entwicklungsumgebung RStudio wird auch in diesem Seminar benutzt. Sie erhalten einen Einblick in die grundlegende Struktur von R, das Einlesen von Daten aus verschiedenen Formaten, die Aufbereitung von Daten und die Visualisierung der Daten anhand eines durchgehenden Fallbeispiels. Es werden die bekannten Bibliotheken data.table und ggplot2 benutzt, welche unter data scientists sehr beliebt sind. Der Schwerpunkt am zweiten Tag liegt auf den bekanntesten Machine Learning Algorithmen im Data Science, welche in der Theorie erklärt und mit R umgesetzt werden. Der Abschluss bildet eine Data Mining Aufgabe, anhand derer Sie Ihre erste Datenanalyse unter Begleitung des Trainers üben können.

Auf der Suche nach einer anderen R Weiterbildung?

Schulungsziel

Sie können grundlegende Schritte mit R und RStudio im Bereich Data Science anwenden, so dass ein selbstständiges Arbeiten als data scientist möglich ist. Sie kennen die Konzepte von R und können Ihre eigene erste Datenanalyse durchführen. Wege, um weitergehende Algorithmen und Methoden in R zu finden sind bekannt, um das Wissen auch nach dem Seminar weiter ausbauen zu können. Sie haben einen Überblick über verwendete Algorithmen im Machine Learning und können diese voneinander differenzieren und in R anwenden. Sie arbeiten überwiegend selbstständig mit Unterstützung des Trainers, um das Erlernte direkt umzusetzen und anzuwenden. Anhand eines durchgehenden Datenbeispiels werden die wichtigsten Bibliotheken besprochen und in umfangreichen Übungen trainiert.

Details

Inhalt Wer teilnehmen sollte Ihre Schulung Organisation Buchen ohne Risko Kostenfreie Services

Wer teilnehmen sollte

Technisch interessierte Fachkräfte bzw. Projektleiter, angehende data scientists und Datenanalysten, welche einen Einstieg in die Programmiersprache R wünschen, um eigenständig an Data Science Projekten mitzuarbeiten oder ein besseres Verständnis für R Code zu erhalten. Die Teilnehmer benötigen keine Erfahrung mit R, sollten aber schon grundlegende Erfahrung mit einer Programmiersprache gehabt haben, um das Grundkonzept einer Programmiersprache zu verstehen. Überdies ist ein Basiswissen von grundlegenden statistischen Begriffen hilfreich (wie Mittelwert, Median, Perzentil, lineare Regression).

Ihre Schulung

Präsenz-Schulung	Online-Schulung
Lernmethode
Ausgewogene Mischung aus Theorie und Praxis	Wie auch bei unseren Präsenz-Seminaren: Ausgewogene Mischung aus Theorie und praktischen Übungen. Trainer durchgehend präsent.
Unterlagen
Seminarunterlagen oder Fachbuch inklusive. Das Fachbuch wählt der Trainer passend zum Seminar aus - Ihren individuellen Buch-Wunsch berücksichtigen wir auf Nachfrage gerne.	Seminarunterlagen oder Fachbuch inklusive (per Post). Das Fachbuch wählt der Trainer passend zum Seminar aus - Ihren individuellen Buch-Wunsch berücksichtigen wir auf Nachfrage gerne.
Arbeitsplatz
PC/VMs für alle Teilnehmenden Hochwertige und performante Hardware Große, höhenverstellbare Bildschirme Zugang zu Ihrem Firmennetz erlaubt 86-90 Zoll Bildschirm für perfekte Präsentationen in jedem Schulungsraum	Online Meeting + Remote Zugriff auf persönlichen GFU-Schulungs-PC Keine Installation auf dem eigenem PC notwendig
Lernumgebung
Neu aufgesetzte Remote-Systeme für jeden Kurs in Abstimmung mit dem Seminarleiter, sodass Sie über ein perfektes Setup für die Durchführung aller praktischen Übungen verfügen.
Arbeitsmaterialien
Din A4 Block, Notizblock, Kugelschreiber, USB-Stick, Textmarker, Post-its
Teilnahmebescheinigung
Die Teilnahmebescheinigung inkl. Inhaltsverzeichnis wird Ihnen am Ende des Seminars ausgehändigt.	Die Teilnahmebescheinigung inkl. Inhaltsverzeichnis wird Ihnen per Post zugesandt.

Organisation

Präsenz-Schulung

Online-Schulung

Teilnehmendenzahl

min. 1, max. 8 Personen

Garantierte Durchführung *

Ab 1 Teilnehmenden

Schulungszeiten

2 Tage, 09:00 - 16:00 Uhr

Ort der Schulung

GFU Schulungszentrum oder Virtual Classroom

GFU Schulungszentrum
Am Grauen Stein 27
51105 Köln-Deutz

oder online im Virtual Classroom oder europaweit bei Ihnen als Inhouse-Schulung

Das Hygienekonzept wurde mit professioneller Hilfe umgesetzt und mit der zuständigen Behörde abgestimmt. Gerne stellen wir Ihnen dieses zur Verfügung. Darüber hinaus haben wir zu Ihrer Sicherheit das Schulungszentrum mit insgesamt 17 Trotec TAC V+ Hochleistungsluftreinigern ausgestattet. Durch die neuartig entwickelte Filtertechnik (H14 zertifiziert nach DIN EN1822) wird die Raumluft mehrfach stündlich umgewälzt und infektiöse Aerosole im HEPA-Virenfilter zu 99.995% abgeschieden und abgetötet. Zusätzlich sind alle Räume mit CO2 Ampeln ausgestattet, wir stellen Ihnen gerne zertifizierte FFP2 Masken zur Verfügung.

Räumlichkeiten

Helle und modern ausgestattete Räume mit perfekter Infrastruktur

Bequem aus dem Homeoffice von überall

All-Inclusive

Frühstück, Snacks und Getränke ganztägig, Mittagessen im eigenen Restaurant, täglich 6 Menüs, auch vegetarisch

Eine Auswahl unserer Frühstücks-Snacks und Nervennahrungs-Highlights senden wir Ihnen mit den Seminarunterlagen per Post zu.

Barrierefreiheit

Das GFU-Schulungszentrum (Am Grauen Stein 27) ist barrierefrei

Kostenfreie Services

Präsenz-Schulung	Online-Schulung
Eigener Shuttle-Service Reservierte Parkplätze Hotelreservierung	Technik-Sofort-Support

Inhalt

Einführung
- Hintergrund zu R und RStudio
- Installieren von neuen Paketen und die Paketumgebung CRAN
- Lizenzinformationen
- Aspekte von R, die anders als in anderen Programmiersprachen sind
Einführung in das Data Science Paket data.table
- Aufbau eines data.table und Ähnlichkeit zu SQL-Abfragen
- Verschiedene Möglichkeiten, Zeilen und Spalten zu extrahieren
- Möglichkeiten, auf Spalten direkt Berechnungen durchzuführen
- Abfragen nach Variablen gruppieren
Daten einlesen
- Das Arbeitsverzeichnis in R und RStudio setzen
- Ein CSV bzw. Excel Datei einlesen und schreiben und Überblick über die nützlichsten Parameter
- Eine SPSS Datei einlesen und schreiben
- Die fread() Funktion, um effizient große Datenmengen einzulesen
- Daten binär in .RData speichern und laden
- Abfragen aus einer Datenbank (SQLite)
Data handling in einem data.table
- Der := Operator in data.table
- Ersetzen von fehlenden Werten
- Eine Spalte erzeugen, löschen, ändern
- Zwischen Datentypen konvertieren
- lapply() und die Anwendung in einem data.table (mit .SD und .SDcols)
Visualisierung mit ggplot2
- Die Idee hinter der Grammar of Graphics
- Aesthethics layer und geometries layer zur Erstellung erster Plots (boxplots, scatter plots, bar plots, Kerndichteschätzer, Histogramme, Linienplot)
- Statistics layer, um Statistiken durch ggplot2 zu plotten
- Aspekte der Darstellung (Größe der Datenpunkte, Farbe, Gruppierung) mit einer Variable steuern oder fest angeben
- Faceting - Mehrere Subplots erstellen, welche nach einer Kategorie geteilt sind
- Speichern der Plots
Algorithmen im Data Science (theoretischer Überblick)
- Big Data und die vier Vs von Big data
- Was ist Machine Learning
- Die Einteilung von Algorithmen im Machine Learning (supervised Learning - unsupervised learning - reinforcement learning)
- Einführung in wichtige Algorithmen: Lineare Regression, Logistische Regression, Entscheidungsbäume, Random Forest, Support Vector Machine (SVM), K-means, Kerndichteschätzer
- Overfitten und wie ich es entdecken und vermeiden kann
- Kreuzvalidierung, confusion matrix, ROC Kurve
Algorithmen im Data Science (in der Praxis)
- Die Schritte beim Modellieren (Aufteilung der Daten in Test-Train, Model erstellen, Model validieren)
- Praktische Umsetzung der theoretisch behandelten Algorithmen in R
- Trainieren und Validieren von verschiedenen Algorithmen (Lineare Regression, Logistische Regression, Entscheidungsbäume, Random Forest, Support Vector Machine (SVM), K-means, Kerndichteschätzer)
- Auswertung der Modellgüte auf dem Testdatensatz
- Eine ROC Kurve plotten
Finaler use case zur Wiederholung des Gelernten
- Abgeschlossenes Projekt, indem die wichtigsten Schritte wiederholt werden können vom Daten Einlesen, Daten handling, über Visualisierung und Erstellen und Vergleich von Machine Learning Algorithmen

Buchungsmöglichkeiten

Online oder in Präsenz teilnehmen

Sie können sowohl Online als auch in Präsenz am Seminar teilnehmen. Klicken Sie bei Ihrer Buchung oder Anfrage einfach die entsprechende Option an.

Mehr Infos

Inhouse-/Firmenschulung

Inhalte werden auf Wunsch an die Anforderungen Ihres Teams angepasst.

Online, Präsenz oder Hybrid
Komplette Lernumgebung in der Cloud mit Remote Zugriff

Unverbindlich anfragen

Individualschulung

Fokus aufs Fachliche und maximaler Raum für individuelle Fragen.

Online, Präsenz oder Hybrid
Komplette Lernumgebung in der Cloud mit Remote Zugriff

Unverbindlich anfragen

FAQ für Inhouse Schulungen

Was bedeutet Offene Schulung und Inhouse Schulung?

Bei einer offenen Schulung stehen Ort und Termin vorab fest. Jeder Interessent kann eine offene Schulung buchen, daher treffen Teilnehmer aus verschiedenen Unternehmen aufeinander.

Inhouse Schulungen können auf Ihren individuellen Schulungsbedarf zugeschnitten werden. Sie bestimmen den Teilnehmerkreis, Termin und Schulungsort.

Ist eine Inhouse Schulung die richtige Wahl?

Bei einer Inhouse Schulung gehen wir auf die individuellen Bedürfnisse Ihres Unternehmens ein und decken den Schulungsbedarf direkt bei Ihnen im Unternehmen ab.

Das spart Zeit und Geld und sorgt für einen schnellen Wissenstransfer Ihrer Mitarbeiter.

Wer kümmert sich um die Technik bei Inhouse Schulungen?

Eine komplette Lernumgebung in der Cloud mit Remote Zugriff ist für uns selbstverständlich. Sie müssen sich um nichts kümmern. Lediglich ein funktionierender PC oder Notebook mit Internetanschluss sollte für jeden Teilnehmer am Schulungstag bereit stehen.

Vorteile einer Inhouse Schulung

Kompetente Seminarberatung
Dozenten aus der Praxis
Auf Ihre Bedürfnisse zugeschnittener individueller Lernstoff
Sie können den Termin flexibel gestalten, so wie es für Sie am besten passt
Unsere Inhouse Schulungen können Europaweit durchgeführt werden
Der Fokus liegt auf Ihrem Schulungsbedarf, somit schonen Sie Ihr Budget
Wissenslücken Ihrer Mitarbeitet werden schnell geschlossen

Schulung Kompakte Einführung in die Datenanalyse mit R - für angehende data scientists

Schulungsformen

Inhouse-/Firmenschulung

Individualschulung

Beschreibung

Schulungsziel

Details

Wer teilnehmen sollte

Ihre Schulung

Organisation

Kostenfreie Services

Inhalt

Buchungsmöglichkeiten

Online oder in Präsenz teilnehmen

Inhouse-/Firmenschulung

Individualschulung

So haben GFU-Kunden gestimmt

Was bedeutet Offene Schulung und Inhouse Schulung?

Ist eine Inhouse Schulung die richtige Wahl?

Wer kümmert sich um die Technik bei Inhouse Schulungen?

Vorteile einer Inhouse Schulung

Verwandte Seminare