PDF-Download

Schulung Kompakte Einführung in die Datenanalyse mit R - für angehende data scientists (S1962)

6 Teilnehmer haben bisher dieses Seminar besucht
R ist mit über zwei Millionen Nutzern weltweit eine der meistverwendeten Programmiersprachen im data science und data mining. Als eine der de-facto data science Programmiersprachen (neben Python) bieten viele Software Anbieter Schnittstellen zu R an. Die meistgenutzte Entwicklungsumgebung RStudio wird auch in diesem Seminar benutzt. Sie erhalten einen Einblick in die grundlegende Struktur von R, das Einlesen von Daten aus verschiedenen Formaten, die Aufbereitung von Daten und die Visualisierung der Daten anhand eines durchgehenden Fallbeispiels. Es werden die bekannten Bibliotheken data.table und ggplot2 benutzt, welche unter data scientists sehr beliebt sind. Der Schwerpunkt am zweiten Tag liegt auf den bekanntesten Machine Learning Algorithmen im Data Science, welche in der Theorie erklärt und mit R umgesetzt werden. Der Abschluss bildet eine Data Mining Aufgabe, anhand derer Sie Ihre erste Datenanalyse unter Begleitung des Trainers üben können.

Offene Termine

20.09.-21.09.2018
2 Tage | 1.240,00
Köln   
Noch frei
Buchen Vormerken
14.02.-15.02.2019
2 Tage | 1.240,00
Köln   
Noch frei
Buchen Vormerken
27.05.-28.05.2019
2 Tage | 1.240,00
Köln   
Noch frei
Buchen Vormerken
02.09.-03.09.2019
2 Tage | 1.240,00
Köln   
Noch frei
Kein passender Termin? Termin
vorschlagen
1 weitere Termine weniger Termine
Buchen ohne Risiko:
  • Keine Vorkasse
  • Kostenfreies Storno bis zum Vortag des Seminars
  • Rechnung nach erfolgreichem Seminar
  • Garantierter Termin und Veranstaltungsort
  • Preise pro Person zzgl. Mehrwertsteuer
  • Der dritte Mitarbeiter nimmt kostenfrei teil

Weitere Buchungsmöglichkeiten

Firmenschulung
GFU Schulungszentrum
Anfragen
Inhouse-Schulung
Auswählen
Wo soll Ihre Schulung stattfinden?
  • Europaweit
  • GFU Schulungszentrum
  • Berlin
  • Bremen
  • Düsseldorf
  • Dortmund
  • Dresden
  • Frankfurt
  • Hamburg
  • Hannover
  • Köln
  • Leipzig
  • Mannheim
  • München
  • Nürnberg
  • Stuttgart
Weiterer Ort:
Anfragen
Individualschulung
Auswählen
Wo soll Ihre Schulung stattfinden?
  • Europaweit
  • GFU Schulungszentrum
  • Berlin
  • Bremen
  • Düsseldorf
  • Dortmund
  • Dresden
  • Frankfurt
  • Hamburg
  • Hannover
  • Köln
  • Leipzig
  • Mannheim
  • München
  • Nürnberg
  • Stuttgart
Weiterer Ort:
Anfragen

Schulungs-Ziel

Sie können grundlegende Schritte mit R und RStudio im Bereich Data Science anwenden, so dass ein selbstständiges Arbeiten als data scientist möglich ist. Sie kennen die Konzepte von R und können Ihre eigene erste Datenanalyse durchführen. Wege, um weitergehende Algorithmen und Methoden in R zu finden sind bekannt, um das Wissen auch nach dem Seminar weiter ausbauen zu können. Sie haben einen Überblick über verwendete Algorithmen im Machine Learning und können diese voneinander differenzieren und in R anwenden. Sie arbeiten überwiegend selbstständig mit Unterstützung des Trainers, um das Erlernte direkt umzusetzen und anzuwenden. Anhand eines durchgehenden Datenbeispiels werden die wichtigsten Bibliotheken besprochen und in umfangreichen Übungen trainiert. 

Wer sollte teilnehmen

Technisch interessierte Fachkräfte bzw. Projektleiter, angehende data scientists und Datenanalysten, welche einen Einstieg in die Programmiersprache R wünschen, um eigenständig an Data Science Projekten mitzuarbeiten oder ein besseres Verständnis für R Code zu erhalten. Die Teilnehmer benötigen keine Erfahrung mit R, sollten aber schon grundlegende Erfahrung mit einer Programmiersprache gehabt haben, um das Grundkonzept einer Programmiersprache zu verstehen. Überdies ist ein Basiswissen von grundlegenden statistischen Begriffen hilfreich (wie Mittelwert, Median, Perzentil, lineare Regression).

Inhalt

  • Einführung
    • Hintergrund zu R und RStudio
    • Installieren von neuen Paketen und die Paketumgebung CRAN
    • Lizenzinformationen
    • Aspekte von R, die anders als in anderen Programmiersprachen sind
  • Einführung in das Data Science Paket data.table
    • Aufbau eines data.table und Ähnlichkeit zu SQL-Abfragen
    • Verschiedene Möglichkeiten, Zeilen und Spalten zu extrahieren
    • Möglichkeiten, auf Spalten direkt Berechnungen durchzuführen
    • Abfragen nach Variablen gruppieren 
  • Daten einlesen 
    • Das Arbeitsverzeichnis in R und RStudio setzen 
    • Ein CSV bzw. Excel Datei einlesen und schreiben und Überblick über die nützlichsten Parameter 
    • Eine SPSS Datei einlesen und schreiben 
    • Die fread() Funktion, um effizient große Datenmengen einzulesen
    • Daten binär in .RData speichern und laden 
    • Abfragen aus einer Datenbank (SQLite)
  • Data handling in einem data.table
    • Der := Operator in data.table 
    • Ersetzen von fehlenden Werten
    • Eine Spalte erzeugen, löschen, ändern
    • Zwischen Datentypen konvertieren
    • lapply() und die Anwendung in einem data.table (mit .SD und .SDcols)
  • Visualisierung mit ggplot2
    • Die Idee hinter der Grammar of Graphics 
    • Aesthethics layer und geometries layer zur Erstellung erster Plots (boxplots, scatter plots, bar plots, Kerndichteschätzer, Histogramme, Linienplot)
    • Statistics layer, um Statistiken durch ggplot2 zu plotten
    • Aspekte der Darstellung (Größe der Datenpunkte, Farbe, Gruppierung) mit einer Variable steuern oder fest angeben
    • Faceting - Mehrere Subplots erstellen, welche nach einer Kategorie geteilt sind
    • Speichern der Plots
  • Algorithmen im Data Science (theoretischer Überblick)
    • Big Data und die vier Vs von Big data
    • Was ist Machine Learning
    • Die Einteilung von Algorithmen im Machine Learning (supervised Learning - unsupervised learning - reinforcement learning)
    • Einführung in wichtige Algorithmen: Lineare Regression, Logistische Regression, Entscheidungsbäume, Random Forest, Support Vector Machine (SVM), K-means, Kerndichteschätzer
    • Overfitten und wie ich es entdecken und vermeiden kann
    • Kreuzvalidierung, confusion matrix, ROC Kurve
  • Algorithmen im Data Science (in der Praxis)
    • Die Schritte beim Modellieren (Aufteilung der Daten in Test-Train, Model erstellen, Model validieren)
    • Praktische Umsetzung der theoretisch behandelten Algorithmen in R
    • Trainieren und Validieren von verschiedenen Algorithmen (Lineare Regression, Logistische Regression, Entscheidungsbäume, Random Forest, Support Vector Machine (SVM), K-means, Kerndichteschätzer)
    • Auswertung der Modellgüte auf dem Testdatensatz
    • Eine ROC Kurve plotten
  • Finaler use case zur Wiederholung des Gelernten 
    • Abgeschlossenes Projekt, indem die wichtigsten Schritte wiederholt werden können vom Daten Einlesen, Daten handling, über Visualisierung und Erstellen und Vergleich von Machine Learning Algorithmen

Schulungszeiten und Teilnehmerzahl

Teilnehmerzahl:min. 1, max. 8 Personen

Schulungszeiten: 2 Tage, 1. Tag 10:00 - 17:00 Uhr, Folgetag 09:00 - 16:00 Uhr

Ort der Schulung: GFU-Schulungszentrum Köln oder bei Ihnen als Inhouse-Schulung

Offene Termine

20.09.-21.09.2018
2 Tage | 1.240,00
Köln   
Noch frei
Buchen Vormerken
14.02.-15.02.2019
2 Tage | 1.240,00
Köln   
Noch frei
Buchen Vormerken
27.05.-28.05.2019
2 Tage | 1.240,00
Köln   
Noch frei
Buchen Vormerken
02.09.-03.09.2019
2 Tage | 1.240,00
Köln   
Noch frei
Kein passender Termin? Termin
vorschlagen
1 weitere Termine weniger Termine
Buchen ohne Risiko:
  • Keine Vorkasse
  • Kostenfreies Storno bis zum Vortag des Seminars
  • Rechnung nach erfolgreichem Seminar
  • Garantierter Termin und Veranstaltungsort
  • Preise pro Person zzgl. Mehrwertsteuer
  • Der dritte Mitarbeiter nimmt kostenfrei teil

Weitere Buchungsmöglichkeiten

Firmenschulung
GFU Schulungszentrum
Anfragen
Inhouse-Schulung
Auswählen
Wo soll Ihre Schulung stattfinden?
  • Europaweit
  • GFU Schulungszentrum
  • Berlin
  • Bremen
  • Düsseldorf
  • Dortmund
  • Dresden
  • Frankfurt
  • Hamburg
  • Hannover
  • Köln
  • Leipzig
  • Mannheim
  • München
  • Nürnberg
  • Stuttgart
Weiterer Ort:
Anfragen
Individualschulung
Auswählen
Wo soll Ihre Schulung stattfinden?
  • Europaweit
  • GFU Schulungszentrum
  • Berlin
  • Bremen
  • Düsseldorf
  • Dortmund
  • Dresden
  • Frankfurt
  • Hamburg
  • Hannover
  • Köln
  • Leipzig
  • Mannheim
  • München
  • Nürnberg
  • Stuttgart
Weiterer Ort:
Anfragen


Ein Team einer Firma will zusammen das Seminar Kompakte Einführung in die Datenanalyse mit R - für angehende data scientists buchen

Dann kann ein kundenspezifisches Lehrgangssystem zum Gegenstand Kompakte Einführung in die Datenanalyse mit R - für angehende data scientists richtig sein. Der Unterrichtsstoff des Lehrgangs kann nebenbei bemerkt zusammen mit den Dozenten variiert oder reduziert werden.

Haben die Schulungsteilnehmer ohnehin Vorwissen in Kompakte Einführung in die Datenanalyse mit R - für angehende data scientists, sollte der Anfang nur gestreift werden. Eine kundenspezifische Bildungsmaßnahme rechnet sich ab drei Seminarbesuchern. Die Firmen-Schulungen zum Thema Kompakte Einführung in die Datenanalyse mit R - für angehende data scientists finden manchmal in der Nähe von Frankfurt, Bielefeld, Berlin, Essen, Dortmund, Duisburg, Hannover, Dÿsseldorf, Nÿrnberg, Mÿnchen, Bremen, Hamburg, Leipzig, Mÿnster, Wuppertal, Bonn, Dresden, Bochum, Stuttgart und Köln am Rhein in NRW statt.

Welche Thematiken erweitern Kompakte Einführung in die Datenanalyse mit R - für angehende data scientists?

Eine erste Ergänzung findet sich in Kompakte Einführung in die Datenanalyse mit R - für angehende data scientists mit

  • Was ist Machine Learning
  • Praktische Umsetzung der theoretisch behandelten Algorithmen in R
  • Speichern der Plots
  • Abfragen nach Variablen gruppieren 

Empfehlenswert ist auch ein Kurs von „Data Science Business Akademie: Grundlagenwoche mit Zertifizierung“ mit der Behandlung von

  • Data Science Methoden Supervised/Unsupervised Machine Learning
  • Implementierung unterschiedlicher Zielfunktionen
  • Nutzung im Unternehmen
  • Induktive Statistik und statistische Test-Verfahren

Für Firmenschulungen ist das Thema „Agile Vorgehensweise für Data Warehouse und BI-Projekte mit Scrum“ mit dem Unterrichtsgegenstand Optionale Themen Management mehrerer und verteilter Teams mit SCRUM und Artefakte: Product Backlog, Sprint Backlog, Burndown Chart, Definition of Done prädestiniert.

Für Help-Desk-Mitarbeiter passt auch eine Business Intelligence und Data Warehouse Grundlagen  Schulung. In diesem Workshop werden vor allen Dingen

  • Self-Service BI 
  • Multidimensionaler Entwurf 
  • Betrieb  Relevanz 
  • Grundlagen von Datenbankdesign- und modellierung  Begriffsklärung 
behandelt.

Haben Sie Fragen?
  • 0221 82 80 90
  • Chat offline
Empfangsdamen der GFU