Einführung in Data Mining mit R
Ziele
In dieser 3-tägigen Schulung "Einführung in Data Mining mit R" lernen Sie die Grundlagen und Anwendungsmöglichkeiten von R für Data Science. Wir werden die wichtigsten Datenstrukturen und Funktionen in R kennenlernen und uns mit der Datenmanipulation, Visualisierung und statistischen Analyse befassen. Außerdem werden wir uns mit Machine Learning-Algorithmen und deren Validierung beschäftigen. Die Schulung beinhaltet praktische Übungen, um das Gelernte anzuwenden. Am Ende der Schulung werden Sie in der Lage sein, Daten zu analysieren, Visualisierungen zu erstellen und einfache Machine Learning-Algorithmen anzuwenden.
Zielgruppe
Für eine optimale Teilnahme am Kurs empfehlen wir folgende Vorkenntnisse:
- Fach- und Führungskräfte aus dem Bereich Data Science
Voraussetzungen
- Grundlagenkennisse in Programmiersprachen oder VBA-Programmierung
- Grundlagenwissen in Statistik
Lernmethodik
Die Schulung bietet Ihnen eine ausgewogene Mischung aus Theorie und Praxis in einer erstklassigen Lernumgebung. Profitieren Sie vom direkten Austausch mit unseren projekterfahrenen Trainern und anderen Teilnehmern, um Ihren Lernerfolg zu maximieren.
Agenda
Warum ist R eine der meistverwendeten Data Science Programmiersprachen?
- Geschichte und Hintergrund von R
- Anwendungsmöglichkeiten und Einbindung von R
- Überblick über die wichtigsten data structures in R (vector, list, matrix, data frame, factors)
- Hands-On: Erste Schritte mit R
Data.table - Einführung (data.table)
- Einführung in die Besonderheit vom data.table Paket
- Erzeugen eines data.table
- Subsetting
- Indexierung
Daten einlesen und Schreiben (foreign)
- Welche Möglichkeiten gibt es, verschiedene Datenformate einzulesen?
- Einlesen und Schrieben in RData
- Einlesen und Schreiben aus anderen Formaten (xls, csv, dat,...)
Datenmanipulation (data.table)
- Manipulation auf einem data.table bei Zeilen und Spalten
- Zusammenfassen und Filtern von Daten
- Neue Variablen anhängen
- Fehlende Werte ersetzen
- Summary Funktionen
Grundlagen der Datenvisualisierung
- Struktur der Befehle bei der Benutzung von ggplot2
- Die Layer von ggplot2
- Einfache Plots (Scatter, Line, Boxplot, Kernel Density)
Grundlegende Statistiken und Tests (stats)
- Wichtige grundlegende Statistiken
- Korrelationen (Spearman, Pearson)
- Gebräuchliche Test (t-test, Kolmogorov-Smirnox,...)
- Erzeugen von Zufallszahlen aus verschiedenen Verteilungen
Fortgeschrittene Benutzung eines data.tables (data.table)
- Wichtige grundlegende Statistiken
- Korrelationen (Spearman, Pearson)
- Gebräuchliche Tests (t-test, Kolmogorov)
Control Flows
- Control Flows in R
- If und if-else
- For Schleifen
- Eine eigene Funktion schreiben
Die Mächtigkeit von Machine Learning Algorithmen
- Technischer Überblick über Machine Learning Algorithmen (supervised, unsupervised)
- Vertiefung einzelner ML Algorithmen
- Validierungsmöglichkeiten: Wie bestimme ich die Generalisierung meiner Lösung?
Hands-On: Algorithmen mit R
- Einführung wie Algorithmen in R verwendet werden
- Hands-On: Eigenständiges Arbeiten, um verschiedene Algorithmen zu testen und zu validieren
Hands-On: Fallbeispiel
- Eigenständiges Arbeiten, um das bisher gelernte anhand eines Fallbeispiels anzuwenden
Open Badge - Ihr digitaler Kompetenznachweis
Durch die erfolgreiche Teilnahme an einem Kurs bei IT-Schulungen.com erlangen Sie nicht nur Fachkenntnisse und Fähigkeiten, sondern bekommen zusätzlich zu Ihrem Teilnahmezertifikat ein Open Badge als digitalen Nachweis Ihrer Kompetenz.
Sie können diesen in Ihrem persönlichen und kostenfreien Mein IT-Schulungen.com Konto abrufen. Ihre verdienten Badges lassen sich problemlos in sozialen Netzwerken integrieren und weitergeben.
Kurz vor Durchführung
Termin | Standort | Aktion |
---|---|---|
22.05. - 24.05.2024 | Hamburg | |
25.06. - 27.06.2024 | München | |
08.07. - 10.07.2024 | Köln | |
20.08. - 22.08.2024 | Nürnberg |