Inhalt
Beschreibung:
Angesprochener Teilnehmerkreis: Personen, die große Datenmengen analysieren möchte sowie Entwickler, die R-Analysen in ihre Lösungen integrieren werden
R ist eine freie Programmiersprache für statistische Berechnungen, die von Statistiker entwickelt wurde. R ist auf vielen Plattformen verfügbar, die Umgebung wird von den Entwicklern ausdrücklich ebenfalls als R bezeichnet.
Der Schwerpunkt dieses Seminars liegt auf der Verwendung von Microsoft R Server für das Erstellen und Ausführen von Analysen über große Datensätze und auf dem Einsatz in Big-Data-Umgebungen wie Hadoop- oder Spark-Cluster oder einer SQL-Server-Datenbank.
Das Seminar kann zur Vorbereitung auf die Prüfung 70-773 für die Zertifizierung als Microsoft Certified Solutions Associate (MCSA): Machine Learning und Microsoft Certified Solutions Expert (MCSE): Data Management and Analytics genutzt werden.
ACHTUNG: Die Prüfung 70-773 wurde zum 30.06.2019 abgekündigt.
Prüfungsgebühren sind nicht im Kurspreis inklusive. Dieses Seminar führen wir in Kooperation mit der cmt Computer- & Management Trainings GmbH mit zertifizierten Trainern durch.
Inhalt:
Microsoft-R-Server und R-Client
- Was versteht man unter Microsoft-R-Server?
- Verwendung des Microsoft-R-Clien
- ScaleR-Funktionen
Einführung in Big Data
- ScaleR-Datenquellen
- Einlesen von Daten in ein XDF-Objekt
- Summieren von Daten in einem XDF-Objekt
Visualisieren von Big Data
Verarbeiten von Big Data
- Transformieren von BiData, Verwalten von Datensätzen
Parallelisieren von Analysevorgängen
- Verwenden des RxLocalParallel-Computekontexts mit rxExec
- Verwenden des revoPemaR-Pakets
Erstellen und Evaluieren von Regressionsmodellen
- Clustern von Big Data
- Erstellen von Regressionsmodellen und Vorhersagen
Erstellen und Evaluieren von Partitionierungsmodellen
- Erstellen von Partitionierungsmodellen basierend auf Entscheidungsbäumen mithilfe der rxDTree-, rxDForest- und rxBTree-Algorithmen
Verarbeiten von Big Data in SQL Server und Hadoop
Voraussetzungen:
Programmiererfahrung mit R und Vertrautheit mit gängigen R-Paketen
Kenntnisse über gängige statistische Methoden und Best Practices für die Datenanalyse
Grundkenntnisse über das Microsoft-Windows-Betriebssystem und seine Kernfunktionalität
Praktische Erfahrung mit relationalen Datenbanken
Abschluss: PC-COLLEGE Zertifikat