Inhalt
Beschreibung:
Angesprochener Teilnehmerkreis: Dateningenieure, Datenarchitekten, Datenwissenschaftler und Entwickler.
Zielsetzung: Mit dem Abschluss dieses Seminars sind die Teilnehmer in der Lage, Big Data-Workflows auf HDInsight zu planen und zu implementieren und zu warten.
Das Seminar dient auch zur Vorbereitung auf die Prüfung 70-775 zur Zertifizierung zum Microsoft Certified Solutions Associate (MCSA): Data Engineering with Azure.
ACHTUNG: Die Prüfung 70-775 wurde zum 30.06.2019 abgekündigt.
Prüfungsgebühren sind nicht im Kurspreis inklusive.
Inhalt:
Einführung in HDInsight (Big Data, Hadoop, MapReduce, HDInsight)
Bereitstellung von HDInsight-Clustern (HDInsight-Clustertypen, Verwaltung von HDInsight-Clustern, Verwaltung von HDInsight-Clustern mit PowerShell)
Berechtigung von Benutzern für den Zugriff auf Ressourcen
Laden von Daten in HDInsight (HDInsight-Speicher, Tools für das Laden von Daten, Performance und Verlässlichkeit)
Troubleshooting von HDInsight (Analyse von HDInsight-Protokollen, YARN-Protokolle, Heap Dumps, Operations Management Suite)
Implementierung von Batch-Lösungen (Apache-Hive-Speicher, Abfragen mit Hive und Pig, Operationalisieren von HDInsight
Design von Batch-ETL-Lösungen für Big Data mit Spark
Datenanalyse mit Spark SQL
Datenanalyse mit Hive und Phoenix
Azure Stream Analytics
Spark Streaming mithilfe der DStream API
Entwicklung von Lösungen für die Echtzeitverarbeitung von Big Data mit Apache Storm
Voraussetzungen:
Programmiererfahrung mit R und Vertrautheit mit gängigen R-Paketen, Kenntnisse über gängige statistische Methoden und Best Practices für die Datenanalyse, Grundkenntnisse über das Microsoft-Windows-Betriebssystem und seine Kernfunktionalität, praktische Erfahrung mit relationalen Datenbanken.
Abschluss: PC-COLLEGE Zertifikat