Seminar: Data Scientist Basis-Training mit Python und Spark MLlib
Zwei- oder dreitägiges Intensivseminar
Kurzinformationen
Zweitägig:
Ort: | Termin: | Preis: | |
Münster: | 14.06. – 15.06.2021 | 1.750,00 EUR (zzgl. MwSt.) | |
Baden-Dättwil: | 26.01. – 27.01.2021 | 2.100,00 CHF (zzgl. MwSt.) | |
Dreitägig:
Ort: | Termin: | Preis: | |
Münster: | 14.06. – 16.06.2021 | 2.610,00 EUR (zzgl. MwSt.) | |
Baden-Dättwil: | 26.01. – 28.01.2021 | 2.990,00 CHF (zzgl. MwSt.) | |
Dieses dreitägige Grundlagen-Seminar gibt angehenden Data Scientists und Data Analysts neben der Modellbildung einen Einblick in die Bereiche Data Exploration, Feature Preparation und Visualisierung.
Detailinformationen
Das Seminar
Dieses dreitägige Grundlagen-Seminar gibt angehenden Data Scientists und Data Analysts neben der Modellbildung einen Einblick in die Bereiche Data Exploration, Feature Preparation und Visualisierung.
Der Seminarinhalt
Während des Seminars werden weit verbreitete Bibliotheken und Frameworks wie Pandas, Matplotlib, scikit-learn und Apache Spark vorgestellt und und in einer Vielzahl von Übungen eingesetzt. Das Seminar vermittelt Ihnen sowohl die theoretischen Grundlagen im Bereich Advanced Analytics als auch deren Anwendung.Die Referenten sind erfahrene Data Scientists mit didaktischen Fähigkeiten.
Alle Übungen werden auf einem Multi-Node-Hadoop-Cluster ausgeführt, welches in der Amazon EC2 Cloud installiert ist.
Seminar-Agenda
Jeweils von 09:00 bis 17:00 Uhr
Einführung in Data Mining (Tag 1)
- Vorstellung verschiedener Machine Learning Use Cases
- Allgemeines Vorgehen beim Data Mining
- Einführung in die Python-Bibliotheken Numpy und Pandas
- Übung: Praktischer Einsatz von Numpy und Pandas
- Techniken zur Data Exploration und Datenvisualisierung
- Einführung in die Python-Bibliotheken Matplotlib und Seaborn
- Übung: Datenvisualisierung mit Matplotlib und Seaborn
- Feature Engineering und Feature Preparation
- Übung: Datenaufbereitung und Feature Engineering mit Pandas
Machine-Learning-Methoden (Tag 2)
- Detaillierte Besprechung wichtiger Machine Learning Algorithmen
(Lineare und logistische Regression, Entscheidungsbäume, Random Forest,
k-Nearest-Neighbor-Algorithmus, k-Means-Algorithmus) - Einführung in die Python-Bibliothek scikit-learn
- Übung: Entwicklung einer Machine-Learning-Pipeline für Regression und binäre Klassifikation
- Vorstellung von Metriken zur Bewertung eines Machine-Learning-Modells
- Übung: Evaluierung der zuvor selbst erstellten Modelle
Big Data Analysen und komplexe ML-Methoden
(Tag 3, optional)
- Einführung in Spark und Spark SQL
- Übung: Data Preparation mit Spark SQL
- Einführung in MLlib
- Übung: Clustering mit Spark MLlib
- Advanced Machine Learning Topics:
Curse of Dimensionality, Feature Selection, Imbalanced Datasets, etc.
Voraussetzungen
Notwendig ist ein Basiswissen von Python und grundlegendes mathematisches und statistisches Verständnis.
Berücksichtigen Sie bitte, dass eine Mindestteilnehmerzahl von 4 Personen vorgesehen ist. Ansonsten kann das Seminar nicht stattfinden.
Methode
Präsenzseminar:
Das Seminar wird aus Vortrag, Diskussionsrunden sowie praktischen Übungen bestehen. Viele Beispiele aus der Praxis verdeutlichen die Theorie.
Sprachen
Seminar: Deutsch
Zielgruppe
Das Seminar richtet sich an (angehende) Data Scientists und Data Analysts, die sich die wichtigsten Basiskenntnisse erarbeiten wollen, um valide Modelle mit Hilfe unterschiedlicher Verfahren des Machine Learnings entwicklen zu können.
Anmeldung
Stornierung
Bei Stornierung bis zu 14 Tage vor Veranstaltungsbeginn erheben wir eine Bearbeitungsgebühr von 50% der Gebühr. Bei späteren Absagen wird der gesamte Beitrag fällig.
Seminarabsage
Sollten wir aus wichtigem Grund (z. B. Erkrankung des/der Referenten) gezwungen sein, den Kurs abzusagen, so teilen wir Ihnen dieses umgehend mit. Wir werden Ihnen in diesem Fall einen Ersatztermin anbieten. Passt dieser nicht zu Ihrer Terminplanung, erhalten Sie die bereits gezahlte Seminargebühr in voller Höhe zurück. Darüber hinausgehende Ansprüche bestehen nicht.
Teamvorteil
Sie sind als Team an der Teilnahme interessiert? Dann buchen Sie für 3 Teilnehmer und erhalten Sie ab dem 3. Teilnehmer 10 % Rabatt.