Seminar: Data Scientist Basis-Training mit Python und Spark MLlib

Zwei- oder dreitägiges Intensivseminar

Kurzinformationen

Dreitägig:

 

Ort:Termin:Preis:
Münster:29.01. – 31.01.20192.610,00 EUR (zzgl. MwSt.)
Baden-Dättwil:05.02. – 07.02.20192.990,00 CHF (zzgl. MwSt.)

 

Zweitägig:

 

Ort:Termin:Preis:
Münster:29.01. – 30.01.20191.750,00 EUR (zzgl. MwSt.)
Baden-Dättwil:05.02. – 06.02.20192.100,00 CHF (zzgl. MwSt.)

Dieses dreitägige Grundlagen-Seminar gibt angehenden Data Scientists und Data Analysts neben der Modellbildung einen Einblick in die Bereiche Data Exploration, Feature Preparation und Visualisierung.

Seminar-Optionen

Der dritte Seminartag ist optional. Somit können Sie entweder die ersten beiden Seminartage buchen oder alle drei Seminartage.

Detailinformationen

Das Seminar

Dieses dreitägige Grundlagen-Seminar gibt angehenden Data Scientists und Data Analysts neben der Modellbildung einen Einblick in die Bereiche Data Exploration, Feature Preparation und Visualisierung.

Der Seminarinhalt

Während des Seminars werden weit verbreitete Bibliotheken und Frameworks wie Pandas, Matplotlib, scikit-learn und Apache Spark vorgestellt und und in einer Vielzahl von Übungen eingesetzt. Das Seminar vermittelt Ihnen sowohl die theoretischen Grundlagen im Bereich Advanced Analytics als auch deren Anwendung.Die Referenten sind erfahrene Data Scientists mit didaktischen Fähigkeiten.

Alle Übungen werden auf einem Multi-Node-Hadoop-Cluster ausgeführt, welches in der Amazon EC2 Cloud installiert ist.

Seminar-Agenda

Jeweils von 09:00 bis 17:00 Uhr

Einführung in Data Mining (Tag 1)

  • Vorstellung verschiedener Machine Learning Use Cases
  • Allgemeines Vorgehen beim Data Mining
  • Einführung in die Python-Bibliotheken Numpy und Pandas
  • Übung: Praktischer Einsatz von Numpy und Pandas
  • Techniken zur Data Exploration und Datenvisualisierung
  • Einführung in die Python-Bibliotheken Matplotlib und Seaborn
  • Übung: Datenvisualisierung mit Matplotlib und Seaborn
  • Feature Engineering und Feature Preparation
  • Übung: Datenaufbereitung und Feature Engineering mit Pandas

Machine-Learning-Methoden (Tag 2)

  • Detaillierte Besprechung wichtiger Machine Learning Algorithmen
    (Lineare und logistische Regression, Entscheidungsbäume, Random Forest,
    k-Nearest-Neighbor-Algorithmus, k-Means-Algorithmus)
  • Einführung in die Python-Bibliothek scikit-learn
  • Übung: Entwicklung einer Machine-Learning-Pipeline für Regression und binäre Klassifikation
  • Vorstellung von Metriken zur Bewertung eines Machine-Learning-Modells
  • Übung: Evaluierung der zuvor selbst erstellten Modelle

Big Data Analysen und komplexe ML-Methoden
(Tag 3, optional)

  • Einführung in Spark und Spark SQL
  • Übung: Data Preparation mit Spark SQL
  • Einführung in MLlib
  • Übung: Clustering mit Spark MLlib
  • Advanced Machine Learning Topics:
    Curse of Dimensionality, Feature Selection, Imbalanced Datasets, etc.

Voraussetzungen

Notwendig ist ein Basiswissen von Python und grundlegendes mathematisches und statistisches Verständnis.
Berücksichtigen Sie bitte, dass eine Mindestteilnehmerzahl von 4 Personen vorgesehen ist. Ansonsten kann das Seminar nicht stattfinden.

Methode

Präsenzseminar:
Das Seminar wird aus Vortrag, Diskussionsrunden sowie praktischen Übungen in Kleingruppen bestehen. Viele Beispiele aus der Praxis verdeutlichen die Theorie.

Sprachen

Seminar: Deutsch
Unterlagen: Deutsch und Englisch

Zielgruppe

Das Seminar richtet sich an (angehende) Data Scientists und Data Analysts, die sich die wichtigsten Basiskenntnisse erarbeiten wollen, um valide Modelle mit Hilfe unterschiedlicher Verfahren des Machine Learnings entwicklen zu können.

Bitte Termin/Ort auswählen:

Bitte Termin/Ort auswählen:*

1. Seminarteilnehmer:

Anrede:*Titel:
Vorname:*Nachname:*
Firma: Position:
Abteilung: E-Mail: *
Telefon:*Fax:
Adresse:*PLZ:*
Stadt:*Land:*
Bemerkung:

weitere Teilnehmer anmelden:

2. Seminarteilnehmer:

Anrede:*Titel:
Vorname:*Nachname:*
Position: Abteilung:
E-Mail:*Telefon:*

3. Seminarteilnehmer:

Anrede:*Titel:
Vorname:*Nachname:*
Position: Abteilung:
E-Mail:*Telefon:*

* diese Angaben werden für die Versendung des Formulars benötigt

2. und 3. Teilnehmer sind optional, ab dem 3. Teilnehmer gewähren wir einen Teamvorteil von 10 %!

Stornierung

Bei Stornierung bis zu 14 Tage vor Veranstaltungsbeginn erheben wir eine Bearbeitungsgebühr von 50% der Gebühr. Bei späteren Absagen wird der gesamte Beitrag fällig.

Seminarabsage

Sollten wir aus wichtigem Grund (z. B. Erkrankung des/der Referenten) gezwungen sein, den Kurs abzusagen, so teilen wir Ihnen dieses umgehend mit. Wir werden Ihnen in diesem Fall einen Ersatztermin anbieten. Passt dieser nicht zu Ihrer Terminplanung, erhalten Sie die bereits gezahlte Seminargebühr in voller Höhe zurück. Darüber hinausgehende Ansprüche bestehen nicht.

Teamvorteil

Sie sind als Team an der Teilnahme interessiert? Dann buchen Sie für 3 Teilnehmer und erhalten Sie ab dem 3. Teilnehmer 10 % Rabatt.