Wie Maschinen mit Menschen kommunizieren – Aktuelle Trends im Natural Language Processing

Natural Language Processing (NLP) beschreibt das Feld der Computerwissenschaften, welches sich mit der Interaktion zwischen Computerprogrammen und menschlicher Sprache beschäftigt. Durch die aktuellen Entwicklungen in den Bereichen der künstlichen Intelligenz und speziell des maschinellen Lernens in jüngerer Zeit hat die automatisierte Verarbeitung von Text- und Sprachdaten bereits Einzug in verschiedene Unternehmensbranchen gefunden. So werden in […]

Vielversprechende Tools und Frameworks für 2019 – Teil 1

Pünktlich zum Jahresstart stellt saracus einige vielversprechende Tools, Plattformen und Frameworks vor, die auch Ihnen das Leben erleichtern können. Hier ist der Teil 1. Debezium Die Methode Change Data Capture (CDC) hat viele Anwendungsfälle u. a. das Replizieren von Daten in andere Datenbanken, die Versorgung von Analytics-Systemen, das Extrahieren von Microservices von Monolithen und die […]

The New Age of Data – GDPR Compliance und Data Analytics – Teil 2

Die jüngsten Fortschritte im Bereich des maschinellen Lernens haben ein wirtschaftliches Interesse erzeugt, die neuen Technologien in Geschäftsprozessen zu integrieren. Das belegen die ansteigenden Investitionen in ML-Tools und der rapide Aufbau von Analytics-Abteilungen. Gleichzeitig wurden Fragen nach Datenschutz und einer digitalen Ethik laut. Als rechtliche Antwort auf diese Entwicklungen hat die Europäische Union im Mai [...]

Performance-Metriken des überwachten Lernens für Klassifikationsprobleme

Die Daten wurden aufbereitet, neue Features abgeleitet und verschieden Machine-Learning-Modelle trainiert. Doch wie bewertet man die Performance dieser Modelle? Wie entscheidet man sich z.B. zwischen einem neuronalen Netz, Random Forest oder Gradient Boosting Classifier? Hierfür verwendet man im Machine-Learning-Bereich sogenannte Performance-Metriken. Diese werden auf einem Testdatensatz (Hold-Out Set) evaluiert, welches nicht zum Training des Modells [...]

Imbalanced Learning

1. Einführung Was haben Datensätze in Bereichen wie Betrugserkennung im Banking, Echtzeitgebote im Marketing oder Intrusion Detection in Netzwerken gemeinsam? Daten, die in diesen Bereichen verwendet werden, weisen oft weniger als 1% seltener, aber "interessanter" Ereignisse auf (z. B. Betrüger, die Kreditkarten verwenden, Nutzer klicken auf Werbung oder beschädigte Server scannen ihr Netzwerk). Die meisten [...]

Hyperopt – Optimierung der Hyperparameter für Machine Learning- Modelle in Python

Den gesamten sogenannten Hyperparameterraum nach einer optimalen Parameterkonfiguration abzusuchen ist in der Regel nicht realisierbar. Gewöhnlich nutzen Data Scientists hierfür ihre Erfahrung und führen nur einen kleinen Gridsearch über einen Teil des Raums aus. Meistens ist diese Methode selbst für erfahrene Data Scientists nicht sehr effizient und führt oft zu einem falschen lokalen Minimum der Verlustfunktion. Beispielsweise ist bei der Einstellung der [...]

Data Wrangling mit Trifacta

Die rasante Entwicklung hin zu immer größeren und komplexeren Datenmengen in Unternehmen bringt einige neue Anforderungen an das Verarbeiten dieser Daten mit sich. Bedingt durch die Masse an Daten und die Komplexität der Datenstrukturen, ist die Analyse sowie Bereinigung der Daten ohne leistungsstarke Software Tools häufig nicht mehr möglich. Insbesondere die Strukturierung und Bereinigung nimmt [...]

Call Center Optimierung durch Speech to Text und Advanced Analytics

Die Zufriedenheit eines Kunden hängt oftmals nicht nur von der Qualität des gekauften Produkts ab, sondern auch vom Service des Anbieters. Ein positives Kundenerlebnis kann darüber entscheiden, ob aus einem zufriedenen Kunden ein loyaler Kunde wird und er sich eventuell sogar zu einem “Botschafter der Marke” entwickelt. In diesem Blog möchten wir Ihnen unsere umgesetzte [...]

Big Data Use Cases im Retail Banking

Die Identifizierung und schnelle Umsetzung von Big Data Use Cases entscheidet über den Erfolg von Big Data Initiativen. Business Know-how, die Bereitschaft Geschäftsprozesse vom Kunden her zu denken, analytische und methodische Fähigkeiten, Pragmatismus und Kreativität sind wichtige Faktoren auf dem beschwerlichen Weg der digitalen Transformation. Und nicht zu vergessen, ein bisschen Inspiration. Deshalb möchten wir [...]