visualisierungstools

Open Source-Visualisierungstools

Wenn es um den Erkenntnisgewinn durch Daten geht, ist ein Blick auf die Rohdaten meist wenig gewinnbringend, da ohne weitere Analyse keine Schlussfolgerungen aus diesen gezogen werden können. Abhilfe können hierbei Visualisierungstools schaffen, welche eine flexible und schnelle Veranschaulichung der Daten ermöglichen. Dadurch können Muster und Zusammenhänge innerhalb der Datensätze für den Betrachter erkennbar gemacht [...]

Hyperopt – Optimierung der Hyperparameter für Machine Learning- Modelle in Python

Den gesamten sogenannten Hyperparameterraum nach einer optimalen Parameterkonfiguration abzusuchen ist in der Regel nicht realisierbar. Gewöhnlich nutzen Data Scientists hierfür ihre Erfahrung und führen nur einen kleinen Gridsearch über einen Teil des Raums aus. Meistens ist diese Methode selbst für erfahrene Data Scientists nicht sehr effizient und führt oft zu einem falschen lokalen Minimum der Verlustfunktion. Beispielsweise ist bei der Einstellung der [...]
pro-contra

Vergleich von Hadoop Distributionen

Cloudera CDH vs. Hortonworks HDP Das Hadoop Framework ermöglicht die verteilte Verwaltung und Berechnung großer Datenmengen mithilfe von Clustern, indem die auszuführenden Transformationen auf die Server verteilt und dort parallel ausgeführt werden. Hadoop und das dazugehörige Ökosystem sind durch die Vielzahl an verknüpften Tools sehr komplex und erfordern deshalb die Entwicklung und Wartung durch Spezialisten. [...]
database-schema

Vergleich der Graphdatenbank Neo4J mit relationalen Datenbanken

Teil I Die fortschreitende Entwicklung in den Bereichen Big Data, Internet of Things, Machine Learning  etc. und der Einsatz von entsprechenden Tools in Unternehmen sind nicht mehr wegzudiskutieren. Wird unsere Welt in dem Bereich analytischer Systeme - so wie wir sie kennen - komplett auf den Kopf gestellt? Müssen wir zwangsläufig neue Technologien in diesen [...]

Data Wrangling mit Trifacta

Die rasante Entwicklung hin zu immer größeren und komplexeren Datenmengen in Unternehmen bringt einige neue Anforderungen an das Verarbeiten dieser Daten mit sich. Bedingt durch die Masse an Daten und die Komplexität der Datenstrukturen, ist die Analyse sowie Bereinigung der Daten ohne leistungsstarke Software Tools häufig nicht mehr möglich. Insbesondere die Strukturierung und Bereinigung nimmt [...]

Tool-basierte Generierung von Big Data Use Cases

Die Anforderungen verschiedener Unternehmen hinsichtlich Big Data können sich stark unterscheiden. Um die für ein spezifisches Unternehmen erforderlichen Anforderungen möglichst schnell und zuverlässig identifizieren zu können, hat saracus consulting den saracus Big Data Use Case Konfigurator  (BDUK) entwickelt. Mithilfe einer Datenbank, die den Zugriff auf über 600 vordefinierte  Basis-Use-Cases ermöglicht, kann der Konfigurator die Definition [...]

Einsatz eines Open Source Clickstream-Collectors

Begriffe wie Customer Experience, Omnichannel Management, Customer Journey, Customer Analytics, Personalisierung und kontextbasierte Kundeninteraktionen stehen bei vielen Unternehmen ganz oben auf der Agenda. Für das Ausspielen von personalisiertem Content in Echtzeit über digitale Kanäle (z.B. zur Steigerung der Conversion-Rate) werden aktuelle Daten über den Interessenten bzw. Kunden benötigt. Dazu gehören z.B. demographische Daten, die bisherige [...]

Call Center Optimierung durch Speech to Text und Advanced Analytics

Die Zufriedenheit eines Kunden hängt oftmals nicht nur von der Qualität des gekauften Produkts ab, sondern auch vom Service des Anbieters. Ein positives Kundenerlebnis kann darüber entscheiden, ob aus einem zufriedenen Kunden ein loyaler Kunde wird und er sich eventuell sogar zu einem “Botschafter der Marke” entwickelt. In diesem Blog möchten wir Ihnen unsere umgesetzte [...]
img xml-strukturen

Generische Verarbeitung komplexer XML-Strukturen

Die generische Verarbeitung komplexer XML-Strukturen in einer relationalen Datenbank oder einem Data Lake (auf Hadoop-Basis) ist eine anspruchsvolle Herausforderung für Software-Entwickler. saracus consulting hat seine Data Warehouse Automatisierungs-Software DWautomatic um diese Funktionalität erweitert. An folgendendem Beispiel soll die Funktionalität und Arbeitsweise dargestellt werden. In der Logistikbranche ist das Tracking von Transportsendungen unverzichtbar für das Erreichen [...]
retail banking

Big Data Use Cases im Retail Banking

Die Identifizierung und schnelle Umsetzung von Big Data Use Cases entscheidet über den Erfolg von Big Data Initiativen. Business Know-how, die Bereitschaft Geschäftsprozesse vom Kunden her zu denken, analytische und methodische Fähigkeiten, Pragmatismus und Kreativität sind wichtige Faktoren auf dem beschwerlichen Weg der digitalen Transformation. Und nicht zu vergessen, ein bisschen Inspiration. Deshalb möchten wir [...]