Java verwenden in der Azure Data Factory

Microsofts Azure Data Factory (ADF) ist ein Datenintegrationsdienst, in dem man komplexe Arbeitsabläufe in Form von Pipelines erstellen und ausführen kann. Seit Ende Juni 2018 gibt es ADF V2, in der man Pipelines bequem in einer grafischen Oberfläche im Browser entwickeln kann - ähnlich wie mit SQL Server Integration Services. Dabei hat man für die [...]

Ausführung von SSIS-Paketen in der Azure Cloud mit der Azure Data Factory

Bei der Ausführung bzw. Migration von SSIS-Paketen in die Azure Cloud gibt es gemäß Forrester vier verschiedene Möglichkeiten: Lift & Shift Lift & Extend Hybrid Extension Full Rebuild Lift & Shift bezeichnet hierbei eine mehr oder weniger direkte Migration mit lediglich geringen erforderlichen Anpassungen der bisherigen Infrastruktur zu einer Cloudumgebung. Bei Lift & Extend werden [...]

Vergleich der Graphdatenbank Neo4J mit relationalen Datenbanken

Teil I Die fortschreitende Entwicklung in den Bereichen Big Data, Internet of Things, Machine Learning  etc. und der Einsatz von entsprechenden Tools in Unternehmen sind nicht mehr wegzudiskutieren. Wird unsere Welt in dem Bereich analytischer Systeme - so wie wir sie kennen - komplett auf den Kopf gestellt? Müssen wir zwangsläufig neue Technologien in diesen [...]

Data Wrangling mit Trifacta

Die rasante Entwicklung hin zu immer größeren und komplexeren Datenmengen in Unternehmen bringt einige neue Anforderungen an das Verarbeiten dieser Daten mit sich. Bedingt durch die Masse an Daten und die Komplexität der Datenstrukturen, ist die Analyse sowie Bereinigung der Daten ohne leistungsstarke Software Tools häufig nicht mehr möglich. Insbesondere die Strukturierung und Bereinigung nimmt [...]

Tool-basierte Generierung von Big Data Use Cases

Die Anforderungen verschiedener Unternehmen hinsichtlich Big Data können sich stark unterscheiden. Um die für ein spezifisches Unternehmen erforderlichen Anforderungen möglichst schnell und zuverlässig identifizieren zu können, hat saracus consulting den saracus Big Data Use Case Konfigurator  (BDUK) entwickelt. Mithilfe einer Datenbank, die den Zugriff auf über 600 vordefinierte  Basis-Use-Cases ermöglicht, kann der Konfigurator die Definition [...]

Einsatz eines Open Source Clickstream-Collectors

Begriffe wie Customer Experience, Omnichannel Management, Customer Journey, Customer Analytics, Personalisierung und kontextbasierte Kundeninteraktionen stehen bei vielen Unternehmen ganz oben auf der Agenda. Für das Ausspielen von personalisiertem Content in Echtzeit über digitale Kanäle (z.B. zur Steigerung der Conversion-Rate) werden aktuelle Daten über den Interessenten bzw. Kunden benötigt. Dazu gehören z.B. demographische Daten, die bisherige [...]

White Paper Data Science – Wissen schaffen mit Technologie und Talent

In diesem White Paper erfahren Sie, wie Big Data Technologie zu diesen Zweck sinnvoll eingesetzt werden kann und wie die Datenauswertung und -veredelung gelingt. Seit vielen Jahren ist in den meisten Unternehmen klar, dass einer ihrer wichtigen Rohstoffe die eigenen Daten sind. Mit der fortschreitenden Digitalisierung und mit Big Data Technologie wurde nun etwas möglich, [...]