Big Data & Hadoop


saracus hat bereits vor drei Jahren begonnen, Big Data Kompetenzen aufzubauen und verschiedene Projekte für Kunden durchgeführt. Dabei bietet saracus den gesamten Prozess von der Big Data Strategie, der Identifizierung von Use Cases über die Implementierung bis zum Betrieb die gesamte Wertschöpfungskette an.
Aber auch eine Vielzahl weiterer Big Data Komponenten (zumeist Open-Source) hat saracus in seinen Projekten erfolgreich eingesetzt.

Konzeption und Entwicklung von Big Data-Anwendungen

  • Identifizierung und Priorisierung / Auswahl von Use Cases
  • Konkretisierung des ausgewählten Use Cases (Analyseanforderungen, Datenquellen, Datenvolumen, Anforderungen an Hard- und Softwareressource, etc.)
  • Auswahl und Aufbau einer Big Data & Analytics Plattform
  • Analyse und Erstellung eines Prototypen auf Basis eines Big-Data-Ansatzes zur effizienten Speicherung und Analyse von großen Datenmengen in Echtzeit

 

Konzeption und Implementierung von IT-nahen Big Data Services

  • Standardisierung von Prozessen für Datenbereitstellung (inkl. Compliance)
  • Veredlung- und Cleansing-Prozesse
  • Datenspeicherung
  • Automatisierung von Datentransfers und Reports
  • Aufbau eines Datenkatalogs
  • Bereitstellung von Analysebausteinen
  • Überführung von Test-Analyseprozessen in die Produktion
  • Definition von SLAs
  • Abgrenzung zur bestehenden BI- / DWH-Infrastruktur definieren

Big Data Beratungsprodukte und Services


Das Big Data Framework von saracus


Hadoop ist ein in Java programmiertes Software-Framework, mit dessen Hilfe Anwender rechenintensive Prozesse mit großen Datenmengen auf Server-Clustern abarbeiten können. Applikationen können mit Hilfe von Hadoop komplexe Computing-Aufgaben auf tausende von Rechnerknoten verteilen und Datenvolumina im Petabyte-Bereich verarbeiten.

Was ist Hadoop?


Hadoop-Events im deutschsprachigem Raum


17.11.2017

Leider keine interessanten Events diese Woche.

 

28.02.-01.03.2018:  Big Data Summit Hanau

https://www.bitkom-bigdata.de/das-Event

Hadoop Neuigkeiten


17.11.2017

MapR hat ein neues Produkt angekündigt: Data Science Refinery. Es basiert auf Apache Zeppelin und bietet eine integrierte Lösung für notebook-based development.

https://mapr.com/blog/introducing-mapr-data-science-refinery/

 

06.11.2017

MapR hat einen Service für die Converged Data Platform von MapR angekündigt.

https://mapr.com/company/press-releases/mapr-launches-managed-services-for-improved-dataops/

 

30.10.2017

Videos von der Big Data Los Angeles, die im August stattgefunden hat, sind jetzt online:

https://www.bigdatadayla.com/#slides

23.10.2017

Hadoop auf der Strata Data Conference in New York City bedeutungslos?

Auf der Strata Data Conference war Hadoop nur schwer zu finden, allerdings sind die Hauptbestandteile von  Hadoop, insbesondere Spark immer noch sehr lebendig. Lesen Sie weiter auf:

https://www.datanami.com/2017/09/29/hadoop-hard-find-strata-week/

 

11.10.2017

SQL Databanken integrieren NoSQL Funktionen

Relationale Datenbanken (SQL) wurden über Jahrzehnte in allen möglichen Bereichen eingesetzt. Die Technology ist erprobt, stabil und standardisiert und wurde über 20 Jahre weiterentwickelt. Die Hersteller gehen nun dazu über, auch NoSql Funktionen einzubauen.

https://www.datanami.com/2017/09/25/sql-databases-integrating-nosql-like-features/

 

27.09.2017

MapR hat eine neue MapR Orbit Cloud Suite angekündigt, die eine cross-cloud Funktionalität bietet: die Kombination von public und private clouds.

https://community.mapr.com/community/products/blog/2017/08/29/introducing-the-mapr-orbit-cloud-Suite