Produkte und Dienstleistungen von saracus

Die Produkte und Dienstleistungen von saracus unterstützen Sie auf Ihrem Weg zu einer Data Driven Organization. Mit 25 Jahren Erfahrung im Bereich der Datenwissenschaften helfen wir Ihnen bei der Identifikation, Analyse, Gewinnung und Visualisierung von relevanten Daten und bieten Schulungen für Sie und Ihre Mitarbeiter an.

Building a Data Driven Organization

Gründung 1991

90+ Mitarbeiter

2 Standorte

In 8 Schritten zur Data Driven Organization

Enterprise Data Strategy, Use Case Management, Maturity Assessment, Roadmap, Business Case, POC

1

Organization Skills, Agility, Scrum, Kanban, Analytical-Progress-Mgmt., Talend Recruitment, Talend Mgmt.

2

DG-Policy-Program, Information Stewardship, GDPR, Data Catalog, Metadata, Data Quality, MDM, DLM

3

Data Lake, DWH, Layer-Konzept, Streaming Framework, Data Repositories (RDBMS, NoSQL), Virtualisierung, Data Ops, Cloud, Docker, Kubernetes

4

Batch, CDC, Event(Realtime) Historis., Data Pipeline, Cleanding, Microservices, Selfservice Data Preperation & Movement, Automatisierung

5

Advanced Analytics, BI, Visualization, Analy-Selfservice & Workflows, NLP, Bilderkennung, Zeitreihen, Deep Learning, Data Marketplace

6

Continuous Integration & Deployment, Automated Testing, Code Performance & Monitoring, Support & Administration

7

Monitoring & Review: Strategy-Fit Skills, Data Processes, Analytical Models, Technology

8

Die Teilbereiche und unser Service

saracus Methoden & Software Komponenten

Big Data Academy

Big Data Methodology,
Big Data Use Case Configurator

Entwicklung einer Big Data Strategy,
Big Data Use Case Management

Big Data Methodology

Implementation:
BICC, Analytical CoE

DWinsurance,
Data Governance,
SVML für Data Catalog Tools

Basics dimensionaler Modellierung im DWH,
Daten-Design mit koplexen Datenarchitekturen(Core-DWH),
DQ im Data Lake

Big Data Methodology

Einführung in Big Data und Hadoop

DWx2r,
DWautomatic,
Data Lake Transformation Services

Real Time Stream Processing,
Versionierung als Kernproblem der Bewirtschaftung

DWautomatic,
Analytical Showcase,
Advanced Visualization Framework

Data Science Basics,
Deep Learning,
Neuronale Netze

DWautomatic Framework: Deployment,
Advanced Analytical Models

Hadoop Administrator Training

Big Data Methodology

Review & Redesign,
DWH & Data Lake

Skill Set der saracus Data Scientists

Machine Learning Algorithmen

pro Kategorie die wichtigsten Vertreter

NLP Basic, CV Basic, Feature Selection, Ensemble, Dimensionality Reduction, Deep Learning, Artifical Neural Network, Association Rule Learning, Clustering, Bayesioan, Decision Tree, Regularization, Instance Based, Regression

Mathematik und Statistik

lineare Algebra
Statistik

Technologien

mind. 1 Vertreter

Data Visualization
Data Preperation, ETL, SQL, RDBMS
Cloud (AWS, Azure, Google)
Frameworks & Libraries
Python, Scala, R und mehr!
Data Science Platform
APIs für MLP, CV, etc.

Model Development Process

Model Building

Supervised Learning
Unsupervised Learning
Reinforcement Learning

Model Optimization

Hyper-Parameter Tuning
Gradient Descent
SGD
Ensemble
Boosting

Model Evaluation

Precision-Recall
F-measure
Log-loss
MSE, RSME, RSS
Cross Validation

Feature Selection

PCS
LSH
SVD

Feature Transformation

Normalizer
Vector Indexer
One Host Encoder
Stop Words Remote
Tokenizer
nn-gram, PCS

Feature Extraction

TF-IDF(Hashing TF & IDF)
Word2Vec
Count Vectorizer

Education & Softskills

PhD or Master in Natural Science
Communication Skills
Intellectual Curiosity

Project Management

Scrum
Kanban
Methodologien: CRISP, TDSC
…und mehr!

Requirement Analysis

Domain Know-How
Design Thinking
Lean Startup

Eine Spezialisierung pro Data Scientist

Computer Vision

mehr erfahren >

Natural Language Processing

mehr erfahren >

Time Series

mehr erfahren >

& dazu unsere Produkte

SVML – saracus Visual Metadata Layer

SVML dient dazu, die Navigation in einem Data Catalog zu vereinfachen und diesen um zusätzliche Features, wie beispielsweise Aggregationen, zu erweitern.

DWautomatic

DWautomatic wird verwendet, um neue Quellsysteme in das DWH einzubinden, bei denen die Datenstrukturen im DWH den Strukturen des Quellsystems ähnlich sind, aber eine Delta-Erkennung, Versionierung / Historisierung und einfache Transformationen vorgenommen werden sollen.

DWx2r

DWx2r ist ein generischer XML-Parser für einfache und komplexe XML-Datentypen, also eine Softwarelösung zur automatisierten Generierung eines relationalen Datenbankschemas.

DWtec

DWtec® stellt eine umfassende Basis an Prozessen, Templates, Beispielen, best-practice-Anleitungen zur Projektdurchführung dar, von der Initialidee über die Entwicklung bis hin zum Betrieb.

DWinsurance

Eine umfangreiche Erweiterung von DWtec in Form von Datenmodellen in der Branche Insurance für Data Warehouse und Business Intelligence Projekte.