Wegen wachsender Komplexität vieler Datenstrukturen im Internet werden Wege gesucht, um die Datenflut für Menschen auf Relevantes zu reduzieren und verständlich zu organisieren. saracus machte es sich zum Ziel, den Datengewinn aus komplexen XML- und XSD-Dateien zu optimieren und entwickelte DWx2r.

DWx2r ist ein generischer XML-Parser für einfache und komplexe XML-Datentypen, also eine Softwarelösung zur automatisierten Generierung eines relationalen Datenbankschemas und laut eigener Marktforschung die Einzige auf dem Markt. Das Schema wird aus XSD- und XML-Dateien ermittelt; mehrere Tausend zugehörige Nachrichten pro Sekunde können im XML-Format mit DWx2r aus Dateien oder  Datenbank-CLOBs in das Schema geladen werden.

Herausforderungen

  • generische Verarbeitung von komplexen XML-Datentypen
  • hohe Anzahl an Beziehungen
  • 0-n Beziehungen in der XML-Datei
  • redundante Unterstrukturen

Lösungsansätze

  • intelligenter Algorithmus zum Hochziehen von komplexen Datentypen
  • erkennen und ausnormalisieren von 0-n Beziehungen
  • redundante Unterstrukturen organisieren

Vorteile

  • schneller Datengewinn durch tabellarische Auflösung komplexer XML-Strukturen unter Beibehaltung der Relationen
  • automatisches Laden der Daten in die relationalen Tabellen
  • multithreading Implementierung in JAVA
  • hohe Performance durch Parallelisierung
  • near realtime Verarbeitung
  • plattformunabhängig
  • automatische Erstellung einer Dokumentation der erzeugten Tabellen
  • unterstützt die wichtigsten XML-Datentypen

Softwaredemo runterladen


linux-logo
windows-logo
apple-logo

Unterstützte Datentypen


Typ
string
boolean
decimal
float
double
dateTime
time
date
Typ
integer
nonPositiveInteger
long
int
short
byte
nonNegativeInteger
unsignedLong
unsignedInt
unsignedShort
unsignedByte
positiveInteger