Suchen

Tiefgehende Big-Data-Analysen mit Datawatch Daten zum Leben erwecken

Redakteur: Elke Witmer-Goßner

Kaum ein Unternehmen weiß wirklich, wie viele Daten aus den verschiedensten Quellen und in unterschiedlichsten Formaten anfallen und welchen inhaltlichen Wert und Bedeutung diese haben. Dabei ist der umfassende Blick auf Geschäftskennzahlen, die jeden noch so kleinen „Datenschnipsel“ berücksichtigen, heute existenziell für die Gestaltung der Geschäftsmodelle und die Pflege der Kundenbeziehungen.

Firmen zum Thema

Datawatch schließt mit seinen Big-Data-Analyse-Werkzeugen Datenlücken, die durch den Betrieb unterschiedlicher Systeme entstehen.
Datawatch schließt mit seinen Big-Data-Analyse-Werkzeugen Datenlücken, die durch den Betrieb unterschiedlicher Systeme entstehen.
(Bild: Gernot Krautberger, Fotolia)

Wer suchet, der findet. Das Sprichwort verliert in komplexen IT-Umgebungen, wo jede Sekunde unvorstellbare Mengen an Daten, strukturiert, unstrukturiert oder in gemischten Formaten anfallen, schnell seinen Sinn. Das Aufspüren relevanter Informationen aus Excel- und PDF-Dateien, HTML, XBRL, Log-Files, gedruckten Listen sowie Daten aus den verschiedensten IT-Systemen für ERP, HR, CRM, ECM, BI, ERP, SAP usw. – lokal oder sogar in der Cloud gespeichert – ist eine große Herausforderung im Big-Data-Zeitalter.

Informationen im toten Winkel

In einem gewissen Rahmen findet Datenmanagement in Unternehmen schon statt. Allerdings liegt der Fokus hier auf strukturierten Daten aus Business-Intelligence-Systemen oder Data Warehouses. Mit diesen Analysen kratzen die Firmen aber nur an der Oberfläche: Der größte Schatz wertvoller Daten ist in vielen unterschiedlichen Systemen verborgen und kann mit Hilfe gängiger Anwendungen nur unter massivem Aufwand gehoben werden. Big-Data-Strategien, um vor allem unstrukturierte Daten zu extrahieren und zu analysieren, sind zwar ein Schritt in die richtige Richtung. Allerdings bleiben Daten in gemischten Formaten – semistrukturierte Daten – noch außen vor, stehen quasi im toten Winkel von Datenmanagement-Projekten. Damit entgehen den Unternehmen wichtige Informationen, die sich in vorgefertigten Berichten, EDI-Streams, PDF-Dateien, oder auch anderen Quellen wie Enterprise-Content-Management-Systemen (ECM) mit großen Beständen an geschäftsrelevanten Dokumenten finden.

Das immense, stetig wachsende Datenvolumen in den Griff zu bekommen, ist schon bei lokal implementierten Anwendungen und IT-Infrastrukturen schwierig. Noch problematischer wird es, wenn auch noch Cloud-Umgebungen und -Services hinzukommen. Der Datenanalyse- und Big-Data-Spezialist Datawatch hat hierfür eine neue Softwaregeneration entwickelt, die die traditionellen Ansätze der Geschäftsanalyse ergänzen: „Information Optimization Software“ bricht herkömmliche Datenmanagement-Strukturen auf und schließt die Lücken zwischen verschiedenen Systemen. Alle Datenquellen eines Unternehmens werden angezapft, um auch semistrukturierte Daten ausnahmslos zu erfassen. Die Daten werden, ohne auf Systemschnittstellen zugreifen zu müssen, ausgelesen und extrahiert. In einem weiteren Schritt werden die Ergebnisse in Datenmodelle eingespielt und mit anderen Informationen aus anderen Quellen zusammengeführt, um schließlich ausgewertet zu werden für das umfassende Reporting. Wichtig dabei: Um den gesetzlichen und rechtlichen Anforderungen gerecht zu werden, können alle Daten jederzeit auf ihre ursprüngliche Quelle zurückverfolgt werden.

Was einfach klingt, erfordert doch hohe Expertise und tiefes Verständnis der Strukturen und Komponenten der einzelnen Datenarten und Formate, die erkannt, extrahiert und eingelesen werden müssen. Die Datawatch-Lösung ist, wie alle Information-Optimization-Systeme, keine Stand-alone-Anwendung, sondern bezieht ECM- und BI-Systeme mit ein, um strukturierte und semistrukturierte Daten kombinieren zu können. Datawatch bereitet dabei auch Daten aus Lösungen auf, die auf anderen Technologien basieren, wie beispielsweise Qlikview oder Tableau.

(ID:40113980)