Interview zum Thema Big Data

„Die Bearbeitung gigantischer Datenmengen ist große Herausforderung und Chance zugleich“

Seite: 4/5

Firmen zum Thema

Wie beeinflusst die Datenqualität das Big-Data-Management?

Stelz: Das Paradigma „der Prozess bestimmt die Datenqualität“ ändert sich auch bei Big Data nicht. Datenqualität ist auch bei Big Data von enormer Bedeutung. Vor allem dann, wenn – wie schon von mir angesprochen – Unternehmensdaten mit Informationen aus Big Data angereichert werden. Wenn also beispielsweise Kundendaten durch Daten aus den sozialen Medien ergänzt werden sollen, zum Beispiel bei den benutzerangepassten Suchergebnissen einer Google-Suche. Eine hohe Datenqualität muss bereits vor der Datenanalyse gewährleistet sein – am besten schon bei der Dateneingabe beziehungsweise Datenerhebung. Denn erst eine einheitliche, qualitativ hochwertige Datenbasis versetzt die Anwender in die Lage, Daten schnell zu analysieren und so beispielsweise rechtzeitig auf Markttendenzen zu reagieren. Die Grundaufgaben von Data Management in Bezug auf Big Data bleiben dabei die gleichen: Profiling, Cleansing sowie Anreichern und Abgleichen mit Referenzdaten. Aber auch hier steigt im Bereich Big Data die Bedeutung von Datenqualität: Das Schaffen des Single Point of Truth ist beim gegebenen Datenvolumen schwieriger geworden und auch die Anforderungen an die Performance der Datenqualitätslösungen sind stark angewachsen.

Martin: In der Vergangenheit hatten wir uns stets bemüht, den Single Point of Truth herzustellen und zu bewahren. Das wird nicht mehr so wie bisher, also deterministisch, im Big Data machbar sein, da eine Konsistenz über alle Datenquellen in der Regel nicht mehr erreichbar sein wird. Daher wird der Single Point of Truth eher mit wahrscheinlichkeitstheoretischen Ansätzen formuliert und definiert werden müssen. Mit diesen Überlegungen stehen wir aber noch ganz am Anfang.

Stelz: Um auch mit Big Data im Unternehmen den Single Point of Truth anzustreben, müssen neben der Performance auch die Service-Orientierung der Werkzeuge, die Services selbst und Plattformen stimmen. Denkbar ist hier zum Beispiel der Einsatz von hybriden Cloud-Lösungen, bei denen bestimmte Services in der Cloud zur Verfügung stehen und andere wiederum on demand abgerufen werden können.

(ID:34290920)