Suchen

Übersicht beim Storage Datenkataloge – die Grundlage für ein effizientes Datenmanagement

| Autor / Redakteur: Andreas Schaub* / Dr. Jürgen Ehneß

Mit dem steigenden Datenwachstum nimmt auch der benötigte Speicherplatz zu. Je größer das Datenaufkommen und je mehr und umfangreicher die eingesetzten Storage-Lösungen, desto dringlicher wird ein reibungslos funktionierendes Datenmanagement benötigt.

Firma zum Thema

Daten zu speichern, ist das eine, doch man muss sie auch wiederfinden.
Daten zu speichern, ist das eine, doch man muss sie auch wiederfinden.
(Bild: Nirat.pix)

Ein effizientes und effektives Datenmanagement: Im Zeitalter der Digitalisierung wird das zu einem entscheidenden Erfolgsfaktor für Unternehmen. Kaum eine wichtige Geschäftsentscheidung wird mehr ohne die vorherige Auswertung von Daten getroffen. Hier gilt: Nur mit verlässlichen und lückenlosen Informationen können die bestmöglichen Entscheidungen getroffen werden.

Um das zu gewährleisten, müssen die beteiligten Mitarbeiter über die Herkunft, die Qualität, die Vollständigkeit und die Verfügbarkeit der Datenbestände genau Bescheid wissen. Keine einfache Aufgabe, denn das Management der Daten war noch nie so komplex und schwierig. Einerseits wächst die Datenmenge rasant, andererseits erfordern neue Anwendungsfelder wie Big Data, Cloud-Hosting oder Self-Service-Analytics den Einsatz neuer Technologien. Hinzu kommen behördliche Regulierungen, die strenge Vorgaben für die Handhabung von Datensätzen festlegen.

Angesichts dieser Herausforderungen erfahren Datenkataloge eine Renaissance. Von ihrem anfänglichen Dasein als bloße Dateninventarlisten und Suchwerkzeuge haben sie sich inzwischen zu einem entscheidenden Tool nicht nur für IT- und Datenspezialisten, sondern für Mitarbeiter aller Abteilungen weiterentwickelt. Keine einfache Aufgabe angesichts der wachsenden Datenmenge, mit der Unternehmen konfrontiert sind.

Der Datenkatalog als wichtiges Tool im modernen Datenmanagement

Ein Datenkatalog – alternativ auch „Data Catalog“ oder „Datenverzeichnis“ genannt – ist ein zentralisiertes Register von Metadaten, das alle relevanten Informationen über die Daten, ihre Definitionen, Quellen sowie ihre Beziehung untereinander umfasst. Das verschafft den Mitarbeitern eine einheitliche Struktur und Übersicht über den gesamten Datenbestand. Damit besitzen Datenkataloge einen signifikanten strategischen Wert für verschiedene Unternehmensbereiche.

Chief Data Officer und Chief Analytics Officer etwa benötigen Datenkataloge als Basis für Data Asset Management, Data Governance und Self-Service-Analysen. Compliance-Verantwortliche ermöglicht eine zuverlässige Katalogisierung sensibler Daten hingegen, die strengen Anforderungen der EU-Datenschutz-Grundverordnung (DSGVO) zu erfüllen. Moderne Lösungen besitzen zudem eine intuitive Oberfläche, dank der auch nicht-technische Mitarbeiter schnell relevante Daten finden, verwalten und ihre Qualität prüfen können – auch ohne IT-Fachkenntnisse.

Das zeigt: Die zentrale Katalogisierung von Informationen führt zu einer Verlagerung des IT-zentrierten Datenmanagements hin zu einer Kuration, die sich auf alle Unternehmensbereiche erstreckt und eine umfassende geschäftliche Zusammenarbeit ermöglicht.

Der erste Schritt: Metadaten mit System sammeln

Das wichtigste Merkmal eines effektiven Datenkatalogs ist seine Vollständigkeit. Wollen Unternehmen einen eigenen Katalog implementieren, müssen sie also zunächst ihren gesamten Datenbestand scannen und die dazugehörigen Metadaten erfassen. Zu berücksichtigen sind sämtliche Data Lakes, Data Warehouses, operationale Datenbanken sowie alle weiteren Datenbestände, die als wertvoll erachtet werden.

Die Masse an Metadaten manuell zu sammeln und zu strukturieren, wäre allerdings ein schier unmögliches Unterfangen und zudem fehleranfällig. Eine Software erledigt diesen Prozess automatisiert. Moderne Data-Intelligence-Lösungen wie der Intelligent Data Catalogue (IDC) von ASG Technologies nutzen maschinelles Lernen, um eine lückenlose Anreicherung zu gewährleisten. Automatisiertes Tagging und Recommendations sind dabei unerlässlich.

Den Ansprüchen verschiedener Anwender gerecht werden

Einfach ist die Auswahl eines geeigneten Datenkatalogs nicht. Immerhin muss er in die bestehende Geschäftskultur eingebettet werden und die Interessen sämtlicher Anwender berücksichtigen.

Nutzer des Datenkatalogs sind all jene Personen, die Daten reporten, visualisieren und analysieren. Dazu zählen hochqualifizierte Datenanalysten genauso wie Business-User. Die Lösung muss also einerseits einen gewissen Freiheitsgrad für die IT-Spezialisten bieten, damit diese problemlos die Anforderungen komplexerer Sachverhalte bedienen können. Gleichzeitig braucht sie auch ein hohes Maß an Benutzerfreundlichkeit, sodass auch Mitarbeiter mit wenig technischem Know-how davon profitieren können. Das gelingt am besten über eine intuitive Benutzeroberfläche.

Eine umfangreiche Software bietet zudem folgende Funktionen:

  • Data-Lineage zur Dokumentation des Datenflusses durch das Unternehmen sowie zur Transformation der Daten.
  • Intelligente Erkennung und Kennzeichnung persönlicher Daten sowohl in strukturierten als auch unstrukturierten Datenspeichern. Das ist Voraussetzung, um die Einhaltung der Datenschutzbestimmungen zu unterstützen.
  • Rollenbasierten Zugriff auf die Daten.
  • Sofort einsatzbereite Workflows, um Datenzugriff zu verwalten.
  • Kennzeichnung von Business-Terms, die Bewertung der Datenqualität und die Zusammenarbeit verschiedener Nutzer anhand von Rankings, Kommentaren und Empfehlungen sowie Tag-Vorschlägen.

Fazit

Der Datenkatalog ist ein wesentlicher Bestandteil des modernen Datenmanagements geworden, um den Unternehmen nicht herumkommen werden. Nur wenn Mitarbeiter jederzeit Zugriff auf relevante, vollständige und verlässliche Daten haben, können sie das volle Potenzial der Informationen ausschöpfen, sie gewinnbringend einsetzen und fundierte Entscheidungen treffen.

Andreas Schaub, Enterprise Solution Engineer – Data Intelligence bei ASG Technologies.
Andreas Schaub, Enterprise Solution Engineer – Data Intelligence bei ASG Technologies.
(Bild: ASG Technologies)

*Der Autor: Andreas Schaub ist Enterprise Solution Engineer – Data Intelligence bei ASG Technologies und seit mehreren Jahren in den Bereichen Big Data, Metadaten-Management und Data Analytics tätig. Zu seinem Tätigkeitsfeld gehörten in dieser Zeit Entwicklung, Beratung und Konzipierung von Big Data und Metadaten-Management-Lösungen. Hierbei unterstützte er Kunden, effektive Datenstrategien zu entwickeln. Sein Ziel ist es, Daten in den Mittelpunkt der Entscheidungen zu stellen und gleichzeitig regulatorische Vorschriften einzuhalten.

(ID:46268055)