Sieben Datenmanagement-Tipps

Es kommt auf die richtige Strategie an

| Autor / Redakteur: Paul Ferraro / Tina Billo

Paul Ferraro gibt Tipps rund um das Thema Datenmanagement.
Paul Ferraro gibt Tipps rund um das Thema Datenmanagement. (Bild: gemeinfrei - Gerd Altmann / Pixabay / CC0)

Für Unternehmen entwickelt es sich zu einer immer größeren Herausforderung, ihren massiv ansteigenden Bestand an Daten verfügbar und zugänglich zu halten. Paul Ferraro, Technologieberater bei Evotek, erläutert in einem Blogbeitrag des Speicher-Startups Igneous, wie sich diese Aufgabe meistern lässt.

"Was wir haben, ist eine Datenschwemme" ist ein gern von Storage-Herstellern zitierter Satz des US-amerikanischen Mathematikers, Informatikers und Science-Fiction-Autors Vernor Vinge. Tatsächlich ist die Menge der heute weltweit gespeicherten Daten größer denn je und nimmt kontinuierlich zu.

Deren wertschöpfende Nutzung entscheidet inzwischen häufig über den Markterfolg von Unternehmen. Doch die Aufbewahrung der Daten unter Einhaltung immer strengerer Compliance-Auflagen plus diese für den Zugriff von jedem beliebigen Firmenstandort aus durchgängig bereitzustellen, ist keine triviale Angelegenheit. Hier hilft, eine gute Datenmanagement-Strategie in petto zu haben - sieben Tipps, die bei der Entwicklung hilfreich sein könnten.

Daten bereinigen

Viele gespeicherte Daten werden gar nicht mehr verwendet, dennoch belegen sie Ressourcen. Doch die wenigsten Unternehmen bereinigen ihren Bestand. Vielmehr kaufen sie weitere Storage-Arrays hinzu - besonders wirtschaftlich ist diese Vorgehensweise nicht.

Hinzu kommt, dass große Unternehmen heute meist rund um den Globus mit Niederlassungen vertreten sind. Daten müssen übergreifend zur Verfügung stehen, diese an die einzelnen Standorte zu replizieren, kostet jedoch Netzbandbreite und damit Geld.

Die Speicherinfrastruktur auf dem aktuellen Stand zu halten - im Regelfall erfolgt ein "Refresh" alle drei bis fünf Jahre - treibt die Investitionsspirale weiter in die Höhe. Kommen beispielsweise zu Anfang fünf Arrays mit jeweils 200 Terabyte Storage-Kapazität zum Einsatz, besteht die Möglichkeit im Zuge des Upgrades ein Petabyte an Speicher zu erwerben und 500 Terabyte an Daten auszumustern. Dies ist allerdings leichter gesagt, als getan.

Daten klassifizieren

Für den Schutz des geistigen Eigentums Sorge zu tragen, ist in vielen Fällen ein bei Datenmanagementstrategien ebenfalls stiefmütterlich behandelter Punkt. Dies erfordert zunächst einmal, Datenbestände in zwei Kategorien zu unterteilen: In Informationen, auf die lediglich nach dem Prinzip "Kenntnis nur, wenn nötig" zugegriffen werden darf und in solche, die sich breiter teilen lassen.

Zu ermitteln, in welche Gruppe die Daten fallen, ist allerdings nur die eine Sache. Die andere, sie so zu sperren, dass sie sich sobald erforderlich von hierfür berechtigten Mitarbeitern trotzdem schnell und ohne Zugriffsprobleme abrufen lassen. Des Weiteren müssen sie so gesichert werden, dass sie sich jederzeit schnell wiederherstellen lassen.

Datenmuster verstehen

Der überwiegende Teil der heute in Unternehmen erzeugten Daten ist unstrukturiert. Um zu bestimmen, wer sie verwendet, wo sie am besten gespeichert und wie lange sie aufbewahrt werden sollten etc., heißt es, deren grundlegende Muster zu verstehen.

Der exorbitante Anstieg des Anteils an unstrukturierten Daten am Gesamtvolumen, wird gerne mit dem als "kambrische Explosion" bezeichneten scheinbar unvermittelten Entstehens eines enormen Artenreichtums an Tieren verglichen.
Der exorbitante Anstieg des Anteils an unstrukturierten Daten am Gesamtvolumen, wird gerne mit dem als "kambrische Explosion" bezeichneten scheinbar unvermittelten Entstehens eines enormen Artenreichtums an Tieren verglichen. (Bild: Patrick Cheesman)

Am besten startet man damit, große Datensätze dahingehend zu prüfen und arbeitet sich von diesem Punkt ausgehend schrittweise weiter vor. Hierbei sollte die IT-Abteilung eng mit den Eigentümern der Daten zusammenarbeiten. Hilfestellung kann zudem der Einsatz von hierauf ausgelegten Software-Lösungen von Drittanbietern leisten.

Self-Service einführen

Mitarbeiter sollten zudem Storage-Ressourcen und -dienste jederzeit kostenlos nutzen sowie nicht mehr benötigten Speicherplatz selbstbestimmt freigeben können. Eine Grundvoraussetzung hierfür ist, dass mit den Daten arbeitende Anwender jederzeit einsehen können, wie auf diese zugegriffen und wie sie genutzt werden.

Zusätzlich sind Funktionen erforderlich, mit denen sich datenbezogene Aufgaben, darunter beispielsweise die Archivierung oder das Löschen von Informationen - automatisieren und von den Nutzern selber steuern lassen.

Datenworkflows prüfen

IT-Verantwortliche müssen nicht nur über die ruhenden Daten Bescheid wissen, sondern auch, wie es um die Leistungsanforderungen bestellt ist, die das Grid oder die Anwendungen an die Speicherplattform stellen. Beispielsweise ist es möglich, dass für die Verarbeitung der Daten anfangs viel Performance vonnöten ist und im Zeitverlauf zurückgeht. Oder der Bedarf langsam ansteigt, zwischenzeitlich hoch ist und dann wieder abfällt.

Insofern bietet es sich an, einen genauen Blick auf die Muster der einzelnen Datenworkflows zu werfen. Dadurch lässt sich besser beurteilen, ob und wie sich die für die Verarbeitung von Daten erforderliche Leistung während des Lebenszyklusses von Projekten ändert.

Die Spreu vom Weizen trennen

Alle Daten vorzuhalten bedeutet, dass die Infrastrukturkosten - also die Ausgaben für Speicher, Vernetzung und Rechenzentrumskomponenten - höher sind, als sie sein müssten. Sicherlich ist es schwierig zu entscheiden, welche Datensätze von Wert sind und welche nicht. Doch indem die Spreu vom Weizen getrennt wird, lassen sich viele Euros einsparen.

Ein weiterer Pluspunkt ist, dass tatsächlich nicht mehr alle Daten, sondern nur die für die Zusammenarbeit an den einzelnen Standorten nötigen Informationen repliziert werden müssen. Letztlich lassen sich auch aus verschiedenen Gründen unzureichend ausgelastete Arrays besser nutzen.

Datenportabilität sicherstellen

Daten sollten möglichst nicht in bestimmten Plattformen gefangen oder an bestimmte Anwendungen oder Tools gebunden sein, da sie möglicherweise auch an anderer Stelle zur Verfügung gestellt werden müssen. So ist es vielleicht erforderlich, bislang nur in der Zentrale gespeicherte Daten weltweit zugänglich zu machen oder bereits an verschiedenen Standorten lokal vorgehaltene Informationen beständig zwischen den einzelnen Lokationen auszutauschen. Insofern sind Plattformen und Tools gefragt, mit denen sich die Daten ohne großen Aufwand verschieben und genau dort, wo gerade gebraucht werden, bereitstellen lassen.

Fazit

Eine gute Datenmanagementstrategie setzt somit voraus, dass Unternehmen mit ihren Datenworkflows und der Datennutzung vertraut sind, den Datenlebenszyklus bestimmende Richtlinien aufgesetzt sowie Self-Services eingeführt haben. Ebenso dass für die Speicherung und Bereitstellung von Daten Plattformen zum Einsatz kommen, die deren Mustern und Leistungsanforderungen am besten gerecht werden. Sind diese Bedingungen erfüllt, sinkt der ansonsten für das Storage-Management erforderliche Zeitaufwand von selbst.

Der Autor: Paul Ferraro ist Technologieberater bei Evotek. Zuvor war er 26 Jahre für Qualcomm tätig, zuletzt als Senior Director IT Global Infrastructure Services. In dieser Position überschaute er sämtlliche mit der Speicherung, der Verwaltung und dem Schutz von Daten verbundene Aufgaben sowie das Server-Management sowie virtuelle Infrastrukturdienste.
Der Autor: Paul Ferraro ist Technologieberater bei Evotek. Zuvor war er 26 Jahre für Qualcomm tätig, zuletzt als Senior Director IT Global Infrastructure Services. In dieser Position überschaute er sämtlliche mit der Speicherung, der Verwaltung und dem Schutz von Daten verbundene Aufgaben sowie das Server-Management sowie virtuelle Infrastrukturdienste. (Bild: Evotek)

Kommentare werden geladen....

Was meinen Sie zu diesem Thema?

Der Kommentar wird durch einen Redakteur geprüft und in Kürze freigeschaltet.

Anonym mitdiskutieren oder einloggen Anmelden

Avatar
Zur Wahrung unserer Interessen speichern wir zusätzlich zu den o.g. Informationen die IP-Adresse. Dies dient ausschließlich dem Zweck, dass Sie als Urheber des Kommentars identifiziert werden können. Rechtliche Grundlage ist die Wahrung berechtigter Interessen gem. Art 6 Abs 1 lit. f) DSGVO.
  1. Avatar
    Avatar
    Bearbeitet von am
    Bearbeitet von am
    1. Avatar
      Avatar
      Bearbeitet von am
      Bearbeitet von am

Kommentare werden geladen....

Kommentar melden

Melden Sie diesen Kommentar, wenn dieser nicht den Richtlinien entspricht.

Kommentar Freigeben

Der untenstehende Text wird an den Kommentator gesendet, falls dieser eine Email-hinterlegt hat.

Freigabe entfernen

Der untenstehende Text wird an den Kommentator gesendet, falls dieser eine Email-hinterlegt hat.

copyright

Dieser Beitrag ist urheberrechtlich geschützt. Sie wollen ihn für Ihre Zwecke verwenden? Kontaktieren Sie uns über: support.vogel.de/ (ID: 45655101 / Daten)