Mobile-Menu

Grundlagen des Cloud-Storage, Teil 1 Das A und O des Cloud-Speicherns: Datenmanagement

Von Michael Matzer 4 min Lesedauer

Anbieter zum Thema

Backup und Disaster Recover sind nur zwei der bekanntesten Verwendungsweisen von Cloud-Speicher, doch es gibt noch viele weitere, so etwa die Archivierung, Data Lakes und Data Warehouses zwecks Analysen sowie synchronisierte Replikation als grundlegende Sicherheitsmaßnahme. Cloud-Speicher wird inzwischen global am Netzwerkrand und für Niederlassungen bereitgestellt. Storage hat mittlerweile eine zentrale Bedeutung für die Informatik erhalten.

Wohin mit den Datenmassen? Cloud-Speicher haben sich längst für verschiedene Bedarfsfälle etabliert.(Bild:  jahidsuniverse - stock.adobe.com)
Wohin mit den Datenmassen? Cloud-Speicher haben sich längst für verschiedene Bedarfsfälle etabliert.
(Bild: jahidsuniverse - stock.adobe.com)

Die Datenflut steigt kontinuierlich weiter: Big Data ist zu einem Problem geworden, hinsichtlich Speicherkapazitäten, Energieverbrauch und Nachhaltigkeit. Betrug die weltweite Datenmenge laut Statista 2010 noch rund 2 Zettabyte, so waren es 2020 schon rund 64 ZB, und bis 2025 werden daraus gewaltige 181 ZB – nicht zuletzt durch die bis dahin eine Billion vernetzter Endgeräte.

Bildergalerie

Wohin mit den großen Datenmengen, mag sich der IT-Anwender fragen. Sollen sie besser in einem Cluster von Network-Attached-Storage-Geräten (NAS) beziehungsweise in einem Storage Area Network (SAN) gespeichert werden oder, wenn sie weiter so rasant zunehmen, doch lieber in einem der skalierbaren Cloud-Speicher? Und wenn ja, dann stellt sich die Wahl: Public Cloud, Hybrid-Cloud, On-Premises oder Co-Location? Für alle diese Betriebsmodelle gibt es mittlerweile Angebote. Die Wahl ist schwer und will wohlerwogen sein. Stets stellt sich die Frage der Betriebskosten, aber auch Zugriffs- und Datensicherheit gilt es dabei zu beachten. Diese Artikelserie befasst sich primär mit Cloud-Storage.

„Enterprise-Cloud-Speicher sind zur führenden und bevorzugten Methode zur digitalen Datenspeicherung geworden, insbesondere für kleine und mittlere Unternehmen“, schreibt der Anbieter Veritas Technologies. „Sie sind sicherer als die lokale Speicherung, da dort Datensicherheitsmaßnahmen auf Branchenebene zum Einsatz kommen. Außerdem sind sie platzsparend und kostengünstig, weltweit verfügbar, ermöglichen das schnelle Synchronisieren und Freigeben von Dateien und verhindern Datenverlust.“

Cloud-Storage ist nach der Definition des Standardisierungsgremiums NIST ein Teilgebiet von Cloud-Computing. Manche Storage-Dienste funktionieren beispielsweise nur in Kooperation mit Compute-Diensten. Wie der Name schon sagt, stellen Cloud-Storage-Dienste Speicherkapazitäten in verteilten Rechenzentren bereit. Sie werden auch als Backup-as-a-Service (BaaS) und als Disaster-Recovery-as-a-Service (DRaaS) bezeichnet, wenn es um die Datensicherung beziehungsweise -wiederherstellung geht. Mehr Details finden Sie im E-Book „Disaster Recovery – Konzepte für den Daten-Notfall“.

Cloud-Computing benötigt mitunter hohe Rechenleistung, aber sehr wenig Speicherkapazität, bei Cloud-Storage verhält es sich genau umgekehrt: Enorme Speichermengen können ohne viel Rechenleistung – sie wird für die Verwaltung (Tiering, Verschlüsselung, Verteilung, Kompression, Deduplizierung, Zugriffsverwaltung und so weiter) benötigt – gehandhabt werden. Alle diese Aspekte werden in dieser Artikelserie betrachtet.

Datenmanagement

Datenmanagement im Storage-Bereich ist einer der am schnellsten wachsenden Bereiche in der Storage-Software-Entwicklung. Denn mit einem intelligenten und ausgefeilten, individuell angepassten Datenmanagement lassen sich erhebliche Kosten einsparen und Leistungsvorteile erzielen, beispielsweise durch Datenkompression und Deduplizierung. Optimiertes Datenmanagement ermöglicht die Entwicklung innovativer Apps für die Cloud, für Kubernetes-Plattformen und Supercomputing-Umgebungen, die KI nutzen.

NAS und SAN mögen für manche Anforderungen ausreichende Technologien im lokalen Rechenzentrum sein. Doch auch die Public Cloud rentiert sich nur dann, wenn man es versteht, ihre Ressourcen und Nutzungsbedingungen richtig zu nutzen. Diesbezüglich sollte sich der Nutzer frühzeitig kundig machen, um grobe Fehler zu vermeiden, die sein Unternehmen teuer zu stehen kommen können.

Die Webseiten der Hyperscaler beispielsweise bieten weitreichende Informationen, doch darüber hinaus ist Beratung nötig, um die zu abonnierenden Dienste miteinander zu integrieren. Zudem sind gesetzliche Vorgaben wie die DSGVO zu beachten, die unter anderem bestimmen, ob inländische Kundendaten im Ausland gespeichert werden dürfen. Vor diesem Hintergrund geht der Trend zur Regionalisierung von Diensten aus der Public und Hybrid-Cloud.

Vorgaben für Datenmanagement

Die Vorgaben für das Datenmanagement beruhen auf einer Reihe von Parametern, die jede Kosten- und Leistungskalkulation bestimmen. So spielt etwa Latenz eine wichtige Rolle für bestimmte Workloads, doch auch die Public Cloud erweist sich nicht immer als die schnellste Speicherressource, insbesondere dann, wenn es darum geht, „alte“ Archivdaten wiederherzustellen. Latenz hängt von technischen Faktoren wie Verbindungstechnik, Datendurchsatz, Bandbreite, Protokoll und Distanz ab.

Jetzt Newsletter abonnieren

Täglich die wichtigsten Infos zu Data-Storage und -Management

Mit Klick auf „Newsletter abonnieren“ erkläre ich mich mit der Verarbeitung und Nutzung meiner Daten gemäß Einwilligungserklärung (bitte aufklappen für Details) einverstanden und akzeptiere die Nutzungsbedingungen. Weitere Informationen finde ich in unserer Datenschutzerklärung. Die Einwilligungserklärung bezieht sich u. a. auf die Zusendung von redaktionellen Newslettern per E-Mail und auf den Datenabgleich zu Marketingzwecken mit ausgewählten Werbepartnern (z. B. LinkedIn, Google, Meta).

Aufklappen für Details zu Ihrer Einwilligung

Der nächste Faktor ist das Speichermedium selbst. Es gibt relativ schnelle Medien wie Flash-Memory mit NVMe-Support, mittelschnelle wie Festplatten und relativ langsame wie Tape-Libraries. Das schnellste Speichermedium wie etwa eine QLC-SSD muss nicht unbedingt das robusteste und zuverlässigste oder langlebigste sein. Die Workload und der Use-Case bestimmen also, welche Medien sich für einen Zweck am besten eignen.

Bildergalerie

Ein weiterer wichtiger Faktor ist die Speicherdauer in Verbindung mit der Zugriffsfrequenz. Echtzeitdaten erfordern entsprechend schnelle Medien, aber nur für kurze Zeit, etwa im Streaming oder im IoT. Denn diese schnellste Speicherklasse ist in der Public Cloud mit höchsten Gebühren belastet. Umgekehrt werden langlebige Daten mit langer Speicherdauer, auf die nur selten oder ab und zu zugegriffen wird, mit den niedrigsten Gebühren belastet. Die CSPs stellen entsprechende Tools bereit, um sowohl die Speicherdauer als auch die Zugriffsfrequenz messen zu können. Der Nutzer kann seine Nutzung von Cloud-Speicher entsprechend anpassen.

Denn von Speicherdauer und Zugriffsfrequenz hängt die wichtigste Methode des Datenmanagement ab: intelligentes Tiering. Damit werden die Daten, die sich entweder auf bestimmten Speichermedien oder in entsprechenden Speicherklassen befinden, dergestalt angeordnet, dass sie

  • 1. kostengünstig,
  • 2. leistungsoptimiert und
  • 3. für Workloads und Latenz optimiert angeordnet sind.

Was zunächst nach der Quadratur des Kreises klingt, ist heute bereits vielfach Realität: Statistische Verfahren, Richtlinien und Machine-Learning-Modelle sorgen dafür, dass jede Anforderung im Gesamtsystem optimal erfüllt wird. Dass wiederum das Storage-System entsprechende Veränderungen erfährt, ergibt sich daraus. Daher auch der starke Trend zu möglichst flexiblen IT- und Storage-Strukturen.

Aktuelles eBook

NAS oder Cloud-Storage?

eBook NAS oder Cloud-Storage
eBook „NAS oder Cloud-Storage?“
(Bild: Storage-Insider)

Eine der zentralen Fragen für nahezu alle Unternehmen lautet: Wohin mit den großen Datenmengen? Unser neues eBook vergleicht Vor- und Nachteile von NAS-Geräten und Cloud-Speicherlösungen. Diese unterscheiden sich in vielerlei Hinsicht, sei es bei der Skalierbarkeit, Daten- und Zugriffssicherheit und Compliance – doch der Nutzer sollte sich stets die Frage stellen: „Für welche Anwendung benötige ich diesen oder jenen Speichertyp?“

Die Themen im Überblick:

  • Wohin mit der ausufernden Datenflut?
  • Vor-Ort-Speicher in einem verteilten Netzwerk
  • Cloud-Speicher in verteilten Rechenzentren

(ID:50248466)