Speicheralternative für Datenberge, Teil 2

Objektspeicher: Leistungsmerkmale und Vorteile

| Autor / Redakteur: Erik Ottem / Tina Billo

Bei der objektbasierten Speicherung sorgt die Erasure-Coding-Technik in Verbindung mit der Verteilung von Daten über zahlreiche physische Speichersysteme an verschiedenen Standorten (Geo-Spreading) hinweg für eine hohe Datenverfügbarkeit.
Bei der objektbasierten Speicherung sorgt die Erasure-Coding-Technik in Verbindung mit der Verteilung von Daten über zahlreiche physische Speichersysteme an verschiedenen Standorten (Geo-Spreading) hinweg für eine hohe Datenverfügbarkeit. (Bild: JaCZhou)

Nach einem Blick auf die unterschiedlichen technischen Ansätze, die objekt-, datei- und blockbasierten Systemarchitekturen zugrunde liegen, und warum sich Object Storage insbesondere für die Speicherung großer unstrukturierter Datenmengen anbietet, geht es heute ins Detail. Die wichtigsten Charakteristiken im Überblick.

Unternehmen stehen vor der Herausforderung, mit dem exponentiellen Datenwachstum Schritt zu halten. Hierfür sind sie auf skalierbare Speicherplattformen angewiesen, die sich einfach verwalten lassen. Darüber hinaus müssen diese so ausgelegt sein, dass die vorgehaltenen Informationen jederzeit verfügbar und zudem umfassend geschützt sind.

Objektbasierte Speicher bieten genau diese Eigenschaften und sind zudem kosteneffizient. Aufgrund ihrer hohen Speicherdichte beanspruchen sie weniger Platz im Rechenzentrum und sind SAN- oder NAS-Implementierungen die Betriebskosten angehend überlegen. Darüber hinaus ermöglicht ihr Einsatz Unternehmen, cloudbasierte Strategien sowohl On- als auch Off-Premise umzusetzen.

Metadaten anstelle Indizes

Bei klassischen Storage-Architekturen ermöglichen Indizes die Skalierung über einen einzelnen Ordner hinaus. Nimmt jedoch die Zahl an Dateien zu, erweist sich deren Organisation in einer hierarchischen Struktur als Hürde und kann sich negativ auf die Leistung und Skalierbarkeit der Systeme auswirken.

Objektspeicher nutzen hingegen Metadaten, um Objekte in Buckets oder anderen logischen Einheiten zusammenzufassen und legen diese in einem einzigen flachen Adressraum ab. Dadurch lassen sich Kapazitäten effizienter und praktisch unbegrenzt skalieren, so dass stets ausreichend Platz für die Speicherung selbst großer Datenmengen bereitsteht.

Datenverfügbarkeit durch RAID

Bei traditionellen Speichersystemen ist RAID ein gängiger Ansatz, um die Verfügbarkeit von Daten sicherzustellen. Hierfür werden sie auf redundant angeordnete und voneinander unabhängige Festplatten verteilt. Dies bietet zwar Schutz vor Laufwerksausfällen, allerdings kann es während der Wiederherstellung zu Leistungsabfällen kommen. Die Erfahrung zeigt zudem, dass während des Prozesses die Wahrscheinlichkeit steigt, dass weitere der RAID-Gruppe zugehörige Festplatten ihren Dienst versagen.

Hinzu kommt, dass in den Systemen immer kapazitätsstärkere Festplatten zum Einsatz kommen. Dadurch kann sich ein Rebuild durchaus über mehrere Stunden oder gar Tage hinwegziehen und in Folge einen sofortigen Austausch des oder der Laufwerke erfordern. Tritt während der Wiederherstellung darüber hinaus ein nicht behebbarer Lesefehler auf, gehen die auf den Medien gespeicherten Daten dauerhaft verloren.

Daten- anstelle Hardware-Redundanz

Objektspeicher sichern Daten hingegen mittels Erasure Coding ab. Bei diesem Verfahren werden Daten mit Paritätsinformationen versehen, in Blöcke aufgeteilt und im Anschluss auf den zu Storage-Pools zusammengeschlossenen Speichermedien, -knoten oder auch Rechenzentren verteilt. Auf einem Laufwerk wird stets nur ein Datenbruchstück und auf einem Knoten lediglich die für die Wiederherstellung eines Objekts minimal benötige Zahl an Fragmenten gespeichert. Dies stellt auch beim Ausfall mehrere Komponenten sicher, dass die Daten weiterhin verfügbar sind. Ebenso fallen weder Rebuild-Zeiten an, noch kommt es zu Leistungseinbußen und ausgefallene Komponenten müssen nicht direkt ausgetauscht werden.

Die Verteilung der Daten auf drei verschiedene geographisch auseinanderliegende Standorte oder Rechenzentren (Geo-Spreading) gewährleistet deren hohe Verfügbarkeit. Im Gegensatz zur dreifachen Spiegelung werden jedoch nicht die gesamten Daten an jeden Standort repliziert, sondern vielmehr nur ein Drittel der per Erasure Coding kodierten Objektdaten pro Lokation gespeichert. Neben einem geringeren Netzverkehr lässt sich dadurch eine höhere Datenverfügbarkeit und Resilienz bei gleichzeitig niedrigeren IT- und Managementkosten erreichen.

Schutz vor schleichender Datenkorruption

Sogenannte Bit Rots können die Zuverlässigkeit von Speichermedien im Verlauf der Zeit herabsetzen und deren Ausfall verursachen. Hervorgerufen wird dies dadurch, dass Bits beim Schreiben auf den Datenträger unbeabsichtigt geändert werden. In Folge dessen kann es dazu kommen, dass ein Teil der Laufwerksoberfläche nicht mehr lesbar ist und Daten unwiederbringlich verloren gehen. Insofern ist der Schutz inaktiver auf Festplatten gespeicherter Informationen unerlässlich.

Techniken wie RAID helfen hier allerdings nur wenig weiter. Zwar minimiert sich durch ihren Einsatz das Risiko, dass Laufwerke komplett ausfallen. Gegen den schleichenden Verlust von Bits auf Magnetspeichern können sie jedoch nichts ausrichten. Anders verhält es sich bei Objektspeichern, die zur Bereinigung von Daten unter anderem Festplatten auf ihre Konsistenz prüfen. Sollte sich dabei herausstellen, dass ein Datenfragment beschädigt ist, lässt sich dies anhand der in den übrigen Bruchstücken des Objekts gespeicherten Paritätsinformationen rekonstruieren. Dies bietet den Vorteil, dass sich von Bitfehlern betroffene Dateien wiederherstellen lassen, ohne dass hierfür ein Rebuild des Laufwerks oder dessen Austausch nötig ist.

Hohe Datenbeständigkeit

Die Absicherung der Daten per Erasure Coding, ihre Verteilung auf mehrere Standorte plus der für die Validierung der Informationen auf den Speichermedien genutzten Bereinigungstechniken stellt eine hohe Datenbeständigkeit sicher. Diese kann bei bis zu 99,999999999999999 liegen. Auf die Zahl gespeicherter Objekte übertragen heißt dies, das von eintausend Billionen gespeicherten Objekten im besten Fall nur eines unlesbar wäre. Insofern überrascht es nicht, dass Object Storage zunehmend die Basis von Hyperscale-Rechenzentren und Cloud-Computing-Umgebungen stellt.

Speicher- und standortübergreifendes Management

Bei der objektbasierten Speicherung werden alle Objekte in einer flachen anstelle hierarchisch aufgebauten Struktur in einem einzigen Namensraum abgelegt, selbst wenn sie auf unterschiedlichen Systemen oder an verschiedenen Standorten liegen. Dadurch lassen sich mannigfaltige Storage-Racks wie ein einziges System aus einer Hand zentral verwalten.

Obwohl die Daten auf mehrere Speicher an verschiedenen Standorten verteilt sind, wird der eigentliche Betrieb nur einmal ausgeführt und erfolgt für den Anwender nicht sichtbar im Hintergrund. Durch die Nutzung eines einzigen Adressraums lässt sich der Speicherpool übergreifend verwalten. Das ist deutlich einfacher, als jeden Standort einzeln zu managen.

Fazit

Zusammengenommen bieten sich Objektspeicher für die kostengünstige Speicherung, Verwaltung und Nutzung großer Datenmengen an. Aufgrund ihrer hohen Speicherdichte, Skalierbarkeit und Verfügbarkeit, den integrierten Datenschutzmechanismen plus der einfachen Verwaltung stellen sie eine gute Alternative zu bislang in Rechenzentren betriebenen klassischen Storage-Systemen dar, die sich auch unter Investitions- und Betriebskosten auf Dauer rechnet.

* Erik Ottem ist Director Produktmarketing Data Center Systems bei Western Digital

Kommentare werden geladen....

Was meinen Sie zu diesem Thema?

Der Kommentar wird durch einen Redakteur geprüft und in Kürze freigeschaltet.

Anonym mitdiskutieren oder einloggen Anmelden

Avatar
Zur Wahrung unserer Interessen speichern wir zusätzlich zu den o.g. Informationen die IP-Adresse. Dies dient ausschließlich dem Zweck, dass Sie als Urheber des Kommentars identifiziert werden können. Rechtliche Grundlage ist die Wahrung berechtigter Interessen gem. Art 6 Abs 1 lit. f) DSGVO.
  1. Avatar
    Avatar
    Bearbeitet von am
    Bearbeitet von am
    1. Avatar
      Avatar
      Bearbeitet von am
      Bearbeitet von am

Kommentare werden geladen....

Kommentar melden

Melden Sie diesen Kommentar, wenn dieser nicht den Richtlinien entspricht.

Kommentar Freigeben

Der untenstehende Text wird an den Kommentator gesendet, falls dieser eine Email-hinterlegt hat.

Freigabe entfernen

Der untenstehende Text wird an den Kommentator gesendet, falls dieser eine Email-hinterlegt hat.

copyright

Dieser Beitrag ist urheberrechtlich geschützt. Sie wollen ihn für Ihre Zwecke verwenden? Infos finden Sie unter www.mycontentfactory.de (ID: 44874431 / Speichersysteme)