Im Fokus: Cloud Storage Object-Storage skaliert besser – und ist jetzt auch noch schnell

Autor / Redakteur: Paul Speciale* / Dr. Jürgen Ehneß

Im Rahmen unseres Themenschwerpunktes „Im Fokus: Cloud Storage“ erläutern wir die unterschiedlichen Facetten des Komplexes, bieten einen mosaikartigen Überblick und gehen nicht zuletzt der Frage nach der jeweils geeigneten Cloud-Speicherstrategie nach. Der vorliegende Gastbeitrag beschäftigt sich mit dem Thema „Objektspeicher und Cloud“.

Firma zum Thema

Object-Storage liegt im Trend.
Object-Storage liegt im Trend.
(Bild: © Funtap - stock.adobe.com)

Jeden Tag entstehen in den unterschiedlichsten Bereichen mit stark zunehmender Geschwindigkeit unstrukturierte Daten. Genannt seien hier die Unterhaltungsindustrie oder auch das Gesundheitswesen, ferner große Banken sowie Dienstleister. Unstrukturierte Daten wachsen schneller als jede andere Art von Daten, die uns umgeben (der IT-Branchenanalyst Gartner beziffert das Wachstum auf etwa 30 bis 60 Prozent jährlich).

Unstrukturierte Daten machen heute 80 Prozent der Daten aus, die verwaltet werden müssen: Dokumente, Audio- oder Video-Files, Metadaten, Geodaten oder auch Daten aus der digitalen Medizin. Unstrukturiert sind grundsätzlich all jene Daten, die nicht sauber in die Zeilen und Spalten bekannter relationaler Datenbanken passen.

Speichern in Pre-Cloud-Zeiten

Bevor die Cloud in den Fokus des allgemeinen Interesses rückte, wandten sich Unternehmen mit Blick auf das Management strukturierter Daten meist dem sogenannten Block-Storage zu (manchmal auch „Block-Level Storage“ genannt). Realisiert wird Block-Storage üblicherweise in einem SAN (Storage Area Network). Block-Storage teilt Daten in Blöcke gleicher Größe auf. Diese Blöcke haben Adressen, um den Zugriff über ein Netzwerk mehrerer Server zu organisieren. Für das Speichern unstrukturierter Daten und Files sowie unabhängigen, aufwandsarmen Zugriff gingen Unternehmen in Pre-Cloud-Zeiten eher den Weg des dedizierten Network Attached Storage (NAS). Im Gegensatz zu Fileservern sind sogenannte Netzwerkspeicher kostengünstiger und auch weniger intensiv in der Betreuung.

Object-Storage hingegen ist ein etwas jüngeres Speichermodell, das vor etwas mehr als zwanzig Jahren aufkam, aber erst mit Public-Cloud-Diensten wie etwa AWS S3 um das Jahr 2006 plötzlich rasch an Popularität gewann. Neben File- und Block-Storage ist Object-Storage seither in Rechenzentren von Unternehmen immer häufiger anzutreffen und hat sich zu einer zuverlässigen Lösung gerade für die Speicherung sehr großer, dynamischer Mengen unstrukturierter Daten entwickelt. Object-, File- und Block-Storage haben jeweils ihre eigenen Schnittstellen oder Zugriffsprotokolle. NAS verfügt über die beliebten NFS- und SMB-File-Protokolle, in jüngerer Zeit haben sich Angebote und Dienste zu Object-Storage um die AWS S3 API herum entwickelt.

Daten in logischen Containern

Der objektbasierte Ansatz, der anfangs mehr auf Archivdaten fokussiert war und sicherlich zunächst nicht mit Schnelligkeit in Verbindung gebracht wurde, unterscheidet sich grundlegend von blockbasierten Ansätzen. Object-Storage organisiert Daten in logischen Containern. In der AWS-S3-Terminologie werden diese als „Buckets“ bezeichnet. Innerhalb von Buckets können eine unbegrenzte Anzahl von tatsächlichen Inhalten gespeichert werden, die als „Objekte“ bezeichnet werden. Bei Object-Storage wird die übliche hierarchische Struktur des File-Systems (Verzeichnisse und Unterverzeichnisse) durch eine einfache, flache Struktur – auch als „Object Name Space“ bezeichnet – ersetzt. Diese flache Hierarchie ermöglicht einen einheitlichen Zugriff auf potenziell Milliarden von Objekten.

Neues eBook

Umfassender Überblick über die verschiedenen Möglichkeiten für Cloud-Storage

Cloud-Speicher-Strategien im Vergleich

eBook Cloud-Speicher
eBook Cloud-Speicher
(Bildquelle: Storage-Insider)

Die Hauptthemen des eBooks sind:
# Günstig, schnell und sicher: Storage in der Cloud
# Wozu Cloud-Storage-Plattformen?
# Exklusiver Cloud-Storage vor Ort
# Standardisierter Cloud-Storage von Providern
# Das Beste aus beiden Welten vereinen
# Alternativlos – aber die Qual der Wahl bleibt


>>> eBook „Cloud-Speicher-Strategien im Vergleich“ downloaden

In den meisten modernen „Scale-Out“-Lösungen des Object-Storage kann die Speicherkapazität ganz einfach durch Hinzufügen weiterer Ressourcen auf Petabyte-Niveau (und darüber hinaus) erweitert werden. Im Gegensatz dazu zeigen traditionelle, File-basierte Speicherlösungen wie etwa NAS-Plattformen mit zunehmender Anzahl von Files klare Beschränkungen in der Skalierung.

Elastisch, flexibel und leicht skalierbar

Aus diesem Grund eignen sie sich in der Regel für eine überschaubarere Anzahl von Files sowie insgesamt kleinere Gesamtkapazitäten. Block-Storage wiederum ist sinnvoll bei Daten in einem strukturierten Kontext. Sie ist optimal geeignet für Random Access auf kleine Datensätze, etwa in einem vorgegebenen Datenbanksystem.

Mit Blick auf ihre eindeutigen Stärken (Einfachheit, Effizienz, Wirtschaftlichkeit, Skalierbarkeit, Metadaten-Tagging) ist es keine Überraschung, dass objektbasierte Ansätze schnell begonnen haben, wichtige Arbeitslasten zu dominieren. Nun ist Object-Storage auch in der Lage, All-Flash-Speicherung zu unterstützen, sodass die Liste der Vorteile um High-Performance erweitert werden kann. Object-Storage ist der Speicher der Wahl in der Cloud im Kontext unstrukturierter Daten, weil er elastisch und flexibel ist und sich zudem leichter skalieren lässt, bis hin zu hunderten Petabytes und mehr.

Das sind Gründe, die Object-Storage gerade auch für aufkommende Anwendungsfälle im Edge-Bereich attraktiv machen. Unter einem sogenannten „Edge Device“ versteht man zunächst den Ort, an dem Daten gesammelt werden – das können ein Mobiltelefon, ein Auto, ein Kühlschrank oder jedes beliebige Gerät sein, das über das Internet der Dinge (IoT) verbunden ist. Hier kommt es speziell auf die Unterstützung bei dynamischem Datenwachstum sowie den schnellen Zugriff in der Nähe des Entstehungsortes der Daten an. In Edge-Umgebungen sind ältere SAN- und NAS-Systeme unflexibel und oft inkompatibel mit Blick auf diese konkreten Anwendungsfälle, da die Anwendungen naturgemäß Cloud-freundliche APIs wie etwa S3 nativ benötigen.

Konvergenz zwischen File und Object als Schlüsselfaktor

Wann immer der Weg zur Cloud zu weit ist, rückt aus Sicht der Industrie und auch der Hersteller Object-Storage in den Vordergrund, insbesondere bei Anwendungen, die große Data-Streams von einer Vielzahl an mobilen Geräten erfassen. Dazu gehören heute Event-Streams aller Art sowie deren Protokolle, aber auch Daten aus dem Bereich der Connected Cars sowie Bild- und Videodaten aus dem medizinischen IoT-Sektor.

Diese Anwendungen werden Cloud-native entwickelt und orientieren sich an Object-Storage-RESTful-Protokollen. Object-Storage auf Flash-Medien wird vor diesem Hintergrund zur optimalen Wahl für die Unterstützung dieser wachsenden Klasse datenzentrierter Anwendungen.

Da viele Unternehmen noch dabei sind, schrittweise zur Cloud überzugehen, benötigen sie Unterstützung in der Datenspeicherung sowohl bei herkömmlichen – Legacy – als auch bei modernen Cloud-Anwendungen.

Lösungen, die darauf abzielen, File- und Object-Storage-Protokolle in ein und derselben Speicherplattform zu vereinheitlichen, erweisen sich mehr und mehr als sinnvoll – insbesondere hinsichtlich maschinell generierter Daten, moderner Verfahren zur Analyse sowie bei Ad-hoc-Anforderungen an hohe Rechenleistung. Daher ist die Konvergenz zwischen File und Object hier ein Schlüsselfaktor, der die Wiederverwendung von Daten erleichtert sowie mögliche Performance-Einbußen auf eine einzige Anwendung beschränkt.

On-Premises und Public Cloud

Das französisch-US-amerikanische Unternehmen Scality wird von IDC und Gartner als einer der Marktführer für die Konsolidierung hochperformanter File- und Object-Storage-Lösungen anerkannt. Scality konzentriert sich auf die Speicherung, den Schutz sowie die Verwaltung großer Mengen unstrukturierter Daten sowohl On-Premises als auch in Public Clouds. Das Flaggschiffprodukt RING fungiert als integrierte Speicherlösung, die File- und Object-Storage nativ kombiniert und gleichzeitig Public Clouds sowie lokale Implementierungen unterstützt. Die Enterprise-Cloud- und Edge-Speicherlösungen von Scality sind mit einer großen Auswahl an Hardware-Produkten kompatibel. Kürzlich hat Scality eine All-Flash-Unterstützung für RING8 Object Storage seinem Portfolio hinzugefügt, um insbesondere Performance-sensitive File- und Object-Workloads abzudecken. Das Scale-Out-File-System des Anbieters ist zudem in der Azure Cloud verfügbar.

Je schneller Unternehmen heute Daten verarbeiten können, desto zügiger können wesentliche Geschäftsentscheidungen fallen. Performance ist daher ein wichtiges Argument für die Verlagerung der Datenverarbeitung weg von traditionellen Rechenzentren und hin zur Public Cloud. Die Fähigkeit, die Datenverarbeitung sowie auch den Datentransfer zu beschleunigen, ist für die optimale Nutzung von Edge-Computing praktisch unerlässlich. Der Schlüssel zur Schnelligkeit liegt darin, jegliche Abhängigkeit von Netzwerken mit hoher Latenz zu beseitigen.

Beispielsweise nutzt Scality RING seit fast einem Jahrzehnt die Vorteile von Flash-Media, um Metadaten sowohl des internen File-Systems als auch des Object-Storage zu speichern. Bei File-Systemen beziehen sich diese Metadaten auf die Verzeichnisstrukturen, Berechtigungen, Dateinamen sowie Verzeichnisorte. Bei Object-Storage hingegen stehen diese Metadaten im Kontext der Container (Buckets in AWS S3) und der internen Attribute wie Bucket-Namen, Erstellungsdatum, Kontrollrichtlinien des Zugriffs sowie der IDs (Schlüssel) der Objekte im jeweiligen Bucket. RING geht im Namen der Performance sogar noch einen Schritt weiter: Gespeichert wird eine weitere Schicht interner Metadaten auf Flash (Location Indizes der Daten), wodurch die kostengünstigeren Speicherorte gezielt für die eigentlichen Daten-Payloads reserviert. Das bedeutet, dass ein sehr hoher relevanter Prozentsatz des operativen Zugriffs blitzschnell bedient werden kann.

Paul Speciale, Chief Product Officer Scality.
Paul Speciale, Chief Product Officer Scality.
(Bild: Scality)

Im Kontext des explosionsartigen Wachstums unstrukturierter Daten sowie der klaren Vorteile, die modernes Object-Storage im großen Maßstab gerade für hohe Anforderungen im Bereich Performance bietet, hat diese Art des Storage das Potential, künftig ein noch breiteres Spektrum an Workloads abzudecken. Bedarf und Markt sind hochdynamisch. Die Reise bleibt spannend!

*Der Autor: Paul Speciale, Chief Product Officer Scality

(ID:47023892)