Datenmengen im Petabyte-Umfang effektiv speichern

Dateisysteme, Cloud-Speicher und lokale Speicherlösungen für große Datenmengen: Oracle/Sun QFS, Fujitsu Exabyte File System, Amazon EFS, Azure Data Lake, IBM FlashSystem, Cray Cluster Store Datenmengen im Petabyte-Umfang effektiv speichern – Teil 4

20.07.2020 Von Thomas Joos 3 min Lesedauer

Anbieter zum Thema

Im vierten Teil unserer Reihe zur Datenspeicherung von Daten im Petabyte-Bereich befassen wir uns mit weiteren Dateisystemen, Cloud-Speichern in diesem Bereich und neuen Speichersystemen.

Dateisysteme für Big Data: hier Teil 4 unserer Übersicht.(Bild: gemeinfrei / Pixabay) — Dateisysteme für Big Data: hier Teil 4 unserer Übersicht.
(Bild: gemeinfrei / Pixabay)

In den ersten drei Teilen dieses Beitrags haben wir uns mit Dateisystemen befasst, die Daten im Petabyte-Bereich nicht nur theoretisch speichern können, sondern auch in der Lage sind, den benötigten Speicher den Anwendern und Workloads schnell und stabil zur Verfügung zu stellen. Den Abschluss machen weitere Dateisysteme sowie Cloud- und On-Premises-Speicherlösungen.

Dateisystem: Oracle/Sun Quick File System (QFS)

Bei Quick File System (QFS) handelt es sich um ein Dateisystem von Sun Microsystems. Durch die Übernahme von Sun Microsystems durch Oracle wurde das Open-Source-Dateisystem in die Produktlinie von Oracle übernommen. Das Dateisystem ist Bestandteil von SAM-QFS (Storage and Archive Manager). Hierbei handelt es sich um ein hierarchisches Speichermanagementsystem.

Dateisystem: Fujitsu Exabyte File System

Beim Fujitsu Exabyte File System (FEFS) handelt es sich um ein skalierbares, paralleles Dateisystem, das auf Lustre basiert. Wir haben Lustre bereits im dritten Teil unserer Reihe vorgestellt. Das Dateisystem ist optimiert für Fujitsu-HPC-Cluster. Unternehmen können ihre Speicherbereitstellungen horizontal skalieren. FEFS unterstützt Systeme mit bis zu 8 Exabyte (8.000 PB) Kapazität und 1 TB/s. Zusätzlich verfügt FEFS über Funktionen wie integrierte Hochverfügbarkeit aller Komponenten, Fair-Share-E/A-Verwaltung und Quoten auf Verzeichnisebene.

FEFS stellt Dateifreigaben zwischen einem HPC-Cluster-System mit FEFS-Server und FEFS-Client bereit. Der FEFS-Client arbeitet auf Rechenknoten und Anmeldeknoten, die mit hoher Geschwindigkeit verbunden sind. Das System nutzt InfiniBand und bietet transparenten Dateizugriff auf FEFS-Server. Der FEFS-Server umfasst Metadatenserver (MDS) und Objektspeicherserver (OSS) für Hochleistungsdaten. Mit redundanter Konfiguration von MDS und OSS bietet FEFS Hochverfügbarkeit und Failover-Funktionen. Die Systemkapazität und -leistung können dynamisch verändert werden.

Die Datenmengen steigen – und mit ihnen der Bedarf an geeigneten Dateisystemen. (Bild: © garrykillian - adobe.stock.com)

Cloud-Speicher: Amazon Elastic File System (EFS)

Bei Amazon Elastic File System (EFS) handelt es sich um ein skalierbares und verwaltetes NFS-Dateisystem in AWS. Administratoren können also selbst nicht in die Konfiguration von EFS zugreifen. Aktualisierung, Verwaltung und Patchen des Dateisystems werden von Amazon übernommen. Die Verwaltung läuft über Schnittstellen, mit denen Administratoren und Entwickler das System konfigurieren können.

Das System ist für die Verwendung von Cloud-Ressourcen in AWS optimiert. Die Skalierung erfolgt automatisch. Mit EFS lassen sich mehrere tausend VMs in EC2 anbinden. Die VMs erhalten parallelen Zugriff und hohen Durchsatz. Das System ist aber nicht lokal auf eigenen Servern einsetzbar, sondern ausschließlich in der Amazon-Cloud (AWS).

Cloud-Speicher: Azure Data Lake

Bei Azure Data Lake handelt es sich um einen Speicherbereich in Microsoft Azure, der nahezu beliebige Daten in unbegrenzter Menge speichern kann. Der Dienst kann auch gestreamte Datenmengen speichern und stellt seine Funktion für andere Dienste in Microsoft Azure zur Verfügung. Azure Data Lake kann Daten im Petabyte-Bereich speichern. Zusätzlich zu Hadoop unterstützt Azure Data Lake auch Spark, Storm, Flume, Sqoop, Kafka und andere Lösungen für Big Data, die mit Hadoop zusammenarbeiten.

Storage-Solution: IBM FlashSystem 7200, 9200 und 9200R

Es gibt viele Speicherlösungen von großen Anbietern wie HPE, Dell oder IBM, mit denen sich Daten in großer Menge speichern lassen. Die neuen Speichersysteme FlashSystem 7200, 9200 und 9200R von IBM unterstützen bis zu 4 Petabyte. Die Server basieren auf der Plattform Spectrum Virtualize. Die Storage-Systeme lassen sich in verschiedenen Bereitstellungsarten nutzen. Neben der Installation über Bare-Metal, kann die Umgebung auch virtualisiert und als Cloud-System gebucht werden. Auch Hybrid-Lösungen und Multi-Cloud-Anbindung ist möglich.

Die Systeme bauen auf FlashCore-Module auf und stehen natürlich als Racklösung zur Verfügung. Neben FlashCore werden in dem System auch Non-Volatile Memory Express (NVMe), Storage Class Memory (SCM), eine KI-basierte, vorausschauende Speicherverwaltung sowie die aktive Unterstützung durch Storage Insights bereitgestellt. Das FlashSystem wird assembliert geliefert, wobei Installation und Konfiguration von IBM durchgeführt werden.

Big Data zu speichern, übersteigt die Fähigkeiten herkömmlicher Dateisysteme. (Bild: © garrykillian - adobe.stock.com)

Storage-Solution: Cray Cluster Store für ein Exabyte und mehr

Der Supercomputerhersteller Cray baut für das Department of Energy (DOE) und das Oak Ridge National Lab (ORNL) eine Exabyte-Speicherlösung. Das Cray-ClusterStor-Speicherdateisystem wird als Teil des Frontier-Exascale-Supercomputers von ORNL integriert, der auf der Shasta Architektur von Cray aufbaut. Das Frontier-System wird voraussichtlich 2021 fertiggestellt.

Die neue Speicherlösung wird auf der nächsten Generation der ClusterStor-Speicherlinie von Cray basieren und aus mehr als einem Exabyte (EB) Hybrid-Flash und Speicher mit hoher Kapazität bestehen. Als Dateisystem wird Lustre eingesetzt. Verglichen mit dem Speicher für den aktuellen Summit-Supercomputer des ORNL, ist diese Lösung mehr als viermal so leistungsfähig und mehr als viermal so durchsatzstark. Die Speicherlösung wird aus über 40 Speicherschränken bestehen und mehr als 1 EB Gesamtkapazität über zwei Speicherebenen bieten.

Jetzt Newsletter abonnieren

Täglich die wichtigsten Infos zu Data-Storage und -Management

Geschäftliche E-Mail

Bitte geben Sie eine gültige E-Mailadresse ein.

Mit Klick auf „Newsletter abonnieren“ erkläre ich mich mit der Verarbeitung und Nutzung meiner Daten gemäß Einwilligungserklärung (bitte aufklappen für Details) einverstanden und akzeptiere die Nutzungsbedingungen. Weitere Informationen finde ich in unserer Datenschutzerklärung. Die Einwilligungserklärung bezieht sich u. a. auf die Zusendung von redaktionellen Newslettern per E-Mail und auf den Datenabgleich zu Marketingzwecken mit ausgewählten Werbepartnern (z. B. LinkedIn, Google, Meta).

Stand: 08.12.2025

Es ist für uns eine Selbstverständlichkeit, dass wir verantwortungsvoll mit Ihren personenbezogenen Daten umgehen. Sofern wir personenbezogene Daten von Ihnen erheben, verarbeiten wir diese unter Beachtung der geltenden Datenschutzvorschriften. Detaillierte Informationen finden Sie in unserer Datenschutzerklärung.

Einwilligung in die Verwendung von Daten zu Werbezwecken

Ich bin damit einverstanden, dass die Vogel IT-Medien GmbH, Max-Josef-Metzger-Straße 21, 86157 Augsburg, einschließlich aller mit ihr im Sinne der §§ 15 ff. AktG verbundenen Unternehmen (im weiteren: Vogel Communications Group) meine E-Mail-Adresse für die Zusendung von Newslettern und Werbung nutzt. Auflistungen der jeweils zugehörigen Unternehmen können hier abgerufen werden.

Der Newsletterinhalt erstreckt sich dabei auf Produkte und Dienstleistungen aller zuvor genannten Unternehmen, darunter beispielsweise Fachzeitschriften und Fachbücher, Veranstaltungen und Messen sowie veranstaltungsbezogene Produkte und Dienstleistungen, Print- und Digital-Mediaangebote und Services wie weitere (redaktionelle) Newsletter, Gewinnspiele, Lead-Kampagnen, Marktforschung im Online- und Offline-Bereich, fachspezifische Webportale und E-Learning-Angebote. Wenn auch meine persönliche Telefonnummer erhoben wurde, darf diese für die Unterbreitung von Angeboten der vorgenannten Produkte und Dienstleistungen der vorgenannten Unternehmen und Marktforschung genutzt werden.

Meine Einwilligung umfasst zudem die Verarbeitung meiner E-Mail-Adresse und Telefonnummer für den Datenabgleich zu Marketingzwecken mit ausgewählten Werbepartnern wie z.B. LinkedIN, Google und Meta. Hierfür darf die Vogel Communications Group die genannten Daten gehasht an Werbepartner übermitteln, die diese Daten dann nutzen, um feststellen zu können, ob ich ebenfalls Mitglied auf den besagten Werbepartnerportalen bin. Die Vogel Communications Group nutzt diese Funktion zu Zwecken des Retargeting (Upselling, Crossselling und Kundenbindung), der Generierung von sog. Lookalike Audiences zur Neukundengewinnung und als Ausschlussgrundlage für laufende Werbekampagnen. Weitere Informationen kann ich dem Abschnitt „Datenabgleich zu Marketingzwecken“ in der Datenschutzerklärung entnehmen.

Falls ich im Internet auf Portalen der Vogel Communications Group einschließlich deren mit ihr im Sinne der §§ 15 ff. AktG verbundenen Unternehmen geschützte Inhalte abrufe, muss ich mich mit weiteren Daten für den Zugang zu diesen Inhalten registrieren. Im Gegenzug für diesen gebührenlosen Zugang zu redaktionellen Inhalten dürfen meine Daten im Sinne dieser Einwilligung für die hier genannten Zwecke verwendet werden. Dies gilt nicht für den Datenabgleich zu Marketingzwecken.

Recht auf Widerruf

Mir ist bewusst, dass ich diese Einwilligung jederzeit für die Zukunft widerrufen kann. Durch meinen Widerruf wird die Rechtmäßigkeit der aufgrund meiner Einwilligung bis zum Widerruf erfolgten Verarbeitung nicht berührt. Um meinen Widerruf zu erklären, kann ich als eine Möglichkeit das unter https://contact.vogel.de abrufbare Kontaktformular nutzen. Sofern ich einzelne von mir abonnierte Newsletter nicht mehr erhalten möchte, kann ich darüber hinaus auch den am Ende eines Newsletters eingebundenen Abmeldelink anklicken. Weitere Informationen zu meinem Widerrufsrecht und dessen Ausübung sowie zu den Folgen meines Widerrufs finde ich in der Datenschutzerklärung.

Zum Speichern von Big Data benötigt man entsprechend dimensionierte Dateisysteme. (Bild: © garrykillian - AdobeStock)

(ID:46574206)