Mobile-Menu

Vast Data Gemini Universal Storage statt Storage Tiers

Von Klaus Länger

Vast Data gehört zu den aufstrebenden Storage-Anbietern ohne eigene Hardware-Fertigung. Die zertifizierten Appliances nutzen Flash-Speicher für alle Workloads. Mit Gemini hat die Firma ein Vertriebsmodell entwickelt, bei dem die Software separat bezogen wird.

Anbieter zum Thema

Vast Data setzt beim Storage auf eine disaggregierte Shared-Everything-Cluster-Architektur (DASE) statt auf Storage Tiers mit verschiedenen Schichten wie Flash, Hybrid-Flash und HDD.
Vast Data setzt beim Storage auf eine disaggregierte Shared-Everything-Cluster-Architektur (DASE) statt auf Storage Tiers mit verschiedenen Schichten wie Flash, Hybrid-Flash und HDD.
(Bild: DDevicee - stock.adobe.com)

Seit etwa einem Jahr ist der 2016 gegründete Storage-Start-up Vast Data international aktiv und laut Field CTO Sven Breuner der derzeit am schnellsten wachsende Infrastrukturanbieter weltweit. Ende Januar dieses Jahres hat das Unternehmen einen Distributionsvertrag mit Arrow für den europäischen Markt abgeschlossen, der auch deutschen Systemhäusern Zugriff auf Vast Data Gemini ermöglicht, das Storage-Business-Modell der Storage-Firma.

Bildergalerie

Gemini ist eine Universal-Storage-Software, die Kunden als Managed Service mit Laufzeiten zwischen einem und zehn Jahren mit und einer skalierbaren Kapazität ab 100 TB erwerben. Sie läuft auf von Vast Data vorgegebenen und zertifizierten Systemen, die durch Partner wie Avnet oder Lenovo gefertigt und unabhängig von der Software angeboten werden, aber vorinstalliert beim Kunden ankommen. Den Verkauf kompletter eigener Appliances hat der Anbieter bereits im Frühjahr 2021 beendet. Der Vorteil dieses Modells ist, dass die Kunden selbst die Hardware aktualisieren können, ohne dass neue Software-Lizenzen benötigt werden. Die Firma garantiert dabei eine Hardware-Kompatibilität für zehn Jahre.

QLC-Flash für alle Workloads

Die Besonderheit der Storage-Lösung von Vast Data liegt im Universal Storage. Die Systeme sollen alle Arten von Workloads von KI bis zur Archivierung mit einer einheitlichen Storage-Architektur bewältigen – es gibt kein Storage-Tiering. Vast Data setzt stattdessen auf eine disaggregierte Shared-Everything-Cluster-Architektur (DASE). Die Storage-Software läuft in Containern auf skalierbaren Server-Nodes, die Daten liegen auf hochverfügbaren Storage-Enclosures mit Flash als Speichermedium und einem gemeinsamen Namespace. Die Verbindungsschicht ist eine NVMe-Fabric auf Basis von Ethernet oder Infiniband, über die alle Nodes Zugriff auf alle Enclosures haben.

In den eigentlichen Storage-Geräten kommen dabei zwei Arten von Speichermedien zum Einsatz: Günstiger Hyperscale-QLC-Flash mit hoher Kapazität sowie Storage Class Memory (SCM) für eine niedrige Latenz beim Schreiben durch das Puffern der Schreibvorgänge und als Speicher für umfangreiche Metadaten. Alle Speichermedien sind über NVMe angebunden. Die Composable-Infrastruktur ermöglicht eine unabhängige Skalierung aller Komponenten.

Für eine möglichst hohe Ausnutzung der Speicherkapazität der einzelnen QLC-Drives sorgen lokal dekodierbare Erasure Codes mit nur 2,7 Prozent Overhead und eine spezielle Form der Datenkompression, die der Hersteller „Similarity” nennt. Hier werden in ihrem Hash-Wert ähnliche Speicherblöcke gemeinsam komprimiert, um eine möglichst hohe Kompressionsrate zu erreichen und dann erst aus dem SCM in den QLC-Speicher zu übertragen.

Laut Vast Data soll die Similarity-Technologie so die sonst übliche Kombination aus Komprimierung und Deduplizierung in der Effizienz übertreffen. So seien beispielsweise Kompressionsraten zwischen 1,1:1 bei vorkomprimiertem Videomaterial, 3:1 bei Trainingsdaten für Machine Learning und bis zu 20:1 bei per Backup gesicherten Enterprise-Daten möglich.

Multi-Protokoll-Unterstützung

Das Vast Operating System ist dem Hersteller zufolge eine Art Realtime-OS im Linux-Userspace, das nicht nur den Speicher verwaltet, sondern auch noch eine Multi-Protokoll-Unterstützung für den Zugriff auf die protokollunabhängig gespeicherten Daten erlaubt. Derzeit beherrscht der Protokoll-Manager NFS v3 und v4, SMB v2.1 und S3. Wie Breuner betont, nutzt seine Firma dabei einen selbst entwickelten und auf Performance optimierten NFS-Code mit RDMA- und GPUDirect-Unterstützung.

Weitere Features sind eine S3-kompatible API mit Object-Lock und Versionierung, ein Multi-Protokoll-Namespace, Load Balancing, Replikation auf andere Vast-Data-Cluster, Object-Storage-Systeme oder via S3 in die Public Cloud sowie Automatisierungs-Plug-ins für Kubernetes. Für das Management stellt der Hersteller pro Account einen eigenen Level-3-Ingenieur ab. Zudem können die Systeme auf Wunsch Telemetriedaten übertragen, die für ein vorausschauendes Management genutzt werden. Kunden und Partnern stehen ein webbasiertes Verwaltungstool auf Swagger-Basis und eine APU zur Verfügung.

Workloads für Universal Storage

Die möglichen Anwendungsszenarien für Universal Storage sind laut dem Field-CTO vielfältig. Für KI-Anwendungen eignen sie sich durch die enge Kooperation mit Nvidia und den GPUDirect-Support für eine sehr schnellen Datentransfer zu den GPUs. Zudem nennt Breuner Storage für Felder wie Life-Sciences, etwa für Genomanalysen, Finanzanalysen, Big Data, Medienstreaming oder HPC. Aber auch als Backup-Ziel sollen sich die Vast-Data-Cluster gut eignen, da sie einen guten Schutz gegen Angriffe und eine sehr schnelle Wiederherstellung der Daten bieten.

Hier sind Commvault, Veeam und Rubrik Partner aus dem Secondary-Storage-Sektor. Eine Nutzung der Vast-Data-Software direkt in der Public Cloud sieht Breuner noch nicht, da sie eine sehr spezielle Hardware als Basis benötigt, die Hyperscaler derzeit nicht im Portfolio haben. Hier soll es aber noch Gespräche geben.

Dafür ist Vast Data in Verhandlungen mit weiteren Hardware-Partnern und auf der Sucher nach weiteren Partnern im Channel. Im Blick hat das Unternehmen dabei vor allem kleinere Systemhäuser mit Storage-Expertise.

(ID:48178444)