Mobile-Menu

Western Digital setzt auf NVME oF Composable-Plattform ermöglicht disaggregierte Systemdesigns

Autor / Redakteur: lic.rer.publ. Ariane Rüdiger / Jürgen Ehneß |

Western Digital kombiniert in seiner Systemserie OpenFlex F3100 NVMe oF (Non-Volatile Memory Express over Fabric) mit einer komplett Software-definierten Ad-hoc-Zuweisung der vorhandenen Systemressourcen. Server können damit von der Storage disaggregiert werden.

Anbieter zum Thema

Eine OpenFlex F3100; oben auf dem Gerät ein einzelnes Speichermodul.
Eine OpenFlex F3100; oben auf dem Gerät ein einzelnes Speichermodul.
(Bild: Western Digital)

Der Begriff „Composable Infrastructure“ ist in der IT schon länger bekannt. HPE brachte mit seiner Synergy-Plattform die bislang wohl verbreitetste Composable-Plattform auf den Markt. Doch nun gibt es Konkurrenz durch Western Digital mit seiner F3100-Serie, die sich ebenfalls mit dem Zusatz „Composable“ schmückt.

Merkmal von Composable-Infrastrukturen ist, dass alle Systemressourcen per Software-Befehl den jeweiligen Applikationen zugewiesen werden. Ist der Bedarf gedeckt, etwa, weil die geplanten Abläufe abgeschlossen sind, werden die Ressourcen freigegeben und stehen dann wieder zur Verfügung. Genau dieses Prinzip hat Western Digital in den Produkten der OpenFlex-F3100-Serie umgesetzt.

2015: Einstieg ins Systemgeschäft

Western Digital stieg 2015 zunächst mit dem Object-Storage-System „Active Archive“ ins Systemgeschäft ein. In OpenFlex unternimmt der Festplattenspezialist, der das Systemgeschäft seit 2016 verstärkt mit Plattformen angeht, noch einen weiteren innovativen Schritt: Er kombiniert die Composable-Technologien mit NVMe oF (Non-Volatile Memory Express over Fabric).

Das latenzarme RoCE-2.0-Protokoll befreit Flash-Storage von der Beschränkung, lediglich direkt an den Server angebunden zu funktionieren. Sie limitierte bislang Design- und Einsatzoptionen von NVMe-Speicherlösungen. Mit NVMe oF müssen sie sich nicht mehr in der unmittelbaren Nähe befinden, sondern nur irgendwo in der Fabric.

Disaggregation als Ziel

„Am Ende ist unser Ziel eine disaggregierte Systemarchitektur“, erklärt Manfred Berger, bei Western Digital EMEA und Indien verantwortlich für die Geschäftsentwicklung der Plattformlösungen. Zusammen mit dem US-amerikanischen Software-Unternehmen Liquid, das für die gesamte Orchestrierungsschicht zuständig ist, soll eine Fabric entstehen. In ihr sollen alle Systemressourcen von CPU über GPU bis zu Storage, Netzwerk und sogar FPGA-Chips (Floating Gate Programmable Array), etwa für KI-Aufgaben, ad hoc über die Fabric zugewiesen werden.

„Unser Ziel ist eine disaggregierte Systemarchitektur“, sagt Manfred Berger, bei Western Digital EMEA und Indien verantwortlich für die Geschäftsentwicklung der Plattformlösungen.
„Unser Ziel ist eine disaggregierte Systemarchitektur“, sagt Manfred Berger, bei Western Digital EMEA und Indien verantwortlich für die Geschäftsentwicklung der Plattformlösungen.
(Bild: Western Digital)

Doch derzeit steht erst einmal die Automatisierung der Storage selbst im Vordergrund. Als nächstes solle ein Software-gesteuerter Storage-Layer für Funktionen wie Spiegelung, Verschlüsselung et cetera entstehen, berichtet Berger. Ein solcher steht beispielsweise vom Österreicher Software-Unternehmen Linbit zur Verfügung.

Connectivity steckt im Storage-Modul

Wenig erbaut dürften Anwender sein, dass Western Digital für seine OpenFlex-Familie zwar beim klassischen 19-Zoll-Format bleibt, ansonsten aber ein eigenes Format entwickelt hat. „Wir verwenden etwas größere Module, um die Netzwerktechnologie direkt in den Modulen unterzubringen. Sie entsprechen dem neu geschaffenen SNIA-Standard SFF-TA-1013 bis 1015“, erklärt Berger. Selbstredend dürfe jeder die gewählte Bauform nutzen. Die Anbindung der Module an die Fabric erfolgt jeweils über zwei 50-GbE-Anschlüsse direkt am Modul. Sie sind redundant aus jeweils zwei 25-Gbit/s-Ethernetverbindungen zusammengesetzt, die mittels QSFP realisiert wurden. „Damit skaliert die Transportleistung mit der Zahl der Drives“, erklärt Berger. Switching-Fabrics zwischen den Modulen sind im Gerät unnötig.

Mehr als ein halbes Petabyte Storage

Jede selbstvirtualisierende Box fasst bis zu 614 TB Storage, die in dem 3U-Gehäuse auf die 10 x 2 Dual-Port-Slots verteilt werden können. Integrieren lassen sich Drives mit 12,8 bis 61,44 TB. Das System virtualisiert sich automatisch und ermöglicht je Modul bis zu 256 NVMe-Namespaces für die dynamische Bereitstellung von Speicher.

Tatsächlich können sich die Transportleistungen, die Western Digital für die OpenFlex F3100 angibt, sehen lassen: Pro Gerät sind es 21,9 Millionen IOPS bei einem vollbestückten System und zufälligen Lesezugriffen auf 4-KiB-Segmente (Kibibyte), beim Schreiben 24,3 Millionen IOPS. Beim sequentiellen Lesen von 128 KiB-Blöcken bringt es ein Gerät auf 117 GB/s, beim sequentiellen Schreiben in 32-KiB-Blöcken auf 99 GB/s. Das ist eine ganze Menge.

Protokollvielfalt im Netz

Auf der Transportschicht läuft RoCE 2.0 (RDMA over Converged Ethernet), andere Speicherprotokolle sind über einen Storage-Software-Layer realisierbar. RoCE v 2.0 lässt sich mit klassischen Routing-Protokollen verwenden und besitzt eine leistungsfähige Datenflusskontrolle. Als Zugriffsprotokoll dient das ressourcensparsame RDMA (Remote Direct Memory Access). Berger: „Wir haben in Pilotinstallationen damit Latenzen von 35 Mikrosekunden gemessen, also die Hälfte dessen, was eine lokale SAS-SSD schafft; damit eignet sich die Technologie für Echtzeittransfers.“

Durch die NVMe-Architektur werden mehrschichtige Speicherarchitekturen möglich, die über dieselbe Netzwerkanbindung mittels NVMe oF adressiert werden. Dabei lassen sich Flash und Disk kombinieren. „Wir machen es unnötig, für SSDs und Flash unterschiedliche Anbindungen einzusetzen“, betont Berger.

Wenig verwunderlich bei den am Highend ansetzenden Leistungsdaten, zielt Western Digital mit seinen OpenFlex-Produkten vor allem auf die leistungshungrigsten Anwendungen und Installationen der Welt: große Cloud-Provider, Wissenschaft und Forschung, aber auch Medien. Eine typische Anwendung wäre etwa die DNA-Analyse mit umfassenden Datenbankvergleichen.

Western Digitals Open Composable API macht alle Komponenten, die an einer NVME-oF-Fabric hängen, der Zuweisung durch Software zugänglich.
Western Digitals Open Composable API macht alle Komponenten, die an einer NVME-oF-Fabric hängen, der Zuweisung durch Software zugänglich.
(Bild: Western Digital)

Fabric-Aufbau über offene API

Eine wichtige Komponente des ganzen OpenFlex-Ansatzes ist die Open Composable API. Diese Software-Schnittstelle eröffnet den Zugriff auf alle Komponenten an einer NVMe-oF-Fabric mit OpenFlex-Systemen.

Die Idee dahinter: Serverhersteller und andere Komponentenanbieter sollen sich auf die API ausrichten, damit ihre Lösungen möglichst optimal mit den Western-Digital-Produkten in der Fabric zusammenarbeiten.

Über die offene API greift auch die Composable-Software „Drive Scale“ auf die einzelnen Komponenten zu. Ein Dashboard zeigt die bislang entdeckten Ressourcen und ihre aktuelle Verwendung sowie die Auslastung des Gesamtsystems. Dort können auch die Discovery neuer Ressourcen und die Ressourcenzuweisung stattfinden.

Kompatibilitätstests an der Universität of New Hampshire

Ergänzend dazu richtet Western Digital ein „Open Composable Compliance Lab“ ein, das die Kompatibilität von Geräten in der Fabric mit dem Western-Digital-System sicherstellen soll. Durchgeführt werden diese Tests im Auftrag der jeweiligen Hersteller in einem NVMe-oF-Kompatibilitätslabor an der University of New Hampshire, wo es bereits ein entsprechendes Labor für Ethernet-Kompatibilitätstests gibt.

Der Ansatz scheint zu überzeugen, denn Western Digital konnte eine ganze Reihe namhafter Partner gewinnen. So baut Xilinx FPGAs (Field Programmable Gate Arrays, programmierbare Logikbausteine) für Spezialaufgaben in die Module ein. Die Verarbeitungsleistungen steigen damit um zwei- bis dreistellige Faktoren, je nach Anwendung.

Ein anderer Partner, Eideticon, hat auf Basis der Western-Digital-Lösung eine Datenbankbeschleunigungslösung gebaut. Er übernimmt auf der Speicherseite die Vorverarbeitung der Daten, was die Antwortzeiten extrem verkürzt.

Man darf gespannt sein, wann andere Hersteller beginnen, sich die Vorteile von NVMe oF durch neuartige Systemdesigns zunutze zu machen.

(ID:46464538)