Mobile-Menu

Hammersmith/Nimbus – neue Plattformen für KI Schneller auf mehr Storage zugreifen

Von lic.rer.publ. Ariane Rüdiger 5 min Lesedauer

Anbieter zum Thema

Die stetig anschwellende Datenflut und neue analytische Technologien überfordern bisherige Storage-Umgebungen. Grundlegende technologische Verbesserungen sind notwendig – und kommen langsam auf den Märkten an. Zwei Beispiele.

Immer größere Datenmassen und neue Technologien rund um die viel zitierte KI erfordern neue Ansätze bei der Storage-Hard- und -Software.(Bild:  ©Just_Super, Getty Images Signature via Canva.com)
Immer größere Datenmassen und neue Technologien rund um die viel zitierte KI erfordern neue Ansätze bei der Storage-Hard- und -Software.
(Bild: ©Just_Super, Getty Images Signature via Canva.com)

Datenwachstum und kein Ende. So kann man die Situation knapp umschreiben. Gleichzeitig ergeben sich dank neuer KI-/ML-Technologien neue analytische Möglichkeiten. Doch zwischen Daten und Analyse stehen einige unangenehme Bottlenecks. Insbesondere der, die Daten in ausreichender Menge und Geschwindigkeit zu den analytischen Rechenkapazitäten zu bringen oder umgekehrt.

Bildergalerie

Dabei gilt: Je mehr Schaltstellen und Zwischenstationen (Hops) die Daten passieren müssen, um von A nach B zu gelangen, und je schmalbandiger diese Schnittstellen sind, desto länger dauert es. Und desto kritischer wird dieser Zeitverbrauch für die Lösungen analytischer Aufgaben.

Nieder mit den Engpässen

Ein wesentliches Ziel der derzeitigen technischen Entwicklung im Bereich Storage ist daher, dieses Problem zu beheben. Dabei kann man mit der Hard- oder der Software-Seite anfangen. Auf beiden Seiten gibt es vielversprechende neue Ansätze, von denen im Folgenden zwei vorgestellt werden.

Fangen wir mit der Software an. Hammerspace, ein 2018 von David Flynn mit eigenem Geld aus der Taufe gehobenes Start-up, widmet sich dem Thema Datenorchestrierung. Inzwischen konnte die Firma 56,7 Millionen US-Dollar Erstrundenfinanzierung generieren. Laut eigenen Angaben managt Hammerspace derzeit Kapazitäten über 100 PByte, wobei das Kapazitätswachstum von Jahr zu Jahr bei 650 Prozent liege.

Schnell genug für GPUs – einfach genug für Enterprise-Umgebungen

Das erste Produkt kam 2020 auf den Markt. Ziel war es, bei großen Datenmengen die Leistung zu steigern, die GPUs besser auszulasten und die Daten jederzeit für die Anwendungen verfügbar zu halten. Die Idee: ein hochleistungsfähiges paralleles Filesystem für die NAS-Verarbeitung auf Enterprise-NAS mit NFS.

„Die Filesysteme von HPC-Systemen sind nicht kompatibel zur NAS-Welt“, sagt Brian Pawlowski, Vice President Performance Engineering. „Dafür muss ein Filesystem POSIX können.“ POSIX (Portable Operating System Interface) ist die Standardschnittstelle zwischen Anwendungen und Betriebssystem. Es gelte also, die Vorteile von HPC-Filesystemen mit denen von Scale-Out-NAS zu einem „Hyperscale-NAS“ zu kombinieren.

Trennung von Daten- und Kontrollkanal

Wichtigstes Merkmal einer solchen Infrastruktur ist, dass Leistung und Kapazität unabhängig voneinander skalieren. Hammerspace behauptet, dies sei bei Systemen bis zu über 1.000 Knoten bereits nachgewiesen.

Außerdem muss es mit strukturierten und unstrukturierten Daten (Block, File, Objekte) gleich gut zurechtkommen. Die technischen Grundvoraussetzungen dafür wurden bereits in Linux NFS 4.1 und 4.2 gelegt. Denn es umfasst pNFS (Parallel NFS) mit FlexFiles. Mit letzterem können Files unter NFSv3 und NFSv4 in einem globalen Namensraum zusammengefasst werden; pNFS erlaubt parallele Zugriffe.

Die Architektur von Hammerspace trennt Daten- und Kontrollpfad und erlaubt mehrere parallele Netzwerkkommunikationskanäle zwischen Clients und Servern. Damit passt die Lösung zu allen Linux-Umgebungen ab 4.1.

Passt zu jeder Festplatte

Hinsichtlich der Storage ist die Lösung agnostisch. Jeder Storage-Knoten übernimmt sein Block-Mapping, während Files nur auf der Metadaten-Ebene gemappt werden. Ein-/Ausgaben finden nur auf Storage-Knoten statt, während der Metadaten-Server nicht in Berührung mit Files kommt.

Backups gibt es nicht mehr, da Daten jederzeit verschoben werden können. Daten lassen sich während des Zugriffs bewegen. Anwender können gleichzeitig in Metadaten und Storage recherchieren. Wegen der Architektur der Lösung brauchen Storage-Systeme keine interne Fabric mehr.

Hochrangige Kooperationspartner

Dass der Ansatz erfolgversprechend ist, zeigen einerseits Kooperationspartner wie Infinidat oder Pure – „Blockstorage-Anbieter, die File-Technologien anbieten wollen“, sagt Pawlowski. Andererseits konnte Hammerspace kürzlich die Zertifizierung für Nvidias GPUDirect erringen. Damit lässt sich der Speicherpuffer mit oder ohne RDMA direkt in die GPU einlesen. In letzterem Fall verwendet man einen von Hammerspace angebotenen DSX-Knoten.

Welche Arten von Hardware-Designs das ermöglicht, zeigt Nimbus Data. Der Hersteller verkündete gerade eine Kooperationsvereinbarung mit Hammerspace.

Nimbus: eine neue Plattform fürs AI-Zeitalter

Nimbus gibt es schon seit 20 Jahren, aber in den vergangenen Jahren war es still um sie. Gründer und CEO Thomas Isakovich: „Wir haben uns entschieden, eine vollkommen neue Plattform zu entwickeln und bis dahin einfach nur unsere alten Produkte verkauft.“

Jetzt Newsletter abonnieren

Täglich die wichtigsten Infos zu Data-Storage und -Management

Mit Klick auf „Newsletter abonnieren“ erkläre ich mich mit der Verarbeitung und Nutzung meiner Daten gemäß Einwilligungserklärung (bitte aufklappen für Details) einverstanden und akzeptiere die Nutzungsbedingungen. Weitere Informationen finde ich in unserer Datenschutzerklärung. Die Einwilligungserklärung bezieht sich u. a. auf die Zusendung von redaktionellen Newslettern per E-Mail und auf den Datenabgleich zu Marketingzwecken mit ausgewählten Werbepartnern (z. B. LinkedIn, Google, Meta).

Aufklappen für Details zu Ihrer Einwilligung

Die Firma ist nicht auf fremdes Geld angewiesen – sie beschäftigt derzeit nur 30 Mitarbeiter und ist profitabel. Der Firmensitz befindet sich in Irvine, Kalifornien. Forschung und Entwicklung finden in Indien und Taiwan statt. Das Unternehmen brachte 2009 das erste All-Flash-Array auf den Markt.

Im Zentrum: Federated Arrays

Die neue HALO-Infrastrukturplattform, 2023 an ausgewählte Kunden verteilt und danach noch wesentlich verfeinert, verwendet Flash für alle Tiers. 2024 soll eine größere Produktoffensive folgen.

Die Plattform skaliert bis in den Peta- oder sogar Exabyte-Bereich. Sie unterstützt vielfältige Netzwerkprotokolle und Workloads unter x86 und ARM. Sie kommt mit Block- und Filedaten zurecht.

Ihre Basis sind sogenannte Federated Arrays der Marke FlashRack, die keine Fabric zwischen sich brauchen. In jedem Array werden die Daten dreifach redundant gehalten. In jedem Array stecken bis zu 72 beliebige Drives – auf eine tiefergehende Optimierung der nichtflüchtigen Speicherbausteine verzichtet Nimbus ganz bewusst. „Das können andere billiger und besser als wir“, ist Isakovich überzeugt.

Bildergalerie

Bis zu 400 Gbit/s schnelle Anbindung

Derzeit werden Fibre Channel (64 Gbit/s), Ethernet und Infiniband (400 Gbit/s) als Übertragungsformen unterstützt. RAID wird nicht verwendet, auch kein Erasure Coding. Mittels NVMe oF lässt sich die Flash-Kapazität disaggregieren. Das bedeutet: man kann ein mobiles Flash-Pack aus dem System nehmen, obwohl darauf gespiegelte Daten liegen, und diesen Spiegel in ein anderes System schieben.

Die Controller sind in jedem Chassis doppelt ausgelegt. Die Management-Software, zugänglich über ein Lingo REST API, läuft auf beiden Controllern. Außerdem gibt es eine Webschnittstelle („Vantage“) für das Management beliebig vieler Arrays und auch noch eine Befehlsschnittstelle.

Stromsparende Controller

Die selbst entwickelten Controller liefern alle gängigen Funktionen: Deduplikation, Prüfsummen, Kompression, Snapshots und eine in Hardware ausgeführte Inline-Beschleunigung. Das Gerät verbraucht nur 150 Watt.

Dass die Controller einfach gezogen und ersetzt werden können, erhöht die Wartbarkeit – ein Einsatzgebiet ist das datenreiche Edge. Außerdem wurde PCIe Gen5 integriert. Aktualisierungen auf Nachfolger sind vorgesehen. Außer in der Stromversorgung gibt es keine Lüfter.

Ein FlashRack besteht aus einem 20 Zoll tiefen Grundgehäuse, in dem mit 64-TByte-SSDs insgesamt 1,5 PByte untergebracht werden können. Das kann durch zwei Erweiterungschassis vergrößert werden. Dann stehen 4,5 PByte auf 6 HU zur Verfügung. Nimbus garantiert eine SSD-Lebensdauer von zehn Jahren – unter anderem wegen des schonenden Streaming-Write-Modus.

Ausblick: immer weniger Schritte zu den Daten

Auf einer Präsentation während einer Technology-Live-Veranstaltung in London zeigte Isakovich außerdem als Prototyp eine mit Nimbus-Technologie ausgerüstete Karte für den Einbau in Server. Die GPU- und Speicherressourcen eines solchen Servers lassen sich damit in Nimbus-Umgebungen integrieren.

Schließlich führte er Prototypen von SSDs mit Ethernet-Schnittstelle vor, die den Direktzugriff auf die Daten jeder einzelnen SSD von jeder GPU aus gestatten würden. Möglich wird das dank der Kooperation mit Hammerspace, das ja über die GPUDirect-Zertifizierung von Nvidia verfügt.

Aktuelles eBook

Storage für HPC & KI

eBook Storage für HPC & KI
eBook „Storage für HPC & KI“
(Bild: Storage-Insider)

Speichersysteme für das HPC und für die verschiedenen Disziplinen der KI sind hohen Anforderungen ausgesetzt. Denn sie müssen enorme Datenmengen in kürzester Zeit bereitstellen oder sammeln. Wie können diese Herausforderungen gemeistert werden?

Die Themen im Überblick:

  • Aktuelle Trends in der Künstlichen Intelligenz
  • High-Performance Computing – Explosion der Innovationen
  • Künstliche Intelligenz – nahezu Echtzeit-Datenverarbeitung

(ID:49944093)