Schneller auf mehr Storage zugreifen

Hammersmith/Nimbus – neue Plattformen für KI Schneller auf mehr Storage zugreifen

22.03.2024 Von lic.rer.publ. Ariane Rüdiger 5 min Lesedauer

Anbieter zum Thema

Die stetig anschwellende Datenflut und neue analytische Technologien überfordern bisherige Storage-Umgebungen. Grundlegende technologische Verbesserungen sind notwendig – und kommen langsam auf den Märkten an. Zwei Beispiele.

Immer größere Datenmassen und neue Technologien rund um die viel zitierte KI erfordern neue Ansätze bei der Storage-Hard- und -Software.(Bild: ©Just_Super, Getty Images Signature via Canva.com) — Immer größere Datenmassen und neue Technologien rund um die viel zitierte KI erfordern neue Ansätze bei der Storage-Hard- und -Software.
(Bild: ©Just_Super, Getty Images Signature via Canva.com)

Datenwachstum und kein Ende. So kann man die Situation knapp umschreiben. Gleichzeitig ergeben sich dank neuer KI-/ML-Technologien neue analytische Möglichkeiten. Doch zwischen Daten und Analyse stehen einige unangenehme Bottlenecks. Insbesondere der, die Daten in ausreichender Menge und Geschwindigkeit zu den analytischen Rechenkapazitäten zu bringen oder umgekehrt.

Bildergalerie

Molly Presley, SVP Global Marketing, und Hammerspace-CEO David Flynn präsentieren ihre Lösung.(Bild: Rüdiger)

Ein einfach auswechselbarer Controller von Nimbus.(Bild: Rüdiger)

Nimbus-CEO Thomas Isakovich präsentiert den Prototyp einer Karte, mit der sich Server direkt in eine Flexbase-Infrastruktur einbinden lassen.(Bild: Rüdiger)

Dabei gilt: Je mehr Schaltstellen und Zwischenstationen (Hops) die Daten passieren müssen, um von A nach B zu gelangen, und je schmalbandiger diese Schnittstellen sind, desto länger dauert es. Und desto kritischer wird dieser Zeitverbrauch für die Lösungen analytischer Aufgaben.

Nieder mit den Engpässen

Ein wesentliches Ziel der derzeitigen technischen Entwicklung im Bereich Storage ist daher, dieses Problem zu beheben. Dabei kann man mit der Hard- oder der Software-Seite anfangen. Auf beiden Seiten gibt es vielversprechende neue Ansätze, von denen im Folgenden zwei vorgestellt werden.

Fangen wir mit der Software an. Hammerspace, ein 2018 von David Flynn mit eigenem Geld aus der Taufe gehobenes Start-up, widmet sich dem Thema Datenorchestrierung. Inzwischen konnte die Firma 56,7 Millionen US-Dollar Erstrundenfinanzierung generieren. Laut eigenen Angaben managt Hammerspace derzeit Kapazitäten über 100 PByte, wobei das Kapazitätswachstum von Jahr zu Jahr bei 650 Prozent liege.

Schnell genug für GPUs – einfach genug für Enterprise-Umgebungen

Das erste Produkt kam 2020 auf den Markt. Ziel war es, bei großen Datenmengen die Leistung zu steigern, die GPUs besser auszulasten und die Daten jederzeit für die Anwendungen verfügbar zu halten. Die Idee: ein hochleistungsfähiges paralleles Filesystem für die NAS-Verarbeitung auf Enterprise-NAS mit NFS.

„Die Filesysteme von HPC-Systemen sind nicht kompatibel zur NAS-Welt“, sagt Brian Pawlowski, Vice President Performance Engineering. „Dafür muss ein Filesystem POSIX können.“ POSIX (Portable Operating System Interface) ist die Standardschnittstelle zwischen Anwendungen und Betriebssystem. Es gelte also, die Vorteile von HPC-Filesystemen mit denen von Scale-Out-NAS zu einem „Hyperscale-NAS“ zu kombinieren.

Trennung von Daten- und Kontrollkanal

Wichtigstes Merkmal einer solchen Infrastruktur ist, dass Leistung und Kapazität unabhängig voneinander skalieren. Hammerspace behauptet, dies sei bei Systemen bis zu über 1.000 Knoten bereits nachgewiesen.

Außerdem muss es mit strukturierten und unstrukturierten Daten (Block, File, Objekte) gleich gut zurechtkommen. Die technischen Grundvoraussetzungen dafür wurden bereits in Linux NFS 4.1 und 4.2 gelegt. Denn es umfasst pNFS (Parallel NFS) mit FlexFiles. Mit letzterem können Files unter NFSv3 und NFSv4 in einem globalen Namensraum zusammengefasst werden; pNFS erlaubt parallele Zugriffe.

Die Architektur von Hammerspace trennt Daten- und Kontrollpfad und erlaubt mehrere parallele Netzwerkkommunikationskanäle zwischen Clients und Servern. Damit passt die Lösung zu allen Linux-Umgebungen ab 4.1.

Passt zu jeder Festplatte

Hinsichtlich der Storage ist die Lösung agnostisch. Jeder Storage-Knoten übernimmt sein Block-Mapping, während Files nur auf der Metadaten-Ebene gemappt werden. Ein-/Ausgaben finden nur auf Storage-Knoten statt, während der Metadaten-Server nicht in Berührung mit Files kommt.

Backups gibt es nicht mehr, da Daten jederzeit verschoben werden können. Daten lassen sich während des Zugriffs bewegen. Anwender können gleichzeitig in Metadaten und Storage recherchieren. Wegen der Architektur der Lösung brauchen Storage-Systeme keine interne Fabric mehr.

Hochrangige Kooperationspartner

Dass der Ansatz erfolgversprechend ist, zeigen einerseits Kooperationspartner wie Infinidat oder Pure – „Blockstorage-Anbieter, die File-Technologien anbieten wollen“, sagt Pawlowski. Andererseits konnte Hammerspace kürzlich die Zertifizierung für Nvidias GPUDirect erringen. Damit lässt sich der Speicherpuffer mit oder ohne RDMA direkt in die GPU einlesen. In letzterem Fall verwendet man einen von Hammerspace angebotenen DSX-Knoten.

Welche Arten von Hardware-Designs das ermöglicht, zeigt Nimbus Data. Der Hersteller verkündete gerade eine Kooperationsvereinbarung mit Hammerspace.

Die neue Folge von „Speicherhungrig“ beschäftigt sich mit dem Thema „Digitalisierung im Stadtarchiv Augsburg“. (Bild: Vogel IT-Medien)

Nimbus: eine neue Plattform fürs AI-Zeitalter

Nimbus gibt es schon seit 20 Jahren, aber in den vergangenen Jahren war es still um sie. Gründer und CEO Thomas Isakovich: „Wir haben uns entschieden, eine vollkommen neue Plattform zu entwickeln und bis dahin einfach nur unsere alten Produkte verkauft.“

Jetzt Newsletter abonnieren

Täglich die wichtigsten Infos zu Data-Storage und -Management

Geschäftliche E-Mail

Bitte geben Sie eine gültige E-Mailadresse ein.

Mit Klick auf „Newsletter abonnieren“ erkläre ich mich mit der Verarbeitung und Nutzung meiner Daten gemäß Einwilligungserklärung (bitte aufklappen für Details) einverstanden und akzeptiere die Nutzungsbedingungen. Weitere Informationen finde ich in unserer Datenschutzerklärung. Die Einwilligungserklärung bezieht sich u. a. auf die Zusendung von redaktionellen Newslettern per E-Mail und auf den Datenabgleich zu Marketingzwecken mit ausgewählten Werbepartnern (z. B. LinkedIn, Google, Meta).

Stand: 08.12.2025

Es ist für uns eine Selbstverständlichkeit, dass wir verantwortungsvoll mit Ihren personenbezogenen Daten umgehen. Sofern wir personenbezogene Daten von Ihnen erheben, verarbeiten wir diese unter Beachtung der geltenden Datenschutzvorschriften. Detaillierte Informationen finden Sie in unserer Datenschutzerklärung.

Einwilligung in die Verwendung von Daten zu Werbezwecken

Ich bin damit einverstanden, dass die Vogel IT-Medien GmbH, Max-Josef-Metzger-Straße 21, 86157 Augsburg, einschließlich aller mit ihr im Sinne der §§ 15 ff. AktG verbundenen Unternehmen (im weiteren: Vogel Communications Group) meine E-Mail-Adresse für die Zusendung von Newslettern und Werbung nutzt. Auflistungen der jeweils zugehörigen Unternehmen können hier abgerufen werden.

Der Newsletterinhalt erstreckt sich dabei auf Produkte und Dienstleistungen aller zuvor genannten Unternehmen, darunter beispielsweise Fachzeitschriften und Fachbücher, Veranstaltungen und Messen sowie veranstaltungsbezogene Produkte und Dienstleistungen, Print- und Digital-Mediaangebote und Services wie weitere (redaktionelle) Newsletter, Gewinnspiele, Lead-Kampagnen, Marktforschung im Online- und Offline-Bereich, fachspezifische Webportale und E-Learning-Angebote. Wenn auch meine persönliche Telefonnummer erhoben wurde, darf diese für die Unterbreitung von Angeboten der vorgenannten Produkte und Dienstleistungen der vorgenannten Unternehmen und Marktforschung genutzt werden.

Meine Einwilligung umfasst zudem die Verarbeitung meiner E-Mail-Adresse und Telefonnummer für den Datenabgleich zu Marketingzwecken mit ausgewählten Werbepartnern wie z.B. LinkedIN, Google und Meta. Hierfür darf die Vogel Communications Group die genannten Daten gehasht an Werbepartner übermitteln, die diese Daten dann nutzen, um feststellen zu können, ob ich ebenfalls Mitglied auf den besagten Werbepartnerportalen bin. Die Vogel Communications Group nutzt diese Funktion zu Zwecken des Retargeting (Upselling, Crossselling und Kundenbindung), der Generierung von sog. Lookalike Audiences zur Neukundengewinnung und als Ausschlussgrundlage für laufende Werbekampagnen. Weitere Informationen kann ich dem Abschnitt „Datenabgleich zu Marketingzwecken“ in der Datenschutzerklärung entnehmen.

Falls ich im Internet auf Portalen der Vogel Communications Group einschließlich deren mit ihr im Sinne der §§ 15 ff. AktG verbundenen Unternehmen geschützte Inhalte abrufe, muss ich mich mit weiteren Daten für den Zugang zu diesen Inhalten registrieren. Im Gegenzug für diesen gebührenlosen Zugang zu redaktionellen Inhalten dürfen meine Daten im Sinne dieser Einwilligung für die hier genannten Zwecke verwendet werden. Dies gilt nicht für den Datenabgleich zu Marketingzwecken.

Recht auf Widerruf

Mir ist bewusst, dass ich diese Einwilligung jederzeit für die Zukunft widerrufen kann. Durch meinen Widerruf wird die Rechtmäßigkeit der aufgrund meiner Einwilligung bis zum Widerruf erfolgten Verarbeitung nicht berührt. Um meinen Widerruf zu erklären, kann ich als eine Möglichkeit das unter https://contact.vogel.de abrufbare Kontaktformular nutzen. Sofern ich einzelne von mir abonnierte Newsletter nicht mehr erhalten möchte, kann ich darüber hinaus auch den am Ende eines Newsletters eingebundenen Abmeldelink anklicken. Weitere Informationen zu meinem Widerrufsrecht und dessen Ausübung sowie zu den Folgen meines Widerrufs finde ich in der Datenschutzerklärung.

Die Firma ist nicht auf fremdes Geld angewiesen – sie beschäftigt derzeit nur 30 Mitarbeiter und ist profitabel. Der Firmensitz befindet sich in Irvine, Kalifornien. Forschung und Entwicklung finden in Indien und Taiwan statt. Das Unternehmen brachte 2009 das erste All-Flash-Array auf den Markt.

Im Zentrum: Federated Arrays

Die neue HALO-Infrastrukturplattform, 2023 an ausgewählte Kunden verteilt und danach noch wesentlich verfeinert, verwendet Flash für alle Tiers. 2024 soll eine größere Produktoffensive folgen.

Die Plattform skaliert bis in den Peta- oder sogar Exabyte-Bereich. Sie unterstützt vielfältige Netzwerkprotokolle und Workloads unter x86 und ARM. Sie kommt mit Block- und Filedaten zurecht.

Ihre Basis sind sogenannte Federated Arrays der Marke FlashRack, die keine Fabric zwischen sich brauchen. In jedem Array werden die Daten dreifach redundant gehalten. In jedem Array stecken bis zu 72 beliebige Drives – auf eine tiefergehende Optimierung der nichtflüchtigen Speicherbausteine verzichtet Nimbus ganz bewusst. „Das können andere billiger und besser als wir“, ist Isakovich überzeugt.

Bildergalerie

Bis zu 400 Gbit/s schnelle Anbindung

Derzeit werden Fibre Channel (64 Gbit/s), Ethernet und Infiniband (400 Gbit/s) als Übertragungsformen unterstützt. RAID wird nicht verwendet, auch kein Erasure Coding. Mittels NVMe oF lässt sich die Flash-Kapazität disaggregieren. Das bedeutet: man kann ein mobiles Flash-Pack aus dem System nehmen, obwohl darauf gespiegelte Daten liegen, und diesen Spiegel in ein anderes System schieben.

Die Controller sind in jedem Chassis doppelt ausgelegt. Die Management-Software, zugänglich über ein Lingo REST API, läuft auf beiden Controllern. Außerdem gibt es eine Webschnittstelle („Vantage“) für das Management beliebig vieler Arrays und auch noch eine Befehlsschnittstelle.

Stromsparende Controller

Die selbst entwickelten Controller liefern alle gängigen Funktionen: Deduplikation, Prüfsummen, Kompression, Snapshots und eine in Hardware ausgeführte Inline-Beschleunigung. Das Gerät verbraucht nur 150 Watt.

Dass die Controller einfach gezogen und ersetzt werden können, erhöht die Wartbarkeit – ein Einsatzgebiet ist das datenreiche Edge. Außerdem wurde PCIe Gen5 integriert. Aktualisierungen auf Nachfolger sind vorgesehen. Außer in der Stromversorgung gibt es keine Lüfter.

Ein FlashRack besteht aus einem 20 Zoll tiefen Grundgehäuse, in dem mit 64-TByte-SSDs insgesamt 1,5 PByte untergebracht werden können. Das kann durch zwei Erweiterungschassis vergrößert werden. Dann stehen 4,5 PByte auf 6 HU zur Verfügung. Nimbus garantiert eine SSD-Lebensdauer von zehn Jahren – unter anderem wegen des schonenden Streaming-Write-Modus.

Ausblick: immer weniger Schritte zu den Daten

Auf einer Präsentation während einer Technology-Live-Veranstaltung in London zeigte Isakovich außerdem als Prototyp eine mit Nimbus-Technologie ausgerüstete Karte für den Einbau in Server. Die GPU- und Speicherressourcen eines solchen Servers lassen sich damit in Nimbus-Umgebungen integrieren.

Schließlich führte er Prototypen von SSDs mit Ethernet-Schnittstelle vor, die den Direktzugriff auf die Daten jeder einzelnen SSD von jeder GPU aus gestatten würden. Möglich wird das dank der Kooperation mit Hammerspace, das ja über die GPUDirect-Zertifizierung von Nvidia verfügt.

Aktuelles eBook

Storage für HPC & KI

Speichersysteme für das HPC und für die verschiedenen Disziplinen der KI sind hohen Anforderungen ausgesetzt. Denn sie müssen enorme Datenmengen in kürzester Zeit bereitstellen oder sammeln. Wie können diese Herausforderungen gemeistert werden?

Die Themen im Überblick:

Aktuelle Trends in der Künstlichen Intelligenz
High-Performance Computing – Explosion der Innovationen
Künstliche Intelligenz – nahezu Echtzeit-Datenverarbeitung

eBook „Storage für HPC & KI“ kostenlos downloaden

(ID:49944093)