Mobile-Menu

Neue PowerScale-Features Dell will KI-Einsatz optimieren

Von Michael Matzer 3 min Lesedauer

Anbieter zum Thema

Dell Technologies hat Dell PowerScale, seine Speicherplattform für unstrukturierte Daten, und deren Betriebssystem OneFS aktualisiert. Mit noch schnellerer Datenübertragung, höherer Speicherdichte und verbesserten Suchfunktionen soll die Plattform den KI-Einsatz optimieren.

Die Power Scale Nodes A300 und A3000 stellen HDDs mit jeweils 24 TB bereit. (Bild:  Dell Technologies)
Die Power Scale Nodes A300 und A3000 stellen HDDs mit jeweils 24 TB bereit.
(Bild: Dell Technologies)

Dell PowerScale unterstützt jetzt Ethernet- und InfiniBand-Verbindungen mit 200 Gbps. Damit beschleunigt die Plattform laut internen Untersuchungen von Dell Technologies das kontinuierliche Schreiben von Daten um bis zu 220 Prozent und das kontinuierliche Lesen um bis zu 99 Prozent gegenüber dem Stand von 2023.

Diese schnelle Übertragungsgeschwindigkeit gewährleiste nicht nur einen nahtlosen Datenfluss entlang der kompletten KI-Pipeline, sondern steigere auch die Leistung von GPUs in Generative-AI-Umgebungen. „Der signifikant erhöhte Datendurchsatz erlaubt das verbesserte Lesen von Datenströmen und beschleunigte Schreibvorgänge“, so Prasanna Vijayakumar, Senior Product Marketing Manager für Dells Unstructured Data Solutions. „Die größere Bandbreite ist von wesentlicher Bedeutung, um die hohe Ausnutzung der GPU-Kapazität während intensiver Rechenaufgaben aufrechtzuerhalten. Denn sie verringert Checkpoint-Fenster, verkürzt die Trainingsdauer und ermöglicht schnellere Iterationen des Modells.“

Bildergalerie

Höhere Speicherdichte

Die All-Flash-Lösung PowerScale F710 bietet jetzt SSD-Laufwerke mit 61 TB, und die Power Scale Nodes A300, A3000 (A wie Archiv), H700 und H7000 (H wie Hybrid) stellen HDDs mit 24 TB bereit. Diese erhöhte Speicherdichte soll zu substantiellen Einsparungen beim Energieverbrauch führen und die Kosten im Rechenzentrum senken, indem der beanspruchte Stellplatz im Rechenzentrum um bis zu 50 Prozent verringert wird.

Unternehmen können damit laut Dell größere Large-Language-Models (LLMs) für generative KI mit weniger Storage-Nodes unterstützen und dadurch ihre KI-Implementierungen kosteneffizienter gestalten. Dell erwähnt explizit Nvidias DGX SuperPOD als eine solche KI-Plattform.

Hinsichtlich der festplattenbasierten Geräteplattformen (A- und H-Modelle) argumentiert Dell, dass die 24-TB-Laufwerke ein besseres Verhältnis von SSD-Cache pro Festplatte anböten als die bisherigen 20-TB-Laufwerke. Dieses Leistungsmerkmal führe direkt zu geringerer Latenzzeit und einem höheren Datenausstoß.

Vijayakumar erläuterte, dass das PowerScale-Design darauf abziele, den Stromverbrauch zu verringern und damit Betriebskosten zu dämpfen sowie Nachhaltigkeit zu fördern. „Die Datensicherheit wird durch selbstverschlüsselnde Laufwerke (SEDs) realisiert, so dass die Verschlüsselung ruhender Daten Konformität gewährleistet und vertrauliche Informationen schützt“, sagte er.

Bessere Durchsuchbarkeit von Modelldaten

Die neuen MetadataIQ-Funktionen von PowerScale sollen den Zugang zu Informationen in verteilten Datenmengen vereinfachen, indem alle erfassten Dateien automatisch mit Metadaten versehen werden. Die Rede ist natürlich von unstrukturierten Daten wie etwa PDF-Dokumenten, Wissensdatenbanken und Support-Datenbanken. Zu den Dateiattributen dürften Merkmale wie Erstellungsdatum und Herkunft gehören. Besonders die Herkunft ist im Hinblick auf die Verwendbarkeit und Zuverlässigkeit der Informationen von höchster Bedeutung, etwa um „Halluzinationen“ zu vermeiden. Hierfür spielt der Einsatz von RAG (Retrieval Augmented Generation) eine wesentliche Rolle – siehe unten.

Unternehmen haben laut Dell dank MetadataIQ zudem die Möglichkeit, Metadaten in Elasticsearch-Datenbanken zu exportieren und dort zu durchsuchen und auszuwerten. Dadurch könnten sie kuratierte, konsistente und kontextbezogene Trainingsdatenmengen gewährleisten und ihre KI-Modelle effizienter trainieren. Die Kapazität, die Dell nennt, sind „Milliarden von Dateien“ und „Petabyte an Daten“. Dieser Umfang dürfte für die meisten Modelle ausreichen.

Dieser Ansatz erlaubt es Unternehmen laut Dell, ihre RAG-Workflows – wie etwa dem auf der Nvidia-KI-Plattform – effizient zu halten, indem die Notwendigkeit für „Treewalks“ über ganze Dateiverzeichnisse hinweg eliminiert werde und nur aktualisierte oder neue Inhalte verarbeitet würden. Dadurch werde die Nutzung von Rechenleistung zugunsten der Einsparung von Zeitaufwand und Kosten maximiert. Gleichzeitig werde die Treffer- und Vorhersagegenauigkeit in Umgebungen (lies: Anwendungen) mit Generativer KI verbessert.

Verfügbarkeiten

Die Updates für die sechs verfügbaren Dell-PowerScale-Modelle der F-Baureihe (F wie Flash) sollen im Laufe des vierten Quartals 2024 verfügbar sein, um das bereits verfügbare Modell F910 zu ergänzen. Das betrifft wohl auch die anderen Modelle der A-Reihe (Archiv) A300 und A3000 sowie die H-Modelle (Hybrid) H700 und H7000. Die Updates für Dell Data Lakehouse sollen im ersten Halbjahr 2025 verfügbar sein.

Aktuelles eBook

All-Flash-Arrays mit NVMe – eine Chance für neue Use Cases

eBook All-Flash-Arrays mit NVMe
eBook „All-Flash-Arrays mit NVMe“
(Bild: Storage-Insider)

Gegenüber herkömmlichen drehenden Festplatten setzen sich zunehmend mit SSDs bestückte Flash-Systeme durch und punkten im Verbund mit NVMe vor allem durch hohe Geschwindigkeit. Wann lohnt sich der Einsatz eines All-Flash-Arrays im Unternehmen? Und welches System ist das passende? Diese und weitere Fragen beantwortet unser neues, kostenloses eBook.

Die Themen im Überblick:

  • Technologische Grundlagen: Was ist NVMe-Flash?
  • Use Cases: Wann lohnt sich ein NVMe-Array fürs Unternehmen?
  • Anbieter und Produkte: NVMe-AFAs

(ID:50268427)

Jetzt Newsletter abonnieren

Täglich die wichtigsten Infos zu Data-Storage und -Management

Mit Klick auf „Newsletter abonnieren“ erkläre ich mich mit der Verarbeitung und Nutzung meiner Daten gemäß Einwilligungserklärung (bitte aufklappen für Details) einverstanden und akzeptiere die Nutzungsbedingungen. Weitere Informationen finde ich in unserer Datenschutzerklärung. Die Einwilligungserklärung bezieht sich u. a. auf die Zusendung von redaktionellen Newslettern per E-Mail und auf den Datenabgleich zu Marketingzwecken mit ausgewählten Werbepartnern (z. B. LinkedIn, Google, Meta).

Aufklappen für Details zu Ihrer Einwilligung