Dell Technologies hat Dell PowerScale, seine Speicherplattform für unstrukturierte Daten, und deren Betriebssystem OneFS aktualisiert. Mit noch schnellerer Datenübertragung, höherer Speicherdichte und verbesserten Suchfunktionen soll die Plattform den KI-Einsatz optimieren.
Die Power Scale Nodes A300 und A3000 stellen HDDs mit jeweils 24 TB bereit.
(Bild: Dell Technologies)
Dell PowerScale unterstützt jetzt Ethernet- und InfiniBand-Verbindungen mit 200 Gbps. Damit beschleunigt die Plattform laut internen Untersuchungen von Dell Technologies das kontinuierliche Schreiben von Daten um bis zu 220 Prozent und das kontinuierliche Lesen um bis zu 99 Prozent gegenüber dem Stand von 2023.
Diese schnelle Übertragungsgeschwindigkeit gewährleiste nicht nur einen nahtlosen Datenfluss entlang der kompletten KI-Pipeline, sondern steigere auch die Leistung von GPUs in Generative-AI-Umgebungen. „Der signifikant erhöhte Datendurchsatz erlaubt das verbesserte Lesen von Datenströmen und beschleunigte Schreibvorgänge“, so Prasanna Vijayakumar, Senior Product Marketing Manager für Dells Unstructured Data Solutions. „Die größere Bandbreite ist von wesentlicher Bedeutung, um die hohe Ausnutzung der GPU-Kapazität während intensiver Rechenaufgaben aufrechtzuerhalten. Denn sie verringert Checkpoint-Fenster, verkürzt die Trainingsdauer und ermöglicht schnellere Iterationen des Modells.“
Bildergalerie
Höhere Speicherdichte
Die All-Flash-Lösung PowerScale F710 bietet jetzt SSD-Laufwerke mit 61 TB, und die Power Scale Nodes A300, A3000 (A wie Archiv), H700 und H7000 (H wie Hybrid) stellen HDDs mit 24 TB bereit. Diese erhöhte Speicherdichte soll zu substantiellen Einsparungen beim Energieverbrauch führen und die Kosten im Rechenzentrum senken, indem der beanspruchte Stellplatz im Rechenzentrum um bis zu 50 Prozent verringert wird.
Unternehmen können damit laut Dell größere Large-Language-Models (LLMs) für generative KI mit weniger Storage-Nodes unterstützen und dadurch ihre KI-Implementierungen kosteneffizienter gestalten. Dell erwähnt explizit Nvidias DGX SuperPOD als eine solche KI-Plattform.
Hinsichtlich der festplattenbasierten Geräteplattformen (A- und H-Modelle) argumentiert Dell, dass die 24-TB-Laufwerke ein besseres Verhältnis von SSD-Cache pro Festplatte anböten als die bisherigen 20-TB-Laufwerke. Dieses Leistungsmerkmal führe direkt zu geringerer Latenzzeit und einem höheren Datenausstoß.
Vijayakumar erläuterte, dass das PowerScale-Design darauf abziele, den Stromverbrauch zu verringern und damit Betriebskosten zu dämpfen sowie Nachhaltigkeit zu fördern. „Die Datensicherheit wird durch selbstverschlüsselnde Laufwerke (SEDs) realisiert, so dass die Verschlüsselung ruhender Daten Konformität gewährleistet und vertrauliche Informationen schützt“, sagte er.
Bessere Durchsuchbarkeit von Modelldaten
Die neuen MetadataIQ-Funktionen von PowerScale sollen den Zugang zu Informationen in verteilten Datenmengen vereinfachen, indem alle erfassten Dateien automatisch mit Metadaten versehen werden. Die Rede ist natürlich von unstrukturierten Daten wie etwa PDF-Dokumenten, Wissensdatenbanken und Support-Datenbanken. Zu den Dateiattributen dürften Merkmale wie Erstellungsdatum und Herkunft gehören. Besonders die Herkunft ist im Hinblick auf die Verwendbarkeit und Zuverlässigkeit der Informationen von höchster Bedeutung, etwa um „Halluzinationen“ zu vermeiden. Hierfür spielt der Einsatz von RAG (Retrieval Augmented Generation) eine wesentliche Rolle – siehe unten.
Unternehmen haben laut Dell dank MetadataIQ zudem die Möglichkeit, Metadaten in Elasticsearch-Datenbanken zu exportieren und dort zu durchsuchen und auszuwerten. Dadurch könnten sie kuratierte, konsistente und kontextbezogene Trainingsdatenmengen gewährleisten und ihre KI-Modelle effizienter trainieren. Die Kapazität, die Dell nennt, sind „Milliarden von Dateien“ und „Petabyte an Daten“. Dieser Umfang dürfte für die meisten Modelle ausreichen.
Dieser Ansatz erlaubt es Unternehmen laut Dell, ihre RAG-Workflows – wie etwa dem auf der Nvidia-KI-Plattform – effizient zu halten, indem die Notwendigkeit für „Treewalks“ über ganze Dateiverzeichnisse hinweg eliminiert werde und nur aktualisierte oder neue Inhalte verarbeitet würden. Dadurch werde die Nutzung von Rechenleistung zugunsten der Einsparung von Zeitaufwand und Kosten maximiert. Gleichzeitig werde die Treffer- und Vorhersagegenauigkeit in Umgebungen (lies: Anwendungen) mit Generativer KI verbessert.
Verfügbarkeiten
Die Updates für die sechs verfügbaren Dell-PowerScale-Modelle der F-Baureihe (F wie Flash) sollen im Laufe des vierten Quartals 2024 verfügbar sein, um das bereits verfügbare Modell F910 zu ergänzen. Das betrifft wohl auch die anderen Modelle der A-Reihe (Archiv) A300 und A3000 sowie die H-Modelle (Hybrid) H700 und H7000. Die Updates für Dell Data Lakehouse sollen im ersten Halbjahr 2025 verfügbar sein.
Aktuelles eBook
All-Flash-Arrays mit NVMe – eine Chance für neue Use Cases
eBook „All-Flash-Arrays mit NVMe“
(Bild: Storage-Insider)
Gegenüber herkömmlichen drehenden Festplatten setzen sich zunehmend mit SSDs bestückte Flash-Systeme durch und punkten im Verbund mit NVMe vor allem durch hohe Geschwindigkeit. Wann lohnt sich der Einsatz eines All-Flash-Arrays im Unternehmen? Und welches System ist das passende? Diese und weitere Fragen beantwortet unser neues, kostenloses eBook.
Die Themen im Überblick:
Technologische Grundlagen: Was ist NVMe-Flash?
Use Cases: Wann lohnt sich ein NVMe-Array fürs Unternehmen?
Es ist für uns eine Selbstverständlichkeit, dass wir verantwortungsvoll mit Ihren personenbezogenen Daten umgehen. Sofern wir personenbezogene Daten von Ihnen erheben, verarbeiten wir diese unter Beachtung der geltenden Datenschutzvorschriften. Detaillierte Informationen finden Sie in unserer Datenschutzerklärung.
Einwilligung in die Verwendung von Daten zu Werbezwecken
Ich bin damit einverstanden, dass die Vogel IT-Medien GmbH, Max-Josef-Metzger-Straße 21, 86157 Augsburg, einschließlich aller mit ihr im Sinne der §§ 15 ff. AktG verbundenen Unternehmen (im weiteren: Vogel Communications Group) meine E-Mail-Adresse für die Zusendung von Newslettern und Werbung nutzt. Auflistungen der jeweils zugehörigen Unternehmen können hier abgerufen werden.
Der Newsletterinhalt erstreckt sich dabei auf Produkte und Dienstleistungen aller zuvor genannten Unternehmen, darunter beispielsweise Fachzeitschriften und Fachbücher, Veranstaltungen und Messen sowie veranstaltungsbezogene Produkte und Dienstleistungen, Print- und Digital-Mediaangebote und Services wie weitere (redaktionelle) Newsletter, Gewinnspiele, Lead-Kampagnen, Marktforschung im Online- und Offline-Bereich, fachspezifische Webportale und E-Learning-Angebote. Wenn auch meine persönliche Telefonnummer erhoben wurde, darf diese für die Unterbreitung von Angeboten der vorgenannten Produkte und Dienstleistungen der vorgenannten Unternehmen und Marktforschung genutzt werden.
Meine Einwilligung umfasst zudem die Verarbeitung meiner E-Mail-Adresse und Telefonnummer für den Datenabgleich zu Marketingzwecken mit ausgewählten Werbepartnern wie z.B. LinkedIN, Google und Meta. Hierfür darf die Vogel Communications Group die genannten Daten gehasht an Werbepartner übermitteln, die diese Daten dann nutzen, um feststellen zu können, ob ich ebenfalls Mitglied auf den besagten Werbepartnerportalen bin. Die Vogel Communications Group nutzt diese Funktion zu Zwecken des Retargeting (Upselling, Crossselling und Kundenbindung), der Generierung von sog. Lookalike Audiences zur Neukundengewinnung und als Ausschlussgrundlage für laufende Werbekampagnen. Weitere Informationen kann ich dem Abschnitt „Datenabgleich zu Marketingzwecken“ in der Datenschutzerklärung entnehmen.
Falls ich im Internet auf Portalen der Vogel Communications Group einschließlich deren mit ihr im Sinne der §§ 15 ff. AktG verbundenen Unternehmen geschützte Inhalte abrufe, muss ich mich mit weiteren Daten für den Zugang zu diesen Inhalten registrieren. Im Gegenzug für diesen gebührenlosen Zugang zu redaktionellen Inhalten dürfen meine Daten im Sinne dieser Einwilligung für die hier genannten Zwecke verwendet werden. Dies gilt nicht für den Datenabgleich zu Marketingzwecken.
Recht auf Widerruf
Mir ist bewusst, dass ich diese Einwilligung jederzeit für die Zukunft widerrufen kann. Durch meinen Widerruf wird die Rechtmäßigkeit der aufgrund meiner Einwilligung bis zum Widerruf erfolgten Verarbeitung nicht berührt. Um meinen Widerruf zu erklären, kann ich als eine Möglichkeit das unter https://contact.vogel.de abrufbare Kontaktformular nutzen. Sofern ich einzelne von mir abonnierte Newsletter nicht mehr erhalten möchte, kann ich darüber hinaus auch den am Ende eines Newsletters eingebundenen Abmeldelink anklicken. Weitere Informationen zu meinem Widerrufsrecht und dessen Ausübung sowie zu den Folgen meines Widerrufs finde ich in der Datenschutzerklärung.