Mobile-Menu

IBM Storage Scale 6.0 Big Blue bohrt Storage-Scale-Boliden für KI-Workloads auf

Von Michael Matzer 4 min Lesedauer

Anbieter zum Thema

Die neue Version 6.0 von IBM Storage Scale verfügt nun über eine Data Acceleration Tier (DAT), eine leistungsstarke NVMe-oF-basierte Speicherschicht, die eine hohe Zahl von IOPS und eine sehr niedrige Latenz für Echtzeit-KI-Inferenzierungs-Workloads ermöglicht.

Die IBM Storage Scale System Expansion Enclosure soll Organisationen in die Lage versetzen, Workloads, die sehr große Datenmengen verarbeiten, kosteneffizient bereitzustellen.(Bild:  IBM)
Die IBM Storage Scale System Expansion Enclosure soll Organisationen in die Lage versetzen, Workloads, die sehr große Datenmengen verarbeiten, kosteneffizient bereitzustellen.
(Bild: IBM)

IBM Storage Scale, das ursprünglich GPFS (Global Parallel File System) genannt wurde, ist IBMs parallele Software-definierte Dateisystemsoftware für File- und Objektspeicher von sowohl strukturierten wie auch unstrukturierten Daten. Im Magic Quadrant der Gartner Group erzielt Storage Scale regelmäßig Spitzenplätze in Rankings für Primärspeicher. Das System ist verbreitet in Supercomputing- und Hochleistungs-Computing-Kreisen (HPC) sowie in Enterprise-Computing-Shops, die HPC-IT für solche Workloads übernehmen, welche ein schnelles Datei-I/O benötigen, wie etwa Generative KI (GenAI).

Bildergalerie
Bildergalerie mit 6 Bildern

Storage Scale passt sich nun der GenAI-Ära an, indem es die Datenbereitstellung an GPU-Server mit einer neuen Speicherebene für Low-Latency- und High-Speed-Zugriff beschleunigt: die DAT-Schicht (Data Acceleration Tier), die die asymmetrische Datenreplikation verwendet. Diese Schicht bietet einerseits ein „Performance“-Datenreplikat für schnelles Lesen, andererseits ein „zuverlässiges“ Datenreplikat für die Datensicherheit, das durch Erasure-Coding geschützt ist.

Das „Performance“-Replikat verwendet NVMe-over-Fabric-Flash-Speicher, um möglichst schnelle Inferenzvorgänge des KI-Modells zu unterstützen (s. u.). IBM verfügt mit Watsonx selbst über ein komplettes Framework an KI-Technologie. „Entwickelt für extreme Leistung und Skalierbarkeit zur Unterstützung datenintensiver Workloads“, schreibt IBM auf seiner Webseite. „Als Nvidia-zertifizierter Speicher bietet er GPU-optimierten Durchsatz für schnellere Einblicke und Entscheidungen.“

Die „Performance“-Kopie von Daten ist ein persistenter, nicht redundanter Cache. Er wird mit „fauler“ Konsistenz beibehalten, was bedeutet, dass verpasste Updates (beispielsweise, weil ein Performance-Laufwerk offline ist) beim nächsten Lesen korrigiert werden, nachdem das Laufwerk wieder online ist.

Es gibt zwei Bereitstellungsoptionen für die Performance-Replik und den zuverlässigen Pool auf der Storage-Scale-System-6000-Appliance (ESS 6000):

  • Zentrale DAT: Diese Konfiguration ist für die Benutzerfreundlichkeit optimiert und erfüllt die allgemeinen AI-Workload-IOPS-Anforderungen, wobei der Leistungspool auf Storage Scale System 6000 (ESS 6000) mit NVMe oF für den Clientzugriff bereitgestellt wird. Diese Konfiguration hat 29 Millionen IOPS mit 32 Knoten im Cluster erreicht.
  • Verteilte DAT: Diese Konfiguration ist für höhere IOPS-Anforderungen durch KI-Workloads optimiert, wobei der Leistungspool auf clientlokalem Speicher (GPU-Server-DAS) bereitgestellt wird und die Leistung durch die Laufwerkskonfiguration und die Rechenfunktionen der Clientknoten bestimmt wird. Diese Konfiguration hat bislang einen Wert von 16 Millionen IOPS mit 16 Knoten erzielt.

Die Komponenten der ESS 6000 sind laut Datenblatt:

  • 24 x 61,44 TB QLC + 24 x 30,72 TB TLC-NVM,
  • 48 x 30,72 TB TLC-NVMe,
  • 48 x 38,4-TB-FlashCore-Module (FCM).

Das bedeutet, dass die Rohkapazität bei 2.211,84 TB (gemischtes QLC + TLC) liegt, die effektive Kapazität aber bei 3,4 PB. Der maximale Durchsatz liegt laut Datenblatt bei 330 GB/s. Alle diese Werte stellen durchschnittlich eine Verdoppelung der Leistung des Vorgängermodells ESS 3500 dar.

Es gibt Einschränkungen für den praktischen Einsatz. Eine ESS-6000-Appliance unterstützt ein einzelnes DAT-Dateisystem, und ein DAT-Dateisystem darf nicht mehr als eine einzige ESS 6000 verwenden, und das sollte die gesamte NVMe-Flash-Konfiguration sein, nicht eine Hybrid-Konfiguration.

Funktionen für KI-Workloads

Insgesamt, sagt IBM in seiner entsprechenden Pressemitteilung, verfügt die Software „Storage Scale v6.0“ über mehrere KI-relevante Funktionen. Dazu gehört erstens die Content Aware Storage (CAS); sie führt asynchrone Benachrichtigungen ein und soll eine schnellere, ereignisgesteuerte Datenaufnahme in KI-Inferenz-Workflows erlauben.

Zweitens verfügt Version 6.0 über eine erweiterte Nvidia-Integration mit CNSA-Unterstützung (Container Native Storage Access) für GPUDirect Storage sowie über erweiterte Basis-Befehls-Manager-Unterstützung und Nvidia-Nsight-Integration.

Drittens ist die ESS 6000 ausgerichtet auf NvidiaA-BasePOD/SuperPOD- und neueste Grace-Blackwell-GPU-Plattformen und verfügt über Nvidia-Speicher-Zertifikate, um auf diese Weise optimale Leistung und Kompatibilität zu gewährleisten.

Bildergalerie
Bildergalerie mit 6 Bildern

Sonstige Neuerungen

Version 6 verfügt auch über Ein-Tasten-GUI-Upgrades, und verbesserte Prechecks sowie eine einheitliche Protokollbereitstellung sollen den Betrieb vereinfachen. API-gesteuerte Verbesserungen der Steuerungsebene sollen helfen, die Automatisierung von Funktionen wie etwa Quoten zu ermöglichen. Es gebe zudem verbesserte Diagnostiken der Problembestimmung für Datenextrakte und Snapshots, um die Ursachenanalyse und -sanierung zu rationalisieren.

IBM kündigt an, dass es „in Kürze“ auch zusätzliche Unterstützung für NFS nconnect für Storage Scale 6.0.0 geben soll, was Hochdurchsatz-KI-Workloads über Standard-Ethernet ermöglichen soll. IBM will Unterstützung für SMB-Multichannel für zukünftige Versionen von Storage Scale hinzufügen, die eine Hochgeschwindigkeits-Datenerfassung von Windows-basierten Instrumenten und eine schnellere spätere Datenverarbeitung durch Windows-basierte Anwendungen ermöglichen würden. (Windows verwendet das SMB-Protokoll als Standard.)

Jetzt Newsletter abonnieren

Täglich die wichtigsten Infos zu Data-Storage und -Management

Mit Klick auf „Newsletter abonnieren“ erkläre ich mich mit der Verarbeitung und Nutzung meiner Daten gemäß Einwilligungserklärung (bitte aufklappen für Details) einverstanden und akzeptiere die Nutzungsbedingungen. Weitere Informationen finde ich in unserer Datenschutzerklärung. Die Einwilligungserklärung bezieht sich u. a. auf die Zusendung von redaktionellen Newslettern per E-Mail und auf den Datenabgleich zu Marketingzwecken mit ausgewählten Werbepartnern (z. B. LinkedIn, Google, Meta).

Aufklappen für Details zu Ihrer Einwilligung

IBM beabsichtigt laut neuesten Informationen, in einer zukünftigen Version der Software die oben genannte DAT-Beschränkung aufzuheben, die besagt, dass es einen Remote-Cluster nicht unterstützen kann.

Aktuelles eBook

Storage-Software als Effizienzbooster

eBook Storage-Software als Effizienzbooster
eBook „Storage-Software als Effizienzbooster“
(Bild: Storage-Insider)

Mit der geeigneten Storage-Software kann sich ein Unternehmen einen Effizienzbooster ins Haus holen oder in der Cloud abonnieren. Dieser Booster steigert nicht nur die Performance der geschäftskritischen Anwendungen, sondern optimiert auch die Kosten der bereits installierten Speichersysteme.

Die Themen im Überblick:

  • Herausforderungen eines modernen Speichersystems
  • Methoden und Technologien effizienter Speichersysteme
  • Effizienter Speicher mit Pure Storage, AWS, Cohesity und Dell

(ID:50624497)