Mobile-Menu

Vast Data „Storage ohne Zusatzfunktionen hat keine Zukunft“

Von lic.rer.publ. Ariane Rüdiger 6 min Lesedauer

Anbieter zum Thema

Storage wird immer mehr zur bloßen Hardware-Unterlage für intelligente Software-Lösungen. Ein Beispiel für diese Entwicklungen ist Vast Data. Der Spezialist für hochleistungsfähige Storage-Software diskutierte in München mit der Presse über die Trends des neuen Jahres.

Insight Engine integriert Nvidia NIMs in die Software-Umgebung der Vast Data Platform, so dass alle Analysen direkt dort durchgeführt werden können.(Bild:  Vast Data)
Insight Engine integriert Nvidia NIMs in die Software-Umgebung der Vast Data Platform, so dass alle Analysen direkt dort durchgeführt werden können.
(Bild: Vast Data)

Daten sind, so der Allgemeinplatz, das Gold der Zukunft, und das liegt auf Storage. Trotzdem sinkt die relative Bedeutung der Storage-Hardware. Denn ohne intelligente Software-Anwendungen, die aus den Daten auf der Storage verwertbare Erkenntnisse destillieren, ist mit der Storage nicht allzu viel anzufangen.

Das zeigt sich unter anderem daran, dass viele Storage-Hersteller versuchen, sich immer stärker als Software-Unternehmen zu definieren. So auch Vast Data. Die 2016 gegründete Firma setzte sich zum Ziel, eine Software-basierte Speicherplattform zu entwickeln, die besonders auf die Themen Hochleistungsrechnen und inzwischen auch KI zugeschnitten ist.

Zielgruppe: große Unternehmen und gehobener Mittelstand

Vast selbst versteht sich als Software-Unternehmen, obwohl die Kunden eine Appliance erhalten, auf der dann die Vast-Software läuft. Für Kleinfirmen ist die Lösung eher nichts. Konkrete Angaben über einen Einstiegspreis mag Breuner aber nicht machen. „Im Durchschnitt liegt der Umsatz mit unseren Kunden bei einer Million Dollar über drei bis fünf Jahre“, erklärt er.

Man unterhält Hardware-Kooperationen mit vielen großen Anbietern wie Lenovo, HPE, das Vast Data für seinen Greenlake-File-Storage-Service nutzt, und so weiter. Systemintegratoren, vor allem größere, übernehmen das Zusammenbauen der Lösungen. Seit 2019, als die Version 1.0 der Vast Data Platform vorlag, habe man mehrere Exabyte Storage implementiert.

Zehn Mitarbeitende in Deutschland

In Deutschland beschäftigt Vast Data zehn Personen, die allesamt im Home-Office arbeiten – die Errichtung einer Deutschland-Zentrale ist vorläufig auch nicht geplant, weiß Field CTO International Sven Breuner. Er ist in Mainz stationiert.

„Weltweit sind wir nicht ganz so schnell gewachsen, wie wir wollten“, sagt Breuner. Man habe aber inzwischen 950 Mitarbeiter, und der Cash-Flow sei schon eine Weile positiv. Zu den Kunden gehört auch der größte AI-Cluster der USA, XAI. Das Tochterunternehmen des Musk-Konzerns betreibt mehr als 100.000 Nvidia-GPUs parallel. Ein Erzeugnis ist das Multimodal-Modell GROK.

Erfahrungen aus der Filesystem-Entwicklungen

Breuner, der eine Aufgabe bei Vast Data seit vier Jahren wahrnimmt, konnte seine zuvor beim Fraunhofer-Institut gewonnene Erfahrung in diesem Umfeld sehr gut umsetzen: Er entwickelte in der Forschungseinrichtung mit an globalen Filesystemen, insbesondere BeeFS, die für Hochleistungs-Umgebungen eingesetzt werden. „Wir kommunizierten eng mit HPC-Spezialisten, die ständig von uns wissen wollten, warum beispielsweise Datenzugriffe nicht schnell genug funktionieren“, erinnert sich Breuner.

„Storage muss in Zukunft deutlich mehr können“: Sven Breuner, Field CTO International Vast Data.(Bild:  Storage-Insider)
„Storage muss in Zukunft deutlich mehr können“: Sven Breuner, Field CTO International Vast Data.
(Bild: Storage-Insider)

Denn HPC und KI haben enge Berührungspunkte. Das vereinfacht es Vast Data nun, im letztgenannten Bereich voranzukommen. „Sowohl bei HPC als auch bei KI geht es um die schnelle Handhabung vieler kleiner Files“, erklärt er. „Die bisherigen Algorithmen führten zu vielen Zufallszugriffen. Man musste also sehr sorgfältig die genutzten Algorithmen auswählen, um gute Ergebnisse zu bekommen.“

Strukturelle Systemähnlichkeit zwischen AI und HPC

Außerdem gehe es darum, Arbeit und Zugriffe auf viele parallel arbeitende GPUs zu verteilen. Das Vorgehen ähnelt dem, mit dem die Arbeit innerhalb von HPC-Umgebungen auf konventionelle Rechencores verteilt wird. „HPC war früher nur etwas für Universitäten oder sehr große Unternehmen. Heute verbreitet sich wegen KI die Technologie viel weiter“, sagt Breuner.

Mit der ausschließlichen Nutzung von Flash-Storage, kompletter Disaggregation der verschiedenen Ebenen und daraus folgend separater Skalierbarkeit je nach Bedarf kommt Vast Data Platform den Bedarfen dieser Märkte entgegen. Zu den deutschen Kunden gehört beispielsweise auch der Deutsche Wetterdienst, der für seine Vorhersagen hochkomplexe Modelle nutzt.

Daten sollen einfacher nutzbar werden

Das aktuelle Ziel von Vast Data ist es, Daten und AI für Unternehmen insgesamt einfacher nutzbar und zugänglicher zu machen. „Autobauer verwenden heute AI vor allem für das autonome Fahren. Dabei könnte die Technologie, überall eingesetzt und mit allen vorhandenen Daten gefüttert, das gesamte Unternehmen umkrempeln“, sagt Breuner.

Vast Data möchte daher die Daten „AI-ready“ (Breuner) auf seiner Plattform bereithalten. Dazu dient auch die Ankündigung der Insight Engine, einem Kooperationsprojekt mit Nvidia. Dabei werden Nvidias NIM-Mikroservices für Inferenzaufgaben direkt auf der Vast-Plattform zugänglich. Derzeit laufen Webinare, um die Kundschaft auf die Segnungen des neuen Angebots vorzubereiten. Doch erhältlich ist es noch nicht. Das folgt laut Breuner noch im ersten Halbjahr.

Jetzt Newsletter abonnieren

Täglich die wichtigsten Infos zu Data-Storage und -Management

Mit Klick auf „Newsletter abonnieren“ erkläre ich mich mit der Verarbeitung und Nutzung meiner Daten gemäß Einwilligungserklärung (bitte aufklappen für Details) einverstanden und akzeptiere die Nutzungsbedingungen. Weitere Informationen finde ich in unserer Datenschutzerklärung. Die Einwilligungserklärung bezieht sich u. a. auf die Zusendung von redaktionellen Newslettern per E-Mail und auf den Datenabgleich zu Marketingzwecken mit ausgewählten Werbepartnern (z. B. LinkedIn, Google, Meta).

Aufklappen für Details zu Ihrer Einwilligung

Insight Engine: Nvidia direkt auf Vast Data Platform

„Mit Insight Engine können Kunden direkt auf der Datenplattform Einsichten aus der Analyse von Sprache oder Videos gewinnen“, erklärt Breuner. Beispielsweise könnten die Filme, die über frühere Crash-Tests gedreht wurden, nach AI-Analyse zur Weiterentwicklung von Airbags verwendet werden. Solche generalisierenden Ansätze gebe es gerade in Deutschland zu wenig. Das mag allerdings auch daran liegen, dass viele Spezialisten gerade nicht zum breitflächigen Einsatz, sondern zum vorsichtigen Herantasten über zunächst einige erfolgversprechende Testfelder raten.

Neben Insight Engine bringt Vast mit „Triggers“ und „Functions“ neue Möglichkeiten, aktuelle Daten über RAG (Reetrieval Augmented Generation) quasi in Echtzeit in die Vast Database, eine Schlüsselkomponente der Vast Data Platform, zu integrieren. Das könnte etwa die Video-Datenströme aus Kameras betreffen, ein Thema, das für Sicherheitsanwendungen eine Rolle spielt.

Daten sollen On-Premises bleiben

Breuner glaubt wie viele Spezialisten daran, dass Unternehmen in Zukunft nicht etwa vor allem mit ChatGPT, sondern eher mit kleineren, spezialisierteren Modellen arbeiten werden, auch wenn ChatGPT für bestimmte Aufgaben sehr gern genutzt wird. „Es gibt schon sehr gute Speziallösungen, beispielsweise Cursor AI, um Software zu generieren“, sagt Breuner.

Kunden behielten sehr wahrscheinlich ihre Daten auch weiterhin gern im Haus oder lagerten die Analyse an spezialisierte Dienstleister mit KI-Rechenzentren aus, sofern bei ihnen garantiert sei, dass sie die geltende Rechtslage hinsichtlich der Daten respektierten. Auch das komme Vasts Ansatz entgegen.

Hardware: mehr Auswahl, aber die Software fehlt

Hinsichtlich der Processing-Hardware gebe es mehr und mehr Auswahl neben Nvidia, etwa von AMD oder Cerebras. Allerdings, so Breuner, habe Nvidia sich mit CUDA einen schwer einholbaren Software-Vorsprung erarbeitet. Dabei habe AMD inzwischen sogar einen Konverter für die Nutzung von CUDA-Code auf der eigenen Plattform entwickelt.

Breuner begrüßt sehr die europäischen Initiativen für mehr Eigenständigkeit bei AI-Hard- und Software. Ein Beispiel ist das Europa-Projekt HammerHAI, bei dem eine AI-Factory an der Universität Stuttgart entstehen soll. Ein anderes ist Hessian AI, eine auf dieses Bundesland bezogene AI-Initiative der hessischen Regierung. Breuner: „Allerdings wird oft nicht genug Geld investiert. Vergleicht man US- und EU-Projekte, dann steckt in den US-Projekten meist zehnmal so viel Geld.“

Storage der Zukunft: funktionsreich und nachhaltig

Wie muss das Storage-System der Zukunft aussehen? Breuner sieht hier vor allem zwei Notwendigkeiten: Die erste besteht in der Durchgängigkeit zwischen unterschiedlichen Rechenzentren, auf denen ein Unternehmen Daten lagert, ohne dabei Zugriffsrechte und Compliance zu vernachlässigen. Dazu gehören auch ausgefeilte Sicherheitsmechanismen.

Der zweite wichtige Punkt sei ein nachhaltigerer Betrieb solcher Plattformen. Hier habe Vast Data mit dem Infinite Storage Lifecycle bereits eine gute Lösung auf Lager, berichtet Breuner. Darunter ist zu verstehen, dass stets zertifizierte Hardware-Plattformen unterschiedlicher Hersteller und unterschiedlicher Produktgenerationen in einem System zusammenarbeiten können. So können Anwender, die einerseits an der Leistungsspitze stehen, andererseits ihre Altsysteme nicht sinnlos entsorgen wollen, beide Ziele unter einen Hut bringen.

Aktuelles eBook

Storage für HPC & KI

eBook Storage für HPC & KI
eBook „Storage für HPC & KI“
(Bild: Storage-Insider)

Speichersysteme für das HPC und für die verschiedenen Disziplinen der KI sind hohen Anforderungen ausgesetzt. Denn sie müssen enorme Datenmengen in kürzester Zeit bereitstellen oder sammeln. Wie können diese Herausforderungen gemeistert werden?

Die Themen im Überblick:

  • Aktuelle Trends in der Künstlichen Intelligenz
  • High-Performance Computing – Explosion der Innovationen
  • Künstliche Intelligenz – nahezu Echtzeit-Datenverarbeitung

(ID:50304415)