Mobile-Menu

Interview mit Andy Pernsteiner, Field CTO bei VAST Data „KI für alle!“

Von Dr. Jürgen Ehneß 8 min Lesedauer

Anbieter zum Thema

Im Frühherbst hat VAST Data die Intensivierung seiner strategischen Partnerschaft mit CoreWeave zum Aufbau einer auf Nvidia-Technologie basierenden Cloud für Accelerated Computing bekanntgegeben. Wir haben beim Field CTO Andy Pernsteiner nachgehakt, welche Möglichkeiten und Vorteile den Kundenunternehmen damit entstehen.

Zusammen mit CoreWeave will VAST allen Unternehmen „Zugang zu den neuesten Technologien, effizienten Architekturen und wettbewerbsfähigen Preisen“ ermöglichen.(Bild:  ©koyu, Getty Images via Canva.com)
Zusammen mit CoreWeave will VAST allen Unternehmen „Zugang zu den neuesten Technologien, effizienten Architekturen und wettbewerbsfähigen Preisen“ ermöglichen.
(Bild: ©koyu, Getty Images via Canva.com)

Storage-Insider: Können Sie uns mehr über den Hintergrund und die Motivation für die strategische Partnerschaft zwischen VAST Data und CoreWeave erzählen?

Andy Pernsteiner, VAST Data: CoreWeave ist ein spezialisierter Cloud-Provider, der eine große Anzahl von GPUs auf der schnellsten und flexibelsten Infrastruktur der Branche bereitstellt. Die VAST Data Platform wurde von Grund auf entwickelt, um KI-Workloads in jeder Größenordnung zu unterstützen und gleichzeitig eine sichere Multi-Tenancy-Unterstützung auf Enterprise-Niveau zu bieten. Letztendlich verfolgen wir das gemeinsame Ziel, erstklassige Services, Software und Architekturen bereitzustellen, damit Unternehmen jeder Größe sofort mit der Bereitstellung ihrer KI-Workloads beginnen können.

Wie genau wird VAST Data CoreWeave dabei helfen, Unternehmenskunden eine skalierbare Cloud-Infrastruktur für KI und beschleunigte Rechenlasten bereitzustellen?

Pernsteiner: CoreWeave wird die VAST Data Platform in seinen Rechenzentren auf der ganzen Welt einsetzen. Da die Plattform Leistung und Kapazität unabhängig voneinander skalieren kann, wird CoreWeave in der Lage sein, schnell auf alle unvorhersehbaren Anforderungen seiner Kunden zu reagieren. Da VAST Software-definiert ist und nach Kapazität lizenziert wird, kann CoreWeave die zugrundeliegende Hardware basierend auf Beschaffungszyklen bereitstellen und die Lizenzierung dieser Kapazität später auf Grundlage der tatsächlichen Nachfrage aktivieren. Dadurch können CSPs wie CoreWeave ihren Kunden wettbewerbsfähige Preise anbieten, indem sie die zugrundeliegenden Kosten senken.

Können Sie einige spezifische Anwendungsfälle oder Branchen nennen, die von dieser Partnerschaft profitieren werden?

Pernsteiner: Alle Unternehmen, die GPU-beschleunigte Workloads wie KI-Training, Inferenz und generative KI ausführen wollen, werden von dieser Partnerschaft profitieren, da sie ein nahtloses KI-Erlebnis mit effizienter Nutzung der GPU-Ressourcen bietet. LLMs erfreuen sich derzeit großer Beliebtheit, da viele große Unternehmenskunden ihre Modelle für ChatBot-Anwendungsfälle optimieren. Vor allem im Bereich der Gesundheitswissenschaften haben wir eine hohe Akzeptanz und Interesse festgestellt. So wird beispielsweise ein Modell anhand von Millionen von MRTs und anderen Bildern trainiert, um Inferenzen und Anomalien zu erkennen, so dass Ärzte und Kliniker mehr Sicherheit bei der Diagnose von Krankheiten bei ihren Patienten gewinnen können.

Welche spezifischen Merkmale der VAST Data Platform machen sie besonders geeignet für KI-, LLM-Trainings- und Inferenzanwendungen?

Pernsteiner: Die VAST Data Platform trennt Rechen- und Speicherfunktionen in einer einzigartigen Architektur namens DASE. Dieser Ansatz ermöglicht den Kunden eine unabhängige Skalierung von Leistung und Speicher über Namespaces im Exabyte-Bereich. Um die Leistung zu steigern, müssen dem Cluster lediglich zustandslose Container-Server hinzugefügt werden, so dass CoreWeave neue Anforderungen einfach und dynamisch erfüllen kann. Unterstützung für NFSoRDMA sowie Erweiterungen für MultiPathing und GPU Direct Storage stellen sicher, dass die GPUs die Daten in dem Tempo erhalten, in welchem sie diese verbrauchen wollen.

Die integrierte, stets aktive Datenreduzierung zusammen mit extrem breiten Daten-Stripes bietet eine überzeugende Wirtschaftlichkeit für die Speicherung aller für KI benötigten Daten. Dadurch entfallen die Notwendigkeit mehrerer Storage-Tiers und die Anforderung, Daten vor und nach dem Training zu verschieben. Dies vereinfacht die KI-Datenpipelines der Kunden erheblich. Zu beachten ist, dass LLMs häufig auf textbasierten Daten trainiert werden, die bei einer Speicherung auf VAST bis zu 5:1 reduziert werden können.

Andy Pernsteiner, Field CTO bei VAST Data.(Bild:  VAST Data)
Andy Pernsteiner, Field CTO bei VAST Data.
(Bild: VAST Data)

Der VAST DataSpace bietet einen globalen Namensraum, der alle Daten an jedem beliebigen Ort verfügbar macht. Dies reduziert erheblich die Komplexität, sicherzustellen, dass die Daten dort sind, wo sie sein müssen, wenn dies erforderlich ist, auf allen Stufen ihrer Reise – vom Import (Ingestion) über das Training bis zur Inferenz. Die VAST DataBase ermöglicht es Anwendungen, strukturierte Daten in großem Umfang zu speichern. Sie unterstützt Schema-Evolution, schnelle Pushdown-Filter und nutzt die einzigartige Architektur von VAST, um die beste Leistung ihrer Klasse zu bieten. Sie ist gleichzeitig in der Lage, Millionen von Transaktionsaktualisierungen pro Sekunde, schnelle Ad-hoc-Abfragen und tiefe Analysen im OLAP-Stil zu liefern – und das alles für dieselben Tabellen.

Welche Vorteile bieten CoreWeave und die VAST Data Platform im Vergleich zu herkömmlichen Cloud-Providern, insbesondere in Bezug auf Geschwindigkeit und Kosten?

Pernsteiner: Sowohl CoreWeave als auch VAST haben die Vision, KI für alle zu demokratisieren. Dazu gehört auch, dass jeder Zugang zu den neuesten Technologien, effizienten Architekturen und wettbewerbsfähigen Preisen hat. CoreWeave bietet Zugang zu den schnellsten Grafikprozessoren der Welt auf einer Datenplattform, die mandantenfähig, sicher und unternehmenstauglich ist und sich auf jedes geforderte Leistungs- und Kapazitätsniveau skalieren lässt. Die Kombination der beiden Systeme bietet allen Unternehmen, ob groß oder klein, Zugang zu derselben Hardware, auf die auch die führenden Technologieunternehmen zugreifen können, und eine extrem effiziente Architektur, die zu den besten ihrer Klasse gehört.

Jetzt Newsletter abonnieren

Täglich die wichtigsten Infos zu Data-Storage und -Management

Mit Klick auf „Newsletter abonnieren“ erkläre ich mich mit der Verarbeitung und Nutzung meiner Daten gemäß Einwilligungserklärung (bitte aufklappen für Details) einverstanden und akzeptiere die Nutzungsbedingungen. Weitere Informationen finde ich in unserer Datenschutzerklärung. Die Einwilligungserklärung bezieht sich u. a. auf die Zusendung von redaktionellen Newslettern per E-Mail und auf den Datenabgleich zu Marketingzwecken mit ausgewählten Werbepartnern (z. B. LinkedIn, Google, Meta).

Aufklappen für Details zu Ihrer Einwilligung

Wie sehen Sie die zukünftige Entwicklung der künstlichen Intelligenz, und welche Anwendungsbereiche könnten von Fortschritten in diesem Bereich besonders profitieren?

Pernsteiner: Es gab bisher erstaunliche Entwicklungen, die noch nicht voll ausgeschöpft wurden. Der Einsatz von multimodaler KI wird viele dieser Entwicklungen kombinieren und zu Ergebnissen führen, die größer sind als die der einzelnen Teile. Dies wird dazu führen, dass immer mehr Anwendungen, die verschiedene Formen von Eingaben benötigen (zum Beispiel Text, Bilder, Fachwissen), die Vorteile der KI nutzen können.

Welche Auswirkungen erwarten Sie von dieser Partnerschaft auf die Zukunft von KI-Computing und datengesteuerter Forschung?

Pernsteiner: Eine der größten Hürden für Fortschritte in den Bereichen KI-Computing und Data-Driven-Discovery ist das Wissen, das für die Einrichtung, Konfiguration und Optimierung einer Umgebung erforderlich ist, um KI effizient und kostengünstig einzusetzen. Sowohl CoreWeave als auch VAST haben die gemeinsame Vision, die Welt mit einem Service und einer Plattform auszustatten, die dies Wirklichkeit werden lassen. Kombiniert man die beiden Lösungen, erhält man eine sehr einfach zu nutzende KI-Infrastruktur, die es Unternehmen ermöglicht, ihre KI-Initiativen schnell umzusetzen.

Was sind die langfristigen Ziele von VAST Data und CoreWeave im Bereich KI und Cloud Computing?

Pernsteiner: Das langfristige Ziel im Bereich KI und Cloud Computing ist einfach: so vielen Unternehmen wie möglich den Zugang zu erstklassigen KI-Architekturen zu ermöglichen, um unendliche Mengen an datengesteuerten Entdeckungen freizusetzen, die die Welt verändern werden.

Welche Herausforderungen sind bei der Umsetzung dieser ehrgeizigen Cloud-Plattform zu erwarten, und wie werden sie bewältigt?

Pernsteiner: Eine der größten Herausforderungen besteht darin, mit den rasanten Veränderungen in diesem Bereich Schritt zu halten. Die VAST Data Platform wurde auf der Grundlage eines radikalen neuen Ansatzes entwickelt, bei dem die Verarbeitung von Daten und die Speicherung disaggregiert sind, und auf der Grundlage revolutionärer Methoden des Datenlayouts, die auf einigen der neuesten verfügbaren Technologien basieren. Daher befindet sich diese Plattform in einer einzigartigen Position, um alle Herausforderungen zu bewältigen, die sich ihr stellen. In Kombination mit der Tatsache, dass die VAST Data Platform Software-basiert ist, kann sie sich problemlos an neu verfügbare Technologien, Protokolle und Datenpipelines anpassen, und zwar mit „Over the air“-Updates.

Wir arbeiten eng mit einigen der weltweit größten Installationen von KI-Infrastrukturen zusammen, was uns die Möglichkeit gibt, sicherzustellen, dass unsere Datenplattform für die neuesten und größten Anforderungen ausgelegt ist, die an sie gestellt werden.

Welche neuen Möglichkeiten eröffnet diese Partnerschaft für KI-Forschung und -Entwicklung?

Pernsteiner: Diese Partnerschaft ermöglicht der KI-Forschung und -Entwicklung den Zugang zu den besten KI-Architekturen und -Geschwindigkeiten, um die Voraussetzungen für den Zugang zu den neuesten und besten Technologien zu schaffen.

Welche Skalierbarkeits- und Leistungsvorteile bietet die VAST Data Platform für KI-Workloads?

Pernsteiner: Aufgrund der einzigartigen DASE-Architektur von VAST lassen sich Kapazität und Leistung linear skalieren, indem einfach mehr Speicher oder mehr Rechenknoten hinzugefügt werden. Bei herkömmlichen Scale-Out-Architekturen nehmen die Erträge mit zunehmender Anzahl von Knoten ab; dies ist bei der VAST Data Platform nicht der Fall. Darüber hinaus unterstützt VAST die Protokolle, mit denen KI bevorzugt arbeitet, einschließlich RDMA und nativer GPU-proprietärer Protokolle. Die VAST Data Platform ist die einzige Plattform auf Enterprise-Niveau, die vom weltweit führenden GPU-Anbieter zertifiziert wurde.

Glauben Sie, dass sich KI in Zukunft in verschiedenen Branchen und im täglichen Leben durchsetzen wird, und wie wird sich dies auf die Gesellschaft insgesamt auswirken?

Pernsteiner: Es wird definitiv eine Masseneinführung von KI in allen Branchen geben. Jeder neue Anwendungsfall von KI führt zu neuen Ideen in anderen, nicht verwandten Branchen. Und wenn verschiedene Konkurrenten in der Branche KI einsetzen und einen Wettbewerbsvorteil erlangen, übt dies Druck auf die übrigen Konkurrenten im gleichen Bereich aus.

Jede Innovation wird sich auf die Gesellschaft auswirken. Es gibt zahlreiche Anwendungsfälle, aber ein bemerkenswerter Anwendungsfall ist die Idee der Personalisierung. Heute erhalten wir allgemeine ärztliche Verordnungen, Fernsehsendungen für ein breites Publikum, Schulungsinhalte für Arbeitgeber in einer Sprache oder einem Kommunikationsstil. KI wird eine kosteneffiziente Möglichkeit bieten, die Art und Weise, wie die Außenwelt mit jedem Einzelnen interagiert, zu personalisieren.

Was ist die langfristige Vision Ihres Unternehmens in Bezug auf die Integration und Nutzung von KI in verschiedenen Aspekten des täglichen Lebens und der Wirtschaft?

Pernsteiner: VAST Data möchte Unternehmen aller Größenordnungen in die Lage versetzen, die Welt um sie herum durch den Einsatz von KI positiv zu beeinflussen. Die VAST Data Platform bietet eine Architektur, die es Unternehmen ermöglicht, KI so zu nutzen, wie sie heute genutzt wird. Im Jahr 2024 werden wir ein Software-Update veröffentlichen, das es Unternehmen ermöglicht, zu einem datengesteuerten Ansatz überzugehen, bei dem Daten automatisch KI-Funktionen starten, die in Echtzeit Erkenntnisse aus diesen neuen Daten gewinnen. Sie kann dann den Datenkatalog nutzen, den Kunden heute einsetzen, um diese Erkenntnisse eng mit den ursprünglichen Daten zu verknüpfen. Diese neuen Erkenntnisse können wiederum andere KI-Funktionen auslösen, die vielleicht ein anderes KI-Modell nutzen. Dieser gesamte Prozess kann rekursiv ablaufen, was ein System ermöglicht, das selbständig auf früheren Erkenntnissen aufbaut. Und dies ermöglicht die Automatisierung der Entdeckung selbst.

Vielen Dank für das Interview, Herr Pernsteiner.

Aktuelles eBook

Storage für HPC & KI

eBook Storage für HPC & KI
eBook „Storage für HPC & KI“
(Bild: Storage-Insider)

Speichersysteme für das HPC und für die verschiedenen Disziplinen der KI sind hohen Anforderungen ausgesetzt. Denn sie müssen enorme Datenmengen in kürzester Zeit bereitstellen oder sammeln. Wie können diese Herausforderungen gemeistert werden?

Die Themen im Überblick:

  • Aktuelle Trends in der Künstlichen Intelligenz
  • High-Performance Computing – Explosion der Innovationen
  • Künstliche Intelligenz – nahezu Echtzeit-Datenverarbeitung

(ID:49813241)