Beim Einsatz von KI zählen vor allem die Ergebnisse – seien es neue Inhalte, automatisierte Prozesse oder völlig neue Erkenntnisse. Damit KI-Technologien erfolgreich arbeiten, müssen Daten richtig gespeichert, abgerufen und verwaltet werden.
Cloud-Storage könnte auf Dauer das Rückgrat der KI-Infrastruktur abbilden und sich als essenzielle Unterstützung für Datenmanagement entpuppen.
Das sind ebenjene Aspekte, die im Hintergrund laufen, aber von zentraler Bedeutung sind. Die zugrunde liegende Speicherinfrastruktur wird so zum entscheidenden Erfolgsfaktor und bildet in ihrer Gesamtheit die sogenannte KI-Data-Pipeline.
Storage ist keine technische Nebensache
KI-Anwendungen greifen oft auf Terabytes oder sogar Petabytes an Daten zurück. Diese Informationen sind häufig unstrukturiert und unvollständig. Um sie verarbeiten zu können, benötigen IT-Teams Speicherlösungen, die hohe Geschwindigkeiten bei der Datenaufnahme (Ingestion) unterstützen, für Datensicherheit sorgen und zuverlässigen Zugriff bieten. Das gilt für den gesamten KI-Lebenszyklus, so müssen sowohl aktuelle als auch historische Datensätze jederzeit abrufbar sein. Sollte sich der Zugriff jedoch als zu langsam, teuer oder komplex erweisen, kann bereits die Experimentierphase ins Stocken geraten. Das Gesamtsystem verliert so an Flexibilität, auch wenn die KI-Modelle selbst hochentwickelt sind.
Die KI-Data-Pipeline verläuft dabei selten linear. Die Anforderungen variieren je nach Phase: Während der Ingestion zählen Durchsatz und Skalierbarkeit, beim Training und bei der Validierung stehen Geschwindigkeit und geringe Latenz im Vordergrund. Für die Langzeitspeicherung sind dagegen Haltbarkeit und Kostenoptimierung entscheidend. Außerdem greifen IT-Teams beim Retraining oder zum Vergleich von Ergebnissen oft auf Datensätze zurück, die sie bereits vor Monaten archiviert haben.
Es ist daher wichtig, die passende Speicherlösung für die jeweilige Anforderung zu wählen. Wenn jeder Schritt in der KI-Data-Pipeline ausschließlich mittels High-Performance-Storage abgedeckt würde, würden die Kosten schnell explodieren. Nicht alle Workloads benötigen die gleiche Performance, und nicht jeder Datensatz muss in teuren, schnellen Umgebungen gespeichert werden. Kosteneffizientes Datenmanagement bedeutet, den richtigen Speicher zum richtigen Zeitpunkt zu verwenden. So lassen sich Ressourcen flexibel an die jeweiligen Anforderungen anpassen. Entsprechend konzipierte Storage-Lösungen führen sowohl zu mehr Effizienz im operativen Bereich als auch zu höheren Investitionsrenditen.
Skalierung wird immer wichtiger
Angesichts der zunehmenden Abhängigkeit von KI und maschinellem Lernen wird die Nachfrage nach Cloud-Storage-Lösungen deutlich steigen. Laut aktuellen Studien erwarten fast zwei Drittel der Unternehmen, die die Cloud als primäres Speichermedium nutzen, dass sich ihr Speicherbedarf in den nächsten drei Jahren mehr als verdoppeln wird. Das Datenvolumen, das durch KI-Modelle generiert, gespeichert und wiederverwendet wird, wächst dabei exponentiell.
Schätzungen des international tätigen Marktforschungsunternehmens IDC zufolge liegen 89 Prozent der Daten, die bei großen Cloud-Anbietern gespeichert werden, auf Festplatten. Diese Zahl spiegelt den Umfang und die Haltbarkeit wider, die für die Verwaltung solcher Daten notwendig sind. Sie zeigt aber auch, dass ein Großteil der KI-Infrastruktur noch immer auf traditionellen Speichertechnologien basiert. Den Zugriff und die Performance auf allen Ebenen der Data-Pipeline zu optimieren, bleibt daher eine zentrale Herausforderung.
Mittlerweile hat sich die Objektspeicherung in der Cloud (Cloud-Object-Storage) als praktikable Lösung für viele Phasen der KI-Data-Pipeline etabliert. Diese Art der Speicherung wird spezialisierte Hochleistungsspeicher zwar nicht ersetzen, sie unterstützt jedoch den Datenfluss in Organisationen. Mittels Object-Storage können IT-Teams umfangreiche Daten leicht zugänglich, sicher und preiswert speichern, selbst wenn Monate zwischen der letzten Nutzung liegen. Diese Kontinuität wird immer wichtiger, weil sich die KI-Entwicklung in Organisationen zunehmend von einem einmaligen Projekt zu einem fortlaufenden Prozess wandelt.
Preisfalle hemmt Potenzial
Ein häufiges Problem beim Thema Storage sind dabei nicht die Kosten für die Speicherlösung selbst, sondern die Zusatzzahlungen. So erheben einige Anbieter Gebühren für das Abrufen oder Interagieren mit den gespeicherten Daten. Diese mögen für sich genommen gering erscheinen, doch bei datenintensiven Arbeitsabläufen summieren sie sich im Handumdrehen. Dieser zusätzliche Aufwand kann wiederum Teams daran hindern, iterative Prozesse durchzuführen oder neue Hypothesen zu testen.
Stand: 08.12.2025
Es ist für uns eine Selbstverständlichkeit, dass wir verantwortungsvoll mit Ihren personenbezogenen Daten umgehen. Sofern wir personenbezogene Daten von Ihnen erheben, verarbeiten wir diese unter Beachtung der geltenden Datenschutzvorschriften. Detaillierte Informationen finden Sie in unserer Datenschutzerklärung.
Einwilligung in die Verwendung von Daten zu Werbezwecken
Ich bin damit einverstanden, dass die Vogel IT-Medien GmbH, Max-Josef-Metzger-Straße 21, 86157 Augsburg, einschließlich aller mit ihr im Sinne der §§ 15 ff. AktG verbundenen Unternehmen (im weiteren: Vogel Communications Group) meine E-Mail-Adresse für die Zusendung von Newslettern und Werbung nutzt. Auflistungen der jeweils zugehörigen Unternehmen können hier abgerufen werden.
Der Newsletterinhalt erstreckt sich dabei auf Produkte und Dienstleistungen aller zuvor genannten Unternehmen, darunter beispielsweise Fachzeitschriften und Fachbücher, Veranstaltungen und Messen sowie veranstaltungsbezogene Produkte und Dienstleistungen, Print- und Digital-Mediaangebote und Services wie weitere (redaktionelle) Newsletter, Gewinnspiele, Lead-Kampagnen, Marktforschung im Online- und Offline-Bereich, fachspezifische Webportale und E-Learning-Angebote. Wenn auch meine persönliche Telefonnummer erhoben wurde, darf diese für die Unterbreitung von Angeboten der vorgenannten Produkte und Dienstleistungen der vorgenannten Unternehmen und Marktforschung genutzt werden.
Meine Einwilligung umfasst zudem die Verarbeitung meiner E-Mail-Adresse und Telefonnummer für den Datenabgleich zu Marketingzwecken mit ausgewählten Werbepartnern wie z.B. LinkedIN, Google und Meta. Hierfür darf die Vogel Communications Group die genannten Daten gehasht an Werbepartner übermitteln, die diese Daten dann nutzen, um feststellen zu können, ob ich ebenfalls Mitglied auf den besagten Werbepartnerportalen bin. Die Vogel Communications Group nutzt diese Funktion zu Zwecken des Retargeting (Upselling, Crossselling und Kundenbindung), der Generierung von sog. Lookalike Audiences zur Neukundengewinnung und als Ausschlussgrundlage für laufende Werbekampagnen. Weitere Informationen kann ich dem Abschnitt „Datenabgleich zu Marketingzwecken“ in der Datenschutzerklärung entnehmen.
Falls ich im Internet auf Portalen der Vogel Communications Group einschließlich deren mit ihr im Sinne der §§ 15 ff. AktG verbundenen Unternehmen geschützte Inhalte abrufe, muss ich mich mit weiteren Daten für den Zugang zu diesen Inhalten registrieren. Im Gegenzug für diesen gebührenlosen Zugang zu redaktionellen Inhalten dürfen meine Daten im Sinne dieser Einwilligung für die hier genannten Zwecke verwendet werden. Dies gilt nicht für den Datenabgleich zu Marketingzwecken.
Recht auf Widerruf
Mir ist bewusst, dass ich diese Einwilligung jederzeit für die Zukunft widerrufen kann. Durch meinen Widerruf wird die Rechtmäßigkeit der aufgrund meiner Einwilligung bis zum Widerruf erfolgten Verarbeitung nicht berührt. Um meinen Widerruf zu erklären, kann ich als eine Möglichkeit das unter https://contact.vogel.de abrufbare Kontaktformular nutzen. Sofern ich einzelne von mir abonnierte Newsletter nicht mehr erhalten möchte, kann ich darüber hinaus auch den am Ende eines Newsletters eingebundenen Abmeldelink anklicken. Weitere Informationen zu meinem Widerrufsrecht und dessen Ausübung sowie zu den Folgen meines Widerrufs finde ich in der Datenschutzerklärung.
Wenn Organisationen ihre Speicherarchitektur festlegen, beeinflussen sie damit direkt, wie flexibel sie mit KI umgehen, wie experimentierfreudig sie bleiben und welche Kosten entstehen. Systeme, die eine transparente Preisgestaltung bieten und einen einfachen Zugriff ermöglichen, fördern eine nachhaltigere und agilere Entwicklung von KI.
Bei KI zählt, was langfristig zielführend ist
Die erfolgreichsten KI-Projekte sind meist diejenigen, die sich kontinuierlich weiterentwickeln. Dafür reicht ein leistungsstarkes Modell allein nicht aus. Entscheidend ist eine Dateninfrastruktur, die zuverlässig, zugänglich und flexibel genug ist, sich den Arbeitsprozessen der Teams anzupassen. Mit der wachsenden Bedeutung von KI in allen Branchen wird Cloud Storage auch künftig ein grundlegender Erfolgsfaktor bleiben – und als stilles Fundament der KI die weitere Entwicklung maßgeblich prägen.
* Der Autor Marco Pfuhl wurde im Juni 2025 zum DACH-Chef bei Wasabi Technologies ernannt.
Bildquelle: Wasabi Technologies
Aktuelles eBook
Storage für HPC & KI
eBook „Storage für HPC & KI“
(Bild: Storage-Insider)
Speichersysteme für das HPC und für die verschiedenen Disziplinen der KI sind hohen Anforderungen ausgesetzt. Denn sie müssen enorme Datenmengen in kürzester Zeit bereitstellen oder sammeln. Wie können diese Herausforderungen gemeistert werden?
Die Themen im Überblick:
Aktuelle Trends in der Künstlichen Intelligenz
High-Performance Computing – Explosion der Innovationen