Seit Jahren wird viel über Artificial Intelligence (AI) und Maschinelles Lernen (ML) diskutiert. Fraglich blieb, ob der Einfluss auf unser Leben tatsächlich spürbar ist. Jedoch scheinen sich mit dem erfolgreichen Einzug von ChatGPT in unseren Alltag die AI-Prognosen aus den letzten Jahren zu bewahrheiten.
Durch Künstliche Intelligenz und Machine Learning entstehen neue Anforderungen an Speichersysteme und -infrastrukturen.
(Bild: sdecoret - stock.adobe.com)
Es steht wohl außer Frage, dass AI und andere Formen des Maschinellen Lernens das Leben und die Wirtschaft maßgeblich verändern werden. Auf der Grundlage riesiger Datenmengen lassen sich wiederholende Aufgaben mit AI-Tools beschleunigen und automatisieren. Deep-Learning-Anwendungen werden dabei in drei Schritten entwickelt: Datenaufbereitung, Modelltraining und Schlussfolgerung.
1. Datenvorbereitung (Data Preparation): Enorme Masse an Rohmaterial wird in nutzbare Daten konvertiert.
2. Modelltraining (Model Training): Training der Software-Programme, aus Daten neue Fähigkeiten zu erlernen.
3. Schlussfolgerung (Inference): Das Programm setzt das Gelernte bei neuen Daten ein.
Daten sind die Grundlage für AI. Man kann also davon ausgehen, dass mit vermehrtem Einsatz von AI-Anwendungen noch mehr Daten generiert werden. Branchenspezialisten schätzen, dass sich der Umfang unstrukturierter Daten – also Dateien und Objekte – in den nächsten Jahren verdoppeln oder sogar verdreifachen wird. Eine große Rolle bei diesem Wachstum werden AI, ML und Deep Learning spielen.
Neues Zeitalter der Datenspeicherung
Das neue Zeitalter für Daten bringt einige besondere Herausforderung für die Verantwortlichen mit sich. Der Umfang und das Volumen der Datensätze sind exponentiell größer als alles andere je zuvor. Entwickler von Machine-Learning-Technologien für Autonomes Fahren produzieren im Allgemeinen in nur wenigen Jahren mehr als ein Exabyte an Daten. Als eine Form des Maschinellen Lernens und Maschinellen Sehens beruht Autonomes Fahren auf Bild- und Videodaten. In den nächsten fünf Jahren wird sich die Datenmengen aufgrund von AI und ML weiter stark vergrößern.
Storage-Infrastruktur muss sich ändern
Die Leistung der Speicherinfrastruktur wird durch solche Deep-Learning-Anwendungen über die einfache Speicherung hinaus außerordentlich gefordert. Üblicherweise benötigt die Verarbeitung dieser umfangreichen unstrukturierten Datensätze sehr niedrige Latenzzeiten und in diesem Zusammenhang konsistente Leistung. Diese Anforderungen können von festplattenbasierten Speichersystemen, die auf seriellen Festplatten basieren, einfach nicht mehr erfüllt werden. Um die gefragten niedrigen Latenzzeiten und stärkere Leistung garantieren zu können, vertrauen Unternehmen auf neue verteilte Architekturen, die auf NVMe und RDMA basieren. Aufgrund der zunehmenden Günstigkeit dieser auf Flash basierenden Speicher werden diese auch häufiger verwendet.
Wesentliche Performancesteigerung von Speichersystemen erforderlich
Ein weiterer wichtiger Punkt ist der Speicherort dieser Daten. Nur selten liegen sie handlich auf dem Arbeitsspeicher im Hauptzentrum. Diese Daten werden meistens außerhalb des Rechenzentrums erzeugt und schließlich an einen anderen Ort zur Verarbeitung übertragen. Das kann entweder in einem Rechenzentrum oder in der Public Cloud stattfinden, oder aber, und das ist wahrscheinlicher, die Datenverarbeitung erfolgt an beiden Orten. Datentransport und Datenmanagement über ihren gesamten Lebenszyklus hinweg sind ausschlaggebend für das Management der IT-Infrastruktur, insbesondere weil die Datenmengen und ihre Modelle jahrzehntelang gespeichert werden – für den Fall, dass die Programme irgendwann einmal neu trainiert werden müssen.
Diese Aspekte des Datenmanagements setzen alte Speicherarchitekturen schon lange unter Druck. Der Großteil der unstrukturierten Daten liegt heute auf Speichersystemen ab, die vor 20 Jahren entwickelt wurden. Damals konnte man sich noch nicht vorstellen, dass einmal Billionen von Daten und Objekten von Maschinen und nicht von Menschen erzeugt und jahrzehntelang gespeichert werden würden.
Fazit: Mit NVMe und RDMA zum Storage der neuesten Generation
Ines Wolf, Manager Pre-Sales Zentraleuropa bei Quantum.
(Bild: Quantum)
Auf lange Sicht können Unternehmen, die Anwendungen auf Basis von AI, ML und Deep Learning erzeugen, ihre Ziele nicht mit traditionellen Storage-Infrastrukturen erreichen. Datenwissenschaftler, Inhaltsersteller und Analysten, die jeden Tag auf diese Anwendungen angewiesen sind, werden in ihrer Produktivität wesentlich eingeschränkt. Um die Produktivität dieser Fachkräfte zu fördern, müssen Unternehmen sich mit den neusten Alternativen der Speicherarchitekturen befassen. Ein Teil dieser Planung werden zwangsläufig NVMe und RDMA sein.
* Die Autorin: Ines Wolf, Manager Pre-Sales Zentraleuropa bei Quantum
Aktuelles eBook
Storage für HPC & KI
eBook „Storage für HPC & KI“
(Bild: Storage-Insider)
Speichersysteme für das HPC und für die verschiedenen Disziplinen der KI sind hohen Anforderungen ausgesetzt. Denn sie müssen enorme Datenmengen in kürzester Zeit bereitstellen oder sammeln. Wie können diese Herausforderungen gemeistert werden?
Die Themen im Überblick:
Aktuelle Trends in der Künstlichen Intelligenz
High-Performance Computing – Explosion der Innovationen
Es ist für uns eine Selbstverständlichkeit, dass wir verantwortungsvoll mit Ihren personenbezogenen Daten umgehen. Sofern wir personenbezogene Daten von Ihnen erheben, verarbeiten wir diese unter Beachtung der geltenden Datenschutzvorschriften. Detaillierte Informationen finden Sie in unserer Datenschutzerklärung.
Einwilligung in die Verwendung von Daten zu Werbezwecken
Ich bin damit einverstanden, dass die Vogel IT-Medien GmbH, Max-Josef-Metzger-Straße 21, 86157 Augsburg, einschließlich aller mit ihr im Sinne der §§ 15 ff. AktG verbundenen Unternehmen (im weiteren: Vogel Communications Group) meine E-Mail-Adresse für die Zusendung von Newslettern und Werbung nutzt. Auflistungen der jeweils zugehörigen Unternehmen können hier abgerufen werden.
Der Newsletterinhalt erstreckt sich dabei auf Produkte und Dienstleistungen aller zuvor genannten Unternehmen, darunter beispielsweise Fachzeitschriften und Fachbücher, Veranstaltungen und Messen sowie veranstaltungsbezogene Produkte und Dienstleistungen, Print- und Digital-Mediaangebote und Services wie weitere (redaktionelle) Newsletter, Gewinnspiele, Lead-Kampagnen, Marktforschung im Online- und Offline-Bereich, fachspezifische Webportale und E-Learning-Angebote. Wenn auch meine persönliche Telefonnummer erhoben wurde, darf diese für die Unterbreitung von Angeboten der vorgenannten Produkte und Dienstleistungen der vorgenannten Unternehmen und Marktforschung genutzt werden.
Meine Einwilligung umfasst zudem die Verarbeitung meiner E-Mail-Adresse und Telefonnummer für den Datenabgleich zu Marketingzwecken mit ausgewählten Werbepartnern wie z.B. LinkedIN, Google und Meta. Hierfür darf die Vogel Communications Group die genannten Daten gehasht an Werbepartner übermitteln, die diese Daten dann nutzen, um feststellen zu können, ob ich ebenfalls Mitglied auf den besagten Werbepartnerportalen bin. Die Vogel Communications Group nutzt diese Funktion zu Zwecken des Retargeting (Upselling, Crossselling und Kundenbindung), der Generierung von sog. Lookalike Audiences zur Neukundengewinnung und als Ausschlussgrundlage für laufende Werbekampagnen. Weitere Informationen kann ich dem Abschnitt „Datenabgleich zu Marketingzwecken“ in der Datenschutzerklärung entnehmen.
Falls ich im Internet auf Portalen der Vogel Communications Group einschließlich deren mit ihr im Sinne der §§ 15 ff. AktG verbundenen Unternehmen geschützte Inhalte abrufe, muss ich mich mit weiteren Daten für den Zugang zu diesen Inhalten registrieren. Im Gegenzug für diesen gebührenlosen Zugang zu redaktionellen Inhalten dürfen meine Daten im Sinne dieser Einwilligung für die hier genannten Zwecke verwendet werden. Dies gilt nicht für den Datenabgleich zu Marketingzwecken.
Recht auf Widerruf
Mir ist bewusst, dass ich diese Einwilligung jederzeit für die Zukunft widerrufen kann. Durch meinen Widerruf wird die Rechtmäßigkeit der aufgrund meiner Einwilligung bis zum Widerruf erfolgten Verarbeitung nicht berührt. Um meinen Widerruf zu erklären, kann ich als eine Möglichkeit das unter https://contact.vogel.de abrufbare Kontaktformular nutzen. Sofern ich einzelne von mir abonnierte Newsletter nicht mehr erhalten möchte, kann ich darüber hinaus auch den am Ende eines Newsletters eingebundenen Abmeldelink anklicken. Weitere Informationen zu meinem Widerrufsrecht und dessen Ausübung sowie zu den Folgen meines Widerrufs finde ich in der Datenschutzerklärung.