KI ist zu einem wichtigen Faktor für die Wettbewerbsfähigkeit von Unternehmen geworden. Mit der zunehmenden Verbreitung von GenAI-Tools auf dem Markt besteht die Möglichkeit, KI in nahezu jeder Abteilung eines Unternehmens einzusetzen, um die Effizienz zu steigern und neue Geschäftsmodelle zu entwickeln, sei es im Vertrieb, in der Produktentwicklung, im Personalwesen oder im Kundendienst.
Augen auf bei der Wahl der Speicherlösung – diese wirkt sich direkt auf die Leistung, Genauigkeit und Skalierbarkeit von RAG-Systemen aus.
(Bild: Midjourney / KI-generiert)
Jede Nutzung von GenAI steht allerdings vor zwei Problemen: Sie muss ein hohes Maß an Genauigkeit und kontextbezogenes Verständnis erreichen. Wie beim Training von KI-Modellen im Allgemeinen spielen Daten eine entscheidende Rolle bei der Lösung dieser Probleme. Nachdem KI-Modelle auf riesigen Datenmengen trainiert wurden, von denen die meisten öffentlich zugänglich sind, macht interessanterweise der vergleichsweise kleine, firmeneigene Datensatz des Unternehmens, das die KI einsetzt, den größten Unterschied bei der Verbesserung von Genauigkeit und kontextbezogenem Verständnis. Wie erfolgreich ein Unternehmen bei der Implementierung von KI-Modellen unter Verwendung seiner eigenen Daten sein wird, hängt maßgeblich von der Datenspeicherinfrastruktur im Allgemeinen und der Retrieval-Augmented Generation (RAG) im Besonderen ab.
RAG
RAG nutzt Mechanismen der externen Informationsbeschaffung, um die Fähigkeiten von KI-Modellen zu verbessern. Dieser Ansatz ermöglicht es KI-Systemen, auf zusätzliche Daten zuzugreifen und diese zu nutzen, die über ihren ursprünglichen Trainingssatz hinausgehen, was zu genaueren, aktuelleren und kontextrelevanten Antworten führt.
Bei RAG werden zunächst relevante Informationen aus zusätzlichen Quellen wie Datenbanken, Dokumenten oder dem Internet abgerufen, wenn eine Benutzeranfrage gestellt wird. Anschließend werden diese Informationen in die Eingabeaufforderung des KI-Modells integriert, sodass das Modell Antworten auf der Grundlage seines bereits vorhandenen Wissens und der neu gewonnenen Kontextdaten generieren kann.
Dieser Prozess besteht in der Regel aus vier Hauptphasen:
1. Indizierung: Referenzdaten werden über ein Einbettungsmodell in Vektoren umgewandelt und in einer entsprechenden Datenbank gespeichert.
2. Abruf: Relevante Dokumente werden auf Basis der Benutzeranfrage ausgewählt.
3. Anreicherung: Die abgerufenen Informationen werden in den Prompt des Modells aufgenommen.
4. Generierung: Das Modell erzeugt eine Ausgabe, die sowohl auf der Anfrage als auch auf dem abgerufenen Kontext basiert.
Durch die dynamische Integration relevanter Daten reduziert RAG KI-Halluzinationen erheblich, verbessert die faktische Genauigkeit und ermöglicht die Einbeziehung bereichsspezifischen Wissens, ohne dass das Modell häufig neu trainiert werden muss. Dies macht RAG besonders nützlich für Anwendungen, die aktuelle oder spezialisierte Informationen erfordern, wie Chatbots für den Kundensupport, bereichsspezifische Frage-Antwort-Systeme und Wissensmanagement-Tools für Unternehmen.
Die Rolle für Storage
Wie beschrieben, ist RAG stark auf die Fähigkeit angewiesen, große Mengen an Informationen zu speichern, zu indizieren und schnell darauf zuzugreifen, um KI-Antworten mit relevantem Kontext zu ergänzen. Die primäre Speicherkomponente in RAG-Architekturen ist in der Regel eine Vektordatenbank, die für die Speicherung und den Abruf hochdimensionaler Vektoren optimiert ist, die semantische Informationen aus Texten, Bildern oder anderen Datentypendarstellen.
Vektordatenbanken ermöglichen es RAG-Systemen, effiziente Ähnlichkeitssuchen durchzuführen und kontextuell relevante Informationen auf der Grundlage von Benutzeranfragen schnell zu identifizieren und abzurufen. Diese Datenbanken verwenden spezielle Indizierungstechniken wie Hierarchical Navigable Small World (HNSW) und Inverted File Index (IVF), um die Suche zu beschleunigen und die Genauigkeit zu erhalten.
Vektordatenbanken stellen besonders hohe Anforderungen an Speichersysteme. Bei der Auswahl einer geeigneten Speicherinfrastruktur für RAG sind daher Faktoren wie niedrige Latenzzeiten, hohe Zugriffsgeschwindigkeiten und die Fähigkeit, große Datenmengen zu verarbeiten, von entscheidender Bedeutung.
Mit der Weiterentwicklung von RAG-Systemen müssen sich die Speicherlösungen von Unternehmen an die steigenden Anforderungen der Echtzeitverarbeitung und der Generierung von Antworten mit geringer Latenz anpassen. Die hybride Multi-Cloud-Integration gewinnt zunehmend an Bedeutung, weil sie Skalierbarkeit, Leistung und die Fähigkeit zur Bewältigung dynamischer Arbeitslasten bietet. Cloud-Plattformen vereinfachen die Bereitstellung und Verwaltung der für RAG-Pipelines erforderlichen Infrastruktur und ermöglichen eine nahtlose Skalierung bei wachsenden Datenmengen.
Eine korrekt konfigurierte RAG-Workflow-Bereitstellungsarchitektur wird unabhängig davon funktionieren, ob sich die Daten in einem Rechenzentrum oder in einer hybriden Multi-Cloud befinden. Eine Cloud-Edition einer Enterprise-Storage-Lösung integriert sich nahtlos in die Cloud und vereinfacht und beschleunigt den Roll-out von RAG für Unternehmen. Dies ergänzt die Arbeit der Hyperscaler, die KI-Modelle in größerem Maßstab aufbauen und das anfängliche Training der KI-Modelle durchführen.
Stand: 08.12.2025
Es ist für uns eine Selbstverständlichkeit, dass wir verantwortungsvoll mit Ihren personenbezogenen Daten umgehen. Sofern wir personenbezogene Daten von Ihnen erheben, verarbeiten wir diese unter Beachtung der geltenden Datenschutzvorschriften. Detaillierte Informationen finden Sie in unserer Datenschutzerklärung.
Einwilligung in die Verwendung von Daten zu Werbezwecken
Ich bin damit einverstanden, dass die Vogel IT-Medien GmbH, Max-Josef-Metzger-Straße 21, 86157 Augsburg, einschließlich aller mit ihr im Sinne der §§ 15 ff. AktG verbundenen Unternehmen (im weiteren: Vogel Communications Group) meine E-Mail-Adresse für die Zusendung von Newslettern und Werbung nutzt. Auflistungen der jeweils zugehörigen Unternehmen können hier abgerufen werden.
Der Newsletterinhalt erstreckt sich dabei auf Produkte und Dienstleistungen aller zuvor genannten Unternehmen, darunter beispielsweise Fachzeitschriften und Fachbücher, Veranstaltungen und Messen sowie veranstaltungsbezogene Produkte und Dienstleistungen, Print- und Digital-Mediaangebote und Services wie weitere (redaktionelle) Newsletter, Gewinnspiele, Lead-Kampagnen, Marktforschung im Online- und Offline-Bereich, fachspezifische Webportale und E-Learning-Angebote. Wenn auch meine persönliche Telefonnummer erhoben wurde, darf diese für die Unterbreitung von Angeboten der vorgenannten Produkte und Dienstleistungen der vorgenannten Unternehmen und Marktforschung genutzt werden.
Meine Einwilligung umfasst zudem die Verarbeitung meiner E-Mail-Adresse und Telefonnummer für den Datenabgleich zu Marketingzwecken mit ausgewählten Werbepartnern wie z.B. LinkedIN, Google und Meta. Hierfür darf die Vogel Communications Group die genannten Daten gehasht an Werbepartner übermitteln, die diese Daten dann nutzen, um feststellen zu können, ob ich ebenfalls Mitglied auf den besagten Werbepartnerportalen bin. Die Vogel Communications Group nutzt diese Funktion zu Zwecken des Retargeting (Upselling, Crossselling und Kundenbindung), der Generierung von sog. Lookalike Audiences zur Neukundengewinnung und als Ausschlussgrundlage für laufende Werbekampagnen. Weitere Informationen kann ich dem Abschnitt „Datenabgleich zu Marketingzwecken“ in der Datenschutzerklärung entnehmen.
Falls ich im Internet auf Portalen der Vogel Communications Group einschließlich deren mit ihr im Sinne der §§ 15 ff. AktG verbundenen Unternehmen geschützte Inhalte abrufe, muss ich mich mit weiteren Daten für den Zugang zu diesen Inhalten registrieren. Im Gegenzug für diesen gebührenlosen Zugang zu redaktionellen Inhalten dürfen meine Daten im Sinne dieser Einwilligung für die hier genannten Zwecke verwendet werden. Dies gilt nicht für den Datenabgleich zu Marketingzwecken.
Recht auf Widerruf
Mir ist bewusst, dass ich diese Einwilligung jederzeit für die Zukunft widerrufen kann. Durch meinen Widerruf wird die Rechtmäßigkeit der aufgrund meiner Einwilligung bis zum Widerruf erfolgten Verarbeitung nicht berührt. Um meinen Widerruf zu erklären, kann ich als eine Möglichkeit das unter https://contact.vogel.de abrufbare Kontaktformular nutzen. Sofern ich einzelne von mir abonnierte Newsletter nicht mehr erhalten möchte, kann ich darüber hinaus auch den am Ende eines Newsletters eingebundenen Abmeldelink anklicken. Weitere Informationen zu meinem Widerrufsrecht und dessen Ausübung sowie zu den Folgen meines Widerrufs finde ich in der Datenschutzerklärung.
Schlussfolgerung
Insgesamt ist die Speicherlösung eine kritische Komponente von RAG-Systemen, die sich direkt auf deren Leistung, Genauigkeit und Skalierbarkeit auswirkt. Weil diese Systeme immer größere Datenmengen verarbeiten, ist die Wahl der Speicherlösung, der Indizierungsstrategien und der Datenverwaltungstechniken von entscheidender Bedeutung für die Gewährleistung einer effizienten und effektiven Retrieval-Augmented Generation und damit für die Wettbewerbsfähigkeit eines Unternehmens.
* Der Autor: James Lewis, Regional Sales Director DACH bei Infinidat
Aktuelles eBook
Speichern am Netzwerkrand: Edge-Storage
eBook „Edge-Storage“
(Bild: Storage-Insider)
Speicherkapazitäten am Netzwerkrand werden immer häufiger genutzt, denn die Zahl der Geräte, die am Edge eingesetzt werden, vervielfacht sich. Ein Edge-Storage kann dabei vielfältig verwendet werden.
Die Themen im Überblick:
Einsatzbereiche: Der Netzwerkrand ist (fast) überall
Technologien bei der Edge-Storage-Nutzung
Lösungen, Produkte und Kostenaspekte von Edge-Storage