Mobile-Menu

Zusatzinformationen für LLMs Was ist Retrieval-Augmented Generation (RAG)?

Von Dipl.-Ing. (FH) Stefan Luber 3 min Lesedauer

Retrieval-Augmented Generation ist ein Verfahren zur Verbesserung der Fähigkeiten und Leistung großer Sprachmodelle. Es verwendete neben der eigentlichen Fragestellung zusätzliche Informationen, zum Beispiel aus externen Datenquellen, als weitere Eingabedaten, um die Genauigkeit oder Aktualität der Antwort des Sprachmodells zu verbessern.

Retrieval-Augmented Generation erweitert die Möglichkeiten von LLMs durch die Bereitstellung zusätzlichen Kontextes.(Bild:  Midjourney / KI-generiert)
Retrieval-Augmented Generation erweitert die Möglichkeiten von LLMs durch die Bereitstellung zusätzlichen Kontextes.
(Bild: Midjourney / KI-generiert)

Retrieval-Augmented Generation, abgekürzt RAG, ist ein Verfahren, das im Bereich großer generativer Sprachmodelle (Large Language Models – LLMs) zum Einsatz kommt. Es ruft zusätzliche Informationen, die für die Bearbeitung der Fragestellung relevant sind, aus weiteren Informationsquellen, zum Beispiel aus dem Internet oder aus externen oder internen Datenbanken, ab und verwendet sie als weitere Eingabeinformationen und zusätzlichen Kontext für das Sprachmodell. Das verbessert die Zuverlässigkeit, Genauigkeit und Aktualität der Antworten des Modells, da es für die Bearbeitung der Anfrage neben dem im Training erlernten Wissen weitere Informationen heranziehen kann. Es wird quasi eine weitere Wissensbasis bereitgestellt, ohne dass das Modell neu trainiert oder feinabgestimmt werden muss. So erweitert RAG das Potenzial generativer KI.

Warum wird RAG eingesetzt?

Große, moderne Sprachmodelle verfügen über viele Milliarden Parameter und besitzen erstaunliche Fähigkeiten. Ihr Wissen und ihre Fähigkeiten erlernen sie größtenteils durch Training mit riesigen Datenmengen. Das Training ist langwierig und erfordert den Einsatz enormer Rechnerressourcen. Die für das Training eingesetzten Daten sind statisch und besitzen für das vorhandene Wissen einen Stichtag. Trotz riesiger Mengen an Trainingsdaten können nicht alle Fach- und Wissensgebiete abgedeckt werden.

Da das Training der Sprachmodelle aufwendig und teuer ist, kann es nicht ständig wiederholt und für aktuelle oder spezifische Informationen erneut durchgeführt werden. Das bedeutet, dass das Wissen der LLMs auf die Aktualität bezogen stagniert. Zudem handelt es sich bei dem Wissen der Modelle um viel Allgemeinwissen und deutlich weniger spezifisches Expertenwissen.

An dieser Stelle kommt Retrieval-Augmented Generation ins Spiel. Indem RAG dem Sprachmodell spezifischen, zusätzlichen Kontext bereitstellt, werden die beschriebenen Einschränkungen überwunden, und das Modell erhält domänenspezifisches, aktuelles Wissen, das es für die Beantwortung von Fragen verwenden kann. So lässt sich beispielsweise einem LLM ohne weiteres Training internes Wissen eines Unternehmens vermitteln.

Wie funktioniert Retrieval-Augmented Generation?

Die grundsätzliche Funktionsweise von RAG lässt sich vereinfacht in diesen Schritten beschreiben:

  • 1. Der RAG-Prozess erhält die Anfrage eines Anwenders an das Sprachmodell.
  • 2. Die Anfrage wird analysiert und in eine maschinenlesbare Darstellung überführt.
  • 3. In dieser Darstellung lassen sich zur Anfrage passende Informationen aus einer zuvor erstellten, ebenfalls maschinenlesbaren Wissensdatenbank suchen oder aus weiteren externen oder internen Quellen beziehen (Retrieval).
  • 4. RAG reichert die ursprüngliche Anfrage an das Sprachmodell mit den zusätzlich gefundenen Informationen und mit relevantem Kontext an (Augmentation).
  • 5. Das Sprachmodell generiert mit der ursprünglichen Anfrage und dem zusätzlich bereitgestellten Kontext eine genauere, ausführlichere oder aktuellere Antwort (Generation).
  • 6. Häufig enthalten die Antworten Verweise auf die Quellen der zusätzlich durch den RAG-Prozess bereitgestellten Informationen, was die Nachvollziehbarkeit und die Kontrollmöglichkeiten der Antworten verbessert.

Als interne oder externe Informationsquellen für RAG kommen zum Beispiel Wissensdatenbanken, Dokumentensammlungen (PDFs, Handbücher, Produktdaten) oder Internetsuchen zum Einsatz.

Was sind die Vorteile von Retrieval-Augmented Generation?

Retrieval-Augmented Generation bietet viele Vorteile und erweitert das Potenzial generativer KI. Zu den Vorteilen zählen:

  • erweitert die Fähigkeiten und das Wissen von LLMs ohne aufwendiges und teures zusätzliches Training,
  • stellt dem Sprachmodell spezifisches Wissen zur Verfügung,
  • verbindet Sprachmodelle mit aktuellen Informationsquellen und liefert Benutzern Antworten mit neuesten Informationen,
  • verbessert die generelle Antwortqualität der Modelle,
  • ermöglicht die flexible Anpassung großer Sprachmodelle an sich verändernde Anforderungen,
  • verbessert die Nachvollziehbarkeit und die Kontrollmöglichkeiten der Antworten der Sprachmodelle,
  • reduziert das Risiko von Halluzinationen,
  • verbessert das Vertrauen in die Antworten der Sprachmodelle.

Wo kommt Retrieval-Augmented Generation zum Einsatz?

Der Einsatz von RAG ist immer dann sinnvoll, wenn aktuelle Informationen oder spezifisches Fachwissen für die Beantwortung einer Anfrage an ein Sprachmodell notwendig sind. Typische Einsatzbereiche sind Chatbots, die Erweiterung der Suchfunktionen klassischer Suchmaschinen mit KI-Antworten, Kundenservice und Kundenbetreuung, wissenschaftliche Forschung, juristische Recherchen, Wissensmanagement im Unternehmen, Content-Erstellung (zum Beispiel Produktbeschreibungen), Auswertung von spezifischen Logdaten, Finanzanalysen, KI-Anwendungen im Bildungswesen und vieles mehr.

(ID:50632601)

Jetzt Newsletter abonnieren

Täglich die wichtigsten Infos zu Data-Storage und -Management

Mit Klick auf „Newsletter abonnieren“ erkläre ich mich mit der Verarbeitung und Nutzung meiner Daten gemäß Einwilligungserklärung (bitte aufklappen für Details) einverstanden und akzeptiere die Nutzungsbedingungen. Weitere Informationen finde ich in unserer Datenschutzerklärung. Die Einwilligungserklärung bezieht sich u. a. auf die Zusendung von redaktionellen Newslettern per E-Mail und auf den Datenabgleich zu Marketingzwecken mit ausgewählten Werbepartnern (z. B. LinkedIn, Google, Meta).

Aufklappen für Details zu Ihrer Einwilligung