Definition Wie profitiert KI von Retrieval-Augmented Generation?

Von Casablanca 3 min Lesedauer

Anbieter zum Thema

Retrieval-Augmented Generation, kurz „RAG“, beschreibt ein spezielles Verfahren der generativen Künstlichen Intelligenz. Die Ausgabe erfolgt dabei nicht allein auf Basis von Trainingsdaten, sondern schließt auch weiterführende externe Informationen ab ein.

Durch das Einbeziehen externer Informationsquellen im Zuge von Retrieval-Augmented Generation liefert Generative KI qualitativ hochwertigere Antworten.(Bild:  scyther5, Getty Images via Canva.com)
Durch das Einbeziehen externer Informationsquellen im Zuge von Retrieval-Augmented Generation liefert Generative KI qualitativ hochwertigere Antworten.
(Bild: scyther5, Getty Images via Canva.com)

Retrieval-Augmented Generation ist als Optimierung und Weiterentwicklung von großen, KI-gestützten Sprachmodellen (Large Language Models, LLM) zu verstehen. Ziel dessen ist, vor der Ausgabe eines Textes die eigene Wissensdatenbank selbständig zu erweitern, damit der generierte Text wiederum nicht ausschließlich auf Trainingsdaten aufbaut. Diese Trainingsdaten von entsprechend großen Sprachmodellen umfassen bereits Milliarden von Parametern und Informationen, das RAG-Prinzip baut anschließend darauf auf – und nutzt ergänzend eine besonders umfassende Wissensdatenbank, die wiederum in einer höheren Qualität der ausgegeben Informationen resultieren soll. Das LLM-Modell selbst muss dafür nicht neu trainiert werden, stattdessen ist Retrieval-Augmented Generation allen voran eine wirtschaftliche Möglichkeit, um die Qualität des Systems gezielt zu verbessern.

Der RAG-Prozess gliedert sich dafür in zwei Phasen:

  • In der ersten Phase nutzt das System automatisch die ursprünglich eingespeisten Trainingsdaten, simultan werden weitere relevante Informationen aus einer umfangreichen Datenbank bezogen. Dabei handelt es sich normalerweise um Vektordatenbanken oder vergleichbare Datensammlungen mit unstrukturierten Daten, wobei auch die Anbindung an relationale Datenbanken möglich ist. Das System kann eine Vielzahl an Informationen und Dateien verarbeiten, darunter beispielsweise publizierte Artikel, Studien oder schlicht andere Texte und Online-Content.
  • In der zweiten Phase nutzt das System all die bis dato verarbeiteten Informationen, um eine Antwort, typischerweise in Textform, bereitzustellen. Die zuvor zusätzlich einbezogenen Informationen sollen dem System helfen, eine wahrheitsgemäße und schlicht bessere Antwort zu liefern, als das bei einer ausschließlichen Nutzung von Trainingsdaten möglich wäre.

Der Einfluss von RAG auf generative KI

Das RAG-Verfahren knüpft da an, wo KI- und LLM-Systeme bekannte große Schwächen aufweisen. KI-Systeme wie ChatGPT und Co. kennen zunächst nämlich keinen Eigenzweifel: Sie verstehen es als ihr Ziel, den Nutzern eine Antwort zu geben, die idealerweise korrekt ist. Aufgrund veralteter oder unzureichender Informationen, mit denen das Sprachmodell trainiert wurde, ist das allerdings nicht immer der Fall. Gleichermaßen präsentiert die KI ihre eigene Antwort mit voller Überzeugung – und könnte dafür notfalls sogar Quellen frei erfinden.

Unter Einsatz des RAG-Verfahrens sollen also allen voran die Schwächen solcher LLM-Systeme reduziert werden. Typische Schwächen von KI-Textgeneratoren sind:

  • Ausgabe von falschen Informationen, auch wenn das System weiß, dass es gar keine Antwort hat
  • Nutzung von schlechten und/oder veralteten, oftmals auch nicht autoritative Quellen
  • Antworten ohne aktuellen Bezug
  • ungenaue Antworten, auch aufgrund eines mangelhaften Sprachstils und fehlerhafter Terminologie

In diesen Situationen beziehungsweise in einem System mit RAG-Prozess würde die KI beziehungsweise das LLM im Idealfall genauere Antworten liefern, da sie sich einem vorher definierten Wissensspeicher bedienen kann – was beispielsweise die zuvor erwähnte große Vektordatenbank sein könnte. Ebenfalls im Idealfall liefert die KI, durch die Ergänzung des zusätzlichen Wissensspeichers, dann korrekte und nicht länger fehlerhafte oder nicht mehr aktuelle Antworten.

Vorteile von Retrieval-Augmented Generation in der Praxis

Ein wirtschaftlicher Vorteil aus Unternehmenssicht liegt in der kostengünstigen Implementierung. Da die Basis der Technologie, das LLM-System, schon vorhanden ist, geht es nur noch um die gezielte Erweiterung von wertvollen Wissensspeichern. Diese einzusetzen, ist zwar ebenfalls mit Kosten verbunden, aus Sicht von großen Konzernen, Institutionen oder Milliardenunternehmen sind selbige normalerweise aber vernachlässigbar.

Durch die RAG-Prozesse ist das LLM-System zudem in der Lage, aktuelle Informationen zu verarbeiten, sofern diese in entsprechender Form in dem gewählten Wissensspeicher vorliegen. Die mitunter höhere Antwortqualität, gepaart mit der Aktualität, kann in einem gesteigerten Benutzervertrauen resultieren. Anwender können sich also, sofern das LLM RAG nutzt, eher auf dessen Antworten verlassen, als wenn RAG nicht eingesetzt werden würde. Außerdem erhalten Entwickler, sowie die diese anstellenden Institutionen und Unternehmen, mehr Kontrolle über die Antworten einer KI. Auch das ist ein Vorteil, der allen voran bei (sehr) großen Unternehmen und entsprechend kapitalstarken Institutionen ausgespielt werden kann.

Auch in Behörden und im öffentlichen Sektor kann Retrieval-Augmented Generation erhebliche Vorteile bieten. Indem große Mengen an unstrukturierten Daten aus verschiedenen Quellen genutzt werden, ermöglicht RAG die automatische Generierung personalisierter Inhalte sowie die Extraktion wertvoller Erkenntnisse. Im Kunden- und Bürgersupport verspricht das Konzept eine effizientere Beantwortung häufig gestellter Fragen sowie kontextualisierte Hilfestellungen bei der Navigation durch bestehende Informationen und Prozesse. Bei aller Leistungsfähigkeit müssen allerdings ethische Aspekte und der Datenschutz stets berücksichtigt werden.

(ID:50148770)

Jetzt Newsletter abonnieren

Wöchentlich die wichtigsten Infos zur Digitalisierung in der Verwaltung

Mit Klick auf „Newsletter abonnieren“ erkläre ich mich mit der Verarbeitung und Nutzung meiner Daten gemäß Einwilligungserklärung (bitte aufklappen für Details) einverstanden und akzeptiere die Nutzungsbedingungen. Weitere Informationen finde ich in unserer Datenschutzerklärung. Die Einwilligungserklärung bezieht sich u. a. auf die Zusendung von redaktionellen Newslettern per E-Mail und auf den Datenabgleich zu Marketingzwecken mit ausgewählten Werbepartnern (z. B. LinkedIn, Google, Meta).

Aufklappen für Details zu Ihrer Einwilligung