Zum Inhalt springen

RAG

Zuletzt aktualisiert: 20.05.2026Autor: Redaktion DomainProvider.de · Lesezeit: 3 Min.

RAG (Retrieval-Augmented Generation) ist eine Technik, bei der ein grosses Sprachmodell (LLM) vor der Antwortgenerierung gezielt relevante Dokumente aus einer externen Wissensquelle abruft. Statt sich ausschliesslich auf das Wissen zu verlassen, das waehrend des Trainings eingelernt wurde, durchsucht das Modell eine Datenbank, ein Dokumentenarchiv oder ein Firmenwiki und bezieht die gefundenen Informationen in seine Antwort ein. Dadurch werden Halluzinationen reduziert, Antworten bleiben aktuell und koennen firmenspezifisches Wissen enthalten.

Wie funktioniert RAG technisch?

Der RAG-Prozess laeuft in zwei Phasen ab: Retrieval (Abruf) und Generation (Erzeugung).

  1. Indexierung: Dokumente werden in kleine Abschnitte (Chunks) zerlegt und als Vektoren in einer Vektordatenbank gespeichert. Jeder Vektor repraesentiert die inhaltliche Bedeutung eines Textabschnitts.
  2. Retrieval: Wenn eine Nutzeranfrage eingeht, wird diese ebenfalls in einen Vektor umgewandelt. Die Vektordatenbank sucht die inhaltlich aehnlichsten Dokumentenabschnitte heraus.
  3. Augmentation: Die gefundenen Abschnitte werden zusammen mit der urspruenglichen Frage als Kontext an das Sprachmodell uebergeben.
  4. Generation: Das Sprachmodell formuliert eine Antwort auf Basis der Frage und der bereitgestellten Dokumente.

Durch diese Architektur kann das Modell auf Informationen zugreifen, die nicht Teil seines Trainings waren — etwa interne Firmenrichtlinien, aktuelle Produktdaten oder branchenspezifische Dokumentation.

Warum halluzinieren Sprachmodelle ohne RAG?

Sprachmodelle generieren Text auf Basis statistischer Wahrscheinlichkeiten. Wenn das Modell eine Frage nicht sicher beantworten kann, erzeugt es trotzdem eine plausibel klingende Antwort — auch wenn diese faktisch falsch ist. Dieses Verhalten wird als Halluzination bezeichnet.

RAG reduziert Halluzinationen, indem es dem Modell konkrete Quellen liefert. Statt zu raten, kann das Modell aus realen Dokumenten zitieren. Viele RAG-Implementierungen zeigen zusaetzlich die verwendeten Quellen an, sodass Nutzer die Antwort ueberpruefen koennen.

Was unterscheidet RAG von Fine-Tuning?

RAG und Fine-Tuning sind zwei verschiedene Ansaetze, um Sprachmodelle an spezifische Anforderungen anzupassen.

Merkmal RAG Fine-Tuning
Ansatz Externe Dokumente zur Laufzeit abrufen Modell mit eigenen Daten nachtrainieren
Wissen aktualisieren Dokumente austauschen — sofort wirksam Erneutes Training erforderlich
Kosten Vektordatenbank und Embedding-Kosten GPU-Rechenzeit fuer Training
Halluzinationsrisiko Deutlich reduziert durch Quellenangaben Geringer als Basismodell, aber nicht eliminiert
Einsatzgebiet Wissensmanagement, Support, Dokumentation Stil, Ton, branchenspezifische Sprache

In der Praxis werden RAG und Fine-Tuning haeufig kombiniert: Fine-Tuning passt den Stil und die Ausdruecke des Modells an, RAG liefert aktuelle Fakten und Quellenbelege.

Welche Anwendungen hat RAG in Unternehmen?

RAG eignet sich ueberall dort, wo ein KI-System auf firmenspezifische oder sich aendernde Informationen zugreifen muss.

  • Interner Wissenszugang: Mitarbeiter stellen Fragen an einen Chatbot, der Antworten aus dem Firmenwiki, Handbuecher oder internen Richtlinien generiert.
  • Kundensupport: Support-Bots beantworten Anfragen auf Basis der aktuellen Produktdokumentation und FAQ-Datenbanken.
  • Rechtsabteilung und Compliance: Juristen durchsuchen grosse Vertragsarchive und erhalten zusammengefasste, quellenbasierte Antworten.
  • E-Commerce: Produktberater empfehlen Artikel auf Basis aktueller Lagerbestaende und Produktbeschreibungen.

Worauf sollte man bei der Einfuehrung von RAG achten?

Die Qualitaet eines RAG-Systems haengt massgeblich von der Qualitaet der Datenquellen und der Chunk-Strategie ab.

  • Datenqualitaet: Veraltete, widersprüchliche oder schlecht strukturierte Dokumente fuehren zu fehlerhaften Antworten. Eine regelmaessige Pflege der Wissensbasis ist entscheidend.
  • Chunk-Groesse: Zu kleine Abschnitte verlieren Kontext, zu grosse verwischen die Relevanz. Die optimale Groesse haengt vom Anwendungsfall ab.
  • Datenschutz: Firmeninterne Dokumente muessen in einer geschuetzten Umgebung verarbeitet werden. Cloud-basierte Loesungen erfordern eine sorgfaeltige Pruefung der Datenverarbeitung.
  • Evaluierung: RAG-Systeme sollten regelmaessig getestet werden — sowohl auf die Relevanz der abgerufenen Dokumente als auch auf die Korrektheit der generierten Antworten.

Fazit

RAG (Retrieval-Augmented Generation) verbindet die Staerken grosser Sprachmodelle mit externen Wissensquellen. Statt sich auf eingefrorenes Trainingswissen zu verlassen, greift das Modell auf aktuelle Dokumente zu und kann quellenbasierte Antworten liefern. Fuer Unternehmen ist RAG eine praktikable Moeglichkeit, KI-Systeme mit firmenspezifischem Wissen auszustatten, ohne ein eigenes Modell trainieren zu muessen.