settings
OTEX_BIG
Süddeutsche Zeitung Institut Auszeichnung
 Image
Alle Weitere Themen Schulungen

Schulung RAG-Anwendungen: Einführung in Retrieval Augmented Generation

Sprachmodelle mit unternehmenseigenen Datenquellen verbinden und fundierte Antworten generieren

5 Tage / S6225
Neues Seminar
Per E-Mail senden

Schulungsformen

Offene Schulung


  • Dritter Mitarbeitende kostenfrei
  • Learning & Networking in einem. Garantierte Durchführung ab 1 Teilnehmenden.
Präsenz Online

Inhouse-/Firmenschulung

  • 5 Tage - anpassbar
  • Termin nach Wunsch
  • In Ihrem Hause oder bei der GFU
  • Preis nach Angebot

  • Lernumgebung in der Cloud
  • Inhalte werden auf Wunsch an die Anforderungen Ihres Teams angepasst.
Präsenz Online Hybrid

Individualschulung

  • 5 Tage - anpassbar
  • Termin nach Wunsch
  • In Ihrem Hause oder bei der GFU
  • Preis nach Angebot

  • Lernumgebung in der Cloud
  • 1 Teilnehmender = Fokus aufs Fachliche und maximaler Raum für individuelle Fragen.
Präsenz Online Hybrid

Beschreibung

Dieses Seminar vermittelt die Konzepte, Komponenten und den Aufbau von RAG-Systemen, die Large Language Models mit unternehmenseigenen Wissensbasen verbinden. Die Teilnehmer lernen den vollständigen Ablauf von der Dokumentenvorbereitung über Embeddings und Vektordatenbanken bis zur Antwortgenerierung mit Quellenverankerung. Unternehmen profitieren davon, dass KI-gestützte Anwendungen auf interne, aktuelle und vertrauliche Daten zugreifen können, ohne teure Modell-Trainings durchzuführen. RAG reduziert Halluzinationen, ermöglicht nachvollziehbare Antworten mit Quellenangaben und erschließt unstrukturierte Unternehmensdaten für Chatbots, Wissensmanagement und intelligente Suchsysteme.

Schulungsziel

Nach Abschluss verstehen die Teilnehmer die Architektur und Funktionsweise von RAG-Systemen und können die einzelnen Komponenten von der Dokumentenaufbereitung über Embeddings und Vektordatenbanken bis zur Prompt-Augmentierung und Generierung einordnen. Sie sind in der Lage, eine grundlegende RAG-Pipeline aufzubauen, Retrievalqualität zu bewerten und Ansatzpunkte für die Optimierung zu identifizieren.

Details

Inhalt

  • Ziele und Erwartungen der Teilnehmenden
    • Klärung individueller Lernziele und Erwartungen für ein praxisnahes und relevantes Seminar
  • 1. Grundlagen und Motivation für RAG-Systeme
    • Verstehen, warum Large Language Models trotz ihrer Leistungsfähigkeit an Grenzen stoßen, wenn sie nur auf statischen Trainingsdaten basieren und keinen Zugriff auf aktuelle, domänenspezifische oder vertrauliche Informationen haben
    • Das RAG-Konzept als Architekturmuster kennenlernen, das Informationsabruf mit generativer KI kombiniert, um Antworten auf externe Wissensbasen zu stützen statt ausschließlich auf das im Modell gespeicherte Wissen
    • Typische Problemstellungen identifizieren, die RAG adressiert, darunter veraltete Informationen, Halluzinationen, fehlende Quellenangaben und mangelnde Anpassung an unternehmensspezifische Kontexte
  • 2. Die RAG-Architektur im Überblick
    • Den vierstufigen Ablauf eines RAG-Systems nachvollziehen: Indexierung der Wissensbasis, Abruf relevanter Dokumente, Augmentierung des Prompts mit Kontext und Generierung der Antwort durch das Sprachmodell
    • Die Kernkomponenten verstehen, darunter Embedding-Modelle für die Vektorisierung, Vektordatenbanken für die Speicherung und Suche, Retriever für den Dokumentenabruf und das LLM für die Antwortgenerierung
    • Das Zusammenspiel der Komponenten in einer Pipeline nachvollziehen und verstehen, wie Orchestrierungs-Frameworks wie LangChain oder LlamaIndex die einzelnen Schritte koordinieren
  • 3. Dokumentenvorbereitung und Chunking-Strategien
    • Die Notwendigkeit des Chunkings verstehen, bei dem Dokumente in kleinere Einheiten zerlegt werden, um sie innerhalb des Kontextfensters des LLM verarbeiten zu können und präzise Abrufergebnisse zu erzielen
    • Verschiedene Chunking-Strategien kennenlernen, darunter feste Zeichenanzahl, Satzgrenzen, semantische Absätze und überlappende Chunks, sowie deren Auswirkungen auf Retrievalqualität und Antwortgenauigkeit
    • Metadaten zu Chunks hinzufügen, um Quellenzuordnung, Filterung nach Dokumenttyp oder Zeitraum und die spätere Referenzierung in Antworten zu ermöglichen
  • 4. Embeddings und Vektorrepräsentationen
    • Verstehen, wie Embedding-Modelle Text in numerische Vektoren umwandeln, die die semantische Bedeutung des Inhalts in einem mehrdimensionalen Raum abbilden
    • Verschiedene Embedding-Modelle vergleichen, darunter Sentence Transformers, OpenAI Embeddings und spezialisierte Modelle für bestimmte Sprachen oder Domänen, und deren Einfluss auf die Retrievalqualität einschätzen
    • Die Beziehung zwischen Embedding-Dimension, Speicherbedarf und Suchgeschwindigkeit nachvollziehen und Kriterien für die Modellauswahl im Unternehmenskontext ableiten
  • 5. Vektordatenbanken für die Wissensspeicherung
    • Die Rolle von Vektordatenbanken als spezialisierte Speicher- und Suchsysteme verstehen, die effiziente Ähnlichkeitssuchen über Millionen von Vektoren ermöglichen
    • Verbreitete Vektordatenbanken wie Pinecone, Weaviate, Chroma, Milvus und Qdrant überblicken und deren Funktionsumfang hinsichtlich Skalierung, Metadatenfilterung und Hybrid-Suche vergleichen
    • Die Indexierung von Dokumenten in einer Vektordatenbank praktisch nachvollziehen, von der Vektorerstellung über das Hochladen bis zur Konfiguration von Indizes und Ähnlichkeitsmetriken
  • 6. Retrieval-Methoden und Suchstrategien
    • Semantische Suche verstehen, bei der die Benutzeranfrage ebenfalls vektorisiert und mit den gespeicherten Vektoren verglichen wird, um die relevantesten Dokumente anhand von Kosinus-Ähnlichkeit oder anderen Metriken zu finden
    • Hybrid-Suche kennenlernen, die semantische Vektorsuche mit Keyword-Suche wie BM25 kombiniert, um sowohl bedeutungsbasierte als auch wortbasierte Treffer zu berücksichtigen und die Retrievalqualität zu verbessern
    • Fortgeschrittene Retrieval-Techniken überblicken, darunter Query-Rewriting zur Verbesserung der Suchanfrage, Hypothetical Document Embeddings und Multi-Hop-Retrieval für komplexe Fragestellungen
  • 7. Reranking und Kontextoptimierung
    • Die Notwendigkeit des Rerankings verstehen, bei dem die initialen Suchergebnisse durch ein spezialisiertes Modell neu bewertet werden, um die Relevanz für die konkrete Fragestellung zu verbessern
    • Cross-Encoder und andere Reranking-Modelle kennenlernen, die Anfrage und Dokument gemeinsam betrachten und präzisere Relevanzscores liefern als rein vektorbasierte Ähnlichkeitsmaße
    • Kontextoptimierung anwenden, indem die Anzahl der übergebenen Chunks begrenzt, redundante Informationen entfernt und die relevantesten Passagen priorisiert werden, um das Kontextfenster des LLM effizient zu nutzen
  • 8. Prompt-Augmentierung und Generierung
    • Verstehen, wie der augmentierte Prompt aus der ursprünglichen Benutzeranfrage und dem abgerufenen Kontext zusammengesetzt wird und welche Prompt-Engineering-Techniken die Antwortqualität beeinflussen
    • System-Prompts für RAG-Anwendungen gestalten, die das LLM anweisen, Antworten auf den bereitgestellten Kontext zu stützen, bei fehlendem Wissen dies transparent zu kommunizieren und Quellen zu referenzieren
    • Die Auswahl des generativen Modells für RAG-Anwendungen diskutieren und Kriterien wie Kontextfenstergröße, Instruktionsbefolgung, Halluzinationsneigung und Kosten in die Entscheidung einbeziehen
  • 9. Evaluierung und Qualitätssicherung
    • Ground-Truth-Datensätze für die RAG-Evaluierung aufbauen, die erwartete Frage-Antwort-Paare enthalten und als Referenz für die Bewertung der Systemleistung dienen
    • Retrieval-Metriken wie Precision, Recall und Mean Reciprocal Rank anwenden, um zu messen, wie gut das System relevante Dokumente findet, bevor die Generierung beginnt
    • Generierungsqualität bewerten, indem Antworten auf Faktentreue, Vollständigkeit, Quellenverankerung und Halluzinationen geprüft werden, und automatisierte Evaluierungsframeworks kennenlernen
  • 10. Produktionsüberlegungen und Betrieb
    • Die Herausforderungen des RAG-Betriebs einordnen, darunter Datenaktualität, kontinuierliche Indexaktualisierung, Latenz-Optimierung und Kostenmanagement bei API-basierten Modellen
    • Monitoring und Observability für RAG-Systeme einrichten, um Abrufqualität, Generierungsleistung, Fehlerraten und Benutzerinteraktionen zu überwachen und Verbesserungspotenziale zu identifizieren
    • Sicherheits- und Datenschutzaspekte berücksichtigen, darunter den Umgang mit vertraulichen Daten in der Wissensbasis, die Filterung sensibler Informationen und die Kontrolle von Zugriffsrechten auf verschiedene Dokumentenbereiche
  • Praxisübung: Eine RAG-Pipeline von der Indexierung bis zur Antwortgenerierung aufbauen
    • Die Teilnehmer entwickeln eine vollständige RAG-Anwendung, die Unternehmensdokumente als Wissensbasis nutzt und Fragen dazu beantwortet. Zunächst werden bereitgestellte Dokumente in geeignete Chunks zerlegt und mit Metadaten versehen. Die Chunks werden mit einem Embedding-Modell vektorisiert und in eine Vektordatenbank geladen. Die Teilnehmer implementieren die Retrieval-Logik, die Benutzeranfragen vektorisiert und die relevantesten Chunks abruft. Optional wird ein Reranking-Schritt ergänzt, um die Ergebnisse zu verfeinern. Anschließend wird der augmentierte Prompt zusammengestellt und an ein LLM übergeben, das eine kontextbasierte Antwort generiert. Die Teilnehmer testen verschiedene Anfragen, prüfen die Quellenverankerung der Antworten und identifizieren Fälle, in denen das System keine ausreichenden Informationen findet. Abschließend werden Evaluierungsmetriken erhoben und Verbesserungsmöglichkeiten für Chunking, Retrieval und Prompt-Gestaltung diskutiert.

Das Seminar richtet sich an technische Fachkräfte, die KI-Anwendungen konzipieren, entwickeln oder bewerten und verstehen möchten, wie Sprachmodelle mit Unternehmensdaten verbunden werden. Angesprochen sind Personen aus den Bereichen Softwareentwicklung, Data Engineering, Data Science und IT-Architektur sowie technisch orientierte Projektverantwortliche. Grundlegende Programmierkenntnisse in Python und ein konzeptionelles Verständnis von Machine Learning und Large Language Models werden vorausgesetzt.


In Präsenz

Online
Lernmethode

Ausgewogene Mischung aus Theorie und Praxis

Wie auch bei unseren Präsenz-Seminaren: Ausgewogene Mischung aus Theorie und praktischen Übungen. Trainer durchgehend präsent.

Unterlagen

Seminarunterlagen oder Fachbuch zum Seminar inklusive, das man nach Rücksprache mit dem Trainer individuell auswählen kann.

Seminarunterlagen oder Fachbuch inklusive (via DHL). Das Fachbuch wählt der Trainer passend zum Seminar aus - Ihren individuellen Buch-Wunsch berücksichtigen wir auf Nachfrage gerne.

Arbeitsplatz
PC/VMs für jeden Teilnehmenden
Hochwertige und performante Hardware
Große, höhenverstellbare Bildschirme
Zugang zu Ihrem Firmennetz erlaubt
  • Online Meeting + Remote Zugriff auf persönlichen GFU-Schulungs-PC
  • Keine Installation auf dem eigenen PC notwendig
Lernumgebung

Neu aufgesetzte Systeme für jeden Kurs in Abstimmung mit dem Seminarleiter.

Arbeitsmaterialien

DIN A4 Block, Notizblock, Kugelschreiber, USB-Stick, Textmarker, Post-its

Teilnahmezertifikat

Nach Abschluss des Seminars erhalten Sie das Teilnahmezertifikat inkl. Inhaltsverzeichnis per E-Mail als PDF.


In Präsenz

Online
Teilnehmendenzahl

min. 1, max. 8 Personen

Garantierte Durchführung

Ab 1 Teilnehmenden*

Schulungszeiten
5 Tage, 09:00 - 16:00 Uhr
Ort der Schulung
GFU Schulungszentrum oder Virtual Classroom
GFU Schulungszentrum
Am Grauen Stein 27
51105 Köln-Deutz

oder online im Virtual Classroom oder europaweit bei Ihnen als Inhouse-Schulung

Um ein optimales Raumklima zu gewährleisten, haben wir das Schulungszentrum mit 17 hochmodernen Trotec TAC V+ Luftreinigern ausgestattet. Diese innovative Filtertechnologie (H14 zertifiziert nach DIN EN1822) sorgt dafür, dass die Raumluft mehrfach pro Stunde umgewälzt wird und Schadstoffe zu 99.995% im HEPA-Filter abgeschieden und infektiöse Aerosole abgetötet werden.

Zusätzlich sind alle Räume mit CO2-Ampeln ausgestattet, um jederzeit eine hervorragende Luftqualität sicherzustellen.

Räumlichkeiten

Helle und modern ausgestattete Räume mit perfekter Infrastruktur

Bequem aus dem Homeoffice von überall

Preisvorteil

Dritter Mitarbeitende nimmt kostenfrei teil.
(Nicht mit anderen Rabatten kombinierbar.)

Eventuell anfallende Prüfungskosten für den dritten Teilnehmenden werden zusätzlich berechnet.

Hinweis: Um den Erfolg der Schulung zu gewährleisten, sollte auch der dritte Teilnehmende die erwarteten Vorkenntnisse mitbringen.

KOMPASS — Förderung für Solo-Selbstständige

Solo-Selbstständige können für dieses Seminar eine Förderung via KOMPASS beantragen.

Ausführliche Informationen dazu finden Sie hier.

All-Inclusive

Gebäck, Snacks und Getränke ganztägig, Mittagessen im eigenen Restaurant, täglich 6 Menüs, auch vegetarisch

Eine Auswahl unserer Frühstücks-Snacks und Nervennahrungs-Highlights senden wir Ihnen mit den Seminarunterlagen via DHL zu.

Barrierefreiheit

Das GFU-Schulungszentrum (Am Grauen Stein 27) ist barrierefrei

-
Rechnungsstellung

Erst nach dem erfolgreichen Seminar. Keine Vorkasse.

Stornierung

Kostenfrei bis zum Vortag des Seminars

Vormerken statt buchen

Sichern Sie sich unverbindlich Ihren Seminarplatz schon vor der Buchung - auch wenn Sie selbst nicht berechtigt sind zu buchen


In Präsenz

Online
  • Eigener Shuttle-Service
  • Reservierte Parkplätze
  • Hotelreservierung
  • Technik-Sofort-Support

Buchungsmöglichkeiten

Online oder in Präsenz teilnehmen

Sie können sowohl Online als auch in Präsenz am Seminar teilnehmen. Klicken Sie bei Ihrer Buchung oder Anfrage einfach die entsprechende Option an.

Weiterbildung RAG-Anwendungen: Einführung in Retrieval Augmented Generation

TerminOrtPreis
08.06.-12.06.2026
Plätze vorhanden
Köln / Online 3.250,00
Köln / Online 3.250,00 Buchen Vormerken
10.08.-14.08.2026
Plätze vorhanden
Köln / Online 3.250,00
Köln / Online 3.250,00 Buchen Vormerken
12.10.-16.10.2026
Plätze vorhanden
Köln / Online 3.250,00
Köln / Online 3.250,00 Buchen Vormerken
14.12.-18.12.2026
Plätze vorhanden
Köln / Online 3.250,00
Köln / Online 3.250,00 Buchen Vormerken
2027
15.02.-19.02.2027
Plätze vorhanden
Köln / Online 3.250,00
Köln / Online 3.250,00 Buchen Vormerken
  • Buchen ohne Risiko
  • Keine Vorkasse
  • Kostenfreies Storno bis zum Vortag des Seminars
  • Rechnung nach erfolgreichem Seminar
  • All-Inclusive-Preis
  • Garantierter Termin und Veranstaltungsort
  • Preise pro Person zzgl. Mehrwertsteuer
  • Dritter Mitarbeitende kostenfrei (Nicht mit anderen Rabatten kombinierbar.)
Inhouse-/Firmenschulung
  • Lernumgebung in der Cloud
  • Inhalte werden auf Wunsch an die Anforderungen Ihres Teams angepasst.
Präsenz Online Hybrid
Individualschulung
  • Lernumgebung in der Cloud
  • 1 Teilnehmender = Fokus aufs Fachliche und maximaler Raum für individuelle Fragen.
Präsenz Online Hybrid
Nachbetreuung

Unterstützung nach der Schulung durch
individuelle Nachbetreuung

Details & Anfrage

So haben GFU-Kunden gestimmt

Zu diesem Seminar wurden noch keine Bewertungen abgegeben.

FAQ für Offene Schulungen
  • Alle folgenden Schulungsformen können auch Online als Virtual Classroom durchgeführt werden.
  • Eine Offene Schulung findet zu einem festgelegten Zeitpunkt im voll ausgestatteten Schulungszentrum oder Online/Remote statt. Sie treffen auf Teilnehmende anderer Unternehmen und profitieren vom direkten Wissensaustausch.
  • Eine Inhouse-/Firmen-Schulung geht auf die individuellen Bedürfnisse Ihres Unternehmens ein. Sie erhalten eine kostenfreie Beratung von Ihrem Seminarleiter und können Inhalte und Dauer auf Ihren Schulungsbedarf anpassen. Inhouse-Schulungen können Europaweit durchgeführt werden.
  • Bei einer Individual-Schulung erhalten Sie eine 1-zu-1 Betreuung und bestimmen Inhalt, Zeit und Lerntempo. Der Dozent passt sich Ihren Wünschen und Bedürfnissen an.

Sie können unsere Schulungen auch als Remote Schulung im Virtual Classroom anfragen.

In drei Schritten zum Online Seminar im Virtual Classroom:

  1. Seminar auswählen und auf "Buchen" klicken
  2. Wählen Sie bei "Wie möchten Sie teilnehmen?" einfach "Online" aus.
  3. Formular ausfüllen und über den Button "Jetzt buchen" absenden.

Unser Kundenservice meldet sich bei Ihnen mit der Buchungsbestätigung.

Unsere Online Schulungen finden im Virtual Classroom statt. Ein Virtual Classroom bündelt mehrere Werkzeuge, wie Audio-Konferenz, Text-Chat, Interaktives Whiteboard, oder Application Sharing.

Vorteile von Virtual Classroom:

  • Sie erhalten 1 zu 1 die gleiche Lernumgebung, die Sie auch vor Ort bei uns vorfinden
  • Die technische Vorbereitung wird von den GFU-Technikern vorgenommen
  • Sie erhalten remote Zugriff auf Ihren persönlichen Schulungs-PC im GFU-Seminarraum
  • Die Virtual Classroom Lösung lässt sich auch im Browser betreiben
  • Die GFU-Technik leistet wie gewohnt Soforthilfe bei Problemen
  • Die Schulungsunterlagen bekommen Sie via DHL zugeschickt
  • Sie sparen Reisekosten und Zeit
  • 08. Jun. - 12. Jun. ✓ Noch einige Plätze frei ▶ Köln + Online/Remote
  • 10. Aug. - 14. Aug. ✓ Noch einige Plätze frei ▶ Köln + Online/Remote
  • 12. Okt. - 16. Okt. ✓ Noch einige Plätze frei ▶ Köln + Online/Remote
  • 14. Dez. - 18. Dez. ✓ Noch einige Plätze frei ▶ Köln + Online/Remote
  • 15. Feb. - 19. Feb. ✓ Noch einige Plätze frei ▶ Köln + Online/Remote
  • Auch als Inhouse-Schulung, bundesweit mit Termin nach Wunsch und individuellen Inhalten
  • Buchen ohne Risiko! Kostenfreie Stornierung bis zum Vortag des Seminars
Das GFU-Sorglos-Paket

Die Seminare der GFU finden in angenehmer Atmosphäre statt und sind perfekt organisiert. Profitieren Sie von dem Rundum-Service der GFU!

Shuttle-Service

Machen Sie sich keinen Kopf um die Anreise! Unser Shuttle fährt Sie. Oder Sie parken einfach auf einem extra für Sie reservierten Parkplatz.

Hotelreservierung

Hotelzimmer gesucht? Wir organisieren Ihnen eins. Ihr Vorteil: Sie sparen Zeit und Geld!

Kostenfreies Storno

Stornierung bei offenen Seminaren kostenfrei bis einen Tag vor Schulungsbeginn.

Technik-Support

Unsere Techniker sind immer zur Stelle, egal ob online oder vor Ort.

aegallianzaxaElement 1deutsche-bankdeutsche-postlufthansamercedessonyzdf