
Bitte wählen Sie die Bereiche, die Sie exportieren möchten:

Schulung Daten für KI: Daten-Vorbereitung für RAG, Fine-Tuning und Embedding
Datenmanagement für KI-Anwendungen Schritt für Schritt
Schulungsformen
Offene Schulung
- 2 Tage
- 5 gesicherte Termine
- Köln / Online
- 1.440,00 p. P. zzgl. MwSt.
- Dritter Mitarbeitende kostenfrei
- Learning & Networking in einem. Garantierte Durchführung ab 1 Teilnehmenden.
Inhouse-/Firmenschulung
- 2 Tage - anpassbar
- Termin nach Wunsch
- In Ihrem Hause oder bei der GFU
- Preis nach Angebot
- Lernumgebung in der Cloud
- Inhalte werden auf Wunsch an die Anforderungen Ihres Teams angepasst.
Individualschulung
- 2 Tage - anpassbar
- Termin nach Wunsch
- In Ihrem Hause oder bei der GFU
- Preis nach Angebot
- Lernumgebung in der Cloud
- 1 Teilnehmender = Fokus aufs Fachliche und maximaler Raum für individuelle Fragen.
Beschreibung
Wer in 2026 produktive RAG-Anwendungen umsetzen will, braucht ein systematisches Verständnis der Daten-Vorbereitung - von der ersten PDF-Ingestion bis zur produktiven Vektor-Suche. Dieses Zwei-Tage-Seminar vermittelt die Datenmanagement-Disziplin Schritt für Schritt, mit klarem Fokus auf RAG als zentraler Architektur-Pattern und einsteigerfreundlicher Einordnung von Fine-Tuning.
Finden Sie die richtige KI Schulung aus unserem Portfolio.
Schulungsziel
Jede teilnehmende Person verlässt das Seminar mit einem strukturierten Verständnis der Daten-Anforderungen für KI-Anwendungen, der Beherrschung von Document Processing und Chunking, der Routine in der Auswahl von Embedding-Modellen (OpenAI, Mistral, BGE), der Plattform-Auswahl-Matrix für Vektordatenbanken (pgvector, Qdrant, Weaviate, Pinecone), der Praxis in RAG-Architektur, dem fundierten Verständnis von Fine-Tuning und seiner Abgrenzung zu RAG und Prompt Engineering, der Datenqualitäts- und Governance-Disziplin mit DSGVO- und EU-AI-Act-Aspekten und einer 12-Monats-Roadmap für die KI-Daten-Reife - einsetzbar als operative Grundlage für erste RAG-Anwendungen und KI-Datenpipelines.
Details
Inhalt
1. Datenanforderungen für KI-Anwendungen
- Ziele und Erwartungen der Teilnehmenden
- Klärung individueller Lernziele und Erwartungen für ein praxisnahes und relevantes Seminar
- Drei Wege zur Wissens-Anreicherung von LLMs: Prompt Engineering, RAG, Fine-Tuning.
- Entscheidungs-Matrix: wann welcher Ansatz nach Use Case, Daten-Volumen, Aktualität, Kosten.
- Daten-Typen: strukturierte Daten (Datenbanken), unstrukturierte Daten (PDFs, Word, Webseiten).
- Datenqualitäts-Dimensionen für KI: Vollständigkeit, Aktualität, Genauigkeit, Relevanz.
- Sensitivitäts-Klassifizierung: was darf in welches LLM.
- Praxis-Übung: Eigene KI-Daten-Bestandsaufnahme - fünf Datenquellen identifizieren, nach Typ, Qualität und Sensitivität bewerten, geeignete Anreicherungs-Strategie zuordnen.
- Document Ingestion: PDF-Parser, Word-Parser, HTML-Cleaning, OCR für Scans.
- Chunking-Strategien:
- Fixed-Size-Chunking als naivester Ansatz.
- Recursive Character Chunking als bevorzugte Variante.
- Document-aware Chunking mit Strukturen-Respekt (Überschriften, Absätze).
- Chunk-Grösse: 200-500 Tokens als Faustregel, mit Overlap von 10-20 Prozent.
- Metadaten pro Chunk: Quell-Dokument, Datum, Autor, Zugriffsrechte.
- Praxis-Übung: Drei reale PDF-Dokumente in zwei Chunking-Varianten verarbeiten - Fixed-Size und Recursive Character; Ergebnisse vergleichen.
- Embedding-Konzept: Texte als Vektoren in hochdimensionalen Räumen.
- Embedding-Modelle 2026:
- OpenAI text-embedding-3 als Standard-Wahl.
- Mistral Embed als europäische Alternative mit guter Multilingualität.
- BGE und E5 als Open-Source-Optionen.
- Multilingualität: was ein "deutsch-fähiges" Embedding-Modell ausmacht.
- SaaS vs. Self-hosted: Souveränitäts-Aspekte und Kosten-Vergleich.
- Praxis-Übung: Gleichen Text-Korpus mit zwei Embedding-Modellen vektorisieren, drei Such-Anfragen testen, Ergebnisse vergleichen.
- Vektordatenbank-Konzept: Speicherung und Indexierung von Vektoren mit schneller Ähnlichkeits-Suche.
- Pragmatische Optionen für DACH-Mittelstand:
- pgvector als PostgreSQL-Extension - ideal für moderate Datenvolumen mit bestehender PostgreSQL.
- Qdrant (deutsch) als performante Open-Source-Variante, EU-hostbar.
- Weaviate (niederländisch) mit integrierten Embedding-Modulen.
- Pinecone als SaaS-Option mit EU-Region.
- Hybrid-Search: Kombination von Vektor-Suche und klassischer Keyword-Suche.
- Metadata-Filtering: Vorfilterung nach Datum, Autor, Zugriffsrechten.
- Auswahl-Kriterien: Daten-Volumen, EU-Hosting, vorhandene Infrastruktur, Pricing.
- Praxis-Übung: Vektordatenbank-Auswahl-Matrix für die eigene Organisation - vier Optionen gegen fünf Kriterien bewerten, Empfehlung mit Begründung.
5. RAG-Architektur
- RAG-Konzept: Wissens-Anreicherung von LLMs durch dynamische Datenabfrage.
- RAG-Komponenten: Document Loader, Chunker, Embedder, Vektor-Speicher, Retriever, LLM für Generation.
- Quellen-Verweise in Antworten: User-Vertrauen durch Transparenz.
- Re-Ranking als Optionen für höhere Antwort-Qualität.
- 1-Million-Token-Kontextfenster-Effekt (DeepSeek V4, Gemini, Claude): wann reduziert sich RAG-Komplexität.
- Tools und Frameworks: LangChain, LlamaIndex, Haystack (deutsch).
- Praxis-Übung: RAG-Architektur für einen Beispiel-Use-Case (interner Wissens-Bot) skizzieren - Komponenten-Auswahl, Datenfluss, Compliance-Aspekte.
- Fine-Tuning-Konzept: Anpassung eines Basis-Modells durch zusätzliches Training.
- Wann Fine-Tuning sinnvoll: Stil-Anpassung, Output-Format-Konsistenz.
- Wann nicht sinnvoll: neue Faktenwissen einbringen - das macht RAG besser.
- Daten-Anforderungen: typischerweise einige hundert bis einige tausend hochwertige Beispiele.
- Plattform-Optionen: OpenAI Fine-Tuning API, Mistral Fine-Tuning, Hugging Face.
- Fine-Tuning vs. RAG vs. Prompt Engineering: Entscheidungs-Matrix.
- Praxis-Übung: Drei reale Use Cases gegen Fine-Tuning vs. RAG vs. Prompt Engineering bewerten - Kunden-Support-Bot, Domain-spezifische Code-Generierung, Compliance-Frage-Antwort-System; Empfehlung mit Begründung.
- Datenqualitäts-Probleme typisch für KI-Anwendungen: Duplikate, veraltete Versionen, widersprüchliche Aussagen, OCR-Fehler.
- Data Governance für KI: Verantwortlichkeiten, Daten-Owner, Versionierung.
- Zugriffskontrolle in RAG-Systemen: Document-Level-Permissions, User-Context im Prompt.
- DSGVO und KI-Daten: personenbezogene Daten in Embeddings, Recht auf Vergessenwerden.
- EU-AI-Act seit 2. August 2026: Transparenz-Pflichten.
- Praxis-Übung: Daten-Governance-Konzept für eine geplante KI-Anwendung skizzieren - Datenquellen, Verantwortliche, Zugriffskontrollen, DSGVO-Disziplin.
- Production-Architektur: Ingestion, Processing, Embedding, Storage, Retrieval, LLM-Call.
- Inkrementelle Updates: neue, geänderte, gelöschte Dokumente im Vektor-Index pflegen.
- Monitoring: Retrieval-Qualität, Antwort-Qualität, User-Feedback.
- KPIs für KI-Datenpipelines: Datenqualitäts-Score, Retrieval-Hit-Rate, Antwort-Akzeptanz-Rate.
- Lernpfad: Self-hosted Frontier-LLMs, Hands-on RAG, MLOps-Vertiefung.
- Praxis-Übung: 12-Monats-Roadmap für KI-Daten-Reife skizzieren - Bestandsaufnahme, Pilot-Architektur, drei Quick Wins, KPI-Set, drei Risiken mit Mitigations-Strategien.
Zielgruppe & Vorkenntnisse
- Daten-Verantwortliche und IT-Architektinnen: Die Datenpipelines für erste KI-Projekte aufbauen.
- KI-Verantwortliche im Mittelstand: Die RAG-Anwendungen pragmatisch umsetzen wollen.
- Backend-Entwicklerinnen mit KI-Interesse: Die LLM-Anwendungen mit eigenen Daten anreichern.
- Quereinsteigerinnen ins KI-Daten-Thema: Die einen strukturierten Einstieg ohne Hands-on-Programmier-Tiefe suchen.
Ihre Schulung
In Präsenz | Online |
|---|---|
| Lernmethode | |
Ausgewogene Mischung aus Theorie und Praxis | Wie auch bei unseren Präsenz-Seminaren: Ausgewogene Mischung aus Theorie und praktischen Übungen. Trainer durchgehend präsent. |
| Unterlagen | |
Seminarunterlagen oder Fachbuch zum Seminar inklusive, das man nach Rücksprache mit dem Trainer individuell auswählen kann. | Seminarunterlagen oder Fachbuch inklusive (via DHL). Das Fachbuch wählt der Trainer passend zum Seminar aus - Ihren individuellen Buch-Wunsch berücksichtigen wir auf Nachfrage gerne. |
| Arbeitsplatz | |
| PC/VMs für jeden Teilnehmenden Hochwertige und performante Hardware Große, höhenverstellbare Bildschirme Zugang zu Ihrem Firmennetz erlaubt |
|
| Lernumgebung | |
Neu aufgesetzte Systeme für jeden Kurs in Abstimmung mit dem Seminarleiter. | |
| Arbeitsmaterialien | |
DIN A4 Block, Notizblock, Kugelschreiber, USB-Stick, Textmarker, Post-its | |
| Teilnahmezertifikat | |
Nach Abschluss des Seminars erhalten Sie das Teilnahmezertifikat inkl. Inhaltsverzeichnis per E-Mail als PDF. | |
Organisation
In Präsenz | Online | |
|---|---|---|
| Teilnehmendenzahl | ||
min. 1, max. 8 Personen | ||
| Garantierte Durchführung | ||
Ab 1 Teilnehmenden* | ||
| Schulungszeiten | ||
| ||
| Ort der Schulung | ||
GFU SchulungszentrumAm Grauen Stein 27 51105 Köln-Deutz oder online im Virtual Classroom oder europaweit bei Ihnen als Inhouse-Schulung Um ein optimales Raumklima zu gewährleisten, haben wir das Schulungszentrum mit 17 hochmodernen Trotec TAC V+ Luftreinigern ausgestattet. Diese innovative Filtertechnologie (H14 zertifiziert nach DIN EN1822) sorgt dafür, dass die Raumluft mehrfach pro Stunde umgewälzt wird und Schadstoffe zu 99.995% im HEPA-Filter abgeschieden und infektiöse Aerosole abgetötet werden. Zusätzlich sind alle Räume mit CO2-Ampeln ausgestattet, um jederzeit eine hervorragende Luftqualität sicherzustellen. | ||
| Räumlichkeiten | ||
Helle und modern ausgestattete Räume mit perfekter Infrastruktur | Bequem aus dem Homeoffice von überall | |
| Preisvorteil | ||
Dritter Mitarbeitende nimmt kostenfrei teil. Eventuell anfallende Prüfungskosten für den dritten Teilnehmenden werden zusätzlich berechnet - auch bei Seminaren inkl. Prüfungsgebühr. Hinweis: Um den Erfolg der Schulung zu gewährleisten, sollte auch der dritte Teilnehmende die erwarteten Vorkenntnisse mitbringen. | ||
| All-Inclusive | ||
Gebäck, Snacks und Getränke ganztägig, Mittagessen im eigenen Restaurant, täglich 6 Menüs, auch vegetarisch | Eine Auswahl unserer Frühstücks-Snacks und Nervennahrungs-Highlights senden wir Ihnen mit den Seminarunterlagen via DHL zu. | |
| Barrierefreiheit | ||
Das GFU-Schulungszentrum (Am Grauen Stein 27) ist barrierefrei | - | |
Buchen ohne Risiko
| Rechnungsstellung |
Erst nach dem erfolgreichen Seminar. Keine Vorkasse. |
| Stornierung |
Kostenfrei bis zum Vortag des Seminars |
| Vormerken statt buchen |
Sichern Sie sich unverbindlich Ihren Seminarplatz schon vor der Buchung - auch wenn Sie selbst nicht berechtigt sind zu buchen |
Kostenfreie Services
In Präsenz | Online |
|---|---|
|
|
Buchungsmöglichkeiten
Online oder in Präsenz teilnehmen
Sie können sowohl Online als auch in Präsenz am Seminar teilnehmen. Klicken Sie bei Ihrer Buchung oder Anfrage einfach die entsprechende Option an.
Gesicherte offene Termine
| Termin | Ort | Preis | ||
|---|---|---|---|---|
| 23.09.-24.09.2026 Plätze vorhanden Köln / Online 1.440,00 | Köln / Online | 1.440,00 | Buchen Vormerken | |
| 23.11.-24.11.2026 Plätze vorhanden Köln / Online 1.440,00 | Köln / Online | 1.440,00 | Buchen Vormerken | |
| 2027 | ||||
| 08.03.-09.03.2027 Plätze vorhanden Köln / Online 1.440,00 | Köln / Online | 1.440,00 | Buchen Vormerken | |
| 10.05.-11.05.2027 Plätze vorhanden Köln / Online 1.440,00 | Köln / Online | 1.440,00 | Buchen Vormerken | |
| 12.07.-13.07.2027 Plätze vorhanden Köln / Online 1.440,00 | Köln / Online | 1.440,00 | Buchen Vormerken | |
- Lernumgebung in der Cloud
- Inhalte werden auf Wunsch an die Anforderungen Ihres Teams angepasst.
- Lernumgebung in der Cloud
- 1 Teilnehmender = Fokus aufs Fachliche und maximaler Raum für individuelle Fragen.
- Alle folgenden Schulungsformen können auch Online als Virtual Classroom durchgeführt werden.
- Eine Offene Schulung findet zu einem festgelegten Zeitpunkt im voll ausgestatteten Schulungszentrum oder Online/Remote statt. Sie treffen auf Teilnehmende anderer Unternehmen und profitieren vom direkten Wissensaustausch.
- Eine Inhouse-/Firmen-Schulung geht auf die individuellen Bedürfnisse Ihres Unternehmens ein. Sie erhalten eine kostenfreie Beratung von Ihrem Seminarleiter und können Inhalte und Dauer auf Ihren Schulungsbedarf anpassen. Inhouse-Schulungen können Europaweit durchgeführt werden.
- Bei einer Individual-Schulung erhalten Sie eine 1-zu-1 Betreuung und bestimmen Inhalt, Zeit und Lerntempo. Der Dozent passt sich Ihren Wünschen und Bedürfnissen an.
Sie können unsere Schulungen auch als Remote Schulung im Virtual Classroom anfragen.
In drei Schritten zum Online Seminar im Virtual Classroom:
- Seminar auswählen und auf "Buchen" klicken
- Wählen Sie bei "Wie möchten Sie teilnehmen?" einfach "Online" aus.
- Formular ausfüllen und über den Button "Jetzt buchen" absenden.
Unser Kundenservice meldet sich bei Ihnen mit der Buchungsbestätigung.
Unsere Online Schulungen finden im Virtual Classroom statt. Ein Virtual Classroom bündelt mehrere Werkzeuge, wie Audio-Konferenz, Text-Chat, Interaktives Whiteboard, oder Application Sharing.
Vorteile von Virtual Classroom:
- Sie erhalten 1 zu 1 die gleiche Lernumgebung, die Sie auch vor Ort bei uns vorfinden
- Die technische Vorbereitung wird von den GFU-Technikern vorgenommen
- Sie erhalten remote Zugriff auf Ihren persönlichen Schulungs-PC im GFU-Seminarraum
- Die Virtual Classroom Lösung lässt sich auch im Browser betreiben
- Die GFU-Technik leistet wie gewohnt Soforthilfe bei Problemen
- Die Schulungsunterlagen bekommen Sie via DHL zugeschickt
- Sie sparen Reisekosten und Zeit
- 23. Sep. - 24. Sep. ✓ Noch einige Plätze frei ▶ Köln + Online/Remote
- 23. Nov. - 24. Nov. ✓ Noch einige Plätze frei ▶ Köln + Online/Remote
- 08. Mär. - 09. Mär. ✓ Noch einige Plätze frei ▶ Köln + Online/Remote
- 10. Mai - 11. Mai ✓ Noch einige Plätze frei ▶ Köln + Online/Remote
- 12. Jul. - 13. Jul. ✓ Noch einige Plätze frei ▶ Köln + Online/Remote
- Auch als Inhouse-Schulung, bundesweit mit Termin nach Wunsch und individuellen Inhalten
- Buchen ohne Risiko! Kostenfreie Stornierung bis zum Vortag des Seminars
Die Seminare der GFU finden in angenehmer Atmosphäre statt und sind perfekt organisiert. Profitieren Sie von dem Rundum-Service der GFU!
Machen Sie sich keinen Kopf um die Anreise! Unser Shuttle fährt Sie. Oder Sie parken einfach auf einem extra für Sie reservierten Parkplatz.
Hotelzimmer gesucht? Wir organisieren Ihnen eins. Ihr Vorteil: Sie sparen Zeit und Geld!
Stornierung bei offenen Seminaren kostenfrei bis einen Tag vor Schulungsbeginn.
Unsere Techniker sind immer zur Stelle, egal ob online oder vor Ort.
GFU Schulungszentrum