
Bitte wählen Sie die Bereiche, die Sie exportieren möchten:

Schulung Vektordatenbanken: Grundlagen für KI-Anwendungen
Semantische Suche und Ähnlichkeitsabfragen technisch verstehen
Schulungsformen
Inhouse-/Firmenschulung
- 3 Tage - anpassbar
- Termin nach Wunsch
- In Ihrem Hause oder bei der GFU
- Preis nach Angebot
- Lernumgebung in der Cloud
- Inhalte werden auf Wunsch an die Anforderungen Ihres Teams angepasst.
Individualschulung
- 3 Tage - anpassbar
- Termin nach Wunsch
- In Ihrem Hause oder bei der GFU
- Preis nach Angebot
- Lernumgebung in der Cloud
- 1 Teilnehmender = Fokus aufs Fachliche und maximaler Raum für individuelle Fragen.
Beschreibung
Schulungsziel
Nach Abschluss verstehen die Teilnehmer die Funktionsweise von Vektordatenbanken, von der Vektorrepräsentation über Distanzmetriken und ANN-Algorithmen bis zu Indexstrukturen und Hybrid-Suche. Sie können verschiedene Datenbanklösungen bewerten, eine Vektordatenbank aufsetzen und semantische Suchanfragen implementieren sowie Auswahlkriterien für den Unternehmenseinsatz anwenden.
Details
Inhalt
- Ziele und Erwartungen der Teilnehmenden
- Klärung individueller Lernziele und Erwartungen für ein praxisnahes und relevantes Seminar
- 1. Vektordatenbanken im Kontext moderner KI-Systeme
- Verstehen, warum traditionelle relationale Datenbanken an ihre Grenzen stoßen, wenn es darum geht, unstrukturierte Daten wie Text, Bilder oder Audio semantisch zu durchsuchen und ähnliche Inhalte zu finden
- Das Konzept der Vektordatenbank als spezialisiertes Speicher- und Suchsystem kennenlernen, das für hochdimensionale Daten optimiert ist und Ähnlichkeitssuchen in Millisekunden ermöglicht
- Typische Anwendungsfälle identifizieren, darunter Retrieval Augmented Generation, semantische Suche, Empfehlungssysteme, Bildähnlichkeitssuche und Anomalieerkennung
- 2. Vektoren und Embeddings als Datengrundlage
- Verstehen, wie Embedding-Modelle unstrukturierte Daten in numerische Vektoren umwandeln, die die semantische Bedeutung in einem mehrdimensionalen Raum abbilden
- Die Beziehung zwischen Eingabedaten und deren Vektorrepräsentation nachvollziehen und verstehen, warum ähnliche Inhalte zu Vektoren führen, die im Vektorraum nahe beieinander liegen
- Verschiedene Embedding-Modelle für Text, Bilder und multimodale Inhalte überblicken und deren Dimensionalität, Speicherbedarf und Qualitätsunterschiede einordnen
- 3. Ähnlichkeitsmaße und Distanzmetriken
- Die mathematischen Grundlagen der Ähnlichkeitssuche verstehen, bei der die Distanz zwischen Vektoren als Maß für semantische Nähe dient
- Verbreitete Distanzmetriken vergleichen, darunter Kosinus-Ähnlichkeit für Richtungsvergleiche, euklidische Distanz für absolute Abstände und Skalarprodukt für normalisierte Vektoren
- Die Auswahl der passenden Metrik je nach Anwendungsfall nachvollziehen und verstehen, wie die Metrikwahl die Suchergebnisse und deren Interpretation beeinflusst
- 4. Approximate Nearest Neighbor Algorithmen
- Die Herausforderung der exakten Nächster-Nachbar-Suche in hochdimensionalen Räumen verstehen und warum diese bei großen Datenmengen rechnerisch nicht praktikabel ist
- Approximate Nearest Neighbor Algorithmen als Lösung kennenlernen, die Geschwindigkeit gegen einen kontrollierten Genauigkeitsverlust eintauschen und Suchen in Millisekunden ermöglichen
- Verbreitete ANN-Algorithmen überblicken, darunter HNSW für graphbasierte Navigation, IVF für clusterbasierte Partitionierung und Product Quantization für komprimierte Vektoren
- 5. Indexierung und Indextypen
- Die Rolle von Indizes in Vektordatenbanken verstehen, die den Suchraum strukturieren und effiziente Abfragen über Millionen oder Milliarden von Vektoren ermöglichen
- Verschiedene Indextypen und deren Eigenschaften kennenlernen, darunter flache Indizes für kleine Datenmengen, invertierte Indizes für partitionierte Suche und hierarchische Indizes für skalierbare Anwendungen
- Trade-offs zwischen Indexgröße, Aufbauzeit, Suchgeschwindigkeit und Recall-Genauigkeit nachvollziehen und Kriterien für die Indexkonfiguration ableiten
- 6. Verbreitete Vektordatenbanken im Vergleich
- Pinecone als vollständig verwaltete Cloud-Lösung kennenlernen, die Infrastrukturmanagement abnimmt und sich für Teams eignet, die sich auf die Anwendungsentwicklung konzentrieren möchten
- Open-Source-Alternativen wie Weaviate, Milvus, Qdrant und Chroma überblicken und deren Stärken hinsichtlich Hybrid-Suche, Skalierung, Performance und Entwicklerfreundlichkeit vergleichen
- Erweiterungen für bestehende Datenbanken wie pgvector für PostgreSQL einordnen und verstehen, wann eine dedizierte Vektordatenbank gegenüber einer Erweiterung vorteilhaft ist
- 7. Hybrid-Suche und Metadatenfilterung
- Das Konzept der Hybrid-Suche verstehen, die semantische Vektorsuche mit Keyword-Suche wie BM25 kombiniert, um sowohl bedeutungsbasierte als auch wortbasierte Treffer zu berücksichtigen
- Metadatenfilterung einsetzen, um Suchergebnisse nach Attributen wie Dokumenttyp, Zeitraum, Kategorie oder Zugriffsrechten einzuschränken, bevor oder während die Vektorsuche durchgeführt wird
- Anwendungsfälle identifizieren, in denen Hybrid-Suche und Filterung entscheidend sind, etwa wenn exakte Begriffe wichtig sind oder geschäftliche Einschränkungen gelten
- 8. Datenmanagement und Betriebsaspekte
- Strategien für die Datenaufnahme verstehen, darunter Batch-Indexierung für initiale Datenbestände und Echtzeit-Updates für dynamische Inhalte
- Die Aktualität der Wissensbasis sicherstellen durch geplante Reindexierung, inkrementelle Updates und Versionierung von Embeddings bei Modellwechseln
- Monitoring und Observability für Vektordatenbanken einrichten, um Latenz, Recall, Speicherverbrauch und Indexwachstum zu überwachen und Engpässe frühzeitig zu erkennen
- 9. Auswahlkriterien und Entscheidungsfindung
- Ein Bewertungsraster für die Datenbankauswahl entwickeln, das Skalierungsanforderungen, Betriebsmodell, Feature-Bedarf, Integrationsaufwand und Kostenstruktur berücksichtigt
- Die Entscheidung zwischen verwalteten Cloud-Diensten und selbst betriebenen Open-Source-Lösungen anhand von Team-Kapazitäten, Datenschutzanforderungen und Budget treffen
- Einen Migrationspfad einplanen, der mit leichtgewichtigen Lösungen für Prototypen beginnt und den Wechsel zu produktionsreifen Systemen bei wachsenden Anforderungen ermöglicht
- Praxisübung: Eine Vektordatenbank aufsetzen und semantische Suche implementieren
- Die Teilnehmer richten eine Vektordatenbank ihrer Wahl ein und implementieren eine vollständige Ähnlichkeitssuche von der Vektorerstellung bis zur Abfrage. Zunächst werden bereitgestellte Textdokumente mit einem Embedding-Modell in Vektoren umgewandelt und zusammen mit Metadaten in die Datenbank geladen. Die Teilnehmer konfigurieren einen geeigneten Index und wählen eine passende Distanzmetrik. Anschließend werden verschiedene Suchanfragen durchgeführt, bei denen die Anfrage ebenfalls vektorisiert und die ähnlichsten Dokumente abgerufen werden. Die Teilnehmer experimentieren mit unterschiedlichen Parametern wie der Anzahl der Ergebnisse und Schwellenwerten für die Mindestähnlichkeit. Optional wird Metadatenfilterung ergänzt, um Ergebnisse nach Kategorien einzuschränken. Die Ergebnisse werden hinsichtlich Relevanz und Latenz bewertet, und die Teilnehmer identifizieren Optimierungsmöglichkeiten für Indexkonfiguration und Abfrageparameter.
- Die Teilnehmer richten eine Vektordatenbank ihrer Wahl ein und implementieren eine vollständige Ähnlichkeitssuche von der Vektorerstellung bis zur Abfrage. Zunächst werden bereitgestellte Textdokumente mit einem Embedding-Modell in Vektoren umgewandelt und zusammen mit Metadaten in die Datenbank geladen. Die Teilnehmer konfigurieren einen geeigneten Index und wählen eine passende Distanzmetrik. Anschließend werden verschiedene Suchanfragen durchgeführt, bei denen die Anfrage ebenfalls vektorisiert und die ähnlichsten Dokumente abgerufen werden. Die Teilnehmer experimentieren mit unterschiedlichen Parametern wie der Anzahl der Ergebnisse und Schwellenwerten für die Mindestähnlichkeit. Optional wird Metadatenfilterung ergänzt, um Ergebnisse nach Kategorien einzuschränken. Die Ergebnisse werden hinsichtlich Relevanz und Latenz bewertet, und die Teilnehmer identifizieren Optimierungsmöglichkeiten für Indexkonfiguration und Abfrageparameter.
Zielgruppe & Vorkenntnisse
Das Seminar richtet sich an technische Fachkräfte, die KI-Anwendungen mit semantischer Suche, Empfehlungssystemen oder RAG-Architekturen entwickeln oder bewerten. Angesprochen sind Personen aus den Bereichen Softwareentwicklung, Data Engineering, Data Science und IT-Architektur, die die technischen Grundlagen von Vektordatenbanken verstehen möchten. Grundlegende Programmierkenntnisse und ein konzeptionelles Verständnis von Machine Learning und Embeddings werden vorausgesetzt.
Ihre Schulung
In Präsenz | Online |
|---|---|
| Lernmethode | |
Ausgewogene Mischung aus Theorie und Praxis | Wie auch bei unseren Präsenz-Seminaren: Ausgewogene Mischung aus Theorie und praktischen Übungen. Trainer durchgehend präsent. |
| Unterlagen | |
Seminarunterlagen oder Fachbuch inklusive. Das Fachbuch wählt der Trainer passend zum Seminar aus - Ihren individuellen Buch-Wunsch berücksichtigen wir auf Nachfrage gerne. | Seminarunterlagen oder Fachbuch inklusive (via DHL). Das Fachbuch wählt der Trainer passend zum Seminar aus - Ihren individuellen Buch-Wunsch berücksichtigen wir auf Nachfrage gerne. |
| Arbeitsplatz | |
|
|
| Lernumgebung | |
Neu aufgesetzte Remote-Systeme für jeden Kurs in Abstimmung mit dem Seminarleiter, sodass Sie über ein perfektes Setup für die Durchführung aller praktischen Übungen verfügen. | |
| Arbeitsmaterialien | |
Din A4 Block, Notizblock, Kugelschreiber, USB-Stick, Textmarker, Post-its | |
| Teilnahmezertifikat | |
Nach Abschluss des Seminars erhalten Sie das Teilnahmezertifikat inkl. Inhaltsverzeichnis per E-Mail als PDF. | |
Organisation
In Präsenz | Online | |
|---|---|---|
| Teilnehmendenzahl | ||
min. 1, max. 8 Personen | ||
| Garantierte Durchführung * | ||
Ab 1 Teilnehmenden | ||
| Schulungszeiten | ||
| ||
| Ort der Schulung | ||
GFU SchulungszentrumAm Grauen Stein 27 51105 Köln-Deutz oder online im Virtual Classroom oder europaweit bei Ihnen als Inhouse-Schulung Um ein optimales Raumklima zu gewährleisten, haben wir das Schulungszentrum mit 17 hochmodernen Trotec TAC V+ Luftreinigern ausgestattet. Diese innovative Filtertechnologie (H14 zertifiziert nach DIN EN1822) sorgt dafür, dass die Raumluft mehrfach pro Stunde umgewälzt wird und Schadstoffe zu 99.995% im HEPA-Filter abgeschieden und infektiöse Aerosole abgetötet werden. Zusätzlich sind alle Räume mit CO2-Ampeln ausgestattet, um jederzeit eine hervorragende Luftqualität sicherzustellen. | ||
| Räumlichkeiten | ||
Helle und modern ausgestattete Räume mit perfekter Infrastruktur | Bequem aus dem Homeoffice von überall | |
| All-Inclusive | ||
Frühstück, Snacks und Getränke ganztägig, Mittagessen im eigenen Restaurant, täglich 6 Menüs, auch vegetarisch | Eine Auswahl unserer Frühstücks-Snacks und Nervennahrungs-Highlights senden wir Ihnen mit den Seminarunterlagen via DHL zu. | |
| Barrierefreiheit | ||
Das GFU-Schulungszentrum (Am Grauen Stein 27) ist barrierefrei | - | |
Kostenfreie Services
In Präsenz | Online |
|---|---|
|
|
Buchungsmöglichkeiten
Online oder in Präsenz teilnehmen
Sie können sowohl Online als auch in Präsenz am Seminar teilnehmen. Klicken Sie bei Ihrer Buchung oder Anfrage einfach die entsprechende Option an.
- Lernumgebung in der Cloud
- Inhalte werden auf Wunsch an die Anforderungen Ihres Teams angepasst.
- Lernumgebung in der Cloud
- 1 Teilnehmender = Fokus aufs Fachliche und maximaler Raum für individuelle Fragen.
Was bedeutet Offene Schulung und Inhouse Schulung?
Bei einer offenen Schulung stehen Ort und Termin vorab fest. Jeder Interessent kann eine offene Schulung buchen, daher treffen Teilnehmer aus verschiedenen Unternehmen aufeinander.
Inhouse Schulungen können auf Ihren individuellen Schulungsbedarf zugeschnitten werden. Sie bestimmen den Teilnehmerkreis, Termin und Schulungsort.
Ist eine Inhouse Schulung die richtige Wahl?
Bei einer Inhouse Schulung gehen wir auf die individuellen Bedürfnisse Ihres Unternehmens ein und decken den Schulungsbedarf direkt bei Ihnen im Unternehmen ab.
Das spart Zeit und Geld und sorgt für einen schnellen Wissenstransfer Ihrer Mitarbeiter.
Wer kümmert sich um die Technik bei Inhouse Schulungen?
Eine komplette Lernumgebung in der Cloud mit Remote Zugriff ist für uns selbstverständlich. Sie müssen sich um nichts kümmern. Lediglich ein funktionierender PC oder Notebook mit Internetanschluss sollte für jeden Teilnehmer am Schulungstag bereit stehen.
Vorteile einer Inhouse Schulung
- Kompetente Seminarberatung
- Dozenten aus der Praxis
- Auf Ihre Bedürfnisse zugeschnittener individueller Lernstoff
- Sie können den Termin flexibel gestalten, so wie es für Sie am besten passt
- Unsere Inhouse Schulungen können Europaweit durchgeführt werden
- Der Fokus liegt auf Ihrem Schulungsbedarf, somit schonen Sie Ihr Budget
- Wissenslücken Ihrer Mitarbeitet werden schnell geschlossen
GFU Schulungszentrum