Überblick über Vektordatenbanken

Eine Vektordatenbank ist ein spezialisiertes System, das hochdimensionale Vektoren effizient speichert und abfragt. Diese Datenbanken sind von grundlegender Bedeutung für RAG-Anwendungen (Retrieval Augmented Generation).

Vektordatenbanken handhaben die Datenkonvertierung und -speicherung auf folgende Weise:

Objekte (wie Audio-, Bild- und Textdateien) werden mithilfe von Einbettungsmodellen in Vektoren konvertiert.
Vektoren werden in speziellen Datenformaten gespeichert.
Vektordatenbanken ermöglichen schnelle Ähnlichkeitssuchen.

Vektordatenbanken bieten mehrere wichtige Vorteile gegenüber herkömmlichen Datenbanken und eignen sich daher besonders gut für moderne Datenherausforderungen. Sie sind speziell für Vektoroperationen optimiert und verarbeiten hochdimensionale Daten effizient. Sie sind auch auf Ähnlichkeitssuchen spezialisiert, mit denen herkömmliche Datenbanken zu kämpfen haben. Neben diesen Kernfunktionen sind Vektordatenbanken darauf ausgelegt, den sich wandelnden Anforderungen von ML- und generativen KI-Anwendungen gerecht zu werden. Sie zeichnen sich durch großflächige Vektorspeicher aus und nutzen verteiltes Computing, um Workloads auf mehrere Knoten zu verteilen. Dies bietet Skalierbarkeit und Leistung bei wachsenden Datenmengen.

Das folgende Diagramm zeigt eine RAG-Implementierung:

Inhalte, wie Dokumente, PDFs oder Textdateien, werden als Rohdaten zur Verarbeitung in das Einbettungsmodell eingespeist.
Das Einbettungsmodell wandelt die Rohdaten in numerische Vektoren um, die die semantische Bedeutung des Inhalts darstellen.
Die generierten Vektoreinbettungen werden in einer Vektordatenbank gespeichert, die für das Speichern und Abrufen von hochdimensionalen Vektoren optimiert ist.
Anwendungen können nun als Reaktion auf Anwendungsfälle wie semantische Suche und Inhaltsempfehlungen die Vektordatenbank abfragen.

Das Einbettungsmodell konvertiert Inhalte in Vektoreinbettungen, die in der Vektordatenbank gespeichert sind, um auf Abfragen zu antworten.

Die Auswahl einer ungeeigneten Vektordatenbank für eine RAG-Lösung kann zu erheblichen Problemen und Einschränkungen führen, darunter die folgenden:

Schlechte Abfrageleistung
Engpässe bei der Skalierbarkeit
Herausforderungen bei der Datenaufnahme
Fehlende erweiterte Funktionen wie Filterung und Rangfolge
Schwierigkeiten bei der Integration mit anderen Systemen
Bedenken hinsichtlich Beständigkeit und Dauerhaftigkeit
Gleichzeitigkeits- und Konsistenzprobleme in Umgebungen mit mehreren Benutzern
Höhere Lizenzkosten oder Bindung an einen bestimmten Anbieter
Eingeschränkte Unterstützung und Ressourcen durch die Community
Potenzielle Sicherheits- und Compliance-Risiken

Warnung JavaScript ist in Ihrem Browser nicht verfügbar oder deaktiviert.

Zur Nutzung der AWS-Dokumentation muss JavaScript aktiviert sein. Weitere Informationen finden auf den Hilfe-Seiten Ihres Browsers.

Dokumentkonventionen

Überblick über Vektoren

Vektor-Datenbankoptionen