View a markdown version of this page

Überblick über Vektordatenbanken - AWS Präskriptive Leitlinien

Die vorliegende Übersetzung wurde maschinell erstellt. Im Falle eines Konflikts oder eines Widerspruchs zwischen dieser übersetzten Fassung und der englischen Fassung (einschließlich infolge von Verzögerungen bei der Übersetzung) ist die englische Fassung maßgeblich.

Überblick über Vektordatenbanken

Eine Vektordatenbank ist ein spezialisiertes System, das hochdimensionale Vektoren effizient speichert und abfragt. Diese Datenbanken sind von grundlegender Bedeutung für RAG-Anwendungen (Retrieval Augmented Generation).

Vektordatenbanken handhaben die Datenkonvertierung und -speicherung auf folgende Weise:

  • Objekte (wie Audio-, Bild- und Textdateien) werden mithilfe von Einbettungsmodellen in Vektoren konvertiert.

  • Vektoren werden in speziellen Datenformaten gespeichert.

  • Vektordatenbanken ermöglichen schnelle Ähnlichkeitssuchen.

Vektordatenbanken bieten mehrere wichtige Vorteile gegenüber herkömmlichen Datenbanken und eignen sich daher besonders gut für moderne Datenherausforderungen. Sie sind speziell für Vektoroperationen optimiert und verarbeiten hochdimensionale Daten effizient. Sie sind auch auf Ähnlichkeitssuchen spezialisiert, mit denen herkömmliche Datenbanken zu kämpfen haben. Neben diesen Kernfunktionen sind Vektordatenbanken darauf ausgelegt, den sich wandelnden Anforderungen von ML- und generativen KI-Anwendungen gerecht zu werden. Sie zeichnen sich durch großflächige Vektorspeicher aus und nutzen verteiltes Computing, um Workloads auf mehrere Knoten zu verteilen. Dies bietet Skalierbarkeit und Leistung bei wachsenden Datenmengen.

Das folgende Diagramm zeigt eine RAG-Implementierung:

  1. Inhalte, wie Dokumente oder Textdateien PDFs, werden als Rohdaten zur Verarbeitung in das Einbettungsmodell eingespeist.

  2. Das Einbettungsmodell wandelt die Rohdaten in numerische Vektoren um, die die semantische Bedeutung des Inhalts darstellen.

  3. Die generierten Vektoreinbettungen werden in einer Vektordatenbank gespeichert, die für das Speichern und Abrufen von hochdimensionalen Vektoren optimiert ist.

  4. Anwendungen können nun als Reaktion auf Anwendungsfälle wie semantische Suche und Inhaltsempfehlungen die Vektordatenbank abfragen.

Das Einbettungsmodell konvertiert Inhalte in Vektoreinbettungen, die in der Vektordatenbank gespeichert sind, um auf Abfragen zu antworten.

Die Auswahl einer ungeeigneten Vektordatenbank für eine RAG-Lösung kann zu erheblichen Problemen und Einschränkungen führen, darunter die folgenden:

  • Schlechte Abfrageleistung

  • Engpässe bei der Skalierbarkeit

  • Herausforderungen bei der Datenaufnahme

  • Fehlende erweiterte Funktionen wie Filterung und Rangfolge

  • Schwierigkeiten bei der Integration mit anderen Systemen

  • Bedenken hinsichtlich Beständigkeit und Dauerhaftigkeit

  • Gleichzeitigkeits- und Konsistenzprobleme in Umgebungen mit mehreren Benutzern

  • Höhere Lizenzkosten oder Bindung an einen bestimmten Anbieter

  • Eingeschränkte Unterstützung und Ressourcen durch die Community

  • Potenzielle Sicherheits- und Compliance-Risiken