Individuelle Vektordatenbankoptionen Option „Verwalteter Service“Auswahl der richtigen Vektordatenbank

Vektor-Datenbankoptionen

AWS bietet eine breite Palette von Vektordatenbanklösungen zur Unterstützung verschiedener Anwendungsfälle und Anforderungen in generativen KI-Anwendungen. Diese Optionen lassen sich grob in einzelne Datenbankdienste und Managed-Services-Angebote unterteilen, die jeweils unterschiedliche Merkmale und Vorteile aufweisen. Das Verständnis dieser Optionen ist für Unternehmen von entscheidender Bedeutung, die Vektorsuchfunktionen effektiv implementieren und gleichzeitig optimale Leistung, Skalierbarkeit und Kosteneffizienz gewährleisten möchten.

Weitere Informationen zu Vektordatenbanklösungen finden Sie in den folgenden Abschnitten:

Individuelle Vektordatenbankoptionen
Option für verwalteten Dienst
Auswahl der richtigen Vektordatenbank

Individuelle Vektordatenbankoptionen

Zu den einzelnen Vektordatenbankoptionen AWS gehören Amazon Kendra, Amazon OpenSearch Service, Amazon RDS for PostgreSQL mit pgvector, Amazon MemoryDB, Amazon DocumentDB , Amazon Neptune Analytics und Amazon S3 Vector. (Als Open-Source-Erweiterung bietet pgvector die Möglichkeit, ML-generierte Vektoreinbettungen zu speichern und zu durchsuchen.) Diese Lösungen bieten unterschiedliche Ansätze für die Vektorsuche, sodass Unternehmen auf der Grundlage ihrer vorhandenen Infrastruktur, ihrer technischen Anforderungen und ihrer spezifischen Anwendungsfälle eine Auswahl treffen können.

Amazon Kendra

Amazon Kendra ist ein intelligenter Suchdienst für Unternehmen, der natürliche Sprachverarbeitung und fortschrittliche Algorithmen für maschinelles Lernen verwendet, um spezifische Antworten auf Suchfragen aus Ihren Daten zurückzugeben. Amazon Kendra vereinfacht die Implementierung von Suchfunktionen und ist damit eine effektive Backend-Lösung für generative KI-Anwendungen.

Zu den weiteren wichtigen Funktionen von Amazon Kendra gehören:

Native Verbindungen zu über 40 Datenquellen
Integrierte Funktionen zur Datenaufbereitung
Schnelle Einrichtung, für die kein tiefes technisches Fachwissen erforderlich ist

Zu den Vorteilen von Amazon Kendra gehören:

Automatisierte Datenverarbeitung (Chunking, Ingestion, Abruf)
Leistungsstarke Anpassungsoptionen:
Einfacher programmatischer Zugriff über AWS SDK für Python (Boto3)

Weitere Informationen finden Sie unter Vorteile von Amazon Kendra in der Amazon Kendra Kendra-Dokumentation.

OpenSearch Amazon-Dienst

Amazon OpenSearch Service ist ein verwalteter Service, der Sie bei der Bereitstellung, dem Betrieb und der Skalierung von OpenSearch Service-Clustern in der unterstützt AWS Cloud.

Zu den Kernfunktionen von OpenSearch Service gehören die folgenden:

Open-Source-Such- und Analyse-Engine
Verteilte Architektur
Datenverarbeitung in Echtzeit

Zu den Vorteilen der Nutzung des OpenSearch Dienstes gehören die folgenden:

Horizontale Skalierbarkeit
RESTful API-Unterstützung
Verarbeitet strukturierte und unstrukturierte Daten
Datenanalyse in Echtzeit
Geeignet für verschiedene Einsatzgrößen

Weitere Informationen finden Sie unter Funktionen von Amazon OpenSearch Service in der OpenSearch Servicedokumentation.

Amazon RDS for PostgreSQL mit pgvector

Amazon RDS for PostgreSQL mit pgvector kombiniert den AWS verwalteten relationalen Datenbankservice mit der Vektorverarbeitungserweiterung von PostgreSQL. Diese Kombination ermöglicht es Unternehmen, hochdimensionale Vektoren zu speichern und abzufragen und gleichzeitig Amazon RDS beizubehalten. Die Lösung eignet sich besonders für generative KI-Anwendungen, die Vektoroperationen in Echtzeit erfordern, ohne den Aufwand für die Verwaltung der Datenbankinfrastruktur.

Zu den wichtigsten Vorteilen von Amazon RDS for PostgreSQL mit pgvector gehören:

Hohe Verfügbarkeit
Automatisches Failover
Kostengünstig () pay-per-use
Integrierte Überwachung
Integration von Vektordaten in Echtzeit

Weitere Informationen finden Sie unter Vorteile von Amazon RDS in der Amazon RDS-Dokumentation.

Amazon DocumentDB

Amazon DocumentDB (mit MongoDB-Kompatibilität) ist eine Dokumentendatenbank, die native Vektorsuchfunktionen in Version 5.0 und höher bietet. Sie kombiniert die Flexibilität der JSON-basierten Dokumentenablage mit der Vektorsuche und unterstützt sowohl hierarchische Navigable Small World (HNSW) als auch Inverted File Flat () Indexierungsmethoden. IVFFlat

Zu den Kernfunktionen von Amazon DocumentDB gehören:

Speichern und indizieren Sie Vektoren mit bis zu 2.000 Dimensionen (bis zu 16.000 Dimensionen ohne Indizierung)
Antwortzeiten in Millisekunden für Vektorähnlichkeitssuchen
Support für euklidische, Kosinus- und Punktabstandsmetriken
Nahtlose Integration mit bestehenden MongoDB-kompatiblen Anwendungen

Verwenden Sie Amazon DocumentDB in den folgenden Situationen:

Für Anwendungen, die MongoDB bereits verwenden APIs und Vektorsuchfunktionen benötigen
Für Anwendungsfälle, die flexible Dokumentendatenstrukturen in Kombination mit semantischer Suche erfordern
Für Szenarien, die sowohl herkömmliche Dokumentenabfragen als auch Vektorähnlichkeitssuchen erfordern
Für Anwendungen, die Produktempfehlungen, Personalisierung, Chat-Assistenten und Betrugserkennung bieten

Weitere Informationen finden Sie unter Vektorsuche für Amazon DocumentDB in der Amazon DocumentDB DocumentDB-Dokumentation.

Amazon MemoryDB

Amazon MemoryDB ist eine Redis-kompatible In-Memory-Datenbank, die unter den gängigen Vektordatenbanken die schnellste Vektor-Suchleistung bietet. AWS Sie bietet Abfragelatenzen von unter einer Millisekunde mit Beständigkeit in mehreren Availability Zones.

Zu den Kernfunktionen von MemoryDB gehören:

Speichern Sie Anwendungsdaten und Millionen von Vektoren in einer einzigen Datenbank
Antwortzeiten für Abfragen und Updates im einstelligen Millisekundenbereich
Höchste Rückrufraten bei schnellster Leistung bei AWS
Support für bis zu 32.768 Dimensionen pro Vektor
Semantische Such- und Caching-Funktionen in Echtzeit

Verwenden Sie MemoryDB in den folgenden Situationen:

Für Echtzeitanwendungen, die eine extrem niedrige Latenz (unter 10 ms) erfordern
Für Workloads mit hohem Durchsatz und Millionen von Anfragen pro Tag
Für Anwendungsfälle wie Empfehlungs-Engines in Echtzeit, semantisches Caching und Anomalieerkennung
Für Anwendungen, die sowohl speicherinterne Datenspeicher- als auch Vektorsuchfunktionen benötigen

Weitere Informationen finden Sie unter Vektorsuche in der MemoryDB-Dokumentation.

Amazon Neptune Analytics

Amazon Neptune Analytics ist eine Graphanalyse-Engine, die native Vektorsuchfunktionen bietet und sich somit ideal für Anwendungsfälle der Graph Retrieval Augmented Generation (GraphRag) eignet. Sie kombiniert die Suche nach Vektorähnlichkeit mit Graphendurchläufen und Algorithmen.

Zu den Kernfunktionen von Neptune Analytics gehören:

Analysieren Sie Dutzende von Milliarden von Beziehungen innerhalb von Sekunden
Kombinieren Sie die Vektorsuche mit Graphalgorithmen (Pfadfindung, Erkennung von Gemeinschaften, Zentralität)
Support für GraphRag-Anwendungen mit topologischem Wissen
Bis zu 80-mal schneller als bestehende Lösungen für die Graphanalyse
Integration mit Amazon Bedrock für vollständig verwaltetes GraphRag

Verwenden Sie Neptune Analytics in den folgenden Situationen:

Für GraphRag-Anwendungen, die Wissensgraphen mit Vektoreinbettungen benötigen
Für Anwendungsfälle, bei denen neben der Vektorähnlichkeit auch komplexe Beziehungen überwunden werden müssen
Für Anwendungen, die erklärbare KI-Antworten mit Beziehungskontext erfordern
Für Szenarien wie 360-Grad-Kundenansichten, Netzwerke zur Betrugserkennung und Wissensentdeckung

Weitere Informationen finden Sie in der Dokumentation zu Amazon Neptune Analytics.

Amazon S3 Vectors

Amazon S3 Vectors ist der erste Cloud-Objektspeicher AWS mit nativen Vektorspeicher- und Abfragefunktionen. Er bietet speziell entwickelten, kostenoptimierten Vektorspeicher für KI-Anwendungen, die eine enorme Skalierung erfordern.

Zu den Kernfunktionen von Amazon S3 Vectors gehören:

Speicher für bis zu 2 Milliarden Vektoren pro Index mit Unterstützung für bis zu 10.000 Indizes pro Vektor-Bucket
Abfragelatenz unter 100 ms, die für Langzeitspeicherung und seltene Zugriffsmuster optimiert ist
Bis zu 90% geringere Kosten für Vektoroperationen im Vergleich zu speziellen Vektordatenbanken
Serverlose Architektur mit automatischer Skalierung und einer Lebensdauer von 99,999999999% (11 9s)

Verwenden Sie Amazon S3 Vectors in den folgenden Situationen:

Für Anwendungen, die Milliarden von Vektoren zu minimalen Kosten speichern müssen
Für Workloads, die eine Abfragelatenz von weniger als einer Sekunde (100 ms oder mehr) statt weniger als 10 ms tolerieren
Für Anwendungsfälle zur langfristigen Aufbewahrung und Archivierung von Vektoren
Für RAG-Anwendungen mit seltenen Abrufmustern
Für Unternehmen, die der Wirtschaftlichkeit des Speichers Vorrang vor extrem niedriger Latenz einräumen

Amazon S3 Vectors lässt sich nativ in Amazon Bedrock Knowledge Bases integrieren und funktioniert gut in mehrstufigen Architekturen mit Amazon Service. OpenSearch Sie können Amazon S3 Vectors für Cold Storage und OpenSearch Service für Hot Queries verwenden.

Weitere Informationen finden Sie unter Arbeiten mit S3-Vektoren und Vektor-Buckets in der Amazon S3 S3-Dokumentation.

Option „Verwalteter Service“

Amazon Bedrock Knowledge Bases steht für den AWS vollständig verwalteten Ansatz zur Implementierung von Vektordatenbanken. Die Flexibilität der Speicheroptionen des Service in Kombination mit seinen automatisierten Verwaltungsfunktionen macht ihn besonders für Unternehmen interessant, die RAG implementieren möchten, ohne eine komplexe Infrastruktur verwalten zu müssen.

Mit Amazon Bedrock Knowledge Bases können Sie Wissensdatenbanken erstellen, verwalten und abfragen, die Ihre Basismodelle mithilfe von RAG verbessern. Dieser Service vereinfacht den komplexen Prozess der Implementierung von RAG, indem er die gesamte Pipeline für Datenaufnahme, Vektorisierung und Datenabruf verwaltet.

Zu den wichtigsten Vorteilen von Amazon Bedrock Knowledge Bases gehören:

Vereinfachte Datenverarbeitung
- Automatische Datenaufnahme und -aufteilung
- Integrierte Textextraktion aus mehreren Dateiformaten
- Generierung verwalteter Vektor-Einbettungen
- Automatische Extraktion und Indexierung von Metadaten
Optimierte RAG-Implementierung
- Vorkonfigurierte Abrufstrategien
- Automatische Optimierung des Kontextfensters
- Integrierte Relevanzoptimierung
- Semantische Suchfunktionen, sofort einsatzbereit
Sicherheit und Governance
- Integrierte AWS Identity and Access Management (IAM) Steuerungen
- Datenverschlüsselung im Ruhezustand und bei der Übertragung
- VPC-Unterstützung
- Audit-Protokollierung mit AWS CloudTrail

Amazon Bedrock Knowledge Bases unterstützt mehrere Vector Store-Optionen, darunter:

Amazon Aurora PostgreSQL mit pgvector
Amazon Neptune Analytics
Amazon EMR Serverless
Amazon S3 Vectors
Tannenzapfen
Redis Enterprise Cloud

Dieser verwaltete Service kümmert sich um die automatische Erfassung, Vektorisierung und den Abruf von Daten. Dies vereinfacht RAG-Implementierungen.

Detaillierte Informationen zu den einzelnen unterstützten Vector Stores finden Sie in der Amazon Bedrock Knowledge Bases-Dokumentation.

Auswahl der richtigen Vektordatenbank

Wählen Sie Ihre Vektordatenbank auf der Grundlage dieser wichtigen Entscheidungsfaktoren aus:

Wenn Sie eine MongoDB-kompatible Dokumentendatenbank mit Vektorsuche benötigen, wählen Sie Amazon DocumentDB. Dies ist ideal, wenn Ihre Anwendung MongoDB verwendet APIs und Sie semantische Suchfunktionen hinzufügen möchten, ohne eine separate Vektorinfrastruktur verwalten zu müssen.
Wenn Sie eine extrem niedrige Latenz für Echtzeitanwendungen benötigen, wählen Sie Amazon MemoryDB. Dies bietet die schnellste Vektor-Suchleistung AWS mit Reaktionszeiten von unter einer Millisekunde. Es ist ideal für Empfehlungsmaschinen in Echtzeit und Anwendungen mit hohem Durchsatz.
Wenn Sie graphenbasierte Wissensdarstellungen mit Vektorsuche benötigen, entscheiden Sie sich für Amazon Neptune Analytics. Dies eignet sich am besten für GraphRag-Anwendungen, die komplexe Zusammenhänge durchqueren und neben Vektorsuchen auch grafenbasierte Abfragen durchführen müssen, um erklärbare KI-Antworten zu liefern.
Wenn Sie relationale Abfragen mit Vektorsuche kombinieren müssen, wählen Sie Amazon Aurora PostgreSQL with pgvector. Diese Option ist ideal, wenn Ihre Anwendung sowohl traditionelle SQL-Operationen als auch Vektorähnlichkeitssuchen innerhalb derselben Datenbank erfordert.
Wenn Sie Abfragen mit hohem Durchsatz und einer Latenz von weniger als 10 ms benötigen, wählen Sie Amazon OpenSearch Service. Es zeichnet sich durch die Verarbeitung von hochfrequenten Abfragen und Echtzeitanwendungen aus und umfasst aktuelle Verbesserungen der GPU-Beschleunigung.
Wenn Sie Milliarden von Vektoren kostengünstig speichern müssen, entscheiden Sie sich für Amazon S3 Vectors. Diese Option bietet Kosteneinsparungen von bis zu 90% und ist ideal für Anwendungen mit seltenen Abrufmustern (Minuten bis Stunden zwischen Abfragen), die eine Latenz von weniger als 100 ms tolerieren können.
Wenn Sie neben der Vektorsuche auch eine Volltextsuche benötigen, wählen Sie Amazon OpenSearch Service. Diese Option kombiniert leistungsstarke Funktionen für die Volltextsuche mit der Vektorsuche auf einer einzigen Plattform.

Warnung JavaScript ist in Ihrem Browser nicht verfügbar oder deaktiviert.

Zur Nutzung der AWS-Dokumentation muss JavaScript aktiviert sein. Weitere Informationen finden auf den Hilfe-Seiten Ihres Browsers.

Dokumentkonventionen

Überblick über Vektordatenbanken

Vergleich von Vektordatenbanken