Die vorliegende Übersetzung wurde maschinell erstellt. Im Falle eines Konflikts oder eines Widerspruchs zwischen dieser übersetzten Fassung und der englischen Fassung (einschließlich infolge von Verzögerungen bei der Übersetzung) ist die englische Fassung maßgeblich.
Vektor-Datenbankoptionen
AWS bietet eine breite Palette von Vektordatenbanklösungen zur Unterstützung verschiedener Anwendungsfälle und Anforderungen in generativen KI-Anwendungen. Diese Optionen lassen sich grob in einzelne Datenbankdienste und Managed-Services-Angebote unterteilen, die jeweils unterschiedliche Merkmale und Vorteile aufweisen. Das Verständnis dieser Optionen ist für Unternehmen von entscheidender Bedeutung, die Vektorsuchfunktionen effektiv implementieren und gleichzeitig optimale Leistung, Skalierbarkeit und Kosteneffizienz gewährleisten möchten.
Weitere Informationen zu Vektordatenbanklösungen finden Sie in den folgenden Abschnitten:
Individuelle Vektordatenbankoptionen
Zu den einzelnen Vektordatenbankoptionen AWS gehören Amazon Kendra, Amazon OpenSearch Service, AmazonRDS for PostgreSQL mit pgvector, Amazon MemoryDB, Amazon DocumentDB, AmazonNeptune Analytics und Amazon S3 Vector. (Als Open-Source-Erweiterung bietet pgvector die Möglichkeit, ML-generierte Vektoreinbettungen zu speichern und zu durchsuchen.) Diese Lösungen bieten unterschiedliche Ansätze für die Vektorsuche, sodass Unternehmen auf der Grundlage ihrer vorhandenen Infrastruktur, ihrer technischen Anforderungen und ihrer spezifischen Anwendungsfälle eine Auswahl treffen können.
Amazon Kendra
Amazon Kendra ist ein intelligenter Suchdienst für Unternehmen, der natürliche Sprachverarbeitung und fortschrittliche Algorithmen für maschinelles Lernen verwendet, um spezifische Antworten auf Suchfragen aus Ihren Daten zurückzugeben. Amazon Kendra vereinfacht die Implementierung von Suchfunktionen und ist damit eine effektive Backend-Lösung für generative KI-Anwendungen.
Zu den weiteren wichtigen Funktionen von Amazon Kendra gehören:
-
Native Verbindungen zu über 40 Datenquellen
-
Integrierte Funktionen zur Datenaufbereitung
-
Schnelle Einrichtung, für die kein tiefes technisches Fachwissen erforderlich ist
Zu den Vorteilen von Amazon Kendra gehören:
-
Automatisierte Datenverarbeitung (Chunking, Ingestion, Abruf)
-
Leistungsstarke Anpassungsoptionen:
-
Einfacher programmatischer Zugriff über AWS SDK für Python (Boto3)
Weitere Informationen finden Sie unter Vorteile von Amazon Kendra in der Amazon Kendra Kendra-Dokumentation.
OpenSearch Amazon-Dienst
Amazon OpenSearch Service ist ein verwalteter Service, der Sie bei der Bereitstellung, dem Betrieb und der Skalierung von OpenSearch Service-Clustern in der unterstützt AWS Cloud.
Zu den Kernfunktionen von OpenSearch Service gehören die folgenden:
-
Open-Source-Such- und Analyse-Engine
-
Verteilte Architektur
-
Datenverarbeitung in Echtzeit
Zu den Vorteilen der Nutzung des OpenSearch Dienstes gehören die folgenden:
-
Horizontale Skalierbarkeit
-
RESTful API-Unterstützung
-
Verarbeitet strukturierte und unstrukturierte Daten
-
Datenanalyse in Echtzeit
-
Geeignet für verschiedene Einsatzgrößen
Weitere Informationen finden Sie unter Funktionen von Amazon OpenSearch Service in der OpenSearch Servicedokumentation.
Amazon RDS for PostgreSQL mit pgvector
Amazon RDS for PostgreSQL mit pgvector
Zu den wichtigsten Vorteilen von Amazon RDS for PostgreSQL mit pgvector gehören:
-
Hohe Verfügbarkeit
-
Automatisches Failover
-
Kostengünstig () pay-per-use
-
Integrierte Überwachung
-
Integration von Vektordaten in Echtzeit
Weitere Informationen finden Sie unter Vorteile von Amazon RDS in der Amazon RDS-Dokumentation.
Amazon DocumentDB
Amazon DocumentDB (mit MongoDB-Kompatibilität) ist eine Dokumentendatenbank, die native Vektorsuchfunktionen in Version 5.0 und höher bietet. Sie kombiniert die Flexibilität der JSON-basierten Dokumentenablage mit der Vektorsuche und unterstützt sowohl hierarchische Navigable Small World (HNSW) als auch Inverted File Flat () Indexierungsmethoden. IVFFlat
Zu den Kernfunktionen von Amazon DocumentDB gehören:
-
Speichern und indizieren Sie Vektoren mit bis zu 2.000 Dimensionen (bis zu 16.000 Dimensionen ohne Indizierung)
-
Antwortzeiten in Millisekunden für Vektorähnlichkeitssuchen
-
Support für euklidische, Kosinus- und Punktabstandsmetriken
-
Nahtlose Integration mit bestehenden MongoDB-kompatiblen Anwendungen
Verwenden Sie Amazon DocumentDB in den folgenden Situationen:
-
Für Anwendungen, die MongoDB bereits verwenden APIs und Vektorsuchfunktionen benötigen
-
Für Anwendungsfälle, die flexible Dokumentendatenstrukturen in Kombination mit semantischer Suche erfordern
-
Für Szenarien, die sowohl herkömmliche Dokumentenabfragen als auch Vektorähnlichkeitssuchen erfordern
-
Für Anwendungen, die Produktempfehlungen, Personalisierung, Chat-Assistenten und Betrugserkennung bieten
Weitere Informationen finden Sie unter Vektorsuche für Amazon DocumentDB in der Amazon DocumentDB DocumentDB-Dokumentation.
Amazon MemoryDB
Amazon MemoryDB ist eine Redis-kompatible In-Memory-Datenbank, die unter den gängigen Vektordatenbanken die schnellste Vektor-Suchleistung bietet. AWS Sie bietet Abfragelatenzen von unter einer Millisekunde mit Beständigkeit in mehreren Availability Zones.
Zu den Kernfunktionen von MemoryDB gehören:
-
Speichern Sie Anwendungsdaten und Millionen von Vektoren in einer einzigen Datenbank
-
Antwortzeiten für Abfragen und Updates im einstelligen Millisekundenbereich
-
Höchste Rückrufraten bei schnellster Leistung bei AWS
-
Support für bis zu 32.768 Dimensionen pro Vektor
-
Semantische Such- und Caching-Funktionen in Echtzeit
Verwenden Sie MemoryDB in den folgenden Situationen:
-
Für Echtzeitanwendungen, die eine extrem niedrige Latenz (unter 10 ms) erfordern
-
Für Workloads mit hohem Durchsatz und Millionen von Anfragen pro Tag
-
Für Anwendungsfälle wie Empfehlungs-Engines in Echtzeit, semantisches Caching und Anomalieerkennung
-
Für Anwendungen, die sowohl speicherinterne Datenspeicher- als auch Vektorsuchfunktionen benötigen
Weitere Informationen finden Sie unter Vektorsuche in der MemoryDB-Dokumentation.
Amazon Neptune Analytics
Amazon Neptune Analytics ist eine Graphanalyse-Engine, die native Vektorsuchfunktionen bietet und sich somit ideal für Anwendungsfälle der Graph Retrieval Augmented Generation (GraphRag) eignet. Sie kombiniert die Suche nach Vektorähnlichkeit mit Graphendurchläufen und Algorithmen.
Zu den Kernfunktionen von Neptune Analytics gehören:
-
Analysieren Sie Dutzende von Milliarden von Beziehungen innerhalb von Sekunden
-
Kombinieren Sie die Vektorsuche mit Graphalgorithmen (Pfadfindung, Erkennung von Gemeinschaften, Zentralität)
-
Support für GraphRag-Anwendungen mit topologischem Wissen
-
Bis zu 80-mal schneller als bestehende Lösungen für die Graphanalyse
-
Integration mit Amazon Bedrock für vollständig verwaltetes GraphRag
Verwenden Sie Neptune Analytics in den folgenden Situationen:
-
Für GraphRag-Anwendungen, die Wissensgraphen mit Vektoreinbettungen benötigen
-
Für Anwendungsfälle, bei denen neben der Vektorähnlichkeit auch komplexe Beziehungen überwunden werden müssen
-
Für Anwendungen, die erklärbare KI-Antworten mit Beziehungskontext erfordern
-
Für Szenarien wie 360-Grad-Kundenansichten, Netzwerke zur Betrugserkennung und Wissensentdeckung
Weitere Informationen finden Sie in der Dokumentation zu Amazon Neptune Analytics.
Amazon S3 Vectors
Amazon S3 Vectors ist der erste Cloud-Objektspeicher AWS mit nativen Vektorspeicher- und Abfragefunktionen. Er bietet speziell entwickelten, kostenoptimierten Vektorspeicher für KI-Anwendungen, die eine enorme Skalierung erfordern.
Zu den Kernfunktionen von Amazon S3 Vectors gehören:
-
Speicher für bis zu 2 Milliarden Vektoren pro Index mit Unterstützung für bis zu 10.000 Indizes pro Vektor-Bucket
-
Abfragelatenz unter 100 ms, die für Langzeitspeicherung und seltene Zugriffsmuster optimiert ist
-
Bis zu 90% geringere Kosten für Vektoroperationen im Vergleich zu speziellen Vektordatenbanken
-
Serverlose Architektur mit automatischer Skalierung und einer Lebensdauer von 99,999999999% (11 9s)
Verwenden Sie Amazon S3 Vectors in den folgenden Situationen:
-
Für Anwendungen, die Milliarden von Vektoren zu minimalen Kosten speichern müssen
-
Für Workloads, die eine Abfragelatenz von weniger als einer Sekunde (100 ms oder mehr) statt weniger als 10 ms tolerieren
-
Für Anwendungsfälle zur langfristigen Aufbewahrung und Archivierung von Vektoren
-
Für RAG-Anwendungen mit seltenen Abrufmustern
-
Für Unternehmen, die der Wirtschaftlichkeit des Speichers Vorrang vor extrem niedriger Latenz einräumen
Amazon S3 Vectors lässt sich nativ in Amazon Bedrock Knowledge Bases integrieren und funktioniert gut in mehrstufigen Architekturen mit Amazon Service. OpenSearch Sie können Amazon S3 Vectors für Cold Storage und OpenSearch Service für Hot Queries verwenden.
Weitere Informationen finden Sie unter Arbeiten mit S3-Vektoren und Vektor-Buckets in der Amazon S3 S3-Dokumentation.
Option „Verwalteter Service“
Amazon Bedrock Knowledge Bases steht für den AWS vollständig verwalteten Ansatz zur Implementierung von Vektordatenbanken. Die Flexibilität der Speicheroptionen des Service in Kombination mit seinen automatisierten Verwaltungsfunktionen macht ihn besonders für Unternehmen interessant, die RAG implementieren möchten, ohne eine komplexe Infrastruktur verwalten zu müssen.
Mit Amazon Bedrock Knowledge Bases können Sie Wissensdatenbanken erstellen, verwalten und abfragen, die Ihre Basismodelle mithilfe von RAG verbessern. Dieser Service vereinfacht den komplexen Prozess der Implementierung von RAG, indem er die gesamte Pipeline für Datenaufnahme, Vektorisierung und Datenabruf verwaltet.
Zu den wichtigsten Vorteilen von Amazon Bedrock Knowledge Bases gehören:
-
Vereinfachte Datenverarbeitung
-
Automatische Datenaufnahme und -aufteilung
-
Integrierte Textextraktion aus mehreren Dateiformaten
-
Generierung verwalteter Vektor-Einbettungen
-
Automatische Extraktion und Indexierung von Metadaten
-
-
Optimierte RAG-Implementierung
-
Vorkonfigurierte Abrufstrategien
-
Automatische Optimierung des Kontextfensters
-
Integrierte Relevanzoptimierung
-
Semantische Suchfunktionen, sofort einsatzbereit
-
-
Sicherheit und Governance
-
Integrierte AWS Identity and Access Management (IAM) Steuerungen
-
Datenverschlüsselung im Ruhezustand und bei der Übertragung
-
VPC-Unterstützung
-
Audit-Protokollierung mit AWS CloudTrail
-
Amazon Bedrock Knowledge Bases unterstützt mehrere Vector Store-Optionen, darunter:
-
Amazon Aurora PostgreSQL mit pgvector
-
Amazon Neptune Analytics
-
Amazon EMR Serverless
-
Amazon S3 Vectors
-
Tannenzapfen
-
Redis Enterprise Cloud
Dieser verwaltete Service kümmert sich um die automatische Erfassung, Vektorisierung und den Abruf von Daten. Dies vereinfacht RAG-Implementierungen.
Detaillierte Informationen zu den einzelnen unterstützten Vector Stores finden Sie in der Amazon Bedrock Knowledge Bases-Dokumentation.
Auswahl der richtigen Vektordatenbank
Wählen Sie Ihre Vektordatenbank auf der Grundlage dieser wichtigen Entscheidungsfaktoren aus:
-
Wenn Sie eine MongoDB-kompatible Dokumentendatenbank mit Vektorsuche benötigen, wählen Sie Amazon DocumentDB. Dies ist ideal, wenn Ihre Anwendung MongoDB verwendet APIs und Sie semantische Suchfunktionen hinzufügen möchten, ohne eine separate Vektorinfrastruktur verwalten zu müssen.
-
Wenn Sie eine extrem niedrige Latenz für Echtzeitanwendungen benötigen, wählen Sie Amazon MemoryDB. Dies bietet die schnellste Vektor-Suchleistung AWS mit Reaktionszeiten von unter einer Millisekunde. Es ist ideal für Empfehlungsmaschinen in Echtzeit und Anwendungen mit hohem Durchsatz.
-
Wenn Sie graphenbasierte Wissensdarstellungen mit Vektorsuche benötigen, entscheiden Sie sich für Amazon Neptune Analytics. Dies eignet sich am besten für GraphRag-Anwendungen, die komplexe Zusammenhänge durchqueren und neben Vektorsuchen auch grafenbasierte Abfragen durchführen müssen, um erklärbare KI-Antworten zu liefern.
-
Wenn Sie relationale Abfragen mit Vektorsuche kombinieren müssen, wählen Sie Amazon Aurora PostgreSQL with pgvector. Diese Option ist ideal, wenn Ihre Anwendung sowohl traditionelle SQL-Operationen als auch Vektorähnlichkeitssuchen innerhalb derselben Datenbank erfordert.
-
Wenn Sie Abfragen mit hohem Durchsatz und einer Latenz von weniger als 10 ms benötigen, wählen Sie Amazon OpenSearch Service. Es zeichnet sich durch die Verarbeitung von hochfrequenten Abfragen und Echtzeitanwendungen aus und umfasst aktuelle Verbesserungen der GPU-Beschleunigung.
-
Wenn Sie Milliarden von Vektoren kostengünstig speichern müssen, entscheiden Sie sich für Amazon S3 Vectors. Diese Option bietet Kosteneinsparungen von bis zu 90% und ist ideal für Anwendungen mit seltenen Abrufmustern (Minuten bis Stunden zwischen Abfragen), die eine Latenz von weniger als 100 ms tolerieren können.
-
Wenn Sie neben der Vektorsuche auch eine Volltextsuche benötigen, wählen Sie Amazon OpenSearch Service. Diese Option kombiniert leistungsstarke Funktionen für die Volltextsuche mit der Vektorsuche auf einer einzigen Plattform.