Die vorliegende Übersetzung wurde maschinell erstellt. Im Falle eines Konflikts oder eines Widerspruchs zwischen dieser übersetzten Fassung und der englischen Fassung (einschließlich infolge von Verzögerungen bei der Übersetzung) ist die englische Fassung maßgeblich.
Vergleich von Vektordatenbanken
AWS bietet mehrere Ansätze zur Implementierung von Vektorsuchfunktionen, die von einzelnen Vektordatenbanken bis hin zu Amazon Bedrock Knowledge Bases, einem vollständig verwalteten Service, reichen. Bei der Bewertung dieser Optionen müssen Unternehmen verschiedene Aspekte berücksichtigen, darunter Architektur, Skalierbarkeit, Integrationsmöglichkeiten, Leistungsmerkmale und Sicherheitsmerkmale.
Individuelle Vektordatenbanken
Die folgende Tabelle bietet einen Überblick über die wichtigsten Funktionen verschiedener AWS individueller Vektordatenbanklösungen, wobei der Schwerpunkt auf deren Architekturen, Skalierungsmöglichkeiten, Datenquellenintegrationen und Leistungsmerkmalen liegt.
Merkmal |
Amazon Kendra |
OpenSearch Amazon-Dienst |
Amazon RDS für Postgre-Pvvector SQLwith |
Amazon DocumentDB |
Amazon MemoryDB |
Amazon Neptune Analytics |
Amazon S3 Vectors |
|---|---|---|---|---|---|---|---|
Primärer Anwendungsfall |
Unternehmenssuche und RAG |
Verteilte Suche und Analytik |
Relationale Datenbank mit Vektorunterstützung |
Dokumenten-Datenbank mit Vektorsuche |
Vektorsuche im Speicher in Echtzeit |
Graphanalyse mit Vektorsuche |
Kostenoptimierter Vektorspeicher |
Architektur |
Vollständig verwaltet |
Verteilter Cluster |
Relationale Datenbank |
Dokumentenorientiert |
In-Memory-Datenbanken |
Graph-Analyse-Engine |
Serverloser Objektspeicher |
Datenmodell |
Dokumentenbasiert |
JSON-Dokumente |
Relationale Tabellen |
JSON-Dokumente |
Schlüsselwert mit JSON |
Eigenschaftsdiagramm |
Objektspeicher |
Abmessungen von Vektoren |
Automatisch verwaltet |
Bis zu 16.000 |
Konfigurierbar |
Bis zu 2.000 (indexiert); 16.000 (nicht indexiert) |
Bis zu 32.768 |
Konfigurierbar |
Bis zu 4.096 |
Methoden zur Indizierung |
Automatisch |
HNSW, IVF |
HNSW, IVFFlat |
HNSW, IVFFlat |
HNSW |
Nativer Graph und Vektor |
Automatisch |
Entfernungsmetriken |
Automatisch |
Kosinus, Euklidisch, Punktprodukt |
Kosinus, Euklidisch, inneres Produkt |
Kosinus, Euklidisch, Punktprodukt |
Kosinus, Euklidisch, inneres Produkt |
Kosinus, Euklidisch |
Kosinus, Euklidisch |
Latenz bei Abfragen |
In weniger als einer Sekunde |
Unter 10 ms (GPU-beschleunigt) |
10-100 ms |
Millisekunde |
Submillisekunde |
In weniger als einer Sekunde |
Unter 100 ms |
Skalierungsmodell |
Automatisch |
Horizontal (Knoten hinzufügen) |
Vertikale und lesbare Repliken |
Horizontal (Instanzen hinzufügen) |
Vertikal und Replikate |
Automatisch |
Automatisch (serverlos) |
Maximale Anzahl von Vektoren |
Verwaltet |
Milliarden (clusterabhängig) |
Millionen (instanzabhängig) |
Millionen pro Sammlung |
Millionen pro Datenbank |
Milliarden |
2 Milliarden pro Index; 10.000 Indizes pro Bereich |
Durchsatz |
Hoch |
Sehr hoch (Tausende von QPS) |
Medium |
Hoch |
Sehr hoch (Millionen von Anfragen pro Tag) |
Hoch |
Mittel (optimiert für seltene Abfragen) |
Lebensdauer von Daten |
99,999999999 % (11x9) |
Konfigurierbar mit Replikaten |
99,99% (Multi-AZ) |
99,99% (Multi-AZ) |
99,99% (Multi-AZ) |
99,99 % |
99,999999999 % (11x9) |
Konsistenzmodell |
Eventuell |
Eventual (konfigurierbar) |
Stark (ACID) |
Irgendwann |
Stark |
Stark |
Stark |
Zusätzliche Funktionen |
40 oder mehr Datenanschlüsse, NLP |
Volltextsuche, Analytik, Dashboards |
SQL-Abfragen, ACID-Transaktionen |
MongoDB-API-Kompatibilität |
Redis-API-Kompatibilität, Caching |
Graphalgorithmen, Traversalen |
Amazon S3 S3-Integration, Lebenszyklusrichtlinien |
Preismodell |
Zahlen Sie pro Anfrage und Speicherplatz |
Stunden und Speicherplatz der Instanz |
Stunden und Speicherplatz der Instanz |
Stunden und Speicherplatz der Instanz |
Stunden und Speicherplatz der Instanz |
Kapazitätseinheiten und Speicherplatz |
Speicherung, Abfragen und Datenübertragung |
Kostenoptimierung |
Nutzungsbasiert |
Reservierte Instances, auto-scaling |
Reservierte Instanzen, Aurora Serverless |
Reserved Instances |
Reserved Instances |
Auto Scaling |
Einsparungen von bis zu 90% im Vergleich zu Spezialprodukten DBs |
Am besten geeignet für |
Unternehmenssuche mit minimalem Einrichtungsaufwand |
Abfragen mit hohem Durchsatz und niedriger Latenz |
Hybride SQL- und Vektor-Workloads |
MongoDB-kompatible Apps, die Vektoren benötigen |
Apps in Echtzeit mit extrem niedriger Latenz |
GraphRag und Wissensgraphen |
Langfristige, kostengünstige Lagerung |
Ideales Abfragemuster |
Häufige Suchanfragen in Unternehmen |
Hochfrequente Abfragen in Echtzeit |
Gemischte SQL- und Vektorabfragen |
Dokumentenabfragen mit semantischer Suche |
Millionen von Anfragen pro Tag |
Traversierungen mit Vektorsuche grafisch darstellen |
Seltene Anfragen (Minuten bis Stunden) |
Komplexität der Einrichtung |
Niedrig (vollständig verwaltet) |
Mittel (Clusterkonfiguration) |
Mittel (Erweiterungs-Setup) |
Mittel (Clusterkonfiguration) |
Mittel (Clusterkonfiguration) |
Niedrig (vollständig verwaltet) |
Niedrig (serverlos) |
Fachwissen des Teams erforderlich |
Minimal |
OpenSearch oder Elasticsearch |
PostgreSQL, SQL |
MongoDB |
Redis |
Graph-Datenbanken |
Amazon S3, grundlegende Vektorkonzepte |
Verwalteter Service — Amazon Bedrock Knowledge Bases
Amazon Bedrock Knowledge Bases bietet eine vollständig verwaltete Lösung mit mehreren Vektorspeicheroptionen. In der folgenden Tabelle werden diese Speicheroptionen verglichen.
Merkmal |
Aurora Postgre-Pvektor SQLwith |
Neptun-Analytik |
OpenSearch Serverloser Service |
Amazon S3 S3-Vektoren |
Tannenzapfen |
RedisEnterprise Cloud |
|---|---|---|---|---|---|---|
Primärer Anwendungsfall |
Relationale Datenbank mit Vektor-RAG |
Graphbasierte Vektorsuche für GraphRag |
Wissensmanagement RAG |
Kostenoptimierter Vektor-RAG |
Hochleistungsfähige Vektorsuche |
Vektorsuche im Speicher |
Architektur |
Vollständig verwaltetes relationales |
Vollständig verwaltete Graphenanalysen |
Vollständig verwaltetes, serverloses System |
Serverloser Objektspeicher |
Vollständig verwaltete Hybrid-Cloud |
Vollständig verwalteter In-Memory-Speicher |
Datenmodell |
Relationale Tabellen |
Eigenschaftsdiagramm |
JSON-Dokumente |
Objektspeicher |
Speziell entwickelte Vektoren |
Schlüsselwert mit Vektoren |
Vektor-Speicher |
Durch die Erweiterung pgvector |
Native Graphvektoren |
Durch den OpenSearch Motor |
Nativer Amazon S3 S3-Vektorspeicher |
Native Vektordatenbank |
Vektoren im Speicher |
Integration mit Amazon Bedrock |
Nativ |
Nativ |
Nativ |
Nativ |
Nativ |
Nativ |
Automatische Einnahme |
Ja (über Amazon Bedrock) |
Ja (über Amazon Bedrock) |
Ja (über Amazon Bedrock) |
Ja (über Amazon Bedrock) |
Ja (über Amazon Bedrock) |
Ja (über Amazon Bedrock) |
Automatische Vektorisierung |
Ja (über Amazon Bedrock) |
Ja (über Amazon Bedrock) |
Ja (über Amazon Bedrock) |
Ja (über Amazon Bedrock) |
Ja (über Amazon Bedrock) |
Ja (über Amazon Bedrock) |
Skalierung |
Automatische Skalierung (Aurora Serverless) |
Automatische Skalierung von Diagrammen |
Automatisch serverlos |
Automatisch (Milliarden von Vektoren) |
Automatische Skalierung von Pods |
Automatische Skalierung von Clustern |
Abfrageleistung |
Hoch für relational oder vektoriell |
Hoch für Graphvektoren |
Hoch |
Mittel (Latenz von 100 ms oder mehr) |
Very high (Sehr hoch) |
Very high (Sehr hoch) |
Maximale Vektoren |
Millionen (instanzabhängig) |
Milliarden |
Milliarden |
2 Milliarden pro Index |
Milliarden |
Millionen (speicherabhängig) |
Zusätzliche Funktionen |
SQL-Abfragen, ACID-Transaktionen |
Graphalgorithmen, Traversalen |
Volltextsuche, Analytik |
Amazon S3 S3-Lebenszyklus, Tiering |
Filterung von Metadaten, Namespaces |
Redis-Datenstrukturen, Caching |
Kostenoptimierung |
Moderat (Aurora Serverless) |
Moderat (Kapazitätseinheiten) |
Hoch (serverlos, pay-per-use) |
Sehr hoch (Einsparungen von bis zu 90%) |
Moderat (pod-basierte Preisgestaltung) |
Niedrig (In-Memory-Premium) |
Am besten geeignet für |
Hybride Workloads SQL/vector |
Verbundene Wissensgraphen |
Volltext mit Vektorsuche |
Langfristige Vektoren mit seltenem Zugriff |
Vektorsuche in Echtzeit in großem Maßstab |
Anforderungen an extrem niedrige Latenz |
Ideales Abfragemuster |
Gemischte SQL- und Vektorabfragen |
Traversierungen mit Vektoren grafisch darstellen |
Häufige Suchanfragen mit Analysen |
Seltener Abruf (Minuten bis Stunden) |
Hochfrequente Abfragen in Echtzeit |
Millionen von Anfragen pro Sekunde |
Einrichtung mit Amazon Bedrock |
Einfach (verwaltet von Amazon Bedrock) |
Einfach (verwaltet von Amazon Bedrock) |
Einfach (verwaltet von Amazon Bedrock) |
Einfach (verwaltet von Amazon Bedrock) |
Einfach (verwaltet von Amazon Bedrock) |
Einfach (verwaltet von Amazon Bedrock) |
Datenresidenz |
AWS-Regionen |
AWS-Regionen |
AWS-Regionen |
AWS-Regionen |
Multi-Cloud (AWS und andere) |
Multi-Cloud (AWS und andere) |
Preismodell |
Stunden und Speicherplatz der Instanz |
Kapazitätseinheiten und Speicherplatz |
Rechenleistung und Speicher (serverlos) |
Speicherung, Abfragen und Übertragung |
Öffnungszeiten und Speicherplatz |
Öffnungszeiten und Speicherplatz der Knoten |
Wählen Sie zwischen individuellen und verwalteten Optionen
Überlegung |
Wählen Sie eine individuelle Vektor-DB |
Wählen Sie Amazon Bedrock Knowledge Bases (verwaltet) |
|---|---|---|
RAG-Implementierung |
Sie möchten die volle Kontrolle über die RAG-Pipeline |
Sie möchten ein vollständig verwaltetes RAG mit minimalem Einrichtungsaufwand |
Anpassung |
Sie benötigen eine benutzerdefinierte Abruflogik und Vorverarbeitung |
Standard-RAG-Muster erfüllen Ihre Anforderungen |
Bestehende Infrastruktur |
Sie haben die Datenbank bereits bereitgestellt |
Sie fangen neu an oder wünschen sich eine vereinfachte Verwaltung |
Fachwissen im Team |
Ihr Team verfügt über Fachkenntnisse in der Datenbankadministration |
Sie konzentrieren sich lieber auf die Anwendungslogik als auf die Infrastruktur |
Komplexität der Integration |
Sie benötigen eine tiefe Integration mit bestehenden Systemen |
Sie möchten eine schnelle Integration mit Amazon Bedrock-Modellen |
Operativer Overhead |
Sie können Datenbankoperationen verwalten |
Sie AWS möchten Operationen abwickeln |
Kostenstruktur |
Sie bevorzugen direkte Datenbankpreise |
Sie bevorzugen eine einheitliche Amazon Bedrock-Preisgestaltung |
Zeit bis zur Markteinführung |
Sie haben Zeit für eine kundenspezifische Implementierung |
Sie benötigen eine schnelle Bereitstellung |