Individuelle Vektordatenbanken Verwalteter Service — Amazon Bedrock Knowledge Bases Wählen Sie zwischen individuellen und verwalteten Optionen

Vergleich von Vektordatenbanken

AWS bietet mehrere Ansätze zur Implementierung von Vektorsuchfunktionen, die von einzelnen Vektordatenbanken bis hin zu Amazon Bedrock Knowledge Bases, einem vollständig verwalteten Service, reichen. Bei der Bewertung dieser Optionen müssen Unternehmen verschiedene Aspekte berücksichtigen, darunter Architektur, Skalierbarkeit, Integrationsmöglichkeiten, Leistungsmerkmale und Sicherheitsmerkmale.

Individuelle Vektordatenbanken

Die folgende Tabelle bietet einen Überblick über die wichtigsten Funktionen verschiedener AWS individueller Vektordatenbanklösungen, wobei der Schwerpunkt auf deren Architekturen, Skalierungsmöglichkeiten, Datenquellenintegrationen und Leistungsmerkmalen liegt.

Merkmal	Amazon Kendra	OpenSearch Amazon-Dienst	Amazon RDS für Postgre-Pvvector SQLwith	Amazon DocumentDB	Amazon MemoryDB	Amazon Neptune Analytics	Amazon S3 Vectors
Primärer Anwendungsfall	Unternehmenssuche und RAG	Verteilte Suche und Analytik	Relationale Datenbank mit Vektorunterstützung	Dokumenten-Datenbank mit Vektorsuche	Vektorsuche im Speicher in Echtzeit	Graphanalyse mit Vektorsuche	Kostenoptimierter Vektorspeicher
Architektur	Vollständig verwaltet	Verteilter Cluster	Relationale Datenbank	Dokumentenorientiert	In-Memory-Datenbanken	Graph-Analyse-Engine	Serverloser Objektspeicher
Datenmodell	Dokumentenbasiert	JSON-Dokumente	Relationale Tabellen	JSON-Dokumente	Schlüsselwert mit JSON	Eigenschaftsdiagramm	Objektspeicher
Abmessungen von Vektoren	Automatisch verwaltet	Bis zu 16.000	Konfigurierbar	Bis zu 2.000 (indexiert); 16.000 (nicht indexiert)	Bis zu 32.768	Konfigurierbar	Bis zu 4.096
Methoden zur Indizierung	Automatisch	HNSW, IVF	HNSW, IVFFlat	HNSW, IVFFlat	HNSW	Nativer Graph und Vektor	Automatisch
Entfernungsmetriken	Automatisch	Kosinus, Euklidisch, Punktprodukt	Kosinus, Euklidisch, inneres Produkt	Kosinus, Euklidisch, Punktprodukt	Kosinus, Euklidisch, inneres Produkt	Kosinus, Euklidisch	Kosinus, Euklidisch
Latenz bei Abfragen	In weniger als einer Sekunde	Unter 10 ms (GPU-beschleunigt)	10-100 ms	Millisekunde	Submillisekunde	In weniger als einer Sekunde	Unter 100 ms
Skalierungsmodell	Automatisch	Horizontal (Knoten hinzufügen)	Vertikale und lesbare Repliken	Horizontal (Instanzen hinzufügen)	Vertikal und Replikate	Automatisch	Automatisch (serverlos)
Maximale Anzahl von Vektoren	Verwaltet	Milliarden (clusterabhängig)	Millionen (instanzabhängig)	Millionen pro Sammlung	Millionen pro Datenbank	Milliarden	2 Milliarden pro Index; 10.000 Indizes pro Bereich
Durchsatz	Hoch	Sehr hoch (Tausende von QPS)	Medium	Hoch	Sehr hoch (Millionen von Anfragen pro Tag)	Hoch	Mittel (optimiert für seltene Abfragen)
Lebensdauer von Daten	99,999999999 % (11x9)	Konfigurierbar mit Replikaten	99,99% (Multi-AZ)	99,99% (Multi-AZ)	99,99% (Multi-AZ)	99,99 %	99,999999999 % (11x9)
Konsistenzmodell	Eventuell	Eventual (konfigurierbar)	Stark (ACID)	Irgendwann	Stark	Stark	Stark
Zusätzliche Funktionen	40 oder mehr Datenanschlüsse, NLP	Volltextsuche, Analytik, Dashboards	SQL-Abfragen, ACID-Transaktionen	MongoDB-API-Kompatibilität	Redis-API-Kompatibilität, Caching	Graphalgorithmen, Traversalen	Amazon S3 S3-Integration, Lebenszyklusrichtlinien
Preismodell	Zahlen Sie pro Anfrage und Speicherplatz	Stunden und Speicherplatz der Instanz	Stunden und Speicherplatz der Instanz	Stunden und Speicherplatz der Instanz	Stunden und Speicherplatz der Instanz	Kapazitätseinheiten und Speicherplatz	Speicherung, Abfragen und Datenübertragung
Kostenoptimierung	Nutzungsbasiert	Reservierte Instances, auto-scaling	Reservierte Instanzen, Aurora Serverless	Reserved Instances	Reserved Instances	Auto Scaling	Einsparungen von bis zu 90% im Vergleich zu Spezialprodukten DBs
Am besten geeignet für	Unternehmenssuche mit minimalem Einrichtungsaufwand	Abfragen mit hohem Durchsatz und niedriger Latenz	Hybride SQL- und Vektor-Workloads	MongoDB-kompatible Apps, die Vektoren benötigen	Apps in Echtzeit mit extrem niedriger Latenz	GraphRag und Wissensgraphen	Langfristige, kostengünstige Lagerung
Ideales Abfragemuster	Häufige Suchanfragen in Unternehmen	Hochfrequente Abfragen in Echtzeit	Gemischte SQL- und Vektorabfragen	Dokumentenabfragen mit semantischer Suche	Millionen von Anfragen pro Tag	Traversierungen mit Vektorsuche grafisch darstellen	Seltene Anfragen (Minuten bis Stunden)
Komplexität der Einrichtung	Niedrig (vollständig verwaltet)	Mittel (Clusterkonfiguration)	Mittel (Erweiterungs-Setup)	Mittel (Clusterkonfiguration)	Mittel (Clusterkonfiguration)	Niedrig (vollständig verwaltet)	Niedrig (serverlos)
Fachwissen des Teams erforderlich	Minimal	OpenSearch oder Elasticsearch	PostgreSQL, SQL	MongoDB	Redis	Graph-Datenbanken	Amazon S3, grundlegende Vektorkonzepte

Verwalteter Service — Amazon Bedrock Knowledge Bases

Amazon Bedrock Knowledge Bases bietet eine vollständig verwaltete Lösung mit mehreren Vektorspeicheroptionen. In der folgenden Tabelle werden diese Speicheroptionen verglichen.

Merkmal	Aurora Postgre-Pvektor SQLwith	Neptun-Analytik	OpenSearch Serverloser Service	Amazon S3 S3-Vektoren	Tannenzapfen	RedisEnterprise Cloud
Primärer Anwendungsfall	Relationale Datenbank mit Vektor-RAG	Graphbasierte Vektorsuche für GraphRag	Wissensmanagement RAG	Kostenoptimierter Vektor-RAG	Hochleistungsfähige Vektorsuche	Vektorsuche im Speicher
Architektur	Vollständig verwaltetes relationales	Vollständig verwaltete Graphenanalysen	Vollständig verwaltetes, serverloses System	Serverloser Objektspeicher	Vollständig verwaltete Hybrid-Cloud	Vollständig verwalteter In-Memory-Speicher
Datenmodell	Relationale Tabellen	Eigenschaftsdiagramm	JSON-Dokumente	Objektspeicher	Speziell entwickelte Vektoren	Schlüsselwert mit Vektoren
Vektor-Speicher	Durch die Erweiterung pgvector	Native Graphvektoren	Durch den OpenSearch Motor	Nativer Amazon S3 S3-Vektorspeicher	Native Vektordatenbank	Vektoren im Speicher
Integration mit Amazon Bedrock	Nativ	Nativ	Nativ	Nativ	Nativ	Nativ
Automatische Einnahme	Ja (über Amazon Bedrock)	Ja (über Amazon Bedrock)	Ja (über Amazon Bedrock)	Ja (über Amazon Bedrock)	Ja (über Amazon Bedrock)	Ja (über Amazon Bedrock)
Automatische Vektorisierung	Ja (über Amazon Bedrock)	Ja (über Amazon Bedrock)	Ja (über Amazon Bedrock)	Ja (über Amazon Bedrock)	Ja (über Amazon Bedrock)	Ja (über Amazon Bedrock)
Skalierung	Automatische Skalierung (Aurora Serverless)	Automatische Skalierung von Diagrammen	Automatisch serverlos	Automatisch (Milliarden von Vektoren)	Automatische Skalierung von Pods	Automatische Skalierung von Clustern
Abfrageleistung	Hoch für relational oder vektoriell	Hoch für Graphvektoren	Hoch	Mittel (Latenz von 100 ms oder mehr)	Very high (Sehr hoch)	Very high (Sehr hoch)
Maximale Vektoren	Millionen (instanzabhängig)	Milliarden	Milliarden	2 Milliarden pro Index	Milliarden	Millionen (speicherabhängig)
Zusätzliche Funktionen	SQL-Abfragen, ACID-Transaktionen	Graphalgorithmen, Traversalen	Volltextsuche, Analytik	Amazon S3 S3-Lebenszyklus, Tiering	Filterung von Metadaten, Namespaces	Redis-Datenstrukturen, Caching
Kostenoptimierung	Moderat (Aurora Serverless)	Moderat (Kapazitätseinheiten)	Hoch (serverlos, pay-per-use)	Sehr hoch (Einsparungen von bis zu 90%)	Moderat (pod-basierte Preisgestaltung)	Niedrig (In-Memory-Premium)
Am besten geeignet für	Hybride Workloads SQL/vector	Verbundene Wissensgraphen	Volltext mit Vektorsuche	Langfristige Vektoren mit seltenem Zugriff	Vektorsuche in Echtzeit in großem Maßstab	Anforderungen an extrem niedrige Latenz
Ideales Abfragemuster	Gemischte SQL- und Vektorabfragen	Traversierungen mit Vektoren grafisch darstellen	Häufige Suchanfragen mit Analysen	Seltener Abruf (Minuten bis Stunden)	Hochfrequente Abfragen in Echtzeit	Millionen von Anfragen pro Sekunde
Einrichtung mit Amazon Bedrock	Einfach (verwaltet von Amazon Bedrock)	Einfach (verwaltet von Amazon Bedrock)	Einfach (verwaltet von Amazon Bedrock)	Einfach (verwaltet von Amazon Bedrock)	Einfach (verwaltet von Amazon Bedrock)	Einfach (verwaltet von Amazon Bedrock)
Datenresidenz	AWS-Regionen	AWS-Regionen	AWS-Regionen	AWS-Regionen	Multi-Cloud (AWS und andere)	Multi-Cloud (AWS und andere)
Preismodell	Stunden und Speicherplatz der Instanz	Kapazitätseinheiten und Speicherplatz	Rechenleistung und Speicher (serverlos)	Speicherung, Abfragen und Übertragung	Öffnungszeiten und Speicherplatz	Öffnungszeiten und Speicherplatz der Knoten

Wählen Sie zwischen individuellen und verwalteten Optionen

Überlegung	Wählen Sie eine individuelle Vektor-DB	Wählen Sie Amazon Bedrock Knowledge Bases (verwaltet)
RAG-Implementierung	Sie möchten die volle Kontrolle über die RAG-Pipeline	Sie möchten ein vollständig verwaltetes RAG mit minimalem Einrichtungsaufwand
Anpassung	Sie benötigen eine benutzerdefinierte Abruflogik und Vorverarbeitung	Standard-RAG-Muster erfüllen Ihre Anforderungen
Bestehende Infrastruktur	Sie haben die Datenbank bereits bereitgestellt	Sie fangen neu an oder wünschen sich eine vereinfachte Verwaltung
Fachwissen im Team	Ihr Team verfügt über Fachkenntnisse in der Datenbankadministration	Sie konzentrieren sich lieber auf die Anwendungslogik als auf die Infrastruktur
Komplexität der Integration	Sie benötigen eine tiefe Integration mit bestehenden Systemen	Sie möchten eine schnelle Integration mit Amazon Bedrock-Modellen
Operativer Overhead	Sie können Datenbankoperationen verwalten	Sie AWS möchten Operationen abwickeln
Kostenstruktur	Sie bevorzugen direkte Datenbankpreise	Sie bevorzugen eine einheitliche Amazon Bedrock-Preisgestaltung
Zeit bis zur Markteinführung	Sie haben Zeit für eine kundenspezifische Implementierung	Sie benötigen eine schnelle Bereitstellung

Warnung JavaScript ist in Ihrem Browser nicht verfügbar oder deaktiviert.

Zur Nutzung der AWS-Dokumentation muss JavaScript aktiviert sein. Weitere Informationen finden auf den Hilfe-Seiten Ihres Browsers.

Dokumentkonventionen

Vektor-Datenbankoptionen

Kostenvergleiche und Überlegungen