View a markdown version of this page

Vergleich von Vektordatenbanken - AWS Präskriptive Leitlinien

Die vorliegende Übersetzung wurde maschinell erstellt. Im Falle eines Konflikts oder eines Widerspruchs zwischen dieser übersetzten Fassung und der englischen Fassung (einschließlich infolge von Verzögerungen bei der Übersetzung) ist die englische Fassung maßgeblich.

Vergleich von Vektordatenbanken

AWS bietet mehrere Ansätze zur Implementierung von Vektorsuchfunktionen, die von einzelnen Vektordatenbanken bis hin zu Amazon Bedrock Knowledge Bases, einem vollständig verwalteten Service, reichen. Bei der Bewertung dieser Optionen müssen Unternehmen verschiedene Aspekte berücksichtigen, darunter Architektur, Skalierbarkeit, Integrationsmöglichkeiten, Leistungsmerkmale und Sicherheitsmerkmale.

Individuelle Vektordatenbanken

Die folgende Tabelle bietet einen Überblick über die wichtigsten Funktionen verschiedener AWS individueller Vektordatenbanklösungen, wobei der Schwerpunkt auf deren Architekturen, Skalierungsmöglichkeiten, Datenquellenintegrationen und Leistungsmerkmalen liegt.

Merkmal

Amazon Kendra

OpenSearch Amazon-Dienst

Amazon RDS für Postgre-Pvvector SQLwith

Amazon DocumentDB

Amazon MemoryDB

Amazon Neptune Analytics

Amazon S3 Vectors

Primärer Anwendungsfall

Unternehmenssuche und RAG

Verteilte Suche und Analytik

Relationale Datenbank mit Vektorunterstützung

Dokumenten-Datenbank mit Vektorsuche

Vektorsuche im Speicher in Echtzeit

Graphanalyse mit Vektorsuche

Kostenoptimierter Vektorspeicher

Architektur

Vollständig verwaltet

Verteilter Cluster

Relationale Datenbank

Dokumentenorientiert

In-Memory-Datenbanken

Graph-Analyse-Engine

Serverloser Objektspeicher

Datenmodell

Dokumentenbasiert

JSON-Dokumente

Relationale Tabellen

JSON-Dokumente

Schlüsselwert mit JSON

Eigenschaftsdiagramm

Objektspeicher

Abmessungen von Vektoren

Automatisch verwaltet

Bis zu 16.000

Konfigurierbar

Bis zu 2.000 (indexiert); 16.000 (nicht indexiert)

Bis zu 32.768

Konfigurierbar

Bis zu 4.096

Methoden zur Indizierung

Automatisch

HNSW, IVF

HNSW, IVFFlat

HNSW, IVFFlat

HNSW

Nativer Graph und Vektor

Automatisch

Entfernungsmetriken

Automatisch

Kosinus, Euklidisch, Punktprodukt

Kosinus, Euklidisch, inneres Produkt

Kosinus, Euklidisch, Punktprodukt

Kosinus, Euklidisch, inneres Produkt

Kosinus, Euklidisch

Kosinus, Euklidisch

Latenz bei Abfragen

In weniger als einer Sekunde

Unter 10 ms (GPU-beschleunigt)

10-100 ms

Millisekunde

Submillisekunde

In weniger als einer Sekunde

Unter 100 ms

Skalierungsmodell

Automatisch

Horizontal (Knoten hinzufügen)

Vertikale und lesbare Repliken

Horizontal (Instanzen hinzufügen)

Vertikal und Replikate

Automatisch

Automatisch (serverlos)

Maximale Anzahl von Vektoren

Verwaltet

Milliarden (clusterabhängig)

Millionen (instanzabhängig)

Millionen pro Sammlung

Millionen pro Datenbank

Milliarden

2 Milliarden pro Index; 10.000 Indizes pro Bereich

Durchsatz

Hoch

Sehr hoch (Tausende von QPS)

Medium

Hoch

Sehr hoch (Millionen von Anfragen pro Tag)

Hoch

Mittel (optimiert für seltene Abfragen)

Lebensdauer von Daten

99,999999999 % (11x9)

Konfigurierbar mit Replikaten

99,99% (Multi-AZ)

99,99% (Multi-AZ)

99,99% (Multi-AZ)

99,99 %

99,999999999 % (11x9)

Konsistenzmodell

Eventuell

Eventual (konfigurierbar)

Stark (ACID)

Irgendwann

Stark

Stark

Stark

Zusätzliche Funktionen

40 oder mehr Datenanschlüsse, NLP

Volltextsuche, Analytik, Dashboards

SQL-Abfragen, ACID-Transaktionen

MongoDB-API-Kompatibilität

Redis-API-Kompatibilität, Caching

Graphalgorithmen, Traversalen

Amazon S3 S3-Integration, Lebenszyklusrichtlinien

Preismodell

Zahlen Sie pro Anfrage und Speicherplatz

Stunden und Speicherplatz der Instanz

Stunden und Speicherplatz der Instanz

Stunden und Speicherplatz der Instanz

Stunden und Speicherplatz der Instanz

Kapazitätseinheiten und Speicherplatz

Speicherung, Abfragen und Datenübertragung

Kostenoptimierung

Nutzungsbasiert

Reservierte Instances, auto-scaling

Reservierte Instanzen, Aurora Serverless

Reserved Instances

Reserved Instances

Auto Scaling

Einsparungen von bis zu 90% im Vergleich zu Spezialprodukten DBs

Am besten geeignet für

Unternehmenssuche mit minimalem Einrichtungsaufwand

Abfragen mit hohem Durchsatz und niedriger Latenz

Hybride SQL- und Vektor-Workloads

MongoDB-kompatible Apps, die Vektoren benötigen

Apps in Echtzeit mit extrem niedriger Latenz

GraphRag und Wissensgraphen

Langfristige, kostengünstige Lagerung

Ideales Abfragemuster

Häufige Suchanfragen in Unternehmen

Hochfrequente Abfragen in Echtzeit

Gemischte SQL- und Vektorabfragen

Dokumentenabfragen mit semantischer Suche

Millionen von Anfragen pro Tag

Traversierungen mit Vektorsuche grafisch darstellen

Seltene Anfragen (Minuten bis Stunden)

Komplexität der Einrichtung

Niedrig (vollständig verwaltet)

Mittel (Clusterkonfiguration)

Mittel (Erweiterungs-Setup)

Mittel (Clusterkonfiguration)

Mittel (Clusterkonfiguration)

Niedrig (vollständig verwaltet)

Niedrig (serverlos)

Fachwissen des Teams erforderlich

Minimal

OpenSearch oder Elasticsearch

PostgreSQL, SQL

MongoDB

Redis

Graph-Datenbanken

Amazon S3, grundlegende Vektorkonzepte

Verwalteter Service — Amazon Bedrock Knowledge Bases

Amazon Bedrock Knowledge Bases bietet eine vollständig verwaltete Lösung mit mehreren Vektorspeicheroptionen. In der folgenden Tabelle werden diese Speicheroptionen verglichen.

Merkmal

Aurora Postgre-Pvektor SQLwith

Neptun-Analytik

OpenSearch Serverloser Service

Amazon S3 S3-Vektoren

Tannenzapfen

RedisEnterprise Cloud

Primärer Anwendungsfall

Relationale Datenbank mit Vektor-RAG

Graphbasierte Vektorsuche für GraphRag

Wissensmanagement RAG

Kostenoptimierter Vektor-RAG

Hochleistungsfähige Vektorsuche

Vektorsuche im Speicher

Architektur

Vollständig verwaltetes relationales

Vollständig verwaltete Graphenanalysen

Vollständig verwaltetes, serverloses System

Serverloser Objektspeicher

Vollständig verwaltete Hybrid-Cloud

Vollständig verwalteter In-Memory-Speicher

Datenmodell

Relationale Tabellen

Eigenschaftsdiagramm

JSON-Dokumente

Objektspeicher

Speziell entwickelte Vektoren

Schlüsselwert mit Vektoren

Vektor-Speicher

Durch die Erweiterung pgvector

Native Graphvektoren

Durch den OpenSearch Motor

Nativer Amazon S3 S3-Vektorspeicher

Native Vektordatenbank

Vektoren im Speicher

Integration mit Amazon Bedrock

Nativ

Nativ

Nativ

Nativ

Nativ

Nativ

Automatische Einnahme

Ja (über Amazon Bedrock)

Ja (über Amazon Bedrock)

Ja (über Amazon Bedrock)

Ja (über Amazon Bedrock)

Ja (über Amazon Bedrock)

Ja (über Amazon Bedrock)

Automatische Vektorisierung

Ja (über Amazon Bedrock)

Ja (über Amazon Bedrock)

Ja (über Amazon Bedrock)

Ja (über Amazon Bedrock)

Ja (über Amazon Bedrock)

Ja (über Amazon Bedrock)

Skalierung

Automatische Skalierung (Aurora Serverless)

Automatische Skalierung von Diagrammen

Automatisch serverlos

Automatisch (Milliarden von Vektoren)

Automatische Skalierung von Pods

Automatische Skalierung von Clustern

Abfrageleistung

Hoch für relational oder vektoriell

Hoch für Graphvektoren

Hoch

Mittel (Latenz von 100 ms oder mehr)

Very high (Sehr hoch)

Very high (Sehr hoch)

Maximale Vektoren

Millionen (instanzabhängig)

Milliarden

Milliarden

2 Milliarden pro Index

Milliarden

Millionen (speicherabhängig)

Zusätzliche Funktionen

SQL-Abfragen, ACID-Transaktionen

Graphalgorithmen, Traversalen

Volltextsuche, Analytik

Amazon S3 S3-Lebenszyklus, Tiering

Filterung von Metadaten, Namespaces

Redis-Datenstrukturen, Caching

Kostenoptimierung

Moderat (Aurora Serverless)

Moderat (Kapazitätseinheiten)

Hoch (serverlos, pay-per-use)

Sehr hoch (Einsparungen von bis zu 90%)

Moderat (pod-basierte Preisgestaltung)

Niedrig (In-Memory-Premium)

Am besten geeignet für

Hybride Workloads SQL/vector

Verbundene Wissensgraphen

Volltext mit Vektorsuche

Langfristige Vektoren mit seltenem Zugriff

Vektorsuche in Echtzeit in großem Maßstab

Anforderungen an extrem niedrige Latenz

Ideales Abfragemuster

Gemischte SQL- und Vektorabfragen

Traversierungen mit Vektoren grafisch darstellen

Häufige Suchanfragen mit Analysen

Seltener Abruf (Minuten bis Stunden)

Hochfrequente Abfragen in Echtzeit

Millionen von Anfragen pro Sekunde

Einrichtung mit Amazon Bedrock

Einfach (verwaltet von Amazon Bedrock)

Einfach (verwaltet von Amazon Bedrock)

Einfach (verwaltet von Amazon Bedrock)

Einfach (verwaltet von Amazon Bedrock)

Einfach (verwaltet von Amazon Bedrock)

Einfach (verwaltet von Amazon Bedrock)

Datenresidenz

AWS-Regionen

AWS-Regionen

AWS-Regionen

AWS-Regionen

Multi-Cloud (AWS und andere)

Multi-Cloud (AWS und andere)

Preismodell

Stunden und Speicherplatz der Instanz

Kapazitätseinheiten und Speicherplatz

Rechenleistung und Speicher (serverlos)

Speicherung, Abfragen und Übertragung

Öffnungszeiten und Speicherplatz

Öffnungszeiten und Speicherplatz der Knoten

Wählen Sie zwischen individuellen und verwalteten Optionen

Überlegung

Wählen Sie eine individuelle Vektor-DB

Wählen Sie Amazon Bedrock Knowledge Bases (verwaltet)

RAG-Implementierung

Sie möchten die volle Kontrolle über die RAG-Pipeline

Sie möchten ein vollständig verwaltetes RAG mit minimalem Einrichtungsaufwand

Anpassung

Sie benötigen eine benutzerdefinierte Abruflogik und Vorverarbeitung

Standard-RAG-Muster erfüllen Ihre Anforderungen

Bestehende Infrastruktur

Sie haben die Datenbank bereits bereitgestellt

Sie fangen neu an oder wünschen sich eine vereinfachte Verwaltung

Fachwissen im Team

Ihr Team verfügt über Fachkenntnisse in der Datenbankadministration

Sie konzentrieren sich lieber auf die Anwendungslogik als auf die Infrastruktur

Komplexität der Integration

Sie benötigen eine tiefe Integration mit bestehenden Systemen

Sie möchten eine schnelle Integration mit Amazon Bedrock-Modellen

Operativer Overhead

Sie können Datenbankoperationen verwalten

Sie AWS möchten Operationen abwickeln

Kostenstruktur

Sie bevorzugen direkte Datenbankpreise

Sie bevorzugen eine einheitliche Amazon Bedrock-Preisgestaltung

Zeit bis zur Markteinführung

Sie haben Zeit für eine kundenspezifische Implementierung

Sie benötigen eine schnelle Bereitstellung