View a markdown version of this page

Confronto tra database vettoriali - AWS Guida prescrittiva

Le traduzioni sono generate tramite traduzione automatica. In caso di conflitto tra il contenuto di una traduzione e la versione originale in Inglese, quest'ultima prevarrà.

Confronto tra database vettoriali

AWS offre diversi approcci all'implementazione delle funzionalità di ricerca vettoriale, dai database vettoriali individuali alle Amazon Bedrock Knowledge Bases, un servizio completamente gestito. Nel valutare queste opzioni, le organizzazioni devono considerare vari aspetti, tra cui architettura, scalabilità, capacità di integrazione, caratteristiche prestazionali e caratteristiche di sicurezza.

Database vettoriali individuali

La tabella seguente fornisce una panoramica delle funzionalità chiave di diverse soluzioni di database vettoriali AWS individuali, con particolare attenzione alle architetture, alle capacità di scalabilità, alle integrazioni delle fonti di dati e alle caratteristiche prestazionali.

Funzionalità

Amazon Kendra

OpenSearch Servizio Amazon

Amazon RDS per SQLwith Postgre pgvector

Amazon DocumentDB

Amazon MemoryDB

Analisi di Amazon Neptune

Amazon S3 Vectors

Caso d'uso principale

Ricerca aziendale e RAG

Ricerca e analisi distribuite

DB relazionale con supporto vettoriale

DB di documenti con ricerca vettoriale

Ricerca vettoriale in memoria in tempo reale

Analisi grafica con ricerca vettoriale

Archiviazione vettoriale ottimizzata in termini di costi

Architecture

Servizio completamente gestito

Cluster distribuito

Database relazionale

Orientato ai documenti

Database in memoria

Motore di analisi grafica

Storage di oggetti senza server

Modello di dati

Basato su documenti

Documenti JSON

Tabelle relazionali

Documenti JSON

Valore-chiave con JSON

Grafico delle proprietà

Archiviazione di oggetti

Dimensioni vettoriali

Gestito automaticamente

Fino a 16.000

Configurabile

Fino a 2.000 (indicizzati); 16.000 (non indicizzati)

Fino a 32.768

Configurabile

Fino a 4.096

Metodi di indicizzazione

Automatica

HNSW, IVF

HNSW, IVFFlat

NSW, IVFFlat

HNSW

Grafico e vettore nativi

Automatica

Metriche della distanza

Automatica

Coseno, euclideo, prodotto a punti

Coseno, euclideo, prodotto interno

Coseno, euclideo, prodotto a punti

Coseno, euclideo, prodotto interno

Coseno, euclideo

Coseno, euclideo

Latenza delle interrogazioni

Frazioni di secondo

Meno di 10 ms (accelerato da GPU)

10-100 ms

Millisecondi

Meno di millisecondo

Frazioni di secondo

Meno di 100 ms

Modello di ridimensionamento

Automatica

Orizzontale (aggiungi nodi)

Repliche verticali e lette

Orizzontale (aggiungi istanze)

Verticale e repliche

Automatica

Automatico (senza server)

Numero massimo di vettori

Gestiti

Miliardi (a seconda del cluster)

Milioni (a seconda dell'istanza)

Milioni per collezione

Milioni per database

Miliardi

2 miliardi per indice; 10.000 indici per bucket

Throughput

Elevata

Molto alto (migliaia di QPS)

Media

Elevata

Molto alto (milioni di richieste al giorno)

Elevata

Medio (ottimizzato per richieste poco frequenti)

Durabilità dei dati

99,999999999% (11 9 s)

Configurabile con repliche

99,99% (Multi-AZ)

99,99% (Multi-AZ)

99,99% (Multi-AZ)

99,99%

99,999999999% (11 9 s)

Modello di coerenza

Eventuale

Eventuale (configurabile)

Forte (ACIDO)

Eventuale

Forte

Forte

Forte

Funzionalità aggiuntive

40 o più connettori dati, NLP

Ricerca nel testo completo, analisi, dashboard

Interrogazioni SQL, transazioni ACID

Compatibilità con le API MongoDB

Compatibilità con le API Redis, memorizzazione nella cache

Algoritmi grafici, traversi

Integrazione con Amazon S3 e politiche del ciclo di vita

Modello tariffario

Pagamento in base alle richieste e allo storage

Ore e spazio di archiviazione delle istanze

Ore e archiviazione delle istanze

Ore e archiviazione delle istanze

Ore e archiviazione delle istanze

Unità di capacità e storage

Archiviazione, interrogazioni e trasferimento dati

Ottimizzazione dei costi

Basato sull'utilizzo

Istanze riservate, auto-scaling

Istanze riservate, Aurora Serverless

Istanze riservate

Istanze riservate

Dimensionamento automatico

Fino al 90% di risparmio rispetto alle soluzioni specializzate DBs

Ideale per

Ricerca aziendale con configurazione minima

Query ad alta velocità e bassa latenza

Carichi di lavoro SQL e vettoriali ibridi

App compatibili con MongoDB che necessitano di vettori

App in tempo reale con latenza ultra bassa

GraphRag e grafici della conoscenza

Storage a lungo termine ed economico

Modello di interrogazione ideale

Ricerche aziendali frequenti

Interrogazioni in tempo reale ad alta frequenza

Interrogazioni SQL e vettoriali miste

Interrogazioni documentali con ricerca semantica

Milioni di richieste al giorno

Rappresenta graficamente le traversate con la ricerca vettoriale

Domande poco frequenti (da minuti a ore)

Complessità della configurazione

Bassa (completamente gestita)

Medio (configurazione del cluster)

Medio (configurazione dell'estensione)

Medio (configurazione del cluster)

Medio (configurazione del cluster)

Basso (completamente gestito)

Basso (senza server)

È richiesta l'esperienza del team

Minima

OpenSearch o Elasticsearch

PostgreSQL, SQL

MongoDB

Redis

Database grafici

Amazon S3, concetti vettoriali di base

Servizio gestito — Amazon Bedrock Knowledge Bases

Amazon Bedrock Knowledge Bases offre una soluzione completamente gestita con diverse opzioni di storage vettoriale. La tabella seguente confronta queste opzioni di storage.

Funzionalità

Immagine vettoriale Aurora Poster SQLwith

Analisi di Neptune

OpenSearch Servizio serverless

Vettori Amazon S3

Pigna

RedisEnterprise Cloud

Caso d'uso principale

DB relazionale con RAG vettoriale

Ricerca vettoriale basata su grafici per GraphRag

Gestione della conoscenza RAG

RAG vettoriale ottimizzato in termini di costi

Ricerca vettoriale ad alte prestazioni

Ricerca vettoriale in memoria

Architecture

Relazionale completamente gestito

Analisi grafica completamente gestita

Completamente gestita senza server

Storage di oggetti senza server

Cloud ibrido completamente gestito

In-memory completamente gestito

Modello di dati

Tabelle relazionali

Grafico delle proprietà

Documenti JSON

Archiviazione di oggetti

Vettori creati appositamente

Valore-chiave con vettori

Archiviazione vettoriale

Tramite l'estensione pgvector

Vettori grafici nativi

Tramite motore OpenSearch

Storage vettoriale Amazon S3 nativo

Database vettoriale nativo

Vettori in memoria

Integrazione con Amazon Bedrock

Nativo

Nativo

Nativo

Nativo

Nativo

Nativo

Ingestione automatica

Sì (tramite Amazon Bedrock)

Sì (tramite Amazon Bedrock)

Sì (tramite Amazon Bedrock)

Sì (tramite Amazon Bedrock)

Sì (tramite Amazon Bedrock)

Sì (tramite Amazon Bedrock)

Vettorizzazione automatica

Sì (tramite Amazon Bedrock)

Sì (tramite Amazon Bedrock)

Sì (tramite Amazon Bedrock)

Sì (tramite Amazon Bedrock)

Sì (tramite Amazon Bedrock)

Sì (tramite Amazon Bedrock)

Dimensionamento

Scalabilità automatica (Aurora Serverless)

Ridimensionamento automatico del grafico

Automatico senza server

Automatico (miliardi di vettori)

Pod con ridimensionamento automatico

Cluster con scalabilità automatica

Prestazioni delle query

Alto per valori relazionali o vettoriali

Alto per i vettori grafici

Elevata

Medio (latenza pari o superiore a 100 ms)

Molto alto

Molto alto

Vettori massimi

Milioni (a seconda dell'istanza)

Miliardi

Miliardi

2 miliardi per indice

Miliardi

Milioni (dipende dalla memoria)

Funzionalità aggiuntive

Interrogazioni SQL, transazioni ACID

Algoritmi grafici, traversi

Ricerca nel testo completo, analisi

Ciclo di vita di Amazon S3, suddivisione in più livelli

Filtraggio dei metadati, namespace

Strutture dati Redis, memorizzazione nella cache

Ottimizzazione dei costi

Moderato (Aurora Serverless)

Moderato (unità di capacità)

Alto (senza server, pay-per-use)

Molto alto (fino al 90% di risparmio)

Moderato (prezzi basati su pod)

Basso (prezzo in memoria premium)

Ideale per

Carichi di lavoro SQL/vector ibridi

Grafici della conoscenza connessi

Testo completo con ricerca vettoriale

Vettori a lungo termine ad accesso raro

Ricerca vettoriale in tempo reale su larga scala

Esigenze di latenza estremamente basse

Modello di interrogazione ideale

Interrogazioni SQL e vettoriali miste

Traverse grafiche con vettori

Ricerche frequenti con analisi

Recupero poco frequente (da minuti a ore)

Interrogazioni in tempo reale ad alta frequenza

Milioni di richieste al secondo

Configurazione con Amazon Bedrock

Semplice (gestito da Amazon Bedrock)

Semplice (gestito da Amazon Bedrock)

Semplice (gestito da Amazon Bedrock)

Semplice (gestito da Amazon Bedrock)

Semplice (gestito da Amazon Bedrock)

Semplice (gestito da Amazon Bedrock)

Residenza dei dati

Regioni AWS

Regioni AWS

Regioni AWS

Regioni AWS

Multi-cloud (AWS e altri)

Multi-cloud (AWS e altri)

Modello tariffario

Orari e spazio di archiviazione delle istanze

Unità di capacità e storage

Elaborazione e archiviazione (senza server)

Archiviazione, interrogazioni e trasferimento

Orari e spazio di archiviazione del pod

Ore e spazio di archiviazione dei nodi

Scelta tra opzioni individuali e gestite

Considerazione

Scegli DB vettoriali individuali

Scegli Amazon Bedrock Knowledge Base (gestite)

Implementazione RAG

Vuoi il pieno controllo sulla pipeline RAG

Volete un RAG completamente gestito con una configurazione minima

Personalizzazione

Sono necessarie una logica di recupero e una preelaborazione personalizzate

I pattern RAG standard soddisfano le tue esigenze

Infrastruttura esistente

Il database è già distribuito

Stai iniziando da zero o desideri una gestione semplificata

Esperienza del team

Il tuo team ha esperienza nell'amministrazione dei database

Preferisci concentrarti sulla logica delle applicazioni, non sull'infrastruttura

Complessità dell'integrazione

È necessaria una profonda integrazione con i sistemi esistenti

Desideri un'integrazione rapida con i modelli Amazon Bedrock

Sovraccarico operativo

È possibile gestire le operazioni del database

Vuoi AWS gestire le operazioni

Struttura dei costi

Preferisci la tariffazione diretta dei database

Preferisci i prezzi unificati di Amazon Bedrock

È ora di commercializzare

Hai tempo per l'implementazione personalizzata

Hai bisogno di un'implementazione rapida