Database vettoriali individuali Servizio gestito — Amazon Bedrock Knowledge Bases Scelta tra opzioni individuali e gestite

Confronto tra database vettoriali

AWS offre diversi approcci all'implementazione delle funzionalità di ricerca vettoriale, dai database vettoriali individuali alle Amazon Bedrock Knowledge Bases, un servizio completamente gestito. Nel valutare queste opzioni, le organizzazioni devono considerare vari aspetti, tra cui architettura, scalabilità, capacità di integrazione, caratteristiche prestazionali e caratteristiche di sicurezza.

Database vettoriali individuali

La tabella seguente fornisce una panoramica delle funzionalità chiave di diverse soluzioni di database vettoriali AWS individuali, con particolare attenzione alle architetture, alle capacità di scalabilità, alle integrazioni delle fonti di dati e alle caratteristiche prestazionali.

Funzionalità	Amazon Kendra	OpenSearch Servizio Amazon	Amazon RDS per SQLwith Postgre pgvector	Amazon DocumentDB	Amazon MemoryDB	Analisi di Amazon Neptune	Amazon S3 Vectors
Caso d'uso principale	Ricerca aziendale e RAG	Ricerca e analisi distribuite	DB relazionale con supporto vettoriale	DB di documenti con ricerca vettoriale	Ricerca vettoriale in memoria in tempo reale	Analisi grafica con ricerca vettoriale	Archiviazione vettoriale ottimizzata in termini di costi
Architecture	Servizio completamente gestito	Cluster distribuito	Database relazionale	Orientato ai documenti	Database in memoria	Motore di analisi grafica	Storage di oggetti senza server
Modello di dati	Basato su documenti	Documenti JSON	Tabelle relazionali	Documenti JSON	Valore-chiave con JSON	Grafico delle proprietà	Archiviazione di oggetti
Dimensioni vettoriali	Gestito automaticamente	Fino a 16.000	Configurabile	Fino a 2.000 (indicizzati); 16.000 (non indicizzati)	Fino a 32.768	Configurabile	Fino a 4.096
Metodi di indicizzazione	Automatica	HNSW, IVF	HNSW, IVFFlat	NSW, IVFFlat	HNSW	Grafico e vettore nativi	Automatica
Metriche della distanza	Automatica	Coseno, euclideo, prodotto a punti	Coseno, euclideo, prodotto interno	Coseno, euclideo, prodotto a punti	Coseno, euclideo, prodotto interno	Coseno, euclideo	Coseno, euclideo
Latenza delle interrogazioni	Frazioni di secondo	Meno di 10 ms (accelerato da GPU)	10-100 ms	Millisecondi	Meno di millisecondo	Frazioni di secondo	Meno di 100 ms
Modello di ridimensionamento	Automatica	Orizzontale (aggiungi nodi)	Repliche verticali e lette	Orizzontale (aggiungi istanze)	Verticale e repliche	Automatica	Automatico (senza server)
Numero massimo di vettori	Gestiti	Miliardi (a seconda del cluster)	Milioni (a seconda dell'istanza)	Milioni per collezione	Milioni per database	Miliardi	2 miliardi per indice; 10.000 indici per bucket
Throughput	Elevata	Molto alto (migliaia di QPS)	Media	Elevata	Molto alto (milioni di richieste al giorno)	Elevata	Medio (ottimizzato per richieste poco frequenti)
Durabilità dei dati	99,999999999% (11 9 s)	Configurabile con repliche	99,99% (Multi-AZ)	99,99% (Multi-AZ)	99,99% (Multi-AZ)	99,99%	99,999999999% (11 9 s)
Modello di coerenza	Eventuale	Eventuale (configurabile)	Forte (ACIDO)	Eventuale	Forte	Forte	Forte
Funzionalità aggiuntive	40 o più connettori dati, NLP	Ricerca nel testo completo, analisi, dashboard	Interrogazioni SQL, transazioni ACID	Compatibilità con le API MongoDB	Compatibilità con le API Redis, memorizzazione nella cache	Algoritmi grafici, traversi	Integrazione con Amazon S3 e politiche del ciclo di vita
Modello tariffario	Pagamento in base alle richieste e allo storage	Ore e spazio di archiviazione delle istanze	Ore e archiviazione delle istanze	Ore e archiviazione delle istanze	Ore e archiviazione delle istanze	Unità di capacità e storage	Archiviazione, interrogazioni e trasferimento dati
Ottimizzazione dei costi	Basato sull'utilizzo	Istanze riservate, auto-scaling	Istanze riservate, Aurora Serverless	Istanze riservate	Istanze riservate	Dimensionamento automatico	Fino al 90% di risparmio rispetto alle soluzioni specializzate DBs
Ideale per	Ricerca aziendale con configurazione minima	Query ad alta velocità e bassa latenza	Carichi di lavoro SQL e vettoriali ibridi	App compatibili con MongoDB che necessitano di vettori	App in tempo reale con latenza ultra bassa	GraphRag e grafici della conoscenza	Storage a lungo termine ed economico
Modello di interrogazione ideale	Ricerche aziendali frequenti	Interrogazioni in tempo reale ad alta frequenza	Interrogazioni SQL e vettoriali miste	Interrogazioni documentali con ricerca semantica	Milioni di richieste al giorno	Rappresenta graficamente le traversate con la ricerca vettoriale	Domande poco frequenti (da minuti a ore)
Complessità della configurazione	Bassa (completamente gestita)	Medio (configurazione del cluster)	Medio (configurazione dell'estensione)	Medio (configurazione del cluster)	Medio (configurazione del cluster)	Basso (completamente gestito)	Basso (senza server)
È richiesta l'esperienza del team	Minima	OpenSearch o Elasticsearch	PostgreSQL, SQL	MongoDB	Redis	Database grafici	Amazon S3, concetti vettoriali di base

Servizio gestito — Amazon Bedrock Knowledge Bases

Amazon Bedrock Knowledge Bases offre una soluzione completamente gestita con diverse opzioni di storage vettoriale. La tabella seguente confronta queste opzioni di storage.

Funzionalità	Immagine vettoriale Aurora Poster SQLwith	Analisi di Neptune	OpenSearch Servizio serverless	Vettori Amazon S3	Pigna	RedisEnterprise Cloud
Caso d'uso principale	DB relazionale con RAG vettoriale	Ricerca vettoriale basata su grafici per GraphRag	Gestione della conoscenza RAG	RAG vettoriale ottimizzato in termini di costi	Ricerca vettoriale ad alte prestazioni	Ricerca vettoriale in memoria
Architecture	Relazionale completamente gestito	Analisi grafica completamente gestita	Completamente gestita senza server	Storage di oggetti senza server	Cloud ibrido completamente gestito	In-memory completamente gestito
Modello di dati	Tabelle relazionali	Grafico delle proprietà	Documenti JSON	Archiviazione di oggetti	Vettori creati appositamente	Valore-chiave con vettori
Archiviazione vettoriale	Tramite l'estensione pgvector	Vettori grafici nativi	Tramite motore OpenSearch	Storage vettoriale Amazon S3 nativo	Database vettoriale nativo	Vettori in memoria
Integrazione con Amazon Bedrock	Nativo	Nativo	Nativo	Nativo	Nativo	Nativo
Ingestione automatica	Sì (tramite Amazon Bedrock)	Sì (tramite Amazon Bedrock)	Sì (tramite Amazon Bedrock)	Sì (tramite Amazon Bedrock)	Sì (tramite Amazon Bedrock)	Sì (tramite Amazon Bedrock)
Vettorizzazione automatica	Sì (tramite Amazon Bedrock)	Sì (tramite Amazon Bedrock)	Sì (tramite Amazon Bedrock)	Sì (tramite Amazon Bedrock)	Sì (tramite Amazon Bedrock)	Sì (tramite Amazon Bedrock)
Dimensionamento	Scalabilità automatica (Aurora Serverless)	Ridimensionamento automatico del grafico	Automatico senza server	Automatico (miliardi di vettori)	Pod con ridimensionamento automatico	Cluster con scalabilità automatica
Prestazioni delle query	Alto per valori relazionali o vettoriali	Alto per i vettori grafici	Elevata	Medio (latenza pari o superiore a 100 ms)	Molto alto	Molto alto
Vettori massimi	Milioni (a seconda dell'istanza)	Miliardi	Miliardi	2 miliardi per indice	Miliardi	Milioni (dipende dalla memoria)
Funzionalità aggiuntive	Interrogazioni SQL, transazioni ACID	Algoritmi grafici, traversi	Ricerca nel testo completo, analisi	Ciclo di vita di Amazon S3, suddivisione in più livelli	Filtraggio dei metadati, namespace	Strutture dati Redis, memorizzazione nella cache
Ottimizzazione dei costi	Moderato (Aurora Serverless)	Moderato (unità di capacità)	Alto (senza server, pay-per-use)	Molto alto (fino al 90% di risparmio)	Moderato (prezzi basati su pod)	Basso (prezzo in memoria premium)
Ideale per	Carichi di lavoro SQL/vector ibridi	Grafici della conoscenza connessi	Testo completo con ricerca vettoriale	Vettori a lungo termine ad accesso raro	Ricerca vettoriale in tempo reale su larga scala	Esigenze di latenza estremamente basse
Modello di interrogazione ideale	Interrogazioni SQL e vettoriali miste	Traverse grafiche con vettori	Ricerche frequenti con analisi	Recupero poco frequente (da minuti a ore)	Interrogazioni in tempo reale ad alta frequenza	Milioni di richieste al secondo
Configurazione con Amazon Bedrock	Semplice (gestito da Amazon Bedrock)	Semplice (gestito da Amazon Bedrock)	Semplice (gestito da Amazon Bedrock)	Semplice (gestito da Amazon Bedrock)	Semplice (gestito da Amazon Bedrock)	Semplice (gestito da Amazon Bedrock)
Residenza dei dati	Regioni AWS	Regioni AWS	Regioni AWS	Regioni AWS	Multi-cloud (AWS e altri)	Multi-cloud (AWS e altri)
Modello tariffario	Orari e spazio di archiviazione delle istanze	Unità di capacità e storage	Elaborazione e archiviazione (senza server)	Archiviazione, interrogazioni e trasferimento	Orari e spazio di archiviazione del pod	Ore e spazio di archiviazione dei nodi

Scelta tra opzioni individuali e gestite

Considerazione	Scegli DB vettoriali individuali	Scegli Amazon Bedrock Knowledge Base (gestite)
Implementazione RAG	Vuoi il pieno controllo sulla pipeline RAG	Volete un RAG completamente gestito con una configurazione minima
Personalizzazione	Sono necessarie una logica di recupero e una preelaborazione personalizzate	I pattern RAG standard soddisfano le tue esigenze
Infrastruttura esistente	Il database è già distribuito	Stai iniziando da zero o desideri una gestione semplificata
Esperienza del team	Il tuo team ha esperienza nell'amministrazione dei database	Preferisci concentrarti sulla logica delle applicazioni, non sull'infrastruttura
Complessità dell'integrazione	È necessaria una profonda integrazione con i sistemi esistenti	Desideri un'integrazione rapida con i modelli Amazon Bedrock
Sovraccarico operativo	È possibile gestire le operazioni del database	Vuoi AWS gestire le operazioni
Struttura dei costi	Preferisci la tariffazione diretta dei database	Preferisci i prezzi unificati di Amazon Bedrock
È ora di commercializzare	Hai tempo per l'implementazione personalizzata	Hai bisogno di un'implementazione rapida

Avvertimento JavaScript è disabilitato o non è disponibile nel tuo browser.

Per usare la documentazione AWS, JavaScript deve essere abilitato. Consulta le pagine della guida del browser per le istruzioni.

Convenzioni dei documenti

Opzioni del database vettoriale

Confronti e considerazioni sui costi