Le traduzioni sono generate tramite traduzione automatica. In caso di conflitto tra il contenuto di una traduzione e la versione originale in Inglese, quest'ultima prevarrà.
Confronto tra database vettoriali
AWS offre diversi approcci all'implementazione delle funzionalità di ricerca vettoriale, dai database vettoriali individuali alle Amazon Bedrock Knowledge Bases, un servizio completamente gestito. Nel valutare queste opzioni, le organizzazioni devono considerare vari aspetti, tra cui architettura, scalabilità, capacità di integrazione, caratteristiche prestazionali e caratteristiche di sicurezza.
Database vettoriali individuali
La tabella seguente fornisce una panoramica delle funzionalità chiave di diverse soluzioni di database vettoriali AWS individuali, con particolare attenzione alle architetture, alle capacità di scalabilità, alle integrazioni delle fonti di dati e alle caratteristiche prestazionali.
Funzionalità |
Amazon Kendra |
OpenSearch Servizio Amazon |
Amazon RDS per SQLwith Postgre pgvector |
Amazon DocumentDB |
Amazon MemoryDB |
Analisi di Amazon Neptune |
Amazon S3 Vectors |
|---|---|---|---|---|---|---|---|
Caso d'uso principale |
Ricerca aziendale e RAG |
Ricerca e analisi distribuite |
DB relazionale con supporto vettoriale |
DB di documenti con ricerca vettoriale |
Ricerca vettoriale in memoria in tempo reale |
Analisi grafica con ricerca vettoriale |
Archiviazione vettoriale ottimizzata in termini di costi |
Architecture |
Servizio completamente gestito |
Cluster distribuito |
Database relazionale |
Orientato ai documenti |
Database in memoria |
Motore di analisi grafica |
Storage di oggetti senza server |
Modello di dati |
Basato su documenti |
Documenti JSON |
Tabelle relazionali |
Documenti JSON |
Valore-chiave con JSON |
Grafico delle proprietà |
Archiviazione di oggetti |
Dimensioni vettoriali |
Gestito automaticamente |
Fino a 16.000 |
Configurabile |
Fino a 2.000 (indicizzati); 16.000 (non indicizzati) |
Fino a 32.768 |
Configurabile |
Fino a 4.096 |
Metodi di indicizzazione |
Automatica |
HNSW, IVF |
HNSW, IVFFlat |
NSW, IVFFlat |
HNSW |
Grafico e vettore nativi |
Automatica |
Metriche della distanza |
Automatica |
Coseno, euclideo, prodotto a punti |
Coseno, euclideo, prodotto interno |
Coseno, euclideo, prodotto a punti |
Coseno, euclideo, prodotto interno |
Coseno, euclideo |
Coseno, euclideo |
Latenza delle interrogazioni |
Frazioni di secondo |
Meno di 10 ms (accelerato da GPU) |
10-100 ms |
Millisecondi |
Meno di millisecondo |
Frazioni di secondo |
Meno di 100 ms |
Modello di ridimensionamento |
Automatica |
Orizzontale (aggiungi nodi) |
Repliche verticali e lette |
Orizzontale (aggiungi istanze) |
Verticale e repliche |
Automatica |
Automatico (senza server) |
Numero massimo di vettori |
Gestiti |
Miliardi (a seconda del cluster) |
Milioni (a seconda dell'istanza) |
Milioni per collezione |
Milioni per database |
Miliardi |
2 miliardi per indice; 10.000 indici per bucket |
Throughput |
Elevata |
Molto alto (migliaia di QPS) |
Media |
Elevata |
Molto alto (milioni di richieste al giorno) |
Elevata |
Medio (ottimizzato per richieste poco frequenti) |
Durabilità dei dati |
99,999999999% (11 9 s) |
Configurabile con repliche |
99,99% (Multi-AZ) |
99,99% (Multi-AZ) |
99,99% (Multi-AZ) |
99,99% |
99,999999999% (11 9 s) |
Modello di coerenza |
Eventuale |
Eventuale (configurabile) |
Forte (ACIDO) |
Eventuale |
Forte |
Forte |
Forte |
Funzionalità aggiuntive |
40 o più connettori dati, NLP |
Ricerca nel testo completo, analisi, dashboard |
Interrogazioni SQL, transazioni ACID |
Compatibilità con le API MongoDB |
Compatibilità con le API Redis, memorizzazione nella cache |
Algoritmi grafici, traversi |
Integrazione con Amazon S3 e politiche del ciclo di vita |
Modello tariffario |
Pagamento in base alle richieste e allo storage |
Ore e spazio di archiviazione delle istanze |
Ore e archiviazione delle istanze |
Ore e archiviazione delle istanze |
Ore e archiviazione delle istanze |
Unità di capacità e storage |
Archiviazione, interrogazioni e trasferimento dati |
Ottimizzazione dei costi |
Basato sull'utilizzo |
Istanze riservate, auto-scaling |
Istanze riservate, Aurora Serverless |
Istanze riservate |
Istanze riservate |
Dimensionamento automatico |
Fino al 90% di risparmio rispetto alle soluzioni specializzate DBs |
Ideale per |
Ricerca aziendale con configurazione minima |
Query ad alta velocità e bassa latenza |
Carichi di lavoro SQL e vettoriali ibridi |
App compatibili con MongoDB che necessitano di vettori |
App in tempo reale con latenza ultra bassa |
GraphRag e grafici della conoscenza |
Storage a lungo termine ed economico |
Modello di interrogazione ideale |
Ricerche aziendali frequenti |
Interrogazioni in tempo reale ad alta frequenza |
Interrogazioni SQL e vettoriali miste |
Interrogazioni documentali con ricerca semantica |
Milioni di richieste al giorno |
Rappresenta graficamente le traversate con la ricerca vettoriale |
Domande poco frequenti (da minuti a ore) |
Complessità della configurazione |
Bassa (completamente gestita) |
Medio (configurazione del cluster) |
Medio (configurazione dell'estensione) |
Medio (configurazione del cluster) |
Medio (configurazione del cluster) |
Basso (completamente gestito) |
Basso (senza server) |
È richiesta l'esperienza del team |
Minima |
OpenSearch o Elasticsearch |
PostgreSQL, SQL |
MongoDB |
Redis |
Database grafici |
Amazon S3, concetti vettoriali di base |
Servizio gestito — Amazon Bedrock Knowledge Bases
Amazon Bedrock Knowledge Bases offre una soluzione completamente gestita con diverse opzioni di storage vettoriale. La tabella seguente confronta queste opzioni di storage.
Funzionalità |
Immagine vettoriale Aurora Poster SQLwith |
Analisi di Neptune |
OpenSearch Servizio serverless |
Vettori Amazon S3 |
Pigna |
RedisEnterprise Cloud |
|---|---|---|---|---|---|---|
Caso d'uso principale |
DB relazionale con RAG vettoriale |
Ricerca vettoriale basata su grafici per GraphRag |
Gestione della conoscenza RAG |
RAG vettoriale ottimizzato in termini di costi |
Ricerca vettoriale ad alte prestazioni |
Ricerca vettoriale in memoria |
Architecture |
Relazionale completamente gestito |
Analisi grafica completamente gestita |
Completamente gestita senza server |
Storage di oggetti senza server |
Cloud ibrido completamente gestito |
In-memory completamente gestito |
Modello di dati |
Tabelle relazionali |
Grafico delle proprietà |
Documenti JSON |
Archiviazione di oggetti |
Vettori creati appositamente |
Valore-chiave con vettori |
Archiviazione vettoriale |
Tramite l'estensione pgvector |
Vettori grafici nativi |
Tramite motore OpenSearch |
Storage vettoriale Amazon S3 nativo |
Database vettoriale nativo |
Vettori in memoria |
Integrazione con Amazon Bedrock |
Nativo |
Nativo |
Nativo |
Nativo |
Nativo |
Nativo |
Ingestione automatica |
Sì (tramite Amazon Bedrock) |
Sì (tramite Amazon Bedrock) |
Sì (tramite Amazon Bedrock) |
Sì (tramite Amazon Bedrock) |
Sì (tramite Amazon Bedrock) |
Sì (tramite Amazon Bedrock) |
Vettorizzazione automatica |
Sì (tramite Amazon Bedrock) |
Sì (tramite Amazon Bedrock) |
Sì (tramite Amazon Bedrock) |
Sì (tramite Amazon Bedrock) |
Sì (tramite Amazon Bedrock) |
Sì (tramite Amazon Bedrock) |
Dimensionamento |
Scalabilità automatica (Aurora Serverless) |
Ridimensionamento automatico del grafico |
Automatico senza server |
Automatico (miliardi di vettori) |
Pod con ridimensionamento automatico |
Cluster con scalabilità automatica |
Prestazioni delle query |
Alto per valori relazionali o vettoriali |
Alto per i vettori grafici |
Elevata |
Medio (latenza pari o superiore a 100 ms) |
Molto alto |
Molto alto |
Vettori massimi |
Milioni (a seconda dell'istanza) |
Miliardi |
Miliardi |
2 miliardi per indice |
Miliardi |
Milioni (dipende dalla memoria) |
Funzionalità aggiuntive |
Interrogazioni SQL, transazioni ACID |
Algoritmi grafici, traversi |
Ricerca nel testo completo, analisi |
Ciclo di vita di Amazon S3, suddivisione in più livelli |
Filtraggio dei metadati, namespace |
Strutture dati Redis, memorizzazione nella cache |
Ottimizzazione dei costi |
Moderato (Aurora Serverless) |
Moderato (unità di capacità) |
Alto (senza server, pay-per-use) |
Molto alto (fino al 90% di risparmio) |
Moderato (prezzi basati su pod) |
Basso (prezzo in memoria premium) |
Ideale per |
Carichi di lavoro SQL/vector ibridi |
Grafici della conoscenza connessi |
Testo completo con ricerca vettoriale |
Vettori a lungo termine ad accesso raro |
Ricerca vettoriale in tempo reale su larga scala |
Esigenze di latenza estremamente basse |
Modello di interrogazione ideale |
Interrogazioni SQL e vettoriali miste |
Traverse grafiche con vettori |
Ricerche frequenti con analisi |
Recupero poco frequente (da minuti a ore) |
Interrogazioni in tempo reale ad alta frequenza |
Milioni di richieste al secondo |
Configurazione con Amazon Bedrock |
Semplice (gestito da Amazon Bedrock) |
Semplice (gestito da Amazon Bedrock) |
Semplice (gestito da Amazon Bedrock) |
Semplice (gestito da Amazon Bedrock) |
Semplice (gestito da Amazon Bedrock) |
Semplice (gestito da Amazon Bedrock) |
Residenza dei dati |
Regioni AWS |
Regioni AWS |
Regioni AWS |
Regioni AWS |
Multi-cloud (AWS e altri) |
Multi-cloud (AWS e altri) |
Modello tariffario |
Orari e spazio di archiviazione delle istanze |
Unità di capacità e storage |
Elaborazione e archiviazione (senza server) |
Archiviazione, interrogazioni e trasferimento |
Orari e spazio di archiviazione del pod |
Ore e spazio di archiviazione dei nodi |
Scelta tra opzioni individuali e gestite
Considerazione |
Scegli DB vettoriali individuali |
Scegli Amazon Bedrock Knowledge Base (gestite) |
|---|---|---|
Implementazione RAG |
Vuoi il pieno controllo sulla pipeline RAG |
Volete un RAG completamente gestito con una configurazione minima |
Personalizzazione |
Sono necessarie una logica di recupero e una preelaborazione personalizzate |
I pattern RAG standard soddisfano le tue esigenze |
Infrastruttura esistente |
Il database è già distribuito |
Stai iniziando da zero o desideri una gestione semplificata |
Esperienza del team |
Il tuo team ha esperienza nell'amministrazione dei database |
Preferisci concentrarti sulla logica delle applicazioni, non sull'infrastruttura |
Complessità dell'integrazione |
È necessaria una profonda integrazione con i sistemi esistenti |
Desideri un'integrazione rapida con i modelli Amazon Bedrock |
Sovraccarico operativo |
È possibile gestire le operazioni del database |
Vuoi AWS gestire le operazioni |
Struttura dei costi |
Preferisci la tariffazione diretta dei database |
Preferisci i prezzi unificati di Amazon Bedrock |
È ora di commercializzare |
Hai tempo per l'implementazione personalizzata |
Hai bisogno di un'implementazione rapida |