View a markdown version of this page

Comparación de bases de datos vectoriales - AWS Guía prescriptiva

Las traducciones son generadas a través de traducción automática. En caso de conflicto entre la traducción y la version original de inglés, prevalecerá la version en inglés.

Comparación de bases de datos vectoriales

AWS proporciona varios enfoques para implementar capacidades de búsqueda vectorial, que van desde bases de datos vectoriales individuales hasta Amazon Bedrock Knowledge Bases, que es un servicio totalmente gestionado. Al evaluar estas opciones, las organizaciones deben tener en cuenta varios aspectos, como la arquitectura, la escalabilidad, las capacidades de integración, las características de rendimiento y las características de seguridad.

Bases de datos vectoriales individuales

La siguiente tabla proporciona una descripción general de las características clave de varias soluciones de bases de datos vectoriales AWS individuales, centrándose en sus arquitecturas, capacidades de escalado, integraciones de fuentes de datos y características de rendimiento.

Característica

Amazon Kendra

OpenSearch Servicio Amazon

Amazon RDS para SQLwith Postgre pgvector

Amazon DocumentDB

Amazon MemoryDB

Análisis de Amazon Neptune

Amazon S3 Vectors

Caso de uso principal

Búsqueda empresarial y RAG

Búsqueda y análisis distribuidos

Base de datos relacional con soporte vectorial

Base de datos de documentos con búsqueda vectorial

Búsqueda vectorial en memoria en tiempo real

Análisis de gráficos con búsqueda vectorial

Almacenamiento vectorial con costes optimizados

Arquitectura

Totalmente administrado

Clúster distribuido

Base de datos relacional

Orientado a documentos

Base de datos en memoria

Motor de análisis gráfico

Almacenamiento de objetos sin servidor

Modelo de datos

Basado en documentos

Documentos JSON

Tablas relacionales

Documentos JSON

Valor clave con JSON

Gráfico de propiedades

Almacenamiento de objetos

Dimensiones vectoriales

Administrado automáticamente

Hasta 16.000

Configurable

Hasta 2000 (indexados); 16.000 (sin indexar)

Hasta 32.768

Configurable

Hasta 4.096

Métodos de indexación

Automático

NSW, SI

HNSW, IVFFlat

HNSW, IVFFlat

HNSW

Gráfico y vector nativos

Automático

Métricas de distancia

Automático

Coseno, euclidiano, producto puntual

Coseno, euclidiano, producto interno

Coseno, euclidiano, producto puntiagudo

Coseno, euclidiano, producto interno

Coseno, euclidiano

Coseno, euclidiano

Latencia de consulta

Subsegundo

Menos de 10 ms (acelerada por la GPU)

10-100 ms

Milisegundos

Inferior a un milisegundo

Subsegundo

Menos de 100 ms

Modelo de escalado

Automático

Horizontal (añadir nodos)

Réplicas verticales y de lectura

Horizontal (añadir instancias)

Vertical y réplicas

Automático

Automático (sin servidor)

Número máximo de vectores

Administrado

Miles de millones (depende del clúster)

Millones (depende de la instancia)

Millones por colección

Millones por base de datos

Miles de millones

2 mil millones por índice; 10 000 índices por segmento

Rendimiento

Alto

Muy alto (miles de QPS)

Medio

Alto

Muy alto (millones de solicitudes por día)

Alto

Medio (optimizado para consultas poco frecuentes)

Duración de los datos

99,999999999 % (11 9s)

Configurable con réplicas

99,99% (Multi-AZ)

99,99% (Multi-AZ)

99,99% (Multi-AZ)

99,99%

99,999999999 % (11 9s)

Modelo de consistencia

Eventual

Eventual (configurable)

Fuerte (ACID)

Eventual

Fuerte

Fuerte

Fuerte

Capacidades adicionales

40 o más conectores de datos, NLP

Búsqueda de texto completo, análisis, paneles

Consultas SQL, transacciones ACID

Compatibilidad con la API de MongoDB

Compatibilidad con la API de Redis, almacenamiento en caché

Algoritmos gráficos, recorridos

Políticas de ciclo de vida e integración de Amazon S3

Modelo de precios

Pague por consulta y almacenamiento

Horas de instancia y almacenamiento

Horas y almacenamiento de la instancia

Horas y almacenamiento de la instancia

Horas y almacenamiento de la instancia

Unidades de capacidad y almacenamiento

Almacenamiento, consultas y transferencia de datos

Optimización de costos

Basado en el uso

Instancias reservadas, autoescalado

Instancias reservadas, Aurora Serverless

Instancias reservadas

Instancias reservadas

Escalado automático

Hasta un 90% de ahorro en comparación con las especializadas DBs

Lo mejor para

Búsqueda empresarial con una configuración mínima

Consultas de alto rendimiento y baja latencia

Cargas de trabajo vectoriales y de SQL híbridas

Aplicaciones compatibles con MongoDB que necesitan vectores

Aplicaciones en tiempo real y de latencia ultrabaja

GraphRag y gráficos de conocimiento

Almacenamiento rentable y a largo plazo

Patrón de consulta ideal

Búsquedas empresariales frecuentes

Consultas de alta frecuencia en tiempo real

Consultas vectoriales y de SQL mixtas

Consultas de documentos con búsqueda semántica

Millones de solicitudes al día

Grafica los recorridos con búsqueda vectorial

Consultas poco frecuentes (de minutos a horas)

Complejidad de la configuración

Bajo (totalmente gestionado)

Medio (configuración de clúster)

Medio (configuración de extensión)

Medio (configuración de clúster)

Medio (configuración de clúster)

Bajo (totalmente gestionado)

Bajo (sin servidor)

Se requiere experiencia en equipo

Minimal

OpenSearch o Elasticsearch

PostgreSQL, SQL

MongoDB

Redis

Bases de datos gráficas

Amazon S3, conceptos vectoriales básicos

Servicio gestionado — Amazon Bedrock Knowledge Bases

Amazon Bedrock Knowledge Bases ofrece una solución totalmente gestionada con múltiples opciones de almacenamiento vectorial. En la siguiente tabla se comparan estas opciones de almacenamiento.

Característica

Aurora Postgre pgvector SQLwith

Análisis de Neptune

OpenSearch Servicio sin servidor

Vectores de Amazon S3

Pinecone

RedisEnterprise Cloud

Caso de uso principal

Base de datos relacional con RAG vectorial

Búsqueda vectorial basada en gráficos para GraphRag

Gestión del conocimiento RAG

RAG vectorial optimizado en costes

Búsqueda vectorial de alto rendimiento

Búsqueda vectorial en memoria

Arquitectura

Relacional totalmente gestionado

Análisis de gráficos totalmente gestionado

Sin servidor totalmente gestionado

Almacenamiento de objetos sin servidor

Nube híbrida totalmente gestionada

Almacenamiento en memoria totalmente gestionado

Modelo de datos

Tablas relacionales

Gráfico de propiedades

Documentos JSON

Almacenamiento de objetos

Vectores diseñados específicamente

Valor clave con vectores

Almacenamiento vectorial

A través de la extensión pgvector

Vectores gráficos nativos

A través OpenSearch del motor

Almacenamiento vectorial nativo de Amazon S3

Base de datos vectorial nativa

Vectores en memoria

Integración de Amazon Bedrock

KCL

KCL

KCL

KCL

KCL

KCL

Ingestión automática

Sí (a través de Amazon Bedrock)

Sí (a través de Amazon Bedrock)

Sí (a través de Amazon Bedrock)

Sí (a través de Amazon Bedrock)

Sí (a través de Amazon Bedrock)

Sí (a través de Amazon Bedrock)

Vectorización automática

Sí (a través de Amazon Bedrock)

Sí (a través de Amazon Bedrock)

Sí (a través de Amazon Bedrock)

Sí (a través de Amazon Bedrock)

Sí (a través de Amazon Bedrock)

Sí (a través de Amazon Bedrock)

Escalado

Escalado automático (Aurora Serverless)

Escalado automático de gráficos

Automático sin servidor

Automático (miles de millones de vectores)

Cápsulas de escalado automático

Clústeres con escalado automático

Rendimiento de las consultas

Alto para relacionales o vectoriales

Alto para vectores gráficos

Alto

Medio (latencia de 100 ms o más)

Muy alta

Muy alta

Vectores máximos

Millones (en función de la instancia)

Miles de millones

Miles de millones

2 mil millones por índice

Miles de millones

Millones (depende de la memoria)

Capacidades adicionales

Consultas SQL, transacciones ACID

Algoritmos gráficos, recorridos

Búsqueda de texto completo, análisis

Ciclo de vida de Amazon S3, organización en niveles

Filtrado de metadatos, espacios de nombres

Estructuras de datos de Redis, almacenamiento en caché

Optimización de costos

Moderado (Aurora sin servidor)

Moderado (unidades de capacidad)

Alto (sin servidor, pay-per-use)

Muy alto (hasta un 90% de ahorro)

Moderado (precios basados en cápsulas)

Bajo (versión premium en memoria)

Lo mejor para

Cargas de trabajo híbridas SQL/vector

Gráficos de conocimiento conectados

Texto completo con búsqueda vectorial

Vectores de acceso poco frecuente y a largo plazo

Búsqueda vectorial a escala en tiempo real

Necesidades de latencia ultrabaja

Patrón de consulta ideal

Consultas vectoriales y de SQL mixtas

Grafique los recorridos con vectores

Búsquedas frecuentes con análisis

Recuperación poco frecuente (de minutos a horas)

Consultas de alta frecuencia en tiempo real

Millones de solicitudes por segundo

Configuración con Amazon Bedrock

Simple (gestionado por Amazon Bedrock)

Simple (gestionado por Amazon Bedrock)

Simple (gestionado por Amazon Bedrock)

Simple (gestionado por Amazon Bedrock)

Simple (gestionado por Amazon Bedrock)

Simple (gestionado por Amazon Bedrock)

Residencia de datos

Regiones de AWS

Regiones de AWS

Regiones de AWS

Regiones de AWS

Nube múltiple (AWS y otras)

Nube múltiple (AWS y otras)

Modelo de precios

Horas de instancia y almacenamiento

Unidades de capacidad y almacenamiento

Computación y almacenamiento (sin servidor)

Almacenamiento, consultas y transferencia

Horario y almacenamiento del pod

Horas y almacenamiento de los nodos

Elegir entre opciones individuales y administradas

Consideración

Elija una base de datos vectorial individual

Elija las bases de conocimiento de Amazon Bedrock (administradas)

Implementación de RAG

¿Desea tener el control total sobre la canalización de RAG

Quiere un RAG totalmente gestionado con una configuración mínima

Personalización

Necesita una lógica de recuperación y un preprocesamiento personalizados

Los patrones RAG estándar satisfacen sus necesidades

La infraestructura existente

Ya tiene la base de datos implementada

Está empezando de cero o desea una administración simplificada

Experiencia del equipo

Su equipo tiene experiencia en administración de bases de datos

Prefiere centrarse en la lógica de las aplicaciones, no en la infraestructura

Complejidad de integración

Necesita una integración profunda con los sistemas existentes

¿Quieres una integración rápida con los modelos de Amazon Bedrock?

Gastos generales operativos

Puede administrar las operaciones de la base de datos

Quiere AWS gestionar las operaciones

Estructura de costos

Prefiere los precios directos de las bases de datos

Prefieres los precios unificados de Amazon Bedrock

¿Hora de comercialización

Tiene tiempo para una implementación personalizada

Necesita un despliegue rápido