Bases de datos vectoriales individuales Servicio gestionado — Amazon Bedrock Knowledge Bases Elegir entre opciones individuales y administradas

Comparación de bases de datos vectoriales

AWS proporciona varios enfoques para implementar capacidades de búsqueda vectorial, que van desde bases de datos vectoriales individuales hasta Amazon Bedrock Knowledge Bases, que es un servicio totalmente gestionado. Al evaluar estas opciones, las organizaciones deben tener en cuenta varios aspectos, como la arquitectura, la escalabilidad, las capacidades de integración, las características de rendimiento y las características de seguridad.

Bases de datos vectoriales individuales

La siguiente tabla proporciona una descripción general de las características clave de varias soluciones de bases de datos vectoriales AWS individuales, centrándose en sus arquitecturas, capacidades de escalado, integraciones de fuentes de datos y características de rendimiento.

Característica	Amazon Kendra	OpenSearch Servicio Amazon	Amazon RDS para SQLwith Postgre pgvector	Amazon DocumentDB	Amazon MemoryDB	Análisis de Amazon Neptune	Amazon S3 Vectors
Caso de uso principal	Búsqueda empresarial y RAG	Búsqueda y análisis distribuidos	Base de datos relacional con soporte vectorial	Base de datos de documentos con búsqueda vectorial	Búsqueda vectorial en memoria en tiempo real	Análisis de gráficos con búsqueda vectorial	Almacenamiento vectorial con costes optimizados
Arquitectura	Totalmente administrado	Clúster distribuido	Base de datos relacional	Orientado a documentos	Base de datos en memoria	Motor de análisis gráfico	Almacenamiento de objetos sin servidor
Modelo de datos	Basado en documentos	Documentos JSON	Tablas relacionales	Documentos JSON	Valor clave con JSON	Gráfico de propiedades	Almacenamiento de objetos
Dimensiones vectoriales	Administrado automáticamente	Hasta 16.000	Configurable	Hasta 2000 (indexados); 16.000 (sin indexar)	Hasta 32.768	Configurable	Hasta 4.096
Métodos de indexación	Automático	NSW, SI	HNSW, IVFFlat	HNSW, IVFFlat	HNSW	Gráfico y vector nativos	Automático
Métricas de distancia	Automático	Coseno, euclidiano, producto puntual	Coseno, euclidiano, producto interno	Coseno, euclidiano, producto puntiagudo	Coseno, euclidiano, producto interno	Coseno, euclidiano	Coseno, euclidiano
Latencia de consulta	Subsegundo	Menos de 10 ms (acelerada por la GPU)	10-100 ms	Milisegundos	Inferior a un milisegundo	Subsegundo	Menos de 100 ms
Modelo de escalado	Automático	Horizontal (añadir nodos)	Réplicas verticales y de lectura	Horizontal (añadir instancias)	Vertical y réplicas	Automático	Automático (sin servidor)
Número máximo de vectores	Administrado	Miles de millones (depende del clúster)	Millones (depende de la instancia)	Millones por colección	Millones por base de datos	Miles de millones	2 mil millones por índice; 10 000 índices por segmento
Rendimiento	Alto	Muy alto (miles de QPS)	Medio	Alto	Muy alto (millones de solicitudes por día)	Alto	Medio (optimizado para consultas poco frecuentes)
Duración de los datos	99,999999999 % (11 9s)	Configurable con réplicas	99,99% (Multi-AZ)	99,99% (Multi-AZ)	99,99% (Multi-AZ)	99,99%	99,999999999 % (11 9s)
Modelo de consistencia	Eventual	Eventual (configurable)	Fuerte (ACID)	Eventual	Fuerte	Fuerte	Fuerte
Capacidades adicionales	40 o más conectores de datos, NLP	Búsqueda de texto completo, análisis, paneles	Consultas SQL, transacciones ACID	Compatibilidad con la API de MongoDB	Compatibilidad con la API de Redis, almacenamiento en caché	Algoritmos gráficos, recorridos	Políticas de ciclo de vida e integración de Amazon S3
Modelo de precios	Pague por consulta y almacenamiento	Horas de instancia y almacenamiento	Horas y almacenamiento de la instancia	Horas y almacenamiento de la instancia	Horas y almacenamiento de la instancia	Unidades de capacidad y almacenamiento	Almacenamiento, consultas y transferencia de datos
Optimización de costos	Basado en el uso	Instancias reservadas, autoescalado	Instancias reservadas, Aurora Serverless	Instancias reservadas	Instancias reservadas	Escalado automático	Hasta un 90% de ahorro en comparación con las especializadas DBs
Lo mejor para	Búsqueda empresarial con una configuración mínima	Consultas de alto rendimiento y baja latencia	Cargas de trabajo vectoriales y de SQL híbridas	Aplicaciones compatibles con MongoDB que necesitan vectores	Aplicaciones en tiempo real y de latencia ultrabaja	GraphRag y gráficos de conocimiento	Almacenamiento rentable y a largo plazo
Patrón de consulta ideal	Búsquedas empresariales frecuentes	Consultas de alta frecuencia en tiempo real	Consultas vectoriales y de SQL mixtas	Consultas de documentos con búsqueda semántica	Millones de solicitudes al día	Grafica los recorridos con búsqueda vectorial	Consultas poco frecuentes (de minutos a horas)
Complejidad de la configuración	Bajo (totalmente gestionado)	Medio (configuración de clúster)	Medio (configuración de extensión)	Medio (configuración de clúster)	Medio (configuración de clúster)	Bajo (totalmente gestionado)	Bajo (sin servidor)
Se requiere experiencia en equipo	Minimal	OpenSearch o Elasticsearch	PostgreSQL, SQL	MongoDB	Redis	Bases de datos gráficas	Amazon S3, conceptos vectoriales básicos

Servicio gestionado — Amazon Bedrock Knowledge Bases

Amazon Bedrock Knowledge Bases ofrece una solución totalmente gestionada con múltiples opciones de almacenamiento vectorial. En la siguiente tabla se comparan estas opciones de almacenamiento.

Característica	Aurora Postgre pgvector SQLwith	Análisis de Neptune	OpenSearch Servicio sin servidor	Vectores de Amazon S3	Pinecone	RedisEnterprise Cloud
Caso de uso principal	Base de datos relacional con RAG vectorial	Búsqueda vectorial basada en gráficos para GraphRag	Gestión del conocimiento RAG	RAG vectorial optimizado en costes	Búsqueda vectorial de alto rendimiento	Búsqueda vectorial en memoria
Arquitectura	Relacional totalmente gestionado	Análisis de gráficos totalmente gestionado	Sin servidor totalmente gestionado	Almacenamiento de objetos sin servidor	Nube híbrida totalmente gestionada	Almacenamiento en memoria totalmente gestionado
Modelo de datos	Tablas relacionales	Gráfico de propiedades	Documentos JSON	Almacenamiento de objetos	Vectores diseñados específicamente	Valor clave con vectores
Almacenamiento vectorial	A través de la extensión pgvector	Vectores gráficos nativos	A través OpenSearch del motor	Almacenamiento vectorial nativo de Amazon S3	Base de datos vectorial nativa	Vectores en memoria
Integración de Amazon Bedrock	KCL	KCL	KCL	KCL	KCL	KCL
Ingestión automática	Sí (a través de Amazon Bedrock)	Sí (a través de Amazon Bedrock)	Sí (a través de Amazon Bedrock)	Sí (a través de Amazon Bedrock)	Sí (a través de Amazon Bedrock)	Sí (a través de Amazon Bedrock)
Vectorización automática	Sí (a través de Amazon Bedrock)	Sí (a través de Amazon Bedrock)	Sí (a través de Amazon Bedrock)	Sí (a través de Amazon Bedrock)	Sí (a través de Amazon Bedrock)	Sí (a través de Amazon Bedrock)
Escalado	Escalado automático (Aurora Serverless)	Escalado automático de gráficos	Automático sin servidor	Automático (miles de millones de vectores)	Cápsulas de escalado automático	Clústeres con escalado automático
Rendimiento de las consultas	Alto para relacionales o vectoriales	Alto para vectores gráficos	Alto	Medio (latencia de 100 ms o más)	Muy alta	Muy alta
Vectores máximos	Millones (en función de la instancia)	Miles de millones	Miles de millones	2 mil millones por índice	Miles de millones	Millones (depende de la memoria)
Capacidades adicionales	Consultas SQL, transacciones ACID	Algoritmos gráficos, recorridos	Búsqueda de texto completo, análisis	Ciclo de vida de Amazon S3, organización en niveles	Filtrado de metadatos, espacios de nombres	Estructuras de datos de Redis, almacenamiento en caché
Optimización de costos	Moderado (Aurora sin servidor)	Moderado (unidades de capacidad)	Alto (sin servidor, pay-per-use)	Muy alto (hasta un 90% de ahorro)	Moderado (precios basados en cápsulas)	Bajo (versión premium en memoria)
Lo mejor para	Cargas de trabajo híbridas SQL/vector	Gráficos de conocimiento conectados	Texto completo con búsqueda vectorial	Vectores de acceso poco frecuente y a largo plazo	Búsqueda vectorial a escala en tiempo real	Necesidades de latencia ultrabaja
Patrón de consulta ideal	Consultas vectoriales y de SQL mixtas	Grafique los recorridos con vectores	Búsquedas frecuentes con análisis	Recuperación poco frecuente (de minutos a horas)	Consultas de alta frecuencia en tiempo real	Millones de solicitudes por segundo
Configuración con Amazon Bedrock	Simple (gestionado por Amazon Bedrock)	Simple (gestionado por Amazon Bedrock)	Simple (gestionado por Amazon Bedrock)	Simple (gestionado por Amazon Bedrock)	Simple (gestionado por Amazon Bedrock)	Simple (gestionado por Amazon Bedrock)
Residencia de datos	Regiones de AWS	Regiones de AWS	Regiones de AWS	Regiones de AWS	Nube múltiple (AWS y otras)	Nube múltiple (AWS y otras)
Modelo de precios	Horas de instancia y almacenamiento	Unidades de capacidad y almacenamiento	Computación y almacenamiento (sin servidor)	Almacenamiento, consultas y transferencia	Horario y almacenamiento del pod	Horas y almacenamiento de los nodos

Elegir entre opciones individuales y administradas

Consideración	Elija una base de datos vectorial individual	Elija las bases de conocimiento de Amazon Bedrock (administradas)
Implementación de RAG	¿Desea tener el control total sobre la canalización de RAG	Quiere un RAG totalmente gestionado con una configuración mínima
Personalización	Necesita una lógica de recuperación y un preprocesamiento personalizados	Los patrones RAG estándar satisfacen sus necesidades
La infraestructura existente	Ya tiene la base de datos implementada	Está empezando de cero o desea una administración simplificada
Experiencia del equipo	Su equipo tiene experiencia en administración de bases de datos	Prefiere centrarse en la lógica de las aplicaciones, no en la infraestructura
Complejidad de integración	Necesita una integración profunda con los sistemas existentes	¿Quieres una integración rápida con los modelos de Amazon Bedrock?
Gastos generales operativos	Puede administrar las operaciones de la base de datos	Quiere AWS gestionar las operaciones
Estructura de costos	Prefiere los precios directos de las bases de datos	Prefieres los precios unificados de Amazon Bedrock
¿Hora de comercialización	Tiene tiempo para una implementación personalizada	Necesita un despliegue rápido

Aviso JavaScript está desactivado o no está disponible en su navegador.

Para utilizar la documentación de AWS, debe estar habilitado JavaScript. Para obtener más información, consulte las páginas de ayuda de su navegador.

Convenciones del documento

Opciones de bases de datos vectoriales

Consideraciones y comparaciones de costos