Las traducciones son generadas a través de traducción automática. En caso de conflicto entre la traducción y la version original de inglés, prevalecerá la version en inglés.
Comparación de bases de datos vectoriales
AWS proporciona varios enfoques para implementar capacidades de búsqueda vectorial, que van desde bases de datos vectoriales individuales hasta Amazon Bedrock Knowledge Bases, que es un servicio totalmente gestionado. Al evaluar estas opciones, las organizaciones deben tener en cuenta varios aspectos, como la arquitectura, la escalabilidad, las capacidades de integración, las características de rendimiento y las características de seguridad.
Bases de datos vectoriales individuales
La siguiente tabla proporciona una descripción general de las características clave de varias soluciones de bases de datos vectoriales AWS individuales, centrándose en sus arquitecturas, capacidades de escalado, integraciones de fuentes de datos y características de rendimiento.
Característica |
Amazon Kendra |
OpenSearch Servicio Amazon |
Amazon RDS para SQLwith Postgre pgvector |
Amazon DocumentDB |
Amazon MemoryDB |
Análisis de Amazon Neptune |
Amazon S3 Vectors |
|---|---|---|---|---|---|---|---|
Caso de uso principal |
Búsqueda empresarial y RAG |
Búsqueda y análisis distribuidos |
Base de datos relacional con soporte vectorial |
Base de datos de documentos con búsqueda vectorial |
Búsqueda vectorial en memoria en tiempo real |
Análisis de gráficos con búsqueda vectorial |
Almacenamiento vectorial con costes optimizados |
Arquitectura |
Totalmente administrado |
Clúster distribuido |
Base de datos relacional |
Orientado a documentos |
Base de datos en memoria |
Motor de análisis gráfico |
Almacenamiento de objetos sin servidor |
Modelo de datos |
Basado en documentos |
Documentos JSON |
Tablas relacionales |
Documentos JSON |
Valor clave con JSON |
Gráfico de propiedades |
Almacenamiento de objetos |
Dimensiones vectoriales |
Administrado automáticamente |
Hasta 16.000 |
Configurable |
Hasta 2000 (indexados); 16.000 (sin indexar) |
Hasta 32.768 |
Configurable |
Hasta 4.096 |
Métodos de indexación |
Automático |
NSW, SI |
HNSW, IVFFlat |
HNSW, IVFFlat |
HNSW |
Gráfico y vector nativos |
Automático |
Métricas de distancia |
Automático |
Coseno, euclidiano, producto puntual |
Coseno, euclidiano, producto interno |
Coseno, euclidiano, producto puntiagudo |
Coseno, euclidiano, producto interno |
Coseno, euclidiano |
Coseno, euclidiano |
Latencia de consulta |
Subsegundo |
Menos de 10 ms (acelerada por la GPU) |
10-100 ms |
Milisegundos |
Inferior a un milisegundo |
Subsegundo |
Menos de 100 ms |
Modelo de escalado |
Automático |
Horizontal (añadir nodos) |
Réplicas verticales y de lectura |
Horizontal (añadir instancias) |
Vertical y réplicas |
Automático |
Automático (sin servidor) |
Número máximo de vectores |
Administrado |
Miles de millones (depende del clúster) |
Millones (depende de la instancia) |
Millones por colección |
Millones por base de datos |
Miles de millones |
2 mil millones por índice; 10 000 índices por segmento |
Rendimiento |
Alto |
Muy alto (miles de QPS) |
Medio |
Alto |
Muy alto (millones de solicitudes por día) |
Alto |
Medio (optimizado para consultas poco frecuentes) |
Duración de los datos |
99,999999999 % (11 9s) |
Configurable con réplicas |
99,99% (Multi-AZ) |
99,99% (Multi-AZ) |
99,99% (Multi-AZ) |
99,99% |
99,999999999 % (11 9s) |
Modelo de consistencia |
Eventual |
Eventual (configurable) |
Fuerte (ACID) |
Eventual |
Fuerte |
Fuerte |
Fuerte |
Capacidades adicionales |
40 o más conectores de datos, NLP |
Búsqueda de texto completo, análisis, paneles |
Consultas SQL, transacciones ACID |
Compatibilidad con la API de MongoDB |
Compatibilidad con la API de Redis, almacenamiento en caché |
Algoritmos gráficos, recorridos |
Políticas de ciclo de vida e integración de Amazon S3 |
Modelo de precios |
Pague por consulta y almacenamiento |
Horas de instancia y almacenamiento |
Horas y almacenamiento de la instancia |
Horas y almacenamiento de la instancia |
Horas y almacenamiento de la instancia |
Unidades de capacidad y almacenamiento |
Almacenamiento, consultas y transferencia de datos |
Optimización de costos |
Basado en el uso |
Instancias reservadas, autoescalado |
Instancias reservadas, Aurora Serverless |
Instancias reservadas |
Instancias reservadas |
Escalado automático |
Hasta un 90% de ahorro en comparación con las especializadas DBs |
Lo mejor para |
Búsqueda empresarial con una configuración mínima |
Consultas de alto rendimiento y baja latencia |
Cargas de trabajo vectoriales y de SQL híbridas |
Aplicaciones compatibles con MongoDB que necesitan vectores |
Aplicaciones en tiempo real y de latencia ultrabaja |
GraphRag y gráficos de conocimiento |
Almacenamiento rentable y a largo plazo |
Patrón de consulta ideal |
Búsquedas empresariales frecuentes |
Consultas de alta frecuencia en tiempo real |
Consultas vectoriales y de SQL mixtas |
Consultas de documentos con búsqueda semántica |
Millones de solicitudes al día |
Grafica los recorridos con búsqueda vectorial |
Consultas poco frecuentes (de minutos a horas) |
Complejidad de la configuración |
Bajo (totalmente gestionado) |
Medio (configuración de clúster) |
Medio (configuración de extensión) |
Medio (configuración de clúster) |
Medio (configuración de clúster) |
Bajo (totalmente gestionado) |
Bajo (sin servidor) |
Se requiere experiencia en equipo |
Minimal |
OpenSearch o Elasticsearch |
PostgreSQL, SQL |
MongoDB |
Redis |
Bases de datos gráficas |
Amazon S3, conceptos vectoriales básicos |
Servicio gestionado — Amazon Bedrock Knowledge Bases
Amazon Bedrock Knowledge Bases ofrece una solución totalmente gestionada con múltiples opciones de almacenamiento vectorial. En la siguiente tabla se comparan estas opciones de almacenamiento.
Característica |
Aurora Postgre pgvector SQLwith |
Análisis de Neptune |
OpenSearch Servicio sin servidor |
Vectores de Amazon S3 |
Pinecone |
RedisEnterprise Cloud |
|---|---|---|---|---|---|---|
Caso de uso principal |
Base de datos relacional con RAG vectorial |
Búsqueda vectorial basada en gráficos para GraphRag |
Gestión del conocimiento RAG |
RAG vectorial optimizado en costes |
Búsqueda vectorial de alto rendimiento |
Búsqueda vectorial en memoria |
Arquitectura |
Relacional totalmente gestionado |
Análisis de gráficos totalmente gestionado |
Sin servidor totalmente gestionado |
Almacenamiento de objetos sin servidor |
Nube híbrida totalmente gestionada |
Almacenamiento en memoria totalmente gestionado |
Modelo de datos |
Tablas relacionales |
Gráfico de propiedades |
Documentos JSON |
Almacenamiento de objetos |
Vectores diseñados específicamente |
Valor clave con vectores |
Almacenamiento vectorial |
A través de la extensión pgvector |
Vectores gráficos nativos |
A través OpenSearch del motor |
Almacenamiento vectorial nativo de Amazon S3 |
Base de datos vectorial nativa |
Vectores en memoria |
Integración de Amazon Bedrock |
KCL |
KCL |
KCL |
KCL |
KCL |
KCL |
Ingestión automática |
Sí (a través de Amazon Bedrock) |
Sí (a través de Amazon Bedrock) |
Sí (a través de Amazon Bedrock) |
Sí (a través de Amazon Bedrock) |
Sí (a través de Amazon Bedrock) |
Sí (a través de Amazon Bedrock) |
Vectorización automática |
Sí (a través de Amazon Bedrock) |
Sí (a través de Amazon Bedrock) |
Sí (a través de Amazon Bedrock) |
Sí (a través de Amazon Bedrock) |
Sí (a través de Amazon Bedrock) |
Sí (a través de Amazon Bedrock) |
Escalado |
Escalado automático (Aurora Serverless) |
Escalado automático de gráficos |
Automático sin servidor |
Automático (miles de millones de vectores) |
Cápsulas de escalado automático |
Clústeres con escalado automático |
Rendimiento de las consultas |
Alto para relacionales o vectoriales |
Alto para vectores gráficos |
Alto |
Medio (latencia de 100 ms o más) |
Muy alta |
Muy alta |
Vectores máximos |
Millones (en función de la instancia) |
Miles de millones |
Miles de millones |
2 mil millones por índice |
Miles de millones |
Millones (depende de la memoria) |
Capacidades adicionales |
Consultas SQL, transacciones ACID |
Algoritmos gráficos, recorridos |
Búsqueda de texto completo, análisis |
Ciclo de vida de Amazon S3, organización en niveles |
Filtrado de metadatos, espacios de nombres |
Estructuras de datos de Redis, almacenamiento en caché |
Optimización de costos |
Moderado (Aurora sin servidor) |
Moderado (unidades de capacidad) |
Alto (sin servidor, pay-per-use) |
Muy alto (hasta un 90% de ahorro) |
Moderado (precios basados en cápsulas) |
Bajo (versión premium en memoria) |
Lo mejor para |
Cargas de trabajo híbridas SQL/vector |
Gráficos de conocimiento conectados |
Texto completo con búsqueda vectorial |
Vectores de acceso poco frecuente y a largo plazo |
Búsqueda vectorial a escala en tiempo real |
Necesidades de latencia ultrabaja |
Patrón de consulta ideal |
Consultas vectoriales y de SQL mixtas |
Grafique los recorridos con vectores |
Búsquedas frecuentes con análisis |
Recuperación poco frecuente (de minutos a horas) |
Consultas de alta frecuencia en tiempo real |
Millones de solicitudes por segundo |
Configuración con Amazon Bedrock |
Simple (gestionado por Amazon Bedrock) |
Simple (gestionado por Amazon Bedrock) |
Simple (gestionado por Amazon Bedrock) |
Simple (gestionado por Amazon Bedrock) |
Simple (gestionado por Amazon Bedrock) |
Simple (gestionado por Amazon Bedrock) |
Residencia de datos |
Regiones de AWS |
Regiones de AWS |
Regiones de AWS |
Regiones de AWS |
Nube múltiple (AWS y otras) |
Nube múltiple (AWS y otras) |
Modelo de precios |
Horas de instancia y almacenamiento |
Unidades de capacidad y almacenamiento |
Computación y almacenamiento (sin servidor) |
Almacenamiento, consultas y transferencia |
Horario y almacenamiento del pod |
Horas y almacenamiento de los nodos |
Elegir entre opciones individuales y administradas
Consideración |
Elija una base de datos vectorial individual |
Elija las bases de conocimiento de Amazon Bedrock (administradas) |
|---|---|---|
Implementación de RAG |
¿Desea tener el control total sobre la canalización de RAG |
Quiere un RAG totalmente gestionado con una configuración mínima |
Personalización |
Necesita una lógica de recuperación y un preprocesamiento personalizados |
Los patrones RAG estándar satisfacen sus necesidades |
La infraestructura existente |
Ya tiene la base de datos implementada |
Está empezando de cero o desea una administración simplificada |
Experiencia del equipo |
Su equipo tiene experiencia en administración de bases de datos |
Prefiere centrarse en la lógica de las aplicaciones, no en la infraestructura |
Complejidad de integración |
Necesita una integración profunda con los sistemas existentes |
¿Quieres una integración rápida con los modelos de Amazon Bedrock? |
Gastos generales operativos |
Puede administrar las operaciones de la base de datos |
Quiere AWS gestionar las operaciones |
Estructura de costos |
Prefiere los precios directos de las bases de datos |
Prefieres los precios unificados de Amazon Bedrock |
¿Hora de comercialización |
Tiene tiempo para una implementación personalizada |
Necesita un despliegue rápido |