Opciones de bases de datos vectoriales individuales Opción de servicio gestionado Cómo elegir la base de datos vectorial adecuada

Opciones de bases de datos vectoriales

AWS ofrece una amplia gama de soluciones de bases de datos vectoriales para respaldar diferentes casos de uso y requisitos en las aplicaciones de IA generativa. Estas opciones se pueden clasificar en términos generales en servicios de bases de datos individuales y ofertas de servicios gestionados, cada uno con características y ventajas distintas. Comprender estas opciones es crucial para las organizaciones que desean implementar las capacidades de búsqueda vectorial de manera eficaz y, al mismo tiempo, mantener un rendimiento, una escalabilidad y una rentabilidad óptimos.

Para obtener más información sobre las soluciones de bases de datos vectoriales, consulte las siguientes secciones:

Opciones de bases de datos vectoriales individuales
Opción de servicio gestionado
Elegir la base de datos vectorial adecuada

Opciones de bases de datos vectoriales individuales

Las opciones de bases de datos vectoriales individuales disponibles AWS incluyen Amazon Kendra, Amazon OpenSearch Service, Amazon RDS for PostgreSQL con pgvector, Amazon MemoryDB, Amazon DocumentDB, AmazonNeptune Analytics y Amazon S3 Vector. (Una extensión de código abierto, pgvector añade la capacidad de almacenar y buscar incrustaciones vectoriales generadas por ML). Estas soluciones ofrecen diferentes enfoques de búsqueda vectorial, lo que permite a las organizaciones elegir en función de la infraestructura existente, los requisitos técnicos y los casos de uso específicos.

Amazon Kendra

Amazon Kendra es un servicio de búsqueda inteligente de nivel empresarial que utiliza el procesamiento del lenguaje natural y algoritmos avanzados de aprendizaje automático para devolver respuestas específicas a las preguntas de búsqueda a partir de sus datos. Amazon Kendra simplifica la implementación de la funcionalidad de búsqueda y la convierte en una solución de backend eficaz para aplicaciones de IA generativa.

Otras características clave de Amazon Kendra son las siguientes:

Conexiones nativas a más de 40 fuentes de datos
Capacidades de preparación de datos integradas
Configuración rápida que no requiere una gran experiencia técnica

Los beneficios de Amazon Kendra incluyen los siguientes

Procesamiento automatizado de datos (fragmentación, ingestión, recuperación)
Potentes opciones de personalización:
Acceso programático sencillo a través del AWS SDK para Python (Boto3)

Para obtener más información, consulte Ventajas de Amazon Kendra en la documentación de Amazon Kendra.

OpenSearch Servicio Amazon

Amazon OpenSearch Service es un servicio gestionado que le ayuda a implementar, operar y escalar clústeres de OpenSearch servicios en Nube de AWS.

Las principales capacidades del OpenSearch servicio incluyen las siguientes:

Motor de búsqueda y análisis de código abierto
Arquitectura distribuida
Procesamiento de datos en tiempo real

Algunas de las ventajas de utilizar el OpenSearch Servicio son las siguientes:

Escalabilidad horizontal
RESTful Soporte de API
Maneja datos estructurados y no estructurados
Análisis en tiempo real
Adecuado para varios tamaños de despliegue

Para obtener más información, consulta Características de Amazon OpenSearch Service en la documentación del OpenSearch servicio.

Amazon RDS para PostgreSQL con pgvector

Amazon RDS for PostgreSQL con pgvector AWS combina el servicio de bases de datos relacionales gestionadas con la extensión de procesamiento vectorial de PostgreSQL. Esta combinación permite a las organizaciones almacenar y consultar vectores de alta dimensión y, al mismo tiempo, mantener Amazon RDS. La solución es especialmente adecuada para aplicaciones de IA generativa que requieren operaciones vectoriales en tiempo real sin la sobrecarga de administrar la infraestructura de bases de datos.

Entre las principales ventajas de Amazon RDS for PostgreSQL con pgvector se incluyen las siguientes:

Alta disponibilidad
Conmutación por error automática
Rentable () pay-per-use
Monitorización integrada
Integración de datos vectoriales en tiempo real

Para obtener más información, consulte Ventajas de Amazon RDS en la documentación de Amazon RDS.

Amazon DocumentDB

Amazon DocumentDB (compatible con MongoDB) es una base de datos de documentos que ofrece funciones de búsqueda vectorial nativas en la versión 5.0 y versiones posteriores. Combina la flexibilidad del almacenamiento de documentos basado en JSON con la búsqueda vectorial y es compatible con los métodos de indexación jerárquica navegable pequeña (HNSW) e inverted File Flat (). IVFFlat

Entre las principales funciones de Amazon DocumentDB se incluyen las siguientes:

Almacene e indexe vectores de hasta 2000 dimensiones (hasta 16 000 dimensiones sin indexación)
Tiempos de respuesta en milisegundos para búsquedas de similitud vectorial
Support para métricas de distancia entre productos euclidianos, cosenoidales y puntuales
Integración perfecta con las aplicaciones compatibles con MongoDB existentes

Utilice Amazon DocumentDB en las siguientes situaciones:

Para aplicaciones que ya utilizan APIs MongoDB y que necesitan capacidades de búsqueda vectorial
Para casos de uso que requieren estructuras de datos de documentos flexibles combinadas con una búsqueda semántica
Para escenarios que requieren tanto consultas de documentos tradicionales como búsquedas de similitud vectorial
Para aplicaciones que ofrecen recomendaciones de productos, personalización, asistentes de chat y detección de fraudes

Para obtener más información, consulte Búsqueda vectorial para Amazon DocumentDB en la documentación de Amazon DocumentDB.

Amazon MemoryDB

Amazon MemoryDB es una base de datos en memoria compatible con Redis que ofrece el rendimiento de búsqueda vectorial más rápido entre las bases de datos vectoriales más populares. AWS Proporciona latencias de consulta inferiores a un milisegundo con una durabilidad en varias zonas de disponibilidad.

Las principales capacidades de MemoryDB incluyen las siguientes:

Almacene datos de aplicaciones y millones de vectores en una única base de datos
Tiempos de respuesta de consultas y actualizaciones en milisegundos de un solo dígito
Las tasas de recuperación más altas con el rendimiento más rápido en AWS
Support para hasta 32.768 dimensiones por vector
Capacidades de búsqueda semántica y almacenamiento en caché en tiempo real

Utilice MemoryDB en las siguientes situaciones:

Para aplicaciones en tiempo real que requieren una latencia ultrabaja (inferior a 10 ms)
Para cargas de trabajo de alto rendimiento con millones de solicitudes al día
Para casos de uso como los motores de recomendaciones en tiempo real, el almacenamiento semántico en caché y la detección de anomalías
Para aplicaciones que necesitan capacidades tanto de almacenamiento de datos en memoria como de búsqueda vectorial

Para obtener más información, consulte Búsqueda vectorial en la documentación de MemoryDB.

Análisis por Amazon Neptune

Amazon Neptune Analytics es un motor de análisis de gráficos que ofrece funciones de búsqueda vectorial nativas, lo que lo hace ideal para los casos de uso de generación aumentada de recuperación de gráficos (GraphRag). Combina la búsqueda por similitud vectorial con algoritmos y recorridos de gráficos.

Entre las principales funciones de Neptune Analytics se incluyen las siguientes:

Analice decenas de miles de millones de relaciones en cuestión de segundos
Combine la búsqueda vectorial con algoritmos gráficos (búsqueda de rutas, detección de comunidades, centralidad)
Support para aplicaciones GraphRag con conocimientos topológicos
Hasta 80 veces más rápido que las soluciones analíticas gráficas existentes
Integración con Amazon Bedrock para una gestión completa de GraphRag

Utilice Neptune Analytics en las siguientes situaciones:

Para aplicaciones de GraphRag que requieren conocimientos: gráficos con incrustaciones vectoriales
Para casos de uso que requieren atravesar relaciones complejas junto con similitudes vectoriales
Para aplicaciones que requieren respuestas de IA explicables con un contexto relacional
Para escenarios como las vistas de 360 grados de los clientes, las redes de detección de fraudes y el descubrimiento de conocimientos

Para obtener más información, consulte la documentación de Amazon Neptune Analytics.

Amazon S3 Vectors

Amazon S3 Vectors es el primer almacén de objetos en la nube AWS con capacidades nativas de almacenamiento vectorial y consulta. Proporciona almacenamiento vectorial diseñado específicamente y con costes optimizados para aplicaciones de IA que requieren una escalabilidad masiva.

Entre las principales capacidades de Amazon S3 Vectors se incluyen las siguientes:

Almacenamiento para hasta 2 mil millones de vectores por índice con soporte para hasta 10 000 índices por segmento vectorial
Latencia de consulta inferior a 100 ms optimizada para el almacenamiento a largo plazo y los patrones de acceso poco frecuentes
Reducción de costes de hasta un 90% en las operaciones vectoriales en comparación con las bases de datos vectoriales especializadas
Arquitectura sin servidor con escalado automático y una durabilidad del 99,99999% (11 9 s)

Utilice Amazon S3 Vectors en las siguientes situaciones:

Para aplicaciones que requieren almacenar miles de millones de vectores a un costo mínimo
Para cargas de trabajo que toleran una latencia de consulta inferior a un segundo (100 ms o más) en lugar de una latencia inferior a 10 ms
Para casos de uso de archivado y retención vectorial a largo plazo
Para aplicaciones RAG con patrones de recuperación poco frecuentes
Para organizaciones que priorizan la economía del almacenamiento por encima de la latencia ultrabaja

Amazon S3 Vectors se integra de forma nativa con las bases de conocimiento de Amazon Bedrock y funciona bien en arquitecturas escalonadas con Amazon Service. OpenSearch Puede usar Amazon S3 Vectors para almacenamiento en frío y usar OpenSearch Service para consultas urgentes.

Para obtener más información, consulte Trabajar con vectores y cubos vectoriales de S3 en la documentación de Amazon S3.

Opción de servicio gestionado

Amazon Bedrock Knowledge Bases representa el enfoque AWS totalmente gestionado para la implementación de bases de datos vectoriales. La flexibilidad del servicio en cuanto a las opciones de almacenamiento, combinada con sus funciones de administración automatizada, lo hacen especialmente valioso para las organizaciones que buscan implementar RAG sin administrar una infraestructura compleja.

Con las bases de conocimiento de Amazon Bedrock, puede crear, mantener y consultar bases de conocimiento que mejoren sus modelos básicos mediante RAG. Este servicio simplifica el complejo proceso de implementación de RAG al administrar todo el proceso de ingesta, vectorización y recuperación de datos.

Entre las principales ventajas de las bases de conocimiento de Amazon Bedrock se incluyen las siguientes:

Procesamiento de datos simplificado
- Ingestión y fragmentación automáticas de datos
- Extracción de texto integrada de varios formatos de archivo
- Generación gestionada de incrustaciones vectoriales
- Extracción e indexación automáticas de metadatos
Implementación simplificada de RAG
- Estrategias de recuperación preconfiguradas
- Optimización automática de la ventana de contexto
- Ajuste de relevancia incorporado
- Capacidades de búsqueda semántica listas para usar
Seguridad y gobernanza
- Controles integrados AWS Identity and Access Management (IAM)
- Cifrado de datos en reposo y en tránsito
- Compatibilidad con VPC
- Audite el registro con AWS CloudTrail

Las bases de conocimiento de Amazon Bedrock admiten varias opciones de almacenamiento vectorial, entre las que se incluyen:

Amazon Aurora PostgreSQL con pgvector
Análisis por Amazon Neptune
Amazon EMR sin servidor
Amazon S3 Vectors
Cono de pino
Redis Enterprise Cloud

Este servicio gestionado gestiona la ingesta, vectorización y recuperación automatizadas de datos. Esto simplifica las implementaciones de RAG.

Para obtener información detallada sobre cada almacén de vectores compatible, consulte la documentación de las bases de conocimiento de Amazon Bedrock.

Cómo elegir la base de datos vectorial adecuada

Seleccione su base de datos vectorial en función de estos factores de decisión clave:

Si necesita una base de datos de documentos compatible con MongoDB con búsqueda vectorial, elija Amazon DocumentDB. Esto es ideal cuando su aplicación usa APIs MongoDB y desea agregar capacidades de búsqueda semántica sin administrar una infraestructura vectorial separada.
Si necesita una latencia ultrabaja para aplicaciones en tiempo real, elija Amazon MemoryDB. Esto proporciona el rendimiento de búsqueda vectorial más rápido AWS con tiempos de respuesta inferiores a un milisegundo. Es ideal para motores de recomendaciones en tiempo real y aplicaciones de alto rendimiento.
Si necesita representaciones del conocimiento basadas en gráficos con búsqueda vectorial, elija Amazon Neptune Analytics. Esto es lo mejor para las aplicaciones de GraphRag que necesitan atravesar relaciones complejas y realizar consultas basadas en gráficos junto con búsquedas vectoriales, lo que proporciona respuestas de IA explicables.
Si necesita combinar consultas relacionales con búsquedas vectoriales, elija Amazon Aurora PostgreSQL con pgvector. Esta opción es ideal cuando la aplicación requiere tanto operaciones de SQL tradicionales como búsquedas de similitud vectorial en la misma base de datos.
Si necesitas consultas de alto rendimiento con una latencia inferior a 10 ms, elige Amazon Service. OpenSearch Se destaca en el manejo de consultas de alta frecuencia y aplicaciones en tiempo real, e incluye mejoras recientes en la aceleración de la GPU.
Si necesita almacenar miles de millones de vectores de forma rentable, elija Amazon S3 Vectors. Esta opción ofrece un ahorro de costos de hasta un 90% y es ideal para aplicaciones con patrones de recuperación poco frecuentes (minutos u horas entre consultas) que pueden tolerar una latencia inferior a los 100 ms.
Si necesita una búsqueda de texto completo junto con una búsqueda vectorial, elija Amazon OpenSearch Service. Esta opción combina potentes capacidades de búsqueda de texto completo con búsqueda vectorial en una sola plataforma.

Aviso JavaScript está desactivado o no está disponible en su navegador.

Para utilizar la documentación de AWS, debe estar habilitado JavaScript. Para obtener más información, consulte las páginas de ayuda de su navegador.

Convenciones del documento

Descripción general de las bases de datos vectoriales

Comparación de bases de datos vectoriales