

Las traducciones son generadas a través de traducción automática. En caso de conflicto entre la traducción y la version original de inglés, prevalecerá la version en inglés.

# Descripción general de las bases de datos vectoriales
<a name="vector-databases"></a>

Una base de datos vectorial es un sistema especializado que almacena y consulta vectores de alta dimensión de manera eficiente. Estas bases de datos son fundamentales para las aplicaciones de generación aumentada de recuperación (RAG).

Las bases de datos vectoriales gestionan la conversión y el almacenamiento de datos de las siguientes maneras:
+ Los objetos (como archivos de audio, imágenes y texto) se convierten en vectores mediante modelos de incrustación.
+ Los vectores se almacenan en formatos de datos especializados.
+ Las bases de datos vectoriales permiten búsquedas rápidas de similitudes.

Las bases de datos vectoriales ofrecen varias ventajas clave sobre las bases de datos tradicionales, lo que las hace especialmente adecuadas para los desafíos de datos modernos. Están optimizadas específicamente para operaciones vectoriales y gestionan datos de alta dimensión de forma eficiente. También se especializan en las búsquedas por similitud que suelen hacer las bases de datos tradicionales. Más allá de estas capacidades básicas, las bases de datos vectoriales están diseñadas para satisfacer las demandas cambiantes de las aplicaciones de aprendizaje automático y de IA generativa. Destacan en el almacenamiento vectorial a gran escala y utilizan la computación distribuida para equilibrar las cargas de trabajo en varios nodos. Esto proporciona escalabilidad y rendimiento a medida que aumentan los volúmenes de datos.

El siguiente diagrama muestra una implementación de RAG:

1. El contenido, como documentos o archivos de texto PDFs, se introduce en el modelo de incrustación como datos sin procesar para su procesamiento.

1. El modelo de incrustación transforma los datos sin procesar en vectores numéricos, que representan el significado semántico del contenido.

1. Las incrustaciones vectoriales generadas se almacenan en una base de datos vectorial optimizada para el almacenamiento y la recuperación de vectores de alta dimensión.

1. Las aplicaciones ahora pueden consultar la base de datos vectorial en respuesta a casos de uso como la búsqueda semántica y la recomendación de contenido.

![El modelo de incrustación convierte el contenido en incrustaciones vectoriales almacenadas en una base de datos vectorial para responder a las consultas.](http://docs.aws.amazon.com/es_es/prescriptive-guidance/latest/choosing-an-aws-vector-database-for-rag-use-cases/images/s3-model.png)


La elección de una base de datos vectorial inadecuada para una solución RAG puede provocar importantes dificultades y limitaciones, entre las que se incluyen las siguientes: 
+ Rendimiento de consulta deficiente
+ Obstáculos de escalabilidad
+ Retos de la ingestión de datos
+ Falta de funciones avanzadas, como el filtrado y la clasificación
+ Dificultades de integración con otros sistemas
+ Problemas de persistencia y durabilidad
+ Problemas de concurrencia y coherencia en entornos con varios usuarios
+ Costes de licencia más altos o dependencia de un proveedor
+ El apoyo y los recursos de la comunidad son limitados 
+ Posibles riesgos de seguridad y cumplimiento