Las traducciones son generadas a través de traducción automática. En caso de conflicto entre la traducción y la version original de inglés, prevalecerá la version en inglés.
Descripción general de los vectores
Los vectores son representaciones numéricas que ayudan a las máquinas a entender y procesar los datos. En la IA generativa, cumplen dos propósitos clave:
-
Representar espacios latentes que capturan la estructura de datos en forma comprimida
-
Crear incrustaciones de datos como palabras, oraciones e imágenes
Los modelos de incrustación, como Word2Vec GloVe
-
Aprenda del contexto a representar palabras como vectores.
-
Coloca palabras similares más cerca unas de otras en el espacio vectorial.
-
Permita que las máquinas procesen datos en un espacio continuo.
El siguiente diagrama proporciona una visión general de alto nivel del proceso de incrustación:
-
Un bucket de Amazon Simple Storage Service (Amazon S3) contiene archivos que son las fuentes de datos desde las que el sistema leerá y procesará la información. El bucket S3 se especifica durante la configuración de la base de conocimientos de Amazon Bedrock, que también incluye la sincronización de datos con la base de conocimientos.
-
El modelo de incrustación convierte los datos sin procesar de los archivos de objetos del depósito S3 en incrustaciones vectoriales. Por ejemplo, Object1 se convierte en un vector [0.6, 0.7,...], que representa su contenido en un espacio multidimensional.

Las incrustaciones de palabras son fundamentales para el procesamiento del lenguaje natural (PNL) porque hacen lo siguiente:
-
Capture las relaciones semánticas entre palabras.
-
Permita la generación de texto relevante desde el punto de vista contextual.
-
Impulse modelos de lenguaje extensos (LLMs) para producir respuestas parecidas a las humanas.