Vue d'ensemble des vecteurs

Les vecteurs sont des représentations numériques qui aident les machines à comprendre et à traiter les données. Dans le domaine de l'IA générative, ils répondent à deux objectifs principaux :

Représentation des espaces latents qui capturent la structure des données sous forme compressée
Création d'intégrations pour des données, telles que des mots, des phrases et des images

Les modèles d'intégration tels que Word2Vec GloVeet Amazon Titan Text Embeddings convertissent les données en vecteurs grâce à un processus appelé intégration. Ces modèles d'intégration peuvent effectuer les opérations suivantes :

Apprenez à partir du contexte pour représenter les mots sous forme de vecteurs
Rapprochez les mots similaires dans l'espace vectoriel
Permettre aux machines de traiter les données dans un espace continu

Le schéma suivant fournit une vue d'ensemble détaillée du processus d'intégration :

Un bucket Amazon Simple Storage Service (Amazon S3) contient des fichiers qui sont les sources de données à partir desquelles le système lit et traite les informations. Le compartiment Amazon S3 est spécifié lors de la configuration de la base de connaissances Amazon Bedrock, qui inclut également la synchronisation des données avec la base de connaissances.
Le modèle d'intégration convertit les données brutes des fichiers objets du compartiment Amazon S3 en intégrations vectorielles. Par exemple, Object1 est converti en un vecteur [0.6, 0.7, ...] qui représente son contenu dans un espace multidimensionnel.

Le modèle d'intégration convertit les objets du compartiment Amazon S3 en intégrations vectorielles.

Les intégrations de mots sont cruciales pour le traitement du langage naturel (NLP) car elles permettent :

Capturez les relations sémantiques entre les mots
Permettre la génération de texte contextuellement pertinent
Alimentez de grands modèles linguistiques (LLMs) pour produire des réponses semblables à celles des humains

Avertissement JavaScript est désactivé ou n'est pas disponible dans votre navigateur.

Pour que vous puissiez utiliser la documentation AWS, Javascript doit être activé. Vous trouverez des instructions sur les pages d'aide de votre navigateur.

Conventions de rédaction

Introduction

Vue d'ensemble des bases de données vectorielles