Présentation de l’intégration Quand utiliser cette intégration Modèles de vectorisation pris en charge Conditions préalables et autorisations Création d’une base de connaissances avec S3 Vectors Gestion et interrogation de votre base de connaissances Limitations

Utilisation de S3 Vectors avec les bases de connaissances d’Amazon Bedrock

S3 Vectors s'intègre aux bases de connaissances Amazon Bedrock et à Amazon SageMaker AI Unified Studio afin de simplifier et de réduire le coût du stockage vectoriel pour les applications de génération augmentée (RAG) par récupération.

Pour plus d'informations sur les commandes CLI de haut niveau qui intègrent les modèles d'intégration Amazon Bedrock aux opérations S3 Vectors, consultez. Création de vectorisation et réalisation de recherches sémantiques avec s3vectors-embed-cli

Rubriques

Présentation de l’intégration
Quand utiliser cette intégration
Modèles de vectorisation pris en charge
Conditions préalables et autorisations
Création d’une base de connaissances avec S3 Vectors
Gestion et interrogation de votre base de connaissances
Limitations

Présentation de l’intégration

Lorsque vous créez une base de connaissances dans Amazon Bedrock, vous pouvez sélectionner S3 Vectors comme magasin de vecteurs. Cette intégration fournit les éléments suivants :

Économies de coûts pour les applications RAG utilisant de grands jeux de données vectorielles.
Intégration fluide avec le flux de travail RAG entièrement géré d’Amazon Bedrock.
Gestion automatique des vecteurs gérée par le service Amazon Bedrock.
Sub-second latence des requêtes à froid et latence chaude des requêtes aussi faible que 100 millisecondes pour les opérations de récupération de la base de connaissances.

Les bases de connaissances d’Amazon Bedrock fournissent un flux de travail RAG de bout en bout entièrement géré. Lorsque vous créez une base de connaissances avec S3 Vectors, Amazon Bedrock extrait automatiquement les données de votre source de données S3, convertit le contenu en blocs de texte, génère des vectorisations et les stocke dans votre index vectoriel. Vous pouvez ensuite interroger la base de connaissances et générer des réponses basées sur des blocs récupérés de vos données sources.

Quand utiliser cette intégration

Envisagez d’utiliser S3 Vectors avec les bases de connaissances d’Amazon Bedrock lorsque vous avez besoin des éléments suivants :

Cost-effective stockage vectoriel pour les grands ensembles de données où la latence des requêtes inférieure à une seconde répond aux exigences de votre application.
Récupération de documents basée sur du texte et des images pour des cas d’utilisation tels que la recherche dans les manuels, les politiques et le contenu visuel.
Applications RAG qui privilégient l’optimisation des coûts de stockage par rapport aux réponses à très faible latence.
Opérations vectorielles gérées sans avoir à apprendre directement les opérations de l’API S3 Vectors. Vous pouvez continuer à utiliser les interfaces Amazon Bedrock que vous connaissez déjà.
Long-term stockage vectoriel avec la durabilité et l'évolutivité d'Amazon S3

Cette intégration est idéale pour les entreprises qui créent des applications RAG qui ont besoin de rechercher et de récupérer des informations à partir de contenus écrits et d’images, pour lesquelles les avantages économiques de S3 Vectors correspondent à des exigences de performances de requête acceptables.

Modèles de vectorisation pris en charge

Consultez les modèles pris en charge pour les intégrations vectorielles dans le guide de l'utilisateur d'Amazon Bedrock.

Conditions préalables et autorisations

Avant de créer une base de connaissances avec S3 Vectors, assurez-vous de disposer des éléments suivants :

Autorisations IAM appropriées pour S3 Vectors et les services Amazon Bedrock. Pour plus d’informations sur les autorisations IAM pour S3 Vectors, consultez Identity and Access Management dans S3 Vectors. Pour plus d’informations sur les autorisations IAM associées à votre rôle de service de bases de connaissances d’Amazon Bedrock afin d’accéder à S3 Vectors, consultez Autorisations permettant d’accéder à votre magasin de vecteurs dans Amazon S3 Vectors dans le Guide de l’utilisateur Amazon Bedrock.
Vos documents sources ont été préparés pour être intégrés à la base de connaissances.
Compréhension des exigences de votre modèle de vectorisation.

Lors de la configuration des configurations de sécurité, vous pouvez choisir un rôle IAM qui autorise Amazon Bedrock à accéder aux services requis AWS . Vous pouvez soit laisser Amazon Bedrock créer le rôle de service, soit utiliser votre propre rôle personnalisé. Si vous utilisez un rôle personnalisé, configurez une stratégie de compartiment de vecteur qui limite l’accès au compartiment de vecteur et à l’index vectoriel au rôle personnalisé.

Pour obtenir des informations détaillées sur les autorisations requises et les rôles IAM, consultez Création d’un rôle de service pour les bases de connaissances d’Amazon Bedrock dans le Guide de l’utilisateur Amazon Bedrock. Le rôle de service doit également disposer d'autorisations pour les vecteurs S3 et les opérations AWS KMS d'API.

Création d’une base de connaissances avec S3 Vectors

Vous pouvez créer une base de connaissances qui utilise S3 Vectors à l’aide de deux méthodes.

Méthode 1 : utilisation de la console Amazon Bedrock

Lorsque vous créez une base de connaissances dans la console Amazon Bedrock, vous pouvez sélectionner « compartiment de vecteur S3 » comme option de magasin de vecteurs. Vous avez deux options de configuration :

Créez rapidement un nouveau magasin de vecteurs : Amazon Bedrock crée un compartiment de vecteur S3 et un index vectoriel et les configure avec les paramètres requis pour vous. Par défaut, le compartiment vectoriel est chiffré à l'aide d'un chiffrement côté serveur avec des clés gérées par Amazon S3 ()SSE-S3. Vous pouvez éventuellement chiffrer le compartiment à l'aide AWS KMS de. Pour plus d’informations sur Création rapide d’un magasin de vecteurs dans la console, consultez Création d’une base de connaissances en se connectant à une source de données dans les bases de connaissances d’Amazon Bedrock dans le Guide de l’utilisateur Amazon Bedrock.
Choisissez un magasin de vecteurs que vous avez créé : choisissez un compartiment de vecteur S3 existant et un index vectoriel provenant du compte que vous avez créé précédemment. Pour plus d’informations sur la création d’un compartiment de vecteur S3 et d’un index vectoriel dans la console de bases de connaissances d’Amazon Bedrock, consultez l’onglet S3 Vectors dans Conditions préalables à l’utilisation d’un magasin de vecteurs que vous avez créé pour une base de connaissances dans le Guide de l’utilisateur Amazon Bedrock.

Pour obtenir des instructions détaillées étape par étape, consultez Création d’une base de connaissances en se connectant à une source de données dans les bases de connaissances d’Amazon Bedrock dans le Guide de l’utilisateur Amazon Bedrock.

Méthode 2 : utilisation d'Amazon SageMaker Unified Studio

Vous pouvez également créer et gérer des bases de connaissances avec S3 Vectors via Amazon Bedrock dans Amazon SageMaker AI Unified Studio. Cela fournit un environnement de développement unifié pour créer et tester des applications d’IA qui utilisent des bases de connaissances.

Amazon Bedrock in SageMaker AI Unified Studio est conçu pour les utilisateurs qui ont besoin de fonctionnalités de bloc-notes intégrées et qui travaillent sur plusieurs services d' AWS apprentissage automatique et d'analyse. Vous pouvez créer rapidement un compartiment de vecteur S3 et le configurer comme magasin de vecteurs pour vos bases de connaissances lorsque vous créez des applications d’IA générative.

Pour plus d'informations sur l'utilisation des vecteurs S3 avec Amazon Bedrock dans SageMaker AI Unified Studio, consultez la section Ajouter une source de données à votre application Amazon Bedrock dans le guide de l'utilisateur d'SageMaker AI Unified Studio.

Gestion et interrogation de votre base de connaissances

Synchronisation et gestion des données

Les bases de connaissances d’Amazon Bedrock proposent des opérations de tâches d’ingestion afin de synchroniser vos sources de données et vos vectorisations. Lorsque vous synchronisez votre source de données, Amazon Bedrock scanne chaque document et vérifie s’il a été indexé dans le magasin de vecteurs. Vous pouvez également indexer directement des documents dans le magasin de vecteurs à l'aide de IngestKnowledgeBaseDocumentscette opération. Une bonne pratique consiste à créer un magasin de vecteurs distinct pour chaque base de connaissances afin de garantir la synchronisation des données.

Lorsque vous supprimez une base de connaissances ou une ressource de source de données, Amazon Bedrock propose deux politiques de suppression de données : Delete (par défaut) et Retain. Si vous choisissez cette politique Delete, les vecteurs de l’index vectoriel et du compartiment de vecteur sont automatiquement supprimés.

Interrogation et récupération

Une fois que votre base de connaissances est configurée, vous pouvez procéder comme suit :

Récupérez des blocs de vos données sources à l’aide de l’opération d’API Récupérer.
Générez des réponses basées sur les fragments récupérés à l'aide de l'opération RetrieveAndGenerateAPI.
Testez les requêtes directement dans la console Amazon Bedrock.

Les réponses sont renvoyées avec des citations des données sources d’origine.

Limitations

Envisagez d’utiliser S3 Vectors avec les bases de connaissances d’Amazon Bedrock lorsque vous avez besoin des limitations suivantes :

Recherche sémantique uniquement : S3 Vectors prend en charge la recherche sémantique, mais pas les fonctionnalités de recherche hybrides.
Limites de taille de S3 Vectors : chaque vecteur a une limite de taille totale des métadonnées et une limite de taille pour les métadonnées filtrables, ce qui peut limiter les métadonnées personnalisées et les options de filtrage. Lorsque vous utilisez S3 Vectors comme magasin de vecteurs avec les bases de connaissances Amazon Bedrock, vous pouvez joindre jusqu'à 1 Ko de métadonnées personnalisées et 35 clés de métadonnées par vecteur.
Contraintes liées à la stratégie de segmentation : lorsque vous utilisez un nombre de jetons très élevé avec un découpage hiérarchique dans les bases de connaissances Amazon Bedrock, vous pouvez dépasser les limites de taille maximale des métadonnées, car les relations entre les fragments parent-enfant et le contexte hiérarchique sont stockés sous forme de métadonnées non filtrables dans les vecteurs S3. Pour plus d'informations sur les limites de taille des métadonnées par vecteur, consultezLimites et restrictions.
Floating-point vecteurs uniquement : les intégrations de vecteurs binaires ne sont pas prises en charge.

Pour obtenir des conseils complets sur l’utilisation des bases de connaissances d’Amazon Bedrock, consultez Récupération des données et génération des réponses basées sur l’IA avec les bases de connaissances Amazon Bedrock dans le Guide de l’utilisateur d’Amazon Bedrock.

Avertissement JavaScript est désactivé ou n'est pas disponible dans votre navigateur.

Pour que vous puissiez utiliser la documentation AWS, Javascript doit être activé. Vous trouverez des instructions sur les pages d'aide de votre navigateur.

Conventions de rédaction

Utilisation de vecteurs S3 avec OpenSearch Service

Régions AWS, points de terminaison, et quotas pour S3 Vectors