Les traductions sont fournies par des outils de traduction automatique. En cas de conflit entre le contenu d'une traduction et celui de la version originale en anglais, la version anglaise prévaudra.
Utilisation de vecteurs S3 avec les bases de connaissances Amazon Bedrock
Note
Amazon S3 Vectors est en version préliminaire pour Amazon Simple Storage Service et est sujet à modification.
S3 Vectors s'intègre aux bases de connaissances Amazon Bedrock
Pour plus d'informations sur les commandes CLI de haut niveau qui intègrent les modèles d'intégration Amazon Bedrock aux opérations S3 Vectors, consultez.
Rubriques
Présentation de l'intégration
Lorsque vous créez une base de connaissances dans Amazon Bedrock, vous pouvez sélectionner S3 Vectors comme magasin de vecteurs. Cette intégration fournit les éléments suivants :
-
Économies de coûts pour les applications RAG utilisant de grands ensembles de données vectorielles.
-
Intégration parfaite avec le flux de travail RAG entièrement géré d'Amazon Bedrock.
-
Gestion automatique des vecteurs gérée par le service Amazon Bedrock.
-
Latence de requête inférieure à une seconde pour les opérations de récupération de la base de connaissances.
Les bases de connaissances Amazon Bedrock fournissent un flux de travail end-to-end RAG entièrement géré. Lorsque vous créez une base de connaissances avec S3 Vectors, Amazon Bedrock extrait automatiquement les données de votre source de données S3, convertit le contenu en blocs de texte, génère des intégrations et les stocke dans votre index vectoriel. Vous pouvez ensuite interroger la base de connaissances et générer des réponses basées sur des fragments extraits de vos données sources.
Quand utiliser cette intégration
Envisagez d'utiliser des vecteurs S3 avec les bases de connaissances Amazon Bedrock lorsque vous avez besoin des éléments suivants :
-
Stockage vectoriel rentable pour les grands ensembles de données où le temps de latence des requêtes inférieur à une seconde répond aux exigences de votre application.
-
Récupération de documents basée sur du texte et des images pour des cas d'utilisation tels que la recherche dans les manuels, les politiques et le contenu visuel.
-
Applications RAG qui privilégient l'optimisation des coûts de stockage par rapport aux réponses à très faible latence.
-
Gestion des opérations vectorielles sans avoir à apprendre directement les opérations de l'API S3 Vectors. Vous pouvez continuer à utiliser les interfaces Amazon Bedrock que vous connaissez déjà.
-
Stockage vectoriel à long terme associé à la durabilité et à l'évolutivité d'Amazon S3
Cette intégration est idéale pour les entreprises qui créent des applications RAG qui ont besoin de rechercher et d'extraire des informations à partir de contenus écrits et d'images, pour lesquelles les avantages économiques des vecteurs S3 correspondent à des exigences de performances de requête acceptables.
Modèles d'intégration pris en charge
L'intégration de S3 Vectors aux bases de connaissances Amazon Bedrock prend en charge les modèles d'intégration suivants :
-
amazon. titan-embed-text-v2:0 - Pour les intégrations basées sur du texte
-
amazon. titan-embed-image-v1 - Pour les intégrations d'images et multimodales
-
cohérer. embed-english-v3 - Pour les intégrations de texte multilingues et spécialisées
Conditions préalables et autorisations
Avant de créer une base de connaissances avec S3 Vectors, assurez-vous de disposer des éléments suivants :
-
Autorisations IAM appropriées pour les services S3 Vectors et Amazon Bedrock. Pour plus d'informations sur les autorisations IAM pour les vecteurs S3, consultezGestion des identités et des accès dans S3 Vectors. Pour plus d'informations sur les autorisations IAM associées à votre rôle de service Amazon Bedrock Knowledge Bases afin d'accéder aux vecteurs S3, consultez la section Autorisations d'accès à votre boutique vectorielle dans Amazon S3 Vectors dans le guide de l'utilisateur d'Amazon Bedrock.
-
Vos documents sources ont été préparés pour être intégrés à la base de connaissances.
-
Compréhension des exigences de votre modèle d'intégration.
Lors de la configuration des configurations de sécurité, vous pouvez choisir un rôle IAM qui autorise Amazon Bedrock à accéder aux services requis AWS . Vous pouvez laisser Amazon Bedrock créer le rôle de service ou utiliser votre propre rôle personnalisé. Si vous utilisez un rôle personnalisé, configurez une politique de compartiment vectoriel qui limite l'accès au compartiment vectoriel et à l'index vectoriel au rôle personnalisé.
Pour obtenir des informations détaillées sur les autorisations requises et les rôles IAM, consultez la section Créer un rôle de service pour les bases de connaissances Amazon Bedrock dans le guide de l'utilisateur d'Amazon Bedrock. Le rôle de service doit également disposer d'autorisations pour les vecteurs S3 et les opérations AWS KMS d'API.
Création d'une base de connaissances avec des vecteurs S3
Vous pouvez créer une base de connaissances qui utilise les vecteurs S3 à l'aide de deux méthodes.
Méthode 1 : utilisation de la console Amazon Bedrock
Lorsque vous créez une base de connaissances dans la console Amazon Bedrock, vous pouvez choisir « compartiment vectoriel S3 » comme option de boutique vectorielle. Deux options de configuration s'offrent à vous :
-
Création rapide d'un nouveau magasin de vecteurs : Amazon Bedrock crée un compartiment vectoriel S3 et un index vectoriel et les configure avec les paramètres requis pour vous. Par défaut, le compartiment vectoriel est chiffré à l'aide du chiffrement côté serveur avec des clés gérées par Amazon S3 (SSE-S3). Vous pouvez éventuellement chiffrer le compartiment à l'aide AWS KMS de. Pour plus d'informations sur la création rapide d'un nouveau magasin vectoriel dans la console, consultez Créer une base de connaissances en vous connectant à une source de données dans les bases de connaissances Amazon Bedrock du guide de l'utilisateur Amazon Bedrock.
-
Choisissez un magasin vectoriel que vous avez créé : choisissez un compartiment vectoriel S3 existant et un index vectoriel provenant de votre compte que vous avez créé précédemment. Pour plus d'informations sur la création d'un bucket vectoriel S3 et d'un index vectoriel dans la console Amazon Bedrock Knowledge Bases, consultez l'onglet S3 Vectors dans Conditions préalables à l'utilisation d'un magasin vectoriel que vous avez créé pour une base de connaissances dans le guide de l'utilisateur d'Amazon Bedrock.
Pour step-by-step obtenir des instructions détaillées, consultez la section Créer une base de connaissances en vous connectant à une source de données dans les bases de connaissances Amazon Bedrock du guide de l'utilisateur d'Amazon Bedrock.
Méthode 2 : utilisation d'Amazon SageMaker Unified Studio
Vous pouvez également créer et gérer des bases de connaissances avec S3 Vectors via Amazon Bedrock dans Amazon SageMaker AI Unified Studio
Amazon Bedrock in SageMaker AI Unified Studio
Pour plus d'informations sur l'utilisation des vecteurs S3 avec Amazon Bedrock dans SageMaker AI Unified Studio, consultez la section Ajouter une source de données à votre application Amazon Bedrock dans le guide de l'utilisateur d'SageMaker AI Unified Studio.
Gestion et consultation de votre base de connaissances
Synchronisation et gestion des données
Les bases de connaissances Amazon Bedrock proposent des opérations d'ingestion afin de synchroniser vos sources de données et vos intégrations vectorielles. Lorsque vous synchronisez votre source de données, Amazon Bedrock scanne chaque document et vérifie s'il a été indexé dans le magasin vectoriel. Vous pouvez également indexer directement des documents dans le magasin de vecteurs à l'aide de IngestKnowledgeBaseDocumentscette opération. La meilleure pratique consiste à créer un magasin vectoriel distinct pour chaque base de connaissances afin de garantir la synchronisation des données.
Lorsque vous supprimez une base de connaissances ou une ressource de source de données, Amazon Bedrock propose deux politiques de suppression de données : Delete
(par défaut) etRetain
. Si vous choisissez cette Delete
politique, les vecteurs de l'index vectoriel et du compartiment de vecteurs sont automatiquement supprimés.
Interrogation et extraction
Une fois votre base de connaissances configurée, vous pouvez effectuer les opérations suivantes :
-
Récupérez des fragments de vos données sources à l'aide de l'opération Retrieve API.
-
Générez des réponses basées sur les fragments récupérés à l'aide de l'opération RetrieveAndGenerateAPI.
-
Testez les requêtes directement dans la console Amazon Bedrock.
Les réponses sont renvoyées avec des citations des données sources d'origine.
Limites
Lorsque vous utilisez des vecteurs S3 avec les bases de connaissances Amazon Bedrock, vous devez connaître les limites suivantes :
-
Recherche sémantique uniquement : S3 Vectors prend en charge la recherche sémantique, mais pas les fonctionnalités de recherche hybrides.
-
Limites de taille des vecteurs S3 : Chaque vecteur a une limite de taille totale des métadonnées et une limite de taille pour les métadonnées filtrables, ce qui peut limiter les métadonnées personnalisées et les options de filtrage. Pour plus d'informations sur les métadonnées et les limites de taille des métadonnées filtrables par vecteur, consultezLimites et restrictions.
-
Contraintes liées à la stratégie de segmentation : limitée aux modèles qui divisent le contenu en blocs de 500 jetons maximum en raison des restrictions de taille des métadonnées.
-
Vecteurs à virgule flottante uniquement : les intégrations de vecteurs binaires ne sont pas prises en charge.
Pour obtenir des conseils complets sur l'utilisation des bases de connaissances Amazon Bedrock, consultez la section Récupérer des données et générer des réponses basées sur l'IA avec les bases de connaissances Amazon Bedrock dans le guide de l'utilisateur d'Amazon Bedrock.