Prérequis pour les bases de connaissances multimodales - Amazon Bedrock

Les traductions sont fournies par des outils de traduction automatique. En cas de conflit entre le contenu d'une traduction et celui de la version originale en anglais, la version anglaise prévaudra.

Prérequis pour les bases de connaissances multimodales

Les bases de connaissances multimodales Amazon Bedrock nécessitent une configuration supplémentaire au-delà des bases de connaissances standard pour traiter les images, le contenu audio et vidéo. Les prérequis spécifiques dépendent de l'approche de traitement et de la configuration de stockage que vous avez choisies.

Avant de créer une base de connaissances multimodale, vous devez remplir les conditions préalables suivantes :

Conditions préalables

  1. Assurez-vous que vos données se trouvent dans un connecteur de source de données pris en charge. Le contenu multimodal n'est pris en charge qu'avec Amazon S3 et les sources de données personnalisées.

  2. (Facultatif) Configurez votre propre magasin de vecteurs pris en charge. Vous pouvez ignorer cette étape si vous prévoyez de créer automatiquement un magasin de vecteurs à l’aide de la AWS Management Console.

  3. Créez un rôle de service personnalisé Gestion des identités et des accès AWS (IAM) avec les autorisations appropriées pour le traitement multimodal. Consultez Autorisations pour le contenu multimodal pour plus de détails.

    Note

    Si vous utilisez la console, les bases de connaissances Amazon Bedrock configureront automatiquement les autorisations pour vous.

  4. (Facultatif) Paramétrez des configurations de sécurité supplémentaires en suivant les étapes sous Chiffrement des ressources des bases de connaissances.

  5. Si vous prévoyez d'utiliser l'opération RetrieveAndGenerateAPI avec du contenu traité par la BDA, demandez l'accès aux modèles que vous utiliserez dans les régions dans lesquelles vous les utiliserez en suivant les étapes décrites dans. Accès aux modèles de fondation Amazon Bedrock

Autorisations pour le contenu multimodal

Les bases de connaissances multimodales nécessitent des autorisations supplémentaires au-delà des autorisations de base de connaissances standard. Les autorisations spécifiques dépendent de l'approche de traitement et de la configuration de stockage que vous avez choisies.

Vous devez configurer les autorisations suivantes en fonction de votre approche de traitement multimodal :

  • Autorisations Nova Multimodal Embeddings : requises lors de l'utilisation de Nova Multimodal Embeddings pour des recherches directes de similarité visuelle et audio. Inclut des autorisations pour l'invocation de modèles asynchrones et l'accès au stockage multimodal.

  • Autorisations Bedrock Data Automation (BDA) : requises lors de l'utilisation de BDA pour convertir du contenu multimodal en représentations textuelles. Inclut des autorisations pour l'automatisation des données, l'invocation et la surveillance de l'état.

  • Autorisations relatives aux clés KMS gérées par le client : obligatoires lors de l'utilisation de clés de chiffrement gérées par le client avec traitement BDA. Inclut les autorisations pour les opérations clés et la création de subventions.

  • Autorisations de stockage multimodal : obligatoires lors de la configuration d'une destination de stockage multimodal. Inclut les autorisations S3 standard pour le compartiment de stockage.

Pour des politiques IAM détaillées et la configuration des step-by-step autorisations, consultezAutorisations pour le contenu multimodal.

Besoins de stockage

Intégrations multimodales Nova

Obligatoire : vous devez configurer une destination de stockage multimodale. Cette destination stocke des copies de vos fichiers multimédia à récupérer et garantit leur disponibilité même si les fichiers sources sont modifiés ou supprimés.

Automatisation des données Bedrock (BDA)

Facultatif : vous pouvez configurer un bucket de stockage multimodal pour une fiabilité accrue et également pour récupérer le fichier lors de l'exécution. Cependant, cela n'est pas obligatoire puisque BDA convertit le contenu en texte.

Note

Si vous sélectionnez l'analyseur BDA sans configurer de compartiment de stockage multimodal, seule l'analyse de texte sera disponible. Pour tirer parti des fonctionnalités d'analyse multimodale avec BDA (traitement des images, du son et de la vidéo), vous devez configurer une destination de stockage multimodale.

Configuration de la destination de stockage multimodale

Lorsque vous configurez votre destination de stockage multimodal, tenez compte des points suivants :

  • Utiliser des compartiments séparés (recommandé) : configurez différents compartiments Amazon S3 pour votre source de données et votre destination de stockage multimodal. Cela fournit la configuration la plus simple et évite les conflits potentiels.

  • Si vous utilisez le même compartiment : vous devez spécifier un préfixe d'inclusion pour votre source de données qui limite le contenu ingéré. Cela empêche de réingérer les fichiers multimédias extraits.

  • Évitez le préfixe « aws/ » : lorsque vous utilisez le même compartiment à la fois pour la source de données et pour la destination de stockage multimodale, n'utilisez pas de préfixes d'inclusion commençant par « aws/ » car ce chemin est réservé au stockage multimédia extrait.