Les traductions sont fournies par des outils de traduction automatique. En cas de conflit entre le contenu d'une traduction et celui de la version originale en anglais, la version anglaise prévaudra.
Dépannage des bases de connaissances multimodales
Cette section fournit des conseils pour résoudre les problèmes courants rencontrés lors de l'utilisation de bases de connaissances multimodales. Les informations de dépannage sont organisées en fonction des limites générales, des scénarios d'erreur courants avec leurs causes et solutions, et des recommandations d'optimisation des performances. Utilisez ces informations pour diagnostiquer et résoudre les problèmes lors de la configuration, de l'ingestion ou de l'interrogation de votre contenu multimodal.
Limitations générales
Tenez compte des limites actuelles lorsque vous travaillez avec des bases de connaissances multimodales :
-
Limites de taille de fichier : 1,5 Go maximum par fichier vidéo, 1 Go par fichier audio (Nova Multimodal Embeddings) ou 1,5 Go par fichier (BDA)
-
Fichiers par tâche d'ingestion : maximum 15 000 fichiers par tâche (Nova Multimodal Embeddings) ou 1 000 fichiers par tâche (BDA)
-
Limites de requêtes : maximum d'une image par requête
-
Restrictions relatives aux sources de données : seuls Amazon S3 et les sources de données personnalisées prennent en charge le contenu multimodal
-
Limites du découpage BDA : lorsque vous utilisez Bedrock Data Automation avec un découpage de taille fixe, les paramètres de pourcentage de chevauchement ne sont pas appliqués au contenu audio et vidéo
-
Limites de tâches BDA simultanées : limite par défaut de 20 tâches BDA simultanées. Pour un traitement à grande échelle, envisagez de demander une augmentation du quota de service
-
Limites du modèle de reclassement : les modèles de reclassement ne sont pas pris en charge pour le contenu multimodal
-
Limites de synthèse : la synthèse des réponses de récupération contenant du contenu non textuel n'est pas prise en charge
-
Limites de saisie des requêtes : les entrées contenant à la fois du texte et des images ne sont actuellement pas prises en charge. Vous pouvez utiliser des requêtes sous forme de texte ou d'image, mais pas les deux simultanément.
-
Filtres de contenu d'image de garde-corps : lorsque vous utilisez des requêtes d'image avec un garde-corps sur lequel des filtres de contenu d'image sont configurés, l'image d'entrée est évaluée par rapport au garde-corps et peut être bloquée si elle dépasse les seuils de filtre configurés
-
Incompatibilité de saisie et de type : par défaut, l'entrée est supposée être du texte lorsque le type n'est pas spécifié. Lorsque vous utilisez des modalités autres que le texte, vous devez spécifier le type correct
Erreurs courantes et solutions
Si vous rencontrez des problèmes avec votre base de connaissances multimodale, passez en revue les scénarios courants suivants :
- Erreur 4xx lors de l'utilisation de requêtes d'image
-
Cause : tentative d'utilisation de requêtes d'image avec des modèles incorporant uniquement du texte ou des bases de connaissances traitées par BDA.
Solution : Choisissez Amazon Nova Multimodal Embeddings lors de la création de votre base de connaissances pour la prise en charge des requêtes d'images.
- RAG renvoie une erreur 4xx avec un contenu multimodal
-
Cause : utilisation
RetrieveAndGenerateavec une base de connaissances contenant uniquement du contenu multimodal et le modèle Amazon Nova Multimodal Embeddings.Solution : utilisez l'analyseur BDA pour les fonctionnalités RAG ou assurez-vous que votre base de connaissances contient du texte.
- Erreur de destination de stockage multimodale requise
-
Cause : utilisation de Nova Multimodal Embeddings sans configurer de destination de stockage multimodale.
Solution : Spécifiez une destination de stockage multimodale lors de l'utilisation de Nova Multimodal Embeddings.
- La source de données et le stockage multimodal utilisent le même compartiment S3
-
Cause : Configuration de votre source de données et de votre destination de stockage multimodal pour utiliser le même compartiment Amazon S3 sans préfixes d'inclusion appropriés.
Solution : utilisez des compartiments distincts pour la source de données et le stockage multimodal, ou configurez des préfixes d'inclusion pour empêcher la réingestion des fichiers multimédias extraits.
- Le préfixe d'inclusion ne peut pas commencer par « aws/ »
-
Cause : utilisation d'un préfixe d'inclusion commençant par « aws/ » lorsque votre source de données et votre destination de stockage multimodal partagent le même compartiment Amazon S3.
Solution : Spécifiez un autre préfixe d'inclusion. Le chemin « aws/ » est réservé au stockage des médias extraits et ne peut pas être utilisé comme préfixe d'inclusion pour éviter de réingérer le contenu traité.
- L'ingestion de BDA ignore le contenu multimodal
-
Cause : La base de connaissances a été créée sans destination de stockage multimodale, puis une source de données BDA a été ajoutée avec un contenu multimodal.
Solution : Recréez la base de connaissances avec une destination de stockage multimodale configurée pour permettre le traitement BDA de fichiers audio, vidéo et image.
- Base de connaissances créée sans modèle d'intégration multimodal
-
Cause : La base de connaissances a été créée avec un modèle d'intégration contenant uniquement du texte, ce qui limite les capacités multimodales.
Solution : Créez une nouvelle base de connaissances avec Nova Multimodal Embeddings pour permettre le traitement multimodal natif et les requêtes basées sur des images.
Gestion des données transitoires avec les politiques de cycle de vie d'Amazon S3
Lorsque vous utilisez Nova Multimodal Embeddings, Amazon Bedrock stocke les données transitoires dans votre destination de stockage multimodal et tente de les supprimer une fois le traitement terminé. Nous recommandons d'appliquer une politique de cycle de vie au chemin de données transitoire afin de garantir qu'il est correctement expiré.
Pour plus d'informations sur les politiques de cycle de vie d'Amazon S3, consultez Gérer le cycle de vie des objets dans le guide de l'utilisateur d'Amazon S3.
Considérations sur les performances
Pour optimiser les performances de votre base de connaissances multimodale, tenez compte des facteurs suivants :
-
Temps de traitement : le traitement BDA prend plus de temps en raison de la conversion du contenu
-
Latence des requêtes : les requêtes d'image peuvent avoir une latence plus élevée que les requêtes de texte
-
Durée du découpage : des durées de segments audio/vidéo plus longues augmentent le temps de traitement mais peuvent améliorer la précision