Limitations générales Erreurs courantes et solutions Gestion des données transitoires avec les politiques de cycle de vie d'Amazon S3 Considérations sur les performances

Dépannage des bases de connaissances multimodales

Cette section fournit des conseils pour résoudre les problèmes courants rencontrés lors de l'utilisation de bases de connaissances multimodales. Les informations de dépannage sont organisées en fonction des limites générales, des scénarios d'erreur courants avec leurs causes et solutions, et des recommandations d'optimisation des performances. Utilisez ces informations pour diagnostiquer et résoudre les problèmes lors de la configuration, de l'ingestion ou de l'interrogation de votre contenu multimodal.

Limitations générales

Tenez compte des limites actuelles lorsque vous travaillez avec des bases de connaissances multimodales :

Limites de taille de fichier : 1,5 Go maximum par fichier vidéo, 1 Go par fichier audio (Nova Multimodal Embeddings) ou 1,5 Go par fichier (BDA)
Fichiers par tâche d'ingestion : maximum 15 000 fichiers par tâche (Nova Multimodal Embeddings) ou 1 000 fichiers par tâche (BDA)
Limites de requêtes : maximum d'une image par requête
Restrictions relatives aux sources de données : seuls Amazon S3 et les sources de données personnalisées prennent en charge le contenu multimodal
Limites du découpage BDA : lorsque vous utilisez Bedrock Data Automation avec un découpage de taille fixe, les paramètres de pourcentage de chevauchement ne sont pas appliqués au contenu audio et vidéo
Limites de tâches BDA simultanées : limite par défaut de 20 tâches BDA simultanées. Pour un traitement à grande échelle, envisagez de demander une augmentation du quota de service
Limites du modèle de reclassement : les modèles de reclassement ne sont pas pris en charge pour le contenu multimodal
Limites de synthèse : la synthèse des réponses de récupération contenant du contenu non textuel n'est pas prise en charge
Limites de saisie des requêtes : les entrées contenant à la fois du texte et des images ne sont actuellement pas prises en charge. Vous pouvez utiliser des requêtes sous forme de texte ou d'image, mais pas les deux simultanément.
Filtres de contenu d'image de garde-corps : lorsque vous utilisez des requêtes d'image avec un garde-corps sur lequel des filtres de contenu d'image sont configurés, l'image d'entrée est évaluée par rapport au garde-corps et peut être bloquée si elle dépasse les seuils de filtre configurés
Incompatibilité de saisie et de type : par défaut, l'entrée est supposée être du texte lorsque le type n'est pas spécifié. Lorsque vous utilisez des modalités autres que le texte, vous devez spécifier le type correct

Erreurs courantes et solutions

Si vous rencontrez des problèmes avec votre base de connaissances multimodale, passez en revue les scénarios courants suivants :

Erreur 4xx lors de l'utilisation de requêtes d'image

Cause : tentative d'utilisation de requêtes d'image avec des modèles incorporant uniquement du texte ou des bases de connaissances traitées par BDA.

Solution : Choisissez Amazon Nova Multimodal Embeddings lors de la création de votre base de connaissances pour la prise en charge des requêtes d'images.

RAG renvoie une erreur 4xx avec un contenu multimodal

Cause : utilisation RetrieveAndGenerate avec une base de connaissances contenant uniquement du contenu multimodal et le modèle Amazon Nova Multimodal Embeddings.

Solution : utilisez l'analyseur BDA pour les fonctionnalités RAG ou assurez-vous que votre base de connaissances contient du texte.

Erreur de destination de stockage multimodale requise

Cause : utilisation de Nova Multimodal Embeddings sans configurer de destination de stockage multimodale.

Solution : Spécifiez une destination de stockage multimodale lors de l'utilisation de Nova Multimodal Embeddings.

La source de données et le stockage multimodal utilisent le même compartiment S3

Cause : Configuration de votre source de données et de votre destination de stockage multimodal pour utiliser le même compartiment Amazon S3 sans préfixes d'inclusion appropriés.

Solution : utilisez des compartiments distincts pour la source de données et le stockage multimodal, ou configurez des préfixes d'inclusion pour empêcher la réingestion des fichiers multimédias extraits.

Le préfixe d'inclusion ne peut pas commencer par « aws/ »

Cause : utilisation d'un préfixe d'inclusion commençant par « aws/ » lorsque votre source de données et votre destination de stockage multimodal partagent le même compartiment Amazon S3.

Solution : Spécifiez un autre préfixe d'inclusion. Le chemin « aws/ » est réservé au stockage des médias extraits et ne peut pas être utilisé comme préfixe d'inclusion pour éviter de réingérer le contenu traité.

L'ingestion de BDA ignore le contenu multimodal

Cause : La base de connaissances a été créée sans destination de stockage multimodale, puis une source de données BDA a été ajoutée avec un contenu multimodal.

Solution : Recréez la base de connaissances avec une destination de stockage multimodale configurée pour permettre le traitement BDA de fichiers audio, vidéo et image.

Base de connaissances créée sans modèle d'intégration multimodal

Cause : La base de connaissances a été créée avec un modèle d'intégration contenant uniquement du texte, ce qui limite les capacités multimodales.

Solution : Créez une nouvelle base de connaissances avec Nova Multimodal Embeddings pour permettre le traitement multimodal natif et les requêtes basées sur des images.

Gestion des données transitoires avec les politiques de cycle de vie d'Amazon S3

Lorsque vous utilisez Nova Multimodal Embeddings, Amazon Bedrock stocke les données transitoires dans votre destination de stockage multimodal et tente de les supprimer une fois le traitement terminé. Nous recommandons d'appliquer une politique de cycle de vie au chemin de données transitoire afin de garantir qu'il est correctement expiré.

Console

Pour créer une règle de cycle de vie à l'aide de la console

Ouvrez la console Amazon S3.
Accédez à la destination de stockage multimodale que vous avez configurée pour votre base de connaissances.
Choisissez l'onglet Gestion, puis sélectionnez Créer une règle de cycle de vie.
Pour le nom de la règle du cycle de vie, entrezTransient Data Deletion.
Sous Type de filtre, choisissez Limiter la portée de cette règle à l'aide d'un ou de plusieurs filtres.
Dans Préfixe, entrez le chemin de données transitoire pour votre base de connaissances et votre source de données.

Remplacez les valeurs d'espace réservé du préfixe suivant par vos identifiants réels :
```
aws/bedrock/knowledge_bases/knowledge-base-id/data-source-id/transient_data
```
Important
N'appliquez pas de politiques de cycle de vie à l'ensemble du compartiment ou au préfixe « aws/ », car cela supprimerait votre contenu multimodal et provoquerait des échecs de récupération. Utilisez uniquement le chemin de données transitoire spécifique indiqué ci-dessus.
Sous Actions relatives aux règles du cycle de vie, sélectionnez Expirer les versions actuelles des objets.
Pour Jours après la création de l'objet, entrez1.
Choisissez Créer une règle.

AWS CLI

Pour créer une règle de cycle de vie à l'aide du AWS CLI

Créez un fichier JSON nommé lifecycle-policy.json avec le contenu suivant.

Remplacez les valeurs de l'espace réservé par vos identifiants réels :

knowledge-base-id- L'identifiant de votre base de connaissances
data-source-id- L'identifiant de votre source de données


{
    "Rules": [
        {
            "ID": "TransientDataDeletion",
            "Status": "Enabled",
            "Filter": {
                "Prefix": "aws/bedrock/knowledge_bases/knowledge-base-id/data-source-id/transient_data"
            },
            "Expiration": {
                "Days": 1
            }
        }
    ]
}

Appliquez la politique de cycle de vie à votre compartiment. Remplacez your-multimodal-storage-bucket par le nom de votre compartiment :


aws s3api put-bucket-lifecycle-configuration \
    --bucket your-multimodal-storage-bucket \
    --lifecycle-configuration file://lifecycle-policy.json

Vérifiez que la politique de cycle de vie a été appliquée :


aws s3api get-bucket-lifecycle-configuration \
    --bucket your-multimodal-storage-bucket

Pour plus d'informations sur les politiques de cycle de vie d'Amazon S3, consultez Gérer le cycle de vie des objets dans le guide de l'utilisateur d'Amazon S3.

Considérations sur les performances

Pour optimiser les performances de votre base de connaissances multimodale, tenez compte des facteurs suivants :

Temps de traitement : le traitement BDA prend plus de temps en raison de la conversion du contenu
Latence des requêtes : les requêtes d'image peuvent avoir une latence plus élevée que les requêtes de texte
Durée du découpage : des durées de segments audio/vidéo plus longues augmentent le temps de traitement mais peuvent améliorer la précision

Avertissement JavaScript est désactivé ou n'est pas disponible dans votre navigateur.

Pour que vous puissiez utiliser la documentation AWS, Javascript doit être activé. Vous trouverez des instructions sur les pages d'aide de votre navigateur.

Conventions de rédaction

Base de connaissances sur les tests et les requêtes

Création d’une base de connaissances en la connectant à un magasin de données structuré