Les traductions sont fournies par des outils de traduction automatique. En cas de conflit entre le contenu d'une traduction et celui de la version originale en anglais, la version anglaise prévaudra.

# Prise en charge du multimodal pour Amazon Nova
<a name="modalities"></a>

**Note**  
Cette documentation concerne la version 1 d'Amazon Nova. Pour consulter la documentation multimodale Amazon Nova 2, consultez la page Compréhension [multimodale](https://docs.aws.amazon.com/nova/latest/nova2-userguide/using-multimodal-models.html).

Les modèles de compréhension Amazon Nova sont des modèles de compréhension multimodaux, ce qui signifie qu’ils prennent en charge les entrées multimodales telles que les images, les vidéos et les documents afin de déduire et de répondre à des questions en fonction du contenu fourni. Les modèles Amazon Nova sont dotés de nouvelles capacités de vision qui leur permettent de comprendre et d’analyser des images, des documents et des vidéos, réalisant ainsi des cas d’utilisation de compréhension multimodale.

La section suivante présente les directives relatives à l’utilisation des images, des documents et des vidéos dans Amazon Nova. Elle comprend les stratégies de prétraitement utilisées, des exemples de code et les limitations pertinentes à prendre en compte.

**Topics**
+ [Types de contenu pris en charge par modalité](#modalities-content)
+ [Compréhension des images](modalities-image.md)
+ [Compréhension des vidéos](modalities-video.md)
+ [Compréhension des documents](modalities-document.md)
+ [Gestion des erreurs](text-error-handing.md)

## Types de contenu pris en charge par modalité
<a name="modalities-content"></a>

Les informations suivantes détaillent les formats de fichiers pris en charge par les fichiers multimédias et les méthodes d’entrée acceptées.


| Type de fichier multimédia | Formats de fichier pris en charge | **Méthode de saisie** | Stratégie d’analyse | 
| --- |--- |--- |--- |
| Image | PNG, JPG, JPEG, GIF, WebP | Base64 URI Amazon S3 | Compréhension visuelle des images | 
| Document texte *(API Converse uniquement)* | CSV, XLS, XLSX, HTML, TXT, MD, DOC | Octets URI Amazon S3 | Compréhension textuelle à partir du document uniquement. | 
| Document multimédia *(API Converse uniquement)* | PDF, DOCX | Octets URI Amazon S3 | Texte avec images entrelacées Compréhension visuelle | 
| Vidéo | MP4, MOV, MKV, WebM, FLV, MPEG, MPG, WMV, 3GP | Base64 URI Amazon S3 | Compréhension visuelle de la vidéo | 

**Note**  
Vous pouvez inclure jusqu’à cinq fichiers provenant de votre ordinateur ou 1 000 fichiers provenant d’Amazon S3. Chaque fichier ne doit pas dépasser 1 Go lorsqu’il est chargé depuis Amazon S3. La taille totale des fichiers chargés ne peut pas dépasser 25 Mo lorsqu’ils sont chargés depuis votre ordinateur ou 2 Go lorsqu’ils sont chargés depuis Amazon S3.

Étant donné que 25 Mo est la limite globale de données utiles, veuillez vous assurer de tenir compte de la surcharge base64. Pendant que vous travaillez, n’oubliez pas que les bibliothèques et les cadres conservent la mémoire, et que le contenu multimédia transmis peut rapidement s’accumuler. Lorsque vous utilisez la vidéo, spécifier un `s3Location` devrait atténuer de nombreux problèmes de stockage.

**Note**  
Les vidéos et les documents volumineux prennent du temps à traiter, quelle que soit la méthode de saisie. Si le délai d'expiration du SDK boto3 expire en attendant une réponse de Amazon Bedrock, assurez-vous que vous avez défini une valeur [read\$1timeout](https://botocore.amazonaws.com/v1/documentation/api/latest/reference/config.html) appropriée et que vous avez mis à niveau boto3 vers au moins la version 1.38.