Prise en charge du multimodal pour Amazon Nova - Amazon Nova

Les traductions sont fournies par des outils de traduction automatique. En cas de conflit entre le contenu d'une traduction et celui de la version originale en anglais, la version anglaise prévaudra.

Prise en charge du multimodal pour Amazon Nova

Note

Cette documentation concerne la version 1 d'Amazon Nova. Pour consulter la documentation multimodale Amazon Nova 2, consultez la page Compréhension multimodale.

Les modèles de compréhension Amazon Nova sont des modèles de compréhension multimodaux, ce qui signifie qu’ils prennent en charge les entrées multimodales telles que les images, les vidéos et les documents afin de déduire et de répondre à des questions en fonction du contenu fourni. Les modèles Amazon Nova sont dotés de nouvelles capacités de vision qui leur permettent de comprendre et d’analyser des images, des documents et des vidéos, réalisant ainsi des cas d’utilisation de compréhension multimodale.

La section suivante présente les directives relatives à l’utilisation des images, des documents et des vidéos dans Amazon Nova. Elle comprend les stratégies de prétraitement utilisées, des exemples de code et les limitations pertinentes à prendre en compte.

Types de contenu pris en charge par modalité

Les informations suivantes détaillent les formats de fichiers pris en charge par les fichiers multimédias et les méthodes d’entrée acceptées.

Type de fichier multimédia

Formats de fichier pris en charge

Méthode de saisie

Stratégie d’analyse

Image

PNG, JPG, JPEG, GIF, WebP

Base64

URI Amazon S3

Compréhension visuelle des images

Document texte

(API Converse uniquement)

CSV, XLS, XLSX, HTML, TXT, MD, DOC

Octets

URI Amazon S3

Compréhension textuelle à partir du document uniquement.

Document multimédia

(API Converse uniquement)

PDF, DOCX

Octets

URI Amazon S3

Texte avec images entrelacées Compréhension visuelle

Vidéo

MP4, MOV, MKV, WebM, FLV, MPEG, MPG, WMV, 3GP

Base64

URI Amazon S3

Compréhension visuelle de la vidéo

Note

Vous pouvez inclure jusqu’à cinq fichiers provenant de votre ordinateur ou 1 000 fichiers provenant d’Amazon S3. Chaque fichier ne doit pas dépasser 1 Go lorsqu’il est chargé depuis Amazon S3. La taille totale des fichiers chargés ne peut pas dépasser 25 Mo lorsqu’ils sont chargés depuis votre ordinateur ou 2 Go lorsqu’ils sont chargés depuis Amazon S3.

Étant donné que 25 Mo est la limite globale de données utiles, veuillez vous assurer de tenir compte de la surcharge base64. Pendant que vous travaillez, n’oubliez pas que les bibliothèques et les cadres conservent la mémoire, et que le contenu multimédia transmis peut rapidement s’accumuler. Lorsque vous utilisez la vidéo, spécifier un s3Location devrait atténuer de nombreux problèmes de stockage.

Note

Les vidéos et les documents volumineux prennent du temps à traiter, quelle que soit la méthode de saisie. Si le délai d'expiration du SDK boto3 expire en attendant une réponse de Amazon Bedrock, assurez-vous que vous avez défini une valeur read_timeout appropriée et que vous avez mis à niveau boto3 vers au moins la version 1.38.