Les traductions sont fournies par des outils de traduction automatique. En cas de conflit entre le contenu d'une traduction et celui de la version originale en anglais, la version anglaise prévaudra.
Prise en charge du multimodal pour Amazon Nova
Note
Cette documentation concerne la version 1 d'Amazon Nova. Pour consulter la documentation multimodale Amazon Nova 2, consultez la page Compréhension multimodale.
Les modèles de compréhension Amazon Nova sont des modèles de compréhension multimodaux, ce qui signifie qu’ils prennent en charge les entrées multimodales telles que les images, les vidéos et les documents afin de déduire et de répondre à des questions en fonction du contenu fourni. Les modèles Amazon Nova sont dotés de nouvelles capacités de vision qui leur permettent de comprendre et d’analyser des images, des documents et des vidéos, réalisant ainsi des cas d’utilisation de compréhension multimodale.
La section suivante présente les directives relatives à l’utilisation des images, des documents et des vidéos dans Amazon Nova. Elle comprend les stratégies de prétraitement utilisées, des exemples de code et les limitations pertinentes à prendre en compte.
Rubriques
Types de contenu pris en charge par modalité
Les informations suivantes détaillent les formats de fichiers pris en charge par les fichiers multimédias et les méthodes d’entrée acceptées.
Type de fichier multimédia |
Formats de fichier pris en charge |
Méthode de saisie |
Stratégie d’analyse |
|---|---|---|---|
Image |
PNG, JPG, JPEG, GIF, WebP |
Base64 URI Amazon S3 |
Compréhension visuelle des images |
Document texte (API Converse uniquement) |
CSV, XLS, XLSX, HTML, TXT, MD, DOC |
Octets URI Amazon S3 |
Compréhension textuelle à partir du document uniquement. |
Document multimédia (API Converse uniquement) |
PDF, DOCX |
Octets URI Amazon S3 |
Texte avec images entrelacées Compréhension visuelle |
Vidéo |
MP4, MOV, MKV, WebM, FLV, MPEG, MPG, WMV, 3GP |
Base64 URI Amazon S3 |
Compréhension visuelle de la vidéo |
Note
Vous pouvez inclure jusqu’à cinq fichiers provenant de votre ordinateur ou 1 000 fichiers provenant d’Amazon S3. Chaque fichier ne doit pas dépasser 1 Go lorsqu’il est chargé depuis Amazon S3. La taille totale des fichiers chargés ne peut pas dépasser 25 Mo lorsqu’ils sont chargés depuis votre ordinateur ou 2 Go lorsqu’ils sont chargés depuis Amazon S3.
Étant donné que 25 Mo est la limite globale de données utiles, veuillez vous assurer de tenir compte de la surcharge base64. Pendant que vous travaillez, n’oubliez pas que les bibliothèques et les cadres conservent la mémoire, et que le contenu multimédia transmis peut rapidement s’accumuler. Lorsque vous utilisez la vidéo, spécifier un s3Location devrait atténuer de nombreux problèmes de stockage.
Note
Les vidéos et les documents volumineux prennent du temps à traiter, quelle que soit la méthode de saisie. Si le délai d'expiration du SDK boto3 expire en attendant une réponse de Amazon Bedrock, assurez-vous que vous avez défini une valeur read_timeout