Compréhension des documents - Amazon Nova

Les traductions sont fournies par des outils de traduction automatique. En cas de conflit entre le contenu d'une traduction et celui de la version originale en anglais, la version anglaise prévaudra.

Compréhension des documents

Note

Cette documentation concerne la version 1 d'Amazon Nova. Pour consulter le guide de compréhension des documents Amazon Nova 2, consultez la section Présentation des documents.

La capacité de compréhension des documents d'Amazon Nova vous permet d'inclure des documents complets (fichiers WordPDFs, feuilles de calcul, etc.) dans votre invite et de poser des questions ou des demandes concernant leur contenu. Les modèles de compréhension multimodale de Nova (Lite, Pro, Premier) peuvent interpréter à la fois le texte et les éléments visuels (tels que des graphiques ou des tableaux) contenus dans ces documents. Cela permet des cas d'utilisation tels que la réponse à des questions, la synthèse et l'analyse de longs rapports ou de documents numérisés. Les principales fonctionnalités incluent une très grande fenêtre contextuelle (1 à 2 millions de jetons) pour les documents longs et la possibilité de gérer plusieurs documents en une seule requête.

Amazon Nova fait la distinction entre deux types de saisie de documents :

  • Types de documents basés sur du texte (par exemple TXT, CSV, Markdown, HTML, DOC) : ils sont traités principalement pour leur contenu textuel. Nova se concentrera sur la compréhension et l'extraction d'informations à partir du texte de ces documents.

  • Types de documents basés sur des supports (PDF, DOCX, par exemple) : ces fichiers peuvent contenir des mises en page complexes, des images, des graphiques ou des graphiques intégrés. Pour les documents multimédias, Nova traite à la fois les éléments visuels et textuels. Nova utilise une compréhension basée sur la vision pour interpréter le contenu visuel, tel que les graphiques, les tableaux, les diagrammes ou les captures d'écran, parallèlement au texte du document.

    JPEG2000 et JBIG2 ne sont pas pris en charge dans les fichiers PDF d'Amazon Nova.

Les formats de fichier pris en charge incluent les types de documents courants : fichiers texte brut et texte structuré (CSV, TXT), feuilles de calcul (XLS/XLSX), HTML/Markdown, Word documents (DOC/DOCX) et fichiers PDF. Pour les images contenues dans des documents, les formats d'image standard (PNG, JPG, GIF, WebP) sont gérés, mais certains encodages PDFs d'image (CYMK, SVG) ne sont pas pris en charge.

Limites de taille des documents et directives d'utilisation
Contrainte Limite

Nombre maximum de documents

Jusqu'à 5 documents par demande (s'applique à la fois au téléchargement direct et à Amazon S3)

Taille de document basée sur le texte

Chaque document texte (par exemple, .txt, .csv, .md, .html, .doc) doit peser ≤ 4,5 Mo

Taille du document basée sur le support

Pour les fichiers .pdf et .docx, il n'y a pas de limite de taille de fichier individuelle, mais :

  • Lorsque vous utilisez le téléchargement direct, la taille combinée de tous les documents multimédia doit être ≤ 25 Mo

  • Lorsque vous utilisez Amazon S3, la taille combinée de tous les documents multimédia doit être ≤ 2 Go

Contenu PDF non pris en charge

PDFs contenant des profils de couleurs CMJN ou des images SVG ne sont pas pris en charge