Comprensión de documentos - Amazon Nova

Comprensión de documentos

nota

Esta documentación corresponde a la versión 1 de Amazon Nova. Para ver la guía sobre la comprensión de documentos de Amazon Nova 2, consulte Document understanding.

La capacidad de comprensión de documentos de Amazon Nova le permite incluir documentos completos (PDF, archivos de Word, hojas de cálculo, etc.) en su petición y hacer preguntas o solicitudes sobre su contenido. Los modelos de comprensión multimodales de Nova (Lite, Pro, Premier) pueden interpretar tanto el texto como los elementos visuales (como gráficos o tablas) de estos documentos. Esto permite casos de uso como contestar preguntas, resumir y analizar informes largos o documentos escaneados. Las características clave incluyen una cantidad de contexto muy grande (de 1 a 2 millones de tokens) para documentos largos y la capacidad de gestionar varios documentos en una sola consulta.

Amazon Nova distingue entre dos tipos de entradas de documentos:

  • Tipos de documentos basados en texto (por ejemplo, TXT, CSV, Markdown, HTML, DOC): se procesan principalmente por su contenido textual. Nova se centrará en comprender y extraer información del texto de estos documentos.

  • Tipos de documentos basados en contenido multimedia (por ejemplo, PDF, DOCX): estos archivos pueden contener diseños, imágenes, gráficos o contenido gráfico incrustado complejos. En el caso de los documentos multimedia, Nova procesa tanto los elementos visuales como los textuales. Nova emplea un análisis basado en la visión para interpretar el contenido visual, como gráficos, tablas, diagramas o capturas de pantalla, junto con el texto del documento.

    JPEG2000 y JBIG2 no son compatibles con archivos PDF en Amazon Nova.

Los formatos de archivo compatibles incluyen los tipos de documentos más comunes: archivos de texto sin formato y de texto estructurado (CSV, TXT), hojas de cálculo (XLS/XLSX), HTML/Markdown, documentos de Word (DOC/DOCX) y archivos PDF. En el caso de las imágenes dentro de los documentos, se utilizan los formatos de imagen estándar (PNG, JPG, GIF, WebP), aunque no se admiten archivos PDF que contengan determinadas codificaciones de imagen (CYMK, SVG).

Límites de tamaño de los documentos y pautas de uso
Restricción Límite

Número máximo de documentos

Hasta 5 documentos por solicitud (se aplica tanto a la carga directa como a Amazon S3)

Tamaño del documento basado en texto

Cada documento de texto (por ejemplo, .txt, .csv, .md, .html, .doc) debe tener un tamaño inferior o igual a 4,5 MB

Tamaño del documento basado en contenido multimedia

En el caso de los archivos .pdf y .docx, no existe un límite de tamaño de archivo individual, pero tenga en cuenta lo siguiente:

  • Al utilizar la carga directa, el tamaño combinado de todos los documentos multimedia debe ser ≤ 25 MB

  • Al utilizar Amazon S3, el tamaño combinado de todos los documentos multimedia debe ser ≤ 2 GB

Contenido en PDF no compatible

No se admiten archivos PDF que contengan perfiles de color CMYK o imágenes SVG