Compreensão do documento - Amazon Nova

Compreensão do documento

nota

Esta documentação é para o Amazon Nova versão 1. Para ver o guia de compreensão de documentos do Amazon Nova 2, acesse Compreensão de documentos.

A capacidade de compreensão de documentos do Amazon Nova permite que você inclua documentos inteiros (PDFs, arquivos do Word, planilhas etc.) em seu prompt e faça perguntas ou solicitações sobre seu conteúdo. Os modelos de compreensão multimodal do Nova (Lite, Pro, Premier) podem interpretar tanto o texto quanto os elementos visuais (como gráficos ou tabelas) nesses documentos. Isso permite casos de uso como resposta a perguntas, resumo e análise de relatórios longos ou documentos digitalizados. Os principais recursos incluem uma janela de contexto muito grande (1 a 2 milhões de tokens) para documentos longos e a capacidade de lidar com vários documentos em uma consulta.

O Amazon Nova distingue entre dois tipos de entradas de documentos:

  • Tipos de documentos baseados em texto (por exemplo, TXT, CSV, Markdown, HTML, DOC): são processados principalmente por seu conteúdo textual. O Nova se concentrará em entender e extrair informações do texto nesses documentos.

  • Tipos de documentos baseados em mídia (por exemplo, PDF, DOCX): esses arquivos podem conter layouts, imagens, tabelas ou gráficos incorporados complexos. Para documentos baseados em mídia, o Nova processa os elementos visuais e textuais. O Nova emprega a compreensão baseada na visão para interpretar o conteúdo visual, como gráficos, tabelas, diagramas ou capturas de tela, junto com o texto do documento.

    Não há suporte para JPEG2000 e JBIG2 em arquivos PDF no Amazon Nova.

Os formatos de arquivo compatíveis incluem tipos comuns de documentos: texto simples e arquivos de texto estruturado (CSV, TXT), planilhas (XLS/XLSX), HTML/Markdown, documentos do Word (DOC/DOCX) e arquivos PDF. Para imagens em documentos, os formatos de imagem padrão (PNG, JPG, GIF, WebP) são tratados, embora PDFs contendo determinadas codificações de imagem (CYMK, SVG) não sejam suportados.

Limites de tamanho do documento e diretrizes de uso
Restrição Limite

Número máximo de documentos

Até 5 documentos por solicitação (aplicável tanto ao upload direto quanto ao Amazon S3)

Tamanho do documento baseado em texto

Cada documento de texto (por exemplo, .txt, .csv, .md, .html, .doc) deve ter até 4,5 MB

Tamanho do documento baseado em mídia

Para arquivos .pdf e .docx, não há limite de tamanho de arquivo individual, mas:

  • Ao usar o upload direto, o tamanho combinado de todos os documentos de mídia deve ser de até 25 MB

  • Ao usar o Amazon S3, o tamanho combinado de todos os documentos de mídia deve ser de até 2 GB

Conteúdo em PDF não suportado

PDFs contendo perfis de cores CMYK ou imagens SVG não são suportados