Comprensione dei documenti - Amazon Nova

Le traduzioni sono generate tramite traduzione automatica. In caso di conflitto tra il contenuto di una traduzione e la versione originale in Inglese, quest'ultima prevarrà.

Comprensione dei documenti

Nota

Questa documentazione è per Amazon Nova versione 1. Per la guida alla comprensione dei documenti di Amazon Nova 2, visita Document understanding.

La funzionalità di comprensione dei documenti di Amazon Nova ti consente di includere interi documenti (file WordPDFs, fogli di calcolo, ecc.) nel prompt e porre domande o richieste sul loro contenuto. I modelli di comprensione multimodale di Nova (Lite, Pro, Premier) possono interpretare sia il testo che gli elementi visivi (come grafici o tabelle) all'interno di questi documenti. Ciò consente casi d'uso come la risposta a domande, il riepilogo e l'analisi di report lunghi o documenti scansionati. Le caratteristiche principali includono una finestra contestuale molto ampia (1-2 milioni di token) per documenti lunghi e la capacità di gestire più documenti in un'unica query.

Amazon Nova distingue due tipi di input di documenti:

  • Tipi di documenti basati su testo (ad esempio TXT, CSV, Markdown, HTML, DOC): vengono elaborati principalmente per il loro contenuto testuale. Nova si concentrerà sulla comprensione e l'estrazione di informazioni dal testo di questi documenti.

  • Tipi di documenti basati su supporti (ad esempio PDF, DOCX): questi file possono contenere layout complessi, immagini, grafici o grafica incorporata. Per i documenti multimediali, Nova elabora sia gli elementi visivi che quelli testuali. Nova utilizza la comprensione basata sulla visione per interpretare i contenuti visivi, come grafici, tabelle, diagrammi o schermate, insieme al testo del documento.

    JPEG2000 e JBIG2 non sono supportati nei file PDF in Amazon Nova.

I formati di file supportati includono tipi di documenti comuni: file di testo semplice e di testo strutturato (CSV, TXT), fogli di calcolo (XLS/XLSX), HTML/Markdown, Word documents (DOC/DOCX) e file PDF. Per le immagini all'interno dei documenti, vengono gestiti i formati di immagine standard (PNG, JPG, GIF, WebP), sebbene quelli PDFs contenenti determinate codifiche di immagine (CYMK, SVG) non siano supportati.

Limiti di dimensione dei documenti e linee guida per l'utilizzo
Vincolo Limite

Numero massimo di documenti

Fino a 5 documenti per richiesta (valido sia per il caricamento diretto che per Amazon S3)

Dimensioni del documento basato su testo

Ogni documento di testo (ad esempio, .txt, .csv, .md, .html, .doc) deve pesare ≤ 4,5 MB

Dimensioni del documento basato su supporti

Per i file con estensione pdf e docx, non esiste un limite per le dimensioni dei singoli file, ma:

  • Quando si utilizza il caricamento diretto, la dimensione combinata di tutti i documenti multimediali deve essere ≤ 25 MB

  • Quando si utilizza Amazon S3, la dimensione combinata di tutti i documenti multimediali deve essere ≤ 2 GB

Contenuti PDF non supportati

PDFs contenenti profili di colore CMYK o immagini SVG non sono supportati