

Le traduzioni sono generate tramite traduzione automatica. In caso di conflitto tra il contenuto di una traduzione e la versione originale in Inglese, quest'ultima prevarrà.

# Supporto multimodale per Amazon Nova
<a name="modalities"></a>

**Nota**  
Questa documentazione è per Amazon Nova versione 1. Per la documentazione multimodale di Amazon Nova 2, visita [Multimodal](https://docs.aws.amazon.com/nova/latest/nova2-userguide/using-multimodal-models.html) understanding.

I modelli di comprensione di Amazon Nova sono modelli di comprensione multimodali, il che significa che supportano input multimodali come immagini, video e documenti per dedurre e rispondere a domande in base al contenuto fornito. I modelli Amazon Nova sono dotati di nuove funzionalità di visione che consentono al modello di comprendere e analizzare immagini, documenti e video, realizzando in tal modo casi d’uso di comprensione multimodale.

La sezione riportata di seguito illustra le linee guida per lavorare con immagini, documenti e video in Amazon Nova. Queste includono le strategie di pre-elaborazione utilizzate, gli esempi di codice e le limitazioni pertinenti da considerare.

**Topics**
+ [Tipo di contenuto supportato per modalità](#modalities-content)
+ [Comprensione delle immagini](modalities-image.md)
+ [Comprensione dei video](modalities-video.md)
+ [Comprensione dei documenti](modalities-document.md)
+ [Gestione degli errori](text-error-handing.md)

## Tipo di contenuto supportato per modalità
<a name="modalities-content"></a>

Le seguenti informazioni descrivono in dettaglio i formati di file supportati dal file multimediale e il metodo di input accettato.


| Tipo di file multimediale | Formati di file supportati | **Metodo di input** | Strategia di analisi | 
| --- |--- |--- |--- |
| Immagine | PNG, JPG, JPEG, GIF, WebP | Base64 URI Amazon S3 | Comprensione visiva dell’immagine | 
| Documento di testo *(Solo API Converse)* | CSV, XLS, XLSX, HTML, TXT, MD, DOC | Byte URI Amazon S3 | Comprensione testuale solo dal documento. | 
| Documento multimediale *(Solo API Converse)* | PDF, DOCX | Byte URI Amazon S3 | Testo con comprensione dell’immagine interlacciata | 
| Video | MP4, MOV, MKV, WebM, FLV, MPEG, MPG, WMV, 3GP | Base64 URI Amazon S3 | Comprensione visiva del video | 

**Nota**  
Puoi includere fino a cinque file dal tuo computer o 1.000 file da Amazon S3. Ogni file non deve pesare più di 1 GB quando viene caricato da Amazon S3. La dimensione totale dei file caricati non può superare i 25 MB quando si carica dal computer o 2 GB quando si carica da Amazon S3.

Poiché il limite di payload complessivo è di 25 MB, assicurati di considerare il sovraccarico di base64. Durante il lavoro, ricorda che le librerie e i framework mantengono la memoria e che i contenuti multimediali trasmessi possono accumularsi rapidamente. Quando si utilizza un video, specificare una `s3Location` dovrebbe risolvere molti problemi di archiviazione.

**Nota**  
L’elaborazione di video e documenti di grandi dimensioni richiede tempo, indipendentemente dal metodo di input. [Se boto3 SDK scade in attesa di una risposta da parte di boto3 Amazon Bedrock, assicurati di avere un valore read\$1timeout appropriato e di aver aggiornato boto3 almeno alla versione 1.38.](https://botocore.amazonaws.com/v1/documentation/api/latest/reference/config.html)