Le traduzioni sono generate tramite traduzione automatica. In caso di conflitto tra il contenuto di una traduzione e la versione originale in Inglese, quest'ultima prevarrà.
Supporto multimodale per Amazon Nova
Nota
Questa documentazione è per Amazon Nova versione 1. Per la documentazione multimodale di Amazon Nova 2, visita Multimodal understanding.
I modelli di comprensione di Amazon Nova sono modelli di comprensione multimodali, il che significa che supportano input multimodali come immagini, video e documenti per dedurre e rispondere a domande in base al contenuto fornito. I modelli Amazon Nova sono dotati di nuove funzionalità di visione che consentono al modello di comprendere e analizzare immagini, documenti e video, realizzando in tal modo casi d’uso di comprensione multimodale.
La sezione riportata di seguito illustra le linee guida per lavorare con immagini, documenti e video in Amazon Nova. Queste includono le strategie di pre-elaborazione utilizzate, gli esempi di codice e le limitazioni pertinenti da considerare.
Argomenti
Tipo di contenuto supportato per modalità
Le seguenti informazioni descrivono in dettaglio i formati di file supportati dal file multimediale e il metodo di input accettato.
Tipo di file multimediale |
Formati di file supportati |
Metodo di input |
Strategia di analisi |
|---|---|---|---|
Immagine |
PNG, JPG, JPEG, GIF, WebP |
Base64 URI Amazon S3 |
Comprensione visiva dell’immagine |
Documento di testo (Solo API Converse) |
CSV, XLS, XLSX, HTML, TXT, MD, DOC |
Byte URI Amazon S3 |
Comprensione testuale solo dal documento. |
Documento multimediale (Solo API Converse) |
PDF, DOCX |
Byte URI Amazon S3 |
Testo con comprensione dell’immagine interlacciata |
Video |
MP4, MOV, MKV, WebM, FLV, MPEG, MPG, WMV, 3GP |
Base64 URI Amazon S3 |
Comprensione visiva del video |
Nota
Puoi includere fino a cinque file dal tuo computer o 1.000 file da Amazon S3. Ogni file non deve pesare più di 1 GB quando viene caricato da Amazon S3. La dimensione totale dei file caricati non può superare i 25 MB quando si carica dal computer o 2 GB quando si carica da Amazon S3.
Poiché il limite di payload complessivo è di 25 MB, assicurati di considerare il sovraccarico di base64. Durante il lavoro, ricorda che le librerie e i framework mantengono la memoria e che i contenuti multimediali trasmessi possono accumularsi rapidamente. Quando si utilizza un video, specificare una s3Location dovrebbe risolvere molti problemi di archiviazione.
Nota
L’elaborazione di video e documenti di grandi dimensioni richiede tempo, indipendentemente dal metodo di input. Se boto3 SDK scade in attesa di una risposta da parte di boto3 Amazon Bedrock, assicurati di avere un valore read_timeout appropriato e di aver aggiornato boto3 almeno alla versione 1.38.