Supporto multimodale per Amazon Nova - Amazon Nova

Le traduzioni sono generate tramite traduzione automatica. In caso di conflitto tra il contenuto di una traduzione e la versione originale in Inglese, quest'ultima prevarrà.

Supporto multimodale per Amazon Nova

Nota

Questa documentazione è per Amazon Nova versione 1. Per la documentazione multimodale di Amazon Nova 2, visita Multimodal understanding.

I modelli di comprensione di Amazon Nova sono modelli di comprensione multimodali, il che significa che supportano input multimodali come immagini, video e documenti per dedurre e rispondere a domande in base al contenuto fornito. I modelli Amazon Nova sono dotati di nuove funzionalità di visione che consentono al modello di comprendere e analizzare immagini, documenti e video, realizzando in tal modo casi d’uso di comprensione multimodale.

La sezione riportata di seguito illustra le linee guida per lavorare con immagini, documenti e video in Amazon Nova. Queste includono le strategie di pre-elaborazione utilizzate, gli esempi di codice e le limitazioni pertinenti da considerare.

Tipo di contenuto supportato per modalità

Le seguenti informazioni descrivono in dettaglio i formati di file supportati dal file multimediale e il metodo di input accettato.

Tipo di file multimediale

Formati di file supportati

Metodo di input

Strategia di analisi

Immagine

PNG, JPG, JPEG, GIF, WebP

Base64

URI Amazon S3

Comprensione visiva dell’immagine

Documento di testo

(Solo API Converse)

CSV, XLS, XLSX, HTML, TXT, MD, DOC

Byte

URI Amazon S3

Comprensione testuale solo dal documento.

Documento multimediale

(Solo API Converse)

PDF, DOCX

Byte

URI Amazon S3

Testo con comprensione dell’immagine interlacciata

Video

MP4, MOV, MKV, WebM, FLV, MPEG, MPG, WMV, 3GP

Base64

URI Amazon S3

Comprensione visiva del video

Nota

Puoi includere fino a cinque file dal tuo computer o 1.000 file da Amazon S3. Ogni file non deve pesare più di 1 GB quando viene caricato da Amazon S3. La dimensione totale dei file caricati non può superare i 25 MB quando si carica dal computer o 2 GB quando si carica da Amazon S3.

Poiché il limite di payload complessivo è di 25 MB, assicurati di considerare il sovraccarico di base64. Durante il lavoro, ricorda che le librerie e i framework mantengono la memoria e che i contenuti multimediali trasmessi possono accumularsi rapidamente. Quando si utilizza un video, specificare una s3Location dovrebbe risolvere molti problemi di archiviazione.