Modelli Luma AI - Amazon Bedrock

Le traduzioni sono generate tramite traduzione automatica. In caso di conflitto tra il contenuto di una traduzione e la versione originale in Inglese, quest'ultima prevarrà.

Modelli Luma AI

Questa sezione descrive i parametri di richiesta e i campi di risposta per i modelli Luma AI. Usa queste informazioni per effettuare chiamate di inferenza ai modelli di intelligenza artificiale di Luma con l'operazione. StartAsyncInvoke Questa sezione include anche esempi di codice Python che mostrano come chiamare i modelli Luma AI. Per utilizzare un modello in un’operazione di inferenza, è necessario l’ID modello per il modello.

  • ID modello: luma.ray-v2:0

  • Nome del modello: Luma Ray 2

  • Modello da testo a video

I modelli Luma AI elaborano i prompt dei modelli in modo asincrono utilizzando Async, tra cui, e. APIs StartAsyncInvokeGetAsyncInvokeListAsyncInvokes

Il modello Luma AI elabora i prompt utilizzando la seguente procedura.

  • L'utente richiede StartAsyncInvokeal modello di utilizzare.

  • Attendere che InvokeJob sia terminato. Puoi utilizzare GetAsyncInvoke o ListAsyncInvokes per controllare lo stato di completamento del processo.

  • L’output del modello viene inserito nel bucket Amazon S3 di output specificato

Per ulteriori informazioni sull'utilizzo dei modelli Luma AI con APIs, consulta Generazione video.

Chiamata di inferenza Luma AI.

POST /async-invoke HTTP/1.1 Content-type: application/json { "modelId": "luma.ray-v2:0", "modelInput": { "prompt": "your input text here", "aspect_ratio": "16:9", "loop": false, "duration": "5s", "resolution": "720p" }, "outputDataConfig": { "s3OutputDataConfig": { "s3Uri": "s3://your-bucket-name" } } }

Campi

  • prompt (stringa): contenuto necessario nel video di output (1 <= lunghezza <= 5.000 caratteri).

  • aspect_ratio (valore numerico) Proporzioni del video di output (“1:1”, “16:9”, “9:16”, “4:3”, “3:4”, “21:9”, “9:21”).

  • loop (valore booleano): indica se riprodurre in loop il video di output.

  • duration (valore numerico): durata del video di output (“5s”, “9s”).

  • resolution (valore numerico): risoluzione del video di output (“540p”, “720p”).

Il MP4 file verrà archiviato nel bucket Amazon S3 come configurato nella risposta.

Text-to-Video Generazione

Genera video da prompt di testo utilizzando il modello Luma Ray 2. Il modello supporta varie opzioni di personalizzazione tra cui proporzioni, durata, risoluzione e loop.

Text-to-VideoRichiesta di base

{ "modelId": "luma.ray-v2:0", "modelInput": { "prompt": "an old lady laughing underwater, wearing a scuba diving suit" }, "outputDataConfig": { "s3OutputDataConfig": { "s3Uri": "s3://your-bucket-name" } } }

Text-to-VideoAvanzato con opzioni

{ "modelId": "luma.ray-v2:0", "modelInput": { "prompt": "an old lady laughing underwater, wearing a scuba diving suit", "aspect_ratio": "16:9", "loop": true, "duration": "5s", "resolution": "720p" }, "outputDataConfig": { "s3OutputDataConfig": { "s3Uri": "s3://your-bucket-name" } } }

Text-to-VideoEsempio aggiuntivo

Esempio con parametri di risoluzione e durata.

{ "modelId": "luma.ray-v2:0", "modelInput": { "prompt": "a car", "resolution": "720p", "duration": "5s" }, "outputDataConfig": { "s3OutputDataConfig": { "s3Uri": "s3://your-bucket-name" } } }

Image-to-Video Generazione

Trasforma immagini statiche in video dinamici fornendo fotogrammi chiave. È possibile specificare fotogrammi iniziali, fotogrammi finali o entrambi per controllare il processo di generazione del video.

Basic Image-to-Video con Start Frame

{ "modelId": "luma.ray-v2:0", "modelInput": { "prompt": "A tiger walking in snow", "keyframes": { "frame0": { "type": "image", "source": { "type": "base64", "media_type": "image/jpeg", "data": "iVBORw0KGgoAAAANSUhEUgAAAAgAAAAIAQMAAAD+wSzIAAAABlBMVEX///+/v7+jQ3" } } } }, "outputDataConfig": { "s3OutputDataConfig": { "s3Uri": "s3://your-bucket-name" } } }

Image-to-Video con frame iniziale e finale

{ "modelId": "luma.ray-v2:0", "modelInput": { "prompt": "A tiger walking in snow", "keyframes": { "frame0": { "type": "image", "source": { "type": "base64", "media_type": "image/jpeg", "data": "iVBORw0KGgoAAAANSUhEUgAAAAgAAAAIAQMAAAD+wSzIAAAABlBMVEX///+/v7+jQ3" } }, "frame1": { "type": "image", "source": { "type": "base64", "media_type": "image/jpeg", "data": "iVBORw0KGgoAAAANSUhEUgAAAAgAAAAIAQMAAAD+wSzIAAAABlBMVEX///+/v7+jQ3" } } }, "loop": false, "aspect_ratio": "16:9" }, "outputDataConfig": { "s3OutputDataConfig": { "s3Uri": "s3://your-bucket-name" } } }

Parametri aggiuntivi per Image-to-Video

  • fotogrammi chiave — (oggetto) Definisce i fotogrammi chiave di inizio (frame0) e and/or fine (frame1)

    • frame0: immagine del fotogramma chiave iniziale

    • frame1: immagine del fotogramma chiave finale

    • type: deve essere “image”

    • source: origine dell’immagine

risoluzione dei problemi

Problemi e soluzioni comuni durante l’utilizzo di modelli Luma AI:

  • Stato del processo non riuscito: verifica che il bucket S3 disponga delle autorizzazioni di scrittura corrette e che il bucket esista nella stessa Regione del servizio Bedrock.

  • Errori di accesso all'URL dell'immagine: assicurati che le immagini URLs siano accessibili pubblicamente e utilizzi HTTPS. Le immagini devono essere nei formati supportati (JPEG o PNG).

  • Errori di parametri non validi: verifica che i valori delle proporzioni corrispondano alle opzioni supportate (“1:1”, “16:9”, “9:16”, “4:3”, “3:4”, “21:9”, “9:21”) e che la durata sia “5s” o “9s”.

  • Problemi di timeout: utilizza GetAsyncInvoke per controllare lo stato del processo anziché attendere in modo sincrono. La generazione di video può richiedere alcuni minuti.

  • Errori di lunghezza dei prompt: mantieni i prompt compresi tra 1 e 5.000 caratteri. Prompt più lunghi verranno rifiutati.

Note per le prestazioni

Considerazioni importanti relative alle prestazioni e alle limitazioni dei modelli Luma AI:

  • Tempo di elaborazione: la generazione di video richiede in genere 2-5 minuti per video di 5 secondi e 4-8 minuti per video di 9 secondi, a seconda della complessità.

  • Requisiti relativi alle immagini: le immagini di input devono essere di alta qualità con una risoluzione minima di 512 x 512 pixel. La dimensione massima supportata dell’immagine è 4.096 x 4.096 pixel.

  • Dimensioni dei video di output: i video generati variano da 5 a 50 MB a seconda della durata, della risoluzione e della complessità del contenuto.

  • Limiti di utilizzo: le chiamate API asincrone sono soggette a quote di servizio. Monitora il tuo utilizzo e richiedi aumenti delle quote, se necessario.

  • Archiviazione S3: garantisci una capacità di archiviazione S3 sufficiente per i video di output e valuta le policy del ciclo di vita per l’ottimizzazione dei costi.

Documentazione correlata

Per ulteriori informazioni e servizi correlati: